Skip to content

Latest commit

 

History

History
261 lines (175 loc) · 6.04 KB

402-820492-[趣味拓展]中文系统_gbk_BIG5_南极星_内码转化.sy.md

File metadata and controls

261 lines (175 loc) · 6.04 KB
show version enable_checker
step
1.0
true

中文系统bgk

回忆上次内容

  • 简体和繁体的汉字
    • 字符数量都超级大
    • 感谢王选和陈堃銶等前辈发明了激光照排技术

图片描述

  • 中文排版从此使用上了gb2312编码

    • 标准定了立刻就能用起来么?
  • 字型 是如何 进入显示器的呢??🤔

字体样式

  • 1994年的《魔兽争霸》
    • 像素字体 在RGB显卡的 支持下
    • 字体不但 可以有衬线
    • 而且 可以有立体感

图片描述

  • 配色也很细腻

中文隶书

  • 智冠公司出品的《三国演义》

图片描述

  • 使用隶书和车马符号
    • 代表那个三国时代

终端时代的中文超文本编辑器

图片描述

  • 当时的wps系统

wps

  • 当时还没有所见即所得

图片描述

  • 使用一些编辑标记
    • 制作富文本

图片描述

  • 只有打印预览才能查看效果

中文之星

  • 纸张之外
    • 显示器是更先进的输出设备

图片描述

  • 还可以做艺术字特效

推荐一款 点阵字库

  • 中文点阵
    • 最小也需要 7x7 像素

图片描述

  • 这个字体风格
    • 很独特

图片描述

字体辨识度

  • 字体辨识度

图片描述

中国台湾

  • BIG5 码

    • 是由 5 个公司联合制作的
  • 收录次序 取决于 频率

    • 然后是 笔画数
    • 然后是 康熙字典
  • 同时用 BIG5 编码和解码也是没有问题的

    • 但如果用BIG5编码
    • 却用gb2312解码就会有问题

图片描述

  • 不过存储的内容在文件里
    • 系统不知道用什么解码时
    • 默认自动会用 gb2312 解码
    • 这就造成了自动乱码

反之亦然

  • 我们用 gb2312 编码的文字
    • 用 gb2312 可以打开
    • 但是用 BIG5 打开就是乱码
    • 也需要转化

图片描述

  • 转化工具是有的
    • 能解决问题但很麻烦
    • 大量的输入输出编码解码的问题
    • 令人头大

图片描述

  • 确实麻烦

解决办法

  • 麻烦的地方正是机会所在

图片描述

  • 当时如果
    • 日文游戏 或者台湾地区游戏 不能玩
    • 可能是 因为字符 编码格式不一致
    • 可以用 南极星 调整字符编码格式
    • 把 不同编码格式 进行转化
    • 把字节 按照正确的方式 进行解码
    • 就 可以玩啦
  • 而且 gb2312
    • 只有6763个汉字
    • 大量汉字 连内码 都没有
  • 没有个标准整合一下吗?

GBK

  • GBK 即汉字内码扩展规范
    • 在GB2312的基础上扩展了繁体字符集
    • K 为汉语拼音 Kuo Zhan(扩展)中“扩”字的声母
    • 英文全称 Chinese Internal Code Specification
    • 最初是微软搞的
    • 虽然不是国家标准
    • 却是事实上的技术规范

图片描述

  • 共收入 21886 个汉字和图形符号
    • GB 2312 中的全部汉字、非汉字符号
    • BIG5 中的全部汉字(繁体兼容 GBK1)
    • 将 汉字、日本汉字、朝鲜汉字融合了
    • 合计 20902 个汉字

问题

  • 没有根本上解决互为乱码的问题
    • 同样两个字节
    • 还是会被解释得

图片描述

  • 只是能在gbk模式下
    • 显示繁体字
  • 标准也
    • 不是一蹴而就的

过程

  • 凡事都有个过程
    • 95年定的gbk
    • 98年才逐渐推行开来

图片描述

  • 但还是有些生僻字
    • 没有相应的字型
    • 导致 报纸无法印刷
    • 只能用 部首 拼接

解决

  • 内码 从无到有
    • 字形码 也从无到有

图片描述

  • 印刷厂字库 跟上
    • 特事特办
    • 很快 就解决问题了

标准的烟花

  • 正如ASA X3.4-1963
    • 到 ASA X3.4-1965
    • 最终到ascii

图片描述

  • GB也在不断进化

    • 从GB/T 1355-86
    • 到GB/T 1355-2021
    • 这是小麦粉标准的进化
  • 从GB2312-1986

    • 再到GBK
    • 这是中文字符标准的进化
  • 但是还是有问题

  • GBK虽然兼容了BIG5 中的全部汉字

    • 但是无法兼容编码
  • 用GBK方式 打开BIG5编码的文件

    • 还是乱码!😭

问题

  • 如果新GBK兼容了BIG5编码
    • 就无法向前兼容gb2312

图片描述

  • 这难道 无解了吗?
    • 时间自会给我们答案
    • 老天自有安排!

图片描述

总结

  • 中国的简体和繁体汉字

    • 字符数量都超级大
    • 彼此还认对方为乱码
  • 如果有种编码

    • 能将 所有的字符
    • 都 编进去
    • 就 好 了

图片描述

  • 中日韩(CJK)
  • 简体繁体
  • 欧洲各种拼音
  • 梵文
  • 阿拉伯文
  • 等等等都包括进去
  • 能有么?🤔
  • 我们下次再说!👋