下载豆瓣客户端

豆瓣 6.0 全新发布 ×

豆瓣

扫码直接下载

iPhone · Android

豆瓣社区

快速注册

[oeasy]python0123_中文字符_文字编码_gb2312_激光照排技术_王选

overmind 2023-04-02 08:55:23 北京

中文编码GB2312

回忆上次内容

上次回顾了日韩各有编码格式日本有假名五十音一字节可以勉强放下有日本汉字字符数量超过20000+ 韩国有谚文数量超过500 一个字节放不下有朝鲜汉字字符数量超过20000+

作为汉字源头的中国究竟应该如何对汉字进行编码呢？🤔

汉字

汉字起源于甲骨文是世界上唯一还在使用的象形文字真的很不容易

写的本意就是画写意写生
这就是最初的象形字

六书

以象形为基础指事会意形声转注假借

字的结构是什么呢？

间架结构

上下
左右
内外

字型相当复杂
笔画也千姿百态

汉字笔画

笔画也比较复杂

运笔藏锋都很有讲究

中国大陆地区

中国大陆地区最早使用 GB/T 2312-1980当时参考了比我们先进的日本JIS 字符集 1980 年指定的国标 (GuoBiao) 1981 年 5 月 1 日开始使用
GB2312 编码共收录汉字 6763 个其中一级汉字 3755 个二级汉字 3008 个
这么多字怎么排呢？

区位

01-09 区为特殊符号先把ascii的128个字符让出去然后在留有一些制表的字符还留了相当多的空余
16-55 区为一级汉字按拼音排序
56-87 区为二级汉字按部首／笔画排序

出了汉字之外，还收录了拉丁字母希腊字母日文平假名及片假名字母俄语西里尔字母真的很全了
可是这gb2312具体是如何编解码的呢？🤔

应用

如果是0-127以内的ascii字符标志位为0 1个字节存储

如果是ascii以外的字符标志位为1 2个字节存储

编解码

编解码方法一致就可以解铃还须系铃人

同时用 gb2312 编解码是没有问题的
这篇制定标准的文档当时怎么打印出来的呢？制定内码标准的时候就有字形了吗？

铅字

虽然计算机在当时还没有普及但是出版行业已经工业化了

印刷厂使用铅活字进行排版铸字工拼版工还有拣字工

拣字工

印刷家谱从一个大盒子就够了

字再多些要用转轮排字盘

字再多些呢？

捡字室

大印刷厂字模特别多

甚至要放好几面墙好几张桌子

开端

这也曾被使用26个字母的西方文明嘲讽

出书确实不易捡好了字排好了版先打个样再来校对再浇铅板最后印刷
最初的书籍杂志报纸试卷都是这样印刷出来的
到了印刷 gb2312-80标准的 1980年已经启用了新的技术

机械打字机

从轮转排字盘到谢卫楼发明的中文打字机

再到舒震东在前人的研究基础上经过创新得到的舒式打字机

中文字符的数量是一个难关
直到照相技术的发展

照片排版

使用照片底片进行排版

也面临检字的工作

照片排版技术本身也在迭代

激光照排

这次使用激光扫描照片

每一个小字型都是一个照片根据汉字内码找到汉字对应的激光照片然后再把激光照片像活字一样排版这就是激光照排技术

用照片排版的方式制作了这样一个汉字编码的文档
标准定了立刻就能用起来么？

过程

凡事都有个过程95年定的gbk 98年才逐渐推行开来
但还是有些生僻字没有相应的字型

内码从无到有字形码也从无到有

感谢前辈

感谢王选与陈堃銶前辈的技艺

激光照排技术可以印刷中文书籍和报纸了

总结

简体和繁体的汉字字符数量都超级大感谢王选和陈堃銶等前辈发明了激光照排技术中文排版从此使用上了gb2312编码

纸张之外显示器是更先进的输出设备
计算机是如何在显示器上显示的呢？🤔
我们下次再说！👋
蓝桥->https://www.lanqiao.cn/courses/3584
github->https://github.com/overmind1980/oeasy-python-tutorial
gitee->https://gitee.com/overmind1980/oeasypython

回应转发赞收藏

还没人转发这篇日记

overmind (北京)

會玩才會學

overmind的最新日记 · · · · · · ( 全部 )

热门话题 · · · · · · ( 去话题广场 )

加载中...