说的不一定对,根据个人理解说一下: 所谓字库,应该指汉字总量,汉字总量应该在10000以上,常用简化字大约在3000左右,这应该是咱们常说的文化人的识字标准,也就是说认识3000字就算文化人了。。。。。。 说道字库的概念,应该是包含字形(或者说字体),这就是一个无限大的概念了,因为字体是一个无限大的概念,宋体、隶书、楷体。。。。。。。。。。。。。。。。。。。。
2010sya 发表于 2023-7-5 21:00 说的不一定对,根据个人理解说一下: 所谓字库,应该指汉字总量,汉字总量应该在10000以上,常用简化字大 ... 我说的是标准编码下的字体所包含的字,不是你说的什么宋体,楷体,隶书。
区别:GBK主要用于中文编码,包含全部中文字符,utf8包含全世界所有国家需要用到的字符;utf8比较灵活,长度在1-6个字节,GBK的长度为2个字节,和GBK相比,utf8会占用更多的数据库存储空间。 中文常用的编码方式:GB2312、GBK、GB18030,其中GB2312收录了7445个字符,GBK还收录了藏文,GB18030包含27000多个汉字和字符。 我常用网页编辑字符编码为utp_8,cmd经常保存就是 ASCII 码。 我知道就这些,不知道对不对。
gb2312,GBK,gb18030这些是储存编码标准,Unicode是显示编码,这是不同的,更具体的度娘吧。 GB18030-2022是最新的国家标准,包含8万7千多汉字。 实际上没有哪个字体能容纳这么多字符,一个字体最多容纳65536字符,要显示8w多汉字,就要用到大字符集,但目前还没基于此标准的大字符集出来(网上流通的大字符集都是GB18030-2005版)。 而说到包含最多汉字的字体,就我知道的话,花园明朝http://fonts.jp/hanazono/应该是最多的,但因为它是日本人做的,大部分汉字都是以日本汉字字形为准,我们看惯了国内的字形,看花园明朝这些字体会觉得难看。 实际上方正的GB18030标准的字体就足以满足大部分人的日常需求,就算研究古籍,装上方正的大字符集也足够了,还有更偏僻的汉字,你能用到应该也不会来这里问了,确实有需求,看这里的天珩全字库,注意不能商用。http://cheonhyeong.com/Simplified/download.html。
asky800 发表于 2023-7-5 22:23 gb2312,GBK,gb18030这些是储存编码标准,Unicode是显示编码,这是不同的,更具体的度娘吧。 GB18030-2 ... 鬼子的那个花园明朝体字是很难看的。而且这个网站还找不到下载链接。