您现在的位置是:首页 > 精选问答 >正文

gb2312编码规则(gb2312编码)

发布时间:2022-09-29 04:34:38单于茜贝来源:

导读您好,现在渔夫来为大家解答以上的问题。gb2312编码规则,gb2312编码相信很多小伙伴还不知道,现在让我们一起来看看吧!1、GB2312或GB2312-80...

您好,现在渔夫来为大家解答以上的问题。gb2312编码规则,gb2312编码相信很多小伙伴还不知道,现在让我们一起来看看吧!

1、GB2312或GB2312-80是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集--基本集》,由中国国家标准总局发布, 1981年5月1日实施。

2、GB2312编码通行于大陆;新加坡等地也采用此编码。

3、几乎所有的中文系统和国际化的软件都支持GB2312。

4、GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄罗斯语西里尔字母在内的682个全形字符。

5、GB2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖99.75%的使用频率。

6、对于人名、古汉语等方面出现的罕用字,GB2312不能处理,这导致了后来GBK及GB18030汉字字符集的出现。

7、接下来就是比较新的gb18030 * GB18030 也是对 GB2312 的扩展,其编码长度由 2 个字节变为 1~4 个字节 o 单字节,其值从 0 到 0x7F。

8、 o 双字节,第一个字节的值从 0x81 到 0xFE,第二个字节的值从 0x40 到 0xFE(不包括 0x7F )。

9、 o 四字节,第一个字节的值从 0x81 到 0xFE,第二个字节的值从 0x30 到 0x39,第三个字节的值从 0x81 到 0xFE ,第四个字节的值从 0x30 到 0x39 。

10、是以保持 GB2312/GBK 反向兼容的条件下,加入 4-byte 部份,让 GB18030 可以完全地 一对一 映射到 Unicode U+0000..U+10FFFF,是一个「一劳永逸」的方案。

本文就为大家分享到这里,希望小伙伴们会喜欢。

标签:

上一篇
下一篇

最新文章