- 讲师:刘萍萍 / 谢楠
- 课时:160h
- 价格 4580 元
特色双名师解密新课程高频考点,送国家电网教材讲义,助力一次通关
配套通关班送国网在线题库一套
2.汉字的编码
ASCIl码只对廷文字母、数字和标点符号进行了编码。为了使计算机能够处理、显示、打印、交换汉字字符,同样也需要对汉字进行编码。我国于1980年发布了国家汉字编码标准GB2312--80,全称是《信息交换用汉字编码字符集一基本集》(简称GB码或国标码)。根据统计,把最常用的6763个汉字分成两级:一级汉字有3755个,按汉语拼音字母的次序排列;二级汉字有3008个,按偏旁部首排列。由于一个字节只能表示256种编码,是不足以表示6763个汉字的,所以一个国≯示码用两个字节来表示一个汉字,每个字节的最高位为0。
为避开ASCIl码表中的控制码,将GB2312—80中的6763个汉字分为94行、94列,代码表分94个区(行)和94个位(列)。由区号(行号)和位号(列号)构成了区位码。区位码最多可以表示94x94=8836个汉字。区位码由4位十进制数字组成,前两位为区号,后两位为位号。在区位码中,01~09区为特殊字符,10~55区为一级汉字,56~87区为二级汉字。例如汉字“中”的区位码为5448,即它位于第54行、第48列。
区位码是一个4位十进制数,国标码是一个4位十六进制数。为了与ASCIl码兼容,汉字输入区位码与国标码之间有一个简单的转换关系。具体方法是:将一个汉字的十进制区号和十进制位号分别转换成十六进制;然后再分别加上20H(十进制就是32),就成为汉字的国标码。例如,汉字“中”字的区位码与国标码及转换如下:
区位码5448D(3630)H
国标码8680D(3630H+2020H)=5650H,
二进制表示为:(0011011000110000)B+(0010000000100000)B=(0101011001010000)B
世界上使用汉字的地区除了中国内地,还有中国台湾及港澳地区、日本和韩国,这些地区和
国家使用了与中国内地不同的汉字字符集。中国台湾、香港等地区使用的汉字是繁体字即
BIG5码。
1992年通丈£的国际标准IS010646,定义了一个用于世界范围各种文字及各种语言的书面
形式的图形字符集,基本上收全了上面国家和地区使用的汉字。Unicode编码标准对汉字集的处理与IS010646相似。
GB2312—80中因有许多汉字没有包括在内,为此有了GBK编码(扩展汉字编码),它是对
GB2312—80的扩展,共收录了21003个汉字,支持国际标准IS010646中的全部中日韩汉字,也包含了BIG5(台、港、澳)编码中的所有汉字。GBK编码于1995年12月发布。目前Windows以上的版本都支持GBK编码,只要计算机安装了多语言支持功能,几乎不需要任何操作就可以在不同的汉字豸、统之间自由变换。“微软拼音”、“全拼”、“紫光”等几种输入法都支持GBK字符集。2001年我国发布了GBl8030编码标准,它是GBK的升级,GBl8030编码空间约为l60万码位,目前已经纳入编码的汉字约为2.6万个。
责编:胡梦瑶
课程专业名称 |
讲师 |
课时 |
查看课程 |
---|
课程专业名称 |
讲师 |
课时 |
查看课程 |
---|
点击加载更多评论>>