admin管理员组

文章数量:1532482

2024年2月17日发(作者:)

计算机编码知识 区位码、国标码、机内码、输入码、字 计算机编码知识--区位码、国标码、机内码、输入码、字形码2010年07月12日星期一1748在计算机中各种信息都是以二进制编码的形式存在的也就是说不管是文字、图形、声音、动画还是电影等各种信息在计算机中都是以0和1组成的二进制代码表示的计算机之所以能区别这些信息的不同是因为它们采用的编码规则不同。比如同样是文字英文字母与汉字的编码规则就不同英文字母用的是单字节的ASCII码汉字采用的是双字节的汉字内码但随着需求的变化这两种编码有被统一的UNICODE码由Unicode协会开发的能表示几乎世界上所有书写语言的字符编码标准所取代的趋势当然图形、声音等的编码就更复杂多样了。这也就告诉我们信息在计算机中的二进制编码是一个不断发展的、高深的、跨学科的知识领域。1、字符英文包括字母、数字、标点、运算符等编码字符的编码采用国际通用的ASCII码American Standard Code for Information

Interchange美国信息交换标准代码每个ASCII码以1个字节Byte储存从0到数字127代表不同的常用符号例如大写A的ASCII码是65小写a则是97。由于ASCII码只用了字节的七个位最高位并不使用所以后来又将最高的一个位也编入这套编码码中成为八个位的延伸ASCIIExtendedASCII码这套内码加上了许多外文和表格等特殊符号成为目前常用的编码。基本的ASCII字符集共有128个字符其中有96个可打印字符包括常用的字母、数字、标点符号等另外还有32个控制字符。标准ASCII码使用7个二进位对字符进行编码对应的ISO标准为ISO646标准。下表展示了基本ASCII字符集及其编码字母和数字的ASCII码的记忆是非常简单的。我们只要记住了一个字母或数字的ASCII码例如记住A为650的ASCII码为48知道相应的大小写字母之间差32就可以推算出其余字母、数字的ASCII码。虽然标准ASCII码是7位编码但由于计算机基本处理单位为字节1byte8bit所以一般仍以一个字节来存放一个ASCII字符。每一个字节中多余出来的一位最高位在计算机内部通常保持为0在数据传输时可用作奇偶校验位。由于标准ASCII字符集字符数目有限在实际应用中往往无法满足要求。为此国际标准化组织又制定了ISO2022标准它规定了在保持与ISO646兼容的前提下将ASCII字符集扩充为8位代码的统一方法。ISO陆续制定了一批适用于不同地区的扩充ASCII字符集每种扩充ASCII字符集分别可以扩充128个字符这些扩充字符的编码均为高位为1的8位代码即十进制数128255称为扩展ASCII码。下表展示的是最流行的一套扩展ASCII字符集和编码2、汉字的编码1汉字内码汉字信息在计算机内部也是以二进制方式存放。由于汉字数量多用一个字节的128种状态不能全部表示出来因此在1980年我国颁布的《信息交换用汉字编码字符集--基本集》即国家标准GB2312-80方案中规定用两个字节的十六位二进制表示一个汉字每个字节都只使用低7位与ASCII码相同即有128×12816384种状态。由于ASCII码的34个控制代码在汉字系统中也要使用为不致发生冲突不能作为汉字编码128除去34只剩94种所以汉字编码表的大小是94×948836用以表示国标码规定的7445个汉字和图形符号。每个汉字或图形符号分别用两位的十进制区码行码和两位的十进制位码列码表示不足的地方补0组合起来就是区位码。把区位码按一定的规则转换成的二进制代码叫做信息交换码简称国标码。国标码共有汉字6763个一级汉字是最常用的汉字按汉语拼音字母顺序排列共3755个二级汉字属于次常用汉字按偏旁部首的笔划顺序排列共3008个数字、字母、符号等682个共7445个。由于国标码不能直接存储在计算机内为方便计算机内部处理和存储汉字又区别于ASCII码将国标码中的每个字节在最高位改设为1这样就

形成了在计算机内部用来进行汉字的存储、运算的编码叫机内码或汉字内码或内码。内码既与国标码有简单的对应关系易于转换又与ASCII码有明显的区别且有统一的标准内码是惟一的。2汉字外码无论是区位码或国标码都不利于输入汉字为方便汉字的输入而制定的汉字编码称为汉字输入码。汉字输入码属于外码。不同的输入方法形成了不同的汉字外码。常见的输入法有以下几类按汉字的排列顺序形成的编码流水码如区位码按汉字的读音形成的编码音码如全拼、简拼、双拼等按汉字的字形形成的编码形码如五笔字型、郑码等按汉字的音、形结合形成的编码音形码如自然码、智能ABC。输入码在计算机中必须转换成机内码才能进行存储和处理。3汉字字形码为了将汉字在显示器或打印机上输出把汉字按图形符号设计成点阵图就得到了相应的点阵代码字形码。全部汉字字码的集合叫汉字字库。汉字库可分为软字库和硬字库。软字库以文件的形式存放在硬盘上现多用这种方式硬字库则将字库固化在一个单独的存储芯片中再和其它必要的器件组成接口卡插接在计算机上通常称为汉卡。用于显示的字库叫显示字库。显示一个汉字一般采用16×16点阵或24×24点阵或48×48点阵。已知汉字点阵的大小可以计算出存储一个汉字所需占用的字节空间。例用16×16点阵表示一个汉字就是将每个汉字用16行每行16个点表示一个点需要1位二进制代码16个点需用16位二进制代码即2个字节共16行所以需要16行×2字节/行32字节即16×16点阵表示一个汉字字形码需用32字节。即字节数点阵行数×点阵列数/8用于打印的字库叫打印字库其中的汉字比显示字库多而且工作时也不像显示字库需调入内存。可以这样理解为在计算机内表示汉字而统一的编码方式形成汉字编码叫内码如国标码内码是惟一的。为方便汉字输入而形成的汉字编码为输入码属于汉字的外码输入码因编码方式不同而不同是多种多样的。为显示和打印输出汉字而形成的汉字编码为字形码计算机通过汉字内码在字模库中找出汉字的字形码实现其转换。

本文标签: 编码计算机字节国标码字库