当国人得到盘算机后,就要对汉字举行编码。在ASCII码表的底子上,小于127的字符意义与原来类似;而将两个大于127的字节连在一起,来表现汉字,前一个字节从0xA1(161)到0xF7(247)共87个字节,称为高字节,后一个字节从0xA1(161)到0xFE(254)共94个字节,称为低字节,两者可组合出约8000种组合,用来表现6763个简体汉字、数学符号、罗马字母、日文字等。在重新编码的数字、标点、字母是两字节长的编码,这些称为“全角”字符;而原来在ASCII码表的127以下的称为“半角”字符。简单而言,GB2312就是在ASCII底子上的简体汉字扩展。
UTF(UCS Transfer Format)