为什么计算机能输入汉字
计算机的数据全部采用二进制数来表示。当我们输入数字、字母以及各种符号的时候,电脑并非直接识别它们的,而是先把它们变成二进制数码,然后才能对它们进行处理。因此,人们必须首先按一定的规则编码,使每个符号或字符对应一个二进制数。编码的方法有各种各样,为了统一起见需要标准的编码。当今,国际上采用的是ASCⅡ码。在输入符号时,信息经过部件变为相应的ASCⅡ二进制码,然后才输入主机。在输出信息(如在显示器上显示)时,由主机处理后再将二进制代码转换成与之相应字符或符号输出。这种过程简直是把电报码翻译成报文的过程。
那幺,汉字编码又是如何的呢?汉字与西文的特点是有区别的。英文是表音文字,由字母组成单词,而汉字是表意文字,每个字是由基本笔划经过排列组合而成,字形变式多样,所以,汉字只能作为字符信息来处理,这就需要由代码系统来表示。
根据ASCⅡ码,我国已经研制出了几百种汉字编码,可以归结为字形、字音和音形结合的输入码。不同的输入码可以找到同一个汉字,这是由于它们都参照一个标准,输入码都参照了这个汉字“内码”。目前,大陆用的标准内码是GB码,而台湾通用的是BIG5码,这就是我们上台湾的网站上看到怪字符的缘故了。
汉字的内码与ASCⅡ码不同,一个ASCⅡ构成西文字符,一个字符占一个字节,而一个字节是二进制的8倍,而两个字节构成一个汉字字符。
汉字显示不仅需要内码,而且还需要汉字字形码。字形码由点形成,点构成了图形,以二进制的形式输入于字库中。利用汉字的机内码找到字形码的地址,根据字形码就能把字清楚地显示在屏幕上了,用打印机也要用到字形码。
汉字比英文的输入要快得多,这对于一度吹捧汉字落后于信息时代的人来说,是一个十分有力的打击。