扫描/长按下面二维码 |
扫描/长按下面二维码 |
(四)汉字字数繁多,结构复杂,缺少完备的表音系统。
汉字系统的字数,数量之多是非常惊人的。从古到今,汉字的总字数已达到8万多个,据资料统计,现代汉语用字在1万左右,国家公布的《现代汉语通用字表》收录汉字7千个,《现代汉语常用字表》收录汉字3千5百个。
汉字字数众多的根源在于汉语的特点。由于汉语的音节结构比较简单,音节数量比较少,和语言中的语素的数量相比较,简直不成比例。比如现代汉语声母和韵母拼合组成的基本音节只有4百来个,再配上四个声调也只有1千2百多个,而现代汉语语汇系统中的语素,多达数千个,在这种情况下,读音相同的语素就非常多,加之含此词形简短,以双音节此为主,但因借此也非常多,而且往往是常用词,假如书面上不用形体各异的汉字把这些同音的语素和词区别开来,就会造成混淆,造成使用上的混乱,影响交际使用,影响人际沟通,严重的甚至有可能早引起误会,造成损失。汉字字形分化字义的作用,我们可以从一些汉字的分化过程看出来。比如“云”,本意就是云彩的云,后来增加了“说话”的意义,为了区别,便另外造了一个“雲”來区別:“其”本来就是簸箕的意思,后来产生了表示第三人称的意义,于是人们便在院子基础上增加一个竹字头,构成“箕”:“莫”,从构形上看是太阳淹没在草丛中,就是傍晚黄昏的意思,后来引申出否定的意义,表示没有人,为了区别,于是在原字形的基础上另加一个“日”来区别,这就是“暮”字。类似的例子很多,例如“昏-婚”、“然-燃”、“止-趾”、“采-採”、“益-溢”等等。可见,汉字字数繁杂,有其不便于学习掌握的一面,但也有其便于区别意义的一面。
汉字的结构复杂,可以从几个方面来看,一方面,汉字笔画很多,以7千个通用汉字为例,笔画在7画至15画的多达5千以上,最多的一个汉字笔画多达36画;另一方面,汉字的结构单位笔画和部件,在组合成子是不是按照统一的方向排列组合的,而是上下左右全方位展开,多向行进,具有平面型特点,而且结构单位的组合模式也是多种多样的,笔画组合有相离、相接、相交几种,部件组合有左右结构、上下结构、包围结构、框架结构等,而且很多子往往是几种方式的总和,结构就更复杂了。汉字不像拼音文字那样是按一个方向行进的。所以学习汉字,只知道笔画部件,不知道结构方式,依然无法把一个字写出来。
而且汉字结构中可以说是没有表音成分,虽然汉字系统中有数量众多的形声子,但是形声字的音符并不是专门的表音符号,很多依然是独立成字的,更主要的事,现代汉字形声字的音符绝大部分已经失去了表音作用,有的音符在一个字中可以表音,在另外一个字中不能表音,这种种情况夹杂在一起,很难判断,例如“台”在“抬胎邰”中是表音的,在“殆怠迨治冶”中是不表音的。根据现代形声字音符的表音情况,如果用音符去推断一个不认识的字的读音,大部分都有可能出错。而人们在使用汉字时,往往有这样一种错觉,认为汉字既然实行绳子,那么就可以利用其音符来推断字音,结果常常推断错误,闹出笑话来。例如下面这些汉字,之所以读错,就是人们盲目使用音符推断造成的结果:“诣、愎、菅、龋、啮、酵、涸、烨、酗”。人们常说,汉字难读,这同汉字结构上不能表音不无关系。
(五)汉字用于机械处理和信息处理比较困难。
汉字用于机械化和信息化处理比较困难,我们可以从以下几个方面来认识。首先,汉字数量多,现代汉语通用字有7千个,如果涉及到专业领域的用字,数量更多,这样多的汉字机械处理当然就比较困难。其次,汉字结构复杂,大多数汉字笔画在10画左右,多的有好几十画,而且汉字笔画和部件组合的模式也非常复杂,随人我们可以给这些汉字的构造单位的组合方式归类,但一字一字观察比较,可以说是一个字有一个字的构造模式,有些字,例如“董、麝、爨、齉、冀”等,信息处理就非常困难。相比较而言,拼音的音素文字由于数量有限,机械处理就没有障碍,比如引文用拉丁字母,只有26个,加上大写字母也只有52个,加上其它字符(例如标点符号等),总量不超过100个。所以英文的字符可以全部搬上键盘,而把7000个汉字照搬上键盘,那简直是不可想象的。所以在我国,打字成为一门技术,需要专门学习。
我们可以用英文和汉字做个比较,这种差异就看出来了。现在电脑处理文字信息,一般使用点阵表示,即用电子方阵来表示一个字符,每个方阵有若干个格子,其中有笔画的点亮,每有笔画的点暗,这样就实现了文字自负的显示。显示英文,最低要用7×9点表示一个字符(一般要使用9×12点),显示汉子,最低要使用16×16点表示一个字符(一般要用24×24点)。英文的字符我们算100个,汉字的字符只算7000个,那么所占的点是:
英文:7×9×100=6300点
汉字:16×16×7000=1792000点
汉字字形存储量在电脑中所占的空间,是英文的284倍。差距之大是惊人的。汉字的机械化处理以前之所以落后于其他文字,因为7千个汉字字符需储存1750k位,而英文不到10k位,在计算机发展之初,根本就没有那样大内存。据资料载,美国IBM公司60年代末期生产的最先进的一种型号的电子计算机,内存为4096-131072,可以装入汉字,但是价格高得惊人,根本不可能推向市场,而其他型号的计算机,则不能装进汉字。这还是普通型汉字点阵,如果是精密型汉字点阵,比如是32×32点,或者100×100点,处理1万个字符,那所占的空间更是惊人。当然,在电子计算机储存量急速扩大的今天,这个问题已经得到顺利解决,但比较拉丁字母,汉字的局限仍然是明显的,所以有的学者认为,从长远看,汉字只有拼音化才能便于信息处理。
相关推荐: