再谈一些容易读错的字或词 中文的汉字常用字有几千之众,那么汉字的总量是多少呢?在网上(http://www.soouo.com/baike/2422.htm)抄来答案如下: 历史上出现过的汉字总数有8万多(也有6万多的说法),其中多数为异体字和罕用字。绝大多数异体字和罕用字已自然消亡或被规范掉,除古文之外一般只在人名、地名中偶尔出现。此外,继第一批简化字后,还有一批“二简字”,已被废除,但仍有少数字在社会上流行。
汉字数量的首次统计是汉朝许慎在《说文解字》中进行的,共收录9353字。其后,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字。此后收字较多的是宋朝官修的《类篇》,收字31319个;另一部宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书。
另外有些字典收字也较多,如清朝的《康熙字典》收字47035个;日本的《大汉和字典》收字48902个,另有附录1062个;台湾的《中文大字典》收字49905个;《汉语大字典》收字54678个。20世纪已出版的字数最多的是《中华字海》,收字85000个。
在汉字计算机编码标准中,GB 2312收录简体汉字6763个,GBK收录简体、繁体及日语、韩语汉字20912个,大五码收录繁体汉字13053个,而Unicode的中日韩统一表意文字基本字集则收录汉字20902个,另有两个扩展区,总数高达七万多字。 汉字总数量这样多,而从发音的角度看(暂不考虑4声的分别)所有的汉字都被局限在400多个音中,要想避免同音字是不可能的。如果考虑常用的3千汉字,除以400+后,每个音中平均要容纳约7个字。即便把4声的区别也考虑进去,每一音的每一声,还是要容纳多于1个的汉字。更何况,这里只是讲“平均”,而实际情况是:某一音会具有较少的汉字,具体到每一声时,有时会有缺字的情况。(例如,RI音,在中国汉字中并无1-3声的情况。)另一方面,某些音会有较多的字“挤”在其中。(例如,YI音竟有370个左右的汉字,考虑进4声外加轻声的5种情况,仍平均要有74个字处在YI音的每一声中。) 这里想说的,无非是众多汉字与其发音的关系:掌握这种联系,对于电脑来说不难;对于人脑来说,我们出于生活的体验,都知道这并非易事。上面涉及到了多字同音的问题,还有一字多音的问题,更为掌握汉字的发音增加了难度。 举一个较为“夸张”的例子:龟兔赛跑之“龟”谁都会发音,在“龟裂”一词中的“龟”变成“JUN(均)”音了;再到(古)地名“龟兹(QIU CI)”中,又发“秋”音。我们的老祖宗真不怕麻烦,把一些复杂的概念放在同一个字上承载,发音的差别又那么大,不用心记一下,是很难完成任务的。话又说回来了,如果这些概念都有自己独一无二的字,那我们汉字的总量不就会成倍成倍地增加,常用字也会增加,学习汉语的任务不就更为繁重了吗?(至此,我把自己都转糊涂了,怎样才能让汉语变得简便些呢?) 回到“易读错的字”这个话题,网友“蛮夷”举了数例: 瞠(CHENG, 1声)目结舌, 心广体胖(PAN, 2声)和呆(AI,2声)板。(在“呆若木鸡”中似乎还是发“DAI”音—至少在谷歌拼音输入法中可以验证如此。(又注:几经查询,发现AI 2声的读法为旧读,自1987年后,已被新华字典放弃。) 网友“马黑”建议编一个“易读错的常用字表”—这个主意不错,需要大家努力,找一个合适的平台,将之日积月累地拼凑起来。 下面,是我对马黑先生之建议的一点响应,贡献一些我个人的积累(目前想得起来的): 莘莘学子 的 “莘”为SHEN, 1声(深)音。 惴惴不安 的 “惴” 为ZHUI, 4声(坠)音。 怙恶不悛 的 “悛” 为QUAN, 1声 (圆圈之圈)音。 参差不齐 的 “参差” – CEN 1声, CI 1声。 良莠不齐 的 “莠” – YOU 3声 (有) 音。 一语成谶 的 “谶” – CHEN 4声 (趁)音。 胼手胝足 的 “胼” – PIAN 2声, “胝” – ZHI 1声。 修葺一新 的 “葺” – QI 4声 (气)音。 另外的词语有: 干涸 的 “涸 ” – HE 2声 (河)音。 嫔妃 的 “嫔” – PIN 2声 (贫)音。 证券 的 “券” – QUAN 4声 (劝)音。 徜徉 – “徜” CHANG 2声 (尝)音,“徉” YANG 4声 (样)音。 戏谑 的 “谑” XUE 4声 (血)音。 詈骂 的 “詈” LI 4声 (力)音。 还有几个难念的地名: 亳州 的 “亳” BO 2声 (薄)音。 荥阳 的 “荥” XING 2声 (型)音。 兖州 的 “兖” YAN 3声 (眼)音。 在网上找到一帖:“[转帖]中国各省最容易读错的地名一览 千万别闹笑话” http://www.czdx.cn/u/10/archives/2009/2009226132453.html 把我挂一漏万的心得都包括了。 |