淘客熙熙

主题:【原创】查字典漫想 -- 抱朴仙人

共:💬37 🌺46
全看树展主题 · 分页首页 上页
/ 3
下页 末页
家园 【原创】查字典漫想

朋友喜得贵子,打电话来要求为孩子取名。

父母爱子,早就请人推了四柱,八字批罢,说是五行欠土,名字中第二个字要有土,而且是十二画的字。

于是请出《辞源》,泡一壶茶,慢慢地找来。

一时找不到,思想就开始乱飘,忽然想起幼年学字时的经历。当时认字写字苦不堪言,于是恨恨说道:“要是我造字,一定不这么造!”

汉字确实是一种很可恶的文字,字多,长得像,难认难读。这且不说,最可恶的就是你碰到不认识的字,字典就在手边,还是不见得能找到它。

几万个汉字,大部分是死字,即使是大学问家,也难得能认全,必须依靠词典。词典这种东西,是所谓一个字一个字的书。这些个字,应该怎样分类呢?开始,是按照意义分类,比如《尔雅》,十九卷,每一卷把意义相近相关的字词堆在一起,什么宫室啊,山川啊,称谓啊,各堆成一大堆。按照意义排列,好处是不需要认识这个字,大概知道这是个干什么的东西就可以了,毛病也大,万一对字的意义理解有分歧,那可就找不着了。比方说“泰山”,这应该归称谓呢还是归山川?所以对付多义词,这种归类法有困难。而咱们汉字,那最大的特点,就是多义性。打个比方,这种分类法如果用来对人分类,它是按照专业分的,“学文科的站左边,学理科的站右边!”那萨苏呢?一个学图书馆的,理科考进,文科毕业,干着IT,写着历史,他算哪一类?于是铁手大喊一声:“萨苏站中间!”

上古字少,问题还不大,后来字越来越多,这样瞎对付就不中用了。于是就有了高人来解决这个问题。

汉朝,许慎编《说文解字》,想了一个创造性的方法,来解决查字难的问题。那就是不按照意义分类了,而是按照长相分类。也就是按照汉字的结构特点,分成不同的部首,把汉字分类,归在不同的部首下面。

对人,按照面相分类,乃是古已有之的方法。清朝有所谓大挑,是挑选官员的一种方法,专看长相,不管成绩的。考官分辨记录应试学子的面相,嘴里就要嘀咕着这些考生应该归于哪一类:“国、田、由、甲、申……”一张张不同的嘴脸,就井然有序地被分门归类了。比如动画片《天书奇谭》里面那个县官,就长了一张我们平时说的枣核脸,他的档案里,记录的却一定是“申”字脸,而不会是什么枣核之类。

可是这字的长相,那比人可复杂得多。汉字的结构五花八门,归成多少个部首才好呢?《说文解字》收了九千多个字,分在五百四十个部首下边,平均每个部首下边不到二十个字。比如有个“青”部,除了“青”字,底下只孤零零地领着一个“静”字,部首利用效率之低可见一斑。到了明代,梅鹰祚编了本词典叫《字汇》,就把部首减少到了两百多个,再把这些部首按照笔画分为十二大捆,以十二地支命名。一画和两画的部首,放到子部,三画的,放到丑部和寅部,四画的最多,捆成卯、辰、巳三大捆,……十画以上的,统统扔进亥部。《康熙字典》的部首安排,也是按着这个规矩来的。到了《新华字典》,部首只剩了189个,查起来就简单多了。

说起来,部首检字法用的人越来越少。现在的朋友,不经常搬弄古文的话,搬起一部《辞海》或者《辞源》,多数是从后边查起,就是专靠拼音检字法过日子。要说这拼音可是好东西,对汉字的贡献,恐怕是仅次于发明汉字的列祖列宗。可是,拼音也有大毛病啊,如果不知道怎么读,或者读音不标准,那就抱着字典找不到字了。还是得用部首检字法。

部首检字法,要先找自己所要查的字归于哪个部首,把这个部首查出来。比如《康熙字典》的查法,是有口诀的,小时候学查字典,必须先背口诀:“一二在子三丑寅,四卯辰巳五午寻,六在未申七在酉,八九在戌余亥存。”这歌不像歌,诗不像诗的四句,虽不是武功秘笈,作用其实也差不多。这就是部首检字法的口诀,直到如今,《辞源》还是这么编排的,背不过这几句,看见老的词典您只有傻眼的份。

背过了这个口诀,就万事大吉了吗?也不尽然。有些字归于哪个部首根本就是乱规定的。比如雠(仇)这个字,归于“言”部,跟它长的模样差不多的“辩”字,却归在“辛”部。再比如“桃、李”,那都归在“木”部,可是轮到“沐”字,却是归在“水”部的。

铁手大喊一声:“萨苏站中间!”这就是强行规定萨苏列入哪个部首,咱们大家,也只有记住这个规定才行。有了人,没法归类,是管理者的失败;咱们必须死记硬背这个规定,是咱们大家的晦气。

弄不清楚部首,不是还有个笔画检字法吗?咱按笔顺,数笔画总能把它数出来吧,也不见得。就说“凸凹”这两个字,起笔是什么笔顺?一共有几笔?说起来可笑,俺从小就画这两个墨水瓶子,画到如今也还是没弄清楚笔顺。

这样一来,查个不认识的字,就得几般武器一起上,什么音序检字法、部首检字法、笔画检字法一齐上阵,就不信查不出它来。

查倒是查得出来,可惜编一本汉语的字典,倒有十分之一的篇幅是各种检字法,字典这般编法,算是独步寰球。中国人认字的苦难,由此也可见一斑。俺自觉还算略有学问,自己测了一下,也只认识万把个字。翻开一本古书,上边的字,不是不认识,就是不会读,要么就是不会写。到得如今,不再学着认字,不是认得差不多了,实在是没有信心了。

这还是正体的汉字。还有异体字,还有手写的各种变体简体。孔乙己说回字有四种写法,这就包括各种异体字。1001n看到一个“口商”字,不认识,就是不知道那其实是商量的商字。

所谓中国文化博大精深,说这话的人往往倒没读过几卷书。有时候我看到小学生、中学生甚至大学生在拼命认字,想到没有别的民族像我们一样需要耗费十几二十年的生命学习文字,就不由得痛恨这个没有规律、难读难记、多音多意的汉字。连带着,也就有些恨这个所谓博大精深的文化。

可是,在这上面浪费了几十年的时光,终于弄得比较熟了,又有些自得。别看没什么用,这可就是文化啊,文化文化,不就是学了没有用的东西吗?

关键词(Tags): #陈谷子烂芝麻元宝推荐:履虎尾,
家园 花! 沙发!

部首如果能分左、中、右三部来查,会容易点。这种办法在纸印的字典上行不通,可是用电脑 relative 数据库是可以实现的。现在网上的中文字典都是老字典的翻版,没有真正应用电脑技术的中文字典。

幸好我没文化。做文化人,脑子里装那么多无用的东西,累!

家园 花,这文章看着忒长志气!

仙人这篇大作码了两千多汉字,没有俺不认得的,俺这文化真不是一点点吧

家园 雨点兄:电脑中文输入法的设计很可能会决定汉字的根本出路。

部首是分为左中右的,但有时候匪夷所思。比如“辉”这个字,它既不属于军部,也不属于光部,它竟然属于小部,只看左上角就行。呵呵。

电脑的汉字输入法,实际就是检字法。能做到无重码,自然,简易,这就是检字法的至高境界。

现在汉字输入法的专利雄踞食品、中药之后,为我国专利申请数量的第三名。单凭这个数量,就知道他们所要解决的问题之难。

如果中文输入法不能够搞出很好的解决方案,汉字在电子时代的前途堪虑。如果搞得出来,中文还是有希望成为一种科学语言的。尽管它的语法等等还有不少问题。

家园 呵呵呵

那谁说来着,人生烦恼识字始

可是不识字,就不能上网读仙人的文章了

识字有识字的好处,不识字有不识字的好处

心不囿于见,随便什么文化来,都可以玩得转呀

要是反过来,拿文字文化当成见,你被它转,就不好玩了呀

家园 仙人原创,照例送花

看着俺就头晕

现在最怕把字读错了,俺是全拼输入,不知道音就是找不到字

像上次俺回国流水帐里的哪个“塤”字,俺又是yun,sun,yuan的走了一通也没找到,让阿磕这家伙笑话了

家园 又说我坏话,找人踢你

点看全图

外链图片需谨慎,可能会被源头改

关键词(Tags): #踢地主
家园 左中右不够,就加上“上中下“,玩九部首 :DDD

中文字的检索是介于图形检索和符号检索之间的,比图形检索还是容易一点。图形检索可是被研究了N年了,门都没有呢!

家园 真有意思,花!
家园 阿磕兄弟到了?好久不见。

可见你想谁了,就应该说他坏话,保证马上出现。

家园 高兴, 加上和尚这几个居然在下也全部认得,文化也剩下一点点吧.
家园 同意仙兄观点,汉字编码的确是个大问题

也稍微留心过汉字编码的问题。其实无论是拼音检字还是部首检字,都是对汉字进行归类编码。如仙兄所说,拼音检字,容易出现不会念的字就查不到的问题,这说明拼音式编码有其缺陷;同样的,部首检字,容易出现不知部首而查不到的问题,说明部首检字也是有问题的。

两大主流检字方式都有问题,汉字编码之难可见一斑。仙兄举例如“凹凸”,也曾困扰过我。此外,“卡”字笔顺又是什么?按先上后下,先左后右的笔顺,得出的结果如果在手机中按T9笔画输入,肯定是错的(T9对不对这里先不研究);再有“○”,这唯一一个绝无横、竖、点、撇、捺、折(严格意义上的)成分的规范汉字,即便归入一笔之字,部首究竟是个啥也还是让人挠头。即便是拼音搜字,也容易出现问题。比如“拎”,我一直见字生义地读为“līng”,后来打不出这字,才知道该念“līn”——手边暂缺字典,如果有错,也望指教——诸如此类,问题多多。

究竟有没有一种方便高效、一目了然、无漏无重的编码方案呢?从所谓“万码奔腾”就能看出,这个要求实在是太难实现了。古人造字,本就不拘一格,比如“彦”,底下为什么连来三撇?“巡”,这并列三折又是怎么个讲究?一撇一捺既可为“八”、“入”又可为“人”,是何居心?等等等等,不一而足。

难啊。

不过也赞同仙兄见解,拼音检字似乎更有前途。我从来是拼音输入打字,具体来说就是智能ABC。无论是智能ABC、微软拼音还是紫光输入法——我只用过这三个拼音输入法——都有个特点,就是支持词组联想式输入。而词组输入,往往直接输入简略拼法即可,不仅大大减少输入字符数量(缩短编码码长),同时还极大地降低了重码率。以此来看,以词组,甚至更长的常用语文单位(比如“中华人民共和国财政部”、“我们一定要紧密团结在以”)作为编码单位,也是一条可以探究的路子。

饶是如此,仍然不能改变拼音检字的固有问题。汉字,无非有形有声有义,倘若形声皆无妙计,难道只能在“义”字上做文章了?粗粗一想,更是难如登天。

算了,不胡说八道了,还是献花吧:)

家园 我的一个大学同学曾经试图创出个中文输入法

每天坐计算机前苦思冥想。就记得他说,要弄得看见一个字就可以查到,据说是,读白字也可以。后来我说,可能翻页会很麻烦,每个音下面的字太多了

家园 九方部首分为九宫,您这个是井田法啊。呵呵
家园 仙人说得没错,其实汉字是一种艺术

念着铿锵,写出来漂亮。实用性稍差点,也将就了。俺们科学家和艺术家,讲究太衫的东西就俗了。

特别是拐了弯儿引经据典骂人,一骂便中,对方还如坠雾里,那叫一个爽啊~

全看树展主题 · 分页首页 上页
/ 3
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河