淘客熙熙

主题:【原创】和本嘉明兄商榷关于汉字拼音化 -- 羽羊

共:💬140 🌺103
分页树展主题 · 全看首页 上页
/ 10
下页 末页
                          • 家园 多“吐吐”口水也不坏。

                              实际上我想说的只是拼音文字相对于表意文字来说优点是好读、好写、好学,可能是我的表达水平不高,多出来那么多口水战。

                            • 家园 拼音文字相对于表意文字来说优点是好读、好写,但不好学

                              前面很多人提出的,读而不明其意也叫识字?

                              因此,英语以词为单位,是好读好写了,但词与词之间脱离联系,虽然有词根,但词根本身数目就巨大得恐怖,出现新事物又要命名新词,这学习的量,6000单词刚脱贫,更别提专业领域了。而这本身也加大了普通人理解专业领域知识的困难,不是每个人都有那精力去重新学那浩瀚无涯不断涌现的新词的,就现在英语词汇,100万不止了吧,普通的也许就那2~3万,但要深一点了解各方面知识,那十几万估计得少不了,无形中形成知识隔离和垄断,并且越随着专业发展的深入新词的增多,愈加如此。

                              汉语则不然,虽然比拼音文字貌似难读点,难写点(其实也不见得难到哪去,基本小学普通用字就识全了),但在学习和使用上,字与字组成词,望文生义等,则比英语一个个互不相干的单词学习和使用,要方便的多。明显的,我们学两三千字基本阅读写作甚至专业学习,就不成问题,而英语呢?得学习多少词汇?在专业领域上,我们也基本望文生义,都是认识的字,看字面理解了一半,再随便一讲就明白了。英语则要重新学习词汇,相当重新要认字,外加完全陌生的重新理解学习,这难度谁比谁大?而在普及性上,大家都认识的字和大部分人都陌生的东西,对专业领域知识的普及谁更有益?

                              更别指我们的字本身互相之间也是联系的,汉字的“六书”规律,使得虽然我们学习的汉字要两三千,但实际上,很多时候识了一个字,其他联系的字学习起来很快基本立即明白,这倒跟英语的词根与其产生的词汇相似,因此我感觉,小学真正认真教的字五百左右吧,但识的字二千左右没问题。英语呢?五百个单词能干什么?

                    • 家园 小bug

                      档案和单干写成汉语拼音都是dangan
                      档案写成汉语拼音都是dang'an。

                • 家园 现在的汉字,使用矢量字体是一种主流,一般来说比起点阵字体

                  的字库略小一点。另外,现行的标准是 GB18030-2005 。这个标准的要求是让近两万个汉字都可以显示。字库全部不过是十几兆而已。

                  现在的汉字处理方法效率是很低,不过现在的技术,已经不是很在乎这一点点的存储空间与显示算法了。输入上,尽管手写板还没有成为标配,成本也不像键盘这么低,但是手写板的确让计算机输入汉字的学习成本降至零了,对于一般人来说,要不要学习更快捷的输入方式只是一个对工作效率的要求而已。语音输入还在发展,相信过不了多久也会成为一种很可靠的输入方法。

                  在硬件快速发展的今天,你提到的很多问题已经被解决的非常彻底,绝大多数人都已经不再关注汉字编码问题也可以说明这一点。没多少人在意那一点性能上的损失了(当然还是有一部分人有一点在意,但我想假如网速再快一点……)。随着信息化进程加快,对汉字的算是只能是越来越方便。

                  • 家园 这要看多高精度,

                      对于高精度的字来说是矢量字库小,但对低精度的来说还是点阵字库小。

                      比如说二级字库6000多个字,矢量字库依字体的不同从3M多到6M多(我看到一个宋体方正超大字符集,39.6M),而点阵字库16X16的是200多k,24X24的是500多k,打印4号字以下24X24的就相当不错了。

                      矢量字库的好处是打印大字,不管放多大都不会变形(出现锯齿),点阵字库的优点在小字快速显示,你现在看这个帖子的屏幕上的字实际就是点阵字库。

                      如果一个存储量只有一两M以下的处理器系统(如单片机)显示汉字就没法用矢量字库。象常用的51系列单片机,内存只有64k+64k,放不下最小的汉字库,要显示汉字就很困难,而显示字母就很容易。

                    • 家园 就算是从今天开始文字改革

                      全社会齐动员,就像大跃进一样大踏步前进,跑步奔向胜利的前方,咱们想想大约需要多少年?

                      五十年?太长。那就三十年?二十年?好吧,十年!行了吧?十年后全社会都用拼音文字来写文章来出书来写所有的指示牌,所有的单片机上都只装字母不装汉字库。

                      十年之后只有128K的单片机还会存在吗?十年前我用的计算机是640K内存,现在还能买得到这内存吗?

                      • 家园 文字改革确实是难事,

                          就是大力推行没有几十年改不过来,如果不是一个强力政府用强力手段可能一两百年也难改。

                          问题在于我并没有说现在就要改,也没有说拼音文字全面占优,只是说拼音文字在读、写方面与方块字比有强大的优势,这个读写优势再加上总字数少很多的优势造成文字与机器(打字机、电动文字打印机、早期计算机,甚至还可以加上一个活字印刷)联系时比较容易解决,这就造成汉字在这方面的应用迟于西方。

                          可以70以后的学生都没见过机械打字机,英文与汉字的差别极大,英文的成本低得多,使用也方便得多,用英语的文字工作者三十年代前就用上了打字机。而汉字呢?我敢说在计算机开始普及前没有一个中文工作者能用中文打字机工作,不管是在国内还是国外,需要用中文打字机的都得经过相当的训练才行。就是经过训练使用中文打字机的速度也远远慢于字母打字机,需要当场记录的用字母打字机只要语速慢一点就行了(打字员同样熟练),中文打字机就不可能当场记录。

                          在点阵式打印机出现之前,用电动文字打印机打印汉字是不可能的事,而打印字母的有多种类型。

                          早期计算机对处理汉字的困难我说过了,可能你们会想活字印刷是中国发明的。不错,活字印刷是中国发明的(棒子不要找我),但推广应用不是中国,是在西欧先大规模应用的,直到清朝中后期中国的汉字出版还在用整块雕板印刷。这是为什么?除了机械加工水平的差别以外,就是因为汉字数量太多,几万个汉字活字拣起来也是个麻烦事,更不要说做那么多种的活字了。就是用铸造铅字,

                        汉字一种字体就要做几万个字模,字母呢?加上各种符号也就一百个左右。到49年以后国家规定了常用字规范才改善一些,但也是近万个与一百个的差别。

                          以前的手工雕刻时,汉字活字与整块雕板没有明显的优势,所以中国先发明了活字印刷而应用上就落后了。这完全可以说是方块字与字母的差别造成的。

                          回来说这单片机,早期有不少类型的单片机现在已经淘汰了,但这64k程序存储器加64K数据存储器的51系列单片机生命力非常强大。它的出现年代我搞不清楚,现在也没功夫去查。但我记得我最早给它编程时用的是苹果II型计算机,后进没多久改用IBM-pc机,就是那个cpu是准16位的8088的计算机,印象中是在八十年代中期。到现在,苹果II和IBM-pc早就不见影子了,51系列单片机也有了很多发展,但它的内存还是64k程序存储器加64K数据存储器,一点也没增加,就是现在51系列单片机应用也非常广泛,很多芯片厂家还把它插入很多专用芯片中,应用在许多简单控制中。实际上51系列单片机的64k程序存储器加64K数据存储器不是它的实际容量,而是它可能扩展的最大容量,大部分应用用不了这么多,比如说常用的几种自带存储器的芯片:89c51、89c52、89c55只有4、8、20k的程序存储器,没有数据存储器,只有256字节的数据寄存器,(当然可以扩展),就这么点内存在许多地方也一样够用。

                          从51系列单片机二十多年的发展看,再过一、二十年还会在应用,内存还是这么多。

                • 家园 在计算机技术不断发展的条件下,每个字所占的容量真的不重要
        • 家园 有几点不同意见

          不管怎么说,表音字母比表意方块字好学的多,也好写得多。就是咱河里这些学过十几、几十年汉字的河鱼,也肯定每个人都会有或多或少不识识的汉字(在二级字库范围内,六千多个汉字),如果完全拼音化,只要认全字母,学会拼法就不会有不认识的字了。

          应该是“学会拼法就不会有不会读的字了”,这样的说法应该比较严谨。至于会读之后知道这个字/词什么意思,应该也是“认识”的一个组成部分,就知音知意而言,表音和表意文字没有级别上的显著差异,各有优劣。以英汉为例,英文不符合读音规则的单词,仍然需要辅以音标,汉语则需要辅以汉语拼音,就知意而言,英文和汉语都可以从一些构词法上面推出大概的意思。

          所以,当代表意文字和表音文字不能仅仅从字面上理解为表意文字不表音和表音文字不表意,语言文字发展到今天,已经不能简单用表什么涵盖全部了。

          如果把眼光放远一点,看这两种文字的发展,我们很容易发现,表意的汉语进行表音的进化很容易,远有六书之形声字,今有汉语拼音方案,源流长远,而表音文字进行表意补充则难度很大了,一个维度的文字和两个维度的文字比较,从信息量的承载潜力上说,现有的以一维拼写为主的表音文字是很难进行表意化演进的。

          方块字同音异形异意字可以用拼音只组词,大部分词都用两个以上的字(指原方块字)组成,这样岐意就会很少,再剩下有岐意的词可以换用另一个同意词或用上下文区别,有人试验过,用现在的方块汉字,每个同音异形异意字都统一用一个字代替来打印出人民日报上的文章,看文章的人大多能正确理解词意(结合上下文)。甚至有人提议过用此方法(这样只剩下几十还是一百多汉字,当然组成词就多了)印发另一版本的人民日报的,借以到拼音化的过渡;我有个朋友有段时间在国外,没有汉字输入,给我发Email只好用汉语拼音(俺看不懂英文),只是读得慢一点,意思都能读懂。

          这种拼音化付出的代价实在是太大了,用人民日报举例恰恰说明了拼音化的局限,因为您提到了词的使用和上下文。双音化是汉语发展的一个趋势,然而语言文字最为迷人的就是趋势仅能总结而不能预测,不好说哪天咱们又开始像古人那样惜字如金了,而您所言的这种拼音化在当代白话文的情况下是可以说的过去的,而且,太祖当年甚至比您更狂热的推进拼音化,还提出过拼音化毛泽东选集,后来也不了了之了,估计老人家想明白了,著书立传目的何在?因为这恰恰触及了一个表音文字的劣势——语言的变迁导致文字的割裂,古今英语的巨大差异就是例证之一,如果仅看学习难度,古汉语的学习难度几乎可以忽略不计了,这在文化的传承上是有巨大的积极意义的。

          当然,无论怎么说,无论是否拼音化,汉语拼音的地位是无论怎么褒奖都不过分的,也许我们这一代开始,能够传承给后代的信息量会史无前例的充实,举一例而言

          硕鼠硕鼠,无食我黍!三岁贯女,莫我肯顾。

          逝将去女,适彼乐土。乐土乐土,爰得我所。

          硕鼠硕鼠,无食我麦!三岁贯女,莫我肯德。

          逝将去女,适彼乐国。乐国乐国,爰得我直。

          硕鼠硕鼠,无食我苗!三岁贯女,莫我肯劳。

          逝将去女,适彼乐郊。乐郊乐郊,谁之永号。

          这首诗著名吧,诗经,魏风,民歌都是老百姓唱和的,也就是说,当时,这个就是大白话了,可是我们读的时候,看第三行,一个奇怪的情况出现了——韵脚不对了,全诗仅此一句不押韵的,非常不合道理,这事儿羽羊当初很费琢磨,先生含笑曰:豫东方言读之。茅塞顿开。数千年前,百姓放歌,情景瞬间犹在眼前,这个就是意至音不至的鲜活例子了。而今有了汉语拼音,我们的子孙,则不光能知吾辈所想,更能知吾辈所语了,岂不大善。

分页树展主题 · 全看首页 上页
/ 10
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河