淘客熙熙

主题:知乎笑话选 -- 万年看客

共:💬116 🌺551 🌵25
全看分页树展 · 主题 跟帖
家园 60:民科码农

https://www.zhihu.com/question/66951195/answer/613442291

问:民科是不是很少拿计算机科学开涮?为什么?

Qi K​ 答:

在北师大读书的时候,在实验室接待过2位计算机民科。CS并不是师大的传统强势专业,本人见识有限,而世界又很大,所以综合来看,全国的计算机民科数量应该不容小觑。

================很意外的是,这两个人的个人特质和研究方向却有某种一致性,下面来具体讲讲。

第一位大概六七十岁,带着一本厚厚的文件来到实验室,希望我们能给他开发一个程序。这一本文件是他自己发明的一个“汉字编码方案”。类似于汉语词典 的“偏旁部首检字表”,有很多个分区,每个分区里有一些汉字。他声称这个分区是根据某些中国传统典籍总结归纳出来的,汉语拼音使用拉丁字母表示汉字,是西方文化对中国文化的入侵。而他发明的这个方案,脱胎于中国古代经典,有利于传播中华传统文化。

他还声称这个方案可以表示出汉语拼音以及任何汉字输入法 都无法输入的汉字。可是他的那份文稿是电脑打印的,我就问他既然无法输入,那这些打印的汉字是如何到电脑里,才打印出来的呢?他似乎无法听懂我的问题。

我想他也许是在学习使用拼音输入汉字的时候遇到了麻烦,他强烈地抨击了使用拼音输入汉字的不合理性,并声称只有年轻人才学得会用拼音打字。他坚定地认为,在北师大,那些跟他同龄的教授专家,也无法熟练地使用拼音打字。我对他的这种想法感到惊讶。虽然没有调查,但我还是相信师大的教授们应该还没水到那个程度,就算不写论文了,用拼音发个短信聊个QQ应该不至于有障碍。

我花费了很多口舌试图让他清晰地定义自己想要干什么。他想做的是输入法吗?那他应该定义电脑键盘上的按键和汉字的对应关系,就像五笔字型那样。他想做的是汉字编码 吗?那他应该定义二进制与汉字之间的对应关系,就像GB2312或者Unicode那样。而这些他都没有,他只是根据某种规律对汉字进行了分类,我无法理解这个东西有什么用,也无法让他明白他应该做的是什么。无奈下我只能终止了与他的沟通,他在抨击了中国大学生视野狭窄、不懂创新等等之后离开了实验室。

================这第二位也是六七十岁,带来的东西也是汉字输入法。也许学习拼音输入法 真的伤害了这个年龄的一些人……相比于第一位奇幻型的“中国传统文化”民科,这第二位则务实得多。他来的时候真的开发出了一个可以工作的输入法。在Windows系统中,有一个叫做“输入法生成器 ”(imegen.exe)的系统自带工具。在这个工具中,给出键盘字母和汉字的对应关系,即可产生一个自制的输入法。这个工具大概在Windows 95时代就有,直到Windows XP。我大概在很小的时候(小学?)就见过它,但从来没有使用过。在我问他是如何开发这个输入法时,他提到了这个工具,所以我很快明白了他干了什么,打算解决什么问题。有了上次的经历,这位老先生让我感觉靠谱很多,我决定仔细听他介绍他的这个输入法有何高明之处。

他的输入法在本质上是一个双拼输入法 。他主要解决的问题是拼音输入法的重码问题。他对双拼的改进是,让韵母带上声调。规定某个按键为某韵母的一声,往右的三个键是这个韵母的二三四声,有了声调之后会一定程度上降低重码。其实设计这样一个方案应该也不算容易,这么多韵母又带上声调,大概会很容易互相冲突。他应该也是费了一些功夫减少这种冲突。而且双拼都会面临零声母 、零韵母等一些问题,他应该也都需要进行处理。他似乎在组词的情况下设计了更多降低重码的方案,但时间久远我有些记不清了。

遗憾的是,他的这个输入法试图解决的问题在今天的意义已经不是很大了。现代的输入法利用现代计算机更强大的计算能力,可以在本地包含更大的词库和更精确的模型。而基于互联网,更是可以实现海量的云端词库和热词实时更新,甚至还有上下文联想等功能。在日常输入中,需要我们停下来选字、解决重码的情况已经比较少见了。在当前的背景下,提高打字速度的更好方法其实是降低按键次数。例如搜狗输入法,只要输入“bjsf”即可在候选字中得到“北京师范大学”、“北京师范大学珠海分校”等选项。bjsf3这5次按键,即可完成“北京师范大学珠海分校”10个字的输入。

这完全依赖于庞大的词库,而不是“bjsf”这四个字重码少。(想自己尝试一下的朋友请使用最新版本的搜狗输入法 在Windows或Mac操作系统的电脑上尝试,手机不行,别问了【捂脸】)我提出这个观点后,他似乎还不太相信,于是我在我的笔记本电脑上向他演示了现代输入法的词库。他要求我输入“我家住在伍佑镇 ”,我直接全拼整句输入,按空格上屏,就得到了准确的结果。他非常惊讶于我的电脑为何知道“伍佑镇”这个地名。我又向他演示了“今晚去巴依老爷吃新疆菜”、“头疼吃对乙酰氨基酚片 ”等比较生僻和拗口的词组,利用云候选都可以自动排在候选词的第一名。他似乎也意识到了现代输入法的先进程度,放弃了对他的输入法先进性的坚持。后来我祝他好运并礼貌送走了他。

评论里说这个人不能算民科,因为他至少拿来了能用的东西。但我想他至少还是具备了一些民科的特质。首先,他能带着作品来到大学,显然是认为这个作品具备了科研成果的独创性和先进性。他跟我的开场白大概是“20年前xx国家领导人号召我们xxx,20年过去了,我完成了这个成果”。从我跟他的交流中,也可以感受到他起初对这个作品的定义就是一个二十年磨一剑的“重大创新”,对他自己所做的事情就是“推动科技发展”,我想在他心中的自己,大概算得上科研人员。而他没有对市场上现有的产品有所了解,也不具备检索科研文献的能力。他来时蓬头垢面,身上散发着难闻的味道,衣服应该也是很久没洗过了。想必是沉迷于他的“科研”,以至于影响了他的正常生活。其实民科在我这里算不上什么特别贬义的词,也没有冒犯意。如果有网友觉得不妥,那我就姑且称他是一位落伍的爱好者吧。

这就是我的经历。

话说回来,要宣称解决了问题,就需要先发现问题。发现的问题至少应该是真实存在的。哥德巴赫猜想 是真实存在的,光速无法被超越是真实存在的,拼音输入汉字对老年朋友不友好这个问题也是真实存在的。推翻冯诺依曼架构 大概不算是个问题,现代处理器也有很多采用了哈佛架构,技术选择不同,并没有推翻一说。

现代互联网产品都在极尽所能优化用户体验,没有计算机科学素养的民科大概也被这些友好的软件们惯坏了,发现不了问题大概就不会有民科了吧~

通宝推:普鲁托,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河