淘客熙熙

主题:【原创】中文文化消失的必然性:文化的传承。搜索引擎的搜索技术的影响 -- 铁手

共:💬23 🌺22
全看树展主题 · 分页首页 上页
/ 2
下页 末页
家园 【原创】中文文化消失的必然性:文化的传承。搜索引擎的搜索技术的影响

原标题是用了“GOOGLE的搜索技术”,改为“搜索引擎的搜索技术”--注

但愿不是我危言耸听。

之前有过一些想法,前些时候,正好又看到 苏萸【保卫西西-原创】拿什么对抗google。拖了些时候,写出来供大家讨论。

几千年的存在了,作为一个会写中文,会看中文的人,我们都会为我们的中华文明史而自豪。在若干个历史上曾经辉煌过,而如今只能通过历史和考古来缅怀的其他文明的灯光摇弋下,我们都很庆幸,也很自豪我们的文明,经过千百年的锤炼,生存、并繁衍着。

很多人都对这几千年的文化传承感到自豪,也必然相信我们的文明会子子孙孙的继续下去,也许几万年以后,我们的后裔还会象我们今天一样的自豪。

坦率的说,我不乐观。即便中国的大量的人口天然成为一个极端有利的条件。

有一次和朋友讨论中西之间语言对文明的影响(他是个德国人),他很惊讶于中文的一些特点。在欧洲国家里,表示同一个意思的词,比如说某个地方的地名,在不同的地方写法可以不一样,但是发音基本上类似。而在中国呢?同一个词,在不同的地方,写法是相同的,但是发音可能随着地域变化而不同。

我想,正是因为“书同文”让我们的文化和文明,在几千年里不断出现的民族融合过程中而得以保存和延续。

对中文文化消失的忧虑,或者说是对中文文化延续的不乐观,是因为现在的文化传播方式已经大不相同。

现在,互联网已经改变了这个世界很多。能够上互联网的人,也很少有不利用搜索引擎来找资料的。在这种情况下,或者在可以预见的将来,文化的传播已经不能离开网络的存在。

问题是在于,你到网上找资料的时候,搜索引擎提供给你什么,以什么样的次序提供,会有怎样影响呢?

几乎所有的搜索引擎都会使用某种打分规则来给页面打分,从而决定页面的重要性,也决定某个页面有多大的机会被人看到。

拿GOOGLE来说明吧。它使用的是PAGERANK为指标,PAGERANK由很多因素决定最后的值,其中很关键的一个是有多少个页面链接到某个页面,那些页面的重要性怎样?在某种程度上,这个PAGERANK的算法就是一种高人推荐的一种计算机实现。显然,诸葛亮的推荐显然要比蒋干的推荐更让人另眼相待不是?关键的关键,是有没有人推荐?

最近我在网上搜一些资料,中文页面和英文页面,说实在,差别太大。

同样的内容,可以在无数个中文页面里找到,但是不知道原作者是谁。而在英文的页面里,重复的很少,而从一个页面里,也能够很容易的通过链接的引用而找到其他网站的相关内容。

因为GOOGLE搜索引擎的地位,也因为我们日益依赖于搜索引擎“喂”给我们东西,GOOGLE的PAGERANK的存在,虽然未必就是英文页面里众多链接现象的根本,但至少也是鼓励了很多人尽可能的通过链接的交换,通过引用别人的链接而让别人也链接自己来提高自己内容的受关注程度。最终,群体的行为,直接和间接的导致相关内容的相互关联,也导致原创的、有实际内容的页面更容易被人看到。

这就是游戏规则!

也会是 如果 我们 不 注意 引用 别人 的 内容 和 链接,而 导致 中文 文化 和 文明 在 网络 和 现实 中 消失 的 根本 原因。

会不会呢?

(待续)


本帖一共被 3 帖 引用 (帖内工具实现)
家园 果然是危言耸听
家园 文化不会因为技术而消失。中文网络世界的弊端。

这篇文章提出了两个问题。第一是中文的方言发音不规范的问题,第二是Google的page ranking的问题。中间的过渡不太连贯,我没看明白其中的逻辑。

英文的one,有的地方念“万”,有的地方念“旺”。英美发音区别也很多。但是没有到中国的方言造成不能交流的地步。这更显出推广普通话的重要性。

一个搜索引擎的技术问题,不会导致文化的消失,大请放心。技术是跟着人走的。假想一下,当初计算机产生,不能处理中文,没有合用的中文输入法,那时候的恐慌要比你现在的更巨大。其实这都是细枝末节。技术上没有不能实现的道理。Google采取适合英文世界的技术,也会改进自己来适应中文世界。如果西方人不搞,中国人也会自己搞。你描述的确实是个问题,我不是搞算法的,也不知道解决的答案。但是如果说这是个不能解决的技术问题,我会非常非常惊讶的。

关于中英文网络世界的区别我愿意多谈谈。

我去英文网站比较多,逛论坛也一直去英文的。后来再回到中文论坛,才看出了各种弊端。还不得不自己办了个小论坛。不过先夸夸西西河,不是吹捧,而是真心的。西西河的讨论气氛非常好。也是我知道的唯一能来的中文论坛。如果我以前知道有西西河,可能就不会自己开论坛了。

中文网络世界的弊端很多,但是我只就着你的话说一点,就是互联的问题。中国论坛有个特别的“原创”的概念,这在英文论坛是没有的。为什么有原创呢?因为转载太多了。转载,就是ctrl-c,ctrl-v。别说论坛了,正经做网站的也敢这么干。所以你搜索什么,都是发现一模一样的东西,所有网站都有。但是英文论坛,(还有我的论坛也是这么要求的),转帖,给个连接就行了,加个摘要更好。除了特殊的理由,比如所连网站被封、只好全文转载,我看不出有任何理由把全文摘过来。互联网的方便之处就是连接。你给出连接了,别人看到了,为什么非要全照抄过来呢?

一个重要原因是论坛怕访客流失,怕访客从连接找到别的地方去了。极端的论坛根本就禁止连接的功能。所以我在西西河也比较小心些,都是全文照抄过来,以免版主不悦。

真是很可悲,简直是粗暴的取消了互联网的最大功能。这一点,我觉得是太小气了。如果我论坛的访客,从我的连接,发现了他需要的东西,找到了其他更多的东西,我会因此高兴,我认为的帖子帮助了别人,有价值。正因为连接多,才更使你有价值。

并且我也不担心别人会走。来论坛的,是和坛子里的人聊,他去别的地方读文章,还是会回这里聊。如果他觉得我这里不如别的地方好,尽管去,我怎么会强留人呢?

有些作IT的人非常明白这个道理,有些IT界名人的blog都是给别人给朋友做很多连接。我很赞赏这个态度。

把中文网络世界的各立山寨的封闭特色上升为文化问题不算过分。我们还没有形成这种开放的互助的双赢的文化。

家园 特别赞同你后面的观点,也是我一直想努力实现。

坦白交代一下,我前面那个主题那么说,说白了,无非是想为后面西西河的一些举措做个铺垫。最好的效果,就是实现我以前提到过的“选择性文摘”

在网站的首页我刚加上了一些简要说明。引用链接数的功能也已经有了一些模样,很快就会正式推出。

就目前而言,在西西河里是不鼓励全文转载,而是更鼓励以文摘链接+作者名的方式来进行。

将来的话,会慢慢过渡到 文摘链接+作者名+部分内容而不是全部内容的方式。

你后半部分内容说的非常好,其实也是我的那个立论的重要基础之一。

有个误解需要澄清一下。是书同文,而音不同的内容方面,是我写的不够清楚,造成误解了。

我的意思是,书同文,而是不书同音,这个事实,是中国文化得以延续的重要基础。古代的时候,只要我们刻简,刻书,文化的延续就可以进行。

跳跃到现在的GOOGLE,的确是有些大。

家园 不会不会

看一种文化的延续,关键还是要看这种文化的载体,说白了就是运用这种文化的人民.只要中国,中国人在这个世界上保持经济,政治,军事的规模,其文化必然会保持和发扬.

顺便说一句,目前跟政府打交道的事情,很多表格,文件,必须是以中文为准,英文只作为参考,不具有法律效力,很多人(包括我)在具体操作时候,曾经很希望能有英文同等效力的文件---

然而现在看起来,这样坚持是对的.

家园 响应舵主号召,献花讨论

大家对中文、西文孰优孰劣意见不一,对Google引导互联网技术发展或许分歧不会太大。我个人认为从人类智能的发展,中西方应该不会有大差别,就象80年代初PC引入国内,输入法是最大的阻碍一样,但现在小孩们打字贼快。我觉得问题在于中国的科技体制有问题,高喊“创新”,急功近利,鞭打快牛,出小聪明者众,大智慧者少,如能不能不跟从Google的思路而另辟捷径。

我个人认为中文不至于有生存危机,中文互联网仍然会热闹下去,因为互联网除了传播知识的功能外,娱乐更是普罗大众的基本要求。

我也相信中文搜索技术也会慢慢出现不同于Google的一些方法。

家园 【文摘】果然是危言耸听

个人——企业(组织)——民族——文化(文明)

不是这样简单就能够链接起来的吧。

google用什么样的算法筛选、排序会对情报/知识的获取做出怎样的影响,

是个问题。但是,人还是可以做出自己的选择和排序的。这和控制环境恶化,

避免最终生存在垃圾之中所要做出的劳动是类似的。

问题的关键在人自身。要付出学费、要付出汗水鲜血乃至生命来意识到

问题的存在,并在此基础上做出解决问题的努力是一个痛苦的劳动过程。

媒体、互联网和著作权的话题,自己所欠的账并没忘。容俺再准备些馅和柴吧。

列几个参考先

·关于[知识共享]( CC——Creative Commons )

http://cn.creativecommons.org/

http://www.creativecommons.cn/

·《Republic.com》作者 Cass Sunstein

中文译名是《网络共和国》或《网络共和国的民主前景何在》

(日文书名直译成中文是:互联网是民主的敌人吗)

关键词(Tags): #劳动
家园 您说的我也同意,可是对于中文的还真有点不现实

我们都知道,国内用户不能看到很多外来链接,也不一定那些链接的文章就真的是反对谁谁的,可只要从某些ip来的,一概不给看。那您说的只给链接的话,就会有很多人看不到原文。这真的算是比较中国特色的东西了,也许古巴、朝鲜也会有类似限制,可毕竟他们在网络咨询上占的比例太小了。

还有很多其他中国特色的东西,我记得好多突发事件,国内一些正规网站也会在第一时间报道,可是不久又会因为这样那样的原因删掉,只给链接让人不知所以,对于事态的来龙去脉摸不着头脑。其实哪怕第一时间的报道有误,让我们知道一下,了解媒体也不那么冷静也好啊。还有,总讲与时具进,过一段时期的说法就变了。例如某个好人后来发现问题变成了一个坏人,以前的说法干脆全部删掉了,好像从来就没被人当过好人似的,个人感觉很没有必要,具体就不争论了。所以保留原文在这种情况下,也算有点用吧。

还有一个特色,可说是无奈。我数年网上搜索信息的经验告诉我,中文讯息链接失效的太快了,好多公司、个人网站生生的就消失了,那上面的信息也随着驾鹤西去了,让人郁闷。一般2-3年前的中文一手信息就不好找了。而与此同时,大多数英文信息,都能长久存在,找到6-8年前的信息也不算困难。即使公司倒闭、个人去世,他们的网页不再更新,也不会被自动删除。所以保留中文原文的拷贝也是不得已而为之。

家园 论坛的外在形式和内心世界

你说得很有道理。我的意思呢,也不是说全文转载有多么不好,但是不给连接甚至禁止连接是非常不好的。

既然说开了,我再多说几句。从全文转载这个外在形式,我们可以看到更多的内在的东西。其他很多论坛,不包括西西河,都是转载一篇文章,其他人在下面品头论足,仅此而已。这些论坛不是论坛,是文章集散地。他们有自己的价值,我也定期查一查这些文章集散地,读一读,但是没有发言的价值。

西西河里很多很好的讨论。这是我来的原因。

西西河还有个特有的形式,就是嘉宾。一个人主讲,其他人加入。我来听专家讲,有收获。专家听各位回馈,有帮助。但是如果有人有了尖锐对立的观点呢?这时候就有个有趣的现象了——他会新开个主题。

但是在英文论坛,没有人会针对一篇文章来讨论的。除非是特例,比如袁伟时的一篇文章出事儿了,咱们来针对谈。一般来说不会的,一般就是起个头,然后你们就发言吧。假如咱们讨论胡锦涛访美,或者乡村水利,你会针对一篇文章谈吗?不会的。就是开个头,大家谈,这是基于一个你有最起码的阅读量和研究能力的假设(我希望这个假设在中文读者中成立)。那么讨论者贡献连接,加起来就多了,会极大的增加你的阅读量。阅读量大的主儿会给你很多很多连接!

如果三年之后连接失效呢?从文章积累这个角度来看是损失,但是用户是不会介意的,因为我是在和朋友讨论,不是在和某篇文章讨论。所以你看那些文章集散地会注意“精化区”的维护,甚至单作一个界面,但是论坛不是这么搞的。

这里面我倒没有褒贬之意。无论是常见的中文论坛,英文论坛,还是西西河这样的很有特色的地方,各有各的好处。但是中文网络世界缺乏一个像英文论坛那种形式的论坛,是个缺失。

我发现论坛作为一个软件,内在和外在是紧密相连的。看到一个建筑的格局,就知道里面的居民如果生活。看到论坛的功能,就知道用户在怎么谈。海外还有几个大论坛采取的是最新回帖不置顶,太荒唐了,只能做文章集散地。版式是直排还是缩进是另一个问题,我比较倾向于直排,缩进式的树状版面是发散性思维,经常演变成捉对厮杀。

扯得太远了,打住了。有些想法可能没讲清楚。

家园 我倒是很喜欢全文转贴

只要转贴的同时不要忘记写上转贴,并尽量把作者名字写上就行,当然贴上原贴地址就更好了。

我很讨厌直接贴链接,首先链接要是网站还好,要是论坛,很多都是需要注册才能看,让人很是不爽。而且如今网络病毒横行,谁知道链接里面有没有毒?

家园 没见过网络链接有病毒的

反正我上网很多年,没有碰到过。另外,我有个杀毒软件不错,一年来都没有碰到一个病毒,如果需要,我可以传给你。

家园 没看明白

不过以前倒是看过一篇文章,说google因为是机器自动收集网页,所以引用链接越多,这个页面越靠前。带来一个什么问题呢?就是人气越高越会广为流传(哪怕它是错误的)。。。所以google搜来的东西不可靠。

不知道是否就是楼主表达的意思?

家园 你说的这也是个问题,所以我也不大喜欢链接

有些连接里面带着像3721那种恶心的东西确实要命。还有些挂着羊头卖狗肉的,你一点跑去不知道什么地方看恶心图片就更坏了

家园 嗬嗬,用户要求第一!

嗬嗬,喜欢全文转载的人还是挺多的。这些说得也都是实情。不过我逛的网站少,恶意连接没见识过。

如果我只是个用户,可能还要多说几句。但我是个程序员,也是个小网管,所以我深知,用户是对的!

这个事情当然是铁手肯定都很熟悉。

做软件嘛,必须让用户满意。但是让用户满意的方案可以有很多种,这里面就可以作出引导。

家园 这个可能和论坛的定位有关系。

有些论坛,就是为了流量,所以不会在乎很多东西,只要有人来看就好。

作为西西河,更希望是作为一些原创好文章的收藏点,因而,在某种程度上,单纯以论坛来看,还是不是很贴切。

对了,嘉宾的方式,也不完全是一个人主导,而是更多的,是做为一种荣誉性质,并借此激发一些话题。版面的主题,并不受嘉宾限制。

全看树展主题 · 分页首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河