淘客熙熙

主题:这几天大火的Deepseek没有人讨论吗 -- 俺本懒人

共:💬121 🌺326 🌵12新 💬13 🌺3
全看树展主题 · 分页首页 上页
/ 9
下页 末页
家园 官僚贵族伪装同族,精神贵族和官僚贵族勾结,技术变革后就暴露了

我跟DeepSeek V3讨论了一下我观察的两种特别普遍的社会现象:

(1)贵族伪装成同一阶级,同族贵族天天提民族主义伪装成虚假的同族。

事实上,所有的贵族都是神权-脱产-殖民这一上位阶级,在同出一源也是敌我矛盾,最典型的比如官僚贵族。

(2)上位阶层伪装成上位阶级,同一阶级去当精神贵族。

事实上,真正的贵族、真正的上位阶级的数量是极少的,但他们的外围、帮闲、帮凶、精神皈依者特别多啊。比如官僚贵族的私属宦官。

--

官僚贵族伪装成虚假同族,精神贵族伪装成上位阶级,两者相互勾连,才能够通过不断回音的现象,彻底操纵舆论。

但社会舆论管得了普通人说什么,管不了普通人想什么,也就是社会思潮。操作社会舆论,只是在伪装成社会思潮。

但事实上,社会思潮是经济形势的映射,经济形势好,社会思潮就缓和,经济形势差,社会思潮就矛盾尖锐。

在社会舆论被操纵的情况下,社会思潮和社会舆论彻底无关,只要你看明白了这一点,你就不会再关注社会舆论。

--

现在,一方面是持续不断的技术革命,冲击了官僚贵族和精神贵族的勾结,另一方面,经济形势越来越差。

技术替代不了官僚贵族和他们的私属宦官没关系,最重要的是,技术更新和经济停摆,一方面把他们彻底暴露出来,他们面临整个社会的冲击。

另一方面各种社会支撑功能和他们两者彻底解绑定之后,整个社会就不再需要他们,他们会彻底失去存在之基。

--

当他们彻底暴露,当他们失去存在之基础,短期内,他们作为寄生虫是可以依照惯性继续维持统治。

但比起来之前的寄生,现在这种寄生型统治只是一个外部肿瘤,任何一个外科手术都能把他们彻底收拾掉。

最简单的例子,一鸦二鸦之前的清朝,满蒙贵族在中国是深度寄生,他们和中国本土的官僚地主捆绑在一起了。

(北方的官僚地主、江南的商贸地主、东南的海贸地主也不能完全归入贵族行列,只有江南的宗族地主反动到必须归入的程度。)

但在太平天国、义和团、八国联军侵华、辛丑条约之后,满清政府就已经彻底失去了深度寄生,变成了外部肿瘤。

所以,从太平天国到辛亥革命,屠光了满城,满清政府就完了,作为外部肿瘤的满清,只有满城无法和关内满蒙贵族切割。

辛丑条约之后的满清太小丑了,关外满族、蒙古族都在和满清切割,但需要注意,关外的满蒙贵族依然是支持满清的。

--

只要理解了太平天国和辛亥革命的屠满,你就能明白我为啥与毛和一尊彻底切割,你也能明白颂圣派和神毛派是怎么回事——官僚贵族的私属太监,新时代的满城。

家园 不对。小孩显然是不完善的智能而不是没有智能

我们确认小孩是“不完善的智能”,是因为他在某些方面表现出了只能,例如会搭积木,会说话,跟他能够有效互动。同时在另一方面又表现出“不完善”,例如自行脑补,并且理直气壮地说得跟真的一样。

你不能说一个爱幻想的五岁小孩,常常跟自己的玩具说话,并且跟大人说玩具就是会说话的那种,没有智能。

家园 人工智能对劳动力的替代必然是从下向上的

从替代普通劳工开始,到替代中层管理人员,最后替代领导。

有人说,用AI替换领导就没人出来背责任了。。。这话说得,好像出现AI之前领导会主动出来背责任似的。。。

家园 大家看看,媒体人马前卒对DS的评论对不对? -- 补充帖

著名媒体人马前卒说,DS是踩着GPT肩膀站高的

这似乎解释了我的直觉感受:

和gpt一样好,或者和gpt一样坏

家园 东大才是一本正经的讲假话,脸都不带红的

明明比资本主义还要资本主义,说的却全是社会主义,面不改色心不跳

家园 小异

育良书记们说的假话,逻辑自洽,可以答疑,把听众当正常智商的人。

巴菲特们说的假话,只能听,没有提问答疑环节,一问就露馅,听众被设定为弱智白痴。

懂王应该吃过这个瘪,一直耿耿于怀的。

家园 东大更反动,明明是官僚封建主义。反资本主义反成封建主义

就像我说的,资本主义,特别是在金融资本主义崛起之前,是没有真正的脱产者的,这是资本主义和封建主义的最大区别。

这种情况下,所有人都被资本主义裹挟,所有人都被资本主义异化,这是资本主义最反动的一点,但也是资本主义最进步的一点。

没有真正的脱产者,那么资本主义所有人都是同一阶级的不同阶层,所以资本主义才能诞生罗斯福,诞生社民党,诞生高福利社会的北欧。

--

但马恩派呢?把阶层成为阶级,反了半天,不仅没消灭阶层差别,反而把资本主义已经消灭的阶级给捡了回来了。

在金融资本主义以美国为壳建立超帝国主义,开始往用永生永世贵族过渡的时候,国内的那些官僚可是羡慕得眼珠子都要掉下来,天天在国内琢磨怎么抄袭美元、抄袭美联储、抄袭金融帝国主义。

家园 把观众当人(的电影)人民愿意付钱

隔壁电影楼说了,把观众当人的电影与把观众弱智的电影票房收入能差一万倍。可见我说的这个“小异”还是挺重要的,侮辱智商本质上是不尊重人。

我明白华尔街为啥都是一群耄耋之年的老家伙了,他们的事禁不起问,他们的谎言没法圆。换个周受资那样的年轻人上台,不得与观众互动嘛,很老很老的金融大佬不回答现场提问,理由可以是耳聋、年事已高、身体不适,大家都理解。

家园 把从业人员当爷的电影,从业人员代表人民表示愿付钱,从商人那扣

贼总你也沦落到比烂的地步了?收钱的从业人员,替观众表示愿意付钱,从商人那里扣,你是不是觉得这套逻辑丝滑到你屁股都坐不住了?

家园 感觉西西河到了这类前沿专业领域,信口开河的人有点多

1. 马前卒这次的发言可以忽略,几乎0价值,参考知乎上 段小草 的回答 如何评价第859期睡前消息? - 段小草的回答 - 知乎

https://www.zhihu.com/question/11285665541/answer/92969787112。

2. DeepSeek的总参数在变大,v3/r1比v2/2.5大,v2比之前的coder/chat v1大。但它是MoE模型,和dense模型(llama系列直到3)无法直接比较,并且它的重要创新点就是MoE模型方面的。

河友关于“压缩”/变小部分,我理解来自之前流行对大语言模型的一个理解,将LLM看作世界知识的压缩(压缩既智能 https://zhuanlan.zhihu.com/p/681449063 ),但是本身这个也属于玄学。和LLM工程进展没太大关系。

下面属于我的个人不靠谱总结:

Dense模型不时出现32B在特定任务(尤其是qwen 2.5 coder 32B)反杀70B模型的情况。但是更通用的任务中,大家慢慢发现,知识点记忆(世界知识)仍然需要更大的模型来记忆。这时候高参数,低激活参数的MoE模型显出了优势,尤其是DeepSeek推进到几十上百个专家(分散记忆知识点),但是激活几个的模式,这个创新实际上其他家并没有做到,Mistral只做到8专家2~3激活。(这个创新也是Anthropic CEO文章提到的DeepSeek在MoE上走得更远的创新)

家园 大模型是数据库+信息检索的融合,知识抽象程度既看前者也看后者

只是相关领域,并非大模型领域,但数据索引+搜索算法这块可就是我专业的领域了。

大模型与过去的数据库、数据索引、信息检索比起来,最大的特点是数据库、数据索引、信息检索全融合到一起了,而不是过去孤立的。

所以,大模型才能做到比任何数据索引+信息检索算法更快的搜索结果。而大模型与数据库最大的区别是,大模型把数据抽象成了知识。

大模型把数据抽象成了知识,这个是所有语言类大模型都在做的,而深搜我认为里程碑的一点,不仅表现在模型大小上,更是表现在搜索上。

1. 模型大小。

首先,模型大小不能直接以参数大小估计,你不知道参数的稀疏程度是怎么样的,所有高维模型,经常有大量零值的参数,即算法没把模型用到极限。

DeepSeek(深搜)作为一个独立推动的模型框架,无疑是符合这一点的,而过去的那些基于同一个框架的大模型,毫无疑问参数空间用得更多。

模型大小本身在网上也有数据,我记得是671G,结果你们纷纷告诉我参数怎么怎么样多。(模型文件大小,根据版本不同,最小1.1GB, 最大671GB。)

这也就是为什么在你这个回帖之前,我都懒得再发回复说明这一点,如果连一些最基本的常识都不清楚,我还非得去解释不成?

第一、如果比模型大小,连直接比模型大小都不会,只会比参数大小,那我说又能说啥,我又该说啥?

第二、比模型大小,首先你要选那些性能接近的模型,深搜之前有性能能超过OpenAI最新模型的模型吗?有的话轮的到深搜?

如果你不懂的性能曲线的含义,不懂得在OpenAI最新模型性能往上提升一个级别的含金量,不懂开源模型和闭源模型的性能鸿沟,那我说啥?

2. 搜索速度,这个碾压了吧?这个总该没有疑问了吧?这个性能曲线完全爆表到没办法用OpenAI的行能来防守了吧?

首先,你模型特别大,搜素速度还能上的去,我就从来没见过,模型小和算法好,两者兼备,才能把速度上升一个级别。

其次,所有的大模型最终考验的是预测、决策时候的性能曲线,用得好不好,反应快不快,我还不知道吗?国内一大票大模型知耻。

搜索速度上去了,就是从最终结果上,说明DeepSeek(深搜)的知识抽象程度高,否则你搜索速度根本上不去,靠GPU飙上去的啊?

3. DeepSeek的花费的时候也说了,算力是完全被碾压的,不论是训练的时候,还是预测和决策的时候,性能曲线能够反压,当然是算法的胜利。

算法>算力,但算法太难了,所以大多数时候,大家都是在原有算法那里微创新,然后拼算力、拼数据。

不是大家不想拼算法,而是风险太大了,没人敢做主,微创新风险就小很多,胜有功,失败也是理所当然的。

真的出现算法突破的时候,谁敢不跟风?但并不是大家不知道算法厉害才是真的厉害,你看看现在国内外有多少个跟风?

4. 最后的最后,我是因为只是相关专业,才不敢打包票,才只敢从我懂的角度,给出一些预测。

天天在网上洗地的有傻子,做最前沿的没有傻子,特别是DeepSeek在大模型中属于绝对廉价的,不跟风才是傻子。

那个飞来飞去的li feifei都抢跑到发论文了,这就是最好的证据。DeepSeek绝对是里程碑式的成果,也是当初chat-gpt之后到现在最重要的里程碑。

5. 补充一下,“知识抽象”在大模型领域的术语叫“知识蒸馏”,也就是OpenAI无端指责深搜的借口,但li feifei他们正在做的事情。

Qwen(阿里通义千问)2.5已经证明DeepSeek的模型是最好的。现在li feifei他们的论文好像是在证明DeepSeek蒸馏小模型的手艺是最高的。

我没详细看,是因为我又不是做这个方向的,我现在用深搜还来不及,我去管一个飞来飞去的li feifei做什么干嘛?

只要你是做相关行业的,你就知道DeepSeek的含金量,在当前的时间点上,不论深搜的框架,还是深搜蒸馏的手艺,都是世界之巅。

这就是里程碑的含金量,在这个时刻为止。(模型我不是世界之巅我不清除就不乱说了。)

通宝推:桥上,曾伴浮云,铁手,
家园 正解,应该是突破性的进步

现在研究生论文做算法改进,能有百分之几十的性能提高已经是很好了,何况多数还是自己做了手脚,比如选择性地使用实验数据、选择性更改初始值、参数。但这些在硬件的更新面前根本不值一提。DS在算法软件上呈几何级数的性能提高,应该是算法进步的经典之作。

但河里居然抄袭论还依然很有市场,从表现来看,我也不太相信这几位河友是拿钱发帖的,只能说茧房效应无处不在。

本质上来说,现在的人工智能(包括AIGC)还不具备思维创新能力,但是可以比人类更快速地使用现有知识、进行复杂操作,相信河里的诸位已经在不远的将来可以看的到了。

家园 现在眼见着人力间谍的作用越来越小

主要还是因为现在各种主要的设备都成功国产化,西方通过设备来获取数据的途径被切断了。

家园 【原创】这些大模型是不是还是基于统计学原理对人类知识的梳理?

这些大模型是不是还是基于统计学原理对人类知识的梳理?

比如:哥德巴赫猜想只能由人来解决,而不是由大模型解决。但等到由人类解决并且可能会有多种解法之后,大模型才会在这些知识之上给出一个可能更合理,或者说可能大多数人认为正确的解决方法?

大模型可以把现有的知识进行梳理,在形式上可能会更快、更简洁、更完善、更炫的输出。但从零到一的创造性,它是不会具备的吧?

家园 如果去问微博与百度那美国国际开发署就是NGO

昨天我问了豆包和DS,美国国际开发署是美国政府部门。

大家问问closeai与谷歌试试呗。

所以我看AI目前阶段的功能主要是辟谣反忽悠,传递正确的信息与认知。

你说的这个功能,五十年后能实现?

全看树展主题 · 分页首页 上页
/ 9
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河