淘客熙熙

近期网站停站换新具体说明
按以上说明时间，延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间

主题：这几天大火的Deepseek没有人讨论吗 -- 俺本懒人

共:💬101 🌺278 🌵11新 💬22 🌺3

大浪淘沙

全看树展主题 · 分页首页上页下页末页

复续红楼太难为他，让他续了三体

哈哈，三体舰队

二维化，那三个二维空间堆叠起来不就复活了？

复与其说是信息压缩

然后情绪是一个维度

动物没有（复杂）情绪，再到超越情绪的理性，否定之否定，不知是个什么关系了。

复与其说是信息压缩

是的，抽象和重构。能够重够有损压缩的信息，就是创造力的体现

是的，抽象和重构，应该算是一种有损压缩，不能单纯说压缩——能够重损压缩的信息，就是创造力的体现。

当DeepSeek的抽象损失了大量信息之后，它还能把原来的信息重构个七七八八，这就表明它有了创造能力。

所谓的创造能力并不神奇，就是无中生有，凭空造假。创造能力最简单的例子是图像生成模型中的——超分辨率（Super-Resolution）。

对生成模型比较陌生的童鞋，可以去了解一下这个问题。把一张低分辨率图像变成高分辨率图像，需要补充大量的不存在的细节信息，这就涉及到无中生有、凭空造假，这些补充进去的细节信息都是伪造的。

复人类找AI是干活的

缸中之脑现在为止只能当智能助手，完全替代的时候人就危险了

我不知道你为啥有期望缸中之脑完全替代人类的想法，这很危险很资本——金融资本家只需要无人机，工商资本家只需要无人工厂。

当缸中之恼完全替代人类的时候，那是资本的盛世，却是人本的末日——工商资本也将完全蜕变成金融资本，普通人就再也没有存在的价值了。

如果你不是金融资本的一员，也没被马恩忽悠瘸的话，大家最好祈祷缸中之脑止步于智能助手的层次，牛马还有价值，后面一不小心就是历史的终结。

复缸中之脑现在为止只能当智能助手，完全替代的时候人就危险了

替代部分繁重体力活也是需求啊

比如养老院或者家庭护理

劳动力缺乏国家的工人。。。

象美国这样失业率很低的，很多场所还是缺人。。。

复很独特的视角，对我有启发

DeepSeek还到不了逻辑的层次，依然是自然语言的层次

DeepSeek把模型变小是它最关键的一点。

自然语言存在大量的冗余，从抽象和有损的信息压缩角度，DeepSeek已经把自然语言中的冗余挤得差不多了。

自然语言中的逻辑不是逻辑，通篇全是漏洞；形式逻辑因为污染认知问题更大，真正的逻辑是数学中的符号逻辑那一套。

大多数大学生可以从高数、微积分中那套无穷小逼近的那套写法了解一些符号逻辑，更早的话，初中几何中的三个点表示的因为、所以。

我是上过《离散数学》，对于全序偏序、符号逻辑那些体会更深一些，虽然最后收获不多，但我知道什么才是符号逻辑。

--

DeepSeek当前为止并没有表现出任何逻辑能力，也就是判断、证明、证否这些真正的逻辑能力。

DeepSeek当前为止真正表现出来的能力是把原问题分析细化的能力，也就是你当你对DeepSeek提出一个问题之后：

（1）DeepSeek只是用他的丰富的资料库，把问题分析细化；

（2）用更有条理的语言把问题描述得更清晰；

换句话说，DeepSeek只是用它的知识库，把你提出的问题重新描述了一遍，补充资料，组织得更有条理性——所以我称之为分析细化能力。

你提出一个问题，DeepSeek负责描述这个问题，增加资料，更加条理化，然后看你自己能不能找到这个问题的答案。

DeepSeek的回复并没有真正回答这个问题，能不能得出这个问题的答案全看用户自己——能不能充分利用DeepSeek提供的那些资料，能不能充分利用DeepSeek把问题条理化时透漏出来的那些结构化信息。

--

DeepSeek能够做到分析和细化，不是因为它具有了逻辑能力，而是它把自然语言中的冗余挤掉得差不多了，所以特别擅长变换表述。

DeepSeek的分析细化能力，是自然语言层次的变换表述，因为它可以补充各种资料，因为它知道各种结构化信息，所以它可以补完问题。

DeepSeek的变化自然语言的表述，是为了把你提出的问题补充完整，它负责提供各种资料，负责提供结构化信息——但负责做出判断的是用户。

--

所以我有时特别不明白，为啥你们对着自然语言讨论逻辑，金岳霖有句话：红楼梦中的哲学不是哲学，金岳霖的哲学就指逻辑。

讨论逻辑是需要门槛的，我们理工科的门槛叫严格逻辑，数学的门槛叫纯粹逻辑，我严格逻辑还可以，到纯粹逻辑就开始欠费了。

平常我们在网上讨论的这些都不是逻辑层次，而是自然语言的层次。至少也要到符号逻辑的层次，才能真正的讨论逻辑。

--

最后，交互属于HCI（人机交互接口）的研究内容，并不是真正回答你提出的问题才叫交互。

AI回答问题这种交互往往只存在于科幻中，但我们讨论是现实中的技术问题，就不要套科幻了，我怎么觉得你们把科幻当真了？

就像我反复强调的一样，DeepSeek利用它的分析细化能力，把你问题补充完整，也是一种交互。

通宝推：薄荷糖家族,南门桥,

复 DeepSeek还到不了逻辑的层次，依然是自然语言的层次

AI要到什么层次它才能输出人类未知的东西

什么样的合金熔点最高？

目前已知熔点最高的合金是五碳化四钽铪（Ta₄HfC₅）合金，其熔点高达4215摄氏度。

上面这个，就还是个搜索嘛

复 AI要到什么层次它才能输出人类未知的东西

“叙事即权力，想象力即战场”、“城中谈礼法，乡野种稻粱”算吗

这两句都是DeepSeek跟我对话的时候写出来的，我去网上搜了一下，四句只有“叙事即权力”能在网上搜到。

这四句都是我想说但说不出来的，结果DeepSeek跟我对话一会，就成功成为了我的嘴替——为什么我说模型小就意味着创造能力，这就是创造能力！

你举得那个例子叫空想，恰恰是缸中之脑之外的，创造能力指的是绘画之类的，现在DeepSeek在自然语言方面的创造能力太离谱了。

复 “叙事即权力，想象力即战场”、“城中谈礼法，乡野种稻粱”算吗

问了豆包水滴的材料体现出刘慈欣的理科功底

有什么办法能提高材料的熔点吗？

。

改变材料的微观结构

- 细化晶粒：一般情况下，晶粒越细小，材料的熔点越高。

看来人类还是找到了方向嘛，晶粒细化到原子核尺寸那水滴的熔点就是无穷大了吧。

提问能力——正确的提问，这样一直打破砂锅问到底问下去说不定就能找到突破口，有了方向就好办就怕没有方向。

复 “叙事即权力，想象力即战场”、“城中谈礼法，乡野种稻粱”算吗

这方面你可以做个试验

当年藤子京给范中淹写了一封信，信中描写了岳阳楼洞庭湖及风景，然后范中淹这个从来没有去过岳阳楼的人，写出了到现在依然脍炙人口的《岳阳楼记》。几十年前就有这样的想法，就是靠一个简单的介绍，就能恢复出一篇雄文或者是详细的介绍，当然是视频更好。结果今天，几十年前的梦想基本实现了。

复胡锡进这个帖子里的这句值得关注呀

这个就是 DeepSeek 瞎编的

不信你拿同样的问题再去问一遍 DeepSeek，它保证给你个不同的天顶星科技。😁

在睁着眼说瞎话这方面，DeepSeek和其他大模型都一样。问题是 DeepSeek 说得更像真的，更具有迷惑性。

复 DeepSeek还到不了逻辑的层次，依然是自然语言的层次

DeepSeek 的模型可不小

深度自己的介绍：

V3: We present DeepSeek-V3, a strong Mixture-of-Experts (MoE) language model with 671B total parameters with 37B activated for each token. To achieve efficient inference and cost-effective training, DeepSeek-V3 adopts Multi-head Latent Attention (MLA) and DeepSeekMoE architectures, which were thoroughly validated in DeepSeek-V2. Furthermore, DeepSeek-V3 pioneers an auxiliary-loss-free strategy for load balancing and sets a multi-token prediction training objective for stronger performance. We pre-train DeepSeek-V3 on 14.8 trillion diverse and high-quality tokens, followed by Supervised Fine-Tuning and Reinforcement Learning stages to fully harness its capabilities. Comprehensive evaluations reveal that DeepSeek-V3 outperforms other open-source models and achieves performance comparable to leading closed-source models.

R1 是基于 V3 的。一样是671B total parameters with 37B activated for each token.。而Meta的羊驼3也不过 15 trillion training tokens，和DeepSeek 基本相当。而训练结果是最大 405B total parameters ，8B 和 70B active。

DeepSeek 主要的突破有两个：

1. 降低了训练成本，缩短了训练时间

2.显示 AI 的思索过程

复 DeepSeekV3的知识领域评估和技术能力评估：数学、编程

DeepSeek研发人员表达过，程序它是就是是，不是就是不是

这样逻辑就很简单干净。

复问了豆包水滴的材料体现出刘慈欣的理科功底

晶粒越细小，材料的熔点越高？

复这方面你可以做个试验

短文依然是下限高、上限低——有惊喜只限于两句组成的对子长度

从最早用机器翻译做出来的“微软对联/微软春联”，一直到现在的DeepSeek，机器写文依然具有下限高、上限低的特点。

简单说，即使让DeepSeek写短文，它也只能交出一篇平平无奇的、不出戏的短文，在侦探类之外的所有类别都——没有惊喜。

优点是符合格式，缺点是只符合格式，除了符合格式之外一无是处，能够超出普通人和新手，但没有上限，没有惊喜。

就像我前面说的那样，DeepSeek并没有真正理解了逻辑、产生了意识，而是通过生成模型在是自然语言层次的模仿、创造、造假。

--

“叙事即权力，想象力即战场”、“城中谈礼法，乡野种稻粱”。我的唯二惊喜都是在同一个会话，一个网上有很多资料的问题“金庸武侠的东西合璧”下面。

这是一个无约束问题，我不知道增加很多约束之后，能不能在热门、客观、有深度的领域，依然能够获得惊喜的答案。

但这依然是特别了不起的成就，毕竟我逛了半年多的西西河，称得上有惊喜的收获只有三次：

（1）来自胡辣汤老哥你转述的那句“压得住舆论处理百姓，压不住舆论处理官员”。

你说这是你90年代听一个体制内官员所说，但却是我费力总结了半天“体制内裹挟体制外，体制外裹挟体制内”一堆车轱辘话的完美嘴替。

（2）审度的"物视角"。

（3）Swell老哥转述的“钱从何来”。

我在DeepSeek一个晚上的收获，赶上在西西河几个月的收获，你就知道DeepSeek多么惊人了：

交流是有门槛的，DeepSeek已经超越了西西河那些体制内的、只会说车轱辘话的脱产教士。

全看树展主题 · 分页首页上页下页末页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

Copyright © cchere 西西河

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明