- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:这几天大火的Deepseek没有人讨论吗 -- 俺本懒人
我强烈反对用此类工具做教育目的,是因为他们都会一本正经说错话、假话。对于某个问题完全不知道的人,特别是孩子,会毁了他们。但是对于明白的人,做辅助工具是很好的。
比如我问一个很简单的逻辑问题,《圣经-旧约》中国王寿命的矛盾问题,双方都无法给出全面正确的答案。逻辑上是很简单的,对于死亡后才被继承的国王,继位年龄+在位时间=寿命。找到这三个数字,做个比较就好。但是两者都无法做到。不管什么语言,《圣经-旧约》肯定是在训练中可以取得的文字材料。即使训练不用,对于互联网遍地各种语言版本的圣经原文的条件,如果连这个搜索能力也没有,也是令人沮丧的。
另外就是概念解释问题。比如我问过DS什么是马尔可夫过程的问题。在第一次回答时,DS就阐述了马尔可夫过程的一些性质。但其实这只是马尔可夫过程的特例,稳态马尔可夫过程(转移矩阵恒定)的性质。当然为了避免定义的差异,我后来特意问了,转移矩阵不恒定是否也叫马尔可夫过程,它明确回答也是。类似这样的话题,我们需要一些先验知识,一步步去问,它才能提供越来越正确的答案。更危险的是,它会倾向于同意你的诱导性提问。如果你是一个错误但自信的状态,它会大大加强你的错误(有点类似抖音,爱看大长腿的,发现网上女人真的都是大长腿)。如果孩子们拿这类工具当老师,考试吃瘪是小事,工作中犯错损失不可估量。
最后重申,这不是DS的问题,是整个语言大模型类AI的问题。DS依然是gpt的同路人。从使用者的角度看,没有走一条新路。或者说要到非常细分的技术层面,才算新路。我始终认为,这条路上,AI只能是越来越乖巧的,博闻广识的鹦鹉,但并不会有猴子那样的智力。
- 相关回复 上下关系8
🙂这几天大火的Deepseek没有人讨论吗 14 俺本懒人 字675 2025-01-27 09:45:45
🙂和gpt一样好,或者和gpt一样坏
🙂从实用角度,DS是个里程碑:性能高;创造力——来自信息压缩 nobodyknowsI 字2078 2025-01-30 11:05:25
🙂我不同意你的基本出发点 斯特拉斯堡 字281 2025-01-30 11:43:44
🙂就像生成模型,创造力只管生成,判断归用户。形式逻辑问题很大 nobodyknowsI 字4216 2025-01-30 12:42:24
🙂只能说明你也是中国人 1 胡辣汤 字424 2025-01-30 10:17:49
🙂论文中类似的故事太常见了,但DS靠信息压缩获得了一定创造力 nobodyknowsI 字5147 2025-01-30 11:23:08
🙂DeepSeekV3的知识领域评估和技术能力评估:数学、编程 1 nobodyknowsI 字2205 2025-01-30 09:15:07