- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:这几天大火的Deepseek没有人讨论吗 -- 俺本懒人
我没试过chat-gpt,但国内之前的那些语言类大模型都是垃圾,性能低到必须不懂装懂,就是我说的——聊天机器人、话术、糊弄。
chat-gpt模型更大,预测应答更慢,虽然看似性能比国内的那些垃圾大模型强,但性能曲线是处于差不多位置的。
DS则是整个性能曲线进步了一大截,这本是就是特别了不起的进步,所以DS在回答的时候,遇到不懂的问题可以老老实实承认:
【对不起,我还没有学会如何思考这类问题,我擅长数学、代码、逻辑类的题目,欢迎与我交流。】
--
DS的性能曲线提升,不仅因为是整体架构上突破,特别是模型大小减少了很多,后面这点更重要。
模型做得越小,越说明对于整个知识库的压缩能力越强,越接近人类,这一点是毫无疑问的。
你要从整体的信息压缩角度看,压缩的越厉害,越接近人类,压缩超过人类,那就是超过人类。
从信息角度,创造力并不是什么了不起的东西,接近人类平均水平,就获得了人类平均水平的创造力。
当大模型的信息压缩能力超过了人类平均水平,那就是某种生成模型了,当然可以根据某些规则生成人类真假难辨的东西。
这一切都是信息,信息压缩得越厉害,就越有创造力,当前的DS在短篇上、诗词上、古文已经表现出了超出普通人的创造力。
--
DS把大模型做小这一点,才是在人工智能这个领域真正的突破——只要你能够做到信息压缩,你就能获得创造力。
==
然后对于你说的问题,你是按照给严格正确的问答机器人角度拷打DS,我写过,DS依然不是问答机器人,而是介于聊天机器人和问答机器人中间态的智能助手:搜索助手、分析助手、汇总助手。
当前的DS没办法替代人来得出答案,做是否判断,只能够作为智能助手来帮助人做出判断——跟过去的的聊天机器人比起来,这已经是特别惊人的进步了。
- 相关回复 上下关系8
🙂这几天大火的Deepseek没有人讨论吗 14 俺本懒人 字675 2025-01-27 09:45:45
🙂和gpt一样好,或者和gpt一样坏 1 斯特拉斯堡 字2002 2025-01-30 10:26:28
🙂从实用角度,DS是个里程碑:性能高;创造力——来自信息压缩
🙂我不同意你的基本出发点 斯特拉斯堡 字281 2025-01-30 11:43:44
🙂就像生成模型,创造力只管生成,判断归用户。形式逻辑问题很大 nobodyknowsI 字4216 2025-01-30 12:42:24
🙂只能说明你也是中国人 1 胡辣汤 字424 2025-01-30 10:17:49
🙂论文中类似的故事太常见了,但DS靠信息压缩获得了一定创造力 nobodyknowsI 字5147 2025-01-30 11:23:08
🙂DeepSeekV3的知识领域评估和技术能力评估:数学、编程 1 nobodyknowsI 字2205 2025-01-30 09:15:07