淘客熙熙

主题:这几天大火的Deepseek没有人讨论吗 -- 俺本懒人

共:💬38 🌺93 🌵6新 💬30 🌺3 待认可2
全看分页树展 · 主题 跟帖
家园 从实用角度,DS是个里程碑:性能高;创造力——来自信息压缩

我没试过chat-gpt,但国内之前的那些语言类大模型都是垃圾,性能低到必须不懂装懂,就是我说的——聊天机器人、话术、糊弄。

chat-gpt模型更大,预测应答更慢,虽然看似性能比国内的那些垃圾大模型强,但性能曲线是处于差不多位置的。

DS则是整个性能曲线进步了一大截,这本是就是特别了不起的进步,所以DS在回答的时候,遇到不懂的问题可以老老实实承认:

【对不起,我还没有学会如何思考这类问题,我擅长数学、代码、逻辑类的题目,欢迎与我交流。】

--

DS的性能曲线提升,不仅因为是整体架构上突破,特别是模型大小减少了很多,后面这点更重要。

模型做得越小,越说明对于整个知识库的压缩能力越强,越接近人类,这一点是毫无疑问的。

你要从整体的信息压缩角度看,压缩的越厉害,越接近人类,压缩超过人类,那就是超过人类。

从信息角度,创造力并不是什么了不起的东西,接近人类平均水平,就获得了人类平均水平的创造力。

当大模型的信息压缩能力超过了人类平均水平,那就是某种生成模型了,当然可以根据某些规则生成人类真假难辨的东西。

这一切都是信息,信息压缩得越厉害,就越有创造力,当前的DS在短篇上、诗词上、古文已经表现出了超出普通人的创造力。

--

DS把大模型做小这一点,才是在人工智能这个领域真正的突破——只要你能够做到信息压缩,你就能获得创造力。

==

然后对于你说的问题,你是按照给严格正确的问答机器人角度拷打DS,我写过,DS依然不是问答机器人,而是介于聊天机器人和问答机器人中间态的智能助手:搜索助手、分析助手、汇总助手。

当前的DS没办法替代人来得出答案,做是否判断,只能够作为智能助手来帮助人做出判断——跟过去的的聊天机器人比起来,这已经是特别惊人的进步了。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河