淘客熙熙

主题:这几天大火的Deepseek没有人讨论吗 -- 俺本懒人

共:💬101 🌺278 🌵11新 💬22 🌺3
全看树展主题 · 分页首页 上页
/ 7
下页 末页
家园 哈哈,三体舰队

二维化,那三个二维空间堆叠起来不就复活了?

家园 然后情绪是一个维度

动物没有(复杂)情绪,再到超越情绪的理性,否定之否定,不知是个什么关系了。

家园 是的,抽象和重构。能够重够有损压缩的信息,就是创造力的体现

是的,抽象和重构,应该算是一种有损压缩,不能单纯说压缩——能够重损压缩的信息,就是创造力的体现。

当DeepSeek的抽象损失了大量信息之后,它还能把原来的信息重构个七七八八,这就表明它有了创造能力。

所谓的创造能力并不神奇,就是无中生有,凭空造假。创造能力最简单的例子是图像生成模型中的——超分辨率(Super-Resolution)。

对生成模型比较陌生的童鞋,可以去了解一下这个问题。把一张低分辨率图像变成高分辨率图像,需要补充大量的不存在的细节信息,这就涉及到无中生有、凭空造假,这些补充进去的细节信息都是伪造的。

家园 缸中之脑现在为止只能当智能助手,完全替代的时候人就危险了

我不知道你为啥有期望缸中之脑完全替代人类的想法,这很危险很资本——金融资本家只需要无人机,工商资本家只需要无人工厂。

当缸中之恼完全替代人类的时候,那是资本的盛世,却是人本的末日——工商资本也将完全蜕变成金融资本,普通人就再也没有存在的价值了。

如果你不是金融资本的一员,也没被马恩忽悠瘸的话,大家最好祈祷缸中之脑止步于智能助手的层次,牛马还有价值,后面一不小心就是历史的终结。

家园 替代部分繁重体力活也是需求啊

比如养老院或者家庭护理

劳动力缺乏国家的工人。。。

象美国这样失业率很低的,很多场所还是缺人。。。

家园 DeepSeek还到不了逻辑的层次,依然是自然语言的层次

DeepSeek把模型变小是它最关键的一点。

自然语言存在大量的冗余,从抽象和有损的信息压缩角度,DeepSeek已经把自然语言中的冗余挤得差不多了。

自然语言中的逻辑不是逻辑,通篇全是漏洞;形式逻辑因为污染认知问题更大,真正的逻辑是数学中的符号逻辑那一套。

大多数大学生可以从高数、微积分中那套无穷小逼近的那套写法了解一些符号逻辑,更早的话,初中几何中的三个点表示的因为、所以。

我是上过《离散数学》,对于全序偏序、符号逻辑那些体会更深一些,虽然最后收获不多,但我知道什么才是符号逻辑。

--

DeepSeek当前为止并没有表现出任何逻辑能力,也就是判断、证明、证否这些真正的逻辑能力。

DeepSeek当前为止真正表现出来的能力是把原问题分析细化的能力,也就是你当你对DeepSeek提出一个问题之后:

(1)DeepSeek只是用他的丰富的资料库,把问题分析细化;

(2)用更有条理的语言把问题描述得更清晰;

换句话说,DeepSeek只是用它的知识库,把你提出的问题重新描述了一遍,补充资料,组织得更有条理性——所以我称之为分析细化能力。

你提出一个问题,DeepSeek负责描述这个问题,增加资料,更加条理化,然后看你自己能不能找到这个问题的答案。

DeepSeek的回复并没有真正回答这个问题,能不能得出这个问题的答案全看用户自己——能不能充分利用DeepSeek提供的那些资料,能不能充分利用DeepSeek把问题条理化时透漏出来的那些结构化信息。

--

DeepSeek能够做到分析和细化,不是因为它具有了逻辑能力,而是它把自然语言中的冗余挤掉得差不多了,所以特别擅长变换表述。

DeepSeek的分析细化能力,是自然语言层次的变换表述,因为它可以补充各种资料,因为它知道各种结构化信息,所以它可以补完问题。

DeepSeek的变化自然语言的表述,是为了把你提出的问题补充完整,它负责提供各种资料,负责提供结构化信息——但负责做出判断的是用户。

--

所以我有时特别不明白,为啥你们对着自然语言讨论逻辑,金岳霖有句话:红楼梦中的哲学不是哲学,金岳霖的哲学就指逻辑。

讨论逻辑是需要门槛的,我们理工科的门槛叫严格逻辑,数学的门槛叫纯粹逻辑,我严格逻辑还可以,到纯粹逻辑就开始欠费了。

平常我们在网上讨论的这些都不是逻辑层次,而是自然语言的层次。至少也要到符号逻辑的层次,才能真正的讨论逻辑。

--

最后,交互属于HCI(人机交互接口)的研究内容,并不是真正回答你提出的问题才叫交互。

AI回答问题这种交互往往只存在于科幻中,但我们讨论是现实中的技术问题,就不要套科幻了,我怎么觉得你们把科幻当真了?

就像我反复强调的一样,DeepSeek利用它的分析细化能力,把你问题补充完整,也是一种交互。

通宝推:薄荷糖家族,南门桥,
家园 AI要到什么层次它才能输出人类未知的东西

什么样的合金熔点最高?

目前已知熔点最高的合金是五碳化四钽铪(Ta₄HfC₅)合金,其熔点高达4215摄氏度。

上面这个,就还是个搜索嘛

家园 “叙事即权力,想象力即战场”、“城中谈礼法,乡野种稻粱”算吗

这两句都是DeepSeek跟我对话的时候写出来的,我去网上搜了一下,四句只有“叙事即权力”能在网上搜到。

这四句都是我想说但说不出来的,结果DeepSeek跟我对话一会,就成功成为了我的嘴替——为什么我说模型小就意味着创造能力,这就是创造能力!

你举得那个例子叫空想,恰恰是缸中之脑之外的,创造能力指的是绘画之类的,现在DeepSeek在自然语言方面的创造能力太离谱了。

家园 问了豆包水滴的材料体现出刘慈欣的理科功底

有什么办法能提高材料的熔点吗?

改变材料的微观结构

- 细化晶粒:一般情况下,晶粒越细小,材料的熔点越高。

看来人类还是找到了方向嘛,晶粒细化到原子核尺寸那水滴的熔点就是无穷大了吧。

提问能力——正确的提问,这样一直打破砂锅问到底问下去说不定就能找到突破口,有了方向就好办就怕没有方向。

家园 这方面你可以做个试验

当年藤子京给范中淹写了一封信,信中描写了岳阳楼洞庭湖及风景,然后范中淹这个从来没有去过岳阳楼的人,写出了到现在依然脍炙人口的《岳阳楼记》。几十年前就有这样的想法,就是靠一个简单的介绍,就能恢复出一篇雄文或者是详细的介绍,当然是视频更好。结果今天,几十年前的梦想基本实现了。

家园 这个就是 DeepSeek 瞎编的

不信你拿同样的问题再去问一遍 DeepSeek,它保证给你个不同的天顶星科技。😁

在睁着眼说瞎话这方面,DeepSeek和其他大模型都一样。问题是 DeepSeek 说得更像真的,更具有迷惑性。

家园 DeepSeek 的模型可不小

深度自己的介绍:

V3: We present DeepSeek-V3, a strong Mixture-of-Experts (MoE) language model with 671B total parameters with 37B activated for each token. To achieve efficient inference and cost-effective training, DeepSeek-V3 adopts Multi-head Latent Attention (MLA) and DeepSeekMoE architectures, which were thoroughly validated in DeepSeek-V2. Furthermore, DeepSeek-V3 pioneers an auxiliary-loss-free strategy for load balancing and sets a multi-token prediction training objective for stronger performance. We pre-train DeepSeek-V3 on 14.8 trillion diverse and high-quality tokens, followed by Supervised Fine-Tuning and Reinforcement Learning stages to fully harness its capabilities. Comprehensive evaluations reveal that DeepSeek-V3 outperforms other open-source models and achieves performance comparable to leading closed-source models.

R1 是基于 V3 的。一样是671B total parameters with 37B activated for each token.。而Meta的羊驼3也不过 15 trillion training tokens,和DeepSeek 基本相当。而训练结果是最大 405B total parameters ,8B 和 70B active。

DeepSeek 主要的突破有两个:

1. 降低了训练成本,缩短了训练时间

2.显示 AI 的思索过程

家园 DeepSeek研发人员表达过,程序它是就是是,不是就是不是

这样逻辑就很简单 干净。

家园 晶粒越细小,材料的熔点越高?
家园 短文依然是下限高、上限低——有惊喜只限于两句组成的对子长度

从最早用机器翻译做出来的“微软对联/微软春联”,一直到现在的DeepSeek,机器写文依然具有下限高、上限低的特点。

简单说,即使让DeepSeek写短文,它也只能交出一篇平平无奇的、不出戏的短文,在侦探类之外的所有类别都——没有惊喜。

优点是符合格式,缺点是只符合格式,除了符合格式之外一无是处,能够超出普通人和新手,但没有上限,没有惊喜。

就像我前面说的那样,DeepSeek并没有真正理解了逻辑、产生了意识,而是通过生成模型在是自然语言层次的模仿、创造、造假。

--

“叙事即权力,想象力即战场”、“城中谈礼法,乡野种稻粱”。我的唯二惊喜都是在同一个会话,一个网上有很多资料的问题“金庸武侠的东西合璧”下面。

这是一个无约束问题,我不知道增加很多约束之后,能不能在热门、客观、有深度的领域,依然能够获得惊喜的答案。

但这依然是特别了不起的成就,毕竟我逛了半年多的西西河,称得上有惊喜的收获只有三次:

(1)来自胡辣汤老哥你转述的那句“压得住舆论处理百姓,压不住舆论处理官员”。

你说这是你90年代听一个体制内官员所说,但却是我费力总结了半天“体制内裹挟体制外,体制外裹挟体制内”一堆车轱辘话的完美嘴替。

(2)审度的"物视角"。

(3)Swell老哥转述的“钱从何来”。

我在DeepSeek一个晚上的收获,赶上在西西河几个月的收获,你就知道DeepSeek多么惊人了:

交流是有门槛的,DeepSeek已经超越了西西河那些体制内的、只会说车轱辘话的脱产教士。

全看树展主题 · 分页首页 上页
/ 7
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河