- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:【原创】我的chatGPT的使用体验 -- Swell
刚才在请教,因为记忆🈶冲突
左边是高斯--克里斯托夫·古德曼--卡尔·赫尔曼·阿曼杜斯·施瓦茨--费耶尔·利波特--约翰·冯·诺伊曼
右边是黎曼,黎曼结构是阿法狗基础
最初,深度学习和强化学习是分开的。
深度学习就是搞一个训练数据集,通过回溯算法把一堆(可能分好几层)参数算出来。如果,提前给训练数据集做了标注,那就是监督学习。
强化学习是另外一条路:首先对问题的搜索空间给予数学定义,然后在搜索空间中通过试错的方式寻找(最)优解,每步迭代时,大概率是采用以前搜索时找到的当前最优解,小概率是在没有搜索过的空间中去碰运气。因为是大概率采用当前最优解,所以叫强化学习,也因此容易掉进局部最优解的陷阱中。
到阿尔法狗的时候,是在强化学习的基础上,用了深度学习。每对局一盘就是强化学习的一次迭代,迭代的目的就是搜索棋盘每个格点的价值。同一个空间点位,有没有旗子算不同的格点
图书馆,当前的互联网,今后的互联网,三个不同的数据集。从前到后,信息量的大小是递增的,信息的干净程度的递减的。假设信息量的值是1,100,10000;信息的干净程度是100,0.1, 10(-4)(我的拍脑袋,大家不必较真)
今天的chatGPT是从图书馆和当前的互联网学习的,那么它获取干净知识的估值是100.1
未来的chatGPT beta是从图书馆和今后的互联网学习的,它获取干净知识的估值是101。基本上,出道即巅峰。
为什么?由它产生的大量虚假知识可能会封闭掉它进化的可能。
另外,chatGPT生成内容与阿拉法狗搜索棋盘格点价值的底层逻辑是不一样的。所以,不应该用阿尔法狗的进化类比chatGPT
老毛听说分子,原子,电子,,,,就说物质无限可细分,然后西方发现了新粒子,
中国报纸大吹,老毛哲学指导出来的结果 ,物质果然还能细分,,,,
chatgpt在英文方面可能比较容易,来源于英文的语义分析相对简单,更深原因在于语音表字往往隐含的信息量很少。所以英文的各类法律文本很厚,在于定语从句多,而运用chatgpt+3段落恰好很容易分析具体表达的意思。但中文是单字多意,极少文字能够表达丰富的内涵,这个和英文不一样。忘了是看谁的帖说,联合国中文的法律文本是最薄的。
在大陆用户不能使用chatgpt前(目前封了入口),浦东和上海市的语义分析还不能达到有效识别文件程度,最多就是较快的定位可能出现问题的地方,但远未到替代的程度。且看吧。
代码质量差,技术缺乏专业性,软件极端落后。最最关键的是那种既不懂又不屑的态度。
比如med pub上的知识,我认为和图书馆知识的干净程度几乎相同,它也是随着时间不断增长的。另外像elsevier等等,基本上可以看成是一个快速增长的在线图书馆。另外,加上各种政府企业文档,软件手册。
稍微差一点的, 我认为可以去主流的门户网站,报纸,杂志,技术上,stack flow, GitHub。
其他的我认为就不用参与训练了。
一般人说的是"互联网根域名服务器", 这东西其实也没啥用. 既不能切断某些国家的域名服务,也可能被局部污染.
互联网不存在什么"总电源开关"之类的东西.
美国的互联网霸权并不是因为这个.
中国亡国了吗?十五六年来还不是一样从胜利走向胜利。
五十步笑百步可以理解,一百步笑五十步的,我就不理解了。
主要原因是
1\ 现在大部分的有效内容产出是英语 ,比例可能在60%-70%左右(具体比例我没有查),尤其是在信息科学技术领域, 几乎都是英语.
2\因为西方世界的互联网巨头几乎都在美国,所有这些英语信息内容也大部分在美国的信息巨头手上.
3\其他语言的内容生产和传播, 在质量和数量上都被远远拉下了.
自动驾驶好像也有类似问题,到底出了事算谁的。