主题:chatGPT是我朝面临的巨大挑战!应鼓励天才和尖子,刻不容 -- 玄铁重剑
美国社媒刻意迎合白左的意识形态,而排斥保守派的意识形态,那么其于社媒数据的人工智能产品也必然是迎合白左,排斥保守派。这正好给了白右,东欧和俄国同类产品生存空间。
未来这些人工智能产品会大大加深美欧内部的社会撕裂。
就算你说的是真的,
如果中国与北约国家网络互通,那么加个英译汉的步骤不需要多少时间,川普发的推特也是同步传到大陆人民的眼球。
如果北约对华网络隔离,需要了解啥最新资讯我们在印度新加坡泰国开个办公室不就行了?
最后与最重要的是,讲英文的人数确实多,但是普通人的口水帖有啥价值?上次问过你指的是不是专业文献你说不是。
自西方白人崛起以来,横扫全世界,除了中国站住站稳了,最后其他民族国家全都跪了。你既然不是中国人,大概率也是跪族。连英国人都大赞中国的四大发明和文官制度并擅加学习和利用,可见人和狗的智慧有着巨大的差距。人总是能相对客观的看问题,而狗是不懂得什么叫客观的看问题,在狗的眼里,只要是不如自己主人的,都是垃圾。所以,狗之所以成为狗,主要是因为没有智慧,智商低下。
你自己所谓的创造性的工作,其实百分之九十还是重复性的。看懂文献,理顺关系,找到几组工作的结合点,迈一小步,做点别人没做过的,总结,写文章。
如果有工具帮你解决90%,哪怕其中的一半,那不是一个人当几个人用?更可怕的是,你认为创造性的百分之十,是不是也没啥了不起?
我个人用下来的体会就是,很多时候,为了到达学术最前沿,一般的人需要走很远很远,路上还要绕很多很多的弯路。但是,chatgpt就像一辆车,直接把你载到学术最前沿。你需要做的只是不断的问问题和分解问题罢了。
我就是一个研究表面氧空穴对于势能函数的影响和键长的相互作用,虽然设备测量需要颗粒越大结果越清晰,但是我为什么还要辛辛苦苦的去研究大颗粒的晶体怎么合成。这就是90%重复性的来源了,大家都绕不开这一步,都得过这个坑,毕竟不是每一个小组都有趁手的实验员的。
现在我不再需要整天去琢磨为什么测不出数据,是样品有问题还是仪器有问题或者是处理方式不对。我只需要按部就班的让GPT-4列出合成的时候所有需要注意的要点,并且根据它给出的方式去烧一炉子,之后就能得到我需要的样品了。因为至少在样品合成上,它比我们小组所有的老师和学生加一块都强。
至于剩下来的10%,的确是没什么了不起的,无非就是研究的人太少了罢了,等以后AI这趟车把越来越多原本被困在路上的人送到这个位置,毫无疑问的这个方向就没有所谓的创造性可言了,哪个领域都一样,创造性就是人少的代名词。像现在钱扎堆人扎堆全世界搞材料搞冶金的搞凝聚态物理的聪明脑袋全奔过来把原本搞电化学的统统卷爆了的能源材料,每一个你能想到的思路,至少都有四五篇或者更多的文献在等着你。就像三体里说的,你再快都有比你快的,你再慢也有比你慢的。
至于过了临界点之后AI自己一路往前猛开,把人类统统甩下来了,人类还是得捡AI开出来的路干活,只不过是大家统统不算老师了,都是学生,和围棋一样,都得跟着AI学习和干活。到那个时候,人类社会的剧烈变动根本不是现在所能理解和讨论的。
chatgpt之类的AI能从10到100我相信是有可能的,但是我还是没看到chatgpt从0到1的能力。
那人类历史就结束了。
尤其是有人发现用 Chat-GPT 参加高考,可以被新疆大学录取,那么我们的教育体系是不是要改革一下?侧重点是不是要转向培养学生的创造力和想象力?听数学的人说 Chat-GPT 已经达到大二的数学水平。继续下去很快会到研究生水平,很多人和工作可以被取代了。能够跨学科的集成知识这一点太厉害了,不知道能不能什么时候写个具体专业的程序?比如计算化学中的 DFT 程序。
感觉我们看到了两个不同侧面的美国,一方面基础设施陈旧老化,无力更新,在传统领域不停衰落腐朽;另一方面在新兴领域如AI,还有其它的学科前沿,不断创新,引领潮流。为什么会这样?很多原创性和里程碑式的工作都发生在美国,一而再,再而三,搞得不禁要问为什么是他们?为什么又是他们?为什么还是他们?为什么老是他们?他们不断创新的动力是什么?为什么不是创新的一定程度躺下来享受成果?
另外感觉美国这个国家好像是生产力驱动的,政客可以在哪里瞎搞,但是生产力发展了,把他们的愚蠢行为可以抵消。但是这种不停的创新有没有终止的时候?
国内的几个大模型其实也都还可以,复旦的MOSS,只有200亿左右的参数,大模型该有的各种涌现能力也都有了。百度的文言一心,GPT4比不了,和初代的chatGPT还是有的一比的。有了这些基础,如果也能快速演进,应该不至于被甩的太远。
能否快速演进,算力是一个关键 。由于芯片的限制,国内公司搭建算力平台的难度远远大于美国公司。没有足够的算力,模型就难以大规模应用,迭代不起来,这恐怕才是当下最头疼的问题。
现在很多测试证明这个ai有时候会胡说八道,比如给出压根不存在的文献之类的
尤其是new bing,是三档可调的,调整到最严谨的那个挡位,而且不要钱,你去下载一个edge canary后用英文提问就可以。
今年3月15号以后,我问的每一个问题都可以清晰的给出参考文献,附带链接,甚至可以绕过文献付费墙,我不知道bing是怎么做到的。反正哪怕是没有openaccess的杂志GPT一样可以检索和分析其中的内容。
所以我才担心,是不是欧美学术出版机构已经和OpenAI合流了,把几十年来的人类科研精华已经全部灌进去了,这要是真的,国家不调用一点战略能力,也弄来欧美的科研数据库灌进去的话,那么差距就不是一点半点的巨大了。
刘慈欣要封神了,三体三部曲在工业中国的地位,不会低于四大名著。
金庸?什么玩意也配碰瓷刘慈欣。
不管是nature还是science,本质都是商业出版社,自己的数据凭什么要给你微软做训练?显然是钱给到位了。github本来就是微软自家的更不用说。国外似乎这些巨头可以通力合作,国内就是你死我活。
国内的公众号里面的优质内容你用百度搜都搜不到,还给你做训练数据?国内的知网估计也不会做慈善把数据给百度的,各大巨头各自为战互相提防。
我们甚至需要成立一个专门的部门来协调,甚至还得强压着才能干活还不一定利落,肯定到时候还有一堆扯皮。
怎么这说好的行业壁垒,说好的巨大阻力,说好的内部激烈党争就在英美科技领域彷佛就根本不存在一样,协调起来得心应手,动作麻利交接极快,感觉比国内国资委指挥下属国企还顺畅.....
按照3.5和4.0版本的问答区分,要知道这些学术出版社积累的数据库也是极为庞大的,这短短几个月就调试到现在这个水平,我怀疑相关企业甚至一天都没有休息。
我最近经常在想的一个问题,如果他给出了一个错误的答案,但是普通人又看不出来,怎么办?
这里其实又分为几个问题:
1、假设数据源没问题,chatGPT提供的信息就一定会不曲解原意吗?
2、假设数据源被污染了,chatGPT会“把巧克力和屎搅到一起”吗?
3、如果存在上面两个问题,那用户如何去核实?