外来客网

AI已经逼近“自我进化”的门槛 进展速度比预想更快

日前Anthropic的一篇讲递归式自我改进(recursive self-improvement,简称RSI)的文章,以不太寻常的方式,告诉大家最近半年大模型领域出现了一个新的大变量——大模型已经开始“自己造自己”了,而且进展速度比之前预想的快。

证据包括:

1. 大模型独立可靠地完成需要较长时间任务的能力提升在加速。几年时间内,AI能完成的编程工作,从4分钟提升到十几个小时。也就是说,很多常规软件开发工作AI自己就能完成了。

2. 大模型本身产品代码很高比例已经是AI写的了。Anthropic公司80%以上的代码是AI写的,而且质量已经追上工程师。

3. 更可怕的是,在科研环节,大模型的表现也越来越好。包括自主提出实验想法、寻找训练中出现问题的原因等等,已经可以与人类科学家抗衡。

AI已经逼近“自我进化”的门槛 进展速度比预想更快

开源AI智能体“龙虾”手机端页面 / 新华社发(伊凡摄)

虽然没有信息表明,目前最强模型Mythos有多大程度得益于AI自我改进,但现在硅谷有一种浓厚的悲观情绪,与这一进展是息息相关的。

一位投资界的朋友3月去硅谷考察,发现当地的AI精英们一方面在激烈竞争,不顾代价地投资、消耗AI算力,迭代速度已从“按月计算”变为“按周计算”;一方面内心又极为焦虑,刚博士毕业没几年的一线科学家,自嘲两三年内自己也可能被AI淘汰,不少人更严肃地讨论“买比特币、建地堡、给家里装防弹玻璃”,为不远的将来做准备:因为AI太强,大部分人在经济系统中不再有用,会出现一个由“永久底层”构成的二元社会,社会治安随之恶化……

这实际上带我们回到人工智能发展两个更现实的问题:社会影响;应用与商业化。

社会影响有很多维度。中美之间可能差异最大的,是民众对AI的态度。各种调查结果给出一致结论:中国民众对AI是总体乐观,最直观的体现,是机器人、视频生成等各种AI元素在合家欢春晚上越来越多;而美国则是“全民怀疑”,不仅普通老百姓不信任,感觉到威胁,大学生在毕业典礼上也纷纷向说AI好话的名人演讲者报以嘘声,连获益最大的硅谷精英,情绪也不是正面的。

直接带来的反作用,就是美国本土数据中心等基础建设落地困难。在政府大开绿灯、行业巨头投资爆炸性增长的情况下,美国计划于2027年竣工的数据中心产能中,超过60%至今尚未动工。重要的原因之一是民众不支持。盖洛普民调显示,约七成美国人反对在其居住地附近建设AI数据中心。



3月20日,工作人员(右二)在向参观者介绍一个家庭数据中心存储设备 / 新华社记者 方喆 摄

应用与商业化方面,有两个看起来相反的因素在起作用:一是模型能力过剩,很多能力已经超过日常所需,但大部分人还不太会用;二是模型的能力是锯齿状,有的方面非常强,有的方面又弱智得可笑(比如前一阵传播很广的“50米洗车问题”)。

与此同时,AI应用的成本还很高。Uber就说,今年的AI预算4个月就花完了。

因此,寻找高价值且大模型能落地的场景,成了整个行业最大的战略问题。Anthropic正是有点偶然地从用户反馈中,抓住了编程这一差异点,成就了目前的领先地位。下一个大机会呢?如果编程及衍生出来的智能体能力就能覆盖所有知识性工作场景,就意味着目前的格局将延续,直到影响蓝领工作的具身智能/人形机器人进入主流。

评论 (0)