AI已经逼近“自我进化”的门槛进展速度比预想更快

日前Anthropic的一篇讲递归式自我改进（recursive self-improvement，简称RSI）的文章，以不太寻常的方式，告诉大家最近半年大模型领域出现了一个新的大变量——大模型已经开始“自己造自己”了，而且进展速度比之前预想的快。

证据包括：

1. 大模型独立可靠地完成需要较长时间任务的能力提升在加速。几年时间内，AI能完成的编程工作，从4分钟提升到十几个小时。也就是说，很多常规软件开发工作AI自己就能完成了。

2. 大模型本身产品代码很高比例已经是AI写的了。Anthropic公司80%以上的代码是AI写的，而且质量已经追上工程师。

3. 更可怕的是，在科研环节，大模型的表现也越来越好。包括自主提出实验想法、寻找训练中出现问题的原因等等，已经可以与人类科学家抗衡。

AI已经逼近“自我进化”的门槛进展速度比预想更快

开源AI智能体“龙虾”手机端页面 / 新华社发（伊凡摄）

虽然没有信息表明，目前最强模型Mythos有多大程度得益于AI自我改进，但现在硅谷有一种浓厚的悲观情绪，与这一进展是息息相关的。

一位投资界的朋友3月去硅谷考察，发现当地的AI精英们一方面在激烈竞争，不顾代价地投资、消耗AI算力，迭代速度已从“按月计算”变为“按周计算”；一方面内心又极为焦虑，刚博士毕业没几年的一线科学家，自嘲两三年内自己也可能被AI淘汰，不少人更严肃地讨论“买比特币、建地堡、给家里装防弹玻璃”，为不远的将来做准备：因为AI太强，大部分人在经济系统中不再有用，会出现一个由“永久底层”构成的二元社会，社会治安随之恶化……

这实际上带我们回到人工智能发展两个更现实的问题：社会影响；应用与商业化。

社会影响有很多维度。中美之间可能差异最大的，是民众对AI的态度。各种调查结果给出一致结论：中国民众对AI是总体乐观，最直观的体现，是机器人、视频生成等各种AI元素在合家欢春晚上越来越多；而美国则是“全民怀疑”，不仅普通老百姓不信任，感觉到威胁，大学生在毕业典礼上也纷纷向说AI好话的名人演讲者报以嘘声，连获益最大的硅谷精英，情绪也不是正面的。

直接带来的反作用，就是美国本土数据中心等基础建设落地困难。在政府大开绿灯、行业巨头投资爆炸性增长的情况下，美国计划于2027年竣工的数据中心产能中，超过60%至今尚未动工。重要的原因之一是民众不支持。盖洛普民调显示，约七成美国人反对在其居住地附近建设AI数据中心。

3月20日，工作人员（右二）在向参观者介绍一个家庭数据中心存储设备 / 新华社记者方喆摄

应用与商业化方面，有两个看起来相反的因素在起作用：一是模型能力过剩，很多能力已经超过日常所需，但大部分人还不太会用；二是模型的能力是锯齿状，有的方面非常强，有的方面又弱智得可笑（比如前一阵传播很广的“50米洗车问题”）。

与此同时，AI应用的成本还很高。Uber就说，今年的AI预算4个月就花完了。

因此，寻找高价值且大模型能落地的场景，成了整个行业最大的战略问题。Anthropic正是有点偶然地从用户反馈中，抓住了编程这一差异点，成就了目前的领先地位。下一个大机会呢？如果编程及衍生出来的智能体能力就能覆盖所有知识性工作场景，就意味着目前的格局将延续，直到影响蓝领工作的具身智能/人形机器人进入主流。

AI已经逼近“自我进化”的门槛 进展速度比预想更快

评论 (0)

AI已经逼近“自我进化”的门槛进展速度比预想更快