LLM已能自我更新权重，自适应、知识整合能力大幅提升，AI醒了？

机器之心 · 公众号 · AI · 2025-06-14 12:12

主要观点总结

文章介绍了关于AI自我演进的最新研究和趋势，重点关注了SEAL框架的实现细节、应用案例和实验结果。其中涉及到的自适应语言模型可以自我提升能力引起了广泛讨论。

关键观点总结

关键观点1: AI自我进化的话题和研究现状

近期关于AI自我演进的研究变得密集，包括SEAL框架在内的多项技术旨在实现AI的自我改进能力。

关键观点2: SEAL框架介绍

SEAL框架是一种自适应语言模型，允许语言模型通过生成自己的合成数据并优化参数来实现自我提升。该框架结合了强化学习和监督微调，使用奖励机制来优化自编辑的生成过程。

关键观点3: SEAL框架的实验结果

在知识整合和少样本学习两个领域实例中，SEAL框架的实验结果展示了其有效性。然而，仍存在性能提升空间，需要进一步改进和优化。

关键观点4: 关于AI自我进化未来的讨论

文章引发了对AI自我进化实现时间的讨论，并指出SEAL框架存在一些局限性和需要解决的问题。

正文

请到「今天看啥」查看全文

https://x.com/VraserX/status/1932842095359737921

但不管怎样，AI 也确实正向实现自我进化这条路前进。

MIT 昨日发布的《Self-Adapting Language Models》就是最新的例证之一，其中提出了一种可让 LLM 更新自己的权重的方法： SEAL🦭 ，即 Self-Adapting LLMs。在该框架中，LLM 可以生成自己的训练数据（自编辑 /self-editing），并根据新输入对权重进行更新。而这个自编辑可通过强化学习学习实现，使用的奖励是更新后的模型的下游性能。

论文标题：Self-Adapting Language Models
论文地址：https://arxiv.org/pdf/2506.10943
项目页面：https://jyopari.github.io/posts/seal
代码地址：https://github.com/Continual-Intelligence/SEAL

这篇论文发布后引发了广泛热议。在 Hacker News 上，有用户评论说，这种自编辑方法非常巧妙，但还不能说就已经实现了能「持续自我改进的智能体」。

论文一作 Adam Zweiger 也在 𝕏 上给出了类似的解释：

也有人表示，这表明我们正在接近所谓的事件视界（event horizon） —— 这个概念其实也出现在了山姆・奥特曼《温和的奇点》博客的第一句话，不过奥特曼更激进一点，他的说法是「我们已经越过了事件视界」。简单来说，event horizon（事件视界）指的是一个不可逆转的临界点，一旦越过，人类将不可避免地迈入某种深刻变革的阶段，比如通向超级智能的道路。

当然，也有人对自我提升式 AI 充满了警惕和担忧。

下面就来看看这篇热门研究论文究竟得到了什么成果。

自适应语言模型（SEAL）

SEAL 框架可以让语言模型在遇到新数据时，通过生成自己的合成数据并优化参数（