专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
目录
相关文章推荐
黄建同学  ·  Codex 这个功能不错啊!Codex ... ·  昨天  
爱可可-爱生活  ·  [LG]《Reinforcement ... ·  2 天前  
爱可可-爱生活  ·  [LG]《Intention-Conditi ... ·  2 天前  
宝玉xp  ·  牛逼-20250614102659 ·  3 天前  
51好读  ›  专栏  ›  机器之心

LLM已能自我更新权重,自适应、知识整合能力大幅提升,AI醒了?

机器之心  · 公众号  · AI  · 2025-06-14 12:12

主要观点总结

文章介绍了关于AI自我演进的最新研究和趋势,重点关注了SEAL框架的实现细节、应用案例和实验结果。其中涉及到的自适应语言模型可以自我提升能力引起了广泛讨论。

关键观点总结

关键观点1: AI自我进化的话题和研究现状

近期关于AI自我演进的研究变得密集,包括SEAL框架在内的多项技术旨在实现AI的自我改进能力。

关键观点2: SEAL框架介绍

SEAL框架是一种自适应语言模型,允许语言模型通过生成自己的合成数据并优化参数来实现自我提升。该框架结合了强化学习和监督微调,使用奖励机制来优化自编辑的生成过程。

关键观点3: SEAL框架的实验结果

在知识整合和少样本学习两个领域实例中,SEAL框架的实验结果展示了其有效性。然而,仍存在性能提升空间,需要进一步改进和优化。

关键观点4: 关于AI自我进化未来的讨论

文章引发了对AI自我进化实现时间的讨论,并指出SEAL框架存在一些局限性和需要解决的问题。


正文

请到「今天看啥」查看全文



https://x.com/VraserX/status/1932842095359737921


但不管怎样,AI 也确实正向实现自我进化这条路前进。


MIT 昨日发布的《Self-Adapting Language Models》就是最新的例证之一,其中提出了一种可让 LLM 更新自己的权重的方法: SEAL🦭 ,即 Self-Adapting LLMs。在该框架中,LLM 可以生成自己的训练数据(自编辑 /self-editing),并根据新输入对权重进行更新。而这个自编辑可通过强化学习学习实现,使用的奖励是更新后的模型的下游性能。



  • 论文标题:Self-Adapting Language Models

  • 论文地址:https://arxiv.org/pdf/2506.10943

  • 项目页面:https://jyopari.github.io/posts/seal

  • 代码地址:https://github.com/Continual-Intelligence/SEAL


这篇论文发布后引发了广泛热议。在 Hacker News 上,有用户评论说,这种自编辑方法非常巧妙,但还不能说就已经实现了能「持续自我改进的智能体」。



论文一作 Adam Zweiger 也在 𝕏 上给出了类似的解释:



也有人表示,这表明我们正在接近所谓的 事件视界(event horizon) —— 这个概念其实也出现在了山姆・奥特曼《温和的奇点》博客的第一句话,不过奥特曼更激进一点,他的说法是「我们已经越过了事件视界」。简单来说,event horizon(事件视界)指的是一个不可逆转的临界点,一旦越过,人类将不可避免地迈入某种深刻变革的阶段,比如通向超级智能的道路。



当然,也有人对自我提升式 AI 充满了警惕和担忧。



下面就来看看这篇热门研究论文究竟得到了什么成果。


自适应语言模型(SEAL)


SEAL 框架可以让语言模型在遇到新数据时,通过生成自己的合成数据并优化参数(







请到「今天看啥」查看全文