Nature：DeepMind发布重磅通用科学人工智能体

人工智能学家 · 公众号 · AI · 2025-05-16 18:32

正文

请到「今天看啥」查看全文

通用目标的AI

迄今为止，AI 在科学领域的大多数成功应用，包括蛋白质设计工具 AlphaFold，都采用了为特定任务专门手工打造的学习算法，Krenn 说道。但 AlphaEvolve 是通用型的，它利用大语言模型（LLM）生成代码的能力，在广泛的领域中解决问题。

DeepMind 将 AlphaEvolve 称为“智能体（agent）”，因为它涉及多个 AI 模型之间的交互。 但它所针对的科学流程环节，与许多其他“智能体式”AI 科学系统不同，后者多用于文献综述和假说生成。

AlphaEvolve 构建于 DeepMind 自家的 Gemini 系列 LLM 之上。每项任务都由用户输入问题、评估标准和初步解法，LLM 随后提出数百乃至数千种修改方案。然后，“评估器”算法根据优良解法的度量标准（例如，在分配 Google 计算任务时希望尽量减少资源浪费）对这些方案进行打分。 DeepMind 的 AI 科学家、该研究的联合负责人 Matej Balog 表示，LLM 会基于最优方案继续提出新思路，随着时间推移，系统就演化出一组更强大的算法。“我们探索了一系列多样化的问题解决可能方案。”他如此描述。

图 3. AlphaEvolve 发现流程。用户提供初始程序（并在其中标记待迭代的部分）、评估代码和可选配置。AlphaEvolve 随即启动进化循环。Prompt 采样器从程序数据库中抽取程序，构建丰富的提示。基于这些提示，LLM 生成代码修改，并应用于创建新程序。然后，评估器对这些新程序进行打分，并将表现优异的解法重新注册回程序数据库，从而推动程序的迭代优化，发现更佳的解决方案。

Balog 指出，AlphaEvolve 是在公司 2023 年推出的 FunSearch 系统基础上发展而来；后者曾用类似的进化方法在人类尚未解决的数学问题上超越人类。与 FunSearch 相比，AlphaEvolve 能处理更大规模的代码，并在更多复杂算法和广泛的科学领域中发挥作用。

DeepMind 表示， AlphaEvolve 还提出了一种矩阵乘法的计算方法，在某些情况下比 1969 年德国数学家 Volker Strassen 提出的最快算法更快 。矩阵乘法是将数字按网格相乘，广泛用于神经网络训练。尽管 AlphaEvolve 是通用性的，它在矩阵运算方面的表现仍优于 2022 年 DeepMind 专为矩阵运算设计的 AI 工具 AlphaTensor。 这一方法可用于解决各类优化问题，或任何在科学中存在“具体度量”或“仿真评估”以判断解法优劣的场景。 这还可能包括新型显微镜、望远镜甚至材料的设计.

图 4. 使用 AlphaEvolve 发现的打破最先进水平（SOTA）的数学构造示例。AlphaEvolve 的多功能性能够解决： 分析学 中的自相关与不确定性不等式问题； 几何学 中的填充与最小／最大距离问题； 组合数学 中的 Erdős 最小重叠问题以及有限集的和与差问题。

应用：待向广泛群体开放

牛津大学数学家兼 AI 研究员 Simon Frieder 表示，在数学领域，AlphaEvolve 似乎能显著加速某些问题的解决。但他认为，它大概只会应用到那些可以“通过代码来表述”的有限任务上。其他研究者则 对该工具的真正效用持保留态度，认为要等到它在 DeepMind 以外的环境中经受考验后才能下定论 。“在系统被更广泛的社区测试之前，我会保持怀疑，并对报道的结果持保留态度，”美国俄亥俄州立大学的 AI 研究员 Huan Sun 这样说。Frieder 也表示，他会等到研究者们重现出一个开源版本，而不依赖可能随时变动或下线的 DeepMind 专有系统。

DeepMind 科学主管 Pushmeet Kohli 说，尽管 AlphaEvolve 的运行算力需求低于 AlphaTensor，但它仍然过于耗费资源，不适合免费托管在 DeepMind 的服务器上。不过，DeepMind 希望通过发布这套系统，激励研究者们提出更多可将 AlphaEvolve 应用于各种科学领域的想法。“我们非常希望让科学界尽可能多的人都能使用到它，”Kohli 说道。

参考文献

1. Romera-Paredes, B. et al. Nature 625 , 468–475 (2024).

2. Strassen, V. Numer. Math. 13 , 354–356 (1969).

3. Fawzi, A. et al. Nature 610 , 47–53 (2022).

阅读最新前沿科技趋势报告，请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。 目前拥有超过8000 篇重要资料。 每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问 https://wx.zsxq.com/group/454854145828 进入。