专栏名称: 人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
目录
相关文章推荐
爱可可-爱生活  ·  【[137星]adb-mcp:为Adobe工 ... ·  15 小时前  
爱可可-爱生活  ·  //@爱可可-爱生活:欢迎参与~-20250 ... ·  昨天  
爱可可-爱生活  ·  #听见微博# #微博声浪计划# ... ·  昨天  
新机器视觉  ·  移动机器人室内定位技术综述 ·  昨天  
51好读  ›  专栏  ›  人工智能学家

Nature:DeepMind发布重磅通用科学人工智能体

人工智能学家  · 公众号  · AI  · 2025-05-16 18:32

正文

请到「今天看啥」查看全文



通用目标的AI




迄今为止,AI 在科学领域的大多数成功应用,包括蛋白质设计工具 AlphaFold,都采用了为特定任务专门手工打造的学习算法,Krenn 说道。但 AlphaEvolve 是通用型的,它利用大语言模型 (LLM) 生成代码的能力,在广泛的领域中解决问题。


DeepMind 将 AlphaEvolve 称为“智能体(agent)”,因为它涉及多个 AI 模型之间的交互。 但它所针对的科学流程环节,与许多其他“智能体式”AI 科学系统不同,后者多用于文献综述和假说生成。


AlphaEvolve 构建于 DeepMind 自家的 Gemini 系列 LLM 之上。 每项任务都由用户输入问题、评估标准和初步解法,LLM 随后提出数百乃至数千种修改方案。然后,“评估器”算法根据优良解法的度量标准(例如,在分配 Google 计算任务时希望尽量减少资源浪费)对这些方案进行打分。 DeepMind 的 AI 科学家、该研究的联合负责人 Matej Balog 表示,LLM 会基于最优方案继续提出新思路,随着时间推移,系统就演化出一组更强大的算法。“我们探索了一系列多样化的问题解决可能方案。”他如此描述。


图片

图 3. AlphaEvolve 发现流程。用户提供初始程序(并在其中标记待迭代的部分)、评估代码和可选配置。AlphaEvolve 随即启动进化循环。Prompt 采样器从程序数据库中抽取程序,构建丰富的提示。基于这些提示,LLM 生成代码修改,并应用于创建新程序。然后,评估器对这些新程序进行打分,并将表现优异的解法重新注册回程序数据库,从而推动程序的迭代优化,发现更佳的解决方案。


Balog 指出,AlphaEvolve 是在公司 2023 年推出的 FunSearch 系统基础上发展而来;后者曾用类似的进化方法在人类尚未解决的数学问题上超越人类。与 FunSearch 相比,AlphaEvolve 能处理更大规模的代码,并在更多复杂算法和广泛的科学领域中发挥作用。


DeepMind 表示, AlphaEvolve 还提出了一种矩阵乘法的计算方法,在某些情况下比 1969 年德国数学家 Volker Strassen 提出的最快算法更快 。矩阵乘法是将数字按网格相乘,广泛用于神经网络训练。尽管 AlphaEvolve 是通用性的,它在矩阵运算方面的表现仍优于 2022 年 DeepMind 专为矩阵运算设计的 AI 工具 AlphaTensor。 这一方法可用于解决各类优化问题,或任何在科学中存在“具体度量”或“仿真评估”以判断解法优劣的场景。 这还可能包括新型显微镜、望远镜甚至材料的设计.


图片

图 4. 使用 AlphaEvolve 发现的打破最先进水平(SOTA)的数学构造示例。AlphaEvolve 的多功能性能够解决: 分析学 中的自相关与不确定性不等式问题; 几何学 中的填充与最小/最大距离问题; 组合数学 中的 Erdős 最小重叠问题以及有限集的和与差问题。





应用:待向广泛群体开放




牛津大学数学家兼 AI 研究员 Simon Frieder 表示,在数学领域,AlphaEvolve 似乎能显著加速某些问题的解决。但他认为,它大概只会应用到那些可以“通过代码来表述”的有限任务上。其他研究者则 对该工具的真正效用持保留态度,认为要等到它在 DeepMind 以外的环境中经受考验后才能下定论 。“在系统被更广泛的社区测试之前,我会保持怀疑,并对报道的结果持保留态度,”美国俄亥俄州立大学的 AI 研究员 Huan Sun 这样说。Frieder 也表示,他会等到研究者们重现出一个开源版本,而不依赖可能随时变动或下线的 DeepMind 专有系统。


DeepMind 科学主管 Pushmeet Kohli 说,尽管 AlphaEvolve 的运行算力需求低于 AlphaTensor,但它仍然过于耗费资源,不适合免费托管在 DeepMind 的服务器上。不过,DeepMind 希望通过发布这套系统,激励研究者们提出更多可将 AlphaEvolve 应用于各种科学领域的想法。“我们非常希望让科学界尽可能多的人都能使用到它,”Kohli 说道。


参考文献

1. Romera-Paredes, B. et al. Nature 625 , 468–475 (2024).

2. Strassen, V. Numer. Math. 13 , 354–356 (1969).

3. Fawzi, A. et al. Nature 610 , 47–53 (2022).

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828


未来知识库 是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。 目前拥有超过8000 篇重要资料。 每周更新不少于100篇世界范围最新研究 资料 欢迎扫描二维码或访问 https://wx.zsxq.com/group/454854145828 进入。







请到「今天看啥」查看全文