正文
迄今为止,AI 在科学领域的大多数成功应用,包括蛋白质设计工具 AlphaFold,都采用了为特定任务专门手工打造的学习算法,Krenn 说道。但 AlphaEvolve 是通用型的,它利用大语言模型
(LLM)
生成代码的能力,在广泛的领域中解决问题。
DeepMind 将 AlphaEvolve 称为“智能体(agent)”,因为它涉及多个 AI 模型之间的交互。
但它所针对的科学流程环节,与许多其他“智能体式”AI 科学系统不同,后者多用于文献综述和假说生成。
AlphaEvolve 构建于 DeepMind 自家的 Gemini 系列 LLM 之上。
每项任务都由用户输入问题、评估标准和初步解法,LLM 随后提出数百乃至数千种修改方案。然后,“评估器”算法根据优良解法的度量标准(例如,在分配 Google 计算任务时希望尽量减少资源浪费)对这些方案进行打分。
DeepMind 的 AI 科学家、该研究的联合负责人 Matej Balog 表示,LLM 会基于最优方案继续提出新思路,随着时间推移,系统就演化出一组更强大的算法。“我们探索了一系列多样化的问题解决可能方案。”他如此描述。
图 3. AlphaEvolve 发现流程。用户提供初始程序(并在其中标记待迭代的部分)、评估代码和可选配置。AlphaEvolve 随即启动进化循环。Prompt 采样器从程序数据库中抽取程序,构建丰富的提示。基于这些提示,LLM 生成代码修改,并应用于创建新程序。然后,评估器对这些新程序进行打分,并将表现优异的解法重新注册回程序数据库,从而推动程序的迭代优化,发现更佳的解决方案。
Balog 指出,AlphaEvolve 是在公司 2023 年推出的 FunSearch 系统基础上发展而来;后者曾用类似的进化方法在人类尚未解决的数学问题上超越人类。与 FunSearch 相比,AlphaEvolve 能处理更大规模的代码,并在更多复杂算法和广泛的科学领域中发挥作用。
DeepMind 表示,
AlphaEvolve 还提出了一种矩阵乘法的计算方法,在某些情况下比 1969 年德国数学家 Volker Strassen 提出的最快算法更快
。矩阵乘法是将数字按网格相乘,广泛用于神经网络训练。尽管 AlphaEvolve 是通用性的,它在矩阵运算方面的表现仍优于 2022 年 DeepMind 专为矩阵运算设计的 AI 工具 AlphaTensor。
这一方法可用于解决各类优化问题,或任何在科学中存在“具体度量”或“仿真评估”以判断解法优劣的场景。
这还可能包括新型显微镜、望远镜甚至材料的设计.
图 4. 使用 AlphaEvolve 发现的打破最先进水平(SOTA)的数学构造示例。AlphaEvolve 的多功能性能够解决:
分析学
中的自相关与不确定性不等式问题;
几何学
中的填充与最小/最大距离问题;
组合数学
中的 Erdős 最小重叠问题以及有限集的和与差问题。
牛津大学数学家兼 AI 研究员 Simon Frieder 表示,在数学领域,AlphaEvolve 似乎能显著加速某些问题的解决。但他认为,它大概只会应用到那些可以“通过代码来表述”的有限任务上。其他研究者则
对该工具的真正效用持保留态度,认为要等到它在 DeepMind 以外的环境中经受考验后才能下定论
。“在系统被更广泛的社区测试之前,我会保持怀疑,并对报道的结果持保留态度,”美国俄亥俄州立大学的 AI 研究员 Huan Sun 这样说。Frieder 也表示,他会等到研究者们重现出一个开源版本,而不依赖可能随时变动或下线的 DeepMind 专有系统。
DeepMind 科学主管 Pushmeet Kohli 说,尽管 AlphaEvolve 的运行算力需求低于 AlphaTensor,但它仍然过于耗费资源,不适合免费托管在 DeepMind 的服务器上。不过,DeepMind 希望通过发布这套系统,激励研究者们提出更多可将 AlphaEvolve 应用于各种科学领域的想法。“我们非常希望让科学界尽可能多的人都能使用到它,”Kohli 说道。
参考文献
1. Romera-Paredes, B.
et al.
Nature
625
, 468–475 (2024).
2. Strassen, V.
Numer. Math.
13
, 354–356 (1969).
3. Fawzi, A.
et al.
Nature
610
, 47–53 (2022).
阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”
https://wx.zsxq.com/group/454854145828
未来知识库
是“
欧米伽
未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。
目前拥有超过8000
篇重要资料。
每周更新不少于100篇世界范围最新研究
资料
。
欢迎扫描二维码或访问
https://wx.zsxq.com/group/454854145828
进入。