专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
目录
相关文章推荐
新浪科技  ·  【#曝iOS26适配iPhone11及更新机 ... ·  昨天  
新浪科技  ·  【#labubu带动系列收入超30亿#】企查 ... ·  昨天  
51好读  ›  专栏  ›  DeepTech深科技

DeepMind推出能改进芯片设计、解决数学难题的Agent,还可帮助Gemini训练

DeepTech深科技  · 公众号  · 科技媒体  · 2025-05-15 16:56

主要观点总结

谷歌DeepMind使用大型语言模型(LLM)扩展了功能,推出新工具AlphaEvolve,它能够解决数学和现代计算领域中的基础且高度复杂的问题。AlphaEvolve结合了大型语言模型的代码生成能力与进化算法的迭代优化思想,构成了一个能够自主发现并改进复杂算法的AI智能体。它在许多测试中超越了人类专家编写的最佳解决方案,并应用于谷歌的数据中心、芯片设计和AI训练流程中,提升了效率。AlphaEvolve的进化方法使其能够主动探索广阔的解决方案空间,发现新颖方法,并通过自动化的评估过程不断优化这些方法。该团队在一系列问题上测试了AlphaEvolve,包括矩阵乘法等,并发现了优于现有解决方案的新算法。此外,AlphaEvolve还帮助谷歌改进了其硬件设计和AI模型训练,显著缩短了内核优化的工程时间。

关键观点总结

关键观点1: AlphaEvolve融合了大型语言模型的强大代码生成能力与进化算法的迭代优化思想。

构成一个能够自主发现并改进复杂算法的AI智能体。

关键观点2: AlphaEvolve在许多测试中超越了人类专家编写的最佳解决方案。

在谷歌的数据中心、芯片设计和AI训练流程中提升了效率。

关键观点3: AlphaEvolve通过进化方法主动探索解决方案空间,发现新颖方法,并通过自动化评估过程不断优化。

在一系列问题上进行了测试,包括矩阵乘法等,发现了优于现有解决方案的新算法。

关键观点4: AlphaEvolve帮助谷歌改进了其硬件设计和AI模型训练。

显著缩短了内核优化的工程时间,为未来节省算力和能耗铺平道路。


正文

请到「今天看啥」查看全文



而 2023 年底亮相的 FunSearch 实现了范式革新——它用具备代码生成能力的大语言模型替代了游戏 AI。由于大语言模型具有多任务处理能力,相比仅专精单一游戏类型的早期系统,FunSearch 能攻克更多样化的问题。该工具甚至成功破解了纯数学领域一个长期悬而未决的著名难题。


AlphaEvolve 是 FunSearch 的升级版本。与 FunSearch 只能生成解决特定问题的简短代码片段不同,它能编写长达数百行的完整程序。这一突破使其能够应对更广泛的问题类型。


从理论上说,任何能用代码描述且解决方案可通过计算机评估的问题,AlphaEvolve 都能处理。"算法驱动着我们周围的世界,因此这项技术的影响将无比深远,"谷歌 DeepMind 算法探索团队负责人 Matej Balog 说道。


(来源:DeepMind)


AlphaEvolve 的具体工作流程可以概括为一个进化式搜索循环。其核心组件协同工作:首先,一个程序数据库 (Program Database) 负责存储当前已发现的、有潜力的程序(算法)及其评估分数,并在进化过程中不断更新。

接着,提示采样器 (Prompt Sampler) 从程序数据库中选择一个或多个“父程序”以及一些“灵感”代码片段,构建一个具有引导性的提示。

随后,系统的 LLM 核心,主要利用快速高效的 Gemini Flash 模型接收此提示,并生成对父程序的修改建议(通常以 diff 的形式体现),这些修改旨在探索新的算法变体。当需要更深入、更具洞察力的分析或遇到瓶颈时,系统可以灵活调用能力更强但速度稍慢的 Gemini Pro 模型。生成的 diff 会被应用到父程序上,从而创造出新的“子程序”。






请到「今天看啥」查看全文