专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
目录
相关文章推荐
新浪科技  ·  【#华为Pura80系列预约人数破10万#】 ... ·  16 小时前  
36氪  ·  顶流「苏超」:除了「恩怨」,还有生意 ·  17 小时前  
新浪科技  ·  【#小鹏华为预告战略合作# ... ·  2 天前  
51好读  ›  专栏  ›  DeepTech深科技

MIT研究发现AI科学家在复杂物理问题上自发达成理论共识

DeepTech深科技  · 公众号  · 科技媒体  · 2025-04-17 14:54

正文

请到「今天看啥」查看全文



接着,对每个系统,MASS 内部的一个独立子网络学习其特定的标量函数 S,这可以看作是假设形成的过程。随后,共享的最终层介入进行理论评估,它对学习到的各个标量函数 S 进行求导等一系列数学运算,并结合可学习的权重,推断出描述系统行为的统一控制方程。这一步骤强制要求 AI 用一套融贯的“理论框架”来解释所有观察到的系统。


最后是改进与泛化阶段,模型将其推断出的运动或状态变化与真实的观测数据进行比较,计算误差,并通过反向传播算法调整网络的所有参数(包括学习标量函数的子网络和学习理论规则的共享层)。这个过程不断迭代,目标是优化出一个单一的理论体系,使其能同时且准确地描述多个不同的物理系统。


通过训练多个具有不同随机初始化的 MASS 模型,研究人员得以模拟不同的 AI 科学家群体,并细致观察它们学习到的标量函数 S 以及最终推导出的理论有何异同。


从简谐振子到混沌双摆


研究团队使用 MASS 进行了大量受控实验。他们首先从经典力学中最基础的模型开始,如简谐振子(Simple harmonic oscillator)和单摆(Simple pendulum),然后逐步引入更复杂的系统,包括开普勒问题(Kepler problem,描述行星运动)、相对论性谐振子,甚至是一些研究人员设计的、没有标准物理解释的“合成”势能系统(Synthetic potentials)。


为了模拟多个独立科学家的情景,研究人员使用不同的随机“种子”(seeds)来初始化多个 MASS 模型实例,然后让它们学习相同的数据集。他们仔细追踪了模型的训练过程、最终学习到的理论(通过分析最终层输出的数学表达式和内部激活 activations)以及这些理论之间的相似性。


在 AI 学习的初级阶段,当它只面对一个非常简单的系统时,比如简谐振子,它确实能够非常准确地预测系统的行为。然而,当研究人员深入剖析其内部形成的“理论”时,发现情况并不简单。AI 有时会学到一种包含大量数学项的复杂表达,其复杂程度远超标准物理理论描述该系统所需。


更有意思的是,不同的 AI,仅仅因为初始随机种子的不同,就可能学到形式上略有差异的标量函数 S,尽管这些不同的函数都能最终导出正确的预测结果。在这个阶段,一些 AI 学习到的理论在形式上更接近物理学中的哈密顿描述(这是一种侧重于能量守恒的视角,通常表达为系统动能与势能之和)。


图丨(a)最终层的权重(蓝色)和平均激活范数(红色);(b)显著激活的相关性 (来源: arXiv


研究中最关键发现来自于逐步增加学习任务复杂性的过程。当研究人员要求 AI 不再只解释单一系统,而是要同时理解并解释简谐振子、单摆、开普勒问题等多个不同物理系统时,情况发生了很大变化。那些原先仅在简单系统上有效、可能包含冗余信息或甚至是“错误”假设的理论开始暴露出局限性,它们无法同时满足来自多个系统的新数据约束。


这个过程非常像自然选择:只有那些更具普适性、更能抓住物理本质的理论,才能在更广泛、更多样的物理现象面前“存活”下来并得到强化。一个有力的证据是,随着 AI 需要学习的物理系统数量的增加,其理论中“显著项”(即对最终预测结果贡献最大的那些数学项)的数量呈现出显著减少的趋势。 这清晰地表明,AI 在面对更丰富、更复杂的数据挑战时,倾向于主动寻找更简洁、更核心、更具统一性的解释。


图丨由单个 AI 科学家学习的成对相关性,该科学家在逐步处理越来越复杂的系统时训练 (来源: arXiv


随着系统复杂度的进一步提升,特别是当引入那些在广义坐标(Generalized Coordinates)下描述更为复杂的系统时,AI 学习到的理论展现出一种明确的转变趋势。它们明显地从早期类似哈密顿量的形式,逐渐转向了更接近拉格朗日量(Lagrangian)的形式。拉格朗日量在物理学中通常表达为系统动能与势能之差。







请到「今天看啥」查看全文