专栏名称: 图灵人工智能
人工智能及其他科技学术前沿、机器学习、图像识别、语音识别、自动驾驶、自然语言处理、脑机接口、云计算、大数据、物联网、机器人、天文物理、生物科学、数学、区块链、比特币、计算机等学术前沿知识、报告、讲座等介绍。
目录
相关文章推荐
爱否科技  ·  真我GT7 阿斯顿马丁 F1 ... ·  21 小时前  
爱否科技  ·  红魔电竞平板 3 PRO 发布:小尺寸,大性能 ·  昨天  
科技美学  ·  骁龙8Elite2性能大升级,骁龙8Elit ... ·  11 小时前  
科技美学  ·  骁龙8Elite2性能大升级,骁龙8Elit ... ·  11 小时前  
福昕会员  ·  129元享终身!PDF/Word/图片/PP ... ·  昨天  
福昕会员  ·  129元享终身!PDF/Word/图片/PP ... ·  昨天  
51好读  ›  专栏  ›  图灵人工智能

DeepMind 最新研究:智能体就是世界模型!

图灵人工智能  · 公众号  ·  · 2025-06-06 00:00

正文

请到「今天看啥」查看全文


图片
图片

具体来说,他们证明了可以从任何满足一定性能要求的目标条件策略中恢复出环境转移函数的有界误差近似。这个性能要求是:智能体在足够广泛的简单目标集合上满足一个遗憾界限(regret bound),比如将环境引导到期望状态。

图片

深远影响:从涌现能力到AI安全

图片

安全性保证。

几种AI安全方法需要准确的世界模型,但智能体能力可能超过我们构建模型的能力。这项工作给出了理论保证:我们可以从智能体中提取世界模型,且模型保真度随智能体能力的提升而增加。

涌现能力的解释。

为了在许多目标上最小化训练损失,智能体必须学习世界模型,这个模型可以解决智能体未明确训练过的任务。简单的目标导向性催生了许多能力(社会认知、不确定性推理、意图理解等)。

图片

因果层级的新视角

这项研究还揭示了一个有趣的因果层级结构。

在之前的工作中,团队展示了因果世界模型对于鲁棒性是必需的。但对于任务泛化,你不需要那么多环境的因果知识。 这是一个关于智能体和智能体能力的因果层级,而不是推理的因果层级!

图片






请到「今天看啥」查看全文