专栏名称: 人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
目录
相关文章推荐
51好读  ›  专栏  ›  人工智能学家

DeepMind CTO最新对话实录:大模型性能新突破,并行假设可让模型更深入思考

人工智能学家  · 公众号  · AI  · 2025-05-27 17:07

正文

请到「今天看啥」查看全文



我认为重要的是要确保在各个层面都有广泛的研究正在进行。而且,与其只从单一维度思考 Scaling,实际上有很多不同的思考角度,并且应该在这些角度上进行投入。我们可以看到回报,我认为在整个领域都是如此,不仅仅是在 Google,而是在整个领域,许多不同的模型都在以相当显著的幅度进步。所以我认为,作为一个领域,我们取得的进展是相当辉煌的。这非常令人兴奋。


在 Google,我们对于 Gemini 模型所取得的进展感到非常兴奋。从 1.5 版本到 2.0 再到 2.5 版本,我认为我们在模型能力方面取得了非常稳健的进展和提升,无论是在我们所拥有的能力广度上,还是在每项能力的质量水平上。


因此,令我感到兴奋的是,我们一直在不断拓展前沿,并且在许多研究方向和不同维度的研究中都看到了回报。我很高兴的是,我认为我们还有更多的进展空间,而且为了实现 AGI,也还需要取得更多的进展。


关于模型迭代速度,当我审视我们的模型系列,从 Gemini 1 到 1.5,再到 2,如今到 2.5,我对我们目前的发展速度感到非常兴奋。我们持续增加新的功能。例如,我们从一开始就将 Gemini 模型设计为多模态的。这是我们的目标,因为我们致力于构建 AGI,希望确保我们的模型能够具备我们对通用智能所期望的那些能力。


因此,多模态从一开始就是关键。随着版本的迭代,我们一直在不断增强这种自然的多模态特性。观察我们在推理能力方面的进步速度,例如我们最近增加了思考能力,我认为通过 2.5 Pro,我们期望在推理能力和编码能力方面实现巨大飞跃。


我认为关键之一在于,我们将所有这些能力都整合到单一的模型系列中,这本身就是实现快速改进的催化剂之一。这样做更具挑战性,但我们发现,创建一个能够理解世界的单一模型,然后你可以问它:“你能帮我编写一个模拟树木生长的代码吗?”然后它就能做到。这需要对很多事物有深入的理解,而不仅仅是编码知识。因为我们正努力使这些模型变得实用,能被更广泛的用户群体所使用。

而且,我认为我们目前的发展步伐真实地反映了我们在研发方面所做的全面投入。我对我们伴随 Gemini 发展所做的一切感到非常兴奋,相关的研究也愈发激动人心。当然,对于我们这些从事研究的人员来说,这确实是非常好的局面。


03

DeepThink作为一种新的推理模式是实现AGI的重要探索


主持人提问: 您在开场时提到目标是AGI,并强调在实现AGI前还有许多工作要做。Yann LeCun曾表示AI行业不可能仅通过扩大大型语言模型规模来达到人类水平智能,您是否同意此观点?另外,Google I/O大会宣布了DeepThink,它依赖于推理或所谓的“测试时计算”,这种在模型中加入推理的方法对推动模型发展有多大效果?能否详细介绍DeepThink及其与传统推理模型的不同之处?


Koray Kavukcuoglu 实录: 我认为那是一个假设,它可能被证实,也可能不会。而且,我也不认为有任何研究实验室仅仅在尝试扩大大语言模型的规模。所以,我不确定是否真的有人在试图反驳那个假设。


我们并非如此。从我的角度来看,我们正在对极为广泛的研究领域进行投入,我认为这才是必要的。而且很明显,我交谈过的许多研究人员以及我自己都认为,还有更多关键的要素有待发明。所以,在我们通往 AGI 的道路上,有一些我们必须攻克的关键创新。这就是为什么我们仍然将此视为一个极具挑战性的研究课题。


而且我认为保持这种批判性思维至关重要。对于任何研究问题,你总是会尝试审视多种不同的假设,探索多种不同的解决方案。这样一个雄心勃勃的研究问题,可能是我们一生中正在从事的最重要的问题。它可能是我们工作中面临的最困难的研究问题。我认为,拥有这样一个真正雄心勃勃的研究议程和投资组合,并在许多不同方向上进行投入,这才是最重要的。从我的角度来看,重要的是明确目标所在。我们的目标是 AGI,而不是以某种特定方式构建 AGI。重要的是以正确的方式构建 AGI,一种能够产生积极影响、能够在其基础上为世界带来巨大利益的方式。这才是我们研究 AGI、试图构建 AGI 的原因。AGI 本身,有时可能给人的印象是它自身即是目标。但目标本身在于这样一个事实:如果我们实现了 AGI,那么我们就能极大地造福整个社会乃至全世界。这才是真正的目标。


所以,带着这份责任,你所投入的并不仅仅是某个特定的方面,那个特定的假设是否成立对我而言并非至关重要。重要的是,我们要通过开展一项极具雄心的研究,遵循一个极具雄心的研究议程,并建立起对智能这一领域极为深刻的理解,从而最终达成目标。


关于DeepThink,首先, DeepThink 本身不一定是一款独立的产品。它更像是一种我们为 2.5 Pro 模型启用的模式,使其能够在推理时间投入更多时间进行思考和构建假设。关键在于,它能够构建并行的假设,而非单一的思路链;它可以建立多个并行的思路链,并基于这些思路链进行推理,形成一个假设,再基于这些假设建立理解,然后继续构建这些并行的思路链。 在目前的设置中,它确实需要更长的时间。因为理解并构建那些并行的思考本身就是一个更为漫长的过程。但我们同样将其定位为尚处于研究阶段。我们正在分享一些初步的研究成果,并对此感到兴奋。我们为这项技术及其潜力感到兴奋,它实际上能够在新的能力和性能水平上实现突破。但这仍处于早期,因此我们目前仅小范围分享。我们将开始与安全研究人员和一些受信任的测试人员分享,因为我们希望了解人们想用它解决哪些问题,它带来了哪些新能力,以及我们应如何以期望的方式去训练它。所以,这方面确实还处于早期,但我认为这是我们在推理时间思考模型领域发现的一个令人振奋的研究方向。


至于与传统推理模型的不同,目前的推理思考模型,至少从我们的研究角度来看,大多数时候是构建一个单一的思路链。当模型构建单一思路链并持续关注该思路链时,它能更好地理解希望给出的回应,可以在不同假设间切换,并反思之前的行为。


现在,如果从视觉化的角度思考,可以引入的一种扩展性是:能否拥有多个并行的思路链?这样就可以并行分析不同的假设,从而有更大容量去探索不同类型的假设。然后可以观察、比较这些假设,排除一些,或者继续深究并扩展特定的假设。这在某种程度上是一个非常直观的过程,但无疑也更为复杂。







请到「今天看啥」查看全文