刚刚，谷歌AI路线图曝光：竟要抛弃注意力机制？Transformer有致命缺陷！

机器学习研究组订阅 · 公众号 · AI · 2025-06-16 19:04

主要观点总结

谷歌未来的AI路线图曝光，产品负责人Logan Kilpatrick在AI工程师世界博览会的演讲中介绍了Gemini模型的未来。全模态、扩散模型、默认具备Agent能力、推理能力持续扩展等是重点。谷歌在AI领域表现出色，被认为是春风得意。此外，文章还涉及其他硅谷大厂的AI进展。

包括全模态、扩散模型的实验、默认具备Agent能力、推理能力持续扩展等。

通过产品负责人Logan Kilpatrick的演讲内容和全球用户的反馈，显示出谷歌在AI领域的优势，被认为是春风得意。

包括OpenAI、DeepSeek、Anthropic等公司的AI进展，以及谷歌与其他公司的竞争态势。

Anthropic

仍然是软件开发(SWE)领域的领头羊。如果其CEO所言不虚，智能体和进一步的发展将在未来几年内实现所有流程的自动化，并由通用智能体来处理。目前，Anthropic 正专注于商业领域（这一点从较低的速率限制上也不难看出），并继续保持强劲地位。

谷歌

然而，今年最大的赢家可能是谷歌，它几乎是从后起之秀跃居领先地位。Gemini 已经取得了令人瞩目成功。产品的定期更新、许多公告，包括出色的TPU定位，让谷歌的未来看起来一片光明。

Meta

不可否认，Meta已经落后了。Llama 4失败了，Behemoth也还没有发布。小扎组建了新的超级智能团队，试图再次迎头赶上。Alexandr Wang从Scale AI加入Meta是否会成为转折点？仍有待观察。

Grok

Grok 3.5也即将上线。目前很难评估。Grok在Colossus集群中显然处于有利位置。然而，它是否能训练出更好的模型？仍有待观察。

这其中评价最高的谷歌，接下来一段时间会有什么大动作？

让我们仔细看看Logan Kilpatrick的演讲内容，从中找出关键线索。

这次大会上，前OpenAI成员、谷歌AI Studio产品负责人Logan Kilpatrick的演讲干货满满，透露了不少Gemini 2.5 Pro以及将来谷歌Gemini的计划的细节。

关于Logan Kilpatrick这位哥，还有一件趣事：据说Gemini制作笑话的能力完全是根据他的推文训练出来的，这就是为什么它们都不好笑。 🤣

目前，Logan Kilpatrick负责Gemini API 开发及AGI研究

在演讲中， Logan Kilpatrick 快速讲了三部分内容：

关于Gemini 2.5 Pro，他认为它被谷歌内部、也被外部开发者生态认为是一次「转折点」——

它为Gemini的未来奠定了坚实的基础。

Gemini的愿景

「统一助手」

大多数人会想到：谷歌账号。但谷歌账号本身其实不「保留状态」，它的作用只是让你登录各个独立产品。

而现在，Gemini正在成为「统一线程」（thread）——串联起谷歌所有服务的那条线。

Gemini App ，很有意思，很酷，体现了谷歌如何思考 AI 产品的未来。