主要观点总结
Google I/O 2025大会上,谷歌展示了其AI技术的重大进展。谷歌的Gemini 2.5系列模型在多个方面领先于竞争对手,并且推出了新的AI功能。谷歌的AI战略变得极为激进,其将AI集成到多个产品中,包括搜索、广告、云和设备等。谷歌的生态系统涵盖了个人生活、工作、知识和娱乐等方面,创造了协同效应,放大了人工智能的影响力。谷歌的AI技术与其无处不在的服务相结合,可能会使初创公司在通用AI助手或基本功能方面的竞争处于尴尬境地。同时,谷歌在训练大型模型方面拥有优势,能够更经济、更快地训练模型。
关键观点总结
关键观点1: 谷歌在Google I/O 2025大会上展示了AI技术的重大进展,包括Gemini 2.5系列的更新和AlphaEvolve的突破性成果。
谷歌的AI技术在很多方面都领先于竞争对手,展示了强大的能力。谷歌的AI战略变得极为激进,将AI集成到多个产品中。
关键观点2: 谷歌的生态系统涵盖了个人生活、工作、知识和娱乐等方面,创造了协同效应,放大了人工智能的影响力。
谷歌的生态系统整合了多个平台和服务,使用户能够更方便地访问和使用AI功能。这种整合创造了协同效应,提高了AI的影响力。
关键观点3: 谷歌将AI技术与其无处不在的服务相结合,可能会使初创公司在通用AI助手或基本功能方面的竞争处于尴尬境地。
由于谷歌在AI技术和服务整合方面的优势,初创公司在通用AI助手或基本功能方面的竞争可能会面临挑战。这将使这些公司需要寻找更具创意的产品能力来维持生存或异军突起。
关键观点4: 谷歌在训练大型模型方面拥有优势,能够更经济、更快地训练模型。
谷歌推出了第七代TPU Ironwood,性能强大,能够加速模型的训练。谷歌表示,其强大的基础设施使其能够经济实惠地提供模型和服务。
正文
图源:Google 官方 Blog
Gemini 2.5 在深度思考模式中会展示思维链的摘要,新添加了对 MCP 工具的支持,并能控制思考预算
( 该功能将在 Gemini 2.5 Pro Preview 中引入 )
,除了没有展示完整思维链还是个槽点,也算是当前深度思考模型产品的顶配。
因为具有更强的并行性优势,除了图像、视频领域,扩散模型在语言方向的关注度也愈发高涨。
谷歌也没有放过这个增长点,推出了 Gemini Diffusion,据称其 Demo 版生成速度是谷歌迄今为止最快模型的五倍,编码能力也没有缩水。
开发工具方面几乎实现了全栈支持
,比如 Colab和Gemini Code Assist 用于快速实验和编码,Stitch 用于快速设计前端 UI,Firebase Studio 用于 Web 和移动应用开发,Jules 异步处理繁重无聊的任务
( 比如 debug )
等。
可以看出,谷歌早就不再是追赶者,它正走在重夺早期
AI
时代领导地位的路上。
基于强大的基础模型和早期构建起来的应用生态,谷歌开始发挥自己的独有优势,其将
AI
集成到如此多产品
( 搜索、广告、云和设备等 )
中的能力几乎无人能及。
相比之下,OpenAI 拥有出色的技术,但可以说只有一款主要产品ChatGPT。
基础模型拼的是 AI 输出能力,但要打造好的产品应用,好的输入能力也很重要。
比如主流大模型产品原本普遍不支持直接的 URL 网页内容提取,只能被动地通过搜索功能实现。
而谷歌正在实验的 “ URL 上下文 ” 支持能力,若能大规模落地,其利用谷歌搜索和互联网生态丰富上下文的能力不可小觑,价值相当于公开数据中的 MCP。
这其实就是将 AI 嵌入各个环境以构建 AI Agent 的操作,关键在于,谷歌还能通过应用生态将这些 AI Agent 再连接起来。
在搜索的时候顺便看一眼 AI 提供的摘要,如今估计已成为了大多数人的习惯,
谷歌表示,“ 用户使用 AI 概览后,对搜索结果更加满意,搜索频率也更高。”
以搜索为立命之本的谷歌自然不会放过这一增长点,对搜索功能特别进行了加强,推出了 AI Mode 。
AI Mode 底层采用谷歌的 query fan-out 技术,可以将用户搜索问题分解为子主题,并同时发出多个查询。
深度搜索模式则采用相同的 query fan-out 技术,但能发起更多搜索,可多达数百次,直接对标 OpenAI Deep Research
( 最多进行 100 次查询 )
。
不仅如此,它还支持将公共数据与私人数据
( 比如 PDF、图像等 )
结合,这在模态上比 OpenAI 目前的 Deep Research 模式更加丰富。甚至很快,你就可以在 Google Drive 和 Gmail 上使用 Deep Research 。
搜索中还支持用摄像头实时互动
( 基于 Project Astra 技术 )