Gemini 大模型逆袭，给了 Google Cloud「AI 基建」的勇气

极客公园 · 公众号 · 科技媒体 · 2025-04-10 12:04

主要观点总结

Google Cloud Next 2025大会开幕，Google展现了其在AI领域的全面实力。发布了新模型Gemini 2.5 Flash、新工具Vertex AI、新硬件TPU Ironwood等。此外，还推出了Agent2Agent（A2A）协议，用于连接不同生态系统中的AI Agents。这些新发布的产品和技术更新展示了Google在AI领域的持续创新和领导地位。

关键观点总结

关键观点1: Gemini 2.5 Flash的发布

作为Google CEO皮查伊亲自发布的产品，Gemini 2.5 Flash是一款注重效率和动态可控的推理模型，旨在根据查询的复杂性提供动态调整处理时间的能力。

关键观点2: Vertex AI的全模态更新

Vertex AI获得了视频、图像、语音和音乐生成AI工具的全模态更新，其中最引人注目的是视频生成模型Veo 2的更新，新增了编辑和相机控制功能。

关键观点3: TPU Ironwood的发布

Google发布了第七代Tensor处理单元（TPU）Ironwood，旨在满足思维模型对计算能力的需求，具有高性能、可扩展性和能效。

关键观点4: Agent2Agent（A2A）协议的推出

Google推出了一项新的开放协议A2A，旨在连接不同生态系统中的AI Agents，解决不同供应商生态系统上的代理无法相互通信的挑战。

正文

请到「今天看啥」查看全文

据皮查伊介绍，Gemini 2.5 Flash 主打卖点是提供「动态且可控的」计算能力，允许开发者根据查询的复杂性，手动调整处理时间。 「你可以根据具体需求调整速度、准确性和成本之间的平衡。这种灵活性对于在高流量、成本敏感的应用中优化模型的性能至关重要」。

根据在现场与 Google 工程师的交谈，他指出 2.5 Pro 在处理一些简单的问题时，仍容易出现「过度思考」导致其响应速度大幅降低的问题。这也是 2.5 Flash 在体验中力求解决的难点。但最终他们的目标，还是进一步改善模型的动态思考能力，并将更多控制权开放给用户。

作为打响大模型性价比大战第一枪的选手，Google 还特别提到了与 DeepSeek R1 这样「价格较低但性能良好的模型」的对比，表示 2.5 Flash 非常适合在「高流量」和「实时」应用的商用场景——例如客户服务和文档解析。

除了新模型，Google 还放出了将最新模型「本地部署」这样的策略，来让已经有自己数据中心、或是有着更高数据管理要求的客户，能够使用现有的硬件设施，快速在自己的服务中部署 Gemini 2.5 Flash 的能力。

Google 计划从第三季度开始，将 2.5 Flash 这样的 Gemini 模型引入本地部署环境。该公司的 Gemini 模型将可在 Google Distributed Cloud (GDC) 上使用，同时表示 Google 也正在与英伟达合作，将 Gemini 模型引入符合 GDC 规范的 Nvidia Blackwell 系统。

这样的服务分量也吸引到老黄来站台｜图片来源：极客公园

新工具

作为 Google Cloud 托管的 AI 工具部署平台，Vertex AI 也在今天得到了几乎是「全模态」的更新，新的视频、图像、语音和音乐生成 AI 工具都将登陆 Vertex AI。

其中最值得关注的，就是视频生成模型 Veo 2 的更新，新增的编辑和相机控制功能，除了可以自动「从视频中移除不需要的背景图像、徽标或干扰物」。还能将原始视频的画面扩展，进一步填充原本的空白内容。这个工具会用 AI 生成的、能与原始片段融合的视频素材来填充新的空间。

Veo 2 的视频内容拓展效果｜图片来源：Google

此次更新还允许 Veo 2 用户在生成素材时，除了文本描述外，还可以选择电影技巧预设，用于指导最终结果中的镜头构图、摄像机角度和节奏。包括延时摄影效果、无人机风格的第一人称视角（POV）以及模拟不同方向的摄像机平移。

此外，本次更新还增加了一个新的插值（Interpolation）功能，可以在两个静态图像之间创建视频过渡，用新的帧填充开头和结尾序列。

只需给出一个起始帧和最终帧，Veo 2 就会生成连接两者的视频。

只需两张照片，Veo 2 就能自动生成一段中间视频｜图片来源：Google

文本转图像模型 Imagen 3 的编辑功能也得到了更新，Google 表示本次更新「显著」改进了自动对象移除时的自然效果。

Imagen 3 能获得更自然的内容移除效果｜图片来源：Google

据现场相关业务负责人介绍，Veo 2 和 Imagen 3 已经被欧莱雅等公司用于设计营销内容。负责人 Justin Thomas 表示，过去「 需要八周才能完成的图像处理任务，现在只需八小时 」。