专栏名称: 极客公园
科技创新者的大本营。汇聚优秀的产品报道、评测视频和高质量的线下活动。
目录
相关文章推荐
36氪  ·  高校英语专业,快没了 ·  昨天  
51好读  ›  专栏  ›  极客公园

Gemini 大模型逆袭,给了 Google Cloud「AI 基建」的勇气

极客公园  · 公众号  · 科技媒体  · 2025-04-10 12:04

主要观点总结

Google Cloud Next 2025大会开幕,Google展现了其在AI领域的全面实力。发布了新模型Gemini 2.5 Flash、新工具Vertex AI、新硬件TPU Ironwood等。此外,还推出了Agent2Agent(A2A)协议,用于连接不同生态系统中的AI Agents。这些新发布的产品和技术更新展示了Google在AI领域的持续创新和领导地位。

关键观点总结

关键观点1: Gemini 2.5 Flash的发布

作为Google CEO皮查伊亲自发布的产品,Gemini 2.5 Flash是一款注重效率和动态可控的推理模型,旨在根据查询的复杂性提供动态调整处理时间的能力。

关键观点2: Vertex AI的全模态更新

Vertex AI获得了视频、图像、语音和音乐生成AI工具的全模态更新,其中最引人注目的是视频生成模型Veo 2的更新,新增了编辑和相机控制功能。

关键观点3: TPU Ironwood的发布

Google发布了第七代Tensor处理单元(TPU)Ironwood,旨在满足思维模型对计算能力的需求,具有高性能、可扩展性和能效。

关键观点4: Agent2Agent(A2A)协议的推出

Google推出了一项新的开放协议A2A,旨在连接不同生态系统中的AI Agents,解决不同供应商生态系统上的代理无法相互通信的挑战。


正文

请到「今天看啥」查看全文


据皮查伊介绍,Gemini 2.5 Flash 主打卖点是提供「动态且可控的」计算能力,允许开发者根据查询的复杂性,手动调整处理时间。 「你可以根据具体需求调整速度、准确性和成本之间的平衡。这种灵活性对于在高流量、成本敏感的应用中优化模型的性能至关重要」。
根据在现场与 Google 工程师的交谈,他指出 2.5 Pro 在处理一些简单的问题时,仍容易出现「过度思考」导致其响应速度大幅降低的问题。这也是 2.5 Flash 在体验中力求解决的难点。但最终他们的目标,还是进一步改善模型的动态思考能力,并将更多控制权开放给用户。
作为打响大模型性价比大战第一枪的选手,Google 还特别提到了与 DeepSeek R1 这样「价格较低但性能良好的模型」的对比,表示 2.5 Flash 非常适合在「高流量」和「实时」应用的商用场景——例如客户服务和文档解析。
除了新模型,Google 还放出了将最新模型「本地部署」这样的策略,来让已经有自己数据中心、或是有着更高数据管理要求的客户,能够使用现有的硬件设施,快速在自己的服务中部署 Gemini 2.5 Flash 的能力。
Google 计划从第三季度开始,将 2.5 Flash 这样的 Gemini 模型引入本地部署环境。该公司的 Gemini 模型将可在 Google Distributed Cloud (GDC) 上使用,同时表示 Google 也正在与英伟达合作,将 Gemini 模型引入符合 GDC 规范的 Nvidia Blackwell 系统。
这样的服务分量也吸引到老黄来站台| 图片来源:极客公园

02

新工具

作为 Google Cloud 托管的 AI 工具部署平台,Vertex AI 也在今天得到了几乎是「全模态」的更新,新的视频、图像、语音和音乐生成 AI 工具都将登陆 Vertex AI。
其中最值得关注的,就是视频生成模型 Veo 2 的更新,新增的编辑和相机控制功能,除了可以自动「从视频中移除不需要的背景图像、徽标或干扰物」。还能将原始视频的画面扩展,进一步填充原本的空白内容。这个工具会用 AI 生成的、能与原始片段融合的视频素材来填充新的空间。
Veo 2 的视频内容拓展效果 | 图片来源:Google
此次更新还允许 Veo 2 用户在生成素材时,除了文本描述外,还可以选择电影技巧预设,用于指导最终结果中的镜头构图、摄像机角度和节奏。包括延时摄影效果、无人机风格的第一人称视角(POV)以及模拟不同方向的摄像机平移。
此外,本次更新还增加了一个新的插值(Interpolation)功能,可以在两个静态图像之间创建视频过渡,用新的帧填充开头和结尾序列。
只需给出一个起始帧和最终帧,Veo 2 就会生成连接两者的视频。
只需两张照片,Veo 2 就能自动生成一段中间视频 | 图片来源:Google
文本转图像模型 Imagen 3 的编辑功能也得到了更新,Google 表示本次更新「显著」改进了自动对象移除时的自然效果。
Imagen 3 能获得更自然的内容移除效果 | 图片来源:Google
据现场相关业务负责人介绍,Veo 2 和 Imagen 3 已经被欧莱雅等公司用于设计营销内容。负责人 Justin Thomas 表示,过去「 需要八周才能完成的图像处理任务,现在只需八小时 」。






请到「今天看啥」查看全文