专栏名称: 华尔街见闻
追踪全球财经热点,精选影响您财富的资讯,投资理财必备神器!
目录
相关文章推荐
51好读  ›  专栏  ›  华尔街见闻

一文读懂Google I/O 2025 开发者大会:开启 “模型即平台” 的 AI 生态新时代

华尔街见闻  · 公众号  · 财经  · 2025-05-21 18:38

正文

请到「今天看啥」查看全文


他介绍,一年来,谷歌系统每月处理的token数量激增,从去年的9.7万亿增加到现在的480万亿,增长将近50倍。Gemini的App每月有4 亿多活跃用户。


“智能体模式”将上线Chrome、搜索及Gemini App


皮查伊宣布,谷歌将在Chrome浏览器、搜索以及Gemini的App中推出智能体模式(Agent Mode)。

智能体可以与浏览器和其他软件进行交互和操作。谷歌研究的AI智能体Mariner现在可以同时管理多达10个任务,用户只需向其展示一次任务,它就会学习该任务,并将经验用于未来的案例。

智能体模式的实验版即将向Gemini App的订阅者推出。

皮查伊现场演示Gemini App中的智能体模式,要求它帮用户找公寓。得到指令后,Gemini搜索房产网Zillow,用电脑调整筛选条件,并使用模型上下文协议MCP预约看房。

皮查伊评价:

“这是一个新兴的时代。将研究成果转化为现实的最佳方式就是让它真正发挥作用。”

他说,在经用户许可的情况下,Gemini 现在可以在各种App中以“私密安全”的方式使用个人信息。

Gemini Live语音助手升级 Gemini 2.5 Pro 和 Flash有原生音频输出

谷歌高管称,Gemini App有三大定位:Personal(个性化)、Proactive(主动)、Powerful(强大)。它可主动帮助你准备考试、整理任务、制定旅行计划,甚至提前生成解释视频。

Gemini Live语音助手升级,即日起在Android 和 iOS免费开放,支持 45种以上的语言。它支持语音对话、摄像头识别与屏幕共享,能在上下班途中与用户自然聊天或帮你读懂周围环境。谷歌称,Gemini Live的“这些交互是如此自然,以至于你会忘了你在跟 AI 说话。”

在智能体模式下,Gemini Live可帮用户找房、预约、订票。谷歌演示,用户只需说出需求:“我和两个室友在奥斯汀找房,每人预算 1200 美元”,Gemini 会自动比对 Zillow 房源、筛选洗衣设施、甚至安排看房时间。完全不需要切换 App,AI 就已为你搞定。

Canvas功能让文档“变身”成可分享的内容。用户可以上传文档,一键生成互动网页、信息图,甚至播客内容。“Canvas 不是工具,它是共创空间。”

谷歌Gemini模型的产品策略负责人Tulsee Doshi介绍,Gemini 2.5 Pro 和 Flash现在都有原生音频输出,支持两种声音。

模型现在可以用更具表现力的方式交谈,甚至可以低声细语。它可以无缝切换到印地语,然后以相同的声音切换回英语。Gemini API现在就可以提供原生音频输出。

Gemini的实时语音助手Gemini Live现在可以区分说话者的声音和背景音,因此可以做出更恰当的响应。


Google Beam利用AI模型实时拼接视图创造3D人物


谷歌发布名为Google Beam 的新产品。它是一个AI驱动的视频通信平台,让人们的视频感觉如同面对面聊天。它是谷歌3D视频会议系统项目Starline 技术的升级版。谷歌与惠普合作,将Google Beam 系统商业化,今年晚些时候,惠普将推出首批Google Beam设备。







请到「今天看啥」查看全文