专栏名称: 智东西
智东西-聚焦智能变革,服务产业升级!作为智能行业新锐媒体,智东西专注五大领域:VR/AR;AI/机器人/无人机;智能汽车/智能出行;智能家居/物联网;智能穿戴/智能医疗,通过内容、活动、报告以及社群等方式助力“智能+”时代的创业和产业升级。
目录
相关文章推荐
51好读  ›  专栏  ›  智东西

谷歌I/O超全总结:AI搜索大变样,AR眼镜复活,大模型全家桶升级,史上最贵订阅费1800元

智东西  · 公众号  · 科技媒体  · 2025-05-21 07:50

正文

请到「今天看啥」查看全文


10余款模型重大突破、20余款重大AI产品

自第一代Gemini模型发布以来,Gemini模型的Elo分数已提升300多分。编程方面, Gemini 2.5 Pro成为编程平台Cursor上年度增长最快的模型 ,每分钟产出数十万行被采纳的代码。

在LMArena排行榜中,Gemini系列模型包揽了每秒生成输出token数最高的前三名,并且模型价格也在下降。

全栈基础设施方面,谷歌 第七代TPU Ironwood 是首款专为大规模AI思考和推理工作负载而设计的TPU,其性能是上一代的10倍,每个Pod的计算能力达到42.5 exaFLOPS。

皮查伊提到谷歌大模型相关的几组数据:

去年同期谷歌每月通过产品和API处理的token数量为 9.7万亿 ,目前其每月处理的token数达到 480万亿 ,一年内增长了约50倍;

超过 700万名 开发者通过Gemini API进行开发,涵盖谷歌AI Studio和Vertex AI两大平台,同比增长超过五倍,同时Vertex AI平台上的Gemini使用率较去年增长40倍;

Gemini应用目前拥有超过 4亿月活用户 ,在Gemini应用中使用2.5 Pro版本的用户使用量增长了45%;

在搜索方面,AI概览功能的每月用户超 15亿 。皮查伊认为AI Mode是搜索领域的下一个重大进展,我们正处在AI平台转型的新阶段。

皮查伊还提到,Gemini已经通关精灵宝可梦,集齐8枚徽章获得冠军,“距离人工宝可梦智能更进一步”。

02 .
Gemini编程、语音、深度思考迎升级
DeepMind CEO揭秘终极愿景


哈萨比斯提到, Gemini 2.5 Pro是谷歌迄今为止最智能的模型,也是全球最强大的基础模型 。两周前,谷歌发布了Gemini 2.5 Pro的预览版,开发者们用它实现了诸多创意:比如将草图转化为交互应用、模拟完整3D城市等。
新版的Gemini 2.5 Pro在WebDev Arena编程排行榜登顶。谷歌还将他们去年发布的LearnLM(专为学习场景微调的模型)接入Gemini 2.5 Pro模型,这让后者在解题等学习场景的能力进一步提升。
今天谷歌推出了 轻量级模型Gemini 2.5 Flash的升级版。 这款模型在推理、编程和长上下文等关键指标上实现提升,在大模型竞技场的排名仅次于Gemini 2.5 Pro。升级版模型将于6月初全面开放,Pro版本随后跟进,目前开发者已经可以在AI Studio抢先体验。
Gemini还引入了更多的功能。增强版安全防护的可抵御间接提示注入攻击;思维摘要功能将模型思考过程可视化,便于调试;Gemini 2.5 Pro即将新增“思考预算”控件,开发者可控制模型思考的长度,从而平衡质量与成本。
Gemini 2.5 Pro和Gemini 2.5 Flash的文本转语音功能支持多角色对话,能实现语气微妙变化、切换耳语模式、跨24种语言切换。
谷歌Gemini产品负责人Tulsee Doshi展示了Gemini 2.5 Pro的编程能力。现场,Gemini 2.5 Pro仅参照一张草图就生成了完整的3D交互网页,用时 37秒 就在原网页代码上完成修改。
Gemini 2.5 Pro现已在多款AI IDE平台(如Cursor等)中可用。谷歌昨日开启公测的 编程助手Jules也接入了Gemini 2.5 Pro ,能独立处理GitHub代码库的复杂任务,将原本耗时数小时的工作缩短至分钟级。

▲谷歌Jules用户界面

在模型架构创新方面,谷歌将扩散模型技术应用于文本生成。全新的 Gemini Diffusion实验模型(扩散语言模型) 的生成速度比Gemini 2.5 Flash快5倍。这款模型不仅仅能按顺序从左到右生成内容,还可以生成过程中快速迭代解决方案,并在生成过程中进行错误纠正。
谷歌打造了Gemini 2.5的






请到「今天看啥」查看全文