专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
目录
相关文章推荐
爱可可-爱生活  ·  //@爱可可-爱生活:欢迎参与~-20250 ... ·  昨天  
爱可可-爱生活  ·  【Anthropic团队内部如何用Claud ... ·  2 天前  
爱可可-爱生活  ·  【damn:AI驱动的命令行助手,一键获取你 ... ·  2 天前  
彭涛说  ·  我跟AI打了个视频电话... ·  2 天前  
彭涛说  ·  我跟AI打了个视频电话... ·  2 天前  
51好读  ›  专栏  ›  新智元

新版Gemini 2.5所有榜一,谷歌无敌了!一个月全面击败o3,编程反超Claude 4

新智元  · 公众号  · AI  · 2025-06-06 09:32

正文

请到「今天看啥」查看全文


这次,Gemini 2.5 Pro(06-05)依旧是所有榜一。

在数学、编程、推理基准测试中,新版模型全部刷新SOTA,完全碾压o3、Claude 4、DeepSeek-R1。

相较于上一代,Gemini 2.5 Pro整体Elo提升了24分,尤其是在Web Arena上Elo提升了足足35分。

值得一提的是,更新后版本token依旧维持原价,性价比极高,输出价格仅为o3的四分之一,Claude 4就更别提了。

而且,Gemini 2.5 Pro(06-05)还引入了「思考预算」,最高达32k,还改进了函数调用等功能。



Gemini 2.5数学编码再进化,所有榜一

新版Gemini 2.5 Pro(06-05)和旧版Gemini 2.5 Pro(05-06),名字后面版本的时间,值得玩味。

很明显,谷歌这次特意选择在这个时间点放出新模型。

根据官博介绍,此次是Gemini 2.5 Pro的升级预览版,这是谷歌迄今最智能的模型。

升级基于5月I/O大会展示的基础上,这个模型将在几周后成为普遍可用的稳定版本,适合企业级应用。







请到「今天看啥」查看全文