专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

新版Gemini 2.5所有榜一，谷歌无敌了！一个月全面击败o3，编程反超Claude 4

新智元 · 公众号 · AI · 2025-06-06 09:32

正文

这次，Gemini 2.5 Pro（06-05）依旧是所有榜一。

在数学、编程、推理基准测试中，新版模型全部刷新SOTA，完全碾压o3、Claude 4、DeepSeek-R1。

相较于上一代，Gemini 2.5 Pro整体Elo提升了24分，尤其是在Web Arena上Elo提升了足足35分。

值得一提的是，更新后版本token依旧维持原价，性价比极高，输出价格仅为o3的四分之一，Claude 4就更别提了。

而且，Gemini 2.5 Pro（06-05）还引入了「思考预算」，最高达32k，还改进了函数调用等功能。

Gemini 2.5数学编码再进化，所有榜一

新版Gemini 2.5 Pro（06-05）和旧版Gemini 2.5 Pro（05-06），名字后面版本的时间，值得玩味。

很明显，谷歌这次特意选择在这个时间点放出新模型。

根据官博介绍，此次是Gemini 2.5 Pro的升级预览版，这是谷歌迄今最智能的模型。

升级基于5月I/O大会展示的基础上，这个模型将在几周后成为普遍可用的稳定版本，适合企业级应用。

推荐文章

黄建同学 · 收藏↓ Reinforcement Learning from -20250612132807

10 小时前

宝玉xp · 转发微博-20250612000643

昨天

爱可可-爱生活 · 【[48星]GiGL：大规模图神经网络训练与推理的开源利器。亮点-20250611170846

昨天

爱可可-爱生活 · 【[75星]spotify-mcp-server：让AI助手轻松-20250610191818

2 天前

爱可可-爱生活 · 我们团队制作的面向青少年的AI通识系列短视频课程《AI在大前》第-20250610192346

2 天前

商业地产观察 · 不只是严肃，这些商业建筑让呆萌进行到底，吸客又吸金

8 年前

扯淡堂 · 人就是这样子，越是自己没有的，越会喜欢它

8 年前

HRTechChina · 如果未来面试官是机器人，你该如何表现才能过关？

7 年前

蒲公英Ouryao · 提取浓缩岗位操作歌诀

7 年前

又有好物推荐 · 阳春四月，野外出行一定要带上这款神器

7 年前