专栏名称: 智东西
智东西-聚焦智能变革,服务产业升级!作为智能行业新锐媒体,智东西专注五大领域:VR/AR;AI/机器人/无人机;智能汽车/智能出行;智能家居/物联网;智能穿戴/智能医疗,通过内容、活动、报告以及社群等方式助力“智能+”时代的创业和产业升级。
目录
相关文章推荐
新浪科技  ·  【#中国支付清算协会发布两项新规# ... ·  19 小时前  
新浪科技  ·  【#李斌回忆19年比现在还难#:#李斌称19 ... ·  2 天前  
36氪  ·  10年前学钢琴的人,现在找不到工作 ·  2 天前  
51好读  ›  专栏  ›  智东西

美国最新报告!DeepSeek成全球第二大AI实验室,OpenAI谷歌坐不住了

智东西  · 公众号  · 科技媒体  · 2025-05-30 14:41

正文

请到「今天看啥」查看全文


▲社交平台X上的网友评论(英文已翻译为中文)


01 .
DeepSeek成全球第二大AI实验室
开源领域第一


Artificial Analysis的AI分析指数包含7项评估:MMLU-Pro、GPQA Diamond、Humanity's Last Exam、LiveCodeBench、SciCode、AIME、MATH-500。
DeepSeek-R1-0528实现了多方面智能提升:最大的突破体现在AIME 2024(竞赛数学,+21 分)、LiveCodeBench(代码生成,+15 分)、GPQA Diamond(科学推理,+10分)和人类的最后考试(推理与知识,+6分)中。
如下图所示,DeepSeek-R1-0528在AI分析指数得分达到68分,仅次于OpenAI o4-mini(高版本)的70分和OpenAI o3的69分。与谷歌Gemini 2.5 Pro的68分持平。
开源模型和封闭模型之间的差距比以往任何时候都小。如下图所示,蓝色矩形代表开原模型,黑色矩形代表封闭模型,DeepSeek-R1-0528以68分稳居第一,而后是62分的Qwen3-235B。

02 .
编程和数学能力突出
三年里一直加速追赶






请到「今天看啥」查看全文