专栏名称: 大模型智能

机器学习算法、深度学习算法、自然语言处理等干货知识集中营

目录

相关文章推荐

A6工作室 · 新能源车辆新能源车辆外部电网故障裁判困境：保 ... · 5 小时前

Python大全 · 微信提现可以免手续费了，方法教会你，真的太实 ... · 16 小时前

Python大全 · 微信提现可以免手续费了，方法教会你，真的太实 ... · 16 小时前

保险一哥 · 平安创展“创保网”九周年庆，汇聚百万代理人、 ... · 3 天前

保险一哥 · 保险业务员集体下架MDRT，COT，TOT等 ... · 2 天前

海外掘金 · 香港保险要变天了！这两个大爆款6月30日停售 ... · 2 天前

海外掘金 · 香港保险要变天了！这两个大爆款6月30日停售 ... · 2 天前

51好读 › 专栏 › 大模型智能

刚刚，新版DeepSeek-R1正式开源！直逼o3编程强到离谱，一手实测来了

大模型智能 · 公众号 · · 2025-05-30 07:30

正文

请到「今天看啥」查看全文

文本生成优化：更自然，格式更佳

独特的推理风格：不仅快，而且更缜密

支持长时思考：单任务处理时长可达30-60分钟

思考时间更长，成为了全网讨论最多的一点。有网友实测后，R1思考时长超过了25分钟。

另外，这似乎是唯一一个能持续正确做对「9.9 - 9.11是多少」的模型。

编程能力强到爆

网友实测显示，新版DeepSeek-R1在编程方面简直不可思议！

AI圈大佬「karminski-牙医」用同一个prompt测试了DeepSeek-R1-0528和Claude 4 Sonnet后发现。

不管是光线照射在墙上形成的漫反射，还是球在撞击后的运动方向，亦或是控制面板的美观程度，这一把R1稳赢。

网友Alex的测试也显示出，DeepSeek-R1在前端编码的能力上超越了Claude 4 Sonnet。

网友Haider.则是让模型构建一个单词评分系统。R1简要思考后，就立刻出了关于代码和工作测试的两个文件，第一次运行就完美无瑕。

此前，o3是唯一能完成这个任务的模型。而如今，R1堪称是完成这个任务的最佳模型。

注意，R1的表现之所以如此惊人，是因为它返回的两个文件在第一次都能运行良好，不用编辑，不用重试，这极其少见。

因为此前的大多数模型，要么会在边缘情况下终端，要么会做得太复杂，要么缺少适当的测试覆盖率。

和Gemini高能PK

还有人将DeepSeek-R1与Gemini 2.5 Pro进行了对标。同一个提示下，它们各自的表现如何？

首先是深度研究的能力，给出「研究微剂量服用裸盖菇素对长期认知的影响，需引用学术来源」提示。

这一把Gemini的响应更快，引用了可靠的研究文献，并且答案结构清晰。

再来看看它们搜索+对比能力如何？提示模型用实时来源列出全民基本收入（UBI）的五大优点和缺点。

请到「今天看啥」查看全文

推荐文章

A6工作室 · 新能源车辆新能源车辆外部电网故障裁判困境：保险责任边界与条款完善

5 小时前

Python大全 · 微信提现可以免手续费了，方法教会你，真的太实用（2025最新）

16 小时前

Python大全 · 微信提现可以免手续费了，方法教会你，真的太实用（2025最新）

16 小时前

保险一哥 · 平安创展“创保网”九周年庆，汇聚百万代理人、累计创收超300亿！

3 天前

保险一哥 · 保险业务员集体下架MDRT，COT，TOT等等荣誉称号

2 天前

海外掘金 · 香港保险要变天了！这两个大爆款6月30日停售，错过再无

2 天前

海外掘金 · 香港保险要变天了！这两个大爆款6月30日停售，错过再无

2 天前

光电与显示 · 高通魅族将和解？中国市场盛传魅族 2017 年新机列入高通芯片

8 年前

扑克投资家 · 不懂爬虫的博士不是好Trader：一分钟教你用Excel从统计局抓数据！

8 年前

酱子工厂 · 小姨妹逗姐夫，笑岔气！

8 年前

扬子晚报 · 男子与女同学玩暧昧给她发12万红包，接着画风一变…将其告上法庭

8 年前

成都发布 · 成都市交委运管处开通“尾气维修”微信公众号。

8 年前

移动版

51好读 - 微信公众号文章