主要观点总结
文章介绍了DeepSeek的新版V3模型的更新情况,包括模型参数、更新内容、能力提升等方面。
关键观点总结
关键观点1: DeepSeek发布了V3模型的更新
文章介绍了DeepSeek在3月24日发布了其开源版本的新版V3模型,目前该模型已经上架开源网站,其开源许可更新为MIT开源许可。
关键观点2: 新版V3模型的能力提升
新版V3模型前端编码能力的提升是最显著的部分,据专业用户综合体验判断,其提升幅度相当于Sonnet 3.5到Sonnet 3.6的提升。同时,用户在多轮对话中也体现出了更强的上下文理解能力。
关键观点3: 新版V3模型的对比测试
用户按照提示词对新版V3与R1下达任务,实际产出的效果已经出现巨大差异。同时,与Claude 3.5/3.7的对比测试也显示了新版V3在编程能力上的优秀表现。
关键观点4: 新版V3模型的开源许可变更
新版V3的开源许可更新为MIT开源许可,这意味着新版V3有着更宽松的开源使用条件,对于希望在商业项目中使用新版V3模型的开发者来说,这是本次更新最重要的改变。
正文
初代 V3 模型最为人所熟知的,可能还是「557.6万美金比肩Claude 3.5效果」的超级性价比。而更新后的模型由其新的 32KGPU 集群上改进的后训练提供支持。
截至目前,还没有任何关于新版 DeepSeek V3 的能力基准测试榜单出现,但有了 DeepSeek V3 发布即成为 Chatbot Arena 榜单前十中唯一一个开源模型的刷榜历史,还是在发布一小时后迅速吸引来全球用户对其测试体验。
根据目前最新的用户上手测试,新版 V3 模型前端编码能力的提升,是目前「感知最强」的部分。根据专业用户对新版 V3 的综合体验判断,V3-0324 的提升幅度大约相当于 Sonnet 3.5 到 Sonnet 3.6 的提升。
用户按照下面的提示词,同时对新版 V3 与 R1 下达任务,实际产出的效果已经出现巨大差异。
创建一个包含 CSS 和 JavaScript 的单个 HTML 文件,以生成一个动画天气卡片。卡片应通过不同的动画直观地表示以下天气条件:风:(例如,移动的云朵、摇曳的树木或风线)雨:(例如,落下的雨滴、形成的水坑)晴:(例如,闪耀的光线、明亮的背景)雪:(例如,落下的雪花、积雪)并排显示所有天气卡片。卡片应具有深色背景。在此单个文件中提供所有 HTML、CSS 和 JavaScript 代码。JavaScript 应包含一种在不同天气条件之间切换的方法(例如,一个函数或一组按钮),以演示每种天气的动画。
左侧是 DeepSeek 新版 V3 模型的生成结果,右侧为 R1 的生成结果。
除了对比 R1 ,用户还用类似的提示词,对比了 Claude 系列。Claude 3.7 作为目前号称「编程能力最强模型」,实际编程能力使用体验也是多次被评为「已经达到专家级程序员水准」。
同一提示词给到 Claude 3.5/3.7 后,模型生成的前端内容如下所示: