专栏名称: 高可用架构
高可用架构公众号。
目录
相关文章推荐
美团技术团队  ·  可信实验白皮书系列04:随机轮转实验 ·  2 天前  
架构师之路  ·  爸爸!除了你,沈括,沈万三... ... ·  3 天前  
字节跳动技术团队  ·  掘金 AI 编程社区- 人人都是 AI 编程家竞赛 ·  昨天  
51好读  ›  专栏  ›  高可用架构

一文了解DeepSeek及应用场景

高可用架构  · 公众号  · 架构  · 2025-03-28 08:32

正文

请到「今天看啥」查看全文


二、DeepSeek


2.1. DeepSeek是什么

  • DeepSeek (深度求索)是中国的人工智能公司,成立于 2023 年7月,由知名量化资管巨头幻方量化创立,专注于探索通用人工智能(artificial general intelligence,AGI)的实现路径,主攻大模型研发与应用。

  • DeepSeek-V3 是其开源的 通用自然语言处理模型 ,对标GPT-4o.

  • DeepSeek-R1 是其开源的 推理模型 ,擅长处理复杂任务,对标OpenAI o1 / o1-mini.

Image

DeepSeek主流模型的竞品对标


2.2. DeepSeek可以做什么

直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景,支持 联网搜索 深度思考 ,同时支持 文本上传 ,能够扫描读取各类文件及图片的 文字内容

Image


2.3. DeepSeek的模型对比

2.3.1. DeepSeek模型发展史

Image

资料来源: 彩云之南公众号,浙商证券研究所。[相关链接2]

我们常说的DeepSeek的大模型,是指当前主流的DeepSeek-V3和DeepSeek-R1。

2.3.2. V3与R1的对比与选择

总结: 不考虑调用成本,复杂推理任务(例如数学、代码等)或者希望获取思维链,优先DeepSeek-R1;内容创作、文本生成等优先DeepSeek-V3。

  • DeepSeekV3与DeepSeek-R1的对比

Image
  • 选择V3和R1的指南

Image

2.3.3. 竞品-OpenAI的大模型

Image

*o3-mini的一个介绍: [3] , o1-mini的一个介绍: [4] , GPT-4o的一个介绍: [5] , GPT-4o-mini的一个介绍: [6]

2.3.4. 竞品-通义千问的大模型

Image

Image

引用: 通义千问官网[7]


2.4. DeepSeek为什么大火

Image

2.4.1. 性能优越

  • DeepSeek-v3推断速度快 :吐字速度从v2的20TPS提升到60TPS.

  • DeepSeek-v3性能优越 : 在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首 ,与世界上最先进的闭源模型不分伯仲。

Image
  • DeepSeek R1专注于推理能力 ,尤其是 密集推理任务 (reasoning-intensive tasks),比如代码、数学、科学、逻辑推理这些 带有明确答案的良定义的问题 。DeepSeek R1在数学、代码、自然语言推理等任务上 性能可比肩OpenAI o1模型正式版

    • 在AIME 2024数学基准测试中,DeepSeek R1得分率79.8%,OpenAI o1得分率79.2%。

    • 在MATH-500基准测试中,DeepSeek R1得分率97.3%,OpenAI o1得分率96.4%。

Image
  • 顿悟(Aha)时刻: 单纯的RL (没有显式地提供CoT数据,而是告诉模型先思考,再回答) 就可以激发模型产出带有长思维链 (甚至是反思)的回复的能力,在DeepSeek-R1-zero训练过程中,在某个特定阶段,模型 突然学会了重新评估自己的初始方法,并为复杂问题分配更多的思考时间。 这个时刻不仅标志着模型能力的质的飞跃,也是研究者们的重大发现,它展示了强化学习在培养AI自主思考和问题解决能力方面的巨大潜力。

Image
  • 蒸馏小模型: 在R1的发布中,同时探索了如何将大模型的推理能力高效地蒸馏到小模型中,使用DeepSeek-R1生成80万条训练样本, 直接对开源的小模型(如Qwen和Llama系列)进行微调 ,开源了方便本地部署的一众蒸馏小模型。

*AIME 2024: 数学题,涵盖算术、代数、计数、几何、数论、概率等中学数学主题的综合评测,测试数学问题解决能力。







请到「今天看啥」查看全文