专栏名称: 爱分析ifenxi

爱分析ifenxi是一家专注于创新领域的投研机构，以企业价值研究为内核，服务企业决策者和机构投资者。爱分析重点研究技术驱动型创新领域，包括新金融、企业服务及大消费等，并通过全网多个平台发布访谈和调研报告。

DeepSeek在企业侧的落地：技术盘点与路径解析

爱分析ifenxi · 公众号 · · 2025-03-05 18:00

正文

请到「今天看啥」查看全文

推理模型元年，新模型、新技术依然可期

整体技术情况是企业进行推理模型落地部署和场景探索的基础。从技术本身而言，今年可被视为推理模型元年，在模型和技术层面，存在许多新的迭代方向，技术路线也存在竞争。

模型方面，梳理从OpenAI o1 Preview版本发布到Grok 3发布的过程，其间不仅有OpenAI和DeepSeek ，还有千问、 Google的Gemini，以及智谱、讯飞、阶跃星辰、Kimi等。预计3月左右，Anthropic和OpenAI有可能发布GPT 5，不同厂商在推出不同模型。与去年下半年模型发布节奏相比，变化巨大。ChatGPT刚发布后，国内厂商基本每月迭代一个版本，2023年大部分厂商按月或按季度更新迭代大语言模型版本。2024年下半年，可能半年都未必有新版本更新，更多更新转向多模态模型。进入2025年，由于DeepSeek开源模型发布，预计2月、3月乃至整个上半年，不同厂商都会发布推理模型，且版本迭代速度加快。Grok比DeepSeek晚发布约一个月，预计豆包、Anthropic等企业也会发布新模型。

从模型本身来看，去年下半年大语言模型的Scaling Law接近极限，但目前推理模型的 Scal ing L aw 才刚刚起步，这也是版本迭代井喷的原因之一，预计2025年还会出现大量新的模型版本。此外，DeepSeek 公开了强化学习（RL）这一技术路线，但它并非唯一可行路线。此前还有过程奖励、蒙树等不同技术路线，以及无需思维链的隐式推理技术路线等，这些技术路线仍在探索中，RL是首个跑通的，但不意味着只有它可行。

基于大量新推理模型和新技术路线的探索，当考虑将其落地到企业进行部署时，鉴于模型版本不断迭代更新，建议企业采取由浅入深、逐步推进的方式落地推理模型。以下列出四条由浅入深的路径：

1. API接入 ：这是最基础的方式，目前许多央企已在企业内部即时通讯（IM）中嵌入推理模型，采用类似微信对DeepSeek进行灰度测试的模式。采用API接入，一是速度快，能迅速完成部署；二是可实现全员使用。相较于之前接入大厂API需高额付费，接入R1虽仍需付费，但金额大幅降低，所以多数企业选择从API接入起步。

2. 本地化部署结合知识库RAG ：这是上一波大语言模型落地较为通用的方式，目前仍广泛应用于企业内部，尤其在金融机构和央企中。不过，各企业部署的R1版本有所不同，少数采用6000亿参数版本，多数采用蒸馏后的千问32B版本。

3. 对知识库RAG中的提示词工程进行精细化处理 ：部分企业会将基于思维链的提示词单独提取出来，做进一步精细化处理。当前多数企业推进速度最快也就到这一步，也是较为理想的实施阶段。完成前三步后，一方面，全员参与使用有助于拓展新应用场景，企业在部署模型后，更关注投资回报率（ROI）及能否开拓新场景，通过全员探索自下而上的方式较为有效；另一方面，继续深入则不可避免涉及监督微调（SFT）和模型蒸馏。由于推理模型不断涌现，难以保证三个月后R1模型不因自身迭代或新厂商模型的出现而被超越，这就可能需要重新进行SFT。