专栏名称: 爱分析ifenxi
爱分析ifenxi是一家专注于创新领域的投研机构,以企业价值研究为内核,服务企业决策者和机构投资者。爱分析重点研究技术驱动型创新领域,包括新金融、企业服务及大消费等,并通过全网多个平台发布访谈和调研报告。
目录
相关文章推荐
微观三农  ·  夏收一线 · “盐碱地种这油菜,收益嘹咋咧!” ·  23 小时前  
幸福东台  ·  祝贺!复审通过 ·  昨天  
幸福东台  ·  祝贺!复审通过 ·  昨天  
幸福东台  ·  案件通报 ·  2 天前  
幸福东台  ·  案件通报 ·  2 天前  
51好读  ›  专栏  ›  爱分析ifenxi

DeepSeek在企业侧的落地:技术盘点与路径解析

爱分析ifenxi  · 公众号  ·  · 2025-03-05 18:00

正文

请到「今天看啥」查看全文


推理模型元年,新模型、新技术依然可期
整体技术情况是企业进行推理模型落地部署和场景探索的基础。从技术本身而言,今年可被 视为推理模型元年,在模型和技术层面,存在许多新的迭代方向,技术路线也存在竞争。
模型方面,梳理从OpenAI o1 Preview版本发布到Grok 3发布的过程,其间不仅有OpenAI和DeepSeek ,还有千问、 Google的Gemini,以及智谱、讯飞、阶跃星辰、Kimi等。预计3月左右,Anthropic和OpenAI有可能发布GPT 5,不同厂商在推出不同模型。与去年下半年模型发布节奏相比,变化巨大。ChatGPT刚发布后,国内厂商基本每月迭代一个版本,2023年大部分厂商按月或按季度更新迭代大语言模型版本。2024年下半年,可能半年 都未必有新版本更新,更多更新转向多模态模型。进入2025年,由于DeepSeek开源模型发布,预计2月、3月乃至整个上半年,不同厂商都会发布推理模型,且版本迭代速度加快。Grok比DeepSeek晚发布约一个月,预计豆包、Anthropic等企业也会发布新模型。
从模型本身来看,去年下半年大语言模型的Scaling Law接近极限,但目前推理模 型的 Scal ing L aw 才刚刚起步,这也是版本迭代井喷的原因之一,预计2025年还会出现大量新的模型版本。此外,DeepSeek 公开了强化学习(RL)这一技术路线,但它并非唯一可行路线。 此前还有过程奖励、蒙树等不同技术路线,以及无需思维链的隐式推理技术路线等,这些技术路线仍在探索中,RL是首个跑通的,但不意味着只有它可行。
基于大量新推理模型和 新技术路线的探索,当考虑将其落地到企业进行部署时,鉴于模型版本不断迭代更新,建 议企业采取由浅入深、逐步推进的方式落地推理模型。以下列出四条由浅入 深的路径:
1. API接入 :这是最基础的方式,目前许多央企已在企业内部即时通讯(IM)中嵌入推理模 型,采用类似微信对DeepSeek进行灰度测试的模式。采用API接入,一是速度快,能迅速完成部署;二是可实现全员使用。相较于之前接入大厂API需高额付费,接入R1虽仍需 付费,但金额大幅降低,所以多数企业选择从API接入起步。
2. 本地化部署结合知识库RAG :这是上一波大语言模型落地较为通用的方式,目前仍广泛应用于企业内部,尤其在金融机构和央企中。不过,各企业部署的R1版本有所不同,少数采用6000亿参数版本,多数采用蒸馏后的千问32B版本。
3. 对知识库RAG中的提示词工程进行精细化处理 :部分企业会将基于思维链的提示词单独提取出来,做进一步精细 化处理。当前多数企业推进速度最快也就到这一步,也是较为理想的实施阶段。完成前三步后,一方面,全员参与使用有助于拓展新应用场景,企业在部署模型后,更关注投资回 报率(ROI)及能否开拓新场景,通过全员探索自下而上的方式较为有效;另一方面,继续深 入则不可避免涉 及监督微调(SFT)和模型蒸馏。由于推理模型不断涌现,难以保证三个月后R1模型不因自身迭代或新厂商模型的出现而被超越,这就可能需要重新进行SFT。






请到「今天看啥」查看全文