专栏名称: AI科技评论
点评学术,服务 AI !
目录
相关文章推荐
九章算法  ·  6月LeetCode刷题小分队正式开始啦:刷 ... ·  9 小时前  
Java知音  ·  SpringBoot 实现接口防刷的 5 ... ·  昨天  
Java知音  ·  SpringBoot 实现接口防刷的 5 ... ·  昨天  
算法与数据结构  ·  惊艳我的 LRU ... ·  4 天前  
算法爱好者  ·  马云罕见回应!阿里 15 ... ·  4 天前  
九章算法  ·  「九点热评」谷歌正式冻结招聘! ·  3 天前  
51好读  ›  专栏  ›  AI科技评论

关于 DeepSeek 一体机落地真相,我们调研了 12 家上市公司

AI科技评论  · 公众号  ·  · 2025-04-11 18:03

正文

请到「今天看啥」查看全文


困住客户的不止于此:市面上还有厂家售卖的所谓一体机,只是“计算平台+推理框架+预装大模型”,没有智能体平台、没有操作界面,仍是开发机;有的厂家打着满血版的名义,却给客户部署蒸馏的模型;还有的厂家,四处东拼西凑出一体机,交付时却不负责调优应用。用户迷茫,做快生意的厂家却盆满钵满。
供给市场鱼龙混杂,一个重要原因是,前期一体机的利润不容小觑。“硬件成本下探空间小,软件长期服务更盈利”这套一贯的逻辑,用在DeepSeek一体机市场里还不够全面。有知情人士透露,得益于前几年英伟达H20囤卡风潮,此次一体机早期硬件利润不低,一台满血版的H20一体机,整体利润率可达30%。
不过,多位业内人士反映,这一利润率已在下降。(一体机背后利润几何?可添加作者微信 Ericazhao23 交流)
选对厂商只是第一步,此后还有一系列问题摆在用户面前:满血版还是蒸馏版?国产卡还是H卡?训推一体机还是推理一体机?具体切入什么场景?
每一关都是信息博弈,且每个A和B之间的抉择,成本也相去甚远。

咨询时都要满血版,落地时50%交付蒸馏版

满血版,是许多用户的第一个执念——领略过 DeepSeek-R1 的表现后,大家由奢入俭难。

但满血版在单台一体机上的性能到底如何,目前存疑。 用单台八卡英伟达H20,基于推理框架优化能让模型顺利运行,但性能会有一定损失。还有使用国产芯片的厂商表示,在 DeepSeek “话很多” 的情况下,一个问题的答案可能要五分钟才能吐完。
而价格上,满血版DeepSeek一体机一般在150万上下,内置国产芯片的还会更高。DeepSeek一体机国产卡的配置,目前以华为昇腾、沐曦、海光较多,但由于国产卡的显存资源和性能仍稍差,一般要部署至少两台才能把满血版跑起来,预算将近四百万。这对于规模较小或处于起步阶段的企业而言,有些吃亏。
但其实,并非所有人都需要满血版。
优刻得(UCloud)新兴产业事业部首席架构师李天朋观察到,现阶段许多用户是想把DeepSeek部署用在企业内部的智能问答场景中,预算三四十万的32B、70B等蒸馏版模型,已能满足需求,响应速度还会更快。他统计后发现, 最后实际交付时,满血版和蒸馏版模型比例大概五五开。
而对于什么样的用户需要满血版,他总结道:一类是对模型泛化能力要求高的客户,比如把 DeepSeek 用在对外服务上,面向大量用户;还有成本足够、希望在本地大规模部署的客户;以及希望借助 DeepSeek 模型优化内部算法来提升性能的客户,比如用来校准交易策略模型。
除此之外,大模型在业务里的“开疆扩土”,也可以交给满血版。云天励飞副总裁罗忆说道,开拓一个新业务时,要先让一位“老法师”把业务跑通,才能安排能力合适的下属在具体岗位上维系日常运转,同理,对业务闭环有高要求的用户,可以先用满血版把业务跑通,再安置不同的小尺寸模型在合适位置上。

训推一体机价格高昂,并非必要采购

而在引入大模型时,有传统企业用户希望训练自己的模型,于是摩拳擦掌看向训推一体机——其价格显著高于推理一体机。然而,在李天朋看来,这对大部分用户来说都不太必要。

他向雷峰网指出, 纯训练所占的资源至少是纯推理的两到三倍,但 DeepSeek 的颠覆性恰恰在于推理算力需求的大幅下降,这让训推的成本悬殊更大 ——
DeepSeek 如果想跑训练,对底层硬件要求非常高,需要大显存和高容量存储系统等计算资源;然而,由于模型本身的高度稀疏性,在后续推理中,大规模储备的计算资源又会面临浪费。
并且,大部分用户真实使用时,训练周期相对推理周期非常短,早期的训练需求可以寻求算力厂商或云厂商租赁资源。除非是有行业知识的垂直领域客户——如医院、法律和金融行业——希望用 RAG 训练微调 DeepSeek ,对模型后期训练有更高要求,下重本选训推一体机会更划算。

落地场景纷繁, 业务适配、技术运维有门槛

本次一体机的部署流程,深信服云计算BG AIC智能计算产品线总经理郜振锋总结到,用户一般先小规模采购一批设备部署私有化模型,配提示词问答和搭内部知识库系统,AI起步后,再考虑耦合到原来业务系统。

目前,DeepSeek 直接接入 WPS 、企业助手或客服问答场景的频次最高。但在行业人士看来,普通企业或许没有必要花这么大成本去“维护”这些数据,加密存储和云服务的安全措施已能满足需求。
而真正对一体机采购有刚需的,首当其冲是军工院所。其次是高端制造业,比如苹果、华为的供应链,应用于生产流程优化、高精度的缺陷检测等——去到这类场所拜访时,手机和电脑的摄像头都得贴起来,离开时若发现贴的纸张有撕过的痕迹,设备就会被没收,其对安全性的高需求可见一斑。
政府也是此次部署的重要参与者,部分还会通过发函的形式先行先试。这波AI探索中,各部门几乎都站上了起跑线。有厂商与政府合作的项目正在被赶着交付,因为“内部业务都催着要用”。
目前在政府侧,智算一体机的主要用途之一是公文生成和政务服务,如政务审批、咨询场景。例如,深圳福田就已在 DeepSeek 政务大模型基础上,上线70名“数智员工”,缩短公文审核时间 90%。而此前在信息领域已有积累的数据局和公安部门,需求相对更明确“激进”——例如,公安部门的 DeepSeek 部署已能应用在预警、接警等环节中,帮助完成警情分类,或风险防控、侦查打击等。
金融、医疗等行业也是更明确自己一体机需求的用户,有客户会一次性提十台八卡一体机。






请到「今天看啥」查看全文