专栏名称: 深网腾讯新闻
《深网》是一档原创深度报道栏目,挖掘TMT领域热门公司、事件和人物中的隐秘故事,探究背后的深层逻辑。
目录
相关文章推荐
新华社  ·  这些“课堂”,藏着不少“坑”! ·  昨天  
现代快报  ·  孟子义工作室发严正声明 ·  昨天  
人民日报  ·  ​【夜读】最好的感情,是双向奔赴 ·  昨天  
三弄2023  ·  20250611三弄有事,联播解读明天补上 ·  2 天前  
51好读  ›  专栏  ›  深网腾讯新闻

狂潮30天,DeepSeek改变了谁?

深网腾讯新闻  · 公众号  · 社会  · 2025-02-19 18:05

正文

请到「今天看啥」查看全文


2024年12月28日,DeepSeek V3模型发布后的第三天,OpenAI创始人萨姆·奥尔特曼在社交媒体评论称,DeepSeek能够以低价算力提供这样的服务令人惊讶。OpenAI将暂停一些新的发布,拥有一个新竞争对手令他感到兴奋。

1月31日,他在Reddit论坛回复网友问题时提到,DeepSeek的出现改变了过去几年OpenAI遥遥领先的情况。

2月7日,OpenAI宣布公开最新模型o3-mini系列模型的思维链(并非完整版),即让用户看到模型是如何推理思考的,而此前,出于竞争考虑,OpenAI没有完全公开o3-mini及其前身(o1和o1-mini)的推理步骤,仅向用户提供推理摘要。

DeepSeek对美国资本市场带来了冲击,甚至引发了美国政策制定者、硅谷科技巨头及创业公司的关注。

美国总统特朗普1月27日在迈阿密发表讲话时称,DeepSeek模型高效且经济,其出现是一种积极的发展,也给美国相关产业敲响了警钟。美国需要集中精力赢得竞争。

微软首席执行官萨提亚·纳德拉1月27日在瑞士达沃斯世界经济论坛表示,应当非常、非常认真地对待来自中国的这些技术进展。

Anthropic是亚马逊投资的一家AI创业公司,它是OpenAI的直接竞争对手。Anthropic CEO达里奥·阿莫代伊(Dario Amodei)1月撰文称,一个公正的说法是,DeepSeek生产出了一款性能接近美国七个至十个月前模型的模型。它的成本大幅降低,但远未达到人们所说的比例。DeepSeek-V3并非一项独特的突破,也没有根本改变大模型的经济规律。它只是持续成本降低曲线上一个可预期的成功。但这次不同之处在于,第一个降低预期成本的是中国公司。这在以前从未发生过,并且具有地缘政治意义。

一位曾在硅谷和欧洲从事多年科技投资的人士向《财经》评价,DeepSeek之所以能在美国科技圈引发地震,主要有三方面因素:一是DeepSeek本身的技术进步,用低成本实现高性能,且不断有新的优化版本出现;二是开源,过去中国在世界科技领域的信任度是被美国所限制的,但开源是透明的,透明就意味着信任,且开源意味着大家都能用,越多人用,就越多人相信这个模型的实力;第三,DeepSeek的出现,颠覆了美国科技公司对AI领域的预设,他们开始反思并调整动作。“我们曾一度认为AI是一座大山,大家努力往上顶爬,现在或许应该思考,AI可能是大海,有很多方向可以探索。”

DeepSeek带来的影响不止在美国科技圈,前述投资人提到,近期所有的相关会议里,DeepSeek都变成了最重要的议题。欧洲和印度的一些创业者和投资人,过去认为大模型是只有中国和美国能做的事,他们不太敢投入,现在大家都好像有了底气,也都在尝试进入这一领域。

在中国,此前大模型行业主要有两类玩家,一是科技大厂们,包括字节跳动、百度、阿里巴巴、腾讯、华为等,它们大多拥有相对完整的AI生态,战略上重视大模型,人才储备和资金实力强大。二是AI创业公司,最具代表性的是“六小虎”——智谱AI、百川智能、月之暗面、Minimax、阶跃星尘、零一万物,它们都拿到了巨额融资,各有发展侧重。

这个春节,DeepSeek狂潮的出现,两类玩家陷入压力之中。

所有大厂中,字节旗下的豆包感受到的冲击感相对强烈。在DeepSeek出现之前,豆包App是中国活跃用户量最高的生成式AI应用。多位字节人士曾告诉《财经》,字节对大模型的投入“不设限”,几乎是字节内部的“一号工程”。整个豆包团队,包括研发、解决方案和商务,人员数量约2000人-3000人,且不少人员都是加了50%甚至1倍的薪资,从其他大厂里挖来的。字节对于大模型业务的要求是要做到“全面领先”。

豆包用高成本堆积的C端领先优势,被DeepSeek用一个月的时间超过了。2月5日,DeepSeek移动端上线26天,日活用户数突破4000万。前述字节人士表示,在B端用户那里,DeepSeek起到了很好的推广效应,近期有不少企业主动来要求推动豆包AI合作。但提到对C端应用的影响,他说,“内部打击不小。”

多位行业人士提到,大厂很难做出突破性创新,更常见的路径是,小团队做出成果,大厂再通过投资、收购,或是复制、优化的方式来跟进,并扩大创新的商业价值。

另一大型科技公司的一位中层人员向《财经》提到,以目前AI技术的进程来看,AI领域里还有很多未知的可能性,但他所在公司的管理层早早就下了判断,包括“不卷模型,要卷应用”“闭源才是未来,开源价值不大”等。且公司定期会有员工考试,考试的题目就包含了这些判断,员工必须“答对”。公司认为这样能够实现“战略对齐”。

但从现在的局面来看,他觉得有点“被打脸了”。

大厂虽然人才储备丰富,但涉及多项业务和层级,层级汇报、不同业务部门的沟通协作都会消耗时间精力。DeepSeek的母公司幻方做的是量化投资,是天然的AI大模型应用场景,业内认为,技术研发和应用场景的联动,是有效提升技术实力的方式之一。前述大厂人士提到,他所在的核心业务部门曾多次向大模型团队提出合作,但都没有收到积极反馈。

DeepSeek出圈后,大量客户在询问云厂商的一线销售人员,DeepSeek何时可以上架。过去,销售人员为了业绩通常会对客户说,自家模型表现最好。如今,客户质疑随之而来,一线销售人员很难回答这个问题。

销售人员把这些质疑也抛给了技术团队——为什么你们无法开发出客户真正需要的技术?某国际云厂商的一位中国区销售人士向《财经》评价,自家模型在公开测评中得分与DeepSeek差距很大。这款去年底发布的自研大模型曾被寄予厚望,但如今已悄无声息。这家云厂商的销售人员私下已经开始了小范围的讨论和反思,这些复盘并未上升到公司层面。

类似情况在一家中国头部云厂商内部也存在。一位中国头部云厂商架构师最近压力很大,现有的模型不如DeepSeek-R1,但客户又对R1非常感兴趣。前线的压力逐渐传递到了后方产研团队。产研团队可以承认DeepSeek的技术创新,却不愿承认自己技不如人。

对比大厂,创业公司相对更灵活也更扁平,但有其他阻力。

一家成立超过七年的AI公司创始人很佩服DeepSeek敢于投入的勇气。他的感受是,虽然业内很多公司都拿到高融资,宣称大举投入,但实际很少有创业公司真正花了大价钱去做大模型的基础研发。“大家花的不是自己的钱,烧这种量级的钱还是谨慎的。”

此前,一位英伟达的长期合作伙伴告诉《财经》,过去两年密集购买英伟达GPU的中国公司主要是自身有业务需求的大厂,包括阿里巴巴、腾讯、字节跳动、百度等,创业公司很少。有一些知名大模型创业公司会主动要求和他建立战略合作关系,以此来对外证明自己在投入算力,“不给钱的那种”。

大模型太烧钱,即使是以低成本著称的DeepSeek在前期的投入也很难估量。第三方机构SemiAnalysis推算,DeepSeek实际拥有庞大的算力储备:共堆砌了6万张英伟达GPU卡,其中包括1万张A100、1万张H100、1万张“特供版”H800以及3万张“特供版”H20。

按照行业传统,中国AI创业公司还有一个大掣肘因素——创业公司拿到融资后,就不得不去考虑股东回报,这需要逐步抬高公司估值,而估值越高,IPO(首次公开募股)的时间表就越紧急。这意味着,一个AI创业公司拿不到融资甚至没理由活下去,但一旦拿到第一笔融资,就被上了发条,为了上市而草草商业化。

大模型领域对算力和数据的高投入,一度被认为是影响创业公司估值的障碍。一方面,创业公司很难在这些投入上和大厂抗衡,投入看不到上限。另一方面,这会让创业公司变成一家重资产公司。

大多数中国科技公司一开始就会将重心放在闭源模型上,因为行业的普遍预判是AI商业化应用主要集中在B端,而核心的企业客户需要闭源模型,甚至需要本地化部署。

物理AI仿真系统开发商松应科技CEO聂凯旋告诉《财经》,DeepSeek的开源模式一定程度上规避了这个矛盾。开源比闭源的模式成本低且进步速度快,“DeepSeek没有做特别多架构性的创新,应该说它是在借鉴开源的基础上,对模型能力做了比较陡峭的升级”。

生态:聚拢效应正在形成

无论大公司小公司,之前要赢,是高成本的赢;现在,所有人都有可能低成本赢,这是生态的本质

DeepSeek两款模型V3/R3是开源的,任何人都可以下载、部署、使用,这也是它能够快速获得讨论度的核心原因之一。

大年初一,正在丈母娘家吃团圆饭的华为工程师张飞飞(化名)被拉进一个电话会,新的动作在这次会上被部署:“准备安排加班,我们现在就要开始接入DeepSeek V3。”四天后,所有团队成员就位。他们的目标是一季度就要完成所有的适配工作。

阿里云资深工程师徐陵(化名)所在团队在年前就已经多次开会讨论了。他透露,2025年开年以来自己“所有工作都是在围着DeepSeek转。”他评价,DeepSeek的技术路线并不是独一无二的,各家大厂都有类似的产品,但DeepSeek目前展示出的工程能力确实很强。所谓工程能力,包括但不仅限于训练成本效率、模型性能和技术创新能力。







请到「今天看啥」查看全文