中国 AI 大厂，被 Deepseek 掀了牌桌之后

极客公园 · 公众号 · 科技媒体 · 2025-05-19 12:18

正文

请到「今天看啥」查看全文

这直接打在了原来那种「闭环型自研」的路线要害上。很多大厂花大钱训练的模型，在 DeepSeek-R1 面前变得毫无优势——不是能力不行，而是「性价比不行」：你没法再说「自研比别人更强」，因为别人把过程全开了，而且你追上也要几个月；你也没法说「闭环护城河更高」，因为别人三两天就能基于 DeepSeek-R1 搭个 demo，甚至用它打磨出产品。

这种「开源即能力平权」的冲击，不只打到了大厂，也打乱了 AI 小龙们的节奏。以面壁、百川为代表的「小模型派」，原本还希望在训练效率和推理速度上做文章，现在发现 DeepSeek 直接掀了桌子，把效率和能力统统平衡好了，而且是白送的——这让「闭源商业化」变得更加困难。

行业由此进入了一段显著的「战略迷茫期」：

大厂开始重新评估自研的价值：是否还值得烧钱去追一个很可能被开源赶超的模型？是否应该把精力转向「拼装模型能力+打造 AI 原生应用」的组合打法？

AI 小龙们 则面临最直接的生存压力：原来讲闭源、讲技术栈的优势正在消失；大厂又开始加速从开源模型中「拿货」，对它们的合作需求也在下滑；只能重新找定位，要么抱团，要么找「差异化垂直场景」。

投资人 也在重新审视项目价值：一个大模型初创公司如果没有特别的创新机制或生态合作资源，其估值逻辑就会受到挑战。

总之，DeepSeek 不是推出了一个强模型这么简单，它更像是一次「范式洗牌」：用极致透明和开源方式打破旧有路径依赖，把「自研大模型闭环」从主流选项变成了一个「代价极高」的冒险。这个时刻之后，谁能快速认清现实，找到新生态位，谁才有可能留在下一轮的牌桌上。

震荡之后，大厂摸索新方向

DeepSeek 带来的冲击在持续发酵时，整个行业一开始是懵的，迷茫、不确定、不知所措。大家都知道这是一次系统性冲击，但具体要怎么应对、往哪儿走，其实那时候没有明确答案。

但从 2 月下旬开始，情况慢慢变了。大厂开始陆续有所动作，新的叙事也浮出水面。一句话总结就是：战略重心从去年强调「应用先行」「超级 App」的落地路线，重新回到了「AGI 优先」的轨道上。

这轮转向有几个关键的变化。

第一个变化是目标清晰了。过去讲 AI 应用的时候，很多公司都停留在「做一个超级 App」的层面，比如搞一个 AI 助手、一个 AI 搜索或者 AI 办公工具。

但现在，在字节与阿里最新的对外表达中，都明确把「冲刺 AGI」作为最核心的目标。

在 2 月的全员会上，字节 CEO 梁汝波曾表示：「智能水平是最重要的，要把提高智能本身当成最重要的目标，而不是某个产品的 DAU。」

3 月，豆包大模型部门召开全员会，明确部门的最重要目标是探索智能上限；同时强调进一步加强组织文化，提高技术开放程度，并考虑推进开源。

「Seed Edge」是字节豆包大模型团队在年初组建的 AGI 长期研究团队，鼓励探索更长周期的 AGI 研究课题，如推理能力、感知能力、软硬一体化等。

这个项目强调「宽松的研究环境」和「长周期考核」，为入选课题提供独立算力支持，体现了字节对 AGI 的长期布局。

Seed Edge 的目标是探索 AGI 的新方法，鼓励跨模态、跨团队合作，目前初步确定了五大研究方向，包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代 AI 学习范式、探索下一个 scaling 方向。

可以看出，字节正在为通向 AGI 的下一阶段做技术储备。

2025 财年财报后的电话会上，阿里 CEO 吴泳铭首次明确提出 AGI 是阿里 AI 战略的核心目标，甚至用了「AI 将影响全球 50% GDP 结构」这样激进的表述。

这也意味着，阿里正在从强调「云+模型」服务能力，逐步走向更高层次的通用智能探索。

第二个变化，是对「开源」和「模型选择」的态度发生了实质变化。过去讲模型、做应用时，往往强调「全链路自主可控」，什么都要自己来。但现在，尤其是腾讯和百度，看起来越来越强调实用主义导向：谁的模型能力强就接谁的模型，应用产品的目标是用户满意、场景落地，而不是一定要套用自家大模型。

这背后，其实是每家公司在重新厘清自己的生态位——它在 AI 时代扮演什么角色，它的核心竞争力到底在哪里。

阿里的反应看起来「稳」一些，或者可以说是延续之前的节奏。

因为阿里在大模型上的投入本身就走在了开源路线的前列。通义千问（Qwen）系列在海外和开源社区持续表现强劲，Qwen2.5-Max 一度号称性能超越 DeepSeek-V3，而 4 月底刚开源的 Qwen3，不仅成本显著降低，性能更是反超 DeepSeek-R1 和 OpenAI-o1，登上开源模型榜首。阿里的打法很明确：先用模型性能证明自己，再用开源吸引全球开发者，把生态「引进来」。