正文
这直接打在了原来那种「闭环型自研」的路线要害上。很多大厂花大钱训练的模型,在 DeepSeek-R1 面前变得毫无优势——不是能力不行,而是「性价比不行」:你没法再说「自研比别人更强」,因为别人把过程全开了,而且你追上也要几个月;你也没法说「闭环护城河更高」,因为别人三两天就能基于 DeepSeek-R1 搭个 demo,甚至用它打磨出产品。
这种「开源即能力平权」的冲击,不只打到了大厂,也打乱了 AI 小龙们的节奏。以面壁、百川为代表的「小模型派」,原本还希望在训练效率和推理速度上做文章,现在发现 DeepSeek 直接掀了桌子,把效率和能力统统平衡好了,而且是白送的——这让「闭源商业化」变得更加困难。
行业由此进入了一段显著的「战略迷茫期」:
大厂
开始重新评估自研的价值:是否还值得烧钱去追一个很可能被开源赶超的模型?是否应该把精力转向「拼装模型能力+打造 AI 原生应用」的组合打法?
AI
小龙们
则面临最直接的生存压力:原来讲闭源、讲技术栈的优势正在消失;大厂又开始加速从开源模型中「拿货」,对它们的合作需求也在下滑;只能重新找定位,要么抱团,要么找「差异化垂直场景」。
投资人
也在重新审视项目价值:一个大模型初创公司如果没有特别的创新机制或生态合作资源,其估值逻辑就会受到挑战。
总之,DeepSeek 不是推出了一个强模型这么简单,它更像是一次「范式洗牌」:用极致透明和开源方式打破旧有路径依赖,把「自研大模型闭环」从主流选项变成了一个「代价极高」的冒险。这个时刻之后,谁能快速认清现实,找到新生态位,谁才有可能留在下一轮的牌桌上。
DeepSeek 带来的冲击在持续发酵时,整个行业一开始是懵的,迷茫、不确定、不知所措。大家都知道这是一次系统性冲击,但具体要怎么应对、往哪儿走,其实那时候没有明确答案。
但从 2 月下旬开始,情况慢慢变了。大厂开始陆续有所动作,新的叙事也浮出水面。一句话总结就是:战略重心从去年强调「应用先行」「超级 App」的落地路线,重新回到了「AGI 优先」的轨道上。
这轮转向有几个关键的变化。
第一个变化是目标清晰了。过去讲 AI 应用的时候,很多公司都停留在「做一个超级 App」的层面,比如搞一个 AI 助手、一个 AI 搜索或者 AI 办公工具。
但现在,在字节与阿里最新的对外表达中,都明确把「冲刺 AGI」作为最核心的目标。
在 2 月的全员会上,字节 CEO 梁汝波曾表示:「智能水平是最重要的,要把提高智能本身当成最重要的目标,而不是某个产品的 DAU。」
3 月,豆包大模型部门召开全员会,明确部门的最重要目标是探索智能上限;同时强调进一步加强组织文化,提高技术开放程度,并考虑推进开源。
「Seed Edge」是字节豆包大模型团队在年初组建的 AGI 长期研究团队,鼓励探索更长周期的 AGI 研究课题,如推理能力、感知能力、软硬一体化等。
这个项目强调「宽松的研究环境」和「长周期考核」,为入选课题提供独立算力支持,体现了字节对 AGI 的长期布局。
Seed Edge 的目标是探索 AGI 的新方法,鼓励跨模态、跨团队合作,目前初步确定了五大研究方向,包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代 AI 学习范式、探索下一个 scaling 方向。
可以看出,字节正在为通向 AGI 的下一阶段做技术储备。
2025 财年财报后的电话会上,阿里 CEO 吴泳铭首次明确提出 AGI 是阿里 AI 战略的核心目标,甚至用了「AI 将影响全球 50% GDP 结构」这样激进的表述。
这也意味着,阿里正在从强调「云+模型」服务能力,逐步走向更高层次的通用智能探索。
第二个变化,是对「开源」和「模型选择」的态度发生了实质变化。过去讲模型、做应用时,往往强调「全链路自主可控」,什么都要自己来。但现在,尤其是腾讯和百度,看起来越来越强调实用主义导向:谁的模型能力强就接谁的模型,应用产品的目标是用户满意、场景落地,而不是一定要套用自家大模型。
这背后,其实是每家公司在重新厘清自己的生态位——它在
AI
时代扮演什么角色,它的核心竞争力到底在哪里。
阿里的反应看起来「稳」一些,或者可以说是延续之前的节奏。
因为阿里在大模型上的投入本身就走在了开源路线的前列。通义千问(Qwen)系列在海外和开源社区持续表现强劲,Qwen2.5-Max 一度号称性能超越 DeepSeek-V3,而 4 月底刚开源的 Qwen3,不仅成本显著降低,性能更是反超 DeepSeek-R1 和 OpenAI-o1,登上开源模型榜首。阿里的打法很明确:先用模型性能证明自己,再用开源吸引全球开发者,把生态「引进来」。