专栏名称: 极客公园
科技创新者的大本营。汇聚优秀的产品报道、评测视频和高质量的线下活动。
目录
相关文章推荐
51好读  ›  专栏  ›  极客公园

中国 AI 大厂,被 Deepseek 掀了牌桌之后

极客公园  · 公众号  · 科技媒体  · 2025-05-19 12:18

正文

请到「今天看啥」查看全文


这直接打在了原来那种「闭环型自研」的路线要害上。很多大厂花大钱训练的模型,在 DeepSeek-R1 面前变得毫无优势——不是能力不行,而是「性价比不行」:你没法再说「自研比别人更强」,因为别人把过程全开了,而且你追上也要几个月;你也没法说「闭环护城河更高」,因为别人三两天就能基于 DeepSeek-R1 搭个 demo,甚至用它打磨出产品。

这种「开源即能力平权」的冲击,不只打到了大厂,也打乱了 AI 小龙们的节奏。以面壁、百川为代表的「小模型派」,原本还希望在训练效率和推理速度上做文章,现在发现 DeepSeek 直接掀了桌子,把效率和能力统统平衡好了,而且是白送的——这让「闭源商业化」变得更加困难。

行业由此进入了一段显著的「战略迷茫期」:

大厂 开始重新评估自研的价值:是否还值得烧钱去追一个很可能被开源赶超的模型?是否应该把精力转向「拼装模型能力+打造 AI 原生应用」的组合打法?

AI 小龙们 则面临最直接的生存压力:原来讲闭源、讲技术栈的优势正在消失;大厂又开始加速从开源模型中「拿货」,对它们的合作需求也在下滑;只能重新找定位,要么抱团,要么找「差异化垂直场景」。

投资人 也在重新审视项目价值:一个大模型初创公司如果没有特别的创新机制或生态合作资源,其估值逻辑就会受到挑战。

总之,DeepSeek 不是推出了一个强模型这么简单,它更像是一次「范式洗牌」:用极致透明和开源方式打破旧有路径依赖,把「自研大模型闭环」从主流选项变成了一个「代价极高」的冒险。这个时刻之后,谁能快速认清现实,找到新生态位,谁才有可能留在下一轮的牌桌上。


02

震荡之后,大厂摸索新方向

DeepSeek 带来的冲击在持续发酵时,整个行业一开始是懵的,迷茫、不确定、不知所措。大家都知道这是一次系统性冲击,但具体要怎么应对、往哪儿走,其实那时候没有明确答案。

但从 2 月下旬开始,情况慢慢变了。大厂开始陆续有所动作,新的叙事也浮出水面。一句话总结就是:战略重心从去年强调「应用先行」「超级 App」的落地路线,重新回到了「AGI 优先」的轨道上。

这轮转向有几个关键的变化。

第一个变化是目标清晰了。过去讲 AI 应用的时候,很多公司都停留在「做一个超级 App」的层面,比如搞一个 AI 助手、一个 AI 搜索或者 AI 办公工具。

但现在,在字节与阿里最新的对外表达中,都明确把「冲刺 AGI」作为最核心的目标。

在 2 月的全员会上,字节 CEO 梁汝波曾表示:「智能水平是最重要的,要把提高智能本身当成最重要的目标,而不是某个产品的 DAU。」

3 月,豆包大模型部门召开全员会,明确部门的最重要目标是探索智能上限;同时强调进一步加强组织文化,提高技术开放程度,并考虑推进开源。

「Seed Edge」是字节豆包大模型团队在年初组建的 AGI 长期研究团队,鼓励探索更长周期的 AGI 研究课题,如推理能力、感知能力、软硬一体化等。

这个项目强调「宽松的研究环境」和「长周期考核」,为入选课题提供独立算力支持,体现了字节对 AGI 的长期布局。

Seed Edge 的目标是探索 AGI 的新方法,鼓励跨模态、跨团队合作,目前初步确定了五大研究方向,包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代 AI 学习范式、探索下一个 scaling 方向。

可以看出,字节正在为通向 AGI 的下一阶段做技术储备。

2025 财年财报后的电话会上,阿里 CEO 吴泳铭首次明确提出 AGI 是阿里 AI 战略的核心目标,甚至用了「AI 将影响全球 50% GDP 结构」这样激进的表述。

这也意味着,阿里正在从强调「云+模型」服务能力,逐步走向更高层次的通用智能探索。

第二个变化,是对「开源」和「模型选择」的态度发生了实质变化。过去讲模型、做应用时,往往强调「全链路自主可控」,什么都要自己来。但现在,尤其是腾讯和百度,看起来越来越强调实用主义导向:谁的模型能力强就接谁的模型,应用产品的目标是用户满意、场景落地,而不是一定要套用自家大模型。

这背后,其实是每家公司在重新厘清自己的生态位——它在 AI 时代扮演什么角色,它的核心竞争力到底在哪里。

阿里的反应看起来「稳」一些,或者可以说是延续之前的节奏。

因为阿里在大模型上的投入本身就走在了开源路线的前列。通义千问(Qwen)系列在海外和开源社区持续表现强劲,Qwen2.5-Max 一度号称性能超越 DeepSeek-V3,而 4 月底刚开源的 Qwen3,不仅成本显著降低,性能更是反超 DeepSeek-R1 和 OpenAI-o1,登上开源模型榜首。阿里的打法很明确:先用模型性能证明自己,再用开源吸引全球开发者,把生态「引进来」。







请到「今天看啥」查看全文