正文
2025年1月27日DeepSeek超越ChatGPT,登顶中国区和美国区苹果APP Store免费榜,引发全球关注。让DeepSeek有如此成就的是其推理大模型DeepSeek-R1。根据DeepSeek公布的信息,R1在多项权威测试中得分与o1正式版接近,部分测试中得分还超过o1正式版。
榜单评分外,开源+性价比则是让DeepSeek引发泼天热度的重要组合拳。受到DeepSeek的冲击,曾经的闭源信徒百度创始人李彦宏也宣布加入开源队伍,OpenAI创始人山姆.奥特曼也反思道,公司在开源领域的策略上一直处于“错误的一方”。
大模型“六小龙”中的MiniMax在1月15日发布了首个开源模型,其创始人闫俊杰在接受《晚点》采访时也表示,“第一次创业很多经验不具备,如果可以重新选,应该第一天就开源。”其他五小龙中,只有智谱是最早开源闭源两条腿走路的。经过近两年的摸爬滚打后,“六小龙”发展方向已南辕北辙。
零一万物是第一家公开大幅调整的基础大模型公司,先是裁撤了预训练算法团队和Infra团队,部分人员以跳槽形式加入阿里,后宣布与阿里云、苏州高新区分别联合成立产业大模型联合实验室、产业大模型基地。
人员方面,模型训练负责人黄文灏、负责大模型API开放平台的蓝雨川、生产力产品负责人曹大鹏都相继离职。试图留在牌桌上的零一万物,掩盖不住在这一轮大模型竞赛中的颓势。
百川智能则在2024年明确了走医疗赛道,近期上线了首个“AI儿科医生”。在To B的商业化上百川则似乎不太顺利,其联合创始人、商业化负责人洪涛年前已经离职。据百川一位员工告知的确不及预期,“现在有了DeepSeek后,今年的压力只增不减。”
To B商业化负责人离职的还有MiniMax的魏伟,此前魏伟接受采访时表示,很多B端客户不会轻易掏这个钱,去支撑大模型公司的营收,只能基于研发能力、算法能力来帮助客户在实际场景中对齐输出效果,也印证了大模型商业化并非易事。
如此看来,仍在专注于大模型技术创新和追求AGI的,仅剩下月之暗面、智谱、阶跃星辰。受到DeepSeek的影响,阶跃星辰也加入了开源阵营,只是与DeepSeek重点在文本模型上不同的是,阶跃星辰最新开源的是两款多模态模型——Step-Video-T2V、Step-Audio。
2月23日凌晨,月之暗面发布最新论文《Muon is Scalable for LLM Training》,并开源MoE模型Moonlight,模型激活参数仅需3B。不少业内人士认为这是在“截胡开源周”,因为早前DeepSeek宣布将连续5天发布开源项目。
对月之暗面而言,火烧眉毛的或许是其大手笔投流的Kimi产品。
烧钱投流难成榜一大哥
与大模型“六小龙”一样DeepSeek也有同名C端产品,在上线后的第一周并没有在市场上引起过多的关注。据QuestMobile向媒体披露的数据显示,2025年1月13日至1月19日,DeepSeek App周下载量仅为28.5万,远不及豆包(452万)以及Kimi(155.7万)。
在2025年1月20日R1发布后,DeepSeek下载量开始陡峭式增长,Sensor Tower研究显示DeepSeek在发布会18天内下载量超1600万次,几乎是OpenAI的ChatGPT首次发布时的900万次的两倍。
访问量激增,一度让DeepSeek闪崩,而即便如此,增长的势头依然很猛,月下载量超1.1亿。DeepSeek的光芒再也没有哪家可以视而不见,2月13日字节跳动内部全员会上,CEO梁汝波谈及DeepSeek时,反思跟进速度不够,今年要追求智能上线。