国产大模型「五强争霸」，决战AGI！

大模型智能 · 公众号 · · 2025-05-16 00:00

正文

阿里：开源王者，全球第三

阿里以「开源王者」的独特定位，不仅在国内市场占据重要席位，更在全球AI开源生态中，稳居全球TOP 3模型贡献者。

斯坦福2025年人工智能指数报告

可以说，阿里是国内过最开源自研LLM互联网巨头，也是全球唯一一家实现「全尺寸、全模态」开源的云计算厂商。

可以说，作为开源最早、最完整的大公司，阿里在AI的投入上最坚决，也是如今布局最全、最先赚到钱的中国互联网大厂。

自2023年以来，通义团队累积开源200+模型，涵盖了千问（Qwen）大语言模型和万相（Wan）视觉生成模型两大基座系列。

这些模型覆盖了文本生成、视觉/语音理解生成、文生图，以及视频生成等全模态，参数规模从0.5B到235B不等，跨越119种语言及方言。

两年前，国内LLM市场尚处于「百模」混战阶段，阿里率先将Qwen-7B开源，吸引了全球开发者的关注。

截至目前，Qwen全球下载量超3亿，衍生模型数量超10万，超越Llama成为全球第一开源模型。

在Hugging Face社区，2024年Qwen系列占全球模型下载量的30%以上，稳居第一。

25年2月，Hugging Face全球开源大模型榜单中，排名前十开源模型全部基于Qwen二次开发

在这场「烧钱」的游戏中，未来三年，阿里还将投入3800亿元用于AI研发，用于云和AI硬件基础设施，总额超过去十年总和。

这一投入规模在国内互联网公司中首屈一指，恰恰展现了阿里在AI赛道上的战略决心。

相较于其他大模型玩家，阿里凭借成熟的商业化路径和广泛的客户基础，率先实现了投入到回报的闭环。

截止2025年1月底，通过阿里云百炼平台调用通义大模型API的企业已超过29万。

字节：巨型航母，重回创业

字节的大模型以「综合能力强」为特色，覆盖了文本生成、图像理解、视频生成、语音处理等多模态领域。

在这场技术与资源的巅峰对决之中，字节不仅在自研大模型和AI应用领域，展现出了「凶残的战斗力」。

目前，字节旗下的AI应用超20多款，爆火核心产品「豆包」凭借其强大文本生成和多模态能力，迅速占领用户心智，月活用户超1亿。

视频生成工具「即梦」也被赋予了更高的战略优先级，已在虚拟偶像、电商直播等领域，实现商业化落地。

同样，字节在AI编程领域不敢落后。他们推出的AI编程工具Trae，直接对标Cursor等AI集成开发环境。

在企业服务方面，基于豆包大模型，火山引擎「飞连」也在多场景落地AI应用等。

字节的全面布局，还体现在其生态整合能力上。通过抖音、今日头条、飞书等平台，字节将大模型嵌入到内容推荐、协同办公中，形成了技术到应用的生态闭环。

而如今，字节以「巨型航母重回创业」姿态，凭借雄厚资金、超高人才密度、多方向全面布局，成为中国AI赛道领跑者之一。

阶跃星辰：低调的大模型国家队

跟其他家相比，阶跃星辰可以算是这五强中最低调的大模型国家队了。

可以说，阶跃星辰是生于上海、长于上海的国家队。2024年底，阶跃星辰完成了总额达数亿美元的融资，核心投资方包括上海国有资本投资有限公司及其旗下基金，战略和财务投资人包括腾讯投资、五源资本、启明创投等。

如今，才成立2年的阶跃星辰，已累计发布22款自研基座模型，覆盖文字、语音、图像、视频、音乐、推理，其中有16款是多模态模型，性能领跑全行业，成为行业内公认的「多模态卷王」。

其中，Step-1o Vision便在2025年初分别在知名大模型竞技场Chatbot Arena和国内权威评估平台「司南」（OpenCompass）中，分别拿下了视觉领域中国大模型第一，以及多模态模型榜单第一的成绩。

更难得的是，阶跃星辰的多模态矩阵既全面，又在全行业领先。要知道，多模态模型的核心，就是综合能力，既要求语音、图片、视频多个模态的能力，又要求模型能理解、生成、推理。在此布局上，阶跃星辰的每条线都达到了第一梯队。

而多模还有一大难点，就是融合过程中不能损失单个模特的性能，尤其不能降智。而阶跃星辰采取了原生多模的方式，在此方面经验独到。

在阶跃星辰看来，多模态是通往AGI的必经之路。随着多模态交互和推理的融合愈加成熟，更多Agent会在智能终端上涌现。

现在，阶跃星辰正在发力彻底解决视觉领域根本难题——表征和对齐的基础问题，也即「predict next frame」。