发布 Qwen3，阿里云拉开新一轮开源模型竞赛的序幕

极客公园 · 公众号 · 科技媒体 · 2025-04-29 15:18

主要观点总结

Qwen3是阿里云开源的新一代通义千问模型，性能全面超越R1、OpenAI-o1等全球顶尖模型，参数量仅为DeepSeek-R1的1/3，成本大幅下降。它包含多个型号，其中旗舰型号Qwen3-235B-A22B具有混合推理模式和Agent能力。混合推理模式可根据问题所需的推理预算灵活调整思考长度。此外，Qwen3还支持MCP协议，具有强大的工具调用能力。阿里的AI战略重视AI基础设施建设以及与阿里其他应用的结合，Qwen模型的选择旨在满足开发者和B端用户的部署需求。

关键观点总结

关键观点1: Qwen3的性能全面超越R1、OpenAI-o1等模型

Qwen3是阿里云新发布的一款开源模型，其性能在多个评估中均表现出超越其他顶尖模型的表现，如AIME25测评中获得81.5分的高分。

关键观点2: Qwen3的参数量仅为DeepSeek-R1的1/3，成本大幅下降

相较于其他顶尖模型，Qwen3的参数量更低，意味着其部署和使用的成本大大降低，更加符合实用性和经济效益的需求。

关键观点3: Qwen3具有混合推理模式和Agent能力

Qwen3不仅具备强大的推理能力，还能像人一样进行思考和行动。它支持混合推理模式，可以根据问题所需的推理预算灵活调整思考长度。此外，Qwen3还具备Agent能力，可以像智能助手一样为用户提供服务。

关键观点4: Qwen3支持MCP协议和强大的工具调用能力

Qwen3原生支持MCP协议，具备强大的工具调用能力，可以方便地调用各种工具来完成任务。这大大提高了模型的实用性和效率。

关键观点5: 阿里的AI战略重视生态建设与应用结合

阿里的AI战略不仅追求模型技术的领先性，还重视生态建设与应用结合。Qwen模型的发布是阿里云在AI领域的重要布局，旨在满足开发者和B端用户的部署需求。

正文

请到「今天看啥」查看全文

Qwen3 包含 2 个 MoE 和 6 个密集模型，阿里云开源了两个 MoE 模型的权重，六个 Dense 模型也已开源，包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B，均在 Apache 2.0 许可下开源。

Qwen3 开源模型家族

其中，旗舰型号 Qwen3-235B-A22B 参数量仅为 DeepSeek-R1 的 1/3，成本大幅下降，性能全面超越 R1、OpenAI-o1 等全球顶尖模型，登顶全球最强开源模型。

此外，据阿里云官方介绍， Qwen3 是国内首个「混合推理模型」 。「快思考」与「慢思考」集成进同一个模型，对简单需求可低算力「秒回」答案，对复杂问题可多步骤「深度思考」，大大节省算力消耗。

Qwen3 在推理、指令遵循、工具调用、多语言能力等方面均大幅增强，创下所有国产模型及全球开源模型的性能新高：在奥数水平的 AIME25 测评中，Qwen3 斩获 81.5 分，刷新开源纪录；在考察代码能力的 LiveCodeBench 评测中，Qwen3 突破 70 分大关，表现甚至超过 Grok3；在评估模型人类偏好对齐的 ArenaHard 测评中，Qwen3 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。

性能大幅提升的同时，Qwen3 的部署成本还大幅下降， 仅需 4 张 H20 即可部署千问 3 满血版，显存占用仅为性能相近模型的三分之一。

Qwen3 性能｜图片来源：阿里云

此外，小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%，表现更胜一筹，甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

据介绍，Qwen3-235B-A22B 是一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型；Qwen3-30B-A3B 则是一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。

得益于在预训练、大规模强化学习和推理模式整合方面取得的显著进展，Qwen3 主打「思考更深、行动更快」，更好地构建 AI 应用。Qwen3 预训练数据量达 36T，并在后训练阶段多轮强化学习，将非思考模式无缝整合到思考模型中。

值得注意的是，这次 Qwen3 的发布，主打混合推理，但是需要思考的长度最短也是 1024tokens，否则如果问题所需要的推理预算用不满 1024tokens，根本感受不到可以调节精度的混合推理模型的好。也就无法发挥用 Qwen3 不同程度的思考，灵活满足 AI 应用和不同场景对性能和成本的多样需求。

截图来源：X

大模型全面转向

「混合推理模型」和「Agent」

在 Qwen3 发布的前一天，X 平台已有「行业人士」——日本的大模型厂商 SakanaAI 的一位工程师敏锐地捕捉到了 Qwen3 的重点。当天，在 AI 领域最重要的学术会议之一 ICLR 2025 的一个工作坊上，阿里云通义实验室通义千问负责人林俊旸透露了 Qwen 的下一步方向：推理模型和非推理模型的统一，以及面向 agent 的大模型。