主要观点总结
Qwen3是阿里云开源的新一代通义千问模型,性能全面超越R1、OpenAI-o1等全球顶尖模型,参数量仅为DeepSeek-R1的1/3,成本大幅下降。它包含多个型号,其中旗舰型号Qwen3-235B-A22B具有混合推理模式和Agent能力。混合推理模式可根据问题所需的推理预算灵活调整思考长度。此外,Qwen3还支持MCP协议,具有强大的工具调用能力。阿里的AI战略重视AI基础设施建设以及与阿里其他应用的结合,Qwen模型的选择旨在满足开发者和B端用户的部署需求。
关键观点总结
关键观点1: Qwen3的性能全面超越R1、OpenAI-o1等模型
Qwen3是阿里云新发布的一款开源模型,其性能在多个评估中均表现出超越其他顶尖模型的表现,如AIME25测评中获得81.5分的高分。
关键观点2: Qwen3的参数量仅为DeepSeek-R1的1/3,成本大幅下降
相较于其他顶尖模型,Qwen3的参数量更低,意味着其部署和使用的成本大大降低,更加符合实用性和经济效益的需求。
关键观点3: Qwen3具有混合推理模式和Agent能力
Qwen3不仅具备强大的推理能力,还能像人一样进行思考和行动。它支持混合推理模式,可以根据问题所需的推理预算灵活调整思考长度。此外,Qwen3还具备Agent能力,可以像智能助手一样为用户提供服务。
关键观点4: Qwen3支持MCP协议和强大的工具调用能力
Qwen3原生支持MCP协议,具备强大的工具调用能力,可以方便地调用各种工具来完成任务。这大大提高了模型的实用性和效率。
关键观点5: 阿里的AI战略重视生态建设与应用结合
阿里的AI战略不仅追求模型技术的领先性,还重视生态建设与应用结合。Qwen模型的发布是阿里云在AI领域的重要布局,旨在满足开发者和B端用户的部署需求。
正文
Qwen3 包含 2 个 MoE 和 6 个密集模型,阿里云开源了两个 MoE 模型的权重,六个 Dense 模型也已开源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B,均在 Apache 2.0 许可下开源。
Qwen3 开源模型家族
其中,旗舰型号 Qwen3-235B-A22B 参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球顶尖模型,登顶全球最强开源模型。
此外,据阿里云官方介绍,
Qwen3 是国内首个「混合推理模型」
。
「快思考」与「慢思考」集成进同一个模型,对简单需求可低算力「秒回」答案,对复杂问题可多步骤「深度思考」,大大节省算力消耗。
Qwen3 在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,创下所有国产模型及全球开源模型的性能新高:在奥数水平的 AIME25 测评中,Qwen3 斩获 81.5 分,刷新开源纪录;在考察代码能力的 LiveCodeBench 评测中,Qwen3 突破 70 分大关,表现甚至超过 Grok3;在评估模型人类偏好对齐的 ArenaHard 测评中,Qwen3 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。
性能大幅提升的同时,Qwen3 的部署成本还大幅下降,
仅需 4 张 H20 即可部署千问 3 满血版,显存占用仅为性能相近模型的三分之一。
Qwen3 性能|图片来源:阿里云
此外,小型 MoE 模型
Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。
据介绍,Qwen3-235B-A22B 是一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型;Qwen3-30B-A3B 则是一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。
得益于在预训练、大规模强化学习和推理模式整合方面取得的显著进展,Qwen3 主打「思考更深、行动更快」,更好地构建 AI 应用。Qwen3 预训练数据量达 36T,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中。
值得注意的是,这次 Qwen3 的发布,主打混合推理,但是需要思考的长度最短也是 1024tokens,否则如果问题所需要的推理预算用不满 1024tokens,根本感受不到可以调节精度的混合推理模型的好。也就无法发挥用 Qwen3 不同程度的思考,灵活满足 AI 应用和不同场景对性能和成本的多样需求。
截图来源:X
在 Qwen3 发布的前一天,X 平台已有「行业人士」——日本的大模型厂商 SakanaAI 的一位工程师敏锐地捕捉到了 Qwen3 的重点。当天,在 AI 领域最重要的学术会议之一 ICLR 2025 的一个工作坊上,阿里云通义实验室通义千问负责人林俊旸透露了 Qwen 的下一步方向:推理模型和非推理模型的统一,以及面向 agent 的大模型。