专栏名称: 阿里研究院

阿里研究院依托阿里巴巴集团海量数据、深耕小企业前沿案例、集结全球商业智慧，以开放、合作、共建、共享的方式打造具影响力的新商业知识平台。阿里研究，洞察数据，共创新知！官方网站http://www.aliresearch.com/

产业之声 | 阿里通义Qwen3发布：基础模型技术进步是推动产业应用繁荣的原生动力

阿里研究院 · 公众号 · 电商 · 2025-04-30 14:28

正文

请到「今天看啥」查看全文

Qwen3系列模型中，有两款尺寸引入了混合专家（MoE）架构，以实现极致性能和高效推理的完美平衡。以旗舰模型Qwen3-235B-A22B为例，其总参数量达到2350亿，但在推理时仅激活220亿参数。这种架构设计不仅大幅降低了计算资源的消耗，还使得模型在推理速度和性能上表现出色。此外，Qwen3的MoE模型在保持高性能的同时，进一步降低了部署与使用成本。Qwen3-235B-A22B仅需4张H20显卡即可实现满血版部署，显存占用仅为性能相近模型的三分之一。这种高效的设计使得Qwen3系列模型不仅在性能上超越了DeepSeek-R1、OpenAI o1等顶尖模型，还为开发者和企业提供了更具性价比的选择，极大地提升了应用效率，推动了大模型技术在更多场景中的广泛应用。

五、极大加速应用普及：全系采用Apache-2.0开源许可协议，最大化维持使用开放性和生态可控性

Qwen3系列模型均采用了Apache-2.0开源许可协议，维持了最大限度的使用开放性和生态可控性 。目前Apache-2.0协议是使用最多的开源模型许可协议，在Hugging Face上有超过27万个模型使用该协议进行开源，约有10万个模型使用了限制最少的MIT协议，相较而言Apache-2.0协议增加了下游开发过程中对模型状态调整进行通知的要求，在保障利用自由的同时也保护了模型的完整性和可控性， 有利于提高模型开源生态的透明度 ，帮助各方有效管理开源模型的使用。此外， Qwen3对8个尺寸的模型均采用了统一的开源协议 ，不设置用户规模上限等商业保留，不对模型生成内容或衍生模型进行额外要求，也没有对最强模型的使用进行限制，为开发者利用Qwen3进行蒸馏、微调，开发适合各类型场景的衍生模型 提供了最大程度的技术便利和资源支持 。

六、模型自身能力演进以及和云+芯的协同联动，将为产业应用繁荣与普及提供原生动力

首先，模型本身在类人思考和多模态领域将持续演进提升 。Qwen3作为全球首个开源的混合推理模型，融合了“推理”和“非推理”模式，能够根据不同问题选择“快思考”和“慢思考”。以及阿里在3月发布的Qwen2.5 Omni模型在端到端多模态方向上的积累和提升，使其能够更好地理解和生成多种模态的内容，为未来的智能应用提供了更强大的能力支持。上述融合提升揭示出更 深层面的演化趋势，即我们正在见证模型领域“大一统”的过程 。无论是思考模式、还是各种模态的融合统一，都在近期飞速发展，这 对于模型向真正的通用人工智能（AGI）演进，具有极为重要的推进意义 。

同时，模型技术与云基础架构、芯片架构的协同演进正成为推动产业技术进步的关键 。大模型的发展与云体系的支撑密不可分，无论是训练还是推理，每一次模型能力的突破背后，都是云计算、数据和工程平台的全面配合与升级。以及，在Qwen3发布的短短几个小时后，昇腾社区即宣布其国产算力集群适配Qwen3模型，模型算法与芯片硬件的紧密协同，揭示出当前的模型与芯片的关系，正在从“模型适配芯片”向“模型优化芯片”乃至“模型定义芯片”快速演进。

-END-

版块介绍 — 产业之声

紧跟产业发展脉搏，我们汇集行业领袖与企业的真实声音，在算力基础设施的规划与布局、能耗优化、大模型能力发展、大模型评测体系、产业应用案例深入研究、新技术与应用趋势前瞻探索等方面，剖析成功案例背后的逻辑与挑战，并提供基于产业深度洞察的策略建议。同时，我们依托于阿里巴巴集团在人工智能领域的全面布局，分享阿里的AI产业生态和应用的实践落地，探讨技术如何重塑产业格局并推动社会经济的转型升级。

推荐阅读