专栏名称: 阿里研究院
阿里研究院依托阿里巴巴集团海量数据、深耕小企业前沿案例、集结全球商业智慧,以开放、合作、共建、共享的方式打造具影响力的新商业知识平台。 阿里研究,洞察数据,共创新知! 官方网站http://www.aliresearch.com/
目录
相关文章推荐
龙视新闻联播  ·  清凉在龙江|凉资源 热运营 ·  10 小时前  
龙视新闻联播  ·  清凉在龙江|凉资源 热运营 ·  10 小时前  
电子商务研究中心  ·  一站式循环租用服务平台“人人租”完成数亿元D ... ·  昨天  
51好读  ›  专栏  ›  阿里研究院

产业之声 | 阿里通义Qwen3发布:基础模型技术进步是推动产业应用繁荣的原生动力

阿里研究院  · 公众号  · 电商  · 2025-04-30 14:28

正文

请到「今天看啥」查看全文



Qwen3系列模型中,有两款尺寸引入了混合专家(MoE)架构,以实现极致性能和高效推理的完美平衡。以旗舰模型Qwen3-235B-A22B为例,其总参数量达到2350亿,但在推理时仅激活220亿参数。这种架构设计不仅大幅降低了计算资源的消耗,还使得模型在推理速度和性能上表现出色。此外,Qwen3的MoE模型在保持高性能的同时,进一步降低了部署与使用成本。Qwen3-235B-A22B仅需4张H20显卡即可实现满血版部署,显存占用仅为性能相近模型的三分之一。这种高效的设计使得Qwen3系列模型不仅在性能上超越了DeepSeek-R1、OpenAI o1等顶尖模型,还为开发者和企业提供了更具性价比的选择,极大地提升了应用效率,推动了大模型技术在更多场景中的广泛应用。



五、极大加速应用普及:全系采用Apache-2.0开源许可协议,最大化维持使用开放性和生态可控性


Qwen3系列模型均采用了Apache-2.0开源许可协议,维持了最大限度的使用开放性和生态可控性 。目前Apache-2.0协议是使用最多的开源模型许可协议,在Hugging Face上有超过27万个模型使用该协议进行开源,约有10万个模型使用了限制最少的MIT协议,相较而言Apache-2.0协议增加了下游开发过程中对模型状态调整进行通知的要求,在保障利用自由的同时也保护了模型的完整性和可控性, 有利于提高模型开源生态的透明度 ,帮助各方有效管理开源模型的使用。此外, Qwen3对8个尺寸的模型均采用了统一的开源协议 ,不设置用户规模上限等商业保留,不对模型生成内容或衍生模型进行额外要求,也没有对最强模型的使用进行限制,为开发者利用Qwen3进行蒸馏、微调,开发适合各类型场景的衍生模型 提供了最大程度的技术便利和资源支持



六、模型自身能力演进以及和云+芯的协同联动,将为产业应用繁荣与普及提供原生动力

首先,模型本身在类人思考和多模态领域将持续演进提升 。Qwen3作为全球首个开源的混合推理模型,融合了“推理”和“非推理”模式,能够根据不同问题选择“快思考”和“慢思考”。以及阿里在3月发布的Qwen2.5 Omni模型在端到端多模态方向上的积累和提升,使其能够更好地理解和生成多种模态的内容,为未来的智能应用提供了更强大的能力支持。上述融合提升揭示出更 深层面的演化趋势,即我们正在见证模型领域“大一统”的过程 。无论是思考模式、还是各种模态的融合统一,都在近期飞速发展,这 对于模型向真正的通用人工智能(AGI) 演进,具有极为重要的推进意义


同时,模型技术与云基础架构、芯片架构的协同演进正成为推动产业技术进步的关键 。大模型的发展与云体系的支撑密不可分,无论是训练还是推理,每一次模型能力的突破背后,都是云计算、数据和工程平台的全面配合与升级。以及,在Qwen3发布的短短几个小时后,昇腾社区即宣布其国产算力集群适配Qwen3模型,模型算法与芯片硬件的紧密协同,揭示出当前的模型与芯片的关系,正在从“模型适配芯片”向“模型优化芯片”乃至“模型定义芯片”快速演进。


-END-


版块介绍 — 产业之声

紧跟产业发展脉搏,我们汇集行业领袖与企业的真实声音,在算力基础设施的规划与布局、能耗优化、大模型能力发展、大模型评测体系、产业应用案例深入研究、新技术与应用趋势前瞻探索等方面,剖析成功案例背后的逻辑与挑战,并提供基于产业深度洞察的策略建议。同时,我们依托于阿里巴巴集团在人工智能领域的全面布局,分享阿里的AI产业生态和应用的实践落地,探讨技术如何重塑产业格局并推动社会经济的转型升级。


推荐阅读







请到「今天看啥」查看全文