专栏名称: 智东西
智东西-聚焦智能变革,服务产业升级!作为智能行业新锐媒体,智东西专注五大领域:VR/AR;AI/机器人/无人机;智能汽车/智能出行;智能家居/物联网;智能穿戴/智能医疗,通过内容、活动、报告以及社群等方式助力“智能+”时代的创业和产业升级。
目录
相关文章推荐
新浪科技  ·  【#智谱COO张帆即将离职#】智谱AI ... ·  10 小时前  
新浪科技  ·  【#雷军辟谣YU7售价23.59万元#:不可 ... ·  昨天  
虎嗅APP  ·  零公里二手车,大部分出国了 ·  2 天前  
新浪科技  ·  【#金价年内涨超25%#】#金价冲破3350 ... ·  2 天前  
51好读  ›  专栏  ›  智东西

阿里Qwen3深夜开源!8款模型、集成MCP,性能超DeepSeek-R1,2小时狂揽16.9k星

智东西  · 公众号  · 科技媒体  · 2025-04-29 06:51

正文

请到「今天看啥」查看全文


体验地址:
https://chat.qwen.ai/
博客地址:
https://qwenlm.github.io/blog/qwen3/
GitHub地址:
https://github.com/QwenLM/Qwen3
Hugging Face地址:
https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f

01 .
以小搏大!激活参数仅1/10
实现性能反超


6个稠密模型中,0.6B~4B参数规模的模型上下文长度为 32K ,8B~32B参数规模的模型上下文长度为 128K
2个MoE模型的上下文长度均为 128K
小型MoE模型Qwen3-30B-A3B, 在激活参数是QwQ-32B的1/10的情况下,实现了性能反超 。且参数规模更小的Qwen3-4B模型,实现了与Qwen2.5-72B-Instruct的性能相当。






请到「今天看啥」查看全文