专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
51好读  ›  专栏  ›  大数据文摘

阿里 Qwen3 重磅开源,MoE架构对标OpenAI / 谷歌,全球119语种通吃!

大数据文摘  · 公众号  · 大数据  · 2025-04-29 12:00

正文

请到「今天看啥」查看全文


模式”、“多语言支持”、“代码+推理能力强化”,并大部分 开源、可商用 ,支持 Hugging Face、GitHub、ModelScope、Kaggle 多平台部署。

01 性能实测:不是“吊打GPT”,但是真·能打

先看数据。其中,最受关注的自然是Qwen3-235B-A22B。在AIME数学测试中,击败OpenAI的o3-mini;

在Codeforces编程竞赛中,超过Gemini 2.5 Pro;在BFCL推理评测中,展现出混合专家模型的强大上下文处理能力。

过去我们对大模型的要求只有两件事:答得准、答得快。

Qwen3在此基础上,给出了一个新的维度:“思考预算”的灵活控制机制。

即实现了思考模式与速答模式的无缝切换,用户可以根据任务复杂度自由分配思考预算。

速答模式(Non-Thinking Mode) :适合处理简单问答、快速交互,低延迟、高吞吐。

思考模式(Thinking Mode) :适合复杂推理、代码分析、数学题解等场景,采用逐步推理方式,类似人类的“分步思考”。







请到「今天看啥」查看全文