正文
还只是个人畜无害的卡皮巴拉,
Qwen3
就可以说得上是肌肉猛男了。
Qwen3-235B-A22B
总参数量为
235B
,激活仅需
22B
,
只需
4
张
H20
显卡即可满血运行
,成本大幅降低,仅为
DeepSeek-R1
的
1/3
。
此外,在奥数水平
AIME25
测试中,斩获
81.5
分;在编程测试
LiveCodeBench
中,斩获
70.7
分;在评估模型人类偏好对齐的
ArenaHard
测评中,斩获
95.6
分。
性能上已经全面超越了
DeepSeek-R1
、
OpenAI-o1
等顶级模型,登顶全球最强开源模型宝座。
即使是
Qwen3-30B-A3B
这样的小型模型,总参数
30B
,激活仅
3B
,是
QwQ-32B
的十分之一,但性能已经远远超越。
有网友将其称为:
DeepSeek moment
。
并且,
Qwen3
支持多种终端适配,
0.6B
版本可直接应用于本地测试及科研,
4B
版本可在手机端运行,
8B
版本可部署在电脑端或汽车端,
14B/32B
可在企业端部署落地。
连外国网友也忍不住惊呼它的便携性。
同时支持思考和非思考模式
语言覆盖至
119
种
此次
Qwen3