专栏名称: 新浪财经
新浪财经提供7*24小时财经资讯及全球金融市场报价,覆盖股票、债券、基金、期货、信托、理财、管理等多种面向个人和企业的服务。
目录
相关文章推荐
51好读  ›  专栏  ›  新浪财经

DeepSeek和李飞飞之后,英伟达也看上阿里千问?

新浪财经  · 公众号  · 财经  · 2025-05-14 09:07

正文

请到「今天看啥」查看全文


可英伟达此次开源的OCR模型,恰巧反驳了这点。只要你的底座模型足够好,哪怕不是最新版本的开源模型,在经过高质量训练和优化后,也能超越闭源模型。

这就让人不由得想起,此前被业界称为“AI教母”的斯坦福大学人工智能研究院院长李飞飞团队,也曾基于阿里通义千问Qwen2.5-32B-Instruct,训练出与OpenAI o1、DeepSeek R1等尖端推理模型数学及编码能力相当的s1-32B模型。

今年4月,李飞飞团队最新研究报告《2025 AI 指数报告》还显示:中美两国模型性能差距已经由2023年的17.5%大幅缩至0.3%,近乎持平。阿里6大模型入选报告,论模型贡献度,仅次于OpenAI和Google,排名全球第三、中国第一。

更早之前,DeepSeek官方也曾透露,曾将DeepSeek-R1的推理能力蒸馏6个模型开源给社区,其中4个来自千问,且在多项能力上实现了对标OpenAI o1-mini的效果。

不少学者指出,千问是所有开源模型中“隐藏惊喜”最大的。滑铁卢大学陈文虎教授直言,用同样的方法训练和微调别的模型都不管用,只有千问才有效果,“千问系列模型一定有一些魔力!”

衍生模型超10万,

通义千问被青睐的“三大原因”

事实上在开源大模型领域,被千问“迷之魅力”吸引来的,远不止英伟达、DeepSeek、李飞飞团队这些顶级公司和大佬。更多的,还是日常在频繁使用大模型的普通开发者们。

据公开数据显示,截至当前,千问全球下载量超3亿;在HuggingFace社区2024年全球模型下载量中,占比超30%,稳居全球第一。千问衍生模型数量已突破10万,超越美国Llama模型,是全球第一AI开源模型。在2025年2月的Huggingface全球开源大模型榜单(Open LLM Leaderboard)中,排名前十的开源模型全部都是基于千问Qwen二次开发的衍生模型。

一个来自中国的大模型,为何在全球AI社区引发狂潮?在新浪科技看来,以下三方面起到了关键作用。

一是性能强劲,成本更低。







请到「今天看啥」查看全文