专栏名称: 自然系列
Nature Research官方账号,介绍中国及世界科技出版业最新动态,如何在Nature及其子刊上发表论文,针对中国研究人员的最新产品及服务。
目录
相关文章推荐
51好读  ›  专栏  ›  自然系列

2025 AI 指数报告:没有一家独大, “小而美”模型大有可为

自然系列  · 公众号  · 科研  · 2025-04-17 12:40

主要观点总结

本文介绍了人工智能领域的最新发展,特别是关于AI模型竞争的现状。文章指出,头部AI模型表现提升,竞争日益激烈,同时小型化AI模型在突破年展现潜力。中国高性能AI模型数量和质量正在挑战美国的领先地位。报告强调AI将继续快速发展,没有公司能独占鳌头。小型模型展现竞争力,算法优化和硬件效率提高推动进展。然而,生成式AI仍存在隐性偏见等问题。本文还涉及DeepSeek等中国开源AI模型的全球影响。

关键观点总结

关键观点1: 头部AI模型表现迅速提升,竞争激烈

文章指出,头部AI模型之间的竞争越来越激烈,表现也在迅速提升。

关键观点2: 小型化AI模型成为突破年的重点

报告强调,更小更简洁的模型也能承担重任,算法优化使得现代小型模型的表现与大型模型不相上下。

关键观点3: 中国高性能AI模型挑战美国领先地位

文章提到,中国开发的AI模型在数量和质量上正在挑战美国的领先地位,特别是在某些基准测试上的表现逐渐接近甚至超越美国模型。

关键观点4: AI模型的开放权重趋势增加

DeepSeek和LLaMa等开放权重模型的涌现为用户提供了更多透明度。用户可以查看这些模型的训练参数,但细节可能未公开。

关键观点5: 生成式AI存在的挑战

尽管在多个基准测试中取得进步,但生成式AI仍存在隐性偏见、幻觉和不实信息生成等问题。


正文

请到「今天看啥」查看全文


该报告显示,平均而言,几个主要的生成式AI模型仍在“壮大”——通过使用更多的决策变量,更多算力和更大的训练数据集。但开发者也在证明, 更小更简洁的模型也能“肩负重任” 。在算法优化的加持下,如今一个现代模型的表现和两年前一个大100倍的模型不相上下。报告指出, “2024是小型化AI模型的突破年。”


未参与撰写该报告的美国康奈尔大学计算科学家Bart Selman表示, 看到更小更平价的模型能证明自己的竞争力 ,如中国的DeepSeek,确实是件好事。 “我预言我们将看到一些只有五个人或两个人的团队,他们将带来一些推陈出新的新算法概念,”他说,“这很好。我们不希望决定世界运转的只有几个大公司。”

势均力敌

报告显示, 主要AI模型中的绝大部分如今都由产业界而不是学术界开发 :与2000年代初的情况形成了鲜明反差,当时神经网和生成式AI都还未崛起。2006年前,产业界推出的主要AI模型还占不到20%,但2023年达到了60%,2024年接近90%。


美国仍是主要模型的最大生产国,2024年发布数量为40,中国为15,欧洲为3。 但许多其他地区也开始崭露头角,包括中东、拉丁美洲、东南亚。


美国之前在模型质量上的领先优势已不复存在,报告写道。 中国作为AI发表著作和专利产出的主要国家,现在能开发出与美国对手性能相当的模型。 2023年,领先的中国模型在Massive Multitask Language Understanding (MMLU,大语言模型的一个常用测评基准) 的得分比第一名的美国模型差了近20个百分点。但到了2024年底,美国的领先优势缩小到了0.3个百分点。


“2015年左右, 中国成了AI领域的重要参与者,这是通过教育投入实现的 ,”Selman说,“我们看到投入开始产生回报了。”


在AI领域, DeepSeek和Facebook的LLaMa这类“开放权重”模型的数量和性能也出现了令人惊喜的激增 。用户可以自由看到这些模型在训练时学习和用于预测的参数,但训练代码等其他细节可能并未公开。最早,闭源系统的性能要优越很多,也就是这些参数全都不公开的系统,但两者各自最好“选手”的差距在2024年初缩小到了8%,2025年初只有1.7%。


“对于无法从头构建模型的人来说,比如很多小公司和研究人员,这自然是好事,”该研究的联合主任、加州非营利研究所SRI的计算科学家Ray Perrault说。开发了对话机器人ChatGPT的加州公司OpenAI计划在接下来几个月里发布一款开放权重模型。

小而美,价更优







请到「今天看啥」查看全文