2025 AI 指数报告：没有一家独大， “小而美”模型大有可为

自然系列 · 公众号 · 科研 · 2025-04-17 12:40

主要观点总结

本文介绍了人工智能领域的最新发展，特别是关于AI模型竞争的现状。文章指出，头部AI模型表现提升，竞争日益激烈，同时小型化AI模型在突破年展现潜力。中国高性能AI模型数量和质量正在挑战美国的领先地位。报告强调AI将继续快速发展，没有公司能独占鳌头。小型模型展现竞争力，算法优化和硬件效率提高推动进展。然而，生成式AI仍存在隐性偏见等问题。本文还涉及DeepSeek等中国开源AI模型的全球影响。

关键观点总结

关键观点1: 头部AI模型表现迅速提升，竞争激烈

文章指出，头部AI模型之间的竞争越来越激烈，表现也在迅速提升。

关键观点2: 小型化AI模型成为突破年的重点

报告强调，更小更简洁的模型也能承担重任，算法优化使得现代小型模型的表现与大型模型不相上下。

关键观点3: 中国高性能AI模型挑战美国领先地位

文章提到，中国开发的AI模型在数量和质量上正在挑战美国的领先地位，特别是在某些基准测试上的表现逐渐接近甚至超越美国模型。

关键观点4: AI模型的开放权重趋势增加

DeepSeek和LLaMa等开放权重模型的涌现为用户提供了更多透明度。用户可以查看这些模型的训练参数，但细节可能未公开。

关键观点5: 生成式AI存在的挑战

尽管在多个基准测试中取得进步，但生成式AI仍存在隐性偏见、幻觉和不实信息生成等问题。

正文

请到「今天看啥」查看全文

该报告显示，平均而言，几个主要的生成式AI模型仍在“壮大”——通过使用更多的决策变量，更多算力和更大的训练数据集。但开发者也在证明， 更小更简洁的模型也能“肩负重任” 。在算法优化的加持下，如今一个现代模型的表现和两年前一个大100倍的模型不相上下。报告指出， “2024是小型化AI模型的突破年。”

未参与撰写该报告的美国康奈尔大学计算科学家Bart Selman表示， 看到更小更平价的模型能证明自己的竞争力 ，如中国的DeepSeek，确实是件好事。 “我预言我们将看到一些只有五个人或两个人的团队，他们将带来一些推陈出新的新算法概念，”他说，“这很好。我们不希望决定世界运转的只有几个大公司。”

势均力敌

报告显示， 主要AI模型中的绝大部分如今都由产业界而不是学术界开发 ：与2000年代初的情况形成了鲜明反差，当时神经网和生成式AI都还未崛起。2006年前，产业界推出的主要AI模型还占不到20%，但2023年达到了60%，2024年接近90%。

美国仍是主要模型的最大生产国，2024年发布数量为40，中国为15，欧洲为3。 但许多其他地区也开始崭露头角，包括中东、拉丁美洲、东南亚。

美国之前在模型质量上的领先优势已不复存在，报告写道。 中国作为AI发表著作和专利产出的主要国家，现在能开发出与美国对手性能相当的模型。 2023年，领先的中国模型在Massive Multitask Language Understanding （MMLU，大语言模型的一个常用测评基准）的得分比第一名的美国模型差了近20个百分点。但到了2024年底，美国的领先优势缩小到了0.3个百分点。

“2015年左右， 中国成了AI领域的重要参与者，这是通过教育投入实现的 ，”Selman说，“我们看到投入开始产生回报了。”

在AI领域， DeepSeek和Facebook的LLaMa这类“开放权重”模型的数量和性能也出现了令人惊喜的激增 。用户可以自由看到这些模型在训练时学习和用于预测的参数，但训练代码等其他细节可能并未公开。最早，闭源系统的性能要优越很多，也就是这些参数全都不公开的系统，但两者各自最好“选手”的差距在2024年初缩小到了8%，2025年初只有1.7%。

“对于无法从头构建模型的人来说，比如很多小公司和研究人员，这自然是好事，”该研究的联合主任、加州非营利研究所SRI的计算科学家Ray Perrault说。开发了对话机器人ChatGPT的加州公司OpenAI计划在接下来几个月里发布一款开放权重模型。

小而美，价更优