主要观点总结
本文介绍了人工智能领域的最新发展,特别是关于AI模型竞争的现状。文章指出,头部AI模型表现提升,竞争日益激烈,同时小型化AI模型在突破年展现潜力。中国高性能AI模型数量和质量正在挑战美国的领先地位。报告强调AI将继续快速发展,没有公司能独占鳌头。小型模型展现竞争力,算法优化和硬件效率提高推动进展。然而,生成式AI仍存在隐性偏见等问题。本文还涉及DeepSeek等中国开源AI模型的全球影响。
关键观点总结
关键观点1: 头部AI模型表现迅速提升,竞争激烈
文章指出,头部AI模型之间的竞争越来越激烈,表现也在迅速提升。
关键观点2: 小型化AI模型成为突破年的重点
报告强调,更小更简洁的模型也能承担重任,算法优化使得现代小型模型的表现与大型模型不相上下。
关键观点3: 中国高性能AI模型挑战美国领先地位
文章提到,中国开发的AI模型在数量和质量上正在挑战美国的领先地位,特别是在某些基准测试上的表现逐渐接近甚至超越美国模型。
关键观点4: AI模型的开放权重趋势增加
DeepSeek和LLaMa等开放权重模型的涌现为用户提供了更多透明度。用户可以查看这些模型的训练参数,但细节可能未公开。
关键观点5: 生成式AI存在的挑战
尽管在多个基准测试中取得进步,但生成式AI仍存在隐性偏见、幻觉和不实信息生成等问题。
正文
该报告显示,平均而言,几个主要的生成式AI模型仍在“壮大”——通过使用更多的决策变量,更多算力和更大的训练数据集。但开发者也在证明,
更小更简洁的模型也能“肩负重任”
。在算法优化的加持下,如今一个现代模型的表现和两年前一个大100倍的模型不相上下。报告指出,
“2024是小型化AI模型的突破年。”
未参与撰写该报告的美国康奈尔大学计算科学家Bart Selman表示,
看到更小更平价的模型能证明自己的竞争力
,如中国的DeepSeek,确实是件好事。
“我预言我们将看到一些只有五个人或两个人的团队,他们将带来一些推陈出新的新算法概念,”他说,“这很好。我们不希望决定世界运转的只有几个大公司。”
报告显示,
主要AI模型中的绝大部分如今都由产业界而不是学术界开发
:与2000年代初的情况形成了鲜明反差,当时神经网和生成式AI都还未崛起。2006年前,产业界推出的主要AI模型还占不到20%,但2023年达到了60%,2024年接近90%。
美国仍是主要模型的最大生产国,2024年发布数量为40,中国为15,欧洲为3。
但许多其他地区也开始崭露头角,包括中东、拉丁美洲、东南亚。
美国之前在模型质量上的领先优势已不复存在,报告写道。
中国作为AI发表著作和专利产出的主要国家,现在能开发出与美国对手性能相当的模型。
2023年,领先的中国模型在Massive Multitask Language Understanding
(MMLU,大语言模型的一个常用测评基准)
的得分比第一名的美国模型差了近20个百分点。但到了2024年底,美国的领先优势缩小到了0.3个百分点。
“2015年左右,
中国成了AI领域的重要参与者,这是通过教育投入实现的
,”Selman说,“我们看到投入开始产生回报了。”
在AI领域,
DeepSeek和Facebook的LLaMa这类“开放权重”模型的数量和性能也出现了令人惊喜的激增
。用户可以自由看到这些模型在训练时学习和用于预测的参数,但训练代码等其他细节可能并未公开。最早,闭源系统的性能要优越很多,也就是这些参数全都不公开的系统,但两者各自最好“选手”的差距在2024年初缩小到了8%,2025年初只有1.7%。
“对于无法从头构建模型的人来说,比如很多小公司和研究人员,这自然是好事,”该研究的联合主任、加州非营利研究所SRI的计算科学家Ray Perrault说。开发了对话机器人ChatGPT的加州公司OpenAI计划在接下来几个月里发布一款开放权重模型。