一场文心大模型的「AI马拉松」

机器之心 · 公众号 · AI · 2025-05-22 18:25

主要观点总结

文章介绍了百度在AI领域的发展策略，包括保持长期主义的战略定力、技术路径的灵活应变、以及其在基础模型研发、多模态大模型、深度思考模型等方面的技术投入和成果。文章还提到了百度在生态建设、数据建设、模型降本增效、智能体发展方向等方面的努力，以及其全栈布局、自主研发的技术路线。

关键观点总结

关键观点1: 百度在AI领域的发展策略包括保持长期主义的战略定力和技术路径的灵活应变。

这是百度在这轮科技革命中的制胜之道，既坚持不变的研发投入和模型优化，又不断适应新技术和新需求的变化。

关键观点2: 百度在基础模型研发、多模态大模型、深度思考模型等方面取得重要进展。

例如，文心大模型的持续创新，以及文心X1 Turbo模型在推理能力方面的突出表现，都体现了百度在AI技术研发方面的实力和进展。

关键观点3: 百度重视生态建设，通过打造闭环机制，整合行业数据，推动AI生态系统的健康发展。

同时，百度还在智能体发展方向被看好，将大模型从单纯的理解和生成工具升级为能够进行多步骤思考、自主规划并调用工具的行动系统。

关键观点4: 百度在降低模型成本方面也做出了努力。

例如，文心 X1 Turbo 的超低定价，为行业内的广大开发者提供了更广泛的应用可能性，有助于创造蓬勃发展的AI应用生态。

正文

请到「今天看啥」查看全文

在前两天的百度 AI Day 上，百度集团副总裁吴甜深入解读了文心最新模型的创新技术，并回应了业界对百度文心大模型的诸多关注。通过她的分享，我们得以一窥百度在基础模型研发领域坚持的核心理念与技术演进路径，也更加清晰地认识到了评测数据背后那个真实且充满活力的飞桨文心生态。

进击的文心

在 AI Day 现场，吴甜演示了一个文心 X1 Turbo 解题的案例。这道题不光有文字描述，还有几何图，需要模型综合多模态信息进行推理。

从文心 X1Turbo 的回答来看，它思考解答这个题目的思路非常清晰，能够自主规划，识别图片中的明面信息和隐藏含义，再思考分析，反思每个选项答案的准确性，最后综合给出解题步骤和答案。这在一些权威基准测试中也得到了验证。文心 X1 Turbo 整体效果领先 DeepSeek R1、V3 最新版，略低于 OpenAI o1 满血版。

此外，来自中国信通院的大模型推理能力评估也显示，文心 X1 Turbo 在 24 项能力测试中表现突出 ——16 项获 5 分、7 项获 4 分、1 项获 3 分，综合评级达到「4 + 级」，成为国内首款通过该测评的大模型。评估结果还表明，该模型在逻辑推理、代码推理、推理效果优化等技术能力及工具支持度、安全可靠度等应用能力均获得满分。这样一个来自第三方的评测意味着，文心 X1 Turbo 已经站稳了国内推理模型的第一梯队。

除了推理能力，文心 X1 Turbo 和之前的文心 X1 之所以出圈，和它们的成本优势也密不可分。在能力相当的情况下，文心 X1 把价格打到了 DeepSeek R1 的一半；X1 Turbo 则更进一步，把价格打到了 DeepSeek-R1 的 25%，这让一些海外开发者羡慕不已。

一个搭建多年的全栈技术体系