正文
而在短短的2年时间里,文心一言版本也已经迭代到了4.0,从日均调用量和各种榜单成绩来看,是推动中国大模型发展不可或缺的组成部分。
从技术角度来看,文心大模型的核心技术之一是知识增强。
不同于仅靠大规模文本数据训练的LLM(如GPT系列),文心一言结合了百度的知识图谱(涉及万亿级实体和关系),让模型在问答任务中更精准,减少幻觉问题。
除此之外,文心一言还通过持续学习(Continual Learning),让模型能够动态适应新知识,避免旧知识遗忘问题。
加之多任务学习(Multi-Task Learning),文心一言能在对话、翻译、阅读理解、代码生成等多种任务间共享知识,提高泛化能力。
文心一言还具备强大的多模态理解和生成能力,包括图像生成、视频生成和语音交互等等。
最重要的一点是,文心一言的背后还有百度强大的生态支撑,百度搜索、百度地图、百度智能云等,可以提供更完整的AI服务。
而从收费到免费,从闭源到开源,或许是大模型发展所使然;毕竟就在昨天,不仅是百度,就连OpenAI也官宣了“免费”的动作。
不过今天百度能够决定开源,一定程度上也展示了百度在AI领域的开放态度和技术自信。
据悉,百度计划在今年发布多款模型,并在下半年文心大模型5.0版本,多模态能力将会有显著提升。
而就在刚刚过去的阿联酋迪拜World Governments Summit 2025峰会上,李彦宏也谈及了对DeepSeek的看法。
在被问到DeepSeek是否是意料之中时,李彦宏表示:
我认为,创新是不能被计划的。你不知道创新何时何地到来,你所能做的是,营造一个有利于创新的环境。
李彦宏指出大语言模型领域创新速度极快,如今大模型推理成本每年能降低 90% 以上,远超过去计算机革命的速度: