专栏名称: MacTalk
MacTalk 开通于2012年末,内容起于 Mac 而不止 Mac,内容覆盖了技术、创业、产品和人文思考。文风有趣,又有一点力量。相关图书《MacTalk·人生元编程》《MacTalk·跨越边界》
目录
相关文章推荐
科技美学  ·  华为Pura80系列抢先看,三折叠迭代也来了 ·  15 小时前  
江西市场监管  ·  “碳”索绿色发展!这项成效显著→ ·  昨天  
江西市场监管  ·  “碳”索绿色发展!这项成效显著→ ·  昨天  
51好读  ›  专栏  ›  MacTalk

哎,说千道万,RAG 是个基本功

MacTalk  · 公众号  · 科技自媒体  · 2025-01-27 10:10

正文

请到「今天看啥」查看全文


如果我们追根溯源,检索增强早在百度 2023 年 3 月发布文心一言的时候就已经提出来。现在将近两年时间过去了,检索增强的价值,从百度最早推出到现在已经成为业界共识。百度检索增强技术深度融合大模型能力和搜索系统,构建了“理解-检索-生成”的协同优化技术。
去年十一月,百度 CTO 王海峰曾经在百度世界大会中提到了百度缓解大模型幻觉的关键就是得益于这套增强检索技术。
简单来说,“理解”就是拆解知识点,充分理解用户的需求;“检索”就是找到最合适的信息,然后进行搜索排序优化,并将搜索返回的异构信息统一表示,再送给大模型;“生成”阶段会综合不同来源的信息做出判断,并基于大模型逻辑推理能力,解决信息冲突等问题,最后生成准确率高、时效性好的答案。
可以说,百度的检索增强技术提升了大模型技术及应用的效果。

数据层面,百度作为全球最大的中文搜索引擎,过去积累了非常海量的数据、知识图谱、知识库以及实时数据整合能力等。这部分能力中,有些可以复用,有些则需要调整。比如对于大语言模型而言,人类易读的搜索结果内容却不便于模型对内容抽取和理解。

于是,在既有的技术框架和模块化 RAG 架构的基础上,百度打造了一套可以处理搜索需求和大模型检索增强需求的 AI 原生的检索系统 AIAPI,它可以为模型生成提供更优质检索结果,并且兼顾资源利用率、响应速度和运行效率。不得不说,百度在 AI 技术方面的积累,真的让人敬佩。确实是一家认真做技术的公司。







请到「今天看啥」查看全文