正文
ima 乍一看确实与市面上的AI产品并没有多大的区别,甚至如果用户愿意完全可以把它当成简易版的腾讯元宝来用。
如果要用一个关键词去定义 ima 产品的核心,那就是知识库。
如果将基座大模型看作是一个厨师的话,那么“数据”就等同于厨师做饭所需要的食材。
显然在厨艺之外,食材的品质是决定最后成品质量的关键。
知识库需求的集中爆发,是AI产品发展进入深水区后的必然
。
尤其随着 DeekSeek-R1 的开源之后,大模型水平被迅速拉齐,数据质量对于AI产品最终的用户体验,则显得愈发举足轻重。
众所周知,在互联网长期发展的过程中,公域范围内存在着海量虚假、重复的低质量数据。那么在同等的算力下,利用“公域数据+开源AI大模型”的解决方案来打造 AI 应用的这条路,显然是完全走不通的。
因此能否构建具备高壁垒、强检索能力的高价值数据库,将成为影响 AI 应用最终成败的关键。
互联网行业中,首先意识到知识库巨大价值的并非是腾讯,而是百度
。
作为全网文档类专业数据最多的平台之一,在无人问津的角落,百度文库悄然完成了蜕变。由百度文心大模型赋能之后的百度文库,已不再只是海量文档的简单堆积。在AI的加持下,尘封许久的知识,终于被调用了起来。
百度文库在产品转型后,用户数据一路冲高。在2024年12月月活冲高至9400万,同比增长216%,环比增长83%。而令很多人意想不到的是,在DeepSeekR1发布之前,百度文库网页的月访问量始终保持国内第2名的位次,超过豆包、Kimi的网页访问量。
近 15 亿条优质内容资源库积累,显然是百度文库打赢翻身仗的关键。
秘塔AI搜索同样是在去年爆火的一款主打知识库的AI产品。
2024 年 3 月上线当月,秘塔AI网站访问量超过 700 万次,至今仍然维持网页版访问量前10的位次,足以证明用户对于AI搜索这一细分场景的广泛需求。
秘塔主要的卖点在于无广告、高质量的搜索结果,明牌打的就是百度等传统搜索引擎在广告、竞价等冗余算法影响下,数据信息污染严重的软肋。