专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
目录
相关文章推荐
程序猿  ·  北大“韦神”粉丝超千万,家属回应牙齿缺失 ·  15 小时前  
老刘说NLP  ·  再看知识图谱本体生成:RAG用于Mysql数 ... ·  2 天前  
程序猿  ·  Python有史以来最强大的挑战者终于出现 ·  昨天  
OSC开源社区  ·  苹果开源编程语言Swift官网全新改版 ·  3 天前  
程序员的那些事  ·  AI 编程工具 Windsurf 突遭 ... ·  4 天前  
51好读  ›  专栏  ›  老刘说NLP

再看知识图谱本体生成:RAG用于Mysql数据转换及非结构化文本生成思路

老刘说NLP  · 公众号  · 程序员  · 2025-06-07 12:10

正文

请到「今天看啥」查看全文


》(https://arxiv.org/pdf/2506.01232),介绍了一种名为RIGOR(Retrieval-augmented Iterative Generation of RDB Ontologies)的方法,用于将关系数据库转换为丰富的OWL本体。

实现流程如下:

(a)按照外键约束遍历表;(b)使用RAG从核心本体中检索相关概念;(c)使用RAG检索相关文本描述;(d)使用RAG从本体库中检索相关概念和属性;(e)构建提示;(f)使用Gen-LLM生成增量本体;(g)通过人类专家或Judge-LLM对增量本体进行细化;(h)将细化后的增量本体整合到核心本体中,以扩展其覆盖范围。

其中,用于本体生成的提示模板如下:

固定的分隔符(如[CONTEXT]、[INSTRUCTIONS]和[OUTPUT])被逐字包含在提示中,以结构化LLM的输入并引导其响应。花括号中的占位符(例如,{data['table_name']})在每次迭代时都会动态替换为特定于表的内容。

看一个转换结果:

这个工作的意义在于,加快将mysql数据库为知识图谱的转换速度。

二、基于非结构化知识库进行本体生成







请到「今天看啥」查看全文