一文全览，AAAI 2020上的知识图谱

AI科技评论 · 公众号 · AI · 2020-02-13 15:08

正文

请到「今天看啥」查看全文

论文链接： https://arxiv.org/pdf/1907.12412.pdf

ERNIE 2.0 框架，Source Sun et al.

百度在相似性融合方面做了不少工作，他们在本届AAAI上介绍了 ERNIE 2.0。这是一个整合外部知识的扩展方法，与ERNIE 1.0相比，它可以捕获更多的词汇、语法和语义信息。

论文链接： https://pasinit.github.io/papers/scarlini_etal_aaai2020.pdf

开源地址： http://sensembert.org/

Scarlini等人将BERT与语义网络BabelNet和NASARI一起应用在他们的SensEmBERT模型中，这个模型能够在多种语言中进行词义歧义消除和词义表示。

作者还指出，SensE没BERT在WSD任务中能够更好地支持不常见词，并优于定制的监督方法。目前这个模型是开源的。

论文链接：https://arxiv.org/pdf/1911.12753.pdf

Bouraoui等人进一步对BERT的关系知识进行了评估，即在给定一对实体（例如法国-巴黎）的情况下，它能否预测正确的关系。作者发现，BERT在事实和常识任务中表现良好，在词汇任务中表现也不错，在形态任务中就更出色了。这实际上也是用知识图谱来增强语言模型的一个重要动机。

二、异质知识图谱中的实体匹配

不同的知识图谱都有他们自己的实体建模的模式，换句话说，不同的属性集合可能只有部分重叠，甚至URLs完全不重叠。例如在Wikidata中Berlin的URL是 https://www.wikidata.org/entity/Q64 ，而DBpedia中Berlin的URL是 http://dbpedia.org/resource/Berlin 。

如果你有一个由这些异质URL组成的知识图谱，尽管它们两个都是在描述同一个真实的Berlin，但知识图谱中却会将它们视为各自独自的实体；当然你也可以编写/查找自定义映射，以显式的方式将这些URL进行匹配成对，例如开放域知识图谱中经常使用的owl:sameAs谓词。维护大规模知识图谱的映射问题是一个相当繁琐的任务。以前，基于本体的对齐工具主要依赖于这种映射来定义实体之间的相似性。但现在，我们有GNNs来自动学习这样的映射，因此只需要一个小的训练集即可。

论文地址：https://arxiv.org/pdf/1911.08936.pdf

Sun等人提出了AliNet模型，这是一个端到端的基于GNN的框架，能够为实体对齐聚合远程多跳邻域。由于模式异质，这个任务变得更加复杂，因为不同知识图谱中相似实体的邻域不是同质的。

Source: Sun et al

为了弥补这一缺陷，作者建议关注节点的n-hop环境以及具有特定损失函数的TransE-style关系建模。最后，门函数会控制一个节点从1-hop、2-hop、3-hop邻域中获得更多信息。AliNet在DBpedia多语言版、DBpedia -Wikidata、 DBpedia -YAGO等数据集上都进行了评估。众所周知，DBpedia、Wikipedia、YAGO有着完全不同的模式。但他们的结果达到了令人吃惊的90+% Hits@10的预测精度，完全不需要手工哦！

论文链接：https://arxiv.org/pdf/2001.08728v1.pdf

Kun Xu等人研究了多语言知识图谱（本例中为DBpedia）中的对齐问题，在这个问题上基于GNN的方法会陷入“多对一”的情况，当给定一个目标实体时会生成多个候选的源实体。

Source: Xu