论文题目:Start from Zero: Triple Set Prediction for Automatic Knowledge Graph Completion
本文作者:张文(浙江大学)、徐雅静(浙江大学)、叶鹏(移动)、黄志伟(浙江大学)、许泽众(浙江大学)、陈矫彦(曼彻斯特大学)、Jeff Z. Pan(爱丁堡大学)、陈华钧(浙江大学)
发表期刊:TKDE 2024
论文链接:bit.ly/3QOLOu5
代码链接:bit.ly/4al9v3W
欢迎转载,转载请注明出处
一、引言
知识图谱补全(KGC)旨在预测知识图谱中缺失的三元组。一些任务,如链接预测和实例补全,已经被提出用于知识图谱补全。但它们都是三元组级别的任务,任务定义为给定三元组中的其中一些元素并预测缺失的元素。然而,事先知道被补全三元组的中的元素并不总是一个现实的设定。在本文中,我们提出了一种新的图级别自动知识图谱补全任务,称为三元组集合预测(Triple Set Prediction,TSP),它假设缺失三元组中的所有元素都是未知的。TSP的目标是基于已知的三元组集合,预测缺失的三元组集合。为这个新任务我们提出了4个评估指标,包括3个分类指标和1个排名指标,充分考虑了部分开放世界假设和封闭世界假设。此外,为了应对候选三元组数量巨大的挑战,我们提出了一种新颖而高效的基于子图分割和头尾实体建模的三元组集合预测方法GPHT,它可以快速预测三元组集。为了公平比较TSP的结果,我们还提出了两种类型基线方法RuleTensor-TSP和KGE-TSP,将现有的基于规则和嵌入的知识图谱补全方法应用于TSP任务。我们构建了3个不同特性的数据集,并进行实验验证。结果表明,这些方法可以成功生成一组缺失的三元组,并在新任务上取得合理的得分,而我们提出的GPHT方法的性能和效率均优于基线方法。