知识图谱补全(KGC)是一种广泛使用的方法,通过预测缺失的链接来解决知识图谱(KGs)中的不完整性问题。基于描述的KGC利用预训练的语言模型来学习实体和关系的表示,这些模型的名称或描述显示出有希望的结果。然而,基于描述的KGC的性能仍然受到文本质量和不完整结构的限制,因为它缺乏足够的实体描述,并且完全依赖于关系名称,导致结果不是最优的。为了解决这个问题,提出MPIKGC,这是一个通用框架,通过从不同角度查询大型语言模型(LLMs)来补偿上下文化知识的不足,并改进KGC。这涉及到利用LLMs的推理、解释和总结能力来分别扩展实体描述、理解关系和提取结构 实体描述扩展(MPIKGC-E):使用Chain-of-Thought(CoT)提示策略,让LLMs逐步生成更丰富的实体描述。关系理解(MPIKGC-R):通过全局、局部和反向提示策略,提高KGC模型对关系含义的理解,从而改善链接预测的反向预测性能。结构提取(MPIKGC-S):利用LLMs的关键词总结和匹配能力,提取额外的结构信息,丰富知识图谱,特别是对于长尾实体。从实体、关系和结构的角度提高知识图谱的框架。通过使用各种基于描述的知识图谱补全(KGC)模型在链接预测和三元组分类任务上评估增强知识图谱的效率。
每个查询策略的模板,MPIKGC-E、-R 和 -S 分别对应于实体、关系和结构方面的改进方法 
StrategiesTemplatesMPIKGC-EPleaseprovideallinformationabout{EntityName}.Givetherationalebeforeanswering:MPIKGC-RGlobalPleaseprovideanexplanationofthesignificanceoftherelation{RelationName}inaknowledgegraphwithonesentence:MPIKGC-RLocalPleaseprovideanexplanationofthemeaningofthetriplet(headentity,{RelationName},tailentity)andrephraseitintoasentence:MPIKGC-RReversePleaseconverttherelation{RelationName}intoaverbformandprovideastatementinthepassivevoice:MPIKGC-SPleaseextractthefivemostrepresentativekeywordsfromthefollowingtext:{EntityDescription}.Keywords:实验在四个基于描述的KGC模型和四个数据集上进行,包括链接预测和三元组分类任务。结果表明,MPIKGC在多个性能指标上都取得了显著的提升。具体来说:MPIKGC-E 在提高实体描述方面表现出色,尤其是在链接预测任务中。MPIKGC-R 在理解关系方面取得了进步,尤其是在三元组分类任务中。MPIKGC-S 在结构提取方面表现最佳,尤其是在链接预测任务中。链接预测任务的实验结果,每个区块中最好的结果用粗体显示。↑:数值越高越好。↓:数值越低越好。 
Multi-perspectiveImprovementofKnowledgeGraphCompletionwithLargeLanguageModelshttps://arxiv.org/abs/2403.01972https://github.com/quqxui/MPIKGC |