知识图谱(KG)在多个领域的广泛应用,其中包括实体、概念和关系组成的语义网络。构建KG通常涉及多种任务,如命名实体识别(NER)、关系提取(RE)、事件提取(EE)和实体链接(EL)。链接预测(LP)是KG推理的关键步骤,对于理解构建的KG至关重要。此外,KG在问答(QA)任务(即利用已有的知识图谱来回答问题,这可能涉及到对 KG 中的实体和关系进行推理)中也占据中心地位,尤其是在基于问题上下文进行推理时。
因此,为了深入了解 LLMs 在与 KG 有关的任务中的表现,作者针对实体和关系抽取(RE)、事件检测(ED)、链接预测(LP)和问答(QA)四个任务,对 LLMs 在 KG 构建和推理任务中的潜力进行实证调查。通过理解 LLMs 的基本能力,作者进一步探讨了它们在未来可能的发展方向。研究集中在以下几个方面:
编者按:“事件提取”(EE)可能并不是一个常见的 KG 构建任务,参考相关资料和往期内容《[综述导读] 知识图谱自动构建综述(一)》,KG 构建的一般流程除了前面提到的 NER、RE、EL 外,还有实体分类(ET)、共指解析(CR)等。但 EE 在KG 构建中可能可以起到丰富知识表示、增强关系识别、提供上下文信息、促进领域特定应用、辅助自动化知识获取、增强语义理解等作用,因此其作用也是不容忽视的。(如有不同意见,欢迎在评论区提出)
如下图所示,在 AutoKG 框架中,不同的智能体被分配不同的角色,例如作为咨询者的 KG 助理智能体 (KG assistant agent) 和作为领域专家的 KG 用户智能体 (KG user agent)。智能体接收到与知识图谱构建或推理任务相关的提示,这些提示指导智能体执行特定的行动。
在收到提示和分配的角色后,任务指定智能体(task specifier)会提供详细描述以澄清概念。随后,KG 助手和 KG 用户通过多方写作和互动完成指定任务,直到 KG 用户确认任务完成。与此同时,还引入了网络搜索者(web searcher),以帮助 KG 助手进行互联网知识检索。KG assistant 在收到 KG user 的对话后,首先会咨询 web searcher 是否根据内容上网浏览信息;在 web searcher 回答的引导下,KG assistant 继续处理 KG user 的指令。实验结果表明,使用多智能体和互联网增强方法可以更有效、更全面地构建知识图谱。
三个显著挑战
尽管 AutoKG 可以显著改善 LLMs 构建 KG 的效果,但在使用过程中存在三个显著挑战:
API 的 Token 限制问题:当前使用的 gpt-3.5-turbo 受限于最大 Token 限制。这个限制影响了 KG 的构建,因为API 的 Token 限制可能会阻碍处理较长的文本或复杂的查询。