链载Ai

标题: GraphRAG在企业知识服务中的应用落地 [打印本页]

作者: 链载Ai    时间: 昨天 20:47
标题: GraphRAG在企业知识服务中的应用落地

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;color: rgb(0, 0, 0);font-size: 14px;text-align: justify;visibility: visible;line-height: 2em;">导读本文聚焦 GraphRAG 技术在工业制造业企业知识服务中的技术实现路径,系统性剖析当前#RAG(Retrieve and Generate)技术的核心痛点,提出基于知识图谱的增强方案(GraphRAG),并从技术架构设计、知识建模与融合、图推理优化等维度阐述其工业落地方法。

主要内容包括以下几个部分:


ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;line-height: 2em;visibility: visible;">1.工业场景需求与技术挑战

2.GraphRAG 核心技术

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;line-height: 2em;">3.关键痛点问题及解决路径总结

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;line-height: 2em;">4.结语

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;text-align: left;line-height: 1.75em;">分享嘉宾|杜振东 南京云问网络技术有限公司 算法负责人

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;text-align: left;line-height: 1.75em;">编辑整理|赵培姿

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;text-align: left;line-height: 1.75em;">内容校对|李瑶

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;text-align: left;line-height: 1.75em;">出品社区|DataFun


01


工业场景需求与技术挑战


在尝试与大模型结合的过程中,RAG成为最常见的落地方式。企业通常搭建私有化知识库,基于知识库进行检索匹配、答案召回,再由大模型做答案生成。


然而传统RAG技术在工业场景中暴露出显著局限性:


02


GraphRAG核心技术


为解决上述问题,我们尝试引入知识图谱,以弥补大模型的不足。


1.知识图谱引入


知识图谱是一种描述实体及其关系的语义网络(如节点表示对象,边表示关系)。与传统知识库相比具有以下优势:


知识图谱与大模型各具优势,可互相补充。


基于上述知识图谱与大模型的互补关系,二者在实际应用中衍生出了如下融合方向:


2.知识图谱智能问答技术路线


下图展示了基于知识图谱构建智能问答的技术路线,涵盖了数据处理、图谱构建、智能问答、大语言模型训练等环节。


在大模型训练过程中,预训练和微调是重要环节。建议先专注于构建模型基础能力,微调并非起始阶段的必要操作,可在模型应用中发现具体问题后,再有针对性地进行微调。此外,不应忽视提示工程的价值,精心优化提示策略,能有效提升模型表现,且相较于微调,往往具有更高的性价比。


智能问答依赖于底层图谱的构建,图谱构建主要包括以下关键内容:


智能问答系统的搭建、知识图谱的构建以及所需数据的确定,均需从业务场景出发,依循场景需求来规划与实施。


用户问题输入后,经GraphRAG(检索融合知识图谱增强、链式推理知识关系图谱增强、线索追溯知识图谱推理验证 ),结合向量检索、链式关系、推理溯源等,利用图谱知识增强大模型答案生成,最终输出答案,同时大模型输出可反馈至知识图谱。整个过程中,多源异构数据处理为知识图谱构建提供数据,知识图谱又支撑智能问答,大语言模型与知识图谱相互增强。


3.数据处理


在基于知识图谱的智能问答技术中,数据处理至关重要。企业现有的业务资源FAQ数据、各类系统操作文库数据以及客服系统的音频数据,原始状态下可能存在格式不统一、噪声干扰、冗余无效等问题,无法直接用于知识图谱构建。通过数据处理,能将这些杂乱的数据转化为高质量、结构化的数据输入,为后续图谱信息抽取、知识图谱构建奠定坚实基础,提升智能问答系统的准确性和有效性 ,从而更好地服务于业务场景,提高客户服务质量和效率。


4.图谱构建


图谱构建步骤如下:


需要强调的是,要使用好的模型减少知识加工的成本。


5.图谱查询


图谱查询通过对用户输入的问题进行语义解析与意图理解,将问题拆解为关键的实体、属性、关系和操作符等基本单元,并基于图谱中预定义的实体关系网络和属性结构,进行语义匹配与逻辑推理。


案例:用户问“物资发票如何退回?”


推理链条


6.大模型赋能知识图谱技术路线


大模型以其卓越的自然语言处理与智能推理能力,可深度赋能图谱构建及问答应用,全面支撑知识加工、知识表示、知识生成三大核心环节。通过自动化完成知识抽取、清洗等加工环节,大幅提升效率;运用向量表征技术统一编码结构化与非结构化知识,实现多模态知识的高效存储与检索;基于已有知识图谱动态推演,生成逻辑连贯、符合领域规范的新知识内容,推动知识体系持续进化。


7.知识图谱 schema设计


基于场景需求,按需设计schema,可选择性构建三类本体:


为知识图谱提供基础框架,支撑后续推理。


8.基于知识图谱平台的知识图谱构建流程


通过知识图谱平台,可以完成从图谱构建、图谱管理到可视化应用、搜索报表等全部图谱相关工作。


9.结合大模型的知识加工平台


结合大模型的知识加工平台,借助大模型强大的自然语言处理能力,能高效处理各类文本数据。它可在不同知识加工场景下,精准抽取实体、关系等知识要素,还能通过后台的持续学习迭代,不断提升知识加工的质量与效率,为用户提供更优质的知识服务。


03


关键痛点问题及解决路径总结


上图中总结了知识图谱构建过程中各阶段的关键痛点问题及解决路径。


在数据处理阶段,痛点在于多源异构数据整合困难以及数据质量不高,应对措施是运用NLP技术对文本数据标准化处理,优化ASR模型提升音频识别精度,建立清洗去噪流程。


知识抽取阶段,实体和关系抽取不准确、动态事件难建模是主要问题,通过训练定制化模型、结合规则与机器学习以及引入时间戳机制来解决。


知识融合阶段,实体冲突冗余和融合标准不统一是挑战,采用向量化表征实现实体对齐,协同制定融合规则并建立审查机制。


图谱问答阶段,复杂查询推理性能不足和问题语义理解偏差突出,通过优化数据库索引、引入分步推理和链试验证机制,以及扩充常见问题库并微调大模型等方式来应对。


04


结语


GraphRAG凭借知识图谱与大模型的深度融合与协同运作,为企业知识服务领域打造出切实可行、易于落地的创新技术方案。在当下,它已显著提升企业知识管理与应用的效能。展望未来,随着图计算技术的持续革新以及大模型性能的不断跃升,GraphRAG将解锁更多潜在应用场景。而实际落地时更应着眼于具体业务场景,将GraphRAG及其它相关技术深度嵌入企业业务流程,全方位赋能企业知识服务体系。

以上就是本次分享的内容,谢谢大家。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5