链载Ai

标题: 再看Medical Graph RAG增强医疗问答方案:兼读RAG中的细粒度引文生成思路 [打印本页]

作者: 链载Ai    时间: 昨天 10:59
标题: 再看Medical Graph RAG增强医疗问答方案:兼读RAG中的细粒度引文生成思路

今天是2024年8月10日,星期六,北京,天气晴。

最近两天,出现了多个关于RAG相关的工作,很有趣,我们来系统回顾昨日的一些事儿。

此外,老刘社区分享一个中文简称词库,文件见社区如上。

值得注意的是,社区成员提醒,在少数别有用心的特定提示下,GPT-4o还会发出非常不宜的语音,比如暴力的尖叫和枪声。这些别有用心的特定提示太可怕了,建议强调一下,应用开发中必须得采取严格的措施来过滤,这是非常严肃和重要的事情

我们今天选择其中关于RAG的几个代表性的一些工作,包括关于RAG中的细粒度引文生成思路、Medical Graph RAG做医疗领域问答的方案(温习一下),来看看,会有收获。

一、关于RAG中的细粒度引文生成思路

引文生成是当前RAG落地过程中的一个重要议题,但目前许多都是基于大模型微调的方案进行。

大模型中生成精细引用:《Learning Fine-Grained Grounded Citations for Attributed Large Language Models》,https://arxiv.org/pdf/2408.04568,代码在https://github.com/LuckyyySTA/Fine-grained-Attribution。

可以看看自动数据生成流程和两阶段训练框架FRONT。

1、自动数据生成

包括数据收集、属性答案生成和数据过滤三个核心组件。

具体地:

  1. 数据收集(Data Collection):







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5