|
RAG(Retrieval Augmented Generation,检索增强生成)是一种结合信息检索和文本生成的技术范式。 RAG 技术就像给 AI 装上了「实时百科大脑」,通过先查资料后回答的机制,让 AI 摆脱传统模型的“知识遗忘”困境。 1. 文档切割 → 建立智能档案库- 给每个知识碎片打标签(如“技术规格”、“操作指南”)
? 关键价值:优质的知识切割如同图书馆分类系统,决定了后续检索效率2. 向量编码 → 构建语义地图? 示例效果:“续航时间”和“电池容量”会被编码为相似向量3. 相似检索 → 智能资料猎人应答触发流程:
4. 生成增强 → 专业报告撰写应答构建过程:
? 输出示例: “根据《产品手册v2.3》第5章内容:该设备续航时间为...” 配置类@Configurationpublic class RagConfig {
@BeanChatClient chatClient(ChatClient.Builder builder) {return builder.defaultSystem("你将作为一名机器人产品的专家,对于用户的使用需求作出解答").build();}
@BeanVectorStore vectorStore(EmbeddingModel embeddingModel) {SimpleVectorStore simpleVectorStore = SimpleVectorStore.builder(embeddingModel).build();
// 生成一个机器人产品说明书的文档List<Document> documents = List.of(new Document("产品说明书:产品名称:智能机器人\n" +"产品描述:智能机器人是一个智能设备,能够自动完成各种任务。\n" +"功能:\n" +"1. 自动导航:机器人能够自动导航到指定位置。\n" +"2. 自动抓取:机器人能够自动抓取物品。\n" +"3. 自动放置:机器人能够自动放置物品。\n"));
simpleVectorStore.add(documents);return simpleVectorStore;}
}
通过这个配置类,完成以下内容: 1、配置 ChatClient 作为 Bean,其中设置系统默认角色为机器人产品专家, 负责处理用户查询并生成回答向量存储配置。 2、初始化 SimpleVectorStore,加载机器人产品说明书文档,将文档转换为向量形式存储。SimpleVectorStore 是将向量保存在内存 ConcurrentHashmap 中,Spring AI 提供了多种存储方式,如 Redis、MongoDB 等,可以根据实际情况选择适合的存储方式。 检索增强服务@RestController@RequestMapping("/ai")public class RagController {
@Autowiredprivate ChatClient chatClient;
@Autowiredprivate VectorStore vectorStore;
@PostMapping(value = "/chat", produces = "text/plain; charset=UTF-8")public String generation(String userInput) {// 发起聊天请求并处理响应return chatClient.prompt().user(userInput).advisors(new QuestionAnswerAdvisor(vectorStore)).call().content();}}
通过添加 QuestionAnswerAdvisor 并提供对应的向量存储,可以将之前放入的文档作为参考资料,并生成增强回答。启动 Spring Boot 应用程序,并访问/ai/chat接口,传入用户问题,即可获取增强回答。如下:POST http://localhost:8080/spring-ai/ai/chat?userInput=机器人有哪些功能?
HTTP/1.1 200 Content-Type: text/plain;charset=UTF-8
根据您提供的智能机器人产品说明书,该机器人的主要功能包括:
1. 自动导航:机器人可以自动导航到指定的位置。2. 自动抓取:机器人能够自动抓取物品。3. 自动放置:机器人能够自动放置物品。
如果您需要更详细的信息或者关于其他功能的问题,请提供具体的需求,我会尽力帮助您。 这样测试结果,可以清晰地看到 AI 生成的回答,并参考了机器人产品说明书中的相关信息。Multi Query Expansion (多查询扩展)多查询扩展是提高 RAG 系统检索效果的关键技术。在实际应用中,用户的查询往往是简短且不完整的,这可能导致检索结果不够准确或完整。Spring AI 提供了强大的多查询扩展机制,能够自动生成多个相关的查询变体,从而提高检索的准确性和召回率。// 创建聊天客户端实例// 设置系统提示信息,定义AI助手作为专业的室内设计顾问角色ChatClient chatClient = builder.defaultSystem("你是一位专业的室内设计顾问,精通各种装修风格、材料选择和空间布局。请基于提供的参考资料,为用户提供专业、详细且实用的建议。在回答时,请注意:\n" +"1. 准确理解用户的具体需求\n" +"2. 结合参考资料中的实际案例\n" +"3. 提供专业的设计理念和原理解释\n" +"4. 考虑实用性、美观性和成本效益\n" +"5. 如有需要,可以提供替代方案").build();
// 构建查询扩展器// 用于生成多个相关的查询变体,以获得更全面的搜索结果MultiQueryExpander queryExpander = MultiQueryExpander.builder().chatClientBuilder(builder).includeOriginal(false) // 不包含原始查询.numberOfQueries(3) // 生成3个查询变体.build();
// 执行查询扩展// 将原始问题"请提供几种推荐的装修风格?"扩展成多个相关查询List<Query> queries = queryExpander.expand(new Query("请提供几种推荐的装修风格?"));
在这个过程中,系统会自动生成多个相关的查询变体,例如当用户查询“请提供几种推荐的装修风格?”时,系统会生成多个不同角度的查询。这种方式不仅提高了检索的全面性,还能捕获用户潜在的查询意图。 扩展后的查询内容:1.哪些装修风格最受欢迎?请推荐一些。2.能否推荐一些流行的家居装修风格?3.想了解不同的装修风格,有哪些是值得推荐的? 多查询扩展的主要优势: - 提高召回率:通过多个查询变体,增加相关文档的检索机会
查询重写是 RAG 系统中的一个重要优化技术,它能够将用户的原始查询转换成更加结构化和明确的形式。这种转换可以提高检索的准确性,并帮助系统更好地理解用户的真实意图。Spring AI 提供了 RewriteQueryTransformer 来实现查询重写功能。以下是一个具体的示例:// 创建一个模拟用户学习AI的查询场景Query query = new Query("我正在学习人工智能,什么是大语言模型?");
// 创建查询重写转换器QueryTransformer queryTransformer = RewriteQueryTransformer.builder().chatClientBuilder(builder).build();
// 执行查询重写Query transformedQuery = queryTransformer.transform(query);
// 输出重写后的查询System.out.println(transformedQuery.text());
重写后的查询可能会变成: 什么是大语言模型? 查询重写的主要优势:查询明确化:将模糊的问题转换为具体的查询点 这种转换不仅有助于系统检索到更相关的文档,还能帮助生成更全面和专业的回答。查询翻译是 RAG 系统中的一个实用功能,它能够将用户的查询从一种语言翻译成另一种语言。这对于多语言支持和跨语言检索特别有用。Spring AI 提供了 TranslationQueryTransformer 来实现这一功能。// 创建一个英文查询Query query = new Query("What is LLM?");
// 创建查询翻译转换器,设置目标语言为中文QueryTransformer queryTransformer = TranslationQueryTransformer.builder().chatClientBuilder(builder).targetLanguage("chinese")// 设置目标语言为中文.build();
// 执行查询翻译Query transformedQuery = queryTransformer.transform(query);
// 输出翻译后的查询System.out.println(transformedQuery.text());
翻译后的查询结果: 什么是大语言模型? 查询翻译的主要优势: Context-aware Queries (上下文感知查询)在实际对话中,用户的问题往往依赖于之前的对话上下文。下面通过一个房地产咨询的场景来说明上下文感知查询的实现://构建带有历史上下文的查询//这个例子模拟了一个房地产咨询场景,用户先问小区位置,再问房价Queryquery=Query.builder().text("那这个小区的二手房均价是多少?")//当前用户的提问.history(newUserMessage("深圳市南山区的碧海湾小区在哪里?"),//历史对话中用户的问题newAssistantMessage("碧海湾小区位于深圳市南山区后海中心区,临近后海地铁站。"))//AI的回答.build();在这个例子中: - 用户接着问“那这个小区的二手房均价是多少?”(当前查询)
如果不考虑上下文,系统将无法理解“这个小区”具体指的是哪个小区。为了解决这个问题,我们使用 CompressionQueryTransformer 来处理上下文信息: // 创建查询转换器// QueryTransformer用于将带有上下文的查询转换为完整的独立查询QueryTransformer queryTransformer = CompressionQueryTransformer.builder().chatClientBuilder(builder).build();
// 执行查询转换// 将模糊的代词引用("这个小区")转换为明确的实体名称("碧海湾小区")QuerytransformedQuery=queryTransformer.transform(query);
转换后的查询会变成更明确的形式,比如:“深圳市南山区碧海湾小区的二手房均价是多少?”。这种转换有以下优势: 提高准确性:使系统能够更精确地检索相关信息
输出结果:深圳市南山区碧海湾小区的二手房均价是多少? 在实际应用中,我们经常需要从多个查询或多个数据源获取文档。为了有效地管理和整合这些文档,Spring AI 提供了 ConcatenationDocumentJoiner 文档合并器。这个工具可以将多个来源的文档智能地合并成一个统一的文档集合。- 智能去重:当存在重复文档时,只保留第一次出现的文档
- 多源支持:支持同时处理来自不同查询和不同数据源的文档
以下是一个使用示例: // 从多个查询或数据源获取的文档集合Map<Query, List<List<Document>>> documentsForQuery = ...
// 创建文档合并器实例DocumentJoiner documentJoiner = new ConcatenationDocumentJoiner();
// 执行文档合并List<Document>documents=documentJoiner.join(documentsForQuery);
这种合并机制在以下场景特别有用: - 跨源检索:从不同的数据源(如数据库、文件系统)获取文档
- 查询扩展:使用查询扩展生成多个相关查询时,需要合并所有结果
增量更新:在现有文档集合中添加新的检索结果 检索增强顾问(RetrievalAugmentationAdvisor)RetrievalAugmentationAdvisor 是 Spring AI 提供的一个强大工具,它能够自动化地处理文档检索和查询增强过程。这个顾问组件将文档检索与查询处理无缝集成,使得 AI 助手能够基于检索到的相关文档提供更准确的回答。基础用法以下是 RetrievalAugmentationAdvisor 的基本使用示例:// 1. 初始化向量存储SimpleVectorStore vectorStore = SimpleVectorStore.builder(embeddingModel).build();
// 2. 添加文档到向量存储List<Document> documents = List.of(new Document("产品说明书:产品名称:智能机器人\n" +"产品描述:智能机器人是一个智能设备,能够自动完成各种任务。\n" +"功能:\n" +"1. 自动导航:机器人能够自动导航到指定位置。\n" +"2. 自动抓取:机器人能够自动抓取物品。\n" +"3. 自动放置:机器人能够自动放置物品。\n"));vectorStore.add(documents);
// 3. 创建检索增强顾问Advisor advisor = RetrievalAugmentationAdvisor.builder().documentRetriever(VectorStoreDocumentRetriever.builder().vectorStore(vectorStore).build()).build();
// 4. 在聊天客户端中使用顾问String response = chatClient.prompt().user("机器人有哪些功能?").advisors(advisor)// 添加检索增强顾问.call().content();
这个基础实现提供了以下功能:
高级配置选项RetrievalAugmentationAdvisor 支持多种高级配置:Advisoradvisor=RetrievalAugmentationAdvisor.builder()//配置查询增强器.queryAugmenter(ContextualQueryAugmenter.builder().allowEmptyContext(true)//允许空上下文查询.maxTokens(300)//限制查询长度.temperature(0.7)//控制查询扩展的创造性.build())//配置文档检索器.documentRetriever(VectorStoreDocumentRetriever.builder().vectorStore(vectorStore).similarityThreshold(0.5)//相似度阈值.topK(3)//返回文档数量.minScore(0.1)//最小匹配分数.maxDistance(0.8)//最大向量距离.build()).build(); 主要配置选项包括:
- 上下文处理策略:定义如何处理对话历史和上下文信息,包括上下文窗口大小、历史消息权重等
- 空值处理方式:指定当查询缺少某些参数时的处理策略,如使用默认值或抛出异常
- 查询转换规则:设置如何将原始查询转换为更有效的检索形式,包括同义词扩展、关键词提取等
- 相似度阈值设置:确定文档匹配的最低相似度要求,低于此阈值的文档将被过滤掉
- 返回结果数量限制:控制每次检索返回的最大文档数量,避免返回过多不相关的结果
- 文档过滤规则:定义基于元数据的过滤条件,如时间范围、文档类型、标签等
Document Selection (文档选择)在理解了检索增强顾问的基础上,我们来看看更复杂的文档选择机制。文档选择是 RAG 系统的核心组件之一,它决定了系统能够为用户提供多么准确和相关的信息。文档结构设计// 生成室内设计案例文档List<Document> documents = new ArrayList<>();
// 现代简约风格客厅案例documents.add(new Document("案例编号:LR-2023-001\n" +"项目概述:180平米大平层现代简约风格客厅改造\n" +"设计要点:\n" +"1. 采用5.2米挑高的落地窗,最大化自然采光\n" +"2. 主色调:云雾白(哑光,NCS S0500-N)配合莫兰迪灰\n" +"3. 家具选择:意大利B&B品牌真皮沙发,北欧白橡木茶几\n" +"4. 照明设计:嵌入式筒灯搭配意大利Flos吊灯\n" +"5. 软装配饰:进口黑胡桃木电视墙,几何图案地毯\n" +"空间效果:通透大气,适合商务接待和家庭日常起居",Map.of("type", "interior",// 文档类型"year", "2023",// 年份"month", "06", // 月份"location", "indoor", // 位置类型"style", "modern",// 装修风格"room", "living_room" // 房间类型)));
每个文档包含两个主要部分: - 文档内容:结构化的文本描述,包含项目编号、概述、详细信息等
- 元数据:用于快速筛选和分类的键值对,如类型、年份、位置等
高级检索实现// 1. 初始化向量存储SimpleVectorStore vectorStore = SimpleVectorStore.builder(embeddingModel).build();
// 2. 配置AI助手角色ChatClient chatClient = builder.defaultSystem("你是一位专业的室内设计顾问,精通各种装修风格、材料选择和空间布局。请基于提供的参考资料,为用户提供专业、详细且实用的建议。在回答时,请注意:\n" +"1. 准确理解用户的具体需求\n" +"2. 结合参考资料中的实际案例\n" +"3. 提供专业的设计理念和原理解释\n" +"4. 考虑实用性、美观性和成本效益\n" +"5. 如有需要,可以提供替代方案").build();
// 3. 构建复杂的文档过滤条件var b = new FilterExpressionBuilder();var filterExpression = b.and(b.and(b.eq("year", "2023"), // 筛选2023年的案例b.eq("location", "indoor")), // 仅选择室内案例b.and(b.eq("type", "interior"),// 类型为室内设计b.in("room", "living_room", "study", "kitchen")// 指定房间类型));
// 4. 配置文档检索器DocumentRetriever retriever = VectorStoreDocumentRetriever.builder().vectorStore(vectorStore).similarityThreshold(0.5)// 设置相似度阈值.topK(3) // 返回前3个最相关的文档.filterExpression(filterExpression.build()).build();
// 5. 创建上下文感知的查询增强器Advisor advisor = RetrievalAugmentationAdvisor.builder().queryAugmenter(ContextualQueryAugmenter.builder().allowEmptyContext(true).build()).documentRetriever(retriever).build();
// 6. 执行查询并获取响应String userQuestion = "根据已经提供的资料,请描述所有相关的场景风格,输出案例编号,尽可能详细地描述其内容。";String response = chatClient.prompt().user(userQuestion).advisors(advisor).call().content();
这个实现包含以下关键特性:
- 使用 FilterExpressionBuilder 构建复杂的过滤条件
- 支持精确匹配(eq)、范围查询(in)等多种过滤方式
- 通过 similarityThreshold 设置相似度阈值(0.3)
- 集成 ContextualQueryAugmenter 实现上下文感知
- 允许空上下文查询(allowEmptyContext)
- 使用 RetrievalAugmentationAdvisor 增强查询效果
通过这种多层次的文档选择机制,系统能够: Error Handling and Edge Cases (错误处理和边界情况)在生产环境中,RAG 系统需要优雅地处理各种边界情况,特别是文档检索失败或相关文档未找到的情况。通过使用 ContextualQueryAugmenter,我们可以实现更友好的错误处理机制:// 1. 构建检索增强顾问Advisor advisor = RetrievalAugmentationAdvisor.builder().queryAugmenter(ContextualQueryAugmenter.builder().allowEmptyContext(true)// 允许空上下文,避免NPE.build()).documentRetriever(retriever).build();
// 2. 执行查询并处理可能的异常return chatClient.prompt().user(query).advisors(advisor).call().getContent();
运行效果对比:
AI回答:I'msorry,butitappearsthatthespecificdetailsorreferencesyoumentionedforyourinteriordesignqueryarenotincludedinmycurrentknowledgebase.Toprovideyouwiththebestpossibleadvice,Iwouldneedmoreinformationaboutyourproject,suchasthestyleyou'reaimingfor,thesizeofthespace,yourbudget,andanyspecificelementsyouwanttoincludeoravoid.Ifyoucanprovidemoredetails,Iwouldbemorethanhappytooffertailoredadviceoninteriordesign,spaceplanning,materialselection,andmore. 修改后的结果展示: AI回答:很抱歉,您没有提供具体的参考资料或案例编号。为了能够提供详细的场景风格描述,我需要您提供具体的案例编号或者相关资料。一旦您提供了这些信息,我将能够准确地描述相关的场景风格,包括以下内容:
1. 设计风格和主题2. 空间布局和功能规划3. 材料选择和色彩搭配4. 灯光设计和氛围营造5. 家具配置和软装搭配
通过使用 ContextualQueryAugmenter,我们实现了以下改进:
这种错误处理方式不仅提供了更好的用户体验,还有助于收集更完整的用户需求信息,从而提供更准确的响应。在实际部署和运营 RAG 系统时,我们需要从多个维度来考虑系统的最佳实践。以下是完整的实践指南:文档结构设计- 结构化内容:文档应包含清晰的结构,如案例编号、项目概述、设计要点等
Map.of("type","interior",//文档类型"year","2023",//年份"style","modern"//风格类型)文档切割策略多查询扩展(Multi Query Expansion)查询重写和翻译- 使用 RewriteQueryTransformer 优化查询结构
- 配置 TranslationQueryTransformer 支持多语言
向量存储配置SimpleVectorStorevectorStore=SimpleVectorStore.builder(embeddingModel).build(); 选择合适的向量存储方案 - 根据数据规模选择存储方式(内存/Redis/MongoDB)
检索器配置DocumentRetrieverretriever=VectorStoreDocumentRetriever.builder().vectorStore(vectorStore).similarityThreshold(0.5)//相似度阈值.topK(3)//返回文档数量.build(); 异常处理边界情况处理ContextualQueryAugmenter.builder().allowEmptyContext(true).build() AI 助手配置ChatClientchatClient=builder.defaultSystem("你是一位专业的顾问,请注意:\n"+"1.准确理解用户需求\n"+"2.结合参考资料\n"+"3.提供专业解释\n"+"4.考虑实用性\n"+"5.提供替代方案").build();查询优化资源管理通过遵循以上最佳实践,可以构建一个高效、可靠的 RAG 系统,为用户提供准确和专业的回答。这些实践涵盖了从文档处理到系统配置的各个方面,能够帮助开发者构建更好的 RAG 应用。 |