链载Ai

标题: 让用户与数据库对话:使用Streamlit构建基于RAG的SQL助手 [打印本页]

作者: 链载Ai    时间: 昨天 20:53
标题: 让用户与数据库对话:使用Streamlit构建基于RAG的SQL助手

RAG(检索增强生成)系统通过利用大语言模型(LLM)并将其与特定数据源集成,使用户可以使用自然语言提出问题。

我将在本文重点介绍 RAG 的一个具体应用:将用户的自然语言转化成 SQL 查询并在数据库引擎上执行,最后以自然语言的形式返回结果。

最终我们将会得到一个能执行单表和联表查询的 SQL 助手:

我们的主要技术栈:

用于 SQL 的 RAG 系统

SQL 的 RAG 系统通过将 LLM 与真实数据库上下文结合,帮助生成更准确的结果。LLM 不仅仅依赖通用训练数据,而是利用检索到的上下文生成精确、实时的响应。这些上下文来自数据库的模式元数据。

当用户提出问题时,系统会自动将上下文与问题一起作为提示的一部分提供。这帮助 LLM 理解 SQL 方言、可用表、关系和列数据,从而构建语法和语义正确的查询。

这些查询随后提交给数据库引擎,检索到的结果被转化为自然语言。

我在本文的示例是使用 SQLite 数据库查询Northwind 数据集,SQLite 是一个轻量级本地数据库,常用于教程和演示。Northwind 数据集是一个经典的零售数据集,包含客户、产品、订单和员工数据。

系统概览:工作原理

下图展示了整体系统架构——用户、数据库和大型语言模型如何通过应用层交互。

工作原理:内部工作流程和工具

应用层内的工作流程通常分为以下几个阶段:

工作流程背后的关键工具

技术细节

现在让我们逐步了解其构建过程——从项目设置到数据库连接、模型编排和前端集成。

项目结构和前提条件

核心代码

db_connections.py:负责管理数据库链接,以及获取数据库中表相关重要元数据的代码。

sql_query_graph.py:定义了从接收用户问题、编写 SQL 查询、执行查询到生成最终答案的 4 个核心函数,最后使用 LangGraph 将这 4 个核心函数组织成逻辑工作流。

1. write_query:生成语法正确的 SQL 查询。

2.execute_query:使用 QuerySQLDatabaseTool 函数对选定数据库执行生成的 SQL 查询,并检索结果。
3.generate_answer:使用 SQL 查询结果生成对原始问题的自然语言回答。

4. answer_question:创建基于图的执行流程,按逻辑顺序连接每个函数:






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5