|
构建生产级 RAG(检索增强生成)AI 系统是一个艰难的任务。
?是 RAG 系统中的一些关键组件,你需要对它们进行管理和持续优化,以实现预期的效果(不要错过最后的 H 部分):
检索(Retrieval)
F) 数据切分(Chunking)- 如何对用于外部上下文的数据进行切分?- 滑动窗口(sliding window)或滚动窗口(tumbling window)进行切分。
- 在搜索时是检索父级或关联块,还是仅使用原始检索数据?
C) 选择嵌入模型(Choosing the embedding model)- 考虑上下文化嵌入(Contextual embeddings)。
D) 向量数据库(Vector Database)E) 向量搜索(Vector Search)- 查询路径的选择:先基于元数据还是先使用 ANN(近似最近邻)搜索?
G) 规则与启发式(Heuristics)- 在检索过程中应用的业务规则。
生成(Generation)
A) LLM 选择(Choosing the right Large Language Model)✅ 随着 LLM 的发展,这个问题变得越来越简单。当前,开源和专有 LLM 的性能正在趋同,主要的选择在于: - 使用专有模型(Proprietary model)。
B) Prompt 设计(Prompt Engineering)即使有了外部上下文,仍然需要精心设计 Prompt:
别忘了一个容易被忽略的部分
H) 观察、评估、监控和安全性(Observing, Evaluating, Monitoring and Securing)确保生产环境下的应用运行稳定、安全,并能持续优化!
|