链载Ai

标题: Langchain 的 LLM 代理简介:当 RAG 有局限性怎么办 [打印本页]

作者: 链载Ai    时间: 昨天 22:22
标题: Langchain 的 LLM 代理简介:当 RAG 有局限性怎么办

Agents介绍

让我们通过探索 LLM 代理的各种示例。虽然这个话题被广泛讨论,但很少有人积极使用代理;通常,我们所认为的代理只是大型语言模型。让我们考虑这样一个简单的任务,例如搜索足球比赛结果并将其保存为 CSV 文件。我们可以比较几种可用的工具:

由于可用的工具不是很好,让我们从如何从头开始构建代理的首要原则中学习。

第 1 步:规划

您可能遇到过各种旨在提高大型语言模型性能的技术,例如提供提示,甚至开玩笑地威胁他们。一种流行的技术被称为“思维链”,要求模型逐步思考,从而实现自我纠正。这种方法已经演变成更高级的版本,如“具有自洽性的思想链”和广义的“思想树”,其中创建、重新评估和整合多个想法以提供输出

在本教程中,我使用了大量Langsmith,这是一个用于生产 LLM 应用程序的平台。例如,在构建思想树提示时,我将子提示保存在提示存储库中并加载它们:

from langchain import hub
from langchain.chains import SequentialChain

cot_step1 = hub.pull("rachnogstyle/nlw_jan24_cot_step1")
cot_step2 = hub.pull("rachnogstyle/nlw_jan24_cot_step2")
cot_step3 = hub.pull("rachnogstyle/nlw_jan24_cot_step3")
cot_step4 = hub.pull("rachnogstyle/nlw_jan24_cot_step4")

model = "gpt-3.5-turbo"

chain1 = LLMChain(
llm=ChatOpenAI(temperature=0, model=model),
prompt=cot_step1,
output_key="solutions"
)

chain2 = LLMChain(
llm=ChatOpenAI(temperature=0, model=model),
prompt=cot_step2,
output_key="review"
)

chain3 = LLMChain(
llm=ChatOpenAI(temperature=0, model=model),
prompt=cot_step3,
output_key="deepen_thought_process"
)

chain4 = LLMChain(
llm=ChatOpenAI(temperature=0, model=model),
prompt=cot_step4,
output_key="ranked_solutions"
)

overall_chain = SequentialChain(
chains=[chain1, chain2, chain3, chain4],
input_variables=["input", "perfect_factors"],
output_variables=["ranked_solutions"],
verbose=True
)

你可以在这个笔记本中看到这种推理的结果,我想在这里要说的是定义你的推理步骤并在像 Langsmith 这样的 LLMOps 系统中对它们进行版本控制的正确过程。此外,您还可以在公共存储库(如 ReAct 或 Self-ask with search)中看到其他流行的推理技术示例:

prompt = hub.pull("hwchase17/react")
prompt = hub.pull("hwchase17/self-ask-with-search")

其他值得注意的方法包括:

第 2 步:内存

from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain.agents import AgentExecutor
from langchain.agents import create_openai_functions_agent

llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)
tools = [retriever_tool]
agent = create_openai_functions_agent(
llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

message_history = ChatMessageHistory()
agent_with_chat_history = RunnableWithMessageHistory(
agent_executor,
lambda session_id: message_history,
input_messages_key="input",
history_messages_key="chat_history",
)
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.vectorstores import FAISS
from langchain_openai import OpenAIEmbeddings

loader = WebBaseLoader("https://neurons-lab.com/")
docs = loader.load()
documents = RecursiveCharacterTextSplitter(
chunk_size=1000, chunk_overlap=200
).split_documents(docs)
vector = FAISS.from_documents(documents, OpenAIEmbeddings())
retriever = vector.as_retriever()

第 3 步:工具

ChatGPT插件和OpenAI API函数调用是 LLM 在实践中增强工具使用能力的好例子。

from langchain.utilities.tavily_search import TavilySearchAPIWrapper
from langchain.tools.tavily_search import TavilySearchResults

search = TavilySearchAPIWrapper()
tavily_tool = TavilySearchResults(api_wrapper=search)

llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.0)
agent_chain = initialize_agent(
[retriever_tool, tavily_tool],
llm,
agent=AgentType.STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION,
verbose=True,
)
from langchain.pydantic_v1 import BaseModel, Field
from langchain.tools import BaseTool, StructuredTool, tool

@tool
def calculate_length_tool(a: str) -> int:
"""The function calculates the length of the input string."""
return len(a)

llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.0)
agent_chain = initialize_agent(
[retriever_tool, tavily_tool, calculate_length_tool],
llm,
agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
verbose=True,
)

你可以在这个脚本中找到它如何工作的示例,但你也可以看到一个错误——它没有提取 Neurons Lab 公司的正确描述,尽管调用了正确的长度计算自定义函数,但最终结果是错误的。让我们尝试修复它!

第 4 步:齐心协力

我提供了一个干净的版本,在这个脚本中将所有架构部分组合在一起。请注意,我们如何轻松地分别分解和定义:

代理的最终定义将如下所示:

llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)
agent = create_openai_functions_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
agent_with_chat_history = RunnableWithMessageHistory(
agent_executor,
lambda session_id: message_history,
input_messages_key="input",
history_messages_key="chat_history",
)

正如您在脚本的输出中看到的(或者您可以自己运行它),它解决了上一部分中与工具相关的问题。发生了什么变化?我们定义了一个完整的架构,其中短期记忆起着至关重要的作用。我们的代理获得了消息历史记录和画板作为推理结构的一部分,这使得它能够提取正确的网站描述并计算其长度。

尾声

我希望这个演练对 LLM 代理架构的核心元素的了解能够帮助你为要自动化的认知任务设计功能性机器人。最后,我想再次强调将代理的所有元素都到位的重要性。正如我们所看到的,缺少短期记忆或对工具的描述不完整可能会扰乱代理的推理,并提供不正确的答案,即使对于非常简单的任务,如摘要生成及其长度计算也是如此。







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5