Agents介绍让我们通过探索 LLM 代理的各种示例。虽然这个话题被广泛讨论,但很少有人积极使用代理;通常,我们所认为的代理只是大型语言模型。让我们考虑这样一个简单的任务,例如搜索足球比赛结果并将其保存为 CSV 文件。我们可以比较几种可用的工具: 由于可用的工具不是很好,让我们从如何从头开始构建代理的首要原则中学习。
第 1 步:规划您可能遇到过各种旨在提高大型语言模型性能的技术,例如提供提示,甚至开玩笑地威胁他们。一种流行的技术被称为“思维链”,要求模型逐步思考,从而实现自我纠正。这种方法已经演变成更高级的版本,如“具有自洽性的思想链”和广义的“思想树”,其中创建、重新评估和整合多个想法以提供输出。 在本教程中,我使用了大量Langsmith,这是一个用于生产 LLM 应用程序的平台。例如,在构建思想树提示时,我将子提示保存在提示存储库中并加载它们: from langchain import hub from langchain.chains import SequentialChain
cot_step1 = hub.pull("rachnogstyle/nlw_jan24_cot_step1") cot_step2 = hub.pull("rachnogstyle/nlw_jan24_cot_step2") cot_step3 = hub.pull("rachnogstyle/nlw_jan24_cot_step3") cot_step4 = hub.pull("rachnogstyle/nlw_jan24_cot_step4")
model = "gpt-3.5-turbo"
chain1 = LLMChain( llm=ChatOpenAI(temperature=0, model=model), prompt=cot_step1, output_key="solutions" )
chain2 = LLMChain( llm=ChatOpenAI(temperature=0, model=model), prompt=cot_step2, output_key="review" )
chain3 = LLMChain( llm=ChatOpenAI(temperature=0, model=model), prompt=cot_step3, output_key="deepen_thought_process" )
chain4 = LLMChain( llm=ChatOpenAI(temperature=0, model=model), prompt=cot_step4, output_key="ranked_solutions" )
overall_chain = SequentialChain( chains=[chain1, chain2, chain3, chain4], input_variables=["input", "perfect_factors"], output_variables=["ranked_solutions"], verbose=True ) 你可以在这个笔记本中看到这种推理的结果,我想在这里要说的是定义你的推理步骤并在像 Langsmith 这样的 LLMOps 系统中对它们进行版本控制的正确过程。此外,您还可以在公共存储库(如 ReAct 或 Self-ask with search)中看到其他流行的推理技术示例: prompt = hub.pull("hwchase17/react") prompt = hub.pull("hwchase17/self-ask-with-search")其他值得注意的方法包括: 第 2 步:内存感觉记忆:记忆的这一组成部分捕捉即时的感官输入,例如我们看到、听到或感觉到的。在提示工程和 AI 模型的上下文中,提示充当瞬态输入,类似于瞬间触摸或感觉。这是触发模型处理的初始刺激。 短期记忆:短期记忆暂时保存信息,通常与正在进行的任务或对话有关。在提示工程中,这等同于保留最近的聊天记录。这种记忆使智能体能够在整个交互过程中保持上下文和连贯性,确保响应与当前对话保持一致。在代码中,通常将其添加为对话历史记录:
from langchain_community.chat_message_histories import ChatMessageHistory from langchain_core.runnables.history import RunnableWithMessageHistory from langchain.agents import AgentExecutor from langchain.agents import create_openai_functions_agent
llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0) tools = [retriever_tool] agent = create_openai_functions_agent( llm, tools, prompt) agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
message_history = ChatMessageHistory() agent_with_chat_history = RunnableWithMessageHistory( agent_executor, lambda session_id: message_history, input_messages_key="input", history_messages_key="chat_history", ) from langchain.text_splitter import RecursiveCharacterTextSplitter from langchain_community.document_loaders import WebBaseLoader from langchain_community.vectorstores import FAISS from langchain_openai import OpenAIEmbeddings
loader = WebBaseLoader("https://neurons-lab.com/") docs = loader.load() documents = RecursiveCharacterTextSplitter( chunk_size=1000, chunk_overlap=200 ).split_documents(docs) vector = FAISS.from_documents(documents, OpenAIEmbeddings()) retriever = vector.as_retriever() 第 3 步:工具ChatGPT插件和OpenAI API函数调用是 LLM 在实践中增强工具使用能力的好例子。 from langchain.utilities.tavily_search import TavilySearchAPIWrapper from langchain.tools.tavily_search import TavilySearchResults
search = TavilySearchAPIWrapper() tavily_tool = TavilySearchResults(api_wrapper=search)
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.0) agent_chain = initialize_agent( [retriever_tool, tavily_tool], llm, agent=AgentType.STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION, verbose=True, ) from langchain.pydantic_v1 import BaseModel, Field from langchain.tools import BaseTool, StructuredTool, tool
@tool def calculate_length_tool(a: str) -> int: """The function calculates the length of the input string.""" return len(a)
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.0) agent_chain = initialize_agent( [retriever_tool, tavily_tool, calculate_length_tool], llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, verbose=True, ) 你可以在这个脚本中找到它如何工作的示例,但你也可以看到一个错误——它没有提取 Neurons Lab 公司的正确描述,尽管调用了正确的长度计算自定义函数,但最终结果是错误的。让我们尝试修复它! 第 4 步:齐心协力我提供了一个干净的版本,在这个脚本中将所有架构部分组合在一起。请注意,我们如何轻松地分别分解和定义: 代理的最终定义将如下所示: llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0) agent = create_openai_functions_agent(llm, tools, prompt) agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True) agent_with_chat_history = RunnableWithMessageHistory( agent_executor, lambda session_id: message_history, input_messages_key="input", history_messages_key="chat_history", ) 正如您在脚本的输出中看到的(或者您可以自己运行它),它解决了上一部分中与工具相关的问题。发生了什么变化?我们定义了一个完整的架构,其中短期记忆起着至关重要的作用。我们的代理获得了消息历史记录和画板作为推理结构的一部分,这使得它能够提取正确的网站描述并计算其长度。 尾声我希望这个演练对 LLM 代理架构的核心元素的了解能够帮助你为要自动化的认知任务设计功能性机器人。最后,我想再次强调将代理的所有元素都到位的重要性。正如我们所看到的,缺少短期记忆或对工具的描述不完整可能会扰乱代理的推理,并提供不正确的答案,即使对于非常简单的任务,如摘要生成及其长度计算也是如此。
|