❝上节课,我们定义了AI航空客服助手需要使用的一系列API接口工具,并定义了一个简单的零样本代理作为用户的助手。没看过的同学可以点击链接LangGraph实战:从零分阶打造人工智能航空客服助手查阅。这次我们将讲述,如何通过LangGraph的特性,使得客服助手的行为更加可控 。
当智能助手代表用户执行操作时,用户几乎总是应该对是否执行这些操作拥有最终决定权。否则,即使是智能助手的一点小失误,或是它未能抵御的任何指令注入,都可能对用户造成实际损害。
在这部分,我们将利用LangGraph 的interrupt_before功能,在执行任何工具之前,暂停流程并把控制权交还给用户。
您的流程图可能看起来像这样:
流程图示例 和之前一样,我们首先定义状态:
状态与智能助手
我们的流程图状态和LLM调用与第一部分基本相同,除了:
我们新增了一个user_info字段,它将由我们的流程图主动填充
我们可以在Assistant对象中直接使用状态,而不是使用可配置的参数
from typing import Annotated from langchain_anthropic import ChatAnthropic from langchain_community.tools.tavily_search import TavilySearchResults from langchain_core.prompts import ChatPromptTemplate from langchain_core.runnables import Runnable, RunnableConfig from typing_extensions import TypedDict from langgraph.graph.message import AnyMessage, add_messages class State(TypedDict): messages: Annotated[list[AnyMessage], add_messages] user_info: str class Assistant: def __init__(self, runnable: Runnable): self.runnable = runnable def __call__(self, state: State, config: RunnableConfig): while True: passenger_id = config.get("passenger_id", None) result = self.runnable.invoke(state) # 如果大型语言模型恰好返回了一个空响应,我们将重新请求一个实际的响应。 if not result.tool_calls and ( not result.content or isinstance(result.content, list) and not result.content[0].get("text") ): messages = state["messages"] + [("user", "请给出真实的输出。")] state = {**state, "messages": messages} else: break return {"messages": result} # Haiku模型更快更经济,但准确性较低 # llm = ChatAnthropic(model="claude-3-haiku-20240307") llm = ChatAnthropic(model="claude-3-sonnet-20240229", temperature=1) # 你也可以使用OpenAI或其他模型,尽管你可能需要调整提示 # from langchain_openai import ChatOpenAI # llm = ChatOpenAI(model="gpt-4-turbo-preview") assistant_prompt = ChatPromptTemplate.from_messages( [ ( "system", "你是一个乐于助人的瑞士航空客户支持智能助手。" "利用提供的工具搜索航班、公司政策和其他信息,以帮助解答用户的疑问。" "在搜索时,要持之以恒。如果首次搜索没有结果,就扩大你的搜索范围。" "如果搜索依然一无所获,继续扩大搜索范围,不要轻言放弃。" "\n\n当前用户:\n<User>\n{user_info}\n</User>" "\n当前时间:{time}。", ), ("placeholder", "{messages}"), ] ).partial(time=datetime.now()) part_2_tools = [ TavilySearchResults(max_results=1), fetch_user_flight_information, search_flights, lookup_policy, update_ticket_to_new_flight, cancel_ticket, search_car_rentals, book_car_rental, update_car_rental, cancel_car_rental, search_hotels, book_hotel, update_hotel, cancel_hotel, search_trip_recommendations, book_excursion, update_excursion, cancel_excursion, ] part_2_assistant_runnable = assistant_prompt | llm.bind_tools(part_2_tools)
定义流程图
现在,创建流程图。根据第一部分的反馈,我们做出两个改变:
在第一个节点中明确填充用户状态,这样智能助手就不必通过使用工具来了解用户信息。
from langgraph.checkpoint.sqlite import SqliteSaver from langgraph.graph import END, StateGraph from langgraph.prebuilt import ToolNode, tools_condition builder = StateGraph(State) def user_info(state: State): return {"user_info": fetch_user_flight_information.invoke({})} # 新增:fetch_user_info节点首先执行,这意味着我们的智能助手可以在 # 不采取任何行动的情况下查看用户的航班信息 builder.add_node("fetch_user_info", user_info) builder.set_entry_point("fetch_user_info") builder.add_node("assistant", Assistant(part_2_assistant_runnable)) builder.add_node("action", create_tool_node_with_fallback(part_2_tools)) builder.add_edge("fetch_user_info", "assistant") builder.add_conditional_edges( "assistant", tools_condition, {"action": "action", END: END} ) builder.add_edge("action", "assistant") memory = SqliteSaver.from_conn_string(":memory:") part_2_graph = builder.compile( checkpointer=memory, # 新增:流程图在执行“action”节点之前总是暂停。 # 用户可以在智能助手继续之前批准或拒绝(甚至修改请求) interrupt_before=["action"], )
from IPython.display import Image, display try: display(Image(part_2_graph.get_graph(xray=True).draw_mermaid_png())) except: # 这需要一些额外的依赖项,并且是可选的 pass
流程图示例2
示例对话
现在,让我们通过以下对话示例来测试我们新修订的聊天机器人。
import shutil import uuid # 使用备份文件更新,以便我们可以从每个部分的起始点重新启动 shutil.copy(backup_file, db) thread_id = str(uuid.uuid4()) config = { "configurable": { # passenger_id在我们的航班工具中使用,以获取用户的航班信息 "passenger_id": "3442 587242", # 通过thread_id访问检查点 "thread_id": thread_id, } } _printed = set() # 我们可以重复使用第一部分的教程问题,以观察聊天机器人的表现。 for question in tutorial_questions: events = part_2_graph.stream( {"messages": ("user", question)}, config, stream_mode="values" ) for event in events: _print_event(event, _printed) snapshot = part_2_graph.get_state(config) while snapshot.next: # 我们遇到了一个中断!代理正试图使用一个工具,而用户可以批准或拒绝它 # 注意:这段代码位于你的流程图之外。通常,你会将输出流式传输到用户界面。 # 然后,你会在用户输入时,通过API调用触发一个新的运行。 user_input = input( "你同意上述操作吗?输入'y'以继续;" "否则,请说明你请求的更改。\n\n" ) if user_input.strip() == "y": # 继续执行 result = part_2_graph.invoke( None, config, ) else: # 通过提供关于请求更改/改变主意的说明,满足工具调用 result = part_2_graph.invoke( { "messages": [ ToolMessage( tool_call_id=event["messages"][-1].tool_calls[0]["id"], content=f"API调用被用户拒绝。理由:'{user_input}'. 继续协助,考虑用户的输入。", ) ] }, config, ) snapshot = part_2_graph.get_state(config)
第二部分回顾
现在,我们的智能助手能够节省一步来响应我们的航班详情。我们还完全控制了执行的操作。这一切都是通过LangGraph的interrupts和checkpointers实现的。中断暂停了流程图的执行,其状态使用配置的检查点器安全地持久化。用户随后可以在任何时候通过使用正确的配置运行它来启动它。
查看一个LangSmith示例跟踪,以更好地理解流程图是如何运行的。注意从这个跟踪中,你通常通过使用(None, config)调用流程图来恢复 流程。状态从检查点加载,就像它从未被中断过一样。
这个流程图工作得很好!但当需要我们参与每一个 智能助手的行动的要求,十分影响使用体验,并且助手在执行查询等动作时并不会影响实际业务。
在下一节中,我们将重新组织我们的流程图,以便我们只在实际写入数据库的“敏感”操作时才中断。