链载Ai

标题: LLM 大模型框架 LangChain 可观测性最佳实践 [打印本页]

作者: 链载Ai    时间: 昨天 09:35
标题: LLM 大模型框架 LangChain 可观测性最佳实践


LLM(Large Language Model)大模型的可观测性是指对模型内部运行过程的理解和监控能力。由于LLM大模型通常具有庞大的参数量和复杂的网络结构,因此对其内部状态和运行过程的理解和监控是一个重要的问题。


什么是 LangChain?


LangChain 是一个开源的应用开发框架,旨在将大型语言模型(LLM)与开发者现有的知识和系统相结合,以提供更智能化的服务。具体来说,LangChain 可以帮助开发者f轻松地管理与 LLM 的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。


此外,LangChain 还提供了多种工具、组件和接口,以简化创建由 LLM 提供支持的应用程序的过程。例如,它提供了模型输入/输出管理工具,用于管理 LLM 及其输入和格式化输出;Prompt 模板支持自定义 Prompt 工程的快速实现以及和 LLMs 的对接;Utils 组件提供了大模型常见的植入能力的封装,如搜索引擎、Python 编译器、Bash 编译器、数据库等;Chains 组件则提供了大模型针对一系列任务的顺序执行逻辑链。


因此,LangChain 的应用场景非常广泛,可以应用于自然语言处理、聊天机器人、智能客服、文本生成等多个领域。同时,由于其开源的特性,LangChain 也可以被广大开发者用于定制开发自己的 LLM 应用,从而推动人工智能技术的不断发展和创新。


LangChain 可观测性体系



LangChain 本身并没有提供可观测性能力,但可以通过集成其他工具来实现对 LangChain 应用的可观测性,以此来提高大模型的可解释性和可控性。



需要注意的是,可观测性方案的选择和实施应根据具体的应用场景和需求进行定制。


LangChain 可观测性接入方案



准备工作

安装 DataKit


token 在「观测云控制台」-「集成」-「Datakit」 上面获取。


DK_DATAWAY="https://openway.guance.com?token=tkn_xxxxxx"bash-c"$(curl-Lhttps://static.guance.com/datakit/install.sh)"



DataKit 采集器配置



DDTrace 采集器用于采集链路信息,进入到 DataKit 安装目录下,执行 conf.d/ddtrace/,复制 ddtrace.conf.sample 并重命名为 ddtrace.conf 。



StatsD 采集器用于采集指标信息,默认端口为 8125 。



systemctlrestartdatakit


准备 OpenAI API Key


在 Langchain 应用中使用 OpenAI 的模型,需要一个 API Key,点击 https://platform.openai.com/account/api-keys 创建你的 API Key。



模拟 LLM 应用并接入观测云

主要实现了一个基于 OpenAI 的 GPT-3.5 模型的聊天对话系统,并设置了一个函数来跟踪 API 令牌的使用情况。



pipinstalllangchainpipinstallopenaipipinstallddtrace



使用 Langchain 创建 LLM,模型选择 gpt-3.5 。


llm=ChatOpenAI(model='gpt-3.5-turbo',temperature=0)



创建一个 ConversationChain 对象,传入之前创建的 llm 对象,设置 verbose 为 True(表示输出详细的调试信息),并使用 ConversationBufferMemory 作为记忆储存。


conversation=ConversationChain(llm=llm,verbose=True,memory=ConversationBufferMemory())



定义一个函数 track_tokens_usage ,它接受一个对话链和一个查询作为参数。


deftrack_tokens_usage(chain,query):withget_openai_callback()ascb:result=chain.run(query)print(f"prompttoken{cb.prompt_tokens},restoken{cb.completion_tokens},totaltoken{cb.total_tokens}")print(f"successfulrequests{cb.successful_requests},totalcost{cb.total_cost}USD")print(result)returnresult


通过回调函数 get_openai_callback 创建一个回调对象 cb ,并通过对象 cb 可以获取请求相关信息:请求数、消耗金额、令牌数量等。



track_tokens_usage(conversation,"介绍一下观测云可观测性的产品及优势")


由于执行完成后,进程会退出,添加以下代码阻止退出,方便相关数据及时上报。


print("脚本执行完成,按Enter键退出...")input()



DD_SERVICE="my-langchain"DD_ENV="dev"DD_AGENT_HOST="localhost"DD_AGENT_PORT="9529"ddtrace-runpython3langchain_demo.py



LangChain 可观测性实践效果






常见问题



Token 异常

如果没有配置 Token,则会报错:


pydantic.v1.error_wrappers.ValidationError:1validationerrorforChatOpenAI__root__Didnotfindopenai_api_key,pleaseaddanenvironmentvariable`OPENAI_API_KEY`whichcontainsit,orpass`openai_api_key`asanamedparameter.(type=value_error)


关于 Token,可以在代码中定义:


importosos.environ["OPENAI_API_KEY"]='sk-...DcE2'


但不建议那么做,可以使用环境变量方式:


OPENAI_API_KEY="sk-...DcE2"



余额不足


openai.RateLimitError:Errorcode:429-{'error':{'message':'Youexceededyourcurrentquota,pleasecheckyourplanandbillingdetails.Formoreinformationonthiserror,readthedocs:https://platform.openai.com/docs/guides/error-codes/api-errors.','type':'insufficient_quota','param':None,'code':'insufficient_quota'}}



代理

如需配置代理,可以加入以下配置:


importosos.environ["http_proxy"]="http://localhost:7890"os.environ["https_proxy"]="http://localhost:7890"



其他第三方 API

如果需要更换第三方 API 地址,可以使用以下方式:


importosos.environ["OPENAI_API_BASE"]='https://chatapi.a3e.top/v1'







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5