随着人工智能技术的快速发展,ChatGPT 不再仅仅是一个回答问题的机器人,它已经进化为可以执行复杂任务的强大工具。这一切的背后,离不开它的 Function Calling(函数调用)机制。本文将为你详细解析这一扩展功能,揭示 ChatGPT 如何在对话过程中调用预定义函数,完成特定任务,提供实时、个性化的服务。
一、 背景与概念ChatGPT 的 Function Calling 机制允许模型调用外部函数获取信息或执行操作。这种机制不仅增强了模型的功能,使其能够处理更复杂的任务,还大大扩展了 AI 在实际应用中的能力范围。不再局限于静态知识库的回答,ChatGPT 通过 Function Calling 可以动态获取最新信息,执行特定操作,极大提高了实用性和灵活性。
二、主要组件Function Calling 机制主要由以下几个关键组件构成:- 函数定义:预先定义可调用的函数,包括名称、参数类型和返回值类型等。
- 函数调用请求:用户或系统发出的调用请求,包含函数名称及所需参数。
- 函数执行器:实际执行函数的组件,可能是外部的 API 或本地逻辑处理器。
- 结果返回:函数执行完毕后,返回结果给 ChatGPT,继续对话。
三、 Function Calling 机制详细解析一个应用如何与OpenAI的API进行交互,通过发送函数定义,接收参数,调用函数,再将结果与其他信息结合生成最终的回答,并返回给用户。下面是每一步的详细说明:一个应用如何与 OpenAI 的 API 进行交互?以下是详细的步骤说明:
- OpenAI 将函数结果与其他相关信息结合,生成完整的回答。
四. 安全与控制为了确保安全性和控制,函数调用机制通常包括以下措施:- 错误处理:处理函数调用过程中可能出现的错误,如网络错误、参数错误等。
五. 示例应用- 信息查询:调用外部 API 获取天气、新闻、股票价格等实时信息。
- 操作执行:调用函数执行系统操作,如发送邮件、创建日历事件等。
- 数据处理:调用数据处理函数,如数据分析、图表生成等。
import openaiimport osfrom math import *from icecream import icimport json
# 加载 .env 文件from dotenv import load_dotenv, find_dotenv_ = load_dotenv(find_dotenv())
# 从环境变量中获得你的 OpenAI Keyopenai.api_key = os.getenv('OPENAI_API_KEY')openai.api_base = os.getenv('OPENAI_API_URL')model = os.getenv('MODEL')
# 基于 prompt 生成文本def get_completion3(messages, model=model):response = openai.ChatCompletion.create( # 注意,以前的 openai.ChatCompletion 要换成 openai.chat.completionsmodel=model,messages=messages,temperature=0,# 模型输出的随机性,0 表示随机性最小tools=[{# 用 JSON 描述函数。可以定义多个。由大模型决定调用谁"type": "function","function": {"name": "sum","description": "计算一组数的加和","parameters": {"type": "object","properties": {"numbers": {"type": "array","items": {"type": "number"}}}}}}],)return response.choices[0].message
def test_promopt():prompt = "Tell me the sum of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10."#prompt = "桌上有 2 个苹果,四个桃子和 3 本书,一共有几个水果?"#prompt = "1+2+3...+99+100"
messages = [{"role": "system", "content": "你是一个小学数学老师,你要教学生加法"},{"role": "user", "content": prompt}]response = get_completion3(messages)
# 把大模型的回复加入到对话历史中if (response.content is None):# 解决 OpenAI 的一个 400 bugresponse.content = "null"messages.append(response)
# 如果返回的是函数调用结果,则打印出来if (response.tool_calls is not None):# 是否要调用 sumtool_call = response.tool_calls[0]if (tool_call.function.name == "sum"):# 调用 sumargs = json.loads(tool_call.function.arguments)result = sum(args["numbers"])
# 把函数调用结果加入到对话历史中messages.append({"tool_call_id": tool_call.id,# 用于标识函数调用的 ID"role": "tool","name": "sum","content": str(result)# 数值result 必须转成字符串})
# 再次调用大模型ic("=====最终回复=====")ic(get_completion3(messages).content)
if __name__ == '__main__': test_promopt()
ic|'=====最终回复====='ic|get_completion3(messages).content:'Thesumof1,2,3,4,5,6,7,8,9,10is55.' import openaiimport osfrom math import *from icecream import icimport jsonfrom math import *
# 加载 .env 文件from dotenv import load_dotenv, find_dotenv_ = load_dotenv(find_dotenv())
# 从环境变量中获得你的 OpenAI Keyopenai.api_key = os.getenv('OPENAI_API_KEY')openai.api_base = os.getenv('OPENAI_API_URL')model = os.getenv('MODEL')
# 基于 prompt 生成文本def get_completion(messages, model=model):response = openai.ChatCompletion.create( # 注意,以前的 openai.ChatCompletion 要换成 openai.chat.completionsmodel=model,messages=messages,temperature=0,# 模型输出的随机性,0 表示随机性最小tools=[{"type": "function","function": {"name": "calculate","description": "计算一个数学表达式的值","parameters": {"type": "object","properties": {"expression": {"type": "string","description": "a mathematical expression in python grammar.",}}}}}],)return response.choices[0].message
def test_promopt():#prompt = "从1加到10"prompt = "3的平方根乘以2再开平方"
messages = [{"role": "system", "content": "你是一个数学家,你可以计算任何算式。"},{"role": "user", "content": prompt}]response = get_completion(messages)if (response.content is None):# 解决 OpenAI 的一个 400 bugresponse.content = "null"messages.append(response)# 把大模型的回复加入到对话中ic("=====GPT回复=====")ic(response)
# 如果返回的是函数调用结果,则打印出来if (response.tool_calls is not None):# 是否要调用 sumtool_call = response.tool_calls[0]if (tool_call.function.name == "calculate"):# 调用 calculateargs = json.loads(tool_call.function.arguments)result = eval(args["expression"])ic("=====函数返回=====")ic(result)
# 把函数调用结果加入到对话历史中messages.append({"tool_call_id": tool_call.id,# 用于标识函数调用的 ID"role": "tool","name": "calculate","content": str(result)# 数值result 必须转成字符串})
# 再次调用大模型ic("=====最终回复=====")ic(get_completion(messages).content)
if __name__ == '__main__': test_promopt()
ic|'=====GPT回复====='ic|response:<OpenAIObjectat0x1a97b6d3480>JSON:{"role":"assistant","content":"null","tool_calls":[{"id":"call_jSVjTMqMIMUHYCpDisvpYInp","type":"function","function":{"name":"calculate","arguments":"{\"expression\":\"((3**0.5)*2)**0.5\"}"}}]}ic|'=====函数返回====='ic|result:1.8612097182041991ic|'=====最终回复====='ic|get_completion(messages).content:'3的平方根乘以2再开平方的结果约为1.8612。'3、从一段文字中抽取联系人姓名、地址和电话,用 Function Calling 获取 JSON 结构轻松解决,在没有大模型之前非常难解决的问题import openaiimport osfrom math import *from icecream import icimport jsonfrom math import *import requestsimport logging# 设置日志记录配置logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
# 加载 .env 文件from dotenv import load_dotenv, find_dotenv_ = load_dotenv(find_dotenv())
# 从环境变量中获得你的 OpenAI Keyopenai.api_key = os.getenv('OPENAI_API_KEY')openai.api_base = os.getenv('OPENAI_API_URL')model = os.getenv('MODEL')amap_key = os.getenv('GAODE_MAP_API_KEY')
def get_completion(messages, model=model):response = openai.ChatCompletion.create(model=model,messages=messages,temperature=0,# 模型输出的随机性,0 表示随机性最小tools=[{"type": "function","function": {"name": "add_contact","description": "添加联系人","parameters": {"type": "object","properties": {"name": {"type": "string","description": "联系人姓名"},"address": {"type": "string","description": "联系人地址"},"tel": {"type": "string","description": "联系人电话"},}}}}],)return response.choices[0].message
def test_promopt():prompt = "帮我寄给星城老谭,地址是湖南省长沙市岳麓区湘江壹号8楼,电话18874868888。"messages = [{"role": "system", "content": "你是一个联系人录入员。"},{"role": "user", "content": prompt}]response = get_completion(messages)logging.info("====GPT回复====")logging.info(response)args = json.loads(response.tool_calls[0].function.arguments)logging.info("====函数参数====")logging.info(args)
if __name__ == '__main__': test_promopt()
2024-06-0513:31:30,121-INFO-====GPT回复====2024-06-0513:31:30,124-INFO-{"role":"assistant","content":null,"tool_calls":[{"id":"call_QEnFRbZRBs2Eww4YbUxP7oKv","type":"function","function":{"name":"add_contact","arguments":"{\"name\":\"\u661f\u57ce\u8001\u8c2d\",\"address\":\"\u6e56\u5357\u7701\u957f\u6c99\u5e02\u5cb3\u9e93\u533a\u6e58\u6c5f\u58f9\u53f78\u697c\",\"tel\":\"18874868888\"}"}}]}2024-06-0513:31:30,124-INFO-====函数参数====2024-06-0513:31:30,125-INFO-{'name':'星城老谭','address':'湖南省长沙市岳麓区湘江壹号8楼','tel':'1887486XXXX'}ChatGPT 的 Function Calling 机制极大地扩展了其功能,使其能够在对话中动态调用外部函数,提供实时、个性化和互动的服务。这一机制不仅提升了用户体验,也为开发者提供了强大的工具,帮助他们构建更智能、更强大的对话系统和应用。理解并善用这一机制,能让你在 AI 应用开发中占据领先地位。通过这篇文章,希望你对 ChatGPT 的 Function Calling 机制有了更深入的了解。未来,随着这一技术的不断发展,我们可以期待更多令人惊喜的应用场景。
|