大模型为什么能把业务系统拉通?Function Calling全面解析

显示全部楼层

随着人工智能技术的快速发展，ChatGPT 不再仅仅是一个回答问题的机器人，它已经进化为可以执行复杂任务的强大工具。这一切的背后，离不开它的 Function Calling（函数调用）机制。本文将为你详细解析这一扩展功能，揭示 ChatGPT 如何在对话过程中调用预定义函数，完成特定任务，提供实时、个性化的服务。

一、背景与概念

ChatGPT 的 Function Calling 机制允许模型调用外部函数获取信息或执行操作。这种机制不仅增强了模型的功能，使其能够处理更复杂的任务，还大大扩展了 AI 在实际应用中的能力范围。不再局限于静态知识库的回答，ChatGPT 通过 Function Calling 可以动态获取最新信息，执行特定操作，极大提高了实用性和灵活性。

二、主要组件

Function Calling 机制主要由以下几个关键组件构成：

函数定义：预先定义可调用的函数，包括名称、参数类型和返回值类型等。
函数调用请求：用户或系统发出的调用请求，包含函数名称及所需参数。
函数执行器：实际执行函数的组件，可能是外部的 API 或本地逻辑处理器。
结果返回：函数执行完毕后，返回结果给 ChatGPT，继续对话。

三、 Function Calling 机制详细解析

一个应用如何与OpenAI的API进行交互，通过发送函数定义，接收参数，调用函数，再将结果与其他信息结合生成最终的回答，并返回给用户。下面是每一步的详细说明：

一个应用如何与 OpenAI 的 API 进行交互？以下是详细的步骤说明：

传入函数定义：

应用服务将函数定义传递给 OpenAI。

返回调用参数：

OpenAI 返回调用函数所需的参数。

调用函数：

应用服务使用这些参数调用相应的函数。

传入结果：

函数调用结果被传递回 OpenAI。

组合回答：

OpenAI 将函数结果与其他相关信息结合，生成完整的回答。

返回答案：

最终回答通过应用服务返回给用户。

四. 安全与控制

为了确保安全性和控制，函数调用机制通常包括以下措施：

权限控制：仅允许调用经过安全审查的函数。
输入验证：验证输入参数的合法性，防止恶意输入。
错误处理：处理函数调用过程中可能出现的错误，如网络错误、参数错误等。

五. 示例应用

这种机制在许多应用场景中非常有用，例如：

信息查询：调用外部 API 获取天气、新闻、股票价格等实时信息。
操作执行：调用函数执行系统操作，如发送邮件、创建日历事件等。
数据处理：调用数据处理函数，如数据分析、图表生成等。

六、案例实现

1、调用本地函数计算一个数学表达式的值

import openaiimport osfrom math import *from icecream import icimport json
# 加载 .env 文件from dotenv import load_dotenv, find_dotenv_ = load_dotenv(find_dotenv())
# 从环境变量中获得你的 OpenAI Keyopenai.api_key = os.getenv('OPENAI_API_KEY')openai.api_base = os.getenv('OPENAI_API_URL')model = os.getenv('MODEL')
# 基于 prompt 生成文本def get_completion3(messages, model=model):response = openai.ChatCompletion.create( # 注意，以前的 openai.ChatCompletion 要换成 openai.chat.completionsmodel=model,messages=messages,temperature=0,# 模型输出的随机性，0 表示随机性最小tools=[{# 用 JSON 描述函数。可以定义多个。由大模型决定调用谁"type": "function","function": {"name": "sum","description": "计算一组数的加和","parameters": {"type": "object","properties": {"numbers": {"type": "array","items": {"type": "number"}}}}}}],)return response.choices[0].message
def test_promopt():prompt = "Tell me the sum of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10."#prompt = "桌上有 2 个苹果，四个桃子和 3 本书，一共有几个水果？"#prompt = "1+2+3...+99+100"
messages = [{"role": "system", "content": "你是一个小学数学老师，你要教学生加法"},{"role": "user", "content": prompt}]response = get_completion3(messages)
# 把大模型的回复加入到对话历史中if (response.content is None):# 解决 OpenAI 的一个 400 bugresponse.content = "null"messages.append(response)

# 如果返回的是函数调用结果，则打印出来if (response.tool_calls is not None):# 是否要调用 sumtool_call = response.tool_calls[0]if (tool_call.function.name == "sum"):# 调用 sumargs = json.loads(tool_call.function.arguments)result = sum(args["numbers"])
# 把函数调用结果加入到对话历史中messages.append({"tool_call_id": tool_call.id,# 用于标识函数调用的 ID"role": "tool","name": "sum","content": str(result)# 数值result 必须转成字符串})
# 再次调用大模型ic("=====最终回复=====")ic(get_completion3(messages).content)

if __name__ == '__main__': test_promopt()

输出

ic|'=====最终回复====='ic|get_completion3(messages).content:'Thesumof1,2,3,4,5,6,7,8,9,10is55.'

2、通过代码套代码实现可以算任意数学表达式需求

import openaiimport osfrom math import *from icecream import icimport jsonfrom math import *
# 加载 .env 文件from dotenv import load_dotenv, find_dotenv_ = load_dotenv(find_dotenv())
# 从环境变量中获得你的 OpenAI Keyopenai.api_key = os.getenv('OPENAI_API_KEY')openai.api_base = os.getenv('OPENAI_API_URL')model = os.getenv('MODEL')
# 基于 prompt 生成文本def get_completion(messages, model=model):response = openai.ChatCompletion.create( # 注意，以前的 openai.ChatCompletion 要换成 openai.chat.completionsmodel=model,messages=messages,temperature=0,# 模型输出的随机性，0 表示随机性最小tools=[{"type": "function","function": {"name": "calculate","description": "计算一个数学表达式的值","parameters": {"type": "object","properties": {"expression": {"type": "string","description": "a mathematical expression in python grammar.",}}}}}],)return response.choices[0].message
def test_promopt():#prompt = "从1加到10"prompt = "3的平方根乘以2再开平方"
messages = [{"role": "system", "content": "你是一个数学家，你可以计算任何算式。"},{"role": "user", "content": prompt}]response = get_completion(messages)if (response.content is None):# 解决 OpenAI 的一个 400 bugresponse.content = "null"messages.append(response)# 把大模型的回复加入到对话中ic("=====GPT回复=====")ic(response)
# 如果返回的是函数调用结果，则打印出来if (response.tool_calls is not None):# 是否要调用 sumtool_call = response.tool_calls[0]if (tool_call.function.name == "calculate"):# 调用 calculateargs = json.loads(tool_call.function.arguments)result = eval(args["expression"])ic("=====函数返回=====")ic(result)
# 把函数调用结果加入到对话历史中messages.append({"tool_call_id": tool_call.id,# 用于标识函数调用的 ID"role": "tool","name": "calculate","content": str(result)# 数值result 必须转成字符串})
# 再次调用大模型ic("=====最终回复=====")ic(get_completion(messages).content)

if __name__ == '__main__': test_promopt()

输出

ic|'=====GPT回复====='ic|response:<OpenAIObjectat0x1a97b6d3480>JSON:{"role":"assistant","content":"null","tool_calls":[{"id":"call_jSVjTMqMIMUHYCpDisvpYInp","type":"function","function":{"name":"calculate","arguments":"{\"expression\":\"((3**0.5)*2)**0.5\"}"}}]}ic|'=====函数返回====='ic|result:1.8612097182041991ic|'=====最终回复====='ic|get_completion(messages).content:'3的平方根乘以2再开平方的结果约为1.8612。'

3、从一段文字中抽取联系人姓名、地址和电话，用 Function Calling 获取 JSON 结构轻松解决，在没有大模型之前非常难解决的问题

import openaiimport osfrom math import *from icecream import icimport jsonfrom math import *import requestsimport logging# 设置日志记录配置logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
# 加载 .env 文件from dotenv import load_dotenv, find_dotenv_ = load_dotenv(find_dotenv())
# 从环境变量中获得你的 OpenAI Keyopenai.api_key = os.getenv('OPENAI_API_KEY')openai.api_base = os.getenv('OPENAI_API_URL')model = os.getenv('MODEL')amap_key = os.getenv('GAODE_MAP_API_KEY')
def get_completion(messages, model=model):response = openai.ChatCompletion.create(model=model,messages=messages,temperature=0,# 模型输出的随机性，0 表示随机性最小tools=[{"type": "function","function": {"name": "add_contact","description": "添加联系人","parameters": {"type": "object","properties": {"name": {"type": "string","description": "联系人姓名"},"address": {"type": "string","description": "联系人地址"},"tel": {"type": "string","description": "联系人电话"},}}}}],)return response.choices[0].message



def test_promopt():prompt = "帮我寄给星城老谭，地址是湖南省长沙市岳麓区湘江壹号8楼，电话18874868888。"messages = [{"role": "system", "content": "你是一个联系人录入员。"},{"role": "user", "content": prompt}]response = get_completion(messages)logging.info("====GPT回复====")logging.info(response)args = json.loads(response.tool_calls[0].function.arguments)logging.info("====函数参数====")logging.info(args)
if __name__ == '__main__': test_promopt()

输出

2024-06-0513:31:30,121-INFO-====GPT回复====2024-06-0513:31:30,124-INFO-{"role":"assistant","content":null,"tool_calls":[{"id":"call_QEnFRbZRBs2Eww4YbUxP7oKv","type":"function","function":{"name":"add_contact","arguments":"{\"name\":\"\u661f\u57ce\u8001\u8c2d\",\"address\":\"\u6e56\u5357\u7701\u957f\u6c99\u5e02\u5cb3\u9e93\u533a\u6e58\u6c5f\u58f9\u53f78\u697c\",\"tel\":\"18874868888\"}"}}]}2024-06-0513:31:30,124-INFO-====函数参数====2024-06-0513:31:30,125-INFO-{'name':'星城老谭','address':'湖南省长沙市岳麓区湘江壹号8楼','tel':'1887486XXXX'}

七、总结

ChatGPT 的 Function Calling 机制极大地扩展了其功能，使其能够在对话中动态调用外部函数，提供实时、个性化和互动的服务。这一机制不仅提升了用户体验，也为开发者提供了强大的工具，帮助他们构建更智能、更强大的对话系统和应用。理解并善用这一机制，能让你在 AI 应用开发中占据领先地位。

通过这篇文章，希望你对 ChatGPT 的 Function Calling 机制有了更深入的了解。未来，随着这一技术的不断发展，我们可以期待更多令人惊喜的应用场景。