|
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">使用大型语言模型(LLMs)进行工具学习已成为增强LLMs能力以解决高度复杂问题的一个有希望的范式。尽管这一领域受到越来越多的关注和快速发展,但现有的文献仍然分散,缺乏系统性的组织,为新来者设置了进入障碍。因此对LLMs工具学习方面的现有工作进行全面调查,从两个主要方面展开:ingFang SC";font-size: 14px;letter-spacing: normal;text-wrap: wrap;text-align: left;line-height: 1.75;padding-left: 1em;list-style: circle;color: rgb(63, 63, 63);" class="list-paddingleft-1"> •(1)为什么工具学习是有益的; •(2)如何实现工具学习,以全面理解LLMs的工具学习。 ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">根据工具学习工作流程中的四个关键阶段对文献进行了系统性审查:任务规划、工具选择、工具调用和响应生成。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;overflow-x: auto;border-radius: 8px;margin: 10px 8px;">Paper:ToolLearningwithLargeLanguageModels:ASurvey ArXiv:https://arxiv.org/pdf/2405.17935 Code:https://github.com/quchangle1/LLM-Tool-SurveyingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;color: rgb(63, 63, 63);"> ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;border-radius: 4px;display: block;margin: 0.1em auto 0.5em;height: auto !important;" title="null" src="https://api.ibos.cn/v4/weapparticle/accesswximg?aid=83716&url=aHR0cHM6Ly9tbWJpei5xcGljLmNuL3N6X21tYml6X3BuZy9BRTc0aWE2MlhyaWNHak1JaWFwN25WZVp0ZUJhNEg4V1NHUE9taWNCOUFISENRUWZpYWRPQU9LTG9vcTI4NzhLbXluM0wxMjc3YkhhNnZncGlhdzJCQzdhM0taZy82NDA/d3hfZm10PXBuZyZhbXA=;from=appmsg&wxfrom=13"/>ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;color: rgb(63, 63, 63);"> ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;border-radius: 4px;display: block;margin: 0.1em auto 0.5em;height: auto !important;" title="null" src="https://api.ibos.cn/v4/weapparticle/accesswximg?aid=83716&url=aHR0cHM6Ly9tbWJpei5xcGljLmNuL3N6X21tYml6X3BuZy9BRTc0aWE2MlhyaWNHak1JaWFwN25WZVp0ZUJhNEg4V1NHUHVxQlpKTGljdVFRZXZLWGljQVZzREZNZklmMVk1b0gzNU5LZGozanZOeVhPaHhxMG85RW9veWljZy82NDA/d3hfZm10PXBuZyZhbXA=;from=appmsg&wxfrom=13"/>ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 1.2em;font-weight: bold;display: table;margin: 2em auto 1em;padding-right: 1em;padding-left: 1em;border-bottom: 2px solid rgb(250, 81, 81);color: rgb(63, 63, 63);">为什么工具学习是有益的?ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">一方面,将工具整合到LLMs中可以增强多个领域内的能力,即知识获取、专业技能提升、自动化与效率以及交互增强。另一方面,采用工具学习范式可以增强响应的稳健性和生成过程的透明度,从而提高可解释性和用户信任度,以及改善系统的稳健性和适应性知识获取(Knowledge Acquisition):专业知识增强(Expertise Enhancement):自动化和效率(Automation and Efficiency):交互增强(Interaction Enhancement):增强的可解释性和用户信任(Enhanced Interpretability and User Trust):改进的鲁棒性和适应性(Improved Robustness and Adaptability):如何实现工具学习? 任务规划(Task Planning )任务规划的重要性:任务规划的步骤:任务规划的方法:•无需调整的方法(Tuning-free Methods):利用LLMs的内在能力,通过少量示例或零示例提示来实现任务规划。例如,使用CoT(Chain of Thought)或ReACT等框架来引导LLMs逐步思考和规划。 •基于调整的方法(Tuning-based Methods):通过在特定任务上微调LLMs来提高任务规划能力。例如,Toolformer等方法通过微调来增强LLMs对工具使用的意识和能力。
 工具选择(Tool Selection)工具选择的重要性:工具选择的分类:工具选择的方法:无需调整的方法(Tuning-free Methods):基于调整的方法(Tuning-based Methods): 工具调用(Tool Calling)工具调用的重要性:工具调用的步骤:工具调用的方法: 响应生成(Response Generation)响应生成的重要性:响应生成的方法: 工具学习范式(Paradigms of Tool Learning)工具学习范式:范式的特点:工具学习评估基准与指标评估指标(Evaluation)任务规划评估(Task Planning Evaluation):•工具使用意识(Tool Usage Awareness):评估LLMs是否能够准确识别何时需要使用外部工具。 •任务规划效果(Effectiveness of Task Planning):使用通过率(pass rate)或人类评估来衡量任务规划解决查询的有效性。 •计划精度(Precision of the Plan):通过与最优解决方案比较,定量分析LLMs生成的计划的准确性。
工具选择评估(Tool Selection Evaluation):•召回率(Recall):衡量模型选择的前K个工具中有多少是正确的。 •归一化折扣累积增益(NDCG, Normalized Discounted Cumulative Gain):不仅考虑正面工具的比例,还考虑它们在列表中的位置。 •完整性(COMP, Completeness):评估前K个选择的工具是否形成了一个相对于真实集合的完整集合。
工具调用评估(Tool Calling Evaluation):响应生成评估(Response Generation Evaluation):
|