链载Ai

标题: 思维链(Chain-of-Thought)技术的背后,是人类思考问题的方式! [打印本页]

作者: 链载Ai    时间: 昨天 10:31
标题: 思维链(Chain-of-Thought)技术的背后,是人类思考问题的方式!


Q: Roger has 5 tennis balls. He buys 2 more cans of tennis balls. Each can has 3 tennis balls. How many tennis balls does he have now?

问题:罗杰有5个网球。他又买了2罐网球,每罐有3个网球。现在他总共有多少个网球?

这是一道小学水平的数学推理题目,对于现在的我们来说,肯定是毫无压力。甚至对于现在大多数LLM模型来说,也能够回答正确。但要知道,一个语言模型为什么能够回答正确这种带有推理的数学计算,这是值得玩味和深思的问题。

遵循人类的思考逻辑来说,为了解决上面这道题目,首先需要分析:当前有5个网球。其次2罐网球,每罐3个,可知共6个。最后,相加得到“11”这个答案。这样的思维过程是一个步步紧扣的链式思维,也被称之为思维链(Chain-of-Thought)

思维链技术同样可以应用于LLM模型上,它能够模拟人类大脑处理信息的逻辑链条,面对复杂问题时,会自然地将其拆解为若干个可管理的小问题,逐一攻克,最终汇聚成完整的解决方案。语言模型通过思维链提示,能够模仿这一过程,逐步推理出正确答案。思维链技术最早出现在一篇2022年发布的题为《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》的论文中,研究人员探索了生成思维链——一系列中间推理步骤——如何显著提升大型语言模型执行复杂推理的能力。

思维链提示(Chain-of-Thought Prompting)

论文探讨了一种名为思维链提示Chain-of-Thought Prompting)的技术,旨在提升语言模型解决复杂问题的能力。通过模仿人类解决问题时的逐步思考过程,该技术使模型能够通过一系列逻辑推理步骤来得出答案。论文展示了在提供少量示例的情况下,大型语言模型能够生成思维链,从而在算术、常识和符号推理任务上取得显著的性能提升。这种提示方法不仅提高了模型的推理能力,还为理解模型的决策过程提供了透明度。此外,这种方法的普适性意味着它可以应用于任何可以通过语言表达的人类任务,为模型的使用场景增加新的可能性。

思维链提示作为一种促进语言模型推理的方法具有几个吸引人的特性:

  1. 首先,从原则上讲,思维链允许模型将多步骤问题分解为中间步骤,这意味着可以为需要更多推理步骤的问题分配额外的计算。

  2. 其次,思维链提供了一个可解释的窗口,了解模型的行为,表明它可能如何得出特定答案,并提供机会来调试推理路径在哪里出了问题(尽管完全描述支持答案的模型计算仍然是一个开放性问题)。

  3. 第三,思维链推理可以用于数学文字问题、常识推理和符号操作等任务,并且原则上可能适用于任何人类可以通过语言解决的任务。

  4. 最后,通过在少量提示的示例中包含思维链序列的例子,可以轻松地在足够大的现成语言模型中引发思维链推理。

算术推理(Arithmetic Reasoning)

研究背景与目标

实验设置

实验结果

错误分析

消融研究

研究还进行了消融实验,测试了其他类型的提示对性能的影响:

思维链的稳健性

结论

常识推理(Commonsense Reasoning)

研究背景与目标

基准数据集

实验设置

实验结果

结论

符号推理(Symbolic Reasoning)

研究目标

任务设计

实验设置

实验结果

结论







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5