返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

太简单了,大模型提示词工程CoT(Chain-of-Thought)原来是这意思!

[复制链接]
链载Ai 显示全部楼层 发表于 3 小时前 |阅读模式 打印 上一主题 下一主题

ingFang SC", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif;font-size: medium;letter-spacing: normal;text-align: start;background-color: rgb(255, 255, 255);visibility: visible;">在大型语言模型(LLM)的领域中,"Chain-of-Thought"(CoT)是一种新兴的提示技术,它通过模拟解决问题的思考过程来提高模型生成内容的质量和相关性。CoT的概念源自于人类解决问题时的思维模式,即通过一系列逻辑步骤来逐步推导和解决问题。

CoT提示技术要求模型在生成答案之前,先展示其思考过程。这不仅仅是直接给出答案,而是包括了推理、分析和解释的步骤。CoT可以促使模型更深入地理解问题,并提供更全面、更有逻辑性的回答。

CoT对LLM生成内容的影响主要体现在以下几个方面:

a. 提高答案质量

通过CoT,模型能够生成更准确、更详细的答案,因为它需要展示其推理过程,这有助于避免生成模糊或错误的信息。

b. 增强逻辑性和连贯性

CoT要求模型在生成内容时保持逻辑性和连贯性,因为它需要按照一定的顺序展示其思考过程。

c. 提升用户信任

当用户看到模型的推理过程时,他们更有可能信任模型提供的答案,因为这些答案看起来更加透明和可解释。

d. 促进教育和学习

CoT可以作为一种教育工具,帮助用户理解复杂概念和解决问题的方法。



让我们通过一个数学问题的例子来说明CoT的应用:

假设问题是:“一个长方形的长是宽的两倍,如果它的周长是20厘米,那么它的长和宽分别是多少?”

  • 没有CoT:模型可能直接给出答案:“长是8厘米,宽是4厘米。”

  • 使用CoT:模型会展示其思考过程:

  1. 我们知道长方形的周长是长和宽的两倍之和。

  2. 设宽为 ,长为 。

  3. 周长公式为 =20 厘米。

  4. 简化得到 。

  5. 解得 厘米,约为3.33厘米。

  6. 长为 厘米,约为6.67厘米。


通过CoT,模型不仅给出了答案,还展示了如何通过逻辑推理得到答案。那在写提示词的时候,应该如何写呢?看下面这个例子。


我用chatgpt3.5-turbo来演示下实际的效果,问题是选择哪种交通出行的方式,能够最快到达公司。

如果不使用CoT,模型直接告诉你,用哪个选项。如果使用CoT的模式,你的提示词,需要给出推理的样本,类似one-shot、few-shots,模型也同样地,会反馈给你推理的过程:

#不使用Cot:提示词:Which is a faster way to get to work?Option 1: Take a 1000 minute bus, then a half hour train, and finally a 10 minute bike ride.Option 2: Take an 800 minute bus, then an hour train, and finally a 30 minute bike ride.
模型输出:Option 1 is a faster way to get to work.
#使用CoT来优化答案,让模型解释推理的过程提示词:Which is a faster way to get home?Option 1: Take an 10 minutes bus, then an 40 minute bus, and finally a 10 minute train.Option 2: Take a 90 minutes train, then a 45 minute bike ride, and finally a 10 minute bus.Option 1 will take 10+40+10 = 60 minutes.Option 2 will take 90+45+10=145 minutes.Since Option 1 takes 60 minutes and Option 2 takes 145 minutes, Option 1 is faster.
Which is a faster way to get to work?Option 1: Take a 1000 minute bus, then a half hour train, and finally a 10 minute bike ride.Option 2: Take an 800 minute bus, then an hour train, and finally a 30 minute bike ride.
模型输出:Option 1 will take 1000+30+10 = 1040 minutes.Option 2 will take 800+60+30 = 890 minutes.Since Option 2 takes 890 minutes and Option 1 takes 1040 minutes, Option 2 is faster.

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;text-wrap: wrap;background-color: rgb(255, 255, 255);text-align: right;">

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;text-wrap: wrap;background-color: rgb(255, 255, 255);text-align: right;">


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ