chain of thought (思维链， cot)|电子爱好者

admin管理员组
文章数量:1534199

定义

思维链 (Chain-of-thought，CoT) 的概念是在 Google 的论文 "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models" 中被首次提出。思维链（CoT）是一种改进的提示策略，用于提高 LLM 在复杂推理任务中的性能，如算术推理、常识推理和符号推理。

如上图，左边是传统的输入输出，右边是基于CoT思想的输入及输出。高亮部分及CoT, 说白了就是一个推理过程。

few-shot CoT

Few-shot CoT 是 ICL （in-context-learning）的一种特殊情况，它通过融合 CoT 推理步骤，将每个演示〈input，output〉扩充为〈input，CoT，output〉。

类似上图所示右边的例子

zero-shot CoT

与 Few-shot CoT 不同，Zero-shot CoT 在 prompt 中不包括人工标注的任务演示。相反，它直接生成推理步骤，然后使用生成的 CoT 来导出答案。其中 LLM 首先由 “Let's think step by step” 提示生成推理步骤，然后由 “Therefore, the answer is” 提示得出最终答案。

举例：

假设我们有如下一个原始问题：

罗杰有5个网球。他又买了2罐网球。每个罐子有3个网球。他现在有多少个网球?

步骤一：构建prompt如下，让模型输出推理过程

问：罗杰有5个网球。他又买了2罐网球。每个罐子有3个网球。他现在有多少个网球?
答：让我们一步一步的思考。

模型输出结果：

首先，罗杰原本有 5 个网球。
然后，他买了 2 罐网球，每罐有 3 个网球，所以总共买了 2 * 3 = 6 个网球。
因此，罗杰现在有的网球数量为:
5(原来的网球) + 6(新买的网球) = 11 个网球。

步骤二：我们已经拿到了模型的推理过程了（即CoT）,现在我们把CoT拼接起来，构造一个新的prompt给模型输出最终答案，prompt 如下：

问：罗杰有5个网球。他又买了2罐网球。每个罐子有3个网球。他现在有多少个网球?
答：让我们一步一步的思考。
首先，罗杰原本有 5 个网球。
然后，他买了 2 罐网球，每罐有 3 个网球，所以总共买了 2 * 3 = 6 个网球。
因此，罗杰现在有的网球数量为:
5(原来的网球) + 6(新买的网球) = 11 个网球。
所以最后的答案是：

模型输出：

罗杰现在有 11 个网球。

结论

CoT 对小模型作用不大，模型参数至少达到 10B 才有效果，达到 100B 效果才明显。并且，从小模型的输出可以看出，它们大部分是输出了流畅但不合逻辑的 CoT，因此得到错误的结果。
CoT 对复杂的问题的性能增益更大，例如 GSM8K（更难，因为基线最低）上 GPT-3 和 PaLM 的性能增加了一倍多。而对于 MAWPS-SingleOp（更简单的任务），性能改进非常小甚至是负面的。
加上 CoT 的 PaLM 540B 超过了任务特定的用监督学习训练的模型的最优结果。不加 CoT 的话 GSM8K 和 MAWPS 任务上 LLM 的结果比不过最优的监督学习模型。

本文标签：思维 chain Thought CoT

版权声明：本文标题：chain of thought (思维链， cot) 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1726877247a1088493.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

chain of thought (思维链， cot)

定义

few-shot CoT

zero-shot CoT

结论

更多相关文章

Multimodal Chain-of-Thought Reasoning in Language Models阅读笔记

Beyond Chain-of-Thought: A Survey of Chain-of-X Paradigms for LLMs论文阅读笔记（未完待续）

CoT开山之作：Chain-of-Thought Prompting

[ACL2023] Symbolic Chain-of-Thought Distillation: Small Models Can Also “Think” Step-by-Step

（论文阅读）Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

【论文阅读】Multimodal Chain-of-Thought Reasoning in Language Models

大模型prompt技巧——思维链（Chain-of-Thought）

大语言模型提示词方式 CoT（Chain of Thought）

【提示工程】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

探秘Tree of Thought LLM：普林斯顿NLP团队的新型语言模型

论文笔记--Skip-Thought Vectors

some thought

文献阅读：Exchange-of-Thought: Enhancing Large Language Model Capabilities through Cross-Model Communicat

论文阅读：chain of thought Prompting elicits reasoning in large language models

NLP中 大语言模型LLM中的思维链 Chain-of-Thought(CoT) GoT

Text-to-SQL任务中的思维链（Chain-of-thought）探索

使用 Skeleton of Thought 技术实现更高效的 AI 文本生成

chain of thought (思维链， cot)

“Chain of Thought Reasoning“ 和 “Chain Prompts“ 是什么

Tree-of-Thought Puzzle Solver 学习资料汇总 - 一个使用LLM求解复杂推理任务的框架

发表评论

推荐文章

Win10 bat 调用管理员运行打开杀死进程

Proof of Stake FAQ

机器人技术发展追踪及ChatGPT引发的机器人应用思考（机器人篇）

ThoughtWorks面试篇

Maven的pom文件 提示错误 Failure to transfer com.thoughtworks.xstream:xstream:jar:

热门文章

WiFi密码分享有妙招 不必口头相传

【Android开发—智能家居系列】（三）：手机连接WIFI模块

win7下vs2008过期升级没有提示序列号

电脑问题处理篇6：解决电脑底部任务栏变小如何还原的问题

有哪些免费抠图软件？这12款抠图软件简单易上手，新手也能快速掌握！

转发：已经足够好用的IDEA社区版

wps二维码根据一列自动生成_拯救秃头！WPS还能这么玩？

2345王牌浏览器网页加载慢怎么办 网页加载慢解决办法

香橙派 ubuntu c# .net 使用ThoughtWorks.QRCodCore库生成 或识别 二维码，及报错处理方法

让360安全浏览器默认使用谷歌内核

最新文章

第02章_MySQL重装

Win7系统提示找不到mmc.exe文件的解决办法

Win7系统提示找不到diskraid.exe文件的解决办法

Win7系统提示找不到wow64win.dll文件的解决办法

联想拯救者Y7000 2020H原厂Win10系统镜像：重拾纯净体验

Win7系统提示找不到utildll.dll文件的解决办法

回归经典：Win7 SP1 原版32位，你的稳定之选

操作系统发展简史（UnixLinux 篇 + DOSWindows 篇）| Mac 与 Microsoft 之风云争霸

Win11系统提示找不到OEMDefaultAssociations.dll文件的解决办法

单、双硬盘装Windows和Ubuntu双系统——准备篇

Win7系统提示找不到cscript.exe文件的解决办法

Win7系统提示找不到systeminfo.exe文件的解决办法

Win7系统提示找不到hal.dll文件的解决办法

Win7系统提示找不到winload.exe文件的解决办法

win7怎么安装系统 win7系统怎么装机

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

NLP中大语言模型LLM中的思维链 Chain-of-Thought(CoT) GoT

Maven的pom文件提示错误 Failure to transfer com.thoughtworks.xstream:xstream:jar:

WiFi密码分享有妙招不必口头相传

2345王牌浏览器网页加载慢怎么办网页加载慢解决办法

香橙派 ubuntu c# .net 使用ThoughtWorks.QRCodCore库生成或识别二维码，及报错处理方法

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载