Chain of Thought (CoT) 系列论文：大模型思维链，提升 LLM 的推理能力|电子爱好者

admin管理员组
文章数量:1534198

文章目录

1. COT：Chain of Thought
- 1. 研究背景
- 2. CoT的原理
- 3. CoT Prompt

1. COT：Chain of Thought

COT 是 2022.01 由 google 提出的针对提升 LLM 的推理能力的 Prompt Engineering 方法。

paper：

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
v1：https://arxiv/abs/2201.11903
v2：https://arxiv/abs/2201.11903v2

参考资料：

【跟李沐学AI 论精精读-43】Chain of Thought论文、代码和资源
一文读懂「Chain of Thought，CoT」思维链

1. 研究背景

LLM 使用大力出奇迹的方法（增加模型的训练数据和参数量）在情感分析和主题分类等 NLP 任务上已经实现了强大的性能。这些任务称为 system-1 tasks，这些任务能够很快很直观的被人类所理解。
但 LLM 在推理任务中具有局限性：难以在推理任务中取得良好的性能，比如数学、符号、常识推理。这类任务称为 system-2 tasks，人类对这些任务需要详细的推理。

LLM 在推理任务中的局限性被称为 ﬂat scaling curves，即简单地增加模型规模不会导致实质性的性能增益（大力不能出奇迹了）。

2. CoT的原理

CoT 的核心在于让 LLM 模拟人类一步一步思考和推理的过程（step-by-step thought process），并将该过程写入到 prompt 中。因此 CoT 是一种 Prompt Engineering 方法，并不涉及模型结构的改进。

传统的 Standard Prompt 只是 LLM 能力的下限，通过各种 Prompt Engineering 方法可以提高 LLM 的性能。

区别于传统的 Standard Prompt 从输入直接到输出的映射「 input --> output 」的方式，CoT 完成了从输入到思维链再到输出的映射，即「 input --> reasoning chain --> output 」。如果将使用 CoT 的 Prompt 进行分解，可以更加详细的观察到 CoT 的工作流程。COT的原理如下图所示：

3. CoT Prompt

一个完整的包含 CoT Prompt 由指令（Instruction），逻辑依据（Rationale），示例（Exempes）三部分组成：

Instruction：用于描述问题并且告知大模型的输出格式
Rationale：指 CoT 的中间推理过程，可以包含问题的解决方案、中间推理步骤以及与问题相关的任何外部知识
Exempes：指以 Few-Shot 的方式为大模型提供输入输出对的基本格式，每一个示例都包含：问题、推理过程、答案。

以是否包含 Exempes 为区分，可以将 CoT 分为 Zero-Shot CoT 与 Few-Shot CoT：

Zero-Shot CoT：不添加 Exempes 而仅仅在指令中添加一行经典的 “Let’s think step by step”（GPT-3是这个指令），就可以“唤醒”LLM的推理能力。
Few-Shot Cot：在 Exempes 中详细描述了“解题步骤”，让模型照猫画虎得到推理能力。最早的 Exempes 是人为制定的，这可能导致 LLM 的性能依赖于 Exempes 的质量，因此后面出现了 Auto Cot 的工作，使 LLM 自动生成 Rationale

本文标签：模型思维能力系列论文

版权声明：本文标题：Chain of Thought (CoT) 系列论文：大模型思维链，提升 LLM 的推理能力内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1726877447a1088514.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Chain of Thought (CoT) 系列论文：大模型思维链，提升 LLM 的推理能力

文章目录

1. COT：Chain of Thought

1. 研究背景

2. CoT的原理

3. CoT Prompt

更多相关文章

【干货超全】国内外常见的Ai大模型汇总！！！

Amazon SageMaker + Stable Diffusion 搭建文本生成图像模型

Issue 6:装机系列1，PC下windows系统安装指南

论文中译英英译汉真的能降重吗

破解索尼PS4系列：利用网页漏洞实现相关的ROP攻击（一）

【Adobe系列软件MacOS版 部分问题解决方案】

Python 系列（一）- 收藏集 - 掘金

Postman系列番外篇 - postman web版介绍及与PC版的对比

架构师修炼系列【CAP定理[布鲁尔定理]】

共识算法论文——Paxos Made Simple

【模型检测学习笔记】8：无限字上ω正则LT性质的验证

【愚公系列】2022年11月 .NET CORE工具案例-.NET 7中的WebTransport通信

Skip-Thought Vector —— 跳跃思维句表示

了解大型语言模型中的思维链（Thought Chain）

Beyond Chain-of-Thought: A Survey of Chain-of-X Paradigms for LLMs论文阅读笔记（未完待续）

人工智能-深度学习：句表示学习方法：Skip Thought模型、Quick thoughts模型(A kind of Encoder-Decoder)

NLP中 大语言模型LLM中的思维链 Chain-of-Thought(CoT) GoT

Text-to-SQL任务中的思维链（Chain-of-thought）探索

chain of thought 也就是 CoT思维链

chain of thought (思维链， cot)

发表评论

推荐文章

Error: could not open `D:Java-jrelibamd64jvm.cfg‘

手机测试要点大全

移动硬盘无法访问的恢复方法

ASUS华硕魔霸7S枪神7笔记本G713PV PI PU PZ原装出厂Win11系统工厂模式镜像包原厂OEM预装系统

FTP协议详解

热门文章

AMD黑苹果 3A平台EFI分享给大家

五笔字根查询接口,五笔输入法数据

Windows10家庭版 SMB共享文件 方法

苹果电脑怎么用移动硬盘ntfs？快速读取和编辑Mac外置移动硬盘

移动硬盘读不出来的问题

程序设计综合实践——京东管理系统（C语言实现）

ps磨皮滤镜portraiture安装教程mac

像怀胎一样怀产品，要厚着脸皮听批评

艺赛旗（RPA）使用 selenium 控制 360 安全浏览器

360浏览器下载不了文件怎么办？

最新文章

Win7系统提示找不到mmc.exe文件的解决办法

Win7系统提示找不到diskraid.exe文件的解决办法

Win7系统提示找不到wow64win.dll文件的解决办法

联想拯救者Y7000 2020H原厂Win10系统镜像：重拾纯净体验

win7系统如何安装,win7系统安装教程图解

Win7系统提示找不到utildll.dll文件的解决办法

回归经典：Win7 SP1 原版32位，你的稳定之选

操作系统发展简史（UnixLinux 篇 + DOSWindows 篇）| Mac 与 Microsoft 之风云争霸

Win11系统提示找不到OEMDefaultAssociations.dll文件的解决办法

单、双硬盘装Windows和Ubuntu双系统——准备篇

Win7系统提示找不到cscript.exe文件的解决办法

Win7系统提示找不到systeminfo.exe文件的解决办法

Win7系统提示找不到hal.dll文件的解决办法

Win7系统提示找不到winload.exe文件的解决办法

win7怎么安装系统 win7系统怎么装机

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

【Adobe系列软件MacOS版部分问题解决方案】

NLP中大语言模型LLM中的思维链 Chain-of-Thought(CoT) GoT

Windows10家庭版 SMB共享文件方法

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载