【Chain-of-Thought 专题】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models|电子爱好者

admin管理员组
文章数量:1534209

【Chain-of-Thought 专题】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

ChatGPT 🔥🔥🔥🔥火了
GPT-4 🔥🔥🔥🔥🔥 已于2023年3月15日凌晨发布

作为NLP Researcher

不了解预训练语言模型、prompt-tuning、chain-of-thought

你一定会被OUT！

走向NLP最前沿，你只需阅读下面两篇博客！！！

快速学习预训练语言模型，进入专栏阅读：预训练语言模型
深入学习Prompt-Tuning：点击阅读：Prompt-Tuning——深度解读一种新的微调范式
Prompting——深度解读一种全新的微调范式

Chain of Thought（CoT）—— a series of intermediate reasoning steps—significantly improves the ability of large language models to perform complex reasoning.

一、介绍

增大模型参数规模对于一些具有挑战的任务（例如算术、常识推理和符号推理）的效果并未证明有效；

Scaling up model size alone has not proved sufficient for achieving high performance on challenging tasks such as arithmetic, commonsense, and symbolic reasoning.

因此我们期望探索如何对大模型进行推理的简单方法：

对于算术类推理任务，期望生成自然语言逻辑依据来指导并生成最终答案；但是获得逻辑依据是比较复杂昂贵的。

It is costly to create a large set of high quality rationales, which is much more complicated than simple input–output pairs used in normal machine learning.

对某个task，为大模型提供一些上下文in-context example作为prompt；简单的示例可能并非能够提升推理能力。

It works poorly on tasks that require reasoning abilities, and often does not improve substantially with increasing language model scale.

本文提出chain of thouth prompting：A chain of thought is a series of intermediate natural language reasoning steps that lead to the final output, and we refer to this approach as chain-of-thought prompting.

二、Chain-of-Thought

下面给出几个Chain-of-Thought样例：

传统的方法是，给定几个人工标注的Template，或者少量样本作为In-Context Example来提示大模型生成结果。但是这种方式无法保证生成结果的可靠性。为了进一步提高大模型对于一些较为复杂任务的表现。CoT旨在通过在In-Context Learning的基础上，对每个问题（Question）输出结果（Answer）的同时，提供解答的推理依据（Rationale），这种依据通常是一种推理路径（Reason Path）的形式呈现。通过展示对一个问题的解答，能够很好地激发出模型按照人类思考的模式生成合理的答案。

例如在数学计算问题上，只需要人工标注少量的chain-of-thought，即可以得到很惊艳的效果：

事实证明，Chain-of-Thought对超过1000亿参数量规模的模型所展现的性能提升效果是很明显的。

更多基于GPT-3的Chain-of-Thought的Benchmark详见：https://github/FranxYao/chain-of-thought-hub。

三、Chain of Thought的未来工作：

虽然Chain-of-Thought模拟了人类推理者的思维过程，但这并不能回答神经网络是否真的“推理”，我们将其作为一个悬而未决的问题。
尽管在少样本设置中手动增加具有思想链的样本的成本是最小的，但这样的注释成本对于微调来说可能是令人望而却步的（尽管这可能会被合成数据生成或零样本泛化所克服）。
不能保证正确的推理路径，这可能导致正确和错误的答案；改进事实语言模型是未来工作的一个开放方向。
仅在大型模型尺度上出现的思维链推理使得在实际应用中服务的成本很高；进一步的研究可以探索如何在较小的模型中进行推理。

本文标签：专题 Prompting chain Thought Elicits

版权声明：本文标题：【Chain-of-Thought 专题】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1726875447a1088291.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

【Chain-of-Thought 专题】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

【Chain-of-Thought 专题】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

作为NLP Researcher

不了解预训练语言模型、prompt-tuning、chain-of-thought

你一定会被OUT！

一、介绍

二、Chain-of-Thought

三、Chain of Thought的未来工作：

更多相关文章

探秘 Skeleton-of-Thought：提升大型语言模型并行解码的新纪元

《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》【大模型思维链】

Skip-Thought Vector —— 跳跃思维句表示

论文阅读：Self-Consistency Improves Chain of Thought Reasoning in Language Models

了解大型语言模型中的思维链（Thought Chain）

大模型思维链（Chain-of-Thought）技术原理

大模型prompt技巧——思维链（Chain-of-Thought）

Skip-Thought Vector学习笔记

一致性思维链（SELF-CONSISTENCY IMPROVES CHAIN OF THOUGHT REASONING IN LANGUAGE MODELS）

【提示工程】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

Quick-Thought模型学习笔记

Skip-Thought词向量模型实现Sent2Vec

TOT(Tree of Thought) | 让GPT-4像人类一样思考

【论文精读】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

【COT】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

论文阅读：chain of thought Prompting elicits reasoning in large language models

chain of thought 也就是 CoT思维链

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models导读

Tree-of-Thought Puzzle Solver 学习资料汇总 - 一个使用LLM求解复杂推理任务的框架

论文笔记(2)：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

发表评论

推荐文章

软件安全期末总结

传统bios安装的windows添加efi引导，用于ubuntu grub开机引导

IntelliJ IDEA安装

电脑桌面计算机打开无响应,电脑任务栏假死点击没反应的解决方法(win7与xp)

【windows系统】360浏览器按F12弹出独立窗口的解决方法（图文）

热门文章

跟杀毒软件说不

IDEA全局搜索快捷键失效（搜狗拼音输入法冲突）

制作WIFI二维码，实现一键扫描连接WIFI

移动硬盘一直不能正常读取

GhostXP_SP3会员专用版V4.0【IE6+IE8】

计算机 hdmi不显示桌面,电脑用HDMI连接电视，电视却只显示桌面 其他的什么都不显示...

ps第二次安装出错解决办法

如何优雅的在 Mac 上安装fiddler [无需mono - 完美解决]

在线免费网页工具 ：转换视频为wmv格式 izyc.net

Mac Jmeter导入外部.jmx文件时报错“com.thoughtworks.xstream.converters.ConversionException”

最新文章

Ubuntu18.04双系统安装与安装后要做的事

如何安装或重新安装Windows 7

树莓派(0) : 树莓派4系统烧录、开机配置、网络连接、静态ip、开启root账号及ssh

第02章_MySQL重装

Win7系统提示找不到mmc.exe文件的解决办法

【转载】WIN7下硬盘安装UBUNTU 12.04

Win7系统提示找不到ocsetup.exe文件的解决办法

关于Ubuntu 16.04系统安装以及Nvidia显卡驱动安装的一些问题

Win7系统提示找不到mspaint.exe文件的解决办法

Win7系统提示找不到utildll.dll文件的解决办法

easyuefi只能在基于uefi启动的_主板传统BIOS引导与UEFI引导有何不同？选错了安装系统会出错的...

Win7系统提示找不到psr.exe文件的解决办法

Win7系统提示找不到bderepair.dll文件的解决办法

Win7系统提示找不到cscript.exe文件的解决办法

Win7系统提示找不到systeminfo.exe文件的解决办法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

计算机 hdmi不显示桌面,电脑用HDMI连接电视，电视却只显示桌面其他的什么都不显示...

在线免费网页工具：转换视频为wmv格式 izyc.net

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载