chain of thought 也就是 CoT思维链|电子爱好者

admin管理员组
文章数量:1534200

chain of thought 也就是 CoT ，一经提出就引发了社区对它的热烈讨论，CoT 能够帮助大规模语言模型解决复杂的算术、常识及字符推理等任务。

背景知识

语言模型

语言模型的本质是对任意一段文本序列的概率进行建模
如果将语言模型看成一个大黑盒的话，它的输入是一段文本序列，输出也是一段文本序列，通过训练语言模型，就能使得给定的文本序列和输出的文本序列拼接起来所组成的一整段文本序列的概率尽可能比较大

文献：Chain of Thought Prompting Elicits Reasoning in Large Language Models（arxiv/abs/2201.1190）
这种情况下使用到了少样本学习，在输入问题之前，手动设计一些问题和答案的样例（样例的答案给出中间推理步骤），这些问题和答案都需要手动构造，所以叫 Manual-CoT
语言模型的输入是一些手动设计的问题和答案的参考样例连接一个真正需要求解的问题，然后让语言模型进行续写
Manual-CoT 比 Zero-Shot-CoT 的性能要好，因为它采用的是 few shot ，在输入中提供了一些问题、中间推理步骤以及答案的样例给语言模型进行参考。但是，提供这些样例需要进行人工设计，这就需要一定的人工成本

4、Auto-CoT

Abstract

现在语言模型的规模越来越大，但是即便是现在最大的语言模型，它们也往往很难在涉及到推理方面的任务取得很好的表现，也就是说，他们通常很难在数学，符号，以及常识的推理上取得尚佳的表现

这篇文章主要是针对大语言模型在遇到语言推理任务时的局限性，提出了 chain of thought，也就是思维链

文中也给出了 CoT 的定义：人类在遇到一系列问题时所产生的推理步骤，而它们的表现形式就是一系列的短句子（比如说在背景介绍中所提到的遇到数学问题时所产生的中间推理步骤）

最终的实验效果非常好，比如说在使用谷歌内部的 540B 参数量的 PaLM 大语言模型，CoT 能够在像 GSM8K 这样比较难一点的数学问题数据集上取得新的 state of art

在此前关于大规模语言模型的推理任务中，有两种方法：针对下游任务对模型进行微调；为模型提供少量的输入输出样例进行学习。但是这两种方法都有着局限性，前者微调计算成本太高，后者采用传统的输入输出样例在推理任务上效果很差，而且不会随着语言模型规模的增加而有实质性的改善。

语言模型的规模达到 100B 的参数量之后，就能够在像 sentiment analysis and topic classification 这种分类任务上取得非常好的结果

作者将这类任务归纳为 system-1，也就是能够人类很快很直观地理解的任务
还有一类任务需要很慢而且是很仔细的考虑，作者将其归纳为 system-2 （比如一些设计逻辑、常识的推理任务）

作者发现，即便语言模型的规模达到了几百B的参数量，也很难在 system-2 这类任务上获得很好的表现

作者将这种现象称为 flat scaling curves：如果将语言模型参数量作为横坐标，在 system-2 这类任务上的表现作为纵坐标，则折线就会变得相当平缓，不会像在 system-1 这类任务上那么容易就实现模型的性能随着模型参数量的增长而提升，也就是说，在 system-2 这类任务上语言模型就很难大力出奇迹了

针对这个问题，作者提出了 chain of thought （CoT）这种方法来利用大语言模型求解推理任务

上图展示了在 CoT 诞生之前是怎样使用标准的 prompting 方法来求解推理任务的
首先这是一个少样本学习的方法，需要给出一些问题和答案的样例，然后拼接这正想要求解的问题，最后再拼接一个字符串“A:”之后输入到大语言模型中，让大语言模型进行续写
大语言模型会在所提供的问题和答案的样例中学习如何求解，结果发现很容易出错，也就是上面提到的大语言模型在 system-2 上很容易遇到瓶颈

本文标签：也就是思维 chain Thought CoT

版权声明：本文标题：chain of thought 也就是 CoT思维链内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1726877087a1088474.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

【LLM 论文】思维链 CoT 提示方法：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

3小时前

论文：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models ⭐⭐⭐⭐⭐ NeurIPS 2022, Google Research

Beyond Chain-of-Thought: A Survey of Chain-of-X Paradigms for LLMs论文阅读笔记（未完待续）

3小时前

地址：https:arxivhtml2404.15676v1 一些论文合集：https:githubatfortesAwesome-LLM-Reasoning 背景思维链

CoT开山之作：Chain-of-Thought Prompting

3小时前

CoT开山之作：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models 论文解读, CoT开山之作：Chain

（论文阅读）Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

3小时前

论文地址 https:openreviewpdf?id_VjQlMeSB_J 摘要我们探索如何生成一个思维链——一系列中间推理步骤——如何显著提高大型语言模型执行复杂推理的能力。特别是，我们展示了这种推理

【论文阅读】Multimodal Chain-of-Thought Reasoning in Language Models

3小时前

【还是写写CSDN自我激励一下吧哈哈】今天分享的是亚马逊推出的multimodal-COT，使用多模态数据触发CoT进行推理问答，在参数量小于 10 亿的情况下，在 Sc

思维链提示 (Chain-of-thought，CoT)

3小时前

😄 思维链提示，可用于训练阶段，构造高质量数据集（输入&思维链输出），让模型学习逐步推理的能力&a

大语言模型提示词方式 CoT（Chain of Thought）

3小时前

CoT（Chain of Thought）是一种用于大语言模型（LLM）的提示词方式，它鼓励模型解释其推理过程。不使用CoT

一致性思维链（SELF-CONSISTENCY IMPROVES CHAIN OF THOUGHT REASONING IN LANGUAGE MODELS）

3小时前

概要思维链已经在很多任务上取得了非常显著的效果，这篇论文中提出了一种 self-consistency 的算法，来代替贪婪解码算法。本方法通过采样多个思维链集合，然

探秘Tree of Thought LLM：普林斯顿NLP团队的新型语言模型

3小时前

探秘Tree of Thought LLM：普林斯顿NLP团队的新型语言模型 tree-of-thought-llm[NeurIPS 2023] Tree of Thoughts: Deliberate Problem

Chain-of-thought prompting（链式思考提示）

3小时前

1.大模型“涌现”的思维链最近 AI 大厂的开发人员和高校的 NLP 研究人员，都在琢磨，怎么让大模型“涌现”。所谓“涌现”，在大模型领域指的是当模型突破某个规模时&am

some thought

2小时前

最好的学习方法就是不管别人怎么想怎么做，自己去搞一下就都知道了!别人的东西不能看太多，太久，越看越他妈懵逼，要消化实践出真知看&#xff

文献阅读：Exchange-of-Thought: Enhancing Large Language Model Capabilities through Cross-Model Communicat

2小时前

文献阅读：Exchange-of-Thought: Enhancing Large Language Model Capabilities through Cross-Model Communication 1. 文章

Thought Cloning 项目教程

2小时前

Thought Cloning 项目教程 Thought-Cloning[NeurIPS 23 Spotlight] Thought Cloning: Learning to Think while Acting by Imitating

【COT】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

2小时前

文章目录主要解决什么问题采用什么方法实验分析与结果消融实验Commonsense ReasoningSymbolic Reasoning 问题与展望 Chain-of-Thought Prompting Elicits Reasoning

论文阅读：chain of thought Prompting elicits reasoning in large language models

2小时前

论文阅读：chain of thought Prompting elicits reasoning in large language models 跟着沐神读论文视频链接：https:w