admin管理员组

文章数量:1534194

😄 思维链提示,可用于训练阶段,构造高质量数据集(输入&思维链+输出),让模型学习逐步推理的能力;也可用于推理阶段,给模型提示,激发模型的推理能力,使模型得出更准确且有理有据的答案。

文章目录

  • ⭐ CoT微调:
  • ⭐ CoT提示:

⭐ CoT微调:

  • 使用 CoT 微调的模型使用带有逐步推理的人工标注的指令数据集。也就是让模型微调训练学会 think step by step。

⭐ CoT提示:

  • 教chatgpt如何思考,如何一步步推理得出答案;给模型输入一个示例,并且示例中写明推理过程,这种推理的解释会引导模型在同类问题上得出更准确的结果。
  • 其实就是在传统few-shot基础上加上了思维链(即推理过程),输入&思维链+输出。
  • 通过CoT提示可将大模型这种能力激发出来。就比如下图,没有CoT提示的输入模型输出了错误结果,而采用了CoT提示,模型被引导输出了推理的过程并得到了正确的结果。






引用:

  • Google Research, Brain Team: 《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》
  • HuggingFace

本文标签: 思维提示chainThoughtCoT