纯自回归式语言模型,原来并不具备良好推理本领,特别是在数学题目的推理。但是现在的天生模型是能实现一些数学的推理的。研究者以为当模型充足大他实际上能学习到许多潜在本领,怎样让本领得以涌现也是一个重要题目。
思维链就是这方面的工作,研究怎样去发掘他的潜能。CoT(Chain of thought),思维链,普通说就是引发LLM像人类一样有一个“思考”前摇动作来回答一些复杂性题目,这样能资助模型有引导性提升推理本领。
这篇论文探索了天生思维链——一系列中心推理步调——怎样明显提高大型语言模型实行复杂推理的本领。特别是,展示了这种推理本领怎样通过一种简朴的方法,称为思维链提示,在充足大的语言模型中天然地涌现,其中一些思维链演示作为提示中的示例提供。对三个大型语言模型的实行表明,思维链提示提高了模型在算术、常识和符号推理任务上的性能。实证增益可能非常明显。
在我的影象中这个论文是我了解到的最早期的思维链论文,后面的对话模型等练习中都会使用思维链的头脑。
paper
1 论文方法