自监督学习(Self - Supervised Learning):语言生成模型通常采用自监督学习的方式举行练习。以常见的 “猜测下一个单词” 任务为例,模型会根据输入文本序列的前面部分来猜测背面的单词。例如,给定句子 “The cat is sitting on the”,模型要猜测出下一个单词 “mat”。在练习过程中,模型的猜测结果与真实的下一个单词举行比较,通过盘算丧失函数(如交叉熵丧失)来衡量猜测的正确性。
起始输入(Initial Input):当要生成文本时,需要给模型一个起始输入。这个起始输入可以是一个特定的单词、一个句子片断或者一个特殊的起始标记(如 [CLS])。例如,在回答一个题目时,起始输入可能是题目中的关键词或者一个通用的回答起始语,如 “In response to your question”。