谷歌最近发布了一项名为ASPIRE的训练框架,专为大型语言模型设计,旨在增强AI模型的选择性预测能力。该框架引入了可信度机制,使模型能够输出一系列带有正确概率评分的答案,从而在高风险决策场合更为可靠。
当前,大型语言模型在自然语言理解和生成内容方面取得了显著进展,但在应用于高风险决策场合时,由于模型预测的不确定性和可能的“幻觉”,存在一定风险。为此,谷歌推出了ASPIRE训练框架,为模型引入了可信度机制,以提高模型的预测准确性。
ASPIRE训练框架主要分为三个阶段:特定任务调整、答案采样和自我评估学习。在特定任务调整阶段,对已接受基础训练的大型语言模型进行深入训练,通过微调提升模型在特定任务上的预测性能。答案采样阶段通过使用可调参数为每个训练问题生成不同的答案,创造用于自我评估学习的数据集。自我评估学习阶段旨在让模型学会自己判断输出答案的准确性,为生成的答案附上正确概率评分。
谷歌研究人员使用CoQA、TriviaQA和SQuAD三个问答数据集验证了ASPIRE训练框架。据称,经过ASPIRE调整的OPT-2.7B小模型在表现上远超更大的OPT-30B模型。实验结果表明,即使是较小的语言模型,在适当调整后也可以在某些场景中超越大语言模型。
总体而言,ASPIRE框架训练显著提升了大型语言模型的输出准确率,即使是较小的模型也能在经过微调后进行准确且有自信的预测。这一创新有望为语言模型的应用场景带来更高的可信度和可靠性。
本文来自投稿,不代表TePhone特锋手机网立场,如若转载,请注明出处:https://www.tephone.com/article/6451