本公开涉及大模型,尤其涉及一种基于大模型算法的超参数值确定方法、装置及电子设备。
背景技术:
1、在大语言模型(llm)进行输出内容的过程中,解码时所采用的超参(如temperature、top_p等)具有关键意义,这些超参的数值对输出内容的风格起到了决定性作用。
2、此外,由于模型自身参数(或权重)的限制,当运用较小的llm,如qwen-1.8b、minicpm-2b及其量化版本进行推理时,超参数值对输出的影响会被进一步放大。尤其在面对复杂任务场景时,较小的llm的输出要么维持高创造性,要么维持高准确性,无法表现出理想效果。
技术实现思路
1、本公开提供了一种基于大模型算法的超参数值确定方法、装置及电子设备,以至少解决现有技术中存在的以上技术问题。
2、根据本公开的第一方面,提供了一种基于大模型算法的超参数值确定方法,所述方法包括:
3、获取大模型的第一输入和t-1时刻输出的第一标记;
4、将所述第一输入和所述第一标记输入至决策模型中,确定t-1时刻所述大模型的超参数值;
5、基于所述第一标记和所述超参数值,确定所述大模型t时刻的超参数值;
6、其中,所述超参数值表征所述大模型的输出的准确性程度和创作性程度;超参数值越高,则大模型的输出的创作性越高;超参数值越低,则大模型输出的准确性越高。
7、上述方案中,所述方法还包括:
8、获取第二输入和第二输入对应的至少一个标记;
9、基于大模型,确定所述第二输入对应的至少一个标记的标注分数;
10、将所述第二输入和所述第二输入对应的至少一个标记输入至决策模型中,获取所述决策模型对所述第二输入对应的至少一个标记的预测分数;
11、基于所述标注分数和所述预测分数,调整所述决策模型的参数;
12、其中,所述标注分数表征大模型对至少一个标记的准确性的评分,准确性越高,则对应的标注分数越高;准确性越低,则对应的标注分数越低。
13、上述方案中,所述方法还包括:
14、确定大模型输出每一个第二输入对应的标记时,对应的超参数值;
15、基于每一个第二输入对应的标记的超参数值,和每一个第二输入对应的标注分数,确定超参数值与标注分数的关系曲线;
16、其中,所述超参数值与分数的关系曲线中,超参数值越高,则标注分数越低;超参数值越低,则标注分数越高。
17、上述方案中,所述将所述第一输入和所述第一标记输入至决策模型中,确定t-1时刻所述大模型的超参数值,包括:
18、将所述第一输入和所述第一标记输入至决策模型中,确定所述第一标记对应的分数;
19、基于所述分数和所述超参数值与标注分数的关系曲线,确定所述第一标记对应的超参数值,为t-1时刻所述大模型的超参数值。
20、上述方案中,所述基于所述第一标记和所述超参数值,确定所述大模型t时刻的超参数值,包括:
21、确定所述第一标记的语义;
22、基于所述第一标记的语义和t-1时刻所述大模型的超参数值,确定所述大模型t时刻的超参数值。
23、上述方案中,所述基于所述第一标记的语义和t-1时刻所述大模型的超参数值,确定所述大模型t时刻的超参数值,包括以下之一:
24、响应于所述第一标记的语义表征所述大模型t时刻的输出的准确性大于所述大模型t-1时刻的输出的准确性,则确定所述大模型t时刻的超参数值小于大模型t-1时刻的超参数值;
25、响应于所述第一标记的语义表征所述大模型t时刻的输出的创作性大于所述大模型t-1时刻的输出的创作性,则确定所述大模型t时刻的超参数值大于或等于大模型t-1时刻的超参数值。
26、上述方案中,所述基于所述第一标记和所述超参数值,确定所述大模型t时刻的超参数值之后,所述方法还包括:
27、调整大模型的超参数值,使大模型在t时刻基于调整后的超参数值输出第一输入对应的标记。
28、根据本公开的第二方面,提供了一种基于大模型算法的超参数值确定装置,所述装置包括:
29、获取单元,用于获取大模型的第一输入和t-1时刻输出的第一标记;
30、第一确定单元,用于将所述第一输入和所述第一标记输入至决策模型中,确定t-1时刻所述大模型的超参数值;
31、第二确定单元,用于基于所述第一标记和所述超参数值,确定所述大模型t时刻的超参数值;
32、其中,所述超参数值表征所述大模型的输出的准确性程度和创作性程度;超参数值越高,则大模型的输出的创作性越高;超参数值越低,则大模型输出的准确性越高。
33、根据本公开的第三方面,提供了一种电子设备,包括:
34、至少一个处理器;以及
35、与所述至少一个处理器通信连接的存储器;其中,
36、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所述的方法。
37、根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开所述的方法。
38、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
1.一种基于大模型算法的超参数值确定方法,所述方法包括:
2.根据权利要求1所述的方法,所述方法还包括:
3.根据权利要求2所述的方法,所述方法还包括:
4.根据权利要求3所述的方法,所述将所述第一输入和所述第一标记输入至决策模型中,确定t-1时刻所述大模型的超参数值,包括:
5.根据权利要求1所述的方法,所述基于所述第一标记和所述超参数值,确定所述大模型t时刻的超参数值,包括:
6.根据权利要求5所述的方法,所述基于所述第一标记的语义和t-1时刻所述大模型的超参数值,确定所述大模型t时刻的超参数值,包括以下之一:
7.根据权利要求1所述的方法,所述基于所述第一标记和所述超参数值,确定所述大模型t时刻的超参数值之后,所述方法还包括:
8.一种基于大模型算法的超参数值确定装置,所述装置包括:
9.一种电子设备,包括:
10.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行根据权利要求1-7中任一项所述的方法。