本发明涉及计算机,更具体的说,涉及一种提示词的优化方法、系统、电子设备及存储介质。
背景技术:
1、在自然语言处理(natural language processing,nlp)中,提示词(prompt)可用于提醒学习的特定目标,使得预训练的大规模语言模型(large language model,llm)适应不同的任务场景。使用提示词可以利用大语言模型llm解决大量任务,合适的提示词可以更好地提示llm,让llm预测的答案更准确。
2、现有技术下,大模型的应用中需要根据需求手动设计提示词来帮助大模型完成任务,并手动对提示词进行优化以提高模型的表现。手动调整提示词过程较为复杂,效率低,且难以获得合适的提示词。
技术实现思路
1、为了克服现有技术的不足,本发明提供一种提示词的优化方法、系统、电子设备及存储介质,解决了当前手动调整提示词过程较为复杂,效率低,且难以获得合适的提示词的问题,从而既提高了调整提示词的效率和准确率,又优化了用户体验。
2、本发明解决其技术问题所采用的技术方案是:一种提示词的优化方法,应用于语言大模型,其改进之处在于,所述提示词的优化方法包括以下步骤:
3、s10,语言大模型获取基础提示词和原始问题集,并通过对原始问题集计算得到原始回答集,且对原始回答集进行分数评估,以得到原始分数集;
4、s20,语言大模型结合基础提示词对原始问题集计算得到第一回答集,且对第一回答集进行分数评估,以得到第一分数集;
5、s30,语言大模型结合原始分数集和第一分数集生成提示词优化方案,并通过提示词优化方案优化基础提示词,以得到第一优化提示词;
6、s40,语言大模型通过对第一优化提示词进行同义改写,以得到若干同义优化提示词;
7、s50,语言大模型结合第一优化提示词和若干同义优化提示词分别对原始问题集计算得到若干优化回答集,且对若干优化回答集分别进行分数评估,以得到若干优化分数集;
8、s60,语言大模型分别计算第一分数集和若干优化分数集的平均分,并输出分数最高的优化提示词;
9、s70,语言大模型将s60中分数最高的优化提示词作为下一轮优化的基础提示词,并循环持续执行s10-s70,且判断当前循环是否满足循环结束条件,若满足,则循环结束,若不满足,则循环继续。
10、进一步的,所述语言大模型获取基础提示词和原始问题集的具体方式为:用户将基础提示词和原始问题集直接输入至语言大模型中,语言大模型直接对用户输入的基础提示词和原始问题集对应的文本信息进行读取。
11、进一步的,所述语言大模型中设置有原始问题集对应的目标答案集以及基于目标答案集相似度的评分机制。
12、进一步的,所述语言大模型对第一回答集及若干优化回答集进行分数评估的具体方式为:语言大模型通过比对第一回答集及若干优化回答集同目标答案集的相似度,并根据语言大模型中的评分机制对比对的相似度进行评分,以得出第一分数集及若干优化分数集。
13、进一步的,所述语言大模型在生成提示词优化方案的过程中,需先判断第一分数集中的分数是否均高于原始分数集中的分数,若是,则语言大模型不提出优化方案,直接输出基础提示词;若否,则语言大模型需生成提示词优化方案。
14、进一步的,所述语言大模型对第一优化提示词进行同义改写的数量由用户自定义设置。
15、进一步的,所述循环结束条件具体包括循环次数达到预设值和第一分数集中的分数均高于原始分数集中的分数;其中,所述预设值是在执行提示词的优化方法前设置的;
16、一种提示词的优化系统,应用于如上所述的提示词的优化方法,其改进之处在于,所述提示词的优化系统包括:
17、问答生成模块,用于通过对原始问题集计算得到原始回答集、结合基础提示词对原始问题集计算得到第一回答集以及结合第一优化提示词和若干同义优化提示词分别对原始问题集计算得到若干优化回答集;
18、同义改写模块,用于分析理解第一优化提示词,并生成语句不同但意义相同的若干同义优化提示词;
19、回答评估模块,用于比对原始回答集、第一回答集以及若干优化回答集同目标答案集的相似度,并根据评分机制和比对的相似度进行评分,以生成原始分数集、第一分数集以及若干优化分数集;
20、分数筛选模块,用于分别计算第一分数集和若干优化分数集的平均分,并保留平均分数最高的优化提示词;
21、优化方案生成模块,用于分析原始分数集和第一分数集生成基础提示词的各种基础优化方案;
22、优化方案总结模块,用于总结各个基础优化方案,生成综合优化方案;
23、优化提示词生成模块,用于结合综合优化方案和基础提示词,生成第一优化提示词。
24、一种电子设备,其改进之处在于,包括:至少一个处理器以及至少一个存储器,其中,
25、所述存储器上存储有计算机可读指令;
26、所述计算机可读指令被一个或多个所述处理器执行,使得电子设备实现如上所述的提示词的优化方法。
27、一种存储介质,其上存储有计算机可读指令,其改进之处在于,所述计算机可读指令被一个或多个处理器执行,以实现如上所述的提示词的优化方法。
28、本发明的有益效果是:本方案通过语言大模型分别通过直接对原始问题集进行计算、结合基础提示词对原始问题进行计算、结合第一优化提示和同义优化提示词对原始问题进行计算,以得到原始回答集、第一回答集以及若干优化回答集;分别对原始回答集、第一回答集以及优化回答集进行分数评估和比较,保留并输出分数最高的优化提示词;在此过程中,语言大模型通过结合原始分数集和第一分数集生成提示词优化方案对基础提示词进行优化,得到第一优化提示词,并通过对第一优化提示词进行同义改写得到若干同义优化提示词;并分别计算第一分数集和若干优化分数集的平均分,并输出分数最高的优化提示词,且将分数最高的优化提示词作为下一轮优化的基础提示词;循环持续执行上述提示词的优化过程,并判断当前循环是否满足循环结束条件,若满足,则循环结束,若不满足,则循环继续;此方案中提示词的优化方法通过语言大模型自动实现,无需手动调整,且能够通过比对评估分数的方式找到分数最高的提示词,并持续的对提示词进行迭代又换,从而既提高了调整提示词的效率和准确率,又优化了用户体验。
1.一种提示词的优化方法,应用于语言大模型,其特征在于,所述提示词的优化方法包括以下步骤:
2.根据权利要求1所述的一种提示词的优化方法,其特征在于,所述语言大模型获取基础提示词和原始问题集的具体方式为:用户将基础提示词和原始问题集直接输入至语言大模型中,语言大模型直接对用户输入的基础提示词和原始问题集对应的文本信息进行读取。
3.根据权利要求2所述的一种提示词的优化方法,其特征在于,所述语言大模型中设置有原始问题集对应的目标答案集以及基于目标答案集相似度的评分机制。
4.根据权利要求3所述的一种提示词的优化方法,其特征在于,所述语言大模型对第一回答集及若干优化回答集进行分数评估的具体方式为:语言大模型通过比对第一回答集及若干优化回答集同目标答案集的相似度,并根据语言大模型中的评分机制对比对的相似度进行评分,以得出第一分数集及若干优化分数集。
5.根据权利要求4所述的一种提示词的优化方法,其特征在于,所述语言大模型在生成提示词优化方案的过程中,需先判断第一分数集中的分数是否均高于原始分数集中的分数,若是,则语言大模型不提出优化方案,直接输出基础提示词;若否,则语言大模型需生成提示词优化方案。
6.根据权利要求1所述的一种提示词的优化方法,其特征在于,所述语言大模型对第一优化提示词进行同义改写的数量由用户自定义设置。
7.根据权利要求1所述的一种提示词的优化方法,其特征在于,所述循环结束条件具体包括循环次数达到预设值和第一分数集中的分数均高于原始分数集中的分数;其中,所述预设值是在执行提示词的优化方法前设置的。
8.一种提示词的优化系统,应用于权利要求1-7任一项所述的提示词的优化方法,其特征在于,所述提示词的优化系统包括:
9.一种电子设备,其特征在于,包括:至少一个处理器以及至少一个存储器,其中,
10.一种存储介质,其上存储有计算机可读指令,其特征在于,所述计算机可读指令被一个或多个处理器执行,以实现如权利要求1至7中任一项所述的提示词的优化方法。