回答评定方法、大语言模型的微调方法和相关设备与流程

文档序号:39251179发布日期:2024-09-03 17:32阅读:12来源:国知局
回答评定方法、大语言模型的微调方法和相关设备与流程

本申请涉及自然语言处理领域,尤其涉及一种回答评定方法,大语言模型的微调方法和相关设备。


背景技术:

1、传统儿童手表也拥有智能语音问答的功能,同时支持通过语音唤醒手表功能。例如,传统的儿童手表也包括拨打电话、制定闹钟、打开应用、播放音乐故事等功能,还可以进行基础的简单百科知识问答,回答小朋友生活中的疑惑。例如,儿童手表为上小学的小朋友提供诗句对答功能,通过向小朋友提问某个诗句的前半句或者后半句,提示小朋友回答该诗句的后半句或前半句,从而巩固小朋友的记忆。

2、然而,传统的儿童手表向小朋友提供诗句对答功能有比较大的局限性。手表端通常仅仅是基于预先设置的诗句知识库随机抽取某个诗句的前半句或后半句向小朋友进行提问,功能单一,限制了儿童手表的语音功能在实际应用中的效用。


技术实现思路

1、本申请实施例提供了一种回答评定方法、大语言模型的微调方法和相关设备,可以解决上述问题。所述技术方案如下:

2、第一方面,本申请实施例提供了一种回答评定方法,所述方法包括:

3、接收启动指令,在候选的多对诗句中确定目标诗句,以及获取用于指示用户回答第一子诗句对应的第二子诗句的提问信息,所述目标诗句由所述第一子诗句和所述第二子诗句组成;

4、输出所述提问信息,以及接收所述用户根据所述提问信息输入的回答信息;

5、根据大语言模型对所述回答信息进行评定,输出评定结果,所述评定结果包括与所述回答信息有关的评定内容以及与所述目标诗句有关的评定内容。

6、第二方面,本申请实施例提供了一种大语言模型的微调方法,所述大语言模型适用于如第一方面所述的回答评定方法,所述大语言模型的微调方法包括:

7、根据用于指示用户回答第一子诗句对应的第二子诗句的提问信息,获取所述提问信息对应的多个回答信息,所述第一子诗句和所述第二子诗句组成样本诗句,所述多个回答信息分别与所述第二子诗句之间的匹配程度皆不相同;

8、根据所述多个回答信息,确定所述多个回答信息分别对应的样本评定结果;

9、分别将所述多个回答信息输入至所述待训练大语言模型进行评定,输出多个训练评定结果,根据所述多个训练评定结果和多个所述样本评定结果训练所述待训练大语言模型直至收敛,得到所述大语言模型。

10、第三方面,本申请实施例提供了一种回答评定装置,所述装置包括:

11、第一接收模块,用于接收启动指令,在候选的多对诗句中确定目标诗句,以及获取用于指示用户回答第一子诗句对应的第二子诗句的提问信息,所述目标诗句由所述第一子诗句和所述第二子诗句组成;

12、第二接收模块,用于输出所述提问信息,以及接收所述用户根据所述提问信息输入的回答信息;

13、第一评定模块,用于根据大语言模型对所述回答信息进行评定,输出评定结果,所述评定结果包括与所述回答信息有关的评定内容以及与所述目标诗句有关的评定内容。

14、第四方面,本申请实施例提供了一种大语言模型的微调装置,所述大语言模型适用于如第一方面所述的回答评定方法,所述装置包括:

15、第一获取模块,用于根据用于指示用户回答第一子诗句对应的第二子诗句的提问信息,获取所述提问信息对应的多个回答信息,所述第一子诗句和所述第二子诗句组成样本诗句,所述多个回答信息分别与所述第二子诗句之间的匹配程度皆不相同;

16、第二获取模块,用于根据所述多个回答信息,确定所述多个回答信息分别对应的样本评定结果;

17、第一训练模块,用于分别将所述多个回答信息输入至所述待训练大语言模型进行评定,输出多个训练评定结果,根据所述多个训练评定结果和多个所述样本评定结果训练所述待训练大语言模型直至收敛,得到所述大语言模型。

18、第五方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。

19、第六方面,本申请实施例提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。

20、本申请一些实施例提供的技术方案带来的有益效果至少包括:

21、在本申请实施例中,响应于启动回答评定功能的启动指令,在候选的多对诗句中确定由第一子诗句和第二子诗句组成的目标诗句,以及根据目标诗句获取用于指示用户回答第一子诗句对应的第二子诗句的提问信息,例如,第一子诗句为目标诗句的前半句,第二子诗句为目标诗句的后半句。通过语音等方式输出提问信息,以及接收用户根据提问信息输入的回答信息。进一步的,通过大语言模型对回答信息进行评定,输出包括与回答信息有关的评定内容以及与目标诗句有关的解析内容,与回答信息有关的评定内容表征回答信息中关于第二子诗句的读音、文本等是否正确,与目标诗句有关的解析内容表征目标诗句的来源、作者、背景、释义等。换而言之,本申请针对用户针对诗句的回答,输出信息丰富的评定结果,不仅可以对用户进行纠错,还可以向用户补充与该诗句有关的背景知识等信息,有效巩固用户对诗句的记忆,帮助用户学习诗句。



技术特征:

1.一种回答评定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的回答评定方法,其特征在于,所述根据大语言模型对所述回答信息进行评定,输出评定结果之前,还包括:

3.根据权利要求2所述的回答评定方法,其特征在于,所述根据所述回答信息与所述第二子诗句之间的匹配程度,生成所述回答信息对应的提示文本,包括:

4.根据权利要求1所述的回答评定方法,其特征在于,所述根据大语言模型对所述回答信息进行评定,输出评定结果之后,还包括:

5.根据权利要求1所述的回答评定方法,其特征在于,所述根据大语言模型对所述回答信息进行评定,输出评定结果之后,还包括:

6.一种大语言模型的微调方法,其特征在于,所述大语言模型适用于如权利要求1-5任一所述基于诗句的对话方法中,所述方法包括:

7.一种回答评定装置,其特征在于,所述装置包括:

8.一种大语言模型的微调装置,其特征在于,所述装置包括:

9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~6任意一项的方法步骤。

10.一种电子设备,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~6任意一项的方法步骤。


技术总结
本申请实施例公开了一种回答评定方法、大语言模型的微调方法和相关设备,设计自然语言处理领域。其中,回答评定方法包括:接收启动指令,在候选的多对诗句中确定目标诗句,以及获取用于指示用户回答第一子诗句对应的第二子诗句的提问信息,目标诗句由第一子诗句和第二子诗句组成输出提问信息,以及接收用户根据提问信息输入的回答信息;根据大语言模型对回答信息进行评定,输出评定结果,评定结果包括与回答信息有关的评定内容以及与目标诗句有关的解析内容。本申请针对用户针对诗句的回答,输出信息丰富的评定结果,不仅可以对用户进行纠错,还可以向用户补充与该诗句有关的背景知识等信息,有效巩固用户对诗句的记忆,帮助用户学习诗句。

技术研发人员:杨颖慧
受保护的技术使用者:深圳市三六零智慧生活科技有限公司
技术研发日:
技术公布日:2024/9/2
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1