人机交互的数据处理方法、服务器及存储介质与流程

文档序号:36621400发布日期:2024-01-06 23:16阅读:13来源:国知局
人机交互的数据处理方法、服务器及存储介质与流程

本申请涉及计算机技术,尤其涉及一种人机交互的数据处理方法、服务器及存储介质。


背景技术:

1、随着人工智能的发展,大模型被广泛应用于自然语言处理领域的人机交互中。目前,对于如大规模语言模型等人机交互模型的评估大家集中在评估模型的单轮对话能力。然而人机交互的多轮对话能力的应用场景很多,如聊天、人机互动游戏、人工智能助手等。很多用户在最开始时并没有形成清晰指令和问题,所以需要多轮对话,也可能需要人机交互模型进行苏格拉底式提问帮助用户。多轮对话能力是目前人机交互模型具备重要价值能力,如何客观评估这些人机交互模型的多轮对话能力非常重要。

2、目前多轮对话能力的评估方法,使用的多轮对话数据是预先设计好的,至少各轮输入人机交互模型的问题是固定的,无论人机交互模型在上一轮是否给出响应、给出的响应是什么,下一轮输入人机交互模型的问题是不会变化的,不能很好地模拟人类真实自然的交互过程,不能真正、准确地测评人机交互模型多轮对话能力,不利于模型迭代中选择多轮对话能力较好的优质模型、不利于控制上线模型进行多轮对话的质量,导致人机交互质量差。


技术实现思路

1、本申请提供一种人机交互的数据处理方法、服务器及存储介质,用以解决现有技术不能真正、准确地测评人机交互模型多轮对话能力,不利于模型迭代中选择多轮对话能力较好的优质模型、不利于控制上线模型进行多轮对话的质量,导致人机交互质量差的问题。

2、第一方面,本申请提供一种人机交互的数据处理方法,包括:

3、获取预先构建的会话主题,和待测评的第一人机交互模型;

4、使用第二人机交互模型基于所述会话主题与所述第一人机交互模型进行多轮对话,得到所述会话主题的多轮对话信息,所述对话信息包括:输入所述第一人机交互模型的问题信息,和所述第一人机交互模型生成的所述问题信息的响应信息;

5、根据所述会话主题的多轮对话信息,确定所述第一人机交互模型的多轮对话能力的测评信息。

6、第二方面,本申请提供一种人机交互的数据处理方法,包括:

7、接收端侧设备发送的对语言模型的多轮对话能力的测评请求,获取预先构建的至少一个会话主题;

8、使用第二人机交互模型基于所述会话主题与所述语言模型进行多轮对话,得到所述会话主题的多轮对话信息,所述对话信息包括:输入所述语言模型的问题信息,和所述语言模型生成的所述问题信息的响应信息;

9、根据所述会话主题的多轮对话信息,确定所述语言模型的多轮对话能力的测评信息。

10、第三方面,本申请提供一种服务器,包括:

11、至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述服务器执行第一方面或第二方面所述的方法。

12、第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面或第二方面所述的方法。

13、本申请提供的人机交互的数据处理方法、服务器及存储介质,通过获取预先构建的会话主题,和待测评的第一人机交互模型;使用第二人机交互模型基于会话主题与第一人机交互模型进行多轮对话,得到基于会话主题的多轮对话信息,对话信息包括:输入第一人机交互模型的问题信息,和第一人机交互模型生成的问题信息的响应信息;使用第二人机交互模型拟人类用户与第一人机交互模型围绕会话主题进行多轮对话的过程,由此产生基于会话主题的多轮对话信息。进一步地,根据会话主题的多轮对话信息,确定第一人机交互模型的多轮对话能力的测评信息,可以真正地实现第一人机交互模型的多轮对话能力的测评,获得准确地、高质量的测评信息,测评信息用于指导第一人机交互模型的上线判定或更新第一人机交互模型的优化版本,可以在第一人机交互模型迭代中准确地选择优质模型,提升迭代更新得到的第一人机交互模型的多轮对话质量,提升上线模型的多轮对话质量,从而提升人机交互中多轮对话的质量。



技术特征:

1.一种人机交互的数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,使用第二人机交互模型基于所述会话主题与所述第一人机交互模型进行多轮对话,得到所述会话主题的多轮对话信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述使用所述第二人机交互模型,基于已得到的所述会话主题的各轮对话信息,生成下一轮的问题信息,包括:

4.根据权利要求2所述的方法,其特征在于,所述使用所述第二人机交互模型,基于已得到的所述会话主题的各轮对话信息,生成下一轮的问题信息,包括:

5.根据权利要求2所述的方法,其特征在于,

6.根据权利要求3所述的方法,其特征在于,还包括:

7.根据权利要求1所述的方法,其特征在于,所述根据所述会话主题的多轮对话信息,确定所述第一人机交互模型的多轮对话能力的测评信息,包括:

8.根据权利要求1所述的方法,其特征在于,所述根据所述会话主题的多轮对话信息,确定所述第一人机交互模型的多轮对话能力的测评信息,包括:

9.根据权利要求1所述的方法,其特征在于,所述根据所述会话主题的多轮对话信息,确定所述第一人机交互模型的多轮对话能力的测评信息,包括:

10.根据权利要求1所述的方法,其特征在于,还包括:

11.根据权利要求10所述的方法,其特征在于,还包括:

12.根据权利要求1-11中任一项所述的方法,其特征在于,还包括:

13.根据权利要求1-11中任一项所述的方法,其特征在于,还包括:

14.一种人机交互的数据处理方法,其特征在于,包括:

15.一种服务器,其特征在于,包括:

16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-14任一项所述的方法。


技术总结
本申请提供一种人机交互的数据处理方法、服务器及存储介质。本申请的方法,通过获取预先构建的会话主题,使用第二人机交互模型基于会话主题与待测评的第一人机交互模型进行多轮对话,得到基于会话主题的多轮对话信息,使用模拟人类用户与第一人机交互模型的多轮对话过程;根据会话主题的多轮对话信息,确定第一人机交互模型的多轮对话能力的测评信息,可以真正实现第一人机交互模型的多轮对话能力的测评,获得高质量的测评信息,提升第一人机交互模型的测评质量,从而可在第一人机交互模型迭代中准确地选择优质模型,提升迭代更新得到的第一人机交互模型的多轮对话质量,提升上线模型的多轮对话质量,从而提升人机交互中多轮对话的质量。

技术研发人员:张一昌,刘高,林俊旸,周畅,周靖人
受保护的技术使用者:阿里云计算有限公司
技术研发日:
技术公布日:2024/1/5
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1