本技术涉及人工智能和游戏,具体而言,本技术涉及一种游戏策略的推荐方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术:
1、随着计算机技术和互联网技术的迅速发展,电子游戏越来越受欢迎。在一些游戏场景中,电子设备控制的虚拟角色,或者称为智能体,可以协助玩家控制的虚拟角色进行对战,例如智能体向玩家控制的虚拟角色提供游戏策略。
2、现有技术方案通常是人工枚举可能涉及的虚拟角色的状态,通过规则的方式进行策略推送。例如,一个规则:在虚拟角色的血量低于预设百分比,且虚拟角色的背包中包括药包时,向虚拟角色推荐策略,该策略为:打药。
3、基于规则的方案劣势在于其严重依赖于人工制定策略以及梳理对应的规则,这导致新策略的产生到上线的周期十分漫长;且这种方式构建策略点往基于规则的方案劣势在于其严重依赖于人工制定策略以及梳理对应的规则,这导致新策略的产生到上线的周期十分漫长;且这种方式构建策略点往由于虚拟角色的状态考虑的面不够广,而导致的不准确的问题。
技术实现思路
1、本技术实施例提供了一种游戏策略的推荐方法、装置、电子设备、计算机可读存储介质及计算机程序产品,可以解决现有技术的上述问题。所述技术方案如下:
2、根据本技术实施例的一个方面,提供了一种游戏策略的推荐方法,该方法包括:
3、获得目标虚拟角色在当前游戏对局中的当前对局信息;
4、根据参考对局信息集中各个参考对局信息与所述当前对局信息的匹配度确定至少一个目标参考对局信息;
5、获得各目标参考对局信息对应的参考游戏策略;
6、基于各目标参考对局信息对应的参考游戏策略向所述目标虚拟角色进行游戏策略推荐。
7、根据本技术实施例的另一个方面,提供了一种游戏策略的推荐装置,该装置包括:
8、对局信息获取模块,用于获得目标虚拟角色在当前游戏对局中的当前对局信息;
9、对局匹配模块,用于根据参考对局信息集中各个参考对局信息与所述当前对局信息的匹配度确定至少一个目标参考对局信息;
10、参考策略活动模块,用于获得各目标参考对局信息对应的参考游戏策略;
11、策略推荐模块,用于基于各目标参考对局信息对应的参考游戏策略向所述目标虚拟角色进行游戏策略推荐。
12、作为一种可选的实施方式,对于所述当前对局信息和所述参考对局信息集中的每个对局信息,所述对局信息包括虚拟环境信息、对应的虚拟角色的状态信息以及局部行为序列信息。
13、作为一种可选的实施方式,对局匹配模块包括:
14、匹配度子模块,用于确定所述当前对局信息与多个参考对局信息簇的匹配度,所述多个参考对局信息簇是通过对所述参考对局信息集进行聚类处理得到的;
15、目标参考对局模块,用于将匹配度最高的参考对局信息簇中的参考对局信息作为所述目标参考对局信息。
16、作为一种可选的实施方式,匹配度子模块包括:
17、特征向量单元,用于对所述当前对局信息中的虚拟环境信息、对应的虚拟角色的状态信息以及局部行为序列信息分别进行特征编码,根据所述虚拟环境信息、对应的虚拟角色的状态信息以及局部行为序列信息的特征编码结果,获得所述当前对局信息的当前特征向量;
18、距离确定单元,用于确定所述当前特征向量与各个参考对局信息簇的簇中心的距离,将每个所述参考对局信息簇对应的距离作为所述参考对局信息簇对应的匹配度,距离越小匹配度越高;
19、其中,所述参考对局信息簇是通过对所述参考对局信息集中的各个参考对局信息的参考特征向量进行聚类处理获得的,所述参考特征向量是根据参考对局信息中的虚拟环境信息、对应的虚拟角色的状态信息以及局部行为序列信息分别进行特征编码后的特征编码结果获得的。
20、作为一种可选的实施方式,局部行为序列信息的特征编码结果为所述局部行为序列信息的词嵌入表示;
21、特征向量单元具体用于:
22、确定所述当前对局信息中的局部行为序列信息的目标种类,将所述目标种类对应的词嵌入表示作为所述当前对局信息中的局部行为序列信息的词嵌入表示;
23、其中,各个种类的局部行为序列信息对应的词嵌入表示,是通过参考对局信息集中的各个种类的局部行为序列信息训练词嵌入模型获得的。
24、作为一种可选的实施方式,策略推荐模块包括:
25、评价指数单元,用于获取各所述目标参考对局信息对应的各个参考游戏策略的评价指数;
26、目标策略单元,用于根据各个参考游戏策略的评价指数确定目标游戏策略,根据所述目标游戏策略生成并提供推荐信息,所述推荐信息包括与所述目标游戏策略相关的执行建议信息。
27、作为一种可选的实施方式,目标策略单元用于:
28、响应于获得策略提供指令,提供所述推荐信息,所述策略提供指令是通过语音或者预设游戏控件触发的。
29、作为一种可选的实施方式,目标游戏策略包括以下至少一种:
30、评价指数最高的至少一个参考游戏策略;
31、评价指数最低的至少一个参考游戏策略;
32、评价指数高于第一阈值的参考游戏策略;
33、评价指数低于第二阈值的参考游戏策略。
34、作为一种可选的实施方式,每个所述参考游戏策略的评价指数是通过以下方式确定的:
35、获取所述参考对局信息集中每个参考对局信息的评价指数、以及每个参考对局信息的参考游戏策略;
36、对于每个所述参考游戏策略,若所述参考游戏策略对应一个参考对局信息,则将所述参考对局信息的评价指数确定为所述参考游戏策略对应的评价指数,若所述参考游戏策略对应至少两个参考对局信息,则根据所述至少两个参考对局信息的评价指数确定所述参考游戏策略的评价指数。
37、作为一种可选的实施方式,参考对局信息集和所述参考对局信息局中每个参考对局信息对应的参考游戏策略,是通过以下方式得到的:
38、获取至少一个参考虚拟角色对应的多个历史游戏对局的全局对局信息,每个所述全局对局信息包括参考虚拟角色在历史游戏对局中的全局行为序列;
39、根据预设的游戏策略触发规则,确定每个所述全局对局信息的全局行为序列中满足所述触发规则的局部行为序列,其中,所述触发规则包括至少一个游戏策略对应的触发规则;
40、对于满足所述触发规则的每个局部行为序列,根据所述局部行为序列所满足的触发规则对应的目标游戏策略,确定所述局部行为序列对应的全局对局信息中所述目标游戏策略对应的目标局部对局信息;
41、将确定出的每个所述目标局部对局信息作为参考对局信息,将所述目标局部对局信息对应的目标游戏策略确定为参考对局信息的参考游戏策略。
42、根据本技术实施例的另一个方面,提供了一种电子设备,该电子设备包括存储器、处理器及存储在存储器上的计算机程序,处理器执行所述计算机程序以实现上述游戏策略的推荐方法的步骤。
43、根据本技术实施例的再一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的游戏策略的推荐方法的步骤。
44、根据本技术实施例的一个方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时上述游戏策略的推荐方法的步骤。
45、本技术实施例提供的技术方案带来的有益效果是:
46、通过获取目标虚拟角色在当前游戏对局中的当前对局信息,不需要对获取当前对局信息的时间做限制,也即满足于在游戏对局中的任意时间获取对局信息,通过预先获取的参考对局信息集中各个参考对局信息域当前对局信息的匹配程度,确定与当前对局信息匹配的至少一个目标参考对局信息,进一步获得各个目标参考对局信息对应的参考游戏策略,基于各目标参考对局信息对应的参考游戏策略向所述目标虚拟角色进行游戏策略推荐,灵活性大大提高,可以更及时地向目标虚拟角色推荐游戏策略。