本技术涉及计算机,尤其涉及数据处理方法、数据处理装置、计算机设备及计算机可读存储介质、计算机程序产品。
背景技术:
1、非玩家角色(non-player character,npc)在电子游戏中是十分重要的部分,其不受真实玩家控制,而是由人工智能(artificial intelligence,ai)程序控制,可以模拟真实世界中的对象执行各种行为。目前对npc行为的ai决策方式是通过对不同行为对应的数值进行加权评分,评分最高的行为作为ai决策的npc执行行为。然而,通过这种ai决策方式确定出的npc执行行为难以融合不同虚拟对象所具有的特性,导致npc行为表现缺少灵活性。
技术实现思路
1、本技术实施例提供一种数据处理方法、装置、设备及存储介质、程序产品,可以确定出更加符合虚拟对象的特性和行为习惯的行为,这样有助于虚拟对象实现更加多样化、更加生动、以及更加自然的行为表现。
2、一方面,本技术实施例提供一种数据处理方法,该方法包括:针对目标候选行为,确定目标候选行为包括的各个行为分量的基础行为决策参数,利用修正参数对各个基础行为决策参数进行修正处理,并根据各个修正后的基础行为决策参数确定目标候选行为的参考行为决策参数,若根据虚拟对象的历史行为序列确定目标候选行为满足衰减调整条件,则对参考行为决策参数进行衰减调整,得到目标候选行为的目标行为决策参数;其中,目标候选行为为虚拟对象的多个候选行为中的任意一个,修正参数与虚拟对象的特性相关联;根据多个候选行为中的各个候选行为的目标行为决策参数,确定各个候选行为的决策概率;根据虚拟对象的目标历史行为以及各个候选行为的决策概率,从多个候选行为中确定虚拟对象的目标执行行为。
3、一方面,本技术实施例提供一种数据处理装置,该装置包括:
4、获取单元,用于获取虚拟对象的多个候选行为;
5、处理单元,用于针对目标候选行为,确定目标候选行为包括的各个行为分量的基础行为决策参数,利用修正参数对各个基础行为决策参数进行修正处理,并根据各个修正后的基础行为决策参数确定目标候选行为的参考行为决策参数,若根据虚拟对象的历史行为序列确定目标候选行为满足衰减调整条件,则对参考行为决策参数进行衰减调整,得到目标候选行为的目标行为决策参数;其中,目标候选行为为虚拟对象的多个候选行为中的任意一个,修正参数与虚拟对象的特性相关联;根据多个候选行为中的各个候选行为的目标行为决策参数,确定各个候选行为的决策概率;根据虚拟对象的目标历史行为以及各个候选行为的决策概率,从多个候选行为中确定虚拟对象的目标执行行为。
6、在一些实施例中,获取单元,还用于获取目标行为分量的初始行为决策参数,目标行为分量为目标候选行为包括的多个行为分量中的任意一个;获取目标行为分量对应的区间参数和阈值参数,阈值参数用于指示目标行为分量的行为决策参数的变化折点;处理单元,还用于根据区间参数以及阈值参数将初始行为决策参数调整到基准范围内,得到目标行为分量的基础行为决策参数。
7、在一些实施例中,获取单元,还用于获取虚拟对象的历史行为序列,历史行为序列包括虚拟对象的m个已执行行为,m个已执行行为连续,且按照执行顺序从后往先的顺序排列,m个已执行行为中排在首位的已执行行为是虚拟对象最近一次执行的行为,m为正整数;处理单元,还用于若历史行为序列中存在目标候选行为,且目标候选行为排在前n位,则确定目标候选行为满足衰减调整条件;n是根据m和设定参数确定的,且n为小于m的正整数。
8、在一些实施例中,处理单元,还用于确定历史行为序列中目标候选行为的数量;若数量大于或等于第一阈值,则利用第一衰减参数对参考行为决策参数进行衰减调整,得到目标候选行为的目标行为决策参数;若数量小于第一阈值,则根据第一衰减参数确定第二衰减参数,并利用第二衰减参数对参考行为决策参数进行衰减调整,得到目标候选行为的目标行为决策参数;其中,第一衰减参数小于第二衰减参数。
9、在一些实施例中,处理单元,还用于若虚拟对象的目标历史行为包含于多个候选行为中,则从各个候选行为的决策概率中确定目标历史行为的目标决策概率;目标历史行为是虚拟对象最近一次执行的行为;若根据目标决策概率确定目标历史行为满足惯性触发条件,则将目标历史行为确定为虚拟对象的目标执行行为;若根据目标决策概率确定目标历史行为不满足所述惯性触发条件,则按照行为选取策略从多个候选行为中确定虚拟对象的目标执行行为。
10、在一些实施例中,处理单元,还用于若目标决策概率大于或等于第二阈值,则确定目标历史行为满足所述惯性触发条件;或者,若目标决策概率大于或等于第三阈值且小于第二阈值,则计算目标决策概率和第四阈值的乘积,若乘积大于各个候选行为的决策概率,则确定目标历史行为满足所述惯性触发条件;其中,第三阈值小于第二阈值,第二阈值小于第四阈值,第三阈值为第一程度选取的概率值,第二阈值为第二程度选取的概率值,第一程度小于第二程度。
11、在一些实施例中,处理单元,还用于根据各个候选行为的决策概率,从多个候选行为中确定决策概率小于第五阈值的第一候选行为;根据多个候选行为中除第一候选行为之外的各个第二候选行为的决策概率,从各个第二候选行为中随机确定虚拟对象的目标执行行为。
12、相应地,本技术实施例还提供了一种计算机设备,包括:处理器、通信接口和存储器,上述处理器、上述通信接口和上述存储器相互连接,其中,上述存储器存储有可执行程序代码,上述处理器用于调用所述可执行程序代码,实现本技术实施例中的方法。
13、相应地,本技术实施例还提供了一种计算机可读存储介质,该计算机读存储介质中存储有计算机程序,该计算机程序被处理器执行时,实现本技术实施例中的方法。
14、相应地,本技术实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序或计算机指令,该计算机程序或计算机指令被处理器执行时实现本技术实施例中的方法。
15、相应地,本技术实施例提供了一种计算机程序,该计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取计算机指令,处理器执行计算机指令,使得计算机设备执行本技术实施例中的方法。
16、通过实施本技术实施例,一方面,通过利用与虚拟对象的特性相关联的修正参数,对各个候选行为的基础行为决策参数进行修正处理,这样可以使得基于修正后的行为决策参数确定出的目标执行行为更加符合虚拟对象的特性。另一方面,在根据虚拟对象的历史行为序列确定候选行为满足衰减调整条件的情况下,对参考行为决策参数进行衰减调整,可以使得基于衰减调整得到的目标行为决策参数确定出的目标执行行为,能够一定程度地体现虚拟对象执行重复行为时产生的倦怠感,从而有利于增强虚拟对象的行为表现的真实性。除此之外,根据虚拟对象的目标历史行为以及各个候选行为的决策概率,从各个候选行为中确定虚拟对象的目标执行行为,可以引入行为惯性对虚拟对象的行为决策的影响,使得最终确定出的目标执行行为更加符合虚拟对象的行为习惯,从而有利于增强虚拟对象的行为表现的自然性。总而言之,通过实施本技术实施例确定出的虚拟对象的目标执行行为不仅更加符合虚拟对象的特性,而且更加符合虚拟对象的行为习惯,这样有助于虚拟对象实现更加多样化、更加生动、以及更加自然的行为表现,提升虚拟对象的表现效果。