基于时序点过程的多标签事件预测方法及相关设备与流程

文档序号:35959200发布日期:2023-11-08 21:27阅读:30来源:国知局
基于时序点过程的多标签事件预测方法及相关设备与流程

本技术涉及计算机,特别涉及一种基于时序点过程的多标签事件预测方法及相关设备。


背景技术:

1、通常在一段连续时间域上由多种事件的发生组成的过程中,事件间往往具有内在联系,一个事件的发生会促进或抑制其它事件的发生。时序点过程(continuous temporalpoint process)即为连续时间点过程,是由连续时间域上的一系列事件构成的随机过程,可以利用时间点过程对连续时间域上的事件进行建模以预测事件在时间域上的潜在发生概率。

2、多标签事件(multi-label event)是指同一时间发生会发生不定数量的多个预设事件。相关技术中,在利用时间点过程预测多标签事件在时间域上的潜在发生概率时,其预测准确性较差。


技术实现思路

1、为了解决现有技术的问题,本技术实施例提供了一种基于时序点过程的多标签事件预测方法及相关设备。所述技术方案如下:

2、一方面,提供了一种基于时序点过程的多标签事件预测方法,所述方法包括:

3、获取待预测对象在预测时间对应的历史事件记录序列,每个历史事件记录包括记录时间和事件信息,所述事件信息包括在所述记录时间并行发生的至少一个预设事件;

4、基于所述历史事件记录序列中各历史事件记录的事件信息进行事件相似度处理,得到每个所述历史事件记录对应的事件相似度信息;所述事件相似度信息表征相应历史事件记录与所述历史事件记录序列中各历史事件记录之间的事件相似度;

5、基于所述历史事件记录序列中各历史事件记录的记录时间进行时域相似度处理,得到每个所述历史事件记录对应的时域相似度信息;所述时域相似度信息表征相应历史事件记录与所述历史事件记录序列中各历史事件记录之间的时域相似度;

6、基于每个所述历史事件记录对应的事件相似度信息和时域相似度信息进行综合特征提取,得到每个所述历史事件记录的特征向量表示;

7、基于各所述历史事件记录的特征向量表示进行强度函数预测,得到目标预设事件对应的目标事件发生强度函数,并基于所述目标事件发生强度函数确定所述目标预设事件在所述预测时间的发生概率;所述目标预设事件为任一所述预设事件。

8、另一方面,提供了一种基于时序点过程的多标签事件预测装置,所述装置包括:

9、历史记录获取模块,用于获取待预测对象在预测时间对应的历史事件记录序列,每个历史事件记录包括记录时间和事件信息,所述事件信息包括在所述记录时间并行发生的至少一个预设事件;

10、事件相似度处理模块,用于基于所述历史事件记录序列中各历史事件记录的事件信息进行事件相似度处理,得到每个所述历史事件记录对应的事件相似度信息;所述事件相似度信息表征相应历史事件记录与所述历史事件记录序列中各历史事件记录之间的事件相似度;

11、时域相似度处理模块,用于基于所述历史事件记录序列中各历史事件记录的记录时间进行时域相似度处理,得到每个所述历史事件记录对应的时域相似度信息;所述时域相似度信息表征相应历史事件记录与所述历史事件记录序列中各历史事件记录之间的时域相似度;

12、综合特征提取模块,用于基于每个所述历史事件记录对应的事件相似度信息和时域相似度信息进行综合特征提取,得到每个所述历史事件记录的特征向量表示;

13、发生概率预测模块,用于基于各所述历史事件记录的特征向量表示进行强度函数预测,得到目标预设事件对应的目标事件发生强度函数,并基于所述目标事件发生强度函数确定所述目标预设事件在所述预测时间的发生概率;所述目标预设事件为任一所述预设事件。

14、在一个示例性的实施方式中,所述时域相似度处理模块,包括:

15、时间嵌入模块,用于对所述历史事件记录序列中各历史事件记录的记录时间进行向量嵌入处理,得到时间嵌入向量序列;

16、第一注意力权重确定模块,用于基于注意力机制,确定所述时间嵌入向量序列中每个时间嵌入向量对应的注意力权重信息;

17、时域相似信息确定子模块,将每个时间嵌入向量对应的注意力权重信息作为相应时间嵌入向量所对应历史事件记录的时域相似度信息。

18、在一个示例性的实施方式中,所述事件相似度处理模块,包括:

19、编码模块,用于对所述历史事件记录序列中各历史事件记录的事件信息进行编码处理,得到事件编码向量序列;

20、第二注意力权重确定模块,用于基于注意力机制,确定所述事件编码向量序列中每个事件编码向量对应的注意力权重信息;

21、事件相似信息确定子模块,将每个事件编码向量对应的注意力权重信息作为相应事件编码向量所对应历史事件记录的事件相似度信息。

22、在一个示例性的实施方式中,所述综合特征提取模块,包括:

23、综合相似度确定模块,用于对于每个所述历史事件记录对应的事件相似度信息和时域相似度信息,确定对应于同一历史事件记录的事件相似度和时域相似度的乘积,得到所述历史事件记录与所述同一历史事件记录之间的综合相似度;

24、特征向量表示确定子模块,用于基于各所述历史事件记录的事件编码向量和相应历史事件记录的综合相似度进行加权求和,得到所述历史事件记录的特征向量表示。

25、在一个示例性的实施方式中,所述编码模块,包括:

26、查找模块,用于查找所述历史事件记录序列对应的有效属性信息;

27、归一化模块,用于在查找到所述有效属性信息的情况下,对所述有效属性信息进行归一化处理,得到归一化信息;

28、加权模块,用于对于每个历史事件记录对应的事件嵌入向量集合,基于所述归一化信息对所述事件嵌入向量集合中的事件嵌入向量进行加权求和,得到每个所述历史事件记录对应的事件向量表示;

29、第一编码子模块,用于基于循环神经网络编码事件向量表示序列,得到所述事件编码向量序列;所述事件向量表示序列包括所述历史事件记录序列中各历史事件记录对应的事件向量表示;

30、其中,每个历史事件记录对应的事件嵌入向量集合基于对相应历史事件记录的事件信息进行向量嵌入处理得到。

31、在一个示例性的实施方式中,所述编码模块,还包括:

32、第二编码子模块,用于在未查找到所述有效属性信息的情况下,基于逆向循环神经网络编码每个所述历史事件记录对应的事件嵌入向量集合,得到每个所述历史事件记录在所述事件编码向量序列中对应的事件编码向量。

33、在一个示例性的实施方式中,所述发生概率预测模块,包括:

34、参数信息矩阵确定模块,用于对于每个历史事件记录的特征向量表示,基于多个预设强度影响参数分别对应的多个预设激活函数对所述特征向量表示进行预设维度的映射处理,得到所述历史事件记录对应每个所述预设强度影响参数的参数信息矩阵;所述预设维度与所述预设事件一一对应;

35、目标参数信息确定模块,用于基于各所述历史事件记录对应每个所述预设强度影响参数的参数信息矩阵,确定所述目标预设事件对应每个所述预设强度影响参数的目标参数信息;

36、目标事件发生强度函数确定模块,用于将所述目标预设事件对应每个所述预设强度影响参数的目标参数信息代入预设事件发生强度函数,得到所述目标预设事件对应的目标事件发生强度函数;所述预设事件发生强度函数包括所述多个预设强度影响参数。

37、在一个示例性的实施方式中,所述发生概率预测模块,还包括:

38、事件发生强度确定模块,用于将所述预测时间代入所述目标事件发生强度函数进行强度计算,得到所述目标预设事件在所述预测时间的事件发生强度;

39、累计强度确定模块,用于基于所述目标事件发生强度函数在目标时间区间进行累计强度计算,得到所述目标预设事件在所述目标时间区间的累积强度;所述目标时间区间为所述预测时间与距离所述预测时间最近的所述记录时间之间的时间段;

40、生存系数确定模块,用于基于所述累积强度,确定所述目标预设事件在所述预测时间的生存系数;

41、发生概率确定模块,用于确定所述目标预设事件在所述预测时间的事件发生强度与所述生存系数的乘积,作为所述目标预设事件在所述预测时间的发生概率。

42、在一个示例性的实施方式中,所述装置还包括模型训练模块,所述模型训练模块包括:

43、训练数据获取模块,用于获取样本对象在样本预测时间对应的样本历史事件记录序列,以及各所述预设事件在所述样本预测时间对应的参考标签;所述参考标签表征相应预设事件在所述样本预测时间是否发生;

44、向量序列确定模块,用于基于所述样本历史事件记录序列,确定样本时间嵌入向量序列和样本事件编码向量序列;

45、时域注意力处理模块,用于利用所述初始事件预测模型的时域注意力层,基于注意力机制和所述样本时间嵌入向量序列确定每个样本历史事件记录对应的样本时域相似度信息;基于注意力机制和所述样本事件编码向量序列确定每个样本历史事件记录对应的样本事件相似度信息;并基于每个样本历史事件记录对应的样本事件相似度信息和样本时域相似度信息进行综合特征提取得到每个样本历史事件记录的样本特征向量表示;

46、预测模块,用于基于各样本历史事件记录的样本特征向量表示进行强度函数预测得到各所述预设事件对应的目标样本事件发生强度函数,并基于每个所述预设事件对应的目标样本事件发生强度函数,确定每个所述预设事件在所述样本预测时间的发生概率;

47、参数调整模块,用于基于每个所述预设事件在所述样本预测时间的发生概率与相应预设事件在所述样本预测时间的参考标签确定损失值,并基于所述损失值调整所述初始事件预测模型的模型参数直至满足预设训练结束条件,得到所述事件预测模型。

48、在一个示例性的实施方式中,所述预测模块,包括:

49、样本事件发生强度确定模块,用于对于每个所述预设事件,将所述样本预测时间代入所述预设事件对应的目标样本事件发生强度函数,得到所述预设事件在所述样本预测时间的样本事件发生强度;

50、样本累积强度确定模块,用于基于所述目标样本事件发生强度函数在目标样本时间区间进行累计强度计算,得到所述预设事件在所述目标样本时间区间的样本累积强度;所述目标样本时间区间为所述样本预测时间与距离所述样本预测时间最近的样本记录时间之间的时间段;

51、样本生存系数确定模块,用于基于所述样本累积强度,确定所述预设事件在所述样本预测时间的样本生存系数;

52、预测子模块,用于确定所述预设事件的样本事件发生强度与所述样本生存系数的乘积,作为所述预设事件在所述样本预测时间的发生概率。

53、在一个示例性的实施方式中,所述参数调整模块,包括:

54、区间概率确定模块,用于对于每个所述预设事件对应的目标样本事件发生强度函数,对所述目标样本事件发生强度函数在所述目标样本时间区间进行积分处理,得到相应预设事件在所述目标样本时间区间的区间概率;

55、损失值确定模块,用于利用似然函数,基于每个所述预设事件的所述发生概率、所述区间概率和所述参考标签,确定损失值。

56、另一方面,提供了一种电子设备,包括处理器和存储器,所述存储器中存储有至少一条指令或者至少一段程序,所述至少一条指令或者所述至少一段程序由所述处理器加载并执行以实现上述任一方面的基于时序点过程的多标签事件预测方法。

57、另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令或者至少一段程序,所述至少一条指令或者所述至少一段程序由处理器加载并执行以实现如上述任一方面的基于时序点过程的多标签事件预测方法。

58、另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行上述任一方面的基于时序点过程的多标签事件预测方法。

59、本技术实施例通过基于历史事件记录序列中各历史事件记录的事件信息进行事件相似度处理得到每个历史事件记录对应的事件相似度信息,并基于历史事件记录序列中各历史事件记录的事件信息的记录时间进行时域相似度处理,得到每个历史事件记录对应的时域相似度信息,进而基于每个历史事件记录对应的事件相似度信息和时域相似度信息进行综合特征提取得到每个历史事件记录的特征向量表示,基于各历史事件记录的特征向量表示进行强度函数预测得到目标预设事件对应的目标事件发生强度函数,并基于该目标事件发生强度函数确定该目标预设事件在预测时间的发生概率,从而考虑了连续时间在全局中的影响,使得多标签事件预测的准确性大大提高。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1