1.本公开涉及计算机技术领域,尤其涉及自然语言处理和深度学习等人工智能技术领域,具体涉及一种事件的处理方法、装置、计算机设备及存储介质。
背景技术:2.生活中,往往会出现各种各样的突发事件,比如,城市交通枢纽的突发事故,如果没有高效应急的处置,会导致事故的危害性随着时间推移进一步扩大。为了适应应急信息化发展,对于潜在的或可能发生的突发事件,如果可以通过事先制定的预案进行应急处置,将会极大的减少损失。
3.相关技术中,通常通过预测事件的类别,根据人工预设的类别-处置建议字典进行查询得到预案。而人工预设的字典和预案通常较为繁琐,难以做到自适应迭代,且现有的预案模型通常存在模式固化的缺陷,很少会利用事件本身的语义信息,从而导致预案处置不合理,无法提供最佳的处置建议。
技术实现要素:4.本公开提供了一种事件的处理方法、装置、计算机设备及存储介质。
5.根据本公开的第一方面,提供了一种事件的处理方法,包括:
6.确定待处理事件对应的第一向量及预设的事件图谱中每个参考事件对应的第二向量;
7.根据所述第一向量与每个所述第二向量间的相似度,从所述事件图谱中确定出与所述待处理事件相关的各个关联事件;
8.根据所述第一向量分别与每个所述关联事件对应的第二向量间的相似度,确定所述待处理事件与每个所述关联事件间的转移概率;
9.根据各个所述转移概率及每个所述关联事件对应的标签向量,确定所述待处理事件对应的类型标签。
10.根据本公开的第二方面,提供了一种事件的处理装置,包括:
11.第一确定模块,用于确定待处理事件对应的第一向量及预设的事件图谱中每个参考事件对应的第二向量;
12.第二确定模块,用于根据所述第一向量与每个所述第二向量间的相似度,从所述事件图谱中确定出与所述待处理事件相关的各个关联事件;
13.第三确定模块,用于根据所述第一向量分别与每个所述关联事件对应的第二向量间的相似度,确定所述待处理事件与所述每个关联事件间的各个转移概率;
14.第四确定模块,用于根据所述所述转移概率及每个所述关联事件对应的标签向量,确定所述待处理事件对应的类型标签。
15.根据本公开的第三方面,提供了一种电子设备,包括:
16.至少一个处理器;以及
17.与所述至少一个处理器通信连接的存储器;其中,
18.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所述的方法。
19.根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如第一方面所述的方法。
20.根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如第一方面所述的方法。
21.本公开中的事件的处理方法、装置、设备以及存储介质,至少存在以下有益效果:
22.首先确定待处理事件对应的第一向量及预设的事件图谱中每个参考事件对应的第二向量,之后根据第一向量与每个第二向量间的相似度,从事件图谱中确定出与待处理事件相关的各个关联事件,然后根据第一向量分别与每个关联事件对应的第二向量间的相似度,确定待处理事件与每个关联事件间的各个转移概率,最后根据各个转移概率及每个关联事件对应的标签向量,确定待处理事件对应的类型标签。由此,通过结合待处理事件的语义信息、与各个关联事件间的各个转移概率及各个关联事件对应的标签向量,自动确定待处理事件对应的类型标签,从而不仅提高了事件处置建议的合理性和可靠性,而且降低了事件处理成本。
23.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
24.附图用于更好地理解本方案,不构成对本公开的限定。其中:
25.图1是根据本公开一实施例的事件的处理方法的流程示意图;
26.图2是根据本公开另一实施例的事件的处理方法的流程示意图;
27.图3是根据本公开又一实施例的事件的处理方法的流程示意图;
28.图4是根据本公开一实施例的事件的处理装置的结构框图;
29.图5是用来实现本公开实施例的事件的处理方法的电子设备的框图;
具体实施方式
30.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
31.本公开提供的事件的处理方法,该方法可以由本公开提供的事件的处理装置执行,也可以由本公开提供的电子设备执行,其中,电子设备可以包括但不限于台式电脑、平板电脑等终端设备,也可以是服务器,下面以由本公开提供的事件的处理装置来执行本公开提供的一种事件的处理方法,而不作为对本公开的限定,以下简称为“装置”。
32.下面结合参考附图对本公开提供的一种事件的处理方法进行详细描述。
33.图1为本公开实施例所提供的一种事件的处理方法的流程示意图。
34.如图1所示,该事件的处理方法可以包含以下步骤:
35.步骤101,确定待处理事件对应的第一向量及预设的事件图谱中每个参考事件对应的第二向量。
36.本公开中,可以基于任意可将文本向量化的方法,确定待处理事件对应的向量。比如,可以利用词集模型,确定对待处理事件对应的向量;或者,还可以利用词袋模型,确定对待处理事件对应的向量;或者,还可以基于词袋模型及逆文本频率指数 (inverse document frequency,idf)值,确定对待处理事件对应的向量;或者,还可以基于平滑逆词频(smooth inverse frequency, sif),确定对待处理事件对应的向量等等,本公开对此不做限制。其中,第一向量可以为与待处理事件对应的向量,第二向量可以为与每个参考事件对应的向量。
37.步骤102,根据第一向量与每个第二向量间的相似度,从事件图谱中确定出与待处理事件相关的各个关联事件。
38.本公开中,为了直观展示各个事件间的关联关系,还可以构建事件图谱,将待处理事件和各参考事件作为节点,其中,节点之间存在连线,该装置可以将待处理事件和各参考事件之间的相似度作为对应连线的权重。
39.具体的,该装置可以对待处理事件对应的第一向量和各个参考事件分别对应的各个第二向量之间的相似度进行计算,从而之后可以从事件图谱中根据各相似度确定与待处理事件相关的各个关联事件。
40.作为一种可能实现的方式,在将文本向量化之后,本公开可以通过计算第一向量和各个第二向量之间夹角余弦值来评估他们的相似度,对此不进行限定。
41.进而,该装置可以将与待处理事件之间相似度大于指定阈值的各参考事件作为关联事件。通过比较待处理事件与各参考事件之间的相似度,该装置从而可以从事件图谱中确定与待处理事件相关的各个关联事件。
42.举例来说,若计算事件si和事件sj的相似度sim
i,j
,可以将 si和sj事件作为节点,sim
i,j
即为事件si和事件sj这两节点之间的边的权重,通过余弦相似度计算待处理事件和各个参考事件间的相似度,公式如下:
[0043][0044]
其中,为参考事件si对应的向量,为参考事件sj对应的向量,为
[0045]
向量对应的模长,为向量对应的模长。
[0046]
可以理解的是,待处理事件对应第一向量,各个参考事件与各个第二向量相对应。因而,该装置可以通过计算第一向量与各个第二向量的相似度,从而确定待处理事件和各个参考事件间的相似度,然后将与待处理事件间的相似度大于阈值的参考事件,确定为与待处理事件相关的关联事件,将与待处理事件间的相似度小于阈值的参考事件,确定为与待处理事件关系较小的非关联事件,对此不进行限定。
[0047]
步骤103,根据第一向量分别与每个关联事件对应的第二向量间的相似度,确定待处理事件与每个关联事件间的各个转移概率。
[0048]
可以理解的是,转移概率,用于表征两个事件间互相转换的概率。比如待处理事件
转化为某个关联事件的概率。若待处理事件转化为某个关联事件的转移概率越高,则说明待处理事件向该关联事件转移越容易。
[0049]
具体来说,该装置可以先计算待处理事件与各个关联事件间的相似度之和,然后根据待处理事件与每个关联事件的相似度,与待处理事件与各个关联事件间的相似度之和的比值,确定从待处理事件到每个关联事件的转移概率。
[0050]
可选的,在确定待处理事件与每个关联事件间的各个转移概率之后,本公开还可以基于待处理事件及待处理事件与每个关联事件间的转移概率,更新预设的事件图谱。
[0051]
步骤104,根据各个转移概率及每个关联事件对应的标签向量,确定待处理事件对应的类型标签。
[0052]
其中,本公开中的,类型标签可以为用于描述事件所属的类型的标签,比如,人群聚集、交通堵塞、垃圾乱放等等,或者,还可以为与事件对应的处置建议标签等等,本公开对此不做限定。
[0053]
可选的,该装置可以根据各个转移概率及每个关联事件对应的标签向量,确定待处理事件对应的类型标签向量,然后根据类型标签向量中各个元素的取值及类型标签向量中各个元素对应的类型标签,确定待处理事件对应的类型标签。
[0054]
为方便说明,将待处理事件记为se,以l
:,
表示关联事件si的标签的 one-hot(独热)列向量。若关联事件si对应的标签为第k个标签时,该装置则可以确定关联事件在第k个标签下的l
:,
记为1,否则,可以确定关联事件在第k个标签下的l
:,
记为0。
[0055]
进而,该装置可以根据各个转移概率p
i,e
及每个关联事件对应的标签向量l
:,
,确定待处理事件se对应的类型标签向量q,公式如下:
[0056][0057]
之后,该装置可以据此计算类型标签向量中各个元素的取值,将类型标签向量中取值最大的前g个元素对应的类型标签作为待处理事件对应的类型标签,对此不进行限定。
[0058]
需要说明的是,若以类型标签向量q作为该装置对待处理事件的处置建议得分,可以将待处理事件的处置建议得分较高的元素对应的类型标签,作为待处理事件对应的类型标签。其中,待处理事件的类型标签也可以是多个,由此可以为用户提供多个较佳的处置建议以供选择。
[0059]
本公开实施例中该装置首先确定待处理事件对应的第一向量及预设的事件图谱中每个参考事件对应的第二向量,之后根据第一向量与每个第二向量间的相似度,从事件图谱中确定出与待处理事件相关的各个关联事件,然后根据第一向量分别与每个关联事件对应的第二向量间的相似度,确定待处理事件与每个关联事件间的各个转移概率,最后根据各个转移概率及每个关联事件对应的标签向量,确定待处理事件对应的类型标签。由此,通过结合待处理事件的语义信息、与每个关联事件间的各个转移概率及各个关联事件对应的标签向量,自动确定待处理事件对应的类型标签,从而不仅提高了事件处置建议的合理性和可靠性,而且降低了事件处理成本。
[0060]
图2为本公开实施例所提供的另一种事件的处理方法的流程示意图。
[0061]
如图2所示,该事件的处理方法可以包含以下步骤:
[0062]
步骤201,获取第一描述文本集,其中,第一描述文本集中包括多个第一描述文本,
其中,每个第一描述文本对应一个历史事件。
[0063]
其中,第一描述文本可以为与历史事件对应的描述文本,也即待分词处理的文本。
[0064]
步骤202,对第一描述文本集中的多个第一描述文本分别进行分词处理,以获取分词集及分词集中每个第一分词在第一描述文本集中出现的频率,其中,分词集中包括多个历史第一描述文本中出现的各个第一分词。
[0065]
需要说明的是,该装置可以预先设定一个历史事件库,其中,在历史事件库中可以包含有多个历史第一描述文本,比如,当前待处理事件之前一个月的事件对应的第一描述文本,本公开对历史事件的范围不进行限定。
[0066]
本公开中,该装置在获取第一描述文本集之后,可以确定第一描述文本集中的各个第一描述文本,然后对第一描述文本进行分词处理,具体来说,可以对第一描述文本进行分词以及去停用词操作,其中,分词操作可以为将连续的第一描述文本进行分割,从而获取词语序列,去停用词操作可以为将词语序列中无意义的词语进行删除,对此不进行限定。
[0067]
举例来说,若第一描述文本为“诚信小区的东侧堆满了建筑垃圾,请及时清运垃圾”,通过分词操作,可以将描述文本分割为“诚信小区”、“的”、“东侧”、“堆满”、“了”、“建筑”、“垃圾”、“请”、“及时”、“清运”、“垃圾”,通过去停用词操作,可以将上述分词操作后所得的词语序列进行过滤,从而获得“诚信小区”、“东侧”、“堆满”、“建筑”、“垃圾”、“及时”、“清运”、“垃圾”。
[0068]
需要说明的是,上述举例仅为示意性说明,本公开对分词处理的具体操作不进行限定。
[0069]
具体的,该装置在进行分词处理时,用到分词词库,为了提高分词处理的准确性,该装置可以在分词词库中插入地理实体列表。其中,地理实体列表通常包括道路的名称列表,比如“富强路”、“民主路”、“文明路”、“和谐路”等等,或者小区的名称列表,比如“诚信小区”、“友善小区”等等,对此不进行限定。
[0070]
需要说明的是,地理实体列表不限于道路的名称列表和小区的名称列表,还可以为其他兴趣点名称(point of interest,poi) 列表,比如建筑物的名称列表,本公开在此不进行限制。
[0071]
在对各历史事件对应的第一描述文本进行分词处理后,该装置可以确定各第一分词对应的第一描述文本集,其中,每个第一描述文本集中都包含有每个第一分词在历史事件中出现的频率。
[0072]
举例来说,第一描述文本集为q,其中,第一描述文本集中包含的第一分词可以有“及时”、“清运”、“垃圾”,以及第一分词对应的频率[及时-5次]、[清运-4次]、[垃圾-1次]等等,本公开在此不做限制。
[0073]
步骤203,根据每个第一分词在第一描述文本集中出现的频率,确定词概率字典。
[0074]
具体的,该装置可以对第一描述文本集中每个第一分词出现的频率进行统计,以形成词概率字典。其中,词概率字典包括各个分词及其在事件中出现的概率的分词与概率对。
[0075]
步骤204,遍历词概率字典,以确定待处理事件对应的第一向量及每个参考事件对应的第二向量。
[0076]
作为一种可能实现的方式,该装置还可以通过遍历词概率字典,然后确定待处理
事件对应的第二描述文本中每个第二分词对应的词概率、及每个参考事件对应的第三描述文本中每个第三分词对应的词概率,之后根据每个第二分词对应的词概率、每个第二分词对应的词向量及历史事件的数量,确定待处理事件对应的第一向量,然后根据每个第三分词对应的词概率、每个第三分词对应的词向量及历史事件的数量,确定参考事件对应的第二向量。
[0077]
可以理解的是,词概率字典中,对应词概率越大的分词,说明其在各种事件中出现的概率越大,相应的,其对每个事件的影响性可能就偏小。而对应词概率越小的分词,则说明其在事件中出现的概率较小,相应的,其对所在的事件的影响可能就偏大。
[0078]
可选的,可以根据各个第二分词对应的概率,将各个第二分词对应的词向量进行加权平均,以确定待处理事件对应的第一向量;或者,还可以根据每个第二分词对应的概率,将每个第二分词对应的词向量进行调整,然后再将调整后的各分词向量进行拼接,以确定待处理事件对应的第一向量。
[0079]
为方便说明,将历史事件的数量记为s,且s不为0,将第一向量记为vs,分词对应的词向量记为vw,则第一向量vs可以通过以下方式计算:
[0080][0081]
其中,a为平滑参数,p(w)为词语w在分词结果中出现的概率,u 为分词词语的集合,u为vs的最大奇异值对应的奇异向量。
[0082]
需要说明的是,词向量vm可以由开源的词向量文件或者基于事件语料库训练得到,对此不进行限定,第二向量的具体计算过程可以参照上述第一向量的具体计算过程,在此不进行赘述。
[0083]
步骤205,根据待处理事件对应的第一向量及每个参考事件对应的第二向量,确定与待处理事件相关的各个关联事件。
[0084]
需要说明的是,步骤204的具体实现过程可以参考上述实施例的详细描述,此处不再赘述。
[0085]
步骤206,确定第一向量与每个关联事件对应的各个第二向量间的相似度的和。
[0086]
在获取了第一向量和每个关联事件对应的各第二向量的相似度之后,该装置可以将第一向量与每个第二向量间的各个相似度进行相加以求和。若以事件si作为待处理事件,以ni作为待处理事件的各关联事件的数量,以k作为关联事件的个数,则可以以表示第一向量与每个关联事件对应的每个第二向量间的各个相似度的和。
[0087]
步骤207,根据待处理事件与每个关联事件间的相似度、及相似度的和,确定从待处理事件到每个关联事件的转移概率。
[0088]
具体的,该装置可以通过以下公式计算待处理事件si到每个关联事件的转移概率:
[0089][0090]
其中,sim
i,j
为待处理事件与关联事件的相似度,为待处理事件si与
各个关联事件的相似度的和,ni为节点si的邻居节点,k为关联事件的个数。
[0091]
需要说明的是,转移概率代表了待处理事件转向关联事件的难易程度,举例来说,若p
ij
较大,则说明事件si向事件sj转移起来较为容易。
[0092]
步骤208,根据各个转移概率及各个关联事件对应的标签向量,确定待处理事件对应的类型标签。
[0093]
需要说明的是,步骤208可以参照上述实施例的具体实现方式进行实现,本公开在此不进行限定。
[0094]
本公开实施例中该装置首先获取第一描述文本集,其中,第一描述文本集中包括多个第一描述文本,其中,每个第一描述文本对应一个历史事件。然后对第一描述文本集中的多个第一描述文本分别进行分词处理,以获取分词集及分词集中每个第一分词在第一描述文本集中出现的频率,其中,分词集中包括多个历史第一描述文本中出现的各个第一分词,然后根据每个第一分词在第一描述文本集中出现的频率,确定词概率字典,然后遍历词概率字典,以确定待处理事件对应的第一向量及每个参考事件对应的第二向量,根据待处理事件对应的第一向量及每个参考事件对应的第二向量,确定与待处理事件相关的各个关联事件确定第一向量与每个关联事件对应的各个第二向量间的相似度的和,之后根据待处理事件与每个关联事件间的相似度、及各个相似度的和,确定从待处理事件到每个关联事件的转移概率,最后根据各个转移概率及各个关联事件对应的标签向量,确定待处理事件对应的类型标签。由此,通过结合历史事件,确定待处理事件的向量,并根据待处理事件与每个关联事件间的转移概率及各个关联事件对应的标签向量,确定待处理事件对应的类型标签,从而使确定的待处理事件对应的类型标签更加合理,为提供最佳的处置建议提供了条件。
[0095]
图3为本公开实施例所提供的又一种事件的处理方法的流程示意图。
[0096]
如图3所示,该事件的处理方法可以包含以下步骤:
[0097]
步骤301,确定待处理事件对应的第一向量及预设的事件图谱中每个参考事件对应的第二向量。
[0098]
步骤302,根据待处理事件对应的第一向量及每个参考事件对应的第二向量,确定与待处理事件相关的各个关联事件。
[0099]
步骤303,根据所述第一向量分别与每个关联事件对应的第二向量间的相似度,确定所述待处理事件与所述各个关联事件间的各个转移概率。
[0100]
需要说明的是,上述步骤301、302、303可以参照上述实施例的具体实现方式进行实现,本公开在此不进行赘述。
[0101]
步骤304,获取事件标签矩阵,其中,标签矩阵中每个行向量为一个参考事件对应的标签向量,每个列向量对应一种类型标签。
[0102]
本公开中,事件标签矩阵,可以通过多种方式确定,下面本公开将对一种可能实现的方式进行说明。
[0103]
可选的,该装置首先获取多个历史事件,其中,多个历史事件中包括多个有标注类型标签的第一历史事件及多个无标注类型标签的第二历史事件。
[0104]
为方便说明,本公开将获取的历史事件数目记为q,将有标注类型标签的第一历史事件的数量记为h,将剩下的无标注类型标签的第二历史事件的数量记为q-h。
[0105]
之后,该装置可以根据每个第一历史事件对应的标注类型标签及预设的初始化类型标签,确定初始标签矩阵,其中,初始标签矩阵中包括s行c列,其中s为多个历史事件的数量,c为标注类型标签的数量与初始化类型标签的数量和。
[0106]
其中,预设的初始化类型标签可以为一个或者多个,对于无标注类型标签的第二历史事件,该装置可以对其预设初始化类型标签。在初始标签矩阵中,初始标签矩阵的行数可以代表历史事件的数量,初始标签的列数可以代表标注类型标签的数量与初始化类型标签的数量和,比如,若初始标签矩阵中包括5行4列,则说明历史事件的数量为5,标注类型标签的数量与初始化类型标签的数量和为4。
[0107]
之后,可以根据多个历史事件分别对应的多个第三向量间的相似度,确定多个历史事件对应的转移矩阵,其中,转移矩阵中包括s行 s列,转移矩阵中每行的元素和为1,然后基于转移矩阵,将初始标签矩阵进行更新,以获取第一标签矩阵。
[0108]
需要说明的是,将转移矩阵记为r,转移矩阵r为行和列的数目相同的矩阵,其中,转移矩阵的每行可以对应一个历史事件,每行各类型标签对应的转移概率之和为1。其中,每个历史事件都对应有第三向量,该装置可以通过计算待处理事件与历史事件的相似度,进而确定待处理事件与历史事件之间的转移概率。
[0109]
本公开中,对于初始标签矩阵l,该装置可以通过根据标签传播算法(label propagation algorithm,lpa)进行标签传播,具体来说,可以根据转移矩阵p和初始标签矩阵l,计算新的标签矩阵l’,本公开在此将新的标签矩阵记为第一标签矩阵,其中,第一标签矩阵是将初始标签矩阵进行更新所获得的矩阵,具体可以参照以下公式:
[0110]
l’=pl
[0111]
进一步地,在第一标签矩阵中每个第一历史事件对应的行向量表征的类型标签与标注类型标签均一致、且各个第二历史事件标签对应行向量表征的的类型标签与初始化类型标签均一致的情况下,该装置则确定第一标签矩阵为事件标签矩阵。相应的,若更新后的第一标签矩阵中任一第一历史事件对应的行向量表征的类型标签与标注类型标签不一致的情况下,利用任一第一历史事件对应的标注类型标签向量替换第一标签矩阵中的对应的行向量,以生成第二标签矩阵。
[0112]
进一步地,基于转移矩阵,该装置可以重复执行将第二标签矩阵进行更新的操作,直至更新后的标签矩阵与更新前的标签矩阵相同。
[0113]
可以理解的是,通过不断地重复执行将标签矩阵进行更新的操作,可以使更新后的标签矩阵逐渐达到收敛条件,也即能够使更新后的标签矩阵中各个标签,可以准确的表征各个事件对应的标签。
[0114]
或者,该装置还可以在标签矩阵达到预设的更新次数之后,将更新后的标签矩阵,确定为事件标签矩阵。
[0115]
举例来说,若预设的更新次数为5,则该装置可以在标签矩阵更新了5次后,将标签矩阵确定为事件标签矩阵,对此不进行限定。
[0116]
步骤305,根据事件标签矩阵中各行向量与参考事件的对应关系,确定每个关联事件对应的标签向量。
[0117]
为方便说明,将待处理事件记为se,以l
:,
表示关联事件si的标签的 one-hot(独热)列向量。若关联事件si对应的标签为第k个标签时,该装置则可以确定关联事件在第k个
标签下的l
:,
记为1,否则,可以确定关联事件在第k个标签下的l
:,
记为0。
[0118]
步骤306,根据各个转移概率及各个关联事件对应的标签向量,确定待处理事件对应的类型标签。
[0119]
需要说明的是,上述步骤306可以参照上述实施例的具体实现方式进行实现,本公开在此不进行赘述。
[0120]
步骤307,输出待处理事件对应的类型标签。
[0121]
具体的,在确定待处理事件对应的类型标签后,可以将待处理事件对应的类型标签输出至该装置的展示端以供用户进行选择,对此不进行限定。
[0122]
步骤308,在接收到类型标签修改指令的情况下,根据修改指令中的类型标签更新待处理事件的类型标签。
[0123]
可以理解的是,在用户选择或输入了待处理事件对应的类型标签时,也即待处理事件对应的处置建议时,则可以触发类型标签修改指令,该装置在接收到类型标签修改指令的情况下,则可以对根据修改指令中的类型标签对待处理事件的类型标签进行更新,从而能够实现该装置的自适应学习,而不是靠固定规则,提高了事件处理的灵活性。
[0124]
步骤309,根据更新后的待处理事件对应的类型标签,更新事件标签矩阵。
[0125]
需要说明的是,在更新事件标签矩阵之前,需要满足一定的更新条件,该装置可以通过判断更新后的待处理事件对应的类型标签是否达到更新条件,选择是否对事件标签矩阵进行更新。
[0126]
具体的,更新条件可以根据实际情况进行自由设定,举例来说,该装置可以按照一定的时间间隔对事件标签矩阵进行更新,比如每天更新,或者在待处理的事件达到了一定数量时事件标签矩阵进行更新。
[0127]
或者,可以为在事件的类型标签不准确或在类型标签的不准确的次数达到指定的阈值时进行更新,在错误标签的比例达到预设阈值的时候进行更新,还可以为在预测的标签与修改的标签的差异程度达到一定程度时进行更新。
[0128]
需要说明的是,上述更新条件仅为本公开的示意性说明,可以有多种情况,本公开在此不进行限定。
[0129]
本公开实施例中该装置首先确定待处理事件对应的第一向量及预设的事件图谱中每个参考事件对应的第二向量,之后根据待处理事件对应的第一向量及每个参考事件对应的第二向量,确定与待处理事件相关的各个关联事件,之后根据所述第一向量分别与每个关联事件对应的第二向量间的相似度,确定所述待处理事件与所述各个关联事件间的各个转移概率,之后获取事件标签矩阵,其中,标签矩阵中每个行向量为一个参考事件对应的标签向量,每个列向量对应一种类型标签,然后根据事件标签矩阵中各行向量与事件的对应关系,确定每个关联事件对应的标签向量,之后根据各个转移概率及各个关联事件对应的标签向量,确定待处理事件对应的类型标签,最后输出所述待处理事件对应的类型标签,在接收到类型标签修改指令的情况下,根据所述修改指令中的类型标签更新待处理事件的类型标签,并且根据更新后的所述待处理事件对应的类型标签,更新所述事件标签矩阵。由此,实现了对事件标签矩阵进行自适应迭代优化,从而为准确确定事件对应的类型标签提供了依据和条件,提高了事件处理的可靠性。
[0130]
为了实现上述实施例,本公开实施例还提出一种事件的处理装置。图4为本公开实
施例提供的一种时间的处理装置的结构示意图。
[0131]
如图4所示,该事件的处理装置包括:第一确定模块410、第二确定模块420、第三确定模块430以及第四确定模块440。
[0132]
第一确定模块410,第一确定模块,用于确定待处理事件对应的第一向量及预设的事件图谱中每个参考事件对应的第二向量;
[0133]
第二确定模块420,用于根据所述第一向量与每个所述第二向量间的相似度,从所述事件图谱中确定出与所述待处理事件相关的各个关联事件;
[0134]
第三确定模块430,用于根据所述第一向量分别与每个所述关联事件对应的第二向量间的相似度,确定所述待处理事件与所述每个关联事件间的各个转移概率;
[0135]
第四确定模块440,用于根据所述所述转移概率及每个所述关联事件对应的标签向量,确定所述待处理事件对应的类型标签。
[0136]
可选的,所述第一确定模块,包括:
[0137]
第一获取单元,用于获取第一描述文本集,其中,所述第一描述文本集中包括多个第一描述文本,其中,每个第一描述文本对应一个历史事件;
[0138]
第二获取单元,用于对所述第一描述文本集中的多个第一描述文本分别进行分词处理,以获取分词集及所述分词集中每个第一分词在第一描述文本集中出现的频率,其中,所述分词集中包括所述多个历史第一描述文本中出现的各个第一分词;
[0139]
第一确定单元,用于根据所述每个第一分词在所述第一描述文本集中出现的频率,确定词概率字典;
[0140]
第二确定单元,用于基于所述词概率字典,确定所述待处理事件对应的第一向量及每个所述参考事件对应的第二向量。
[0141]
可选的,所述第二确定单元,具体用于:
[0142]
遍历所述词概率字典,以确定所述待处理事件对应的第二描述文本中每个第二分词对应的词概率、及每个所述参考事件对应的第三描述文本中每个第三分词对应的词概率;
[0143]
根据所述每个第二分词对应的词概率、每个第二分词对应的词向量及所述历史事件的数量,确定所述待处理事件对应的第一向量;
[0144]
根据所述每个第三分词对应的词概率、每个第三分词对应的词向量及所述历史事件的数量,确定所述参考事件对应的第二向量。
[0145]
可选的,所述第二确定模块,具体用于:
[0146]
将与所述待处理事件间的相似度大于阈值的参考事件,确定为与所述待处理事件相关的关联事件。
[0147]
可选的,所述第三确定模块,具体用于:
[0148]
确定所述第一向量与每个所述关联事件对应的各个第二向量间的各个相似度的和;
[0149]
根据所述待处理事件与每个所述关联事件间的相似度、及所述相似度的和,确定从所述待处理事件到每个所述关联事件的转移概率。
[0150]
可选的,所述第四确定模块,包括:
[0151]
第三获取单元,用于获取事件标签矩阵,其中,所述标签矩阵中每个行向量为一个
参考事件对应的标签向量,每个列向量对应一种类型标签;
[0152]
第三确定单元,用于根据所述标签矩阵中各行向量与参考事件的对应关系,确定每个所述关联事件对应的标签向量。
[0153]
可选的,所述第三获取单元,具体用于:
[0154]
获取多个历史事件,其中,所述多个历史事件中包括多个有标注类型标签的第一历史事件及多个无标注类型标签的第二历史事件;
[0155]
根据每个所述第一历史事件对应的标注类型标签及预设的初始化类型标签,确定初始标签矩阵,其中,所述初始标签矩阵中包括s 行c列,其中s为所述多个历史事件的数量,c为所述标注类型标签的数量与所述初始化类型标签的数量和;
[0156]
根据所述多个历史事件分别对应的多个第三向量间的相似度,确定所述多个历史事件对应的转移矩阵,其中,所述转移矩阵中包括s 行s列,其中,所述转移矩阵中每行的元素和为1;
[0157]
基于所述转移矩阵,将所述初始标签矩阵进行更新,以获取第一标签矩阵;
[0158]
在所述第一标签矩阵中每个第一历史事件对应的行向量表征的类型标签与标注类型标签均一致、且各个第二历史事件标签对应行向量表征的的类型标签与初始化类型标签均一致的情况下,确定所述第一标签矩阵为所述事件标签矩阵。
[0159]
可选的,所述第三获取单元,还用于:
[0160]
在所述第一标签矩阵中任一第一历史事件对应的行向量表征的类型标签与标注类型标签不一致的情况下,利用所述任一第一历史事件对应的标注类型标签向量替换所述第一标签矩阵中的对应的行向量,以生成第二标签矩阵;
[0161]
基于所述转移矩阵,重复执行所述将标签矩阵进行更新的操作,直至更新后的标签矩阵与更新前的标签矩阵相同,或者达到预设的更新次数,将更新后的标签矩阵,确定为所述事件标签矩阵。
[0162]
可选的,所述第三确定单元,包括:
[0163]
第四确定单元,用于根据各个转移概率及所述各个关联事件对应的标签向量,确定所述待处理事件对应的类型标签向量;
[0164]
第五确定单元,用于根据所述类型标签向量中各个元素的取值及所述类型标签向量中各个元素对应的类型标签,确定所述待处理事件对应的类型标签。
[0165]
可选的,所述第五确定单元,还用于:
[0166]
输出所述待处理事件对应的类型标签;
[0167]
在接收到类型标签修改指令的情况下,根据所述修改指令中的类型标签更新所述待处理事件的类型标签;
[0168]
根据更新后的所述待处理事件对应的类型标签,更新所述事件标签矩阵。
[0169]
可选的,所述第三确定模块,还用于:
[0170]
基于所述待处理事件及所述待处理事件与每个所述关联事件间的转移概率,更新所述预设的事件图谱。
[0171]
本公开实施例中该装置首先确定待处理事件对应的第一向量及预设的事件图谱中每个参考事件对应的第二向量,之后根据第一向量与每个第二向量间的相似度,从事件图谱中确定出与待处理事件相关的各个关联事件,然后根据第一向量分别与每个关联事件
对应的第二向量间的相似度,确定待处理事件与每个关联事件间的各个转移概率,最后根据各个转移概率及每个关联事件对应的标签向量,确定待处理事件对应的类型标签。由此,通过结合待处理事件的语义信息、与每个关联事件间的各个转移概率及各个关联事件对应的标签向量,自动确定待处理事件对应的类型标签,从而不仅提高了事件处置建议的合理性和可靠性,而且降低了事件处理成本。
[0172]
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0173]
图5示出了可以用来实施本公开的实施例的示例电子设备500 的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0174]
如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(rom)502中的计算机程序或者从存储单元508加载到随机访问存储器(ram)503中的计算机程序,来执行各种适当的动作和处理。在ram 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、rom 502以及ram 503通过总线504 彼此相连。输入/输出(i/o)接口505也连接至总线504。
[0175]
设备500中的多个部件连接至i/o接口505,包括:输入单元 506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0176]
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai) 计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如事件的处理方法。例如,在一些实施例中,事件的处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由rom 502 和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到ram 503并由计算单元501执行时,可以执行上文描述的事件的处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行事件的处理方法。
[0177]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至
少一个输出装置。
[0178]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0179]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0180]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入) 来接收来自用户的输入。
[0181]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统 (例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、互联网和区块链网络。
[0182]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务("virtual private server",或简称 "vps")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
[0183]
本公开实施例中该装置首先确定待处理事件对应的第一向量及预设的事件图谱中每个参考事件对应的第二向量,之后根据第一向量与每个第二向量间的相似度,从事件图谱中确定出与待处理事件相关的各个关联事件,然后根据第一向量分别与每个关联事件对应的第二向量间的相似度,确定待处理事件与每个关联事件间的各个转移概率,最后根据各个转移概率及每个关联事件对应的标签向量,确定待处理事件对应的类型标签。由此,通过结合待处理事件的语义信息、与每个关联事件间的各个转移概率及各个关联事件对应
的标签向量,自动确定待处理事件对应的类型标签,从而不仅提高了事件处置建议的合理性和可靠性,而且降低了事件处理成本。
[0184]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
[0185]
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。