一种关键事件检测方法、系统、电子设备及介质

文档序号:35466501发布日期:2023-09-16 06:16阅读:114来源:国知局
一种关键事件检测方法、系统、电子设备及介质

本发明涉及事件检测领域,特别是涉及一种关键事件检测方法、系统、电子设备及介质。


背景技术:

1、所谓关键事件检测就是在一个关于某一主题的语料库中得到一组聚类簇,每一个簇中包含一组描述同一事件的文章。事件发展脉络梳理就是生成每个关键事件的事件描述并按照发生时间排列。随着计算机和网络技术的飞速发展,呈指数增长的、繁杂的、海量的数据信息应运而生,导致人们往往只能看到局部的信息,而很难全面且快速地了解全局信息。因此,探索更为先进的事件检测与事件发展脉络梳理技术,使得人们可以在大规模数据中快速和精确地检测到关键事件,并能及时观测到此关键事件的发展情况,逐渐成为众多研究者关注的研究对象。

2、新闻事件存在发展快速且多变的特性,因此大量地获取有标注的数据比较困难,并且基于训练数据得到的模型可移植性较差。因此使用聚类等无监督方法也成为了一种趋势。如构造keygraph然后使用社区发现算法进行聚类、识别突发信息网络(binet)上的关键节点或关键区域作为质心并构造集群,从而将将事件检测问题转化为在binet网络上实现社区检测以及构造峰值短语图并通过聚类得到关键事件。可以发现目前的研究中,图结构被普遍的使用。

3、图是一种常被使用的数据结构,由边集合和点集合组成。可以被用来表示多种现实中的数据,如社交网络,交通链路以及引用信息等。图卷积网络起源于卷积网络,尽管卷积网络已经给一些领域带来了大幅度的提升。但是,卷积网络只可以在欧式空间上进行卷积运算。面对非欧式空间的图结构,卷积网络通常难以处理。而图卷积网络可以方便的应用到图结构数据之上。通过使用图卷积神经网络,可以将图中各个节点与边的数据进行融合,挖掘出隐藏在图结构之下的信息。进而提升下游的预测、聚类等任务的表现。

4、关键事件检测问题通常可由依据文本信息构造图结构,再对图结构进行聚类等操作进行解决。但是在目前大多数研究中,通常在构建图结构时基于经验人为设定某些图节点间边的权重,有很大的主观性且缺乏普适性。并且一般在对图结构进行处理时并未考虑图中所包含的深层次的信息而直接进行处理。这两个问题通常会导致关键事件检测的准确率和覆盖度不够高。在关键事件检测之后,往往没有对所检测到的关键事件进行一定的梳理,导致得出的结果的可阅读性较低。


技术实现思路

1、基于此,本发明实施例提供一种关键事件检测方法、系统、电子设备及介质,以提高关键事件检测的精准率。

2、为实现上述目的,本发明实施例提供了如下方案:

3、一种关键事件检测方法,包括:

4、抽取目标新闻文本中的高质量短语,并以高质量短语的符合嵌入特征作为节点特征构建图结构;所述高质量语句为满足设定的质量要求的语句;

5、基于图卷积神经网络对所述图结构进行更新,得到图优化结构;所述图优化结构用于提取深度语义信息;

6、采用基于模块度的社区发现算法检测图优化结构中的非重叠社区结构,生成关键事件簇;

7、为所述关键事件簇中的各个关键事件生成事件发展脉络。

8、可选地,抽取目标新闻文本中的高质量短语,并以高质量短语的符合嵌入特征作为节点特征构建图结构,具体包括:

9、采用短语抽取器抽取目标新闻文本中的高质量短语;

10、根据高质量短语自身的语义信息和高质量短语的上下文信息,对高质量短语进行嵌入表示,得到短语嵌入表示;

11、对高质量短语所述的新闻的发布时间进行嵌入表示,得到时间嵌入表示;

12、将所述短语嵌入表示和所述时间嵌入表示进行级联,得到高质量短语的符合嵌入特征;

13、以高质量短语的符合嵌入特征作为节点特征构建图结构。

14、可选地,基于图卷积神经网络对所述图结构进行更新,得到图优化结构,具体包括:

15、采用图卷积神经网络对所述图结构中的节点进行更新,采用非线性更新公式对所述图结构中的边进行更新,得到图优化结构。

16、可选地,采用基于模块度的社区发现算法检测图优化结构中的非重叠社区结构,生成关键事件簇,具体包括:

17、以模块度最大为目标,采用迭代的方法对图优化结构中的节点进行聚类,得到聚类结果;

18、采用evmine模型检索与关键事件相关的文档,得到关键事件簇。

19、可选地,为所述关键事件簇中的各个关键事件生成事件发展脉络,具体包括:

20、使用抽取式无监督摘要生成方法生成所述关键事件簇中的各个关键事件的摘要描述;

21、确定所述关键事件簇中的各个关键事件发生的时间跨度估计;

22、根据所述摘要描述和所述时间跨度估计生成事件发展脉络。

23、可选地,采用图卷积神经网络对所述图结构中的节点进行更新的更新公式为:

24、

25、其中,l∈[1,l],l表示图卷积神经网络的层数;表示图输入时的状态;表示图卷积神经网络第l层的输出;d表示的度矩阵;表示添加了自连接的邻接矩阵,a表示的邻接矩阵,in表示单位阵;relu表示激活函数,wl为图卷积神经网络中第l层的参数;

26、所述非线性更新公式为:

27、

28、其中,wu,v表示节点v和节点u间边的权重;cossim表示余弦相似度;u∈[1,m],v∈[1,m],u表示图结构中的一个节点,v表示图结构中的另一个节点,m为图结构的节点个数;tu表示节点u对应的时间嵌入,tv表示节点v对应的时间嵌入;表示节点u对应的深度语义嵌入特征;表示节点v对应的深度语义嵌入特征。

29、可选地,所述模块度的计算公式为:

30、

31、其中,q表示模块度;r表示图优化结构中边的总数;wu,v表示节点v和节点u间边的权重;ku表示节点u的度;kv表示节点v的度;δ(u,v)表示节点v和节点u是否在一个社区;若节点u和节点v在一个社区中,则δ(u,v)=1,否则δ(u,v)=0。

32、本发明还提供了一种关键事件检测系统,包括:

33、图结构构建模块,用于抽取目标新闻文本中的高质量短语,并以高质量短语的符合嵌入特征作为节点特征构建图结构;所述高质量语句为满足设定的质量要求的语句;

34、图结构优化模块,用于基于图卷积神经网络对所述图结构进行更新,得到图优化结构;所述图优化结构用于提取深度语义信息;

35、关键事件簇生成模块,用于采用基于模块度的社区发现算法检测图优化结构中的非重叠社区结构,生成关键事件簇;

36、事件发展脉络生成模块,用于为所述关键事件簇中的各个关键事件生成事件发展脉络。

37、本发明还提供了一种电子设备,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行上述的关键事件检测方法。

38、本发明还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述的关键事件检测方法。

39、根据本发明提供的具体实施例,本发明公开了以下技术效果:

40、本发明实施例抽取目标新闻文本中的高质量短语,以高质量短语的符合嵌入特征作为节点特征构建图结构,并基于图卷积神经网络对图结构进行更新,得到图优化结构,该图结构构建方式避免了在以往研究中主观性;并且使用图卷积神经网络更新图结构,能提取出高质量短语中各个节点的深度语义信息,从而提升图的表达能力,进而提高关键事件检测的精确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1