市域事件分类方法和装置、异常事件检测方法和装置与流程

文档序号:36201955发布日期:2023-11-30 03:29阅读:48来源:国知局
市域事件分类方法和装置与流程

本公开的实施例涉及市域管理,具体涉及市域事件分类方法和装置、异常事件检测方法和装置。


背景技术:

1、在市域治理体系中,一般通过监测、分析各类型的事件数量变化情况,来进行高发事件预警。从而有助于因政施策,可以有效提高市域治理效果。

2、该背景技术部分中所公开的以上信息仅用于增强对本发明构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。


技术实现思路

1、本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。

2、本公开的一些实施例提出了市域事件分类方法、市域事件分类装置、异常事件检测方法、异常事件检测装置、电子设备、计算机可读介质和计算机程序产品,来解决以上背景技术部分提到的技术问题中的一项或多项。

3、第一方面,本公开的一些实施例提供了一种市域事件分类方法,包括:根据目标事件数据生成事件输入数据;将事件输入数据输入预先训练完成的分类模型,得到目标事件数据的预测事件类型,其中,分类模型用于预测输入事件的分类类型;基于候选类型集中的各候选类型,与预测事件类型之间的相似度,从候选类型集中选取候选类型,以作为目标事件数据的事件类型。

4、在一些实施例中,根据目标事件数据生成事件输入数据,包括:对目标事件数据进行分词处理,得到目标事件数据的词集;根据词集生成事件输入数据。

5、在一些实施例中,根据词集生成事件输入数据,包括:确定词集中各词的向量表示,以及将各词的向量表示分别作为事件表示矩阵中的一行,得到事件表示矩阵以作为事件输入数据。

6、在一些实施例中,得到目标事件数据的预测事件类型,包括:响应于分类模型输出类型表示矩阵,基于类型表示矩阵中各元素的值,确定目标事件数据的预测事件类型。

7、在一些实施例中,基于类型表示矩阵中各元素的值,确定目标事件数据的预测事件类型,包括:确定类型表示矩阵中各行元素的最大值,根据该最大值元素所在的列索引号,确定对应预设词表中的文字,得到文字描述的预测事件类型;其中,类型表示矩阵的列数与预设词表的长度相对应,预设词表中各字的索引号与该字在表中的位置有关。

8、在一些实施例中,该方法还包括:利用杰卡德系数,确定候选类型集中的各候选类型,与预测事件类型之间的相似度。

9、在一些实施例中,分类模型通过以下方法训练得到:将样本数据中的样本事件表示矩阵输入分类模型,输出得到预测类型表示矩阵;将预测类型表示矩阵与对应的样本类型表示矩阵进行比较分析,以及根据比较结果调整分类模型中的参数,以继续训练模型,其中,样本类型表示矩阵通过对样本类型数据进行独热编码得到。

10、第二方面,本公开的一些实施例提供了一种市域事件分类装置,包括:数据生成单元,被配置成根据目标事件数据生成事件输入数据;类型预测单元,被配置成将事件输入数据输入预先训练完成的分类模型,得到目标事件数据的预测事件类型,其中,分类模型用于预测输入事件的分类类型;类型选取单元,被配置成基于候选类型集中的各候选类型,与预测事件类型之间的相似度,从候选类型集中选取候选类型,以作为目标事件数据的事件类型。

11、在一些实施例中,数据生成单元进一步被配置成对目标事件数据进行分词处理,得到目标事件数据的词集;根据词集生成事件输入数据。

12、在一些实施例中,数据生成单元进一步被配置成确定词集中各词的向量表示,以及将各词的向量表示分别作为事件表示矩阵中的一行,得到事件表示矩阵以作为事件输入数据。

13、在一些实施例中,类型预测单元进一步被配置成响应于分类模型输出类型表示矩阵,基于类型表示矩阵中各元素的值,确定目标事件数据的预测事件类型。

14、在一些实施例中,类型预测单元进一步被配置成确定类型表示矩阵中各行元素的最大值,根据该最大值元素所在的列索引号,确定对应预设词表中的文字,得到文字描述的预测事件类型;其中,类型表示矩阵的列数与预设词表的长度相对应,预设词表中各字的索引号与该字在表中的位置有关。

15、在一些实施例中,该分类装置还包括相似度确定单元,被配置成利用杰卡德系数,确定候选类型集中的各候选类型,与预测事件类型之间的相似度。

16、在一些实施例中,该分类装置还包括模型训练单元,被配置成将样本数据中的样本事件表示矩阵输入分类模型,输出得到预测类型表示矩阵;将预测类型表示矩阵与对应的样本类型表示矩阵进行比较分析,以及根据比较结果调整分类模型中的参数,以继续训练模型,其中,样本类型表示矩阵通过对样本类型数据进行独热编码得到。

17、第三方面,本公开的一些实施例提供了一种异常事件检测方法,包括:根据各统计周期内目标事件类型的历史事件数量,提取时间序列特征,其中,目标事件类型采用上述第一方面中,任一实现方式所描述的市域事件分类方法确定;将时间序列特征输入异常检测模型,输出得到异常阈值;基于异常阈值,检测是否存在目标事件类型的异常事件。

18、在一些实施例中,时间序列特征包括以下至少一项:位于当前统计周期的前第预设数目个统计周期内的事件数量变化值、事件数量变化率,其中,预设数目包括至少一个数目;前预设数目个统计周期内的事件数量统计值,其中,事件数量统计值包括以下至少一项:事件数量总和、均值、中位值、最大值、最小值和方差。

19、在一些实施例中,根据各统计周期内目标事件类型的历史事件数据量,提取时间序列特征,还包括:响应于确定某个统计周期的时间序列特征缺失,将其他统计周期对应的时间序列特征的均值,作为缺失的时间序列特征的属性值;以及对于各统计周期的同一时间序列特征,将小于该时间序列特征均值的属性值,替换为特征均值。

20、第四方面,本公开的一些实施例提供了一种异常事件检测装置,包括:特征提取单元,被配置成根据各统计周期内目标事件类型的历史事件数量,提取时间序列特征,其中,目标事件类型采用上述第一方面中,任一实现方式所描述的市域事件分类方法确定;阈值确定单元,被配置成将时间序列特征输入异常检测模型,输出得到异常阈值;检测单元,被配置成基于异常阈值,检测是否存在目标事件类型的异常事件。

21、在一些实施例中,时间序列特征包括以下至少一项:位于当前统计周期的前第预设数目个统计周期内的事件数量变化值、事件数量变化率,其中,预设数目包括至少一个数目;前预设数目个统计周期内的事件数量统计值,其中,事件数量统计值包括以下至少一项:事件数量总和、均值、中位值、最大值、最小值和方差。

22、在一些实施例中,特征提取单元还被配置成响应于确定某个统计周期的时间序列特征缺失,将其他统计周期对应的时间序列特征的均值,作为缺失的时间序列特征的属性值;以及对于各统计周期的同一时间序列特征,将小于该时间序列特征均值的属性值,替换为特征均值。

23、第五方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面或第三方面中任一实现方式所描述的方法。

24、第六方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,计算机程序被处理器执行时实现上述第一方面或第三方面中任一实现方式所描述的方法。

25、第七方面,本公开的一些实施例提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现上述第一方面或第三方面中任一实现方式所描述的方法。

26、本公开的上述各个实施例具有如下有益效果:本公开的一些实施例的市域事件分类方法,可以提高事件类型确定的准确度。具体来说,在进行事件数量变化分析的过程中,通常事件信息中需要包含事件类型信息。然而,有些市域事件可能缺少事件类型。有些具有事件类型的市域事件,标注的事件类型可能不太准确。这些都会影响后续异常事件检测的准确性。

27、基于此,本公开的一些实施例的市域事件分类方法,首先可以将事件数据输入分类模型中,得到该事件的预测事件类型。通过模型进行分析预测,可以提高类型确定的准确度。接着,根据预测事件类型与各候选类型之间的相似度,可以在候选类型集中选取候选类型,从而作为该事件的事件类型。通过将预测事件类型与候选类型作进一步分析,来确定事件最终的事件类型,而不是直接将模型的预测结果作为最终事件类型。这样有助于进一步提高类型确定的准确度,从而得到所需的事件类型数据。而准确的事件类型,有利于提高后续异常事件检测的准确性。进而有助于减少异常事件的预警次数,以及减少无效预警(错误预警)次数。从而可以降低市域资源(如人力资源、设施资源等)的浪费。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1