分类模型的训练方法、画像生成方法、装置、介质及设备与流程

文档序号:34104028发布日期:2023-05-10 19:07阅读:63来源:国知局
分类模型的训练方法、画像生成方法、装置、介质及设备与流程

本发明涉及深度学习、智慧城市,尤其涉及分类模型的训练方法、画像生成方法、装置、介质及设备。


背景技术:

1、通过风险预测或者犯罪预测,能够为执法部门提供预警信息,便于执法部门对预测时间段或者预测区域进行关注。

2、在实现本发明的过程中,发现现有技术中至少存在以下技术问题:目前的犯罪预测一般是通过历史风险或犯罪事件发生的地点、时间、类别进行关联来对未来风险和犯罪事件发生的结构和趋势进行预测,无法对特定人员进行风险预测。同时,传统的风险或犯罪预测方法需要大量的已掌握的风险或犯罪案件从而进行模型的监督训练,但往往风险和犯罪案件的信息保密程度较高,很难获得其相关信息。


技术实现思路

1、本发明提供了分类模型的训练方法、画像生成方法、装置、介质及设备,以通过正常人员的行为数据训练得到异常行为的分类模型,可用于对特定人员进行异常行为的判别与画像。

2、根据本发明的一方面,提供了一种分类模型的训练方法,包括:

3、获取样本行为数据,提取所述样本行为数据中的实体分词;

4、根据样本行为数据所包含的实体分词的词性,确定样本行为数据的样本类型,以及,根据样本行为数据所包含的实体分词所属类型,确定所述样本行为数据对应的异常行为类型;

5、基于任一异常行为类型对应的各样本类型的样本行为数据,训练得到所述异常行为类型的分类模型。

6、根据本发明的另一方面,提供了一种画像生成方法,包括:

7、获取目标对象的行为数据,并确定各所述行为数据的行为向量;

8、将各所述行为向量分别输入至各异常行为类型对应的分类模型中,得到各所述分类模型的输出结果;

9、根据各分类模型的输出结果对所述目标对象设置行为标签,并基于所述目标对象的行为标签形成所述目标对象的风险画像。

10、根据本发明的另一方面,提供了一种分类模型的训练装置,包括:

11、实体分词提取模块,用于获取样本行为数据,提取所述样本行为数据中的实体分词;

12、样本类型确定模块,用于根据样本行为数据所包含的实体分词的词性,确定样本行为数据的样本类型;

13、异常行为类型匹配模块,用于根据样本行为数据所包含的实体分词所属类型,确定所述样本行为数据对应的异常行为类型;

14、模型训练模块,用于基于任一异常行为类型对应的各样本类型的样本行为数据,训练得到所述异常行为类型的分类模型。

15、根据本发明的另一方面,提供了一种画像生成装置,包括:

16、行为向量确定模块,用于获取目标对象的行为数据,并确定各所述行为数据的行为向量;

17、分类模块,用于将各所述行为向量分别输入至各异常行为类型对应的分类模型中,得到各所述分类模型的输出结果;

18、画像生成模块,用于根据各分类模型的输出结果对所述目标对象设置行为标签,并基于所述目标对象的行为标签形成所述目标对象的风险画像。

19、根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:

20、至少一个处理器;以及

21、与所述至少一个处理器通信连接的存储器;其中,

22、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的分类模型的训练方法,或者,画像生成方法。

23、根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的分类模型的训练方法,或者,画像生成方法。

24、本发明实施例的技术方案,通过正常人员的样本行为数据训练得到各异常行为类型的分类模型,无需采集犯罪数据,降低了样本行为数据的采集难度。通过获取的样本行为数据中实体分词的词性和所属类型确定各异常行为类型对应的样本行为数据集,以训练得到各个异常行为类型对应的分类模型,无需对样本行为数据设置标签,简化了训练数据的处理过程,实现了分类模型的无监督训练。通过训练得到的分类模型可对待预测人员进行异常行为的预测,确定待预测人员是否具有异常行为风险,实现对特定人员的风险预测。

25、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种分类模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在根据样本行为数据所包含的实体分词的词性,确定样本行为数据的样本类型之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,根据各实体分词的出现频次确定各实体分词的词性,包括:

4.根据权利要求2所述的方法,其特征在于,根据样本行为数据所包含的实体分词的词性,确定样本行为数据的样本类型,包括:

5.根据权利要求1所述的方法,其特征在于,根据样本行为数据所包含的实体分词所属类型,确定所述样本行为数据对应的异常行为类型,包括:

6.根据权利要求1所述的方法,其特征在于,基于任一异常行为类型对应的各样本类型的样本行为数据,训练得到所述异常行为类型的分类模型,包括:

7.一种画像生成方法,其特征在于,包括:

8.根据权利要求7所述的方法,其特征在于,所述确定各所述行为数据的行为向量,包括:

9.根据权利要求7所述的方法,其特征在于,所述根据各分类模型的输出结果对所述目标对象设置行为标签,包括:

10.一种分类模型的训练装置,其特征在于,包括:

11.一种画像生成装置,其特征在于,包括:

12.一种电子设备,其特征在于,所述电子设备包括:

13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-6中任一项所述的分类模型的训练方法,或者权利要求7-9中任一项所述的画像生成方法。


技术总结
本发明公开了分类模型的训练方法、画像生成方法、装置、介质及设备。其中,分类模型的训练方法包括:获取样本行为数据,提取所述样本行为数据中的实体分词;根据样本行为数据所包含的实体分词的词性,确定样本行为数据的样本类型,以及,根据样本行为数据所包含的实体分词所属类型,确定所述样本行为数据对应的异常行为类型;基于任一异常行为类型对应的各样本类型的样本行为数据,训练得到所述异常行为类型的分类模型。利用正常人员词库中各词的词频差异性无监督地标记出词语的正负词性构建出正负样本库,实现分类模型的训练,降低训练数据的获取难度。训练得到的分类模型可确定对特定人员的风险画像,实现了对特定人员的风险预测。

技术研发人员:李晟洁,袁野,陈旭旭
受保护的技术使用者:京东城市(北京)数字科技有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1