样本构建方法、装置、设备以及存储介质与流程

文档序号:35673070发布日期:2023-10-07 23:06阅读:29来源:国知局
样本构建方法、装置、设备以及存储介质与流程

本申请涉及人工智能领域,尤其涉及一种样本构建方法、装置、设备以及存储介质。


背景技术:

1、在系统平台的自动化运营过程中,需要通过风险预测模型来预测不同进程行为特征所组成的特征组合的风险情况,以保证系统平台的安全运行。

2、现有技术中,用于训练风险预测模型的训练样本往往来源于已知的高级风险样本,由于样本量不足,模型很难学习到所有的特征组合,导致模型预测效果较差。简单的将各种进程行为特征自由组合很难确定其是否为真实存在,不能直接用于模型训练。

3、基于此,如何全面有效地构建风险样本成为亟需解决的问题。


技术实现思路

1、本申请实施例提供一种样本构建方法、装置、设备以及存储介质,可全面构建用于风险预测模型训练的风险样本,适用性高。

2、一方面,本申请实施例提供一种样本构建方法,该方法包括:

3、确定多个初始特征组合,每个上述初始特征组合包括预设特征集合中第一数量的进程行为特征,且任意两个上述初始特征组合不相同;

4、从各上述初始特征组合中确定出符合预设风险条件的第一特征组合;

5、确定每个上述第一特征组合的目标特征广度,根据每个上述第一特征组合的目标特征广度从各上述第一特征组合中确定出风险样本;

6、其中,每个上述目标特征广度用于表征与对应第一特征组合关联的对象主体的数量,每个上述对象主体用于表征以下至少一项:

7、一个设备以及该设备运行的一个进程;

8、一个设备以及该设备运行的一个进程树;

9、其中,上述风险样本用于训练风险预测模型,上述风险预测模型用于预测特征组合的风险情况。

10、另一方面,本申请实施例提供了一种样本构建装置,该装置包括:

11、特征处理模块,用于确定多个初始特征组合,每个上述初始特征组合包括预设特征集合中第一数量的进程行为特征,且任意两个上述初始特征组合不相同;

12、组合筛选模块,用于从各上述初始特征组合中确定出符合预设风险条件的第一特征组合;

13、样本确定模块,用于确定每个上述第一特征组合的目标特征广度,根据每个上述第一特征组合的目标特征广度从各上述第一特征组合中确定出风险样本;

14、其中,每个上述目标特征广度用于表征与对应第一特征组合关联的对象主体的数量,每个上述对象主体用于表征以下至少一项:

15、一个设备以及该设备运行的一个进程;

16、一个设备以及该设备运行的一个进程树;

17、其中,上述风险样本用于训练风险预测模型,上述风险预测模型用于预测特征组合的风险情况。

18、另一方面,本申请实施例提供了一种电子设备,包括处理器和存储器,该处理器和存储器相互连接;

19、上述存储器用于存储计算机程序;

20、上述处理器用于在调用上述计算机程序时,执行本申请实施例提供的样本构建方法。

21、另一方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行以实现本申请实施例提供的样本构建方法。

22、另一方面,本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机程序,上述计算机程序被处理器执行时实现本申请实施例提供的样本构建方法。

23、在本申请实施例中,通过将预设特征集合内的进程行为特征以第一数量进行组合得到多个初始特征组合,可使得符合预设风险条件的第一特征组合可以覆盖多种进程行为特征的组合方式,有利于发现未知且符合预设风险条件的第一特征组合。进一步地,每个第一特征组合的目标特征广度用于表征与该第一特征组合关联的不同对象主体的数量,从而可确定出现每个第一特征组合内所有进程行为特征的主体对象的范围,并以此为基础从第一特征组合中筛选出的风险样本更符合风险特征,进而可提升风险预测模型的训练效果。



技术特征:

1.一种样本构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定多个初始特征组合,包括:

3.根据权利要求1所述的方法,其特征在于,所述从各所述初始特征组合中确定出符合预设风险条件的第一特征组合,包括以下至少一项:

4.根据权利要求1所述的方法,其特征在于,对于每个所述第一特征组合,确定该第一特征组合对应的目标特征广度,包括:

5.根据权利要求4所述的方法,其特征在于,确定每个对象主体对应的第二特征组合,包括:

6.根据权利要求5所述的方法,其特征在于,对于每个所述行为特征日志,所述根据该行为特征日志对应的第三数量,生成第二特征组合,包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.根据权利要求7所述的方法,其特征在于,所述方法还包括:

9.一种样本构建装置,其特征在于,所述装置包括:

10.一种电子设备,其特征在于,包括处理器和存储器,所述处理器和存储器相互连接;

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1至8任一项所述的方法。

12.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一项所述的方法。


技术总结
本申请实施例公开了一种样本构建方法、装置、设备以及存储介质,可适用于计算机技术领域。该方法包括:确定多个初始特征组合,每个初始特征组合包括预设特征集合中第一数量的进程行为特征,任意两个初始特征组合不相同;从各初始特征组合中确定出符合预设风险条件的第一特征组合;根据每个第一特征组合的目标特征广度从各第一特征组合中确定出风险样本;每个目标特征广度用于表征与对应第一特征组合关联的对象主体的数量;风险样本用于训练风险预测模型,风险预测模型用于预测特征组合的风险情况。采用本申请实施例,可全面构建用于风险预测模型训练的风险样本,适用性高。

技术研发人员:赵云皓
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1