本技术涉及数据处理,尤其涉及一种基于特征引擎的资产定级方法、装置、电子设备及介质。
背景技术:
1、随着我国数据合规相关立法的相继落地,各行各业应当及时关注、了解立法动向,强化数据合规的内控管理,并辅之以技术手段协助企业实现数据合规,使数据合规隐患防于未然。其中,企业资产涉及服务器、交换机、路由器、门户网站、内部网站、无线路由器等方面。在中大型企业资产管理过程中,企业资产数量庞大,并且种类繁多,这就需要企业选取大量的负责人去负责不同的资产管理。并且企业信息安全体系建设是个全面保护的过程,遵循"木桶原理",一个系统的安全强度等于它最薄弱环节的安全强度。不同的资产被攻陷后对企业造成的影响程度是不同的,在资产规模较大时,基于人工进行定级的方式难以得到落实,具体实施难度大,并且责任人安全技术水平参差不齐,导致现存资产定义无法提供有力的依据支撑自身的定级结论,结果相对主观。
技术实现思路
1、本技术实施例的主要目的在于提出一种基于特征引擎的资产定级方法、装置、电子设备及介质,能够标准、客观地进行资产定级,合理分配安全资源。
2、为实现上述目的,本技术实施例的第一方面提出了一种基于特征引擎的资产定级方法,所述方法包括:
3、接收终端设备发送的样本流量数据以及实时流量数据,其中,所述样本流量数据包括行为特征信息,所述行为特征信息用于表征所述样本流量数据中网络行为的原子动作信息;
4、根据所述流量特征信息的行为特征信息创建网络行为特征表,并对所述网络行为特征表与预设的资产分类定级表进行映射,得到目标映射表,其中,所述资产分类定级表存储有用于表征资产重要程度的重要性分数;
5、将所述样本流量数据以及所述目标映射表输入特征引擎进行训练,得到训练好的特征引擎;
6、将所述实时流量数据输入训练好的特征引擎,输出与所述实时流量数据对应的资产分类信息;
7、根据所述目标映射表确定与所述资产分类信息对应的重要性分数;
8、根据所述重要性分数、所述资产分类信息以及预设的决策树对所述实时流量数据进行资产预测,得到目标资产分值,其中,所述目标资产分值用于表征所述资产分类信息中资产的重要程度。
9、在一些实施例中,所述将所述样本流量数据以及所述目标映射表输入特征引擎进行训练,得到训练好的特征引擎,包括:
10、将所述样本流量数据以及所述目标映射表输入所述特征引擎,以使所述特征引擎对所述样本流量数据的行为特征信息进行特征标注,得到多个样本标记信息;
11、根据所述样本标记信息对所述样本流量数据与所述目标映射表进行匹配,得到与所述样本流量数据对应的多个样本资产分类;
12、根据所述样本资产分类对所述样本流量数据进行分类,得到样本集合;
13、根据所述样本集合对所述特征引擎进行训练,得到训练好的特征引擎。
14、在一些实施例中,所述将所述实时流量数据输入训练好的特征引擎,输出与所述实时流量数据对应的资产分类信息,包括:
15、基于预设的解析模板对所述实时流量数据进行范式化处理,得到所述实时流量数据的特征参数;
16、将所述实时流量数据输入训练好的特征引擎,使得所述特征引擎对所述特征参数进行数据标识,得到标识信息;
17、对所述实时流量数据进行去噪操作,得到实时数据;
18、根据所述标识信息对所述实时数据与所述样本集合中的样本流量数据进行距离计算,得到距离集合;
19、对所述距离集合中的样本资产分类进行统计,输出与所述实时流量对应的资产分类信息。
20、在一些实施例中,所述对所述实时流量数据进行去噪操作,得到实时数据,包括:
21、基于预设的均值聚类算法对所述实时流量数据进行检测,得到所述实时流量数据的多个观测值;
22、对多个所述观测值进行分箱操作,得到多个一维矩阵;
23、根据所述一维矩阵对所述实时流量数据进行距离监测,得到噪音数据;
24、对所述实时流量数据中的所述噪音数据进行清洗操作,得到实时数据。
25、在一些实施例中,所述根据所述标识信息对所述实时数据与所述样本集合中的样本流量数据进行距离计算,得到距离集合,包括:
26、根据所述标识信息对所述实时数据进行特征提取,得到特征向量空间;
27、根据所述样本标记信息对所述样本集合中的样本流量数据进行特征提取,得到样本向量空间;
28、基于预设的余弦公式对所述特征向量空间以及所述样本向量空间进行距离计算,得到多个余弦距离值;
29、基于预设的目标相似度值对所述余弦距离值进行排序,得到所述距离集合。
30、在一些实施例中,所述根据所述重要性分数、所述资产分类信息以及预设的决策树对所述实时流量数据进行资产预测,得到目标资产分值,包括:
31、根据所述样本集合对所述决策树进行训练,得到目标森林;
32、将所述资产分类信息输入所述目标森林进行类别判断,输出多个分类结果;
33、对所述分类结果进行数量统计,得到目标分类信息;
34、根据所述目标分类信息对所述重要性分数进行选择,确定目标资产分值。
35、在一些实施例中,所述根据所述资产分类定级表以及所述样本集合对所述决策树进行训练,得到所述目标森林,包括:
36、基于预设的决策树对所述样本集合中的样本流量数据进行信息抽取,得到资产分类子集;
37、对所述资产分类子集进行信息增益操作,得到分裂节点;
38、根据所述分裂节点对所述决策树进行分裂直至满足预设的结束条件,得到分裂结果;
39、根据所述分裂结果对所述决策树进行训练,得到所述目标森林。
40、本技术实施例的第二方面提出了一种基于特征引擎的资产定级装置,所述装置包括:
41、所述装置包括:
42、流量接收模块,用于接收终端设备发送的样本流量数据以及实时流量数据,其中,所述样本流量数据包括行为特征信息,所述行为特征信息用于表征所述样本流量数据中网络行为的原子动作信息;
43、信息映射模块,用于根据所述流量特征信息的行为特征信息创建网络行为特征表,并对所述网络行为特征表与预设的资产分类定级表进行映射,得到目标映射表,其中,所述资产分类定级表存储有用于表征资产重要程度的重要性分数;
44、类别训练模块,用于将所述样本流量数据以及所述目标映射表输入特征引擎进行训练,得到训练好的特征引擎;
45、资产分类模块,用于将所述实时流量数据输入训练好的特征引擎,输出与所述实时流量数据对应的资产分类信息;
46、分数确定模块,用于根据所述目标映射表确定与所述资产分类信息对应的重要性分数;
47、资产确定模块,用于根据所述重要性分数、所述资产分类信息以及预设的决策树对所述实时流量数据进行资产预测,得到目标资产分值,其中,所述目标资产分值用于表征所述资产分类信息中资产的重要程度。
48、本技术实施例的第三方面提出了一种电子设备,所述电子设备包括存储器和处理器,其中,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时所述处理器用于执行如本技术第一方面实施例任一项所述的基于特征引擎的资产定级方法。
49、本技术实施例的第四方面提出了一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,在所述计算机程序被计算机执行时,所述计算机用于执行如本技术第一方面实施例任一项所述的基于特征引擎的资产定级方法。
50、本技术实施例提出的基于特征引擎的资产定级方法、装置、电子设备及介质,首先,接收终端设备发送的样本流量数据以及实时流量数据,并根据终端设备的流量特征信息创建网络行为特征表,对网络行为特征表与预设的资产分类定级表进行映射,得到目标映射表,便于后续得到与资产对应的重要性分数,从而合理的进行资产分级,之后将样本流量数据以及目标映射表输入特征引擎进行训练,得到训练好的特征引擎,提高特征引擎对数据的处理能力,再将实时流量数据输入训练好的特征引擎,输出与实时流量数据对应的资产分类信息,从而提高对实时流量数据的资产的分类准确性,并根据目标映射表确定与资产分类信息对应的重要性分数,便于后续判断资产分类信息中资产的重要程度,最后,根据重要性分数、资产分类信息以及预设的决策树对实时流量数据进行资产预测,得到目标资产分值,从而能够标准、客观地进行基于特征引擎的资产定级,合理分配安全资源。