本发明涉及信息监督,尤其涉及一种基于大数据运维的智慧信息处理系统。
背景技术:
1、基于大数据运维的智慧信息处理系统是现代企业和组织中越来越重要的一部分。它利用大数据技术、人工智能和云计算等先进技术,优化信息处理和运维管理。
2、现有专利公开了基于信息安全的大数据检测系统及方法(公布号cn114840851a),包括:数据采集模块、人为操作状态获取模块、设备信息自检模块、设备风险特征提取模块及设备信息安全分析模块,所述数据采集模块用于获取第一单位时间内用户设备被病毒攻击的状态数据;所述人为操作状态获取模块获取第一单位时间内用户在设备上的所有操作记录。该专利所公开技术中,对于需要进行处理和安全判断的信息进行监测过程中,往往缺乏对待处理判断数据信息的各项指标进行精确综合判断的能力。
技术实现思路
1、本发明主要解决的技术问题是提供一种基于大数据运维的智慧信息处理系统,解决了上述背景技术中的问题。
2、为解决上述技术问题,根据本发明的一个方面,更具体的说是一种基于大数据运维的智慧信息处理系统,包括数据采集模块、特征提取模块、数据分析模块、决策分析模块、数据存储模块以及访问控制模块;
3、所述数据采集模块,通过api以及网络爬虫,来从互联网大数据采集与待处理信息归为同类的异常数据,并将采集异常数据反馈至特征提取模块;
4、所述特征提取模块,用于将从互联网中采集的异常数据中,以及待处理的信息数据中,选择相关性最大的特征进行提取,并将提取的特征数据反馈至数据分析模块;
5、所述数据分析模块,应用机器学习算法来计算关键统计指标以总结数据特征,再使用回归分析来进行未来趋势预测,挖掘数据特征中的潜在趋势,并将预测的数据趋势以及总结的数据特征反馈至决策分析模块;
6、所述决策分析模块,基于数据分析的结果来向访问控制模块发送是否进行权限限制的指令;
7、所述访问控制模块,根据决策分析模块的反馈来限制数据采集模块,以及其他第三方对该待处理信息数据的访问调用权限。
8、更进一步的,所述数据存储模块,用于对历史的数据提取特征信息,以及根据对应特征信息做出的决策信息进行存储,并将存储的历史数据反馈至数据分析模块用于进行趋势预测。
9、更进一步的,所述决策分析模块根据数据分析模块提供的统计指标、异常数据与待处理的信息数据的相关性指标,以及具有相关性数据特征的频率指标,来确定待处理数据是否归为异常数据,有:
10、
11、式中,w表示待处理数据归为异常数据的概率系数,h表示异常数据与待处理的信息数据的相关性概率系数,c表示具有相关性数据特征的频率指标系数,m表示异常数据与待处理的信息数据统计相关性的概率系数,并且有:
12、
13、式中,m表示异常数据与待处理的信息数据统计相关性的概率系数,a表示异常数据的均值与待处理信息数据均值之间差的绝对值,s表示异常数据与待处理数据之间的标准差。
14、更进一步的,决策分析模块根据异常数据与待处理的信息数据之间的线性关系的强度,以及异常数据与待处理的信息数据之间连续变量的关系,来确定异常数据与待处理的信息数据的相关性指标,有:
15、
16、式中,h表示异常数据与待处理的信息数据的相关性概率系数,u表示异常数据与待处理的信息数据之间的皮尔逊相关系数,k表示异常数据与待处理的信息数据之间最大连续变量差的绝对值。
17、更进一步的,决策分析模块根据具有相关性数据特征在数据集中出现的次数,以及具有相关性数据特征占总数据的比例,来确定具有相关性数据特征的频率指标,有:
18、
19、式中,c表示具有相关性数据特征的频率指标系数,n表示具有相关性数据特征在数据集中出现的次数,d表示具有相关性数据特征占总数据的比例。
20、更进一步的,当w<85%时,则表示待处理的数据不属于异常数据;
21、当w≥85%时,则表示待处理的数据归为异常数据。
22、更进一步的,还包括有运维监控模块、数据可视单元。
23、更进一步的,所述运维监控模块,接收特征提取模块反馈的最大相关性特征,以及决策分析模块的决策指令,来监控和二次确定决策分析模块的决策指令是否异常;
24、所述数据可视单元,用于接收运维监控模块的异常判断信息,以及整合后的数据信息,并通过仪表盘和可视化工具,展示关键指标和数据分析结果。
25、有益效果:
26、1、本发明采用双循环判断逻辑设计,内循环用于判断待处理信息是否与大数据中标记为异常的数据实质相同,进而来限制本系统或其他第三方对该待处理信息的访问和调用;而外循环用于二次判断待处理数据是否归为异常数据,并结合管理员的判断来主动修改该处理信息的安全状态。
27、2、本发明根据数据分析模块提供的统计指标、异常数据与待处理的信息数据的相关性指标,以及具有相关性数据特征的频率指标,可以精准高效的确定待处理数据是否归为异常数据。
1.一种基于大数据运维的智慧信息处理系统,其特征在于,包括数据采集模块、特征提取模块、数据分析模块、决策分析模块、数据存储模块以及访问控制模块;
2.根据权利要求1所述的基于大数据运维的智慧信息处理系统,其特征在于:所述数据存储模块,用于对历史的数据提取特征信息,以及根据对应特征信息做出的决策信息进行存储,并将存储的历史数据反馈至数据分析模块用于进行趋势预测。
3.根据权利要求1所述的基于大数据运维的智慧信息处理系统,其特征在于:所述决策分析模块根据数据分析模块提供的统计指标、异常数据与待处理的信息数据的相关性指标,以及具有相关性数据特征的频率指标,来确定待处理数据是否归为异常数据,有:
4.根据权利要求3所述的基于大数据运维的智慧信息处理系统,其特征在于:决策分析模块根据异常数据与待处理的信息数据之间的线性关系的强度,以及异常数据与待处理的信息数据之间连续变量的关系,来确定异常数据与待处理的信息数据的相关性指标,有:
5.根据权利要求4所述的基于大数据运维的智慧信息处理系统,其特征在于:决策分析模块根据具有相关性数据特征在数据集中出现的次数,以及具有相关性数据特征占总数据的比例,来确定具有相关性数据特征的频率指标,有:
6.根据权利要求5所述的基于大数据运维的智慧信息处理系统,其特征在于:当w<85%时,则表示待处理的数据不属于异常数据;
7.根据权利要求1所述的基于大数据运维的智慧信息处理系统,其特征在于,还包括有数据可视单元;