本发明涉及数据中心访问,尤其是涉及一种状态监控方法及其装置。本发明还涉及一种数据中心以及一种多活数据中心。
背景技术:
1、数据中心是一个集中存储、管理和处理大量数据和信息的设施,承载着各种关键的业务和应用,包括云计算、大数据分析、网站托管、在线服务和电子商务等。数据中心提供了高性能的计算、存储和网络资源,为用户和企业提供了可靠的数据存储、处理和交换平台;数据中心还支持各种关键的it服务,例如虚拟化、容灾备份、安全防护、监控和管理等。
2、近年来,随着数字化时代的到来,大量的数据和信息需要被存储、处理和传输,而在存储、处理、传输和保护数据等方面能够发挥关键作用的数据中心则变得越来越重要。但是,数据中心在工作过程中也会遇到很多的问题,例如:(1)数据中心的安全措施出现问题或者未能及时发现和处理安全漏洞而导致系统被入侵、数据被窃取等问题,给数据中心造成很大的安全问题,破坏数据中心稳定性;(2)数据中心的存储设备发生故障或者未能及时备份数据,造成数据丢失或者损坏;(3)数据中心的计算和存储资源无法满足业务需求,导致系统响应时间变慢、应用程序卡顿等性能问题等。这些问题会影响数据中心的可靠性、安全性和性能,导致业务无法正常运行,影响用户满意度。所以,需要对数据中心进行监控,但是,现有技术中缺少有效的技术手段对数据中心进行各方面的监控进而避免以上问题。而多活数据中心作为由多个数据中心组成的系统,同样面临以上的问题。
3、因此,如何及时有效地对数据中心及多活数据中心进行状态监控,避免出现以上问题,从而保证数据中心及多活数据中心的正常运行,进而提高数据中心及多活数据中心的安全性、可靠性和性能,保证用户满意度,是数据中心访问技术领域亟待解决的问题之一。
技术实现思路
1、本发明旨在至少一定程度上解决上述技术中的技术问题之一。为此,本发明的第一个目的在于提出一种状态监控方法,从多个角度全面检测系统的运行状况,及时发现系统可能存在的故障或异常;对系统的安全性进行评估,帮助及时发现潜在的安全隐患,保障系统的安全运行;通过自动化的故障检测和安全评估,减少人工干预的需要,提升监控效率和准确性,降低管理成本。
2、本发明的第二个目的在于提出一种状态监控装置。
3、本发明的第三个目的在于提出一种数据中心。
4、本发明的第四个目的在于提出一种多活数据中心。
5、为达到上述目的,本发明实施例提出了一种状态监控方法,包括:
6、获取第一监控数据;
7、将第一监控数据输入到预先训练的故障检测模型中进行故障检测,得到故障检测结果;
8、获取第二监控数据;
9、对第二监控数据进行分析,得到安全等级结果;基于故障检测结果及安全等级结果生成状态监控结果。
10、优选的,所述获取第一监控数据,包括:
11、对数据中心的环境进行监控,得到环境监控数据;
12、对数据中心的ups进行监控,得到ups监控数据;
13、对数据中心的设备运行状况进行监控,得到设备监控数据;
14、将环境监控数据、ups监控数据及设备监控数据作为第一监控数据。
15、优选的,所述获取第二监控数据,包括:
16、对数据中心的网络流量进行监控,得到流量监控数据;
17、对数据中心的入侵事件进行监控,得到事件监控数据;
18、将流量监控数据及事件监控数据作为第二监控数据。
19、优选的,故障检测模型的训练方法,包括:
20、获取数据中心历史故障数据;所述数据中心历史故障数据包括历史故障对应的历史环境监控数据、历史ups监控数据及历史设备监控数据;
21、将数据中心历史故障数据进行标准化处理,得到标准化数据;
22、基于标准化数据对预设待训练模型进行迭代训练,在训练结果符合要求时,得到故障检测模型。
23、优选的,在将第一监控数据输入到预先训练的故障检测模型中进行故障检测之前,还包括:对第一监控数据中环境监控数据进行数据清洗;
24、对环境监控数据进行数据清洗,包括:
25、将环境监控数据作为待清洗数据;
26、基于预设抽取规则对所述待清洗数据进行抽取,得到若干个的待清洗子数据;
27、基于预设算法对若干个的待清洗子数据进行数据质量评估,得到每个待清洗子数据对应的数据质量评估值;
28、将若干个待清洗子数据对应的数据质量评估值取均值作为待清洗数据对应的目标数据质量评估值;
29、将所述目标数据质量评估值与预设数据质量评估阈值作比较;
30、若所述目标数据质量评估值大于等于数据质量评估阈值时,获取第一数据清洗规则对待清洗数据进行数据清洗;所述第一数据清洗规则为基于数据中心的配置规模及数据处理量自动配置;
31、若所述目标数据质量评估值小于数据质量评估阈值时,获取第二数据清洗规则对待清洗数据进行数据清洗;所述第二数据清洗规则为基于数据中心的配置规模、数据处理量及历史清洗记录中对异常数据的有效限定阈值自动配置;
32、基于第一数据规则和/或第二数据规则完成对所述待清洗数据的数据清洗。
33、优选的,基于预设算法对若干个的待清洗子数据进行数据质量评估,得到每个待清洗子数据对应的数据质量评估值,包括:
34、
35、其中,ti表示第i个待清洗子数据对应的数据质量评估值;γ()表示伽玛函数,ai表示第i个待清洗子数据的长度对应的关键信息系数;π表示圆周率;ln表示自然对数;bi表示第i个待清洗子数据的长度对应的关键信息参考标准系数;m1表示第i个待清洗子数据的复杂系数对应的权重值;表示第i个待清洗子数据的复杂系数;si表示第i个待清洗子数据的完整度;m2表示第i个待清洗子数据的完整度对应的权重值;n表示待清洗子数据的总数;pi表示第i个待清洗子数据对应的稀疏值;σ表示误差因子,取值范围为[0.005,0.01]。
36、优选的,所述对第二监控数据进行分析,得到安全等级结果,包括:
37、对第二监控数据中的流量监控数据进行分析,确定数据中心中每个网络节点对应的流量统计数据;根据预设属性类型对每个网络节点的流量监控数据进行分类,得到每个网络节点对应的若干个流量监控数据组;
38、基于每个网络节点对应的若干个流量监控数据组,确定同一网络节点中每个流量监控数据组对应的流量大小,得到第一流量统计量;基于预设属性类型对流量监控数据进行分类,得到每种预设属性类型对应的流量大小,得到第二流量统计量;
39、基于第一流量统计量及第二流量统计量,确定流量监控数据对应的流量分布特征;
40、对第二监控数据中的事件监控数据进行解析,得到数据中心中每个网络节点对应的解析结果;所述解析结果包括网络攻击行为数据、同一目标网络位置的访问次数及网络地址数据;
41、对所述解析结果进行深度分析,得到数据中心中每个网络节点对应的异常信息;
42、基于每个网络节点对应的异常信息,确定事件监控数据对应的异常分布特征;
43、基于流量监控数据对应的流量分布特征及事件监控数据对应的异常分布特征,查询流量分布-异常分布-安全等级表,确定安全等级结果。
44、为达到上述目的,本发明第二方面实施例提出了一种状态监控装置,包括:
45、第一获取模块,用于获取第一监控数据;
46、故障检测模块,用于将第一监控数据输入到预先训练的故障检测模型中进行故障检测,得到故障检测结果;
47、第二获取模块,用于获取第二监控数据;
48、安全检测模块,用于对第二监控数据进行分析,得到安全等级结果;生成模块,用于基于故障检测结果及安全等级结果生成状态监控结果。
49、为达到上述目的,本发明第三方面实施例提出了一种数据中心,包括若干个以上实施例所述的状态监控装置。
50、为达到上述目的,本发明第四方面实施例提出了一种多活数据中心,包括多个以上实施例所述的数据中心。
51、本发明的有益效果是:本发明具体公开了一种状态监控方法,通过整合环境监控数据、ups监控数据、设备监控数据、流量监控数据和事件监控数据,综合监控系统的运行状态,从多个角度全面检测系统的运行状况;通过预先训练的故障检测模型对第一监控数据进行故障检测,能够及时发现系统可能存在的故障或异常,提前预警,减少故障导致的损失;通过对第二监控数据进行分析,得出安全等级结果,对系统的安全性进行评估,帮助及时发现潜在的安全隐患,保障系统的安全运行。结合了多种监控及数据来源,从不同角度对系统状态进行评估,更全面地了解系统的运行情况,帮助及时调整和优化系统运行策略;基于故障检测结果和安全等级结果,生成状态监控结果,可以快速反馈系统运行状态,支持运维人员和管理者及时做出决策和调整;通过自动化的故障检测和安全评估,减少人工干预的需要,提升监控效率和准确性,降低管理成本;本发明还提供了一种状态监控装置,以及包括上述状态监控装置的数据中心,以及一种由多个上述数据中心组成的多活数据中心,也具有上述优点,在此不再赘述。
52、本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
53、下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。