本发明涉及故障巡检,尤其涉及一种网络巡检故障溯源方法及装置。
背景技术:
1、随着计算机技术的飞速发展,信息网络已经成为社会发展的重要保证。在云网融合时代大背景下,灵活敏捷的网络服务能力直接影响运营商的竞争力。分段路由(segmentrouting,sr)是源路由技术的一种,srv6是sr技术在ipv6网络的应用,srv6的出现是一个巨大的创新,它结合软件定义网络(software defined network,sdn)技术使能可编程的网络,这为云网时代的网络基础服务和增值网络服务提供了创新的土壤。在如此大的srv6网络规模下,当srv6网络中ipv6节点获取流量后,通过大模型进行报文转发到更匹配节点是未来发展趋势。
2、现有技术中,报文转发根据人为设置或网络策略制定某协议优先转发,缺乏智能分析及调度过程;巡检过程中对数据中心巡检主要依靠脚本巡检自动化执行来完成,对可能隐匿的节点无法巡检且巡检过程中发现告警只能定位当前故障源不一定是真正的故障源头,只能依靠日志分析查找,时效性较差,影响故障排查。
3、在如此大的srv6网络规模下,通过人工分析或全面排查机房巡检发现异常数据的根因,使得故障溯源的时效性较差,也可能存在误报情况,导致故障溯源的效率低和准确性低。
技术实现思路
1、本发明提供一种网络巡检故障溯源方法及装置,用以解决故障溯源的效率低和准确性低的问题。
2、本发明提供一种网络巡检故障溯源方法,应用于部署在数据中心的运维服务平台,所述运维服务平台包括至少一个传感器、智算节点和调度节点,包括:
3、所述智算节点获取各所述传感器采集的所述数据中心每个区域的目标数据和与各所述传感器相关的日志数据;
4、所述智算节点对各所述目标数据进行分析,得到各所述目标数据对应的分析结果;所述分析结果表示所述目标数据为正常数据或者异常数据;
5、所述智算节点基于所述日志数据,对所述异常数据进行故障溯源,得到所述目标数据对应的巡检溯源结果。
6、根据本发明提供的一种网络巡检故障溯源方法,所述智算节点对各所述目标数据进行分析,得到各所述目标数据对应的分析结果,包括:
7、针对每个所述目标数据,所述智算节点对所述目标数据进行网络安全态势评估评分,得到所述目标数据对应的至少一个分值;
8、所述智算节点基于各所述分值,判断所述目标数据是否为异常数据;
9、所述智算节点基于判断结果,对所述目标数据进行标记处理,得到所述分析结果。
10、根据本发明提供的一种网络巡检故障溯源方法,所述智算节点对所述目标数据进行网络安全态势评估评分,得到所述目标数据对应的至少一个分值,包括:
11、所述智算节点基于目标指标,确定至少一个数据集合;所述目标指标包括以下至少一项:目标资产、危害性、事件数目、可清除性;
12、所述智算节点分别对各所述数据集合进行网络安全态势评估评分,得到所述目标数据对应的各所述分值。
13、根据本发明提供的一种网络巡检故障溯源方法,所述智算节点基于所述日志数据,对所述异常数据进行故障溯源,得到所述目标数据对应的巡检溯源结果,包括:
14、所述智算节点基于所述日志数据的流量五元组信息,获得所述智算节点到目的节点之间的途径节点、所述目标数据关联的至少一个设备和各所述设备关联的其他设备;所述流量五元组信息包括源地址、源端口、目的地址、目的端口和传输层协议;
15、所述智算节点基于各所述设备的地址、所述目标数据对应的传感器的地址和所述其他设备的地址,形成关联关系链;
16、所述智算节点将所述关联关系链、各所述设备的地址对应的业务权重、所述目标数据对应的传感器的地址对应的业务权重、所述其他设备的地址对应的业务权重和所述标记后的目标数据的数量占比传输至巡检大模型,得到所述大模型输出的所述目标数据对应的巡检溯源结果。
17、根据本发明提供的一种网络巡检故障溯源方法,所述方法还包括:
18、所述智算节点基于所述智算节点到所述目的节点之间的途径节点,形成传输路径;
19、所述智算节点从所述日志数据提取所述传输路径中所述途径节点的权重指标,并基于所述权重指标对所述传输路径进行权重标记。
20、根据本发明提供的一种网络巡检故障溯源方法,所述方法还包括:
21、所述智算节点将所述标记后的目标数据和所述巡检溯源结果转发至所述调度节点;
22、所述调度节点基于设置的优先级,将所述标记后的目标数据和所述巡检溯源结果转发至目的节点;所述优先级是基于所述标记后的目标数据对应的占比或者所述目标数据对应的业务权重设置的。
23、根据本发明提供的一种网络巡检故障溯源方法,所述智算节点将所述标记后的目标数据转发至所述调度节点,包括:
24、所述智算节点基于所述目标数据对应的目标分值,将所述标记后的目标数据采用所述智算节点到所述调度节点之间的最短传输路径转发至所述调度节点;所述目标分值是基于所述目标数据对应的各所述分值求和之后得到的。
25、本发明还提供一种网络巡检故障溯源装置,应用于部署在数据中心的运维服务平台,所述运维服务平台包括至少一个传感器、智算节点和调度节点,包括:
26、获取模块,用于获取各所述传感器采集的所述数据中心每个区域的目标数据和与各所述传感器相关的日志数据;
27、分析模块,用于对各所述目标数据进行分析,得到各所述目标数据对应的分析结果;所述分析结果表示所述目标数据为正常数据或者异常数据;
28、溯源模块,用于基于所述日志数据,对所述异常数据进行故障溯源,得到所述目标数据对应的巡检溯源结果。
29、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述网络巡检故障溯源方法。
30、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述网络巡检故障溯源方法。
31、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述网络巡检故障溯源方法。
32、本发明提供的网络巡检故障溯源方法及装置,应用于部署在数据中心的运维服务平台,所述运维服务平台包括至少一个传感器和智算节点,通过所述智算节点获取各所述传感器采集的所述数据中心每个区域的目标数据和与各所述传感器相关的日志数据;所述智算节点对各所述目标数据进行分析,得到各所述目标数据对应的分析结果;所述分析结果表示所述目标数据为正常数据或者异常数据;基于所述日志数据,对所述异常数据进行故障溯源,得到所述目标数据对应的巡检溯源结果。通过对多个传感器采集的目标数据的分析,确定目标数据是否为异常数据;同时,通过与传感器相关的日志数据的分析,确定目标数据为异常数据的原因,自动化地实现对异常数据的故障溯源,从而提升故障溯源的效率和准确性。