本技术涉及通信技术,尤其涉及一种云环境下智能网卡硬件卸载的单点故障避免方法。
背景技术:
1、随着互联网技术的发展,网络处理开销增加,普通网卡在网络协议处理、数据搬移及使用灵活性方面存在的缺陷增多,可编程智能网卡支持网络协议处理卸载、网络功能虚拟化、特定应用加速,成为了一个具有应用前景的发展方向。
2、在现有技术中,智能网卡实现网络高性能,通过硬件卸载技术将网络功能、安全功能和存储功能从主服务器卸载,基于智能网卡的计算能力进行数据处理和数据传输,实现释放主服务器的处理能力,提高网络处理的效率。
3、在应用智能网卡的环境中,由于硬件卸载功能无法跨越物理网卡,应用只能运行在一个智能网卡设备中,因此在将智能网卡应用于云服务时,由于硬件卸载的设备限制,存在单点问题,导致智能网卡中应用的可用性降低的技术问题。
技术实现思路
1、本技术提供一种云环境下智能网卡硬件卸载的单点故障避免方法,用以解决单点问题导致的智能网卡中应用可用性降低的技术问题。
2、第一方面,本技术提供一种云环境下智能网卡硬件卸载的单点故障避免方法,应用于目标服务器,目标服务器包括多个智能网卡,该方法包括:
3、基于预设时间间隔获取智能网卡的运行状态,基于运行状态判断智能网卡是否发生故障;
4、若是,则将智能网卡确定为故障网卡,并基于故障网卡的故障信息进行告警;
5、在接收到响应于告警生成的故障处理指令时,将故障网卡上运行的目标应用迁移至未发生故障的智能网卡。
6、可选地,将故障网卡上运行的目标应用迁移至未发生故障的智能网卡,包括:
7、关闭故障网卡的目标应用,将故障网卡上目标应用相应的目标功能和设备迁移至未发生故障的智能网卡;
8、基于目标功能和设备,启动未发生故障的智能网卡上的目标应用,以完成目标应用的迁移。
9、可选地,将故障网卡上目标应用相应的目标功能和设备迁移至未发生故障的智能网卡,包括:
10、将故障网卡相应的物理功能和设备迁移至未发生故障的智能网卡;
11、将故障网卡相应的虚拟功能迁移至未发生故障的智能网卡。
12、可选地,将故障网卡相应的物理功能和设备迁移至未发生故障的智能网卡,包括:
13、基于目标应用确定物理功能的配置信息;
14、基于配置信息移除故障网卡相应的物理功能和设备,并在未发生故障的智能网卡上新增物理功能和设备,以使物理功能和设备迁移至未发生故障的智能网卡。
15、可选地,将故障网卡相应的虚拟功能迁移至未发生故障的智能网卡,包括:
16、基于目标应用确定故障网卡的虚拟功能;
17、解除目标应用与故障网卡的虚拟功能的第一关联关系,并建立目标应用与未发生故障的智能网卡的虚拟功能的第二关联关系,以使虚拟功能迁移至未发生故障的智能网卡。
18、可选地,基于预设时间间隔获取智能网卡的运行状态,包括:
19、基于预设时间间隔获取智能网卡的链路探测信息、网卡状态信息,和/或业务数据信息;
20、基于链路探测信息、网卡状态信息,和/或业务数据信息,确定智能网卡的运行状态。
21、可选地,基于运行状态判断智能网卡是否发生故障,包括:
22、基于链路探测信息、网卡状态信息,和/或业务数据信息的加权和值,确定智能网卡的故障判断值;
23、在故障判断值大于预设阈值时,确定智能网卡发生故障。
24、第二方面,本技术提供一种云环境下智能网卡硬件卸载的单点故障避免设备,应用于目标服务器,目标服务器包括多个智能网卡,包括:
25、第一处理模块,用于基于预设时间间隔获取智能网卡的运行状态,基于运行状态判断智能网卡是否发生故障;
26、第二处理模块,用于若是,则将智能网卡确定为故障网卡,并基于故障网卡的故障信息进行告警;
27、迁移模块,用于在接收到响应于告警生成的故障处理指令时,将故障网卡上运行的目标应用迁移至未发生故障的智能网卡。
28、可选地,迁移模块还用于:
29、关闭故障网卡的目标应用,将故障网卡上目标应用相应的目标功能和设备迁移至未发生故障的智能网卡;
30、基于目标功能和设备,启动未发生故障的智能网卡上的目标应用,以完成目标应用的迁移。
31、可选地,迁移模块还用于:
32、将故障网卡相应的物理功能和设备迁移至未发生故障的智能网卡;
33、将故障网卡相应的虚拟功能迁移至未发生故障的智能网卡。
34、可选地,迁移模块还用于:
35、基于目标应用确定物理功能的配置信息;
36、基于配置信息移除故障网卡相应的物理功能和设备,并在未发生故障的智能网卡上新增物理功能和设备,以使物理功能和设备迁移至未发生故障的智能网卡。
37、可选地,迁移模块还用于:
38、基于目标应用确定故障网卡的虚拟功能;
39、解除目标应用与故障网卡的虚拟功能的第一关联关系,并建立目标应用与未发生故障的智能网卡的虚拟功能的第二关联关系,以使虚拟功能迁移至未发生故障的智能网卡。
40、可选地,第一处理模块还用于:
41、基于预设时间间隔获取智能网卡的链路探测信息、网卡状态信息,和/或业务数据信息;
42、基于链路探测信息、网卡状态信息,和/或业务数据信息,确定智能网卡的运行状态。
43、可选地,第一处理模块还用于:
44、基于链路探测信息、网卡状态信息,和/或业务数据信息的加权和值,确定智能网卡的故障判断值;
45、在故障判断值大于预设阈值时,确定智能网卡发生故障。
46、第三方面,提供了一种云环境下智能网卡硬件卸载的单点故障避免设备,包括:
47、处理器和存储器;
48、存储器存储计算机执行指令;
49、处理器执行存储器存储的计算机执行指令,使得云环境下智能网卡硬件卸载的单点故障避免设备执行第一方面中任一项的云环境下智能网卡硬件卸载的单点故障避免方法。
50、第四方面,本技术提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面中任一项的云环境下智能网卡硬件卸载的单点故障避免方法。
51、本技术提供的云环境下智能网卡硬件卸载的单点故障避免方法,应用于目标服务器,目标服务器包括多个智能网卡,该方法包括:基于预设时间间隔获取智能网卡的运行状态,基于运行状态判断智能网卡是否发生故障;若是,则将智能网卡确定为故障网卡,并基于故障网卡的故障信息进行告警;在接收到响应于告警生成的故障处理指令时,将故障网卡上运行的目标应用迁移至未发生故障的智能网卡;从而基于智能网卡的运行状态判断是否出现故障,并基于故障信息确定故障处理指令并进行故障迁移;在智能网卡被确定为故障网卡时,将故障网卡的故障信息进行告警处理,实现通过故障信息确定对故障网卡的故障迁移指令;基于故障迁移指令将故障网卡中的目标应用进行迁移,实现维持故障网卡中目标应用的正常运行,避免了单点问题并提高智能网卡中应用可用性,维持目标服务器的稳定性,实现了降低单点故障发生率的技术效果。