本发明涉及数据中心网络以及资源调度领域,具体涉及一种云数据中心智能化监测应用任务部署方法、装置和系统。
背景技术:
1、数据中心网络的智能化监测有助于运营商了解网络质量,对于其诊断、解决当前网络中存在的问题起到至关重要的作用。然而,诸如snmp的传统网络监控技术,存在数据采集周期长、采集资源的开销高等问题,无法保证数据中心网络的实时化、智能化监测。面对此情况,带内网络遥测技术被多家单位联合提出并被应用至网络测量。该技术支持细粒度网络管理和较低的资源开销,这极大的促进了云数据中心智能化监测应用的快速发展,引起了学术界、工业界的广泛关注。
2、究其原因,这是由于带内网络遥测技术能够保证亚秒监测周期、纳秒单位粒度,并且不需要控制平面干预,仅仅需要在数据平面收集并且处理信息。具体地,利用该技术监测网路资源时,由节点生成特定的遥测数据包,该数据包按照预先规划的路线从源节点开始转发,直至目的节点结束,中间的网络设备负责处理并转发该数据包。在网络设备处理过程中,根据数据包中提供的指令,将所需的遥测数据嵌入数据包的指定位置,携带遥测数据的数据包会随着数据的转发进入下一跳网络设备并被下一条处理,直至最后一跳网络设备。
3、然而,为保证智能化监测应用的性能,需要为带内网络遥测设计合理的路径转发策略,这存在诸多挑战。首先,为了监测网络资源状态,往往需要生成特定的数据包。应尽可能保证该类数据包所走过路径不重叠,因为这种重叠通常会导致较高的冗余,浪费带宽资源。其次,大规模网络的监测往往生成的路径较为长,较长的路径意味着监测时延高。为了缓解这一情况,需要多条路径,每条路径对应一个探测包,以覆盖网络的不同部分。这里存在一个路径长度和路径数量的权衡,更短的路径意味着需要更多的路径,相反,更长的路径意味着监测的时延高。第三,为了满足信息收集的及时性,不同路径的长度应该尽可能平衡。这是由于监测任务的完成通常取决于从最长路径返回的最后一个包。因此,为监测任务规划出一组监测路径,并且保证该路径非重叠、完全覆盖的全部的网络设备往往具有一定的挑战。
技术实现思路
1、本发明的目的是提出一种面向云数据中心智能化监测应用任务部署方法、装置和系统,至少部分地解决现有技术中的问题。
2、为了达到上述发明目的,本发明采用以下技术方案:
3、第一方面,一种云数据中心智能化监测应用任务部署方法,包括以下步骤:
4、利用带内网络遥测技术获取当前网络状态信息,包括网络拓扑、相邻网络设备之间的链路时延;
5、根据获得的网络状态信息,生成与网络拓扑相对应的带权图g(v,e,w),其中点集合v中元素为网络设备,边集合e中元素为网络设备之间的链路,权重集合w中元素为链路时延,为带权图g构建带权回路;
6、将带权回路拆分为多段路径,每一段路径对应一个探测包,构建以最小化最大路径的时延为目标的优化问题并求解,将求解结果作为当前智能化监测应用的部署决策,决策信息为路径数量以及每条路径上具体的网络设备,其中所述优化问题如下:
7、优化目标: (1)
8、约束条件:
9、1.1)对于链路分组的限制:所待监测的链路被划分为k个组,并且每个组的所有路径非重叠:;
10、1.2)对于网络设备监测次数的限制:每一条链路仅被监测一次:;
11、1.3)对于路径数量的限制:路径数量存在上限:;
12、1.4)对于决策的定义域限制:;
13、式中,表示在回路的链路的时延情况;表示监测任务为带宽带来的开销;表示接收节点处理的总带宽;为决策变量,表示回路中的链路i是否被放入路径j中;为决策变量,表示监测任务生成的路径的总数量;表示回路c上包含的链路的数量;为决策变量,表示回路中与链路相邻的下一条链路是否被放入路径j中;表示路径的集合,的大小等于k;表示回路的集合;表示正整数集合。
14、进一步地,对优化问题的求解包括:
15、基于接收节点的总带宽存在固定上限以及的大小依赖于具体的监测任务,消除问题中的路径数量变量,将优化问题(1)转换为优化问题(2):
16、优化目标: (2)
17、约束条件:
18、1.1)对于链路分组的限制:所待监测的链路被划分为k个组,并且每个组的所有路径非重叠:;
19、1.2)对于网络设备监测次数的限制:每一条链路仅被监测一次:;
20、1.3)对于决策的定义域限制:;
21、求解优化问题(2),得到符合要求的路径信息。
22、进一步地,对优化问题(2)的求解包括:
23、初始化路径集合,对于奇数次生成的集合:从具有最大时延的链路开始遍历,并依次将遍历到的链路放置集合,当集合中全部链路的总时延大于平均时延avg时不再向集合放置链路,初始化新的集合;对于偶数次生成的集合:从上次结束的链路继续开始遍历,并依次将遍历到的链路放置集合,当集合中全部链路的总时延小于平均时延avg时不再向集合放置链路,初始化新的集合;直到全部的链路遍历结束,输出最终生成的k和路径集合。
24、进一步地,所述平均时延avg=sum/k,sum为回路上的全部链路的总时延。
25、进一步地,参数k的确定方法如下:利用待监测的网络链路构建回路,测试接收节点的处理上限确定参数的取值,测试每次监测任务下发带来的开销确定参数,并根据约束1.3计算参数k,也即路径的数量。
26、第二方面,一种云数据中心智能化监测应用任务部署装置,包括:
27、网络设备配置模块,被配置为对网络设备进行协议配置,使得网络设备支持带内网络遥测协议v1和带内网络遥测协议v2,同时支持源路由协议;
28、网络信息获取模块,被配置为利用带内网络遥测技术获取当前网络状态信息,包括网络拓扑、相邻网络设备之间的链路时延;
29、带权回路构建模块,被配置为根据获得的网络状态信息,生成与网络拓扑相对应的带权图g(v,e,w),其中点集合v中元素为网络设备,边集合e中元素为网络设备之间的链路,权重集合w中元素为链路时延,为带权图g构建带权回路;
30、部署决策计算模块,被配置为将带权回路拆分为多段路径,每一段路径对应一个探测包,构建以最小化最大路径的时延为目标的优化问题并求解,将求解结果作为当前智能化监测应用的部署决策,决策信息为路径数量以及每条路径上具体的网络设备,其中所述优化问题如下:
31、优化目标: (1)
32、约束条件:
33、1.1)对于链路分组的限制:所待监测的链路被划分为k个组,并且每个组的所有路径非重叠:;
34、1.2)对于网络设备监测次数的限制:每一条链路仅被监测一次:;
35、1.3)对于路径数量的限制:路径数量存在上限:;
36、1.4)对于决策的定义域限制:;
37、式中,表示在回路的链路的时延情况;表示监测任务为带宽带来的开销;表示接收节点处理的总带宽;为决策变量,表示回路中的链路i是否被放入路径j中;为决策变量,表示监测任务生成的路径的总数量;表示回路c上包含的链路的数量;为决策变量,表示回路中与链路相邻的下一条链路是否被放入路径j中;表示路径的集合,的大小等于k;表示回路的集合;表示正整数集合;以及
38、部署决策下发模块,被配置为根据求解的结果来为每一组待下发监测任务选择最优的监测路径。
39、进一步地,所述装置还包括:
40、智能监测展示模块,被配置为利用时序数据库influxdb实时存储收集到的监测信息,利用图像展示工具grafana展示数据库中的数据。
41、第三方面,一种云数据中心智能化监测应用任务部署系统,包括:若干网络节点、发送节点、接收节点、数据存储节点、资源智能化展示节点、路径规划节点、网络设备配置装置,所述各个节点之间经由链路互连,所述规划节点针对当前的网络拓扑,为监控任务产生的探测包进行路径规划,所述路径规划节点采用如第一方面所述的智能化监测应用任务部署方法实现对监测应用任务部署,或者在各个路径规划节点部署如第二方面所述的智能化监测应用任务部署装置,所述发送节点发送探测包,该探测包按照预先规划的路径经过全部的网络设备,所述接收节点收集探测包并交由存储节点储存,资源智能化展示节点从存储节点中读取数据并展示给运维人员。
42、相比于现有技术,本发明具有以下有益效果:本发明提出了面向云数据中心智能化监测应用任务部署策略,利用带内网络遥测技术获取当前的网络信息,包含网络拓扑以及交换机的拥塞情况,根据当前获得的信息确定路径规划模型,构建以最小化最大路径的时延为目标的优化问题并求解,将求解结果作为当前监测应用的部署决策,决策信息为路径数量以及每条路径覆盖的设备。与现有技术中的部署方案相比,本发明的部署策略充分的考虑了链路的拥塞情况,可以在线的、自适应做出最佳决策,提高了智能化监测应用的效率,提高了用户的服务质量。