本公开总体上涉及计算机网络,更具体地,涉及计算机网络的监测和故障排除。
背景技术:
1、诸如办公室、医院、机场、体育场或零售店的商业场所或地点通常在整个场所安装复杂的无线网络系统(包括无线接入点(ap)的网络),以向一个或多个无线客户端设备(或简称为“客户端”)提供无线网络服务。ap是使用各种无线网络协议和技术使其他设备能够无线连接到有线网络的实体电子设备,各种无线网络协议和技术例如:符合一个或多个ieee 802.11标准的无线局域网协议(即“wi-fi”)、蓝牙/蓝牙低能量(ble)、网状网络协议(例如,zigbee)或其他无线网络技术。许多不同类型的无线客户端设备(例如,膝上型计算机、智能手机、平板电脑、可穿戴设备、电器和物联网(iot)设备)都包含了无线通信技术,并且可以被配置为当设备处于兼容无线接入点的范围内时连接到无线接入点,以便接入有线网络。在客户端设备运行基于云的应用程序(诸如,网络电话协议(voip)应用程序、流视频应用程序、游戏应用程序或视频会议应用程序)的情况下,在应用程序会话期间,客户端设备通过一个或多个ap和一个或多个有线网络设备(例如,交换机、路由器和/或网关设备)来交换数据,以到达基于云的应用程序服务器。
技术实现思路
1、总体上,根据本公开的一种或多种技术,本公开描述了一种或多种用于网络管理系统(nms)以识别导致和/或促成应用程序会话的问题的一个或多个网络特征并且调用一个或多个动作来补救或防止该问题的技术。在用于基于云的应用程序的应用程序会话期间(例如,voip或视频会议呼叫、流视频观看会话或游戏会话),运行该应用程序的客户端设备通过一个或多个接入点(ap)设备、有线网络边缘的一个或多个交换机以及核心网络的一个或多个网络节点来交换数据,以到达托管由第三方应用程序服务提供商提供的应用程序的基于云的应用程序服务器。应用程序服务提供商可以收集关于应用程序性能的数据(本文称为“应用程序性能数据”),诸如,延迟、带宽、音频质量、视频质量等。当用户遇到应用程序的性能问题时,用户可以标记特定应用程序会话的问题(例如,质量差或故障)。通常,应用程序服务提供商可以使用应用程序性能数据来确定应用程序是否是导致问题的原因。虽然应用程序性能数据可以提供关于应用程序会话质量的信息或者指示应用程序会话的故障,但是应用程序性能数据不足以确定用户遇到的应用程序性能问题的根本原因,诸如,由网络特征引起的问题。
2、根据所公开的技术,根据本公开的一种或多种技术,nms被配置为确定导致和/或促成已经发生的应用程序会话的问题的一个或多个网络特征(本文称为“反应性问题确定”)和/或预测应用程序会话的问题和影响应用程序会话的性能的一个或多个网络特征(本文称为“预测性问题确定”),并且调用一个或多个动作来补救或防止该问题。
3、为了反应性地确定导致应用程序会话的问题的原因,nms可以组合(例如,根据时间或其他关联)从应用程序服务提供商获得的应用程序会话的应用程序性能数据和从与应用程序会话相关联的一个或多个网络设备获得的网络数据。基于应用程序性能数据和/或网络数据,nms可以识别应用程序会话的至少一个故障状况。例如,nms可以将应用程序会话的应用程序性能数据(例如,延迟、带宽、分组丢失等)与上限阈值或下限阈值进行比较,如果满足上限阈值或下限阈值,则表示存在应用程序会话的问题。nms可以指示应用程序会话的至少一个故障状况与根据网络数据确定的网络特征的性能(例如,无线网络性能、有线网络性能、vpn会话等)的充分和/或必要的关系,来确定导致或促成至少一个故障状况的一个或多个网络特征。例如,nms可以将应用程序会话的延迟问题与和应用程序会话相关联的接入点的无线网络性能(例如,根据指示连接到接入点的客户端设备的信号强度的接收信号强度指示符(received signal strength indicator,rssi)值来确定)相关联,因为接入点的无线网络性能较差可能是导致延迟问题的原因或贡献因素。
4、nms可以将来自网络设备的网络数据与阈值(例如,高于或低于预定义rssi值的rssi)进行比较,如果满足该阈值,则可以指示存在网络设备的无线网络性能的问题,并且因此网络设备的无线网络性能被确定为导致或促成应用程序性能问题的网络特征。在一些示例中,阈值可以从机器学习模型中获得,而不是从临时规则中获得,作为对机器学习方法的可能的有效近似,以最大限度地减少确认偏差。机器学习模型或数据分析也可以确定所选择的阈值是否足以导致故障状况。响应于确定导致或促成至少一个故障状况的网络特征,nms可以调用动作来补救该问题,诸如,向管理员设备生成通知,该通知识别导致或促成应用程序会话的问题的网络特征或者针对该问题的补救动作,或者自动重新配置网络中的网络设备的一个或多个组件来纠正或减轻该问题。
5、为了预测应用程序会话的问题,nms可以预测应用程序会话的一个或多个应用程序性能度量,该应用程序性能度量可以指示应用程序会话和影响应用程序会话的性能的一个或多个网络特征的所预测的问题。例如,nms可以在第一时间段内从与应用程序会话相关联的一个或多个网络设备获得网络数据(例如,历史网络数据)。nms可以基于在第一时间段内获得的网络数据训练预测模型,以预测应用程序会话的应用程序性能度量,并识别影响应用程序性能度量的一个或多个网络特征。预测模型可以包括例如使用决策树和梯度提升方法的监督学习模型、神经网络、生成式预训练变换器(generative pretrainedtransformer,gpt)或其他类型的学习模型。然后,nms可以在随后的第二时间段内从与应用程序会话相关联的一个或多个网络设备获得网络数据(例如,当前网络数据),并将网络数据应用于预测模型,该预测模型输出应用程序会话的一个或多个所预测的应用程序性能度量(其可以指示应用程序性能问题)和影响应用程序性能度量的一个或多个网络特征。基于一个或多个所预测的应用程序性能度量和影响应用程序性能度量的一个或多个网络特征,nms可以调用动作,诸如,向管理员设备生成通知,该通知识别应用程序会话的所预测的问题的原因或贡献因素或者所预测的问题的预防动作,或者自动重新配置网络设备的一个或多个组件以防止所预测的问题。
6、所公开的技术可以提供一个或多个技术优势和实际应用程序。例如,通过将应用程序性能数据和与应用程序会话相关联的网络数据相结合,nms可以反应性地确定应用程序会话的问题的根本原因,例如,并非单独从应用程序性能数据确定的由应用程序会话的网络引起的问题。此外,通过利用预测模型来预测一个或多个应用程序性能度量和影响应用程序性能度量的一个或多个网络特征,计算系统可以预测未来的应用程序性能问题或故障,或者预测网络是否可以为应用程序提供足够的服务,并且可以主动调用动作来避免或减轻应用程序的用户遇到的问题或故障的影响,例如,生成指示应用程序或网络的性能的所预测的问题的通知和/或提供将网络配置为“应用程序就绪”的建议。
7、在一个示例中,所公开的技术描述了一种网络管理系统,包括:存储器;以及一个或多个处理器,该一个或多个处理器与存储器耦接并且被配置为:从应用程序服务器获得应用程序会话的应用程序性能数据;从与应用程序会话相关联的一个或多个网络设备获得网络数据;将应用程序性能数据与网络数据相结合;基于应用程序性能数据或网络数据,识别应用程序会话的至少一个故障状况;确定导致至少一个故障状况的一个或多个网络特征;以及基于导致至少一个故障状况的所确定的一个或多个网络特征,调用动作来补救应用程序会话的至少一个故障状况。
8、在另一示例中,所公开的技术描述了一种网络管理系统,包括:存储器;以及一个或多个处理器,该一个或多个处理器与存储器耦接并且被配置为:在第一时间段内从与应用程序会话相关联的一个或多个网络设备获得网络数据;基于网络数据训练预测模型,以预测应用程序会话的至少一个故障状况以及影响所预测的至少一个故障状况的一个或多个网络特征;将在随后的第二时间段内从一个或多个网络设备获得的网络数据应用于预测模型,以预测应用程序会话的至少一个故障状况以及影响所预测的至少一个故障状况的一个或多个网络特征;以及基于所预测的至少一个故障状况以及影响所预测的至少一个故障状况的一个或多个网络特征,调用动作来防止应用程序会话的所预测的至少一个故障状况。
9、在另一示例中,所公开的技术描述了一种方法,该方法包括通过计算系统在第一时间段内从与应用程序会话相关联的一个或多个网络设备获得网络数据。该方法还包括通过计算系统基于网络数据训练预测模型,以预测应用程序会话的至少一个故障状况以及影响所预测的至少一个故障状况的一个或多个网络特征。该方法还包括通过计算系统将在随后的第二时间段内从一个或多个网络设备获得的网络数据应用于预测模型,以预测应用程序会话的至少一个故障状况以及影响所预测的至少一个故障状况的一个或多个网络特征。此外,该方法还包括通过计算系统基于应用程序会话的所预测的至少一个故障状况以及影响所预测的至少一个故障状况的一个或多个网络特征,调用动作来防止应用程序会话的至少一个故障状况。
10、在附图和以下描述中阐述了本公开的技术的一个或多个示例的细节。从说明书和附图以及权利要求书中,这些技术的其他特性、目的和优点将变得显而易见。