本技术涉及机器人,特别涉及一种通信能力开放平台负荷预测方法、装置、电子设备以及可读存储介质。
背景技术:
1、通信能力开放平台负荷预测是指利用技术手段和算法分析对历史负荷数据构建模型进行学习,基于历史数据对未来一段时间内通信负荷数据情况进行预测;
2、现有的负荷预测主要计算手段集中在模型构建,通过若干不同的预测模型预测未来负荷数据,然而,由于负荷数据采集过程中存在人为因素或外在因素,导致负荷数据的准确性变差,且丢失数据及异常数据都会影响预测数据,导致预测未来负荷数据不准确。
技术实现思路
1、本技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本技术的一个目的在于提出一种通信能力开放平台负荷预测方法,在预测未来负荷数据中,由于负荷数据采集过程中存在人为因素或外在因素,导致负荷数据的准确性变差,且丢失数据及异常数据都会影响预测数据,导致预测未来负荷数据不准确。
2、为达到以上目的,本发明采用的技术方案为:
3、一种通信能力开放平台负荷预测方法,包括:
4、获取通信能力开放平台的历史通信负荷数据;
5、对通信能力开放平台的历史通信负荷数据进行预处理,获得基础负荷数据数据集;
6、基于通信能力开放平台的基础负荷数据数据集,计算历史通信负荷数据的基础负荷指标;
7、基于历史通信负荷数据的基础负荷指标,确定每一个基础负荷指标与每一个波动指标之间的关联系数;
8、基于每一个基础负荷指标与每一个波动指标之间的关联系数,构建负荷预测模型,预测未来负荷数据。
9、优选的,获取通信能力开放平台的历史通信负荷数据,具体包括:
10、根据预测需求,获取短时间/24h,中长时间/7days,长时间/1months下的通信负荷数据;
11、通信负荷数据包括:
12、api接口数量,所述api接口为若干不同的服务类型预留函数,允许第三方程序通过网络调用以提供不同的服务;列如:通信能力开放平台一个用于服务电子商务的api接口,可能包括:商品管理、订单管理、支付管理、物流管理等接口;
13、通信流量,所述通信流量包括不限于,api请求调用、http请求、get请求、post请求、数据库查询请求、服务下载请求;所述通信流量为服务器请求数据,涉及到网络通信、数据传输、业务逻辑处理等方面,对于不同的请求类型,服务器会根据相应的处理逻辑进行数据处理和响应;
14、并发连接数:所述并发连接数指的是客户端向服务器发起请求,并建立了tcp连接,每秒钟服务器链接的总tcp数量;tcp包括:qps,每秒查询、tps,每秒事务、rt,响应时间。
15、优选的,对通信能力开放平台的历史通信负荷数据进行预处理,获得基础负荷数据数据集,具体包括:
16、基于通信能力开放平台的历史通信负荷数据,对历史通信数据缺失负荷数据进行修补,获得初步处理负荷数据
17、基于初步处理负荷数据,将前后两个负荷数据作为参考点,设置范围阈值,对于超出范围阈值的负荷数据,标记为异常数据;
18、基于标记为异常数据的负荷数据,对异常数据进行修正,获得基础负荷数据集;
19、其中,所述对历史通信数据缺失负荷数据进行修补,获得初步处理负荷数据,方法为:
20、p=w1p(d1,t)+w2p(d2,t)
21、式中,p为待补缺的负荷数据,n为相近的负荷数据总,w1,w2为相近负荷数据的加权平均权重,p(d1,t),p(d2,t)为与d相近d1,d2日期下的t时间的负荷数据;
22、其中,对于超出范围阈值的负荷数据,标记为异常数据方法为:
23、
24、式中,z为范围阈值,z<=1时表示负荷数据正常;当z>1时表示负荷数据异常;n为初步处理负荷数据的总数,pn为第n个待检测负荷数
25、据,p1+p2/2为计算前一个p1负荷数据与后一个p2负荷数据的平均值,|p1-p2|/2为计算前一个p1负荷数据与后一个p2负荷数据的标准差值,pn-|p1+p2/2|为计算第n个待检测负荷数据与平均值的绝对值。
26、其中,所述对异常数据进行修正,获得基础负荷数据集,方法为:
27、
28、式中,set为修正后的基础负荷数据集,为异常数据同一时间下的负荷数据平均值,n为多个日期下同一时间的负荷数据总数,p(d,t)为不同日期下同一时间t的负荷数据;
29、优选的,基于通信能力开放平台的基础负荷数据数据集,计算历史通信负荷数据的基础负荷指标,具体为:
30、基于通信能力开放平台的基础负荷数据数据集,将数据集划分为每一天的负荷数据,每一个星期的负荷数据,每一个越的负荷数据,计算出短时间、中长时间、长时间的负荷指标;
31、基于短时间、中长时间、长时间的负荷指标,综合计算历史通信负荷数据的基础负荷指标;
32、历史通信负荷数据的基础负荷指标计算方法为:
33、
34、式中,l为通信能力开放平台的基础负荷数据指标,n为负荷数据的总数,l1为短时间内的负荷指标,l2为中长时间的负荷指标,l3为长时间的负荷指标;
35、优选的,基于历史通信负荷数据的基础负荷指标,确定每一个基础负荷指标与每一个波动指标之间的关联系数,具体包括:
36、获取影响基础负荷指标的影响因素,列如天气变化,季节更替,节假日等;
37、基于影响基础负荷指标的影响因素,构建每一个基础负荷指标与每一个影响因素之间的负荷曲线图;
38、基于每一个基础负荷指标与每一个影响因素之间的负荷曲线图,计算每一个基础负荷指标与每一个影响因素之间的线性回归系数,以该系数作为基础负荷指标与影响因素之间的关联系数;
39、所述线性回归系数计算公式为:
40、
41、式中,g为基础负荷指标与影响因素之间的关联系数,li为负荷曲线图中第i个基础负荷指标,si为负荷曲线图中第i个影响基础负荷指标的因素,n为负荷曲线图中负荷数据的总数。
42、优选的,基于每一个基础负荷指标与每一个波动指标之间的关联系数,构建负荷预测模型,预测未来负荷数据,具体包括:
43、收集每一个基础负荷指标与每一个波动指标之间的关联系数之间的历史负荷数据,以每一个每一个基础负荷指标与每一个波动指标之间的关联系数之间的特征数据作为输入,模型以预测未来负荷数据作为输出,训练负荷数据预测模型;
44、所述负荷数据预测模型为:
45、
46、式中,p预为预测的未来负荷数据,l为当前的负荷数据基础值,g为影响负荷数据的第i个因子的关联系数。
47、与现有技术相比,本发明的有益效果在于:通过获取通信通信能力开放平台的历史通信负荷数据,对历史负荷通信数据进行预处理,使历史负荷数据完整可靠,并将历史负荷数据构建基础负荷数据数据集,通过计算负荷数据的基础负荷数据,获得每一个基础负荷数据与每一个波动数据的关联系数,可以更好地理解负荷数据的特征,从而构建更标准的预测模型,精准预测未来负荷数据;