数据处理方法、装置以及计算机可读存储介质与流程

文档序号:33736282发布日期:2023-04-06 07:49阅读:22来源:国知局
数据处理方法、装置以及计算机可读存储介质与流程

本技术涉及数据处理的,具体涉及一种数据处理方法、装置以及计算机可读存储介质。


背景技术:

1、随着计算机领域的不断发展,出现了不同种类的结算系统,例如内容分发网络(content delivery network,cdn)计费结算系统。cdn计费结算系统根据用户在云上使用cdn服务,对产生的流量数据进行统计,并根据用户的账户类型、计费类型和计费区间成计费账单。

2、在现有应用中,当用户选择按日结cdn计费的方式时,可以将用户在历史的自然日产生的流量数据作为所预测的用户在当前自然日会产生的流量数据,但是,用户在不同自然日产生的流量数据通常会有较大的差异,因此现有应用通过将用户在历史的自然日所产生的流量数据直接作为对当前自然日所预测的流量数据,会导致所预测的流量数据缺乏准确性。


技术实现思路

1、本技术实施例提供一种数据处理方法、装置以及计算机可读存储介质,可提高所预测得到的预测数据集的准确性。

2、本技术一方面提供了一种数据处理方法,该方法包括:

3、获取目标对象在第一时间窗口所产生的第一数据集;第一数据集包含目标对象在第一时间窗口的n个时间点分别产生的数据量,n为正整数;

4、根据n个时间点分别对应的数据量之间的波动幅度预测第二时间窗口对应的第二数据集;第二时间窗口与第一时间窗口相邻,第二时间窗口位于第一时间窗口之后,第二数据集包含所预测的第二时间窗口的m个时间点分别对应的数据量,m为正整数;

5、获取第一历史时间窗口对应的第一参考数据集;第一参考数据集包含第一历史时间窗口的l1个时间点分别对应的数据量,l1为正整数;

6、根据第一数据集、第二数据集及第一参考数据集预测第三时间窗口对应的第三数据集;第三数据集包含所预测的第三时间窗口的k个时间点分别对应的数据量,k为正整数,第三时间窗口与第二时间窗口相邻,第三时间窗口位于第二时间窗口之后,k个时间点与l1个时间点一一关联,一一关联的时间点处于不同自然日的相同时刻;

7、根据第二数据集和第三数据集生成目标对象的预测数据集。

8、本技术一方面提供了一种数据处理装置,该装置包括:

9、获取模块,用于获取目标对象在第一时间窗口所产生的第一数据集;第一数据集包含目标对象在第一时间窗口的n个时间点分别产生的数据量,n为正整数;用于获取第一历史时间窗口对应的第一参考数据集;第一参考数据集包含第一历史时间窗口的l1个时间点分别对应的数据量,l1为正整数;

10、数据预测模块,用于根据n个时间点分别对应的数据量之间的波动幅度预测第二时间窗口对应的第二数据集,第二时间窗口与第一时间窗口相邻,第二时间窗口位于第一时间窗口之后,第二数据集包含所预测的第二时间窗口的m个时间点分别对应的数据量,m为正整数;用于根据第一数据集、第二数据集及第一参考数据集预测第三时间窗口对应的第三数据集;第三数据集包含所预测的第三时间窗口的k个时间点分别对应的数据量,k为正整数,第三时间窗口与第二时间窗口相邻,第三时间窗口位于第二时间窗口之后,k个时间点与所述l1个时间点一一关联,一一关联的时间点处于不同自然日的相同时刻;

11、处理模块,用于根据第二数据集和第三数据集生成目标对象的预测数据集。

12、可选的,上述数据预测模块用于:

13、根据n个时间点分别对应的数据量生成数据拟合曲线;数据拟合曲线用于表征n个时间点分别对应的数据量之间的波动幅度;

14、根据数据拟合曲线预测m个时间点分别对应的数据量;

15、根据m个时间点分别对应的数据量构建第二数据集。

16、可选的,上述数据预测模块根据n个时间点分别对应的数据量生成数据拟合曲线的方法,包括:

17、获取初始拟合曲线;初始拟合曲线包含曲线参数;

18、根据初始拟合曲线,获取n个时间点分别对应的拟合数据量;

19、根据n个时间点分别对应的数据量和拟合数据量确定n个时间点分别对应的差异数据量;

20、对n个时间点分别对应的差异数据量进行求和,得到目标差异数据量;

21、根据目标差异数据量更新初始拟合曲线的曲线参数,将进行曲线参数更新的初始拟合曲线确定为数据拟合曲线。

22、可选的,上述数据预测模块用于:

23、获取第二历史时间窗口对应的第二参考数据集;第二历史时间窗口包含l2个时间点,l2为正整数,l2等于n+m,l2个时间点与n+m个时间点一一关联,一一关联的时间点处于不同自然日的相同时刻,第二参考数据集包含l2个时间点分别对应的数据量;

24、根据第一数据集、第二数据集及第二参考数据集确定数据量偏移比率;

25、根据数据量偏移比率和第一参考数据集,预测第三数据集。

26、可选的,上述数据预测模块根据第一数据集、第二数据集及第二参考数据集确定数据量偏移比率的方法,包括:

27、n个时间点分别对应的数据量和m个时间点分别对应的数据量构成第四数据集;

28、将第四数据集中分别与l2个时间点关联的时间点所对应的数据量,确定为l2个时间点分别对应的参考数据量;

29、根据l2个时间点分别对应的数据量和参考数据量,确定l2个时间点分别对应的偏移比率;

30、对l2个时间点分别对应的偏移比率进行平均处理,得到数据量偏移比率。

31、可选的,上述数据预测模块根据第一数据集、第二数据集及第二参考数据集确定数据量偏移比率的方法,包括:

32、根据数据量偏移比率对li个时间点分别对应的数据量进行偏移运算,得到k个时间点分别对应的偏移数据量;

33、根据k个时间点分别对应的偏移数据量,生成第三数据集。

34、可选的,目标对象是目标应用中的对象;

35、若目标对象在第一自然日内未产生数据量,则l1个时间点分别对应的数据量是根据目标应用中的全量对象在l1个时间点分别产生的数据量得到,且l2个时间点分别对应的数据量是根据全量对象在l2个时间点分别产生的数据量得到;第一自然日是第一历史时间窗口和第二历史时间窗口所属的自然日;

36、若目标对象在第一自然日内产生数据量,则l1个时间点分别对应的数据量为目标对象在l1个时间点分别产生的数据量,且l2个时间点分别对应的数据量为目标对象在l2个时间点分别产生的数据量。

37、可选的,上述处理模块还用于:

38、获取单位资源转移量;

39、根据第一数据集和预测数据集统计目标对象在第二自然日所产生的预估数据总量;

40、根据单位资源转移量和预估数据总量确定目标对象在第二自然日的预估资源转移量。

41、本技术一方面提供了一种计算机设备,其特征在于,包括处理器和存储器,处理器和存储器相互连接,其中,存储器用于存储计算机程序,计算机程序包括程序指令,处理器被配置用于调用程序指令,执行如本技术中一方面中的方法。

42、本技术一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被处理器执行时使处理器执行上述一方面中的方法。

43、本技术一方面提供了一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序/指令被处理器执行时实现上述一方面中的方法。

44、本技术通过第一时间窗口所对应的第一数据集对第二时间窗口所包含第二数据集预测,得到第二数据集,并利用第一数据集、第二数据集和第一历史时间窗口所包含的第一参考数据集对第三时间窗口所包含的第三数据集进行预测,以此确定第三数据集,其中第一自然日包括第一历史时间窗口,第二自然日包括第一时间窗口、第二时间窗口和第三时间窗口,第一自然日位于第二自然日之前。其中第二数据集、第三数据集为第二自然日未产生的数据集,通过结合第一自然日的数据集以及第二自然日已经产生的数据集来预测第二自然日还未产生的数据集,可以使得所预测得到的数据集(如第二数据集和第三数据集)的准确性更高。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1