一种时间序列数据分析方法、系统及设备与流程

文档序号:38031594发布日期:2024-05-17 13:12阅读:19来源:国知局
一种时间序列数据分析方法、系统及设备与流程

本发明涉及数据分析,尤其涉及一种时间序列数据分析方法、系统及设备。


背景技术:

1、随着我国科技水平的不断提高,促使互联网技术飞速发展,用户所产生的数据总量成指数型增长,在大量的数据中,时间序列数据是一种非常常见的时态数据,它被广泛的应用于工业、农业、医疗、金融、交通等行业与我们的生活息息相关,因此如何准确分析时间序列数据成为重中之重。

2、目前常用的时间序列分析方法为中国专利授权公告号:cn108399434b公开了一种基于特征提取的高维时间序列数据的分析预测方法,涉及数据分析技术领域。该方法首先度量高维时间序列数据的条件属性间和条件属性与决策属性间的相关性,并将与决策属性有相关性的条件属性加入属性核集中;再对高维时间序列数据进行特征提取;然后建立多元线性回归模型,再通过基于健康度的粒子群优化算法对模型中的回归系数进行优化;最后根据所构建的多元线性回归模型,得到某一时刻决策属性的值。本发明提供的基于特征提取的高维时间序列数据的分析预测方法,解决了高维时间序列数据在分析预测过程中所存在的预测效率低、误差大以及容易出现局部最优解的问题,有效提高了多元线性回归分析算法对高维时间序列数据的预测效果。

3、但是,上述方法存在以下问题:时间序列数据分析时会因为其服务器所在地不同造成服务器对时间序列数据处理完成顺序与上传顺序不同,从而导致时间序列数据出现错误以及混淆。


技术实现思路

1、为此,本发明提供一种时间序列数据分析方法、系统及设备,用以克服现有技术中时间序列数据分析时会因为其服务器所在地不同造成服务器对时间序列数据处理完成顺序与上传顺序不同,从而导致时间序列数据出现错误以及混淆的问题。

2、为实现上述目的,本发明提供一种时间序列数据分析方法,包括:

3、步骤s1,获取时间序列数据的数据属性,并进行数据转换;

4、步骤s2,对完成所述数据转换的数据属性进行去极值处理以及数据清洗;

5、步骤s3,对完成所述数据清洗的时间序列数据,根据所述数据属性对时间序列数据进行分组;

6、步骤s4,对分组后的时间序列数据进行数据关联、排序,并根据排序结果确定有效关联组;

7、步骤s5,对所述有效关联组进行数据划分以生成数据排序训练集,并根据数据排序训练集确定对时间序列数据的静默时长;

8、步骤s6,对待处理的时间序列数据匹配所述静默时长以进行数据分析;

9、其中,所述数据属性包括数据名称、上传时间以及数据资源;所述数据关联为将所述时间序列数据关联其对应的传输时长以及处理时长。

10、进一步地,在所述步骤s1中,所述数据转换包括将从不同时区的服务器的所述时间序列数据的数据时间转换为协调世界时,以及将各所述时间序列数据的数据格式转换为相同格式。

11、进一步地,在所述步骤s2中,所述去极值处理为将所述时间序列数据对应的数据资源按照预设标准将量级不同的数据资源按量级进行分类,并在各类数据资源中确定对应的平均数据资源以及标准差,以分类进行去极值处理;

12、所述数据清洗为根据预设筛选条件对所述时间序列数据进行剔除。

13、进一步地,在所述步骤s3中,分组的方式包括根据所述时间序列数据对应的数据资源的分位数进行分组以及根据所述时间序列数据对应的数据资源的资源量级进行分组。

14、进一步地,在所述步骤s4中,对各个分组中的时间序列数据分别根据所述上传时间以及完成时间进行排序;

15、其中,时序周期包括所述传输时长以及所述处理时长;

16、其中,所述完成时间与所述时序周期以及所述上传时间有关。

17、进一步地,在所述步骤s4中,单个分组中的时间序列数据根据所述上传时间的排序顺序以及根据所述完成时间的排序顺序结果是否一致,确定单个分组中的时间序列数据是否为有效关联组;

18、若单个分组中的时间序列数据根据所述上传时间的排序顺序以及根据所述完成时间的排序顺序结果一致,判定单个分组中的时间序列数据为有效关联组;

19、若单个分组中的时间序列数据根据所述上传时间的排序顺序以及根据所述完成时间的排序顺序结果不一致,判定单个分组中的时间序列数据为无效关联组。

20、进一步地,对所述无效关联组对应的所述时间序列数据的所述时序周期进行修正,以生成对应的有效关联组;

21、其中,所述时序周期的修正为选取所述无效关联组中最长的时序周期作为标准周期,对无效关联组中的时序周期增加静默时长以生成标准周期;

22、静默时长由式(1)确定:

23、t’=t+t1=t0   (1)

24、其中,t’修正后的时序周期,t0为标准周期,t为原时序周期,t1为静默时长。

25、进一步地,根据所述有效关联组对应的数据资源的资源量级以及对应的上传间隔确定是否采用数据并行;

26、若所述有效关联组对应的数据资源的资源量级大于预设量级且对应的上传间隔大于预设间隔,对有效关联组采用数据并行。

27、另一方面,本发明还提供一种时间序列数据分析系统,包括:

28、收集单元,其用以收集时间序列数据,并获取对应的数据属性

29、预处理单元,其与所述收集单元相连,用以对所述时间序列数据进行数据转换、去极值处理以及数据清洗以生成初级时间序列数据;

30、分选单元,其与所述预处理单元相连,用以根据所述数据属性对所述初级时间序列数据进行分组以生成数据小组;

31、关联单元,其与所述分选单元相连,用以对所述数据小组进行数据关联以生成关联小组;

32、判断单元,其与所述关联单元相连,用以对所述关联小组进行排序并根据排序结果确定关联小组的类型;

33、修正单元,其与所述判断单元以及所述关联单元相连,用以根据所述关联小组的类型确定是否对所述关联小组进行修正以生成二次关联小组;

34、训练单元,其与所述关联单元以及所述修正单元相连,用以根据所述关联小组以及所述二次关联小组进行数据划分以生成数据排序训练集,并根据数据排序训练集确定对时间序列数据的静默时长;

35、应用单元,其与所述训练单元相连,用以对待处理的时间序列数据匹配所述静默时长以进行数据分析。

36、另一方面,本发明还提供一种时间序列数据分析设备,包括:

37、服务器,其用以接收时间序列数据;

38、处理组件,其用以对时间序列数据进行数据转换、去极值处理以及数据清洗以生成初级时间序列数据;

39、分析组件,其与所述处理组件相连,用以对所述初级时间序列数据进行分选、数据关联以生成关联小组;

40、决策组件,其与所述分析组件相连用以对所述关联小组进行排序并根据排序结果确定关联小组的类型;

41、管理组件,其与所述决策组件以及所述分析组件相连,用以根据所述关联小组的类型确定是否对所述关联小组进行修正以生成二次关联小组;

42、开发组件,其与所述管理组件以及所述分析组件相连,用以根据所述关联小组以及所述二次关联小组进行数据划分以生成数据排序训练集并根据数据排序训练集确定对时间序列数据的静默时长;

43、模拟组件,其与所述开发组件相连,用以对待处理的时间序列数据匹配所述静默时长以进行数据分析。

44、与现有技术相比,本发明的有益效果在于,本发明通过将时间序列数据根据对应的数据资源的资源量级进行分组,对分组后的时间序列数据进行数据关联和排序,并根据排序结果修正时间序列数据的时序周期,确保时间序列的完成顺序与其对应的上传顺序一致,避免时间序列数据分析发生错误以及混淆,从而提高了时间序列数据分析的准确性。

45、进一步地,本发明通过对时间序列数据进行数据属性获取和数据转换,将时间序列数据从不同时区的服务器的数据时间转换为协调世界时以及数据格式转换为相同格式统一为特定的格式或单位,从而消除不同服务器记录时间的差异,从而进一步地提高了时间序列数据分析的准确性。

46、进一步地,本发明通过将时间序列数据按预设标准分类为不同的数据资源量级后确定对应的平均数据资源以及标准差后,进行去极值处理以及数据清洗,按量级分类后有助于更好地去除对数据分析结果影响较大的极端异常值,并保留更多的数据特征,清洗数据可以去除错误、重复、无效或不一致的数据,提高时间序列数据分析质量,从而进一步地提高了时间序列数据分析的准确性。

47、进一步地,本发明能够应用于网络服务器处理数据或设备传输数据,应用在时间序列数据处理时,通过对时序数据的时序周期进行处理和调整,能够提高数据传输的效率、稳定性以及时间序列周期数据处理的可靠性以及准确性;应用于设备传输数据时,通过对时序数据的时序周期进行处理和调整,确保设备正常运行和数据分析准确性,能够提高数据传输的处理速度以及提高设备的整体性能,降低能源消耗、提高数据服务器的可靠性和优化设备资源利用。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1