一种替换历史客流数据中异常客流数据的方法及系统与流程

文档序号:32820359发布日期:2023-01-04 05:26阅读:43来源:国知局

1.本发明涉及智能交通技术领域,具体涉及一种替换历史客流数据中异常客流数据的方法及系统。


背景技术:

2.目前,通常使用历史客流数据进行地铁站点的客流预测,由于客流预测对历史客流数据的质量要求非常高,所以需要对历史客流数据中的异常客流数据进行处理,现有的方法大多是对历史客流数据中的异常客流数据进行剔除处理,但这种方法会导致历史客流数据在时间上不连续,影响后续的客流预测效果。


技术实现要素:

3.本发明的目的在于提供一种替换历史客流数据中异常客流数据的方法及系统,不仅能够对历史客流数据中的异常客流数据进行处理,而且在处理过后还能够生成在时间上连续且质量更高的客流数据。
4.为解决上述技术问题,本发明采用了以下方案:一方面,一种替换历史客流数据中异常客流数据的方法,包括以下步骤:s1:调用地铁站点的历史客流数据,所述历史客流数据包括异常客流数据和正常客流数据;s2:根据历史客流数据计算特征客流数据;s3:将历史客流数据中的异常客流数据替换为特征客流数据。
5.进一步的,所述历史客流数据包括历史时间段、在历史时间段内的任意时间段的进站客流值和出站客流值,所述异常客流数据包括进站客流值中的异常进站客流值、出站客流值中的异常出站客流值、异常进站客流值对应的异常进站时间段和异常出站客流值对应的异常出站时间段,所述正常客流数据包括进站客流值中的正常进站客流值、出站客流值中的正常出站客流值、正常进站客流值对应的正常进站时间段和正常出站客流值对应的正常出站时间段。
6.进一步的,所述特征客流数据包括特征进站值和特征出站值,所述s2包括:s21:根据异常进站客流值、异常进站时间段、正常进站客流值和正常进站时间段计算特征进站值;s22:根据异常出站客流值、异常出站时间段、正常出站客流值和正常出站时间段计算特征出站值。
7.进一步的,所述s21包括:s211:将历史时间段分为若干个连续且长度为客流周期的长度t的历史周期时间段;s212:将全部历史周期时间段中与异常进站时间段对应的正常进站时间段标记为特征进站时间段,调用全部特征进站时间段的正常进站客流值;
s213:判断全部特征进站时间段的正常进站客流值是否满足正态分布;s214:若全部特征进站时间段的正常进站客流值满足正态分布,则计算全部特征进站时间段的正常进站客流值满足的正态分布的第一极大似然值,并将第一极大似然值赋值给特征进站值;若全部特征进站时间段的正常进站客流值不满足正态分布,则将全部特征进站时间段的正常进站客流值的中位数赋值给特征进站值。
8.进一步的,所述s22包括:s221:将历史时间段分为若干个连续且长度为客流周期的长度t的历史周期时间段;s222:将全部历史周期时间段中与异常出站时间段对应的正常出站时间段标记为特征出站时间段,调用全部特征出站时间段的正常出站客流值;s223:判断全部特征出站时间段的正常出站客流值是否满足正态分布;s224:若全部特征出站时间段的正常出站客流值满足正态分布,则计算全部特征出站时间段的正常出站客流值满足的正态分布的第二极大似然值,并将第二极大似然值赋值给特征出站值;若全部特征出站时间段的正常出站客流值不满足正态分布,则将全部特征出站时间段的正常出站客流值的中位数赋值给特征出站值。
9.进一步的,所述客流周期为从地铁站点进站的总人数与从地铁站点出站的总人数相等的最小时间间隔。
10.进一步的,所述s3包括:s31:将异常进站时间段的异常进站客流值替换为与异常进站时间段对应的特征进站值;s32:将异常出站时间段的异常出站客流值替换为与异常出站时间段对应的特征出站值。
11.另一方面,一种替换历史客流数据中异常客流数据的系统,包括:存储器;一个或若干个处理器;一个或若干个模块,存储在存储器中并被配置成由所述一个或若干个处理器执行,所述一个或若干个模块包括:调用地铁站点的历史客流数据的数据调用模块;根据历史客流数据计算特征客流数据的特征客流数据计算模块;将历史客流数据中的异常客流数据替换为特征客流数据的异常客流数据替换模块。
12.进一步的,所述特征客流数据计算模块包括:根据异常进站客流值、异常进站时间段、正常进站客流值和正常进站时间段计算特征进站值的特征进站值计算模块;根据异常出站客流值、异常出站时间段、正常出站客流值和正常出站时间段计算特征出站值的特征出站值计算模块。
13.进一步的,所述将历史客流数据中的异常客流数据替换为特征客流数据的模块包括:将异常进站时间段的异常进站客流值替换为与异常进站时间段对应的特征进站
值的异常进站客流值替换模块;将异常出站时间段的异常出站客流值替换为与异常出站时间段对应的特征出站值的异常出站客流值替换模块。
14.本发明具有的有益效果:1、本发明中,通过提供一种替换历史客流数据中异常客流数据的方法及系统,其中数据调用模块调用历史客流数据并将历史客流数据输出给特征客流数据计算模块,特征客流数据计算模块根据历史客流数据计算特征客流数据并将特征客流数据输出至异常客流数据替换模块,异常客流数据替换模块将历史客流数据中的异常客流数据替换为特征客流数据,相对于剔除历史客流数据中的异常客流数据,本发明提供的方法及系统能够生成在时间上连续的客流数据。
15.2、本发明中,通过设置特征客流数据计算模块判断全部特征出站时间段的进站客流值和出战客流值是否符合正态分布,若满足正态分布,则将对应正态分布的极大似然值赋值给特征进站值和特征出站值;若不满足正态分布,则将全部特征出站时间段的进站客流值和出站客流值的中位数对应赋值给特征进站值和特征出站值,该方法得到的特征客流数据的质量更高。
附图说明
16.图1为本发明中的替换历史客流数据中异常客流数据的方法的总体流程图;图2为本发明中的s21的具体流程图;图3为本发明中的s22的具体流程图;图4为本发明中的替换历史客流数据中异常客流数据的系统的总体结构图。
具体实施方式
17.为使本领域技术人员更好地理解本发明/发明的技术方案,下面结合附图和具体实施方式对本发明/发明作进一步详细描述。
18.实施例1:如图1至图3所示的一种替换历史客流数据中异常客流数据的方法,包括以下步骤:s1:调用地铁站点的历史客流数据,所述历史客流数据包括异常客流数据和正常客流数据;s2:根据历史客流数据计算特征客流数据;s3:将历史客流数据中的异常客流数据替换为特征客流数据。
19.具体的,所述历史客流数据包括历史时间段、在历史时间段内的任意时间段的进站客流值和出站客流值,所述异常客流数据包括进站客流值中的异常进站客流值、出站客流值中的异常出站客流值、异常进站客流值对应的异常进站时间段和异常出站客流值对应的异常出站时间段,所述正常客流数据包括进站客流值中的正常进站客流值、出站客流值中的正常出站客流值、正常进站客流值对应的正常进站时间段和正常出站客流值对应的正常出站时间段。
20.具体的,所述特征客流数据包括特征进站值和特征出站值,所述s2包括:
s21:根据异常进站客流值、异常进站时间段、正常进站客流值和正常进站时间段计算特征进站值;s22:根据异常出站客流值、异常出站时间段、正常出站客流值和正常出站时间段计算特征出站值。
21.具体的,所述s21包括:s211:将历史时间段分为若干个连续且长度为客流周期的长度t的历史周期时间段;s212:将全部历史周期时间段中与异常进站时间段对应的正常进站时间段标记为特征进站时间段,调用全部特征进站时间段的正常进站客流值;s213:判断全部特征进站时间段的正常进站客流值是否满足正态分布;s214:若全部特征进站时间段的正常进站客流值满足正态分布,则计算全部特征进站时间段的正常进站客流值满足的正态分布的第一极大似然值,并将第一极大似然值赋值给特征进站值;若全部特征进站时间段的正常进站客流值不满足正态分布,则将全部特征进站时间段的正常进站客流值的中位数赋值给特征进站值。
22.具体的,所述s22包括:s221:将历史时间段分为若干个连续且长度为客流周期的长度t的历史周期时间段;s222:将全部历史周期时间段中与异常出站时间段对应的正常出站时间段标记为特征出站时间段,调用全部特征出站时间段的正常出站客流值;s223:判断全部特征出站时间段的正常出站客流值是否满足正态分布;s224:若全部特征出站时间段的正常出站客流值满足正态分布,则计算全部特征出站时间段的正常出站客流值满足的正态分布的第二极大似然值,并将第二极大似然值赋值给特征出站值;若全部特征出站时间段的正常出站客流值不满足正态分布,则将全部特征出站时间段的正常出站客流值的中位数赋值给特征出站值。
23.具体的,所述客流周期为从地铁站点进站的总人数与从地铁站点出站的总人数相等的最小时间间隔。
24.具体的,所述s3包括:s31:将异常进站时间段的异常进站客流值替换为与异常进站时间段对应的特征进站值;s32:将异常出站时间段的异常出站客流值替换为与异常出站时间段对应的特征出站值。
25.例如,历史时间段为140天,客流周期的长度t为7天,历史时间段分为了20个连续且长度为7天的历史周期时间段。
26.本实施例的工作原理:本发明中定义了客流周期为从地铁站点进站的总人数与从地铁站点出站的总人数相等的最小时间间隔,经大量研究发现,绝大多数地铁站点的进站客流值和出站客流值在相邻的两个长度为客流周期长度的时间段内的变化曲线基本保持一致,因此地铁站点在长度为客流周期长度的时间段内的进站客流值变化曲线和出站客流值变化曲线基本能够体现该地铁站点普遍的进站特性和出站特性。
27.基于上述原理,本技术方案首先以客流周期为基准对历史时间段进行分段,将历史时间段分为若干个连续且长度为客流周期的长度t的历史周期时间段,虽然地铁站点的进站客流值和出站客流值在相邻的两个长度为客流周期长度的时间段内的变化曲线基本保持一致,但是其中仍存在一些与正常客流数据差异较大的异常客流数据,而基本保持一致的正常进站客流值和正常出站客流值更能够体现该地铁站点普遍的进站特性和出站特性,所以提取全部历史周期时间段内与异常进站客流值和异常出站客流值时间对应的正常进站客流值和正常出站客流值,并根据正常进站客流值和正常出站客流值计算特征进站值和特征出站值,最后将异常进站客流值和异常出站客流值替换为对应的特征进站值和特征出站值,本方案生成的客流数据连续,且相比于包含有异常进站客流值和异常出站客流值的历史客流数据,本方案中生成的客流数据质量更高,根据该客流数据对后续客流的预测效果更好。
28.实施例2:如图4所示的,一种替换历史客流数据中异常客流数据的系统,包括:存储器;一个或若干个处理器;调用地铁站点的历史客流数据的数据调用模块;根据历史客流数据计算特征客流数据的特征客流数据计算模块;将历史客流数据中的异常客流数据替换为特征客流数据的异常客流数据替换模块。
29.具体的,所述特征客流数据计算模块包括:根据异常进站客流值、异常进站时间段、正常进站客流值和正常进站时间段计算特征进站值的特征进站值计算模块;根据异常出站客流值、异常出站时间段、正常出站客流值和正常出站时间段计算特征出站值的特征出站值计算模块。
30.具体的,所述将历史客流数据中的异常客流数据替换为特征客流数据的模块包括:将异常进站时间段的异常进站客流值替换为与异常进站时间段对应的特征进站值的异常进站客流值替换模块;将异常出站时间段的异常出站客流值替换为与异常出站时间段对应的特征出站值的异常出站客流值替换模块。
31.本实施例的工作原理:本发明中,数据调用模块调用历史客流数据并将历史客流数据输出给特征客流数据计算模块;特征客流数据计算模块中的特征进站值计算模块和特征出站值计算模块根据历史客流数据计算特征进站值和特征出站值并将特征进站值和特征出站值输出至异常客流数据替换模块;异常客流数据替换模块中的异常进站客流值替换模块将历史客流数据中的异常进站客流数据替换为特征进站值,异常客流数据替换模块中的异常出站客流值替换模块将历史客流数据中的异常出站客流数据替换为特征出站值,相对于剔除历史客流数据中的异常客流数据,该系统能够生成在时间上连续的客流数据。
32.实施例3:
本实施例从整体流程角度详细描述一种替换历史客流数据中异常客流数据的方法及系统,如图1至图4所示:本发明的技术方案包括一个调用历史客流数据的过程、一个计算特征客流数据的过程一个替换异常客流数据的过程,具体包括:调用历史客流数据:数据调用模块调用历史时间段为140天的历史客流数据;计算特征客流数据:特征客流数据计算模块将历史时间段分为20个连续且长度为7天的历史周期时间段;特征进站值计算模块将全部历史周期时间段中与异常进站时间段对应的正常进站时间段标记为特征进站时间段,调用全部特征进站时间段的正常进站客流值,判断全部特征进站时间段的正常进站客流值是否满足正态分布,若全部特征进站时间段的正常进站客流值满足正态分布,则计算全部特征进站时间段的正常进站客流值满足的正态分布的第一极大似然值,并将第一极大似然值赋值给特征进站值,若全部特征进站时间段的正常进站客流值不满足正态分布,则将全部特征进站时间段的正常进站客流值的中位数赋值给特征进站值;同理,特征出站值计算模块将历史时间段分为20个连续且长度为7天的历史周期时间段,将全部历史周期时间段中与异常出站时间段对应的正常出站时间段标记为特征出站时间段,调用全部特征出站时间段的正常出站客流值,判断全部特征出站时间段的正常出站客流值是否满足正态分布,若全部特征出站时间段的正常出站客流值满足正态分布,则计算全部特征出站时间段的正常出站客流值满足的正态分布的第二极大似然值,并将第二极大似然值赋值给特征出站值;若全部特征出站时间段的正常出站客流值不满足正态分布,则将全部特征出站时间段的正常出站客流值的中位数赋值给特征出站值。
33.替换异常客流数据:异常客流数据替换模块中的异常进站客流值替换模块将异常进站时间段的异常进站客流值替换为与异常进站时间段对应的特征进站值;异常客流数据替换模块中的异常出站客流值替换模块将异常出站时间段的异常出站客流值替换为与异常出站时间段对应的特征出站值。
34.从上述过程中可以看出,本发明通过根据历史客流数据中的正常客流数据计算特征客流数据,再将历史客流数据中的异常客流数据替换为特征客流数据,相比于直接剔除历史客流数据中的异常客流数据,本方案不仅能够提供在时间上连续的客流数据,同时数据质量更高。
35.可以理解的是,以上实施方式仅仅是为了说明本发明/发明的原理而采用的示例性实施方式,然而本发明/发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明/发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明/发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1