客流量的确定方法及装置、非易失性存储介质与流程

文档序号:28483002发布日期:2022-01-14 22:15阅读:122来源:国知局
客流量的确定方法及装置、非易失性存储介质与流程

1.本技术涉及游客数量预测领域,具体而言,涉及一种客流量的确定方法及装置、非易失性存储介质。


背景技术:

2.旅游景区内游客数量常常随着全年不同的时间段而出现规律性的变化趋势。但同时,景区游客数量也受如季节、节日、事件、天气等各种外在因素的影响。这些因素中,天气对旅游景区游客数量影响是非常重大的。一方面,天气本身变化无常;另一方面,天气的变化对景区游客数量的影响也是相对来说比较显著的。
3.统计特征是业界内常用的衡量天气影响客流大小的方式,该方案虽然可以部分反映天气的影响大小,但精准度不高。
4.针对上述的问题,目前尚未提出有效的解决方案。
5.申请内容
6.本技术实施例提供了一种客流量的确定方法及装置、非易失性存储介质,以至少解决目前采用统计特征衡量天气对客流大小的影响导致景区客流量预测的精确度比较低的技术问题。
7.根据本技术实施例的一个方面,提供了一种客流量的确定方法,包括:获取目标时间片所属目标日期的类型和目标时间片内的预估客流量;依据类型确定与类型对应的机器学习模型,其中,机器学习模型为基于历史数据中至少一个时间片内的客流量和时间片对应的天气特征确定的;将目标时间片的天气特征输入至机器学习模型中进行分析,得到天气影响因子,其中,该天气影响因子用于指示天气特征对客流量的影响程度;基于天气影响因子对预估客流量进行调整,得到目标客流量。
8.根据本技术实施例的另一方面,还提供了一种客流量的确定装置,包括:获取模块,用于获取目标时间片所属目标日期的类型和目标时间片内的预估客流量;确定模块,用于依据类型确定与类型对应的机器学习模型,其中,机器学习模型为基于历史数据中至少一个时间片内的客流量和时间片对应的天气特征确定的;分析模块,用于将目标时间片的天气特征输入至机器学习模型中进行分析,得到天气影响因子,其中,该天气影响因子用于指示天气特征对客流量的影响程度;调整模块,用于基于天气影响因子对预估客流量进行调整,得到目标客流量。
9.根据本技术实施例的再一方面,还提供了一种非易失性存储介质,其中,存储介质包括存储的程序,其中,在程序被处理器执行时执行以上的客流量的确定方法。
10.根据本技术实施例的再一方面,还提供了一种计算设备,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取目标时间片所属目标日期的类型和目标时间片内的预估客流量;依据类型确定与类型对应的机器学习模型,其中,机器学习模型为基于历史数据中至少一个时间片内的客流量和时间片对应的天气特征确定的;将目标时间片的天气特征输入至机器学习模型中进行分析,得到天气影响因子,其
中,该天气影响因子用于指示天气特征对客流量的影响程度;基于天气影响因子对预估客流量进行调整,得到目标客流量。
11.在本技术实施例中,采用获取目标时间片所属目标日期的类型和目标时间片内的预估客流量;依据类型确定与类型对应的机器学习模型,其中,机器学习模型为基于历史数据中至少一个时间片内的客流量和时间片对应的天气特征确定的;将目标时间片的天气特征输入至机器学习模型中进行分析,得到天气影响因子,其中,该天气影响因子用于指示天气特征对客流量的影响程度;基于天气影响因子对预估客流量进行调整,得到目标客流量的方式,通过利用机器学习的方法得到较优的衡量天气对客流影响的天气影响因子,然后利用天气影响因子对预估的客流量进行调整,得到目标客流量,从而实现了提高景区客流量预测的精确度的技术效果,进而解决了目前采用统计特征衡量天气对客流大小的影响导致景区客流量预测的精确度比较低的技术问题。
附图说明
12.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
13.图1示出了一种用于实现客流量的确定方法的计算机终端(或移动设备)的硬件结构框图;
14.图2a是根据本技术实施例的一种客流量的确定方法的流程图;
15.图2b是根据本技术实施例的一种可选的客流量的确定方法的流程图
16.图3是根据本技术实施例的一种客流量的确定装置的结构图;
17.图4是根据本技术实施例的一种计算机终端的结构框图。
具体实施方式
18.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
19.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
20.首先,在对本技术实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
21.独热编码:即one-hot编码,又称一位有效编码,其方法是使用n位状态寄存器来对n个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。
例如对六个状态进行编码:
22.自然顺序码为000,001,010,011,100,101
23.独热编码则是000001,000010,000100,001000,010000,100000。
24.天气影响因子:天气对客流的影响大小,该因子大于等于0,小于等于1。该因子常与估计的客流数相乘,所以接近0时认为天气对客流的影响比较大,接近1时对客流的比较小。
25.实施例1
26.旅游景区内游客数量常常随着全年不同的时间段而出现规律性的变化趋势。但同时,景区游客数量也会受到天气等各种外在因素的影响。统计特征是业界内常用的衡量天气影响客流大小的方式,该方案虽然可以部分反映天气的影响大小,但精准度不高。因此,研究一个定量的天气对景区客流影响因子是十分必要的。
27.为实施上述目的,本技术实施例还提供了一种客流量的确定方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
28.本技术实施例1所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现客流量的确定方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,
……
,102n来示出)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(i/o接口)、通用串行总线(usb)端口(可以作为i/o接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
29.应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本技术实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
30.存储器104可用于存储应用软件的软件程序以及模块,如本技术实施例中的客流量的确定方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的客流量的确定方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
31.传输模块106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输模块106包括一个网络适
配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
32.显示器可以例如触摸屏式的液晶显示器(lcd),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
33.在上述运行环境下,本技术提供了如图2a所示的客流量的确定方法。图2a是根据本技术实施例1的一种客流量的确定方法的流程图,如图2a所示,该方法包括以下步骤:
34.步骤s202,获取目标时间片所属目标日期的类型和目标时间片内的预估客流量。
35.步骤s202中目标日期的类型主要包括以下三种类型:工作日(周一至周五),一般节假日(周末)以及特殊节假日(如春节、五一、国庆等)。目标时间片为预先设定的一个时长,本实施例中的目标时间片为15分钟,也可以根据需要设置为其他预设时长。
36.预估客流量的确定方式有多种,例如,在执行步骤s202时可以获取无线接入点在目标时刻的终端数量;将终端数量输入至客流量预测模型进行分析,得到目标时间片内的预估客流量。目标时间片为包含目标时刻的时间片。
37.其中,上述无线接入点为wifi探针,wifi探针是指基于wifi探测技术来识别ap(无线接入点)附近已开启wifi的wifi终端(、智能手机、笔记本,平板电脑等),无需用户接入wifi,wifi探针就能够识别用户的信息。
38.当用户走进探针信号覆盖区域内且wifi设备打开时,wifi设备就能被探针探测到,无论是ios或者安卓系统都能轻易检测到,并且获取设备的mac地址。
39.在执行上述步骤时,获取通过wifi探针实时获得的流量和历史几小时、过去几天的分时间片流量,例如,确定前五天中当前时刻的终端数量;基于所述终端数量预测当前时刻所属时间片内的客流量。
40.需要注意的是,对于预估客流量还可以通过其他方式确定,例如,可以直接依据历史数据中同一日期内与所述目标时间片相同的时间片内的客流量确定:例如,目标时间片为2020年10月3日中10:00-10:30之间的时间段,此时可以依据2017年、2018年和2019年在10月3日10:00-10:30之间的客流量确定当前(2020年10月3日)的客流量,具体可以依据前几年的客流量平均值确定。
41.步骤s204,依据类型确定与类型对应的机器学习模型,其中,机器学习模型为基于历史数据中至少一个时间片内的客流量和时间片对应的天气特征确定的。
42.步骤s204中至少一个时间片内的客流量即为15分钟内景区的平均客流人数。天气特征包括:天气状态(晴、阴、多云等)、温度、平均风力大小、降水量、能见度。
43.在一些实施例中,步骤s204中的机器学习模型可以为xgboost回归模型,xgboost是一个优化的分布式梯度增强库,旨在实现高效,灵活和便携。它在gradient boosting框架下实现机器学习算法。xgboost提供并行树提升,可以快速准确地解决许多数据科学问题。
44.步骤s206,将目标时间片的天气特征输入至机器学习模型中进行分析,得到天气影响因子,其中,该天气影响因子用于指示天气特征对客流量的影响程度。
45.步骤s208,基于天气影响因子对预估客流量进行调整,得到目标客流量。例如,其中,调整方式包括但不限于将天气影响因子与预估客流量相乘,得到目标客流量。
46.需要注意的是,在考虑旅游景区的客流量时,事件对客流的影响是具有较大不确定性的。事件本身是偶发的,但这并不意味着事件引起的客流变化可以被忽视。事实上,既然是一个事件,那么它的发生本身就是比较吸引人眼球的,很多时候是应该被更加重视的。所以,要对事件发生时对景区客流流量做一个更准确的把握,研究事件对景区流量的影响是非常必要的。这里所说的事件,是比较广义的。它可以指一个特殊的节日(如烟花节等),一次紧急的事件(如某明星突然光临等),也可以指一次大中型活动(如庆祝游行等)等等。
47.因此,为了提高目标客流量的准确性,在对预估客流量进行调整时,除了考虑天气影响因子之外,还可以考虑其他影响因子,例如事件调节因子,其中,所述事件调节因子用于表示事件对客流量的影响程度。
48.上述事件调节因子可以通过事件联立模型来计算,该因子的范围在-1到1之间(大部分在从0到1的范围内)。事件联立模型参照事件日期、目标日期等因素,建立未来事件与历史事件的联立关系,并根据平均人流密度在历史事件前后的变化趋势,借鉴到未来事件的日期前后构建联立模型,计算事件调节因子。
49.其中,事件调节因子用于指示:事件发生前的第一时间段内的客流量和事件发生后的第二预设时间段内的客流量之间的变化趋势。
50.在本技术的一些可选的实施例中,事件调节因子通过以下方式确定:确定预估事件的起始时间和结束时间之间的第一时长,以及关联事件的起始时间和结束时间之间的第二时长,其中,关联事件为与预估事件具有关联关系的关联事件;确定第一时长内各个时间片内的客流量,以及第二时长内各个时间片内的客流量;基于第一时长内各个时间片内的客流量确定各个时间片的第一事件调节因子序列,以及基于第二时长内各个时间片内的客流量确定第二事件调节因子序列;基于第一时间调节因子序列和第二事件调节因子序列确定事件调节因子。
51.根据事件进行景区客流数量的预估需要有一些历史事件做参考,预估未来某个事件对景区客流的影响,首先要做的是找到与之相关联的历史事件与景区客流的记录。
52.在形式上,以表1形式提供:
[0053][0054]
为保证预估的准确性,关联事件的选取应该尽可能遵循以下两个原则:一、关联事件的事件类型应该尽可能与预估事件的事件类型一致;二、关联事件的当天发生时间段也
应该与预估事件的当天发生时间段一致,避免白天的事件与晚上的事件关联,也尽可能避免晚上的事件与白天的事件相关联。
[0055]
一个预估事件如果关联了多个历史事件,将历史上的多个事件进行平均处理,得到一个整体的关联事件。例如,将多个事件作为一个整体事件,将多个事件所对应的各个时间片的客流量进行平均,例如,某事件a对应关联事件b和事件c,确定事件b和事件c在不同年份的同一历史日期的同一个时间片内的客流量平均值,将该客流量平均值作为整体的关联事件在上述时间片内的客流量。
[0056]
有了关联事件,便可以计算预估事件发生期间客流量的影响因子,即事件影响因子。
[0057]
例如,可以依据历史记录中预估事件和其关联事件发生过程中,各个时间片的客流量确定事件影响因子:在每个事件发生日期内,将每个时间片对应的客流量与该日期内总客流量的比值作为预估事件的事件调节因子或关联事件的事件调节因子。然后,基于两类事件调节因子(即预估事件的事件调节因子和关联事件的事件调节因子)确定最终的时间影响因子:例如,将两类因子的平均值作为最终的事件调节因子。
[0058]
也就是说,事件调节因子是依据预估事件与关联事件共同确定的,此时目标客流量=历史流量预测部分*(1-气象调节因子)*(1+事件调节因子)。
[0059]
事件对客流的影响因子是相对于事件前一段时间客流数量的相对比值大小,该比值大于等于0,没有上限。
[0060]
在本技术的一个可选的实施例中,步骤s206通过以下方法实现:获取目标时间片内的天气特征;基于历史时间片内的天气特征对目标时间片的天气特征进行归一化处理,得到目标天气特征值,其中,历史时间片为在目标日期之前的至少一个历史日期中与目标时间片属于同一时间片的时间片;基于机器学习模型对目标天气特征值进行分析,得到天气影响因子。
[0061]
其中,上述天气特征可以分为有物理量和无物理量两类特征,此时,可以通过以下方式获取目标时间片内的天气特征:获取目标时间片内的天气数据,其中,天气数据包括:具有用于量化天气状态的物理量的第一类天气数据和不具有物理量的第二类天气数据;基于第一类天气数据对应的物理量确定第一类天气数据对应的天气特征值;对第二类天气数据进行独热编码(one-hot encoding),得到编码值;基于编码值确定与第二类天气数据对应的天气特征值;基于第一类天气数据对应的天气特征值和与第二类天气数据对应的天气特征值共同确定目标时间片内的天气特征。
[0062]
在本步骤中,具有量化天气状态的物理量的第一类天气数据是指温度、平均风力大小、降水量、能见度等有具体的数值的天气特征。不具有物理量的第二类天气数据是指天气状态,天气状态是表示类别的值。对于第一类天气数据,可以直接获取具体的数值作为第一类天气数据对应的天气特征值。对于第二类天气数据进行独热编码,得到第二类天气数据对应的天气特征值。将第一类天气数据对应的天气特征值和第二类天气数据对应的天气特征值作为目标时间片内的天气特征。然后对目标时间片内的天气特征进行归一化处理,得到目标天气特征值。
[0063]
上文中的目标天气特征值包括:第一目标特征值;第一目标特征值通过以下方式确定:确定至少一个历史日期中所有历史时间片的天气特征值;确定所有历史时间片的天
气特征值中的极大值和极小值;基于极大值和极小值对目标时间片内的天气特征进行归一化处理,得到第一目标特征值;将目标时间片的天气特征输入至机器学习模型中进行分析,得到天气影响因子,包括:将第一目标特征值输入至机器学习模型中进行分析,得到第一天气影响因子。
[0064]
例如,将同一时间片ti的样本中的各天气属性进行归一化处理,即:
[0065][0066]
其中,表示第一目标特征值,x
*j
表示该数据集中所有时间片与ti相等的天气特征,即t
*
=ti;min表示取最小数值,max表示取最大数值。
[0067]
其中,上述第一天气影响因子称为绝对影响因子,其生成方式如下:
[0068]
以景区的客流量预测为例,如图2b所示,将天气对景区客流的影响因子分成两类:绝对影响因子与相对影响因子。每类因子又分成三个子因子:即工作日天气对客流的影响因子,节日天气对客流的影响因子(如周末),特殊假日(如春节、五一、国庆等)天气对客流的影响因子。
[0069]
依据过去一年以上每15分钟景区的天气条件与客流数量对应关系进行研究。天气特征包括:天气状态(晴、阴、多云等)、温度、平均风力大小、降水量、能见度。客流数量即为15分钟内景区的平均客流人数。
[0070]
1、将以上数据集分成三部分:工作日天气-客流数据集、节日天气-客流数据集、特殊假日天气-客流数据集。
[0071]
2、在每个数据集内,以x
ij
代表第i个样本的第j个天气特征(1≤j≤5且j∈n),ti代表第i个样本的15分钟时间片(1≤ti≤96且ti∈n),用yi代表第i个样本的客流数(yi∈n)。
[0072]
样本数据需要进行如下处理:
[0073]
a、温度、平均风力大小、降水量、能见度都有具体的数值,可以直接取这些数值;天气状态是表示类别的值,进行独热编码(one-hot encoding);
[0074]
b、将同一时间片ti的样本中的各天气属性进行归一化处理,即:
[0075][0076]
其中,x
*j
表示该数据集中所有时间片与ti相等的天气特征,即t
*
=ti;min表示取最小数值,max表示取最大数值。
[0077]
c、将yi进行如下转化:
[0078][0079]
其中,表示客流因子,y
*
表示该数据集中所有时间片与yi相等的客流量,即t
*
=ti。
[0080]
3、将三个数据集内预处理后的样本分别进行用xgboost模型进行回归建模。得到三个回归模型。模型的输入为预处理后的天气特征输出为处理后的客流因子
[0081]
4、对某日15分钟时间片内的天气特征先代入以上预处理模型中处理,处理后再代
入以上xgboost回归模型,得到的模型输出结果,就是绝对影响因子。
[0082]
上文中的目标天气特征值还包括:第二目标特征值;第二目标特征值通过以下方式确定:确定目标日期的前一个日期内历史时间片的天气特征值;确定目标时间片的天气特征值与历史时间片的天气特征值的差异;依据差异确定第二目标特征值;将目标时间片的天气特征输入至机器学习模型中进行分析,得到天气影响因子,包括:将第二目标特征值输入至机器学习模型中进行分析,得到第二天气影响因子。
[0083]
上述第二天气影响因子称为第二天气影响因子,其生成方式如下:
[0084]
1、在所有数据集内,以x
ij
代表第i个样本的第j个天气特征(1≤j≤5且j∈n),ti代表第i个样本的15分钟时间片(1≤ti≤96且ti∈n),用yi代表第i个样本的客流数(yi∈n)。
[0085]
2、样本数据需要进行如下的预处理:除第一天的样本外,将所有样本的各天气特征数值转化为与前一自然日、同样时间片样本的差值;其中t
p
=ti并且样本p是样本i的前一天的对应数据。
[0086]
3、将以上数据集分成三部分:工作日天气-客流数据集、节日天气-客流数据集、特殊假日天气-客流数据集。按照绝对影响因子的2、3、4步处理得到天气相对影响因子。
[0087]
根据本技术的一个可选的实施例,机器学习模型通过以下方式训练得到:获取预设统计周期内的各个时间片的样本天气数据,以及各个时间片内的客流量;对样本天气数据进行归一化处理,得到目标样本特征,以及对各个时间片内的客流量进行归一化处理,得到各个时间片的第一客流因子;建立目标样本特征和第一客流因子的映射关系,并基于映射关系确定样本数据集;采用样本数据集中的样本数据对机器学习模型进行训练。
[0088]
上述机器学习模型还可以通过以下方式训练得到:获取预设统计周期内的各个时间片的样本天气数据,以及各个时间片内的客流量;对样本天气数据之间的差异进行归一化处理,得到目标样本特征,以及对各个时间片的客流量差异进行归一化处理,得到各个时间片的第二客流因子;建立目标样本特征和第二客流因子的映射关系,并基于映射关系确定样本数据集;采用样本数据集中的样本数据对机器学习模型进行训练。
[0089]
在本技术的一些可选的实施例中,采用样本数据集中的样本数据对机器学习模型进行训练之前,还需要确定样本数据集中的样本数据所对应的样本时间片;确定样本时间片所属的日期;确定样本时间片所属的日期类型;依据日期类型对样本数据集中的样本数据进行分类,得到多个类型的样本数据集,其中,不同类型的数据集中包括不同日期类型的样本数据;采用样本数据集中的样本数据对机器学习模型进行训练,包括:分别采用多个类型的样本数据集对机器学习模型进行训练,得到与多个类型的样本数据及对应的多个训练后的机器学习模型。
[0090]
上述客流量的预测方法不仅可以应用于旅游景区预测客流量的应用场景,还可以应用于交通枢纽的客流量预测,比如机场、火车站、汽车站、码头等交通枢纽的客流量预测,以及大型活动比如演唱会、体育比赛等应用场景下的客流量预测。
[0091]
以机场的客流量预测的应用场景为例,首先获取目标时间片所属目标日期的类型和目标时间片内的预估客流量,例如,目标时间片为2020年10月3日中10:00-10:30之间的时间段,此时可以依据2017年、2018年和2019年在10月3日10:00-10:30之间的客流量确定当前(2020年10月3日)的客流量,具体可以依据前几年的客流量平均值确定。然后将目标时
间片的天气特征输入至与目标时间片所属目标日期的类型对应的机器学习模型进行分析,得到天气影响因子。利用得到的天气影响因子对机场的预估客流量进行调整,得到最终的目标客流量。
[0092]
对于演唱会、体育比赛等应用场景下的客流量预测,在获取预估客流量时获取无线接入点在目标时刻的终端数量;将终端数量输入至客流量预测模型进行分析,得到目标时间片内的预估客流量。然后将目标时间片的天气特征输入至与目标时间片所属目标日期的类型对应的机器学习模型进行分析,得到天气影响因子。利用得到的天气影响因子对演唱会或者体育比赛场地的预估客流量进行调整,得到最终的目标客流量。根据目标客流量布置相应的安保措施。
[0093]
本技术实施例利用机器学习的方法,将数据资源充分利用起来,避免了人为参与过多导致的数据使用不充分、复用能力较弱的短板。可以得到较优的衡量天气对客流影响的因子,如果单纯用来研究天气因子,绝对因子的xgboost重要性可以分析各个因子的影响大小;如果用来客流预测,则相对影响因子更有发挥空间。本方案可以提升20%的预测准确性。
[0094]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本技术所必须的。
[0095]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的客流量的确定方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例所述的方法。
[0096]
实施例2
[0097]
根据本技术实施例,还提供了一种用于实施上述客流量的确定方法的装置,如图3所示,该装置包括:
[0098]
获取模块30,用于获取目标时间片所属目标日期的类型和目标时间片内的预估客流量;
[0099]
确定模块32,用于依据类型确定与类型对应的机器学习模型,其中,机器学习模型为基于历史数据中至少一个时间片内的客流量和时间片对应的天气特征确定的;
[0100]
分析模块34,用于将目标时间片的天气特征输入至机器学习模型中进行分析,得到天气影响因子,其中,该天气影响因子用于指示天气特征对客流量的影响程度;
[0101]
调整模块36,用于基于天气影响因子对预估客流量进行调整,得到目标客流量。
[0102]
此处需要说明的是,上述获取模块30、确定模块32、分析模块34和调整模块36对应于实施例1中的步骤s202至步骤s208,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
[0103]
实施例3
[0104]
本技术的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
[0105]
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
[0106]
在本实施例中,上述计算机终端可以执行应用程序的客流量的确定方法中以下步骤的程序代码:获取目标时间片所属目标日期的类型和目标时间片内的预估客流量;依据类型确定与类型对应的机器学习模型,其中,机器学习模型为基于历史数据中至少一个时间片内的客流量和时间片对应的天气特征确定的;将目标时间片的天气特征输入至机器学习模型中进行分析,得到天气影响因子,其中,该天气影响因子用于指示天气特征对客流量的影响程度;基于天气影响因子对预估客流量进行调整,得到目标客流量。
[0107]
可选地,图4是根据本技术实施例的一种计算机终端的结构框图,如图4所示,该计算机终端40可以包括:一个或多个(图中仅示出一个)处理器402、存储器404、以及射频模块、音频模块以及显示屏。
[0108]
其中,存储器可用于存储软件程序以及模块,如本技术实施例中的安全漏洞检测方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的客流量的确定方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0109]
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取目标时间片所属目标日期的类型和目标时间片内的预估客流量;依据类型确定与类型对应的机器学习模型,其中,机器学习模型为基于历史数据中至少一个时间片内的客流量和时间片对应的天气特征确定的;将目标时间片的天气特征输入至机器学习模型中进行分析,得到天气影响因子,其中,该天气影响因子用于指示天气特征对客流量的影响程度;基于天气影响因子对预估客流量进行调整,得到目标客流量。
[0110]
可选的,上述处理器还可以执行如下步骤的程序代码:获取目标时间片内的天气特征;基于历史时间片内的天气特征对目标时间片的天气特征进行归一化处理,得到目标天气特征值,其中,历史时间片为在目标日期之前的至少一个历史日期中与目标时间片属于同一时间片的时间片;基于机器学习模型对目标天气特征值进行分析,得到天气影响因子。
[0111]
可选的,上述处理器还可以执行如下步骤的程序代码:获取目标时间片内的天气数据,其中,天气数据包括:具有用于量化天气状态的物理量的第一类天气数据和不具有物理量的第二类天气数据;基于第一类天气数据对应的物理量确定第一类天气数据对应的天气特征值;对第二类天气数据进行独热编码,得到编码值;基于编码值确定与第二类天气数据对应的天气特征值;基于第一类天气数据对应的天气特征值和与第二类天气数据对应的天气特征值共同确定目标时间片内的天气特征。
[0112]
可选的,上述处理器还可以执行如下步骤的程序代码:确定至少一个历史日期中所有历史时间片的天气特征值;确定所有历史时间片的天气特征值中的极大值和极小值;基于极大值和极小值对目标时间片内的天气特征进行归一化处理,得到第一目标特征值。
[0113]
可选的,上述处理器还可以执行如下步骤的程序代码:将第一目标特征值输入至机器学习模型中进行分析,得到第一天气影响因子。
[0114]
可选的,上述处理器还可以执行如下步骤的程序代码:确定目标日期的前一个日期内历史时间片的天气特征值;确定目标时间片的天气特征值与历史时间片的天气特征值的差异;依据差异确定第二目标特征值;将目标时间片的天气特征输入至机器学习模型中进行分析,得到天气影响因子。
[0115]
可选的,上述处理器还可以执行如下步骤的程序代码:将第二目标特征值输入至机器学习模型中进行分析,得到第二天气影响因子。
[0116]
可选的,上述处理器还可以执行如下步骤的程序代码:获取预设统计周期内的各个时间片的样本天气数据,以及各个时间片内的客流量;对样本天气数据进行归一化处理,得到目标样本特征,以及对各个时间片内的客流量进行归一化处理,得到各个时间片的第一客流因子;建立目标样本特征和第一客流因子的映射关系,并基于映射关系确定样本数据集;采用样本数据集中的样本数据对机器学习模型进行训练。
[0117]
可选的,上述处理器还可以执行如下步骤的程序代码:获取预设统计周期内的各个时间片的样本天气数据,以及各个时间片内的客流量;对样本天气数据之间的差异进行归一化处理,得到目标样本特征,以及对各个时间片的客流量差异进行归一化处理,得到各个时间片的第二客流因子;建立目标样本特征和第二客流因子的映射关系,并基于映射关系确定样本数据集;采用样本数据集中的样本数据对机器学习模型进行训练。
[0118]
采用本技术实施例,提供了一种客流量的确定方法。通过利用机器学习的方法得到较优的衡量天气对客流影响的天气影响因子,然后利用天气影响因子对预估的客流量进行调整,得到目标客流量,从而实现了提高景区客流量预测的精确度的技术效果,进而解决了目前采用统计特征衡量天气对客流大小的影响导致景区客流量预测的精确度比较低的技术问题。
[0119]
本领域普通技术人员可以理解,图4所示的结构仅为示意,计算机终端也可以是智能手机(如android手机、ios手机等)、平板电脑、掌声电脑以及移动互联网设备(mobile internet devices,mid)、pad等终端设备。图4其并不对上述电子装置的结构造成限定。例如,计算机终端40还可包括比图4中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图4所示不同的配置。
[0120]
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-only memory,rom)、随机存取器(random access memory,ram)、磁盘或光盘等。
[0121]
本技术的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例1所提供的客流量的确定方法所执行的程序代码。
[0122]
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
[0123]
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取目标时间片所属目标日期的类型和目标时间片内的预估客流量;依据类型确定与类型对应的机器学习模型,其中,机器学习模型为基于历史数据中至少一个时间片内的客流量和时间片对应的天气特征确定的;将目标时间片的天气特征输入至机器学习模型中进行分析,得到天气影响因子,其中,该天气影响因子用于指示天气特征对客流量的影响程度;基于天气影响因子对预估客流量进行调整,得到目标客流量。
[0124]
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:获取目标时间片内的天气特征;基于历史时间片内的天气特征对目标时间片的天气特征进行归一化处理,得到目标天气特征值,其中,历史时间片为在目标日期之前的至少一个历史日期中与目标时间片属于同一时间片的时间片;基于机器学习模型对目标天气特征值进行分析,得到天气影响因子。
[0125]
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:获取目标时间片内的天气数据,其中,天气数据包括:具有用于量化天气状态的物理量的第一类天气数据和不具有物理量的第二类天气数据;基于第一类天气数据对应的物理量确定第一类天气数据对应的天气特征值;对第二类天气数据进行独热编码,得到编码值;基于编码值确定与第二类天气数据对应的天气特征值;基于第一类天气数据对应的天气特征值和与第二类天气数据对应的天气特征值共同确定目标时间片内的天气特征。
[0126]
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:确定至少一个历史日期中所有历史时间片的天气特征值;确定所有历史时间片的天气特征值中的极大值和极小值;基于极大值和极小值对目标时间片内的天气特征进行归一化处理,得到第一目标特征值。
[0127]
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:将第一目标特征值输入至机器学习模型中进行分析,得到第一天气影响因子。
[0128]
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:确定目标日期的前一个日期内历史时间片的天气特征值;确定目标时间片的天气特征值与历史时间片的天气特征值的差异;依据差异确定第二目标特征值;将目标时间片的天气特征输入至机器学习模型中进行分析,得到天气影响因子。
[0129]
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:将第二目标特征值输入至机器学习模型中进行分析,得到第二天气影响因子。
[0130]
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:获取预设统计周期内的各个时间片的样本天气数据,以及各个时间片内的客流量;对样本天气数据进行归一化处理,得到目标样本特征,以及对各个时间片内的客流量进行归一化处理,得到各个时间片的第一客流因子;建立目标样本特征和第一客流因子的映射关系,并基于映射关系确定样本数据集;采用样本数据集中的样本数据对机器学习模型进行训练。
[0131]
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:获取预设统计周期内的各个时间片的样本天气数据,以及各个时间片内的客流量;对样本天气数据之间的差异进行归一化处理,得到目标样本特征,以及对各个时间片的客流量差异进行归一化处理,得到各个时间片的第二客流因子;建立目标样本特征和第二客流因子的映射关系,并基于映射关系确定样本数据集;采用样本数据集中的样本数据对机器学习模型进行训练。
[0132]
上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
[0133]
在本技术的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0134]
在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0135]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0136]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0137]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0138]
以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1