一种人流量预测方法、装置及系统与流程

文档序号:21087542发布日期:2020-06-12 17:00阅读:208来源:国知局
一种人流量预测方法、装置及系统与流程

本发明涉及计算机处理技术领域,更具体的说,是涉及一种人流量预测方法、装置及系统。



背景技术:

随着人们生活水平的提高,在线下零售店中(例如大型商业购物中心)购物的人流量越来越多,通过对一定时间内线下零售店中的人流量进行预测,能够更好的指引线下零售店经营者的营销策略。

目前采用的人流量预测方式都是通过摄像头对进出线下零售店的顾客行为进行采集,得到一定时间内进、出线下零售店的顾客人数,进而得到一定时间内线下零售店的在店人数,然而,受摄像头安装位置以及安装角度的限制,摄像头采集的信息与实际的进出店人数会有偏差,导致直接依据摄像头采集的信息进行线下零售店人流量预测的方式存在准确性低的问题。



技术实现要素:

有鉴于此,本发明提供了一种人流量预测方法、装置及系统,以克服现有技术中直接依据摄像头采集的信息进行线下零售店人流量预测的方式存在准确性低的问题。

为实现上述目的,本发明提供如下技术方案:

一种人流量预测方法,所述方法包括:

获取目标时间段内目标店铺的人员进、出店率;

获取所述目标时间段内目标店铺的在店人数预测值;

获取所述目标店铺的历史进店人群对应的用户特征值,以及所述目标店铺对应的店铺特征值;

对所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值做第一特征交叉处理,得到第一特征交叉结果;

对所述目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值做第二特征交叉处理,得到第二特征交叉结果;

将所述第一特征交叉结果以及所述第二特征交叉结果输入到人流量预测模型中,得到目标时间段内的店铺人流量预测结果。

优选的,所述对所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值做第一特征交叉处理,得到第一特征交叉结果包括:

计算目标时间段内目标店铺不同在店人数预测值之间的关联关系,得到第一在店人数特征关联结果;

计算不同用户特征值之间的关联关系,得到用户特征关联结果;

计算不同店铺特征值之间的关联关系,得到店铺特征关联结果;

计算目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值中两两之间的关联关系,得到第一联合特征关联结果;

利用第一在店人数特征关联结果、用户特征关联结果、店铺特征关联结果,以及第一联合特征关联结果,得到第一特征交叉结果。

优选的,所述对所述目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值做第二特征交叉处理,得到第二特征交叉结果包括:

计算目标时间段内目标店铺的不同进店率之间的关联关系,得到进店特征关联结果;

计算目标时间段内目标店铺的不同出店率之间的关联关系,得到出店特征关联结果;

计算目标时间段内目标店铺不同在店人数预测值之间的关联关系,得到第二在店人数特征关联结果;

计算目标间段内目标店铺的人员进、出店率,与预估时间段内目标店铺的在店人数预测值之间的关联关系,得到第二联合特征关联结果;

利用所述进店特征关联结果、出店特征关联结果、第二在店人数特征关联结果,以及第二联合特征关联结果,得到高维第二特征交叉结果;

对所述高维第二特征交叉结果进行降维处理,得到低维第二特征交叉结果。

优选的,所述人流量预测模型的训练过程包括:

获取样本集中的第一特征交叉结果训练样本、第二特征交叉结果训练样本,以及与所述第一特征交叉结果训练样本和第二特征交叉结果训练样本对应的参考输出店铺人流量;

将所述第一特征交叉结果训练样本和所述第二特征交叉结果训练样本输入到人流量预测模型中进行训练,得到预测店铺人流量;

利用所述参考输出店铺人流量以及所述预测店铺人流量得到人流量预测模型的损失函数;

利用所述人流量预测模型的损失函数对所述人流量预测模型的模型参数进行调整;

返回执行所述将所述第一特征交叉结果训练样本和所述第二特征交叉结果训练样本输入到人流量预测模型中进行训练,得到预测店铺人流量的步骤继续训练,直至得到人流量预测模型的损失函数呈现收敛状况时的人流量预测模型的模型参数作为人流量预测模型参数,并停止训练。

优选的,所述获取目标时间段内目标店铺的人员进、出店率包括:

将历史时间段内的目标店铺的人员进、出店率输入到时间序列模型中;

利用所述时间序列模型得到目标时间段内目标店铺的人员进、出店率。

优选的,所述获取所述目标时间段内目标店铺的在店人数预测值包括:

将历史时间段内的目标店铺的在店人数预测值输入到滚动时间窗回归模型中;

利用所述滚动时间窗回归模型得到目标时间段内目标店铺的在店人数预测值。

一种人流量预测装置,所述装置包括:

人员进、出店率获取单元,用于获取目标时间段内目标店铺的人员进、出店率;

在店人数预测值获取单元,用于获取所述目标时间段内目标店铺的在店人数预测值;

特征值获取单元,用于获取所述目标店铺的历史进店人群对应的用户特征值,以及所述目标店铺对应的店铺特征值;

第一特征交叉处理单元,用于对所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值做第一特征交叉处理,得到第一特征交叉结果;

第二特征交叉处理单元,用于对所述目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值做第二特征交叉处理,得到第二特征交叉结果;

人流量预测结果计算单元,用于将所述第一特征交叉结果以及所述第二特征交叉结果输入到人流量预测模型中,得到目标时间段内的店铺人流量预测结果。

优选的,所述第一特征交叉处理单元包括:

预测值关联关系计算单元,用于计算目标时间段内目标店铺不同在店人数预测值之间的关联关系,得到第一在店人数特征关联结果;

用户特征值关联关系计算单元,用于计算不同用户特征值之间的关联关系,得到用户特征关联结果;

店铺特征值关联关系计算单元,用于计算不同店铺特征值之间的关联关系,得到店铺特征关联结果;

第一联合特征关联结果计算单元,用于计算目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值中两两之间的关联关系,得到第一联合特征关联结果;

第一特征交叉结果计算单元,用于利用第一在店人数特征关联结果、用户特征关联结果、店铺特征关联结果,以及第一联合特征关联结果,得到第一特征交叉结果。

优选的,所述第二特征交叉处理单元包括:

进店率关联关系计算单元,用于计算目标时间段内目标店铺的不同进店率之间的关联关系,得到进店特征关联结果;

出店率关联关系计算单元,用于计算目标时间段内目标店铺的不同出店率之间的关联关系,得到出店特征关联结果;

在店人数关联关系计算单元,用于计算目标时间段内目标店铺不同在店人数预测值之间的关联关系,得到第二在店人数特征关联结果;

第二联合特征关联结果计算单元,用于计算目标间段内目标店铺的人员进、出店率,与预估时间段内目标店铺的在店人数预测值之间的关联关系,得到第二联合特征关联结果;

高维第二特征交叉结果计算单元,用于利用所述进店特征关联结果、出店特征关联结果、第二在店人数特征关联结果,以及第二联合特征关联结果,得到高维第二特征交叉结果;

降维单元,用于对所述高维第二特征交叉结果进行降维处理,得到低维第二特征交叉结果。

一种人流量预测系统,所述系统包括:

处理器和存储器;

所述处理器,用于调用并执行所述存储器中存储的程序;

所述存储器用于存储所述程序,所述程序至少用于:

执行如上所述的人流量预测方法。

经由上述的技术方案可知,与现有技术相比,本发明提供了一种人流量预测方法、装置及系统,通过获取目标时间段内目标店铺的人员进、出店率;获取所述目标时间段内目标店铺的在店人数预测值;获取所述目标店铺的历史进店人群对应的用户特征值,以及所述目标店铺对应的店铺特征值;对所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值做第一特征交叉处理,得到第一特征交叉结果;对所述目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值做第二特征交叉处理,得到第二特征交叉结果;将所述第一特征交叉结果以及所述第二特征交叉结果输入到人流量预测模型中,得到目标时间段内的店铺人流量预测结果。本发明在获得目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值,用户特征值以及店铺特征值之后,对上述特征做了如上特征交叉处理,得到了各个特征之间的关联关系,从而人流量预测模型能够利用各个特征之间的关联关系,来计算得到目标时间段内的店铺人流量预测结果,本发明实施例在计算目标时间段内的店铺人流量预测结果的过程中考虑到了各个特征之间的关联关系,能够提高店铺人流量预测结果的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种计算机设备硬件结构图;

图2为本发明实施例提供的一种人流量预测方法一个实施例的流程示意图;

图3为本发明实施例提供的一种人流量预测方法另一个实施例的流程示意图;

图4为本发明实施例提供的环神经网络rnn的具体架构图;

图5为本发明实施例提供的人流量预测装置的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

由于目前采用的人流量预测方式都是通过摄像头对进出线下零售店的顾客行为进行采集,得到一定时间内进、出线下零售店的顾客人数,进而得到一定时间内线下零售店的在店人数,具体做法为:摄像头识别到有一个顾客进店了,在店人数就加1,识别到有一个顾客出店了,在店人数就-1,摄像头并不能准确区分出店的和进店的是不是同一个人。并且,受摄像头安装位置以及安装角度的限制,导致摄像头不能覆盖到线下零售店所有角度,会有非常小部分顾客的进店和出店行为没被捕获到,或者部分顾客只有进店行为或者之后出店行为,导致摄像头采集的信息与实际的进出店人数会有偏差,如果直接依据摄像头采集的信息进行线下零售店人流量预测的话,会导致线下零售店人流量预测结果准确性低。

为了解决上述技术问题,本发明实施例提供了一种人流量预测方法,通过获取目标时间段内目标店铺的人员进、出店率;获取目标时间段内目标店铺的在店人数预测值;获取所述目标店铺的历史进店人群对应的用户特征值,以及所述目标店铺对应的店铺特征值;对所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值做第一特征交叉处理,得到第一特征交叉结果;对所述目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值做第二特征交叉处理,得到第二特征交叉结果;将所述第一特征交叉结果以及所述第二特征交叉结果输入到人流量预测模型中,得到目标时间段内的店铺人流量预测结果。本发明在获得目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值,用户特征值以及店铺特征值之后,对上述特征做了如上特征交叉处理,得到了各个特征之间的关联关系,从而人流量预测模型能够利用各个特征之间的关联关系,来计算得到目标时间段内的店铺人流量预测结果,本发明实施例在计算目标时间段内的店铺人流量预测结果的过程中考虑到了各个特征之间的关联关系,能够提高店铺人流量预测结果的准确性。

本发明实施例的人流量预测方法可以应用于计算机设备,该计算机设备可以为终端或服务器,如图1所示,其示出了本发明的方案所适用的计算机设备的一种组成结构示意图。在图1中,该计算机设备10可以包括:处理器101和存储器102。

该计算机设备10还可以包括:通信接口103、输入单元104和显示器105和通信总线106。

处理器101、存储器102、通信接口103、输入单元104、显示器105、均通过通信总线106完成相互间的通信。

在本发明实施例中,该处理器101,可以为中央处理器(centralprocessingunit,cpu),现场可编程门阵列(fpga)或者其他可编程逻辑器件等。

该处理器101可以调用存储器102中存储的程序,具体的,处理器可以执行以下方法实施例中终端侧所执行的操作。

存储器102中用于存放一个或者一个以上程序,程序可以包括程序代码,所述程序代码包括计算机操作指令,在本发明实施例中,该存储器中至少存储有用于实现以下功能的程序:

获取目标时间段内目标店铺的人员进、出店率;

获取目标时间段内目标店铺的在店人数预测值;

获取所述目标店铺的历史进店人群对应的用户特征值,以及所述目标店铺对应的店铺特征值;

对所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值做第一特征交叉处理,得到第一特征交叉结果;

对所述目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值做第二特征交叉处理,得到第二特征交叉结果;

将所述第一特征交叉结果以及所述第二特征交叉结果输入到人流量预测模型中,得到目标时间段内的店铺人流量预测结果。

如图2所示,其示出了本申请一种人流量预测方法一个实施例的流程示意图,本实施例主要以该方法应用于计算机设备来举例说明,参照图2,该人流量预测方法具体包括如下步骤:

s100、获取目标时间段内目标店铺的人员进、出店率;

需要说明的是,目标时间段可以为当前的一段时间或者是未来的一段时间,例如当前一个小时内,或者明天、后天的某个小时内,还可以是未来一个月的某天内等,本发明实施例并不做具体限定。

目标时间段内目标店铺的人员进、出店率包括:目标时间段内目标店铺的人员进店率以及目标时间段内目标店铺的人员出店率。

s110、获取所述目标时间段内目标店铺的在店人数预测值;

本发明实施例具体获取的是目标店铺在目标时间段内的在店人数预测值,需要说明的是,目标店铺的人员进、出店率以及目标店铺的在店人数预测值针对的都是同一个目标时间段,但是针对同一个目标时间段内的目标店铺的人员进、出店率以及目标店铺的在店人数预测值可以具有不同的时间粒度,本发明实施例中可以依据目标店铺的人员进、出店率以及目标店铺的在店人数预测值的数据特征,选用不同的粒度,从而能够体现目标店铺的人员进、出店率以及目标店铺的在店人数预测值的数据特征。

具体的,目标店铺的人员进、出店率可以选用粗粒度,目标店铺的在店人数预测值可以选用细粒度,例如:本发明可以获取目标时间段内每半个小时的目标店铺的人员进、出店率,并获取目标时间段内每分钟的目标店铺的在店人数预测值;当然,本发明实施例中的目标店铺的人员进、出店率可以选用细粒度,目标店铺的在店人数预测值可以选用粗粒度等;两者还可以选用相同的粒度,本发明实施例不做具体限定。

s120、获取所述目标店铺的历史进店人群对应的用户特征值,以及所述目标店铺对应的店铺特征值;

目标店铺的历史进店人群对应的用户特征值为历史时期进入目标店铺的人群对应的用户特征值,用户特征值主要是对用户相关特征信息的描述,用户特征值例如包括如下特征:性别分布特征值、年龄段分布特征值、到店次数分布特征值、兴趣爱好特征值、店铺偏好特征值、购买力特征值、品牌偏好特征值、以及进店人群和路过人群的相似度特征值等,本发明实施例不做具体限定。

由于历史时期所涵盖的时间段不同,历史进店人群对应的用户特征值也会有所不用,本发明实施例一方面可以直接从服务器中获取预先存储的某个历史时期对应的历史进店人群的用户特征值,还可以利用服务器中预先存储的某个历史时期对应的历史进店人群的用户特征值,根据当前时间实时计算历史进店人群对应的用户特征值,例如:根据最近三个月的历史进店人群的用户特征值,计算最近一个月的历史进店人群对应的用户特征值,还可以直接从服务器中获取预先存储的最近一个月的历史进店人群对应的用户特征值,本发明实施例不做具体限定。

需要说明的是,用户特征值可以从与用户相关的各种应用程序中获取。

店铺特征值为与目标店铺相关的特征值,店铺特征值例如可以包括:店铺所属的业态、店铺所在楼层、店铺面积、店铺的客单价、店铺风格、店铺品牌档次、店铺日均销售额、以及店铺与店铺之间的相似性、互斥性和导流率等,本发明实施例不做具体限定。

s130、对所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值做第一特征交叉处理,得到第一特征交叉结果;

本发明实施例为了获取所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值之间的特征相关性,可以利用预先设置的算法或模型对所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值做第一特征交叉处理,得到第一特征交叉结果。

s140、对所述目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值做第二特征交叉处理,得到第二特征交叉结果;

本发明实施例为了获取所述目标时间段内目标店铺的人员进、出店率,以及目标时间段内目标店铺的在店人数预测值之间的特征相关性,可以利用预先设置的算法或模型对目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值做第二特征交叉处理,得到第二特征交叉结果。

s150、将所述第一特征交叉结果以及所述第二特征交叉结果输入到人流量预测模型中,得到目标时间段内的店铺人流量预测结果。

本发明实施例中预先训练了人流量预测模型,人流量预测模型是基于大数据进行训练的,能够得到准确的店铺人流量预测结果,因此,本发明实施例将所述第一特征交叉结果以及所述第二特征交叉结果输入到人流量预测模型中,来计算能得到目标时间段内的店铺人流量预测结果。

目标时间段内的店铺人流量预测结果具体可以包括目标时间段内目标店铺的在店人数预测结果。

本发明实施例通过获取目标时间段内目标店铺的人员进、出店率;获取目标时间段内目标店铺的在店人数预测值;获取所述目标店铺的历史进店人群对应的用户特征值,以及所述目标店铺对应的店铺特征值;对所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值做第一特征交叉处理,得到第一特征交叉结果;对所述目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值做第二特征交叉处理,得到第二特征交叉结果;将所述第一特征交叉结果以及所述第二特征交叉结果输入到人流量预测模型中,得到目标时间段内的店铺人流量预测结果。本发明在获得目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值,用户特征值以及店铺特征值之后,对上述特征做了如上特征交叉处理,得到了各个特征之间的关联关系,从而人流量预测模型能够利用各个特征之间的关联关系,来计算得到目标时间段内的店铺人流量预测结果,本发明实施例在计算目标时间段内的店铺人流量预测结果的过程中考虑到了各个特征之间的关联关系,利用各个特征之间的关联关系进行店铺人流量预测,能够提高店铺人流量预测结果的准确性。本申请还综合考虑了用户特征值以及店铺特征值对店铺人流量预测结果的影响,使得特征维度更加全面,进一步提高店铺人流量预测结果的准确性。

并且,本申请中得到准确的店铺人流量预测结果,能够进一步帮助店铺经营者更好的了解当前店铺内的热度、消费情况和人流走向,从而能够更好的指引店铺经营者实时调整导购和营销方案。

如图3所示,其示出了本申请一种人流量预测方法另一个实施例的流程示意图,本实施例主要以该方法应用于计算机设备来举例说明,参照图3,该人流量预测方法具体包括如下步骤:

s200、将历史时间段内的目标店铺的人员进、出店率输入到时间序列模型中,利用所述时间序列模型得到目标时间段内目标店铺的人员进、出店率;

需要说明的是,本发明实施例具体可以采用设置在目标店铺内的视频采集设备获取历史时间段内的人员进、出信息,在对获取到的历史时间段内的人员进、出信息进行数据处理,得到历史时间段内的目标店铺的人员进、出店率。

具体的,由于受视频采集设备安装位置以及安装角度的限制,视频采集设备采集的信息与实际的进出店人数会有偏差,本发明实施例在利用视频采集设备采集历史时间段内的人员进、出信息之后,可以通过技术人员对视频内容的分析,对视频采集设备采集的历史时间段内的人员进、出信息进行调整,得到准确的历史时间段内的准确的人员进、出信息,历史时间段内的目标店铺的人员进、出店率是依据调整后的历史时间段内的准确的人员进、出信息得到的。

调整后的历史时间段内的准确的人员进、出信息包括:

历史时间段内既有进店行为又有出店行为的人群数a,历史时间段内只有出店行为没有进店行为的人群数b,历史时间段内只有进店行为没有出店行为的人群数c,还有历史时间段内既没有识别到进店,又没有识别到出店的人群,即视频采集设备完全没有识别到的人群。

历史时间段内的目标店铺的人员进店率p=a/a+b;

历史时间段内的目标店铺的人员出店率q=a/a+c。

需要说明的是,本发明实施例中的时间序列模型为基于lstmnetwork搭建的,lstmnetwork是基于循环神经网络建立的可进行长短期时间记忆的神经网络。循环神经网络rnn是一个序列到序列的模型,参考图4中给出了循环神经网络rnn的具体架构:

循环神经网络rnn的具体架构中xt表示t时刻的输入,ot表示t时刻的输出,st表示t时刻的记忆,xt-1表示t-1时刻的输入,ot-1表示t-1时刻的输出,st-1表示t-1时刻的记忆,xt+1表示t+1时刻的输入,ot+1表示t+1时刻的输出,st+1表示t+1时刻的记忆。

本发明实施例在将历史时间段内的目标店铺的人员进、出店率输入到时间序列模型中之前,可以对历史时间段内的目标店铺的人员进、出店率做数据预处理操作,数据预处理操作具体可以为:将按照时间序列排列的目标店铺的人员进、出店率转化为监督序列的形式,然后创建差分数列,再进行差分逆变换,最后进行归一化处理,得到归一化结果。将归一化结果输入到时间序列模型中进行处理。

具体的,本发明实施例可以基于最近3个月目标店铺的人员进、出信息,计算目标店铺在历史时间段内对应的工作日/周末/节假日的每半小时的人员进、出店率,用时间序列建模的方法预测出未来每半小时的目标店铺的人员进、出店率。

时间序列模型的训练过程可以为:

获取样本集中的人员进、出店率训练样本以及与所述人员进、出店率训练样本对应的参考输出人员进、出店率;将所述人员进、出店率训练样本输入到时间序列模型中进行训练,得到预测人员进、出店率;利用所述参考输出人员进、出店率以及预测人员进、出店率得到时间序列模型的损失函数;利用所述时间序列模型的损失函数对所述时间序列模型的模型参数进行调整;返回执行所述将所述人员进、出店率训练样本输入到时间序列模型中进行训练,得到预测人员进、出店率的步骤继续训练,直至得到时间序列模型的损失函数呈现收敛状况时的时间序列模型的模型参数作为目标时间序列模型参数,并停止训练。

具体的本发明实施例在对目标时间序列模型训练之后,还可以选取测试集,对目标时间序列模型进行测试,例如可以取最近2个月的数据为训练集,取最近1个月的数据为测试集,对目标时间序列模型进行测试,提高目标时间序列模型的准确率。

时间序列模型的损失函数可以为:mape(meanabsolutelypercenterror,平均绝对百分比误差)和rmse(rootmeansquarederror,均方根误差),

yi表示参考输出人员进、出店率,表示预测人员进、出店率,n为所有的样本量。

s210、将历史时间段内的目标店铺的在店人数预测值输入到滚动时间窗回归模型中,利用所述滚动时间窗回归模型得到目标时间段内目标店铺的在店人数预测值;

在店人数预测值具体可以为在历史时间段内在店人数的平均值、方差、标准差、一阶差分或二阶差分中的至少一种。

举例来说,历史时间段内的目标店铺的在店人数预测值可以为:最近3个月内目标店铺距离当前时间点最近1分钟/5分钟/10分钟/半小时/1小时的在店人数的均值/方差/标准差/一阶差分/二阶差分,或者是历史相同星期内每小时/每分钟的在店人数的均值/方差/标准差/一阶差分/二阶差分等,本发明实施例不做具体限定。

本发明实施例中利用所述滚动时间窗回归模型得到目标时间段内目标店铺的在店人数预测值的过程可以包括:

利用滚动时间窗回归模型,通过线性回归算法和xgboost回归算法,将历史时间段内的目标店铺的在店人数预测值进行滚动时间窗转换,把线性回归算法的预测结果和xgboost回归算法的预测结果取平均,将平均值作为目标时间段内目标店铺的在店人数预测值。

滚动时间窗转换的过程包括:通过向滚动时间窗回归模型提供x(t-1),x(t-2),x(t-3),…,x(t-n)形式的历史时间段内的目标店铺的在店人数预测值,预测时间序列中的下一个值,得到目标时间段内目标店铺的在店人数预测值x(t),这里的时间窗可以分别为1天或1周,本发明实施例不做具体限定。

比如:历史时间段内的目标店铺的在店人数预测值为最近半小时的在店人数的均值,如果时间窗为1天,那么x(t-1)为昨天的最近半小时的在店人数的均值,那么x(t)为今天的最近半小时的在店人数的均值;如果时间窗为1周,那么x(t-1)为上周的今天(假设今天周五,那么就是上周五)的最近半小时的在店人数的均值,那么x(t)为今天的最近半小时的在店人数的均值。

本发明实施例中的滚动时间窗回归模型采用线性回归模型结合xgboost回归模型,当然还可以单独采用线性回归模型和xgboost回归模型中的一种,也可以采用其他形式的模型,本发明实施例不做具体限定。

线性回归模型的函数形式为:

f(x)=ω1x1+ω2x2+…+ωixi+b(1)

向量表达式为:

f(x)=ωt+b(2)

为了拟合训练数据(x1,y1),(x2,y2)…(xn,yn),模型需改变参数ω和b,通过一定次数的迭代优化,找到最优参数ω*,b*,使得y=ω*x+b*,最优参数ω*,b*即为线性回归模型的模型参数。

线性回归模型的损失函数为:mape和rmse。

xgboost回归模型是一种将速度和效率发挥到极致的x(extreme)的梯度提升决策树(gbdt,gradientboostingdecisiontreee),是一种基于树结构并结合集成学习的一种回归模型,其基础树机构为分类回归树(cart,classificationandregressiontreee)。类似局部加权的线性回归,基于树结构的回归算法也是一类局部的回归算法,xgboost回归模型主要将历史时间段内的目标店铺的在店人数预测集切分成多份,在每一份历史时间段内的目标店铺的在店人数预测集上单独建模。cart算法采用一种二分递归分割的技术,算法是将当前样本集分割为两个子样本集,使得生成的决策树的每个非叶子结点都只有两个分枝,每次最优划分都针对单个变量,并剪枝。决策树的生成就是递归地构建二叉决策树的过程,在训练数据集的输入空间中,递归地将每个区域划分为两个子区域并决定每个子区域的输出值。在回归树中用平方误差最小化准则来划分子区域。xgboost回归模型在cart的基础上引入集成学习(boosting方法),并采用并行计算方法极大加速模型计算速度。boosting是将所有弱分类器的结果相加等于预测值,然后下一个弱分类器去拟合误差函数对预测值的梯度/残差(这个梯度/残差就是预测值与真实值之间的误差)。

xgboost回归模型的函数形式为:

其中,k为树的总个数,fk表示第k棵树,表示目标时间段内目标店铺的在店人数预测值,xi表示历史时间段内的目标店铺的在店人数预测值。

其中损失函数表示为:

其中,为样本在店人数预测值的训练误差,ω(fk)表示第k棵树的正则项。

s220、获取所述目标店铺的历史进店人群对应的用户特征值,以及所述目标店铺对应的店铺特征值;

s230、调用第一特征交叉模型,对所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值做第一特征交叉处理,得到第一特征交叉结果;

所述第一特征交叉模型对所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值做第一特征交叉处理的过程包括:

获取目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值;计算目标时间段内目标店铺不同在店人数预测值之间的关联关系,得到第一在店人数特征关联结果;计算不同用户特征值之间的关联关系,得到用户特征关联结果;计算不同店铺特征值之间的关联关系,得到店铺特征关联结果;计算目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值中两两之间的关联关系,得到第一联合特征关联结果;利用第一在店人数特征关联结果、用户特征关联结果、店铺特征关联结果,以及第一联合特征关联结果,得到第一特征交叉结果。

需要说明的是,由于目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值中的特征值有的是离散的,有的是连续的,在第一特征交叉模型对所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值做第一特征交叉处理之前,对于连续特征值需要进行离散化,可采用分桶、one-hot编码等方式将连续特征值离散化。

需要说明的是,在计算目标时间段内目标店铺不同在店人数预测值之间的关联关系,得到第一在店人数特征关联结果;计算不同用户特征值之间的关联关系,得到用户特征关联结果;以及计算不同店铺特征值之间的关联关系,得到店铺特征关联结果的过程中,采用fm(factormachine因子分解机)来计算,将两个互异的特征向量之间的关联信息考虑进来,fm计算公式为:

其中,n表示样本中的特征数量,xi表示第i个特征值,xj表示第j个特征值,vi表示第i维特征的隐向量,vj表示第j维特征的隐向量,ω0是常数项参数,对应线性回归的bias,ωi是一阶特征向量的权重参数。

上述公式在求解交叉项系数时,对每一个特征分量xi引入k维隐向量,vi=(vi,1,vi,2,…,vi,k),利用内积结果对交叉项的系数<vi,vj>进行估计,即

<·,·>代表向量点积,计算公式为:

其中,k为隐向量长度(k<<n),表示包含k个描述特征的因子。vi,f是向量vi的第f维隐向量,vf,j是向量vj的第f维隐向量,这里向量vi和向量vj都被影射到k维隐向量,可选的,本发明实施例中计算目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值中两两之间的关联关系,得到第一联合特征关联结果的过程即是得到在店人数预测值、用户特征值以及店铺特征值之间的特征关联结果。

本发明实施例中计算目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值中两两之间的关联关系的过程可以利用ffm(field-awarefactormachine场感知因子分解机),ffm计算公式为:

fi是第i个特征所属的类别(包括在店人数预测值类别、用户特征值类别或店铺特征值类别),fj是第j个特征所属的类别(包括在店人数预测值类别、用户特征值类别或店铺特征值类别)xi表示第i个特征值,xj表示第j个特征值,vi,fi表示第i维特征的隐向量,vj,fj表示第j维特征的隐向量,ω0是常数项参数,对应线性回归的bias,ωi是一阶特征向量的权重参数。

s240、调用第二特征交叉模型,对所述目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值做第二特征交叉处理,得到第二特征交叉结果;

所述第二特征交叉模型对所述目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值做第二特征交叉处理的过程包括:

获取目标时间段内目标店铺的人员进、出店率,以及目标时间段内目标店铺的在店人数预测值;计算目标时间段内目标店铺的不同进店率之间的关联关系,得到进店特征关联结果;计算目标时间段内目标店铺的不同出店率之间的关联关系,得到出店特征关联结果;计算目标时间段内目标店铺不同在店人数预测值之间的关联关系,得到第二在店人数特征关联结果;计算目标间段内目标店铺的人员进、出店率,与预估时间段内目标店铺的在店人数预测值之间的关联关系,得到第二联合特征关联结果;利用所述进店特征关联结果、出店特征关联结果、第二在店人数特征关联结果,以及第二联合特征关联结果,得到高维第二特征交叉结果;对所述高维第二特征交叉结果进行降维处理,得到低维第二特征交叉结果。

需要说明的是,本发明实施例中计算目标时间段内目标店铺的不同进店率之间的关联关系,得到进店特征关联结果;计算目标时间段内目标店铺的不同出店率之间的关联关系,得到出店特征关联结果;计算目标时间段内目标店铺不同在店人数预测值之间的关联关系,得到第二在店人数特征关联结果的过程采用fm来计算,将两个互异的特征向量之间的关联信息考虑进来。

本发明实施例中计算目标间段内目标店铺的人员进、出店率,与预估时间段内目标店铺的在店人数预测值之间的关联关系,得到第二联合特征关联结果的过程即是得到目标间段内目标店铺的人员进、出店率与预估时间段内目标店铺的在店人数预测值之间的特征关联结果。

本发明实施例中计算目标间段内目标店铺的人员进、出店率,与预估时间段内目标店铺的在店人数预测值之间的关联关系,得到第二联合特征关联结果的过程可以利用ffm来计算。

但为了保证特征交叉结果的准确性,本发明实施例在利用所述进店特征关联结果、出店特征关联结果、第二在店人数特征关联结果,以及第二联合特征关联结果,得到高维第二特征交叉结果之后;还执行了对所述高维第二特征交叉结果进行降维处理,得到低维第二特征交叉结果,即将高维稀疏的特征向量转化为低维稠密的特征向量。

s250、将所述第一特征交叉结果以及所述第二特征交叉结果输入到人流量预测模型中,得到目标时间段内的店铺人流量预测结果。

需要说明的是,本发明实施例中的人流量预测模型可以采用线性回归模型,也可以采用xgboost回归模型,还可以同时采用线性回归模型与xgboost回归模型,还可以采用其他种类的模型,本发明实施例不做具体限定。

所述人流量预测模型的训练过程包括:

获取样本集中的第一特征交叉结果训练样本、第二特征交叉结果训练样本,以及与所述第一特征交叉结果训练样本和第二特征交叉结果训练样本对应的参考输出店铺人流量;将所述第一特征交叉结果训练样本和所述第二特征交叉结果训练样本输入到人流量预测模型中进行训练,得到预测店铺人流量;利用所述参考输出店铺人流量以及所述预测店铺人流量得到人流量预测模型的损失函数;利用所述人流量预测模型的损失函数对所述人流量预测模型的模型参数进行调整;返回执行所述将所述第一特征交叉结果训练样本和所述第二特征交叉结果训练样本输入到人流量预测模型中进行训练,得到预测店铺人流量的步骤继续训练,直至得到人流量预测模型的损失函数呈现收敛状况时的人流量预测模型的模型参数作为人流量预测模型参数,并停止训练。

本发明实施例将所述第一特征交叉结果以及所述第二特征交叉结果输入到人流量预测模型中,得到目标时间段内的店铺人流量预测结果,预测出当前及未来时刻的在店人数,如果是预测未来半天/1天的在店人数,本发明实施例中的人流量预测模型得到的预测结果可以精确到每分钟,如果是预测未来3天/1周的在店人数,本发明实施例中的人流量预测模型得到的预测结果可以精确到每半小时等,本发明实施例不做具体限定。

下面对本发明实施例提供的人流量预测装置进行介绍,下文描述的人流量预测装置可与上文人流量预测方法相互对应参照。

图5为本发明实施例提供的人流量预测装置的结构框图,参照图5,该任人流量预测装置可以包括:

人员进、出店率获取单元500,用于获取目标时间段内目标店铺的人员进、出店率;

在店人数预测值获取单元510,用于获取所述目标时间段内目标店铺的在店人数预测值;

特征值获取单元520,用于获取所述目标店铺的历史进店人群对应的用户特征值,以及所述目标店铺对应的店铺特征值;

第一特征交叉处理单元530,用于对所述目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值做第一特征交叉处理,得到第一特征交叉结果;

第二特征交叉处理单元540,用于对所述目标时间段内目标店铺的人员进、出店率,目标时间段内目标店铺的在店人数预测值做第二特征交叉处理,得到第二特征交叉结果;

人流量预测结果计算单元550,用于将所述第一特征交叉结果以及所述第二特征交叉结果输入到人流量预测模型中,得到目标时间段内的店铺人流量预测结果。

所述第一特征交叉处理单元包括:

预测值关联关系计算单元,用于计算目标时间段内目标店铺不同在店人数预测值之间的关联关系,得到第一在店人数特征关联结果;

用户特征值关联关系计算单元,用于计算不同用户特征值之间的关联关系,得到用户特征关联结果;

店铺特征值关联关系计算单元,用于计算不同店铺特征值之间的关联关系,得到店铺特征关联结果;

第一联合特征关联结果计算单元,用于计算目标时间段内目标店铺的在店人数预测值、用户特征值以及店铺特征值中两两之间的关联关系,得到第一联合特征关联结果;

第一特征交叉结果计算单元,用于利用第一在店人数特征关联结果、用户特征关联结果、店铺特征关联结果,以及第一联合特征关联结果,得到第一特征交叉结果。

所述第二特征交叉处理单元包括:

进店率关联关系计算单元,用于计算目标时间段内目标店铺的不同进店率之间的关联关系,得到进店特征关联结果;

出店率关联关系计算单元,用于计算目标时间段内目标店铺的不同出店率之间的关联关系,得到出店特征关联结果;

在店人数关联关系计算单元,用于计算目标时间段内目标店铺不同在店人数预测值之间的关联关系,得到第二在店人数特征关联结果;

第二联合特征关联结果计算单元,用于计算目标间段内目标店铺的人员进、出店率,与预估时间段内目标店铺的在店人数预测值之间的关联关系,得到第二联合特征关联结果;

高维第二特征交叉结果计算单元,用于利用所述进店特征关联结果、出店特征关联结果、第二在店人数特征关联结果,以及第二联合特征关联结果,得到高维第二特征交叉结果;

降维单元,用于对所述高维第二特征交叉结果进行降维处理,得到低维第二特征交叉结果。

所述装置好包括:人流量预测模型训练单元,所述人流量预测模型训练单元具体用于:

获取样本集中的第一特征交叉结果训练样本、第二特征交叉结果训练样本,以及与所述第一特征交叉结果训练样本和第二特征交叉结果训练样本对应的参考输出店铺人流量;

将所述第一特征交叉结果训练样本和所述第二特征交叉结果训练样本输入到人流量预测模型中进行训练,得到预测店铺人流量;

利用所述参考输出店铺人流量以及所述预测店铺人流量得到人流量预测模型的损失函数;

利用所述人流量预测模型的损失函数对所述人流量预测模型的模型参数进行调整;

返回执行所述将所述第一特征交叉结果训练样本和所述第二特征交叉结果训练样本输入到人流量预测模型中进行训练,得到预测店铺人流量的步骤继续训练,直至得到人流量预测模型的损失函数呈现收敛状况时的人流量预测模型的模型参数作为人流量预测模型参数,并停止训练。

所述人员进、出店率获取单元具体用于:

将历史时间段内的目标店铺的人员进、出店率输入到时间序列模型中;

利用所述时间序列模型得到目标时间段内目标店铺的人员进、出店率。

在店人数预测值获取单元具体用于:

将历史时间段内的目标店铺的在店人数预测值输入到滚动时间窗回归模型中;

利用所述滚动时间窗回归模型得到目标时间段内目标店铺的在店人数预测值。

本发明实施例还公开了一种人流量预测系统,所述系统包括:

处理器和存储器;

所述处理器,用于调用并执行所述存储器中存储的程序;

所述存储器用于存储所述程序,所述程序至少用于:

执行如上所述的人流量预测方法。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1