商户菜品交易预测及备餐方法及装置与流程

文档序号:19222503发布日期:2019-11-26 02:15阅读:228来源:国知局
商户菜品交易预测及备餐方法及装置与流程

本说明书涉及计算机领域。



背景技术:

外卖在餐饮行业越来越普及,用户通过网上订餐,由商户接单并备餐。目前用户对商户备餐速度要求越来越高,如果商户在用户下单后再进行备餐,当正好处于下单高峰时段,备餐速度会受到人力以及场地环境的限制。因此,如何有效地提高备餐速度,对于商户而言十分重要。



技术实现要素:

本说明书提供了一种商户菜品交易预测及备餐方法及装置,能够有效地对商户的菜品交易量进行预测并规划备餐方案。

本申请公开了一种商户菜品交易预测及备餐方法,包括:

获取商户在待预测时间段对应的菜品交易特征数据;

将所述菜品交易特征数据作为商户的回归模型的输入,获取该商户在所述待预测时间段的菜品交易预测值;

根据所述菜品交易预测值,规划该菜品的备餐方案。

在一个优选例中,所述将所述菜品交易特征数据作为商户的菜品交易预测模型的输入,获取该商户在所述待预测时间段的菜品交易预测值之前,还包含:

获取所述商户历史在多个时间段的菜品交易样本;

基于所述菜品交易样本的菜品交易特征数据与对应的菜品交易量,训练所述回归模型。

在一个优选例中,所述菜品交易特征数据包括以下之一或其任意组合:菜品交易量的时序特征、天气特征、时间段特征、商户活动特征、菜品特征。

在一个优选例中,所述菜品交易量的时序特征是指所述商户的历史的菜品交易量根据时间变化的特征。

在一个优选例中,所述菜品交易量的时序特征是以下之一:近期历史的连续的l个固定时长t内的菜品交易量序列,近期历史的连续的l个固定时长t内的菜品交易量序列的加权平均值,近期历史的连续的l个固定时长t内的菜品交易量序列的一阶、二阶差分值。

在一个优选例中,所述时间段特征包括一下之一或其任意组合:当前固定时长t所在日期的节假日类型,当前固定时长t所在日期是该星期的第几天以及类型,当前固定时长t在该天的序号以及当前固定时长t所在小时在该天的序号。

在一个优选例中,所述商户活动信息包括:商户送券的金额,和/或商户交易价格减免的比例。

在一个优选例中,所述菜品活动信息包括:所述菜品的单价,和/或所述菜品价格减免比例。

在一个优选例中,所述回归模型是lightgbm模型。

在一个优选例中,所述回归模型包括n个子模型,所述回归模型输出的预测值是所述n个子模型输出的预测值的加权平均值;

所述基于所述菜品交易样本的菜品交易特征数据与对应的菜品交易量,训练所述回归模型,进一步包括:

从所述菜品交易样本中随机筛选固定比例数量的样本,设置随机参数种子,分别训练所述m个子模型,确定训练好的各个子模型的训练准确度,从所述m个子模型中挑选n个训练准确度超过预定门限的子模型,其中m≥n>1。

在一个优选例中,所述将n个子模型输出的预测值加权平均时,每个子模型的权重与该子模型的训练准确度正相关。

在一个优选例中,所述子模型是lightgbm模型。

本申请还公开了一种商户菜品交易预测及备餐装置包括:

第二获取模块,用于获取商户在待预测时间段对应的菜品交易特征数据;

预测模块,用于将所述菜品交易特征数据作为商户的回归模型的输入,获取该商户在所述待预测时间段的菜品交易预测值;

规划模块,用于根据所述菜品交易预测值,规划该菜品的备餐方案。

在一个优选例中,还包括:

第一获取模块,用于获取所述商户历史在多个时间段的菜品交易样本;

训练模块,用于基于所述菜品交易样本的菜品交易特征数据与对应的菜品交易量,训练所述回归模型。

在一个优选例中,所述菜品交易特征数据包括以下之一或其任意组合:菜品交易量的时序特征、天气特征、时间段特征、商户活动特征、菜品特征。

在一个优选例中,所述菜品交易量的时序特征是指所述商户的历史的菜品交易量根据时间变化的特征。

在一个优选例中,所述菜品交易量的时序特征是以下之一:近期历史的连续的l个固定时长t内的菜品交易量序列,近期历史的连续的l个固定时长t内的菜品交易量序列的加权平均值,近期历史的连续的l个固定时长t内的菜品交易量序列的一阶、二阶差分值。

在一个优选例中,所述时间段特征包括一下之一或其任意组合:当前固定时长t所在日期的节假日类型,当前固定时长t所在日期是该星期的第几天以及类型,当前固定时长t在该天的序号以及当前固定时长t所在小时在该天的序号。

在一个优选例中,所述商户活动信息包括:商户送券的金额,和/或商户交易价格减免的比例。

在一个优选例中,所述菜品活动信息包括:所述菜品的单价,和/或所述菜品价格减免比例。

在一个优选例中,所述回归模型是lightgbm模型。

在一个优选例中,所述回归模型包括n个子模型,所述回归模型输出的预测值是所述n个子模型输出的预测值的加权平均值;

所述训练模块还用于从所述菜品交易样本中随机筛选固定比例数量的样本,设置随机参数种子,分别训练所述m个子模型,确定训练好的各个子模型的训练准确度,从所述m个子模型中挑选n个训练准确度超过预定门限的子模型,其中m≥n>13。

在一个优选例中,所述将n个子模型输出的预测值加权平均时,每个子模型的权重与该子模型的训练准确度正相关。

在一个优选例中,所述子模型是lightgbm模型。

本申请还公开了一种商户菜品交易预测及备餐设备包括:

存储器,用于存储计算机可执行指令;以及,

处理器,用于在执行所述计算机可执行指令时实现如前文描述的方法中的步骤。

本申请还公开了一种计算机可读存储介质所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如前文描述的方法中的步骤。

本说明书实施方式中,有效预测商户各个菜品的交易量随时间的分布,由此在备餐时按照预测数量对相同的餐品进行同时同锅烧制,实现并行制作,有效地对人力和时间进行规划,既可以节约人力、又可以保证备餐速度。

本说明书中记载了大量的技术特征,分布在各个技术方案中,如果要罗列出本申请所有可能的技术特征的组合(即技术方案)的话,会使得说明书过于冗长。为了避免这个问题,本说明书上述发明内容中公开的各个技术特征、在下文各个实施方式和例子中公开的各技术特征、以及附图中公开的各个技术特征,都可以自由地互相组合,从而构成各种新的技术方案(这些技术方案均应该视为在本说明书中已经记载),除非这种技术特征的组合在技术上是不可行的。例如,在一个例子中公开了特征a+b+c,在另一个例子中公开了特征a+b+d+e,而特征c和d是起到相同作用的等同技术手段,技术上只要择一使用即可,不可能同时采用,特征e技术上可以与特征c相组合,则,a+b+c+d的方案因技术不可行而应当不被视为已经记载,而a+b+c+e的方案应当视为已经被记载。

附图说明

图1是根据本说明书第一实施方式的商户菜品交易预测及备餐方法的流程示意图;

图2是根据本说明书第二实施方式的商户菜品交易预测及备餐装置的结构示意图。

具体实施方式

在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。

下面将结合附图对本说明书的实施方式作进一步地详细描述。

本说明书的第一实施方式涉及一种商户菜品交易预测及备餐方法,其流程如图1所示,该方法包括以下步骤:

步骤110:获取商户历史在多个时间段的菜品交易样本;

步骤120:基于所述菜品交易样本的时间段的菜品交易特征数据与对应的菜品交易量,训练所述商户的回归模型;

步骤130:获取所述商户在待预测时间段的菜品交易特征数据;

步骤140:将所述菜品交易特征数据作为该商户的所述回归模型的输入,获取该商户在所述待预测时间段的菜品交易预测值;

步骤150:根据所述菜品交易预测值,规划该菜品的备餐方案。

下面将对每一个步骤进行详细的解释和说明。

针对步骤110:获取商户历史在多个时间段的菜品交易样本。

换句话说,在本步骤中获取的商户历史在多个时间段的菜品交易样本,包含该商家在不同时间段内的交易特征数据与对应的菜品交易量。

上述菜品交易量,是指针对某一种菜品的交易量。例如,针对商户的一个菜品“南翔小笼”的交易量。

时间段可以是例如:12:00-12:15,这种情况下,时间段对应的时长是15分钟,时间段的起始时间节点是12:00。还可以有其它时间段,例如18:30-18:40,时间段对应的时长是10分钟,时间段的起始时间节点是18:30。

可选的,可将时间段的时长设置为一个固定值,例如10分钟或15分钟,也可以设置为30分钟或60分钟。

菜品交易特征数据可以是与该菜品交易相关的特征信息,该特征信息能够对菜品的交易量产生影响,例如:天气信息、时间段信息、商户优惠活动信息,等等。下文中会进一步解释说明。

针对步骤120:基于所述菜品交易样本的菜品交易特征数据与对应的菜品交易量,训练所述商户的回归模型。

可选的,回归模型的输入特征,即,每个固定时长内,菜品交易样本的菜品交易特征数据,包含但不限于:菜品交易量的时序特征、天气特征、时间特征、商户活动信息,以及菜品信息等。

可选的,菜品交易量的时序特征是指商户的历史的菜品交易数量根据时间变化的特征,这种特征可以体现出每个菜品交易数量随时间的变化趋势。菜品交易量的时序特征可以是例如以下几种:

1)近期历史的连续的l个固定时长t内的菜品交易量序列。

2)近期历史的连续的l个固定时长t内的菜品交易量序列的加权平均值。

3)近期历史的连续的l个固定时长t内的菜品交易量序列的一阶、二阶差分值。

可选的,天气特征是指每个固定时长t内的气候特征,例如,固定时长t的期初是阵雨,则对应的天气编码是001,固定时长t的期末是多云,则对应的天气编码是002,等等。天气编码可以有多种设置方式,在此不做赘述。

可选的,将气候特征分为晴、多云、阴、大风、阵雨、大雨、大雪等等不同类别,并为每个类别设置对应的天气编码,作为天气特征。

将天气作为回归模型的输入特征,是考虑到天气情况会影响商户的菜品的交易量。

可选的,时间特征是指时间段本身的特性或属性。时间特征可以例如以下几种:

1)当前固定时长t所在日期的节假日类型,例如,双休日、国定节日。

2)当前固定时长t所在日期是该星期的第几天,类型(即,工作日、周末),例如,第三个工作日、周末。

3)当前固定时长t在该天的序号,以及当前时长t所在小时在该天的序号。例如,将固定时长t设置为15分钟,则给每一段时长t设置一个对应的序号,另外,以小时为单位,以整点为起始时间节点,为1天的每个小时设置序号,确定当前固定时长t所在小时在该天的序号。

将时间特征作为回归模型的输入特征,是考虑到时间段本身的特性或属性,会影响商户的菜品的交易量。

可选的,商户活动信息是指优惠活动的信息,例如,商户送券的金额,商户交易价格减免的比例。

将商户活动信息作为回归模型的输入特征,是考虑到商户的活动会影响商户的菜品的交易量。

可选的,菜品活动信息,是指例如:菜品本身的单价,价格减免比例等信息。

将菜品活动信息作为回归模型的输入特征,是考虑到菜品活动信息会影响商户的菜品的交易量。

可选的,本实施例中采用基于特征工程的lightgbm模型。lightgbm是基于树模型的集成模型,它具备更强的特征筛选能力,具有比较好的预测表现。

可选的,回归模型包括n个子模型,所述子模型是lightgbm模型。

在训练回国模型的过程中,从所述菜品交易样本中随机筛选固定比例数量的样本,设置随机参数种子,分别训练所述m个子模型,确定训练好的各个子模型的训练准确度,从所述m个子模型中挑选n个训练准确度超过预定门限的子模型,其中m≥n>1。

可选的,通过以下具体方式对回归模型进行训练:

例如,有15,000个菜品交易样本数据,分成两组,一组是1万个样本数据,用于训练,另外一组是5000个样本数据,用于测试。设置5个子模型,每个子模型预先分别用随机的方式设置参数的初始值,并且,每次从1万个用于训练的样本数据中抽取其中的80%的样本,总共抽取5次,得到5组样本数据,分别用于训练5个不同的子模型,然后用5000个测试数据分别测试这5个子模型得到模型训练的准确度,确定其中4个子模型的训练准确度达到预定的标准,则4个子模型将用于后面的预测中。

针对步骤130:获取所述商户在待预测时间段的菜品交易特征数据。

待预测时间段可以是一个待预测时长t,例如:12:00-12:15。在本步骤中,获取12:00-12:15的待测时间段内的菜品交易特征数据,包括上述菜品交易量的时序特征、天气特征、时间段特征、商户活动特征、菜品特征等。

对于回归模型的准确度而言,时长t的值越大,一般回归模型的准确度越高。

针对步骤140:将所述菜品交易特征数据作为该商户的所述回归模型的输入,获取该商户在所述待预测时间段的菜品交易预测值。

预测菜品交易量,是指在上述待预测的时间段内,通过回归模型,预测商户的一个菜品的交易量,即,下单量。

如上所述,回归模型包括n个子模型,所述回归模型输出的预测值是所述n个子模型输出的预测值的加权平均值。其中,所述将n个子模型输出的预测值加权平均时,每个子模型的权重与该子模型的训练准确度正相关。

具体的,在进行商户的菜品交易预测时,将待预测时长t对应的菜品交易特征数据输入上述训练得到的4个子模型,并根据这4个子模型的准确度设置相应的加权重,对这4个菜品交易子模型的输出进行加权平均,得到最终的菜品交易预测值。这种模型融合的方法好处在于预测输出的稳定性比较好。

在本说明书的其它实施例中,也可以使用gbdt,或xgboost等树模型。

针对步骤150:根据所述菜品交易预测值,规划该菜品的备餐方案。

规划备餐方案,是指根据菜品交易量的预测结果,确定该菜品的备餐方案。可选的,该备餐方案包括但不限于以下方式:对于该菜品,根据该菜品的交易量的预测结果并行烧制;对于菜品的原料,根据该菜品的交易量的预测结果,提前准备;根据菜品的交易量的预测结果,确定该菜品的烧制优先级。较好的,也可以在每个菜品的交易量的预测结果基础上,进一步结合该菜品对应的用户数量,确定该菜品的烧制优先级。

可选的,备餐方案包括但不限于每个菜品的:原料份数、菜品优先级,菜品份数,等等。

本说明书的第二实施方式涉及一种商户菜品交易预测及备餐装置,其结构如图2所示,该商户菜品交易预测及备餐装置包括:第一获取模块、训练模块、第二获取模块、预测模块,以及规划模块。具体如下:

第一获取模块,用于获取所述商户历史在多个时间段的菜品交易样本。

可选的,所述菜品交易特征数据包括以下之一或其任意组合:菜品交易量的时序特征、天气特征、时间段特征、商户活动特征、菜品特征。

具体的,所述菜品交易量的时序特征是指所述商户的历史的菜品交易量根据时间变化的特征。可选的,所述菜品交易量的时序特征是以下之一:近期历史的连续的l个固定时长t内的菜品交易量序列,近期历史的连续的l个固定时长t内的菜品交易量序列的加权平均值,近期历史的连续的l个固定时长t内的菜品交易量序列的一阶、二阶差分值。

可选的,所述时间段特征包括一下之一或其任意组合:当前固定时长t所在日期的节假日类型,当前固定时长t所在日期是该星期的第几天以及类型,当前固定时长t在该天的序号以及当前固定时长t所在小时在该天的序号。

可选的,所述商户活动信息包括:商户送券的金额,和/或商户交易价格减免的比例。

训练模块,用于基于所述菜品交易样本的菜品交易特征数据与对应的菜品交易量,训练回归模型。

可选的,所述回归模型是lightgbm模型。

可选的,所述回归模型包括n个子模型,所述训练模块还用于从所述菜品交易样本中随机筛选固定比例数量的样本,设置随机参数种子,分别训练所述m个子模型,确定训练好的各个子模型的训练准确度,从所述m个子模型中挑选n个训练准确度超过预定门限的子模型,其中m≥n>13。

第二获取模块,用于获取商户在待预测时间段对应的菜品交易特征数据。

预测模块,用于将所述菜品交易特征数据作为商户的回归模型的输入,获取该商户在所述待预测时间段的菜品交易预测值。

如上所述,所述回归模型包括n个子模型,所述回归模型输出的预测值是所述n个子模型输出的预测值的加权平均值。具体的,所述将n个子模型输出的预测值加权平均时,每个子模型的权重与该子模型的训练准确度正相关。

规划模块,用于根据所述菜品交易预测值,规划该菜品的备餐方案。

第一实施方式是与本实施方式相对应的方法实施方式,第一实施方式中的技术细节可以应用于本实施方式,本实施方式中的技术细节也可以应用于第一实施方式。

需要说明的是,本领域技术人员应当理解,上述商户菜品交易预测及备餐装置的实施方式中所示的各模块的实现功能可参照前述商户菜品交易预测及备餐方法的相关描述而理解。上述商户菜品交易预测及备餐装置的实施方式中所示的各模块的功能可通过运行于处理器上的程序(可执行指令)而实现,也可通过具体的逻辑电路而实现。本说明书实施例上述商户菜品交易预测及备餐装置如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本说明书各个实施例所述方法的全部或部分。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,readonlymemory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本说明书实施例不限制于任何特定的硬件和软件结合。

相应地,本说明书实施方式还提供一种计算机可读存储介质,其中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现本说明书的各方法实施方式。计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于,相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读存储介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

此外,本说明书实施方式还提供一种商户菜品交易预测及备餐设备,其中包括用于存储计算机可执行指令的存储器,以及,处理器;该处理器用于在执行该存储器中的计算机可执行指令时实现上述各方法实施方式中的步骤。其中,该处理器可以是中央处理单元(centralprocessingunit,简称“cpu”),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,简称“dsp”)、专用集成电路(applicationspecificintegratedcircuit,简称“asic”)等。前述的存储器可以是只读存储器(read-onlymemory,简称“rom”)、随机存取存储器(randomaccessmemory,简称“ram”)、快闪存储器(flash)、硬盘或者固态硬盘等。本发明各实施方式所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。

需要说明的是,在本专利的申请文件中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本专利的申请文件中,如果提到根据某要素执行某行为,则是指至少根据该要素执行该行为的意思,其中包括了两种情况:仅根据该要素执行该行为、和根据该要素和其它要素执行该行为。多个、多次、多种等表达包括2个、2次、2种以及2个以上、2次以上、2种以上。

在本说明书提及的所有文献都被认为是整体性地包括在本说明书的公开内容中,以便在必要时可以作为修改的依据。此外应理解,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1