模型训练及多品订货量预测方法、计算机设备和介质与流程

文档序号:38473540发布日期:2024-06-27 11:32阅读:15来源:国知局
模型训练及多品订货量预测方法、计算机设备和介质与流程

本技术涉及数据处理,特别是涉及一种模型训练及多品订货量预测方法、计算机设备和介质。


背景技术:

1、生鲜门店是指专门销售未经加工或简单加工的新鲜食品的零售商店,这些食品通常包括新鲜蔬菜、水果、肉类、海鲜、奶制品和熟食等。生鲜门店的特点是商品的保质期较短,需要快速流通以保证食品的新鲜度和质量。由于生鲜商品易腐烂,因此这类门店在商品的采购、库存管理、订货策略以及销售策略等方面都面临着特别的挑战。为了让消费者买到更新鲜的商品,一些生鲜门店还采用日清模式。日清模式是指门店当天进的商品必须在当天卖完清空,在日清模式下,所有商品的销售期限都为1天,为了实现日清,生鲜门店会在晚间进行打折销售,到了打烊时间还没卖完的商品则会直接报损。

2、生鲜门店主要依靠店长或店员的人工经验来进行订货,包括确定需要订货的生鲜商品以及各种生鲜商品的需求量(需求量通常就是订货量),然而,人的经验良莠不齐,而且人的算力有限,因此难以实现准确订货。近年来,随着人工智能技术的发展,有不少企业利用基于机器学习、深度学习的数据分析技术来预测市场对特定商品的需求,进而基于预测的需求信息如商品的销售量来进行订货。然而,与其他类别的商品相比,生鲜商品具有季节性强、保质期短、非标准化三大特点,它在销售数据上会呈现出品项时有时无、售价波动大、滞销和畅缺频发等特点,而且,生鲜商品之间有较强的相关性,包括互补性和替代性。目前的商品需求预测方案并未充分考虑到生鲜商品的上述特点,因而还无法实现准确预测生鲜商品的需求。例如,时间序列预测模型是常用的用于预测商品需求的模型,但是,很多生鲜商品在生鲜门店中时有时无,其订货和销售数据在时间轴上也是断断续续的,因此难以直接用时间序列预测模型来预测生鲜商品的需求量。又例如,生鲜商品之间存在相关性,因此商品需求预测领域中常用的单品预测模型无法用于预测生鲜商品的需求,此时需要引入多品预测模型,可是传统的机器学习和深度学习的输入特征是固定的,难以应对品项时有时无的生鲜商品,而如果对历史上所有生鲜商品都构建一个或多个相应的特征,那么特征量将非常庞大,且数据会非常稀疏,这会导致多品预测模型难以进行训练。此外,商品需求预测时通常是预测商品未来的销售量,即以商品的销售量作为商品的需求量,可是生鲜商品存在滞销、畅缺情况频发的特点,这导致生鲜商品的销售量往往不等于需求量,因而如果只是对生鲜商品的销售量进行预测,将得不到真实需求量,而如果要预测多种生鲜商品的需求量,目前的商品需求预测方案则难以实现。


技术实现思路

1、本技术针对上述不足或缺点,提供了一种模型训练及多品订货量预测方法、计算机设备和介质,该方法能够准确预测多种生鲜商品的订货量。

2、本技术根据第一方面提供了一种模型训练方法,在一些实施例中,该方法包括:

3、基于预先从多个生鲜门店采集的多条样本数据构造多条训练样本;

4、构建多品订货量预测模型;

5、使用该多条训练样本对该多品订货量预测模型进行训练;

6、该多品订货量预测模型,用于根据输入的训练样本生成多维度特征,根据该多维度特征构造多个序列单元,根据该多个序列单元构造输入序列;基于自注意力机制将接收到的输入序列转换为第一过渡序列;通过线性变换将第一过渡序列转换为第二过渡序列,从第二过渡序列中提取多品订货量预测信息并输出;该多维度特征包括该训练样本相关的生鲜门店的门店特征、多个门店销售日的日期特征和天气特征、每种订货商品的静态商品特征和包括实际销售进度特征的动态经营特征、每种不订货商品的静态商品特征和动态经营特征。

7、在一些实施例中,使用该多条训练样本对该多品订货量预测模型进行训练,包括:

8、依次按照日期分箱和序列长度分箱的方式将该多条训练样本分为多个批次;

9、确定各个批次的日期,根据各个批次的日期确定各个批次的训练次序;

10、按照各个批次的训练次序依次使用各个批次对该多品订货量预测模型进行训练。

11、在一些实施例中,针对该多品订货量预测模型的每次训练的训练过程,包括:

12、将一批次的训练样本分别输入该多品订货量预测模型;

13、获取该多品订货量预测模型输出的各训练样本相应的多品订货量预测信息;

14、基于各训练样本相应的多品订货量预测信息和多品订货量真实信息计算预测损失;

15、根据预测损失更新该多品订货量预测模型的模型参数。

16、在一些实施例中,根据该多维度特征构造多个序列单元,根据该多个序列单元构造输入序列,包括:

17、将门店特征作为一个序列单元,记为第一序列单元;

18、将每个门店销售日的日期特征和天气特征合并为一个序列单元,记为第二序列单元;第二序列单元的数量与门店销售日的数量相同;

19、将每种订货商品的静态商品特征和包括实际销售进度特征的动态经营特征合并为一个序列单元,记为第三序列单元;第三序列单元的数量与订货商品的种类数量相同;

20、将每种不订货商品的静态商品特征和动态经营特征合并为一个序列单元,记为第四序列单元;第四序列单元的数量与不订货商品的种类数量相同;

21、将第一序列单元、每一第二序列单元、每一第四序列单元与任一第三序列单元进行特征对齐,使得所有序列单元的维度相同,之后根据所有序列单元构造得到输入序列。

22、在一些实施例中,将第一序列单元、每一第二序列单元、每一第四序列单元与任一第三序列单元进行特征对齐,包括:

23、通过第一特征空间对齐变换矩阵处理第一序列单元,使得处理后的第一序列单元的维度与第三序列单元的维度相同;

24、通过第二特征空间对齐变换矩阵处理每个第二序列单元,使得每个处理后的第二序列单元的维度与第三序列单元的维度相同;

25、通过第三特征空间对齐变换矩阵处理每个第四序列单元,使得每个处理后的第四序列单元的维度与第三序列单元的维度相同。

26、在一些实施例中,根据所有序列单元构造得到输入序列,包括:

27、在特征对齐后,将所有序列单元进行堆叠,得到初始输入序列;

28、获取本次训练所用批次的最大序列长度;

29、判断初始输入序列的序列长度是否小于最大序列长度;

30、若是,在初始输入序列中添加填充单元,以获得序列长度等于最大序列长度的输入序列;填充单元的序列长度等于最大序列长度减去初始输入序列的序列长度。

31、在一些实施例中,基于自注意力机制将接收到的输入序列转换为第一过渡序列时,通过预先构建的填充单元掩码机制对输入序列中每个填充单元进行掩码处理,使得每个填充单元的注意力权重近似为0。

32、在一些实施例中,每个门店销售日的日期特征包括节假日类别特征和节假日位置特征,每个门店销售日的节假日类别特征用于表示该门店销售日对应的节假日类别;该节假日类别包括非节假日和多种节假日;对于任一门店销售日,当该门店销售日的节假日类别特征表示该门店销售日对应的节假日类别是任一种节假日时,该门店销售日的节假日位置特征用于表示该门店销售日位于节假日的哪一天。

33、在一些实施例中,基于自注意力机制将接收到的输入序列转换为第一过渡序列时,通过预先构建的日期掩码机制对输入序列中的每种生鲜商品对相应日期位于该种生鲜商品的销售期限之后的日期和天气特征的注意力权重进行掩码处理,使得每种生鲜商品对相应日期位于该种生鲜商品的销售期限之后的日期和天气特征的注意力权重为0。

34、本技术根据第二方面提供了一种多品订货量预测方法,在一些实施例中,该方法包括:

35、获取待预测订货量的多种生鲜商品的最佳销售进度特征;

36、将该多种生鲜商品的最佳销售进度特征输入预先采用如上述任一实施例提供的模型训练方法训练好的多品订货量预测模型;

37、获取该多品订货量预测模型输出的多品订货量预测信息;

38、从该多品订货量预测信息中获取每种生鲜商品的订货量预测值。

39、本技术根据第三方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一实施例中提供的模型训练方法或多品订货量预测方法。

40、本技术根据第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例中提供的模型训练方法或多品订货量预测方法。

41、本技术基于机器翻译场景中的句子的特点和生鲜商品订货场景中的生鲜商品的特点基本相同的发现,将生鲜商品订货问题巧妙地转换为序列到序列的问题,进而能基于机器翻译的处理方式来处理生鲜商品订货问题,并实现多种生鲜商品需求的准确预测。

42、在上述实施例中,预先从多个生鲜门店采集多条样本数据,并基于该多条样本数据构造多条训练样本,进而使用该多条训练样本对基于自注意力机制的多品订货量预测模型进行训练。该多品订货量预测模型能够根据输入的训练样本生成多维度特征,根据该多维度特征构造多个序列单元,根据该多个序列单元构造输入序列;基于自注意力机制将接收到的输入序列转换为第一过渡序列;通过线性变换将第一过渡序列转换为第二过渡序列,从第二过渡序列中提取多品订货量预测信息并输出;其中,输入序列由多维度特征构造得到,该多维度特征包括每种生鲜商品自身的相关特征,还包括生鲜门店的特征、销售日的日期特征和天气特征,进而在序列到序列模型的训练过程中,其可以通过自注意力机制捕捉不同生鲜商品在销售时的相关性,并同时考虑到门店、日期、天气等商品外因素对生鲜商品的销售的协同影响。

43、在一些实施例中,通过将订货商品的静态商品特征和动态经营特征合并为一个序列单元,使得模型能够识别出各动态经营特征分别是哪个生鲜商品的经营特征,而无需将所有生鲜商品的动态经营特征按照固定顺序排列出来,从而降低了系统复杂度。

44、在一些实施例中,在订货商品的相关特征中嵌入销售进度特征,同时使序列到序列模型的输出序列用于确定每种生鲜商品的订货量,并且,在模型训练阶段中采用的实际销售进度特征,而在模型推理阶段则采用最佳销售进度特征,上述的特征设置方式解决了销量不等于需求量的问题,后续可以通过为生鲜商品设置合理的销售进度特征来得到合理的生鲜商品的订货量。还值得指出的是,本实施例可以预测不同销售期限的生鲜商品的订货量,因而不管生鲜门店采用日清模式或是非日清模式,都可以采用本实施例来准确预测多种生鲜商品的订货量。

45、在一些实施例中,采用小批次训练的方式来训练多品订货量预测模型,其中,在对多条训练样本进行分批时,依次按照日期分箱和序列长度分箱的方式来实现分批,即先采用日期分箱方式进行分批,再采用序列长度分箱方式做进一步的分批,从而把日期相近的样本输入序列放在同一批次中进行训练,将序列长度相似的放在同一批次中进行训练,并在训练时,先使用对应日期较早的批次数据进行训练,而再使用对应日期较近的批次数据进行训练,从而进一步地提升模型训练的效率和效果。

46、在一些实施例中,为了便于批次训练,在完成分批操作后,在每个批次中的每条序列长度小于该批次的最大序列长度的初始输入序列中添加填充单元,使得每个批次中的每条初始输入序列的序列长度等于该批次的最大序列长度。

47、同时,在一些实施例中,利用掩码机制为填充单元设置相应的注意力掩码(可称为填充单元掩码),以使每个填充单元的注意力权重近似为0,从而解决同一批次数据中的门店订货商品不同、订货商品数量不同的问题。进一步地,通过构建日期掩码机制来使每种生鲜商品对相应日期位于该种生鲜商品的销售期限之后1到天内的日期和天气特征的注意力权重为0,以此解决了不同生鲜商品因销售期限不同而受不同日期的节假日和天气影响的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1