1.本公开涉及人工智能技术领域,具体为深度学习、智能调度技术领域,尤其涉及运输调度方法、装置、电子设备和存储介质。
背景技术:2.近年来,随着社会的不断发展,运输已经成为物品流通的一个重要环节。在通过多个运输工具比如车辆或者轮船等运输物品时,如何减少运输过程中的运输成本是很重要的。
技术实现要素:3.本公开提供了一种运输调度方法、装置、电子设备和存储介质。
4.根据本公开的一方面,提供了一种运输调度方法,所述方法包括:获取多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束;其中,所述目标函数表示多个所述运输工具在资源上的不平衡性;基于多个所述物品的属性信息、多个所述运输工具的属性信息、所述目标函数以及所述约束,采用机器学习模型确定满足所述约束且使得所述目标函数最小化的情况下,至少一个所述物品放入各所述运输工具的第一置信度,以基于至少一个所述物品放入各所述运输工具的第一置信度,确定所述多个物品与所述多个运输工具之间的对应关系;在所述对应关系的目标函数取值满足设定阈值的情况下,将所述对应关系确定为所述多个物品与所述多个运输工具之间的目标运输关系。
5.根据本公开的另一方面,提供了一种用于运输调度的机器学习模型的训练方法,所述方法包括:获取多个训练样本,其中,至少一个所述训练样本包括多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束;所述目标函数表示多个所述样本运输工具在资源上的不平衡性;对于至少一个所述训练样本,基于其中多个所述样本物品的属性信息、多个所述样本运输工具的属性信息、所述目标函数以及所述约束,采用机器学习模型确定满足所述约束且使得所述目标函数最小化的情况下,至少一个所述样本物品放入各所述样本运输工具的第三置信度;基于至少一个所述训练样本中至少一个所述样本物品放入各所述样本运输工具的第三置信度,对所述机器学习模型进行训练。
6.根据本公开的另一方面,提供了一种运输调度装置,所述装置包括:第一获取模块,用于获取多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束;其中,所述目标函数表示多个所述运输工具在资源上的不平衡性;第一确定模块,用于基于多个所述物品的属性信息、多个所述运输工具的属性信息、所述目标函数以及所述约束,采用机器学习模型确定满足所述约束且使得所述目标函数最小化的情况下,至少一个所述物品放入各所述运输工具的第一置信度,以基于至少一个所述物品放入各所述运输工具的第一置信度,确定所述多个物品与所述多个运输工具之间的对应关系;第二确定模块,用于在所述对应关系的目标函数取值满足设定阈值的情况下,将所述对应关系确定为所述多个物品与所述多个运输工具之间的目标运输关系。
7.根据本公开的另一方面,提供了一种用于运输调度的机器学习模型的训练装置,所述装置包括:第二获取模块,用于获取多个训练样本,其中,至少一个所述训练样本包括多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束;所述目标函数表示多个所述样本运输工具在资源上的不平衡性;第三确定模块,用于对于至少一个所述训练样本,基于其中多个所述样本物品的属性信息、多个所述样本运输工具的属性信息、所述目标函数以及所述约束,采用机器学习模型确定满足所述约束且使得所述目标函数最小化的情况下,至少一个所述样本物品放入各所述样本运输工具的第三置信度;训练模块,用于基于至少一个所述训练样本中至少一个所述样本物品放入各所述样本运输工具的第三置信度,对所述机器学习模型进行训练。
8.根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的运输调度方法,或者执行本公开的用于运输调度的机器学习模型的训练方法。
9.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开实施例公开的运输调度方法,或者执行本公开实施例公开的用于运输调度的机器学习模型的训练方法。
10.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开的运输调度方法的步骤,或者实现本公开的用于运输调度的机器学习模型的训练方法的步骤。
11.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
12.附图用于更好地理解本方案,不构成对本公开的限定。其中:
13.图1是根据本公开第一实施例的运输调度方法的流程示意图;
14.图2是根据本公开第二实施例的运输调度方法的流程示意图;
15.图3是根据本公开第二实施例的运输调度方法的架构图;
16.图4是根据本公开第三实施例的运输调度方法的流程示意图;
17.图5是根据本公开第四实施例的用于运输调度的机器学习模型的训练方法的流程示意图;
18.图6是根据本公开第五实施例的用于运输调度的机器学习模型的训练方法的流程示意图;
19.图7是根据本公开第六实施例的运输调度装置的结构示意图;
20.图8是根据本公开第七实施例的用于运输调度的机器学习模型的训练装置的结构示意图;
21.图9是用来实现本公开实施例的运输调度方法或用于运输调度的机器学习模型的训练方法的电子设备的框图。
具体实施方式
22.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
23.可以理解的是,运输工具比如车辆或者轮船等具有多种资源,比如重量上的资源,即运输工具能够承载的重量,或者空间上的资源,即运输工具具有的空间,以及其它种类的资源。物品也具有多种资源,比如重量上的资源,即物品的重量,或者空间上的资源,即物品所占的空间,以及其它种类的资源。
24.以重量上的资源为例,假设运输工具为轮船,轮船的数量为2,2艘轮船在重量上的资源均为10吨,所有待运输的物品在重量上的资源为10吨。在通过多个运输工具运输多个物品时,若多个运输工具的整体资源不平衡,比如一艘轮船装载9吨的物品,而另一艘轮船装载1吨的物品,则会导致装载1吨物品的轮船的资源利用率低、存在空跑的情况,而装载9吨物品的轮船在运输过程中的燃料消耗过快,且会增加其它如换船、救援等意外成本,从而运输过程中的运输成本高。
25.为了减少运输过程中的运输成本,需要合理分配资源,保证各个运输工具的整体资源的平衡性,这就需要在通过多个运输工具运输多个物品时,决策将各个物品装载在哪个运输工具上,以保证各个运输工具的整体资源的不平衡性最小。
26.相关技术,为了决策将各个物品装载在哪个运输工具上,可以使用求解器比如scip(solving constraint integer programs,求解约束整数规划)来进行该问题的求解。用户可以将求解过程所需的信息输入到求解器中,并设置求解器参数,求解器可以根据用户的设置自动调用诸如近邻搜索等内部启发式算法求解问题的可行解,直到求解结束。这种方式耗费的时间较长。相关技术为了提高效率,对于每个物品和每个运输工具,可以使用二分类模型来预测该物品是否放入该运输工具的概率,进而根据这些概率来快速确定各个物品与运输工具的对应关系。然而,这种方式中的二分类模型预测的是一个物品是否放入一个运输工具的概率,在输入模型的特征较为相似时极易造成预测的概率在0.5附近徘徊,进而导致模型的预测结果接近于随机猜测,使最后确定的多个物品与多个运输工具之间的对应关系不准确。
27.本公开实施例提供一种能够合理分配资源,保证各个运输工具的整体资源的平衡性,从而减少运输过程中的运输成本的运输调度方法和用于运输调度的机器学习模型的训练方法。其中运输调度方法包括:获取多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束;其中,目标函数表示多个运输工具在资源上的不平衡性;基于多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个物品放入各运输工具的第一置信度,以基于至少一个物品放入各运输工具的第一置信度,确定多个物品与多个运输工具之间的对应关系;在对应关系的目标函数取值满足设定阈值的情况下,将对应关系确定为多个物品与多个运输工具之间的目标运输关系。由此,能够保证多个运输工具在资源上的不平衡性最小,从而减少运输过程中的运输成本。
28.本公开提供的运输调度方法、用于运输调度的机器学习模型的训练方法、装置、电
子设备、非瞬时计算机可读存储介质以及计算机程序产品,涉及人工智能技术领域,具体为深度学习、智能调度技术领域。
29.其中,人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
30.深度学习,是机器学习领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
31.下面参考附图描述本公开实施例的运输调度方法、用于运输调度的机器学习模型的训练方法、装置、电子设备、非瞬时计算机可读存储介质以及计算机程序产品。
32.需要说明的是,本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
33.首先对本公开实施例提供的运输调度方法进行说明。
34.图1是根据本公开第一实施例的运输调度方法的流程示意图。其中,需要说明的是,本实施的运输调度方法,执行主体为运输调度装置,该运输调度装置可以由软件和/或硬件实现,该运输调度装置可以配置在电子设备中,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。
35.如图1所示,该运输调度方法可以包括:
36.步骤101,获取多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束;其中,目标函数表示多个运输工具在资源上的不平衡性。
37.其中,物品,为需要运输的任意物品,比如物品可以为装有食品的箱子、或者装有衣物的袋子等,本公开实施例对此不作限制。
38.物品的属性信息,可以包括与物品有关的任意属性信息,比如物品的数量信息、物品所占空间的大小和物品的重量等资源信息,本公开对此不作限制。
39.运输工具,为能够运输物品的任意工具,比如运输工具可以为轮船、车辆等,本公开实施例对此不作限制。
40.运输工具的属性信息,可以包括与运输工具有关的任意属性信息,比如运输工具的数量信息、运输工具具有的空间和可以承载的重量等资源的容量信息,本公开对此不作限制。
41.目标函数,为将多个物品放入多个运输工具时,需要实现的目标与相关因素之间的函数关系。本公开实施例中的目标函数表示多个运输工具在资源上的不平衡性,可以用于指示多个物品与多个运输工具之间的目标运输关系的最优解,比如,使目标函数取值最小的解为最优解。其中,多个物品与多个运输工具之间的目标运输关系,指示将各个物品装载在哪个运输工具上进行运输。
42.约束,为将多个物品放入多个运输工具时,必须遵守的限制条件。比如,所有物品中的每个物品必须仅仅放到一个运输工具上、每个运输工具上承载的物品的资源量不能超
过该运输工具能够承载的资源总量等。
43.步骤102,基于多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个物品放入各运输工具的第一置信度,以基于至少一个物品放入各运输工具的第一置信度,确定多个物品与多个运输工具之间的对应关系。
44.其中,第一置信度,表示物品放入运输工具的可能性大小。
45.机器学习模型,可以为任意的能够进行多分类的神经网络模型,本公开对此不作限制。
46.在示例实施例中,对于至少一个物品,可以从多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束中提取特征信息,并将特征信息输入机器学习模型,从而采用机器学习模型,基于多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束,预测满足约束且使得目标函数最小化的情况下,该物品放入各运输工具的第一置信度。
47.在示例实施例中,在确定至少一个物品放入各运输工具的第一置信度后,对于该至少一个物品中的任一物品,可以将该物品放入各运输工具的第一置信度中,对应的第一置信度最高且大于预设置信度阈值的运输工具确定为该物品对应的目标运输工具,从而确定该至少一个物品与多个运输工具之间的对应关系。由此,在该至少一个物品的数量为所有物品的总数量时,即可确定多个物品与多个运输工具之间的对应关系。另外,在至少一个物品的数量少于所有物品的总数量时,对于所有物品中除该至少一个物品之外的其它物品,可以利用求解器确定其它物品对应的目标运输工具,或者根据经验确定其它物品对应的目标运输工具,或者通过其它方式确定其它物品对应的目标运输工具,本公开实施例对此不作限制。
48.步骤103,在对应关系的目标函数取值满足设定阈值的情况下,将对应关系确定为多个物品与多个运输工具之间的目标运输关系。
49.其中,设定阈值,为预先设定的目标函数取值需要满足的阈值,可以根据需要任意设置,本公开实施例对此不作限制。
50.其中,目标函数取值,即多个运输工具在资源上的不平衡值。
51.在示例实施例中,在基于至少一个物品放入各运输工具的第一置信度,确定多个物品与多个运输工具之间的对应关系后,可以确定该对应关系的目标函数取值,在目标函数取值小于设定阈值的情况下,可以将该对应关系确定为多个物品与多个运输工具之间的目标运输关系。由此,可以确定满足约束且使得目标函数最小化并且目标函数取值满足设定阈值的情况下,多个物品与多个运输工具之间的目标运输关系。
52.本公开实施例提供的运输调度方法,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个物品放入各运输工具的第一置信度,进而基于至少一个物品放入各运输工具的第一置信度,确定多个物品与多个运输工具之间的对应关系,在对应关系的目标函数取值满足设定阈值的情况下,将对应关系确定为多个物品与多个运输工具之间的目标运输关系,相比相关技术中通过二分类模型预测每个物品是否放入每个运输工具的概率,来确定多个物品与多个运输工具之间的运输关系的方式,可以使得机器学习模型避免惰性随机猜测来进行预测,真正让模型学习到问题内部的知识,提高模型的预测能力,得到更准确的目标运输关系,从而最大程度的保证运输过程中各个运输工具的整体资
源的平衡性,减少运输过程中的运输成本。并且本公开实施例提供的运输调度方法,相比通过求解器进行求解的方式,无需根据用户的设置自动调用诸如近邻搜索等内部启发式算法求解问题的可行解,直到求解结束,能够快速的确定多个物品与多个运输工具之间的目标运输关系,效率高,且基于机器学习模型得到的多个物品与多个运输工具之间的对应关系更准确。
53.综上,本公开实施例提供的运输调度方法,获取多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束;其中,目标函数表示多个运输工具在资源上的不平衡性;基于多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个物品放入各运输工具的第一置信度,以基于至少一个物品放入各运输工具的第一置信度,确定多个物品与多个运输工具之间的对应关系;在对应关系的目标函数取值满足设定阈值的情况下,将对应关系确定为多个物品与多个运输工具之间的目标运输关系。由此,能够保证多个运输工具在资源上的不平衡性最小,从而减少运输过程中的运输成本。
54.下面结合图2,对本公开提供的运输调度方法中,基于多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个物品放入各运输工具的第一置信度的过程,以及基于至少一个物品放入各运输工具的第一置信度,确定多个物品与多个运输工具之间的对应关系的过程进行进一步说明。
55.图2是根据本公开第二实施例的运输调度方法的流程示意图。如图2所示,运输调度方法,可以包括以下步骤:
56.步骤201,获取多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束;其中,目标函数表示多个运输工具在资源上的不平衡性。
57.其中,步骤201的相关说明可以参考步骤101,此处不再赘述。
58.步骤202,将多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束输入求解器,以通过求解器获取多个第一变量x
i,b
对应的第一特征向量、多个第二变量y
b,r
对应的第二特征向量以及约束对应的第三特征向量。
59.其中,第一变量x
i,b
表示是否将第i个物品放入第b个运输工具,第二变量y
b,r
表示第b个运输工具在第r种资源上的不平衡值,i为1至i之间的整数,b为1至b之间的整数,r为1至r之间的整数,i为物品的数量、b为运输工具的数量、r为资源的种类数量,i、b和r为大于或等于1的整数。
60.其中,第一变量x
i,b
为二进制变量。在第一变量的取值为1时,可以表示将第i个物品放入第b个运输工具;在第一变量的取值为0时,可以表示不将第i个物品放入第b个运输工具。即对于任意的i和b,第一变量x
i,b
的取值可以包括0和1。
61.第二变量y
b,r
可以表示归一化后的第b个运输工具在第r种资源上的不平衡值。即,对于任意的b和r,第二变量y
b,r
的取值可以为大于等于0且小于等于1的数。
62.需要说明的是,获取第二变量后,还可以基于第二变量的第二特征向量,获取第三变量zr对应的特征向量。其中,第三变量zr可以表示归一化后的第r种资源在所有运输工具上的不平衡值的最大值。相应的,第三变量的取值可以为大于等于0且小于等于1的数。
63.将多个物品放入多个运输工具的约束,可以包括以下4个约束:
64.一、所有的物品必须仅仅放到一个运输工具上:
65.即
66.二、运输工具上装载的物品的资源不能超过该运输工具的资源容量:
[0067][0068]
其中,size
i,r
表示第i个物品所需的第r个资源的量,为常量;capacity
b,r
表示第b个运输工具的第r个资源的量,为常量。
[0069]
三、第b个运输工具在第r种资源上的不平衡值满足以下公式(3):
[0070][0071]
四、每个不平衡值小于最大不平衡值:
[0072][0073]
目标函数可以为:
[0074]b×r×
∑rzr+∑
b,ryb,r
ꢀꢀꢀꢀ
(5)
[0075]
第一特征向量,用于表示第一变量的特征信息;第二特征向量,用于表示第二变量的特征信息;第三特征向量,用于表示约束的特征信息。其中,特征信息,比如可以包括上述约束中等号左侧的值,约束中的参数,等号右侧的值等。
[0076]
在示例实施例中,可以将多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束输入求解器,以通过求解器执行多轮迭代,求解多个物品与多个运输工具之间的对应关系。在求解器求解的过程中,可以进行初始化,从多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束中提取一些特征,从而得到多个第一变量x
i,b
对应的第一特征向量、多个第二变量y
b,r
对应的第二特征向量以及约束对应的第三特征向量。另外,为了丰富第一变量、第二变量和约束的特征信息,还可以在求解器通过一轮迭代,得到多个物品与多个运输工具之间的一个对应关系时,结合该对应关系以及已经提取的特征,得到多个第一变量x
i,b
对应的第一特征向量、多个第二变量y
b,r
对应的第二特征向量以及约束对应的第三特征向量。
[0077]
其中,约束的第三特征向量的数量,可以为一个或多个,本公开实施例对此不作限制。
[0078]
求解器,可以为任意的能够用于求解混合整数优化问题的求解工具,本公开实施例对此不作限制。
[0079]
步骤203,基于各第一特征向量、各第二特征向量以及第三特征向量,采用机器学习模型,确定至少一个物品放入各运输工具的第一置信度。
[0080]
在示例实施例中,可以将各第一变量对应的第一特征向量、各第二变量对应的第二特征向量以及约束对应的第三特征向量输入机器学习模型,以通过机器学习模型预测至少一个物品放入各运输工具的第一置信度。在示例实施例中,也可以将各第一变量对应的第一特征向量、各第二变量对应的第二特征向量、第三变量对应的特征向量以及约束对应的第三特征向量输入机器学习模型,以通过机器学习模型预测至少一个物品放入各运输工具的第一置信度。
[0081]
在示例实施例中,机器学习模型可以包括依次连接的特征提取模块和归一化模
块;相应的,步骤203可以通过以下方式实现:将各第一特征向量、各第二特征向量以及第三特征向量输入特征提取模块,以通过特征提取模块,将各第一变量对应的第一特征向量,与输入特征提取模块的特征向量中除第一特征向量之外的其它特征向量融合,得到各第一变量对应的第四特征向量,并将各第一变量对应的第四特征向量以目标顺序组合,得到第一向量矩阵;将第一向量矩阵输入归一化模块,以通过归一化模块确定至少一个物品放入各运输工具的第一置信度。
[0082]
其中,目标顺序,为将各第一变量对应的第四特征向量进行组合得到第一向量矩阵时的顺序,可以根据需要预先设置。比如,目标顺序可以为,第一变量x
i,b
对应的第四特征向量,为第一向量矩阵中的第i行第b列元素。
[0083]
在示例实施例中,特征提取模块可以包括依次连接的输入层、图卷积神经网络层、全连接层和激活层。在示例实施例中,可以将各第一特征向量、各第二特征向量以及第三特征向量输入输入层,从而通过输入层对各第一特征向量、各第二特征向量以及第三特征向量进行整合,将各特征向量映射到相同的维度,得到各第一变量、各第二变量和约束各自对应的相同维度的特征向量。接着,可以将输入层输出的各第一变量、各第二变量和约束各自对应的相同维度的特征向量输入图卷积神经网络层,以通过图卷积神经网络层,根据各第一变量、各第二变量和约束各自对应的相同维度的特征向量,捕获变量与变量之间的关系、变量与约束之间的关系的特征,再将捕获的这些特征融合到第一变量对应的特征向量上,进而通过全连接层和激活层,提取第一变量的特征中的非线性的特征,得到各第一变量的第四特征向量,进而可以将各第四特征向量以目标顺序组合,得到第一向量矩阵。在得到第一向量矩阵后,可以将第一向量矩阵输入归一化模块,以通过归一化模块,对于至少一个物品,基于表示该物品是否放入各个运输工具的各第一变量的第四特征向量,确定该物品放入各运输工具的第一置信度。其中,激活层中所利用的激活函数,可以为relu(linear rectification function,线性整流函数)或其它激活函数,此处不作限制。
[0084]
由于对于各第一变量,机器学习模型结合该第一变量的特征信息、其它第一变量的特征信息、第二变量的特征信息以及约束的特征信息得到该第一变量对应的第四特征向量,可以获取该第一变量的更丰富的特征信息,进而对于至少一个物品,基于表示该物品是否放入各个运输工具的各第一变量的第四特征向量,可以准确确定该物品放入各运输工具的第一置信度。
[0085]
在示例实施例中,特征提取模块可以包括依次连接的特征提取层和矩阵变换层,相应的,将各第一特征向量、各第二特征向量以及第三特征向量输入特征提取模块,以通过特征提取模块,将各第一变量对应的第一特征向量,与输入特征提取模块的特征向量中除第一特征向量之外的其它特征向量融合,得到各第一变量对应的第四特征向量,可以包括:将各第一特征向量、各第二特征向量以及第三特征向量输入特征提取层,以通过特征提取层,将各第一变量对应的第一特征向量,与输入特征提取模块的特征向量中除第一特征向量之外的其它特征向量融合,得到各第一变量对应的第四特征向量,并将各第二变量对应的第二特征向量,与输入特征提取模块的特征向量中除第二特征向量之外的其它特征向量融合,得到各第二变量对应的第五特征向量,以及将各第一变量对应的第四特征向量和各第二变量对应的第五特征向量以初始顺序组合,得到第二向量矩阵;获取存储有各第四特征向量和各第五特征向量在第二向量矩阵中的位置信息的映射关系表;将第二向量矩阵和
映射关系表输入矩阵变换层,以基于位置信息,从第二向量矩阵中获取各第一变量对应的第四特征向量。
[0086]
其中,初始顺序,可以为求解器输出各第一变量对应的第一特征向量和各第二变量对应的第二特征向量时,各第一变量对应的第一特征向量和各第二变量对应的第二特征向量的排列顺序。
[0087]
其中,参考图3,机器学习模型可以包括特征提取层。其中,特征提取层可以包括依次连接的输入子层31、图卷积神经网络子层32、全连接子层33和激活子层34。另外,机器学习模模型还包括与激活子层34连接的矩阵变换层35,以及与矩阵变换层35连接的归一化模块36。
[0088]
在示例实施例中,可以将求解器30输出的各第一特征向量、各第二特征向量以及第三特征向量等特征向量输入到输入子层31中,从而通过输入子层31对各第一特征向量、各第二特征向量以及第三特征向量进行整合,将各特征向量映射到相同的维度,得到各第一变量、各第二变量和约束各自对应的相同维度的特征向量。接着,可以将输入子层31输出的各第一变量、各第二变量和约束各自对应的相同维度的特征向量输入图卷积神经网络子层31,以通过图卷积神经网络子层31,根据各第一变量、各第二变量和约束各自对应的相同维度的特征向量,捕获变量与变量之间的关系、变量与约束之间的关系的特征,再将捕获的这些特征融合到第一变量对应的特征向量上,以及将捕获的这些特征融合到第二变量对应的特征向量上,进而通过全连接子层33和激活子层34,提取第一变量的特征中的非线性的特征,得到各第一变量的第四特征向量,以及通过全连接子层33和激活子层34,提取第二变量的特征中的非线性的特征,得到各第二变量的第五特征向量。进而可以将各第四特征向量和各第五特征向量以初始顺序组合,得到第二向量矩阵。
[0089]
可以理解的是,在求解器输出各第一变量对应的第一特征向量和各第二变量对应的第二特征向量时,运输调度装置可以从求解器中获取到存储有各第一特征向量和各第二特征向量的排列顺序的映射关系表,该映射关系表中的各第一特征向量和各第二特征向量的排列顺序,可以指示各第一变量对应的第四特征向量和各第二变量对应的第五特征向量在第二向量矩阵中的位置信息。进而将第二向量矩阵和映射关系表输入矩阵变换层35后,矩阵变换层35可以根据映射关系表中存储的各第四特征向量和各第五特征向量在第二向量矩阵中的位置信息,从第二向量矩阵中获取各第一变量对应的第四特征向量,进而可以将各第四特征向量以目标顺序组合,得到第一向量矩阵。
[0090]
举例来说,假设对于某个第一变量x
2,5
,按照目标顺序,第一变量x
2,5
对应的第四特征向量,为第一向量矩阵中的第2行第5列元素,而根据映射关系表中的位置信息,第一变量x
2,5
对应的第四特征向量,为第二向量矩阵中的第一个元素。则可以根据位置信息,从第二向量矩阵中获取该第一变量x
2,5
对应的第四特征向量,并将该第一变量x
2,5
对应的第四特征向量置于第一向量矩阵中的第2行第5列。
[0091]
在得到第一向量矩阵后,可以将第一向量矩阵输入归一化模块36,以通过归一化模块36,对于至少一个物品,基于表示该物品是否放入各个运输工具的各第一变量的第四特征向量,确定该物品放入各运输工具的第一置信度。
[0092]
由此,可以在机器学习模型中特征提取层获取的各第一变量对应的第四特征向量以任意顺序排列时,通过矩阵变换层,得到各第一变量对应的第四特征向量以目标顺序排
列的第一向量矩阵,为归一化模块基于第一向量矩阵准确确定至少一个物品放入各运输工具的第一置信度奠定基础。
[0093]
步骤204,基于至少一个物品放入各运输工具的第一置信度,确定至少一个物品中至少一个目标物品对应的第一目标运输工具。
[0094]
在示例实施例中,可以预先设置置信度阈值,并对于至少一个物品中的任一物品,在该物品放入各运输工具的第一置信度中,存在大于置信度阈值的第一置信度时,将该大于置信度阈值的第一置信度对应的运输工具,确定为该物品对应的第一目标运输工具,相应的,该物品称为目标物品。
[0095]
举例来说,假设置信度阈值为0.9,运输工具的数量为4。对于第3个物品,放入第1个运输工具的第一置信度为0.01、放入第2个运输工具的第一置信度为0.02、放入第3个运输工具的第一置信度为0.95、放入第4个运输工具的第一置信度为0.02。由于0.95大于0.9,则可以将第3个物品称为目标物品,并将第3个运输工具,确定为第3个物品对应的第一目标运输工具。
[0096]
步骤205,将多个物品的属性信息、多个运输工具的属性信息、目标函数、约束以及至少一个目标物品对应的第一目标运输工具,输入求解器,以通过求解器,确定多个物品中除至少一个目标物品外的其它物品对应的第二目标运输工具。
[0097]
步骤206,基于至少一个目标物品对应的第一目标运输工具,以及其它物品对应的第二目标运输工具,确定多个物品与多个运输工具之间的对应关系。
[0098]
在示例实施例中,可以根据机器学习模型确定的至少一个物品放入各运输工具的第一置信度,确定部分物品与部分运输工具的对应关系,再通过求解器,确定多个物品中其它物品与其它运输工具的对应关系,进而得到多个物品与多个运输工具之间的对应关系。
[0099]
具体的,对于各目标物品,可以基于该目标物品对应的第一目标运输工具,确定该目标物品对应的多个第一变量的取值,进而将已确定了这些第一变量对应的取值的子问题作为全新的混合整数优化问题,输入求解器中进行求解。由于大量的第一变量的取值已经确定了,子问题的搜索空间会变小,削减了问题的规模,因此让求解器求解子问题会更加容易,从而可以更加快速地求解出一个较好的可行解。
[0100]
举例来说,假设运输工具的数量为4。对于第3个物品,该物品对应的第一变量包括x
3,1
、x
3,2
、x
3,3
、x
3,4
,分别表示是否将第3个物品放入第1个运输工具、第2个运输工具、第3个运输工具、第4个运输工具。假设确定第3个物品对应第3个运输工具,则可以将x
3,3
的取值确定为1,将x
3,1
、x
3,2
、x
3,4
的取值确定为0,从而将已确定了这些第一变量对应的取值的子问题作为全新的混合整数优化问题,输入求解器中进行求解。
[0101]
步骤207,在对应关系的目标函数取值满足设定阈值的情况下,将对应关系确定为多个物品与多个运输工具之间的目标运输关系。
[0102]
综上,本公开实施例提供的运输调度方法,通过获取多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束,其中,目标函数表示多个运输工具在资源上的不平衡性,将多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束输入求解器,以通过求解器获取多个第一变量x
i,b
对应的第一特征向量、多个第二变量y
b,r
对应的第二特征向量以及约束对应的第三特征向量,基于各第一特征向量、各第二特征向量以及第三特征向量,采用机器学习模型,确定至少一个物品放入各运输工具的第一置信度,可以使得机
器学习模型基于求解器确定的多个第一变量对应的第一特征向量、多个第二变量对应的第二特征向量以及约束对应的第三特征向量进行预测,避免惰性随机猜测来进行预测,真正让模型学习到问题内部的知识,提高模型的预测能力,从而准确确定至少一个物品放入各运输工具的第一置信度。通过基于至少一个物品放入各运输工具的第一置信度,确定至少一个物品中至少一个目标物品对应的第一目标运输工具,将多个物品的属性信息、多个运输工具的属性信息、目标函数、约束以及至少一个目标物品对应的第一目标运输工具,输入求解器,以通过求解器,确定多个物品中除至少一个目标物品外的其它物品对应的第二目标运输工具,基于至少一个目标物品对应的第一目标运输工具,以及其它物品对应的第二目标运输工具,确定多个物品与多个运输工具之间的对应关系,可以使得输入求解器中的问题规模缩小,从而快速确定多个物品与多个运输工具之间的对应关系。
[0103]
在一种可能的实现形式中,确定多个物品与多个运输工具之间的对应关系后,可能出现对应关系的目标函数取值不满足设定阈值的情况。下面结合图4,针对上述情况,对本公开提供的运输调度方法进行进一步说明。
[0104]
图4是根据本公开第三实施例的运输调度方法的流程示意图。如图4所示,运输调度方法,可以包括以下步骤:
[0105]
步骤401,获取多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束;其中,目标函数表示多个运输工具在资源上的不平衡性。
[0106]
步骤402,将多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束输入求解器,以通过求解器获取多个第一变量x
i,b
对应的第一特征向量、多个第二变量y
b,r
对应的第二特征向量以及约束对应的第三特征向量。
[0107]
其中,第一变量x
i,b
表示是否将第i个物品放入第b个运输工具,第二变量y
b,r
表示第b个运输工具在第r种资源上的不平衡值,i为1至i之间的整数,b为1至b之间的整数,r为1至r之间的整数,i为物品的数量、b为运输工具的数量、r为资源的种类数量,i、b和r为大于或等于1的整数。
[0108]
步骤403,基于各第一特征向量、各第二特征向量以及第三特征向量,采用机器学习模型,确定至少一个物品放入各运输工具的第一置信度。
[0109]
步骤404,基于至少一个物品放入各运输工具的第一置信度,确定至少一个物品中至少一个目标物品对应的第一目标运输工具。
[0110]
步骤405,将多个物品的属性信息、多个运输工具的属性信息、目标函数、约束以及至少一个目标物品对应的第一目标运输工具,输入求解器,以通过求解器,确定多个物品中除至少一个目标物品外的其它物品对应的第二目标运输工具。
[0111]
步骤406,基于至少一个目标物品对应的第一目标运输工具,以及其它物品对应的第二目标运输工具,确定多个物品与多个运输工具之间的对应关系。
[0112]
其中,步骤401-406的具体实现过程及原理,可以参考上述实施例的描述,此处不再赘述。
[0113]
步骤407,在对应关系的目标函数取值不满足设定阈值的情况下,执行至少一轮迭代,直至对应关系的目标函数取值满足设定阈值。
[0114]
在示例实施例中,在步骤406中确定多个物品与多个运输工具之间的对应关系后,可以确定对应关系的目标函数取值,并在对应关系的目标函数取值不满足设定阈值的情况
下,执行至少一轮迭代,在各轮迭代中确定多个物品与多个运输工具之间的对应关系,以及对应关系的目标函数取值,直至对应关系的目标函数取值满足设定阈值。
[0115]
其中,在至少一轮迭代中,基于历史迭代中确定的多个物品与多个运输工具之间的对应关系,更新上一轮迭代中获取的各第一特征向量、各第二特征向量以及第三特征向量,并基于更新后的各第一特征向量、各第二特征向量以及第三特征向量,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个物品放入各运输工具的第二置信度,以基于至少一个物品放入各运输工具的第二置信度,确定多个物品与多个运输工具之间的对应关系。
[0116]
其中,第二置信度,表示物品放入运输工具的可能性大小。
[0117]
在示例实施例中,基于历史迭代中确定的多个物品与多个运输工具之间的对应关系,更新上一轮迭代中获取的各第一特征向量、各第二特征向量以及第三特征向量的过程,可以为:在上一轮迭代中,通过求解器从多个物品的属性信息、多个运输工具的属性信息、目标函数、约束以及至少一个目标物品对应的第一目标运输工具这些信息中提取一些特征,并结合历史迭代中确定的多个物品与多个运输工具之间的对应关系,得到更新后的各第一特征向量、各第二特征向量以及第三特征向量。
[0118]
在示例实施例中,各第一特征向量,或各第二特征向量,或各第一特征向量和各第二特征向量所表示的对应变量的特征信息中,可以包括以下信息中的至少一种:对应变量在历史迭代中的取值、对应变量在历史迭代中取值的改变次数、对应变量在历史迭代中取值次数最多的值、对应变量在历史迭代中取值的最大值、对应变量在历史迭代中取值的最小值、对应变量是否为稳定变量。
[0119]
上述信息可以较好的表达一个变量的取值特点,有利于机器学习模型捕获更深层次的特征并用于置信度的预测。由此,通过在各第一特征变量和/或各第二特征变量所表示的对应变量的特征信息中包括上述信息,可以有针对性的提取变量的特征信息,并且丰富变量的特征信息,进而机器学习模型可以基于更丰富、更深层次的特征信息进行置信度的预测,提高模型预测的准确性。
[0120]
其中,稳定变量,为在历史迭代中的取值不变或者变化次数少于预设次数阈值的变量。
[0121]
需要说明的是,在各轮迭代中,基于更新后的各第一特征向量、各第二特征向量以及第三特征向量,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个物品放入各运输工具的第二置信度,以基于至少一个物品放入各运输工具的第二置信度,确定多个物品与多个运输工具之间的对应关系的过程,与步骤403-406的过程类似,此处不再赘述。
[0122]
步骤408,在对应关系的目标函数取值满足设定阈值的情况下,将对应关系确定为多个物品与多个运输工具之间的目标运输关系。
[0123]
综上,本公开实施例提供的运输调度方法,通过确定多个物品与多个运输工具之间的对应关系后,在对应关系的目标函数取值不满足设定阈值的情况下,执行至少一轮迭代,直至对应关系的目标函数取值满足设定阈值,在对应关系的目标函数取值满足设定阈值的情况下,将对应关系确定为多个物品与多个运输工具之间的目标运输关系,实现了通过多轮迭代,确定目标函数取值满足设定阈值的情况下,多个物品与多个运输工具之间的
目标运输关系的最优解。
[0124]
在示例实施例中,还提供一种用于运输调度的机器学习模型的训练方法。图5是根据本公开第四实施例的用于运输调度的机器学习模型的训练方法的流程示意图。
[0125]
其中,需要说明的是,本公开实施例提供的用于运输调度的机器学习模型的训练方法,执行主体为用于运输调度的机器学习模型的训练装置,以下简称训练装置。该训练装置可以由软件和/或硬件实现,该训练装置可以配置在电子设备中,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。
[0126]
如图5所示,用于运输调度的机器学习模型的训练方法,可以包括以下步骤:
[0127]
步骤501,获取多个训练样本,其中,至少一个训练样本包括多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束;目标函数表示多个样本运输工具在资源上的不平衡性。
[0128]
其中,样本物品,为需要运输的任意物品,比如样本物品可以为装有食品的箱子、或者装有衣物的袋子等,本公开实施例对此不作限制。
[0129]
样本物品的属性信息,可以包括与样本物品有关的任意属性信息,比如样本物品的数量信息、样本物品所占空间的大小和样本物品的重量等资源信息,本公开对此不作限制。
[0130]
样本运输工具,为能够运输样本物品的任意工具,比如样本运输工具可以为轮船、车辆等,本公开实施例对此不作限制。
[0131]
样本运输工具的属性信息,可以包括与样本运输工具有关的任意属性信息,比如样本运输工具的数量信息、样本运输工具具有的空间和可以承载的重量等资源的容量信息,本公开对此不作限制。
[0132]
需要说明的是,训练样本中的样本物品的数量、样本运输工具的数量以及其它属性信息,与机器学习模型训练完成后的应用过程,即上述上述实施例的运输调度方法中的物品的数量、运输工具的数量以及其它属性信息可以相同,也可以不同,本公开实施例对此不作限制。
[0133]
目标函数,为将多个样本物品放入多个样本运输工具时,需要实现的目标与相关因素之间的函数关系。本公开实施例中的目标函数表示多个样本运输工具在资源上的不平衡性,可以用于指示多个样本物品与多个样本运输工具之间的目标运输关系的最优解,比如,使目标函数取值最小的解为最优解。其中,多个样本物品与多个样本运输工具之间的目标运输关系,指示将各个样本物品装载在哪个样本运输工具上进行运输。
[0134]
约束,为将多个样本物品放入多个样本运输工具时,必须遵守的限制条件。比如,所有样本物品中的每个样本物品必须仅仅放到一个样本运输工具上、每个样本运输工具上承载的物品的资源量不能超过该样本运输工具能够承载的资源总量等。
[0135]
步骤502,对于至少一个训练样本,基于其中多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个样本物品放入各样本运输工具的第三置信度。
[0136]
其中,第三置信度,表示样本物品放入样本运输工具的可能性大小。
[0137]
其中,步骤502的具体实现过程及原理,可以参考运输调度方法的实施例的说明,此处不再赘述。
[0138]
步骤503,基于至少一个训练样本中至少一个样本物品放入各样本运输工具的第三置信度,对机器学习模型进行训练。
[0139]
在示例实施例中,确定各训练样本中至少一个样本物品放入各样本运输工具的第三置信度后,可以基于至少一个样本物品放入各样本运输工具的第三置信度,确定多个样本物品与多个样本运输工具之间的样本对应关系,并确定样本对应关系的目标函数取值,通过使目标函数取值最小化,来对机器学习模型进行训练。
[0140]
在示例实施例中,各训练样本可以以其中的多个样本物品与多个样本运输工具之间的样本对应关系进行标注,从而基于各训练样本中至少一个样本物品放入各样本运输工具的第三置信度与样本对应关系,确定损失值,基于该损失值对机器学习模型进行训练。
[0141]
需要说明的是,训练后的机器学习模型,可以用于执行前述的运输调度方法。采用训练后的机器学习模型执行前述的运输调度方法的过程,可以参考上述运输调度方法的实施例的说明,此处不再赘述。
[0142]
综上,本公开实施例提供的用于运输调度的机器学习模型的训练方法,获取多个训练样本,其中,至少一个训练样本包括多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束,目标函数表示多个样本运输工具在资源上的不平衡性,对于至少一个训练样本,基于其中多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个样本物品放入各样本运输工具的第三置信度,基于至少一个训练样本中至少一个样本物品放入各样本运输工具的第三置信度,对机器学习模型进行训练,实现了对用于运输调度的机器学习模型的训练,通过利用训练后的机器学习模型,确定多个物品与多个运输工具之间的目标运输关系,可以提高确定的目标运输关系的准确性,保证多个运输工具在资源上的不平衡性最小,从而减少运输过程中的运输成本。
[0143]
下面结合图6,进一步说明本公开提供的用于运输调度的机器学习模型的训练方法。图6是根据本公开第五实施例的用于运输调度的机器学习模型的训练方法的流程示意图。
[0144]
如图6所示,用于运输调度的机器学习模型的训练方法,可以包括以下步骤:
[0145]
步骤601,获取多个训练样本,其中,至少一个训练样本包括多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束;目标函数表示多个样本运输工具在资源上的不平衡性。
[0146]
其中,步骤601的具体实现过程及原理,可以参考上述实施例的描述,此处不再赘述。
[0147]
步骤602,对于至少一个训练样本,将其中多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束输入求解器,以通过求解器执行多轮迭代,获取至少一轮迭代中求解器输出的多个第三变量p
i’,b’对应的第六特征向量、多个第四变量q
b’,r’对应的第七特征向量、约束对应的第八特征向量。
[0148]
其中,第三变量p
i’,b’表示是否将第i’个样本物品放入第b’个样本运输工具,第四变量q
b’,r’表示第b’个样本运输工具在第r’种资源上的不平衡值,i’为1至i’之间的整数,b’为1至b’之间的整数,r’为1至r’之间的整数,i’为样本物品的数量、b’为样本运输工具的数量、r’为资源的种类数量,i’、b’和r’为大于或等于1的整数。
[0149]
其中,第六特征向量,用于表示第三变量的特征信息;第七特征向量,用于表示第四变量的特征信息;第八特征向量,用于表示约束的特征信息。其中,特征信息,比如可以包括上述约束中等号左侧的值,约束中的参数,等号右侧的值等。
[0150]
在示例实施例中,对于各训练样本,可以将其中多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束输入求解器,以通过求解器执行多轮迭代,求解多个样本物品与多个样本运输工具之间的对应关系,直至求解器求解结束或者达到预设时间。在求解器求解的过程中,每执行一轮迭代,可以从多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束中提取一些特征,从而得到多个第三变量p
i’,b’对应的第六特征向量、多个第四变量q
b’,r’对应的第七特征向量、约束对应的第八特征向量。另外,为了丰富第三变量、第四变量和约束的特征信息,还可以在求解器每通过一轮迭代,得到多个样本物品与多个样本运输工具之间的一个对应关系时,结合该对应关系以及已经提取的特征,得到多个第三变量p
i’,b’对应的第六特征向量、多个第四变量q
b’,r’对应的第七特征向量、约束对应的第八特征向量。
[0151]
在示例实施例中,在求解器得到前几个对应关系时,这几个对应关系虽然满足约束,但对应的目标函数取值与设定阈值的差距较远,则可以本公开实施例中,可以在求解器执行多轮迭代之后,再获取至少一轮迭代中求解器输出的第三变量p
i’,b’对应的第六特征向量、多个第四变量q
b’,r’对应的第七特征向量、约束对应的第八特征向量,比如在求解器得到第4个对应关系后,再获取之后每轮迭代中求解器输出的第三变量p
i’,b’对应的第六特征向量、多个第四变量q
b’,r’对应的第七特征向量、约束对应的第八特征向量。
[0152]
其中,各第六特征向量,或者各第七特征向量,或者第六特征向量和第七特征向量所表示的对应变量的特征信息中,可以包括以下信息中的至少一种:对应变量在历史迭代中的取值、对应变量在历史迭代中取值的改变次数、对应变量在历史迭代中取值次数最多的值、对应变量在历史迭代中取值的最大值、对应变量在历史迭代中取值的最小值、对应变量是否为稳定变量。
[0153]
上述信息可以较好的表达一个变量的取值特点,有利于机器学习模型捕获更深层次的特征并用于置信度的预测。由此,通过在各第六特征变量和/或各第七特征变量所表示的对应变量的特征信息中包括上述信息,可以有针对性的提取变量的特征信息,并且丰富变量的特征信息,进而机器学习模型可以基于更丰富、更深层次的特征信息进行训练学习,提高模型预测的准确性。
[0154]
另外,求解器输出第三变量pi’,b’对应的第六特征向量、多个第四变量q b’,r’对应的第七特征向量、约束对应的第八特征向量的同时,训练装置还可以得到一个映射关系表,用于在模型训练过程中进行矩阵的变换。
[0155]
步骤603,基于至少一个训练样本的至少一轮迭代对应的各第六特征向量、各第七特征向量以及第八特征向量,采用机器学习模型确定至少一个样本物品放入各样本运输工具中的第三置信度。
[0156]
步骤604,基于至少一个训练样本的至少一轮迭代对应的至少一个样本物品放入各样本运输工具的第三置信度,对机器学习模型进行训练。
[0157]
在示例实施例中,一个训练样本的一轮迭代对应的各第六特征向量、各第七特征向量以及第八特征向量(或者还可以包括映射关系表),可以作为一个子训练样本,进而可
以采用机器学习模型确定该子训练样本中的至少一个样本物品放入各样本运输工具中的第三置信度,并基于各子训练样本中的至少一个样本物品放入各样本运输工具中的第三置信度,对机器学习模型进行训练。
[0158]
由于求解器通过多轮迭代,可以对之前轮中确定的多个样本物品与多个样本运输工具之间的样本对应关系进行优化,最终确定多个样本物品与多个样本运输工具之间的样本对应关系的最优解,从而基于求解器在多轮迭代中确定的多个第三变量对应的第六特征向量、多个第四变量对应的第七特征向量、约束对应的第八特征向量对机器学习模型进行训练,可以使得机器学习模型基于更准确的训练数据进行训练,提高机器学习模型的预测能力。
[0159]
在实例实施例中,对于至少一个训练样本,将其中多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束输入求解器,以通过求解器执行多轮迭代之后,还可以获取至少一轮迭代中求解器输出的各第三变量对应的取值,各第三变量的取值可以指示一轮迭代中多个样本物品与多个样本运输工具之间的样本对应关系。在本公开实施例中,可以将各训练样本的各迭代中求解器输出的各第三变量的取值作为标签,对机器学习模型进行训练。
[0160]
即,步骤604中基于至少一个训练样本的至少一轮迭代对应的至少一个样本物品放入各样本运输工具的第三置信度,对机器学习模型进行训练,可以包括:基于至少一个训练样本的至少一轮迭代对应的至少一个样本物品放入各样本运输工具中的第三置信度以及各第三变量对应的取值,确定交叉熵损失;基于交叉熵损失,对机器学习模型进行训练。
[0161]
由此,通过基于至少一个训练样本的至少一轮迭代对应的至少一个样本物品放入各样本运输工具中的第三置信度以及各第三变量对应的取值,确定交叉熵损失,基于交叉熵损失,对机器学习模型进行训练,可以实现对机器学习模型的监督训练,提高机器学习模型的预测能力。
[0162]
需要说明的是,本公开实施例中的机器学习模型,为一个多分类模型,机器学习模型的预测类别数,与样本运输工具或运输工具的数量是强相关的,但可以根据实际情况,通过替换映射关系表来自适应地调整机器学习模型的预测类别数,即多分类中的类别数是自适应的,因此本公开实施例中的机器学习模型在应用于运输调度中确定多个物品与多个运输工具之间的对应关系时,具有很好的普适泛化性。例如:在运输工具的数量为10的情况下,机器学习模型为一个10分类模型,在训练好10分类的机器学习模型后,可以复用这个模型的大部分参数来处理20个运输工具的运输调度问题,只需要替换模型所使用的变量映射表,即可使模型的矩阵变换层转换为20分类。基于此,本公开实施例中的机器学习模型的其它部分例如图卷积神经网络层或图卷积神经网络子层、全连接层或全连接子层等模块的参数可以实现复用,泛化性较好。另外,在10分类模型的基础上,在面对运输调度过程中需要进行20分类时,也可以对图卷积神经网络层或图卷积神经网络子层、全连接层或全连接子层等等结构进行持续的训练,提升模型的表征能力,缓解过拟合问题。
[0163]
下面结合图7,对本公开提供的运输调度装置进行说明。
[0164]
图7是根据本公开第六实施例的运输调度装置的结构示意图。
[0165]
如图7所示,本公开提供的运输调度装置700,包括:第一获取模块701、第一确定模块702以及第二确定模块703。
[0166]
其中,第一获取模块701,用于获取多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束;其中,目标函数表示多个运输工具在资源上的不平衡性;
[0167]
第一确定模块702,用于基于多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个物品放入各运输工具的第一置信度,以基于至少一个物品放入各运输工具的第一置信度,确定多个物品与多个运输工具之间的对应关系;
[0168]
第二确定模块703,用于在对应关系的目标函数取值满足设定阈值的情况下,将对应关系确定为多个物品与多个运输工具之间的目标运输关系。
[0169]
需要说明的是,本实施例提供的运输调度装置700,可以执行前述实施例的运输调度方法。其中,运输调度装置700可以由软件和/或硬件实现,该运输调度装置700可以配置在电子设备中,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。
[0170]
在示例实施例中,第一确定模块702,可以包括:
[0171]
第一获取子模块,用于将多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束输入求解器,以通过求解器获取多个第一变量x
i,b
对应的第一特征向量、多个第二变量y
b,r
对应的第二特征向量以及约束对应的第三特征向量;其中,第一变量x
i,b
表示是否将第i个物品放入第b个运输工具,第二变量y
b,r
表示第b个运输工具在第r种资源上的不平衡值,i为1至i之间的整数,b为1至b之间的整数,r为1至r之间的整数,i为物品的数量、b为运输工具的数量、r为资源的种类数量,i、b和r为大于或等于1的整数;
[0172]
第一确定子模块,用于基于各第一特征向量、各第二特征向量以及第三特征向量,采用机器学习模型,确定至少一个物品放入各运输工具的第一置信度。
[0173]
在示例实施例中,机器学习模型包括依次连接的特征提取模块和归一化模块;第一确定子模块,包括:
[0174]
处理单元,用于将各第一特征向量、各第二特征向量以及第三特征向量输入特征提取模块,以通过特征提取模块,将各第一变量对应的第一特征向量,与输入特征提取模块的特征向量中除第一特征向量之外的其它特征向量融合,得到各第一变量对应的第四特征向量,并将各第一变量对应的第四特征向量以目标顺序组合,得到第一向量矩阵;
[0175]
确定单元,用于将第一向量矩阵输入归一化模块,以通过归一化模块确定至少一个物品放入各运输工具的第一置信度。
[0176]
在示例实施例中,特征提取模块包括依次连接的特征提取层和矩阵变换层;处理单元,包括:
[0177]
处理子单元,用于将各第一特征向量、各第二特征向量以及第三特征向量输入特征提取层,以通过特征提取层,将各第一变量对应的第一特征向量,与输入特征提取模块的特征向量中除第一特征向量之外的其它特征向量融合,得到各第一变量对应的第四特征向量,并将各第二变量对应的第二特征向量,与输入特征提取模块的特征向量中除第二特征向量之外的其它特征向量融合,得到各第二变量对应的第五特征向量,以及将各第一变量对应的第四特征向量和各第二变量对应的第五特征向量以初始顺序组合,得到第二向量矩阵;
[0178]
第一获取子单元,用于获取存储有各第四特征向量和各第五特征向量在第二向量
矩阵中的位置信息的映射关系表;
[0179]
第二获取子单元,用于将第二向量矩阵和映射关系表输入矩阵变换层,以基于位置信息,从第二向量矩阵中获取各第一变量对应的第四特征向量。
[0180]
在示例实施例中,第一确定模块702,包括:
[0181]
第二确定子模块,用于基于至少一个物品放入各运输工具的第一置信度,确定至少一个物品中至少一个目标物品对应的第一目标运输工具;
[0182]
第三确定子模块,用于将多个物品的属性信息、多个运输工具的属性信息、目标函数、约束以及至少一个目标物品对应的第一目标运输工具,输入求解器,以通过求解器,确定多个物品中除至少一个目标物品外的其它物品对应的第二目标运输工具;
[0183]
第四确定子模块,用于基于至少一个目标物品对应的第一目标运输工具,以及其它物品对应的第二目标运输工具,确定多个物品与多个运输工具之间的对应关系。
[0184]
在示例实施例中,运输调度装置还包括:
[0185]
处理模块,用于在对应关系的目标函数取值不满足设定阈值的情况下,执行至少一轮迭代,直至对应关系的目标函数取值满足设定阈值;
[0186]
其中,在至少一轮迭代中,基于历史迭代中确定的多个物品与多个运输工具之间的对应关系,更新上一轮迭代中获取的各第一特征向量、各第二特征向量以及第三特征向量,并基于更新后的各第一特征向量、各第二特征向量以及第三特征向量,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个物品放入各运输工具的第二置信度,以基于至少一个物品放入各运输工具的第二置信度,确定多个物品与多个运输工具之间的对应关系。
[0187]
在示例实施例中,各第一特征向量和/或各第二特征向量所表示的对应变量的特征信息中,包括以下信息中的至少一种:对应变量在历史迭代中的取值、对应变量在历史迭代中取值的改变次数、对应变量在历史迭代中取值次数最多的值、对应变量在历史迭代中取值的最大值、对应变量在历史迭代中取值的最小值、对应变量是否为稳定变量。
[0188]
需要说明的是,前述对于运输调度方法的实施例的说明,也适用于本公开提供的运输调度装置,此处不再赘述。
[0189]
本公开实施例提供的运输调度装置,获取多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束;其中,目标函数表示多个运输工具在资源上的不平衡性;基于多个物品的属性信息、多个运输工具的属性信息、目标函数以及约束,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个物品放入各运输工具的第一置信度,以基于至少一个物品放入各运输工具的第一置信度,确定多个物品与多个运输工具之间的对应关系;在对应关系的目标函数取值满足设定阈值的情况下,将对应关系确定为多个物品与多个运输工具之间的目标运输关系。由此,能够保证多个运输工具在资源上的不平衡性最小,从而减少运输过程中的运输成本。
[0190]
在示例实施例中,还提供一种用于运输调度的机器学习模型的训练装置。下面结合图8,对本公开提供的用于运输调度的机器学习模型的训练装置进行说明。
[0191]
图8是根据本公开第七实施例的用于运输调度的机器学习模型的训练装置的结构示意图。
[0192]
如图8所示,本公开提供的用于运输调度的机器学习模型的训练装置800,包括:第
二获取模块801、第三确定模块802以及训练模块803。
[0193]
其中,第二获取模块801,用于获取多个训练样本,其中,至少一个训练样本包括多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束;目标函数表示多个样本运输工具在资源上的不平衡性;
[0194]
第三确定模块802,用于对于至少一个训练样本,基于其中多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个样本物品放入各样本运输工具的第三置信度;
[0195]
训练模块803,用于基于至少一个训练样本中至少一个样本物品放入各样本运输工具的第三置信度,对机器学习模型进行训练。
[0196]
需要说明的是,本实施例提供的用于运输调度的机器学习模型的训练装置800,简称训练装置,可以执行前述实施例的用于运输调度的机器学习模型的训练方法。其中,训练装置可以由软件和/或硬件实现,该训练装置可以配置在电子设备,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。
[0197]
在示例实施例中,第三确定模块802,包括:
[0198]
第二获取子模块,用于对于至少一个训练样本,将其中多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束输入求解器,以通过求解器执行多轮迭代,获取至少一轮迭代中求解器输出的多个第三变量p
i’,b’对应的第六特征向量、多个第四变量q
b’,r’对应的第七特征向量、约束对应的第八特征向量;其中,第三变量p
i’,b’表示是否将第i’个样本物品放入第b’个样本运输工具,第四变量q
b’,r’表示第b’个样本运输工具在第r’种资源上的不平衡值,i’为1至i’之间的整数,b’为1至b’之间的整数,r’为1至r’之间的整数,i’为样本物品的数量、b’为样本运输工具的数量、r’为资源的种类数量,i’、b’和r’为大于或等于1的整数;
[0199]
第五确定子模块,用于基于至少一个训练样本的至少一轮迭代对应的各第六特征向量、各第七特征向量以及第八特征向量,采用机器学习模型确定至少一个样本物品放入各样本运输工具中的第三置信度。
[0200]
在示例实施例中,第三确定模块802,还包括:
[0201]
第三获取子模块,用于获取至少一轮迭代中求解器输出的各第三变量对应的取值;
[0202]
训练模块803,包括:
[0203]
第六确定子模块,用于基于至少一个训练样本的至少一轮迭代对应的至少一个样本物品放入各样本运输工具中的第三置信度以及各第三变量对应的取值,确定交叉熵损失;
[0204]
训练子模块,用于基于交叉熵损失,对机器学习模型进行训练。
[0205]
需要说明的是,前述对于用于运输调度的机器学习模型的训练方法的实施例的说明,也适用于本公开提供的用于运输调度的机器学习模型的训练装置,此处不再赘述。
[0206]
本公开实施例提供的用于运输调度的机器学习模型的训练装置,获取多个训练样本,其中,至少一个训练样本包括多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数以及约束,目标函数表示多个样本运输工具在资源上的不平衡性,对于至少一个训练样本,基于其中多个样本物品的属性信息、多个样本运输工具的属性信息、目标函数
以及约束,采用机器学习模型确定满足约束且使得目标函数最小化的情况下,至少一个样本物品放入各样本运输工具的第三置信度,基于至少一个训练样本中至少一个样本物品放入各样本运输工具的第三置信度,对机器学习模型进行训练,实现了对用于运输调度的机器学习模型的训练,通过利用训练后的机器学习模型,确定多个物品与多个运输工具之间的目标运输关系,可以提高确定的目标运输关系的准确性,保证多个运输工具在资源上的不平衡性最小,从而减少运输过程中的运输成本。
[0207]
基于上述实施例,本公开还提供一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的运输调度方法,或者执行本公开的用于运输调度的机器学习模型的训练方法。
[0208]
基于上述实施例,本公开还提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开实施例公开的运输调度方法,或者执行本公开实施例公开的用于运输调度的机器学习模型的训练方法。
[0209]
基于上述实施例,本公开还提供一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开的运输调度方法的步骤,或者实现本公开的用于运输调度的机器学习模型的训练方法的步骤。
[0210]
根据本公开的实施例,本公开还提供了一种电子设备和一种可读存储介质和一种计算机程序产品。
[0211]
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0212]
如图9所示,该电子设备900可以包括计算单元901,其可以根据存储在只读存储器(rom)902中的计算机程序或者从存储单元908加载到随机访问存储器(ram)903中的计算机程序,来执行各种适当的动作和处理。在ram 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、rom 902以及ram 903通过总线904彼此相连。输入/输出(i/o)接口905也连接至总线904。
[0213]
设备900中的多个部件连接至i/o接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0214]
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如运输调度方法或用于运输调度的机器学习模型的训练方法。例如,在一些实施例中,运输调度方法或用于运输调度的机器学习模型的训练方法可被实现为计算机软件程序,其被
有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由rom 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到ram 903并由计算单元901执行时,可以执行上文描述的运输调度方法或用于运输调度的机器学习模型的训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行运输调度方法或用于运输调度的机器学习模型的训练方法。
[0215]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0216]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0217]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0218]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0219]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网
(lan)、广域网(wan)、互联网和区块链网络。
[0220]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务("virtual private server",或简称"vps")中,存在的管理难度大,业务扩展性弱的缺陷。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
[0221]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
[0222]
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。