用于确定预计到达时间的方法和设备与流程

文档序号:31346545发布日期:2022-08-31 11:50阅读:133来源:国知局
用于确定预计到达时间的方法和设备与流程
用于确定预计到达时间的方法和设备
1.相关申请的交叉引用
2.本技术是申请日期为2016年04月18日、中国国家申请号为201610242067.5、发明名称为“用于确定预计到达时间的方法和设备”的发明专利申请的分案申请。
技术领域
3.本公开的实施例总体上涉及机器学习领域,更具体地涉及用于确定预计到达时间的方法和设备。


背景技术:

4.预计到达时间(estimated time of arrival,eta)是指预计的到达时间,eta用于估计到达指定目的地的时间,例如今天下午3:23到达,或者六分钟之后到达。在智能交通(例如,电子地图,导航应用)领域,eta用于估计移动主体(例如,车辆或行人等)从起点到终点所花费的时间,其能描述移动主体的出行行程所花费的时间和成本代价。
5.传统地,通过对出行行程进行物理建模来估计eta。这种物理建模通常将行程划分成多个子行程,每个子行程例如可以表示一段路程,通过计算每段路程的速度来确定每段路程所需花费的时间,再加上通过每个路口的时间,最终能够确定该行程的eta。
6.现有的eta估计方法依赖于对每段路程的实时速度的准确监控和对每个路口的花费时间的准确估计,然而,某些路程的速度可能无法准确计算,并且通过每个路口的时间难以精确估计。因此,现有的eta估计方法不仅准确性较差,还过分的依赖于实时路网数据,因而现有的eta估计方法无法准确地估计eta。
7.因此,在不依赖于实时路网数据的情况下,如何准确且高效地估计新的行程的预计到达时间,成为一个亟待解决的问题。


技术实现要素:

8.有鉴于此,本公开的各实施例提出了一种用于确定预计到达时间(eta)的方法和设备。本公开的实施例利用多个历史行程作为样本集,通过机器学习训练预计到达时间估计模型,从而能够准确、高效地估计新的行程的预计到达时间。
9.根据本公开的一个方面,提供了一种用于确定预计到达时间(eta)的方法。该方法包括:获取多个历史行程中的每个历史行程的特征向量;将多个历史行程的特征向量和实际时长作为样本集,以构建预计到达时间估计模型;以及使用经构建的预计到达时间估计模型来确定新的行程的预计到达时间。
10.根据本公开的另一方面,提供了一种用于确定预计到达时间(eta)的设备。该设备包括:获取装置,用于获取多个历史行程中的每个历史行程的特征向量;构建装置,用于将多个历史行程的特征向量和实际时长作为样本集,以构建预计到达时间估计模型;以及确定装置,用于使用经构建的预计到达时间估计模型来确定新的行程的预计到达时间。
11.根据本公开的又一方面,提供了一种用于确定预计到达时间(eta)的设备。该设备
包括处理单元,该处理单元被配置为:获取多个历史行程中的每个历史行程的特征向量;将多个历史行程的特征向量和实际时长作为样本集,以构建预计到达时间估计模型;以及使用经构建的预计到达时间估计模型来确定新的行程的预计到达时间。
附图说明
12.结合附图并参考以下详细说明,本公开的各实施例的特征、优点及其他方面将变得更加明显,在此以示例性而非限制性的方式示出了本公开的若干实施例,在附图中:
13.图1图示了基于物理模型来估计行程100的预计到达时间的示例图;
14.图2图示了根据本公开的实施例的用于确定预计到达时间的方法200的流程图;
15.图3图示了根据本公开的实施例的用于确定预计到达时间的另一方法300的流程图;
16.图4图示了根据本公开的实施例的用于确定预计到达时间的设备400的框图;以及
17.图5图示了可以用来实施本公开的实施例的设备500的示意性框图。
具体实施方式
18.以下参考附图详细描述本公开的各个示例性实施例。附图中的流程图和框图示出了根据本公开的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意,在有些作为备选的实现中,方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,或者它们有时也可以按照相反的顺序执行,这取决于所涉及的功能。同样应当注意的是,流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合,可以使用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以使用专用硬件与计算机指令的组合来实现。
19.本文所使用的术语“包括”、“包含”及类似术语应该被理解为是开放性的术语,即“包括/包含但不限于”,表示还可以包括其他内容。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”。
20.机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。机器学习方法包括监督式机器学习方法或者非监督式机器学习方法,监督式机器学习是指利用已知标签的数据作为训练数据来训练机器学习模型;非监督式机器学习是指在利用无标签的数据作为训练数据来训练机器学习模型。
21.在本公开的实施例中,术语“行程”表示移动主体(例如,车辆或行人等)从一个位置(例如,起点)到另一个位置(例如,终点)所经过的一系列的道路路径。术语“特征向量”表示根据从样本(例如,行程)所提取的特征信息而构建的多维向量,向量的维度等于特征信息类型的数目,特征向量例如可以包括行程的行驶距离、开始时间以及实时特征,等等。
22.应当理解,给出这些示例性实施例仅是为了使本领域技术人员能够更好地理解进而实现本公开的实施例,而并非以任何方式限制发明的范围。
23.图1图示了基于物理模型来估计行程100的预计到达时间的示例图。图1示出了一
个车辆的行程100,包括起点和终点以及将要通过的道路路段。利用传统的物理模型,将图1的行程划分为10个子行程,并分别计算每个子行程所需的时间,例如第一个子行程所需的时间为t1、第二个子行程所需的时间为t2…
第十个子行程所需的时间为t
10
。此外,在图1的行程100中,需要途径9个红绿灯路口,因此,也需要对通过每个红绿灯路口的时间进行估计,例如,通过第一个红绿灯路口的时间为l1、通过第二个红绿灯路口的时间为l2…
通过第九个红绿灯路口的时间为l9。因此,行程100将花费的总时间为t1+t2…
+t
10
+l1+l2…
l9,即通过十个子行程的时间之和加上通过九个路口的时间之和。然后,根据行程100的开始时间,基于将花费的总时间可以确定出行程100的预计到达时间(eta)。
24.然而,在图1的物理建模方法中,每个子行程的时间需要依赖于实时路网数据,并且某些路程的速度无法准确计算,此外,通过每个路口的时间难以精确估计。因此,图1的物理模型的方法无法准确地估计行程100的预计到达时间eta。此外,路网数据是实时变化的,而传统的物理模型估计方法是在行程开始时间处估计通过后面的子行程的时间,这会导致估计的准确性降低。例如,在行程开始时间处,第十个子行程所需的时间为t
10
,而当移动主体行驶或前进到第十个子行程时,第十个子行程所需的时间为t
10
已经更新为t
10’,t
10’可能与t
10
相差非常大。因此,传统的eta估计方法无法准确地估计行程的eta。
25.图2图示了根据本公开的实施例的用于确定预计到达时间的方法200的流程图。方法200以步骤202开始,获取多个历史行程中的每个历史行程的特征向量。例如,特征向量可以至少包括历史行程的行驶距离、开始时间以及实时特征,其中实时特征表示与道路的实时状况有关的信息,例如道路的实时速度或拥堵程度,或者是用其他方法得到的对这段路径通过时间的估计。
26.在一个实施例中,特征向量还可以包括:起点位置、终点位置、卫星定位采样点序列、各等级道路的行驶距离、基础道路段的数目、红绿灯路口数目以及非红绿灯路口数目。在另一个实施例中,红绿灯路口数目包括红绿灯路口左转数目、红绿灯路口右转数目和红绿灯路口直行数目。在又一个实施例中,特征向量还可以包括:各限速等级(例如,高速或市区道路等)的行驶距离、限速等级的切换次数、起点与终点之间的球面距离、基础路段(其表示底层地图数据库中的基础路段)的数目、非红绿灯路口数目(例如,包括非红绿灯路口左转数目、非红绿灯路口右转数目和非红绿灯路口直行数目)等。通过选择不同种类和数目的特征来训练机器学习模型,可以实现不同的eta估计精度。
27.在步骤204处,将多个历史行程的特征向量和实际时长作为样本集,以构建预计到达时间(eta)估计模型。例如,将一个历史行程构成一个训练样本,以实际时长作为标签,然后作为机器学习模型(例如,决策树、回归分析、神经网络等)的输入,从而训练生成eta估计模型。在一个实施例中,将每个历史行程整体作为样本集中的一个样本,来训练生成eta估计模型。因此,与传统的物理模型的分段估计方法相比,方法200以行程整体作为一个样本,而不需要将每个历史行程划分成多个子行程。
28.在步骤206处,使用经构建的预计到达时间(eta)估计模型来确定新的行程的预计到达时间。例如,在已经训练生成eta模型之后,针对任何新的行程,通过输入新的行程的特征向量,可以获得新的行程的预计到达时间。因此,方法200通过利用多个历史行程作为样本集,并且通过机器学习训练预计到达时间估计模型,从而能够准确且高效地估计新的行程的预计到达时间。
29.图3图示了根据本公开的实施例的用于确定预计到达时间的另一方法300的流程图。方法300以步骤302开始,在步骤302处,获取多个历史行程,例如,从行程数据库中获取多个历史行程,其中行程数据库中包括历史上已经完成的所有行程的相关数据。在步骤304处,针对多个历史行程中的每个历史行程,生成相应的特征向量。其中特征向量表示根据从行程样本所提取的特征信息而构建的多维向量。在一些实施例中,特征向量可以包括以下各项中的一项或多项:历史行程的行驶距离、开始时间、红绿灯路口数目、非红绿灯路口数目、起点与终点之间的球面距离、行程基础路段的数目以及实时特征,其中所述实时特征表示与道路的实时状况有关的信息,例如道路的实时速度或拥堵程度。
30.在步骤306处,获取与每个历史行程对应的实际时长。也就是说,在构建每个历史行程的特征向量之后,获取相应的实际时长,作为机器学习模型的样本。在步骤308处,利用每个行程的特征向量和实际时长,来训练预计到达时间估计模型。例如,可以使用树状结构来建立决策树模型;以及使用决策树模型来训练样本集,以生成eta估计模型。
31.在一些实施例中,eta估计模型可以包括多个子模型。可选地,eta估计模型可以包括针对不同应用场景的多个子模型,不同应用场景可能具有不同的行为,因此需要针对不同的行为分别建立相应的子模型以提高模型估计的可应用性和准确性。不同的应用场景可以例如包括智能用车模式中的接驾段(即,司机前往乘客位置以接驾乘客的路段)和送客段(即,司机从乘客位置将乘客送到目的地的路段),因此,可以训练并生成针对接驾段的接驾段子模型和针对送客段的送客段子模型。备选地,eta估计模型包括针对不同时间段的多个子模型。同一路程在不同时刻的所花费的时间差距可能非常大,例如在早晚高峰期行驶非常缓慢,而在半夜行驶非常通畅,因此,可以根据行程的开始时间来建立针对不同时间段的子模型。可选地,可以将一天中的例如每两小时作为一个时间段,则eta估计模型可以包括12个时间段子模型。在另一些实施例中,eta估计模型可以仅包括一个统一模型,该统一模型可以根据特征向量中的特征数据,自适应地处理不同场景的行程,从而仍能保证较高的eta估计精度。
32.方法300继续进行到步骤310,输入新的行程,例如,在已经训练生成eta估计模型之后,可以对新的行程进行eta估计。在步骤312处,获取新的行程的特征向量,新的行程的特征向量可以与样本集中历史行程的特征向量的特征类型相同。可选地,新的行程的特征向量可以包括行驶距离、开始时间以及实时特征。备选地,特征向量还可以包括:起点位置、终点位置、卫星定位采样点序列、各等级道路的行驶距离、基础道路段的数目、红绿灯路口数目以及非红绿灯路口数目,其中红绿灯路口数目包括红绿灯路口左转数目、红绿灯路口右转数目和红绿灯路口直行数目。
33.方法300继续进行到步骤314处,将新的行程的特征向量输入到eta估计模型,输出新的行程的预计到达时间(eta)。在一些实施例中,当eta估计模型中存在多个子模型时,可以根据特征信息来选择使用相应的子模型。例如,当eta估计模型包括针对不同时间段的多个子模型时,可以基于新的行程的开始时间来确定新的行程的开始时间所处的时间段,并且基于时间段来选择针对相应时间段的子模型。可选地,相应时间子模型可以表示一个子模型,例如,当新的行程的开始时间为早上7:15时,可以确定其处于7-8点时间段的子模型,此时,选择早高峰拥堵条件下的7-8点时间段子模型来确定新的行程的eta。备选地,相应时间子模型还可以表示由多个子模型集成(ensemble)的子模型(例如,加权子模型),例如,将
多个子模型进行集成,并生成集成的子模型以供使用。
34.在一些实施例中,在存在多个新的行程时,可以重复执行方法300中步骤310-314以处理多个新的行程。在一个实施例中,方法300还包括,在新的行程完成之后,使用新的行程的实际时长来调整预计到达时间估计模型的模型参数。也就是说,新的行程一旦完成,其就变成历史行程中的一个历史行程,该新的行程的数据变成eta估计模型中的新的一个样本,随着样本的不断增加,eta模型的估计准确性也可以不断提高。
35.在一些实施例中,服务器对数据库中的历史行程进行训练学习,以生成eta估计模型。然后,移动主体使用用户设备将新的行程的起终点发送给服务器,服务器基于eta估计模型对新的行程进行处理,向用户设备发送新的行程的预计到达时间(eta)。
36.本公开的实施例的方法300将机器学习方法应用于eta估计中,并且将每个行程整体作为一个样本,将行程的实际时长作为样本的标签,来对eta模型进行训练。此外,选择了多种特征类型,能够提高eta估计的准确性。另外,可选地,针对不同的应用场景,可以设置不同的子模型或者对统一模型进行小幅度的调整。因此,本公开的实施例的方法300能够准确、高效地估计新的行程的预计到达时间。
37.图4图示了根据本公开的实施例的用于确定预计到达时间的设备400的框图。该设备400包括:获取装置402,用于获取多个历史行程中的每个历史行程的特征向量,该特征向量包括历史行程的行驶距离、开始时间以及实时特征;构建装置404,用于将多个历史行程的特征向量和实际时长作为样本集,以构建预计到达时间估计模型;以及确定装置406,用于使用经构建的预计到达时间估计模型来确定新的行程的预计到达时间。在一个实施例中,设备400还可以包括调整装置(未示出),用于在所述新的行程完成之后,使用新的行程的实际时长来调整预计到达时间估计模型的模型参数。
38.应当理解,设备400可以利用各种方式来实现。例如,在某些实施例中,设备400可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、cd或dvd-rom的载体介质、诸如只读存储器的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本公开的实施例的设备和装置不仅可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合来实现。
39.图5图示了可以用来实施本公开的实施例的设备500的示意性框图。如图所示,设备500包括中央处理单元(cpu)501,其可以根据存储在只读存储器(rom)502中的计算机程序指令或者从存储单元508加载到随机访问存储器(ram)503中的计算机程序指令,来执行各种适当的动作和处理。在ram 503中,还可存储设备500操作所需的各种程序和数据。cpu 501、rom 502以及ram 503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。
40.设备500中的多个部件连接至i/o接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通
信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
41.上文所描述的各个过程和处理,例如方法200和300,可由处理单元501执行。例如,在一些实施例中,方法200和300可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由rom 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序被加载到ram 503并由cpu 501执行时,可以执行上文描述的方法200和300的一个或多个步骤。
42.应当注意,尽管在上文的详细描述中提及了设备的若干装置或子装置,但是这种划分仅仅是示例性而非强制性的。实际上,根据本公开的实施例,上文描述的两个或更多装置的特征和功能可以在一个装置中具体化。反之,上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。
43.以上所述仅为本公开的实施例可选实施例,并不用于限制本公开的实施例,对于本领域的技术人员来说,本公开的实施例可以有各种更改和变化。凡在本公开的实施例的精神和原则之内,所作的任何修改、等效替换、改进等,均应包含在本公开的实施例的保护范围之内。
44.虽然已经参考若干具体实施例描述了本公开的实施例,但是应该理解,本公开的实施例并不限于所公开的具体实施例。本公开的实施例旨在涵盖在所附权利要求的精神和范围内所包括的各种修改和等同布置。所附权利要求的范围符合最宽泛的解释,从而包含所有这样的修改及等同结构和功能。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1