用于在行进期间预测目的地的方法
【专利摘要】本发明的实施方式提供了一种在导航系统中根据目的地的历史来预测行进目的地的方法。用于预测的模型包含目的地数据库,该目的地数据库可包括用户最喜爱的、即最可能的目的地。该模型还使用可包括诸如当前时刻、星期几、当前位置、当前方向、过去位置、天气等特征的环境。即使未准确知道目的地,该模型也推测目的地和目的地类别。具体地说,方法使用表示行进的先前状态的预测模型,基于表示行进的当前状态的特征矢量、目的地和目的地的类别的概率在行进期间预测目的地。将具有最高概率的目的地和目的地类别的子集输出以供用户选择。
【专利说明】
用于在行进期间预测目的地的方法
技术领域
[0001] 本发明总体上设及预测行进目的地,尤其是基于历史数据进行预测。
【背景技术】
[0002] 导航系统正在取代纸质地图和海图来辅助司机和船长航行通过不熟悉的区域到 达不熟悉的目的地。大多数导航系统包括全球定位系统(GPS),W确定车辆、船只或飞机的 精确位置。作为优点,导航系统中的数据可W被不断更新,增加额外的航路信息,并且在系 统之间容易地传送。
[0003] 通常,目的地由驾驶员或乘客设置。目的地可W基于位置名称、地址、电话号码、从 预先登记的目的地的列表中选择的预先选择的地理点等等。特定路线的知识,连同状况和 环境数据(例如,交通和天气)可用于辅助驾驶员领航员到达特定目的地。
[0004] 美国专利7,233,861描述了一种用于预测目的地并且接收车辆位置数据的方法。 车辆位置数据包括当前行程,将该当前行程与先前行程相比较W预测该车辆的目的地。还 可W建议到达该目的地的路径。
[0005] 美国专利公报20110238289描述了一种导航装置和用于预测行程目的地的方法。 该方法确定包括行程的起点、起始时间和日期在内的起始参数。通过使用行程历史的信息 生成预测算法。
[0006] 美国专利公报20130166096描述了一种使车辆导航系统辅助获得车辆的目的地的 预测式目的地录入系统。导航系统使用先前的驾驶历史或习惯。该信息用于对车辆的用户 所期望的当前目的地进行预测。该信息可W被分离成不同的用户配置文件,并且可W包括 车辆位置、车辆先前的驾驶历史、车辆的用户的先前的检索历史或与车辆的一个或更多个 特征有关的感觉输入(senscxry input)。
【发明内容】
[0007] 本发明的实施方式提供了一种在导航系统中根据目的地的历史来预测行进目的 地的方法。用于预测的模型包含目的地数据库,该目的地数据库可包括用户最喜爱的(即, 最可能的)目的地。
[000引该模型还使用可包括诸如当前时刻、星期几、当前位置、当前方向、过去位置、天气 等特征的环境。即使未准确知道目的地时,该模型也可W推测目的地。
[0009] 具体地说,方法使用基于行进的先前状态的预测模型,基于表示行进的当前状态 的特征矢量和目的地的类别的概率在行进期间预测目的地。将具有最高概率的类别的子集 输出W供用户选择。
【附图说明】
[0010] 图1是根据本发明的实施方式的用于基于历史数据来预测行进目的地的方法的流 程图。
[0011] 图2是根据本发明的实施方式的层级式目的地类别预测模型。
[0012] 图3是根据本发明的实施方式、凭借目的地类别依赖性的目的地类别预测模型。
【具体实施方式】 [001引概述
[0014]本发明的实施方式提供了一种在导航系统中用于根据行进活动的历史预测行进 目的地的方法。在本文中描述的示例中,行进由车辆执行。然而,可W理解的是,其他行进模 式也可W由本文中所述的方法预测。运些方法可W在连接到由总线连接的存储器、输入/输 出接口的处理器中执行。输出装置可包括向用户指示目的地的显示器或扬声器。输入装置 可包括来自选择具体目的地的全球定位系统(GPS)触摸屏、键盘和语音识别系统的位置轨 迹。
[001引方法综述
[0016]本方法获取导航数据101、(车辆)系统总线数据102、天气数据103和导出数据。一 些导出数据可从车辆导航系统、车辆总线和天气数据101-103获得。导航系统可包括GPSW 及到各种信息服务器的无线互联网连接。车辆总线被定义为将车辆(例如,机动车、公共汽 车、火车、工业或农业车辆、船舶或飞机)内部的部件互连的任意特殊的内部通信网络。将数 据同步110并且提取120特征作为特征矢量121。各特征矢量集体表示某段过去时间的行进 的先前状态。
[0017] 训练
[0018] 在可W是一次性的、间歇的、周期性的或连续的训练阶段155期间,在训练数据库 151中存储特征。训练还维护含有与诸如企业、政府机关、住宅、地标和其他地理定位实体的 具体目的地关联的位置、地址、名称、标识符、类别的目的地数据库150。运种目的地数据库 还可W位于服务器上。目的地类别可W含有诸如其类型、质量、可用性等与目的地选择相关 的任意语义信息。
[0019] 在训练期间,推测153目的地类别的概率。即,与目的地的类另咲联的概率。目的地 类别的概率不应与如在现有技术系统中通常发现的目的地的标识混淆。训练还确定152所 观察的在行进期间轨迹。在经由用户导航接口不知道用户的实际目的地的情况下,使用所 观察的轨迹来推测与各目的地和关联的类别关联的概率。在训练期间所推测的轨迹、概率 性地推测的目的地和目的地类别用于构建预测模型160。
[0020] 操作
[0021] 操作期间,实时获取并由预测过程130处理实际行进的当前状态的类似特征,W获 得目的地概率131、目的地类别W及诸如给目的地打电话的相关动作。显示140具有最高概 率(即,最高Ξ个概率)的预测的目的地、类别和动作,或者在诸如语音输出的用户输出接口 141上经由其他手段呈现给用户作为选择。所显示的具有最高概率的选项数量可W由用户 指定。然后,用户可W使用用户输入接口来选择142目的地、目的地类别或动作,然后在向所 选择的目的地行进的期间,可W生成路线信息或轨迹143。
[0022] 理论依据
[0023] 本发明基于行进者在他们的目的地序列呈现的规则性的直观性,例如,
[0024] 家一饮料/小吃店一工作一商店一家。
[0025]本发明的实施方式将从诸如先前的目的地、目的地类别W及时刻、星期几、行程状 况、行进方向等当前和过去的轨迹导出的特征作为输入。预测被视为使用表示目的地、目的 地类别W及最终到达位置的变量进行的推测任务。当仅观察到到达位置时,训练算法可W 推测目的地和目的地类别作为隐含变量。
[00%] 简化模型
[0027] 在随机变量对{x,s}中,X代表特征矢量,并且S代表位置,例如经度和缔度,例如, 行程区间的终点。
[0028] 特征矢量X =[ XI,···.,XF ]包括轨迹标识(ID )、针对各轨迹的区间ID、针对各区间的 点ID、高度、时刻、速度和方向,并且可能包括它们的统计情况,例如,平均值、均值、偏差等, 总体地称为行进状况。
[0029] 我们推测目的地d的多项类别(或"类型")ze [1,...,C],多项类别是来自目的地 数据库的目的地或从用户处获得的"最喜爱"目的地来对可能目的地加索引的多项式。
[0030] 我们将此用公式表示为多项式逻辑回归模型:
[0031]
[003^ 其中,4=[、,...人。]了,人是权重,并且
并且Φ(χ)是我们的输入 特征X的矢量值函数。依赖于推测的类型,我们还可W使用与多项式逻辑回归模型类似但是 可能对于基于样本的方法更方便的多项式概率单位(probit)回归模型。
[0033] 我们的直观假设在用户已选择具有更较高概率的类别C之后,用户将最可能选择 来自该类别的目的地d:
[0034]
[00对其中,"cat"是用目的地d标识的一组类别。运是涵盖与类另Ijc一致的目的地的统一 多项式。
[0036] 我们假设用户在所选d附近的位置S处停车。运可W建模为
[0037]
[003引其中,S=02l2并且0是某人停车距目的地的距离的标准差,并且l0C(d) = [dlat, dlnn]T是关注点d的位置(经度和缔度)。
[0039] 模型训练
[0040] 为了训练155运种模型160,考虑例如,xi,s拥,其中,XI在区间的中间。训练的目标 函数是:
[0041]
庚中, 我们只对一组目的地求和
[00伯]巧,《?>) - 1(/) : !k皆城,}…sj <沒巧,并且爲运c款。'义)}、
[0043] 因为p(z I d)和/或p(s I d)在该组之外为零或者相对小。
[0044] 规则化方案
[0045] 逻辑回归受益于某种形式的^和/或L2规则化。将特征变换到更低维的子空间也可 W改善泛化性能。
[0046] 变换模型是:
[0047]
[004引其中,A是所有类和所有用户共享的(RXF)矩阵。通常,R<FW执行降维。
[0049]作为目标函数,模型是:
[0化3 ] 其中,α = 〇.5并且β = 0.5对于模型参数的规则化最理想。我们不对A加入规则化矩 阵。
[0054] 用于类别预测的概率模型
[0055] 不是使用逻辑回归对p(z|x)来建模,我们发现使用从生成模型的视点较容易处理 的概率单位回归很有用。我们使用利用数据X回归到的辅助变量YERExw和参数(回归因子)W ERExw。遵循常规的噪音模型ε :N(0,1),(该模型会导致得到yci=wc Φ (χι)+ε,其中,wc是类C 回归因子的1XN行矢量,并且Φ(χι)是第i个元素的内积的NX1列矢量)将得出W下高斯概 率分布:
[0化6]
0
[0057]从辅助变量yci到作为对象的离散目标类别ZiEl,. . .,C的联系是:
[0化引zi = j,,如果巧 >>矿,々>/,
[0059] 并且通过W下边缘化
[0060]
[0061 ]其中,p(zi = j I yi)是德尔塔函数,得到多项式单位可能性
[0062]
[0063] 其中,E是相对于常规正态分布取得的期望值
[0064] 沪(对)?入*巧J )和巫
[00化]是正态累计密度函数。
[0066] 类别预测模型
[0067] 回想一下,我们有,其中XiERD是D维特征矢量并且Si是终点的位置。我 们希望对各个时刻i预测类别。对于各个类别,我们可W构建线性分类器或非线性分类器。 对于线性情况,Φ (Xi) = Xi,而对于非线性情况,Φ (Xi) = [K(Xi,Xl),K(Xi,X2),. . .,K(Xi, XN)],其中Κ(.,.)是内核函数。
[0068] 回归因子wic遵循均值为零和方差为汾g:/的传统正态分布,其中遵循具有超 参数τ,ν的伽玛分布。通过将τ,ν设置为足够小的值,例如(<10-5),回归因子wn。的仅小子集 为非零,随后导致稀疏性。
[0069] 我们假设对于每一个类别C,存在关于目的地咸。的唯一分布μ。,其中,Lc是 、 L·· 其类别包括C的所推测的目的地153,并且為W表示被指标化为η的目的地。
[0070] 根据多项-狄利克雷(Dir)分布获得最终目的地di的模型。假设某人在目的地附近 停车,我们使用所选择的目的地的位置的均值为山、方差为别2的高斯分布对Si建模,〇2可W 是固定的或被进一步施加伽玛先验概率。
[0071] 图2图形地示出了我们的模型,其具有如本文中所述并且如下总结的变量:
[0072]
[0073] 我们还可W将各个分类的目的地的参数作为用户偏好来学习。然而,为了学习,可 能需要更多的训练数据。在运种情况下,我们需要包括关于分类的目的地的信息的层级W 对此进一步约束。例如,我们可W有"类型"g和"名称"或"品牌"b(例如,"Starbucks"相对于 "山ikin donuts" ) W及实际的目的地d(例如,特定地址处的特定"S化rbucks")。我们可W将 运些表示为树结构:C一g一b一d,并且运些关系可W是确定性的。bebrand(d),gegenre (b),cecat(g)。
[0074] 在存在超过一个的标签与各项目关联的情况下,我们将运些用公式表示为组,但 一般而言,树中的各项目具有单个亲项。w此方式,可w包括用户对类型和品牌名称的偏 好,而不必学习实际位置d的级别的参数。
[0075]
[0076] 因为我们还可W包括其他用户数据,所W我们可W用公式表示全局先验概率
[0077] p(ji)=Dir(3i; γ),
[007引来约束运些概率。
[00巧]位置预测
[0080] 如果我们希望预测用户将从前一位置行进到的下一个位置,那么我们可W考虑集 群化位置,W降低推测的复杂性。我们使用一组离散的集群区域rER。我们可W使用基于Ν- gram的马尔可夫模型p(ri|ri-i,ri-2,. . .,ri-n+i)根据先前区域推测当前区域rt,其中,η是马 尔可夫模型的阶并且N-gram是区域序列η,η-ι,η-2,. . .,ri-n+i ·可W平滑化N-gram模型, W提供针对未见的N-gram的概率。
[0081] 我们还可W考虑用户向附近区域行进的模型:
[0082]
[0083] 我们还可W考虑经由指示用户是否向附近位置行进的辅助随机变量W,或者经由 上面的马尔可夫动态来对运些进行组合:
[0084]
[0085] 将上式和先验概率p(〇i)组合并且假设观察到ri,我们可W最优化目标函数W学习
[0086]
[0087] 由于两个分量之间的冗余性,可能无法很好地学习 p(〇i),并且使用交叉验证来设 置可能更好,或者将狄利克雷先验概率置于其上,W有利于均匀分布。
[0088] 用于区域预测的判别模型
[0089] 可能难W在用于区域预测的N-gram模型中组合诸如时刻等的其他环境特征。作为 另选方案,我们可W使用诸如上述逻辑回归或概率单位回归模型等基于分类器的方法。在 运种情况下,我们可W按照与P(zi IXI)类似的方式定义Ρ(η IXI)。在运种情况下,除了用于 类别预测的任意其它特征之外,特征xi还含有表示先前目的地ri-i,ri-2,. . .,ri-n+i的特征。
[0090] 用于目的地类别选择的位置依赖性
[0091] 我们还可W对所预测的区域r、所预测的类别Z与目的地d之间的依赖性建模。可W 借助如下的目的地可能性组合区域预测和类别预测:
[0092]
[0093] 目的地数据库依赖性
[0094] 我们可W具有多于一个的目的地数据库150并且数据库可W在确定用户目的地时 具有不同的重要性。尤其,用户可W拥有一批"最喜爱"的目的地。运里,我们把运些视为具 有比来自通用数据库的先验概率更高的先验概率的目的地数据库。因此,我们使用指示用 于预测行程区间i的目的地、由用户选择的数据库的多项式随机变量fi:Multa)。为了实现 目的地数据库的选择,我们将集合Uk定义为来自类别包括C的数据库k的目的地的库。然 后
其中,??κ表示被索引为η的目的地。
[00Μ]假设数据根据模型来分布:
[0096] 参目的地指标概率A:Diriichlet(ri)
[0097] 参方差参数InverseGammako'do)
[009引参目的地概率yc:Dirichlet(丫)
[0099] ?回归因子煤e:
[0100] 参对于各个点i = l,. . .,N
[0101 ]-目的地数据库指标fi:Multinomial(A)
[0105] -停车位置 Si:N(loc(山
[0106] 图3示出了具有本文中所定义的变量、利用目的地数据库依赖性的目的地类别预 测模型。
[0107] 无监管区域建模
[0108] 在上述模型中,区域被视为或者通过平铺地理空间,或者集群化用户频繁行进的 目的地和/或位置而导出的预定义位置。将目的地位置的空间分布考虑作为区域模型是合 理的扩展。在运种情况下,区域的位置可无监管方式在模型的环境中学习。
[0109] 轨迹建模
[0110] 在上述模型中,位置预测基于区域历史。预测还可W基于包括行进方向、道路区 间、沿着路线的距离、根据当前路线和地图信息导航到目的地的容易性、交通信息的地理特 征。运种模型化是本方法的合理扩展,其改进了到新位置的预测和泛化。
【主权项】
1. 一种用于在行进期间预测目的地的方法,该方法包括以下步骤: 基于所述行进的先前状态,推测过去曾行进到的目的地和目的地类别的概率; 基于表示所述行进的当前状态的特征矢量,使用基于所述行进的先前状态、所述目的 地和目的地类别的预测模型来预测所述目的地的类别的概率;以及 输出具有最高概率的类别子集供用户选择, 其中,上述步骤在处理器中执行。2. 根据权利要求1所述的方法,其中,所述特征矢量包括车辆导航数据、车辆系统总线 数据、天气数据和导出数据。3. 根据权利要求1所述的方法,其中,所述预测模型基于N-gram。4. 根据权利要求1所述的方法,其中,所述模型是概率+单位(概率单位)回归模型,其中 因变量只能够取两个值。5. 根据权利要求1所述的方法,所述方法还包括以下步骤: 调整所述模型的参数;并且 将特征矢量变换到更低维的子空间。6. 根据权利要求1所述的方法,其中,所述预测使用概率模型。7. 根据权利要求1所述的方法,其中,使用多项分布来预测所述目的地。8. 根据权利要求1所述的方法,其中,类别包括类型、名称和目的地的层级。9. 根据权利要求1所述的方法,其中,所述预测使用目的地的数据库和位置的历史的组 合。
【文档编号】G01C21/36GK105829831SQ201480061737
【公开日】2016年8月3日
【申请日】2014年10月27日
【发明人】J·R·赫尔歇, 李凌波, 李沛霖
【申请人】三菱电机株式会社