路径规划方法、路径规划系统、电子设备及计算机存储介质

文档序号：24649343发布日期：2021-04-13 16:57阅读：74来源：国知局

1.本发明涉及路径轨迹数据处理技术领域，尤其涉及一种路径规划方法、路径规划系统、电子设备及计算机存储介质。

背景技术：

2.随着自动化的兴起，地图导航成为研究的热点，现在的地图导航一般首先是基于已有地图规划出一条最优全局路线，该过程称之为路径规划，然后车辆沿着该路线从出发点自动驾驶到目的点，在此过程中，车辆根据各类传感器检测到的外界交通状况，结合轨迹计算在对应交通状况下，如何保证车辆的准确性直接影响了服务的质量。然而，由于各种因素，卫星导航定位数据的采样往往采用低采样率的卫星导航定位采样，这样采样获得的轨迹数据直接带来了用户行驶路径的缺失，这些数据的缺失将会极大地影响基于位置的服务质量。对于这些缺失路径的轨迹数据，如果能够利用剩下的部分高采样率的轨迹数据对其缺失部分进行恢复，那么毫无疑问将会提高数据的利用率。
3.现有路径恢复技术中的热门路径恢复方法，通过从历史数据中找出需要恢复路径的首尾路段之间的最热门路径来作为缺失路径的恢复结果。然而，这种方法在长距离的缺失下会产生一定的问题，且对历史数据的数量有一定的要求。是当路径的缺失距离变长后，历史数据中在缺失路径的首尾路段之间的轨迹数量也将减少，且路径的多样性也将会变多，导致热门路径的恢复效果不佳。
4.针对上述这种情况，本发明提出了一种路径规划方法、路径规划系统、电子设备及计算机存储介质，能够有效地对现有技术进行改进，克服其不足。

技术实现要素：

5.针对现有技术的不足，本发明提供了一种路径规划方法、路径规划系统、电子设备及计算机存储介质，以解决现有技术存在的多道路的缺失下准确度错的问题，其具体方案如下：
6.第一方面，本发明提供了一种路径规划方法，所述方法包括：
7.获取起始轨迹路径和终止轨迹路径；以及，
8.根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径；
9.所述获取起始轨迹路径和终止轨迹路径包括：
10.定义马尔科夫决策过程mdp模型，获取所述起始轨迹路径至所述终止轨迹路径的所有道路状态s，所有道路构成状态集合s*；
11.所述训练模型参数的获取方法包括：
12.s01，对所述所有道路构成状态集合s*进行归一化处理，获得所有道路构成状态归一化集合s；
13.s02，每两条相邻道路之间的状态转移动作定义为状态转移矩阵a，所述集合s中道
路之间的状态转变需所述状态转移矩阵a参与，所述集合s中道路之间的转变经所述状态转移矩阵a作用转移到相邻道路的概率分布定义为p
ss
；
14.s03，将所述集合s每条道路长度的负数作为所述道路的初始回报函数r，总的回报函数集合为r＝-s，衰减因子定义为γ；
15.s04，初始化最优值函数v，采用迭代算法公式：
[0016][0017]
计算所有状态集合s获得收敛最优值函数v
*
(s)；其中，k为迭代当前状态；
[0018]
s05，根据所有历史轨迹的路径，选择重复次数超过预设次数l的路径作为历史轨迹，对于任意一条历史轨迹tr＝s1→
s2→…→
s
q
，所述任意一条历史轨迹的训练集合为m；
[0019]
s06，根据历史轨迹的训练集合m，计算其行程时间相符程度：
[0020]
当max
j∈m
(|t
j-t
k
|)≠min
j∈m
(|t
j-t
k
|)时，
[0021][0022]
当max
j∈m
(|t
j-t
k
|)＝min
j∈m
(|t
j-t
k
|)时，
[0023]
x(tr)＝1；
[0024]
其中，t
i
为历史轨迹的计算路径行程时间，t
j
为历史轨迹的统计路径行程时间，t
k
为历史轨迹的平均路径行程时间；
[0025]
s07，根据历史轨迹的训练集合m，将每相邻两条道路的状态定义为s
i
、s
j
，计算s
i
转移至s
j
最优值函数：
[0026]
q(s
i
→
s
j
)＝r(s
i
)+γv
*
(s
j
)
[0027]
s08，根据所述最优值函数求取s
i
至s
j
的转移概率：
[0028][0029]
其中，s
k
为s
i
相邻状态；
[0030]
s09，计算历史轨迹tr在当前回报函数集合r和行程时间相符程度校正下的联合概率：
[0031][0032]
其中，m为大于1的历史轨迹的数量；
[0033]
s10，重复步骤s05—s09，计算n条用于训练的历史轨迹在当前回报值集合r下的联合概率：
[0034][0035]
s11，对当前回报值集合r下的每个状态的初始回报函数r在(r
-△
,r+
△
)区间进行采样，得到回报值集合r的新的回报值集合r
*
；
[0036]
s12，重复步骤s05—s09计算所有历史轨迹tr在新的回报函数集合r
*
和行程时间相符程度校正下的联合概率：
[0037]
[0038]
其中，m为大于1的历史轨迹的数量；
[0039]
s13，根据联合概率p2(tr)，计算n条用于训练的历史轨迹在新的回报值集合r
*
下的联合概率：
[0040][0041]
s14，根据的接受概率接受新的回报值集合r
*
；
[0042]
s15，重复步骤s11—s14，直到满足步骤s14的接受概率条件，将接受新的回报值集合r
*
作为模型参数的当前回报值集合r。
[0043]
优选地，所述根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径，所述方法包括：
[0044]
s21，定义马尔科夫决策过程mdp模型，获取所有道路状态s，所有道路构成状态集合s*，对所述所有道路构成状态集合s*进行归一化处理，获得所有道路构成状态归一化集合s；
[0045]
每两条相邻道路之间的状态转移动作定义为状态转移矩阵a，所述集合s中道路之间的状态转变需所述状态转移矩阵a参与，所述集合s中道路之间的转变经所述状态转移矩阵a作用转移到相邻道路的概率分布定义为p
ss
；
[0046]
将所述集合s每条道路长度的负数作为所述道路的初始回报函数r，总的回报函数集合为r＝-s，衰减因子定义为γ；
[0047]
s22，根据训练部分的步骤s04—s15得到更新后的回报值集合r；
[0048]
s23，根据历史轨迹的训练集合创建图论g，每条道路为图论的顶点集合，相邻两条道路s
i
转移至s
j
的负对数为边权值：
[0049]
wm＝-ln(p(s
i
→
s
j
))；
[0050]
s24，定义需要补全的路径起点为t
o
，终点为t
d
，在图论g中使用增加交叉口的方向补偿的最短路径法，计算得出补全的路径t
o
→
t1→
t2→…→
t
d
作为恢复的路径。
[0051]
优选地，所述方法还包括：根据所述起始轨迹路径、所述终止轨迹路径及缺失路径构建目标行驶路径。
[0052]
优选地，所述获取起始轨迹路径和终止轨迹路径之前，所述方法还包括：根据卫星导航接收机获取导航电文，提取卫星轨道关于起始轨迹路径和终止轨迹路径的关键坐标参数。
[0053]
优选地，所述方法还包括：将恢复的缺失路径数据反馈至终端，并通过可视化方式展示出来。
[0054]
优选地，所述根据历史轨迹的训练集合m，计算其行程时间相符程度的历史轨迹数据的车速为每小时30公里。
[0055]
优选地，所述集合s中道路之间的转变经所述状态转移矩阵a作用转移到相邻道路的概率分布p
ss
为0.25。
[0056]
第二方面，本发明提供了一种路径规划系统，所述系统包括：
[0057]
获取模块，用于获取起始轨迹路径和终止轨迹路径；
[0058]
恢复模块，用于根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢
复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径。
[0059]
第三方面，本发明提供了一种路径规划系统，所述系统包括：
[0060]
通信总线，用于实现处理器与存储器间的连接通信；
[0061]
存储器，用于存储计算机程序；
[0062]
处理器，用于执行所述计算机程序以实现如下步骤：
[0063]
获取起始轨迹路径和终止轨迹路径；以及，
[0064]
根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径。
[0065]
第四方面，本发明提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的方法。
[0066]
有益效果：本发明的路径规划方法、路径规划系统、电子设备及计算机存储介质，通过在训练阶段对训练区域的道路数据归一化标准，提取历史轨迹的路径集合并添加了时间相符程度，训练满足历史轨迹下的最优回报函数值；在路径恢复阶段用所得最优回报函数值计算相邻道路之间的转移概率，并将道路与道路之间的转移概率作为边权值创建图论，同时加入了交叉口的方向补偿，对车辆掉头选择做出了优化补偿，在更新后的图论基础上采用最短路径法对缺失路径恢复，使得在多道路的缺失下依然能保持恢复的准确度，解决现有技术存在的多道路的缺失下准确度错的问题。
附图说明
[0067]
为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，附图中的实施例不构成对本发明的任何限制，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0068]
图1是本发明路径规划方法实施例一流程示意图。
[0069]
图2是本发明路径规划方法实施例二流程示意图。
[0070]
图3是本发明路径规划交叉口方向补偿，即从t1→
t2，不考虑模型中的掉头选择。
[0071]
图4是本发明路径规划训练区域内所有道路情况。
[0072]
图5是本发明路径规划选择的训练历史轨迹部分显示。
[0073]
图6是本发明路径规划需要恢复的路径起点为s7，终点为s7。
[0074]
图7是本发明路径规划在恢复缺失路径下的准确情况。
[0075]
图8是本发明路径规划系统一实施例结构示意图。
[0076]
图9是本发明路径规划电子设备一实施例结构示意图。
具体实施方式
[0077]
下面结合附图与实施例对本发明技术方案作进一步详细的说明，这是本发明的较佳实施例。应当理解，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例；需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0078]
本发明实施例技术方案的主要思想：获取起始轨迹路径和终止轨迹路径；根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径。
[0079]
为了更好的理解上述的技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
[0080]
实施例一
[0081]
本发明一实施例提供了一种路径规划方法，如图1所示，该路径规划方法具体可以包括如下步骤：
[0082]
s101，获取起始轨迹路径和终止轨迹路径；
[0083]
在路径规划的实际应用中，需要先确定起点与终点，即获取到起始轨迹路径和终止轨迹路径。
[0084]
在一个可选场景中，起始轨迹路径与终止轨迹路径可以通过获取用户输入的信息所确定。在另一可选场景中，起始轨迹路径还可以通过进行卫星定位所确定。
[0085]
在本发明申请实施例中，具体是定义马尔科夫决策过程mdp模型，并通过用户输入的信息或通过进行卫星定位获取起始轨迹路径至所述终止轨迹路径的所有道路状态s，所有道路构成状态集合s*。在本发明申请实施例中，所有道路构成状态集合s*可以表示如下：
[0086]
s
*
＝(s1,s2,s3,...,s
54
)
[0087]
s102，根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径；其中，所述训练模型参数具体可以如下方法步骤获取：
[0088]
s1001，对所述所有道路构成状态集合s*进行归一化处理，获得所有道路构成状态归一化集合s；
[0089]
在本发明申请实施例中的归一化，具体是将矩阵中的每个状态，即道路的长度处理成[0,1]范围内，采用如下归一化公式进行处理：
[0090]
y＝(ymax-ymin)*(x-xmin)/(xmax-xmin)+ymin
[0091]
其中，ymax＝1，ymin＝0。
[0092]
s1002，每两条相邻道路之间的状态转移动作定义为状态转移矩阵a，所述集合s中道路之间的状态转变需所述状态转移矩阵a参与，所述集合s中道路之间的转变经所述状态转移矩阵a作用转移到相邻道路的概率分布定义为p
ss
。
[0093]
在本发明申请实施例的一个应用场景中p
ss
＝0.25。作为示例：每两条相邻道路之间的转移定义为一组动作a，s1到s2即为一组动作，s1到s7为一组动作，状态集合s中的道路之间的转移经过动作a参与作用后，转移到相邻道路的概率分布定义为p
ss
，例如s1到s2的概率，s1到s7的概率，默认每条道路从四个方向转移到相邻道路，即为0.25；创建转移矩阵，结合训练区域内道路分布：
[0094][0095]
s1003，将所述集合s每条道路长度的负数作为所述道路的初始回报函数r，总的回
报函数集合为r＝-s，衰减因子定义为γ；其中，在本发明申请实施例的一个应用场景中γ＝0.95。
[0096]
如图3-6所示，在本发明申请实施例中，初始回报函数r可以表示如下：
[0097]
r(s1)＝-s1,r(s2)＝-s2,...,r(s
54
)＝-s
54
[0098]
在本发明申请实施例中，总的回报函数集合r可以表示如下：
[0099]
r＝(-s1,-s2,...,-s
54
)
[0100]
s1004，初始化最优值函数v，采用迭代算法公式：
[0101][0102]
计算所有状态集合s获得收敛最优值函数v
*
(s)；其中，k为迭代当前状态；
[0103]
s1005，根据所有历史轨迹的路径，选择重复次数超过预设次数l的路径作为历史轨迹，对于任意一条历史轨迹tr＝s1→
s2→…→
s
q
，所述任意一条历史轨迹的训练集合为m。
[0104]
如图3-6所示，在本发明申请实施例的一个应用场景中可选取一条历史轨迹：
[0105]
tr1＝s3→
s2→
s7→
s
18
→
s
23
。
[0106]
s1006，根据历史轨迹的训练集合m，在历史轨迹数据的车速为每小时30公里情形下，计算其行程时间相符程度：
[0107]
当max
j∈m
(|t
j-t
k
|)≠min
j∈m
(|t
j-t
k
|)时，
[0108][0109]
当max
j∈m
(|t
j-t
k
|)＝min
j∈m
(|t
j-t
k
|)时，
[0110]
x(tr)＝1；
[0111]
其中，t
i
为历史轨迹的计算路径行程时间，t
j
为历史轨迹的统计路径行程时间，t
k
为历史轨迹的平均路径行程时间；
[0112]
s1007，根据历史轨迹的训练集合m，将每相邻两条道路的状态定义为s
i
、s
j
，计算s
i
转移至s
j
最优值函数：
[0113]
q(s
i
→
s
j
)＝r(s
i
)+γv
*
(s
j
)
[0114]
如图3-6所示，在本发明申请实施例的一个应用实例中，具体可以是：首先，获取mdp决策得到收敛的最优值函数v
*
(s)；然后，计算：
[0115]
q(s3→
s2)＝r(s3)+γv
*
(s2)，
[0116]
q(s2→
s7)＝r(s2)+γv
*
(s7)，
[0117]
q(s7→
s
18
)＝r(s7)+γv
*
(s
18
)，
[0118]
q(s
18
→
s
23
)＝r(s
18
)+γv
*
(s
23
)
[0119]
s1008，根据所述最优值函数求取s
i
至s
j
的转移概率：
[0120][0121]
其中，s
k
为s
i
相邻状态；
[0122]
如图3-6所示，在本发明申请实施例的一个应用实例中，具体可以是：
[0123][0124][0125][0126][0127]
s1009，计算历史轨迹tr在当前回报函数集合r和行程时间相符程度校正下的联合概率：
[0128][0129]
其中，m为大于1的历史轨迹的数量；
[0130]
如图3-6所示，在本发明申请实施例的一个应用实例中，一条轨迹情形下具体可以是：
[0131]
p1(tr1)＝p(s3→
s2)*p(s2→
s7)*p(s7→
s
18
)*p(s
18
→
s
23
)
[0132]
s1010，重复步骤s1005—s1009，计算n条用于训练的历史轨迹在当前回报值集合r下的联合概率：
[0133][0134]
在本发明申请实施例的一个应用实例中，n条轨迹情形下具体可以是：
[0135]
p
1*
＝p(tr1)
×
p(tr2)
×
,...,p(tr
123
)
[0136]
s1011，对当前回报值集合r下的每个状态的初始回报函数r在(r
-△
,r+
△
)区间进行采样，得到回报值集合r的新的回报值集合r
*
；
[0137]
在本发明申请实施例的一个应用实例中，新的回报值集合r
*
具体可以是由每个状态的初始回报函数r采样值，如图3-6所示：
[0138]
r
*
(s1)∈(r(s1)
-△
,r(s1)+
△
)，
[0139]
r
*
(s2)∈(r(s2)
-△
,r(s2)+
△
)，
[0140]
…
[0141]
r
*
(s
54
)∈(r(s
54
)
-△
,r(s
54
)+
△
)
[0142]
求出：
[0143]
r
*
＝(r
*
(s1),r
*
(s2)...,r
*
(s
54
))
[0144]
s1012，重复步骤s1005—s1009计算所有历史轨迹tr在新的回报函数集合r
*
和行程时间相符程度校正下的联合概率：
[0145][0146]
其中，m为大于1的历史轨迹的数量；
[0147]
s1013，根据联合概率p2(tr)，计算n条用于训练的历史轨迹在新的回报值集合r
*
下的联合概率：
[0148][0149]
在本发明申请实施例的一个应用实例中，n条轨迹情形下具体可以是：
[0150]
p
2*
＝p2(tr1)
×
p2(tr2)
×
,...,p2(tr
123
)
[0151]
s1014，根据的接受概率接受新的回报值集合r
*
；
[0152]
s1015，重复步骤s1011—s1014，直到满足步骤s14的接受概率条件，将接受新的回报值集合r
*
作为模型参数的当前回报值集合r。
[0153]
进一步，所述根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径的方法具体可以包括如下步骤：
[0154]
s1021，定义马尔科夫决策过程mdp模型，获取所有道路状态s，所有道路构成状态集合s*，对所述所有道路构成状态集合s*进行归一化处理，获得所有道路构成状态归一化集合s；
[0155]
每两条相邻道路之间的状态转移动作定义为状态转移矩阵a，所述集合s中道路之间的状态转变需所述状态转移矩阵a参与，所述集合s中道路之间的转变经所述状态转移矩阵a作用转移到相邻道路的概率分布定义为p
ss
；
[0156]
将所述集合s每条道路长度的负数作为所述道路的初始回报函数r，总的回报函数集合为r＝-s，衰减因子定义为γ；
[0157]
s1022，根据训练部分的步骤s1004—s1015得到更新后的回报值集合r；
[0158]
s1023，根据历史轨迹的训练集合创建图论g，每条道路为图论的顶点集合，相邻两条道路s
i
转移至s
j
的负对数为边权值：
[0159]
wm＝-ln(p(s
i
→
s
j
))；
[0160]
s1024，定义需要补全的路径起点为t
o
，终点为t
d
，在图论g中使用增加交叉口的方向补偿的最短路径法，计算得出补全的路径t
o
→
t1→
t2→…→
t
d
作为恢复的路径。
[0161]
在图论g中增加交叉口的方向补偿，举例s7、s
12
、s8是交叉口相邻三条道路，如图3-6所示，起点是s7,终点是s
12
，模型计算得出补偿路径s7→
s8→
s
12
，s7到s8，s8掉头到s
12
，经方向补偿得出s7→
s
12
；
[0162]
在补偿更新后的图论g中，使用最短路径法，例如需要恢复的路径起点为s7，终点为s
36
，在补偿更新后的图g中计算得出补全的路径s7→
s
13
→
s
19
→
s
30
→
s
36
，则s7→
s
13
→
s
19
→
s
30
→
s
36
即为恢复的路径。仿真结果如图7所示。
[0163]
实施例二
[0164]
本发明一实施例提供了一种路径规划方法，如图2所示，该路径规划方法具体可以包括如下步骤：
[0165]
s201，根据卫星导航接收机获取导航电文，提取卫星轨道关于起始轨迹路径和终止轨迹路径的关键坐标参数。
[0166]
s202，获取起始轨迹路径和终止轨迹路径；
[0167]
在路径规划的实际应用中，需要先确定起点与终点，即获取到起始轨迹路径和终止轨迹路径。
[0168]
在一个可选场景中，起始轨迹路径与终止轨迹路径可以通过获取用户输入的信息
所确定。在另一可选场景中，起始轨迹路径还可以通过进行卫星定位所确定。
[0169]
在本发明申请实施例中，具体是定义马尔科夫决策过程mdp模型，并通过用户输入的信息或通过进行卫星定位获取起始轨迹路径至所述终止轨迹路径的所有道路状态s，所有道路构成状态集合s*。在本发明申请实施例中，所有道路构成状态集合s*可以表示如下：
[0170]
s
*
＝(s1,s2,s3,...,s
54
)
[0171]
s203，根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径；其中，所述训练模型参数具体可以如下方法步骤获取：
[0172]
s2001，对所述所有道路构成状态集合s*进行归一化处理，获得所有道路构成状态归一化集合s；
[0173]
在本发明申请实施例中的归一化，具体是将矩阵中的每个状态，即道路的长度处理成[0,1]范围内，采用如下归一化公式进行处理：
[0174]
y＝(ymax-ymin)*(x-xmin)/(xmax-xmin)+ymin
[0175]
其中，ymax＝1，ymin＝0。
[0176]
s2002，每两条相邻道路之间的状态转移动作定义为状态转移矩阵a，所述集合s中道路之间的状态转变需所述状态转移矩阵a参与，所述集合s中道路之间的转变经所述状态转移矩阵a作用转移到相邻道路的概率分布定义为p
ss
。
[0177]
在本发明申请实施例的一个应用场景中p
ss
＝0.25。作为示例：每两条相邻道路之间的转移定义为一组动作a，s1到s2即为一组动作，s1到s7为一组动作，状态集合s中的道路之间的转移经过动作a参与作用后，转移到相邻道路的概率分布定义为p
ss
，例如s1到s2的概率，s1到s7的概率，默认每条道路从四个方向转移到相邻道路，即为0.25；创建转移矩阵，结合训练区域内道路分布：
[0178][0179]
s2003，将所述集合s每条道路长度的负数作为所述道路的初始回报函数r，总的回报函数集合为r＝-s，衰减因子定义为γ；其中，在本发明申请实施例的一个应用场景中γ＝0.95。
[0180]
如图3-6所示，在本发明申请实施例中，初始回报函数r可以表示如下：
[0181]
r(s1)＝-s1,r(s2)＝-s2,...,r(s
54
)＝-s
54
[0182]
在本发明申请实施例中，总的回报函数集合r可以表示如下：
[0183]
r＝(-s1,-s2,...,-s
54
)
[0184]
s2004，初始化最优值函数v，采用迭代算法公式：
[0185][0186]
计算所有状态集合s获得收敛最优值函数v
*
(s)；其中，k为迭代当前状态；
[0187]
s2005，根据所有历史轨迹的路径，选择重复次数超过预设次数l的路径作为历史轨迹，对于任意一条历史轨迹tr＝s1→
s2→…→
s
q
，所述任意一条历史轨迹的训练集合为m。
[0188]
如图3-6所示，在本发明申请实施例的一个应用场景中可选取一条历史轨迹：
[0189]
tr1＝s3→
s2→
s7→
s
18
→
s
23
。
[0190]
s2006，根据历史轨迹的训练集合m，在历史轨迹数据的车速为每小时30公里情形下，计算其行程时间相符程度：
[0191]
当max
j∈m
(|t
j-t
k
|)≠min
j∈m
(|t
j-t
k
|)时，
[0192][0193]
当max
j∈m
(|t
j-t
k
|)＝min
j∈m
(|t
j-t
k
|)时，
[0194]
x(tr)＝1；
[0195]
其中，t
i
为历史轨迹的计算路径行程时间，t
j
为历史轨迹的统计路径行程时间，t
k
为历史轨迹的平均路径行程时间；
[0196]
s2007，根据历史轨迹的训练集合m，将每相邻两条道路的状态定义为s
i
、s
j
，计算s
i
转移至s
j
最优值函数：
[0197]
q(s
i
→
s
j
)＝r(s
i
)+γv
*
(s
j
)
[0198]
如图3-6所示，在本发明申请实施例的一个应用实例中，具体可以是：首先，获取mdp决策得到收敛的最优值函数v
*
(s)；然后，计算：
[0199]
q(s3→
s2)＝r(s3)+γv
*
(s2)，
[0200]
q(s2→
s7)＝r(s2)+γv
*
(s7)，
[0201]
q(s7→
s
18
)＝r(s7)+γv
*
(s
18
)，
[0202]
q(s
18
→
s
23
)＝r(s
18
)+γv
*
(s
23
)
[0203]
s2008，根据所述最优值函数求取s
i
至s
j
的转移概率：
[0204][0205]
其中，s
k
为s
i
相邻状态；
[0206]
如图3-6所示，在本发明申请实施例的一个应用实例中，具体可以是：
[0207][0208][0209][0210][0211]
s2009，计算历史轨迹tr在当前回报函数集合r和行程时间相符程度校正下的联合概率：
[0212][0213]
其中，m为大于1的历史轨迹的数量；
[0214]
如图3-6所示，在本发明申请实施例的一个应用实例中，一条轨迹情形下具体可以是：
[0215]
p1(tr1)＝p(s3→
s2)*p(s2→
s7)*p(s7→
s
18
)*p(s
18
→
s
23
)
[0216]
s2010，重复步骤s2005—s2009，计算n条用于训练的历史轨迹在当前回报值集合r下的联合概率：
[0217][0218]
在本发明申请实施例的一个应用实例中，n条轨迹情形下具体可以是：
[0219]
p
1*
＝p(tr1)
×
p(tr2)
×
,...,p(tr
123
)
[0220]
s2011，对当前回报值集合r下的每个状态的初始回报函数r在(r
-△
,r+
△
)区间进行采样，得到回报值集合r的新的回报值集合r
*
；
[0221]
如图3-6所示，在本发明申请实施例的一个应用实例中，新的回报值集合r
*
具体可以是由每个状态的初始回报函数r采样值：
[0222]
r
*
(s1)∈(r(s1)
-△
,r(s1)+
△
)，
[0223]
r
*
(s2)∈(r(s2)
-△
,r(s2)+
△
)，
[0224]
…
[0225]
r
*
(s
54
)∈(r(s
54
)
-△
,r(s
54
)+
△
)
[0226]
求出：
[0227]
r
*
＝(r
*
(s1),r
*
(s2)...,r
*
(s
54
))
[0228]
s2012，重复步骤s2005—s2009计算所有历史轨迹tr在新的回报函数集合r
*
和行程时间相符程度校正下的联合概率：
[0229][0230]
其中，m为大于1的历史轨迹的数量；
[0231]
s2013，根据联合概率p2(tr)，计算n条用于训练的历史轨迹在新的回报值集合r
*
下的联合概率：
[0232][0233]
在本发明申请实施例的一个应用实例中，n条轨迹情形下具体可以是：
[0234]
p
2*
＝p2(tr1)
×
p2(tr2)
×
,...,p2(tr
123
)
[0235]
s2014，根据的接受概率接受新的回报值集合r
*
；
[0236]
s2015，重复步骤s2011—s2014，直到满足步骤s14的接受概率条件，将接受新的回报值集合r
*
作为模型参数的当前回报值集合r。
[0237]
进一步，所述根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径的方法具体可以包括如下步骤：
[0238]
s2021，定义马尔科夫决策过程mdp模型，获取所有道路状态s，所有道路构成状态集合s*，对所述所有道路构成状态集合s*进行归一化处理，获得所有道路构成状态归一化集合s；
[0239]
每两条相邻道路之间的状态转移动作定义为状态转移矩阵a，所述集合s中道路之
间的状态转变需所述状态转移矩阵a参与，所述集合s中道路之间的转变经所述状态转移矩阵a作用转移到相邻道路的概率分布定义为p
ss
；
[0240]
将所述集合s每条道路长度的负数作为所述道路的初始回报函数r，总的回报函数集合为r＝-s，衰减因子定义为γ；
[0241]
s2022，根据训练部分的步骤s2004—s2015得到更新后的回报值集合r；
[0242]
s2023，根据历史轨迹的训练集合创建图论g，每条道路为图论的顶点集合，相邻两条道路s
i
转移至s
j
的负对数为边权值：
[0243]
wm＝-ln(p(s
i
→
s
j
))；
[0244]
s2024，定义需要补全的路径起点为t
o
，终点为t
d
，在图论g中使用增加交叉口的方向补偿的最短路径法，计算得出补全的路径t
o
→
t1→
t2→…→
t
d
作为恢复的路径。
[0245]
在图论g中增加交叉口的方向补偿，举例s7、s
12
、s8是交叉口相邻三条道路，如图3-6所示，起点是s7,终点是s
12
，模型计算得出补偿路径s7→
s8→
s
12
，s7到s8，s8掉头到s
12
，经方向补偿得出s7→
s
12
；
[0246]
在补偿更新后的图论g中，使用最短路径法，例如需要恢复的路径起点为s7，终点为s
36
，在补偿更新后的图g中计算得出补全的路径s7→
s
13
→
s
19
→
s
30
→
s
36
，则s7→
s
13
→
s
19
→
s
30
→
s
36
即为恢复的路径。仿真结果如图7所示，
[0247]
s204，根据所述起始轨迹路径、所述终止轨迹路径及缺失路径构建目标行驶路径；同时，将恢复的缺失路径数据反馈至终端，并通过可视化方式展示出来。
[0248]
实施例三
[0249]
本发明一实施例提供了一种路径规划系统，如图8所示，该路径规划系统具体可以包括如下模块：
[0250]
获取模块，用于获取起始轨迹路径和终止轨迹路径；
[0251]
在路径规划的实际应用中，需要先确定起点与终点，即获取到起始轨迹路径和终止轨迹路径。
[0252]
在一个可选场景中，起始轨迹路径与终止轨迹路径可以通过获取用户输入的信息所确定。在另一可选场景中，起始轨迹路径还可以通过进行卫星定位所确定。
[0253]
在本发明申请实施例中，具体是定义马尔科夫决策过程mdp模型，并通过用户输入的信息或通过进行卫星定位获取起始轨迹路径至所述终止轨迹路径的所有道路状态s，所有道路构成状态集合s*。在本发明申请实施例中，所有道路构成状态集合s*可以表示如下：
[0254]
s
*
＝(s1,s2,s3,...,s
54
)
[0255]
恢复模块，用于根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径；其中，所述训练模型参数具体可以如下方法步骤获取：
[0256]
s3001，对所述所有道路构成状态集合s*进行归一化处理，获得所有道路构成状态归一化集合s；
[0257]
在本发明申请实施例中的归一化，具体是将矩阵中的每个状态，即道路的长度处理成[0,1]范围内，采用如下归一化公式进行处理：
[0258]
y＝(ymax-ymin)*(x-xmin)/(xmax-xmin)+ymin
[0259]
其中，ymax＝1，ymin＝0。
[0260]
s3002，每两条相邻道路之间的状态转移动作定义为状态转移矩阵a，所述集合s中道路之间的状态转变需所述状态转移矩阵a参与，所述集合s中道路之间的转变经所述状态转移矩阵a作用转移到相邻道路的概率分布定义为p
ss
。
[0261]
在本发明申请实施例的一个应用场景中p
ss
＝0.25。作为示例：每两条相邻道路之间的转移定义为一组动作a，s1到s2即为一组动作，s1到s7为一组动作，状态集合s中的道路之间的转移经过动作a参与作用后，转移到相邻道路的概率分布定义为p
ss
，例如s1到s2的概率，s1到s7的概率，默认每条道路从四个方向转移到相邻道路，即为0.25；创建转移矩阵，结合训练区域内道路分布：
[0262][0263]
s3003，将所述集合s每条道路长度的负数作为所述道路的初始回报函数r，总的回报函数集合为r＝-s，衰减因子定义为γ；其中，在本发明申请实施例的一个应用场景中γ＝0.95。
[0264]
在本发明申请实施例中，初始回报函数r可以表示如下：
[0265]
r(s1)＝-s1,r(s2)＝-s2,...,r(s
54
)＝-s
54
[0266]
在本发明申请实施例中，总的回报函数集合r可以表示如下：
[0267]
r＝(-s1,-s2,...,-s
54
)
[0268]
s3004，初始化最优值函数v，采用迭代算法公式：
[0269][0270]
计算所有状态集合s获得收敛最优值函数v
*
(s)；其中，k为迭代当前状态；
[0271]
s3005，根据所有历史轨迹的路径，选择重复次数超过预设次数l的路径作为历史轨迹，对于任意一条历史轨迹tr＝s1→
s2→…→
s
q
，所述任意一条历史轨迹的训练集合为m。
[0272]
在本发明申请实施例的一个应用场景中可选取一条历史轨迹：
[0273]
tr1＝s3→
s2→
s7→
s
18
→
s
23
。
[0274]
s3006，根据历史轨迹的训练集合m，在历史轨迹数据的车速为每小时30公里情形下，计算其行程时间相符程度：
[0275]
当max
j∈m
(|t
j-t
k
|)≠min
j∈m
(|t
j-t
k
|)时，
[0276][0277]
当max
j∈m
(|t
j-t
k
|)＝min
j∈m
(|t
j-t
k
|)时，
[0278]
x(tr)＝1；
[0279]
其中，t
i
为历史轨迹的计算路径行程时间，t
j
为历史轨迹的统计路径行程时间，t
k
为历史轨迹的平均路径行程时间；
[0280]
s3007，根据历史轨迹的训练集合m，将每相邻两条道路的状态定义为s
i
、s
j
，计算s
i
转移至s
j
最优值函数：
[0281]
q(s
i
→
s
j
)＝r(s
i
)+γv
*
(s
j
)
[0282]
在本发明申请实施例的一个应用实例中，具体可以是：首先，获取mdp决策得到收敛的最优值函数v
*
(s)；然后，计算：
[0283]
q(s3→
s2)＝r(s3)+γv
*
(s2)，
[0284]
q(s2→
s7)＝r(s2)+γv
*
(s7)，
[0285]
q(s7→
s
18
)＝r(s7)+γv
*
(s
18
)，
[0286]
q(s
18
→
s
23
)＝r(s
18
)+γv
*
(s
23
)
[0287]
s3008，根据所述最优值函数求取s
i
至s
j
的转移概率：
[0288][0289]
其中，s
k
为s
i
相邻状态；
[0290]
在本发明申请实施例的一个应用实例中，具体可以是：
[0291][0292][0293][0294][0295]
s3009，计算历史轨迹tr在当前回报函数集合r和行程时间相符程度校正下的联合概率：
[0296][0297]
其中，m为大于1的历史轨迹的数量；
[0298]
在本发明申请实施例的一个应用实例中，一条轨迹情形下具体可以是：
[0299]
p1(tr1)＝p(s3→
s2)*p(s2→
s7)*p(s7→
s
18
)*p(s
18
→
s
23
)
[0300]
s3010，重复步骤s3005—s3009，计算n条用于训练的历史轨迹在当前回报值集合r下的联合概率：
[0301][0302]
在本发明申请实施例的一个应用实例中，n条轨迹情形下具体可以是：
[0303]
p
1*
＝p(tr1)
×
p(tr2)
×
,...,p(tr
123
)
[0304]
s3011，对当前回报值集合r下的每个状态的初始回报函数r在(r
-△
,r+
△
)区间进行采样，得到回报值集合r的新的回报值集合r
*
；
[0305]
在本发明申请实施例的一个应用实例中，新的回报值集合r
*
具体可以是由每个状态的初始回报函数r采样值：
[0306]
r
*
(s1)∈(r(s1)
-△
,r(s1)+
△
)，
[0307]
r
*
(s2)∈(r(s2)
-△
,r(s2)+
△
)，
[0308]
…
[0309]
r
*
(s
54
)∈(r(s
54
)
-△
,r(s
54
)+
△
)
[0310]
求出：
[0311]
r
*
＝(r
*
(s1),r
*
(s2)...,r
*
(s
54
))
[0312]
s3012，重复步骤s3005—s3009计算所有历史轨迹tr在新的回报函数集合r
*
和行程时间相符程度校正下的联合概率：
[0313][0314]
其中，m为大于1的历史轨迹的数量；
[0315]
s3013，根据联合概率p2(tr)，计算n条用于训练的历史轨迹在新的回报值集合r
*
下的联合概率：
[0316][0317]
在本发明申请实施例的一个应用实例中，n条轨迹情形下具体可以是：
[0318]
p
2*
＝p2(tr1)
×
p2(tr2)
×
,...,p2(tr
123
)
[0319]
s3014，根据的接受概率接受新的回报值集合r
*
；
[0320]
s3015，重复步骤s3011—s3014，直到满足步骤s14的接受概率条件，将接受新的回报值集合r
*
作为模型参数的当前回报值集合r。
[0321]
进一步，所述根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径的方法具体可以包括如下步骤：
[0322]
s3021，定义马尔科夫决策过程mdp模型，获取所有道路状态s，所有道路构成状态集合s*，对所述所有道路构成状态集合s*进行归一化处理，获得所有道路构成状态归一化集合s；
[0323]
每两条相邻道路之间的状态转移动作定义为状态转移矩阵a，所述集合s中道路之间的状态转变需所述状态转移矩阵a参与，所述集合s中道路之间的转变经所述状态转移矩阵a作用转移到相邻道路的概率分布定义为p
ss
；
[0324]
将所述集合s每条道路长度的负数作为所述道路的初始回报函数r，总的回报函数集合为r＝-s，衰减因子定义为γ；
[0325]
s3022，根据训练部分的步骤s3004—s3015得到更新后的回报值集合r；
[0326]
s3023，根据历史轨迹的训练集合创建图论g，每条道路为图论的顶点集合，相邻两条道路s
i
转移至s
j
的负对数为边权值：
[0327]
wm＝-ln(p(s
i
→
s
j
))；
[0328]
s3024，定义需要补全的路径起点为t
o
，终点为t
d
，在图论g中使用增加交叉口的方向补偿的最短路径法，计算得出补全的路径t
o
→
t1→
t2→…→
t
d
作为恢复的路径。
[0329]
在图论g中增加交叉口的方向补偿，举例s7、s
12
、s8是交叉口相邻三条道路，起点是s7,终点是s
12
，模型计算得出补偿路径s7→
s8→
s
12
，s7到s8，s8掉头到s
12
，经方向补偿得出s7→
s
12
；
[0330]
在补偿更新后的图论g中，使用最短路径法，例如需要恢复的路径起点为s7，终点为s
36
，在补偿更新后的图g中计算得出补全的路径s7→
s
13
→
s
19
→
s
30
→
s
36
，则s7→
s
13
→
s
19
→
s
30
→
s
36
即为恢复的路径。
[0331]
实施例四
[0332]
本发明一实施例提供了一种路径规划系统，如图9所示，该路径规划系统具体可以包括如下模块：
[0333]
通信总线，用于实现处理器与存储器间的连接通信；
[0334]
存储器，用于存储计算机程序；存储器可能包含高速ram存储器，也可能还包含非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器可选的可以包含至少一个存储装置。
[0335]
处理器，用于执行上述计算机程序以实现如下步骤：
[0336]
首先，根据卫星导航接收机获取导航电文，提取卫星轨道关于起始轨迹路径和终止轨迹路径的关键坐标参数。
[0337]
其次，获取起始轨迹路径和终止轨迹路径；
[0338]
在路径规划的实际应用中，需要先确定起点与终点，即获取到起始轨迹路径和终止轨迹路径。
[0339]
在一个可选场景中，起始轨迹路径与终止轨迹路径可以通过获取用户输入的信息所确定。在另一可选场景中，起始轨迹路径还可以通过进行卫星定位所确定。
[0340]
在本发明申请实施例中，具体是定义马尔科夫决策过程mdp模型，并通过用户输入的信息或通过进行卫星定位获取起始轨迹路径至所述终止轨迹路径的所有道路状态s，所有道路构成状态集合s*。在本发明申请实施例中，所有道路构成状态集合s*可以表示如下：
[0341]
s
*
＝(s1,s2,s3,...,s
54
)
[0342]
然后，根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径；其中，所述训练模型参数具体可以如下方法步骤获取：
[0343]
s4001，对所述所有道路构成状态集合s*进行归一化处理，获得所有道路构成状态归一化集合s；
[0344]
在本发明申请实施例中的归一化，具体是将矩阵中的每个状态，即道路的长度处理成[0,1]范围内，采用如下归一化公式进行处理：
[0345]
y＝(ymax-ymin)*(x-xmin)/(xmax-xmin)+ymin
[0346]
其中，ymax＝1，ymin＝0。
[0347]
s4002，每两条相邻道路之间的状态转移动作定义为状态转移矩阵a，所述集合s中道路之间的状态转变需所述状态转移矩阵a参与，所述集合s中道路之间的转变经所述状态转移矩阵a作用转移到相邻道路的概率分布定义为p
ss
。
[0348]
在本发明申请实施例的一个应用场景中p
ss
＝0.25。作为示例：每两条相邻道路之间的转移定义为一组动作a，s1到s2即为一组动作，s1到s7为一组动作，状态集合s中的道路之间的转移经过动作a参与作用后，转移到相邻道路的概率分布定义为p
ss
，例如s1到s2的概率，s1到s7的概率，默认每条道路从四个方向转移到相邻道路，即为0.25；创建转移矩阵，结合训练区域内道路分布：
[0349][0350]
s4003，将所述集合s每条道路长度的负数作为所述道路的初始回报函数r，总的回报函数集合为r＝-s，衰减因子定义为γ；其中，在本发明申请实施例的一个应用场景中γ＝0.95。
[0351]
在本发明申请实施例中，初始回报函数r可以表示如下：
[0352]
r(s1)＝-s1,r(s2)＝-s2,...,r(s
54
)＝-s
54
[0353]
在本发明申请实施例中，总的回报函数集合r可以表示如下：
[0354]
r＝(-s1,-s2,...,-s
54
)
[0355]
s4004，初始化最优值函数v，采用迭代算法公式：
[0356][0357]
计算所有状态集合s获得收敛最优值函数v
*
(s)；其中，k为迭代当前状态；
[0358]
s4005，根据所有历史轨迹的路径，选择重复次数超过预设次数l的路径作为历史轨迹，对于任意一条历史轨迹tr＝s1→
s2→…→
s
q
，所述任意一条历史轨迹的训练集合为m。
[0359]
在本发明申请实施例的一个应用场景中可选取一条历史轨迹：
[0360]
tr1＝s3→
s2→
s7→
s
18
→
s
23
。
[0361]
s4006，根据历史轨迹的训练集合m，在历史轨迹数据的车速为每小时30公里情形下，计算其行程时间相符程度：
[0362]
当max
j∈m
(|t
j-t
k
|)≠min
j∈m
(|t
j-t
k
|)时，
[0363][0364]
当max
j∈m
(|t
j-t
k
|)＝min
j∈m
(|t
j-t
k
|)时，
[0365]
x(tr)＝1；
[0366]
其中，t
i
为历史轨迹的计算路径行程时间，t
j
为历史轨迹的统计路径行程时间，t
k
为历史轨迹的平均路径行程时间；
[0367]
s4007，根据历史轨迹的训练集合m，将每相邻两条道路的状态定义为s
i
、s
j
，计算s
i
转移至s
j
最优值函数：
[0368]
q(s
i
→
s
j
)＝r(s
i
)+γv
*
(s
j
)
[0369]
在本发明申请实施例的一个应用实例中，具体可以是：首先，获取mdp决策得到收敛的最优值函数v
*
(s)；然后，计算：
[0370]
q(s3→
s2)＝r(s3)+γv
*
(s2)，
[0371]
q(s2→
s7)＝r(s2)+γv
*
(s7)，
[0372]
q(s7→
s
18
)＝r(s7)+γv
*
(s
18
)，
[0373]
q(s
18
→
s
23
)＝r(s
18
)+γv
*
(s
23
)
[0374]
s4008，根据所述最优值函数求取s
i
至s
j
的转移概率：
[0375][0376]
其中，s
k
为s
i
相邻状态；
[0377]
在本发明申请实施例的一个应用实例中，具体可以是：
[0378][0379][0380][0381][0382]
s4009，计算历史轨迹tr在当前回报函数集合r和行程时间相符程度校正下的联合概率：
[0383][0384]
其中，m为大于1的历史轨迹的数量；
[0385]
在本发明申请实施例的一个应用实例中，一条轨迹情形下具体可以是：
[0386]
p1(tr1)＝p(s3→
s2)*p(s2→
s7)*p(s7→
s
18
)*p(s
18
→
s
23
)
[0387]
s4010，重复步骤s4005—s0409，计算n条用于训练的历史轨迹在当前回报值集合r下的联合概率：
[0388][0389]
在本发明申请实施例的一个应用实例中，n条轨迹情形下具体可以是：
[0390]
p
1*
＝p(tr1)
×
p(tr2)
×
,...,p(tr
123
)
[0391]
s4011，对当前回报值集合r下的每个状态的初始回报函数r在(r
-△
,r+
△
)区间进行采样，得到回报值集合r的新的回报值集合r
*
；
[0392]
在本发明申请实施例的一个应用实例中，新的回报值集合r
*
具体可以是由每个状态的初始回报函数r采样值：
[0393]
r
*
(s1)∈(r(s1)
-△
,r(s1)+
△
)，
[0394]
r
*
(s2)∈(r(s2)
-△
,r(s2)+
△
)，
[0395]
…
[0396]
r
*
(s
54
)∈(r(s
54
)
-△
,r(s
54
)+
△
)
[0397]
求出：
[0398]
r
*
＝(r
*
(s1),r
*
(s2)...,r
*
(s
54
))
[0399]
s4012，重复步骤s4005—s4009计算所有历史轨迹tr在新的回报函数集合r
*
和行程时间相符程度校正下的联合概率：
[0400]
[0401]
其中，m为大于1的历史轨迹的数量；
[0402]
s4013，根据联合概率p2(tr)，计算n条用于训练的历史轨迹在新的回报值集合r
*
下的联合概率：
[0403][0404]
在本发明申请实施例的一个应用实例中，n条轨迹情形下具体可以是：
[0405]
p
2*
＝p2(tr1)
×
p2(tr2)
×
,...,p2(tr
123
)
[0406]
s4014，根据的接受概率接受新的回报值集合r
*
；
[0407]
s4015，重复步骤s4011—s4014，直到满足步骤s14的接受概率条件，将接受新的回报值集合r
*
作为模型参数的当前回报值集合r。
[0408]
进一步，所述根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径的方法具体可以包括如下步骤：
[0409]
s4021，定义马尔科夫决策过程mdp模型，获取所有道路状态s，所有道路构成状态集合s*，对所述所有道路构成状态集合s*进行归一化处理，获得所有道路构成状态归一化集合s；
[0410]
每两条相邻道路之间的状态转移动作定义为状态转移矩阵a，所述集合s中道路之间的状态转变需所述状态转移矩阵a参与，所述集合s中道路之间的转变经所述状态转移矩阵a作用转移到相邻道路的概率分布定义为p
ss
；
[0411]
将所述集合s每条道路长度的负数作为所述道路的初始回报函数r，总的回报函数集合为r＝-s，衰减因子定义为γ；
[0412]
s4022，根据训练部分的步骤s4004—s4015得到更新后的回报值集合r；
[0413]
s4023，根据历史轨迹的训练集合创建图论g，每条道路为图论的顶点集合，相邻两条道路s
i
转移至s
j
的负对数为边权值：
[0414]
wm＝-ln(p(s
i
→
s
j
))；
[0415]
s4024，定义需要补全的路径起点为t
o
，终点为t
d
，在图论g中使用增加交叉口的方向补偿的最短路径法，计算得出补全的路径t
o
→
t1→
t2→…→
t
d
作为恢复的路径。
[0416]
在图论g中增加交叉口的方向补偿，举例s7、s
12
、s8是交叉口相邻三条道路，起点是s7,终点是s
12
，模型计算得出补偿路径s7→
s8→
s
12
，s7到s8，s8掉头到s
12
，经方向补偿得出s7→
s
12
；
[0417]
在补偿更新后的图论g中，使用最短路径法，例如需要恢复的路径起点为s7，终点为s
36
，在补偿更新后的图g中计算得出补全的路径s7→
s
13
→
s
19
→
s
30
→
s
36
，则s7→
s
13
→
s
19
→
s
30
→
s
36
即为恢复的路径。
[0418]
最后，根据所述起始轨迹路径、所述终止轨迹路径及缺失路径构建目标行驶路径；同时，将恢复的缺失路径数据反馈至终端，并通过可视化方式展示出来。
[0419]
本实施例中的处理器可能是一种集成电路芯片，具有信号处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。上述处理器可以是微处理器或者上述处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。
[0420]
实施例五
[0421]
本发明一实施例提供了一种计算机可读存储介质，其上存储有计算机程序，上述计算机程序被处理器执行时实现上述的路径规划方法。
[0422]
综上所述，本发明实施例提供的一种路径规划方法、路径规划系统、电子设备及计算机存储介质，通过在训练阶段对训练区域的道路数据归一化标准，提取历史轨迹的路径集合并添加了时间相符程度，训练满足历史轨迹下的最优回报函数值；在路径恢复阶段用所得最优回报函数值计算相邻道路之间的转移概率，并将道路与道路之间的转移概率作为边权值创建图论，同时加入了交叉口的方向补偿，对车辆掉头选择做出了优化补偿，在更新后的图论基础上采用最短路径法对缺失路径恢复，使得在多道路的缺失下依然能保持恢复的准确度，解决现有技术存在的多道路的缺失下准确度错的问题。
[0423]
需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本发明所必须的。
[0424]
上述实施例，可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时，上述实施例可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行该计算机程序指令时，全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，dvd)、或者半导体介质。半导体介质可以是固态硬盘。
[0425]
本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。
[0426]
在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。
[0427]
所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
[0428]
在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
[0429]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0430]
另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0431]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-only memory，rom)、随机存取存储器(random access memory，ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0432]
本发明是参照本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0433]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0434]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0435]
需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存
在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0436]
最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王涛;刘承堃;王晨
技术所有人：桂林电子科技大学
我是此专利的发明人

上一篇：用于传送家禽的机组和方法与流程
上一篇：基于TR069协议的宽带无线网络管理系统、方法和存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、邢老师：1.机械设计及理论 2.生物医学材料及器械 3.声发射检测技术。
2、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
3、王老师：1.机器人 2.嵌入式控制系统开发
4、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。