本发明涉及电子地图领域,具体涉及一种生成地图车道线的聚类参数的确定方法及系统。
背景技术:
为了生成高精度地图中的车道线数据,需要对大量从车端上传的车道线矢量数据做聚类,当前的聚类的常用算法是基于线段的密度聚类算法dbscan(density-basedspatialclusteringofapplicationswithnoise)。dbscan为一个比较有代表性的基于密度的聚类算法,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类,但聚类之前需要选择eps和minpts这两个聚类参数,eps为核心点半径,minpts为半径区域内的核心点最小个数。
这两个聚类参数常常是通过业务经验得到,在不同的场景,会有不同的取值,这种人工干预行为不利于高精度地图的自动化生成。
技术实现要素:
本发明针对现有技术中存在的技术问题,提供一种生成地图车道线的聚类参数的确定方法及系统。
本发明解决上述技术问题的技术方案如下:一种生成地图车道线的聚类参数的确定方法,包括:所述聚类参数包括密度聚类的半径参数,所述确定方法包括:
步骤1,设置半径区域内的核心点最小个数的值minpts,确定用于聚类的车道线中的各条线段到最近的第k条线段的距离数组,其中,k=minpts-1;
步骤2,将各条线段到最近的第k条线段的所述距离数组的分布转换成累积概率曲线;
步骤3,确定所述密度聚类的半径参数的值eps为所述累积概率曲线的拐点对应的距离或者所述距离数组的中位数。
一种生成地图车道线的聚类参数的确定系统,所述聚类参数包括密度聚类的半径参数,所述确定系统包括:距离数组确定模块、累计概率曲线转换模块和聚类参数确定模块;
距离数组确定模块,用于设置半径区域内的核心点最小个数的值minpts,确定用于聚类的车道线中的各条线段到最近的第k条线段的距离数组,其中,k=minpts-1;
累计概率曲线转换模块,用于将各条线段到最近的第k条线段的所述距离数组的分布转换成累积概率曲线;
聚类参数确定模块,用于确定所述密度聚类的半径参数的值eps为所述累积概率曲线的拐点对应的距离或者所述距离数组的中位数。
一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述生成地图车道线的聚类参数的确定方法的步骤。
本发明的有益效果是:根据用于聚类的车道线中线段之间的距离确定密度聚类的半径参数,该确定过程可以通过系统自动确定,实现地图车道线的聚类过程中的自动化调参,不用人工干预即可得到较好的结果。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述聚类参数包括半径区域内的核心点最小个数;
所述步骤1中设置的半径区域内的核心点最小个数的值minpts为有效观测到的车道线的次数。
所述步骤1中两条线段的距离为两条线段的垂直距离、平行距离和角度距离的加权和。
所述步骤1中确定用于聚类的车道线中的各条线段到最近的第k条线段的距离数组的过程包括:
步骤101,计算用于聚类的车道线中的两两线段之间的距离,构成距离矩阵;
步骤102,对所述距离矩阵进行横向从小到大的排序后,对所述距离矩阵中的第k列进行纵向排序,得到从小到大排序的各条线段到最近的第k条线段的距离数组。
所述步骤2包括:
步骤201,设置距离区间,得到所述距离数组分别落在每个所述距离区间的距离个数,各个所述距离个数除以距离的总个数表示所述距离区间的概率,得到以所述距离区间节点为自变量、所述概率为因变量的概率密度曲线;
步骤202,绘制以所述距离区间节点为自变量、距离区间节点及其之前的累积概率为因变量的累积概率曲线。
所述步骤3包括:
步骤301,采用最小二乘法对所述累积概率曲线进行曲线拟合得到累积概率曲线的拟合多项式;
步骤302,求所述拟合多项式的二阶导数为0的方程的解;
步骤303,计算得到所述方程有在正常区域的解时,确定所述密度聚类的半径参数的值eps为所述累积概率曲线的拐点对应的距离;否则确定所述密度聚类的半径参数的值eps为所述距离数组的中位数。
所述步骤303中所述距离数组的中位数为:
当n为奇数时,m=x(n+1)/2;当n为偶数时,
m表示所述距离数组的中位数,n表示所述距离数组的数据个数,x1...xn表示从小到大排序的所述距离数组的单个数据。
采用上述进一步方案的有益效果是,计算距离矩阵并排序,并将距离在把每个区间概率转换成累积概率,得到一条单调上升地累积概率曲线,可以更方便地获取距离变化的拐点,使整个聚类参数的确定过程简单明了,结果经试验准确率高。
附图说明
图1为本发明实施例提供的一种生成地图车道线的聚类参数的确定方法流程图;
图2为本发明提供的一种生成地图车道线的聚类参数的确定方法的实施例的流程图;
图3为本发明提供的一种生成地图车道线的聚类参数的确定方法的实施例中线段序号和距离的对应关系图;
图4为本发明提供的一种生成地图车道线的聚类参数的确定方法的实施例中概率密度和累积概率密度图;
图5为本发明提供的一种生成地图车道线的聚类参数的确定方法的实施例中不同k值的累积概率曲线的拐点示意图;
图6为本发明提供的一种生成地图车道线的聚类参数的确定方法的实施例中根据确定的聚类参数的计算结果图;
图7为本发明提供的一种生成地图车道线的聚类参数的确定系统的结构框图。
附图中,各标号所代表的部件列表如下:
1、距离数组确定模块2、累计概率曲线转换模块,3、聚类参数确定模块。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示为本发明实施例提供的一种生成地图车道线的聚类参数的确定方法流程图,由图1可知,该聚类参数包括密度聚类的半径参数,该方法包括:
步骤1,设置半径区域内的核心点最小个数的值minpts,确定用于聚类的车道线中的各条线段到最近的第k条线段的距离数组,其中,k=minpts-1。
步骤2,将各条线段到最近的第k条线段的距离数组的分布转换成累积概率曲线。
步骤3,确定密度聚类的半径参数的值eps为该累积概率曲线的拐点对应的距离或者该距离数组的中位数。
本发明实施例提供的一种生成地图车道线的聚类参数的确定方法,根据用于聚类的车道线中线段之间的距离确定密度聚类的半径参数,该确定过程可以通过系统自动确定,实现地图车道线的聚类过程中的自动化调参,不用人工干预即可得到较好的结果。
实施例1
本发明提供的实施例1为本发明提供的一种生成地图车道线的聚类参数的确定方法的实施例,该实施例中确定的聚类参数包括半径区域内的核心点最小个数和密度聚类的半径参数。如图2所示为本发明提供的一种生成地图车道线的聚类参数的确定方法的实施例的流程图。
步骤1,设置半径区域内的核心点最小个数的值minpts,确定用于聚类的车道线中的各条线段到最近的第k条线段的距离数组,其中,k=minpts-1。
其中,步骤1中设置的半径区域内的核心点最小个数的值minpts为有效观测到的车道线的次数。例如,有效观察到车道线4次则认为该车道线存在,那么半径区域内的核心点最小个数的值minpts固定为4。
两条线段的距离定义为trajectory-hausdorff距离,为两条线段的垂直距离、平行距离和角度距离的加权和,公式为:
dhausdorff=w⊥·d⊥+w||·d||+wθdθ;
其中,dhausdorff表示两条线段之间的trajectory-hausdorff距离,w⊥表示垂直距离的权值,w||表示平行距离的权值,wθ表示角度距离的权值,d⊥表示垂直距离,d||表示平行距离,dθ表示角度距离。
步骤1中确定用于聚类的车道线中的各条线段到最近的第k条线段的距离数组的过程包括:
步骤101,计算用于聚类的车道线中的两两线段之间的距离,构成距离矩阵。
步骤102,对距离矩阵进行横向从小到大的排序后,对距离矩阵中的第k列进行纵向排序,得到从小到大排序的各条线段到最近的第k条线段的距离数组。
对距离矩阵进行横向从小到大的排序后,该任一横向的排序表示的是某一线段到其他所有线段的距离的排序。则距离矩阵中的第k列表示的是各条线段到最近的第k条线段的距离,对距离矩阵中的第k列进行纵向排序后即为各条线段到最近的第k条线段的距离分布结果。k=minpts-1,并且k的值不能超过线段的总个数。
如图3所示为本发明提供的一种生成地图车道线的聚类参数的确定方法的实施例中线段序号和距离的对应关系图。图3中,横轴表示排序后的线段序号i,i的范围是0-35,纵轴表示序号为i的线段到最近的第k条线段的距离。即图3展示了k值不同时,序号为i的线段到最近的第k条线段的距离。
步骤2,将各条线段到最近的第k条线段的距离数组的分布转换成累积概率曲线。
该步骤2包括:
步骤201,设置距离区间,得到距离数组分别落在每个距离区间的距离个数,各个距离个数除以距离的总个数表示该距离区间的概率,得到以距离区间节点为自变量、概率为因变量的概率密度曲线。
步骤202,绘制以距离区间节点为自变量、距离区间节点及其之前的累积概率为因变量的累积概率曲线。
把每个区间概率转换成累积概率,得到一条单调上升地累积概率曲线,可以更方便地获取距离变化地拐点。
如图4所示为本发明提供的一种生成地图车道线的聚类参数的确定方法的实施例中概率密度和累积概率密度图,图4给出的实施例中,距离区间为0.1m,k的值为3。图4中下方的曲线为概率分布曲线,各个距离区间节点0.1、0.2、0.3……1.4对应的概率,上方为累积概率分布曲线,各个距离区间节点0.1、0.2、0.3……1.4对应的累积概率。
步骤3,确定密度聚类的半径参数的值eps为该累积概率曲线的拐点对应的距离或者该距离数组的中位数。
从图3的整体上看,大部分曲线都是在平缓上升后再急剧上升,大部分值落在平缓的区间,只要找到从平缓到急剧上升的拐点,即可把该点所对应的距离设为eps。
步骤3包括:
步骤301,采用最小二乘法对累积概率曲线进行曲线拟合得到累积概率曲线的拟合多项式。
为了保证精度和方便计算拐点,以拟合4次为例,拟合多项式为:y=c0x4+c1x3+c2x2+c3x+c4。
其中,x表示自变量,y表示因变量,c0c1c2c3c4为常数。
步骤302,求该拟合多项式的二阶导数为0的方程的解。
通过多项式二阶导为0得到:dy=12c0x2+6c1x+2c2=0。
其中,dy表示因变量y的二阶倒数。
根据x的值域,得到x的其中一个解为:
步骤303,计算得到方程有在正常区域的解时,确定密度聚类的半径参数的值eps为累积概率曲线的拐点对应的距离;否则确定密度聚类的半径参数的值eps为该距离数组的中位数。
具体的,方程有在正常区域的解时,表示该累积概率曲线存在拐点,如果拐点不存在,以距离数组的中位数作为密度聚类的半径参数的值eps。
当n为奇数时,m=x(n+1)/2,当n为偶数时,
m表示距离数组的中位数,n表示距离数组的数据个数,x1...xn表示从小到大排序的距离数组的单个数据。
如图5所示为本发明提供的一种生成地图车道线的聚类参数的确定方法的实施例中不同k值的累积概率曲线的拐点示意图。
如图6所示为本发明提供的一种生成地图车道线的聚类参数的确定方法的实施例中根据确定的聚类参数的计算结果图,图中线段上标注的数字表示不同的分组。
实施例2
本发明提供的实施例2为本发明提供的一种生成地图车道线的聚类参数的确定系统的实施例,如图7所示为本发明提供的一种生成地图车道线的聚类参数的确定系统的结构框图,由图7可知,该系统确定的聚类参数包括密度聚类的半径参数,该系统包括:所述确定系统包括:距离数组确定模块1、累计概率曲线转换模块2和聚类参数确定模块3。
距离数组确定模块1,用于设置半径区域内的核心点最小个数的值minpts,确定用于聚类的车道线中的各条线段到最近的第k条线段的距离数组,其中,k=minpts-1。
累计概率曲线转换模块2,用于将各条线段到最近的第k条线段的距离数组的分布转换成累积概率曲线。
聚类参数确定模块3,用于确定密度聚类的半径参数的值eps为累积概率曲线的拐点对应的距离或者距离数组的中位数。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。