本公开的实施例一般涉及图像处理领域,并且更具体地,涉及像方和物方混合匹配基元的数字表面模型生成方法、装置、设备和计算机可读存储介质。
背景技术:
数字表面模型(dsm)被广泛应用于城市规划、虚拟现实、交通以及通信等各个领域,是摄影测量和计算机视觉的重点研究内容之一。
现有的dsm提取方法大多为立体匹配算法,例如灰度匹配、局部匹配、全局匹配和半全局匹配等,上述方法均为单纯的像方或者物方的匹配方法,而单纯的物方匹配和像方匹配都存在多方面的问题,比如在弱纹理区、遮挡区域存在错误匹配,可靠度不高等问题。
技术实现要素:
根据本公开的实施例,提供了一种像方和物方混合匹配基元的数字表面模型生成方案。
在本公开的第一方面,提供了一种像方和物方混合匹配基元的数字表面模型生成方法。该方法包括:
获取多视影像,其中,所述多视影像至少包括同一地物的三个不同视角的影像图片;
通过prc文件和控制点文件对所述多视影像进行自由网平差,得到定位参数;
对所述定位参数进行处理,生成近似核线影像,基于所述近似核线影像生成影像金字塔,并计算所述影像金字塔的格网点坐标;
根据所述prc文件、控制点文件和影像金字塔的格网点坐标,确定基准影像对应的格网点坐标;
通过预设的相关系数和所述基准影像对应的格网点坐标,进行金字塔影像匹配,确定同名点坐标;
通过所述定位参数,解算所述同名点坐标,得到三维同名像点的地面三维坐标,并对所述地面三维坐标进行内插生成数字表面模型;
通过物方多视匹配模型对所述数字表面模型进行处理,得到最终数字表面模型。
进一步地,所述对所述定位参数进行处理,生成近似核线影像,基于所述近似核线影像生成影像金字塔,并计算所述影像金字塔的格网点坐标包括:
通过投影轨迹法对所述定位参数进行处理,生成近似核线影像;
对所述核线影像进行重组,生成影像金字塔;
根据所述影像金字塔的像素宽、高,得到所述影像金字塔的格网点坐标。
进一步地,所述根据所述prc文件、控制点文件和影像金字塔的格网点坐标,确定基准影像对应的格网点坐标包括:
根据所述prc文件和控制点文件,从所述多视影像的任意两张影像中提取出所述两张影像的同名点坐标;
将所述同名点坐标代入预设的多项式中,解算出所述多项式的系数;
以所述两张多视影像中的任一影像作为基准影像,将所述基准影像的格网点坐标代入所述多项式,得到所述基准影像对应的格网点坐标。
进一步地,所述通过预设的相关系数和所述基准影像对应的格网点坐标,进行金字塔影像匹配,确定同名点坐标包括:
以预设的相关系数作为相似性测度,根据基准影像对应的格网点坐标,通过概率松弛法进行金字塔影像匹配,得到上层金字塔影像匹配到的两张影像的同名点坐标;
根据所述上层金字塔影像匹配到的两张影像的同名点坐标,计算得到所述同名点坐标的视差值;
在下一层金字塔影像匹配时,以所述视差值作为基准同名像点的视差初值进行基准匹配,直到最底层金字塔匹配完成。
进一步地,所述通过物方多视匹配模型对所述dsm进行处理,得到最终dsm包括:
以所述dsm作为初值,利用线阵影像的物方多视匹配模型对所述dsm进行多视密集匹配,得到密集点云;
通过所述密集点云进行插值生成最终dsm。
在本公开的第二方面,提供了一种像方和物方混合匹配基元的数字表面模型生成装置。该装置包括:
获取模块,用于获取多视影像,其中,所述多视影像至少包括同一地物的三个不同视角的影像图片;
测量模块,用于通过prc文件和控制点文件对所述多视影像进行自由网平差,得到定位参数;
计算模块,用于对所述定位参数进行处理,生成近似核线影像,基于所述近似核线影像生成影像金字塔,并计算所述影像金字塔的格网点坐标;
确定模块,用于根据所述prc文件、控制点文件和影像金字塔的格网点坐标,确定基准影像对应的格网点坐标;
匹配模块,用于通过预设的相关系数和所述基准影像对应的格网点坐标,进行金字塔影像匹配,确定同名点坐标;
解算模块,用于通过所述定位参数,解算所述同名点坐标,得到三维同名像点的地面三维坐标,并对所述地面三维坐标进行内插生成数字表面模型;
处理模块,用于通过物方多视匹配模型对所述数字表面模型进行处理,得到最终数字表面模型。
进一步地,所述对所述定位参数进行处理,生成近似核线影像,基于所述近似核线影像生成影像金字塔,并计算所述影像金字塔的格网点坐标包括:
通过投影轨迹法对所述定位参数进行处理,生成近似核线影像;
对所述核线影像进行重组,生成影像金字塔;
根据所述影像金字塔的像素宽、高,得到所述影像金字塔的格网点坐标。
进一步地,所述根据所述prc文件、控制点文件和影像金字塔的格网点坐标,确定基准影像对应的格网点坐标包括:
根据所述prc文件和控制点文件,从所述多视影像的任意两张影像中提取出所述两张影像的同名点坐标;
将所述同名点坐标代入预设的多项式中,解算出所述多项式的系数;
以所述两张影像中的任一影像作为基准影像,将所述基准影像的格网点坐标代入所述多项式,得到所述基准影像对应的格网点坐标。
在本公开的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
在本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本公开的第一方面的方法。
本申请实施例提供的像方和物方混合匹配基元的数字表面模型生成方法,通过在近似核线约束的前提下,以金字塔分层匹配作为匹配策略,以概率松弛匹配作为影像匹配模型,最终实现影像的精确匹配,利用空间前方交会解算匹配点云的三维坐标,然后利用反距离加权方法获得该区域的初始dsm,最后以该dsm为初值,进行物方多视密集匹配,最终获得该区域的dsm,提高了影像匹配的可靠性。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
图1示出了根据本公开的实施例的像方和物方混合匹配基元的数字表面模型生成方法的流程图;
图2示出了根据本公开的实施例的gc3模型的基本原理示意图;
图3示出了根据本公开的实施例的ammgc模型的基本原理示意图;
图4示出了根据本公开的实施例的像方和物方混合匹配基元的数字表面模型生成装置的方框图;
图5示出了能够实施本公开的实施例的示例性电子设备的方框图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1示出了根据本公开实施例的像方和物方混合匹配基元的数字表面模型生成方法100的流程图。方法100包括:
s110,获取多视影像,其中,所述多视影像至少包括同一地物的三个不同视角的影像图片。
在一些实施例中,可通过无人机等航拍设备或卫星拍摄等方式获取同一地物的多个不同视角的影像图片(多视影像);也可以从本地获取预先存储的多视影像;所述多视影像包括多张垂直角度影像图片和倾斜角度影像图片等;所述多个为不小于3的正整数。
s120,通过prc文件和控制点文件对所述多视影像进行自由网平差,得到定位参数;
在一些实施例中,所述prc文件,用于对获取的多视影像进行几何校正,所述prc文件包括各种成像参数,如航空影像的内外方位元素、卫星轨道参数等,通过所述prc文件对所述多视影像进行处理,确定所述多视影像的坐标信息,得到包含坐标信息的多视影像。
进一步地,通过所述控制点文件对包含坐标信息的多视影像进行控制点校正,得到定位参数。
即,通过prc文件和控制点文件对所述多视影像进行自由网平差(无起算数据的平差方法),得到定位参数,即,确定所述多视影像的像点坐标。
在一些实施例中,所述prc文件和控制点文件可以是预先测量得到的文件,也可以是在获取所述多视影像的同时获取的文件。
s130,对所述定位参数进行处理,生成近似核线影像,基于所述近似核线影像生成影像金字塔,并计算所述影像金字塔的格网点坐标。
在一些实施例中,
通过投影轨迹法对步骤s120获取的定位参数进行处理,生成近似核线影像;
具体地,通过所述定位参数将地面点的大地坐标与其对应的多视影像的像点坐标用比值多项式关联起来,并将所述地面坐标和像点坐标正则化-1到1之间,以保证计算的稳定性,根据所述比值多项式确定所述多视影像的同名核线的近似方程的系数,根据该系数依次计算左右核线影像上每一行所对应的左右原始影像核线近似直线方程,根据所确定的核线近似直线方程,基于灰度一维线性内插实现对所述多视影像的近似核线重排,从而生成所述近似核线影像。
进一步地,将所述近似核线影像进行重组,生成影像金字塔;根据所述影像金字塔中影像像素的宽高和格网像素间距离,将所述影像金字塔中的影像均匀的划分为若干块,每一块的中心点的影像的像素行列号为所述各网点坐标。
s140,根据所述prc文件、控制点文件和影像金字塔的格网点坐标,确定基准影像对应的格网点坐标。
在一些实施例中,根据所述prc文件、控制点文件,从所述多视影像的任意两张影像中提取出所述两张影像的同名点坐标,即,计算所述两张图片的重叠范围。
将所述同名点坐标代入预设的多项式中,解算出所述多项式的系数,即,解算出所述两张影像的概略对应关系;
所述多项式可以为一次多项式,如:
其中,所述(x,y)和(x,y)分别为两张影像对应的像点坐标;
所述a_0、a_1、a_2、b_0、b_1和b_2为所述多项式的系数。
在一些实施例中,将所述两张影像中的任一张影像作为基础影像,将所述基准影像的格网点坐标代入上述多项式,得到所述基准影像对应的格网点坐标。
需要说明的是,通常选取中央影像或质量最好的影像为基准影像,但当遮挡比较严重时,也可以依次选择每一张影像作为基准影像,此时可充分利用每张影像提供的信息。
s150,通过预设的相关系数和所述基准影像对应的格网点坐标,进行金字塔影像匹配,确定同名点坐标。
在一些实施例中,以预设的相关系数作为相似性测度,根据基准影像对应的格网点坐标,通过概率松弛法进行金字塔影像匹配,得到上层金字塔影像匹配到的两张影像的同名点坐标;所述相关系数的取值范围为0.5-1;
所述概率松弛算法基于地形局部平滑原理,即在局部范围内地形起伏较小(即左右视差可认为是平滑变化的)。对于每个参与匹配的特征点,利用相似性测度,如相关系数的峰值,找出可能的同名点作为候选匹配点。根据地形的平滑性,同名点应能获得较大的邻域支持,而错误的候选点的邻域支持较小。在松弛迭代过程中,正确的候选点的概率值在迭代中得到增加,错误的候选的概率值在迭代中不断减小。迭代若干次数后,正确的候选点概率值收敛于1,错误的候选点收敛到0。从而得到正确的匹配。在影像金字塔的顶部,分辨率降低,局部的相容性相当于原始分辨率影像上大范围的相容,保证了匹配的可靠性。通过上层匹配的信息为下层匹配提供准确、可靠的近似值,可以减小匹配候选点搜索范围,加快匹配速度。
具体地,设任一格网点为i,有n个候选匹配点;
若所述格网点i落在水域等无纹理区域,设置相关阈值为0.6,有超过搜索区域半数以上候选匹配点。此时,候选匹配点为预测点附近11个点。该点的可靠性较差,设置可靠性系数0.1;
若所述格网点i落在纹理贫乏区域,设置相关阈值0.6,没有候选匹配点。此时,候选匹配点为预测点附近11个点。该点的可靠性较差,设置可靠性系数0.1;
若所述格网点i落在纹理丰富区域,设置相关阈值0.6,有多个候选匹配点。此时,这些匹配点为候选匹配点,可靠性为最大相关系数;
若所述格网点为人工导入的约束点、线、面。此时,候选匹配点只有人工选定点,且可靠性系数为1.0;
进一步地,通过如下公式,计算周围点对i的匹配点为k的排斥度:
其中,所述r(j,i,k)为周围点j点对(i,k)匹配对的视差约束;
所述d_j为周围点j的可靠性;
所述r(i,k)数值范围为[8,976];
进一步地,
其中,所述t(j,l,i,k)=1+(dx-dx_0)*(dx-dx_0)为匹配点对(j,l)与匹配点对(i,k)之间视差的排斥性;
所述p(j,l)为网格点j匹配点l的概率;
所述t(j,l,i,k)数值范围为[1,122];
所述r(j,i,k)数值范围为[1,122];
进一步地,通过如下公式计算得到同名点坐标,即,具有最大匹配概率的匹配候选点坐标:
其中,所述q(i,k)=1.0/r(i,k)。
在一些实施例中,根据所述上层金字塔影像匹配到的两张影像的同名点坐标,计算得到所述同名点坐标的视差值,在下一层金字塔影像匹配时,以所述视差值作为基准同名像点的视差初值进行基准匹配,直到最底层金字塔匹配完成。
具体地,设上层金字塔影像匹配结果的到两张影像的同名点对为(x_p,y_p)和(x_p,y_p),那么该层匹配结果,两张影像同名点视差值d为x_p-x_p;在下层金字塔影像匹配时,将该视差值作为初值,即搜索同名像点位置时候的视差初值,进行搜索,以达到减少搜索范围,提高匹配速度的目的。
s160,通过所述定位参数,解算所述同名点坐标,得到三维同名像点的地面三维坐标,并对所述地面三维坐标进行内插生成数字表面模型包括:
在一些实施例中,根据步骤s120中得到的定位参数,将步骤s150得到的同名点坐标转换为地面三维坐标,并进行内插生成数字表面模型(dsm)。
s170,通过物方多视匹配模型对所述数字表面模型进行处理,得到最终数字表面模型。
在一些实施例中,以所述数字表面模型作为初值,利用线阵影像的物方多视匹配模型对所述数字表面模型进行多视密集匹配,得到密集点云。
其中,所述多视匹配模型包括影像gc3匹配模型及其改进模型ammgc;
如图2所示,图2示出了所述gc3匹配模型的匹配原理,图中,下视影像选为参考影像,记为l_0;其它两张影像选为搜索影像,记为l_i(l_1,l_2)。假设这3张影像的定向参数已知,或者是可以通过空三平差过程计算求得。对于参考影像上的一个给定像点p_0,得到一条光束〖cp〗_0,所述c表示与点p_0相关的瞬时透视中心。将光束〖cp〗_0与一个事先给定的高程z_0的平面相交,得到物方空间点p_0(x_0,y_0,z_0),由于z_0不精确,设其误差为△z,则p_0的正确高程位置应位于(z_0-△z,z_0+△z)之间,在此高程区间内,将位于〖cp〗_0光束上的物方空间点相向投影,确定p_0点处的“准核线”记为s_i(z)(所述i为大于等于1的正整数)。
综上,在搜索影像上,p_0点的同名像点必然位于影像的准核线s_i(z)上。
如图3所示,图3示出了ammgc模型的匹配原理,相比于gc3模型,改进点在于:对于基准影像,首先匹配一张影像,计算相关系数局部峰值,然后利用剩余匹配影像,对局部峰值进行“反向匹配”检验。
具体地,设所述基准影像为l_0,其余影像(搜索影像)为l_i;所述i为大于等于1的正整数;l_0上的待匹配点为p_k(给定像点);
a,通过影像金字塔获取近似高程值z_k0与高程误差△z_k0,通过所述数字表面模型确定搜索步距dz_k。
b,根据所述z_k0、△z_k0、dz_k和所述定位参数在l_i上确定准核线si(z),并定义相关窗口w_k的大小、形状;
c,对应于p_k光束,在给定的高程值z_k条件下,计算p_k的平面坐标(x_k,y_k),根据p_k光束上的地面点(x_k,y_k,z_k),反算至影像l_i,得到对应像点p_ki;所述i为大于等于1的正整数;
d,计算像点p_k与p_ki之间的相关测度,如相关系数等,将所有的测度进行累加,取均值;
e,从z_k0-△z_k0开始,以dz_k为步长,逐步增加高程值,重复步骤c、d,将得到的相关测度以曲线表示,以x轴表示高程,y轴表示相关测度均值;
f,通过步骤e得到的曲线,确定该曲线的峰值,通过一个光滑的二次函数拟合该曲线位置,计算该二次函数的最大值,该最大值所对应的高程z即为p_k点的最终高程;
g,根据p_k点的像点坐标与地面高程z,通过构象模型,计算p_k点的地面坐标(x,y,z),进一步地通过空间后方交会获取p_k点在各搜索影像上的同名像点;
h,令k=1,2,3……,重复上述步骤,完成所有像点的多视匹配工作,得到密集点云;
i,通过所述密集点云进行插值,优化所述数字表面模型,得到最终的数字表面模型。
根据本公开的实施例,实现了以下技术效果:
以金字塔分层匹配作为匹配策略,以概率松弛匹配作为影像匹配模型,最终实现影像的精确匹配,利用空间前方交会解算匹配点云的三维坐标,然后利用反距离加权方法获得该区域的初始dsm,最后以该dsm为初值,进行物方多视密集匹配,最终获得该区域的dsm,解决了在弱纹理区、遮挡区域存在错误匹配,可靠度不高等问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制,因为依据本公开,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本公开所必须的。
以上是关于方法实施例的介绍,以下通过装置实施例,对本公开所述方案进行进一步说明。
图4示出了根据本公开的实施例的像方和物方混合匹配基元的数字表面模型生成装置400的方框图。如图4所示,装置400包括:
获取模块410,用于获取多视影像,其中,所述多视影像至少包括同一地物的三个不同视角的影像图片;
测量模块420,用于通过prc文件和控制点文件对所述多视影像进行自由网平差,得到定位参数;
计算模块430,用于对所述定位参数进行处理,生成近似核线影像,基于所述近似核线影像生成影像金字塔,并计算所述影像金字塔的格网点坐标;
确定模块440,用于根据所述prc文件、控制点文件和影像金字塔的格网点坐标,确定基准影像对应的格网点坐标;
匹配模块450,用于通过预设的相关系数和所述基准影像对应的格网点坐标,进行金字塔影像匹配,确定同名点坐标;
解算模块460,用于通过所述定位参数,解算所述同名点坐标,得到三维同名像点的地面三维坐标,并对所述地面三维坐标进行内插生成数字表面模型;
处理模块470,用于通过物方多视匹配模型对所述数字表面模型进行处理,得到最终数字表面模型。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,所述描述的模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图5示出了可以用来实施本公开的实施例的电子设备500的示意性框图。如图所示,设备500包括中央处理单元(cpu)501,其可以根据存储在只读存储器(rom)502中的计算机程序指令或者从存储单元508加载到随机访问存储器(ram)503中的计算机程序指令,来执行各种适当的动作和处理。在ram503中,还可以存储设备500操作所需的各种程序和数据。cpu501、rom502以及ram503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。
设备500中的多个部件连接至i/o接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理单元501执行上文所描述的各个方法和处理,例如方法100。例如,在一些实施例中,方法100可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由rom502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到ram503并由cpu501执行时,可以执行上文描述的方法100的一个或多个步骤。备选地,在其他实施例中,cpu501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法100。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)等等。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。