一种采用几何引导的稀疏表示三维点云压缩方法与流程

文档序号:18753008发布日期:2019-09-24 21:25阅读:548来源:国知局
一种采用几何引导的稀疏表示三维点云压缩方法与流程

本发明涉及视频编码领域,特别是指一种采用几何引导的稀疏表示三维点云压缩方法。



背景技术:

随着三维采集和多媒体通信技术的快速发展,三维点云作为一种新兴传输媒质被广泛应用于远程通信、增强现实、沉浸式交流等多个领域。三维点云是由大量拥有具体三维位置信息的点集组成,其中每个点具备一个或多个特征(如:颜色,法线等)。作为新型空间数据类型,三维点云能够更有效地表示拓扑结构更加复杂的三维物体或场景。但是其巨大的数据量给其存储和传输带来了极大的挑战。因此,如何构建高效稳定的三维点云压缩方法显得尤为重要。

与传统自然图像视频不同,三维点云的特征是不规则的,这种不规则性主要表现为并不是每个体素都是被占用的,这给三维点云的压缩带来了极大挑战。随着研究工作的进展,稀疏表示可以用来高效地压缩高维的数据,但是如何建立冗余字典,并将点云的颜色信息在冗余字典上稀疏表示仍然是有待解决的难题。



技术实现要素:

本发明的主要目的在于克服现有技术中的上述缺陷,提出一种采用几何引导的稀疏表示三维点云压缩方法。本发明方法充分考虑三维点云数据中相邻点的相关性,通过稀疏表示的方法将颜色信息变换为稀疏系数,通过对数量较少的非零系数编码,实现对庞大三维点云数据的有效压缩。

本发明采用如下技术方案:

一种采用几何引导的稀疏表示三维点云压缩方法,其特征在于,包括如下步骤:

1)对输入三维点云进行分割得到若干单元块;

2)计算单元块的原始的冗余字典;

3)基于当前单元块内点的几何信息,在原始的冗余字典降采用获取,得到降采样的冗余字典;

4)计算每个单元块内的颜色均值,对每个单元块的颜色信息进行去均值;

5)对去均值的颜色信息在降采样的冗余字典上稀疏表示,得到量化后的稀疏系数;

6)利用基于八叉树的块均值预测算法对每个单元块的颜色均值进行预测编码;

7)采用run-level的方法对量化后的稀疏系数进行编码;

8)采用算术编码器对步骤6)、7)得到的编码后的参数进行熵编码。

优选的,在步骤1)中,对输入三维点云采用八叉树分割成大小均匀的单元块。

优选的,在步骤2)中,通过图形变换获取单元块的原始的冗余字典。

由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:

1.本发明方法采用八叉树对三维点云进行分割,不仅有效保留了点与点之间的相关性,还可以让分割后的每个单元块大小相同。

2.本发明方法利用点与点之间存在较强的相关性,通过假定每个块内的体素都被占用,随后采用图形变换的方法得到原始冗余字典;利用块内点的几何信息得到降采样冗余字典;将块内点的颜色信息在降采样的冗余字典上稀疏表示,可以将颜色信号能量集中到数量较少的非零系数上,极大地降低三维点云的数据量。

3.本发明设计了一种基于八叉树的块均值预测模式,可消除每个单元块之间的颜色冗余;对于变换后的稀疏系数,利用run-level的方法对量化后的稀疏系数进行高效编码。

附图说明

图1为本发明方法的主流程图;

图2为本发明方法的八叉树分割方法;

图3中本发明方法的基于八叉树树的单元块均值预测方法原理图;

图4为本发明方法的run-level编码方法流程图。

以下结合附图和具体实施例对本发明作进一步详述。

具体实施方式

以下通过具体实施方式对本发明作进一步的描述。

参见图1,一种采用几何引导的稀疏表示三维点云压缩方法,对输入的三维点云进行八叉树分割,随后假定每个块内的体素都被占用,利用图形变换得到原始的冗余字典,并通过每个块内的几何信息得到降采样冗余字典。随后将每个块内的颜色信息在降采样后的冗余字典上稀疏表示,得到稀疏系数。每个块的均值,利用本发明的基于八叉树的块均值预测方法进行预测编码并量化。量化后的稀疏系数采用run-level的编码方法对非零系数进行编码。最后所有的编码参数采用算法编码器进行熵编码。具体实施步骤如下:

1)采用八叉树对原始的输入点云进行分割,得到大小均匀的单元块即编码块,具体的,如图2所示。给定分割深度n,首先对原始的输入的三维点云进行八等分,分割完后,把包含点的块记为1,不含点的块记为0。接着继续对标记为1的块进行八等分,同样的根据块内有没有点来对块进行0,1标记,然后对标记为1的块继续分割。重复这样的过程,直到分割至给定的深度,令分割后的块的个数为z。

2)以单元块为处理单元,假定每个块内的体素都被占用,计算每个体素之间的权重值wi,j,随后采用图形变换可获得原始的冗余字典d,具体的,可通过如下公式获取:

a=diag(d1,d2,...,dn)

l=a-w=dλd-1

其中,dist表示第i个体素和第j个体素之间的欧式距离,τ为阈值,σ为每个体素预设的参数,l为图形拉普拉斯算子,λ为对角矩阵平移算子。

3)降采样的冗余字典可通过块内点的几何信息获取,具体的,对于第i个块,降采样冗余字典可通过如下公式获取:

其中si是一个降采样矩阵,由一个单位矩阵通过去掉第i个块内未占用体素的行而得到。

4)颜色均值x可通过求平均获取,用来稀疏表示的颜色信息x通过原始颜色信息去均值获取。具体的,对于第i个块,可通过如下公式获取:

5)稀疏系数ci可以通过去平均的颜色信息在降采样后的冗余字典上稀疏表示获取。具体的,对于第i个块,可利用omp算法解如下优化问题获取:

其中n是被占用块的数目,ε是重建误差,用来控制稀疏系数ci的稀疏度,||·||0为向量的0范数,用来统计输入向量的非零元素的个数。

6)每个单元块的均值采用基于八叉树的预测算法进行编码。八叉树预测方法如图3所示,具体如下:

首先假定经过八叉树分割后,原始的三维点云已经被划分成了m×m×m个块,每个块在三维空间中都有其独立的三维空间坐标(px,py,pz),其中,1≤px≤m,1≤py≤m,1≤pz≤m。图3中的(a)给出了当前编码块的8个相邻块,其中编号1的灰色块的坐标为(px,py,pz),为当前的编码块,其他七个不同颜色的块编号2-8的坐标为(px-δpx,py-δpy,pz-δpz),其中δpx,δpy,δpz∈{0,1},为已经编码的参考块。对于当前的单元块(图3(b)中用灰色块表示,块标签为1),9个预测模式将会被采用,这9种预测模式包括一个dc模式和8个角度模式。8个角度模式中,mode1至mode7是七种参考相邻块的模式;mode8为参考宏块的模式,宏块为将7个参考块当成整体的一个块。通过与相邻的块和宏块进行比较,最佳的预测模式可由如下公式获取:

modedecision=min|b-bi|

通过与8个参考块比较即可得到8个预测残差,这8个残差中绝对值最小的即对应最佳的预测模式。

其中,b是当前编码单元块的均值,bi是参考块的均值,i∈{1,2,...,8};|·|是绝对值符号。由于三维坐标包含一的块即是整个三维点云最外面一层的块,它们没有参考块,于是直接对每个块的颜色均值进行量化,即采用dc模式。

步骤7)量化后的稀疏系数可通过run-level的方法编码。

具体的如图4所示,将量化后的稀疏系数表示为2个一维的阵列,分别记为run和level。由于每个块非零系数的个数不同,引入numnonzerocoef来记录每个块中非零系数的个数。对于第i个块,只有当numnonzerocoef[i]不等于0的时候才会对(runi,leveli)进行编码,1≤i≤z。对于量化后的系数ci,如果不含非零系数,则numnonzerocoef[i]为0,表示没有系数需要编码。如果ci中有ni个非零系数,先把ni存储在变量numnonzerocoef[i]中,然后分别存储runi和leveli到run{i}和level{i}中。重复以上过程,直到所有的单元块被编码完毕。

步骤8)采用算术编码器对之前步骤中所有编码完毕的参数进行熵编码,编码后的参数包括有量化后的预测残差、最佳预测模式、run、level、numnonzerocoef。

上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1