一种基于模拟退火算法的图像运动估计方法
【专利摘要】本发明公开一种基于模拟退火算法的图像运动估计方法。运动估计最简单的办法就是遍历搜索,这种方法的特点是实现简单,但是运算量大,这是在实际应用中绝对不允许的。模拟退火算法是一种适合解决大规模组合优化问题的通用有效的全局优化方法,其基本思想是利用随机优化问题求解过程与统计力学中热平衡问题的相似性,它具有突跳性,有助于逃离优化问题的局部最优解而找到全局最优解。通过设定初温、初态以及降温率控制温度的不断下降,结合概率突跳特性利用解空间的邻域结构进行随机搜索。本专利采用模拟退火算法来加快搜索速度,得到的真实而准确的运动信息的同时,重构出能体现真实的下一帧图像信息的图像。
【专利说明】一种基于模拟退火算法的图像运动估计方法【技术领域】
[0001]本发明涉及一种图像运动估计方法,尤其是视频编码和视频处理中基于模拟退火方法的图像运动估计方法。【背景技术】
[0002]运动估计是视频编码和视频处理(例如去交织)中广泛使用的一种技术。运动估计的基本思想是将图像序列的每一帧分成许多互不重叠的宏块,并认为宏块内所有象素的位移量都相同,然后对每个宏块到参考帧某一给定特定搜索范围内根据一定的匹配准则找出与当前块最相似的块,即匹配块,匹配块与当前块的相对位移即为运动矢量。视频压缩的时候,只需保存运动矢量和残差数据就可以完全恢复出当前块。在实际应用中,对于一个原始的视频序列,其数据量会非常的庞大,举例来说,对于720P的原始视频序列,存储60帧大约需要300MB,如果按每秒播放24帧来计算,这么大的容量还存储不了 3秒,更何况动辄长达2小时的电影。因此不经过压缩编码的原始视频几乎是不存在的。常见的编码标准如MPEG-2,H.264,AVS等,都对视频序列进行了压缩。在编码的过程中,基于运动估计/运动补偿(ME/MC)的方法是最常用的,该方法的核心思想就是通过前后两帧的图像数据,可以重构出中间的若干帧图像,那么在编码端就可以从原始视频序列中丢弃一些原始帧,仅存储剩余的帧序列,而在解码端,仅需根据运动估计/运动补偿(ME/MC),用重构的帧来代替那些丢弃的原始帧,这样就可以恢复出原始的视频序列,同时大大减小实际的存储容量。运动估计最简单的办法就是遍历搜索,这种方法的特点是实现简单,但是运算量大,如果采用遍历匹配算法,让三个匹配变量从O开始匹配,最理想的情况下到达下一帧的运动目标状态的运算次数也要达到成千上万次,这是在实际应用中绝对不允许的。
【发明内容】
[0003]本发明目的是为了保证精度的同时,提高运动估计的运算速度,提出了一种基于模拟退火算法快速准确进行运动估计的方法,减少了遍历所有数据的冗余操作和时间消耗。
[0004]为了实现所述的目的,本发明的基于模拟退火算法的图像运动估计方法,其特征是包括如下步骤:
[0005]目标函数的确定S1:根据匹配原则,定义目标函数为两幅图像的SAD值为目标函数。
[0006]初始向量及温度选取S2:根据运动估计特性和试验反复验证,选取合适的初始温度及初始向量。
[0007]概率的确定S3:根据Metropolis准则及实验数据选取合适的转移概率。
[0008]具体来讲,确定目标函数确定方法包括如下要点:
[0009]Sll:设当前图像位置上的信息以imagel代表,相应被估计位置图像信息以image2 代表;[0010]S12:定义f = I imagel-1mage2 ,相当于每个像素灰度值之差的绝对值求和;
[0011]S13:当f取到最小值时,表明利用运动估计获得的运动信息重构出下一帧,所得到的重构帧图像与实际的下一帧图像达到最佳匹配(即差别最小),那么此时搜索到的运动信息即为运动估计的结果。
[0012]具体来讲,初始向量及温度选取方法包括如下要点:
[0013]S21:初始温度选取0.5 ;
[0014]S22:终止温度选取0.01;
[0015]S23:降温因子选取0.8 ;
[0016]S24:循环次数L选取100 ;
[0017]S25:整个运动估计过程主要集中在低温中进行。
[0018]具体来讲,概率的确定方法包括如下要点:
[0019]S31:粒子在温度T时趋于平衡的概率为e_AE/(kT),其中E为温度T时的内能,Λ E为其改变量,k为Boltzmann常数;
[0020]S32:用固体退火模拟组合优化问题,将内能E模拟为目标函数值f,温度T演化成控制参数t ;
[0021]S33:由初始解i和控制参数初值t开始,对当前解重复“产生新解一计算目标函数差一接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解即为所得近似最优解。
[0022]本发明采用上述技术方案的有益效果是,通过增加记忆功能,避免了搜索过程中由于执行概率接受环节而遗失当前遇到的最优解,可通过增加存储环节,将一些在这之前好的态记忆下来;增加升温或重升温过程,在算法进程的适当时机,将温度适当提高,从而可激活各状态的接受概率,以调整搜索进程中的当前状态,避免算法在局部极小解处停滞不前。
【专利附图】
【附图说明】
[0023]附图为本发明的详细流程图【具体实施方式】
[0024]下面结合附图和【具体实施方式】对本发明作进一步详细说明。
[0025]将模拟退火算法结合实际的运动估计问题,不难发现,待估计的参数有三个,用向量表示为[Θ,dx,dy],因此可以将该向量作为退火算法中的变量。要确定该向量首先需要确定如下参数:
[0026](I)目标函数f:目标函数的作用是判断当前解X的质量,一般情况下f值越小,代表当前解X质量越好。模拟退火算法的目标是确定最佳运动矢量。f定义为
imagel-1mage2 ,其中imagel代表当前图像位置上的信息,image2代表相应被估计位置图像信息。
[0027]
【权利要求】
1.一种基于模拟退火算法的图像运动估计方法,其特征是包括如下步骤: 目标函数的确定S1:根据匹配原则,定义目标函数为两幅图像的SAD值为目标函数。初始向量及温度选取S2:根据运动估计特性和试验反复验证,选取合适的初始温度及初始向量。 概率的确定S3根据Metropolis准则及实验数据选取合适的转移概率。
2.根据权利要求1所述的目标函数确定方法,包括如下要点: 511:设当前图像位置上的信息以imagel代表,相应被估计位置图像信息以image2代表; 512:定义f = I imagel-1mage2 ,相当于每个像素灰度值之差的绝对值求和; 513:当f取到最小值时,表明利用运动估计获得的运动信息重构出下一帧,所得到的重构帧图像与实际的下一帧图像达到最佳匹配(即差别最小),那么此时搜索到的运动信息即为运动估计的结果。
3.根据权利要求1所述的初始向量及温度选取方法,包括如下要点: 521:初始温度选取0.5 ; 522:终止温度选取0.01 ; 523:降温因子选取0.8 ; 524:循环次数L选取100 ; 525:整个运动估计过程主要集中在低温中进行。
4.根据权利要求1所述的概率的确定方法,包括如下要点: 531:粒子在温度T时趋于平衡的概率为e- Δ E/ (kT),其中E为温度T时的内能,Λ E为其改变量,k为Boltzmann常数; 532:用固体退火模拟组合优化问题,将内能E模拟为目标函数值f,温度T演化成控制参数t ; 533:由初始解i和控制参数初值t开始,对当前解重复“产生新解一计算目标函数差—接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解即为所得近似最优解。
【文档编号】H04N19/51GK103546756SQ201210239195
【公开日】2014年1月29日 申请日期:2012年7月11日 优先权日:2012年7月11日
【发明者】陈远峥, 刘书, 吴杰, 郑耀 申请人:陈远峥