基于支持向量机的avs到hevc优化视频转码方法

文档序号:8514827阅读:248来源:国知局
基于支持向量机的avs到hevc优化视频转码方法
【技术领域】
[0001] 本发明设及的是一种视频信号处理领域的技术,具体是一种基于支持向量机的 AVS到肥VC优化视频转码方法。
【背景技术】
[0002] 视频转码技术,是将已压缩的码流通过解码再编码得到符合要求的目标码流。随 着多媒体技术和互联网等的广泛应用和快速发展,在网络上传输各种视频数据已经成为现 在网络技术发展的趋势,目前已出现了多种视频编码标准,包括MPEG- 4、MPEG- 2、H. 264、 AVS、肥VC等。由于视频资源多种多样,W及不同的终端设备的显示能力、存储能力、对码流 的处理能力存在差异,在不同情境下用户对视频的需求也不尽相同,因此,如何能够实现高 效的转码,使之适应于不同硬件设备W及网络传输环境中,一直广泛受到业界的关注。肥VC 是目前最新的视频编码标准,压缩效率比H. 264等标准提高了约50%,它将会得到越来越 广泛的应用。AVS是我国自主研发的标准,具有与H. 264相当的编码性能和更低的编码复杂 度,在视频应用领域具有重要的影响力。目前已有许多已压缩的AVS码流,它将于肥VC等 标准长期共存,因此实现AVS到肥VC标准间的视频转换成为重要的研究方向。
[0003] 机器学习应用于多个研究领域,包括人工智能、机器翻译、数据挖掘、文字识别W 及商业领域等,随着数字多媒体技术W及传输网络等的发展,它也不断的应用于视频捜索、 视频分析W及视频编转码等研究方向,目前将机器学习算法应用于视频转码领域的应用也 在不断增多。支持向量机是机器学习的一个重要的方法,从输入码流前面部分帖中提取出 解码信息等,利用支持向量机学习出AVS信息和肥VC编码模式之间的对应关系,在后面编 码的过程中,就直接根据解码出的AVS的信息,预测出肥VC编码的模式,而不需要进行完全 迭代遍历的过程,从而达到降低视频转换复杂度的目的。因此,通过利用支持向量机该种机 器学习方法,如何学习得到准确的训练模型,实现准确预测W降低视频转换的复杂度,提高 视频转码的速率成为当前研究的一个重要课题。
[0004] 经过对现有技术的检索发现,中国专利文献号CN104320667A公开(公告)日 2015. 01. 28,公开了一种多过程最优化编码系统,包括若干个并行编码器、前瞻缓冲器和二 次编码器,前瞻缓冲器的输入端与并行编码器的输出端连接,前瞻缓冲器的输出端与二次 编码器的输入端连接,并公开了其方法,包括第一编码阶段、最优化选择阶段和第二编码阶 段3个步骤,第一编码阶段由若干个并行编码器同时进行编码,前瞻缓冲器对第一编码阶 段所得到的结果进行最优化选择W获得最优编码路径,二次编码器根据最优化选择阶段所 获得的最优编码路径第二次编码,获得最终而最优的编码结果。该技术性能、质量、带宽效 率更高,编码/转码结果更好,非常易于配置并且非常灵活,既可用于高视频质量的4K和超 高清应用,也可用于超高效带宽的移动视频应用。但该技术的输入是原始码流,没有能够利 用输入为压缩码流时包含的编码信息,且对于肥VC比较复杂的编码器,编码路径多样,实 现复杂度也会相对比较高。

【发明内容】

[0005] 本发明针对现有技术存在的上述不足,提出一种基于支持向量机的AVS到肥VC优 化视频转码方法,采用了简化的视频转码框架,在训练阶段将从AVS码流提取出的特征向 量训练得到训练模型,然后在转码阶段利用该模型对肥VC中的编码单元划分情况进行区 域转码,同时结合快速模式选择算法,减少了重编码阶段编码单元划分W及模式选择的复 杂度,大大提高了视频转码速度,同时保证了有限了转码视频质量下降。
[0006] 本发明是通过W下技术方案实现的:
[0007] 本发明通过采集AVS码流的特征向量,并利用支持向量机对其进行学习并得到训 练模型,将提取出的AVS特征向量分为在肥VC中相应位置的CU划分或不划分两类,在转码 阶段W训练模型预测CU是否需要划分。
[000引所述的AVS特征向量采集自AVS码流,包括;宏块编码模式、运动向量和变换系数 等f目息。
[0009] 所述的宏块编码模式是指;AVS中每个宏块的模式信息。
[0010] 所述的运动向量是指;AVS中宏块的平均运动向量大小。
[0011] 所述的变换系数是指;AVS编码的离散余弦变换值CT)系数中非零系数的个数。
[0012] 所述的对应关系是指;AVS特征向量与肥VC中编码单元是否需要划分通过学习得 到的训练模型,也即映射关系。
[001引所述的预测,当得到当前CU需要划分时,再在当前肥VC的深度下分别进行2NX2N模式和SKIP模式计算,并从该两种模式中选择出最优预测模式,当预测得到当前CU不需要 进行划分,则按照肥VC标准编码过程进行最优模式选择。 技术效果
[0014] 与现有技术相比,本发明结合机器学习基本思想W及支持向量机学习方法,对视 频学习得到训练模型并预测后续转码过程中肥VC编码模式,从而降低了转码复杂度,提高 转码速度。整个转码过程分为两个阶段,即训练阶段和转码阶段。在训练阶段,提取出AVS 特征向量和肥VC中相应位置的CU划分信息,根据支持向量机算法和工具训练得到两者的 对应关系,即训练模型;在转码阶段,利用训练阶段得到的模型,根据AVS的特征向量,对深 度为0和1时肥VC相应位置CU是否划分进行预测,若预测得到当前CU需要划分,则对当 前深度的CU只进行SKIP和2化2N模式选择,若预测得到当前CU不需要划分,则按照肥VC 标准过程对最优模式进行选择。通过机器学习和快速模式选择方法结合,可W自适应的根 据每个序列自身的特征得到相应训练模型,在保证转码视频质量下降有限的情况下,大大 减少了转码过程中的计算复杂度,从而提高了转码速度,节省了转码时间。
【附图说明】
[0015] 图1是本发明转码框架图;
[0016] 图2是本发明流程图。
【具体实施方式】
[0017] 下面对本发明的实施例作详细说明,本实施例在W本发明技术方案为前提下进行 实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施 例。 实施例1
[001引如图2所示,本实施例分为W下四个步骤:
[0019] 步骤一、采集AVS码流的特征向量,具体为;采集AVS码流中与对应的肥VC中深度 为0和1时相应位置CU划分的信息。
[0020] 所述的AVS特征向量采集自AVS码流,包括;宏块编码模式、运动向量和变换系数 等信息。
[0021] 所述的宏块编码模式是指;在AVS对应的肥VC中深度为0时,每个CU中包含有16 个宏块,因此含有16个特征;在深度为1时,每个CU中包含有4个宏块,相应的有4个模式 特征。
[002引所述的运动向量是指;AVS中运动向量是W8X8为单位,一个宏块中包含4个运 动向量基本单元,每个运动向量分别取模,然后将一个宏块中四个运动向量模的平均值作 为一个特征。同样,深度为0时CU中含有16个运动特征,深度为1时含有4个运动特征。 运动向量模的平均值Vwg等于
【主权项】
1. 一种基于支持向量机的AVS到HEVC优化视频转码方法,其特征在于,通过采集AVS 码流的特征向量,并利用支持向量机对其进行学习并得到训练模型,将提取出的AVS特征 向量分为在HEVC中相应位置的CU划分或不划分两类,在转码阶段以训练模型预测CU是 否需要划分,当得到当前CU需要划分时,再在当前HEVC的深度下分别进行2NX2N模式和 SKIP模式计算,并从这两种模式中选择出最优预测模式,当预测得到当前CU不需要进行划 分,则按照HEVC标准编码过程进行最优模式选择。
2. 根据权利要求1所述的方法,其特征是,所述的AVS特征向量采集自AVS码流,包括: 宏块编码模式、运动向量和变换系数。
3. 根据权利要求2所述的方法,其特征是,所述的宏块编码模式是指:AVS中每个宏 块的模式信息;所述的运动向量是指:AVS中宏块的平均运动向量大小;所述的变换系数是 指:AVS编码的离散余弦变换系数中非零系数的个数。
4. 根据权利要求2或3所述的方法,其特征是,所述的宏块编码模式是指:在AVS对应 的HEVC中深度为O时,每个CU中包含有16个宏块,因此含有16个特征;在深度为1时,每 个CU中包含有4个宏块,相应的有4个模式特征;所述的运动向量是指:AVS中运动向量是 以8X8为单位,一个宏块中包含4个运动向量基本单元,每个运动向量分别取模,然后将一 个宏块中四个运动向量模的平均值作为一个特征,当深度为〇时CU中含有16个运动特征, 深度为1时含有4个运动特征;所述的变换系数是指:AVS中DCT也是以8X8块为单位,将 一个宏块内所有DCT系数中非零系数的个数作为一个特征,当深度为O时含有16个DCT系 数特征,深度为1时含有4个DCT系数特征。
5. 根据权利要求1所述的方法,其特征是,所述的最优预测模式是指:对2NX2N和 SKIP模式进行率失真比较,选择出的率失真代价最小的编码模式。
6. 根据权利要求1所述的方法,其特征是,所述的最优模式选择是指:对HEVC中所有 的编码模式进行率失真的比较,从而选择出率失真代价最小的过程。
【专利摘要】一种基于支持向量机的AVS到HEVC优化视频转码方法,通过采集AVS码流的特征向量,并利用支持向量机对其进行学习并得到训练模型,将提取出的AVS特征向量分为在HEVC中相应位置的CU划分或不划分两类,在转码阶段以训练模型预测CU是否需要划分,当得到当前CU需要划分时,再在当前HEVC的深度下分别进行2N×2N模式和SKIP模式计算,并从这两种模式中选择出最优预测模式,当预测得到当前CU不需要进行划分,则按照HEVC标准编码过程进行最优模式选择。本发明结合了机器学习基本思想,将整个转码过程分为了训练阶段和转码阶段,通过学习得到训练模型,预测HEVC中CU的划分,并结合快速模式选择算法,既提高了转码的速度,又保证了转码后视频的整体视频质量。
【IPC分类】H04N19-103, H04N19-147, H04N19-40
【公开号】CN104837019
【申请号】CN201510215888
【发明人】解蓉, 罗瑞, 张文军, 张良
【申请人】上海交通大学
【公开日】2015年8月12日
【申请日】2015年4月30日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1