一种编码单元的模式决策方法和装置的制造方法

文档序号：10573049阅读：196来源：国知局

一种编码单元的模式决策方法和装置的制造方法
【专利摘要】本发明实施例提供了一种编码单元的模式决策方法和装置。其中的方法包括：对当前编码单元分别进行Merge模式决策和2N×2N模式决策，得到最优编码模式；确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费；在非零DCT系数数目和最小率失真花费满足终止决策条件时，终止对所述当前编码单元的模式决策。本发明实施例可以避免遍历计算所有帧内模式和帧间模式的率失真花费，从而可以减少模式决策过程中选择预测模式所需要的计算量，进而能够在一定程度减少编码过程中的运算量及复杂度，降低编码的复杂度和编码时间。
【专利说明】
一种编码单元的模式决策方法和装置
技术领域
[0001]本发明涉及视频编码技术领域，特别是涉及一种编码单元的模式决策方法和装置。
【背景技术】
[0002]HEVC(High Efficiency Video Coding，高效视频编码标准)是新一代视频编码标准，其可用于解决人们对视觉和听觉质量日益增加的需求。
[0003]为了提高编码效率，HEVC采用了更加灵活的编码结构，包括⑶(Coding Unit，编码单元)、PU(Predict1n Unit，预测单元)和TU(Transform unit，变换单元)。其中，CU是HEVC编码的基本单元，CU的最大尺寸为64 X 64，最小尺寸为4 X 4 JU以⑶为基础进行划分，用于实现CU的预测过程，每个CU可以划分为I个、2个或者4个PU JU以CU为基础进行划分，用于实现对⑶的变换过程，每个⑶可以包含一个或多个TU。
[0004]其中，PU的划分是和预测模式相关的，预测模式具体可以包括:帧内(intra)模式和帧间(inter)模式。对于采用帧内模式编码的CU，可以采用2N X 2N和NX N两种PU划分方式;对于采用帧间模式编码的0]，可以采用2~\212~\~川\212~\111]、2~\110、111^2_口nRX2N七种PU划分方式。
[0005]最终选择哪种PU划分方式是由率失真花费决定的，编码器需要依次遍历帧内模式和帧间模式中的所有PU划分方式，逐个计算率失真花费，并选择率失真花费最小的PU划分方式。然而，由于需要计算每一种预测模式下的率失真代价，且率失真代价的计算量较大，导致模式决策过程需要花费较多的时间，占整个编码时长的60%?70%，大大增加了编码的复杂度和编码时间。

【发明内容】

[0006]本发明实施例所要解决的技术问题是提供一种编码单元的模式决策方法和装置，能够减少预测模式选择过程所需要的计算量，从而能够在一定程度减少编码过程中的运算量及复杂度，进一步地可以降低编码的复杂度和编码时间。
[0007]为了解决上述问题，本发明公开了一种编码单元的模式决策方法，包括:
[0008]对当前编码单元分别进行Merge模式决策和2NX2N模式决策，得到最优编码模式；
[0009]确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费；
[0010]在非零DCT系数数目和最小率失真花费满足终止决策条件时，终止对所述当前编码单元的模式决策。
[0011 ]可选地，所述终止决策条件包括:
[0012]所述非零DCT系数数目小于第一阈值，且所述最小率失真花费小于第二阈值；其中，所述第一阈值、所述第二阈值为依据所述当前编码单元的尺寸参数、以及均匀运动场参数所确定。
[0013]可选地，通过如下步骤确定所述均匀运动场参数:
[0014]确定所述当前编码单元的最优参考索引；
[0015]将所述当前编码单元划分为多个子编码单元；
[0016]以所述最优参考索引对应的最优运动向量为参考，对所述多个子编码单元分别进行运动估计，以得到所述多个子编码单元分别对应的运动向量；
[0017]在所有的子编码单元对应的运动向量均和所述最优运动向量相同时，设置所述当前编码单元的均匀运动场参数为I;否则，设置所述当前编码单元的均匀运动场参数为O。
[0018]可选地，所述确定所述最优编码模式对应的非零DCT系数数目的步骤，包括:
[0019]根据所述最优编码模式确定所述当前编码单元对应的预测图像；
[0020]将所述预测图像和所述当前编码单元对应的源图像相减得到对应的残差；
[0021 ]对所述残差执行DCT变换以及量化操作，得到非零DCT系数数目。
[0022]可选地，所述对当前编码单元进行Merge模式决策的步骤，包括:
[0023]对所述当前编码单元构建Merge候选列表；
[0024]对所述Merge候选列表中的候选运动向量计算率失真花费；
[0025]选择率失真花费最小的候选运动向量作为最优运动向量，所述最优运动向量对应的Merge候选模式为最优Merge模式。
[0026]依据本发明的另一方面，提供了一种编码单元的模式决策装置，包括:
[0027]模式确定模块，用于对当前编码单元分别进行Merge模式决策和2NX2N模式决策，得到最优编码模式；
[0028]参数确定模块，用于确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费；
[0029]条件判断模块，用于在非零DCT系数数目和最小率失真花费满足终止决策条件时，终止对所述当前编码单元的模式决策。
[0030]可选地，所述终止决策条件包括:
[0031]所述非零DCT系数数目小于第一阈值，且所述最小率失真花费小于第二阈值；其中，所述第一阈值、所述第二阈值为依据所述当前编码单元的尺寸参数、以及均匀运动场参数所确定。
[0032]可选地，所述装置还包括:运动场参数确定模块，用于确定均匀运动场参数;所述运动场参数确定模块，包括:
[0033]索引确定子模块，用于确定所述当前编码单元的最优参考索引；
[0034]划分子模块，用于将所述当前编码单元划分为多个子编码单元；
[0035]运动估计子模块，用于以所述最优参考索引对应的最优运动向量为参考，对所述多个子编码单元分别进行运动估计，以得到所述多个子编码单元分别对应的运动向量；
[0036]参数确定子模块，用于在所有的子编码单元对应的运动向量均和所述最优运动向量相同时，设置所述当前编码单元的均匀运动场参数为I;否则，设置所述当前编码单元的均匀运动场参数为O。
[0037]可选地，所述参数确定模块包括:非零系数数目确定子模块，用于确定所述最优编码模式对应的非零DCT系数数目；所述非零系数数目确定子模块，包括:
[0038]预测单元，用于根据所述最优编码模式确定所述当前编码单元对应的预测图像；
[0039]残差计算单元，用于将所述预测图像和所述当前编码单元对应的源图像相减得到对应的残差；
[0040]量化单元，用于对所述残差执行DCT变换以及量化操作，得到非零DCT系数数目。[0041 ]可选地，所述装置还包括:Merge模式决策模块，用于对当前编码单元进行Merge模式决策;所述Merge模式决策模块，包括:
[0042 ]建立子模块，用于对所述当前编码单元构建Merge候选列表；
[0043]计算子模块，用于对所述Merge候选列表中的候选运动向量计算率失真花费；
[0044]确定子模块，用于选择率失真花费最小的候选运动向量作为最优运动向量，所述最优运动向量对应的Merge候选模式为最优Merge模式。
[0045]与现有技术相比，本发明实施例包括以下优点:
[0046]本发明实施例在对编码单元进行编码的过程中，首先对当前编码单元分别进行帧间Merge模式决策和帧间2NX2N模式决策，得到最优编码模式。如果所述最优编码模式满足终止决策条件，即可终止对所述当前编码单元的模式决策过程。如果通过帧间Merge模式和帧间2NX2N模式这两种模式决策得到的最优编码模式满足终止决策条件，说明所述最优编码模式已经可以达到预期的编码效果，即可提前终止对所述当前编码单元的模式决策过程。因此，本发明实施例可以避免遍历计算所有帧内模式和帧间模式的率失真花费，从而可以减少模式决策过程中选择预测模式所需要的计算量，进而能够在一定程度减少编码过程中的运算量及复杂度，降低编码的复杂度和编码时间。此外，本发明实施例能够有效降低选择预测模式花费的时间，进而可以满足一些实时性要求较高的场景的需求。
【附图说明】
[0047]图1示出了本发明实施例的一种编码单元的模式决策方法的步骤流程图；
[0048]图2示出了本发明实施例的一种编码单元的模式决策装置的结构框图；
[0049]图3示出了本发明实施例的另一种编码单元的模式决策装置的结构框图。
【具体实施方式】
[0050]为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和【具体实施方式】对本发明作进一步详细的说明。
[0051 ]方法实施例
[0052]参照图1，示出了本发明实施例的一种编码单元的模式决策方法的步骤流程图，具体可以包括如下步骤:
[0053]步骤101、对当前编码单元分别进行帧间Merge模式决策和帧间2NX2N模式决策，得到最优编码模式；
[0054]步骤102、确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费；
[0055]步骤103、在非零DCT系数数目和最小率失真花费满足终止决策条件时，终止对所述当前编码单元的模式决策。
[0056]本发明实施例可应用于各种电子设备中的视频编码器，在视频编码器对视频图像进行编码的过程中，在满足终止决策条件时，可以提前终止对编码单元模式决策的计算过程，避免对当前编码单元遍历计算所有帧内模式和帧间模式的率失真花费，从而能够在一定程度上减少当前编码单元模式决策过程中的运算量及复杂度，进一步地可以降低编码的复杂度和编码时间。可以理解，所述电子设备具体可以包括:移动电话、无线装置、个人数据助理、手持式或便携式计算机、GPS(Global Posit1ning System，全球定位系统)接收机/导航器、照相机、音频/视频播放器、摄像机、录像机、监控设备等，本发明实施例对于所述电子设备的具体形式不加以限制。
[0057]需要说明的是，在对编码单元进行编码的过程中，首先需要对编码单元进行预测，以得到预测图像;然后对残差进行DCT(Discrete Cosine Transform，离散余弦变换)编码。其中，残差为将预测图像和当前编码单元对应的源图像相减得到。本发明实施例中所述的非零DCT系数数目具体指对残差进行DCT变换，以及量化后得到的非零DCT系数数目。具体地，所述确定所述最优编码模式对应的非零DCT系数数目的步骤，具体可以包括:
[0058]步骤S11、根据所述最优编码模式确定所述当前编码单元对应的预测图像；
[0059]步骤S12、将所述预测图像和所述当前编码单元对应的源图像相减得到对应的残差;
[0060]步骤S13、对所述残差执行DCT变换以及量化操作，得到非零DCT系数数目。
[0061]在具体应用中，DCT是指将一组光强数据转换成频率数据，通过DCT变换可以将原始图像信息块转换成代表不同频率分量的DCT系数集，量化实际上就是对DCT系数的一个优化过程，利用人眼对高频数据不敏感的特性来实现数据的大幅简化。量化的目的是减小非零DCT系数的数目以及增加零值DCT系数的数目。
[0062]由于在实际的编码过程中，对于一个任意尺寸的⑶，帧间Merge模式和帧间2NX2N模式使用的比例显著高于其它的PU划分模式。因此，本发明实施例首先对当前编码单元分别进行帧间Merge模式决策和帧间2NX2N模式决策，得到最优编码模式。如果通过这两种模式决策得到的最优编码模式满足终止决策条件时，说明所述最优编码模式已经可以达到预期的编码效果，即可终止对所述当前编码单元的模式决策过程，也即可以节省对其它7种帧间预测模式以及两种帧内预测模式的率失真花费计算过程，减少了预测模式选择过程所需要的计算量，能够有效降低预测模式选择的耗时，进而可以满足一些实时性要求较高的场景的需求。
[0063]在具体应用中，帧间预测采用Merge模式时，不需要进行复杂的运动估计，只有运动补偿。当前PU的运动信息(包括运动矢量、参考索弓1、预测模式)都可以通过相邻PU的运动信息推导得到。编码时，当前PU只需要传送合并标记(Merge Flag)以及合并索引(MergeIndex)，无需传送其运动信息。这样可以大幅度节省运动信息的编码比特数，并且可以减少编码的复杂度。因此，本发明实施例首先对当前编码单元进行Merge模式决策，可选地，所述对当前编码单元进行Merge模式决策的步骤，具体可以包括:
[0064]步骤S21、对所述当前编码单元构建Merge候选列表；
[0065]步骤S22、对所述Merge候选列表中的候选运动向量计算率失真花费；
[0066]步骤S23、选择率失真花费最小的候选运动向量作为最优运动向量，所述最优运动向量对应的Merge候选模式为最优Merge模式。
[0067]具体地，首先为当前⑶建立一个Merge候选列表，该候选列表中包括若干Merge候选模式对应的候选运动向量MV及参考图像。通过遍历这些候选MV，确定其对应的TU划分模式，以及计算每个候选MV对应的率失真花费，最终选取率失真花费最小的候选MV作为最优MV，所述最优MV对应的Merge候选模式为最优Merge模式。若编码器依照相同的方式建立该候选列表，则编码器只需要传输最优MV在候选列表中的索引即可，这样大幅度节省了运动信息的编码比特数。
[0068]在本发明实施例中，可以先对当前编码单元进行帧间Merge模式决策，得到最优Merge模式，再对当前编码单元再进行帧间2N X 2N模式决策，得到最优2N X 2N模式，最后选择最优Merge模式和最优2N X 2N模式中率失真花费最小的一个作为最优编码模式，且对应的率失真花费为最小率失真花费。
[0069]在本发明实施例中，计算率失真花费的过程可以通过现有的率失真花费计算公式所得到，此处不再赘述。在确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费之后，可以判断所述非零DCT系数数目和最小率失真花费是否满足终止决策条件，若满足，则终止对所述当前编码单元的模式决策。
[0070]在本发明的一种可选实施例中，所述终止决策条件具体可以包括:
[0071]所述非零DCT系数数目小于第一阈值，且所述最小率失真花费小于第二阈值；其中，所述第一阈值、所述第二阈值为依据所述当前编码单元的尺寸参数、以及均匀运动场参数所确定。
[0072]具体地，所述终止决策条件可以包括如下不等式:
[0073]coefnum<coefnum_th(cu_width,is_mvf_all_eq) (I)
[0074]rdcost<rdcost_th(cu_width,is_mvf_all_eq) (2)
[0075]其中，coefnum为非零DCT系数数目，coefnum_th为第一阈值，rdcost为最小率失真花费，rdcost_th为第二阈值。需要说明的是，所述第一阈值coefnum_th和第二阈值rdcost_th，可以为通过运行编码器，根据大量的测试结果测试得到的经验值。
[0076]在具体应用中，coefnum的值越大，说明当前编码单元的预测越不精确，残差越多；rdcost的值越大说明当前编码单元的复杂度越高，该编码单元需要的预测花费和残差的DCT变换花费都较多。本发明实施例可以预置较小的第一阈值COefnum_th和第二阈值rdcost_th，使得在满足上述终止决策条件时，表示coefnum和rdcost的值都比较小，在这种情况下，说明当前编码单元的复杂度较低，按照当前PU划分模式进行预测已经很精确了，不需要再决策当前⑶的2NXN模式、NX2N模式以及4个非对称模式的情况。因此，可以节省一部分CU模式的计算过程，从而极大节省计算复杂度。
[0077]在本发明实施例中，所述coefnum_th为依据cu_width、以及is_mvf_all_eq所确定。其中，所述cu_width为当前编码单元的尺寸。所述is_mvf_all_eq为当前编码单元的均匀运动场参数，在is_mvf_all_eq为I时，表示当前编码单元的各部分具有相同的运动场;在is_mvf_all_eqS(^t，表示当前编码单元的各部分不具有相同的运动场。具体地，coefnum_th的值随cu_width的增加而增大；coefnum_th的值在is_mvf_all_eq为I时比在is_mvf_已11_6卩为0时显著增大。
[0078]在本发明的一种可选实施例中，可以通过如下步骤确定所述均匀运动场参数:
[0079]步骤S31、确定所述当前编码单元的最优参考索引；
[0080]具体地，可以确定当前编码单元2NX2N模式的最优参考索引best_ref，如果当前编码单元的2NX2N模式是双向运动补偿，那么可以存在两个最优参考索引，则从中随意选择一个即可。
[0081]步骤S32、将所述当前编码单元划分为多个子编码单元；
[0082]具体地，可以将当前编码单元划分为4个N X N子编码单元。
[0083]步骤S33、以所述最优参考索引对应的最优运动向量为参考，对所述多个子编码单元分别进行运动估计，以得到所述多个子编码单元分别对应的运动向量；
[0084]具体地，可以最优参考索引对应的最优运动向量best_mv为参考，对上述4个子编码单元分别执行一次运动估计，以得到所述子编码单元对应的运动向量。
[0085]步骤S34、在所有的子编码单元对应的运动向量均和所述最优运动向量相同时，设置所述编码单元的均匀运动场参数为I;否则，设置所述编码单元的均匀运动场参数为O。
[0086 ] 具体地，在所述4个子编码单元对应的运动向量均和b e s t_m V相同时，贝Ij，可以确定当前编码单元具有均匀运动场，则设置变量is_mvf_all_eq的值为I;否则，可以确定当前编码单元不具有均勾运动场，则设置变量is_mvf_all_eq的值为O。
[0087]综上，本发明实施例在对编码单元进行编码的过程中，首先对当前编码单元分别进行帧间Merge模式决策和帧间2NX2N模式决策，得到最优编码模式。如果所述最优编码模式满足终止决策条件，即可终止对所述当前编码单元的模式决策过程。如果通过帧间Merge模式和帧间2NX2N模式这两种模式决策得到的最优编码模式满足终止决策条件，说明所述最优编码模式已经可以达到预期的编码效果，即可提前终止对所述当前编码单元的模式决策过程。因此，本发明实施例可以避免遍历计算所有帧内模式和帧间模式的率失真花费，从而可以减少模式决策过程中选择预测模式所需要的计算量，进而能够在一定程度减少编码过程中的运算量及复杂度，降低编码的复杂度和编码时间。此外，本发明实施例能够有效降低选择预测模式花费的时间，进而可以满足一些实时性要求较高的场景的需求。
[0088]应用示例
[0089]为了使本领域技术人员更加理解本发明实施例的编码单元的模式决策方法，下面通过具体示例说明本发明实施例的实现过程。
[0090]对于当前CU，首先，分别决策其帧间Merge模式和帧间2NX2N模式，得到其中率失真花费最小的模式，以及得到非零DCT系数数目coefnum和最小率失真花费rdcost。
[0091]然后，获得当前⑶的2NX2N模式的一个最优参考索引best_ref(如果当前⑶的2NX2N模式是双向运动补偿，那么最优参考索引是2个，随意选择一个即可)，将当前CU块划分为四个N X Ni夬，以最优参考索引对应的2N X 2N的最优运动向量bestjw为参考，分别执行一次运动估计，判断其运动向量是否全部和best_mv相同，如果相同，设置is_mvf_all_eq为I，否则为O。
[0092]最后，判断如下两个不等式是否成立，若成立，则终止当前⑶的模式决策过程。
[0093]coefnum<coefnum_th(cu_width,is_mvf_all_eq)
[0094]rdcost<rdcost_th(cu_width,is_mvf_all_eq)
[0095]本发明改进了CU的模式决策算法，可以节省一部分CU模式的计算量，从而极大节省计算复杂度。具体地，可以加速H.265编码器11 %，而压缩效率损失仅为0.5 %。
[0096]需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。
[0097]装置实施例
[0098]参照图2，示出了本发明实施例的一种编码单元的模式决策装置的结构框图，具体可以包括如下模块:
[0099]模式确定模块210，用于对当前编码单元分别进行Merge模式决策和2NX2N模式决策，得到最优编码模式；
[0100]参数确定模块220，用于确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费；
[0101]条件判断模块230，用于在非零DCT系数数目和最小率失真花费满足终止决策条件时，终止对所述当前编码单元的模式决策。
[0102]在本发明的一种可选实施例中，所述终止决策条件具体可以包括:
[0103]所述非零DCT系数数目小于第一阈值，且所述最小率失真花费小于第二阈值；其中，所述第一阈值、所述第二阈值为依据所述当前编码单元的尺寸参数、以及均匀运动场参数所确定。
[0104]参照图3，示出了本发明实施例的另一种编码单元的模式决策装置的结构框图。具体可以包括如下模块:模式确定模块310、参数确定模块320、条件判断模块330、运动场参数确定模块340;
[0105]其中，所述运动场参数确定模块340，用于确定均匀运动场参数;所述运动场参数确定模块340，具体可以包括:
[0106]索引确定子模块341，用于确定所述当前编码单元的最优参考索引；
[0107]划分子模块342，用于将所述当前编码单元划分为多个子编码单元；
[0108]运动估计子模块343，用于以所述最优参考索引对应的最优运动向量为参考，对所述多个子编码单元分别进行运动估计，以得到所述多个子编码单元分别对应的运动向量；
[0109]参数确定子模块344，用于在所有的子编码单元对应的运动向量均和所述最优运动向量相同时，设置所述当前编码单元的均匀运动场参数为I;否则，设置所述当前编码单元的均匀运动场参数为O。
[0110]在本发明的一种可选实施例中，所述参数确定模块320，具体可以包括:非零系数数目确定子模块321，用于确定所述最优编码模式对应的非零DCT系数数目；所述非零系数数目确定子模块321，具体可以包括:
[0111]预测单元3211，用于根据所述最优编码模式确定所述当前编码单元对应的预测图像；
[0112]残差计算单元3212，用于将所述预测图像和所述当前编码单元对应的源图像相减得到对应的残差；
[0113]量化单元3213，用于对所述残差执行DCT变换以及量化操作，得到非零DCT系数数目。
[0114]在本发明的另一种可选实施例中，所述装置还可以包括:Merge模式决策模块350，用于对当前编码单元进行Merge模式决策;所述Merge模式决策模块350，具体可以包括:
[0115]建立子模块351，用于对所述当前编码单元构建Merge候选列表；
[0116]计算子模块352，用于对所述Merge候选列表中的候选运动向量计算率失真花费；
[0117]确定子模块353，用于选择率失真花费最小的候选运动向量作为最优运动向量，所述最优运动向量对应的Merge候选模式为最优Merge模式。
[0118]对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
[0119]本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。
[0120]本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0121]本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0122]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0123]这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0124]尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
[0125]最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
[0126]以上对本发明所提供的一种编码单元的模式决策方法和装置，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在【具体实施方式】及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。
【主权项】
1.一种编码单元的模式决策方法，其特征在于，所述方法包括: 对当前编码单元分别进行Merge模式决策和2N X 2N模式决策，得到最优编码模式；确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费；在非零DCT系数数目和最小率失真花费满足终止决策条件时，终止对所述当前编码单元的模式决策。2.如权利要求1所述的方法，其特征在于，所述终止决策条件包括: 所述非零DCT系数数目小于第一阈值，且所述最小率失真花费小于第二阈值;其中，所述第一阈值、所述第二阈值为依据所述当前编码单元的尺寸参数、以及均匀运动场参数所确定。3.如权利要求2所述的方法，其特征在于，通过如下步骤确定所述均匀运动场参数: 确定所述当前编码单元的最优参考索引；将所述当前编码单元划分为多个子编码单元；以所述最优参考索引对应的最优运动向量为参考，对所述多个子编码单元分别进行运动估计，以得到所述多个子编码单元分别对应的运动向量；在所有的子编码单元对应的运动向量均和所述最优运动向量相同时，设置所述当前编码单元的均匀运动场参数为I;否则，设置所述当前编码单元的均匀运动场参数为O。4.如权利要求1至3任一所述的方法，其特征在于，所述确定所述最优编码模式对应的非零DCT系数数目的步骤，包括: 根据所述最优编码模式确定所述当前编码单元对应的预测图像；将所述预测图像和所述当前编码单元对应的源图像相减得到对应的残差；对所述残差执行DCT变换以及量化操作，得到非零DCT系数数目。5.如权利要求1至3任一所述的方法，其特征在于，所述对当前编码单元进行Merge模式决策的步骤，包括: 对所述当前编码单元构建Merge候选列表；对所述Merge候选列表中的候选运动向量计算率失真花费；选择率失真花费最小的候选运动向量作为最优运动向量，所述最优运动向量对应的Merge候选模式为最优Merge模式。6.一种编码单元的模式决策装置，其特征在于，所述装置包括: 模式确定模块，用于对当前编码单元分别进行Merge模式决策和2N X 2N模式决策，得到最优编码模式；参数确定模块，用于确定所述最优编码模式对应的非零DCT系数数目和最小率失真花费；条件判断模块，用于在非零DCT系数数目和最小率失真花费满足终止决策条件时，终止对所述当前编码单元的模式决策。7.如权利要求6所述的装置，其特征在于，所述终止决策条件包括: 所述非零DCT系数数目小于第一阈值，且所述最小率失真花费小于第二阈值;其中，所述第一阈值、所述第二阈值为依据所述当前编码单元的尺寸参数、以及均匀运动场参数所确定。8.如权利要求7所述的装置，其特征在于，所述装置还包括:运动场参数确定模块，用于确定均匀运动场参数;所述运动场参数确定模块，包括: 索引确定子模块，用于确定所述当前编码单元的最优参考索引；划分子模块，用于将所述当前编码单元划分为多个子编码单元；运动估计子模块，用于以所述最优参考索引对应的最优运动向量为参考，对所述多个子编码单元分别进行运动估计，以得到所述多个子编码单元分别对应的运动向量；参数确定子模块，用于在所有的子编码单元对应的运动向量均和所述最优运动向量相同时，设置所述当前编码单元的均匀运动场参数为I;否则，设置所述当前编码单元的均匀运动场参数为O。9.如权利要求6至8任一所述的装置，其特征在于，所述参数确定模块包括:非零系数数目确定子模块，用于确定所述最优编码模式对应的非零DCT系数数目；所述非零系数数目确定子t吴块，包括: 预测单元，用于根据所述最优编码模式确定所述当前编码单元对应的预测图像；残差计算单元，用于将所述预测图像和所述当前编码单元对应的源图像相减得到对应的残差；量化单元，用于对所述残差执行DCT变换以及量化操作，得到非零DCT系数数目。10.根据权利要求6至8任一所述的装置，其特征在于，所述装置还包括:Merge模式决策模块，用于对当前编码单元进行Merge模式决策;所述Merge模式决策模块，包括: 建立子模块，用于对所述当前编码单元构建Merge候选列表；计算子模块，用于对所述Merge候选列表中的候选运动向量计算率失真花费；确定子模块，用于选择率失真花费最小的候选运动向量作为最优运动向量，所述最优运动向量对应的Merge候选模式为最优Merge模式。
【文档编号】H04N19/147GK105933717SQ201610262469
【公开日】2016年9月7日
【申请日】2016年4月25日
【发明人】朱洪波
【申请人】北京奇艺世纪科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱洪波;
技术所有人：北京奇艺世纪科技有限公司;
我是此专利的发明人

上一篇：视频直播互动销售系统及方法
上一篇：一种基于深度引导扩展块匹配的三维视频帧率提升方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。