相关申请的交叉引用根据适用的《专利法》和/或《巴黎公约》的规定,本申请及时要求于2018年11月10日提交的国际专利申请号pct/cn2018/114931的优先权和利益。根据美国法律的目的,将上述申请的全部公开以引用方式并入本文,作为本申请公开的一部分。本申请文档一般针对图像和视频编解码技术。
背景技术:
:运动补偿是视频处理中的技术,其通过考虑相机和/或视频中的对象的运动,在给定先前和/或将来帧的情况下预测视频中的帧。运动补偿可以用于视频数据的编码和解码以实现视频压缩。技术实现要素:描述了与用于图像和视频编解码的、基于子块的预测的统一取整方法相关的设备、系统和方法。在一个代表性方面,所公开的技术可用于提供视频处理的方法。所述方法包括:基于运动候选对,为视频的当前块的处理生成成对merge候选;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=shift(mv0x+mv1x,1)且mv*y=shift(mv0y+mv1y,1),其中,shift(x,s)=(x+off)>>s,其中off和s是整数,并且其中,>>表示右移操作。在另一代表性方面,所公开的技术可用于提供视频处理的方法。所述方法包括:基于运动候选对,为视频的当前块的处理生成成对merge候选;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=signshift(mv0x+mv1x,1)且mv*y=signshift(mv0y+mv1y,1),其中其中off和s是整数,并且其中,>>表示移位操作。在又一代表性方面,所公开的技术可用于提供视频处理的方法。所述方法包括:基于运动候选对,为视频的当前块的处理生成成对merge候选;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=signshift(mv0x+mv1x,1)且mv*y=signshift(mv0y+mv1y,1),其中其中off和s是整数,并且其中,>>表示移位操作。在又一代表性方面,所公开的技术可用于提供视频处理的方法。所述方法包括:为视频的当前块的处理生成成对merge候选,其中所述生成基于参考包含所述当前块的当前图片的运动候选对;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=shift(mv0x+mv1x,1)且mv*y=shift(mv0y+mv1y,1),其中shift(x,s)=(x+off)>>s,其中off和s是整数,并且其中,>>表示右移操作。在又一代表性方面,所公开的技术可用于提供视频处理的方法。所述方法包括:为视频的当前块的处理生成成对merge候选,其中所述生成基于参考包含所述当前块的当前图片的运动候选对;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=signshift(mv0x+mv1x,1)且mv*y=signshift(mv0y+mv1y,1),其中其中off和s是整数,并且其中,>>表示移位操作。在又一代表性方面,所公开的技术可用于提供视频处理的方法。所述方法包括:为视频的当前块的处理生成成对merge候选,其中所述生成基于参考包含所述当前块的当前图片的运动候选对;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=signshift(mv0x+mv1x,1)且mv*y=signshift(mv0y+mv1y,1),其中其中off和s是整数,并且其中,>>表示移位操作。在又一代表性方面,所公开的技术可用于提供视频处理的方法。所述方法包括:为视频的当前块的处理生成成对merge候选,其中所述生成基于参考包含所述当前块的当前图片的运动候选对;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=(shift(mv0x+mv1x,(w+1)))<<w且mv*y=(shift(mv0y+mv1y,(w+1)))<<w,其中shift(x,s)=(x+off)>>s,其中w、off和s是整数,并且其中,>>表示右移操作。在又一代表性方面,所公开的技术可用于提供视频处理的方法。所述方法包括:为视频的当前块的处理生成成对merge候选,其中所述生成基于参考包含所述当前块的当前图片的运动候选对;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=(signshift(mv0x+mv1x,(w+1)))<<w且mv*y=(signshift(mv0y+mv1y,(w+1)))<<w,其中其中w、off和s是整数,并且其中,>>表示移位操作。在又一代表性方面,所公开的技术可用于提供视频处理的方法。所述方法包括:为视频的当前块的处理生成成对merge候选,其中所述生成基于参考包含所述当前块的当前图片的运动候选对;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=(signshift(mv0x+mv1x,(w+1)))<<w且mv*y=(signshift(mv0y+mv1y,(w+1)))<<w,其中其中w、off和s是整数,并且其中,>>表示移位操作。在又一代表性方面,所公开的技术可用于提供视频处理的方法。所述方法包括:基于缩放运动矢量和列表0运动矢量,为使用几何分割模式编解码的视频的当前块,生成单向预测运动候选;以及基于所述单向预测运动候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述缩放运动矢量为mv1’=(mv1′x,mv1′y),并且所述列表0运动矢量为mv0=(mv0x,mv0y),并且其中,mv*=(mv*x,mv*y)是所述单向预测运动候选,使得:mv*x=shift(mv0x+mv1′x,1)且mv*y=shift(mv0y+mv1′y,1),其中shift(x,s)=(x+off)>>s,其中off和s是整数,并且其中,>>表示右移操作。在又一代表性方面,所公开的技术可用于提供视频处理的方法。所述方法包括:基于缩放运动矢量和列表0运动矢量,为使用几何分割模式编解码的视频的当前块,生成单向预测运动候选;以及基于所述单向预测运动候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述缩放运动矢量为mv1’=(mv1′x,mv1′y),并且所述列表0运动矢量为mv0=(mv0x,mv0y),并且其中,mv*=(mv*x,mv*y)是所述单向预测运动候选,使得:mv*x=signshift(mv0x+mv1′x,1)且mv*y=signshift(mv0y+mv1′y,1),其中其中off和s是整数,并且其中,>>表示移位操作。在又一代表性方面,所公开的技术可用于提供视频处理的方法。所述方法包括:基于缩放运动矢量和列表0运动矢量,为使用几何分割模式编解码的视频的当前块,生成单向预测运动候选;以及基于所述单向预测运动候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述缩放运动矢量为mv1’=(mv1′x,mv1′y),并且所述列表0运动矢量为mv0=(mv0x,mv0y),并且其中,mv*=(mv*x,mv*y)是所述单向预测运动候选,使得:mv*x=signshift(mv0x+mv1′x,1)且mv*y=signshift(mv0y+mv1′y,1),其中其中off和s是整数,并且其中,>>表示移位操作。在又一代表性方面,上述方法可以以处理器可执行代码的形式体现,并且存储在计算机可读程序介质中。在又一代表性方面,公开了一种设备,其被配置为或可操作以执行上述方法。所述设备可以包括被编程以实现该方法的处理器。在又一代表性方面,视频解码装置可以实现本文中所述的方法。在附图、说明书和权利要求书中更详细地描述了所公开的技术的上述和其它方面和特征。附图说明图1示出了基于子块的预测的示例。图2示出了简化的仿射运动模型的示例。图3示出了每个子块的仿射运动矢量场(mvf)的示例。图4示出了af_inter仿射运动模式的运动矢量预测(mvp)的示例。图5a和5b示出了af_merge仿射运动模式的示例候选。图6示出了使用用于编解码单元(cu)的可选时域运动矢量预测(atmvp)算法的运动预测的示例。图7示出了空时运动矢量预测(stmvp)算法使用的具有子块和相邻块的编解码单元(cu)的示例。图8示出了双向光流(bio)算法使用的光流轨迹的示例。图9a和9b示出了使用无块扩展的双向光流(bio)算法的示例快照。图10示出了帧速率上转换(fruc)算法中的双边匹配的示例。图11示出了fruc算法中的模板匹配的示例。图12示出了fruc算法中的单边运动估计的示例。图13示出了jem中4:2:0格式的不同分量的子块的示例。图14示出了根据所公开的技术的4:2:0格式的不同分量的子块的示例。图15示出了根据所公开的技术的4:2:0格式的不同分量的子块的另一示例。图16示出了根据所公开的技术的子块运动矢量(mv)复制的示例。图17示出了根据所公开的技术的子块运动矢量(mv)复制的另一示例。图18示出了子块运动矢量(mv)推导的示例。图19a至19c示出了视频处理的示例方法的流程图。图20是用于实现本文档所述的视觉媒体解码或视觉媒体编码技术的硬件平台的示例的框图。图21是可以实现所公开的技术的示例视频处理系统的框图。具体实施方式由于对高分辨率视频的需求日益增加,视频编解码方法和技术在现代技术中无处不在。视频编解码器通常包括压缩或解压缩数字视频的电子电路或软件,并且不断地被改进以提供更高的编解码效率。视频编解码器将未压缩的视频转换为压缩格式,或反之亦然。视频质量、用于表示视频的数据量(由比特率决定)、编码和解码算法的复杂度、对数据丢失和错误的敏感度、易于编辑、随机访问和端到端延迟(等待时间(latency))之间存在复杂的关系。压缩格式通常符合标准视频压缩规范,例如,高效视频编解码(hevc)标准(也称为h.265或mpeg-h第2部分)、待定案的多功能视频编解码标准或其它当前和/或未来的视频编解码标准。基于子块的预测首先被高效视频编解码(hevc)标准引入视频编解码标准。使用基于子块的预测,将块(诸如编解码单元(cu)或预测单元(pu))划分为几个不重叠的子块。可以为不同的子块分配不同的运动信息,诸如参考索引或运动矢量(mv),并为每个子块分别执行运动补偿(mc)。图1示出了基于子块的预测的示例。所公开的技术的实施例可应用于现有视频编解码标准(例如,hevc、h.265)和未来标准,以提高运行时间性能。在本文中,使用章节标题来提高描述的可读性,并且不会以任何方式将讨论或实施例(和/或实现)仅限于各自的章节。1.联合探索模型(jem)的示例在一些实施例中,使用名为联合探索模型(jem)的参考软件来探索未来的视频编解码技术。在jem中,基于子块的预测被用于多种编解码工具中,诸如仿射预测、可选时域运动矢量预测(atmvp)、空时运动矢量预测(stmvp)、双向光流(bio)、帧速率上转换(fruc)、局部自适应运动矢量分辨率(lamvr)、重叠块运动补偿(obmc)、局部照明补偿(lic)和解码器侧运动矢量细化(dmvr)。1.1仿射预测的示例在hevc中,仅将平移运动模型应用于运动补偿预测(mcp)。然而,相机和对象可能具有多种运动,例如放大/缩小、旋转、透视运动和/或其它不规则运动。另一方面,jem应用了简化的仿射变换运动补偿预测。图2示出了由两个控制点运动矢量v0和v1描述的块200的仿射运动场的示例。块200的运动矢量场(mvf)可以由以下等式描述:如图2所示,(v0x,v0y)是左上角控制点的运动矢量,并且(v1x,v1y)是右上角控制点的运动矢量。为了简化运动补偿预测,可以应用基于子块的仿射变换预测。子块尺寸m×n推导如下:这里,mvpre是运动矢量分数精度(例如,jem中的1/16)。(v2x,v2y)是左下控制点的运动矢量,其根据等式(1)计算。如果需要,m和n可以被向下调节使其分别作为w和h的除数。图3示出了块300的每个子块的仿射mvf的示例。为了推导出每个m×n子块的运动矢量,可以根据等式(1)计算每个子块的中心样本的运动矢量,并且取整到运动矢量分数精度(例如,jem中的1/16)。然后可以应用运动补偿插值滤波器,利用推导出的运动矢量生成各子块的预测。在mcp之后,对每个子块的高精度运动矢量进行取整,并将其保存为与正常运动矢量相同的精度。在jem中,有两个仿射运动模式:af_inter模式和af_merge模式。对于宽度和高度都大于8的cu,可以应用af_inter模式。在比特流中,发信令通知(signal)cu级别的仿射标志,以指示是否使用af_inter模式。在af_inter模式中,使用相邻块构造具有运动矢量对{(v0,v1)|v0={va,vb,vc},v1={vd,ve}}的候选列表。图4示出了在af_inter模式中块400的运动矢量预测(mvp)的示例。如图4所示,从子块a、b或c的运动矢量中选择v0。可以根据参考列表对相邻块的运动矢量进行缩放。也可以根据相邻块参考的图片顺序计数(poc)、当前cu参考的poc和当前cu的poc之间的关系对运动矢量进行缩放。从相邻的子块d和e中选择v1的方法类似。如果候选列表的数目小于2,则该列表由复制每个amvp候选组成的运动矢量对来填充。当候选列表大于2时,可以首先根据相邻运动矢量对候选进行排序(例如,基于一对候选中两个运动矢量的相似性)。在一些实现中,保留前两个候选。在一些实施例中,使用速率失真(rd)成本检查来确定选择哪个运动矢量对候选作为当前cu的控制点运动矢量预测(cpmvp)。可以在比特流中用信令通知指示cpmvp在候选列表中的位置的索引。在确定了当前仿射cu的cpmvp后,应用仿射运动估计,并且找到控制点运动矢量(cpmv)。然后,在比特流中用信令通知cpmv和cpmvp的差异。当在af_merge模式下应用cu时,它从有效的相邻重构块中获取用仿射模式编解码的第一个块。图5a示出了当前cu500的候选块的选择顺序的示例。如图5a所示,选择顺序可以是从当前cu500的左(501)、上(502)、右上(503)、左下(504)到左上(505)。图5b示出了在af_merge模式中当前cu500的候选块的另一个示例。如果相邻的左下块501以仿射模式编解码,如图5b所示,则导出包含子块501的cu左上角、右上角和左下角的运动矢量v2、v3和v4。当前cu500左上角的运动矢量v0是基于v2、v3和v4计算的。可以相应地计算当前cu右上的运动矢量v1。根据等式(1)中的仿射运动模型计算当前cu的cpmvv0和v1后,可以生成当前cu的mvf。为了识别当前cu是否使用af_merge模式进行编解码,当至少有一个相邻块以仿射模式编解码时,可以在比特流中用信令通知仿射标志。在jem中,仅当当前块的宽度和高度都大于8时可以使用非merge仿射模式;仅当当前块的区域(即宽度x高度)不小于64时可以使用merge仿射模式。1.2可选时域运动矢量预测(atmvp)的示例在atmvp方法中,通过从小于当前cu的块中提取多组运动信息(包括运动矢量和参考指数),来修改时域运动矢量预测(tmvp)方法。图6示出了cu600的atmvp运动预测过程的示例。atmvp方法分两步预测cu600内子cu601的运动矢量。第一步是用时域矢量识别参考图片650中的相应块651。参考图片650也称为运动源图片。第二步是将当前的cu600划分成子cu601,并从每个子cu对应的块中获取每个子cu的运动矢量和参考指数。在第一步中,参考图片650和对应的块由当前cu600的空间相邻块的运动信息确定。为了避免相邻块的重复扫描处理,使用当前cu600的merge候选列表中的第一merge候选。第一可用的运动矢量及其相关联的参考索引被设置为时域矢量和对运动源图片的索引。这样,与tmvp相比,可以更准确地识别对应的块,其中对应的块(有时称为并置块)始终位于相对于当前cu的右下角或中心位置。在第二步中,通过将时域矢量添加到当前cu的坐标中,通过运动源图片650中的时域矢量识别子cu651的对应块。对于每个子cu,使用其对应块的运动信息(例如,覆盖中心样本的最小运动网格)来导出子cu的运动信息。在识别出对应的n×n块的运动信息后,用与hevc的tmvp同样方式,将其转换为当前子cu的运动矢量和参考指数,其中应用运动缩放和其它程序。例如,解码器检查是否满足低延迟条件(例如,当前图片的所有参考图片的poc都小于当前图片的poc),并且可能使用运动矢量mvx(例如,与参考图片列表x对应的运动矢量)来预测每个子cu的运动矢量mvy(例如,x等于0或1并且y等于1-x)。1.3空时运动矢量预测(stmvp)的示例在stmvp方法中,子cu的运动矢量按照光栅扫描顺序递归导出。图7示出具有四个子块的一个cu和相邻块的示例。考虑8×8的cu700,其包括四个4×4子cua(701)、b(702)、c(703)和d(704)。当前帧中相邻的4×4块标记为a(711)、b(712)、c(713)和d(714)。子cua的运动推导由识别其两个空间邻居开始。第一邻居是子cua701上方的n×n块(块c713)。如果该块c(713)不可用或是帧内编解码的,则检查子cua(701)上方的其它n×n块(从左到右,从块c713处开始)。第二邻居是子cua701左侧的一个块(块b712)。如果块b(712)不可用或是帧内编解码的,则检查子cua701左侧的其它块(从上到下,从块b712处开始)。每个列表从相邻块获得的运动信息被缩放到给定列表的第一参考帧。接下来,按照hevc中规定的与tmvp相同的程序,推导出子块a701的时域运动矢量预测(tmvp)。提取块d704处的并置块的运动信息并进行相应的缩放。最后,在检索和缩放运动信息后,对每个参考列表分别平均所有可用的运动矢量。将平均的运动矢量指定为当前子cu的运动矢量。1.4双向光流(bio)的示例双向光流(bio)方法是在逐块运动补偿之上对双向预测进行的逐样本运动细化。在一些实现中,样本级的运动细化不使用信令。设i(k)为块运动补偿后到参考k(k=0,1)的亮度值,并且分别为i(k)梯度的水平分量和垂直分量。假设光流是有效的,则运动矢量场(vx,vy)由下式给出:将此光流等式与每个样本的运动轨迹的埃尔米特(hermite)插值相结合,得到唯一的三阶多项式,该多项式在末端同时匹配函数值i(k)和其导数该多项式在t=0时的值是bio预测:图8示出了双向光流(bio)方法中的示例光流轨迹。这里,τ0和τ1表示到参考帧的距离。基于ref0和ref1的poc计算距离τ0和τ1:τ0=poc(当前)-poc(ref0),τ1=poc(ref1)-poc(当前)。如果两个预测都来自同一个时间方向(都来自过去或都来自未来),则符号是不同的(例如,τ0·τ1<0)。在这种情况下,如果预测不是来自同一时间点(例如,τ0≠τ1),则应用bio。两个参考区域都具有非零运动(例如,mvx0,mvy0,mvx1,mvy1≠0),并且块运动矢量与时间距离成比例(例如,mvx0/mvx1=mvy0/mvy1=-τ0/τ1)。通过最小化a点和b点之间的值的差δ来确定运动矢量场(vx,vy)。图9a-9b示出了运动轨迹与参考帧平面相交的示例。对δ,模型仅使用局部泰勒展开的第一个线性项:上述等式中的所有值取决于样本位置,表示为(i′,j′)。假设在局部周围区域的运动是一致的,那么δ可以在以当前预测点(i,j)为中心的(2m+1)x(2m+1)方形窗口ω内最小化,其中m等于2:对于这个优化问题,jem使用简化方法,首先在垂直方向上最小化,然后在水平方向最小化。结果如下:其中,为了避免被零除或很小的值除,可在式(7)和式(8)中引入正则化参数r和m,其中r=500·4d-8等式(10)m=700·4d-8等式(11)这里,d是视频样本的比特深度。为了使bio的内存访问与常规双向预测运动补偿相同,计算当前块内位置的所有预测和梯度值图9a示出了块900外部的访问位置示例。如图9a所示,在等式(9)中,以预测块边界上当前预测点为中心的(2m+1)x(2m+1)的方形窗口ω需要访问块外的位置。在jem中,块外的值i(k)、设置为等于块内最近的可用值。例如,这可以实现为填充区域901,如图9b所示。使用bio,可以对每个样本的运动场进行细化。为了降低计算复杂度,在jem中采用了基于块设计的bio。可以基于4x4块计算运动细化。在基于块的bio中,可以对4x4块中所有样本的等式(9)中的sn值进行聚合,然后将sn的聚合值用于4x4块的推导的bio运动矢量偏移。更具体地说,下面的等式可以用于基于块的bio推导:这里,bk表示属于预测块的第k个4x4块的样本组。等式(7)和等式(8)中的sn替换为((sn,bk)>>4)以推导相关联的运动矢量偏移。在某些情况下,由于噪声或不规则运动,bio的mv团(regiment)可能不可靠。因此,在bio中,mv团的尺寸被固定到一个阈值。该阈值是基于当前图片的参考图片是否全部来自一个方向确定的。例如,如果当前图片的所有参考图片都来自一个方向,则该阈值的值被设置为12×214-d,否则其被设置为12×213-d。可以使用与hevc运动补偿处理一致的操作(例如,2d可分离有限脉冲响应(fir))通过运动补偿插值同时计算bio的梯度。在一些实施例中,2d可分离fir的输入是与运动补偿处理相同的参考帧,以及根据块运动矢量的分数部分的分数位置(fracx,fracy)。对于水平梯度首先使用biofilters对信号进行垂直插值,该biofilters对应于具有去缩放位移d-8的分数位置fracy。然后在水平方向上应用梯度滤波器biofilterg,该biofilterg对应于具有去缩放位移18-d的分数位置fracx。对于垂直梯度使用biofilterg垂直地应用梯度滤波器,该biofilterg对应于具有去缩放位移d-8的分数位置fracy。然后,然后在水平方向上使用biofilters执行信号替换,该biofilters对应于具有去缩放位移18-d的分数位置fracx。用于梯度计算biofilterg和信号替换biofilters的插值滤波器的长度可以更短(例如,6-tap),以保持合理的复杂度。表2示出了可用在bio中块运动矢量的不同分数位置的梯度计算的示例滤波器。表3示出了可用在bio中预测信号生成的插值示例滤波器。表2bio中用于梯度计算的示例滤波器分数像素位置梯度的插值滤波器(biofilterg)0{8,-39,-3,46,-17,5}1/16{8,-32,-13,50,-18,5}1/8{7,-27,-20,54,-19,5}3/16{6,-21,-29,57,-18,5}1/4{4,-17,-36,60,-15,4}5/16{3,-9,-44,61,-15,4}3/8{1,-4,-48,61,-13,3}7/16{0,1,-54,60,-9,2}1/2{-1,4,-57,57,-4,1}表3bio中用于预测信号生成的示例插值滤波器分数像素位置用于预测信号的插值滤波器(biofilters)0{0,0,64,0,0,0}1/16{1,-3,64,4,-2,0}1/8{1,-6,62,9,-3,1}3/16{2,-8,60,14,-5,1}1/4{2,-9,57,19,-7,2}5/16{3,-10,53,24,-8,2}3/8{3,-11,50,29,-9,2}7/16{3,-11,44,35,-10,3}1/2{3,-10,35,44,-11,3}在jem中,当两个预测来自不同的参考图片时,bio可应用于所有的双向预测块。当为cu启用局部照明补偿(lic)时,可以禁用bio。在一些实施例中,在正常mc处理之后将obmc应用于块。为了降低计算复杂度,在obmc处理期间可能不应用bio。这意味着在obmc处理期间,当使用自己的mv时,将bio应用于块的mc处理,而当使用相邻块的mv时,不将bio应用于块的mc处理。在jem中,仅为亮度分量调用bio。1.5帧速率上转换(fruc)的示例对于cu,当其merge标志为真时,可以用信令通知对fruc标志。当fruc标志为假时,可以用信令通知merge索引并且使用常规merge模式。当fruc标志为真时,可以用信令通知另一个fruc模式标志以指示将使用哪种方法(例如,双边匹配或模板匹配)来导出该块的运动信息。在编码器端,基于对正常merge候选所做的rd成本选择决定是否对cu使用frucmerge模式。例如,通过使用rd成本选择来检查cu的多个匹配模式(例如,双边匹配和模板匹配)。导致最低成本的模式进一步与其它cu模式相比较。如果fruc匹配模式是最有效的模式,那么对于cu,将fruc标志设置为真,并且使用相关的匹配模式。通常,frucmerge模式中的运动推导处理有两个步骤:首先执行cu级运动搜索,然后执行子cu级运动细化。在cu级,基于双边匹配或模板匹配,导出整个cu的初始运动矢量。首先,生成mv候选列表,并且选择导致最低匹配成本的候选作为进一步cu级细化的起点。然后在起始点附近执行基于双边匹配或模板匹配的局部搜索。将最小匹配成本的mv结果作为整个cu的mv值。随后,以导出的cu运动矢量为起点,进一步在子cu级细化运动信息。例如,对于w×hcu运动信息推导执行以下推导过程。在第一阶段,推导出了整个w×hcu的mv。在第二阶段,该cu进一步被分成m×m子cu。m的值按照(16)计算,d是预先定义的划分深度,在jem中默认设置为3。然后导出每个子cu的mv值。图10示出在帧速率上转换(fruc)法中使用的双边匹配的示例。通过在两张不同的参考图片(1010,1011)中沿当前cu(1000)的运动轨迹找到两个块之间最接近的匹配,使用双边匹配来获得当前cu的运动信息。在连续运动轨迹假设下,指向两个参考块的运动矢量mv0(1001)和mv1(1002)与当前图片和两个参考图片之间的时间距离(例如,td0(1003)和td1(1004))成正比。在一些实施例中,当当前图片1000暂时位于两个参考图片(1010,1011)之间并且当前图片到两个参考图片的时间距离相同时,双边匹配成为基于镜像的双向mv。图11示出在帧速率上转换(fruc)方法中使用的模板匹配的示例。模板匹配可以用于通过找到当前图片中的模板(例如,当前cu的顶部和/或左侧相邻块)与参考图片1110中的块(例如,与模板尺寸相同)之间的最接近匹配来获取当前cu1100的运动信息。除了上述的frucmerge模式外,模板匹配也可以应用于amvp模式。在jem和hevc中,amvp都具有两个候选。通过模板匹配方法,可以导出新的候选。如果通过模板匹配新导出的候选与第一个现有的amvp候选不同,则将其插入amvp候选列表的最开始处,并且然后将列表尺寸设置为2(例如,通过删除第二个现有amvp候选)。当应用于amvp模式时,仅应用cu级搜索。cu级设置的mv候选可以包括以下:(1)原始amvp候选,如果当前cu处于amvp模式,(2)所有merge候选,(3)插值mv场(稍后描述)中的数个mv,以及顶部和左侧相邻运动矢量。当使用双边匹配时,merge候选的每个有效mv可以用作输入,以生成假设为双边匹配的mv对。例如,merge候选在参考列表a处的一个有效mv为(mva,refa)。然后在另一个参考列表b中找到其配对的双向mv的参考图片refb,使得refa和refb在时间上位于当前图片的不同侧。如果参考列表b中的这种refb不可用,则将refb确定为与参考refa不同的参考,并且其到当前图片的时间距离是列表b中的最小距离。确定refb后,通过基于当前图片和refa、refb之间的时间距离缩放mva来导出mvb。在一些实现中,还可以将来自插值mv场中的四个mv添加到cu级候选列表中。更具体地,添加当前cu的位置(0,0)、(w/2,0)、(0,h/2)和(w/2,h/2)处插值的mv。当在amvp模式下应用fruc时,原始的amvp候选也被添加到cu级的mv候选集。在一些实现中,在cu级,可以将amvpcu的15个mv和mergecu的13个mv添加到候选列表中。在子cu级设置的mv候选包括从cu级搜索确定的mv,(2)顶部、左侧、左上方和右上方相邻的mv,(3)参考图片中并置的mv的缩放版本,(4)一个或多个atmvp候选(例如,最多四个)和(5)一个或多个stmvp候选(例如,最多四个)。来自参考图片的缩放mv如下导出。两个列表中的参考图片都被遍历。参考图片中子cu的并置位置处的mv被缩放为起始cu级mv的参考。atmvp和stmvp候选可以是前四个。在子cu级,一个或多个mv(例如,最多17个)被添加到候选列表中。插值mv场的生成。在对帧进行编解码之前,基于单向me生成整个图片的插值运动场。然后,该运动场可以随后用作cu级或子cu级的mv候选。在一些实施例中,两个参考列表中每个参考图片的运动场在4×4的块级别上被遍历。图12示出了在fruc方法中的单边运动估计(me)1200的示例。对于每个4×4块,如果与块相关联的运动通过当前图片中的4×4块,并且该块没有被分配任何插值运动,则根据时间距离td0和td1将参考块的运动缩放到当前图片(与hevc中tmvp的mv缩放相同方式),并且在当前帧中将该缩放运动分配给该块。如果没有分配缩放的mv给4×4块,则在插值运动场中将块的运动标记为不可用。插值和匹配成本。当运动矢量指向分数样本位置时,需要运动补偿插值。为了降低复杂度,对双边匹配和模板匹配都使用双线性插值而不是常规的8抽头hevc插值。匹配成本的计算在不同的步骤处有点不同。当从cu级的候选集中选择候选时,匹配成本可以是双边匹配或模板匹配的绝对和差(absolutesumdifference,sad)。在确定起始mv后,双边匹配在子cu级搜索的匹配成本c如下计算:这里,w是权重系数。在一些实施例中,w可以被经验地设置为4。mv和mvs分别指示当前mv和起始mv。仍然可以将sad用作模式匹配在子cu级搜索的匹配成本。在fruc模式下,通过仅使用亮度(亮度)样本导出mv。导出的运动将用于mc帧间预测的亮度和色度。确定mv后,对亮度使用8抽头(8-taps)插值滤波器并且对色度使用4抽头(4-taps)插值滤波器,来执行最终mc。mv细化是基于模式的mv搜索,以双边匹配成本或模板匹配成本为标准。在jem中,支持两种搜索模式—无限制中心偏置菱形搜索(ucbds)和自适应交叉搜索,分别在cu级和子cu级进行mv细化。对于cu级和子cu级的mv细化,都在四分之一亮度样本mv精度下直接搜索mv,接着是八分之一亮度样本mv细化。将cu和子cu步骤的mv细化的搜索范围设置为8个亮度样本。在双边匹配merge模式下,应用双向预测,因为cu的运动信息是基于在两个不同的参考图片中沿着当前cu运动轨迹的两个块之间的最近匹配得出的。在模板匹配merge模式下,编码器可以从列表0的单向预测、列表1的单向预测或者双向预测中为cu做出选择。该选择可以基于如下的模板匹配成本:这里,cost0是列表0模板匹配的sad,cost1是列表2模板匹配的sad,并且costbi是双向模板匹配的sad。例如,当factor的值等于1.25时,意味着选择过程朝双向预测偏移。帧间预测方向选择可应用于cu级模板匹配处理。1.6为色度分量中的mc导出的mv的示例在示例中,hevc标准定义了如何从亮度分量中的mc使用的mv(称为mv)导出色度分量中的mc使用的mv(称为mvc)。一般来说,mvc是以mv乘以一个系数来计算的,这取决于色彩格式,如4:2:0或4:2:2。1.7vvc中当前图片参考的示例在hevc屏幕内容编解码扩展(scc)中,采用了帧内块复制(ibc,或称为帧内块补偿)技术,也称为当前图片参考(cpr)。这个工具对于屏幕内容视频的编解码非常有效,因为文本和图形丰富的内容频繁出现在相同图片中。将具有相等或相似模式的先前重构块作为预测器可以有效地降低预测误差,从而提高编解码效率。与hevcscc中的crp的设计类似,在vvc中,在序列和图片级二者上用信令通知ibc模式的使用。当在序列参数集(sps)上启用ibc模式时,它可以在图片级启用。当在图片级启用ibc模式时,当前重建的图片被视为参考图片。因此,在现有的vvc帧间模式的顶层不需要在块级上进行语法改变来用信令通知ibc模式的使用。本实施例的特征包括:○它被视为常规帧间模式。因此,merge和跳过模式也可用于ibc模式。merge候选列表构造是统一的,包含来自以ibc模式或hevc帧间模式编解码的相邻位置的merge候选。取决于所选择的merge索引,可以将merge或跳过模式下的当前块合并到ibc模式编解码的邻居、或者以不同图片作为参考图片的常规帧间模式编解码的邻居。○ibc模式的块矢量预测和编解码方案重用在hevc帧间模式(amvp和mvd编码)中用于运动矢量预测和编解码的方案。○ibc模式的运动矢量(也称为块矢量)以整数像素精度编解码,但在解码后以1/16像素精度存储在存储器中,因为在插值和去方块阶段需要四分之一像素精度。当用于ibc模式的运动矢量预测时,存储的矢量预测器将右移4。○搜索范围:限制在当前ctu内。○当启用仿射模式/三角模式/gbi/加权预测时,不允许cpr。1.8成对平均候选的示例通过对当前merge候选列表中预定义候选对进行平均,生成成对平均候选,并且预定义对定义为{(0,1),(0,2),(1,2),(0,3),(1,3),(2,3)},其中数字表示merge候选列表的merge索引。分别计算每个参考列表的平均运动矢量。如果两个运动矢量都在一个列表中可用,则即使当这两个运动矢量指向不同的参考图片时,也会对它们进行平均;如果只有一个运动矢量可用,则直接使用该运动矢量;如果没有运动矢量可用,则保持此列表无效。在hevc标准中,成对平均候选替换组合候选。假设两个merge候选的mv是mv0=(mv0x,mv0y)和mv1=(mv1x,mv1y),则表示为mv*=(mv*x,mv*y)的成对merge候选的mv导出为:mv*x=(mv0x+mv1x)/2,并且mv*y=(mv0y+mv1y)/2。此外,当mv0和mv1参考当前图片(即cpr模式)时,mv*x和mv*y被进一步取整,以移除比全像素精度更高的部分,以确保获取整数mv:mv*x=(mv*x/16)<<4,并且mv*y=(mv*y/16)<<4应当注意的是,对于每一对,如果两个中的一个用cpr编解码,而另一个没有用cpr编码,则不允许该对生成成对平均候选。1.9三角预测模式的示例三角预测模式(tpm)的概念是引入用于运动补偿预测的新的三角分割。在对角线方向或逆对角线方向上将cu划分成两个三角预测单元。cu中的每个三角预测单元是使用从单个单向预测候选列表导出的其自身的单向预测运动矢量和参考帧索引进行帧间预测的。在对三角预测单元进行预测后,对对角线边缘进行自适应加权处理。然后,将变换和量化处理应用到整个cu中。应当注意的是,此模式仅适用于merge模式(注意:跳过模式被视为特殊的merge模式)。tpm的单向预测候选列表。名为tpm运动候选列表的单向预测候选列表由五个单向预测运动矢量候选组成。它从七个相邻块导出,包括五个空域相邻块和两个时域并置块。收集7个相邻块的运动矢量,并将其按照单向预测运动矢量、双向预测运动矢量的l0运动矢量、双向预测运动矢量的l1运动矢量、以及双向预测运动矢量的l0和l1运动矢量的平均运动矢量的顺序放入单向预测候选列表中。如果候选数目小于5,则将零运动矢量添加到列表中。添加到该列表中的运动候选被称为tpm候选,从空域/时域块导出的运动信息被称为常规运动候选。更具体地,涉及以下步骤:(1)在不进行任何修剪操作的情况下,从a1、b1、b0、a0、b2、col和col2(与在常规merge模式中相似)中获取常规运动候选。(2)设置变量numcurrmergecand=0。(3)对于从a1、b1、b0、a0、b2、col和col2导出的每个常规运动候选,并且numcurrmergecand小于5,如果该常规运动候选是单向预测的(来自列表0或列表1),则直接将其添加到merge列表中作为tpm候选,且numcurrmergecand增加1。这种tpm候选被命名为“原始单向预测预测候选”。应用完全修剪。(4)对于从a1、b1、b0、a0、b2、col和col2导出的每个运动候选,并且numcurrmergecand小于5,如果该常规运动候选是双向预测的,则将来自列表0的运动信息添加到tpmmerge列表(即,修改为来自列表0的单向预测)作为新的tpm候选,且numcurrmergecand增加1。这种tpm候选被命名为“截断的列表0预测候选”。应用完全修剪。(5)对于从a1、b1、b0、a0、b2、col和col2导出的每个运动候选,并且numcurrmergecand小于5,如果该常规运动候选是双向预测的,则将来自列表1的运动信息添加到tpmmerge列表(即,修改为来自列表1的单向预测),且numcurrmergecand增加1。这种tpm候选被命名为“截断的列表1预测候选”。应用完全修剪。(6)对于从a1、b1、b0、a0、b2、col和col2导出的每个运动候选,并且numcurrmergecand小于5,如果该常规运动候选是双向预测的,则首先将列表1的运动信息缩放到列表0参考图片,并且将两个mv(一个来自原始列表0,并且另一个是来自列表1的缩放mv)的平均添加到tpmmerge列表,这种候选被称为来自列表0运动候选的平均单向预测,且numcurrmergecand增加1。应用完全修剪。(7)如果numcurrmergecand小于5,则添加零运动矢量候选。在将候选插入列表时,如果需要将其与所有先前添加的候选做比较,以查看该候选是否与它们中的一个等同,则将这种处理称为完全修剪。假设缩放的mv表示为(mv1’x,mv1’y),并且列表0mv表示为(mv0x,mv0y)。表示为(mv*x,mv*y)的来自列表0运动候选的平均单向预测被定义为:mv*x=(mv0x+mv1’x+1)>>1,并且mv*y=(mv0y+mv1’y+1)>>1。2.现有实现的缺陷现有的基于子块的预测技术存在以下问题:(1)在一些现有实现中,子块尺寸(诸如jem中的4×4)主要针对亮度分量设计的。在jem中,对于4:2:0格式的色度分量,子块的尺寸是2×2,并且对于4:2:2格式的色度分量,子块的尺寸是2×4。子块的小尺寸对带宽提出了更高的要求。图13示出了jem中4:2:0格式的不同分量的16×16块(cb/cr为8×8)的子块的示例。(2)在一些现有的基于子块的工具(诸如jem中的仿射预测)中,用等式(1)中的仿射模型为每个分量独立地计算每个子块的mv,这导致亮度和色度分量之间的运动矢量的错位。(3)在一些现有的基于子块的工具(诸如仿射预测)中,对于merge模式和非merge帧间模式(即amvp模式、或常规帧间模式),使用约束是不同的,需要对其进行统一。(4)在一些现有实现中,从列表0运动候选中导出成对merge候选/平均单向预测的运动矢量平均操作应该与子块预测中使用的取整方法对准。从而硬件可以有统一的设计。3.视频编解码中统一取整的示例方法示例1.取决于色彩分量和/或色彩格式和/或块形状/尺寸,以不同的方式将一个块划分为子块。(a)对于一个亮度及其相应的色度块(例如,对于4:2:0色彩格式,一个mxn的亮度块对应于一个m/2xn/2的cb块和一个m/2xn/2的cr块),对于不同的分量,划分的子块的数目可以不同。如果块对于该分量具有较大的尺寸,则针对该分量将块划分为更多子块。(b)对于每个色彩分量,子块的尺寸是相同的,例如对于y、cb和cr分量为w×h,其中w×h可以是8×8、8×4、4×8、4×4等。例如,w和h都等于4。图14示出了4:2:0格式的不同分量的16×16块(对于cb/cr为8×8)的提议子块的示例。在一个示例中,如果w>w或h>h,则针对该分量不将块划分为子块。(c)可以允许一个块内的不同尺寸的子块。在一个示例中,如果w(或h)不是w(或h)的整数倍,则建议将宽度/高度小于w/h的子块合并到其相邻的左侧或上方子块中。图15示出了将12×16的块(对于cb/cr为6×8)划分为子块的示例。子块尺寸为4×4。对于cb/cr分量,最后两个子块的尺寸为2×4,因此它们被合并到其左侧相邻块中。(d)子块尺寸可进一步取决于块形状。(i)在一个示例中,对于正方形块(w等于h),w可以设置为等于h。(ii)可选地,对于非正方形块(w不等于h),w可以不等于h。例如,当w>h时,w可以设置为大于h,反之亦然。(e)可以在序列参数集(sps)、图片参数集(pps)、条带标头中用信令通知不同色彩分量或不同块形状的子块尺寸。(f)可以以不同的方式确定y分量和cb/cr分量的子块尺寸。例如,可以从诸如4×4、8×8、4×8和8×4的一些候选中自适应地确定y分量的子块尺寸,但是将cb/cr分量的子块尺寸固定为4×4。(g)y分量和cb/cr分量的子块尺寸可取决于色彩格式,诸如4:2:0、4:2:2和4:4:4。示例2.可以从另一个色彩分量的一个或多个子块的mv(已经用仿射模型导出)导出一个色彩分量的子块的mv。在这种情况下,不需要基于同一色彩分量的信息导出一个色彩分量的运动信息三次。(a)在一个示例中,可以从另一个分量的对应子块的mv中导出一个分量的子块的mv。图16示出了4:2:0格式的示例。按照图13中的示例划分每个分量的块。从y分量中对应的4×4子块的mv复制第一个导出的mv*,然后根据第1.6节中规定的规则,从mv*导出cb或cr分量中的2×2子块的mv。(b)在另一示例中,可以从另一个分量的几个对应子块的mv导出一个分量的子块的mv。图17示出了4:2:0格式的示例,其中cb或cr分量中的4×4子块对应于y分量中的四个4×4子块。按照图14中的示例划分每个分量的块。从另一个分量的几个对应子块的mv计算第一个导出的mv*,然后根据第1.6节中规定的规则,从mv*导出cb或cr分量中的4×4子块的mv。(i)在一个实施例中,mv*被计算为y分量中所有对应子块mv的平均。在示例中,mv*=(mv0+mv1+mv2+mv3)/4。假设mv*=(mv*x,mv*y),mv0=(mv0x,mv0y),mv1=(mv1x,mv1y),mv2=(mv2x,mv2y)并且mv3=(mv3x,mv3y),(1)在一个实施例中,mv*x=shift(mv0x+mv1x+mv2x+mv3x,2),mv*y=shift(mv0y+mv1y+mv2y+mv3y,2)。(2)在另一个实施例中,mvx*=signshift(mv0x+mv1x+mv2x+mv3x,2),mvy*=signshift(mv0y+mv1y+mv2y+mv3y,2)。(3)在另一个实施例中,mv*的计算可以按以下步骤依次进行:mv’x=shift(mv0x+mv1x,1),mv’y=shift(mv0y+mv1y,1),mv”x=shift(mv2x+mv3x,1),mv”y=shift(mv2y+mv3y,1),mv*x=shift(mv’x+mv”x,1),以及mv*y=shift(mv’y+mv”y,1)。(4)在另一个实施例中,mv*的计算可以按以下步骤依次进行:mv’x=shift(mv0x+mv2x,1),mv’y=shift(mv0y+mv2y,1),mv”x=shift(mv1x+mv3x,1),mv”y=shift(mv1y+mv3y,1),mv*x=shift(mv’x+mv”x,1),以及mv*y=shift(mv’y+mv”y,1)。(5)在另一个实施例中,mv*的计算可以按以下步骤依次进行:mv’x=signshift(mv0x+mv1x,1),mv’y=signshift(mv0y+mv1y,1),mv”x=signshift(mv2x+mv3x,1),mv”y=signshift(mv2y+mv3y,1),mv*x=signshift(mv’x+mv”x,1),以及mv*y=signshift(mv’y+mv”y,1)。(6)在另一个实施例中,mv*的计算可以按以下步骤依次进行:mv’x=signshift(mv0x+mv2x,1),mv’y=signshift(mv0y+mv2y,1),mv”x=signshift(mv1x+mv3x,1),mv”y=signshift(mv1y+mv3y,1),mv*x=signshift(mv’x+mv”x,1),以及mv*y=signshift(mv’y+mv”y,1)。(ii)在一个实施例中,mv*被计算为y分量中左上对应子块的mv。在该示例例中,mv*=mv0。(iii)在一个实施例中,mv*被计算为y分量中中心对应子块的mv。(iv)在一个实施例中,mv*被计算为y分量中所有对应子块mv的中值(median)。在一个示例中,mv*=median(mv0,mv1,mv2,mv3)。(v)可以基于色彩格式(诸如4:2:0、4:2:2和4:4:4)来确定如何从另一个分量导出一个分量的子块的mv。(1)在色彩格式为4:4:4的示例中,所有分量的子块尺寸都相同,并且每个子块的子块的mv都相同。(2)在色彩格式为4:2:2的示例中,所有分量的子块尺寸都相同。从另一个分量的几个对应子块的mv计算第一个导出的mv*,然后根据第2.6节中规定的规则,从mv*导出cb或cr分量中的子块的mv。在图18所示的示例中,一个cb/cr子块对应于具有运动矢量mv0和mv1的两个y子块。(a)mv*=(mv0+mv1)/2;假设mv*=(mv*x,mv*y),mv0=(mv0x,mv0y),mv1=(mv1x,mv1y),(i)在一个实施例中,mv*x=shift(mv0x+mv1x,1),mv*y=shift(mv0y+mv1y,1)。(ii)在另一实施例中,mvx*=signshift(mv0x+mv1x,1),mvy*=signshift(mv0y+mv1y,1)。merge和非merge仿射模式的统一约束的示例示例3.以相同块尺寸约束允许或不允许merge仿射模式和非merge仿射模式。(a)块尺寸约束取决于与一个或两个阈值相比的宽度和高度。例如,如果当前块的宽度和高度都大于m(例如,m等于8),或者宽度大于m0并且高度大于m1(例如,m0等于8,并且m1等于4),则允许merge仿射模式和非merge仿射模式二者;否则,不允许merge仿射模式和非merge仿射模式。(b)块尺寸约束取决于一个块内的样本点总数(即面积宽度x高度)。在一个示例中,如果当前块的面积(即宽度×高度)不小于n(例如,n等于64),则允许merge仿射模式和非merge仿射模式二者;否则,不允许merge仿射模式和非merge仿射模式。(c)对于merge仿射模式,它可以是如在jem中用信令通知标志的显式模式,或者也可以是如在其他实现中不用信令通知标志的隐式模式。在后一种情况下,如果不允许merge仿射模式,则不将仿射merge候选放入统一merge候选列表中。(d)对于非merge仿射模式,当根据上述规则不允许仿射时,跳过对仿射模式指示的信令通知。统一取整处理的示例示例4.假设一个merge候选具有表示为mv0=(mv0x,mv0y)的运动矢量,并且另一个merge候选具有表示为mv1=(mv1x,mv1y)的运动矢量,则从这两个merge候选中导出的成对merge候选中的一个mv(表示为mv*=(mv*x,mv*y))导出为:mv*x=shift(mv0x+mv1x,1),并且mv*y=shift(mv0y+mv1y,1).可替代地,mv*x=signshift(mv0x+mv1x,1),并且mv*y=signshift(mv0y+mv1y,1)。示例5.假设一个merge候选具有表示为mv0=(mv0x,mv0y)的运动矢量,并且另一个merge候选具有表示为mv1=(mv1x,mv1y)的运动矢量,并且mv0和/或mv1参考当前图片,则从这两个merge候选导出的成对merge候选的一个mv(表示为mv*=(mv*x,mv*y))导出为:(a)mv*x=shift(mv0x+mv1x,1);mv*y=shift(mv0y+mv1y,1);则mv*x=(shift(mv*x,4))<<4;mv*y=(shift(mv*y,4))<<4(b)mv*x=signshift(mv0x+mv1x,1);mv*y=signshift(mv0y+mv1y,1);则mv*x=(signshift(mv*x,4))<<4;mv*y=(signshift(mv*y,4))<<4(c)mv*x=(shift(mv0x+mv1x,(w+1)))<<w;mv*y=(shift(mv0y+mv1y,(w+1)))<<w,其中w是诸如2或4的整数。w是整数,使得1<<w等于mv表示精度。(d)mv*x=(signshift(mv0x+mv1x,(w+1)))<<w;mv*y=(signshift(mv0y+mv1y,(w+1)))<<w,其中w是诸如2或4的整数。w是整数,使得1<<w等于mv表示精度。示例6.假设缩放mv由(mv1’x,mv1’y)表示,并且列表0mv由(mv0x,mv0y)表示。则由(mv*x,mv*y)表示的来自列表0运动候选的平均单向预测被定义为:mv*x=shift(mv0x+mv1’x,1),并且mv*y=shift(mv0y+mv1’y,1).可替代地,mv*x=signshift(mv0x+mv1’x,1),并且mv*y=signshift(mv0y+mv1’y,1)。在一些实施例中,signshift(x,s)可以向0右移一个整数,定义为:这里,off=(1<<(s-1))-1。在其他实施例中,signshift(x,s)可替代地定义为:这里,off=(1<<(s-1))-1。上面描述的示例可以并入下面描述的方法的上下文,例如,可以在视频解码器和/或视频编码器处实现的方法1930、1960和1990。图19a示出了视频处理的示例方法1930的流程图。方法1930包括:在步骤1932,基于运动候选对,为视频的当前块的处理生成成对merge候选。方法1930包括:在步骤1934,基于所述成对merge候选执行所述视频的比特流表示与所述当前块之间的转换。图19b示出了视频处理的示例方法1960的流程图。方法1960包括:在步骤1962,为视频的当前块的处理生成成对merge候选,所述生成基于参考包含所述当前块的当前图片的运动候选对。方法1960包括:在步骤1964,基于所述成对merge候选执行所述视频的比特流表示与所述当前块之间的转换。图19c示出了视频处理的示例方法1990的流程图。方法1990包括:在步骤1992,基于缩放运动矢量和列表0运动矢量,为使用几何分割模式编解码的视频的当前块,生成单向预测运动候选。方法1990包括:在步骤1994,基于所述单向预测运动候选,执行所述视频的比特流表示与所述当前块之间的转换。在一些实施例中,实现了以下技术解决方案:a1.一种视频处理方法,包括:基于运动候选对,为视频的当前块的处理生成成对merge候选;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=shift(mv0x+mv1x,1)且mv*y=shift(mv0y+mv1y,1),其中,shift(x,s)=(x+off)>>s,其中off和s是整数,并且其中,>>表示右移操作。a2.一种视频处理方法,包括:基于运动候选对,为视频的当前块的处理生成成对merge候选;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=signshift(mv0x+mv1x,1)且mv*y=signshift(mv0y+mv1y,1),其中其中off和s是整数,并且其中,>>表示移位操作。a3.一种视频处理方法,包括:基于运动候选对,为视频的当前块的处理生成成对merge候选;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=signshift(mv0x+mv1x,1)且mv*y=signshift(mv0y+mv1y,1),其中其中off和s是整数,并且其中,>>表示移位操作。a4.根据解决方案a1至a3中任一项所述的方法,其中,merge候选对来自merge候选列表。a5.根据解决方案a1至a3中任一项所述的方法,其中,所述参考图片列表l包括参考图片列表0(l0)或参考图片列表1(l1)。a6.根据解决方案a1至a3中任一项所述的方法,还包括:将所述成对merge候选插入所述merge候选列表中。a7.根据解决方案a1至a3中任一项所述的方法,还包括:在执行所述转换之后更新所述merge候选列表。a8.根据解决方案a1至a7中任一项所述的方法,其中,off=0。a9.根据解决方案a1至a7中任一项所述的方法,其中,当确定s=0时,off=0。a10.根据解决方案a1至a7中任一项所述的方法,其中,off=1<<(s-1)。a11.根据解决方案a1至a7中任一项所述的方法,其中,当确定s≠0时,off=1<<(s-1)。a12.根据解决方案a1至a7中任一项所述的方法,其中,off=(1<<(s-1))-1。a13.根据解决方案a1至a12中任一项所述的方法,其中,所述当前视频块是编解码单元。a14.根据解决方案a1至a13中任一项所述的方法,其中,执行所述转换包括:从所述当前视频块生成所述比特流表示。a15.根据解决方案a1至a13中任一项所述的方法,其中,执行所述转换包括:从所述比特流表示生成所述当前视频块。a16.一种视频解码装置,包括处理器,所述处理器被配置为实现解决方案a1至a15中任一项所述的方法。a17.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于实现解决方案a1至a15中任一项所述的方法的程序代码。在一些实施例中,实现了以下技术解决方案:b1.一种视频处理方法,包括:为视频的当前块的处理生成成对merge候选,其中所述生成基于参考包含所述当前块的当前图片的运动候选对;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=shift(mv0x+mv1x,1)且mv*y=shift(mv0y+mv1y,1),其中shift(x,s)=(x+off)>>s,其中off和s是整数,并且其中,>>表示右移操作。b2.根据解决方案b1所述的方法,其中,生成所述成对merge候选还包括执行以下操作:mv*x=(shift(mv*x,4))<<4并且mv*y=(shift(mv*y,4))<<4。b3.一种视频处理方法,包括:为视频的当前块的处理生成成对merge候选,其中所述生成基于参考包含所述当前块的当前图片的运动候选对;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=signshift(mv0x+mv1x,1)且mv*y=signshift(mv0y+mv1y,1),其中其中off和s是整数,并且其中,>>表示移位操作。b4.根据解决方案b3所述的方法,其中,生成所述成对merge候选还包括执行以下操作:mv*x=(signshift(mv*x,4))<<4且mv*y=(signshift(mv*y,4))<<4。b5.一种视频处理方法,包括:为视频的当前块的处理生成成对merge候选,其中所述生成基于参考包含所述当前块的当前图片的运动候选对;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=signshift(mv0x+mv1x,1)且mv*y=signshift(mv0y+mv1y,1),其中其中off和s是整数,并且其中,>>表示移位操作。b6.根据解决方案b5所述的方法,其中,生成所述成对merge候选还包括执行以下操作:mv*x=(signshift(mv*x,4))<<4且mv*y=(signshift(mv*y,4))<<4。b7.一种视频处理方法,包括:为视频的当前块的处理生成成对merge候选,其中所述生成基于参考包含所述当前块的当前图片的运动候选对;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=(shift(mv0x+mv1x,(w+1)))<<w且mv*y=(shift(mv0y+mv1y,(w+1)))<<w,其中shift(x,s)=(x+off)>>s,其中w、off和s是整数,并且其中,>>表示右移操作。b8.一种视频处理方法,包括:为视频的当前块的处理生成成对merge候选,其中所述生成基于参考包含所述当前块的当前图片的运动候选对;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=(signshift(mv0x+mv1x,(w+1)))<<w且mv*y=(signshift(mv0y+mv1y,(w+1)))<<w,其中其中w、off和s是整数,并且其中,>>表示移位操作。b9.一种视频处理方法,包括:为视频的当前块的处理生成成对merge候选,其中所述生成基于参考包含所述当前块的当前图片的运动候选对;以及基于所述成对merge候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述运动候选对包括第一运动候选中的参考图片列表l的第一运动矢量mv0=(mv0x,mv0y)、以及第二运动候选中的所述参考图片列表l的第二运动矢量mv1=(mv1x,mv1y),并且其中,mv*=(mv*x,mv*y)是所述成对merge候选,使得:mv*x=(signshift(mv0x+mv1x,(w+1)))<<w且mv*y=(signshift(mv0y+mv1y,(w+1)))<<w,其中其中w、off和s是整数,并且其中,>>表示移位操作。b10.根据解决方案b7至b9中任一项所述的方法,其中,w=2或w=4。b11.根据解决方案b10所述的方法,其中,(1<<w)是运动矢量表示精度。b12.根据解决方案b1至b11中任一项所述的方法,其中,所述merge候选对来自merge候选列表。b13.根据解决方案b1至b11中任一项所述的方法,其中,所述参考图片列表l包括参考图片列表0(l0)或参考图片列表1(l1)。b14.根据解决方案b1至b11中任一项所述的方法,还包括:将所述成对merge候选插入所述merge候选列表中。b15.根据解决方案b1至b11中任一项所述的方法,还包括:在执行所述转换之后更新所述merge候选列表。b16.根据解决方案b1至b15中任一项所述的方法,其中,off=0。b17.根据解决方案b1至b15中任一项所述的方法,其中,当确定s=0时,off=0。b18.根据解决方案b1至b15中任一项所述的方法,其中,off=1<<(s-1)。b19.根据解决方案b1至b15中任一项所述的方法,其中,当确定s≠0时,off=1<<(s-1)。b20.根据解决方案b1至b15中任一项所述的方法,其中,off=(1<<(s-1))-1。b21.根据解决方案b1至b20中任一项所述的方法,其中,所述当前视频块是编解码单元。b22.根据解决方案b1至b21中任一项所述的方法,其中,执行所述转换包括:从所述当前块生成所述比特流表示。b23.根据解决方案b1至b21中任一项所述的方法,其中,执行所述转换包括:从所述比特流表示生成所述当前块。b24.一种视频解码装置,包括处理器,所述处理器被配置为实现解决方案b1至b23中任一项所述的方法。b25.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于实现解决方案b1至b23中任一项所述的方法的程序代码。在一些实施例中,实现了以下技术解决方案:c1.一种视频处理方法,包括:基于缩放运动矢量和列表0运动矢量,为使用几何分割模式编解码的视频的当前块,生成单向预测运动候选;以及基于所述单向预测运动候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述缩放运动矢量为mv1’=(mv1′x,mv1′y),并且所述列表0运动矢量为mv0=(mv0x,mv0y),并且其中,mv*=(mv*x,mv*y)是所述单向预测运动候选,使得:mv*x=shift(mv0x+mv1′x,1)且mv*y=shift(mv0y+mv1′y,1),其中shift(x,s)=(x+off)>>s,其中off和s是整数,并且其中,>>表示右移操作。c2.一种视频处理方法,包括:基于缩放运动矢量和列表0运动矢量,为使用几何分割模式编解码的视频的当前块,生成单向预测运动候选;以及基于所述单向预测运动候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述缩放运动矢量为mv1’=(mv1′x,mv1′y),并且所述列表0运动矢量为mv0=(mv0x,mv0y),并且其中,mv*=(mv*x,mv*y)是所述单向预测运动候选,使得:mv*x=signshift(mv0x+mv1′x,1)且mv*y=signshift(mv0y+mv1′y,1),其中其中off和s是整数,并且其中,>>表示移位操作。c3.一种视频处理方法,包括:基于缩放运动矢量和列表0运动矢量,为使用几何分割模式编解码的视频的当前块,生成单向预测运动候选;以及基于所述单向预测运动候选,执行所述视频的比特流表示与所述当前块之间的转换,其中,所述缩放运动矢量为mv1’=(mv1′x,mv1′y),并且所述列表0运动矢量为mv0=(mv0x,mv0y),并且其中,mv*=(mv*x,mv*y)是所述单向预测运动候选,使得:mv*x=signshift(mv0x+mv1′x,1)且mv*y=signshift(mv0y+mv1′y,1),其中其中off和s是整数,并且其中,>>表示移位操作。c4.根据解决方案c1至c3中任一项所述的方法,其中,mv*使用来自列表0的参考图片。c5.根据解决方案c1至c3中任一项所述的方法,其中,所述缩放运动矢量和所述列表0运动矢量来自从使用所述几何分割模式编解码的块导出的运动候选列表。c6.根据解决方案c1至c3中任一项所述的方法,还包括:将所述单向预测运动候选插入所述运动候选列表中。c7.根据解决方案c1至c3中任一项所述的方法,还包括:在执行所述转换之后更新所述运动候选列表。c8.根据解决方案c1至c7中任一项所述的方法,其中,off=0。c9.根据解决方案c1至c7中任一项所述的方法,其中,当确定s=0时,off=0。c10.根据解决方案c1至c7中任一项所述的方法,其中,off=1<<(s-1)。c11.根据解决方案c1至c7中任一项所述的方法,其中,当确定s≠0时,off=1<<(s-1)。c12.根据解决方案c1至c7中任一项所述的方法,其中,off=(1<<(s-1))-1。c13.根据解决方案c1至c12中任一项所述的方法,其中,所述几何分割模式包括三角预测模式(tpm)。c14.根据解决方案c1至c12中任一项所述的方法,其中,将所述当前块分割成多个分割,其中至少一个分割是非正方形和非矩形的。c15.根据解决方案c1至c14中任一项所述的方法,其中,所述当前视频块是编解码单元。c16.根据解决方案c1至c15中任一项所述的方法,其中,执行所述转换包括:从所述当前视频块生成所述比特流表示。c17.根据解决方案c1至c15中任一项所述的方法,其中,执行所述转换包括:从所述比特流表示生成所述当前视频块。c18.一种视频解码装置,包括处理器,所述处理器被配置为实现解决方案c1至c17中任一项所述的方法。c19.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于实现解决方案c1至c17中任一项所述的方法的程序代码。4.公开技术的示例实现图20是所述视频处理装置2000的框图。装置2000可用于实现本文所述的一个或多个方法。装置2000可以被实现在智能手机、平板电脑、计算机、物联网(iot)接收器等中。装置2000可以包括一个或多个处理器2002、一个或多个存储器2004和所述视频处理硬件2006。处理器2002可以被配置为实现本文所述的一个或多个方法(包括但不限于方法1930、1960和1990)。(一个或多个)存储器2004可用于存储用于实现本文所述的方法和技术的数据和代码。所述视频处理硬件2006可用于在硬件电路中实现本文所述的一些技术。在一些实施例中,可以使用实现在如图20所述的硬件平台上的解码装置来实现所述视频解码方法。图21是示出示例所述视频处理系统2100的框图,其中可以实施本文公开的各种技术。各种实现可能包括系统2100的部分或全部分量。系统2100可包括用于接收所述视频内容的输入2102。所述视频内容可以原始或未压缩格式接收,例如8位或10位多分量像素值,或者可以压缩或编码格式接收。输入2102可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(pon)等的有线接口,以及诸如wi-fi或蜂窝接口的无线接口。系统2100可包括编解码分量2104,其可实现本文中所描述的各种编解码或编码方法。编解码分量2104可以降低从输入2102到编解码分量2104的输出的所述视频的平均比特率,以产生所述视频的编解码表示。因此,编解码技术有时被称为所述视频压缩或所述视频转码技术。编解码分量2104的输出可以被存储,也可以通过连接的通信进行传输,如分量2106所示。输入2102处接收的所述视频的存储或通信比特流(或编解码)表示可由分量2108用于生成像素值或发送到显示接口2110的可显示所述视频。从比特流表示生成用户可观看所述视频的处理有时称为所述视频解压缩。此外,尽管某些所述视频处理操作被称为“编解码”操作或工具,但应当理解的是,编解码工具或操作被用于编码器处,并且逆向编码结果的对应的解码工具或操作将由解码器执行。外围总线接口或显示接口的示例可以包括通用串行总线(usb)或高清晰度多媒体接口(hdmi)或显示端口等。存储接口的示例包括sata(串行高级技术附件)、pci、ide接口等。本文中所述的技术可实施在各种电子设备中,例如移动电话、笔记本电脑、智能手机或其他能够执行数字数据处理和/或所述视频显示的设备。从上述来看,应当理解的是,为了便于说明,本发明公开的技术的具体实施例已经在本文中进行了描述,但是可以在不偏离本发明范围的情况下进行各种修改。因此,除了的之外,本发明公开的技术不限于权利要求的限定。本发明文件中描述的主题的实现和功能操作可以在各种系统、数字电子电路、或计算机软件、固件或硬件中实现,包括本说明书中所公开的结构及其结构等效体,或其中一个或多个的组合。本说明书中描述的主题的实现可以实现为一个或多个计算机程序产品,即一个或多个编码在有形的和非易失的计算机可读介质上的计算机程序指令的模块,以供数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储设备、影响机器可读传播信号的物质组成或其中一个或多个的组合。术语“数据处理单元”或“数据处理装置”包括用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多处理器或计算机组。除硬件外,该装置还可以包括为计算机程序创建执行环境的代码,例如,构成处理器固件的代码、协议栈、数据库管理系统、操作系统或其中一个或多个的组合。计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以以任何形式部署,包括作为独立程序或作为模块、分量、子程序或其它适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件对应。程序可以存储在保存其它程序或数据的文件的部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于该程序的单个文件中、或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行,这些计算机位于一个站点上或分布在多个站点上,并通过通信网络互连。本说明书中描述的处理和逻辑流可以通过一个或多个可编程处理器执行,该处理器执行一个或多个计算机程序,通过在输入数据上操作并生成输出来执行功能。处理和逻辑流也可以通过特殊用途的逻辑电路来执行,并且装置也可以实现为特殊用途的逻辑电路,例如,fpga(现场可编程门阵列)或asic(专用集成电路)。例如,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型数字计算机的任何一个或多个。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是执行指令的处理器和存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或通过操作耦合到一个或多个大容量存储设备来从其接收数据或将数据传输到一个或多个大容量存储设备,或两者兼有。然而,计算机不一定具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如eprom、eeprom和闪存设备。处理器和存储器可以由专用逻辑电路来补充,或merge到专用逻辑电路中。本说明书和附图仅意在被视为示例性的,其中示例性是指示例。如本文所用,除非上下文另有明确说明,否则单数形式“一”、“一个”和“这个”也应包括复数形式。此外,“或”的使用旨在包括“和/或”,除非上下文另有明确说明。虽然本专利文件包含许多细节,但不应将其解释为对任何发明或权利要求范围的限制,而应解释为对特定发明的特定实施例的特征的描述。本专利文件在单独实施例的上下文描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种功能也可以在多个实施例中单独实施,或在任何合适的子组合中实施。此外,尽管上述特征可以描述为在某些组合中起作用,甚至最初要求是这样,但在某些情况下,可以从组合中删除权利要求组合中的一个或多个特征,并且权利要求的组合可以指向子组合或子组合的变体。同样,尽管图纸中以特定顺序描述了操作,但这不应理解为要获得想要的结果必须按照所示的特定顺序或顺序执行此类操作,或执行所有说明的操作。此外,本专利文件所述实施例中各种系统分量的分离不应理解为在所有实施例中都需要这样的分离。仅描述了一些实现和示例,其它实现、增强和变体可以基于本专利文件中描述和说明的内容做出。当前第1页12