视频译码中运动矢量细化过程的提前终止的制作方法

文档序号:30713422发布日期:2022-07-11 14:08阅读:141来源:国知局
视频译码中运动矢量细化过程的提前终止的制作方法
视频译码中运动矢量细化过程的提前终止
1.本技术要求于2020年11月19日提交的美国专利申请16/952,736和于2019年11月22日提交的美国临时专利申请62/939,325的权益,该两篇申请中的每一篇的全部内容通过引用并入。
技术领域
2.本公开涉及视频编码和视频解码。


背景技术:

3.数字视频能力可以被结合到多种多样的设备中,包括数字电视、数字直接广播系统、无线广播系统、个人数字助理(pda)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录设备、数字媒体播放器、视频游戏设备、视频游戏控制台、蜂窝或卫星无线电电话、所谓的“智能电话”、视频电话会议设备、视频流传输设备等。数字视频设备实施视频译码技术,诸如在由mpeg-2、mpeg-4、itu-t h.263、itu-t h.264/mpeg-4第10部分、高级视频译码(avc)、itu-t h.265/高效视频译码(hevc)定义的标准以及此类标准的扩展中描述的那些技术。通过实施此类视频译码技术,视频设备可以更高效地发送、接收、编码、解码和/或存储数字视频信息。
4.视频译码技术包括空间(图片内)预测和/或时间(图片间)预测,以减少或移除视频序列中固有的冗余。对于基于块的视频译码,视频切片(即,视频图片或视频图片的一部分)可以被分割成视频块,这些视频块也可以被称为译码树单元(ctu)、译码单元(cu)和/或译码节点。图片的经帧内译码(i)切片中的视频块使用关于同一图片中相邻块中的参考样本的空间预测来进行编码。图片的经帧间译码(p或b)切片中的视频块可以使用关于同一图片中的相邻块中的参考样本的空间预测,或关于其他参考图片中的参考样本的时间预测。图片可以被称为帧,并且参考图片可以被称为参考帧。


技术实现要素:

5.通常,本公开描述了与运动矢量细化过程的提前终止相关的技术。本公开的技术可以应用于现有视频编解码器的扩展,诸如高效视频译码(hevc)、多功能视频译码(vvc)、基本视频译码(evc),或者可以在任何未来的视频译码标准中应用。
6.诸如,例如双向光流(bdof)和解码器侧运动矢量细化(dmvr)的运动矢量细化过程是可以在视频译码期间使用的译码工具。例如,如果满足运动矢量细化过程的提前终止条件,则视频译码器(例如,视频编码器或视频解码器)可以在运动矢量细化过程开始之前终止运动矢量细化过程。否则,如果不满足针对运动矢量细化过程的提前终止条件,则视频译码器执行运动矢量细化过程。
7.可能存在一个或多个与应用运动矢量细化过程相关的问题,在应用运动矢量细化过程的情况下,视频译码器可以在运动矢量细化过程添加相对大量的复杂性和相对少量的预测准确度的情况下应用运动矢量细化过程。这可能增加视频译码器的总复杂性,增加成
本,以及可能减慢译码过程。
8.如本文所述,视频译码器(例如,视频编码器或视频解码器)可以确定关于当前块是否满足条件。例如,视频译码器可以基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件。也就是说,视频译码器可以基于双向运动矢量的绝对值是否小(即,小于阈值)来提前终止运动矢量细化过程,以帮助避免在运动矢量细化过程添加相对大量的复杂性和相对少量的预测准确度的情况下应用运动矢量细化过程。以这种方式,视频译码器可以提前终止对当前块的双向运动矢量应用运动矢量细化过程,这可以潜在地减少解码器侧复杂性的平均情况。
9.在一个示例中,一种对视频数据进行解码的方法包括:确定视频数据的当前块的双向运动矢量;以及基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件。该方法还包括:基于关于当前块满足条件来提前终止对当前块的双向运动矢量应用运动矢量细化过程。该方法还包括:基于当前块的双向运动矢量来确定针对当前块的预测块;以及基于针对当前块的预测块来重构当前块。
10.在另一示例中,一种设备包括:存储器,被配置为存储视频数据;以及一个或多个处理器,被实施在电路中。该一个或多个处理器被配置为:确定视频数据的当前块的双向运动矢量;以及基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件。该一个或多个处理器被配置为:基于关于当前块满足条件来提前终止对当前块的双向运动矢量应用运动矢量细化过程。该一个或多个处理器被配置为:基于当前块的双向运动矢量来确定针对当前块的预测块;以及基于针对当前块的预测块来重构当前块。
11.在一个示例中,一种具有存储在其上的指令的计算机可读存储介质,该指令在被执行时使处理器:确定视频数据的当前块的双向运动矢量;以及基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件。该指令进一步使处理器:基于关于当前块满足条件来提前终止对当前块的双向运动矢量应用运动矢量细化过程。该指令进一步使处理器:基于当前块的双向运动矢量来确定针对当前块的预测块;以及基于针对当前块的预测块来重构当前块。
12.在一个示例中,一种设备包括:用于确定视频数据的当前块的双向运动矢量的部件;以及用于基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件的部件。该设备还包括:用于基于关于当前块满足条件来提前终止对当前块的双向运动矢量应用运动矢量细化过程的部件。该设备还包括:用于基于当前块的双向运动矢量来确定针对当前块的预测块的部件,以及用于基于针对当前块的预测块来重构当前块的部件。
13.一个或多个示例的细节将在附图和以下描述中进行阐述。从说明书、附图和权利要求中,其他特征、目标和优点将变得显而易见。
附图说明
14.图1是示出可以执行本公开的技术的示例视频编码和解码系统的框图。
15.图2a是示出用于合并模式的空间相邻运动矢量(mv)候选的概念图。
16.图2b是示出用于amvp模式的空间相邻mv候选的概念图。
17.图3a是示出示例时间运动矢量预测器(tmvp)候选的概念图。
18.图3b是示出mv缩放的示例的概念图。
19.图4是示出双边模板匹配的概念图。
20.图5是示出在双向光流(bdof)中使用的示例扩展译码单元(cu)区域的概念图。
21.图6是示出可以执行本公开的技术的示例视频编码器的框图。
22.图7是示出可以执行本公开的技术的示例视频解码器的框图。
23.图8是示出可以由视频编码器根据本公开的一个或多个技术执行的用于对当前块进行编码的示例方法的流程图。
24.图9是示出可以由视频解码器根据本公开的一个或多个技术执行的用于对视频数据的当前块进行解码的示例方法的流程图。
25.图10是示出可以由视频译码器根据本公开的一个或多个技术执行的示例方法的流程图。
具体实施方式
26.诸如,例如双向光流(bdof)和解码器侧运动矢量细化(dmvr)的运动矢量细化过程是可以在视频译码期间用在运动补偿过程中的译码工具。例如,bdof和dmvr中的每一个都可以与提前终止条件相关联。如果满足bdof的提前终止条件,则视频译码器(例如,视频编码器或视频解码器)可以在bdof过程开始之前终止bdof过程。否则,如果不满足针对bdof的提前终止条件,则视频译码器执行bdof过程。类似地,如果满足针对dmvr的提前终止条件,则视频译码器可以在dmvr过程开始之前终止dmvr过程。如果不满足针对dmvr的提前终止条件,则视频译码器执行dmvr过程。
27.2019年10月1至11日,在瑞士日内瓦举行的itu-t sg 16wp 3和iso/iec jtc 1/sc 29/wg 11的联合视频专家小组(jvet)第16次会议(jvet-p2001-v14)上,bross等人的“versatile video coding(draft 7)(多功能视频译码(草案7))”(在下文中简称“vvc草案7”)是vvc标准的草案。在vvc草案7中,针对bdof和dmvr两者的提前终止条件都应用了基于绝对差之和(基于sad)的提前终止,以减少解码器侧复杂性的平均情况。也就是说,可能存在一个或多个与应用bdof和/或dmvr相关的问题,在应用bdof和/或dmvr的情况下,视频译码器可以在bdof和/或dmvr添加相对大量的复杂性和相对少量的预测准确度的情况下应用bdof和/或dmvr。这可能增加视频译码器的总复杂性,增加成本,以及可能减慢译码过程。
28.根据本公开的技术,用于bdof和/或dmvr的提前终止技术可以通过考虑双向运动矢量是否对称(或接近对称)或者双向运动矢量的绝对值是否小(即,小于阈值)来改进。本公开描述了可以向一个或多个上述问题和/或一个或多个其他问题提供解决方案的技术。例如,在一个示例中,视频译码器(例如,视频编码器或视频解码器)可以确定关于当前块是否满足提前终止条件。例如,视频译码器可以基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足提前终止条件。以这种方式,视频译码器可以基于双向运动矢量是否对称(或接近对称)和/或基于双向运动矢量的绝对值是否小来应用对当前块的双向运动矢量应用运动矢量细化过程的提前终止,这可以在译码准确度方面具有较少损失或几乎没有损失的情况下潜在地减少解码器侧复杂性的平均情况。
29.图1是示出可以执行本公开的技术的示例视频编码和解码系统100的框图。本公开的技术通常涉及译码(编码和/或解码)视频数据。通常,视频数据包括用于处理视频的任何数据。因此,视频数据可以包括原始的、未经编码的视频、经编码的视频、经解码的(例如,经
重构的)视频和视频元数据,诸如信号通知的数据。
30.如图1所示,在该示例中,系统100包括源设备102,该源设备102提供要由目的设备116解码和显示的经编码的视频数据。具体地,源设备102经由计算机可读介质110向目的设备116提供视频数据。源设备102和目的设备116可以包括大范围的设备中的任何一种,包括:桌上型计算机、移动设备(例如,笔记本(即,膝上型)计算机、平板计算机、诸如智能手机的电话送受话器、相机等)、机顶盒、广播接收器设备、电视机、显示设备、数字媒体播放器、视频游戏控制台、视频流传输设备等。在一些情况下,源设备102和目的设备116可以被配备用于无线通信,并且因此可以被称为无线通信设备。
31.在图1的示例中,源设备102包括视频源104、存储器106、视频编码器200和输出接口108。目的设备116包括输入接口122、视频解码器300、存储器120和显示设备118。根据本公开,源设备102的视频编码器200和目的设备116的视频解码器300可以被配置为应用与dmvr和bdof相关的技术。因此,源设备102表示视频编码设备的示例,而目的设备116表示视频解码设备的示例。在其他示例中,源设备和目的设备可以包括其他组件或布置。例如,源设备102可以从诸如外部相机的外部视频源接收视频数据。类似地,目的设备116可以与外部显示设备接口连接,而非包括集成的显示设备。
32.如图1所示的系统100仅仅是一个示例。通常,任何数字视频编码和/或解码设备都可以执行与dmvr和bdof相关的技术。源设备102和目的设备116仅仅是此类译码设备的示例,其中源设备102生成经译码的视频数据以传输到目的设备116。本公开将“译码”设备称为执行数据的译码(编码和/或解码)的设备。因此,视频编码器200和视频解码器300表示译码设备的示例,具体地,分别为视频编码器和视频解码器。在一些示例中,源设备102和目的设备116可以按基本上对称的方式操作,使得源设备102和目的设备116的每个设备都包括视频编码和解码组件。因此,系统100可以例如对于视频流传输、视频回放、视频广播或视频电话,支持源设备102与目的设备116之间的单向或双向视频传输。
33.通常,视频源104表示视频数据的源(即,原始的、未经编码的视频数据),并且向视频编码器200提供视频数据的连续系列的图片(也被称为“帧”),该视频编码器200对用于图片的数据进行编码。源设备102的视频源104可以包括视频捕获设备,诸如摄像机、包含先前捕获的原始视频的视频存档和/或从视频内容提供商接收视频的视频馈送接口。作为进一步的替代,视频源104可以生成基于计算机图形的数据作为源视频,或者实况视频、存档的视频和计算机生成的视频的组合。在每种情况下,视频编码器200对捕获的、预捕获的或计算机生成的视频数据进行编码。视频编码器200可以将图片从接收顺序(有时被称为“显示顺序”)重新布置成用于译码的译码顺序。视频编码器200可以生成包括经编码的视频数据的位流(bitstream)。源设备102然后可以经由输出接口108向计算机可读介质110上输出经编码的视频数据,用于由例如目的设备116的输入接口122接收和/或取得。
34.源设备102的存储器106和目的设备116的存储器120表示通用存储器。在一些示例中,存储器106、120可以存储原始视频数据,例如来自视频源104的原始视频和来自视频解码器300的原始的、经解码的视频数据。附加地或可替代地,存储器106、120可以分别存储可由例如视频编码器200和视频解码器300执行的软件指令。尽管在该示例中,存储器106和存储器120被示出为与视频编码器200和视频解码器300分离,但是应当理解的是,视频编码器200和视频解码器300也可以包括用于功能上类似或等同目的的内部存储器。此外,存储器
106、120可以存储经编码的视频数据,例如从视频编码器200输出并且输入到视频解码器300的数据。在一些示例中,存储器106、120的部分可以被分配作为一个或多个视频缓冲器,例如以存储原始的、经解码的和/或经编码的视频数据。
35.计算机可读介质110可以表示能够将经编码的视频数据从源设备102传递到目的设备116的任何类型的介质或设备。在一个示例中,计算机可读介质110表示通信介质,以使得源设备102能够例如经由射频网络或基于计算机的网络实时地直接向目的设备116发送经编码的视频数据。根据通信标准,诸如无线通信协议,输出接口108可以调制包括经编码的视频数据的传输信号,并且输入接口122可以解调所接收的传输信号。通信介质可以包括任何无线或有线通信介质,诸如射频(rf)频谱或一条或多条物理传输线。通信介质可以形成基于分组的网络(诸如局域网、广域网或全球网(诸如因特网))的一部分。通信介质可以包括路由器、交换机、基站或有助于促进从源设备102到目的设备116的通信的任何其他装置。
36.在一些示例中,计算机可读介质110可以包括存储设备112。源设备102可以从输出接口108向存储设备112输出经编码的数据。类似地,目的设备116可以经由输入接口122访问来自存储设备112的经编码的数据。存储设备112可以包括多种分布式或本地访问的数据存储介质中的任何一种,诸如硬盘驱动器、蓝光光盘、dvd、cd-rom、闪速存储器、易失性或非易失性存储器,或者用于存储经编码的视频数据的任何其他合适的数字存储介质。
37.在一些示例中,计算机可读介质110可以包括文件服务器114或可以存储由源设备102生成的经编码的视频数据的另一中间存储设备。源设备102可以向文件服务器114或可以存储由源设备102生成的经编码的视频的另一中间存储设备输出经编码的视频数据。目的设备116可以经由流传输或下载从文件服务器114访问所存储的视频数据。文件服务器114可以是能够存储经编码的视频数据并且向目的设备116发送该经编码的视频数据的任何类型的服务器设备。文件服务器114可以表示网络服务器(例如,用于网站的)、文件传输协议(ftp)服务器、内容递送网络设备或网络附加存储(nas)设备。目的设备116可以通过任何标准数据连接(包括因特网连接),访问来自文件服务器114的经编码的视频数据。这可以包括无线信道(例如,wi-fi连接)、有线连接(例如,数字订户线(dsl)、电缆调制解调器等)或适合于访问存储在文件服务器114上的经编码的视频数据的上述两者的组合。文件服务器114和输入接口122可以被配置为根据流传输协议、下载传输协议或它们的组合来操作。
38.输出接口108和输入接口122可以表示无线发送器/接收器、调制解调器、有线联网组件(例如,以太网卡)、根据多种ieee 802.11标准中的任何一种操作的无线通信组件或其他物理组件。在输出接口108和输入接口122包括无线组件的示例中,输出接口108和输入接口122可以被配置为根据蜂窝通信标准(诸如4g、4g-lte(长期演进)、高级lte、5g等)来传输数据,诸如经编码的视频数据。在输出接口108包括无线发送器的一些示例中,输出接口108和输入接口122可以被配置为根据其他无线标准(诸如ieee 802.11规范、ieee 802.15规范(例如,zigbee
tm
)、蓝牙
tm
标准等)来传输数据,诸如经编码的视频数据。在一些示例中,源设备102和/或目的设备116可以包括相应的片上系统(soc)设备。例如,源设备102可以包括执行归属于视频编码器200和/或输出接口108的功能性的soc设备,并且目的设备116可以包括执行归属于视频解码器300和/或输入接口122的功能性的soc设备。
39.本公开的技术可以应用于视频译码,以支持多种多媒体应用中的任何一种,诸如
空中电视广播、有线电视传输、卫星电视传输、因特网流传输视频传输(诸如通过http的动态自适应流传输(dash))、经编码到数据存储介质上的数字视频、解码存储在数据存储介质上的数字视频或其他应用。
40.目的设备116的输入接口122可以从计算机可读介质110(例如,通信介质、存储设备112、文件服务器114等)接收经编码的视频位流。经编码的视频位流可以包括由视频编码器200定义的信令信息,诸如具有描述视频块或其他经译码的单元(例如,切片、图片、图片组、序列等)的特征和/或处理的值的语法元素,该信令信息也被视频解码器300使用。显示设备118向用户显示经解码的视频数据的经解码的图片。显示设备118可以表示多种显示设备中的任何一种,诸如液晶显示器(lcd)、等离子显示器、有机发光二极管(oled)显示器或另一种类型的显示设备。
41.虽然图1中未示出,但是在一些示例中,视频编码器200和视频解码器300可以各自与音频编码器和/或音频解码器集成,并且可以包括适当的mux-demux单元或其他硬件和/或软件,以处理包括共同数据流中的音频和视频两者的经复用的流。如果适用,mux-demux单元可以遵照itu h.223多路复用器协议,或其他协议,诸如用户数据报协议(udp)。
42.视频编码器200和视频解码器300各自可以被实施为多种合适的编码器和/或解码器电路中的任何一种,诸如一个或多个微处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)、分立逻辑、软件、硬件、固件或它们的任何组合。当这些技术部分地以软件实施时,设备可以将用于软件的指令存储在合适的非暂时性计算机可读介质中,并且在硬件中使用一个或多个处理器来执行这些指令以执行本公开的技术。视频编码器200和视频解码器300中的每一个可以被包括在一个或多个编码器或解码器中,该一个或多个编码器或解码器中的任一个可以被集成作为相应设备中的组合编码器/解码器(编解码器(codec))的一部分。包括视频编码器200和/或视频解码器300的设备可以包括集成电路、微处理器和/或无线通信设备,诸如蜂窝电话。
43.视频编码器200和视频解码器300可以根据视频译码标准来操作,诸如itu-t h.265,也被称为高效视频译码(hevc)或其扩展,诸如多视图和/或可缩放视频译码扩展。可替代地,视频编码器200和视频解码器300可以根据其他专有或行业标准来操作,诸如itu-t h.266,也被称为多功能视频译码(vvc)。vvc草案7是vvc标准的最新草案。然而,本公开的技术不限于任何特定的译码标准。2019年1月9至18日,在摩洛哥马拉喀什举行的itu-tsg 16wp 3和iso/iec jtc 1/sc 29/wg 11的联合视频专家小组(jvet)的第15次会议(jvet-m1002)上,j.chen等人的“algorithm description of versatile video coding and test model 4(vtm 4)(多功能视频译码的算法描述和测试模型4(vtm 4))”是vvc的算法描述和测试模型。
44.通常,视频编码器200和视频解码器300可以执行图片的基于块的译码。术语“块”通常指包括要处理(例如,要编码的、要解码的或以其他方式用在编码和/或解码过程中的)的数据的结构。例如,块可以包括亮度和/或色度数据的样本的二维矩阵。通常,视频编码器200和视频解码器300可以对以yuv(例如,y、cb、cr)格式表示的视频数据进行译码。也就是说,视频编码器200和视频解码器300可以对亮度和色度分量进行译码,其中色度分量可以包括红色调和蓝色调色度分量两者,而不是对针对图片的样本的红、绿和蓝(rgb)数据进行译码。在一些示例中,视频编码器200在编码之前将接收到的rgb格式化数据转换成yuv表
示,并且视频解码器300将yuv表示转换成rgb格式。可替代地,预处理和后处理单元(未示出)可以执行这些转换。
45.本公开通常可以涉及图片的译码(例如,编码和解码),以包括对图片数据进行编码或解码的过程。类似地,本公开可以涉及图片的块的译码,以包括对用于块的数据进行编码或解码的过程,例如预测和/或残差译码。经编码的视频位流通常包括表示译码决策(例如,译码模式)和图片到块的分割的语法元素的一系列值。因此,对译码图片或块的引用通常应被理解为用于形成图片或块的语法元素的译码值。
46.hevc定义了各种块,包括译码单元(cu)、预测单元(pu)和变换单元(tu)。根据hevc,视频译码器(诸如视频编码器200)根据四叉树结构来将译码树单元(ctu)分割成cu。也就是说,视频译码器将ctu和cu分割成四个相等的、不重叠的正方形,并且四叉树的每个节点具有零个或四个子节点。不具有子节点的节点可以被称为“叶节点”,并且此叶节点的cu可以包括一个或多个pu和/或一个或多个tu。视频译码器还可以分割pu和tu。例如,在hevc中,残差四叉树(rqt)表示tu的分割。在hevc中,pu表示帧间预测数据,而tu表示残差数据。经帧内预测的cu包括帧内预测信息,诸如帧内模式指示。
47.作为另一示例,视频编码器200和视频解码器300可以被配置为根据vcc来操作。根据vcc,视频译码器(诸如视频编码器200)将图片分割成多个译码树单元(ctu)。视频编码器200可以根据树结构(诸如四叉树-二叉树(qtbt)结构或多类型树(mtt)结构)来分割ctu。qtbt结构移除了多种分割类型的概念,诸如hevc的cu、pu和tu之间的分离。qtbt结构包括两级:根据四叉树分割来分割的第一级和根据二叉树分割来分割的第二级。qtbt结构的根节点对应于ctu。二叉树的叶节点对应于译码单元(cu)。
48.在mtt分割结构中,块可以使用四叉树(qt)分割、二叉树(bt)分割和一个或多个类型的三叉树(triple tree,tt)(也被称为三元树(ternary tree,tt))分割来分割。三叉或三元树分割是将块划分成三个子块的分割。在一些示例中,三叉或三元树分割将块分成三个子块,而不通过中心来分原始块。mtt中(例如,qt、bt和tt)的分割类型可以是对称的或者不对称的。
49.在一些示例中,视频编码器200和视频解码器300可以使用单个qtbt或mtt结构来表示亮度分量和色度分量中的每一个,而在其他示例中,视频编码器200和视频解码器300可以使用两个或更多个qtbt或mtt结构,诸如一个qtbt/mtt结构用于亮度分量,并且另一qtbt/mtt结构用于两个色度分量(或者两个qtbt/mtt结构用于相应的色度分量)。
50.视频编码器200和视频解码器300可以被配置为使用每hevc四叉树分割、qtbt分割、或mtt分割或其他分割结构。出于解释的目的,相对于qtbt分割呈现了本公开的技术的描述。然而,应当理解的是,本公开的技术也可以应用于被配置为使用四叉树分割或其他类型的分割的视频译码器。
51.在图片中,可以按各种方式对块(例如,ctu或cu)进行分组。作为一个示例,砖块(brick)可以指图片中特定图块(tile)内的ctu行的矩形区域。图块可以是图片中特定图块列和特定图块行内的ctu的矩形区域。图块列指具有等于图片高度的高度和由语法元素(例如,诸如在图片参数集中的语法元素)指定的宽度的ctu的矩形区域。图块行指具有由语法元素(例如,诸如在图片参数集中的语法元素)指定的高度和等于图片宽度的宽度的ctu的矩形区域。
52.在一些示例中,图块可以被分割成多个砖块,每个砖块可以包括图块内的一个或多个ctu行。没有被分割成多个砖块的图块也可以被称为砖块。然而,作为图块的真子集的砖块不能被称为图块。
53.图片中的砖块也可以按切片布置。切片可以是图片的整数个砖块,它们可以排他地被包含在单个网络抽象层(nal)单元中。在一些示例中,切片包括若干完整的图块或仅包括一个图块的完整的砖块的连续序列。
54.本公开可以互换地使用“n
×
n”和“n乘n”来指代块(诸如cu或其他视频块)在垂直和水平维度方面的样本维度,例如,16
×
16样本或16乘16样本。通常,16
×
16cu在垂直方向上具有16个样本(y=16),并且在水平方向上具有16个样本(x=16)。同样地,n
×
n cu通常在垂直方向上具有n个样本,并且在水平方向上具有n个样本,其中n表示非负整数值。cu中的样本可以按行和列布置。此外,cu不一定需要在水平方向具有与垂直方向相同数量的样本。例如,cu可以包括n
×
m个样本,其中m不一定等于n。
55.视频编码器200对表示预测和/或残差信息以及其他信息的用于cu的视频数据进行编码。预测信息指示要如何预测cu,以便形成用于cu的预测块。残差信息通常表示编码之前的cu的样本与预测块之间的逐样本差。
56.为了预测cu,视频编码器200通常可以通过帧间预测或帧内预测来形成用于cu的预测块。帧间预测通常指从先前经译码的图片的数据预测cu,而帧内预测通常指从相同图片的先前经译码的数据预测cu。为了执行帧间预测,视频编码器200可以使用一个或多个运动矢量来生成预测块。视频编码器200通常可以执行运动搜索以标识例如就cu与参考块之间的差而言,与cu紧密匹配的参考块。视频编码器200可以使用绝对差之和(sad)、平方差之和(ssd)、平均绝对差(mad)、均方差(msd)或其它此类差计算来计算差度量,以确定参考块是否与当前cu紧密匹配。在一些示例中,视频编码器200可以使用单向预测或双向预测来预测当前cu。
57.根据本公开的技术,视频编码器200可以确定关于当前块是否满足条件。例如,视频编码器200可以基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件。基于关于当前块满足条件,视频编码器200可以提前终止对当前块的双向运动矢量应用运动矢量细化过程(例如,dmvr和/或bdof)。例如,视频编码器200可以避免在当前块的双向运动矢量上启动和/或绕过运动矢量细化过程(例如,dmvr和/或bdof)。
58.vvc的一些示例还提供仿射运动补偿模式,该模式可以被认为是帧间预测模式。在仿射运动补偿模式中,视频编码器200可以确定表示非平移运动(诸如放大或缩小、旋转、透视运动或其他不规则运动类型)的两个或更多个运动矢量。
59.为了执行帧内预测,视频编码器200可以选择帧内预测模式来生成预测块。vvc的一些示例提供了六十七个帧内预测模式,包括各种方向模式,以及平面模式和dc模式。通常,视频编码器200选择描述与当前块(例如,cu的块)相邻的样本的帧内预测模式,从该模式来预测当前块的样本。假设视频编码器200以光栅扫描顺序(从左侧到右侧、从顶部到底部)来对ctu和cu进行译码,此类样本通常可以在与当前块相同的图片中的当前块的上方、左上方或左侧。
60.视频编码器200对表示用于当前块的预测模式的数据进行编码。例如,对于帧间预测模式,视频编码器200可以对表示使用了各种可用帧间预测模式中的哪一种的数据进行
编码,以及对用于对应的模式的运动信息进行编码。例如,对于单向或双向帧间预测,视频编码器200可以使用高级运动矢量预测(amvp)或合并(merge)模式来对运动矢量进行编码。视频编码器200可以使用类似的模式来对用于仿射运动补偿模式的运动矢量进行编码。
61.在预测之后,诸如块的帧内预测或帧间预测之后,视频编码器200可以计算用于块的残差数据。残差数据(诸如残差块)表示块与针对该块的预测块之间的逐样本差,其通过使用对应预测模式而形成。视频编码器200可以对残差块应用一个或多个变换,以在变换域而不是样本域中产生经变换的数据。例如,视频编码器200可以对残差视频数据应用离散余弦变换(dct)、整数变换、小波变换或概念上类似的变换。此外,视频编码器200可以在第一变换之后应用次级变换,诸如模式相关的不可分离次级变换(mdnsst)、信号相关的变换、卡洛南-洛伊(karhunen-loeve)变换(klt)等。视频编码器200在应用一个或多个变换之后产生变换系数。
62.如上所述,在产生变换系数的任何变换之后,视频编码器200可以执行变换系数的量化。量化通常指其中变换系数被量化以尽可能减少用来表示变换系数的数据量、从而提供进一步压缩的过程。通过执行量化过程,视频编码器200可以减少与变换系数中的一些或全部相关联的位深度。例如,视频编码器200可以在量化期间将n位值向下舍入为m位值,其中n大于m。在一些示例中,为了执行量化,视频编码器200可以对要量化的值执行按位右移。
63.量化之后,视频编码器200可以扫描变换系数,从而从包括经量化的变换系数的二维矩阵产生一维矢量。扫描可以被设计成将较高能量(并且因此较低频率)的变换系数放置在矢量的前面,并且将较低能量(并且因此较高频率)的变换系数放置在矢量的后面。在一些示例中,视频编码器200可以利用预定义的扫描顺序来扫描经量化的变换系数,以产生经串行化的矢量,并且然后,对矢量的经量化的变换系数进行熵编码。在其他示例中,视频编码器200可以执行自适应扫描。在扫描经量化的变换系数以形成一维矢量之后,视频编码器200可以例如根据上下文自适应二进制算术译码(cabac)来对一维矢量进行熵编码。视频编码器200还可以对用于描述与经编码的视频数据相关联的元数据的语法元素的值进行熵编码,以供视频解码器300在对视频数据进行解码时使用。
64.为了执行cabac,视频编码器200可以将上下文模型内的上下文分配给要发送的符号。上下文可以涉及例如符号的相邻值是否为零值。概率确定可以基于被分配给符号的上下文。
65.视频编码器200还可以例如在图片标头、块标头、切片标头或其他语法数据(诸如序列参数集(sps)、图片参数集(pps)或视频参数集(vps))中给视频解码器300生成语法数据,诸如基于块的语法数据、基于图片的语法数据和基于序列的语法数据。视频解码器300可以同样地对此语法数据进行解码,以确定如何解码对应的视频数据。
66.以这种方式,视频编码器200可以生成位流,该位流包括经编码的视频数据,例如描述图片到块(例如,cu)的分割的语法元素以及用于块的预测和/或残差信息。最终,视频解码器300可以接收位流并且对经编码的视频数据进行解码。
67.通常,视频解码器300执行与由视频编码器200执行的过程相反的过程,以对位流的经编码的视频数据进行解码。例如,视频解码器300可以使用cabac、按与视频编码器200的cabac编码过程基本相似但相反的方式,对针对位流的语法元素的值进行解码。语法元素可以定义用于将图片分割成ctu的分割信息以及根据对应的分割结构(诸如qtbt结构)的每
个ctu的分割的分割信息,以定义ctu的cu。语法元素还可以定义用于视频数据的块(例如,cu)的预测和残差信息。
68.残差信息可以由例如经量化的变换系数来表示。视频解码器300可以对块的经量化的变换系数进行逆量化和逆变换,以再现针对块的残差块。视频解码器300使用发信号通知的预测模式(帧内预测或帧间预测)和相关预测信息(例如,用于帧间预测的运动信息),以形成针对块的预测块。视频解码器300然后可以(在逐样本的基础上)组合预测块和残差块,以再现原始块。视频解码器300可以执行附加的处理,诸如执行去块过程以减少沿块的边界的视觉伪影。
69.根据本公开的技术,视频解码器300可以确定关于当前块是否满足条件。例如,视频解码器300可以基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件。基于关于当前块满足条件,视频解码器300可以提前终止对当前块的双向运动矢量应用运动矢量细化过程(例如,dmvr和/或bdof)。例如,视频解码器300可以避免在当前块的双向运动矢量上启动和/或绕过运动矢量细化过程(例如,dmvr和/或bdof)。
70.在hevc中,切片中最大的译码单元被称为译码树块(ctb)或译码树单元(ctu)。ctb包含四叉树,四叉树的节点是译码单元。在hevc主配置文件中,ctb的大小可以在从16
×
16到64
×
64的范围内(尽管技术上可以支持8
×
8的ctb大小)。译码单元(cu)的大小可以与ctb的大小相同,小到8
×
8。每个译码单元以一个模式(例如,帧间或帧内)进行译码。当cu经帧间译码时,cu可以被进一步分割成2个或4个预测单元(pu),或者当进一步分割不适用时变成仅一个pu。当一个cu中存在两个pu时,这两个pu可以是一半大小的矩形或具有cu的1/4或3/4大小的两个矩形大小。当cu经帧间译码时,每个pu具有以唯一帧间预测模式导出的一个运动信息集。
71.在hevc标准中,对于预测单元(pu),有两个帧间预测模式,分别命名为合并模式(跳过被认为是合并的特例)和高级运动矢量预测(amvp)模式。在amvp或合并模式中,为多个运动矢量预测器维护运动矢量(mv)候选列表。当前pu的(多个)运动矢量以及合并模式下的参考索引是通过从mv候选列表中选取一个候选来生成的。
72.mv候选列表包含多达5个用于合并模式的候选以及仅两个用于amvp模式的候选。合并候选可以包含运动信息集,例如对应于参考图片列表(列表0和列表1)和参考索引两者的运动矢量。如果合并候选被合并索引标识,则用于当前块的预测的参考图片以及相关联的运动矢量被确定。另一方面,在amvp模式下,对于来自列表0或列表1的每个潜在预测方向,参考索引需要与mv预测器(mvp)索引一起被明确地发信号通知给mv候选列表,因为amvp候选仅包含运动矢量。在amvp模式中,可以进一步细化所预测的运动矢量。用于两个模式的候选是类似地从相同的空间和时间相邻块导出的。
73.空间mv候选是从图2a和图2b中示出的针对特定pu(pu0)(140)的相邻块导出的,尽管对于合并和amvp模式,从块生成候选的方法不同。图2a是示出用于合并模式的空间相邻mv候选的概念图。图2b是示出用于amvp模式的空间相邻mv候选的概念图。
74.在合并模式中,可以利用图2a中示出的具有数字的顺序来导出多达四个空间mv候选,并且该顺序如下:左(0,a1)、上(1,b1)、右上(2,b0)、左下(3,a0)和左上(4,b2),如图2a所示。
75.在amvp模式中,相邻块142a-142e被分为两组:由块0和1组成的左组,以及由块2、3
和4组成的上组,如图2b所示。对于每个组,参考与由发信号通知的参考索引所指示的参考图片相同的参考图片的相邻块中的潜在候选具有要被选择来形成该组的最终候选的最高优先级。可能没有相邻块包含指向相同参考图片的运动矢量。因此,如果找不到此候选,第一可用候选将被缩放以形成最终候选;因此,可以补偿时间距离差。
76.如果时间运动矢量预测器(tmvp)候选被启用并且可用,则可以将其添加到mv候选列表中,位于空间运动矢量候选之后。针对tmvp候选的运动矢量导出过程对于合并模式和amvp模式两者来说是相同的;然而,用于合并模式中的tmvp候选的目标参考索引总是被设定为0。
77.用于tmvp候选导出的主要块位置是并置(collocated)pu之外的右下块(如图3a中被示出为“t”),以补偿到用于生成空间相邻候选的上块和左块的偏差。然而,如果该块位于当前ctb行之外或者运动信息不可用,则用pu的中心块取代该块。
78.图3a是示出tmvp候选的概念图。在图3a的示例中,cu 160包括第一pu 162(表示为pu0)和第二pu 164(表示为pu1)。在图3a的示例中,用于tmvp候选导出的主要块位置166是并置pu之外的右下块(被显示为块“t”),以补偿到用于生成空间相邻候选的上块和左块的偏差。然而,如果主块位置166处的块位于当前ctb行之外或者运动信息不可用,则用pu 602的中心块168来取代该块。针对tmvp候选的运动矢量是从共置(co-located)图片的共置pu导出的,以切片级指示。针对共置pu的运动矢量被称为并置mv。类似于h.264/avc中的时间直接模式,为了导出tmvp候选运动矢量,共置mv可能需要被缩放以补偿时间距离差,例如,如图3b所示。
79.图3b是示出mv缩放的概念图。在图3b的示例中,针对当前图片172的并置图片170包括运动矢量(即,并置运动矢量),该运动矢量指示并置参考图片174中的位置。并置图片170与并置参考图片174之间的时间距离被称为并置时间距离。此外,在amvp中,针对当前图片172的当前块的参考索引指示当前参考图片176。当前图片172与当前参考图片176之间的时间距离被称为当前时间距离。视频译码器可以使用并置运动矢量作为当前图片172中的块的时间运动矢量预测器(tmvp),但可以基于并置时间距离与当前时间距离之间的差来缩放并置运动矢量。
80.因此,为了确定列表0(l0)amvp候选列表,视频译码器可以确定在左组中是否存在具有l0运动矢量的可用相邻块。如果相邻块存在,并且视频译码器能够访问关于相邻块的运动信息,则相邻块可以被认为是可用的。此外,如果左组包括具有l0运动矢量的可用相邻块,则视频译码器可以将l0运动矢量包括在l0 amvp候选列表中。此外,视频译码器可以确定在上组中是否存在具有l0运动矢量的可用相邻块。如果上组包括具有l0运动矢量的可用相邻块,则视频译码器可以将l0运动矢量包括在l0 amvp候选列表中。在一些示例中,如果左组和/或上组不包括可用l0运动矢量,则视频译码器可以包括时间邻居的l0运动矢量。在一些此类示例中,如果时间邻居不可用或不具有l0运动矢量,则视频译码器可以将零值运动矢量包括在l0 amvp候选列表中。视频译码器可以用l1替换l0来执行相同的过程,以确定列表1(l1)amvp候选列表。
81.下面呈现了合并和amvp模式的几个方面。
82.运动矢量缩放:运动矢量的值可能与图片在呈现时间中的距离成比例。如本文所提到的,运动矢量将参考图片和包含运动矢量的图片(例如,包含图片)这两个图片关联起
来。当视频译码器(例如,视频编码器200或视频解码器300)使用运动矢量来预测其他运动矢量时,视频译码器可以基于图片顺序计数(poc)值来计算包含图片和参考图片的距离。
83.对于要预测的运动矢量,与该运动矢量相关联的包含图片和参考图片可以是不同的。因此,视频译码器(例如,视频编码器200或视频解码器300)可以计算新的距离(基于poc)。视频译码器可以基于这两个poc距离来对运动矢量进行缩放。对于空间相邻候选,针对两个运动矢量的包含图片是相同的,而参考图片是不同的。当执行hevc时,视频译码器可以对用于空间和时间相邻候选的tmvp和amvp两者应用运动矢量缩放。
84.人工运动矢量候选生成:如果运动矢量候选列表不完整,则视频译码器(例如,视频编码器200或视频解码器300)可以生成人工运动矢量候选,并且在列表的末尾插入人工运动矢量候选,直到mv候选列表具有所有候选。在合并模式中,有两种类型的人工mv候选:(1)仅为b-切片导出的组合候选;(2)仅用于amvp的零候选,如果第一类型没有提供足够的人工候选的话。
85.对于已经在候选列表中并且具有必要的运动信息的每对候选,视频译码器(例如,视频编码器200或视频解码器300)可以通过参考列表0中的图片的第一候选的运动矢量与参考列表1中的图片的第二候选的运动矢量的组合来导出双向组合运动矢量候选。
86.用于候选插入的修剪过程:来自不同块的候选可能碰巧是相同的,这降低了合并/amvp候选列表的效率。视频译码器(例如,视频编码器200或视频解码器300)可以应用修剪过程来帮助防止来自不同块的候选是相同的。当应用修剪过程时,视频译码器可以将一个候选与当前候选列表中的其他候选进行比较,以在一定程度上避免插入相同的候选。为了降低复杂性,视频译码器可以仅应用有限次数的修剪过程,而不是将每个潜在的候选与所有其他现有的候选进行比较。
87.解码器侧运动矢量细化(dmvr)是解码器侧mv导出技术的变型,其避免了基于模板的细化过程。当应用dmvr时,视频译码器(例如,视频编码器200或视频解码器300)可以直接地计算由初始双预测mv(例如,如图4中的v0和v1)指向的单预测参考块(表示为i0(x+v0)和i1(x+v1),并且x为当前块内的像素的坐标)之间的双边匹配成本。
88.图4是示出双边模板匹配的概念图。在图4的示例中,当前图片180包括当前块182。当前块182具有l0运动矢量,该l0运动矢量指示与过去参考图片186中的区域184(表示为ref.0(参考0))相对应的位置。当前块182还具有l1运动矢量,该l1运动矢量指示与未来参考图片190中的区域188相对应的位置。视频译码器(例如,视频编码器或视频解码器)基于围绕初始双预测mv的预定义5
×
5搜索范围内的双边匹配来执行局部搜索。按照从5
×
5窗口的左上方开始的光栅扫描顺序,dmvr过程找到最佳增量mv(即,δ)。最佳增量mv是导致最低双边匹配成本的增量mv,其中成本函数被定义为i0(x+v0+δ)与i1(x+v1-δ)之间的失真。增量mv是元组,其包括x和y值,该x和y值被添加到双预测mv的x和y值中或从双预测mv的x和y值中被减去。最佳增量mv可以用δ*来表示。vvc草案7中使用的失真函数是绝对差之和(sad)。
89.然后,视频译码器(例如,视频编码器200或视频解码器300)可以再次以亚像素精度来细化输出mv对(表示为v0+δ*和v1-δ*,其中δ*是预定义5
×
5窗口内的优化的δ)。视频译码器可以用所得mv对来替代合并块的原始mv(v
0(0)
和v
1(0)
)。然后,视频译码器可以基于经细化的mv来执行运动补偿。因此,在图4的示例中,视频译码器可以确定与由经细化的mv
对所指示的位置ref0’和ref1’相对应的区域192和194。
90.2019年7月3至12日,瑞典哥德堡举行的itu-t sg 16wp 3和iso/iec jtc 1/sc 29/wg 11的联合视频专家小组(jvet)的第15次会议(jvet-o2001-ve)上,bross等人的“versatile video coding(draft 6)(多功能视频译码(草案6))”(在下文中简称“vvc草案6”)(vtm-6.0),在对于vvc草案6的测试模型中,如果满足以下条件中的每一个,则视频译码器(例如,视频编码器200或视频解码器300)可以对于cu应用dmvr过程:
91.·
具有双预测mv的cu级合并模式。
92.·
相对于当前图片,一个参考图片在过去,并且另一参考图片在未来。
93.·
从两个参考图片到当前图片的距离(例如,poc差)是相同的。
94.·
cu不是使用仿射模式或高级时间运动矢量预测(atmvp)合并模式来译码的。
95.·
cu具有64个以上亮度样本。
96.·
cu高度和cu宽度两者大于或等于8个亮度样本。
97.·
具有cu权重的双预测(bcw)权重索引指示相等权重。
98.·
对于当前块,未启用加权预测(wp),以及
99.·
对于当前块,没有使用组合帧间和帧内预测(ciip)模式。
100.视频译码器(例如,视频编码器200或视频解码器300)可以使用双向光流(bdof)来细化4
×
4子块级的cu中的亮度样本的双预测信号。如其名称所指示,bdof模式基于光流概念,光流概念假定物体的运动是平滑的。对于每个4
×
4的子块,视频译码器可以通过最小化l0预测样本与l1预测样本之间的差来计算运动细化(v
x
,vy)。视频译码器可以使用运动细化来调整4
×
4子块中的双预测的样本值。视频译码器可以在bdof过程中应用以下步骤。
101.视频译码器(例如,视频编码器200或视频解码器300)可以通过直接地计算两个相邻样本之间的差来计算两个预测信号的水平和垂直梯度和k=0,1,例如,
[0102][0103][0104]
其中i
(k)
(i,j)是列表k(k=0,1)中预测信号的坐标(i,j)处的样本值,并且shift1基于亮度位深度bitdepth被计算为shift1=max(2,14-bitdepth)。
[0105]
视频译码器(例如,视频编码器200或视频解码器300)可以将梯度s1、s2、s3、s5和s6的自相关和互相关计算为:
[0106]
s1=∑
(i,j)∈ω
ψ
x
(i,j)
·
ψ
x
(i,j),s3=∑
(i,j)∈ω
θ(i,j)
·
ψ
x
(i,j)
[0107][0108]
[0109]
其中
[0110][0111][0112]
θ(i,j)=(i
(1)
(i,j)>>nb)-(i
(0)
(i,j)>>nb)
[0113]
其中,ω是围绕4
×
4子块的6
×
6窗口,并且na和nb的值分别被设置为等于min(5,bitdepth-7)和min(8,bitdepth-4)。
[0114]
视频译码器(例如,视频编码器200或视频解码器300)可以使用互相关和自相关项、使用下式来导出运动细化(v
x
,vy):
[0115][0116][0117]
其中th

bio
=2
13-b
。是向下取整函数(floor function),并且
[0118]
基于运动细化和梯度,视频译码器(例如,视频编码器200或视频解码器300)可以为4
×
4子块中的每个样本计算以下调整:
[0119][0120]
视频译码器(例如,视频编码器200或视频解码器300)可以通过如下调整双预测样本来计算cu的bdof样本:
[0121]
pred
bdof
(x,y)=(i
(0)
(x,y)+i
(1)
(x,y)+b(x,y)+o
offset
)>>shift
[0122]
视频译码器(例如,视频编码器200或视频解码器300)可以选择这些值,使得bdof过程中的乘数不超过15位,并且bdof过程中的中间参数的最大位宽度保持在32位以内。
[0123]
为了导出梯度值,视频译码器(例如,视频编码器200或视频解码器300)可以在当前cu边界之外在列表k(k=0,1)中生成一些预测样本i
(k)
(i,j)。如图5所描绘的,当执行bdof时,视频译码器可以围绕cu 196的边界使用一个扩展行/列。为了控制生成边界外预测样本的计算复杂性,视频译码器可以通过直接在附近的整数位置(对坐标使用floor()操作)取参考样本而无需插值来在扩展区域(白色位置)中生成预测样本,并且正常的8抽头(tap)运动补偿插值滤波器被用于生成cu内的预测样本(灰色位置)。视频译码器可以仅在梯度计算中使用这些扩展样本值。对于bdof过程中的剩余步骤,如果需要cu边界之外的任何样本和梯度值,则视频译码器可以从其最近的邻居处填充(即,重复)样本和梯度值。
[0124]
视频译码器(例如,视频编码器200或视频解码器300)可以使用bdof来细化4
×
4子块级的cu的双预测信号。如果cu满足以下所有条件,则视频译码器可以对其应用bdof:
[0125]
·
使用“真”双预测模式来对cu进行译码,即,两个参考图片中的一个在显示顺序上位于当前图片之前,并且另一个在显示顺序上位于当前图片之后。
[0126]
·
cu不是使用仿射模式或atmvp合并模式来译码的。
[0127]
·
cu具有64个以上亮度样本。
[0128]
·
cu高度和cu宽度两者大于或等于8个亮度样本。
[0129]
·
bcw权重索引指示相等权重。
[0130]
·
对于当前cu,未启用wp。
[0131]
·
对于当前cu,没有使用ciip模式。
[0132]
在vvc工作草案7中,当执行bdof和dmvr两者时,视频译码器(例如,视频编码器200或视频解码器300)可以应用基于sad的提前终止,以减少解码器侧复杂性的平均情况。然而,当应用基于sad的提前终止时,视频译码器(例如,视频编码器200或视频解码器300)可以在bdof和/或dmvr添加相对大量的复杂性和相对少量的预测准确度的情况下应用bdof和/或dmvr。这可能增加视频译码器的总复杂性,增加成本,以及可能减慢译码过程。
[0133]
如本文所述,视频译码器(例如,视频编码器200或视频解码器300)可以确定关于当前块是否满足条件。例如,视频译码器可以提前终止具有非对称双向运动矢量的dmvr。在对于具有非对称双向mv的dmvr执行提前终止的一些示例中,如果双向运动矢量不是彼此对称的,则视频译码器可以提前终止dmvr。也就是说,视频译码器可以基于双向运动矢量是否对称(或接近对称)来提前终止,以帮助避免在bdof和/或dmvr添加相对大量的复杂性和相对少量的预测准确度的情况下应用bdof和/或dmvr。在一些示例中,视频译码器可以基于双向运动矢量的绝对值是否小(即,小于阈值)来提前终止,以帮助避免在bdof和/或dmvr添加相对大量的复杂性和相对少量的预测准确度的情况下应用bdof和/或dmvr。以这种方式,视频译码器可以提前终止对当前块的双向运动矢量应用运动矢量细化过程,这可以潜在地减少解码器侧复杂性的平均情况。
[0134]
以下是其中视频译码器可以根据本公开的技术提前终止dmvr的示例条件的非排他性列表。
[0135]
如果mvl0x≠-1*mvl1x且mvl0y≠-1*mvl1y,则视频译码器(例如,视频编码器200或视频解码器300)可以提前终止dmvr过程。在本公开中,mvl0x表示l0运动矢量的x分量,mvl0y表示l0运动矢量的y分量,mvl1x表示l1运动矢量的x分量,以及mvl1y表示l1运动矢量的y分量。换句话说,视频译码器(例如,视频编码器200或视频解码器300)可以基于mvl0x不
等于-1*mvl1x且mvl0y不等于-1*mvl1y来确定关于当前块满足条件(例如,提前终止条件),其中mvl0x是当前块的双向运动矢量的列表0运动矢量的x分量,mvl1x是当前块的双向运动矢量的列表1运动矢量的x分量,mvl0y是当前块的双向运动矢量的列表0运动矢量的y分量,以及mvl1y是当前块的双向运动矢量的列表1运动矢量的y分量。
[0136]
如果mvl0x≠-1*mvl1x或mvl0y≠-1*mvl1y,则视频译码器(例如,视频编码器200或视频解码器300)可以提前终止dmvr过程。作为一个示例,视频译码器(例如,视频编码器200或视频解码器300)可以基于mvl0x不等于-1*mvl1x或mvl0y不等于-1*mvl1y来确定关于当前块满足条件(例如,提前终止条件),其中mvl0x是当前块的双向运动矢量的列表0运动矢量的x分量,mvl1x是当前块的双向运动矢量的列表1运动矢量的x分量,mvl0y是当前块的双向运动矢量的列表0运动矢量的y分量,以及mvl1y是当前块的双向运动矢量的列表1运动矢量的y分量。
[0137]
如果对于范围从-n到n的所有δx和δy,mvl0x≠-1*(mvl1x+δx)且mvl0y≠-1*(mvl1y+δy),则视频译码器(例如,视频编码器200或视频解码器300)可以提前终止dmvr过程,其中n可以是在位流中发信号通知的序列级、图片级、子图片级、图块级或切片级数字或预定义的恒定整数。例如,δx和δy两者可以是32(即,如果mv存储精度为1/16像素,则在空间距离上为2个像素),因此如果δx∈{-32,

,32}和δy∈{-32,

,32}中的全部满足mvl0x≠-1*(mvl1x+δx)和mvl0y≠-1*(mvl1y+δy),则dmvr可以被提前终止。换句话说,视频译码器(例如,视频编码器200或视频解码器300)可以基于对于范围从-n到n的所有δx和δy,mvl0x不等于-1*(mvl1x+δx)且mvl0y不等于-1*(mvl1y+δy)来确定关于当前块满足条件(例如,提前终止条件),其中mvl0x是当前块的双向运动矢量的列表0运动矢量的x分量,mvl1x是当前块的双向运动矢量的列表1运动矢量的x分量,mvl0y是当前块的双向运动矢量的列表0运动矢量的y分量,mvl1y是当前块的双向运动矢量的列表1运动矢量的y分量,以及n是在位流中发信号通知的序列级、图片级、子图片级、图块级或切片级数字或预定义的恒定整数。
[0138]
如果对于范围从-n到n的所有δx和δy,mvl0x≠-1*(mvl1x+δx)或mvl0y≠-1*(mvl1y+δy),则视频译码器(例如,视频编码器200或视频解码器300)可以提前终止dmvr过程,其中n可以是在位流中发信号通知的序列级、图片级、子图片级、图块级或切片级数字或预定义的恒定整数。例如,δx和δy两者可以是32(即,如果mv存储精度为1/16像素,则在空间距离上为2个像素),因此如果δx∈{-32,

,32}和δy∈{-32,

,32}中的全部满足mvl0x≠-1*(mvl1x+δx)或mvl0y≠-1*(mvl1y+δy),则dmvr可以被提前终止。换句话说,视频译码器(例如,视频编码器200或视频解码器300)可以基于对于范围从-n到n的所有δx和δy,mvl0x不等于-1*(mvl1x+δx)或mvl0y不等于-1*(mvl1y+δy)来确定关于当前块满足条件(例如,提前终止条件),其中mvl0x是当前块的双向运动矢量的列表0运动矢量的x分量,mvl1x是当前块的双向运动矢量的列表1运动矢量的x分量,mvl0y是当前块的双向运动矢量的列表0运动矢量的y分量,mvl1y是当前块的双向运动矢量的列表1运动矢量的y分量,以及n是在位流中发信号通知的序列级、图片级、子图片级、图块级或切片级数字或预定义的恒定整数。
[0139]
如果mv的长度彼此不同,则视频译码器(例如,视频编码器200或视频解码器300)可以提前终止dmvr过程。所述长度的定义是运动矢量的p范数,其中p可以是任何非负整数。
换句话说,视频译码器(例如,视频编码器200或视频解码器300)可以基于当前块的双向运动矢量的长度彼此不同来确定关于当前块满足条件(例如,提前终止条件)。然而,基于关于第二当前块不满足条件,视频译码器可以对第二块的双向运动矢量应用运动矢量细化过程,以确定第二块的经细化的双向运动矢量,并且基于第二块的经细化的双向运动矢量来确定针对第二块的预测块。
[0140]
如果mv的p范数彼此完全不同,则视频译码器(例如,视频编码器200或视频解码器300)可以提前终止dmvr过程。具体地,如果双向mv的相应的p范数之间的绝对差落入给定阈值n(预定义的或以序列级、图片级、子图片级、图块级、切片级或ctu级发信号通知的)之外,则dmvr可以被提前终止。换句话说,视频译码器(例如,视频编码器200或视频解码器300)可以基于当前块的双向运动矢量的p范数(例如,长度)之间的差大于阈值来确定关于当前块满足条件(例如,提前终止条件)。
[0141]
如果mv的p范数并非彼此完全不同,则视频译码器(例如,视频编码器200或视频解码器300)可以提前终止dmvr过程。具体地,如果双向mv的相应的p范数之间的绝对差落入给定阈值n(预定义的或以序列级、图片级、子图片级、图块级、切片级或ctu级发信号通知的)之内,则dmvr可以被提前终止。换句话说,视频译码器(例如,视频编码器200或视频解码器300)可以基于当前块的双向运动矢量的p范数(例如,长度)之间的差小于阈值来确定关于当前块满足条件(例如,提前终止条件)。
[0142]
注意到,在一些实施例中,视频译码器(例如,视频编码器200或视频解码器300)可以应用用于dmvr过程的上述提前终止技术以提前终止bdof过程。
[0143]
在本公开的一些示例中,视频译码器(例如,视频编码器200或视频解码器300)可以对于具有小的双向mv的dmvr执行提前终止。例如,如果给定双向mv的每个分量(即,mvx和mvy)的绝对值小于给定阈值n,其中n是可以是预定义(例如1、2、3、4......)的或作为序列级、图片级、子图片级、图块级、切片级或ctu级语法元素发信号通知的整数,则视频译码器可以提前终止dmvr。具体地,对于n,如果|mvl0x|<n,|mvl0y|<n,|mvl1x|<n且|mvl1y|<n,则视频译码器可以在运动补偿阶段期间在dmvr过程开始之前终止dmvr过程。例如,可以设置n等于4,因此如果|mvl0x|<4,|mvl0y|<4,|mvl1x|<4且|mvl1y|<4,则dmvr被提前终止。在另一示例中,可以设置n等于1,因此如果mvl0x=0,mvl0y=0,mvl1x=0且mvl1y=0,则dmvr可以在运动补偿期间在其细化过程开始之前被提前终止。换句话说,视频译码器(例如,视频编码器200或视频解码器300)可以基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件(例如,提前终止条件)。
[0144]
注意到,在一些示例中,相同的提前终止方法可以应用于bdof以提前终止bdof本身。
[0145]
因此,根据本公开的示例,视频译码器(例如,视频编码器200或视频解码器300)可以确定视频数据的当前块的双向运动矢量,并且确定关于当前块是否满足条件。视频译码器可以基于关于当前块满足条件来提前终止对当前块的双向运动矢量应用运动矢量细化过程,并且基于当前块的双向运动矢量来确定针对当前块的预测块。视频译码器可以执行以下中的至少一项:基于针对当前块的预测块来重构当前块,或者基于针对当前块的预测块来生成用于当前块的残差数据。
[0146]
在本公开的一些示例中,视频译码器(例如,视频编码器200或视频解码器300)可
以使用有约束的mv细化。在此类示例中,视频译码器可以仅细化双向mv中的一个,同时保持另一个mv不变。例如,视频译码器可以确定视频数据的当前块的第一运动矢量和当前块的第二运动矢量。视频译码器可以从第一运动矢量和第二运动矢量中确定选定的运动矢量。视频译码器可以通过对选定的运动矢量应用运动矢量细化过程来生成选定运动矢量的经细化的版本。视频译码器可以基于选定的运动矢量的经细化的版本以及第一和第二运动矢量中的不是选定的初始运动矢量的那一个来确定针对当前块的预测块。视频译码器可以执行基于针对当前块的预测块来重构当前块或者基于针对当前块的预测块来生成用于当前块的残差数据中的至少一项。
[0147]
当执行dmvr时,视频编码器200可以指定是否要细化mvl0或mvl1并且保持另一个不变。视频编码器200可以通过使用序列级、图片级、子图片级、图块级、切片级、ctu级或cu级标志来指示要细化两个mv中的哪一个。换句话说,视频编码器(例如,视频编码器200)可以将指示当前块的第一运动矢量或当前块的第二运动矢量是选定的运动矢量的一个或多个语法元素包括在包括视频数据的经编码的表示的位流中。在一些示例中,视频解码器(例如,视频解码器300)可以基于在包括视频数据的经编码的表示的位流中发信号通知的一个或多个语法来确定当前块的第一运动矢量或当前块的第二运动矢量中的哪一个是选定的运动矢量。
[0148]
当应用dmvr时,视频译码器(例如,视频编码器200或视频解码器300)可以基于运动矢量的长度来确定mvl0和mvl1中的哪一个是要被细化的那一个。换句话说,视频译码器(例如,视频编码器200或视频解码器300)可以基于当前块的第一运动矢量和当前块的第二运动矢量的长度来确定选定的运动矢量。所述长度的定义是运动矢量的p范数(例如,长度),其中p可以是任何非负整数。在一些示例中,视频译码器可以细化具有较长长度的mv,同时保持另一个不变。在另一示例中,视频译码器可以细化具有较短长度的mv,同时保持另一个不变。
[0149]
当应用dmvr时,视频译码器(例如,视频编码器200或视频解码器300)可以基于mvl0和mvl1的对称性来确定它们中的哪一个是要被细化的那一个。换句话说,视频译码器可以确定选定的运动矢量,包括基于当前块的第一运动矢量和当前块的第二运动矢量的对称性来确定选定的运动矢量。
[0150]
当双向mv中的两个彼此不对称(例如,mvl0不等于-1*mvl1)时,视频译码器(例如,视频编码器200或视频解码器300)可以细化具有较短(或在另一个实施例中较长)长度的mv,同时保持另一个不变;否则如果mvl0等于-1*mvl1,则两个mv都被细化。换句话说,视频译码器可以基于当前块的第一运动矢量和当前块的第二运动矢量彼此不对称来选择当前块的第一运动矢量和当前块的第二运动矢量中较短的那一个作为选定的运动矢量。
[0151]
当应用dmvr时,视频译码器(例如,视频编码器200或视频解码器300)可以基于mvl0和mvl1的对称性来确定它们中的哪一个是要被细化的那一个。换句话说,视频译码器可以基于当前块的第一运动矢量和当前块的第二运动矢量对称来作出确定,以确定选定的运动矢量。当双向mv中的两个并非彼此完全对称时,视频译码器可以细化具有较短(或在另一实施例中较长)长度的mv,同时保持另一个不变;否则,两个mv都被细化。当应用dmvr时,视频译码器可以基于对于范围从-n到n的所有δx和δy,mvl0≠-1*(mvl1+(δx,δy)),其中n可以是在位流中发信号通知的序列级、图片级、子图片级、图块级或切片级数字或预定
义的恒定整数,来确定双向mv中的两个是否并非彼此完全对称。换句话说,视频译码器可以基于对于范围从-n到n的所有δx和δy,mvl0x≠-1*(mvl1+(δx,δy))来作出确定,以确定选定的运动矢量,其中n是在位流中发信号通知的序列级、图片级、子图片级、图块级、切片级数字或预定义的恒定整数。
[0152]
注意到,在本公开的一些示例中,视频译码器(例如,视频编码器200或视频解码器300)可以对bdof过程应用相同的提前终止和/或选择mv中的一个来细化。
[0153]
因此,根据本公开的一个或多个示例,视频译码器(例如,视频编码器200或视频解码器300)可以确定视频数据的当前块的双向运动矢量。视频译码器可以确定关于当前块是否满足条件。例如,视频译码器可以基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件。视频译码器可以基于关于当前块满足条件来提前终止对当前块的双向运动矢量应用运动矢量细化过程。视频译码器可以基于当前块的双向运动矢量来确定针对当前块的预测块。视频译码器可以基于针对当前块的预测块来重构当前块和/或基于针对当前块的预测块来生成用于当前块的残差数据。
[0154]
图6是示出可以执行本公开的技术的示例视频编码器200的框图。图6是出于解释的目的而提供的,并且不应被认为是对如本公开广泛例示和描述的技术的限制。出于解释的目的,本公开在视频译码标准(诸如hevc视频译码标准和正在开发的h.266视频译码标准)的背景下描述了视频编码器200。然而,本公开的技术不限于这些视频译码标准,并且通常适用于视频编码和解码。
[0155]
在图6的示例中,视频编码器200包括视频数据存储器230、模式选择单元202、残差生成单元204、变换处理单元206、量化单元208、逆量化单元210、逆变换处理单元212、重构单元214、滤波器单元216、经解码图片缓冲器(dpb)218和熵编码单元220。视频数据存储器230、模式选择单元202、残差生成单元204、变换处理单元206、量化单元208、逆量化单元210、逆变换处理单元212、重构单元214、滤波器单元216、dpb 218和熵编码单元220中的任何一个或全部可以被实施在一个或多个处理器或处理电路中。此外,视频编码器200可以包括附加的或替代的处理器或处理电路,以执行这些和其他功能。
[0156]
视频数据存储器230可以存储要由视频编码器200的组件编码的视频数据。视频编码器200可以从例如视频源104(图1)接收存储在视频数据存储器230中的视频数据。dpb 218可以充当存储参考视频数据以供视频编码器200在后续视频数据的预测中使用的参考图片存储器。视频数据存储器230和dpb 218可以由多种存储器设备中的任何一种形成,诸如动态随机存取存储器(dram),包括同步dram(sdram)、磁阻ram(mram)、电阻ram(rram)或其他类型的存储器设备。视频数据存储器230和dpb 218可以由同一存储器设备或分开的存储器设备提供。在各种示例中,视频数据存储器230可以与视频编码器200的其他组件一起在芯片上,如所示出的,或者相对于那些组件在芯片外。
[0157]
在本公开中,对视频数据存储器230的引用不应被解释为限于视频编码器200内部的存储器,除非具体描述如此,或者限于视频编码器200外部的存储器,除非具体描述如此。而是,对视频数据存储器230的引用应被理解为存储视频编码器200接收以用于编码的视频数据(例如,用于要被编码的当前块的视频数据)的参考存储器。图1的存储器106还可以提供来自视频编码器200的各种单元的输出的临时存储。
[0158]
示出了图6的各种单元,以帮助理解由视频编码器200执行的操作。这些单元可以
被实施为固定功能电路、可编程电路或它们的组合。固定功能电路指提供特定功能性并且预设可执行的操作的电路。可编程电路指可以被编程为执行各种任务并且在可以被执行的操作中提供灵活功能性的电路。例如,可编程电路可以执行使可编程电路按由软件或固件的指令定义的方式操作的软件或固件。固定功能电路可以执行软件指令(例如,以接收参数或输出参数),但是固定功能电路执行的操作的类型通常是不变的。在一些示例中,一个或多个单元可以是不同的电路块(固定功能的或可编程的),并且在一些示例中,一个或多个单元可以是集成电路。
[0159]
视频编码器200可以包括由可编程电路形成的算术逻辑单元(alu)、初等函数单元(efu)、数字电路、模拟电路和/或可编程核心。在使用由可编程电路执行的软件来执行视频编码器200的操作的示例中,存储器106(图1)可以存储视频编码器200接收和执行的软件的指令(例如,目标代码),或者视频编码器200内的另一存储器(未示出)可以存储此类指令。
[0160]
视频数据存储器230被配置为存储接收到的视频数据。视频编码器200可以从视频数据存储器230中取得视频数据的图片,并且向残差生成单元204和模式选择单元202提供视频数据。视频数据存储器230中的视频数据可以是要被编码的原始视频数据。
[0161]
模式选择单元202包括运动估计单元222、运动补偿单元224和帧内预测单元226。模式选择单元202可以包括根据其他预测模式来执行视频预测的附加功能单元。作为示例,模式选择单元202可以包括调色板单元、帧内块复制单元(其可以是运动估计单元222和/或运动补偿单元224的一部分)、仿射单元、线性模型(lm)单元等。在图6的示例中,运动补偿单元224包括运动细化单元225。
[0162]
模式选择单元202通常协调多个编码过程,以测试编码参数的组合以及用于这些组合的所得率失真值。编码参数可以包括ctu到cu的分割、用于cu的预测模式、用于cu的残差数据的变换类型、用于cu的残差数据的量化参数等。模式选择单元202可以最终选择具有比其他测试组合更好的率失真值的编码参数的组合。
[0163]
视频编码器200可以将从视频数据存储器230中取得的图片分割成一系列的ctu,并且将一个或多个ctu封装在切片内。模式选择单元202可以根据树结构(诸如上述hevc的四叉树结构或qtbt结构)来分割图片的ctu。如上所述,视频编码器200可以通过根据树结构分割ctu来形成一个或多个cu。此cu通常也可以被称为“视频块”或“块”。
[0164]
通常,模式选择单元202还控制其组件(例如,运动估计单元222、运动补偿单元224和帧内预测单元226)以生成针对当前块(例如,当前cu,或者在hevc中,pu和tu的重叠部分)的预测块。对于当前块的帧间预测,运动估计单元222可以执行运动搜索以标识一个或多个参考图片(例如,存储在dpb 218中的一个或多个先前经译码的图片)中的一个或多个紧密匹配的参考块。具体地,运动估计单元222可以例如根据绝对差之和(sad)、平方差之和(ssd)、平均绝对差(mad)、均方差(msd)等来计算表示潜在参考块与当前块有多类似的值。运动估计单元222通常可以使用当前块与所考虑的参考块之间的逐样本差来执行这些计算。运动估计单元222可以标识具有从这些计算得到的最低值的参考块,从而指示最紧密匹配当前块的参考块。
[0165]
运动估计单元222可以形成一个或多个运动矢量(mv),该一个或多个mv定义参考图片中的参考块相对于当前图片中的当前块的位置的位置。运动估计单元222然后可以向运动补偿单元224提供运动矢量。例如,对于单向帧间预测,运动估计单元222可以提供单个
运动矢量,而对于双向帧间预测,运动估计单元222可以提供两个运动矢量。运动补偿单元224然后可以使用运动矢量来生成预测块。例如,运动补偿单元224可以使用运动矢量来取得参考块的数据。作为另一示例,如果运动矢量具有分数样本精度,则运动补偿单元224可以根据一个或多个插值滤波器来插值用于预测块的值。此外,对于双向帧间预测,运动补偿单元224可以取得由相应运动矢量标识的用于两个参考块的数据,并且例如通过逐样本平均或加权平均来组合所取得的数据。
[0166]
运动补偿单元224的运动细化单元225可以使用运动细化过程(诸如,例如bdof过程和/或dmvr过程)来生成预测块。bdof过程和dmvr过程的示例在本公开别处进行描述。运动细化单元225可以检查一个或多个提前终止条件。如果不满足一个或多个提前终止条件,则运动细化单元225可以继续应用运动矢量细化过程(例如,bdof过程和/或dmvr过程)以生成预测块。否则,如果满足提前终止条件,则运动细化单元225可以在不使用运动矢量细化过程的应用(例如,提前终止应用运动矢量细化过程)的情况下生成预测块。在本公开的一些示例中,相对于vvc草案7中阐述的提前终止条件,对一个或多个提前终止条件进行修改。具体地,作为一个示例,针对bdof和dmvr两者的提前终止条件应用基于绝对差值之和(基于sad)的提前终止,以减少解码器侧复杂性的平均情况,而不考虑双向运动矢量是否对称(或接近对称)或者双向运动矢量的绝对值是否小(即,小于阈值)。因此,在一些示例中,即使当双向运动矢量对称(或接近对称)时和/或当双向运动矢量的绝对值很小时,运动细化单元225也可以执行运动矢量细化过程的应用。
[0167]
作为另一示例,对于帧内预测或帧内预测译码,帧内预测单元226可以从与当前块相邻的样本生成预测块。例如,对于方向模式,帧内预测单元226通常可以在数学上组合相邻样本的值,并且跨越当前块在所定义的方向上填充这些计算出来的值,以产生预测块。作为另一示例,对于dc模式,帧内预测单元226可以计算与当前块相邻的样本的平均值,并且生成预测块以对于预测块的每个样本包括该所得平均值。
[0168]
模式选择单元202向残差生成单元204提供预测块。残差生成单元204从视频数据存储器230接收当前块的原始的、未经编码的版本,并且从模式选择单元202接收预测块。残差生成单元204计算当前块与预测块之间的逐样本差。所得逐样本差定义针对当前块的残差块。在一些示例中,残差生成单元204还可以确定残差块中的样本值之间的差,以使用残差差分脉冲译码调制(rdpcm)来生成残差块。在一些示例中,残差生成单元204可以使用执行二进制减法的一个或多个减法器电路来形成。
[0169]
在模式选择单元202将cu分割成pu的示例中,每个pu可以与亮度预测单元和对应的色度预测单元相关联。视频编码器200和视频解码器300可以支持具有各种大小的pu。如上所指示,cu的大小可以指cu的亮度译码块的大小,并且pu的大小可以指pu的亮度预测单元的大小。假定特定cu的大小为2n
×
2n,那么视频编码器200可以支持用于帧内预测的2n
×
2n或n
×
n的pu大小,以及用于帧间预测的2n
×
2n、2n
×
n、n
×
2n、n
×
n等的对称pu大小。视频编码器200和视频解码器300还可以支持对用于帧间预测的2n
×
nu、2n
×
nd、nl
×
2n和nr
×
2n的pu大小的非对称分割。
[0170]
在模式选择单元202没有进一步将cu分割成pu的示例中,每个cu可以与亮度译码块和对应的色度译码块相关联。同上,cu的大小可以指cu的亮度译码块的大小。视频编码器200和视频解码器300可以支持2n
×
2n、2n
×
n或n
×
2n的cu大小。
[0171]
对于其它视频译码技术,作为少数示例,诸如帧内块复制模式译码、仿射模式译码和线性模型(lm)模式译码,模式选择单元202经由与译码技术相关联的相应单元,生成针对正被编码的当前块的预测块。在一些示例中,诸如调色板模式译码,模式选择单元202可以不生成预测块,而是生成指示基于选定的调色板来重构块的方式的语法元素。在此类模式中,模式选择单元202可以将这些语法元素提供给熵编码单元220进行编码。
[0172]
如上所述,残差生成单元204接收针对当前块和对应的预测块的视频数据。残差生成单元204然后生成针对当前块的残差块。为了生成残差块,残差生成单元204计算预测块与当前块之间的逐样本差。
[0173]
变换处理单元206对残差块应用一个或多个变换,以生成变换系数的块(本文中被称为“变换系数块”)。变换处理单元206可以对残差块应用各种变换,以形成变换系数块。例如,变换处理单元206可以对残差块应用离散余弦变换(dct)、方向变换、卡洛南-洛伊变换(klt)或概念上类似的变换。在一些示例中,变换处理单元206可以对残差块执行多个变换,例如初级变换和次级变换,诸如旋转变换。在一些示例中,变换处理单元206不对残差块应用变换。
[0174]
量化单元208可以量化变换系数块中的变换系数,以产生经量化的变换系数块。量化单元208可以根据与当前块相关联的量化参数(qp)值来量化变换系数块的变换系数。视频编码器200(例如,经由模式选择单元202)可以通过调整与cu相关联的qp值来调整应用于与当前块相关联的变换系数块的量化程度。量化可能引入信息损失,并且因此,经量化的变换系数可能具有比由变换处理单元206产生的原始变换系数更低的精度。
[0175]
逆量化单元210和逆变换处理单元212可以对经量化的变换系数块分别应用逆量化和逆变换,以从变换系数块中重构残差块。重构单元214可以基于经重构的残差块和由模式选择单元202生成的预测块来产生与当前块相对应的经重构的块(尽管可能具有一定程度的失真)。例如,重构单元214可以将经重构的残差块的样本添加到来自由模式选择单元202生成的预测块的对应样本中,以产生经重构的块。
[0176]
滤波器单元216可以对经重构的块执行一个或多个滤波操作。例如,滤波器单元216可以执行去块操作来减少沿cu边缘的块效应伪影。滤波器单元216的操作可以在一些示例中跳过。
[0177]
视频编码器200将经重构的块存储在dpb 218中。例如,在不需要滤波器单元216的操作的示例中,重构单元214可以将经重构的块存储到dpb 218。在需要滤波器单元216的操作的示例中,滤波器单元216可以将滤波后的经重构的块存储到dpb 218。运动估计单元222和运动补偿单元224可以从dpb218中取得由经重构(并且可能的滤波后)的块形成的参考图片,以对随后经编码的图片的块进行帧间预测。另外,帧内预测单元226可以使用当前图片的dpb 218中的经重构的块来对当前图片中的其他块进行帧内预测。
[0178]
通常,熵编码单元220可以对从视频编码器200的其他功能组件接收的语法元素进行熵编码。例如,熵编码单元220可以对来自量化单元208的经量化的变换系数块进行熵编码。作为另一示例,熵编码单元220可以对来自模式选择单元202的预测语法元素(例如,用于帧间预测的运动信息或用于帧内预测的帧内模式信息)进行熵编码。熵编码单元220可以对作为视频数据的另一示例的语法元素执行一个或多个熵编码操作,以生成经熵编码的数据。例如,熵编码单元220可以对数据执行上下文自适应可变长度译码(cavlc)操作、cabac
操作、可变到可变(v2v)长度译码操作、基于语法的上下文自适应二进制算术译码(sbac)操作、概率区间分割熵(pipe)译码操作、指数哥伦布编码操作或另一种类型的熵编码操作。在一些示例中,熵编码单元220可以在旁路模式中操作。
[0179]
视频编码器200可以输出位流,该位流包括重构切片或图片的块所需的经熵编码的语法元素。具体地,熵编码单元220可以输出位流。
[0180]
上述操作是相对于块来描述的。此描述应当被理解为用于亮度译码块和/或色度译码块的操作。如上所述,在一些示例中,亮度译码块和色度译码块是cu的亮度分量和色度分量。在一些示例中,亮度译码块和色度译码块是pu的亮度分量和色度分量。
[0181]
在一些示例中,对于色度译码块,不需要重复相对于亮度译码块执行的操作。作为一个示例,标识针对亮度译码块的运动矢量(mv)和参考图片的操作不需要被重复用于标识针对色度块的mv和参考图片。而是,针对亮度译码块的mv可以被缩放以确定针对色度块的mv,并且参考图片可以是相同的。作为另一示例,对于亮度译码块和色度译码块,帧内预测过程可以是相同的。
[0182]
视频编码器200表示被配置为对视频数据进行编码的设备的示例,其包括被配置为存储视频数据的存储器,以及被实施在电路中并且被配置为确定视频数据的当前块的双向运动矢量的一个或多个处理单元。一个或多个处理单元可以基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件。一个或多个处理单元可以基于关于当前块满足条件来提前终止对当前块的双向运动矢量应用运动矢量细化过程。一个或多个处理单元可以基于当前块的双向运动矢量来确定针对当前块的预测块。一个或多个处理单元可以基于针对当前块的预测块来重构当前块,和/或基于针对当前块的预测块来生成用于当前块的残差数据。
[0183]
图7是示出可以执行本公开的技术的示例视频解码器300的框图。图7是出于解释的目的而提供的,并且不限制如本公开广泛例示和描述的技术。出于解释的目的,本公开根据vvc和hevc的技术描述了视频解码器300。然而,本公开的技术可以由被配置为其他视频译码标准的视频译码设备来执行。
[0184]
在图7的示例中,视频解码器300包括经译码的图片缓冲器(cpb)存储器320、熵解码单元302、预测处理单元304、逆量化单元306、逆变换处理单元308、重构单元310、滤波器单元312和经解码图片缓冲器(dpb)314。cpb存储器320、熵解码单元302、预测处理单元304、逆量化单元306、逆变换处理单元308、重构单元310、滤波器单元312和dpb 314中的任何一个或全部可以被实施在一个或多个处理器中或处理电路中。此外,视频解码器300可以包括附加的或替代的处理器或处理电路,以执行这些和其他功能。
[0185]
预测处理单元304包括运动补偿单元316和帧内预测单元318。预测处理单元304可以包括附加单元,以根据其他预测模式来执行预测。作为示例,预测处理单元304可以包括调色板单元、帧内块复制单元(其可以形成运动补偿单元316的一部分)、仿射单元、线性模型(lm)单元等。在其他示例中,视频解码器300可以包括更多、更少或不同的功能组件。在图7的示例中,运动补偿单元316可以包括运动细化单元317。
[0186]
cpb存储器320可以存储要由视频解码器300的组件解码的视频数据,诸如经编码的视频位流。存储在cpb存储器320中的视频数据可以例如从计算机可读介质110(图1)获得。cpb存储器320可以包括存储来自经编码的视频位流的经编码的视频数据(例如,语法元
素)的cpb。同样,cpb存储器320可以存储除经译码的图片的语法元素之外的视频数据,诸如表示来自视频解码器300的各种单元的输出的临时数据。dpb 314通常存储经解码的图片,视频解码器300可以在对经编码视频位流的后续数据或图片进行解码时输出该经解码的图片和/或将该经解码的图片用作参考视频数据。cpb存储器320和dpb 314可以由多种存储器设备中的任何一种形成,诸如dram,包括sdram、mram、rram或其他类型的存储器设备。cpb存储器320和dpb 314可以由同一存储器设备或分离的存储器设备提供。在各种示例中,cpb存储器320可以与视频解码器300的其他组件一起在芯片上,或者相对于那些组件在芯片外。
[0187]
附加地或可替代地,在一些示例中,视频解码器300可以从存储器120(图1)中取得经译码的视频数据。也就是说,存储器120可以存储如上面关于cpb存储器320所讨论的数据。同样地,存储器120可以在视频解码器300的一些或所有功能性被实施在要由视频解码器300的处理电路执行的软件中时存储要由视频解码器300执行的指令。
[0188]
示出了图7中示出的各种单元,以帮助理解由视频解码器300执行的操作。这些单元可以被实施为固定功能电路、可编程电路或它们的组合。类似于图6,固定功能电路指提供特定功能性并且预设可执行的操作的电路。可编程电路指可以被编程为执行各种任务并且在可以被执行的操作中提供灵活功能性的电路。例如,可编程电路可以执行使可编程电路按由软件或固件的指令定义的方式操作的软件或固件。固定功能电路可以执行软件指令(例如,以接收参数或输出参数),但是固定功能电路执行的操作的类型通常是不变的。在一些示例中,一个或多个单元可以是不同的电路块(固定功能的或可编程的),并且在一些示例中,一个或多个单元可以是集成电路。
[0189]
视频解码器300可以包括由可编程电路形成的alu、efu、数字电路、模拟电路和/或可编程核心。在视频解码器300的操作由在可编程电路上执行的软件来执行的示例中,片上或片外存储器可以存储视频解码器300接收和执行的软件的指令(例如,目标代码)。
[0190]
熵解码单元302可以从cpb接收经编码的视频数据,并且对视频数据进行熵解码以再现语法元素。预测处理单元304、逆量化单元306、逆变换处理单元308、重构单元310和滤波器单元312可以基于从位流中提取的语法元素来生成经解码的视频数据。
[0191]
通常,视频解码器300在逐块基础上重构图片。视频解码器300可以单个地对每个块执行重构操作(其中当前正在重构的块,即经解码的块可以被称为“当前块”)。
[0192]
熵解码单元302可以对定义经量化的变换系数块的经量化变换系数的语法元素以及变换信息(诸如量化参数(qp)和/或(多个)变换模式指示)进行熵解码。逆量化单元306可以使用与经量化的变换系数块相关联的qp来确定量化程度,并且同样地,确定供逆量化单元306应用的逆量化程度。逆量化单元306可以例如执行逐位左移操作来对经量化的变换系数进行逆量化。逆量化单元306由此可以形成包括变换系数的变换系数块。
[0193]
在逆量化单元306形成变换系数块之后,逆变换处理单元308可以对变换系数块应用一个或多个逆变换,以生成与当前块相关联的残差块。例如,逆变换处理单元308可以对变换系数块应用逆dct、逆整数变换、逆卡洛南-洛伊变换(klt)、逆旋转变换、逆方向变换或另一逆变换。
[0194]
此外,预测处理单元304根据由熵解码单元302熵解码的预测信息语法元素来生成预测块。例如,如果预测信息语法元素指示当前块是帧间预测的,则运动补偿单元316可以生成预测块。在这种情况下,预测信息语法元素可以指示从中取得参考块的dpb 314中的参
考图片、以及运动矢量,该运动矢量标识参考块在参考图片中相对于当前块在当前图片中的位置的位置。运动补偿单元316通常可以按基本上类似于相对于运动补偿单元224(图6)描述的方式来执行帧间预测过程。
[0195]
运动补偿单元316的运动细化单元317可以使用运动细化过程(诸如,例如bdof过程和/或dmvr过程)来生成预测块。bdof过程和dmvr过程的示例在本公开别处进行描述。运动细化单元317可以检查一个或多个提前终止条件。如果不满足一个或多个提前终止条件,则运动细化单元317可以继续应用运动矢量细化过程(例如,bdof过程和/或dmvr过程)以生成预测块。否则,如果满足提前终止条件,则运动细化单元317可以在不使用运动矢量细化过程的应用(例如,提前终止应用运动矢量细化过程)的情况下生成预测块。在本公开的一些示例中,相对于vvc草案7中阐述的提前终止条件,对一个或多个提前终止条件进行修改。具体地,作为一个示例,针对bdof和dmvr两者的提前终止条件应用基于绝对差值之和(基于sad)的提前终止,以减少解码器侧复杂性的平均情况,而不考虑双向运动矢量是否对称(或接近对称)或者双向运动矢量的绝对值是否小(即,小于阈值)。因此,在一些示例中,即使当双向运动矢量对称(或接近对称)时和/或当双向运动矢量的绝对值很小时,运动细化单元317也可以执行运动矢量细化过程的应用。
[0196]
作为另一示例,如果预测信息语法元素指示当前块是帧内预测的,则帧内预测单元318可以根据由预测信息语法元素指示的帧内预测模式来生成预测块。再次地,帧内预测单元318通常可以按基本上类似于相对于帧内预测单元226(图6)描述的方式来执行帧内预测过程。帧内预测单元318可以从dpb 314中取得与当前块相邻的样本的数据。
[0197]
重构单元310可以使用预测块和残差块来重构当前块。例如,重构单元310可以将残差块的样本添加到预测块的对应样本中,以重构当前块。
[0198]
滤波器单元312可以对经重构的块执行一个或多个滤波操作。例如,滤波器单元312可以执行去块操作来减少沿经重构的块的边缘的块效应伪影。不必在所有示例中执行滤波器单元312的操作。
[0199]
视频解码器300可以将经重构的块存储在dpb 314中。例如,在不执行滤波器单元312的操作的示例中,重构单元310可以将经重构的块存储到dpb 314。在执行滤波器单元312的操作的示例中,滤波器单元312可以将滤波后的经重构的块存储到dpb 314。如上所讨论,dpb 314可以向预测处理单元304提供参考信息,诸如用于帧内预测的当前图片的样本和用于后续运动补偿的经先前解码的图片。此外,视频解码器300可以输出来自dpb 314的经解码的图片(例如,经解码的视频),以供随后呈现在显示设备(诸如图1的显示设备118)上。
[0200]
以这种方式,视频解码器300表示视频解码设备的示例,其包括被配置为存储视频数据的存储器,以及被实施在电路中并且被配置为确定视频数据的当前块的双向运动矢量的一个或多个处理单元。一个或多个处理单元可以基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件。一个或多个处理单元可以基于关于当前块满足条件来提前终止对当前块的双向运动矢量应用运动矢量细化过程。一个或多个处理单元可以基于当前块的双向运动矢量来确定针对当前块的预测块。一个或多个处理单元可以基于针对当前块的预测块来重构当前块,和/或基于针对当前块的预测块来生成用于当前块的残差数据。
[0201]
图8是示出用于对当前块进行编码的示例方法的流程图。当前块可以包括当前cu。尽管相对于视频编码器200(图1和图4)进行了描述,但是应当理解的是,其他设备可以被配置为执行类似于图8的方法。
[0202]
在该示例中,视频编码器200预测当前块(350)。例如,视频编码器200可以形成针对当前块的预测块。作为预测当前块的一部分,视频编码器200可以使用本公开的技术(例如,见图10)来确定运动矢量,并且然后可以使用运动矢量来确定针对当前块的预测块。例如,视频编码器200(例如,运动估计单元222)可以确定视频数据的当前块的双向运动矢量。视频编码器200(例如,运动细化单元225)可以确定关于当前块是否满足条件。例如,视频编码器200(例如,运动细化单元225)可以基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件。基于关于当前块满足条件,视频编码器200(例如,运动细化单元225)可以提前终止对当前块的双向运动矢量应用运动矢量细化过程。例如,视频编码器200(例如,运动补偿单元224)可以避免应用或绕过dmvr和/或bdof。视频编码器200(例如,运动补偿单元224)可以基于当前块的双向运动矢量来确定针对当前块的预测块。
[0203]
在一些示例中,视频编码器200可以确定视频数据的当前块的第一运动矢量和当前块的第二运动矢量;从第一运动矢量和第二运动矢量中确定选定的运动矢量;通过对选定的运动矢量应用运动矢量细化过程来生成选定的运动矢量的经细化的版本;以及基于选定的运动矢量的经细化的版本以及第一和第二运动矢量中的不是选定的初始运动矢量的那一个来确定针对当前块的预测块。
[0204]
视频编码器200然后可以计算针对当前块的残差块(352)。为了计算残差块,视频编码器200可以计算原始的、未经编码的块与针对当前块的预测块之间的差。视频编码器200然后可以对残差块的变换系数进行变换和量化(354)。接下来,视频编码器200可以扫描残差块的经量化的变换系数(356)。在扫描期间或扫描之后,视频编码器200可以对变换系数进行熵编码(358)。例如,视频编码器200可以使用cavlc或cabac来对变换系数进行编码。视频编码器200然后可以输出块的经熵编码的数据(360)。
[0205]
图9是示出用于对视频数据的当前块进行解码的示例方法的流程图。当前块可以包括当前cu。尽管相对于视频解码器300(图1和图3)进行了描述,但是应当理解的是,其他设备可以被配置为执行类似于图9的方法。
[0206]
视频解码器300可以接收用于当前块的经熵编码的数据,诸如用于与当前块相对应的残差块的变换系数的经熵编码的数据和经熵编码的预测信息(370)。视频解码器300可以对经熵编码的数据进行熵解码,以确定用于当前块的预测信息和再现残差块的变换系数(372)。
[0207]
视频解码器300可以例如使用如用于当前块的预测信息所指示的帧内或帧间预测模式来预测当前块(374),以计算针对当前块的预测块。作为预测当前块的一部分,视频解码器300可以使用本公开的技术(例如,见图10)来确定运动矢量,并且然后可以使用运动矢量来确定针对当前块的预测块。例如,视频解码器300(例如,预测处理单元304)可以确定视频数据的当前块的双向运动矢量。视频解码器300(例如,运动细化单元317)可以确定关于当前块是否满足条件。例如,视频编码器200(例如,运动细化单元317)可以基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件。基于关于当前块满足条件,视频解码器300(例如,运动细化单元317)可以提前终止对当前块的双向运动矢量应用运动
矢量细化过程。例如,视频解码器300(例如,运动补偿单元316)可以避免应用或绕过dmvr和/或bdof。视频解码器300(例如,运动补偿单元316)可以基于当前块的双向运动矢量来确定针对当前块的预测块。
[0208]
在一些示例中,视频解码器300可以确定视频数据的当前块的第一运动矢量和当前块的第二运动矢量;从第一运动矢量和第二运动矢量中确定选定的运动矢量;通过对选定的运动矢量应用运动矢量细化过程来生成选定的运动矢量的经细化的版本;以及基于选定的运动矢量的经细化的版本以及第一和第二运动矢量中的不是选定的初始运动矢量的那一个来确定针对当前块的预测块。
[0209]
视频解码器300然后可以逆扫描再现的变换系数(376),以创建经量化的变换系数的块。视频解码器300然后可以对变换系数进行逆量化和逆变换,以产生残差块(378)。视频解码器300可以通过组合预测块和残差块来最终对当前块进行解码(380)。
[0210]
图10是示出可以由视频译码器根据本公开的一个或多个技术执行的示例方法的流程图。图10的方法可以由视频编码器200或视频解码器300来执行。
[0211]
在图10的示例中,视频译码器(例如,视频编码器200的运动细化单元225或视频解码器300的运动细化单元317)可以确定视频数据的当前块的双向运动矢量(402)。视频译码器可以确定关于当前块是否满足条件(404)。例如,视频译码器可以基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件。
[0212]
基于关于当前块满足条件,视频译码器(例如,视频编码器200的运动细化单元225或视频解码器300的运动细化单元317)可以提前终止对当前块的双向运动矢量应用运动矢量细化过程(406)。例如,视频译码器可以响应于关于当前块满足条件来避免或绕过对当前块的双向运动矢量应用运动矢量细化过程。
[0213]
视频译码器(例如,视频编码器200的运动细化单元225或视频解码器300的运动细化单元317)可以基于当前块的双向运动矢量来确定针对当前块的预测块(408)。例如,视频译码器可以基于绕过应用运动矢量细化过程的当前块的双向运动矢量来确定针对当前块的预测块。
[0214]
视频译码器(例如,视频编码器200的运动细化单元225或视频解码器300的运动细化单元317)可以基于针对当前块的预测块来重构当前块,和/或视频编码器(例如,视频编码器200的运动细化单元225)可以基于针对当前块的预测块来生成用于当前块的残差数据(410)。
[0215]
以下是根据本公开的一个或多个技术的示例的非限制性列表。
[0216]
条款1.一种对视频数据进行译码的方法,该方法包括:确定视频数据的当前块的双向运动矢量;确定关于当前块是否满足条件;基于关于当前块满足条件来提前终止对当前块的双向运动矢量应用运动矢量细化过程;基于当前块的双向运动矢量来确定针对当前块的预测块;以及执行以下中的至少一项:基于针对当前块的预测块来重构当前块,或基于针对当前块的预测块来生成用于当前块的残差数据。
[0217]
条款2.根据条款1的方法,其中,当前块是第一块,并且该方法还包括:确定视频数据的第二块的双向运动矢量;确定关于第二块是否满足条件;基于关于当前块不满足条件来对第二块的双向运动矢量应用运动矢量细化过程;基于当前块的经细化的双向运动矢量来确定针对第二块的预测块;以及执行以下中的至少一项:基于针对第二块的预测块来重
构第二块,或基于针对第二块的预测块来生成用于第二块的残差数据。
[0218]
条款3.根据条款1至2中的任一项的方法,其中,运动矢量细化过程是解码器侧运动矢量细化(dmvr)过程。
[0219]
条款4.根据条款1至3中的任一项的方法,其中,运动矢量细化过程是双向光流(bdof)过程。
[0220]
条款5.根据条款1至4中的任一项的方法,其中,确定关于当前块是否满足条件包括:基于mvl0x不等于-1*mvl1x且mvl0y不等于-1*mvl1y来确定关于当前块满足条件,其中,mvl0x是当前块的双向运动矢量的列表0运动矢量的x分量,mvl1x是当前块的双向运动矢量的列表1运动矢量的x分量,mvl0y是当前块的双向运动矢量的列表0运动矢量的y分量,以及mvl1y是当前块的双向运动矢量的列表1运动矢量的y分量。
[0221]
条款6.根据条款1至5中的任一项的方法,其中,确定关于当前块是否满足条件包括:基于mvl0x不等于-1*mvl1x或mvl0y不等于-1*mvl1y来确定关于当前块满足条件,其中,mvl0x是当前块的双向运动矢量的列表0运动矢量的x分量,mvl1x是当前块的双向运动矢量的列表1运动矢量的x分量,mvl0y是当前块的双向运动矢量的列表0运动矢量的y分量,以及mvl1y是当前块的双向运动矢量的列表1运动矢量的y分量。
[0222]
条款7.根据条款1至6中的任一项的方法,其中,确定关于当前块是否满足条件包括:基于对于范围从-n到n的所有δ
x
和δy,mvl0x不等于-1*(mvl1x+δ
x
)且mvl0y不等于-1*(mvl1y+δy)来确定关于当前块满足条件,其中,mvl0x是当前块的双向运动矢量的列表0运动矢量的x分量,mvl1x是当前块的双向运动矢量的列表1运动矢量的x分量,mvl0y是当前块的双向运动矢量的列表0运动矢量的y分量,mvl1y是当前块的双向运动矢量的列表1运动矢量的y分量,以及n是在位流中发信号通知的序列级、图片级、子图片级、图块级、切片级数字或预定义的恒定整数。
[0223]
条款8.根据条款1至7中的任一项的方法,其中,确定关于当前块是否满足条件包括:基于对于范围从-n到n的所有δ
x
和δy,mvl0x不等于-1*(mvl1x+δ
x
)或mvl0y不等于-1*(mvl1y+δy)来确定关于当前块满足条件,其中,mvl0x是当前块的双向运动矢量的列表0运动矢量的x分量,mvl1x是当前块的双向运动矢量的列表1运动矢量的x分量,mvl0y是当前块的双向运动矢量的列表0运动矢量的y分量,mvl1y是当前块的双向运动矢量的列表1运动矢量的y分量,以及n是在位流中发信号通知的序列级、图片级、子图片级、图块级、切片级数字或预定义的恒定整数。
[0224]
条款9.根据条款1至8中的任一项的方法,其中,确定关于当前块是否满足条件包括:基于当前块的双向运动矢量的p范数彼此不同来确定关于当前块满足条件。
[0225]
条款10.根据条款1至9中的任一项的方法,其中,确定关于当前块是否满足条件包括:基于当前块的双向运动矢量的p范数之间的差大于阈值来确定关于当前块满足条件。
[0226]
条款11.根据条款1至10中的任一项的方法,其中,确定关于当前块是否满足条件包括:基于当前块的双向运动矢量的p范数之间的差小于阈值来确定关于当前块满足条件。
[0227]
条款12.根据条款1至11中的任一项的方法,其中,确定关于当前块是否满足条件包括:基于当前块的双向运动矢量的每个分量小于阈值来确定关于当前块满足条件。
[0228]
条款13.一种对视频数据进行译码的方法,该方法包括:确定视频数据的当前块的第一运动矢量和当前块的第二运动矢量;从第一运动矢量和第二运动矢量中确定选定的运
动矢量;通过对选定的运动矢量应用运动矢量细化过程来生成选定的运动矢量的经细化的版本;基于选定的运动矢量的经细化的版本以及第一和第二运动矢量中的不是选定的初始运动矢量的那一个来确定针对当前块的预测块;以及执行以下中的至少一项:基于针对当前块的预测块来重构当前块,或基于针对当前块的预测块来生成用于当前块的残差数据。
[0229]
条款14.根据条款13的方法,其中,运动矢量细化过程是解码器侧运动矢量细化(dmvr)过程。
[0230]
条款15.根据条款13至14中的任一项的方法,其中,运动矢量细化过程是双向光流(bdof)过程。
[0231]
条款16.根据条款13至15中的任一项的方法,还包括:将指示当前块的第一运动矢量或当前块的第二运动矢量是选定的运动矢量的一个或多个语法元素包括在包括视频数据的经编码的表示的位流中。
[0232]
条款17.根据条款13至15中的任一项的方法,其中,确定选定的运动矢量包括:基于在包括视频数据的经编码的表示的位流中发信号通知的一个或多个语法来确定当前块的第一运动矢量或当前块的第二运动矢量中的哪一个是选定的运动矢量。
[0233]
条款18.根据条款13至17中的任一项的方法,其中,确定选定的运动矢量包括:基于当前块的第一运动矢量和当前块的第二运动矢量的长度来确定选定的运动矢量。
[0234]
条款19.根据条款13至18中的任一项的方法,其中,确定选定的运动矢量包括:基于当前块的第一运动矢量和当前块的第二运动矢量的对称性来确定选定的运动矢量。
[0235]
条款20.根据条款19的方法,其中,确定选定的运动矢量包括:基于当前块的第一运动矢量和当前块的第二运动矢量彼此不对称来选择当前块的第一运动矢量和当前块的第二运动矢量中较短的那一个作为选定的运动矢量。
[0236]
条款21.根据条款13至20中的任一项的方法,其中,该方法还包括:基于当前块的第一运动矢量和当前块的第二运动矢量对称来作出确定,以确定选定的运动矢量。
[0237]
条款22.根据条款13至20中的任一项的方法,确定选定的运动矢量包括:基于对于范围从-n到n的所有δ
x
和δy,mvl0≠-1*(mvl1+(δ
x
,δy))来作出确定,以确定选定的运动矢量,其中,n是在位流中发信号通知的序列级、图片级、子图片级、图块级、切片级数字或预定义的恒定整数。
[0238]
条款23.根据条款1至22中的任一项的方法,其中,译码包括解码。
[0239]
条款24.根据条款1至22中的任一项的方法,其中,译码包括编码。
[0240]
条款25.一种用于对视频数据进行译码的设备,该设备包括用于执行根据条款1至22中的任一项的方法的一个或多个部件。
[0241]
条款26.根据条款25的设备,其中,所述一个或多个部件包括被实施在电路中的一个或多个处理器。
[0242]
条款27.根据条款25和26中的任一项的设备,还包括用于存储视频数据的存储器。
[0243]
条款28.根据条款25至27中的任一项的设备,还包括被配置为显示经解码的视频数据的显示器。
[0244]
条款29.根据条款25至28中的任一项的设备,其中,该设备包括相机、计算机、移动设备、广播接收器设备或机顶盒中的一个或多个。
[0245]
条款30.根据条款25至29中的任一项的设备,其中,该设备包括视频解码器。
[0246]
条款31.根据条款25至30中的任一项的设备,其中,该设备包括视频编码器。
[0247]
条款32.一种具有存储在其上的指令的计算机可读存储介质,该指令在被执行时使一个或多个处理器执行根据条款1至22中的任一项的方法。
[0248]
将认识到,取决于示例,本文描述的技术中的任何一种的某些动作或事件可以按不同的顺序来执行,可以被添加、合并或一起省略(例如,并非所有所描述的动作或事件对于技术的实践都是必要的)。此外,在某些示例中,动作或事件可以通过多线程处理、中断处理或多个处理器同时执行,而不是顺序执行。
[0249]
在一个或多个示例中,所描述的功能可以以硬件、软件、固件或它们的任何组合实施。如果以软件实施,这些功能可以作为一个或多个指令或代码在计算机可读介质上存储或发送,并由基于硬件的处理单元执行。计算机可读介质可以包括:与诸如数据存储介质的有形介质相对应的计算机可读存储介质、或包括例如根据通信协议促进将计算机程序从一个地方转移到另一个地方的任何介质的通信介质。以这种方式,计算机可读介质通常可以对应于(1)非暂时性的有形计算机可读存储介质,或(2)诸如信号或载波的通信介质。数据存储介质可以是可由一个或多个计算机或一个或多个处理器访问以取得用于实施本公开中描述的技术的指令、代码和/或数据结构的任何可用介质。计算机程序产品可以包括计算机可读介质。
[0250]
举例来说而非限制,此类计算机可读存储介质可以包括ram、rom、eeprom、cd-rom或其他光盘存储、磁盘存储或其他磁存储设备、闪速存储器或可以用于以指令或数据结构的形式存储期望的程序代码并可以由计算机访问的任何其他介质。同样,任何连接都被恰当地称为计算机可读介质。例如,如果指令是使用同轴电缆、光纤电缆、双绞线、数字订户线(dsl)或无线技术(诸如红外线、无线电和微波)从网站、服务器或其他远程源发送的,则同轴电缆、光纤电缆、双绞线、dsl或无线技术(诸如红外线、无线电和微波)都被包括在介质的定义中。然而,应当理解,计算机可读存储介质和数据存储介质不包括连接、载波、信号或其他暂时性介质,而是指向非暂时性、有形的存储介质。如本文所使用,盘和碟包括压缩碟(cd)、激光碟、光碟、数字多功能碟(dvd)、软盘和蓝光碟,其中盘通常磁性地再现数据,而碟用激光光学地再现数据。上述的组合也应被包括在计算机可读介质的范围内。
[0251]
指令可以由一个或多个处理器执行,诸如一个或多个数字信号处理器(dsp)、通用微处理器、专用集成电路(asic)、现场可编程门阵列(fpga)或其他等同的集成或分立逻辑电路。相应地,如本文所使用的术语“处理器”和“处理电路”可以指任何前述结构或者适合于实施本文描述的技术的任何其他结构。另外,在一些方面中,本文描述的功能性可以在被配置用于编码和解码的专用硬件和/或软件模块内提供,或者被结合在组合编解码器中。同样,这些技术可以被完全实施在一个或多个电路或逻辑元件中。
[0252]
本公开的技术可以被实施在各种各样的设备或装置中,包括无线手持机、集成电路(ic)或ic组(例如,芯片组)。在本公开中描述了各种组件、模块或单元,以强调被配置为执行所公开的技术的设备的功能方面,但是不一定要求通过不同的硬件单元来实现。而是,如上所述,各种单元可以被组合在编解码器硬件单元中,或者由包括如上所述的一个或多个处理器的互操作硬件单元的集合结合合适的软件和/或固件来提供。
[0253]
已经对各种示例进行了描述。这些和其他示例都在以下权利要求的范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1