用于视频译码中的运动补偿的高级内插技术的制作方法

文档序号:7733679阅读:388来源:国知局
专利名称:用于视频译码中的运动补偿的高级内插技术的制作方法
技术领域
本发明涉及数字视频译码,且更特定来说,涉及用于视频译码中的预测性数据的 分数内插。
背景技术
可将数字视频能力并入到许多装置中,包括数字电视、数字直播系统、无线广播系 统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、视频游戏装置、 视频游戏控制台、蜂窝式或卫星无线电电话等。数字视频装置实施视频压缩技术,例如, MPEG-2、MPEG-4或ITU-T H. 264/MPEG-4第十部分、高级视频译码(AVC),以更有效地发射和 接收数字视频信息。视频压缩技术可执行空间预测和/或时间预测以减少或移除视频序列 中固有的冗余。基于块的帧间译码为非常有用的译码技术,其依赖于时间预测来减少或移除在视 频序列的连续经译码单元的视频块之间的时间冗余。经译码单元可包含视频帧、视频帧的 切片、图片的群组或视频块的另一定义单元。对于帧间译码,视频编码器执行运动估计和运 动补偿以追踪两个或两个以上相邻经译码单元的对应视频块的移动。运动估计产生运动向 量,其指示视频块相对于一个或一个以上参考帧或其它经译码单元中的对应预测视频块的 移位。运动补偿使用运动向量以从参考帧或其它经译码单元产生预测视频块。在运动补偿 之后,残余视频块由从正经译码的原始视频块减去预测视频块而形成。视频编码器还可应用变换、量化和熵译码过程以进一步降低与残余块的通信相关 联的位速率。变换技术可包含离散余弦变换(DCT)或概念上类似的过程。或者,可使用小 波变换、整数变换或其它类型的变换。在DCT过程中,例如,一组像素值经转换为变换系数, 其可表示频域中的像素值的能量。将量化应用于变换系数,且量化通常涉及限制与任何给 定变换系数相关联的位数目的过程。熵译码包含共同压缩经量化变换系数的序列的一个或 一个以上过程。熵译码的实例包括(但不限于)内容自适应可变长度译码(CAVLC)和上下 文自适应二进制算术译码(CABAC)。经译码的视频块可由可用于产生或识别预测性块的预测信息和指示正经译码块 与预测性块之间的差异的数据的残余块来表示。预测信息可包含一个或一个以上运动向 量,所述一个或一个以上运动向量用于识别数据的预测性块。给定运动向量,解码器能够重 新建构用于译码残余块的预测性块。因此,给定一组残余块和一组运动向量(和可能的一 些额外语法),解码器可能够重新建构最初经编码的视频帧。基于运动估计和运动补偿的帧 间译码可实现非常好的压缩,因为连续视频帧或其它类型的经译码单元通常非常类似。经 编码的视频序列可包含残余数据块、运动向量和可能的其它类型的语法。
已开发内插技术以便改进可在帧间译码中实现的压缩级别。在此情况下,在运动 补偿期间所产生的预测性数据(其用于译码视频块)可从视频帧或用于运动估计中的其它 经译码单元的视频块的像素进行内插。内插通常经执行以产生预测性半像素值(半像素) 和预测性四分之一像素值(四分之一像素)。此内插通常产生比预测性帧或用于视频译码 中的其它经译码单元的实际视频块更类似于正经译码视频块的预测性块。

发明内容
一般来说,本发明描述在视频译码的运动补偿过程期间由编码器和解码器执行的 内插技术。根据本发明的技术,编码器可应用多个预定义的内插滤波器以便产生多个不同 的经内插预测数据。可选择实现最高级别的压缩的经内插预测数据,且可将所使用的内插 滤波器译码为语法且传送到解码装置以作为经译码视频数据的部分。内插滤波器可每预测 性单元定义一次(例如,每预测帧一次),或可在块基础上加以定义(例如,不同滤波可应用 于预测性单元内的不同视频块)。或者,可在样本基础上定义内插滤波器,或可在子样本基 础上定义内插滤波器。解码器接收经译码的视频数据,且可解译语法以便识别曾由编码器使用的内插滤 波器。以此方式,解码器可在其运动补偿过程期间识别且使用在编码过程期间所使用的相 同内插滤波器。通过考虑在编码器处的多个不同的内插滤波器,可相对于具有固定内插滤 波器的技术而改进压缩。同时,所述技术可比常规自适应内插滤波显著不复杂,常规自适应 内插滤波自适应地定义内插滤波器系数以作为译码过程的部分。根据本发明的一些方面, 可通过对测试视频序列实施自适应内插滤波或其它技术以便预定义将可能导致良好压缩 的内插滤波器系数的集合而预定义不同内插滤波器。或者,不同数目的滤波器系数(不同 数目的分接头)或不同类型的滤波器可一起经预定义,且接着在编码和解码过程期间选择 并使用。另外,本发明还认识到归因于半像素值的常规舍入的译码低效,且提供可通过减 小或消除中间舍入来改进内插的技术。在此情况下,可为半像素内插的目的而舍入经内插 半像素值。然而,可基于经内插的半像素值中的一者或一者以上而产生的四分之一像素值 可依赖于半像素值的未舍入版本。此可消除从半像素值到四分之一像素值的舍入不准确性 的传播。在一些情况下,在不牺牲最终值的准确性的情况下的轻微舍入可应用于一个特定 半像素值,以便确保16位存储元件可用于存储半像素的任何中间值。具体来说,当15个可 能的子像素位置经定义以用于每一像素位置时,特定半像素值中的一者可能需要基于其它 半像素值而产生(即,需要二级半像素内插),且此特定半像素值可能需要舍入以确保16位 存储元件可用于存储所有内插值。在任何情况下,中间舍入任务的消除可在实施或不实施多个预定义内插滤波器的 情况下进行,如本文中所描述。举例来说,可在使用多个预定义内插滤波器的实施方案的情 形中执行中间舍入的消除,如本文中所描述。或者,可在更常规内插的情形中,例如,在自适 应内插滤波(AIF)的情形中执行中间舍入的消除。在一个实例中,本发明提供一种编码视频数据的方法。所述方法包含产生预测数 据,其中产生预测数据包括基于多个不同的预定义内插滤波器而内插参考视频数据的像素 值。所述方法还包含基于预测数据来编码视频数据。
在另一实例中,本发明提供一种解码视频数据的方法。所述解码方法包含接收语 法元素,所述语法元素识别来自多个不同的预定义内插滤波器的内插滤波器;产生预测数 据,其中产生预测数据包括基于由语法元素识别的内插滤波器而内插参考视频数据的像素 值;以及基于所述预测数据而解码视频数据。在另一实例中,本发明提供一种内插用于视频译码的预测性视频数据的方法。所 述方法包含基于整数像素值而产生半像素值,舍入所述半像素值以产生半像素内插值,存 储半像素值以作为半像素值的未舍入版本,和基于半像素值的未舍入版本和整数像素值而 产生四分之一像素值。在另一实例中,本发明提供一种编码视频数据的设备,所述设备包含视频编码器, 所述视频编码器包括产生预测数据的运动补偿单元。运动补偿单元基于多个不同的预定义 内插滤波器而内插参考视频数据的像素值,且视频编码器基于所述预测数据而编码视频数 据。在另一实例中,本发明提供一种解码视频数据的设备,所述设备包含视频解码器, 所述视频解码器包括运动补偿单元。所述视频解码器接收语法元素,所述语法元素识别来 自多个不同的预定义内插滤波器的内插滤波器。所述运动补偿单元产生预测数据,其中产 生预测数据包括基于由语法元素识别的内插滤波器而内插参考视频数据的像素值。视频解 码器接着基于预测数据而解码视频数据。在另一实例中,本发明提供一种内插用于视频译码的预测性视频数据的设备,其 中所述设备包括运动补偿单元,所述运动补偿单元基于整数像素值而产生半像素值,舍入 半像素值以产生半像素内插值,存储半像素值以作为半像素值的未舍入版本,和基于半像 素值的未舍入版本和整数像素值而产生四分之一像素值。在另一实例中,本发明提供一种编码视频数据的装置,所述装置包含用于产生预 测数据的装置,其中用于产生预测数据的装置包括用于基于多个不同的预定义内插滤波器 而内插参考视频数据的像素值的装置和用于基于预测数据而编码视频数据的装置。在另一实例中,本发明提供一种解码视频数据的装置,所述装置包含用于接收语 法元素的装置,所述语法元素识别来自多个不同的预定义内插滤波器的内插滤波器;用于 产生预测数据的装置,其中用于产生预测数据的装置包括用于基于由语法元素识别的内插 滤波器而内插参考视频数据的像素值的装置;以及用于基于预测数据而解码视频数据的装 置。在另一实例中,本发明提供一种内插用于视频译码的预测性视频数据的装置,所 述装置包含用于基于整数像素值而产生半像素值的装置,用于舍入半像素值以产生半像素 内插值的装置,用于存储半像素值以作为半像素值的未舍入版本的装置,和用于基于半像 素值的未舍入版本和整数像素值而产生四分之一像素值的装置。在另一实例中,本发明提供一种编码视频数据的装置,所述装置包含视频编码器, 所述视频编码器包括运动补偿单元,所述运动补偿单元通过基于多个不同的预定义内插滤 波器而内插参考视频数据的像素值来产生预测数据,且基于所述预测数据而编码视频数 据;以及无线发射器,其将视频数据发射到另一装置。在另一实例中,本发明提供一种解码视频数据的装置,所述装置包含无线接收 器,其接收视频数据;以及视频解码器,其包括运动补偿单元,所述运动补偿单元接收识别来自多个不同的预定义内插滤波器的内插滤波器的语法元素,产生预测数据,其中产生预 测数据包括基于由语法元素识别的内插滤波器而内插参考视频数据的像素值,和基于预测 数据而解码视频数据。在另一实例中,本发明提供一种编码视频数据的装置,所述装置包含视频编码 器,所述视频编码器包括运动补偿单元,所述运动补偿单元基于整数像素值而产生半像素 值,舍入半像素值以产生半像素内插值,存储半像素值以作为半像素值的未舍入版本,和基 于半像素值的未舍入版本和整数像素值而产生四分之一像素值;以及无线发射器,其将由 运动补偿单元编码的视频数据发射到另一装置。在另一实例中,本发明提供一种解码视频数据的装置,所述装置包含无线接收 器,其接收视频数据;以及包括运动补偿单元的视频解码器,其解码视频数据。在解码视频 数据中,运动补偿单元基于整数像素值而产生半像素值,舍入半像素值以产生半像素内插 值,存储半像素值以作为半像素值的未舍入版本,且基于半像素值的未舍入版本和整数像 素值而产生四分之一像素值。本发明中所描述的技术可以硬件、软件、固件或其任何组合实施。如果以软件实 施,则软件可执行于一个或一个以上处理器(例如,微处理器、专用集成电路(ASIC)、现场 可编程门阵列(FPGA)或数字信号处理器(DSP))中。执行所述技术的软件最初可存储于计 算机可读媒体中且加载并执行于处理器中。因此,本发明还涵盖一种包含指令的计算机可读存储媒体,所述指令在执行后即 刻致使装置编码视频数据,其中所述指令致使所述装置产生预测数据,其中产生预测数据 包括基于多个不同的预定义内插滤波器而内插参考视频数据的像素值,和基于预测数据而 编码视频数据。本发明还涵盖一种包含指令的计算机可读存储媒体,所述指令在执行后即刻致使 装置解码视频数据,其中所述指令致使所述装置在接收到识别来自多个不同的预定义内插 滤波器的内插滤波器的语法元素后即刻产生预测数据,其中产生预测数据包括基于由语法 元素识别的内插滤波器而内插参考视频数据的像素值,和基于预测数据而解码视频数据。另外,本发明还涵盖一种包含指令的计算机可读存储媒体,所述指令在执行后即 刻致使装置内插用于视频译码的预测性视频数据,其中所述指令致使所述装置基于整数像 素值而产生半像素值,舍入半像素值以产生半像素内插值,存储半像素值以作为半像素值 的未舍入版本,和基于半像素值的未舍入版本和整数像素值而产生四分之一像素值。在附图和以下描述中陈述本发明的一个或一个以上方面的细节。本发明中所描述 的技术的其它特征、目标和优点将从所述描述和图式以及从权利要求书中而显而易见。


图1为说明视频编码和解码系统的示范性框图。图2为说明与本发明一致的视频编码器的一实例的框图。图3为说明与本发明一致的视频解码器的一实例的框图。图4A到图4D为说明整数像素和可包含预测性视频块的像素的经内插像素的概念 图。图5到图8为说明与本发明一致的技术的流程图。
具体实施例方式本发明描述在视频译码的运动补偿过程期间由编码器和解码器执行的各种内插 技术。根据本发明的一个方面,编码器可应用多个预定义内插滤波器以便产生多个不同的 经内插预测数据。可在编码器处选择实现最高级别的压缩的经内插预测数据,且可将曾使 用的内插滤波器译码为语法且传送到解码装置以作为经译码视频数据的部分。经内插预测 数据包含参考数据。可从经内插预测数据(例如,内插预测性参考块)中减去待译码的视 频数据(例如,视频块)以便定义经编码数据的残余块,所述残余块接着可经变换、量化和 熵译码。内插滤波器可每预测单元定义一次(例如,每预测帧一次),或可在样本基础上加 以定义(例如,不同滤波可应用于预测性单元内的不同视频块或不同样本位置)。不同内插 滤波器(例如)可由不同组的滤波器系数、不同数目的滤波器系数或可能不同的滤波器类 型来定义。在任何情况下,通过提供多个预定义内插滤波器,经内插数据可提供改进的数据 压缩。解码器接收经译码的视频数据,且可解译语法以便识别由编码器使用的内插滤波 器。以此方式,解码器可在其运动补偿过程期间识别且使用在编码过程期间曾使用的相同 内插滤波器。而且,通过考虑在编码器处的多个不同的内插滤波器,可相对于具有单一经定 义内插滤波器的技术而改进压缩。同时,所述技术可比常规自适应内插滤波显著不复杂,其 中常规自适应内插滤波自适应地定义内插滤波器(通过选择滤波器系数)以作为译码过程 的一部分。在一个实例中,内插滤波器可通过对测试视频序列实施自适应内插滤波或其它 技术以便预定义将可能导致良好压缩的内插滤波器系数的集合而加以预定义。在本发明的另一方面中,描述内插技术,其消除或显著减小用于四分之一像素内 插的半像素值的中间舍入。消除或显著减小中间舍入的技术可在具有或不具有使用预定义 内插滤波器的以上所提及技术的情况下使用。换句话说,可根据一个或一个以上预定义内 插滤波器在内插期间使用消除或显著减小中间舍入的技术,但还可与使用固定内插滤波器 的内插或可能与自适应精细化内插技术一起使用。本发明认识到可归因于半像素值的常规舍入而出现的译码低效,且提出通过消除 或减小中间舍入来改进内插的技术。在此情况下,可为半像素内插的目的而舍入经内插的 半像素值。然而,可基于经内插半像素值中的一者或一者以上而产生的四分之一像素值可 依赖于半像素值的未舍入版本。此可消除从半像素值到四分之一像素值的舍入不准确性的 传播。在一些情况下,轻微舍入可应用于一些半像素值以便确保16位数据结构可用于存储 任何中间值。在一些情况下,轻微舍入对最终准确性的影响可通过适当地执行舍入而为零。 在任何情况下,中间舍入的消除或减小可在实施或不实施多个预定义内插滤波器的情况下 进行,如本文中所描述。图1为说明可实施本发明的技术的一个示范性视频编码和解码系统10的框图。如图1中所示,系统10包括源装置12,其将经编码的视频经由通信信道15发射到目的地装置 16。源装置12和目的地装置16可包含许多装置中的任一者。在一些情况下,源装置12和 目的地装置16包含例如无线手持机、所谓的蜂窝式或卫星无线电话等无线通信装置,或可 经由通信信道15传送视频信息的任何无线装置,在所述情况下,通信信道15为无线的。然而,关于运动补偿内插的本发明的技术不必限于无线应用或设定。 在图1的实例中,源装置12可包括视频源20、视频编码器22、调制器/解调器(调 制解调器)23和发射器24。目的地装置16可包括接收器26、调制解调器27、视频解码器28 和显示装置30。根据本发明,源装置12的视频编码器22可经配置以应用本发明的内插技 术中的一者或一者以上以作为视频编码过程的部分。类似地,目的地装置16的视频解码器 28可经配置以应用本发明的内插技术中的一者或一者以上以作为视频解码过程的部分。图1的所说明系统10仅为示范性的。本发明的内插技术可由支持运动补偿内插 到子像素分辨率的任何编码装置来执行。源装置12和目的地装置16仅为此些译码装置的 实例。在此情况下,源装置12产生用于发射到目的地装置16的经译码视频数据。装置12、 16可以实质上对称的方式操作以使得装置12、16中的每一者包括(例如)在组合的编码 器-解码器(CODEC)中的视频编码和解码组件。因此,系统10可支持视频装置12、16之间 的单向或双向视频发射,例如,以用于视频串流、视频回放、视频广播或视频电话。源装置12的视频源20可包括例如视频摄像机等视频俘获装置、含有先前俘获的 视频的视频档案或来自视频内容提供者的视频馈送。作为另一替代情况,视频源20可产生 基于计算机图形的数据以作为源视频,或现场直播视频、所存档的视频与计算机产生的视 频的组合。在一些情况下,如果视频源20为视频摄像机,则源装置12和目的地装置16可 形成所谓的相机电话或视频电话。在每一情况下,经俘获、预先俘获或计算机产生的视频可 由视频编码器22编码。经编码的视频信息接着可根据通信标准(例如,码分多址(CDMA) 或另一通信标准)由调制解调器23调制,且经由发射器24发射到目的地装置16。调制解 调器23可包括各种混频器、滤波器、放大器或经设计以用于信号调制的其它组件。对于无 线应用,发射器24可包括经设计以用于发射数据的电路,其包括放大器、滤波器和一个或 一个以上天线。目的地装置16的接收器26经由信道15接收信息,且调制解调器27解调所述信 息。而且,视频编码过程可实施本文中所述技术中的一者或一者以上以在运动补偿期间改 进内插。由视频解码器28执行的视频解码过程还可在解码过程的其运动补偿阶段期间执 行内插。显示装置30向用户显示经解码的视频数据,且可包含例如阴极射线管、液晶显示 器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置等多种 显示装置中的任一者。在图1的实例中,通信信道15可包含任何无线或有线通信媒体,例如,射频(RF) 频谱或一个或一个以上物理传输线,或无线与有线媒体的任何组合。通信信道15可形成例 如局域网、广域网或例如因特网的全球网络的基于包的网络的部分。通信信道15通常表示 用于将视频数据从源装置12发射到目的地装置16的任何适合的通信媒体,或不同通信媒 体的集合。视频编码器22和视频解码器28可根据视频压缩标准(例如ITU-T H. 264标准 (或者描述为MPEG-4第十部分、高级视频译码(AVC)))来操作。然而,本发明的技术不限 于任何特定译码标准。尽管在图1中未展示,但在一些方面中,视频编码器22和视频解码 器28可各自与音频编码器和解码器集成,且可包括适当的MUX-DEMUX单元或其它硬件和软 件,以处置共同数据流或单独数据流中的音频与视频的编码。如果适用,则MUX-DEMUX单元 可符合ITU H. 223多路复用器协议,或例如用户数据报协议(UDP)的其它协议。
由ITU-T视频译码专家组(VCEG)与IS0/IEC运动图片专家组(MPEG) —起将ITU H. 264/MPEG-4(AVC)标准制定为被称作联合视频小组(JVT)的集体合作伙伴的产品。在一 些方面中,本发明中所描述的技术可应用于通常符合H. 264标准的装置。ITU-T研究组在 2005年3月在ITU-T推荐H. 264 “用于通用音视频服务的高级视频译码(Advanced Video Coding for generic audiovisual services) ” 中描述了 H. 264 标准,其在本文中可被称 作H. 264标准或H. 264规范或H. 264/AVC标准或规范。联合视频小组(JVT)继续致力于对 H. 264/MPEG-4AVC 的扩展。视频编码器22和视频解码器28各自可实施为一个或一个以上微处理器、数字信 号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、 固件或其任何组合。视频编码器22和视频解码器28中的每一者可包括于一个或一个以上 编码器或解码器中,其任一者可集成为相应移动装置、订户装置、广播装置、服务器等中的 组合的CODEC的部分。视频序列通常包括一系列视频帧。视频编码器22对个别视频帧内的视频块操作 以便编码视频数据。所述视频块可具有固定或不同的大小,且可根据指定的译码标准而在 大小上不同。每一视频帧包括一系列切片。每一切片可包括一系列宏块,其可布置为子块。 作为一实例,ITU-T H. 264标准支持各种块大小的帧内预测(例如,对于亮度分量来说为 16 X 16、8 X 8或4X 4,且对于色度分量来说为8 X 8)以及各种块大小的帧间预测(例如,对 于亮度分量来说为16X16、16X8、8X16、8X8、8X4、4X8和4X4,且对于色度分量来说为 对应的经缩放的大小)。视频块可(例如)在例如离散余弦变换或概念上类似的变换过程 的变换过程之后包含像素数据的块或变换系数的块。较小视频块可提供较佳分辨率,且可用于定位包括高细节水平的视频帧。一般来 说,宏块(MB)和各种子块可视作视频块。另外,一切片可视作一系列视频块,例如MB和/ 或子块。每一切片可为视频帧的可独立解码的单元。视频编码器22和视频解码器28执行 基于帧间的预测性译码,其涉及产生预测性参考数据和从预测性参考数据减去待译码的视 频块以产生残余数据,所述残余数据接着可经变换、量化和熵译码。基于帧间的预测性译码 可包括根据本发明的预测性数据的内插。在基于帧间的预测性译码(其包括本发明的内插技术)之后且在任何变换(例如 用于H. 264/AVC中的4X4或8X8整数变换或离散余弦变换DCT)之后,可执行量化。量化 大体上指代其中系数经量化以可能减少用于表示系数的数据量的过程。量化过程可减小与 一些或所有系数相关联的位深度。举例来说,16位值在量化期间可下舍入为15位值。在量 化之后,可(例如)根据内容自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码 (CABAC)或另一熵译码方法来执行熵译码。根据本发明的技术,视频编码器22可应用多个预定义内插滤波器以便产生多个 不同的经内插预测数据。可由视频编码器22选择实现最高级别的压缩的经内插预测数据, 且可将曾用于所选的经内插预测数据的内插滤波器译码为语法且传送到目的地装置16以 作为经译码视频数据的部分。在此情况下,视频解码器28接收经译码的视频数据,且可解 译语法以便识别曾由视频编码器22使用的内插滤波器。因此,视频解码器28可在其运动 补偿解码过程期间识别且使用在编码过程期间曾使用的相同内插滤波器。不同的预定义内 插滤波器可包含具有滤波器系数(滤波器分接头)的不同集合的类似滤波器。或者,不同的预定义内插滤波器可包含具有不同数目的滤波器分接头或可能完全不同类型的滤波器 配置的滤波器。而且,根据本发明的另一方面,视频编码器22和视频解码器28可应用内插技术, 其消除或显著减小用于四分之一像素内插的半像素值的中间舍入。在此情况下,视频编码 器22和视频解码器28可为了半像素内插的目的而舍入经内插的半像素值。然而,对于四 分之一像素内插,视频编码器22和视频解码器28可存储且使用半像素值的未舍入版本以 便减小或消除从半像素值到四分之一像素值的舍入不准确性的传播。在一些情况下,轻微 舍入可应用于需要二级内插的一个特定半像素值以便确保固定大小的存储元件(例如,16 位寄存器)可用于存储任何中间值。在一些情况下,可通过适当地执行舍入而使轻微舍入 对最终准确性的影响为零,如本文中所描述。图2为说明与本发明一致的可执行运动补偿内插的视频编码器50的一实例的框 图。视频编码器50可对应于装置20的视频编码器22或不同装置的视频编码器。视频编 码器50可执行视频帧内的块的帧内译码和帧间译码,但不说明帧内编码。帧内译码依赖于 空间预测来减小或移除给定视频帧帧内的视频中的空间冗余。帧间译码依赖于时间预测来 减小或移除视频序列的邻近帧内的视频中的时间冗余。帧内模式(I模式)可指基于空间 的压缩模式,且例如预测(P模式)或双向(B模式)的帧间模式可指基于时间的压缩模式。 本发明的技术通常可在帧间译码期间应用,且因此为说明的简单性和简易性起见而未在图 2中说明例如空间预测单元的帧内译码单元。然而,本发明的舍入技术还可应用于空间预测 和帧内译码技术。如图2中所示,视频编码器50接收待编码的视频帧内的当前视频块。在图2的 实例中,视频编码器50包括运动估计单元32、运动补偿单元35、参考帧存储装置34、加 法器48、变换单元38、量化单元40和熵译码单元46。对于视频块重新建构,视频编码器 50还包括逆量化单元42、逆变换单元44、加法器51。还可包括解块滤波器(deblocking filter)(未图示)以对块边界进行滤波,以从重新建构的视频移除块假影(blockiness artifact) 0需要时,解块滤波器通常将对加法器51的输出进行滤波。在编码过程期间,视频编码器50接收待译码的视频块,且运动估计单元32和运动 补偿单元35执行帧间预测性译码。运动估计单元32和运动补偿单元35可高度集成,但为 概念目的而单独说明。运动估计通常视为产生运动向量的过程,其估计视频块的运动。运 动向量(例如)可指示预测性帧(或其它经译码单元)内的预测性块相对于当前帧(或其 它经译码单元)内的正经译码的当前块的移位。运动补偿通常视为基于由运动估计确定的 运动向量而获取或产生预测性块的过程。而且,运动估计单元32和运动补偿单元35可功 能上集成。本发明中所述的内插技术经描述为由运动补偿单元35执行。然而,可在运动估 计期间执行内插以便促进最佳运动向量的选择。根据本发明,运动估计32通过比较待译码视频块与预测性经译码单元(例如,先 前帧)的视频块来选择用于待译码视频块的适当运动向量。此时,运动补偿单元35可执行 内插以便产生子像素分辨率下的预测性数据。在一些情况下,在运动估计期间,内插可基于 固定内插滤波器。在其它情况下,在运动补偿(如下文概述)期间所应用的不同内插滤波 器还可为了运动向量选择的目的而在运动估计过程期间使用。一旦运动估计单元32已选择用于待译码视频块的运动向量,运动补偿单元35便产生与那个运动向量相关联的预测性视频块。然而,根据本发明,运动补偿单元35可考虑 具有子像素分辨率的任何预测性视频块的若干版本。在此情况下,运动补偿单元35可应用 多个预定义内插滤波器以便产生用于待译码视频块的多个不同的经内插预测数据。运动补 偿单元35接着选择实现最高级别的压缩的经内插预测数据(例如,与内插滤波器中的一者 相关联的经内插视频块)。曾用于产生经内插数据的内插滤波器可经译码为内插语法且传 送到熵译码单元46以用于包括于经译码位流中。一旦运动补偿单元35已选择且应用最佳 内插滤波器,运动补偿单元35便使用内插滤波器产生预测性数据,且视频编码器应用加法 器48以从正经译码的视频块减去那个预测性数据以产生残余数据。而且,根据本发明的另一方面,视频编码器22和视频解码器28可应用内插技术, 其消除或显著减小用于四分之一像素内插的半像素值的中间舍入。在此情况下,视频编码 器22和视频解码器28可为了半像素内插的目的而舍入经内插的半像素值。然而,对于四 分之一像素内插,视频编码器22和视频解码器28可存储且使用半像素值的未舍入版本,以 便减小或消除从半像素值到四分之一像素值的舍入不准确性的传播。在一些情况下,轻微 舍入可应用于需要二级内插的一个特定半像素值以便确保固定大小的存储元件(例如,16 位寄存器)可用于存储任何中间值。如所述,一旦运动补偿单元35产生预测数据(例如,经内插的预测性视频块),视 频编码器50便通过从正经译码的原始视频块减去预测数据来形成残余视频块。加法器48 表示执行此减法运算的一个或一个以上组件。变换单元38将例如离散余弦变换(DCT)的 变换或概念上类似的变换应用于残余块,从而产生包含残余变换块系数的视频块。举例来 说,变换单元38可执行例如由H. 264标准定义的其它变换,其概念上类似于DCT。还可使用 小波变换、整数变换、副频带变换或其它类型的变换。在任何情况下,变换单元38将变换应 用于残余块,从而产生残余变换系数的块。变换可将残余信息从像素域转换到频域。量化单元40量化残余变换系数以进一步降低位速率。量化过程可减小与一些或 所有系数相关联的位深度。举例来说,16位值在量化期间可下舍入为15位值。在量化之 后,熵译码单元46熵译码经量化的变换系数。举例来说,熵译码单元46可执行内容自适应 可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码方法。在通过 熵译码单元46进行的熵译码之后,可将经编码的视频发射到另一装置或经存档以供稍后 发射或检索。经译码的位流可包括经熵译码的残余块、用于此些块的运动向量和包括识别 曾由运动补偿单元35应用的内插滤波器的内插语法的其它语法。逆量化单元42和逆变换单元44分别应用逆量化和逆变换来在像素域中重新建 构残余块(例如)以供稍后用作参考块。求和器51将重新建构的残余块加到由运动补偿 单元35所产生的运动补偿预测块以产生重新建构的视频块以供存储于参考帧存储装置34 中。重新建构的视频块可由运动估计单元32和运动补偿单元35用作参考块以帧间编码后 续视频帧中的块。图3为说明视频解码器60的一实例的框图,所述视频解码器60解码以本文中所 述的方式编码的视频序列。视频解码器60包括运动补偿单元55,所述运动补偿单元55执 行本发明的内插技术以用于解码。具体来说,在解码侧,运动补偿单元55可从熵解码单元 52接收语法元素,所述语法元素识别来自多个不同的预定义内插滤波器的内插滤波器。运 动补偿单元55可产生预测数据,其包括基于由语法元素识别的内插滤波器而内插参考视频数据的像素值。特定来说,运动补偿单元55可基于从熵解码单元52接收的运动向量和 如由语法元素定义的内插(图3中标记为内插语法)而产生预测数据。基于此经内插预测 数据,可解码视频数据(例如,重新建构的残余视频块)。熵解码单元52熵解码所接收的位流以产生量化系数和语法(例如,发送到运动补 偿单元55的内插语法和运动向量)。逆量化单元56逆量化(S卩,解量化)经量化的块系 数。逆量化过程可为如由H. 264解码定义的常规过程。逆变换单元58将逆变换(例如,逆 DCT或概念上类似的逆变换过程)应用于变换系数以便在像素域中产生残余块。运动补偿 单元55以本文中所述的方式产生经运动补偿块,(例如)包括基于由语法元素识别的内插 滤波器系数的集合(即,内插语法)的内插。求和器64通过对残余块与由运动补偿单元55产生的对应预测块求和来解码残余 块以形成经解码的块。需要时,还可应用解块滤波器以对经解码的块进行滤波以便移除块 假影。接着将经解码的视频块存储于参考帧存储装置62中,其为提供用于后续运动补偿的 参考块且还产生到驱动显示装置(例如图1的装置30)的经解码视频的存储元件。而且,本发明的技术涉及经运动补偿的内插,其中预测性视频块的像素值经内插 到子像素分辨率。编码器使用本发明的技术以识别来自多个预定义内插滤波器的合意内插 滤波器。不同滤波器的特征可在于滤波器系数的不同集合、不同数目的滤波器系数或不同 滤波器类型。解码器解译从编码器发送的语法元素以便识别由编码器使用的内插滤波器系 数的相同合意集合。图4A到图4D为说明整数像素和可包含预测性视频块的像素的经内插像素的概念 图。在图4的概念性说明中,不同框表示像素。大写字母(在具有实线的框中)表示整数像 素位置,而小写字母(在具有虚线的框中)表示经内插像素位置。字母标记在本文中可用 于描述像素位置或像素定位,或可指代与各种位置相关联的像素值。像素位置“aa”、“bb”、 “沈”、“(1(1”、“扰”、1广,、、8”、“址”、“^”和“力_”为用于与像素位置乂3”相关联的各种分 数位置的分数内插中的半像素位置。每一像素位置可具有相关联的15个不同分数位置(例如,依照顺从ITU H. 264/ AVC标准的内插)。在图4A到图4D的实例中,说明与像素“C3”相关联的这15个不同分数 位置。为说明的简单性和简易性起见,未展示大部分其它分数位置(不同于以上所提及的 那些位置,其用于产生与像素“C3”相关联的15个不同分数位置中的一者或一者以上)。在ITU H. 264/AVC标准中,为了获得在半像素位置处的亮度信号,通常使用具有系 数[1,-5,20,20,5,1]的6分接头维纳滤波器(Wiener filter)。接着,为了获得在四分之 一像素位置处的亮度信号,使用双线性滤波器。双线性滤波器还可用于色度分量的分数像 素内插中,所述色度分量在H. 264/AVC中可具有高达1/8像素精度。在图4B中分别在水平和垂直方向上示范像素位置“b”和“h”的半像素内插。在 此情况下,可基于整数像素“C1”、“C2”、“C3”、“C4”、“C5”和“C6”而内插像素位置“b”。类 似地,可基于整数像素“A3”、“B3”、“C3”、“D3”、“E3”和“F3”而内插像素位置“h”。可应用 不同内插滤波器(例如,滤波器分接头的不同集合)以产生像素位置“b”和“h”的不同内 插值,如本文中所描述。在图4B中,内插像素位置“b”和“h”以阴影展示,且整数像素位置 “Cl”、“ C2 ”、“ C3 ”、“ C4 ”、“ C5 ”、“ C6 ”、“ A3 ”、“ B3 ”、“ C3 ”、“ D3 ”、“ E3,,和 “ F3,,以交叉阴影展示。图4C说明可能需要二级内插的一种特殊情况。具体来说,像素位置“j”不同于其它半像素位置,因为像素位置“j”本身基于其它半像素值而经内插。举例来说,像素位置 “j”可基于在水平方向上的半像素内插值“cC”、“dd”、“h”、“ee”、“ff”和“gg”而经内插。 或者,像素位置“彳”可基于在垂直方向上的半像素内插值、^、“^”、^”、“!^”、“^”* “ jj”而经内插。在图4C中,内插像素位置“j”以阴影展示,在垂直方向上的半像素内插值 “aa”、“bb”、“b”、“hh”、“ii”和“jj”以右到左交叉阴影展示,且半像素内插值“cc”、“dd”、 “h”、“ee”、“ff”和“gg”以左到右交叉阴影展示。图4D以阴影说明四分之一像素位置“&”、“(3”、“(1”、、”、“广,、、”、“广、1”、“1,,、 “m”、“n”和“0”,且以交叉阴影说明用于此四分之一像素内插的整数和半像素位置(例如, “ C3 ”、“b ”、“ C4 ”、“h ”、“ j ”、“ ee ”、“D3 ”、“hh,,和 “D4 ”)。在运动估计之后,可识别给定视频块的最佳运动向量,例如,可能使用速率失真模 型来平衡译码速率与质量。接着,在运动补偿期间使用最佳运动向量形成预测视频块。如 上概述,通过从原始视频块减去预测视频块来形成残余视频块。接着将变换应用于残余块, 且变换系数经量化和熵译码以进一步降低位速率。而且,图4A到图4D用大写字母以实线框展示整数像素样本(还称为全像素)。对 于任何给定整数像素样本,总共存在15个子像素位置,其在图4A到图4D中经展示为用于 整数像素样本“C3”且标记为“a”到“O”。在H. 264/AVC中,可首先使用一维6分接头维纳 滤波器来计算半像素位置“b”、“h”和“j”。如所述,半像素位置“j”可能需要使用6分接 头滤波的二级此内插。在此情况下,对于像素位置“j”,内插滤波器首先应用于水平方向且 接着应用于垂直方向,其中可能在一个维度上内插之后中间舍入经内插的像素值以便确保 数据可存储于16位存储元件内。其余四分之一像素位置接着经由使用双线性滤波器和已 计算的半像素样本的滤波而经内插。ITU-T SG16/Q.6/VCEG (视频译码专家群)委员会一直在探索提供比H. 264/AVC更 高的译码效率的译码技术。此探索在KTA(关键技术领域)论坛中进行。已在KTA中采用 的译码工具中的一者被称为自适应内插滤波器(AIF)。AIF提供优于H. 264/AVC的大译码 增益,对具有高分辨率(例如,720p)的视频序列尤其如此。在AIF中,每一子像素位置的内 插滤波器通过最小化预测误差能量而以分析的方式经计算用于每一视频帧。每一帧的以分 析的方式导出的自适应滤波器系数接着经预测、量化、译码且发送于视频位流中。本发明的技术可实现与那些由AIF实现的相当的译码改进,同时相对于AIF降低 实施复杂性。所描述的技术可不需要分析过程以导出每一视频帧的滤波器系数。而是,在 一个实例中,滤波器系数的不同集合经预先计算和预定义以用于实时应用。在此情况下,滤 波器系数的预定义可基于应用于测试序列的AIF或其它选择准则。三种不同类型的AIF方案已采用于KTA中。第一者为二维不可分AIF(NS-AIF), 第二者为可分AIF(S-AIF),且第三者为具有方向滤波器的AIF(DAIF)。然而,所有三个AIF 方案使用相同的分析过程以导出滤波器系数,其在下文使用不可分AIF作为实例来进行阐释。假定6X6 二维不可分滤波器具有系数,其中i,j = 0. . . 5且SP表示图4A到图 4D中所示的15个子像素位置(a到ο)中的一者。应注意,15个子像素位置中的6者“a”、 “b”、“c”、“d”、“h”和“1”为一维子像素位置,其可使用6分接头滤波器进行内插。而且假 定参考帧中的整数像素位置(图4A到图4D中的Al到F6)处的预测像素采取像素值Pi,其中 i,j = 0. . . 5。BP, Al 采取值 PQ,。,. . .,A6 采取值 P5,。,...,Fl 采取值 P5,。,...,且 F6 采取值P5,5。接着,在子像素位置SP,SP e {a,...,o}处的内插值psp可使用以下等式来计

权利要求
一种编码视频数据的方法,所述方法包含产生预测数据,其中产生所述预测数据包括基于多个不同的预定义内插滤波器而内插参考视频数据的像素值;以及基于所述预测数据而编码所述视频数据。
2.根据权利要求1所述的方法,其中基于多个不同的预定义内插滤波器而内插参考视 频数据的像素值包含基于预定义内插滤波器系数的多个不同集合而内插参考视频数据的像素值。
3.根据权利要求1所述的方法,其中编码所述视频数据包含基于与所述不同的预定义内插滤波器中的每一者相关联的所述预测数据而编码所述 视频数据;以及选择实现最高级别的数据压缩的经编码视频数据。
4.根据权利要求3所述的方法,其中编码所述视频数据进一步包含 识别与所述最高级别的数据压缩相关联的特定内插滤波器;以及编码语法以识别到解码器的所述特定内插滤波器。
5.根据权利要求4所述的方法,其进一步包含编码不同语法元素以识别用于产生所述视频数据的不同经译码单元的所述预测性数 据的不同参考视频单元的不同内插滤波器。
6.根据权利要求4所述的方法,其进一步包含编码不同语法元素以识别用于所述参考视频数据的不同视频块的不同内插滤波器。
7.根据权利要求1所述的方法,其中基于应用于测试视频序列的视频译码而预定义所 述预定义内插滤波器中的至少一些。
8.根据权利要求1所述的方法,其中内插与所述预定义内插滤波器中的至少一者相关 联的像素值包括基于整数像素值而产生半像素值;舍入所述半像素值以产生半像素内插值;存储所述半像素值以作为所述半像素值的未舍入版本;以及基于所述半像素值的所述未舍入版本和所述整数像素值而产生四分之一像素值。
9.根据权利要求8所述的方法,其中所述值中的每一者可存储于16位数据结构内,所 述方法进一步包含基于所述半像素值的多个所述未舍入版本而产生另一半像素值;舍入所述另一半像素值以使得所述另一半像素值可存储于所述16位数据结构内;以及基于所述另一半像素值和所述半像素值的所述未舍入版本而产生额外四分之一像素值。
10.一种解码视频数据的方法,所述方法包含接收语法元素,所述语法元素识别来自多个不同的预定义内插滤波器的内插滤波器; 产生预测数据,其中产生所述预测数据包括基于由所述语法元素识别的所述内插滤波 器而内插参考视频数据的像素值;以及基于所述预测数据而解码所述视频数据。
11.根据权利要求10所述的方法,其中基于由所述语法元素识别的所述内插滤波器而 内插参考视频数据的像素值包含基于由所述语法元素识别的内插滤波器系数的预定义集 合而内插参考视频数据的像素值。
12.根据权利要求10所述的方法,其中基于应用于测试视频序列的视频译码而预定义 所述预定义内插滤波器中的至少一些。
13.根据权利要求10所述的方法,其中内插像素值包括 基于整数像素值而产生半像素值;舍入所述半像素值以产生半像素内插值;存储所述半像素值以作为所述半像素值的未舍入版本;以及基于所述半像素值的所述未舍入版本和所述整数像素值而产生四分之一像素值。
14.根据权利要求13所述的方法,其中所述值中的每一者可存储于16位数据结构内, 其中内插像素值包括基于所述半像素值的多个所述未舍入版本而产生另一半像素值;舍入所述另一半像素值以使得所述另一半像素值可存储于所述16位数据结构内;以及基于所述另一半像素值和所述半像素值的所述未舍入版本而产生额外四分之一像素值。
15.根据权利要求10所述的方法,其进一步包含接收用于产生所述预测性数据的不同 参考视频单元的不同语法元素,和基于由所述不同语法元素识别的不同内插滤波器而内插 用于所述不同参考视频单元的像素值。
16.根据权利要求10所述的方法,其进一步包含接收用于产生所述预测性数据的参考 视频单元的不同视频块的不同语法元素,和基于由所述不同语法元素识别的不同内插滤波 器而内插用于所述不同视频块的像素值。
17.—种编码视频数据的设备,所述设备包含视频编码器,所述视频编码器包括产生预 测数据的运动补偿单元,其中所述运动补偿单元基于多个不同的预定义内插滤波器而内插参考视频数据的像 素值;且所述视频编码器基于所述预测数据而编码所述视频数据。
18.根据权利要求17所述的设备,其中所述多个不同的预定义内插滤波器是由预定义 内插滤波器系数的多个不同集合来定义。
19.根据权利要求17所述的设备,其中所述视频编码器基于与所述不同的预定义内插滤波器中的每一者相关联的所述预测数据而编码所述 视频数据;以及选择实现最高级别的数据压缩的经编码视频数据。
20.根据权利要求19所述的设备,其中所述视频编码器识别与所述最高级别的数据压缩相关联的特定内插滤波器;以及编码语法以识别到解 码器的所述特定内插滤波器。
21.根据权利要求20所述的设备,其中所述视频编码器编码不同语法元素以识别用于产生所述视频数据的不同经译码单元的所述预测性数据的不同参考视频单元的不同内插滤波器。
22.根据权利要求20所述的设备,其中所述视频编码器编码不同语法元素以识别用于所述参考视频数据的不同视频块的不同内插滤波器。
23.根据权利要求17所述的设备,其中所述预定义内插滤波器中的至少一些是基于应 用于测试视频序列的视频译码而经预定义。
24.根据权利要求17所述的设备,其中所述运动补偿单元 基于整数像素值而产生半像素值;舍入所述半像素值以产生半像素内插值;存储所述半像素值以作为所述半像素值的未舍入版本;以及基于所述半像素值的所述未舍入版本和所述整数像素值而产生四分之一像素值。
25.根据权利要求24所述的设备,其中所述值中的每一者可存储于16位数据结构内, 其中所述运动补偿单元基于所述半像素值的多个所述未舍入版本而产生另一半像素值;舍入所述另一半像素值以使得所述另一半像素值可存储于所述16位数据结构内;以及基于所述另一半像素值和所述半像素值的所述未舍入版本而产生额外四分之一像素值。
26.根据权利要求17所述的设备,其中所述设备包含集成电路。
27.根据权利要求17所述的设备,其中所述设备包含微处理器。
28.一种解码视频数据的设备,所述设备包含视频解码器,所述视频解码器包括运动补 偿单元,其中所述视频解码器接收语法元素,所述语法元素识别来自多个不同的预定义内插滤波器 的内插滤波器;所述运动补偿单元产生预测数据,其中产生所述预测数据包括基于由所述语法元素识 别的所述内插滤波器而内插参考视频数据的像素值;以及 所述视频解码器基于所述预测数据而解码所述视频数据。
29.根据权利要求28所述的设备,其中所述多个不同的预定义内插滤波器是由预定义 内插滤波器系数的多个不同集合来定义。
30.根据权利要求28所述的设备,其中所述预定义内插滤波器中的至少一些是基于应 用于测试视频序列的视频译码而经预定义。
31.根据权利要求28所述的设备,其中所述运动补偿单元 基于整数像素值而产生半像素值;舍入所述半像素值以产生半像素内插值;存储所述半像素值以作为所述半像素值的未舍入版本;以及基于所述半像素值的所述未舍入版本和所述整数像素值而产生四分之一像素值。
32.根据权利要求31所述的设备,其中所述值中的每一者可存储于16位数据结构内, 其中所述运动补偿单元基于所述半像素值的多个所述未舍入版本而产生另一半像素值;舍入所述另一半像素值以使得所述另一半像素值可存储于所述16位数据结构内;以及基于所述另一半像素值和所述半像素值的所述未舍入版本而产生额外四分之一像素值。
33.根据权利要求28所述的设备,其中所述视频解码器接收用于产生所述预测性数据 的不同参考视频单元的不同语法元素,且所述运动补偿单元基于由所述不同语法元素识别 的不同内插滤波器而内插用于所述不同参考视频单元的像素值。
34.根据权利要求28所述的设备,其中所述视频解码器接收用于产生所述预测性数据 的参考视频单元的不同视频块的不同语法元素,且所述运动补偿单元基于由所述不同语法 元素识别的不同内插滤波器而内插用于所述不同视频块的像素值。
35.根据权利要求28所述的设备,其中所述设备包含集成电路。
36.根据权利要求28所述的设备,其中所述设备包含微处理器。
37.一种计算机可读存储媒体,其包含在执行后即刻致使装置编码视频数据的指令,其 中所述指令致使所述装置执行以下操作产生预测数据,其中产生所述预测数据包括基于多个不同的预定义内插滤波器而内插 参考视频数据的像素值;以及基于所述预测数据而编码所述视频数据。
38.根据权利要求37所述的计算机可读存储媒体,其中所述多个不同的预定义内插滤 波器是由预定义内插滤波器系数的多个不同集合来定义。
39.根据权利要求37所述的计算机可读存储媒体,其中所述指令致使所述装置执行以 下操作基于与所述不同的预定义内插滤波器中的每一者相关联的所述预测数据而编码所述 视频数据;以及选择实现最高级别的数据压缩的经编码视频数据。
40.一种计算机可读存储媒体,其包含在执行后即刻致使装置解码视频数据的指令,其 中所述指令致使所述装置执行以下操作在接收到识别来自多个不同的预定义内插滤波器的内插滤波器的语法元素后即刻,产生预测数据,其中产生所述预测数据包括基于由所述语法元素识别的所述内插滤波 器而内插参考视频数据的像素值;以及基于所述预测数据而解码所述视频数据。
41.根据权利要求40所述的计算机可读存储媒体,其中所述预定义内插滤波器中的至 少一些是基于应用于测试视频序列的视频译码而经预定义。
42.根据权利要求40所述的计算机可读存储媒体,其中所述指令致使所述装置执行以 下操作在接收到用于产生所述预测性数据的不同参考视频单元的不同语法元素后即刻,基于由所述不同语法元素识别的不同内插滤波器而内插用于所述不同参考视频单元 的像素值。
43.根据权利要求40所述的计算机可读存储媒体,其中所述指令致使所述装置执行以 下操作在接收到用于产生所述预测性数据的参考视频单元的不同视频块的不同语法元素后即刻,基于由所述不同语法元素识别的不同内插滤波器而内插用于所述不同视频块的像素值。
44.一种编码视频数据的装置,所述装置包含用于产生预测数据的装置,其中用于产生所述预测数据的装置包括用于基于多个不同的预定义内插滤波器而内插参考视频数据的像素值的装置;以及 用于基于所述预测数据而编码所述视频数据的装置。
45.一种解码视频数据的装置,所述装置包含用于接收语法元素的装置,所述语法元素识别来自多个不同的预定义内插滤波器的内 插滤波器;用于产生预测数据的装置,其中用于产生所述预测数据的装置包括用于基于由所述语 法元素识别的所述内插滤波器而内插参考视频数据的像素值的装置;以及 用于基于所述预测数据而解码所述视频数据的装置。
46.一种编码视频数据的装置,所述装置包含视频编码器,其包括运动补偿单元,所述运动补偿单元通过基于多个不同的预定义内 插滤波器而内插参考视频数据的像素值来产生预测数据,且基于所述预测数据而编码所述 视频数据;以及无线发射器,其将所述视频数据发射到另一装置。
47.根据权利要求46所述的装置,其中所述装置包含无线通信手持机。
48.一种解码视频数据的装置,所述装置包含 无线接收器,其接收所述视频数据;以及视频解码器,其包括运动补偿单元,所述视频解码器接收语法元素,所述语法元素识别来自多个不同的预定义内插滤波器的内插滤波器; 产生预测数据,其中产生所述预测数据包括基于由所述语法元素识别的所述内插滤波 器而内插参考视频数据的像素值;以及基于所述预测数据而解码所述视频数据。
49.根据权利要求48所述的装置,其中所述装置包含无线通信手持机。
全文摘要
本发明描述由编码器和解码器在视频译码的运动补偿过程期间执行的各种内插技术。在一个实例中,编码器基于多个不同的预定义内插滤波器而内插参考视频数据的像素值。在此实例中,所述解码器接收识别内插滤波器的语法元素,且基于由所述语法元素识别的所述内插滤波器而内插参考视频数据的像素值。在另一实例中,一种内插预测性视频数据的方法包括基于整数像素值而产生半像素值;舍入所述半像素值以产生半像素内插值;存储所述半像素值以作为所述半像素值的未舍入版本;以及基于所述半像素值的所述未舍入版本和所述整数像素值而产生四分之一像素值。
文档编号H04N7/26GK101990760SQ200980112683
公开日2011年3月23日 申请日期2009年4月10日 优先权日2008年4月10日
发明者叶琰, 玛尔塔·卡切维奇, 陈培松 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1