用于视频译码的内容自适应变换精度的制作方法

文档序号:27970939发布日期:2021-12-14 21:39阅读:97来源:国知局
用于视频译码的内容自适应变换精度的制作方法
用于视频译码的内容自适应变换精度
相关申请的交叉参考
1.本技术要求2019年3月26日申请的美国序列号62/823,738的优先权,其全部内容通过引用而被并入本文。


背景技术:

2.视频译码(coding)系统可以用于压缩数字视频信号,例如,以减少这种信号所需的存储和/或传输带宽。


技术实现要素:

3.公开了系统、方法和装置,用于获得包括多个块的量化变换系数的译码视频数据,获得与第一块相关联的第一精度因子以对该第一块执行至少一个解码(decoding)功能,获得与第二块相关联的第二精度因子以对该第二块执行所述至少一个解码功能,以及使用所述第一精度因子对所述第一块的所述量化变换系数执行所述至少一个解码功能,并且使用所述第二精度因子对所述第二块的所述量化变换系数执行所述至少一个解码功能。
4.可从所述译码视频数据获得所述第一精度因子(例如,与所述第一块相关联)和所述第二精度因子(例如,与第二块相关联)。所述第一精度因子及所述第二精度因子可基于它们的相应块的所述变换系数的量值(magnitude)来获得。所述第一精度因子与所述第二精度因子可不同(例如,取决于所述相应块的内容)。
5.所述至少一个解码功能可以包括解量化。所述第一精度因子可包括第一解量化移位。所述第二精度因子可包括第二解量化移位。
6.所述至少一个解码功能可以包括逆变换。所述第一精度因子可包括第一中间变换移位。所述第二精度因子可包括第二中间变换移位。获得与所述第一块相关联的所述第一精度因子可包含:基于第一逆变换的输出的绝对量值的界限,确定与所述第一块相关联的所述中间变换移位,且所述至少一个解码功能可包含第二逆变换。
7.所述第一精度因子可包括解量化移位及中间变换移位。可基于与所述第一块相关联的所述解量化移位来确定与所述第一块相关联的所述中间变换移位。可基于与所述第一块相关联的所述解量化移位及中间变换移位获得与所述第一块相关联的归一化移位。可以使用该归一化移位对所述第一块执行归一化处理。所述解量化移位、所述中间变换移位及所述归一化移位的总和可为内容独立的值。
8.公开了系统、方法和手段,用于获得多个视频数据块的预测残差数据,分析所述预测残差数据以确定表示块的量值输入,确定与第一块相关联的第一精度因子以对所述第一块执行至少一个编码(encoding)功能,确定与第二块相关联的第二精度因子以对所述第二块执行所述至少一个编码功能,以及使用所述第一精度因子对所述第一块的输入执行所述至少一个编码功能并使用所述第二精度因子对所述第二块的输入执行所述至少一个编码功能。
9.所述至少一个编码功能可包括水平变换或量化中的至少一者。
10.可将关于所述第一块的所述第一精度因子的指示包含在表示所述视频数据的比特流中。和/或可将关于所述第二块的所述第二精度因子的指示包含于表示所述视频数据的比特流中。关于所述第一精度因子的所述指示可以包括用于执行至少一个解码功能的分数比特的数量。
11.可在垂直变换之前,执行分析预测残差数据,以确定可用以表示块的最大量值输入(例如,量值输入可基于与块相关联的残差系数的最大量值)。
12.所述第一精度因子与所述第二精度因子可不同。
13.本文描述的系统、方法和手段可涉及解码器。在一些示例中,本文描述的系统、方法和手段可涉及编码器。在一些示例中,本文描述的系统、方法和手段可涉及信号(例如,来自编码器和/或由解码器接收)。计算机可读介质可以包括用于使一个或多个处理器执行本文描述的方法的指令。计算机程序产品可以包括指令,当该程序由一个或多个处理器执行时,所述指令可以使所述一个或多个处理器执行本文描述的方法。
附图说明
14.图1a是示出了可以实施所公开的一个或多个实施例的示例通信系统的系统图示;
15.图1b是示出了根据一个实施例的可以在图1a所示的通信系统内部使用的示例无线发射/接收单元(wtru)的系统图示;
16.图1c是示出了根据一个实施例的可以在图1a所示的通信系统内部使用的例示无线电接入网络(ran)和例示核心网络(cn)的系统图示;
17.图1d是示出了根据一个实施例的可以在图1a所示的通信系统内部使用的另一个例示ran和另一个例示cn的系统图示;
18.图2示出了示例性的基于块的视频编码器。
19.图3示出了示例视频解码器。
20.图4示出了可以在其中实现各个方面和示例的系统的示例。
21.图4a示出了一般编码器结构的示例。
22.图5示出了解量化和/或逆变换的示例。
23.图6示出了待使用的比特的示例(例如,在对样本序列进行逆变换之前(例如,仅帧内))。
24.图7示出了解量化和/或逆变换的示例。
25.图8示出了根据本发明的解码操作的流程图的示例。
26.图9示出了前向变换中的移位的示例。
27.图10示出了内容自适应变换精度(cat)前向编码器的示例。
28.图11示出了根据本公开的编码操作的流程图的示例。
具体实施方式
29.从以下结合附图以示例方式给出的描述中可以更详细地理解本发明。
30.图1a是示出了可以实施所公开的一个或多个实施例的例示通信系统100的图示。该通信系统100可以是为多个无线用户提供语音、数据、视频、消息传递、广播等内容的多址接入系统。该通信系统100可以通过共享包括无线带宽在内的系统资源而使多个无线用户
能够访问此类内容。举例来说,通信系统100可以使用一种或多种信道接入方法,例如码分多址(cdma)、时分多址(tdma)、频分多址(fdma)、正交fdma(ofdma)、单载波fdma(sc

fdma)、零尾唯一字dft扩展ofdm(zt uw dts

s ofdm)、唯一字ofdm(uw

ofdm)、资源块过滤ofdm以及滤波器组多载波(fbmc)等等。
31.如图1a所示,通信系统100可以包括无线发射/接收单元(wtru)102a、102b、102c、102d、ran 104/113、cn 106/115、公共交换电话网络(pstn)108、因特网110以及其他网络112,然而应该了解,所公开的实施例设想了任意数量的wtru、基站、网络和/或网络部件。每一个wtru 102a、102b、102c、102d可以是被配置成在无线环境中工作和/或通信的任何类型的设备。举例来说,任一wtru 102a、102b、102c、102d都可被称为“站”和/或“sta”,其可以被配置成发射和/或接收无线信号,并且可以包括用户设备(ue)、移动站、固定或移动订户单元、基于签约的单元、寻呼机、蜂窝电话、个人数字助理(pda)、智能电话、膝上型计算机、上网本、个人计算机、无线传感器、热点或mi

fi设备、物联网(iot)设备、手表或其他可穿戴设备、头戴显示器(hmd)、车辆、无人机、医疗设备和应用(例如,远程手术)、工业设备和应用(例如,机器人和/或在工业和/或自动处理链环境中工作的其他无线设备)、消费类电子设备、以及在商业和/或工业无线网络上工作的设备等等。wtru102a、102b、102c、102d中的任意者可被可交换地称为ue。
32.通信系统100还可以包括基站114a和/或基站114b。每一个基站114a和/或基站114b可以是被配置成通过以无线方式与wtru 102a、102b、102c、102d中的至少一个无线对接来促使其接入一个或多个通信网络(例如,cn 106/115、因特网110、和/或其他网络112)的任何类型的设备。例如,基站114a、114b可以是基地收发信台(bts)、节点b、e节点b、家庭节点b、家庭e节点b、gnb、nr节点b、站点控制器、接入点(ap)、以及无线路由器等等。虽然每一个基站114a、114b都被描述成了单个部件,然而应该了解,基站114a、114b可以包括任何数量的互连基站和/或网络部件。
33.基站114a可以是ran 104/113的一部分,并且所述ran还可以包括其他基站和/或网络部件(未显示),例如基站控制器(bsc)、无线电网络控制器(rnc)、中继节点等等。基站114a和/或基站114b可被配置成在名为小区(未显示)的一个或多个载波频率上发射和/或接收无线信号。这些频率可以处于许可频谱、无许可频谱或是授权与无许可频谱的组合之中。小区可以为相对固定或者有可能随时间变化的特定地理区域提供无线服务覆盖。小区可被进一步分成小区扇区。例如,与基站114a相关联的小区可被分为三个扇区。由此,在一个实施例中,基站114a可以包括三个收发信机,即,每一个收发信机都对应于小区的一个扇区。在一个实施例中,基站114a可以使用多输入多输出(mimo)技术,并且可以为小区的每一个扇区使用多个收发信机。例如,通过使用波束成形,可以在期望的空间方向上发射和/或接收信号。
34.基站114a、114b可以通过空中接口116来与wtru 102a、102b、102c、102d中的一个或多个进行通信,其中所述空中接口可以是任何适当的无线通信链路(例如,射频(rf)、微波、厘米波、毫米波、红外线(ir)、紫外线(uv)、可见光等等)。空中接口116可以使用任何适当的无线电接入技术(rat)来建立。
35.更具体地说,如上所述,通信系统100可以是多址接入系统,并且可以使用一种或多种信道接入方案,例如cdma、tdma、fdma、ofdma以及sc

fdma等等。例如,ran 104/113中的
基站114a与wtru 102a、102b、102c可以实施某种无线电技术,例如通用移动电信系统(umts)陆地无线电接入(utra),其中所述技术可以使用宽带cdma(wcdma)来建立空中接口115/116/117。wcdma可以包括如高速分组接入(hspa)和/或演进型hspa(hspa+)之类的通信协议。hspa可以包括高速下行链路(dl)分组接入(hsdpa)和/或高速ul分组接入(hsupa)。
36.在一个实施例中,基站114a和wtru 102a、102b、102c可以某种无线电技术,例如演进型umts陆地无线电接入(e

utra),其中所述技术可以使用长期演进(lte)和/或先进lte(lte

a)和/或先进lta pro(lte

a pro)来建立空中接口116。
37.在一个实施例中,基站114a和wtru 102a、102b、102c可以实施某种无线电技术,例如nr无线电接入,其中所述无线电技术可以建立使用新型无线电(nr)的空中接口116。
38.在一个实施例中,基站114a和wtru 102a、102b、102c可以实施多种无线电接入技术。例如,基站114a和wtru 102a、102b、102c可以共同实施lte无线电接入和nr无线电接入(例如,使用双连接(dc)原理)。由此,wtru 102a、102b、102c使用的空中接口可以通过多种类型的无线电接入技术和/或向/从多种类型的基站(例如,enb和gnb)发送的传输来表征。
39.在其他实施例中,基站114a和wtru 102a、102b、102c可以实施以下的无线电技术,例如ieee 802.11(即,无线高保真(wifi))、ieee802.16(即,全球微波接入互操作性(wimax))、cdma2000、cdma2000 1x、cdma2000 ev

do、临时标准2000(is

2000)、临时标准95(is

95)、临时标准856(is

856)、全球移动通信系统(gsm)、用于gsm演进的增强数据速率(edge)以及gsm edge(geran)等等。
40.图1a中的基站114b可以是无线路由器、家庭节点b、家庭e节点b或接入点,并且可以使用任何适当的rat来促成局部区域中的无线连接,例如营业场所、住宅、车辆、校园、工业设施、空中走廊(例如,供无人机使用)以及道路等等。在一个实施例中,基站114b与wtru 102c、102d可以通过实施ieee 802.11之类的无线电技术来建立无线局域网(wlan)。在一个实施例中,基站114b与wtru 102c、102d可以通过实施ieee 802.15之类的无线电技术来建立无线个人局域网(wpan)。在再一个实施例中,基站114b和wtru 102c、102d可通过使用基于蜂窝的rat(例如,wcdma、cdma2000、gsm、lte、lte

a、lte

a pro、nr等等)来建立微微小区或毫微微小区。如图1a所示,基站114b可以直连到因特网110。由此,基站114b不需要经由cn 106/115来接入因特网110。
41.ran 104/113可以与cn 106/115进行通信,所述cn可以是被配置成向一个或多个wtru 102a、102b、102c、102d提供语音、数据、应用和/或借助网际协议语音(voip)服务的任何类型的网络。该数据可以具有不同的服务质量(qos)需求,例如不同的吞吐量需求、时延需求、容错需求、可靠性需求、数据吞吐量需求、以及移动性需求等等。cn 106/115可以提供呼叫控制、记账服务、基于移动位置的服务、预付费呼叫、因特网连接、视频分发等等,和/或可以执行用户验证之类的高级安全功能。虽然在图1a中没有显示,然而应该了解,ran 104/113和/或cn 106/115可以直接或间接地和其他那些与ran 104/113使用相同rat或不同rat的ran进行通信。例如,除了与使用nr无线电技术的ran 104/113相连之外,cn 106/115还可以与使用gsm、umts、cdma 2000、wimax、e

utra或wifi无线电技术的别的ran(未显示)通信。
42.cn 106/115还可以充当供wtru 102a、102b、102c、102d接入pstn 108、因特网110和/或其他网络112的网关。pstn 108可以包括提供简易老式电话服务(pots)的电路交换电话网络。因特网110可以包括使用了公共通信协议(例如,tcp/ip网际协议族中的传输控制
协议(tcp)、用户数据报协议(udp)和/或网际协议(ip))的全球性互联计算机网络设备系统。网络112可以包括由其他服务供应商拥有和/或运营的有线和/或无线通信网络。例如,网络112可以包括与一个或多个ran相连的另一个cn,其中所述一个或多个ran可以与ran 104/113使用相同rat或不同rat。
43.通信系统100中一些或所有wtru 102a、102b、102c、102d可以包括多模能力(例如,wtru 102a、102b、102c、102d可以包括在不同无线链路上与不同无线网络通信的多个收发信机)。例如,图1a所示的wtru 102c可被配置成与使用基于蜂窝的无线电技术的基站114a通信,以及与可以使用ieee 802无线电技术的基站114b通信。
44.图1b是示出了例示wtru 102的系统图示。如图1b所示,wtru 102可以包括处理器118、收发信机120、发射/接收部件122、扬声器/麦克风124、数字键盘126、显示器/触摸板128、不可移除存储器130、可移除存储器132、电源134、全球定位系统(gps)芯片组136以及其他周边设备138。应该了解的是,在保持符合实施例的同时,wtru 102还可以包括前述部件的任何子组合。
45.处理器118可以是通用处理器、专用处理器、常规处理器、数字信号处理器(dsp)、多个微处理器、与dsp核心关联的一个或多个微处理器、控制器、微控制器、专用集成电路(asic)、现场可编程门阵列(fpga)电路、其他任何类型的集成电路(ic)以及状态机等等。处理器118可以执行信号编码、数据处理、功率控制、输入/输出处理、和/或其他任何能使wtru 102在无线环境中工作的功能。处理器118可以耦合至收发信机120,收发信机120可以耦合至发射/接收部件122。虽然图1b将处理器118和收发信机120描述成单独组件,然而应该了解,处理器118和收发信机120也可以集成在一个电子组件或芯片中。
46.发射/接收部件122可被配置成经由空中接口116来发射或接收去往或来自基站(例如,基站114a)的信号。举个例子,在一个实施例中,发射/接收部件122可以是被配置成发射和/或接收rf信号的天线。作为示例,在另一个实施例中,发射/接收部件122可以是被配置成发射和/或接收ir、uv或可见光信号的放射器/检测器。在再一个实施例中,发射/接收部件122可被配置成发射和/或接收rf和光信号。应该了解的是,发射/接收部件122可以被配置成发射和/或接收无线信号的任何组合。
47.虽然在图1b中将发射/接收部件122描述成是单个部件,但是wtru 102可以包括任何数量的发射/接收部件122。更具体地说,wtru 102可以使用mimo技术。由此,在一个实施例中,wtru 102可以包括两个或多个通过空中接口116来发射和接收无线电信号的发射/接收部件122(例如,多个天线)。
48.收发信机120可被配置成对发射/接收部件122所要传送的信号进行调制,以及对发射/接收部件122接收的信号进行解调。如上所述,wtru102可以具有多模能力。因此,收发信机120可以包括允许wtru102借助多种rat(例如,nr和ieee 802.11)来进行通信的多个收发信机。
49.wtru 102的处理器118可以耦合到扬声器/麦克风124、数字键盘126和/或显示器/触摸板128(例如,液晶显示器(lcd)显示单元或有机发光二极管(oled)显示单元),并且可以接收来自这些部件的用户输入数据。处理器118还可以向扬声器/麦克风124、数字键盘126和/或显示器/触摸板128输出用户数据。此外,处理器118可以从诸如不可移除存储器130和/或可移除存储器132之类的任何适当的存储器中存取信息,以及将信息存入这些存
储器。不可移除存储器130可以包括随机存取存储器(ram)、只读存储器(rom)、硬盘或是其他任何类型的记忆存储设备。可移除存储器132可以包括订户身份模块(sim)卡、记忆棒、安全数字(sd)记忆卡等等。在其他实施例中,处理器118可以从那些并非实际位于wtru 102的存储器存取信息,以及将数据存入这些存储器,作为示例,此类存储器可以位于服务器或家庭计算机(未显示)。
50.处理器118可以接收来自电源134的电力,并且可被配置分发和/或控制用于wtru 102中的其他组件的电力。电源134可以是为wtru 102供电的任何适当设备。例如,电源134可以包括一个或多个干电池组(如镍镉(ni

cd)、镍锌(ni

zn)、镍氢(nimh)、锂离子(li

ion)等等)、太阳能电池以及燃料电池等等。
51.处理器118还可以耦合到gps芯片组136,该芯片组可被配置成提供与wtru 102的当前位置相关的位置信息(例如,经度和纬度)。作为来自gps芯片组136的信息的补充或替换,wtru 102可以经由空中接口116接收来自基站(例如,基站114a、114b)的位置信息,和/或根据从两个或多个附近基站接收的信号定时来确定其位置。应该了解的是,在保持符合实施例的同时,wtru 102可以借助任何适当的定位方法来获取位置信息。
52.处理器118还可以耦合到其他周边设备138,其中所述周边设备可以包括提供附加特征、功能和/或有线或无线连接的一个或多个软件和/或硬件模块。例如,周边设备138可以包括加速度计、电子指南针、卫星收发信机、数码相机(用于照片和/或视频)、通用串行总线(usb)端口、振动设备、电视收发信机、免提耳机、模块、调频(fm)无线电单元、数字音乐播放器、媒体播放器、视频游戏机模块、因特网浏览器、虚拟现实和/或增强现实(vr/ar)设备、以及活动跟踪器等等。周边设备138可以包括一个或多个传感器,所述传感器可以是以下的一个或多个:陀螺仪、加速度计、霍尔效应传感器、磁强计、方位传感器、邻近传感器、温度传感器、时间传感器、地理位置传感器、高度计、光传感器、触摸传感器、磁力计、气压计、手势传感器、生物测定传感器和/或湿度传感器。
53.wtru 102可以包括全双工无线电设备,其中对于该无线电设备来说,一些或所有信号(例如,与用于ul(例如,对传输而言)和下行链路(例如,对接收而言)的特定子帧相关联)的接收或传输可以是并发和/或同时的。全双工无线电设备可以包括借助于硬件(例如,扼流线圈)或是凭借处理器(例如,单独的处理器(未显示)或是凭借处理器118)的信号处理来减小和/或基本消除自干扰的干扰管理单元。在一个实施例中,wtru 102可以包括传送或接收一些或所有信号(例如,与用于ul(例如,对传输而言)或下行链路(例如,对接收而言)的特定子帧相关联)的半双工无线电设备。
54.图1c是示出了根据一个实施例的ran 104和cn 106的系统图示。如上所述,ran 104可以在空中接口116上使用e

utra无线电技术来与wtru 102a、102b、102c进行通信。所述ran 104还可以与cn 106进行通信。
55.ran 104可以包括e节点b160a、160b、160c,然而应该了解,在保持符合实施例的同时,ran 104可以包括任何数量的e节点b。每一个e节点b 160a、1 60b、160c都可以包括在空中接口116上与wtru 102a、102b、102c通信的一个或多个收发信机。在一个实施例中,e节点b 160a、160b、160c可以实施mimo技术。由此,举例来说,e节点b 140a可以使用多个天线来向wtru 102a发射无线信号,和/或接收来自wtru 102a的无线信号。
56.每一个e节点b 160a、160b、160c都可以关联于一个特定小区(未显示),并且可被
配置成处理无线电资源管理决策、切换决策、ul和/或dl中的用户调度等等。如图1c所示,e节点b 160a、160b、160c彼此可以通过x2接口进行通信。
57.图1c所示的cn 106可以包括移动性管理实体(mme)162、服务网关(sgw)164以及分组数据网络(pdn)网关(或pgw)166。虽然前述的每一个部件都被描述成是cn 106的一部分,然而应该了解,这其中的任一部件都可以由cn运营商之外的实体拥有和/或运营。
58.mme 162可以经由s1接口连接到ran 104中的每一个e节点b160a、160b、160c,并且可以充当控制节点。例如,mme 142可以负责验证wtru 102a、102b、102c的用户,执行承载激活/去激活处理,以及在wtru 102a、102b、102c的初始附着过程中选择特定的服务网关等等。mme 162还可以提供一个用于在ran 104与使用其他无线电技术(例如,gsm和/或wcdma)的其他ran(未显示)之间进行切换的控制平面功能。
59.sgw 164可以经由s1接口连接到ran 104中的每一个e节点b 160a、160b、160c。sgw 164通常可以路由和转发去往/来自wtru 102a、102b、102c的用户数据分组。并且,sgw 164还可以执行其他功能,例如在e节点b间的切换过程中锚定用户平面,在dl数据可供wtru 102a、102b、102c使用时触发寻呼处理,以及管理并存储wtru 102a、102b、102c的上下文等等。
60.sgw 164可以连接到pgw 166,所述pgw可以为wtru 102a、102b、102c提供分组交换网络(例如,因特网110)接入,以便促成wtru 102a、102b、102c与启用ip的设备之间的通信。
61.cn 106可以促成与其他网络的通信。例如,cn 106可以为wtru 102a、102b、102c提供电路交换网络(例如,pstn 108)接入,以便促成wtru102a、102b、102c与传统的陆线通信设备之间的通信。例如,cn 106可以包括一个ip网关(例如,ip多媒体子系统(ims)服务器)或与之进行通信,并且该ip网关可以充当cn 106与pstn 108之间的接口。此外,cn 106可以为wtru 102a、102b、102c提供针对其他网络112的接入,其中该网络可以包括其他服务供应商拥有和/或运营的其他有线和/或无线网络。
62.虽然在图1a

1d中将wtru描述成了无线终端,然而应该想到的是,在某些代表性实施例中,此类终端与通信网络可以使用(例如,临时或永久性)有线通信接口。
63.在一些代表性的实施例中,其他网络112可以是wlan。
64.采用基础架构基本服务集(bss)模式的wlan可以具有用于所述bss的接入点(ap)以及与所述ap相关联的一个或多个站(sta)。所述ap可以访问或是对接到分布式系统(ds)或是将业务量送入和/或送出bss的别的类型的有线/无线网络。源于bss外部且去往sta的业务量可以通过ap到达并被递送至sta。源自sta且去往bss外部的目的地的业务量可被发送至ap,以便递送到相应的目的地。处于bss内部的sta之间的业务量可以通过ap来发送,例如其中源sta可以向ap发送业务量并且ap可以将业务量递送至目的地sta。处于bss内部的sta之间的业务量可被认为和/或称为点到点业务量。所述点到点业务量可以在源与目的地sta之间(例如,在其间直接)用直接链路建立(dls)来发送。在某些代表性实施例中,dls可以使用802.11e dls或802.11z隧道化dls(tdls))。举例来说,使用独立bss(ibss)模式的wlan可不具有ap,并且处于所述ibss内部或是使用所述ibss的sta(例如,所有sta)彼此可以直接通信。在这里,ibss通信模式有时可被称为“自组织”通信模式。
65.在使用802.11ac基础设施工作模式或类似的工作模式时,ap可以在固定信道(例如,主信道)上传送信标。所述主信道可以具有固定宽度(例如,20mhz的带宽)或是借助信令
动态设置的宽度。主信道可以是bss的工作信道,并且可被sta用来与ap建立连接。在某些代表性实施例中,所实施的可以是具有冲突避免的载波感测多址接入(csma/ca)(例如,在802.11系统中)。对于csma/ca来说,包括ap在内的sta(例如,每一个sta)可以感测主信道。如果特定sta感测到/检测到和/或确定主信道繁忙,那么所述特定sta可以退避。在指定的bss中,在任何指定时间都有一个sta(例如,只有一个站)进行传输。
66.高吞吐量(ht)sta可以使用宽度为40mhz的信道来进行通信(例如,借助于将宽度为20mhz的主信道与宽度为20mhz的相邻或不相邻信道相结合来形成宽度为40mhz的信道)。
67.甚高吞吐量(vht)sta可以支持宽度为20mhz、40mhz、80mhz和/或160mhz的信道。40mhz和/或80mhz信道可以通过组合连续的20mhz信道来形成。160mhz信道可以通过组合8个连续的20mhz信道或者通过组合两个不连续的80mhz信道(这种组合可被称为80+80配置)来形成。对于80+80配置来说,在信道编码之后,数据可被传递并经过一个分段解析器,所述分段解析器可以将数据非成两个流。在每一个流上可以单独执行反向快速傅里叶变换(ifft)处理以及时域处理。所述流可被映射在两个80mhz信道上,并且数据可以由执行传输的sta来传送。在执行接收的sta的接收机上,用于80+80配置的上述操作可以是相反的,并且组合数据可被发送至介质接入控制(mac)。
68.802.11af和802.11ah支持次1ghz的工作模式。相比于802.11n和802.11ac,在802.11af和802.11ah中使用信道工作带宽和载波有所缩减。802.11af在tv白空间(tvws)频谱中支持5mhz、10mhz和20mhz带宽,并且802.11ah支持使用非tvws频谱的1mhz、2mhz、4mhz、8mhz和16mhz带宽。依照代表性实施例,802.11ah可以支持仪表类型控制/机器类型通信(例如,宏覆盖区域中的mtc设备)。mtc可以具有某种能力,例如包含了支持(例如,只支持)某些和/或有限带宽在内的受限能力。mtc设备可以包括电池,并且该电池的电池寿命高于阈值(例如,用于保持很长的电池寿命)。
69.对于可以支持多个信道和信道带宽的wlan系统(例如,802.11n、802.11ac、802.11af以及802.11ah)来说,这些系统包含了一个可被指定成主信道的信道。所述主信道的带宽可以等于bss中的所有sta所支持的最大公共工作带宽。主信道的带宽可以由某一个sta设置和/或限制,其中所述sta源自在支持最小带宽工作模式的bss中工作的所有sta。在关于802.11ah的示例中,即使bss中的ap和其他sta支持2mhz、4mhz、8mhz、16mhz和/或其他信道带宽工作模式,但对支持(例如,只支持)1mhz模式的sta(例如,mtc类型的设备)来说,主信道的宽度可以是1mhz。载波感测和/或网络分配向量(nav)设置可以取决于主信道的状态。如果主信道繁忙(例如,因为sta(其只支持1mhz工作模式)对ap进行传输),那么即使大多数的频带保持空间并且可供使用,也可以认为整个可用频带繁忙。
70.在美国,可供802.11ah使用的可用频带是902mhz到928mhz。在韩国,可用频带是917.5mhz到923.5mhz。在日本,可用频带是916.5mhz到927.5mhz。依照国家码,可用于802.11ah的总带宽是6mhz到26mhz。
71.图1d是示出了根据一个实施例的ran 113和cn 115的系统图示。如上所述,ran 113可以在空中接口116上使用nr无线电技术来与wtru 102a、102b、102c进行通信。ran 113还可以与cn 115进行通信。
72.ran 113可以包括gnb 180a、180b、180c,但是应该了解,在保持符合实施例的同时,ran 113可以包括任意数量的gnb。每一个gnb 180a、180b、180c都可以包括一个或多个
收发信机,以便通过空中接口116来与wtru 102a、102b、102c通信。在一个实施例中,gnb 180a、180b、180c可以实施mimo技术。例如,gnb 180a、180b可以使用波束成形处理来向和/或从gnb 180a、180b、180c发射和/或接收信号。由此,举例来说,gnb 180a可以使用多个天线来向wtru 102a发射无线信号,和/或接收来自wtru 102a的无线信号。在一个实施例中,gnb 180a、180b、180c可以实施载波聚合技术。例如,gnb 180a可以向wtru 102a传送多个分量载波(未显示)。这些分量载波的一个子集可以处于无许可频谱上,而剩余分量载波则可以处于许可频谱上。在一个实施例中,gnb 180a、180b、180c可以实施协作多点(comp)技术。例如,wtru 102a可以接收来自gnb 180a和gnb 180b(和/或gnb 180c)的协作传输。
73.wtru 102a、102b、102c可以使用与可扩缩参数配置相关联的传输来与gnb 180a、180b、180c进行通信。例如,对于不同的传输、不同的小区和/或不同的无线传输频谱部分来说,ofdm符号间隔和/或ofdm子载波间隔可以是不同的。wtru 102a、102b、102c可以使用具有不同或可扩缩长度的子帧或传输时间间隔(tti)(例如,包含了不同数量的ofdm符号和/或持续不同的绝对时间长度)来与gnb 180a、180b、180c进行通信。
74.gnb 180a、180b、180c可被配置成与采用独立配置和/或非独立配置的wtru 102a、102b、102c进行通信。在独立配置中,wtru 102a、102b、102c可以在不接入其他ran(例如,e节点b160a、160b、160c)的情况下与gnb 180a、180b、180c进行通信。在独立配置中,wtru 102a、102b、102c可以使用gnb 180a、180b、180c中的一个或多个作为移动锚点。在独立配置中,wtru 102a、102b、102c可以使用无许可频带中的信号来与gnb 180a、180b、180c进行通信。在非独立配置中,wtru 102a、102b、102c会在与别的ran(例如,e节点b160a、160b、160c)进行通信/相连的同时与gnb 180a、180b、180c进行通信/相连。举例来说,wtru 102a、102b、102c可以通过实施dc原理而以基本同时的方式与一个或多个gnb 180a、180b、180c以及一个或多个e节点b160a、160b、160c进行通信。在非独立配置中,e节点b 160a、160b、160c可以充当wtru 102a、102b、102c的移动锚点,并且gnb 180a、180b、180c可以提供附加的覆盖和/或吞吐量,以便为wtru 102a、102b、102c提供服务。
75.每一个gnb 180a、180b、180c都可以关联于特定小区(未显示),并且可以被配置成处理无线电资源管理决策、切换决策、ul和/或dl中的用户调度、支持网络切片、实施双连接性、实施nr与e

utra之间的互通处理、路由去往用户平面功能(upf)184a、184b的用户平面数据、以及路由去往接入和移动性管理功能(amf)182a、182b的控制平面信息等等。如图1d所示,gnb 180a、180b、180c彼此可以通过xn接口通信。
76.图1d所示的cn 115可以包括至少一个amf 182a、182b,至少一个upf 184a、184b,至少一个会话管理功能(smf)183a、183b,并且有可能包括数据网络(dn)185a、185b。虽然每一个前述部件都被描述了cn 115的一部分,但是应该了解,这其中的任一部件都可以被cn运营商之外的其他实体拥有和/或运营。
77.amf 182a、182b可以经由n2接口连接到ran 113中的一个或多个gnb 180a、180b、180c,并且可以充当控制节点。例如,amf 182a、182b可以负责验证wtru 102a、102b、102c的用户,支持网络切片(例如,处理具有不同需求的不同pdu会话),选择特定的smf 183a、183b,管理注册区域,终止nas信令,以及移动性管理等等。amf 182a、1823b可以使用网络切片处理,以便基于wtru 102a、102b、102c使用的服务类型来定制为wtru 102a、102b、102c提供的cn支持。作为示例,针对不同的使用情况,可以建立不同的网络切片,例如依赖于超可
靠低时延(urllc)接入的服务、依赖于增强型大规模移动宽带(embb)接入的服务、和/或用于机器类型通信(mtc)接入的服务等等。amf 162可以提供用于在ran 113与使用其他无线电技术(例如,lte、lte

a、lte

apro和/或诸如wifi之类的非3gpp接入技术)的其他ran(未显示)之间切换的控制平面功能。
78.smf 183a、183b可以经由n11接口连接到cn 115中的amf 182a、182b。smf 183a、183b还可以经由n4接口连接到cn 115中的upf 184a、184b。smf 183a、183b可以选择和控制upf 184a、184b,并且可以通过upf 184a、184b来配置业务量路由。smf 183a、183b可以执行其他功能,例如管理和分配ue ip地址、管理pdu会话、控制策略实施和qos、以及提供下行链路数据通知等等。pdu会话类型可以是基于ip的、不基于ip的、以及基于以太网的等等。
79.upf 184a、184b可以经由n3接口连接到ran 113中的一个或多个gnb 180a、180b、180c,这样可以为wtru 102a、102b、102c提供分组交换网络(例如,因特网110)接,以便促成wtru 102a、102b、102c与启用ip的设备之间的通信,upf 184、184b可以执行其他功能,例如路由和转发分组、实施用户平面策略、支持多宿主pdu会话、处理用户平面qos、缓冲下行链路分组、以及提供移动性锚定处理等等。
80.cn 115可以促成与其他网络的通信。例如,cn 115可以包括或者可以与充当cn 115与cn 108之间的接口的ip网关(例如,ip多媒体子系统(ims)服务器)进行通信。此外,cn 115可以为wtru 102a、102b、102c提供针对其他网络112的接入,这其中可以包括其他服务供应商拥有和/或运营的其他有线和/或无线网络。在一个实施例中,wtru 102a、102b、102c可以经由对接到upf 184a、184b的n3接口以及介于upf 184a、184b与dn 185a、185b之间的n6接口并通过upf 184a、184b连接到本地数据网络(dn)185a、185b。
81.有鉴于图1a

1d以及关于图1a

1d的相应描述,在这里对照以下的一项或多项描述的一个或多个或所有功能可以由一个或多个仿真设备(未显示)来执行:wtru 102a

d、基站114a

b、e节点b 160a

c、mme 162、sgw164、pgw 166、gnb 180a

c、amf 182a

ab、upf 184a

b、smf 183a

b、dn 185a

b和/或这里描述的其他任何设备。这些仿真设备可以是被配置成模拟这里一个或多个或所有功能的一个或多个设备。举例来说,这些仿真设备可用于测试其他设备和/或模拟网络和/或wtru功能。
82.仿真设备可被设计成在实验室环境和/或运营商网络环境中实施关于其他设备的一项或多项测试。例如,所述一个或多个仿真设备可以在被完全或部分作为有线和/或无线通信网络一部分实施和/或部署的同时执行一个或多个或所有功能,以便测试通信网络内部的其他设备。所述一个或多个仿真设备可以在被临时作为有线和/或无线通信网络的一部分实施/部署的同时执行一个或多个或所有功能。所述仿真设备可以直接耦合到别的设备以执行测试,和/或可以使用空中无线通信来执行测试。
83.一个或多个仿真设备可以在未被作为有线和/或无线通信网络一部分实施/部署的同时执行包括所有功能在内的一个或多个功能。例如,所述仿真设备可以在测试实验室和/或未被部署(例如,测试)的有线和/或无线通信网络的测试场景中使用,以便实施关于一个或多个组件的测试。所述一个或多个仿真设备可以是测试设备。所述仿真设备可以使用直接的rf耦合和/或借助了rf电路(作为示例,该电路可以包括一个或多个天线)的无线通信来发射和/或接收数据。
84.本技术描述了多个方面,这其中包括工具、特征、示例、模型、方法等。这些方面中
的许多方面被描述为具有特异性,并且至少为了示出个体特性,通常以可能听起来受限的方式来描述。然而,这是为了描述清楚的目的,并且不限制那些方面的应用或范围。实际上,所有不同的方面可以组合和互换以提供另外的方面。此外,这些方面也可以与在较早的申请中描述的方面组合和互换。
85.本技术中描述和预期的方面可以以许多不同的形式来实现。本文所述的图5

11可提供一些示例,但也可设想其它示例。图5

11的讨论不限制实现的广度。至少一个方面主要涉及视频编码和解码,并且至少一个其它方面主要涉及传送所生成或编码的比特流。这些和其它方面可实施为方法、装置、上面存储有用于根据所描述的方法中的任意者编码或解码视频数据的指令的计算机可读存储介质、和/或上面存储有根据所描述的方法中的任意者产生的比特流的计算机可读存储介质。
86.在本技术中,术语“重构”和“解码”可以互换使用,术语“像素”和“样本”可以互换使用,术语“图像”、“图片”和“帧”可以互换使用。
87.本文描述了各种方法,并且每种方法包括用于实现所描述的方法的一个或多个步骤或动作。除非方法的正确操作需要特定顺序的步骤或动作,否则可修改或组合特定步骤和/或动作的顺序和/或使用。另外,诸如“第一”、“第二”等术语可以在各种示例中用来修改元素、组件、步骤、操作等,诸如“第一解码”和“第二解码”。除非特别要求,否则这些术语的使用并不意味着对修改后的操作的排序。因此,在该示例中,第一解码不需要在第二解码之前执行,并且可以例如在第二解码之前、期间或在与第二解码重叠的时间段中发生。
88.本技术中描述的各种方法和其它方面可以用于修改如图2和图3所示的视频编码器200和解码器300的模块,例如解码模块,此外,本文公开的主题可以应用于例如任何类型、格式或版本的视频译码,无论是以标准还是推荐来描述,无论是预先存在的还是将来开发的,以及任何这样的标准和推荐的扩展。除非另外指出或在技术上排除,否则本技术中描述的方面可以单独或组合使用。
89.在本技术所描述的示例中使用了各种数值,例如比特数、比特深度等。这些和其它特定值是为了描述示例的目的,并且所描述的方面不限于这些特定值。
90.图2是示出了示例视频编码器的图。示例编码器200的变型均是可以预见的,但是为了清楚起见,下面描述该编码器200,而不描述所有预期的变型。
91.在被编码之前,视频序列可以经历预编码处理(201),例如,对输入颜色图片应用颜色变换(例如,从rgb 4∶4∶4到ycbcr 4∶2∶0的转换),或者执行输入图片分量的重新映射,以便获得对压缩更有弹性的信号分布(例如,使用颜色分量之一的直方图均衡)。元数据可以与所述预处理相关联,并且被附加到比特流。
92.在编码器200中,如下所述,由编码器元件对图片进行编码。以例如译码单元(cu)为单位分区(202)并处理要编码的图片。使用例如帧内或帧间模式来编码每个单元。当在帧内模式中对单元进行编码时,其执行帧内预测(260)。在帧间模式中,执行运动估计(275)和补偿(270)。编码器决定(205)使用帧内模式或帧间模式中的来对所述单元进行编码,并且通过例如预测模式标志来指示所述帧内/帧间决定。可以计算预测残差,例如,通过从原始图像块中减去(210)预测块来计算预测残差。
93.然后,对所述预测残差进行变换(225)和量化(230)。对量化的变换系数以及运动向量和其它语法元素进行熵译码(245)以输出比特流。编码器可以跳过所述变换,并直接对
未变换的残差信号应用量化。编码器可以绕过变换和量化,即,直接对所述残差进行译码而不应用所述变换或量化处理。
94.编码器对编码块进行解码,以提供用于进一步预测的参考。对量化变换系数进行解量化(240)和逆变换(250)以对预测残差进行解码。将解码的预测残差与预测块进行组合(255),重构图像块。环内滤波器(265)被应用于重构的图片,以执行例如解块/sao(采样自适应偏移)滤波,从而减少编码伪像。将滤波图像存储在参考图片缓冲器(280)中。
95.图3是示出了视频解码器的示例的图。在示例解码器300中,如下所述,由解码器元件解码比特流。视频解码器300通常执行与图2中所描述的编码回合互逆的解码回合。编码器200通常还执行视频解码作为对视频数据进行编码的一部分。
96.明确地说,解码器的输入包含视频比特流,其可由视频编码器200产生。该比特流首先被熵解码(330)以获得变换系数、运动向量和其它译码信息。图片分区信息指示图片如何被分区。解码器因此可以根据解码的图片分区信息来划分(335)所述图片。所述变换系数被解量化(340)和逆变换(350)以解码所述预测残差。将解码的预测残差与预测块进行组合(355),重构图像块。所述预测块可以从帧内预测(360)或运动补偿预测(即,帧间预测)(375)获得(370)。将环内滤波器(365)应用于所述重构的图像。将滤波后的图像存储在参考图片缓冲器(380)中。
97.所述解码后的图像可以进一步经过解码后处理(385),例如,逆颜色变换(例如,从ycbcr 4:2:0到rgb 4:4:4的转换)或执行在预编码处理(201)中执行的重新映射处理的逆重新映射。所述解码后处理可以使用在预编码处理中导出并且在比特流中用信号通知的元数据。在一示例中,可将经解码图像(例如,在应用环路内滤波器(365)之后,和/或如果使用了解码后处理,在在解码后处理(385)之后)发送到显示设备以用于呈现给用户。
98.图4是示出了其中可以实现本文描述的各个方面和示例的系统的示例的图。系统400可以被实现为包括以下描述的各种组件的设备,并且被配置为执行本文中描述的一个或多个方面。此类设备的示例包括但不限于各种电子设备,诸如个人计算机、膝上型计算机、智能电话、平板计算机、数字多媒体机顶盒、数字电视接收机、个人视频记录系统、连接的家用电器和服务器。系统400的元件可以单独地或组合地在单个集成电路(ic)、多个ic和/或分立组件中实现。例如,在至少一个示例中,系统400的处理和编码器/解码器元件跨多个ic和/或分立组件分布。在各种示例中,系统400经由例如通信总线或通过专用输入和/或输出端口而通信地耦合到一个或多个其他系统或其他电子设备。在各种示例中,系统400被配置为实现本文中描述的一个或多个方面。
99.所述系统400包括至少一个处理器410,其被配置为执行加载到其中的指令,以用于实现例如本文中描述的各个方面。处理器410可以包括嵌入式存储器、输入输出接口和本领域已知的各种其它电路。系统400包括至少一个存储器420(例如,易失性存储器设备和/或非易失性存储器设备)。系统400包括存储设备440,其可以包括非易失性存储器和/或易失性存储器,这其中包括但不限于电可擦除可编程只读存储器(eeprom)、只读存储器(rom)、可编程只读存储器(prom)、随机存取存储器(ram)、动态随机存取存储器(dram)、静态随机存取存储器(sram)、闪存、磁盘驱动器和/或光盘驱动器。作为非限制性示例,所述存储设备440可以包括内部存储设备、附接的存储设备(包括可拆卸的和不可拆卸的存储设备)和/或网络可访问的存储设备。
100.系统400包括编码器/解码器模块430,其被配置为例如处理数据以提供编码视频或解码视频,并且该编码器/解码器模块430可以包括其自己的处理器和存储器。编码器/解码器模块430表示可以包括在设备中以执行编码和/或解码功能的模块(一个或多个)。如已知的,设备可以包括编码和解码模块中的一个或两个。另外,编码器/解码器模块430可以被实现为系统400的单独元件,或者可以作为本领域技术人员已知的硬件和软件的组合而被并入处理器410内。
101.要加载到处理器410或编码器/解码器430上以执行本文档中描述的各个方面的程序代码可以存储在存储设备440中,并且随后加载到存储器420上以供处理器410执行。根据各种示例,处理器410、存储器420、存储设备440和编码器/解码器模块430中的一个或多个可以在执行本文中描述的过程期间存储各种项中的一个或多个。这些存储的项可以包括但不限于输入视频、解码视频或解码视频的部分、比特流、矩阵、变量以及来自等式、公式、运算和运算逻辑的处理的中间或最终结果。
102.在一些示例中,处理器410和/或编码器/解码器模块430内部的存储器被用于存储指令并且提供用于在编码或解码期间需要的处理的工作存储器。然而,在其它示例中,所述处理设备外部的存储器(例如,处理设备可为处理器410或编码器/解码器模块430)用于这些功能中的一者或多者。外部存储器可以是存储器420和/或存储设备440,例如,动态易失性存储器和/或非易失性闪存。在若干示例中,外部非易失性闪存用于存储例如电视的操作系统。在至少一个示例中,诸如ram等快速外部动态易失性存储器被用作视频编码和解码操作的工作存储器。
103.如框445中所示,可以通过各种输入设备提供对系统400的元件的输入。这样的输入设备包括但不限于(i)接收例如由广播者通过空中传输的rf信号的射频(rf)部分,(ii)分量(comp)输入端子(或一组comp输入端子),(iii)通用串行总线(usb)输入端子,和/或(iv)高清晰度多媒体接口(hdmi)输入端子。图4中未示出的其它示例包括合成视频。
104.在各种示例中,框445的输入设备具有本领域已知的相关联的相应输入处理元件。例如,所述rf部分可以与适合于以下的元件相关联:(i)选择期望频率(也称为选择信号,或将信号频带限制到一频带),(ii)下转换所选择的信号,(iii)再次频带限制到较窄频带,以选择(例如)信号频带,在某些示例中,该信号频带可以称为信道,(iv)解调所述下转换和频带限制的信号,(v)执行纠错,和(vi)解复用以选择期望的数据分组流。各种示例的rf部分包括执行这些功能的一个或多个元件,例如频率选择器、信号选择器、限带器、信道选择器、滤波器、下转换器、解调器、纠错器和解复用器。所述rf部分可以包括执行各种这些功能的调谐器,这些功能包括例如将接收信号下转换到较低频率(例如,中频或近基带频率)或基带。在一个机顶盒的示例中,所述rf部分及其相关的输入处理元件接收通过有线(例如,电缆)介质发送的rf信号,并通过滤波、下转换和再次滤波到期望的频带来执行频率选择。各种示例重新安排上述(和其他)元件的顺序、移除这些元件中的一些、和/或添加执行类似或不同功能的其他元件。添加元件可以包括在现有元件之间插入元件,例如插入放大器和模数转换器。在各种示例中,所述rf部分包括天线。
105.另外,usb和/或hdmi端子可以包括用于通过usb和/或hdmi连接将系统400连接到其它电子设备的相应接口处理器。应当理解,输入处理的各个方面(例如,reed

solomon纠错)可以根据需要在例如单独的输入处理ic内或处理器410内实现。类似地,usb或hdmi接口
处理的各方面可以根据需要在单独的接口ic内或在处理器410内实现。解调、纠错和解复用的流被提供给各种处理元件,这其中包括例如处理器410和编码器/解码器430,其与存储器和存储元件结合操作以根据需要处理数据流以便在输出设备上呈现。
106.系统400的各种元件可以设置在集成壳体内。在该集成壳体内,各种元件可以使用合适的连接布置425(例如,本领域已知的内部总线(包括ic间(i2c)总线、布线和印刷电路板))互连并在其间传输数据。
107.所述系统400包括通信接口450,其使得能够经由通信信道460与其它设备通信。所述通信接口450可以包括但不限于被配置为通过通信信道460发送和接收数据的收发信机。所述通信接口450可以包括但不限于调制解调器或网卡,并且所述通信信道460可以例如在有线和/或无线介质内实现。
108.在各种示例中,使用诸如wi

fi网络(例如,ieee 802.11(ieee指的是电气和电子工程师协会))的无线网络,将数据流式传输或以其他方式提供给系统400。这些示例的wi

fi信号通过适于wi

fi通信的通信信道460和通信接口450接收。这些示例的通信信道460通常连接到接入点或路由器,该接入点或路由器提供对包括因特网的外部网络的访问,以允许流传输应用和其它过顶(over

the

top)通信。其它示例使用通过输入框445的hdmi连接递送数据的机顶盒来向系统400提供流式数据。还有其它的示例使用输入框445的rf连接向系统400提供流式数据。如上所述,各种示例以非流传输方式提供数据。另外,各种示例使用除wi

fi之外的无线网络,例如蜂窝网络或网络。
109.所述系统400可以向各种输出设备提供输出信号,该输出设备包括显示器475、扬声器485和其他外围设备495。各种示例的显示器475包含例如触摸屏显示器、有机发光二极管(oled)显示器、弯曲显示器和/或可折叠显示器中的一者或多者。所述显示器475可以用于电视、平板电脑、膝上型计算机、蜂窝电话(移动电话)或其他设备。所述显示器475还可以与其它组件集成(例如,如在智能电话中)或分离(例如,用于膝上型计算机的外部监视器)。在各种示例中,所述其它外围设备495包括独立数字视频盘(或数字多功能盘)(dvd,针对这两者)、盘播放器、立体声系统和/或照明系统中的一个或多个。各种示例使用基于系统400的输出提供功能的一个或多个外围设备495。例如,盘播放器执行播放所述系统400的输出的功能。
110.在各种示例中,使用诸如av.链路(av.link)、消费电子控制(cec)、或在有或没有用户干预的情况下实现设备到设备控制的其他通信协议的信令,在系统400和显示器475、扬声器485或其他外围设备495之间传送控制信号。所述输出设备可以经由通过相应接口470、480和490的专用连接而通信地耦合到系统400。或者,所述输出设备可以使用通信信道460经由通信接口450连接到系统400。所述显示器475和扬声器485可以与在电子设备(例如,电视机)中的系统400的其它组件集成单个单元中。在各种示例中,显示接口470包括显示驱动器,诸如,例如,定时控制器(t con)芯片。
111.例如,如果输入445的rf部分是单独机顶盒的一部分,则显示器475和扬声器485可以备选地与其它组件中的一个或多个分离。在显示器475和扬声器485是外部组件的各种示例中,输出信号可以经由专用输出连接提供,所述专用输出连接包括例如hdmi端口、usb端口或comp输出。
112.这些示例可以由处理器410实现的计算机软件或通过硬件或通过硬件和软件的组
合来执行。作为非限制性示例,这些示例可以由一个或多个集成电路来实现。所述存储器420可以是适合于技术环境的任何类型,并且可以使用任何适当的数据存储技术来实现,作为非限制性示例,诸如光学存储器设备、磁存储器设备、基于半导体的存储器设备、固定存储器和可移动存储器。所述处理器410可以是适合于技术环境的任何类型,并且可以包含作为非限制性示例的微处理器、通用计算机、专用计算机和基于多核架构的处理器中的一个或多个。
113.各种实现方式涉及解码。如本技术中所使用的,“解码”可以包括例如对接收到的编码序列执行的全部或部分处理,以便产生适合于显示的最终输出。在各种示例中,这样的过程包括通常由解码器执行的一个或多个过程,例如熵解码、逆量化、逆变换和差分解码。在各种示例中,此类过程还或替代地包含由本技术案中所描述的各种实施方案的解码器执行的过程,例如,解量化、逆变换,以及获得精度因子(例如,精度因子可具有将用于编码器或解码器操作中的一或多个精度值,或将用于量化或解量化过程中的一或多个移位值)等。
114.作为进一步的示例,在一个示例中,“解码”仅指熵解码,在另一示例中,“解码”仅指差分解码,并且在另一示例中,“解码”指熵解码和差分解码的组合。短语“解码过程”是否旨在具体地指代操作的子集或一般地指代更广泛的解码过程基于具体描述的上下文将是清楚的,并且相信是本领域技术人员所充分理解的。
115.各种实现涉及编码。以与以上关于“解码”的讨论类似的方式,如在本技术中使用的“编码”可以包括例如对输入视频序列执行的以便产生编码比特流的过程的全部或部分。在各种示例中,这样的过程包括通常由编码器执行的一个或多个过程,例如,分区、差分编码、变换、量化和熵编码。在各种示例中,此类过程还或替代地包含由本技术案中所描述的各种实施方案的编码器执行的过程,例如执行量化、变换及获得精度因子(例如,精度因子可具有将用于编码器或解码器操作中的一或多个精度值,或将用于量化或解量化过程中的一或多个移位值)等。
116.作为进一步的示例,在一个示例中,“编码”仅指熵编码,在另一示例中,“编码”仅指差分编码,并且在另一示例中,“编码”指差分编码和熵编码的组合。短语“编码过程”是否旨在具体地指代操作的子集或一般地指代更广泛的编码过程将基于具体描述的上下文而变得清楚,并且相信是本领域技术人员所充分理解的。
117.注意,如本文所使用的语法元素(例如,关于精度因子、移位、分数比特的数目等的译码语法)是描述性项。因此,它们不排除使用其它语法元素名称。
118.当附图被呈现为流程图时,应当理解,它还提供了对应装置的框图。类似地,当附图被呈现为框图时,应当理解,它还提供了对应的方法/过程的流程图。
119.各种示例涉及解码。可以应用内容自适应变换。特别地,一种装置可以接收表示内容的视频比特流。该视频比特流可包含用于一或多个块的量化变换系数。可获得(例如,确定或用信号发送)精度因子(例如,移位)。该精度因子可以具有将在编码器或解码器操作中使用的一个或多个精度值,或者将在量化或解量化过程中使用的一个或多个移位值。所述精度因子可以与块相关联,用于对该块执行至少一个解码功能。在一示例中,所述精度因子可基于所述块的变换系数的量值。所述精度因子可以减小最大量值变换系数以适合16位(16

bits)。
120.本文描述的实现方式和方面可以在例如方法或过程、装置、软件程序、数据流或信
号中实现。即使仅在单一形式的实现的上下文中讨论(例如,仅作为方法讨论),所讨论的特征的实现也可以以其他形式(例如,装置或程序)来实现。例如,可以以适当的硬件、软件和固件来实现装置。所述方法可以在例如处理器中实现,所述处理器通常指处理设备,这其中包括例如计算机、微处理器、集成电路或可编程逻辑设备。处理器还包括通信设备,例如计算机、蜂窝电话、便携式/个人数字助理(“pda”)和便于终端用户之间的信息通信的其他设备。
121.对“一个示例”、“示例”或“一个实现”或“实现”及其它变型的引用意味着结合该示例描述的特定特征、结构、特性等被包括在至少一个示例中。因此,在本技术中的各个地方出现的短语“一个示例”、“示例”或“一个实现”或“实现”以及任何其他变型的出现不一定全部指代相同的示例。
122.另外,本技术可以涉及“确定”各种信息。确定该信息可以包括例如以下一者或多者:估计该信息、计算该信息、预测该信息或从存储器检索该信息。获得可以包括:接收、检索、构建、生成和/或确定。
123.此外,本技术可以涉及“访问”各种信息。访问该信息可以包括例如以下一者或多者:接收该信息、检索该信息(例如,从存储器)、存储该信息、移动该信息、复制该信息、计算该信息、确定该信息、预测该信息或估计该信息。
124.另外,本技术可以涉及“接收”各种信息。如同“访问”一样,接收旨在是广义的术语。接收该信息可以包括例如以下一者或多者:访问该信息或检索该信息(例如从存储器)。此外,在诸如存储信息、处理信息、发送信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息或估计信息的操作期间,通常以一种方式或另一种方式涉及“接收”。
125.应当理解,例如在“a/b”、“a和/或b”以及“a和b中的至少一个”的情况下,使用以下“/”、“和/或”以及“中的至少一个”中的任何一个旨在涵盖仅对第一列出的选项(a)的选择、或仅对第二列出的选项(b)的选择、或对两个选项(a和b)的选择。作为进一步的示例,在“a、b和/或c”和“a、b和c中的至少一个”的情况下,这样的措词旨在包括仅选择第一个列出的选项(a),或者仅选择第二个列出的选项(b),或者仅选择第三个列出的选项(c),或者仅选择第一个和第二个列出的选项(a和b),或者仅选择第一个和第三个列出的选项(a和c),或者仅选择第二个和第三个列出的选项(b和c),或者选择所有三个选项(a和b和c)。如本领域和相关领域的普通技术人员所清楚的,这可以扩展到所列的多个项。
126.此外,如本文所使用的,词语“信号”尤其是指向对应的解码器指示某物。编码器信号可以包括例如使用精度因子对块的输入的编码功能等。以这种方式,在示例中,在编码器侧和解码器侧两者处使用相同的参数。因此,例如,编码器可以向解码器发送(显式信令)特定参数,使得解码器可以使用相同的特定参数。相反,如果解码器已经具有该特定参数以及其它参数,则可以使用信令而不进行发送(隐式信令),以简单地允许解码器知道并选择特定参数。通过避免任何实际功能的传输,在各种示例中实现了比特节省。应当理解,可以以各种方式来实现信令。例如,在各种示例中,一个或多个语法元素、标志等被用于将信息用信号通知给对应的解码器。虽然前述内容涉及词语“信号”的动词形式,但是词语“信号”在本文中也可以用作名词。
127.如对于本领域普通技术人员将显而易见的,实现可以产生被格式化以携带例如可以被存储或发送的信息的各种信号。该信息可以包括例如用于执行方法的指令,或者由所
描述的实现之一产生的数据。例如,信号可以被格式化以携带所描述的示例的比特流。这种信号可以被格式化为例如电磁波(例如,使用频谱的射频部分)或基带信号。所述格式化可以包括例如编码数据流和用编码数据流调制载波。所述信号携带的信息可以是例如模拟或数字信息。如已知的,所述信号可以通过各种不同的有线或无线链路来传输。该信号可以存储在处理器可读介质上。
128.本文描述了许多示例。示例的特征可以在各种权利要求类别和类型上单独地或以任何组合提供。此外,示例可以单独地或以任何组合、跨越各种权利要求类别和类型包括本文描述的特征、设备或方面中的一个或多个。例如,本文描述的特征可以在包括如本文描述的那样生成的信息的比特流或信号中实现。该信息可以允许解码器根据所描述的任何实施例解码比特流,和/或编码器根据所描述的任何实施例编码比特流。例如,本文描述的特征可以通过创建和/或发送和/或接收和/或解码比特流或信号来实现。例如,本文描述的特征可以实现为方法、过程、装置、存储指令的介质、存储数据的介质或信号。例如,本文描述的特征可以由tv、机顶盒、蜂窝电话、平板电脑或执行解码的其他电子设备来实现。所述tv、机顶盒、蜂窝电话、平板电脑或其他电子设备可以显示(例如,使用监视器、屏幕或其他类型的显示器)结果图像(例如,来自视频比特流的残差重构的图像)。所述tv、机顶盒、蜂窝电话、平板电脑或其他电子设备可以接收包括编码图像的信号并执行解码。
129.视频和/或图像可以用8位样本来表示。视频(例如,使用运动补偿译码的视频)可产生9位残差。可以在解码器处用16位整数流水线(pipeline)来实现例如具有8
×
8或4
×
4的块大小的通过离散余弦变换(dct)的处理。
130.图4a示出了一般编码器结构的示例。
131.用8位样本表示的视频例如在暗区域中可能表现出轮廓伪像。可以使用支持处理中的扩展比特深度的视频编解码器。应用可以产生需要更高比特深度样本的内容,诸如高动态范围内容、合成内容以及光检测和测距(lidar)范围数据。在视频编解码器中可考虑较大块大小的变换。较大的块大小变换可增加残差动态范围。视频编解码器可以支持处理中的扩展比特深度。流水线、乘法和/或存储器访问可以保持在16位精度。
132.动态范围控制可以在视频译码中执行。视频压缩可以在8位样本数据上操作和/或使用8
×
8dct变换。一些编解码器设计可能未定义位精确(bit

exact)逆变换和/或重构过程。可以开发不同的体系结构用于逆变换和/或重构。例如,与参考浮点离散余弦逆变换(idct)相比,可使用统计容差。例如,可以使用逆变换精度规范和/或逆离散余弦变换。开发不同的架构可能将漂移引入到视频编解码器的时间预测过程中。所述漂移可以被控制。可以指定块在没有预测的情况下(例如,帧内)被译码的频率。
133.例如,宏块可以每132次被发送至少一次(例如,强制地)被更新。可控制逆变换失配误差的累积。一种方法可用于处理小的输入信号和/或潜在的idct漂移。idct失配控制可以包括例如如果系数的和在逆量化之后为偶数,则对该系数加一或减一。
134.对于一些idct近似,idct的小的非零输入可以导致全零输出。如果这发生在编码器中,则在使用与在编码器中对解码过程建模时使用的近似不同的符合idct近似的解码器中可能发生失配。编码器可以检查该编码器自身的idct近似的输出。例如,当所讨论的区块通过编码器自身的idct功能近似而重建成零时,编码器可以避免将非零系数插入比特流。
135.可以分析各种idct漂移问题。一些视频译码可并入具有高于8位的比特深度的译
码格式。可以支持更高的比特深度。可以使用视频重构流水线中的附加精度。某些通用解码器可能不支持高比特深应用。
136.可以使用比特精确重构。可以指定比特精确逆变换。可以使用一种变换,以便idct计算对从前向变换产生的数据使用16位乘法操作(例如,仅)和/或16位存储器访问。在示例中,比特流可以不包含导致任何重新产生的残差值或中间系数值超出从
‑2(7+bitdepth
)到2
(7+bitdepth)

1(包括端值)的整数值范围的数据。
137.例如,在第一idct之前和/或在可分离的idct阶段之间,可以使用例如,等式1和/或等式2,(例如,明确地)提供对系数的限幅操作。d[x][y]=clip3(

32768,32767,((transcoefflevel[xtby][ytby][cidx][x][y]*m[x][y]*levelscale[qp%6]<<(qp/6))+(1<<(bdshift

1)))>>bdshift)
ꢀꢀꢀꢀꢀꢀꢀꢀ
等式1g[x][y]=clip3(

32768,32767,(e[x][y]+64)>>7)
ꢀꢀꢀꢀ
等式2
[0138]
包含限幅操作可支持16位动态范围的变换足以用于idct计算。可以使用规范的比特精确重构等式(例如,以避免在没有传输错误的情况下的漂移)。
[0139]
可以使用动态范围的变换。该变换可以是理想变换。作为示例,可以使用具有在等式3和等式4中示出的一个或多个属性的n点变换t。
[0140]
t可以是正交变换。例如,t可保留l2能量。
[0141]
t可以是压缩变换。例如,t可以取dc信号到(例如,单个)系数。
[0142]
可以使用具有有限动态范围的一组输入,例如,
[0143]
例如,可以通过将变换t应用于最大dc信号来计算最大量值系数,例如,如等式5和/或等式6所示。和/或等式6所示。
[0144]
例如,如等式7和/或等式8所示,可以使用t的正交性来确定值α。例如,如等式7和/或等式8所示,可以使用t的正交性来确定值α。
[0145]
最大量值系数可以通过因子而被增加。
[0146]
可以例如使用等式9

11中的一个或多个来计算低量值系数。
[0147]
的dc系数可以共计为α。该dc系数可以是(例如,可以全部是)正的。至少一个系数c的绝对值可以小于或等于例如,如等式12所示。
[0148]
最小系数可以是大小的分数分数比特可用于表示低于1的值。
[0149]
可以使用关于最大和最小系数的界限,例如,如等式13和/或等式14所示。例如,可以使用等式来计算系数动态范围的界限。以使用等式来计算系数动态范围的界限。以使用等式来计算系数动态范围的界限。
[0150]
限于1+log2(r)比特的源可以被扩展最大log2(sqrt(n))比特,和/或可以需要附加的log2(sqrt(n))比特的分数部分。可以使用总共1+log2(r)+log2(sqrt(n))+log2(sqrt(n))=1+log2(r)+log2(n)比特。
[0151]
等式16可用于确定整数源上的n点变换的整数比特。log2(sqrt(n))+log2(r)+1
ꢀꢀꢀꢀꢀ
等式16
[0152]
等式17可用于确定n点变换的分数比特。log2(sqrt(n))
ꢀꢀꢀꢀꢀꢀ
等式17
[0153]
对于n点1d变换,最坏情况系数(例如,最大量值系数)的量值可以通过因子sqrt(n)而被增加。
[0154]
随着变换大小的增加,系数的精度可被增加(例如,可使用更多分数比特)。
[0155]
所使用的(例如,所需的)整数比特的数量可以随着用于表示整数源的比特的数量(例如,log2(r))而增长。分数比特的数目可以独立于整数源的量值。可以针对一些代表性变换大小来总结结果。
[0156]
例如,对于大小为nxm的可分离2d变换,可以使用等式18和/或等式19来执行(例如,重复)分析。
[0157]
等式18可用于确定整数源上的nxm变换的整数比特。log2(sqrt(n)+sqrt(m))+log2(r)+1
ꢀꢀꢀ
等式18
[0158]
等式19可用于确定nxm变换的分数比特。
log2(sqrt(n)+sqrt(m))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
等式19
[0159]
表1和表2示出了所需的整数比特数量可以随着用于表示整数源的比特数而增长。表1:8位源的变换系数比特深度行m列n整数比特分数比特总比特44112138812315161613417323214519481231581613417表2:10位源的变换系数比特深度行m列n整数比特分数比特总比特44132158814317161615419323216521481431781615419
[0160]
可以分析逆变换的动态范围使用。可以使用基于前向变换的信号。动态范围可以在具有前向变换的信号的逆变换中减小。如果量化改变系数,那么可将信号表达为多个分量的和(例如,原始系数加上基于量化噪声的信号)。这些分量(例如,原始系数和/或基于量化噪声的信号)在逆变换下可具有不同动态范围行为。原始信号分量的动态范围可能减小。逆变换可能增加所述量化噪声的动态范围。所述量化噪声的量值可以由系数数据的量值来控制。动态范围分析可以集中在前向变换的结果上。例如,如果量化噪声是主要的,则低精度和/或限幅的引入可以改变所述噪声。
[0161]
可以使用定点变换。该定点变换可能不是精确正交的,或者不是完全将dc压缩成单个系数。从动态范围的角度来看,该固定点变换可使用额外处理以用于归一化。用于归一化的该附加处理可以移动样本和/或可以不影响用于表示样本的比特的数量。1

d变换可以通过对可分离的2d变换的可能的扩展来分析,该可分离的2d变换被产生为在行和(例如,然后)在列上的1

d变换。变换可基于dct的整数近似。
[0162]
视频编解码器可支持例如具有块大小范围(4,8,16,32)和/或样本比特深度范围(8,10,12,14,16)的反离散余弦变换(idct)的16位计算。可以避免高量值残差信号的限幅。可以保持低幅度残差信号的精度。对于给定译码单元(cu),可避免高量值系数的限幅(例如,优先于保持精度)。例如,当不存在高量值系数时,可以保留低幅度残差信号。
[0163]
动态范围限制可能影响所处理的最大系数。动态范围限制可能影响低幅度系数的精度。图5示出了解量化和/或逆变换的示例。可以实现图5中所示的示例(500)。例如,可以接收表示内容的编码视频比特流。可以执行解量化。移位(例如,移位1)可以用于逆变换动态范围(参见表3)。该移位可以基于比特深度和/或块大小(例如,基于其而被设置)。该移位可以独立于源比特深度和动态范围。
[0164]
用于逆变换的代码(例如,在voidtrquant::xit()中)可使用水平阶段之后的移位(例如,移位2)和/或垂直变换阶段之后的移位(例如,移位3)。第二移位的大小可取决于比特深度。在一示例中,所述第二移位的大小可不取决于变换大小或信号统计。
[0165]
例如,在逆变换之前,可以在解量化中使用缩放。在逆变换之前的解量化中使用的缩放可考虑变换归一化缩放和/或块大小效应。在解量化中使用的缩放可以不考虑信号的特定特性,例如,在解量化中使用的缩放可以被设置用于最坏情况的可能信号。解量化和逆变换(一个或多个)的操作可以包括一个或多个移位(例如,图5中所示的三个移位)。这可以在表3中示出。表3
[0166]
例如,如果或当假定最坏情况输入时,可以确定移位值(例如,第一到第三移位)。所确定的移位值可以避免例如在上端处的限幅。在一些示例中,移位值可以不取决于信号的内容。在一个示例中,图5中的三个移位可以被认为是基本移位(例如,移位1可以是base_dequant_shift;移位2可以是base_mid_transform_shift;移位3可以是base_normalization_shift)。在一些示例中,基础移位值取决于源比特深度和/或变换块大小,然而,所述基本移位值不取决于实际源内容。
[0167]
可基于(例如,用于一些样本编码的)变换单元(tu)中所需的比特的数目来收集一些样本数据。图6示出了待使用的比特的示例(例如,在对样本序列进行逆变换之前(例如,仅帧内))。图6中的示例可展示基于每一tu中对于一些样本编码所需的比特的数目而收集的样本数据。数据可通过记录tu{v}中的系数的值来确定。图6中的示例可以示出tu{v}中的系数的最大绝对值。例如,值v所需的比特数可以在等式20中确定(例如,定义)。图6可以示出所需比特数的概率。在图6中,针对tu块(例如,帧内译码测试序列的tu块)展示每颜色分量的概率。如图6所示,对于典型内容,不需要16位。16位可用于最坏情况的结果。少于16位(例如,12位或更少)的比特可以用于除了最坏情况结果之外的数据。bitsneeded=1+ceil(log2(|v|))
ꢀꢀꢀꢀ
等式20
[0168]
例如,可以基于16位约束来确定残差操作期间的逆变换的精度。16位约束条件在非必需的情况下可以降低精度。可例如基于16位约束来确定可在低幅度信号上在不损失精度的情况下处理的内容的比特深度(例如,10比特深度数据和/或4
×
4变换可使用如表2中所见的15位精度)。以默认配置操作的某些编解码器可支持例如以至多10位在内部表示数据。例如,在编码之前,高比特深度输入可以被缩放为10位。qp值可例如基于输入比特深度来调整。解码器可被告知所述输入比特深度且/或可调整qp。某些编解码器可以在例如
internalbitdepth=10处操作,而不管针对该值的源比特深度级别设置。
[0169]
例如,如本文所述,可以压缩满足对逆变换计算的16位约束的数据(例如,8位或10位视频)。精度可以增加和/或提供压缩改进。在逆变换中使用多于16位的数据(例如,12位或14位视频)可以在对逆变换计算具有16位约束的情况下被压缩。处理可以适应于块、tu、cu、或ctu等的内容。可以实现高精度,同时避免溢出。
[0170]
乘法器和/或存储资源可以被灵活地使用(例如,通过考虑信号的内容而被灵活使用)。例如,16位乘法器和/或存储资源可以例如在解码器处灵活地使用。可以避免高量值残差系数信号的限幅。例如,当不与高量值残差系数同时存在时,可以保持低幅度残差系数信号的精度。移位(一个或多个)可被用于调整数据,例如,由idct处理的数据。该调整可以基于例如除源比特深度和/或变换块大小之外的因素。可避免16位idct计算中的溢出。
[0171]
在示例中,可以接收表示内容的视频比特流。该视频比特流可包括多个块的量化变换系数。精度因子(例如,移位)可与块相关联以用于对所述块执行至少一个解码功能。解码功能的示例包括解量化和/或逆变换。可基于视频比特流的内容来调适所述精度因子。该精度因子可基于所述块的所述变换系数的量值(例如,基于最大量值)(例如,量值输入可基于与所述块相关联的残差系数的最大量值)。可以使用所述精度因子对所述块的所述量化变换系数执行所述解码功能。
[0172]
可(例如)基于当前块(例如,正被解码的变换块)的残差系数的量值(例如,最大(例如,最高)绝对值),确定移位(例如,精度因子;例如,该移位的值)。举例来说,当前块的残差系数的所述量值可为最大可能残差信号的一小部分(例如,基于最坏情况分析)。可以在idct之前选择(例如,系数数据的)移位值。举例来说,可结合选择系数数据的移位来修改在残差数据的构造中使用的移位。该修改可以是为了一致性。可以基于内容的确定的量值输入(例如,最大量值输入)来确定精度因子(例如,移位)。
[0173]
可以获得例如与图5中所示的解量化阶段和逆变换阶段结合使用的移位。可以获得所述移位以考虑信号的内容。可以获得所述移位以产生信号自适应行为。例如,在解码器处,可以改进有限宽度寄存器的利用。图7中示出了(例如修改的)示例结果。图7示出了解量化和/或逆变换的示例。示例模块(700)可以用于计算信号的统计(例如,tu或其他的最大绝对值)。如图7所示,模块“计算移位”可以用于例如基于对所述信号的分析(例如,源信号的基于内容的分析)来计算移位。可以提供解量化移位。可以提供中间变换移位。可以提供归一化移位。例如,服从等式21的约束,可以基于所计算的最大值来获得第一逆变换之前和/或最后逆变换之后的(一个或多个)移位。等式21可用于确定移位的关系。shift
dequant
+shift
mid
+shift
normalization
=shift1+shift2+shift3ꢀꢀꢀꢀ
等式21左侧的和与右侧的和可以是相同的(例如,具有相同的归一化)。在一个示例中,等式21右侧的移位可以取决于源比特深度和/或变换块大小(例如,值不取决于实际源内容)。另外,等式21右侧的移位的值可以基于理论最大值,如果不需要(见图6),则理论最大值可能导致效率和/或精度的损失。相反,等式21左侧的移位可以基于实际的源内容(例如,通过确定一组解量化数据的最大量值和/或确定所述系数的界限以限制变换结果的最大值)。因此,在使用与等式21右侧的移位相同的硬件(例如,解码器和/或编码器)的同时,等式21左侧的移位可以提供增加的精度和/或增加的动态范围。
[0174]
可以使用逆变换(例如,一个或多个16位逆变换)。信号可以达到或不能达到所允
许的理论最大值。当没有达到理论最大值时,可以提高精度。可以支持较高比特深度的源,其中可以通过自适应来实现精度。可能不需要较高精度的处理。
[0175]
可以减小移位的大小。举例来说,可在解量化和/或逆变换操作(例如,解量化和/或逆变换操作的早期阶段)时减小左移位的大小(一个或多个)。可以提高精度。移位(例如,本文的示例移位)可被约束为例如具有与特定视频译码码中的移位的总和相同的总和。归一化可以通过所述处理流水线来维护。本文的示例可以用于确定第一和第二移位(例如,shift
dequant
和shift
mid
)。例如,可以基于引入的变化和/或逆变换增益来获得第二移位(例如,shift
mid
)。例如,根据等式22可以获得最终移位值shift
normalization
。可以获得最终移位值shift
normalization
以保持一致的归一化。等式22可用于确定对移位总和的约束。(shift
dequant
+shift
mid
+shift
normalization
)=(shift1+shift2+shift3)
ꢀꢀꢀ
等式22
[0176]
可以选择解量化移位。移位的选择可基于系数值(例如,tu的最大系数值)。可分析系数数据以确定移位,例如,用于将最大量值系数减小到逆变换处理的输入动态范围(例如,16位)的最小移位。可执行cu的残差重构过程,例如以计算变换块中的变换系数的最大绝对量值m。由此,例如可以基于等式23来确定移位shift
dequant
。可以确定移位shift
dequant
以使得(例如在等式23中)c
i,j
>>shift
dequant
可以例如对于每个系数c
i,j
被包含在16位中。可执行右移位。如果m的值低于16位,则可以执行左移位。例如,在移位之前,可以将右移位与舍入偏移的相加进行组合。
[0177]
等式23可用于确定解量化移位。shift
dequant
=ceil(l0g2(m))

16
ꢀꢀꢀꢀ
等式23
[0178]
可以选择对该组系数的分析以用于系数的缩放。例如,可以以几种方式选择用于系数缩放的最大系数(例如,在idct之前)。在示例中,可执行到32位的解量化,和/或可在记录最大系数之后进行重新归一化移位(例如,应用于所有系数)。在示例中,可以将(例如,每个)系数解量化为16位精度,和/或可以记录适当的缩放。可以(例如,随后)适当地重新调整所述系数(一个或多个)。在这些示例中,所使用的存储器可以是最小的。在示例中,可以使用两个通道(pass)。在第一通道中,可读取非零系数水平和/或qp值以(例如)确定用于系数的分数比特的数目(例如,移位值)。非零系数水平和/或qp值可基于空间位置而变化。在第二通道中,例如基于所述选择,可以用适当数量的分数比特对系数进行解量化。最大系数和/或解量化或重新缩放过程可使用例如对每一子任务的并行性来确定。例如,一旦确定了所述移位,就可以彼此独立地(例如,并行地)缩放系数。在示例中,系数在缩放过程中是独立的,除了当系数被用于确定移位时。
[0179]
例如,可以基于视频比特流中的变换系数来确定所述移位。举例来说,此确定可由视频解码器作出。可以用信号通知要使用的分数比特的数量,或者可以从信号内容推断要使用的分数比特的数量。可以使用固定的缩放。该固定缩放可基于用信号通知的参数(例如,比特深度和变换大小)来确定。
[0180]
在示例中,可以执行信号分析过程以选择所述解量化移位。在示例中,可选择tu的最大系数值(例如,该系数的最大绝对值)。内容自适应最大值在确定溢出时可以是保守的。可以使用更详细的统计(例如,行/列的l1范数)。
[0181]
解码器可以在一组移位和/或精度值之间进行选择。该解码器可以使用例如解量化系数值的动态范围来在一组移位和/或精度值之间进行选择。
[0182]
移位(例如,catp_dequant_shift)可基于(例如,仅基于)解量化之前的最大系数值来计算。可以基于内容(例如,与最坏情况的可能信号相对)获得紧随系数块的解量化之后的移位。随后的移位(一个或多个)(例如,逆变换或归一化)可能不反映额外的内容自适应性(例如,除了由解量化移位产生的之外)。在示例中,可将系数数据块解量化为32位以给出cij。可确定最大量值经解量化数据(例如,m=max(|cij|))。可确定需要表示m的比特的数目(例如,nbits=ceil(〖log〗_2(m)))。可以确定将最大值减小到适合16位内所需的移位(例如,catp_dequant_shift=nbits

16(如果为负,则可以使用零))。
[0183]
可以选择中间变换移位。在示例中,可选择中间变换移位(例如,catp_mid_transform_shift)以补偿所述解量化移位(例如,等式24)。
[0184]
等式24可用于确定中间变换移位。shift
mid
=shift2+(shift1‑
shift
dequant
)
ꢀꢀꢀꢀ
等式24
[0185]
例如,如果使用等式24,则可以增加应用变换(例如,第一变换)的精度。
[0186]
在示例中,可以基于内容来选择中间变换移位。该中间变换移位(例如,所选定的)可允许通过第二变换而保持额外精度。在这些示例中,可以对解量化的数据执行分析,和/或可以根据变换界限,确定第一变换之后的量值(例如,如本文所述)。
[0187]
可以使用界限。例如,可以给出变换的输出的绝对量值的界限(例如,通过由矩阵t进行左乘来定义)。在不同的应用中可以使用多种类型的界限(例如,如等式25和等式26所示的两种类型)。所使用的界限的类型可以限制变换计算的结果的量值(例如,基于变换矩阵和/或输入的分析)。
[0188]
等式25的系数可用于确定动态范围界限i。可以基于矩阵变换系数和最大系数数据之和来确定catp_mid_transform_shift。
[0189]
在示例中,对于每一行,可确定变换系数的绝对值的和m
r
=∑
k
|t
r,k
|。可以确定行的最大值m=max
r
m
r
(例如,这可以离线完成,因为变换t是已知的)。可确定当前块中的最大系数c
max
=max
r,c
|c
r,c
|。乘积m
·
c
max
所需的比特数量可以是每个分量的比特的总和数量和/或被直接计算为:nbits=ceil(log2(m
·
c
max
)),并且catp_mid_transform_shift=nbits

16可以被确定。
[0190]
第一界限(例如,基于等式25确定的动态范围界限i)可以使用最大绝对系数值,例如,仅使用该最大绝对系数值。如果数据被限制为16位,则可以在不进行分析的情况下使用所述第一界限,和/或可以离线执行变换分析。如果数据是前向变换的结果(例如,如利用逆变换计算),则可以不使用所述第一界限。
[0191]
等式26可用于确定动态范围界限ii。可以基于最大变换系数和系数数据的列和来确定catp_mid_transform_shift。|t
·
c|
r,c
=|∑
k
t
r,k
*c
k,c
|≤(max
r,c
|t
r,c
|)*(∑
k
|c
k,c
|)
ꢀꢀꢀ
等式26
[0192]
在示例中,可以确定最大绝对系数m=max
r,c
|t
r,c
|,并且可以确定表示m所需的比特数量,即,matrixbitsused=ceil(log2(m))。可以离线确定比特的数量(例如,比特的数量可以独立于内容(例如,尽管比特的数量将基于用信号通知的变换而不同))。对于系数的每一列c,可确定绝对值的和m
c
=∑
k
|c
k,c
|。可以确定列的最大和m=max
c
m
c
。可确定表示绝对列系数的最大和所需的比特的数目coefficientbitsused=ceil(log2(m))。
totalbitsused可以是matrixbitsused+coefficientbitsused

1(其中1被减去以避免对符号进行双重计数)。可以确定catp_mid_transform_shift=totalbitsused

16。如果结果是负的,则可以用零来代替它。例如,可以基于等式26来开发基于内容的界限。对输入到第一逆变换的系数数据的分析可以用于基于第二界限来确定第一逆变换输出的输出上的界限(例如,如本文所述)。
[0193]
例如,等式26中的界限可用于根据对输入到第一变换的系数数据的分析来确定例如在第一变换之后的数据的动态范围上的界限。在第一逆变换之后应用的移位可以基于对该变换之前的数据的分析来计算。
[0194]
在使用等式26的界限的另一示例中,直接计算用于乘积的比特的数量。这可以导致较小的移位,例如,如果表示有符号值

5和

9所需的比特分别是4位(例如,3位用于量值,1位用于符号)和5位(例如,4位用于量值,1位用于符号)(例如,4+5

1=8个有符号比特),而+45的值仅需要7个有符号比特(例如,6位用于量值,1位用于符号),则结果是对于catp_mid_transform_shift,移位低一位。
[0195]
可以组合等式25和等式26(例如,以计算每个变换单元上的移位)。在示例中,可以针对每列单独地确定catp_dequant_shift和catp_mid_transform移位。
[0196]
等式27可用于确定系数界限统计。b=max
c
|∑
k
|c
k,c
||
ꢀꢀꢀꢀ
等式27
[0197]
在实施例中,等式27中的界限可以取决于对系数数据的分析,和/或结果可以用于限制变换结果的最大值(例如,如等式28所示)。
[0198]
等式28可用于确定系数界限。
[0199]
系数矩阵的值可以是有界限的(例如,|t
r,c
|≤27)。固定移位可基于所述界限用于移位2(例如,移位2=7)。中间变换移位可以使用等式29来确定。中间值可以减少到16位。
[0200]
在示例中,等式29可以用于确定中间变换移位。shift
mid
=ceil(log2(b)

16)+shift2
ꢀꢀꢀꢀ
等式29
[0201]
在示例中,可以通过分析第一变换之后的结果的(一个或多个)量值来确定中间变换移位。在实施例中,等式30和/或等式31可用于确定所述中间变换移位。k可以是第一变换的输出的最大绝对值。在所述示例中,精度可针对第二变换而增加。可以在第一变换之后执行对数据的分析。例如,在确定中间变换移位之前,可以以高比特深度保存所述第一变换的输出。可以使用附加的计算方面。高比特深度结果可例如在所述第一变换之后被存储。可以使用临时缓冲器。可以使用附加存储器来存储高比特深度的第一变换的输出。
[0202]
等式30和/或等式31可用于确定中间变换移位。k=max(|t(c
i,j
>>shift
dequant
)|)
ꢀꢀꢀꢀ
等式30shift
mid
=ceil(log2(k))

16
ꢀꢀꢀꢀꢀ
等式31
[0203]
可确定归一化移位。
[0204]
在一些示例中,如果(例如,一旦)选择两个移位(例如,shift
dequant
和shift
mid
),则可以例如使用等式22来确定第三移位shift
normalization
。等式22可被求解以基于约束和所选移位(例如,shift
dequant
和/或shift
mid
)来确定归一化移位。求解等式22的结果可以在等式32中示出。
[0205]
等式32可用于确定归一化移位。shift
normalization
=shift3‑
(shift
dequant

shift1)

(shift
mid

shift22)等式32
[0206]
在示例中,可以从tu和/或参考数据的统计的更详细分析来计算移位。
[0207]
可以接收表示内容的视频比特流,该视频比特流包括用于一个或多个块的量化变换系数。可以确定基于块的变换系数的量值的精度因子(例如,移位)。该精度因子可以减小最大量值变换系数以适合16位。所述精度因子可以将最大量值变换系数减小到逆变换处理的输入动态范围。所述精度因子可以用于执行至少一个解码功能。所述解码功能可以是解量化和/或逆变换处理。所述解码功能可以用于所述视频比特流的残差重构。可确定一比特数目以表示所述变换系数的最大量值。可接收指示在确定所述精度因子时使用的分数比特的数目的信令。可确定第二精度因子。所述第一精度因子和/或所述第二精度因子可以是内容相关值。可在逆变换处理期间应用所述第二精度因子。所述第二精度因子可基于解量化变换的输出的最大绝对值来限制变换的结果的量值。所述第二精度因子可包括变换系数的列总和。可以确定变换的输出的绝对量值的界限。可确定第三精度因子。可在归一化处理期间应用所述第三精度因子。所述三个精度因子的和可以是与内容无关的值。
[0208]
图8示出了根据本公开的可以在系统、方法和手段中采用的解码操作(800)的流程图的示例。可获得包含多个块的量化变换系数的译码视频数据(810)。可获得与第一块相关联的第一精度因子以用于对所述第一块执行至少一个解码功能(820)。可获得与第二块相关联的用于对所述第二块执行所述至少一个解码功能的第二精度因子(830)。可使用所述第一精度因子对所述第一块的所述量化变换系数执行所述至少一个解码功能,且使用所述第二精度因子对所述第二块的所述量化变换系数执行所述至少一个解码功能(840)。可用信号发送所述第一精度因子。可基于所述第一块的所述变换系数的量值来确定所述第一精度因子。
[0209]
可以结合本文的一个或多个示例来使用编码器。
[0210]
解码器(例如,如本文所述)可被实现为与编码器隔离或嵌入在其中。在逆变换计算中可以实现附加的精度。例如,如果编码器知道逆变换的高精度能力,则可以采取措施来减少编码过程对量化噪声的影响。量化噪声可由编码过程(例如,在编码器操作期间)产生。例如,如果逆变换具有有限的精度,则量化噪声影响可以被有限的精度隐藏。
[0211]
例如,如果残差数据(例如,预测残差数据)不是最坏情况,则可以使用上下文自适应技术。可以提高一个或多个前向变换所使用的精度。图9示出了前向变换(900)中的移位的示例。可使用残差信号的前向变换的结构(例如,如图9中所示)。计算残差数据(例如,最坏情况的残差数据)。可以执行数据的垂直变换。移位(例如,精度因子;移位4)可应用于经变换数据。可执行数据的水平变换。移位(例如,精度因子;移位5)可应用于经变换的数据。可以执行数据的量化。移位(例如,精度因子;移位6)可以被应用于量化数据。可以避免溢出(例如,在最坏情况的残差数据的情况下)。
[0212]
图10示出了catp前向编码器(1000)的示例。可执行对残差分量的分析以确定值的量值(一个或多个),例如,垂直变换之后的最大量值(例如,最大输入)。可以确定(例如,计算)移位(例如,精度因子)。可以执行数据的垂直变换。第一移位(例如,精度因子;midshift)可在第一变换阶段之后(例如,在前向编码期间)应用。midshift可基于数据的内容(例如,与最坏情况假定相对的最大量值输入)来确定。可执行数据的水平变换。可将第二
移位(例如,精度因子;prequantshift)应用于所述变换数据。可以执行数据的量化。第三移位(例如,精度因子;quantshift)可应用于经量化数据。可以执行对移位的分析和/或计算。举例来说,列sad值可经计算和/或与垂直变换的特性一起使用以将动态范围输入限制为中间变换移位(例如,以进一步改进精度)。
[0213]
等式33可用于确定对移位总和的约束。(shift
mid
+shift
prequant
+shift
quant
)=(shift4+shift5+shift6)
ꢀꢀꢀꢀ
等式33
[0214]
例如,在(例如,任何)变换阶段之前(例如,之先),可以使用(例如,单个)分析阶段(例如,如图10所示)。分析可以放置在变换阶段之后和/或附加分析模块可以被包括在第一变换之后。对于前向编码器,界限(例如,如本文所述的任何一个或多个界限)可用于确定中间变换移位和/或预量化移位。作为示例,编码器处的前两个移位的计算可以基于等式25和/或等式26的界限。残差数据可以具有或不具有与用于逆变换的结构相同的结构。等式25中的界限可被使用。当支持最大输入时,该最大输入可以用于确定输入数据的界限和/或导出shift
mid
和/或shift
prequant
,例如,通过使用等式34。b=2
15
>max
k,c
|c
k,c
|
ꢀꢀꢀꢀꢀ
等式34
[0215]
图11示出了根据本公开的编码操作的方法(1100)的流程图的示例。编码器可获得视频数据的多个块的预测残差数据。可分析预测残差数据(例如,以确定用以表示块的量值输入(例如,最大量值输入))(1110)。可获得与第一块相关联的第一精度因子以用于对所述第一块执行至少一个编码功能(1120)。可获得与第二块相关联的第二精度因子以用于对所述第二块执行所述至少一个编码功能(1130)。可使用所述第一精度因子对所述第一块执行所述至少一个编码功能,且使用所述第二精度因子对所述第二块执行所述至少一个编码功能(1140)。可以在任何变换步骤之前(例如,在垂直变换之前)执行对所述预测残差数据的分析以确定用于表示块的最大量值输入。
[0216]
在一些示例中,本发明描述一种包括译码视频数据的信号,所述译码视频数据包括多个块的量化变换系数,其中所述量化变换系数基于所述数据的内容(例如,量值输入(例如,最大量值输入))而被确定。
[0217]
尽管以上以特定的组合描述了特征和元素,但是本领域的普通技术人员将理解,每个特征或元素可以单独使用或与其它特征和元素任意组合使用。另外,本文描述的方法可以在计算机程序、软件或固件中实现,所述计算机程序、软件或固件并入计算机可读介质中以由计算机或处理器执行。计算机可读媒体的示例包括电子信号(通过有线或无线连接传输)和计算机可读存储媒体。计算机可读存储媒体的示例包括但不限于只读存储器(rom)、随机存取存储器(ram)、寄存器、高速缓冲存储器、半导体存储器设备、诸如内部硬盘和可移动盘等磁媒体、磁光媒体、以及诸如cd

rom盘和数字多功能盘(dvd)等光媒体。与软件相关联的处理器可以用于实现在wtru、ue、终端、基站、rnc或任何主机计算机中使用的射频收发信机。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1