在变换跳过模式和多变换选择之间进行协调的方法和装置与流程

文档序号:28326490发布日期:2022-01-05 01:00阅读:100来源:国知局
在变换跳过模式和多变换选择之间进行协调的方法和装置与流程
在变换跳过模式和多变换选择之间进行协调的方法和装置
1.引用并入
2.本公开要求在2019年2月8日向美国专利商标局提交的美国临时申请第62/803,244号的优先权,以及在2019年5月6日向美国专利商标局提交的美国申请第16/403,771号的优先权,其全部内容通过引用并入本文。


背景技术:

3.1.领域
4.与实施例一致的方法和装置涉及视频编解码,并且更具体地,涉及一种在变换跳过模式和多变换选择之间进行协调的方法和装置。
5.2.现有技术描述
6.在高效视频编解码(high efficiency video coding,hevc)中,主变换是4点、8点、16点和32点离散余弦变换

2(discrete cosine transform

2,dct

2),并且变换核心矩阵使用8比特整数表示,即,8比特变换核心。较小的dct

2的变换核心矩阵是较大的dct

2的一部分,如下所示。
7.4x4变换
8.{64,64,64,64}
9.{83,36,

36,

83}
10.{64,

64,

64,64}
11.{36,

83,83,

36}
12.8x8变换
13.{64,64,64,64,64,64,64,64}
14.{89,75,50,18,

18,

50,

75,

89}
15.{83,36,

36,

83,

83,

36,36,83}
16.{75,

18,

89,

50,50,89,18,

75}
17.{64,

64,

64,64,64,

64,

64,64}
18.{50,

89,18,75,

75,

18,89,

50}
19.{36,

83,83,

36,

36,83,

83,36}
20.{18,

50,75,

89,89,

75,50,

18}
21.16x16变换
[0022][0023]
32x32变换
[0024][0025]
dct

2核具有对称/反对称特性。因此,支持所谓的“部分蝶形”实施方式,以减少操作计数(乘法、加法/减法、移位)的数量,并且使用部分蝶形实施方式可以获得与矩阵乘法相同的结果。


技术实现要素:

[0026]
根据实施例,一种控制残差编码,以对视频序列进行解码或编码的方法由至少一个处理器执行,并且所述方法包括:基于多变换选择mts索引指示对所述视频序列的已编码块启用变换跳过模式,将恒等变换identity transform识别为水平变换和/或垂直变换。所述方法进一步包括:基于所述mts索引指示未对所述已编码块启用所述变换跳过模式,将离散余弦变换dct、离散正弦变换dst、哈达玛变换hadamard transform和哈尔变换haar transform之一识别为所述水平变换、或所述垂直变换、或所述水平变换和所述垂直变换的组合。所述方法进一步包括:使用所述识别的水平变换和所述识别的垂直变换,对所述已编码块执行残差编码。
[0027]
根据实施例,一种控制残差编码,以对视频序列进行解码或编码的装置包括至少一个存储器,用于存储计算机程序代码;以及,至少一个处理器,用于访问所述至少一个存
储器,并根据所述计算机程序代码进行操作。其中,所述计算机程序代码包括第一识别代码,用于使得所述至少一个处理器,基于多变换选择mts索引指示对所述视频序列的已编码块启用变换跳过模式,将恒等变换识别为水平变换和/或垂直变换。所述计算机程序代码进一步包括第二识别代码,用于使得所述至少一个处理器,基于所述mts索引指示未对所述已编码块启用所述变换跳过模式,将离散余弦变换dct、离散正弦变换dst、哈达玛变换和哈尔变换之一识别为所述水平变换、或所述垂直变换、或所述水平变换和所述垂直变换的组合。所述计算机程序代码还包括执行代码,用于使得所述至少一个处理器使用所述识别的水平变换和所述识别的垂直变换,对所述已编码块执行残差编码。
[0028]
根据实施例,一种非易性计算机可读存储介质存储指令,所述指令使得至少一个处理器:基于多变换选择mts索引,将恒等变换识别为水平变换和垂直变换中的每一个,其中,所述mts索引指示对视频序列的已编码块启用变换跳过模式。所述指令进一步使得所述至少一个处理器基于所述mts索引,将离散余弦变换dct、离散正弦变换dst、哈达玛变换和哈尔变换之一识别为所述水平变换、或所述垂直变换、或所述水平变换和所述垂直变换,其中,所述mts索引指示未对所述已编码块启用所述变换跳过模式。所述指令还使得所述至少一个处理器使用所述识别的水平变换和所述识别的垂直变换,对所述已编码块执行残差编码。
附图说明
[0029]
图1a是在通用视频编解码(versatile video coding,vvc)的帧内子分区(intra sub

partition,isp)编码模式下对4
×
8块和8
×
4块进行划分的示意图。
[0030]
图1b是在通用视频编解码vvc的帧内子分区isp编码模式下对除4x8、8x4和4x4块以外的所有块进行划分的示意图。
[0031]
图2是根据实施例的通信系统的简化框图。
[0032]
图3是根据实施例的在流式传输环境中的视频编码器和视频解码器的示意图。
[0033]
图4是根据实施例的视频解码器的功能框图。
[0034]
图5是根据实施例的视频编码器的功能框图。
[0035]
图6是根据实施例的一种控制残差编码,以对视频序列进行解码或编码的方法流程图。
[0036]
图7是根据实施例的一种控制残差编码,以对视频序列进行解码或编码的装置的简化框图。
[0037]
图8是适合于实现实施例的计算机系统的图。
具体实施方式
[0038]
在当前的通用视频编解码vvc中,除了与hevc相同的4点、8点、16点和32点dct

2变换之外,还可以包括额外的2点和64点dct

2。在vvc中定义的64点dct

2内核为64x64矩阵。
[0039]
除了在hevc中已经采用的dct

2和4
×
4离散正弦变换

7(discrete sine transform

7,dst

7)之外,已在vvc中使用自适应多变换(adaptive multiple transform,amt,或被称为增强型多变换(enhanced multiple transform,emt),或被称为多变换选择(multiple transform selection,mts))方案,以编码帧间编码块和帧内编码块的残差。除
了使用hevc中的当前变换之外,amt方案还使用dct/dst系列的多个选定的变换。新引入的变换矩阵是dst

7、dct

8。表1示出了所选dst/dct的基函数。
[0040]
表1:dct

2,dst

7和dct

8用于n点输入的转换基函数
[0041][0042]
vvc中的所有主变换矩阵都以8比特表示。amt应用于宽度和高度都小于或等于32的编码单元(coding unit,cu),并且由称为mts_flag的标志控制是否应用amt。当mts_flag等于0时,应用dct

2对残差进行编码。当mts_flag等于1时,使用2个二进制数进一步发信号通知索引mts_idx,以识别根据表2待使用的水平和垂直变换,其中,值1表示使用dst

7,并且值2表示使用dct

8。
[0043]
表2:取决于mts_idx[x][y][cidx]的trtypehor和trtypever的规格
[0044]
mts_idx[xtby][ytby][cidx]trtypehortrtypever

100011121212322
[0045]
dst

7的变换核心是由基矢量组成的矩阵,也可以表示如下:
[0046]
4点dst

7:
[0047]
{a,b,c,d}
[0048]
{c,c,0,

c}
[0049]
{d,

a,

c,b}
[0050]
{b,

d,c,

a}
[0051]
其中,{a,b,c,d}={29,55,74,84}
[0052]
8点dst

7:
[0053]
{a,b,c,d,e,f,g,h,}
[0054]
{c,f,h,e,b,

a,

d,

g,}
[0055]
{e,g,b,

c,

h,

d,a,f,}
[0056]
{g,c,

d,

f,a,h,b,

e,}
[0057]
{h,

a,

g,b,f,

c,

e,d,}
[0058]
{f,

e,

a,g,

d,

b,h,

c,}
[0059]
{d,

h,e,

a,

c,g,

f,b,}
[0060]
{b,

d,f,

h,g,

e,c,

a,}
[0061]
其中,{a,b,c,d,e,f,g,h}={17,32,46,60,71,78,85,86}
[0062]
16点dst

7:
[0063]
{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,}
[0064]
{c,f,i,l,o,o,l,i,f,c,0,

c,

f,

i,

l,

o,}
[0065]
{e,j,o,m,h,c,

b,

g,

l,

p,

k,

f,

a,d,i,n,}
[0066]
{g,n,l,e,

b,

i,

p,

j,

c,d,k,o,h,a,

f,

m,}
[0067]
{i,o,f,

c,

l,

l,

c,f,o,i,0,

i,

o,

f,c,l,}
[0068]
{k,k,0,

k,

k,0,k,k,0,

k,

k,0,k,k,0,

k,}
[0069]
{m,g,

f,

n,

a,l,h,

e,

o,

b,k,i,

d,

p,

c,j,}
[0070]
{o,c,

l,

f,i,i,

f,

l,c,o,0,

o,

c,l,f,

i,}
[0071]
{p,

a,

o,b,n,

c,

m,d,l,

e,

k,f,j,

g,

i,h,}
[0072]
{n,

e,

i,j,d,

o,a,m,

f,

h,k,c,

p,b,l,

g,}
[0073]
{l,

i,

c,o,

f,

f,o,

c,

i,l,0,

l,i,c,

o,f,}
[0074]
{j,

m,c,g,

p,f,d,

n,i,a,

k,l,

b,

h,o,

e,}
[0075]
{h,

p,i,

a,

g,o,

j,b,f,

n,k,

c,

e,m,

l,d,}
[0076]
{f,

l,o,

i,c,c,

i,o,

l,f,0,

f,l,

o,i,

c,}
[0077]
{d,

h,l,

p,m,

i,e,

a,

c,g,

k,o,

n,j,

f,b,}
[0078]
{b,

d,f,

h,j,

l,n,

p,o,

m,k,

i,g,

e,c,

a,}
[0079]
其中,{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p}={9,17,25,33,41,49,56,62,66,72,77,81,83,87,89,90}
[0080]
32点dst

7:
[0081]
{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,a,b,c,d,e,f,}
[0082]
{c,f,i,l,o,r,u,x,a,d,f,c,z,w,t,q,n,k,h,e,b,

a,

d,

g,

j,

m,

p,

s,

v,

y,

b,

e,}
[0083]
{e,j,o,t,y,d,d,y,t,o,j,e,0,

e,

j,

o,

t,

y,

d,

d,

y,

t,

o,

j,

e,0,e,j,o,t,y,d,}
[0084]
{g,n,u,b,d,w,p,i,b,

e,

l,

s,

z,

f,

y,

r,

k,

d,c,j,q,x,e,a,t,m,f,

a,

h,

o,

v,

c,}
[0085]
{i,r,a,c,t,k,b,

g,

p,

y,

e,

v,

m,

d,e,n,w,f,x,o,f,

c,

l,

u,

d,

z,

q,

h,a,j,s,b,}
[0086]
{k,v,f,u,j,

a,

l,

w,

e,

t,

i,b,m,x,d,s,h,

c,

n,

y,

c,

r,

g,d,o,z,b,q,f,

e,

p,

a,}
[0087]
{m,z,z,m,0,

m,

z,

z,

m,0,m,z,z,m,0,

m,

z,

z,

m,0,m,z,z,m,0,

m,

z,

z,

m,0,m,z,}
[0088]
{o,d,t,e,

j,

y,

y,

j,e,t,d,o,0,

o,

d,

t,

e,j,y,y,j,

e,

t,

d,

o,0,o,d,
t,e,

j,

y,}
[0089]
{q,e,n,

c,

t,

b,

k,f,w,y,h,

i,

z,

v,

e,l,c,s,b,

o,

f,

p,a,r,d,m,

d,

u,

a,

j,g,x,}
[0090]
{s,a,h,

k,

d,

p,c,v,x,e,

n,

f,

m,f,y,u,b,

q,

c,

j,i,b,r,

a,

t,

z,

g,l,e,o,

d,

w,}
[0091]
{u,w,b,

s,

y,

d,q,a,f,

o,

c,

h,m,e,j,

k,

f,

l,i,d,n,

g,

b,

p,e,z,r,

c,

x,

t,a,v,}
[0092]
{w,s,

d,

a,

o,h,e,k,

l,

d,

g,p,z,c,

t,

v,a,x,r,

e,

b,

n,i,f,j,

m,

c,

f,q,y,b,

u,}
[0093]
{y,o,

j,

d,

e,t,t,

e,

d,

j,o,y,0,

y,

o,j,d,e,

t,

t,e,d,j,

o,

y,0,y,o,

j,

d,

e,t,}
[0094]
{a,k,

p,

v,e,f,f,

u,

q,j,b,a,

z,

l,o,w,

d,

e,

g,t,r,

i,

c,

b,y,m,

n,

x,c,d,h,

s,}
[0095]
{c,g,

v,

n,o,u,

h,

b,a,d,f,

w,

m,p,t,

i,

a,b,e,e,

x,

l,q,s,

j,

z,c,f,d,

y,

k,r,}
[0096]
{e,c,

b,

f,y,i,

v,

l,s,o,

p,

r,m,u,

j,

x,g,a,

d,

d,a,f,b,

c,

e,z,h,

w,

k,t,n,

q,}
[0097]
{f,

a,

e,b,d,

c,

c,d,b,

e,

a,f,z,

g,

y,h,x,

i,

w,j,v,

k,

u,l,t,

m,

s,n,r,

o,

q,p,}
[0098]
{d,

e,

y,j,t,

o,

o,t,j,

y,

e,d,0,

d,e,y,

j,

t,o,o,

t,

j,y,e,

d,0,d,

e,

y,j,t,

o,}
[0099]
{b,

i,

s,r,j,

a,

a,c,

h,

t,q,k,

z,

b,d,

g,

u,p,l,

y,

c,e,

f,

v,o,m,

x,

d,f,

e,

w,n,}
[0100]
{z,

m,

m,z,0,

z,m,m,

z,0,z,

m,

m,z,0,

z,m,m,

z,0,z,

m,

m,z,0,

z,m,m,

z,0,z,

m,}
[0101]
{x,

q,

g,e,

j,

n,a,

c,

u,t,d,

b,m,k,

d,f,r,

w,

a,y,

p,

h,f,

i,

o,z,

b,

v,s,e,

c,l,}
[0102]
{v,

u,

a,w,

t,

b,x,

s,

c,y,

r,

d,z,

q,

e,a,

p,

f,b,

o,

g,c,

n,

h,d,

m,

i,e,

l,

j,f,

k,}
[0103]
{t,

y,e,o,

d,j,j,

d,o,e,

y,t,0,

t,y,

e,

o,d,

j,

j,d,

o,

e,y,

t,0,t,

y,e,o,

d,j,}
[0104]
{r,

c,k,g,

y,v,

d,

n,f,

o,

c,u,

z,h,j,

b,s,

a,

q,d,

l,

f,x,

w,e,m,

e,p,b,

t,a,

i,}
[0105]
{p,

f,q,

a,

o,e,

r,b,n,

d,s,

c,

m,c,

t,d,l,

b,u,

e,

k,a,

v,f,j,

z,w,

g,

i,y,

x,h,}
[0106]
{n,

b,w,

i,

e,s,

f,r,

d,

j,x,

a,m,a,

o,c,

v,h,f,

t,e,

q,c,k,

y,z,

l,

b,p,

d,u,

g,}
[0107]
{l,

x,c,

q,e,g,

s,e,

v,j,b,

n,z,

a,o,

c,

i,u,

f,t,

h,

d,p,

b,y,

m,a,k,

w,d,

r,f,}
[0108]
{j,

t,d,

y,o,

e,

e,o,

y,d,

t,j,0,

j,t,

d,y,

o,e,e,

o,y,

d,t,

j,0,j,

t,d,

y,o,

e,}
[0109]
{h,

p,x,

f,y,

q,i,

a,

g,o,

w,e,

z,r,

j,b,f,

n,v,

d,a,

s,k,

c,

e,m,

u,c,

b,t,

l,d,}
[0110]
{f,

l,r,

x,d,

c,w,

q,k,

e,

a,g,

m,s,

y,e,

b,v,

p,j,

d,

b,h,

n,t,

z,f,

a,u,

o,i,

c,}
[0111]
{d,

h,l,

p,t,

x,b,

f,c,

y,u,

q,m,

i,e,

a,

c,g,

k,o,

s,w,

a,e,

d,z,

v,r,

n,j,

f,b,}
[0112]
{b,

d,f,

h,j,

l,n,

p,r,

t,v,

x,z,

b,d,

f,e,

c,a,

y,w,

u,s,

q,o,

m,k,

i,g,

e,c,

a,}
[0113]
其中,{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,a,b,c,d,e,f}={4,9,13,17,21,26,30,34,38,42,45,50,53,56,60,63,66,68,72,74,77,78,80,82,84,85,86,88,88,89,90,90}
[0114]
4点dct

8:
[0115]
{a,b,c,d,}
[0116]
{b,0,

b,

b,}
[0117]
{c,

b,

d,a,}
[0118]
{d,

b,a,

c,}
[0119]
其中,{a,b,c,d}={84,74,55,29}
[0120]
8点dct

8:
[0121]
{a,b,c,d,e,f,g,h,}
[0122]
{b,e,h,

g,

d,

a,

c,

f,}
[0123]
{c,h,

e,

a,

f,g,b,d,}
[0124]
{d,

g,

a,

h,c,e,

f,

b,}
[0125]
{e,

d,

f,c,g,

b,

h,a,}
[0126]
{f,

a,g,e,

b,h,d,

c,}
[0127]
{g,

c,b,

f,

h,d,

a,e,}
[0128]
{h,

f,d,

b,a,

c,e,

g,}
[0129]
其中,{a,b,c,d,e,f,g,h}={86,85,78,71,60,46,32,17}
[0130]
16点dct

8:
[0131]
{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,}
[0132]
{b,e,h,k,n,0,

n,

k,

h,

e,

b,

b,

e,

h,

k,

n,}
[0133]
{c,h,m,

p,

k,

f,

a,

e,

j,

o,n,i,d,b,g,l,}
[0134]
{d,k,

p,

i,

b,

f,

m,n,g,a,h,o,

l,

e,

c,

j,}
[0135]
{e,n,

k,

b,

h,0,h,b,k,

n,

e,

e,

n,k,b,h,}
[0136]
{f,0,

f,

f,0,f,f,0,

f,

f,0,f,f,0,

f,

f,}
[0137]
{g,

n,

a,

m,h,f,

o,

b,

l,i,e,

p,

c,

k,j,d,}
[0138]
{h,

k,

e,n,b,0,

b,

n,e,k,

h,

h,k,e,

n,

b,}
[0139]
{i,

h,

j,g,k,

f,

l,e,m,

d,

n,c,o,

b,

p,a,}
[0140]
{j,

e,

o,a,

n,

f,i,k,

d,

p,b,

m,

g,h,l,

c,}
[0141]
{k,

b,n,h,

e,0,e,

h,

n,b,

k,

k,b,

n,

h,e,}
[0142]
{l,

b,i,o,

e,f,

p,

h,c,

m,

k,a,

j,

n,d,

g,}
[0143]
{m,

e,d,

l,

n,f,

c,k,o,

g,b,

j,

p,h,

a,i,}
[0144]
{n,

h,b,

e,k,0,

k,e,

b,h,

n,

n,h,

b,e,

k,}
[0145]
{o,

k,g,

c,b,

f,j,

n,

p,l,

h,d,

a,e,

i,m,}
[0146]
{p,

n,l,

j,h,

f,d,

b,a,

c,e,

g,i,

k,m,

o,}
[0147]
其中,{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p}={90,89,87,83,81,77,72,66,62,56,49,41,33,25,17,9}
[0148]
32点dct

8:
[0149]
{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,a,b,c,d,e,f,}
[0150]
{b,e,h,k,n,q,t,w,z,c,f,

e,

b,

y,

v,

s,

p,

m,

j,

g,

d,

a,

c,

f,

i,

l,

o,

r,

u,

x,

a,

d,}
[0151]
{c,h,m,r,w,b,0,

b,

w,

r,

m,

h,

c,

c,

h,

m,

r,

w,

b,0,b,w,r,m,h,c,c,h,m,r,w,b,}
[0152]
{d,k,r,y,f,

a,

t,

m,

f,

b,

i,

p,

w,

d,c,v,o,h,a,g,n,u,b,

e,

x,

q,

j,

c,

e,

l,

s,

z,}
[0153]
{e,n,w,f,

y,

p,

g,

c,

l,

u,

d,a,r,i,a,j,s,b,

c,

t,

k,

b,

h,

q,

z,e,v,m,d,f,o,x,}
[0154]
{f,q,b,

a,

p,

e,

g,

r,

c,z,o,d,h,s,d,

y,

n,

c,

i,

t,

e,x,m,b,j,u,f,

w,

l,

a,

k,

v,}
[0155]
{g,t,0,

t,

g,

g,

t,0,t,g,g,t,0,

t,

g,

g,

t,0,t,g,g,t,0,

t,

g,

g,

t,0,t,g,g,t,}
[0156]
{h,w,

b,

m,

c,

r,0,r,c,m,b,

w,

h,

h,

w,b,m,c,r,0,

r,

c,

m,

b,w,h,h,w,

b,

m,

c,

r,}
[0157]
{i,z,

w,

f,

l,

c,t,c,o,f,

q,

a,

r,e,n,d,u,

b,

k,

g,

x,y,h,j,a,

v,

e,

m,

d,s,b,p,}
[0158]
{j,c,

r,

b,

u,z,g,m,f,

o,

e,

x,w,d,p,

e,

l,

h,

a,t,a,s,

b,

i,

k,

d,q,c,v,

y,

f,

n,}
[0159]
{k,f,

m,

i,

d,o,g,b,

q,

e,

z,s,c,x,

u,

a,

v,w,b,t,

y,

d,

r,a,f,p,

c,

h,

n,e,j,l,}
[0160]
{l,

e,

h,

p,a,d,t,

w,

a,

x,s,e,b,

o,

i,

f,k,m,

d,

g,

q,z,c,u,

v,

b,

y,r,f,c,

n,

j,}
[0161]
{m,

b,

c,

w,r,h,0,

h,

r,w,c,b,

m,

m,b,c,w,

r,

h,0,h,r,

w,

c,

b,m,m,

b,

c,

w,r,h,}
[0162]
{n,

y,

c,

d,i,s,

t,

h,e,d,x,

o,

m,z,b,c,

j,

r,u,g,

f,

e,

w,p,l,

a,

a,

b,k,q,

v,

f,}
[0163]
{o,

v,

h,c,a,d,

g,

w,n,p,

u,

i,b,b,e,

f,

x,m,q,

t,

j,a,c,f,

e,

y,l,r,

s,

k,z,d,}
[0164]
{p,

s,

m,v,j,

y,

g,b,d,

e,

a,

f,c,c,

f,

z,i,w,

l,

t,o,q,

r,

n,u,k,

x,

h,a,e,

d,

b,}
[0165]
{q,

p,

r,o,s,

n,

t,m,u,

l,

v,k,w,

j,

x,i,y,

h,

z,g,a,

f,

b,e,c,

d,

d,c,e,

b,

f,a,}
[0166]
{r,

m,

w,h,b,

c,0,c,

b,

h,w,m,

r,

r,m,w,

h,

b,c,0,

c,b,h,

w,

m,r,r,

m,

w,h,b,

c,}
[0167]
{s,

j,

b,a,

c,

i,t,r,

k,

a,b,

d,

h,u,q,

l,

z,c,

e,

g,v,p,

m,

y,d,

f,

f,w,o,

n,

x,e,}
[0168]
{t,

g,0,g,

t,

t,g,0,

g,t,t,

g,0,g,

t,

t,g,0,

g,t,t,

g,0,g,

t,

t,g,0,

g,t,t,

g,}
[0169]
{u,

d,b,n,

k,

e,g,

r,

x,a,

y,

q,h,

f,

j,o,a,

c,v,t,

e,c,m,

l,

d,f,

s,

w,b,

z,

p,i,}
[0170]
{v,

a,w,u,

b,x,t,

c,y,s,

d,z,r,

e,a,q,

f,b,p,

g,c,o,

h,d,n,

i,e,m,

j,f,l,

k,}
[0171]
{w,

c,r,b,

h,m,0,

m,h,

b,

r,c,

w,

w,c,

r,

b,h,

m,0,m,

h,b,r,

c,w,w,

c,r,b,

h,m,}
[0172]
{x,

f,m,

e,

q,b,

t,

b,j,

i,a,u,

c,p,f,

n,e,

w,

y,g,

l,d,r,

a,s,c,

k,h,

z,

v,d,

o,}
[0173]
{y,

i,h,

x,

z,j,

g,w,a,

k,f,

v,

b,l,

e,u,c,

m,d,

t,

d,n,

c,s,e,

o,b,

r,

f,p,

a,q,}
[0174]
{z,

l,c,

q,e,u,

g,h,

v,

d,p,

b,m,

a,

y,k,

d,r,

f,

t,f,

i,w,c,

o,a,

n,b,x,

j,e,

s,}
[0175]
{a,

o,c,

j,v,f,

t,h,

e,q,

c,

y,m,

a,l,

x,

d,r,

f,g,

s,e,w,

k,b,

n,z,b,

p,d,

i,u,}
[0176]
{b,

r,h,

c,m,

w,0,w,

m,c,

h,r,

b,

b,r,

h,c,

m,w,0,

w,m,

c,h,

r,b,b,

r,h,

c,m,

w,}
[0177]
{c,

u,m,

e,d,

l,t,

b,

d,v,

n,f,

c,k,

s,a,e,

w,o,

g,b,

j,r,

z,

f,x,

p,h,

a,i,

q,y,}
[0178]
{d,

x,r,

l,f,

a,g,

m,s,

y,e,c,

w,q,

k,e,

b,h,

n,t,

z,f,b,

v,p,

j,d,

c,i,

o,u,

a,}
[0179]
{e,

a,w,

s,o,

k,g,

c,b,

f,j,

n,r,

v,z,

d,

f,b,

x,t,

p,l,

h,d,

a,e,

i,m,

q,u,

y,c,}
[0180]
{f,

d,b,

z,x,

v,t,

r,p,

n,l,

j,h,

f,d,

b,a,

c,e,

g,i,

k,m,

o,q,

s,u,

w,y,

a,c,

e,}
[0181]
其中,{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,a,b,c,d,e,f}={90,90,89,88,88,86,85,84,82,80,78,77,74,72,68,66,63,60,56,53,50,45,42,38,34,30,26,21,17,13,9,4}
[0182]
在vvc中,当编码块的高度和宽度都小于或等于64时,转换大小始终与编码块大小相同。当编码块的高度或宽度大于64时,在进行变换或帧内预测时,将编码块进一步划分为
多个子块,其中,每个子块的宽度和高度小于或等于64,并对每个子块执行一次变换。
[0183]
图2是根据实施例的通信系统(200)的简化框图。通信系统(200)可以包括经由网络(250)互连的至少两个终端(210

220)。对于数据的单向传输,第一终端(210)可以在本地位置对视频数据进行编码,以经由网络(250)传输到另一终端(220)。第二终端(220)可以从网络(250)接收另一终端的已编码视频数据,解码该已编码数据,并显示恢复的视频数据。在媒体服务应用程序等类似程序中,单向数据传输可能很常见。
[0184]
下面描述vvc草案版本2中mts的相关语法和语义(以斜体突出显示)
[0185]
7.3.4.11变换单元语法
[0186][0187]
7.3.4.12残差编码语法
[0188]
[0189][0190]
7.4.5.11变换单元语义
[0191]
cu_mts_flag[x0][y0]等于1表示将多变换选择应用于关联的亮度变换块的残差样本。cu_mts_flag[x0][y0]等于0表示未将多变换选择应用于关联的亮度变换块的残差样本。数组索引x0,y0指定所考虑的变换块的左上亮度样本相对于图片的左上亮度样本的位置为(x0,y0)。
[0192]
当不存在cu_mts_flag[x0][y0]时,推断cu_mts_flag[x0][y0]为0。
[0193]
7.4.5.12残差编码语义
[0194]
transform_skip_flag[x0][y0][cidx]指定是否将变换应用于相关联的变换块:数组索引x0、y0指定所考虑的变换块的左上亮度样本相对于图片的左上亮度样本的位置为(x0,y0)。数组索引cidx指定颜色分量的指示符;对于亮度,数组索引cidx等于0,对于cb,数组索引cidx等于1,且对于cr,数组索引cidx等于2。transform_skip_flag[x0][y0][cidx]等于1指定不对当前变换块应用变换。
[0195]
transform_skip_flag[x0][y0][cidx]等于0指定是否将变换应用于当前变换块的决定取决于其它语法元素。当transform_skip_flag[x0][y0][cidx]不存在时,推断transform_skip_flag[x0][y0][cidx]等于0。
[0196]
last_sig_coeff_x_prefix指定变换块内按扫描顺序排列的最后有效系数的列位置的前缀。last_sig_coeff_x_prefix的值应该在0到(log2tbwidth<<1)

1(包括端值)的范围内。
[0197]
last_sig_coeff_y_prefix指定变换块内按扫描顺序排列的最后有效系数的行位置的前缀。last_sig_coeff_y_prefix的值应该在0到(log2tbheight<<1)

1(包括端值)的范围内。
[0198]
last_sig_coeff_x_suffix指定变换块内按扫描顺序排列的最后有效系数的列位置的后缀last_sig_coeff_x_suffix的值应该在0到(1<<((last_sig_coeff_x_prefix>>1)

1))

1(包括端值)的范围内。
[0199]
如下导出变换块lastsignificantcoeffx内按扫描顺序排列的最后一个有效系数
的列位置:
[0200]

如果last_sig_coeff_x_suffix不存在时,则以下适用:
[0201]
lastsignificantcoeffx=last_sig_coeff_x_prefix
[0202]

否则(last_sig_coeff_x_suffix存在),则以下适用:
[0203]
lastsignificantcoeffx=(1<<((last_sig_coeff_x_prefix>>1)

1))*(2+(last_sig_coeff_x_prefix&1))+last_sig_coeff_x_suffix
[0204]
……
[0205]
coeff_sign_flag[n]指定扫描位置n的变换系数级别的正负号,如下所示:
[0206]

如果coeff_sign_flag[n]等于0,则对应的变换系数级别具有正值。
[0207]

否则(coeff_sign_flag[n]等于1),则对应的变换系数级别具有负值。
[0208]
当coeff_sign_flag[n]不存在时,推断coeff_sign_flag[n]等于0。
[0209]
mts_idx[x0][y0]指定沿当前变换块的水平和垂直方向将哪些变换核应用于亮度残差样本。数组索引x0、y0指定所考虑的变换块的左上亮度样本相对于图片的左上亮度样本的位置为(x0,y0)。
[0210]
当mts_idx[x0][y0]不存在时,推断mts_idx[x0][y0]等于

1。
[0211]
在vvc中,变换跳过模式(transform skip mode,tsm)用于对帧内和帧间预测残差进行编码。对于小于或等于16个样本的编码块(亮度编码块和色度编码块),发信号通知一个标志,以指示是否将tsm应用于当前块。当应用tsm时,下面列出了每个模块的详细修改。
[0212]
(a)预测:无变化。
[0213]
(b)变换:跳过。相反,对于变换跳过变换单元(transform unit,tu),使用简单的缩放过程。为了使变换跳过系数具有与其它变换系数类似的大小,执行缩小过程,并且缩放因子与同大小的其它变换(相对于标准1的标准浮点变换)相关联的缩放比例相同。
[0214]
(c)熵编码:发信号通知一个标志,以指示是否绕过变换。
[0215]
(d)解块、sao和alf:无变化。
[0216]
(e)序列参数集(sequence parameter set,sps)中指示是否启用变换跳过的标志。下面描述vvc草案版本2中tsm的相关规范文本(以斜体突出显示):
[0217]
7.3.4.13残差编码语义
[0218][0219]
7.4.5.12残差编码语义
[0220]
transform_skip_flag[x0][y0][cidx]指定是否将变换应用于相关联的变换块:数组索引x0、y0指定所考虑的变换块的左上亮度样本相对于图片的左上亮度样本的位置为(x0,y0)。数组索引cidx指定颜色分量的指示符;对于亮度,数组索引cidx等于0,对于cb,数组索引cidx等于1,且对于cr,数组索引cidx等于2。transform_skip_flag[x0][y0][cidx]等于1指定不对当前变换块应用变换。transform_skip_flag[x0][y0][cidx]等于0指定是否将变换应用于当前变换块的决定取决于其它语法元素。当transform_skip_flag[x0][y0][cidx]不存在时,推断transform_skip_flag[x0][y0][cidx]等于0。
[0221]
last_sig_coeff_x_prefix指定变换块内按扫描顺序排列的最后有效系数的列位置的前缀。last_sig_coeff_x_prefix的值应该在0到(log2tbwidth<<1)

1(包括端值)的范围内。
[0222]
8.5.2缩放和变换过程
[0223]
该过程的输入为:
[0224]

亮度位置(xtby,ytby),指定相对于当前图片的左上亮度样本的当前亮度变换块的左上样本,
[0225]

变量cidx,指定当前块的色彩分量,
[0226]

变量ntbw,指定变换块宽度,
[0227]

变量ntbh,指定变换块高度。
[0228]
该过程的输出是残差样本ressamples[x][y]的(ntbw)x(ntbh)数组,其中,x=0..ntbw

1,y=0..ntbh

1。
[0229]
如下导出变量bitdepth,bdshift和tsshift:
[0230]
bitdepth=(cidx==0)?bitdepth
y
:bitdepth
c
[0231]
bdshift=max(22

bitdepth,0)
[0232]
tsshift=5+((log2(ntbw)+log2(ntbh))/2)
[0233]
如下导出残差样本ressamples的(ntbw)x(ntbh)数组:
[0234]
1.以变换块位置(xtby,ytby)、变换宽度ntbw和变换高度ntbh、色彩分量变量cidx和当前色彩分量bitdepth的位深度作为输入,调用第8.5.3条中规定的变换系数的缩放过程,并且输出是缩放变换系数d的(ntbw)x(ntbh)数组。
[0235]
2.如下导出残差样本r的(ntbw)x(ntbh)数组:
[0236]

如果transform_skip_flag[xtby][ytby][cidx]等于1,则如下导出残差样本数组值r[x][y],其中,x=0..ntbw

1,y=0..ntbh

1:
[0237]
r[x][y]=d[x][y]<<tsshift
[0238]

否则,(transform_skip_flag[xtby][ytby][cidx]等于0),使用变换块位置(xtby,ytby)、变换宽度ntbw、变换高度ntbh、色彩分量变量cidx和已缩放变换系数d的(ntbw)
×
(ntbh)数组作为输入,调用已缩放变换系数的变换过程,并且输出是残差样本r的(ntbw)x(ntbh)数组。
[0239]
3.如下导出残差样本ressamples[x][y],其中,x=0..ntbw

1,y=0..ntbh

1:
[0240]

ressamples[x][y]=(r[x][y]+(1<<(bdshift

1)))>>bdshift
[0241]
8.5.3变换系数的缩放过程
[0242]
该过程的输入是:
[0243]

亮度位置(xtby,ytby)指示当前亮度转换块的左上样本相对于当前图片的左上亮度样本的位置
[0244]

变量ntbw指示变换块的宽度,
[0245]

变量ntbh指示变换块的高度,
[0246]

变量cidx指示当前块的色彩分量,
[0247]

变量bitdepth指示当前色彩分量的位深度。
[0248]
该过程的输出是已缩放变换系数的(ntbw)x(ntbh)数组d,其中,已缩放变换系数具有元素d[x][y]。
[0249]
如下导出量化参数qp:
[0250]

若cidx等于0,以下适用:
[0251]
qp=qp

y
[0252]

否则,若cidx等于1,以下适用:
[0253]
qp=qp

cb
[0254]

否则(cidx等于2),以下适用:
[0255]
qp=qp

cr
[0256]
如下导出变量bdshift,rectnorm和bdoffset:
[0257]
bdshift=bitdepth+(((log2(ntbw)+log2(ntbh))&1)*8+(log2(ntbw)+log2(ntbh))/2)

5+dep_quant_enabled_flag
[0258]
rectnorm=((log2(ntbw)+log2(ntbh))&1)==1?181:1
[0259]
bdoffset=(1<<bdshift)>>1
[0260]
将具有k=0..5的levelscale[k]={40,45,51,57,64,72}指定为列表levelscale[]。
[0261]
对于具有x=0..ntbw

1的已缩放的变换系数d[x][y]的推导,以下适用:
[0262]

将中间比例因子m[x][y]设置为等于16。
[0263]

如下导出缩放因子ls[x][y]:
[0264]

若dep_quant_enabled_flag等于1,以下适用:
[0265]
ls[x][y]=(m[x][y]*levelscale[(qp+1)%6])<<((qp+1)/6)
[0266]

否则(dep_quant_enabled_flag等于0),以下适用:
[0267]
ls[x][y]=(m[x][y]*levelscale[qp%6])<<(qp/6)
[0268]

如下导出值dnc[x][y]:
[0269]
dnc[x][y]=
[0270]
(transcoefflevel[xtby][ytby][cidx][x][y]*ls[x][y]*rectnorm+bdoffset)>>bdshift
[0271]

如下导出已缩放变换系数d[x][y]:
[0272]
d[x][y]=clip3(coeffmin,coeffmax,dnc[x][y])
[0273]
在联合视频探索团队(joint video exploration team,jvet)

m0464,提出了一种用于变换跳过和mts的经过修改的语法设计,并将其纳入vvc草稿3。下表说明了与vvc草案3相比,提议的联合语法元素tu_mts_idx的修改后语法。
[0274][0275]
新的联合语法元素tu_mts_idx使用截断的一元二值化(truncated unary binarization),而不是先解析mts标志,然后解析ts标志,随后是对mts索引使用2个二进制数的固定长度编码。第一个二进制数指示ts,mts以及mts索引后的所有内容。下表显示了完整的语义和二值化。
[0276][0277][0278]
上下文模型的数量不变,对tu_mts_idx的每个二进制数分配的上下文索引增量ctxinc如下所示。
[0279][0280]
帧内子分区(intra sub

partitions,isp)编码模式根据块的大小,将亮度帧内预测块垂直或水平划分为2个或4个子分区,如表3所示。图1a和图1b示出了这两种可能性的例子。所有子分区均满足至少有16个样本的条件。对于色度分量,不应用isp。
[0281]
表3:取决于块大小的子分区数
[0282]
块大小子分区数4
×
4不分区4
×
8和8
×
42所有其他情况4
[0283]
对于这些子分区中的每个子分区,通过对编码器发送的系数进行熵解码,然后对熵解码结果进行逆量化和逆变换,生成残差信号。然后,对该子分区进行帧内预测,最后通过将残差信号添加到预测信号,获得相应的重建样本。因此,每个子分区的重建值将可用于生成下一个子分区的预测,下一个子分区会重复该过程,以此类推。所有子分区共享相同的帧内模式。
[0284]
将仅使用属于最可能模式(most probable mode,mpm)列表的帧内模式来测试isp算法。因此,如果块使用了isp,则推断mpm标志为1。此外,如果将isp用于某个块,则修改mpm列表以排除dc模式,并确定isp水平分割的水平帧内模式和isp垂直分割的垂直帧内模式的优先级。
[0285]
在isp中,由于对每个子分区单独执行了变换和重建,因此可将每个子分区视为一个子变换单元(tu)。
[0286]
如上所述,为tsm和mts定义单独的语法和语义。然而,这两种工具都与变换选择相关,因此可以协调语法和语义。
[0287]
在tsm中,跳过水平和垂直变换。然而,跳过水平变换,或跳过垂直变换,或跳过水平变换和垂直变换,可能更加灵活。
[0288]
对于4x2块和2x4块,tsm适用于面积小于或等于16的块,因为面积大小不是2的偶数幂。为了重复使用相同的量化方案,需要在tsm中进行乘法运算,这与不涉及乘法的4点变换跳过相比是额外的计算成本。
[0289]
图2示出了第二对终端(230、240),用于支持可能发生的已编码视频的双向传输,例如,在视频会议期间。对于数据的双向传输,每个终端(230,240)可以对在本地位置捕获的视频数据进行编码,以经由网络(250)传输到另一终端。每个终端(230,240)还可以接收由另一终端发送的已编码视频数据,可以对已编码数据进行解码,并且可以在本地显示设备显示恢复的视频数据。
[0290]
在图2中,终端(210

240)可为服务器、个人计算机和智能电话,但实施例的原理可不限于此。多个实施例适用于膝上型计算机、平板电脑、媒体播放器和/或专用视频会议设备。网络(250)表示在终端(210

240)之间传送已编码视频数据的任何数目的网络,包括例如有线(连线的)和/或无线通信网络。通信网络(250)可在电路交换和/或分组交换信道中交换数据。该网络可包括电信网络、局域网、广域网和/或互联网。出于本公开的目的,除非在下文中有所解释,否则网络(250)的架构和拓扑对于多个实施例的操作来说可能是无关紧要的。
[0291]
图3示出了根据实施例的视频编码器和视频解码器在流式传输环境中的放置方式。本公开所公开主题可同等地适用于其它支持视频的应用,包括例如视频会议、数字tv、在包括cd、dvd、存储棒等的数字介质上存储压缩视频等等。
[0292]
流式传输系统可包括采集子系统(313),所述采集子系统可包括数码相机等视频源(301),所述视频源创建,例如,未压缩的视频样本流(302)。相较于已编码的视频码流,视频样本流(302)被描绘为粗线以强调高数据量的视频样本流,视频样本流(302)可由耦接到相机(301)的编码器(303)处理。编码器(303)可包括硬件、软件或软硬件组合,以实现或实施如下文更详细地描述的所公开主题的各方面。相较于样本流,已编码视频码流(304)被描绘为细线,以强调较低数据量的已编码视频码流,已编码视频码流可存储在流式传输服务器(305)上以供将来使用。一个或多个流式传输客户端(306,308)可访问流式传输服务器(305),以检索已编码的视频码流(304)的副本(307,309)。客户端(306)可包括视频解码器(310)。视频解码器(310)对已编码的视频码流的传入副本(307)进行解码,且产生可在显示器(312)或另一呈现装置(未描绘)上呈现的输出视频样本流(311)。在一些流式传输系统中,可根据某些视频编码/压缩标准对视频码流(304,307,309)进行编码。该些标准的实施例包括itu

t h.265。正在开发的视频编码标准非正式地称为多功能视频编码(versatile video coding,vvc),本公开可用于vvc标准的上下文中。
[0293]
图4是根据实施例的视频解码器(310)的功能框图。
[0294]
接收器(410)可接收将由解码器(310)解码的一个或多个编解码器视频序列;一次接收一个已编码视频序列,其中每个已编码视频序列的解码独立于其它已编码视频序列。可从信道(412)接收已编码视频序列,所述信道可以是通向存储已编码的视频数据的存储
装置的硬件/软件链路。接收器(410)可接收已编码的视频数据以及其它数据,例如,可转发到它们各自的使用实体(未标示)的已编码音频数据和/或辅助数据流。接收器(410)可将已编码视频序列与其它数据分开。为了防止网络抖动,缓冲存储器(415)可耦接在接收器(410)与熵解码器/解析器(420)(此后称为“解析器”)之间。而当接收器(410)从具有足够带宽和可控性的存储/转发装置或从等时同步网络接收数据时,也可能不需要配置缓冲器(415),或可以将所述缓冲存储器做得较小。当然,为了在互联网等业务分组网络上使用,也可能需要缓冲器(415),所述缓冲存储器可相对较大且可具有自适应性大小。
[0295]
视频解码器(310)可包括解析器(420)以根据熵已编码视频序列重建符号(421)。这些符号的类别包括用于管理视频解码器(310)的操作的信息,以及用以控制显示装置,例如,显示屏(312),的潜在信息,所述显示装置不是解码器的组成部分,但可耦接到所述解码器,如图4中所示。用于显示装置的控制信息可以是辅助增强信息(supplementary enhancement information,sei消息)或视频可用性信息(video usability information,vui)的参数集片段(未标示)。解析器(420)可对接收到的已编码视频序列进行解析/熵解码。已编码视频序列的编码可根据视频编码技术或标准进行,且可遵循本领域技术人员众所周知的原理,包括可变长度编码、霍夫曼编码(huffman coding)、具有或不具有上下文灵敏度的算术编码等等。解析器(420)可基于对应于群组的至少一个参数,从已编码视频序列提取用于视频解码器中的像素的子群中的至少一个子群的子群参数集。子群可包括图片群组(group of pictures,gop)、图片、图块、切片、宏块、编码单元(coding unit,cu)、块、变换单元(transform unit,tu)、预测单元(prediction unit,pu)等等。熵解码器、解析器还可从已编码视频序列提取信息,例如变换系数、量化器参数值、运动矢量等等。
[0296]
解析器(420)可对从缓冲器(415)接收的视频序列执行熵解码/解析操作,从而创建符号(421)。解析器(420)可以接收已编码的数据,并且选择性地解码特定符号(421)。此外,解析器(420)可以确定是否将特定符号(421)提供给运动补偿预测单元(453),缩放器/逆变换单元(451),帧内预测单元(452),或环路滤波器单元(454)。
[0297]
取决于已编码视频图片或一部分已编码视频图片(例如:帧间图片和帧内图片、帧间块和帧内块)的类型以及其它因素,符号(421)的重建可涉及多个不同单元。涉及哪些单元以及涉及方式可由解析器(420)从已编码视频序列解析的子群控制信息控制。为了简洁起见,未描述解析器(420)与下文的多个单元之间的此类子群控制信息流。
[0298]
除已经提及的功能块以外,解码器(310)可在概念上细分成如下文所描述的数个功能单元。在商业约束下运行的实际实施例中,这些单元中的许多单元彼此紧密交互并且可以彼此集成。然而,出于描述所公开主题的目的,概念上细分成下文的功能单元是适当的。
[0299]
第一单元是缩放器/逆变换单元(451)。缩放器/逆变换单元(451)从解析器(420)接收作为符号(421)的量化变换系数以及控制信息,包括使用哪种变换方式、块大小、量化因子、量化缩放矩阵等。缩放器/逆变换单元(451)可输出包括样本值的块,所述样本值可输入到聚合器(455)中。
[0300]
在一些情况下,缩放器/逆变换单元(451)的输出样本可属于帧内编码块;即:不使用来自先前重建的图片的预测性信息,但可使用来自当前图片的先前重建部分的预测性信息的块。此类预测性信息可由帧内图片预测单元(452)提供。在一些情况下,帧内图片预测
单元(452)采用从当前(部分重建的)图片(456)提取的已重建信息生成大小和形状与正在重建的块相同的周围块。在一些情况下,聚合器(455)基于每个样本,将帧内预测单元(452)生成的预测信息添加到由缩放器/逆变换单元(451)提供的输出样本信息中。
[0301]
在其它情况下,缩放器/逆变换单元(451)的输出样本可属于帧间编码和潜在运动补偿块。在此情况下,运动补偿预测单元(453)可访问参考图片存储器(457)以提取用于预测的样本。在根据符号(421)对提取的样本进行运动补偿之后,这些样本可由聚合器(455)添加到缩放器/逆变换单元的输出(在这种情况下被称作残差样本或残差信号),从而生成输出样本信息。运动补偿预测单元从参考图片存储器内的地址获取预测样本可受到运动矢量控制,且所述运动矢量以所述符号(421)的形式而供运动补偿预测单元使用,所述符号(421)例如是包括x、y和参考图片分量。运动补偿还可包括在使用子样本精确运动矢量时,从参考图片存储器提取的样本值的内插、运动矢量预测机制等等。
[0302]
聚合器(455)的输出样本可在环路滤波器单元(454)中被各种环路滤波技术采用。视频压缩技术可包括环路内滤波器技术,所述环路内滤波器技术受控于包括在已编码视频码流中的参数,且所述参数作为来自解析器(420)的符号(421)可用于环路滤波器单元(454)。然而,在其他实施例中,视频压缩技术还可响应于在解码已编码图片或已编码视频序列的先前(按解码次序)部分期间获得的元信息,以及响应于先前重建且经过环路滤波的样本值。
[0303]
环路滤波器单元(454)的输出可以是样本流,所述样本流可输出到显示装置(312)以及存储在参考图片存储器(456),以用于后续的帧间图片预测。
[0304]
一旦完全重建,某些已编码图片就可用作参考图片以用于将来预测。一旦已编码图片被完全重建,且已编码图片(通过例如解析器(420))被识别为参考图片,则当前参考图片(456)可变为参考图片缓冲器(457)的一部分,且可在开始重建后续已编码图片之前重新分配新的当前图片存储器。
[0305]
视频解码器(310)可根据例如itu

t h.265标准中记录的预定视频压缩技术执行解码操作。在已编码视频序列遵守视频压缩技术或标准的语法的意义上,如视频压缩技术文档或标准,特别是其中的配置文件中所指定的,所述已编码视频序列可以符合所使用的视频压缩技术或标准所指定的语法。对于合规性,还要求已编码视频序列的复杂度处于视频压缩技术或标准的层级所限定的范围内。在一些情况下,层级限制最大图片大小、最大帧率、最大重建取样率(以例如每秒兆(mega)个样本为单位进行测量)、最大参考图片大小等。在一些情况下,由层级设定的限制可通过假想参考解码器(hypothetical reference decoder,hrd)规范和在已编码视频序列中用信号表示的hrd缓冲器管理的元数据来进一步限定。
[0306]
在实施例中,接收器(410)可连同已编码视频一起接收附加(冗余)数据。所述附加数据可以是已编码视频序列的一部分。所述附加数据可由视频解码器(310)用以对数据进行适当解码和/或较准确地重建原始视频数据。附加数据可呈例如时间、空间或信噪比(signal noise ratio,snr)增强层、冗余切片、冗余图片、前向纠错码等形式。
[0307]
图5是根据实施例的视频编码器(303)的功能框图。
[0308]
编码器(303)可从视频源(301)(并非编码器的一部分)接收视频样本,所述视频源可采集将由编码器(303)编码的视频图像。
[0309]
视频源(301)可提供将由编码器(303)编码的呈数字视频样本流形式的源视频序列,所述数字视频样本流可具有任何合适位深度(例如:8位、10位、12位
……
)、任何色彩空间(例如bt.601y crcb、rgb
……
)和任何合适取样结构(例如y crcb 4:2:0、y crcb 4:4:4)。在媒体服务系统中,视频源(301)可以是存储先前已准备的视频的存储装置。在视频会议系统中,视频源(301)可以是采集本地图像信息作为视频序列的相机。可将视频数据提供为多个单独的图片,当按顺序观看时,这些图片被赋予运动。图片自身可构建为空间像素阵列,其中取决于所用的取样结构、色彩空间等,每个像素可包括一个或多个样本。所属领域的技术人员可以很容易理解像素与样本之间的关系。下文侧重于描述样本。
[0310]
根据实施例,编码器(303)可实时或在由应用所要求的任何其它时间约束下,将源视频序列的图片编码且压缩成已编码视频序列(543)。施行适当的编码速度是控制器(550)的一个功能。控制器控制如下文所描述的其它功能单元且在功能上耦接到这些单元。为了简洁起见,图中未标示耦接。由控制器(550)设置的参数可包括速率控制相关参数(图片跳过、量化器、率失真优化技术的λ值等)、图片大小、图片群组(group of pictures,gop)布局,最大运动矢量搜索范围等。本领域技术人员可以容易地识别控制器(550)的其他功能,因为这些功能可能与针对特定系统设计优化的视频编码器(303)有关。
[0311]
一些视频编码器以本领域技术人员容易理解的“编码循环”的方式进行操作。作为简单的描述,编码环路可包括编码器(530)的编码部分(此后称为“源编码器”)(负责基于待编码的输入图片和参考图片创建符号)和嵌入于编码器(303)中的(本地)解码器(533)。解码器(533)以(远程)解码器创建样本数据的方式重建符号以创建样本数据(因为在本公开所考虑的视频压缩技术中,符号与已编码视频码流之间的任何压缩是无损的)。将重建的样本流输入到参考图片存储器(534)。由于符号流的解码产生与解码器位置(本地或远程)无关的位精确结果,因此参考图片缓冲器中的内容在本地编码器与远程编码器之间也是按比特位精确对应的。换句话说,编码器的预测部分“看到”的参考图片样本与解码器将在解码期间使用预测时所“看到”的样本值完全相同。这种参考图片同步性基本原理(以及在例如因信道误差而无法维持同步性的情况下产生的漂移)是本领域技术人员众所周知的。
[0312]“本地”解码器(533)的操作可与例如已在上文结合图4详细描述的“远程”解码器(310)相同。然而,另外简要参考图4,当符号可用且熵编码器(545)和解析器(420)能够无损地将符号编码/解码为已编码视频序列时,包括信道(412),接收器(410),缓冲器(415)和解析器(420)在内的解码器(310)的熵解码部分,可能无法完全在本地解码器(533)中实施。
[0313]
此时可以观察到,除存在于解码器中的解析/熵解码之外的任何解码器技术,也必定以基本上相同的功能形式存在于对应的编码器中。可简化编码器技术的描述,因为编码器技术与全面地描述的解码器技术互逆。仅在某些区域中需要更详细的描述,并且在下文提供。
[0314]
作为操作的一部分,源编码器(530)可执行运动补偿预测编码。参考来自视频序列中被指定为“参考帧”的一个或多个先前已编码帧,所述运动补偿预测编码对输入帧进行预测性编码。以此方式,编码引擎(532)对输入帧的像素块与参考帧的像素块之间的差异进行编码,所述参考帧可被选作所述输入帧的预测参考。
[0315]
本地视频解码器(533)可基于源编码器(530)创建的符号,对可指定为参考帧的帧的已编码视频数据进行解码。编码引擎(532)的操作可为有损过程。当已编码视频数据可在
视频解码器(图4中未示出)处被解码时,重建的视频序列通常可以是带有一些误差的源视频序列的副本。本地视频解码器(533)复制解码过程,所述解码过程可由视频解码器对参考帧执行,且可使重建的参考帧存储在参考图片高速缓存(534)中。以此方式,编码器(303)可在本地存储重建的参考帧的副本,所述副本与将由远端视频解码器获得的重建参考帧具有共同内容(不存在传输误差)。
[0316]
预测器(535)可针对编码引擎(532)执行预测搜索。即,对于将要编码的新帧,预测器(535)可在参考图片存储器(534)中搜索可作为所述新图片的适当预测参考的样本数据(作为候选参考像素块)或某些元数据,例如参考图片运动矢量、块形状等。预测器(535)可基于样本块逐像素块操作,以找到合适的预测参考。在一些情况下,根据预测器(535)获得的搜索结果,可确定输入图片可具有从参考图片存储器(534)中存储的多个参考图片取得的预测参考。
[0317]
控制器(550)可管理视频编码器(530)的编码操作,包括例如设置用于对视频数据进行编码的参数和子群参数。
[0318]
可在熵编码器(545)中对所有上述功能单元的输出进行熵编码。熵编码器根据本领域技术人员已知的技术,例如,霍夫曼编码、可变长度编码、算术编码等技术对各种功能单元生成的符号进行无损压缩,从而将所述符号转换成已编码视频序列。
[0319]
传输器(540)可缓冲由熵编码器(545)创建的已编码视频序列,从而为通过通信信道(560)进行传输做准备,所述通信信道可以是通向将存储已编码的视频数据的存储装置的硬件/软件链路。传输器(540)可将来自视频编码器(530)的已编码视频数据与要传输的其它数据合并,所述其它数据例如是已编码音频数据和/或辅助数据流(未示出来源)。
[0320]
控制器(550)可管理编码器(303)的操作。在编码期间,控制器(550)可以为每个已编码图片分配某一已编码图片类型,但这可能影响可应用于相应的图片的编码技术。例如,通常可将图片分配为以下任一种帧类型:
[0321]
帧内图片(i图片),其可以是不将序列中的任何其它帧用作预测源就可被编码和解码的图片。一些视频编解码器容许不同类型的帧内图片,包括例如独立解码器刷新(independent decoder refresh,“idr”)图片。所属领域的技术人员了解i图片的变体及其相应的应用和特征。
[0322]
预测性图片(p图片),其可以是可使用帧内预测或帧间预测进行编码和解码的图片,所述帧内预测或帧间预测使用至多一个运动矢量和参考索引来预测每个块的样本值。
[0323]
双向预测性图片(b图片),其可以是可使用帧内预测或帧间预测进行编码和解码的图片,所述帧内预测或帧间预测使用至多两个运动矢量和参考索引来预测每个块的样本值。类似地,多个预测性图片可使用多于两个参考图片和相关联元数据以用于重建单个块。
[0324]
源图片通常可在空间上细分成多个样本块(例如,4
×
4、8
×
8、4
×
8或16
×
16个样本的块),且逐块进行编码。这些块可参考其它(已编码)块进行预测编码,根据应用于块的相应图片的编码分配来确定所述其它块。举例来说,i图片的块可进行非预测编码,或所述块可参考同一图片的已经编码的块来进行预测编码(空间预测或帧内预测)。p图片的像素块可参考一个先前编码的参考图片通过空间预测或通过时域预测进行非预测编码。b图片的块可参考一个或两个先前编码的参考图片通过空间预测或通过时域预测进行非预测编码。
[0325]
视频编码器(303)可根据例如itu

t h.265建议书的预定视频编码技术或标准执行编码操作。在操作中,视频编码器(303)可执行各种压缩操作,包括利用输入视频序列中的时间和空间冗余的预测编码操作。因此,已编码视频数据可符合所用视频编码技术或标准指定的语法。
[0326]
在实施例中,传输器(540)可在传输已编码的视频时传输附加数据。视频编码器(530)可将此类数据作为已编码视频序列的一部分。附加数据可包括时间/空间/snr增强层、冗余图片和切片等其它形式的冗余数据、sei消息、vui参数集片段等。
[0327]
下面描述的方法可以单独使用,也可以按任何顺序组合使用。此外,每个方法、或每个实施例、编码器和解码器可以由处理电路(例如,一个或多个处理器、或一个或多个集成电路)实现。例如,一个或多个处理器执行存储在非易失性计算机可读介质中的程序。在下面的描述中,可将术语“块”解释为预测块、编码块或编码单元(coding unit,cu)。
[0328]
可将n点恒等变换(identity transform,idt)定义为使用nxn变换核的线性变换过程,该nxn变换核沿对角线位置仅有非零元素。对角线位置是指具有相等的水平和垂直坐标值的位置。在以下关于二值化的描述中,在“0”和“1”之间切换的另一码字也适用。例如,当描述码字“010”时,也可使用另一码字“101”代替。
[0329]
在以下描述中,可以假设垂直预测方向使用预测角度v,并且将类似的垂直帧内预测方向定义为与落入(v

thr,v+thr)范围内的预测角度相关联的帧内预测方向,其中thr是给定阈值。还可以假设水平预测方向使用预测角度h,并且将类似的垂直帧内预测方向定义为与落入(h

thr,h+thr)范围内的预测角度相关联的帧内预测方向,其中thr是给定阈值。
[0330]
在以下描述中,当描述mts候选的dst

7时,它也可以指dst

4。当描述mts候选的dct

8时,它也可以指dct

4。
[0331]
根据实施例,用idt替换mts的某些变换类型,并且,在水平和垂直变换中都使用idt来代替tsm。
[0332]
在实施例中,保留了在jvet

m0464中提出的相同的语法/语义和二值化方法。
[0333]
在实施例中,保留了在jvet

m0464中提出的相同的语法/语义和二值化方法,但是移除了最后一个mts候选,即,对水平变换和垂直变换都应用dct

8。
[0334]
在实施例中,如下修改mts和tsm的索引tu_mts_idx的二值化,其中,x可以是dct

2,或dst

7,或哈达玛变换(hadamard transform),或哈尔变换(haar transform)。
[0335][0336]
在实施例中,如下修改mts和tsm的索引tu_mts_idx的二值化,其中,x可以是dct

2,或dst

7,或哈达玛变换,或哈尔变换。
[0337][0338]
在实施例中,如下修改mts和tsm的索引tu_mts_idx的二值化,其中,x可以是dct

2,或dst

7,或哈达玛变换,或哈尔变换。
[0339][0340][0341]
在实施例中,发信号通知第一标志,以指示idt用作水平变换、垂直变换、还是水平变换和垂直变换。在示例中,如果第一标志指示未将idt用作水平变换或垂直变换,则发信号通知另一标志,以指示是否将dct

2或dst

7应用于水平变换和垂直变换。在另一示例中,如果第一标志指示将idt应用于水平变换、或垂直变换、或水平变换和垂直变换,则可以发信号通知第二标志,以指示是否将idt应用于水平变换和垂直变换,如果第二标志指示未将idt用作水平变换或垂直变换,则可以发信号通知第三标志,以指示是否将idt应用于水平变换或垂直变换。在又一示例中,使用上下文对第一标志进行熵编码,根据是否使用idt编码相邻块导出上下文。
[0342]
在实施例中,如下修改mts和tsm的索引tu_mts_idx的二值化,其中,x可以是dct

2,或dst

7,或哈达玛变换,或哈尔变换。
[0343][0344][0345]
在实施例中,根据使用编码信息满足的某些条件,可以自适应地使用idt替换mts候选。使用已编码信息的某些条件包括,但不限于:是否使用idt(或tsm)对相邻块进行编码、是否使用某些帧内预测模式对当前块进行编码、是否使用帧内块复制(intra block copy,ibc)对当前块进行编码、当前分量是亮度还是色度、是否使用子块合并模式对当前块
进行编码,以及是否使用isp模式对当前块进行编码。例如,当使用类似垂直或类似水平的帧内预测模式,通过帧内预测对当前块进行编码时,可以使用idt替换多个mts候选中的一个mts候选。在另一示例中,当通过帧内预测对当前块进行编码,并且不应用分数点内插时,例如,对角线模式、水平模式、垂直模式,和与任何可用块形状的对角线方向对准的帧内预测模式方向(不需要分数点内插的广角帧内预测模式),可以用idt替换多个mts候选中的一个mts候选。
[0346]
在实施例中,如果要用水平和垂直变换的idt替换tsm,第一块大小阈值用于确定是否使用idt(用作水平和垂直变换)替换tsm。如果idt正在替换某个mts变换候选,则使用第二块大小阈值确定idt是否正在替换水平变换,或垂直变换。当前块的块大小可以是面积、高度和宽度中的任何一个,或任何组合。第一块大小阈值和第二块大小阈值可以是不同的值。可以在高级语法元素(比如,sps、视频参数集(video parameter set,vps)、图片参数集(picture parameter set,pps)、图块组头、切片头和编码树单元(coding tree unit,ctu)头)中,发信号通知第一块大小阈值和第二块大小阈值。
[0347]
对于某些编码模式,包括子块帧间预测模式、双向光流(bi

directional optical flow,bio)模式、子块变换(sub

block transform,sbt)、多假设帧内帧间合并模式(multi

hypothesis intra

inter merge mode)、三角形分区模式、isp模式和某些非角度帧内预测模式(平面(planar)和/或dc),不应用、或不发信号通知tsm或idt。或者,当应用tsm或idt时,不应用或发信号通知某些模式,比如,子块帧间预测模式、bio模式、sbt、多假设帧内帧间合并模式、三角形分区模式、isp模式和某些非角度帧内预测模式(平面和/或dc)。
[0348]
在实施例中,对于编码器模式决策,为了测量候选预测模式的成本,其中,变换是线性变换,比如,哈达玛变换,绝对差之和(sum of absolute difference,sad)也与绝对变换差之和(sum of absolute transform difference,satd)结合使用,而不是仅仅使用satd。将sad和satd函数的输出用作编码器模式决策的候选预测模式的最终成本。例如,函数可以是min(sad,satd)。在另一示例中,该函数可以是sad和satd的加权和。最终成本可以用于帧内模式决策或帧间模式决策,其中,satd也可以用于运动估计或候选模式选择。
[0349]
具体地,上述方法可以包括对已编码块的残差块应用哈达玛变换,以生成变换系数块,以及基于变换系数块确定satd。该方法可以进一步包括:基于残差块确定sad;以及基于satd与sad,即,这两个差的函数,确定已编码块的候选预测模式的最终成本。该方法可以进一步包括:基于候选预测模式的最终成本,设置mts索引,以指示对已编码块启用tsm。在示例中,可以确定三个候选预测模式的最终成本,并且可以从确定的这三个候选预测模式的最终成本中,选择具有最小最终成本的候选预测模式,以预测是否对已编码块启用tsm。
[0350]
图6是根据实施例的一种控制残差编码,以对视频序列进行解码或编码的方法(600)的流程图。在一些实施方式中,图6的一个或多个过程方框可以由解码器(310)执行。在一些实施方式中,图6的一个或多个过程方框可以由与解码器(310)分离或包括解码器(310)的另一设备或一组设备来执行,例如编码器(303)。
[0351]
参考图6,方法(600)包括:基于mts索引指示对视频序列的已编码块启用了变换跳过模式(610

是),在第一步骤(620)中,将恒等变换(identity transform)识别为水平变换和/或垂直变换,。
[0352]
方法(600)进一步包括:基于mts索引指示未对已编码块启用变换跳过模式(610

否),在第二步骤(630)中,将离散余弦变换(discrete cosine transform,dct)、离散正弦变换(discrete sine transform,dst)、哈达玛变换和哈尔变换之一识别为水平变换、或垂直变换、或水平变换和垂直变换的组合。
[0353]
方法(600)进一步包括:在第三步骤(640)中,使用识别的水平变换和识别的垂直变换,对已编码块执行残差编码。
[0354]
将dct、dst、哈达玛变换和哈尔变换中的一个识别为水平变换、或垂直变换、或、水平变换和垂直变换的组合,包括:基于mts索引指示未对已编码块启用变换跳过模式,并且指示第一值,将恒等变换(identity transform)识别为水平变换,并且将dct

2、dst

7、哈达玛变换和哈尔变换中的一个识别为垂直变换。
[0355]
将dct、dst、哈达玛变换和哈尔变换中的一个识别为水平变换、或垂直变换、或、水平变换和垂直变换的组合,可以包括:基于mts索引指示未对已编码块启用变换跳过模式,并且指示不同于第一值的第二值,将dct

2、dst

7、哈达玛变换和哈尔变换中的一个识别为水平变换,并且将恒等变换(identity transform)识别为垂直变换。
[0356]
方法(600)可以进一步包括:确定是否满足多个条件中的任一个条件、或任何条件的组合,该多个条件包括是否通过恒等变换对已编码块的相邻块进行编码、是否通过帧内预测模式对已编码块进行编码、是否通过帧内块复制对已编码块进行编码、已编码块的分量是亮度还是色度、是否通过子块合并模式对已编码块进行编码,以及是否通过帧内子分区模式对已编码块进行编码。方法(600)可以进一步包括:基于mts索引指示未对已编码块启用变换跳过模式,以及指示确定满足多个条件中的任一条件、或任何条件的组合,将恒等变换识别为水平变换和垂直变换。
[0357]
方法(600)可以进一步包括:确定已编码块的大小是否大于预定阈值,该大小是面积、高度和宽度之一。方法(600)可以进一步包括:基于mts索引指示未对已编码块启用变换跳过模式、基于确定满足的多个条件中的任一条件或任意条件的组合,以及,基于确定已编码块的大小大于预定阈值,将恒定变换识别为水平变换和/或垂直变换。
[0358]
方法(600)可以进一步包括确定已编码块的大小是否大于预定阈值,该大小是面积、高度和宽度之一。将恒等变换识别为水平变换和/或垂直变换可以包括:基于mts索引指示对已编码块启用变换跳过模式和确定已编码块的大小大于预定阈值,将恒等变换识别为水平变换和/或垂直变换。
[0359]
方法(600)可以进一步包括:对已编码块的残差块应用dct、dst和哈达玛变换中的一个,以生成变换系数块;基于变换系数块,确定satd;基于残差块,确定sad;基于satd和sad,确定已编码块的候选预测模式的最终成本,以及基于候选预测模式的最终成本,设置mts索引,以指示启用变换跳过模式。
[0360]
候选预测模式的最终成本可以是satd和sad中的最小值。
[0361]
候选预测模式的最终成本可以是satd和sad的加权和。
[0362]
尽管图6示出了方法(600)的示例性步骤,但是在一些实施方式中,方法(600)可以包括比图6中描绘的那些步骤更多的步骤、更少的步骤、不同的步骤或不同排列的步骤。另外地或可替代地,可以并行的执行方法(600)的两个或多个步骤。
[0363]
此外,可以通过处理电路(例如,一个或多个处理器,或者一个或多个集成电路)实施所提出的方法。在示例中,一个或多个处理器执行存储在非易失性计算机可读介质中的
程序,以执行所提出的一个或多个方法。
[0364]
图7是根据实施例的一种控制残差编码,以对视频序列进行解码或编码的装置(700)的简化框图。
[0365]
参照图7,装置(700)包括第一识别代码(710),第二识别代码(720),执行代码(730),第一确定代码(740),第二确定代码(750)和设置代码(760)。
[0366]
第一识别代码(710)被配置为使得至少一个处理器,基于mts索引指示对视频序列的已编码块启用变换跳过模式,将恒等变换识别为水平变换和/或垂直变换,。
[0367]
第二识别代码(720)被配置为使得至少一个处理器,基于mts索引指示未对已编码块启用变换跳过模式,将dct、dst、哈达玛变换和哈尔变换中的每一个识别为水平变换、垂直变换、或水平变换和垂直变换的组合。
[0368]
执行代码(730)被配置为使得至少一个处理器,使用识别的水平变换和识别的垂直变换,对已编码块执行残差编码。
[0369]
第二识别代码(720)可进一步被配置为使得至少一个处理器,基于mts索引指示未对已编码块启用变换跳过模式并指示第一值,将恒等变换识别为水平变换,并识别dct

2,dst

7,哈达玛变换和哈尔变换之一。
[0370]
第二识别代码(720)可进一步被配置为使得至少一个处理器,基于mts索引指示未对已编码块启用变换跳过模式,并指示与第一值不同的第二值,将dct

2,dst

7,哈达玛变换和哈尔变换之一识别为水平变换,并将恒等变换识别为垂直变换。
[0371]
第一确定代码(740)可被配置为使得至少一个处理器确定是否满足多个条件中的任何一个条件,或多个条件中的任何条件的组合,所述多个条件包括是否通过恒等变换对已编码块的相邻块进行编码、是否通过帧内预测模式对已编码块进行编码、是否通过帧内块复制对已编码块进行编码、已编码块的分量是亮度还是色度、是否通过子块合并模式对已编码块进行编码,以及是否通过帧内子分区isp模式对已编码块进行编码。第一识别代码(710)可以进一步被配置为使至少一个处理器基于mts索引指示未对已编码块启用变换跳过模式,和确定满足的多个条件中的任一条件、或任意条件的组合,将恒等变换识别为水平变换和/或垂直变换。
[0372]
第二确定代码(750)可以被配置为使至少一个处理器确定已编码块的大小是否大于预定阈值,该大小是面积、高度和宽度之一。第一识别代码(710)可以进一步被配置为使至少一个处理器基于mts索引指示未对已编码块启用变换跳跃模式,确定满足的多个条件中的任一条件、或任意条件的组合,以及确定已编码块的大小大于预定阈值,将恒等变换识别为水平变换和/或垂直变换。
[0373]
第二确定代码(750)可以被配置为使至少一个处理器确定已编码块的大小是否大于预定阈值,该大小是面积、高度和宽度之一。第一识别代码(710)可以进一步被配置为使至少一个处理器基于mts索引指示对已编码块启用变换跳过模式,以及确定已编码块的大小大于预定阈值,将恒等变换识别为水平变换和/或垂直变换。
[0374]
设置代码(760)可以被配置为使至少一个处理器对已编码块的残差块应用dct、dst和哈达玛变换之一,以生成变换系数块;基于变换系数块,确定satd;基于残差块,确定sad;基于satd和sad的和,确定已编码块的候选预测模式的最终成本,以及基于候选预测模式的最终成本,设置mts索引,以指示启用变换跳过模式。
[0375]
候选预测模式的最终成本可以是satd与sad中的最小值。
[0376]
候选预测模式的最终成本可以是satd与sad的加权和。
[0377]
上述技术可以通过计算机可读指令实现为计算机软件,并且物理地存储在一个或多个计算机可读介质中。
[0378]
图8是适于实现实施例的计算机系统(800)的图。
[0379]
所述计算机软件可通过任何合适的机器代码或计算机语言进行编码,通过汇编、编译、链接等机制创建包括指令的代码,所述指令可由计算机中央处理单元(central processing unit,cpu),图形处理单元(graphics processing unit,gpu)等直接执行或通过译码、微代码等方式执行。
[0380]
所述指令可以在各种类型的计算机或其组件上执行,包括例如个人计算机、平板电脑、服务器、智能手机、游戏设备、物联网设备等。
[0381]
图8所示的用于计算机系统(800)的组件本质上是示例,并不用于对实现实施例的计算机软件的使用范围或功能进行任何限制。也不应将组件的配置解释为与计算机系统(800)的示例实施例中所示的任一组件或其组合具有任何依赖性或要求。
[0382]
计算机系统(800)可以包括某些人机界面输入设备。这种人机界面输入设备可以通过触觉输入(如:键盘输入、滑动、数据手套移动)、音频输入(如:声音、掌声)、视觉输入(如:手势)、嗅觉输入(未示出),对一个或多个人类用户的输入做出响应。所述人机界面设备还可用于捕获某些媒体,气与人类有意识的输入不必直接相关,如音频(例如:语音、音乐、环境声音)、图像(例如:扫描图像、从静止影像相机获得的摄影图像)、视频(例如二维视频、包括立体视频的三维视频)。
[0383]
人机界面输入设备可包括以下中的一个或多个(仅绘出其中一个):键盘(801)、鼠标(802)、触控板(803)、触摸屏(810)、数据手套(804)、操纵杆(805)、麦克风(806)、扫描仪(807)、照相机(808)。
[0384]
计算机系统(800)还可以包括某些人机界面输出设备。这种人机界面输出设备可以通过例如触觉输出、声音、光和嗅觉/味觉来刺激一个或多个人类用户的感觉。这样的人机界面输出设备可包括触觉输出设备(例如通过触摸屏(810)、数据手套(804)或操纵杆(805)的触觉反馈,但也可以有不用作输入设备的触觉反馈设备)、音频输出设备(例如,扬声器(809)、耳机(未示出))、视觉输出设备(例如,包括阴极射线管(cathode ray tube,crt)屏幕、液晶屏幕(liquid

crystal display,lcd)、等离子屏幕、有机发光二极管(organic light

emitting diode,oled)的屏幕(810),其中每一个都具有或没有触摸屏输入功能、每一个都具有或没有触觉反馈功能——其中一些可通过诸如立体画面输出的手段输出二维视觉输出或三维以上的输出;虚拟现实眼镜(未示出)、全息显示器和放烟箱(未示出))以及打印机(未示出)。
[0385]
计算机系统(800)还可以包括人可访问的存储设备及其相关介质,如包括具有cd/dvd的高密度只读/可重写式光盘(cd/dvd rom/rw)(820)或类似介质(821)的光学介质、拇指驱动器(822)、可移动硬盘驱动器或固体状态驱动器(823),诸如磁带和软盘(未示出)的传统磁介质,诸如安全软件保护器(未示出)等的基于rom/asic/pld的专用设备,等等。
[0386]
本领域技术人员还可以理解,结合所公开的主题使用的术语“计算机可读介质”不包括传输介质、载波或其它瞬时信号。
[0387]
计算机系统(800)还可以包括通往一个或多个通信网络的接口。例如,网络可以是无线的、有线的、光学的。网络还可为局域网、广域网、城域网、车载网络和工业网络、实时网络、延迟容忍网络等等。网络还包括以太网、无线局域网、蜂窝网络(gsm、3g、4g、5g、lte等)等局域网、电视有线或无线广域数字网络(包括有线电视、卫星电视、和地面广播电视)、车载和工业网络(包括canbus)等等。某些网络通常需要外部网络接口适配器,用于连接到某些通用数据端口或外围总线(849)(例如,计算机系统(800)的usb端口);其它系统通常通过连接到如下所述的系统总线集成到计算机系统(800)的核心(例如,以太网接口集成到pc计算机系统或蜂窝网络接口集成到智能电话计算机系统)。通过使用这些网络中的任何一个,计算机系统(800)可以与其它实体进行通信。所述通信可以是单向的,仅用于接收(例如,无线电视),单向的仅用于发送(例如can总线到某些can总线设备),或双向的,例如通过局域或广域数字网络到其它计算机系统。上述的每个网络和网络接口可使用某些协议和协议栈。
[0388]
上述的人机界面设备、人可访问的存储设备以及网络接口可以连接到计算机系统(800)的核心(840)。
[0389]
核心(840)可包括一个或多个中央处理单元(cpu)(841)、图形处理单元(gpu)(842)、以现场可编程门阵列(fpga)(843)形式的专用可编程处理单元、用于特定任务的硬件加速器(844)等。这些设备以及只读存储器(rom)(845)、随机存取存储器(846)、内部大容量存储器(例如内部非用户可存取硬盘驱动器、固态硬盘等)(847)等可通过系统总线(848)进行连接。在某些计算机系统中,可以以一个或多个物理插头的形式访问系统总线(848),以便可通过额外的中央处理单元、图形处理单元等进行扩展。外围装置可直接附接到核心的系统总线(848),或通过外围总线(849)进行连接。外围总线的体系结构包括外部控制器接口pci、通用串行总线usb等。
[0390]
cpu(841)、gpu(842)、fpga(843)和加速器(844)可以执行某些指令,这些指令组合起来可以构成上述计算机代码。该计算机代码可以存储在rom(845)或ram(846)中。过渡数据也可以存储在ram(846)中,而永久数据可以存储在例如内部大容量存储器(847)中。通过使用高速缓冲存储器可实现对任何存储器设备的快速存储和检索,高速缓冲存储器可与一个或多个cpu(841)、gpu(842)、大容量存储器(847)、rom(845)、ram(846)等紧密关联。
[0391]
所述计算机可读介质上可具有计算机代码,用于执行各种计算机实现的操作。介质和计算机代码可以是为实施例的目的而特别设计和构造的,也可以是计算机软件领域的技术人员所熟知和可用的介质和代码。
[0392]
作为实施例而非限制,具有体系结构(800)的计算机系统,特别是核心(840),可以作为处理器(包括cpu、gpu、fpga、加速器等)提供执行包含在一个或多个有形的计算机可读介质中的软件的功能。这种计算机可读介质可以是与上述的用户可访问的大容量存储器相关联的介质,以及具有非易失性的核心(840)的特定存储器,例如核心内部大容量存储器(847)或rom(845)。实现9各种实施例的软件可以存储在这种设备中并且由核心(840)执行。根据特定需要,计算机可读介质可包括一个或一个以上存储设备或芯片。该软件可以使得核心(840)特别是其中的处理器(包括cpu、gpu、fpga等)执行本文所述的特定过程或特定过程的特定部分,包括定义存储在ram(846)中的数据结构以及根据软件定义的过程来修改这种数据结构。另外或作为替代,计算机系统可以提供逻辑硬连线或以其它方式包含在电路
(例如,加速器(844))中的功能,该电路可以代替软件或与软件一起运行以执行本文所述的特定过程或特定过程的特定部分。在适当的情况下,对软件的引用可以包括逻辑,反之亦然。在适当的情况下,对计算机可读介质的引用可包括存储执行软件的电路(如集成电路(ic)),包含执行逻辑的电路,或两者兼备。实施例包括任何合适的硬件和软件组合。
[0393]
虽然本公开已对多个示例实施例进行了描述,但实施例的各种变更、排列和各种等同替换均属于本公开的范围内。因此应理解,本领域技术人员能够设计多种系统和方法,所述系统和方法虽然未在本文中明确示出或描述,但其体现了本公开的原则,因此属于本公开的精神和范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1