专利名称:数字电视数据流中用户数据的带宽高效通信的制作方法
技术领域:
本发明的背景本发明涉及数字电视信号的通信,尤其涉及无需为用户数据预留空间,在数字电视数据流中提供用户数据的带宽高效方案。这类用户数据的实例包括闭路字幕数据、非实时视频数据(例如,帧扫描间测试信号-VITS)、采样视频数据和调测数据的自动测试(AMOL)。
电视信号的数字传输能够以比模拟技术高得多的质量提供视频和音频服务。数字传输方案对于通过有线电视网络或卫星传播到有线电视附属机构和/或直接传播到家庭卫星电视接收器的信号尤其具有优势。可以预测,数字电视发送器和接收器系统将取代现存的模拟系统,就象音频工业界中数字光盘取代模拟留声机的唱片一样。
将压缩的视频数据传送给接收器的一种方法是以包含于打包数据流中的包的形式进行的。一般地,载有压缩数据的包与其他的包,例如,载有相应音频数据和重建电视信号所必需的控制信息的包多路复用。以此方式传输数字电视信号的一个标准是M PEG-2,详见国际标准化组织,ISO/IEC 13818-1,国际标准,1994年11月13日,标题为“GenericCoding of Moving Pictures and A ssociated A udioSystems”,建议H.222.0,此处作为参考文献引用。MPEG-2视频语法和语义的进一步细节见国际标准化组织ISO/IEC 13818-2,国际标准,1995,标题为“Generic Coding of Moving Pictures and Associated AudioVideo”,建议H.262,此处也作为参考文献引用。
在MPEG-2系统(和类似于通用仪器公司专有的DigiCipherII系统)中,一传输流,或传输复用由相邻的一组固定长度包构成。视频序列利用层次结构(其中序列头后接各种扩充,用户数据,一组图形(“GOP”)头,可选用户数据,一图形头等等)被传输。序列头提供一图形序列的信息,该图形序列通常包含多于一个的GOP。该信息包括,例如,水平和垂直尺寸值,纵横比,帧和位的速率,和视频数据的量化参数。一用户数据扩充也可被包含,其在别的事物中,为解码器的使用提供附加数据。DigiCipherII标准为在序列头后附加用户数据的传输而提供,以便识别DigiCipherII信号和在序列中所用的任何专用的视频压缩技术,包括DigiCipher专用预测和块运动估计。
在MPEG-2和DigiCipherII语法中,除了序列扩充和用户数据外,包含有例如视频格式和色彩描述信息的序列显示扩充被提供。一后续图形头组在其他信息中提供一时间码。此后,包含有与将被显示的图形序列中对应图形相关的各种信息的图形头被提供。一图形扩充和最终用于观看的将被解码和复制的实际图形数据此后被提供。注意,MPEG没有指明各种扩充(例如序列显示扩充)或用户数据必需传输的顺序,除它们必需在序列扩充之后且在GOP头(若提供)或图形头之前这一事实外。MPEG不要求GOP头被发送,该头可在特定实现中被忽略。
在实际传输系统中,可能需要为不同目的在不同时间包含附加数据,例如提供闭路字幕,VITS,附加实时视频,和AMOL数据。这类附加数据可被载于电视信号的场消隐间隔(VBI)部分,并在此处被称作“VBI用户信息”。一般地,这些VBI用户信息的插入将需要传输语法以分配和保留固定长度部分(其中VBI用户信息被插入)。若VBI用户信息未被使用,固定长度部分对于其他信息不可使用于是频带将被浪费。
为包含各种类型VBI用户信息(在任意给定时间可能被或可能不被使用)数字电视数据提供传输语法,而不要求为该信息预留空间是具有优势的。此方案在对于传输VBI用户信息提供灵活性的同时,促使频带的有效管理。本发明提供了一传输方法和体现上述优势的装置。本发明的概述根据本发明,为利用数字电视数据流传输载于电视信号场消隐间隔(VBI)部分的各种数量的不同类型信息,提供了一带宽高效的方法。待传输的信息取自于对应连续视频帧的场消隐间隔的输入视频数据部分。第一标识符被提供给所提取的信息。第一标识符指明与该标识符相关信息的特定类型计数。第一标识符和相关信息被插入到数字电视数据流的VBI相关部分。该数据流,包括第一标识符和该信息,此后被传送到一接收器。第一标识符促使数据流作调节以容纳各种数量的不同类型信息而无需为特定数量和信息类型预留空间。
第二标识符被提供给所提取的信息。第二标识符指明由第一标识符所确认的信息的特定类型的优先级。在所述的实施例中,第一和第二标识符在数据流中位于其相关信息的前面。每个第二标识符跟随在第一标识符相应部分之后。因此,该语法提供一确定信息特定类型计数的第一标识符,其后跟随确认信息优先级的第二标识符,而后跟随信息本身。应该理解信息的每一类型(即,“结构,”由计数所规定的大小)可以包含优先级,以便视频图形包含各种优先级的结构。
所提取的信息可包含,例如,一个或多个闭路字幕数据,非实时视频数据,采样视频数据和AMOL数据,此处称作VBI用户数据,因为它被提供于电视信号的VBI部分。当所提取信息包含非实时视频数据时,该语法为非实时视频数据部分提供序列数和段数。当所提取信息包含AMOL数据时,标识符被提供以便指明AMOL数据是否为在简化格式中被表示的空数据。例如,在AMOL数据包含一零串的地方,该字符串可被游程编码以免发送整个零串,由此节省带宽。该语法也可提供标识符以为AMOL数据指定奇偶值。
在所述实施例中,数字电视数据流被装配,以在VBI部分提供指明闭路字幕数据计数的第一标识符,而后跟随指明非实时视频数据计数的第一标识符,而后跟随指明采样视频数据计数的第一标识符,而后跟随指明AMOL数据计数的第一标识符。应该理解以此顺序形成的语法仅构成一个可能的实施例,并且该顺序可被重新安排而不偏离本发明的概念。
本发明也提供一方法用以对上述方式传送的信息进行解码。在该解码方法中,数字电视数据流在一解码器处被接收。当该数据流的VBI部分被触及时,第一标识符被检测到。当确认闭路字幕数据计数的第一标识符指明该数据的存在时,闭路字幕数据被处理。当确认采样视频数据计数的第一标识符指明该数据的存在时,采样视频数据被处理。当确认AMOL数据计数的第一标识符指明该数据的存在时,AMOL数据被处理。
在第二标识符被提供于VBI部分以指定由第一标识符所确认的特定类型数据信息的优先级时,第二标识符在所接收数据流中被检测到。若由第二标识符所确定的优先级不是解码器所支持的优先级,特定信息的处理被禁止。以此方式,具有不同能力的解码器可被应用于操作公共数据流的领域中。不被特定解码器所支持的信息不会给解码器的操作带来负面影响,由于解码器会得到优先级标识符的通知,它将忽略特定信息。
接收器装置被提供用于对包含于数字电视信号的信息进行解码。该接收器包括用于检测所接收数据电视信号中场消隐部分的信息(该信息指明闭路字幕数据计数、非实时视频数据计数、采样视频数据计数和可能出现于场消隐部分的AMOL数据计数)的装置。当闭路字幕数据的计数指明该数据存在于场消隐部分时,响应检测装置的装置处理闭路字幕数据。当非实时的视频数据计数指明该数据存在于视频消隐部分时,响应检测装置的装置处理非实时视频数据。当采样视频数据的计数指明该数据存在于场消隐部分时,响应检测装置的装置处理采样视频数据。当AMOL数据的计数指明该数据存在于场消隐部分时,响应检测装置的装置处理AMOL数据。
接收装置可进一步包含用于检测确认所接收数据优先级的信息的装置。当优先级不被该接收器装置支持时,装置被提供以禁止数据的处理。在一所述实施例中,所接收的数字电视信号具有一MPEG格式。
装置被提供用于在数字电视数据流中以带宽高效的方式传送信息。装置被提供用于从对应于连续视频帧场消隐间隔的数字视频数据部分提取信息。由提取装置所提取的至少一个特定类型的信息被量化,且第一标识符与其相关。第一标识符确定跟随在标识符之后的特定类型信息的计数。装置被提供用于将包括和其相关的第一标识符的所提取信息与数字视频数据的活动视频部分相结合以便形成数字电视数据流。第一标识符促使数据流调整以便容纳各种数量和类型的信息,而不为该信息预留空间。
该装置可进一步包括用于将第二标识符与所提取信息相关的装置。第二标识符指明由第一标识符所确定的特定类型信息的优先级。在所描述的实施例中,每一第二标识符被插入到跟随于第一标识符相应部分之后的数据流中。第一标识符可为闭路字幕数据、非实时视频数据、采样视频数据、和AMOL数据提供计数。附图的简要说明
图1是体现本发明的数字视频编码器的框图;图2是图1所示的语法处理器更详细的、概念上的框图;图3是体现本发明的视频解压缩处理器的框图4是图3所示的视频重建电路的更详细的、概念上的框图(因与本发明相关)。本发明的详细说明本发明提供一带宽高效的方法和装置,用于利用数字电视数据流以传输载于电视信号VBI部分中的各种数量和不同类型的信息。关注的信息是一种类型用户数据的子集,被称为“图形用户数据”以与MPEG或DigiCipherII传输流中的“序列用户数据”相区别。该子集,此处被称作为VBI用户信息,包括闭路字幕数据、非实时视频数据、采样视频数据、和AMOL数据。除非实时视频之外,图形用户数据的这些类中的每一个随每一图形被更新。非实时视频在几个到多个图形周期内被更新。图形用户数据在对应于VBI行的连续视频帧部分中被传输。每一VBI行在根据本发明处理之前由720个8比特亮度样本和720个8比特色度样本表示。
图1示出(框图形式),一用于将原始视频数据处理到语法(其中各种数量不同类型的VBI用户数据可在数字电视数据流中被发送)的编码器。原始数字视频,如与运动图形和电视工程师团体(SM PTE)的标准相符合的视频通过终端10被输入到串行接收器12中。串行接收器将以并行格式输入的数据串行化。串行化的数据缓存于缓冲器14,它可包含一常规的先进先出(FIFO)寄存器。视频分析器16解释串行化数据的语法并去除各种信息如确定新行开始处、确定新帧开始处和原始亮度和色度的数据信息。亮度和色度数据被输入到分解器18(在其中它被分解为对应于连续视频帧场消隐间隔的数据部分和那些帧的活动视频部分)。分解器18也确定是否所获取数据的同步被失去,如果是这样的话,输出一“同步丢失”信号到视频压缩处理器22中,后者也接收将被压缩的活动视频。视频压缩处理器是本技术领域熟知的类型,如美国专利5,376,968;5,235,419;5,091,782;或5,068,724所描述。
包含于数字视频输入信号中的VBI部分的数据自分解器18输出到随机访问存储器(RAM)20中,后者包括亮度RAM和色度RAM。该RAM存储数据直到语法处理器24(它提取VBI用户信息并建立促使将在数字电视数据流的VBI部分中高效传输的信息被通信到相应解码器,例如,在最终用户处的解码器的语法)要求时。
由语法处理器所提供的语法被存储于头FIFO 28中,它用来在,例如,数据电视数据流的MPEG或DigiCipherII的实现中装配传输头。头FIFO向将头与来自视频编码器26的压缩活动视频相结合的环形移位器30提供语法信息。视频编码器26以众所周知的方式利用,例如,哈夫曼编码对来自于视频压缩处理器22的压缩视频进行编码,以提供代码字(CW)、代码字长度(CL)和确认编码信息的数据标签。来自环形移位器30的输出是一包含被头(它包含对活动视频进行解码的必要信息)分隔的活动视频的数据流。此数据流被存储于视频缓冲器32(它根据需要向打包器提供数据)中。打包器是一根据传输流标准如MPEG-2或DigiCipheII标准,将数据装配成传输包的常规组件。
图2是图1所示的语法处理器操作的更详细的、概念性框图。数字视频(例如,来自图1所示的视频分析器16)经终端40输入到一VBI分解器和RAM42。该组件实际上是图1所示的分解器18和VBI20的组合。该分解器输出活动视频到活动视频处理组件76,后者包括如图1所示的视频压缩处理器22和视频编码器26。
包含闭路字幕信息的VBI数据部分由分解器和RAM42输入到41所指示的闭路字幕处理路径。输入到终端40的数字视频数据流的非实时视频数据被分解器和RAM42输出到43所指示的非实时视频处理路径。类似地,采样视频被输出到45指示的采样视频处理路径,AMOL数据输出到47所指示的AMOL处理路径。处理路径41,43,45和47中的每一个根据规定的图形的用户数据位流语法提供采样解释、计数插入、优先级插入和其他语法插入。该语法利用MPEG传输标准所使用的正式语法被描述如下。
MPEG语法是类似于C语言的语法,且是一种描述连续和可能的变速位序列,而不是在计算机C语言中规定一过程性程序和其函数。语法的第一列包含语法元素。第二列以位为单位给出语法元素的长度,第三列指明语法类型。这些类型是bslbf(位串最左位在先)和uim sbf(无符号整数最高位在先)。头“user_data 0{...}”指明括号内的语法元素是一已命名的集合且可在语法任意处可通过简单使用“user_data 0”被激活。位结构的条件出现可用通常的“if”测试来指明。C语言中惯用的关系操作符也可被应用。循环结构也可用且采用标准C循环头语法。语法表后跟随语义集,为每一个事先未定义语法域提供定义并设置其使用限制。跟随的图形用户数据位流语法和位流语义代表本发明的一个优选实施例<pre listing-type="program-listing"><![CDATA[Syntax No.Bits M nem onicuser_data 0{user_data_type_code32bslbfuser_data_type_code8 uim sbfif(user_data_type_code==0x03) {reserved 1 bslbfpicture_special_frame_flag 1 bslbfpicture_special_field_flag 1 bslbfpicture_sp_m v_scale_flag 1 bslbfreserved 3 bslbfvbi_data_flag 1 bslbfif(vbi_daa_flag){cc_count 5 uim sbffor(I=0;i<cc_count;I++){cc_priority 2uim sbffield_num ber2uim sbfline_offset 5uim sbfcc_data_1[18] 8bslbfcc_data_2[18] 8bslbfm arker_bit 1bslbf}non_real_tim e_video_count 4uim sbffor(i=0;i<non_real_tim e_video_count,i++){non_real_tim e_video_priority2uim sbfsequence_num ber 2uim sbfnon_real_tim e_video_field_num ber 1uim sbfline_offset 5uim sbfif(sequence_num ber!=00){ segm ent_num ber 5uim sbf for(i=0;i<32;i++){ non_real_tim e_video_cb_data[70] 8uim sbf non_real_tim e_video_cr_data[70] 8uim sbf}}}sam pled_video_count 3uim sbffor(i=0;i<sam pled_video_count,i++){ sam pled_video_priority2uim sbf field_num ber 2uim sbf line_offset5uim sbf for(i=0;i<704;i++){sam pled_video_Y_data[70] 8uim sbf } for(i=0;i<352;i++){sam pled_video_cb_data[70] 8uim sbfsam pled_video_cr_data[70] 8uim sbf }}am ol_count 4uim sbffor(i=0;i<am ol_coutn;i++){ am ol_priority 2uim sbf field_num ber 2uim sbfline_offset 5uim sbffram e_counter[40] 5uim sbfam ol_data_parity 1uim sbfnon_zero_am ol_flag 1bslbfif(non_zero_am ol_flag){ am ol_data[120] 20 bslbf m arker_bit 1bslbf am ol_data[2135] 15 bslbf} } reservednbslbf}next_start_code 0 }]]></pre>图形用户数据位流语义user_data_type_code-图形用户数据的8位代码,以16进制表示为03。注意在任意一个给定的图形头后编码器将发送不多于一个的图形用户数据结构。
picture_special_fram e_flag-当设置为1时,该标志指明特定帧预测被用于当前图形。该标志废弃sequence_special_fram e_flag的值,且对除P图形外的所有图形被忽略。
picture_special_field_flag-当设置为1时,该标志指明特定帧预测被用于当前图形。该标志废弃sequence_special_field_flag的值,且对除P图形外的所有图形被忽略。
picture_sp_m v_scale_flag-仅当或者picture_special_fram e_flag或picture_special_field_flag被设置时具有意义,影响当前P图形的比例。当设置为1时,3/2和1/2的尺度被指明,0指明单位比例。在special_fram e_flag或special_field_flag被设置为1时,该标志重载sequence_sp_m v_scale_flag的值,除P图形外被忽略。
vbi_data_flag-它指明一个或多个VBI数据结构跟随(闭路字幕,实时或非实时采样视频,和/或AMOL)。
注意在优选实施例中,编码器将满足与VBI数据有关的下列通常要求1.编码器按解码顺序对图形用户数据打包,把要从给定图形重建的VBI数据存储到同一图形的图形用户数据中。
2.编码器为重复域传输VBI数据,随着传输待重复的域的视频数据的图形。
3.对一给定图形和VBI数据类型,编码器传输第一显示域的所有VBI数据,此第一显示域后跟第二显示域的所有VBI数据,此第二显示域后跟所有第三(重复)显示域的所有VBI数据,若出现的话。同时,对于一给定图形,VBI数据类型和域,编码器传输第一行的所有VBI数据,后跟第二行的所有VBI数据,等等。
cc_count-指明跟随此域的闭路字幕结构数量的一5位整数(值的范围在
)。所有这类结构必须以指定的显示顺序出现,假定是隔行扫描显示。
cc_priority-指明图形重建(在此处存在硬件能力的不同级别)中的结构优先级的处于0-3之间的数。对闭路字幕结构,多达每显示域(包括行21)4行可被标为0优先级。
field_num ber-显示顺序中此域的号,从那里VBI数据开始,解释如下值 意义00禁止01第一显示域10第二显示域11第三显示域(胶片(film mode)模式中的重复域)line_offset-给出VBI数据初始行相对于基VBI帧行(NTSC域1的行10,NTSC域2的行273,PAL域1的行6,PAL域2的行319)的偏移量的5位整数,如CCIR报告624-4中所指出的那样。
cc_data_1[18]-用于该域的第一闭路字幕字符的数据,以使第一个接收的位是在从左到右显示的视频行上重建的第一位。
cc_data_2[18]-用于该域的第二闭路字幕字符的数据,以使第一个接收的位是在从左到右显示的视频行上重建的第一位。
该编码器将闭路字幕数据压缩到16位的表示形式且将这些位打包到以第一字符的最低位开始并以第二字符最高位结束的图形数据中。
non_real_tim e_video_count-指明所跟随的非实时视频结构的数量。该域的值可为0-15。所有这类结构以指定的显示顺序出现,假定是隔行扫描显示。
non_real_tim e_video_priority-由解码器所使用的0-3之间的数以确定是否需要重建特定非实时的VBI行。对于非实时采样视频,仅一行可被标为优先级0。因此能够重建一行的解码器只需要重建优先级。
sequence_num ber-对非实时视频段的每一序列进行编号,从1开始到3,在重新滚动到1之前。0序列号表明非实时采样视频行不被重建(非活动的)直到带有非0序列号的段被接收到并且由此相应域不跟随该结构。该序列号在序列间以1递增。
non_real_tim e_video_field_num ber-指明解码器必需重建非实时视频行的域的1位数据,解释如下值 意义0 奇数域1 偶数域
segm ent_num ber-非实时采样视频段的号,起始于0001。
该编码器将非实时采样视频分段为64字节段,并将其作为32个亮度(Y)样本的阵列,后跟16色度样本对(Cb,Cr)的阵列发送,起始于最左样本的最高位。序列的所有段在同一非实时视频行的新采样的任意段之前被顺序传输。
non_real_tim e_video_Y_data[70]-该段的非实时采样视频亮度数据,以使第一位为代码字的最高位。
non_real_tim e_video_cb_data[70]-该段的非实时采样视频色度Cb数据,以使第一位为代码字的最高位。
non_real_tim e_video_cr_data[70]-该段的非实时采样视频色度Cr数据,以使第一位为代码字的最高位。
sam pled_video_count-指明此域后的实时采样视频结构的号(值从0到7)。所有这类结构以指定的显示顺序出现,假定是隔行扫描显示。
sam pled_video_priority-由解码器所使用的0-3之间的数以确定是否需要重建特定采样视频行。对于实时采样视频,仅一行可被标为优先级0。因此能够重建一行的解码器只需要重建优先级0。
sam pled_video_Y_data[70]-该结构的实时采样视频亮度数据,以使其第一位为代码字的最高位。
sam pled_video_cb_data[70]-该结构的实时采样视频色度Cb数据,以使其第一位为代码字的最高位。
sam pled_video_cr_data[70]-该结构的实时采样视频色度Cr数据,以使其第一位为代码字的最高位。
am ol_count-指明跟随该域的AMOL结构的号,且其值在0-15之间。所有这类结构以指定的显示顺序出现,假定是隔行扫描显示。
am ol_priority-由解码器所使用的0-3之间的数以确定是否需要重建特定AMOL行。对于AMOL,仅一行可被标为优先级0。因此能够仅重建行20的解码器只需要重建优先级0。
fram e_count[40]-AMOL结构的帧地址,其中msb对应AMOL位#8,且lsb对应ACN 403-1122-000的AMOL位#12。
am ol_data_parity-对应ACN 403-1122-000的AMOL位#48的AMOL结构的奇偶值。
non_zero_am ol_flag-当AMOL位#13到#47不全为零时置位,并且由此这些位的值在其后域中被传递。
am ol_data[135]-ACN 403-1122-000的AMOL位#13到#47的值,此处am ol_data[1]对应AMOL位#13,且am ol_data[35]对应AMOL位#47。
上述语法被如图2所示的语法处理器24的组件装配。在优选实施例中,这些组件以固件的形式实现。在路径41中,闭路字幕数据被采样解释功能处理,后者从包含闭路字幕数据的每一VBI行的总共1408个样点(704个采样亮度,704个采样色度)中提取16位闭路字幕数据。闭路字幕(CC)计数插入功能46对取自当前视频域的闭路字幕结构的数量进行计数。如图形用户数据位流语义所指示,计数值可为0-31。CC优先级插入功能48将闭路字幕数据的优先级插入,以便支持当前优先级的解码器对闭路字幕数据进行解码,且不支持当前优先级的解码器对数据不解码。所有其他语法信息,如域号,行编移,和标志位被“其他语法插入”功能50插入。来自路径41的语法输出对应以“CC_count”开头的图形用户数据流语法中的上述内容。
非实时视频在路径43中被处理。编码器需要对VBI数据分段以便当图形用户数据负载以较大百分比的分配服务数据率变化时,将负载分配到多个图形中。它主要应用于非实时视频。为减小编码器用于将非实时视频负载分配到图形上的算法的复杂性,非实时视频更新率被限制为22个图形的整数倍。为了对传输包丢失提供坚定性,尤其是对非实时视频序列的最后段,在非实时视频的语法中提供段和序列号以允许解码器检测丢失的非实时视频段。因为非实时视频数据在段中传输,对于解码器来说,较好的方法是对非实时视频数据采用双缓存的方案,以便在接收下一行时显示当前行。为通知解码器停止等待新的非实时视频段的到来且停止重建当前行,编码器将为序列号是0的特定域和行传输几个结构。这向解码器提供信号以停止(即,关闭)非实时视频行。而且,编码器在传输同一非实时视频行的新的采样的任意段之前按序发送非实时视频序列的所有段。序号在非实时视频序列之间以1递增。非实时视频行从活动到非活动状态的转换可被编码器通过将四个图形序列号设置为0的非实时视频行打包图形用户数据而指明。同时,如图形用户数据语法所指明,无对应的亮度或色度采样在此情况下被传输。
为最左采样点在先传输,非实时视频数据被划分成64个字节的段。编码器将每一非实时视频数据段作为以最左采样的最高位为起始的32亮度采样(Y)阵列传输。亮度采样后跟随以最左采样的最高位为起始的16个色度采样对(Cb,Cr)的阵列。编码器能够随着每个视频帧采样、压缩并传输非实时视频中的一行。非实时视频以从每22个图形一次到每484个图形一次(其增量为22个图形)的速率来采样。非实时视频以每行704个水平采样点的完全分辨率被处理。22个图形上非实时视频数据的分段由非实时视频采样解释功能52进行操作。704个采样点的每一个的亮度和色度数据以每个采样点32个字节由采样解释功能52输出。每帧的非实时视频数据的计数由非实时视频(NRV)计数插入功能54保持。这提供用户数据位流语法和语义中设置的non_real_tim e_video_count。非实时视频优先级被NRV优先级插入功能56插入以使解码器忽略它们不支持的优先级。其它非实时视频语法,包括序列号,非实时视频域号,行偏移和段号,被非实时视频处理路径43中的“其他语法插入”功能58插入。注意非实时视频特征可被用于支持场间隔测试信号(VITS),通过在几个帧期间传输VITS的704个采样点。其他数据,如场间隔参考(VIR)信号,也可利用非实时视频路径被传输。通过将数据分段并在许多行上逐一发送,该语法的非实时视频能力使数据服务如VITS所使用的带宽大大减小。
采样视频处理在路径45被提供。采样视频类似非实时视频,但被实时提供。因此,不是将包含于许多帧之上的视频行数据分段,每一帧或域被提供以新的视频行。采样视频可被用于支持广播者或程序员所要发送的任意通用视频。
采样视频数据被已采样的视频采样解释功能60所解释。采样亮度和色度信息被采样视频(SAV)计数功能62计数。采样视频优先级被SAV优先级插入功能64插入以使不支持SAV优先级的解码器忽略SAV数据。其他语法插入,包括域号和行偏移,被路径45上的“其他语法插入功能”66提供。
A.C.N ielson公司为市场研究而使用的程序调测信息,并被称作“调测自动测量”(AMOL)也被用户数据语法提供。该数据被提供给各种电视观众的市场研究处理器所使用,并记录所观看的每个节目和所观看的时间。电视广告具有它们自己的AMOL,且该特征可被作广告者用来在节目调测期间检验广告的正确播放。AMOL信息在国家电视系统委员会(NTSC)播放标准中被插入到每一电视帧的域2的行22中。行22是一活动视频行,且由此对于NTSC信号解码器可能从行23而不是行22开始处理活动视频。在30帧序列中,每一帧的AMOL行一般出现,但大多数帧的数据将通常为空。然而,奇偶位的定义在每一AMOL行要变化。因此语法包括一指明每一帧的35个AMOL数据位是否为0的位,以使语法不发送0数据。相反,语法的non_zero_AMOL_flag位被清除,以利用一位指明整个AMOL行为空。语法总是发送奇偶位,而不管其数据内容,因为即使在无数据出现时,奇偶性也易于变化。
图2所示的路径47的AMOL数据处理类似于采样视频的处理。AMOL数据的解释被AMOL采样解释功能68所提供。如果AMOL数据出现,它被计数且该数据计数被AMOL计数插入功能70插入到语法中。AMOL优先级被功能72插入以使不支持该AMOL优先级的解码器跳过AMOL数据。余下的AMOL语法元素,包括域号,行偏移,AMOL数据奇偶性和非零AMOL标志,以及标志位(如果需要的话)被AMOL处理路径47的“其他语法插入”功能74插入。
包括包含于数字视频信号中的所有闭路字幕、非实时视频、样视频、AMOL数据的VBI语法与从VBI用户数据中的活动视频处理部件76和视频复用器78输出的活动视频多路复用。该多路复用器提供头FIFO 28和图1示出的环形移位器30的功能。复用器78输出的复用数据流被缓存且打包以提供最终传输到解码器群的传输流。
图3是用于处理包含上面详述的VBI用户数据语法的接收数据流的视频解压缩处理器(即,解码器)的框图。视频解压处理器(VDP)包含寻址外部DRAM 122以存储和取出接收器处重建电视节目的视频数据的存储管理器130。该处理器,指明为120,是一个设计用来对传输层(即,控制和其他非视频信息)和通过终端110输入的压缩位流的视频层进行解码的流水线处理器,有时称作视频处理器的“传输包接口”。
一用户处理器接口在终端114被提供,以用于通过M-bus控制器150(在处理器120中配置各种寄存器)对视频数据处理器进行控制。M-bus是双线的、两个方向的串行总线(它提供装置间数据交换的简单高效的手段),且与I2C总线标准完全兼容。
到DRAM 122的接口通过地址线124和数据线126被提供。在图3所示的实例中,DRAM 122具有9位地址口和32位数据口。
视频输出接口138为解压、重建视频(例如,它可被作为标准CCIR(国际无线电咨询委员会)656,8位,27Mhz多路复用的亮度(Y)和色度(Cr,Cb)信号输出而提供)。
一测试接口可通过终端162提供给常规JTAG(联合测试活动组(JointTestA ction G roup))控制器160。JTAG是一用于板级测试的标准边界扫描方法以检测包、板连接以及内部电路中的错误。
视频解压缩处理器120经终端112接收时钟信号。时钟提供时序信息(例如,用于使传输语法分析器132从经终端110输入的打包数据流中的传输包中恢复时序信息和视频信息所使用的时间信息)。获取和错误管理电路134利用由视频语法分析器140检测的程序时钟参考(PCR)和解码时间标记(DTS)以与图形解码起始同步。该电路设置场同步且对所有视频解码和显示功能提供全局同步。
视频层由存储管理器130在外部DRAM 122中配置的输入缓冲器(FIFO)中被缓冲。视频语法分析器140通过存储管理器130接收DRAM FIFO输出的压缩视频数据,并且从描述视频信息的因子中分离运动向量信息。该因子由哈夫曼解码器152、反量化器154、和反向离散余弦变换(IDCT)处理器156处理。
运动向量被恢复并用于寻址重建当前视频帧所需的前面解码的视频帧。具体地,运动向量解码器142解码从视频语法分析器140接收的运动向量,并将其传递给预测地址发生器144。预测地址发生器提供经存储管理器130查找必要的锚帧(anchor frame)(即,帧内(I)或预测(P)帧)数据所需的地址信息,以使预测计算器146提供重建当前帧块所需的预测信号。差分解码器148将预测数据与解码因子数据结合以提供解压视频数据。解压视频数据经存储管理器130存储于DRAM122的适当缓冲器中。应当理解由运动向量解码器142、预测地址发生器144、预测计算器146、差分解码器148、哈夫曼解码器152、反量化器154和IDCT 156实现的视频解压过程通常是常规的,易于被本技术领域的精通者理解。
存储管理器130调度外部DRAM地址和数据总线124,126的全部活动并高效地寻址DRAM 122。该存储管理器保证DRAM 122的输入FIFO部分、视频语法分析器140和视频重建电路136(及预测计算器146和差分解码器148)的数据传输要求得以满足。视频重建电路136计算当前图形并处理VBI用户数据以便插入任何闭路字幕、非实时视频(包括VITS)、采样视频和AMOL数据、及任何测试模式数据,用于在视频输出线138上输出。输出数据的显示通过将解码器时钟指定的时间与当前时间标记(PTS)(它指示何时视频将被显示)相比较而同步的。确认何时视频帧的解码和显示必需开始是通过将解码时间标记(DTS)与PTS相比较而得到的。
DRAM 122被描述为外部存储器并可由多个DRAM芯片构成,如2个4M bit(兆比特,即220比特)的DRAM构成8M,4个4M bit的DRAM构成16M。应该理解在未来实现中,随着存储技术的发展,DRAM 122可被以视频解压处理器中的内部存储器来提供。DRAM被映射以提供不同的解码和输出视频缓冲器及压缩输入视频位流的环状FIFO缓冲器。DRAM也可被用于提供测试模式缓冲器、VITS缓冲器和闭路字幕显示记录缓冲器,也用于存储正确显示和解码视频帧所需的各种图形结构数据。当变量被改变,如PAL或NTSC视频、8或16M bit存储器配置及是否出现B帧时,DRAM可通过存储管理器130被再初始化以按需求提供不同的存储映射。
如上所述,存储管理器130调度外部DRAM总线(包括输入FIFO、视频分析器和视频重建电路的数据传输要求)上的所有动作。存储管理器同时以常规方式完成所要求的DRAM刷新。例如,每一2个或4个外部DRAM中的同一行可被同时刷新。
当包含压缩视频数据的已打包的位流被输入到视频解压处理器120的终端110上时,由压缩数据所表示的视频帧被一次重建一个。初始时,视频数据的一完整帧将被接收并存储于DRAM 122中。后续视频帧的信息可包括整个视频帧的子集(当加入到来自主视频帧(存储于DRAM122)的预测数据中时,它将产生整个视频的重建)。
图4是描述在解码器处将VBI用户信息重建为数字视频数据流的功能框图。该压缩的位流通过终端170被输入到VBI用户数据分解器172中。该分解器功能由图3所示的视频语法分析器140提供,它分解压缩位流以提供闭路字幕用户数据、非实时视频用户数据、采样视频用户数据、AMOL用户数据和活动视频。活动视频处理由接收此活动视频、对其解压(例如,利用众所周知的运动估计和补偿技术)并将此解压视频输出给VBI和视频多路器208的功能206提供。
闭路字幕数据是由171指明的闭路字幕数据通路处理的。闭路字幕计数由功能174去除,它确认当前域或帧将被处理的闭路字幕的数量。由用户数据语法表明的闭路字幕优先级此后被检查以确认它是否为解码器所支持的优先级。如果是,优先级检查功能176将使闭路字幕语法解释功能178解释余下语法,包括域号和行偏移,并恢复实际的闭路字幕数据。被解码器用来阻止新的起始代码的错误检测的任意标志位将被忽略。
语法被解释之后,载有闭路字幕数据的VBI行被功能180重建。来自语法解释功能178的16位闭路字幕数据被重建为具有相应704个亮度采样和704个色度采样的常规VBI行。重建的行被输出到VBI和视频多路器208(此处,它们与分别由路径173、175和177恢复的非实时视频、采样视频和AMOL视频以及来自于活动视频处理功能206的解压缩活动视频输出装配)。
非实时视频路径173、采样视频路径175和AMOL路径177与闭路字幕路径171操作相似。非实时视频计数被功能182去除,非实时视频的优先级检测由功能184完成。若优先级被特定解码器支持,非实时视频语法将被功能186解释且载有非实时视频数据的VBI行将被功能188重建。非实时视频特征可提供功能例如VITS行的双缓存,当接收到一新的序列段时,进行序号检查并丢弃前一序列的各段,和指明给定VITS行的重建应当被终止的条件“sequence=0”的检查。
采样视频计数被功能190去除,且被采样的视频优先级由功能192检查。如果该解码器支持采样视频优先级,该语法被功能194解释,并且载有采样视频数据的VBI行被功能196重建。
AMOL计数被功能198去除,且AMOL优先级由功能200检查。如果AMOL优先级被支持,AMOL语法被功能202解释。载有AMOL数据(即行22)的VBI行被功能204重建。
多路器208的输出包含所有传输的VBI用户信息和解压活动视频,以图2所示呈现给VBI DEMUX和RAM42的原始格式。因此,多路器208将输出由编码器处理的原始数字视频的重建优先级。
应当理解,本发明提供一用于数字电视的编码、通信和解码用户数据的方法和装置。图形用户数据语法可传输闭路字幕、非实时视频、采样视频和AMOL。编码器以解码顺序将图形用户数据打包,以使VBI数据到达跟随图形(在其中,VBI行将被重建)的图形头的图形用户数据中。VBI数据的出现在图形用户数据语法中是有条件的。更具体地,指明用户数据是否包含任何VBI数据的VBI数据标志被提供。每一VBI数据结构集合前的计数值使解码器可跳过闭路字幕和采样视频数据(若无此数据被提供)。由于非实时视频和AMOL的结构取决其内容,计数值不足以计算结构集合的大小。因此,解码器必需通过这些结构进行分析它们是否支持后续VBI数据类型,即使可能没有非实时视频或AMOL数据存在。
对于每一不要求任何VBI数据的图形,编码器清除VBI数据标志,并且不包含任何在图形用户数据语法中指明的后续结构。在胶片模式处理(例如,3∶2折叠)的情况下,编码器将随着为待重复的域传输视频数据为重复域传输VBI数据。编码器将为给定图形和VBI数据类型传输所有的第一显示域的VBI数据,若需要的话,其后跟随第二显示域的所有VBI数据,其后再跟随第三显示域的所有VBI数据。对于一给定图形、VBI数据类型的域,编码器传输第一行(后跟随第二行的所有的VBI数据,等等)的所有VBI数据。例如,对于3个域的胶片模式图形(显示顺序为f2,f1,f2,且闭路字幕在域2的14,16和21行及域1的15和21行上),给定图形的闭路字幕数据将以下列顺序被传输...d1-14,d1-16,d1-21,d2-15,d2-21,d3-14,d3-16,d3-21...
其中,f1是奇数域,f2是偶数域,d1是第一显示域,d2是第二显示域,d3是第三显示域。
重要的是,编码器不应使用指明将VBI服务重建为活动视频的行偏移值。在优选实现中,编码器将闭路字幕数据压缩为16-bit的表示形式。这16-bit以它们在视频行从左到右,以第一字符的最低位起始,第二字符的最高位结束的顺序被打包成图形用户数据。
解码器不要求图形用户数据跟随任意或所有图形。所有来自当前服务视频语法的图形用户数据的VBI数据被解码器接收。该解码器不重建给定的VBI数据结构,除非该结构的优先级域指明其优先级被解码器支持。
在处理非实时视频数据中,解码器将搜索指明非实时视频数据序列的起始的第一段。解码器不考虑将被接收的所有非实时视频段,直到它已经按正确顺序接收序列的每一段。直到所有段被接收到非实时视频服务才被重建,在该时间,非实时视频以满分辨率被处理。解码器此后将显示当前非实时视频行,同时接收下一非实时视频行。当其所有段被接收到时,下一非实时视频行将被显示。
如果解码器在接收到当前非实时视频序列所有段之前接收到新的非实时视频序列的一段,它将抛弃与当前序列相关的非实时视频。新序列的每一段的接收此后将开始。若一个或多个连续图形用户数据结构的图形用户数据指明非实时视频行不是活动的,任意非实时视频行的重建将被终止。这种表示可通过为零的序列号来提供。
尽管本发明已与各种特定实施例相联系被描述,应当理解,各种应用和修改可在不偏离权利要求中所提出的本发明的精神和范围的条件下进行。
权利要求
1.一用于对数字电视数据流中各种数量的不同类型的用户信息进行通信的带宽高效的方法,包括下列步骤从对应连续视频帧的场消隐间隔(VBI)的输入视频数据部分提取用户信息;为所提取的用户信息提供多个第一标识符,每一第一标识符指明与特定标识符相关的特定类型用户信息的计数;以预定顺序将上述第一标识符和其相关用户信息插入上述数字电视数据流的视频语法中,上述顺序指示跟随上述视频语法中的每一第一标识符的用户数据类型;及将包括上述第一标识符和用户信息的上述数据流通信到接收器;其中,上述第一标识符促使上述数据流调整,以容纳各种数量不同类型的用户信息,而无需为具体数量和类型的用户信息预留空间。
2.根据权利要求1的方法还,包括以下各步为所提取的用户信息提供第二标识符;且将上述第二标识符插入到视频语法;上述第二标识符指明由上述第一标识符所确定的特定类型用户信息的优先级。
3.根据权利要求2的方法,其中上述第一和第二标识符在上述视频语法中与其相关的用户信息之前,每一第二标识符在对应的第一标识符之后。
4.根据权利要求1的方法,其中所提取的用户信息包括非实时视频数据,上述方法还包括下列步骤提供上述非实时视频数据的第二和第三标识符,上述第二标识符指明序列号,上述第三标识符指明上述非实时视频数据部分的段号。
5.根据权利要求1的方法,其中所提取的用户信息包括AMOL数据,上述方法还包括下列步骤提供第二标识符以指明AMOL数据是否为以简化形式呈现的零数据。
6.根据权利要求5的方法,进一步包括提供第三标识符以指明上述AMOL数据的奇偶值。
7.根据权利要求1的方法,其中被插入到上述视频语法中的所提取的用户信息包括闭路字幕数据、非实时视频数据、采样视频数据,和AMOL数据中的至少两个。
8.根据权利要求1的方法,其中上述视频语法中的上述第一标识符的预定顺序包括确定闭路字幕数据计数的第一标识符,其后跟随确定非实时视频数据计数的第一标识符,其后跟随确定采样视频数据计数的第一标识符,其后跟随AMOL数据计数的第一标识符。
9.根据权利要求1的方法,其中上述视频语法中的上述第一标识符的预定顺序包括确定闭路字幕数据计数的第一标识符,其后跟随确定非实时视频数据计数的第一标识符。
10.用于对以权利要求7的方法进行通信的用户信息进行解码的方法包括以下步骤在解码器处接收上述数字电视数据流,并且检测那里的上述第一标识符;和当确认闭路字幕数据的上述计数的第一标识符指明这类数据的存在时,处理上述闭路字幕数据。
11.用于对以权利要求7的方法进行通信的用户信息进行解码的方法包括以下步骤在解码器处接收上述数字电视数据流,并且检测那里的上述第一标识符;和当确认非实时视频数据的上述计数的第一标识符指明这类数据的存在时,处理上述非实时视频数据。
12.用于对以权利要求7的方法进行通信的用户信息进行解码的方法包括以下步骤在解码器处接收上述数字电视数据流,并且检测那里的上述第一标识符;和当确认采样视频数据的上述计数的第一标识符指明这类数据的存在时,处理上述采样视频数据。
13.用于对以权利要求7的方法进行通信的用户信息进行解码的方法包括以下步骤在解码器处接收上述数字电视数据流,并且检测那里的上述第一标识符;和当确认AMOL数据的上述计数的第一标识符指明这类数据的存在时,处理上述AMOL数据。
14.根据权利要求7的方法,其中在将上述数字电视数据流通信给上述接收器之前,第二标识符在上述视频语法中被提供,上述第二标识符指明由上述第一标识符所确定的特定类型用户信息的优先级。
15.根据权利要求14的方法,其中上述用户数据的解码包括以下步骤检测所接收数据流中的上述第二标识符;如果由相应第二标识符所确定的优先级不是解码器所支持的优先级时,禁止特定用户信息的处理。
16.根据权利要求8的方法,包括下列步骤为已提取的用户信息提供第二标识符,上述第二标识符指明由上述第一标识符所确定的特定类型的用户信息的优先级;为上述非实时视频数据提供第三和第四标识符,上述第三标识符指明序列号,上述第四标识符指明非实时视频部分的段号;及为上述AMOL数据提供第五和第六标识符,上述第五标识符指明AMOL数据是否为以简化形式表示的零数据,上述第六标识符指明上述AMOL数据的奇偶值。
17.用于解码包含于数字电视信号中用户信息的接收装置,包括用于检测来自由所接收数字电视信号所载的视频语法的信息的装置,该信息确认闭路字幕数据计数和非实时视频数据计数;当上述闭路字幕数据计数指明在上述场消隐部分存在这类数据时,响应检测装置处理上述闭路字幕数据的装置;当上述非实时视频数据计数指明在上述场消隐部分存在这类数据时,响应检测装置处理上述非实时视频数据的装置。
18.根据权利要求17的接收装置,还包括用于检测上述视频语法中的信息的装置,该信息确定采样视频数据计数和AMOL数据计数之中至少一个;当上述采样视频数据计数指明在上述场消隐部分存在这类数据时,响应检测装置处理上述采样视频数据的装置;当上述AMOL数据计数指明在上述场消隐部分存在这类数据时,响应检测装置处理上述AMOL数据的装置。
19.根据权利要求17的接收装置,其中每一上述处理装置包括用于检测确定所接收数据优先级的信息的装置;和用于如果上述优先级不被接收装置支持,禁止数据处理的装置。
20.根据权利要求17的接收装置,其中上述所接收的数字电视信号具有MPEG格式。
21.用于在数字电视数据流中,以带宽高效方式对用户信息进行通信的装置,包括用于从对应连续视频帧的场消隐间隔的数字视频数据部分提取用户信息的装置;用于量化由上述提取装置所提取的多种特定类型用户信息,并将第一标识符与每一类型的用户信息相联系的装置,上述第一标识符指明跟随标识符的特定类型用户信息的计数;用于将包括以预定顺序与其相关的第一标识符的所提取的用户信息和上述数字电视数据活动视频部分相结合,以形成上述数字电视数据流,上述预定顺序指示跟随上述数据流中每一第一标识符的用户数据类型;其中上述第一标识符促使调整上述数据流以容纳各种数量和类型的用户信息,而无需为该用户信息预留空间。
22.根据权利要求21的装置,包括用于将第二标识符与所提取的用户信息相联系的装置,上述第二标识符指明由上述第一标识符所确定的特定类型用户信息的优先级。
23.根据权利要求22的装置,其中每一上述第二标识符被插入到跟随对应的第一标识符的上述数据流中。
24.根据权利要求21的装置,其中用于量化和关联的上述装置提供确定闭路字幕数据计数的第一标识符和用于确定非实时视频数据计数的第一标识符。
25.根据权利要求24的装置,其中用于量化和关联的上述装置还提供确定采样视频数据计数的第一标识符和用于确定AMOL数据计数的第一标识符。
全文摘要
提供一种用于数字电视VBI用户的数据通信的方法和装置。一允许闭路字幕、非实时视频、采样视频和AMOL传输的语法被提供。非实时视频可被用于以全分辨率在系统中传输各种类型的数据,如场间隔测试信号(V IT S)。每一类型VBI用户信息计数语法中的约定促使调整数字电视数据流,以容纳各种数量和类型的这类信息,而无需预留的空间。语法中优先级值的约定使解码器丢掉不被特定解码器支持的VBI用户信息优先级。
文档编号H04N7/52GK1200220SQ96196539
公开日1998年11月25日 申请日期1996年6月27日 优先权日1995年6月28日
发明者雷·纽伯, 保罗·莫罗尼, 克里斯·霍根博姆 申请人:通用仪器公司