唱盘和音频信号的编码、解码装置和传输方法及记录媒体的制作方法

文档序号:6751347阅读:136来源:国知局
专利名称:唱盘和音频信号的编码、解码装置和传输方法及记录媒体的制作方法
技术领域
本发明涉及唱盘和音频信号的编码装置、解码装置和传输方法以及计算机程序的记录媒体。
作为现有的音频重放用光盘,CD(小型盘)是公知的。作为比CD密度更高的光盘,DVD(数字视频盘)是公知的。
但是,在DVD(以下称为DVD视盘)中,由于是以记录视频信号为主,以记录音频信号为辅,所以而存在以下问题(1)音频信号与视频信号是一体化的,音频信号的记录容量较少。
(2)不能管理音频信号的时间。
(3)不能取出曲名等简单的文字信息。
与视盘相比,唱盘的使用者的使用面较宽,因此,通过象CD那样设置TOC(目录表)的区域,来求得简单的重放方法。但是,在DVD视盘中,由导航控制包(CONT包)及多个视频(V)包和音频(A)包来构成视频目录块单元,通过CONT包来控制V、A包的重放等,因此,即使以音频信号为主进行记录,使用者也不能简单地进行重放,存在使用便利性变差的问题。
在DVD视盘中,由于仅以视频帧单位来进行时间管理,所以即使以音频信号为主进行记录的情况下,因为音频信号的连续性比视频更为重要,则存在实时的管理困难这样的问题。
因此,本发明的目的是提供一种在以音频信号为主进行记录的情况下使用者能够简单方便地进行重放并且使实时管理变得简单的唱盘和音频信号的编码装置、解码装置和传输方法以及计算机程序的记录媒体。
为了实现上述目的,本发明由具有音频数据作为实际数据的第一包和具有与音频数据相关的实时信息数据作为实际数据的第二包构成两种音频对象(AOB),并且,由具有与音频数据相关的静止图象数据作为实际数据的第三包构成静止图象组(SPS)。
即,根据本发明,提供一种记录下列数据结构的唱盘,该数据结构具有包含多个音频对象(AOB)的音频标题组(ATS)和静止图象组(SPS),上述AOB由下列两种AOB所构成仅由具有音频数据作为实际数据的第一包所构成的第一AOB;由具有上述第一包和作为实际数据与上述音频数据相关的实时信息数据的第二包所构成的第二AOB,而且,具有上述SPS包含有与上述音频数据相关的静止图象数据的第三包。
根据本发明,提供一种音频信号的编码装置,具有对权利要求1至28任一项所述的数据结构进行格式化的装置。
根据本发明,提供一种音频信号的解码装置,具有对权利要求1至28任一项所述的数据结构进行解码的装置。
根据本发明,提供一种音频信号的传输方法,其特征在于,通过记录媒体或者通信媒体来传输权利要求1至28任一项所述的数据结构。
根据本发明,提供一种记载编码方法的计算机程序的记录媒体,该编码方法具有对权利要求1至28任一项所述的数据结构进行格式化的步骤。
根据本发明,提供一种记载解码方法的计算机程序的记录媒体,该解码方法具有对权利要求1至28任一项所述的数据结构进行解码的步骤。
本发明的这些和其他的目的、优点及特征将通过结合附图对本发明的实施例的描述而得到进一步说明。在这些附图中

图1是表示DVD视盘的格式和本发明所涉及的DVD唱盘的格式的第一实施例的示意图;图2是详细表示图1的音频管理器(AMG)的格式的示意图;图3是详细表示图1的音频标题组(ATS)的格式的示意图;图4是详细表示图2的音频管理器信息(AMGI)的格式的示意图;图5是详细表示图4的音频标题组·属性表(ATS-ATRT)的格式的示意图;图6是详细表示图5的音频标题组·属性数据(ATS-ATR)的格式的示意图;图7是详细表示图3的音频标题组信息(ATSI)的格式的示意图;图8是详细表示图7的音频标题组信息·管理器表(ATSI-MAT)的格式的示意图;图9是详细表示图8的音频标题组菜单·音频流·属性数据(ATSM-AST-ATR)的示意图;图10是详细表示图8的音频标题组·音频流·属性表(ATS-AST-ATRT)的格式的示意图;图11是详细表示图10的各音频流的属性数据(ATS-AST-ATR)的示意图;图12是表示图1的音频目录块单元(ACBU)的示意图;图13是详细表示图12的音频包和视频包的格式的示意图;图14是详细表示图12的音频控制(A-CONT)包的格式的示意图;图15是详细表示图14的音频字符显示(ACD)区域的格式的示意图;图16表示由图15的名称空间信息所显示的例子的示意图;图17是详细表示图14的音频检索数据(ASD)区域的格式的示意图;图18是表示图1的音频目录块单元的变形例的示意图;图19是详细表示第二实施例中的音频管理器信息(AMGI)的格式的示意图;图20是详细表示图19的TOC信息的示意图;图21是详细表示第三实施例的音频标题组信息(ATSI)的格式的示意图;图22是表示第四实施例的DVD唱盘的基本格式的示意图;图23是表示图22的DVD唱盘的音频数据结构的示意图;图24是表示DVD-Van盘的基本格式的示意图;图25是表示DVD视盘的基本格式的示意图;图26是表示DVD-Avd盘的基本格式的示意图;图27是表示第四实施例的DVD唱盘中的AOTT-AOB-ATR的示意图;图28是表示第四实施例的DVD-Avd盘中的线性PCM的专用首部的示意图;图29是表示本发明所涉及的音频信号的编码装置的一个实施例的方框图;图30是详细表示图29的信号处理电路的方框图;图31是表示第五实施例的数据结构的示意图;图32是详细表示图31的音频专用标题用音频对象组(AOTT-AOBS)的示意图;图33是详细表示图32的音频包的一例的示意图;图34是详细表示图33的专用首部的示意图;图35是详细表示图34的UPC/EAN-ISRC数据的示意图;图36是表示图33的音频数据的比特移位的示意图;图37是详细表示图32的实时信息(RTI)包的示意图38是详细表示静止图象(SPCT)包的示意图;图39是详细表示图31的音频标题组信息·管理器表(ATSI-MAT)的格式的示意图;图40是详细表示图39的音频专用标题用音频对象属性(AOTT-AOB-ATR)的示意图;图41是详细表示图39的音频专用标题用视频对象音频流属性(AOTT-VOB-AST-ATR)的示意图;图42是详细表示图40和图41的声道分配信息的示意图;图43是详细表示图39的降频混频系数(ATS-DM-COEFT)的示意图;图44是详细表示图39的静止图象数据属性(ATS-SPCT-ATR)的示意图;图45是详细表示图31的音频标题组程序链信息表(ATS-PGCIT)的示意图;图46是详细表示图45的ATS-PGCIT信息(ATS-PGCITI)的示意图;图47是详细表示图45的ATS-PGCIT检索指针(ATS-PGCI-SPR)的示意图;图48是详细表示图47的ATS-PGC种类(ATS-PGCI-CAT)的示意图;图49是详细表示图45的音频标题组程序链信息(ATS-PGCI)的示意图;图50是详细表示图49的ATS-PGC一般信息(ATS-PGCI-GI)的示意图;图51是详细表示图50的ATS-PGC目录(ATS-PGC-CNT)的示意图;图52是详细表示图49的ATS程序信息表(ATS-PGIT)的示意图;图53是详细表示图52的ATS程序信息(ATS-PGI)的示意图;图54是详细表示图53的ATS-PG目录(ATS-PG-CNT)的示意图;图55是详细表示图52的ATS单元播放包信息表(ATS-C-PBIT)的示意图;图56是详细表示图55的ATS单元播放包信息(ATS-C-PBI)的示意图;图57是详细表示图56的ATS-C型(ATS-C-TY)的示意图;图58是表示第五实施例的编码装置的方框图;图59是表示图58的编码装置的处理的流程图;图60是表示第五实施例的解码装置的方框图;图61是从功能上表示图60的解码装置的方框图;图62是表示图60、图61的解码装置的处理的流程图;图63是表示第五实施例的传输音频信号时的打包装置的方框图;图64是表示图63的打包装置的打包处理的流程图;图65是详细表示图64的包生成装置的流程图;图66是详细表示图64的ATS生成处理的流程图;图67是表示图63的打包装置的发送处理的流程图;图68是表示第五实施例的传输音频信号时的解包装置的方框图;图69是表示图68的解包装置的接收处理的流程图;图70是表示图68的解包装置的解包处理的流程图;图71是详细表示图70的ATSI解码处理的流程图;图72是详细表示图70的包解码处理的流程图;图73是详细表示图31的SPS(静止图象组)即ASVS(音频静止视频组)的示意图;图74是详细表示图73的ASVUI(音频静止视频单元信息)的示意图;图75是详细表示图73的ASV-ADMAP(音频静止视频地址图)的示意图;图76是详细表示图73的ASVOBS(音频静止视频对象组)的示意图;图77是详细表示图76的精彩场面信息包、静止图象包和子图象包的示意图;图78是详细表示图77的精彩场面信息的示意图;图79是详细表示图77的静止图象信息组的示意图;图80是详细表示图77的子图象信息组的示意图;图81是表示由图78的精彩场面信息包、静止图象包和子图象包的示意图所产生的显示画面的示意图;图82是表示图31的数据结构的变形例的示意图;图83是详细表示图82的静止图象控制信息表(SPCIT)即ATS-ASV-PBIT(ATS音频静止视频播放包信息表)的示意图;图84是详细表示图83的ATS-ASV-播放信息检索指针(ATS-PG-ASV-PBIT-SRP#1~#m)的示意图;图85是详细表示图84的ASV显示方式的示意图;图86是详细表示图83的ATS-ASV-PBI(ATS音频静止视频播放信息)的示意图;图87是详细表示图86的ASV显示清单的示意图;图88是详细表示图86的另一个ASV显示清单的示意图;图89是详细表示图86的另一个ASV显示清单的示意图;图90是详细表示图86的另一个ASV显示清单的示意图。
下面参照附图来说明本发明的实施例。图1是表示DVD视盘的格式和本发明所涉及的DVD唱盘的格式的第一实施例的示意图;图2是详细表示图1的音频管理器(AMG)的格式的示意图;图3是详细表示图1的音频标题组(ATS)的格式的示意图;图4是详细表示图2的音频管理器信息(AMGI)的格式的示意图;图5是详细表示图4的音频标题组·属性表(ATS-ATRT)的格式的示意图;图6是详细表示图5的音频标题组·属性数据(ATS-ATR)的格式的示意图;图7是详细表示图3的音频标题组信息(ATSI)的格式的示意图;图8是详细表示图7的音频标题组信息·管理器表(ATSI-MAT)的格式的示意图;图9是详细表示图8的音频标题组菜单·音频流·属性数据(ATSM-AST-ATR)的示意图;图10是详细表示图8的音频标题组·音频流·属性表(ATS-AST-ATRT)的格式的示意图;图11是详细表示图10的各音频流的属性数据(ATS-AST-ATR)的示意图。
图12是表示图1的音频目录块单元(ACBU)的示意图;图13是详细表示图12的音频包和视频包的格式的示意图;图14是详细表示图12的音频控制(A-CONT)包的格式的示意图;图15是详细表示图14的音频字符显示(ACD)区域的格式的示意图;图16是表示由图15的名称空间信息所显示的例子的示意图;图17是详细表示图14的音频检索数据(ASD)区域的格式的示意图;图18是表示图1的音频目录块单元的变形例的示意图。
其中,在该说明的DVD唱盘中,为了适应于从CD过渡到DVD唱盘时的过渡期,记录立体声用立体声和5/6/8声道的多声道的两者的信号来作为音频信号。当该过渡期经过之后,可以考虑仅记录5/6/8声道的多声道信号。而且,即使在仅记录多声道信号的情况下,重放时也能够通过降频混频的系数而从多声道信号生成立体声信号。该所生成的立体声信号作为简易重放而设置。
图1(a)、(b)分别表示DVD视盘、DVD唱盘的各自的格式,DVD唱盘的格式的区域的名称不同,但与DVD视盘具有兼容性。首先,大致分为DVD视盘的格式由开头的视频管理器(VMG)和接着其后的多个视频标题组(VTS)的各个区域所构成,另一方面,DVD唱盘的格式由与之相对应的图2中详细表示的音频管理器(AMG)和如图3中详细表示的接着AMG之后的多个音频标题组(ATS)的各个区域所构成。
VTS分别由开头的VTS信息(VTSI)、接着其后的一个以上的视频目录块设置(VCBS)和最后的VTSI组成,另一方面,与之相对应,ATS分别由开头的ATS信息(ATSI)、接着其后的一个以上的音频目录块设置(ACBS)和最后的ATSI组成。在ATSI中以实时设置ACBS内的各个曲目的演奏时间。
在本发明中,在最初的ACBS中记录用于显示菜单画面的菜单信息。其与DVD视盘相同而省略其说明。
每个VCBS由多个VCB所构成,另一方面,每个ACBS由多个ACB所构成。每个VCB是视频的一个标题(Title),与之相对应,每个ACB分别是音频的一个标题。每个VCB(一个标题)由多个段(Chapter)所构成,另一方面,与之相对应,每个ACB(一个标题)由多个信息道(Track)所构成。段包含标题部分(PTT),信息道包含标题部分(PTT)。
每个段由多个单元(CELL)所构成,另一方面,与之相对应,每个道由多个索引(Index)所构成。每个单元由多个VCB单元(VCBU)所构成,另一方面,与之相对应,每个索引由多个ACB单元(ACBU)所构成。每个VCB单元和ACB单元由多个包所构成,一个包由2048字节所构成。
每个VCB单元由开头的控制包(以下,称为CONT包)、接着其后的音频(A)包、多个视频(V)包和子图象(SP)包所构成,另一方面,与之相对应,每个ACB单元由开头的音频控制包(以下,称为A-CONT包)、接着其后的多个A包和V包所构成。
在CONT包中配置了控制后续的V包的信息,在A-CONT包中象CD的TOC信息那样配置了用于管理后续的A包的音频信号的信息。在A包中配置了音频数据,在V包中除了视频数据之外还配置了音频数据之外的例如闭路字幕(CC)数据。
如图2所示的那样,AMG(音频管理器)具有·图4中详细表示的音频管理器信息(AMGI);·AMG菜单用音频目录块设置(AMGM-ACBS);·备份用AMGI。
AMGM-ACBS作为控制信息而具有·放映控制信息(PCI);·数据检索信息(DSI)。
如图3所示的那样,ATS(音频标题组)具有·图7中详细表示的音频标题组信息(ATSI);·ATS菜单用音频目录块设置(ATSM-ACBS);·ATS标题用音频目录块设置(ATSA-ACBS);·备份用ATSI。
ATSM-ACBS和ATSA-ACBS都具有上述(图2)的PCI和DSI。
如图4详细表示的那样,AMGI(音频管理器信息)具有·AMGI的管理器表(AMGI-MAT);·标题的检索指针表(T-SRPT);·音频管理器菜单PGCI单元表(AMGM-PGCI-UT);·双租赁管理信息表(PTL-MAIT);·图5中详细表示的音频标题组·属性表(ATS-ATRT);·文本数据管理器(TXTDT-MG);·音频管理器菜单单元(索引)地址表(AMGM-C-ADT);·音频管理器菜单·音频目录块单元·地址图(AMGM-ACBU-ADMAP)。
如图5详细表示的那样,ATS-ATRT(音频标题组·属性表)具有·音频标题组·属性表信息(ATS-ATRTI);·多个(n个)ATS的各个音频标题组属性检索指针(ATS-ATR-SRP#1~#n);·图6详细表示的那样的多个(n个)ATS的各个音频标题组·属性数据(ATS-ATR-#1~#n)。
如图6详细表示的那样,各个音频标题组属性数据(ATS-ATR-#1~#n)具有·ATS-ATR-EA(结束地址);·ATS-CAT(种类);·ATS-ATRI(信息)。
如图7详细表示的那样,图3所示的ATSI(音频标题组信息)具有·图8详细表示的音频标题组信息·管理器表(ATSI-MAT);·音频标题组·标题部分·检索指针表(ATS-PTT-SRPT);·音频标题组·程序链信息表(ATS-PGCIT);·音频标题组菜单·PGCI·单元表(ATSM-PGCI-UT);·音频标题组·时图表(ATS-TMAPT);·音频标题组菜单·单元·地址表(ATSM-C-ADT);·音频标题组菜单·音频目录块单元·地址图(ATSM-ACBU-ADMAP);·音频标题组·单元·地址表(ATS-C-ADT);·音频标题组·音频目录块单元·地址图(ATS-ACBU-ADMAP)。
如图8详细表示的那样,图7所示的ATSI-MAT(音频标题组信息·管理器表)具有·ATS-ID(识别符);·ATS-EA(结束地址);·ATSI-EA;·VERN(DVD音频标准的版本编号);·ATS-CAT(种类);·ATSI-MAT-EA;·ATSM-ACBS-SA(开始地址);·ATSA-ACBS-SA;·ATS-PTT-SRPT-SA;
·ATS-PGCIT-SA;·ATSM-PGCIT-UT-SA·ATS-TMAP-SA;·ATSM-C-ADT-SA;·ATSM-ACBU-ADMAP-SA;·图9详细表示的那样的ATSM-AST-ATR(ATS的音频流·属性);·ATS-AST-Ns(ATS的音频流的数量);·图10详细表示的那样的ATS-AST-ATRT(ATS的音频流·属性表)。
如图9详细表示的那样,ATSM-AST-ATR由8字节(比特b63~b0)所构成,作为在该盘中所记录的编码音频信号的属性,配置下列那样的数据(1)~(4)(其他的位保留)。
(1)音频编码方式(3位b63~b61)000b杜比-AC-3010bMPEG-1或MPEG-2(没有扩展比特流)011bMPEG-2(有扩展比特流)100b线性PCM音频101b线性PCM音频(包含2ch+5ch、2ch+6ch、2ch+8ch)(2)量化/DRC(动态范围控制)信息(2比特b5、b54)·音频编码方式在「000b」的情况下为「11b」·音频编码方式在「010b」或「011b」的情况下为00b在MPEG音频流内不存在动态范围控制数据01b在MPEG音频流内存在动态范围控制数据10b、11b保留·音频编码方式在「100b」或「101b」的情况下与立体声2ch相对应为00b16比特01b20比特
10b24比特11b保留(3)取样频率fs(2比特b53、b52),与立体声2ch相对应,为00b48kHz01b96kHz10b192kHz(4)声道数量(3比特b50~b48)000b1ch(单声道)001b2ch(立体声)010b3ch011b4ch100b(立体声2ch+5ch)101b(立体声2ch+6ch)110b7ch111b(立体声2ch+8ch)如图11详细表示的那样,图10所示的ATS-AST-ATRT(ATS的音频流·属性表)具有每个音频流#1~#7的ATS-AST-ATR,每个ATS-AST-ATR由8字节所构成(合计64比特)。
如图11所示的那样,一个音频流的ATS-AST-ATR由与图9所示的音频标题组菜单·音频流·属性数据(ATSM-AST-ATR)相同的8字节(比特b63~b0)所构成,除了上述属性数据(1)~(4)之外,还有以下各个数据(5)多声道·扩展(1比特b60)(6)音频类型(2比特b59、b58)(7)音频应用方式(2比特b57、b56)(8)其流(AST)的抽取信息(2比特b47、b46)(9)只LFE(Low Frequency Effect)1ch的抽取信息(2比特b45、b44)。
而且,在该DVD唱盘的(7)音频应用方式下,记录11b2ch+声音方式而且,在(8)其流的抽取信息和(9)只LFE1ch的抽取信息中作为频带信息记录着00b全(1/1)10b半(1/2)11b四分之一(1/4)。
但是,该ATSM-AST-ATR中的(4)声道数量在音频流#0下必须为2ch,而且,音频流#1包含前方的3ch。即,例如在用2+6ch来记录一个标题的音频信号的情况下,给音频流#0分配2ch的立体声信号,给音频流#1分配6ch内的3ch的前方信号,给音频流#2分配2ch的背后信号和LFE1ch信号。而且,在图4所示的音频管理器信息·管理器表(AMGI-MAT)和图8所示的音频标题组信息·管理器表(ATSI-MAT)中都记录「3」,作为流#0~#2的利用数据。
而且,以下列那样的取样频率fs来对该2+6ch的模拟音频信号进行取样,以下列那样的量化位数进行量化来记录立体声2ch 48kHz、20比特前方3ch 96kHz、16比特背后2ch、LFE1ch48kHz、16比特(未抽取)在此情况下,在图9所示的音频标题组菜单·音频流·属性数据(ATSM-AST-ATR)中作为立体声2ch的属性来记录(1)音频编码方式101b线性PCM音频(包含2+5ch、2+6ch、2+8ch)(2)量化/DRC01b20比特(3)取样频率fs
00b48kHz(4)声道数量101b(立体声2ch+6ch)而且,在音频流#0的ATS-AST-ATR中记录(1)音频编码方式101b线性PCM音频(包含2+5ch、2+6ch、2+8ch)(2)量化/DRC01b20比特(3)取样频率fs00b48kHz(4)声道数量001b2ch(立体声)(7)音频应用方式11b2ch+声音方式(8)该流的抽取信息00b全部(1/1)(9)LFE1ch抽取信息00b全部(1/1)。
而且,在音频流#1的ATS-AST-ATR中记录(1)音频编码方式101b线性PCM音频(包含2+5ch、2+6ch、2+8ch)(2)量化/DRC00b16比特(3)取样频率fs01b96kHz(4)声道数量010b3ch(7)音频应用方式
11b2ch+声音方式(8)该流的抽取信息00b全部(1/1)(9)LFE1ch抽取信息00b全部(1/1)。
而且,在音频流#2的ATS-AST-ATR中记录(1)音频编码方式101b线性PCM音频(包含2+5ch、2+6ch、2+8ch)(2)量化/DRC00b16比特(3)取样频率fs00b48kHz(4)声道数量010b3ch(7)音频应用方式11b2ch+声音方式(8)该流的抽取信息00b全部(1/1)(9)LFE1ch抽取信息00b全部(1/1)。
下面对音频流所记录的A包及其控制包进行说明。如图12所示的那样,VCB单元由0.4~1.0秒的任意数量的包所构成,ACB单元由0.5~1.0秒的任意数量的包所构成。而且,DVD音频的ACB单元中的A-CONT包设置在DVD视频的第三包中。
A-CONT包基本上设置在音频时间的0.5秒单位中,索引的断缝设置在0.5~1.0秒的范围中完结。而且,音频的时间(GOFGroup ofAudio Frame单位)由A-CONT包表示,该数据位置由音频帧号和第一存取单元指针以及帧首部的数量所决定。A-CONT包之前的A包不强制以音频时间的0.5秒单位进行填充。
相邻的A包被配置成音频信号相互关联,例如,在立体声的情况下,L声道包和R声道包相邻配置,而且,即使在5/6/8声道的多声道的情况下,也同样进行相邻配置。V包在重放音频信号时显示图象的情况下与该A包相邻配置。如图13所示的那样,A包和V包在2034字节的用户数据(A数据、V数据)的组成中附加了4字节的包开始信息、6字节的SCR(System Clock Refernce系统时间基准参考值)信息、3字节的Mux率(rate)信息和1字节的填充合计14字节的包首部(1包=合计2048字节)。在此情况下,作为计时标志的SCR信息在ACB单元内的开头包中为「1」并在同一标题内为连续的,由此能够管理同一标题内的A包的计时。
与此相对应,如图14所示的那样,A-CONT包由14字节的包首部、24字节的系统首部、1003字节的ACD(音频字符显示)信息组、1007字节的ASD(音频检索数据)信息组所构成。而且,ACD信息组由6字节的信息组首部、1字节的子流ID、图15详细表示的636字节的ACD(音频字符显示)信息、360字节的保留区域所构成。ASD信息组同样由6字节的信息组首部、1字节的子流ID、图17详细表示的1000字节的ASD(音频检索数据)所构成。
如图15详细表示的那样,636字节的ACD信息区域具有48字节的一般信息区域、每个第一语言文字「1」和第二语言文字「2」中的294字节的区域,该各区域由93字节的名称空间区域、分别93字节的两个空闲空间区域和15字节的数据指针区域所构成。在第一语言文字「1」和第二语言文字「2」中的一个的名称空间区域中,如图6所示的那样,配置用于以日本语表示曲名的数据,而在另一个的名称空间区域中配置用于以英语表示的数据。该表示语言可以由盘发行人决定。
48字节的一般信息由例如16字节的服务等级信息、12字节的语言代码信息、6字节的文字设置代码信息、6字节的显示项目信息、2字节的「与前面的ACD信息的差异」信息、6字节的保留信息所构成。16字节的服务等级信息代表显示大小、显示种类、音频/视频/SP的区别、流等,而且,文字是法定的(必须的),而位图是可选择的(随意的)。12字节的语言代码与视频文件一样分别用2字节表示文字「1」「2」的语言,代表1个文件中最多8种语言。英语是法定的。
6字节的文字设置代码信息可以最大具有15个与语言代码相对应的文字代码,用1字节表示文字「1」「2」的语言的有无和种类。代码的例子如下1.ISO6462.ISO8859-11.MS-JIS6字节的显示项目信息表示图15所示的空闲空间「1」「2」、数据指针的有无、ID。名称空间是法定的,必须记载标题名称、音乐名称、艺术家姓名。
1000字节的ASD(音频检索数据),如图17详细表示的那样,由16字节的一般信息、8字节的现在编号(No.)信息、16字节的现在时刻信息、8字节的标题组检索信息、8字节的标题检索信息、404字节的信息道检索信息、408字节的索引检索信息、80字节的精彩场面检索信息、52字节的保留区域所构成。
8字节的现在编号信息由标题组的现在标题编号(2字节BCD)、标题组的现在信息道编号(2字节BCD)、信息道的现在检索编号(2字节BCD)和保留区域(2字节)所构成。16字节的现在时刻信息由信息道的播放时间(4字节BCD)、信息道的剩余播放时间(4字节BCD)、标题的绝对时间(4字节BCD)和标题的剩余的绝对时间(4字节BCD)所构成。
8字节的标题组检索信息由标题组的最初的区段编号(4字节)和标题组的最后的区段编号(4字节)所构成。8字节的标题检索信息由标题的最初的区段编号(4字节)和标题的最后的区段编号(4字节)所构成。404字节的信息道检索信息由标题的信息道和区段编号(4字节×99)、标题的最初的信息道编号(4字节)和标题的最后的信息道编号(4字节)所构成。
408字节的索引检索信息由标题的索引和区段编号(4字节×100)、信息道的最初的索引编号(4字节)和标题的最后的区段编号(4字节)所构成。8字节的精彩场面检索信息由信息道的内区段编号(4字节×10)、信息道的外区段编号(4字节×10)所构成。
根据这样的格式,在多个A包的开头,如CD的TOC信息那样,配置用于管理后续的A包的音频信号的A-CONT包,因此,音频数据不是与视频数据等为一体化的,而能够增多记录容量。而且,能够通过A-CONT包来管理音频时间,并且,可以通过A-CONT包来取出与音频数据相关的曲名等简单的文字信息。
在A-CONT包内配置标题、开始地址、演奏时间等TOC信息,因此,即使在音频重放中,也能从A-CONT包取出与使用者的操作相对应的信息并开始重放。而且,通过在音频管理器信息(AMGI)和音频标题组信息(ATSI)中配置TOC信息,由此,在重放装置内的存储器中存储需要的TOC信息,从存储器中能够立即取出与使用者的操作相对应的信息来开始重放。由于不需要存储DVD视盘中的程序链信息(PGCI)这样的大容量的信息,所以能有效地管理盘。
1.当在目录内没有图象(V)数据时,
(1)能够实现与标题、乐曲、索引的3级相对应的检索、随机存取。
(2)能够实现以GOF(音频帧)为单位的开头选定、时间检索、随机存取。
(3)能够实时管理标题、乐曲、索引的时间。
2.当在目录内有图象(V)数据时,与音频数据相关,除了上述(1)~(3)之外,(4)还能够实时显示和管理标题、乐曲播放中的现在时间、剩余时间。
与视频数据相关,(1)能够实现与标题、PTT、单元的3级相对应的检索、随机存取。
(2)能够实现以视频帧为单位的开头选定、时间检索、随机存取。
(3)能够实时管理标题、PTT、单元的时间。
(4)能够以视频帧单位时间显示和管理PTT或标题中的现在时间、剩余时间。
图1(b)的ACBU包含A-CONT包和CONT包,如图18所示的那样,构成也可以没有A-CONT包和CONT包。在此情况下的特征是,虽然没有记录视频信号,但视频信号的记录容量成比例增加,能够使盘尺寸小型化,并且,能够简化重放功能,因此,能够提供适合于便携的重放装置。
图19是详细表示第二实施例中的音频管理器信息(AMGI)的格式的示意图;图20是详细表示图19的TOC信息的示意图;图21是详细表示第三实施例的音频标题组信息(ATSI)的格式的示意图。
下面,对使用TOC(Table Of Contents)信息的第二实施例进行说明。如图19所示的那样,对于AMGI(音频管理器信息)的空闲区域,追加记录图20中详细表示的TOC,重放装置对该TOC信息进行存取,找出乐曲的开头。图20作为一个例子表示了在CD的引入区域中所记录的一般的TOC信息,重复3次记录相同的信息。当记录在本发明的DVD视盘1中时,可以这样进行重复,也可以不进行重复。
其中,在CD中所使用的TOC信息中,当指针=00~99时,使用分(PMIN)、秒(PSEC)和帧(PFRAME)来表示由该数字所表示的各乐章开始的绝对时间。当指针=A0时,PMIN表示最初的乐章,PSEC=PFRAME=0。当指针=A1时,PMIN表示最后的乐章,PSEC=PFRAME=0。当指针=A2时,使用分(PMIN)、秒(PSEC)和帧(PFRAME)来表示引出区域开始的绝对时间。因此,图20所示的TOC信息表示了在DVD视盘1上记录6首乐曲(或者6个乐章)的情况(指针=01~06)。该TOC信息可以按图21所示的那样记录在ATSI(音频标题组信息)的空闲区域中,也可以记录在图14所示的A-CONT包的ACD信息组内的保留区域(360字节)中,以取代AMGI。
下面对第四实施例进行说明。图22表示本发明所涉及的DVD唱盘的第四实施例的格式,不包含图24至图26所示的VTS,仅由ATS所构成。该ATS(索引)由SAMG(Structure of Simple Audio Manager)、图1(b)所示的音频管理器(AMG)、视频和音频的音频管理器菜单(AMGM)和由AMG内的AMGI所管理的ATS<1>和ATS<2>所构成。如图23所示的那样,ATS<1>和ATS<2>不包含A-CONT包,由A包和RTI包所构成。该RTI包相对于A包不是配置多个,而是每0.5秒配置一个包。而且,静止画面包配置在预定的位置。SAMG是用于ATS<1>和ATS<2>开头选定的SAPP表(TOC)被重复8次描述的区域。该区域可以作为一个独立的文件进行定义。
其中,作为参考,图24表示了DVD-Van(视频+音频导航)盘的格式,该格式大致由作为DVD视频数据的视频标题组(VTS)和作为数据导航数据的ANV标题组(ANV-TS)所构成。详细地说,VTS与图1(a)和下述的图25所示的DVD视盘具有相同的构成,另一方面,ANV-TS由图1(b)所示的音频管理器(AMG)、分别与VTS侧的VTS<1>和VTS<2>成对并由AMG内的AMGI所管理的ATS<1>和ATS<2>所构成。
DVD视盘的格式,如图25和图1(a)所示的那样,不包含ATS和ANV-TS,仅由VTS所构成。
图26表示DVD-Avd(音频+AV数据)盘的格式,该格式大致由作为DVD视频数据的视频标题组(VTS)和作为DVD音频数据的音频标题组(ATS)所构成。详细地说,VTS由图1(a)所示的视频管理器(VMG)、视频和音频的视频管理器菜单(VMGM)、由VMG内的VMGI所管理的VTS<1>所构成。
另一方面,ATS由SAMG、图1(b)所示的音频管理器(AMG)、视频和音频的音频管理器菜单(AMGM)、与VTS侧的VTS<1>内的音频数据成为一对并且由AMG内的AMGI所管理的ATS<1>、与VTS侧不成对的同样由AMG内的AMGI所管理的ATS<2>所构成。该ATS<2>,如图23所示的那样,没有A-CONT包,由A包和RTI包所构成。
图27表示第四实施例的盘的音频专用标题音频对象属性(AOTT-AOB-ATR),其作为表示盘的音频数据的内容的属性数据而记录在盘中。该属性数据由8字节(64比特b63~b0)构成,如果从MSB侧按顺序详细说明,则由下列部分构成·4比特(b63~b60)的音频编码方式·1比特(b59)的降频混频(D-M)方式·3比特(b58~b56)的多声道结构·4比特(b55~b52)的声道组1的量化比特数Q1·4比特(b51~b48)的声道组2的量化比特数Q2·4比特(b47~b44)的声道组1的取样频率fs1
·4比特(b43~b40)的声道组2的取样频率fs2·3比特(b39~b37)的保留区域·5比特(b36~b32)的声道分配·剩余的32比特(b31~b0)的保留区域。
而且,剩余的32比特(b31~b0)用于各声道的属性数据。
下面更详细地说明上述数据。
(1)音频编码方式(b63~b60)0000b线性PCM方式0001b保留用于压缩音频(杜比数字)0010b保留用于压缩音频(无MPEG2扩展)0011b保留用于压缩音频(有MPEG2扩展)0100b保留用于压缩音频(DTS)0101b保留用于压缩音频(SDDS)其他保留用于其他的编码方式(2)降频混频方式(b59)0b降频混频立体声输出许可1b降频混频立体声输出禁止(3)多声道结构的类型(b58~b56)0000b类型1其他保留(4)声道组1的量化比特数Q1(b55~b52)0000b16比特0001b20比特0010b24比特其他保留(5)声道组2的量化比特数Q2(b51~b48)·在声道组1的量化比特数Q为「0000b」的情况下,为「0000b」·在声道组1的量化比特数Q为「0001b」的情况下,为「0000b」或「0001b」·在声道组1的量化比特数Q为「0010b」的情况下,为「0000b」、「0001b」或「0010b」其中,0000b16比特0001b20比特0010b24比特其他保留(6)声道组1的取样频率fs1(b47~b44)0000b48kHz0001b96kHz0010b192kHz1000b44.1kHz1001b88.2kHz1010b176.4kHz其他保留(7)声道组2的取样频率fs2(b43~b40)·在声道组1的取样频率fs1为「0000b」的情况下,为「0000b」·在声道组1的取样频率fs1为「0001b」的情况下,为「0000b」或「0001b」·在声道组1的取样频率fs1为「0010b」的情况下,为「0000b」、「0001b」或「0010b」·在声道组1的取样频率fs1为「1000b」的情况下,为「1000b」·在声道组1的取样频率fs1为「1001b」的情况下,为「1000b」或「1001b」·在声道组1的取样频率fs1为「1010b」的情况下,为「1000b」、「1001b」或「1010b」在该第四实施例的盘中使用线性PCM方式。线性PCM的专用首部,如图28所示的那样,由下列部分构成
·8比特的子流ID·4比特的保留区域·4比特的ISRC编号·8比特的ISRC数据·8比特的专用首部长度·16比特的第一存取单元指针·1比特的音频加重标志F1·4比特的音频加重标志F2,等等。
图29、图30表示编码装置。图29是表示本发明所涉及的音频信号的编码装置的一个实施例的方框图;图30是详细表示图29的信号处理电路的方框图;在图29中,模拟音频信号A通过A/D转换器31而以足够高的取样频率(取样周期Δt)例如由192kHz进行取样,变换为例如24比特的高分辨率的PCM信号,变换为与高分辨率的曲线α相对应的数据串xb1,x1,xa1,x2,xb2、x3,xa2,…,xbi,x2i-1,xai,x2i,…该数据串(xbi,x2i-1,xai,x2i)由图30详细表示的信号处理电路32和存储器33进行编码,接着,施加给DVD格式化部34。
参照图30来详细说明信号处理电路32的构成。首先,由通过1/2频带的低通滤波器36例如FIR滤波器来从与高分辨率的曲线α相对应的数据串(xbi,x2i-1,xai,x2i)得到进行了频带限制的低分辨率的曲线β相对应的数据串xc1,*,*,*,xc2,*,*,*,xc3,*,*,*,…,xci,*,*,*,…
接着,在该数据串内,由抽取电路37抽出数据「*」,由此,生成数据串xc1,xc2,xc3,…,xci,…其中,数据串xci为对由A/D转换器31进行了A/D变换的数字数据进行频带限制而把取样频率降低到1/4的数据串。
在数据串(xbi,x2i-1,xai,x2i)内,由抽取电路38抽出数据xi,由此而生成数据串xb1,xa1,xb2,xa2,…,xbi,xai,…接着,根据这些数据串xci,xbi,xai,通过作为差分计算器的加法器39来运算出差分xbi-xci=Δ1ixai-xci=Δ2i。
其中,差分数据Δ1i、Δ2i为例如24比特或者以下,而且,比特数可以是固定的也可以是可变的。
分配电路40把数据串xci和差分数据Δ1i、Δ2i打包为用户数据(参照图13)(1信息组=2034字节),把该用户数据输出给DVD格式化部34。
视频信号V由A/D转换器31V变换为数字信号,接着,该数字视频信号由V编码器32V编码为MPEG格式,接着,打包为图13所示的用户数据,并施加给DVD格式化部34。DVD格式化部34进行打包而成为如图1~18所示的那样的格式。由该DVD格式化部34进行了格式化的数据通过调制电路35以与盘相对应的调制方式进行调制,根据该调制数据制造盘。
下面参照图31~图90来对第五实施例的DVD唱盘进行说明。首先,如图31(A)所示的那样,该第五实施例的数据结构大致具有SAMG、AMG(音频管理器)、SPS(静止图象组)和多个ATS(音频标题组)。而且,SPS(静止图象组)在以下的说明中称为ASVS(音频静止视频组)以免与子图象(SP)相混同。
ATS从开头依次由下列部分构成·ATSI(ATS信息);·图32~图37详细表示的音频专用标题用音频对象组(AOTT-AOBS);·备份用的ATSI。
ATSI从开头依次由下列部分构成·图39~图44详细表示的ATSI-MAT(ATSI·管理器表);·图45~图57详细表示的ATS-PGCIT(ATS程序链信息表)。
如图32详细表示的那样,AOTT-AOBS由多个音频专用标题用音频对象(AOTT-AOB)所构成。AOTT-AOB分别由多个程序(PG)所构成,每个程序由多个音频单元(ATS-C)所构成。
AOTT-AOB由按图32(1)详细表示的仅含有音频数据的和按图32(2)详细表示的含有音频数据与实时信息数据(RTI数据)的两种AOTT-AOB所构成。在一张盘中和一首曲中配置一种以上的AOTT-AOB。
仅含有音频数据的第一AOTT-AOB的各程序由多个音频单元(ATS-C)所构成,该音频单元仅由多个音频包所构成。包含音频数据和RTI数据的第二AOTT-AOB的各程序由多个音频单元(ATS-C)所构成,该音频单元由配置在第二号的包位置上的RTI包和配置在其他的包位置上的音频包所构成。
线性PCM的A包由2048字节以下构成,其细目如图33所示的那样由14字节的包首部和A信息组所构成。A信息组由17、9或14字节的信息组首部、图34详细表示的专用首部和1至2011字节的音频PCM数据所构成。
如图34所示的那样,专用首部由下列部分构成·8比特的子流ID·3比特的保留区域·5比特的UPC/EAN-ISRC(Universal Product Code/EuropeanArticle Number-International Standard Recording Code)编号·8比特的UPC/EAN-ISRC数据·8比特的专用首部长度·16比特的第一存取单元指针·8比特的音频数据信息(ADI)·0~8比特的填充字节。
ADI由下列部分构成·1比特的音频加重标志·1比特的保留区域·1比特的降频混频方式·1比特的降频混频代码有效性·4比特的降频混频代码·4比特的组「1」的量化字长「1」·4比特的组「2」的量化字长「2」·4比特的组「1」的音频取样频率fs1·4比特的组「2」的音频取样频率fs2
·4比特的保留区域·4比特的多声道类型·3比特的声道组「2」的比特位移数据(参照图36)·5比特的声道分配信息(参照图42)·8比特的动态范围控制信息·8×2比特的保留区域。
如图35所示的那样,在8比特(b7~b0)的UPC/EAN-ISRC数据区域中配置了随UPC/EAN-ISRC编号而不同的数据。即,(1)在UPC/EAN-ISRC编号=1的情况下前2比特b7、b6保留后6比特b5~b0国家代码(ISRC#1)(2)在UPC/EAN-ISRC编号=2的情况下前2比特b7、b6保留后6比特b5~b0国家代码(ISRC#2)(3)在UPC/EAN-ISRC编号=3的情况下前2比特b7、b6保留后6比特b5~b0版权所有人代码(ISRC#3)(4)在UPC/EAN-ISRC编号=4的情况下前2比特b7、b6保留后6比特b5~b0版权所有人代码(ISRC#4)(5)在UPC/EAN-ISRC编号=5的情况下前2比特b7、b6保留后6比特b5~b0版权所有人代码(ISRC#5)(6)在UPC/EAN-ISRC编号=6的情况下前4比特b7~b4保留后4比特b3~b0录制年代(ISRC#6)(7)在UPC/EAN-ISRC编号=7的情况下前4比特b7~b4保留后4比特b3~b0录制年代(ISRC#7)
为了提高S/N比并减少比特数,在A包内的作为实际数据的线性PCM数据的区域内对组「2」的各声道的数据进行减位配置。图36(a)作为一个例子表示了6声道(组「1」=Ch1~Ch3、组「2」=Ch4~Ch6)的PCM数据,电平范围为MAX=0dB~MIN=-144dB(24比特),各声道Ch的值为以下这样Lmax2>Lmax1=Lmax3>Lmax4>Lmax5>Lmax6组「1」的Ch1~Ch3的字长不变,在该例子中,Ch2的值最大,因此,把组「2」的Ch4~Ch6的各电平向上移动(0-Lmax2)dB,而LSB侧削减了0~4比特。在图36所示的例子中表示了Ch4~Ch6的各电平向上移动了最大比特数=4,而削减为20比特。
下面参照图37来详细说明RTI包的构成。该包由14字节的包首部和RTI信息组所构成,RTI信息组由17或14字节的信息组首部、专用首部、1至2015字节的RTI数据所构成。RTI数据是与音频数据相关的文字信息和重放控制信息。
RTI信息组的专用首部由下列部分构成·1字节的子流ID·2字节的UPC/EAN-ISRC编号和数据(在图中,它们简称为ISRC)·1字节的专用首部长度·1字节的RTI信息ID·0~7字节的填充字节。
上述UPC/EAN-ISRC编号和数据是与容纳在SPCT包中的静止图象的著作权相关的UPC/EAN-ISRC编号和数据。
顺便说一下,在图31所示的静止图象组(音频静止视频组)中配置SPCT包,该SPCT包如图38详细表示的那样,由14字节的包首部和SPCT信息组所构成,SPCT信息组由22或19或9字节的信息组首部和2025字节以下的SPCT数据所构成。其中,一幅静止画面被以MPEG1或MPEG2方式进行压缩,而由I图象和内部编码图象所构成,在一个图象单元内进行分割,而作为SPCT包的SPCT数据进行配置。在SPCT包内的信息组首部内同样可以按在RTI包中说明的那样包含与静止图象的著作权相关的UPC/EAN-ISRC编号和数据。
如图39详细表示的那样,图31(A)所示的ATSI-MAT由2048字节(相关字节位置RBP0~2047)所构成,从开头依次为·12字节(RBP0~11)的ATS识别符(ATS-ID);·4字节(RBP12~15)的ATS结束地址(ATS-EA);·12字节(RBP16~27)的保留区域;·4字节(RBP28~31)的ATSI结束地址(ATSI-EA);·2字节(RBP32~33)的版本编号(VERN);·94字节(RBP34~127)的保留区域;·4字节(RBP128~131)的ATSI-MAT的结束地址;·60字节(RBP132~191)的保留区域;·4字节(RBP192~195)的AOTT用VTS的开始地址;·4字节(RBP196~199)的AOTT用AOBS的开始地址或AOTT用VOBS的开始地址;·4字节(RBP200~203)的保留区域;·4字节(RBP204~207)的ATS-PGCIT的开始地址;·48字节(RBP208~255)的保留区域;·128(16×8)字节(RBP256~383)的AOTT用的AOB的属性(AOTT-AOB-ATR)或AOTT用VOB的音频流的属性(AOTT-VOB-AST-ATR);·288(18×8)字节(RBP384~661)的用于把多声道音频数据降频混频为2声道的系数(ATS-DM-COEFT#0~#15)·32字节(RBP672~703)的保留区域;
·2字节(RBP704~705)的AOTT用的AOBS中的静止图象数据的属性(AOTT-SPCT-ATR);·1342字节(RBP706~2047)的保留区域。
在该ATS具有AOTT用的AOBS的情况下,在128(16×8)字节(RBP256~383)的区域中,记述了图40详细表示的AOTT-AOB-ATR。该AOTT-AOB-ATR(b127~b0)从MSB侧依次由下列部分构成·8比特(b127~b120)的音频编码方式·8比特(b119~b112)的保留区域·4比特(b111~b108)的声道组1的量化比特数Q1·4比特(b107~b104)的声道组2的量化比特数Q2·4比特(b103~b100)的声道组1的取样频率fs1·4比特(b99~b96)的声道组2的取样频率fs2·3比特(b95~b93)的多声道结构的类型·5比特(b92~b88)的声道分配·8比特×11(b87~b0)的保留区域。
与此相对,在该ATS没有AOTT用的AOBS的情况下,记述了图41详细表示的AOTT-VOB-AST-ATR。该AOTT-VOB-AST-ATR(b127~b0)从MSB侧依次由下列部分构成·8比特(b127~b120)的音频编码方式·8比特(b119~b112)的保留区域·4比特(b111~b108)的量化比特数Q·4比特(b107~b104)的保留区域·4比特(b103~b100)的取样频率fs·4比特(b99~b96)的保留区域·3比特(b95~b93)的多声道结构的类型·5比特(b92~b88)的声道分配·3比特(b87~b85)的解码音频流数·5比特(b84~b80)的保留区域
·2比特(b79、b78)的MPEG音频用DRC·2比特(b77、b76)的保留区域·4比特(b75~b72)的压缩声道数·8比特×9(b71~b0)的保留区域。
下面详细表示上述数据。其中,由于量化比特数、取样频率、多声道类型与图27相同而省略其说明。
(1)音频编码方式(b63~b60)00000000b线性PCM方式00000001b保留用于压缩音频(杜比数字)00000010b保留用于压缩音频(无MPEG2扩展)00000011b保留用于压缩音频(有MPEG2扩展)00000100b保留用于压缩音频(DTS)00000101b保留用于压缩音频(SDDS)其他 保留用于其他的编码方式(8)声道分配(b92~b88)图42表示从1声道(单声道)到6声道的组「1」、「2」的声道分配信息。下面说明图中表示的标号。
C(mono) 单声道L,R 双声道立体声Lf多声道的左前Rf多声道的右前C 多声道的中心LFE 多声道的Low Frequency EffectS 多声道的环绕声Ls多声道的左环绕声Rs多声道的右环绕声(9)解码音频流数(b87~b85)的「0」或「1」(10)MPEG音频用DRC(b79、b78)
00b在MPEG音频流内不存在DRC数据01b在MPEG音频流内存在DRC数据(11)压缩声道数(b75~b72)音频编码方式在线性PCM音频的情况下为「1111b」0000b1ch(单声道)0001b2ch(立体声)0010b3ch0011b4ch0100b5ch0101b6ch0110b7ch0111b8ch其他保留为了把多声道音频数据降频混频为立体声的,如图43所示的那样,在图39所示的288(18×16)字节(RBP384~671)的区域中使用18字节来记述表编号「0」~「15」的各降频混频系数(ATS-DM-COEFT#0~#15)为了记述AOTT用的AOBS中的静止图象数据的属性(AOTT-SPCT-ATR),图39所示的2字节(RBP704、705)的区域如图44详细表示的那样从MSB侧依次由下列部分构成·2比特(b15、b14)的视频压缩方式·2比特(b13、b12)的TV制式·2比特(b11、b10)的长宽比·2比特(b9、b8)的显示方式·2比特(b7、b6)的保留区域·3比特(b5~b3)的源图象的分辨率·3比特(b2~b0)的保留区域。
下面详细表示上述AST-SPCT-ATR的内容。
(1)视频压缩方式(b15、b14)00b对应于MPEG101b对应于MPEG2其他保留(2)TV制式(b13、b12)00b525/6001b625/60其他保留(3)长宽比(b11、b10)00b4∶301b16∶9其他保留(4)显示方式(b9、b8)00b保留01b保留10b仅许可信箱11b没有记述(5)源图象的分辨率(b5~b3)000b720×480(525/60制式)720×576(625/60制式)其他保留图31(A)所示的ATS-PGCIT(ATS程序链信息表)如图45详细表示的那样从开头依次由下列部分构成·图46详细表示的音频标题组PGCI表信息(ATS-PGCITI)·图47、图48详细表示的n个音频标题组PGCI检索指针(ATS-PGCI-AR-P#1~#n)·图49详细表示的多个音频标题组PGCI。
ATS-PGCITI如图46详细表示的那样由8字节所构成,从开头依次由下列部分构成·2字节的ATS-PGCI-SRP#1~#n的数·2字节的保留区域·4字节的ATS-PGCIT的结束地址。
ATS-PGCI-SRP#1~#n分别如图47详细表示的那样由8字节所构成,从开头依次由下列部分构成·如图48详细表示的那样,4字节的ATS-PGC的种类(ATS-PGC-CAT)·4字节的ATS-PGCI的结束地址。
上述4字节(b31~b0)的ATS-PGC的种类如图48详细表示的那样从开头依次由下列部分构成·1比特的(b31)的入口类型·7比特的(b30~b24)的ATS音频标题数(ATS-TTN)·2比特的(b23、b22)的块方式·2比特的(b21、b20)的块类型·4比特的(b19~b16)的声道数·8比特的(b15~b8)的音频编码方式·8比特的(b7~b0)的保留区域。
下面详细表示上述种类(ATS-PGC-CAT)的内容。
(1)入口类型(b31)0b不是入口PGC1b入口PGC(2)ATS音频标题数(b30~b24)在「1」~「99」的范围中记述该ATS音频标题数(3)块方式(b23、b22)00b不是ATS-PGC块的ATS-PGC
01bATS-PGC块的最初ATS-PGC10b保留11bATS-PGC块的最后ATS-PGC(4)块类型(b21、b20)00b不是该块的一部分01b仅是录音方式的差分的块10b仅是声道的差分的块11b录音方式和声道两者的差分的块(5)声道数(b19~b16)0000b立体声以下0001b超过立体声图45所示的音频标题组PGCI(ATS-PGCI)分别如图49详细表示的那样从开头依次由下列部分构成·图50、图51详细表示的ATS-PGC一般信息(ATS-PGC-GI)·图52~图56详细表示的ATS程序信息表(ATS-PGIT)·图55~图57详细表示的ATS单元播放信息表(ATS-C-PBIT)。
ATS-PGC-GI如图50详细表示的那样由16字节(RBP0~15)所构成,从开头依次由下列部分构成·图51详细表示的4字节(RBP0~3)的ATS-PGC目录(ATS-PG-CNT)·4字节(RBP4~7)的ATS-PGC播放时间(ATS-PGC-PB-TM)·2字节(RBP8、9)的保留区域·2字节(RBP10、11)的ATS-PGIT的开始地址·2字节(RBP12、13)的ATS-C-PBIT的开始地址·2字节(RBP14、15)的保留区域。
上述4字节(RBP0~3)的ATS-PGC目录如图51详细表示的那样从开头依次由下列部分构成
·17比特(b31~b15)的保留区域·7比特(b14~b8)的程序数·8比特(b7~b0)的单元数。
程序数是「1」~「99」的范围,单元数是「1」~「255」的范围。
图49表示的ATS程序信息表(ATS-PGIT)如图52详细表示的那样由n个ATS程序信息(ATS-PGI)#1~#n所构成。ATS-PGI#1~#n分别如图53详细表示的那样由20字节(RBP0~19)所构成,从开头依次由下列部分构成·图54详细表示的4字节(RBP0~3)的ATS-PG目录(ATS-PG-CNT)·1字节(RBP4)的ATS-PG的入口单元编号·1字节(RBP5)的保留区域·4字节(RBP6~9)的ATS-PG的最初音频单元的开始放映时间(FAC-S-PTM)·4字节(RBP10~13)的ATS-PG的播放时间·4字节(RBP14~17)的ATS-PG暂停时间·1字节(RBP18)的保留区域(用于著作权管理数据CMI)·1字节(RBP19)的保留区域。
上述32比特(b31~0)的ATS-PG目录如图54详细表示的那样从开头依次由下列部分构成·1比特(b31)的上一次和这次的PG的关系(R/A)·1比特(b30)的STC不连续性标志(STC-F)·3比特(b29~b27)的属性数(ATRN)·3比特(b26~b24)的声道组(ChGr)「2」的比特位移数据·2比特(b23、b22)的保留区域·1比特(b21)的降频混频方式(D-M)·1比特(b20)的降频混频系数的有效性(图示※)
·4比特(b19~b16)的降频混频系数表编号(DM-COEFTN)·分别为1比特合计为16比特(b15~b0)的RTI标志F15~F0。
图49所示的ATS单元播放信息表(ATS-C-PBIT)如图55详细表示的那样由n个ATS单元播放信息(ATS-C-PBI)#1~#n所构成。ATS-C-PBI#1~#n分别如图56详细表示的那样由12字节(RBP0~11)所构成,从开头依次由下列部分构成·1字节(RBP0)的ATS-C的索引编号·图57详细表示的1字节(RBP1)的ATS-C类型(ATS-C-TY)·2字节(RBP2、3)的保留区域·4字节(RBP4~7)的ATS-C的开始地址·4字节(RBP8~11)的ATS-C的结束地址。
1字节(b7~b0)的ATS-C类型如图57详细表示的那样从开头依次由下列部分构成·2比特(b7、b6)的ATS单元要素(ATS-C-COMP)·2比特(b5、b4)的保留区域·4比特(b3~b0)的ATS单元用途(ATS-C-Usage)。
下面详细表示上述数据的内容。
(1)ATS单元要素(b7、b6)00b仅由音频数据组成的音频单元01b由音频数据和实时信息组成的音频单元10b仅由消音用的音频数据组成的消音单元11b仅由静止图象组成的图象单元(2)ATS单元用途(b3~b0)0000b没有记述0001b聚光部分其他保留下面对第五实施例的编码装置进行说明。图58、图59分别表示编码装置的构成和处理。模拟音频信号A通过A/D转换器31而以足够高的取样频率(取样周期Δt)例如192kHz来进行取样,而变换为例如24比特的高分辨率的PCM信号。接着,在比特位移/信号处理电路32中没有进行压缩的情况下,把由A/D转换器31所变换的PCM数据原样施加给DVD格式化部34。与此相对,在进行了压缩的情况下,由A/D转换器31所变换的PCM数据根据其编码方式由比特位移/信号处理电路32进行压缩,接着施加给DVD格式化部34(步骤S5、S6)。在比特位移/信号处理电路32中使组「2」的各声道进行比特位移。
视频信号V由A/D转换器31变换为数字信号,接着,该数字视频信号由V编码器32V编码为MPEG格式,而施加给DVD格式化部34(步骤S1、S2)。静止画面信号SP由A/D转换器31SP变换为数字信号,接着,该数字静止画面信号SP由压缩编码器32SP编码成为MPEG格式,施加给DVD格式化部34(步骤S3、S4)。著作权信息和实时文本信息(RTI)通过接口(I/F)40(步骤S7、S8),及文字信息和盘识别符EX均施加给DVD格式化部34(步骤S9、S10)。
接着,DVD格式化部34进行打包而成为上述那样的格式(步骤S11)。通过该DVD格式化部34进行格式化的数据通过调制电路35以与盘相对应的调制方式进行调制,根据该调制数据来制造盘,或者暂时记录在记录部38中,再通过通信I/F39进行传输(步骤S12)。
图60表示第五实施例的解码装置的具体构成,图61从功能上表示图60的构成。图62表示其处理。在图60、图61中,首先,当通过操作部18和遥控器19来进行曲目选择、重放、快放、停止操作时,控制部23根据其操作来控制驱动器装置2和重放装置17,在重放时,通过驱动器装置2来读取记录在DVD唱盘1中的比特数据,进行EFM解调。
在重放装置17中,该信号被送给静止画面和V包检测部3和A及RTI包检测部9。在静止画面包、V包记录在盘1的情况下,静止画面和V包检测部3检出该重放数据中的静止画面包、V包并在参数部8设定控制参数,同时,把静止画面包、V包依次写入静止画面和V包缓冲器4中。写入静止画面和V包缓冲器4中的静止画面包、V包内的用户数据(视频信号、静止画面信息)通过缓冲器取出部5根据静止画面包、V包内的SCR(参照图13)而按照包顺序和输出时刻顺序依次取出,接着,通过扩展和图变换部6、D/A变换部7、视频输出端子15、15’作为模拟视频信号输出。
A及RTI包检测部9检出重放数据中的A包和RTI包,在参数部14设定控制参数,同时,把A包和RTI包依次写入A和RTI包缓冲器10。写入A和RTI包缓冲器10的A包、RTI包内的用户数据(音频信号、实时信息)通过缓冲器取出部11按照包顺序和输出时刻顺序依次取出。接着,音频信号通过PCM变换和比特位移/信号处理部12、D/A变换部13、音频输出端子16而作为模拟音频信号输出。实时信息送给显示信号生成部20而生成显示信号,该显示信号通过显示信号输出端22输出,或者输出给内置的文字显示部21。
参照图62来说明该解码装置的处理。首先,对盘1进行存取来读出记录数据(步骤S20),接着,在各分离步骤S21~S29中,分离成视频信号、静止画面信号、音频信号、著作权信息和实时信息(RTI)、文字信息和盘识别符EX。接着,在各解码步骤S22~S30中,分别对分离数据进行解码,然后进行同步重放(步骤S31、S32)。
其中,在重放静止画面SP的处理中具有以下三种情况1)当得到静止画面SP时,中断音频信号A来进行静音。
2)当得到静止画面SP时,根据时间控制信号与音频信号A一起重放。
3)当得到静止画面SP时,根据使用者所指示的翻页命令进行翻页重放。此时,音频信号A按原样重放。
当需要使静止画面与声音同步时,用于实时同步的时间控制信号置于追加设置在图31(B)的ATSI中的静止图象控制信息表(APCIT)之下的时间控制数据信息(SPCIT-TCDI)中。
进而把放有翻页命令的静止图象页面控制命令信息(SPPI)置于SPCIT之下。这样,SPCIT由一般信息的SPCIT一般信息(SPCIT-GI)、时间控制数据信息(SPCIT-TCDI)、静止图象页面控制命令信息(SPPI)所构成。
其中,在图38的SPCT包的静止图象数据中,可以包含用于控制静止图象的页面的边沿信息。可以一边参照SPPI一边解释由该边沿信息所规定的页面控制信息。而且,当在容纳到静止图象数据中时没有富裕的容量的情况下,可以允许在RTI包的RTI数据中包含上述用于控制静止图象的页面的尺寸信息。
下面对通过通信线路传输上述那样格式化的数字音频信号的实施例进行说明。首先,参照图63~图67对作为发送侧的打包装置进行说明。打包装置如图63所示的那样具有打包处理部30、缓冲存储器30B、控制电路29、操作部27和显示器28。在图64~图67中,首先,当输入视频信号V、静止画面信号SP、音频信号A、实时信息RTI和盘识别符EX时,在步骤S100中按图65详细表示的那样生成音频包(步骤S101),接着,生成视频包(步骤S102),然后生成静止画面包(步骤S103),接着生成实时文本(步骤S104)。
接着管理音频单元(ATS-C)(步骤S200),接着管理PTT(标题部分)(步骤S300),接着管理标题(AOTT-AOB)(步骤S400),接着管理标题组(AOTT-AOBS)(步骤S500)。接着在步骤S600中,为了生成ATS,而如图66详细表示的那样生成标题组(步骤S601),接着,生成菜单(步骤S602)。然后记载ATS-PGCI的种类(步骤S603),接着生成由包含比特位移的PG目录组成的PGIT,通过生成PGIT来生成ATS-PGCIT(步骤S604)。接着通过生成属性、系数的MAT来生成ATSI(步骤S605)。接着生成AMG(步骤S700),最后生成TOC(步骤S800)。
接着,当通过通信线路来传输上述那样格式化的数字音频信号时,如图67所示的那样,把存储在发送缓冲器中的发送数据分割为预定长度来进行信息组化(步骤S41),接着给信息组的开头赋予包含发送对方地址的首部(步骤S42),接着把其输出到网络上(步骤S43)。
下面参照图68~图72来对数据接收侧进行说明。如图68所示的那样,数据接收侧的解包装置具有解包处理部60、缓冲器存储器60B、参数存储器56、控制电路59、操作部57和显示器58。首先,如图69所示的那样,从由网络接收的信息组中除去首部(步骤S51),接着把接收数据复原(步骤S52),接着把其传送给存储器(步骤S53)。
接着,如图70~图72所示的那样,首先,对AMG进行解码来检出ATS(步骤S1100),接着在步骤S1200中,为了对目标的ATS的ATSI进行解码,而如图71详细表示的那样对ATS-PGCI的种类进行解码(步骤S1201),接着对由包含比特位移的PG目录组成的PGIT进行解码(步骤S1202),接着对MAT的属性、系数进行解码(步骤S1203),接着把这些解码的各个参数设定在参数存储器56中(步骤S1204)。
接着,当开始进行重放时,识别包(步骤S1300),接着,在步骤S1400中,为了对包进行解码,如图72详细表示的那样对音频包进行解码(步骤S1401),接着对视频包进行解码(步骤S1402),接着对静止画面包进行解码(步骤S1403),接着对实时文本进行解码(步骤S1404)。接着,从这些包输出解码的音频信号、视频信号、静止画面信号和实时文本信号(步骤S1500),在重放中,重复进行步骤S1300~步骤S1500。
下面参照图73~图80来详细说明图31所示的SPS(静止图象组)即ASVS(音频静止视频组)。其中,对于以下所示的静止图象对象组(SPOBS),为了避免与子图象(SP)混同,也称为音频静止视频对象组(ASVOBS)。如图73所示的那样,ASVS(音频静止视频组)由图74、图75详细表示的ASVS信息(ASVSI)、图76详细表示的音频静止视频对象组(ASVOBS)和备份ASVSI所构成。
ASVS信息(ASVSI)由图74详细表示的音频静止视频单元信息(ASVUI)、图75详细表示的ASV地址图(ASV-ADMAP)和填充区域(00h)所构成。
如图74所示的那样,ASVUI(合计888字节)由下列部分构成·12字节的ASVS-ID·2字节的ASVU的数量·2字节的保留区域·4字节的ASVOBS开始地址·4字节的ASVOBS结束地址·2字节×4的ASVU属性#0~#3·4字节×16的ASVOBS子图象载架#0~#15·8字节×99的ASVU#1~#99一般信息。
图73所示的ASV地址图(ASV-ADMAP)如图75详细表示的那样由m(≤99)个ASVU#1~#m所构成,每个ASVU#1~#m由ASVU#1~#99的开始地址所构成。
下面对图73所示的音频静止视频对象组(ASVOBS)进行说明。音频静止视频对象(ASVOB)是一个音频静止视频(ASV)的放映数据,包含按钮用的高亮度(HLT)信息数据、同样的按钮用的子图象(SP)数据和静止图象(SPCT)数据。其中
·在一个ASVOB中仅包含一个静止图象(SPCT)数据。
·在一个ASVOB中可以仅包含一个高亮度(HLT)信息数据。高亮度信息是为了操作静止图象的按钮而采用的。
·在一个ASVOB中可以能够静止图象方式包含1至3个子图象(SP)数据。SP数据是为了显示静止图象的按钮而采用的。
图73的音频静止视频对象组(ASVOBS)按图76所示的那样是上述ASVOB的集合体。ASVOB如图76(a)所示的那样,作为不包含在开头配置高亮度(HLT)包的高亮度信息的空包,而不能起到HLT包的作用,因此,实际上是仅包含静止图象(SPCT)包的和包含图76(b)所示的高亮度(HLT)包、子图象(SP)包及静止图象(SPCT)包的两种情况。
如图77(a)所示的那样,高亮度(HLT)包由14字节的包首部、系统首部和2013字节的高亮度信息信息组所构成。高亮度信息信息组由6字节的信息组首部、1字节的子流ID和694字节的高亮度信息(ASV-HLI)所构成。系统首部由4字节的系统开始码、2字节的首部长度、3字节的速率边界、2字节的音频边界、1字节的限制标志、9字节的流ID的各个区域所构成。
如图78所示的那样,高亮度信息(ASV-HLI)由ASV高亮度一般信息(22字节)、ASV按钮颜色信息表(8字节×3)、ASV按钮信息表(18字节×36)所构成。ASV按钮信息表由ASV按钮信息#1~#n组成,各个ASV按钮信息#i包含作为图象控制命令的ASV按钮命令。在该ASV按钮命令中记述了图81所示的操作按钮时的导航命令。
与此相对,如图77(b)所示的那样,SPCT包和SP包由14字节的包首部和2025字节的静止图象信息组或者子图象信息组所构成,包首部由4字节的包开始码、6字节的SCR、3字节的程序mux率、9或22字节的填充长度所构成。
静止图象(SPCT)信息组如图79详细表示的那样包含SPCT信息组首部和静止图象用的视频数据。该SPCT信息组首部包含在开头必须设置的9字节的SPCT信息组信息、仅在静止画面的最初的SPCT信息组的情况设置的5+5字节的SPCT信息组信息、仅在ASVOB的最初的SPCT信息组的情况设置的3字节的SPCT信息组信息。
子图象(SP)信息组如图80详细表示的那样包含SP信息组首部和子图象数据。该SP信息组首部包含在开头必须设置的9字节的SP信息组信息、仅在SP单元的最初的SP信息组的情况下设置的5字节的SP信息组信息、仅在ASVOB的最初的SP信息组的情况下设置的3字节的SP信息组信息。而且,根据这样的数据结构,在解码器侧,按图81所示的那样把主图象、子图象和高亮度信息进行合成来进行显示。
下面参照图82以后各图来对第五实施例的变形例的数据结构进行说明。其中,在图31(B)所示的数据结构中,静止图象控制信息表(SPCIT)在ATS内独立设置ATSI-MAT和ATS-PGCIT,而在该变形例中,如图82所示的那样,是设置在ATS-PGCIT内。在以下说明中,为了避免与子图象(SP)的混同,把SPCIT称为ATS-ASV-PBIT(ATS音频静止视频播放信息表)。
如图83详细表示的那样,在图49所示的ATS-PGCIT中追加设置该ATS-ASV-PBIT,具有图84、图85详细表示的m个程序#1~#m的各ATS-ASV-播放信息检索指针(ATS-PG-ASV-PBI-SRP#1~#m)和图86~图90详细表示的n个ATS-ASV-PBI#1~#n)(n≤m≤99)。如图84所示的那样,各个SRP#1~#m由下列部分构成·1字节的ASVU编号·1字节的ASV显示方式(ASV-DMOD)·2字节的ATS-ASV-PBI开始地址
·2字节的ATS-ASV-PBI结束地址。
ASVU编号为从「1」至「99」的范围的值。如图85详细表示的那样,ASV显示方式由下列部分构成·4比特(b7~b4)的保留区域·2比特(b3、b2)的显示定时方式·2比特(b1、b0)的显示顺序方式。
以下详细表示上述数据(1)显示定时方式00b滑动表演01b浏览其他保留(2)显示次序方式00b顺序01b随机11b打乱其他保留如图86所示的那样,各个ATS-ASV-PBI#1~#n包含10字节×k个(k≤99)的ASV显示清单。图87表示显示定时方式(b3、b2)是滑动表演(00b),显示次序方式(b1、b0)是顺序(00b)时的ASV显示清单,该清单由下列部分构成·8比特(b79~b72)的ASV编号·8比特(b71~b64)的保留区域·8比特(b63~b56)的在ASV的开始时所强制选择的按钮编号(FOSL-BTNN)·8比特(b55~b48)的在ASV的开始时所播放的程序编号·8比特×4(b47~b16)的显示开始定时(31~0)·4比特(b15~b12)的开始效果方式
·4比特(b11~b8)的开始效果期间·4比特(b7~b4)的结束效果方式·4比特(b3~b0)的结束效果期间。
以下详细表示上述数据的内容(1)显示开始定时(31~0)表示从开始PTS的显示的开始定时,表示31~0/90000(秒)。
(2)开始效果方式(b15~b12)0000b切入0001b淡入0010b溶入0011b从上滑入0100b从下滑入0101b从左滑入0110b从右滑入0111b左斜滑入1000b右斜滑入其他保留(3)结束效果方式(b7~b4)0000b切出0001b淡出其他与(2)开始效果方式(b15~b12)相同图88表示在图85的显示方式中显示定时方式(b3、b2)是滑动表演(00b),显示次序方式(b1、b0)是随机(01b)时的ASV显示清单,在该清单中,除了8比特(b79~b72)为保留之外,其他部分与图87所示的清单相同。图89表示在图85的显示方式中显示定时方式(b3、b2)是浏览(01b),显示次序方式(b1、b0)是顺序(00b)时的ASV显示清单,在该清单中,除了8比特(b55~b48)为保留之外,其他部分与图87所示的清单相同。图90表示在图85的显示方式中显示定时方式(b3、b2)是浏览(01b),显示次序方式(b1、b0)是随机(01b)时的ASV显示清单,在该清单中,除了8比特(b79~b72)和8比特(b55~b48)为保留之外,其他部分与图87所示的清单相同。
上述编码装置和解码装置也可以这样实现把上述编码方法和解码方法作为计算机程序存储在ROM等IC芯片中,通过该程序来使计算机的CPU(中央运算处理装置)工作。本发明不仅可以通过DVD等记录媒体来进行传输而且可以通过因特网和卡拉ok通信线路等通信线路来进行传输,在重放侧通过硬件和PC上的应用程序来进行处理。
如上述那样,根据本发明,由具有音频数据作为实际数据的第一包和作为实际数据与上述音频数据相关的实时信息数据的第二包构成两种音频对象(AOB),而且,由具有包含与上述音频数据相关的静止图象数据作为实际数据的第三包构成静止图象组(SPS),因此,在以音频信号为主进行记录的情况下,使用者可以更方便地简单地进行重放,而且,能够使实时的管理变得简单。
权利要求
1.一种音频信号的编码方法,其特征在于,包括把模拟声音信号进行A/D转换并生成数字音频数据的步骤;格式化成数据结构的步骤,该格式化成数据结构的步骤包括具有音频数据的音频标题组(ATS);具有与上述音频数据相关的静止图象数据的静止图象组(SPS),上述静止图象组包括多个静止图象对象(SPOB);具有开始地址地图的静止图象信息(SPSI),用于重放上述静止图象对象,上述静止图象对象由以下2种构成第1静止图象对象,并不实际具有由静止图象的按钮用强光数据构成的强光包(HLI_PCK)和按钮显示用的子图象数据构成的子图象包(SP_PCK),而具有由上述静止图象数据构成的静止图象包(SPCT_PCK);第2静止图象对象,具有上述强光包(HLI_PCK)和子图象包(SP_PCK)以及静止图象包(SPCT_PCK),上述静止图象信息包括色板信息(ASVOBS子图象色板),用于将上述第2静止图象对象的子图象数据进行解码,并且,上述音频标题组具有含有将上述静止图象数据按照各静止图象单元进行页控制的控制信息(SPCIT)的音频标题组信息(ATSI),上述子图象包具有包头和子图象小包,上述子图象小包具有小包头和子图象数据,上述子图象包为上述第1静止图象对象或者第2静止图象对象的最初的子图象包时,将表示这一内容的信息设置在该包的小包头。
2.根据权利要求1记载的音频信号编码方法,其特征在于上述强光包的强光数据包括引导命令,它是操作通过上述子图象数据显示的显示按钮时的控制处理数据。
3.一种解码装置,将用权利要求1记载的编码方法所记录下来的信号进行解码,其特征在于具有第1解码装置,将配置在上述静止图象信息(SPSI)的用于复原上述第2静止图象对象的子图象的信息进行解码;第2解码装置,从配置在上述第2静止图象对象的强光包和子图象包以及静止图象包中,将强光数据、子图象数据以及静止图象数据进行解码;输出装置,至少根据从上述第1解码装置取出的色板信息,复原通过上述第2解码装置取出的子图象数据,和强光数据以及静止图象数据一同输出。
4.根据权利要求3记载的解码装置,其特征在于上述第2解码装置进一步从强光包的强光数据,将引导命令进行解码,该引导命令是操作通过上述子图象数据显示的显示按钮时的控制处理数据。
全文摘要
本发明的目的是提供一种唱盘和音频信号的编码装置、解码装置和传输方法以及计算机程序的记录媒体,在以音频信号为主进行记录的情况下使用者能够简易方便地进行重放并且使实时管理变得简单。为了实现上述目的,提供SAMG(简单音频管理器)、AMG、包含多个音频对象(AOB)的音频标题组(ATS)、SPS(静止图象组)。AOB由仅包含音频数据的和包含音频数据及实时信息数据(RTI数据)的两种AOTT-AOB所构成。SPS(静止图象组)包含静止图象数据(SPCT数据)。
文档编号G11B27/11GK1495764SQ0313271
公开日2004年5月12日 申请日期1999年4月15日 优先权日1998年4月16日
发明者渕上德彦, 植野昭治, 田中美昭, 上德彦, 昭, 治 申请人:日本胜利株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1