专利名称:用于再现文本字幕流的记录介质、方法和装置的制作方法
技术领域:
本发明涉及记录介质,尤其涉及用于再现文本字幕流的记录介质、方法和装 置。尽管本发明适用于广泛范围的应用,但它特别适用于将文本字幕流文件记录 在记录介质内并有效地再现所记录的文本字幕流。
背景技术:
光盘被广泛地用作用于记录大量数据的光学记录介质。目前,在广泛范围的 光盘中,诸如蓝光盘(下文称为"BD")之类的新的高密度光学记录介质(下文称 为"HD-DVD")正在开发中,用于写入和存储高清晰度的视频和音频数据。当前, 众所周知作为下一代技术的蓝光盘(BD)的全球标准技术规范正在被建立成为能 具有大大超越传统DVD以及许多其它数字装置的数据的下一代光学记录方案。因此,还在开发应用蓝光盘(BD)标准的光学再现装置。然而,因为蓝光盘 (BD)标准仍有待完成,所以在开发完备的光学再现装置的过程中存在许多困难。 特别是为了有效地从蓝光盘(BD)再现数据,不仅应提供主AV数据以及方便用 户所需的各种数据,诸如作为与主AV数据相关的补充数据的字幕信息,而且应系 统化和提供管理信息,用于再现记录在光盘中的主数据和字幕数据。然而,在现有的蓝光盘(BD)标准中,因为补充数据特别是字幕流文件的标 准尚未完全统一,所以在基于蓝光盘(BD)的光学再现装置的全面研发中存在许 多限制。并且,在向用户提供诸如字幕之类的补充数据的过程中这些限制会引起 一些问题。
发明内容
因此,本发明涉及一种用于再现文本字幕流的记录介质、方法和装置,它基 本上避免了由于相关技术的限制和缺点而引起的一个或多个问题。本发明的一个目的是提供能将文本字幕流文件记录在诸如蓝光盘(BD)的记 录介质中的用于再现文本字幕流的方法和装置。本发明的其它优点、目的和特征的一部分将在下面的说明书中阐述, 一部分 将在本领域普通技术人员阅读以下说明后变得显而易见,或者可以从本发明的实 践中认识到。本发明的目的和其它优点可以通过在书面说明书及其权利要求、以 及附图中特别指出的结构来实现和获得。为了实现这些目的和其它优点,并根据在本文中体现并广泛说明的本发明用 途,用于再现文本字幕流的记录介质包括存储至少一个文本字幕流的数据区, 各文本字幕流包括定义一组区域样式的对话样式片段以及多个对话呈现片段,各对话呈现片段包含至少一个对话文本区域,各对话文本区域链接到这组区域样式 中的一个选定样式,其中当前对话呈现片段内所包括的第一对话文本区域包含连 续呈现标志,该连续呈现标志指示先前对话呈现片段内所包括的第一对话文本区 域与第二对话文本区域之间需要连续呈现。在本发明的另一方面中,用于再现文本字幕流的记录介质包括存储至少一 个文本字幕流的数据区,各文本字幕流包括定义一组区域样式的对话样式片段以及多个对话呈现片段,该多个对话呈现片段的至少之一包含第一和第二对话文本 区域,它们分别链接到从这组区域样式中选择出来的第一和第二区域样式,其中 第一和第二区域样式定义同一文本流。在本发明的又一方面中,用于再现文本字幕流的方法包括读取记录在记录 介质上的文本字幕流中所包括的对话样式片段,该对话样式片段定义一组区域样 式,该文本字幕流还包括第一和第二对话样式片段;在图形平面中呈现第一对话 呈现片段中所包括的第一对话文本区域,该第一对话文本区域链接到这组区域样 式中的一个样式;读取第二对话呈现片段中所包括的连续呈现标志,该第二对话呈现片段包括链接到这组区域样式中的一个样式的第二对话文本区域;并且如果 连续呈现片段指示在第一和第二对话文本区域之间需要连续呈现,则通过保留第 一对话文本区域在图形平面中的呈现来呈现第二对话文本区域。在本发明的再一方面中,用于再现文本字幕流的装置包括被配置成预载文 本字幕流的缓冲器,该预载文本字幕流包括定义一组区域样式的对话样式片段、 以及第一和第二对话呈现片段;以及文本字幕解码器,它被配置成在图形平面中 呈现第一对话呈现片段中所包括的第一对话文本区域,并读取包括第二对话文本 区域的第二对话呈现片段中所包括的连续呈现标志,其中如果连续呈现片段指示 在第一和第二对话文本区域之间需要连续呈现,则文本字幕解码器通过保留第一 对话文本区域在图形平面中的呈现来呈现第二对话文本区域。应当理解本发明的在前概述及下列详述是示例性和解释性的,且旨在提供对所要求保护的本发明的进一步解释。
包括在内提供对本发明的进一步理解、并结合其中构成本申请的一部分的附 图示出本发明的各个实施例,并与说明书一起用于解释本发明的原理。在附图中-图1示出根据本发明的记录在光盘中的数据文件的结构; 图2示出根据本发明的光盘的数据存储区; 图3示出根据本发明的呈现在显示屏上的文本字幕和主图像; 图4示出根据本发明的文本字幕流的再现控制的示意图; 图5A-5C示出根据本发明的用于再现文本字幕流的再现控制信息的应用; 图6示出根据本发明的文本字幕流文件的结构;图7示出根据本发明用于将再现控制信息写入文本字幕流内的一方法示例; 图8A-8C示出根据本发明文本字幕流的间断呈现和连续呈现的示例; 图9示出根据本发明的文本字幕流文件的句法;图10A-10C示出根据本发明的表示对话样式片段(DSS)的dialog_style— segment()的详细结构;图11A禾B 11B示出根据本发明的表示对话呈现片段(DPS)的dialog— presentation—segment()的详细结构;图12A和12B示出根据本发明的包括文本字幕流文件再现的光学记录和/或再 现装置。
具体实施方式
现在将详细参考本发明的优选实施例,其示例在附图中示出。在可能的情况 下,在全部附图中用相同的标号来指示相同或相似的部件。另外,虽然本发明中 使用的术语选自众所周知和已使用的术语,但本发明的说明书中提到的某些术语 是由申请人根据他或她的判断选择的,其详细含义在本说明书的相关部分中描述。 此外,本发明需要不仅仅通过所使用的实际术语而通过各术语内蕴含的意义来理 解。在本详细说明书中,"记录介质"指能记录数据的所有类型的介质,并且广义 地包括不论采取何种记录方法的所有类型的介质,例如光盘、磁带等。在下文中,为了简化本发明的说明,光盘特别是"蓝光盘(BD)"将作为本文提出的记录介质 的一个示例给出。然而,可将本发明的精神和范围同等地应用于其它类型的记录 介质是显而易见的。在本详细说明中,"主数据"表示属于由作者记录在光盘中的标题(例如电影 标题)的音频/视频(AV)数据。通常,AV数据以MPEG2格式记录并常常被称为 AV流或主AV流。另外,"补充数据"表示再现主数据所需的所有其它数据,其示 例是文本字幕流、交互式图形流、呈现图形流和补充音频流(例如,用于可浏览 幻灯片)。这些补充数据流可以用MPEG2格式或任何其它数据格式记录。它们能 与AV流多路复用或能在光盘中作为独立数据文件存在。"字幕"表示对应于所再现的视频(图像)数据的字幕说明信息,并且它可 用预定语言表示。例如,当用户在观看显示屏上的图像时选择观看以各种语言表 示的多个字幕之一的选项时,对应于所选择字幕的字幕说明信息被显示在显示屏 的预定部分上。如果所显示的字幕说明信息是文本数据(例如字符),则所选择的 字幕常被称为"文本字幕"。在本发明中,"MPEG-2格式"指根据建立为ISO/IEC 13818标准的国际标准的编码和解码方法。根据本发明的一个方面,多个MPEG2 格式的文本字幕流可记录在一张光盘中,并且它们可作为多个独立的流文件存在。 各个"文本字幕流文件"被创建并记录在一张光盘内。并且,本发明的目的在于 提供一种用于再现所记录的文本字幕流文件的方法和装置。图1示出根据本发明的记录在蓝光盘(下文称为"BD")中的数据文件的文 件结构。参见图1,根目录(root)中包括至少一个BD目录(BDMV)。各BD目录 包括用于与一个或多个用户交互的索引文件(index.bdmv)和对象文件 (MovieObject.bdmv)。例如,索引文件可包含表示具有多个可选择菜单和电影标 题的索引表的数据。各BD目录还包括四个文件目录,它们包括所要再现的音频/ 视频(AV)数据和再现这些AV数据所需的各种数据。各BD目录中所包括的文件目录是流目录(STREAM)、剪辑信息目录(CLIPINF)、播放列表目录(PLAYLIST)、和辅助数据目录(AUXDATA)。首先, 流目录(STREAM)包括具有特定数据格式的音频/视频(AV)流文件。例如,AV 流文件可以是MPEG2传输分组的形式,并命名为"*.m2ts",如图1所示。该流 目录还可包括一个或多个文本字幕流文件,其中各文本字幕流文件包括用特定语 言表示的文本字幕的文本(例如字符)数据和该文本数据的再现控制信息。文本 字幕流文件作为独立的流文件存在于流目录内,并可命名为"气m2ts"或""xtst", 如图l所示。流目录中所包括的AV流文件或文本字幕流文件常称为剪辑流文件。 接着,剪辑信息目录(CLIPINF)包括分别对应于流目录中所包括的诸流文件(AV或文本字幕)的剪辑信息文件。各剪辑信息文件包含相应流文件的属性或再 现定时信息。例如,剪辑信息文件可包括映射信息,在其中呈现时戳(PTS)和源 分组号(SPN)是一一对应关系并根据剪辑类型通过入口点映射(EPM)来映射。 使用该映射信息,可根据由播放项或子播放项提供的一组定时信息(进入时间 In-Time和跳出时间Out-Time)确定流文件的特定位置,下面将对此进行详细讨论。 在工业标准中,每一由流文件及其相应的剪辑信息文件构成的文件对被指定为一 个剪辑。例如,CLIPINF中所包括的01000.clpi包含STREAM中所包括的 01000.m2ts的属性和再现定时信息,且01000.clpi和01000.m2ts形成一个剪辑。 再参考图1,播放列表目录(PLAYLIST)包括一个或多个播放列表文件(*.mpls),其中每个播放列表文件包括至少一个播放项,它指定至少一个主AV 剪辑和该主AV剪辑的再现时间。更具体来说,播放项包含指定进入时间和跳出时 间的信息,进入时间和跳出时间表示由播放项内的Clip—Information—File_Name (剪 辑信息文件名)指定的主AV剪辑的再现开始和结束时间。因此,播放列表文件表 示基本再现文件信息,它执行一个或多个播放项的组合所预期的剪辑组合的再现。 另外,播放列表文件还可包括子播放项,它表示用于文本字幕流文件的基本再现 控制信息。当子播放项被包括在播放列表文件中以再现一个或多个文本字幕流文 件时,该子播放项与(诸)播放项同步。另一方面,当子播放项用于再现可浏览
幻灯片时,它可不与(诸)播放项同步。根据本发明,子播放项的主要功能在于 控制一个或多个文本字幕流文件的再现。最后,辅助数据目录(AUX DATA)可包括补充数据流文件,其示例是字体 文件(例如,aaaaa.font或aaaaa.otf)、弹出式菜单文件(未示出)、和用于产生点 击声的声音文件(例如,Sound.bdmv)。上述文本字幕流文件可包括在辅助数据目 录而非流目录中。图2示出根据本发明的光盘的数据存储区。参见图2,光盘包括占用盘巻的最 里面部分的文件系统信息区、占用盘巻的最外面部分的流区、以及占用文件系统 信息区和流区之间的区域的数据库区。在文件系统信息区中,存储用于管理图1 所示的全部数据文件的系统信息。接着,主数据和补充数据(即,AV流和一个或 多个文本字幕流)被存储在流区中。主数据可包括音频数据、视频数据和图形数 据。并且,补充数据(即,文本字幕)被独立地存储在流区中而不与主数据多路 复用。图1所示的通用文件、播放列表文件和剪辑信息文件被存储在盘巻的数据 库区中。如上所述,通用文件包括索引文件和对象文件,而播放列表文件和剪辑 信息文件包括再现存储在流区中的AV流和文本字幕流所需的信息。使用存储在数 据库区和/或流区中的信息,用户能选择特定回放模式并以所选择的回放模式再现 主AV和文本字幕流。下面将详细说明根据本发明的文本字幕流文件的结构。首先,将新定义用于 再现文本字幕流的控制信息。然后是创建包括新定义的控制信息的文本流文件的 方法、和用于再现文本字幕流从而再现所记录的流文件的方法和装置的详细说明。 图3示出根据本发明呈现在显示屏上的文本字幕和主图像。当同步再现主AV流和 相应的文本字幕流时,所述主图像和文本字幕被同时显示在显示屏上。图4是示出根据本发明的主AV剪辑和文本字幕剪辑的再现控制的示意图。参 见图4,播放列表文件包括控制至少一个主AV剪辑的再现的至少一个播放项、和 控制多个文本字幕剪辑的再现的子播放项。图4所示的用作英文和韩文文本字幕 的文本字幕剪辑1和文本字幕剪辑2中的一个可与主AV剪辑同步,从而主图像和 相应的文本字幕在特定呈现时间同时显示在显示屏上。为了在显示屏上显示该文 本字幕,需要显示控制信息(例如位置和大小信息)和呈现时间信息,其示例在 图5A到图5C中示出。
图5A示出根据本发明的在显示屏上呈现的对话。对话表示在给定呈现时间期 间显示屏上显示的全部文本字幕数据。通常,对话的呈现时间可用呈现时戳(PTS) 表示。例如,图5A所示的对话的呈现在PTS(k)处开始并在PTS(k+l)处结束。因 此,图5A所示的对话表示在PTS(k)和PTS(k十l)之间显示在显示屏上的文本字幕 数据的整个单元。对话最多包括一个文本字幕中的100个字符码。此外,图5B示出根据本发明的对话的多个区域。区域表示在给定呈现时间期 间在显示屏上显示的文木字幕数据(对话)的细分部分。换言之,对话包括至少 一个区域,且各区域可包括至少一行字幕文本。可根据分配给一个区域的区域样 式(全局样式)在显示屏上显示表示该区域的全部文本字幕数据。应根据字幕数 据的期望解码速率来确定包括在一个对话中的最多区域数目,因为较多数目的区 域通常导致较低的解码率。例如,可以将一个对话的最多区域数目限制为2,以实 现合理高的解码速率。据此,当再现文本字幕流时,因为解码负荷的缘故,所以 单个对话内的最多区域数目被限制为2个。在本发明的另一个实施例中,单个对 话内可存在最多n个(其中n〉2)区域。图5C示出根据本发明的对话的多个区域的样式信息。样式信息表示定义显示 对话中所包括区域的至少一部分所需的属性的信息。样式信息的某些示例是位置、 区域大小、背景颜色、文本对齐、文本流向信息等等。样式信息可分类成区域样 式信息(全局样式信息)和内联(inline)样式信息(局部样式信息)。区域样式信息定义应用于对话的整个区域的区域样式(全局样式)。例如,区 域样式信息可包含区域的区域位置、区域大小、字体颜色、背景颜色、文本流向、 文本对齐、行间距、字体名称、字形和字体大小的至少之一。例如,如图5C所示 将两个不同的区域样式应用于区域1和区域2。具有"位置1、大小1及颜色=蓝 色"的区域样式被应用于区域I,而具有"位置2、大小2及颜色=红色"的不同 区域样式被应用于区域2。另一方面,内联样式信息定义应用于区域中所包括的文本数据串的特定部分 的内联样式信息(局部样式信息)。例如,内联样式信息可包含字体类型、字体大 小、字形、和字体颜色的至少之一。文本串的特定部分可以是区域中的整个文本 行或该文本行的特定部分。参见图5C,特定内联样式被应用于区域1中包括的文 本部分"mountahi"。换言之,文本串特定部分的字体类型、字体大小、字形和字体颜色的至少之一与区域1中文本串的其余部分不同。因此,上述文本数据被记 录和描述为应用于特定内联样式信息(inline—style)的"文本串"。图6示出根据本发明的文本字幕流文件(例如,图1所示的10001.m2s)。该 文本字幕流文件可由包括多个传输分组(TP)的MPEG2传输流形成,所有传输分 组都具有相同的分组标识符(例如,PID《xl8xx)。当盘片播放器接收到包括特定 文本字幕流在内的许多输入流时,它用它们的PID找到属于该文本字幕流的所有 传输分组。参见图6,传输分组的每个子集形成一个分组基本流(PES)分组。图 6所示的PES分组之一对应于定义一组区域样式的对话样式片段(DSS)。第—PES 分组之后的所有其余PES分组对应于对话呈现片段(DPS)d在上述图6的文本字幕流结构中,图5A到5C所示的每个对话信息表示一个 对话呈现片段(DPS)。并且,对话信息中所包括的样式信息表示一组信息,该组 信息将在对话样式片段(DSS )中定义的多个区域样式组(也可称为 "region一stylejd")的任一个链接到内联样式。标准化有限数目的区域样式组被记 录在对话样式片段(DSS)中。例如,最多记录60组特定样式信息,其每一组由 region一stylejd描述。因此,在文本字幕解码器中(如图12B所示), 一次仅读取 和解码一个对话呈现片段(DPS)。图7示出根据本发明用于创建文本字幕流的方法,其中定义了应用于各呈现 时间(PTS)部分的各个对话呈现片段(DPS)。更具体地,参见图7, DPS #n-l 由两(2)个区域(区域#1和区域#2)构成,其中在每个区域中记录一个特定对话文 本。在PTS1—start (PTS1开始) PTS1—end (PTS1结束)部分内DPS #n-l呈现 在屏幕上。并且,DPS#n由一(l)个区域构成,其中在相应区域中记录一个特定对 话文本。在PTS2—start PTS2—end部分内DPS弁n呈现在屏幕上。最后,DPS#n+l 由两(2)个区域(区域#1和区域#2)构成,其中在每个区域中记录一个特定对话文 本。在PTS3—start PTS3—end部分内DPS #n+l呈现在屏幕上。因此,如上所述在一个图片内形成的DPS的特征将参照图8A到8C进行详细 的描述。首先,可在相邻DPS之间执行连续呈现或间断呈现。图8A示出DPS之 间的间断呈现(即间断DPS),而图8B示出DPS之间的连续呈现(即连续DPS)。参看图8A,三(3)个相邻DPS,即DPS #n-l、 DPS #n和DPS #n+l全部是间 断的。例如,DPS#n-l的结束PTS (-PTS2)与DPS #n的开始PTS (=PTS3>PTS2)
不同。类似地,DPS存n的结束PTS。PTS4)与DPS #n+l的开始PTS(=PTS5>PTS4) 不同。因此,图8A所示的各个DPS形成为彼此不相关的DPS。各不相关(或间 断)的DPS包括特定的区域样式信息(region—stylejd),且DPS内对话文本的位 置、背景颜色、字体大小、字体颜色等根据相应的区域样式信息来判定。更具体 地,可对DPS #n-l指定"region—style—id=k",可对DPS #n指定"region— style—id=k+l",而可对DPS弁n+l指定"region—style—id=k+2"。然而,即使各DPS 是彼此不相关的,相同的区域样式信息(region—style—id)也可相同地应用于各DPS。参见图8B,三个相邻的DPS,即DPS #n-l、 DPS #n、 DPS #n+l全部是连续 的。例如,DPS#n-l的结束PTS (=PTS2)与DPS弁n的开始PTS (=PTS2)相同。 类似地,DPS弁n的结束PTS (=PTS3)与DPS #n+l的开始PTS (=PTS3)相同。 因此,图8B所示的各个DPS形成为彼此相关联的DPS。各连续的DPS(DPS #n-l、 DPS弁n禾口DPS弁n+l)包括相同的特定区域样式信息(例如,region—style—id= k)。 并且由此,DPS#n-l、 DPS弁n和DPS#n+l每一个内对话文本的位置、背景颜色、 字体大小、字体颜色等根据相应的区域样式信息来等同地判定。图8C示出用于呈现(或再现)间断DPS和连续DPS的方法。更具体地,文 本字幕流文件包括continuousjresenUlag(连续呈现标志),它指示是否在如图8A 所示的相邻对话呈现片段(DPS)的各个区域之间执行连续呈现。因此,如果当前 DPS的再现(或呈现)与前一DPS连续,则分配"continuous_present—flag=l",而 如果再现不连续,则分配"continuous_present—flag=0"。此时,如果DPS中所包括 的区域的至少之一被设置成连续再现,则相应的DPS被定义为"连续呈现DPS"。 因而,例如,作为连续呈现DPS的DPS弁2、 DPS弁3和DPS存4被分组为"连续呈 现组#2"。并且,当上述连续呈现组#2再现(或呈现)时,首先再现连续呈现组#2 (即DPS弁2)的第一DPS。然后,不清除显示到屏幕上的文本数据,继续呈现直 到呈现结束,即直到DPS #4的显示结束。相反,因为DPS #1禾B DPS #5是间断 DPS,所以DPS弁1和DPS弁5不管其相邻DPS如何而独立呈现(或再现)。此外,不管DPS是连续DPS还是间断DPS,各DPS中的对话文本应当是新 定义的。并且,即使在同一DPS内存在两(2)个区域,在各区域内的对话文本流向 也应定义为朝着同一方向。更具体地,各DPS应包括表示(或引用)相应DPS的 对话文本信息,并且该规则等同地适用于连续DPS。此外,当一个DPS中包括两(2)个区域时,各区域应具有相同的文本流向。换言之,在第一区域具有从左到右 (左4右)的文本流向的情形中,不能接受或允许第二区域具有从上到下(上4 下)的文本流向,因为两个文本流向是彼此不同的。这种条件应当理解为强制条 件以防止用户看到混乱的图像。现在将参照图9到11C详细描述上述对话样式片段(DSS)和对话呈现片段 (DPS)的句法结构。图9示出根据本发明的文本字幕流(TexLSubtitle一Stream()) 的句法。如图6所示,Text—Subtitle—Stream()包括dialog—style—segment()句法和 dialog__presentation—segment()句、法。更具体i也,dialog—style—segment()句f去对应于 定义样式信息组的单个对话样式片段(DSS),而dialog_presentation—segment()句 法对应于实际对话信息记录其中的多个对话呈现片段(DPS)。图10A-10C示出表示对话样式片段(DSS)的dialog_style—segment()的详细结 构。更具体地,图IOA示出dialog—style—segment()的整体结构,其中定义了应用于 对话中的不同样式信息组的dialog—style—set()。图10B示出根据本发明的在 dialog—style—segment()中定义的 dialog—style一set()。 除了诸region—style夕卜, dialog一style一set()还包括Player—style—flag (播放器样式标志)、user—changeable—style set()(用户可改变样式组)和palette()(调色板)。Player—style_flag指示是否授权 播放器改变样式信息。同样,user—changeable—style set()定义播放器对样式信息的 改变的范围,而palette()指示颜色信息和透明度。区域样式信息(region_styles)表示对各区域定义的全局样式信息,如上所述。 给各区域分配region—style—id,并定义对应于特定region_style—id的样式信息组。 因此,当通过将应用于相应对话的region—style—id记录在对话呈现片段(DPS)中 来再现对话时,应用由dialog_style set()内的相同region_style—id定义的样式信息 组值以再现对话。因此,现在将描述提供给各regior^style—id的样式信息组内所包 括的各个样式信息。在本文中,region一horizontaljosition(区域横向位置)、region—verticalj osition (区域纵向位置)、region—width (区域宽度)和region—height (区域高度)被提供 作为用于定义相应区域在屏幕内的位置和大小的信息。并且,还提供了决定相应 区域的背景颜色的region—bg—color—index (区域背景颜色索引)信息。此外,作为 定义文本在相应区域内的原始(或起始)位置的信息,提供region—horizontal_position (区域横向位置)禾卩text—vertical_position (区域纵向位 置)。此外,提供定义文本方向(例如左—右、右—左、上—下)的textjlow (文 本流向)、以及定义文本对齐方向(例如左、中、右)的text—alignment (文本对齐)。 更具体地,当特定对话中包括多个区域时,相应对话中所包括的各区域的text—flow 被定义为具有相同的textjlow值,以防止用户看到混乱的图像。此外,指定区域内各行之间间距的line—space (行间距)被提供作为样式信息 组内所包括的个体样式信息。并且,font—type (字体类型)、font—size (字体大小) 和font一colorjndex (字体颜色索引)被提供作为用于实际字体信息的字体信息。 同时,dialog—style set()内记录的Player—style—flag (播放器样式标志)指示作者是 否可应用提供给播放器的样式信息。例如,当Player—style—flag= lb时,播放器被 授权通过应用播放器本身内所提供的样式信息以及记录在盘片内的dialog_ style set()里定义的样式信息来再现文本字幕流。另一方面,当Player—style—flag=0b时, 仅授权记录在盘片内的dialog—style set()中所定义的样式信息的使用。图10C示出根据本发明的在dialog—style set()中定义的user—changeable—style set()。该user—changeable—style set()预定义可由用户改变的样式信息的类型和改变 的范围,并且user—changeable—style set()用于简便地改变文本字幕数据的样式信息。 然而,当用户被允许改变如图10B所述的所有样式信息时,用户会更加困惑。因 此,在本发明中,只可改变 font—size 、 region—horizontal_position 、 以及 region—vertical—position的样式信息。并且,相应地,可根据font—size改变的文本 位置和行间距的变化也在user—changeable—style set()中定义。更具体地,为每个 region—style—id定义user—changeable—style set()。例如,在user—changeable—style set() 中,可定义特定region_style—id=k内最多25个user—style—id。此夕卜,各user—style—id包括region—horizontal_position—direction (区域横向位 置方向)、region—vertical_position—direction (区域纵向位置方向)信息,它们指定 各可变region—horizontal_position禾口 region— vertical_position的改变后位置的方向。 各user—style—id还包括region—horizontal_position—delta (区土或横向位置增量)禾口 region—vertical_position—delta (区域纵向位置增量)信息,用于将各方向上的单个 位置移动单位指定为像素单位。更具体地,例如,当 region—horizontal_position—direction=0 日寸,区域的位置向右移动。而当region—horizontal_position—direction=l 时,区域的位置向左移动。此夕卜,当 region—vertical_position—direction=0 时,区±或的位置向下移动。最后,当 region—vertical— position—direction= 1日寸,区域的位置向上移动。此外,各user_style—id包括指定各可变font—size的改变方向的 font—size—inc—dec (字体大小增减)信息、以及用于将各方向上的单个位置移动单 位指定为像素单位的font—size—delta (字体大小增量)信息。更具体地,例如, font—size—inc—decH3表示font—size的增大方向,而font—size— inc—dec=l表示 font一size的减小方向。类似地,与"文本位置"和"行间距"相关的改变后信息(数据字段)也可根据相同的原理来定义。现在详细描述根据本发明的user—changeable—style set()的特征。对话样式片段(DSS)中所包括的各region—styles()内所定义的user—control—styles()的数目是相同 的。换言之,可应用于各对话呈现片段(DPS)的user—contro1—styles()的数目是相 同的。此夕卜,各user—control—style()由不同的user—stylejd表示。并且,当用户选 择随机的user—style—id日寸,相同顺序的user—control—styles()等同地应用于各 region—style()。此外,可变样式的所有可能组合都在单个user—control—styles()中定 义。换言之,regionjostion和font—size同时组合定义,而非分别定义。并且,最 后,移动方向"—direction)或增减指示(*—inc—dec)不相关地与各位置移动单位 (*—delta)区别开来,并相应地记录。更具体地,在不具有作为实际正在变化的值的 样式值的情况下只定义位置移动单位(*—delta)。随后,将region—style()中定义的值 加上所定义的位置移动单位(*—delta),从而获得实际正在变化的样式值的最终值。 图10D示出根据本发明的在dialog—style set()中定义的调色板信息(palette())。 该palette()提供记录在对话内的文本字幕数据的颜色改变信息。在本文中,palette() 包括多个palette—entry (调色板条目),其中每个palette_entry都由一 palette—entry—id 描述。并且,各palette—entry设置有对应于各palette—entryJd的特定亮度值(Y—value)、特定颜色值(Cr—value、 Cb—value)、以及指定文本数据透明度的特定 T一value。因此,根据本发明的文本字幕流的特征之一是仅定义一基本(或通用) 调色板,该调色板应用于文本字幕流中所包括的各对话呈现片段(DPS)。更具体 地,在定义对话样式片段(DSS)中的调色板之后,所定义的调色板通常被用于各 个对话呈现片段(DPS)中。然而,如果要在特定的对话呈现片段(DPS)中使用新的特定调色板而非通用的调色板,则通过使用palette—update_flag (调色板更新 标志)来新定义特定的调色板,palette_update—flag将参照图IIA如下所述。图11A和11B示出根据本发明表示对话呈现片段(DPS)的 dialog_presentation—segment()的详细结构。图11A示出dialog_presentation_segment() 的整体结构,其中定义dialog—start—PTS (对话开始PTS)和dialog—end—PTS (对 话结束PTS)。dialog_start—PTS和dialog—end—PTS指定相应对话的呈现时间。然后, dialog一presentation一segment()包括指示相应对话内颜色信息的改变的 palette—update—flag 。在本文中,当palette—update—flag= lb日寸,颜色和透明度 (T一value)被改变(或更新),因此新定义颜色的palette()信息被单独记录。在该 情形中,在对话呈现片段(DPS)中新定义的palette()必须只应用于相应的对话呈 现片段(DPS)。假设palette—update—flag=0b,则当呈现(或再现)相应的对话呈 现片段(DPS)时,已在如图IOA所示的对话样式片段(DSS)中定义的上述通用 调色板应当恢复(或保留)。随后,定义区域信息的dialog—region()被记录在dialog_presentation_segment() 中。在本发明中,最多有两个区域可设置在单个对话内,并且因此dialog—region() 信息被提供给各区域。dialog—region()包括region—style—id信息禾卩continuous— present—flag信息。region—style—id信息指定如图10B所示的区域样式的任一个,并 且continuous_present—flag信息标识是否要执行如图8C所示的与前一对话区域的 无缝再现。更具体地,continuous_present—flag被包括在各区域内。如果在一个DPS 中包括两(2)个区域,并且当至少一个区域被设置成continuous_present—flag=lb时, 相应的DPS变成上述连续呈现DPS。此外,在dialog—region()中还包括文本数据和 region—subtitle()信息。文本数据被包括在实际相应区域中,并且region—subtitle() 信息定义局部样式信息。图11B和11C示出记录region—subtitle()的一个示例,该region—subtitle()包括 文本串和标识应用于该文本串的内联样式信息(即inline—style)的标识信息(即 data—type)。此外,1-字节信息(即escape—code (转义码))被记录在由标识信息 (即data—type)标识的信息之间。更具体地,文本串和inline-style (内联类型) 被记录在region一subtitle()内,以包括文本串和标识内联样式信息的标识信息(即 data—type)。在本文中,当data—type=0b时,数据类型是内联样式信息(即
inline—style),而当data_type=lb时,数据类型是文本串。因此,当data—type=lb 时,文本串被记录为textjtring()中所包括的特定字段(即char—data—byte (字符数 据字节))内的字符码。换言之,char—data》yte被用于记录文本数据,诸如"Good morning"或"Good afternoon",如图8A和8B所示,并且,文本数据被记录在各 DPS内的各区域中,而不管DPS是否为连续呈现DPS。此外,当data—type=0b时,记录内联样式信息(即inline—style),其中内联样 式信息被配置成具有至少一个内联样式类型(即inline一style一type)。例如, inline—styleJype=0x01表示字体集中的变化,并且因此由相应Cliplnfo (剪辑信息) 指定的字体ID值被记录在特定字段(即inline—style—data_byte (内联样式数据字 节))内;并且,inline—style—type=0X02表示字形中的变化,并且因此相应的字形 值被记录在特定字段(即inline—style—data—byte)内。此夕卜,inline—style—type=0x03 表示字体大小的变化,并且相应的字体大小值被记录在特定字段(即 inline—style—data—byte)内;而inline—style_type=0x04表示字体颜色中的变化'并 且因此由相应调色板指定的索引值被记录在特定字段(即inline—style—data—byte) 内。此外,inline—style—type=0x0A表示断行。在该情形中,不另外记录数据,除 非在读取相应类型(inline—style—type=0x0A)时在再现(或呈现)之前解码文本字 幕流时应换行。此外,当data—type=0b时,记录内联样式信息(inline—styles),其中记录指示 诸inline—style总长的信息,即inline—style—length。并且,至少一个inline_style—type 和记录各类型的改变后的值的inline—style—dataj3yte值被记录在相应大小内。因此, 内联样式信息(诸inline—style)中所包括的至少一个inline—style—type作为单个单 元被连续记录。然后,当相应内联样式信息的记录完成时,在由连续(或后续) 标识信息(即data—type)记录的文本串之间插入l-字节信息(escape_code)并记 录之。在下文中,将参照图12A和12B详细描述用于再现如上所述记录在光盘中的 文本字幕流的方法和装置。图12A示出用于根据本发明的用于再现光盘的装置, 尤其是解码器,更特别地示出单独包括的文本字幕解码部件40的一个示例。更具 体地,该装置包括分组标识符(PID)过滤器5,用于基于其分组标识符将输入 流分成视频流、音频流、图形流、和文本字幕流;视频解码部件20,用于再现视
频流;音频解码部件IO,用于再现音频流;图形解码部件30,用于再现图形流; 以及文本字幕解码部件40,用于再现文本字幕流。这些文本字幕流可从光盘中提取,或者它们可从其它外部源中输入,如图12A所示。因此,该装置包括选择输入数据源的开关6。因此,如果从光盘中提取MPEG 格式的文本字幕流,则开关6选择与PID过滤器5相连的数据线A。另一方面, 如果它们通过其它外部源输入,则开关6选择与该外部源相连的数据线B。视频解码部件20、音频解码部件10、图形解码部件30分别包括传输缓冲器 21、 11和31,用于存储预定大小的要解码的数据流。视频平面23和图形平面33 分别包括在视频解码部件20和图形解码部件30中,用于将经解码信号转换成可 显示图像。图形解码部件30包括颜色查找表(CLUT) 34,用于控制可显示图 像的颜色和透明度。当文本字幕解码部件40从开关6处接收一个或多个文本字幕流时,所有这些 流在开始时就一次性地预载入文本预载缓冲器(SPB) 41中。假设用于一种语言 的文本字幕流文件的典型大小约为0.5兆字节,则字幕预载缓冲器41的大小应根 据文本字幕流文件的总数来确定。例如,为了确保当用户在支持两种语言的字幕 流文件之间切换时文本字幕的无缝呈现,字幕预载缓冲器41的大小应大于或等于 1兆字节。字幕预载缓冲器41的大小应大到足以一次性地预载所有所需的文本字 幕流文件。因为如上所述整个文本字幕流可记录在小容量内,所以文本字幕流被全部预 载到缓冲器41中并使用。因此,文本字幕流被记录为单独的文件,从而便于只读 取和使用文本字幕数据。此外,因为全部文本字幕数据都被预载到缓冲器中,所 以可更简便地控制该缓冲器。在特定类型的光学记录和再现装置中,假设未发生 缓冲器下溢,则文本字幕流可在未预载文本字幕流的情况下结合主AV数据实时再 现。在下文中,将给出并详细描述根据本发明的正在预载的文本字幕流的一个示 例。文本字幕解码部件40还包括文本字幕解码器42,它解码存储在字幕预载缓 冲器41中的一个或多个文本字幕流;图形平面43,它将解码后的字幕流转换成可 显示图像;以及颜色查找表(CLUT) 44,它控制转换后图像的颜色信息(Y、 Cr 禾口Cb值)和透明度信息(T值)。图12A所示的装置中所包括的图像叠加部件50组合从视频解码部件20、图 形解码部件30和文本字幕解码部件40中输出的图像。这些组合图像在显示屏上 显示。从视频解码部件20的视频平面23中输出的视频图像被显示为显示屏的背 景,并且从图形解码部件30和/或文本字幕解码部件40输出的图像被叠加在所显 示的视频图像上。例如,如果图形解码部件30的输出图像是交互式图形图像,则 由第一加法器52在开始时将从文本字幕解码部件40输出的文本字幕图像叠加在 视频图像之上。然后,再由第二加法器53将交互式图形图像进一步叠加在已叠加 字幕的图像之上。图12A所示的装置还包括用于解码所输入传输流(例如MPEG 传输流)的系统解码器4,以及用于控制装置的所有所述组件的操作的微处理器3。将详细参考根据本发明用于再现文本字幕流的方法。当光盘播放器(其示例 如图12A所示)预载入光盘时,在开始时从盘片中提取再现记录在盘片上的数据 所需的信息,并将其存储在存储器(未示出)中。当用户选择与一播放列表相关 联的特定标题时,开始时将播放列表文件中所指定的至少一个完整(整个)文本 字幕流文件预载入字幕预载缓冲器41,并且与该字幕流文件相关的字体文件被预 载入字体预载缓冲器410。例如,当用户选择与图4所示播放列表相关联的标题时,开始时将文本字幕 剪辑No. 1 (韩语)和文本字幕剪辑No. 2 (英语)的文本字幕文件预载入字幕预 载缓冲器41。此外,与这些文本字幕文件相关的字体文件被预载入字体预载缓冲 器410,这些字体文件可在文本字幕剪辑的剪辑信息文件中指定。然后,开始播放 列表的回放。在播放列表回放期间,主AV剪辑No. l和No. 2的AV流分别由音 频解码部件10和视频解码部件20解码,且所预载的文本字幕流的选定之一由文 本字幕解码器42解码。然后经解码的文本字幕图像被叠加在经解码的主视频图像 上,并且在显示屏上显示整个图像。如上所述,当完成所有操作、并且由播放项控制的主视频数据被显示到屏幕 上时,通过图像叠加部件50 (如图12A所示)叠加相关的文本字幕。并且,因为 提供了经叠加的文本字幕,所以启动了文本字幕流的解码。同时,为了执行文本 字幕流的解码,对话样式片段(DSS)内配置了第一分组流(PES)的区域样式信 息和调色板信息被分别读取并存储以便于在再现该DPS时使用。更具体地,当读 取调色板信息时,同时向CLUT44提供调色板信息,以便于在将文本字幕显示在屏幕上时提供用户所需的颜色和透明度。图12B详细地示出图12A所示的文本字幕解码器42。由文本字幕解码器42 执行的解码过程包括语法分析、绘制和排版步骤。在语法分析步骤中,根据对话 呈现片段(DPS)中所包括的信息,存储在字幕预载缓冲器(SPB) 41中的文本字 幕流被语法分析成排版信息、绘制信息和对话文本数据。对话表示在可由呈现时 戳(PTS)定义的预定时段期间显示的所有文本字幕。因此,排版信息对应于与文 本字幕显示到屏幕上时的显示时间和显示位置相关的信息,并且还对应于由调色 板信息更新(palette_updatejlag=lb)新定义的新调色板信息。绘制信息对应于实 际上描绘(或呈现)各对话中各区域的文本的信息。这种绘制信息包括"区域宽 度和高度"、"背景颜色"、"文本流向"、"文本对齐"、和"字体id/字形/大小"。此 外,对话文本信息对应于应用到实际文本数据的内联样式信息、以及记录在DPS 内的特定文本串。参看图12B,文本字幕解码器42中所包括的文本字幕处理器421将存储在字 幕预载缓冲器41内的字幕流文件语法分析成排版和绘制信息以及对话文本数据。 然后将排版和绘制信息存储在对话排版缓冲器(DCB) 425中,并将对话文本数据 存储在对话缓冲器(DB ) 422中。更具体地,调色板更新信息 (palette—update—flag-lb)被包括在由语法分析步骤语法分析的排版信息内。并且, 当palette—update—flag-0b时,开始时从对话样式片段(DSS)提供给CLUT 44的 通用调色板信息可在不经更新的情况下连续使用。相反,当palette—update—flag=lb 时,忽略DSS内的通用调色板信息,并且新的调色板信息在相应DPS内新定义、 更新到CLUT44并使用。然而,当相应DPS的呈现(或再现)完成时,清除调色 板更新,并再次使用开始时从CLUT44提供的通用调色板信息。此时,CLUT44 的更新应在呈现(或再现)后续DPS之前完成。在绘制步骤中,经语法分析的对话文本数据使用绘制信息绘制成位图数据, 该绘制信息表示绘制对话文本数据所需的样式信息。在对话呈现控制器426的控 制下,文本绘制器423将对话缓冲器422内所存储的对话文本数据绘制成位图数 据。为了执行绘制功能,文本绘制器423从字体预载缓冲器410中接收与对话文 本数据相关联的字体数据、从对话呈现控制器426中接收绘制信息和内联样式信 息、并使用绘制信息和内联样式信息将对话文本数据绘制成位图数据,这适用于
对话文本数据的各个文本串。此后,所绘制的文本数据作为位图对象被存储在位图对象缓冲器(BOB) 424中。因此,记录在BOB缓冲器424内的"对象"对应 于被转换成位图对象的各对话内各区域的文本数据。因此,每个区域最多有两个 对象被语法分析并存储在BOB缓冲器424内。
最后,在排版步骤中,所绘制的文本数据根据排版信息被添加到图形平面(GP) 43中,该排版信息表示指示用于在显示屏内显示文本字幕的时间的信息。最后, 根据由对话呈现控制器426提供的排版信息,存储在位图对象缓冲器424中的位 图对象被传送(添加)到图形平面43。颜色査找表44使用排版信息中包括的调色 板信息以调节图形平面43的输出的颜色和透明度。
因此,在呈现(或再现)构成如图8C所示的连续呈现的连续DPS弁2、 DPS#3 和DPS#4时,居先的DPS#2通过使用全部上述呈现过程来呈现。然后,在呈现 DPS#3和DPS#4时,允许DPS#3和DPS#4的连续呈现的区域使用与前面的DPS#2 相同的区域样式。因此,在该情形中,略去绘制过程,并且保留和使用与图形平 面(GP)内前面的DPS弁2相关的信息。更具体地,图形平面(GP)被保留到其中 完成连续呈现的DPS存S的dialog—end_PTS。然而,当DPS#5的间断呈现开始时, 图形平面(GP)内的信息全部复位。即使DPS是连续呈现组内的连续呈现DPS, 也可包括间断区域,并且在该情形中,不相关区域应通过单独的绘制过程配置位 图对象。
工业实用性
对本领域技术人员而言,显然可在本发明中进行各种更改和变化而不背离本 发明的精神或范围。因而,本发明旨在涵盖本发明的更改和变化,只要它们落在 所附权利要求及其等效方案的范围内即可。
权利要求
1.一种记录介质,包括数据区域,存储至少一个文本字幕流,各文本字幕流包括定义一组区域样式的样式片段和多个呈现片段,多个呈现片段中至少一个包含第一和第二文本区域,分别链接到从所述一组区域样式中选定的第一和第二区域样式,其中第一和第二文本区域定义相同的文本流向。
2. 如权利要求1所述记录介质,其特征在于,所述相同的文本流向指示字符 行进和行行进的至少之一。
3. 如权利要求l所述记录介质,其特征在于,所述相同的文本流向的方向为左到右或上到下。
4. 如权利要求1所述记录介质,其特征在于,当前呈现片段包含连续呈现标 志,指示当前呈现和前一呈现之间是否需要连续呈现。
5. 如权利要求4所述记录介质,其特征在于,所述连续呈现标志设置为"0", 以指示呈现片段和前一呈现片段之间不需要连续呈现。
6. 如权利要求4所述记录介质,其特征在于,所述连续呈现标志设置为"1", 以指示呈现片段和前一呈现片段之间需要连续呈现。
7. —种再现文本字幕流的方法,所述方法包括解码至少一个文本字幕流,各文本字幕流包括定义一组区域样式的样式片段 和多个呈现片段,多个呈现片段中至少一个包含第一和第二文本区域,分别链接 到从所述一组区域样式中选定的第一和第二区域样式,其中第一和第二文本区域 定义相同的文本流向;根据所述相同的文本流向,再现所述至少一个文本字幕流。
8. 如权利要求7所述方法,其特征在于,所述相同的文本流向指示字符行进 和行行进至少之一。
9. 如权利要求7所述方法,其特征在于,所述相同的文本流向的方向为左到 右或上到下。
10. 如权利要求7所述方法,其特征在于,当前呈现片段进一步包含连续呈 现标志,指示当前呈现和前一呈现之间是否需要连续呈现。
11. 如权利要求10所述方法,其特征在于,所述连续呈现标志设置为"0",以指7^呈现片段和前一呈现片段之间不需要连续呈现。
12. 如权利要求10所述方法,其特征在于,所述连续呈现标志设置为"1", 以指示呈现片段和前一呈现片段之间需要连续呈现。
13. —种生成文本字幕流的方法,所述方法包括生成至少一个文本字幕流,各文本字幕流包括定义一组区域样式的样式片段 和多个呈现片段,多个呈现片段中至少一个包含第一和第二文本区域,分别链接 到从所述一组区域样式中选定的第一和第二区域样式,其中第一和第二文本区域 定义相同的文本流向。
14. 如权利要求13所述方法,其特征在于,所述相同的文本流向指示字符行 进和行行进的至少之一。
15. 如权利要求B所述方法,其特征在于,所述相同的文本流向的方向为左 到右或上到下。
16. 如权利要求13所述方法,其特征在于,当前呈现片段进一步包含连续呈 现标志,指示当前呈现和前一呈现之间是否需要连续呈现。
17. 如权利要求16所述方法,其特征在于,所述连续呈现标志设置为"0", 以指示呈现片段和前一呈现片段之间不需要连续呈现。
18. 如权利要求16所述方法,其特征在于,所述连续呈现标志设置为"1", 以指示呈现片段和前一呈现片段之间需要连续呈现。
19. 如权利要求13所述方法,其特征在于,所述方法进一步包括-将所生成的至少一个文本字幕流记录在记录装置上。
20. —种用于解码文本字幕流的装置,所述装置包括-解码器,配置用于解码至少一个文本字幕流,各文本字幕流包括定义一组区 域样式的样式片段和多个呈现片段,多个呈现片段中至少一个包含第一和第二文本区域,分别链接到从所述一组区域样式中选定的第一和第二区域样式,其中第 一和第二文本区域定义相同的文本流向。
21. 如权利要求20所述装置,其特征在于,所述相同的文本流向指示字符行 进和行行进的至少之一。
22. 如权利要求20所述装置,其特征在于,所述相同的文本流向的方向为左 到右或上到下。
23. 如权利要求20所述装置,其特征在于,当前呈现片段进一步包含连续呈 现标志,指示当前呈现和前一呈现之间是否需要连续呈现。
24. 如权利要求23所述装置,其特征在于,所述连续呈现标志设置为"0", 以指示呈现片段和前一呈现片段之间不需要连续呈现。
25. 如权利要求23所述装置,其特征在于,所述连续呈现标志设置为"1", 以指示呈现片段和前一呈现片段之间需要连续呈现。
26. —种用于生成文本字幕流的装置,所述装置包括控制器,配置用于生成至少一个文本字幕流,各文本字幕流包括定义一组区 域样式的样式片段和多个呈现片段,多个呈现片段中至少一个包含第一和第二文 本区域,分别链接到从所述一组区域样式中选定的第一和第二区域样式,其中第 一和第二文本区域定义相同的文本流向。
27. 如权利要求26所述装置,其特征在于,所述相同的文本流向指示字符行 进和行行进的至少之一。
28. 如权利要求26所述装置,其特征在于,所述相同的文本流向的方向为左 到右或上到下。
29. 如权利要求26所述装置,其特征在于,当前呈现片段进一步包含连续呈 现标志,指示当前呈现和前一呈现之间是否需要连续呈现。
30. 如权利要求29所述装置,其特征在于,所述连续呈现标志设置为"0", 以指示呈现片段和前一呈现片段之间不需要连续呈现。
31. 如权利要求29所述装置,其特征在于,所述连续呈现标志设置为"1", 以指示呈现片段和前一呈现片段之间需要连续呈现。
全文摘要
公开了一种用于再现文本字幕流的记录介质、方法和装置。缓冲器开始时预载包括定义一组区域样式的对话样式片段以及第一和第二对话呈现片段的文本字幕流。文本字幕解码器开始时在图形平面中呈现第一对话呈现片段中所包括的第一对话文本区域,并读取包括第二对话文本区域的第二对话呈现片段中所包括的连续呈现标志。如果连续片段指示在第一和第二对话文本区域之间需要连续呈现,则文本字幕解码器通过保留第一对话文本区域在图形平面中的呈现来呈现第二对话文本区域。
文档编号G11B27/034GK101127922SQ200710147218
公开日2008年2月20日 申请日期2005年3月22日 优先权日2004年3月26日
发明者刘齐镛, 徐康洙, 金柄辰 申请人:Lg电子株式会社