专利名称:用于创建多媒体可操作光盘的系统和方法
技术领域:
本发明一般地涉及数字图形簿(digital graphics album)领域,尤其涉及创建包含有多媒体数字图形簿的多媒体可操作光盘(multimediaenabled disc)。
传统的像片簿存储摄影图片。这些摄影图片被置于像片簿中并不时被注释以标识有关这些摄影图片的特殊信息。已开发了电子像片簿,以便通过与传统像片簿类似的方式来存储数字图形图像。伊思曼柯达公司已经开发了数字图形簿的应用,例如柯达像片页(Kodak PicturePage)或者柯达存储像片簿软件(Kodak Memory Album software),使用户得以将数字图形图像组织成像片簿页。通常用户通过日期、时间、位置、主题等等来组织图像。所述软件允许用户通过输入文字或其它描述数字图形图像的信息来注释该图形图像。
一般地,传统的像片簿包含由所有者/用户所拍摄的图片,可能还有由别人拍摄的图片。相比之下,除了电子像片簿的所有者/用户以外,电子像片簿还会包含来自许多来源的数字图形图像。例如,数字图形图像可能是数字照像机所拍摄的,还可能是经过扫描并转换成数字格式的摄影图片。另外,数字图形图像可通过电子方法(例如图形软件程序或图片编辑软件程序)生成。存在数字图形图像的私人的和商用的来源,例如,图片批发代理商以及像互联网这样的共享的图片资源。可通过互联网来访问数字图形图像,将其下载到个人计算机,并放置到数字图形簿中。
有多种选择来管理和注释数字图像簿中的数字图形图像。数字图形簿软件允许用户人工处理。尽管有些软件程序包括自动管理数字图形图像的特征。
然而,为提供具有丰富和详尽的内容及介绍的数字图形簿,并增加观看者在观赏这种像片簿时的乐趣,希望提供一种多媒体数字图形簿。也就是说,希望在单个的数字图形簿中包含的不仅仅是数字的静止图像和计算机所产生的图形。例如,希望在数字图形簿中包含诸如视频片段、音频片段、声音讲解这样的内容。
进一步,希望可将数字图形簿转入到其他的数字介质,例如多媒体可操作光盘,从而可使用通用的、市场上买得到的家用电器来观看这种数字图形簿,并且可在包括用户视听设备和计算机的各种家用电器上播放该数字图形簿。
更进一步,希望包含这种数字图形簿的多媒体可操作光盘可包括基于PC机的软件应用程序和/或数字图像,从而提供与PC机和家用电器都兼容的光盘。
创建多媒体的一些方法已经公开了,然而,参考文献的重点并不是创建多媒体数字图形簿。例如,美国专利5592602号(授予Edmunds等人)是指在创建多媒体期间操作屏幕对象的创建工具。美国专利5907704号(授予Gudmundson等人)是指创建交互式多媒体应用的系统。美国专利5515490号(授予Buchanan等人)是指用于多媒体文档的自动瞬时格式化(automatic temporal formatting)的系统和方法。
有一些软件应用程序可用个人计算机来创建多媒体。例如,在www.ulead.com描述了由Ulead Systems Incorporated所提出的UleadVideoStudio V5.0。该软件应用程序可使用户从包括数字视频、JPEG静止图像以及音频MP3和CD片段的各种输入源中创建诸如MPEG-2输出文件。然而,这个应用软件不能在光盘上自动记录输出文件,也不能从相同的输入文件中产生多个不同的输出文件。
因此,进一步需要有一种用于创建多媒体数字图形簿的系统和方法,该多媒体数字图形簿可在各种包括有用户视听设备和个人计算机的家用电器上播放。还需要有一种用于创建多媒体可操作光盘的系统和方法,该多媒体可操作光盘包括基于PC机的软件应用程序和/或与PC机相兼容的数字图像,并且还包括可在各种家用电器上播放的多媒体数字图形簿。
本发明的另一目的就是提供可在各种家用电器上播放的这样的多媒体图形簿。
本发明还有一个目的就是提供一种与PC机和各种家用电器都兼容的多媒体可操作光盘。
本发明的再一个目的就是提供一种多媒体的可操作光盘,该光盘包括基于PC机的软件应用程序和/或与PC机相兼容的数字图像,并且还包括可在各种家用电器上播放的多媒体数字图形簿。
仅通过说明性实施例的方式来表示出这些目的。这样,也可出现由所公开的本发明而通过内在关系实现的其他所希望的目的和优点,或者这些目的和优点对本领域普通技术人员来说变得显而易见。本发明由所附的权利要求书来限定。
根据本发明的一个方面,提出了一种用于在可记录光盘(recordableoptical disc)记录信息的方法。该方法包括选择多个数字静止图像的步骤、选择至少一个音频片段的步骤、将所述多个数字静止图像和音频片段编码为单一的MPEG位流的步骤、将多个数字静止图像中每个都编码为一个数字图像文件的步骤、以及在可记录光盘上记录所述的单一MPEG位流和多个数字图像文件的步骤。
根据本发明的另一个方面,提出了一种用于产生多媒体数字图形簿的方法,该方法包括以下步骤选择多媒体资源(multimedia material),多媒体资源包括音频数据库中的至少一个音频片段、图形数据库中的至少一个数字静止图形、以及视频数据库中的至少一个视频片段;下载多媒体资源;对多媒体资源进行向下采样(downsampling);提供用户附注资源;产生多媒体资源与用户附的资源的合成图像;对合成图像进行编码以提供MPEG文件;对数字静止图像编码以提供数字图像文件;创建包含MPEG文件和数字图像文件的光盘图像;以及创建包含光盘图像的多媒体可操作光盘。
本发明提出了一种用于创建多媒体图形簿的系统和方法,该多媒体图形簿可在包括用户视听设备和个人计算机的各种家用电器上播放。本发明还提出了一种用于创建多媒体可操作光盘的系统和方法,该光盘包括基于PC机的软件应用程序和/或数字图像,并且还包括可在各种家用电器上播放的多媒体数字图形簿。
图1a和图1b给出了根据本发明的方法的流程图;图2给出了根据本发明的系统;图3给出了当背景图像包含数字图形簿时根据本发明的方法的流程图;图4给出了当视频片段包含数字图形簿时,根据本发明的方法的流程图;图5给出了当视频片段被转换成另外一种代码时,根据本发明的方法的流程图;图6给出了光盘结构;图7给出了图7所示光盘结构的光道(track);图8给出了存储器,以此提供与图像CD兼容的目录结构;图9给出了根据本发明的方法的流程图,其中数字图形簿的多媒体资源包括多个图像、至少一个背景图像、至少一个音频片段、至少一个视频片段、至少一个文本的/图形的资源、以及至少一个由用户所作的附注;图10给出了MPEG编码器。
术语多媒体指包括或涉及多个介质。因此,多媒体资源包括多个介质资源,并且是用来提供具有丰富的和详尽的内容及介绍的数字图形簿,并使观看者在观看这样的数字图形簿时增加乐趣。这样的多媒体资源可包括(但并不局限于)图像、音频、视频、及其任一种组合。
本发明提出了一种用于创建多媒体图形簿的系统和方法,该多媒体图形簿可在包括用户视听设备和计算机的各种家用电器上播放。本发明还提出了一种用于创建多媒体可操作光盘的系统和方法,该光盘包括基于计算机(例如个人计算机)的内容以及多媒体数字图形簿。例如,基于计算机的光盘内容包括数字图形簿原始的图像/视频/音频(例如,数字图形簿的原始内容)。如果原始内容与数字图形簿位于同一光盘,则易于对原始内容进行共享、传送、观看、印刷、用于电子邮件、和/或用于网站。说明一下,在家用电器上观看了数字图形簿之后,观看者可能希望打印在数字图形簿中看到的一幅图像。如果原始内容位于光盘中,观看者就很容易利用该光盘以及个人计算机而得到所要的图像。
类似地,基于计算机的光盘内容可包括诸如计算机游戏这样的软件应用程序。这样,单个多媒体光盘既包含软件应用程序(用于在PC机上播放)又包含多媒体数字图形簿(用于在家用电器上播放)。
图1a和图1b给出了根据本发明的用于创建多媒体可操作光盘的方法的流程图,其中多媒体可操作光盘包括基于计算机的内容以及多媒体图形簿。如上所讨论的,基于计算机的内容可包括原始内容、数字图形簿中未使用的数字图像、和/或计算机应用程序。
对于图1a的流程图,基于计算机的光盘内容包括至少一个在多媒体图形簿中所使用的数字图像。在如图1a所示的步骤100,初始化该方法。选择多媒体资源(步骤102)以产生多媒体数字图形簿。一经选定,即利用MPEG编码器对所选多媒体资源进行编码(步骤104)。在步骤105,将多媒体资源中所使用的数字静止图像编码为数字图像文件,例如JPEG数字图像文件。创建多媒体可操作光盘(步骤106)。下面更详细地描述步骤100~106。
对于图1b所示流程图,基于计算机的光盘内容包括计算机应用程序。如图1b所示,在步骤100初始化该方法。选择多媒体资源(步骤102)。一经选定,即利用MPEG编码器对所选多媒体资源进行编码(步骤104)。在步骤107,选择计算机应用程序。创建多媒体可操作光盘(步骤106)。下面更详细地描述步骤100-107。
图2说明了根据本发明的系统10。系统10包括一个处理单元11以及一个与用户进行通信的输入设备12。最好输入设备12是一个显示器或者具有触摸屏接口的监视器,当然作为选择,用户也可使用键盘14或者其他的输入设备(诸如鼠标或者跟踪球)。系统10是一个独立系统或与网络13相连。另外,该系统可位于家内或者位于家外,例如在零售店、专业摄影工作室、或者其他的商业地点。如果位于家内,系统10可由一个家用个人计算机构成。如果位于家外,系统l0由诸如柯达图像制造商等等这样的信息站组成。如果与网络连接,该连接可置于处理单元11之内或之外。如希望可与互联网15连接,也可与其它系统19相连,例如可与照片洗印机或例如柯达图像制造商的信息站这样的其他系统19相连。多媒体资源包括数字图像、音频以及视频之中一种或数种的任意组合。因此,系统10包括一个输入端口16以提供/获得数字图像、音频和视频。输入端口16的例子包括CD驱动器、DVD-ROM驱动器、快擦写存储卡或者存储卡阅读器、软盘驱动器、话筒、以及类似设备。系统10进一步包括一个介质产生装置17以制造诸如CD/DVD记录器这样的可记录光盘,用以在步骤106创建多媒体可操作光盘。
现在参考图1a、1b以及图2,用于创建多媒体可操作光盘的方法在步骤100被初始化。该初始化包括在基于操作系统的图形用户接口(GUI)中开始创建应用程序。
在步骤102,选择包括多个数字静止图像的多种多媒体资源作为多媒体数字图形簿的组成部分。用于查找和选择数字图形资源的技术已经公开。申请人为Balogh等人,名称为“利用所制定的方案组标题和自然语言接口来产生、编档保存并检索数字图像(Generating,Archiving,and Retrieval of Digital Images with Evoked Suggestion-Set Captions andNatural Language interface)”的美国专利5493677号公开了利用例如英语这样的自然语言,对诸如数字化图片、艺术品、或者图解说明这样的图像进行编档保存和检索。
图2所示的图像18可由各种信息源提供。这样的图像可由数字照像机拍摄,亦即数字静止图像。另外,数字静止图像可从摄影胶片所拍摄的图像中获得,其中图像被印刷、扫描、并转换成数字格式。这种数字静止图像被存储在软盘、光盘、存储卡、或者快擦写存储卡上。系统10可利用输入端口16作为输入数字静止图像的装置。系统10的图像18包括一个图像数据库,该图像数据库包括特定主题的图像,例如来自婚礼、生日宴会、婴儿诞生、以及毕业典礼的场景。数据库还包括感兴趣的区域性图像,例如来自有名望的游览胜地、国家保护文物、国家公园、以及古迹的场景。进一步,图像可包括卡通人物、动画片、以及书画艺术。类似地,利用互联网、网络或者其他系统可从其他有用信息源中选择图像。
图像18的输入格式包括BMP、DCS、DIB、EXIF、FlashPix、IMPS、JPEG、JPEG2000、PhotoCD、PPM、TIFF、和Raw图像格式。
可能希望有背景图像。也就是说,类似于裱有壁纸的墙为该墙上所挂的照片镶边/配边框一样,希望有背景图像来为标题页、索引和/或其他图像镶边/配边框。与数字静止图像的输入格式相同,背景图像的输入格式包括BMP、DCS、DIB、EXIF、FlashPix、IMPS、JPEG、JPEG2000、PhotoCD、PPM、TIFF、和Raw图像格式。
还可包括图2中标识为音频20的音频资源。如同图像18,可从各种信息源中选择音频20。例如,根据本发明的系统包括音频数据库,该音频数据库具有与风俗照片不同的多个音频片段,例如轻音乐、古典乐、摇滚乐、以及特殊的主旋律,其中特殊的主旋律例如是适合婚礼、生日宴会、婴儿诞生、毕业典礼的音乐。系统10可利用输入端口16来提供允许输入数字格式音频的装置,例如存储卡、快擦写存储卡、或者类似设备。这样的输入设备允许用户提供个人的作曲合成。可通过互联网、网络或者其他系统从其他可用的信息源中选择音频资源。
除了音乐之外,音频数据库可包含声音片段。例如,引自著名小说、戏剧或者电影的话,以及像男、女演员和政治家这些有名人物的声音。用户可利用输入端口16提供个人声音片段。例如在输入端口16包括话筒时,即可记录个人声音片段。当用户希望利用数字照像机来注释他们的图像时即可使用该特性。同样,每个图像包括相关的语音文件(例如.way文件)。具有这个特性的多媒体数字图像簿导致类似于或具有放映带解说幻灯片的感觉。
音频的输入格式包括Wave文件、MP3、音乐CD音频、Apple/SGI格式(.AIFF,.AIF)、Sun音频(.AU),以及Creative Lab格式(.VOC)。
系统10还可包括视频资源。可从各种信息源中选择视频,该视频在图2中被标识为视频22。例如,根据本发明的系统10可包括一个视频数据库。该数据库可包括多个特定主题的视频片段,其例如可以是来自婚礼、生日宴会、婴儿诞生、毕业典礼的场景。可利用输入端口16从诸如软盘、存储卡、快擦写存储卡、或者类似设备中输入视频。这样的输入端口允许用户提供个人的影像作品。可利用互联网、网络或者其他系统而从其他可用的信息源中选择视频图像。
可将视频提供作为移动的背景,并伴之以或不伴之以音频。另外,视频可由多个静止的图像组成,并伴之以或不伴之以音频。
视频的输入格式包括MPEG-1、MPEG-2、MPEG-4、H.261、H.262、H.263、CCIR 601(数字视频标准)、AVI(MSWindows介质格式)、Quicktime、DV(来自数字式视频录像摄像机)、以及real视频(RealNetwork)。
本系统的另一特征就是包括注释装置24。也就是说,实时地对文本作注释的装置。该注释包括标题的一部分或者多媒体数字图形簿的图片说明。例如,对于语音输入,注释装置24包括扩音器以及一个内置的语音-正文引擎,其将语音转换成正文。这样的注释装置最好包括一个端口(例如键盘)以允许用户进行修正。
数据库(用于图形、音频、或者视频)可以是一个由库存图像或者私用数据库构成的现有数据库。库存数据库(stock database)通常要求用户支付版权费用来访问图形资源,并可能征收一基本的订阅费。
一旦在步骤102选择了多个多媒体资源,在步骤104利用MPEG编码器对所选择的多媒体资源进行编码,由此产生了多媒体数字图形簿,通过诸如VCD,SVCD或者DVD播放器这样的家电设备可观看多媒体数字图形簿。
图1a中,在步骤105,在步骤102所选择的数字静止图像(亦即作为多媒体资源的一部分)还被编码为单独的数字图像文件,例如作为JPEG文件。在步骤105对数字静止文件所进行的编码使得数字图像文件可以为计算机所使用。例如,可对这些文件进行观看、传送、和/或打印。最好是使数字静止图像继续保持为高分辨率图像,如同当图像最初为数字照像机所捕获的或者是由照片洗印机所第一次扫描的。因此,步骤105提供了基于计算机的光盘内容。
在图1b中,在步骤107获得基于计算机的光盘内容,在此步骤选择计算机应用程序。
MPEG(活动图像专家组)是负责定义各种视频规范的ISO委员会。众所周知来自MPEG的编码标准包括MEPG-1,MEPG-2,以及MEPG-4。
MEPG-1是一种音频-视频编码标准(ISO11172),用于低比特流速率下压缩数字视频。MEPG-2是为广播电视以及使用隔行扫描图像的其他应用而设计的。在1993年出版的ISO/IEC11172-2,MPEG-1视频国际标准中的“对移动图像和有关的音频进行编码使数字存储介质达到1.5Mb/s视频”以及1996年出版的ISO/IEC13818-2,MPEG-2视频国际标准中的“信息技术—对移动图像和有关的音频信息进行一般的编码视频”说明了上述这些MPEG标准。
如下面所讨论的,根据所要创建的多媒体可操作光盘来选择用于对多媒体资源进行编码的MPEG标准。
可利用软件编码应用程序或者硬件编码器仪表板实现MPEG编码。所选择的实现方法根据费用、速度以及图像质量而不同,因此所选实现方法取决于多媒体可操作光盘的要求。例如MPEG-1通常需要比MPEG-2少的计算机资源。随个人计算机性能的提高,近几年来软件编码变得非常流行。按所要求的编码标准(亦即每数秒钟时间内的静止图像),优先选用软件编码,因为其对实现而言可能更经济合算。
一经编码,即在步骤106创建多媒体可操作光盘。诸如用于CD-R以及DVD-可记录光盘的记录器/发生器是市场上买得到的设备,并且因此在图2中引用作为媒体创建装置17。可购买这样的装置用于家用。为了实现快速的写处理,优先选用高速的记录器(大于4X)。
在步骤106创建各种多媒体可操作光盘,例如,VCD(视频高密光盘),SVCD(超视频高密光盘),或DVD(数字化视频光盘)。可在用户视听设备上播放上述这些多媒体可操作光盘中的每一种。VCD是由VCD企业集团(包括菲利普、索尼、三菱以及JVC)所开发的,并且是基于MPEG-1编码的。SVCD则基于MPEG-2编码,而由中国信息产业部(MII)同VCD企业集团合作开发,且逐步发展为国际标准IEC 62107。DVD也基于MPEG-2编码,由DVD研究会开发,DVD研究会包括大约220个成员公司。VCD和SVCD都使用CD介质,但DVD使用DVD介质。VCD提供了352×240(NTSC)或352×288(PAL)的图像分辨率,并支持74分钟的视听内容。SVCD提供了480×480(NTSC)或者480×576(PAL)的图像分辨率,并且根据压缩的比特速率而可支持30~74分钟的视听内容。DVD提供了720×480(NTSC)或者720×576(PAL)的图像分辨率,并可支持133分钟的视听内容。
因此,当需要VCD时,创建VCD图像并烧制(burn)最后的VCD(利用媒体创建装置17),最好是连同预定的菜单一起完成。类似地,当需要SVCD时,创建SVCD图像并烧制最后的SVCD(利用媒体创建装置17),最好是连同预定义的菜单一起完成。同样,当需要DVD时,创建DVD图像并烧制最后的DVD(利用媒体创建装置17),最好是连同预定义的菜单一起完成。
如上所述,MPEG-1或者MPEG-2编码都优先取决于所需要的输出是否为VCD、SVCD或者DVD。例如,将MPEG-1用于VCD,而将MPEG-2用于SVCD或者DVD。
多媒体可操作光盘可包括多种多媒体资源,尤其是包括多种多媒体资源的组合。例如1)图像;无背景图像;无音频;无视频;2)图像;背景图像;无音频并且无视频;3)图像;无背景图像;无音频;视频;4)图像;无背景图像;音频;无视频;5)图像;无背景图像;音频;视频;以及6)图像;无背景图像;音频;视频;其中音频可仅由声音构成(例如每幅图像)、仅由音乐构成、或者由其组合构成。
对于本领域普通技术人员来说,其他组合都是公知的。根据为产生多媒体可操作光盘而选择的多媒体资源的组合,需要进一步的步骤以格式化/配置多媒体资源,从而提供优质的数字多媒体图形簿。
例如,如果需要背景图像,在步骤102所选择的任意图像(亦即选择的多媒体资源)必须在MPEG编码步骤之前与背景图像合成。图3给出了根据本发明的方法,该方法适用于多媒体数字图形簿包括背景图像的情况。如图3所示的,将该方法初始化(步骤100)并选择包括多个数字静止图像的多媒体资源(步骤102)。另外,也选择背景图像(步骤110)。在步骤112产生合成图像,合成图像包括多媒体资源以及背景图像。利用MPEG编码器对合成图像进行编码(步骤114),将多个数字静止图像中的每一个也编码为数字图像文件(步骤105),并且通过将MPEG编码的合成图像和数字图像文件记录在光盘上而产生多媒体可操作光盘(步骤106)。(当采用软件应用程序而不是数字静止图像时,以步骤107替换步骤105。)对于高分辨率的数字静止图像,可能必须在MPEG编码之前对数字静止图像进行向下采样。图4给出了根据本发明的方法,该方法适用于高分辨率的图像被用作多媒体数字图形簿的输入的情况。如图4所示,将该方法初始化(步骤100)并选择多媒体资源(步骤102),其包括选择多个数字静止图像。另外,确定所选数字静止图像是否需要向下采样(步骤120),以便提供一个合适大小的图像来并入MPEG比特流。如果需要,在对多媒体资源进行MPEG编码(步骤104)之前对数字静止图像进行向下采样(步骤122)。向下采样最好包括低通滤波后进行抽取(decimation)。将原始的高分辨率数字静止图像编码以为单独的高分辨率数字图像文件(步骤105)。通过将MPEG比特流和编码的数字图像文件记录在可记录光盘上而创建多媒体可操作光盘。(当采用软件应用程序而不是数字静止图像时,以步骤107替换步骤105。)另外,也提供了MPEG格式的视频,该视频被选择作为多媒体资源的一部分(步骤102),但是所选的视频分辨率可能与输出的MPEG比特流所要求的分辨率不匹配。在此情况下,利用视频代码转换器将视频转换成另外一种代码。图5给出了将视频代码转换器34结合在内的流程图。如图所示,不使视频通过MPEG编码器32,而使所选视频由介质合成单元30通过视频代码转换器34。一旦经过代码转换,则视频比特流和MPEG比特流重新结合,并连到比特流合成单元36而创建单个MPEG文件38,该文件可通过媒体创建装置17加以记录。
根据将被创建的多媒体可操作光盘,视频代码转换器34将输入的视频进行代码转换,成为具有合适分辨率和比特流速率的适当格式。例如,如果将被创建的多媒体可操作光盘是VCD,就要以每秒1.152兆比特的恒定比特流速率对MPEG-1视频进行编码,图像分辨率必须是29.97Hz时为352×240(NTSC),或者25Hz时为352×288(PAL)。同时,MPEG-1音频必须利用第2级编码方案(lay 2encoding scheme)以每秒224千比特的比特流速率进行编码。这些要求与基于MPEG-2编码的DVD不同。
不同的转换代码的技术已经在科学研究著作中公开。设计和实现视频代码转换器的参考文献包括IEEE trans.,视频技术的电路和系统(Circuits and Systems for Video Technology),1996年4月,第6卷,第191~199页,作者为Sun等人的“按比例压缩MPEG域比特流的体系结构(Archtecture for MPEG compressed domain bitstream scaling)”;信号处理图像通信(Signal ProcessingImage Communications),1996年9月,第8卷,第481~500页,作者为Keesman等人的“MPEG比特流的代码转换(Transcoding of MPEG bitstreams)”。
可能要连接(join)其他的MPEG文件(例如合并),以便为创建多媒体可操作光盘提供最终的MPEG文件。当要将若干个MPEG比特流包括进来,作为多媒体可操作光盘的一部分时,需要进行这样的连接。例如在多个数字图形簿合并为单个数字图形簿时,即在比特流合成单元34连续地合并MPEG比特流。然后利用媒体创建装置17而将单个的MPEG文件写入光盘结构单一的一个光道。另外,也可用多个MPEG文件来创建多媒体可操作光盘。在这种情况下,每一个MPEG文件被写入到光盘结构的单独光道。每一个光道与光盘中的单独事件或数字图形簿相对应。
最好将所述多媒体可操作光盘配置为标准压缩光盘,从而可像使用VCD、SVCD、或者DVD一样,在个人计算机上进行观看并加以控制。因此,对于VCD,在标准压缩光盘中包括具有高分辨率图像和其他软件应用程序(例如所提供的柯达图片CD)的标准CD-ROM文件结构,使得包含在MPEG比特流中的图像静止文件也可作为JPEG文件而被访问,从而可在个人计算机上对其进行观看并加以控制。
创建多媒体可操作光盘(步骤106)包括将标准的光盘-ROM结构写入到光盘中。例如,对于VCD而言,将标准的CD-ROM结构写入到可记录光盘中。对于DVD而言,则写入DVD-ROM结构。
编码为数字图像文件(最好是编码为JPEG数字图像文件)的高分辨率数字图像文件被写入到光盘结构(即图6所示的VCD光盘结构)的光道1。根据标准化光盘,光道1区域包括光盘信息区域、ISO9660(CD-ROM)文件结构、以及诸如图段播放条(Segment Play Item)区域这样的其他选项。在图7中更详细地说明了记录在光道1中的信息的分段。
如上所述,在步骤105对原始内容的静止图像所进行的编码使得能够实现数字图像文件,这种数字图像文件可为诸如个人计算机这样的各种家用电器、或图像编辑应用程序软件所使用。图8给出了示例,表明对于VCD而言,如何存储数字图像文件(亦即JPEG数字图像文件)和/或软件应用程序。图中表示了一个VCD的根目录结构。该目录提供了与目录结构相兼容的柯达图片CD。数字图像文件存储在图8所示的“图片”目录中。例如用于观看和编辑这些数字图像文件的其他软件应用程序被存储在例如“Coolstuf”目录或其他的图片CD目录中。其结果是,在步骤106所创建的多媒体可操作光盘提供了与光盘相兼容的柯达图片CD,因为包含在MPEG比特流中用于多媒体数字图形簿的数字静止图像也被独立地存储为与JPEG图像文件相兼容的图片CD。
另外,可存储其他的文件和软件应用程序以代替图片CD信息。
图9给出了根据本发明的方法的流程图,其中多媒体数字图形簿的资源包含多个图形、至少一个背景图像、至少一个音频片段、至少一个视频片段、至少一个文本/图形资源、以及至少一个由用户所作的附注。
如图9所示,在步骤201,对用于创建多媒体图形簿的方法进行初始化。该初始化包括在基于操作系统的图形用户接口(GUI)中开始创建应用程序。在步骤202,用户利用输入装置12或者键盘14来选择包含在多媒体数字图形中的多个数字图像。在步骤204,用户利用输入装置12或者键盘14来选择背景图像。类似地,用户选择一个或多个音频片段(步骤206)、一个或多个视频片段(步骤208)、以及至少一个文本的或者图形的图像(步骤210)。随后系统10对包括背景图像、文本/图形图像、以及视频片段的多个图像进行向下采样(步骤212)。在步骤214,系统10对多个经过向下采样的数字图像、背景图像、以及文本/图形图像进行合成并排序,从而产生第一合成视频信息。如果要包括经过注释的资源,则用户利用例如利用话筒或者文本输入的注释装置24来输入经过注释的资源(步骤216)。系统10利用MPEG1编码器来对带有音频片段以及作了注释的资源的第一合成视频信息进行编码,从而产生第一编码比特流(步骤218)。在步骤220,如果视频片段不是MPEG格式,系统10即对该视频片段进行代码转换,从而产生第二编码比特流。系统10随后将第一编码比特流与第二编码比特流进行合成,从而产生第三编码比特流(步骤222)。如果要构造另一个事件或数字图形簿(步骤223),重复步骤202至222。如果不需构造另外的事件/数字图形簿,在步骤224选择基于计算机的内容。如果所选内容是数字静止图像,在步骤224将这些图像编码成数字图像文件。在步骤225,确定计算机-ROM文件结构。在步骤226,系统10创建多媒体可操作光盘,该光盘包括有计算机-ROM文件结构,基于计算机的内容,以及最终的MPEG比特流(其可以是步骤222的第三编码比特流,或者是多个比特流——如果在步骤223构造了多个事件/数字图形簿的话)。
图10更加详细地描述了MPEG编码器32。如图11所示,MPEG编码器32由三部分组成1)视频编码器;2)音频编码器;以及3)系统多路复用器。编码步骤包括按照帧的连续序列而将帧内的图像/视频序列输入到视频编码器,并将与图像/视频序列相对应的音频数据输入到音频编码器。因此,音频最好依次与图像相对应。来自介质部分30的参数文件也被发送到编码器32,参数文件例如表示输入序列中每一个数字静止图像的播放过程。编码的视频和音频比特流随后经多路复用而形成与MPEG系统比特流相一致的ISO/IEC 11171。
在进行MPEG-1和MPEG-2视频编码时,每一视频帧被划分成一系列宏模块,每一个宏模块其大小是16×16个象素并有4个Y(亮度)模块,U和V(颜色信息)各有1个模块。因此,颜色信息具有亮度信息一半的水平分辨率和垂直分辨率。对于用于视频CD的受约束参数(constrained parameter)系统,每帧最多有396个宏模块。最好是利用离散余弦变换编码(DCT)和运动补偿来对每一个宏模块的Y、U以及V信息进行压缩。
可将索引和标题页包含在所述多媒体数字图形簿中。这可通过首先选择标题/索引页背景图像、再输入描述多媒体数字图形簿的文字或者输入用以标识每个所创建MPEG文件(光道)的标题的文本来实现。
在数字图像文件中编码的数字静止图像(步骤105)不必与在步骤102所选择的作为多媒体资源一部分的数字静止图像相同。相反,图像或包括基于计算机内容的多个图像可以是与数字图形簿中所采用的任一图像不同的一个图像或多个独立图像。因此,提供光盘的方法即包括以下步骤选择第一组多个数字静止图像;选择音频片段;将该第一组多个数字静止文件以及音频片段编码为单独的MPEG比特流;选择第二组多个数字静止图像;将该第二组多个数字静止文件编码为数字图像文件,所述多个数字图像文件中的每一个都是JPEG文件;以及将单独的MPEG比特流和多个数字图形文件记录到光盘上。
这样,本发明公开了一种系统和一种方法,用以有效地创建并提供包括多媒体资源的数字图形簿。除了个人计算机外,由本发明所创建的多媒体可操作光盘还可在诸如VCD播放器、SVCD播放器、以及DVD播放器这样的家用电器上显示和播放。本发明的特征包括(1)自动地操作用户所选择的输入;(2)易于使视听信息与图形资源相联系以创建多媒体数字图形簿;(3)利用诸如VCD、SVCD、以及DVD播放器这样的用户视听设备来观看,同时保持与计算机的兼容性;(4)通过与现有计算机文件结构相结合,易于结合现有的图片产品(例如伊思曼柯达公司的图片CD);(5)易于并入冲洗胶卷处理;以及(6)可利用数字照像机所捕获的用户音频。
本发明提供了一个用以全面提高数字图像的艺术影像的装置。多媒体图形簿的有效创建使得可在诸如VCD、SVCD以及DVD播放器这样普及的家用电器上实现回放。在为用户创建多媒体可操作的柯达图片CD过程中可使用本方法和系统。本方法和系统极大的提高了当前所用柯达图片CD的价值,因为其对于在用户的起居室(而不是PC机上)观看数字化图片提供了另一个路径和新的经验。
权利要求
1.用于在可记录光盘(recordable optical disc)上记录信息的方法,包括选择多个数字静止文件;选择音频片段;将所述多个数字静止图像和音频片段编码为单一的MPEG比特流;将所述多个数字静止图像中每一个编码为数字图像文件;以及在可记录光盘上记录所述单一的MPEG比特流和多个数字图像文件。
2.如权利要求1的方法,其中所述多个数字图像文件中的每一个都是JPEG文件。
3.如权利要求1的方法,进一步包括步骤选择软件应用程序;以及在可记录光盘上记录该软件应用程序。
4.如权利要求1的方法,进一步包括步骤选择计算机文件结构;以及在可记录光盘上记录该计算机文件结构。
5.用于产生多媒体可操作光盘的方法,包括步骤a)选择多媒体资源(multimedia material),该多媒体资源包括音频数据库中的至少一个音频片段,图形数据库中的至少一个数字静止图形,以及视频数据库中的至少一个视频片段;b)下载该多媒体资源;c)对该多媒体资源进行向下采样(downsampling);d)提供用户注释的资源(user annotated material);e)产生所述多媒体资源与用户注释的资源的合成图像;f)对该合成图像进行编码以提供一个MPEG文件;g)对所述数字静止图像编码以提供一个数字图像文件;h)创建包含有所述MPEG文件和数字图像文件的光盘图像;以及i)创建包含有该光盘图像的多媒体可操作光盘。
6.一种用于产生可记录光盘的系统,包括用于选择多个数字静止图像的装置;用于选择音频片段的装置;用于将所述多个数字静止图像和音频片段编码为单一的MPEG比特流,从而产生数字图形簿的装置;用于将所述多个数字静止图像中的每一个编码为数字图像文件的装置;以及用于在可记录光盘上记录所述单一的MPEG比特流和多个数字图像文件的装置。
7.一种用于产生多媒体可操作光盘的系统,包括步骤用于选择多媒体资源的装置,该多媒体资源包括音频数据库中的至少一个音频片段、图形数据库中的至少一个数字静止图形、以及视频数据库中的至少一个视频片段;用于下载该多媒体资源的装置;用于对该多媒体资源进行向下采样的装置;用于提供用户注释的资源的装置;用于产生所述多媒体资源与用户附注的资源的合成图像的装置;用于对该合成图像进行编码以提供一个MPEG文件的装置;用于对所述数字静止图像进行编码以提供一个数字图像文件的装置;用于创建包含有所述MPEG文件和数字图像文件的光盘图像的装置;以及用于创建包含有所述光盘图像的多媒体可操作光盘的装置。
8.一种其上具有记录的信息的可记录光盘,该记录的信息包括至少一个MPEG比特流,其将多个数字静止图像编码为一个多媒体数字图形簿;以及多个数字图像文件,每一个所述数字图像文件都对所述多个静止图像中的每一个进行了编码。
9.一种用于提供多媒体可操作光盘的方法,包括选择第一组多个数字静止图像;选择音频片段;将所述第一组多个数字静止文件以及音频片段编码为单一的MPEG比特流;选择第二组多个数字静止图像;将所述第二组多个数字静止文件编码为数字图像文件,该多个数字图像文件中的每一个都是JPEG文件;以及将所述单一的MPEG比特流和多个数字图形文件记录到光盘上。
10.一种用于提供多媒体可操作光盘的方法,包括选择第一组多个数字静止图像;选择音频片段;将所述第一组多个数字静止文件以及音频片段编码为单一的MPEG比特流;选择软件应用程序;以及将所述单一的MPEG比特流和软件应用程序记录到光盘上。
全文摘要
一种将信息记录到可记录光盘以提供多媒体可操作光盘的系统和方法。所述方法包括选择多个数字静止文件的步骤;选择至少一个音频片段的步骤;将多个数字静止图像和音频片段编码为单一的MPEG比特流的步骤;将多个数字静止图像的每一个编码为数字图像文件的步骤;以及在可记录光盘上记录单一的MPEG比特流和多个数字图像文件的步骤。
文档编号H04N1/00GK1392729SQ02122498
公开日2003年1月22日 申请日期2002年6月4日 优先权日2001年6月20日
发明者A·C·路易, D·R·科克, Y·洛 申请人:伊斯曼柯达公司