用于分析一个图象中的字幕的方法和设备的制作方法

文档序号：7598217阅读：203来源：国知局

专利名称：用于分析一个图象中的字幕的方法和设备的制作方法
技术领域：
本发明涉及经改进的数据处理系统，并特别涉及用于处理数据的方法和设备。具体而言，本发明涉及用于处理视频数据的方法、设备和计算机指令。
背景技术：
个人录像机(PVR)正越来越受到消费者的青睐。该设备也被称为数字录像机(DVR)，允许用户在录制新的节目的同时，回放已经录制的节目。在有些情况下，用户可以一边在一个频道进行收看实况转播，一边从另一个频道录制节目。并且，用户也能在收看实况转播的同时暂停或重放录制的节目。在通常情况下，PVR通过与有线或卫星接收系统相连，来接收数字视频和音频内容。与盒式磁带录像机相同，PVR也允许节目的时移，但它还拥有其他一些特点，如录制一个节目的所有剧集。该系统包括一个用来存储节目的硬盘驱动器。
PVR同时还提供了多种特性，如通过网络与其他PVR共享录制的节目，存储数码照片，存储MP3文件。但PVR缺乏滤除不良内容的功能。某些情况下，用户希望观看节目，同时希望滤除节目中的不良内容，目前的PVR尚未提供该项特性。
因此，提供用于管理PVR上的节目的改良方法、设备和计算机指令是非常有利的。

发明内容
本发明提供用于处理视频数据的方法、设备和计算机指令。多媒体节目数据中字幕的文本被标识来生成一组文本。对该组文本进行分析以创建一个分析。根据该分析需要进行修改的视频片段被标识来形成一个标识的视频片段，并且这个标识的视频片段被改变。另外，还可进行颜色校正，以提高字幕文本的清晰度。

在附录中列出了本发明突出的创新性特点。然而，当结合附图进行阅读时，通过参照图示实施例的详细说明能够最好地理解本发明本身，以及最佳实施方式、目标和优势，其中图1是在其中可以实施本发明的数据处理系统的示意图；图2是根据本发明的一个优选实施例的用于过滤多媒体节目的程序流程图；图3是根据本发明的一个优选实施例的用于执行字幕颜色校正的程序流程图。
具体实施例方式
下面参照附图(特别参照附图1)对可在其中实现本发明的数据处理系统进行描述。数据处理系统100以个人录像机(PVR)为例，它也可被称作数字录像机(DVR)。根据图示，数据处理系统100中的元件通过总线系统102互联。
数据处理系统100包括处理单元104、存储器106、音频单元108、视频单元110、通信单元112、存储设备114和字幕和视频分析单元116。存储器106包含由处理单元104执行的用来提供各种PVR功能的指令。这些功能包括例如，节目的录制、节目播放分析要处理的图像、以及管理可存储在数据处理系统100中的节目等。
音频单元108包括用于从输入端口接收音频信号，并输出音频的元件。这些元件包括例如，一个音频模数转换器(ADC)和一个音频数模转换器(DAC)等。视频单元110用于接收视频信号，并在数据处理系统100中输出视频。视频单元110包括一个视听(AV)编码器/解码器(编码译码器)。视频单元110能够输出视频信号以在显示器上进行显示，例如与数据处理系统100相连的显示器118上。
根据特定的实施方案，音频单元108和视频单元110中的元件可作为硬件元件被敷设到处理单元104中。通信单元112提供一个连接，用于接收多媒体节目。在本实例中，一个多媒体节目包括视频和音频数据。多媒体节目亦可包含闭路标题数据，如字幕等。这些字幕根据用户喜好可以显示，也可以不显示。多媒体节目的实例包括电视节目、电影和音乐视频。这些多媒体节目可以通过连接通信单元112至各种程序设计资源(如通过因特网、电缆网或卫星)获得。
存储设备114提供了一个位置用于存储多媒体节目。字幕和视频分析单元116提供一种用来分析多媒体节目字幕中的文本，并标识这些程序的特定片段是否应该被静音、成为空白或被完全删除的机构。通过这种方式，用户就能够观看到不含不良内容的多媒体节目。
字幕和视频分析单元116能够解码用于处理的多媒体节目的视频部分。在视频流中，字幕信息一般位于一个与视频数据分离的信道中。如果用户希望观看字幕，字幕信息就在视频适配器或显示单元的帧缓存区中被叠加到视频图象上。该字幕亦被称为该视频的一个闭路标题部分。
字幕中的文本被标识。根据具体方案不同，文本能够通过多种方式标识。在图例中，针对进行字幕输出的视频图象的闭路标题部分执行光学文字标识。从该处理中得到的文本将被输入到过滤器中，以标识多媒体节目中的不良部分。
在这些实例中，过滤操作采用在字幕和视频分析单元16中实现的baysean过滤器进行。Baysean过滤器目前被用于过滤电子邮件信息中的垃圾邮件(SPAM)。该类过滤器适用于评定多媒体节目的不同部分的级别。使用baysean过滤器，可采用baysean推论，即如果在一个场景中字幕或者多媒体节目的片段中要显示的文本经常出现在一个PG级电影中，而很少出现在一个G级电影中，则该多媒体节目片段的文本通常被评定为PG级。如果观看喜好被设定为G级多媒体节目，那么特定的场景将被修改或审查。该段视频图象将被刷白、静音、或被同时刷白和静音。
在这些实例中，一个视频图象片段是指在视频图象中显示字幕的某一部分。当显示新的字幕时，将遇到一个新的多媒体节目片段。
多媒体节目过滤用信息可以由数据处理系统100的用户配置。可以创建用于不同电影级别(如G，PG，PG-13和R级)的默认文件设置。这些默认文件可被存储在存储设备114中。另外，供在baysean过滤器中使用的用户提供文件也被存储在存储设备114中。该用户文件可有各种来源。例如一个包含baysean过滤功能的电子邮件公共程序可被用作一个来源。用于过滤SPAM邮件的文件可被下载到数据处理系统100中。当然，任何外部信源可被用于该文件。
此外，字幕和视频分析单元116亦可用于对视频图象进行修改，以提高字幕的清晰度。这些修改包括颜色校正，以调节屏幕上显示字幕的部分的颜色或调整字幕文本的显示。例如，如果文本颜色与背景颜色相近，可使用不同于背景颜色的颜色来描画组成字幕的文字的轮廓。另外，也可以改变字幕显示区域的背景颜色来提供针对更佳的字幕清晰度的对比度。
在这些实例中，字幕和视频分析单元116能够以多种形式实现。例如，该视频单元能够实现为一个具有合适的特定用途集成电路(ASIC)和指令的独立处理单元，以执行本发明图例中的功能。或者，字幕和视频分析单元116可包含由处理单元104执行的指令，来提供这些功能。
在这些实例中，数据处理系统100采用PVR形式。该图示并非表示关于在其中可实现本发明的机构的本发明的体系结构限制。数据处理系统100亦可采用具有软件的计算机和适当的适配器卡来实现，以允许使用PVR中的功能对多媒体节目进行接收和处理。
采用这种方式，本发明的机构具备过滤多媒体节目各部分的能力。虽然一个多媒体节目可能整个被定为不良级别，但该节目也可在滤除其中的不良片段后进行观看。可对其进行静音、画面刷白或同时进行上述两种操作。
现在来看图2，根据本发明的优选实施例描述用于过滤节目的程序流程图。图2中所示的程序能够在过滤系统，例如图1中的字幕和视频分析单元116中实现。
该处理以对多媒体节目进行解码(步骤200)为开始。在这些实例中，视频流以MPEG2、MPEG3或JPEG等格式被接收。在这些多媒体文件中，音频和视频信道被分离为不同的信道。
包含字幕的闭路标题部分在不同于音频和视频的另一信道中。如需要，闭路标题部分能够被叠加到视频上以显示字幕信息。
该数据的解码可通过使用处理单元，例如图1中处理单元104等元件中的编码/解码处理器进行。根据具体方案不同，编码和解码可实现为如实例或硬件所述，例如包含编码和解码功能的逻辑。
选择一个经过解码的多媒体节目数据的片段(步骤202)。在这些示例中，多媒体节目数据中的数据片段被定义为多个帧。视频数据通常按每个片段30帧来进行显示。
接着，对多媒体节目数据的一个片段进行光学文字标识，以从用于那个片段数据的闭路标题部分中的字幕中获得文本(步骤204)。该文本将被输送到baysean和滤除算法(步骤206)。然后可获得评级(步骤208)。将该片段的评级结果与用户选定的喜好相比较(步骤210)。该喜好可以是电影评级，例如PG-13或R级。
对照用户选定的喜好(步骤212)来判定该片段是否恰当。例如，如果用户选定级别PG-13为恰当，并且根据对片段中文本的过滤标识结果，该片段被评定为R级，则该片段将被判定为不恰当。如果该片段被判定为不恰当，某些音频或视频的组合将被刷白画面或静音(步骤214)。虽然只对某个片段进行处理，但实际上步骤214能够对该片段中的每一个帧进行刷白画面或静音处理。经过修改的多媒体节目数据被存储(步骤216)。
接着，将判定是否有更多未经处理的片段(步骤218)。如果存在更多未经处理的片段，处理将返回到步骤202。否则，多媒体节目数据被重新编码(步骤220)，并且在处理结束后保存经过处理的多媒体节目(步骤222)。
在图2的图例中，对片段进行了处理。当然，根据具体方案的不同，处理也可以逐帧地进行。另外，如果编码和解码功能以硬件方式实现，那么其他功能、例如baysean过滤器和帧缓冲器也可位于相同的硬件单元中。
往下翻到图3，是根据本发明的一个优选实施例的字幕颜色校正的程序流程图。图3中所示的处理可在过滤系统，例如图1中的字幕和视频分析单元116中实现。
该处理以对多媒体节目进行解码(步骤300)为开始。在这些实例中，多媒体节目中的视频部分保持不变。解码信息被存储(步骤302)。选择多媒体节目中经解码的视频数据的一个片段进行处理(步骤304)。判定该片段是否需要进行颜色校正，以增强所选定片段中字幕的清晰度(步骤306)。根据方案的不同，步骤306可确定字幕中的文本是否需要被屏蔽或变模糊。执行该步骤可以屏蔽坏的或不良的语言。如需要校正，执行颜色校正(步骤308)。根据方案不同，所执行的具体的颜色校正类型各异。例如，可改变文本的背景，以增强文本相对于背景的对比度。
然后，确定在视频数据中是否有更多未经处理的片段(步骤310)。如果存在更多未经处理的片段，则处理将返回到步骤304。否则，数据被重新编码(步骤312)，且在处理结束后保存经处理的多媒体节目以备将来的回放(步骤314)。再次参照步骤306，如果不需要执行颜色校正，则处理将如前所述前进到步骤310。
因此，本发明提供了用于多媒体节目过滤的改良方法、设备和计算机指令。图例中所列的本发明的机构允许在保持其它部分不变的情况下，根据用户的个人喜好对多媒体节目的某些部分或片段进行修改。在示例中，这些修改包括刷白视频图象片段中的画面，消除该片段的声音，或同时消除该片段的声音或画面。
需要重点提出的是，虽然在上下文中全部以功能性的数据处理系统对本发明进行了描述，但本领域的普通技术人员应当理解，本发明的过程能够以计算机可读介质指令的形式和多种形式散布，并且本发明能够等效地应用而与实际用于执行散布的信号承载介质的特定类型无关。计算机可读介质的实例包括可记录型介质，例如软盘、硬磁盘驱动器、RAM、CD-ROM、DVD-ROM和传输型介质，例如使用如无线电频率和光波传输等传输形式的数字和模拟通信链路、有线或无线通信链路。计算机可读介质可采用这样的编码格式，即解码后可用于特定数据处理系统的实际应用。
本发明说明书的提出目的在于给出例图和说明，并非在于详尽介绍或限于本发明散布时的状态。对于本领域内的一般技术人员而言，许多改进和变化将是非常明显的。选择本实施例并对其描述，其目的在于对本发明的原理、实际应用进行最佳说明，并使其他本领域内一般技术人员能够理解本发明可应用于施以各种改进的不同实施例，就如适用于所期望的特殊用途。
权利要求
1.一种数据处理系统中用于处理多媒体节目数据的方法，该方法包括标识多媒体节目数据中字幕中的文本，以生成一组文本；对该组文本进行分析以形成一个分析；基于该分析，标识应该进行修改的多媒体节目数据的部分来形成一个标识部分；以及修改该标识部分。
2.权利要求1的方法，其中该标识步骤包括针对多媒体节目数据中的字幕执行光学文字标识，以生成一组文本。
3.权利要求1的方法，其中该多媒体节目数据部分包括视频部分和音频部分，并且通过使视频部分或音频部分中的至少一个为空来修改该标识部分。
4.权利要求1的方法，其中该分析步骤包括对该组文本执行baysean过滤。
5.权利要求1的方法，进一步包括在开始执行步骤前，对该多媒体节目数据进行解码；以及在修改该标识部分后，对该多媒体节目数据进行重新编码。
6.权利要求1的方法，其中该多媒体节目数据的该部分为一帧或一组帧。
7.权利要求1的方法，其中多媒体节目为电影。
8.一种数据处理系统中用来处理多媒体节目的方法，该方法包括对多媒体节目解码，以形成解码的多媒体节目数据；分析该多媒体节目数据的一部分；确定该部分多媒体节目数据中字幕的清晰度是否需要提高；以及响应该部分多媒体节目数据中字幕的清晰度需要提高的情况，针对该多媒体节目数据中包含清晰度需要提高的字幕的一部分执行颜色校正，以提高该字幕的清晰度。
9.一种用于处理多媒体节目数据的数据处理系统，该数据处理系统包括标识装置，用于标识多媒体节目数据中字幕中的文本，以生成一组文本；分析装置，用于对该组文本进行分析以形成一个分析；标识装置，用于根据该分析，标识应进行修改的多媒体节目数据的一部分以形成一个标识部分；以及修改装置，用于修改该标识部分。
10.权利要求9的数据处理系统，其中该多媒体节目数据部分包括视频部分和音频部分，并且通过使视频部分或音频部分中的至少一个为空来修改该标识部分。
11.权利要求9的数据处理系统，其中该分析装置包括执行装置，用于对该组文本进行baysean过滤。
12.权利要求9的数据处理系统进一步包括解码装置，用于在开始执行步骤前，对多媒体节目数据进行解码；以及重新编码装置，用于在修改该标识部分后，对该多媒体节目数据进行重新编码。
13.权利要求9的数据处理系统，其中该部分多媒体节目数据为一帧或一组帧。
14.一种用于处理多媒体节目的数据处理系统，该数据处理系统包括解码装置，用于对多媒体节目解码，以形成解码的多媒体节目数据；分析装置，用于分析该多媒体节目数据的一部分；测定装置，用于确定该部分多媒体节目数据中字幕的清晰度是否需要提高；并且执行装置，用于响应该部分多媒体节目数据中字幕的清晰度需要提高的情况，针对该多媒体节目数据中包含清晰度需要提高的字幕的部分执行颜色校正，以提高该字幕的清晰度。
15.一种用于处理多媒体节目数据的、计算机可读介质中的计算机程序产品，其中计算机程序产品包括第一指令，用于标识多媒体节目数据中的文本，以生成一组文本；第二指令，用于分析该组文本以形成一个分析；第三指令，用于基于该分析，标识应进行修改的多媒体节目数据的一部分以形成一个标识部分；并且第四指令，用于修改该标识部分。
16.权利要求15的计算机程序产品，其中该多媒体节目数据部分包括视频部分和音频部分，并且通过使视频部分或音频部分中的至少一个为空来修改该标识部分。
17.权利要求15的计算机程序产品，其中第二指令包括用于对该组文本执行baysean过滤的子指令。
18.权利要求15的计算机程序产品，进一步包括用于在开始执行步骤前，解码该多媒体节目数据的第五指令；以及用于在修改该标识部分后，重新解码该多媒体节目数据的第六指令。
19.权利要求15的计算机程序产品，其中该部分多媒体节目数据为一帧或一组帧。
20.用于处理多媒体节目数据的、计算机可读介质中的计算机程序产品，该计算机程序产品包括用于解码多媒体节目以形成解码的多媒体节目数据的第一指令；用于分析该多媒体节目数据的一部分的第二指令；用于确定该部分多媒体节目数据中字幕的清晰度是否需要提高的第三指令；以及响应该部分多媒体节目数据中字幕的清晰度需要提高，针对该多媒体节目数据中包含清晰度需要提高的字幕的部分执行颜色校正，来提高该字幕的清晰度的第四指令。
21.一种数据处理系统，包括一个总线系统；一个与该总线系统连接的通信单元；一个与该总线系统连接的存储器，其中该存储器包括一组指令；一个与该总线系统连接的处理单元，其中该处理单元执行该组指令以标识多媒体节目数据中字幕中的文本，以生成一组文本；对该组文本进行分析以形成一个分析；根据该分析，标识应进行修改的多媒体节目数据的一部分以形成一个标识部分；以及修改该标识部分。
22.一种数据处理系统，包括一个总线系统；一个与该总线系统连接的通信单元；一个与该总线系统连接的存储器，其中该存储器包括一组指令；以及一个与该总线系统连接的处理单元，其中该处理单元执行该组指令以解码多媒体节目来形成解码的多媒体节目数据；分析该多媒体节目数据的一部分；确定该部分多媒体节目数据中字幕的清晰度是否需要提高；并且响应该部分多媒体节目数据中字幕清晰度需要提高的情况，针对该多媒体节目数据中包含清晰度需要提高的字幕的部分执行颜色校正，以提高字幕的清晰度。
全文摘要
本发明提供了用于分析一个图象中的字幕的方法和设备。多媒体节目数据中字幕中的文本被标识以生成一组文本。对该组文本进行分析以形成一个分析。根据该分析标识需要进行修改的视频片段来形成一个标识的视频片段，并修改这个标识的片段。另外，还可进行颜色校正，以提高字幕中文本的清晰度。
文档编号H04N5/445GK1604624SQ200410082430
公开日2005年4月6日申请日期2004年9月21日优先权日2003年9月30日
发明者珍尼斯·玛丽·吉罗亚德, 马克·约瑟夫·哈姆兹, 埃米莉·简·拉特里夫申请人:国际商业机器公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：珍尼斯.玛丽.吉罗亚德;马克.约瑟夫.哈姆兹;埃米莉.简.拉特里夫
技术所有人：国际商业机器公司
我是此专利的发明人

上一篇：管理交付服务指令的系统和方法
上一篇：建立协作通信的方法和系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。