用于dv视频中进行章节标记和标题边界插入的方法和系统的制作方法

文档序号:6756091阅读:308来源:国知局

专利名称::用于dv视频中进行章节标记和标题边界插入的方法和系统的制作方法
技术领域
:本发明涉及一种用于从来源于第二介质(诸如数字视频磁带)的数据流获得第一介质(诸如DVD)上的数据记录(诸如(数字)视频记录)的方法,所述数据流包括多个数据段或场景,每个数据段或场景均具有不同的记录开始时间。所述方法包括根据对当前记录段的持续时间的确定来产生在第一介质上的数据记录的记录段。依照进一步方面,本发明涉及一种用于从来源于第二介质的数据流获得第一介质上的数据记录的记录系统,所述数据流包括多个数据段,每个数据段均具有不同的记录开始时间,所述记录系统包括输入装置,用于接收来自所述第二介质的数据流,输出装置,用于把所述数据记录存储在所述第一介质上,和连接到所述输入装置和输出装置的处理装置,所述处理装置被配置成根据对当前记录段的持续时间的确定来产生在所述第一介质上的数据记录的记录段。
背景技术
:美国专利申请US2002/0168181描述了一种用于数字视频捕获的方法和设备。视频记录根据准则集被拆分成几个文件。所述准则包括检测视频场景的改变以及视频记录的持续时间。当借助图像处理技术而检测到视频场景改变时,假定新的场景(不同的事件)开始,从而产生新的文件。作为选择,当场景花费太长时间并且没有检测到场景改变时,也开始产生新的文件。此方法和设备具有以下缺点,每个场景改变会导致产生新的文件,这可能会导致来源于单个记录的相当大量的独立文件。
发明内容本发明设法提供一种改进的加索引方法和系统,特别适于对视频数据的记录。依照本发明的第一方面,提供了一种依照在上面前序所定义的方法,其中当记录时间间断性超过阈值时,产生新的记录段,所述记录时间间断性是在第一数据段的记录结束时间和下一数据段的记录开始时间之间的差异。通过只有当记录时间间断性超过阈值时才开始新的数据段,可以在数据记录中提供高效的索引标记插入,并且防止了太多的索引标记插入。在数字视频中,使用诸如章节标记之类的索引标记来表明新数据段的开始。本发明可以依照两种方式来执行,‘即时(onthefly)’和“预扫描”。当在‘即时’实施例使用本发明时,不知道还要记录什么数据(记录时间、场景改变次数等)。在进一步的实施例中,使用‘即时候选方式’,阈值是取决于所想要的记录段持续时间和当前记录段持续时间的函数。通过恰当地选择阈值函数,其中所述阈值是预定义的时间函数,即使当所要记录的数据属性是未知的(‘即时’),也可以防止太多的索引标记插入。在本方法的实施例中,通过把第一类型的索引标记插入在第一介质上的数据记录中来产生新的记录段。在数字视频记录应用中,第一类型的索引标记被称作章节标记。在数字视频处理中添加索引标记是简单的操作,其在数据处理中并不要求许多资源。在进一步的实施例中,阈值函数是连续降低的时间函数。所述函数可以是线性的、二次的、指数的或其它类型的降低函数。这使得在当前数据段长度增加时能够降低阈值,因而操纵把索引标记插入在鉴于原始场景的逻辑位置中,同时获得全局上相同长度的数据段。作为示例性实施例,阈值函数包括两个线性时间函数的组合th(t)=th0-a1*(t-C*d),对于t<(C+0.5)*d;th(t)=th1-a2*(t-(C+1)*d),对于(C+0.5)*d<t<(C+1.5)*d;th(t)=0,对于t>(C+1.5*d),其中C是第一类型的索引标记的计数,a1是第一线性系数,并且a2是第二线性系数。此函数试图在固定时间间隔C*d获得索引标记插入,但是也允许或早或迟一些的插入,这取决于记录时间间断性。在更进一步的实施例中,特别适于‘预扫描’的候选方式,所述方法还包括预扫描数据流以便获得在所述数据流中的记录时间间断性。通过在开始实际记录之前就知道数据流的间断性的数目,可以依照逻辑且高效的方式来选择索引标记插入的数目和位置。可以从所有检测到记录时间间断性中选择记录时间间断性的子集作为新段的开始点,为此使CMIps的值最小化。参数CMIps由下式给出CMIps=C·(1-coverage)+I·imbalance其中coverage=ΣcdeltacΣsdeltas]]>是数据记录的覆盖coverage属性,其中deltac=在记录段c的记录开始时间和前一记录段c的记录结束时间之间的差异;deltas=在数据段s的记录开始时间和前一数据段s的记录结束时间之间的差异;并且imbalance=Σc|durc-avrdur|]]>是数据记录的不平衡imbalance属性,其中avrdur=预定义的平均记录段持续时间;durc=记录段c的持续时间;并且C=用于coverage属性的预定义的恒定权重因数;I=用于imbalance属性的预定义的恒定权重因数。目的在于获得尽可能接近于零的不平衡值,以及尽可能接近于一的覆盖值。在本发明的进一步实施例中,所述方法还包括根据预定的准则集来把所选择的第一类型的索引标记转换为第二类型的索引标记,所述第二类型的索引标记被称作数字视频记录中的标题边界。第二类型的索引标记可以被记录在DVD的内容表(tableofcontentTOC)中,因而能够选择标题边界以便开始播放该部分数据记录。把第一类型的索引标记改变为第二类型的索引标记是简单且高效的操作。依照进一步的方面,本发明涉及一种如前序所定义的记录系统,其中处理装置还被配置成当记录时间间断性超过阈值时产生新的记录段,记录时间间断性是在第一数据段的记录结束时间和下一数据段的记录开始时间之间的差异,其中所述阈值是根据所想要的记录段持续时间和当前记录段持续时间的函数。处理装置还可以被配置成执行本方法的活动。依照本发明的记录系统提供了与上面相对于本方法所描述的优点相关联的优点。依照更进一步方面,本发明涉及一种诸如CD-ROM或其它数据载体之类的计算机程序产品,用于从来源于第二介质的数据流获得第一介质上的数据记录,所述计算机程序产品包括计算机可执行代码,所述计算机可执行代码当被计算机系统加载时向所述计算机系统提供本方法的功能。因而,具有适合于于接收数据流且适合于存储数据记录的接口的通用计算机系统可以转用在记录系统中。下面参考附图使用多个示例性实施例来更详细地论述本发明,其中图1示出了依照本发明实施例的记录系统的简化图;图2依照本发明实施例示出了具有索引标记的数据记录的示意图;图3示出了本发明两个可能实施例的流程图;图4依照本发明实施例示出了阈值函数的曲线;和图5使用相关联的阈值函数示出了在数据记录中所插入的章节标记的曲线。具体实施例方式在图1中,示出了记录系统1(例如DVD记录器)的结构的示意图,包括处理电子设备2、连接到所述处理电子设备2的本地存储器3以及第一记录介质4,在这种情况下为DVD盘片。处理电子设备2和本地存储器3合作以用于提供记录系统1的功能。记录系统1可以被连接到(视频)数据源5(例如DV照相机),以便把来自DV照相机的视频连续镜头从第二记录介质(例如DV磁带)记录到第一记录介质4。此过程被称作捕获。当捕获连续镜头时,创建标题。标题是可播放的实体,其在与第一记录介质4相关联的内容表(TOC)中具有条目。用户可以访问TOC并且选择标题以播放。TOC可以由关键帧、用于表示标题的小图标图片组成。对于一个捕获会话,创建一个标题。所述标题可以长到磁带5的播放时间。其缺点在于整个磁带5的视频连续镜头可被作为一个单元从TOC中访问。通常,磁带5上的视频连续镜头由在不同时刻所记录的几个事件组成。用户可能想直接访问属于这些事件的视频连续镜头。为此存在两种访问方法。通过TOC,用户可以选择标题(通过关键帧)并且直接地播放此标题。在标题内,用户可以直接地导航到章节。章节是标题的再分。通过按压‘下一个’或‘前一个’,用户可以继续在下一标题播放。本发明涉及一种用于把来自摄像放像机5的视频连续镜头自动划分为标题和章节的方法。为此,使用视频连续镜头的记录日期&时间(RecordingDate&TimeRD&T)。视频连续镜头由场景组成。场景是一段连续记录。当记录被中断时,结束当前场景并且开始新的场景。新场景的开始比当前场景的结束具有较迟的RD&T。这被称作RD&T间断性,或更一般的说,记录时间间断性。标题边界应当允许访问事件(例如生日或一天到晚)。通常,在时间上靠近地记录的并且在摄像放像机5上顺序记录的场景属于一个事件。在场景组(例如几天)之间的大RD&T间断性对应于在事件之间的边界。因此,用于标题边界的第一级准则是间断性的大小。第二级准则是标题应当是等长度的。在标题内,导航贯穿章节标记。章节标记最好在时间上被等分并且最好应当被对准在场景的开始。由于具有大间断性的场景更可能允许访问独立的子事件,所以它们是优选的。第一级准则是长度相等,而第二级准则是间断性的大小。在图2中,给出了来源于DV磁带5的数据流10的例子。在该图中,表明了标题边界(T_n和T_n+1)和章节标记(C_m和C_m+1)的位置。DeltaRD&T表明了在场景之间的间断性大小。例如磁带5可以包含其中之一是生日的各种事件。在所述生日之前的最后场景是在所述生日的5天前所记录的。在生日上记录了所有的生日场景,而在3天后记录了在所述生日之后的第一场景。生日场景属于标题n。在所述生日内根据章节中场景的长度来形成多个章节。在图3中,示出了本方法两个可能实施例的流程图。用于获得加索引的DVD4上的数据记录的本方法在两个步骤中完成。首先,在步骤16插入第一类型的索引标记,或章节标记。在随后的步骤17中,把所选择的章节标记转换为标题边界(第二类型的索引标记)。没有插入标题边界而是转换所选择的章节标记有两方面原因a.兼顾了与自动转换相对的手动转换。优点在于用户可以选择使用哪些章节标记。b.章节标记能够快速插入标题边界。实际上标题边界的插入是把一个标题拆分为两个,在这种情况下拆分点是章节标记。如果在并非是章节标记的点上拆分标题,那么需要执行费时的操作。选择性地,可以在步骤16之前设置进一步的步骤18,在所述步骤18中对磁带5执行预扫描。这具有预先已知所有视频材料的潜在优点,以致可以更好地定位章节标记。在没有预扫描的情况下,用于添加章节标记的方法被称作“即时(on-the-fly)算法”。在具有预扫描的情况下,用于添加章节标记的方法被称作“预扫描算法”。“即时算法”当捕获视频材料时插入章节标记。利用“即时算法”,必须根据在插入点之前的视频材料的知识来插入章节标记。不知道总共要记录多少视频材料,也不知道与尚未到来的视频材料中的RD&T信息有关的任何事情。判定在某点插入章节标记是基于以下准则的1.迄今为止已经插入的章节标记量2.自从开始记录以来所经过的时间,3.RD&T间断性的存在和幅度目的在于捕捉大的间断性并且使章节标记之间的距离保持相等并且接近于所想要的值。用阈值函数来表示这些准则。如果存在RD&T间断性并且其幅度超过阈值,那么插入章节标记。非常简单的阈值函数可能是恒定的,例如2小时。超过两个小时的任何RD&T间断性可能会导致要插入章节标记。这种阈值函数可能只满足上面的第三个准则。假定迄今为止已经插入了多个章节标记C。假定d是所想要的章节持续时间,例如15分钟。如果所有章节具有相同的长度,那么每隔d个时间单位就插入新的章节。理想情况下,第(C+1)个章节标记位于t=(C+1)*d。现在设阈值函数为th(t),具有如图4中所定义的形状。当放置章节标记C+1时可以区分以下情况1.t<C*d这恰好是在理想情况下已经插入章节标记C的位置之前。阈值等级很高,但是随着接近t=(C+1)*d而降低。2.t>C*d并且t=<(C+1)*d正在接近章节标记C+1的理想位置。阈值降低。3.t>(C+1)*d已经越过章节标记C+1的理想位置。,阈值进一步降低直到在t=(C+1.5)*d变为零。使用以下数学表达式,图4中的阈值函数还可以被表示为两个线性函数的组合th(t)=th0-a1*(t-C*d),对于t<(C+0.5)*d使用第一线性系数a1;th(t)=th1-a2*(t-(C+1)*d),对于(C+0.5)*d<t<(C+1.5)*d使用小于a1的第二线性系数a2;th(t)=0,对于t>(C+1.5*d)。在图5中,示出了怎样使用上述实施例在记录期间插入章节标记的例子。在曲线中,示出了在记录期间在时间上的阈值th(t)。横轴是当记录时所经过的时间。纵轴是RD&T值。粗线示出了当正在记录时的实际阈值。从横轴指向上方的箭头是RD&T间断性。横轴上的圈是章节标记。·在t=1.5*d,插入第一章节标记。因为没有间断性超过阈值,所以当阈值变为0时插入章节标记。对于C=1,新的阈值函数生效。·在t=2*d之后不久插入第二章节标记,这是因为RD&T间断性超过了阈值。插入章节标记2。对于C=2,新的阈值函数生效。·在t接近于3*d时,另一RD&T间断性超过所述阈值。插入章节标记3。对于C=3,新的阈值函数生效。·在t=3*d之后不久插入第四章节标记,这是因为RD&T间断性超过了阈值。对于C=4,新的阈值函数生效。·在t=5.5*d,插入第五章节标记。因为没有间断性超过阈值,所以当阈值变为0时插入章节标记。阈值函数th(t)的实际形状可以是任何形状,例如是线性的(如同所示)、二次的甚至是指数的。迄今为止,实验示出了线性函数已经给出了良好的结果。当在记录中插入章节标记和标题边界时,存在用于定位所述章节标记的确定准则。可以使用相关参数的数学公式表示来描述这些准则。首先,章节标记必须在经过的时间上较好地分布,这可以使用参数不平衡(imbalance)来公式化。imbalance=Σc|durc-avrdur|totdur]]>其中totdur=视频材料的总持续时间avrdur=预定义的平均章节持续时间durc=章节c的持续时间imbalance的值应当尽可能地接近于0。由于参数totdur对具体数据记录来说是恒定的,所以在方程式(1)中可以不考虑此参数。其次,旨在优化数据流的原始数据段或场景的时间覆盖(coverage)与在所产生的数据记录中最终章节的时间覆盖的比率。此比率可以借助以下公式来描述coverage=ΣcdeltacΣsdeltas---(2)]]>其中deltac=章节c的deltaRD&Tdeltas=数据段或场景s的deltaRD&TdeltaRD&T是在场景/章节开始时的视频的RD&T和在前一场景/章节结束时的视频的RD&T之间的差异。coverage的值应当尽可能地接近于1。在图3中,示出了本发明的候选实施例,包括步骤18,在所述步骤18中预扫描原始的数据流以便预先获得所有的记录时间间断性。预扫描算法的执行以从所捕获的视频材料中收集所有的RD&T间断性开始。例如,如果使用DV磁带来捕获视频材料,那么可以通过从DV磁带的开始快进直到结束来收集RD&T间断性(把RD&T信息嵌入到DV流中)。然后,可以依照下列方式来使用方程式(1)和(2)来公式化章节标记插入(CMI,步骤16)(表示预扫描算法的第二阶段)的问题。必须从所有检测的RD&T间断性集合中选择会使方程式(3)最小化的子集。CMIps=C·(1-coverage)+I·imbalance(3)其中C=预定义的因数(用于coverage)属性的恒定权重)I=预定义的因数(用于imbalance属性的恒定权重)当找到CMIps的最小值时,所有当前选择的RD&T值变为章节标记。依照这种方式公式化,CMI问题就属于组合优化问题组,所述组合优化问题组又是更一般的非线性优化问题组的一部分。已知使用分析方法不能解决非线性的优化问题。因此,为了解决该问题,可以使用试探法。关于此问题所感兴趣之处在于CMIps的全局最小值是已知的并且等于0。这是理论上的最小值,并不确定对于此最小值存在解。当执行预扫描算法时可以很好地使用理论最小值的知识,以估计当前解的质量。以前曾决定使用规范版本的遗传算法(geneticalgorithmGA)(参见D.E.Goldberg、Addison-Wesley的“GeneticAlgorithmsinSearch,OptimizationandMachineLearning”,ISBN0-201-15767-5)来解决CMI问题(还可以使用其它更复杂版本的GA)。在GA的n代(迭代n)中,对当前的GA总体n顺序地执行各种遗传操作符(选择、杂交、突变)以便产生新的总体n+1(根据n+1代)。只要来自当前总体的最佳解正在改进,就重复此过程。在每一代中,总体包含所编码的CMI问题的解(染色体)的集合。为了依照适当的方式执行GA操作符,必须定义以下项把CMI问题的解编码为染色体的方式,拟合函数以及遗传操作符。CMI问题的每个解表示在预扫描算法的第一阶段中从视频材料所收集的所有已知RD&T值的子集。如果所有RD&T值被放入一个数组中,那么可以使用简单的二进制串(数组)来编址一个可能的RD&T子集。这是用于表示CMI问题的解的最简单的方式。对于规范版本的GA来说,它也是非常合适的表示。GA必须能够易于比较CMI问题的两个解。为此,我们可以使用方程式(3)。可以使用以下GA操作符作为选择锦标赛选择,作为杂交一个杂交点,作为突变操作符具有很小突变概率的二进制突变。还可以使用其它更复杂的操作符。注意,此建议并不保证会到达CMI问题的全局最小值。可以把本发明的最终阶段(图3中的步骤17)应用于上述的两个实施例。只在系统内已知视频连续镜头的场景信息之后进行标题边界插入。因此,可以使用预扫描算法。可以使用在上面为coverage和imbalance参数所定义的准则。差异在于章节取代了场景/数据段的角色,而标题取代了章节的角色。因为只有章节标记是标题边界的候选项,所以可以实现这点。在不存在章节标记的地方禁止标题边界插入。权利要求1.一种用于从来源于第二介质的数据流获得第一介质上的数据记录的方法,所述数据流包括多个数据段,每个数据段均具有不同的记录开始时间,所述方法包括根据对当前记录段的持续时间的确定来产生在所述第一介质上的数据记录的记录段,其特征在于当记录时间间断性超过阈值时,产生新的记录段,所述记录时间间断性是在第一数据段的记录结束时间和下一数据段的记录开始时间之间的差异。2.如权利要求1所述的方法,其中所述阈值是取决于所想要的记录段持续时间(d)和当前记录段持续时间的函数。3.如权利要求1所述的方法,其中通过把第一类型的索引标记插入在所述第一介质上的数据记录中来产生新的记录段。4.如权利要求1所述的方法,其中所述阈值函数是连续降低的时间函数。5.如权利要求4所述的方法,其中所述阈值函数包括两个线性时间函数的组合th(t)=th0-a1*(t-C*d),对于t<(C+0.5)*d;th(t)=th1-a2*(t-(C+1)*d),对于(C+0.5)*d<t<(C+1.5)*d;th(t)=0,对于t>(C+1.5*d),其中C是第一类型的索引标记的计数,a1是第一线性系数,并且a2是第二线性系数。6.如权利要求1所述的方法,还包括预扫描所述数据流以便获得在所述数据流中的记录时间间断性。7.如权利要求6所述的方法,其中从所有检测到记录时间间断性中选择记录时间间断性的子集作为新的段的开始点,为此,使CMIps的值最小化。CMIps=C·(1-coverage)+I·imbalance其中coverage=ΣcdeltacΣsdeltas]]>是数据记录的覆盖coverage属性,其中deltac=在记录段c的记录开始时间和前一记录段c的记录结束时间之间的差异;deltas=在数据段s的记录开始时间和前一数据段s的记录结束时间之间的差异;并且imbalance=Σc|durc-avrdur|]]>是数据记录的不平衡imbalance属性,其中avrdur=预定义的平均记录段持续时间;durc=记录段c的持续时间;并且C=用于覆盖属性的预定义的恒定权重因数;I=用于不平衡属性的预定义的恒定权重因数。8.如权利要求1所述的方法,其中所述方法还包括根据预定的准则集合来把所选择的第一类型的索引标记转换为第二类型的索引标记。9.一种用于从来源于第二介质(5)的数据流获得第一介质(4)上的数据记录的记录系统,所述数据流包括多个数据段,每个数据段均具有不同的记录开始时间,所述记录系统(1)包括输入装置,用于接收来自所述第二介质(5)的数据流;输出装置,用于把所述数据记录存储在所述第一介质(4)上;和连接到所述输入装置和输出装置的处理装置(2,3),所述处理装置被配置成根据对当前记录段的持续时间的确定来产生在所述第一介质(4)上的数据记录的记录段,其特征在于所述处理装置(2,3)还被配置成当记录时间间断性超过阈值时产生新的记录段,所述记录时间间断性是在第一数据段的记录结束时间和下一数据段的记录开始时间之间的差异。10.如权利要求9所述的记录系统,其中所述处理装置还被配置成执行如权利要求2到8中任何一个所述的方法的活动。11.一种用于从来源于第二介质(5)的数据流获得第一介质(4)上的数据记录的计算机程序产品,所述计算机程序产品包括计算机可执行代码,所述计算机可执行代码当被计算机系统加载时,向所述计算机系统提供如权利要求1-8中任何一个所述的方法的功能。全文摘要一种用于从来源于第二介质-诸如DV磁带-的数据流获得第一介质-诸如DVD-上的数据记录的方法和记录系统。所述数据流包括多个数据段,每个数据段均具有不同的记录开始时间。在可以“即时”并结合预扫描来使用的本发明中,根据对当前记录段的持续时间的确定来产生第一介质上的数据记录的记录段。当记录时间间断性超过阈值时,产生新的记录段,所述记录时间间断性是在第一数据段的记录结束时间和下一数据段的记录开始时间之间的差异。文档编号G11B27/031GK1886793SQ200480035064公开日2006年12月27日申请日期2004年11月15日优先权日2003年11月27日发明者A·T·J·M·施帕,Z·斯坦科威克,M·柴扎科维斯基申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1