专利名称:字幕数据的处理方法及装置的制作方法
技术领域:
本发明涉及一种字幕数据的处理方法及装置,尤其是一种对字幕数据进 行剪裁处理的处理方法及装置。
背景技术:
多路传输的音频、视频流对于传输带宽有很高要求,因此,出现了许多
方法对音^L频的数据进行压缩,然后再传输,以减少数据传输量及终端的解 码的输出处理量,但现有技术中,经过压缩的音频、视频基本已没有再缩减 的可能。
字幕数据是和视频流一起进行传输的,现有技术中的字幕数据处理方法, 直接从视频流中提取出字幕数据,将一帧字幕数据中的奇场数据和偶场数据 进行合成,然后直接和该帧图象一起进行显示。
现有才支术中的字幕显示处理方法,没有对字幕数据量进行有效的压缩处 理,字幕^:据中存在大量的冗余数据,例如,行与行之间的间距等;现有的 字幕数据编码应用模式,将整幅图像完全编码,虽然可以降低一定数据量, 但并没有达到最高效的应用,对于字幕数据来说,还存在很大的压缩空间。
发明内容
本发明的目的是提供一种字幕数据的处理方法及装置,以减少字幕数据 传输量以及终端解码的字幕数据量,进而提高整体视频系统的资源消耗及运 行效率。
为实5见上述目的,本发明提供了一种字幕数据的处理方法,包括 对字幕流数据进行解析,获取字幕图象数据和字幕控制数据; 对字幕图象数据进行识别,获取字幕位图的有效区域;根据所述有效区域重新生成字幕图象数据,并修改字幕控制数据; 将所述重新生成的字幕图象数据和修改后的字幕控制数据合成字幕流数 据,并输出。
本发明还提供了一种字幕数据的处理装置,包括
字幕流数据解析单元,用于对字幕流数据进行解析,获取字幕图象数据 和字幕控制数据;
有效区域识别单元,用于对字幕图象数据进行识别,获取字幕位图的有 效区域;
剪裁合成单元,用于根据所述有效区域重新生成字幕图象数据,并修改 字幕控制数据;
输出单元,将所述重新生成的字幕图象数据和修改后的字幕控制数据合 成字幕流凄t据,并输出。
由上述技术方案可知,本发明通过对字幕数据的剪裁处理,降低了字幕 数^t量,提高了应用系统的网络带宽利用率,减少了终端解码的字幕数据量, 提升了字幕数据后续处理单元的效率。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
图1为本发明实施例一字幕数据的处理方法的流程图; 图2为本发明实施例二字幕数据的处理装置的结构示意图。
具体实施例方式
实施例一
终端"i史备的字幕显示和图像显示原理类似,都是分成奇场偶场两块进行 隔行扫描显示,字幕数椐一般分别对奇场偶场数据分别进行编码和流化。
本实施例涉及一种字幕数据的处理方法,如图1所示,主要包括如下步
骤步骤ll、对字幕流数据进行解析,获取字幕图象数据和字幕控制数据; 字幕流数据中包含有多帧字幕数据,每一帧字幕数据包含两部分内容 字幕图像數据和字幕控制数据。字幕图像数据主要是将字幕位图编码后的数 据,该数据分成两块,分别是偶场数据块和奇场数据块,对这两块数据分别 解码将得到两张隔行显示的位图,将两张隔行显示的位图合并形成,便完整 的字幕位图。字幕控制数据主要记录了字幕位图尺寸、颜色、显示坐标原点、 显示时间、奇偶数据块边界等数据。
步骤12、对字幕图象数据进行识别,获取字幕位图的有效区域; 字幕位图往往包含大量无用的透明区域,这类区域是冗余的,而且给终 端显示带来了过多的计算量,降低了数据处理的效率,本实施例通过识别出 可裁减的透明区域,进而降低数据冗余。
具体i只别方法,可以通过对奇场、偶场数据块行数据的解析,识别出透 明行,然后通过统计计算得到非透明区域的有效矩形区域。
步骤13、根据所述有效区域重新生成字幕图象数据,并修改字幕控制数
据;
该步骤可以具体为对奇场、偶场数据块的有效矩形区域数据进行提取, 然后修改字幕控制数据,即字幕位图尺寸和坐标原点、奇偶数据块边界三项 数据,形成新的字幕帧。
步骤14、将所述重新生成的字幕图象数据和修改后的字幕控制数据合成 字幕流lt据,并输出。
通过本实施例中对字幕数据的剪裁处理,最后在终端显示的效果与未剪 裁过的图象显示完全一致,而数据量平均减少35%,终端计算量也大大咸少。
在本实施例中,在步骤1之前还可以包括
步骤10、从节目流数据中提取字幕流数据;
字幕5危主要来自于节目流的私有数据流中的子数据流,该数据流可以承 载多个字幕流,通过该数据流负载首字节来识别字幕流的类型和字幕流ID从 而识别多个字幕流。
6200810056153.2
实施,J二
本实施例涉及一种字幕数据的处理装置,如图2所示,包括 字幕'^Jt据解析单元1,用于对字幕流数据进行解析,获取字幕图象数
据和字幕控制数据;
有效区域识别单元2,用于对字幕图象数据进行识别,获取字幕位图的
有效区域;
剪裁合成单元3,用于根据所述有效区域重新生成字幕图象数据,并修 改字幕控制数据;
输出单元4,将所述重新生成的字幕图象数据和修改后的字幕控制数据 合成字幕淨u数据,并输出。
其中,该装置还可以进一步包括字幕流数据提取单元,用于从节目流 数据中提取字幕流数据。
其中,所述对字幕图象数据进行识别,获得字幕位图的有效区域可以具 体为
对偶场数据块和奇场数据块中的行数据进行解析,识别出字幕图象中的 透明-f亍,然后通过统计计算得到所述字幕图象中的非透明区域。
所述才艮据所述有效区域重新生成字幕图象数据,并修改字幕控制数据可 以具体为
分别对奇场数据块和偶场数据块的非透明区域的数据进行提取,然后修 改字幕控制数据中的字幕位图尺寸、坐标原点和奇偶数据块边界数据。
通过上述实施例可以看出,通过对字幕数据的剪裁处理,进一步降4氐字 幕翁:据量,可提高应用系统的网络带宽利用率,提升字幕数据后续处理单元 的效率。
本发明实施例的字幕数据处理方法及装置通过有效区域识别、裁剪技术, 可以应用于多音轨、多字幕AVS (Audio Video coding Standard,音频牙见频 编码标准)IPTV (交互式网络电视)系统的字幕进进行处理,但不限于上述 系统中,乂人而降低数据流量,减轻终端处理负荷,同时和还可以保证终端输
7出字幕显示的正确性,从而提升系统应用空间。
本领域普通技术人员可以理解实现上述方法及装置的实施例的全部或 部分步骤及处理单元,可以通过程序指令相关的硬件来完成,前述的程序可 以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法 实施例的步骤;而前述的存储介质包括R0M、 RAM、》兹碟或者光盘等各种可 以存储程序代码的介质。
最后应说明的是以上实施例仅用以说明本发明的技术方案而非对其进 行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技 术人员应当理解其依然可以对本发明的技术方案进行修改或者等同替换, 而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的 精4申和范围。
权利要求
1、一种字幕数据的处理方法,其特征在于,包括对字幕流数据进行解析,获取字幕图象数据和字幕控制数据;对字幕图象数据进行识别,获取字幕位图的有效区域;根据所述有效区域重新生成字幕图象数据,并修改字幕控制数据;将所述重新生成的字幕图象数据和修改后的字幕控制数据合成字幕流数据,并输出。
2、 4艮据权利要求1所述的方法,其特征在于,所述有效区域具体为 所述字幕位图中的非透明区域。
3、 才艮据权利要求2所述的方法,其特征在于,所述对字幕图象数据 进^f亍识別,获取字幕位图的有效区域具体为对偶场数据块和奇场数据块中的行数据进行解析,识别出字幕位图中 的透明行,然后通过统计计算得到所述字幕位图中的非透明区域。
4、 才艮4居;K利要求3所述的方法,其特征在于,所述根据所述有效区 域重新生成字幕图象数据,并修改字幕控制数据具体为分别对奇场数据块和偶场数据块的非透明区域的数据进行提取,然后 修改字幕控制数据中的字幕位图尺寸、坐标原点和奇偶数据块边界数据
5、 才艮据权利要求1所述的方法,其特征在于,在所述对字幕流数据进行解析,获取字幕图象数据和字幕控制数据之前还包括从节目流数据 中提取字幕流数据。
6、 才艮据权利要求1至5任一权利要求所述的方法,其特征在于,所 述有效区域为矩形。
7、 一种字幕数据的处理装置,其特征在于,包括 字幕;危数据解析单元,用于对字幕流数据进行解析,获取字幕图象数据和字幕控制数据;有效区域识别单元,用于对字幕图象数据进行识别,获取字幕位图的有效区域;剪裁合成单元,用于根据所述有效区域重新生成字幕图象数据,并修 改字幕控制数据;输出单元,将所述重新生成的字幕图象数据和修改后的字幕控制数据 合成字幕流数据,并输出。
8、 根据权利要求7所述的装置,其特征在于,还包括字幕流数据提 取单元,用于从节目流数据中提取字幕流数据。
9、 才艮据权利要求7所述的装置,其特征在于,所述对字幕图象数据进 行识别,获取字幕位图的有效区域具体为对偶场数据块和奇场数据块中的行数据进行解析,识别出字幕图象中 的透明行,然后通过统计计算得到所述字幕图象中的非透明区域。
10、 丰艮据权利要求7所述的装置,其特征在于,所述根据所述有效区 域重新生成字幕图象数椐,并修改字幕控制数据具体为分别对奇场数据块和偶场数据块的非透明区域的数据进行提取,然后 修改字幕控制数据中的字幕位图尺寸、坐标原点和奇偶数据块边界数据。
全文摘要
本发明公开了一种字幕数据的处理方法及装置,该方法包括获取字幕图象数据和字幕控制数据;获取字幕位图的有效区域;根据有效区域重新生成字幕图象数据,并修改字幕控制数据;将所述重新生成的字幕图象数据和修改后的字幕控制数据合成字幕流数据,并输出。该装置包括字幕流数据解析单元,用于获取字幕图象数据和字幕控制数据;有效区域识别单元,用于获取字幕位图的有效区域;剪裁合成单元,用于根据有效区域重新生成字幕图象数据,并修改字幕控制数据;输出单元,将所述重新生成的字幕图象数据和修改后的字幕控制数据合成字幕流数据,并输出。本发明降低了字幕数据量,提高了应用系统的网络带宽利用率,提升了字幕数据后续处理单元的效率。
文档编号H04N5/278GK101489052SQ20081005615
公开日2009年7月22日 申请日期2008年1月14日 优先权日2008年1月14日
发明者刘红旗, 呼大明, 宋益波, 张伦泳, 帆 杨, 杨长水, 军 王, 陈熙霖, 马少红 申请人:中国网通集团宽带业务应用国家工程实验室有限公司;联合信源数字音视频技术(北京)有限公司