一种视频内容文字感知定位系统的制作方法
【技术领域】
[0001]本实用新型涉及数字图像处理领域,具体涉及一种系统结构简单、文字定位精确的视频内容文字感知定位系统。
【背景技术】
[0002]针对大量视频图像中出现的各种文字信息自动地抽取并识别,在图像数据库的组织与管理、视频索引等方面将有着极其广泛的应用。在基于内容的视频检索和浏览中,可供利用的一个重要线索是视频中所包含的字符。因此,自动地检测和识别字符是抽取视频语义内容的基础和关键所在。监控视频图像由于数据量庞大,冗余多,通常以压缩后的视频流形式进行存储和传输,目前h.264的编码标准被大量采纳。若将视频流解码,再进行字符定位检测,计算量大,也严重地影响了处理速度。若在压缩域中对视频流直接处理,有利于提尚实时性。但该算法的准确性仍有待进一步提尚,因此本专利提出将抽取视频流中的IDR关键帧进行像素域处理,结合DCT的频域特征,进行互补制约的对视频流中的文字进行识别与定位,在保证精度的同时,也保障了算法的实时性。
【实用新型内容】
[0003]针对上述问题,本实用新型的主要目的在于提供一种系统结构简单、文字定位精确的视频内容文字感知定位系统。
[0004]本实用新型是通过下述技术方案来解决上述技术问题的:一种视频内容文字感知定位系统,所述视频内容文字感知定位系统包括图像采集装置、接口、熵编码器、文字识别器、文字采集器、文字处理器、解码器、文字显示器、发送端口,需要识别文字的压缩视频流进入图像采集装置,图像采集装置和熵编码器通过接口连接在一起,熵编码器上连接有识别文字信息的文字识别器,文字识别器上连接有采集文字信息的文字采集器,文字采集器上连接有处理文字信息的文字处理器,文字处理器上连接有将文字信息解码为可以显示识别的文字的解码器,解码器上连接有显示文字信息的文字显示器。
[0005]在本实用新型的一个具体实施例子中,所述文字处理器还连接有将文字输入计算机进行存储的发送端口。
[0006]在本实用新型的一个具体实施例子中,所述图像采集装置为摄像头。
[0007]本实用新型的积极进步效果在于:本实用新型提供的视频内容文字感知定位系统具有以下优点:本实用新型提供了高精度的视频中文字定位,使用方便、直观、提高视频内容感知检测效率。复杂背景下也能取得较高的检测率和定位精度,具有良好的鲁棒性和实用性。
【附图说明】
[0008]图1为本实用新型的整体结构示意图。
【具体实施方式】
[0009]下面结合附图给出本实用新型较佳实施例,以详细说明本实用新型的技术方案。
[0010]图1为本实用新型的整体结构示意图。如图1所示,本实用新型提供的视频内容文字感知定位系统,包括图像采集装置1、接口 2、熵编码器3、文字识别器4、文字采集器5、文字处理器6、解码器7、文字显示器8、发送端口 9,需要识别文字的压缩视频流进入图像采集装置1,图像采集装置I和熵编码器3通过接口 2连接在一起,熵编码器3上连接有识别文字信息的文字识别器4,文字识别器4上连接有采集文字信息的文字采集器5,文字采集器5上连接有处理文字信息的文字处理器6,文字处理器6上连接有将文字信息解码为可以显示识别的文字的解码器7,解码器7上连接有显示文字信息的文字显示器8。
[0011]文字处理器6还连接有将文字输入计算机10进行存储的发送端口 9。
[0012]在一般情况下,本实用新型中的图像采集装置I可以选为摄像头。
[0013]本实用新型提供了高精度的视频中文字定位,使用方便、直观、提高视频内容感知检测效率。复杂背景下也能取得较高的检测率和定位精度,具有良好的鲁棒性和实用性。
[0014]以上显示和描述了本实用新型的基本原理和主要特征和本实用新型的优点。本行业的技术人员应该了解,本实用新型不受上述实施例的限制,上述实施例和说明书中描述的只是说明本实用新型的原理,在不脱离本实用新型精神和范围的前提下,本实用新型还会有各种变化和改进,这些变化和改进都落入要求保护的本实用新型范围内,本实用新型要求保护范围由所附的权利要求书及其等效物界定。
【主权项】
1.一种视频内容文字感知定位系统,其特征在于:所述视频内容文字感知定位系统包括图像采集装置、接口、熵编码器、文字识别器、文字采集器、文字处理器、解码器、文字显示器、发送端口,需要识别文字的压缩视频流进入图像采集装置,图像采集装置和熵编码器通过接口连接在一起,熵编码器上连接有识别文字信息的文字识别器,文字识别器上连接有采集文字信息的文字采集器,文字采集器上连接有处理文字信息的文字处理器,文字处理器上连接有将文字信息解码为可以显示识别的文字的解码器,解码器上连接有显示文字信息的文字显示器。
2.根据权利要求1所述的视频内容文字感知定位系统,其特征在于:所述文字处理器还连接有将文字输入计算机进行存储的发送端口。
3.根据权利要求1所述的视频内容文字感知定位系统,其特征在于:所述图像采集装置为摄像头。
【专利摘要】本实用新型涉及一种视频内容文字感知定位系统,包括图像采集装置、接口、熵编码器、文字识别器、文字采集器、文字处理器、解码器、文字显示器、发送端口,需要识别文字的压缩视频流进入图像采集装置,图像采集装置和熵编码器通过接口连接在一起,熵编码器上连接有识别文字信息的文字识别器,文字识别器上连接有采集文字信息的文字采集器,文字采集器上连接有处理文字信息的文字处理器,文字处理器上连接有将文字信息解码为可以显示识别的文字的解码器,解码器上连接有文字显示器。本实用新型提供了高精度的视频中文字定位,使用方便、直观、提高视频内容感知检测效率,复杂背景下也能取得较高的检测率和定位精度,具有良好的鲁棒性和实用性。
【IPC分类】G06K9-20, G06F17-30
【公开号】CN204406433
【申请号】CN201520049677
【发明人】贾莉莉, 曹宁, 王成龙
【申请人】上海国际技贸联合有限公司
【公开日】2015年6月17日
【申请日】2015年1月23日