用于录像机和视频服务器的avs编码文件格式的存储方法

文档序号:7892118阅读:291来源:国知局
专利名称:用于录像机和视频服务器的avs编码文件格式的存储方法
技术领域
本发明涉及网络化安全防范监控技术领域,具体说是涉及到一种用于录像机和视频服务器的AVS编码文件格式的存储方法背景技术众所周知,视频监控经过第一代模拟监控、第二代半数字监控发展到现在的 第三代全数字网络监控,网络化监控已经成为安全防范监控领域的主流技术。数 字化网络化监控与视频图像数字化编码密切相关,国际上音视频编解码标准主要两大系列IS0/IEC JTC1制定的MPEG系列标准;ITU针对多媒体通信制定的H. 26x 系列视频编码标准和G. 7系列音频编码标准。目前音视频产业可以选择的信源编 码标准有四个:MPEG-2、 MPEG-4、 MPEG-4 AVC (简称AVC,也称JVT、 H, 264)、 AVS。其中MPEG-2是第一代信源标准,其余三个为第二代标准。图像编码技术经 过MPEGi、 MPEG2、 MPEG4发展到现在主流的H. 264,都是采用国际标准,这些优 秀的技术使数据量巨大的数字图像压縮成相对较小的数据量,便于存储和网络传 输。为了应对网络化的需要,我国也制订了 AVS国家标准,AVS(Audio Video codingStandard)是中国具备自主知识产权的第二代信源编码标准,顾名思义, "信源"是信息的"源头",信源编码技术解决的重点问题是数字音视频海量数 据(即初始数据、信源)的编码压縮问题,它解决的重点问题是数字音视频海量 数据的编码压縮问题,也称为数字音视频编解码标准技术。显而易见,它是其后 数字信息传输、存储、播放等环节的前提,因此是数字音视频产业的共性基础标 准。AVS的制订最初是针对广播电视行业,但随着我国监控行业的快速发展,对 适用于监控行业的AVS编码也有了迫切的需求。目前国内监控录像文件格式没有 统一标准,各厂商采用企业自己的标准存储录像。虽然国际上有AVI、3GPP、脂VB、 觀V等众多文件存储格式可参考,但由于不适用于监控行业,没有得到普遍采用。 监控行业现有技术中的录像文件一般只定义了音视频数据实现历史文件的播放。 当录像文件跨度很长时间时,为了査找某一事件,不得不使用快放、拖动等方式,人为地观察判断是否是事件发生点,费时费力。如何解决上述文件存储格式的缺 点,提供一种适用于AVS录像文件存储格式的方法,从而更快捷安全的应用于网 络化安全防范监控系统,是本技术领域当前需要解决的重要课题。发明内容本发明的目的是基于AVS信源编码标准,在安全防范监控技术领域实现更快 捷安全的网络化监控,提供一种用于录像机和视频服务器的AVS编码文件格式的 存储方法。为了达到上述目的,本发明采用以下技术方案 一种用于录像机和视频服务 器的AVS编码文件格式的存储方法,包括定义文件头结构、数据区结构以及索引 区结构,其特点是-a. 文件头结构由文件信息结构、媒体信息结构及内容信息结构组成,其中 文件信息结构包括AVS文件标识符、AVS文件版本、文件创建时间、索引区距文件起始位置及数据区距文件起始位置;媒体信息结构包括媒体信息结构标识符、最大包长、平均包长、总包数、 媒体文件的起始时间、媒体文件的持续播放时间、视频及音频编码类型;内容信息结构包括内容信息结构的标识符、本文件内容的标题、本文件的 所有者、版权声明及备注信息;b. 数据区结构由数据区头信息结构和媒体数据结构组成其中 数据区头信息结构包括数据区头信息的标识符、数据区的总字节数、视频或音频类型;媒体数据结构由帧头和帧数据组成,包括帧头标识符、本帧数据长度、帧 的类型、帧的子类型、序列头的长度、本帧数据产生的时间;C.索引区结构由索引区头信息结构和索引数据结构组成,其中 索引区头信息结构包括索引区头信息标识符、索引区大小、索引项个数; 索引数据结构包括索引项对应的I帧数据相对与文件头的偏移字节数、索 引项对应的I帧的时戳、索引项对应的:[帧的帧编号。上述所述文件信息结构中的AVS文件标识符,依次为'T'、 'A'、 'F'、 'F', AVS文件版本网络序存储默认为O;文件总字节数为32bits,文件创建时间单位 为秒,索引区距文件起始位置的偏移字节数为32bits,数据区距文件起始位置的偏移字节数为32bits,均为网络序存储。上述所述的媒体信息结构标识符,依次为'T'、 'A'、 'M' 、 ;最大包长 包括视频、音频、报警一帧数据的长度,总包数包括视频包数目、音频包数目、报警包数目;媒体文件的起始及持续播放时间单位为秒。上述所述的内容信息结构的标识符,依次为'T' 、 'A' 、 'C' 、 。 上述所述的数据区头信息标识符,依次为'T' 、 'A'、 'D'、 'C';数据区的总字节数包括头信息;视频或音频类型可以是视频或音频、也可以是混合文件。上述所述的帧头标识符,定为0x00000000;帧数据长度不包括帧头,帧的类型标识本帧是视频或音频还是报警信息;帧数据产生的时间单位为毫秒。在本存储方法中,文件信息结构中的AVS文件版本修改升级后可改变此版本号,根据此版本号可选择正确的文件解析方法;文件创建时间以文件完整创建完毕的时刻为准,索引区距文件起始位置的偏移字节数为32bits,网络序存储,当其值为0是表示没有索引,没有索引的文件不支持拖动;数据区距文件起始位置的偏移字节数为32bits,网络序存储。媒体信息结构中的最大包长(字节数),包括视频、音频及报警,这里并不是 指网络接收的一个数据包,而是一帧包含本文档定义帧头的视频或音频或报警数 据的长度;平均包长(字节数)是通过媒体数据总字节数和总包数计算得到。数据区结构中的数据区的总字节数,包括头信息;类型表明本数据是视频、 或是音频、还是混合文件;bits为bit0是否为l表示是否存在视频数据,bitl 是否为l表示是否存在音频数据,bit2是否为l表示是否存在报警数据,bit3 到bit31为保留位。在媒体数据结构中,帧的类型包含有子类型,帧的子类型针对视频帧,标识本 帧为序列头、I帧、P帧;序列头的长度,当本帧为带头的I帧时有效;帧数据 产生的时间为毫秒;帧数据为真实的帧编码结构,对于视频帧,其格式符合AVS 标准,对于音频帧,其格式符合其采用的编码标准。对于报警信息,原样封装。 索引区结构中索引区数据为多个索引项顺序排列而成,其中的索引项对应的 I帧数据相对与文件头的偏移字节数;索引项对应的I帧的时戳;索引项对应的 I帧的帧编号。帧编号只对图像帧进行,第一个图像帧编号为l,依次递增。 由于采用了上述用于录像机和视频服务器的AVS编码文件格式的存储方法,而AVS是又是基于创新技术和公开技术的自主标准,本方法编码存储效率高, 而且技术方案简洁,芯片实现复杂度低,支持VCR(Video Cassette Recorder) 控制,支持快速定位(按绝对时间、相对进度等),支持自定义数据(如智能识别、 动态侦测等)检索,易于推广。AVS作为一套包含系统、视频、音频、媒体版权 管理在内的完整标准体系,为数字音视频产业提供更全面的解决方案,而AVS 媒体存储格式可推进AVS这一技术标准进入网络化安全防范技术领域,广泛在 计算机安全防范智能监控中应用,达到了本发明的目的。
具体实施方式
下面结合实施例详述本发明, 一种用于录像机和视频服务器的AVS编码文件 格式的存储方法,包括定义文件头结构、数据区结构以及索引区结构a.文件头结构由文件信息结构、媒体信息结构及内容信息结构组成,其中 文件信息结构包括AVS文件标识符、AVS文件版本、文件创建时间、索引 区距文件起始位置及数据区距文件起始位置;文件信息结构中的AVS文件标识 符,依次为'T'、 'A'、 'F'、 'F', AVS文件版本网络序存储默认为O;文件总字 节数为32bits,文件创建时间单位为秒,索引区距文件起始位置的偏移字节数 为32bits,数据区距文件起始位置的偏移字节数为32bits,均为网络序存储; 媒体信息结构包括媒体信息结构标识符、最大包长、平均包长、总包数、 媒体文件的起始时间、媒体文件的持续播放时间、视频及音频编码类型;媒体信 息结构标识符,依次为'T'、 'A'、 'M' 、 'I';最大包长包括视频、音频、报 警一帧数据的长度,总包数包括视视频包数目、音频包数目、报警包数目;媒体 文件的起始及持续播放时间单位为秒。内容信息结构包括内容信息结构的标识符、本文件内容的标题、本文件的 所有者、版权声明及备注信息;内容信息结构的标识符,依次为'T' 、 (A'、 'C' 、 T 。文件头结构实施例如下所示(以十六进制显示) 文件信息结构54 41 46 46 00 00 00 00 00 30 4F F8 08 05 10 10 35 36 01 24 00 30 4E 6D 00 00 03 8C;其中,54 446 46表示文件信息结构的标识符'T'、 'A'、 'F,、 'F,;00 00 00 oo表示此文件遵循的格式版本号为o;00 30 4F F8表示本文件的大小为3166200字节;08 05 10 10 35 36 01 24表示本文件创建于2008年5月16日16时 53分54.292秒;00 30 4E 6D表示索引区起始地址距离文件首地址的偏移值为3165804j-丄'~|~H子"P ;00 00 03 8C表示数据区起始地址距离文件首地址的偏移值为902字节; 通过读取本结构的相关数据,可获得文件大小以及文件创建时间等基本信息。媒体信息结构54414D49 00 00 34 F5 00 00 19 37 00 00 01E900000100 00 00 00 00 00 00 00 08 05 101035220000 00 00 00 14 00 00 00 00;其中,54 41 4D49表示媒体信息结构的标识符'T'、 'A'、 'M'、 'I'000034F5表示本文件中最大的媒体数据包大小为13557字节;00001937表示本文件中媒体数据包的平均大小为6455字节;000001E9表示本文件中媒体数据包总数为489;000001E9表示本文件中视频媒体数据包总数为489;00000000表示本文件中音频媒体数据包总数为0;00000000表示本文件中报警媒体数据包总数为0;08051010 35 22 00 00表示本文件的起始时间为2008年5月16闩16时53分34秒,由于只精确到秒,所以最后两位置O; 00 00 00 14表示本文件持续播放时间为20秒; 00 OO表示视频编码类型为默认类型; 00 OO表示音频编码类型为默认类型;通过读取本结构的相关数据,可以获取文件的组成、编码等信息。内容信息结构54 41 43 49 74 65 73 74 20 66 69 6C 65 00 00...00 00 00 72 61 72 65 00 00 ............00 00 00 ...............00 00 00 74 65 73 74 00 00 .........00 00 00 ;其中,54 41 43 49表示内容信息结构的标识符'T'、 'A'、 'C,、 T;74 65 73 74 20 66 69 6C 65 00 00 ...等共32字节表示本文件 的标题;72 61 72 65 00 00 ...等共32字节表示本文件的作者;00 00 00 ............是256字节的版权声明,本实例全部为0;74 65 73 74 00 00 ...等共256字节表示本文件的关键字;00 00 00是256字节的备注信息,本实例全部为0通过读取本数据结构的相关数据,可以获取标题、作者、版权、关键字等内 容相关信息b.数据区结构由数据区头信息结构和媒体数据结构组成其中数据区头信息结构包括数据区头信息的标识符、数据区的总字节数、视频或音频类型;数据区头信息标识符依次为'T' 、 'A'、 'D'、 'C',数据区的总字节数包括头 信息,视频或音频类型可以是视频或音频、也可以是混合文件;媒体数据结构由 帧头和帧数据组成,包括帧头标识符、本帧数据长度、帧的类型、帧的子类型、 序列头的长度、本帧数据产生的时间;帧头标识符为0x00000000;帧数据长度不包括帧头,帧的类型标识本帧是视频或音频还是报警信息,帧数据产生的时间单位为毫秒。数据区结构实施例如下所示(以十六进制显示)54 41 44 43 00 30 4A E6 00 00 00 01; 其中,54 41 44 43表示数据区头部信息结构的标识符'T'、 'A'、 'D'、 'C'; 00 30 4A E6表示数据区的大小为3164902字节;00 00 00 01为标识位,其最低位表示是否存在视频、次低位表示是否存在 音频,再依次表示是否有报警数据,本实例中仅有视频数据;数据区除了头部数据以外,就是各个帧的媒体数据,下面是一个视频帧数据 的实例00 00 00 00 00 00 00 8A 00 00 00 8A 08 05 10 10 35 22 00 00 ......;其中,00 00 00 00是媒体数据帧的标识符;00 00 00 8A表示本帧 数据大小为138字节;00表示本帧数据为视频数据;00表示本帧视频数据为带序列头;008A表示序列头长度为138;08 05 10 10 35 22 00 00表示此帧时戳为2008年5月16日16时 53分54秒;后面跟随的为138字节的序列头;数据区存储的是实际的媒体数据,包括视频、音频、报警数据等几种类型。C.索引区结构由索引区头信息结构和索引数据结构组成,其中 索引区头信息结构包括索引区头信息标识符、索引区大小、索引项个数; 索引数据结构包括索引项对应的I帧数据相对与文件头的偏移字节数、索引项 对应的I帧的时戳、索引项对应的I帧的帧编号;索引区只对所有图像帧的I 帧做索引,其索引区头信息标识符依次为'T' 、 'A' 、 'I' 、 'H',索引区大 小包括头信息,每个索引项对应一个I帧,索引区数据为几个索引项顺序排列而 成,索引项对应的I帧数据与与文件头的偏移字节数相对应。索引区结构实施例如下所示(以十六进制显示)54 41 49 48 00 00 01 8C 00 00 00 18其中,54 41 44 43表示索引区头部信息结构的标识符'T'、 'A'、 T、 'H,; 00 00 01 8C表示索引区长度为396字节; 00 00 00 18表示-一共有24项索引; 索引头信息之后是多个顺序排放的索引,每个索引对应着一个视频I帧,表 示如下00 12 E7 73 08 05 10 10 35 2A 02 54 00 00 00 C5 其中,00 12 E7 73表示该索引对应的I帧距离文件首地址的偏移值为 1238899字节;08 05 10 10 35 2A 02 54表示该索引对应的I帧的是戳为2008年 16 R 16时53分42.596秒;00 00 00 C5表示其帧号为197;通过索引区的帮助,可以实现文件播放的按大小位置、时间等进行定位。
权利要求
1.一种用于录像机和视频服务器的AVS编码文件格式的存储方法,包括定义文件头结构、数据区结构以及索引区结构,其特征在于a.文件头结构由文件信息结构、媒体信息结构及内容信息结构组成,其中文件信息结构包括AVS文件标识符、AVS文件版本、文件创建时间、索引区距文件起始位置及数据区距文件起始位置;媒体信息结构包括媒体信息结构标识符、最大包长、平均包长、总包数、媒体文件的起始时间、媒体文件的持续播放时间、视频及音频编码类型;内容信息结构包括内容信息结构的标识符、本文件内容的标题、本文件的所有者、版权声明及备注信息;b.数据区结构由数据区头信息结构和媒体数据结构组成其中数据区头信息结构包括数据区头信息的标识符、数据区的总字节数、视频或音频类型;媒体数据结构由帧头和帧数据组成,包括帧头标识符、本帧数据长度、帧的类型、帧的子类型、序列头的长度、本帧数据产生的时间;c.索引区结构由索引区头信息结构和索引数据结构组成,其中索引区头信息结构包括索引区头信息标识符、索引区大小、索引项个数;索引数据结构包括索引项对应的I帧数据相对与文件头的偏移字节数、索引项对应的I帧的时戳、索引项对应的I帧的帧编号。
2. 根据权利要求1所述的AVS编码文件格式的存储方法,其特征在于上述所述文件信息结构中的AVS文件标识符,依次为'T'、 'A'、 'F'、 <F', AVS文 件版本网络序存储默认为0;文件总字节数为32bits,文件创建时间单位为秒, 索引区距文件起始位置的偏移字节数为32bits,数据区距文件起始位置的偏移 字节数为32bits,均为网络序存储。
3. 根据权利要求1所述的AVS编码文件格式的存储方法,其特征在于上述 所述的媒体信息结构标识符,依次为'T'、 'A'、 'M' 、 'I';最大包长包括视 频、音频、报警一帧数据的长度,总包数包括视视频包数目、音频包数目、报警 包数目;媒体文件的起始及持续播放时间单位为秒。
4. 根据权利要求1所述的AVS编码文件格式的存储方法,其特征在于上述所述的内容信息结构的标识符,依次为'T' 、 'A' 、 'C' 、 'I'。
5. 根据权利要求1所述的/WS编码文件格式的存储方法,其特征在于上述所述的数据区头信息标识符,依次为'T' 、 'A'、 'D'、 'C':数据区的总字节 数包括头信息视频或音频类型可以是视频或音频、也可以是混合文件。
6. 根据权利要求1所述的AVS编码文件格式的存储方法,其特征在于上述 所述的帧头标识符,定为0x()0()000()0;帧数据长度不包括帧头,帧的类型标识本帧是视频或音频还是报警信息;帧数据产生的时间单位为毫秒。
7. 根据权利要求1所述的AVS编码文件格式的存储方法,其特征在于上述所述的索引区对所有图像帧的I帧做索弓I,其索引区头信息标识符,依次为'T'、 'A' 、 'I' 、 'H';索引区大小包括头信肩、,每个索引项对应一个I帧。
8. 根据权利要求1.所述的AVS编码文件格式的存储方法,其特征在于上述 所述的索引区数据为几索引项顺序排列而成,索引项对应的I帧数据与与文件头 的偏移字节数相对应。
全文摘要
本发明公开了一种用于录像机和视频服务器的AVS编码文件格式的存储方法,包括定义文件头结构、数据区结构以及索引区结构;文件头结构由文件信息结构、媒体信息结构及内容信息结构组成;数据区结构由数据区头信息结构和媒体数据结构组成;索引区结构由索引区头信息结构和索引数据结构组成。本方法编码存储效率高,而且技术方案简洁,芯片实现复杂度低,支持VCR控制,支持自定义数据检索,易于推广,AVS媒体存储格式可推进AVS完整标准体系的技术标准进入网络化安全防范技术领域,广泛在计算机安全防范智能监控中应用。
文档编号H04N5/928GK101325681SQ200810117198
公开日2008年12月17日 申请日期2008年7月25日 优先权日2008年7月25日
发明者余和初, 林 楚, 蓉 聂, 政 谭 申请人:北京声迅电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1