一种鉴别数字音频aac格式编解码器的方法
【专利说明】-种鉴别数字音频AAC格式编解码器的方法
[0001]
技术领域
[0002] 本发明设及多媒体信号处理领域,具体设及一种鉴别产生数字音频AAC格式的编 解码器的分析方法。
【背景技术】
[0003] 随着科学的不断发展,形形色色的多媒体成为人们日常生活中必不可少的一部 分。存储空间小,音质效果好的AAC格式数字音频逐步取代mp3格式数字音频,占据主流地 位。正是由于AAC格式数字音频的兴起,各种各样针对AAC格式数字音频的编解码器应运而 生。种类繁杂的编解码器会产生不同的音质效果,但并不会留下明显的不同编解码器的痕 迹,运种区别并不大,运在音频取证等方面如何有效的鉴别出产生AAC数字音频的编解码器 提出了挑战。录音设备上的AAC编码器通常与音频编辑软件的编码器不一样,因此通过识别 数字录音的编码器来鉴定该录音的原始性和真实性。
[0004] 人们常用数字签名和水印技术来鉴别数字音频信息,然而不同编解码器产生AAC 文件时并不一定会留下认证信息,运两种方法适用于事先知道待测音频和不同编解码器加 密解密信息的情况,对现实生活中种类各样的编解码器产生AAC数字音频并且没留下任何 信息的情况并不适用。
[0005] 对产生AAC格式音频文件的编解码器进行鉴别,目前暂时还没发现有文献进行此 类工作。
【发明内容】
[0006] 为了克服上述现有技术的不足,本发明提出一种鉴别数字音频AAC格式编解码器 的方法,用于分析判断鉴别产生数字音频AAC格式的编解码器;本发明是依据数字音频在压 缩时MDCT系数会发生变化,进而导致化ffman编码的不同,不同的编解码器将产生不同的编 码结果。本发明方法将不同编解码器与同一编解码器的化ffman编码小值的差异组成特征 值,再利用SVM分类器分类,对鉴别产生AAC格式的数字音频的编解码器有很好的效果。
[0007] 为了实现上述目的,本发明的技术方案为: 一种鉴别数字音频AAC格式编解码器的方法,步骤如下: I) 数字音频集的构造: II) 不同编解码器压缩一次AAC音频集的构造:首先从CD中选取无损的WAV格式文件,裁 剪成若干10秒钟长度的音频片段,然后分别用不同编解码器W同一码率压缩成AAC格式的 音频,取得不同编解码器压缩一次的AAC音频集; 12)同一编解码器再次压缩音频集的构造:对步骤11)中生成的AAC文件用同一编解码 器进行解码得到WAV格式文件,再将它们用同一编解码器分别W相同的码率再次压缩成AAC 文件,得到同一编解码器再次压缩的音频集; 2) 音频集特征提取: 对上述得到的两种音频集,按W下方法提取特征: 21) 对上述两种AAC音频集进行解码,两次解码都用同一编解码器进行,根据AAC标准, 每帖提取1024个化f fman编码值; 22) 统计每个音频片段中所有帖的化ffman编码值为0的个数,±1的个数和W及±2的 个数和,然后除W帖数,得到平均每帖中〇,±1,±2的个数,将平均每帖中0,±1,±2的个数 称作Huffman小值; 23) 依据步骤22)中的方法,用不同编解码器压缩一次音频片段的化ffman小值减去用 同一编解码器再次压缩音频片段的化ffman小值,得到不同编解码器特征值; 3) 分类器的构造: 将步骤2)中得到的不同编解码器特征值进行训练,得到一个能鉴别分析产生AAC音频 信号的编解码器分类器模型Model; 4) 鉴别待测首频: 首先,将待测音频用同一编解码器解码,得到化ffman小值;然后,将解码得到的音频文 件再次用同一编解码器压缩成AAC文件,而后再解码,得到另一组化ffman小值;将运两组 化ffman小值相减,组成待测音频特征值;最后,利用步骤3)中训练出来的Model进行鉴别; 待测音频最接近哪一组编解码器的特征值,即判断产生待测音频的编解码器就是哪一种。
[0008] 现在市场上流行各种各样的移动媒体和存储介质,对AAC数字音频采用的编解码 器也各不相同。如在人们的生活中有各种各样的手机、电脑、平板、音乐播放器等等,怎样有 效的鉴别出产生AAC格式数字音频的编解码器是十分困难的。对一个AAC数字音频信号,本 发明通过分析其内在的本质特征W及不同的编解码器之间的差别,鉴定它是由哪一种编解 码器产生。
【附图说明】
[0009] 图1是本发明方法鉴别数字音频AAC编解码器流程图。
[0010]图2是AAC标准中解码流程图。
[0011] 图3是不同编解码器压缩一次化ffman小值分布图。
[0012] 图4是不同编解码器压缩一次与同一编解码器再次压缩化ffman小值差的分布图。
【具体实施方式】
[0013] 下面结合附图对本发明方法作进一步说明。
[0014] 本发明提出的一种鉴别数字音频AAC格式编解码器的方法,该方法鉴别待测音频 是由哪一种编解码器产生的过程十分简单,如图1所示。对于输入未知是由哪一种编解码器 产生的AAC格式的待测音频,首先,将其解码获得第一组化ffman小值。然后,将解码得到的 文件再次压缩,再解码获得第二组化ffman小值。最后,将两次获得的化ffman小值做差组成 待测音频的特征值,利用SVM分类器进行分类鉴别。具体步骤如下: I) 数字音频集的构造: II) 不同编解码器压缩一次AAC音频集的构造:首先选取无损WAV格式文件,包括中文歌 曲、外文歌曲、戏曲、钢琴曲、摇滚、爵±、古典等等各种各样的音频文件,包含的范围尽可能 广。将上述运些数字音频利用ffmpeg等音频编辑软件裁剪成若干10秒钟长度的音频片段, 然后分别用不同编解码器W同一码率压缩成AAC格式的音频,取得不同编解码器压缩一次 AAC音频集; 12)同一编解码器再次压缩音频集的构造:对步骤11)中生成的AAC文件用同一编解码 器进行解码得到WAV格式文件,再将它们用同一编解码器分别W相同的码率再次压缩成AAC 文件,得到同一编解码器再次压缩的音频集; 2)音频集特征提取: 对上述音频集中的每个音频片段,按W下方法提取特征: 21)对上述两种AAC音频集进行解码,两次解码都用同一编解码器进行,根据AAC标准, 每帖提取1024个化f fman编码值; 由于两次解码都需要采用同一编解码器,在本实施例中利用比较流行的开源的fdk_ aac化ttp: //sourcefo;rge. net/p/opencore-amr/JMk-aac/.)编解码器,通过在解码端增加 少量代码即可输出Huff man编码值。而后利用功能强大的开源ffmpeg (https : / / ffmpeg.cxrg/)对;Mk_aac进行编译,即可在音频解码时输出化ffman编码值。
[0015] 22)统计每个音频片段中所有帖的化ffman编码值