基于相位谱差值的wav音频压缩历史检测算法-周劲蕾.pdf
《基于相位谱差值的wav音频压缩历史检测算法-周劲蕾.pdf》由会员分享,可在线阅读,更多相关《基于相位谱差值的wav音频压缩历史检测算法-周劲蕾.pdf(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第29卷第4期2016年4月模式识别与人工智能PRAIV0129 No4Apr 2016基于相位谱差值的WAV音频压缩历史检测算法周劲蕾 王让定 金超 严迪群 陈亚楠(宁波大学信息科学与工程学院宁波31521 1)摘要音频压缩历史检测是音频取证领域的重要部分,有助于检测音频是否经过篡改和伪造文中提出基于相位谱差值统计特征的WAV音频压缩历史检测算法利用相位谱差值的均值、方差及峰度作为检测特征,能较准确地判断待测WAV音频是否被常见的4种编码器中的任一种进行压缩解压处理,并能进一步估计该WAV音频被压缩时采用的比特率实验表明文中算法能有效检测WAV音频的压缩历史,且性能优于现有算法关键词WAV音
2、频,压缩历史,相位谱差值中图法分类号TP 391 DOI 1016451jcnkiissnl003-6059201604010引用格式周劲蕾,王让定,金超,严迪群,陈亚楠基于相位谱差值的WAV音频压缩历史检测算法模式识别与人工智能,2016,29(4):376384Compression History Detection for WAV Audio Based onPhase Spectrum DifferencesZHOU Jinglei,WANG Rangding,JIN Chao,YAN Diqun,CHEN Yanan(Faculty ofElectrical Engineering
3、 and Computer Science,Ningbo University,Ningbo 315211)ABSTRACTAs an important branch of audio forensics,audio compression history detection is of greatsignificance for audio tampering and forgery detectionIn this paper,a WAV audio compression historydetection algorithm is proposed based Oil the stat
4、istics of the phase spectrum differencesThe meanthevariance and the kurtosis of phase spectrum differences are utilized as the detection featuresTheproposed algorithm can determine whether the suspicious WAV audio is compressed and decompressed byany of the four popular encodersFurthermore,the bit r
5、ate used in the compression cab also beestimatedExperimental results show that the performance of the proposed algorithm is better than that ofstateobthe-art detection algorithmsKey Words WAV Audio,Compression History,Phase Spectrum Difference国家自然科学基金项目(No61300055,61301247)、浙江省自然科学基金项目(NoLYl5F020002
6、)资助Supposed by National Natural Science Foundation of China(No61300055,61301247),Natural Science Foundation of ZhejiangProvince(NoLZl5F020002)收稿日期:20150514;修回13期:20150730;录用日期:20150906Manuscript received May 14,2015;revised July 30,2015;accepted September 6,2015万方数据4期 周劲蕾 等:基于相位谱差值的WAV音频压缩历史检测算法Cita
7、tion ZHOU J L,WANG R D,JIN C,YAN D Q,CHEN Y NCompression History Detection forWAV Audio Based on Phase Spectrum DifferencesPattern Recognition and Artificial Intelligence,2016,29(4):376384随着多媒体和社交网络技术的发展,音频、视频、图像等多媒体信息快速增长,在给人们生活带来便利和娱乐的同时,也存在许多信息安全的隐患为了应对这类安全隐患,产生了多媒体取证技术,并得到迅速发展音频取证作为多媒体取证的重要组成部分,
8、受到越来越多研究者的关注,具有广阔的发展前景音频压缩历史检测是音频取证技术中被关注的热点问题之一,其目的是检测音频被压缩的次数及每次压缩时使用的比特率通常对音频进行篡改或伪造时均会引入解压、压缩等操作,从而导致音频压缩历史的改变因此音频压缩历史检测是判断音频是否被篡改或伪造的必要程序,该研究对促进音频取证技术的发展具有重要意义近年国内外研究者对压缩域音频(如MP3等)的压缩历史检测开展研究,并取得一些研究成果Dalessandro等通过分析不同比特率下音频的功率谱,发现其在16 kHz至20 kHz频带内呈现不同分布,从而提出通过频谱分析检测MP3音频真实比特率的方法Liu等旧1通过修正离散余
9、弦变换(Modifled Discrete Cosine Transform,MDCT)系数绝对值高于设定阈值的比例,实现单压缩音频和双压缩音频分类,但该阈值的设定基于作者实验的经验值Qiao等1使用小值MDCT系数数量、相邻帧间过渡连续性及系数离散数值分布等特征进行双压缩音频检测Bianchi等H。1通过对待测音频解压、裁剪及压缩操作等,获得新的MDCT系数分布直方图,分析待测音频原始MDCT与新的MDCT系数分布直方图间的差异,以此判断音频是否经过二次压缩Ma等【61通过研究Huffman码表的统计特性及其转移概率,提出有效的音频二次压缩检测方法然而,目前对非压缩域音频的压缩历史检测研究关
10、注较少非压缩域音频是指未经压缩的无损数字音频,如最常见的WAV音频与压缩域音频相比,这类音频更易遭受篡改和伪造,尤其是在音质伪造方面因此可通过检测WAV音频的压缩历史,判断其是否经过有损编码器压缩解压处理,从而有效推断WAV音频音质是否经过伪造Luo等1通过提取MDCT系数作为其压缩历史检测的有效特征,检测是否经过有损编码器压缩解压,在此基础上检测压缩时采用的比特率Luo等1通过增加梅尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)作为检测特征,提高算法检测准确率,但特征维数却也相应增加本文通过研究音频频谱在多次压缩过程中的不同变化,发现频谱在每次压
11、缩时均会产生失真,其中相位谱失真更明显根据相位谱的变化,研究WAV音频压缩前后相位谱差值(Phase Spectrum Differ-ences,PSD)的统计特性,提出WAV格式音频的压缩历史检测算法,该算法特征维数相对较低实验表明本文算法检测准确率较高,能有效检测WAV音频的压缩历史,并能检测WAV音频是否经过MP3、AAC、OGG及WMA中的任一种编码器压缩解压处理,同时能进一步检测其被压缩时采用的比特率1 基于相位谱差值的WAV音频压缩历史检测算法心理声学模型是音频编码的基础,它在保证音频压缩效率的前提下,获得符合人耳听觉效应的高效音质由于人耳易察觉音频信号幅度的变化,却对相位的变化不
12、太敏感,所以音频编码标准,如常见的MP3编码标准(ISOIEC 111723)和AAC编码标准(ISOIEC 138187)均会在编码时控制频谱中幅度的失真情况,但未考虑相位失真情况而相位谱反映信号方向随频率变化的规律,在一定程度上包含的信息量高于幅度谱一。1 0|基于上述分析,本文对WAV音频进行压缩解压处理,研究得到的压缩前和解压后的相位谱变化研究发现,原始未压缩的WAV音频经过压缩解压处理后,相应位置相位的差异较大;反之,对已经过有损压缩解压处理的WAV音频再次进行压缩解压处理,其相应位置相位的变化较小这是因为音频压缩过程实际是一个有损的去除冗余过程,在此过程中音频通常会产生不可逆的失真
13、,从而导致原始WAV音频相位谱产生较明显的变化但经过有损压缩解压处理的WAV音频信号已产生不可逆的失真,对这类WAV音频进行再次压缩解压处理,失真量会大幅减小,使其相位谱变化相对较小综合上述分析,本文以压缩前后相位谱的失真大小作为判断WAV音频压缩历史的依据,提出基于相位谱差值统计特性的万方数据378 模式识别与人工智能 29卷检测算法11相位谱差值本文算法首先根据待测音频提取相应的相位谱差值,如图1所示对待测音频加1进行一次压缩和解压,即w2=O(E(w1),其中,砣表示彬1经过压缩和解压后的音频;E()表示MP3压缩过程,压缩算法是Lame 3995(http:lamesfnet),参数设
14、置为CBR 128 kbps;D()表示音频解压过程,解压算法为Lame 3995然后分别对WAV音频埘1和砚采用汉明窗分帧,每帧有l 152个采样点,相邻两帧之间有50的差值重叠一首WAV音频分成帧,当最后一帧不足1 152个采样点时,舍弃该帧,将J7v帧音频分别记为frame。l(i)和frame砬(i),i=1,2,对这些音频帧分别进行离散傅里叶变换,根据实序列离散傅里叶变换的共轭对称性,选取前576个值,即X。(i)=DFTframe。,(i),k(i)=DFTframe以(i),其中,i=1,2,N,DFT表示离散傅里叶变换,瓦。(i)和X砬(i)分别表示埘1和训2第i帧的前576个
15、离散傅里叶变换值分别计算每帧相位谱,记为妒。(i)、妒以(i),计算每帧的相位谱差值吼(i):pd(i)=妒“(i)一9砬(i)L逐签理_一一一一一j图1 相位谱差值提取流程图Fig1 Flowchart of phase spectrum differences extraction图2为随机选取的一帧WAV音频的相位谱8嚣4恕0墨一480 64 128 192 256 320 384 448 512 576采样点(a)原始WAV音频(a)Original WAV audio采样岸(b)由128 kbps MP3解压得到的WAV音频(b)WAV audio decompressed by 1
16、28 bps MP3图2 WAV音频相位谱差值Fig2 Phe spectrum differences of WAV audio从图2可看出,相比原始WAV音频的相位谱差值,经过MP3压缩过的WAV音频相位谱差值明显减小12特征构造本文算法根据相位谱差值构造检测特征,为表征相位谱差值的变化程度,选取均值、方差及峰度3种统计特性描述相位谱差值的集中趋势、离散程度及分布形态的陡缓程度假设一段音频总采样点数为S,可将S分成1 152N个采样点,为总帧数利用11节所述方法提取每帧相位谱差值,构成一个576N的相位谱差值矩阵P:P=pd(1)pd(2)pd()d11d2,1d5761dI。2d22也7
17、62其中,哆i为第i帧中的第歹个相位谱差值,=1,2,576,i=1,2,N,Pd(i)=叱,d2。一,以椰,为第i帧相位谱差值h毛;Edd卯d丽一5一一hf1昏卜一JI止一。冀1而_l一6醚万方数据4期 周劲蕾等:基于相位谱差值的WAV音频压缩历史检测算法对P中每个行向量嘭,。,嘭2,哆,分别求取相应的统计特性均值、方差吩和峰度砖:2亩荟哆p1_lv巧2亩荟(嘭,i一)2,巧=丽1 2蚤(aI厂鸭)4,J=1,2,576,从而得到由576个相位谱差值均值、方差及峰度构成的5763统计特性矩阵F:F=ml 口l k1m2 秽2 k2t厶,:2厶2:,六3:m576秽576 k576J u76。
18、l六762正763F虽能直接作为本文算法的特征矩阵,但维数过高,在保证算法检测率无明显下降的前提下,可简化特征,有效减低特征维数将每576个特征分成若干组,求得每组特征的均值作为最终的构造特征具体操作如下将F中特征值重新记为Z川J=1,2,576,l=1,2,3将F的每列向量分为18组,每组32个统计特性,每组统计特性求取均值, 1 Lz7;出(I-I)t。, (1)uJ 21其中,t=1,2,18,7,=1,2,3,L=32表示每32个统计特性为一组得到由318组统计均值Z。构成的特征矩阵F:F=M V K,其中M=M”1,一,811、V=M,22,82、K=”五”,83T分别为相位谱差值的
19、均值、方差及峰度特征为反映F的整体规律,首先提取2 000段原始WAV音频,及2 000段分别由各种比特率的MP3、AAC、OGG和WMA音频压缩解压后的WAV音频的相位谱差值然后将相应的2 000段音频特征归一化至一1,1,并求取归一化后的均值,如图3所示图3中,横坐标1,18、19,36及37,54这3组区间对应的特征值分别为18维相位谱差值均值、方差及峰度与原始WAV音频相比,经过有损编码器压缩解压处理后的WAV音频在相位谱差值的均值特征上有明显差异在不同压缩比特率下,音频相位谱差值也有一定的变化规律,即比特率越高,相位谱差值的方差值越大,峰度值越小通过图3所示的规律及实验验证,前8维均
20、值特征及第18维方差特征对检测率并无贡献因此,本文仅选取后10维均值、前17维方差及18维峰度(共45维)作为本文算法特征F磊磊而丁=瓦面习l+64kbps 一128 kbpsIl一8()kbps 一160kbpsI均值 峰度 p-豫,、 。-、窖1_ 硷划 蕊劳l一原始WAV+96 kbpsI一64kbps 一128kbpsll+8()kbps 一160kbpsl均值 方差 峰度 一一 -一越 辫r。_I_|+! 蛆” l :l=7“万方数据380 模式识别与人工智能 29卷 -I- _fl 蘑:糖W,m 0 罐(d)WMA图3 原始WAV音频及经过MP3AAC0GGwMA解压后的WAV音频
21、特征归一化后的均值Fig3 Original WAV audios and means of the features withnormalization for the WAV audios decompressed byMP3AAC0GGWMA13算法步骤图4为本文的待测WAV音频的压缩历史检测算法的具体流程,具体实现步骤如下算法 基于相位谱差值的WAV音频压缩历史检测算法step 1 提取待测WAV音频的相位谱差值统计特性,根据12节描述方法构造一个45维的特征组step 2 将该特征组输入LIBSVM分类器,并依据模型Model 1判断该音频是否为原始WAV音频若是,输出检测结果;否则
22、,执行step 3,进一步解析该WAV音频的压缩历史step 3根据step 2的结果,在Model 2一Model 5中选择相应的训练模型并执行step 4假如step 2的结果为该待测WAV音频经过MP3压缩解压处理,选取Model 2;同样,若该音频为经过AAC、OGG或WMA压缩解压处理的WAV音频,分别选Model 3、Model 4或Model 5step 4 根据step 3选择的训练模型对待测WAV音频的原始比特率进行估计,判断其相应属于64 kbps、80 kbps、96 kbps、128 kbps、160 kbps中的哪一种,并输出结果这里,模型Model 1表示由原始WA
23、V音频,以及MP3、AAC、OGG、WMA解压后的WAV音频等5类音频的特征训练得到的模型;Model 2表示由5类不同比特率64 kbps、80 kbps、96 kbps、128 kbps、160 kbps的MP3压后WAV音频的特征训练得到的模型;同样,Model 3、Model 4及Model 5分别为在AAC、OGG及WMA情况下训练得到的模型2 实验及结果分析图4 本文算法流程图Fig4 Flowchart of the proposed algorithm本文通过互联网下载及CD光盘抓轨等方式获取2 000段未经任何编码器压缩解压的原始WAV音频样本,获得的WAV音频均为双声道音频
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 相位 差值 wav 音频 压缩 历史 检测 算法 周劲蕾
限制150内