一种基于差分dct系数对直方图的图像取证方法-杨富圣.pdf
《一种基于差分dct系数对直方图的图像取证方法-杨富圣.pdf》由会员分享,可在线阅读,更多相关《一种基于差分dct系数对直方图的图像取证方法-杨富圣.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第1期2016年1月电 子 学 报ACTA ELECTRONICA SINICAV0144 No,lJan 2016一种基于差分DCT系数对直方图的图像取证方法杨富圣,高铁杠(南开大学软件学院,天津300071)摘要: 提出了一种基于差分DCT域系数对直方图的图像拼接篡改检测方法该方法首先对图像进行DCT变换,而后分别计算DCT系数矩阵的水平、垂直、主对角线、副对角线四个方向的差分DCT系数矩阵,并对得到的差分DCT系数矩阵进行系数对直方图化,提取特征向量最后,利用支持向量机对真实图像和篡改后的图像进行分类识别实验结果表明,在相关的测试数据集上,和现存的一些算法相比,该方法不仅具有较低的计算复
2、杂度,同时,其检测性能在目前所有提出的算法中达到最高,性能优良关键词: 图像取证;差分DCT系数;系数对直方图;支持向量机中图分类号:TN9117 文献标识码: A 文章编号:03722112(2016)01-0008-06电子学报URL:http:wwwejournalorgcn DOI:103969jissn03722112201601002An I mage Forensic Algorithm Based on DifferentialCoefficient-Pair Histogram in DCT DomainYANG Fusheng,GAO Tiegang(College of
3、Software,Nankai Universit),Tianfin 30007 1,China)Abstract: An image forensic method based on coefficientpair histogram of differential DCT coefficient was pro-posedIn the method,the image is firstly transformed by DCT,and then the differential DCT coefficient of four directions,such as horizontal di
4、rection,veaical direction,diagonal direction and the second diagonal direction are computedAfter that,the coefficientpair histogram for each differential DCT coefficient is calculatedFinally,suppoa vector machine(SVM)isused to classify the authentic and spliced image through training the feature vec
5、tors of authentic and that of tampered imageThe experimental results show that the proposed approach not only has low computing complexity,but also outperforms allthe stateof-theart methods in detection rate on the same test databaseKey words: image forensics;differential DCT coefficient;coefficient
6、-pair histogram;suppoa vector machine1 引言准确鉴定一幅数字图像的真伪已经成为信息安全领域一个热点课题理论上,数字图像取证包括主动取证和被动取证两个方面由于主动取证需要事先向图像中嵌入特定的信息,其应用范围受到很大限制而被动取证则适用于所见到的任何图像根据对图像的篡改种类,人们已经提出了多种图像被动取证算法,如面收稿日期:2014-05-28;修回日期:2015-06-24;责任编辑:李勇锋基金项目:天津市自然科学基金重点项目(No1l JCZDJCl6000)向复制一粘贴的篡改取证算法、面向对比度增强的篡改取证算法、面向JPEG压缩的篡改取证以及面向图像
7、缩放的篡改取证技术等一。9图像拼接篡改是常见的图像篡改方式之一,这种篡改操作所引起的图像统计特征的变化正是人们需要发现并以此识别图像真伪的手段例如,人们应用高阶矩谱、双向干谱等进行图像合成的篡改识别1”。,利用双向干谱相关特征进行图像拼接篡改的识别率可以达万方数据第1期 杨富圣:一种基于差分DCT系数对直方图的图像取证方法 9到722I;Shi提出了一种自然图像模型进行拼接合成图像取证的正确率达到了801511引;Chen则利用二维相位一致性和小波特征函数的统计矩特征识别成功率达到了8232rl 4。;而Shi利用小波矩特征和马尔科夫特征组成的融合特征进行拼接图像的识别,成功率高达9187。5
8、jSutthiwan等提取图像频域的二阶矩特征达到了平均979的识别率、1He等人利用图像DCT域扩展马尔科夫转移概率特征和小波域的转移概率特征的融合,实现了9342的图像拼接检测识别率1Sahar等利用多尺度Weber Local Descriptors(WLD)在图像的色度空间进行特征提取,达到了9661的平均识别率”上述提出的方法中,有的计算复杂度较高,而有的则识别率较低,一个良好的图像篡改检测算法不仅应该具有较低的运算复杂度,而且其识别率应该达到较高的水平,基于这种思想,本文提出了一种融合差分DCT系数和系数对直方图的图像拼接篡改检测方法该方法的特征向量基本维数为324,通过降维处理,
9、特征向量的维数可以降低为50;同时,该算法的识别率达到了99以上,超越了目前所有公开出版算法中的篡改检测识别率2 基于差分DCT系数的图像拼接检测21离散余弦变换(Discrete Cosine Transform)离散余弦变换在数字水印和图像处理领域中的应用较为广泛在图像压缩和处理领域广泛使用的JPEG标准也应用了DCT作为变换方法c(“,”)=n(M)n(”)f(x,y) s警cos紫(1)08l1rj8l矿J【J J“=0M=l,2,M一1咖):J亩,归o【俩, :l,2,一l其中,C(M,口)称为DCT系数22差分DCT系数差分DCT系数矩阵可以减少图像内容相关性对检测结果的影响,这是
10、因为图像经过DCT变换后的系数不服从高斯分布,所以这些系数间存在统计相关性。”将图像进行DCT变换后的系数矩阵,记为D(戈,Y),对D(X,Y)进行水平、垂直、主对角线、副对角线四个方向的差分计算,得到的系数矩阵分别记作D。,D。巩,D。其中,互,Y是DCT系数矩阵的索引差分矩阵计算式如下:D。(x,Y)=I D(z,Y)lI D(x+1,Y)I (2)D(算,Y)=ID(z,Y)IID(x,Y+1)I (3)D,(戈,Y)=I D(戈,Y)ll D(戈+1,Y+1)I (4)D,。(戈,Y)=I D(z+l,Y)II D(戈,Y+1)l (5)为了验证差分DCT系数的性质,随机选取CASIA
11、图像库1000次进行抽样,并分别计算样本空间中各个图像水平方向差分DCT系数的直方图,再求取各个样本点的期望值,得到的系数分布图如图1所示其中,横坐标代表差分DCT系数的取值,纵坐标代表差分DCT系数为某一值时所占整幅图像的比例从图中可以看出差分后的DCT系数服从拉普拉斯发布,系数取值基本集中在以0为中心的较小的范围内,从而进一步验证了DCT变换后的系数问存在一定的相关性23 系数对直方图及其形式图像的直方图常用于隐写分析20。,Mahmood等通过对图像空域的直方图进行傅里叶变换,进而提取其Zernike矩特征进行图像对比度篡改的识别。21I借鉴图像的空域像素直方图思想,构造系数对直方图对于
12、一个大小为m X凡的矩阵,其系数对直方图的(i,j)位置上的数值代表矩阵序列化后系数值从数值i变换Nj发生的次数,即P(i,J)=6(F=i,F川=,) (6)f(mn)其中P代表发生的次数;6()为示性函数,当括号内条件成立时6()=l,否则6()=0;f(川,凡)代表mn的矩阵序列化后的序列,求和范围为整个序列,F。代表矩阵序列化后的某一位置的值系数对直方图的概念可以用二维离散型随机变量的联合分布律来定义,设s表示一个整数序列,从S中连续取两个数,设随机变量x表示第一次取到的数字,随机变量y表示第二次取到的数字则_7v(X=i,Y=j)=P(X=i,Y=,)N(i),其中(X=i,Y=,)
13、表示第一次取到数万方数据10 电 子 学 报 2016年字i且第二次取到数字,的有序数对个数,JP(X=i,Y=i)表示随机变量x,l,的联合分布律,N(i,j)表示s中可以取到的有序数对总个数J7r(X=i,Y=J)即为系数对直方图的概念24差分DCT系数对直方图对每个差分DCT系数矩阵,按照列序进行展开,转换成行向量在中设定一个阈值71,r的选取不能过小或者过大因为如果r过小,阈值处理后的差分DCT系数会丢失大量的边缘及纹理信息;如果71过大,会有过多的低频信息被统计进来,影响统计的效果;同时过大的丁还会引起特征向量维数的增大,增加计算的复杂度因此为了达到在识别率与计算的复杂度之间的均衡,
14、通过实验的方法进行阈值丁的选择表l是从CASIA图像库中随机选取1000张图像进行5次检测的平均结果,可以看出当T=4与T=6时方法同时具有较高的识别率,但是T=6时的特征向量维数是676维,而T=4时特征向量仅为324维,为了减小算法的计算复杂度,本文选择T=4表l不同阈值下的检测结果阈值r 维数 True Positive Rate True Negative Rate Accuratv2 100 6I88 6439 63143 196 5963 7774 68694 324 994l 9989 99655 484 9738 9707 97236 676 9963 9967 99657 9
15、00 9913 9935 9924计算满足一r,r区间的系数对直方图,记作CPH矩阵,显然,CPH矩阵的维数为(2T+1)(2T+1)当71为4时,一个差分DCT系数矩阵的维数为81生成四个差分DCT系数矩阵后,分别计算D。,D。DD。四个方向差分DCT系数矩阵的CPH矩阵,将四个CPH矩阵分别转换成行向量记作:,y。y。融合后得到向量,显然向量的维数为324该向量将用于进行分类训练和测试特征提取的流程图如图2所示3实验与结果分析31实验数据和条件实验数据库采用了CASIA v10数据库和CASIAv20数据库“,该库是目前流行的用于拼接检测评估的首选数据库相比于传统的哥伦比亚图像测试库,CA
16、SIA数据库的组成更加复杂,也更接近现实实验ijn,0试平台为Windows平台,测试软件选为Matlab R2013b图2差分DCT系数特征提取流程图32实验方法实验中使用支持向量机(SVM)作为分类器,并选取LIBSVM工具箱。”。分类时,将分类中所有的真实图像标记为“+1”,所有的拼接图像标记为“一1”,即得到一个二值分类问题对于CASIA v10进行测试时,随机选择56的真实图像和56的拼接图像作为训练集,剩下的16真实图像和16拼接图像作为测试集而对于CASIA v20,由于该库中图像的存储格式有三类(JPEG、BMP、TIFF),并且每一类包含的文件数目不同,为了使得提取的特征具有
17、致性,首先将BMP、TIFF格式图像用Q=100,压缩成JPEG格式其次,由于图像内容分为八大类,图像拼接区域的大小分为S(30拼接区域)、M(3060拼接区域)、L(拼接区域大于60)三类,图像拼接区域边界的后期处理又分为模糊和未处理为了训练集的完备性分别从各个类别中提取训练集中的图像在SVM训练过程中,核函数选择RBF,核函数中的gamma函数以及损失函数的设置通过网格寻优的方法得到用得到的训练模型对测试集数据进行检测33 实验结果将真实图像定义为正样本,拼接图像定义为为负样本这样,对于二值分类问题,SVM对一个测试样本有4种可能的判决结果,如下:TP(True Positive),被预测
18、为正的正样本个数;FN(False Negative),被预测为负的正样本个数;FP(False Positive),被预测为正的负样本个数;TN(True Negative),被预测为负的负样本个数;基于上述定义,采用四种定量参数描述SVM的分类效果,即TPR(True Positive Rate)、TNR(True NegativeRate)、检测准确率Accuracy和精确率Precision,计算公式如下:TD撇5赢(7)71,TNR2赫(8)万方数据第1 期 杨富圣:一种基于差分DCT系数对直方图的图像取让万法 11TP+77v ,n、 同的测试数据集,所以具有可比性表4和表5从特征
19、Accuracy 2而面i了万丽 p 向量的维数与识别率方面分别给出了在CASIA。10上Precisi。n=黑(10) 和cAsIA V2o上的对比结果在对CASIA v10进行的算法测试中,对含有667张真实图像和767张篡改图像的训练集进行训练,然后对133张真实图像和154张拼接图像的测试集进行检测十组训练集和测试集的检测结果见表2从表2可看出,真实图像的平均TPR为99925,拼接图像的平均TNR为99805,平均检测准确率为9986,平均精确率为9978对CASIA v20进行算法测试时,对含有1600张真实图像和1600张篡改图像的训练集进行训练,然后对400张真实图像和400张
20、拼接图像的测试集进行检测表3是十组分类过程的检测结果从表3可以看出,真实图像的平均TPR为999,拼接图像的平均TNR为98125,平均检测准确率为9902,平均精确率为9816表2 十组随机分类的图像库测试的结果识别个数 识别个数TPR TNR Aceuracv Precision测试总数 测试总数100 133133 100 154154 100 100loo 133133 9935 153154 9965 9925100 133133 100 154154 100 1009925 132133 100 154154 9965 100loo 133133 9935 153154 9965
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一种 基于 dct 系数 直方图 图像 取证 方法 杨富圣
限制150内