音频数字水印技术精.ppt
《音频数字水印技术精.ppt》由会员分享,可在线阅读,更多相关《音频数字水印技术精.ppt(108页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、音频数字水印技术音频数字水印技术第1页,本讲稿共108页6.1 概概 述述 6.1.1音频信号的数字化音频信号的数字化是指对模拟的声音信号进行A/D转换,使其转化为数字信号。这个过程有两个重要的参数:量化精度和瞬态采样频率。第2页,本讲稿共108页对高质量音频的量化方式最流行的格式是16bit线性量化,如Windows可视音频格式(WAV)和音频交换文件格式(AIFF)。另一种较低质量音频的量化方式一般采用8bit律量化。这些量化方法会使信号产生一些畸变,在8bit律量化中显得更为明显。第3页,本讲稿共108页6.1.2音频信号传送环境在实践中,含有水印的音频信号从编码到解码之间有多种可能的传
2、播途径。这里,我们仅考虑最普通的四种情形。第一种情形是声音文件从一个机器拷贝到另一个机器,其中没有任何形式的改变。第二种情形是信号仍然保持数字的形式,但采样率发生变化。第4页,本讲稿共108页第三种情形是信号被转换为模拟形式,通过模拟线路进行传播,在终端被重新采样。第5页,本讲稿共108页6.1.3对音频数字水印的要求要想成功地在数字音频媒体中隐藏水印,必须注意以下几方面的要求。1.对数据变换处理操作的稳健性要求水印本身应能经受得住各种有意无意的攻击。典型的攻击有添加噪声、数据压缩、滤波、重采样、A/D-D/A转换、统计攻击等。第6页,本讲稿共108页2.听觉相似性数字水印是在音频载体对象中嵌
3、入一定数量的掩蔽信息,为使得第三方不易察觉这种嵌入信息,需谨慎选择嵌入方法,使嵌入信息前后不产生听觉可感知的变化。3.是否需要原始数据进行信息提取根据数据嵌入和提取方案的不同设计,有些方案可以不需要借助于原始数据进行信息提取,这一性能将影响方案的用途和性能。第7页,本讲稿共108页4.数据提取误码率数据提取误码率也是音频水印方案中的一个重要技术指标,因为一方面存在来自物理空间的干扰,另一方面信道中传输的信号会发生衰减和畸变,再加上人为的数据变换和攻击,都会使数据提取的误码率增加。5.嵌入数据量指标根据用途的不同,在有些应用场合中必须保证一定的嵌入数据量,如利用音频载体进行隐蔽通信。第8页,本讲
4、稿共108页6.1.4数字音频水印系统的典型应用随着音频素材在互联网上的指数级增加,数字音频水印技术有着广泛的应用前景:(1)为了便于对音频素材进行查找和检索,可以用水印技术实现元数据(描述数据的数据)的传输,就是用兼容的隐藏的带内方式传送描述性信息。第9页,本讲稿共108页(2)在广播领域中,可以用水印技术执行自动的任务,比如广播节目类型的标识、广告效果的统计分析、广播覆盖范围的分析研究等。其优点是不依赖于特定的频段。(3)用水印技术实现知识产权的保护,包括所有权的证明、访问控制、追踪非法拷贝等。这也是水印技术最初的出发点。第10页,本讲稿共108页6.2 人类听觉特性人类听觉特性 频域掩蔽
5、算法的具体实现步骤如下:(1)计算频谱。对每16ms的信号s(n),其采样点数N=512,用Hamming窗h(n)进行加窗处理(6-1)第11页,本讲稿共108页s(n)的功率谱由下式得到(6-2)第12页,本讲稿共108页(2)确定纯音和噪音成分。这样做是因为纯音和噪音的掩蔽模型不同。如果某个频谱成分的局部极大值(S(k)S(k+1)且S(k)S(k-1),满足下式:S(k)-S(k+j)7dB j-2,+2,if2k63 j-3,-2,+2,+3,if63k127(6-3)j-6,-5,-2,+2,+5,+6,if127k250则该成分是纯音。(6-4)第13页,本讲稿共108页(3)去
6、除被掩蔽成分,分为以下两步:根据如图6-1所示的绝对听阈曲线,把在绝对听阈以下的纯音和噪音成分去除。对相互间隔小于0.5Bark的多个纯音成分只保留其中有最大值的那一个。第14页,本讲稿共108页图6-1绝对听阈曲线图第15页,本讲稿共108页(4)计算局部掩蔽阈值与整体掩蔽阈值。对原始的N/2(即256)个频域采样点(用k代表),只有其中的一部分采样点(用i代表)被用来计算整体掩蔽阈值。层和层所用到的采样点不同。层:频带被划分为30个子带,最低频6个子带中所有采样点都用到,接下来的6个子带的采样点每2个用到1个,余下的18个子带的采样点每4个用到1个。第16页,本讲稿共108页层:频带被划分
7、为30个子带,最低频3个子带的所有采样点都用到,接下来的3个子带的采样点每2个用到1个,接下来的6个子带的采样点每4个用到1个,余下的18个子带的采样点每8个用到1个。共用到采样点132个。第17页,本讲稿共108页(5)掩蔽是可以叠加的,因而在z(i)处具有的总掩蔽阈值LTg(i)为z(i)处的安静时阈值LTq(i)和所有临(6-8)第18页,本讲稿共108页6.3 时域音频水印算法时域音频水印算法 6.3.1最不重要位方法最不重要位方法是一种最简单的水印嵌入方法。任何形式的水印都可以转换成一串二进制码流,而音频文件的每一个采样数据也是用二进制数来表示。这样,可以将每一个采样值的最不重要位(
8、多数情况下为最低位)用代表水印的二进制位替换,以达到在音频信号中嵌入水印的目的。第19页,本讲稿共108页6.3.2基于回声的水印算法利用回声嵌入水印的算法是一种经典的音频水印算法。它利用了人类听觉系统的另一特性:音频信号在时域的向后屏蔽作用,即弱信号在强信号消失之后变得无法听见。弱信号可以在强信号消失之后50200ms的作用而不被人耳察觉。第20页,本讲稿共108页设音频序列S=s(n),0nN,按下式即可得到含有回声的音频序列Y:y(n)=s(n),0nm s(n)+s(n-m),mnN(6-9)第21页,本讲稿共108页图6-2回声编码水印嵌入流程图第22页,本讲稿共108页在实际的应用
9、中,为了提高水印嵌入的效率,Gruhl采取的方法如下:(1)假设要嵌入的水印比特为“1011001”,先将整个音频信号分成如图6-3所示的7段。(2)分别使用式(6-9),得到延时分别为m0和m1的两个含有回声的信号,如图6-4所示。(3)构造“1”混合信号和“0”混合信号,如图6-5所示。第23页,本讲稿共108页图6-3将原始信号分为小段以嵌入数据第24页,本讲稿共108页图6-4产生“1”和“0”回声信号(用虚线表示)第25页,本讲稿共108页图6-5构造混合信号第26页,本讲稿共108页(4)将延时为m0的信号和“0”混合信号相乘,延时为m1的信号和“1”混合信号相乘,最后将两个信号相
10、加得到含水印信号。第27页,本讲稿共108页图6-6回声编码水印提取流程图第28页,本讲稿共108页回声水印的嵌入过程也可以看作音频信号和一个回声内核进行卷积,回声内核如图6-7所示。图中m是回声延时,是回声的衰减系数。第29页,本讲稿共108页图6-7回声内核第30页,本讲稿共108页6.3.3其他的时域水印方法虽然最不重要位方法有一些局限性,但由于时域水印算法运算速度快,因此除了对回声算法进行研究外,一些学者对时域的其他算法进行了深入研究,提出了一些新的算法。第31页,本讲稿共108页Kim等认为将水印信号嵌入时域中每一个样点会使人耳产生感知,他们每间隔一定的距离(35个样点),通过修改样
11、点的幅度值而嵌入水印。在水印检测时不需要原始音频信号,而是根据嵌入水印的样点附近的样点值估计该点的原始值,进而获得嵌入的水印。第32页,本讲稿共108页Lie等提出的方法与Kim的方法类似,不同处是将每个比特的水印信号嵌入到一段音频信号中。具体算法如下所述。水印嵌入算法:将音频信号f(x)分段,每段长度为L。将任意相连的三段分别记为sec_1、sec_2和sec_3。每段的能量定义为:(6-10)第33页,本讲稿共108页其中xi表示sec_1的起始样点。将三段的能量按从大到小进行排列,重新表示为Emax、Emid和Emin。计算它们的能量差:A=Emax-Emid B=Emid-Emin(6
12、-11)第34页,本讲稿共108页(1)当水印比特为1时,如果A-B=Emax-2Emid+Emin(Emax+2Emid+Emin)d,则不对信号修改;否则增加Emax或减小Emid,直至A-B(Emax+2Emid+Emin)d。(2)当水印比特为0时,如果B-A=2Emid-Emin-Emax(Emax+2Emid+Emin)d,则不对信号修改;否则增加Emid或减小Emin,直至B-A(Emax+2Emid+Emin)d。第35页,本讲稿共108页图6-8使用三个相邻的样点段以嵌入水印示意图第36页,本讲稿共108页图6-9段边界处的渐变加权曲线第37页,本讲稿共108页6.4 变换域
13、音频水印算法变换域音频水印算法 6.4.1相位水印算法相位水印算法利用人耳听觉系统对绝对相位不敏感以及对相对相位敏感的特性,使用代表水印数据的参考相位替换原始音频段的绝对相位,并对其他的音频段进行调整,以保持各段之间的相对相位不变。相位编码的具体步骤如下:第38页,本讲稿共108页(1)设原始音频序列为 S=s(i),0iL(6-13)将S分割成N个等长的小段 sn=sn(i),0nN,0iK(6-14)其中K=L/N。第39页,本讲稿共108页(2)对第n段sn(i)进行K点的离散傅里叶变换(DFT)。生成相位矩阵n(k)和幅度矩阵An(k)(0kK)。(3)计算并存储相邻段对应频点的相位差
14、n+1(k)=n+1(k)-n(k)(6-15)其中0nN-1,0kK。第40页,本讲稿共108页(4)设水印序列W=wk,0kK),wk0,1。用下式定义wk所代表的相位值ifwk=1ifwk=0(6-16)第41页,本讲稿共108页(5)对0nN,利用相位差重新产生相位矩阵:(6-17)第42页,本讲稿共108页(6)利用修改的相位矩阵n(k)和原始幅度矩阵An(k)(其中0nN,0kK)进行IDFT,生成含水印的音频信号。第43页,本讲稿共108页水印解码时,首先要获得含水印音频信号的同步信息,信号段的长度、DFT变换点数都应该为解码方所了解。具体说来,解码过程分以下三步:(1)在已知发
15、送方信号段长度的情况下,将接收到的音频信号分段。(2)提取出第一段,对它做DFT,计算相位值。(3)根据相应的阈值,对相位值进行检测,得到0或1值,构成水印序列。第44页,本讲稿共108页6.4.2扩频水印在通常的通信信道中,为保持有效的带宽和降低能量,总是需要把信息集中在尽可能窄的频谱范围内。另一方面,基本的频谱扩展技术是将编码数据分布到尽可能多的频谱中去,以便对信息流进行编码。第45页,本讲稿共108页使用DSSS方法的音频数字水印的例子,水印嵌入的步骤如下:(1)设水印序列为P,其长度为L:P=pi,0iL,pi-1,+1。(2)设切普速率(ChipRate,扩频倍数)为cr,使用cr=
16、C对P进行比特重复(过采样),形成调制信号:ck=pi,其中(i-1)C+1kiC。第46页,本讲稿共108页(3)设有一个伪随机m序列,将m序列的元素由0,1映射为+1,-1,得到新的序列M=mk,0kLC,mk-1,+1,使用mk对调制信号ck扩频,生成扩频水印信号wk:wk=ckmk,其中0kLC。(4)设待嵌入水印的音频信号为S,其长度为LC:S=sk,0kLC,利用下式得到嵌入水印后的信号:第47页,本讲稿共108页6.4.3离散傅里叶变换域(DFT)方法Tilki和Beex提出了一种DFT变换域音频水印嵌入算法,这种变换的频谱范围是08kHz。首先对音频信息进行DFT,然后选择其中
17、频率范围为2.46.4kHz的DFT系数进行水印嵌入,并用表示水印序列的频谱分量来替换相应的DFT系数。第48页,本讲稿共108页6.4.4离散余弦变换域(DCT)方法YeWang14提出了在时域对信号进行序列变换,在频域加入水印的方法。他首先根据伪随机序列重新排列音频采样信号,然后对序列进行修正离散余弦变换(MDCT,Modified Discrete Cosine Transform),通过对MDCT的系数进行改变以嵌入水印,然后再进行逆变换得到嵌入水印后的音频序列。使用的MDCT公式为(6-18)第49页,本讲稿共108页逆变换为(6-19)第50页,本讲稿共108页1.线性移位寄存器如
18、图6-10所示的n级线性移位寄存器电路,每级寄存器可取0或1这两个状态之一,各级寄存器抽头,即乘法器系数ci=0或ci=1,但cn=1。设移位寄存器的初始状态为(an-1,an-2,a1,a0),它对应的十进制数为s1,当加上一个移位脉冲时,每一级的内容右移给下一级,最末一级即第n级的内容a0就是输出,同时n个寄存器中的内容按图中的连线送至模2加法器中,运算后反馈到第一级中去,第51页,本讲稿共108页于是经过一次移位以后移位寄存器的内容变为(an,an-1,a2,a1),它对应的十进制数为s2,其中an满足关系式(6-20)第52页,本讲稿共108页图6-10n级线性移位寄存器第53页,本讲
19、稿共108页2.水印的嵌入(1)对原始语音信号x(n)进行DCT变换。设每帧语音信号长度为N,由下式得到DCT域的序列y(k):(k=0,1,2,N-1)(6-21)第54页,本讲稿共108页(2)选取序列y(k)的前m个值(不包括y(0)作为添加水印的位置,同时应满足m=2n,其中n为整数。(3)利用伪随机序列发生器,产生一均值为0,方差为1的正态分布随机序列w(n),n=1,2,m。(4)将序列重置,还原成,用下式进行IDCT变换,得到时域中嵌入水印的音频信号,即n=0,1,2,,N-1(6-23)第55页,本讲稿共108页3.水印的检测对待检测信号(n),重复上述步骤(1)、(2)得到D
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 音频 数字 水印 技术
限制150内