音频信息隐藏与水印算法课件.ppt
音频信息隐藏与水印算法1第1页,此课件共69页哦4.1 概述一、音频信号的数字化1、模拟数字 (A/D转化)量化精度和瞬态采样频率高质量音频的量化方式最流行的格式:16b线性量化低质量多采用8b律量化采样频率:8kHz、9.6kHz、10kHz、12kHz、16kHz、16kHz、22.05kHz和44.1kHz、2、压缩算法对数字化音频的影响。2第2页,此课件共69页哦概述二、音频信号传送环境 复制 重采样 数模数转化 空气中传播3第3页,此课件共69页哦概述3、对音频数字水印的要求对数据变换处理操作的稳健性听觉透明性是否需要原始数据进行信息提取数据提取误码率嵌入数据量指标安全性依赖因素4第4页,此课件共69页哦概述4、数字音频水印系统的典型应用便于对音频素材进行查找和检索执行自动任务知识产权保护5第5页,此课件共69页哦语音各个比特位的作用原始语音信号(“床前明月光”)6第6页,此课件共69页哦语音各个比特位的作用(1)去掉低2比特位的语音信号(声音信号听不出差别)7第7页,此课件共69页哦语音各个比特位的作用(2)去掉低4比特位的语音信号(声音信号听不出差别)8第8页,此课件共69页哦语音各个比特位的作用(3)去掉低6比特位的语音信号(声音中有极少的背景噪音,不易被察觉)9第9页,此课件共69页哦语音各个比特位的作用(4)去掉低8比特位的语音信号(声音中有较明显的背景噪音)10第10页,此课件共69页哦语音各个比特位的作用(5)去掉低10比特位的语音信号(声音中有很强的噪音,但话音仍较清晰)11第11页,此课件共69页哦音频数字水印技术 音频信号的特点一维信号人耳听觉系统(HAS)比人眼视觉系统(HVS)灵敏得多对音频水印的要求不可感知性稳健性同步要求盲水印12第12页,此课件共69页哦人类听觉特性 在音频文件中嵌入水印的各种方法一般都要利用人类听觉系统的某些特性,即人的听觉生理心理特性。20Hz20KHz;26个带通滤波器;音频掩蔽效应,分为时域掩蔽和频域蔽效应。掩蔽音,被掩蔽音;频域掩蔽:宽带噪声,纯音;频率高易掩时域掩蔽:前向掩蔽、后向掩蔽、同时掩蔽 心理声学特点:绝对相位不敏感,相对相位敏感同时对不同频率信号敏感程度不同。13第13页,此课件共69页哦频域掩蔽算法1)计算频谱。2)确定纯音和噪声成分3)去除被掩蔽成分4)计算局部掩蔽阈值与整体掩蔽阈值5)掩蔽是可以叠加的14第14页,此课件共69页哦15第15页,此课件共69页哦时域音频水印算法最低有效位方法(LSB)回声隐藏法 其他的时域水印方法 16第16页,此课件共69页哦其他的时域水印方法Kim等人的方法,等间隔修改样点的幅度值来嵌入水印。Bassia等人通过将水印信号与原始信号直接相加的方式实现了一个1比特水印算法。Mansour等人通过改变音频信号两个连续的最大值和最小值之间中间段的相对长度方法来植入数字水印。17第17页,此课件共69页哦变换域音频水印相位水印算法扩频水印算法DFT法DCT法DWT法18第18页,此课件共69页哦压缩域音频水印技术通常有3种方法可以得到带水印的压缩音频1、在非压缩域进行嵌入水印,再压缩;2、在压缩域上进行水印嵌入;这种方法避免了复杂的编解码过程,但稳健性不高,而且能够嵌入的水印容量不大3、解压后,将水印植入,再重新压缩。这种方法稳健性较高,但需要复杂的编码和解码过程,运算量大,实时性不好例1例219第19页,此课件共69页哦音频水印的分类在原始音频信号中嵌入在音频编码器中嵌入,这种方法稳健性较高,但需要复杂的编码和解码过程,运算量大,实时性不好在压缩后的音频数据流中直接嵌入,这种方法避免了复杂的编解码过程,但稳健性不高,而且能够嵌入的水印容量不大(压缩域数字水印)20第20页,此课件共69页哦基于内容的音频水印技术思想:在水印过程中,充分利用媒体中重要的数据特征,既可以直接使用特征进行水印的嵌入和提取,也可以作为标准水印方法的辅助手段,用于确定水印嵌入的参考位置和方向。例子1:例子2:21第21页,此课件共69页哦数字音频水印的攻击Stirmark for audio里的攻击方法:一、动态改变:1)幅度压缩;2)降噪二、滤波:1)高通滤波;2)低通滤波;3)均衡;4)左右声道分离;三、回响:1)延时;2)混响;22第22页,此课件共69页哦四、转换:1)重采样 2)倒置五、添加噪声:六、调制:1)和声;2)镶边;3)增强;七、时域拉伸和单调变化 1)音调变化;2)时间拉伸;八、样点置乱 1)零插值;2)样点复制;3)样点置换;4)样点剪切。23第23页,此课件共69页哦抵抗同步攻击的几种方法1)穷举搜索2)显式同步3)自相关4)恒定水印5)隐含同步24第24页,此课件共69页哦音频水印需解决的问题缺乏有效的同步技术完善对数字水印方案的评价研究 寻找与新一代压缩标准MP3、MPEG相适应的数字音频水印算法 研究音频与视频结合的数字水印,达到对多媒体数据的完整保护 在实用性方面,研究数字水印的网络快速自动验证技术,降低水印提取算法的复杂性 25第25页,此课件共69页哦26第26页,此课件共69页哦计算频谱:对每16ms的信号s(n),其采样点数为N=512,用Hamming窗进行加窗处理计算s(n)的功率谱:27第27页,此课件共69页哦确定纯音和噪声成分。如果某个频谱成分的局部极大值(S(k)S(k+1)且S(k)S(k-1)满足下式:则是纯音28第28页,此课件共69页哦去除被掩蔽成分,分为以下两步。1)根据绝对听阈曲线,把在绝对听阈以下的纯音和噪声成分去除。2)对相互间隔小于0.5Bark的多个纯音成分,只保留其中的有最大值的那一个。29第29页,此课件共69页哦计算局部掩蔽阈值与整体掩蔽值。对原始的N/2个频域采样点,只有其中的一部分采样点被用来计算整体掩蔽阈值。层I和层II所用到的采样点不同。层I:频带被划分为30个子带,开始6个子带中所有频率点都用到,接下来的6个子带的频率点每2个用到1个,余下来的18个子带每4个频率用到1个。共用到108个频率。层II:频带被划分为30个子带,开始3个子带的所有频率点都用到,接下来的3个子带的频率点每2个用到1个,然后6个子带的频率点每4个用到1个,余下的18个子带每8个频率用到1个。共用到132个频率。30第30页,此课件共69页哦掩蔽是可以叠加的。31第31页,此课件共69页哦32第32页,此课件共69页哦最不重要位方法优点是本身简单易实现;音频信号里可编码的数据量大;安全性完全依赖于密钥;嵌入和提取算法简单,速度快。不足是容易引入可感知噪声;稳健性差。应用范围:通常只应用于封闭的数字到数字的环境下。33第33页,此课件共69页哦声音信号中的回声隐藏原理:人耳对一个较强声音后(或前)的极短时间内的较弱声音的不可察觉性方法:在数字声音信号中引入回声,引入回声的位置不同则代表了秘密信息 34第34页,此课件共69页哦回声隐藏算法嵌入原始信号 ,回声信号伪装信号为秘密信息为“0”,延迟为秘密信息为“1”,延迟为在语音信号中隐藏多个秘密信息比特把信号分段,每段隐藏一比特 35第35页,此课件共69页哦基于回声的水印算法利用了人类听觉系统的后向掩蔽作用。对一些有损压缩的算法具有一定的稳健性。具体算法:设音频序列S=s(n),0nN,则含有回声的音频序列Y为:36第36页,此课件共69页哦水印嵌入流程图如下:原始音频数据音频数据段回声混入含水印音频数据延时水印比特段组合分段衰减37第37页,此课件共69页哦回声隐藏算法提取同步对每段信号求倒频谱自相关值,自相关峰值出现的位置,就对应了秘密信息比特 38第38页,此课件共69页哦回声隐藏算法的特点回声隐藏算法的优点具有非常好的隐藏效果,并且具有较好的抗攻击能力,对于一般的数字信号处理如加入随机噪声、滤波、重采样和失真压缩等均具有较好鲁棒性该方法的弱点嵌入容量较小,计算量较大一般秘密信息嵌入量为2bps-64bps,其大小与传输环境和参数设计有关 要求信号同步39第39页,此课件共69页哦40第40页,此课件共69页哦41第41页,此课件共69页哦声音信号中的相位隐藏人类的听觉系统特别敏感,声音信号中微弱的噪声都能够被察觉出来。但是,听觉系统对声音的相位变化不太敏感,因此,可以考虑在声音的相位中隐藏信息 42第42页,此课件共69页哦声音信号中的相位隐藏嵌入将声音信号分段,分别进行DFT变换,得到每一段的幅频特性和相频特性对第一个信号片段的相位进行修改,根据嵌入比特为“0”或“1”决定相位。并且在保持后面相位差不变的情况下修改绝对相位结合原来的幅频特性和新的相位特性,计算傅立叶反变换,恢复语音信号 43第43页,此课件共69页哦具体步骤:1)设原始音频序列为S=s(i),0i1kHz;4、将音频帧按照预定义的类分类,并选择适合于该类的嵌入算法。67第67页,此课件共69页哦一种倒谱域音频盲水印的方法:嵌入方法:1、首先搜索时域中的突变点,用突变点之后的样点作为水印帧的起始点且每帧长度为2p 2、将时域音域信号变换到倒谱域,计算出每一帧倒谱系数的平均值并做相应水印嵌入处理。检测方法:全盲的68第68页,此课件共69页哦69第69页,此课件共69页哦