数字水印技术在视频认证中的应用和实现.pdf
中南民族大学硕士学位论文数字水印技术在视频认证中的应用和实现姓名:史继伟申请学位级别:硕士专业:计算机应用技术指导教师:熊志勇20090523中南民族大学硕士学位论文 I 摘 要 随着计算机计算能力的迅速提高,计算机的普及以及 Internet 的迅速发展,个人信息的安全性变得越来越脆弱,传统的数据加密技术可以部分地克服信息的随意散布,但随着破译技术的迅速发展,几乎所有的数据加密技术都一样的处于危机边缘。保护数字产品的知识产权和阻止盗版已经成为数字产品和网络应用面临的严峻问题。数字水印技术作为一种数字多媒体保护技术,近些年来发展迅速,被公认为是解决多媒体信息安全的一种重要手段。数字水印技术可以用于版权保护,多媒体认证等方面。相对于图像水印技术,视频水印技术的发展相对落后。本文重点研究基于 MPEG-4 的视频认证技术,包括视频内容认证和视频完整性认证。并对提出的算法进行了仿真试验。本文主要工作如下:第一:首先对数字水印技术进行了比较全面的概括,介绍了数字水印技术的现状,分类以及应用,接着介绍了数字视频水印技术的特性与视频认证技术,视频认证技术以及视频认证技术的分类和实现方法。第二:提出一种基于能量关系的视频内容认证改进算法,根据视频内容特征自适应判别标准的数字水印改进算法,选择纹理比较均匀的区域进而提高了水印的不可见性,提高算法的鲁棒性,结合视频编解码标准实现数字水印嵌入和提取,大大提高了算法的执行效率。第三:受扩展频谱通信理论的启发,提出一种基于扩展频谱的数字水印方案。针对传统水印嵌入技术受普通图像处理操作的影响,水印容易丧失这一难题,将传统的水印扩散到一个广泛的频率范围,使得在任何频率单元上的能量都很弱,几乎发现不了,巧妙地解决了如何维持水印不可见性的这一难题!关键词:数字水印,版权保护,视频水印,视频认证,内容认证,扩展频谱 数字水印技术在视频认证中的应用和实现 II Absrtact With the rapid enhancement of the compute ability and the fast development of Internet,the security of personal message becomes dangerous more and more.Although the conventional data encryption techniques maybe partially prevent the work be unauthorized released.almost all the data encryption technologies are crisis with the rapid enchance of the edciphering technique.The protection of digital products to prevent pircay of intellectual property rights and become the application of digital products and networks are facing grave problems.As a method for digital multimedia protection,digital watermarking has developed rapidly in recent years and it has been regarded as effective solution to solve the security prolbem of multimedia.Digital watermarking is used for copyright protection,authentication of multimedia and so on.However,currently available video watermarking technique is far beyond mature yet compared with the still image watermarking.This thesis focused on video authentication watermarking algorithm including content authentication and complete authentication based on MPEG-4.Experiments are performed to test the effectiveness of proposed algorithms.The main research work and contributions of this thesis are summarized as follows:First:First of all,digital watermarking technology to more comprehensive overview on the status of digital watermarking technology,classification and application,and introduced the watermarking technology for digital video features and 中南民族大学硕士学位论文 IIIvideo features and video authentication,video authentication technology,as well as the classification of video authentication technology and implementation.Second:A video based on the relationship between energy content authentication algorithm adaptive pattern characteristic of video content identification stadards to improve the watermarking algorithm,select the uniform texture of the region does not increase the visibility of the watermark to enhance the robustness of algorithms,combined with video codec standards realization of watermark embedding and extraction,greatly enhance the efficiency of algorithm implementation.Third:by the Spread spectrum communication theory inspired,The impact of the traditional watermark embedding technology by the general image processing operation by the impact of this problem can easily be lost watermark,a digital watermarking scheme be made based Spread spectrum.The proliferation of traditional watermark to a wide frequency range,is the frequency unit in any of the energy are very weak and almost can not be found,cleverly solved the watermark is not how to the problem.of maintain visibility.Key Words:digital watermarking,copyrighe protection,video watermarking,viedo authentication,content authentication,Spread spectrum 中南民族大学中南民族大学 学位论文原创性声明学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:日期:年 月 日 学位论文版权使用授权书学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权中南民族大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于 1、保密,在_年解密后适用本授权书。2、不保密。(请在以上相应方框内打“”)作者签名:日期:年 月 日 导师签名:日期:年 月 日 中南民族大学硕士学位论文 1 第 1 章 绪 论 1.1 课题研究内容及背景 随着网络技术的飞速发展,在电子商务中数字产品占据了非常大的份额。在日常生活中,人们可以方便快捷地借助网络获得图像,音频和视频等数字产品,并且,人们可以利用各种各样的多媒体处理软件,非法盗版者也可以对原始数字作品进行拷贝,更有写人会对作品的内容进行修改,并且借助于网络进行任意的发布,由此带来了一些列的社会问题:保护作者版权,控制盗版的数量;确认作品完整性,内容真实有效性等方面。所以多媒体数字产品的安全问题成了我们迫切需要解决的问题,并因此制约着世界数字话的进程,若这个问题一天得不到解决。将慢慢会导致书籍,音乐,电影,软件等电子市场的不良发展。如何利用网络来有效地保护数字产品的知识产权问题成了我们学要解决的迫切问题 密码学作为一种信息安全手段已经在通信领域得到了人们的认可。也由此受到了人们的极大关注,可是在最近这些年来这样的情况有了变化。因为这种方法只能保护在普通传输中的内容,但是它并不能控制用户进行数据加密后的内容。密码学我们的定义是“对信息进行保密的科学和技术”,在版权保护这方面,密码学在以前作为它的保护手段,是非常重要的一个方面。它的基本理论就是通过在版权信息中加入密钥对数字作品的安全进行保护,并对它的访问的控制权限进行了保护,它在将作品发送给合法的用户之前对内容进行了加密。但是这样的一种方法只能对传输中的内容进行保护。它并不能控制用户处理加密后的一些内容,针对多媒体信息而言,多媒体信息如果在加密后权限的密钥一旦被人知道,版权的保护系统也就跟着崩溃。首先,当我们的多媒体信息如果在传播的过程中由于它经过了加密处理,会使我们的多媒体信息的理解性丧失,这样的话对我们多媒体信息的传播是非常不利的,由此网络在多媒体信息的传播方面的作用就不能得到很好的发挥;另外,加密后的多媒体信息容易引起人们的好奇,并且随时就会有人对它进行破解,但是一旦我们所加密的文件被别人破解的话,我们所加密的数字水印技术在视频认证中的应用和实现 2多媒体信息的内容也就完全显示在人们的眼前了。最近一些年来。计算机速度的发展是我们无法预料到的,它的发展速度相当快,另外,一些破解技术也慢慢日渐成熟。例如:网络连接分摊计算复杂度达到并行计算。即便使再好的加密方法,他们在实际应用中安全性问题也是值得人们的思考。在计算机速度大大提高面前也受到了很大的挑战。传统的密码学已经不能满足我们保护版权的要求,因此就需要一种新的方法对它进行补充。针对目前的这样的一种状况,密码学应运而生,它是一种行之有效的解决办法,它与传统密码学的方法的不同之处在于:数字水印信息隐藏存在性,密码学隐藏内容,这就给网络化多媒体信息的安全传送和保存开辟了一条新的途径。在多媒体产品诸如数据的安全维护技术,以及在版权的保护方面,数字水印技术在信息隐藏技术方面是一项非常重要的关键的技术。它所利用的原理就是把水印隐藏在一些数子产品当中,例如在图书,文档和一些音频图像等多媒体数字产品当中,用它的话我们可以在把他作为违法侵权方面作为一个证据来作为鉴定手段。在对数字水印信息的完整性和可靠性方面进行分析和检测的时候我们可以利用数字水印技术。由此在知识产权保护,多媒体数字产品防伪等方面数字水印技术是一个非常有效的手段。到今天为止,认证算法在视频认证方面被提出的还非常少,而且已提出的算法中还有很多需要被修改的地方,目前的视频认证方法可以大致分为两类:数字签名和数字水印。数字视频水印是这样的一种水印,它是把信号通过一定的技术嵌入在视频当中,这样的话,它就可以让人们在视频是否是完整的,视频是否是合法的,建立版权的认证以及辨别所有者方面可以提供一些有用的非常有意义的信息,是一种非常有效的在实现版权保护和产权认证方面的技术手段。数字签名的方法是通过从视频中提取不变的特征量,随后对它们进行一定的编码得到数字签名,提取的特征量在经过普通的图像处理后保持不变,检测时通过分析比较从数字签名得到的特征量和从接收到的图像中得到的特征值是否相同来判断图像是否被纂改。1.2 数字水印技术的框架 一般情况下我们把水印定义为信号 W 中南民族大学硕士学位论文 3()|(),dWw kw kB kW=(1.1)dW表示的是维数为 d 的这样的一组数字水印信号域,d=1,2,3 分别表示声音,静止的图像和视频的图像。数字水印信号是经过加密和调制形成的具有一定意义的水印序列,表示为二值形式 B=0,1,或 B=-1,1或者是高斯噪声形式。我们把六元组(X,W,K,G,D)。定义为数字水印处理系统的基本模型 其中:X 表示数字产品的集合 W 表示可能生成水印信号的集合。K 表示数字水印信息所产生的密钥的集合 G 表示生成水印信息的算法(该算法是由 K 和 X 所产生的),如果该数字产品不被数字水印信号依赖的话,这一步可以省去 G:W=G (X,K)(1.2):表示将 W 嵌入 X 中的一个嵌入算法,即:Xw=(X0,W)(1.3)其中 X0 表示该数字产品没有嵌入数字水印,Xw 表示该数字作品嵌入了数字水印。D 表示数字水印信息的提取或者检测的算法,即 D:(,)WWD XK=(1.4)10ifWWWotherwise=(1.5)其中W表示的是经过算法D提取出来的数字水印的信息。对数字水印框架大致具备那些基本因素我们上面已经做了简单的介绍。在通常情况下,由数字水印的生成,数字水印的嵌入以及数字水印的提取来组成一个完整的数字水印系统。(一)数字水印的生成 如果数字水印信号是具有一定意义信息的诸如版权防伪,图标等这样的信息。数字水印技术在视频认证中的应用和实现 4数字水印信号的产生可以不依赖于原始的数字作品,或者伪随机数或者是通过混沌系统或者是伪随机数发生器所产生的没有任何意义的混沌序列;如果数字水印信号的产生对原来的原始作品具有一定的依附性,这样的话数字水印信号一般情况下为了适应数字水印的嵌入算法需要进一步的变换才能适应。现在我们把子算法进行分解,将其分解为R算法和T算法两个部分。GTR=(1.6):,:R kW T WXKW%(1.7)R输出原始的数字水印信息W%,由密钥K产生原始的数字水印信息。对原始水印经过子算法T进行修改后,然后得到数字水印W(依赖于数字产品的)。这时候子算法T应该满足如下条件:0(,)(,)(,)wWT W XT W XT W X=%(1.8)0X表示在没有嵌入数字水印之前的作品,wX表示作品是嵌入水印信息之后的,并且(),WwwwXM XXX=,M是表示对多媒体信息进行处理时的操作算法。(二)数字水印信息的嵌入 数字水印信息的嵌入过程如下图所示:图 1.1 数字水印信息嵌入过程 数字水印信息嵌入也即把数字水印信号W=w(k)经过一定的嵌入算法将其嵌入到原始数字产品()OOXxk=中,我们可以数字水印的嵌入规则描述为:0()()()()wxkx kh k w k=(1.9)被称为为某种叠加的操作,也可以是包括合适的截断操作或量化操作。H=h(k)称为d维(声音1维,图像2维,视频3维)的数字水印嵌入的掩码。在通常情况下,我们所利用的嵌入规则如下所示:加法准则:()()()woxkx kaw k=+(1.10)水印信息 W原始宿主信号 X 水印嵌入算法含水印的信号 XW密钥 K 中南民族大学硕士学位论文 5 乘法准则:0()()(1()wxkx kaw k=+(1.11)(三)数字水印信息的提取与检测 数字水印信息的提取和检测我们如图1.2所示。在这个图中,虚框部分表示的是该部分可有可无。并不是检测过程所必须有的。在对数字水印信息进行检测的时候,我们首先对产生的水印信息用算子G表示,接下来检测的时候用算子D来检测。在检测的过程当中,有两种可能的错误会发生。我们分别把虚警概率和漏警概率表示在检测过程中所发生的两种可能性的错误。错误I:不存在数字水印信息的数字作品中却检测出存在数字水印信息。(错误肯定);错误II:存在数字水印信息的数字作品却检测不出存在数字水印信息(错误否定)。图 1.2 数字水印信息的提取与检测 1.3 数字水印的基本特征 在一个数字水印系统当中,如果我们所隐藏的信息丢失的话,版权的信息也相当于丢失了,数字水印必须具备以下特征3 1.不可检测性:由于普通作品和数字水印作品在统计噪音分布上并没有明显的不同,所以攻击者是没有办法用统计学的方法确定数字水印的具体位置。2.透明性:人眼对嵌入水印的作品是看不出于原来作品的区别的。3.鲁棒性(robustness):鲁棒性是指当多媒体的数据发生修改后,版权所有人仍然可以证明自己的所有权(通过对数字水印的辨别)。4.安全性(security):安全性是指具有抗攻击能力,并对攻击能力有一定 原始宿主信号原 始 水 印含水印的信号水印提取算法 提 取 的 水 印结果判断 密钥 K 数字水印技术在视频认证中的应用和实现 6承受力,同时嵌入的水印信息仍然是完好的。1.4 数字水印技术的分类和应用 数字水印技术一般分为盲水印,非盲水印,易损水印,鲁棒水印,图像水印,文本水印,变换域水印以及时域水印等。数字水印技术之所以会被人们如此关注。主要是因为不仅在理论研究方面有一定的研究价值,并且在商业领域也有着巨大的商业价值。当今。在我们日常生活中数字水印技术已经应用于我们生活的各个方面,它的应用大大超出了我们早期所预想的仅仅限制在版权的保护方面。随着互联网市场的飞速发展,在信息安全研究方面,数字水印技术已经成为一个研究的重点,目前数字水印技术主要有下面几个方面的应用:1.版权保护 当今,数字水印最主要的方面的应用可能是版权保护。针对版权保护,它主要是嵌入这样一种信息:即数据的来源信息以及具有代表版权信息性质的一些信息。由此对非法的盗版者宣称拥有的的版权进行了有效的阻止,在这样一种情况下,数字水印信息就能够比较公正地解决版权所有权问题,如果要满足这个要求就需要数字水印信息具有有非常高的健壮性,另外,还要考虑一些关键问题,比如,数字水印信息必须是非常清晰的,如果盗版者嵌入了新的数字水印,在这样一种情况下,对于谁是真正的所有者我们还应该能够准确地辨别出来。2.用于盗版跟踪的数字指纹 数字水印技术在数字指纹方面的应用和跟踪,它之所以应用于这个方面,其主要目的就是只对接受者的合法的信息进行传输,而对来源者的数据信息不进行传输。对单个的数据进行发行拷贝进行识别是它的主要的用途。在我们发行的各个拷贝中我们把不同的水印信息嵌入进去,我们把它叫做“数字指纹”3 用于拷贝保护的水印 在日常生活中,我们期待在多媒体发行的系统中存在这样的一个数据拷贝机制,也就是我们在进行多媒体数据进行拷贝时,这些多媒体数据必须是经过授权,否中南民族大学硕士学位论文 7则如果这些多媒体数据没有经过授权,它是不允许进行拷贝的。对于实现拷贝保护,在一个开放性的系统中,我们大家都知道,要实现起来是比较有难度的。如果系统不是开放性的,而是属于封闭系统或者说是私有系统。那么这样的话对于数据的拷贝是可以行的。我们可以用数据的拷贝的情况在这样一个我们所期待的系统中来实现。比如对含有数字水印信息的DVD系统我们不允许它重复播放即禁止拷贝,但带有一次拷贝的数字水印信息,它是不能进一步的再进行制作与拷贝的。在进行鉴定的实际应用中,我们经常运用数字水印的目的是为了对修改过的数据进行检测,这个时候就可以运用半脆弱水印来实现这样的一个目的。它对特定的修改有非常微弱的健壮性。但是其他的一些修改是具有一定的破坏性的,同时根据不同的实际情况,我们对健壮性的具体是哪方面的要求也会有所不同。4 在电子商务中的票据防伪和网页保护 在这些年来,大量各式各样的网站层出不穷,但随之伴随的网页内容的修改与盗版问题也慢慢凸显出来。我们可以在网页中加入数字水印信息来防止非法纂改并达到保护网页版权的所有全问题,是防止盗版的一种有效手段。伴随着电子商务的不断涌现以及一些高质量复制设备发明生产,防伪技术也在伴随着电子商务的脚步不断的发展。很显然,在电子商务中,能有效地识别出票据的防伪是至关重要。我们将会更加深入地研究电子票据的数字水印技术。1.5 章节安排 视频完整性是水印技术在视频认证中的一个主要特征,该文从基本数字水印入手,首先从数字水印的研究背景入手,介绍了数字水印的基本特征,视频编解码技术,视频水印的特征性质等做了详细的介绍,最后提出了一种基于扩展频谱的数字水印方案。可准确地提取到原始视频的完全水印,若水印信息受到攻击,根据扩展频谱解调性质,可以最大限度地恢复出原始水印信息,并统计出有多少个IVOP色度子块受到攻击。水印具有良好的稳定性。第一章:给出了本文课题的研究内容及研究背景,数字水印技术大致的框架,数字水印技术的基本的分类,应用,以及数字水印技术的基本的特征 数字水印技术在视频认证中的应用和实现 8第二章:介绍了视频数字水印的特性与视频认证技术,简单介绍了图像压缩编码的标准,数字视频水印技术具有那些特点,并且对图像压缩编码的基本原理做了简单的介绍。第三章:针对目前的视频内容认证算法,对基于能量关系的视频内容认证算法进行了分析,然后对该算法进行了改进优化。第四章:提出了一种基于扩展频谱的视频水印方案,对扩展频谱技术进行了简单的介 绍,然后对视频认证系统,视频认证技术,以及视频认证的目标做了进一 步介绍,最后给出了视频数字水印算法及实现方案。第五章:对本文的工作进行总结和展望。中南民族大学硕士学位论文 9 第 2 章 数字视频水印的特性与视频认证技术简介 2.1 图像及视频编码标准简介 在我们的日常生活中,我们所见到的多媒体数据产品中,数字图像可以说是我们比较常见的多媒体数据产品,但是JPEG是编码标准中最常见的一种编码方式,JPEG是在1993年发布的。JPEG定义两种基本的压缩方法,即:DPCM(无损压缩算法(基于空间的)和有损压缩算法(基于DCT系数的,应用行程编码和熵编码技术),并采用混合编码方法,(如图2.1.1);在当前研究情况下,JPEG2000是相对比较新的JPEG的压缩标准,小波理论分析在JPEG2000中得到了充分的利用。在同样的情况下,同样的视觉质量可以达到比较大的压缩比。信号具有非常大的信息量,这是图像和视觉信息是无法可比的。并且在表达方式和输入输出方面,这些信息也并不相同,所以,行之有效的表达和对这些数源图像 压缩后图像数据 预测器 熵编码器 表说明 图 2.1.1 无损压缩编码器框图 无失真编码器 源图像 压缩后图像数据 DCT 正变换 量化器 熵编码器 表说明 表说明 图 2.1.2 基于 DCT 的有损压缩编码器框图数字水印技术在视频认证中的应用和实现 10据的适当处理在多媒体音频通信中是很重要的。MPEG伴随着多媒体音视频数据的飞速增长于1988年由ISO与IEC联合成立,MPEG主要是致力于运动图像及其伴音编码标准化的一些工作。在MPEG系统中,这个系统主要由两个部分组成:即MPEG视频和MPEG音频,在早期,MPEG由MPEG-1,MPEG-2,MPEG-3三个版本,在后来MPEG-4版本又产生了,在这些不同的版本中,每个版本他们的用途是不一样的。在多媒体通信的发展中,MPEG系列标准起到了革命性的推动作用。2.1.1 MPEG-2 运动图像压缩编码标准 在多媒体通讯,高清晰电视,多媒体数据库,以及交互式电视系统中,MPEG视频压缩标准是他们中的的关键的技术。MPEG-2的开发是在MPEG-1的基础上由ISO/IEC和ITU联合开发的,与MPEG-1相比,在系统和传送方面,MPEG-2又做了更加详细的规定和更进一步的完善。在视频的数据速率方面,MPEG-2可以达到100Mbit/s,并且它也对许多高级性能和隔行扫描视频格式也兼容,包括我们日常生活中的高清晰电视(HDIV)以及我们平时生活中的用于娱乐的DVD光盘,被定义为SDTV和HDTV的编码标准。与此同时,在通信卫星,电缆以及其他广播通信的数字视频传输中MPEG-2也可以运用其中。表 2.1.1MPEG-2 类别和等级组合 简单 主类 SNR 可分级 空间域 高档次 高级 _ 80Mbps _ 100Mbps 高 1440 级 _ 60 Mbps _60Mps 80 Mbps 主级 15Mbps 15 Mbps 15 Mbps_ 20 Mbps 低级 _ 4 Mbps4 Mbps _ _ 框架和级别的概念是被包含在MPEG-2的视频标准的规范中的,它分为四个“级“和五个”类别“,四个级的划分是根据图案编码的分辨率进行划分的,五个”类别“的划分是根据所使用的编码工具进行划分的。在这些类中,如果类的级别 类别 中南民族大学硕士学位论文 11级别比较高,那么也就意味着他们在进行编码的时候采用了比较多的编码工具集,由此在对编码图像进行处理的时候处理的更加精细,图像质量会与在相同比特率下的图像质量要比较好,但同时付出的代价也是相当大的。比较低的类的编码工具和比较低的类所不具有的编码工具在较高类的编码中都会用到。因此,MPEG-2的”类“之间具有后向的兼容性。如表2.1.1所示,图像清晰程度是由高到低依次一级一级的进行提高,同时编码工具也是逐步递增(由简单到高级)。在这些类级别中,主类级MPML用于SDTV,而主类高级MPHL则应用于HDTV。2.1.2 MPEG-2 编解码基本原理 我们所讲的数据压缩主要是两个方面的压缩:数据和视觉冗余度,与图像数据的压缩概念相比,在进行编码的时候,视频数据不仅可以把单个帧之间的视频图像的空间冗余消除掉,并且同时也可以把视频图像序列的时间冗余消除掉。MPEG编码器的结构如图2.1.3所示。MPEG-2视频编码器的图像序列在输入的时候是连续的,在输入的时候它使用了空间相关性来对图像进行压缩。在图像进行编码的时候,MPEG-2把要输入的图像分为I帧,P帧和B帧三类,I帧图像利用了空间相关性而不是时间相关性,因此使图像的压缩倍数相对比较低,P帧和B帧在编码的时候都是利用了帧间的编码方式,这样把空间相关性和时间相关性进行了融合。P帧图像因为预测的时候只能前向预测,从而压缩效率和图像质量得到了提高。B帧图像以他独特的双向预测编码方式,使图像的压缩倍数进一步提高。另外,值得一提的是,因为B帧图像采用了未来帧做参考,所以在MPEG-2编码流中,图像帧在显示顺序和传输顺序方面都是不相同的。数字水印技术在视频认证中的应用和实现 12 MPEG-2视频编码主要是利用了下面几种关键技术进行的数据压缩,从编码器的结构构成的角度来看:?输入图像序列的预处理:预处理主要包括两个方面的内容:即:分块操作,色度信息滤波采样。前者是将输入的图像进行分割,把它分割成16 16大小的宏块,后者主要是进行平滑的处理,减少被压缩的信息量。?离散余弦变换(DCT):DCT作为一种空间变换,它的预处理的基本原理主要是根据图像的不同的格式所包含数目的不同,经过DCT变换后,生成88大小的DCT系数数据块的一个过程?量化器:它的基本原理就是依据DCT系数的变换,然后对其进行量化,它的量化的过程就是依据某一个量化的步长然后使DCT系数进行消除掉。将量化的精度定义为量化步长的大小。精度随着步长的变长变短而变粗变细。在离散余弦的变化中,相对于视频感觉的重要性低频系数是相对比较高的。?之字扫描与游程编码:DCT在变换之后会产生一个二维数组,这个数组是一个88的二维数组,为了方便我们进行数据传输,我们不得不将它转换为一维的排列方式。目前扫描方式有:之字扫描(Zig-Zig)和交替扫描。运动估计 预处理 DCT Q VLC 缓冲区 量化级控制 Q-1 DCT-运动补偿 Q:量化 VCL:变长编码 运动矢量 图 2.1.3 MPEG-2 编码器框架中南民族大学硕士学位论文 13?熵编码:它是在经过量化之后一种非常有效的离散的表示,这个量化之后它只生成了DCT系数。在没有传输之前,我们必须对它的比特流先进行一个编码。然后产生用于数字比特流的传输。如果想简单化,就采用顶长编码,效率比较低,如果我们采用的熵编码要提高编码的效率,就必须是基于编码信号统计特性,随之使平均的比特率降低。非零系数可以进行独立编码,也可以把他们联合起来作为熵编码。霍夫曼编码是在熵编码中实用最多的一种编码方式。?运动估计:运动估计它的编码方式是通过在帧间进行编码来进行使用的。若我们之前的的估计工作做的非常充分的话,那么最后就会只留下非常小的一个值来用于数据的传输。通常我们在运动估计计算的时候,它的计算一般是以宏块计算的。算出偏移位置。以运动的矢量来描述一个位置的偏移。一个运动矢量代表的是两个方向上的位置,即:水平的和垂直的两个方向。?运动补偿:运用运动估计算出来的运动的矢量,通常情况下我们可以将参考帧图像中的宏块移动到水平和垂直方向的相应的位置上,这样我们就可以对被压缩的图像进行预测。这样的运动都是相对的,在大多数的自然环境中都是井然有序的。所以被压缩图像的差分值与差分值是非常小的。对于视频码流的解码过程来说,我们可以把他看做是与视频编码相对的一个过程,如图2.1.3所示,解码过程实际上也就是将编码数据进行解码为一帧图像。解码器是这样一个工具,它首先对要被编码的数据进行变长码进行解码,但是针对块的AC系数和DC系数,解码的时候我们必须要把他们分开,分别进行解码,因为他们所对应的码表是不一样的。对于每一帧之间的图像,我们对它们进行解码的时候则需要运动补偿的环节,首先先对前面的解码图像进行解码形成预测,然后与系数数据进行组合,进而得到解码的数据。图2.2.3对运动补偿过程做了简要描述。数字水印技术在视频认证中的应用和实现 14 图 2.1.3 MPEG-2 解码器框架 在MPEG-2中,预测方式一般有两类:有场预测和预测两类,在通常的情况下,最多的情况下,每个块可以形成四个独立的预测,各个预测然后通过组合来构成最后的预测块数据pyx。对于内部编码块是不会形成预测的,Pyx被设置为零。图 2.1.4 简化的运动补偿过程 我们可以通过从MPEG-2的视频编码过程和编码的数据结构看出,MPEG-2预测帧/场选择 帧存 寻址 Vectorrst附 加 双 基向量解码 颜 色 分量变化 半像素预 测滤波器帧存 组合预测 半像素信息 fyx Pxy 饱和化 解码元素 dyx FvuFyx 反量化 反DCT运 动 补QFn解码值 变长编码 反扫描 QFSndyx 帧存储器 中南民族大学硕士学位论文 15的视频文件主要是由这些信息所组成:DCT系数,运动矢量数据以及辅助的头信息组成。2.2 数字视频水印技术的特点 2.2.1 数字视频水印的主要特征 由于数字视频播放次序的连续性以及相关性问题,我们可以把视频数字水印的特征概括为如下几个特征,这些特征是一般的图像水印信息所不具备的。1.安全性:所谓安全性就是只有知道数字水印的密钥才能对水印进行操作,这就是Kerchoff原则。2.可靠性:数字水印检测应该是可靠的,虚警率和漏警率都是非常低的。3.鲁棒性:鲁棒性对于一个数字水印系统来说是非常重要的,对于一个数字水印系统来说必须能承受一些认为的攻击或者一些失真。4.不可感知性:不可感知性也就是对于在数字视频中如果嵌入数字水印,一般情况下,我们通过肉眼是没有办法感觉到的,视频质量不会因为嵌入水印信息而降低,当然,如果为了满足一些要求,对嵌入的水印信息要求可见的话的情况是除外的。对于数字视频水印而言,还有其他的要求,例如实时性处理,随机性检测,与视频编码标准相结合等一些独有的特性。2.2.2 视频数字水印设计应考虑的几个方面 水印容量:嵌入的水印信息必须足以标识多媒体内容的购买者或所有者。不可察觉性:嵌入在视频数据中的数字水印应该不可见或不可察觉。鲁棒性:在不明显降低视频质量的前提下,数字水印的信息一般情况下是没办法除去的。盲检测:盲检测也就是当我们在对数字水印信息进行检测的时候,不需要原始视频,因为保存所有的原始视频几乎是不可能的。纂改提示:当多媒体内容发生改变时,通过水印提取算法,能够敏感地检测到原始数据是否被纂改。数字水印技术在视频认证中的应用和实现 162.2.3 数字视频水印的技术评估 当前为止,在数字水印技术的研究中,公正合理地评价一个数字水印系统是一个比较难的问题。对一个水印系统的评价包括几个方面,鲁棒性,失真的主观和定量评价。如果评价一个水印系统,我们应该保证我们所考察的方法必须是在可以进行比较的情况下进行的。同时我们应该在不同的情况下进行测试的话有相同或者相似的结果,测试结果不应该因为测试条件的不同有大的变化。影响水印性能一般包括嵌入水印信息的数量,嵌入强度,数字水印载体的大小和种类,密钥信息等因素:视频水印的性能评估中常用的性能指标如表2.2.1所示 表 2.2.1 性能指标 11001(,)MNxyYf x yMN=均方差MSE 211(,)(,)MNxyf x y g x yMSEMN=峰 值 信 噪 比PNSR 225525510lg10lgPNSRMSEMSE=掩 蔽 峰 值 信噪比MPNSR_25510lg,MPNSRLUT=11_001(,)(,)NMyxLUT f x yf x yLUTMN=20()didixTLUT xxxT=相 似 性 系 数NC 110011110000(,)(,)(,)(,)(,)(,)MNijMNMNijijw i jw i jNCw i jw i jw i jw i j=中南民族大学硕士学位论文 17综合以上这些影响数字水印技术的关键因素,我们可以看到我们如果要在视频中嵌入数字水印信息,如何嵌入水印信息我们必须要首先对不同的数据信息进行测试,这是我们在对水印进行嵌入的时候获得合适的基准和性能评估中应该做到的。这主要是因为我们前面提到的数字水印系统的鲁棒性和它的不可感知性之间有相对的关系,所以要进行合理的评估和进行比较。2.2.4 性能评估中常使用的攻击方法 人们认识到,对水印系统的攻击有几种,每一种都针对数字水印处理的某一个阶段。我们采用Craver等人所总结的方法,将水印攻击划分为四类:表示攻击,信号去除攻击,合法性攻击和解释攻击。表示攻击方法是利用水印检测器失效的方法,此种攻击以某种方式去除水印,而不是从对象中对水印进行去除,以至于检测器不能检测出水印信息。信号去除攻击是四种攻击方法中最直接明显的一种攻击方法,这种攻击包括各式各样的没有任何意义的操作,如图像压缩等。解释攻击一般情况下是利用伪造水印进而取得成功,它是故意使水印不被检测出来而使它失去现有的意义。合法性攻击是结合了法律上的一些法律