数字水印技术的发展与应用.pdf
数字水印技术的发展与应用 1 数字水印技术的发展与应用 上海大学 计算机应用技术 蔡闻怡 指导教师:丁友东 1 引言 信息媒体的数字化为信息的存取提供了极大的便利性,同时也显著提高了信息表达的效率和准确性。特别是随着计算机网络通讯技术的发展,数据的交换和传输变成了一个相对简单的过程,人们借助于计算机、数字扫描仪、打印机等电子设备可以方便、迅速地将数字信息传输到所期望的地方。随之而来的副作用是这些数字形式的数据文件或作品使有恶意的个人和团体有可能在没有得到作品所有者的许可下拷贝和传播有版权的内容,例如,现代盗版者仅需轻点几下鼠标就可以获得与原版一样的复制品,并以此获取暴利;而一些具有特殊意义的信息,如涉及司法诉讼、政府机要等信息,则会遭到恶意攻击和篡改伪造等等。这一系列数字化技术本身的可复制和广泛传播的特性所带来的负面效应,已成为信息产业健康持续发展的一大障碍,目前,数字媒体的信息安全、知识产权保护和认证问题变得日益突出,且已成为数字世界中一个非常重要和紧迫的议题。密码技术是信息安全技术领域的主要传统技术之一,它是基于香农信息论及密码学理论的技术,现有的数字内容的保护多采用加密的方法来完成,即首先将多媒体数据文件加密成密文后发布,使得其在传递过程中出现的非法攻击者无法从密文获取机要信息,从而达到版权保护和信息安全的目的。但这并不能完全解决问题:一方面加密后的文件因其不可理解性而妨碍多媒体信息的传播;另一方面多媒体信息经过加密后容易引起攻击者的好奇和注意,并有被破解的可能性,而且当信息被接收并进行解密后,所有加密的文档就与普通文档一样,将不再受到保护,无法幸免于盗版。换言之,密码学只能保护传输中的内容,而内容一旦解密就不再有保护作用了。因此,迫切需要一种替代技术或是对密码学进行补充的技术,它应该甚至在内容被解密后也能够继续保护内容。这样,人们提出了新兴的信息隐藏的概念数字水印(digital watermarking)。数字水印技术是目前信息安全技术领域的一个新方向,是一种可以在开放网络环境下保护版权和认证来源及完整性的新型技术,创作者的创作信息和个人标志通过数字水印系统以人所不可感知的水印形式嵌入在多媒体中,人们无法从表面上感知水印,只有专用的检测器或计算机软件才可以检测出隐藏的数字水印。在多媒体中加入数字水印可以确立版权所有者、认证多媒体来源的真实性、识别购买者、提供关于数字内容的其它附加信息、确认所有权认证和跟踪侵权行为。它在篡改鉴定、数据的分级访问、数据跟踪和检测、商业和视频广播、Internet 数字媒体的服务付费、电子商务认证鉴定等方面具有十分广阔的应用前景。自 1993 年以来,该技术已经引起工业界的浓厚兴趣,并日益成为国际上非常活跃的研究领域。最初提出数字水印的目的是为了保护版权,然而随着数字水印技术的发展,人们发现了更多更广的应用,有许多是当初人们所没有预料到的。下面列出了七种已提出的或实际的水印应用:广播监控、所有者鉴别、所有权验证、操作跟踪、内容认证、拷贝控制和设备控制。(1)广播监控:通过识别嵌入到作品中的水印来鉴别作品是何时何地被广播的。(2)所有者鉴别:嵌入代表作品版权所有者身份的水印。(3)所有权验证:在发生所有权纠纷时,用水印来提供证据。(4)操作跟踪:用水印来鉴别合法获得内容但非法重新发送内容的人。数字水印技术的发展与应用 2(5)内容认证:将签名信息嵌入到内容中以待日后检查内容是否被篡改。(6)拷贝控制:使用水印来告知录制设备不能录制什么内容。(7)设备控制:使用水印来制造设备,比如 Digimarc 公司的 MediaBridge 系统。数字水印技术还处于发展之中,上述七个方面也不可能包含其所有可能的应用领域,但可以看出数字水印技术未来的应用市场将会更加广阔,毕竟,它还是个方兴未艾的领域。2 数字水印的基本理论 2 1 定义和基本特点 所谓数字水印是向多媒体数据(如图像、声音、视频信号等)中添加某些数字信息以达到文件真伪鉴别、版权保护等功能,嵌入的水印信息隐藏于宿主文件中,不影响原始文件的可观性和完整性。数字水印过程就是向被保护的数字对象(如静止图像、视频、音频等)嵌入某些能证明版权归属或跟踪侵权行为的信息,可以是作者的序列号、公司标志、有意义的文本等等。与水印相近或关系密切的概念有很多,从目前出现的文献中看,已经有诸如信息隐藏、信息伪装、数字水印和数字指纹等概念。不同的应用对数字水印的要求不尽相同,一般认为数字水印应具有如下特点:可证明性:水印应能为受到版权保护的信息产品的归属提供完全可靠的证据。水印算法能够将所有者的有关信息(如注册的用户号码、产品标志或有意义的文字等)嵌入到被保护的对象中,并在需要的时候将这些信息提取出来。水印可以用来判别对象是否受到保护,并能够监视被保护数据的传播、真伪鉴别以及非法拷贝控制等。这实际上也是发展水印技术的基本动力。不可感知性:不可感知性是指视觉或听觉上的不可感知性,即指因嵌入水印导致载体数据的变换对于观察者的视觉或听觉系统来讲应该是不可察觉的,最理想的情况是水印与原始载体在视觉上是一模一样的,这是绝大多数水印算法所应达到的要求。鲁棒性:鲁棒性是指水印应该能够承受大量的物理和几何失真,包括有意的(如恶意攻击)或无意的(如图像压缩、滤波、打印、扫描与复印、噪声污染、尺寸变换等等)。显然在经过这些操作后,鲁棒性的水印算法应仍能从水印载体中提取出嵌入的水印或证明水印的存在。一个鲁棒的水印应做到若攻击者试图删除水印将会导致水印载体的彻底破坏。由于水印特性的要求对应用的依赖型很强,恰当的评价准则和具体的应用有关。许多文献中讨论的数字水印可能不具备上述特点,或者只具备部分上述特点,这里我们讨论更广泛意义上的水印。2 2 数字水印的分类 随着数字水印技术的发展,水印算法的分类方法繁多:按水印的特性,可分为鲁棒水印和脆弱水印。鲁棒水印主要用于在数字作品中标识著作权信息,如作者、作品序号等,它要求嵌入的水印能够经受各种常用的编辑处理;脆弱数字水印主要用于完整性保护,与鲁棒水印的要求相反,脆弱水印必须对信号的改动很敏感,人们根据脆弱水印的状态就可以判断数据是否被篡改过。按水印所附载的媒体,可分为图像水印、音频水印、视频水印、文本水印以及用于三数字水印技术的发展与应用 3 维网格模型的网格水印等。随着数字技术的发展,会有更多种类的数字媒体出现,同时也会产生相应的水印技术。按水印的检测过程,可分为明文水印和盲水印。明文水印在检测过程中需要原始数据,而盲水印的检测只需要密钥,不需要原始数据。一般来说,明文水印的鲁棒性比较强,但其应用受到存储成本的限制。目前学术界研究的数字水印大多数是盲水印。按水印的内容,可分为有意义水印和无意义水印。有意义水印是指水印本身也是某个数字图像(如商标图像)或数字音频片段的编码;无意义水印则只对应于一个序列号。有意义水印的优势在于,如果由于受到攻击或其他原因致使解码后的水印破损,人们仍然可以通过视觉观察确认是否有水印。但对于无意义水印来说,如果解码后的水印序列有若干码元错误,则只能通过统计决策来确定信号中是否含有水印。按水印的用途,可分为票据防伪水印、版权保护水印、篡改提示水印和隐蔽标识水印。票据防伪水印是一类比较特殊的水印,主要用于打印票据和电子票据的防伪。一般来说,伪币的制造者不可能对票据图像进行过多的修改,所以,诸如尺度变换等信号编辑操作是不用考虑的。但另一方面,人们必须考虑票据破损、图案模糊等情形,而且考虑到快速检测的要求,用于票据防伪的数字水印算法不能太复杂。版权标识水印是目前研究最多的一类数字水印。数字作品既是商品又是知识作品,这种双重性决定了版权标识水印主要强调隐蔽性和鲁棒性,而对数据量的要求相对较小。篡改提示水印是一种脆弱水印,其目的是标识宿主信号的完整性和真实性。隐蔽标识水印的目的是将保密数据的重要标注隐藏起来,限制非法用户对保密数据的使用。按数字水印的隐藏位置,可分为时(空)域数字水印、频域数字水印、时/频域数字水印和时间/尺度域数字水印。时(空)域数字水印是直接在信号空间上叠加水印信息,而频域数字水印、时/频域数字水印和时间/尺度域数字水印则分别是在 DCT 变换域、时/频变换域和小波变换域上隐藏水印。2 3 基本理论框架 一个数字水印方案一般包括三个基本方面:水印的生成、水印的嵌入和水印的提取或检测。数字水印技术实际上是通过对水印载体媒质的分析、嵌入信息的预处理、信息嵌入点的选择、嵌入方式的设计、嵌入调制的控制等几个相关技术环节进行合理优化,寻求满足不可感知性、安全可靠性、稳健性等诸条件约束下的准最优化设计问题。而作为水印信息的重要组成部分密钥,则是每个设计方案的一个重要特色所在。往往可以在信息预处理、嵌入点的选择和调制控制等不同环节入手完成密钥的嵌入。数字水印一般过程基本框架示意图如图 1 和图 2 所示。图 1 水印嵌入的一般过程基本框架 图 1 展示了水印的嵌入过程。该系统的输入是水印信息W、原始载体数据I和一个可水印生成 算法(G)水印信息(W)原始载体数据(I)水印嵌入 算法(E)加 入 水 印 后的数据(WI)私钥/公钥(K)数字水印技术的发展与应用 4 选的私钥/公钥K。其中水印信息可以是任何形式的数据,如随机序列或伪随机序列;字符或栅格;二值图像、灰度图像或彩色图像;3D 图像等等。水印生成算法G应保证水印的唯一性、有效性、不可逆性等属性。水印信息W可由伪随机数发生器生成,另外基于混沌的水印生成方法也具有很好的保密特性。密钥K可用来加强安全性,以避免未授权的恢复和修复水印。所有的实用系统必须使用一个密钥,有的甚至使用几个密钥的组合。水印的嵌入算法很多,从总的来看可以分为空间域算法和变换域算法。具体算法将在后面详细介绍。由图 1 可以定义水印嵌入过程的通用公式:),(KWIEIW (1)其中WI表示嵌入水印后的数据(即水印载体数据),I表示原始载体数据,W表示水印集合,K表示密钥集合。这里密钥K是可选项,一般用于水印信号的再生。图 2 水印检测的一般过程基本框架 图 2 是水印的检测过程。由图 2 可以定义水印检测过程的通用公式为 有原始载体数据I时:),(KIIDWW (2)有原始水印W时:),(KWIDWW (3)没有原始信息时:),(KIDWW (4)其中,W表示估计水印,D为水印检测算法,WI表示在传输过程中受到攻击后的水印载体数据。检测水印的手段可以分为两种:一是在有原始信息的情况下,可以做嵌入信号的提取或相关性验证;二是在没有原始信息情况下,必须对嵌入信息做全搜索或分布假设检验等。2 4 数字水印嵌入算法 数字水印技术的学科特点在于它横跨图像处理、多媒体技术、模式识别、密码学、数字通信等多学科领域,以这些领域的算法、思想和概念为基础。一个数字水印方案一般总是综合利用这些领域的最新进展,各学科的学者们也提出了不尽相同的算法。针对静态图象压缩标准 JPEG1,在离散余弦变换基础上植入数字水印的研究成为热点;针对目前流行的视频压缩标准 MPEG2、H.263,Dittmann 等3提出了两种适用于空域和频域的算法;1995 年,Cox 等4在传统通信系统的基础上,提出了扩频水印的概念。这种方法较好地利用了人类视觉系统的特性,水印信息经过一定的调制过程隐藏于数字图象感知比较重要的频谱部分,从而可以抵抗有损压缩和其它数字图象处理操作;Xia 等5、Zeng6,7等做了基于离散小波变换的数字水印技术研究;Zhu 等8在 DWT 技术上,从编码角度做了一些研究;Pitas 等9在统数字水印(W)/原始数据(I)待检测数据(WI)水印检测 算法(D)估计水印(W)/相似度检测(Sim)私钥/公钥(K)数字水印技术的发展与应用 5 计学和混沌的基础上,提出了一种新颖的算法;Wolfgang 等10、schyndel 等11在其定义的m-序列基础上,提出了可以有效抵抗线性和非线性滤波以及 JPEG 有损压缩的数字水印植入算法;Qu 等12以图形着色问题为基础,提出了两种有趣的数字水印技术;Kankanhalli 等13研究了基于图象内容的数字水印技术,这与计算机视觉的发展是密不可分的。此外,很多学者还提出了一些对数字水印进行攻击的方法,非常有助于鲁棒性要求很高的数字水印技术的研究。下面采用按嵌入域的分类方法来具体的介绍一下数字水印各种方法的嵌入和检测过程。2 4 1 空间域数字水印 较早的数字水印算法都是空间域上的,空域水印处理使用各种各样的方法直接修改图像的象素,将数字水印直接加载在数据上,现已提出了如下几种较典型的空域数字水印方法。2 4 1 1 最低有效位方法(Least Significant Bit)这是一种典型的空间域数据隐藏方法,L.F.Turner 与 R.G.Van Schynde 等先后利用此方法将特定的标记隐藏于数字音频和数字图像内。以图像数据而言,一幅图像的每个象素是以多比特的方式构成的,在灰度图像中,每个象素通常为 8 位;在真彩色图像(RGB 方式)中,每个象素为 24 比特,其中 RGB 三色各为 8 位,每一位的取值为 0 或 1。在数字图像中,每个象素的各个位对图像的贡献是不同的。对于 8 位的灰度图像,每个象素的数字g可用公式表示为:702iiibg (6)其中i代表象素的第几位,ib表示第i位的取值,1,0ib。这样,我们把整个图像分解为 8 个位平面,从 LSB(最低有效位 0)到 MSB(最高有效位7)。从位平面的分布来看,随着位平面从低位到高位(即从位平面 0 到位平面 7),位平面图像的特征逐渐变得复杂,细节不断增加。到了比较低的位平面时,单纯从一幅位平面上已经逐渐不能看出测试图像的信息了。由于低位所代表的能量很少,改变低位对图像的质量没有太大的影响。LSB 方法正是利用这一点在图像低位隐藏入水印信息。图 3图 11 分别显示了原始 camera 图及其从高位到低位的八个位平面。在进行数字图像处理和图像变换后,图像的低位非常容易改变,攻击者只需通过简单地删除图像低位数据或者对数字图像进行某种简单数学变换就可将空域 LSB 方法加入的水印信息滤除或破坏掉,因此同变换域的方法相比,这种水印算法的鲁棒性非常弱。尽管如此,由于 LSB 方法实现简单,隐藏量比较大,以 LSB 思想为原型,产生了一些变形的 LSB 方法,目前互联网上公开的图像信息隐藏软件大多使用这种方法。数字水印技术的发展与应用 6 图 3 原始 camera 图(256 级灰度)图 4 位平面 7 图 5 位平面 6 图 6 位平面 5 图 7 位平面 4 图 8 位平面 3 图 9 位平面 2 图 10 位平面 1 图 11 位平面 0 2 4 1 2 Patchwork方法及纹理块映射编码方法 这两种方法都是 Bender 等人提出的。Patchwork 法是一种基于统计的数字水印嵌入方法,这种算法不是像通常做法那样把一个消息隐藏在伪装载体中,而是简单地回答下面的二元问题:“这个人是否知道在嵌入和提取一个水印时所使用的密钥?”在 Patchwork 算法中,一个密钥用来初始化一个伪随机数发生器,而这个伪随机数发生器将产生载体中放置水印的位置。Patchwork 算法的基本思想是:在嵌入过程中,版权所有者根据密钥K伪随机地选择n个象素对,然后通过下面的两个公式更改这n个象素对的亮度值iiba,:11iiiibbaa (7)这样,版权所有者就对所有的ia加 1 和对所有的ib减 1。在提取的过程中,也使用同样的密钥K将在编码过程中赋予水印的n个象素对提取出来,并计算这样一个和:niiibaS1)((8)如果这个载体确实包含了一个水印,就可以预计这个和为n2,否则它将近似为零。这种提法是基于下面的统计假设的,如果我们在一个图像里随机地选取一些象素对,并且假设它们是独立同分布的,那么有:niiiibEaESE)((9)因此,只有知道这些修改位置的版权所有者才能够得到一个近似值nS2。Patchwork 方法数字水印技术的发展与应用 7 隐蔽性好,并且对 JPEG 压缩、FIR 滤波以及图像剪切操作有一定的抵抗力,但该方法嵌入的信息量有限。为了嵌入更多的水印信息,可以将图像分块,然后对每一个图像块进行嵌入操作。现在麻省理工学院的媒体实验室正在研究如何利用这种方法在彩色打印机、复印机输出的图像中加入水印,通过实时地从扫描票据中判断水印的有无,快速辨识真伪。纹理块映射编码方法(Texture Block Coding)则是将数字信息隐藏于数字图像的任意纹理部分,该算法对于滤波、压缩和扭转等操作具有抵抗能力,但仅适用于具有大量任意纹理区域的图像,而且尚不能完全自适应。2 4 2 变换域数字水印 基于变换域的数字水印技术往往采用类似于扩频图像的技术来隐藏水印信息。这类技术一般基于常用的图像变换(基于局部或是全局的变换),这些变换包括离散余弦变换(DCT)、离散小波变换(DWT)、傅氏变换(DFT 或 FFT)、傅立叶梅林(Fourie-Mellin)变换以及哈达马变换(Hadamard transform)等等。变换域水印算法就是利用相应的变换方法(DCT、DWT、DFT 等)将数字图像的空间域数据转化为相应的频域系数;其次,根据待隐藏的信息类型,对其进行适当编码或变形;再次,确定某种规则或算法,用待隐藏的信息的相应数据去修改前面选定的频域系数序列;最后,将数字图像的频域系数经相应的反变换转化为空间域数据。该类算法的隐藏和提取信息操作复杂,隐藏信息量不能很大,但抗攻击能力强,很适合于数字作品版权保护的数字水印技术中。2 4 2 1 DCT变换域方法 基于分块的 DCT 是常用的变换之一,在最早的基于分块 DCT 的水印技术中,数字水印方案是由一个密钥随机地选择图像的一些分块,在频域的中频上稍稍改变一个三元组以隐藏二进制序列信息。选择在中频分量编码是因为在高频编码易于被各种信号处理方法所破坏,而在低频编码则由于人的视觉对低频分量很敏感,对低频分量的改变易于被察觉。该数字水印算法对有损压缩和低通滤波是稳健的。Cox 等人提出了基于图像全局变换的数字水印算法。他们的重要贡献是明确提出加载在图像的视觉敏感部分的数字水印才能有较强的稳健性。他们的水印方案是先对整个图像I进行 DCT,然后将水印加载到 DCT 域中幅值最大的前 k 个系数上(除去直流分量),通常为图像的低频分量。若 DCT 系数的前 k 个最大分量表示为 kidDi,.,1,,水印是服从高斯分布的随机实数序列 kiwWi,.,1,,那么水印的嵌入算法为iiiwdd,其中常数为尺度因子,用来控制水印添加的强度。然后用新的系数做反变换得到水印图像wI。水印检测函数则是分别计算原始载体图像I和水印载体图像wI的离散余弦变换,并提取嵌入的水印iW,再做相关检测WWWW*/*,以确定水印的存在与否。该算法不仅在视觉上具有数字水印的不可察觉性,而且稳健性非常好,可经受有损 JPEG 压缩、滤波、D/A 和A/D 转换及重量化等信号处理,也可经受一般的几何变换如剪切、缩放、平移及旋转等操作。数字水印技术的发展与应用 8 2 4 2 2 DWT变换域方法 DWT 是一种时间尺度(时间频率)信号的多分辨率分析方法,在时频两域都具有表征信号局部特征的能力。根据人类视觉系统的照度掩蔽特性和纹理掩蔽特性,将水印嵌入到图像的纹理和边缘等不易觉被察觉。相应于图象的小波变换域,图像的纹理、边缘等信息主要表现在 HH、HL 和 LH 细节子图中一些有较大值的小波系数上。这样我们可以通过修改这些细节子图上的某些小波系数来嵌入水印信息。Deepa Kundur 等提出了一种基于小波变换的私有水印和公开水印算法。前者将图像和要嵌入的水印信息分别做小波分解,根据视觉特性进行数据融合,此方法在提取水印时需要原始图像;后者对小波系数做特殊的量化后嵌入信息,此方法提取水印不需要原始图像。牛夏牧、陆哲明、孙圣和提出一种基于多分辨率分解的数字水印技术。利用多分辨率分解技术,相同分辨率层次的灰度级数字水印嵌入到对应的相同分辨率层次的原始静态图像之中,使水印对原始图像具有自适应性。由于水印的嵌入过程是基于原始图像的不同分辨率层次之间的关系,所以水印的提取过程不需要原始图像。该方法具有很强的鲁棒性。刘九芬等人研究了水印算法中小波基的选择和正交小波基的性质与稳健性的关系,研究结果表明正交小波基的正则性、消失矩阶数、支撑长度以及小波图像能量在低频带的集中程度对水印稳健性的影响极小,同时得到一个有意义的结论:Haar 小波比较适合于图像水印,这对于在 DWT 域嵌入水印对小波基的选择有重要意义,因为选择不同的小波基对嵌入水印的性能有很大影响。离散小波变换不仅可以较好的匹配 HVS(Human Visual System)的特性,而且与即将出现的 JPEG2000、MPEG4 压缩标准兼容,利用小波变换产生的水印具有良好的视觉效果和抵抗多种攻击的能力,因此基于 DWT 域的数字水印技术是目前主要的研究方向,正逐渐代替 DCT 成为变换域数字水印算法的主要工具。2 4 2 3 DFT变换域方法 DFT 方法是利用图像的 DFT 的相位嵌入信息的方法。因为 Hayes 研究证明一幅图像的DFT 的相位信息比幅值信息更为重要。通信理论中调相信号的抗干扰能力比调幅信号抗干扰的能力强,同样在图像中利用相位信息嵌入的水印也比用幅值信息嵌入的水印更稳健,而且根据幅值对 RST(旋转(rotation)、比例缩放(scale)、平移(translation)操作的不变性,所嵌入的水印能抵抗图像的 RST 操作。这是针对几何攻击提出的方法。DFT 方法的优点在于可以把信号分解为相位信息和幅值信息,具有更丰富的细节信息。但是 DFT 方法在水印算法中的抗压缩的能力还比较弱。目前基于 DFT 的水印算法也相对较少。2 5 数字水印的攻击方法和对策 从数字水印的应用中我们可以看出,数字水印在认证、防盗版方面有重要的应用。然而,水印技术与密码术一样,是在不断的“攻”与“防”中不断发展的,因此,研究数字水印的攻击方法对于数字水印的发展有着重要的作用。对数字水印的攻击一般是针对水印的稳健性提出的要求,在前面已介绍过数字水印的稳健性是指水印信号在经历多种无意或有意的信号处理后,仍能保持完整性或仍能被准确鉴别的特征。标准数据处理是指数据(特别是数字作品)经过数据发布渠道,如编辑、打印、增强、格式转换等的过程。攻击是指那些带有损害性、毁坏性的,或者试图移去水印信号的处数字水印技术的发展与应用 9 理过程。稳健性好的水印应该能够抵抗各种水印攻击行为。在这里我们只考虑那些并不严重导致载体数据失真的攻击方法。按照攻击后的水印作品具有的商业价值可以将攻击分类为:成功的攻击和毁坏性的攻击。一种成功的攻击可以为攻击者创造商业价值。它能够把水印削弱到无法恢复和提取的地步,同时攻击后的载体数据只有一些少许的变动,不影响载体数据的商业价值。这是实际应用中最需要考虑进行对抗的攻击。而毁坏性攻击无法为攻击者创造良好的商业价值,但是它可以起到破坏的作用,影响数字水印的实际应用。它在某些情况下也需要考虑。按照攻击原理可以将攻击分为四类:简单攻击、同步攻击、削去攻击和混淆攻击。2 5 1 简单攻击(simple attacks)及对策 简单攻击是试图对整个水印化数据(嵌入水印后的载体数据)进行操作来削弱嵌入的水印的幅度(而不是试图识别水印或分离水印),导致数字水印提取发生错误,甚至根本提取不出水印信号。常见的操作有线性滤波、通用非线性滤波、压缩(JPEG、MPEG)、添加噪声、漂移、象素域量化、数模转换、gamma 修正等。简单攻击中的操作会给水印化数据造成类噪声失真,在水印提取和校验过程中将得到一个失真、变形的水印信号。可以采用两种方法抵抗这种类噪声失真:增加嵌入水印的幅度和冗余嵌入。通过增加嵌入水印幅度的方法,可以大大地降低攻击产生的类噪声失真现象,在多数应用中是有效的。嵌入的最大容许幅度应该根据人类视觉特性决定,不能影响水印的不可感知性。冗余嵌入是一种更有效的对抗方法。在空间域上可以将一个水印信号多次嵌入,采用大多数投票制度实现水印提取。另外,采用错误校验码技术进行校验,可以更有效地根除攻击者产生的类噪声失真。冗余嵌入可能会影响水印数据嵌入的比特,实际应用中应该折中这种鲁棒性和增加水印数据嵌入比率两者之间的矛盾。2 5 2 同步攻击(synchronization attacks)及对策 同步攻击是试图破坏载体数据和水印的同步性,即试图使水印的相关检测失效或使恢复嵌入的水印成为不可能。被攻击的数字作品中水印仍然存在,而且幅度没有变化,但是水印信号已经错位,不能维持正常水印提取过程所需要的同步性。这样,水印提取器就不可能、或者无法实行对水印的恢复和提取。同步攻击通常采用几何变换方法,如缩放、空间方向的平移、时间方向的平移(视频数字作品)、旋转、剪切、象素置换、二次抽样化、象素或者象素簇的插入或抽取等。同步攻击比简单攻击更加难以防御。因为同步攻击破坏水印化数据中的同步性,使得水印嵌入和水印提取这两个过程不对称。而对于大多数水印技术,水印提取器都需要事先知道嵌入水印的确切位置。这样,经过同步攻击后,水印将很难被提取出来。因此,在对抗同步攻击的策略中,应该设法使得水印的提取过程变得简单。同步攻击可能只使用一种简单的几何变换,例如剪切、平移等。在有源提取的情况下,可以将源载体数据和水印化数据相比较,得到水印化数据遭受的几何变换的种类和区域,进而可以消除和同化几何学上的失真。在无源提取的情况下,只能采用穷举的方法,尝试使用所有可能的处理,将被攻击的数据翻转过来。这种穷举的方法在遇到复杂的同步攻击的情况下,计算将成为不可能。比较可取的对抗同步攻击的对策是在载体数据中嵌入一个参照物。在提取水印时,先对数字水印技术的发展与应用 10 参照物进行提取,得到载体数据所有经历的攻击的明确判断,然后对载体数据依次进行反转处理。这样可以消除所有同步攻击的影响。到目前为止,最复杂的同步攻击是基于 Jittering的,它也常常被用来衡量一个水印技术是否真正实用。Jittering 攻击将数据切割、除去、复制和组合,那么,攻击后的数字作品将只有很细微的改变,甚至没有改变。已有实验证明,这种能非常有效的破坏大多数水印算法中正常的水印提取过程。例如,Jittering 攻击主要用于对音频信号数字水印系统的攻击,一般实现方法是,首先将信号数据分成 500 个采样点为一个单位的数据块,然后在每一个数据块中随机复制或删除一个采样点,来得到 499 或 501个采样点的数据块,接着再将数据块按原来顺序重新组合起来,这种改变即使对古典音乐信号数据也几乎感觉不到,但是却可以非常有效地阻止水印信号的检测定位,以达到难以提取水印信号的目的。类似的方法也可以用来攻击图像数据的数字水印,其实现方法也非常简单,即只要随机地删除一定数量的象素列,然后用另外的象素列补齐即可,该方法虽然简单,但是仍能有效破坏水印信号存在的检验。针对这种特殊攻击的对策是存在的。对于部分水印算法,在水印提取过程前,对攻击后的数字作品进行适当的低频过滤,可以消除 Jittering 攻击带来的影响。2 5 3 削去攻击(removal attacks)及对策 削去攻击试图通过分析水印化数据,估计图像中的水印,将水印化数据分离成为载体数据和水印信号,然后抛弃水印,得到没有水印的载体数据,达到非法盗用的目的。常见的方法有:合谋攻击(collusion attacks)、去噪、确定的非线性滤波、采用图像综合模型的压缩(如纹理模型或者 3-D 模型等)。针对特定的加密算法在理论上的缺陷,也可以构造出对应的削去攻击。合谋攻击,通常采用一个数字作品的多个不同的水印化拷贝实现16。数字作品的一个水印化拷贝成为一个检测体。Cox 提出的一个联合攻击,利用多个检测体进行多次平均统计操作,最后得到一个成功削去水印的载体数据。在另一个联合攻击中,从每个检测体中提取不同位置的一小部分数据,重新合并成一个新的载体数据,而这个载体数据中的水印基本上已经不存在了。针对这种基于统计学的联合攻击的对策是考虑如何限制水印化拷贝的数量。通过实验发现水印化拷贝的数量少于四个的时候,基于统计学的联合攻击将不成功,或者不可实现。针对特定的水印技术采用确定的信号过滤处理,可以直接从水印化数据中削去水印。另外,在知道水印嵌入程序和水印化数据的情况下,还存在着一种基于伪随机化的削去攻击。其原理是,首先根据水印嵌入程序和水印化数据得到近似的源数据,利用水印化数据和近似的源数据之间的差异,将近似的源数据进行伪随机化操作,最后可以得到不包含水印的源数据。为了对抗这种攻击,必须在水印信号生成过程中采用随机密钥加密的方法。采用随机密钥的加密,对于水印的提取过程没有影响,但是基于伪随机化的削去攻击将无法成功。因为每次嵌入的水印都不同,水印嵌入器将不能确定出近似的源数据来。2 5 4 混淆攻击(ambiguity attacks)及对策 混淆攻击是试图生成一个伪源数据、伪水印化数据来混淆含有真正水印的数字作品的版权,由于最早由 IBM 的 Craver 等人提出,也称 IBM 攻击。一个例子是倒置攻击,虽然载体数据是真实的,水印信号也存在,但是由于嵌入了一个或多个伪造的水印,混淆了第一个含有主权信息的水印,失去了唯一性。这种攻击实际上使数字水印的版权保护功能受到了挑战,如何有效地解决这个问题正引起研究人员的极大兴趣。数字水印技术的发展与应用 11 在混淆攻击中,同时存在伪水印、伪源数据、伪水印化数据和真实水印、真实源数据、真实水印化数据。要解决数字作品正确的所有权,必须在一个数据载体的几个水印中判断出具有真正主权的水印。一种对策是采用时间戳(timestamps)技术。时间戳由可信的第三方提供,可以正确判断谁第一个为载体数据加了水印。这样就可以判断水印的真实性。另一种对策是采用不可逆水印(noninvertible watermarking)技术。构造不可逆的水印技术的方法是使水印编码互相依赖。如使用单向哈希函数(one-way hash function)。3 数字水印技术的发展研究动态 从公开发表的文献看,国际上在数字水印方面的研究刚开始不久,但由于有大公司的介入和美国军方及财政部的支持,该技术研究的发展速度非常快。1998 年以来,IEEE 图像处理、IEEE 会报、IEEE 通信选题、IEEE 消费电子学等许多国际重要期刊都组织了数字水印的技术专刊或专题新闻报道。在美国,以麻省理工学院媒体实验室为代表的一批研究机构和企业已经申请了数字水印方面的专利。1998 年,美国政府报告中出现了第一份有关图像数据隐藏的 AD 报告。目前,已支持或开展数字水印研究的机构既有政府部门,也有大学和知名企业,它们包括美国财政部、美国版权工作组、美国空军研究院、美国陆军研究实验室、德国国家信息技术研究中心、日本 NTT 信息与通信系统研究中心、麻省理工学院、伊利诺斯大学、明尼苏达大学、剑桥大学、瑞士洛桑联邦工学院、西班牙 Vigo 大学、IBM 公司 Watson 研究中心、微软公司剑桥研究院、朗讯公司贝尔实验室、CA 公司、Sony公司、NEC 研究所以及荷兰菲利浦公司等。我国在该领域的研究这些年也从跟踪逐步转向自主研究,许多大学和研究所等科研机构纷纷致力于水印技术的研究,并在国内也开办了生产水印产品的公司。但水印在我国还是刚刚起步的一个新领域,还有很多不完善的地方。随着数字化产品在中国的普及,特别是Internet 用户的成倍增长以及电子商务的加速发展,在网络上直接销售数字化产品将给商家带来极大的利益,也是中国产品走向世界的极佳途径,我们应该抓住此机遇,研制出自己的数字水印产品,以适应新技术的发展。4 数字水印技术的应用前景 多媒体技术的飞速发展和 Internet 的普及带来了一系列政治、经济、军事和文化问题,产生了许多新的研究热点,以下几个引起普遍关注的问题构成了数字水印的应用前景。(一)数字作品的知识产权保护 数字作品(如电脑美术、扫描图像、数字音乐、视频、三维动画)的版权保护是当前的热点问题。由于数字作品的拷贝、修改非常容易,而且可以做到与原作完全相同,所以原创者不得不采用一些严重损害作品质量的办法来加上版权标志,而这种明显可见的标志很容易被篡改。数字水印利用数据隐藏原理使版权标志不可见或不可听,既不损害原作品,又达到了版权保护的目的。目前,用于版权保护的数字水印技术已经进入了初步实用化阶段,IBM 公司在其“数字图书馆”软件中就提供了数字水印功能,Adobe 公司也在其著名的 Photoshop软件中集成了 Digimarc 公司的数字水印插件。然而实事求是地说,目前市场上的数字水印产品在技术上还不成熟,很容易被破坏或破解,距离真正的实用还有很长的路要走。(二)商务交易中的票据防伪 随着高质量图像输入输出设备的发展,特别是精度超过 1200dpi 的彩色喷墨、激光打印数字水印技术的发展与应用 12 机和高精度彩色复印机的出现,使得货币、支票以及其他票据的伪造变得更加容易。据美国官方报道,仅在 1997 年截获的价值 4000 万美元的假钞中,用高精度彩色打印机制造的小面额假钞就占 19,这个数字是 1995 年的 9.05 倍。目前,美国、日本以及荷兰都已开始研究用于票据防伪的数字水印技术。其中麻省理工学院媒体实验室受美国财政部委托,已经开始研究在彩色打印机、复印机输出的每幅图像中加入唯一的、不可见的数字水印,在需要时可以实时地从扫描票据中判断水印的有无,快速辨识真伪。另一方面,在从传统商务向电子商务转化的过程中,会出现大量过度性的电子文件,如各种纸质票据的扫描图像等。即使在网络安全技术成熟以后,各种电子票据也还需要一些非密码的认证方式。数字水印技术可以为各种票据提供不可见的认证标志,从而大大增加了伪造的难度。(三)声像数据的隐藏标识和篡改提示 数据的标识信息往往比数据本身更具有保密价值,如遥感图像的拍摄日期、经/纬度等。没有标识信息的数据有时甚至无法使用,但直接将这些重要信息标记在原始文件上又很危险。数字水印技术提供了一种隐藏标识的方法,标识信息在原始文件上是看不到的,只有通过特殊的阅读程序才可以读取。这种方法已经被国外一些公开的遥感图像数据库所采用。此外,数据的篡改提示也是一项很重要的工作。现有的信号拼接和镶嵌技术可以做到“移花接木”而不为人知,因此,如何防范对图像、录音、录像数据的篡改攻击是重要的研究课题。基于数字水印的篡改提示是解决这一问题的理想技术途径,通过隐藏水印的状态可以判断声像信号是否被篡改。(四)隐蔽通信及其对抗 数字水印所依赖的信息隐藏技术不仅提供了非密码的安全途径,更引发了信息战尤其是网络情报战的革命,产生了一系列新颖的作战方式,引起了许多国家的重视。网络情报战是信息战的重要组成部分,其核心内容是利用公用网络进行保密数据传送。迄今为止,学术界在这方面的研究思路一直未能突破“文件加密”的思维模式,然而,经过加密的文件往往是混乱无序的,容易引起攻击者的注意。网络多媒体技术的广泛应用使得利用公用网络进行保密通信有了新的思路,利用数字化声像信号相对于人的视觉、听觉冗余,可以进行各种时(空)域和变换域的信息隐藏,从而实现隐蔽通信。总之,数字水印技术作为一种新兴的应用技术,一个尚未完善的科学领域,在对研究学者提出严峻挑战的同时,也带来了难得的机遇,因为在一种理论及技术趋于成熟的阶段,正是各种观点百家争鸣的时候,面对这样一个开放的研究体系,真正的突破者往往属于勇往直前的先行者!参考文献 1 杨长生 编著.“图象与声音压缩技术.”浙江大学出版社.2000.4,p.264-269.2 陈明奇,钮心忻,杨义先.“数字水印的研究进展和应用.”通信学报,Vol.22,No.5,May 2001,p.71-79.3 王慧琴,李人厚.“一种基于 DWT 的彩色图像数字水印算法.”小型微型计算机系统,第24 卷 第 2 期,2003 年 2 月,p.299-302.4 刘挺,尤韦彦.“一种基于离散小波变换和 HVS 的彩色图像数字水印技术.”计算