《媒体信号编码第6章.ppt》由会员分享,可在线阅读,更多相关《媒体信号编码第6章.ppt(149页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第6章变换编码 第6章变换编码 6.1变换编码的基本概念和原理变换编码的基本概念和原理 6.2KLT编码编码 6.3DCT编码编码 6.4时时-频局部化对变换的要求频局部化对变换的要求 6.5小波变换小波变换 6.6DCT与小波变换的性能比较与小波变换的性能比较 习题与思考题习题与思考题 第6章变换编码 6.1变换编码的基本概念和原理变换编码的基本概念和原理6.1.1变换编码的概念与历史变换编码的概念与历史20世纪70年代后,科学家们开始探索比预测编码效率更高的编码方法,这就是变换编码。变换编码是指先对信号进行某种函数变换(一般采用正交变换),从一种信号空间变换到另一种信号空间,然后再对变换后
2、的信号进行编码。如将时域信号变换到频域,因为声音、图像大部分信号都是低频信号,在频域中信号的能量较集中,再进行采样、编码,那么就能够压缩数据。以大家熟悉的傅里叶变换为例,时域的单频正弦信号经过傅里叶变换后,成为频域的单根谱线,在频域描述单根谱线所需要的比特数显然少于在时域描述正弦信号的比特数,从而实现数据压缩。第6章变换编码 变换编码的通用模型如图6-1所示,它一般经过映射变换、变换域系数二次量化、量化系数的统计编码(熵编码)三个步骤。映射变换的作用是把信号从一个域变换到另一个域,使信号在变换域容易进行压缩,变换后的样值更独立和有序。在采用实数变换的情况下,变换编码一般为可逆变换,即变换前和变
3、换后的数据是一一对应的,变换编码的数据压缩作用主要是依靠二次量化和统计编码实现。广义上说,预测编码、游程编码等都可以纳入图6-1所示模型,只是根据实用技术上的习惯,未将其归入变换编码范畴。第6章变换编码 图6-1变换编码通用模型第6章变换编码 原始图像及其幅度谱原始图像及其幅度谱第6章变换编码 33 percent coefficients containing 99 percent of total energy(not including DC component)第6章变换编码 10 percent coefficients containing 97 percent energy第6章
4、变换编码 5 percent coefficients containing 95 percent energy第6章变换编码 2 percent coefficients containing 92 percent energy第6章变换编码 6.1.2正交变换与正交矩阵正交变换与正交矩阵首先,根据矩阵代数理论,线性变换可以定义为Y=AX (6-1)其中,X为矢量信号,X=(x1,x2,xN)T是由N个分量组成的列向量;A是一个NN 的矩阵,称为此变换的核矩阵;变换结果Y=(y1,y2,yN)T也是由N个分量组成的列向量,称为X的像。式(6-1)反映了Y坐标系与X坐标系的基矢量之间的关系。如
5、果线性变换能保持N维矢量信号X的模X不变,则称此变换为正交变换,此时A为正交矩阵。A为正交矩阵的充要条件为AAT=ATA=I (6-2)第6章变换编码 其中,I为单位阵,AT为A的转置。又AA1=I,因此正交矩阵为满秩阵,其逆矩阵A1等于它的转置矩阵AT,即A1=AT。由于逆矩阵的存在,保证了可用反变换得到唯一确定的复原信号X,即正交变换保证了X与Y的一一对应关系,如式(6-3)所示。这是一个能使正交变换在媒体信号压缩编码中得到应用的重要性质。X=ATY=ATAX=X (6-3)其次,根据矩阵代数理论,一个实对称矩阵,必然存在一个正交矩阵Q及其转置矩阵QT,使得:QQT=(6-4)式中,为对角
6、阵,即第6章变换编码 l1,l2,lN为实对称矩阵F F的N个特征根,而矩阵QT=q1q2qNT的第i个列向量qi(称为矩阵F F的特征向量)和F F的特征根li满足(6-5)(6-6)(6-7)(6-8)第6章变换编码 6.1.3正交变换的压缩原理正交变换的压缩原理现在以一个简单的例子说明变换编码实现数据压缩的基本原理。设对一个缓变均匀分布的信号的采样值采用3比特进行编码,每个样本有23=8个幅度等级,则相邻两个样值x1和x2的联合事件x1x2共有88=64种可能性,可以用图6-2所示的二维平面坐标表示,其中x1轴和x2轴分别表示相邻两样本的可能取值。由于信号缓慢变化,那么相邻两个样值的幅度
7、等级变化差异不大,那么联合事件x1x2出现在图6-2所示的阴影区内的概率就很大。或者说,绝大多数的x1x2联合事件位于图6-2所示的阴影区内。不妨将此阴影区称为x1和x2相关区,x1和x2越相关,此阴影区越扁;x1和x2越不相关,此相关区就越加“方圆”。如果相邻两个样值幅度等级最多差1,那么x1x2联合事件全部出现在此阴影区内。第6章变换编码 图6-2正交变换示意图第6章变换编码 6.2KLT编码编码KLT可使变换后的各个分量之间在统计上互不相关。离散KLT有时也称为霍特林(Hoteling)变换,经霍特林变换后离散信号的各分量不再具有相关性。下面讨论KLT及其性质。对于一个离散信号序列,若每
8、一个信号由n个样点组成,那么就可以将该信号视作一个n维空间的点,而每个样值代表n维信号矢量空间的一个分量,记作X=(x1,x2,xN)T。矢量X的协方差矩阵X可以表示为(6-9)第6章变换编码 由于X为实对称阵,由式(6-4)可知,必存在一个与协方差矩阵X相对应的正交矩阵Q,其列向量是矢量信号X的协方差矩阵X的特征向量。我们用正交矩阵Q对信号X作正交变换,即Y=QX (6-10)这个变换的基本思想是Karhunen和Loeve分别在1947年和1948年提出来的,因此被称为KLT,Q为KLT矩阵,其主要性质如下所述。1.去相关性去相关性KLT使变换后的矢量信号Y的各分量互不相关。要证明矢量信号
9、Y的各分量互不相关,也就是要证明Y的协方差矩阵为对角型。根据协方差矩阵的定义,可以得到第6章变换编码 Y=EYE(Y)YE(Y)T (6-11)将式(6-10)代入式(6-11),有由此可以得出结论,Y为对角阵,Y的各分量之间不存在统计相关性。这也就是说,X各分量的相关性被完全去除,这正是采用正交变换编码所希望得到的结果。(6-12)第6章变换编码 2.能量集中性能量集中性KL变换的能量集中性体现在两个方面:一方面,变换后Y矢量的协方差矩阵Y只在主对角线上值不为零;另一方面,主对角线上的元素的大小按左上角到右下角的顺序依次排列,这也就是说,最大的方差将集中在前m个分量之中。3.最佳性最佳性在最
10、小均方误差准则下,KLT是失真最小的变换。它是从数据压缩角度提出的。首先,正交变换是“模”保持变换,因此变换域信号Y的能量与原始信号X的能量是相等的,变换本身一般是可逆变换,它不牵涉到数据失真,只是使信号易于压缩编码。其第6章变换编码 次,为实现更高性能的数据压缩,必须删除部分能量,这就带来了失真。设只保留前mb时迅速趋于零的所谓“钟形”函数,如Gabor用的窗函数为高斯函数。这样,滑动窗g(tb)在乘以信号f(t)后,便可以有效抑制t=b邻域以外的信号,所以式(6-35)反映的是t=b时刻附近的局部信号的频谱信息,从而达到时域局部化的目的。再分析Gabor变换在频域局部化方面的作用。由于f(
11、t)和F(w)、g(t)和G(w)为傅里叶变换对,根据傅里叶变换的性质,加窗后的信号f(t)g(tb)的傅里叶变换为(6-36)第6章变换编码 3.时时-频窗与窗函数条件频窗与窗函数条件设g(t)是窗函数,称为时窗中心,称为时窗半径。(6-38)(6-37)第6章变换编码 在此定义下,时窗函数g(t)的窗口为t*Dt,t*+Dt,窗口宽度为2Dt。依本定义,可得到窗函数g(tb)的时窗中心为t*+b,窗口宽度仍为2Dt。类似地,可定义频窗中心和频窗半径。设g(t)是窗函数,则其傅里叶变换G(w)为频窗函数,称(6-39)第6章变换编码 为频窗中心,称为频窗半径。在此定义下,频窗函数G(w)的窗
12、口为w*Dw,w*+Dw,窗口宽度为2Dw。依本定义,可得到窗函数G(wh)的频窗中心为w*+h,窗口半径和宽度不变,分别为Dw和 2Dw。(6-40)第6章变换编码 由以上两个定义可知,g(t)和G(w)分别起时窗和频窗的作用。在时间-频率平面上,时窗和频窗共同作用的结果就形成了时-频窗(分辨率单元),它是时-频局部变化的几何直观描述,如图6-7所示。时间-频率平面又简称“相平面”,它在非平稳信号、突变信号的分析和处理中起着非常重要的作用。第6章变换编码 图6-7时间-频率平面上的时-频窗第6章变换编码 时窗和频窗的条件如下:这也是说,若选用一个函数g(t)作为时窗,其傅里叶变换G(w)作为
13、频窗,则g(t)和G(w)应同时具有较强的衰减特性,它们要同时满足式(6-41)的要求。从局部化要求的角度出发,为提高时间分辨率和频率分辨率,则希望Dt和Dw越小越好。但实际上它们之间存在着相互制约的关系,必须服从信号的海森堡测不准原理,即(6-40)(6-41)第6章变换编码 4.Gabor变换的局限变换的局限从式(6-37)和式(6-38)可以看出,对于给定的窗函数g(t),Gabor变换的时间窗的窗宽度是不变的;同理,其频域窗的宽度也是不变的。对于任意时刻b和任意频率w,Gabor变换的时频窗固定以(b,w)为中心,窗宽为2Dt,窗高为2Dw,如图6-7所示。但在实际应用中,由于信号的频
14、率与其持续时间成反比,因此对高频信号检测时,因其持续时间较短,需要较窄的时间窗,以保证一定的精度;对低频信号检测时,因其持续时间较长,需要较宽的时间窗,以便获得足够多的信息。这也就是说,需要一个灵活可变的分辨率单元,使其面对高频成分时,时间窗口自动变窄,具有“显细第6章变换编码 节”的功能;而面对低频成分时,时间窗口自动变宽,具有“显概貌”的功能。这种理想的时-频窗如图6-8所示。显然,Gabor 变换不能满足实际问题的这种要求,这就导致了下一节要讨论的小波变换的提出。第6章变换编码 图6-8时间-频率平面上的时-频窗第6章变换编码 6.5小波变换小波变换6.5.1连续小波变换连续小波变换1.
15、连续小波变换的定义连续小波变换的定义连续小波变换(Continuous Wavelet Transform,CWT)的定义为其中,a为缩放因子(对应于频率信息),b为平移因子(对应于时空信息),y(x)为小波函数(又叫基本小波或母小波),为y(x)的复共轭。连续小波变换的过程如图6-9所示。(6-43)第6章变换编码 图6-9连续小波变换的过程第6章变换编码 小波变换与傅里叶变换比较,它们的变换核不同:傅里叶变换的变换核为固定的虚指数函数(复三角函数)ejwx,而小波变换的变换核为任意的母小波y(x)。前者是固定的,后者是可选的。实际上可选母小波有无穷多种,只要y(x)满足下列条件即可:(1)
16、绝对可积且平方可积,即yL1L2;(2)正负部分相抵,即(3)满足允许条件(admissible condition),即(广义积分收敛),其中,为y(x)的傅里叶变换。第6章变换编码 连续小波变换的定义式(6-43)也可以用内积形式表示为即函数f(x)的小波变换是其在小波基函数上的投影。(6-44)第6章变换编码 2.小波变换的时小波变换的时-频窗频窗可以证明,如果母小波y(x)对应的时窗中心和半径分别为 和Dty,则ya,b(x)对应的时窗中心和半径分别为类似地,ya,b(x)对应的频窗中心和半径为(和Dwy为母小波频窗中心和半径)(6-45)(6-46)第6章变换编码 3.常见的小波函数
17、常见的小波函数(1)Haar小波(Alfred Haar,1910年),其母小波函数为Haar小波函数的时域波形和其傅里叶变换后的信号波形如图6-10所示。(6-47)第6章变换编码 图6-10Haar小波函数及其傅里叶变换后的信号波形第6章变换编码(2)墨西哥草帽(Mexican hat)小波,其母小波函数为后墨西哥草帽小波函数的时域波形和其傅里叶变换后的信号波形如图6-11所示。(6-48)第6章变换编码 图6-11墨西哥草帽小波函数及其傅里叶变换后的信号波形第6章变换编码(3)Morlet小波(Jean Morlet,1984年),其母小波函数为Morlet小波函数的时域波形和其傅里叶变
18、换后的信号波形如图6-12所示。(6-49)第6章变换编码 图6-12Morlet小波函数(C=5)及其傅里叶变换后的信号波形第6章变换编码 6.5.2离散小波变换离散小波变换1.二进小波变换与滤波器二进小波变换与滤波器为了适应数字信号处理的要求,需要将小波变换离散化。可以先进行缩放因子a的离散。若小波函数y满足:则称y为基本二进小波。在连续小波变换中,若y为基本二进小波,则令a=2k,得到二进小波变换:(6-51)(6-50)第6章变换编码 为了构造基本二进小波,可设f满足:可推出,则f 大体上相当于一个低通滤波器,因此f(2x)的通带比f(x)的宽。可设f 满足如下的双尺度方程:其傅里叶变
19、换为(6-54)(6-53)(6-52)第6章变换编码 若设|G(w)|2=1|H(w)|2,其中,则G为高通滤波器,取其傅里叶变换为(6-55)(6-56)第6章变换编码 2.离散小波变换离散小波变换下面再将二进小波变换中的平移因子也离散化:令b=n2k,则可得离散小波变换为可将上式用前面所讲的滤波器系数改写成如下循环形式:(6-57)(6-58)第6章变换编码 可以写出如下正反离散小波变换的具体算法:(1)正变换(分解)(保存和所有)第6章变换编码(2)逆变换(重构)(利用正变换所保存下来的和所有)第6章变换编码 3.小波分解小波分解执行离散小波变换的有效方法是使用滤波器。该方法是Mall
20、at在1988年提出的,叫Mallat算法。该算法实际上是一种信号的分解方法,在数字信号处理中称为双通道子带编码。用滤波器实现离散小波变换的框图如图6-13所示。第6章变换编码 图6-13双通道滤波过程第6章变换编码 图6-13中,S表示原始的输入信号,通过两个互补的滤波器产生A和D两个信号,A表示信号的近似值(Approximations),D表示信号的细节值(Detail);近似值对应信号的低频部分,细节值对应信号的高频部分。在许多应用中,信号的低频部分是最重要的,而高频部分起一个“添加剂”的作用。犹如声音那样,把高频分量去掉之后,听起来声音确实是变了,但还能够听清楚说的是什么内容。相反,
21、如果把低频部分去掉,声音听起来就莫名其妙。在小波分析中,近似值是大的缩放因子产生的系数,表示信号的低频分量,而细节值是小的缩放因子产生的系数,表示信号的高频分量。第6章变换编码 由此可见,离散小波变换可以被表示成由低通滤波器和高通滤波器组成的一棵树。原始信号通过这样的一对滤波器进行的分解叫做一级分解。信号的分解过程可以迭代,也就是说可进行多级分解。如果对信号的高频分量不再分解,而对低频分量连续进行分解,就得到许多分辨率较低的低频分量,形成如图6-14所示的一棵比较大的树。这种树叫做小波分解树,分解级数的多少取决于要被分析的数据和用户的需要。另外,小波分解树一般只对信号的低频分量进行连续分解。第
22、6章变换编码 图6-14小波分解树第6章变换编码 需要指出的是,在使用滤波器对真实的数字信号进行小波变换时,得到的数据将是原始数据的两倍。例如,如果原始信号的数据样本为1000个,通过滤波之后每一个通道的数据均为1000个,总共为2000个。可根据奈奎斯特(Nyquist)采样定理提出的降采样(Down Sampling)方法,在每个通道中每两个样本数据取一个,得到的离散小波变换的系数分别用cD和cA表示,如图6-15所示(图中的符号 表示降采样)。只有这样,经过滤波器分解后的输出系数才仍为1000个。第6章变换编码 图6-15降采样过程第6章变换编码 4.小波重构小波重构离散小波变换正变换过
23、程叫做分解或者分析;把分解的系数还原成原始信号的过程叫做小波重构(Wavelet Reconstruction)或者合成(Synthesis),数学上叫做逆离散小波变换(Inverse Discrete Wavelet Transform,IDWT)。在使用滤波器做小波正变换时包含滤波和降采样两个过程,在小波重构时要包含升采样(Up Sampling)和逆滤波过程,如图6-16所示,图中的符号 表示升采样。第6章变换编码 图6-16小波重构方法第6章变换编码 升采样是在两个样本数据之间插入“0”,目的是把信号的分量恢复成原始长度。升采样的过程如图6-17所示。图6-17升采样的方法第6章变换编
24、码 6.5.3第二代小波变换第二代小波变换1.提升原理提升原理小波提升是一种构造紧支集双正交小波的新方法。由提升构成第二代小波变换的过程分为如下三个步骤:1)分裂分裂(Split)是将原始信号sj=sj,k 分为两个互不相交的子集和。每个子集的长度是原子集的一半。通常是将一个数列分为偶数序列ej1和奇数序列oj1,即Split(sj)=(ej1,oj1)(6-59)其中,ej1=ej1,k=sj,2 k,oj1=oj1,k=sj,2 k+1。第6章变换编码 2)预测预测(Predict)是利用偶数序列和奇数序列之间的相关性,由其中一个序列(一般是偶序列ej1)来预测另一个序列(一般是奇序列oj
25、1)。实际值oj1与预测值P(ej1)的差值dj1反映了两者之间的逼近程度,称之为细节系数或小波系数,对应于原信号sj的高频部分。一般来说,数据的相关性越强,则小波系数的幅值就越小。若预测是合理的,则差值数据集dj1所包含的信息比原始子集oj1包含的信息要少得多。预测过程如下:dj1=oj1P(ej1)(6-60)第6章变换编码 其中,预测算子P可用预测函数Pk来表示,函数Pk可取为ej1中的对应数据本身:Pk(ej1,k)=ej1,k=sj,2k(6-61)或ej1中的对应数据的相邻数据的平均值:或其他更复杂的函数。(6-62)第6章变换编码 3)更新经过分裂步骤产生子集的某些整体特征(如均
26、值)可能与原始数据并不一致,为了保持原始数据的这些整体特征,需要一个更新(Update)过程。更新过程用算子U来代替,具体如下:sj1=ej1+U(dj1)(6-63)其中,sj1为sj的低频部分;与预测函数一样,更新算子也可以取不同函数,如(6-64)第6章变换编码 或若P与U取不同的函数,可构造出不同的小波变换。(6-65)第6章变换编码 2.分解与重构分解与重构经过小波提升,可将信号sj分解为低频部分sj1和高频部分dj1;对于低频数据子集sj1可以再进行相同的分裂、预测和更新,把sj1进一步分解成dj2和sj2;如此下去,经过n次分解后,原始数据sj的小波表示为 sjn,djn,djn
27、+1,dj1。其中,sjn代表了信号的低频部分,而djn,djn+1,dj1则是信号的从低到高的高频部分系列。每次分解对应于上面的三个提升步骤,即分裂、预测和更新。Split(sj)=(ej1,oj1),dj1=oj1P(ej1),sj1=ej1+U(dj1)(6-66)第6章变换编码 小波提升是一个完全可逆的过程,其反变换的步骤如下:ej1=sj1U(dj1),oj1=dj1+P(ej1),sj=Merge(ej1,oj1)(6-67)分解的三个步骤可以用替代的方式来计算:先将奇数序列更新(用偶数序列预测奇数序列),然后用更新的奇数序列更新偶数序列。大致过程如下:Split(sj)=(ej1
28、,oj1),oj1=P(ej1),ej1+=U(oj1)(6-68)其反变换过程也可以用替代的方式来计算:ej1=U(oj1),oj1+=P(ej1),sj=Merge(ej1,oj1)(6-69)用提升方法进行小波分解和重构的示意图如图6-18所示。第6章变换编码 图6-18提升方法分解和重构第6章变换编码 3.特点特点第二代小波变换是由第一代小波变换的提升实现的。与第一代小波相比,第二代小波变换具有以下优点:(1)本位操作:所有运算可做本位操作,节省内存;(2)效率高:利用复合赋值,减少了浮点运算量;(3)并行性:一个上升步骤中的所有操作是并行的,而多个上升步骤之间是串行的;(4)逆变换:
29、逆变换只需简单地改变代码执行的先后顺序,具有与正向变换相同的计算复杂性;(5)通用性:由于变换过程中不必依赖傅里叶分析,因此很容易推广到一般性应用领域;第6章变换编码(6)非线性:易于构造非线性小波变换(如整数变换);(7)自适应:支持自适应性小波变换。函数的分析由粗到细逐步进行,细化过程可仅限于感兴趣的区域。6.5.4图像的小波变换图像的小波变换正因为第二代小波变换具有计算速度快、占用内存少、可以实现整数变换等特点,它成为JPEG 2000推荐的小波变换,是JPEG 2000中的核心算法。与传统的Mallat构造方法相比,第二代小波变换的提升格式完全是基于时(空)域的构造方法,它不依赖于平移
30、和伸缩,也不需要频谱分析工具,因此适用于有限区域、曲面以及非均匀采样等领域中小波的构造。第二代小波变换的基本思想是建立在双正交小波和完第6章变换编码 全可恢复滤波器组的理论基础上的,在保持小波双正交特性的条件下,通过所谓的提升和对偶提升过程,来改善小波及其对偶的性能,以满足各种应用的需要。对于二维数字图像信号,提升小波变换可以通过在水平和垂直方向上分别应用h、g滤波器(行变换和列变换)进行一维滤波来实现,分解过程如图6-19所示。图6-19图像的提升小波分解第6章变换编码 对二维图像数据进行行方向与列方向上的一维滤波,得到相应 LL、HL、LH和 HH 子带。行变换过程和列变换过程是对称的,其
31、顺序可以交换。其中,LL 子带代表原图像水平方向和垂直方向上均为低频的子带,HL 代表了原图像垂直方向上为低频而水平方向上为高频子带;LH 代表了原图像水平方向上的低频子带,而垂直方向上的高频子带;HH 代表了水平方向和垂直方向均为高频的子带。LL 代表了原图像的低频分量,是原图像的概貌成分,对人眼是最重要的,压缩时这部分信息不可损失过多;而其他三个高频子带代表了原图像的细节分量,这部分信息对人眼的显著性较小,图像压缩主要是针对这部分高频分量进行压缩。若进行图像的多级小波分解,则在每次分解后的 LL 子带上重复上述过程,对其余三个高频子带不再进行分解。第6章变换编码 在 JEPG 2000 的
32、具体实现中用小波提升的方法来避免直接对系数进行卷积计算,其中采用了两种小波变换,分别是用于有损压缩的9/7浮点型小波变换和既可以无损也可以用于有损压缩的5/3整数小波变换。x(n)表示输入的图像数据,y(n)表示经提升后的小波系数,有如下的计算公式。(1)5/3小波实现算法:(6-70)第6章变换编码(2)9/7小波实现算法:最后,给出一个图像小波变换的实例,展示如何用小波变换进行图像压缩编码。(6-71)第6章变换编码【例例6-3】设一个空间域图像的数据如下式所示,试对它进行非规范哈尔小波变换。第6章变换编码【解解】一个图像块是一个二维的数据阵列,可以先对阵列的每一行进行一维小波变换,然后再
33、对行变换之后的阵列的每一列进行一维小波变换,最后对经过变换之后的图像数据阵列进行编码。(1)求均值与差值。利用一维的非规范化哈尔小波变换对图像矩阵的每一行进行变换,即求均值与差值。在图像块矩阵A中,第一行的像素值为 R0:642361606757步骤1:在R0行上取每一对像素的平均值,并将结果放到新一行N0的前4个位置,其余的4个数是R0行每一对像素的差值的一半(细节系数):N0:3332333231292725第6章变换编码 步骤2:对行N0的前4个数使用与第一步相同的方法,得到两个平均值和两个细节系数,并放在新一行N1的前4个位置,其余的4个细节系数直接从行N0复制到N1的相应位置上:N1
34、:32.532.50.50.531292725步骤3:用与步骤1和2相同的方法,对剩余的一对平均值求平均值和差值:N2:32.500.50.531292725其中,第一个元素是该行像素值的平均值,其余的是这行的细节系数。需要指出的是,上述过程是可逆的。第6章变换编码(2)计算图像矩阵。使用上步对R0行处理的方法,对矩阵的每一行进行计算,得到行变换后的矩阵为第6章变换编码 其中,每一行的第一个元素是该行像素值的平均值,其余的是这行的细节系数。使用与行处理相同的方法,再对每一列进行计算,得到:第6章变换编码 上式中,左上角的元素表示整个图像块的像素值的平均值,其余是该图像块的细节系数。可以看到:变
35、换过程到此没有丢失信息,由于整个变换过程是可逆的,因此能够从最后得到的数据中无失真地重构出原始数据。对这个给定的变换,我们可以从所记录的数据中重构出各种分辨率的图像。例如,在分辨率为1(此例88)的图像基础上重构出分辨率为2(此例44)的图像,在分辨率为2的图像基础上重构出分辨率为4(此例22)的图像。第6章变换编码 通过变换之后产生的细节系数的幅度值比较小,这就为图像压缩提供了一种途径,例如去掉一些微不足道的细节系数而不影响对重构图像的理解,这时是不可逆过程。一种做法是设置一个阈值,例如设置阈值为5,对细节系数小于等于5时就把它当做“0”看待,这样有矩阵:第6章变换编码 与ARC相比,Ad
36、中“0”的数目增加了18个,也就是去掉了18个细节系数。这样做的好处是可提高图像小波变换编码的效率。对矩阵进行逆变换,得到了重构的近似矩阵。第6章变换编码 将此式的结果和原始数据相比,可看到数据有失真。利用小波变换,用户可以按照应用要求获得不同分辨率的图像。如图6-20所示,其中,(a)表示原始的Lena图像,(b)表示通过一级(level)小波变换可得到1/4分辨率的图像,(c)表示通过二级小波变换可得到1/8分辨率的图像,(d)表示通过三级小波变换可得到1/16分辨率的图像。阈值处理可用于去除图像中的噪声和控制编码后图像的数据量。在取不同阈值的情况下重构图像,可观察到图像质量发生的变化,如
37、图6-21所示。其中,(a)表示原始的Lena图像,(b)表示阈值5的重构图像,(c)表示阈值10的重构图像,(d)表示阈值20的重构图像。从图中可以看到,随着阈值的增大,图像质量也随之降低。第6章变换编码 图6-20使用小波分解产生多种分辨率图像第6章变换编码 图6-21不同阈值下的Lena图像第6章变换编码 6.6DCT与小波变换的性能比较与小波变换的性能比较DCT和小波变换作为在媒体信号编码中最常用的两种变换,它们之间的比较如下14-15:1.变换核变换核DCT 的变换核是固定的,它满足绝对可积条件,因此它是可逆变换。任何一个经过DCT 后的信号都存在逆变换,且物理意义明确。小波变换的变
38、换核是非固定的,存在着各种各样的变换核,而且只有在所采用小波满足“可容许条件”下,逆变换才存在。第6章变换编码 2.能量集中是这两种变换共同的特点能量集中是这两种变换共同的特点变换域编码的作用就是将时域(或空域)中的信号变换到另外一个正交矢量空间(即变换域),并使变换域中各信号分量之间相关性很小或互不相关,从而与变换前相比,其能量更加集中。DCT是先将图像分成NN像素块(N一般等于8),然后对NN像素块逐一进行DCT。由于大多数图像的高频分量较小,相应于图像高频成分系数经常为零,因此DCT 使实际信号的能量主要集中在低频段,在允许一定误差的条件下,对其进行编码时,可以忽略能量小于某值的频率分量
39、,使数码率降低,但数码率很低时要产生令人眼无法忍受的方块效应。第6章变换编码 小波变换并不需要将图像强制分成88的小块。但为了降低对内存的需求和方便压缩域中可能的分块处理,可以将图像分割成若干互不重叠的矩形块(tile)。分块的大小任意,既可以整个图像是一个块,也可以一个像素是一个块。一般分成26102610(即 641024 像素宽)的等大方块,不过边缘部分的块可能小一些,而且不一定是方的。图像分块的大小会影响重构图像的质量。一般来说,分块大比分块小的质量要好一些。小波变换具有很好的时-频局部化特性,信号经小波变换后的能量也集中在少数变换系数上,合理利用其变换系数分布特点,可克服DCT 编码
40、产生的方块效应,获得较好的压缩效果。第6章变换编码 3.图像压缩后性能比较图像压缩后性能比较在对图像编码中的DCT和小波变换进行比较时,如果允许改变变换方式,则应固定量化器和熵编码器,这是在比较小波和DCT编码性能时能提供客观比较的唯一方法。Xiong等人在相同的编码器框架下,只改变相应的变换方法对小波编码与DCT编码的性能进行了比较。第6章变换编码 1)基于基本等级的JPEG编码器在JPEG基本等级编码器中,使用的是DCT。为进行性能比较,只需要DCT部分改为3层的DWT,并按照图6-22(a)所示的父子关系构成小波变换系数块,然后根据小波系数频率变化规律以图6-22(b)扫描次序代替原来的
41、ZigZag扫描,其余部分保持不变。通过对Lena图像和Barbara图像的实验,发现小波变换代替DCT后峰值信噪比PSNR改进了1 dB左右,如表6-6所示。表中码率的单位b/p指的是每像素比特数(bit per pixel)。第6章变换编码 图6-22在JPEG基本编码器中用3层DWT代替DCT后的系数组块和扫描方式第6章变换编码 表表6-6DCT和和DWT的基本的基本JPEG编码器编码器 第6章变换编码 2)基于SPIHT编码框架的比较20 世纪90年代,Shapiro的EZW算法以及Said 等人的Spiht小波编码的成功应用,对传统的DCT 编码提出了严峻的挑战。在Spiht编码框架
42、下,用DCT代替DWT,为了应用Spiht的系数的树形父子关系,对DCT的系数也按照树形结构进行划分,如图 6-23 所示。第6章变换编码 图6-23DCT系数的树形结构(深度为3的系数树)第6章变换编码 经过划分后,88的DCT系数块可以看成是3层的小波系数树,其父子关系如下:对于系数节点,1i63,其父系数节点为i/4;对于系数节点,1j15,其子节点为4j,4j+1,4j+2,4j+3。特别地,直流系数“0”是DCT系数树的树根,它只有子节点,即系数1、2、3。这样,我们可以按Spiht算法的扫描方式进行扫描。为便于比较,相应的标准Spiht算法也只做了3层小波分解。基于DCT的Spih
43、t编码器和标准SPIHT编码器的比较如表6-7所示。由表6-7中的数据可以看出,DWT-SPIHT编码器结果比DCT-SPIHT编码器的PSNR性能改善了1 dB左右。第6章变换编码 表表6-7DCT和和DWT的的Spiht编码器编码器第6章变换编码 3)JPEG基本编码器的DCT系数量化和编码方法优化后与EZW的比较事实上,JPEG基本编码器的DCT系数的量化和编码并不是最优的,M.Crouse等人23提出了一种优化的DCT系数的量化和编码方法,取得了相比基本JPEG编码器有 1.7 dB 左右的PSNR性能改善(如表6-8所示),该结果和嵌入零树小波变换(EZW)相当,但与Spiht还是有
44、一定差距。第6章变换编码 表表6-8优化后的优化后的DCT与与EZW的性能比较的性能比较第6章变换编码 4)DCT与小波变换在视频压缩中的比较标准的视频编码方法是建立在将DCT应用到运动补偿图像的框架上的。将小波变换引入到视频编码中一直以来都是一个受到广泛研究的主题。一个观点就是用小波变换代替视频编码标准方法中的DCT。在基于DCT和小波变换的二维变换视频编码方法中,运动补偿图像同很多自然的静止图像相比有很大的不同,即在运动补偿后空间系数会减少。Xiong等人比较了Samoff公司提出的基于小波的零树熵(ZTE)视频编码器和MPEG-4校验模型(VM)视频编码器的结果,如表6-9所示。从表6-
45、9的结果可以看出,在相同的比特率和帧频下,基于小波的ZTE编码器在MPEG-4 VM上产生的客观性能与基于DCT的编码器相当。第6章变换编码 表表6-9基于基于ZTE和和DCT的的MPEG-4 VM视频编码性能比较视频编码性能比较第6章变换编码 4.多分辨率分析能力比较多分辨率分析能力比较小波变换具有多分辨率分析的能力,算法是采用Mallat提出的多分辨率塔形算法。小波变换处理的图像各个频带分别对应了原图像在不同尺度和不同分辨率下的细节,以及一个由小波变换分解级数决定的最小尺度、最小分辨率下对原始图像的最佳逼近。研究表明,有多种方法能使DCT产生类似于小波的多分辨率图像分解特性:一种是将常规的
46、二维DCT通过系数重组来获得多分辨率的图像;另一种是层式DCT编码分解形式。DCT的多分辨率图像分解为适应网络图像、信号的可分级传输、内容检索等提供了条件。从人类视觉特性对图像进行由粗到细的理解过程看,用于图像编码的任何变换都应该具有多分辨率分析特征。在这一点上,小波变换、DCT均有相似之处,但就目前来看,小波变换的多分辨率分析能力比DCT表现得更有优势。第6章变换编码 5.结论结论经过静止图像和视频的基于DCT和小波的编码比较后,可以得知在图像编码中的主要因素是量化器和熵编码器而不是小波变换和DCT的差别。在具有同样的量化器和熵编码器条件下,基于小波变换的图像编码比基于DCT的小波编码图像客
47、观质量PSNR改进约1 dB左右,在视频编码中则质量相当。另外,通过改进DCT系数重组方式,DCT也能产生类似小波的多分辨率图像分解特性。但是,小波变换的计算复杂度一般都高于DCT的复杂度。因此,DCT具有很强的生命力,在未来的图像视频压缩中必将还能发挥重要的作用。第6章变换编码 习题与思考题习题与思考题6-1变换编码的基本原理是什么?6-2试对协方差矩阵,求KLT矩阵,并验证该矩阵可以将F FX对角化。6-3试证明DCT是正交变换。6-4你认为利用正交变换能否实现熵保持编码?为什么?第6章变换编码 6-5按照JPEG标准的基本算法,试对如下所示的88源图像的亮度采样值编码。求出该图像块的全部码字(假设前一个量化子块的DC系数为11);计算数据压缩比;求出该压缩图像的重建亮度值;计算该重建图像的归一化均方误差。第6章变换编码 6-6修正离散余弦变换与离散余弦变换有何区别?6-7基于离散余弦变换的图像编码的优缺点主要体现在哪些方面?6-8连续小波变换中的参数a和b各是什么含义?6-9基于离散小波变换的图像编码的优缺点主要体现在哪些方面?6-10对图像进行小波变换需要先对图像进行分块吗?为什么?6-11试对题6-5所示的图像数据进行哈尔小波变换(取d=5),并求出重建图像数据。6-12第二代小波变换有哪些主要优点?提升原理的3个步骤的名称和内容各是什么?
限制150内