书签分享收藏举报版权申诉 / 33

立即下载

当前位置：首页 > 教育专区 > 教案示例 > 基于dct的图像压缩编码算法的matlab实现(终稿).doc

基于dct的图像压缩编码算法的matlab实现(终稿).doc

上传人：知****量

文档编号：86250716

上传时间：2023-04-14

格式：DOC

页数：33

大小：315.04KB

( 4.5 )

《基于dct的图像压缩编码算法的matlab实现(终稿).doc》由会员分享，可在线阅读，更多相关《基于dct的图像压缩编码算法的matlab实现(终稿).doc（33页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、摘要摘要随着科学技术的发展,图像压缩技术越来越引起人们的关注。为此从众多的图像压缩编码标准中选取了基于DCT变换的JPEG图像压缩编码算法进行研究，并通过对比分析各种软件特性选取了MATLAB进行实验仿真。首先说明了图像压缩在现代通信中的必要性和可行性，然后讲述了MATLAB及其图像处理工具箱的相关知识，并对基于DCT变换的JPEG图像压缩算法进行了详细的研究，重点介绍了JPEG压缩编码的具体过程和方法 ,详细介绍了编码中DCT变换、量化、熵编码和霍夫曼编码等模块的原理和数学推导以及各模块的功能分析。最后应用MATLAB进行了实验仿真并分析结果得出结论。实验结果表明基于DCT 变换的JPEG

2、图像压缩方法简单、方便,既能保证有较高的压缩比，又能保证有较好的图像质量，应用MATLAB仿真出来的结果较好的反应了其编码算法原理。关键词JPEG图像压缩；DCT；MATLAB；图像处理工具箱III 目录IV摘要IAbstractII第1章绪论11.1 课题背景11.1.1 离散余弦变换21.1.2 预测技术31.2 图像压缩技术的发展和现状31.2.1 图像编码技术发展历史31.2.2 图像编码技术的现状41.3 MATLAB 及其图像处理工具箱41.4 论文组织结构5第2章图像压缩编码理论算法62.1 DCT变换的思想来源62.2 基于DCT的JPEG图像压缩编码步骤82.2.1 颜

3、色空间的转换和采样82.2.2 二维离散余弦变换92.2.3 DCT系数的量化122.2.4 量化系数的编排132.2.5 DC系数的编码142.2.6 AC系数的编码152.2.7 组成位数据流162.2.8 DCT变换在图像压缩中的应用192.3 JPEG2000压缩算法192.3.1 小波变换202.3.2 量化202.3.3 熵编码212.3.4 位流组织212.4 JPEG与JPEG2000的区别212.5 本章小结23第3章基于DCT的图像压缩MATLAB仿真实现243.1 数字图像文件的读写243.2 程序流程图263.3 DCT变换的编程实现273.4 MATLAB仿真结果2

4、73.5 实验结果分析293.6 本章小结30结论31第1章绪论1.1 课题背景随着信息技术的发展，图像信息被广泛应用于多媒体通信和计算机系统中，但是图像数据的一个显著特点就是信息量大。具有庞大的数据量，如果不经过压缩,不仅超出了计算机的存储和处理能力,而且在现有的通信信道的传输速率下，是无法完成大量多媒体信息实时传输的,因此,为了更有效的存储、处理和传输这些图像数据,必须对其进行压缩,因此有必要对图像压缩编码进行研究。由于组成图像的各像素之间,无论是在水平方向还是在垂直方向上都存在着一定的相关性，因此只要应用某种图像压缩编码方法提取或者减少这种相关性, 就可以达到压缩数据的目的1。数字图像

5、的冗余主要表现在以下几种形式：空间冗余：规则物体和规则背景的表面物理特性都具有相关性，数字化后表现为数字冗余。例如：某图片的画面中有一个规则物体,其表面颜色均匀,各部分的亮度、饱和度相近,把该图片作数字化处理,生成位图后,很大数量的相邻像素的数据是完全一样或十分接近的,完全一样的数据当然可以压缩,而十分接近的数据也可以压缩,因为恢复后人亦分辨不出它与原图有什么区别,这种压缩就是对空间冗余的压缩。时间冗余：序列图像(如电视图像和运动图像)和语音数据的前后有着很强的相关性,经常包含着冗余。在播出该序列图像时,时间发生了推移,但若干幅画面的同一部位没有变化,变化的只是其中某些地方,这就形成了时间冗余

6、。统计冗余：空间冗余和时间冗余是把图像信号看作概率信号时所反应出的统计特性，因此，这两种冗余也被称为统计冗余。编码冗余：同样长度的编码可以表示不同的信息。结构冗余：相似的，对称的结构如果都加以记录就出现结构冗余。知识冗余：由图像的记录方式与人对图像的知识差异而产生的冗余。人对许多图像的理解与某些基础知识有很大的相关性。许多规律性的结构，人可以由先验知识和背景知识得到。而计算机存储图像时还得把一个个像素信息存入，这就形成冗余。视觉冗余：视觉系统对于图像场的注意是非均匀和非线性的，视觉系统不是对图像的任何变化都能感知。所谓的图像压缩编码技术就是对要处理的图像数据按一定的规则进行变换和组合, 从而达

7、到以尽可能少的数据流(代码)来表示尽可能多的数据信息。在众多的图像压缩编码标准中，JPEG(Joint Photographic Experts Group)格式是一种称为联合图像专家组的图像压缩格式，它适用于不同类型、不同分辨率的彩色和黑白静止图像2。在JPEG图像压缩算法中，一种是以离散余弦变换(DCT，Discrete Cosine Transform)为基础的有损压缩算法，另一种是以预测技术为基础的无损压缩算法。1.1.1 离散余弦变换 DCT变换利用傅立叶变换的性质。采用图像边界褶翻将像变换为偶函数形式，然后对图像进行二维傅立叶变换，变换后仅包含余弦项，所以称之为离散余弦变换。DCT

8、编码属于正交变换编码方式，用于去除图像数据的空间冗余。变换编码就是将图像光强矩阵(时域信号)变换到系数空间(频域信号)上进行处理的方法。在空间上具有强相关的信号，反映在频域上是在某些特定的区域内能量常常被集中在一起，或者是系数矩阵的分布具有某些规律。我们可以利用这些规律在频域上减少量化比特数，达到压缩的目的。图像经DCT变换以后，DCT系数之间的相关性就会变小。而且大部分能量集中在少数的系数上，因此，DCT变换在图像压缩中非常有用，是有损图像压缩国际标准JPEG的核心。从原理上讲可以对整幅图像进行DCT变换，但由于图像各部位上细节的丰富程度不同，这种整体处理的方式效果不好。为此，发送者首先将输

9、入图像分解为8*8或16*16块，然后再对每个图像块进行二维DCT变换，接着再对DCT系数进行量化、编码和传输；接收者通过对量化的DCT系数进行解码，并对每个图像块进行的二维DCT反变换。最后将操作完成后所有的块拼接起来构成一幅单一的图像。对于一般的图像而言，大多数DCT系数值都接近于0，所以去掉这些系数不会对重建图像的质量产生较大影响。因此，利用DCT进行图像压缩确实可以节约大量的存储空间。在实验中，先将输入的原始lena图像分为8*8块，然后再对每个块进行二维DCT变换。MATLAB图像处理上具箱中提供的二维DCT变换及DCT反变换函数如下。dct2实现图像的二维离散余弦变换。其语法格式为

10、：(1)B=dct2(A) 返回图像A的二维离散余弦变换值，其大小与A相同且各元素为离散余弦变换的系数B（K1，k2)。(2)B=dct2(A，in，n)或B=dct2(A,m，n) 如果m和n比图像A大，在对图像进行二维离散余弦变换之前，先将图像A补零至m*n如果m和n比图像A小。则进行变换之前，将图像A剪切。idct2可以实现图像的二维离散余弦反变换，其语法格式为：B=idct2(A)；B=idct2(A，m，n)或B=idct2(A，m，n)。1.1.2 预测技术它是利用空间中相邻数据的相关性,利用过去和现在出现过的点的数据情况来预测未来点的数据。通常用的方法是差分脉冲编码调制(DPCM

11、)和自适应差分脉冲编码调制(ADPCM)。1.2 图像压缩技术的发展和现状1.2.1 图像编码技术发展历史1948年提出电视信号数字化后，图像压缩编码的研究工作就宣告开始了。在这项技术发展的早期，限于客观条件，仅对帧内预测法和亚取样内查复原法进行研究，对视觉特性也做了一些极为有限但可贵的研究工作。1966年J.B.O Neal对比分析了DPCM和PCM并提出了用于电视的实验数据。1969年进行了线性预测编码的实际实验。1969年举行首届图像编码会议。70年代开始进行了帧间预测编码的研究。80年代开始对运动估值和模型编码进行研究3。进入90年代，ITU-T和ISO制定了一系列图像编码国际建议，如

12、H.261、JPEG、MPEG-1、H.262、H.263、MPEG-4等。变换编码是1968年H.C.Andrews等人提出的，采用的是二维离散傅立叶变换，此后相继出现用其他变换方法的变换编码，其中包括二维离散余弦变换。1.2.2 图像编码技术的现状经过几十年的发展，图像编码技术业已成熟，一些国际建议的制定极大地推动了图像编码技术的实现和产业化，从而推动图像编码技术以更快的速度发展，目前的研究方向有两个：(1) 更好地实现现有的图像编码国际建议。研制出集成度更高、性能更好的图像编码专用芯片，使编码系统成本更低、可靠性更高。解决好现有的图像编码系统开发中的技术问题。例如：提高图像质量、提高

13、抗码能力等。 (2) 对图像编码理论和其他图像编码方法的研究。目前已经提出和正在进行研究的图像编码方法有：多分辨率编码、基于表面描述的编码、模型编码、利用人工神经网络的编码、利用分形几何的编码、利用数学形态学的编码等等。1.3 MATLAB 及其图像处理工具箱如果应用高级语言(如Basic，C，Fortran)编写仿真程序来实现这一基于DCT的图像压缩编码算法比较麻烦，而且仿真效果也不是十分理想。本文主要应用MATLAB发布的图像处理工具箱中的相关函数和命令来实基于DCT的图像压缩编码理论算法的仿真。MATLAB语言是由美国MathWorks公司推出的计算机软件，经过多年的逐步发展与不断完

14、善，现已成为国际公认的最优秀的科学计算与数学应用软件之一，它集数值分析、矩阵运算、信号处理和图形显示于一体，构成了一个方便的、界面友好的用户环境，而且还具有可扩展性特征。MATLAB中的数字图像是以矩阵形式表示的，矩阵运算的语法对MATLAB中的数字图像同样适用，这意味着MATLAB强大的矩阵运算能力对用于图像处理非常有利。图像处理工具箱(Image Processing Toolbox)提供了一套全方位的参照标准算法和图形工具，用于进行图像处理、分析、可视化和算法开发。可进行图像压缩、空间转换、图像增强、特征检测、降噪、图像分割和图像配准等功能。工具箱中大部分函数均以开放式 MATLAB 语

15、言编写，这意味着可以检查算法、修改源代码和创建自定义函数。本文利用MATLAB图像处理工具箱对基于DCT的JPEG图像压缩编码理论算法进行仿真，实验证明该软件功能强大，语言简洁易学，工具箱具有丰富的技术支持并集成了该领域专家的智慧，应用简单而效果良好。1.4 论文组织结构本文的主要内容是，介绍图像压缩编码算法中的离散余弦变换(DCT)变换算法，和用MATLAB进行仿真。第1 章绪论，对于图像压缩的研究意义、可行性、压缩技术的现状和发展、MATLAB图像处理工具进行了简要的介绍。第2章对图像压缩编码理论算法进行了介绍，着重讲解了基于DCT的JPEG图像压缩编码步骤。之后对JPEG2000进行了粗

16、略的介绍，描述了JPEG和JPEG2000的区别。第3章对基于DCT的图像压缩MATLAB仿真实现进行了详细的描述。其中包括利用MATLAB编写程序的流程图，和给出了具体仿真实验结果与结果分析。516第2章图像压缩编码理论算法2.1 DCT变换的思想来源信号的变换分析方法中，通常是通过一组适当的基函数对信号进行分解，得到信号在变换域的表示方法，利用信号在变换域中某些特征趋于集中的特点来提取其特征从而进行分析。自1822年傅立叶(Fourier)发表“热传导解析理论”以来，傅立叶变换一直是信号处理领域中应用最广泛、效果最好的一种分析手段。但傅立叶变换只是一种纯频域的分析方法，它在频域的定位性是

17、完全准确的(即频域分辨率最高)，而在时域无任何定位性(或分辩能力)，也即傅立叶变换所反映的是整个信号全部时间下的整体频域特征，而不能提供任何局部时间段上的频率信息。事实上，在我们生活中的常见信号通常都具有非平稳的性质，即其频域性质都是随时间而变化的。对这一类信号用傅立叶变换进行分析，虽然可以知道信号所包含有哪些频率信息，但不能知道这些频率信息具体出现在哪个时间段上，因此不能提供关于信号完整的信息。可见，傅立叶变换不适用于提取局部时间段(或瞬间)的频域特征信息4。为了研究信号在局部时间范围的频域特征，1946年Gabor提出了著名的Gabor变换。其基本思想是，取时间函数作为窗口函数，用与待分析

18、函数相乘，然后再进行傅立叶变换。在Gabor变换的基础上，为了适应不同问题的需要，进一步发展了多种形式的窗口函数，如矩形窗、汉宁窗、哈明窗等，这一类加窗的傅立叶变换统称为短时傅立叶变换(STFT)。STFT从本质上讲，是用窗函数截取原始信号的一个待分析段进行傅立叶变换，因而可以描述信号在某一局部时间段上的频率信息。目前，STFT在许多领域获得了广泛的应用，但由于STFT的定义决定了其窗函数的大小和形状均与时间和频率无关，一旦选定窗口就保持固定不变，不利于分析时变信号。实际上一般的高频信号持续时间较短，而低频信号持续时间较长，因此我们期望对于高频信号采用小时间窗，对于低频信号采用大时间窗进行分析

19、。在进行信号分析时，这种变时间窗的要求同STFT的固定时窗(窗不随频率而变化)的特性是相矛盾的5。离散余弦变换(DCT)从本质上是一种变换分析方法，要在变换时最大的去除分析信号的相关性提取其特征，就必须适当的构造一组基函数，这组基函数以某种形式类似于我们所要表示的数据，甚至具有与数据相同的相关结构。在我们日常生活中常遇到的信号在空间域和频域都具有相关性。在空间上相隔较近的样值间的相关性比相隔较远的大的多，而在频域上通常呈带状。为了分析和表示这样的信号，我们需要基函数在空间域和频域是局域性的。由于离散余弦函数的频域分辨率与时域分辨率成反比，刚好与实际信号长时低频、短时高频的特性相吻合，既能精确定

20、位信号的突发跳变，又能把握信号的整体变化率。由此可见，离散余弦变换是一种比较理想的进行信号处理的数学工具6。图像压缩编码的理论算法。(1)基于DCT的JPEG图像压缩编码理论算法基于DCT编码的JPEG编码压缩过程框图，如图2-1所示。压缩数据原始图像数据分成8*8的小块量化器DCT变换熵编码器码表量化表图2-1 基于DCT编码的JPEG压缩过程简化图上图是基于DCT变换的图像压缩编码的压缩过程，解压缩与上图的过程相反。在编码过程中，首先将输入图像颜色空间转换后分解为88大小的数据块，然后用正向二维DCT把每个块转变成64个DCT系数值，其中1个数值是直流(DC)系数，即88空域图像子块的平

21、均值，其余的63个是交流(AC)系数，接下来对DCT系数进行量化，最后将变换得到的量化的DCT系数进行编码和传送，这样就完成了图像的压缩过程。在解码过程中，形成压缩后的图像格式，先对已编码的量子化的DCT系数进行解码，然后求逆量化并把DCT系数转化为88样本像块(使用二维DCT反变换)，最后将操作完成后的块组合成一个单一的图像。这样就完成了图像的解压过程。2.2 基于DCT的JPEG图像压缩编码步骤2.2.1 颜色空间的转换和采样JPEG文件使用的颜色空间为1982年推荐的电视图像数字化标准CCIR 601(现为ITU-RB T.601)。在这个色彩空间中，每个分量、每个像素的电平规定为255

22、级，用8位代码表示。JPEG只支持YCbCr颜色模式。其中Y代表亮度，CbCr代表色度。全彩色图像RGB模式转换到YCbCr模式，用下组公式。 (2-1) 其逆变换为： (2-2)JPEG是以88的块为单位来进行处理的，由于人眼对亮度Y的敏感度比色度CbCr的敏感度大的多，所以采用缩减取样的方式，通常采用YUV422取样，图2-2所示。图2-2 YUV422取样示意图即对于1616的块，Y取4个88的块，CbCr各取2个88的块。也有YUV411方式，Y取4个88的块，CbCr各取1个88的块。YUV422取样方式，数据减少1/3。YUV411取样方式，数据减少1/2。缩减取样一般采用图2-3

23、所示方法。abcdebd图2-3 压缩取样示意图2.2.2 二维离散余弦变换在傅里叶级数展开式中，如果被展开的函数是实偶函数，那么，其傅里叶技术中只包含余弦项，在将其离散化由此可导出余弦变换，或称之为离散余弦变换(DCT，Discrete Cosine Transform)7。二维离散余弦正变换公式为 (2-3)式中，。二维离散余弦逆变换公式为 (2-4)式中，。 JPEG采用的是88大小的子块的二维离散余弦变换。在编码器的输入端，把原始图像顺序地分割成一系列88的子块，子块的数值在-128到127之间。采用余弦变换获得64个变换系数8。变换公式，如式(2-5)所示。 (2-5)式中，。在

24、MATLAB的图像处理工具箱中，可以直接调用dct2和idct2来实现二维离散余弦变换及其反变换。(1) dct2dct2函数实现图像的二维离散余弦变换，其语法为：F=dct2(f)运行下列程序：f=imread(cameraman.tif)；f=im2double(f)；F=dct2(f)；subplot(121)，imshow(f， )；subplot(122)，imshow(log(1+20*abs(F)， )；运行结果如图24所示。图24 图像显示及图像DCT变换后频谱显示由运行结果可知，DCT变换具有能量集中的性质，数据集中在左上角。因此进行图像压缩时离散余弦变换矩阵可以舍弃右下角的

25、高频数据。(2) idct2 idct2函数实现图像的二维离散余弦逆变换，其语法为：F=idct2(f)在MATLAB图像处理工具箱中，有一个对图像进行块操作的函数blkproc，利用这个函数，可以直接实现图像一系列88子块的DCT变换。其语法格式为：B = blkproc(A，m n，fun， parameter1,，parameter2， .)B = blkproc(A，m n，mborder nborder,fun,.)B = blkproc(A，indexed，.)m n是指图像以m*n为分块单位，对图像进行处理(如8像素*8像素)Fun：应用此函数对分别对每个m*n分块的像素进行处理

26、parameter1， parameter2：要传给fun函数的参数mborder nborder：对每个m*n块上下进行mborder个单位的扩充，左右进行nborder个单位的扩充，扩充的像素值为0，fun函数对整个扩充后的分块进行处理。如下列程序：I = imread(cameraman.tif)； fun = idct2；J = blkproc(I，8 8，fun)；imagesc(J)， colormap(hot)运行结果如图2-5所示。图2-5 DCT变换后图像88的图像经过DCT变换后，其低频分量都集中在左上角，高频分量分布在右下角(DCT变换实际上是空间域的低通滤波器)。由于该

27、低频分量包含了图像的主要信息(如亮度)，而高频与之相比，就不那么重要了，所以我们可以忽略高频分量，从而达到压缩的目的。将高频分量去掉，这就要用到量化，它是产生信息损失的根源。这里的量化操作，就是将某一个值除以量化表中对应的值。由于量化表左上角的值较小，右上角的值较大，这样就起到了保持低频分量，抑制高频分量的目的。JPEG使用的颜色是YUV格式。我们提到过，Y分量代表了亮度信息，UV分量代表了色差信息。相比而言，Y分量更重要一些。我们可以对Y采用细量化，对UV采用粗量化，可进一步提高压缩比。所以上面所说的量化表通常有两张，一张是针对Y的，一张是针对UV的。2.2.3 DCT系数的量化量化是对经过

28、DCT变换后的频率系数进行量化，其目的是减小非“0”系数的幅度以及增加“0”值系数的数目，它是图像质量下降的最主要原因。对于基于DCT的JPEG图像压缩编码算法使用如图2-6所示的均匀量化器进行量化，量化步距是按照系数所在的位置和每种颜色分量的色调值来确定。因为人眼对亮度信号比对色差信号更敏感，因此使用了表2-1所示的种量化表。此外，由于人眼对低频分量的图像比对高频分量的图像更敏感，因此表中的左上角的量化步距要比右下角的量化步距小9。DCT系数输入量化系数输出图2-6 均匀量化器亮度和色度因为代表的图像的信息量不同，亮度代表了图像的低频分量，色度代表了图像的高频分量，要分别对亮度和色度进行量化

29、，所以量化表也是不同的。JPEG压缩色度和亮度量化表如表2-1所示。表2-1 JPEG压缩色度和亮度量化表亮度量化表色度量化表161110162440516117182447999999991212141926586055182126669999999914131624405769562426569999999999141722295187806247669999999999991822375668109103779999999999999999243555648110411392999999999999999949647887103121120101999999999999999979929

30、598112100103999999999999999999量化会产生误差，上图是综合大量的图像测试的实验结果，对于大部分图像都有很好的结果。表中可以看出，高频部分对应的量化值大，目的就是将高频部分编程接近于0，以便以后处理。JPEG可以在压缩比和图像质量间作取舍。方法就是改变量化值。如果量化值放大一倍，则有更多的系数量化为0，提高了压缩比。2.2.4 量化系数的编排经过DCT变换后，低频分量集中在左上角，其中F(0，0)(即第一行第一列元素)代表了直流(DC)系数，即88子块的平均值，要对它单独编码。由于两个相邻的88子块的DC系数相差很小，所以对它们采用差分编码DPCM，可以提高压缩比，也

31、就是说对相邻的子块DC系数的差值进行编码。88的其它63个元素是交流(AC)系数，采用行程编码10。所以量化后的系数要重新编排，目的是为了增加连续的“0”系数的个数，就是“0”的游程长度，方法是按照Z字形的式样编排。DCT变换后低频分量多呈圆形辐射状向高频率衰减，因此可以看成按Z字形衰减。因此，量化系数按Z字形扫描读数，这样就把一个88的矩阵变成一个164的矢量，频率较低的系数放在矢量的顶部。量化后的DCT系数的编排如图2-7所示。图2-7 量化DCT系数的编排量化后的DCT系数的序号如表2-2所示。表2-2 量化DCT系数的序号01561415272824713162629423812172

32、53041439111824314044531019233239455254202233384651556021343747505659613536484957586263 2.2.5 DC系数的编码88子块的64个变换系数经量化后，按直流系数DC和交流系数AC分成两类处理。坐标u=v=0的直流系数DC实质上就是空域图像中64个像素的平均值。图像块经过DCT变换之后得到的DC直流系数有两个特点，一是系数的数值比较大，二是相邻88图像块的DC系数值变化不大。根据这个特点，JPEG算法使用了差分脉冲调制编码技术。差分脉冲编码调制(DPCM，Differential Pulse Code Modul

33、ation)，是一种对模拟信号的编码模式，先根据前一个抽样值计算出一个预测值，再取当前抽样值和预测值之差作为编码用。此差值称为预测误差。抽样值和预测值非常接近(因为相关性强)，预测误差的可能取值范围比抽样值变化范围小。所以可用少几位编码比特来对预测误差编码，从而降低其比特率。这是利用减小冗余度的办法，降低了编码比特率。因此,对DC系数编码进行差分脉冲编码就是对相邻图像块之间量化DC系数的差值(Delta)进行编码，即对相邻块之间的DC系数的差值DIFF=DC-DC编码。DC采用差值脉冲编码的主要原因是由于在连续色调的图像中，其差值多半比原值小，对差值进行编码所需的位数，会比对原值进行编码所需的

34、位数少许多。例如差值为5，它的二进制表示值为101，如果差值为-5，则先改为正整数5，再将其二进制转换成1的补数即可。所谓1的补数，就是将每个Bit若值为0，便改成1；Bit为1，则变成0。差值5应保留的位数为3，列出差值所应保留的Bit数与差值内容的对照。在差值前端另外加入一些差值的霍夫曼码值，例如亮度差值为5(101)的位数为3，则霍夫曼码值应该是100，两者连接在一起即为100101。2.2.6 AC系数的编码DCT变换所得系数除直流系数之外的其余63个系数称为交流系数(AC系数)。量化AC系数的特点是1 64矢量中包含有许多“0”系数，并且许多“0”是连续的，因此使用非常简单和直观的

35、游程长度编码(RLE)对它们进行编码。所谓行程编码(Run-Length Encoding)就是指仅存储一个像素值以及具有相同颜色的像素数目的图像数据编码方式，或称游程编码，常用RLE(Run-Length Encoding)表示。该压缩编码技术相当直观和经济，运算也相当简单，因此解压缩速度很快。RLE压缩编码尤其适用于计算机生成的图形图像，对减少存储容量很有效果11。 63个AC系数采用行程编码的方式进行编码的格式如图2-8所示。也即在AC01到AC63中，找出每一个非零的AC值，将其表示成(NN/SS)VV的形式，其中：NN表示该AC值前的0的个数。而SS、VV与DC的定义一样。如果连续的

36、非0超过15个时，增加一个扩展字节：(15/0)表示连续16个0。另外若有一串0延伸到AC63，一律用(0/0)表示结束。7654321076543210第一字节第二字节两个非零值之间的连续零的个数下一个非零值所占的比特数下一个非零系数的实际值图2-8 AC编码格式对于AC系数，有两个符号。符号1为行程和尺寸，即上面的(RunLength，Size)。(0，0)和(15，0)是两个比较特殊的情况。(0，0)表示块结束标志(EOB)， (15，0)表示ZRL，当行程长度超过15时，用增加ZRL的个数来解决，所以最多有三个ZRL(316+15=63)。符号2为幅度值(Amplitude)。对于DC

37、系数，也有两个符号。符号1为尺寸(Size)；符号2为幅度值(Amplitude)。对于AC系数，符号1和符号2分别进行编码。零行程长度超过15个时，有一个符号(15，0)，块结束时只有一个符号(0，0)。对符号1进行Huffman编码(亮度，色差的Huffman码表不同)。对符号2进行变长整数VLI编码。举例来说：Size=6时，Amplitude的范围是-63-32，以及3263，对绝对值相同，符号相反的码字之间为反码关系。所以AC系数为32的码字为100000，33的码字为100001，-32的码字为011111，-33的码字为011110。符号2的码字紧接于符号1的码字之后。对于DC系

38、数，Y和UV的Huffman码表也不同。2.2.7 组成位数据流JPEG编码的最后一个步骤是把各种标记代码和编码后的图像数据组成一帧一帧的数据，这样做的目的是为了便于传输、存储和译码器进行译码，这样的组织的数据通常称为JPEG位数据流(JPEG bit stream)12。举个例子来说明上述过程。下面为88的亮度(Y)图像子块经过量化后的系数，如表2-3所示。表2-3 亮度量化后的系数150-100000-2-1000000-1-1000000000000000000000000000000000000000000000017可见量化后只有左上角的几个点(低频分量)不为零，这样采用行程编码就会

39、很有效。第一步，熵编码的中间格式表示。先看DC系数。假设前一个88子块DC系数的量化值为12，则本块DC系数与它的差为3，根据下表表2-4 DC系数表SizeAmplitude0011,123,-2,2,337-4，47415-8，815531-16，1631663-32，32637127-64，641278255-128，1282559511-256，256511101023512，5121023112047-1024，10242047查表得Size=2，Amplitude=3，所以DC中间格式为(2)(3)。下面对AC系数编码。经过Zig-Zag扫描后，遇到的第一个非零系数为-2，其中遇到

40、零的个数为1(即RunLength)，根据下面这张AC系数表：表2-5 AC系数表 SizeAmplitude11,123,-2,2,337-4，47415-8，815531-16，1631663-32，32637127-64，641278255-128，1282559511-256，256511101023512，5121023查表得Size=2。所以RunLength=1，Size=2，Amplitude=3，所以AC中间格式为(1，2)(-2)。其余的点类似，可以求得这个88子块熵编码的中间格式为(DC)(2)(3)，(1，2)(-2)，(0，1)(-1)，(0，1)(-1)，(0，1)

41、(-1)，(2，1)(-1)，(EOB)(0，0)第二步，熵编码。对于(2)(3)：2查DC亮度Huffman表得到11，3经过VLI编码为011；对于(1，2)(-2)：(1，2)查AC亮度Huffman表得到11011，-2是2的反码，为01；对于(0，1)(-1)：(0，1)查AC亮度Huffman表得到00，-1是1的反码，为0；.最后，这一88子块亮度信息压缩后的数据流为11011，1101101，000， 000， 000，111000，1010。总共31比特，其压缩比是648/31=16.5，大约每个象素用半个比特。以上是图像压缩编码的整个过程。从上面的例子可以看出，压缩比和图像

42、质量是呈反比的，以下是压缩效率与图像质量之间的大致关系，可以根据需要，选择合适的压缩比。压缩比和图像质量的关系如表2-6所示。表2-6 压缩比与图像质量的关系压缩效率(单位：bits/pixel)图像质量0.250.50中好，可满足某些应用0.500.75好很好，满足多数应用0.751.5极好，满足大多数应用1.52.0与原始图像几乎一样2.2.8 DCT变换在图像压缩中的应用JPEG格式是目前网络上最流行的图像格式，是可以把文件压缩到最小的格式，在 Photoshop软件中以JPEG格式储存时，提供11级压缩级别，以010级表示。其中0级压缩比最高，图像品质最差。即使采用细节几乎无损的10

43、级质量保存时，压缩比也可达 5：1。以BMP格式保存时得到428MB图像文件，在采用JPG格式保存时，其文件仅为178KB，压缩比达到24：1。经过多次比较，采用第8级压缩为存储空间与图像质量兼得的最佳比例。JPEG格式的应用非常广泛，特别是在网络和光盘读物上，都能找到它的身影。目前各类浏览器均支持JPEG这种图像格式，因为JPEG格式的文件尺寸较小，下载速度快13。2.3 JPEG2000压缩算法目前的JPEG静止图像压缩标准，在中高比特率上压缩效果较好，然而在低比特速率的情况下，重构图像存在严重的方块效应，不能很好地适应网络传描图像的需要。尽管目前的JPEG标准有44种操作模式，但是其中的

44、大部分模式是针对不同的应用提出的，不具有通用性，这给交换、传输的压缩图像带来很大的麻烦。为了弥补目前标准的不足，适应21世纪图像压缩的需要，早在1997年ISO/ITU-T组织下的IECJTCl/SC29/WGl小组便开始着手制定新的静止图像压缩标准JPEG2000。与JPEG不同，JPEG2000基于小波变换，采用当前最新的嵌入式编码技术，在获得优于目前JPEG标准压缩效果的同时，生成的码流有较强的功能，可应用于多个领域。2.3.1 小波变换不同于传统的DCT变换，小波变换具有对信号进行多分辨率分析和反映信号局部特征的特点。通过对图像片进行离散小波变换，得到小波系数图像，而分解的级数视具体情况而定。小波系数图像由几种子带系数图像组成。这些子带系数图像描述的是图像片水平和垂直方向的空间频率特性。不同子带的小波系数反映图像片不同空间分辨率的特性。通过多级小波分解，小波系数既能表示图像片中局部区域的高频信息(如图像边缘)，也能表示图像片中的低频信息(如图像背景)。这样，即使在低比特律的情况下，我们也能保持较多的图像细节(如边缘)。另外，下一级分解得到的系数所表示图像

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

9 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于 dct 图像压缩编码算法 matlab 实现终稿

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：基于dct的图像压缩编码算法的matlab实现(终稿).doc
链接地址：https://www.taowenge.com/p-86250716.html