大容量彩色图片压缩设计与实现毕业设计论文.doc
《大容量彩色图片压缩设计与实现毕业设计论文.doc》由会员分享,可在线阅读,更多相关《大容量彩色图片压缩设计与实现毕业设计论文.doc(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、郑州大学毕业设计(论文)题 目:大容量彩色图片压缩设计与实现 指导教师: 职称: 教授 学生姓名: 学号: 20097650228 专 业: 通信工程 院(系): 2010级通信工程一班 完成时间: 2014年 5 月 3 日30 摘要本论文主要介绍了JPEG的编码和解码过程。该程序的编码部分能把一张图象进行JEPG编码,压缩成以二进制形式保存的文件;通过相应的解码程序又可以把图象解压缩出来。在图象传送过程中,我们经常采用JPEG格式对静态图象进行编码。JPEG基本系统是一种有损编码,无法完全恢复出原图象,信息有一定的丢失,称为有损压缩。尽管我们希望能够无损压缩,但是通常有损压缩的压缩比(即原
2、图象占的字节数与压缩后图象占的字节数之比,压缩比越大,说明压缩效率越高)比无损压缩的高。JPEG编码先把图象色彩RBG变成亮度Y和色度Cr、Cb,它利用人的视觉对色度不敏感的特点,减少一部分色度数据,以达到压缩。JPEG采取多种编码方式,包含有行程编码(Run Length Coding)和哈夫曼(Huffman)编码,有很高的压缩比。在编码前,先对数据进行分块,离散余弦变换(DCT)及量化,保留能量大的低频信号,丢弃高频信号以达到压缩。解码时,进行熵解码,反量化,反离散余弦变换(IDCT)。关键字:JPEG;有损压缩;行程编码;哈夫曼编码 AbstractThis paper introdu
3、ces the encoding and decoding of JPEG and the specific realization of program on vc+ platform. The encoding part of this program can encode a picture and save relevant data as binary system. The decoding program can decode the compression data and reconstruct the origin image. While conveying pictur
4、es we often encode still pictures into the style of JPEG. JPEG is of lossy compression which can not recover all the image data, some data are losed. Although we refer to non-lossy compression, however, the compression ratio of lossy compression( the times that data bytes before compression to that
5、after compression )is bigger than that of non-lossy compression. JPEG encoding translate image color from RBG to luminance Y and chroma Cr、Cb. Because people eyes are less sensitive to chroma comparing with luminance , some of chroma data are abandoned to reduce data size.JPEG envolves some kinds of
6、 ways of encoding including Run Length Coding and Huffman Coding, so it has high compression ratio. Before Coding ,we divide data into blocks , DCT and quantify each block. The low-frequency signals that have more energy are maintained and others are rejected . While decoding , data stream are reade
7、d , decoded , inverse-quantified and then IDCT .Keywords: JPEG;lossy compression;Run Length Coding;Huffman Code1. 引言1.1 图像压缩技术信息时代,人们对使用计算机获取信息、处理信息的依赖性越来越高。计算机系统面临的是数值、文字、语言、音乐、图形、动画、静图像、电视视频图像等多种媒体。而大数据量的图像信息会给存储器的存储容量,通信干线信道的带宽,以及计算机的处理速度增加极大的压力。单纯靠增加存储器容量,提高信道带宽以及计算机的处理速度等方法来解决这个问题是不现实的,这时就要考虑压缩
8、。图像数据之所以能被压缩,就是因为数据中存在着冗余。图像数据的冗余主要表现为:图像中相邻像素间的相关性引起的空间冗余;图像序列中不同帧之间存在相关性引起的时间冗余;不同彩色平面或频谱带的相关性引起的频谱冗余。数据压缩的目的就是通过去除这些数据冗余来减少表示数据所需的比特数。由于图像数据量的庞大,在存储、传输、处理时非常困难,因此图像数据的压缩就显得非常重要。图像压缩是数据压缩技术在数字图像上的应用,它的目的是减少图像数据中的冗余信息从而用更加高效的格式存储和传输数据。1.2 图像压缩方法研究现状 图像压缩已研究了几十年, 提出了诸如DPCM、DCT 、VQ 等压缩方法, 并已出台了基于DCT
9、等技术的国际压缩标准, 如JPEG、MPEG、H. 261 等。人们逐渐发现了这些方法的许多缺点: 比如高压缩比时图像出现严重的方块效应、人眼视觉系统的特性不易被引入到压缩算法中等等。目前, 许多人正在致力于第二代图像编码技术的研究。第一代图像编码技术( 以JPEG为代表) 是指以信息论和数字信号处理技术为理论基础, 旨在去除图像数据中的线性相关性的一类编码技术。这类技术去除客观和视觉的冗余信息的能力已接近极限, 其压缩比不高( 20: 1 左右) 。而第二代图像编码技术是指不局限于SHANNON 信息论的框架, 要求充分利用人的视觉生理心理特性和图像信源的各种特性, 能获得高压缩比的一类编码
10、技术。这其中以小波变换编码、分形编码和模型基编码最具有代表性, 也很有可能成为新一代国际图像压缩标准的核心理论。2. 压缩方法简介2.1 压缩方法的分类 研究图像压缩方法实际是研究图像压缩的算法( 或者称为“编码), 随着研究的不断深入, 出现了多种压缩( “编码”)方法。显然, 各种编码方法的并存是十分必要的。图像压缩编码可以有多种分类方法:1、以恢复的图像与原图像关系分: 无失真编码和限失真编码。2、以使用方法的原理分: 基于图像统计特性、基于人眼视觉特性和基于图像特性提取编码。3、以图像的光学特性分: 静止图像、慢速图像和实时图像编码。4、以采用的基本理论不同分: 变换法和分形法编码。2
11、.2 常见图像的压缩方法2.2.1 RLE(Run Length Encoding) 压缩算法RLE 通常称为行程编码。这种压缩法使用于PCX,TIFF ,BMP 等图像格式中,其压缩原理很简单。将一行中颜色值相同的相邻像素用一个记数值和该颜色值来代替。例如, abbbccccddd 经行程压缩处理后可表示为1a3b4c3d。当图像中存在很多块颜色相同的大面积区域,则RLE 编码产生的压缩率是很高的。但如果图像中很少有两个相邻的像素的灰度值相同时,则RLE 编码非但不能压缩,还会造成处理后的图像数据量大于处理前的情况。2.2.2哈夫曼(Huffman) 编码哈夫曼压缩方法使用于TIFF ,JP
12、EG 等图像格式中。该编码是Huffman 为压缩文本文件而建立的,其压缩原理是先统计需要编码的字符的出现概率,然后将短的码赋予出现频率高的字符,而将长的码赋予出现频率低的字符。因为哈夫曼编码较为简单有效,所以得到了广泛的应用。但是产生哈夫曼编码要对原始数据扫描两遍:第一遍扫描要精确地统计出原始数据中每个值出现的频率;第二遍扫描是建立哈夫曼树并进行编码。由于需要建立二叉树并遍历二叉树生成编码,因此数据压缩和还原速度都较慢。另外哈夫曼编码对于位的增减都反应敏感。由于哈夫曼编码时所有位都集中在一起,而不考虑字节分界,译码程序判断码结束的惟一方法是达到二叉树的一个分支,因此,如果增加或减少位,译码程
13、序将无法正确译出后面的数据。2.2.3 LZW压缩算法 LZW用于GIF ,TIFF 等图像文件中,属于字典压缩法。LZW压缩算法不需要在编码之前构造码表,而是在压缩过程中逐步建立字典的。其基本思想是将每一个字节的值都要与下一个字节的值配成一个字符对,并为每一个字符设置一个代码。当同样的一个字符对再度出现时就用代号代替这一字符对,然后再用这个代号与下一个字符配对。在配对过程中,必须建立三个表格,分别为:字首表、字符表和代号表。所有字符对和代号都分别存入这三个表格中。LZW不仅可以与RLE 压缩算法一样对连续出现的相同字符进行压缩,而且可以对经常出现的由不同字符组成的字符串进行压缩。因此在压缩处
14、理不同值数据串方面,LZW压缩方法优于RLE 压缩算法。但是如果原始图像数据值中带有随机变化的“噪音图像”,则很难利用LZW算法来压缩。2.2.4 Discrete Co sine Transform (DCT ,离散余弦变换) DCT属于变换编码,可用于图像处理的二维离散余弦变换。将预先已分成小块的原始图像进行DCT 变换后,高频部分包含了锐利的边缘信息,而低频部分包含了图像的主要信息,因此低频比高频更重要,可以通过量化步骤有选择性地消除或较粗糙地量化高频部分。需要注意的是,压缩不是在变换步骤取得的,而是在量化时取得的,并且是有损压缩,不可恢复。 与DFT(离散傅里叶变换) 和WHT(沃尔什
15、2哈德玛变换) 相比,DCT 具有更强的信息集中能力。虽然KL 变换是所有变换中信息集中能力最好的变换,但是如果对每个子图都运用KL 变换,所需的计算量很大,所以KL 变换不实用。近年来,因为DCT 的信息集中能力和计算复杂性综合得比较好而得到了较多的应用。在JPEG中就使用了DCT。3.JPEG图像压缩算法随着多媒体技术的快速发展,静止图像的应用越来越广泛。它的应用主要集中在图像的存储和图像的传输两方面,从具体应用中我们可以发现静止图像占用了越来越多的资源。在这样的背景条件下,静止图像的压缩成为了一个研究的热点。目前静止图像的压缩算法以JPEG(JointPhotographicExpert
16、sGroup)和JPEG2000为主。JPEG是第一个被广泛接受的单色和彩色静止图像压缩标准,它的名字源于“Joint Photographic Experts Group(联合图像专家组)”,它是由ISO/和CCITT协同工作的机构,这个机构的工作成果是ISO的国际标准ISO/IEC10918-1(连续色调静止图像的数字压缩和编码,digital compression and coding of continuous tone still images)和ITU-T的建议T.81。JPEG标准草案于1991年公布,1992年正式批准为国际标准,以后这个工作组的进一步增强和扩展形成了ISO
17、10918-3和ITU-T建议T.81。JPEG是一种采用预测编码(DPCM)、离散余弦变换(DCT)以及熵编码,以去除冗余的图像和彩色数据的有损压缩格式,能够将图像压缩在很小的储存空间,图像中重复或不重要的资料会被丢失,因此容易造成图像数据的损伤。尤其是使用过高的压缩比例,将使最终解压缩后恢复的图像质量明显降低,如果追求高品质图像,不宜采用过高压缩比例。但是JPEG压缩技术十分先进,它用有损压缩方式去除冗余的图像数据,在获得极高的压缩率的同时能展现十分丰富生动的图像,也即可以用最少的磁盘空间得到较好的图像品质。而且 JPEG是一种很灵活的格式,具有调节图像质量的功能,允许用不同的压缩比例对文
18、件进行压缩,支持多种压缩级别,压缩比率通常在10:1到40:1之间,压缩比越大,品质就越低;相反地,压缩比越小,品质就越好。比如可以把137Mb的BMP位图文件压缩至203KB。当然也可以在图像质量和文件尺寸之间找到平衡点。JPEG格式压缩的主要是高频信息,对色彩的信息保留较好,适合应用于互联网,可减少图像的传输时间,可以支持24bit真彩色,也普遍应用于需要连续色调的图像。 JPEG的核心算法是DCT变换编码,其压缩性能基本反映了20世纪80年代末图像压缩的技术水平。但自从JPEG制定后的近10年,许多更有效的图像压缩技术已经得到发展,如小波变换方法、分形方法、区域划分方法等。其中,发展最成
19、熟和性能及通用性最好的静止图像压缩方法是小波变换方法。正因如此,制定了第二代静止图像压缩标准,即JPEG2000,它的核心技术正是小波变换编码。其核心编解码器采用小波变换、算术编码及嵌入式分层组织,较以往的静止图像压缩标准复杂,它在同一个码流中实现了无损和有损压缩、分辨率和信噪比的累进性以及随机访问等优良特性。JPEG2000作为JPEG的升级版,其压缩率比JPEG高约30左右,同时支持有损和无损压缩。JPEG2000格式有一个极其重要的特征在于它能实现渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示。此外,JPEG2000还支持所谓的感兴趣区域 特性,
20、可以任意指定影像上感兴趣区域的压缩质量,还可以选择指定的部分先解压缩。 3.1 研究内容JPEG压缩格式是目前图像处理领域里面用得最广泛的一种图像压缩方式,本毕业设计将进行就JPEG标准对图像进行编、解码的研究。主要内容包括:1)要求能读出jpg文件,并显示在界面上其中,JPEG的压缩实现主要分成四个步骤:1)颜色模式转换及采样;2)DCT变换(离散余弦变换); 3)量化; 4)编码(这里采用哈夫曼编码)。3.2 系统原理3.2.1 色彩模型 JPEG 的图片使用的是 YCrCb 颜色模型,而不是计算机上最常用的 RGB。 关于色彩模型, 这里不多阐述。 只是说明, YCrCb 模型更适合图形
21、压缩。 因为人眼对图片上的亮度 Y 的变化远比色度 C 的变化敏感。 我们完全可以每个点保存一个 8bit 的亮度值, 每 2x2 个点保存一个 Cr Cb 值, 而图象在肉眼中的感觉不会起太大的变化。 所以, 原来用 RGB 模型, 4 个点需要 4x3=12 字节。 而现在仅需要 4+2=6 字节; 平均每个点占 12bit。 当然 JPEG 格式里允许每个点的 C 值都记录下来; 不过 MPEG 里都是按 12bit 一个点来存放的, 我们简写为 YUV12。R G B - Y Cb Cr 转换-(R,G,B 都是 8bit unsigned) | Y | = | 0.299 0.587
22、 0.114 | | R | | 0 | | Cb | = |- 0.1687 - 0.3313 0.5 | * | G | + |128| | Cr | = | 0.5 - 0.4187 - 0.0813| | B | |128|Y = 0.299*R + 0.587*G + 0.114*B (亮度)Cb = - 0.1687*R 0.3313*G + 0.5*B +128Cr = 0.5*R 0.4187*G 0.0813*B +128Y,Cb,Cr - R,G,B 转换R = Y + 1.402 *(Cr-128)G = Y 0.34414*(Cb-128) 0.71414*(Cr-12
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大容量彩色图片压缩设计与实现 毕业设计论文 容量 彩色图片 压缩 设计 实现 毕业设计 论文
限制150内