多媒体技术——第5章多媒体数据压缩与编码之二.ppt
《多媒体技术——第5章多媒体数据压缩与编码之二.ppt》由会员分享,可在线阅读,更多相关《多媒体技术——第5章多媒体数据压缩与编码之二.ppt(63页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 1、概述、概述 国际标准化组织国际标准化组织(ISO)和国际电报电话咨询和国际电报电话咨询委员会联合委员会联合于于19871987年成立年成立了一个专家组。了一个专家组。(Joint Photograghic Experts Group, 简称简称JPEG) JPEG标准为国际通用标准,是一个适用范围标准为国际通用标准,是一个适用范围很广的静态图像数据压缩标准,即可用于灰度图像很广的静态图像数据压缩标准,即可用于灰度图像又可用于彩色图像。又可用于彩色图像。累累进进模模式式分分层层模模式式以预测技术为基础以预测技术为基础的无损压缩算法的无损压缩算法以离散余弦(以离散余弦(DCT)为)为基础的
2、有损压缩算法基础的有损压缩算法JPEGJPEG算法算法JPEG专家组开发了两种基本的压缩算法专家组开发了两种基本的压缩算法顺顺序序模模式式(1)正向离散余弦变换(FDCT) 1)空域表示(块准备) 每幅视频图像都可以表示成MN个矩阵, 这种表示称为空域表示。图像 子图像(88像素)3、基于DCT的顺序编码模式8 88 8块块FDCT量化量化熵编码熵编码压缩图像压缩图像数据数据表格规范表格规范表格规范表格规范DCT基压缩编码步骤基压缩编码步骤DCT Based Encoder2)空域到频域的转换 采用某种正交变换把空域表示的图像变换到 另一个正交空间(变换域)。 DCTf(I , j)F(v ,
3、 v)离散余弦变换离散余弦变换空域到频域变换目的是什么? 二维离散余弦变换示意图二维离散余弦变换示意图用于变换的方法有很多,如:用于变换的方法有很多,如:最佳变换(最佳变换(Karhunen-LoeveKarhunen-Loeve,K-LK-L) 离散傅里叶变换(离散傅里叶变换(DFTDFT) 离散余弦变换(离散余弦变换(DCTDCT) 沃尔什哈达玛(沃尔什哈达玛(Walsh-HadamardWalsh-Hadamard)变换)变换 等等等等16) 12(cos16) 12(cos),()()(41),(7070vyuxyxfvcucvuFyx二维二维8 88 8子图像子图像正向正向离散余弦变
4、换(离散余弦变换(FDCTFDCT)是:)是: 16) 12(cos16) 12(cos),()()(41),(7070vyuxvuFvcucyxfyx 逆向逆向离散余弦变换(离散余弦变换(IDCTIDCT)是:)是: 空域经过变换编码后形成的域叫变换域。DC 直流系数其余63个为交流系数ACDCT基函数基函数(2 2)量化)量化 量化是从模拟信号到数字信号的映射量化是从模拟信号到数字信号的映射 。 量化的目的就是在保证图像质量达到一定的保真度的量化的目的就是在保证图像质量达到一定的保真度的 前提下,丢掉一些次要的信息。前提下,丢掉一些次要的信息。 人眼对人眼对低频低频成分较敏感,量化步长取小
5、些,成分较敏感,量化步长取小些, 以保留更多的低频成分。以保留更多的低频成分。 人眼对人眼对高频高频成分不太敏感,量化步长可以取大些。成分不太敏感,量化步长可以取大些。 可忽略一些高频成分,获得较大的压缩比可忽略一些高频成分,获得较大的压缩比 2568u 人眼对人眼对色彩色彩的变化不如对的变化不如对亮度亮度的变化敏感的变化敏感 。u 在编码前一般先将图像从在编码前一般先将图像从RGBRGB空间转换到空间转换到YUVYUV空间空间 。u 再把再把亮度分量亮度分量和和色度分量色度分量各自分成各自分成8 88 8的子块分别处理。的子块分别处理。 u采样时,对采样时,对亮度亮度Y Y分量的采样频率可以
6、高一些,分量的采样频率可以高一些, 色度色度分量分量U U、V V可低一些。可低一些。 常用的方案有常用的方案有Y:U:V=4:2:2Y:U:V=4:2:2、4:2:04:2:0和和Y:U:V=4:1:1Y:U:V=4:1:1等。等。国际无线电咨询委员会(国际无线电咨询委员会(CCIRCCIR)提出了)提出了CCIR601CCIR601标准标准 ( ( 采样比为采样比为4:2:2 ) 4:2:2 ) :BGRVUY0813. 04186. 0500. 0500. 03316. 0169. 0114. 0587. 0299. 01611101624405161121214192658605514
7、131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399 对对亮度亮度和和色度色度分别进行量化。这两个量化表是分别进行量化。这两个量化表是在实验的基础上,结合人眼的视觉特性而获得的在实验的基础上,结合人眼的视觉特性而获得的 。 亮度亮度的量化步长取小些以保证亮度受影响小些的量化步长取小些以保证亮度受影响小些 亮度量化表亮度量化表* 考虑到人眼对考虑到人眼对色度(高频分量)色度(高频分量)的图像的敏感性,左的图像的敏感性,左上角用上角用“1”1
8、”个单位的量度值,这样个单位的量度值,这样1717、1818就可表示出来。就可表示出来。右下角采用右下角采用“5”5”个单位的量度值那么个单位的量度值那么9696,9797,104104都都可以表示成可以表示成9999。17182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999色度量化表色度量化表 源图像样本源图像样本FDCT系数系数量化表量化表规格化量化系数规格化量化系数规格化量化系数规格化量化系
9、数量化表量化表逆量化后的系数逆量化后的系数重构图像样本重构图像样本源图像样本源图像样本* 设计一个设计一个8*8的矩阵的矩阵B,其中每个数都为,其中每个数都为128,将,将“源图像样本源图像样本”矩阵矩阵A与设计的矩阵与设计的矩阵B相减得到矩阵相减得到矩阵C。即即C=A-B,再将,再将C转换为下一页的转换为下一页的“FDCT系数系数”。FDCT系数系数*通过通过FDCT计算得到上表的数值计算得到上表的数值亮度量化表亮度量化表量化阶量化阶1:8规格化量化系数规格化量化系数235.6/16=15-12.1/10=-1逆量化系数逆量化系数15*16=240-1*10=-10重构图像样本重构图像样本源
10、图像样本源图像样本逆向离散余弦变换逆向离散余弦变换IDCT(3)“Z”字形编码字形编码 量化量化DCT系数的编排系数的编排 量化量化DCT系数的序号系数的序号(4)DC直流系数的差分编码 JPEG对量化后的DC系数采用DPCM 编码, 即: j = DCj DCj1 DC系数差分编码系数差分编码 DCj DCj1对差分对差分DC系数用两个符号进行编码系数用两个符号进行编码编码所用位数(尺寸)编码所用位数(尺寸)符号符号1 (表示信息长度表示信息长度)符号符号2 (表示信息幅度表示信息幅度)DC系数的幅度(值)系数的幅度(值)例如,例如,符号符号1为为10 符号符号2为为011 则编码符号为则编
11、码符号为 10011(5)AC交流系数的行程长度编码 AC系数行程编码码字 下一个非0实际值(它为可变长度)符号2两个非0值间连续0的个数 表示下一个非0值需要的bit数符号1例:一个例:一个8*8亮度图像的编码过程亮度图像的编码过程150-100000-2-1000000-1-10000000000000000000000000000000000000000000000假设前一个子块假设前一个子块DC系数值为系数值为12,则,则j = DCj DCj1 = 15 -12 = 3编码(编码(j =3)所需要的位数为)所需要的位数为2。其幅度值为其幅度值为3,故,故DC系数的中间格式为系数的中间
12、格式为 (2) (3)对于对于(2) (3)查查DC亮度的亮度的Huffman表表计算编码时,先表示为中间格式,再查表确定编码计算编码时,先表示为中间格式,再查表确定编码图像分量为图像分量为8位时位时DC系数差值的典型系数差值的典型Huffman表表尺寸分类亮度码字亮度码字1-1,10102-3.-2,2.30113-7.-4,4.71004-15.-8,8.1510156789-511.-256,2565111111111010-1023.-512,51210231111111102的的2进制数为进制数为103经过可变长度编码(经过可变长度编码(VLI)为)为011故故DC系数的编码为系数的
13、编码为10011对对AC系数编码:系数编码:150-100000-2-1000000-1-10000000000000000000000000000000000000000000000l 符号符号1为(为(1,2) (遇到的第(遇到的第1个非零系数为个非零系数为-2,它前面的零系数,它前面的零系数 的个数为的个数为1,编码,编码-2需要需要2位)位)l 符号符号2为(为(-2) 遇到的第遇到的第2个非零系数为个非零系数为-1,它前面的零系数的,它前面的零系数的个数为个数为0,编码,编码0需要需要1位,所以位,所以符号符号1为(为(0,1)可以求得这个可以求得这个8*8象素子块熵编码的象素子块熵
14、编码的中间格式中间格式:(2,3),(,(1,2)()(-2),(),(0,1)()(-1),),DC系数系数AC系数系数查亮度或色度查亮度或色度Huffman表得:(亮度表得:(亮度AC系数表见下页)系数表见下页)10011,1101101,000,注意:注意:-2的反码为的反码为01符号符号2为(为(-1)亮度亮度AC系数表系数表行程尺寸码长码字0/0(EOB,块结束代码)410100/12000/22010/331000/91611111111100000110/A1611111111100000111/1411001/25110111/37111100111/9161111111110
15、0001111/A161111111110001000,2/A,重复直到编完63个系数(6)熵编码)熵编码 对对DC系数系数和和AC系数再系数再使用哈夫曼作基于统计使用哈夫曼作基于统计特性的编码。特性的编码。哈夫曼编码可以使用简单的查表方法进行编码。哈夫曼编码可以使用简单的查表方法进行编码。l 为进一步达到压缩压缩目的为进一步达到压缩压缩目的(1 1)首先将图像分为)首先将图像分为 8 8* *8 8 的若干子图像;的若干子图像;(2 2)对)对 8 8* *8 8 的子图像进行的子图像进行 FDCT FDCT 变换;变换;(3 3)对)对 FDCT FDCT 的系数进行量化;的系数进行量化;
16、(4 4)Z Z 字形编码;字形编码;(5 5)DC DC 系数的差分编码与系数的差分编码与 AC AC 系数的游程长度编码;系数的游程长度编码;(6 6)熵编码(如哈夫曼编码或算术编码)。)熵编码(如哈夫曼编码或算术编码)。源图像数据源图像数据DCT量化器量化器熵编码器熵编码器压缩后的图像数据压缩后的图像数据量化步长表量化步长表编码表编码表块准备块准备JPEG编码器(7 7)JPEGJPEG图像压缩方法总结图像压缩方法总结熵解码器IDCT量化表解码器逆量化器编码表88块压缩图象数据压缩图象数据恢复的图象数据恢复的图象数据 (8)图像的重构过程)图像的重构过程(9 9)JPEGJPEG压缩效果
17、评价压缩效果评价压缩效果压缩效果( (比特比特/ /象素象素) ) 质质 量量 0.250.50中好 0.500.75好很好0.751.5 极 好1.22.0与原始图象分不出来 最后,把各种标记代码和编码后的图像数据按照一定的格式组成JPEG位流(JPEG bitstream)。比较不同压缩比的图像的清晰度比较不同压缩比的图像的清晰度应用软件应用软件PHOTOSHOP如上例中可以计算出数据流为如上例中可以计算出数据流为31bit,则其压缩比为:,则其压缩比为: 64 8 / 31=16.5* *4 4、基于、基于DCTDCT的累进编码模式的累进编码模式 主要方法:主要方法: 第一次扫描只进行粗
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 多媒体 数据压缩 编码
限制150内