第3章多媒体数据压缩编码技术课件.ppt
多多 媒媒 体体 技技 术术电子教学课件电子教学课件第第3 3章章2/5/20231陈文华陈文华第第3章章 多媒体数据多媒体数据压缩编码技术压缩编码技术n3.1 3.1 多媒体数据压缩编码的重要性多媒体数据压缩编码的重要性n3.2 3.2 预测编码技术预测编码技术n3.3 3.3 哈夫曼编码技术哈夫曼编码技术n3.4 3.4 行程(游程)行程(游程)RLERLE编码技术编码技术n3.5 3.5 静态图像压缩编码国际标准静态图像压缩编码国际标准JPEGJPEGn3.6 3.6 运动图像压缩编码国际标准运动图像压缩编码国际标准MPEGMPEG2/5/20232陈文华陈文华第第3章章 多媒体数据多媒体数据压缩编码技术压缩编码技术n 3.1 3.1 多媒体数据压缩编码的重要性多媒体数据压缩编码的重要性u 3.1.1 3.1.1 数据冗余类型数据冗余类型u 3.1.2 3.1.2 数数 据据 压压 缩缩 技技 术术 的的 分分 类类2/5/20233陈文华陈文华第第3章章 多媒体数据多媒体数据压缩编码技术压缩编码技术n 3.1 3.1 媒体数据压缩编码的重要性媒体数据压缩编码的重要性u 信息时代的重要特征是信息的数字化信息时代的重要特征是信息的数字化。u 早早期期的的计计算算机机系系统统采采用用模模拟拟方方式式表表示示信信息息,但存在着明显的缺点:但存在着明显的缺点:u 经经常常会会产产生生噪噪音音和和信信号号丢丢失失,并并且且在在复复制过程中逐步积累噪音和误差制过程中逐步积累噪音和误差。u 模拟信号不适合数字计算机加工处理模拟信号不适合数字计算机加工处理。2/5/20234陈文华陈文华3.1 媒体数据压缩媒体数据压缩编码的重要性编码的重要性n 数数字字化化后后未未经经压压缩缩的的视视频频和和音音频频等等媒媒体体信息的数据量是非常大的信息的数据量是非常大的 1.1.图图像像数数据据量量的的大大小小可可用用下下面面的的公公式式来来计算:计算:图图像像数数据据量量图图像像的的总总像像素素色色彩彩深深度度8 8 (单单 位位 为为 ByteByte,简简 写写 为为 B B)例例如如,一一幅幅640480640480、2424位位(bitbit)真真彩彩色色 的的 图图 像像,其其 文文 件件 大大 小小 为为:64048024 8 64048024 8 921.6921.6KBKB2/5/20235陈文华陈文华3.1 媒体数据压缩媒体数据压缩编码的重要性编码的重要性n 2.2.双双通通道道立立体体声声激激光光唱唱盘盘,采采用用脉脉冲冲码码调调制制采采样样,采采样样频频率率为为44.144.1KHzKHz,采采样样精精度度1616位位,其其一一秒秒钟钟时时间间内内的的采采样样数数据据量为:量为:44.11000162844.110001628 176.4 176.4 KBKB 一一个个650650MBMB的的CDROMCDROM,大大约约可可存存1 1小小时时的的音乐。音乐。2/5/20236陈文华陈文华 3.1 媒体数据压缩媒体数据压缩编码的重要性编码的重要性n 3.3.对对动动态态图图形形和和视视频频图图像像。例例如如对对于于彩彩色色电电视视信信号号,设设代代表表光光强强Y Y的的带带宽宽为为4.24.2MHzMHz、色色彩彩I I为为1.51.5MHzMHz和和色色饱饱和和度度Q Q为为0.50.5MHzMHz,采采样样频频率率2 2倍倍原原始始信信号号频频率率,各各分分量量均均被被数数字字量量化化为为8 8位位,从从而而1 1秒秒钟钟电视信号的数据量为:电视信号的数据量为:(4.24.21.51.50.50.5)2810000008281000000812.4 12.4 MBMB2/5/20237陈文华陈文华3.1 媒体数据压缩媒体数据压缩编码的重要性编码的重要性u 容容量量为为650650MBMB的的CDROMCDROM仅仅能能存存1 1分分钟钟的的原原始始电电视视数数据据。若若为为高高清清晰晰度度电电视视(HDTVHDTV)其其1 1秒秒钟钟数数据据量量约约为为150150MBMB(1.21.2GbpsGbps88),一张一张CDROMCDROM还存不下还存不下5 5秒钟的秒钟的HDTVHDTV图像。图像。n 巨巨大大数数字字化化信信息息的的数数据据量量对对计计算算机机存存储储资资源源和和网网络络带带宽宽有有很很高高的的要要求求,解解决决的的办办法法就就是是要要对对视视、音音频频的的数数据据进进行行大大量量的的压压缩缩。播播放放时时,传传输输少少量量被被压压缩缩的的数数据据,接接收收后后再再对对数据进行解压缩并复原数据进行解压缩并复原。2/5/20238陈文华陈文华3.1.1 数据冗余类型数据冗余类型u 1.1.空间冗余空间冗余u 基基于于离离散散像像素素采采样样来来表表示示物物体体颜颜色色的的方方式式通通常常没没有有利利用用景景物物表表面面颜颜色色的的这这种种空空间间相相关关性性,这这些些相相关关性性的的光光成成像像结结构构在在数数字字化化图图像像中中就就表表现现为为空空间间冗冗余余。我我们们可可以以通通过过改改变变物物体体表表面面颜颜色色的的像像素素存存储储方方式式来来利利用空间相关性,达到减少数据量的目的。用空间相关性,达到减少数据量的目的。2/5/20239陈文华陈文华3.1.1 数据冗余类型数据冗余类型u 2.2.时间冗余时间冗余u 时时间间冗冗余余反反映映在在图图像像序序列列中中的的相相邻邻帧帧图图像像(电电视视图图像像、动动画画)之之间间有有较较大大的的相相关关性性,一一组组连连续续画画面面中中的的相相邻邻帧帧往往往往包包含含相相同同的的背背景景和和移移动动物物体体,只只不不过过移移动动物物体体所所在在的的空空间间位位置置略略有有不不同同,把把一一帧帧图图像像中中的的某某物物体体或或场场景景可可以以由由其其他他帧帧图图像像中中的的物物体体或或场场景景进进行行处处理理后后重重构构出出来来,可可以以大大大大减减少时间冗余。少时间冗余。2/5/202310陈文华陈文华3.1.1 数据冗余类型数据冗余类型u 3.3.结构冗余结构冗余u 有有些些图图像像具具有有较较强强的的相相似似性性的的纹纹理理结结构构,例例如如布布纹纹图图像像和和草草席席图图像像,方方格格状状的的地地板板图案等,我们称此为结构冗余。图案等,我们称此为结构冗余。u 4.4.知识冗余知识冗余u 有有许许多多图图像像的的理理解解与与某某些些基基础础知知识识有有相相当当大大的的相相关关性性,这这类类规规律律性性的的结结构构可可由由先先验验知知识识和和背背景景知知识识得得到到,我我们们称称此此类类冗冗余余为为知知识识冗冗余余。根根据据已已有有的的知知识识,我我们们可可以以构造图像物体构造图像物体的的基本模型,并创建图像库。基本模型,并创建图像库。2/5/202311陈文华陈文华3.1.1 数据冗余类型数据冗余类型u 5.5.视觉冗余视觉冗余u 人人的的接接收收系系统统如如视视觉觉系系统统和和听听觉觉系系统统是是有有一一定定限限度度的的,人人眼眼并并不不能能察察觉觉图图像像场场的的所所有有变变化化,如如人人类类视视觉觉系系统统分分辨辨能能力力约约为为64灰灰度度等等级级,而而一一般般图图像像量量化化采采用用256灰灰度等级,这类冗余我们称为视觉冗余。度等级,这类冗余我们称为视觉冗余。u 6.6.听觉冗余听觉冗余u 人人耳耳的的敏敏感感性性不不能能察察觉觉所所有有频频率率的的变变化化,存在听觉冗余。存在听觉冗余。2/5/202312陈文华陈文华3.1.2 数据压缩技术数据压缩技术 的分类的分类n 根根据据多多媒媒体体数数据据冗冗余余类类型型的的不不同同,解解码码后后数数据据与与原原始始数数据据是是否否完完全全一一致致、质质量量有有无无损损失失来来进进行行分分类类,压压缩缩方方法法可可被被分分为为有有失失真真编码和无失真编码两大类。编码和无失真编码两大类。u 无无失失真真压压缩缩法法也也称称无无损损压压缩缩,无无失失真真压压缩缩的的特特点点是是压压缩缩比比较较小小,大大约约在在22l l至至55l l之之间间,主主要要用用于于文文本本数数据据、程程序序代代码码和和某某些些要要求求严严格格不不丢丢失失信信息息的的环环境境中中,常常用用的的无无失失真真压缩编码有如哈夫曼编码等。压缩编码有如哈夫曼编码等。2/5/202313陈文华陈文华3.1.2 数据压缩技术数据压缩技术 的分类的分类u 有有失失真真压压缩缩法法也也称称有有损损压压缩缩,有有失失真真压压缩缩法法的的冗冗余余压压缩缩取取决决于于初初始始信信号号的的类类型型、前前后后的的相相关关性性、信信号号的的语语义义内内容容等等,压压缩缩比比可可以以从从几几到到几几百百倍倍,常常用用的的有有失失真真压压缩缩编编码码技技术术有有预预测测编编码码、变变换换编编码码、模模型型编编码码、混混合合编编码码方方法法等等。主主要要用用于于压缩图像、声音等信息。压缩图像、声音等信息。2/5/202314陈文华陈文华n 常常用用的的图图像像和和视视频频压压缩缩方方法法如如图图3-13-1所所示示:图像和视频压缩方法图像和视频压缩方法哈夫曼编码哈夫曼编码行程编码行程编码算术编码算术编码LZW编码编码DCT编码编码小波变换小波变换子带编码子带编码无失真压缩无失真压缩有失真压缩有失真压缩预测编码预测编码变换编码变换编码模型编码模型编码运动补偿运动补偿混合编码混合编码分形编码分形编码JPEGMPEGH.2613.1.2 数据压缩技术数据压缩技术 的分类的分类2/5/202315陈文华陈文华3.2 预测编码技术预测编码技术n 根根据据离离散散信信号号之之间间存存在在着着一一定定的的相相关关性性的的特特点点,利利用用图图像像像像素素的的以以往往样样本本值值(前前面面一一个个或或几几个个点点的的数数据据)对对于于新新样样本本值值(下下一一个个点点的的数数据据)进进行行预预测测,然然后后将将样样本本的的实实际际值值与与其其预预测测值值相相减减得得到到一一个个误误差差值值(较较小小),这这样样可可以以用用比比较较少少的的数数码码进进行行编编码码得得到到较较大大的的数数据据压压缩缩结结果果,达达到到压压缩缩数数据据的的目目的的,因因此预测编码技术是一种有失真编码方法。此预测编码技术是一种有失真编码方法。2/5/202316陈文华陈文华n 最常用的是差值脉冲编码调制法,简称为最常用的是差值脉冲编码调制法,简称为DPCMDPCM。图图3-23-2所示的是所示的是DPCMDPCM编、解码系统原理图编、解码系统原理图传传输输信信道道输入输入预测器预测器量化器量化器编码器编码器解码器解码器预测器预测器XnenXnen输出输出XnXnenXn3.2 预测编码技术预测编码技术2/5/202317陈文华陈文华3.2 预测编码技术预测编码技术u 设设x xn n为为t tn n时时刻刻的的亮亮度度取取样样值值,预预测测器器根根据据t tn n时时刻刻之之前前的的样样本本值值x x1 1,x x2 2,x xn n-1-1对对x xn n作作预预测测,得到预测值得到预测值x xn n,x xn n 与与x xn n之间的误差为:之间的误差为:e en nx xn nx xn n (3 31 1)u 接接收收端端恢恢复复的的输输出出信信号号为为xnxn是是xnxn的的近近似似值值,两者的误差是:两者的误差是:x xn nx xn nx xn nx xn n十十e en n(x xn n十十e enn)e en ne en n (3 32 2)2/5/202318陈文华陈文华3.2 预测编码技术预测编码技术n 在在预预测测编编码码中中,量量化化器器的的量量化化对对像像是是预预测测误误差差 e en ne enn分分布布在在零零值值附附近近,正正负负两两边边的的分分布布一一般般是是对对称称的的,图图3-3 3-3 预预测测误误差差分分布布特特性示意图。性示意图。概率概率预测误差预测误差图图3-3 3-3 预测误差分布示意图预测误差分布示意图2/5/202319陈文华陈文华量化输出输入电平非均匀量化间隔非均匀量化器非均匀量化器2/5/202320陈文华陈文华3.2 预测编码技术预测编码技术n 非非均均匀匀量量化化器器对对于于具具有有相相同同的的输输入入信信号号动动态态范范围围、相相同同的的图图像像主主观观评评价价质质量量下下,输出的比特数较低。输出的比特数较低。n 预测编码系统的缺点:预测编码系统的缺点:u 预预测测误误差差的的量量化化是是造造成成图图像像质质量量下下降降的的主主要要原原因因,比比如如在在图图像像边边界界斜斜率率过过载载,表表现现为为图图像像轮轮廓廓变变模模糊糊;因因最最小小量量化化电电平平不不够够小小(量量化化位位数数不不够够高高),使使图图像像灰度缓变区产生颗粒噪声。灰度缓变区产生颗粒噪声。2/5/202321陈文华陈文华3.3 哈夫曼编码技术哈夫曼编码技术n 假假设设一一个个信信息息源源能能产产生生的的事事件件序序列列中中的的事事件件取取自自一一个个有有限限事事件件集集,事事件件集集S S中中的的任任一一事事件件SiSi发发生生的的概概率率为为P(P(SiSi)都都相相等等,即即P(P(SiSi)1/S1/S,则则 其其 所所 能能 携携 带带 的的 信信 息息 量量 I(I(SiSi)定定 义义 为为:I(I(SiSi)loglog2 2 1/S 1/S loglog2 2 P(P(SiSi)(3 33 3)这这里里P(P(SiSi)是是信信息息源源产产生生的的事事件件为为SiSi的的概概率率。等等式式右右边边加加一一负负号号的的目目的的是是保保证证I I(SiSi)的的数数值值不不为为负负值值。定定义义中中用用2 2为为底底的的对对数数,并并规规定定信信息量息量I I(SiSi)的计量单位为比特(的计量单位为比特(bitbit)。)。2/5/202322陈文华陈文华3.3 哈夫曼编码技术哈夫曼编码技术n 如如果果一一个个信信息息源源发发出出的的是是由由8 8个个二二值值数数(0 0,1 1)表表示示的的组组合合信信息息。如如果果这这种种组组合合是是等等概概率率的的,即即 P(P(SiSi)1/2561/256,(i i 0 0,1 1,2 2,255255),则则此此8 8个个数数字字提提供供的的信信息息量量按按(3 33 3)式计算:)式计算:I(I(SiSi)loglog2 2 1/256 1/256 loglog2 2 1 1 十十 loglog2 2256256 8 8(bitbit)(3 34 4)u 组合的总数是组合的总数是256256种可能,每一种可能的种可能,每一种可能的组合为组合为8 8比特。如果上述比特。如果上述256256种可能组合中是种可能组合中是非等概率的,可以证明信息量非等概率的,可以证明信息量I I(SiSi)将小于将小于8 8(bitbit)的。的。2/5/202323陈文华陈文华3.3 哈夫曼编码技术哈夫曼编码技术n 离离散散无无记记忆忆(不不受受其其前前面面事事件件出出现现与与否否的的影影响响)信信息息源源中中一一个个事事件件所所携携带带的的平平均均信信息息量量H H(S S)定定义义为为:(35)平平均均信信息息量量又又称称为为信信息息熵熵,熵熵实实际际上上是是信信源源事事件件集集中中各各事事件件所所携携带带的的信信息息量量的的数数学学期期望望。熵熵值值的的单单位位是是比比特特。数数据据压压缩缩的的另另一一个个基基本本途途径径则则是是去去清清除除联联合合信源中各信源间的相关性。信源中各信源间的相关性。2/5/202324陈文华陈文华3.3 哈夫曼编码技术哈夫曼编码技术n 哈哈夫夫曼曼编编码码利利用用了了以以上上原原理理,属属于于一一种种变变字字长长码码,把把信信息息源源事事件件按按概概率率大大小小顺顺序序排排列列,对对出出现现概概率率大大的的信信息息源源事事件件赋赋予予短短码码字字,而而对对于于概概率率小小的的信信息息源源事事件件赋赋予予长长码码,只只要要码码字字长长度度按按照照信信息息出出现现的的概概率率大大小小逆逆顺顺序序排排列列,可可通通过过数数学学证证明明这这一一结结论论:平平均均码码字字长长度度一一定定小小于于其其它任何事件顺序的排列方式。它任何事件顺序的排列方式。2/5/202325陈文华陈文华3.3 哈夫曼编码技术哈夫曼编码技术n 哈夫曼编码一般过程如下:哈夫曼编码一般过程如下:u 1.1.把把事事件件(消消息息)按按出出现现的的概概率率由由大大到到小小排排成成一一个个序序列列。如如P(1)P(1)P(2)P(2)P(3)P(3)P(P(SmSm-1)-1)P(P(SmSm),即即将将信信息息源源事事件件按按概概率率递减顺序排列。递减顺序排列。u 2.2.把把其其中中两两个个最最小小的的概概率率P(P(SmSm-1)-1),P(P(SmSm)挑挑出出来来,且且将将事事件件“1”“1”赋赋给给其其中中最最小小的的,即即P(P(SmSm)1)1;事事件件“0”“0”赋赋给给另另一一稍稍大大的的即即P(P(SmSm-1)-1)0 0。2/5/202326陈文华陈文华3.3 哈夫曼编码技术哈夫曼编码技术u 3.3.把把两两个个最最小小概概率率相相加加作作为为新新事事件件的的概概率率,即即 求求 出出 P(P(SmSm-1)-1),P(P(SmSm)之之 和和 P(P(SiSi):):P(P(SiSi)=P(P(SmSm-1)-1)十十P(P(SmSm)设设P(P(SiSi)是对应于一个新的消息的概率。是对应于一个新的消息的概率。u 4.4.将将P(P(SiSi)与与上上面面未未处处理理的的(m m2 2)个个消消息息P(P(SmSm-2-2)的的概概率率重重新新由由大大到到小小再再排排列列,构构成成一一个新的概率序列。个新的概率序列。u 5.5.重重复复步步骤骤2 2),3 3),4 4),在在每每次次合合并并信信息息源源时时,将将被被合合并并的的信信源源分分别别赋赋“0”“0”和和“1”“1”直直到到所所有有m m个个事事件件的的概概率率均均已已全全部部合合并并处处理理为为止。止。2/5/202327陈文华陈文华3.3 哈夫曼编码技术哈夫曼编码技术u 6.6.寻寻找找从从每每一一个个信信息息源源事事件件到到概概率率总总和和为为1 1处处的的路路径径,对对每每一一信信息息源源事事件件写写出出“1”“1”、“0”“0”序序列列(从从 树树 根根 到到 信信 息息 源源 事事 件件 节节 点点)作作 为为 码码 字字。HuffmanHuffman编码的平均码字长度可以用下列公式求出:编码的平均码字长度可以用下列公式求出:(3 36 6)这这里里的的n ni i ,为为第第i i个个消消息息事事件件的的码码字字长长度度,P(P(SiSi)为为第第i i个个消消息息出出现现的的概概率率。举举一一例例子子来来说说明明这这一一编编码码过过程程。表表 3-1 3-1 信信 息息 源源 消消 息息 事事 件件 及及 其其 对对 应应 的的 概概 率率2/5/202328陈文华陈文华3.3 哈夫曼编码技术哈夫曼编码技术图图3-5 3-5 哈夫曼编码全过程哈夫曼编码全过程:F2/5/202329陈文华陈文华3.3 哈夫曼编码技术哈夫曼编码技术n 根据哈夫曼的编码规则,我们得到如表根据哈夫曼的编码规则,我们得到如表3-23-2所示:所示:由由于于8 8个个消消息息事事件件A A,B B,CC,H H的的每每个个概概率率为为已已知知,则则哈哈夫夫曼曼码码的的平平均均长长度度L L可可按按公公式式(3-6)3-6)计计算算为为:L L10.410.4十十33(0.180.180.100.10)44(0.100.10十十0.060.06十十0.070.07)十十 55(0.050.05十十 0.040.04)2.612.61比比 特特2/5/202330陈文华陈文华3.3 哈夫曼编码技术哈夫曼编码技术n 图像的熵图像的熵H H(S S)可按公式(可按公式(3-5)3-5)计算为:计算为:定义编码效率为熵值定义编码效率为熵值H H(S S)与平均码长与平均码长L L的比值,即:的比值,即:编编码码效效率率 (3-73-7)=2.55/2.61 97.8%哈哈 夫夫 曼曼 编编 码码 有有 它它 的的 不不 足足 之之 处处:必必须须先先得得到到信信息息源源码码元元(消消息息)的的统统计计概概率率,才才能能进进行行编编码码。折折中中的的方方法法是是根根据据经经验验值值人人为为地地给给出出HuffmanHuffman码表,但这样的编码无法达到最佳。码表,但这样的编码无法达到最佳。2/5/202331陈文华陈文华3.4 行程(游程)行程(游程)RLE 编码技术编码技术n 行行程程编编码码主主要要思思路路是是用用编编码码器器不不断断比比较较信信息息源源符符号号相相邻邻元元素素值值的的变变化化幅幅度度,一一旦旦发发现现有有明明显显的的变变化化,就就开开始始一一个个行行程程。编编码码器器检检测测每每一一个个行行程程起起点点位位置置开开始始的的多多次次重重复复的的比比特特或或者者字字符符序序列列,然然后后将将一一个个相相同同值值的的连连续续串串出出现现次次数数作作为为行行程程长长度度,并并将将行行程程长长度度转转换换成成代代码码,再再取取用用信信息息源源符符号号的的一一个个代代表表值值作作为为代代码码,这这种种编编码码称称为为行行程程编编码码,或或称称游游程编码,常用程编码,常用RLERLE表示。表示。2/5/202332陈文华陈文华对一幅两维图像对一幅两维图像F F(i i,j j)作水平作水平扫描后得到的部分像素的像素值扫描后得到的部分像素的像素值2/5/202333陈文华陈文华3.4 行程(游程)行程(游程)RLE 编码技术编码技术n 用用RLERLE对对这这一一行行数数据据编编码码后后得得到到的的码码字字表表:n RLERLE编编 码码 压压 缩缩 编编 码码 技技 术术 尤尤 其其 适适 用用 于于:计计算算机机生生成成的的图图形形图图像像和和黑黑白白二二值值图图像像的的编编码码,解解压压缩缩速速度度很很快快。RLERLE的的压压缩缩率率的的大大小小取取决决于于图图像像本本身身的的特特点点,可可以以得得到到较较大大的的压压缩缩比比。对对复复杂杂的的图像不适宜用图像不适宜用RLERLE进行编码。进行编码。2/5/202334陈文华陈文华3.5 静态图像压缩编码静态图像压缩编码的国际标准的国际标准-JPEGn 静态图像压缩编码静态图像压缩编码JPEGJPEG概况概况n 3.5.1 3.5.1 JPEGJPEG压缩编码的基本系统压缩编码的基本系统u(1 1)数据块准备数据块准备u(2 2)离散余弦正变换离散余弦正变换DCTDCTu(3 3)量化量化u(4 4)DCTDCT系数系数Z Z形扫描形扫描u(5 5)DCDC系数编码系数编码u(6 6)ACAC系数编码系数编码n 3.5.2 3.5.2 JPEGJPEG压缩编码的扩展系统压缩编码的扩展系统2/5/202335陈文华陈文华 3.5 静态图像压缩编码静态图像压缩编码的国际标准的国际标准-JPEGn JPEGJPEG是是国国际际上上彩彩色色、灰灰度度、静静止止图图像像的的第第一一个个国国际际标标准准。用用来来在在低低分分辨辨率率到到高高分分辨辨率率的的较较宽宽范范围围内内支支持持较较高高的的图图像像分分辨辨率率和和量量化化精精度度。它它不不仅仅适适用用于于黑黑白白、彩彩色色照照片片和和印印刷刷图图片片等等静静止止图图像像的的压压缩缩,而而且且扩扩大大到到了了彩彩色色传传真真、电电话话会会议议、新新闻闻图图片片的的传传送送上上,以以及及电电视视图图像像序序列列的的帧帧内内图图像像的的压压缩缩编编码码也也常常采采用用JPEGJPEG压缩标准。压缩标准。2/5/202336陈文华陈文华3.5 静态图像压缩编码静态图像压缩编码的国际标准的国际标准-JPEGn 变换编码的基本思路:变换编码的基本思路:u 1 1编码时略去某些能量很小的高频分量以降低码编码时略去某些能量很小的高频分量以降低码率。率。u 2 2变换编码还可以根据人眼对不同频率分量的敏变换编码还可以根据人眼对不同频率分量的敏感程度而对不同系数采用不同的量化台阶,以进一感程度而对不同系数采用不同的量化台阶,以进一步提高压缩比。步提高压缩比。n JPEGJPEG开发的压缩编码算法有三种工作方式:开发的压缩编码算法有三种工作方式:u 1 1基本系统(单次扫描)。基本系统(单次扫描)。u 2 2扩展系统(常采用累进编码或分层编码方式)。扩展系统(常采用累进编码或分层编码方式)。u 3 3无损压缩编码。无损压缩编码。2/5/202337陈文华陈文华3.5.1 JPEG 压缩编码的压缩编码的基本系统基本系统n 下面我们讨论一个基于离散余弦正变换下面我们讨论一个基于离散余弦正变换DCTDCT的的有失真有失真JPEGJPEG编解码的工作原理,图编解码的工作原理,图3-73-7是基于是基于DCTDCT的的JPEGJPEG编码的过程框图。编码的过程框图。2/5/202338陈文华陈文华1.数据块准备数据块准备u 块准备将一帧(幅)图像分成块准备将一帧(幅)图像分成8888的数据块。的数据块。对于彩色图像,可以看作多分量对于彩色图像,可以看作多分量(Y Y亮度信号分亮度信号分量和量和U U和和V V色度信号分量)进行压缩处理。色度信号分量)进行压缩处理。u 假假设设图图像像的的大大小小为为480480行行,每每一一行行有有640640个个像像素素。并并假假设设按按44llll取取样样格格式式,即即四四个个亮亮度度分分量量,一一个个色色差差分分量量U U,一一个个色色差差分分量量V V,则则亮亮度度分分量量就就是是一一个个640480640480的的数数值值矩矩阵阵,色色差差分分量量是是一一个个320240320240的数值矩阵。的数值矩阵。u 块块准准备备必必须须划划分分出出48004800个个(64048086404808)亮亮度度块块和和两两份份12001200个个(32024083202408)色色差差块块,共共计计72007200个数据块。个数据块。2/5/202339陈文华陈文华2.离散余弦正变换离散余弦正变换 DCTDCTu 若采样精度为若采样精度为P P位,采样数据在范围(位,采样数据在范围(0 0,2 2P P1 1),),则变成在范围(则变成在范围(2 2P P1 1,2 2P P1 1l l)内,以此作为内,以此作为DCTDCT正变换的输入。在解码器的输出端经正变换的输入。在解码器的输出端经IDCTIDCT反变反变换后,得到一系列换后,得到一系列 88 88的图像数据块,需将其数的图像数据块,需将其数值范围由(值范围由(2 2P P1 1,2 2P P1 1l l)再变回到(再变回到(0 0,2 2P P 1 1 )范围内的无符号整数,才能重构图像。范围内的无符号整数,才能重构图像。n 2.2.离散余弦正变换离散余弦正变换DCTDCTu 离离散散变变换换可可以以用用矩矩阵阵表表示示。假假设设信信源源序序列列为为一一个个n n行行k k列列的的矩矩阵阵X X,变变换换矩矩阵阵为为T T,经经过过某某种种变变换换后后得得到到输输出出序序列列Y Y为为:Y YTXTX2/5/202340陈文华陈文华2.离散余弦正变换离散余弦正变换 DCTDCTu 如果所采用的变换是正交变换如果所采用的变换是正交变换,则,则T T为为正交矩阵,即有:正交矩阵,即有:T T-1-1T TI I 其中其中I I是单位矩阵。在接收端,进行是单位矩阵。在接收端,进行变换:变换:X XT T-1-1Y Y 则可以恢复源信号序列则可以恢复源信号序列X X。JPEGJPEG将将8888大小的子块图像进行离散余大小的子块图像进行离散余弦弦DCTDCT变换。变换。2/5/202341陈文华陈文华2.离散余弦正变换离散余弦正变换 DCTDCTn 下面是离散余弦正变换下面是离散余弦正变换DCTDCT和它的和它的IDCTIDCT逆逆变换的数学表达式。变换的数学表达式。DCTDCT变换为变换为 2/5/202342陈文华陈文华2.离散余弦正变换离散余弦正变换 DCTDCTu 将每个数据块的数据从空间域变换到频率将每个数据块的数据从空间域变换到频率域,输出域,输出6464个个DCTDCT变换系数。如图变换系数。如图3-83-8所示,所示,6464个像素变换为个像素变换为6464个系数。个系数。(a a)像素块像素块 (b b)DCTDCT系数阵列系数阵列横向频率增加方向横向频率增加方向U纵纵向向频频率率增增加加方方向向VXY2/5/202343陈文华陈文华2.离散余弦正变换离散余弦正变换 DCTDCTu 图图3-93-9为二维离散余弦变换的示意图。为二维离散余弦变换的示意图。幅度幅度x yaf(x,y)DC系数系数DCT系数系数Fx Fycg(Fx,Fy)2/5/202344陈文华陈文华3.量化量化u 量量化化是是一一种种不不可可逆逆的的、有有失失真真的的过过程程,在在基基于于DCTDCT的的编编码码器器中中,量量化化是是引引起起信信息息丢失的主要原因。丢失的主要原因。u 对对DCTDCT系数进行量化有两个作用:系数进行量化有两个作用:u 降低系数的幅值降低系数的幅值。u 增加系数中值为增加系数中值为0 0的项数的项数。2/5/202345陈文华陈文华3.量化量化n 表表3-43-4缺省的亮度缺省的亮度Y Y分量量化表分量量化表2/5/202346陈文华陈文华3.量化量化n 表表3-53-5缺省的色度缺省的色度U U、V V分量量化表。分量量化表。2/5/202347陈文华陈文华3.量化量化n JPEGJPEG的的量化器的公式量化器的公式可定义为:可定义为:u 其中:其中:DCTDCT变换系数变换系数C(u,v)C(u,v);u Q(u,v)Q(u,v)是是量量化化器器步步长长,它它是是量量化化表表的的元元素。素。2/5/202348陈文华陈文华4.4.DCT 系数系数Z Z形扫描形扫描图图3-10 3-10 Z Z形扫描顺序形扫描顺序 其一维数组元素的位置顺序如图其一维数组元素的位置顺序如图3-103-10。ZZZZ(0 0)C C(0 0,0 0),ZZZZ(1 1)C C(0 0,l l),ZZZZ(2 2)C C(l l,0 0),),ZZZZ(6363)C C(7 7,7 7)。)。编码顺序依据编码顺序依据 ZZZZ的序号。的序号。0 1 5 6 14 15 27 28 2 4 7 13 16 26 29 42 3 8 12 17 25 30 41 43 9 11 18 24 31 40 44 53 10 19 23 32 39 45 52 54 20 22 33 38 46 51 55 60 21 34 37 47 50 56 59 61 35 36 48 49 57 58 62 632/5/202349陈文华陈文华5.DC 系数编码系数编码u 对对相相邻邻块块之之间间的的DCDC系系数数的的差差值值DIFFDIFFD Di iD Di i1 1进行编码。进行编码。u DIFFDIFFZZZZ(0 0)PREDPRED进行无失真编码。进行无失真编码。u 因因输输入入数数据据已已偏偏移移到到零零电电平平,已已先先行行减减去去了了2 2P P1 1,在扫描起点初始化时刻,规定在扫描起点初始化时刻,规定PREDPRED0 0。Blocki1Blocki图图 3-11 3-11 DCDC系数的差值系数的差值DIFFDIFFD Di iD Di i1 1DiDi12/5/202350陈文华陈文华5.DC 系数编码系数编码n 若若后后面面的的ZZZZ(0 0)的的动动态态范范围围为为1023102310231023,则则DIFFDIFF的的动动态态范范围围可可达达2047204720472047,这样每个值赋予一个码字则码表过于庞大。,这样每个值赋予一个码字则码表过于庞大。n 因因此此,JPEGJPEG对对码码表表进进行行简简化化,采采用用“前前缀缀码码(SSSSSSSS)尾码尾码”。n 前前缀缀码码表表示示尾尾码码的的有有效效位位数数(设设为为B B位位),尾尾码则直接采用码则直接采用B B位自然二进制码。位自然二进制码。n 8 8位位精精度度的的SSSSSSSS值值的的范范围围为为0 011(1211(12项项),其其码码表表可可参参见见 表表3-6 3-6 原原始始图图像像分分量量为为8 8位位精精度度时时DCDC系数差值的典型哈夫曼编码表系数差值的典型哈夫曼编码表 所示。所示。2/5/202351陈文华陈文华5.DC 系数编码系数编码 对于尾码为对于尾码为DIFFDIFF的的B B位:位:n当当DIFF0DIFF0,用原码用原码,尾码的最高位是尾码的最高位是“l”l”;n当当DIFFDIFF0 0,用反码用反码,尾码的最高位是尾码的最高位是“0”“0”;n如如设设DIFFDIFF1212,SSSSSSSS4 4,其其前前缀缀码码字字为为“101”“101”,4 4位位 尾尾 码码 为为 “1100”“1100”,从从 而而 DIFFDIFF 1212的的 编编 码码 为为“1011100”“1011100”。n如如果果DIFFDIFF1212,4 4位位尾尾码码为为1212反反码码“0011”“0011”,从从而而DIFFDIFF1212的的编编码码为为“1010011”“1010011”。解解码码时时,由由前前缀缀码码“101”“101”知知尾尾码码有有4 4位位;若若码码字字是是“1100”“1100”,因因其其最最高高位位为为“1”“1”,立立即即可可得得DIFFDIFF1212;若若码码字字是是“0011”“0011”,则则因因其其最最高高位位为为“0”“0”,知知DIFFDIFF应应为为负负数数,尾码是个反码,取反后可得实际值尾码是个反码,取反后可得实际值DIFFDIFF1212。2/5/202352陈文华陈文华6.AC 系数的编码系数的编码 n Z Z形形扫扫描描将将二二维维量量化化系系数数矩矩阵阵转转换换成成一一维维数数组组ZZZZ中的中的“零游程零游程/非零值非零值”。u 若若最最后后一一个个“零零游游程程/非非零零值值”中中只只有有零零游游程程(ZRLZRL),则则直直接接传传块块结结束束码码字字“EOB”EOB”结结束束本本块。块。n“零零游游程程/非非零零值值”编编码码表表示示为为“NNNN/SSSSNNNN/SSSS尾码尾码”。u 其其中中:4 4位位“NNNN”NNNN”为为相相对对于于前前一一个个非非零零值值的的零游程计数,表示零游程计数,表示ZRLZRL0 01515;u 如如 果果 ZRLZRL 1515,则则 用用“NNNN/SSSS”NNNN/SSSS”“1111/0000”“1111/0000”表表示示ZRLZRL1616,再再对对ZRLZRLZRLZRL1616继续编码。继续编码。2/5/202353陈文华陈文华6.AC 系数的编码系数的编码n 对于基本系统,对于基本系统,SSSSSSSS将不超过将不超过1010,可参见,可参见 表表3-7 3-7 ACAC系数的尾码位数赋值表系数的尾码位数赋值表。n 前前 缀缀 码码 的的 二二 维维 哈哈 夫夫 曼曼 码码 表表 的的 大大 小小 为为 NNNNSSSSNNNNSSSS2 2162162;亮亮度度和和色色差差各各有有自自己己的的码表(分别见码表(分别见 表表3-83-8 亮度亮度ACAC系数码表系数码表 和和 表表3-93-9 色差色差ACAC系数码表系数码表)。)。2/5/202354陈文华陈文华6.AC 系数的编码系数的编码n 若若ZZZZ(k k)为为非非零零ACAC系系数数,则则其其编编码码步步