体数据压缩编码标准.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《体数据压缩编码标准.ppt》由会员分享,可在线阅读,更多相关《体数据压缩编码标准.ppt(123页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第4讲 多媒体数据压缩编码标准14.1静态图像压缩标准JPEG 24.1.1JPEG标准的主要内容 nISO/IEC10918号标准“多灰度连续色调静态图像压缩编码”即JPEG标准,选定ADCT作为静态图像压缩的标准化算法。n该标准为保证通用性,包含以下两种方式:n空间方式可逆编码空间方式对于基本系统和扩展系统来说,被称为独立功能。nDCT方式非可逆编码,包含基本系统(必须保证的功能)和扩展系统(扩充功能)3 n基本系统是实现DCT编码与解码所需的最小功能集,大多数的应用系统只要用此标准,就能基本上满足要求。n扩展系统是为了满足更为广阔领域的应用要求而设置的。44.1.2JPEG静态图像压缩算
2、法 1.基于DPCM的无失真编码 预测器熵编码器表说明无失真编码器源图像数据压缩图像数据图1无失真编码简化框图5n基于DPCM的无失真编码优点是硬件易实现,重建图像质量好。n缺点是压缩比太低,大约为2:1。6n工作原理是对X的预测值X,将X-X进行无失真熵编码。对X的求法见图给出的预测方式。cbax选择值选择值预测预测选择值选择值预测预测 0 1 2 3非预测 a b c 4 5 6 7a+b-ca+(b-c)/2b+(a-c)/2(a+b)/2(a)X邻域(b)预测方式图2预测器72.基于DCT的有失真压缩编码 n离散余弦变换n量化处理nDC系数的编码和AC系数的行程编码n熵编码8图3基于D
3、CT编码过程FDCT熵编码器表说明无失真编码器源图像数据压缩图像数据量化器表说明88块(YUV每个分量)9图4解码过程熵解码器IDCT表说明解码器逆量化器表说明88块压缩图像数据恢复的图像数据10离散余弦变换(1)首先把原始图像顺序分割成88子块;(2)采样精度为P位(二进制),把0,2P-1范围的无符号数变换成-2P-1,2P-1范围的有符号数,作为离散余弦正变换(FDCT)的输入;(3)在输出端经离散余弦逆变换(IDCT)后又得到一系列88子块,需将数值范围-2P-1,2P-1变换回0,2P-1来重构图像。11n这里用的88FDCT的数学定义为:F(u,v)=(1/4)C(u)C(v)x=
4、07y=07 f(x,y)cos(2x+1)u/16)cos(2y+1)v/16)n88IDCT的数学定义为:f(x,y)=(1/4)u=07v=07C(u)C(v)F(u,v)cos(2x+1)u/16)cos(2y+1)v/16)其中:C(u),C(v)=1/2 当u,v=0 C(u),C(v)=1 其他n下面的编码针对FDCT输出的64个基信号的幅值(F(0,0),F(7,7)称作DCT系数)来进行 12量化处理 n量化是一个“多到一”的过程,失真原因n关键是找最小量化失真的量化器,JPEG采用线性均匀量化器,定义为对64个DCT系数除以量化步长,然后四舍五入取整:FQ(u,v)=Int
5、egerRoundF(u,v)/Q(u,v)nQ(u,v)是量化器步长,它是量化表的元素。量化表元素随DCT系数的位置和彩色分量不同有不同的值,量化表尺寸为88与64个变换系数一一对应。n这个量化表应由用户规定(JPEG给出参考值-见后面表格),并作为编码器的一个输入。131611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399表1亮度量化表14 17182447999999
6、991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999表2色度量化表15 n量化的作用是在一定主观保真度图像质量前提下,丢掉那些对视觉影响不大的信息,通过量化可调节数据压缩比。16 DC系数的编码 n64个变换系数经量化后,坐标u=v=0的F(0,0)称DC系数(直流分量),它即64个空域图像采样值的平均值。n相邻88块之间DC系数有强相关性。JPEG对量化后的DC系数采用DPCM编码,即对DIFF=DCi-DCi-1编码
7、。blocki-1blockiDCi-1DCiDC系数差分编码17AC系数的行程编码 n其余63个交流系数(AC)采用行程编码。n从左上方AC0,1开始沿对角线方向“Z”字形扫描直到AC7,7扫描结束,这样可增加行程中连续0的个数。nAC系数编码的码字用两个字节表示,如图所示:图5 Z字形扫描18图6AC系数行程编码码字两个非0值间连续0的个数 表示下一个非0值需要的bit数 下一个非0实际值7430字节1字节2例子例子:对“,3,0,0,0,0,0,12,0,0,”编码,(5,4),(12),.19熵编码 n为了进一步压缩数据,需对DC码和AC行程编码的码字再做基于统计特性的熵编码。nJPE
8、G建议的熵编码是Huffman编码和自适应二进制算术编码。n熵编码可分成两步进行:n把DC码和AC行程码转换为中间符号序列n给这些符号赋以变长码字变长码字20AC系数熵编码的中间格式 n熵编码的中间格式由两个符号组成:n符号1:(行程,尺寸)n符号2:(幅值)n第一个信息参数“行程”表示前后两个非0的AC系数之间连续0的个数。n第二个信息参数“尺寸”是后一个非0的AC系数幅值编码所需比特数。21n行程取值范围为115,超过15时用扩展符号1(15,0)来扩充,63个AC系数最多增加3个扩展符号1。编码结束时用(0,0)表示。n“尺寸”取值范围为010。n“幅值”用以表示非0的AC系数的值,范围
9、为-210,210-1(最长10bit),结构形式如下表所示。221-1,12-3.-2,2.33-7.-4,4.74-15.-8,8.156789-511.-256,25651110-1023.-512,5121023表3符号2结构23DC系数的熵编码n对于直流分量DC也有类似于AC系数的编码格式n符号1:(尺寸)n符号2:(幅值)n“尺寸”表示DC差值的幅值编码所需的比特数,而“幅值”表示DC差值的幅值,范围为-211,211-1。可在表3中多加一级,幅值尺寸以1到11比特表示。n将63个AC系数表示成为符号1和符号2序列,其中连续0的长度超过15时,有多个符号1;块结束(EOB)时仅有一
10、个符号1(0,0)。24“4,0,0,0,0,0,0,0,0,3,0”.4,3之间有31个0.(15,0),(15,0),(1,0),(3)n可变长度熵编码就是对上述序列进行变长编码。n对DC系数、AC系数中的符号1采用Huffman表中的变长码编码(VLC),这里Huffman变长码表必须作为JPEG编码器输入。n符号2用码字长度在表3中给出的变长整数VLI码编码。VLI是变长码,但不是Huffman码。VLI的长度存放在VLC中,JPEG提供VLI码字表供用户使用25nJPEG提供2套Huffman码表:亮度和色度。每套又有DC表和AC表各1个。共有4个表。n表定义(亮度DC系数码表)16
11、B说明码字长度:X00 01 05 01 01 01 01 01 01 00 00 00 00 00 00 00 第i个(1-16)元素值表示长度为i的Huffman码个数。紧跟一组值说明亮度表分类:X00 01 02 03 04 05 06 07 08 09 0A 0B26表表4 亮度亮度DC系数表系数表分类分类 码长码长 码字码字分类分类 码长码长 码字码字020064111013010751111023011861111103310097111111043101108111111105311011911111111027表表5 色度色度DC系数表系数表分类分类 码长码长 码字码字分类分类
12、 码长码长 码字码字020066111110120177111111022108811111110331109911111111044111010101111111110551111011111111111111028表表6 JPEG压缩效果评价压缩效果评价压缩效果压缩效果(比特比特/像素像素)质质 量量0.250.50中好0.500.75好很好0.751.5极好1.22.0与原始图像分不出来293.基于基于DCT的累进操作方式编码的累进操作方式编码 n顺序方式:顺序方式:每个图像分量的编码一次扫描完成的每个图像分量的编码一次扫描完成的;累进方式:累进方式:图像分量编码要经过多次扫描才完成图像
13、分量编码要经过多次扫描才完成。n累进方式累进方式 第一次扫描只进行一次粗糙图像的扫描压缩,第一次扫描只进行一次粗糙图像的扫描压缩,以以相对于总的传输时间快得多的时间传输粗糙图像,相对于总的传输时间快得多的时间传输粗糙图像,并重建一帧质量较低的可识别图像;并重建一帧质量较低的可识别图像;在随后的扫在随后的扫描中再对图像作较细的压缩,描中再对图像作较细的压缩,这时只传递增加的这时只传递增加的信息,可重建一幅质量提高一些的图像。这样不信息,可重建一幅质量提高一些的图像。这样不断累进,断累进,直到满意的图像为止。直到满意的图像为止。30n需在量化器的输出与熵编码的输入之间,增加一个足以存储量化后DCT
14、系数的缓冲区,对缓冲区中存储的DCT系数多次扫描,分批编码。n有以下两种累进方式:n频谱选择法扫描中只对64个DCT变换系数中某些频带的系数进行编码、传送,随后对其他频带编码、传送,直到全部系数传送完毕为止。n按位逼近法沿着DCT量化系数有效位(表示系数精度的位数)方向分段累进编码。如第一次扫描只取最高有效位的n位编码、传送,然后对其余位进行编码、传送。314.基于基于DCT的分层操作方式的分层操作方式 n分层方式是对一幅原始图像的空间分辨率,分成多个分辨率进行“锥形”的编码方法,水平(垂直)方向分辨率的下降以2的倍数因子改变。图7分层操作方式32分层操作方式的过程分层操作方式的过程(1)把原
15、始图像空间分辨率降低。(2)对已降低分辨率的图像采用基于DCT的顺序方式、累进方式或无失真预测编码中的任何一种编码方法进行编码。(3)对低分辨率的图像解码,重建图像,使用插值滤波器,对它插值,恢复图像的水平和垂直分辨率。(4)把分辨率已升高的图像作为原始图像的预测值,对它们的差值采用基于DCT的顺序方式、累进方式或用无失真方式进行编码。(5)重复(3)、(4)直到图像达到完整的分辨率编码。334.1.2JPEG2000简介n基于Internet网络的多媒体应用,给图像编码提出了新的要求.2000年12月公布的新的JPEG2000标准(ISO15444),其目标是在高压缩率的情况下,如何保证图像
16、传输的质量。nJPEG中采用DCT变换考察整个时域过程的频域特征或整个频域过程的时域特征。JPEG2000采用以小波变换为主的多分辨率编码方式。nJPEG2000统一了面向静态图像和二值图像的编码方式,是既支持低比率压缩又支持高比率压缩的通用编码方式。34n该算法主要特点如下:(1)高压缩率。与JPEG相比,可修复约30的速率失真特性。JPEG和JPEG2000在压缩率相同时,JPEG2000的信噪比将提高30左右;(2)无损压缩。预测编码作为对图像进行无损编码的成熟方法被集成在JPEG2000中;(3)渐进传输。JPEG2000可实现以空间清晰度和信噪比为首的各种可调节性,从而实现渐进传输,
17、即具有“渐现”特性.(4)感兴趣区域压缩。JPEG2000支持所谓的“感兴趣区域”。354.2 运动图像压缩标准运动图像压缩标准MPEG364.2.1 MPEG标准简介标准简介nMPEG标准是面向运动图像压缩的一个系列标准。标准是面向运动图像压缩的一个系列标准。n最初最初MPEG专家组的工作项目是专家组的工作项目是3个,即在个,即在1.5Mbps,10Mbps,40Mbps传输速率下对图像编码,传输速率下对图像编码,分别分别命名为命名为MPEG-1,MPEG-2,MPEG-3。MPEG-3后被取消后被取消.n为了满足不同的应用要求,为了满足不同的应用要求,MPEG又将陆续增加其又将陆续增加其他
18、一些标准他一些标准MPEG-4,MPEG-7,MPEG-21。37 nMPEG算法编码过程和解码过程是一种非镜象算法编码过程和解码过程是一种非镜象对称算法对称算法(不对称不对称),解码过程要比编码过程相解码过程要比编码过程相对简单些。对简单些。nMPEG-1和和MPEG-2只规定了解码的方案,只规定了解码的方案,重重点将解码算法标准化。因而用硬件实现点将解码算法标准化。因而用硬件实现MPEG算法时,算法时,人们首先实现人们首先实现MPEG的解码器,如的解码器,如C-Cube公司公司CL450解码器系列。解码器系列。n最近几年,随着最近几年,随着MPC性能的提高,软件解压功性能的提高,软件解压功
19、能也逐渐得到支持。能也逐渐得到支持。384.2.2 MPEG-1系统系统n“用于数字存储媒体运动图像及其伴音速率为用于数字存储媒体运动图像及其伴音速率为1.5Mbps的压缩编码的压缩编码”简称简称MPEG-1,作为作为ISO/IEC 11172号建号建议于议于1992年通过。年通过。n主要用于在主要用于在CD-ROM存储运动视频图像,存储运动视频图像,它针对标准它针对标准分辨率分辨率(NTSC制为制为352240;PAL制为制为352288)的图像的图像进行压缩,进行压缩,每秒每秒30帧画面,帧画面,具备具备CD音质。音质。n它还用于数字电话网络上的视频传输,它还用于数字电话网络上的视频传输,
20、如非对称数字如非对称数字用户线路用户线路(ADSL)、视频点播视频点播、教育网络等。教育网络等。n使用使用MPEG-1的压缩算法,的压缩算法,可将一部可将一部120分钟长的电影分钟长的电影压缩到压缩到1.2GB左右。因此,左右。因此,它被广泛地应用于它被广泛地应用于VCD制制作。作。39MPEG-1分为分为5个部分个部分(1)MPEG系统系统(11172-1),定义音频、视频及有关定义音频、视频及有关数据的同步;数据的同步;(2)MPEG视频视频(11172-2),定义视频数据的编码和定义视频数据的编码和重建图像所需的解码过程,亮度信号分辨率为重建图像所需的解码过程,亮度信号分辨率为36024
21、0,色度信号分辨率为色度信号分辨率为180120;(3)MPEG音频音频(11172-3),定义音频数据的编码和定义音频数据的编码和解码;解码;(4)一致性测试一致性测试(11172-4);(5)软件模拟软件模拟(11172-5)。40图2.15 MPEG-1解码器原型41MPEG-1编解码器原型:编解码器原型:n多路复合而成的码流假设以介质特定格式存储在数多路复合而成的码流假设以介质特定格式存储在数字存储介质字存储介质(DSM)或网络上,或网络上,标准不规定介质特定标准不规定介质特定格式。格式。n系统解码器从输入多路复合流中抽取定时信息,并系统解码器从输入多路复合流中抽取定时信息,并对输入流
22、进行分流处理,对输入流进行分流处理,输出两个基本流分别给输出两个基本流分别给视频和音频解码器。视频和音频解码器。n视频和音频解码器分别解码输出视频和声音信号。视频和音频解码器分别解码输出视频和声音信号。42 n系统、视频、音频和介质系统、视频、音频和介质4个解码器之间用定个解码器之间用定时信息进行同步。时信息进行同步。n多路复合流构造为多路复合流构造为2层:层:系统层和压缩层。系系统层和压缩层。系统解码输入的是系统层;统解码输入的是系统层;而视频、音频解码器而视频、音频解码器输入的是压缩层输入的是压缩层。43 n系统解码器执行两类操作系统解码器执行两类操作:n一类是作用在整个多路复合流上的操作
23、,称为复合流操作一类是作用在整个多路复合流上的操作,称为复合流操作;n另一类是作用在单个基本流上的操作,称为特定流操作。另一类是作用在单个基本流上的操作,称为特定流操作。n系统层分为两个子层系统层分为两个子层:n一个子层称为包一个子层称为包(pack),是复合流操作对象是复合流操作对象;n另一个子层称为组另一个子层称为组(packet),它用于特定流操作它用于特定流操作。44 MPEG音频标准的特点:音频标准的特点:n音频信号采样率可以是音频信号采样率可以是32kHz,44.1kHz或或48kHz。n压缩后的比特流可以按以下压缩后的比特流可以按以下4种模式之一支持单声种模式之一支持单声道或双声
24、道道或双声道:n提供给单音频通道的单声道模式;提供给单音频通道的单声道模式;n提供给两个独立的单音频通道的双提供给两个独立的单音频通道的双-单声道模式;单声道模式;n提供给立体声通道的立体声模式;提供给立体声通道的立体声模式;n联合立体声模式,利用立体声通道之间的关联或通道之联合立体声模式,利用立体声通道之间的关联或通道之间相位差的无关性,或者对两者同时利用。间相位差的无关性,或者对两者同时利用。45 nMPEG音频音频标准提供标准提供3 3个独立的压缩层次,用户可个独立的压缩层次,用户可在复杂性和压缩质量之间权衡选择。在复杂性和压缩质量之间权衡选择。n层层1最简单,使用比特率最简单,使用比特
25、率384kbps,主要用于主要用于DCC;n层层2的复杂度中等,使用比特率的复杂度中等,使用比特率192kbps左右,左右,主要应用主要应用于数字广播的音频编码、于数字广播的音频编码、CD-ROM上的音频信号以及上的音频信号以及CD-I和和VCD。n层层3最为复杂,使用比特率最为复杂,使用比特率64kbps,尤其适用于尤其适用于ISDN上上的音频传输,有损压缩但音质保持逼真效果。的音频传输,有损压缩但音质保持逼真效果。MP3MP3音乐音乐 是利用是利用 MPEG Audio Layer 3 MPEG Audio Layer 3 的技术,的技术,声音采声音采用用 1 1:10 10 甚至甚至 1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据压缩 编码 标准
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内