《图像处理》课件.pptx
数据编码信源编码提高数据表达效率(压缩)信道编码提高数据存贮/传输可靠性一些信号的原始数据量信源信源数据量数据量电话(200Hz 3.4kHz)8k/s 12bits=96kb/s宽带语音(50Hz 7kHz)16k/s 14bits=224kb/s宽带音频(20Hz 20kHz)44.1k/s 2通道16bits=1.412Mb/s图像51251224bits=6Mb视频64048024bits30/s=221Mb/s高清晰度电视128072024bits60/s=1.3Gb/s数据压缩的依据 存在数据冗余时间冗余 时间轴上的相关性空间冗余 像素间的相关性信息熵冗余 数据表示的效率知识冗余 先验知识的利用心理视觉冗余 合理的分辨率coding redundancy Redundancy:R=1 L/mApproaches:-Standard Huffman -Shifted Huffman -Arithmetic Coding No redundancy:8bitInterpixel redundancy Spatial redundancyApproaches:-Run Length coding -intraframe predicative coding -LZW codingInterpixel redundancy Spatial,time redundancyApproaches:-interframe predicative coding (motion prediction)Psychovisual redundancy Original 25%quality 15%quality 45,339 b 3,905 b 3,197 bRemove Less important informationApproaches:-quantization(lossy),DCT Compression system modelTwo parts:Encoder,DecoderSource encoder:remove redundancyChannel encoder:reduce noiseSource encoder and decoder Mapper:transform input data to a special format for reducing interpixel redundancy数据编码分类无损压缩(lossless):变长编码(Huffman)行程编码算术编码-医学或商用数据的压缩有损数据压缩(lossy)预测编码变换编码(Cosine,Wavelet)-视频数据的压缩Run-Length Encoding(1D)Original data:05,05,05,05,11,11,1A,1A,1A,1A,20,22,22,22,22Encoding:05,04,11,02,1A,04,20,01,22,04Application:be suitable for uniform gray images,FAX codingRun-Length Encoding(2D)05,02,05,01,10,01,21,04,05,01,10,01,10,04,21,02,31,02,10,02,10,02,15,01,31,02,31,01,15,01,31,01Rules:basic unit-maximal square left-right,top-bottom LZW coding根据数据本身包含有重复的字符串(不一定要求空间上相邻)每接收一个字符系列,判断以前是否出现过,然后用出现过的字符串代替该重复的部分,输出对应的“指针”(位置)例如:“aabbccddee”的指针是 0100,以后每次出现该字符串,就用0100代替。LZW NotesDictionary is not null at first,single symbolBuilding decompression dictionary is needed Application:GIF(graphic interchange format)TIFF(tagged image file format)PDF(portable document format)Huffman coding灰度 0 1 2 3 4 5 6 7概率 0.05 0.05 0.10 0.15 0.25 0.20 0.15 0.050.100.150.250.300.450.551.001001010101011编码0110001101 10010100110100111编码:从根节点开始到叶子节点!Standard Huffman codingAverage bits:2.2Entropy:2.14 efficiency:0.973Standard Huffman disadvantagesEven if 1 bit error,a series of errors,no solutions (example in next page)When decoding,fail to abstract contents from randomly position Computation:k-2 source rankingTo symbol with less probability:code length is too long(max:k-1 bits)-shifted HuffmanError decoding example of Huffman Code:011,1,01010,0100,01011,00Gray:a1 a2 a3 a4 a5 a6a3,a1,a2,a2,a6.01010 011 1 1 00*Encoding:Gray CodeDecoding:Code Gray010100111100.01010 00 1 1 1 1 00.01010 01011 00.a3,a6,a2,a2,a2,a2,a6.a3,a5,a6.*Add 0:error decoding*011-010,Shifted Huffman encoding 1Truncate:90%(main)-standard HuffmanDivide blocks:assign a prefix to each blockShift:prefix+standard Huffman code Shifted Huffman encoding 2主区间120 150,编码为:c120c150119=sum(0119),低界码 c119151=sum(151255),高阶码 c151c119 和c151分别作为正、负区间码Shifted Huffman encoding 30区间:120 150,1201501区间:151 181,c151+0区间中对应位置的编码,如170-139,编码为:c151c1392区间:182 212,区间码为:c151 c151-1区间:89 119,区间码为:c119算术编码(Arithmetic Encoding)将信息量的增加映射为实数精度的提高编码过程将0,1)区间不断细分SymbolABCDProb0.10.40.20.3Interval0,0.1)0.1,0.5)0.5,0.7)0.7,1)符号序列:C,A,D,A,C,D,B,.010.50.7C0.520.5A0.5140.52D0.5140.5146A.Lossy compressionLossless:8:1 lossy:100:1200:1,quantization 10:1 to 100:1 same in human eyesJPEG,MPEG,H.263 Lossy predictive coding Transform based codingLossy predictive codingDPCM(differential pulse code modulation)Difference:Predictor:Delta modulation(DM)Simplest predictor:m=1 Quantier-1 bit/pixel Problems:Slope overload:when gray values change rapidly distortion edge blurred Granular noise:when gray values change small spot noise Problems of delta modulationOptimal predictorMinimizing:Optimal predictor Global predicator Fixed predictive coefficients:Comparison of four predicators m=1,2,3,1,阶数增加,误差减小 Transform based codingPrinciple:Magnitude near 0 in higher frequencyData compression removing those data near 0,same visual result 正交变换 DFT,DCT,Wavelet,Transform based coding model能量最高的系数被最细量化,而能量较低的系数就被粗量化或被简单地舍去。优点:变换系数的编码误差只影响该系数所在的块,不会扩散到其他的子块,故变换编码的抗干扰能力优于预测编码。subimage size Size:larger than 8*8 saturation Image Compression StandardsJoint Photographics Experts Group(JPEG)reorderingJPEG CoderDC:F(0,0),DPCMAC:RLC,HuffmanDCT coefficients:Zig-Zig reordering original imagesize:66616 bytesJPEG compressedsize:8181 bytesquality factor:0.6original imagesize:66616 bytesJPEG compressedsize:2742 bytesquality factor:0.1视频编码技术 国际电联(ITU-T),标准有:H.261、H.262、H.263、H.263+国际标准化组织(ISO)标准有MPEG-1、MPEG-2、MPEG-4、MPEG-7 由两个组织联合组建的联合视频组(JVT)共同制定的新数字视频编码标准:H.264,MPEG-4 part 10(100:1)四种图像四种图像I-图像帧内图,每个图像群组由此类型的图像开始。编码时独立编码(JPEG),解码时不参考其他帧;P-图像预测图,用前面的I图或P图像进行预测编码得到,并可以作为下一个预测(B图像或P图像)的参照图像。B-图像插补图(双向预测图),预测时,需要用先前及后续的若干个图像作参考,并作运动补偿和运动估计;D-图像,用于快速进带。仅由DC直流分量构造的图像,可在低比特率的时候做浏览用。MPEG 视频流的组成视频流的组成:允许编码端自行选择I图像的使用频率和在视频流中的位置。允许编码端自行选择任意两帧参考图像(I-图或P-图)之间的B图像数。编码端的视频流记录格式可以和图像显示顺序不同。显示的顺序:I B B P B B P B B P B B P B B I 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 视频流顺序:I P B B P B B P B B P B B I B B 1 4 2 3 7 5 6 10 8 9 13 11 12 16 14 15MPEG“I-图像”编码图像数据压缩采用类似JPEG的算法“P-图像”的编码差分方法;运动矢量估计;差分预测编码假设:宏块MPI是宏块MRJ的最佳匹配块运动矢量估计最佳匹配MSE:MAD:“B-图像图像”的压缩编码的压缩编码计算方法与预测图像P的算法类似。可伸缩性分层编码(scalable layered coding)原始视频流被压缩至多个压缩层码流(substreams):基本层码流(base substream):可以被独立解码,提供基本的视频质量保证。增强层码流:需要和基本层一起解码,提供增强的细节上的视频质量。可伸缩性分层编码 时域:通过增加或者减少非关键帧(B帧)的方法来调整帧率从而达到调整码率的目的。空域:多分辨率 原始视频通过下采样得到低分辨率基本层码流;原始视频-基本层视频 增强层码流。质量:不同的量化方法传统分层编码的不足 由于它的编码是以层为最小单位的,所以接收端解码的时候也必须以层为最小单位。即要么解码整个层的数据,要么丢弃整个层;增强层解码需要在基本层的基础上进行,一旦基本层接收失败,则整个解码过程将失败;各个压缩层的码率在编码完成时就固定了,并且一般比特率相差较大,因此,只能实现离散的有限的码率调整,无法保证在带宽波动范围内始终能得到较高的带宽利用率。FGS精细的可扩展性编码(fine granular scalable coding)目标:将原始视频编码成一个可以单独解码的基本层码流和一个可以在任何点截断的增强层码(即,增强层中接收到任意量的数据后都可以立即解码)MPEG-4中的FGS:基本层:基于变换编码方式,提供最低视频质量;增强层:位平面编码技术.每一帧的增强层码流可以在任意地点被截断,接收端解码获得的视频质量与实际收到的数据量成正比,提高了带宽的利用率;多信道,多优先级分层传输:基本层用最高优先级和最优信道环境,增强层用低优先级较差信道.