图像压缩编码数字图像处理.pptx
图像压缩编码图像压缩编码数据压缩与信息论基础图像压缩与编码基本概念信息论基础图像压缩编码无损压缩有损压缩图像压缩编码主要国际标准静止图像压缩编码标准-JPEG运动图像压缩编码标准-MPEG第1页/共107页 一一.图像压缩与编码基本概念图像压缩与编码基本概念 为什么要进行图像压缩为什么要进行图像压缩 图像数据压缩的可能性图像数据压缩的可能性 数据冗余数据冗余 图像压缩的目的图像压缩的目的 图像数据压缩技术的重要指标图像数据压缩技术的重要指标 图像数据压缩的应用领域图像数据压缩的应用领域 图像编码中的保真度准则图像编码中的保真度准则 信息论基础信息论基础 图像压缩模型图像压缩模型第2页/共107页1.1.为什么要进行图像压缩?为什么要进行图像压缩?数字图像通常要求很大的比特数,这给图像的传输和存储带来相当大的困难。要占用很多的资源,花很高的费用。如一幅512*512的灰度图象的比特数为 512*512*8=256k256k 再如一部9090分钟的彩色电影,每秒放映2424帧。把它数字化,每帧512*512象素,每象素的R R R R、G G G G、B B B B三分量分别占8 bit8 bit,总比特数为第3页/共107页 90*60*24*3*512*512*8bit=97,200M97,200M。如一张CDCD光盘可存600600兆字节数据,这部电影光图像(还有声音)就需要160160160160张CDCD光盘用来存储。对图像数据进行压缩显得非常必要。第4页/共107页2.2.图像数据压缩的可能性图像数据压缩的可能性 一般原始图像中存在很大的冗余度。用户通常允许图像失真。当信道的分辨率不及原始图像的分辨率时,降低输入的原始图像的分辨率对输出图像分辨率影响不大。用户对原始图像的信号不全都感兴趣,可用特征提取和图像识别的方法,丢掉大量无用的信息。提取有用的信息,使必须传输和存储的图像数据大大减少。第5页/共107页 设:n1和n2是在两个表达相同信息的数据集中,所携带的单位信息量。压缩率:描述压缩算法性能CR=n1/n2其中,n1是压缩前的数据量,n2是压缩后的数据量相对数据冗余:RD=1 1/CR例:CR=20;RD=19/20描述信源的数据是信息量(信源熵)和信息冗余量之和。3.3.数据冗余数据冗余1 1)数据冗余的基本概念)数据冗余的基本概念第6页/共107页A.A.编码冗余:编码冗余:2 2)常见的数据冗余)常见的数据冗余在数字图像压缩中,常有3种基本的数据冗余:编码冗余、像素间的冗余以及心理视觉冗余为表达图像数据需要用一系列符号,用这些符号根据一定的规则来表达图像就是对图像编码。对每个信息或事件所赋的符号序列称为码字,而每个码字里的符号个数称为码字的长度。第7页/共107页设定义在0,1区间的离散随机变量sk代表图像的灰度值,每个sk以概率ps(sk)出现Ps(sk)=nk/nk=0,1,2,L-1其中L为灰度级数,nk是第k个灰度级出现的次数,n是图像中像素总个数。设用来表示sk的每个数值的比特数是,那么为表示每个像素所需的平均比特数就是编码所用的符号构成的集合称为码本。第8页/共107页等长码:对于一个消息集合中的不同消息,用相同长度的不同码字表示,编解码简单,编码效率不高。变长码:与等长码相对应,对于一个消息集合中的不同消息,也可以用不同长度的码字表示,编码效率高,编码解码复杂。第9页/共107页例:如果用8 8位表示该图像的像素,我们就说该图像存在着编码冗余,因为该图像的像素只有两个灰度,用一位即可表示。如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像包含了编码冗余。第10页/共107页B.B.像素冗余:像素冗余:由于任何给定的像素值,原理上都可以通过它的邻居预测到,单个像素携带的信息相对是小的。对于一个图像,很多单个像素对视觉的贡献是冗余的。这是建立在对邻居值预测的基础上。原始图像越有规则,各像素之间的相关性越强,它可能压缩的数据就越多。例:原图像数据:234223231238235压缩后数据:23411-8-73第11页/共107页相同的目标相同的直方图象素间的相关性不同第12页/共107页类似还有:图像彩色光谱空间的冗余;视频图像信号在时间上的冗余;第13页/共107页 一些信息在一般视觉处理中比其它信息的相对重要程度要小,这种信息就被称为视觉心理冗余。(3)(3)视觉心理冗余:视觉心理冗余:33K15K第14页/共107页4.4.图像压缩的目的图像压缩的目的 图像数据压缩的目的是在满足一定图像质量条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量。在信息论中称为信源编码。图像从结构上大体上可分为两大类,一类是具有一定图形特征的结构,另一类是具有一定概率统计特性的结构。基于不同的图像结构特性,应采用不同的压缩编码方法。第15页/共107页5.5.图像数据压缩技术的重要指标图像数据压缩技术的重要指标(1 1)压缩比:图像压缩前后所需的信息存储量之比,压缩比越大越好。(2 2)压缩算法:利用不同的编码方式,实现对图像的数据压缩。(3 3)失真性:压缩前后图像存在的误差大小。第16页/共107页 全面评价一种编码方法的优劣,除了看它的编编码码效效率率、实实时时性性和失失真真度度以外,还要看它的设备复杂程度设备复杂程度,是否经济与实用经济与实用。常采用混合编码的方案,以求在性能和经济上取得折衷。随着计算方法的发展,使许多高效而又比较复杂的编码方法在工程上有实现的可能。第17页/共107页1)办公自动化;2)医学图像处理;3)卫星遥感遥测系统;4)高清晰度电视HDTV;5)可视电话、会议电视;6)移动多媒体图像及视频传输:彩信业务,手机视频;凡是涉及到图像数据的传输、交换与存储的领域均凡是涉及到图像数据的传输、交换与存储的领域均要求进行图像数据的压缩。要求进行图像数据的压缩。6 6 图像数据压缩的应用领域图像数据压缩的应用领域第18页/共107页7.7.图像编码中的保真度准则图像编码中的保真度准则 图像信号在编码和传输过程中会产生误差,尤其是在有损压缩编码中,产生的误差应在允许的范围之内。在这种情况下,保真度准则可以用来衡量编码方法或系统质量的优劣。通常,这种衡量的尺度可分为客观保真度准客观保真度准则则和主观保真度准则主观保真度准则。第19页/共107页 通常使用的客观保真度准则有输入图像和输出图像的均方根误差均方根误差;输入图像和输出图像的均方根均方根信噪比信噪比两种。均方根误差均方根误差:设输入图像是由NNNN个像素组成,令其为f(x,y)f(x,y),其中x,y=0,1,2,N-1x,y=0,1,2,N-1。这样一幅图像经过压缩编码处理后,送至受信端,再经译码处理,重建原来图像,这里令重建图像为g(x g(x,y),y)。它同样包含NNNN个像素,并且x x,y=0,1,2,N-1,y=0,1,2,N-1。(1)(1)客观保真度准则客观保真度准则第20页/共107页在0,1,2,N-10,1,2,N-1范围内x,yx,y的任意值,输入像素和对应的输出图像之间的误差可用下式表示:而包含NNNN像素的图像之均方误差为:由式可得到均方根误差为第21页/共107页 如果把输入、输出图像间的误差看作是噪声,那么,重建图像g(x,y)g(x,y)可由下式表示:在这种情况下,另一个客观保真度准则重建图像的均方信噪比如下式表示:第22页/共107页 图像处理的结果,大多是给人观看,由研究人员来解释的,因此,图像质量的好坏,既与图像本身的客观质量有关,也与视觉系统的特性有关。有时候,客观保真度完全一样的两幅图像可能会有完全不相同的视觉质量,所以又规定了主观保真度准则,这种方法是把图像显示给观察者,然后把评价结果加以平均,以此来评价一幅图像的主观质量。(2)(2)主观保真度准则主观保真度准则第23页/共107页评分评分评价评价说明说明1优秀的优秀的优秀的具有极高质量的图像优秀的具有极高质量的图像2好的好的 是可供观赏的高质量的图像,干扰并不令人讨厌是可供观赏的高质量的图像,干扰并不令人讨厌 3可通过的可通过的 图像质量可以接受,干扰不讨厌图像质量可以接受,干扰不讨厌4边缘的边缘的图像质量较低,希望能加以改善,干扰有些讨厌图像质量较低,希望能加以改善,干扰有些讨厌5劣等的图像质量很差,尚能观看,干扰显著地令人讨厌6不能用不能用图像质量非常之差,无法观看图像质量非常之差,无法观看另外一种方法是规定一种绝对尺度,如:表6.1 6.1 电视图像质量评价尺度第24页/共107页8.8.信息理论信息理论(一)、信源空间概述1 1、信息:事物运动状态或存在方式的不确定性的描述;2 2、信源空间:随机符号及其出现概率的空间;3 3、信源的分类:(1 1)连续信源离散信源混合信源;(2 2)无记忆信源有记忆信源(相关信源)有限长度记忆信源(MarkovMarkov信源)第25页/共107页(二)、信息的度量1、信息公理(1)信息由不确定性程度进行度量;确定事件的信息量为零。(2)不确定性程度越高信息量越大;(3)相互独立性与信息量可加性;独立事件的联合信息等于两个独立事件的信息总和。满足上述公理的函数为:第26页/共107页2、离散无记忆信源(DNMS)的信息量度量:(1)信源符号 的自信息量定义为:(a)非负性;(b)信息量的单位:底为2时单位为:比特(bit)底为e时单位为:奈特(Nat)底为10时单位为:哈特第27页/共107页(2)、信源平均自信息量(信息熵)离散无记忆信源A的平均自信息量(信息熵)定义为:第28页/共107页例:设8个随机变量具有同等概率为18,计算信息熵H。解:根据公式4-10可得:H=8*-1/8*(log2(1/8)=8*-1/8*(-3)=3图像熵指该图像的平均信息量,即表示图像中各个图像熵指该图像的平均信息量,即表示图像中各个灰度级比特数的统计平均值,等概率事件的熵最灰度级比特数的统计平均值,等概率事件的熵最大。大。第29页/共107页3、平均码字长借助熵的概念可以定义量度任何特定码的性能的准则,即平均码字长度。其中i为灰度级di所对应的码字长度。的单位也是比特/字符。第30页/共107页4、编码效率编码符号是在字母集合A=a1,a2,a3,am中选取的。如果编码后形成一个新的等概率的无记忆信源,字母数为n,则它的最大熵应为logn比特/符号。因此这是一个极限值。如果H(d)/=logn,则可以认为编码效率已经达到100%,如果H(d)/logn,则可认为编码效率较低。编码效率冗余度第31页/共107页根据信息熵编码理论,可以证明在 H条件下,总可以设计出某种无失真编码方法。若编码结果使 远大于H,表明这种编码效率很低,占用的比特数太多。若编码结果使 等于或接近于H,这种状态的编码方法称为最佳编码。若要求编码结果使 H,则必然丢失信息而引起图像失真。这就是在允许失真条件下的一些失真编码方法。第32页/共107页5、压缩比压缩比是衡量数据压缩程度的指标之一。目前常用的压缩比定义为 其中LB为源代码长度,Ld为压缩后代码长度,Pr为压缩比。压缩比的物理意义是被压缩掉的数据占据源数据的百分比。当压缩比Pr接近100%时压缩效果最理想。第33页/共107页6、互信息 信源编码输出为bk给出的关于ai的信息量究竟为多少呢?为此将引入另外一个信息量度互信息 对给定的两个离散信源X和Y,Y中事件bk的发生给出关于X中事件ai的互信息I(ai:bk)定义为:其中,p(ai|bk)表示信源编码输出为bk,估计信源输入为ai的条件概率。I(ai|bk)称为条件自信息量,表示在发现信源编码输出为bk,对信源输入为ai的不确定性的猜测或知道bk后ai还保留的信息量。I(ai)表示ai的不确定性。两者值差即为bk解除的ai不确定性的多少。第34页/共107页设一幅灰度级为K K的图像,图像中第k k级灰度出现的概率为p pk k,图像大小为MNMN,每个像素用d d比特表示,每两帧图像间隔t t 第35页/共107页数字图像的熵H图像的平均码字长度R为:编码效率定义为:第36页/共107页信息冗余度为:每秒钟所需的传输比特数bps为:压缩比r为:第37页/共107页图像信息源图像预处理图像信源编码信道编码调制信道传输解调信道解码图像信源解码显示图像9.9.图像的压缩模型图像的压缩模型第38页/共107页源数据编码:完成原数据的压缩。通道编码:为了抗干扰,增加一些容错、校验位,实际上是增加冗余。通 道:如InternetInternet、广播、通讯、可移动介质源数据编码通道编码通道通道解码源数据解码第39页/共107页源数据编码的模型源数据编码的模型源数据解码的模型源数据解码的模型映射器量化器符号编码器符号解码器反向映射器源数据编码与解码的模型源数据编码与解码的模型第40页/共107页映射器映射器 :减少像素冗余减少像素冗余,如使用,如使用RLERLE编码。编码。或进行图像变换或进行图像变换量化器量化器 :减少视觉心理冗余减少视觉心理冗余,仅用于有损,仅用于有损压缩压缩符号编码器:符号编码器:减少编码冗余减少编码冗余,如使用哈夫曼,如使用哈夫曼编码编码源数据编码与解码的模型源数据编码与解码的模型第41页/共107页预测编码图像编码无损压缩编码有损压缩编码哈夫曼编码行程编码算术编码 频率域方法 其他编码方法二.常用的图像压缩编码方法第42页/共107页 无损压缩算法中删除的仅仅是图像数据中冗余的信息,因此在解压缩时能精确恢复原图像,无损压缩的压缩比很少有能超过3 3:1 1的,常用于要求高的场合。1.无损压缩编码第43页/共107页有损压缩是通过牺牲图像的准确率以实现较大的压缩率,如果容许解压图像有一定的误差,则压缩率可显著提高。有损压缩在压缩比大于3030:1 1时仍然可重构图像,而如果压缩比为10:110:1到20:120:1,则重构的图像与原图几乎没有差别2.有损压缩编码第44页/共107页3.哈夫曼编码哈夫曼编码等长码:对于一个消息集合中的不同消息,用相同长度的不同码字表示,编解码简单,编码效率不高。变长码:与等长码相对应,对于一个消息集合中的不同消息,也可以用不同长度的码字表示,编码效率高,编码解码复杂。哈夫曼编码是一种利用信息符号概率分布特性的变字长的编码方法。对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码。第45页/共107页方法方法:I.I.将信源符号按出现概率从大到小排成一列,然后把最末两个符号的概率相加,合成一个概率。II.II.把这个符号的概率与其余符号的概率按从大到小排列,然后再把最末两个符号的概率加起来,合成一个概率。III.III.重复上述做法,直到最后剩下两个概率为止。IV.IV.从最后一步剩下的两个概率开始逐步向前进行编码。每步只需对两个分支各赋予一个二进制码,如对概率大的赋予码0 0,对概率小的赋予码1 1。第46页/共107页Huffman编码编码输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第47页/共107页Huffman编码编码输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第48页/共107页Huffman编码编码输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第49页/共107页Huffman编码编码输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第50页/共107页Huffman编码编码输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.4第51页/共107页Huffman编码编码输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101第52页/共107页Huffman编码编码输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S1=1第53页/共107页Huffman编码编码输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S2=00第54页/共107页Huffman编码编码输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S3=011第55页/共107页Huffman编码编码输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S4=0100第56页/共107页Huffman编码编码输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S5=01010第57页/共107页Huffman编码编码输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S6=01011第58页/共107页哈夫曼编码效率信源熵为:H=-Pilog2Pi=-(0.4log20.4+0.3log20.3+2*0.1log20.1+0.06log20.06+0.04log20.04)=2.14比特/符号第59页/共107页平均码字长度:R=iPi码字长度R=iPi=0.41+0.3 2+0.1 3+0.1 4+0.06 5+0.04 5=2.2比特/符号编码效率:=H/R(%)=H/R=2.14/2.2=0.973=97.3%第60页/共107页编码举例cbafe7/227/225/225/224/224/222/222/2201f=00 e=10 a=11 b=010 c=0110 d=0111d1/221/223/223/226/226/2222/2222/2213/2213/229/229/223/223/2201010101第61页/共107页作业:作业:1.有如下信源x,u1 u2 u3 u4 u5 u6 u7 u8 P1 P2 P3 P4 P5 P6 P7 P8其中:P10.21,P20.09,P30.11,P40.13,P50.07,P60.12,P70.08,P80.19。将该信源进行哈夫曼编码。2.设一幅灰度级为8(分别用S0、S1、S2、S3、S4、S5、S6、S7表示)的图像中,各灰度所对应的概率分别为0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04。现对其进行哈夫曼编码X第62页/共107页3.设有一信源X=x1,x2,x3,x4,对应概率P=0.5,0.1975,0.1775,0.125.进行霍夫曼编码(要求大概率的赋码字0,小概率的赋码字1),给出码字,平均码长,编码效率;对码串10101011010110110000011110011解码.第63页/共107页由于霍夫曼编码法需要多次排序,当很多时十分不便,为此费诺(Fano)和香农(Shannon)分别单独提出类似的方法,使编码更简单。具体编码方法如下:把 按概率由大到小、从上到下排成一列,然后把 分成两组 ,并使得 把两组分别按0,1赋值。然后分组、赋值,不断反复,直到每组只有一种输入为止。将每个所赋的值依次排列起来就是费诺香农编码。补充:香农费诺编码第64页/共107页以前面哈夫曼编码的例子进行香农费诺编码:输入输入概率概率x10.400 x20.31010 x30.11001100 x40.111101x50.06101110 x60.0411111第65页/共107页4.算术编码 从理论上分析,采用哈夫曼编码可以获得最佳从理论上分析,采用哈夫曼编码可以获得最佳信源字符编码效果信源字符编码效果;实际应用中,由于信源字符出现的概率并非满实际应用中,由于信源字符出现的概率并非满足足2 2的负幂次方,因此往往无法达到理论上的编的负幂次方,因此往往无法达到理论上的编码效率和信息压缩比码效率和信息压缩比;第66页/共107页以信源字符序列以信源字符序列xx,yy为例为例设字符序列设字符序列xx,yy对应的概率为对应的概率为1/31/3,2/32/3,NxNx和和NyNy分别表示字符分别表示字符x x和和y y的最佳码长,则根据的最佳码长,则根据信息论有:信息论有:第67页/共107页字符字符x x、y y的最佳码长分别为的最佳码长分别为1.58bit1.58bit和和0.588bi;0.588bi;这表明,要获得最佳编码效果,需要采用小数码这表明,要获得最佳编码效果,需要采用小数码字长度字长度,这是不可能实现的这是不可能实现的;即采用哈夫曼方法对即采用哈夫曼方法对xx,yy的码字分别为的码字分别为0 0和和1 1,也就是两个符号信息的编码长度都为也就是两个符号信息的编码长度都为1 1。对于出现。对于出现概率大的字符概率大的字符y y并未能赋予较短的码字并未能赋予较短的码字;实际编码效果往往不能达到理论效率实际编码效果往往不能达到理论效率;为提高编码效率,为提高编码效率,EliasElias等人提出了算术编码算法。等人提出了算术编码算法。第68页/共107页算术编码的特点 算术编码是信息保持型编码,它不像哈夫曼编码,算术编码是信息保持型编码,它不像哈夫曼编码,无需为一个符号设定一个码字无需为一个符号设定一个码字;算术编码分为固定方式和自适应方式两种编码算术编码分为固定方式和自适应方式两种编码;选择不同的编码方式,将直接影响到编码效率选择不同的编码方式,将直接影响到编码效率;自适应算术编码的方式,无需先定义概率模型,适自适应算术编码的方式,无需先定义概率模型,适合于无法知道信源字符概率分布的情况合于无法知道信源字符概率分布的情况;当信源字符出现的概率比较接近时,算术编码效率当信源字符出现的概率比较接近时,算术编码效率高于哈夫曼编码的效率,在图像通信中常用它来取高于哈夫曼编码的效率,在图像通信中常用它来取代哈夫曼编码代哈夫曼编码;实现算术编码算法的硬件比哈夫曼编码复杂。实现算术编码算法的硬件比哈夫曼编码复杂。第69页/共107页编码原理 算术编码方法是将被编码的信源消息表示成算术编码方法是将被编码的信源消息表示成0-10-1之之间的一个间隔,即小数区间,消息越长,编码表示间的一个间隔,即小数区间,消息越长,编码表示它的间隔就越小它的间隔就越小;以小数表示间隔,表示的间隔越小所需的二进制位以小数表示间隔,表示的间隔越小所需的二进制位数就越多,码字就越长。反之,间隔越大,编码所数就越多,码字就越长。反之,间隔越大,编码所需的二进制位数就少,码字就短。需的二进制位数就少,码字就短。算术编码将被编码的图像数据看作是由多个符号组算术编码将被编码的图像数据看作是由多个符号组成的字符序列,对该序列递归地进行算术运算后,成的字符序列,对该序列递归地进行算术运算后,成为一个二进制分数成为一个二进制分数;接收端解码过程也是算术运算,由二进制分数重建接收端解码过程也是算术运算,由二进制分数重建图像符号序列。图像符号序列。第70页/共107页编码举例 设图像信源编码可用设图像信源编码可用a a、b b、c c、d d这这4 4个符号来表示,若图像信源个符号来表示,若图像信源字符集为字符集为dacbadacba,信源字符出现的概率分别如下表所示,采用,信源字符出现的概率分别如下表所示,采用算术编码对图像字符集编码。算术编码对图像字符集编码。信源字符信源字符a ab bc cd d出现概率出现概率0.40.40.20.20.20.20.20.2第71页/共107页算术编码的基本步骤(1)(1)根据已知条件和数据可知,信源各字符在区间根据已知条件和数据可知,信源各字符在区间00,11内的子区间间隔分别如下:内的子区间间隔分别如下:a=0.0 a=0.0,0.4)b=0.4 0.4)b=0.4,0.6)0.6)c=0.6 c=0.6,0.8)d=0.8 0.8)d=0.8,1.0)1.0)(2)(2)计算中按如下公式产生新的子区间:计算中按如下公式产生新的子区间:第72页/共107页(3)(3)第第1 1个被压缩的字符为个被压缩的字符为“d d”,其初始子区,其初始子区间为间为0.8 0.8,1.0)1.0)(4)(4)第第2 2个被压缩的字符为个被压缩的字符为“a a”,由于其前面,由于其前面的字符取值区间为的字符取值区间为0.8 0.8,1.0)1.0)范围,因此,字范围,因此,字符符“a a”应在前一字符区间间隔应在前一字符区间间隔0.8 0.8,1.0)1.0)的的0.0 0.0,0.4)0.4)子区间内,根据公式子区间内,根据公式(8-15)(8-15)可得:可得:=0.8+0.0(1.0-0.8)=0.8=0.8+0.0(1.0-0.8)=0.8 =0.8+0.4(1.0-0.8)=0.88 =0.8+0.4(1.0-0.8)=0.88 第73页/共107页(5)(5)第第3 3个被压缩的字符为个被压缩的字符为“c c”,由于其前面的字符取值区间,由于其前面的字符取值区间为为0.8 0.8,0.88)0.88)范围内,因此,字符范围内,因此,字符“c c”应在前一字符区间间应在前一字符区间间隔隔0.8 0.8,0.88)0.88)的的0.6 0.6,0.8)0.8)子区间内,根据子区间内,根据(8-15)(8-15)可得:可得:=0.8+0.6(0.88-0.8)=0.848=0.8+0.6(0.88-0.8)=0.848 =0.8+0.8(0.88-0.8)=0.864 =0.8+0.8(0.88-0.8)=0.864 第74页/共107页(6)(6)第第4 4个被压缩的字符为个被压缩的字符为“b b”,由于其前面,由于其前面的字符取值区间为的字符取值区间为0.848 0.848,0.864)0.864)范围内,因范围内,因此,字符此,字符“b b”应在前一字符区间间隔应在前一字符区间间隔0.848 0.848,0.864)0.864)的的0.4 0.4,0.6)0.6)子区间内,根据子区间内,根据(8-(8-15)15)可得:可得:=0.848+0.4(0.864-=0.848+0.4(0.864-0.848)=0.8544 0.848)=0.8544 =0.848+0.6(0.864-=0.848+0.6(0.864-0.848)=0.8576 0.848)=0.8576第75页/共107页(7)(7)第第5 5个被压缩的字符为个被压缩的字符为“a a”,由于其前面,由于其前面的字符取值区间为的字符取值区间为0.8544 0.8544,0.8)0.8)范围内,因范围内,因此,字符此,字符“a a”应在前一字符区间间隔应在前一字符区间间隔0.8544 0.8544,0.8576)0.8576)的的0.0 0.0,0.4)0.4)子区间内,根据子区间内,根据(8-(8-15)15)可得:可得:=0.8544+0.0(0.8576-=0.8544+0.0(0.8576-0.8544)=0.8544 0.8544)=0.8544 =0.8544+0.4(0.8576-=0.8544+0.4(0.8576-0.86544)=0.85568 0.86544)=0.85568第76页/共107页经过上述计算,字符集经过上述计算,字符集dacbadacba被描述在实数被描述在实数0.8544 0.8544,0.85568)0.85568)子区间内,即该区间内的任一实数值都惟一对应该符子区间内,即该区间内的任一实数值都惟一对应该符号序列号序列dacbadacba;因此,可以用因此,可以用0.8544 0.8544,0.85568)0.85568)内的一个实数表示字符集内的一个实数表示字符集dacbadacba。第77页/共107页0.8544 0.8544,0.85568)0.85568)子区间的二进制表示形式子区间的二进制表示形式为:为:0.1101101010000110 0.1101101010000110,0.1101101100001101)0.1101101100001101);在该区间内的最短二进制代码为在该区间内的最短二进制代码为0.110110110.11011011,去掉小数点及其前的字符,从而得到该字符序列去掉小数点及其前的字符,从而得到该字符序列的算术编码为的算术编码为1101101111011011。算术编码可以通过硬件电路实现,在上述乘法运算术编码可以通过硬件电路实现,在上述乘法运算,可以通过右移来实现,因此在算术编码算法算,可以通过右移来实现,因此在算术编码算法中只有加法和移位运算。中只有加法和移位运算。第78页/共107页算术编码效能 根据上述运算结果,编码根据上述运算结果,编码1101101111011011惟一代表字符序列惟一代表字符序列dacbadacba,因此,平均码字长度为:因此,平均码字长度为:bit/bit/字符字符 第79页/共107页 题 己知信源 X=试对 1011 进行算术编码。0 11/4 3/4 解 (1)对二进制信源只有两个符号“0”和“1”,设置小概率Qe=1/4,大概率 Pe =1 Qe=3/4.(2)设 C 为子区间的左端起始位置,A 为子区间的宽度,符号“0”的子区间为0,1/4),符号“1”的子区间为1/4,1)第80页/共107页(3)初始子区间为0,1),C=0,A=1,子区间按以下各步依次缩小:步序 符号 C A1 1 0+1*1/4=1/4 1*3/4=3/4 2 0 1/4 3/4*1/4=3/163 1 1/4+3/16*1/4=19/64 3/16*3/4=9/644 1 19/64+9/64*1/4=85/256 9/64*3/4=27/25601/4119/6485/25610117/16112/256第81页/共107页最后的子区间左端(起始位置)C=(85/256)d =(0.01010101)b最后的子区间右端(终止位置)C+A=(112/256)d=(0.01110000)b 编码结果为子区间头、尾之间取值,其值为0.011,可编码为011,原来4个符号1011现被压缩为三个符号011。第82页/共107页5.行程编码行程编码RLE RLE 编码编码Run Length EncodingRun Length Encoding概念:概念:行程:具有相同灰度值的像素序列。行程:具有相同灰度值的像素序列。编码思想:编码思想:去除像素冗余。去除像素冗余。用行程的灰度和行程的长度代替行程本身。用行程的灰度和行程的长度代替行程本身。例:设重复次数为例:设重复次数为 iC,iC,重复像素值为重复像素值为 iPiP编码为编码为:iCiP iCiP iCiPiCiP iCiP iCiP 编码前编码前:aaaaaaaaaaaaaabbbbbbbbbbbbcccccccccccccccc 编码后编码后:7 7a a6 6b b8 8c c第83页/共107页q由于一幅图像中有许多颜色相同的图块,用一整数对存储一由于一幅图像中有许多颜色相同的图块,用一整数对存储一个像素的颜色值及相同颜色像素的数目(长度)。例如:个像素的颜色值及相同颜色像素的数目(长度)。例如:(G,L)长度颜色值编码时采用从左到右,从上到下的排列,每当遇到一串相同数据时就用该数据及重复次数代替原来的数据串。000000003333333333222222222226666666111111111111111111111111555555555555888888888888888888555555555555553333222222222222222222(0,8)(3,10)(2,11)(6,7)(1,18)(1,6)(5,12)(8,18)(5,14)(3,4)(2,18)18*7的像素颜色仅用11对数据游程长度编码RLE(RunLengthEncoding):第84页/共107页分析:分析:对于有大面积色块的图像,压缩效果很好对于有大面积色块的图像,压缩效果很好直观,经济直观,经济,是一种无损压缩是一种无损压缩对对于于纷纷杂杂的的图图像像,压压缩缩效效果果不不好好,最最坏坏情情况下,会加倍图像况下,会加倍图像RLE编码RunLengthEncoding第85页/共107页适合行程编码的图第86页/共107页第87页/共107页第88页/共107页适合行程编码的图第89页/共107页图像标准的制定:图像标准的制定:ISOISO和和CCITTCCITT(国际电报电话咨询委员会)联合制定(国际电报电话咨询委员会)联合制定标准的类型:标准的类型:连续图像压缩标准:连续图像压缩标准:静静止止帧帧黑黑白白、彩彩色色压压缩缩:(1)(1)面面向向静静止止的的单单幅幅图图像像JPEGJPEG连连续续帧帧黑黑白白、彩彩色色压压缩缩:(2)(2)面面向向连连续续的的视视频频影影像像MPEGMPEG 四四.静止图像压缩编码标准静止图像压缩编码标准JPEG第90页/共107页JPEG标准简述JPEG压缩流程JPEG压缩算法的实现JPEG压缩举例o 静止图像压缩编码标准静止图像压缩编码标准JPEG第91页/共107页 JPEG JPEG标准简述标准简述 由由ISO/IECISO/IEC与与CCITTCCITT联合发起的联合图像专家组,联合发起的联合图像专家组,在过去十几年图像编码研究成果的基础上于在过去十几年图像编码研究成果的基础上于2020世纪世纪9090年代初制定了静止图像年代初制定了静止图像(包括包括8bit/8bit/像素的灰度图像素的灰度图像与像与24bit/24bit/像素的彩色图像像素的彩色图像)的编码标准。的编码标准。JPEGJPEG标准在较低的计算复杂度下,能提供较高标准在较低的计算复杂度下,能提供较高的压缩比与保真度。在视觉效果不受到严重损失的的压缩比与保真度。在视觉效果不受到严重损失的前提下,算法可以达到前提下,算法可以达到1515到到2020的压缩比。如果在图的压缩比。如果在图像质量上稍微牺牲一点的话,可以达到像质量上稍微牺牲一点的话,可以达到40:140:1或更高或更高的压缩比。的压缩比。第92页/共107页 JPEGJPEG定定义义了了一一个个基基本本系系统统,一一个个符符合合JPEGJPEG标标准准的的编编解解码码器器至至少少要要满满足足基基本本系系统统的的技技术术指指标标。JPEGJPEG基基本本系系统统其其核核心心属属于于变变换换编编码码。JPFGJPFG编编码码时时,对对原原始始图图像像的的每每一一个个分分量量首首先先分分割割成成互互不不重重叠叠的的8888像像素素块块,然然后后对对每每个个像素块的编码过程可分为二维像素块的编码过程可分为二维DCTDCT变换。变换。根根据据图图像像信信号号的的特特点点,对对图图像像块块进进行行二二维维DCTD