数字图像处理与图像通信 第9章 图像的统计特性与压缩编码.ppt
《数字图像处理与图像通信 第9章 图像的统计特性与压缩编码.ppt》由会员分享,可在线阅读,更多相关《数字图像处理与图像通信 第9章 图像的统计特性与压缩编码.ppt(84页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数字图像处理与图像通信数字图像处理与图像通信朱秀昌朱秀昌 1v9.1 9.1 图像的统计特性图像的统计特性v9.2 9.2 压缩编码原理压缩编码原理v9.3 9.3 预测编码和变换编码预测编码和变换编码v9.4 9.4 量化量化第第9 9章章 图像的统计特性与压缩编码图像的统计特性与压缩编码2 图像的统计特性定义图像的统计特性定义 图像的统计特性是指图像信号(亮度、色度或其抽样值等)本身,图像的统计特性是指图像信号(亮度、色度或其抽样值等)本身,或对它们进行某种方式的处理以后的输出值的随机统计特性。或对它们进行某种方式的处理以后的输出值的随机统计特性。图像的统计特性图像的统计特性时间域统计特性
2、时间域统计特性变换域统计特性变换域统计特性9.1 9.1 图像的统计特性图像的统计特性3v 9.1.1 9.1.1 图像的信息熵图像的信息熵几个基本概念:几个基本概念:自信息量:自信息量:设信源设信源X X可发出的消息符号集合为可发出的消息符号集合为 ,设设X X发出发出 的概率为的概率为,则符号,则符号 出现的自信息量定义为:出现的自信息量定义为:4一阶熵一阶熵(熵)(熵):(bit/(bit/符号符号)无无记忆记忆信源:信源:各个符号各个符号的出的出现现是独立的。是独立的。有记忆信源:有记忆信源:一个符号出现的概率与其它符号出现的概率相关。一个符号出现的概率与其它符号出现的概率相关。N阶阶
3、Markov过程:过程:信源发出一个符号的概率只和它前面相继发出的信源发出一个符号的概率只和它前面相继发出的N个符号相关,个符号相关,而与再前面的第而与再前面的第N+1,N+2等符号独立无关。等符号独立无关。平均信息量:平均信息量:对信源对信源X的各符号自信息量取统计平均。的各符号自信息量取统计平均。5由上述概念,引出由上述概念,引出图像信息熵图像信息熵:图像信息熵的单位:图像信息熵的单位:当当Pi表示表示m 种图像中的某一图像出现的概率时,种图像中的某一图像出现的概率时,H(X)单位是单位是 bit/每幅图像每幅图像。当当Pi为各抽样值出现的概率,为各抽样值出现的概率,H(X)单位为单位为
4、bit/像素像素。61.1.当当 Pi表示表示m 种图像中的某一图像出现的概率,种图像中的某一图像出现的概率,H(X)单位是单位是bit/每幅图像。每幅图像。图像熵公式表明:图像熵公式表明:当以图像为基本符号单位时,意味着每幅图像的内容当以图像为基本符号单位时,意味着每幅图像的内容“本身本身”对信对信息的接收者而言是确定的。息的接收者而言是确定的。所需消除的不确定性只是当前显示的图像是图像集中的哪一幅。所需消除的不确定性只是当前显示的图像是图像集中的哪一幅。举例:举例:从一幅扑克牌中抽出一张纸牌,每一张牌的图案是确定的,从一幅扑克牌中抽出一张纸牌,每一张牌的图案是确定的,这时,要消除的不确定性
5、只是牌的面值。这时,要消除的不确定性只是牌的面值。72.当当Pi为各抽样值出现的概率,为各抽样值出现的概率,H(X)单位为单位为bit/像素像素 图像熵是图像压缩编码中的一个重要指标,图像熵是图像压缩编码中的一个重要指标,表示把图像信源作为无记忆时所需的数码率下界。表示把图像信源作为无记忆时所需的数码率下界。具有实际通信意义的图像(而不是具有实际通信意义的图像(而不是“雪花状雪花状”噪声组成的图像),噪声组成的图像),其相邻的像素之间总有一定的联系,其相邻的像素之间总有一定的联系,或者说,图像信息源是一种或者说,图像信息源是一种“有记忆有记忆”的信源。的信源。对于这样的信源,就对于这样的信源,
6、就不能不能把一阶熵作为编码的数码率下界。把一阶熵作为编码的数码率下界。8此时考虑方法如下:当此时考虑方法如下:当N个符号有关联性时,则把这个符号有关联性时,则把这N个符号个符号序列序列当作一个新符号当作一个新符号 。此时:。此时:单位:单位:bit/bit/新符号新符号 其中,其中,m是不同的是不同的N个符合的序列的总个符合的序列的总数,即新符合总数。数,即新符合总数。当用当用N 除除上述熵上述熵值时,即值时,即 它可以作为每个符号的平均熵值,它可以作为每个符号的平均熵值,单位单位 bit/bit/符号符号 或或 bit/bit/像像素素。9l数学期望数学期望(均值均值)l归一化自相关系数归一
7、化自相关系数v 9.1.2 9.1.2 图像自相关函数图像自相关函数NN 的图像两点的图像两点 和和10l亮度平均值亮度平均值ml图像方差图像方差D(X)l标准差标准差=均方差均方差=l均方值均方值=特别,当两个像素在同一行时,即特别,当两个像素在同一行时,即 ,则一维自相关系数可表示为:则一维自相关系数可表示为:11n一维自相关系数分布曲线一维自相关系数分布曲线5 10 15 20 255 10 15 20 25 1.01.00.80.80.60.60.40.40.20.20.00.0 图图 9.1 9.1 一维自相关系数分布曲线一维自相关系数分布曲线图像一维自相关系数可用如下数学模型近似表
8、示:图像一维自相关系数可用如下数学模型近似表示:w取值在取值在0.90.90.980.98w 二维自相关模型及意义与一维类似。二维自相关模型及意义与一维类似。12 v 9.1.3 9.1.3 图像差值信号的统计特性图像差值信号的统计特性 1.1.帧内统计特性帧内统计特性:对一幅(帧)图像内部像素进行的统计特性分析。对一幅(帧)图像内部像素进行的统计特性分析。2.2.帧间统计特性:帧间统计特性:对帧间对应位置上像素进行的统计分析。对帧间对应位置上像素进行的统计分析。13 ,求同一列求同一列1.1.帧内统计特性:帧内统计特性:相相邻邻像素的差像素的差值值指同一行相指同一行相邻邻两像素两像素和和相相
9、邻邻两像素两像素和和的差的差值值:水平方向水平方向(同一行同一行)垂直方向垂直方向(同一列同一列)w 由统计,可得这些差值分布集中在零附近。由统计,可得这些差值分布集中在零附近。w 原因:相邻像素有较强的相关性。原因:相邻像素有较强的相关性。142.2.帧间统计特性帧间统计特性 帧间差定义:帧间差定义:k帧帧t(i,j)(i,j)k-1帧帧图图 9.49.4帧间差位置示意帧间差位置示意 帧帧 差差 域域 值值 1 1 2 2 3 3 5 5 7 7 1010 占占该帧该帧像素像素(%(%)61.661.6 41.741.7 27.927.9 12.012.0 4.44.4 0.830.83 表
10、表9.19.1 帧间差值超过指定阈值的像素占图像像素总数的百分比帧间差值超过指定阈值的像素占图像像素总数的百分比 w 由统计,可得帧间差变化也很小。由统计,可得帧间差变化也很小。w 原因:相邻帧图像有较强的相关性。原因:相邻帧图像有较强的相关性。15v 9.1.4 9.1.4 频率域上的统计特性频率域上的统计特性 由图由图9.59.5可得结论:电视信号的绝大部分能量集中于直流和低频部分。可得结论:电视信号的绝大部分能量集中于直流和低频部分。进进而推断出:对大多数图像,其能量主要成分集中在频率域的低频部分。而推断出:对大多数图像,其能量主要成分集中在频率域的低频部分。0.01 0.1 1 10
11、0.01 0.1 1 10 频率(频率(MHzMHz)0 0-10-10-20-20-30-30-40-40-50-50-60-60相对功率相对功率 (dB)图图 9.59.5电视信号的一维频谱特性电视信号的一维频谱特性169.2 9.2 压缩编码原理压缩编码原理 v 9.2.1 9.2.1 无失真编码无失真编码1 1)基本概念:)基本概念:唯一可译编码(单义可译编码)唯一可译编码(单义可译编码)非续长代码非续长代码 一般情况下,码可分为两类:一般情况下,码可分为两类:定长码定长码,码中所有码字长度相同,如表,码中所有码字长度相同,如表1中的码中的码1。变长码,变长码,码中的码字长短不一,如表
12、码中的码字长短不一,如表1中的码中的码2。信源符号信源符号Si出出现现概率概率p(Si)码码1码码2S1P(S1)000S2P(S2)0101S3P(S3)10001S4P(S4)11111表表1 1 定长码和变长码定长码和变长码17符号符号概率概率码码1码码2码码3码码4S11/20011S21/411101001S31/80000100001S41/8110110000001表表2 2 奇异码和非奇异码奇异码和非奇异码 18 奇异码和非奇异码:奇异码和非奇异码:p 若信源符号与码字一一对应,则为非奇异码,若信源符号与码字一一对应,则为非奇异码,如表如表2 2中的码中的码2 2;p 若信源符
13、号与码字不是一一对应,则为奇异码若信源符号与码字不是一一对应,则为奇异码,如表,如表2 2中的码中的码1 1。唯一可译码:只能唯一的分割成一个个码字,其他分割法会产生一唯一可译码:只能唯一的分割成一个个码字,其他分割法会产生一 些非定义码字。些非定义码字。如如00,1010,1111是唯一可译码,对于是唯一可译码,对于100111000100111000,只能,只能分割分割为为1010,0 0,1111,1010,0 0,0 0。奇异码不是唯一可译码,而非奇异码有非唯奇异码不是唯一可译码,而非奇异码有非唯一可译码和唯一可译码。一可译码和唯一可译码。19 唯一可译码分为:唯一可译码分为:非即时码
14、和即时码非即时码和即时码。如果收端收到一个完整的码字后,不能立即译码,还需等下一个如果收端收到一个完整的码字后,不能立即译码,还需等下一个码字开始接收才能判断是否译码,称为非即时码(码码字开始接收才能判断是否译码,称为非即时码(码3 3),否则为即),否则为即时码(也称为非续长码)。如码时码(也称为非续长码)。如码4 4。单义码不一定是非续长代码,如单义码不一定是非续长代码,如00,0101,011011,111111 注意:注意:非续长代码一定是单义码;非续长代码一定是单义码;202 2)huffmanhuffman编码编码 等长编码(均匀编码):等长编码(均匀编码):每个值以相同长度的二进
15、制码表示。每个值以相同长度的二进制码表示。变长编码:变长编码:概率高的符号分配较短码字,概率低的符号分配较长的码字。概率高的符号分配较短码字,概率低的符号分配较长的码字。变长编码变长编码信息保持型编码(熵编码),信息保持型编码(熵编码),编解码过程中并不引入信息量的损失。编解码过程中并不引入信息量的损失。注:注:huffmanhuffman编码编码结果不唯一,但平均字长一样。结果不唯一,但平均字长一样。21n哈夫曼编码结果:哈夫曼编码结果:非续长;非续长;唯一可译;唯一可译;0 0,1 1任意赋;任意赋;结果不唯一;结果不唯一;平均码长一样;平均码长一样;码长方差(码长变化幅度)不同,其值越小
16、越好。码长方差(码长变化幅度)不同,其值越小越好。22 (其中码长方差其中码长方差Var=)为保证码长的方差小,在遇到概率相等时,把后面求和得到的概为保证码长的方差小,在遇到概率相等时,把后面求和得到的概率放在概率相等的消息之前(或之上)。率放在概率相等的消息之前(或之上)。233)算术编码算术编码引入算术编码原因:引入算术编码原因:p 理论上:哈夫曼方法对信源数据编码可以获得最佳编码效果。理论上:哈夫曼方法对信源数据编码可以获得最佳编码效果。p 实际上:由于在计算机中存储和处理的最小数据单位是实际上:由于在计算机中存储和处理的最小数据单位是“比特比特”,因此在某种情况下,实际压缩编码效果往往
17、达不到理论压缩比。因此在某种情况下,实际压缩编码效果往往达不到理论压缩比。如信源符号如信源符号x,y,其对应概率为其对应概率为2/3,1/3,则根据理论计算,则根据理论计算,符号符号x、y的最佳码长分别为:的最佳码长分别为:x:-log2(2/3)比特比特=0.588 比特比特y:-log2(1/3)比特比特=1.58 比特比特 24这表明:这表明:要获得最佳效果,符号要获得最佳效果,符号x,y的码字长度应分别为的码字长度应分别为0.588、1.58位。位。计算机不可能有非整数位出现,只能按整数位进行,即采用哈夫曼方法计算机不可能有非整数位出现,只能按整数位进行,即采用哈夫曼方法对对x,y编码
18、,得到编码,得到x,y的码字分别为的码字分别为0和和1,也就是两个符号信息的编,也就是两个符号信息的编码长度都为码长度都为1。可见,对于出现概率大的符号可见,对于出现概率大的符号x并未能赋予较短的码字。这就是实际的并未能赋予较短的码字。这就是实际的编码效果往往不能达到理论编码的原因之一。编码效果往往不能达到理论编码的原因之一。为了解决计算机中必须以整数位进行编码的问题,人们提出了算术编为了解决计算机中必须以整数位进行编码的问题,人们提出了算术编码方法。码方法。25算术编码的特点算术编码的特点算术编码是信息保持型编码;算术编码是信息保持型编码;无需为一个符号设定一个码字;无需为一个符号设定一个码
19、字;算术编码有固定方式的编码,也有自适应方式的编码;算术编码有固定方式的编码,也有自适应方式的编码;在信源符号概率比较接近时,算术编码比哈夫曼编码效率要高;在信源符号概率比较接近时,算术编码比哈夫曼编码效率要高;算术编码的算法或硬件实现要比哈夫曼编码复杂。算术编码的算法或硬件实现要比哈夫曼编码复杂。26编码过程编码过程将被编码的信源消息表示成实数轴上将被编码的信源消息表示成实数轴上0 01 1之间之间的一个间隔。的一个间隔。消息越长,编码表示它的间隔就越小,表示这一间隔所需二进制位数消息越长,编码表示它的间隔就越小,表示这一间隔所需二进制位数就越多,码字越长。反之,编码所需的二进制位数就少,码
20、字就短。就越多,码字越长。反之,编码所需的二进制位数就少,码字就短。信源中连续符号根据某一模式生成概率的大小来缩小间隔,可能出现信源中连续符号根据某一模式生成概率的大小来缩小间隔,可能出现的符号要比不太可能出现的符号缩小范围少,只增加了较少的比特。的符号要比不太可能出现的符号缩小范围少,只增加了较少的比特。27 编码端:编码端:将待编码的图像数据看作是由多个符号组成的序列。将待编码的图像数据看作是由多个符号组成的序列。接受端:接受端:由二进制分数重建图像符号序列。由二进制分数重建图像符号序列。dcba (0/8)(1/8)(3/8)(7/8)(8/8)0 0.001 0.011 0.111 1
21、(a)单位区间上的码点单位区间上的码点(b)(b)符号序列符号序列“aabaab”算术码的子分过程算术码的子分过程 图图9.10 9.10 算术编码的子分过程算术编码的子分过程dcba ba d cbab28信源编码符号集的所有符号的概率之和组成了一个完整的概率空信源编码符号集的所有符号的概率之和组成了一个完整的概率空间,用单位长度的矩形表示。间,用单位长度的矩形表示。在此长度为在此长度为1 1的单位矩形中,各个符号依次排列,所占宽度和它的的单位矩形中,各个符号依次排列,所占宽度和它的概率大小成正比。概率大小成正比。各个符号的左边的分界线称之为各个符号的左边的分界线称之为“码点码点”,每个码点
22、有其相应的,每个码点有其相应的码点值。码点值。每个码点值是它前面所出现符号的概率之和。每个码点值是它前面所出现符号的概率之和。29 算术编码的过程实质上是对此单位区间的算术编码的过程实质上是对此单位区间的“子分子分”的过程。的过程。设想有一个编码设想有一个编码“指针指针”,随着所编码字的进行,指针就不停地在,随着所编码字的进行,指针就不停地在 对单位区间进行划分。对单位区间进行划分。对对“a a b c a a b c”进行算术编码,其过程如下:进行算术编码,其过程如下:l 1)1)编码前,指针指向码点编码前,指针指向码点“0 0”,指针活动宽度为,指针活动宽度为“1 1”。l 2)2)编码编
23、码“a a”:指针指向新码点:指针指向新码点:0+10+10.011=0.0110.011=0.011;指针有效活动宽度为:指针有效活动宽度为:1 10.1=0.10.1=0.1。30l3)3)编码编码“a a”:指针指向新码点:指针指向新码点:0.011+0.10.011+0.10.011=0.10010.011=0.1001;指针有效活动宽度为:指针有效活动宽度为:0.10.10.1=0.010.1=0.01。l4)4)编码编码“b b”:指针指向新码点:指针指向新码点:0.1001+0.010.1001+0.010.001=0.100110.001=0.10011;指针有效活动宽度为:指
24、针有效活动宽度为:0.010.010.01=0.00010.01=0.0001。31l5)5)编码编码“c c”:指针指向新码点:指针指向新码点:0.10011+0.00010.10011+0.00010.111+0.10100110.111+0.1010011;指针有效活动宽度为:指针有效活动宽度为:0.00010.00010.001=0.00000010.001=0.0000001。l编码结果:编码结果:“10100111010011”。l算法编码名称由来:上述的运算中,尽管含有乘法运算,但它可以用算法编码名称由来:上述的运算中,尽管含有乘法运算,但它可以用右移来实现,因此在算法中只有加法
25、和移位运算。右移来实现,因此在算法中只有加法和移位运算。32 解码过程解码过程 下面以下面以“0.10100110.1010011”的解码过程为例来说明。的解码过程为例来说明。1)1)解码解码“a a”:由于由于0.0110.10100110.1110.0110.10100110.111,解得第一个码字为,解得第一个码字为“a a”。2)2)解码第二个解码第二个“a a”:由码字序列值(由码字序列值(0.10100110.1010011)减去前码点值()减去前码点值(0.0110.011)得:)得:0.1010011-0.011=0.01000110.1010011-0.011=0.01000
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像处理与图像通信 第9章 图像的统计特性与压缩编码 数字图像 处理 图像 通信 统计 特性 压缩 编码
限制150内