数字图像处理与图像通信 Part3.3.ppt
《数字图像处理与图像通信 Part3.3.ppt》由会员分享,可在线阅读,更多相关《数字图像处理与图像通信 Part3.3.ppt(132页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2.主观准则下的量化器设计主观准则下的量化器设计 依据主观评价准则来进行最佳量化器的设计。其基本原理是根据人眼的视觉掩盖特性,对视觉敏感区域细划分,而对不敏感区域粗划分,并且使量化误差总低于人的视觉可见度阈值,这样设计的量化器,量化误差尽管较大也不易察觉,可以达到在最小量化分层的条件下最佳的主观特性质量。在进行主观准则下最佳量化器的设计时,第一步就是通过实验测量确定预测误差与可见度阈值的关系曲线。图9.18中的上下两个座标中的曲线都是一条实测出来的可见度阈值函数曲线,这条曲线的意义是:某个像素的量化误差,若被同一像素位置的图像信号的预测误差的绝对值所掩盖(观察不出)时,其数值的上限等于可见度阈
2、值。这条实验曲线的趋势表明,当预测误差的绝对值增大时,主观视觉尚觉察不出的量化误差绝对值也随着增大。BUPT Press图9.18 主观准则下最佳量化器的设计 BUPT Press 有了可见度阈值曲线后,就可以用图解的方法来确 定最佳量化器的各量化电 平和判决电平。图9.18(a)所示量化分层总数K为奇数 时的设计方法;图9.18(b)为 K为偶数的情况。图9.19是 两种实际二维预测方案的 可见度阈值曲线。图9.19 两种二维预测方案的可见度阈值曲线 BUPT Press3.DPCM系统的量化信噪比系统的量化信噪比 DPCM系统的量化信噪比为:对于电视信号:这就是DPCM应用于电视信号时的量
3、化信噪比公式。从该式中可以看出,数字视频信号的精度,直接决定了信噪比的大小,每增加1比特精度,信噪比就大约增加6 dB。BUPT Press9.4.2 矢量量化矢量量化1.矢量量化的基本原理矢量量化的基本原理 矢量量化(VQ)就是把图像的样值每n个作为一组,这n个样值可以看成一个n维空间。任何一组的n个样值都可以看成n维空间的一个点,或者说是n维空间的矢量。矢量量化的过程如图9.20所示,可以分为量化和反量化两部分。图9.20 矢量量化过程示意图 BUPT Press2.码书的设计码书的设计 矢量量化中的一个关键问题就是码书的设计。码书的设计越适合待编码的图像的类型,矢量量化器的性能就越好。码
4、书是所有的输出码矢量的集合,设计码书就是在给定训练矢量集的基础上对矢量空间进行划分,并确定所有的码矢量,以使量化误差为最小。码书设计常用的算法是LGB (Linde-Guzo-Bray)算法,LGB算 法只能保证所设计出的码书是局部 最优的,但通常存在多个局部最优 点,有一些局部最优点的性能并不 好。因此,初始码书的选择非常重 要,好的初始码书通常能导致高性 能的矢量量化器。图9.21 二维矢量空间的划分 BUPT Press3.量化性能量化性能 矢量量化输出比特率的计算。设码书共有C 输出码字,矢量量化器输出为1,2,C序号,只需 个比特。输入矢量为n个(n 维),那么,每个抽样的输入所需的
5、比特数为 在满足一定失真条件下选定了量化级C 后,由上式可以看出,矢量量化可以减少所需的比特数。BUPT Press9.4.3 量化压缩机理量化压缩机理 当使用量化器来进行数据压缩时,不管是使用标量量化器还是矢量量化器,都可以把整个量化分别看成量化和反量化两个过程,由下式表示:量化实现数据压缩的根本原因在于传输中是以区间标号来取代原来的量值,而量化区间总数远远少于原量值的总数,由此就能用较少的比特将它们传输出去。量化过程是一个不可逆过程,用量化的方法来进行压缩编码是一种非信息保持型编码。在大部分应用场合,为了简化硬件或软件实现的复杂性,对量化区间标号(量化值)的编码仅采用简单的等长编码方法。在
6、一些要求较高的场合,也可采用可变字长编码来进一步改善编码效率,例如采用哈夫曼编码或算术编码等方法。BUPT Press10 静止图像编码静止图像编码10.1 方块编码方块编码(BTC)10.2 比特面编码比特面编码10.3 JPEG标准与标准与JPEG200010.4 二值图像编码方法简介二值图像编码方法简介 BUPT Press 静止图像是指从显示屏上观察到的内容不变的图像。从被摄对象来看,静止图像包括内容本身是静止的图像以及活动场景的某一时刻的“凝固”图像。如果从编码的角度来看,静止图像编码是指对单幅图像的编码。对于静止图像编码的要求主要有以下几点:(1)清晰度(2)逐渐浮现的显示方式(3
7、)抗干扰。静止图像编码传输系统一般的结构如图10.1所示。图10.1 静止图像数字传输系统一般的结构 BUPT Press10.1 方块编码方块编码(BTC)方块截断编码或简称为方块编码(Block Truncation Coding,简称 BTC)是把一幅图像分为大小为NN 的子像块(简称子块),由于小块内各相邻像素间具有亮度互相近似的相关性,于是只选用两个适当的亮度来近似代表小块内各像素原来的亮度,然后指明子块内的各像素分别属于哪个亮度。1.基本编码方法基本编码方法 设图像中的一个子块的大小为mNN个像素,子块中第i个像素为 ,其亮度值为 ,方块的两个代表性亮度为 ,称之为亮度级分量,用一
8、个二元码 指明像素 编码后属于 或 ,称为分辨力分量。设方块内的亮度阈值为 ,像素 编码后的电平值为 ,则基本编码方法可用下式表示:BUPT Press2.参数的选择参数的选择 m一定时,编码参数 及 的选择对恢复图像的质量有很大的影响。下面是两种较为典型的方式。(1)保持一阶矩、二阶矩的参数选择(方案1)取阈值 ,并记:,它为编码后亮度为 的像素 的个数。编码策略是保持子块的一阶矩和二阶矩不变,即:解此方程组可得:BUPT Press (2)均方误差最小的参数选择(方案2)取 ,编码策略是使均方误差最小,即:同样,记 ,则有 令 ,可以得出 BUPT Press3.进一步降低数码率的方法进一
9、步降低数码率的方法(1)选择合适的传输用的量度级分量,通过成组编码的方式降低其传输码率 对于方案1,可以用 和 取代 进行传输,收端则同样可以恢复编码图像。对于方案2,采用 或 作为传输亮度级,则根据下式同样可以恢复编码图像。即图10.2 两种不同参数组合的分布 BUPT Press(2)通过比特面的再划分,降低传输数码率图10.3 比特面的划分与编码 BUPT Press10.2 比特面编码比特面编码 比特面编码(Bit Plane Coding)是一种非常简单的编码方法,它把灰度图像的编码转换为对各比特面的二值编码。1.次最佳方块编码次最佳方块编码 次最佳方块编码方案如下:全“0”子块:码
10、字为“0”全“1”子块:码字为“11”其它情况:码字为“10”“xxxx”“xxxx”为将子块的比特内容直接输出,故又称为直接编码。这种编码方案的平均码长L:BUPT Press2.用格雷码表示像素亮度用格雷码表示像素亮度 由于格雷码的特点是码距为1,使得比特面上取值相同的面积增大,即P(0;n,m)和P(1;n,m)增大,因而增大了压缩比。3.视觉心理编码视觉心理编码 采用视觉心理编码是指,允许恢复图像有一定的失真,只要视觉感觉不出,或可以容忍。4.方块尺寸的选择方块尺寸的选择 在压缩比 的表示式中,它与 n,m的关系是复杂的。实验表明,取n=m=4较为合适。5.逐渐浮现的编码传输逐渐浮现的
11、编码传输 将图像从最高位到最低位的次序依次传送比特面,接收端将各比特面累加可以得到由粗到细的显示图像,这种编码传输方式是一种简单的逐渐浮现编码方式。如果对每一个比特面采用前述的比特面编码方法,还可以提高传输速率。BUPT Press10.3 JPEG标准与标准与JPEG200010.3.1 JPEG基本系统基本系统 JPEG是ISO/IEC和ITU-T的联合图片专家小组(Joint Photographic Experts Group)的缩称。JPEG以ADCT为基础,于 1990年3月提出一个建议标准草案,并于1991年3月正式通过,成为ISO/IEC 10918号标准,现常称为JPEG 建
12、议。图 10.4为 JPEG 基本系统的编码器的结构框图。图10.4 JPEG基本系统的编码器的结构框图 BUPT Press10.3.2 JPEG2000标准标准 JPEG2000是JPEG工作组制定的最新的静止图像压缩编码的国际标准,标准号为ISO/IEC 15444(ITUT T.800),并于2000年底陆续公布。JPEG2000主要由6个部分组成,其中,第一部分为编码的核心部分,第二至第六部分包括编码扩展(第二部分),Motion JPEG2000(MJP2,第三部分),一致性测试(第四部分),参考软件(第五部分),混合图像文件格式(第六部分)。图10.5是JPEG2000的基本模块
13、组成,其中包括预处理、DWT、量化、自适应算术编码以及码流组织等5个模块。图10.5 JPEG2000基本编码模块组成 BUPT Press1.输入输入 输入图像可以包含多个分量。通常的彩色图像包含3个分量(RGB或Y、Cb、Cr),但为了适应多谱图像的压缩,JPEG2000允许一个输入图像最高有16384个分量。每个分量的采样值可以是无符号数或有符号数,比特深度为138。每个分量的分辨率、采样值符号以及比特深度可以不同。2.处理处理 在预处理中,首先是把图像分成大小相同、互不重叠的矩形叠块(tile)。第二步是对每个分量进行采样值的位移,使值的范围关于0电平对称。第三步是进行采样点分量间的变
14、换,以便除去彩色分量之间的相关性,要求是分量的尺寸、比特深度相同。JPEG2000的第一部分中有两种变换可供选择:一种是不可逆彩色变换ICT,另一种是可逆彩色变换RCT。BUPT Press3.离散小波变换离散小波变换DWT 在JPEG基本系统中使用的基于子块的DCT被全帧DWT取代。如果图像被分为小的叠块,则是对各叠块进行DWT。图10.6为一维双子带DWT 分析综合滤波器组框图。图10.6 一维双子带小波分析和综合滤波器组 BUPT Press 对图像进行二维DWT是用一维DWT以可分离的方式进行的,每一次分解中先用一维分析滤波器组对图像进行水平(行)方向的滤波,然后对得到的每个输出再用同
15、样的滤波器组进行垂直(列)方向的滤波。图10.7是3次小波分解后的子带标记。图10.7 二维3次小波分解 BUPT Press4.量化量化 JPEG2000第一部分采用中央有“死区”的均匀量化器,其区间宽度是量化步长的两倍。将子带b的小波系数量化为量化系数:量化步长表示为5.熵编码熵编码 为了达到抗干扰和任意水平的逐渐显示,JPEG2000对小波变换系数的量化值按不同的子带分别进行编码。它把子带分成小的矩形块编码块(Codeblock),每个编码块单独进行编码。编码块的大小由编码器设定,它必须是2的整数幂,高不小于4,总数不大于4096。BUPT Press10.4 二值图像编码方法简介二值图
16、像编码方法简介 二值图像是一类非常特殊的图像,它只有两个灰度等级,一般取为“黑”、“白”两个亮度值。所以采集时每像素用一个比特表示,用“1”代表“黑”,“0”代表“白”,通常称之为直接编码。二值图像的质量一般用分辨率来表示,它是单位长度所包含的像素数。二值图像传输的最典型的应用场合是传真,因此,二值图像往往指的是传真中的二值文件图像。10.4.1 二值图像的方块编码二值图像的方块编码 WBS 的具体方法是:对全为白的子块用 1比特码字“0”表示,这是因为它出现的概率大,因而分配最短的码字;对至少有一个黑色像素块用N+1比特的码字表示,其中的第 1 个比特为前缀码“1”,其余N个比特采用直接编码
17、(白为0,黑为1)。可见,WBS是一种双字长编码,当然也是非续长码。BUPT Press10.4.2 游程长度编码游程长度编码RLC 在传真的二值图像中,每一扫描行总是由若干段连着的黑像素和连着的白像素组成,它们分别称为“黑游程”和“白游程”,且是交替出现的。如果对于不同的游程长度根据其概率分布分配相应的码字,可以得到较好的压缩,这种方法称为游程长度编码。游程长度编码的信息符号集由长度为 1,2,N 等各种游程长度组成。这里N是一条扫描线上的像素总数。如果不区分黑、白游长进行统一游长编码,并设 其长度为i的游长的概率,则游长的熵H和平均游长L分别为:于是游程长度的符号熵(即平均每个像素的熵)为
18、:BUPT Press10.4.3 JBIG标准标准 JBIG是ISO/IEC和ITU-T的联合二值图像专家组(Joint Bilevel Image expert Group)于1993年制定的二值图像压缩编码的国际标准,其国际标准号为ISO/IEC 11544,也是ITU-T T.82建议。从技术上来看,JBIG具有以下几方面特征:(1)高压缩性能 (2)逐渐显示编码模式 (3)适应灰度和彩色图像的无失真编码1.编码模式编码模式 JBIG标准定义了3种编码模式:渐进的编码模式(Progressive coding),兼容的渐进顺序编码模式(Compatible progressive se
19、quential coding),单层编码模式(Single layer coding)。BUPT Press2.编解码基本原理框图编解码基本原理框图 图10.11(a)是JBIG编码功能模块图,它是由D个差分层编码器和一个底层编码器组成的。其中 表示第D层图像数据,表示第D层第S条带的编码数据。图10.11(b)是JBIG解码功能模块图。图10.11 JBIG编码(a)和解码(b)功能模块图 BUPT Press 图10.12是JBIG采用的自适应算术编码器的MAC (Model_Adapter_Coder)结构。由于各差分层编码执行完全相同的处理,只是输入输出的数据不同,因而在实现时只需要
20、对一个编码模块循环调用即可。图10.12 MAC(Model-Adapter-Coder)结构框图 BUPT Press11 活动图像编码活动图像编码11.1 帧间预测编码帧间预测编码11.2 运动估计与运动补偿预测运动估计与运动补偿预测11.3 混合编码混合编码11.4 有关国际标准简介有关国际标准简介11.5 传输差错与处理传输差错与处理 BUPT Press 所谓活动图像信号,就是通常所说的电视信号或视频信号,经过数字化以后即数字视频信号,也称为数字序列图像。对于活动图像的编码有两个基本的要求,即实时性和高效性。如图11.1所示为活动图像编码传输系统的基本框图。比较它与静态图像系统的框图
21、就可以发现,两者之间的主要差别就在于活动图像的编码传输系统中必须要有一个传输缓冲存储器。图11.1 活动图像编码传输系统的基本框图 BUPT Press 图11.2为缓存控制作用的示意图。根据不同应用场合对图像质量要求的不同选择相应的压缩编码方法,是数字图像通信中采取的一项重要策略。对图像质量的要求一方面意味着系统实现的复杂性,另一方面也意味着对图像内容先验知识可利用的程度。图11.2 缓存控制作用的示意图 BUPT Press 根据目前的情况,可以把图像编码分为下面几个应用层次:(1)标准数字电视 (2)会议电视 (3)数字影碟机等 (4)可视电话 (5)高清晰度电视 对于彩色视频信号进行压
22、缩编码,总体上说有两种不同的编解码方案。一种是复合编码,它直接对复合视频信号进行取样和编码传输;另一种是分量编码,它首先把复合视频中的亮度和色度信号分离出来,然后分别进行数字化和编码传输。图11.3 分量编码系统的基本框图 BUPT Press11.1 帧间预测编码帧间预测编码11.1.1 帧间预测的依据帧间预测的依据 帧间预测是目前数字视频压缩编码采用的标志性技术。对活动图像序列进行帧间编码主要有两方面的依据。首先,从信源的角度看,自然景物大多都处于相对不变或缓变状态(这里不考虑类似于分子热运动的图像),这是帧间相关性存在的前提条件。帧间预测考虑的几种典型的情况由图11.4的可视电话图像概括
23、。图11.4 图像区域分类示意 BUPT Press 假定人的位置在第K帧与第K-1帧相比有一定的位移,可以将画面分为3个各具特点的区域:(1)背景区(2)运动物体区(3)暴露区。以上三类区域的帧间相关性虽然是最理想的情况,但却是帧间压缩编码的重要依据。除了上述的摄像机不变的情况外,对一些摄像机运动的场合也有类似的结论。图11.5是飞行器航拍地面的图像示意图。图11.5 飞行器航拍地面的“扫视”图像示意图 BUPT Press 其次,在活动图像编码中,还可以利用人的视觉(信宿)特性根据景物的活动性适当调整码率,这即所谓空间分辨率与时间分辨率的交换。对传输序列图像而言,可适当降低时间轴(Temp
24、oral)的分辨率。另一方面,人类视觉对于序列图像中的运动物体的分辨率将随着物体运动速率的增大而显著降低,而且摄像器件和电路灵敏度的积分式灵敏度也会造成运动部分的灵敏度下降。此外,电视监视器中的显示器件也有一定的积分模糊效应。这样在传输序列图像中的运动物体时,可以降低这部分图像的清晰度,且物体的运动速度愈高,就可用更低的清晰度进行传输。综上所述,如果根据图像的内容在清晰度和活动性(帧频)之间进行调整,可以使重建图像在视觉上保持一致的主观效果,这种方法就叫做空间分辨率和时间分辨率的交换。BUPT Press11.1.2 基本方法基本方法 对于序列图像中大量存在的静止或缓变区域,可以简单地采用下面
25、一些方法:(1)场(帧)重复工作形式 对于图像中的景物变化缓慢的场合,可以少传一些帧,通常也把这种方式称为抽帧或跳帧。(2)条件修补法(Conditional Frame Replenishment)将第一帧图像存于参考帧存中,并将其发送到对方,之后:第k帧图像位于z=(x,y)的像素采样值 的预测值 为第k-1帧图像的同一位置像素的复原值 。帧间差 为:在目前H.261等视频编码中采用的简单的帧间编码模式是对这种方法的改进。BUPT Press11.1.3 帧内、帧间编码的模式选择帧内、帧间编码的模式选择 帧内编码和帧间编码都是与图像序列的某些特性相对应的编码方法。分析表明,对于变化缓慢的序
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像处理与图像通信 Part3.3 数字图像 处理 图像 通信 Part3
限制150内