数字电视技术第2章223.ppt
《数字电视技术第2章223.ppt》由会员分享,可在线阅读,更多相关《数字电视技术第2章223.ppt(223页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2章 信源编码 数字电视技术第2章223 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望第2章 信源编码 2.1 视频压缩技术视频压缩技术 2.1.1 视频信号压缩的可能性视频信号压缩的可能性视频数据主要存在以下形式的冗余。1.空间冗余空间冗余 2.时间冗余时间冗余 3.结构冗余结构冗余 4.知识冗余知识冗余 5.视觉冗余视觉冗余 第2章 信源编码 2.1.2 视频信号的数字化视频信号的数字化 模拟视频信号通过取样、量化后编码为二进制数字信号的过程称为模/数变换
2、(AD变换)或PCM(Pulse Coding Modulation,脉冲编码调制),所得到的信号也称为PCM信号,其过程可用图2-1(a)表示。若取样频率等于fs,用n比特量化,则PCM信号的数码率为nfs(bs)。PCM编码既可以对彩色全电视信号直接进行,也可以对亮度信号和两个色差信号分别进行。前者称为全信号编码,后者称为分量编码。PCM信号经解码和插入滤波后恢复为模拟信号,如图2-1(b)所示。解码是编码的逆过程,插入滤波是把解码后的信号用理想低通滤波恢复为平滑、连续的模拟信号。这两个步骤合称为数/模变换(DA变换)或PCM解码。第2章 信源编码 图2-1 电视信号的数字化和复原(a)A
3、/D变换;(b)D/A变换 第2章 信源编码 1.奈奎斯特取样定理奈奎斯特取样定理 理想取样时,只要取样频率大于或等于模拟信号中最高频率的两倍,就可以不失真地恢复模拟信号,这称为奈奎斯特取样定理。模拟信号中最高频率的两倍称为折叠频率。一般取样频率应为最高频率的35倍。第2章 信源编码 2.亚奈奎斯特取样亚奈奎斯特取样 按取样定理,若取样频率fs小于模拟信号最高频率fmax的两倍,就会产生混叠失真,但若巧妙地选择取样频率,令取样后频谱中的混叠分量落在色度分量和亮度分量之间,就可用梳状滤波器去除混叠成分。第2章 信源编码 3.均匀量化和非均匀量化均匀量化和非均匀量化 在输入信号的动态范围内,量化间
4、距处处相等的量化称为均匀量化或线性量化。均匀量化时信噪比随输入信号动态幅度的增加而增加。采用均匀量化,在强信号时固然可把噪波淹没掉,但在弱信号时,噪波的干扰就十分显著。为改善弱信号时的信噪比,量化间距应随输入信号幅度而变化,大信号时进行粗量化,小信号时进行细量化,也就是采用非均匀量化,或称非线性量化。第2章 信源编码 非均匀量化有两种方法。一是把非线性处理放在编码器前和解码器后的模拟部分,编、解码仍采用均匀量化,在均匀量化编码器之前,对输入信号进行压缩,这样等效于对大信号进行粗量化,对小信号进行细量化;在均匀量化解码器之后,再进行扩张,以恢复原信号。另一种方法是直接采用非均匀量化器,输入信号大
5、时进行粗量化(量化间距大),输入信号小时进行细量化(量化间距小)。也有采用若干个量化间距不等的均匀量化器,当输入信号超过某一电平时进入粗间距均匀量化器,低于某一电平时进入细间距量化器,这称为准瞬时压扩方式。第2章 信源编码 通常用Q表示量化,用IQ或Q-1表示反量化。量化过程相当于由输入值找到它所在的区间号,反量化过程相当于由量化区间号得到对应的量化电平值。量化区间总数远远小于输入值的总数,所以量化能实现数据压缩。很明显,反量化后并不能保证得到原来的值,因此量化过程是一个不可逆过程,用量化的方法来进行压缩编码是一种非信息保持型编码。通常这两个过程均可用查表法实现,量化过程在编码端完成,而反量化
6、过程则在解码端完成。对量化区间标号(量化值)的编码可以采用等长编码方法,当量化分层总数为K时,经过量化压缩后的二进制数码率为lbK b量化值。也可以采用可变字长编码如哈夫曼编码或算术编码来进一步提高编码效率。第2章 信源编码 4.ITU-R BT.601分量数字系统分量数字系统 数字视频信号是将模拟视频信号经过取样、量化和编码而形成的。模拟电视有PAL、NTSC等制式,必然会形成不同制式的数字视频信号,不便于国际数字视频信号的互通。1982年10月,CCIR(Consultative Committee for International Radio,国际无线电咨询委员会)通过了第一个关于演播
7、室彩色电视信号数字编 码 的 建 议,1993年 变 更 为 ITU-R(International Telecommunications Union-Radio communications Sector,国际电联无线电通信部门)BT.601分量数字系统建议。我国对应的国家标准为GB/T14857-93演播室数字电视编码参数规范。第2章 信源编码 BT.601建议采用对亮度信号和两个色差信号分别编码的分量编码方式,对不同制式的信号均采用相同的取样频率,对亮度信号Y采用的取样频率为13.5 MHz。由于色度信号的带宽远比亮度信号的带宽窄,因此对色度信号U和V的取样频率为6.75 MHz。每个数
8、字有效行分别有720个亮度取样点和3602个色差信号取样点。对每个分量的取样点都是均匀量化的,即对每个取样进行8 b精度的PCM编码。Y信号的黑、白电平分别对应16级和235级;U和V信号的最大正电平对应240级,零电平对应128级,最小负电平对应16级。这几个参数对525行、60场秒和625行50场秒的制式都是相同的。第2章 信源编码 有效取样点是指只有行、场扫描正程的样点有效,逆程的样点不在PCM编码的范围内。因为在数字化的视频信号中不再需要行、场同步信号和消隐信号,所以用定时基准码SAV(Start of Active Video)代表有效视频开始,用定时基准码EAV(End of Ac
9、tive Video)代表有效视频结束。定时基准码占用4个字节,前3个字节是FF0000H,第4个字节是奇偶标志、场正程、逆程标志和校验位。HDTV中常采用10比特量化,定时基准码占用4个字,每个字10比特,第1个字全为“1”,后面2个字全为“0”,第4个字是奇偶标志、场正程、逆程标志和校验位。第2章 信源编码 对应于每个有效行的数据是1728个样值,其中有效图像样值为1440个,定时基准码为8个,行消隐期的280个样值传送辅助信息。场消隐期也传送辅助信息,辅助信息有时间码、宽高比、测试诊断信息、数字音频信息和图文电视。色度信号的取样率是亮度信号的取样率的一半,常称作422格式,可以理解为每一
10、行里的Y、U、V的样点数之比为422。第2章 信源编码 2.1.3 熵编码熵编码 1.Huffman编码编码 霍夫曼(Huffman)编码是一种可变长编码,编码方法如图2-2所示。其具体步骤是:(1)将输入信号符号以出现概率由大至小为序排成一列。(2)将两处最小概率的符号相加合成为一个新概率,再按出现概率大小排序。(3)重复步骤(2),直至最终只剩两个概率。(4)编码从最后一步出发逐步向前进行,概率大的符号赋予“0”码,另一个概率赋予“1”码,直至到达最初的概率排列为止。戴维霍夫曼David Albert Huffman第2章 信源编码 图2-2 Huffman编码 第2章 信源编码 上述6个
11、符号用普通二进制编码,每个符号码长三位;用霍夫曼编码,平均码长为0.41+0.32+0.13+0.14+0.065+0.045=2.2位 第2章 信源编码 2.算术编码算术编码 Huffman编码的每个代码都要使用一个整数位,如果一个符号只需要用2.5位就能表示,在Huffman编码中却必须用3个符号表示,因此它的效率较低。与其相比,算术编码并不为每个符号产生一个单独的代码,而是使整条信息共用一个代码,增加到信息上的每个新符号都递增地修改输出代码。假设信源由4个符号s1、s2、s3和s4组成,其概率模型如表2-1所示。把各符号出现的概率表示在如图2-3所示的单位概率区间之中,其中区间的宽度代表
12、概率值的大小,各符号所对应的子区间的边界值实际上是从左到右各符号的累积概率。在算术编码中通常采用二进制的小数来表示概率,每个符号所对应的概率区间都是半开区间,如s1对应0,0.001),s2对应0.001,0.011)。算术编码所产生的码字实际上是一个二进制小数值的指针,该指针指向所编的符号对应的概率区间。第2章 信源编码 表表2-1 信源概率模型和算术编码过程信源概率模型和算术编码过程 第2章 信源编码 图2-3 算术编码过程示意图 第2章 信源编码 例例1 将符号序列s3s3s2s4进行算术编码,序列的第一个符号为s3,我们用指向图2-3中第3个子区间的指针来代表这个符号,由此得到码字0.
13、011。后续的编码将在前面编码指向的子区间内进行。将0.011,0.111区间再按符号的概率值划分成4份,对第2个符号s3,指针指向0.1001,码字串变为0.1001。然后s3所对应的子区间又被划分为4份,开始对第3个符号进行编码 第2章 信源编码 算术编码的基本法则如下:(1)初始状态:编码点(指针所指处)C0=0,区间宽度A0=1。(2)新编码点:Ci=Ci-1+Ai-1Pi(2-1)式中:Ci-1是原编码点,Ai-1是原区间宽度,Pi为所编符号对应的累积概率。新区间宽度:Ai=Ai-1pi(2-2)式中:pi为所编符号对应的概率。第2章 信源编码 根据上述法则,对序列s3s3s2s4进
14、行算术编码的过程如下:第个符号s3:C1=C0+A0P1=0+10.011=0.011A1=A0p1=10.1=0.1 0.011,0.111)第2个符号s3:C2=C1+A1P2=0.011+0.10.011=0.1001 A2=A1p2=0.10.1=0.010.1001,0.1101)第2章 信源编码 第3个符号s2:C3=C2+A2P3=0.1001+0.010.001=0.10011A3=A2p3=0.010.01=0.00010.10011,0.10101)第4个符号s4:C4=C3+A3P4=0.10011+0.00010.111=0.1010011A4=A3p4=0.00010
15、.001=0.00000010.1010011,0.10101 第2章 信源编码 3.游程编码游程编码 游程编码RLC(Run Length Coding)是一种十分简单的压缩方法,它将数据流中连续出现的字符用单一的记号来表示。游程编码的压缩率不高,但编码、解码的速度快,因而仍得到了广泛的应用,特别是在变换编码及进行Z字形(zigzag)扫描后,再进行游程编码,会有很好的效果。第2章 信源编码 2.1.4 预测编码和变换编码预测编码和变换编码 1.DPCM原理原理 基于图像的统计特性进行数据压缩的基本方法就是预测编码。它利用图像信号的空间或时间相关性,用已传输的像素对当前的像素进行预测,然后对
16、预测值与真实值的差预测误差进行编码处理和传输。目前用得较多的是线性预测方法,其全称 为 差 值 脉 冲 编 码 调 制 DPCM(Differential Pulse Code Modulation)。利用帧内相关性(像素间、行间的相关)的DPCM被称为帧内预测编码。如果对亮度信号和两个色差信号分别进行DPCM编码,即对亮度信号采用较高的取样率和较多位数编码,对色差信号用较低的取样率和较少位数编码,那么构成时分复合信号后再进行DPCM编码,数码率可以更低。第2章 信源编码 利用帧间相关性(邻近帧的时间相关性)的DPCM被称为帧间预测编码,因帧间相关性大于帧内相关性,所以其编码效率更高。若把这两
17、种DPCM组合起来,再配上变字长编码技术,就能获得较好的压缩效果。DPCM是图像编码技术中研究得最早且应用最广的一种方法,它的一个重要特点是算法简单,易于硬件实现。图2-4(a)是它的示意图。编码单元主要包括线性预测器和量化器两部分。编码器的输出不是图像像素的样值f(m,n),而是该样值与预测值g(m,n)之间的差值,即预测误差e(m,n)的量化值E(m,n)。根据图像信号统计特性的分析,给出一组恰当的预测系数,使预测误差主要分布在“0”附近,再经非均匀量化,采用较少的量化分层,图像数据便得到了压缩,而量化噪声又不易被人眼所觉察,图像的主观质量并不明显下降。图2-4(b)是DPCM解码器,其原
18、理和编码器刚好相反。第2章 信源编码 图2-4 DPCM原理(a)DPCM编码器;(b)DPCM解码器 第2章 信源编码 图2-5 四阶预测器(a)输入像素和被预测像素的位置关系;(b)预测器的结构 第2章 信源编码 2.变换编码原理变换编码原理 图像变换编码是将空间域里描述的图像经过某种变换(如傅立叶变换、离散余弦变换、沃尔什变换等),在变换域中进行描述,即将图像能量在空间域的分散分布变为在变换域的相对集中分布,便于用Z字形扫描、自适应量化、变长编码等进一步处理,完成对图像信息的有效压缩。先从一个实例来看一个域的数据变换到另一个域后其分布是如何改变的。以12像素构成的子图像,即相邻两个像素组
19、成的子图像为例,每个像素有3 b编码,取07共8个灰度级,两个像素有64种可能的灰度组合,由图2-6(a)中的64个坐标点表示。一般图像的相邻像素之间存在着很强的相关性,绝大多数的子图像中相邻像素灰度级相等或很接近,也就是说,在x1=x2直线附近出现的概率大,如图2-6(a)中的阴影区所示。第2章 信源编码 图2-6 变换编码的物理意义(a)子图像在阴影区的概率较大;(b)旋转变换后 第2章 信源编码 把一个nn像素的子图像看成n2维坐标系中的一个坐标点。在 n2维坐标系中,每一个坐标点对应于n2个像素。这个坐标点的数值是其对应的n2个像素的灰度组合。图像在n2维变换域中的相关性大大下降,因此
20、用变换后的系数进行编码,比直接用图像数据编码会获得更大的数据压缩。第2章 信源编码 变换编码将被处理数据按照某种变换规则映射到另一个域中去处理,常采用二维正交变换的方式。若将整个图像作为一个二维矩阵,则变换编码的计算量太大,所以将一幅图像分成一个个小图像块,通常是88或1616的小方块,每个图像块可以看成一个二维数据矩阵,变换编码以这些小图像块为单位,把统计上密切相关的像素构成的矩阵通过线性正交变换,变成统计上较为相互独立甚至完全独立的变换系数所构成的矩阵。信息论的研究表明,变换前后,图像的信息量并无损失,可以通过反变换得到原来的图像值。统计分析表明,正交变换后,数据的分布向新坐标系中的少数坐
21、标集中,且集中于少数的直流或低频分量的坐标点。正交变换并不压缩数据量,但它去除了大部分相关性,数据分布相对集中,可以依据人的视觉特性对变换系数进行量化,允许引入一定量的误差,只要它们在重建图像中造成的图像失真不明显,或者能达到所要求的观赏质量就行。量化可以增加许多不用编码的0系数,然后再对量化后的系数施行变长编码。第2章 信源编码 3.离散余弦变换离散余弦变换(DCT)在常用的正交变换中,离散余弦变换DCT(Discrete Cosine Transform)的性能接近最佳,是一种准最佳变换。DCT矩阵与图像内容无关,由于它构造成对称的数据序列,因而避免了子图像轮廓处的跳跃和不连续现象。DCT
22、也有快速算法FDCT,在图像编码的应用中,大都采用二维DCT。第2章 信源编码 88 DCT和88 DCT反变换的数学表达式为(2-3)(2-4)其中:当u=v0时,;当u=v其它值时,C(u)=C(v)=1。88 DCT的变换核函数为 第2章 信源编码 图2-7 88 DCT的基图像 第2章 信源编码 第2章 信源编码 图2-8 图像块的DCT变换(a)背景部分图像块的DCT;(b)细节部分图像块的DCT第2章 信源编码 图2-9 游程编码(a)Z字形扫描;(b)交替扫描 第2章 信源编码 4.混合编码混合编码 混合编码是近年来广泛采用的方法,这种方法充分利用各种单一压缩方法的长处,以期在压
23、缩比和效率之间取得最佳的平衡。如广泛流行的JPEG和MPEG压缩方法都是典型的混合编码方案。第2章 信源编码 2.1.5 静止图像压缩标准静止图像压缩标准 (1)清晰度:静止图像中的细节容易被观察到,要求有更高的清晰度。(2)逐渐浮现(Progressive Build-up)的显示方式:在传输频带较窄时为了减少等待时间,要求编码能提供逐渐浮现的显示方式,即先传模糊的整幅图像,再逐渐变清晰。(3)抗干扰:一幅图像的传输时间较长,各种干扰噪声的显示时间也较长,影响观看,要求编码与调制方式都有较强的抗干扰能力。第2章 信源编码 图2-10 静止图像数字传输系统 第2章 信源编码 1.JPEG标准标
24、准 JPEG是ISO(International Standardization Organization,国际标准化组织)IEC(International Electrotechnical Committee,国际电工技术委员会)和ITU-T(International Telecommunications Union,国际电信联盟)的联合图片专家小组(Joint Photographic Experts Group)的缩写。1991年3月,JPEG建议(ISOIEC10918号标准)“多灰度静止图像的数字压缩编码(通常简称为JPEG标准)”正式通过,这是一个适用于彩色和单色多灰度或连续色
25、调静止数字图像的压缩标准,包括无损压缩及基于离散余弦变换和Huffman编码的有损压缩两个部分。第2章 信源编码 图2-11 JPEG算法步骤 第2章 信源编码 (1)彩色坐标转换。彩色坐标转换是要去除数据冗余量,它不属于JPEG算法,因为JPEG是独立于彩色坐标的。压缩可采用不同坐标(如RGB、YUV、YIQ等)的图像数据。(2)离散余弦变换。JPEG采用的是88子块的二维离散余弦变换算法。在编码器的输入端,把原始图像(U、V的像素是Y的一半)顺序地分割成一系列88的子块。在88图像块中,像素值变化缓慢,具有较低的空间频率。进行二维88离散余弦变换可以将图像块的能量集中在极少数系数上。DCT
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字电视 技术 223
限制150内