数字视频技术第3章--数字视频编码原理课件.ppt
《数字视频技术第3章--数字视频编码原理课件.ppt》由会员分享,可在线阅读,更多相关《数字视频技术第3章--数字视频编码原理课件.ppt(95页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第3章章 数字视频编码原理数字视频编码原理n了解图像和视频编码技术的发展历程,熟悉视频编码的各种了解图像和视频编码技术的发展历程,熟悉视频编码的各种方法。方法。n重点重点掌握哈夫曼编码、算术编码、预测编码和基于掌握哈夫曼编码、算术编码、预测编码和基于DCT的变的变换编码基本原理。换编码基本原理。n掌握掌握运动估计和运动补偿预测编码的基本原理。运动估计和运动补偿预测编码的基本原理。本章学习目标本章学习目标n3.1 数字视频编码概述数字视频编码概述n3.2 熵编码熵编码n3.3 预测编码预测编码n3.4 变换编码变换编码第第3章章 数字视频编码原理数字视频编码原理3.1.1 数字视频压缩的必要性
2、和可能性数字视频压缩的必要性和可能性n数数据据压压缩缩的的理理论论基基础础是是信信息息论论。从从信信息息论论的的角角度度来来看看,压压缩缩就就是是去去掉掉数数据据中中的的冗冗余余,即即保保留留不不确确定定的的信信息息,去去掉掉确确定定的的信信息息(可可推推知知的的),也也就就是是用用一一种更接近信息本质的描述来代替原有冗余的描述。种更接近信息本质的描述来代替原有冗余的描述。n在在一一般般的的图图像像和和视视频频数数据据中中,主主要要存存在在以以下下几几种种形形式的冗余。式的冗余。n空间冗余:空间冗余:也称为空域冗余,是一种与像素间相关也称为空域冗余,是一种与像素间相关性直接联系的数据冗余。性直
3、接联系的数据冗余。例例:图像中包含许多规则物体,它们的亮度、饱和度及颜图像中包含许多规则物体,它们的亮度、饱和度及颜色可能都一样,因此,图像在空间上具有很强的相关性。例色可能都一样,因此,图像在空间上具有很强的相关性。例如如 Lenna Lenna 图像的脸部和肩部。图像的脸部和肩部。3.1.1 数字视频压缩的必要性和可能性数字视频压缩的必要性和可能性n时间冗余:时间冗余:也称为时域冗余,它是针对视频序列图也称为时域冗余,它是针对视频序列图像而言的。像而言的。视视频频序序列列每每秒秒有有25 30帧帧图图像像,相相邻邻帧帧之之间间的的时时间间间间隔隔很很小小;同同时时实实际际生生活活中中的的运
4、运动动物物体体具具有有运运动动一一致致性性,使使得得视频序列图像之间有很强的相关性。视频序列图像之间有很强的相关性。3.1.1 数字视频压缩的必要性和可能性数字视频压缩的必要性和可能性n统计冗余统计冗余 n信源熵:信源熵:如果将信源所有可能事件的信息量进行平均,如果将信源所有可能事件的信息量进行平均,就得到了信源熵就得到了信源熵(entropy)。熵就是平均信息量。熵就是平均信息量。n当当 xj 等概率时,等概率时,H(X)最大。最大。n当当 xj 非等概率时,非等概率时,H(X)不是最大,就存在冗余。不是最大,就存在冗余。采用可变长编码技术,对出现概率大的符号用短码字采用可变长编码技术,对出
5、现概率大的符号用短码字表示,对出现概率小的符号用长码字表示,则可去除符号表示,对出现概率小的符号用长码字表示,则可去除符号冗余,从而节约码字,这就是冗余,从而节约码字,这就是熵编码熵编码的思想。的思想。3.1.1 数字视频压缩的必要性和可能性数字视频压缩的必要性和可能性n结构冗余:结构冗余:在有些图像的部分区域内有着在有些图像的部分区域内有着很相似的纹理结构,或是图像的各个部分很相似的纹理结构,或是图像的各个部分之间存在着某种关系,例如自相似性等,之间存在着某种关系,例如自相似性等,这些都是结构冗余的表现。这些都是结构冗余的表现。分形图像编码分形图像编码的基本思想就是利用了结的基本思想就是利用
6、了结构的自相似性。构的自相似性。3.1.1 数字视频压缩的必要性和可能性数字视频压缩的必要性和可能性n知识冗余:知识冗余:在某些特定的应用场合,编码对象中包含的在某些特定的应用场合,编码对象中包含的信息与某些先验的基本知识有关。信息与某些先验的基本知识有关。例如例如:人脸的图像有同人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中线上线上 可可以以利利用用这这些些先先验验知知识识为为编编码码对对象象建建立立模模型型。通通过过提提取取模模型型参参数数,对对参参数数进进行行编编码码而而不不是是对对图图像像像像素素值值直直接接进进行行编
7、编码码,可可以以达达到到非非常常高高的的压压缩缩比比。这这是是模模型型基基编编码码(或或称知识基编码、语义基编码)的基本思想。称知识基编码、语义基编码)的基本思想。3.1.1 数字视频压缩的必要性和可能性数字视频压缩的必要性和可能性n人眼的视觉冗余人眼的视觉冗余 视视觉觉冗冗余余度度是是相相对对于于人人眼眼的的视视觉觉特特性性而而言言的的。压压缩缩视视觉觉冗冗余余的的核核心心思思想想是是去去掉掉那那些些相相对对人人眼眼而而言言是是看看不不到到的的或或可可有有可可无无的的图图像像数数据据。对对视视觉觉冗冗余余的的压压缩缩通通常常反反映映在在各各种种具具体体的压缩编码过程中。的压缩编码过程中。3.
8、1.1 数字视频压缩的必要性和可能性数字视频压缩的必要性和可能性n1948年提出电视信号的数字化,人们开始了对图像压缩编码的研究工作。n1952年哈夫曼给出最优变长码的构造方法。3.1.2 数字视频编码数字视频编码技术的进展技术的进展n预测编码1952年年,贝贝尔尔实实验验室室的的奥奥利利弗弗等等人人开开始始研研究究线线性性预预测测编编码码理论理论1958年,格雷哈姆用计算机模拟法研究图像的年,格雷哈姆用计算机模拟法研究图像的DPCM方法方法1966年年,奥奥尼尼尔尔通通过过理理论论分分析析和和计计算算模模拟拟比比较较了了PCM和和DPCM对电视信号进行编码传输的性能对电视信号进行编码传输的性
9、能20世纪世纪70年代开始进行了年代开始进行了帧间预测编码帧间预测编码的研究的研究20世世纪纪80年年代代初初开开始始对对作作运运动动补补偿偿预预测测所所用用的的运运动动估估值值进进行研究行研究3.1.2 数字视频编码数字视频编码技术的进展技术的进展n变换编码首先讨论了包括首先讨论了包括K-L(Karhunen-Loeve)变换、变换、傅立叶变换等正交变换傅立叶变换等正交变换1968年安德鲁斯等人采用二维离散傅立叶变换年安德鲁斯等人采用二维离散傅立叶变换(2D-DFT)提出了变换编码)提出了变换编码此后相继出现了沃尔什此后相继出现了沃尔什-哈达玛(哈达玛(Walsh-Hadamard)变换、斜
10、()变换、斜(Slant)变换、)变换、K-L变换、变换、离散余弦变换(离散余弦变换(DCT)等)等3.1.2 数字视频编码数字视频编码技术的进展技术的进展n子带编码1976年美国贝尔系统的克劳切等人提出了话音的年美国贝尔系统的克劳切等人提出了话音的子带编码。子带编码。1985年奥尼尔将子带编码引入到图像编码。年奥尼尔将子带编码引入到图像编码。3.1.2 数字视频编码数字视频编码技术的进展技术的进展n算术编码1960年,年,P.Elias提出了算术编码的概念。提出了算术编码的概念。1976年,年,R.Pasco和和J.Rissanen分别用定长的寄存器实现了分别用定长的寄存器实现了有限精度的算
11、术编码。有限精度的算术编码。1979年年Rissanen和和G.G.Langdon一起将算术编码系统化,一起将算术编码系统化,并于并于1981年实现了二进制编码。年实现了二进制编码。1987年年Witten等人发表了一个实用的算术编码程序,即等人发表了一个实用的算术编码程序,即CACM87(后被(后被ITU-T的的H.263视频压缩标准采用)。视频压缩标准采用)。同期,同期,IBM公司发表了著名的公司发表了著名的Q-编码器(后被编码器(后被JPEG建议建议的扩展系统和的扩展系统和JBIG二值图像压缩标准采用)。二值图像压缩标准采用)。3.1.2 数字视频编码数字视频编码技术的进展技术的进展n基
12、于模型编码1983年瑞典的年瑞典的Forchheimer 和和Fahlander提出了提出了基于模型编码(基于模型编码(Model-Based Coding)的思想)的思想。3.1.2 数字视频编码数字视频编码技术的进展技术的进展n小波变换编码1986年,年,Meyer在理论上证明了一维小波函数的在理论上证明了一维小波函数的存在。存在。1987年年Mallat提出了多尺度分析的思想及多分辨提出了多尺度分析的思想及多分辨率分析的概念,提出了相应的快速小波算法率分析的概念,提出了相应的快速小波算法Mallat算法,并把它有效地应用于图像分解和重算法,并把它有效地应用于图像分解和重构。构。1989年
13、,小波变换开始用于多分辨率图像描述。年,小波变换开始用于多分辨率图像描述。3.1.2 数字视频编码数字视频编码技术的进展技术的进展n分层可分级编码20世世纪纪90年年代代中中后后期期,Internet迅迅猛猛发发展展,移移动动通通信信也也迅迅速速在在全全球球普普及及,因因此此人人们们开开始始有有了了在在网网络络上上传传输输视视频频和和图图像像的的愿愿望望。在在网网络络上上传传输输视视频频和和图图像像等等多多媒媒体体信信息息除除了了要要解解决决误误码码问问题题之之外外,最最大大的的挑挑战战在在于于用用户户可可以以获获得得的的带带宽宽在在不不停停地地变变化化。为为了了适适应应网网络络带带宽宽的的变
14、变化化,提提出出了了分分层层(layered)、可分级()、可分级(scalable)编码的思想。)编码的思想。3.1.2 数字视频编码数字视频编码技术的进展技术的进展压缩编码技术无损编码有损编码哈夫曼编码游程编码算术编码有损预测编码 变换编码 其他编码3.1.2 数字视频编码数字视频编码技术的进展技术的进展n无失真编码 无失真编码又称无损编码、信息保持编码、熵编码。无失真编码又称无损编码、信息保持编码、熵编码。熵熵编编码码是是纯纯粹粹基基于于信信号号统统计计特特性性的的一一种种编编码码方方法法,它它利利用用信信源源概概率率分分布布的的不不均均匀匀性性,通通过过变变长长编编码码来来减减少少信信
15、源源数数据据冗冗余余,解解码码后后还还原原的的数数据据与与压压缩缩编编码码前前的的原原始始数数据据完完全全相相同同而不引入任何失真。而不引入任何失真。无无失失真真编编码码的的压压缩缩比比较较低低,可可达达到到的的最最高高压压缩缩比比受受到到信信源熵的理论限制,一般为源熵的理论限制,一般为2 1到到5 1。最最常常用用的的无无失失真真编编码码方方法法有有哈哈夫夫曼曼(Huffman)编编码码、算算术编码和游程编码术编码和游程编码(Run-Length Encoding,RLE)等。等。3.1.2 数字视频编码数字视频编码技术的进展技术的进展n限失真编码 限失真编码也称有损编码、非信息保持编码、熵
16、压缩编限失真编码也称有损编码、非信息保持编码、熵压缩编码。码。限失真编码方法利用了人类视觉的感知特性,允许压缩限失真编码方法利用了人类视觉的感知特性,允许压缩过程中损失一部分信息,虽然在解码时不能完全恢复原始数过程中损失一部分信息,虽然在解码时不能完全恢复原始数据,但是如果把失真控制在视觉阈值以下或控制在可容忍的据,但是如果把失真控制在视觉阈值以下或控制在可容忍的限度内,则不影响人们对图像的理解,却换来了高压缩比。限度内,则不影响人们对图像的理解,却换来了高压缩比。在限失真编码中,允许的失真愈大,则可达到的压缩比愈高。在限失真编码中,允许的失真愈大,则可达到的压缩比愈高。常见的限失真编码方法有
17、:预测编码、变换编码、矢量常见的限失真编码方法有:预测编码、变换编码、矢量量化、基于模型的编码等。量化、基于模型的编码等。3.1.2 数字视频编码数字视频编码技术的进展技术的进展n3.1 数字视频编码概述数字视频编码概述n3.2 熵编码熵编码n3.3 预测编码预测编码n3.4 变换编码变换编码第第3章章 数字视频编码原理数字视频编码原理3.2 熵编码熵编码 熵熵编编码码的的基基本本原原理理就就是是去去除除图图像像信信源源在在空空间间和和时时间间上上的的相相关关性性,去去除除图图像像信信源源像像素素值值的的概概率率分分布布不不均均匀匀性性,使使编编码码码码字字的的平平均均码码长长接接近近信信源源
18、的的熵熵而而不不产产生生失失真真。由由于于这这种种编编码码完完全全基基于于图图像像的的统统计计特特性性,因因此此,有有时时也称其为也称其为统计编码统计编码。n哈夫曼哈夫曼(Huffman)编码编码n算术算术编码编码n游程编码游程编码(Run-Length Encoding,RLE)哈哈夫夫曼曼(Huffman)于于1952年年提提出出一一种种编编码码方方法法,完完全全依依据据符符号号出出现现概概率率来来构构造造异异字字头头(前前缀缀)的的平平均均长长度度最最短短的的码码字字,有有时时称称之之为最佳编码。为最佳编码。哈哈 夫夫 曼曼 编编 码码 是是 一一 种种 可可 变变 长长 度度 编编 码
19、码(Variable Length Coding,VLC),各各符符号号与码字一一对应,是一种分组码。与码字一一对应,是一种分组码。3.2.1 哈夫曼哈夫曼编码编码l Huffman编码过程(编码过程(1)把信源符号按概率大小顺序排列,并设法按逆次序分配把信源符号按概率大小顺序排列,并设法按逆次序分配 码字的长度。在分配码字的长度时,首先将出现概率最码字的长度。在分配码字的长度时,首先将出现概率最 小的两个符号的概率相加,合成一个概率;第二步把这小的两个符号的概率相加,合成一个概率;第二步把这 个合成概率看成是一个新组合符号的概率,重复上述操个合成概率看成是一个新组合符号的概率,重复上述操 作
20、,直到最后只剩下两个符号的概率为止。作,直到最后只剩下两个符号的概率为止。3.2.1 哈夫曼哈夫曼编码编码 完成以上概率相加顺序排列后,再反过来逐步向前进行完成以上概率相加顺序排列后,再反过来逐步向前进行 编码,每一步有两个分支,各赋予一个二进制码,可以编码,每一步有两个分支,各赋予一个二进制码,可以 对概率大的编码赋予对概率大的编码赋予0,概率小的编码赋予,概率小的编码赋予1。反之,。反之,也可以对概率大的编码赋予也可以对概率大的编码赋予1,概率小的编码赋予,概率小的编码赋予0。l Huffman编码过程(编码过程(2)3.2.1 哈夫曼哈夫曼编码编码l Huffman编码举例编码举例编码编
21、码过程过程cbafe10f=01 e=11 a=10 b=001 c=0001 d=0000d10101010aaaa bbb cc d eeeee fffffff输入输入S1S2S3S4S5S6输入概率输入概率0.40.30.10.10.060.04l Huffman编码举例编码举例输入输入S1S2S3S4S5S6输入概率输入概率0.40.30.10.10.060.04第一步第一步0.40.30.10.10.1l Huffman编码举例编码举例输入输入S1S2S3S4S5S6输入概率输入概率0.40.30.10.10.060.04第一步第一步0.40.30.10.10.1第二步第二步0.40
22、.30.20.1l Huffman编码举例编码举例输入输入S1S2S3S4S5S6输入概率输入概率0.40.30.10.10.060.04第一步第一步0.40.30.10.10.1第二步第二步0.40.30.20.1第三步第三步0.40.30.3l Huffman编码举例编码举例输入输入S1S2S3S4S5S6输入概率输入概率0.40.30.10.10.060.04第一步第一步0.40.30.10.10.1第二步第二步0.40.30.20.1第三步第三步0.40.30.3第四步第四步0.60.4l Huffman编码举例编码举例输入S1S2S3S4S5S6输入概率0.40.30.10.10.0
23、60.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101l Huffman编码举例编码举例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S1=1l Huffman编码举例编码举例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.
24、40101010101S2=00l Huffman编码举例编码举例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S3=011l Huffman编码举例编码举例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S4=0100l Huffman编码举例编码举例输入S1S2S3S4S5S6输入
25、概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S5=01010l Huffman编码举例编码举例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S6=01011l Huffman编码举例编码举例例:例:信源有四个符号:信源有四个符号:X a1 a2 a3 a4 1/2 1/4 1/8 1/8n信源熵:信源熵:nHuf
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字视频 技术 编码 原理 课件
限制150内