第3章多媒体数据压缩技术.ppt
《第3章多媒体数据压缩技术.ppt》由会员分享,可在线阅读,更多相关《第3章多媒体数据压缩技术.ppt(101页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多多 媒媒 体体 技技 术术第第3 3章章1第第3章章 多媒体数据多媒体数据压缩编码技术压缩编码技术n3.1 概述n3.2 数据压缩的基本方法n3.3 静态图像压缩编码国际标准JPEGn3.4 运动图像压缩编码国际标准MPEGn3.5 音频数字化与压缩编码技术2第第3章章 多媒体数据多媒体数据压缩编码技术压缩编码技术n多媒体数据压缩编码的重要性u数据冗余类型u数据压缩技术的分类3第第3章章 多媒体数据多媒体数据压缩编码技术压缩编码技术n媒体数据压缩编码的重要性u 信息时代的重要特征是信息的数字化。u 早期的计算机系统采用模拟方式表示信息,但存在着明显的缺点:u 经常会产生噪音和信号丢失,并且在
2、复制过程中逐步积累噪音和误差。u 模拟信号不适合数字计算机加工处理。4媒体数据压缩媒体数据压缩编码的重要性编码的重要性n 数字化后未经压缩的视频和音频等媒体信息的数据量是非常大的 1.图像数据量的大小可用下面的公式来计算:图像数据量图像的总像素色彩深度8 (单 位 为 Byte,简 写 为 B)例如,一幅640480、24位(bit)真彩色 的 图 像,其 文 件 大 小 为:64048024 8 921.6KB5媒体数据压缩媒体数据压缩编码的重要性编码的重要性n 2.双通道立体声激光唱盘,采用脉冲码调制采样,采样频率为44.1KHz,采样精度16位,其一秒钟时间内的采样数据量为:44.110
3、001628 176.4 KB 一个650MB的CDROM,大约可存1小时的音乐。6媒体数据压缩媒体数据压缩编码的重要性编码的重要性n 3.对动态图形和视频图像。例如对于彩色电视信号,设代表光强Y的带宽为4.2MHz、色彩I为1.5MHz和色饱和度Q为0.5MHz,采样频率2倍原始信号频率,各分量均被数字量化为8位,从而1秒钟电视信号的数据量为:(4.21.50.5)281000000812.4 MB7媒体数据压缩媒体数据压缩编码的重要性编码的重要性u 容量为650MB的CDROM仅能存1分钟的原始电视数据。若为高清晰度电视(HDTV)其1秒钟数据量约为150MB(1.2Gbps8),一张CD
4、ROM还存不下5秒钟的HDTV图像。n 巨大数字化信息的数据量对计算机存储资源和网络带宽有很高的要求,解决的办法就是要对视、音频的数据进行大量的压缩。播放时,传输少量被压缩的数据,接收后再对数据进行解压缩并复原。8数据冗余类型数据冗余类型u 1.空间冗余u 基于离散像素采样来表示物体颜色的方式通常没有利用景物表面颜色的这种空间相关性,这些相关性的光成像结构在数字化图像中就表现为空间冗余。我们可以通过改变物体表面颜色的像素存储方式来利用空间相关性,达到减少数据量的目的。9数据冗余类型数据冗余类型u 2.时间冗余u 时间冗余反映在图像序列中的相邻帧图像(电视图像、动画)之间有较大的相关性,一组连续
5、画面中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,把一帧图像中的某物体或场景可以由其他帧图像中的物体或场景进行处理后重构出来,可以大大减少时间冗余。10数据冗余类型数据冗余类型u 3.结构冗余u 有些图像具有较强的相似性的纹理结构,例如布纹图像和草席图像,方格状的地板图案等,我们称此为结构冗余。u 4.知识冗余u 有许多图像的理解与某些基础知识有相当大的相关性,这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。根据已有的知识,我们可以构造图像物体的基本模型,并创建图像库。11数据冗余类型数据冗余类型u 5.视觉冗余u 人的接收系统如视觉系统和
6、听觉系统是有一定限度的,人眼并不能察觉图像场的所有变化,如人类视觉系统分辨能力约为64灰度等级,而一般图像量化采用256灰度等级,这类冗余我们称为视觉冗余。u 6.听觉冗余u 人耳的敏感性不能察觉所有频率的变化,存在听觉冗余。12数据压缩技术数据压缩技术 的分类的分类n 根据多媒体数据冗余类型的不同,解码后数据与原始数据是否完全一致、质量有无损失来进行分类,压缩方法可被分为有失真编码和无失真编码两大类。u 无失真压缩法也称无损压缩,无失真压缩的特点是压缩比较小,大约在2l至5l之间,主要用于文本数据、程序代码和某些要求严格不丢失信息的环境中,常用的无失真压缩编码有如哈夫曼编码等。13数据压缩技
7、术数据压缩技术 的分类的分类u 有失真压缩法也称有损压缩,有失真压缩法的冗余压缩取决于初始信号的类型、前后的相关性、信号的语义内容等,压缩比可以从几到几百倍,常用的有失真压缩编码技术有预测编码、变换编码、模型编码、混合编码方法等。主要用于压缩图像、声音等信息。14n 常用的图像和视频压缩方法如图3-1所示:图像和视频压缩方法图像和视频压缩方法哈夫曼编码哈夫曼编码行程编码行程编码算术编码算术编码LZW编码编码DCT编码编码小波变换小波变换子带编码子带编码无失真压缩无失真压缩有失真压缩有失真压缩预测编码预测编码变换编码变换编码模型编码模型编码运动补偿运动补偿混合编码混合编码分形编码分形编码JPEG
8、MPEGH.261数据压缩技术数据压缩技术 的分类的分类15行程(游程)行程(游程)RLE 编码技术编码技术n 行程编码主要思路是用编码器不断比较信息源符号相邻元素值的变化幅度,一旦发现有明显的变化,就开始一个行程。编码器检测每一个行程起点位置开始的多次重复的比特或者字符序列,然后将一个相同值的连续串出现次数作为行程长度,并将行程长度转换成代码,再取用信息源符号的一个代表值作为代码,这种编码称为行程编码,或称游程编码,常用RLE表示。16对一幅两维图像对一幅两维图像F F(i i,j j)作水平作水平扫描后得到的部分像素的像素值扫描后得到的部分像素的像素值17行程(游程)行程(游程)RLE 编
9、码技术编码技术n 用RLE对这一行数据编码后得到的码字表:n RLE编 码 压 缩 编 码 技 术 尤 其 适 用 于:计算机生成的图形图像和黑白二值图像的编码,解压缩速度很快。RLE的压缩率的大小取决于图像本身的特点,可以得到较大的压缩比。对复杂的图像不适宜用RLE进行编码。18哈夫曼编码技术哈夫曼编码技术n 假设一个信息源能产生的事件序列中的事件取自一个有限事件集,事件集S中的任一事件Si发生的概率为P(Si)都相等,即P(Si)1/S,则 其 所 能 携 带 的 信 息 量 I(Si)定 义 为:I(Si)log2 1/S log2 P(Si)(33)这里P(Si)是信息源产生的事件为S
10、i的概率。等式右边加一负号的目的是保证I(Si)的数值不为负值。定义中用2为底的对数,并规定信息量I(Si)的计量单位为比特(bit)。19哈夫曼编码技术哈夫曼编码技术n 哈夫曼编码属于一种变字长码,把信息源事件按概率大小顺序排列,对出现概率大的信息源事件赋予短码字,而对于概率小的信息源事件赋予长码,只要码字长度按照信息出现的概率大小逆顺序排列,可通过数学证明这一结论:平均码字长度一定小于其它任何事件顺序的排列方式。20哈夫曼编码技术哈夫曼编码技术n 哈夫曼编码一般过程如下:u 1.把事件(消息)按出现的概率由大到小排成一个序列。如P(1)P(2)P(3)P(Sm-1)P(Sm),即将信息源事
11、件按概率递减顺序排列。u 2.把其中两个最小的概率P(Sm-1),P(Sm)挑出来,且将事件“1”赋给其中最小的,即P(Sm)1;事件“0”赋给另一稍大的即P(Sm-1)0。21哈夫曼编码技术哈夫曼编码技术u 3.把两个最小概率相加作为新事件的概率,即 求 出 P(Sm-1),P(Sm)之 和 P(Si):P(Si)=P(Sm-1)十P(Sm)设P(Si)是对应于一个新的消息的概率。u 4.将P(Si)与上面未处理的(m2)个消息P(Sm-2)的概率重新由大到小再排列,构成一个新的概率序列。u 5.重复步骤2),3),4),在每次合并信息源时,将被合并的信源分别赋“0”和“1”直到所有m个事件
12、的概率均已全部合并处理为止。22哈夫曼编码技术哈夫曼编码技术u 6.寻找从每一个信息源事件到概率总和为1处的路径,对每一信息源事件写出“1”、“0”序列(从 树 根 到 信 息 源 事 件 节 点)作 为 码 字。Huffman编码的平均码字长度可以用下列公式求出:这里的ni,为第i个消息事件的码字长度,P(Si)为第i个消息出现的概率。举一例子来说明这一编码过程。23哈夫曼编码技术哈夫曼编码技术图3-5 哈夫曼编码全过程:F24哈夫曼编码技术哈夫曼编码技术n 根据哈夫曼的编码规则,我们得到如表3-2所示:由于8个消息事件A,B,C,H的每个概率为已知,则哈夫曼码的平均长度L可按公式(3-6)
13、计算为:L10.4十3(0.180.10)4(0.10十0.06十0.07)十 5(0.05十 0.04)2.61比 特25哈夫曼编码技术哈夫曼编码技术n 图像的熵H(S)可按公式(3-5)计算为:定义编码效率为熵值H(S)与平均码长L的比值,即:编码效率 (3-7)=2.55/2.61=2.55/2.61 97.8 97.8%哈 夫 曼 编 码 有 它 的 不 足 之 处:必须先得到信息源码元(消息)的统计概率,才能进行编码。折中的方法是根据经验值人为地给出Huffman码表,但这样的编码无法达到最佳。26LZW编码编码nLZWLZW编编码码是是由由LempleLemple和和ZivZiv提
14、提出出并并经经WelchWelch扩扩充充而形成的无损压缩专利技术。而形成的无损压缩专利技术。n它它采采用用了了一一种种先先进进的的串串表表压压缩缩,将将每每个个第第一一次次出出现现的的串串放放在在一一个个串串表表中中,用用一一个个数数字字来来表表示示串串,压压缩缩文文件件只只存存贮贮数数字字,则则不不存存贮贮串串,从从而而使使图图象象文文件件的的压压缩缩效效率率得得到到较较大大的的提提高高。奇奇妙妙的的是是,不不管管是是在在压压缩缩还还是是在在解解压压缩缩的的过过程程中中都都能能正正确确的的建建立立这这个个串串表表,压压缩缩或或解解压压缩缩完完成成后后,这个串表又被丢弃。这个串表又被丢弃。2
15、7LZW编码示例编码示例n例例如如:现现有有来来源源于于二二色色系系统统的的图图像像数数据据源源(假假设设数数据据以以字字符符串串表表示示):aabbbaabbaabbbaabb,试试对对其其进行进行LZWLZW编码及解码编码及解码。n根根据据图图像像中中使使用用的的颜颜色色数数初初始始化化一一个个字字符符串串表表,字字符符串串表表中中的的每每个个颜颜色色对对应应一一个个索索引引。在在初初始始字字符符串串表表的的LZW_CLEARLZW_CLEAR和和LZW_EOILZW_EOI分分别别为为字字符符表表初始化标志和编码结束标志。初始化标志和编码结束标志。28n设置字符串变量设置字符串变量S1S
16、1、S2S2并初始化为空。并初始化为空。最后的编码结果为:3001646329LZW编码编码nLZWLZW算算法法的的适适用用范范围围是是原原始始数数据据串串最最好好是是有有大大量量的的子子串串多多次次重重复复出出现现,重重复复的的越越多多,压压缩缩效效果果越越好好。反反之之则则越越差差,可可能能真的不减反增了真的不减反增了 30图像压缩预处理技术图像压缩预处理技术n图图像像数数据据压压缩缩的的任任务务是是在在不不影影响响或或少少影影响响图图像像质质量量的的前前提提下下,尽尽量量减减少少图图像像的的数据量。数据量。n图像预处理技术:图像预处理技术:二次抽样二次抽样 人人的的视视觉觉对对图图像像
17、亮亮度度分分量量的的敏敏感感程程度度高于色差分量。高于色差分量。31图像压缩预处理技术图像压缩预处理技术滤波器滤波器 能有选择地删除、衰减或放大信息能有选择地删除、衰减或放大信息量化量化 用用整整数数码码代代替替采采样样值值,真真实实值值和和量量化化值值间的误差是分辨率和噪声的混合间的误差是分辨率和噪声的混合预测编码预测编码 统统计计冗冗余余改改进进压压缩缩。对对预预测测值值和和真真实实值值之间的误差进行编码之间的误差进行编码32图像压缩预处理技术图像压缩预处理技术运动补偿运动补偿 用用二二维维图图像像位位移移矢矢量量来来预预测测邻邻域域图图像像的的位移值位移值变长码变长码 根据出现概率高低决
18、定码字长度根据出现概率高低决定码字长度图像内插法图像内插法 允允许许产产生生中中间间图图像像,因因此此临临近近的的图图像像可可以产生中间像,减少数据传输和存储量。以产生中间像,减少数据传输和存储量。33采采 样样n香香农农定定理理对对于于一一个个包包含含最最高高频频率率f0f0的的模模拟拟信信号号,但但选选择择的的采采样样频频率率f f 满满足足 f=f=2f02f0时时,经经过过取取样样后后的的离离散散信信号号能能够够包包含含原原模模拟拟信信号号的的全全部部信信息息,并并且且,经经过过反反变变换换和和低低通通滤滤波波,可可以以不不失失真真地地恢恢复复出出原始信号。原始信号。34量量 化化n量
19、量化化是是在在幅幅度度轴轴上上把把连连续续值值的的模模拟拟信信号号变变成成为为离离散散值值的的数数字字信信号号,在在时时间间轴轴上上已已变变为为离离散散的的样样值值脉脉冲冲,在在幅幅度度轴轴上上仍仍会会在在动动态态范范围围内内有有连连续续值值,可可能能出出现现任任意意幅幅度度,即即在在幅幅度度轴轴上上仍仍是是模模拟拟信信号号的的性性质质,故故还还必必须须用用有有限限电电平平等等级级来来代代替替实际量值实际量值 35n量量化化级级通通常常用用二二进进制制的的位位数数n n表表示示,例例如如,对对于于 8 8 位位 (bit)(bit)量量化化,相相应应的的十十进进制制量量化等级化等级M M为为
20、:M=2:M=28 8=256.=256.n量量化化的的过过程程是是把把取取样样后后信信号号的的电电平平归归并并到到有有限限个个电电平平等等级级上上,并并以以一一个个相相应应的的数数据来表示。据来表示。36n将将图图象象用用较较少少的的灰灰度度级级别别来来表表示示是是最最简简单单的的减减小数据量的方法,这种方法就是标量量化方法。小数据量的方法,这种方法就是标量量化方法。n更更一一般般的的情情况况是是,针针对对连连续续量量的的采采样样过过程程,量量化化是是用用有有限限个个状状态态来来表表示示连连续续值值。标标量量量量化化器器Q(.)Q(.)是是一一个个函函数数,用用有有限限个个判判决决层层d d
21、i i和和重重构构层层r ri i定义而成:定义而成:n37n当采样值当采样值s在在(di,di-1)范围内时,量化器的输出就是重构层范围内时,量化器的输出就是重构层ri。38n矢矢量量量量化化可可定定义义成成用用有有限限个个矢矢量量状状态态表表示示一一组组矢矢量量,每每个个矢矢量量是是一一些些连连续续值值的的采采样样。在在图图象象压压缩缩中中,标标量量量量化化和和矢矢量量化通常用于变换域内的图象表示。量量化通常用于变换域内的图象表示。39数据压缩算法的评价数据压缩算法的评价n压缩倍数压缩倍数1 1)压缩前和压缩后的总的数据量之比)压缩前和压缩后的总的数据量之比2 2)平均比特数()平均比特数
22、(bpdpbpdp)表示表示n图像质量图像质量 重重建建图图像像质质量量信信噪噪比比SNR(SignalSNR(Signal Noise Noise Ration),Ration),即即信信号号与与噪噪声声的的方方差差之之比比。首首先先计计算算图图象象所所有有象象素素的的局局部部方方差差,将将局局部部方方差差的的最最大大值值认认为为是是信信号号方方差差,最最小小值是噪声方差,求出它们的比值值是噪声方差,求出它们的比值.40数据压缩算法的评价数据压缩算法的评价n压缩和解压缩的速度压缩和解压缩的速度对称压缩对称压缩非对称压缩非对称压缩压缩的计算量压缩的计算量41有损压缩编码技术有损压缩编码技术n预
23、测编码技术预测编码技术nJPEGJPEGnMPEGMPEG42预测编码技术预测编码技术n 根据离散信号之间存在着一定的相关性的特点,利用图像像素的以往样本值(前面一个或几个点的数据)对于新样本值(下一个点的数据)进行预测,然后将样本的实际值与其预测值相减得到一个误差值(较小),这样可以用比较少的数码进行编码得到较大的数据压缩结果,达到压缩数据的目的,因此预测编码技术是一种有失真编码方法。43n 最常用的是差值脉冲编码调制法,简称为DPCM。传传输输信信道道输入输入预测器预测器量化器量化器编码器编码器解码器解码器预测器预测器XnenXnen输出输出XnXnenXn预测编码技术预测编码技术44预测
24、编码技术预测编码技术u 设xn为tn时刻的亮度取样值,预测器根据tn时刻之前的样本值x1,x2,xn-1对xn作预测,得到预测值xn,xn 与xn之间的误差为:enxnxnu 接收端恢复的输出信号为xn是xn的近似值,两者的误差是:xnxnxnxn十en(xn十en)enen 45预测编码技术预测编码技术n 在预测编码中,量化器的量化对像是预测误差 enen分布在零值附近,正负两边的分布一般是对称的,图3-3 预测误差分布特性示意图。概率概率预测误差预测误差图图3-3 3-3 预测误差分布示意图预测误差分布示意图46量化输出输入电平非均匀量化间隔非均匀量化器非均匀量化器47预测编码技术预测编码
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 数据压缩 技术
限制150内