多媒体数据压缩技术课件.ppt
《多媒体数据压缩技术课件.ppt》由会员分享,可在线阅读,更多相关《多媒体数据压缩技术课件.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、网络与多媒体技术网络与多媒体技术关于多媒体数据关于多媒体数据压缩技技术现在学习的是第1页,共43页网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v由于多媒体数据量非常大,造成计算机的存储和网络传输负担由于多媒体数据量非常大,造成计算机的存储和网络传输负担若帧速率为25帧秒,则1s的数据量大约为25MB,一个640MB的光盘只能存放大约25s的动态图像一幅640480分辨率的24位真彩色图像的数据量约为900KB;一个100MB的硬盘只能存储约100幅静止图像画面v解决办法之一就是进行解决办法之一就是进行数据压缩数据压缩,压缩后再进行存储和传输,到需要时再,压缩后再进行存储和
2、传输,到需要时再解压、还原。解压、还原。以目前常用的位图格式的图像存储方式为例,像素与像素之间无论是在行方向还是在列方向都具有很大的相关性,因而整体上数据的冗余度很大,在允许一定限度失真的前提下,能够对图像数据进行很大程度的压缩。现在学习的是第2页,共43页网络与多媒体技术网络与多媒体技术v数据压缩方法数据压缩方法无损压缩:无损压缩:利用数据的统计冗余进行压缩,可完全恢复原始数据而不利用数据的统计冗余进行压缩,可完全恢复原始数据而不引入任何失真,但压缩率受到统计冗余度理论限制,一般引入任何失真,但压缩率受到统计冗余度理论限制,一般为为2:1到到5:1。多媒体应用中经常使用的无损压缩方法主要是基
3、于统多媒体应用中经常使用的无损压缩方法主要是基于统计的编码方案,如游程编码计的编码方案,如游程编码(run length)、Huffman编码、编码、算术编码和算术编码和LZW编码等等。编码等等。常用工具:常用工具:WinRar、WinZip、ARC等等 10.1 数据压缩概述数据压缩概述现在学习的是第3页,共43页网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v数据压缩方法数据压缩方法有损压缩:有损压缩:利用了人类视觉和听觉器官对图像或声音中的某些频率成利用了人类视觉和听觉器官对图像或声音中的某些频率成分不敏感的特性,允许在压缩过程中损失一定的信息;虽分不敏感的特性,允许
4、在压缩过程中损失一定的信息;虽然不能完全恢复原始数据,但是所损失的部分对理解原始然不能完全恢复原始数据,但是所损失的部分对理解原始图像或声音的影响较小,却换来了大得多的压缩比。有损图像或声音的影响较小,却换来了大得多的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩。压缩广泛应用于语音、图像和视频数据的压缩。常用的有损压缩方法有:常用的有损压缩方法有:PCM(脉冲编码调制脉冲编码调制)、预测编码、预测编码、变换编码变换编码(主要是离散余弦变换方法主要是离散余弦变换方法)、插值和外推法、插值和外推法(空域亚采空域亚采样、时域亚采样、自适应样、时域亚采样、自适应)等等。等等。常用工具:常用工具
5、:JPEG、MPEG等等 现在学习的是第4页,共43页网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v衡量一种数据压缩技术的好坏有三个重要的指标衡量一种数据压缩技术的好坏有三个重要的指标压缩比压缩比图像质量或音质图像质量或音质压缩和解压的速度压缩和解压的速度v数据压缩原理数据压缩原理原始的多媒体信源数据原始的多媒体信源数据存在着客观上的大量冗余。存在着客观上的大量冗余。信息理论认信息理论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。去掉冗余不会减少信息量,仍可原样恢复数据;但冗余度。去掉冗余不会减少信息量,
6、仍可原样恢复数据;但若减少了熵,数据则不能完全恢复。不过在允许的范围内损若减少了熵,数据则不能完全恢复。不过在允许的范围内损失一定的熵,数据仍然可以近似恢复。失一定的熵,数据仍然可以近似恢复。现在学习的是第5页,共43页网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v数据压缩原理数据压缩原理因为人的感觉的某些不敏感性,多媒体数据中还存在着因为人的感觉的某些不敏感性,多媒体数据中还存在着从主从主观感受角度观感受角度看去的大量冗余,即:看去的大量冗余,即:在人眼允许的误差范围之内,在人眼允许的误差范围之内,压缩前后的图像如果不做非常细致的对比是很难觉察出两者的差压缩前后的图像如
7、果不做非常细致的对比是很难觉察出两者的差别的。别的。统计编码统计编码:无失真编码。根据信息出现概率的分布特性进行的:无失真编码。根据信息出现概率的分布特性进行的压缩编码。压缩编码。预测编码预测编码:有失真编码。根据原始的离散信号之间存在关联性的:有失真编码。根据原始的离散信号之间存在关联性的特点,利用前面的一个或多个信号对下一个信号进行预测,然后特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差进行编码。对实际值和预测值的差进行编码。现在学习的是第6页,共43页网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v数据压缩原理数据压缩原理变换编码变换编码
8、。有失真编码。对原始数据从初始空间或时间域进行数。有失真编码。对原始数据从初始空间或时间域进行数学变换,使得信号中最重要的部分在变换域中易于识别,并且集学变换,使得信号中最重要的部分在变换域中易于识别,并且集中出现,可以重点处理;相反使能量较少的部分较分散,可以进中出现,可以重点处理;相反使能量较少的部分较分散,可以进行粗处理。行粗处理。三个步骤:变换、变换域采样和量化。三个步骤:变换、变换域采样和量化。分析分析合成编码合成编码。有失真编码。通过对原始数据的分析,将。有失真编码。通过对原始数据的分析,将其分解成一系列更适合表示的其分解成一系列更适合表示的“基元基元”或或“参数参数”,编码仅对这
9、编码仅对这些基本单元或参数进行。而译码时则借助于一定的规则或些基本单元或参数进行。而译码时则借助于一定的规则或模型,按照一定的算法将这些基元或参数再模型,按照一定的算法将这些基元或参数再“综合综合”成原数成原数据的一个逼近。据的一个逼近。现在学习的是第7页,共43页网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v数据压缩技术标准数据压缩技术标准H.26X。由。由CCITT(Consultative Committee of International Telegraph and Telephone 国际电报电话国际电报电话咨询委员会,从咨询委员会,从1993年年3月月1日起
10、,改组为日起,改组为ITU)制定的标)制定的标准。包括准。包括H.261、H.263、H.264,简称为,简称为H.26X主要应用于实时视频通信领域主要应用于实时视频通信领域H.261:是:是ITU-T为在综合业务数字网(为在综合业务数字网(ISDN)上开展双向声)上开展双向声像业务(可视电话、视频会议)而制定的,速率为像业务(可视电话、视频会议)而制定的,速率为64kb/s的整数的整数倍。倍。H.261只对只对CIF(352288)和)和QCIF(176144)两种)两种图像格式进行处理。图像格式进行处理。H.261是最早的运动图像压缩标准。是最早的运动图像压缩标准。现在学习的是第8页,共4
11、3页网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v数据压缩技术标准数据压缩技术标准H.263:在:在H.261的基础上发展而来的加强版,它借鉴了的基础上发展而来的加强版,它借鉴了MPEG-1的优点,支持的优点,支持PSTN,能在低带宽上传输高质量的,能在低带宽上传输高质量的视频流。视频流。H.264:由:由ISO/IEC(IEC,国际电工委员会)与,国际电工委员会)与ITU-T组成的组成的联合视频组(联合视频组(Joint Video Team,JVT)制定的新一代视频)制定的新一代视频压缩编码标准。在相同的重建图像质量下,压缩编码标准。在相同的重建图像质量下,H.264
12、比比H.263+和和MPEG-4减小减小50%码率,对信道时延的适应性较强,既可工码率,对信道时延的适应性较强,既可工作于低时延模式以满足实时业务,如会议电视等,又可工作作于低时延模式以满足实时业务,如会议电视等,又可工作于无时延限制的场合,如视频存储等;提高网络适应性,加于无时延限制的场合,如视频存储等;提高网络适应性,加强对误码和丢包的处理,提高解码器的差错恢复能力。强对误码和丢包的处理,提高解码器的差错恢复能力。现在学习的是第9页,共43页网络与多媒体技术网络与多媒体技术 音频信号压缩编码的主要依据是人耳的听觉音频信号压缩编码的主要依据是人耳的听觉特性,主要有两点:特性,主要有两点:v
13、1.1.人的听觉系统中存在一个人的听觉系统中存在一个听觉阈值电平听觉阈值电平,低于,低于这个电平的声音信号人耳听不到这个电平的声音信号人耳听不到 .v 2.2.人的听觉存在人的听觉存在屏蔽效应屏蔽效应。当几个强弱不同的声。当几个强弱不同的声音同时存在时,强声使弱声难以听到,并且两者之音同时存在时,强声使弱声难以听到,并且两者之间的关系与其相对频率的大小有关间的关系与其相对频率的大小有关 .声音编码算法就是通过这些特性来声音编码算法就是通过这些特性来去掉更多的去掉更多的冗余数据冗余数据,来达到压缩数据的目的。,来达到压缩数据的目的。10.2 音频数据的压缩音频数据的压缩现在学习的是第10页,共4
14、3页网络与多媒体技术网络与多媒体技术10.2 音频数据的压缩音频数据的压缩声音信号的基本参数:声音信号的基本参数:频率频率:信号每秒钟变化的次数。次声、可听声和超声:信号每秒钟变化的次数。次声、可听声和超声 振幅振幅:声波波形的最大位移。:声波波形的最大位移。音频压缩标准:音频压缩标准:电话质量的语音压缩标准电话质量的语音压缩标准:300Hz3.4KHz。当采样频率为当采样频率为8KHz,量化位数为,量化位数为8bit时所对应的速率为时所对应的速率为6kbit/s。调幅广播质量的音频压缩标准调幅广播质量的音频压缩标准:50Hz7KHz。当使用当使用16KHz的的抽样频率和抽样频率和14bit的
15、量化位数时,信号速率为的量化位数时,信号速率为224kbit/s。符合。符合1988年年ITU制定的制定的G.722标准。标准。高保真立体声音频压缩标准高保真立体声音频压缩标准:50Hz20KHz。在在44.1KHz抽样抽样频率下用频率下用16bit量化,信号速率为每声道量化,信号速率为每声道705kbit/s。目前比较目前比较成熟的标准为成熟的标准为“MPEG音频音频”。现在学习的是第11页,共43页网络与多媒体技术网络与多媒体技术 在多媒体中,音频有很多压缩编码标准:在多媒体中,音频有很多压缩编码标准:v1.MP31.MP3音频音频 MP3 MP3的全名是的全名是MPEG Audio La
16、yer-3MPEG Audio Layer-3,简单地说,简单地说就是一种声音文件的压缩格式。是目前最普及的就是一种声音文件的压缩格式。是目前最普及的音频压缩格式,是典型的有损压缩。音频压缩格式,是典型的有损压缩。MPEG-1MPEG-1音频压缩标准里包括了三个使用高性能音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案音频数据压缩方法的感知编码方案 ,按照压缩质,按照压缩质量量(每每BitBit的声音效果的声音效果)和编码方案的复杂程度分别和编码方案的复杂程度分别是是Layer1Layer1、Layer2Layer2、Layer3Layer3。10.2 音频数据的压缩音频数据的
17、压缩现在学习的是第12页,共43页网络与多媒体技术网络与多媒体技术vMPEG-1MPEG-1音频的层次与压缩比率音频的层次与压缩比率 Layer1(相当于384kbps立体声信号)4:1Layer2(相当于192256kbps立体声信号)6:18:1Layer3(相当于112154kbps立体声信号)10:112:1现在学习的是第13页,共43页网络与多媒体技术网络与多媒体技术 MP3MP3是利用是利用 MPEG Audio Layer 3 MPEG Audio Layer 3 的技术,将音的技术,将音乐以乐以1:10 1:10 甚至甚至 1:12 1:12 的压缩率,压缩成容量较小的压缩率,
18、压缩成容量较小的文件,换句话说,能够在音质丢失很小的情况的文件,换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非常好的保下把文件压缩到更小的程度。而且还非常好的保持了原来的音质。正是因为持了原来的音质。正是因为MP3MP3体积小,音质高的体积小,音质高的特点使得特点使得MP3MP3格式几乎成为网上音乐的代名词。每分格式几乎成为网上音乐的代名词。每分钟音乐的钟音乐的MP3MP3格式只有格式只有1MB1MB左右大小,这样每首歌的左右大小,这样每首歌的大小只有大小只有3-43-4兆字节。使用兆字节。使用MP3MP3播放器对播放器对MP3MP3文件进行文件进行实时的解压缩实时的解压
19、缩(解码解码),这样,高品质的,这样,高品质的MP3MP3音乐就播音乐就播放出来了。放出来了。MP3MP3音频音频现在学习的是第14页,共43页网络与多媒体技术网络与多媒体技术v 2.MP3PRO2.MP3PROv MP3PRO MP3PRO,它是,它是 Thomson MultimediaThomson Multimedia多媒体公司多媒体公司推出的一个推出的一个MP3MP3格式的升级版本,格式的升级版本,MP3PROMP3PRO可以把声可以把声音文件压缩到原有音文件压缩到原有MP3MP3格式的一半大小,但却可以保格式的一半大小,但却可以保持相同的音质。持相同的音质。v MP3Pro MP3
20、Pro制式是利用制式是利用低转送速率技术低转送速率技术(bit per bit per secsec),即平常一首),即平常一首MP3MP3的频率大多是的频率大多是128kbit128kbit,而,而MP3ProMP3Pro则固定于则固定于80kbit80kbit,降低码率就可以降低文件,降低码率就可以降低文件大小大小,把每首把每首MP3MP3所占空间减低到原有的所占空间减低到原有的5 5至至6 6成;但成;但音质却丝毫无损。音质却丝毫无损。10.2 音频数据的压缩音频数据的压缩现在学习的是第15页,共43页网络与多媒体技术网络与多媒体技术v 2.MP3PRO2.MP3PROv MP3PRO文
21、件在播放上完全与MP3兼容,也就是说,老的MP3文件可以在新的MP3PRO播放器上进行播放,同时,新的MP3PRO可以在标准的MP3软件和设备上播放,但效果可能较差,因为两者录制方式不同。10.2 音频数据的压缩音频数据的压缩现在学习的是第16页,共43页网络与多媒体技术网络与多媒体技术v 3.OGG3.OGGv Ogg是一种先进的有损的音频压缩技术,正式名称是Ogg Vorbis,是一种免费的开源音频格式。OGG编码格式远比90年代开发成功的MP3先进,它可以在相对较低的数据速率下实现比MP3更好的音质。v Ogg Vorbis支持VBR(可变比特率)和ABR(平均比特率)两种编码方式,Og
22、g还具有比特率缩放功能,可以不用重新编码便可调节文件的比特率。10.2 音频数据的压缩音频数据的压缩现在学习的是第17页,共43页网络与多媒体技术网络与多媒体技术v 3.OGG3.OGGv OGG格式可以对所有声道进行编码,支持多声道模式,而不像MP3只能编码双声道。多声道音乐会带来更多临场感,欣赏电影和交响乐时更有优势,这场革命性的变化是MP3无法支持的。在而且未来人们对音质要求不断提高,Ogg的优势将更加明显。10.2 音频数据的压缩音频数据的压缩现在学习的是第18页,共43页网络与多媒体技术网络与多媒体技术v 4.WMA 4.WMA v WMA(Windows MediaAudio)格式
23、是来自于微软的重量级选手,后台强硬,音质要强于MP3格式,更远胜于RA格式,它是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右.v WMA的另一个优点是内容提供商可以通过DRM(DigitalcentersManagement)方案如Windows Media centersManager7加入防拷贝保护。10.2 音频数据的压缩音频数据的压缩现在学习的是第19页,共43页网络与多媒体技术网络与多媒体技术v 4.WMA 4.WMA v WMA还支持音频流技术,适合在网络上在线播放,更方便的是不用象MP3那样需要安装额外的播放器,而Wind
24、ows操作系统和WindowsMediaPlayer的无缝捆绑让你只要安装了windows操作系统就可以直接播放WMA音乐,新版本的WindowsMediaPlayer7.0更是增加了直接把CD光盘转换为WMA声音格式的功能,在新出品的操作系统WindowsXP中,WMA是默认的编码格式.v 音质好的可与CD媲美,压缩率较高,可用于网络广播。10.2 音频数据的压缩音频数据的压缩现在学习的是第20页,共43页网络与多媒体技术网络与多媒体技术v 4.WMA 4.WMA v WMA(Windows MediaAudio)格式是来自于微软的重量级选手,后台强硬,音质要强于MP3格式,更远胜于RA格式
25、,它是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右.v WMA的另一个优点是内容提供商可以通过DRM(DigitalcentersManagement)方案如Windows Media centersManager7加入防拷贝保护。10.2 音频数据的压缩音频数据的压缩现在学习的是第21页,共43页网络与多媒体技术网络与多媒体技术v 4.WMA 4.WMA v WMA还支持音频流技术,适合在网络上在线播放,更方便的是不用象MP3那样需要安装额外的播放器,而Windows操作系统和WindowsMediaPlayer的无缝捆绑让你只要安装
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 数据压缩 技术 课件
限制150内