第3章多媒体信息编码优秀课件.ppt
《第3章多媒体信息编码优秀课件.ppt》由会员分享,可在线阅读,更多相关《第3章多媒体信息编码优秀课件.ppt(128页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第3章多媒体信息编码1 1第1页,本讲稿共128页第3章 多媒体信息编码 3.1 引言引言 3.23.2无损数据压缩无损数据压缩无损数据压缩无损数据压缩3.3 3.3 有损压缩编码有损压缩编码2 2第2页,本讲稿共128页一、什么是数据压缩数据压缩就是在一定的精度损失条件下,以最少的数码表示信源所发出的信号.数据压缩处理一般由两个过程组成:一是编码过程,即对原始数据进行编码压缩,以便存储和传输;二是解码过程,即对压缩的数据进行解压,恢复成可用的数据。信源编码信道编码信道信道译码信源译码信源信宿3.1 引言3 3第3页,本讲稿共128页压缩/解压的过程EncoderDecoderInputMes
2、sageOutputMessageCompressedMessageaaaaaaaaaaaaaaaaaaaa20aaaaaaaaaaaaaaaaaaaaaCODEC4 4第4页,本讲稿共128页二、多媒体数据压缩编码的必要性 压缩编码的必要性和重要性压缩编码的必要性和重要性1.1.多媒体系统技术多媒体系统技术多媒体系统技术多媒体系统技术:面向三维图形、立体声、彩色全屏幕运动画面的面向三维图形、立体声、彩色全屏幕运动画面的面向三维图形、立体声、彩色全屏幕运动画面的面向三维图形、立体声、彩色全屏幕运动画面的处理技术;处理技术;处理技术;处理技术;多种媒体承载的由模拟量转化成数字量信息的获取、表示、
3、多种媒体承载的由模拟量转化成数字量信息的获取、表示、多种媒体承载的由模拟量转化成数字量信息的获取、表示、多种媒体承载的由模拟量转化成数字量信息的获取、表示、存储、传输、表现。存储、传输、表现。存储、传输、表现。存储、传输、表现。2.2.未压缩的数字化信息量未压缩的数字化信息量未压缩的数字化信息量未压缩的数字化信息量 1 1页页页页B5B5文件数据量约为文件数据量约为文件数据量约为文件数据量约为6.61MB/P6.61MB/P180255mm180255mm2 212122 2像素像素像素像素/mm/mm2 28bit1B/8bit=6.61MB/P8bit1B/8bit=6.61MB/P650
4、MB650MB的的的的CDROMCDROM存放存放存放存放98Pages98Pages5 5第5页,本讲稿共128页二、多媒体数据压缩编码的必要性 CD-ACD-A激光唱盘每秒采样位为激光唱盘每秒采样位为激光唱盘每秒采样位为激光唱盘每秒采样位为1.41Mbps1.41Mbps44kHz16bit/Hz44kHz16bit/Hz 样本样本样本样本2(2(声道声道声道声道)1.41Mbps1.41Mbps650MB650MB的的的的CDROMCDROM存放存放存放存放1 1小时音乐小时音乐小时音乐小时音乐 数字音频磁带数字音频磁带数字音频磁带数字音频磁带(DAT)(DAT)每秒采样位为每秒采样位为
5、每秒采样位为每秒采样位为768kbps768kbps48kHz16bit/Hz48kHz16bit/Hz 样本样本样本样本=768kbps=768kbps650MB650MB的的的的CDROMCDROM存放存放存放存放2 2小时节目小时节目小时节目小时节目 数字电视图像数字电视图像数字电视图像数字电视图像 SIF(Source input format)SIF(Source input format)格式、格式、格式、格式、NFSCNFSC制、彩色、制、彩色、制、彩色、制、彩色、4:4:44:4:4采样采样采样采样每帧每帧每帧每帧:3522403B=253KB:3522403B=253KB每秒
6、每秒每秒每秒:253KB30=7.603MBps:253KB30=7.603MBps每片每片每片每片CDROM:650MB253kB=2569CDROM:650MB253kB=2569帧帧帧帧/片片片片 (650MB7.603MB)60=1.42(650MB7.603MB)60=1.42分分分分/片片片片6 6第6页,本讲稿共128页二、多媒体数据压缩编码的必要性2.2.未压缩的数字化信息量未压缩的数字化信息量未压缩的数字化信息量未压缩的数字化信息量 数字电视图像数字电视图像数字电视图像数字电视图像 ICCR(International Consultative Committee for I
7、CCR(International Consultative Committee for Radio)Radio)格式、格式、格式、格式、PALPAL制、制、制、制、4:4:44:4:4采样采样采样采样每帧每帧每帧每帧:7205763B=1.24MB:7205763B=1.24MB每秒每秒每秒每秒:1.24MB25=31.1MBps:1.24MB25=31.1MBps每片每片每片每片CDROM:650MB1.24MB=524CDROM:650MB1.24MB=524帧帧帧帧/片片片片 650MB31.1MB=20.9650MB31.1MB=20.9秒秒秒秒/片片片片 陆地卫星陆地卫星陆地卫星陆
8、地卫星(LandSat-3)(LandSat-3)分辨率分辨率分辨率分辨率2340324023403240、4 4波段、波段、波段、波段、7 7位采样精度位采样精度位采样精度位采样精度每幅每幅每幅每幅:2340324074=212Mb:2340324074=212Mb每天每天每天每天:212Mb30=6.36Gbit:212Mb30=6.36Gbit每年每年每年每年:6.36Gbit365=2321.4Gbit=290GB:6.36Gbit365=2321.4Gbit=290GB7 7第7页,本讲稿共128页三、多媒体数据压缩的可能性 多媒体数据压缩的可能性(1 1)图像数据表示中大量冗余)图
9、像数据表示中大量冗余(2 2)图像数据压缩技术)图像数据压缩技术:利用图像数据冗余性减少数据量方法利用图像数据冗余性减少数据量方法1.1.空间冗余空间冗余空间冗余空间冗余 静态图像存在的主要冗余静态图像存在的主要冗余静态图像存在的主要冗余静态图像存在的主要冗余;采样点颜色之间的空间连贯性采样点颜色之间的空间连贯性采样点颜色之间的空间连贯性采样点颜色之间的空间连贯性:区域中各点光强、色彩、饱和度同区域中各点光强、色彩、饱和度同区域中各点光强、色彩、饱和度同区域中各点光强、色彩、饱和度同;离散像素采样表示颜色没有利用这种空间连贯性离散像素采样表示颜色没有利用这种空间连贯性离散像素采样表示颜色没有利
10、用这种空间连贯性离散像素采样表示颜色没有利用这种空间连贯性;改变颜色的像素存储方式改变颜色的像素存储方式改变颜色的像素存储方式改变颜色的像素存储方式,利用空间连贯性利用空间连贯性利用空间连贯性利用空间连贯性,减少数据量减少数据量减少数据量减少数据量.8 8第8页,本讲稿共128页图图BitmapBitmap颜色相同的块颜色相同的块帧内压缩帧内压缩帧内压缩例如,在静态图像中有一块表面颜色均匀的区域,在此区域中所有点的光强和色彩以及饱和度都是相同的,因此数据有很大的空间冗余。9 9第9页,本讲稿共128页2.2.时间冗余时间冗余时间冗余时间冗余序列图像序列图像序列图像序列图像(电视、运动图像电视、
11、运动图像电视、运动图像电视、运动图像)表示常包含的冗余表示常包含的冗余表示常包含的冗余表示常包含的冗余;相邻帧记录了相邻时刻的同一场景画面相邻帧记录了相邻时刻的同一场景画面相邻帧记录了相邻时刻的同一场景画面相邻帧记录了相邻时刻的同一场景画面,移动物移动物移动物移动物位置稍不同位置稍不同位置稍不同位置稍不同.运动图像一般为位于一时间轴区间的一组运动图像一般为位于一时间轴区间的一组连续画面,其中的相邻帧往往包含相同的背景和连续画面,其中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有移动物体,只不过移动物体所在的空间位置略有不同,所以后一帧的数据与前一帧的数据有许多不同,所以
12、后一帧的数据与前一帧的数据有许多共同的地方,这种共同性是由于相邻帧记录了相共同的地方,这种共同性是由于相邻帧记录了相邻时刻的同一场景画面,所以称为邻时刻的同一场景画面,所以称为时间冗余。时间冗余。同理,语音数据中也存在着时间冗余。同理,语音数据中也存在着时间冗余。1010第10页,本讲稿共128页时间冗余1111第11页,本讲稿共128页3.3.视觉冗余视觉冗余视觉冗余视觉冗余人类的视觉系统由于受生理特性的限制,对于图像场的注意是非均人类的视觉系统由于受生理特性的限制,对于图像场的注意是非均人类的视觉系统由于受生理特性的限制,对于图像场的注意是非均人类的视觉系统由于受生理特性的限制,对于图像场
13、的注意是非均匀的,人对细微的颜色差异感觉不明显。匀的,人对细微的颜色差异感觉不明显。匀的,人对细微的颜色差异感觉不明显。匀的,人对细微的颜色差异感觉不明显。例如,人类视觉的一般分辨能力为例如,人类视觉的一般分辨能力为例如,人类视觉的一般分辨能力为例如,人类视觉的一般分辨能力为2626灰度等级,而一般的图像的灰度等级,而一般的图像的灰度等级,而一般的图像的灰度等级,而一般的图像的量化采用的是量化采用的是量化采用的是量化采用的是2828灰度等级,即存在视觉冗余。灰度等级,即存在视觉冗余。灰度等级,即存在视觉冗余。灰度等级,即存在视觉冗余。人类的听觉对某些信号反映不太敏感,使得压缩后再还原有允人类的
14、听觉对某些信号反映不太敏感,使得压缩后再还原有允人类的听觉对某些信号反映不太敏感,使得压缩后再还原有允人类的听觉对某些信号反映不太敏感,使得压缩后再还原有允许范围的变化,人也感觉不出来。许范围的变化,人也感觉不出来。许范围的变化,人也感觉不出来。许范围的变化,人也感觉不出来。(1).(1).人类视觉系统对图像场的敏感性是非均匀的和非线性的人类视觉系统对图像场的敏感性是非均匀的和非线性的人类视觉系统对图像场的敏感性是非均匀的和非线性的人类视觉系统对图像场的敏感性是非均匀的和非线性的;(2).(2).记录图像时假定视觉系统是均匀和线性的记录图像时假定视觉系统是均匀和线性的记录图像时假定视觉系统是均
15、匀和线性的记录图像时假定视觉系统是均匀和线性的,对不同敏感区同样对待对不同敏感区同样对待对不同敏感区同样对待对不同敏感区同样对待,产生了视觉产生了视觉产生了视觉产生了视觉冗余冗余冗余冗余.应对不同敏感部分分开编码应对不同敏感部分分开编码应对不同敏感部分分开编码应对不同敏感部分分开编码;1212第12页,本讲稿共128页(3).(3).视觉的非均匀性视觉的非均匀性视觉的非均匀性视觉的非均匀性.视觉系统对图像的亮度和色彩度的敏感性相差很大,视觉系统对图像的亮度和色彩度的敏感性相差很大,视觉系统对图像的亮度和色彩度的敏感性相差很大,视觉系统对图像的亮度和色彩度的敏感性相差很大,RGBRGBNTSCN
16、TSC的的的的YIQYIQ后发现后发现后发现后发现,视觉系统的亮度视觉系统的亮度视觉系统的亮度视觉系统的亮度y y的敏感度远高于色度的敏感度远高于色度的敏感度远高于色度的敏感度远高于色度(I,Q)(I,Q)的敏感度的敏感度的敏感度的敏感度可对可对可对可对IQIQ允允允允许误差大于许误差大于许误差大于许误差大于y y的允许误差的允许误差的允许误差的允许误差;亮度增加时亮度增加时亮度增加时亮度增加时,视觉系统对量化误差的敏感度降低视觉系统对量化误差的敏感度降低视觉系统对量化误差的敏感度降低视觉系统对量化误差的敏感度降低,人眼辨别能力与物体周围人眼辨别能力与物体周围人眼辨别能力与物体周围人眼辨别能力
17、与物体周围的背景亮度成反比的背景亮度成反比的背景亮度成反比的背景亮度成反比.在高亮度区在高亮度区在高亮度区在高亮度区,灰度值的量化可粗糙一些灰度值的量化可粗糙一些灰度值的量化可粗糙一些灰度值的量化可粗糙一些;人眼的视觉系统能把图像的边缘和非边缘区域分开处理人眼的视觉系统能把图像的边缘和非边缘区域分开处理人眼的视觉系统能把图像的边缘和非边缘区域分开处理人眼的视觉系统能把图像的边缘和非边缘区域分开处理边缘区和非边缘区边缘区和非边缘区边缘区和非边缘区边缘区和非边缘区分别编码的依据分别编码的依据分别编码的依据分别编码的依据;人眼的视觉系统是把视网膜上的图像分解成若干个空间有向的视频通道后人眼的视觉系统
18、是把视网膜上的图像分解成若干个空间有向的视频通道后人眼的视觉系统是把视网膜上的图像分解成若干个空间有向的视频通道后人眼的视觉系统是把视网膜上的图像分解成若干个空间有向的视频通道后再进行处理再进行处理再进行处理再进行处理编码时把图像分解成符合这一规律编码时把图像分解成符合这一规律编码时把图像分解成符合这一规律编码时把图像分解成符合这一规律(视觉内在特性视觉内在特性视觉内在特性视觉内在特性)的频率通道的频率通道的频率通道的频率通道,可获大的压缩比可获大的压缩比可获大的压缩比可获大的压缩比;小波编码的特性小波编码的特性小波编码的特性小波编码的特性.1313第13页,本讲稿共128页4.4.结构冗余结
19、构冗余结构冗余结构冗余图像纹理区的像素值存在着分布模式图像纹理区的像素值存在着分布模式图像纹理区的像素值存在着分布模式图像纹理区的像素值存在着分布模式:如方格状地板图案如方格状地板图案如方格状地板图案如方格状地板图案;已知分布模式已知分布模式已知分布模式已知分布模式,可通过某一过程生成图像可通过某一过程生成图像可通过某一过程生成图像可通过某一过程生成图像.5.5.知识冗余知识冗余知识冗余知识冗余 有些图像的理解与某些知识有相当大的相关性有些图像的理解与某些知识有相当大的相关性有些图像的理解与某些知识有相当大的相关性有些图像的理解与某些知识有相当大的相关性,如人脸的图像有固定结构如人脸的图像有固
20、定结构如人脸的图像有固定结构如人脸的图像有固定结构;规律性结构可由先验知识和背景知识获得规律性结构可由先验知识和背景知识获得规律性结构可由先验知识和背景知识获得规律性结构可由先验知识和背景知识获得知识冗余知识冗余知识冗余知识冗余;由已有知识由已有知识由已有知识由已有知识,对图像中物体构造其基本模型对图像中物体构造其基本模型对图像中物体构造其基本模型对图像中物体构造其基本模型,创建对应各种特征的图像库创建对应各种特征的图像库创建对应各种特征的图像库创建对应各种特征的图像库:存存存存储时只需保存图像的一些特征参数储时只需保存图像的一些特征参数储时只需保存图像的一些特征参数储时只需保存图像的一些特征
21、参数;知识冗余是模型编码主要利用的特征知识冗余是模型编码主要利用的特征知识冗余是模型编码主要利用的特征知识冗余是模型编码主要利用的特征.6.6.图像区域的相同性冗余图像区域的相同性冗余图像区域的相同性冗余图像区域的相同性冗余图像中多个区域所对应的像素值相同或者相近图像中多个区域所对应的像素值相同或者相近图像中多个区域所对应的像素值相同或者相近图像中多个区域所对应的像素值相同或者相近,产生重复产生重复产生重复产生重复性存储性存储性存储性存储;向量量化向量量化向量量化向量量化(Vector quantization)(Vector quantization)是针对这种冗余的压缩是针对这种冗余的压缩
22、是针对这种冗余的压缩是针对这种冗余的压缩编码方法编码方法编码方法编码方法.1414第14页,本讲稿共128页时间域压缩迅速传输媒体信源频率域压缩并行开通更多业务空间域压缩降低存储费用能量域压缩降低发射功率四、数据压缩的好处多媒体数据压缩的必要性 数据存储 传输带宽1515第15页,本讲稿共128页五、压缩编码算法的性能评价指标数据压缩编码算法的评估指标包括:1.压缩比压缩比2.保真度保真度3.算法复杂性算法复杂性4.时延时延一个好的算法还要考虑:多媒体系统的软、硬件适应能力。多媒体系统的软、硬件适应能力。应用环境应用环境技术标准技术标准1616第16页,本讲稿共128页压缩编码算法的性能评价指
23、标压缩比:压缩比压缩前数据量压缩比压缩前数据量/压缩后数据量压缩后数据量理论上讲,在保证压缩后图像质量的前提下,压理论上讲,在保证压缩后图像质量的前提下,压缩比越高越好。缩比越高越好。保真性:保真是一个对压缩质量进行评价的参数,分为主观保真度保真是一个对压缩质量进行评价的参数,分为主观保真度和客观保真度。和客观保真度。客观保真度用重建信号质量与原信号之间的均方误客观保真度用重建信号质量与原信号之间的均方误差来衡量:差来衡量:x xi i和和和和x xi i 分别对应原信号和重建信号,分别对应原信号和重建信号,分别对应原信号和重建信号,分别对应原信号和重建信号,N N2 2为总信息数为总信息数为
24、总信息数为总信息数量。量。量。量。1717第17页,本讲稿共128页压缩编码算法的性能评价指标保真性:客观保真性:将均方误差作为由数据压缩而产生的噪声客观保真性:将均方误差作为由数据压缩而产生的噪声能量,定义压缩信噪比为能量,定义压缩信噪比为主观保真性:在规定的观测条件(图像尺寸、对主观保真性:在规定的观测条件(图像尺寸、对主观保真性:在规定的观测条件(图像尺寸、对主观保真性:在规定的观测条件(图像尺寸、对比度、亮度、观测距离等)下,对一组标准图像比度、亮度、观测距离等)下,对一组标准图像比度、亮度、观测距离等)下,对一组标准图像比度、亮度、观测距离等)下,对一组标准图像压缩前后的质量进行对比
25、的主观评定标准。具体压缩前后的质量进行对比的主观评定标准。具体压缩前后的质量进行对比的主观评定标准。具体压缩前后的质量进行对比的主观评定标准。具体做法是对重建信号的特性进行按等级评分,然后做法是对重建信号的特性进行按等级评分,然后做法是对重建信号的特性进行按等级评分,然后做法是对重建信号的特性进行按等级评分,然后根据下式计算平均分根据下式计算平均分根据下式计算平均分根据下式计算平均分MOSMOS:其中,其中,其中,其中,k k为级别数,为级别数,为级别数,为级别数,n ni i为该类别的人数,为该类别的人数,为该类别的人数,为该类别的人数,c ci i为分数。为分数。为分数。为分数。1818第
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体信息 编码 优秀 课件
限制150内