听觉系统的感知特性精.ppt
《听觉系统的感知特性精.ppt》由会员分享,可在线阅读,更多相关《听觉系统的感知特性精.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、听觉系统的感知特性第1页,本讲稿共37页第九章第九章 MPEG声音声音MPEG Audio 与感知特性(与感知特性(P136)心理声学模型(其余内容不作为考试范围)第2页,本讲稿共37页第十章第十章 MPEG电视电视 Mpeg-1;Mpeg-2均采用图像块单元,进行变换、量化、移动补偿等处理电视图像的数据率(电视图像的数据率(P154)ITU-R BT.601标准数据率VCD电视图象数据率的估算 DVD电视图象数据率的估算 第3页,本讲稿共37页第十章第十章 MPEG电视电视 数据压缩算法(10.2)电视图象压缩利用的各种冗余信息(电视图象压缩利用的各种冗余信息(P156表)表)MPEG专家组
2、定义的三种图象:帧内图象专家组定义的三种图象:帧内图象I(intra),预测图象,预测图象P(predicted)和双向预测图象和双向预测图象B(bidirectionally interpolated),典型的排列如图,典型的排列如图10-01所示(所示(P156)第4页,本讲稿共37页第十章第十章 MPEG电视电视 帧内图象I(intra)帧内图象I不参照任何过去的或者将来的其他图象帧,压缩编码采用类似JPEG压缩算法,它的框图如图10-02所示。如果电视图象是用RGB空间表示的,则首先把它转换成YCrCb空间表示的图象。每个图象平面分成88的图块,对每个图块进行离散余弦变换DCT(Dis
3、crete Cosine Transform)。DCT变换后经过量化的交流分量系数按照Zig-zag的形状排序,然后再使用无损压缩技术进行编码。DCT变换后经过量化的直流分量系数用差分脉冲编码DPCM(Differential Pulse Code Modulation),交流分量系数用行程长度编码RLE(run-length encoding),然后再用霍夫曼(Huffman)编码或者用算术编码。第5页,本讲稿共37页第十章第十章 MPEG电视电视 图10-02第6页,本讲稿共37页第十章第十章 MPEG电视电视预测图象预测图象P的压缩编码算法的压缩编码算法预测图象的编码也是以图象宏块(ma
4、croblock)为基本编码单元,一个宏块定义为IJ象素的图象块,一般取1616。预测图象P使用两种类型的参数来表示:一种参数是当前要编码的图象宏块与参考图象的宏块之间的差值差值,另一种参数是宏块的移动矢量第7页,本讲稿共37页要使预测图象更精度,就要求找到与参考宏块MRJ最佳匹配的预测图象编码宏块MPI。所谓最佳匹配是指这两个宏块之间的差值最小。第8页,本讲稿共37页第十章第十章 MPEG电视电视假设编码图象宏块MPI是参考图象宏块MRJ的最佳匹配块,它们的差值就是这两个宏块中相应象素值之差。对所求得的差值进行彩色空间转换,并作4:1:1的子采样得到Y,Cr和Cb分量值,然后仿照JPEG压缩
5、算法对差值进行编码,计算出的移动矢量也要进行霍夫曼编码。第9页,本讲稿共37页第十章第十章 MPEG电视电视10-04第10页,本讲稿共37页第十章第十章 MPEG电视电视双向预测图象双向预测图象B的压缩编码算法的压缩编码算法第11页,本讲稿共37页10.2.5 电视图象的结构电视图象的结构MPEG编码器算法允许选择I图象的频率和位置。I图象的频率是指每秒钟出现I图象的次数,位置是指时间方向上帧所在的位置。一般情况下,I图象的频率为2。MPEG编码器也允许在一对I图象或者P图象之间选择B图象的数目。I图象、P图象和B图象数目的选择依据主要是根节目的内容。例如,对于快速运动的图象,I图象的频率可
6、以选择高一些,B图象的数目可以选择少一点;对于满速运动的图象I图象的频率可以低一点,而B图象的数目可以选择多一点。此外,在实际应用中还要考虑媒体的速率。第12页,本讲稿共37页一个典型的I、P、B图象安排如图所示。编码参数为:帧内图象I的距离为N=15,预测图象(P)的距离为M=3。第13页,本讲稿共37页10.3 MPEG-2的配置和等级的配置和等级 在MPEG-2标准化阶段,考虑到要适应不同数据速率设备的应用,MPEG专家组定义了三种质量不同的编码方式:信噪比可变性(SNR/Signal-to-Noise Scalability),空间分辨率可变性(Spatial Scalability)
7、和时间分辨率可变性(Temporal Scalability)。第14页,本讲稿共37页信噪比可变性SNR(Signal-to-Noise scalability)是指图象质量的折中,对于数据率比较低的解码器使用比较低的信噪比,而对数据率比较高的解码器则使用比较高的信噪比;空间分辨率可变性(Spatial scalability)是指图象的空间分辨率的折中,对于低速率的接受器使用比较低的图象分辨率,而对于数据率比较高的接受器使用比较高的图象分辨率;时间分辨率可变性(Temporal Scalability)是指图象在时间方向上分辨率的折中,与空间分辨率类似。第15页,本讲稿共37页MPEG-2
8、为此引入了“配置(Profiles)”和参数“等级(Levels)的概念。每种配置定义一套新的算法,而每一个等级指定一套参数范围(如图象大小、帧速率和位速率)。第16页,本讲稿共37页10.4 MPEG-4电视图象编码 MPEG Video专家组建立了一个用来开发图象和电视图象编码技术的模型,叫做“试验模型(Test Model)”或者叫做“验证模型(VMVerification Model)”。这个模型描述了一个核心的编码算法平台,包括编码器、解码器以及位流(bitstream)的语法和语义.第17页,本讲稿共37页10.4.1 电视图象对象区的概念 MPEG-4 Video编码算法支持由M
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 听觉 系统 感知 特性
限制150内