音频压缩编码原理及标准精选课件.ppt
《音频压缩编码原理及标准精选课件.ppt》由会员分享,可在线阅读,更多相关《音频压缩编码原理及标准精选课件.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于音频压缩编码原理及标准第一页,本课件共有67页主要内容:音频压缩编码的基本原理MPEG-1音频压缩编码标准杜比AC-3音频压缩算法MPEG-2音频压缩编码标准MPEG-4音频压缩编码标准第二页,本课件共有67页音频信号的分类:按照对声音质量的要求不同以及使用频带的宽窄,按照对声音质量的要求不同以及使用频带的宽窄,将音频信号分为以下将音频信号分为以下4 4类:类:窄带语音:又称电话频带语音,窄带语音:又称电话频带语音,300-3400Hz300-3400Hz,用于,用于各类电话通信,数字化时采样频率常用各类电话通信,数字化时采样频率常用8kHz8kHz。宽带语音:用于电话会议,视频会议,宽带
2、语音:用于电话会议,视频会议,50-7000Hz 50-7000Hz,数字化时采样频率常用,数字化时采样频率常用16kHz16kHz。数字音频广播:数字音频广播:20-15000Hz20-15000Hz,数字化时采样频率常,数字化时采样频率常用用32kHz32kHz。高保真立体声音频信号:高保真立体声音频信号:20-20KHz20-20KHz,用于,用于VCDVCD、DVDDVD、CDCD等,数字化时采样频率常用等,数字化时采样频率常用44.1kHz 44.1kHz 或或48kHz48kHz。第三页,本课件共有67页巨大的数据量给存储和传输带来的压力CD唱片Fs=44.1KHz 量化精度 16
3、bit 双声道数码率?1.41Mbit/s1S信号所需存储空间?176.4KB3.1 3.1 音频压缩编码的基本原理音频压缩编码的基本原理第四页,本课件共有67页音频信号压缩的可能性音频信号压缩的可能性数字音频信号中存在着大量冗余数字音频信号中存在着大量冗余频域冗余:频域冗余:1.低频成分比高频成分多低频成分比高频成分多2.语音信号的共振峰语音信号的共振峰时域冗余:时域冗余:1.小幅度样本比大幅度样值出现的概率大。小幅度样本比大幅度样值出现的概率大。2.相邻样值间的相关性相邻样值间的相关性3.信号周期的相关性信号周期的相关性4.长时自相关长时自相关5.话音间隙冗余话音间隙冗余听觉冗余:听觉冗余
4、:利用人耳的感知特性,将听不到的信号压缩掉。利用人耳的感知特性,将听不到的信号压缩掉。第五页,本课件共有67页声音压缩编码的声学原理声音压缩编码的声学原理声音信号的频率范围?20Hz-20KHz声音频谱的特点:高频段快速下降,高幅值大部分集中在中频段,有的延伸到低频段电平分布特点:声音信号的电平存在冗余第六页,本课件共有67页声音压缩编码的声学原理声音压缩编码的声学原理第七页,本课件共有67页掩蔽效应掩蔽效应一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响第八页,本课件共有67页掩蔽量与掩蔽声具有的声压级成正比掩蔽量与掩蔽声具有的声压级成正比掩蔽声的声压级越高、掩蔽的频率范
5、围随之加宽掩蔽声的声压级越高、掩蔽的频率范围随之加宽被掩蔽声的频率越接近掩蔽声,掩蔽效应越显著、掩蔽被掩蔽声的频率越接近掩蔽声,掩蔽效应越显著、掩蔽量增大量增大掩蔽声对于低于掩蔽声频率的声音掩蔽效果弱,对于高于掩蔽声对于低于掩蔽声频率的声音掩蔽效果弱,对于高于掩蔽声频率的声音掩蔽效果显著。掩蔽声频率的声音掩蔽效果显著。第九页,本课件共有67页利用声音的掩蔽效应,可以用有用的信号去掩蔽无用的信号只需把无用信号的声压级降至掩蔽域之下即可,无需消除无用分量第十页,本课件共有67页噪声对纯音的掩蔽噪声对纯音的掩蔽人耳听力系统 带通滤波器 对某频率的声音信号的拾取会采用中心频率接近此频对某频率的声音信号
6、的拾取会采用中心频率接近此频率的带通滤波器,因此,只有通过该带通滤波器的那部率的带通滤波器,因此,只有通过该带通滤波器的那部分噪声才会对该信号产生影响分噪声才会对该信号产生影响第十一页,本课件共有67页临界带宽描述人耳的滤波特性如果在一频带内噪声的功率等于该纯音的功率,且这时,纯音如果在一频带内噪声的功率等于该纯音的功率,且这时,纯音刚好能被听到(临界状态),此纯音附近的窄带噪声带宽的刚好能被听到(临界状态),此纯音附近的窄带噪声带宽的宽度便称为临界带宽宽度便称为临界带宽通常认为通常认为20Hz20KHz20Hz20KHz内有内有2424个临界频带个临界频带第十二页,本课件共有67页窄带噪声的
7、掩蔽效应要明显于纯音窄带噪声的掩蔽效应要明显于纯音声压级较低时,掩蔽仅局限于中心频率附近较窄的频率范围声压级较低时,掩蔽仅局限于中心频率附近较窄的频率范围随着声压级的提高,掩蔽区的频率范围加宽随着声压级的提高,掩蔽区的频率范围加宽随着声压级的提高,对高于中心频率的声音掩蔽作用加强随着声压级的提高,对高于中心频率的声音掩蔽作用加强第十三页,本课件共有67页时域掩蔽前向掩蔽:前向掩蔽:20ms20ms,由于人耳的积累效应,被掩蔽声尚未被听,由于人耳的积累效应,被掩蔽声尚未被听到,掩蔽声已经出现,其掩蔽效果很差到,掩蔽声已经出现,其掩蔽效果很差后向掩蔽:后向掩蔽:100ms100ms,由于人耳的存储
8、效应,掩蔽声虽已消失,由于人耳的存储效应,掩蔽声虽已消失,掩蔽效应仍然存在。掩蔽效应仍然存在。第十四页,本课件共有67页心理声学模型心理声学模型生理声学研究听觉器官的构造和听音机理心理声学研究听觉心理,研究主观量与客观 量之间的关系。心理声学模型中一个基本概念:听觉系统中存在一个听觉阈值电平,低于这个电平的音频信号就听不到,因此就可以把这部分信号忽略掉,无需对它进行编码,而不影响听觉效果心理声学模型要完成掩蔽阈值的估算,输出信号-掩蔽比率(SMR)第十五页,本课件共有67页利用人耳的听觉感知特性,使用心理声学模型,将人耳不能感知的声音成分去掉,只保留人耳能感知的声音成分。不为追求最小的量化噪声
9、,只要量化噪声不被人耳感知即可。感知音频编码(感知音频编码(MPEG)原理)原理第十六页,本课件共有67页音频编解码器的性能指标:重建的音频质量、数码率、复杂度和时延。研究 的基本问题是:更好的音频质量,并尽可能小的编解码时延和算法复杂度;降低数码率。重建音频质量的评价方法有客观评价和主观评价。第十七页,本课件共有67页分类方法一:时域编码 利用声音信号在时间域内幅度变化经PAM后形成的样本值,对不同样本值实现二进制码替代,从而形成数据码流频域编码 将时域中的声音信号进行频率变换,结合声音的相关性及人的感知,选取量化比特数进行编码统计编码 依据各个信号幅值出现的概率不同进行概率匹配编码音频压缩
10、编码的方法音频压缩编码的方法第十八页,本课件共有67页分类方法二:波形编码 对音频信号的时域或频域波形采样值进行编码。主要利用音频样值的幅度分布规律和相邻样值间的相关性进行压缩。参数编码 根据声音形成机理的分析,以重建语音信号具有足够可懂度的原则上,通过建立语音信号的产生模型,提取代表语音信号特征的参数进行编码混合编码 上述两种编码的混合音频压缩编码的方法音频压缩编码的方法第十九页,本课件共有67页结合声音幅度的出现概率来选取量化比特数进行编码,在满足一定的量化噪声下压缩数码率,从而降低比特率。时域编码时域编码第二十页,本课件共有67页利用人耳听觉的声掩蔽特性,在满足一定量化噪声下来压缩码率采
11、用滤波和变化,在频域内将其能量较小的分量忽略,从而实现降低比特率频域编码频域编码第二十一页,本课件共有67页频域编码频域编码子带编码:通过带通滤波器分成许多频带子带,分析每个子带取样的能量,依据心理声学模型来编码变换编码:变换到频域,根据心理声学模型对变换系数进行量化和编码第二十二页,本课件共有67页子带编码子带编码首先用一组带通滤波器把输入的音频信号分成若干个连续的子带,然后对每个子带中的音频信号单独编码,在接收端将各子带单独译码,然后组合、还原成音频信号。对每个子带的采样值分配不同的比特数。低频分配较多量化比特,高频分配较少量化比特。利用声音信号的频谱特点及人耳的感知模型。第二十三页,本课
12、件共有67页第二十四页,本课件共有67页变换编码变换编码声音信号从时域变为频域,用频率分量形式表示原信号,再对其频谱系数进行量化编码量化编码过程中,利用心理声学模型,对频谱系数进行优化,来实现对音频数据进行有效的压缩时频变化的方法:离散余弦变换DCT、改进的离散余弦变换MDCT第二十五页,本课件共有67页离散余弦变换(DCT)时频变换(DFT)变换时将PCM样值分为N长的一块块进行变换 块长:一块中包含的样本数N 窗长:N(1/Fs)频率分辨率:Fs/N 频率轴上的所能得到的最小频率间隔 块越长,变化编码的频率分辨率越高,但损失了时域分辨率块越长,变化编码的频率分辨率越高,但损失了时域分辨率逆
13、变换逆变换第二十六页,本课件共有67页离散余弦变换(DCT)将原信号沿负方向延拓定义域,并合理选择对称坐标轴,使其正、负轴对称,这样信号变为实轴对称的偶函数,DFT变换后仅有余弦项而不存在正弦项,运算量大为减小。原本的N个样本,经过对称后变为2N个 2N为抽取的样本值总数,为DCT变换的块长度。例:采样为48KHz的PCM样值进行DCT变换,窗长分别为21.33ms(相当于1024个样值),5.33ms(相当于256个样值),则频率分辨率和时间分辨率分别为?时间分辨率:长窗=2N(1/Fs)=42.68ms 短窗=2N(1/Fs)=10.66ms 频率分辨率:长窗=Fs/2N=23.43Hz
14、短窗=Fs/2N=93.75Hz 第二十七页,本课件共有67页依据各个信号幅值出现的概率不同进行概率匹配编码熵编码是依据声音信号幅度的概率分布特点,通过合理的比特数分配使得信号概率与比特数之间相匹配,以达到降低平均码长的目的统计编码统计编码第二十八页,本课件共有67页可变字长编码第二十九页,本课件共有67页MPEGMPEG Moving Picture coding Experts Group 活动图像专家组1988年由国际标准化组织ISO和国际电工委员会IEC联合成立的专家组,负责开发电视图像数据和声音数据的编码、解码和它们的同步等标准。已经开发和正在开发的MPEG标准有:MPEG-1:数字
15、存储媒体标准,1992年正式发布。MPEG-2:数字电视标准,1993年11月发布。MPEG-4:多媒体应用标准(1999年发布)。MPEG-7:多媒体内容描述接口标准(1998年10月)MPEG21:开放的多媒体传输和消费的框架。(2002年6月)3.2 MPEG-1音频压缩编码标准第三十页,本课件共有67页MPEG-1 音频压缩算法的特点世界上第一个高保真音频数据压缩标准输入线性PCM信号,采样频率可以为32kHz,44.1KHz,48KHz,输出数码率32-384kbit/s压缩后的比特流可以是:单声道模式/双-单声道模式/立体声模式/联合立体声模式提供3个独立的压缩层次:第1层(Lay
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 音频 压缩 编码 原理 标准 精选 课件
限制150内