书签分享收藏举报版权申诉 / 61

立即下载

当前位置：首页 > 教育专区 > 教案示例 > 第6章音频压缩编码技术及其国际标准课件.ppt

第6章音频压缩编码技术及其国际标准课件.ppt

上传人：飞****2

文档编号：70483492

上传时间：2023-01-20

格式：PPT

页数：61

大小：1.79MB

( 4.5 )

《第6章音频压缩编码技术及其国际标准课件.ppt》由会员分享，可在线阅读，更多相关《第6章音频压缩编码技术及其国际标准课件.ppt（61页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、1第六章音频压缩编码技术及其国际标准26.1 6.1 概述概述6.2 MPEG6.2 MPEG音频压缩编码音频压缩编码6.3 Dolby AC-36.3 Dolby AC-3数字音频压缩编码技术数字音频压缩编码技术36.1.1 人的听觉生理心理特性6.1.2 数字音频信号压缩编码的主要类型6.1.3 音频压缩编码技术标准介绍6.1 概述概述4声音（Audio）的传送是通信中不可或缺的内容电视及图像通信中除了传送图像外，传送声音也是极为重要的。如在会议电视中，由于通信线路带宽的限制，图像是可以跳帧的，每秒钟能传10帧已经很不错了，但语音的传送却不可以是断续的，而且要有较高的音质。6.1 概述概

2、述5数字声音信号的数据量相比数字视频要小很多，但是如果不压缩的话，对传输和存储的压力还是很大。数字声音信号与图像信号一样，通过取样、量化、编码后的数据也非常大。如CD机，采用44.1kHz取样，16bit量化，即使单声道，其编码数据也达到：44.1X16705.6kbits传输与存储均有很大困难。6.1 概述概述6 声声音音编编码码（Audio Audio CodingCoding）是是一一类类高高保保真真的的音音频频编编码，它的带宽应为码，它的带宽应为20Hz20Hz至至20KHz20KHz。但但在在许许多多场场合合，主主要要是是传传送送语语音音，而而不不是是主主要要传传送送音音乐乐，故故音

3、音频频带带宽宽在在50Hz50Hz至至7KHz7KHz就就够够了了。在在电电话话通通信信中中，其其带带宽宽只只有有300Hz300Hz至至3.4KHz3.4KHz，在在声声音音编编码码中中，主主要要是是传传送送语语音音的的一一类类编编码码称称之之为为语语音音编编码码（Speech Speech CodingCoding）。在在电电视视电电话话及及会会议议电电视视中中主主要要是是语语音音编编码码，而而数数字字电电视视、高高清清晰度电视中的伴音却是属于高保真度的音频晰度电视中的伴音却是属于高保真度的音频编码。编码。6.1 概述概述7声音简介声音简介n声音是听觉器官对声波的感知声音是听觉器官对声波的

4、感知n声波是通过空气或其他介质传播的连续振动声波是通过空气或其他介质传播的连续振动6.1 概述概述8声波具有普通波所具有的特性声波具有普通波所具有的特性反射 reflection折射 refraction衍射diffraction干涉 interference共振 resonance声强、响度：声波的压强，或能量，或振幅声强、响度：声波的压强，或能量，或振幅音高、音调：声波的频率音高、音调：声波的频率音色、音品：声波的谐波频谱和包络决定音色、音品：声波的谐波频谱和包络决定6.1 概述概述96.1 概述概述10 声音信息能够压缩的基本依据是声音信息能够压缩的基本依据是（1 1）声音信息的冗余度

5、）声音信息的冗余度（2 2）人类的听觉特性）人类的听觉特性 6.1 概述概述11（1 1）声音信息的冗余度）声音信息的冗余度从从信信息息保保持持的的角角度度讲讲，只只有有当当信信源源本本身身具具有有冗冗余度，才能对其压缩。余度，才能对其压缩。语语音音和和音音乐乐信信号号中中正正是是存存在在着着时时域域信信息息冗冗余余及及频频域域信信息息冗冗余余，所所以以可可以以进进行行压压缩缩。这这是是对对音音频频信信号进行压缩的一个理论基础。号进行压缩的一个理论基础。6.1 概述概述12（2 2）人类的听觉特性）人类的听觉特性语语音音和和音音乐乐信信号号最最终终是是传传送送给给人人听听的的，人人的的听

6、听觉觉生生理理心理特性在整个音频传输过程中起着重要的作用。心理特性在整个音频传输过程中起着重要的作用。由由于于人人们们的的听听觉觉系系统统存存在在着着某某些些不不敏敏感感效效应应，对对于于某某些些情情况况下下的的音音频频不不能能被被感感知知，因因此此从从感感知知效效果果来来看看，这这些些不敏感的音频分量可认为是知觉冗余。不敏感的音频分量可认为是知觉冗余。如如果果将将这这部部分分冗冗余余压压缩缩掉掉，可可提提高高编编码码效效率率。这这是是音音频压缩的另一个理论基础。频压缩的另一个理论基础。6.1 概述概述13音频数据压缩一般有两种方法：（1）利用信号本身的统计特性，在完全不丢失信息的情况下，进行

7、高效的熵编码(平均信息量编码)；（2）利用人们对音频信号的感知特性，通过省略人们所不能分辨或不敏感的信息来压缩信息量，这就是知觉编码。6.1 概述概述14音频数音频数据压缩据压缩一般有一般有两个途两个途径径利用信号本身的统计利用信号本身的统计特性，在完全不丢失信特性，在完全不丢失信息的情况下，进行息的情况下，进行高效高效高效高效的熵编码的熵编码的熵编码的熵编码 (平均信息量编码平均信息量编码)；利用人们对音频信号的感利用人们对音频信号的感知特性，通过省略人们所知特性，通过省略人们所不能分辨或不敏感的信息不能分辨或不敏感的信息来压缩信息量，这就是来压缩信息量，这就是知觉编码知觉编码知觉编码知觉

8、编码。针对音频中存在针对音频中存在的冗余，目前实的冗余，目前实用的有熵编码和用的有熵编码和知觉编码两种方知觉编码两种方法法。6.1 概述概述15声音质量评价的两种方法客观质量度量用信噪比(SNR)主观质量度量专家打分有时同时采取两种方法评估，有时以主观质量度量为主6.1 概述概述16信噪比信噪比SNR(signal-to-noise ratio)SNR(signal-to-noise ratio)SNR表示信号能量和噪声能量的比，单位为分贝表示信号能量和噪声能量的比，单位为分贝(db)6.1 概述概述17主观平均分主观平均分(mean opinion score(mean opinion

9、 score，MOS)MOS)分数分数质量等级质量等级失真级别失真级别5优优(Excellent)无察觉无察觉4良良(Good)(刚刚)察觉但不讨厌察觉但不讨厌3中中(Fair)(察觉察觉)有点讨厌有点讨厌2差差(Poor)讨厌但不反感讨厌但不反感1劣劣(Bad)极讨厌极讨厌(令人反感令人反感)表：表：声音质量声音质量MOSMOS评分标准评分标准6.1 概述概述18u 对响度的感知对响度的感知声音的响度就是声音的强弱声音的响度就是声音的强弱在物理上，用声强在物理上，用声强W/cm2或声压或声压dyn/cm2度量度量在心理上，用在心理上，用phon（方）或（方）或sone（宋）度量（宋）度量

10、人耳的听觉范围人耳的听觉范围听阈：人耳朵刚可听见的声音强度听阈：人耳朵刚可听见的声音强度痛域：使人耳感到疼痛的声音强度痛域：使人耳感到疼痛的声音强度听觉范围：听阈和痛域之间听觉范围：听阈和痛域之间6.1.1 人的听觉生理人的听觉生理心理特性心理特性19“听阈频率”曲线和“痛阈频率”曲线6.1.1 人的听觉生理人的听觉生理心理特性心理特性20u 人耳能够感知的频率范围约人耳能够感知的频率范围约20-20000Hz20-20000Hz高保真声音高保真声音(high-fidelity audio):(high-fidelity audio):10 10 20000 Hz20000 Hz声音声音(au

11、dio/sound):20(audio/sound):20 20 000Hz20 000Hz话音话音(speech/voice):300(speech/voice):3003400 Hz3400 Hz亚音亚音/次音次音(subsonic):20 Hz(subsonic):20000 Hz(ultrasonic):20000 Hz6.1.1 人的听觉生理人的听觉生理心理特性心理特性21u 对频率的感知表现为音高对频率的感知表现为音高客观上用频率表示声音的音高，单位是客观上用频率表示声音的音高，单位是HzHz主观感觉的音高单位则是主观感觉的音高单位则是“美美(Mel)(Mel)”主观音高与客观音高

12、是对数关系主观音高与客观音高是对数关系6.1.1 人的听觉生理人的听觉生理心理特性心理特性22n“音高频率”曲线6.1.1 人的听觉生理人的听觉生理心理特性心理特性23u 临界频带临界频带人耳刚刚可以感知两种频率的声音有差别的频人耳刚刚可以感知两种频率的声音有差别的频率范围率范围临界频带的单位叫做临界频带的单位叫做Bark(Bark(巴克巴克)，1Bark1Bark等于一等于一个临界频带的宽度。个临界频带的宽度。通常认为音频有通常认为音频有2525个临界频带，见表。个临界频带，见表。临界频带的宽度随频率的变化而变化临界频带的宽度随频率的变化而变化6.1.1 人的听觉生理人的听觉生理心理特性心理

13、特性246.1.1 人的听觉生理人的听觉生理心理特性心理特性25u 掩蔽效应掩蔽效应一个声音阻碍听觉系统感受另一个声音的现象一个声音阻碍听觉系统感受另一个声音的现象前者称为掩蔽声音前者称为掩蔽声音(masking tone)(masking tone)后者称为被掩蔽声音后者称为被掩蔽声音(masked tone)(masked tone)26 在在音音频频信信号号的的知知觉觉编编码码中中，利利用用了了人人们们听听觉觉的的生生理理心心理理特特性性对对感感知知的的影影响响，例例如如人人耳耳的的掩掩蔽蔽效效应应、频频域域灵灵敏敏度度以以及及相位的不敏感特性等相位的不敏感特性等。听听觉觉的的掩掩蔽蔽

14、效效应应是是声声音音编编码码的的基基础础，掩掩蔽蔽效效应应既既和和频频率率域域有有关关，亦亦和和时间域有关。时间域有关。6.1.1 人的听觉生理人的听觉生理心理特性心理特性27人人的的听听觉觉生生理理-心理特性心理特性1)频谱掩蔽效应频谱掩蔽效应2)时间掩蔽效应时间掩蔽效应3)方向掩蔽效应方向掩蔽效应6.1.1 人的听觉生理人的听觉生理心理特性心理特性28 1)频谱掩蔽效应频谱掩蔽效应一个强纯音掩蔽了其附近同时发声的弱纯音的特性，也称同时掩蔽(simultaneous masking)图6.1中示出若有一个声压强度达70dB频率1KHz的纯音出现时，处于1KHz邻近某一频带内强度较小的声音信号

15、人耳是听不见的，即被1KHz纯音掩蔽掉了。图中示出了1KHz纯音的掩蔽阈曲线，一般一个纯音的声压强度越大，对周围频率的掩蔽作用越强。由于处于掩蔽阈曲线下的声音听不见，故这些信息是多余的，无需参与编码输出。6.1.1 人的听觉生理人的听觉生理心理特性心理特性29图图6.1 人耳听觉的频率特性曲线人耳听觉的频率特性曲线30频域掩蔽特性频域掩蔽特性频率越接近，掩蔽效果越明显频率越接近，掩蔽效果越明显高频方向的掩蔽效果强于低频方向高频方向的掩蔽效果强于低频方向不同纯音的掩蔽效应曲线6.1.1 人的听觉生理人的听觉生理心理特性心理特性31信掩比信掩比SMR(signalSMR(signal-to-mas

16、k ratio)-to-mask ratio)子带的信号能量除以子带的最小掩蔽阈值子带的信号能量除以子带的最小掩蔽阈值SMRSMR小于等于小于等于1 1的子带信号是听不到的的子带信号是听不到的l噪掩比噪掩比NMR(noiseNMR(noise-to-mask ratio)-to-mask ratio)噪声除以最小掩蔽阈值噪声除以最小掩蔽阈值噪声是量化带来的，通过控制量化步长可以控噪声是量化带来的，通过控制量化步长可以控制量化噪声，使噪声能够被掩蔽掉制量化噪声，使噪声能够被掩蔽掉l这里所说的掩蔽阈值是全局掩蔽阈值，全这里所说的掩蔽阈值是全局掩蔽阈值，全局掩蔽需要根据实际情况计算得到。局掩蔽需要根

17、据实际情况计算得到。6.1.1 人的听觉生理人的听觉生理心理特性心理特性322)时间掩蔽效应时间掩蔽效应（Temporal Masking EffectTemporal Masking Effect）除除了了在在强强的的声声音音信信号号出出现现的的同同时时弱弱信信号号会会被被掩掩蔽蔽掉掉（称称为为同同时时掩掩蔽蔽）外外，在在强强的的声声音音信信号号出出现现之之前前或或之之后后的的短短暂暂时时间间内内已已存存在在的的弱弱音音信信号号也也会会被被强强信信号号掩掩蔽蔽掉掉，分分别别称称为为前前掩掩蔽蔽和和后后掩掩蔽蔽。如如图图6.26.2所示。这种现象所示。这种现象称时间掩蔽效应称时间掩蔽效应在在

18、声声音音编编码码时时，将将时时间间上上相相继继的的一一些些取取样样值值合合并并为为组组块块以以降降低低码码率率，就就是是利利用用上上述述人人类类听听觉觉的的时时间掩蔽特性而确定的。间掩蔽特性而确定的。6.1.1 人的听觉生理人的听觉生理心理特性心理特性33图图6.2 时间掩蔽效应时间掩蔽效应6.1.1 人的听觉生理人的听觉生理心理特性心理特性前掩蔽通常有3ms 20ms,后掩蔽可以持续50ms100ms 34l产生时域掩蔽的主要原因产生时域掩蔽的主要原因人的大脑处理信息需要花费一定的时间人的大脑处理信息需要花费一定的时间6.1.1 人的听觉生理人的听觉生理心理特性心理特性353)方向掩蔽效应方

19、向掩蔽效应人人耳耳除除具具有有听听觉觉掩掩蔽蔽效效应应外外，还还不不能能分分别别判判断断频频率率接接近近的的高高频频声声音音信信号号的的方方向向，在在声声音音编编码码中中可可利利用用此此特特性性，把把多多个个声声道道的的高高频频部部分分耦耦合合到到一一个个公公共共声声道道，以以达达到到压压缩缩编编码的目的。码的目的。6.1.1 人的听觉生理人的听觉生理心理特性心理特性36 6.1.2 数字音频信号压缩编码的主要类型数字音频信号压缩编码的主要类型3）参数编码）参数编码1）熵编码）熵编码2）波形编码）波形编码4）混合编码）混合编码37典型的声音采样参数质量质量采样频率采样频率(kHz)采样深度采

20、样深度(bit)单道声单道声/立立体声体声(未压缩的未压缩的)数数据率据率(kb/s)频率范围频率范围(Hz)电话电话*88单道声单道声64.0 2003400AM11.0258单道声单道声88.22015000FM22.05016立体声立体声705.6507000CD44.116立体声立体声1411.22020000DAT4816立体声立体声1536.02020000*电话使用律编码，动态范围为13位，压缩后的样本精度为8位6.1.2 数字音频信号压缩编码的主要类型数字音频信号压缩编码的主要类型38 数数字字音音频频信信号号的的压压缩缩编编码码主主要要分分为为熵熵编编码码、波形编码、参数编码

21、、混合编码四种类型。波形编码、参数编码、混合编码四种类型。1)1)熵编码熵编码音音频频信信息息与与视视频频信信息息的的熵熵编编码码基基本本原原理理相相同同，主要主要包括霍夫曼编码、算术编码与游程编码包括霍夫曼编码、算术编码与游程编码。6.1.2 数字音频信号压缩编码的主要类型数字音频信号压缩编码的主要类型392)2)波形编码波形编码当当音音频频信信号号数数字字化化后后，考考虑虑人人类类的的听听觉觉特特性性，使使编编码码信信号号尽尽可可能能既既与与原原始始输输入入信信号号相相匹匹配配，又又能能适适应应人人们们的的应应用用要要求求。波波形形编编码码主主要要包包括括全全频频带带编编码码、子子带带

22、编编码码和和矢矢量量量量化化编编码码，主主要要有有：PCM(PCM(脉脉冲冲编编码码调调制制)、DPCMDPCM（差差分分脉脉冲冲编编码码调调制制）、ADPCMADPCM（自自适适应应差差分分脉脉冲冲编编码码调调制制）、SBCSBC（子子带带编编码码）。波波形形编编码码能能够够在在高高码码率率的的条条件件下下获获得得高高质质量量的的音音频频信号，因而适于高保真语音及音乐信号的压缩编码信号，因而适于高保真语音及音乐信号的压缩编码。6.1.2 数字音频信号压缩编码的主要类型数字音频信号压缩编码的主要类型40DPCM(differentialDPCM(differential pulse code

23、modulation)pulse code modulation)基本思想：根据过去的样本去估算下一个样本信号的幅度大小，这个值称为预测值，然后对实际信号值与预测值之差进行量化编码DPCM与PCM的不同可适应大范围变化的输入信号 6.1.2 数字音频信号压缩编码的主要类型数字音频信号压缩编码的主要类型41ADPCMADPCM (adaptive difference pulse (adaptive difference pulse codemodulationcodemodulation)核心思想利用自适应的思想改变量化阶的大小，即使用小的量化阶去编码小的差值，使用大的量化阶去编码大的差值使用

24、过去的样本值估算下一个输入样本的预测值，使实际样本值和预测值之间的差值总是最小接收端的译码器使用与发送端相同的算法，利用传送来的信号来确定量化阶和预测值 6.1.2 数字音频信号压缩编码的主要类型数字音频信号压缩编码的主要类型42SBC(subSBC(sub-band coding)-band coding)用一组带通滤波器把输入声音信号的频带分成若干个连续的频段，每个频段称为子带。对每个子带中的声音信号采用单独的编码方案去编码在信道上传送时，将每个子带的代码复合在一起；在接收端译码时，将每个子带的代码单独译码，然后把它们组合起来，还原成原来的声音信号6.1.2 数字音频信号压缩编码的主要类型

25、数字音频信号压缩编码的主要类型43好处有两个根据每个子带信号的特点进行自适应控制量化阶根据每个子带信号在感觉上的重要性进行自适应控制6.1.2 数字音频信号压缩编码的主要类型数字音频信号压缩编码的主要类型44LPC(linearLPC(linear predictive coding)predictive coding)话音压缩技术将话音生成机理模型化为若干参数使用线性预测分析话音参数话音合成器根据参数合成话音可以达到极低的码率，但是质量也比较低，而且无法提高6.1.2 数字音频信号压缩编码的主要类型数字音频信号压缩编码的主要类型453)3)参数编码参数编码参参数数编编码码是是指指使使用用合

26、合适适的的模模型型参参数数与与参参考考激激励励信信号号来来模模拟拟音音频频信信号号进进行行编编码码，当当声声音音重重放放时时，根根据据这这些些参参数数重重建建音音频频信信号号，这这就就是是通通常常所所说说的的声声码码器器(VocoderVocoder)。参参数数编编码码压压缩缩比比很很高高，但但计计算算量量也很大，因而也很大，因而不适合高保真度要求不适合高保真度要求的应用场合。的应用场合。6.1.2 数字音频信号压缩编码的主要类型数字音频信号压缩编码的主要类型464)4)混合编码混合编码混混合合编编码码充充分分吸吸收收了了波波形形编编码码与与参参数数编编码码的的优优点点，并并将将二二者者相相

27、结结合合，它它包包括括多多脉脉冲冲线线性性预预测测编编码码(MP-LPC)(MP-LPC)、矢矢量量和和激激励励线线性性预预测测编编码码(VSELP)(VSELP)、码码本本激激励励线线性性预预测测编编码码(CELP)(CELP)、短短时时延延码码本本激激励励线线性性预预测测编编码码(LD-CELP)(LD-CELP)、长长时时延延线线性性预预测测规规则则码码激激励励(RPE-LTP)(RPE-LTP)等。等。表表6.16.1列列出出了了音音频频信信号号数数字字压压缩缩编编码码算算法法及及其其特性特性6.1.2 数字音频信号压缩编码的主要类型数字音频信号压缩编码的主要类型47表表6.16.1音

28、频信号数字压缩编码算法及其特性音频信号数字压缩编码算法及其特性算法名称数据率(kb/s)标准应用质量波形编码 PCM 均匀量化公共网 ISDN 配音4.04.5(A)(A)64G711 APCM 自适应量化 DPCM 差值量化 ADPCM 自适应差值量化 32G721 SB-ADPCM 子带一自适应差值量化 64G722 53,63G723参数编码 LPC 线性预测编码 2.4保密话声2.53.5 混合编码 CELPC 码激励LPC 4.6移动通信 VSELP 矢量和激励LPC 8语音邮件4.03.7 RPE-LTP长时预测规则码激励 13.2G728 ISDNLD-CELP

29、短延时码激励LPC 16G729 MPEG 多子带感知编码 128MPEG CD 5.0杜比AC-3 感知编码AC-3 音响 5.048部分音频编码技术质量比较编码器MOS分64 kb/s64 kb/s脉冲脉冲编码调编码调制制(PCM)(PCM)4.34.332 kb/s32 kb/s自适自适应应差分脉冲差分脉冲编码调编码调制制(ADPCM)(ADPCM)4.14.116 kb/s16 kb/s低低时时延延码码激励激励线线性性预测编码预测编码(LD-CELP)(LD-CELP)4.04.08 kb/s8 kb/s码码激励激励线线性性预测编码预测编码(CELP)(CELP)3.73.73.8 k

30、b/3.8 kb/码码激励激励线线性性预测编码预测编码(CELP)(CELP)3.03.02.4 kb/s2.4 kb/s线线性性预测编码预测编码(LPC)(LPC)2.52.5表：部分编码器的MOS分 6.1.2 数字音频信号压缩编码的主要类型数字音频信号压缩编码的主要类型49 1)1)电话质量的音频压缩编码技术标准电话质量的音频压缩编码技术标准电电话话质质量量语语音音信信号号的的频频率率范范围围为为300Hz 300Hz 3400Hz3400Hz，采采用用标标准准的的脉脉冲冲编编码码调调制制(PCM)(PCM)，采采样样频频率为率为8kHz8kHz、8bit8bit量化时，码率为量化时，

31、码率为64kb64kbs s。19721972年年CCITT(CCITT(现现为为ITU-T)ITU-T)制制定定的的PCMPCM标标准准G.711G.711正正是是针针对对电电话话质质量量语语音音信信号号的的压压缩缩编编码码标标准准，其其码码率率为为64kb64kbs s，采采用用非非线线性性量量化化，质质量量相相当当于于12bit12bit线性量化。线性量化。6.1.3 音频压缩编码技术标准介绍音频压缩编码技术标准介绍50 1)1)电话质量的音频压缩编码技术标准电话质量的音频压缩编码技术标准 19841984年年，CCITTCCITT公公布布了了自自适适应应差差分分脉脉冲冲编编码码调调制制

32、(ADPCM)(ADPCM)标标准准G.721G.721，码码率率为为32kb32kbs s，ADPCMADPCM能能够对中等电话质量要求的信号进行高效编码。够对中等电话质量要求的信号进行高效编码。6.1.3 音频压缩编码技术标准介绍音频压缩编码技术标准介绍51 19921992年年，CCITTCCITT制制定定了了短短时时延延码码本本激激励励线线性性预预测测编编码码(LD-CELP)(LD-CELP)标标准准G.728G.728，码码率率为为16kb16kbs s，其其质量与质量与32kb32kbs s的的G.721G.721标准大致相当。标准大致相当。码码本本激激励励线线性性预预测测编编码

33、码(CELP)(CELP)实实际际上上是是一一个个闭闭环环LPCLPC系系统统，由由输输入入语语音音信信号号确确定定最最佳佳参参数数，再再根根据据最最小小误误差差准准则则从从码码本本中中找找出出最最佳佳激激励励码码本本矢矢量量。CELPCELP具具有有较较强强的的抗抗干干扰扰能能力力，它它在在4 416kb16kbs s的的传传输速率下可获得较高质量的语音信号。输速率下可获得较高质量的语音信号。6.1.3 音频压缩编码技术标准介绍音频压缩编码技术标准介绍52 19881988年年，欧欧洲洲数数字字移移动动特特别别工工作作组组制制定定了了采采用用长长时时延延线线性性预预测测规规则则码码本本激激励

34、励(RPE-LTP)(RPE-LTP)技技术术的的GSMGSM标准，码率为标准，码率为13kb13kbs s。19891989年年，美美国国制制定定了了采采用用矢矢量量和和激激励励线线性性预预测测技技术术(VSELP)(VSELP)的的用用于于数数字字移移动动通通信信的的语语音音标标准准CTIACTIA，码码率为率为8kb8kbs s。6.1.3 音频压缩编码技术标准介绍音频压缩编码技术标准介绍532)2)调幅广播质量的音频压缩编码技术标准调幅广播质量的音频压缩编码技术标准调调幅幅广广播播质质量量音音频频信信号号的的频频率率范范围围为为50Hz50Hz7kHz7

35、kHz，CCITTCCITT于于19881988年年制制定定了了G.722G.722标标准准，它它采采用用16kHz16kHz采采样样、14bit14bit量量化化，信信号号数数据据速速率率为为224kb224kbs s，通通过过采采用用子子带带编编码码方方法法将将输输入入音音频频信信号号经经滤滤波波器器分分为为高高、低低子子带带，再再分分别别进进行行ADPCMADPCM编编码码，随随后后混混合合形形成成输输出出码码流流，ADPCMADPCM可可将将224kb224kbs s的的码码率率压压缩缩为为64kb64kbs s，最最后后进进行行数数据据插插入入(最最高高插插入入速速率可达率可达16k

36、b16kbs)s)。6.1.3 音频压缩编码技术标准介绍音频压缩编码技术标准介绍54 3)3)高保真立体声音频压缩编码技术标准高保真立体声音频压缩编码技术标准高高保保真真度度声声音音信信号号如如CDCD音音质质的的数数字字音音频频信信号号，取取样样频频率率取取为为44.1KHz44.1KHz，量量化化级级数数取取为为16bit16bit时时，双双声声道道的的数数码码率率即即为为1.4Mb/s1.4Mb/s。对对于于高高保保真真度度的的声声音音信号进行压缩编码的标准主要有以下几种：信号进行压缩编码的标准主要有以下几种：6.1.3 音频压缩编码技术标准介绍音频压缩编码技术标准介绍55(1)1)应

37、应用用在在DABDAB（Digital Digital Audio Audio BroadcastingBroadcasting）中中的的码率压缩技术码率压缩技术MUSICAM MUSICAM 及及 ASPECASPEC MUSICAMMUSICAM（MaskingMaskingPattern Pattern Adapted Adapted Universal Universal SubbandSubband Integrated Integrated Coding Coding And And Multiplexing Multiplexing encodingencoding，掩掩蔽蔽型型

38、自自适适应应通通用用子子带带综综合合编编码码和和复复用用）是是欧欧洲尤里卡洲尤里卡147147计划开发成功的。计划开发成功的。该该编编码码方方式式利利用用人人耳耳的的听听觉觉特特性性，把把声声音音信信号号分分割割为为4 4至至6464个个子子带带，以以不不同同的的量量化化特特性性对对各各子子带带加加以以量量化化。利利用用人人耳耳的的掩掩蔽蔽效效应应，对对在在掩掩蔽蔽阈阈以以上上的的声声音音信信号号进进行行编编码码传传输输，略略去去对对掩掩蔽蔽阈阈以以下下的的声声音音信信号号进进行行编编码码，使使码码率率大大大减小。大减小。6.1.3 音频压缩编码技术标准介绍音频压缩编码技术标准介绍56 ASP

39、ECASPEC（Audio Audio Spectral Spectral PercepturalPerceptural Entropy Entropy CodingCoding，音音频频频频谱谱听听觉觉熵熵编编码码），对对于于16bit16bit输输入入信信号号先先以以TDACTDAC（Time Time Domain Domain Aliasing Aliasing CancellationCancellation，时时域域混混叠叠消消除除）进进行行处处理理，然然后后通通过过MDCTMDCT（Modified Modified DCTDCT，改改进进的的离离散散余余弦弦变变换换）变变换换到

40、到频频域域中中去去，另另一一方方面面从从经经过过了了FFTFFT的的信信号号来来确确定定各各临临界界带带宽宽的的掩掩蔽蔽阈阈，再再把把两两者者结结合合起起来进行量化，编成熵码（霍夫曼码）。来进行量化，编成熵码（霍夫曼码）。上上述述两两种种编编码码的的码码率率都都能能从从1.4Mb/s1.4Mb/s降降到到128Kb/s128Kb/s、96Kb/s96Kb/s或或64Kb/s64Kb/s。6.1.3 音频压缩编码技术标准介绍音频压缩编码技术标准介绍57（2 2）MPEGMPEG声音编码算法声音编码算法 19891989年年ISO/IEC/MPEGISO/IEC/MPEG征征求求了了1414种种方

41、方案案，按按算算法法分分类类保保留留了了ASPECASPEC、ATACATAC（Adaptive Adaptive Transform Transform Audio Audio CodingCoding）、MUSICAMMUSICAM及及SBSB（SubbandSubband）/ADPCM/ADPCM等等4 4种种方方案案，经经过过在在多多种种码码率率下下的的一一系系列列测测试试，结结果果ASPEC ASPEC 和和MUSICAMMUSICAM在在每每声声道道96kb/s-128 96kb/s-128 kb/skb/s码码率率下下具具有有优优越越性性能能，因因此此便便以以这这两两种种算算法法

42、为为基基础础确确定定了了3 3层层算算法法（LayerLayer、），并并于于19911991年年1111月月作为作为MPEG-1MPEG-1音频压缩编码音频压缩编码文本草案发表。文本草案发表。6.1.3 音频压缩编码技术标准介绍音频压缩编码技术标准介绍58 19941994年年1111月月通通过过的的MPEG-2MPEG-2草草案案中中，声声音音编编码码仍仍保保持持3 3层层，但但声声道道数数扩扩展展为为3/2/0.13/2/0.1（或或5.15.1），即即前前面面左左、中中、右右三三个个声声道道，左左、右右两两个个环环绕绕声声道道及及一一个个低低音音效效果果声声道道（LFELFE，频频带带

43、为为15Hz15Hz到到120Hz120Hz，通通常常记记为为0.10.1）。MPEG-2MPEG-2的的建建议议中中还还扩扩展展了了低低取取样样频频率率工工作作模模式式（16kHz16kHz、22.05kHz22.05kHz及及24kHz24kHz），以以适适合合多多媒媒体体和和通通信信应应用用，并并且且为为保保证证多多声声道道的的音音质质，提提高高了了上上限限适适用用码码率率。MPEG MPEG Layer Layer 的的目目标标是是实实现现码率为每声道码率为每声道64kb/s64kb/s以下的高品质声音编码。以下的高品质声音编码。6.1.3 音频压缩编码技术标准介绍音频压缩编码技术标准

44、介绍59（3 3）Dolby AC-2Dolby AC-2及及AC-3AC-3 AC-2AC-2及及AC-3AC-3是是美美国国DolbyDolby实实验验室室提提出出的的声声音音编编码码算算法法，AC-2AC-2是是独独立立声声道道编编码码算算法法，AC-3AC-3是是多多声声道道复复合合编编码码算算法法。美美国国已已将将AC-3AC-3作作为为ATSCATSC标标准准的的声声音音编码算法。编码算法。AC-2AC-2的的工工作作码码率率为为每每声声道道64kb/s64kb/s192 192 kb/skb/s，AC-2AC-2按按临临界界带带宽宽划划分分子子带带，每每子子带带谱谱系系数数结结合

45、合成成为为用用一一个个指指数数和和若若干干尾尾数数组组成成的的浮浮点点频频率率块块，然然后后对对指指数数作作差差分分编编码码，指指数数表表达达了了各各子子带带频频谱谱系系数数的的峰峰值，尾数为子带内各系数相对峰值的修正值。值，尾数为子带内各系数相对峰值的修正值。6.1.3 音频压缩编码技术标准介绍音频压缩编码技术标准介绍60 AC-3AC-3是是AC-2AC-2的的多多声声道道扩扩展展算算法法，与与MPEGMPEG相相同同，加加入入了了一一个个中中间间声声道道，两两个个环环绕绕声声道道和和一一个个低低音音效效果果声声道道（3/2/0.13/2/0.1）。AC-3AC-3应应达达到到码码率率为为

46、300 300 kb/s kb/s 400 400 kb/skb/s时时，实实现现3/2/0.13/2/0.1声声道道的的CDCD声声音音质质量量。AC-3AC-3去去除除声声道道内内冗冗余余方方法法与与AC-2AC-2相相同同。其其多多声声道道压压缩缩编编码码主主要要通通过过多多声声道道共共同同分分配配比比特特和和高高频频耦耦合合以以形成多声道比特流来实现。形成多声道比特流来实现。6.1.3 音频压缩编码技术标准介绍音频压缩编码技术标准介绍61思考题1、人耳能感知的声音频率范围是多少？人说话的声、人耳能感知的声音频率范围是多少？人说话的声音的频率范围是多少？音的频率范围是多少？2、什么叫听阈？什么叫、什么叫听阈？什么叫痛阈痛阈？3、什么叫频域掩蔽？什么叫时域掩蔽？、什么叫频域掩蔽？什么叫时域掩蔽？4、什么叫临界频带？、什么叫临界频带？5、话音编码标准有哪些？、话音编码标准有哪些？

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 音频压缩编码技术及其国际标准课件

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：第6章音频压缩编码技术及其国际标准课件.ppt
链接地址：https://www.taowenge.com/p-70483492.html