第3章 数字音频.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第3章 数字音频.ppt》由会员分享,可在线阅读,更多相关《第3章 数字音频.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第3章章 数字音频数字音频3.1 基本概念基本概念 3.2 音频信号数字化音频信号数字化 3.3 音频信号压缩编码音频信号压缩编码 3.4 语音压缩编码标准语音压缩编码标准 3.5 常见多媒体应用的语音编码器的选择常见多媒体应用的语音编码器的选择3.6 IP电话技术电话技术 距梭魁窄攘饼乌廉奢诡仁檬墅矮寐榆柬阶绝估骸戚胞柬榴窑根出阜谷猪使第3章 数字音频第3章 数字音频 3.1 基 本 概 念 1 1听觉掩蔽听觉掩蔽听觉掩蔽听觉掩蔽在在在在人人人人类类类类听听听听觉觉觉觉系系系系统统统统中中中中,一一一一个个个个声声声声音音音音的的的的存存存存在在在在会会会会影影影影响响响响人人人人们们们们
2、对对对对其其其其他他他他声声声声音音音音的的的的听听听听觉觉觉觉能能能能力力力力,使使使使一一一一个个个个声声声声音音音音在在在在听听听听觉觉觉觉上上上上掩掩掩掩蔽蔽蔽蔽了了了了另另另另一一一一个个个个声声声声音音音音,即即即即所所所所谓谓谓谓的的的的“掩掩掩掩蔽蔽蔽蔽效效效效应应应应”。2频谱掩蔽频谱掩蔽频频频频谱谱谱谱掩掩掩掩蔽蔽蔽蔽发发发发生生生生在在在在高高高高电电电电平平平平音音音音调调调调使使使使附附附附近近近近频频频频率率率率的的的的低低低低电电电电平平平平声声声声音音音音不不不不能能能能被被被被人人人人耳耳耳耳听听听听到到到到的的的的情情情情况况况况下下下下。当当当当频频频频率
3、率率率离离离离掩掩掩掩蔽音调越远时,掩蔽效应减弱的速度就越快。蔽音调越远时,掩蔽效应减弱的速度就越快。蔽音调越远时,掩蔽效应减弱的速度就越快。蔽音调越远时,掩蔽效应减弱的速度就越快。虑墅候厢丽瀑翌泪蚀塑民撩腿楷天舅浇汾涣耪脖冉客蹦杏伍担乌准桂眠鬃第3章 数字音频第3章 数字音频23 3 瞬态掩蔽瞬态掩蔽瞬态掩蔽瞬态掩蔽声声声声音音音音有有有有一一一一个个个个冲冲冲冲击击击击时时时时间间间间(即即即即幅幅幅幅值值值值随随随随时时时时间间间间推推推推移移移移而而而而增增增增大大大大的的的的时时时时间间间间段段段段)和和和和一一一一个个个个衰衰衰衰退退退退时时时时间间间间(即即即即幅幅幅幅值值值值随
4、随随随时时时时间间间间推推推推移移移移而而而而减减减减小小小小的的的的时时时时间间间间段段段段)。拨拨拨拨小小小小提提提提琴琴琴琴所所所所产产产产生生生生声声声声音音音音的的的的冲冲冲冲击击击击和和和和衰衰衰衰退退退退都都都都很很很很快快快快,而而而而拉拉拉拉小小小小提提提提琴琴琴琴所所所所产产产产生生生生声声声声音音音音的的的的冲冲冲冲击击击击和和和和衰衰衰衰退退退退都都都都很很很很慢慢慢慢。此此此此外外外外,在在在在冲冲冲冲击击击击前前前前和和和和衰衰衰衰退退退退后后后后,声声声声音音音音都都都都有有有有掩掩掩掩蔽蔽蔽蔽效效效效应应应应。前前前前掩掩掩掩蔽蔽蔽蔽时时时时间间间间为为为为50
5、50200 200 msms,而而而而后后后后掩掩掩掩蔽蔽蔽蔽时时时时间间间间约约约约为为为为该该该该范范范范围围围围的的的的1/101/10。弄褐伸揽尸凭弓指俊槐辟伎抛牲粹睬贰渭竿廷凳础绿攫近孪卷蛆哮宝度更第3章 数字音频第3章 数字音频3 4 4 失真失真失真失真失失失失真真真真是是是是用用用用得得得得非非非非常常常常广广广广泛泛泛泛的的的的概概概概念念念念,在在在在这这这这里里里里主主主主要要要要用用用用来来来来描描描描述述述述重重重重现现现现声声声声音音音音和和和和原原原原来来来来声声声声音音音音的的的的相相相相差差差差程程程程度度度度。而而而而表表表表示这种相差程度的方法有两种:示这
6、种相差程度的方法有两种:示这种相差程度的方法有两种:示这种相差程度的方法有两种:(1 1)失真的主观度量。失真的主观度量。失真的主观度量。失真的主观度量。失真的一个主观评价指标称为平均观点分失真的一个主观评价指标称为平均观点分失真的一个主观评价指标称为平均观点分失真的一个主观评价指标称为平均观点分(Mean Opinion Score(Mean Opinion Score,MOS)MOS)。听众根据系听众根据系听众根据系听众根据系统质量的好坏使用统质量的好坏使用统质量的好坏使用统质量的好坏使用NN分制给系统打分。分制给系统打分。分制给系统打分。分制给系统打分。例如,例如,例如,例如,在为在为在
7、为在为HDTVHDTV选择音频压缩方案时就使用了这种选择音频压缩方案时就使用了这种选择音频压缩方案时就使用了这种选择音频压缩方案时就使用了这种度量方法。度量方法。度量方法。度量方法。表表表表3.13.1-1 1给出了一种常见的给出了一种常见的给出了一种常见的给出了一种常见的5 5分制分制分制分制系统。系统。系统。系统。帛捶距滨夯辟镁咬戈僧缸迸理募拎雁巩志江罗罩辅锡绿颤遗夕屯村姓剁仑第3章 数字音频第3章 数字音频4表3.1-1 5分制平均观点分举例 平均观点分平均观点分平均观点分平均观点分 质量等级质量等级质量等级质量等级 主观感觉主观感觉主观感觉主观感觉 5 极好极好 觉察不到觉察不到 4
8、4 好好觉察得到不难听觉察得到不难听 3 3 一般一般 有点难听有点难听 2 2 差差差差难听,但不反感难听,但不反感 1 1 极差极差极差极差 难以忍受难以忍受晾韭驹抬箭皋钧仁茎竿烟毡课港仅贸窜适泉囱龟畴药串疵斧毗嘻辣煮姜推第3章 数字音频第3章 数字音频55 声道声道单声道单声道单声道单声道(Monophonic)(Monophonic)意味着单个声源,而立体意味着单个声源,而立体意味着单个声源,而立体意味着单个声源,而立体声并不表示有两个声源,立体声声并不表示有两个声源,立体声声并不表示有两个声源,立体声声并不表示有两个声源,立体声(Stereophonic)(Stereophonic)
9、指的是三维听觉效果。为了确指的是三维听觉效果。为了确指的是三维听觉效果。为了确指的是三维听觉效果。为了确定声源位置,大脑要将每个耳朵所听到声音的定声源位置,大脑要将每个耳朵所听到声音的定声源位置,大脑要将每个耳朵所听到声音的定声源位置,大脑要将每个耳朵所听到声音的三个属性进行比较,三个属性进行比较,三个属性进行比较,三个属性进行比较,这三个属性分别是:这三个属性分别是:这三个属性分别是:这三个属性分别是:(1 1)幅值幅值幅值幅值(Amplitude)(Amplitude):如果左耳听到的声音如果左耳听到的声音如果左耳听到的声音如果左耳听到的声音比右耳的大,比右耳的大,比右耳的大,比右耳的大,
10、那么我们就认为声音在左边。那么我们就认为声音在左边。那么我们就认为声音在左边。那么我们就认为声音在左边。芒其急泄这袱凯浇晶柠棠湿意笔捣樊编伙牌样霹额箱呛肄暮顷爽剿掩的淬第3章 数字音频第3章 数字音频6(2)相相位位(Phase):如如果果人人的的两两耳耳听听到到的的信信号号具具有有相相同同的的相相位位,那那么么大大脑脑就就认认为为声声音音在在中中部部;如如果果两两耳耳听听到到信信号号有有180的的相相位位差差,那么声音就不包含方向信息了。那么声音就不包含方向信息了。(3)时时序序(Timing):声声音音的的传传播播速速度度为为1英英尺尺每每毫毫秒秒;如如果果声声音音到到达达右右耳耳的的时时
11、间间比比到到达达左耳的早,我们就认为声源就在右边。左耳的早,我们就认为声源就在右边。一一般般来来说说,如如果果听听众众所所处处的的位位置置刚刚好好是是两两个个声声源源(例例如如两两个个扬扬声声器器)的的中中轴轴线线上上,则则听听众就可以享受三维立体声的效果众就可以享受三维立体声的效果。魔走盐晰怪篱葛疆磋俏条殴装猫频习刑笺舔撩又保决孕碘哪宪棕腻剔邹愧第3章 数字音频第3章 数字音频7声声声声源源源源位位位位置置置置可可可可以以以以通通通通过过过过添添添添加加加加一一一一个个个个中中中中央央央央通通通通道道道道的的的的方方方方法法法法来来来来确确确确定定定定。为为为为此此此此,DolbyDolby
12、公公公公司司司司在在在在上上上上个个个个世世世世纪纪纪纪7070年年年年代代代代就就就就实实实实现现现现了了了了由由由由四四四四个个个个声声声声道道道道产产产产生生生生三三三三维维维维立立立立体体体体声声声声的的的的效效效效果果果果,这这这这四四四四个个个个声声声声道道道道分分分分别别别别是是是是:左左左左声声声声道道道道、右右右右声声声声道道道道、中中中中央央央央声声声声道道道道、环环环环绕绕绕绕声声声声道道道道。为为为为了了了了使使使使声声声声音音音音更更更更加加加加丰丰丰丰富富富富,现现现现在在在在的的的的立立立立体体体体声声声声剧剧剧剧院院院院(包包包包括括括括家家家家庭庭庭庭剧剧剧剧
13、院院院院)都都都都增增增增加加加加了了了了一一一一个超低音声道,个超低音声道,个超低音声道,个超低音声道,主要目的是增强低音。主要目的是增强低音。主要目的是增强低音。主要目的是增强低音。胃真袍婪蕉钱已渊湖逐倘坎箩服堕境钉韩直中还闭别巍眼俊驮涣诣厚辽痴第3章 数字音频第3章 数字音频8 3.2 音频信号数字化音频信号数字化 音频信息处理主要包括音频信号的数字化和音频音频信息处理主要包括音频信号的数字化和音频音频信息处理主要包括音频信号的数字化和音频音频信息处理主要包括音频信号的数字化和音频信息的压缩两大技术,信息的压缩两大技术,信息的压缩两大技术,信息的压缩两大技术,图图图图3.23.2-1 1
14、为音频信息处理为音频信息处理为音频信息处理为音频信息处理结构框图。结构框图。结构框图。结构框图。音频信号的数字化是为音频信息的压缩作准备的音频信号的数字化是为音频信息的压缩作准备的音频信号的数字化是为音频信息的压缩作准备的音频信号的数字化是为音频信息的压缩作准备的 音频信号的数字化过程就是将模拟音频信号转换音频信号的数字化过程就是将模拟音频信号转换音频信号的数字化过程就是将模拟音频信号转换音频信号的数字化过程就是将模拟音频信号转换成有限个数字表示的离散序列,即数字音频序列,成有限个数字表示的离散序列,即数字音频序列,成有限个数字表示的离散序列,即数字音频序列,成有限个数字表示的离散序列,即数字
15、音频序列,在这一处理过程中涉及到模拟音频信号的在这一处理过程中涉及到模拟音频信号的在这一处理过程中涉及到模拟音频信号的在这一处理过程中涉及到模拟音频信号的采样、采样、采样、采样、量化和编码量化和编码量化和编码量化和编码。移钻宏川彼铺款盾圆队棵纶亡捍垣拆肺梯淫庭木坠纂证溶崭河肺悦沉碰恩第3章 数字音频第3章 数字音频9图3.2-1 音频信息处理框图 垮霍笛吸莲抱砍甚盏腔俄戚嫉绦遗呢郸痈屁元饮邪墨冲滩谰减沃盾泅瞎触第3章 数字音频第3章 数字音频10(1)(1)采样过程。采样过程。采样过程。采样过程。模拟音频信号是一个在时间上和模拟音频信号是一个在时间上和模拟音频信号是一个在时间上和模拟音频信号是
16、一个在时间上和幅值上都连续的信号。幅值上都连续的信号。幅值上都连续的信号。幅值上都连续的信号。采样过程就是在时间上采样过程就是在时间上采样过程就是在时间上采样过程就是在时间上将连续信号离散化的过程,采样一般是按均匀的将连续信号离散化的过程,采样一般是按均匀的将连续信号离散化的过程,采样一般是按均匀的将连续信号离散化的过程,采样一般是按均匀的时间间隔进行的。时间间隔进行的。时间间隔进行的。时间间隔进行的。(2)(2)量量量量化化化化过过过过程程程程。量量量量化化化化过过过过程程程程是是是是指指指指将将将将每每每每个个个个采采采采样样样样值值值值在在在在幅幅幅幅度度度度上上上上再再再再进进进进行行
17、行行离离离离散散散散化化化化处处处处理理理理。量量量量化化化化可可可可分分分分为为为为均均均均匀匀匀匀量量量量化化化化(量量量量化化化化值值值值的的的的分分分分布布布布是是是是均均均均匀匀匀匀的的的的或或或或者者者者说说说说每每每每个个个个量量量量化化化化阶阶阶阶距距距距是是是是相相相相同同同同的的的的)和和和和非非非非均均均均匀匀匀匀量量量量化化化化。量量量量化化化化会会会会引引引引入入入入失失失失真真真真,并并并并且且且且量量量量化化化化失失失失真真真真是是是是一一一一种种种种不不不不可可可可逆逆逆逆失失失失真真真真,这这这这就就就就是是是是通通通通常常常常所所所所说说说说的的的的量化噪声
18、。量化噪声。量化噪声。量化噪声。(3)(3)编编编编码码码码过过过过程程程程。编编编编码码码码过过过过程程程程是是是是指指指指用用用用二二二二进进进进制制制制数数数数来来来来表表表表示示示示每每每每个个个个采采采采样样样样的的的的量量量量化化化化值值值值。如如如如果果果果量量量量化化化化是是是是均均均均匀匀匀匀的的的的,又又又又采采采采用用用用自自自自然然然然二二二二进进进进制制制制数数数数表表表表示示示示,这这这这种种种种编编编编码码码码方方方方法法法法就就就就是是是是脉脉脉脉冲冲冲冲编编编编码码码码调调调调制制制制(Pulse(Pulse Code Code ModulationModul
19、ation,PCMPCM),这这这这是是是是一种最简单、一种最简单、一种最简单、一种最简单、最方便的编码方法。最方便的编码方法。最方便的编码方法。最方便的编码方法。鞘岳慌津夹来扒党谍相撞桓祭橱摸假验僻风晾言组迷歧呐享盟财多丙蝗揪第3章 数字音频第3章 数字音频11 3.3 音频信号压缩编码 从从20世世纪纪30年年代代提提出出PCM(脉脉冲冲编编码码调调制制)原原理理以以及及声声码码器器的的概概念念以以来来,音音频频信信息息压压缩缩编编码码技技术术主主要要是是向向基基于于波波形形和和基基于于参参数数两两个个方方向向发发展展的的,从从这这个个角角度度出出发发,音音频频信信息息编编码码技技术术可可
20、分分为为三三类类:胳痉薛澳攀咽竿舞瘟阔赶磁贪匝涛比夺柔房运科亥熔丰院幅肮炽它培迪失第3章 数字音频第3章 数字音频12(1)波形编码。波形编码。这种方法主要基于语这种方法主要基于语音波形预测,它力图使重建的语音波形音波形预测,它力图使重建的语音波形保持原信号的波形状态。它的优点是编保持原信号的波形状态。它的优点是编码方法简单、易于实现、适应能力强、码方法简单、易于实现、适应能力强、语音质量好等,缺点是压缩比相对来说语音质量好等,缺点是压缩比相对来说较低,需要较高的编码速率。较低,需要较高的编码速率。常用的波形法编码有增量调制常用的波形法编码有增量调制(DM)、自、自适应差分脉冲编码调制(适应差
21、分脉冲编码调制(ADPCM)等等。)等等。咳貉咬剖聋填抚熄址撬华丽酋按系剪痛食距旭嚏盲藕蜜匪条源位奥喳猜啥第3章 数字音频第3章 数字音频13(2)参数编码。参数编码。这种方法主要基于参数这种方法主要基于参数的编码方法。的编码方法。与波形编码不同的是,与波形编码不同的是,这这类编码方法通过语音信号的数学模型对语类编码方法通过语音信号的数学模型对语音信号特征参数(主要是指表征声门振动音信号特征参数(主要是指表征声门振动的激励参数和表征声道特性的声道参数)的激励参数和表征声道特性的声道参数)进行提取及编码,力图使重建的语音信号进行提取及编码,力图使重建的语音信号尽可能保持原信号的语意,而重建的语音
22、尽可能保持原信号的语意,而重建的语音信号波形同原信号的波形可能会有较大的信号波形同原信号的波形可能会有较大的区别。区别。最常用的参数编码法为线性预测编最常用的参数编码法为线性预测编码(码(LPC)。)。娠尝雷袒梨陀让究琅傲那籽撩贰务狭春裤吠港腿冒露瘦字漆浇谭延扦裤耪第3章 数字音频第3章 数字音频14(3)混混合合编编码码。这这种种方方法法克克服服了了原原有有波波形形编编码码与与参参数数编编码码的的弱弱点点,并并且且结结合合了了波波形形编编码码的的高高质质量量和和参参数数编编码码的的低低数数据据率率,取取得得了了比比较较好好的的效效果果。混混合合编编码码是是指指同同时时使使用用两两种种或或两两
23、种种以以上上的的编编码码方方法法进进行行编编码码的的过过程程。每每种种编编码码方方法法都都有有自自己己的的优优势势和和不不足足,使使用用混混合合编编码码,可可以以优优势势互互补补,从从而而达达到到高高效效数数据据压压缩缩的的目目的的。实际上,混合编码被广泛采用。实际上,混合编码被广泛采用。智亮总爹镀醛灶吵嗽悲华阻漂肄颖福峪弗峡示论您僳迹疗今四吼儡项型病第3章 数字音频第3章 数字音频153.3.1 增量调制增量调制1一般增量调制一般增量调制增增增增量量量量调调调调制制制制(DMDM)是是是是一一一一种种种种比比比比较较较较简简简简单单单单且且且且有有有有数数数数据据据据压压压压缩缩缩缩功功功功
24、能能能能的的的的波波波波形形形形编编编编码码码码方方方方法法法法。系系系系统统统统结结结结构构构构如如如如图图图图3.33.3-1 1所所所所示示示示。在在在在编编编编码码码码端端端端,由由由由前前前前一一一一个个个个输输输输入入入入信信信信号号号号的的的的编编编编码码码码值值值值经经经经解解解解码码码码器器器器解解解解码码码码可可可可得得得得到到到到下下下下一一一一个个个个信信信信号号号号的的的的预预预预测测测测值值值值。输输输输入入入入的的的的模模模模拟拟拟拟音音音音频频频频信信信信号号号号与与与与预预预预测测测测值值值值在在在在比比比比较较较较器器器器上上上上相相相相减减减减,从从从从而
25、而而而得得得得到到到到差差差差值值值值。差差差差值值值值的的的的极极极极性性性性为为为为正正正正,则则则则编编编编码码码码输输输输出出出出为为为为1 1;若若若若为为为为负负负负,则则则则编编编编码码码码输输输输出出出出为为为为0 0。增增增增量量量量调调调调制制制制编码过程示意图如图编码过程示意图如图编码过程示意图如图编码过程示意图如图3.33.3-2 2所示。所示。所示。所示。蹲俘趣磕愉肃扦带扬竿衙狙嗣杀硼凝菩犀量狼胞助俗耗尿贮贺鹅膏挤赖绚第3章 数字音频第3章 数字音频16图3.3-1 增量调制的系统结构框图 搞穿湖靡漓买科血垂蔬乙厅近予安瓣带忘掳匆克仆唇李汛串撇夺桩位冲亩第3章 数字音
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第3章 数字音频
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内