多媒体音频信息处理技术.ppt
《多媒体音频信息处理技术.ppt》由会员分享,可在线阅读,更多相关《多媒体音频信息处理技术.ppt(86页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体音频信息处理技术多媒体音频信息处理技术现在学习的是第1页,共86页4.1 认识声音认识声音4.1.1 声音处理技术的历史回顾声音处理技术的历史回顾4.1.2 声音信号的形式与特征声音信号的形式与特征4.1.3 声音质量的评价声音质量的评价现在学习的是第2页,共86页4.1.1 声音处理技术的历史回顾声音处理技术的历史回顾v1.自古以来自古以来人类很早就开始研究声音,并利用当时已掌握的人类很早就开始研究声音,并利用当时已掌握的声音的某些规律来制造乐器、进行建筑设计或传声音的某些规律来制造乐器、进行建筑设计或传声装置设计等,使声音更悦耳动听或传得更远。声装置设计等,使声音更悦耳动听或传得更远
2、。请举出古代利用声音的例子请举出古代利用声音的例子v天坛的回音壁、三音石,古代乐器,等天坛的回音壁、三音石,古代乐器,等v铁路工人用铁锤敲击铁轨、医生的听诊器、行军打仗铁路工人用铁锤敲击铁轨、医生的听诊器、行军打仗的号角鼓声的号角鼓声这个时期,声音处理技术的特征这个时期,声音处理技术的特征:v凭耳朵辨别声音,不能记录和存储声音凭耳朵辨别声音,不能记录和存储声音现在学习的是第3页,共86页4.1.1 声音处理技术的历史回顾声音处理技术的历史回顾v2.机械方法记录和播放机械方法记录和播放19世纪爱迪生发明世纪爱迪生发明留声机留声机v启发现象启发现象电话传话器里的膜板随着说话声会引起震动的现象电话传
3、话器里的膜板随着说话声会引起震动的现象v是一种播放声音的机械装置,预先按声音波形特征刻是一种播放声音的机械装置,预先按声音波形特征刻制在唱片表面制在唱片表面(弧形凹槽弧形凹槽),播放时引起探针的不同幅度,播放时引起探针的不同幅度的振动并传递发声。的振动并传递发声。现在学习的是第4页,共86页4.1.1 声音处理技术的历史回顾声音处理技术的历史回顾v3.电声技术电声技术依靠电信号来记录并播放声音依靠电信号来记录并播放声音v通过电压产生模拟声波变化的电流信号,灌录成早期通过电压产生模拟声波变化的电流信号,灌录成早期的唱片或磁带,这种电流信号称为模拟信号。的唱片或磁带,这种电流信号称为模拟信号。v磁
4、带上的磁极变化或唱片音槽内的纹路起伏变化都是磁带上的磁极变化或唱片音槽内的纹路起伏变化都是声音信号的变化对应成正比的。声音信号的变化对应成正比的。现在学习的是第5页,共86页4.1.1 声音处理技术的历史回顾声音处理技术的历史回顾v4.数字化声音处理技术数字化声音处理技术依靠数字信号来记录并播放声音依靠数字信号来记录并播放声音核心技术核心技术是对声音的采样。是对声音的采样。现在学习的是第6页,共86页4.1.2 声音信号的形式与特征声音信号的形式与特征v1.什么是声音?什么是声音?(声音的形式声音的形式)声音是一种振动波声音是一种振动波,是机械振动或气流扰动引起,是机械振动或气流扰动引起周围的
5、弹性介质发生波动的现象。周围的弹性介质发生波动的现象。v许多声音的波形混合在一起可能构成交响乐、交谈声,许多声音的波形混合在一起可能构成交响乐、交谈声,也可能完全是噪声。也可能完全是噪声。在物理上,声音可用一条连线的曲线来表示,它在物理上,声音可用一条连线的曲线来表示,它是在时间和幅度上都连续变化的量,所以称为模是在时间和幅度上都连续变化的量,所以称为模拟量拟量。现在学习的是第7页,共86页4.1.2 声音信号的形式与特征声音信号的形式与特征v2.声音的物理特征声音的物理特征(1)频率频率:即声波振动的快慢,单位:即声波振动的快慢,单位Hz。v根据频率,声音可分为根据频率,声音可分为A.次声波
6、:低于次声波:低于20HzB.正常声音:正常声音:20Hz20KHz(语音:(语音:300Hz3KHz)C.超声波:高于超声波:高于20KHzv频率的倒数为频率的倒数为周期周期周期周期具有周期性的声音通常会更悦耳动听。具有周期性的声音通常会更悦耳动听。现在学习的是第8页,共86页4.1.2 声音信号的形式与特征声音信号的形式与特征也可用声音的也可用声音的波长波长来描述声音来描述声音vv波长波长波长波长:沿声音传播方向,振动一个周期所传播的距离;或在:沿声音传播方向,振动一个周期所传播的距离;或在波形上相位相同的两个相邻点间的距离,单位波形上相位相同的两个相邻点间的距离,单位m.声音的频率也反映
7、了声音的声音的频率也反映了声音的速度速度速度速度vv声速声速声速声速:单位时间内声音传播的距离,单位:单位时间内声音传播的距离,单位m/s.声速、周期、波长的关系为声速、周期、波长的关系为现在学习的是第9页,共86页4.1.2 声音信号的形式与特征声音信号的形式与特征vv(2)幅度幅度:是指信号的基线到当前波峰的距离,:是指信号的基线到当前波峰的距离,即声波振动的强弱,决定了信号音量的强弱即声波振动的强弱,决定了信号音量的强弱程度。程度。A.在物理上,通常用在物理上,通常用声压和声压级声压和声压级来衡量声音的来衡量声音的强弱程度。强弱程度。vv声压声压声压声压:指在声场中某处由声波引起的压强的
8、变化值,:指在声场中某处由声波引起的压强的变化值,单位为单位为“帕斯卡帕斯卡(Pa)”。正常人刚刚能听到的最微弱声音的声压为正常人刚刚能听到的最微弱声音的声压为2X10-5Pa,这个声,这个声压值称为人耳的压值称为人耳的“听阈听阈听阈听阈”。使人耳产生剧烈疼痛感觉的声音的声压约为使人耳产生剧烈疼痛感觉的声音的声压约为20Pa,这个声压,这个声压值称为人耳的值称为人耳的“痛阈痛阈痛阈痛阈”。现在学习的是第10页,共86页4.1.2 声音信号的形式与特征声音信号的形式与特征经研究发现:人耳对声音强弱的感觉大体上与声压的经研究发现:人耳对声音强弱的感觉大体上与声压的对数成正比,称为对数成正比,称为声
9、压级,声压级,声压级,声压级,单位为单位为分贝分贝分贝分贝(dB)v分贝数的计算公式为分贝数的计算公式为其中其中P0为基准声压值,取为基准声压值,取P0=2X10-5Pa现在学习的是第11页,共86页4.1.2 声音信号的形式与特征声音信号的形式与特征B.在物理上,也可用在物理上,也可用声功率和声强声功率和声强声功率和声强声功率和声强来衡量声音的强弱来衡量声音的强弱程度。程度。vv声功率声功率声功率声功率:是指单位时间内,声波通过垂直于传播方向某指定面积:是指单位时间内,声波通过垂直于传播方向某指定面积的声能量,单位为的声能量,单位为W。vv声强声强声强声强:是指单位时间内,声波通过垂直于传播
10、方向的单位:是指单位时间内,声波通过垂直于传播方向的单位面积的声能量,单位为面积的声能量,单位为W/S2。v声压与声强的关系为声压与声强的关系为现在学习的是第12页,共86页4.1.2 声音信号的形式与特征声音信号的形式与特征v也可用声功率或声强计算声音分贝数,分别称为也可用声功率或声强计算声音分贝数,分别称为声功率级声功率级声功率级声功率级L LWW和和和和声强级声强级声强级声强级L LI I,其公式为,其公式为v声强级与声压级的关系为声强级与声压级的关系为其中其中W0=10-12w,I0=10-12w/s2 b与媒介的声特性阻抗有关,因此与空气的温与媒介的声特性阻抗有关,因此与空气的温度度
11、t和压强和压强p有关有关,可查表。可查表。现在学习的是第13页,共86页4.1.2 声音信号的形式与特征声音信号的形式与特征v(3)声音的相加和相减声音的相加和相减即两个以上独立声源作用于某一点叠加形成的声即两个以上独立声源作用于某一点叠加形成的声音。音。声音的能量声音的能量(声功率声功率W,声强声强I)是可以代数相加的,是可以代数相加的,但声压但声压(声压声压P,声压级声压级L)不能直接相加不能直接相加。一些主要结论:一些主要结论:v两个声音相加,总声压级不会比其中一个大两个声音相加,总声压级不会比其中一个大3dB以上以上v两个声音的声压级相差两个声音的声压级相差10dB以上时,叠加增量可以
12、忽以上时,叠加增量可以忽略不计。略不计。现在学习的是第14页,共86页4.1.2 声音信号的形式与特征声音信号的形式与特征v2.声音的听觉特征(主观感受)声音的听觉特征(主观感受)(1)音调音调:v即声音频率的主观反映,也称即声音频率的主观反映,也称音高音高音高音高。v一般地,音调的高低与频率的高低是一致的。当频率一般地,音调的高低与频率的高低是一致的。当频率不变时,强度的变化对音调稍有影响(强度增大时,不变时,强度的变化对音调稍有影响(强度增大时,低频率音调显得更低,高频率音调显得更高)。低频率音调显得更低,高频率音调显得更高)。(2)音色音色:v日常生活中通常是复合音,包括基音和谐音成分。
13、日常生活中通常是复合音,包括基音和谐音成分。v人耳对复合音中各种谐音成分总和起来的主观印象,人耳对复合音中各种谐音成分总和起来的主观印象,称为音色。称为音色。现在学习的是第15页,共86页4.1.2 声音信号的形式与特征声音信号的形式与特征谐音的频率和振幅决谐音的频率和振幅决定音色定音色任何复杂的周期性振动都可分解为许多谐波,称为任何复杂的周期性振动都可分解为许多谐波,称为傅里叶定律;把复杂的振动分解成各种频率成分的傅里叶定律;把复杂的振动分解成各种频率成分的过程称为过程称为傅里叶分析傅里叶分析傅里叶分析傅里叶分析,也称,也称频谱分析频谱分析频谱分析频谱分析;分析结果称;分析结果称为谱图。为谱
14、图。现在学习的是第16页,共86页4.1.2 声音信号的形式与特征声音信号的形式与特征v例如:例如:基音为基音为100Hz的钢琴声约有的钢琴声约有15个振幅不同的谐音个振幅不同的谐音基音为基音为100Hz的黑管声约有的黑管声约有9个振幅不同的谐音个振幅不同的谐音.语音:特殊的复合音,包括元音和辅音。语音:特殊的复合音,包括元音和辅音。(3)音响音响:v即声音的响度,是声音振幅的主观属性。即声音的响度,是声音振幅的主观属性。v振幅越大,响度越大,但它们也不是线性关系。振幅越大,响度越大,但它们也不是线性关系。音乐中的音乐中的音阶音阶:v就是按频率的对数取等分来确定的。就是按频率的对数取等分来确定
15、的。v每八度的声音,其频率就升高或降低一倍。每八度的声音,其频率就升高或降低一倍。现在学习的是第17页,共86页4.1.3 声音质量的评价声音质量的评价v声音质量的评价是很困难的,也是一个值得声音质量的评价是很困难的,也是一个值得研究的课题。研究的课题。v目前,主要有两种度量方法目前,主要有两种度量方法1.声音质量的客观度量声音质量的客观度量2.声音质量的主观度量声音质量的主观度量现在学习的是第18页,共86页1.声音质量的声音质量的客观度量客观度量法法v即用仪器对声波进行测量和分析即用仪器对声波进行测量和分析v常用仪器:常用仪器:声级计声级计是一种能对声音做出类似人耳反应的仪器,它能进行客观
16、是一种能对声音做出类似人耳反应的仪器,它能进行客观且可重复的声压测量和声级测量。且可重复的声压测量和声级测量。v主要指标:主要指标:信噪比信噪比SNR即有用信号与噪声之比,单位为分贝。即有用信号与噪声之比,单位为分贝。一般用信号的功率计算,也可用信号的电压计算。一般用信号的功率计算,也可用信号的电压计算。信噪比数值越高,噪声越小。信噪比数值越高,噪声越小。一般地,一般地,HiFi音响要求音响要求SNR达到达到70dB70dB以上,以上,CD机要求机要求SNR达到达到90dB90dB以上。以上。现在学习的是第19页,共86页2.声音质量的主观度量声音质量的主观度量v(1)评分标准评分标准5 优优
17、 不能察觉失真不能察觉失真4 良良 刚能察觉,但不讨厌刚能察觉,但不讨厌3 中中 察觉失真,稍微讨厌察觉失真,稍微讨厌2 差差 讨厌,但不令人反感讨厌,但不令人反感1 劣劣 极其讨厌,令人反感极其讨厌,令人反感v目前这种评分标准和方法广泛应用于多媒体技术和通信中,目前这种评分标准和方法广泛应用于多媒体技术和通信中,如可视电话、电视会议、语音信箱、语音电子邮件,等。如可视电话、电视会议、语音信箱、语音电子邮件,等。现在学习的是第20页,共86页2.声音质量的主观度量声音质量的主观度量v(2)评价方法评价方法主要根据音质的三要素(音调主要根据音质的三要素(音调/音色音色/音响)的变化和组音响)的变
18、化和组合来主观评定音质的一些特性。合来主观评定音质的一些特性。例如:例如:v低频响亮低频响亮声音丰满,高频响亮声音丰满,高频响亮声音明亮声音明亮低频微弱低频微弱声音平滑,高频微弱声音平滑,高频微弱声音清澄声音清澄v(3)评价音质的常用听感评价音质的常用听感空间感空间感(环绕感环绕感)、定位感、定位感(方向感方向感)、层次感、层次感(厚度感厚度感)力度感、亮度感、软硬感、松紧感、宽窄感,等力度感、亮度感、软硬感、松紧感、宽窄感,等现在学习的是第21页,共86页3.声音质量的分级与带宽声音质量的分级与带宽从频带宽度的角度上,频带越宽,信号强度的相对变从频带宽度的角度上,频带越宽,信号强度的相对变化
19、范围就越大,音响效果就越好。化范围就越大,音响效果就越好。现在学习的是第22页,共86页4.2 声音的数字化方法声音的数字化方法4.2.1 数字化声音的优点数字化声音的优点4.2.2 声音的数字化过程声音的数字化过程4.2.3 声音数据的编码方法与标准声音数据的编码方法与标准现在学习的是第23页,共86页4.2.1 数字化声音的优点数字化声音的优点v1.动态范围大动态范围大若采用若采用8bit量化,音频信号幅度可分为量化,音频信号幅度可分为256个量个量化级,动态范围达化级,动态范围达96 dB。v2.信息易处理信息易处理可以通过计算机对音频、视频信号进行各种特技可以通过计算机对音频、视频信号
20、进行各种特技及非线性编辑。及非线性编辑。v3.媒体易保存媒体易保存使用时间长,采用数字化的光盘,重放时不存在使用时间长,采用数字化的光盘,重放时不存在机械磨损,使用寿命长。机械磨损,使用寿命长。现在学习的是第24页,共86页4.2.1 数字化声音的优点数字化声音的优点v4.成本低成本低数字化信息便于大规模集成电路的存储和处理,数字化信息便于大规模集成电路的存储和处理,可降低成本。可降低成本。v5.可靠性高可靠性高数字信号只要求脉冲的有无,而不依赖信号的幅数字信号只要求脉冲的有无,而不依赖信号的幅值大小,对硬件一致性和稳定性要求下降了许多,值大小,对硬件一致性和稳定性要求下降了许多,从而提高了可
21、靠性。从而提高了可靠性。现在学习的是第25页,共86页4.2.2 声音的数字化过程声音的数字化过程v声音的数字化过程可分为三步声音的数字化过程可分为三步1.采样采样2.量化量化3.编码编码现在学习的是第26页,共86页1.声音的采样声音的采样(Sampling)v(1)什么是什么是采样采样?对给定的模拟声音波形信号,以适当的时间间隔对给定的模拟声音波形信号,以适当的时间间隔采取样本值采取样本值(波形的幅度值波形的幅度值)的过程。的过程。常用器件:常用器件:A/D转换器转换器v(2)采样频率采样频率即单位时间内采集样本点的个数。即单位时间内采集样本点的个数。一般地,采样频率越高,样本点就越多,声
22、音信一般地,采样频率越高,样本点就越多,声音信号的还原效果越好。号的还原效果越好。根据采样频率可分为均匀采样和非均匀采样。根据采样频率可分为均匀采样和非均匀采样。现在学习的是第27页,共86页1.声音的采样声音的采样(Sampling)v采样示例采样示例现在学习的是第28页,共86页1.声音的采样声音的采样(Sampling)v(3)奈奎斯特奈奎斯特(Nyquist)定理定理只有采样频率高于声音信号最高频率的只有采样频率高于声音信号最高频率的2倍时,倍时,才能把数字信号表示的声音还原为原来的声音。才能把数字信号表示的声音还原为原来的声音。反之,建议:反之,建议:v采样频率通常应高于原信号频率的
23、采样频率通常应高于原信号频率的2倍。倍。v(4)常用采样频率常用采样频率8,11.025,22.05,44.1(KHz)现在学习的是第29页,共86页2.声音的量化声音的量化(Quantifying)v(1)什么是什么是量化量化?将整个模拟声音波形信号的幅度划分成有限个区将整个模拟声音波形信号的幅度划分成有限个区段的集合,把落入某个区段的样本值归为一类,段的集合,把落入某个区段的样本值归为一类,并赋予相同的值,这种过程称为量化。并赋予相同的值,这种过程称为量化。可分为可分为均匀量化均匀量化和和非均匀量化非均匀量化。v(2)量化级数量化级数整个声音波形信号的幅度被划分出来的区段数,整个声音波形信
24、号的幅度被划分出来的区段数,称为量化级数,例如:称为量化级数,例如:256级,级,65536级,等级,等.一般地,考虑到二进制数的表示和存储特性,量一般地,考虑到二进制数的表示和存储特性,量化级数取化级数取2n。现在学习的是第30页,共86页2.声音的量化声音的量化(Quantifying)v(3)量化位数量化位数与量化级数与量化级数2n对应的二进制位数对应的二进制位数n,即用多少位,即用多少位二进制数来表示每一个样本值。二进制数来表示每一个样本值。量化位数越高,声音的质量越好。量化位数越高,声音的质量越好。v(4)量化示例量化示例现在学习的是第31页,共86页2.声音的量化声音的量化(Qua
25、ntifying)v(5)量化误差量化误差在量化过程中由于四舍五入所造成的样本值与量在量化过程中由于四舍五入所造成的样本值与量化值之差。化值之差。设量化级差为设量化级差为“”,则量化误差不会超过,则量化误差不会超过“/2”.v例如:设有例如:设有10级量化,级次分别为级量化,级次分别为0,1,2,9 则则 级差级差=1,任意样本值的量化误差必,任意样本值的量化误差必1/2.v(6)量化噪声与信噪比量化噪声与信噪比由于量化误差而引起的声音失真,称为量化噪声,由于量化误差而引起的声音失真,称为量化噪声,也可用信噪比来衡量。也可用信噪比来衡量。一般地,量化位数一般地,量化位数每增加每增加1位位,信噪
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 音频 信息处理 技术
限制150内