音频处理技术课件.ppt
《音频处理技术课件.ppt》由会员分享,可在线阅读,更多相关《音频处理技术课件.ppt(125页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、音频处理技术音频处理技术1第1页,此课件共125页哦简述简述 音频是多媒体技术中媒体的一种,由于音频是多媒体技术中媒体的一种,由于音频信号是一种连续变化的模拟信号,而计音频信号是一种连续变化的模拟信号,而计算机只能处理和记录二进制的数字信号,因算机只能处理和记录二进制的数字信号,因此,音频信号必须经过一定的变化和处理,此,音频信号必须经过一定的变化和处理,变成二进制数据后才能送到计算机进行编辑变成二进制数据后才能送到计算机进行编辑和存储。和存储。2第2页,此课件共125页哦2.1 声音的基本特性声音的基本特性 音频信号所携带的信息大体上可分为语音频信号所携带的信息大体上可分为语音、音乐和音响三
2、类。音、音乐和音响三类。u语音是指具有语言内涵和人类约定的特殊媒体;语音是指具有语言内涵和人类约定的特殊媒体;u音乐是规范的符号化了的声音;音乐是规范的符号化了的声音;u而音响指其他自然声音,如动物的叫声、机器的而音响指其他自然声音,如动物的叫声、机器的轰鸣声、风雨雷电声等轰鸣声、风雨雷电声等 3第3页,此课件共125页哦2.1.1.音频信号的特征音频信号的特征 u机械振动或气流扰动引起周围弹性媒质发生波动,产生声波。产生声波机械振动或气流扰动引起周围弹性媒质发生波动,产生声波。产生声波的物体为的物体为声源声源(如人的声带、乐器等如人的声带、乐器等),声波所及的空间范围称为,声波所及的空间范围
3、称为声场声场。声波传到。声波传到人耳,经过人类听觉系统的感知就是人耳,经过人类听觉系统的感知就是声音声音。u声波可以用一条连续的曲线来表示,它在时间和幅度上都是连续的,称为声波可以用一条连续的曲线来表示,它在时间和幅度上都是连续的,称为模拟音频模拟音频信号信号。u在任一时刻,声波可以分解成一系列正弦波的线性叠加:在任一时刻,声波可以分解成一系列正弦波的线性叠加:4第4页,此课件共125页哦1声音的物理特性声音的物理特性(1)频率频率/周期周期/带宽带宽 u单位时间内声源振动的次数或空气中气压疏密变单位时间内声源振动的次数或空气中气压疏密变化的次数,称为声源的频率化的次数,称为声源的频率f,单位
4、赫兹,单位赫兹(Hz)u频带宽度或称之为带宽,它描述组成复合信号的频带宽度或称之为带宽,它描述组成复合信号的频率范围频率范围 5第5页,此课件共125页哦u虽然高于虽然高于20kHz频率的声音人耳听不到,但由于频率的声音人耳听不到,但由于人的声学心理特性,可感觉到它的存在。因此,人的声学心理特性,可感觉到它的存在。因此,有的音响产品的工作频率上限为有的音响产品的工作频率上限为50kHz,甚至调,甚至调音台的最高工作频率设计到音台的最高工作频率设计到100kHz。u声音信号可被分解和复合,可以从中抽出若干个声音信号可被分解和复合,可以从中抽出若干个单一的正弦信号,也可以用若干个单一的正弦信单一的
5、正弦信号,也可以用若干个单一的正弦信号来合成任意波形的复合信号,如合成语音和合号来合成任意波形的复合信号,如合成语音和合成音乐等成音乐等 6第6页,此课件共125页哦(2)声压和声强声压和声强u声波在空气媒质中是以空气中的分子振动形成疏密而传播。它造成声波在空气媒质中是以空气中的分子振动形成疏密而传播。它造成空气中的气压发生大小变化,相当于在无声波下空气中的气压上叠空气中的气压发生大小变化,相当于在无声波下空气中的气压上叠加一个变化的压强,叠加上的压强称为声压,记作加一个变化的压强,叠加上的压强称为声压,记作P,单位为帕单位为帕(Pa)或者为)或者为ubar。u引起人耳刚能听到声音时的声压称为
6、引起人耳刚能听到声音时的声压称为可听阈值。可听阈值。u声波是由能量来维持传播的。如扬声器纸盆的振动是由电能转换而声波是由能量来维持传播的。如扬声器纸盆的振动是由电能转换而来,因此声波有能量。来,因此声波有能量。u单位时间内通过垂直于声波传播方向的单位面积内的声波能量为声单位时间内通过垂直于声波传播方向的单位面积内的声波能量为声场中某点的场中某点的声强声强,记作,记作I,单位为瓦米,单位为瓦米2(Wm2)。)。u声强与声压最大值的平方成正比关系。声强与声压最大值的平方成正比关系。7第7页,此课件共125页哦u在无线电技术中常引用分贝在无线电技术中常引用分贝(dB)来表征电压、电来表征电压、电流、
7、功率或放大器的放大能力。流、功率或放大器的放大能力。u在声学中引用分贝来表示声压或声强的变化程度在声学中引用分贝来表示声压或声强的变化程度。因为人的听觉神经的刺激程度不与刺激量大小成因为人的听觉神经的刺激程度不与刺激量大小成正比,而是按刺激量以正比,而是按刺激量以10为底的对数增长为底的对数增长 8第8页,此课件共125页哦9第9页,此课件共125页哦(3)动态范围动态范围 u声音的动态范围指声音的最大声压级和最小声压级之间的差值。声音的动态范围指声音的最大声压级和最小声压级之间的差值。u每种声源的动态范围依据各自的特性有所不同。每种声源的动态范围依据各自的特性有所不同。w如女声的动态范围为如
8、女声的动态范围为2550dB,w男声为男声为3050dB,w交响乐队的动态范围大于交响乐队的动态范围大于100dB。u动态范围不仅用来表示一个声源产生的最大声压级与最小声压级之动态范围不仅用来表示一个声源产生的最大声压级与最小声压级之间的差值,录音设备或记录声音的载体间的差值,录音设备或记录声音的载体(磁带、光盘、硬盘磁带、光盘、硬盘)同样可同样可用动态范围表示能够处理信号电平的范围。用动态范围表示能够处理信号电平的范围。w如磁带的动态范围为如磁带的动态范围为50dB60dB,wCD光盘光盘96dB,w磁光盘录放音机磁光盘录放音机105dB。10第10页,此课件共125页哦u动态范围可以用信号
9、的相对强度表示:动态范围可以用信号的相对强度表示:信号的动态范围信号的动态范围=20lg(信号的最大强度信号的最小信号的最大强度信号的最小强度强度)(dB)其中的信号可以用电压或功率衡量。其中的信号可以用电压或功率衡量。u因为是一种比例关系,故只要采用相同的度量单因为是一种比例关系,故只要采用相同的度量单位,其结果都是一致的。位,其结果都是一致的。11第11页,此课件共125页哦(4)频谱频谱 u物体在一定位置的附近作来回往复的运动,称为物体在一定位置的附近作来回往复的运动,称为简谐振动简谐振动。u简谐振动会产生一个特定音调的简谐振动会产生一个特定音调的纯音纯音,听起来感,听起来感觉单薄。觉单
10、薄。u乐器很少产生单一频率的纯音,而是乐器很少产生单一频率的纯音,而是复音复音。u复音复音的产生基于物体的复杂振动,可以分解为许的产生基于物体的复杂振动,可以分解为许多不同振幅和不同频率的简谐振动多不同振幅和不同频率的简谐振动(即看成简谐振即看成简谐振动的叠加动的叠加)。u简谐振动的振幅按频率排列的图形称为频谱简谐振动的振幅按频率排列的图形称为频谱。频。频谱可一目了然地看出复杂振动的频率结构。谱可一目了然地看出复杂振动的频率结构。12第12页,此课件共125页哦钢琴(基频为钢琴(基频为253Hz)的复音频谱)的复音频谱 13第13页,此课件共125页哦2声音的心理学特性声音的心理学特性 从声学
11、心理角度,声音的三个要素是从声学心理角度,声音的三个要素是音音调调、响度响度和和音色音色。它们与声波的频率、声压。它们与声波的频率、声压和频谱结构对应。和频谱结构对应。(1)音调音调 人对声音频率的感觉表现为音调的高低,在人对声音频率的感觉表现为音调的高低,在音乐中称为音高。音调与基频的对数(音乐中称为音高。音调与基频的对数(20lg)成线性关系,单位为美(成线性关系,单位为美(mei)。基频越低,给)。基频越低,给人的感觉越低沉。基频频率增加一倍,音乐上称人的感觉越低沉。基频频率增加一倍,音乐上称提高了一个八度提高了一个八度 14第14页,此课件共125页哦频率与音调的关系频率与音调的关系
12、15第15页,此课件共125页哦音阶音阶CDEFGAB简谱简谱1234567频率频率/Hz26129333034939244049416第16页,此课件共125页哦(2)响度响度 u响度是人耳对声音强弱的感觉程响度是人耳对声音强弱的感觉程度度u虽然响度与衡量声音强弱的声压有虽然响度与衡量声音强弱的声压有一定关系,但与声压的大小并不完一定关系,但与声压的大小并不完全一致,也就是说声压大的感觉不全一致,也就是说声压大的感觉不一定响。一定响。n 由于人的外耳具有一定的耳道长度,耳道会对某段频率产生由于人的外耳具有一定的耳道长度,耳道会对某段频率产生共鸣,使灵敏度提高。因此人耳听到声音的响度与声音的频
13、率共鸣,使灵敏度提高。因此人耳听到声音的响度与声音的频率有关。描述响度、声压以及声源频率之间的关系曲线称为等响有关。描述响度、声压以及声源频率之间的关系曲线称为等响度曲线(图度曲线(图2-4)。)。n 从曲线看出,当音量开到使声压级为从曲线看出,当音量开到使声压级为80 dB时,就可做到高时,就可做到高低频声音丰满低频声音丰满 17第17页,此课件共125页哦(3)音色音色n音色又称音品。通常说法是:声音的音调和音色又称音品。通常说法是:声音的音调和响度以外的音质差异叫做音色。响度以外的音质差异叫做音色。n声音的音色取决于该声音的频谱结构或是频声音的音色取决于该声音的频谱结构或是频谱包络(声波
14、曲线)。谱包络(声波曲线)。n高次谐波越丰富高次谐波越丰富,音色就越有明亮感和穿透力。音色就越有明亮感和穿透力。此外,音色还与诸多其他因素有关,如听音此外,音色还与诸多其他因素有关,如听音条件等。条件等。n它是一个主观量,常用柔和、刺耳、饱满等它是一个主观量,常用柔和、刺耳、饱满等词描述。词描述。18第18页,此课件共125页哦(4)掩蔽效应掩蔽效应n称听不到的声音为称听不到的声音为被掩蔽声被掩蔽声,而起掩蔽作用的声音为,而起掩蔽作用的声音为掩掩蔽声蔽声。n掩蔽效应的实质是掩蔽声的出现使人耳听觉的等响度曲线掩蔽效应的实质是掩蔽声的出现使人耳听觉的等响度曲线的最小可听阈抬高。的最小可听阈抬高。n
15、掩蔽效应的一般规律是强音压低音、低频率声音压高掩蔽效应的一般规律是强音压低音、低频率声音压高频率。频率。n利用掩蔽效应可以用有用信号去掩蔽无用的声信号,利用掩蔽效应可以用有用信号去掩蔽无用的声信号,只需要把无用声音的声压级降低到掩蔽阈以下即可。只需要把无用声音的声压级降低到掩蔽阈以下即可。n在数字音频处理中,还可以利用掩蔽效应去掉人耳听在数字音频处理中,还可以利用掩蔽效应去掉人耳听不到的那部分信号进行声音数据的压缩。不到的那部分信号进行声音数据的压缩。19第19页,此课件共125页哦(5)方位感方位感 n人凭借双耳在一定声学环境内能够对声源定位,这种能力人凭借双耳在一定声学环境内能够对声源定位
16、,这种能力来自于声源发出的声波到达双耳间的强度差、时间差以及来自于声源发出的声波到达双耳间的强度差、时间差以及耳廓耳廓(外耳外耳)的阻挡。的阻挡。n声源到达听者耳朵的声音有两个,其中一个声音直接到达,声源到达听者耳朵的声音有两个,其中一个声音直接到达,而另一个由于人头部遮蔽,需绕过头部才能到达。称前者为而另一个由于人头部遮蔽,需绕过头部才能到达。称前者为直达声,而后者为绕射声。直达声,而后者为绕射声。n若有两个声源,增大其中一个声源的强度,由于该声音源若有两个声源,增大其中一个声源的强度,由于该声音源发出的直达声或绕射声的声压大于另一个声源,双耳将会发出的直达声或绕射声的声压大于另一个声源,双
17、耳将会产生声压级差。使听者感受的声源(声像)位置向强度较产生声压级差。使听者感受的声源(声像)位置向强度较大的声源方向移,使人感受到声音的立体感。大的声源方向移,使人感受到声音的立体感。20第20页,此课件共125页哦(6)空间感空间感 n一个声源发出的声音同时向各个方向散开,其发散的角度一个声源发出的声音同时向各个方向散开,其发散的角度取决于声源所具有的指向性,发散的声波有一小部分直接取决于声源所具有的指向性,发散的声波有一小部分直接传给听者,而大部分会被空间表面反射,然后到达听者。传给听者,而大部分会被空间表面反射,然后到达听者。由于直接和经反射到达听者的两个声音途径存在差别(取由于直接和
18、经反射到达听者的两个声音途径存在差别(取决于环境)而带来时间差。当时间差超过一定数量时,听决于环境)而带来时间差。当时间差超过一定数量时,听者会听到先后到达的两个声音,从而产生者会听到先后到达的两个声音,从而产生回音回音。经多次。经多次反射,造成反射,造成余声余声。即使声源已停止发声,但听者仍能听到。即使声源已停止发声,但听者仍能听到声音存在。声音存在。n回声与余音的感觉可使听者感受出房间体积大小、房回声与余音的感觉可使听者感受出房间体积大小、房间高低及内表面结构上的差异,这便是间高低及内表面结构上的差异,这便是空间感空间感。21第21页,此课件共125页哦2.1.2.音频信号的质量指标音频信
19、号的质量指标 1 频带宽度频带宽度 音频信号所包含的谐波分量越丰富,音色越音频信号所包含的谐波分量越丰富,音色越好。在广播通信和数字音响系统中,以声音信号好。在广播通信和数字音响系统中,以声音信号所包含的谐波分量的频率范围来衡量声音的质量,所包含的谐波分量的频率范围来衡量声音的质量,即带宽。即带宽。不同质量的声音的频带对比示意图不同质量的声音的频带对比示意图 22第22页,此课件共125页哦2动态范围动态范围 n动态范围越大,说明音频信号强度的相对变动态范围越大,说明音频信号强度的相对变化范围越大,音响效果越好。化范围越大,音响效果越好。n动态范围一般用动态范围一般用dB为单位来计量。为单位来
20、计量。uFM广播的动态范围约广播的动态范围约60dB,uAM广播的动态范围约广播的动态范围约40dB。uCDDA的动态范围约的动态范围约100dB,u数字电话约数字电话约50dB。23第23页,此课件共125页哦3信噪比信噪比 n信噪比信噪比SNR(Signal Noise Ratio)是有用信号与噪声之比的是有用信号与噪声之比的简称,即有用信号的平均功率与噪声的平均功率之比简称,即有用信号的平均功率与噪声的平均功率之比 n信噪比大,在一定程度上能够掩蔽噪声,从而获得较好信噪比大,在一定程度上能够掩蔽噪声,从而获得较好的声音效果。的声音效果。n信噪比不仅是声音设备的性能指标,在声音的录制和信噪
21、比不仅是声音设备的性能指标,在声音的录制和播放时,也要注意环境噪声。录制时应尽可能减小环播放时,也要注意环境噪声。录制时应尽可能减小环境噪音。输出时应使音量适当大,以减少环境噪音对境噪音。输出时应使音量适当大,以减少环境噪音对听音的影响。听音的影响。n一般话筒和音箱的信噪比在一般话筒和音箱的信噪比在75dB以上。声卡的信噪比在以上。声卡的信噪比在8595dB。24第24页,此课件共125页哦2.2 数字音频数字音频 1.声音的数字化声音的数字化 u数字化就是将连续信号变成离散信号。数字化就是将连续信号变成离散信号。u对音频信号,首先在时间上离散,取有限个时间对音频信号,首先在时间上离散,取有限
22、个时间点,称为点,称为采样采样。然后在幅度上离散,取有限个幅。然后在幅度上离散,取有限个幅度值,称为度值,称为量化量化。再将得到的数据表示成计算机。再将得到的数据表示成计算机容易识别的格式,称为容易识别的格式,称为编码。编码。u数字化的基本技术是数字化的基本技术是脉冲编码调制脉冲编码调制(Pulse Code Modulation,PCM),简称脉码调制简称脉码调制。25第25页,此课件共125页哦(1)PCM编码编码 PCM是一种把模拟信号转换成数字信号的最基本的编码方法,是一种把模拟信号转换成数字信号的最基本的编码方法,它主要包括采样、量化和编码它主要包括采样、量化和编码3个过程。个过程。
23、u采样采样是每隔一定的时间测量一次声音信号的幅值,把时间连续的模是每隔一定的时间测量一次声音信号的幅值,把时间连续的模拟信号转换成时间离散、幅度连续的采样信号。如果采样的时间间拟信号转换成时间离散、幅度连续的采样信号。如果采样的时间间隔隔相等,这种采样称为均匀采样;相等,这种采样称为均匀采样;u量化量化是按是按“四舍五入四舍五入”或其他方法将采样得到的数值限定在或其他方法将采样得到的数值限定在几个有限的数值中,将采样信号转换成时间离散、幅度离散几个有限的数值中,将采样信号转换成时间离散、幅度离散的数字信号;的数字信号;u编码编码(coding)是将量化后的信号转换成一个二进制码组输出。)是将量
24、化后的信号转换成一个二进制码组输出。比如,量化得到的数据中只会出现两个数值比如,量化得到的数据中只会出现两个数值51和和80,则只用,则只用一位二进制的数表示即可,用一位二进制的数表示即可,用0表示表示51,用,用1表示表示80。若量化。若量化级别为级别为256(有(有256级量化数据),则可用级量化数据),则可用8位二进制数表示,位二进制数表示,这种编码方法称为这种编码方法称为自然编码自然编码。26第26页,此课件共125页哦模拟声音信号的采样和量化过程示意模拟声音信号的采样和量化过程示意(a)模拟声音信号的波形成)模拟声音信号的波形成(b)采样得到的离散时间信号)采样得到的离散时间信号(c
25、)再量化得到的数字信号)再量化得到的数字信号模拟声音信号的数字化模拟声音信号的数字化27第27页,此课件共125页哦例例2.1 设一个连续信号的波形可以表示为设一个连续信号的波形可以表示为 设采样频率为设采样频率为21Hz,-10,10内的量化间隔取为内的量化间隔取为1,试计,试计算出该信号算出该信号0到到1秒内的量化数据。秒内的量化数据。u对于对于CDDA,采样频率为,采样频率为44.1kHz,即每秒取,即每秒取44100个点。幅个点。幅度的取值范围是限制在度的取值范围是限制在216=65 536以内,量化间隔为以内,量化间隔为1,即量,即量化幅度可以取化幅度可以取65 536个不同的值,计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 音频 处理 技术 课件
限制150内