数字音频处理(精品).ppt
《数字音频处理(精品).ppt》由会员分享,可在线阅读,更多相关《数字音频处理(精品).ppt(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数字音频处理数字音频处理一一.概念概念 1.1.声音:声音:是物体的振动引起空气的震荡,人耳对是物体的振动引起空气的震荡,人耳对这种震荡的感觉。人耳能感觉到的空气震荡频率范这种震荡的感觉。人耳能感觉到的空气震荡频率范围为围为2020khz2020khz。人能够区分空气震荡频率的组合,当空气震荡频人能够区分空气震荡频率的组合,当空气震荡频率的组合具有特定含义时,声音即携带信息。如语率的组合具有特定含义时,声音即携带信息。如语音。音。t一个周期空气压强幅度空气压强振荡波形空气压强振荡波形空气压强振荡波形空气压强振荡波形 2.2.声音的探测声音的探测:提取反映空气振荡的波形。提取反映空气振荡的波形。
2、tI/V空气振荡感应的空气振荡感应的I/V波形波形Micphone原理图原理图tI/V空气振荡感应的空气振荡感应的I/V值值 3.3.声音的还原声音的还原:把把I/VI/V波形转化为空气振动。波形转化为空气振动。Earphone原理图原理图 4.4.音频的分划:音频的分划:人耳能听见的声音称人耳能听见的声音称音频。音频。1)1)次声波次声波(Subsonic)(Subsonic):频率低于频率低于20HZ20HZ。2)2)超声波超声波(Ultrasonic)(Ultrasonic):频率高于频率高于20khz20khz。5.5.音频信号类型音频信号类型:语音、音乐及音效三种。语音、音乐及音效三
3、种。1)1)语音语音(Speech)(Speech):人的发音器官产生的声音。人人的发音器官产生的声音。人发音器官产生的声音频率范围为发音器官产生的声音频率范围为803400HZ,803400HZ,人说人说话的频率范围为话的频率范围为3003000hz(3003000hz(语音信号的频率范语音信号的频率范围围)。2)2)音乐:音乐:乐器发出的规范和确定符号化的声音。乐器发出的规范和确定符号化的声音。3)3)音效:音效:自源界其它事物发出的声音。自源界其它事物发出的声音。20 300 3k 20k f(Hz)语音带宽语音带宽语音带宽语音带宽音频带宽音频带宽音频带宽音频带宽次声带次声带次声带次声带
4、超声带超声带超声带超声带 6.6.声音的三要素声音的三要素:音调、音强及音色。音调、音强及音色。1)1)基频与音调:基频与音调:波峰是声波曲线中极大点。每两波峰是声波曲线中极大点。每两个相邻极大点决定一个频率的波,音频曲线可能由个相邻极大点决定一个频率的波,音频曲线可能由多个频率的波合成。在一个可区分的音中,幅度最多个频率的波合成。在一个可区分的音中,幅度最大和波峰间距大约相等的波的频率为基频。基频也大和波峰间距大约相等的波的频率为基频。基频也称音调。音乐中的音阶也称音调,是一个固定频率称音调。音乐中的音阶也称音调,是一个固定频率的声波。的声波。tI/V声波信号声波信号声波信号声波信号音节音节
5、音节音节C CD DE E简谱符号简谱符号简谱符号简谱符号1 12 23 3频率频率频率频率(HZ)(HZ)261261293293330330频率频率频率频率(对数对数对数对数)*)*48.348.349.349.350.350.3 2)2)谐波与音色谐波与音色:在一个音的基频上出现的更高频在一个音的基频上出现的更高频率的波称泛音,也称谐波。谐波就是音色。如果在率的波称泛音,也称谐波。谐波就是音色。如果在基频中加入有规则的音色,声音可能更加动听和更基频中加入有规则的音色,声音可能更加动听和更有渗透力;但不规则的泛音可能是噪声。有渗透力;但不规则的泛音可能是噪声。3)3)幅度与音强幅度与音强:
6、声波曲线中信号基线到波峰的高度声波曲线中信号基线到波峰的高度称幅度。一个音的平均幅度反映了音的强弱,也称称幅度。一个音的平均幅度反映了音的强弱,也称音强音强(音量音量)。音强的单位一般为分贝。音强的单位一般为分贝(dB)(dB),人能够,人能够分辨分辨3dB3dB以上的波动。声波曲线中有强波也有弱波。以上的波动。声波曲线中有强波也有弱波。动态范围反映了强弱波音量相对变化范围。动态范围反映了强弱波音量相对变化范围。动态范围动态范围=20=20log(log(最大强度最大强度最大强度最大强度/最小强度最小强度最小强度最小强度)(dBdB)4)4)音宽与频带音宽与频带:信号波中变化最快波的频率到变化
7、信号波中变化最快波的频率到变化最慢波的频率区域称频带最慢波的频率区域称频带(差为带宽差为带宽)。音频信号的。音频信号的带宽称音宽。如语音信号的带宽为带宽称音宽。如语音信号的带宽为3.2khz3.2khz。频带为。频带为03.2kHz03.2kHz。10 20 50 200 3.4k 7k 15k 22k10 20 50 200 3.4k 7k 15k 22kf(Hz)电话电话电话电话AMAM广播广播广播广播FMFM广播广播广播广播CD-DACD-DA几种音频业务的频带几种音频业务的频带 5)5)信噪比信噪比(Signal to Noise(Signal to Noise Ratio,SNRRa
8、tio,SNR):是衡量是衡量声音质量的一个指标。声音质量的一个指标。SNRSNR定义:定义:有用信号的平均功率有用信号的平均功率 SNR=SNR=噪声的平均功率噪声的平均功率 SNRSNR大,噪声对声音的影响小,声音的质量好。大,噪声对声音的影响小,声音的质量好。二二.数字音频的获取数字音频的获取 数字音频获取过程:数字音频获取过程:模拟音模拟音模拟音模拟音频信号频信号频信号频信号采样采样采样采样量化量化量化量化编码编码编码编码压缩压缩压缩压缩音频音频音频音频文件文件文件文件音频获取过程音频获取过程音频获取过程音频获取过程 1.1.采样采样 1)1)模拟信号:模拟信号:在时间轴上任意两点之间
9、有无数的在时间轴上任意两点之间有无数的时间点时间点;任意时间点对应的幅度值可能是一个无限不任意时间点对应的幅度值可能是一个无限不循环的小数。因此要完全无误地用数字表达一小段循环的小数。因此要完全无误地用数字表达一小段模拟信号是不可能的。模拟信号是不可能的。2)2)模拟信号的离散模拟信号的离散:我们可以每隔一个时间段:我们可以每隔一个时间段t t0 0 0 0取取一个点的幅度值,模拟信号就成为了离散信号。一个点的幅度值,模拟信号就成为了离散信号。3)3)采样频率采样频率 采样频率采样频率f fs s=1/t=1/t0 0 0 0 采样间距采样间距t t0 0 0 0是确定音频离散信号还原质量的关
10、键是确定音频离散信号还原质量的关键问题。问题。t t0 0 0 0大可以减少表示音频的数据量,但有可能大可以减少表示音频的数据量,但有可能使音频失真。使音频失真。采样频率应随曲线变化的快慢也变化。采样频率应随曲线变化的快慢也变化。一个曲线的变化频带为一个曲线的变化频带为f fmaxmaxmaxmaxf fminminminmin。奈奎斯特采样频率奈奎斯特采样频率 f fs s=2 f fmaxmaxmaxmax 如数字电话系统中,语音最高频率为如数字电话系统中,语音最高频率为3.4kHz3.4kHz,采,采样频率应大于样频率应大于6.8kHz6.8kHz,实际定为,实际定为8kHz8kHz。数
11、字电话语音传输过程:数字电话语音传输过程:传输传输传输传输系统系统系统系统语语语语音音音音MicMic-phonephoneA/A/D D编码和压编码和压编码和压编码和压缩缩缩缩解压和解压和解压和解压和解码解码解码解码D/D/A AEar-Ear-phonephone语语语语音音音音数字电话语音传输过程:数字电话语音传输过程:数字电话语音传输过程:数字电话语音传输过程:模拟音模拟音模拟音模拟音频信号频信号频信号频信号采样采样采样采样量化量化量化量化编码编码编码编码压缩压缩压缩压缩音频音频音频音频文件文件文件文件音频获取过程音频获取过程音频获取过程音频获取过程A/A/D(AnalogD(Anal
12、og/Digital):/Digital):模拟值模拟值/数值值转换器。数值值转换器。D/D/A(DigitalA(Digital/Analog):/Analog):数值值数值值/模拟值转换器。模拟值转换器。2.2.量化量化 设模拟信号的幅值在设模拟信号的幅值在-V,+V-V,+V之间连续变化,要之间连续变化,要表示所有的是幅值是不可能的,必须对幅值离散化,表示所有的是幅值是不可能的,必须对幅值离散化,既用有限的幅值代表既用有限的幅值代表-v,+vv,+v 之间的所有值。对一个之间的所有值。对一个采样点来说,就是把该点对应模拟幅值用最接近的采样点来说,就是把该点对应模拟幅值用最接近的离散幅值表
13、示,该过程称为量化。离散幅值表示,该过程称为量化。量化分为均匀量化和非均匀量化两种。量化分为均匀量化和非均匀量化两种。均匀量化把幅值区间均匀量化把幅值区间-v,+vv,+v 等距分为等距分为L L个离散幅个离散幅值。值。幅值间距:幅值间距:d=2v/(L-2)(+0,-0d=2v/(L-2)(+0,-0各计一个幅值各计一个幅值)离散幅值离散幅值:x xi i=d dii (i (i 为正负整数,为正负整数,为正负整数,为正负整数,|i|=(L-2)/2)|i|=(L-2)/2)幅值幅值幅值幅值-3.5v-3.5v-3v-3v-2.5v-2.5v-2v-2v-1.5v-1.5v-1v-1v-0.
14、5v-0.5v-0v-0v+0v+0v 0.5v0.5v 1v1v1.5v1.5v 2v2v2.5v2.5v 3v3v3.5v3.5v二进二进二进二进制数制数制数制数11111111 11101110 11011101 11001100 10111011 10101010 10011001 10001000 00000000 00010001 00100010 00110011 01000100 01010101 01100110 01110111 非均匀量化把幅值区间非均匀量化把幅值区间-v,_vv,_v 分成大小不同的区间,分成大小不同的区间,再对每个区间进行均匀量化。目的是使小信号幅值再
15、对每个区间进行均匀量化。目的是使小信号幅值量化引入的量化噪声的信噪比与大信号量化的信噪量化引入的量化噪声的信噪比与大信号量化的信噪比均衡。比均衡。如:均匀量化区间如:均匀量化区间-3.5v,+3.5v-3.5v,+3.5v为为1616个离散幅值。个离散幅值。间距间距d=2d=23.5v/(16-2)=0.5v3.5v/(16-2)=0.5v 0.25v 0.25v 用用0.5v0.5v表示,引入噪声表示,引入噪声0.25v,0.25v,信噪比为:信噪比为:SNRSNR小小小小=0.25/0.25=1=0.25/0.25=1 0.325v 0.325v 用用3.53.5表示,引入噪声表示,引入噪
16、声0.25v,0.25v,信噪比为:信噪比为:SNRSNR大大大大=0.25/3.25=0.077=0.25/3.25=0.0771)1)均匀量化:均匀量化:幅值区间幅值区间-3.5,3.5v,16-3.5,3.5v,16个离散值,个离散值,间距间距d=0.5vd=0.5v。01010101010001000011001100100010000100010000000010011001101010101011101111001100110111012.52.52v2v1.5v1.5v1v1v0.5v0.5v0v0v-0.5v-0.5v-1v-1v-1.5v-1.5v-2v-2v-2.5v-2.
17、5v 2)2)非均匀量化:非均匀量化:均匀量化的缺点是小幅值量化引入的噪声的信噪均匀量化的缺点是小幅值量化引入的噪声的信噪比太大,使整体引入的平均信噪比过大。比太大,使整体引入的平均信噪比过大。非均匀量化把规格化幅值非均匀量化把规格化幅值x(|xx(|x|=1)|=1)按幅值从小按幅值从小到大划分为区间范围从小到大的不同区域,使用到大划分为区间范围从小到大的不同区域,使用压压缩函数缩函数F(xF(x)把这些不同区域压缩到区间范围大约相把这些不同区域压缩到区间范围大约相等的区间,再对这些区间进行均匀量化。等的区间,再对这些区间进行均匀量化。F(xF(x)的反函数的反函数F F-1-1(x)(x)
18、称称扩张函数扩张函数。设:整个信号幅值区间设:整个信号幅值区间-v,+vv,+v,某信号幅值为某信号幅值为X,X,规规格化幅值格化幅值x=X/v(-1=x=1)x=X/v(-1=x=1)。CCITT(ConsultativeCCITT(ConsultativeCCITT(ConsultativeCCITT(Consultative Committee International Committee International Committee International Committee International Telephone and Telegraph Telephone and
19、 Telegraph Telephone and Telegraph Telephone and Telegraph 国际电报电话咨询委员会国际电报电话咨询委员会 )国际标准使用国际标准使用u u律律(u-Law)(u-Law)和和A A律律(A-Law)(A-Law)两种压扩两种压扩算法。算法。A A律压缩函数:律压缩函数:A|x|A|x|sgn(xsgn(x)(0=|x|=1/A)(0=|x|=1/A)1+lnA 1+lnAF FA A(x(x)=)=1+ln(A|x|)1+ln(A|x|)sgn(xsgn(x)(1/A=|x|=1)(1/A=|x|=1)1+lnA 1+lnA x x为规
20、格化信号幅值为规格化信号幅值(|x|=1),A(|x|=1),A为压扩参数。为压扩参数。1 17/87/86/86/85/85/84/84/83/83/82/82/81/81/80 01/16 1/8 1/4 1/2 11/16 1/8 1/4 1/2 11/321/321/641/64规格化规格化规格化规格化幅度幅度幅度幅度x xF FAA(x(x)A=87.6A=87.61 17/87/86/86/85/85/84/84/83/83/82/82/81/81/80 01/16 1/8 1/4 1/2 11/16 1/8 1/4 1/2 11/321/321/641/64规格化规格化规格化规格
21、化幅度幅度幅度幅度x xF FAA(x(x)A=87.6A=87.6 u u律压缩函数:律压缩函数:ln(1+u|x|)ln(1+u|x|)Fu(xFu(x)=)=sgn(xsgn(x)(|x|=1)(|x|=1)ln(1+u)ln(1+u)x x为规格化信号幅值为规格化信号幅值(|x|=1),u(|x|=1),u为压扩参数。在为压扩参数。在CCITTCCITT标准中标准中u=255u=255。1 17/87/86/86/85/85/84/84/83/83/82/82/81/81/80 031/255 63/255 127/255 1 31/255 63/255 127/255 1 15/25
22、515/2557/2557/255规格化规格化规格化规格化幅度幅度幅度幅度x xF Fu u(x(x)u=255u=2553/2553/2551/2551/255 A A律压扩算法大小幅值量化噪声信噪比比效:律压扩算法大小幅值量化噪声信噪比比效:设实际音频信号的区间(设实际音频信号的区间(-128cv,+128cv-128cv,+128cv)。)。0,+128)0,+128)分划为分划为8 8个大小不同的量化区间,每个个大小不同的量化区间,每个区间按区间按1616个值均匀量化,区间分划如下:个值均匀量化,区间分划如下:1 17/87/86/86/85/85/84/84/83/83/82/82/
23、81/81/80 01/16 1/8 1/4 1/2 11/16 1/8 1/4 1/2 11/321/321/641/64规格化规格化规格化规格化幅度幅度幅度幅度x xF FAA(x(x)A=87.6A=87.6区间号区间号区间号区间号8 87 76 65 54 43 31212实验实验实验实验信号信号信号信号幅值幅值幅值幅值开开开开始始始始64cv64cv32cv32cv16cv16cv8cv8cv4cv4cv2cv2cv0cv0cv结结结结束束束束128cv)128cv)64cv)64cv)32cv)32cv)16cv)16cv)8cv)8cv)4cv)4cv)2cv)2cv)规格规格规
24、格规格化幅化幅化幅化幅值值值值开开开开始始始始1/21/21/41/41/81/81/161/161/321/321/641/640 0结结结结束束束束1)1)1/2)1/2)1/4)1/4)1/8)1/8)1/16)1/16)1/32)1/32)1/641/64区间值距区间值距区间值距区间值距4cv4cv2cv2cv1cv1cv0.5cv0.5cv 0.25cv0.25cv 0.125cv0.125cv 0.0625cv0.0625cv1 1号区间的离散值为号区间的离散值为0cv,0.0625cv,0.125cv,0.25cv0cv,0.0625cv,0.125cv,0.25cv,1.937
25、5cv,1.9375cv该区间的最大量化噪声幅度为该区间的最大量化噪声幅度为0.0625/20.0625/2。设实际幅值设实际幅值0.09375cv0.09375cv,量化幅值为,量化幅值为0.125cv,0.125cv,引入引入噪声强度值为噪声强度值为0.03125cv0.03125cv。SNRSNR1 1=0.03125/0.09375=0.333=0.03125/0.09375=0.333区间号区间号区间号区间号8 87 76 65 54 43 31212实验实验实验实验信号信号信号信号幅值幅值幅值幅值开开开开始始始始64cv64cv32cv32cv16cv16cv8cv8cv4cv4c
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字音频 处理 精品
限制150内