《第二章音频的数字化优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第二章音频的数字化优秀PPT.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章音频的数字化第一页,本课件共有43页学习内容学习内容一、声音一、声音二、模拟音频与数字音频二、模拟音频与数字音频三、音频的采样、量化和数字化三、音频的采样、量化和数字化(重点)(重点)四、数字音频的格式四、数字音频的格式五、音频文件的读取五、音频文件的读取(重点)(重点)六、声音质量的度量六、声音质量的度量第二页,本课件共有43页学习目标学习目标1 1、了解声音相关概念及、了解声音相关概念及要素要素2 2、掌握音频采样、量化和、掌握音频采样、量化和数字化数字化原理原理3 3、了解数字音频的文件格式、了解数字音频的文件格式 4 4、理解、理解WAVWAV文件的文件的文件结构文件结构第三页,
2、本课件共有43页一、声音一、声音声音是通过空气传播的一种连续的波,叫声波。声音是通过空气传播的一种连续的波,叫声波。声音的强弱体现在声波压力的大小上声音的强弱体现在声波压力的大小上音调的高低体现在声音的频率上音调的高低体现在声音的频率上第四页,本课件共有43页一、声音一、声音有关概念有关概念复合信号复合信号:声音信号由许多频率不同的信号组成:声音信号由许多频率不同的信号组成分量信号分量信号:单一频率的信号:单一频率的信号带宽带宽:描述组成复合信号的频率范围。如:描述组成复合信号的频率范围。如:高保真声音的频率范围为高保真声音的频率范围为10Hz20KHz,它的带宽,它的带宽约为约为20KHz。
3、第五页,本课件共有43页一、声音一、声音三要素三要素v音强音强(volume)v音调音调(pitch)v音色音色响度,由振幅决定响度,由振幅决定由频率决定由频率决定指声音频率组成成分指声音频率组成成分第六页,本课件共有43页一、声音一、声音分类分类v次音频信号次音频信号20kHZ(人听不到人听不到,有很强的方向性有很强的方向性,可以形成波束可以形成波束)第七页,本课件共有43页二、模拟音频与数字音频二、模拟音频与数字音频模拟信号模拟信号数字信号数字信号第八页,本课件共有43页二、模拟音频与数字音频二、模拟音频与数字音频模拟模拟音频:在时间和幅度上都是音频:在时间和幅度上都是连续连续变化的变化的
4、数字数字音频:在时间和幅度上都是音频:在时间和幅度上都是离散、不连续离散、不连续的的第九页,本课件共有43页三、音频的数字化三、音频的数字化模拟音频模拟音频数字音频数字音频采样、量化、编码采样、量化、编码第十页,本课件共有43页三、音频的数字化(采样)三、音频的数字化(采样)音频采样:音频采样:当把模拟声音变成数字声音时,需要每当把模拟声音变成数字声音时,需要每隔一个时间间隔在模拟声音波形上取一个幅度值。隔一个时间间隔在模拟声音波形上取一个幅度值。信号转换示意图信号转换示意图第十一页,本课件共有43页三、音频的数字化(采样)三、音频的数字化(采样)采样:采样:将将时间时间上连续的取值变为有限个
5、离散取值的过程上连续的取值变为有限个离散取值的过程第十二页,本课件共有43页三、音频的数字化(采样)三、音频的数字化(采样)奈奎斯特采样定理:奈奎斯特采样定理:设连续信号设连续信号X(t)的最高频率分量为的最高频率分量为Fm,以等间隔,以等间隔Ts(Ts称称采样间隔,采样间隔,fs=1/Ts称为称为采样频率采样频率)对)对X(t)进行采样,得到进行采样,得到Xs(t)。如果如果Fs=2Fm,则,则Xs(t)保留了保留了X(t)的全部信息(从的全部信息(从Xs(t)可以不失可以不失真地恢复出真地恢复出X(t))。)。只要采样频率高于信号中最高频率的只要采样频率高于信号中最高频率的2倍,就可以从采
6、倍,就可以从采样中完全恢复原始信号的波形。样中完全恢复原始信号的波形。第十三页,本课件共有43页三、音频的数字化(量化)三、音频的数字化(量化)音频量化:音频量化:将经采样后将经采样后幅度幅度上无限多个连续的样值变为上无限多个连续的样值变为有限个离散值的过程有限个离散值的过程第十四页,本课件共有43页三、音频的数字化(量化)三、音频的数字化(量化)量化过程:量化过程:先将整个幅度划分成为有限个幅度(量化阶距)先将整个幅度划分成为有限个幅度(量化阶距)的集合,把落入某个阶距内的样值归为一类,并赋予相同的的集合,把落入某个阶距内的样值归为一类,并赋予相同的量化值。量化值。量化等级的划分量化等级的划
7、分第十五页,本课件共有43页三、音频的数字化三、音频的数字化模拟信号模拟信号采样采样量化量化编码编码第十六页,本课件共有43页A/D转换中,影响质量及数据量的主要因素:转换中,影响质量及数据量的主要因素:每秒钟需要采集多少个声音样本即每秒钟需要采集多少个声音样本即采样频率采样频率每个声音样本的位数每个声音样本的位数(bps)应该是多少即应该是多少即量化位数量化位数三、音频的数字化三、音频的数字化例子例子:每个声音样本用每个声音样本用16位表示位表示,测得声音样本值是测得声音样本值是在在065536的范围里的范围里,它的精度就是输入信号的它的精度就是输入信号的1/65536第十七页,本课件共有4
8、3页声音质量与数据率声音质量与数据率三、音频的数字化三、音频的数字化质量质量采样频率采样频率kHz样本精度样本精度(b/s)单单/立体立体声声数据率数据率(kB/s)频率范围频率范围电话电话88单道声单道声82003400AM11.0258单道声单道声112015000FM22.05016立体声立体声88.2507000CD44.116立体声立体声176.4202000DAT4816立体声立体声192.0202000第十八页,本课件共有43页四、数字音频的文件格式四、数字音频的文件格式1、WAV文件文件声音是随着时间连续变化的物理量,并且是声音是随着时间连续变化的物理量,并且是一种能借助介质传
9、播的波。一种能借助介质传播的波。第十九页,本课件共有43页四、数字音频的文件格式四、数字音频的文件格式1、WAV文件文件字节数字节数/秒秒=采样频率(采样频率(HZ)*量化位数(量化位数(BIT)*声道数声道数/8特点:特点:数据量大数据量大音质好音质好不适合网络传播或播放不适合网络传播或播放文件数据量计算:文件数据量计算:?1分钟单声道,采样频率为分钟单声道,采样频率为11.025kHz,8位采样位数位采样位数第二十页,本课件共有43页四、数字音频的文件格式四、数字音频的文件格式2、MP3文件文件MPEGAudioLayer-3特点:特点:数据量较小,压缩率数据量较小,压缩率10:120:1
10、音质较好音质较好是目前最为流行的音频格式文件是目前最为流行的音频格式文件第二十一页,本课件共有43页四、数字音频的文件格式四、数字音频的文件格式3、MIDI文件文件数字乐器接口标准数字乐器接口标准特点:特点:midi文件中存储的是产生声音指令文件中存储的是产生声音指令数据量小数据量小适用于:适用于:需要播放长时间高质量音乐需要播放长时间高质量音乐第二十二页,本课件共有43页四、数字音频的文件格式四、数字音频的文件格式3、MIDI文件文件第二十三页,本课件共有43页四、数字音频的文件格式四、数字音频的文件格式3、MIDI文件文件第二十四页,本课件共有43页四、数字音频的文件格式四、数字音频的文件
11、格式4、ASF、WMA文件文件微软开发的微软开发的网上流式网上流式数字音频文件格式数字音频文件格式特点:特点:音质好音质好数据量小数据量小适合适合网络流式传输网络流式传输第二十五页,本课件共有43页四、数字音频的文件格式四、数字音频的文件格式5、RAM、RA文件文件RealNetworks开发的开发的网上流式网上流式数字音频文件格式数字音频文件格式特点:特点:能随带宽的不同而改变音质,在保证大多数能随带宽的不同而改变音质,在保证大多数人听到流畅声音的前提下,带宽宽裕的听众获得较人听到流畅声音的前提下,带宽宽裕的听众获得较好的音质好的音质适合适合低网速的实时传输低网速的实时传输第二十六页,本课件
12、共有43页四、数字音频的文件格式四、数字音频的文件格式6、AIF、AU文件文件Apple公司开发的音频文件格式公司开发的音频文件格式第二十七页,本课件共有43页四、数字音频的文件格式四、数字音频的文件格式7、CD-DA数字音频光盘数字音频光盘44.1khz、16Bit量化位数、双声道量化位数、双声道第二十八页,本课件共有43页四、数字音频的文件格式四、数字音频的文件格式8、MDMiniDiscSony推出的便携式音乐格式推出的便携式音乐格式MD汽车音响、随身听汽车音响、随身听第二十九页,本课件共有43页五、音频文件的读取五、音频文件的读取工具工具:UltraEditDebug其他反汇编软件其他
13、反汇编软件第三十页,本课件共有43页WAVEWAVE文件作为多媒体中使用的声波文件格式之一,它是以文件作为多媒体中使用的声波文件格式之一,它是以RIFFRIFF格式为标准的。格式为标准的。RIFFRIFF是英文是英文Resource Interchange File FormatResource Interchange File Format(资源互(资源互换文件格式换文件格式 )的缩写,每个)的缩写,每个WAVEWAVE文件的头四个字节便是文件的头四个字节便是“RIFF”“RIFF”。对应的十六进制是。对应的十六进制是52 49 46 4652 49 46 46。五、音频文件的读取五、音频文
14、件的读取文件头文件头数据体数据体WAVEWAVE文件文件RIFFRIFFWAVWAV文件标识段文件标识段声音数据格式说明段声音数据格式说明段第三十一页,本课件共有43页标志符(RIFF)数据大小格式类型(WAVE)fmtSizeof(PCMWAVEFORMAT)PCMWAVEFORMATdata声音数据大小声音数据五、音频文件的读取五、音频文件的读取WAV文件结构文件结构文件头文件头数据体数据体第三十二页,本课件共有43页五、音频文件的读取五、音频文件的读取第三十三页,本课件共有43页五、音频文件的读取五、音频文件的读取例:例:sound.wav44.1kHz16位位双声道双声道12.68秒秒
15、2236752字节数据量字节数据量第三十四页,本课件共有43页00h:52 49 46 46 82 21 22 00 57 41 56 45 66 6D 74 20 RIFF标志标志总数据块大小总数据块大小格式类型格式类型fmt标志标志 22368022236802字节字节 WAVE WAVE 10h:12 00 00 00 01 00 02 00 44 AC 00 00 10 B1 02 00 音频格式数据块大小音频格式数据块大小编码格式编码格式双声道双声道采样频率采样频率每秒数据量每秒数据量18waveformatPCM44.1kHz17640020h:04 00 10 00 00 00
16、66 61 63 74 04 00 00 00 54 88区块对齐单位区块对齐单位量化位数量化位数416位位30h:08 00 64 61 74 61 50 21 22 00 00 00 00 00 FF FFdata标志标志声音裸数据长度声音裸数据长度声音数据内容声音数据内容 2236752字节字节40h:00 00 FE FF FE FF 00 00 00 00 FE FF FE FF 01 00五、音频文件的读取五、音频文件的读取第三十五页,本课件共有43页六、声音质量的度量六、声音质量的度量1、客观质量度量:、客观质量度量:信噪比信噪比信噪比信噪比SNR(SignaltoNoiseRa
17、tio)是有用信号与噪)是有用信号与噪声之比的简称。声之比的简称。噪音可分为环境噪音和设备噪音。信噪噪音可分为环境噪音和设备噪音。信噪比越大,声音质量越好。比越大,声音质量越好。第三十六页,本课件共有43页2、客观质量度量:、客观质量度量:带宽带宽2003.4KHz电话声音范围电话声音范围507KHz调幅广播声音范围调幅广播声音范围2015KHz调频广播声音范围调频广播声音范围1020KHz高保真立体声音范围高保真立体声音范围六、声音质量的度量六、声音质量的度量第三十七页,本课件共有43页2、客观质量度量:、客观质量度量:带宽带宽六、声音质量的度量六、声音质量的度量音频信号的频带越宽,所包含的
18、音频信号分量音频信号的频带越宽,所包含的音频信号分量越丰富,音质越好越丰富,音质越好第三十八页,本课件共有43页六、声音质量的度量六、声音质量的度量3、客观质量度量:、客观质量度量:动态范围动态范围声音的声音的动态范范围即声音从最弱即声音从最弱变到最到最强的范的范围。声音的声音的动态范范围还与与频率有关。率有关。动态范范围最大的最大的频率率区区间是是1000-6000HZ,计量量单位是分位是分贝(dB)。动态范范围越大,信号越大,信号强度的相度的相对变化范化范围越大,音越大,音响效果越好响效果越好第三十九页,本课件共有43页六、声音质量的度量六、声音质量的度量3、客观质量度量:、客观质量度量:
19、动态范围动态范围动态范围动态范围20log(信号的最大强度信号的最大强度/信号的最小强信号的最小强度度)(dB)第四十页,本课件共有43页六、声音质量的度量六、声音质量的度量4、主观质量度量:、主观质量度量:MOS分数分数MeanOpinianScore分数分数质量级别质量级别失真级别失真级别5优优不觉察不觉察4良良刚刚觉察、不讨厌刚刚觉察、不讨厌3中中觉察、有点讨厌觉察、有点讨厌2差差讨厌而不反感讨厌而不反感1劣劣极讨厌、令人反感极讨厌、令人反感第四十一页,本课件共有43页作业作业1、你认为多媒体技术发展的八大技术基础中哪一、你认为多媒体技术发展的八大技术基础中哪一个是最重要的技术基础?并说明原因。个是最重要的技术基础?并说明原因。2、请简述音频数字化过程。、请简述音频数字化过程。3、计算:、计算:三分钟的采样频率为三分钟的采样频率为22.05kHz,量化位数为,量化位数为16位的立位的立体声音频数据量为多少?体声音频数据量为多少?第四十二页,本课件共有43页http:/www.moon-
限制150内