数字声音及MIDI简介剖析优秀PPT.ppt
《数字声音及MIDI简介剖析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《数字声音及MIDI简介剖析优秀PPT.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、MMTMMTYANGZHOUDAXUEYANGZHOUDAXUE物理科学与技术学院物理科学与技术学院其次讲其次讲 数字声音及数字声音及MIDIMIDI简介简介 声音是携带信息的极其重要的媒体(20%),是多媒体技术探讨中的一个重要内容。声音的种类繁多,如人的话音、乐器声、动物发出的声音、机器产生的声音以及自然界的声音等。这些声音有很多共同的特性,也有它们各自的特性。在用计算机处理这些声音时,既要考虑它们的共性,又要利用它们的各自的特性。我们将探讨声音的基础学问,驾驭声音数字化的两个最基本的概念;了解基本的音频信号编码技术。第第1 1节节 声音声音 声音是通过空气传播的一种连续的波,叫声波。反射
2、(reflection)、折射(refraction)和衍射(diffraction)声音信号是由很多频率不同的重量信号组成的复合信号。复合信号的频率范围称为带宽。声音的本质声音的本质声音的本质声音的本质 带宽为20Hz20kHz的信号称为音频(audio)信号,可以被人的耳朵感知。话音信号带宽在80Hz3400Hz。频率确定音调。响度(音量)表示的是声音能量的强弱程度,主要取决于声波振幅的大小。用声压(达因平方厘米,牛顿平方米)或声强(瓦特平方厘米)来计量。声压的单位为帕(Pa)。人耳对lkHz、10-16W/cm2的纯音刚能听到。声强级表示响度的相对量,它定义为某响度与10-16W/cm2
3、比值的对数值乘以10,单位为dB。正常人听觉的强度范围为0dB120dB。声音与听觉声音与听觉声音与听觉声音与听觉乐音乐音乐音乐音n n以小提琴为例,当它的以小提琴为例,当它的A A弦振动时,并不仅仅是整根弦在振弦振动时,并不仅仅是整根弦在振动,这根弦的二分之一、三分之一、四分之一、五分之一动,这根弦的二分之一、三分之一、四分之一、五分之一处都在振动着。于是,整根弦的振动产生了最主要的处都在振动着。于是,整根弦的振动产生了最主要的频率,我们称之为基音,而弦长的二分之一、三分之一、频率,我们称之为基音,而弦长的二分之一、三分之一、四分之一等处的振动则产生了一些次要的频率,我们称之四分之一等处的振
4、动则产生了一些次要的频率,我们称之为泛音。为泛音。n n假如一个物体振动所发出的泛音为基音的整数倍,这个音假如一个物体振动所发出的泛音为基音的整数倍,这个音就会具有清晰可辨的音高,我们称之为乐音,如钢琴,小就会具有清晰可辨的音高,我们称之为乐音,如钢琴,小提琴等发出的都是乐音;假如泛音是基音的非整数倍,这提琴等发出的都是乐音;假如泛音是基音的非整数倍,这个音就不具备清晰可辨的音高,我们称之为噪音,如汽车个音就不具备清晰可辨的音高,我们称之为噪音,如汽车发动机、计算机风扇等发出的都是噪音。发动机、计算机风扇等发出的都是噪音。基音和混入基音的泛音确定音色。声音的三要素声音的三要素声音的三要素声音的
5、三要素n n音调、音强、音色为声音的三要素。音调、音强、音色为声音的三要素。n n音强(响度)取决于声音的幅度。音强(响度)取决于声音的幅度。n n音调取决于声音的频率。音调取决于声音的频率。n n音色是由混入基音的泛音所确定的。音色是由混入基音的泛音所确定的。声音的听觉特性声音的听觉特性声音的听觉特性声音的听觉特性n n声音的方向性声音的方向性n n人的耳朵对声音强度和频率的反应成人的耳朵对声音强度和频率的反应成对数形式对数形式对数形式对数形式n n声音的声音的掩蔽特性掩蔽特性(时域掩蔽、频域掩蔽(时域掩蔽、频域掩蔽)声音质量的度量声音质量的度量声音质量的度量声音质量的度量n n声音的质量与
6、声音的带宽有关,一般来说频率范围越宽,声音的质量与声音的带宽有关,一般来说频率范围越宽,声音质量也就越高。声音质量也就越高。声音类型声音类型带带 宽宽电话语音电话语音200200HzHz3.4kHz3.4kHz调幅广播调幅广播(AM)(AM)5050HzHz7kHz7kHz调频广播调频广播(FM)(FM)2020HzHz15kHz15kHzCDCD10Hz10Hz20kHz20kHz信噪比(信噪比(SNRSNR)度量度量指试听者要把语音编码器的输出按质量分为:优(指试听者要把语音编码器的输出按质量分为:优(5 5分)、良分)、良(4 4分)、中(分)、中(3 3分)、差(分)、差(2 2分)、
7、劣(分)、劣(1 1分)分)或分类为:察觉不到(或分类为:察觉不到(5 5分),稍稍察觉到但无不适感(分),稍稍察觉到但无不适感(4 4分),分),能察觉且有不适感(能察觉且有不适感(3 3分),有不适感但还能忍受(分),有不适感但还能忍受(2 2分),很不分),很不适且无法忍受(适且无法忍受(1 1分)分)主观平均判分法(MOS,Mean Opinion ScoreMean Opinion Score)第2节 声音信号数字化n n声音信号是典型的连续信号,不仅在时间上是连续的,声音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。而且在幅度上也是连续的。n n声音进入计算机
8、的第一步就是数字化,数字化过程中最声音进入计算机的第一步就是数字化,数字化过程中最重要的步骤就是重要的步骤就是采样采样采样采样和和量化量化量化量化。n n采样(采样(采样(采样(samplingsampling):将声音信号在时间上离散将声音信号在时间上离散化,即每隔相等的一段时间抽取一个信号样本。化,即每隔相等的一段时间抽取一个信号样本。n n量化(量化(量化(量化(quantizationquantization):将连续的信号幅度离散):将连续的信号幅度离散):将连续的信号幅度离散):将连续的信号幅度离散化。假如幅度的划分是等间隔的,称为线性量化。假如幅度的划分是等间隔的,称为线性量化。
9、假如幅度的划分是等间隔的,称为线性量化。假如幅度的划分是等间隔的,称为线性量化,否则为非线性量化。一般紧跟编码过程。化,否则为非线性量化。一般紧跟编码过程。化,否则为非线性量化。一般紧跟编码过程。化,否则为非线性量化。一般紧跟编码过程。电压范围电压范围 量化步长量化步长 量化结果量化结果 编码编码 逆量化结果逆量化结果 5 7 2 3 011 6 3 5 2 2 010 4 1 3 2 1 001 2 -1 1 2 0 000 0-3-1 2 -1 111 -2-5-3 2 -2 110 -4-7-5 2 -3 101 -6-9-7 2 -4 100 -8多媒体数据的量化一般通过除以量化步长量
10、化为整数。多媒体数据的量化一般通过除以量化步长量化为整数。逆量化就是乘以量化步长。逆量化就是乘以量化步长。量化步长越长,压缩字节越多,但是误差越大。量化步长越长,压缩字节越多,但是误差越大。量化步长越短,压缩字节越少,但是误差越小。量化步长越短,压缩字节越少,但是误差越小。量化除了有使幅度离散的作用外,同时:量化除了有使幅度离散的作用外,同时:(1 1)压缩字节)压缩字节(2 2)产生量化误差()产生量化误差(量化误差量化误差:逆量化的结果和原始:逆量化的结果和原始信号幅值之差,也称为信号幅值之差,也称为量化噪声量化噪声。)n n采样频率采样频率 奈奎斯特理论指出:奈奎斯特理论指出:采样频率不
11、应低于声音信号采样频率不应低于声音信号最高频率的两倍最高频率的两倍,这样就能把以数字表达的声音,这样就能把以数字表达的声音还原成原来的声音,称为无损数字化。还原成原来的声音,称为无损数字化。f fs s =2f 2fmaxmax 例如例如话音信号话音信号最高频率约为最高频率约为3.43.4kHzkHz,所以采样频所以采样频率取为率取为8 8kHzkHz。n n采样精度采样精度n n 每个声音样本的数字化位数。反映声音波形每个声音样本的数字化位数。反映声音波形幅度的采样精度。也干脆确定数据率的大小。幅度的采样精度。也干脆确定数据率的大小。质量质量采样频率采样频率(kHzkHz)样本精度样本精度(
12、bitbit)单道声单道声/立体声立体声数据率数据率(kb/skb/s)电话电话8 88 8单道声单道声6464AMAM11.02511.0258 8单道声单道声8888.2.2FMFM22.05022.0501616立体声立体声705.6705.6CDCD44.144.11616立体声立体声1411.21411.2人机通信,计算机接收音频信号。获得、语音识别与理解。人机通信,计算机接收音频信号。获得、语音识别与理解。机人通信,计算机输出音频。音频合成;声音重构、模拟。机人通信,计算机输出音频。音频合成;声音重构、模拟。产生真实感声音。产生真实感声音。人机人通信,人通过网络进行语音通信,须要的
13、处理包人机人通信,人通过网络进行语音通信,须要的处理包括:语音采集、编码解码、传输、检索,识别。括:语音采集、编码解码、传输、检索,识别。音频信号处理的内容第3节 音频处理技术关于音频信号的几个问题n n奈奎斯特(奈奎斯特(Nyquist)理论与混迭效应)理论与混迭效应n n量化量化n n信号的时域与频率特征信号的时域与频率特征n n人耳对音频信号的理解人耳对音频信号的理解n n信号的表示和编码信号的表示和编码n n信号的重构信号的重构音频信号处理的流程原始声音信 号声电信号转 换低 通滤 波模拟数字转 换数字信号处 理传 输存 储声 音合 成功 率放 大数字模拟转 换电声信号转换音频信号处理
14、的重要硬件就是音频卡。音频卡结构音频卡结构第4节 WAVE音效和MIDI音乐n nWaveWave音效合成与音效合成与MIDIMIDI音乐合成是声卡最主要的功音乐合成是声卡最主要的功能。能。n nWAVEWAVE音效合成是由声卡的音效合成是由声卡的ADAD模数转换器和模数转换器和DADA数数模转换器来完成的。模拟音频信号经模转换器来完成的。模拟音频信号经ADAD转换后为转换后为数字音频后,以文件形式将数据干脆存放在磁盘数字音频后,以文件形式将数据干脆存放在磁盘等介质上,成为声音文件。这类文件我们称之为等介质上,成为声音文件。这类文件我们称之为wave formwave form文件,通常以文件
15、,通常以.wav.wav为扩展名,因此也称为扩展名,因此也称为为wavwav文件。文件。n n缺点:缺点:wavwav文件须要占用很大的贮存空间。文件须要占用很大的贮存空间。n n为了节约存贮空间,人们运用各种算法对为了节约存贮空间,人们运用各种算法对wavwav文件进文件进行压缩,时下极为流行的行压缩,时下极为流行的MP3MP3就是一种高压缩比低失就是一种高压缩比低失真的压缩算法。真的压缩算法。WAVEWAVEWAVEWAVE文件格式文件格式文件格式文件格式偏移偏移地址地址字节字节数数数据类型数据类型内内 容容文文件件头头4 42 2字字节节00H00H4 4charcharRIFFRIFF
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字 声音 MIDI 简介 剖析 优秀 PPT
限制150内