第5章音频处理技术课件.ppt
《第5章音频处理技术课件.ppt》由会员分享,可在线阅读,更多相关《第5章音频处理技术课件.ppt(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第1页第第5章章 音频处理技术音频处理技术本章概述 本章的学习目标主要内容第2页本章概述本章概述l声音是携带信息的非常重要的媒体。声音是携带信息的非常重要的媒体。l在多媒体计算机系统中,通过声音可以传递信息、在多媒体计算机系统中,通过声音可以传递信息、制造效果、营造气氛及演奏音乐等。制造效果、营造气氛及演奏音乐等。l音频处理技术是多媒体技术研究的重要内容之一音频处理技术是多媒体技术研究的重要内容之一, 主要包括模拟声音信号数字化、音频文件存储、主要包括模拟声音信号数字化、音频文件存储、传输、播放、数字音效处理等内容。传输、播放、数字音效处理等内容。l本章主要介绍声音信号及其数字化的基本概念、本
2、章主要介绍声音信号及其数字化的基本概念、音频卡的组成及其工作原理、数字音频的采集与音频卡的组成及其工作原理、数字音频的采集与编辑、编辑、MIDI音乐以及几个常用的音频处理软件等音乐以及几个常用的音频处理软件等内容,并以内容,并以Adobe Audition 3.0为例,详细介绍为例,详细介绍编辑处理声音文件的具体方法。编辑处理声音文件的具体方法。第3页本章的学习目标本章的学习目标l理解音频的基本知识理解音频的基本知识l掌握常用的音频文件格式掌握常用的音频文件格式l理解音频数字化过程理解音频数字化过程l熟练掌握音频的采集及处理熟练掌握音频的采集及处理 第4页主要内容主要内容5.1 音频基本知识音
3、频基本知识5.2 音频数字化音频数字化5.3 音频文件格式音频文件格式5.4 数字音频的采集数字音频的采集5.5 常用音频工具软件常用音频工具软件5.6 基于基于Adobe Audition的音频处理的音频处理5.7 本章小结本章小结第5页5.1 音频基本知识音频基本知识l声音的物理特征声音的物理特征l音频相关概念音频相关概念第6页声音的物理特征声音的物理特征l人的耳朵所感觉到的空气分子的振动就是人的耳朵所感觉到的空气分子的振动就是声音信号,它通常用一种连续的波形来表声音信号,它通常用一种连续的波形来表示。示。声波的振幅与频率声波的振幅与频率波形的最大位移称为振波形的最大位移称为振幅幅A,反映
4、音量。波形,反映音量。波形中两个连续波峰中两个连续波峰(或波或波谷谷)之间的距离称为周之间的距离称为周期期T。周期的倒数。周期的倒数1/T即即为频率为频率f,以赫兹,以赫兹(Hz)为单位。为单位。第7页声音的物理特征声音的物理特征l频率反映了声音的音调,声音按频率可分频率反映了声音的音调,声音按频率可分为三类:为三类:低于低于20Hz的声音称为次声的声音称为次声频率范围在频率范围在20Hz20kHz范围的可听声称为音范围的可听声称为音频频频率高于频率高于20kHz的声音称为超音频的声音称为超音频(或超声或超声)第8页声音的物理特征声音的物理特征l振幅和频率不变的声音为纯音,纯音一般都是用振幅和
5、频率不变的声音为纯音,纯音一般都是用专用电子设备产生的。专用电子设备产生的。l在自然界中,语音、乐声等大多数不是纯音,它在自然界中,语音、乐声等大多数不是纯音,它们都是由不同的振幅和频率组成的复音。们都是由不同的振幅和频率组成的复音。l在复音中最低频一般是一个常数,称为基频,基在复音中最低频一般是一个常数,称为基频,基频是决定声音音调的基本因素。复音中的其他频频是决定声音音调的基本因素。复音中的其他频率通常称为谐音。率通常称为谐音。l基频和谐音组合后,即可形成不同音质和音色的基频和谐音组合后,即可形成不同音质和音色的声音。音色是辨别声音的特征,通过音色能区分声音。音色是辨别声音的特征,通过音色
6、能区分自然界不同的声源。若在传播过程中谐音有所损自然界不同的声源。若在传播过程中谐音有所损失,则可能改变原声源的特征而发生畸变。失,则可能改变原声源的特征而发生畸变。第9页音频相关概念音频相关概念 从处理方式看,目前多媒体计算机中的音频主要从处理方式看,目前多媒体计算机中的音频主要有波形音频、有波形音频、CD音频和音频和MIDI音乐音乐3种形式:种形式:l波形音频波形音频所谓波形音频,就是由外部声音源通过数字化过程采所谓波形音频,就是由外部声音源通过数字化过程采集到多媒体计算机中的所有声音形式,如讲话录音、集到多媒体计算机中的所有声音形式,如讲话录音、流行歌曲、自然界的各种声音等,可通过编辑流
7、行歌曲、自然界的各种声音等,可通过编辑(裁剪、裁剪、合成、效果等合成、效果等)、编码压缩、存储以及还原播放等方式、编码压缩、存储以及还原播放等方式进行处理。进行处理。在波形音频中,人的语音有一类特殊的声音。语音具在波形音频中,人的语音有一类特殊的声音。语音具有内在的语言学、语音学的内涵,例如发音习惯、语有内在的语言学、语音学的内涵,例如发音习惯、语气等。多媒体计算机可以利用特殊的方法分析、研究、气等。多媒体计算机可以利用特殊的方法分析、研究、抽取语音的相关特征,实现对不同语音的分辨、识别抽取语音的相关特征,实现对不同语音的分辨、识别以及通过文字合成语音波形等。以及通过文字合成语音波形等。第10
8、页音频相关概念音频相关概念lCD音频音频CD音频音频(CD-Audio)是存储在音乐是存储在音乐CD光盘中的数字音光盘中的数字音频,可以通过频,可以通过CD-ROM驱动器读取并采集到多媒体计驱动器读取并采集到多媒体计算机系统中,然后以波形音频的相应形式进行存储和算机系统中,然后以波形音频的相应形式进行存储和处理。处理。lMIDI音乐音乐MIDI音乐是一种十分规范的音乐形式,也称音乐是一种十分规范的音乐形式,也称MIDI音频。音频。它将音乐符号化并保存在它将音乐符号化并保存在MIDI文件中,然后通过音乐文件中,然后通过音乐合成器产生相应的声音波形来还原播放。合成器产生相应的声音波形来还原播放。第
9、11页主要内容主要内容5.1 音频基本知识音频基本知识5.2 音频数字化音频数字化5.3 音频文件格式音频文件格式5.4 数字音频的采集数字音频的采集5.5 常用音频工具软件常用音频工具软件5.6 基于基于Adobe Audition的音频处理的音频处理5.7 本章小结本章小结第12页5.2 音频数字化音频数字化l音频是时间的函数,声音信号是振幅随时间连续变化的模音频是时间的函数,声音信号是振幅随时间连续变化的模拟信号。在计算机处理音频信号之前,必须将声音的模拟拟信号。在计算机处理音频信号之前,必须将声音的模拟信号进行数字化,形成数字音频。信号进行数字化,形成数字音频。l数字化的具体过程包括采
10、样、量化和编码数字化的具体过程包括采样、量化和编码3个环节。采样个环节。采样和量化完成模拟信号的数字化表示,编码实现数字音频的和量化完成模拟信号的数字化表示,编码实现数字音频的标准化和数据压缩。标准化和数据压缩。l数字化后的音频质量取决于采样频率、量化位数以及编码数字化后的音频质量取决于采样频率、量化位数以及编码压缩算法等因素。压缩算法等因素。音频数字化过程第13页5.2 音频数字化音频数字化l 采样与采样频率采样与采样频率l 量化与量化级量化与量化级l 声道声道l音频采样的数据量音频采样的数据量l音频数据编码音频数据编码第14页采样与采样频率采样与采样频率l所谓采样就是每间隔一段时间读取一次
11、声音信号所谓采样就是每间隔一段时间读取一次声音信号幅度,使声音信号在时间上被离散化。幅度,使声音信号在时间上被离散化。l采样的主要参数是采样频率。采样的主要参数是采样频率。l采样频率采样频率(Sampling Rate)是指将模拟声音波形是指将模拟声音波形数字化时,每秒钟所抽取声波幅度样本的次数,数字化时,每秒钟所抽取声波幅度样本的次数,其计算单位是其计算单位是kHz(千赫兹千赫兹)。l一般来说,采样频率越高,声音失真越小,但用一般来说,采样频率越高,声音失真越小,但用于存储数字音频的数据量也越大。于存储数字音频的数据量也越大。l采样频率的高低是根据声音信号本身的最高频率采样频率的高低是根据声
12、音信号本身的最高频率和奈奎斯特采样定理和奈奎斯特采样定理(Nyquist theory)决定的。决定的。 第15页采样与采样频率采样与采样频率l奈奎斯特采样定理:设连续信号奈奎斯特采样定理:设连续信号 的频谱的频谱为为 ,以采样间隔,以采样间隔T采样得到离散信号采样得到离散信号 ,如果满足:当如果满足:当 时,时, 是截止频率,是截止频率, 或或 则可以由离散信号则可以由离散信号 完全确定完全确定连续信号连续信号 。当采样频率等于。当采样频率等于 时,时,即即 ,称,称 为奈奎斯特频率。为奈奎斯特频率。l奈奎斯特采样定理指出,采样频率不应低于声音奈奎斯特采样定理指出,采样频率不应低于声音信号最
13、高频率的两倍,这样才能把离散的数字音信号最高频率的两倍,这样才能把离散的数字音频还原为原来的声音。频还原为原来的声音。)(tx)( fx)(nTxcff cf)2/(1Tfc)(nTx)(tx)2/(1T)2/(1cfT )2/(1TfNNf第16页采样与采样频率采样与采样频率l音频的频率范围大约在音频的频率范围大约在20Hz20kHz之间,根据之间,根据采样理论,为了保证声音不失真,采样频率应在采样理论,为了保证声音不失真,采样频率应在40kHz左右。左右。l常用的音频采样率有常用的音频采样率有8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz(CD音
14、音质质)、48kHz等。等。l采样频率越高,数字音频的音质就越接近原声。采样频率越高,数字音频的音质就越接近原声。第17页量化与量化级量化与量化级l量化就是把采样得到的声音信号幅度转换为数字量化就是把采样得到的声音信号幅度转换为数字值,是声音信号在幅度上被离散化。值,是声音信号在幅度上被离散化。l量化位数是每个采样点能够表示的数据范围,量量化位数是每个采样点能够表示的数据范围,量化位数越多,所得到的量化值越接近原始波形的化位数越多,所得到的量化值越接近原始波形的采样值。采样值。l常用的量化位数有常用的量化位数有8位、位、16位、位、24位。位。l量化位数越高音质越好,数据量也越大。量化位数越高
15、音质越好,数据量也越大。第18页量化与量化级量化与量化级l在多媒体中,对于音频,量化位数可采用在多媒体中,对于音频,量化位数可采用16位,位,对应有对应有65536个量化级;对于语音编码,量化位个量化级;对于语音编码,量化位数可采用数可采用8位,对应有位,对应有256个量化级。个量化级。l量化级的大小决定了声音的动态范围,即被记录量化级的大小决定了声音的动态范围,即被记录和重放的声音最高与最低之间的差值。和重放的声音最高与最低之间的差值。l量化时,每个采样数据均被四舍五入到最接近的量化时,每个采样数据均被四舍五入到最接近的整数,如果波形幅度超过了可用的最大位,波形整数,如果波形幅度超过了可用的
16、最大位,波形的顶部和底部将会被削去,这就是削峰。在量化的顶部和底部将会被削去,这就是削峰。在量化过程中可能会出现噪声,削峰有可能会造成声音过程中可能会出现噪声,削峰有可能会造成声音严重失真。严重失真。第19页声道声道l反映音频数字化质量的另一个因素是声道个数。反映音频数字化质量的另一个因素是声道个数。l记录声音时,如果每次生成一个声波的数据,称记录声音时,如果每次生成一个声波的数据,称为单声道。为单声道。l每次生成两个声波数据,称为双声道每次生成两个声波数据,称为双声道(立体声立体声)。l每次生成两个以上声波数据,称为多声道每次生成两个以上声波数据,称为多声道(环绕立环绕立体声体声)。第20页
17、音频采样的数据量音频采样的数据量l数字音频的采样数据量主要取决于两个因数字音频的采样数据量主要取决于两个因素:素:一是音质因素,它是由采样频率、量化位数和一是音质因素,它是由采样频率、量化位数和声道数声道数3个参数决定的。采样频率越高、量化个参数决定的。采样频率越高、量化位数越多、声道数越多,数字音频的音质就越位数越多、声道数越多,数字音频的音质就越好,反之就越差;好,反之就越差;二是时间因素,采样时间越长,数据量越大。二是时间因素,采样时间越长,数据量越大。第21页音频采样的数据量音频采样的数据量l单位时间的数据量可用下式表示:单位时间的数据量可用下式表示:l 为单位时间的数据量为单位时间的
18、数据量(Kbps), 为采样频率为采样频率(kHz), 为量化位数为量化位数(bit), 为声道数。具体为声道数。具体计算时,需要将单位时间的数据量计算时,需要将单位时间的数据量 与采样时与采样时间间 相乘,并注意采样频率的单位换算。例如,相乘,并注意采样频率的单位换算。例如,对于对于22.05kHz的采样频率,量化位数为的采样频率,量化位数为8位二进位二进制位,单声道制位,单声道10秒钟的采样数据量为秒钟的采样数据量为22.0510008101/8=220500(B)。8sbfvcvcfbstv第22页1分钟声音所需的存储空间分钟声音所需的存储空间 第23页音频数据编码音频数据编码l数字音频
19、的数据量是非常大的,所以音频处理的关键问题数字音频的数据量是非常大的,所以音频处理的关键问题就是要对音频数据进行压缩编码。就是要对音频数据进行压缩编码。l在多媒体计算机系统中,采样量化后的数字音频信号要经在多媒体计算机系统中,采样量化后的数字音频信号要经过编码压缩后才能以音频文件的形式存储或传输,而播放过编码压缩后才能以音频文件的形式存储或传输,而播放音频文件是通过解码器还原后再将音频信号输出。音频文件是通过解码器还原后再将音频信号输出。l为了对音频数据进行有效的压缩,需从采样数据中去除数为了对音频数据进行有效的压缩,需从采样数据中去除数据冗余,同时保证音频质量在许可的可控范围内。据冗余,同时
20、保证音频质量在许可的可控范围内。l人们从音频数据的可能冗余出发,分析研究了不同形式的人们从音频数据的可能冗余出发,分析研究了不同形式的音频数据冗余形式,在统计归纳的基础上,构造了一系列音频数据冗余形式,在统计归纳的基础上,构造了一系列的数据模型,即编码算法,从不同角度实现对音频数据的的数据模型,即编码算法,从不同角度实现对音频数据的有效压缩。有效压缩。第24页音频数据编码音频数据编码l音频数据压缩编码的方法有多种,可分为无损压音频数据压缩编码的方法有多种,可分为无损压缩和有损压缩两大类。缩和有损压缩两大类。无损压缩主要包含各种熵编码。无损压缩主要包含各种熵编码。有损压缩则可分为波形编码、参数编
21、码和同时利用多有损压缩则可分为波形编码、参数编码和同时利用多种技术的混合编码。种技术的混合编码。波形编码是在模拟音频数字化波形编码是在模拟音频数字化(抽样和量化抽样和量化)的过程中,的过程中,根据人耳的听觉特性进行编码,并使编码后的音频信根据人耳的听觉特性进行编码,并使编码后的音频信号与原始信号的波形尽可能匹配,实现数据的压缩。号与原始信号的波形尽可能匹配,实现数据的压缩。波形编码的特点是适应性强,音频质量好,在较高码波形编码的特点是适应性强,音频质量好,在较高码率的条件下可以获得高质量的音频信号,既适合于高率的条件下可以获得高质量的音频信号,既适合于高质量的音频信号,也适合于高保真语音和音乐
22、信号,质量的音频信号,也适合于高保真语音和音乐信号,但波形编码压缩比不大。但波形编码压缩比不大。第25页音频数据编码音频数据编码参数编码把音频信号表示参数编码把音频信号表示成参数编码把音频信号表示参数编码把音频信号表示成某种模型的输出,利用特征提取的方法抽取必要的模某种模型的输出,利用特征提取的方法抽取必要的模型参数和激励信号的信息,并对这些信息进行编码,型参数和激励信号的信息,并对这些信息进行编码,最后在输出端合成原始信号。其目的是重建音频,保最后在输出端合成原始信号。其目的是重建音频,保持原始音频的特性。常用的音频参数有线性预测系数、持原始音频的特性。常用的音频参数有线性预测系数、滤波器组
23、等。参数编码的压缩率很大,但计算量大,滤波器组等。参数编码的压缩率很大,但计算量大,保真度不高,适合于一般语音信号保真度不高,适合于一般语音信号(电话音质电话音质)的编码。的编码。混合编码介于波形编码和参数编码之间,集中了这两混合编码介于波形编码和参数编码之间,集中了这两种方法的优点,可在较低的码率上得到较高的音质。种方法的优点,可在较低的码率上得到较高的音质。第26页主要内容主要内容5.1 音频基本知识音频基本知识5.2 音频数字化音频数字化5.3 音频文件格式音频文件格式5.4 数字音频的采集数字音频的采集5.5 常用音频工具软件常用音频工具软件5.6 基于基于Adobe Audition
24、的音频处理的音频处理5.7 本章小结本章小结第27页5.3 音频文件格式音频文件格式常用的音频文件格式有:常用的音频文件格式有:lWAV格式格式lMP3格式格式lWMA格式格式lMIDI格式格式lCD-DA格式格式lAudio格式格式lRealAudio格式格式lAIFF格式格式第28页音频文件格式音频文件格式lWAV格式格式(.wav)WAV声音格式文件也叫波形声音格式文件也叫波形(WAVE)声音文件,是微软声音文件,是微软公司推出的格式,是公司推出的格式,是Windows所使用的标准数字音频。所使用的标准数字音频。WAV格式存储的采样数据可以用来重现实际声音的波格式存储的采样数据可以用来重
25、现实际声音的波形,这些数据不经过压缩,所有不会失去任何记录信形,这些数据不经过压缩,所有不会失去任何记录信息,音质是最好的,数据体积最大。息,音质是最好的,数据体积最大。Windows录音机就是将原始的声音信号存储为录音机就是将原始的声音信号存储为WAV格格式,大多数压缩格式的声音文件都是在式,大多数压缩格式的声音文件都是在WAV格式的基格式的基础上经过数据的重新编码来压缩其数据量的。础上经过数据的重新编码来压缩其数据量的。第29页音频文件格式音频文件格式lMP3格式格式(.mp3)MP3的全称是的全称是MPEG-1 Layer3音频文件。音频文件。MPEG-1是动态视频压缩标准,其中的声音部
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第5章 音频处理技术课件 音频 处理 技术 课件
限制150内