第2章数字音频处理与实践优秀PPT.ppt
第2章数字音频处理与实践现在学习的是第1页,共40页2.1 多媒体音频信息处理 2.1.1声音信号的形式任任何何声声音音都都是是物物体体振振动动产产生生的的现现象象 ,物物体体受受到到敲敲打打或或激激发发就就能能产产生生振振动动,发发声声体体的的振振动动在在介介质质中中的的传传播播称称为为声声波波。当当声声波波达达到到人人的的耳耳膜膜时时,会感觉到这种压力的变化,或者感觉到振动,这就是会感觉到这种压力的变化,或者感觉到振动,这就是声音声音。在日常生活中,音频在日常生活中,音频(Audio)(Audio)信号可分为两类:信号可分为两类:语音信号语音信号和和非语音信号。非语音信号。在在物物理理上上,声声音音可可用用一一条条连连续续的的曲曲线线来来表表示示。这这条条连连续续的的曲曲线线无无论论多多复复杂杂,都都可可分分解解成成一一系系列列正正弦弦波波的的线线性性叠叠加加。因因声声波波是是在在时时间间和和幅幅度度上上都都连连续续变变化化的量,称为的量,称为模拟量模拟量。现在学习的是第2页,共40页 图图2-1 2-1 用声音录制软件记录的英文单词用声音录制软件记录的英文单词”Hello”Hello”语音语音 的实际波形体之间的关系的实际波形体之间的关系现在学习的是第3页,共40页2.1.2 模拟音频信号的物理特征模模拟拟音音频频信信号号有有两两个个重重要要参参数数:频频率率和和幅幅度度。声声音音的的频频率率体体现现音音调调的的高高低,声波幅度的大小体现声音的强弱。低,声波幅度的大小体现声音的强弱。2-2 2-2 声波的频率、周期与振幅声波的频率、周期与振幅现在学习的是第4页,共40页1 1.频率频率一个声源每秒钟可产生成百上千个波,我们把每秒一个声源每秒钟可产生成百上千个波,我们把每秒钟波峰所发生的数目称之为信号的频率,单位用赫钟波峰所发生的数目称之为信号的频率,单位用赫兹兹(Hz)(Hz)或千赫兹或千赫兹(kHz)(kHz)表示。表示。人们在日常说话时的语音信号:频率范围人们在日常说话时的语音信号:频率范围3003003000Hz3000Hz亚音亚音(subsonic)(subsonic):频率小于:频率小于20 Hz20 Hz的信号的信号音频音频(Audio)(Audio):频率范围为:频率范围为202020kHz20kHz的信号的信号超音频超音频(ultrasonic)(ultrasonic):高于:高于20kHz20kHz的信号的信号 现在学习的是第5页,共40页2 2.周期周期 周周期期是是指指信信号号在在两两个个峰峰点点或或谷谷底底之之间间的的相相对对时时间间。周周期期和和频频率率之之间间的的关关系系是是互互为为倒倒数数。如如果果每每隔隔定定时时间间波波形形就就重重复复相相同同的的形形状状,那那么么就就称称这这个时间为周期。个时间为周期。3 3.幅度幅度 信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大,声音越强。声音的强度水平幅度越大,声音越强。声音的强度水平(声响或者音量声响或者音量)用用dBdB来测量。来测量。dBdB的测量值的测量值等于在对数标尺上选定的参考声强与实际感受的声强的比值。等于在对数标尺上选定的参考声强与实际感受的声强的比值。分贝数分贝数10log(P110log(P1P0)P0)现在学习的是第6页,共40页2.1.3 与声音有关的几个术语1.1.听觉、感知听觉、感知2.2.音高音高 3.3.音色音色4.4.语音语音5.5.响度响度 现在学习的是第7页,共40页6 6.声音的质量声音的质量声声音音的的质质量量与与它它所所占占用用的的频频带带宽宽度度有有关关,频频带带越越宽宽,信信号号强强度度的的相相对对变变化化范范围围就就越大大,音响效果也就越好。按照带宽可将声音质量分为越大大,音响效果也就越好。按照带宽可将声音质量分为4 4级级 图图2-3 2-3 四级声音质量的频率范围四级声音质量的频率范围现在学习的是第8页,共40页2.1.4 模拟音频的数字化过程数数字字化化的的声声音音易易于于用用计计算算机机软软件件处处理理,对对模模拟拟音音频频数数字字化化过过程程涉涉及及音频的采样、量化和编码音频的采样、量化和编码现在学习的是第9页,共40页 采样和量化的过程可由采样和量化的过程可由数模(数模(A/DA/D)转换器)转换器转换器实现。转换器实现。A/DA/D转换器以固定的转换器以固定的频率去采样,即每个周期测量和量化信号一次。经采样和量化后声音信号经频率去采样,即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成为数字音频信号,可以将其以文件形式保存在计算机的存储介质编码后就成为数字音频信号,可以将其以文件形式保存在计算机的存储介质中,这样的文件一般称为数字声波文件。中,这样的文件一般称为数字声波文件。1.1.采样采样为实现为实现A/DA/D转换,需要把模拟音频信号波形进行分割,以转变成数字信转换,需要把模拟音频信号波形进行分割,以转变成数字信号,这种方法称为采样号,这种方法称为采样(Sampling)(Sampling)。采样的过程是。采样的过程是每隔一个时间间隔在模拟声音的每隔一个时间间隔在模拟声音的波形上取一个幅度值波形上取一个幅度值,把时间上的连续信号,变成时间上的离散信号。该时间,把时间上的连续信号,变成时间上的离散信号。该时间间隔称为采样周期,其倒数为采样频率。间隔称为采样周期,其倒数为采样频率。采样频率采样频率是指计算机每秒钟采集多少个是指计算机每秒钟采集多少个声音样本。声音样本。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。样本数据就越多,对声音波形的表示也越精确。现在学习的是第10页,共40页2.2.量化量化对声波波形幅度的数字化表示称之为对声波波形幅度的数字化表示称之为“量化量化”量化的过程量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的样值归为一类,并赋于相同的量化值。落入某个区段内的样值归为一类,并赋于相同的量化值。如何分割采样信号的幅度呢如何分割采样信号的幅度呢?采取二进制的方式,以位采取二进制的方式,以位(bit)(bit)或或1616位的方式来划分纵轴。也就是说在位的方式来划分纵轴。也就是说在一个以一个以8 8位为记录模式的音效中,其纵轴将会被划分为个量化等级位为记录模式的音效中,其纵轴将会被划分为个量化等级(quantization levels)(quantization levels),用以记录其幅度大小。,用以记录其幅度大小。在相同的采样频率之下,量化位数愈高,声音的质量越好。同理,在相同量化位在相同的采样频率之下,量化位数愈高,声音的质量越好。同理,在相同量化位数的情况下,采样频率越高,声音效果也就越好。数的情况下,采样频率越高,声音效果也就越好。现在学习的是第11页,共40页3.3.编码编码 图图2-6 2-6 音频信号处理过程音频信号处理过程 音频编码的信息是声音波形,所以又称波形编码。这种方法要求重构的音频编码的信息是声音波形,所以又称波形编码。这种方法要求重构的声音信号的各个样本尽可能地接近于原始声音的采样值,复原的声音质声音信号的各个样本尽可能地接近于原始声音的采样值,复原的声音质量较高。量较高。常用的波形编码技术有常用的波形编码技术有脉冲编码调制脉冲编码调制(Pulse Code ModulationPulse Code Modulation,PCMPCM)、)、自适应差分脉冲编码调制自适应差分脉冲编码调制(Adaptive Differential Pulse Code Adaptive Differential Pulse Code ModulationModulation,ADPCMADPCM)和)和自适应变换编码自适应变换编码(Adaptive Transform Adaptive Transform CodingCoding,ATCATC)等。)等。现在学习的是第12页,共40页脉冲编码调制脉冲编码调制PCMPCMPCMPCM是把模拟信号变换为数字信号的一种调制方式,既把连续输入的模拟是把模拟信号变换为数字信号的一种调制方式,既把连续输入的模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输或存储。或存储。PCMPCM的主要优点是:的主要优点是:抗干扰能力强;失真小;传输特性稳定,尤其是远距离抗干扰能力强;失真小;传输特性稳定,尤其是远距离信号再生中继时噪声不累积,而且可以采用压缩编码、纠错编码和保密信号再生中继时噪声不累积,而且可以采用压缩编码、纠错编码和保密编码等来提高系统的有效性、可靠性和保密性。编码等来提高系统的有效性、可靠性和保密性。现在学习的是第13页,共40页2.1.5 声卡声卡声卡(也称为声效卡)声卡(也称为声效卡)在多媒体计算机中是不可缺少的重要在多媒体计算机中是不可缺少的重要部件,直接决定了对声音数据的处理能力与质量。部件,直接决定了对声音数据的处理能力与质量。现在的声卡已不仅仅作为发声之用,还兼备了声音的采集、编辑、语音识别、网现在的声卡已不仅仅作为发声之用,还兼备了声音的采集、编辑、语音识别、网络电话等种种功用络电话等种种功用现在学习的是第14页,共40页n1.1.声卡的工作原理声卡的工作原理 图图2-7 2-7 声卡工作原理框图声卡工作原理框图主芯片主芯片-数字信号处理器数字信号处理器 承担着对声音信息处理、特殊音效过滤与处理、语音识别、实时音频压承担着对声音信息处理、特殊音效过滤与处理、语音识别、实时音频压缩、缩、MIDIMIDI合成等重要的任务。合成等重要的任务。声卡主芯片是一块具有强大运算能力的数字信号处理器(声卡主芯片是一块具有强大运算能力的数字信号处理器(DSPDSP),是声卡),是声卡的核心部件。的核心部件。DSPDSP是一种可编程芯片,通过软件安装新的指令后就能够升级。主是一种可编程芯片,通过软件安装新的指令后就能够升级。主芯片能将来自芯片能将来自ADC(ADC(数字数字/模拟转换器模拟转换器)的信号加以处理,改变成所需要的形式。的信号加以处理,改变成所需要的形式。DSPDSP芯片对输入的数字声音用芯片对输入的数字声音用PCMPCM、DPCMDPCM或或ADPCMADPCM方式进行编码和压缩,并形成方式进行编码和压缩,并形成WAVWAV格式文件送入计算机磁盘存储。声音输出时,将磁盘中的格式文件送入计算机磁盘存储。声音输出时,将磁盘中的WAVWAV文件送入文件送入DSPDSP芯芯片,经解码后变成数字声音信号送至片,经解码后变成数字声音信号送至D/AD/A转换部分。转换部分。混音芯片混音芯片-CODEC-CODEC 主要承担对原始声音信号的采样、主要承担对原始声音信号的采样、编码和混音处理;混音的声源可以是编码和混音处理;混音的声源可以是MIDIMIDI信号、信号、CDCD音频、线性输入、话筒音频、线性输入、话筒等,可以选择输入一个声源或将几个等,可以选择输入一个声源或将几个不同声源进行混合录音。在对音源处不同声源进行混合录音。在对音源处理时,可编程设定采样频率和量化位理时,可编程设定采样频率和量化位数。数。音乐合成器音乐合成器 标准多媒体标准多媒体PCPC可以通过声卡的内部合成可以通过声卡的内部合成器器(Synthesizer)(Synthesizer)或主机或主机MIDIMIDI端口的外部端口的外部合成器播放合成器播放MIDIMIDI文件。文件。频率调制合成器频率调制合成器(FM(FM合成器合成器)波表波表(Wave table(Wave table合成器合成器)。总线接口和控制器总线接口和控制器 总线接口和控制器由数据总线双向驱总线接口和控制器由数据总线双向驱动器、总线接口控制逻辑、总线中断逻辑和动器、总线接口控制逻辑、总线中断逻辑和DMADMA控制逻辑组成。目前声卡的总线接口一般控制逻辑组成。目前声卡的总线接口一般采用采用PCIPCI接口,并可设定基本接口,并可设定基本I/OI/O地址、中断地址、中断向量向量IRQIRQ和和DMADMA通道三个参数。通道三个参数。现在学习的是第15页,共40页2.2.声卡的输入声卡的输入/输出接口输出接口声卡的输声卡的输/入输出接口均为入输出接口均为3.5mm3.5mm规格插口(规格插口(MIDI/JoystickMIDI/Joystick除外)除外)图图2-8 2-8 声卡通过接口与外部音频设备的连接声卡通过接口与外部音频设备的连接现在学习的是第16页,共40页 2.1.6 数字音频的文件格式 目前较常用的声音文件格式目前较常用的声音文件格式 图图2-9 2-9 数字音频的常用文件格式数字音频的常用文件格式现在学习的是第17页,共40页1 1WAVWAV格式格式(.wav.wav)WAVWAV格式是格式是微软公司微软公司专门为专门为WindowsWindows设计的最为古老而流行的设计的最为古老而流行的波波形声音文件存储格式形声音文件存储格式,基本上是按照声波的实际振动的波形进,基本上是按照声波的实际振动的波形进行存储,是行存储,是未经压缩未经压缩的格式,所需存储空间较大。的格式,所需存储空间较大。2 2CD-DACD-DA格式格式(.cda.cda)CD-DACD-DA是由是由PhilipsPhilips和和SonySony公司公司结盟于结盟于19791979年联合开发的,年联合开发的,常见的常见的CDCD唱片是数字音频录制的,将音频数字信号直接写在唱片是数字音频录制的,将音频数字信号直接写在盘片上,重现时用激光读出这些信息,再通过盘片上,重现时用激光读出这些信息,再通过D/AD/A(数(数/模)模)转换成模拟音频。转换成模拟音频。现在学习的是第18页,共40页3.MPEG3.MPEG音频文件音频文件MP3MP3 这里的音频文件格式指的是这里的音频文件格式指的是MPEGMPEG标准中的音频部分,即标准中的音频部分,即MPEGMPEG音音频层频层(MPEG Audio Layer)(MPEG Audio Layer)。MPEGMPEG音频文件的压缩是一种音频文件的压缩是一种有损压缩有损压缩,根据压缩质量和编码复杂程度的不同可分为三层根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio(MPEG Audio Layer 1/2/3)Layer 1/2/3),分别对应,分别对应MP1MP1、MP2MP2和和MP3MP3这三种声音文件;这三种声音文件;MPEGMPEG音频编码音频编码具有很高的压缩率具有很高的压缩率,MP3MP3的压缩率可达的压缩率可达101101121121,同时其音质基本保持不失真。,同时其音质基本保持不失真。现在学习的是第19页,共40页5.VOC5.VOC文件文件(.voc.voc)VOCVOC文件是文件是CreativeCreative公司所使用的标准音频文件格式,公司所使用的标准音频文件格式,也是声霸卡(也是声霸卡(Sound BlasterSound Blaster)所使用的音频文件格式)所使用的音频文件格式,多多用于保存用于保存Creative Sound Blaster(Creative Sound Blaster(创新声霸创新声霸)系列声卡所系列声卡所采集的声音数据采集的声音数据.6 6其他格式其他格式现在学习的是第20页,共40页2.1.7 常用音频处理软件介绍1.Cool Edit Pro1.Cool Edit Pro2.Sound Forge 2.Sound Forge 3.Cakewalk3.Cakewalk 现在学习的是第21页,共40页2.2 Cakewalk SONAR 8的安装、配置与界面功能介绍2.2.1 SONAR 8软件的获取2.2.2 SONAR 8软件的安装2.2.3 SONAR 8的初始设置现在学习的是第22页,共40页2.2.4 SONAR8软件的操作主界面 图图2-25 Sonar82-25 Sonar8软件的操作主界面软件的操作主界面现在学习的是第23页,共40页n 1.1.标题栏标题栏n 2.2.主菜单主菜单n 3.3.主界面工具栏主界面工具栏n 4.4.音轨窗音轨窗n 5.5.状态栏状态栏现在学习的是第24页,共40页2.2.5 音轨窗1.1.音轨窗布局音轨窗布局 图图2-34 SONAR 82-34 SONAR 8的音轨窗的音轨窗现在学习的是第25页,共40页2.2.音轨窗的工具栏音轨窗的工具栏 图图2-352-35音轨窗工具条的主要按钮音轨窗工具条的主要按钮(1)(1)插入新音轨(插入新音轨(Insert New TracksInsert New Tracks)(2)(2)选择工具选择工具(Select Tool)(Select Tool)(3)(3)自由编辑工具(自由编辑工具(Free Edit ToolFree Edit Tool)(4)(4)包络线工具(包络线工具(EnvelopeEnvelope)(5)(5)包络线绘制工具包络线绘制工具(Envelope Draw tool)(Envelope Draw tool)(6)(6)网格对齐工具(网格对齐工具(Snap To GridSnap To Grid)(7)(7)启用启用/禁用自动交叠淡变禁用自动交叠淡变(Automatic Crossfades)(Automatic Crossfades)(8)(8)显示显示/隐藏电平隐藏电平(Show/Hide All Meters)(Show/Hide All Meters)(9)(9)分割工具分割工具(Split Tool)(Split Tool)(10)(10)静音工具静音工具(Mute Tool)(Mute Tool)(11)(11)缩放工具缩放工具(Zoom Tool)(Zoom Tool)(12)(12)试听工具试听工具(Scrub Tool)(Scrub Tool)(13)(13)显示显示/隐藏查看器隐藏查看器(Show/Hide Inspector)(Show/Hide Inspector)(14)(14)显示显示/隐藏导航器隐藏导航器(Show/Hide Navigator)(Show/Hide Navigator)(15)(15)显示显示/隐藏视频隐藏视频(Show/Hide Video)(Show/Hide Video)现在学习的是第26页,共40页3 3音轨参数面板音轨参数面板 图图2-36 2-36 音轨参数面板音轨参数面板 现在学习的是第27页,共40页2.3 Cakewalk SONAR2.3 Cakewalk SONAR音频处理基本实验音频处理基本实验实验21:Cakewalk SONAR的基本操作1.1.实验目的实验目的通过本实验掌握通过本实验掌握CakewalkCakewalk的基本操作。的基本操作。2.2.实验内容实验内容SONARSONAR的文件操作、播放控制、静音与独奏、设置标记、循的文件操作、播放控制、静音与独奏、设置标记、循环播放乐曲等。环播放乐曲等。现在学习的是第28页,共40页3.3.实验步骤实验步骤(1)(1)打开文件打开文件现在学习的是第29页,共40页(1)(1)打开文件打开文件(2)(2)设置播放控制工具设置播放控制工具TransportTransport(3)(3)播放乐曲播放乐曲(4)(4)静音和独奏静音和独奏 (5)(5)当前时间当前时间现在学习的是第30页,共40页(6)(6)设置音轨标记设置音轨标记(7)(7)循环播放音乐循环播放音乐 图图2-46“Loop Toolbar”2-46“Loop Toolbar”工具栏工具栏现在学习的是第31页,共40页实验22 Cakewalk SONAR音轨的基本编辑操作1.1.实验目的实验目的掌握掌握Cakewalk SONARCakewalk SONAR音轨的基本操作。音轨的基本操作。2.2.实验内容实验内容使用使用SONARSONAR导入音频文件、音轨的复制、粘贴与删除、音轨的合导入音频文件、音轨的复制、粘贴与删除、音轨的合并与自动淡入淡出等。并与自动淡入淡出等。现在学习的是第32页,共40页3.3.实验步骤实验步骤(1)(1)打开文件打开文件(2)(2)音轨的复制、粘贴与删除音轨的复制、粘贴与删除(3)(3)音轨的移动音轨的移动现在学习的是第33页,共40页(4)(4)设定淡入淡出效果设定淡入淡出效果现在学习的是第34页,共40页(5)(5)音轨的合并音轨的合并现在学习的是第35页,共40页实验23:在乐曲中运用素材风格 风格素材风格素材(Groove Clip)(Groove Clip)是指预先制作好的已知节奏速度与音高的音是指预先制作好的已知节奏速度与音高的音频文件频文件,每个风格素材恰好在一个完整小节的时间长度内的鼓或贝司每个风格素材恰好在一个完整小节的时间长度内的鼓或贝司等伴奏乐器所做的采样录音。等伴奏乐器所做的采样录音。1.1.实验目的实验目的掌握掌握Cakewalk SONARCakewalk SONAR在乐曲中运用风格素材的操作。在乐曲中运用风格素材的操作。2.2.实验内容实验内容利用利用Tutorial.cwbTutorial.cwb工程文件添加风格素材。工程文件添加风格素材。现在学习的是第36页,共40页3.3.实验步骤实验步骤打开文件打开文件添加风格素材添加风格素材 图图2-56 2-56 将风格素材将风格素材100beat2100beat2导入音轨导入音轨5 5现在学习的是第37页,共40页 图图2-57 2-57 风格素材被复制为多个副本风格素材被复制为多个副本现在学习的是第38页,共40页实验24:Cakewalk SONAR综合实验:录制数字音频(1)(1)设置采样率与采样精度设置采样率与采样精度(2)(2)建立新的工程文件建立新的工程文件(3)(3)设置音频轨设置音频轨(4)(4)检查输入电平检查输入电平(5)(5)设置设置MetronomeMetronome(节拍器)(节拍器)(6)(6)录制数字音频录制数字音频 图图2-63 2-63 节拍器工具栏按钮功能节拍器工具栏按钮功能现在学习的是第39页,共40页(7)(7)导出音频文件导出音频文件现在学习的是第40页,共40页