书签分享收藏举报版权申诉 / 40

立即下载

当前位置：首页 > 教育专区 > 大学资料 > 第2章数字音频处理与实践精.ppt

第2章数字音频处理与实践精.ppt

上传人：石***

文档编号：73617449

上传时间：2023-02-20

格式：PPT

页数：40

大小：2.48MB

( 4.5 )

《第2章数字音频处理与实践精.ppt》由会员分享，可在线阅读，更多相关《第2章数字音频处理与实践精.ppt（40页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、第2章数字音频处理与实践第1页，本讲稿共40页2.1 多媒体音频信息处理 2.1.1声音信号的形式任任何何声声音音都都是是物物体体振振动动产产生生的的现现象象 ,物物体体受受到到敲敲打打或或激激发发就就能能产产生生振振动动，发发声声体体的的振振动动在在介介质质中中的的传传播播称称为为声声波波。当当声声波波达达到到人人的的耳耳膜膜时时，会感觉到这种压力的变化，或者感觉到振动，这就是会感觉到这种压力的变化，或者感觉到振动，这就是声音声音。在日常生活中，音频在日常生活中，音频(Audio)(Audio)信号可分为两类：信号可分为两类：语音信号语音信号和和非语音信号。非语音信号。在在物物理理上上，声声

2、音音可可用用一一条条连连续续的的曲曲线线来来表表示示。这这条条连连续续的的曲曲线线无无论论多多复复杂杂，都都可可分分解解成成一一系系列列正正弦弦波波的的线线性性叠叠加加。因因声声波波是是在在时时间间和和幅幅度度上都连续变化的量，称为上都连续变化的量，称为模拟量模拟量。第2页，本讲稿共40页图图2-1 2-1 用声音录制软件记录的英文单词用声音录制软件记录的英文单词”Hello”Hello”语音语音的实际波形体之间的关系的实际波形体之间的关系第3页，本讲稿共40页2.1.2 模拟音频信号的物理特征模模拟拟音音频频信信号号有有两两个个重重要要参参数数：频频率率和和幅幅度度。声声音音的的频频率率

3、体体现现音音调调的的高高低低，声波幅度的大小体现声音的强弱。声波幅度的大小体现声音的强弱。2-2 2-2 声波的频率、周期与振幅声波的频率、周期与振幅第4页，本讲稿共40页1 1.频率频率一个声源每秒钟可产生成百上千个波，我们把每秒一个声源每秒钟可产生成百上千个波，我们把每秒钟波峰所发生的数目称之为信号的频率，单位用赫钟波峰所发生的数目称之为信号的频率，单位用赫兹兹(Hz)(Hz)或千赫兹或千赫兹(kHz)(kHz)表示。表示。人们在日常说话时的语音信号：频率范围人们在日常说话时的语音信号：频率范围3003003000Hz3000Hz亚音亚音(subsonic)(subsonic)：频率小于：

4、频率小于20 Hz20 Hz的信号的信号音频音频(Audio)(Audio)：频率范围为：频率范围为202020kHz20kHz的信号的信号超音频超音频(ultrasonic)(ultrasonic)：高于：高于20kHz20kHz的信号的信号第5页，本讲稿共40页2 2.周期周期周周期期是是指指信信号号在在两两个个峰峰点点或或谷谷底底之之间间的的相相对对时时间间。周周期期和和频频率率之之间间的的关关系系是是互互为为倒数。如果每隔倒数。如果每隔定时间波形就重复相同的形状，那么就称这个时间为周期。定时间波形就重复相同的形状，那么就称这个时间为周期。3 3.幅度幅度信号的幅度是从信号的基线到

5、当前波峰的距离。幅度决定了信号音量的强弱程度。信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大，声音越强。声音的强度水平幅度越大，声音越强。声音的强度水平(声响或者音量声响或者音量)用用dBdB来测量。来测量。dBdB的测量值的测量值等于在对数标尺上选定的参考声强与实际感受的声强的比值。等于在对数标尺上选定的参考声强与实际感受的声强的比值。分贝数分贝数10log(P110log(P1P0)P0)第6页，本讲稿共40页2.1.3 与声音有关的几个术语1.1.听觉、感知听觉、感知2.2.音高音高 3.3.音色音色4.4.语音语音5.5.响度响度第7页，本讲稿共40

6、页6.声音的质量声音的质量与它所占用的频带宽度有关，频带越宽，信号强度的相对变化范围就越大大，音响效果也就越好。按照带宽可将声音质量分为4级图图2-3 2-3 四级声音质量的频率范围四级声音质量的频率范围第8页，本讲稿共40页2 2.1.1.4 4 模拟音频的数字化过程模拟音频的数字化过程数数字字化化的的声声音音易易于于用用计计算算机机软软件件处处理理，对对模模拟拟音音频频数数字字化化过过程程涉涉及及音音频频的采样、量化和编码的采样、量化和编码第9页，本讲稿共40页采样和量化的过程可由采样和量化的过程可由数模（数模（A/DA/D）转换器）转换器转换器实现。转换器实现。A/DA/D转换器以固

7、定的频转换器以固定的频率去采样，即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成率去采样，即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成为数字音频信号，可以将其以文件形式保存在计算机的存储介质中，这样的文件一般为数字音频信号，可以将其以文件形式保存在计算机的存储介质中，这样的文件一般称为数字声波文件。称为数字声波文件。1.1.采样采样为实现为实现A/DA/D转换，需要把模拟音频信号波形进行分割，以转变成数字信转换，需要把模拟音频信号波形进行分割，以转变成数字信号，这种方法称为采样号，这种方法称为采样(Sampling)(Sampling)。采样的过程是。采样的

8、过程是每隔一个时间间隔在模拟声音的每隔一个时间间隔在模拟声音的波形上取一个幅度值波形上取一个幅度值，把时间上的连续信号，变成时间上的离散信号。该时间，把时间上的连续信号，变成时间上的离散信号。该时间间隔称为采样周期，其倒数为采样频率。间隔称为采样周期，其倒数为采样频率。采样频率采样频率是指计算机每秒钟采集多少是指计算机每秒钟采集多少个声音样本。个声音样本。采样频率越高，即采样的间隔时间越短，则在单位时间内计算机得到的采样频率越高，即采样的间隔时间越短，则在单位时间内计算机得到的声音样本数据就越多，对声音波形的表示也越精确。声音样本数据就越多，对声音波形的表示也越精确。第10页，本讲稿共40页2

9、.2.量化量化对声波波形幅度的数字化表示称之为对声波波形幅度的数字化表示称之为“量化量化”量化的过程量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合，把落入是先将采样后的信号按整个声波的幅度划分成有限个区段的集合，把落入某个区段内的样值归为一类，并赋于相同的量化值。某个区段内的样值归为一类，并赋于相同的量化值。如何分割采样信号的幅度呢如何分割采样信号的幅度呢?采取二进制的方式，以位采取二进制的方式，以位(bit)(bit)或或1616位的方式来划分纵轴。也就是说在位的方式来划分纵轴。也就是说在一个以一个以8 8位为记录模式的音效中，其纵轴将会被划分为个量化等级位为记录模式的音

10、效中，其纵轴将会被划分为个量化等级(quantization levels)(quantization levels)，用以记录其幅度大小。，用以记录其幅度大小。在相同的采样频率之下，量化位数愈高，声音的质量越好。同理，在相同量化位数的在相同的采样频率之下，量化位数愈高，声音的质量越好。同理，在相同量化位数的情况下，采样频率越高，声音效果也就越好。情况下，采样频率越高，声音效果也就越好。第11页，本讲稿共40页3.3.编码编码图图2-6 2-6 音频信号处理过程音频信号处理过程音频编码的信息是声音波形，所以又称波形编码。这种方法要求重构音频编码的信息是声音波形，所以又称波形编码。这种方法要

11、求重构的声音信号的各个样本尽可能地接近于原始声音的采样值，复原的声的声音信号的各个样本尽可能地接近于原始声音的采样值，复原的声音质量较高。音质量较高。常用的波形编码技术有常用的波形编码技术有脉冲编码调制脉冲编码调制（Pulse Code ModulationPulse Code Modulation，PCMPCM）、）、自适应差分脉冲编码调制自适应差分脉冲编码调制（Adaptive Differential Pulse Code Adaptive Differential Pulse Code ModulationModulation，ADPCMADPCM）和）和自适应变换编码自适应变换编码（

12、Adaptive Transform CodingAdaptive Transform Coding，ATCATC）等。）等。第12页，本讲稿共40页脉冲编码调制脉冲编码调制PCMPCMPCMPCM是把模拟信号变换为数字信号的一种调制方式，既把连续输入的是把模拟信号变换为数字信号的一种调制方式，既把连续输入的模拟信号变换为在时域和振幅上都离散的量，然后将其转化为代码形模拟信号变换为在时域和振幅上都离散的量，然后将其转化为代码形式传输或存储。式传输或存储。PCMPCM的主要优点是：的主要优点是：抗干扰能力强；失真小；传输特性稳定，尤其是远抗干扰能力强；失真小；传输特性稳定，尤其是远距离信号再生中

13、继时噪声不累积，而且可以采用压缩编码、纠错编码距离信号再生中继时噪声不累积，而且可以采用压缩编码、纠错编码和保密编码等来提高系统的有效性、可靠性和保密性。和保密编码等来提高系统的有效性、可靠性和保密性。第13页，本讲稿共40页2.1.5 声卡声卡声卡（也称为声效卡）声卡（也称为声效卡）在多媒体计算机中是不可缺少的重要部在多媒体计算机中是不可缺少的重要部件，直接决定了对声音数据的处理能力与质量。件，直接决定了对声音数据的处理能力与质量。现在的声卡已不仅仅作为发声之用，还兼备了声音的采集、编辑、语音识别、现在的声卡已不仅仅作为发声之用，还兼备了声音的采集、编辑、语音识别、网络电话等种种功用网络电话

14、等种种功用第14页，本讲稿共40页n1.1.声卡的工作原理声卡的工作原理图图2-7 2-7 声卡工作原理框图声卡工作原理框图主芯片主芯片-数字信号处理器数字信号处理器承担着对声音信息处理、特殊音效过滤与处理、语音识别、实时承担着对声音信息处理、特殊音效过滤与处理、语音识别、实时音频压缩、音频压缩、MIDIMIDI合成等重要的任务。合成等重要的任务。声卡主芯片是一块具有强大运算能力的数字信号处理器（声卡主芯片是一块具有强大运算能力的数字信号处理器（DSPDSP），），是声卡的核心部件。是声卡的核心部件。DSPDSP是一种可编程芯片，通过软件安装新的指令后是一种可编程芯片，通过软件安装新的指令

15、后就能够升级。主芯片能将来自就能够升级。主芯片能将来自ADC(ADC(数字数字/模拟转换器模拟转换器)的信号加以处理，的信号加以处理，改变成所需要的形式。改变成所需要的形式。DSPDSP芯片对输入的数字声音用芯片对输入的数字声音用PCMPCM、DPCMDPCM或或ADPCMADPCM方式进行编码和压缩，并形成方式进行编码和压缩，并形成WAVWAV格式文件送入计算机磁盘存储。声音格式文件送入计算机磁盘存储。声音输出时，将磁盘中的输出时，将磁盘中的WAVWAV文件送入文件送入DSPDSP芯片，经解码后变成数字声音信号芯片，经解码后变成数字声音信号送至送至D/AD/A转换部分。转换部分。混音芯片混音

16、芯片-CODEC-CODEC 主要承担对原始声音信号的采样、主要承担对原始声音信号的采样、编码和混音处理；混音的声源可以是编码和混音处理；混音的声源可以是MIDIMIDI信号、信号、CDCD音频、线性输入、话筒音频、线性输入、话筒等，可以选择输入一个声源或将几个等，可以选择输入一个声源或将几个不同声源进行混合录音。在对音源处不同声源进行混合录音。在对音源处理时，可编程设定采样频率和量化位理时，可编程设定采样频率和量化位数。数。音乐合成器音乐合成器标准多媒体标准多媒体PCPC可以通过声卡的内部合成器可以通过声卡的内部合成器(Synthesizer)(Synthesizer)或主机或主机MIDI

17、MIDI端口的外部合成端口的外部合成器播放器播放MIDIMIDI文件。文件。频率调制合成器频率调制合成器(FM(FM合成器合成器)波表波表(Wave table(Wave table合成器合成器)。总线接口和控制器总线接口和控制器总线接口和控制器由数据总线双向驱总线接口和控制器由数据总线双向驱动器、总线接口控制逻辑、总线中断逻辑和动器、总线接口控制逻辑、总线中断逻辑和DMADMA控制逻辑组成。目前声卡的总线接口一般控制逻辑组成。目前声卡的总线接口一般采用采用PCIPCI接口，并可设定基本接口，并可设定基本I/OI/O地址、中断地址、中断向量向量IRQIRQ和和DMADMA通道三个参数。通道三

18、个参数。第15页，本讲稿共40页2.2.声卡的输入声卡的输入/输出接口输出接口声卡的输声卡的输/入输出接口均为入输出接口均为3.5mm3.5mm规格插口（规格插口（MIDI/JoystickMIDI/Joystick除外）除外）图图2-8 2-8 声卡通过接口与外部音频设备的连接声卡通过接口与外部音频设备的连接第16页，本讲稿共40页 2.1.6 2.1.6 数字音频的文件格式数字音频的文件格式目前较常用的声音文件格式目前较常用的声音文件格式图图2-9 2-9 数字音频的常用文件格式数字音频的常用文件格式第17页，本讲稿共40页1 1WAVWAV格式格式(.wav.wav)WAVWAV格式

19、是格式是微软公司微软公司专门为专门为WindowsWindows设计的最为古老而流行设计的最为古老而流行的的波形声音文件存储格式波形声音文件存储格式，基本上是按照声波的实际振动的，基本上是按照声波的实际振动的波形进行存储，是波形进行存储，是未经压缩未经压缩的格式，所需存储空间较大。的格式，所需存储空间较大。2 2CD-DACD-DA格式格式(.cda.cda)CD-DACD-DA是由是由PhilipsPhilips和和SonySony公司公司结盟于结盟于19791979年联合开发的，常见年联合开发的，常见的的CDCD唱片是数字音频录制的，将音频数字信号直接写在盘片上，重现唱片是数字音频录制的，

20、将音频数字信号直接写在盘片上，重现时用激光读出这些信息，再通过时用激光读出这些信息，再通过D/AD/A（数（数/模）转换成模拟音频。模）转换成模拟音频。第18页，本讲稿共40页3.MPEG3.MPEG音频文件音频文件MP3MP3 这里的音频文件格式指的是这里的音频文件格式指的是MPEGMPEG标准中的音频部分，即标准中的音频部分，即MPEGMPEG音频层音频层(MPEG Audio Layer)(MPEG Audio Layer)。MPEGMPEG音频文件的压缩是一种音频文件的压缩是一种有损压缩有损压缩，根据压缩质量和编码复杂程度的不同可分为三层根据压缩质量和编码复杂程度的不同可分为三层(MP

21、EG Audio(MPEG Audio Layer 1/2/3)Layer 1/2/3)，分别对应，分别对应MP1MP1、MP2MP2和和MP3MP3这三种声音文件；这三种声音文件；MPEGMPEG音频编码音频编码具有很高的压缩率具有很高的压缩率，MP3MP3的压缩率可达的压缩率可达101101121121，同时其音质基本保持不失真。，同时其音质基本保持不失真。第19页，本讲稿共40页5.VOC5.VOC文件文件(.voc.voc)VOCVOC文件是文件是CreativeCreative公司所使用的标准音频文件格式，也是公司所使用的标准音频文件格式，也是声霸卡（声霸卡（Sound Blaste

22、rSound Blaster）所使用的音频文件格式）所使用的音频文件格式,多用于保存多用于保存Creative Sound Blaster(Creative Sound Blaster(创新声霸创新声霸)系列声卡所采集的声音数据系列声卡所采集的声音数据.6 6其他格式其他格式第20页，本讲稿共40页2.1.7 常用音频处理软件介绍1.Cool Edit Pro1.Cool Edit Pro2.Sound Forge 2.Sound Forge 3.Cakewalk3.Cakewalk 第21页，本讲稿共40页2.2 Cakewalk SONAR 8的安装、配置与界面功能介绍2.2.1 SONA

23、R 8软件的获取2.2.2 SONAR 8软件的安装2.2.3 SONAR 8的初始设置第22页，本讲稿共40页2.2.4 SONAR8软件的操作主界面图图2-25 Sonar82-25 Sonar8软件的操作主界面软件的操作主界面第23页，本讲稿共40页n 1.1.标题栏标题栏n 2.2.主菜单主菜单n 3.3.主界面工具栏主界面工具栏n 4.4.音轨窗音轨窗n 5.5.状态栏状态栏第24页，本讲稿共40页2.2.5 音轨窗1.1.音轨窗布局音轨窗布局图图2-34 SONAR 82-34 SONAR 8的音轨窗的音轨窗第25页，本讲稿共40页2.2.音轨窗的工具栏音轨窗的工具栏图图2-

24、352-35音轨窗工具条的主要按钮音轨窗工具条的主要按钮(1)(1)插入新音轨（插入新音轨（Insert New TracksInsert New Tracks）(2)(2)选择工具选择工具(Select Tool)(Select Tool)(3)(3)自由编辑工具（自由编辑工具（Free Edit ToolFree Edit Tool）(4)(4)包络线工具（包络线工具（EnvelopeEnvelope）(5)(5)包络线绘制工具包络线绘制工具(Envelope Draw tool)(Envelope Draw tool)(6)(6)网格对齐工具（网格对齐工具（Snap To GridSna

25、p To Grid）(7)(7)启用启用/禁用自动交叠淡变禁用自动交叠淡变(Automatic Crossfades)(Automatic Crossfades)(8)(8)显示显示/隐藏电平隐藏电平(Show/Hide All Meters)(Show/Hide All Meters)(9)(9)分割工具分割工具(Split Tool)(Split Tool)(10)(10)静音工具静音工具(Mute Tool)(Mute Tool)(11)(11)缩放工具缩放工具(Zoom Tool)(Zoom Tool)(12)(12)试听工具试听工具(Scrub Tool)(Scrub Tool)(1

26、3)(13)显示显示/隐藏查看器隐藏查看器(Show/Hide Inspector)(Show/Hide Inspector)(14)(14)显示显示/隐藏导航器隐藏导航器(Show/Hide Navigator)(Show/Hide Navigator)(15)(15)显示显示/隐藏视频隐藏视频(Show/Hide Video)(Show/Hide Video)第26页，本讲稿共40页3音轨参数面板图图2-36 2-36 音轨参数面板音轨参数面板第27页，本讲稿共40页2.3 Cakewalk SONAR2.3 Cakewalk SONAR音频处理基本实验音频处理基本实验实验21：Cak

27、ewalk SONAR的基本操作1.1.实验目的实验目的通过本实验掌握通过本实验掌握CakewalkCakewalk的基本操作。的基本操作。2.2.实验内容实验内容SONARSONAR的文件操作、播放控制、静音与独奏、设置标记、循环播的文件操作、播放控制、静音与独奏、设置标记、循环播放乐曲等。放乐曲等。第28页，本讲稿共40页3.实验步骤(1)打开文件第29页，本讲稿共40页(1)(1)打开文件打开文件(2)(2)设置播放控制工具设置播放控制工具TransportTransport(3)(3)播放乐曲播放乐曲(4)(4)静音和独奏静音和独奏 (5)(5)当前时间当前时间第30页，本讲稿共40页

28、(6)(6)设置音轨标记设置音轨标记(7)(7)循环播放音乐循环播放音乐图图2-46“Loop Toolbar”2-46“Loop Toolbar”工具栏工具栏第31页，本讲稿共40页实验22 Cakewalk SONAR音轨的基本编辑操作1.1.实验目的实验目的掌握掌握Cakewalk SONARCakewalk SONAR音轨的基本操作。音轨的基本操作。2.2.实验内容实验内容使用使用SONARSONAR导入音频文件、音轨的复制、粘贴与删除、音轨的合并与自导入音频文件、音轨的复制、粘贴与删除、音轨的合并与自动淡入淡出等。动淡入淡出等。第32页，本讲稿共40页3.3.实验步骤实验步骤(1)

29、(1)打开文件打开文件(2)(2)音轨的复制、粘贴与删除音轨的复制、粘贴与删除(3)(3)音轨的移动音轨的移动第33页，本讲稿共40页(4)设定淡入淡出效果第34页，本讲稿共40页(5)音轨的合并第35页，本讲稿共40页实验23：在乐曲中运用素材风格风格素材风格素材(Groove Clip)(Groove Clip)是指预先制作好的已知节奏速度与音高的是指预先制作好的已知节奏速度与音高的音频文件音频文件,每个风格素材恰好在一个完整小节的时间长度内的鼓或每个风格素材恰好在一个完整小节的时间长度内的鼓或贝司等伴奏乐器所做的采样录音。贝司等伴奏乐器所做的采样录音。1.1.实验目的实验目的掌握掌握C

30、akewalk SONARCakewalk SONAR在乐曲中运用风格素材的操作。在乐曲中运用风格素材的操作。2.2.实验内容实验内容利用利用Tutorial.cwbTutorial.cwb工程文件添加风格素材。工程文件添加风格素材。第36页，本讲稿共40页3.3.实验步骤实验步骤打开文件打开文件添加风格素材添加风格素材图图2-56 2-56 将风格素材将风格素材100beat2100beat2导入音轨导入音轨5 5第37页，本讲稿共40页图图2-57 2-57 风格素材被复制为多个副本风格素材被复制为多个副本第38页，本讲稿共40页实验24：Cakewalk SONAR综合实验：录制数字音频(1)(1)设置采样率与采样精度设置采样率与采样精度(2)(2)建立新的工程文件建立新的工程文件(3)(3)设置音频轨设置音频轨(4)(4)检查输入电平检查输入电平(5)(5)设置设置MetronomeMetronome（节拍器）（节拍器）(6)(6)录制数字音频录制数字音频图图2-63 2-63 节拍器工具栏按钮功能节拍器工具栏按钮功能第39页，本讲稿共40页(7)导出音频文件第40页，本讲稿共40页

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

18 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 数字音频处理实践

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：第2章数字音频处理与实践精.ppt
链接地址：https://www.taowenge.com/p-73617449.html