书签分享收藏举报版权申诉 / 40

立即下载

当前位置：首页 > 教育专区 > 大学资料 > 第2章数字音频处理与实践PPT讲稿.ppt

第2章数字音频处理与实践PPT讲稿.ppt

上传人：石***

文档编号：43308507

上传时间：2022-09-17

格式：PPT

页数：40

大小：4.41MB

( 4.5 )

《第2章数字音频处理与实践PPT讲稿.ppt》由会员分享，可在线阅读，更多相关《第2章数字音频处理与实践PPT讲稿.ppt（40页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、第2章数字音频处理与实践第1页，共40页，编辑于2022年，星期一2.1 多媒体音频信息处理 2.1.1声音信号的形式任任何何声声音音都都是是物物体体振振动动产产生生的的现现象象 ,物物体体受受到到敲敲打打或或激激发发就就能能产产生生振振动动，发发声声体体的的振振动动在在介介质质中中的的传传播播称称为为声声波波。当当声声波波达达到到人人的的耳耳膜膜时，会感觉到这种压力的变化，或者感觉到振动，这就是时，会感觉到这种压力的变化，或者感觉到振动，这就是声音声音。在日常生活中，音频在日常生活中，音频(Audio)(Audio)信号可分为两类：信号可分为两类：语音信号语音信号和和非语音信号。非语音信号。

2、在在物物理理上上，声声音音可可用用一一条条连连续续的的曲曲线线来来表表示示。这这条条连连续续的的曲曲线线无无论论多多复复杂杂，都都可可分分解解成成一一系系列列正正弦弦波波的的线线性性叠叠加加。因因声声波波是是在在时时间间和和幅幅度度上都连续变化的量，称为上都连续变化的量，称为模拟量模拟量。第2页，共40页，编辑于2022年，星期一图图2-1 2-1 用声音录制软件记录的英文单词用声音录制软件记录的英文单词”Hello”Hello”语音语音的实际波形体之间的关系的实际波形体之间的关系第3页，共40页，编辑于2022年，星期一2.1.2 模拟音频信号的物理特征模模拟拟音音频频信信号号有有两两个

3、个重重要要参参数数：频频率率和和幅幅度度。声声音音的的频频率率体体现现音音调调的的高高低低，声波幅度的大小体现声音的强弱。声波幅度的大小体现声音的强弱。2-2 2-2 声波的频率、周期与振幅声波的频率、周期与振幅第4页，共40页，编辑于2022年，星期一1 1.频率频率一个声源每秒钟可产生成百上千个波，我们把每秒一个声源每秒钟可产生成百上千个波，我们把每秒钟波峰所发生的数目称之为信号的频率，单位用赫钟波峰所发生的数目称之为信号的频率，单位用赫兹兹(Hz)(Hz)或千赫兹或千赫兹(kHz)(kHz)表示。表示。人们在日常说话时的语音信号：频率范围人们在日常说话时的语音信号：频率范围3003003

4、000Hz3000Hz亚音亚音(subsonic)(subsonic)：频率小于：频率小于20 Hz20 Hz的信号的信号音频音频(Audio)(Audio)：频率范围为：频率范围为202020kHz20kHz的信号的信号超音频超音频(ultrasonic)(ultrasonic)：高于：高于20kHz20kHz的信号的信号第5页，共40页，编辑于2022年，星期一2 2.周期周期周周期期是是指指信信号号在在两两个个峰峰点点或或谷谷底底之之间间的的相相对对时时间间。周周期期和和频频率率之之间间的的关关系系是是互互为为倒数。如果每隔倒数。如果每隔定时间波形就重复相同的形状，那么就称这个时间为

5、周期。定时间波形就重复相同的形状，那么就称这个时间为周期。3 3.幅度幅度信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大，声音越强。声音的强度水平量的强弱程度。幅度越大，声音越强。声音的强度水平(声响或者音声响或者音量量)用用dBdB来测量。来测量。dBdB的测量值等于在对数标尺上选定的参考声强与实的测量值等于在对数标尺上选定的参考声强与实际感受的声强的比值。际感受的声强的比值。分贝数分贝数10log(P110log(P1P0)P0)第6页，共40页，编辑于2022年，星期一2.1.3 与声音有关的几

6、个术语1.1.听觉、感知听觉、感知2.2.音高音高 3.3.音色音色4.4.语音语音5.5.响度响度第7页，共40页，编辑于2022年，星期一6 6.声音的质量声音的质量声声音音的的质质量量与与它它所所占占用用的的频频带带宽宽度度有有关关，频频带带越越宽宽，信信号号强强度度的的相相对对变变化范围就越大大，音响效果也就越好。按照带宽可将声音质量分为化范围就越大大，音响效果也就越好。按照带宽可将声音质量分为4 4级级图图2-3 2-3 四级声音质量的频率范围四级声音质量的频率范围第8页，共40页，编辑于2022年，星期一2.1.4 模拟音频的数字化过程数数字字化化的的声声音音易易于于用用计计算

7、算机机软软件件处处理理，对对模模拟拟音音频频数数字字化化过过程程涉涉及及音音频频的采样、量化和编码的采样、量化和编码第9页，共40页，编辑于2022年，星期一采样和量化的过程可由采样和量化的过程可由数模（数模（A/DA/D）转换器）转换器转换器实现。转换器实现。A/DA/D转换器以固定的频转换器以固定的频率去采样，即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后率去采样，即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成为数字音频信号，可以将其以文件形式保存在计算机的存储介质中，这样的就成为数字音频信号，可以将其以文件形式保存在计算机的存储介质中，这样的文件一般称为

8、数字声波文件。文件一般称为数字声波文件。1.1.采样采样为实现为实现A/DA/D转换，需要把模拟音频信号波形进行分割，以转变成数字信转换，需要把模拟音频信号波形进行分割，以转变成数字信号，这种方法称为采样号，这种方法称为采样(Sampling)(Sampling)。采样的过程是。采样的过程是每隔一个时间间隔在模拟声音的每隔一个时间间隔在模拟声音的波形上取一个幅度值波形上取一个幅度值，把时间上的连续信号，变成时间上的离散信号。该时间间隔称，把时间上的连续信号，变成时间上的离散信号。该时间间隔称为采样周期，其倒数为采样频率。为采样周期，其倒数为采样频率。采样频率采样频率是指计算机每秒钟采集多少个声

9、音样是指计算机每秒钟采集多少个声音样本。本。采样频率越高，即采样的间隔时间越短，则在单位时间内计算机得采样频率越高，即采样的间隔时间越短，则在单位时间内计算机得到的声音样本数据就越多，对声音波形的表示也越精确。到的声音样本数据就越多，对声音波形的表示也越精确。第10页，共40页，编辑于2022年，星期一2.2.量化量化对声波波形幅度的数字化表示称之为对声波波形幅度的数字化表示称之为“量化量化”量化的过程量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集是先将采样后的信号按整个声波的幅度划分成有限个区段的集合，把落入某个区段内的样值归为一类，并赋于相同的量化值。合，把落入某个区段内

10、的样值归为一类，并赋于相同的量化值。如何分割采样信号的幅度呢如何分割采样信号的幅度呢?采取二进制的方式，以位采取二进制的方式，以位(bit)(bit)或或1616位的方式来划分纵轴。也就是说在一个位的方式来划分纵轴。也就是说在一个以以8 8位为记录模式的音效中，其纵轴将会被划分为个量化等级位为记录模式的音效中，其纵轴将会被划分为个量化等级(quantization(quantization levels)levels)，用以记录其幅度大小。，用以记录其幅度大小。在相同的采样频率之下，量化位数愈高，声音的质量越好。同理，在相同量化位在相同的采样频率之下，量化位数愈高，声音的质量越好。同理，在相同

11、量化位数的情况下，采样频率越高，声音效果也就越好。数的情况下，采样频率越高，声音效果也就越好。第11页，共40页，编辑于2022年，星期一3.3.编码编码图图2-6 2-6 音频信号处理过程音频信号处理过程音频编码的信息是声音波形，所以又称波形编码。这种方法要求重构的声音音频编码的信息是声音波形，所以又称波形编码。这种方法要求重构的声音信号的各个样本尽可能地接近于原始声音的采样值，复原的声音质量较高。信号的各个样本尽可能地接近于原始声音的采样值，复原的声音质量较高。常用的波形编码技术有常用的波形编码技术有脉冲编码调制脉冲编码调制（Pulse Code ModulationPulse Cod

12、e Modulation，PCMPCM）、）、自适应差分脉冲编码调制自适应差分脉冲编码调制（Adaptive Differential Pulse Code Adaptive Differential Pulse Code ModulationModulation，ADPCMADPCM）和）和自适应变换编码自适应变换编码（Adaptive Transform CodingAdaptive Transform Coding，ATCATC）等。）等。第12页，共40页，编辑于2022年，星期一脉冲编码调制脉冲编码调制PCMPCMPCMPCM是把模拟信号变换为数字信号的一种调制方式，既把连续输入的模

13、拟信号是把模拟信号变换为数字信号的一种调制方式，既把连续输入的模拟信号变换为在时域和振幅上都离散的量，然后将其转化为代码形式传输或存储。变换为在时域和振幅上都离散的量，然后将其转化为代码形式传输或存储。PCMPCM的主要优点是：的主要优点是：抗干扰能力强；失真小；传输特性稳定，尤其是远距抗干扰能力强；失真小；传输特性稳定，尤其是远距离信号再生中继时噪声不累积，而且可以采用压缩编码、纠错编码和离信号再生中继时噪声不累积，而且可以采用压缩编码、纠错编码和保密编码等来提高系统的有效性、可靠性和保密性。保密编码等来提高系统的有效性、可靠性和保密性。第13页，共40页，编辑于2022年，星期一2.1.5

14、声卡声卡声卡（也称为声效卡）声卡（也称为声效卡）在多媒体计算机中是不可缺少的重要部件，在多媒体计算机中是不可缺少的重要部件，直接决定了对声音数据的处理能力与质量。直接决定了对声音数据的处理能力与质量。现在的声卡已不仅仅作为发声之用，还兼备了声音的采集、编辑、语现在的声卡已不仅仅作为发声之用，还兼备了声音的采集、编辑、语音识别、网络电话等种种功用音识别、网络电话等种种功用第14页，共40页，编辑于2022年，星期一n1.1.声卡的工作原理声卡的工作原理图图2-7 2-7 声卡工作原理框图声卡工作原理框图主芯片主芯片-数字信号处理器数字信号处理器承担着对声音信息处理、特殊音效过滤与处理、语音

15、识别、实时音频压缩、承担着对声音信息处理、特殊音效过滤与处理、语音识别、实时音频压缩、MIDIMIDI合成等重要的任务。合成等重要的任务。声卡主芯片是一块具有强大运算能力的数字信号处理器（声卡主芯片是一块具有强大运算能力的数字信号处理器（DSPDSP），是），是声卡的核心部件。声卡的核心部件。DSPDSP是一种可编程芯片，通过软件安装新的指令后就能够是一种可编程芯片，通过软件安装新的指令后就能够升级。主芯片能将来自升级。主芯片能将来自ADC(ADC(数字数字/模拟转换器模拟转换器)的信号加以处理，改变成所的信号加以处理，改变成所需要的形式。需要的形式。DSPDSP芯片对输入的数字声音用芯片对输

16、入的数字声音用PCMPCM、DPCMDPCM或或ADPCMADPCM方式进行编码方式进行编码和压缩，并形成和压缩，并形成WAVWAV格式文件送入计算机磁盘存储。声音输出时，将磁盘中格式文件送入计算机磁盘存储。声音输出时，将磁盘中的的WAVWAV文件送入文件送入DSPDSP芯片，经解码后变成数字声音信号送至芯片，经解码后变成数字声音信号送至D/AD/A转换部分。转换部分。混音芯片混音芯片-CODEC-CODEC 主要承担对原始声音信号的采样、主要承担对原始声音信号的采样、编码和混音处理；混音的声源可以是编码和混音处理；混音的声源可以是MIDIMIDI信号、信号、CDCD音频、线性输入、话筒音频、

17、线性输入、话筒等，可以选择输入一个声源或将几个等，可以选择输入一个声源或将几个不同声源进行混合录音。在对音源处不同声源进行混合录音。在对音源处理时，可编程设定采样频率和量化位理时，可编程设定采样频率和量化位数。数。音乐合成器音乐合成器标准多媒体标准多媒体PCPC可以通过声卡的内部合成器可以通过声卡的内部合成器(Synthesizer)(Synthesizer)或主机或主机MIDIMIDI端口的外部合成端口的外部合成器播放器播放MIDIMIDI文件。文件。频率调制合成器频率调制合成器(FM(FM合成器合成器)波表波表(Wave table(Wave table合成器合成器)。总线接口和控制器总

18、线接口和控制器总线接口和控制器由数据总线双向驱总线接口和控制器由数据总线双向驱动器、总线接口控制逻辑、总线中断逻辑和动器、总线接口控制逻辑、总线中断逻辑和DMADMA控制逻辑组成。目前声卡的总线接口一般采用控制逻辑组成。目前声卡的总线接口一般采用PCIPCI接口，并可设定基本接口，并可设定基本I/OI/O地址、中断向量地址、中断向量IRQIRQ和和DMADMA通道三个参数。通道三个参数。第15页，共40页，编辑于2022年，星期一2.2.声卡的输入声卡的输入/输出接口输出接口声卡的输声卡的输/入输出接口均为入输出接口均为3.5mm3.5mm规格插口（规格插口（MIDI/JoystickMID

19、I/Joystick除外）除外）图图2-8 2-8 声卡通过接口与外部音频设备的连接声卡通过接口与外部音频设备的连接第16页，共40页，编辑于2022年，星期一 2.1.6 数字音频的文件格式目前较常用的声音文件格式目前较常用的声音文件格式图图2-9 2-9 数字音频的常用文件格式数字音频的常用文件格式第17页，共40页，编辑于2022年，星期一1 1WAVWAV格式格式(.wav.wav)WAVWAV格式是格式是微软公司微软公司专门为专门为WindowsWindows设计的最为古老而流行设计的最为古老而流行的的波形声音文件存储格式波形声音文件存储格式，基本上是按照声波的实际振动的波，基本

20、上是按照声波的实际振动的波形进行存储，是形进行存储，是未经压缩未经压缩的格式，所需存储空间较大。的格式，所需存储空间较大。2 2CD-DACD-DA格式格式(.cda.cda)CD-DACD-DA是由是由PhilipsPhilips和和SonySony公司公司结盟于结盟于19791979年联合开发的，常年联合开发的，常见的见的CDCD唱片是数字音频录制的，将音频数字信号直接写在盘片上，唱片是数字音频录制的，将音频数字信号直接写在盘片上，重现时用激光读出这些信息，再通过重现时用激光读出这些信息，再通过D/AD/A（数（数/模）转换成模拟音模）转换成模拟音频。频。第18页，共40页，编辑于2022

21、年，星期一3.MPEG3.MPEG音频文件音频文件MP3MP3 这里的音频文件格式指的是这里的音频文件格式指的是MPEGMPEG标准中的音频部分，标准中的音频部分，即即MPEGMPEG音频层音频层(MPEG Audio Layer)(MPEG Audio Layer)。MPEGMPEG音频文件的压缩是音频文件的压缩是一种一种有损压缩有损压缩，根据压缩质量和编码复杂程度的不同可分为三层，根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio Layer 1/2/3)(MPEG Audio Layer 1/2/3)，分别对应，分别对应MP1MP1、MP2MP2和和MP3MP3这三种声音这

22、三种声音文件；文件；MPEGMPEG音频编码音频编码具有很高的压缩率具有很高的压缩率，MP3MP3的压缩率可达的压缩率可达101101121121，同时其音质基本保持不失真。，同时其音质基本保持不失真。第19页，共40页，编辑于2022年，星期一5.VOC5.VOC文件文件(.voc.voc)VOCVOC文件是文件是CreativeCreative公司所使用的标准音频文件格式，公司所使用的标准音频文件格式，也是声霸卡（也是声霸卡（Sound BlasterSound Blaster）所使用的音频文件格式）所使用的音频文件格式,多多用于保存用于保存Creative Sound Blaster(C

23、reative Sound Blaster(创新声霸创新声霸)系列声卡所系列声卡所采集的声音数据采集的声音数据.6 6其他格式其他格式第20页，共40页，编辑于2022年，星期一2.1.7 常用音频处理软件介绍1.Cool Edit Pro1.Cool Edit Pro2.Sound Forge 2.Sound Forge 3.Cakewalk3.Cakewalk 第21页，共40页，编辑于2022年，星期一2.2 Cakewalk SONAR 8的安装、配置与界面功能介绍2.2.1 SONAR 8软件的获取2.2.2 SONAR 8软件的安装2.2.3 SONAR 8的初始设置第22页，共4

24、0页，编辑于2022年，星期一2.2.4 SONAR8软件的操作主界面图图2-25 Sonar82-25 Sonar8软件的操作主界面软件的操作主界面第23页，共40页，编辑于2022年，星期一n 1.1.标题栏标题栏n 2.2.主菜单主菜单n 3.3.主界面工具栏主界面工具栏n 4.4.音轨窗音轨窗n 5.5.状态栏状态栏第24页，共40页，编辑于2022年，星期一2.2.5 音轨窗1.1.音轨窗布局音轨窗布局图图2-34 SONAR 82-34 SONAR 8的音轨窗的音轨窗第25页，共40页，编辑于2022年，星期一2.2.音轨窗的工具栏音轨窗的工具栏图图2-352-35音轨窗工具

25、条的主要按钮音轨窗工具条的主要按钮(1)(1)插入新音轨（插入新音轨（Insert New TracksInsert New Tracks）(2)(2)选择工具选择工具(Select Tool)(Select Tool)(3)(3)自由编辑工具（自由编辑工具（Free Edit ToolFree Edit Tool）(4)(4)包络线工具（包络线工具（EnvelopeEnvelope）(5)(5)包络线绘制工具包络线绘制工具(Envelope Draw tool)(Envelope Draw tool)(6)(6)网格对齐工具（网格对齐工具（Snap To GridSnap To Grid）(

26、7)(7)启用启用/禁用自动交叠淡变禁用自动交叠淡变(Automatic Crossfades)(Automatic Crossfades)(8)(8)显示显示/隐藏电平隐藏电平(Show/Hide All Meters)(Show/Hide All Meters)(9)(9)分割工具分割工具(Split Tool)(Split Tool)(10)(10)静音工具静音工具(Mute Tool)(Mute Tool)(11)(11)缩放工具缩放工具(Zoom Tool)(Zoom Tool)(12)(12)试听工具试听工具(Scrub Tool)(Scrub Tool)(13)(13)显示显示/

27、隐藏查看器隐藏查看器(Show/Hide Inspector)(Show/Hide Inspector)(14)(14)显示显示/隐藏导航器隐藏导航器(Show/Hide Navigator)(Show/Hide Navigator)(15)(15)显示显示/隐藏视频隐藏视频(Show/Hide Video)(Show/Hide Video)第26页，共40页，编辑于2022年，星期一3 3音轨参数面板音轨参数面板图图2-36 2-36 音轨参数面板音轨参数面板第27页，共40页，编辑于2022年，星期一2.3 Cakewalk SONAR2.3 Cakewalk SONAR音频处理基本实

28、验音频处理基本实验实验21：Cakewalk SONAR的基本操作1.1.实验目的实验目的通过本实验掌握通过本实验掌握CakewalkCakewalk的基本操作。的基本操作。2.2.实验内容实验内容SONARSONAR的文件操作、播放控制、静音与独奏、设置标记、循的文件操作、播放控制、静音与独奏、设置标记、循环播放乐曲等。环播放乐曲等。第28页，共40页，编辑于2022年，星期一3.3.实验步骤实验步骤(1)(1)打开文件打开文件第29页，共40页，编辑于2022年，星期一(1)(1)打开文件打开文件(2)(2)设置播放控制工具设置播放控制工具TransportTransport(3)(3)播

29、放乐曲播放乐曲(4)(4)静音和独奏静音和独奏 (5)(5)当前时间当前时间第30页，共40页，编辑于2022年，星期一(6)(6)设置音轨标记设置音轨标记(7)(7)循环播放音乐循环播放音乐图图2-46“Loop Toolbar”2-46“Loop Toolbar”工具栏工具栏第31页，共40页，编辑于2022年，星期一实验22 Cakewalk SONAR音轨的基本编辑操作1.1.实验目的实验目的掌握掌握Cakewalk SONARCakewalk SONAR音轨的基本操作。音轨的基本操作。2.2.实验内容实验内容使用使用SONARSONAR导入音频文件、音轨的复制、粘贴与删除、音轨的合

30、导入音频文件、音轨的复制、粘贴与删除、音轨的合并与自动淡入淡出等。并与自动淡入淡出等。第32页，共40页，编辑于2022年，星期一3.3.实验步骤实验步骤(1)(1)打开文件打开文件(2)(2)音轨的复制、粘贴与删除音轨的复制、粘贴与删除(3)(3)音轨的移动音轨的移动第33页，共40页，编辑于2022年，星期一(4)(4)设定淡入淡出效果设定淡入淡出效果第34页，共40页，编辑于2022年，星期一(5)(5)音轨的合并音轨的合并第35页，共40页，编辑于2022年，星期一实验23：在乐曲中运用素材风格风格素材风格素材(Groove Clip)(Groove Clip)是指预先制作好的已知节

31、奏速度与音高的音频是指预先制作好的已知节奏速度与音高的音频文件文件,每个风格素材恰好在一个完整小节的时间长度内的鼓或贝司等每个风格素材恰好在一个完整小节的时间长度内的鼓或贝司等伴奏乐器所做的采样录音。伴奏乐器所做的采样录音。1.1.实验目的实验目的掌握掌握Cakewalk SONARCakewalk SONAR在乐曲中运用风格素材的操作。在乐曲中运用风格素材的操作。2.2.实验内容实验内容利用利用Tutorial.cwbTutorial.cwb工程文件添加风格素材。工程文件添加风格素材。第36页，共40页，编辑于2022年，星期一3.3.实验步骤实验步骤打开文件打开文件添加风格素材添加风格素材

32、图图2-56 2-56 将风格素材将风格素材100beat2100beat2导入音轨导入音轨5 5第37页，共40页，编辑于2022年，星期一图图2-57 2-57 风格素材被复制为多个副本风格素材被复制为多个副本第38页，共40页，编辑于2022年，星期一实验24：Cakewalk SONAR综合实验：录制数字音频(1)(1)设置采样率与采样精度设置采样率与采样精度(2)(2)建立新的工程文件建立新的工程文件(3)(3)设置音频轨设置音频轨(4)(4)检查输入电平检查输入电平(5)(5)设置设置MetronomeMetronome（节拍器）（节拍器）(6)(6)录制数字音频录制数字音频图图2-63 2-63 节拍器工具栏按钮功能节拍器工具栏按钮功能第39页，共40页，编辑于2022年，星期一(7)(7)导出音频文件导出音频文件第40页，共40页，编辑于2022年，星期一

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

18 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 数字音频处理实践 PPT 讲稿

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：第2章数字音频处理与实践PPT讲稿.ppt
链接地址：https://www.taowenge.com/p-43308507.html