第2章数字音频处理与实践精.ppt
《第2章数字音频处理与实践精.ppt》由会员分享,可在线阅读,更多相关《第2章数字音频处理与实践精.ppt(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2章数字音频处理与实践第1页,本讲稿共40页2.1 多媒体音频信息处理 2.1.1声音信号的形式任任何何声声音音都都是是物物体体振振动动产产生生的的现现象象 ,物物体体受受到到敲敲打打或或激激发发就就能能产产生生振振动动,发发声声体体的的振振动动在在介介质质中中的的传传播播称称为为声声波波。当当声声波波达达到到人人的的耳耳膜膜时时,会感觉到这种压力的变化,或者感觉到振动,这就是会感觉到这种压力的变化,或者感觉到振动,这就是声音声音。在日常生活中,音频在日常生活中,音频(Audio)(Audio)信号可分为两类:信号可分为两类:语音信号语音信号和和非语音信号。非语音信号。在在物物理理上上,声声
2、音音可可用用一一条条连连续续的的曲曲线线来来表表示示。这这条条连连续续的的曲曲线线无无论论多多复复杂杂,都都可可分分解解成成一一系系列列正正弦弦波波的的线线性性叠叠加加。因因声声波波是是在在时时间间和和幅幅度度上都连续变化的量,称为上都连续变化的量,称为模拟量模拟量。第2页,本讲稿共40页 图图2-1 2-1 用声音录制软件记录的英文单词用声音录制软件记录的英文单词”Hello”Hello”语音语音 的实际波形体之间的关系的实际波形体之间的关系第3页,本讲稿共40页2.1.2 模拟音频信号的物理特征模模拟拟音音频频信信号号有有两两个个重重要要参参数数:频频率率和和幅幅度度。声声音音的的频频率率
3、体体现现音音调调的的高高低低,声波幅度的大小体现声音的强弱。声波幅度的大小体现声音的强弱。2-2 2-2 声波的频率、周期与振幅声波的频率、周期与振幅第4页,本讲稿共40页1 1.频率频率一个声源每秒钟可产生成百上千个波,我们把每秒一个声源每秒钟可产生成百上千个波,我们把每秒钟波峰所发生的数目称之为信号的频率,单位用赫钟波峰所发生的数目称之为信号的频率,单位用赫兹兹(Hz)(Hz)或千赫兹或千赫兹(kHz)(kHz)表示。表示。人们在日常说话时的语音信号:频率范围人们在日常说话时的语音信号:频率范围3003003000Hz3000Hz亚音亚音(subsonic)(subsonic):频率小于:
4、频率小于20 Hz20 Hz的信号的信号音频音频(Audio)(Audio):频率范围为:频率范围为202020kHz20kHz的信号的信号超音频超音频(ultrasonic)(ultrasonic):高于:高于20kHz20kHz的信号的信号 第5页,本讲稿共40页2 2.周期周期 周周期期是是指指信信号号在在两两个个峰峰点点或或谷谷底底之之间间的的相相对对时时间间。周周期期和和频频率率之之间间的的关关系系是是互互为为倒数。如果每隔倒数。如果每隔定时间波形就重复相同的形状,那么就称这个时间为周期。定时间波形就重复相同的形状,那么就称这个时间为周期。3 3.幅度幅度 信号的幅度是从信号的基线到
5、当前波峰的距离。幅度决定了信号音量的强弱程度。信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大,声音越强。声音的强度水平幅度越大,声音越强。声音的强度水平(声响或者音量声响或者音量)用用dBdB来测量。来测量。dBdB的测量值的测量值等于在对数标尺上选定的参考声强与实际感受的声强的比值。等于在对数标尺上选定的参考声强与实际感受的声强的比值。分贝数分贝数10log(P110log(P1P0)P0)第6页,本讲稿共40页2.1.3 与声音有关的几个术语1.1.听觉、感知听觉、感知2.2.音高音高 3.3.音色音色4.4.语音语音5.5.响度响度 第7页,本讲稿共40
6、页6.声音的质量声音的质量与它所占用的频带宽度有关,频带越宽,信号强度的相对变化范围就越大大,音响效果也就越好。按照带宽可将声音质量分为4级 图图2-3 2-3 四级声音质量的频率范围四级声音质量的频率范围第8页,本讲稿共40页2 2.1.1.4 4 模拟音频的数字化过程模拟音频的数字化过程数数字字化化的的声声音音易易于于用用计计算算机机软软件件处处理理,对对模模拟拟音音频频数数字字化化过过程程涉涉及及音音频频的采样、量化和编码的采样、量化和编码第9页,本讲稿共40页 采样和量化的过程可由采样和量化的过程可由数模(数模(A/DA/D)转换器)转换器转换器实现。转换器实现。A/DA/D转换器以固
7、定的频转换器以固定的频率去采样,即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成率去采样,即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成为数字音频信号,可以将其以文件形式保存在计算机的存储介质中,这样的文件一般为数字音频信号,可以将其以文件形式保存在计算机的存储介质中,这样的文件一般称为数字声波文件。称为数字声波文件。1.1.采样采样为实现为实现A/DA/D转换,需要把模拟音频信号波形进行分割,以转变成数字信转换,需要把模拟音频信号波形进行分割,以转变成数字信号,这种方法称为采样号,这种方法称为采样(Sampling)(Sampling)。采样的过程是。采样的
8、过程是每隔一个时间间隔在模拟声音的每隔一个时间间隔在模拟声音的波形上取一个幅度值波形上取一个幅度值,把时间上的连续信号,变成时间上的离散信号。该时间,把时间上的连续信号,变成时间上的离散信号。该时间间隔称为采样周期,其倒数为采样频率。间隔称为采样周期,其倒数为采样频率。采样频率采样频率是指计算机每秒钟采集多少是指计算机每秒钟采集多少个声音样本。个声音样本。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。声音样本数据就越多,对声音波形的表示也越精确。第10页,本讲稿共40页2
9、.2.量化量化对声波波形幅度的数字化表示称之为对声波波形幅度的数字化表示称之为“量化量化”量化的过程量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的样值归为一类,并赋于相同的量化值。某个区段内的样值归为一类,并赋于相同的量化值。如何分割采样信号的幅度呢如何分割采样信号的幅度呢?采取二进制的方式,以位采取二进制的方式,以位(bit)(bit)或或1616位的方式来划分纵轴。也就是说在位的方式来划分纵轴。也就是说在一个以一个以8 8位为记录模式的音效中,其纵轴将会被划分为个量化等级位为记录模式的音
10、效中,其纵轴将会被划分为个量化等级(quantization levels)(quantization levels),用以记录其幅度大小。,用以记录其幅度大小。在相同的采样频率之下,量化位数愈高,声音的质量越好。同理,在相同量化位数的在相同的采样频率之下,量化位数愈高,声音的质量越好。同理,在相同量化位数的情况下,采样频率越高,声音效果也就越好。情况下,采样频率越高,声音效果也就越好。第11页,本讲稿共40页3.3.编码编码 图图2-6 2-6 音频信号处理过程音频信号处理过程 音频编码的信息是声音波形,所以又称波形编码。这种方法要求重构音频编码的信息是声音波形,所以又称波形编码。这种方法要
11、求重构的声音信号的各个样本尽可能地接近于原始声音的采样值,复原的声的声音信号的各个样本尽可能地接近于原始声音的采样值,复原的声音质量较高。音质量较高。常用的波形编码技术有常用的波形编码技术有脉冲编码调制脉冲编码调制(Pulse Code ModulationPulse Code Modulation,PCMPCM)、)、自适应差分脉冲编码调制自适应差分脉冲编码调制(Adaptive Differential Pulse Code Adaptive Differential Pulse Code ModulationModulation,ADPCMADPCM)和)和自适应变换编码自适应变换编码(
12、Adaptive Transform CodingAdaptive Transform Coding,ATCATC)等。)等。第12页,本讲稿共40页脉冲编码调制脉冲编码调制PCMPCMPCMPCM是把模拟信号变换为数字信号的一种调制方式,既把连续输入的是把模拟信号变换为数字信号的一种调制方式,既把连续输入的模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输或存储。式传输或存储。PCMPCM的主要优点是:的主要优点是:抗干扰能力强;失真小;传输特性稳定,尤其是远抗干扰能力强;失真小;传输特性稳定,尤其是远距离信号再生中
13、继时噪声不累积,而且可以采用压缩编码、纠错编码距离信号再生中继时噪声不累积,而且可以采用压缩编码、纠错编码和保密编码等来提高系统的有效性、可靠性和保密性。和保密编码等来提高系统的有效性、可靠性和保密性。第13页,本讲稿共40页2.1.5 声卡声卡声卡(也称为声效卡)声卡(也称为声效卡)在多媒体计算机中是不可缺少的重要部在多媒体计算机中是不可缺少的重要部件,直接决定了对声音数据的处理能力与质量。件,直接决定了对声音数据的处理能力与质量。现在的声卡已不仅仅作为发声之用,还兼备了声音的采集、编辑、语音识别、现在的声卡已不仅仅作为发声之用,还兼备了声音的采集、编辑、语音识别、网络电话等种种功用网络电话
14、等种种功用第14页,本讲稿共40页n1.1.声卡的工作原理声卡的工作原理 图图2-7 2-7 声卡工作原理框图声卡工作原理框图主芯片主芯片-数字信号处理器数字信号处理器 承担着对声音信息处理、特殊音效过滤与处理、语音识别、实时承担着对声音信息处理、特殊音效过滤与处理、语音识别、实时音频压缩、音频压缩、MIDIMIDI合成等重要的任务。合成等重要的任务。声卡主芯片是一块具有强大运算能力的数字信号处理器(声卡主芯片是一块具有强大运算能力的数字信号处理器(DSPDSP),),是声卡的核心部件。是声卡的核心部件。DSPDSP是一种可编程芯片,通过软件安装新的指令后是一种可编程芯片,通过软件安装新的指令
15、后就能够升级。主芯片能将来自就能够升级。主芯片能将来自ADC(ADC(数字数字/模拟转换器模拟转换器)的信号加以处理,的信号加以处理,改变成所需要的形式。改变成所需要的形式。DSPDSP芯片对输入的数字声音用芯片对输入的数字声音用PCMPCM、DPCMDPCM或或ADPCMADPCM方式进行编码和压缩,并形成方式进行编码和压缩,并形成WAVWAV格式文件送入计算机磁盘存储。声音格式文件送入计算机磁盘存储。声音输出时,将磁盘中的输出时,将磁盘中的WAVWAV文件送入文件送入DSPDSP芯片,经解码后变成数字声音信号芯片,经解码后变成数字声音信号送至送至D/AD/A转换部分。转换部分。混音芯片混音
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字音频 处理 实践
限制150内