第2章多媒体创作精.ppt
《第2章多媒体创作精.ppt》由会员分享,可在线阅读,更多相关《第2章多媒体创作精.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2章多媒体创作第1页,本讲稿共85页第二章第二章 数字音频处理数字音频处理 读者学习本章应重点理解波形音频、读者学习本章应重点理解波形音频、MIDI等常见数字音频的含义、特点及其在等常见数字音频的含义、特点及其在计算机中的实现方法;理解音频格式的种计算机中的实现方法;理解音频格式的种类、音频卡的原理;了解类、音频卡的原理;了解WAV音频低级格音频低级格式分析,能利用式分析,能利用GoldWave进行简单的音进行简单的音频处理;理解音频编码的一般原理。频处理;理解音频编码的一般原理。本章建议学时数:本章建议学时数:6学时。学时数较少学时。学时数较少时可将时可将WAV音频低级格式分析不讲。纯应音
2、频低级格式分析不讲。纯应用专业音频编码也可不讲。用专业音频编码也可不讲。第2页,本讲稿共85页第第 1 1 课课 在本次课中,我们将从数字音频的概在本次课中,我们将从数字音频的概念出发结合声音的特点介绍数字音频在计念出发结合声音的特点介绍数字音频在计算机中的实现,算机中的实现,音频卡的工作原理音频卡的工作原理。第3页,本讲稿共85页1.1.上一课回顾上一课回顾2 2.授课内容授课内容本次授课内容属于:本次授课内容属于:第二章第二章 1 1、2 2、3 3节节第4页,本讲稿共85页1 1 概述概述 一般认为,人的声音是由声道产生,当人说话一般认为,人的声音是由声道产生,当人说话时,在声道里会产生
3、两种类型声音;时,在声道里会产生两种类型声音;一、声音媒体的特征一、声音媒体的特征自然界的声音信号究其本质是一种机械振动,是自然界的声音信号究其本质是一种机械振动,是一种在空气中随时间而变化的压力信号。一种在空气中随时间而变化的压力信号。二、语音媒体二、语音媒体第5页,本讲稿共85页 第一种类型声音为浊音,为准周期脉冲,第一种类型声音为浊音,为准周期脉冲,各股空气之间的间隔称为音调周期各股空气之间的间隔称为音调周期;第二种类型为清音第二种类型为清音,它是由空气通过声道时,它是由空气通过声道时,受声道某些部分的压缩而引起,具有更大的随受声道某些部分的压缩而引起,具有更大的随机性机性第6页,本讲稿
4、共85页理想化的话音波形及频谱如下:理想化的话音波形及频谱如下:第7页,本讲稿共85页 音调与语音的频率有关,音强即声音音调与语音的频率有关,音强即声音的大小,取决于声波的幅度,音色则是的大小,取决于声波的幅度,音色则是由混入基音的泛音所决定由混入基音的泛音所决定2 2结论结论 人的听觉范围最低可达人的听觉范围最低可达2020HzHz,最高可最高可达达2020kHzkHz 语音包含三要素:音调、音强、音色语音包含三要素:音调、音强、音色第8页,本讲稿共85页三三人的听觉感知机理特征人的听觉感知机理特征:人耳对不同频段的声音的敏感程度不同;人耳对不同频段的声音的敏感程度不同;人耳对语音信号的相位
5、变化不敏感。人耳对语音信号的相位变化不敏感。人的听觉具有掩蔽效应。这便是强音掩蔽人的听觉具有掩蔽效应。这便是强音掩蔽弱音,包括同时掩蔽和异时掩蔽两种类型;弱音,包括同时掩蔽和异时掩蔽两种类型;第9页,本讲稿共85页四、数字音频四、数字音频 自然界的声音信号究其本质是一种机械自然界的声音信号究其本质是一种机械振动,对信号进行处理一般需进行变换,振动,对信号进行处理一般需进行变换,对声音信号主要有两种变换器:麦克风,对声音信号主要有两种变换器:麦克风,将声音的压力变化信号转换成电压信号;将声音的压力变化信号转换成电压信号;喇叭,将电压信号转换成声音的压力变化喇叭,将电压信号转换成声音的压力变化信号
6、。信号。第10页,本讲稿共85页 传统电子技术采用模拟音频电子技术处传统电子技术采用模拟音频电子技术处理声音信号:它以模拟电压的幅度表示声理声音信号:它以模拟电压的幅度表示声音的强弱,但计算机只认识数字信号音的强弱,但计算机只认识数字信号 在计算机中,所有信息均以数字表示。在计算机中,所有信息均以数字表示。声音信号也用一系列的数字表示,称为数字声音信号也用一系列的数字表示,称为数字音频。音频。将模拟音频转换为数字音频需经采样、将模拟音频转换为数字音频需经采样、量化两个步骤。量化两个步骤。第11页,本讲稿共85页五五 音频数字化原理音频数字化原理 把把模模拟拟音音频频信信号号转转换换成成有有限限
7、个个数数字字表表示示的的离散序列,即音频数字化。离散序列,即音频数字化。音音频频数数字字化化需需经经历历采采样样、量量化化、编编码码三三个过程个过程第12页,本讲稿共85页 音频信号事实上是连续信号,或称连续时音频信号事实上是连续信号,或称连续时间函数间函数x(t)x(t)。用计算机处理这些信号首先必用计算机处理这些信号首先必须先对连续信号进行采样,即按一定的时间须先对连续信号进行采样,即按一定的时间间隔(间隔(T T)取值,得到取值,得到x(nT)x(nT)(n n为整数)。为整数)。T T称为采样周期,称为采样周期,1/1/T T称为采样频率。称称为采样频率。称x(nT)x(nT)为离散信
8、号,其过程如图为离散信号,其过程如图2-2-32-2-3所示。所示。1 1采样采样 采样过程事实上是一个抽样过程。离散信号采样过程事实上是一个抽样过程。离散信号x(nT)x(nT)是是从连续信号从连续信号x(t)x(t)上取出一部分,那么用上取出一部分,那么用x(nT)x(nT)能能够唯一地恢复出够唯一地恢复出x(t)x(t)吗?吗?第13页,本讲稿共85页 采采样样定定理理告告诉诉我我们们,若若连连续续信信号号x(t)x(t)的的频频谱谱为为x(f)x(f),按按采采样样时时间间间间隔隔T T采采样样取取值值得得到到x(nT)x(nT),如果满足:如果满足:当当|f|fcf|fc时,时,fc
9、fc是截止频率是截止频率 T 1/T 1/(2fc2fc)或或 fcfc 1/1/(2T2T)则可以由离散信号则可以由离散信号x(nT)x(nT)唯一地恢复出唯一地恢复出x(t)x(t)。常用音频采样频率有:常用音频采样频率有:8 8kHzkHz,11.025kHz11.025kHz,22.05kHz22.05kHz,16kHz16kHz,37.8kHz37.8kHz,44.1kHz44.1kHz,48kHz48kHz第14页,本讲稿共85页2量化量化 由于计算机中只能用由于计算机中只能用0 0和和1 1两个数值表示数两个数值表示数据,连续信号据,连续信号x(t)x(t)经采样变成离散信号经采
10、样变成离散信号x(nT)x(nT)仍需用有限个仍需用有限个0 0和和1 1的序列来表示的序列来表示x(nT)x(nT)的幅度。的幅度。我们把用有限个数字我们把用有限个数字0 0和和1 1表示某一电平范围的表示某一电平范围的模拟离散电压信号称为量化。模拟离散电压信号称为量化。第15页,本讲稿共85页 量量化化过过程程是是一一个个A/DA/D转转换换的的过过程程。在在量量化化过过程程中中,一一个个重重要要的的参参数数便便是是量量化化位位数数,这这不不仅仅决决定定着着声声音音数数据据经经数数字字化化后后的的失失真真度度,更更决决定定着着声声音音数数据据数数据据量量的的大大小小。存存储储数数字字音音频
11、频数据的比特率为:数据的比特率为:I=BI=Bf fs s(比特比特/秒)秒)(2-2-12-2-1)f fs s是采样频率是采样频率 B B是每个样值的比特数是每个样值的比特数第16页,本讲稿共85页 如如果果量量化化值值是是均均匀匀的的,则则称称为为均均匀匀量量化化,反反之之,则为非均匀量化。则为非均匀量化。在在实实际际使使用用上上,常常常常采采用用均均匀匀量量化化。对对非非均均匀匀量量化,可先均匀量化然后用软件进行变换。化,可先均匀量化然后用软件进行变换。一一般般而而言言,量量化化将将产产生生一一定定的的失失真真,因因此此,量量化化过过程程中中每每个个样样值值的的比比特特数数直直接接决决
12、定定着着量量化化的的精精度。度。声卡的位数事实上便是指量化过程中每个样值的声卡的位数事实上便是指量化过程中每个样值的比特位数,主要有比特位数,主要有8 8位、位、1616位、位、3232位位 几几个等级。个等级。第17页,本讲稿共85页 有格式的数据才能表达信息的含义。有格式的数据才能表达信息的含义。在实际使用中,主要有在实际使用中,主要有MicrosoftMicrosoft公司为公司为WindowsWindows操作系统定义的数字音频格式操作系统定义的数字音频格式-WaveWave文件格式,文件格式,CreativeCreative公司为公司为DosDos操作系统操作系统定义的数字音频格式定
13、义的数字音频格式-VocVoc文件格式,文件格式,MIDIMIDI规范定义的规范定义的MIDIMIDI标准等标准等3 3 编码并格式化编码并格式化 由于音频数据数据量极大(由于音频数据数据量极大(MIDIMIDI音频例外),因此,音频例外),因此,在格式化前总是对其进行编码。在格式化前总是对其进行编码。第18页,本讲稿共85页 音音频频信信号号经经数数字字化化以以后后以以文文件件形形式式存存放放于于计计算算机机中,当需要声音时计算机将其反格式化并输出。中,当需要声音时计算机将其反格式化并输出。在在计计算算机机中中,数数字字音音频频可可分分为为波波形形音音频频、语语音音和和音乐。音乐。何为波形音
14、频?何为波形音频?对对声声音音进进行行直直接接数数字字化化处处理理所所得得到到的的结结果果称称为为波波形形音音频频,是是对对外外界界连连续续声声音音波波形形进进行行采采样样并并量量化化的的结结果。果。六、数字音频的输出六、数字音频的输出第19页,本讲稿共85页 在在计计算算机机中中,声声音音产产生生有有两两种种方方法法:一一是是录音录音/重放,二是声音合成。重放,二是声音合成。若若采采用用第第一一种种方方法法,首首先先要要把把模模拟拟语语音音信信号号转转换换成成数数字字序序列列,编编码码后后,暂暂存存于于存存储储设设备备中中(录录音音),需需要要时时,再再经经解解码码,重重建建声声音音信信号号
15、(重重放放)。用用这这种种方方法法处处理理产产生生的的声声音音称称为为波波形形音音频频,可可获获得得高高音音质质的的声声音音,并并能能保保留留特特定定人人或或乐乐器器的的特特色色。美美中中不不足足是是所所需需的的存存储储空空间较大。间较大。第20页,本讲稿共85页 第第二二种种方方法法是是一一种种基基于于声声音音合合成成的的声声音音产生技术,包括语音合成、音乐合成两大类。产生技术,包括语音合成、音乐合成两大类。语语音音合合成成亦亦称称文文-语语转转换换,它它能能把把计计算算机中的文字转换成连续自然的语音流。机中的文字转换成连续自然的语音流。第21页,本讲稿共85页 若采用这种方法进行语音输出,
16、应先建立语若采用这种方法进行语音输出,应先建立语音参数数据库、发音规则库,需要输出语音时,音参数数据库、发音规则库,需要输出语音时,系统按需求先合成语音单元,再按语音学规则系统按需求先合成语音单元,再按语音学规则或语言学规则,连接成自然的语流。或语言学规则,连接成自然的语流。第二种方法是解决计算机声音输出的最佳方案,第二种方法是解决计算机声音输出的最佳方案,但第二种方法涉及多个科技领域,走向实用有很多但第二种方法涉及多个科技领域,走向实用有很多难点。难点。目前普遍应用的是音乐合成目前普遍应用的是音乐合成第22页,本讲稿共85页 综综上上所所述述,数数字字音音频频在在计计算算机机中中实实现现需需
17、经经历历音音频频数数字字化化、数数字字音音频频在在计计算算机机中中输输出出两两个个过过程程。在在这这个个实实现现过过程程中中,音音频频卡卡是是完完成成此此过过程程的关键。的关键。第23页,本讲稿共85页七七 音频卡工作原理简介音频卡工作原理简介 处处理理音音频频信信号号的的PCPC插插卡卡是是音音频频卡卡(Audio Audio CardCard),又称声音卡(简称声卡)。),又称声音卡(简称声卡)。音音频频卡卡分分类类有有多多种种方方法法,根根据据数数据据采采样样量量化化的的位位数数来来分分,通通常常可可分分为为8 8位位、1616位位、3232位位等等几个等级。几个等级。第24页,本讲稿共
18、85页(一)音频卡的主要功能有:(一)音频卡的主要功能有:1 1 音频的录制与播放音频的录制与播放2 2 音频文件的编辑与合成音频文件的编辑与合成3 3 MIDIMIDI接口和音乐合成接口和音乐合成4 4 文语转换和语音识别文语转换和语音识别第25页,本讲稿共85页(二)(二)音频卡的原理与组成音频卡的原理与组成第26页,本讲稿共85页第27页,本讲稿共85页八本课重点与难点八本课重点与难点 重点:数字音频在计算机中实现重点:数字音频在计算机中实现 难点:音频数字化原理难点:音频数字化原理九九 习题习题 2-2 4 2-2 4、5 2-4 15 2-4 1 第28页,本讲稿共85页下下 课课第
19、29页,本讲稿共85页第第 2 2 课课 本次课主要介绍本次课主要介绍计算机中的三种常见声计算机中的三种常见声音音,WAVWAV波形音频格式及其处理技术。波形音频格式及其处理技术。学时数较少时可不介绍学时数较少时可不介绍WAVWAV波形音频波形音频格式。格式。第30页,本讲稿共85页一一 计算机中的三种常见声音计算机中的三种常见声音 目目前前,计计算算机机中中主主要要有有三三种种常常见见声声音音:WAVEWAVE波形音频、波形音频、MIDIMIDI音频和音频和CDCD音频。音频。波波形形音音频频是是应应用用最最广广泛泛的的一一种种数数字字音音频频形形式式,流流行行的的格格式式有有:WAVWAV
20、文文件件格格式式、VOCVOC文文件件格格式式及及MP3,MP3,WMA,WMA,OGG,OGG,MP3pro,MP3pro,AAC,AAC,VQF,VQF,ASFASF等等有有损压缩编码格式。损压缩编码格式。第31页,本讲稿共85页 WAVWAV波波形形音音频频是是MicrosoftMicrosoft公公司司为为WindowsWindows操操作作系系统统定定义义的的数数字字音音频频格格式式,VOCVOC文文件件是是CreativeCreative公公司司为为DosDos操操作作系系统统定定义义的的数数字字音音频频格式。格式。WAVWAV文文件件、VOCVOC文文件件均均是是声声音音录录制制
21、完完成成后后的的原原始始音音频频格格式式,一一般般不不压压缩缩,因因此此所所占占存存储储空空间较大,尤其不适合于网络传输与发布。间较大,尤其不适合于网络传输与发布。第32页,本讲稿共85页其数据量计算公式如下(单位:字节其数据量计算公式如下(单位:字节/秒):秒):如如1 1分分钟钟的的CDCD音音质质、1616位位立立体体声声音音频频数数据据,其数据量为:其数据量为:第33页,本讲稿共85页 MP3MP3全全称称是是MPEG MPEG Audio Audio Laye-3Laye-3,具具有有较较高高的的压压缩缩效效率率。VBR(VBR(可可变变编编码码率率)和和ABR(ABR(平平均均编编
22、码码率率)压压缩缩编编码码方方式式引引入入后后,MP3MP3文文件件已已具具有有较较理想的音质。理想的音质。WMAWMA全全称称Windows Windows Media Media AudioAudio,相相对对于于MP3MP3的最大特点就是有极强的可保护性。的最大特点就是有极强的可保护性。MP3MP3、WMAWMA均均是是目目前前网网络络上上流流行行的的声声音音媒媒体体格式。格式。第34页,本讲稿共85页 CDCD音音频频具具有有悠悠久久的的历历史史和和丰丰富富的的资资源源,以以光光盘盘为为载载体体,按按照照音音轨轨组组织织声声音音数数据据。CDCD音音频频记记录录的的依依旧旧是是声声音音
23、的的波波形形,不不过过它它不不是是按按照照文文件方式存储组织。件方式存储组织。第35页,本讲稿共85页 MIDIMIDI是是 Musical Musical Instrument Instrument Digitial Digitial InterfaceInterface的的缩缩写写,是是音音乐乐与与计计算算机机结结合合的的产产物物,是是一一项项工工业业产产品品的的产产物物,泛泛指指数数字字音音乐乐的的国际标准。国际标准。通俗地说,通俗地说,MIDIMIDI文件记录的是音乐的乐谱。文件记录的是音乐的乐谱。MIDIMIDI给给出出了了在在计计算算机机中中得得到到音音乐乐声声音音的的另另外外一一
24、种种方方法法,且且这这种种方方法法极极为为节节省省空空间间,但但关关键键是是MIDIMIDI音音乐乐作作为为一一种种媒媒体体应应能能记记录录这这些些音音乐乐的的符号,相应的设备能够产生和解释这些符号。符号,相应的设备能够产生和解释这些符号。第36页,本讲稿共85页 必必须须指指出出的的是是,虽虽然然波波形形音音频频能能够够实实现现全全部部的的声声音音,但但MIDIMIDI音音频频、CDCD音音频频亦亦是是不不可可代代替替,这是由其本质差异所决定的。这是由其本质差异所决定的。第37页,本讲稿共85页 WAV WAV 声音是声音是MicrosoftMicrosoft公司为公司为WindowsWin
25、dows操作系统定义的数字音频格式,它是波操作系统定义的数字音频格式,它是波形音频的一种;形音频的一种;二二 WAVWAV声音及其应用声音及其应用 要理解要理解WAVWAV文件格式,首先应了解文件格式,首先应了解WindowsWindows操作系统操作系统RIFFRIFF文件格式。文件格式。RIFF RIFF(Resource Interexchange File Resource Interexchange File FormatFormat)文件格式是文件格式是IBM/MicrosoftIBM/Microsoft公司为公司为WindowsWindows操作系统定义的资源交换文件操作系统定义
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 创作
限制150内