第2章多媒体创作精选PPT.ppt
《第2章多媒体创作精选PPT.ppt》由会员分享,可在线阅读,更多相关《第2章多媒体创作精选PPT.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2章多媒体创作第1页,此课件共85页哦第二章第二章 数字音频处理数字音频处理 读者学习本章应重点理解波形音频、读者学习本章应重点理解波形音频、MIDI等常见数字音频的含义、特点及其在计等常见数字音频的含义、特点及其在计算机中的实现方法;理解音频格式的种算机中的实现方法;理解音频格式的种类、音频卡的原理;了解类、音频卡的原理;了解WAV音频低级格音频低级格式分析,能利用式分析,能利用GoldWave进行简单的音频进行简单的音频处理;理解音频编码的一般原理。处理;理解音频编码的一般原理。本章建议学时数:本章建议学时数:6学时。学时数较少时学时。学时数较少时可将可将WAV音频低级格式分析不讲。纯应
2、用音频低级格式分析不讲。纯应用专业音频编码也可不讲。专业音频编码也可不讲。第2页,此课件共85页哦第第 1 1 课课 在本次课中,我们将从数字音频的概在本次课中,我们将从数字音频的概念出发结合声音的特点介绍数字音频在计念出发结合声音的特点介绍数字音频在计算机中的实现,算机中的实现,音频卡的工作原理音频卡的工作原理。第3页,此课件共85页哦1.1.上一课回顾上一课回顾2 2.授课内容授课内容本次授课内容属于:本次授课内容属于:第二章第二章 1 1、2 2、3 3节节第4页,此课件共85页哦1 1 概述概述 一般认为,人的声音是由声道产生,当人说话一般认为,人的声音是由声道产生,当人说话时,在声道
3、里会产生两种类型声音;时,在声道里会产生两种类型声音;一、声音媒体的特征一、声音媒体的特征自然界的声音信号究其本质是一种机械振动,是自然界的声音信号究其本质是一种机械振动,是一种在空气中随时间而变化的压力信号。一种在空气中随时间而变化的压力信号。二、语音媒体二、语音媒体第5页,此课件共85页哦 第一种类型声音为浊音,为准周期脉冲,各第一种类型声音为浊音,为准周期脉冲,各股空气之间的间隔称为音调周期股空气之间的间隔称为音调周期;第二种类型为清音第二种类型为清音,它是由空气通过声道时,受它是由空气通过声道时,受声道某些部分的压缩而引起,具有更大的随机性声道某些部分的压缩而引起,具有更大的随机性第6
4、页,此课件共85页哦理想化的话音波形及频谱如下:理想化的话音波形及频谱如下:第7页,此课件共85页哦 音调与语音的频率有关,音强即声音音调与语音的频率有关,音强即声音的大小,取决于声波的幅度,音色则是的大小,取决于声波的幅度,音色则是由混入基音的泛音所决定由混入基音的泛音所决定2 2结论结论 人的听觉范围最低可达人的听觉范围最低可达2020HzHz,最高可达最高可达2020kHzkHz 语音包含三要素:音调、音强、音色语音包含三要素:音调、音强、音色第8页,此课件共85页哦三三人的听觉感知机理特征人的听觉感知机理特征:人耳对不同频段的声音的敏感程度不同;人耳对不同频段的声音的敏感程度不同;人耳
5、对语音信号的相位变化不敏感。人耳对语音信号的相位变化不敏感。人的听觉具有掩蔽效应。这便是强音掩蔽弱音,人的听觉具有掩蔽效应。这便是强音掩蔽弱音,包括同时掩蔽和异时掩蔽两种类型;包括同时掩蔽和异时掩蔽两种类型;第9页,此课件共85页哦四、数字音频四、数字音频 自然界的声音信号究其本质是一种机自然界的声音信号究其本质是一种机械振动,对信号进行处理一般需进行变换,械振动,对信号进行处理一般需进行变换,对声音信号主要有两种变换器:麦克风,对声音信号主要有两种变换器:麦克风,将声音的压力变化信号转换成电压信号;将声音的压力变化信号转换成电压信号;喇叭,将电压信号转换成声音的压力变化喇叭,将电压信号转换成
6、声音的压力变化信号。信号。第10页,此课件共85页哦 传统电子技术采用模拟音频电子技术处传统电子技术采用模拟音频电子技术处理声音信号:它以模拟电压的幅度表示声理声音信号:它以模拟电压的幅度表示声音的强弱,但计算机只认识数字信号音的强弱,但计算机只认识数字信号 在计算机中,所有信息均以数字表示。在计算机中,所有信息均以数字表示。声音信号也用一系列的数字表示,称为数声音信号也用一系列的数字表示,称为数字音频。字音频。将模拟音频转换为数字音频需经采样、将模拟音频转换为数字音频需经采样、量化两个步骤。量化两个步骤。第11页,此课件共85页哦五五 音频数字化原理音频数字化原理 把把模模拟拟音音频频信信号
7、号转转换换成成有有限限个个数数字字表表示示的离散序列,即音频数字化。的离散序列,即音频数字化。音音频频数数字字化化需需经经历历采采样样、量量化化、编编码码三三个个过过程程第12页,此课件共85页哦 音频信号事实上是连续信号,或称连续时间音频信号事实上是连续信号,或称连续时间函数函数x(t)x(t)。用计算机处理这些信号首先必须先对用计算机处理这些信号首先必须先对连续信号进行采样,即按一定的时间间隔(连续信号进行采样,即按一定的时间间隔(T T)取取值,得到值,得到x(nT)x(nT)(n n为整数)。为整数)。T T称为采样周期,称为采样周期,1/1/T T称为采样频率。称称为采样频率。称x(
8、nT)x(nT)为离散信号,其过程为离散信号,其过程如图如图2-2-32-2-3所示。所示。1 1采样采样 采样过程事实上是一个抽样过程。离散信号采样过程事实上是一个抽样过程。离散信号x(nT)x(nT)是是从连续信号从连续信号x(t)x(t)上取出一部分,那么用上取出一部分,那么用x(nT)x(nT)能够能够唯一地恢复出唯一地恢复出x(t)x(t)吗?吗?第13页,此课件共85页哦 采采样样定定理理告告诉诉我我们们,若若连连续续信信号号x(t)x(t)的的频频谱谱为为x(f)x(f),按按采采样样时时间间间间隔隔T T采采样样取取值值得得到到x(nT)x(nT),如如果满足:果满足:当当|f
9、|fcf|fc时,时,fcfc是截止频率是截止频率 T 1/T 1/(2fc2fc)或或 fcfc 1/1/(2T2T)则可以由离散信号则可以由离散信号x(nT)x(nT)唯一地恢复出唯一地恢复出x(t)x(t)。常用音频采样频率有:常用音频采样频率有:8 8kHzkHz,11.025kHz11.025kHz,22.05kHz22.05kHz,16kHz16kHz,37.8kHz37.8kHz,44.1kHz44.1kHz,48kHz48kHz第14页,此课件共85页哦2量化量化 由于计算机中只能用由于计算机中只能用0 0和和1 1两个数值表示数据,两个数值表示数据,连续信号连续信号x(t)x
10、(t)经采样变成离散信号经采样变成离散信号x(nT)x(nT)仍需用有仍需用有限个限个0 0和和1 1的序列来表示的序列来表示x(nT)x(nT)的幅度。我们把用有限的幅度。我们把用有限个数字个数字0 0和和1 1表示某一电平范围的模拟离散电压信号称表示某一电平范围的模拟离散电压信号称为量化。为量化。第15页,此课件共85页哦 量量化化过过程程是是一一个个A/DA/D转转换换的的过过程程。在在量量化化过过程程中中,一一个个重重要要的的参参数数便便是是量量化化位位数数,这这不不仅仅决决定定着着声声音音数数据据经经数数字字化化后后的的失失真真度度,更更决决定定着着声声音音数数据据数数据据量量的的大
11、大小小。存存储储数数字字音频数据的比特率为:音频数据的比特率为:I=BI=Bf fs s(比特比特/秒)秒)(2-2-12-2-1)f fs s是采样频率是采样频率 B B是每个样值的比特数是每个样值的比特数第16页,此课件共85页哦 如如果果量量化化值值是是均均匀匀的的,则则称称为为均均匀匀量量化化,反反之之,则为非均匀量化。则为非均匀量化。在在实实际际使使用用上上,常常常常采采用用均均匀匀量量化化。对对非非均均匀匀量量化化,可先均匀量化然后用软件进行变换。可先均匀量化然后用软件进行变换。一一般般而而言言,量量化化将将产产生生一一定定的的失失真真,因因此此,量量化化过过程程中中每每个个样样值
12、值的的比比特特数数直直接接决决定定着着量量化化的的精精度。度。声卡的位数事实上便是指量化过程中每个样值的声卡的位数事实上便是指量化过程中每个样值的比特位数,主要有比特位数,主要有8 8位、位、1616位、位、3232位位 几几个等级。个等级。第17页,此课件共85页哦 有格式的数据才能表达信息的含义。有格式的数据才能表达信息的含义。在实际使用中,主要有在实际使用中,主要有MicrosoftMicrosoft公司为公司为WindowsWindows操作系统定义的数字音频格式操作系统定义的数字音频格式-WaveWave文文件格式,件格式,CreativeCreative公司为公司为DosDos操作
13、系统定义的数字操作系统定义的数字音频格式音频格式-VocVoc文件格式,文件格式,MIDIMIDI规范定义的规范定义的MIDIMIDI标准等标准等3 3 编码并格式化编码并格式化 由于音频数据数据量极大(由于音频数据数据量极大(MIDIMIDI音频例外),因此,在格音频例外),因此,在格式化前总是对其进行编码。式化前总是对其进行编码。第18页,此课件共85页哦 音音频频信信号号经经数数字字化化以以后后以以文文件件形形式式存存放放于于计计算算机中,当需要声音时计算机将其反格式化并输出。机中,当需要声音时计算机将其反格式化并输出。在在计计算算机机中中,数数字字音音频频可可分分为为波波形形音音频频、
14、语语音和音乐。音和音乐。何为波形音频?何为波形音频?对对声声音音进进行行直直接接数数字字化化处处理理所所得得到到的的结结果果称称为为波波形形音音频频,是是对对外外界界连连续续声声音音波波形形进进行行采采样样并并量化的结果。量化的结果。六、数字音频的输出六、数字音频的输出第19页,此课件共85页哦 在在计计算算机机中中,声声音音产产生生有有两两种种方方法法:一一是是录音录音/重放,二是声音合成。重放,二是声音合成。若若采采用用第第一一种种方方法法,首首先先要要把把模模拟拟语语音音信信号号转转换换成成数数字字序序列列,编编码码后后,暂暂存存于于存存储储设设备备中中(录录音音),需需要要时时,再再经
15、经解解码码,重重建建声声音音信信号号(重重放放)。用用这这种种方方法法处处理理产产生生的的声声音音称称为为波波形形音音频频,可可获获得得高高音音质质的的声声音音,并并能能保保留留特特定定人人或或乐乐器器的的特特色。美中不足是所需的存储空间较大。色。美中不足是所需的存储空间较大。第20页,此课件共85页哦 第第二二种种方方法法是是一一种种基基于于声声音音合合成成的的声声音音产产生技术,包括语音合成、音乐合成两大类。生技术,包括语音合成、音乐合成两大类。语语音音合合成成亦亦称称文文-语语转转换换,它它能能把把计计算算机机中中的文字转换成连续自然的语音流。的文字转换成连续自然的语音流。第21页,此课
16、件共85页哦 若采用这种方法进行语音输出,应先建立语若采用这种方法进行语音输出,应先建立语音参数数据库、发音规则库,需要输出语音时,音参数数据库、发音规则库,需要输出语音时,系统按需求先合成语音单元,再按语音学规则系统按需求先合成语音单元,再按语音学规则或语言学规则,连接成自然的语流。或语言学规则,连接成自然的语流。第二种方法是解决计算机声音输出的最佳方第二种方法是解决计算机声音输出的最佳方案,但第二种方法涉及多个科技领域,走向实案,但第二种方法涉及多个科技领域,走向实用有很多难点。用有很多难点。目前普遍应用的是音乐合成目前普遍应用的是音乐合成第22页,此课件共85页哦 综综上上所所述述,数数
17、字字音音频频在在计计算算机机中中实实现现需需经经历历音音频频数数字字化化、数数字字音音频频在在计计算算机机中中输输出出两两个个过过程程。在这个实现过程中,音频卡是完成此过程的关键。在这个实现过程中,音频卡是完成此过程的关键。第23页,此课件共85页哦七七 音频卡工作原理简介音频卡工作原理简介 处处理理音音频频信信号号的的PCPC插插卡卡是是音音频频卡卡(Audio Audio CardCard),又称声音卡(简称声卡)。),又称声音卡(简称声卡)。音音频频卡卡分分类类有有多多种种方方法法,根根据据数数据据采采样样量量化化的的位位数来分,通常可分为数来分,通常可分为8 8位、位、1616位、位、
18、3232位等几个等级。位等几个等级。第24页,此课件共85页哦(一)音频卡的主要功能有:(一)音频卡的主要功能有:1 1音频的录制与播放音频的录制与播放2 2音频文件的编辑与合成音频文件的编辑与合成3 3MIDIMIDI接口和音乐合成接口和音乐合成4 4文语转换和语音识别文语转换和语音识别第25页,此课件共85页哦(二)(二)音频卡的原理与组成音频卡的原理与组成第26页,此课件共85页哦第27页,此课件共85页哦八本课重点与难点八本课重点与难点 重点:数字音频在计算机中实现重点:数字音频在计算机中实现 难点:音频数字化原理难点:音频数字化原理九九 习题习题 2-2 4 2-2 4、5 2-4
19、15 2-4 1 第28页,此课件共85页哦下下 课课第29页,此课件共85页哦第第 2 2 课课 本次课主要介绍本次课主要介绍计算机中的三种常见计算机中的三种常见声音声音,WAVWAV波形音频格式及其处理技术。波形音频格式及其处理技术。学时数较少时可不介绍学时数较少时可不介绍WAVWAV波形音频波形音频格式。格式。第30页,此课件共85页哦一一 计算机中的三种常见声音计算机中的三种常见声音 目目前前,计计算算机机中中主主要要有有三三种种常常见见声声音音:WAVEWAVE波形音频、波形音频、MIDIMIDI音频和音频和CDCD音频。音频。波波形形音音频频是是应应用用最最广广泛泛的的一一种种数数
20、字字音音频频形形式式,流流行行的的格格式式有有:WAVWAV文文件件格格式式、VOCVOC文文件件格格式式及及MP3,MP3,WMA,WMA,OGG,OGG,MP3pro,MP3pro,AAC,AAC,VQF,VQF,ASFASF等等有有损损压压缩编码格式。缩编码格式。第31页,此课件共85页哦 WAVWAV波波形形音音频频是是MicrosoftMicrosoft公公司司为为WindowsWindows操操作作系系统统定定义义的的数数字字音音频频格格式式,VOCVOC文文件件是是CreativeCreative公公司为司为DosDos操作系统定义的数字音频格式。操作系统定义的数字音频格式。WA
21、VWAV文文件件、VOCVOC文文件件均均是是声声音音录录制制完完成成后后的的原原始始音音频频格格式式,一一般般不不压压缩缩,因因此此所所占占存存储储空空间间较较大大,尤其不适合于网络传输与发布。尤其不适合于网络传输与发布。第32页,此课件共85页哦其数据量计算公式如下(单位:字节其数据量计算公式如下(单位:字节/秒):秒):如如1 1分分钟钟的的CDCD音音质质、1616位位立立体体声声音音频频数数据据,其其数数据量为:据量为:第33页,此课件共85页哦 MP3MP3全全称称是是MPEG MPEG Audio Audio Laye-3Laye-3,具具有有较较高高的的压压缩缩效效率率。VBR
22、(VBR(可可变变编编码码率率)和和ABR(ABR(平平均均编编码码率率)压压缩缩编码方式引入后,编码方式引入后,MP3MP3文件已具有较理想的音质。文件已具有较理想的音质。WMAWMA全全称称Windows Windows Media Media AudioAudio,相相对对于于MP3MP3的的最最大特点就是有极强的可保护性。大特点就是有极强的可保护性。MP3 MP3、WMAWMA均是目前网络上流行的声音媒体格式。均是目前网络上流行的声音媒体格式。第34页,此课件共85页哦 CDCD音音频频具具有有悠悠久久的的历历史史和和丰丰富富的的资资源源,以以光光盘盘为为载载体体,按按照照音音轨轨组组
23、织织声声音音数数据据。CDCD音音频频记记录录的的依依旧旧是是声声音音的的波波形形,不不过过它它不不是是按按照照文文件件方方式式存存储组织。储组织。第35页,此课件共85页哦 MIDIMIDI是是 Musical Musical Instrument Instrument Digitial Digitial InterfaceInterface的的缩缩写写,是是音音乐乐与与计计算算机机结结合合的的产产物物,是一项工业产品的产物,泛指数字音乐的国际标准。是一项工业产品的产物,泛指数字音乐的国际标准。通俗地说,通俗地说,MIDIMIDI文件记录的是音乐的乐谱。文件记录的是音乐的乐谱。MIDIMID
24、I给给出出了了在在计计算算机机中中得得到到音音乐乐声声音音的的另另外外一一种种方方法法,且且这这种种方方法法极极为为节节省省空空间间,但但关关键键是是MIDIMIDI音音乐乐作作为为一一种种媒媒体体应应能能记记录录这这些些音音乐乐的的符符号号,相相应应的设备能够产生和解释这些符号。的设备能够产生和解释这些符号。第36页,此课件共85页哦 必必须须指指出出的的是是,虽虽然然波波形形音音频频能能够够实实现现全全部部的的声声音音,但但MIDIMIDI音音频频、CDCD音音频频亦亦是是不不可可代代替替,这这是是由由其其本质差异所决定的。本质差异所决定的。第37页,此课件共85页哦 WAV WAV 声音
25、是声音是MicrosoftMicrosoft公司为公司为WindowsWindows操作系统定义的数字音频格式,它是波操作系统定义的数字音频格式,它是波形音频的一种;形音频的一种;二二 WAVWAV声音及其应用声音及其应用 要理解要理解WAVWAV文件格式,首先应了解文件格式,首先应了解WindowsWindows操作系统操作系统RIFFRIFF文件格式。文件格式。RIFF RIFF(Resource Interexchange File Resource Interexchange File FormatFormat)文件格式是文件格式是IBM/MicrosoftIBM/Microsoft公
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 创作 精选 PPT
限制150内