多媒体技术基础--单元5.ppt
《多媒体技术基础--单元5.ppt》由会员分享,可在线阅读,更多相关《多媒体技术基础--单元5.ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体技术基础多媒体技术基础-数字声音数字声音授课教师:Email:学习目标学习目标1了解声音特性。2理解声音数字化的原理。3了解MPEG声音。4理解MIDI音乐原理及特点。5了解声音文件的存储格式及特点。6掌握声音的采集方法。7掌握声音编辑软件的基本功能。8了解音频卡的功能,掌握音频卡的安装和使用。2023/2/102内容框架内容框架2023/2/1035.15.1声音的特性声音的特性5.1.1 声音的物理特性 声音本质上是一种机械振动波,也称之为声波,它通过空气传播到人耳,刺激神经后使人的大脑产生感觉,即听觉。空气振动形成的声波 2023/2/1045.15.1声音的特性声音的特性5.1.
2、1 声音的物理特性1频率与音调频率是指声音信号每秒钟变化的次数,单位用赫兹(Hz)表示。20 300 3k 20k f(Hz)次声带音频(audio)带宽语音(speech)带宽超声带音频频率范围示意 2023/2/1055.15.1声音的特性声音的特性5.1.1 声音的物理特性1频率与音调人耳对声音频率的感觉表现为音调的高低,频率越低,给人的感觉越声音低沉。人耳对同样强度但不同频率的声音其主观感觉的强弱是不同的。2023/2/1065.15.1声音的特性声音的特性5.1.1 声音的物理特性2幅度与音强 音强是指声音信号的强弱程度,它与音频信号的幅度有关。我们常用音量来描述音强,音量是对音频信
3、号的幅度取对数后再乘以20所得到的值,单位为分贝(分贝(dBdB)。人耳能感知的声音幅度大约在0-120dB之间。2023/2/1075.15.1声音的特性声音的特性5.1.1 声音的物理特性2幅度与音强动态范围动态范围定义为音频信号的最大强度与最小强度之比:音频信号的动态范围=20lg(信号的最大强度/信号的最小强度)(dB)动态范围越大,说明音频信号强度的相对变化范围越大,则音响效果越好,表现力越强。2023/2/1085.15.1声音的特性声音的特性5.1.1 声音的物理特性3频带宽度 声音信号是由许多频率不同的信号组成的复合信号,因此需要用一个参数来描述其复合特性,这个参数就是频带宽度
4、或称为带宽,它是描述组成复合信号的频率范围。2023/2/1095.15.1声音的特性声音的特性5.1.1 声音的物理特性3频带宽度 音频信号的频带越宽,所包含的音频信号分量越丰富,因此音质越好。10 20 50 200 3.4k 7k 15k 22k f(Hz)FM广播电话AM广播CD-DA声音质量等级与信号带宽 2023/2/10105.15.1声音的特性声音的特性5.1.2语音、音乐、音效 根据音频信号所携带的信息大体上可以分为语音、音乐、音效三类。1语音2音乐3音效2023/2/10115.25.2 声音的数字化声音的数字化5.2.1 采样与量化声音的数字化主要包括两个过程:声音采样和
5、量化。声音的采样与量化2023/2/10125.25.2 声音的数字化声音的数字化5.2.1 采样与量化1采样与采样频率 在某些特定的时刻对模拟信号进行测量叫做采样采样(sampling),这样就把时间上连续的模拟信号通过抽取样本,变成时间上不连续的信号序列。每秒钟需要采集多少个声音样本,称为采样频率采样频率,单位用赫兹(Hz)来表示。采样率越高,音频信号越不失真,声音品质越好。采样的三个标准频率分别为44.1kHz(CD品质的音乐)、22.05kHz(中等品质的音乐或语音)、11.025kHz(语音)。2023/2/10135.25.2 声音的数字化声音的数字化5.2.1 采样与量化2量化与
6、量化位数 量化(量化(quantizationquantization)是指将采样所得的值数字化,即用二进制来表示模拟量。用来描述音频信号样本的二进制位数,称为量化位数(或称位深度),它决定了模拟信号数字化以后的动态范围,量化位越高,信号的动态范围越大,数字化后的音频信号就越可能接近原始信号。2023/2/10145.25.2 声音的数字化声音的数字化5.2.2 声音质量与数据率1声道 音频文件有单声道(mono)和双声道之分。双声道又分为左右声道。双声道声音文件比单声道声音文件大一倍,因为双声道存储的信息比单声道大两倍。双声道文件可以将左右两个声道的声音分别保存成单声道文件,也可以将左右声道
7、混合后通过一个单声道输出一个立体声(stereo)声音文件。2023/2/10155.25.2 声音的数字化声音的数字化5.2.2 声音质量与数据率2声音质量与数据率声音质量和数据率质量采样频率(kHz)样本精度(bit/s)单道声/立体数据率(kB/s)(未压缩)频率范围电话88单道声82003400HzAM11.0258单道声11.02015000HzFM22.05016立体声88.2507000HzCD44.116立体声176.42020000HzDAT4816立体声192.02020000Hz2023/2/10165.25.2 声音的数字化声音的数字化5.2.2 声音质量与数据率3声音
8、文件的大小文件大小=采样频率(Hz)量化位数(bit)声道数 音频秒数8(Byte)2023/2/10175.25.2 声音的数字化声音的数字化5.2.2 数字音频的压缩编码1PCM、DPCM和ADPCM 是基于音频数据统计特性进行编码的波形编码方法,它直接对波形采样、量化、编码,算法简单,易于实现。声音恢复时能保持原有的特点,但压缩比很难提高。采用PCM编码、ADPCM编码等生成的数字音频都以WAVE的文件格式存储,以“.WAV”为文件扩展名。CD激光唱盘中包含也是WAVE格式的波形数据,只是不存成扩展名为“.WAV”文件而已。2023/2/10185.25.2 声音的数字化声音的数字化5.
9、2.2 数字音频的压缩编码2MPEG音频 在MPEG-1音频标准中应用最广的就是MPEG-1 Audio Layer 3,即我们熟知的MP3音乐,其文件扩展名为“.mp3”。MP3最大的好处在于大幅降低了数字声音文件的容量,而不破坏原来的音质。以CD音质的Wave文件来说,通过MP3格式压缩后,文件便可压缩为原来的1/101/12。2023/2/10195.25.2 声音的数字化声音的数字化5.2.2 数字音频的压缩编码2MPEG音频MPEG-2标准定义了两种声音数据压缩格式MPEG-2 Audio:与MPEG-1 Audio兼容,并在此基础上实现了低码率和多声道扩展,可提供左、右、中及两个环
10、绕声道、一个加重低音声道,即5.1环绕声和多达7个伴音声道,用于DVD的伴音。MPEG-2 AAC(Advanced Audio Coding,先进音频编码):音质更加完美而压缩比更大(15:120:1),但与MPEG-1声音格式不兼容。2023/2/10205.25.2 声音的数字化声音的数字化什么是MP4??2023/2/10215.35.3 认识认识MIDIMIDI音乐音乐5.3.1 什么是MIDI?MIDI是英文Musical Instrument Digital Interface的缩写,中文含义是乐器数字接口。它是用于在电子乐器,如音乐合成器(music synthesizers)
11、或乐器(musical instruments)之间以及电子乐器和计算机之间交换音乐信息的一种标准协议。2023/2/10225.35.3 认识认识MIDIMIDI音乐音乐5.3.2 MIDI音乐的处理过程MIDI端口MIDI键盘音序器MIDI文件合成器扬声器 计算机中的声卡有MIDI端口,它通过MIDI电缆与MIDI键盘或电子乐器的键盘连接,采集键盘演奏的MIDI信息;音序器(sequencer)的作用是记录、编辑、播放由MIDI信息构成的MIDI文件,通常是一软件,如cakewalk;音乐合成器(musical synthesizer)是一种电子设备,可将MIDI信息转换成为模拟信号的波形
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 基础 单元
限制150内