多媒体音频技术优秀课件.ppt
《多媒体音频技术优秀课件.ppt》由会员分享,可在线阅读,更多相关《多媒体音频技术优秀课件.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体音频技术第1页,本讲稿共67页第二章声音信号数字化声音的基本概念通过空气传播的一种连续的机械波。强弱:声压,音调:频率声音信号的两大参数振幅频率第2页,本讲稿共67页分贝是声压级单位,记为dB。分貝表示声音的強度或响度,也就是音量。零分貝的設定,是根据听力正常的年轻人所能听到的最小声音所得到的。1分贝大约是人刚刚能感觉到的声音。适宜的生活环境不应超过45分贝,不应低于15分贝。按普通人的听觉020分贝很静、几乎感觉不到。2040分贝安静、犹如轻声絮语。4060分贝一般、普通室内谈话6070分贝吵闹、有损神经7090分贝很吵、神经细胞受到破坏90100分贝吵闹加剧、听力受损100120分贝
2、难以忍受、呆一分钟即暂时致聋。第3页,本讲稿共67页一般的耳語大約是20分貝超靜音冷氣機的音量是33分貝極安靜的住宅區40分貝一般公共場所50分貝交談約60分貝(所以若兩耳的聽力皆超過60分貝,交談便會產生困難,會出現說話像吵架的情形)交通繁忙地區85分貝飛機場跑道120分貝。第4页,本讲稿共67页(2)频率(音频周期)20khz超声波(ultrasonic)各种音频的带宽人的发音:80hz3.4khz人的说话:300hz3khz人的听觉:20hz20khz第5页,本讲稿共67页从模拟过渡到数字音频信号的产生与还原模拟处理方法音源机电转换滤波放大存储电磁(光)转换(磁带、唱盘等)滤波放大电机转
3、换声音数字处理方法音源-信号转换(电信号)-模数转换-压缩、编码-存储介质(磁盘、光盘等)-数模转换电机转换声音模拟域处理的特点:速度快、受环境变化影响大、成本高。数字域处理的特点:容易实现、精确处理、不受时间和环境变化的影响、可编程成本低、可智能化。第6页,本讲稿共67页模拟信号与数字信号话音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。在时间上“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个,在幅度上“连续”是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。第7页,本讲稿共67页模拟信号与数字信号我们把时间和幅度都用离散的数字表示的信
4、号就称为数字信号。采样在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling),由这些特定时刻采样得到的信号称为离散时间信号。量化采样得到的幅值是无穷多个实数值中的一个,因此幅度还是连续的。如果把信号幅度取值的数目加以限定,这种由有限个数值组成的信号就称为离散幅度信号。第8页,本讲稿共67页声音信号数字化声音进入计算机的第一步就是数字化,数字化实际上就是采样和量化。如前所述,连续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样一次,这种采样称为均匀采样(uniformsampling);连续幅度的离散化通过量化(quantization)来实现,就是把信号的强度划分成一小段一
5、小段,如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。第9页,本讲稿共67页声音信号数字化音频数字化(时间上的离散:采样;幅度上的离散:量化)第10页,本讲稿共67页声音信号数字化声音数字化需要回答两个问题:每秒钟需要采集多少个声音样本,也就是采样频率(fs)是多少,每个声音样本的位数(bitpersample,bps)应该是多少,也就是量化精度。第11页,本讲稿共67页采样频率的高低是根据奈奎斯特理论(Nyquisttheory)和声音信号本身的最高频率决定的。奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,这叫做无损数字
6、化(losslessdigitization)。采样定律用公式表示为fs=2fmax 或者 Ts=T/2其中f max为被采样信号的最高频率。采样频率第12页,本讲稿共67页采样频率可以这样来理解奈奎斯特理论:声音信号可以看成由许许多多正弦波组成的,一个振幅为A、频率为f的正弦波至少需要两个采样样本表示,因此,如果一个信号中的最高频率为fmax,采样频率最低要选择2fmax。例如,电话话音的信号频率约为3.4kHz,采样频率就选为8kHz。第13页,本讲稿共67页采样精度样本大小是用每个声音样本的位数bit/sample表示的,它反映度量声音波形幅度的精度。例如,每个声音样本用16位(2字节)
7、表示,测得的声音样本值是在065536的范围里,它的精度就是输入信号的1/65536。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。第14页,本讲稿共67页采样精度采样精度的另一种表示方法是信号噪声比,简称为信噪比(signal-to-noiseratio,SNR),并用下式计算:SNR10log(Vsignal)2/(Vnoise)220log(Vsignal/Vnoise)其中,Vsignal表示信号电压,Vnoise表示噪声电压;SNR的单位为分贝(db)例1:假设Vnoise1,采样精度为1位表示Vsig
8、nal21,它的信噪比SNR6分贝。例2:假设Vnoise1,采样精度为16位表示Vsignal216,它的信噪比SNR96分贝。第15页,本讲稿共67页声音质量与数据率根据声音的频带,通常把声音的质量分成5个等级,由低到高分别是电话(telephone)、调幅(amplitudemodulation,AM)广播、调频(frequencymodulation,FM)广播、激光唱盘(CD-Audio)和数字录音带(digitalaudiotape,DAT)的声音。在这5个等级中,使用的采样频率、样本精度、通道数和数据率列于表201。第16页,本讲稿共67页声音质量与数据率第17页,本讲稿共67页
9、非线性量化均匀量化:线性,按比例得量化值非均匀量化它们的优缺点对数式压缩A率压扩(P73)U率压扩(P75)第18页,本讲稿共67页第19页,本讲稿共67页率压扩原理第20页,本讲稿共67页率压扩原理第21页,本讲稿共67页A率压扩原理第22页,本讲稿共67页多媒体音频技术音频信号的频谱分析(P65图)基频、取样频率的确定取样频率过高或过低的缺点第23页,本讲稿共67页2.3声音文件的存储格式第24页,本讲稿共67页音频文件的格式如同存储文本文件一样,存储声音数据也需要有存储格式。在因特网上和各种机器上运行的声音文件格式很多,但目前比较流行的有以.wav(waveform),.au(audio
10、),.aiff(AudioInterchangeableFileFormat)和.snd(sound)为扩展名的文件格式。.wav格式主要用在PC上,.au主要用在Unix工作站上,.aiff和snd主要用在苹果机和美国视算科技有限公司(SiliconGraphics,Inc.,SGI)的工作站上。第25页,本讲稿共67页2.4 声音工具声音工具声音工具(audiotools)用来录放、编辑和分析声音文件。声音工具使用得相当普遍,但它们的功能相差很大。下面列出了比较常见的几种工具。Soundrecordwavestudiocooledit示例(编辑处理)第26页,本讲稿共67页2.5声音质量的
11、度量声音质量的评价是一个很困难的问题,目前还在继续研究的课题。前面介绍了用声音信号的带宽来衡量声音的质量,等级由高到低依次是DAT,CD,FM,AM和数字电话。是客观质量度量,客观标准:5个等级及参数、信噪比SNR。另一种是主观质量度量。第27页,本讲稿共67页2.5主观声音质量的度量声音客观质量的度量主要用信噪比(signaltonioseratio,SNR),详细计算可参看23。与用SNR客观质量度量相比较,应该可以说人的感觉(如听觉、视觉等)更具有决定意义,感觉上的、主观上的测试应该成为评价声音质量和图像质量不可缺少的部分。而有的学者则认为,在语音和图像信号编码中使用主观质量度量比使用客
12、观质量度量更加恰当,更有意义。可是一般来说,可靠的主观度量值也是比较 难 获 得 的,所 获 得 的 值 也 是 一 个 相 对 值。第28页,本讲稿共67页2.5声音质量的度量主观度量声音质量的方法类似于电视节目中的歌手比赛,由评委对每个歌手的表现进行评分,然后求出平均值。对声音质量的度量也可以使用类似的方法,召集若干实验者,由他们对声音质量的好坏进行评分,求出平均值作为对声音质量的评价。这种方法称为主观平均判分法,所得的分数称为主观平均(meanopinionscore,MOS)分。对声音主观质量度量比较通用的标准是5分制。第29页,本讲稿共67页主观标准MOS(meanopinionsc
13、ore)一般再现语音频率若达7kHz以上,MOS可评5分第30页,本讲稿共67页2.乐音音质乐音音质的优劣取决于多种因素,如声源特性(声压、频率、频谱等)、音响器材的信号特性(如失真度、频响、动态范围、信噪比、瞬态特性、立体声分离度等)、声场特性(如直达声、前期反射声、混响声、两耳间互相关系数、基准振动、吸声率等)、听觉特性(如响度曲线、可听范围、各种听感)等。所以,对音响设备再现音质的评价难度较大。通常用下列两种方法:一是使用仪器测试技术指标;二是凭主观聆听各种音效。由于乐音音质属性复杂,主观评价的个人色彩较浓,而现有的音响测试技术又只能从某些侧面反映其保真度。所以,迄今为止,还没有一个能真
14、正定量反映乐音音质保真度的国际公认的评价标准。但也有报道,国际电信联盟(ITU-T)近期已批准一种客观评价音质的被称之为电子耳的新型测量方法,可对任何音响器材的音质进行客观听音评价,也可用于检测电话通讯语音编码系统的缺陷。第31页,本讲稿共67页2.6电子乐器数字接口(MIDI)系统lMIDI是MusicalInstrumentDigitalInterface的首写字母组合词,可译成“电子乐器数字接口”。用于在音乐合成器(musicsynthesizers)、乐器(musicalinstruments)和计算机之间交换音乐信息的一种标准协议。从20世纪80年代初期开始,MIDI已经逐步被音乐家
15、和作曲家广泛接受和使用。lMIDI是乐器和计算机使用的标准语言,是一套指令(即命令的约定),它指示乐器即MIDI设备要做什么,怎么做,如演奏音符、加大音量、生成音响效果等。MIDI不是声音信号,而是发给MIDI设备或其它装置让它产生声音或执行某个动作的指令。l特点:文件小、易于编辑、可以与其它媒体同时播放。RobertMoog第32页,本讲稿共67页MIDI标准之所以受到欢迎,主要是它有下列几个优点:生成的文件比较小,因为MIDI文件存储的是命令,而不是声音波形;容易编辑,因为编辑命令比编辑声音波形要容易得多;可以作背景音乐,因为MIDI音乐可以和其它的媒体,如数字电视、图形、动画、话音等一起
16、播放,这样可以加强演示效果。第33页,本讲稿共67页产生MIDI乐音的方法很多,现在用得较多的方法有两种:频率调制(frequencymodulation,FM)合成法乐音样本合成法,也称为波形表(Wavetable)合成法。这两种方法目前主要用来生成音乐。第34页,本讲稿共67页FM合成声音FM合成声音音乐合成器的先驱Robert Moog采用了模拟电子器件生成了复杂的乐音。20世纪80年代初,美国斯坦福大学的John Chowning 研究生发明了一种产生乐音的新方法,这种方法称为数字式频率调制合成法,简称为FM合成器。他把几种乐音的波形用数字来表达,并且用数字计算机而不是用模拟电子器件把
17、它们组合起来,通过数模转换器来生成乐音。斯坦福大学得到了发明专利,并且把专利权授给Yamaha公司,该公司把这种技术做在集成电路芯片里,成了世界市场上的热门产品。FM合成法的发明使合成音乐工业发生了一次革命。第35页,本讲稿共67页FM合成器生成乐音的基本原理FM合成器生由5个基本模块组成:数字载波器、调制器、声音包络发生器、数字运算器和模数转换器。数字载波器用了3个参数:音调(pitch)、音量(volume)和各种波形(wave);调制器用了6个参数:频率(frequency)、调制深度(depth)、波形的类型(type)、反馈量(feedback)、颤音(vibrato)和音效(eff
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 音频 技术 优秀 课件
限制150内