中国高新技术产品出口目录(XXXX)Tit.pptx
《中国高新技术产品出口目录(XXXX)Tit.pptx》由会员分享,可在线阅读,更多相关《中国高新技术产品出口目录(XXXX)Tit.pptx(97页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第2 2章章 音频处理技术(二)音频处理技术(二)西安交通大学西安交通大学计算机教学实验中心计算机教学实验中心20072007多媒体技术及应用基础多媒体技术及应用基础1下一页上一页问题的提出问题的提出n数字音频信息如何处理?数字音频信息如何处理?n用什么工具可以处理?用什么工具可以处理?n有哪些处理?有哪些处理?n我能处理吗?我能处理吗?n2下一页上一页二、数字音频二、数字音频n数字音频原理回顾数字音频原理回顾n3下一页上一页声音的数字化声音的数字化 n声音的数字化声音的数字化 n数字化就是将连续信号变成离散信号。数字化就是将连续信号变成离散信号。n对音频信号,首先在时间上离散,取对音频信号
2、,首先在时间上离散,取有限个时间点,称为有限个时间点,称为采样采样。n然后在幅度上离散,取有限个幅度值,然后在幅度上离散,取有限个幅度值,称为称为量化量化。n再将得到的数据表示成计算机容易识再将得到的数据表示成计算机容易识别的格式,称为别的格式,称为编码编码。4下一页上一页声音的声音的A/D与与D/A转换转换n模拟信号很容易受到电子干扰,因此用数字信息代模拟信号很容易受到电子干扰,因此用数字信息代替声音信号成为音频信息处理的一种方法。替声音信号成为音频信息处理的一种方法。nA/D转换和转换和D/A转换技术便应运而生。转换技术便应运而生。A表示表示Analog”(类比、模拟),(类比、模拟),D
3、代表代表“Digital”(数字),(数字),A/D转换就是把模拟电信号转换成由转换就是把模拟电信号转换成由“0”和和“1”组成数字信号的过程。组成数字信号的过程。n这样做的好处是显而易见的,声音存储质量得到了这样做的好处是显而易见的,声音存储质量得到了加强,数字化的声音信息使计算机能够进行识别、加强,数字化的声音信息使计算机能够进行识别、处理和压缩,这也就是为什么如今磁带逐渐被淘汰,处理和压缩,这也就是为什么如今磁带逐渐被淘汰,CD唱片却趋于流行的原因。唱片却趋于流行的原因。nA/D转换的一个关键步骤是声音的采样和量化,得转换的一个关键步骤是声音的采样和量化,得到数字音频信号,它在时间上是不
4、连续的离散信号。到数字音频信号,它在时间上是不连续的离散信号。5下一页上一页PCM编码编码n1939年法国工程师年法国工程师Alec Reeves发明了将连续的模发明了将连续的模拟信号变换成时间和幅度都离散的二进制码代表的拟信号变换成时间和幅度都离散的二进制码代表的脉冲编码调制信号(脉冲编码调制信号(Pulse Code Modulation-PCM),并申请了专利。),并申请了专利。nP P首先开始应用于电话系统,但一直到首先开始应用于电话系统,但一直到年美国年美国Bell实验室才为制成了国际上第一实验室才为制成了国际上第一套商用电话系统(系统),这标志了通套商用电话系统(系统),这标志了通
5、信开始步入数字化。信开始步入数字化。nPCM 编码是对连续语音信号进行空间采样、幅度值编码是对连续语音信号进行空间采样、幅度值量化及用适当码字将其编码的总称。量化及用适当码字将其编码的总称。6下一页上一页PCM编码主要优点编码主要优点 n抗干扰能力强;失真小;传输特性稳抗干扰能力强;失真小;传输特性稳定,尤其是远距离信号再生中继时噪定,尤其是远距离信号再生中继时噪声不累积,而且可以采用压缩编码、声不累积,而且可以采用压缩编码、纠错编码和保密编码等来提高系统的纠错编码和保密编码等来提高系统的有效性、可靠性和保密性。有效性、可靠性和保密性。7下一页上一页 A/D 和和D/A转换示意图转换示意图 8
6、位可编程A/D转换芯片示意图8下一页上一页模拟声音信号的采样和量化过程示意模拟声音信号的采样和量化过程示意 模拟声音信号的波形采样得到的离散时间信号再量化得到的数字信号9下一页上一页数字音频的技术指标数字音频的技术指标 n采样频率采样频率n采样精度采样精度n声道数声道数n音频数据传输率音频数据传输率n编码算法与音频数据编码算法与音频数据压缩比压缩比10下一页上一页采样频率采样频率n采样频率是指一秒钟采样的次数。采样频采样频率是指一秒钟采样的次数。采样频率越高,单位时间内采集的样本数越多,率越高,单位时间内采集的样本数越多,得到波形越接近于原始波形,音质就越好。得到波形越接近于原始波形,音质就越
7、好。n根据根据奈奎斯特奈奎斯特(Harry Nyquist)采样理论采样理论:如果采样频率高于输入信号最高频率的如果采样频率高于输入信号最高频率的两倍,重放时就能从采样信号序列无失两倍,重放时就能从采样信号序列无失真地重构原始信号真地重构原始信号。11下一页上一页采样的采样的3个常用频率个常用频率n分别为:分别为:n11.025kHzAM(调幅调幅)广播广播n22.05kHz FM(调频调频)广播广播n44.1kHz CD高保真音质声音高保真音质声音n现在声卡的采样频率一般为现在声卡的采样频率一般为48kHz甚至甚至96kHz。12下一页上一页采样精度采样精度 n采样精度用每个声音样本的位数表
8、示,也叫样本精采样精度用每个声音样本的位数表示,也叫样本精度或量化位数,反映度量声音波形幅度的精度。度或量化位数,反映度量声音波形幅度的精度。n例如,每个声音样本用例如,每个声音样本用16位表示,则量化样本位表示,则量化样本值在值在065535之间,它的精度是输入信号的之间,它的精度是输入信号的1/65536。n采样精度采样精度决定了模拟信号数字化以后的动态范围。决定了模拟信号数字化以后的动态范围。n采样精度影响到声音的质量采样精度影响到声音的质量n位数越多,声音的质量越高,而需要的存储空位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要间也越多;位数越少,声音的
9、质量越低,需要的存储空间越少。的存储空间越少。13下一页上一页声道数声道数 n单声道单声道(mono)信号一次产生一组声波数据。信号一次产生一组声波数据。n双声道或立体声双声道或立体声(stereo)一次产生两组声波数据。一次产生两组声波数据。n双双声声道道在在硬硬件件中中占占两两条条线线路路,一一条条是是左左声声道道,一一条是右声道。条是右声道。n立立体体声声不不仅仅音音质质、音音色色好好,而而且且能能产产生生逼逼真真的的空空间间感感。但但立立体体声声数数字字化化后后所所占占空空间间比比单单声声道道多多一一倍。倍。14下一页上一页其他因素其他因素n除除采采样样频频率率、采采样样精精度度、声声
10、道道数数影影响响声声音音质质量量外外,声声音音录录制制时时环环境境噪噪声声、声声卡卡内内部部噪噪声声以以及及采采样样数数据据丢丢失失等等都都会会造造成成声音质量的下降。声音质量的下降。n实实际际收收听听时时,音音响响(功功率率放放大大器器、扬扬声声器器等等)的的质质量量对对音音质质的的表表现现也也起起很很大大作作用。用。15下一页上一页音频数据传输率音频数据传输率 n音频信号数字化后,产生大量数据音频信号数字化后,产生大量数据。n产生数据的速度或播放声音时需要传输数据产生数据的速度或播放声音时需要传输数据的速度影响声音的播放质量。数据传输率用的速度影响声音的播放质量。数据传输率用每秒钟传输的数
11、据位数表示,记为每秒钟传输的数据位数表示,记为bps(bit per second)。)。n未经压缩的数字音频数据传输率为:未经压缩的数字音频数据传输率为:数据传输率数据传输率(bits)=采样频率采样频率(Hz)量化位数量化位数(bit)声道数声道数 16下一页上一页声音质量和数字化指标声音质量和数字化指标 质量质量采样频率采样频率(kHz)样本精度样本精度(bit)单道声单道声/立体声立体声数据率数据率(kB/s)(未压缩未压缩)频率范围频率范围电话电话*88单道声单道声82003 400 HzAM11.0258单道声单道声11.0507 000HzFM22.05016立体声立体声88.2
12、2015 000HzCD44.116立体声立体声176.42020 000 HzDAT4816立体声立体声192.02020 000 Hz17下一页上一页 编码编码算法与音频数据压缩比算法与音频数据压缩比 n未压缩的音频数据量非常大,因此在编码的时未压缩的音频数据量非常大,因此在编码的时候常采用压缩的方式。候常采用压缩的方式。n实际上,编码的作用一是记录数字数据,二是实际上,编码的作用一是记录数字数据,二是采用一定的算法来压缩数据以减少存储空间和采用一定的算法来压缩数据以减少存储空间和提高传输效率。提高传输效率。n压缩编码的基本指标之一就是压缩比,一般为压缩编码的基本指标之一就是压缩比,一般为
13、数据压缩前后的数据量之比:数据压缩前后的数据量之比:18下一页上一页数据压缩说明数据压缩说明n采用不同的数字化指标实际上也是进行了采用不同的数字化指标实际上也是进行了不同比例的数据压缩。不同比例的数据压缩。n如果如果PCMPCM编码采用编码采用4bit4bit量化对量化对CDCD音质信号音质信号压缩,其压缩比为压缩,其压缩比为4:14:1。n压缩算法包括有损压缩和无损压缩;压缩算法包括有损压缩和无损压缩;n有损压缩解压后数据不能完全复原,要有损压缩解压后数据不能完全复原,要丢失一部分信息。丢失一部分信息。n无损压缩不丢失任何信息,能较好地复无损压缩不丢失任何信息,能较好地复原原始信号。原原始信
14、号。19下一页上一页数字音频文件格式数字音频文件格式 n数字声音文件格式是数字音数字声音文件格式是数字音频在磁盘文件中的存放形式,频在磁盘文件中的存放形式,相同的数据可以有不同的文相同的数据可以有不同的文件格式,而不同的数据也可件格式,而不同的数据也可以有相同的文件格式以有相同的文件格式。nWAVE WAVE 格式格式nMP3 MP3 格式格式nRA RA 格式格式20下一页上一页WAVEWAVE文件格式文件格式nWAVEWAVE文件是一种通用的音频数据文件,文文件是一种通用的音频数据文件,文件扩展名为件扩展名为“WAV”WAV”,WindowsWindows系统和一系统和一般的音频卡都支持这
15、种格式文件的生成、般的音频卡都支持这种格式文件的生成、编辑和播放。编辑和播放。nCDCD激光唱盘中包含的就是激光唱盘中包含的就是WAVEWAVE格式的波形格式的波形数据。一般说来,声音质量与其数据。一般说来,声音质量与其WAVEWAVE格式格式的文件大小成正比。的文件大小成正比。nWAVEWAVE文件的文件的特点特点是易于生成和编辑,但在是易于生成和编辑,但在保证一定音质的前提下压缩比不够,不适保证一定音质的前提下压缩比不够,不适合在网络上播放。合在网络上播放。21下一页上一页 MP3文件文件nMP3MP3文件是采用文件是采用MP3MP3算法压缩生成的数字音频算法压缩生成的数字音频数据文件,以
16、数据文件,以“.MP3”“.MP3”为文件后缀。为文件后缀。nMP3MP3利用利用MPEGMPEG制定的制定的MPEG-1 Audio layer 3MPEG-1 Audio layer 3的的压缩标准,将音频信息用压缩标准,将音频信息用10:110:1甚至甚至12:112:1压缩压缩率变成容量较小的数据文件。率变成容量较小的数据文件。n虽然虽然MP3MP3是一种利用了人类心理声学特性的有是一种利用了人类心理声学特性的有损压缩,人耳基本不能分辨出失真,音质几损压缩,人耳基本不能分辨出失真,音质几乎达到了乎达到了CDCD音质标准。按照这种算法,音质标准。按照这种算法,1010张张CD-DACD-
17、DA的内容可以压缩到的内容可以压缩到l l张张CD-ROMCD-ROM中,而且中,而且视听效果相当好。视听效果相当好。22下一页上一页 RA文件文件 nReal AudioReal Audio是是Real networksReal networks推出的一种推出的一种音乐压缩格式,它的压缩比可达到音乐压缩格式,它的压缩比可达到96:196:1,因此在网上比较流行。,因此在网上比较流行。n经过压缩的音乐文件可以在通过速率为经过压缩的音乐文件可以在通过速率为14.4kb/s14.4kb/s的的MODEMMODEM上网的计算机中流畅回上网的计算机中流畅回放。其最大特点是可以采用流媒体的方放。其最大特
18、点是可以采用流媒体的方式实现网上实时播放,即边下载边播放。式实现网上实时播放,即边下载边播放。23下一页上一页五、多媒体数据的编码技术五、多媒体数据的编码技术 n自然现象:自然现象:我们了解的东西,描述它用的信息量我们了解的东西,描述它用的信息量少,不了解的东西,描述它用的信息量大。少,不了解的东西,描述它用的信息量大。n在信息论中,可以说:信息是用不确定的度量来在信息论中,可以说:信息是用不确定的度量来定义的;一个消息的可能性越小,其信息含量越定义的;一个消息的可能性越小,其信息含量越大;消息的可能性越大,则信息含量越小。大;消息的可能性越大,则信息含量越小。24下一页上一页(1)(1)信息
19、和熵信息和熵n香农(香农(C.E.ShannonC.E.Shannon)信息论应用概率来描述不)信息论应用概率来描述不确定性。事件出现的概率小,不确定性越多,信确定性。事件出现的概率小,不确定性越多,信息量就大,反之则少。息量就大,反之则少。n在数学上,所传输的消息是其出现概率的单调下在数学上,所传输的消息是其出现概率的单调下降函数。所谓信息是指从降函数。所谓信息是指从N N个相等可能事件中选出个相等可能事件中选出一个事件,所需要的信息度量或含量,也就是在一个事件,所需要的信息度量或含量,也就是在辨识辨识N N个事件中某个特定事件过程中所需提问个事件中某个特定事件过程中所需提问“是是”或或“否
20、否”的最少次数。的最少次数。n如从如从6464个数中选定某一个数,提问:个数中选定某一个数,提问:“是否大于是否大于32?”32?”,则不论回答是与否,都消去了半数的可能,则不论回答是与否,都消去了半数的可能事件,如此下去,只要问事件,如此下去,只要问6 6次这类问题,就可以从次这类问题,就可以从6464个数中选定一个数。因此,可以用二进制的个数中选定一个数。因此,可以用二进制的6 6个个位来记录这一过程,就可以得到这条信息。位来记录这一过程,就可以得到这条信息。25下一页上一页信息源信息源x的熵的熵 26下一页上一页例例2-10 27下一页上一页例例2-112-11 28下一页上一页香侬理论
21、的要点香侬理论的要点n信源中含有信源中含有自然冗余度自然冗余度,这些冗余度既来自于信,这些冗余度既来自于信源本身的相关性,又来自于信源概率分布的不均源本身的相关性,又来自于信源概率分布的不均匀性,只要找到去除相关性或改变概率分布不均匀性,只要找到去除相关性或改变概率分布不均匀性的手段和方法,也就找到了信息熵编码的方匀性的手段和方法,也就找到了信息熵编码的方法。法。n但信源所含有的平均信息量(熵)是进行无失真但信源所含有的平均信息量(熵)是进行无失真编码的理论的极限,只要不低于此极限,就能找编码的理论的极限,只要不低于此极限,就能找到某种适宜的编码方法,去逼近信息熵,实现数到某种适宜的编码方法,
22、去逼近信息熵,实现数据压缩。据压缩。29下一页上一页(2)(2)信息冗余信息冗余 n多媒体数据中大的数据量并不完全等于它们所多媒体数据中大的数据量并不完全等于它们所携带的信息量。在信息论中,称为携带的信息量。在信息论中,称为冗余冗余。n冗余是指信息存在的各种性质的多余度。减少冗余是指信息存在的各种性质的多余度。减少数据冗余可以节省存储空间,有效利用网络带数据冗余可以节省存储空间,有效利用网络带宽。宽。30下一页上一页数据冗余的类型数据冗余的类型空间冗余空间冗余 物理特性具有相关性。物理特性具有相关性。时间冗余时间冗余 相邻帧图像之间有较大的相关性。相邻帧图像之间有较大的相关性。信息熵冗余信息熵
23、冗余 自然编码的比特分配不能达到最佳。自然编码的比特分配不能达到最佳。视觉冗余视觉冗余 人眼不能察觉图像中的所有变化。人眼不能察觉图像中的所有变化。知识冗余知识冗余 数据的理解与先验知识有很大的关系。数据的理解与先验知识有很大的关系。例如,当接收到一个成语的前三个字例如,当接收到一个成语的前三个字“大惊小大惊小”时,就知道下一个字肯定是时,就知道下一个字肯定是“怪怪”。听觉冗余听觉冗余 人耳不能察觉所有频率的变化。人耳不能察觉所有频率的变化。31下一页上一页数据压缩的基本原理数据压缩的基本原理n数据压缩的对象是数据。数据是信息数据压缩的对象是数据。数据是信息的载体,用来记录和传送信息。真正的载
24、体,用来记录和传送信息。真正有用的不是数据本身,而是数据所携有用的不是数据本身,而是数据所携带的信息。大的数据量并不代表含有带的信息。大的数据量并不代表含有大的信息量大的信息量 。n而对于去掉冗余的数据对信息没有本而对于去掉冗余的数据对信息没有本质的影响称为压缩。质的影响称为压缩。32下一页上一页(3)压缩算法的分类压缩算法的分类 n从信息量有无损失划分:从信息量有无损失划分:可逆编码可逆编码和和不可逆不可逆编码编码。n可逆编码也叫无失真编码、冗余度压缩、熵编可逆编码也叫无失真编码、冗余度压缩、熵编码等。其原理是减少数据中的冗余度,而不损码等。其原理是减少数据中的冗余度,而不损失任何信息。解压
25、时可以完全恢复出原来的数失任何信息。解压时可以完全恢复出原来的数据,亦称无损压缩。典型的无损压缩有据,亦称无损压缩。典型的无损压缩有Huffman编码、算术编码和行程编码等。编码、算术编码和行程编码等。n可逆编码由于不会产生失真,因此在多媒体技可逆编码由于不会产生失真,因此在多媒体技术中常用于文本、数据的压缩,它能保证完全术中常用于文本、数据的压缩,它能保证完全地恢复原始数据。但这种方法的压缩比较低,地恢复原始数据。但这种方法的压缩比较低,一般在一般在2:15:1之间。之间。33下一页上一页不可逆编码不可逆编码n不可逆编码是有失真压缩,信息论中叫熵压缩。不可逆编码是有失真压缩,信息论中叫熵压缩
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中国 高新技术 产品出口 目录 XXXX Tit
限制150内