第三章-多媒体音频信息处理ppt课件.ppt
《第三章-多媒体音频信息处理ppt课件.ppt》由会员分享,可在线阅读,更多相关《第三章-多媒体音频信息处理ppt课件.ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程第三章第三章 多媒体音频信息处理多媒体音频信息处理病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 声音是携带信息的极其重要的媒体,声音是携带信息的极其重要的媒体,是多媒体技术研究中的一个重要内容。声是多媒体技术研究中的一个重要内容。声音的种类繁多,如人的话音、乐器声、动音的种类繁多,如人的话音、乐器声、动物发出的声音、机器产生的声音以及自然物发出的声音、机器产生的声音以及自然界的声音等。界的声音等。这些声音有许多共同的特性
2、,也有这些声音有许多共同的特性,也有它们各自的特性。在用计算机处理这些声它们各自的特性。在用计算机处理这些声音时,既要考虑它们的共性,又要利用它音时,既要考虑它们的共性,又要利用它们的各自的特性。们的各自的特性。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程一、音频信号的分类一、音频信号的分类音频信号可分为两类:音频信号可分为两类:v 语音信号语音信号:语音是语言的物质载体,它包含了:语音是语言的物质载体,它包含了 丰富的语言内涵,是人类进行信息交流所特有丰富的语言内涵,是人类进行信息交流所特有 的形式。的形式。v 非语音信号非语
3、音信号:主要包括音乐和自然界存在的其他:主要包括音乐和自然界存在的其他 声音形式。非语音信号的特点是不含复杂的语义声音形式。非语音信号的特点是不含复杂的语义 和语法信息,其信息量低,识别简单。和语法信息,其信息量低,识别简单。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程二、音频信号的形式二、音频信号的形式 声音可用一条连续的曲线来表示。这条连声音可用一条连续的曲线来表示。这条连续的曲线无论多么复杂,都可分解成一系列正续的曲线无论多么复杂,都可分解成一系列正炫波的线性叠加,称为炫波的线性叠加,称为声波声波。因声波是在时间。因声波是
4、在时间上和幅度上都连续变化的量,因此称之为模拟上和幅度上都连续变化的量,因此称之为模拟量。模拟信号有两个重要参数:量。模拟信号有两个重要参数:频率频率和和幅度幅度。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程q 一个声源每秒钟可产生成百上千个波峰,把每一个声源每秒钟可产生成百上千个波峰,把每 秒钟波峰所发生的数目称之为秒钟波峰所发生的数目称之为信号的频率信号的频率。q 信号周期信号周期是指两个峰点或谷底之间的相对时间。是指两个峰点或谷底之间的相对时间。q 信号的基线信号的基线提供了一个测量声音的起点。提供了一个测量声音的起点。信
5、号信号 的幅度的幅度是从信号的基线到当前波峰的距离。幅是从信号的基线到当前波峰的距离。幅 度决定了信号音量的强弱程度。度决定了信号音量的强弱程度。q 信号带宽信号带宽是声音信号的一个重要参数,它用来描是声音信号的一个重要参数,它用来描 述组成复合信号的频率范围。述组成复合信号的频率范围。振幅周期基线病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程1GHz10GHz超高声波超高声波20kHz1GHz超声波超声波20Hz20kHz人类听力所能接受人类听力所能接受020Hz亚声波亚声波频率范围频率范围声音分类声音分类病原体侵入机体,消弱机
6、体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程三、声音质量的评价三、声音质量的评价v 客观质量度量:用信噪比来衡量。客观质量度量:用信噪比来衡量。v 主观质量度量主观质量度量现在公认的声音质量分为现在公认的声音质量分为4级级 数字激光唱盘质量数字激光唱盘质量 调频无线电广播调频无线电广播 调幅无线电广播调幅无线电广播 电话质量电话质量病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程CD-DAFM广播广播AM广播广播电话电话10 20 50 200 3.4K 7K 15K 22K 病原体侵入机
7、体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程四、模拟音频的数字化过程四、模拟音频的数字化过程话音信号是典型的连续信号,不话音信号是典型的连续信号,不仅在时间上是连续的,而且在幅仅在时间上是连续的,而且在幅度上也是连续的。在时间上度上也是连续的。在时间上“连连续续”是指在一个指定的时间范围是指在一个指定的时间范围里声音信号的幅值有无穷多个,里声音信号的幅值有无穷多个,在幅度上在幅度上“连续连续”是指幅度的数是指幅度的数值有无穷多个。我们把在时间和值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟幅度上都是连续的信号称为模拟信号。信号。病
8、原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程如果要用计算机对音频信息进行处理如果要用计算机对音频信息进行处理,则首先将则首先将模拟音频信号模拟音频信号(如语音、音乐等如语音、音乐等)转换成数字信号转换成数字信号.对模拟音频数字化的过程涉及到音频的对模拟音频数字化的过程涉及到音频的采样、采样、量化和编码量化和编码.模拟音频信号模拟音频信号采样采样量化量化编码编码数字音频信号数字音频信号病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程n计算机对声音的表示主要是通过计算机对声
9、音的表示主要是通过规则规则的的时间时间间隔间隔测出音波振动的幅度从而产生的一系列测出音波振动的幅度从而产生的一系列声音数据。这种测出数据的方法就称为声音数据。这种测出数据的方法就称为采样采样,一秒内采样的次数称为一秒内采样的次数称为采样率采样率(sampling rate),),单位为单位为Hz。例如:例如:采样频率通常采用种:11.025KHz(语音效果)、22.05KHz(音乐效果)44.1KHz(高保真效果)。常见的CD唱盘的采样频率即为44.144.1KHzKHz。采样采样病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 奈
10、奎斯特理论奈奎斯特理论:采样频率与声音频率之间有采样频率与声音频率之间有 一定的关系一定的关系,只有采样频率高于声音信号最只有采样频率高于声音信号最 高频率的两倍时高频率的两倍时,才能把数字信号表示的声才能把数字信号表示的声 音还原成为原来的声音音还原成为原来的声音.例如例如:CDCD唱片唱片,要想获得要想获得CDCD音质的效果音质的效果,则要则要 保证采样频率为保证采样频率为44.144.1KHzKHz.病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程n采样的离散音频数据要转换成计算机能够表示的采样的离散音频数据要转换成计算机能够
11、表示的 数据范围的过程数据范围的过程,我们把对声波波形幅度的数字化我们把对声波波形幅度的数字化 表示称之为表示称之为“量化量化”n量化的过程首先将采样后的信号按整个声波的幅量化的过程首先将采样后的信号按整个声波的幅 度划分成有限个区段的集合度划分成有限个区段的集合,把落入某个区段内把落入某个区段内 的样值归为一类的样值归为一类,并赋予相同的量化值并赋予相同的量化值.量化量化病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程(c)c)采样信号的量化采样信号的量化(a)a)模拟音频信号模拟音频信号(b)b)音频信号的采样音频信号的采样数字
12、化音频的过程如下图所示。数字化音频的过程如下图所示。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 量化位数量化位数 量化位数也称量化位数也称“量化精度量化精度”,是描述每个采样,是描述每个采样点样值的二进制位数。例如,点样值的二进制位数。例如,8 8位量化位数表示每位量化位数表示每个采样值可以用个采样值可以用2 28 8即即256256个不同的量化值之一来表个不同的量化值之一来表示,而示,而1616位量化位数表示每个采样值可以用位量化位数表示每个采样值可以用2 21616即即6553665536个不同的量化值之一来表示。这个参数
13、就是个不同的量化值之一来表示。这个参数就是通常所说的声卡的位数通常所说的声卡的位数.常用的量化位数为常用的量化位数为8 8位、位、1616位、位、3232位位,专业级的高档声卡有专业级的高档声卡有6464位的。位的。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程编码编码为什么要对音频编码?为什么要对音频编码?nA、获取更好的数学描述方法?nB、让声音不失真?nC、不编码就不是比特流?nD、为了使比特流更加简练?nE、为了便于计算机存储?nF、为了便于在网络上传输音频?以上哪个是最根本的出发点?以上哪个是最根本的出发点?以上哪个是最
14、根本的出发点?以上哪个是最根本的出发点?病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 所谓所谓编码编码,就是按照一定的格式把离散的数字就是按照一定的格式把离散的数字记录下来记录下来,并在有用的数据中加入一些用于纠错并在有用的数据中加入一些用于纠错、同步和控制的数据同步和控制的数据.在数据回放时在数据回放时,可以根据所记可以根据所记录的纠错数据判别读出的声音数据是否有错录的纠错数据判别读出的声音数据是否有错,如如在一定范围内有错在一定范围内有错,可加以纠正可加以纠正.病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且
15、在一定部位生长繁殖,引起不同程度的病理生理过程五、音频信号的压缩编码与标准五、音频信号的压缩编码与标准数字波形文件数据量大,数字音频的编码必须采用高效的数据压缩编码技术。对数字化后的声音信号进行压缩编码,使其成为具有一定字长的二进制数字序列,并以这种形式在计算机内传输和存储.在播放时经解码器恢复成原来的声音信号.输入信号输入信号编码器编码器传输传输/存储存储解码器解码器输出信号输出信号病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 音频信号能够被压缩编码的依据有两个,一是声音信号存在着数据冗余;二是利用人的听觉特性来降低编码率,人
16、的听觉具有一个强音能抑制一个同时存在的弱音现象,这样就可以抑制与信号同时存在的量化噪声;另外人耳对低频端比较敏感,而对高频端不太敏感,由此引出了“子带编码技术”。音频信号的编码方式可分为波形编码参数编码和混合编码三种。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 波形编码的算法简单,易于实现,可获得波形编码的算法简单,易于实现,可获得高质量的语音。常见的三种波形编码方法为:高质量的语音。常见的三种波形编码方法为:脉冲编码调制脉冲编码调制(PCM)PCM),实际为直接对声音信号作实际为直接对声音信号作A AD D转换。只要采样频率
17、足够高,量化位数足转换。只要采样频率足够高,量化位数足够多,就能使解码后恢复的声音信号有很高的够多,就能使解码后恢复的声音信号有很高的质量。质量。差分脉冲编码调制差分脉冲编码调制(DPCM)DPCM),即只传输声音预测即只传输声音预测值和样本值的差值以此降低音频数据的编码率。值和样本值的差值以此降低音频数据的编码率。自适应差分编码调制自适应差分编码调制(ADPCM)ADPCM),是是DPCMDPCM方法的进方法的进一步改进,通过调整量化步长,对不同频段设一步改进,通过调整量化步长,对不同频段设置不同的量化字长,使数据得到进一步的压缩。置不同的量化字长,使数据得到进一步的压缩。病原体侵入机体,消
18、弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程2).2).参数编码参数编码参数编码方法通过建立起声音信号的产生参数编码方法通过建立起声音信号的产生模型,将声音信号用模型参数来表示,再对参模型,将声音信号用模型参数来表示,再对参数进行编码,在声音播放时根据参数重建声音数进行编码,在声音播放时根据参数重建声音信号。参数编码法算法复杂,计算量大,压缩信号。参数编码法算法复杂,计算量大,压缩率高,但还原声音的质量不高。率高,但还原声音的质量不高。3).3).混合编码混合编码混合编码是把波形编码的高质量和参数编混合编码是把波形编码的高质量和参数编码的低数据率
19、结合在一起,取得了较好效果。码的低数据率结合在一起,取得了较好效果。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程脉冲编码调制脉冲编码调制(PCM)PCM)病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 PCM PCM编码是对连续语音信号进行空间采样编码是对连续语音信号进行空间采样,幅度值量化及用适当码字将其编码的总称幅度值量化及用适当码字将其编码的总称.PCMPCM方法可以按量化方式的不同方法可以按量化方式的不同,分为均匀量化分为均匀量化PCM,PCM,非均匀量化非
20、均匀量化PCMPCM和自适应量化和自适应量化PCMPCM等三种等三种.病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程均匀量化均匀量化非均匀量化非均匀量化病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程差分脉冲编码调制差分脉冲编码调制(DPCM)DPCM)他编码的不是声音采样样本值他编码的不是声音采样样本值,而是样本值及而是样本值及其预测值的差分。根据过去的样本去估算其预测值的差分。根据过去的样本去估算(estimate)estimate)下一个样本信号的幅度大小,这个值
21、称为预测值,下一个样本信号的幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,然后对实际信号值与预测值之差进行量化编码,从而就减少了表示每个样本信号的位数。从而就减少了表示每个样本信号的位数。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程自适应差分脉冲编码自适应差分脉冲编码(ADPCM)ADPCM)自适应就是使量化间隔大小的变化自动的去适应输入信号大小的变化.他根据信号分布不均匀的特点,是系统具有随输入
22、信号的变化而改变量化区间的大小,以保证输入量化器的信号基本均匀的能力.病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程标准 比特速度 编码技术 应用 制定日期 G.723 5.3kb/s或6.3kb/s MP-MLQ 视频电话及IP电话等 1996.3 G.722 64kb/s SBC+ADPCM 视听多媒体和会议电话 1988.11 G.711 64kb/s PCM 公共电话网 1972G.728 16kb/s LD-CE
23、LP 公共电话网 1992.9G.729 8kb/s CS-ACELP 无线移动网、1996.3 计算机通信系统等ITU-T G系列音频压缩编码标准系列音频压缩编码标准病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程音频编码标准和算法音频编码标准和算法编码类型算法名称数据率标准应用质量波形编码PCM均匀量化公共网ISDN配音4.0-4.5(A)(A)64kbit/s G.711APCM自适应量化DPCM差值量化ADPCM自适应差值量化32kbit/s G.721SB-ADPCM子带一自适应差值量化64kbit/s G.722参数 编
24、码LPC线性预测编码2.4kbit/s 保密电话2.5-3.5混合 编码CELPC码激励LPC4.8kbit/s 移动通信3.7-4.0VSELP矢量和激励LPC8kbit/s 语音邮件 RPE-CELP长时预测规则码激励13.2kbit/s ISDN LD-CELP低延时码激励LPC16kbit/G.728MPEG多子带感知编码128kbit/sCD 5.0病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程六、数字音频的文件格式六、数字音频的文件格式 WAV文件文件WAV文件又称为波形文件,是Micorsoft公司的文件格式.WAV
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 多媒体 音频 信息处理 ppt 课件
限制150内