语音信号处理第4章概要优秀PPT.ppt
《语音信号处理第4章概要优秀PPT.ppt》由会员分享,可在线阅读,更多相关《语音信号处理第4章概要优秀PPT.ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、7.17.1概述概述7.27.2矢量量化的基本原理矢量量化的基本原理7.37.3失真测度失真测度7.47.4最佳矢量量化器和码本设计最佳矢量量化器和码本设计7.57.5降低困难度的矢量量化系统降低困难度的矢量量化系统7.67.6语音参数的矢量量化语音参数的矢量量化7.1 7.1 概述概述v矢量量化(矢量量化(VQVQ,即,即Vector QuantizationVector Quantization)是一种极)是一种极其重要的信号压缩方法。其重要的信号压缩方法。VQVQ在语音信号处理中占特在语音信号处理中占特别重要的地位。广泛应用于语音编码、语音识别和别重要的地位。广泛应用于语音编码、语音识别
2、和语音合成等领域。语音合成等领域。v量化分为两类:量化分为两类:v *标量量化:将取样后的信号值逐个地进行量化。标量量化:将取样后的信号值逐个地进行量化。v *矢量量化:将若干取样信号分成一组,即构成矢量量化:将若干取样信号分成一组,即构成一个矢量,然后对此矢量一次进行量化。一个矢量,然后对此矢量一次进行量化。v凡是要用量化的地方都可以接受矢量量化。凡是要用量化的地方都可以接受矢量量化。矢量量化是实现数据压缩的一种有效方法,早矢量量化是实现数据压缩的一种有效方法,早在在5050和和6060年头就被用于语音压缩编码。直到年头就被用于语音压缩编码。直到7070年头线性预料技术被引入语音编码后,矢年
3、头线性预料技术被引入语音编码后,矢量量化技术才活跃起来。量量化技术才活跃起来。8080年头初,矢量量年头初,矢量量化技术的理论和应用探讨得到快速发展。化技术的理论和应用探讨得到快速发展。接受矢量量化技术对信号波形或参数进行压缩接受矢量量化技术对信号波形或参数进行压缩处理,可以获得很好的效益,使存储要求、处理,可以获得很好的效益,使存储要求、传输比特率需求或和计算量需求降低传输比特率需求或和计算量需求降低.接受矢量量化的效果优于标量量化的缘由?接受矢量量化的效果优于标量量化的缘由?矢量量化能有效的应用矢量中各重量矢量量化能有效的应用矢量中各重量之间的四种相互关联性质来消退数据中的之间的四种相互关
4、联性质来消退数据中的冗余度。这四种相互关联的性质是线性依冗余度。这四种相互关联的性质是线性依靠靠(相关性相关性)、非线性依靠、非线性依靠(统计不独立统计不独立)、概率密度函数的形态和矢量量化的维数,概率密度函数的形态和矢量量化的维数,而标量量化仅能利用线性依靠和概率密度而标量量化仅能利用线性依靠和概率密度函数的形态来消退冗余度。函数的形态来消退冗余度。矢量量化探讨的目的?矢量量化探讨的目的?针对特定的信息源和矢量维数,设计针对特定的信息源和矢量维数,设计出一种最优化的量化器,在出一种最优化的量化器,在R(量化速率)(量化速率)确定的状况下,给出的量化失真尽可能确定的状况下,给出的量化失真尽可能
5、接近接近D(R)(最小量化失真最小量化失真)。7.2 7.2 矢量量化的基本原理矢量量化的基本原理 标量量化是对信号的单个样本或参数的幅度进行标量量化是对信号的单个样本或参数的幅度进行量化;标量是指被量化的变量,为一维变量。量化;标量是指被量化的变量,为一维变量。矢量量化的过程是将语音信号波形的矢量量化的过程是将语音信号波形的K K个样点的个样点的每一帧,或有每一帧,或有K K个参数的每一参数帧构成个参数的每一参数帧构成K K维空间的维空间的一个矢量,然后对这个矢量进行量化。一个矢量,然后对这个矢量进行量化。标量量化可以说是标量量化可以说是K K1 1的矢量量化。矢量量化的矢量量化。矢量量化过
6、程和标量量化过程相像。将过程和标量量化过程相像。将K K维无限空间划分为维无限空间划分为M M个区域边界,然后将输入矢量与这些边界进行比较,个区域边界,然后将输入矢量与这些边界进行比较,并被量化为并被量化为“距离距离”最小的区域边界的中心矢量值。最小的区域边界的中心矢量值。矢量量化的定义矢量量化的定义 将信号序列将信号序列 的每的每K个连续样点分个连续样点分成一组,形成成一组,形成K维欧式空间中的一个矢量,维欧式空间中的一个矢量,矢量量化就是把这个矢量量化就是把这个K维输入矢量维输入矢量X映射成映射成另一个另一个K维量化矢量。其中量化矢量构成的维量化矢量。其中量化矢量构成的集合集合 称为码书或
7、码本,码书中的每称为码书或码本,码书中的每个矢量个矢量 称为码字或者码矢。称为码字或者码矢。以以K K2 2进行说明:进行说明:当当K K2 2时,所得到的是二维矢量。全部可能时,所得到的是二维矢量。全部可能的二维矢量就形成了一个平面。的二维矢量就形成了一个平面。记为(记为(a1,a2a1,a2),全部可能的(全部可能的(a1,a2a1,a2)就是一个二维空间。如图就是一个二维空间。如图7-17-1(a a)所示)所示图图7-1 7-1 矢量量化概念示意图矢量量化概念示意图 矢量量化就是将这个平面划分为矢量量化就是将这个平面划分为M M块块S1S1,S2S2,SiSMSiSM,然后从每一块中找
8、出代表值,然后从每一块中找出代表值YiYi(i i1 1,2.M2.M),这就构成一个有),这就构成一个有M M个区间的二维矢量量化个区间的二维矢量量化器。图器。图7-17-1(b b)所示的是一个)所示的是一个7 7区间的二维矢量量化区间的二维矢量量化器,即器,即K K2 2,M M7 7。通常这些代表值通常这些代表值YiYi称为量化矢量。称为量化矢量。对一个矢量对一个矢量X X进行量化,首先选择一个合适的失进行量化,首先选择一个合适的失真测度,然后用最小失真原理,分别计算用量化矢真测度,然后用最小失真原理,分别计算用量化矢量量YiYi替代替代X X所带来的失真。所带来的失真。其中最小失真值
9、所对应的那个量化矢量,就是矢其中最小失真值所对应的那个量化矢量,就是矢量量X X的重构矢量(或复原矢量)。的重构矢量(或复原矢量)。全部全部M M个量化矢量构成的集合个量化矢量构成的集合 称为码书称为码书或码本;或码本;把码书中的每个量化矢量把码书中的每个量化矢量YiYi(i i1 1,2.M2.M)称为码字或码矢。)称为码字或码矢。不同的划分或不同的量化矢量选取就可以构不同的划分或不同的量化矢量选取就可以构成不同的矢量量化器。成不同的矢量量化器。注:依据仙农信息论,矢量越长越好。实际中注:依据仙农信息论,矢量越长越好。实际中码书是不完备的,即矢量数是有限的,而对于码书是不完备的,即矢量数是有
10、限的,而对于任何一个实际应用来说,矢量通常是无限的。任何一个实际应用来说,矢量通常是无限的。在实际运用中,输入矢量和码书中码字不匹配在实际运用中,输入矢量和码书中码字不匹配的状况下,这种失真是允许的。的状况下,这种失真是允许的。存在的问题存在的问题 一、如何划分一、如何划分M M个区域边界。个区域边界。方法是:将大量欲处理的信号的矢量进行统支配分,方法是:将大量欲处理的信号的矢量进行统支配分,进一步确定这些划分边界的中心矢量值来得到码书。进一步确定这些划分边界的中心矢量值来得到码书。二、如何确定两矢量在进行比较时的测度。二、如何确定两矢量在进行比较时的测度。这个测度就是两矢量间的距离,或以其中
11、某一矢这个测度就是两矢量间的距离,或以其中某一矢量为基准时的失真度。它描述了当输入矢量用码书量为基准时的失真度。它描述了当输入矢量用码书所对应的矢量来表征时所付出的代价。所对应的矢量来表征时所付出的代价。图图7-2 7-2 矢量量化系统的组成矢量量化系统的组成 工作过程:工作过程:在编码端,输入矢量在编码端,输入矢量XiXi与码书中的每一个码字与码书中的每一个码字进行比较,分别计算出它们的失真。搜寻到进行比较,分别计算出它们的失真。搜寻到失真最小的码字失真最小的码字 的序号的序号 (或该码字所在(或该码字所在码书中的地址),这些序号就作为传输或存码书中的地址),这些序号就作为传输或存储的参数。
12、储的参数。在复原时,依据此序号从复原端的码书中找出在复原时,依据此序号从复原端的码书中找出相应的码字相应的码字 。由于两本码书完全相同,此。由于两本码书完全相同,此时失真最小,所以时失真最小,所以 就是输入矢量就是输入矢量XiXi的重构的重构矢量。矢量。特点:特点:传输存储的不是矢量本身而是其序号,所以传输存储的不是矢量本身而是其序号,所以据有高保密性能据有高保密性能收发两端没有反馈回路,因此比较稳定收发两端没有反馈回路,因此比较稳定矢量量化器的关键是编码器的设计,译码器矢量量化器的关键是编码器的设计,译码器只是简洁的的查表过程。只是简洁的的查表过程。矢量量化的性能指标除了码书的大小矢量量化的
13、性能指标除了码书的大小M M以外以外还有由于量化而产生的平均信噪比。还有由于量化而产生的平均信噪比。矢量量化的准则:在给定码本大小矢量量化的准则:在给定码本大小K K时使量时使量化所造成的失真最小。化所造成的失真最小。矢量量化的设计:从大量信号样本中训练出矢量量化的设计:从大量信号样本中训练出好的码书,从实际效果动身找寻最好的失真测好的码书,从实际效果动身找寻最好的失真测度定义公式,设计出最佳的矢量量化系统,以度定义公式,设计出最佳的矢量量化系统,以便用最少的搜寻和计算失真的计算量,来实现便用最少的搜寻和计算失真的计算量,来实现最大可能的平均信噪比。最大可能的平均信噪比。7.3 7.3 失真测
14、度失真测度 前面我们讲过设计矢量量化器的关键前面我们讲过设计矢量量化器的关键是编码器的设计。而在编码的过程中,就是编码器的设计。而在编码的过程中,就须要引入失真测度的概念。须要引入失真测度的概念。失真测度(距离测度):是将输入矢量失真测度(距离测度):是将输入矢量XiXi用码用码本重构矢量本重构矢量YiYi来表征时所产生的误差或失真的度量来表征时所产生的误差或失真的度量方法,它可以描述两个或多个模型矢量间的相像程方法,它可以描述两个或多个模型矢量间的相像程度。度。1p84 1p84 失真测度是矢量量化和模式识别中一个失真测度是矢量量化和模式识别中一个特别重要的问题,选择合适与否干脆影响系特别重
15、要的问题,选择合适与否干脆影响系统的性能。统的性能。失真是将输入信号矢量用码书的重构矢量来表征失真是将输入信号矢量用码书的重构矢量来表征时的误差或所付出的代价。这种代价的统计平均值时的误差或所付出的代价。这种代价的统计平均值(平均失真)描述了矢量量化器的工作性。(平均失真)描述了矢量量化器的工作性。失真度选择必需具备的特性失真度选择必需具备的特性必需在主观评价上有意义,即小的失真应当对应于好必需在主观评价上有意义,即小的失真应当对应于好的主观语音质量;的主观语音质量;必需是易于处理的,即在数学上易于实现,这样可以必需是易于处理的,即在数学上易于实现,这样可以用于实际的矢量量化器的设计;用于实际
16、的矢量量化器的设计;平均失真存在并且可以计算;平均失真存在并且可以计算;易于硬件实现易于硬件实现 失真测度主要有均方误差失真测度(即欧氏距失真测度主要有均方误差失真测度(即欧氏距离)、加权的均方误差失真测度、板仓斋藤离)、加权的均方误差失真测度、板仓斋藤(ItakuraItakuraSaitoSaito)距离,似然比失真测度等,还)距离,似然比失真测度等,还有人提出的所谓的有人提出的所谓的“主观的主观的”失真测度。失真测度。一、欧氏距离均方误差一、欧氏距离均方误差 设输入信号的某个设输入信号的某个K K维矢量维矢量X X,与码书中某个,与码书中某个K K维矢量维矢量Y Y进行比较,进行比较,x
17、 xi i,y,yi i分别表示分别表示X X和和Y Y中的各元素中的各元素 ,则定义均方误差为欧氏距离:,则定义均方误差为欧氏距离:几种其他常用的欧氏距离:几种其他常用的欧氏距离:1.1.r r方平均误差方平均误差 2.r2.r平均误差平均误差 3.3.确定值平均误差确定值平均误差 4.4.最大平均误差最大平均误差 二、线性预料失真测度二、线性预料失真测度 用全极模型表示的线性预料方法,广泛应用于语用全极模型表示的线性预料方法,广泛应用于语音信号处理中。它在分析时得到的是模型的预料系数音信号处理中。它在分析时得到的是模型的预料系数.仅由预料系数的差值,不能完全表征这两个语音信息仅由预料系数的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 处理 概要 优秀 PPT
限制150内