语音编码及信道编码介绍.pptx
《语音编码及信道编码介绍.pptx》由会员分享,可在线阅读,更多相关《语音编码及信道编码介绍.pptx(97页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、5.1 概 述 5.1.1语音编码语音编码的基本方法可分为波形编码和参量编码两种。波形编码是将时域的模拟语音的(电压)波形信号经过取样、量化、编码而形成的数字语音信号。为了保证数字语音信号解码后的高保真度,取样速率应满足奈奎斯特取样定理,并且量化分层数要足够大。第1页/共97页在选择各种不同的数字语音编码方案时,应考虑以下一些基本要求:编码速率要低,语音质量要高;应有较强的抗噪声干扰和抗误码的性能;编译码时延应在几十毫秒以内;编译码器复杂度要低,便于大规模集成;功耗要小,以便适应手持机。第2页/共97页5.1.2信道编码著名的仙农(Shannon)定理为实现有效和可靠的通信奠定了理论基础。该定
2、理指出:在有噪声的信道环境下,只要信源的信息速率不超过信道容量,就可以找到一种编码方法,使信息的传输速率任意地逼近信道容量,而传输的错误概率任意地逼近于零,或者传输的失真度能够任意地逼近给定的要求。这里指出了信道编码在实现有效和可靠的通信方面的重要作用和地位,并从理论上为信道编码的发展指出了努力方向。第3页/共97页所谓信道编码,就是按一定的规律给待传送的数字序列d增加一些多余的码元,称之为监督码元。使不具有规律性的信息序列d变换为具有某种规律性的数字序列c,称之为码序列。经变换后得到的码序列的诸码元与多余码元之间是相关的;接收端的译码器则根据这种相关性来检测和纠正传输过程中产生的差错。第4页
3、/共97页信道编码的方法有许多种,一般可按下列方式分类:(1)按照信息码元和监督码元之间的约束方式不同,可分为分组码和卷积码。(2)按照信息码元与监督码元之间的关系又可分为线性码和非线性码。(3)按照编码后每个码字的结构可分为系统码和非系统码。(4)按照修正错误的类型不同,可以分为纠正随机错误和纠正突发错误的码。(5)按照码字中每个码元的取值不同,还可分为二进制码和多进制码等。第5页/共97页5.2 参量编码和声码器 5.2.1参量编码的基本原理1.语音信号产生人类的发音器官是一个相当复杂的系统。来自肺部的气流通过气管、喉部、声门进入口腔及鼻腔。口腔形成一个声道,并由舌头、下颌和嘴唇的位置决定
4、其形状。第6页/共97页图5-1及图5-2分别示出浊音及清音的频谱。从图中可以看出,浊音的频谱包络有三个峰值处,即共振峰频率。图中的小尖峰点,即基音fp的谐波,能量集中在其附近,相关性较强。清音的频谱包络没有共振峰和小尖峰点存在,时间波形特性没有准周期性。第7页/共97页图5-1浊音频谱第8页/共97页图5-2清音频谱第9页/共97页2.语音发声过程的物理模型根据对发音器官的构造和声音产生的机理的分析,图5-3(a)、(b)、(c)分别示出语音产生过程的机械模型、电路模型以及激励的功率谱和滤波器的频率响应特性。第10页/共97页图5-3语音产生过程的机械和电路模型(a)机械模型;(b)电路模型
5、;(c)激励功率谱和滤波器的频率响应第11页/共97页 图 5-3 语音产生过程的机械和电路模型(a)机械模型;(b)电路模型;(c)激励功率谱和滤波器的频率响应第12页/共97页5.2.2线性预测编码(LPC)线性预测分析法可十分精确地估算语音参数,而且速度快,因而获得了广泛的应用。线性预测是指一个语音的抽样值可用该样值以前若干个语音抽样值的线性组合来逼近。如果使二者的差值的平方和达到最小值,则可以决定惟一的一组预测器的加权系数。图5-4为语音产生模型的简化方框图。第13页/共97页图5-4语音产生模型的简化方框图第14页/共97页图5-5线性预测器及合成滤波器第15页/共97页应用上述线性
6、预测的分析与合成方法的语音编码,称为语音的线性预测编码(LPC)。线性预测编解码器的简化方框图如图5-6所示,图(a)为LPC编码器,图(b)为解码器。第16页/共97页图5-6线性预测编码器简化方框图第17页/共97页5.2.3规则脉冲激励长期预测LPC编码(RPE-LTP)1.线性预测编码的改进模型上述LPC编解码器能够保证在一定的可懂度条件下,使数码率降低到2.44.8kb/s。但也存在如下一些缺点:损失了语音自然度;抗噪声干扰能力差;谱包络的估值可产生很大的失真。产生这些缺点的原因主要是LPC没有将发端的余数(误差)信号送到收端去。第18页/共97页图5-7为几种不同激励语音合成模型的
7、简化方框图。图(a)为一般的LPC声码器;(b)为多脉冲激励线性预测编码(MP-LPC),它使用一个数目有限、幅度和位置可调整的脉冲序列作为激励源;图(c)为码激励线性预测编码(CELP),它使用一个波形的码矢量作为激励源。第19页/共97页图5-7不同激励语音合成模型简化方框图第20页/共97页图5-8(b)为合成分析编码器的工作原理方框图。其中由激励发生器、长时预测、短时预测合成语音,合成语音与原始语音比较得到误差,根据使均方误差最小为最佳的准则,来调整激励和长时及短时预测,并将均方误差为最小时的参数输出。图5-8(a)给出了三种激励源的信号波形:多脉冲激励信号、规则脉冲激励信号和码激励线
8、性预测编码(CELP)的码矢。第21页/共97页图5-8合成分析编码原理方框图第22页/共97页(1)多脉冲激励的LPC编码原理。多脉冲激励LPC编码器中的激励发生器产生具有一定位置和幅度的脉冲序列来激励声道。声道由长时延及短时延相关滤波器来模拟,从而合成语音。(2)规则脉冲激励的LPC编码原理。所谓规则脉冲激励,是指激励脉冲序列中脉冲的相对位置(间隔)不变,而只可改变幅度的激励源。第23页/共97页图5-9RPE编码激励源的可能模式第24页/共97页2.规则脉冲激励长期预测编解码器RPELTP线性预测编解码器即是具有长期预测的规则脉冲激励的线性预测编解码器。这种RPE-LTP线性预测编码方式
9、已用于泛欧GSM数字蜂房移动通信系统中,并作为GSM标准予以公布。下面分别介绍它的编码器和解码器。第25页/共97页1)RPE-LTP线性预测编码器图5-10(a)示出RPE-LTP线性预测编码器的方框图,它由预处理、LPC分析、短时分析滤波、长时预测和规则脉冲激励(RPE)编码5个部分组成。现将其各部分的功能分述如下。第26页/共97页图5-10RPE-LTP-LPC编/解码原理方框图第27页/共97页图 5-10 RPE-LTP-LPC编/解码原理方框图第28页/共97页(1)预处理。语音信号在预处理部分除去输入信号中的直流分量,并进行高频分量的预加重,以便更好地进行LPC分析。预加重采用
10、一阶FIR滤波器。(2)LPC分析。LPC分析的主要目的是从预处理后的语音信号(S)中提取LPC参数。(3)短时分析滤波。短时分析滤波的目的在于得出余量信号d。(4)长时预测。长时预测部分是一个长时预测器环路。第29页/共97页(5)规则脉冲激励(RPE)编码。RPF编码部分将长时预测得出的余量信号e进行规则脉冲序列提取及量化编码。第30页/共97页2)RPE-LTP线性预测解码器图5-10(b)为解码器方框图。图中粗体箭头表示收到的编码参数。RPE参数Mc、Mmaxc和Xmc;在解码器中用来重建长时余量信号e,以供长时预测滤波器产生激励信号d。短时合成(综合)滤波器将其用来恢复成语音信号S。
11、恢复的语音信号S在后处理部分经去加重后成为解码器最后输出的语音信号S0。第31页/共97页5.3 矢量和激励线性预测编码(VSELP)5.3.1矢量量化(VQ)编码矢量量化是把信号序列中的每K个样值作为一组,形成空间中的一个K维矢量,再对此矢量进行量化。矢量量化编码是将代表语音的矢量构成一个庞大的码本,发端做线性预测时,是在码本中找出预测误差信号最小所对应的样值组合的地址。第32页/共97页矢量量化编码的关键是建立一个好的码本。对码本的要求是:(1)码本中的样值组合应与实际语音信号相近;(2)码本应尽可能的小;(3)搜索码本的时间短。第33页/共97页5.3.2码激励线性预测编码(CELP)图
12、5-11为CELP的基本原理框图。与图5-8中MPLPC原理方框图比较,除激励部分不同外,其它部分都是一样的。在激励部分以N个样值为一组,构成一个N维矢量,用一个码字代表。若干个码字组成一定尺寸的码本,收、发端设置同样的码本。第34页/共97页图5-11CELP的基本原理方框图第35页/共97页图5-12(a)为码激励线性预测(CELP)编解码器的方框图。在编码器中,基本的分析过程是在码本中根据某些主观的差错判据去搜寻最佳码字(矢量)Ck。在解码器中根据收到的这些信息,合成出原始的语声来,参见图5-12(b)。从图中不难看出,解码器的结构实际上就是编码器的下半部分(即合成部分),其作用原理亦完
13、全相同。第36页/共97页图5-12CELP编解码器方框图第37页/共97页5.3.3矢量和激励线性预测编码(VSELP)VSELP是矢量和激励线性预测编码(Vector SumExcitedLPC)的缩写,它是矢量量化的一种具体编码方法。美国IS-54标准选用的就是VSELP。它采用的码本为事先确定好的结构,从而避免了全搜索过程,大大减少了寻找最佳码字的时间。这种编码器用两个码本,分别用I及H命名。各由128个40维矢量构成。每一激励信号是由码本I、H及长时预测时延L三者之和所决定,故称矢量和激励。图5-13为VSELP编解码器的方框图。第38页/共97页图5-13VSELP编解码器方框图第
14、39页/共97页图5-13VSELP编解码器方框图第40页/共97页5.4 线 性 分 组 码 5.4.1线性分组码的特点线性分组码是信道编码中最基本的一类码。在线性分组码中,监督码元仅与所在码组中的信息码元有关,且两者之间是通过预定的线性关系联系起来的。第41页/共97页在(n,k)码中,对于k个信息元。有2k种不同的信息组,则有2k个码字分别与之一一对应,每个码字长n。这些码组的集合构成代数中的群,因此又称为群码或块码。它具有下面的性质:(1)任意两个码字之和(模2和)仍为一个码字,即具有封闭性。(2)码的最小距离等于非零码的最小重量。第42页/共97页5.4.2线性分组码的生成如前面所述
15、,(n,k)线性码中(n-k)个附加的监督码元是由信息码元的线性运算产生的,下面以(7,4)码为例来说明如何构造这种线性分组码。(7,4)码中,每一个长度为4的信息分组经编码后变换成长度为7的码组,我们用C6C5C4C3C2C1C0表示这7个码元,其中C6C5C4C3为信息码元,C2C1C0为监督码元。监督码元可按下面方程组计算:C2=C6+C5+C4C1=C6+C5+C3C0=C6=C4+C3(5-1)第43页/共97页表5-1(7,4)分组码编码表第44页/共97页式(5-1)的监督方程可以改写为 C6+C5+C4+C2=0 C6+C5+C3+C1=0 C6+C4+C3+C0=0(5-2)
16、进一步,写成矩阵形式为(5-3)第45页/共97页记作或(5-4)其中 C=C6 C5 C4 C3 C2 C1 C0 0=0 0 0第46页/共97页H称为监督阵,是一个37矩阵。注意到H的后三列组成一个33阶单位子阵I,H的其余部分用Q表示,则 H=QI (5-5)第47页/共97页从线性分组码的性质可知,(n,k)线性码的2k个码字构成n维线性空间中的一个k维子空间,编码的实质就是要在n维线性空间中,找出一组长为n的k个线性无关的矢量g0g1gk-1,使得每个码字C都可以表示为这k个矢量的线性组合,即C=mk-1g0+mk-2g1+m0gk-1(5-6)式中,mi0,1,i=0,1,k-1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 编码 信道编码 介绍
限制150内