第五章 信源编码.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第五章 信源编码.ppt》由会员分享,可在线阅读,更多相关《第五章 信源编码.ppt(128页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 信源编码信源编码信源编码信源编码信源编码是以提高通信的有效性为目的编码。信源编码是以提高通信的有效性为目的编码。通常通过压缩信源的冗余度来实现。通常通过压缩信源的冗余度来实现。采用的一般方法是压缩每个信源符号的平均比采用的一般方法是压缩每个信源符号的平均比特数或信源的码率。同样多的信息用较少的码特数或信源的码率。同样多的信息用较少的码率来传送,使单位时间内传送的平均信息量增率来传送,使单位时间内传送的平均信息量增加,从而提高通信的有效性。加,从而提高通信的有效性。信源编码的基本途径有两个:信源编码的基本途径有两个:使序列中的各个符号尽可能地互相使序列中的各个符号尽可能地互相独立,
2、即解除相关性;独立,即解除相关性;使编码中各个符号出现的概率尽可使编码中各个符号出现的概率尽可能地相等,即概率均匀化。能地相等,即概率均匀化。信源编码的基础是信息论中的两个编码定理:信源编码的基础是信息论中的两个编码定理:无失真编码定理无失真编码定理 限失真编码定理限失真编码定理 无失真编码无失真编码只适用于离散信源只适用于离散信源 对于连续信源,只能在失真受限制的情况下进对于连续信源,只能在失真受限制的情况下进行行限失真编码限失真编码下面介绍几种典型的离散信源编码方法。下面介绍几种典型的离散信源编码方法。a1,a2,aK为信源符号集,序列中每一个符号uml都取自信源符号集。b1,b2,bD是
3、适合信道传输的D个符号,用作信源编码器的编码符号。编码输出码字cm=cm1cm2 cmn,c mkb1,b2,bD k=1,2,n ,n表示码字长度,简称码长码长 信源符号 a1,a2,aK 信道符号(码符号)b1,b2,bD图5-1 信源编码器模型信源信源 信源编码器信源编码器 一般来说,信源编码可归纳为如图5-1所示的模型。消息ui=ui1ui2 uiL 码字ci=ci1ci2 cin 信源编码可看成是从信源符号集到码符号集的一种映射,即将信源符号集中的每个元素(可以是单符号,也可以是符号序列)映射成一个长度为n的码字。对于同一个信源,编码方法是多种的。【例例】用u1,u2,u3,u4表示
4、信源的四个消息,码符号集为0,1,表5-1列出了该信源的几种不同编码。表5-1同一信源的几种不同编码信 源消息各消息概率码1码2码3码4u1q(u1)000001u2q(u2)1101110u3q(u3)101000100u4q(u4)1111111000码的分类3.变长码变长码若码字集合C中的所有码字cm(m=1,2,M),其码长不都相同,称码C为变长码,表5-1中列出的码3、码4就是变长码。2.等长码等长码在一组码字集合C中的所有码字cm(m=1,2,M),其码长都相同,则称这组码C为等长码,表3-1中列出的码1、码2就码长n=2等长码。一般,可以将码简单的分成如下几类:1.二元码二元码若
5、码符号集为0,1,则码字就是二元序列,称为二元码,二元码通过二进制信道传输,这是数字通信和计算机通信中最常见的一种码,表5-1列出的4种码都是二元码。5.非奇异码非奇异码从信源消息到码字的影射是一一对应的,每一个不同的信源消息都用不同的码字对其编码,例表5-1中的码2、码3和码4都是非奇异码。4.奇异码奇异码对奇异码来说,从信源消息到码字的影射不是一一对应的。例表5-1中的码1,信源消息u2和u4都用码字11对其编码,因此这种码就是奇异码,奇异码不具备惟一可译性。扩展信源信源编码器 信源符号 a1,a2,aK 信道符号(码符号)b1,b2,bD消息u1 uN=(u11u12 u1L)(uN1u
6、N2 uNL)N次扩展码字 c1 cN=(c11c12 c1n)(cN1cN2 cNn)图5-2 N次扩展信源编码器模型原码的N次扩展码是将信源作N次扩展得到的新信源符号序列u(N)=u1 uN =(u11u12 u1L)(uN1uN2 uNL),对应码符号序列c(N)=c1 cN=(c11c12 c1n)(cN1cN2 cNn),记集合C(N)=c1(N),c2(N),,C(N)即原码C的N次扩展码。6.原码原码C的的N次扩展码次扩展码原码C的N次扩展码中的每个元素是N次扩展信源中的序列所对应的N个码字组成的序列。对于定长码,若原码是惟一可译码,则它的N次扩展码也是惟一可译的,而对于变长码则
7、不尽然,见表5-2。信源消息各消息概率码1码2码3u1q(u1)011u2q(u2)11001u3q(u3)00100001u4q(u4)1110000001表5-2同一信源的几种不同变长编码表5-2同一信源的几种不同变长编码7.惟一可译码惟一可译码定义定义5.1 如果码的任意如果码的任意N次扩展码都是非奇异码,则称该码为次扩展码都是非奇异码,则称该码为惟一可译码。惟一可译码。8.即时码即时码对于变长码,又有如下定义定义定义5.2 对于码字对于码字c=c1 c2 cn,称称c、=c1 c2 ci(i n)为码字为码字c的字头(前缀)。的字头(前缀)。定义定义5.3 若码中任一码字都不是另一码字
8、的字头,称该码为异字头码(无前缀码)。表5-3中码3,收到“1”后就知道一个码字已经完结,无须等待下一个符号抵达,所以无前缀码能够即时译码,称之为即时可译码,简称即时码即时码。而对于码2,收到“1”后,并不能立即做出判决,就是收到“10”也不能立即做出判决,则还要收到下面的码元才能做出判决。所以非异字头码不能即时译码,称为非非即即时时码码,由于非异字头码的其中一些码字是另一些码字的延长,故也称延长码。显然,即时码是惟一可译码,而惟一可译码不一定是即时码。即时码可用树图法来构造。图5-3 用树图法编码树根编码深度u1:1u2:01u3:001u4:000110u1u2u3u411100【例例】用
9、树图法表示表5-2中的码3,如图5-3所示(D=2)。码奇异码非奇异码非惟一可译码惟一可译码变长码等长码即时码延长码图5-5 码的分类结构图图5-5是码的分类结构图由上面的结构图可看出,将码分为奇异码和非奇异码两大类,我们只讨论非奇异码。非奇异码又分为惟一可译码和非惟一可译码两大类,我们只讨论惟一可译码。平均码长的计算平均码长的计算对于变变长长码码,码集C的平均码长,用符号 表示,定义为码C中每个码字cm(m=1,2,,M)其码长的概率加权平均值为 (3-1)式中nm是码字cm所对应的码字的长度,p(cm)是码字cm出现的概率。对于等等长长码码,由于码集C中的每个码字的码长都相同,平均码长就等
10、于每个码字的码长KpkpkKmmmmm=11)()(c cc c【例例】给定信源 ,为提高传输效率,使平均码长尽可能短,遵照概率大取码长短,概率小取码长长的原则对上述信源进行二进制不等长编码,得到 ,求编码后的信息传输率R。(比特/符号)(码元/符号)等长码及等长编码定理等长码及等长编码定理考虑对一简单信源S进行等长编码,信源符号集有n个符号,码符号集含m个符号,码字长度记为K。要得到惟一可译码,必须满足下式nmK对单符号信源S的L次扩展信源S(L)进行等长编码,要得到长为K的惟一可译码,必须满足n L mK (5-5)对式(5-5)两边取对数,得 (5-6)对于那些出现概率极小的字符序列不予
11、编码,这样可以减小平均码长,当然这样会带来一定的失真当然这样会带来一定的失真。下面的定理 将证明,当满足一定的条件时,在L 时,失真pe 0译码定长编码定理:定长编码定理:11反之2编码效率:编码效率:变长码及变长编码定理变长码及变长编码定理 变长码变长码 对变长码的讨论是在L足够大的条件下得到的结论,当L为有限值时,则总会带来一定程度的失真。对于变长码,往往在L不是很大的情况下就可编出高效且无失真的码。变长码也要求原码的任意L次扩展码也是惟一可译的。变长码分为即时码和延长码,为保证即时译码,要求变长惟一可译码采用即时码。对于变长码,要求整个码集的平均码长力求最小,此时编码效率最高。对于给定信
12、源,使平均码长达到最小的编码方法,称为最最佳佳编编码码,得到的码集称为最佳码最佳码。克拉夫特不等式克拉夫特不等式 定定理理5.2 m进制码字集合C=c1,c2,cM,码集中每一ci(i=1,2,M)都是一个m进制符号串,设c1,c2,cM 对应的码长分别是k1,k2,kM,则存在唯一可译码的充要条件是 (5-10)式(5-10)也称克拉夫特不等式克拉夫特不等式 定理5.2只是说是存在惟一可译码的充要条件,这里强调的是“存在”,但它并不是唯一可译码的充要条件,换言之,惟一可译码一定满足克拉夫特不等式,反之,满足克拉夫特不等式的码不一定是惟一可译码。变长编码定理变长编码定理 定定理理5.3 给定熵
13、为H(X)的离散无记忆信源,及有m个元素的码符号集,则总可找到一种无失真编码方法,构成惟一可译码,其平均码长 满足:(5-19)定理定理5.4 变长编码定理变长编码定理(Shannon第一定理第一定理)给定熵为H(X)的离散无记忆信源 ,其L次扩展信源 的熵记为H(X),给定有m个元素的码符号集,对扩展信源进行编码,总可以找到一种惟一可译码,使码长 满足 (5-23)记 为信源每个符号所对应的平均码字数,则式(5-23)为 (5-24)Shannon第一定理的物理意义在于:对信源进行编码,使使编编码码后后的的码码集集中中各各码码字字尽尽可可能能等等概概分分布布,如如果果将将这这码码集集看看成成
14、为为一一个新的信源,这时新信源所含信息量最大。个新的信源,这时新信源所含信息量最大。编码效率编码效率 (5-26)是一个无量纲的数,一般情况下1,在极限情况下=1。5.1 5.1 离散信源编码离散信源编码 5.2 5.2 连续信源编码连续信源编码 5.3 5.3 相关信源编码相关信源编码 5.4 5.4 变换编码变换编码5.1.45.1.4 赫夫曼编码赫夫曼编码5.1.35.1.3 费诺编码费诺编码5.1.55.1.5 游程编码游程编码5.1.65.1.6 冗余位编码冗余位编码5.1.1 5.1.1 码字唯一可译的条件码字唯一可译的条件5.1.25.1.2 香农编码香农编码如何分离码字?如果0
15、,01都是码字,译码时如何分离?判断以下码字是否可分离?例2.4.1 对离散无记忆信源,消息长度为L,符号熵为H(X),对信源进行m元变长编码,一定存在无失真的信源编码方法,满足:满足:其码字平均长度其码字平均长度K满足:满足:其码字平均信息率其码字平均信息率R R5.1.45.1.4 赫夫曼编码赫夫曼编码5.1.35.1.3 费诺编码费诺编码5.1.55.1.5 游程编码游程编码5.1.65.1.6 冗余位编码冗余位编码5.1.1 5.1.1 码字唯一可译的条件码字唯一可译的条件5.1.2 5.1.2 香农编码香农编码5.1.2 香农编码香农编码设有离散无记忆信源设有离散无记忆信源1234香
16、农编码方法的步骤香农编码方法的步骤按信源符号的概率从大到小的顺序排队不妨设不妨设例例设有一单符号离散无记忆信源设有一单符号离散无记忆信源试对该信源编二进制香农码。试对该信源编二进制香农码。编码过程编码过程(1)5.1.45.1.4 赫夫曼编码赫夫曼编码5.1.3 5.1.3 费诺编码费诺编码5.1.55.1.5 游程编码游程编码5.1.65.1.6 冗余位编码冗余位编码5.1.1 5.1.1 码字唯一可译的条件码字唯一可译的条件5.1.25.1.2 香农编码香农编码5.1.3 5.1.3 费诺编码费诺编码对概率按m进行分组,使每组概率尽可能相等给每个分组分配一个码元对每个分组重复2、3步,直到
17、不可分为止1234按信源符号的概率从大到小的顺序排队不妨设不妨设设有一单符号离散无记忆信源设有一单符号离散无记忆信源试对该信源编二进制费诺码。试对该信源编二进制费诺码。例例编码过程编码过程 可以看出本例中费诺码有较高的编码效率。可以看出本例中费诺码有较高的编码效率。费诺码比较适合于每次分组概率都很接近的信源。费诺码比较适合于每次分组概率都很接近的信源。树图树图:5.1.4 5.1.4 赫夫曼编码赫夫曼编码5.1.35.1.3 费诺编码费诺编码5.1.55.1.5 游程编码游程编码5.1.65.1.6 冗余位编码冗余位编码5.1.1 5.1.1 码字唯一可译的条件码字唯一可译的条件5.1.25.
18、1.2 香农编码香农编码将信源符号按概率由大到小顺序排队给两个概率最小的符号各分配一个码位,将其概率相加后合并作为一个新的符号,与剩下的符号一起,再重新排队给缩减信源中概率最小的符号各分配一个码元重复步骤2、3直至概率和为121435.1.4 5.1.4 赫夫曼编码赫夫曼编码设有一单符号离散无记忆信源设有一单符号离散无记忆信源试对该信源编二进制哈夫曼码。试对该信源编二进制哈夫曼码。例例编码过程编码过程说明:说明:Huffman码的编码方法不是唯一的。首先,每码的编码方法不是唯一的。首先,每次对缩减信源两个最小的符号分配次对缩减信源两个最小的符号分配“0”和和“1”码码元试任意的,所以可得到不同
19、的码字。只要在元试任意的,所以可得到不同的码字。只要在各次缩减信源中保持码元分配的一致性,即能各次缩减信源中保持码元分配的一致性,即能得到可分离码字。不同的码元分配,得到的具体得到可分离码字。不同的码元分配,得到的具体码字不同,但码长,平均码长都不变,所以没有码字不同,但码长,平均码长都不变,所以没有本质区别。其次,若合并后的新符号的概率与其本质区别。其次,若合并后的新符号的概率与其他符号的概率相等,从编码的方法上来说,这几他符号的概率相等,从编码的方法上来说,这几个符号的次序可任意排列,编出的码都是正确的,个符号的次序可任意排列,编出的码都是正确的,但得到的码字不同。不同的编法得到的码字长度
20、但得到的码字不同。不同的编法得到的码字长度也不尽相同。也不尽相同。对信源进行缩减时,两个概率最小的符号合对信源进行缩减时,两个概率最小的符号合并后的概率与其它信源符号的概率相同时,这并后的概率与其它信源符号的概率相同时,这两者在缩减信源中进行概率排序,其位置放置两者在缩减信源中进行概率排序,其位置放置次序是可以任意的,故会得到不同的哈夫曼码。次序是可以任意的,故会得到不同的哈夫曼码。此时将影响码字的长度,一般将此时将影响码字的长度,一般将合并的概率放合并的概率放在上面在上面,这样可获得,这样可获得较小的码方差较小的码方差。如下面的例子如下面的例子例例 设有离散无记忆信源设有离散无记忆信源用两种
21、不同的方法对其编二进制用两种不同的方法对其编二进制huffmanhuffman码码方法一方法一方法二方法二信源符号信源符号xi概率概率p(xi)码字码字Wi1码长码长Ki1码字码字Wi2码长码长Ki2x10.411002x20.2012102x30.20003112x40.1001040103x50.1001140113两种不同的编码方法得到的码字和码长的对比两种不同的编码方法得到的码字和码长的对比平均码长和编码效率平均码长和编码效率两种编码方法编出的码字的码长方差比较两种编码方法编出的码字的码长方差比较可以看出第二种编码方法的码长方差要小可以看出第二种编码方法的码长方差要小许多。这意味着第二
22、种编码方法的码长变许多。这意味着第二种编码方法的码长变化较小,比较接近平均码长。由此可以得化较小,比较接近平均码长。由此可以得到一个结论到一个结论(怎样得到码方差较小的怎样得到码方差较小的huffmanhuffman编码编码)。结论:结论:进进行行赫赫夫夫曼曼编编码码时时,为为得得到到码码方方差差最最小小的的码码,应应使使合合并并的的信信源源符符号号位位于于缩缩减减信信源源序序列列尽尽可可能能高高的的位位置置上上,以以减减少少再再次次合合并并的的次数,充分利用短码。次数,充分利用短码。5.1.45.1.4 赫夫曼编码赫夫曼编码5.1.3 5.1.3 费诺编码费诺编码5.1.5 5.1.5 游程
23、编码游程编码5.1.65.1.6 冗余位编码冗余位编码5.1.1 5.1.1 码字唯一可译的条件码字唯一可译的条件5.1.25.1.2 香农编码香农编码5.1.5 游程编码游程编码 前面的几种编码方法主要时针对无记忆信源,对有前面的几种编码方法主要时针对无记忆信源,对有记忆信源,这些编码方法的效率并不高,特别是对二记忆信源,这些编码方法的效率并不高,特别是对二元相关信源,需要一些其它的方法。游程编码就是这元相关信源,需要一些其它的方法。游程编码就是这样的方法,对相关信源的编码更有效。样的方法,对相关信源的编码更有效。游程:游程:指数字序列中连续出现相同符号的一段。在指数字序列中连续出现相同符号
24、的一段。在二元信源中,连续的一段二元信源中,连续的一段00称为一个称为一个00游程,游程,00的个数称为此游程的长度,同样,也有的个数称为此游程的长度,同样,也有11游游程。程。游程序列:游程序列:用交替出现的用交替出现的00游程、游程、11游程的游程的长度,来表示任意二元序列而产生的一个新序列。它长度,来表示任意二元序列而产生的一个新序列。它和二元序列是一个一一对应的变换。和二元序列是一个一一对应的变换。00010111001000131132131若已知若已知二元序列二元序列以以0起始,从游程序列很起始,从游程序列很容易恢复成原来的二元序列容易恢复成原来的二元序列 游程序列是多元序列,各长
25、度可按游程序列是多元序列,各长度可按赫夫赫夫曼编码曼编码或其它方法处理以达到压缩码率或其它方法处理以达到压缩码率的目的。的目的。多元序列也存在相应的游程序列多元序列也存在相应的游程序列 多元序列变换成游程序列再进行压缩编多元序列变换成游程序列再进行压缩编码没有多大意义码没有多大意义 游游程编码只适用于二元序列,对于多游游程编码只适用于二元序列,对于多元信源,一般不能直接利用游程编码元信源,一般不能直接利用游程编码 因为游程变换是一一对应的可逆变换,所以游程变换后,熵不变。组合编码可获得较高的编码效率:游程编码赫夫曼编码5.1.45.1.4 赫夫曼编码赫夫曼编码5.1.3 5.1.3 费诺编码费
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五章 信源编码 第五 信源 编码
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内