第四章 无失真信源编码优秀PPT.ppt
《第四章 无失真信源编码优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四章 无失真信源编码优秀PPT.ppt(106页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章 无失真信源编码第一页,本课件共有106页 本章主要讨论对离散信源进行无失真信源编码本章主要讨论对离散信源进行无失真信源编码的要求、方法及理论极限的要求、方法及理论极限,并得出香农第一极限定并得出香农第一极限定理,同时学习几种常见的无失真信源编码方法。理,同时学习几种常见的无失真信源编码方法。主主 要要 内内 容容4.1 4.1 信源编码概述信源编码概述4.2 4.2 等长码及等长信源编码定理等长码及等长信源编码定理4.3 4.3 变长码及变长信源编码定理变长码及变长信源编码定理4.4 4.4 常见无失真信源编码方法常见无失真信源编码方法第二页,本课件共有106页4.1 4.1 信源编码
2、概述信源编码概述 实际信源的信源符号之间总存在相关性和分布的不均匀性,使得信源存在冗余度。信源编码的目的是要减少冗余,提高编码效率。信源编码的基本途径有两个:一是编码后使序列中的各个符号之间尽可能地互相独立,即解除相关性,方法包括预测编码和变换编码。二是使编码后各个符号出现的概率尽可能相等,即均匀化分布,方法主要是统计编码。4.1 4.1 信源编码概述信源编码概述第三页,本课件共有106页4.1 4.1 信源编码概述信源编码概述信源编码:信源编码:将信源符号序列按一定的数学规律映射成由码符号组成的码序列的过程。信源编码就要压缩信源输出符号的比特率。信源译码:信源译码:根据码序列恢复信源序列的过
3、程。两类信源编码:两类信源编码:无失真和限失真信源编码。无失真信源编码:无失真信源编码:即信源符号可以通过编码序列无差错地恢复,主要用于文字、数据信源的压缩(适用于离散信源的编码)。限失真信源编码:限失真信源编码:信源符号不能通过编码序列无差错地恢复(可以把差错限制在某一个限度内),主要用于图像、语音信源的压缩。第四页,本课件共有106页4.1 4.1 信源编码概述信源编码概述4.1.1 4.1.1 编码器编码器 编码编码可以看作是对信源原始符号按照一定的数学规则进行的一种变换,信源编码器模型如下:S为信源符号集合,X为码符号集合。编码器的作用是将信源符号集合中的符号si(或信源符号序列)变换
4、成由码符号集合中的码符号序列输出。第五页,本课件共有106页4.1 4.1 信源编码概述信源编码概述 编码器的输出符号序列称为码字码字,码符号也可以叫作码元,码元,码字的集合称为码组码组(或者叫码或者叫码),用C表示。码字的长度称为码长码长。码组Wi码字li码长 可见,编码就是从信源符号(信源符号序列)到码符号序列的一种映射。若要实现无失真编码,这种编码的映射必须是一一对应的而且是可逆的。第六页,本课件共有106页4.1 4.1 信源编码概述信源编码概述4.1.2 4.1.2 码的分类码的分类 根据编码器中码符号集合X中码元的个数不同以及码字长度是否一致,编码有以下分类:1 1 二元码和二元码
5、和r元码元码 若码符号集X=0,1,编码所得码字为二元码二元码,数字通信与计算机系统常用。若码符号集共有r个元素,则所得之码称为r元码。元码。2 2 等长码等长码 若一组码中所有码字长度都相同称为等长码等长码。3 3 变长码变长码 若一组码中码字的码长各不相同,称为变长码变长码。第七页,本课件共有106页4 4 非奇异码和奇异码非奇异码和奇异码 若一组码中所有码字都不相同,则称为非奇异码非奇异码,反之,则为奇异码奇异码。如表中的“编码2”是奇异码,其他码是非奇异码。符号概率P(ai)编码1编码2 编码3 编码4编码5a11/4000001a21/401011001a31/81010011000
6、1a41/401111011100001a51/81110111111000014.1 4.1 信源编码概述信源编码概述所有码都是2元码,码1是等长码,也是奇异码;码2是变长码,也是奇异码,码3,4,5是变长码,但是非奇异码。第八页,本课件共有106页4.1 4.1 信源编码概述信源编码概述5 5 同价码同价码 若码符号集X=x1,x2,xr中每个码符号所占的传输时间都相同,则所得的码为同价码同价码。同价码中等长码每个码字的传输时间相同,而变长码每个码字的传输时间不一定相同。6 6 码的码的N次扩展码次扩展码 假定某一种编码,它把信源S=s1,s2,sq中的符号si一一变换成码C中的码字Wi,
7、则码C的N次扩展码是所有N个码字组成的码字序列的集合。例如:若码 满足:第九页,本课件共有106页4.1 4.1 信源编码概述信源编码概述 则码C的N次扩展码集合:其中:即码C的N次扩展码中,每个码字Bi与信源的N次扩展信源SN中的每个信源符号:是一一对应的。即:7 7 惟一可译码惟一可译码 若任意一串有限长的码符号序列只能被唯一地译成所对应的信源符号序列,则此码称为唯一可译码唯一可译码(或称单或称单义可译码义可译码)。否则称为非唯一可译码或非单义可译码。第十页,本课件共有106页4.1 4.1 信源编码概述信源编码概述 若要使某一码为惟一可译码,则对于任意给定的有限长的码符号序列,只能被惟一
8、地分割成一个个的码字。例如:对于二元码C1=1,01,00,当任意给定一串码字序列,例如“10001101”,只可唯一地划分为1,00,01,1,01,因此是唯一可译码;而对另一个二元码C2=0,10,01,当码字序列为“0100101”时,可划分为0,10,01,01或01,0,01,01,所以是非惟一可译的。惟一可译码又分为即时码和非即时码。即时码和非即时码。如果在接收端收到一个完整的码字后,就能立即进行译码,这样的码叫做即时码即时码;第十一页,本课件共有106页4.1 4.1 信源编码概述信源编码概述 当在接收端收到一个完整的码字后,还需等下一个码字接收后才能判断是否可以译码,这样的码叫
9、做非非即时码即时码。即时码又称为非延长码即时码又称为非延长码,对即时码而言,在码组中任意一个码字都不是其它码字的前缀部分。对非即时码来说,有的码是惟一可译的,有的码是非惟一可译的,主要取决于码的总体结构。例如:码组C=a1,a2,a3,a4=1,01,001,0001,对于码符号序列“10100100011001”,可译码为a1a2a3a4a1a3,因每见一个码字,不根据其后或其前的码符号即可进行译码,因此该码为即时码。第十二页,本课件共有106页4.1 4.1 信源编码概述信源编码概述4.1.3 4.1.3 简单信源编码器举例简单信源编码器举例1 1 二进制信源编码器二进制信源编码器ASCI
10、I ASCII(美国信息交换标准代码),是由美国国家标准协会(ANSI)开发的代码,是一个由7位二进数组成的字母、符号和命令代码。它存在多个变种。例如,可以增加1位校验位,变成8位。ASCII是PC机上使用的标准代码。第十三页,本课件共有106页4.1 4.1 信源编码概述信源编码概述2 2 摩尔斯信源编码器摩尔斯信源编码器 1836年,Samuel F.Morse(美国)发明了摩尔斯电码。曾在过去的通信中发挥过重要作用,至今仍被业余无线电爱好者和海上船只所使用。信源符号是英文字母,码符号集由“点”、“划”、“字母间隔”和“单词间隔”组成。编码器先将英文字母变成摩尔斯电码(信源编码I),再将摩
11、尔斯电码变成二进码(信源编码器II)。第十四页,本课件共有106页4.1 4.1 信源编码概述信源编码概述3 3 中文电报信源编码器中文电报信源编码器 中文电报信源编码器的信源符号是一万个常用汉字,一个汉字首先用一个四位十进来代表,而每个十进制数字再用5位二进制3:2的等重码来代表。该等重码含3个“1”和”2”个“0”,因此重量为3。所以存在45=20个5位二进3:2的等重码。例如,汉字“中”,在编码时,先编成一个四位十进数“0022”,再用4个5位二进3:2的等重码“01101 01101 11001 11001”来表示。第十五页,本课件共有106页4.2 4.2 等长信源编码定理等长信源编
12、码定理4.2 4.2 等长码及等长信源编码定理等长码及等长信源编码定理4.2.1 4.2.1 无失真编码条件无失真编码条件 对于定长码,只要非奇异就唯一可译。这就要求码字的数目不少于被编码的信源序列的个数。1 1 单信源符号编码单信源符号编码 设信源S包含信源q个符号,码符号集包含的符号数为r,对单信源符号进行定长编码,则信源S存在唯一可译码的条件为:qrl 其中l为码长.第十六页,本课件共有106页2 2 N长信源符号序列编码(长信源符号序列编码(N次扩展码)次扩展码)将q个信源符号的信源进行N次扩展,扩展信源的消息序列数为qN,则对扩展信源编成长度为l的码字,则编码唯一可译的条件是:qNr
13、l例如,英文字母26个加1个空格可看成共27个符号的信源。如对其单符号进行2元编码,设编码长度为l,则需满足:272l,则每个信源符号所需二进码(r=2)符号数为:取4.2 4.2 等长信源编码定理等长信源编码定理第十七页,本课件共有106页4.2.2 4.2.2 渐近等分割性及渐近等分割性及 典型序列典型序列设离散无记忆信源如下:其N次扩展信源如下:4.2 4.2 等长信源编码定理等长信源编码定理第十八页,本课件共有106页 当q为有限值时,DI(ai)方差为有限值。定理定理4.2.14.2.1渐进等分割性 若随机序列S1S2SN中Si(i=1,2,N)相互统计独立并且服从同一概率分布P(s
14、),又ai=(si1si2siN)S1S2SN,则4.2 4.2 等长信源编码定理等长信源编码定理第十九页,本课件共有106页证明:证明:因为相互独立的随机变量的函数也是相互独立的随机变量。因此Si(i=1,2,N)是彼此统计独立并服从同一概率分布p(s)的,所以-logP(Si)也是统计独立的随机变量,且有E-logp(s)=H(S)。4.2 4.2 等长信源编码定理等长信源编码定理第二十页,本课件共有106页可见,信源序列ai的自信息均值I(ai)/N以概率收敛于H(S)。当N为有限长,在所有的qN个长为N的序列中必有一些ai,其自信息量的均值与信源熵H(S)之差小于;而另一些信源序列ai
15、来说,I(ai)/N与信源熵H(S)之差大于。可以分为两类序列:4.2 4.2 等长信源编码定理等长信源编码定理第二十一页,本课件共有106页定理定理4.2.24.2.2 对于任意小的正数0,0,当N足够大时,则4.2 4.2 等长信源编码定理等长信源编码定理第二十二页,本课件共有106页证明:证明:(1)由定理4-1知由性质(2)可知,所有典型序列出现的概率近似相等,近似为 ,为渐近等概序列。4.2 4.2 等长信源编码定理等长信源编码定理第二十三页,本课件共有106页N次扩展信源中信源序列分为两大类:一类典型序列经常出现,当N时概率趋近于1。反之非典型序列则不经常出现。N时概率接近于0。4
16、.2 4.2 等长信源编码定理等长信源编码定理第二十四页,本课件共有106页4.2.3 4.2.3 等长信源编码定理等长信源编码定理 定理定理4.2.34.2.3(等长信源编码定理)离散无记忆信源其熵为H(S),对其N次扩展信源的N长信源序列进行长度为l的编码,若 只要满足则当N足够大时可实现几乎无失真编码,反之若不能实现无失真编码,N足够大时错误概率接近1。4.2 4.2 等长信源编码定理等长信源编码定理第二十五页,本课件共有106页证明思路:证明思路:只考虑对N次扩展信源中的典型序列进行编码,非典型序列则放弃,不编码。证明:证明:由前面定理可知典型序列个数为4.2 4.2 等长信源编码定理
17、等长信源编码定理如果只对典型序列进行编码,则只需要满足:第二十六页,本课件共有106页4.2 4.2 等长信源编码定理等长信源编码定理编码序列的个数r l少于典型序列的个数 ,则l长的编码序列只能对部分典型序列进行编码,即则其余的信源序列则没有对应的编码,若一旦出现,则会出错,即错误概率为第二十七页,本课件共有106页4.2 4.2 等长信源编码定理等长信源编码定理定理说明:定理说明:(1)定理是在平稳离散无记忆信源的条件下得到的,但是同样适用于平稳离散有记忆信源。此时信源熵用极限熵替换即可,即(2)若进行2元编码,则(3)将上式改写成 ,令R是编码后平均每个信源符号能载荷的最大信息量,称为编
18、码后的信息传输率。编码后的信息传输率。(4)编码效率编码效率第二十八页,本课件共有106页4.2 4.2 等长信源编码定理等长信源编码定理(5)当H(S)一定,信源序列长度N与最佳编码效率和允许错误概率有关。当DI(si)和均为定值,允许错误概率小于时,N满足通常通常,要想达到最佳编码效率且很小的错误概率要想达到最佳编码效率且很小的错误概率,往往需要很大往往需要很大的的N值值.即即要大要大和和P Pe e要小都需要要小都需要N N越大。越大。第二十九页,本课件共有106页4.2 4.2 等长信源编码定理等长信源编码定理 例例4-1 4-1 一离散无记忆信源的模型如下:要求采用二元编码,编码效率
19、为 ,差错率 试估计信源序列的最小长度N。解解:第三十页,本课件共有106页4.2 4.2 等长信源编码定理等长信源编码定理 例例4-24-2 设离散无记忆信源如下:若要对信源采用定长二元编码,要求编码效率90%,允许错误概率小于10-6,请问N最少需要多长。解解:要达到一定误码要求,信源序列长度需很长,编码器难于实现.第三十一页,本课件共有106页4.3 4.3 变长码及变长信源编码定理变长码及变长信源编码定理4.3 4.3 变长码及变长信源编码定理变长码及变长信源编码定理 由前面等长码信源编码定理可知,等长编码很难提高编码效率,除非增加N到很大,大到编码器很难实现。变长编码可以很好的解决这
20、个问题,变长编码往往在码符号序列长度不大时就可以编出效率很高且不失真的码。要实现无失真编码,则变长码必须是惟一可以惟一可以码码,即必须是非奇异码是非奇异码(且其任意有限长N次扩展码也应该是非奇异码),如果要能即时译码还必须是即时码。即时码。第三十二页,本课件共有106页4.3 4.3 变长码及变长信源编码定理变长码及变长信源编码定理4.3.1 4.3.1 唯一可译变长码与即时码唯一可译变长码与即时码 与等长编码一样,变长码也必须是唯一可译码才能实现无失真编码。变长码是非奇异的,其任意有限长N次扩展码也是非奇异的,则是唯一可译码唯一可译码。定义定义4.3.14.3.1 在唯一可译码中,若在译码时
21、不需要参考后续的码符号就能立即做出判断,译码成对应的信源符号,这类码称为即时码。即时码。定义定义4.3.2 4.3.2 设某码字称码符号序列 为码字 的前缀前缀(又称为词头词头);或称码字 是码符号序列的延长延长。第三十三页,本课件共有106页4.3 4.3 变长码及变长信源编码定理变长码及变长信源编码定理定义定义4.3.34.3.3 若码C中,没有任何完整的码字是其他码字的前缀,即设 是码C中的任一码字,而它不是其他码字 ,的前缀,则此码为非延长码非延长码或前缀条件码前缀条件码。可见,码为即时码的充要条件充要条件是没有任何完整的码字是其他码字的前缀。因此即时码就是前缀条件码,前缀条件码(非延
22、长码)也就是即时码。各种码的关系如图所有码非奇异码唯一可译码即时码第三十四页,本课件共有106页4.3 4.3 变长码及变长信源编码定理变长码及变长信源编码定理4.3.2 4.3.2 即时码的树图构造法即时码的树图构造法1 1 码树码树 对于给定的码字的集合,可以用树图来描述,称此树图为码树码树。第三十五页,本课件共有106页4.3 4.3 变长码及变长信源编码定理变长码及变长信源编码定理(1)树根树根为码树起点(根节点根节点),根节点根节点经n个树支的节点为n阶节点阶节点,最末树支对应的为终端节点。终端节点。(2)给每个节点的树支分配不同的r个码符号,从根节点到某终端节点所经过的树支所对应的
23、码符号序列就形成一个码字码字。(3)如果一个码树的各叶(终端节点)的阶数相同,则称为全树或整树全树或整树,否则为非全树非全树。(4)全树对应等长码等长码,非全树对应着变长码变长码。(5)每个节点对应的树支数为码树的元数元数。(5)r元码树中,n阶节点个数最多为rn,2进码树中,n阶节点数目最多为2n。第三十六页,本课件共有106页4.3 4.3 变长码及变长信源编码定理变长码及变长信源编码定理根节点根节点一阶节点一阶节点二阶节点二阶节点三阶节点三阶节点四阶节点四阶节点r=2二元码树二元码树r=3三元码树三元码树第三十七页,本课件共有106页4.3 4.3 变长码及变长信源编码定理变长码及变长信
24、源编码定理2 2 即时码的树图构造法即时码的树图构造法 即时码的一种简单构造方法是树图法。树图法。对于给定码字的全体集合 ,可以用码树码树来描述它。利用码树构造码字,将码树的某个节点取为码字,取码字以后的节点为终端节点终端节点,不再继续伸出树支。从根节点到终端节点之间的节点称为中间节点,中间节点不安排为码字,因此,由码树构成的码一定是即时码即时码(非非延长码延长码)。另外,当第i阶节点作为终端节点,且分配以码字,则这个码字的码长为i。第三十八页,本课件共有106页4.3 4.3 变长码及变长信源编码定理变长码及变长信源编码定理 例例4-34-3 分别用树图法构造码C1=0,10,110,111
25、0,C2=1,10,100,1000。01 01 0 011 00001011011101101001000码C2在构造时,取为码字的节点继续伸展树支,因此,前面码字为后面码字的前缀码,不满足前缀条件码,不是即时码。但仍为唯一可译码。由树图可知,码C1在构造时,取为码字以后即为终端节点,再不继续伸展树支,因此为即时码。第三十九页,本课件共有106页4.3 4.3 变长码及变长信源编码定理变长码及变长信源编码定理4.3.3 4.3.3 克拉夫特不等式克拉夫特不等式定理定理4.3.14.3.1 对于码符号数集为X=x1,x2,xr的任意r元即时码,其码字为W1,W2,Wq,相应码长度为l1,l2,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四章 无失真信源编码优秀PPT 第四 失真 信源 编码 优秀 PPT
限制150内