信息论与编码-第5章.ppt
《信息论与编码-第5章.ppt》由会员分享,可在线阅读,更多相关《信息论与编码-第5章.ppt(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第5章信源编码章信源编码 编码(Coding)分为信源编码(Source Coding)和信道编码(Channel Coding),其中信源编码又分为无失真信源编码和限失真信源编码一般称u无失真信源编码定理为Shannon第一极限定理;u信道编码定理(包括离散和连续信道)称为Shannon第 二极限定理;u限失真信源编码定理称为Shannon第三极限定理 第第5章信源编码章信源编码l信源编码的主要任务:由于信源符号之间存在分布不均 匀和相关性,使得信源存在冗余度,信源编码的主要任务就是减少冗余,提高编码效率l信源编码的基本途径:n 使序列中的各个符号尽可能地互相独立,即解除相关性;n 使编码
2、中各个符号出现的概率尽可能地相等,即概率均 匀化第第5章信源编码章信源编码信源编码的理论基础是信息论中的两个编码定理:n无失真编码定理n限失真编码定理 无失真编码只适用于离散信源 对于连续信源,只能在失真受限制的情况下进行限失真编码 第第5章信源编码章信源编码本章主意讨论离散信源编码首先从无失真编码定理出发,重点讨论以香农(Shannon)码、费诺(Fano)码和霍夫曼(Huffman)码为代表的几种无失真信源码然后介绍限失真编码定理最后简单介绍了一些常用的信源编码方法5.1 编码的定义编码的定义信源编码器信道码符号(元)图5-1 信源编码器示意图XYX信源符号(Source Symbol)序
3、列Y码字(Codeword)序列信源编码是指信源输出的信源符号经信源编码器编码后转换成另外的压缩符号(码字Codeword)无失真信源编码:可精确无失真地复制信源输出的消息5.1 编码的定义编码的定义将信源消息分成若干组,即符号序列 xi,xi(xi1xi2xilxiL),xilA=a1,a2,ai,an每个符号序列xi依照固定码表映射成一个码字yi,yi(yi1yi2yilyiL),yilB=b1,b2,bi,bm这样的码称为分组码(Block Codes),也叫块码只有分组码才有对应的码表,而非分组码中则不存在码表 5.1 编码的定义编码的定义如果信源输出符号序列长度L1,信源符号集 A(
4、a1,a2,an)信源概率空间为 若将信源X通过二元信道传输,就必须把信源符号ai变换成由0,1符号组成的码符号序列,这个过程就是信源编码 5.1 编码的定义编码的定义码可分为两类:1、固定长度的码,码中所有码字的长度(码元个数)都相同,如表5-1中的码1就是定长码(Fixed Length Codes)2、可变长度码,码中的码字长短不一,如表中码2就是变长码(Variable Length Codes)表5-1 变长码与定长码信源符号ai信源符号出现概率p(ai)码表码1码2a1p(a1)000a2p(a2)0101a3p(a3)10001a4p(a4)111115.1 编码的定义编码的定义
5、码的属性及分类(1)奇 异 码(Singular Codes)和 非 奇 异 码 (Nonsingular Codes)若信源符号和码字是一一对应的,则该码为非奇异码,反之为奇异码 表5-2中的码1是奇异码,码2是非奇异码信源符号ai符号出现概率p(ai)码1码2码3码4a11/20011a21/411101001a31/80000100001a41/8110110000001表5-2 码的不同属性5.1 编码的定义编码的定义(2)唯一可译码(Uniquely Decodable Codes)任意有限长的码元序列,只能被唯一地分割成一个个的码字,便称为唯一可译码(3)唯 一 可 译 码 中 又
6、 分 为 非 即 时 码 和 即 时 码(Instantaneous Codes):如果接收端收到一个完整的码字后,不能立即译码,还需等下一个码字开始接收后才能判断是否可以译码,这样的码叫做非即时码5.1 编码的定义编码的定义即时码:只要收到符号就表示该码字已完整,可以立即译码即时码又称为非延长码(Undelayed Codes),任意一个码字都不是其它码字的前缀部分,有时叫做异前缀码(Prefix Codes)码码奇异码非分组码分组码非奇异码非唯一可译码非即时码即时码(非延长码)唯一可译码5.1 编码的定义编码的定义分组码非奇异码唯一可译码即时码紧致码(最佳码)码5.1 编码的定义编码的定义
7、通常可用码树来表示各码字的构成 树根root树枝 orders节点 notes终端节点 terminal nodes 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1二进制码树015.1 编码的定义编码的定义 0 1 2 0 1 2 0 1 2 0 1 20 1 20 1 2三进制码树5.1 编码的定义编码的定义唯一可译码存在的充分和必要条件是各码字的长度Ki(码元个数)应符合克劳夫特不等式(Kraft Inequality):其中m为进制数,n为信源符号数,Ki为各码字的长度(码元个数)必要性体现在如果是唯一可译码,则一定满足该不
8、等式充分性体现在如果满足该不等式,则这种码长的唯一可译码一定存在,但并不表示所有满足Kraft不等式的码一定是唯一可译码所以说,该不等式是唯一可译码存在的充要条件5.1 编码的定义编码的定义例5.1(p.88)设二进制码中ai (a1,a2,a3,a4),K11,K22,K32,K43,应用Kraft定理判断是否可能是唯一可译码 因此不存在满足这种Ki的唯一可译码。解:5.1 编码的定义编码的定义a1=1 0 1 0 1 0 1a2=01a3=011a4=0001,01,001,000 惟一可译码;1,01,101,010 不是惟一可译码;均满足克劳夫特不等式克劳夫特不等式只是用来说明唯一可译
9、码是否存在是否存在,并不能作为唯一可译码的判据。5.2 无失真信源编码无失真信源编码信源输出符号序列为 X(X1X2XlXL),其中 Xla1,a2,ai,an编码输出的码序列(码字)为 Y=(Y1Y2 Yk YKL)其中 Ykb1,b2,bj,bm要求能够无失真或无差错地译码,同时传送Y 时所需要的信息率最小 由于Yk平均每个符号的最大信息量为 logm KL长码字的最大信息量为 KLlogm则传送每一个信源符号所需要的信息率平均为 其中Y所能编成的码字的个数5.2 无失真信源编码无失真信源编码所谓信息率最小,就是找到一种编码方式使 最小。无失真信源编码定理研究的内容:最小信息率为多少时,才
10、能得到无失真的译码?若小于这个信息率是否还能无失真地译码?这就是无失真信源编码定理所要研究的内容n定长编码定理n变长编码定理5.2 无失真信源编码无失真信源编码n5.2.1 定长编码定理K是定值 且惟一可译码由L个符号组成的、每个符号的熵为HL(X)的无记忆平稳信源符号序列X1X2XlXL,可用KL=K个符号Y1,Y2,Yk,YKL,(每个符号有m种可能值)进行定长编码。对任意 0,0,只要则当L足够大时,必可使译码差错小于;反之,当 时,译码差错一定是有限值,而L足够大时,译码几乎必定出错5.2 无失真信源编码无失真信源编码定长编码定理含义:码字所能携带的信息量大于信源序列输出的信息量,则可
11、以使传输几乎无失真,当然条件是L足够大 反之,当 时,不可能构成无失真的编码,也就是不可能做一种编码器,能使收端译码时差错概率趋于零而当 时,则为临界状态,可能无失真,也可能有失真5.2 无失真信源编码无失真信源编码编码效率定义编码效率总是小于1,且最佳编码效率为编码定理从理论上阐明了编码效率接近1的理想编码器的存在性,它使输出符号的信息率与信源熵之比接近于1即信源的平均符号熵为HL(X),采用平均符号码长为 来编码,所得的效率即 只要L足够大5.2 无失真信源编码无失真信源编码5.2.2 变长编码定理在变长编码中,码长K是变化的根据信源各个符号的统计特性,如概率大的符号用短码,概率小的用较长
12、的码,使得编码后平均码长降低,从而提高编码效率。(统计匹配)5.2 无失真信源编码无失真信源编码单个符号变长编码定理:若离散无记忆信源的符号熵为H(X),每个信源符号用m进制码元进行变长编码,一定存在一种无失真编码方法,其码字平均长度满足下列不等式5.2 无失真信源编码无失真信源编码 离散平稳无记忆序列变长编码定理:对于平均符号熵为HL(X)的离散平稳无记忆信源,必存在一种无失真编码方法,使平均信息率满足不等式其中为任意小正数由此式可推导出平均码字长度应满足的不等式用变长编码来达到相当高的编码效率,一般所要求的符号长度L可以比定长编码小得多5.2 无失真信源编码无失真信源编码编码效率总是小于1
13、,可以用它来衡量各种编码方法的优劣为了衡量各种编码方法与最佳码的差距,定义码的剩余度为 其中 为平均信息率5.2 无失真信源编码无失真信源编码例5.2(p.93)设离散无记忆信源的概率空间为其信源熵为若用二元定长编码(0,1)来构造一个即时码:平均码长 1 二元码符号/信源符号5.2 无失真信源编码无失真信源编码编码效率为输出的信息率为 R0.811 比特/二元码符号长度为2的信源序列进行变长编码(编码方法后面讨论),其即时码如下表 aip(ai)即时码a1a19/160a1a23/1610a2a13/16110a2a21/161115.2 无失真信源编码无失真信源编码二元码符号/信源序列二元
14、码符号/信源符号码字平均长度为每个符号的平均码长为编码效率信息效率 R20.961 比特/二元码符号5.2 无失真信源编码无失真信源编码L3 R30.985 比特/二元码符号 L4 R40.991 比特/二元码符号 5.2 无失真信源编码无失真信源编码5.2.3 最佳变长编码 凡是能载荷一定的信息量,且码字的平均长度最短,可分离的变长码的码字集合称为最佳变长码为此,将概率大的信源符号编以短码字,将概率小的信源符号编以长码字能获得最佳码的编码方法主要有:n香农(Shannon)编码n费诺(Fano)编码n哈夫曼(Huffman)编码等5.2 无失真信源编码无失真信源编码香农(Shannon)码(
15、1)将信源消息符号按其出现的概率大小依次排列(2)确定满足下列不等式的整数码长Ki(3)为了编成唯一可译码,计算第i个消息的累加概率(4)将累加概率Pi变换成二进制数(5)取Pi二进数的小数点后Ki位即为该消息符号的二进制码字5.2 无失真信源编码无失真信源编码例5.3(p.95)设信源共7个符号,其概率和累加概率如下表所示 信源符号 ai 符号概率(ai)累加概率 Pi -log p(ai)码字长度 Ki 码 字a10.2002.323000a20.190.22.393001a30.180.392.473011a40.170.572.563100a50.150.742.743101a60.1
16、00.893.3241110a70.010.996.64711111105.2 无失真信源编码无失真信源编码指数分数十进制二进制2-11/21.5.12-21/22.25.012-31/23.125.0012-41/24.0625.000 12-51/25.03125.000 012-61/26.015625.000 001例如:0.2=.125+.0625+.001+.0001+=.0011 0.57=.5+.0625+.1+.0001+=.1001 0.99=.5+.25+.125+.0625+.03125+.015625+.75 .875 .9375 .96875 .984375 0.1
17、+0.01+0.001+0.0001+0.00001+0.000001+=0.11111105.2 无失真信源编码无失真信源编码码元/符号比特/码元 信源熵平均码长信息效率比特/符号5.2 无失真信源编码无失真信源编码费诺(Fano)编码方法(属于概率匹配编码)(1)将信源消息符号按其出现的概率大小依次排列:(2)将依次排列的信源符号按概率值分为两大组,使两个组的概率之和近于相同,并对各组赋予一个二进制码元“0”和“1”;(3)将每一大组的信源符号进一步再分成两组,使划分后的两个组的概率之和近于相同,并又赋予两个组一个二进制符号“0”和“1”。(4)如此重复,直至每个组只剩下一个信源符号为止。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论 编码
限制150内