第四章:无失真信源编码.pptx
《第四章:无失真信源编码.pptx》由会员分享,可在线阅读,更多相关《第四章:无失真信源编码.pptx(113页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、无失真信源编码无失真编码概述定长信源编码变长信源编码实用的无失真信源编码方法举例第1页/共113页4.1无失真编码概述1离散、无失真、无记忆信源编码的一般模型模型:总组合数:总码组合数:入出信源编码 取值于同一个符号集,符号集大小为n 取值于同一个符号集,符号集大小为m第2页/共113页4.1无失真编码概述2问问题题:能能否否进进行行无无失失真真编编码码?怎怎样样进进行行无无失失真真编编码码?(前提:不考虑信源统计特性前提:不考虑信源统计特性)应满足条件应满足条件:无失真条件变换无失真条件变换 相互矛盾!相互矛盾!o 结论:结论:当当 n=m 时,时,KL 不有效。不有效。当当K=L 时,时,
2、mn,亦不满足有效性,亦不满足有效性o 解决办法:解决办法:引入信源统计特性。引入信源统计特性。无失真:无失真:有效:有效:第3页/共113页4.1无失真编码概述3考察无失真条件:等概条件下的消息符号熵等概条件下的码字符号熵考虑信源的实际统计特性(非等概),实际消息熵为:考虑信源的实际统计特性(非等概),实际消息熵为:代入无失真条件得:代入无失真条件得:结论:即使m=n,只要 就有可能实现K0,0,只要满足:只要满足:则:当则:当L足够大时,可使译码差错小于足够大时,可使译码差错小于,反反之之,当当时,译码一定出错。时,译码一定出错。解释:解释:定长编码定理给出了信源进行定长编码定理给出了信源
3、进行等长编码等长编码所需码长的所需码长的理论极限值理论极限值。第5页/共113页o结论:对信源进行二元等长编码时,每个信源符号所需码长的极限值为 o结论:对于唯一可译码,每个信源符号至少需要用 个码符号来变换。4.2定长编码定理2-进一步理解若要求所得的等长码是唯一可译的,则必须:o若L1,则:o当采用二元码编码时,m2,则:第6页/共113页4.2定长编码定理2-进一步理解每个码字(码序列)所能携带的平均信息量每个源序列所包含的平均不确定性。即:信源序列携带的信息量o 等长有效性的无失真编码的条件:等长有效性的无失真编码的条件:码长下限:码长下限:o 为实现有效:为实现有效:误码率任意小的方
4、向:误码率任意小的方向:?o结论:只要码字能够携带的信息量大于信源序列携带的信息 量,总可以实现几乎无失真编码 考虑信源统计特性考虑信源统计特性第7页/共113页讨论讨论:第三章:在考虑符号出现的概率和符号间相关性前提下第三章:在考虑符号出现的概率和符号间相关性前提下,每个每个 英文符号平均携带的信息量是英文符号平均携带的信息量是1.4bit/1.4bit/符号符号5bit/5bit/码符号。码符号。4.2 定长编码定理3-举例例1:英文电报有32个符号(266),即n=32,若m=2,L1(即对信源的逐个符号进行二元编码),则:bit解释解释:每个英文电报符号至少需要用每个英文电报符号至少需
5、要用5 5位二元符号编码位二元符号编码 (每位二元符号可以携带(每位二元符号可以携带1bit1bit信息,即每个英文电报符号用了可以携带信息,即每个英文电报符号用了可以携带 5bit5bit信息的码符号即信息的码符号即5 5位二元码表示)位二元码表示)问题:问题:如何提高效率?如何体现有效性如何提高效率?如何体现有效性?结论:结论:若不考虑信源统计特性等长编码效率极低若不考虑信源统计特性等长编码效率极低!第8页/共113页4.2定长编码定理4-进一步理解解决方法:字母个数为字母个数为n n,字母之间相关长度为,字母之间相关长度为L L的英文信源,其可能的字母序列的英文信源,其可能的字母序列总数
6、为总数为 ;但其中大部分字母序列是无意义的字母组合,而且随着;但其中大部分字母序列是无意义的字母组合,而且随着L L的增加,这种无意义序列的总数越来越大。的增加,这种无意义序列的总数越来越大。进行联合编码,即对字母序列编码,且只对哪些有意义的字母序列编进行联合编码,即对字母序列编码,且只对哪些有意义的字母序列编码,即需编码的字母序列的总数码,即需编码的字母序列的总数 ,则平均每个信源符号所需则平均每个信源符号所需的码符号个数可以大大减少,从而提高了传输效率。的码符号个数可以大大减少,从而提高了传输效率。考察考察:方法方法:问题问题:会引入一定的误差!但当会引入一定的误差!但当L足够长后,误差可
7、以任意小。足够长后,误差可以任意小。第9页/共113页4.2定长编码定理5证明考察离散、随机序列信源的统计特性渐进等分割性(AEP)AEP描述:渐进等分割定理:(熵定理,遍历性定理)设是离散无记忆信源输出的一个特定序列,则任给和,总可以找到一个整数,使当时,有:引入:渐进等分割性(引入:渐进等分割性(AEP:Asymptotic Equipartition Property)特定序列的平均符号自信息随机矢量的平均符号熵第10页/共113页任任何何一一个个离离散散随随机机序序列列信信源源当当序序列列长长度度L时时,信信源源序序列列会会产产生生两两极极分分化化.小小概概率率事事件件集集合合与与大大
8、概概率率事事件件集集合合,即即nL=对于对于有性质有性质:对于对于有性质有性质:由此可见,信源编码只需对信源中由此可见,信源编码只需对信源中少数少数落入典型大概率事件的集合的符落入典型大概率事件的集合的符号进行编码即可。而对号进行编码即可。而对大多数大多数属于非典型小概率事件集合中的信源符号属于非典型小概率事件集合中的信源符号无需编码无需编码.4.2定长编码定理6AEP物理意义信源序列集合信源熵信源熵大概率事件熵大概率事件熵第11页/共113页4.2定长编码定理7AEP证明集合和中的序列分别称为典型序列和非典型序列表示 中所有 典型序列的集合表示 集合中序列的个数可以证明:对于任意小的正数可以
9、证明:对于任意小的正数 ,当,当L足够大时,足够大时,第12页/共113页4.2定长编码定理7AEP证明还可以证明:对于任意小的正数,当L足够大时,表示序列 出现的概率 由切比雪夫不等式可得:表示S中每个符号携带的信息量的方差第13页/共113页第14页/共113页例2p(1)=p,p(0)=q,统计独立L长的序列:当L8时,序列11000101和序列011100101的概率为和显然,这两个序列不等概,当L时,有一些序列时,有一些序列1出现的出现的次数接近次数接近Lp,这些序列的概率为,这些序列的概率为且这些序列近似等概分布。且这些序列近似等概分布。4.2定长编码定理8AEP举例L长的序列长的
10、序列 ,对于任意小的正数,对于任意小的正数 满足式满足式 的序列称为的序列称为 典型序列典型序列 即:即:典型序列集是哪些平均自信息任意小地接近信源熵的典型序列集是哪些平均自信息任意小地接近信源熵的N长序列长序列的集的集合合第15页/共113页4.2定长编码定理9-AEP应用AEP结论:当L足够大时,所有典型序列出现的概率近似相等,即典型序列为渐进等概序列可粗略认为典型序列出现的概率为所有典型序列的概率和接近为1,即典型序列总数占信源序列的总数第16页/共113页4.2定长编码定理9-AEP应用o AEP应用:应用:n提出、证明都是基于离散无记忆序列信源提出、证明都是基于离散无记忆序列信源 n
11、平稳遍历信源有类似结果平稳遍历信源有类似结果n体现信源统计特性体现信源统计特性n用以证明定长编码定理用以证明定长编码定理第17页/共113页4.2定长编码定理10证明定长编码定理证明思路:将取自S,长为L的信源符号序列分为集合和o 几个概念:几个概念:n 编码信息率:编码信息率:编码后对应于每个信源符号平均能载荷的最大信息量n 编码效率:编码效率:编码前后平均每个信源符号能载荷的最大信息量之比只对集合 中的序列进行一一对应的等长编码此时的误差为 ,计算误差证明当证明当 ,且,且(K/L)log mH(S)+时,时,第18页/共113页4.2定长编码定理11(物理意义)结论:可推广至离散、非平稳
12、无记忆信源和有记忆信源(即H(S)=H(S))情况只要码字传输的信息量大于信源序列携带的信息量,总可以实现几乎无失真编码二元码时,二元码时,m2:l最佳等长码时:最佳等长码时:第19页/共113页4.2定长编码定理12(实际应用问题)编译码同步问题问题:如何使译码端知道码字起点问题:如何使译码端知道码字起点解决办法:解决办法:1 1、每个码字加短同步前缀、每个码字加短同步前缀 2 2、每若干码字加较长同步前缀、每若干码字加较长同步前缀o 分组长度与编译码复杂性、编译码延时等的关系分组长度与编译码复杂性、编译码延时等的关系n问题:要实现有效,源序列分组很长,使得编译码复杂性和延时增加问题:要实现
13、有效,源序列分组很长,使得编译码复杂性和延时增加n解决办法:目前没有理想的解决办法解决办法:目前没有理想的解决办法o 定长信源编码的定长信源编码的理论意义理论意义远大于其远大于其实用价值实用价值第20页/共113页4.2定长编码定理13(举例)例例3:设有一简单离散信源:设有一简单离散信源:L=1,n=2 对其进行近似于无失真的等长编码,若要求其编码效率为对其进行近似于无失真的等长编码,若要求其编码效率为96%,差错率低,差错率低 于于10-5,试求符号联合编码长度,试求符号联合编码长度L=?解:解:由编码效率:由编码效率:而:而:则:则:且:则:则:结论:可见结论:可见,需要需要4100万个
14、信源符号联合编码万个信源符号联合编码,才能达到上述要求才能达到上述要求,这显然是不现实的这显然是不现实的.一般来说:当一般来说:当L L有限时,高传输效率的等长码往有限时,高传输效率的等长码往往要引入一定的失真和错误,它不能象变长编往要引入一定的失真和错误,它不能象变长编码那样可以实现真正的无失真编码码那样可以实现真正的无失真编码第21页/共113页改变信源改变信源定长编码定长编码无失真信源编码实现方法一无失真信源编码实现方法一无失真信源编码实现方法二无失真信源编码实现方法二适应信源适应信源变长编码变长编码大概率大概率短码;小概率短码;小概率长码长码第22页/共113页4.3变长信源编码-1几
15、个码类的概念非奇异码(单义码)唯一可译码前缀码(即时码、非延长码、异前置码)最佳码(紧致码)Kraft定理即时码码长必须满足的条件唯一可译码存在定理变长编码定理(香农第一定理)第23页/共113页4.3变长信源编码-2(几个码类的概念)非奇异码(单义码):每一个码字仅对应信源中的一个信源符号(序列)。编码是单义的。反之为奇异码或非单义码。第24页/共113页4.3变长信源编码-3(几个码类的概念)唯一可译码编码单义、译码单义对任何一个有限长度的信源字母序列,如果编码得到的码字母序列不与其他任何信源字母序列所对应的码字母序列相同。非奇异码=唯一可译码?第25页/共113页4.3变长信源编码-4(
16、几个码类的概念)前缀码是唯一可译码中的一类在一个变长码中,没有任何一个码字是其他码字的前缀。译码时无需参考后续的码符号就能立即作出判断,进行无延时译码。又称即时码、非延时码例如逗点码:1,01,001,0001第26页/共113页4.3变长信源编码-5(几个码类的概念)最佳码唯一可译码的一类其平均码长小于其他唯一可译码的平均长度所有的码所有的码非奇异码非奇异码唯一可译码唯一可译码前缀码前缀码最佳码最佳码第27页/共113页4.3变长信源编码-6(几种类型的信源编码举例几种类型的信源编码举例)例4:信源信源概概 率率pi 编编 码码编编 码码编编 码码编编 码码编编 码码U11/2000000U
17、21/401010110U31/810100011110U41/81110110111111定长唯一可译奇异奇异非奇非奇异异前缀前缀唯一唯一可译可译第28页/共113页4.3变长信源编码-7(Kraft定理)引出码树构造即时码方法Kraft定理描述即时码码长须满足的条件Kraft定理证明略第29页/共113页实时唯一可译、可分离A0B10C110D1110E11110ABA BBBBBAACDDED要求:须严格同步第30页/共113页4.3变长信源编码-8(Kraft定理引出)问题问题:寻求实时唯一可译码实时唯一可译码方法:研究实时唯一可译码的码字可分离条件方法:研究实时唯一可译码的码字可分离
18、条件简单信源:简单信源:“码树码树”概念(直观)概念(直观)一般信源:通过一般信源:通过KraftKraft定理给出定理给出实时唯一可译码(实时唯一可译码(前缀码)存前缀码)存在在 的条件的条件第31页/共113页码树变长码的树图表示将变长码与码树建立将变长码与码树建立“一一对应一一对应”关系:关系:树根树根码字起点码字起点树枝数树枝数码的进制数码的进制数节点节点码字或码字的一部分码字或码字的一部分终止节点终止节点码字码字节数节数码长码长非满树非满树变长码变长码满树满树等长码等长码第32页/共113页利用码树构造前缀码利用码树构造前缀码源符号源符号概率概率前前缀码s1s2s3s40111000
19、10110111s10.04s4s30.160.64s20.16第33页/共113页4.3变长信源编码-9(Kraft定理)问题:问题:比较简单信源,码树方法可直接且直观构造前缀码比较简单信源,码树方法可直接且直观构造前缀码较复杂信源,直接画码树复杂且困难较复杂信源,直接画码树复杂且困难解决方法:解决方法:为便于分析,特别对含有很多符号种类的复杂信源,寻为便于分析,特别对含有很多符号种类的复杂信源,寻找一种与上述找一种与上述“树图树图”等效的解析式表达式等效的解析式表达式-Kraft不不等式。等式。结论:结论:KraftKraft定理给出定理给出码字可分离码字可分离或或前缀码存在前缀码存在的的
20、充要条件充要条件第34页/共113页4.3变长信源编码-10(Kraft定理)kraft定定理理:长长度度为为Ki(i=1,2,n)的的m(码码字字母母表表长长度度)进制前缀码存在的充要条件为:进制前缀码存在的充要条件为:证明:略证明:略物理意义:物理意义:给给定定信信源源个个数数N和和码码字字母母数数m,只只要要允允许许码码字字长长度度可可以以足足够够长,就总可以满足长,就总可以满足Kraft不等式,从而得到前缀码。不等式,从而得到前缀码。只要适当选取码长,码字一定可以即时分离。只要适当选取码长,码字一定可以即时分离。第35页/共113页(a)10(0.8)(0.2)(b)10(0.2)(0
21、.64)(0.16)10(c)10(0.2)(0.512)(0.16)10(0.128)10例例5:32104 个叶子个叶子:代表序列代表序列 1,01,001 和和 000是前缀码消息符号概率码字序号编码a0.201b0.16101c0.1282001d0.5123000第36页/共113页4.3变长信源编码-11(唯一可译码定理)KraftKraft不等式给出的限制也是所有唯一可译码都必须满足的。不等式给出的限制也是所有唯一可译码都必须满足的。定理描述:定理描述:任何唯一可译码均满足任何唯一可译码均满足KraftKraft不等式。不等式。结论:结论:唯一可译码一定满足唯一可译码一定满足kr
22、aftkraft不等式不等式满足满足kraftkraft不等式的码不一定是唯一可译码,但一定存不等式的码不一定是唯一可译码,但一定存在至少一种唯一可译码在至少一种唯一可译码对任何唯一可译码均可在不改变码字长度的条件下得到对任何唯一可译码均可在不改变码字长度的条件下得到相应的前缀码相应的前缀码第37页/共113页4.3变长编码定理12问题:问题:对于已知信源对于已知信源S可用码符号集可用码符号集X进行变长编码,而且对同一信进行变长编码,而且对同一信源编成同一码符号的前缀码或惟一可译码可有许多种。究竟源编成同一码符号的前缀码或惟一可译码可有许多种。究竟哪一种最好呢哪一种最好呢?从高速度传输信息的观
23、点来考虑,当然希望从高速度传输信息的观点来考虑,当然希望选择由短的码符号组成的码字,就是用码长作为选择选择由短的码符号组成的码字,就是用码长作为选择准则。准则。引入:码的引入:码的平均长度平均长度。离散无记忆平稳信源离散无记忆平稳信源信源熵率为信源熵率为 ,码字个数为,码字个数为M,信源符号对应码长分别,信源符号对应码长分别为:为:ki,i=1,2,.n则前缀码平均码长:则前缀码平均码长:第38页/共113页4.3变长编码定理13定理:定理:离散无记忆平稳信源离散无记忆平稳信源S,其熵为,其熵为 ,并有码符号集,并有码符号集C=c1,cm。对信源。对信源S进行编码进行编码,总可以找到一种编码方
24、法,总可以找到一种编码方法,构成惟一可译码,使信源构成惟一可译码,使信源S中中每个信源符号每个信源符号所需的平均码所需的平均码长满足长满足:另一方面另一方面,必可以找到前缀码,使其平均码长满足必可以找到前缀码,使其平均码长满足 l对于给定的信源和码符号集,若有一个唯一可译码,其对于给定的信源和码符号集,若有一个唯一可译码,其平均长度小于所有其他唯一可译码,则称这种码为平均长度小于所有其他唯一可译码,则称这种码为紧致码紧致码或最佳码。或最佳码。唯一可译唯一可译码存在性码存在性紧致码的紧致码的存在性存在性第39页/共113页证明:证明:第40页/共113页Jensen不等式第41页/共113页平均
25、码长=下限值第42页/共113页第43页/共113页由右边不等式第44页/共113页l香农第一定理(变长无失真信源编码定理):香农第一定理(变长无失真信源编码定理):设离散无记忆信源的熵为设离散无记忆信源的熵为 H H(S S),它的,它的N N次扩展信源次扩展信源为为 ,对扩展信源,对扩展信源 进行编码。总可以找到一种编进行编码。总可以找到一种编码方法,构成唯一可译码,使平均码长满足:码方法,构成唯一可译码,使平均码长满足:其中l当时,有第45页/共113页l当时,有代表平均到每个信源符号所需的码长l当时,每个码符号能够携带的信息量为:第46页/共113页4.3变长编码定理14物理意义:又称
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 失真 信源 编码
限制150内