信息论与编码第4无失真信源编码.ppt
《信息论与编码第4无失真信源编码.ppt》由会员分享,可在线阅读,更多相关《信息论与编码第4无失真信源编码.ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信息论与编码第4无失真信源编码 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望第4章 编码类型(1)在不失真或允许一定失真条件下,如何提高信息传输速度,这种编码称为信源编码。根据是否允许失真,信源编码又可以分为无失真信源编码(当失真可以逼近于0时,在信息论中也当做无失真编码讨论)和限失真信源编码。(2)在信道受到干扰的情况下,如何增加信号的抗干扰能力,同时又使得信息的有效传输率最大,达到这种目的的编码称为信道编码。它是为了对抗信道中的噪音和衰减,通过增加冗余,如校
2、验码等,来提高抗干扰能力以及纠错能力。第4章 编码类型(3)在可以监听的信道上如何进行安全的通信,使得在信道上监听的人也无法获取消息,需要进行加密。对应的加密转换方法称为加密编码。4.1 编码器和相关概念为了分析方便和突出问题的重点,当研究信源编码时,我们把信道编码和译码看成是信道的一部分,从而突出信源编码。同样,在研究信道编码时,可以将信源编码和译码看成是信源和信宿的一部分,从而突出信道编码。对于加密编码也是如此。简单地说,通信系统模型中的各种编码都是可选的,我们可以忽略其他编码,而专门讨论我们研究的那种编码。4.1.1 码的分类图4-1 信源编码器模型4.1.1 码的分类图4-2 码的分类
3、4.1.1 常用码的定义1.二元码和r元码,若码符号集为X=0;1,所有码字都是一些二元序列,则称为二元码(Binary Code)2.等长码,若一组码中所有码字的码长都相同,即li=l(i=1,2,q),则称为等长码(定长码,fixed length code)3.变长码,若一组码组中所有码字的码长各不相同,则称为变长码(variable length codes)4.1.1 常用码的定义4.非奇异码,若一组码中所有码字都不相同,则称为非奇异码(nonsingular code,nonsigular code)5.奇异码,若一组码中有相同的码字,则称为奇异码。该码可能具有什么用途,又有什么缺
4、陷?6.唯一可译码7.非即时码和即时码8.分组码与非分组码4.1.2 码树对于给定码字的全体集合 C=W1,W2,Wq,可以用码树来描述。码树有助于研究唯一可译码的判别。图4-3 码树图4.1.3 Kraft不等式利用码树可以判断给定的码是否为惟一可译码,但需要画出码树。在实际中,我们可以利用克拉夫特(又译克劳夫特,Kraft)不等式,直接根据各码字的长度来判断惟一可译码是否存在,即各码字的长度应符合克拉夫特不等式:4.1.3 Kraft不等式 定理定理4-1 Kraft定理:对于码符号为X=x1,x2,xr的任意唯一可译码,其码字为W1,W2,Wq,所对应的码长为l1,l2,lq,则必定满足
5、克拉夫特不等式定理定理4-2 将码C中所有可能的尾随后缀组成一个集合F,当且仅当集合F中没有包含任一码字,则可判断此码C为唯一可译码。4.2 定长编码定理4-3 定长(等长)编码定理:由L个符号组成的、每个符号熵为HL(X)的无记忆平稳信源符号序列X1X2X3XL用KL个符号Y1Y2YKL(每个符号有m中可能值)进行定长变码。对任意,只要则当L足够大时,必可使译码差错小于;反之,当 时,译码差错一定是有限值,当L足够大时,译码几乎必定出错。4.2 定长编码 4.2 定长编码例4-3设离散无记忆信源概率空间为信源熵为4.2 定长编码自信息方差为4.2 定长编码对信源符号采用定长二元编码,要求编码
6、效率,无记忆信源有因此可以得到如果要求译码错误概率,则由此可见,在对编码效率和译码错误概率的要求不是十分苛刻的情况下,就需要个信源符号一起进行编码,这对存储和处理技术的要求太高,目前还无法实现。4.3 变长编码定理4-4 香农单符号变长编码定理:若离散无记忆信源的符号熵为H(S),每个信源符号用r进制码元进行变长编码,一定存在一种无失真编码(唯一可译编码)方法,其码字的平均长度满足:4.3 变长编码定理4-5 香农离散平稳无记忆序列变长编码定理,即:若对信源离散无记忆信源S的N次扩展信源SN进行编码,则总可以找到一种编码方法,构成惟一可译码,使信源S中每个信源符号所需的平均码长满足:4.3.1
7、 编码空间在信源编码的时候,我们可以如何使得编码最短,但是越短的编码,也容易造成唯一不可译。以异前缀编码为例,如果编的过短,会使得大量的码字不可用,如果较长,则影响不大。为了便于理解,我们这里提出一种新概念-编码空间。4.3.1 编码空间实际上它是一个相对量,是指一个编码占用的可以使用的编码的比例,考虑异前缀编码,显然一个二进制的编码,如果将0作为码字,所有以0开头的编码都不能再用,则有一半的编码将不能继续作为码字,如果是两位,则有四分之一的码字不能使用,对于十进制,一个一位的十进制占用的比例为十分之一,依此,一个n位的k进制占用的编码空间为1/kn,当占用的编码空间小于等于1的时候,异前缀码
8、是可能存在的,如果大于1,则不可能存在。4.3.2 香农码香农第一定理指出,选择每个码字的长度Ki满足下式的整数:logmpiKi1logmpi 例4-4设无记忆信源的概率空间为:4.3.2 香农码以二进制编码为例,香农编码方法如下:将信源消息符号按其出现的概率大小依次排列 p(u1)p(u2)p(un)确定码长Ki(整数):Mi=取整;Ki=Mi+1,如果 Mi是小数;Ki=Mi,如果Mi是整数 为了编成唯一可译码,计算第i个消息的累加概率 4.3.2 香农码 将累加概率Pi变换成二进制数。取pi二进制数的小数点后Ki位即为该消息符号的二进制数。例4-5 对信源进行香农编码。4.3.2 香农
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论 编码 失真 信源
限制150内