第五章信源编码(编码定义及定长编码)(课堂PPT).ppt
《第五章信源编码(编码定义及定长编码)(课堂PPT).ppt》由会员分享,可在线阅读,更多相关《第五章信源编码(编码定义及定长编码)(课堂PPT).ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 信源编码信源编码5.1编码的定义编码的定义5.2无失真信源编码无失真信源编码 5.2.1定长编码定理定长编码定理31456002张安然张安然1回顾:为什么进行信源编码?回顾:为什么进行信源编码?理理论论上上,信信源源传传送送信信息息所所需需要要的的信信息息率率:极极限限熵熵H(X)或信息率失真函数或信息率失真函数R(D).极极限限熵熵H(X):多多符符号号离离散散平平稳稳信信源源实实际际上上就就是是原原始始信信源源在在不不断断地地发发出出符符号号,随随着着信信源源之之间间的的依依赖赖关关系系(即即信信源源的的相相关关性性)变变多多,信信源源的的实实际际熵熵越越小小(第第二二章章P
2、32-33证证明明),越越趋趋于于H(X)。所所以以H(X)是是离离散散平平稳稳有有记记忆忆信信源源平平均均每每发发一一个符号提供的信息量的个符号提供的信息量的最小值最小值。2信信息息率率失失真真函函数数R(D):从从允允许许一一定定失失真真的的条条件件下下,我我们们去去寻寻找找可可以以用用较较小小的的信信息息率率来来传传送送信信息息,即即去去掉掉某某些些不不必必要要的的成成分分,这这时时得得到到的的信信息息率率的的最小值最小值是是R(D)。)。由由此此可可见见,极极限限熵熵H(X)或或信信息息率率失失真真函函数数R(D)是是理理论论上上传传送送信信息息的的最最小小值值。而而实实际际上上,信信
3、源源发发出出消消息息时时包包含含了了多多余余信信息息,即即存存在在冗冗余余度度,冗余度体现了信源输出信号的信息携带效率。冗余度体现了信源输出信号的信息携带效率。3冗余度冗余度定定义义:衡衡量量信信源源发发出出消消息息时时包包含含了了多多余余信信息息的的物物理量理量来源:来源:1.信信源源符符号号的的相相关关性性。相相关关程程度度越越大大,信信源源的的实实际上越小,越趋向于际上越小,越趋向于H(X)。2.信信源源符符号号分分布布的的不不均均匀匀性性。等等概概率率分分布布时时信信源源熵熵最最大大,不不均均匀匀分分布布时时,信信源源熵熵减减小小。当当各各符符号号之之间间不不存存在在依依赖赖关关系系且
4、且为为等等概概率率分分布布时时,信信源源实实际熵趋于最大熵际熵趋于最大熵H0(X)4下面,以英文为例,计算文字信源的冗余度:下面,以英文为例,计算文字信源的冗余度:首先给出英文字母(含空档)出现概率如下:首先给出英文字母(含空档)出现概率如下:5下面,首先求得独立等概率情况,即下面,首先求得独立等概率情况,即其次,计算独立不等概率情况,其次,计算独立不等概率情况,再次,若仅考虑字母有一维相关性,求再次,若仅考虑字母有一维相关性,求H2最最后后,利利用用统统计计推推断断方方法法求求出出,由由于于采采用用的的逼逼近近的的方方法法和和所所取取的的样样本本的的不不同同,推推算算值值也也有有不不同同,这
5、这里里采采用用Shannon的推断值。的推断值。6采用等概率下传送方式,计算得采用等概率下传送方式,计算得这这样样,可可以以计计算算出出R=0.71。这这一一结结论论说说明明,英英文文信信源源,从从理理论论上上看看71是是多多余余成成分分。直直观观地地说说100页页英英文文书书,理理论论上上看看仅仅有有29页页是是有有效效的的,其其余余71页页是是多多余余的的。正正是是由由于于这这一一多多余余量量的的存存在在,才才有有可能对英文信源进行压缩编码。可能对英文信源进行压缩编码。消消息息的的冗冗余余,特特别别是是大大量量的的冗冗余余,为为我我们们提提高高通通信信效效率率,压压缩缩信信号号容容量量提提
6、供供了了基基础础。为为了了提提高高传传输效率,对大量冗余进行压缩,即信源编码。输效率,对大量冗余进行压缩,即信源编码。7信源编码信源编码信源编码是以提高通信的有效性为目的信源编码是以提高通信的有效性为目的编码。编码。采用的一般方法是压缩每个信源符号的采用的一般方法是压缩每个信源符号的平均比特数。同样多的信息用较少的信平均比特数。同样多的信息用较少的信息率来传送,使单位时间内传送的平均息率来传送,使单位时间内传送的平均信息量增加,从而提高通信的有效性。信息量增加,从而提高通信的有效性。信源编码的目的就是要减少冗余,提高编信源编码的目的就是要减少冗余,提高编码效率码效率。8信信源源编编码码的的基基
7、本本途途径径(即即消消除除冗冗余余度度来源的途径)有两个:来源的途径)有两个:使使序序列列中中的的各各个个符符号号尽尽可可能能地地互互相相独独立,即解除相关性;立,即解除相关性;使使编编码码中中各各个个符符号号出出现现的的概概率率尽尽可可能能地相等,即概率均匀化。地相等,即概率均匀化。9 根根据据能能否否在在解解码码后后完完全全准准确确的的恢恢复复出出原原始始消消息息(可逆)分为:(可逆)分为:无失真信源编码无失真信源编码 限失真信源编码限失真信源编码 无无失失真真编编码码只只适适用用于于离离散散信信源源;对对于于连连续续信信源源,只只能能在在失失真真受受限限制制的的情情况况下下进进行行限限失
8、失真真编编码码。前前者者主主要要用用于于文文字字、数数据据信信源源的的压压缩缩;后后者者主主要要用用于于图像、语音信源的压缩。图像、语音信源的压缩。10 一一般般地地:由由于于这这些些定定理理都都要要求求符符号号数数很很大大(参参考考极极限限熵熵H(X)序序列列长长趋趋向向于于)才才能能使使它它的的值值接接近所规定的值,因而这些定理被称为近所规定的值,因而这些定理被称为极限定理。极限定理。1.无失真信源编码定理称为无失真信源编码定理称为第一极限定理第一极限定理;2.信信道道编编码码定定理理(包包括括离离散散和和连连续续信信道道)称称为为第第二二极极限定理;限定理;3.限失真信源编码定理称为限失
9、真信源编码定理称为第三极限定理第三极限定理。这些定理的完善化,是这些定理的完善化,是香农信息论香农信息论的主要内容。的主要内容。11编编码码定定理理不不但但证证明明了了必必然然存存在在一一种种编编码码方方法法,使使代代码码的的平平均均长长度度可可任任意意接接近近但但不不能能低低于于符符号号熵熵,而而且且还还阐阐明明了了达达到到这这目目标标的的途途径径,就就是是使使概概率率与与码长匹配。码长匹配。例例如如之之后后学学习习的的变变长长编编码码,使使出出现现概概率率小小的的信信源源符符号号用用短短码码编编,出出现现概概率率大大的的用用长长的的码码编编,这这样样就就可可以以使使平平均均每每个个信信源源
10、符符号号的的输输出出符符号号降降低低。以以哈夫曼编码为例:哈夫曼编码为例:12哈哈夫夫曼曼编编码码的的编编码码结结果果可可以以看看出出,信信源源出出现现符符号号小小的的a7编编码码长长度度是是4位位,信信源源出出现现符符号号小小的的a1编编码码长长度度是是2位位,平平均均码长计算得码长计算得2.72码元码元/符号,输出符号码长减小。符号,输出符号码长减小。13信源编码(主要内容)信源编码定理信源编码定理v信源编码基本概念信源编码基本概念v定长信源编码定长信源编码v变长信源编码变长信源编码信源编码方法信源编码方法 离散信源编码离散信源编码 连续信源编码连续信源编码 相关信源编码相关信源编码 变换
11、编码变换编码145.1编码的定义编码的定义分分组组码码定定义义:将将信信源源消消息息分分成成若若干干组组,即即符符号号序序列列Xi=xi1,xi2,.,xiL,序序列列中中的的每每一一个个符符号号取取自自于于符符号号集集A,xil属属于于a1,a2,ai,an,而而每每个个符符号号序序列列Xi依依照照固固定定的的码码表表映映射射成成一一个个码码字字Yi,这样的码称为分组码,有时也叫块码。这样的码称为分组码,有时也叫块码。分分组组码码百百科科定定义义:它它把把信信源源待待发发的的信信息息序序列列按按固固定定的的位位一一组组划划分分成成消消息息组组,再再将将每每一一消消息息组组独独立立变变换换成成
12、长长为为n(n)的的二二进进制制数数字字组组,称称为为码码字字。如如果果消消息息组组的的数数目目为为M(显显然然M2),由由此此所所获获得得的的M个个码码字字的的全全体体便便称称为为码码长长为为n、信信息息数数目目为为M的的分分组码组码,记为记为【n,M】。15只有分组码才有对应的码表,而非分组码中不存在码表。只有分组码才有对应的码表,而非分组码中不存在码表。编编码码定定义义:二二元元信信道道(基基本本符符号号0,1)中中,若若将将信信源源X通通过过这这样样的的二二元元信信道道传传输输,就就必必须须把把信信源源符符号号ai 变变换换成成有有1.0符符号组成的码符号序列,这个过程就是信源编码。号
13、组成的码符号序列,这个过程就是信源编码。编编码码的的广广泛泛定定义义:编编码码是是信信息息从从一一种种形形式式或或格格式式转转换换为为另另一一种种形形式式的的过过程程也也称称为为计计算算机机编编程程语语言言的的代代码码简简称称编编码码。用用预预先先规规定定的的方方法法将将文文字字、数数字字或或其其它它对对象象编编成成数数码码,或或将信息、数据转换成规定的电脉冲信号。将信息、数据转换成规定的电脉冲信号。我们之后介绍的是二元信道中的编码。我们之后介绍的是二元信道中的编码。16信源编码器示意图信源符号集信源符号集X Xaa1 1,a,a2 2,a an n:代表信源发出的消息,共有代表信源发出的消息
14、,共有n n个信源符号。个信源符号。码表(码符号集)码表(码符号集)码符号集中的元素称为码元或者码符号,适合信道传输。码符号集中的元素称为码元或者码符号,适合信道传输。码字集合码字集合Y=WY=W1 1,W,W2 2,W Wn n:与信源符号一一对应,码字由码符号序列组成。与信源符号一一对应,码字由码符号序列组成。17一个简单的编码实例一个简单的编码实例【例例】对学生的成绩等级进行编码,分为优、良、对学生的成绩等级进行编码,分为优、良、中、差中、差4 4个个 等级。等级。信源符号集信源符号集X Xaa1 1,a,a2 2,a an n=优、良、中、差优、良、中、差 用二元码,码符号集合为用二元
15、码,码符号集合为0,10,1码字集合为码字集合为 Y=WY=W1 1,W,W2 2,W Wn n=00,01,10,1100,01,10,11编码过程:编码过程:0000代表优,代表优,0101代表良,代表良,1010代表中,代表中,1111代代表差。每一个码字都是表差。每一个码字都是2 2个码符号组成的序列。个码符号组成的序列。18信源符号信源符号符符号号出出现现概概率率p(ai)码码1码码2码码3码码4a11/20011a21/411101001a31/80000100001a41/811011000000119(1)奇异码与非奇异码书书中中定定义义:若若信信源源符符号号和和码码字字是是一
16、一一一对对应应的的,则则该该码码是是非非奇奇异异码码;反反之之,是是奇奇异异码码。这这个个定定义义可可以以理理解解为为数数学学意意义义上上的的映映射射,每每一一个个符符号号均均可可以以在码字集合中找到唯一对应的码。在码字集合中找到唯一对应的码。华华中中科科技技大大学学书书中中定定义义:若若一一种种码码中中的的所所有有码码字字都都互互不不相相同同,则则称称此此分分组组码码为为非非奇奇异异码码,否否则则称称为奇异码。为奇异码。可可以以看看出出,表表中中码码1是是奇奇异异码码,有有两两个个11码码。其其他他是非奇异码是非奇异码20(2)唯一可译码书书中中定定义义:任任意意有有限限长长序序列列,只只能
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 信源 编码 定义 定长 课堂 PPT
限制150内