第5章 无失真信源编码PPT讲稿.ppt
《第5章 无失真信源编码PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第5章 无失真信源编码PPT讲稿.ppt(87页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第5章 无失真信源编码中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT,第1页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 第第五五章章 无失真信源编码无失真信源编码5.1 信源编码的相关概念信源编码的相关概念5.2 定长码及定长编码定理定长码及定长编码定理5.3 变长码及变长编码定理变长码及变长编码定理5.4 变长码的编码方法变长码的编码方法5.5 实用的无失
2、真信源码方法实用的无失真信源码方法第2页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.1 信源编码的相关概念信源编码的相关概念5.1.1 编码器编码器 信源输出的符号序列,需要变换成适合信道传输的符号序列,一般称为码序列码序列,对信源输出的原始符号按照一定的数学规则进行的这种变换称为编码编码,完成编码功能的器件,称为编码编码器器。接收端有一个译码器译码器完成相反的功能。讨论无失真信源编码,可以不考虑干扰问题,所以它的数学描述比较简单。第3页,共87页,编
3、辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 图5.1是一个信源编码器,它的输入是信源符号(字母)集 ,同时存在另一符号(码字母)集 ,一般来说,元素 是适合信道传输的,称为码符号(或者码元)。编码器的功能就是将信源符号集中的符号 (或者长为N的信源符号序列 )变换成由 组成 ,其的长度为 的一一对应的序列。5.1.1 编码器编码器 第4页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Ele
4、ctrical Engineering,CUMT 编 码 器输出图图5.1 无失真信源编码器无失真信源编码器码字母表码字母表码序列码序列信源符号序列信源符号序列5.1.1 编码器编码器第5页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT BCD码(码(8421码)码)0 00001 00012 00103 00114 01005 01016 01107 01118 10009 10015.1.1 编码器编码器第6页,共87页,编辑于2022年,星期一中国矿业大
5、学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.1.1 编码器编码器第7页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.1.1 编码器编码器第8页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.1.1 编码器编码器第9页,共
6、87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 可见,编码就是从信源符号到码符号的一种映射,编码就是从信源符号到码符号的一种映射,即若 ,称f为定长编码;否则,f为变长编码。平均码长:平均码长:若要实现无失真编码,则这种映射必须是一一对应的,并且是可逆的。5.1.1 编码器编码器第10页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUM
7、T 5.1.1 编码器编码器信源编码有以下3种主要方法:(1)匹配编码匹配编码根据信源符号的概率不同,编码的码长不同:概率大的信源符号,所编的代码短;概率小的信源符号所编的代码长,这样使平均码长最短。将要讲述的香农编码、哈夫曼编码、费诺码都是概率匹配编码,都是无失真信源编码。(2)变换编码变换编码 先对信号进行变换,从一种信号空间变换为另一种信号空间,然后针对变换后的信号进行编码。(3)识别编码识别编码识别编码主要用于印刷或打字机等有标准形状的文字符号和数据的编码,比如中文文字和语音的识别。后两种信源编码均为有失真的信源编码。无失真信源编码主要针对离散信源,连续信源在量化编码的过程中必然会有量
8、化失真,所以对连续信源只能近似地再现信源的消息。第11页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 下面,我们给出这些码的定义。1.二元码二元码若码符号集为 ,所有码字都是一些二元序列,则称为二元码。二元码是数字通信和计算机系统中最常用的一种码。2.等长码等长码若一组码中所有码字的码长都相同,即 ,则称为等长码。3.变长码变长码若一组码组中各码字的码长长短不一,则称为变长码。5.1.2 码的分类码的分类第12页,共87页,编辑于2022年,星期一中国矿业大
9、学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.1.2 码的分类码的分类4.分组码和非分组码分组码和非分组码 定义定义5.1 将信源符号集中的每个信源符号 固定地映射成一个码字 ,这样的码称为分组码。分组码。用分组码对信源符号进行编码时,为了使接收端能够迅速准确地将码译出,分组码必须具有一些直观属性。与分组码对应的是非非分组码分组码,又称为树码树码、树码编码器输出的码符号通常与编码器的所有信源符号都有关。5.奇异码与非奇异码奇异码与非奇异码 定义定义5.2 若一种分组码中的所有码字都不相同,则称此分组
10、码为非奇异码非奇异码,否则称为奇异码奇异码。第13页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.1.2 码的分类码的分类奇异码与非奇异码奇异码与非奇异码 信源符号信源符号符号出现概率符号出现概率码码1 1码码2 2码码3 3码码4 41/21/20 00 01 11 11/41/411111010101001011/81/8000000001001000010011/81/8111101011000100000010001注释注释变长、奇变长、奇异码异
11、码变长,非变长,非奇奇异异码,非唯码,非唯一可译码一可译码变长,非变长,非奇异、唯奇异、唯一可译一可译、非即时码非即时码变长,非变长,非奇异、唯奇异、唯一可译、一可译、即时码即时码第14页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.1.2 码的分类码的分类6.唯一可译码与非唯一可译码唯一可译码与非唯一可译码 定义定义5.3 任意有限长的码元序列,如果只能唯一地分割成一个个码字,便称为唯一可译码唯一可译码。唯一可译码的物理含义是指不仅要求不同的码字表示不
12、同的信源符号,而且还要求对由信源符号构成的符号序列进行编码时,在接收端仍能正确译码而不发生混淆。唯一可译码首先是非奇异码,且任意有限长的码字序列不会雷同。下雨天,留客,天留我不留。下雨天,留客,天留我不留。下雨天,留客天,留我不?留。下雨天,留客天,留我不?留。7.即时码与非即时码即时码与非即时码 定义定义5.4 无需考虑后续的码符号就可以从码符号序列中译出码字,这样的唯一可译码称为即时码即时码。第15页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.1.
13、2 码的分类码的分类 下面讨论唯一可译码成为即时码的条件。定义定义5.5 设 为一码字,对于任意的 ,称码符号序列的前j个元素 为码字的前缀。按照上述的前缀的定义,有下述结论:定理定理5.1 一个唯一可译码成为即时码 的充要条件是其中任何一个码字都不是 其他码字的前缀。即时码可以用树图来构造图5.2是一个 二元即时码的树图图5.2 二元即时码的树图第16页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.1.2 码的分类码的分类 树是没有回路的图,所以它也是
14、由节点和弧构成的树中最顶部的节点称为根节点根节点,没有子节点的节点称为叶子节点叶子节点。所有根节点的子节点称为一阶节点一阶节点,所有一阶节点的子节点称为二阶节点二阶节点,依此类推。阶节点最多有 个。节点的阶次又称为节点的深度深度。综上所述,可将信源编码作如下分类:码非分组码(树码)分组码(块码)奇异码非奇异码非唯一可译码唯一可译码即时码非即时码第17页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 前面已经说过,所谓信源编码,就是将信源符号序列变换成另一个序列
15、(码字)。设信源输出符号序列长度为N,码字的长度为 ,编码的目的,就是要使信源的信息率最小,也就是说,要用最少的符号来代表信源。5.2 定长码及定长编码定理定长码及定长编码定理第18页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.2 定长码及定长编码定理定长码及定长编码定理 若对一个有q个信源符号的信源X进行定长编码,那么信源X存在唯一可译定长码的条件是 (5.1)其中,r是码符号集中的码元数,l是定长码的码长。如果对信源S的N次扩展信源 进行定长编码,
16、若要编得的定长码是唯一可译码,则必须满足 (5.2)其中,q是信源X的符号个数,是信源X的N次扩展信源 的符号个数,r是码符号集B的码符号数。第19页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 一、基本概念一、基本概念若信源符号序列,共 个变换成定长码序列,共 个1、编码速率:、编码速率:码序列最大信息量与信源序列长度N平均最大信息量(信息传输率信息传输率),单位bit/符号。5.2 定长码及定长编码定理定长码及定长编码定理第20页,共87页,编辑于202
17、2年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 2、信息传输率:、信息传输率:编码后平均每个码元携带的信息量,即二、定长编码定理二、定长编码定理由N个符号组成的、每个符号熵为 的无记忆平稳信源符号序列 ,可用 个符号(每个符号有r中可能值)进行定长变码。对任意 ,只要5.2 定长码及定长编码定理定长码及定长编码定理第21页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Enginee
18、ring,CUMT 则当N足够大时,必可使译码差错小于 ;反之,当时,译码差错一定是有限值,即当N足够大时,译码几乎必定出错。5.2 定长码及定长编码定理定长码及定长编码定理第22页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 所以等长编码定理告诉我们,只要码字传输的信息量大于信源序列携带的信息量,总可以实现几乎无失真的编码。条件是所取得信源序列长度N足够大。设差错概率为 ,信源序列的自方差为则有:5.2 定长码及定长编码定理定长码及定长编码定理第23页,共
19、87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 当 和 均为定值时,只要N足够大,可一小于任一正数 ,即此时要求:5.2 定长码及定长编码定理定长码及定长编码定理第24页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 只要 足够小,就可以几乎无差错地译码,当然代价是N变得更大。令为码字最大平均符号信息量。三、三、编码效率编码效率1
20、、定义、定义5.2 定长码及定长编码定理定长码及定长编码定理第25页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 2、最佳编码效率为、最佳编码效率为四、指导意义四、指导意义无失真信源编码定理从理论上阐明了编码效率接近于1的理想编码器的存在性,它使输出符号的信息率与信源熵之比接近于1,但要在实际中实现,则要求信源符号序列的N非常大进行统一编码才行,这往往是不现实的。5.2 定长码及定长编码定理定长码及定长编码定理第26页,共87页,编辑于2022年,星期一中国
21、矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 例题:设离散无记忆信源概率空间为信源熵为自信息方差为五、应用举例五、应用举例5.2 定长码及定长编码定理定长码及定长编码定理第27页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.2 定长码及定长编码定理定长码及定长编码定理第28页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院Scho
22、ol of Information and Electrical Engineering,CUMT 对信源符号采用定长二元编码,要求编码效率 ,无记忆信源有 ,因此可以得到如果要求译码错误概率 ,则5.2 定长码及定长编码定理定长码及定长编码定理第29页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 由此可见,在对编码效率和译码错误概率的要求不是十分苛刻的情况下,就需要 个信源符号一起进行编码,这对存储和处理技术的要求太高,目前还无法实现。如果用3比特来对上述
23、信源的8个符号进行定长二元编码,N=1,此时可实现译码无差错,但编码效率只有2.55/3=85%。5.2 定长码及定长编码定理定长码及定长编码定理第30页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.2 定长码及定长编码定理定长码及定长编码定理 定长编码的信息传输效率是很低的。提高信息传输效率的方法有:方法方法1 考虑符号之间的依赖关系,对信源S的扩展信源进行编码。方法方法2对于概率等于0或非常小的符号序列不予编码。因此,一般说来,当N有限时,高传输效率
24、的定长码往往要引入一定的失真和译码错误。解决的办法是可以采用变长编码。第31页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.3 变长码及变长编码定理变长码及变长编码定理5.3.1 Kraft不等式和不等式和McMillan不等式不等式 定理定理5.3 设信源符号集为 ,码符号集为 ,对信源进行编码,得到的码为 ,码长分别为 。即时码存在的充要条件是 这称为Kraft不等式不等式。由Kraft不等式可知,给定r和q,只要允许码字长度可以足够长,则码长总可以
25、满足Kraft不等式而得到即时码,Kraft不等式指出了即时码的码长必须满足的条件(5.11)第32页,共87页,编辑于2022年,星期一中国矿业大学信电学院中国矿业大学信电学院School of Information and Electrical Engineering,CUMT 5.3.1 Kraft不等式和不等式和McMillan不等式不等式 对于唯一可译码,该不等式又称为McMillan不等式。定理定理5.4 唯一可译码存在的充要条件是 r为码符号个数,为码字长度,q为信源符号个数。定理5.4指出了唯一可译码中r、q、之间的关系,如果满足这个不等式的条件,则一定能够构成至少一种唯一可
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第5章 无失真信源编码PPT讲稿 失真 信源 编码 PPT 讲稿
限制150内