信源编码与编码定理.ppt
《信源编码与编码定理.ppt》由会员分享,可在线阅读,更多相关《信源编码与编码定理.ppt(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信源编码与编码定理现在学习的是第1页,共42页第五章第五章:无失真信源编码无失真信源编码 5. 1 编码问题的一般概念与定义编码问题的一般概念与定义 (General Concepts and Definitions for Coding) 所谓编码即信号的变换,或信号形式的变换。 (signal transform or signal form transform) “通信的根本问题是将信源的输出经信道传输后在接收端(信宿)精确地或近似地重现出来。”这就是通信的本质,能在宿端再现发端的信号,所以信号形式上的变换就是通信的核心问题。 变换(transform)称为编码(encoding) 反变
2、换(inverse-transform)则称为解(译) 码 (decoding) 所有编码手段无外乎为了四个目的: . 有效性(effectiveness)、. 可靠性(reliability) 、 . 安全性(security) 、. 经济性(economically) 、 现在学习的是第2页,共42页5. 1 编码问题的一般概念与定义. 解决有效性问题的编码信源编码( Source coding) 亦称压缩编码(Compressed coding),所谓信源编码是指在无失真,或在有失真的条件下,如何利用尽可能少的符号来表述信源发出的消息。 很显然,这种编码在于压缩信息的冗余度。根据编码的前
3、提条件,信源编码又分为两类: 无失真信源编码(Source coding without distortion) 这种编码是一种可逆性编码(invertible coding) ,即编码后的码字序列再经解码处理后,可无失真地恢复出原来的消息或消息序列。显然对于离散信源来说才有可能实现这种可逆编码,所以无失真信源编码仅适用离散信源。现在学习的是第3页,共42页5. 1 编码问题的一般概念与定义 限失真信源编码(Source coding with finite distortion) 此编码方式不能构成可逆编码,即编码后的码字序列经解码(反变换)处理后,所恢复的消息序列与发端的原消息序列存在有一
4、定的失真。这种编码适合于连续信源模拟信号的编码,因为对连续信源的信号无论做何种处理,都无法避免信息的损失。比如语音信号,即使采用64Kbit/s以上的速率量化,也会有相当的信息产生丢失,只不过有时人耳察觉不到而已。实际工程中失真大量存在,而且在允许失真的限度下进行编码处理对于大多数用户都是可以接受的。因此对于信息量无限大的连续变量来说,按照熵编码的原则压缩,信息丢失的程度应该是最小。 限失真信源编码的方法有很多,而且随信源的特性不同也有其不同的压缩模式。但它们都没有达到Shannon所给出的理论极限。 现在学习的是第4页,共42页5. 1 编码问题的一般概念与定义. 解决可靠性问题的编码信道编
5、码信道编码 (Channel coding) 亦称纠错编码。此类编码方式的目的,主要是解决如何充分地利用信道的能力来可靠地传输信息。我们把这种增加信道中抗干扰能力的编码称为信道编码。它所采用的处理方针恰恰与信源编码中压缩冗余的方针正好相反,是充分利用原有冗余度和进一步扩展冗余度的方针。所以这种编码技术是以牺牲传输的有效性为代价来提高传输的可靠性。. 解决安全性问题的编码密码密码(Cryptography) 这里的编码方法主要是为了解决信息传输过程中的安全性问题。即为使授权用户(empower-user)尽可能无失真地接收信息;而对于非授权用户(empower-user), 则不允许其获取信息。
6、现在学习的是第5页,共42页5. 1 编码问题的一般概念与定义 . 解决传输经济性问题的编码调制与复用调制与复用 (modulation & multiplex) 是指为了充分利用信道,进一步提高通信系统的通信能力和降低通信成本而采用的编码技术。这类编码技术不仅广泛地应用于通信网络中,而且在计算机网络和有线电视网中也有大量的使用。这种编码技术大体分为这几类: 时分复用与时分多址接入技术时分复用与时分多址接入技术(TDM & TDMA) 频分复用与频分多址接入技术频分复用与频分多址接入技术(FDM & FDMA) 码分复用与码分多址接入技术码分复用与码分多址接入技术(CDM & CDMA) 波分
7、复用波分复用(WDM) 空分复用空分复用(SDM) 统计复用统计复用(Statistical multiplex)现在学习的是第6页,共42页5. 1 编码问题的一般概念与定义 以上四类编码技术都有其专门的学科论述,而信息论中仅定性、定量地给出各种编码方法的理论极限和性能界限。这些都是以极限定理的方式给出,因此它们就预示着在每一种具体的编码方法实现之前,就可给出它的实现前提和最好目标或可实现性。所以信息论中的编码定理,大多是我们用以评估系统优劣的界限;或估计系统是否值得改善的尺度;以及用以比较系统目标的最佳性或可实现性。 总之学习信息论就是为了掌握这些性能界限;应用编码定理来评估实际问题。而具
8、体的编码技术应在其它相应的专业课程来解决。现在学习的是第7页,共42页5. 1 编码问题的一般概念与定义一、编码器与解码器一、编码器与解码器(encoder & decoder) 编码器就是将消息符号序列变换成码字序列的装置(器件),而解码器则是相应的反变换装置(或器件) 。KXEncoderDecoderLS LS KX KX LS 而码字序列可由K个码字所组成,则两种序列的个数分别为: 编码器的输入是消息符号序列,其中符号的取值集合为S:12,nSa aa;如果给定一个码字符号集合12,mxb bb则编码器的输出可以由码字符号构造出一个码字序列与输入的消息符号序列相对应。设消息序列由L个符
9、号构成 ,12LLSS SS 12KKxx xxLKnm和KLmn只有才可能产生一一对应的映射关系, 形成可逆编码。KLmn如果则不可能实现无失真编码, 只能实现有失真编码。现在学习的是第8页,共42页5. 1 编码问题的一般概念与定义 例例5-1. 如果消息符号为一如果消息符号为一16进制符号集合,若采用二进制码进制符号集合,若采用二进制码字符号,来对其进行可逆编码时需要码字长度如何?字符号,来对其进行可逆编码时需要码字长度如何?题解:, , ,loglog16loglog2andnm0 1 290 11624iiKLthSAFxnmmnLKbients 如果信源所发的消息是以两个如果信源所
10、发的消息是以两个16进制符号组成的序列,即所谓信源的进制符号组成的序列,即所谓信源的二次扩展,我们称为并源处理:二次扩展,我们称为并源处理: Combined Source Processing 则此刻则此刻的码字序列的长度正是一个字节的码字序列的长度正是一个字节(byte)长度。长度。22log162168log2KKbits现在学习的是第9页,共42页5. 1 编码问题的一般概念与定义二、分组码二、分组码(块码块码)与非分组码与非分组码(序列码序列码) (Block code & Non-block code =Sequence code) 以上例子中的码字序列均有一个固定字长,我们称为定
11、长码字。(Fixed-length code word) 如果码字长度不是一个固定的常数,我们则称为码字为变长码字。(Variable-length code word) 无论是定长码,还是变长码它们均属于所谓分组码,因其特征是每一个码字都有一个有限的字长 l ,所以分组码亦称为块码结构。还有一类码字是没有特定的字长,它是一个无限长或相当长的码字序列,不能按一个个的码字进行编译码,而是随消息序列按边输入边输出的机制实现编译码。这类编码方法称为非分组码 序列码序列码 ,如算术码等。 现在学习的是第10页,共42页5. 1 编码问题的一般概念与定义三、码树结构三、码树结构( Code Tree S
12、tructure )RootNodeBranchJoint branch0 1111111000000101 一个码树,从根部可分出m个分枝(或树叶leaf),这相对于m进制码。如果从根部开始,对于每个节点上引出的分枝都分配一个代码,则由根出发到任意一个终端节点,形成一联枝。若将一联枝的所有分枝的代码组合则形成码字序列。 如果所有的联枝其长度相同,称为整树结构整树结构。由整树中可以得到定长码字,反之将得到变长码字。现在学习的是第11页,共42页5. 1 编码问题的一般概念与定义四、满树原则四、满树原则 ( Full Tree Principle )01200112201201122 比较以上两
13、码树其相互差别在于从任意一节点出发能否保证其后续的枝数一定是m枝(相对于m进制码)。满足这一原则为满树结构,否则为非满树结构(non-full tree structure)。Full Tree Principle:N = m+ k(m -1) 其中k表示为中间节点的个数;N表示码树的联枝数或码字个数。满数满数结构结构非满数结构非满数结构现在学习的是第12页,共42页5. 1 编码问题的一般概念与定义 显然,任何一个二进制码字序列,其码树一定符合满 树结构,因为给定一个N,总可以找得到k个中间节点来满足满树原则: ()22122NkkkNLNmmk(m1) 如果满树结构与整数结构相同时,有 其
14、中,L是联枝串接的分枝数,k是中间节点个数。 任何一个整树都符合满树结构,但任意的满树却不一定满足整树结构。由于整树的联枝长度相同,故此码树对应定长编码;而符合满树原则但又不是整树的结构常用于对应变长编码。现在学习的是第13页,共42页5. 1 编码问题的一般概念与定义000111222012Root()( )r33271312 2nNrrk书中图书中图5.3有误应符有误应符合整树定义。合整树定义。 N=r112000000001111111222222220现在学习的是第14页,共42页第五章第五章:无失真信源编码无失真信源编码 5. 2 定长定长编码及定长编码定理编码及定长编码定理 (Th
15、e Fixed-length Coding and its Theorem) 前面我们已经推出利用定长编码实现可逆编码的条件是:logloglog:logLKLmnLnKmnKThmen Where K is the code length . 因为定长编码可以实现一一对应的无失真编码,但是这时却没有实现信源编码的主要目的压缩消息序列的冗余度,甚至编码后的码字序列还可能增加新的冗余。 那么如何采用定长编码来达到压缩的目的,这是我们这节重点概念。在第二章中已知道这样的结论:()KLmn012log m+1nHHHHH 现在学习的是第15页,共42页5. 2 定长编码及定长编码定理定长编码及定长编
16、码定理 上式表明对信源特性了解越多,则所需传输的信息量就越少。因此我们对Hm感兴趣,若把L个消息符号排成一个序列,不论其是否有记忆,只要统计出Hm的值,就对压缩序列的冗余有利。我们可以仅从符号间相互独立的序列中看到这一特点。 从数学的大数定律中可以证明这样一个结论,如果对L个消息符号可构成无记忆序列,则按每一个序列的出现概率可将所有序列分成两大类:一类是高概率序列类高概率序列类;另一类是低概率序列类低概率序列类。所谓高概率序列是指属于此集合的元素,大体上将以几乎相同的概率出现。一般称为渐近等概率集合渐近等概率集合,记AL。而且L越大这种等等概率特性越明显概率特性越明显。另一类集合中的序列,它的
17、出现概率很低,几乎为零。所以我们把这一部分序列集合称为低概率集合低概率集合,记为CLA;();()10LLLLLdefCLdefAAxp xxp xMand 现在学习的是第16页,共42页5. 2 定长编码及定长编码定理定长编码及定长编码定理 例例52. 设 如一个小盒子中装有100枚围棋子,其中75枚为白色棋子,25枚为黑色棋子。如果将100只同样比例的围棋子盒子倒入一大盒子中搅匀,问若随机性的装一小盒子围棋子,这盒棋子全是白色的概率是多少?若全是黑色棋子的概率又是多少?,., .20 75 0 25aax 1 1解:解:根据数学中的大数定律,落入高概率类集合的事件数目为:1122; ();
18、134()logloglog4log0.811443defb tHip 1()() LLLLLandI xAxxxH XMLXpppp ();();()Lx0 CLLLLIAxp xxHXL 同同 理理 ,现在学习的是第17页,共42页5. 2 定长编码及定长编码定理定长编码及定长编码定理()()()(),()(pp1 LLLLCCLLLL22I xxApaApH XLI xxAAH XL (x)LLndwhere 这就是说如果给定了 ,总可以找到一个L 使得落入两个概率类集合的序列各有自己的出现概率。而落入渐近等概率集合的序列个数将是一个常数:1!()!niiLMp L ()()10 CLL
19、LLap xAp xAndM 现在学习的是第18页,共42页5. 2 定长编码及定长编码定理定长编码及定长编码定理 给出此例并不是希望大家掌握计算序列概率的方法,而是要大家了解定长编码达到压缩的目的。因为消息序列中的个数为: 且且,LnLn L! M 显然,如果采用一一对应的定长编码策略,仅对渐进等概率集合中的消息序列一一对应的编码;而对那些几乎不出现的序列,不给分配码字序列,这样编码的出错概率将会控制到 以下。如果认为这样的失真还不够小,可以增加L的值,使得 足够小。因此无失真定长编码的理论是建立在误差概率几乎为零的意义下的无失真结果。LetKMm 若若 即保证对于高概率类序列集合中的每一消
20、息序列都能实现一一对应的编码,而且由于:KLm n这就体现出定长编码压缩序列冗余的效果。现在学习的是第19页,共42页5. 2 定长编码及定长编码定理定长编码及定长编码定理 介绍定长编码极限定理: 设消息序列: 和码字序列:1212;,LLinSS SSSa aa 1212;,KKimxx xxxb bb再设:,log().;defeKmLL00 eebe theprobability oferror.can be made arbitrarilysmallby makingsufficently large, i.PeifaRH XPLPny. 有有:则则, log(),21eKmH XL
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信源 编码 定理
限制150内