多媒体编码与通信-熵编码课件.pptx
《多媒体编码与通信-熵编码课件.pptx》由会员分享,可在线阅读,更多相关《多媒体编码与通信-熵编码课件.pptx(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体编码与通信多媒体编码与通信111111第二章 熵编码技术n熵编码概述n信息熵理论nHuffman编码n指数哥伦布编码n算术编码n基于上下文的熵编码n自适应熵编码n其他无损编码方法熵编码概述n熵编码是针对统计冗余的压缩编码方法n熵编码的理论基础是shannon的信息熵理论,所以被叫做熵编码n熵编码是无损编码n熵编码是压缩编码中最重要的一种编码方法,是各种编解码方案中都要采用的编码方法信息熵理论假设无记忆信息源 M=mi,miS,i=0.N-1符号表 S=sk,k=0.K-1符号sk出现的概率为pk,k=0.K-1符号sk的信息量为 h(sk)=-log2(pk)信息熵理论符号出现的概率越小
2、,所包含的信息量越大。经过理论分析和实践检验,证明概率的倒数的对数是最符合概率和信息量之间关系的(2.26,9.58)信息源的信息量是构成它的所有符号的信息量的和,即(M)=h(m0)+h(mN-1)信息熵理论信息源的熵是构成它的所有符号的平均信息量H(M)=(h(m0)+h(mN-1)/N =(-pklog(pk)当所有符号出现的概率相同时,信息源的熵最大当对数以2为底时,(M)是编码信息源所需的最小位数,而H(M)是每个符号的平均位数信息熵理论M=AAAAAAAAAAAAAAABBBBBBBCCCCCCDDDDDDEEEEEhuffman编码Shannon-Fano算法根据出现概率从大到小
3、将符号排成一列将符号列分成上下两部分,使两部分的概率之和尽量接近上半部分标0,下半部分标1对所分的两部分重复上述步骤,直到所有分组都只包含一个符号huffman编码huffman算法寻找概率最小的两个符号将概率最小的两个符号连接成一个新符号,新符号的概率为原来的两个符号的概率之和用新符号替换原来的两个符号重复上述步骤,直到符号集中只剩下一个符号哈夫曼编码过程演示A1A1A2A2A3A3A4A4A5A5A6A6A7A70.230.230.210.210.180.180.150.150.130.130.070.070.030.03 1 1 0 00.100.101 1 0 00.230.23 1
4、1 0 00.330.33 1 1 0 00.440.44 1 1 0 00.560.560 0 1 11 1编码编码编码编码 01 01 00 00 111 111 110 110 101 1011001100110001000huffman编码ASCII码(定长码)l39 x 8=312Shannon-Fano算法l15x2+7x2+6x2+6x3+5x3=89huffmann算法l15x1+7x3+6x3+6x3+5x3=87理论最小值l85.25指数哥伦布码nExponential-Golomb code=Exp-Golomb code nHuffmann码的局限只适用于有限符号集需要
5、传送或保存码表n指数哥伦布码的优点可以对无限符号集编码不需要传送或保存码表指数哥伦布码阶数码字结构CodeNum取值范围k=0100 1 x0120 0 1 x1 x0360 0 0 1 x2 x1 x0714.k=11 x0010 1 x1 x0250 0 1 x2 x1 x06130 0 0 1 x3 x2 x1 x01429.k=21 x1 x0030 1 x2 x1 x04110 0 1 x3 x2 x1 x012270 0 0 1 x4 x3 x2 x1 x02859.指数哥伦布码n指数哥伦布码的局限通常不是最优的,只有概率分布合适的时候是0阶指数哥伦布码总共用了109位1阶指数哥伦
6、布码总共用了112位需要根据符号的概率分布选择合适的阶数算数编码的由来nHuffman码和指数哥伦布码的码字必须是整数个bit,这就造成了大多数情况下huffman码无法达到理论极限,甚至距离理论极限很远。n例如,如果一个符号的概率是1/3,则该符号的编码位数最优是1.6左右,而huffman码却只能为其设计1位或2位的码字。n当一个符号的概率特别高时,例如大于0.9,则最优码长是0.15位,而huffman码只能是1位,比最优码长长6倍n当符号集中只有两个符号时(例如二值图像),huffman码几乎失去作用。解决这个问题的方法是将若干个相连的符号打包,从而产生一个较大的符号集,然后再应用hu
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 编码 通信 课件
限制150内