信息论第讲算术编码与编码.ppt
《信息论第讲算术编码与编码.ppt》由会员分享,可在线阅读,更多相关《信息论第讲算术编码与编码.ppt(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信息论第讲算术编码与编码现在学习的是第1页,共28页算术编码算术编码前面所讨论的无失真编码,都是建立在信源符号与码字一一对应的基前面所讨论的无失真编码,都是建立在信源符号与码字一一对应的基础上,这种编码方法通常称为础上,这种编码方法通常称为块码或分组码块码或分组码,此时信源符号一般是,此时信源符号一般是多多元元的。的。如果要对二元序列进行编码,则需采用合并信源符号方法,把二元序如果要对二元序列进行编码,则需采用合并信源符号方法,把二元序列转换成多值符号,转换时二元符号之间的相关性不予考虑,转换后列转换成多值符号,转换时二元符号之间的相关性不予考虑,转换后这些多值符号之间的相关性也不予考虑。这就
2、使信源编码的匹配原则这些多值符号之间的相关性也不予考虑。这就使信源编码的匹配原则不能充分满足,编码效率一般不高。不能充分满足,编码效率一般不高。为了克服这种局限性,需要跳出分组码范畴,为了克服这种局限性,需要跳出分组码范畴,从整个符号序列出发,采从整个符号序列出发,采用递推形式进行编码用递推形式进行编码。现在学习的是第2页,共28页 从整个符号序列出发,根据各信源序列的概率将信源序列映射到从整个符号序列出发,根据各信源序列的概率将信源序列映射到0,1) 区间上,然后选取区间内的一点(也就是一个二进区间上,然后选取区间内的一点(也就是一个二进制的小数)来表示信源序列。制的小数)来表示信源序列。算
3、术编码基本思想算术编码基本思想 设信源字母表为设信源字母表为a1, a2,概率概率p(a1)=0.6, p(a2)=0.4,将将0,1按概率比例分为区间按概率比例分为区间0,0.6,0.6,l。p(a1)p(a2)0 0.6 10 0.36 0.6 0.84 1p(a1a1)p(a1a2)p(a2a1)p(a2a2)随着序列的长度不断增加随着序列的长度不断增加,C所在区间的长度就越短所在区间的长度就越短,精精确地确定确地确定C的位置需要码长的位置需要码长也不断增加也不断增加现在学习的是第3页,共28页 设信源符号集设信源符号集A=a1,a2,an, 其相应概率分布为其相应概率分布为pi, pi
4、 0 (i=1,2, ,n), 定义信源符号的定义信源符号的为为 P1= 0; P2= p1 ; P3= p1+p2 ; 11riirpP累积概率累积概率r=1,2, ,npr = Pr+1 - Pr) 1 , 0rPP1p1P2P3P41p2p30现在学习的是第4页,共28页 当当A=0,1二元信源时,二元信源时,P1=P(0)= 0 ; P2 = P(1)= p0P(0)P(1)01p0p1二元序列的累积概率引例引例设有二元序列设有二元序列S=011,求,求S的累积概率的累积概率P(S)=p(000)+ p(001)+ p(010)现在学习的是第5页,共28页若若S后面接后面接0P(S0)
5、=p(0000)+ p(0001)+ p(0010)+p(0011)+ p(0100)+ p(0101) =p(000)+ p(001)+ p(010) =P(S)若若S后面接后面接1P(S1)=p(0000)+ p(0001)+ p(0010)+p(0011)+ p(0100)+ p(0101)+ p(0110) =P(S)+ p(0110) =P(S)+p(S) p0二元序列的累积概率P(0)=0,P(1)=p0 P(Sar)=P(S) + p(S) PrS0=0110S1=0111 p(Sar)=p(S) p(ar) p(Sar)=p(S) p(ar) P(Sar)=P(S) + p(S
6、) Pr现在学习的是第6页,共28页P(0)0P(1)1p0设符号序列设符号序列S = 011p1P(0)P(1)p(00)=p(0)P(1)P(01)p(01)P(01)P(1)P(011)p(010)=p(01)P(1)p(011)二元序列的累积概率 P(Sar)=P(S)+p(S)Pr现在学习的是第7页,共28页累积概率递推公式累积概率递推公式一般多元信源序列的累积概率递推公式一般多元信源序列的累积概率递推公式rrPSpSPaSPP)()(),(0)()()(),(),(1)(rrrapSpaSpaSAp序列的概率序列的概率(所对应区间的宽度所对应区间的宽度)递推公式递推公式SrrPSp
7、SPaSPP/)()(),(0)()/()(),(),(1)(SapSpaSpaSAprrr现在学习的是第8页,共28页实际中实际中,求序列累积概率只需两个存储器求序列累积概率只需两个存储器,起始时可令起始时可令: A() =1, P() = 0 每输入一个符号每输入一个符号,存储器存储器P和和A 就按照上式更新一次就按照上式更新一次,直至符号输入完毕直至符号输入完毕,这时存储器这时存储器P的内容即为该序列的累积概率。的内容即为该序列的累积概率。 0)()()(),(PPSpSPaSPrr,1)()()(),(),(papSpaSpaSArrr,累积概率递推公式累积概率递推公式累积概率递推计算
8、累积概率递推计算注意:计算过程中注意:计算过程中,每输入一个符号只要进行乘法和加每输入一个符号只要进行乘法和加法运算。法运算。现在学习的是第9页,共28页 通过信源符号序列累积概率计算通过信源符号序列累积概率计算,把区间分割成许多小把区间分割成许多小区间区间,不同的信源符号序列对应不同的区间为不同的信源符号序列对应不同的区间为P(S), P(S) + p(S) ,可取小区间内的一点来代表这序列。,可取小区间内的一点来代表这序列。 将符号序列的将符号序列的写成二进位小数,取小数点后写成二进位小数,取小数点后L位位,若后面有尾数若后面有尾数,就进位到第就进位到第L位,即位,即)(1logSpL算术
9、编码算术编码若若P(S) = 0.10110001,L=3 则则C = 0.110LLSP.0)(现在学习的是第10页,共28页算术编码的唯一可译性算术编码的唯一可译性由码由码C的形成方法,的形成方法,)(SPC )(1logSpL又又可知可知可知可知LSp 2)()()(SpSPLSP2)(C由此可见由此可见C必在必在)()(),(SpSPSP)()(),(SpSPSPCLSPC2)(,因而唯一可译。因而唯一可译。)(1logSpL对于长序列,对于长序列,p(S)必然很小,必然很小,L与概率倒数对数几乎相等,也与概率倒数对数几乎相等,也就是说取整造成的差别很小,因而平均码长将接近于信源熵就是
10、说取整造成的差别很小,因而平均码长将接近于信源熵H(S)现在学习的是第11页,共28页7)(1logSpL设二元无记忆信源设二元无记忆信源S=0,1,p(0)=1/4,p(1)=3/4。S=11111100,对其做算术编码。,对其做算术编码。P(S) = p(00000000) + p(00000001) + p(00000010) + + p(11111011) = 1- p(11111111)- p(11111110)- p(11111101) - p(11111100) = 1- p(111111) = 1-(3/4)6= 0.110100100111从而得从而得C = 0.110101
11、0,S的码字为的码字为1101010解:解:p(S) = p2(0)p6(1) = (1/4)2 (3/4)6例例 题题1101001%7 .928/7811. 0现在学习的是第12页,共28页+=p(1)=3/4=(0.11)2p(11)=(3/4)2=(0.1001)2+=p(0)=(1/4)=2-2p(S)p(0)p(S)右移2位现在学习的是第13页,共28页1log14( )npu设无记忆信源设无记忆信源U=a1,a2,a3,a4,其概率分布依次为,其概率分布依次为 0.5,0.25,0.125,0.125,对信源序列,对信源序列做算术编码。做算术编码。解:解:例例 题题21 1341
12、21a a a a a a a au42214( )(0.5) (0.25) (0.125)2Pu现在学习的是第14页,共28页序号uip(ui)P(ui)l(ui)C0空1001a21/41/220.102a11/81/230.1003a11/161/240.10004a31/12835/6470.10001105a41/1024567/1024100.10001101116a11/2048567/1024110.100011011107a21/81922269/4096130.10001101110108a11/163842269/4096140.10001101110100算术编码递推过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论 算术 编码
限制150内