信息论第讲算术编码与编码讲稿.ppt





《信息论第讲算术编码与编码讲稿.ppt》由会员分享,可在线阅读,更多相关《信息论第讲算术编码与编码讲稿.ppt(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信息论第讲算术编码与编码第一页,讲稿共二十八页哦算术编码算术编码前面所讨论的无失真编码,都是建立在信源符号与码字一一对应的前面所讨论的无失真编码,都是建立在信源符号与码字一一对应的基础上,这种编码方法通常称为基础上,这种编码方法通常称为块码或分组码块码或分组码,此时信源符号一,此时信源符号一般是般是多元多元的。的。如果要对二元序列进行编码,则需采用合并信源符号方法,把二元如果要对二元序列进行编码,则需采用合并信源符号方法,把二元序列转换成多值符号,转换时二元符号之间的相关性不予考虑,转序列转换成多值符号,转换时二元符号之间的相关性不予考虑,转换后这些多值符号之间的相关性也不予考虑。这就使信源编
2、码的匹换后这些多值符号之间的相关性也不予考虑。这就使信源编码的匹配原则不能充分满足,编码效率一般不高。配原则不能充分满足,编码效率一般不高。为了克服这种局限性,需要跳出分组码范畴,为了克服这种局限性,需要跳出分组码范畴,从整个符号序列出从整个符号序列出发,采用递推形式进行编码发,采用递推形式进行编码。第二页,讲稿共二十八页哦 从整个符号序列出发,根据各信源序列的概率将信源序列映射从整个符号序列出发,根据各信源序列的概率将信源序列映射到到0,1)区间上,然后选取区间内的一点(也就是一个二进区间上,然后选取区间内的一点(也就是一个二进制的小数)来表示信源序列。制的小数)来表示信源序列。算术编码基本
3、思想算术编码基本思想 设信源字母表为设信源字母表为a1,a2,概率概率p(a1)=0.6,p(a2)=0.4,将将0,1按概率比例分为区间按概率比例分为区间0,0.6,0.6,l。p(a1)p(a2)0 0.6 10 0.36 0.6 0.84 1p(a1a1)p(a1a2)p(a2a1)p(a2a2)随着序列的长度不断增加随着序列的长度不断增加,C所所在区间的长度就越短在区间的长度就越短,精确地精确地确定确定C的位置需要码长也的位置需要码长也不断增加不断增加第三页,讲稿共二十八页哦 设信源符号集设信源符号集A=a1,a2,an,其相应概率分布为其相应概率分布为pi,pi 0(i=1,2,n)
4、,定义信源符号的定义信源符号的累积概率(分布函数)累积概率(分布函数)累积概率(分布函数)累积概率(分布函数)为为 P1=0;P2=p1;P3=p1+p2;累积概率累积概率r=1,2,npr=Pr+1-PrP1p1P2P3P41p2p30第四页,讲稿共二十八页哦 当当A=0,1二元信源时,二元信源时,P1=P(0)=0;P2=P(1)=p0P(0)P(1)01p0p1二元序列的累积概率二元序列的累积概率引例引例设有二元序列设有二元序列S=011,求,求S的累积概率的累积概率P(S)=p(000)+p(001)+p(010)第五页,讲稿共二十八页哦若若S后面接后面接0P(S0)=p(0000)+
5、p(0001)+p(0010)+p(0011)+p(0100)+p(0101)=p(000)+p(001)+p(010)=P(S)若若S后面接后面接1P(S1)=p(0000)+p(0001)+p(0010)+p(0011)+p(0100)+p(0101)+p(0110)=P(S)+p(0110)=P(S)+p(S)p0二元序列的累积概率二元序列的累积概率P(0)=0,P(1)=p0 P(Sar)=P(S)+p(S)PrS0=0110S1=0111 p(Sar)=p(S)p(ar)p(Sar)=p(S)p(ar)P(Sar)=P(S)+p(S)Pr第六页,讲稿共二十八页哦P(0)0P(1)1p
6、0设符号序列设符号序列S=011p1P(0)P(1)p(00)=p(0)P(1)P(01)p(01)P(01)P(1)P(011)p(010)=p(01)P(1)p(011)二元序列的累积概率二元序列的累积概率 P(Sar)=P(S)+p(S)Pr第七页,讲稿共二十八页哦累积概率递推公式累积概率递推公式一般多元信源序列的累积概率递推公式一般多元信源序列的累积概率递推公式序列的概率序列的概率(所对应区间的宽度所对应区间的宽度)递推公式递推公式第八页,讲稿共二十八页哦实际中实际中,求序列累积概率只需两个存储器求序列累积概率只需两个存储器,起始时可令起始时可令:A()=1,P()=0 每输入一个符号
7、每输入一个符号,存储器存储器P和和A 就按照上式更新一次就按照上式更新一次,直至符号输入直至符号输入完毕完毕,这时存储器这时存储器P的内容即为该序列的累积概率。的内容即为该序列的累积概率。累积概率递推公式累积概率递推公式累积概率递推计算累积概率递推计算注意:计算过程中注意:计算过程中,每输入一个符号只要进行乘法和加每输入一个符号只要进行乘法和加法运算。法运算。第九页,讲稿共二十八页哦 通过信源符号序列累积概率计算通过信源符号序列累积概率计算,把区间分割成许多把区间分割成许多小区间小区间,不同的信源符号序列对应不同的区间为不同的信源符号序列对应不同的区间为P(S),P(S)+p(S),可取小区间
8、内的一点来代表这序列。,可取小区间内的一点来代表这序列。将符号序列的将符号序列的累积概率累积概率累积概率累积概率写成二进位小数,取小数点后写成二进位小数,取小数点后L位位,若后面有尾数若后面有尾数,就进位到第就进位到第L位,即位,即算术编码算术编码若若P(S)=0.10110001,L=3 则则C=0.110第十页,讲稿共二十八页哦算术编码的唯一可译性算术编码的唯一可译性由码由码C的形成方法,的形成方法,又又可知可知可知可知由此可见由此可见C必在必在,因而唯一可译。因而唯一可译。对于长序列,对于长序列,p(S)必然很小,必然很小,L与概率倒数对数几乎相等,与概率倒数对数几乎相等,也就是说取整造
9、成的差别很小,因而平均码长将接近于也就是说取整造成的差别很小,因而平均码长将接近于信源熵信源熵H(S)第十一页,讲稿共二十八页哦设二元无记忆信源设二元无记忆信源S=0,1,p(0)=1/4,p(1)=3/4。S=11111100,对其做算术编码。,对其做算术编码。P(S)=p(00000000)+p(00000001)+p(00000010)+p(11111011)=1-p(11111111)-p(11111110)-p(11111101)-p(11111100)=1-p(111111)=1-(3/4)6=0.110100100111从而得从而得C=0.1101010,S的码字为的码字为110
10、1010解:解:p(S)=p2(0)p6(1)=(1/4)2(3/4)6例例 题题1101001第十二页,讲稿共二十八页哦+=p(1)=3/4=(0.11)2p(11)=(3/4)2=(0.1001)2+=p(0)=(1/4)=2-2p(S)p(0)p(S)右移2位第十三页,讲稿共二十八页哦设无记忆信源设无记忆信源U=a1,a2,a3,a4,其概率分布依次为,其概率分布依次为 0.5,0.25,0.125,0.125,对信源序列,对信源序列做算术编码。做算术编码。解:解:例例 题题第十四页,讲稿共二十八页哦序号uip(ui)P(ui)l(ui)C0空1001a21/41/220.102a11/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论 算术 编码 讲稿

限制150内