信息论与编码第5章-3.ppt
《信息论与编码第5章-3.ppt》由会员分享,可在线阅读,更多相关《信息论与编码第5章-3.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信源编码信源编码 第5章5.1 编码的定义5.2 无失真信源编码5.3 限失真信源编码5.4 常用信源编码方法简介内容25.3 限失真信源编码定理3限失真信源编码定理 在本章一开始我们就分析了在很多实际信源中,特别在模拟的连续信源中,无失真要求是完全没有必要的,而且也是达不到的。在实际中限失真信源是具有现实意义的4限失真信源编码定理 限失真信源编码定理:设离散无记忆信源X的信息率失真函数为R(D),当信息率 RR(D)时,只要信源序列长度 L 足够长,一定存在一种编码方法,其译码失真小于或等于 D+,为任意小的正数;反之,若RR(D),则无论采用什么样的编码方法,其译码失真必大于D。如是二元信
2、源,则对于任意小的0,每一个信源符号的平均码长满足如下公式:55.4 常用信源编码方法6常用信源编码 香农编码、费诺编码、哈夫曼编码主要是针对无记忆信源。当信源有记忆时上述编码效率不高;游程编码对相关信源编码更有效;香农编码、费诺编码、哈夫曼编码属于无失真信源编码;游程编码属于限失真信源编码。7游程编码 游程:数字序列中连续出现相同符号的一段。二元序列的游程:只有“0”和“1”两种符号。连“0”这一段称为“0”游程,它的长度称为游程长度L(0);连“1”这一段称为“1”游程,它的游程长度用L(1)表示。8游程编码 二元独立序列游程长度概率 若规定二元序列总是从“0”开始,第一个游程是“0”游程
3、,则第二个游程必为“1”游程,第三个又是“0”游程。对于随机序列,游程长度是随机的其取值可为1,2,3,,直至无穷。游程长度序列/游程序列:用交替出现的“0”游程和“1”游程长度表示任意二元序列。游程变换:是一种一一对应的变换,也是可逆变换。例如:二元序列000101110010001 可变换成如下游程序列 311321319 游程变换减弱了原序列符号间的相关性。游程变换将二元序列变换成了多元序列;这样就适合于用其他方法,如哈夫曼编码,进一步压缩信源,提高通信效率。编码方法:首先测定“0”游程长度和“1”游程长度的概率分布,即以游程长度为元素,构造一个新的信源;对新的信源(游程序列)进行哈夫曼
4、编码。游程编码10传真编码 文件传真的基本特性 文字传真:黑、白两个灰度级 图像传真:有比较丰富的灰度的图片、图像 数字式文件传真把一页文件分为nm个像素 Xij表示第i行(i=l,2n)第j列(j=l,2m)的像素 由于文件传真是二值电平二值电平的,即只有两个灰度值,Xij0(白色)1(黑色)11传真编码 直接编码:每一个像素用一位二进码(0或1)代表 一页文件的码元数就等于该页二值图像的像素数 X3=1111 0010 0011 0001 1111分辨率分辨率:单位长度(lmm)包含的像素数。分辨率愈高,文件细节愈清晰,文件质量也就愈高。但是表示一页文件的比特数就愈多。12 例如一页A4文
5、件,分辨率为5点/mm。直接编码时需传送:21029752=1.5Mbit 用2400bit/s的数码率传送约需11分钟 如果希望达到CCITT的第3类文件传真机的标准,即用市话网作信道,1分钟内传输一页A4文件,那么我们就需要找到一种编码方法,把数码压缩到原来的1/11。某一种编码的压缩比为:13 CCITT建议使用两种分辨率:1728像素/行(8样点/mm),3.85行/mm(4行/mm)1728像素/行(8样点/mm),7.7行/mm(8行/mm)根据汉字的特点,对传真用的七种试用样张进行了统计,测得下列平均值:p(白)=pW=93.3 p(黑)=pB=6.7 测试结果表明:50%LW小
6、于18个像素 80%LW小于61个像素 50%LB小于4个像素 80%LB小于6个像素LW白游程长度LB 黑游程长度14游程编码 有了上述游程的概率分布,对不同的游程长度,按其不同的发生概率,可以分配不同的码字,这种编码方式称为游程编码。游程编码既可以将白、黑游程分别按其概率进行分别编码,也可以将白长与黑长混起来统一编码。15 黑、白分开编码时 白游程熵:其中LW为白游程长度,p(LW)为对应的白游程概率,L为游程最大长度,对文件传真L=1728,白游程平均编码长度应满足:令 为白游程长的平均像素数P84:5-2-9每像数的编码比特数 平均每像素的熵值 16 黑游程熵:黑游程平均编码长应满足
7、经过黑、白平均可得每个像素的熵值 每个像素的编码比特数 17 黑、白游程分别最佳编码后,由每个像素的熵hWB 即可得到最小比特率。极限压缩比游程编码18 对中文A4文件七种样张的平均值:分辨率88 分辨率84 pW=0.9326 0.933;pB=0.0674 0.0670 LW=85.99 86.44 像素(pel)LB=5.73 5.72 像素(pel)HW=5.89 5.87 b/run HB=3.14 3.14 b/run hWB=0.1003 0.0997 b/pel K0=9.97 10.03对中文A4文件,7种样张的统计极限压缩比 K0 10倍195.4.2 算术编码 算术编码是
8、近十多年来发展迅速的一种无失真信源编码,它与最佳的哈夫曼码相比,理论性能稍加逊色,而实际压缩率和编码效率却往往还优于哈夫曼码,且实现简单,故很受工程上的重视。算术编码不同于哈夫曼码,它是非分组(非块)码。它从全序列出发,考虑符号之间的关系来进行编码。算术编码利用了累积概率累积概率的概念。算术码主要的编码方法是计算输入信源符号序列所对应的区间。20算术码的主要概念 算术码的主要概念:把信源输出序列的概率和实数段0,1中的一个数C联系起来。设信源字母表为a1,a2,其概率p(a1)=0.6,p(a2)=0.4 将0,1分成与概率比例相应的区间,0,0.6 0.6,lp(a1)p(a2)0 0.6
9、1 设信源输出序列S=S1S2S3Sn 当信源输出的第一个符号S1=a1时,数C的值处在0,0.6 当信源输出的第一个符号S1=a2时,数C的值处在0.6,l 根据信源S1的情况,把C所在的段再次按概率比例划分0 0.36 0.6 0.84 1p(a1a1)p(a1a2)p(a2a1)p(a2a2)随着序列的长度不断增加,C所在区间的长度就越短,也就可以更加精确地确定C的位置 21累积概率 设信源符号集A=a1,a2,an,其相应概率分布为p(ai),p(ai)0(i=1,2,n)信源符号的累积概率累积概率为 显然 P1=0;P2=p1;P3=p1+p2;而且 pr=Pr+1 Pr22 累积概
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论 编码
限制150内