信息论与编码限失真信源编码PPT讲稿.ppt
《信息论与编码限失真信源编码PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《信息论与编码限失真信源编码PPT讲稿.ppt(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信息论与编码限失真信源编码第1页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码第三章我们讨论了无失真信源编码。但是,在很多场合,特别是对于连续信源,因为其绝对熵为无限大,若要求无失真地对其进行传输,则要求信道的信息传输率也为无限大,这是不现实的。因此也就不可能实现完全无失真传输。另一方面,从无失真信源编码定理来考虑,由于要求码字包含的信息量大于等于信源的熵,所以对于连续信源,要用无限多个比特才能完全无失真地来描述。第2页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码即使对于离散信源,由于处理的信息量越来越大,使得信息的存储和传输成本很高,而且在很多场合,过高
2、的信息率也没有必要,例如:由于人耳能够接收的带宽和分辨率是有限的,因此对数字音频传输的时候,就允许有一定的失真,并且对欣赏没有影响。又如对于数字电视,由于人的视觉系统的分辨率有限,并且对低频比较敏感,对高频不太敏感,因此也可以损失部分高频分量,当然要在一定的限度内。等等这些,都决定了限失真信源编码的重要性。第3页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码在限失真信源编码里,一个重要的问题就是在一定程度的允许失真限度内,能把信源信息压缩到什么程度,即最少用多少比特数才能描述信源。这个问题已经被香农解决。香农在1948年的经典论文中已经提到了这个问题,在1959年,香农又在他
3、的一篇论文“保真度准则下的离散信源编码定理”里讨论了这个问题。研究这个问题并做出较大贡献的还有前苏联的柯尔莫郭洛夫(Kolmogorov)以及伯格(T.Berger)等。第4页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码信息率失真理论矢量化、数摸转换、频带压缩和数据压缩的理论基础。本章主要介绍信息率失真理论的基本内容,包括信源的失真度和信息率失真函数的定义与性质,离散信源和连续信源的信息率失真函数计算,介绍一些常用的限失真编码方法等。第5页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码4.1 平均失真和信息率失真函数平均失真和信息率失真函数一、失真函数设某
4、信源输出的随机变量为X,其值集合为 ,经过编码后输出为 ,设 对应 ,如果则认为没有失真。当 时,就产生了失真,失真的大小,用失真函数来衡量。失真函数的定义为第6页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码由于输入符号有n个,输出符号有m个,所以共有 个,写成矩阵形式,就是d被称为失真矩阵。第7页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码失真函数 的函数形式可以根据需要适当选取,如平方代价函数、绝对代价函数、均匀代价函数等:平方失真:绝对失真:相对失真:误码失真:第8页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码也可以按其它的标准
5、,如引起的损失、风险、主观感觉上的差别等来定义失真函数。二、平均失真由于信源X和信宿Y都是随机变量,所以符号失真度函数也是一个随机变量,传输时引起的平均失真应该是符号失真度函数 在信源概率空间和信宿概率空间求平均,即第9页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码平均失真是符号失真函数在信源空间和信宿空间平均的结果,是描述某一信源在某一信道传输时失真的大小,是从整体上描述系统的失真情况。三、信源符号序列的失真从上面的单符号失真函数,可以得到信源符号序列的失真函数和平均失真度。由于序列时相当于是一个由单符号随机变量组成的随机矢量,仿照单符号时的情况,可得:第10页,共45页
6、,编辑于2022年,星期四信息论与编码-限失真信源编码设信源输出的符号序列为 ,其中的每一个随机变量 取自同一符号集 ,所以X共有 种不同的符号序列,记为 ,接收到的符号为 式中每一个符号取自符号集 ,所以Y共有 种不同的符号序列,记为 ,则 第11页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码失真函数矩阵应该是一个 的矩阵。故对L长的信源序列,其平均失真度为平均每个符号的平均失真度为当信源无记忆时,而第12页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码若平均失真度不大于我们所允许的失真D,即我们称此为保真度准则。四、信息率失真函数在信源给定,并且也定义
7、了具体的失真函数之后,我们总是希望在满足一定的失真限度要求的情况下,使信源最后输出的信息率R尽可能地小。也就是说,要在满足保真度准则下(),寻找信源输出信息率R的下限值。如果将信源编码也看成是一个信道,构成了一类假想信道,第13页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码称为D允许信道(或D失真许可的试验信道),记为对于离散无记忆信道,有我们的目的,就是要在上述允许信道 中,寻找到一个信道P(Y/X),使得从输入端传送过来的信息量最少,即I(X;Y)最小。这个最小的互信息就称为信息率失真函数R(D),简称为率失真函数,即第14页,共45页,编辑于2022年,星期四信息论与
8、编码-限失真信源编码其单位是比特/信源符号。应当注意,在研究R(D)时,我们引用的条件概率 并没有实际信道的含义,只是为了求平均互信息的最小值而引用的、假想的可变试验信道。实际上这些信道反应的仅是不同的有失真信源编码,或称信源压缩。所以改变试验信道求最小值,实质上是选择一种编码方式式信息第15页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码传输率为最小,也就是在保真度准则下,使信源的压缩率最高。五、信息率失真函数的性质 1.R(D)的定义域R(D)的定义域,即D的取值范围。(1)因为D是非负函数d(x,y)的数学期望,因此D也是非负函数,其下界为0。此时,第16页,共45页,
9、编辑于2022年,星期四信息论与编码-限失真信源编码意味着不允许失真,所以信道的信息率等于信源的熵,即(2)平均失真D也有一上界值 。根据R(D)的定义,R(D)是在一定的约束条件下,平均互信息量I(X;Y)的最小值,其下界为0。R(D)和D的关系曲线一般如下图所示。当D大到一定程度,R(D)就达到其下界0,我们定义这时的D为 。第17页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码n 的计算:设当平均失真 时,R(D)以达到其下界0。当允许更大失真时,即 时,R(D)仍只能继续是0。因为当X和Y统计独立时,平均互信息I(X;Y)=0,可见当 时,信源X和接收符号Y已经统计独
10、立了,因此 ,与x无关。R(D)DR(D)0R(D)=0第18页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码因此,就是在R(D)=0的条件下,看在什么分布下,能够得到的平均失真D的最小值,即也可以改写成第19页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码也就是说,要求 的数学期望的最小值。这个最小值是一定存在的。比如 这样分布:当某一个 使得 为最小时,就取 ,而其余的 ,此时求得的 的数学期望一定是最小的。此时,有例题:设输入输出符号表为X=Y=0,1,输入概率分布为 ,失真矩阵为第20页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码
11、求解:第21页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码而输出符号概率为例题2:输入输出符号表同上题,失真矩阵为求解:第22页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码此时,(2)R(D)函数的单调递减性和连续性R(D)的单调递减性是很容易理解的。因为允许的失真越大,所要求的信息率就可以越小。根据R(D)的定义,他是在平均失真度小于或等于允许失真度D的所有试验信道集合 中,取I(X;Y)的最小值。当允许失真D扩大,则 的集合也扩大,当然仍然包含原来满足条件的所有信道。这是在扩大了的 集合中找I(X;Y)的最小值,第23页,共45页,编辑于2022年,
12、星期四信息论与编码-限失真信源编码显然或者是最小值不变,或者是变小了,所以R(D)是非增的。关于R(D)的连续性,这里我们就不再证明了。所以,R(D)有如下基本性质:n ,定义域为 ,当 时,R(D)=0。nR(D)是关于D的连续函数。nR(D)是关于D的严格递减函数。第24页,共45页,编辑于2022年,星期四信息论与编码-限失真信源编码因此,当规定了允许失真,又找到了适当的失真函数 ,就可以找到该失真条件下的最小信息率R(D),用不同的方法进行数据压缩时(在允许的失真限度D内),其压缩的程度如何,可以用R(D)来衡量。由它可知是否还有压缩潜力,有多大的压缩潜力。因此,有关R(D)的研究也是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论 编码 失真 信源 PPT 讲稿
限制150内