信息论与编码理论基础第三章PPT讲稿.ppt
《信息论与编码理论基础第三章PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《信息论与编码理论基础第三章PPT讲稿.ppt(195页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信息论与编码理论基础第三章2022/9/281第1页,共195页,编辑于2022年,星期五 信源发出的消息序列通常不能直接信源发出的消息序列通常不能直接送给信道传输,需要经过信源编码和信送给信道传输,需要经过信源编码和信道编码。道编码。2022/9/282第2页,共195页,编辑于2022年,星期五信道编码信道编码n在传输过程中噪声和干扰在所难免,为了在传输过程中噪声和干扰在所难免,为了降低差错率,提高降低差错率,提高传送的可靠性,传送的可靠性,在信道编码器中可以引入冗余度,在信道解在信道编码器中可以引入冗余度,在信道解码端就可以利用此冗余度来尽可能地重建输入序列。码端就可以利用此冗余度来尽可
2、能地重建输入序列。n可靠性:增加冗余可靠性:增加冗余2022/9/283第3页,共195页,编辑于2022年,星期五信源编码信源编码n对信源进行对信源进行压缩压缩、扰乱和加密,用最少的码字最安全地传输最大、扰乱和加密,用最少的码字最安全地传输最大的信息量:的信息量:n有效性有效性和安全性:去除冗余和安全性:去除冗余n如何对信源进行建模?(如随机过程)如何对信源进行建模?(如随机过程)n如何测量信源的内容?(熵)如何测量信源的内容?(熵)n如何表示一个信源?(编码:码字设计)如何表示一个信源?(编码:码字设计)2022/9/284第4页,共195页,编辑于2022年,星期五为什么需要信源编码/数
3、据压缩n数字化视频和音频等媒体信息的数据量很大数字音频格式频带范围(Hz)取样频率(kHz)样本精度(bit)声道数原始码率(Kb/s)电话300340088164调频(FM)广播201500022.03162705.6激光唱盘(CD)202000044.11621411.2数字视频格式每秒帧数图像分辨率(像素)样本精度(bit)亮度信号原始码率(Mb/s)CIF格式的亮度信号30352*288824.33HDTV亮度信号一例601920*10808995.32022/9/285第5页,共195页,编辑于2022年,星期五为什么需要信源编码/数据压缩n减少存储空间减少存储空间n文件压缩、图像压
4、缩、语音压缩、视频压缩文件压缩、图像压缩、语音压缩、视频压缩n减少传输时间减少传输时间2022/9/286第6页,共195页,编辑于2022年,星期五信源编码信源编码/数据压缩的数据压缩的例子:例子:摩尔斯式电码摩尔斯式电码n19世纪中叶,由 Samuel Morse发明n每个字符用“.”或“”表示n观察:一些字符比另外一些字符出现的频率更高,如“a,e”比“z,q”出现的频率高n因此,为了减少发送信息的平均时间,用较短的序列表示出现频率高的字符,较长的序列表示出现频率低的字符ne:.,a:.nq:-.-,j:.-2022/9/287第7页,共195页,编辑于2022年,星期五为什么可以进行为
5、什么可以进行信源编码信源编码/数据压缩数据压缩n自然界中的大多数数据都是冗余的:任何非随机选择的数据都有一定结构,可利用这种结构得到数据的更紧致表示n统计冗余:大多数常见的压缩算法都是利用该冗余n字母冗余:英文中字母E最常出现,而Z很少出现n文本冗余:字母Q后常跟有字母U2022/9/288第8页,共195页,编辑于2022年,星期五例:空间冗余n图像中存在大面积部分相似或完全一样的像素图像中存在大面积部分相似或完全一样的像素pmf2022/9/289第9页,共195页,编辑于2022年,星期五例:时间冗余n视频图像前后几帧的内容变化不大(位置可能不同,视频图像前后几帧的内容变化不大(位置可能
6、不同,可用运动估计方法找到对应位置)可用运动估计方法找到对应位置)2022/9/2810第10页,共195页,编辑于2022年,星期五例:结构冗余n图像中物体表面纹理等结构存在冗余图像中物体表面纹理等结构存在冗余2022/9/2811第11页,共195页,编辑于2022年,星期五怎样进行信源编码信源编码n无失真编码无失真编码:若若要求将信源输出在接收端精确地重现出来,即保证信源输出所携带的信息全部无损地传达给信宿,就要对信源进行无失真编码。n无失真编码只是对信源冗余度进行压缩,并不改变信源熵,它能保证信源序列经无扰信道传输后,得到无失真的恢复。n限定失真编码限定失真编码:在实际传信中,要精确的
7、复制出信源的输出是不可能的,根据信源信宿对定出的可接收准则或保真度准则,计算要保留多少有关信源输出的信息量,以及如何表示它们,这就是限定失真的信源编码问题。2022/9/2812第12页,共195页,编辑于2022年,星期五第三章:第三章:信源编码(一)离散信源无失真编码3.1 信源及其分类信源及其分类3.2 离散无记忆(简单)信源的等长编码离散无记忆(简单)信源的等长编码3.3 离散无记忆(简单)信源的不等长编离散无记忆(简单)信源的不等长编码码3.4 最佳不等长编码最佳不等长编码2022/9/2813第13页,共195页,编辑于2022年,星期五3.1 信源及其分类信源及其分类信源的概念信
8、源的概念:信源就是信息的来源。注意注意:n在一个固定的时刻,信源发出的是一个随机变在一个固定的时刻,信源发出的是一个随机变量量。n随着时间的延续,信源发出一个又一个随机变量,随着时间的延续,信源发出一个又一个随机变量,称之为一个随机过程。称之为一个随机过程。因此,可以用概率空间来描述信源。因此,可以用概率空间来描述信源。2022/9/2814第14页,共195页,编辑于2022年,星期五3.1 信源及其分类信源及其分类离散信源离散信源 信源每隔一个定长时间段就发出一个随机变量;随着时间的延续,信源发出的是随机变量序列U-2U-1U0U1U2,其中 Uk为第k个时间段发出的随机变量;每个Uk都是
9、一个离散型的随机变量。离散无记忆信源离散无记忆信源 随机变量、U-2、U-1、U0、U1、U2、相互独立的离散信源。离散无记忆离散无记忆 随机变量、U-2、U-1、U0、U1、U2、简单信源简单信源 具有相同的概率分布的离散无记忆信源。2022/9/2815第15页,共195页,编辑于2022年,星期五3.1 信源及其分类信源及其分类(总结:离散无记忆简单信源离散无记忆简单信源就是时间离散、事件离散、各随机变量独立同分布的信源。课程学习所面对的信源将主要是离散无记忆简单信源)一般的信源一般的信源 连续信源:有时间连续的信源,也有事件连续的信源;有记忆信源:信源在不同时刻发出的随机变量相互依赖;
10、有限记忆信源:在有限时间差内的信源随机变量相互依赖;非简单信源:信源在不同时刻发出的随机变量具有不同的 概率分布。马尔可夫信源:信源随机过程是马尔可夫过程。2022/9/2816第16页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码(1)设有一个离散无记忆简单信源离散无记忆简单信源,信源发出的随机变量序列为:U-2U-1U0U1U2。设信源随机变量U1的事件有K个:a1,a2,aK,则L维信源随机向量(U1U2UL)的事件有KL个:(u1u2uL)|其中每个分量ul跑遍a1,a2,aK。P(U1U2UL)=(u1u2uL)=P(U
11、1=u1)P(U2=u2)P(UL=uL)=P(U1=u1)P(U1=u2)P(U1=uL)=q(u1)q(u2)q(uL)(2)D元编码元编码:设有一个含D个字母的字母表,对于(U1U2UL)的每一个事件(u1u2uL),都用一个字母串(c1c2)来表示。2022/9/2817第17页,共195页,编辑于2022年,星期五码长:码字所含码元的个数 等长编码:所有码字均有相同的码长N,对应的码 叫做等长码(FLC,Fixed Length code);否则为变长编码。编码器码字码字:每一个事件每一个事件(u1u2uL)所对应的字母串所对应的字母串(c1c2)。编码器模型:D个字母的字母表A信源
12、2022/9/2818第18页,共195页,编辑于2022年,星期五n熵是随机变量平均不确定性的一个测度,表示了描述这个随机变量所需要的平均比特数2022/9/2819第19页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码例例:离散无记忆简单信源发出的随机变量序列为:U-2U-1U0U1U2。其中U1的事件有3个:晴,云,阴。(U1U2)有9个事件 (晴晴),(晴云),(晴阴),(云晴),(云云),(云阴),(阴晴),(阴云),(阴阴)。用字母表0,1对(U1U2)的事件进行2元编码如下:(晴晴)0000,(晴云)0001,(晴阴
13、)0011,(云晴)0100,(云云)0101,(云阴)0111,(阴晴)1100,(阴云)1101,(阴阴)1111。2022/9/2820第20页,共195页,编辑于2022年,星期五n无错编码无错编码(唯一可译码)(U1U2UL)的不同事件用不同的码字来表示。n能够实现无错编码的充要条件是DNKL。(即NlogD/LlogK)n这里nN/L表示每个信源符号所需要的码符号数;logD是一个码符号所能载荷的最大信息量;nN/LlogK/logD说明对于等长唯一可译码平均每个信源符号至少需要logK/logD个码符号对其进行编码变换;n(NlogD)/L是编码后平均每个信源符号所能载荷的信息量
14、的最大值,称为编码速率,记为R.n 关于编码速率的说明:由编码速率的计算公式R=NlogD/L,似乎可以任意设置N和L,进而可以任意设置编码速率。事实上存在着编码设备的性能指标:编码速率R0。这就是说,选择N和L,必须使得实际的编码速率NlogD/L不能超过编码设备的编码速率R0。n有错编码有错编码 (U1U2UL)的有些不同事件用相同的码字来表示。编码是一种由消息集到码字集的映射2022/9/2821第21页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码n无错编码的最低代价无错编码的最低代价n当R=(NlogD)/LlogK时,
15、能够实现无错编码。(DNKL)n当RH(U1)时,无论怎样编码都是有错编码。这是因为RH(U1)logK。(DNRH(U1)时,虽然无论怎样编码都是有错编码,但可以适当地编码和译码使译码错误的概率pe任意小。这就是所谓“渐进无错编码”。3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码2022/9/2823第23页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码n我们以英文电报为例,由于英文字母之间有很强的关联性,n当用字母组合成不同的英文字母序列时,并不是所有的字母组合都是有意义的单词,n若再把单词组合成更长
16、的字母序列时,也不是任意的单词组合都是有意义的句子,n因此,在足够长的英文字母序列中,就有许多无用和无意义的序列,这些信源序列出现的概率等于零或任意小,那么在编码时,对于那些无用的字母组合,无意义的句子都可以不编码,从而提高传输效率,但同时,会引入一定的误差,但是当L足够大时,这种误差概率就可以任意小,可做到几乎无失真编码。2022/9/2824第24页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码n渐进无错编码渐进无错编码 (简单地说就是:当RH(U1)时,可以适当地编码和译码使得译码错误的概率pe任意小。严格地说就是:)设给定
17、了编码设备的编码速率设给定了编码设备的编码速率R0,R0H(U1)。则。则对任意的对任意的0,总存在一个,总存在一个L0,使得对任意的,使得对任意的LL0,都,都有对有对(U1U2UL)的等长编码和对应的译码方法,满足的等长编码和对应的译码方法,满足n实际的编码速率实际的编码速率R=NlogD/LR0,n译码错误的概率译码错误的概率pe。2022/9/2825第25页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码不能渐进无错的编码不能渐进无错的编码 (简单地说就是:当RH(U1)时,无论怎样编码和译码都不能使译码错误的概率pe任意
18、小。严格地说就是:)设给定了编码设备的编码速率设给定了编码设备的编码速率R0,R00有PH(U1)-ILH(U1)+2022/9/2828第28页,共195页,编辑于2022年,星期五切比雪夫不等式切比雪夫不等式注:注:切比雪夫切比雪夫2022/9/2829第29页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码取定L0使得 ,则当LL0时总有因此当LL0时总有这样的一些事件序列,H(U1)-ILH(U1)+,而且PH(U1)-ILH(U1)+1-。n说明当L足够大时,信源序列的自信息量的均值以概率1收敛于信源熵。n当L足够大时,在
19、信源序列中必有一些消息序列其自信息量的均值与信源熵之差小于,而对另外一些信源序列其差,因此,可以把信源序列分成两个互补的子集。2022/9/2830第30页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码定义定义3.2.1(p57)定义TU(L,)=(u1u2uL)|H(U1)-ILH(U1)+,称TU(L,)为-典型序列集。称TU(L,)的补集为非-典型序列集。(综上所述有)定理定理3.2.1(信源划分定理,p58)对任意0,取L0使得则当LL0时总有P(U1U2UL)=(u1u2uL)|(u1u2uL)TU(L,)1-。2022
20、/9/2831第31页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码(简记H(U)=H(U1)。设以下的对数都是以2为底的。)系系3.2.1(特定典型序列出现的概率,p58)若一个特定的事件(u1u2uL)TU(L,),则2-L(H(U)+)P(U1U2UL)=(u1u2uL)2-L(H(U)-)。证明 设(u1u2uL)TU(L,)。注意到此时H(U)-ILH(U)+,2022/9/2832第32页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码所以2022/9/28
21、33第33页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码系系3.2.2(典型序列的数量,p58)(1-)2L(H(U)-)|TU(L,)|2L(H(U)+)。证明 一方面,2022/9/2834第34页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码另一方面,2022/9/2835第35页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码 P(U1U2UL)=(u1u2uL)|(u1u2uL)TU(L,)1-
22、。系系3.2.1(特定典型序列出现的概率)2-L(H(U)+)P(U1U2UL)=(u1u2uL)2-L(H(U)-)。系系3.2.2(典型序列的数量)(1-)2L(H(U)-)|TU(L,)|2L(H(U)+)。2022/9/2836第36页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源的等离散无记忆(简单)信源的等长编码长编码典型序列集典型序列集非典型序列集非典型序列集序列集合序列集合定理3.2.1,系3.2.1以及系3.2.2就说明:n所有典型序列的概率和接近于1,是高概率集;n典型序列集中各序列出现的概率近似相等;n每个典型序列中一个信源符号的平均信息量接近于信源
23、熵;当L达到无限时,才等于信源熵。2022/9/2837第37页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码补充引理补充引理 设给定一个R0H(U)。对每个正整数L,对应地取整数N=R0L(R0L的下取整)。则0R0L-N1 即 0R0-N/LL0时nN/LR0-R0-(R0-H(U)/2=H(U)+(R0-H(U)/2H(U)+。nP(U1U2UL)TU(L,)1-。(由定理3.2.1)2022/9/2838第38页,共195页,编辑于2022年,星期五3.2 离散无记忆(简单)信源离散无记忆(简单)信源的等长编码的等长编码定
24、理定理3.2.2(无错编码正定理,无错编码正定理,p60)给定编码设备的编码速率给定编码设备的编码速率R0,R0H(U)。则对任意的则对任意的0,总存在一个,总存在一个L0,使得对任意的,使得对任意的LL0,都有对,都有对(U1U2UL)的的2元等长编码方法和元等长编码方法和对应的译码方法,对应的译码方法,实际的编码速率实际的编码速率R满足满足R0RH(U),“译码错误译码错误”的概率的概率peH(U);“译码错误”的概率pe=P(U1U2UL)不属于TU(L,)=1-P(U1U2UL)TU(L,)。得证。定理定理3.2.2(无错编码反定理,p60)设给定编码设备的编码速率R0,满足R0H(U
25、);给定一个任意小的正数0;要求:选择合适的L,N,对(U1U2UL)进行合适的2元N长编码,使得实际的编码速率R=N/L满足RR0;“译码错误”的概率pe。2022/9/2842第42页,共195页,编辑于2022年,星期五渐进无错编码的步骤渐进无错编码的步骤由U1的概率分布计算取L满足 。取整数N=R0L(R0L下取整)。取典型序列集2022/9/2843第43页,共195页,编辑于2022年,星期五渐进无错编码的步骤渐进无错编码的步骤将TU(L,)中的事件用不同的N长2元码字来表示,而将TU(L,)以外的事件用一个固定的N长2元码字来表示,这个固定的N长2元码字已经用来表示了TU(L,)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论 编码 理论基础 第三 PPT 讲稿
限制150内