湖南大学信息论与纠错编码.ppt
《湖南大学信息论与纠错编码.ppt》由会员分享,可在线阅读,更多相关《湖南大学信息论与纠错编码.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、湖南大学信息论与纠湖南大学信息论与纠错编码错编码n互信息互信息n信息熵信息熵复习复习xi的自信息量的自信息量 非负非负 单调减单调减 可加可加 不确定性不确定性(提供的信息量提供的信息量)收到某消息获得的信息量收到某消息获得的信息量收到某消息获得的信息量收到某消息获得的信息量(即收到某消息后获得关于某事件发生的信息量即收到某消息后获得关于某事件发生的信息量即收到某消息后获得关于某事件发生的信息量即收到某消息后获得关于某事件发生的信息量)不确定性减少的量不确定性减少的量不确定性减少的量不确定性减少的量(收到此消息前关于某事件发生的不确定性收到此消息前关于某事件发生的不确定性收到此消息前关于某事件
2、发生的不确定性收到此消息前关于某事件发生的不确定性)-(-(收到此消息后关于某事件发生的不确定性收到此消息后关于某事件发生的不确定性收到此消息后关于某事件发生的不确定性收到此消息后关于某事件发生的不确定性)条件自信息量条件自信息量 联合自信量联合自信量I(x)是概率空间是概率空间(X,P)上的一个随机变量上的一个随机变量 互信息量:结结合合图图示示讲讲解解通通信信模模型型,信信源源发发出出消消息息x xi i的的概概率率p(xp(xi i)称称为为先先验验概概率率,信信宿宿收收到到y yi i。利用收到利用收到y yi i推测信源发出推测信源发出x xi i的概率称为后验概率的概率称为后验概率
3、,有时也称条件概率。,有时也称条件概率。思考:思考:思考:思考:事件事件事件事件x xi i是否发生具有不确定性,可用自信息是否发生具有不确定性,可用自信息是否发生具有不确定性,可用自信息是否发生具有不确定性,可用自信息I(I(I(I(x xi i)度量。度量。度量。度量。在收到符号后,事件是否仍具有一定的不确定性,用条件信息量在收到符号后,事件是否仍具有一定的不确定性,用条件信息量在收到符号后,事件是否仍具有一定的不确定性,用条件信息量在收到符号后,事件是否仍具有一定的不确定性,用条件信息量I I(yi|xiyi|xi)度量。)度量。)度量。)度量。相当于相当于相当于相当于进进进进行了通信。
4、行了通信。行了通信。行了通信。问题问题问题问题:观观观观察事件(通信)前后,通信察事件(通信)前后,通信察事件(通信)前后,通信察事件(通信)前后,通信过过过过程中所程中所程中所程中所获获获获得的信息量是什么?得的信息量是什么?得的信息量是什么?得的信息量是什么?定义定义:后验概率与先验概率比值的对数为后验概率与先验概率比值的对数为yiyi对对xixi的互信息量:的互信息量:互信息量和条件互信息量互信息量和条件互信息量互互信信息息量量等等于于自自信信息息量量减减去去条件自信息量。条件自信息量。互信息量互信息量条件概率条件概率先验概率先验概率 互信息其他表达方式:互信息其他表达方式:互信息量互信
5、息量概率互换公式概率互换公式通信之前通信之前X X和和Y Y统计独立,有统计独立,有 ,不确定性,不确定性但但通通信信过过程程中中存存在在信信道道转转移移概概率率 ,符符号号xixi与与yjyj有有了了某某种种关关联联,此此时时联联合合概概率率 ,发,发xixi收收yiyi的不确定性的不确定性 。信道转移概率信道转移概率从从信信源源的的角角度度来来观观察察,上上述述两两个个事事件件之之差就是观察者获得的信息量差就是观察者获得的信息量互信息互信息发发送送符符号号xi,信信宿宿是是否否收收到到yj仍仍具具有有不不 确确 定定 性性,条件信息条件信息信信源源发发送送之之前前,信信宿宿收收到到yj的的
6、概率,概率,自信息自信息信宿收到信宿收到yj的概率的概率条件互信息量条件互信息量三维三维XYZXYZ联合集:联合集:给定条件给定条件 下,下,与与 之间的互信息量,之间的互信息量,其定义式其定义式互信息的性质互信息的性质n对称性对称性互易性互易性n当当X X和和Y Y相互独立时,互信息为相互独立时,互信息为0 0n互信息量可为正值或负值,反映两个事件之间的肯定作用互信息量可为正值或负值,反映两个事件之间的肯定作用n若为正值,通过接收若为正值,通过接收yjyj判断是否发送判断是否发送xixi的不确定性变小,的不确定性变小,能够正常通信能够正常通信n若互信息为负值若互信息为负值,意味着传输中的问题
7、,如信道噪声、干,意味着传输中的问题,如信道噪声、干扰等,扰等,收到收到yjyj判断是否发送判断是否发送xixi的不确定性更大的不确定性更大两个事件的两个事件的互信息量不大于单个事件互信息量不大于单个事件的自信息量的自信息量例例B,C,D三人必有一人晚上去三人必有一人晚上去A家家事件事件E:上午上午D打电话说晚上不来打电话说晚上不来事件事件F:下午下午C打电话说晚上不来打电话说晚上不来求互信息量求互信息量I(B;E),I(C;E),I(D;E)和和I(B;EF)I(B;E),I(C;E)=0.585(bit)I(B;EF)=1.585(bit)BDAC离散信息源的信息熵离散信息源的信息熵n对对
8、一一个个信信源源发发出出不不同同的的消消息息所所含含有有的的信信息息量量也也不不同同。所所以以自自信信息息I(I(xi i)是是一一个个随随机机变变量量,不不能能用用它它来来作作为为整整个个信信源源的的信信息息测度测度n定定义义自自信信息息的的数数学学期期望望为为平平平平均均均均自自自自信信信信息息息息量量量量Hr(X),称称为为信源的信息熵,也叫信源熵或香农熵,简称熵信源的信息熵,也叫信源熵或香农熵,简称熵:熵函数的自变量是熵函数的自变量是X表示信源整体,实质上是表示信源整体,实质上是离散无记忆信源平离散无记忆信源平离散无记忆信源平离散无记忆信源平均不确定度的度量均不确定度的度量均不确定度的
9、度量均不确定度的度量:各消息自信息量的概率加权平均(统计平均)值各消息自信息量的概率加权平均(统计平均)值由由于于这这个个表表达达式式和和统统计计物物理理学学中中热热熵熵的的表表达达式式相相似似,且且在在概概念念上上也也有有相相似似之之处处,因因此此借借用用“熵熵”这个词,把这个词,把H(X)称为信息称为信息“熵熵”;信信息息熵熵的的单单位位由由自自信信息息量量的的单单位位决决定定,即即取取决决于于对数的底。对数的底。HH(X X)的单位的单位的单位的单位:r r 进制单位符号进制单位符号进制单位符号进制单位符号 (r1r1)电视屏上约有电视屏上约有500600=3105个格点,按每格个格点,
10、按每格点有点有10个不同的灰度等级考虑,则共能组成个不同的灰度等级考虑,则共能组成个不同的画面。按等概率个不同的画面。按等概率计算,计算,平均每个画面可提供的信息量为平均每个画面可提供的信息量为 3 105 3.32 bit信源熵例题信源熵例题有有一一篇篇千千字字文文章章,假假定定每每字字可可从从万万字字表表中中任任选选,则共有不同的千字文则共有不同的千字文N=100001000=104000篇篇仍按等概率仍按等概率1/100001000计算,平均每篇千字文可计算,平均每篇千字文可提供的信息量为提供的信息量为H(X)log2N41033.321.3104bit“一一个个电电视视画画面面”平平均
11、均提提供供的的信信息息量量远远远远超超过过“一篇千字文一篇千字文”提供的信息量。提供的信息量。信源熵例题信源熵例题假设一条电线上串联了假设一条电线上串联了8个灯泡个灯泡x1,x2,x8如图如图1所示所示.这这8个灯泡损坏的可能性是等概率的个灯泡损坏的可能性是等概率的,现假设这现假设这8个灯泡中个灯泡中有一个也只有一个灯泡已损坏有一个也只有一个灯泡已损坏,致使串联灯泡都不能点致使串联灯泡都不能点亮亮.在未检查之间在未检查之间,我们不知道哪个灯泡我们不知道哪个灯泡xi已损坏已损坏,是不知是不知的、不确定的的、不确定的.我们只有通过检查我们只有通过检查,用万用表去测量电用万用表去测量电路有否断电路路
12、有否断电路,获得足够的信息量获得足够的信息量,才能获知和确定哪才能获知和确定哪个灯泡个灯泡xi已损坏已损坏.图图8个灯泡串联示意图个灯泡串联示意图利用熵的概念分析:利用熵的概念分析:图中图中8个灯泡构成一信源个灯泡构成一信源X,每个每个灯泡损坏的概率都相等灯泡损坏的概率都相等.这个信源为这个信源为其中其中ai(i=1,2,8)表示第表示第i个灯泡已损坏的事件个灯泡已损坏的事件,信源信源X共有共有8种等可能发生事件种等可能发生事件.可计算得此信源的信息熵可计算得此信源的信息熵这这H(X)正好表示在获知正好表示在获知哪个灯泡已损坏的情况前哪个灯泡已损坏的情况前,关关于哪个灯泡已损坏的于哪个灯泡已损
13、坏的平均不确定性平均不确定性.因此因此,只有获得只有获得3比比特的信息量特的信息量,才能完全消除平均不确定性才能完全消除平均不确定性,才能确定是才能确定是哪个灯泡坏了哪个灯泡坏了.熵的计算熵的计算:有一布袋内放有一布袋内放l00个球,其中个球,其中80个球是红色的,个球是红色的,20个球是白色的。随便摸出一个球,猜测是什么颜个球是白色的。随便摸出一个球,猜测是什么颜色,那么其概率空间为:色,那么其概率空间为:如果被告知摸出的是红球,那么获得的信息量是:如果被告知摸出的是红球,那么获得的信息量是:如果被告知摸出的是红球,那么获得的信息量是:如果被告知摸出的是红球,那么获得的信息量是:I(a1)l
14、og p(a1)log0.8=0.32 (比特)(比特)(比特)(比特)如被告知摸出来的是白球,所获得的信息量应为:如被告知摸出来的是白球,所获得的信息量应为:如被告知摸出来的是白球,所获得的信息量应为:如被告知摸出来的是白球,所获得的信息量应为:I(a2)log p(a2)log0.2=2.32 (比特)(比特)(比特)(比特)平均摸取一次所能获得的信息量为平均摸取一次所能获得的信息量为平均摸取一次所能获得的信息量为平均摸取一次所能获得的信息量为 :H(X)=p(a1)I(a1)+p(a2)I(a2)=0.72(比特(比特(比特(比特/符号)符号)符号)符号)熵的含义熵的含义n熵是熵是从整个
15、集合的统计特性从整个集合的统计特性来考虑的,它从来考虑的,它从平均意义上来平均意义上来表征信源的总体特征表征信源的总体特征。n在信源输出后,信息熵在信源输出后,信息熵H(X)表示表示每个消息提供的平均信每个消息提供的平均信息量息量;n在信源输出前,信息熵在信源输出前,信息熵H(X)表示表示信源的平均不确定性信源的平均不确定性;n信息熵信息熵H(X)表征了变量表征了变量X的随机性。的随机性。n n例:有两信源例:有两信源例:有两信源例:有两信源X X、Y Y,其概率空间分别其概率空间分别其概率空间分别其概率空间分别计算其熵,计算其熵,得:得:得:得:H(X)=0.08H(X)=0.08(bit/
16、bit/符号)符号)符号)符号)H(Y)=1H(Y)=1(bit/bit/符号)符号)符号)符号)H(Y)H(X),因此信源,因此信源Y比信源比信源X的平均不确定性要大。的平均不确定性要大。例例 设甲地的天气预报为:晴设甲地的天气预报为:晴(占占48)、阴、阴(占占28)、大雨、大雨(占占18)、小雨、小雨(占占18)。又设乙地的天气预报为:晴。又设乙地的天气预报为:晴(占占78),小雨小雨(占占18)。试求两地天气预报各自提供的平均信息量。若。试求两地天气预报各自提供的平均信息量。若甲地天气预报为两极端情况,一种是晴出现概率为甲地天气预报为两极端情况,一种是晴出现概率为1而其余为而其余为0。
17、另一种是晴、阴、小雨、大雨出现的概率都相等为。另一种是晴、阴、小雨、大雨出现的概率都相等为14。试。试求这两极端情况所提供的平均信息量。又试求乙地出现这两极求这两极端情况所提供的平均信息量。又试求乙地出现这两极端情况所提供的平均信息量。端情况所提供的平均信息量。两个信源两个信源解:甲地天气预报构成的信源空间为解:甲地天气预报构成的信源空间为:则其提供的平均信息量即信源的信息熵则其提供的平均信息量即信源的信息熵则其提供的平均信息量即信源的信息熵则其提供的平均信息量即信源的信息熵:乙地天气预报的信源空间为乙地天气预报的信源空间为:n n结结结结论论论论:甲甲甲甲地地地地天天气气预预报报提提提提供供
18、供供的的的的平平平平均均均均信信信信息息息息量量量量大大大大于于于于乙乙乙乙地地地地,因因因因为为为为乙乙乙乙地地地地比甲地的平均不确定性小。比甲地的平均不确定性小。比甲地的平均不确定性小。比甲地的平均不确定性小。甲地极端情况n极端情况极端情况1:晴天概率:晴天概率1n 结结论论:等等概概率率分分布布时时信信源源的的不不确确定定性性最最大大,所以信息熵(平均信息量)最大。所以信息熵(平均信息量)最大。n极端情况极端情况2:各种天气等概率分布:各种天气等概率分布乙地极端情况n极端情况极端情况1:晴天概率:晴天概率1n 结论:在极端情况结论:在极端情况2下,甲地比乙地提供更多的信息量。下,甲地比乙
19、地提供更多的信息量。因为,因为,甲地可能出现的消息数比乙地可能出现的消息数多甲地可能出现的消息数比乙地可能出现的消息数多。n极端情况极端情况2:各种天气等概率分布:各种天气等概率分布例例:一一离离散散信信源源由由0,1,2,3四四个个符符号号组组成成,它它们们出出现现的的概概率率分分别别为为3/8,1/4,1/4,1/8,且且每每个个符符号号的的出出 现现 都都 是是 独独 立立 的的。试试 求求 某某 消消 息息201020130213001203210100321010023102002010312032100120210的的信息量信息量和和平均信息量平均信息量。解解:此此消消息息中中,0
20、出出现现23次次,1出出现现14次次,2出出现现13次次,3出现出现7次,共有次,共有57个符号,故该消息的信息量为个符号,故该消息的信息量为 每个符号的算术平均信息量为每个符号的算术平均信息量为若用熵的概念来计算,若用熵的概念来计算,两两种种算算法法的的结结果果有有一一定定误误差差,但但当当消消息息很很长长时时,用用熵熵的的概概念念来来计计算算比比较较方方便便。随随着着消消息息序序列列长长度度的的增增加加,两两种种计计算算误差将趋于零。误差将趋于零。条件熵是在联合符号集合联合符号集合XY上的条件自信息量上的条件自信息量的数学期望。在已知随机变量Y的条件下,随机变量X的条件熵定义为:要用联合要
21、用联合概率加权概率加权条件熵条件熵 条条件件熵熵是是一一个个确确定定值值,是是指指:信信宿宿在在收收到到Y后后,信信源源X仍仍然然存存在在的的平平均均不不确确定定度度。这这是是传传输输失失真真所所造造成成的的。有有时时称称H(X/Y)为为信道疑义度信道疑义度,也称,也称损失熵损失熵。称称条条件件熵熵H(Y/X)为为噪噪声声熵熵。是是指指:发发出出X后后,由由于于信信道道干干扰使得扰使得Y存在平均不确定性存在平均不确定性H(X|Y)n联合离散符号集合XY上的每个元素对每个元素对 的联合自信息量的数学期望联合自信息量的数学期望。n公式:联合熵联合熵 H(XY)熵、条件熵、联合熵之间的关系熵、条件熵
22、、联合熵之间的关系n一个二进信源一个二进信源X发出符号集发出符号集0,1,经过离散无记忆信道传经过离散无记忆信道传输输,信道输出用信道输出用Y表示表示.由于信道中存在噪声由于信道中存在噪声,接收端除收接收端除收到到0和和1的符号外的符号外,还有不确定符号还有不确定符号“2”n已知已知X的先验概率的先验概率:p(x0)=2/3,p(x1)=1/3,n符号转移概率:符号转移概率:p(y0|x0)=3/4,p(y2|x0)=1/4p(y1|x1)=1/2,p(y2|x1)=1/2,XY0101 23/41/21/21/4信源熵信源熵H(X)例题例题 p(x0y0)=p(x0)p(y0|x0)=2/3
23、3/4=1/2 p(x0y1)=p(x0)p(y1|x0)=0 p(x0y2)=p(x0)p(y2|x0)=2/31/4=1/6 p(x1y0)=p(x1)p(y0|x1)=0 p(x1y1)=p(x1)p(y1|x1)=1/31/2=1/6 p(x1y2)=p(x1)p(y2|x1)=1/31/2=1/6由由得联合概率得联合概率例题例题 条件熵条件熵H(Y|X)n联合熵联合熵H(XY)H(XY)H(X)H(Y|X)=1.8bit得得 p(y0)=p(xiy0)=p(x0y0)+p(x1y0)=1/2+0=1/2 p(y1)=p(xiy1)=p(x0y1)+p(x1y1)=0+1/6=1/6
24、p(y2)=p(xiy2)=p(x0y2)+p(x1y2)=1/6+1/6=1/3 由由例题例题信源输出熵信源输出熵H(Y)由由得得同理同理p(x0|y1)=0;p(x1|y1)=1 p(x0|y2)=1/2;p(x1|y2)=1/2 条件熵条件熵H(X|Y)例题例题或或 H(X|Y)=H(XY)-H(Y)=1.8-1.47=0.33bit信信息息熵熵是是信信源源概概率率空空间间的的一一种种特特殊殊矩矩函函数数。这这个个矩矩函函数的大小,与信源的符号数及其概率分布有关。数的大小,与信源的符号数及其概率分布有关。我们用概率矢量我们用概率矢量P来表示概率分布来表示概率分布P(x):三、三、信息熵的
25、基本性质信息熵的基本性质 这这这这样样样样,信信信信息息息息熵熵熵熵H(H(X X)是是是是概概概概率率率率矢矢矢矢量量量量P P或或或或它它它它的的的的分分分分量量量量p p1 1,p p2 2,p pq q的的的的q-1q-1元元元元函函函函数数数数(因因因因各各各各分分分分量量量量满满满满足足足足上上上上述述述述条条条条件件件件限限限限制制制制,所所所所以以以以独独独独立立立立变变变变量量量量只只只只有有有有q-1q-1元元元元)。一般一般一般一般 H(H(X)X)可写成:可写成:可写成:可写成:熵函数熵函数nH(P)是概率矢量是概率矢量P的函数,称为熵函数。的函数,称为熵函数。n我们用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 湖南大学 信息论 纠错 编码
限制150内