第二章信息的度量精选PPT.ppt
《第二章信息的度量精选PPT.ppt》由会员分享,可在线阅读,更多相关《第二章信息的度量精选PPT.ppt(90页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章信息的度量第1页,本讲稿共90页2.1 自信息和互信息自信息和互信息2.1.1 自信息自信息定义定义一个事件(消息)本身所包含的信息,它是由事件的一个事件(消息)本身所包含的信息,它是由事件的不确定不确定性性决定的。决定的。自信息量自信息量一个事件(消息)本身所包含的信息量,记为一个事件(消息)本身所包含的信息量,记为 。自信息量为概率自信息量为概率 的函数。的函数。第2页,本讲稿共90页2.1.1 自信息自信息根据客观事实和人们的习惯概念,自信息量应满足以下条件(根据客观事实和人们的习惯概念,自信息量应满足以下条件(公理公理化条件化条件):):1.是是 的严格递减函数。当的严格递减函数
2、。当 时,时,概概率越小,事件发生的不确定性越大,事件发生以后所包含的自信息率越小,事件发生的不确定性越大,事件发生以后所包含的自信息量越大。量越大。2极限情况下当极限情况下当 =0=0时,时,;当;当 =1=1时,时,=0=0。3另另外外,从从直直观观概概念念上上讲讲,由由两两个个相相对对独独立立的的不不同同的的消消息息所所提提供供的的信息量应等于它们分别提供的信息量之和。信息量应等于它们分别提供的信息量之和。可以证明,满足以上可以证明,满足以上公理化公理化条件的函数形式是条件的函数形式是对数形式对数形式。第3页,本讲稿共90页定定义义:随随机机事事件件的的自自信信息息量量定定义义为为该该事
3、事件件发发生生概概率率的的对对数数的的负负值值。设事件设事件 的概率为的概率为 ,则它的自信息定义为,则它的自信息定义为 由图可见:上述信息量的定义正由图可见:上述信息量的定义正 是满足上述公理性条件的函数形式。是满足上述公理性条件的函数形式。含义:含义:1 1)当事件发生以前,等于事件发生的不确定性的大小;)当事件发生以前,等于事件发生的不确定性的大小;2 2)当事件发生以后,表示事件所含有或所能提供的信息量。)当事件发生以后,表示事件所含有或所能提供的信息量。2.1.1 自信息自信息第4页,本讲稿共90页自信息量的单位:自信息量的单位:与所用与所用对数的底对数的底a有关。有关。单位换算关系
4、:单位换算关系:1 1奈特奈特=比特比特=1.443=1.443比特比特1哈特莱哈特莱=比特比特=3.322比特比特1r进制单位进制单位=比特比特2.1.1 自信息自信息 a=2 I=-log2P 单位为比特(单位为比特(bit)I=-logP a=e I=-ln P 单位为奈特(单位为奈特(nat)a=10 I=-lg P 单位为哈特莱(单位为哈特莱(hartley)a=r I=-logrP 单位为单位为r进制信息单位进制信息单位第5页,本讲稿共90页例例1(1)英文字母中)英文字母中“a”出现的概率为出现的概率为0.064,“c”出现的概率为出现的概率为0.022,分别计算他们的自信息量。
5、,分别计算他们的自信息量。(2)假定前后两字母出现是互相独立的,求)假定前后两字母出现是互相独立的,求“ac”的自信息量。的自信息量。(3)假定前后字母出现不是独立的,当)假定前后字母出现不是独立的,当“a”出现后,出现后,“c“出出现的概率为现的概率为0.04,计算,计算”a“出现后,出现后,”c”出现的自信息量。出现的自信息量。(4)比较()比较(3)中计算出的信息量,并与)中计算出的信息量,并与“c“的信息量进行比的信息量进行比较和分析。较和分析。2.1.1 自信息自信息第6页,本讲稿共90页解解:字母出现相互独立,字母出现相互独立,例例1(1)英文字母中)英文字母中“a”出现的概率为出
6、现的概率为0.064,“c”出现的概率为出现的概率为0.022,分别计算他们的自信息量。,分别计算他们的自信息量。(2)假定前后两字母出现是互相独立的,求)假定前后两字母出现是互相独立的,求“ac”的自信息量。的自信息量。相互独立事件积事件的信息量为各事件信息量的和。相互独立事件积事件的信息量为各事件信息量的和。2.1.1 自信息自信息解解:第7页,本讲稿共90页(3)假定前后字母出现不是独立的,当)假定前后字母出现不是独立的,当“a”出现后,出现后,“c“出现的出现的概率为概率为0.04,计算,计算“a”出现后,出现后,“c”出现的自信息量。出现的自信息量。(4)比较()比较(3)中计算出的
7、信息量,并与)中计算出的信息量,并与“c“的信息量进行比较和的信息量进行比较和分析。分析。可见,可见,“a”出现后,出现后,“c”出现的概率增大,其不确定性则变小。出现的概率增大,其不确定性则变小。(前后字母出现(前后字母出现不是独立的不是独立的,“a”出现给出了出现给出了“c”的部分信息,的部分信息,故故“a”出现后,出现后,“c”的不确定性则变小。的不确定性则变小。)2.1.1 自信息自信息解解:解解:第8页,本讲稿共90页结论:结论:设有两事件a和b:(1)若相互独立,则I(ab)=I(a)+I(b);(2)若不为相互独立,则I(ab)I(a)+I(b).2.1.1 自信息自信息证明?证
8、明?第9页,本讲稿共90页 例例22 8 8个串联的灯泡个串联的灯泡x x1 1,x x2 2,x x8 8,其损坏的可能性是等概率的,其损坏的可能性是等概率的,现假设其中有一个灯泡已损坏,问总共需要多少次测量才能获知和确现假设其中有一个灯泡已损坏,问总共需要多少次测量才能获知和确定哪个灯泡已损坏。定哪个灯泡已损坏。2.1.1 自信息自信息第10页,本讲稿共90页 例例22 8 8个串联的灯泡个串联的灯泡x x1 1,x x2 2,x x8 8,其损坏的可能性是等概率的,其损坏的可能性是等概率的,现假设其中有一个灯泡已损坏,问每进行一次测量可获得多少信息量现假设其中有一个灯泡已损坏,问每进行一
9、次测量可获得多少信息量?总共需要多少次测量才能获知和确定哪个灯泡已损坏。?总共需要多少次测量才能获知和确定哪个灯泡已损坏。解解:收到某消息获得的信息量收到某消息获得的信息量(即收到某消息后获得关于某事件发生的信息量即收到某消息后获得关于某事件发生的信息量)不确定性减少的量不确定性减少的量(收到此消息前关于某事件发生的不确定性收到此消息前关于某事件发生的不确定性)-(-(收到此消息后关于某事件发生的不确定性收到此消息后关于某事件发生的不确定性)第11页,本讲稿共90页已知已知8个灯泡等概率损坏,所以先验概率个灯泡等概率损坏,所以先验概率P(x1)1/8,即,即第二次测量第二次测量获得的信息量获得
10、的信息量=I P(x2)-I P(x3)=1(bit)第三次测量第三次测量获得的信息量获得的信息量=I P(x3)=1(bit)故:至少要获得故:至少要获得故:至少要获得故:至少要获得3 3个比特的信息量就可确切知道哪个灯泡已坏了。个比特的信息量就可确切知道哪个灯泡已坏了。个比特的信息量就可确切知道哪个灯泡已坏了。个比特的信息量就可确切知道哪个灯泡已坏了。第一次测量第一次测量获得的信息量获得的信息量=I P(x1)-I P(x2)=1(bit)经过二次测量后,剩经过二次测量后,剩2个灯泡,等概率损坏,个灯泡,等概率损坏,P(x3)1/2一次测量后,剩一次测量后,剩4个灯泡,等概率损坏,个灯泡,
11、等概率损坏,P(x2)1/4第12页,本讲稿共90页2.1.1 自信息自信息联合自信息量联合自信息量:二维联合集二维联合集XY上元素上元素(xi yj)的自信息量定义为的自信息量定义为其中,其中,xiyj 是积事件;是积事件;p(xiyj)是二维联合概率。是二维联合概率。条件自信息量条件自信息量:若若事件事件xi在在事件事件yj给定条件下的概率为给定条件下的概率为p(xi|yj),则其,则其条件自信息量定义为条件自信息量定义为对于联合事件(多维随机变量):对于联合事件(多维随机变量):第13页,本讲稿共90页定义定义:一个事件一个事件 所给出关于另一个事件所给出关于另一个事件 的信息定义为的信
12、息定义为互信息互信息,用用 表示。表示。含含义义:互互信信息息 是是已已知知事事件件 后后所所消消除除的的关关于于事事件件 的的不不确确定性,它等于事件定性,它等于事件 本身的不确定性本身的不确定性 减去已知事件减去已知事件 后对后对 仍然存在的不确定性仍然存在的不确定性 。2.1.2 互信息互信息 第14页,本讲稿共90页理解理解:因此,已知事件因此,已知事件 后所消除的关于事件后所消除的关于事件 的不确定性为:的不确定性为:即:即:2.1.2 互信息互信息 信道信道信宿信宿信源信源干扰或噪声干扰或噪声消息消息第15页,本讲稿共90页特例(无干扰信道)特例(无干扰信道):因此,已知事件因此,
13、已知事件 后所消除的关于事件后所消除的关于事件 的不确定性为:的不确定性为:即:即:2.1.2 互信息互信息 信道信道信宿信宿信源信源消息消息=1=0第16页,本讲稿共90页2.1.2 互信息互信息例例3 某地二月份天气出现的概率分别为:晴某地二月份天气出现的概率分别为:晴1/21/2,阴,阴1/41/4,雨,雨1/81/8,雪,雪1/81/8。某一天有人告诉你:今天不是晴天,把这句话作为接收的消息。某一天有人告诉你:今天不是晴天,把这句话作为接收的消息y y1 1,求收到求收到y y1 1后,后,y y1 1与各种天气的互信息量。与各种天气的互信息量。解解:记记:x x1 1(晴),晴),x
14、 x2 2(阴),阴),x x3 3(雨),雨),x x4 4(雪)雪)1)求收到)求收到y y1 1后,各种天气的后验概率。后,各种天气的后验概率。则:则:第17页,本讲稿共90页2.1.2 互信息互信息同理:同理:2)根据互信息量定义,计算收到)根据互信息量定义,计算收到y y1 1与各种天气的互信息。与各种天气的互信息。则:则:第18页,本讲稿共90页设某班学生在一次考试中获优(设某班学生在一次考试中获优(A)、)、良(良(B)、)、中(中(C)、)、及格及格(D)和不及格(和不及格(E)的人数相等。当教师通知某甲:的人数相等。当教师通知某甲:“你没有不及格你没有不及格”,甲获得了多少比
15、特信息?为确定自己的成绩,甲还需要多少信息?,甲获得了多少比特信息?为确定自己的成绩,甲还需要多少信息?例例4 解:解:令令P(a)表示表示“得到老师通知前甲的成绩的不确定性(概率)得到老师通知前甲的成绩的不确定性(概率)”P(a|b)表示表示“得到老师通知后甲的成绩的不确定性(概率)得到老师通知后甲的成绩的不确定性(概率)”则则 P(a)=1/5,P(a|b)=1/4总的需要总的需要信息信息剩余信息剩余信息获得信息获得信息第19页,本讲稿共90页2.1.2 互信息互信息条件互信息量条件互信息量:在在联合集联合集XYZ中,在给定中,在给定zk的条件下,的条件下,xi与与yj之间的之间的互信息量
16、定义为互信息量定义为条件互信息量条件互信息量。其定义式为。其定义式为:联合互信息联合互信息:联合事件联合事件 Yyj,Zzk与事件与事件Xxi之间的之间的联合互信联合互信息息为为:对于联合事件(多维随机变量):对于联合事件(多维随机变量):第20页,本讲稿共90页回顾自信息自信息自信息量自信息量条件自信息量条件自信息量联合自信息量联合自信息量互信息互信息第21页,本讲稿共90页自信息量与互信息量的联系第22页,本讲稿共90页2.2 平均平均自信息(信源熵,信息熵,熵)自信息(信源熵,信息熵,熵)2.2.1 平均自平均自信息的概念信息的概念引出:引出:信源不确定性的度量(信源信息的度量)信源不确
17、定性的度量(信源信息的度量)1)自信息量)自信息量2)平均自信息量)平均自信息量信源中每个消息信息量的统计平均值。信源中每个消息信息量的统计平均值。平均自信息量又称为:信源熵、信息熵或熵。平均自信息量又称为:信源熵、信息熵或熵。不可行第23页,本讲稿共90页2.2.1 平均平均自信息的概念自信息的概念信源及其分布的表示形式(概率空间)信源及其分布的表示形式(概率空间)信源具有不确定性,所以我们把信源具有不确定性,所以我们把信源信源用用随机变量随机变量来表示。来表示。相应地,其可能取值和这些取值的概率就可以用相应地,其可能取值和这些取值的概率就可以用概率空间概率空间 来表示。来表示。其中,其中,
18、X代表信源,代表信源,代表其可能的各种取值,代表其可能的各种取值,为各种取值的概为各种取值的概率。率。第24页,本讲稿共90页平均自信息量的定义平均自信息量的定义随机变量随机变量X的每一个可能取值的自信息的每一个可能取值的自信息 的统计平均值的统计平均值 这里这里q为所有为所有X可能取值的个数。可能取值的个数。信息熵信息熵 是随机变量是随机变量X X的概率分布的函数,所以又称为的概率分布的函数,所以又称为熵熵函数,函数,且为且为(q-1q-1)元)元函数。函数。把概率分布把概率分布 ,记为,记为 ,则熵,则熵函数又可以写成概率矢量函数又可以写成概率矢量 的函数的形式,记的函数的形式,记为为 。
19、2.2.1 平均平均自信息的概念自信息的概念第25页,本讲稿共90页平均自信息量(熵)的含义平均自信息量(熵)的含义1 1)熵是从整个集合的统计特性来考虑的,它从)熵是从整个集合的统计特性来考虑的,它从平均意义平均意义上来表征上来表征信源信源的的总体特征总体特征。2 2)信息熵表征了信源的)信息熵表征了信源的随机性随机性。3 3)在信源)在信源输出前输出前,信息熵,信息熵H(X)H(X)表示信源的平均不确定性;表示信源的平均不确定性;4 4)在信源)在信源输出后输出后,信息熵,信息熵H(X)H(X)表示每个消息提供的平均信息量。表示每个消息提供的平均信息量。2.2.1 平均平均自信息的概念自信
20、息的概念第26页,本讲稿共90页几点说明几点说明1 1)熵的单位与所取对数的底数有关。)熵的单位与所取对数的底数有关。根据所取的对数底不同,可以是比特根据所取的对数底不同,可以是比特/符号、奈特符号、奈特/符号、哈符号、哈特莱特莱/符号或者是符号或者是r r进制单位进制单位/符号。通常用符号。通常用比特比特/符号符号为单位。为单位。2 2)信息熵也成为)信息熵也成为负热熵负热熵。3 3)信源熵给出了对信源输出的消息进行)信源熵给出了对信源输出的消息进行无失真编码无失真编码时,平均每个时,平均每个信源符号信源符号至少要用的符号数至少要用的符号数。4 4)信息熵并不等于收信者平均获得的信息量。)信
21、息熵并不等于收信者平均获得的信息量。传输系统往往有噪声和干扰,因此收信者不能全部消除信源的传输系统往往有噪声和干扰,因此收信者不能全部消除信源的平均不确定性,平均不确定性,获得的信息量往往小于信息熵获得的信息量往往小于信息熵。2.2.1 平均平均自信息的概念自信息的概念第27页,本讲稿共90页熵的计算熵的计算例例:有一布袋内放有一布袋内放l00个球,其中个球,其中80个球是红色的,个球是红色的,20个球是白色的。随便摸出一个球,求平均摸取一次个球是白色的。随便摸出一个球,求平均摸取一次所能获得的信息量。所能获得的信息量。如果被告知摸出的是红球,那么获得的信息量是:如果被告知摸出的是红球,那么获
22、得的信息量是:如果被告知摸出的是红球,那么获得的信息量是:如果被告知摸出的是红球,那么获得的信息量是:I(a1)log p(a1)log0.8=0.32 (比特)(比特)(比特)(比特)如被告知摸出来的是白球,所获得的信息量应为:如被告知摸出来的是白球,所获得的信息量应为:如被告知摸出来的是白球,所获得的信息量应为:如被告知摸出来的是白球,所获得的信息量应为:I(a2)log p(a2)log0.2=2.32 (比特)(比特)(比特)(比特)平均摸取一次所能获得的信息量为平均摸取一次所能获得的信息量为平均摸取一次所能获得的信息量为平均摸取一次所能获得的信息量为 :H(X)=p(a1)I(a1)
23、+p(a2)I(a2)=0.72(比特(比特(比特(比特/符号)符号)符号)符号)解:概率空间为:解:概率空间为:第28页,本讲稿共90页例例1 电视屏上约有电视屏上约有500600500600个栅格点,且每点可取个栅格点,且每点可取1010个不同的灰个不同的灰度等级,同时各电视画面的出现概率为相等的,求平均每个电视度等级,同时各电视画面的出现概率为相等的,求平均每个电视画面画面可提供的信息量。可提供的信息量。解解:由题得:电视画面的个数为由题得:电视画面的个数为2.2.1 平均平均自信息的概念自信息的概念第29页,本讲稿共90页例例2 设甲地的天气预报为:晴设甲地的天气预报为:晴(占占48)
24、、阴、阴(占占28)、大雨、大雨(占占18)、小雨、小雨(占占18)。又设乙地的天气预报为:晴。又设乙地的天气预报为:晴(占占78),小雨,小雨(占占18)。试求两地天气预报各自提供的平均信息量。试求两地天气预报各自提供的平均信息量。若甲地天气预报为两极端情况,一种是晴出现概率为若甲地天气预报为两极端情况,一种是晴出现概率为1而其余为而其余为0。另一种是晴、阴、小雨、大雨出现的概率都相等为另一种是晴、阴、小雨、大雨出现的概率都相等为14。试求这。试求这两极端情况所提供的平均信息量。又试求乙地出现这两极端情况两极端情况所提供的平均信息量。又试求乙地出现这两极端情况所提供的平均信息量。所提供的平均
25、信息量。两个信源两个信源第30页,本讲稿共90页解:甲地天气预报构成的信源空间为解:甲地天气预报构成的信源空间为:则其提供的平均信息量即信源的信息熵则其提供的平均信息量即信源的信息熵则其提供的平均信息量即信源的信息熵则其提供的平均信息量即信源的信息熵:乙地天气预报的信源空间为乙地天气预报的信源空间为:n n结论结论结论结论:甲地:甲地:甲地:甲地天气预报天气预报提供的平均信息量大于乙地,因为乙地比甲地的提供的平均信息量大于乙地,因为乙地比甲地的提供的平均信息量大于乙地,因为乙地比甲地的提供的平均信息量大于乙地,因为乙地比甲地的平均不确定性小。平均不确定性小。平均不确定性小。平均不确定性小。第3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 信息 度量 精选 PPT
限制150内