信息的度量与应用优秀课件.ppt
《信息的度量与应用优秀课件.ppt》由会员分享,可在线阅读,更多相关《信息的度量与应用优秀课件.ppt(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信息的度量与应用第1页,本讲稿共27页几个例子:几个例子:例例12 当你要到大会堂去找某一个人时,甲告诉你两条消息:当你要到大会堂去找某一个人时,甲告诉你两条消息:(1)此人不坐在前十排,()此人不坐在前十排,(2)他也不坐在后十排;乙只告诉)他也不坐在后十排;乙只告诉你一条消息:此人坐在第十五排。问谁提供的信息量大?你一条消息:此人坐在第十五排。问谁提供的信息量大?乙虽然只提供了一条消息,但这一条消息对此人在什么位置上乙虽然只提供了一条消息,但这一条消息对此人在什么位置上这一不确定性消除得更多,所以后者包含的信息量应比前者提供的这一不确定性消除得更多,所以后者包含的信息量应比前者提供的两条消
2、息所包含的总信息量更大两条消息所包含的总信息量更大例例13 假如在盛夏季节气象台突然预报假如在盛夏季节气象台突然预报“明天无雪明天无雪”的消息。在明的消息。在明天是否下雪的问题上,根本不存在不确定性,所以这条消息天是否下雪的问题上,根本不存在不确定性,所以这条消息包含的信息量为零。包含的信息量为零。第2页,本讲稿共27页是否存在信息量的度量公式是否存在信息量的度量公式 基于前面的观点,美国贝尔实验室的学者香农基于前面的观点,美国贝尔实验室的学者香农(Shannon)应用)应用概率论知识和逻辑方法概率论知识和逻辑方法推导出了信息量推导出了信息量的计算公式的计算公式 In his words I
3、just wondered how things were put together.Claude Elwood Shannon(April 30,1916-February 24,2001)has been called the father of information theory.第3页,本讲稿共27页Shannon提出的四条提出的四条基本性质基本性质(不妨称它们为公理(不妨称它们为公理)公理公理1信息量是该事件发生概率的连续函数信息量是该事件发生概率的连续函数 公理公理2如果事件如果事件A发生必有事件发生必有事件B发生,则得知事件发生,则得知事件A发生的信息量大发生的信息量大于或等于
4、得知事件于或等于得知事件B发生的信息量。发生的信息量。公理公理3如果事件如果事件A和事件和事件B的发生是相互独立的,则获知的发生是相互独立的,则获知A、B事件将同时发生的信息量应为单独获知两事件发生事件将同时发生的信息量应为单独获知两事件发生的信息量之和。的信息量之和。公理公理4任何信息的信息量均是有限的。任何信息的信息量均是有限的。将某事件发生的信息记为将某事件发生的信息记为M,该事件发生的概率记为,该事件发生的概率记为p,记,记M的信息量为的信息量为I(M)。)。上述公理怎样推出信息量的计算公式呢上述公理怎样推出信息量的计算公式呢第4页,本讲稿共27页定理定理11.2 满足公理满足公理1公
5、理公理4的信息量计算公式为的信息量计算公式为I(M)=Clogap,其中,其中C是任意正常数,对数之底是任意正常数,对数之底a可取任意为不为可取任意为不为1的正实数。的正实数。证明证明:由公理由公理1 I(M)=f(p),函数,函数f连续连续。由公理由公理2 若若A发生必有发生必有B发生,则发生,则pApB,有有f(pA)f(PB),故函数,故函数f是单调不增的是单调不增的。由公理由公理3 若若A、B是两个独立事件,则是两个独立事件,则A、B同时发生同时发生 的概率为的概率为pApB,有,有f(PAPB)=f(pA)+f(pB)。先作变量替换先作变量替换 令令p=a-q,即,即q=logaP
6、记记 ,又,又 有:有:,g亦为连续函数亦为连续函数。第5页,本讲稿共27页 g(x+y)=g(x)+g(y)的连续函数有怎样的性质的连续函数有怎样的性质 首先,由首先,由g(0)=g(0+0)=2g(0)得出得出g(0)=0或或g(0)=。但由公理但由公理4,后式不能成立,故必有,后式不能成立,故必有g(0)=0。记记g(1)=C,容易求得,容易求得g(2)=2C,g(3)=3C,一般地,一般地,有有g(n)=nC。进而。进而 ,可得可得 。于是对一切正有理数于是对一切正有理数 m/n,g(m/n)=(m/n)C。由由连续性连续性可知:对一切非负实数可知:对一切非负实数x,有,有g(x)=C
7、x 当当x取负实数时,由取负实数时,由g(x)+g(x)=g(0)=0,可得,可得出出g(x)=g(x)=cx也成立,从而也成立,从而对一切实数对一切实数x,g(x)=Cx,故故g(q)=Cq。现作逆变换现作逆变换q=logap,得得I(M)=f(P)=ClogaP (11.3)证毕证毕。第6页,本讲稿共27页各种信息量单位各种信息量单位 若取若取a=2,C=1,此时信息量单位称为比特,此时信息量单位称为比特若取若取a=10,C=1,此时信息量单位称为迪吉特,此时信息量单位称为迪吉特若取若取a=e,C=1,此时信息量单位称为奈特,此时信息量单位称为奈特第7页,本讲稿共27页例例14 设剧院有设
8、剧院有1280个座位,分为个座位,分为32排,每排排,每排40座。现欲从中找出座。现欲从中找出某人,求以下信息的信息量。(某人,求以下信息的信息量。(i)某人在第十排;()某人在第十排;(ii)某人在第)某人在第15座;(座;(iii)某人在第十排第)某人在第十排第15座。座。解解:在未知任何信息的情况下,在未知任何信息的情况下,此人在各排的概率可以认为是相等此人在各排的概率可以认为是相等的,他坐在各座号上的概率也可以认为是相等的,故的,他坐在各座号上的概率也可以认为是相等的,故 (i)“某人在第十排某人在第十排”包含的信息量为包含的信息量为 (比特)(比特)(ii)“某人在第某人在第15座座
9、”包含的信息量为包含的信息量为 (比特)(比特)(iii)“某人在第十排第某人在第十排第15座座”包含的信息量为包含的信息量为 (比特)(比特)5bit+5.32bit=10.32bit这一例子反映了对完全独立的几条这一例子反映了对完全独立的几条信息,其总信息量等于各条信息的信息,其总信息量等于各条信息的信息量之和。信息量之和。对于相应不独立的信息,要计算对于相应不独立的信息,要计算在已获得某信息后其余信息的信在已获得某信息后其余信息的信息量时,需要用到条件概率公式,息量时,需要用到条件概率公式,可以参阅信息论书籍。可以参阅信息论书籍。第8页,本讲稿共27页 至此,我们已经引入了信息度量的定量
10、公式。如前至此,我们已经引入了信息度量的定量公式。如前所述,它是信息对消除问题的不确定性的度量。这种讲所述,它是信息对消除问题的不确定性的度量。这种讲法似乎有点难以为人们所接受,其实,这只是人们的习法似乎有点难以为人们所接受,其实,这只是人们的习惯在起作用。这里,我们不妨来作一比较。在人们搞清惯在起作用。这里,我们不妨来作一比较。在人们搞清热的奥秘以前,温度也是一个较为抽象的概念,因它实热的奥秘以前,温度也是一个较为抽象的概念,因它实质上是物体分子运动平均速度的一种映。人们天生就知质上是物体分子运动平均速度的一种映。人们天生就知道冷和热,但如何来度量它却曾经是一个难题。只有在道冷和热,但如何来
11、度量它却曾经是一个难题。只有在解决了这一问题以后,以定量分析为主的热力学才能得解决了这一问题以后,以定量分析为主的热力学才能得到飞速的发展。信息问题也是这样,人们对各种信息包到飞速的发展。信息问题也是这样,人们对各种信息包含的实质含的实质“内容内容”究竟有多少往往也有一个直观的感觉,究竟有多少往往也有一个直观的感觉,但用什么方法来度量它,却比但用什么方法来度量它,却比“今天今天15度度”这样的讲法这样的讲法更不易理解,因为它是通过较为抽象的概率来计算的。更不易理解,因为它是通过较为抽象的概率来计算的。第9页,本讲稿共27页平均信息量(熵)问题平均信息量(熵)问题 设某一实验可能有设某一实验可能
12、有N种结果,它们出现的概率分别为种结果,它们出现的概率分别为p1,pN,则则事先告诉你将出现第事先告诉你将出现第i种结果的信息,其信息量为种结果的信息,其信息量为log2pi,而该,而该实验的不确定性则可用这组信息的平均信息量(或熵)实验的不确定性则可用这组信息的平均信息量(或熵)来表示来表示例例15 投掷一枚骼子的结果有六种,即出现投掷一枚骼子的结果有六种,即出现16点、出现每点、出现每 种种情况的概率均为情况的概率均为1/6,故熵,故熵 H=log262.585(比特)。(比特)。投掷一枚硬币的结果为正、反面两种,出现的概率均为投掷一枚硬币的结果为正、反面两种,出现的概率均为1/2,故熵故
13、熵 H=log22=1(比特)。(比特)。向石块上猛摔一只鸡蛋,其结果必然是将鸡蛋摔破,出现向石块上猛摔一只鸡蛋,其结果必然是将鸡蛋摔破,出现的概率为的概率为1,故熵,故熵H=log21=0 从例子可以看出,熵实质上反映的是问题的从例子可以看出,熵实质上反映的是问题的“模糊度模糊度”,熵为零,熵为零时问题是完全清楚的,熵越大则问题的模糊程度也越大时问题是完全清楚的,熵越大则问题的模糊程度也越大 第10页,本讲稿共27页离散型概率分布的随机试验,熵的定义为离散型概率分布的随机试验,熵的定义为:(11.5)连续型概率分布的随机试验,熵的定义为连续型概率分布的随机试验,熵的定义为:(11.6)熵具有
14、哪些有趣的性质熵具有哪些有趣的性质 定理定理11.3 若实验仅有有限结果若实验仅有有限结果S1,Sn,其发生的概率分别为,其发生的概率分别为 P1,Pn,则当,则当 时,此实验具有最大熵。时,此实验具有最大熵。此定理既可化为条件极值问题此定理既可化为条件极值问题证明之,也可以利用凸函数性证明之,也可以利用凸函数性质来证明,请大家自己去完成质来证明,请大家自己去完成 第11页,本讲稿共27页定理定理9.4 若实验是连续型随机试验,其概率分布若实验是连续型随机试验,其概率分布P(x)在在a,b区区间以外均为零,则当间以外均为零,则当 P(x)平均分布时具有最大熵。平均分布时具有最大熵。定理定理9.
15、5 对于一般连续型随机试验,在方差一定的前提下,正态分布对于一般连续型随机试验,在方差一定的前提下,正态分布具有最大的熵。具有最大的熵。定理定理9.6 最大熵原理,即受到相互独立且均匀而小的随机因素影响最大熵原理,即受到相互独立且均匀而小的随机因素影响的系统,其状态的概率分布将使系统的熵最大。的系统,其状态的概率分布将使系统的熵最大。上述结果并非某种巧合。根据概率论里的中心极限定理,若试上述结果并非某种巧合。根据概率论里的中心极限定理,若试验结果受到大量相互独立的随机因素的影响,且每一因素的影验结果受到大量相互独立的随机因素的影响,且每一因素的影响均不突出时,试验结果服从正态分布。最大熵原理则
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 度量 应用 优秀 课件
限制150内