平均信息熵及其应用精.ppt
《平均信息熵及其应用精.ppt》由会员分享,可在线阅读,更多相关《平均信息熵及其应用精.ppt(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、平均信息熵及其应用第1页,本讲稿共40页信息能否度量?物质、能量和信息是构成客观世界的三大要素。物质、能量和信息是构成客观世界的三大要素。信息(信息(informationinformation)是什么)是什么?至今信息还没有一个公认的定义至今信息还没有一个公认的定义一般定义:常常把消息中有意义的内容称为信息。一般定义:常常把消息中有意义的内容称为信息。第2页,本讲稿共40页认识问题的过程:认识问题的过程:当我们对一问题毫无了解时,对它的认识当我们对一问题毫无了解时,对它的认识是不确定的,在对问题的了解过程中,通过各是不确定的,在对问题的了解过程中,通过各种途径获得信息,逐渐消除了不确定性,获
2、得种途径获得信息,逐渐消除了不确定性,获得的信息越多,消除的不确定性也越多。我们可的信息越多,消除的不确定性也越多。我们可以用以用消除不确定性的多少消除不确定性的多少来度量信息量的大来度量信息量的大小。小。例:会堂有20排、每排20个座位。找一个人。甲告诉消息:此人在第10排;乙告诉消息:此人在第10排、第10座。第3页,本讲稿共40页是否存在信息量的度量公式是否存在信息量的度量公式?1948年,美国数学家、信息论的创始年,美国数学家、信息论的创始人人Shannon在题为在题为“通讯的数学理论通讯的数学理论”的论文中指出:的论文中指出:“信息是用来消除信息是用来消除随机不定性的东西随机不定性的
3、东西”。并。并应用应用概率论概率论知识和逻辑方法知识和逻辑方法推导出了信息量的计推导出了信息量的计算公式算公式ClaudeElwoodShannon(April30,1916-February24,2001)hasbeencalledthefatherofinformationtheory.第4页,本讲稿共40页公理公理1:信息量是事件发生概率的连续函数;:信息量是事件发生概率的连续函数;公理公理2:信息量是有限值;:信息量是有限值;公理公理3:如果事件:如果事件A和事件和事件B的发生是相互独立的,则获知的发生是相互独立的,则获知事件事件A和事件和事件B将同时发生的信息量是单独获知两事件发将同
4、时发生的信息量是单独获知两事件发生的信息量之和。生的信息量之和。设事件发生的概率为P,则满足上述公理的信息量函数为为应用方便,可取c=1,a=e,单位为奈特(nat)第5页,本讲稿共40页信息量函数信息量函数I=-lnp如何体现不确定性的消除?如何体现不确定性的消除?第6页,本讲稿共40页例:会堂有20排、每排20个座位。找一个人。甲告诉消息(A):此人在第10排;乙告诉消息(B):此人在第10排、第10座。由信息量公式I=-lnp可知I是p的单调下降函数第7页,本讲稿共40页信息熵(entropy)的概念设离散型随机变量X的概率分布为X的信息熵定义为“加权平均信息量”第8页,本讲稿共40页信
5、息熵的直观意义变量的不确定性越大,量的不确定性越大,熵也就越大,把它搞清楚所需要也就越大,把它搞清楚所需要的信息量也就越大。的信息量也就越大。一个系一个系统越是有序,信息越是有序,信息熵就越低;反之,一个系就越低;反之,一个系统越是混乱,信息越是混乱,信息熵就越高。所以,信息就越高。所以,信息熵也可以也可以说是系是系统有序化程度的一个度量。有序化程度的一个度量。X甲赢乙赢P0.90.1H0.325X甲赢乙赢P0.50.5H0.693第9页,本讲稿共40页熵的性质连续非负性对称性扩展性可加性极值性:第10页,本讲稿共40页1948年,Shannon提出了熵的概念,并以此作为信息的度量,宣告了信息
6、论作为一门科学学科的诞生。近年来,随着计算机应用的发展和信息时代的来临,信息论理论和应用的研究更显示出其重要意义。第11页,本讲稿共40页应用1:识别假币有有12枚外形相同的硬币,其中枚外形相同的硬币,其中一枚是假币(重量略有不同),一枚是假币(重量略有不同),如何用没有砝码的天平用最少如何用没有砝码的天平用最少次数找出假币?次数找出假币?每个硬币可能是真,也可能是假,每个硬币可能是真,也可能是假,且假币可能重一些,也可能轻一些,故共且假币可能重一些,也可能轻一些,故共有有24种可能,不确定性为种可能,不确定性为ln24。第12页,本讲稿共40页将硬币分成将硬币分成3份,其中份,其中2部分在天
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 平均 信息 及其 应用
限制150内