信息论与编码第二章.ppt
《信息论与编码第二章.ppt》由会员分享,可在线阅读,更多相关《信息论与编码第二章.ppt(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 信息的度量信息的度量n2.12.1信息量信息量n2.22.2信息熵信息熵n2.32.3离散集的平均互信息量离散集的平均互信息量Log(xy)=logx+logyLog(x/y)=logx-logy中学数学知识2.12.1.1.1 自信息和条件自信息量自信息和条件自信息量1 1、自信息量自信息量2.1 2.1 信息量信息量 设甲袋中有设甲袋中有100100个球,其中个球,其中5050个是红球,个是红球,5050个是白球,现有人从袋子中随机抽出一个球是红个是白球,现有人从袋子中随机抽出一个球是红色的,对于这次抽取的事件所携带的信息量是多色的,对于这次抽取的事件所携带的信息量是多少?又
2、如乙袋中也有少?又如乙袋中也有100100个球,其中有个球,其中有2525个红球,个红球,2525个白球,个白球,2525个蓝球,个蓝球,2525个黑球。现又有人随机个黑球。现又有人随机抽取一个球,发现时红球,针对这次抽取的事件抽取一个球,发现时红球,针对这次抽取的事件当中有具有多少信息呢?当中有具有多少信息呢?定义定义2.1 2.1 任意随机事件的自信息量定义为该事件发生任意随机事件的自信息量定义为该事件发生概率的对数的负值。概率的对数的负值。通过上面两个实例可以得知,在甲袋抽出红色球的通过上面两个实例可以得知,在甲袋抽出红色球的不确定性要比乙袋抽红色球的不确定性小。不确定不确定性要比乙袋抽
3、红色球的不确定性小。不确定性越大,就越难猜到,对于狭义信息论而言,此事性越大,就越难猜到,对于狭义信息论而言,此事件的信息量就越大。件的信息量就越大。设事件设事件的概率为的概率为 那么,它的自信息量定义为那么,它的自信息量定义为1 1、自信息量的单位、自信息量的单位自信息量的单位取决于对数的底;自信息量的单位取决于对数的底;底为底为2 2,单位为,单位为“比特(比特(bit)”;底为底为e,单位为单位为“奈特(奈特(nat)”;”;底为底为1010,单位为,单位为“哈特(哈特(hat)”;说明:说明:n2 2、三个自信息量单位之间的转换、三个自信息量单位之间的转换I(ai)是非负值;是非负值;
4、当当P(ai)=1时,时,I(ai)=0;当当P(ai)=0时,时,I(ai)=;I(ai)是是P(ai)的单调递减函数的单调递减函数n3 3、自信息量的性质、自信息量的性质注:注:I自信息自信息解释解释:小概率事件,一当出现必然使人感到意外,因小概率事件,一当出现必然使人感到意外,因此产生的信息量就大;几乎不可能事件一旦出现,此产生的信息量就大;几乎不可能事件一旦出现,将是一条爆炸性的新闻,一鸣惊人。将是一条爆炸性的新闻,一鸣惊人。大概率事件,是预料之中的,即使发生,也没大概率事件,是预料之中的,即使发生,也没什么信息量,特别是当必然事件发生了,它不会什么信息量,特别是当必然事件发生了,它不
5、会给人以任何信息量。给人以任何信息量。【例例2.12.1】某地二月份天气的概率分布统计如下:某地二月份天气的概率分布统计如下:问发生晴天的自信息量是多少?问发生晴天的自信息量是多少?解:发生晴天的概率为解:发生晴天的概率为,则晴天的自信息量为,则晴天的自信息量为【例例2.22.2】设在甲袋中放入设在甲袋中放入n n个不同阻值的电阻,如果个不同阻值的电阻,如果随机地取出一个,并对取出的电阻值进行事先猜测,随机地取出一个,并对取出的电阻值进行事先猜测,其猜测的困难程度相当于概率空间的不确定性,概率其猜测的困难程度相当于概率空间的不确定性,概率空间为空间为式中式中表示取出电阻值为表示取出电阻值为i
6、i的电阻的概率,那么被的电阻的概率,那么被告知告知“取出的阻值为取出的阻值为i i的电阻的电阻”所获得的信息量为多少所获得的信息量为多少?解:解:由于甲袋里的各阻值的电阻为等概分布,则由于甲袋里的各阻值的电阻为等概分布,则【例【例2.32.3】若盒中有若盒中有6 6个电阻,阻值为个电阻,阻值为1 1、2 2、3 3的分别为的分别为2 2个、个、1 1个、个、3 3个,将从盒子中取出阻值为个,将从盒子中取出阻值为i i的的电阻记为事件电阻记为事件组成事件集组成事件集,其概率分布,其概率分布计算出各种事件的自信息量。计算出各种事件的自信息量。计算如下:计算如下:解:自信息量解:自信息量n自信息量自
7、信息量 I(xi)的含义的含义2 2、联合自信息量、联合自信息量某住宅区的某栋商品房,有某住宅区的某栋商品房,有5 5个单元,每个单元住有个单元,每个单元住有1212户,甲要到该住宅区找他的宅区找他的朋友乙,因户,甲要到该住宅区找他的宅区找他的朋友乙,因为每一住户的地址需要单元号和住户号,因此,每一为每一住户的地址需要单元号和住户号,因此,每一住户的地址同时由单元号和住户号唯一确定,甲找到住户的地址同时由单元号和住户号唯一确定,甲找到乙这一事件是二维联合集乙这一事件是二维联合集上的等概分布上的等概分布,他找到乙得到的信息可以用联合自信息量表示。他找到乙得到的信息可以用联合自信息量表示。定义定义
8、2.2 2.2 在二维联合集在二维联合集上元素上元素的联合自信息量的联合自信息量定义为联合概率定义为联合概率的对数的负数,即的对数的负数,即 当当X和和Y相互独立时,联合信息量应等于它们各自信息相互独立时,联合信息量应等于它们各自信息量之和。量之和。二维联合集二维联合集,当当和和相互独立时,有相互独立时,有 则联合自信息量为则联合自信息量为3 3、条件自信息量条件自信息量乙住的楼房有乙住的楼房有5 5个单元,每个单元住有个单元,每个单元住有1212户,甲要到户,甲要到该住宅区找他的朋友乙,若甲知道乙住在第该住宅区找他的朋友乙,若甲知道乙住在第5 5单元,单元,即看做为已知即看做为已知 条件,他
9、要找到乙,记为事件条件,他要找到乙,记为事件 那那么甲找到乙得到多少信息可以用条件自信息量度量。么甲找到乙得到多少信息可以用条件自信息量度量。定义定义2.3 2.3 联合集联合集XY中,中,在在事件事件yj出现的条件下出现的条件下,随机事件随机事件事件事件xi 发生发生的条件下的条件下概率为概率为则它的条件自信息量定义为条件概率对数的负值:则它的条件自信息量定义为条件概率对数的负值:,例例:设在一正方形棋盘上共有设在一正方形棋盘上共有6464个方格,行、列各个方格,行、列各8 8个。个。如甲将一粒棋子随意放在棋盘某个方格内让乙猜测棋如甲将一粒棋子随意放在棋盘某个方格内让乙猜测棋子所在的位置,则
10、子所在的位置,则(1 1)在乙看来,棋子落入某方格的不确定性为多少?)在乙看来,棋子落入某方格的不确定性为多少?(2 2)若甲告知乙棋子落入方格的行号,这时,在乙看)若甲告知乙棋子落入方格的行号,这时,在乙看来棋子落入某方格的不确定性为多少?来棋子落入某方格的不确定性为多少?解:由于甲是将一粒棋子随意地放在棋盘中某一方格解:由于甲是将一粒棋子随意地放在棋盘中某一方格内,因此棋子在棋盘中所处位置为二维等概率分布,内,因此棋子在棋盘中所处位置为二维等概率分布,二维概率分布函数为二维概率分布函数为(1 1)在二维联合集在二维联合集上的元素为上的元素为的自信息为的自信息为:(2 2)在二维联合集在二维
11、联合集上上,元素元素 相对相对 的条件自信息的条件自信息为为:容易证明,自信息量、条件自信息量和联合自信容易证明,自信息量、条件自信息量和联合自信息量之间的关系如下:息量之间的关系如下:或或2.2.1.1.2 2互信息量和条件互信息量互信息量和条件互信息量1 1、互信息量、互信息量 众所周知,在教学过程中,老师在上课前准备众所周知,在教学过程中,老师在上课前准备教授的知识为一个集合教授的知识为一个集合,课后学生课后学生掌握掌握老师所教的内容为一个集合老师所教的内容为一个集合老师在课堂中采用不同的教学方法,会使学生掌握老师在课堂中采用不同的教学方法,会使学生掌握的内容不同。这一过程可以从一次通信
12、过程模型表的内容不同。这一过程可以从一次通信过程模型表示。如示。如下下图所示,图所示,定义定义2.2.4 4 对两个离散随机事件集对两个离散随机事件集X和和Y,事件,事件yj的出现的出现能提供出关于事件能提供出关于事件xi的信息量,定义为互信息量,即的信息量,定义为互信息量,即互信息互信息有多重表达式有多重表达式【例例2.52.5】某地二月份天气的概率分布统计如下:某地二月份天气的概率分布统计如下:某一天有人告诉你:某一天有人告诉你:“今天不是晴天。今天不是晴天。”把这句话作把这句话作为收到的消息为收到的消息。当收到。当收到后,各种天气发生的概后,各种天气发生的概率变成后验概率了。率变成后验概
13、率了。其中其中 试计算试计算与与各种天气之间的互信息量。各种天气之间的互信息量。解:解:互信息量与条件自信息区别互信息量与条件自信息区别:=将事件互信息的概念推广至多维空间。在三维将事件互信息的概念推广至多维空间。在三维2 2、互信息量的性质、互信息量的性质(1 1)互信息量的互易性,即)互信息量的互易性,即I(xi;yj)=I(yj;xi)(2 2)当)当X和和Y相互独立时,互信息为相互独立时,互信息为0 0(3 3)互信息量可为正值或负值互信息量可为正值或负值(4 4)任何两个事件之间的互信息量不可能大于任何两个事件之间的互信息量不可能大于之中任一事件的自信息量之中任一事件的自信息量自信息
14、、条件自信息和互信息自信息、条件自信息和互信息I(xk)I(yj)I(xk;yj)3 3、条件互信息量、条件互信息量定义定义2.2.5 5 三维三维XYZ联合集中,在给定条件联合集中,在给定条件zk的的情况下,情况下,xi与与yj之间的互信息量的定义为之间的互信息量的定义为另外,联合集合另外,联合集合XYZ中还存在中还存在xi与与yjzk之间之间的互信息量,其定义式的互信息量,其定义式或将上式进一步表示为或将上式进一步表示为思考下式的证明思考下式的证明上式表明一对事件上式表明一对事件yjzk出现后提供有关出现后提供有关x xi i的信息的信息量量I I(xi;yjzk),),等于事件等于事件y
15、j出现后所提供的有关出现后所提供的有关xi的信息量的信息量I(xi;yj)加上在给定时间加上在给定时间yj的条件下再出的条件下再出现事件现事件zk所提供的有关所提供的有关xi的信息量。的信息量。学校统计某个年级某个班级的数学期末成绩,那这个学校统计某个年级某个班级的数学期末成绩,那这个班级可以作为整体信源,而班级里的每个学生的数学班级可以作为整体信源,而班级里的每个学生的数学成绩就是一个随机事件,学生个人的成绩好坏只代表成绩就是一个随机事件,学生个人的成绩好坏只代表自己,不能说明他的班级数学成绩。自己,不能说明他的班级数学成绩。2.2.2 2 信息熵信息熵离散集的平均自信息量(熵)离散集的平均
16、自信息量(熵)信息函数信息函数只能表示信源发某一特定的具体符号只能表示信源发某一特定的具体符号所提供的信息量,不同的符号,有不同的自信息量,所提供的信息量,不同的符号,有不同的自信息量,所以它不足以作为整个信源的总体信息测度。所以它不足以作为整个信源的总体信息测度。定义定义2.6 2.6 在在集上,随机变量集上,随机变量的数学期望定义的数学期望定义为平均自信息量为平均自信息量集集的平均自信息又称为集的平均自信息又称为集的信息熵,简称为熵。的信息熵,简称为熵。的平均自信息量表示集的平均自信息量表示集即为了在观测之前,确定集即为了在观测之前,确定集件平均所需的信息量;或者说,在观测之后,集件平均所
17、需的信息量;或者说,在观测之后,集中每出现一个事件平均给出的信息量。中每出现一个事件平均给出的信息量。集集中事件出现的平均不中事件出现的平均不确定性,确定性,中出现一个事中出现一个事平均自信息量的单位:平均自信息量的单位:对数底是对数底是2 2,信息量的单位为比特(,信息量的单位为比特(bit););若取自然对数若取自然对数底底,则信息量的单位为奈特(,则信息量的单位为奈特(nat););若以若以1010为对数底,则信息量的单位为哈特(为对数底,则信息量的单位为哈特(hat)。)。【例例2.62.6】一个布袋内放一个布袋内放100100个球,其中个球,其中8080个球是红个球是红色的,色的,2
18、020个球是白色的,若随机摸取一个球,猜测个球是白色的,若随机摸取一个球,猜测其颜色,求平均摸取一次所能获得的自信息量。其颜色,求平均摸取一次所能获得的自信息量。分析:这一随机事件的概率空间为分析:这一随机事件的概率空间为式中,式中,表示摸出的球为红球事件,表示摸出的球为红球事件,表示摸出的球是白球事件。表示摸出的球是白球事件。这是一个随机事件试验。试验结果是,当被告知摸这是一个随机事件试验。试验结果是,当被告知摸出的是红球,则获得的信息量是出的是红球,则获得的信息量是当被告知摸出的是白球,则获得的信息量是当被告知摸出的是白球,则获得的信息量是如果每次摸出一个球后又放回袋中,再进行下一次摸如果
19、每次摸出一个球后又放回袋中,再进行下一次摸取,那么如此摸取取,那么如此摸取 次,次,红球出现的次数为红球出现的次数为 次,次,白白球出现的次数为球出现的次数为 次。次。随机摸取随机摸取次次后总共所获得的信息量为后总共所获得的信息量为而平均随机摸取一次所获得的信息量则为而平均随机摸取一次所获得的信息量则为 熵是从整个集合的统计特性来考虑的,它是从平均意熵是从整个集合的统计特性来考虑的,它是从平均意义上来表征集合的总体特征的。义上来表征集合的总体特征的。熵表示事件集合中事件发生后,每个事件提供的平熵表示事件集合中事件发生后,每个事件提供的平均信息量;均信息量;熵表示事件发生前,集合的平均不确定性;
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论 编码 第二
限制150内