【教学课件】第二章信息量和熵.ppt
《【教学课件】第二章信息量和熵.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第二章信息量和熵.ppt(66页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 信息量和熵信息量和熵信息量和熵信息量和熵l2.1 离散变量的非平均信息量l2.2 离散集的平均自信息量熵l2.3 离散集的平均互信息量l2.4 连续随机变量的互信息和熵l2.5 凸函数和互信息的凸性2.1 离散变量的非平均信离散变量的非平均信息量息量输入,输出空间定义输入,输出空间定义l输入空间X=xk,k=1,2,K,概率记为q(xk)l输出空间Y=yj,j=1,2,J,概率记为(yj)l联合空间XY=xkyj;k=1,2,K;j=1,2,J,概率为p(xkyj)p(xkyj)=p(xk|yj)(yj)=p(yj|xk)q(xk)非平均互信息量非平均互信息量l例输入消息码字p(
2、xk)收到0收到01收到011X1X2X3X4X5X6X7x80000010100111001011101111/81/81/81/81/81/81/81/81/41/41/41/40000001/21/2000000010000非平均互信息量非平均互信息量输入消息码字p(xk)收到0收到01收到011X1X2X3X4X5X6X7x80000010100111001011101111/81/41/81/41/161/161/161/161/61/31/61/30000001/32/3000000010000非平均互信息量非平均互信息量l例输入消息码字p(xk)收到0收到01收到011X1X20
3、001111/21/21-pp1/21/21-pp1-p1-p0011pp非平均互信息量非平均互信息量非平均互信息量非平均互信息量定定义义(非平均互信息量)给定一个二维离散型随 机 变 量(X,Y),(xk,yj),rkj,k=1K;j=1J(因此就给定了两个离散型随机变量X,xk,qk,k=1K和Y,yj,wj,j=1J)。事件xkX与事件yjY的互信息量定义为非平均互信息量非平均互信息量其中底数a是大于1的常数。常用a=2或a=e,当a=2时互信息量的单位为“比特”。几点说明:几点说明:(1)I(xk;yj)=loga(rkj/(qkwj)。因此有对称性:。因此有对称性:I(xk;yj)=
4、I(yj;xk)。(2)当)当rkj=qkwj时时I(xk;yj)=0。(当两个事件相互独。(当两个事件相互独立时,互信息量为立时,互信息量为0)。)。(3)当)当rkjqkwj时时I(xk;yj)0,当,当rkjqkwj时时I(xk;yj)0。(当两个事件正相关时,互信息量为正值,当两(当两个事件正相关时,互信息量为正值,当两个事件负相关时,互信息量为负值)。个事件负相关时,互信息量为负值)。条件互信息和联合事件互信息条件互信息和联合事件互信息l三个事件集的条件互信息定义为l可以推广到任意有限多个空间情况互信息的可加性互信息的可加性系统u1u2u3系统u1u2u3互信息量特性:互信息量特性:
5、l对称性l可加性l互信息量的值域:-infinite +infinite,即全体实数离散变量的非平均自信息量离散变量的非平均自信息量定义:给定集合X,q(xk),事件xkX的自信息量定义为:非平均自信息的性质非平均自信息的性质l非负性l体现先验不确定性大小条件自信息和联合自信息条件自信息和联合自信息自信息、条件自信息和互信息自信息、条件自信息和互信息I(xk)I(yj)I(xk;yj)2.2 离散集的平均自信离散集的平均自信息量熵息量熵熵熵集X中事件出现的平均不确定性(平均自信息量熵)离散型随机变量X,xk,qk,k=1K的平均自信息量(又称为熵)定义为如下的H(X),其中底数a是大于1的常数
6、。熵熵注意:(1)事件xk的自信息量值为I(xk)=loga(1/qk),因此H(X)是随机变量X的各事件自信息量值的“数学期望”。(2)定义H(X)时,允许某个qk=0。(此时将qkloga(1/qk)通盘考虑)此时补充定义qkloga(1/qk)=0。这个定义是合理的,因为熵熵例例 离散型随机变量X有两个事件x1和x2,P(X=x1)=p,P(X=x2)=1-p。则X的平均自信息量(熵)为H(X)=ploga(1/p)+(1-p)loga(1/(1-p)。观察H(X)(它是p的函数,图给出了函数图象,该图象具有某种对称性),有当p=0或p=1时,H(X)=0。(随机变量X退化为常数时,熵为
7、0)当0p0。p越靠近1/2,H(X)越大。(X是真正的随机变量时,总有正的熵。随机性越大,熵越大)当p=1/2时,H(X)达到最大。(随机变量X的随机性最大时,熵最大。特别如果底数a=2,则H(X)=1比特)条件熵(定义)条件熵(定义)XY独立时有H(X|Y)=H(X)联合熵联合熵熵的性质熵的性质l对称性l非负性l确定性l扩展性l可加性l极值性l是H(P)上凸函数熵是概率矢量的函数熵是概率矢量的函数lP(p1,p2,pk)可以看作是K维矢量,当 ,常称作是概率矢量;l故HK(P)=HK(p1,p2,pk)是概率矢量P的函数熵的性质对称性熵的性质对称性l矢量的各分量p1,p2,pk的次序任意改
8、变时,熵值不变l熵函数的值只与概率分布或将1分割成的K个实数的取值有关,而与这K个实数和K个事件采取何种一一对应方式无关熵的性质非负性熵的性质非负性lHK(P)=HK(p1,p2,pK)0l可由单个事件自信息量的非负性得到熵的性质确定性熵的性质确定性l若事件集X中有一个事件为必然事件,其余事件为不可能事件,则此集合的熵值为0熵的性质扩展性熵的性质扩展性熵的性质可加性熵的性质可加性lH(p1q11,p1q12,p4q44)=H(p1,p4)+p1H(q11,q14)+p4H(q41,q44)p1p2p3p4q11q12q13q14熵的性质极值性熵的性质极值性l引理1:lnxx-1l引理2:lH(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第二 信息量
限制150内