第四章随机变量的数字特征分析.ppt
第四章第四章 随机变量的数字特征随机变量的数字特征 我们知道,随机变量的分布列或概率密度,全面地描述了随机变量的统计规律.但在许多实际问题中,这样的全面描述并不使人感到方便.已知一只母鸡的年产蛋量是一个随机变量,如果要比较两个品种的母鸡的年产蛋量,通常只要比较这两个品种的母鸡的年产蛋量的平均值就可以了.平均值大就意味着这个品种的母鸡的产蛋量高.如果不去比较它们的平均值,而只看它们的分布列,虽然全面,却使人不得要领,既难以掌握,又难以迅速地作出判断.1 随机变量的数学期望随机变量的数学期望1.1 离散型随机变量的数学期望离散型随机变量的数学期望 例:例:有A,B两射手,他们的射击技术如表所示,试问哪一个射手本领较好?0.30.50.20.60.10.3概率10981098击中环数BA射手名称5416212817103只数Nk3210-1-2日走时误差xk则抽查到的100只手表的平均日走时误差为即 例例:某手表厂在出厂产品中,抽查了N=100只手表的日走时误差,其数据如表:如果另外再抽验100只手表,每作一次这样的检验,就得到一组不同的频率,也就有不同的日走时误差的平均值.由关于频率和概率关系的讨论知,理论上应该用概率去代替上述和式的频率,这时得到的平均值才是理论上(也是真正)的平均值.这样我们就引出了随机变量的数学期望的概念.定义定义:设离散型随机变量X的概率分布为如若则称为随机变量X的数学期望数学期望,记为E(X).如果则称随机变量X的数学期望不存在数学期望不存在.所以A的射击技术较B的好.0.30.50.20.60.10.3概率10981098击中环数BA射手名称 例例:有A,B两射手,他们的射击技术如表所示,试问哪一个射手本领较好?解解 A射击平均击中环数为B射击平均击中环数为 解解 分布律为:X0123P0.30.40.20.1 平均废品数为:例例:设随机变量X具有如下的分布,求E(X).解解 虽然有收敛,但发散,因此E(X)不存在.1.1.1(0-1)分布数学期望)分布数学期望 设X的分布列为:X01Pqp则 其中1.1.2 二项分布数学期望二项分布数学期望 定理定理:设随机变量X服从二项分布,即则随机变量X的数学期望E(X)=np.证明证明1.1.3 泊松分布数学期望泊松分布数学期望 证明:定理定理:设随机变量X服从泊松分布,即则随机变量X的数学期望E(X)=.1.2 连续型随机变量的数学期望连续型随机变量的数学期望 我们已知离散型随机变量X的数学期望为E(X)=自然要问连续型随机变量的数学期望是什么?设p(x)是连续型随机变量X的密度函数,取分点x0 x1xn+1则随机变量X落在xi=(xi,xi+1)中的概率为与X近似的随机变量Y的数学期望为由微积分知识自然想到X的数学期望为为连续型随机变量为连续型随机变量X的的数学期望,记为记为E(X).定义定义:设连续型随机变量X的密度函数为p(x),若 则称 如果则称连续型随机变量X的数学期望不存在数学期望不存在.例例:设随机变量X的概率密度函数为试求X的数学期望解解 例例:若随机变量X的概率密度函数为问随机变量X的数学期望E(X)是否存在.解解所以E(X)不存在.但1.2.1 均匀分布的数学期望均匀分布的数学期望 定理定理:设连续型随机变量X的密度函数为则E(X)=(a+b)/2.证明证明:1.2.2 指数分布的数学期望指数分布的数学期望 定理定理:设连续型随机变量X的密度函数为则随机变量X的数学期望为E(X)=1/.证明证明1.2.3 正态分布的数学期望正态分布的数学期望 定理定理:设连续型随机变量XN(,2),则 E(X)=.证明证明2 随机变量函数的数学期望随机变量函数的数学期望定理定理:设Y是随机变量X的函数:Y=f(X)(f是连续函数).(1)设离散型随机变量X的概率分布为PX=xk=pk,k=1,2,.(2)设连续型随机变量X的密度函数为p(x),若 若则则有2.1 随机变量函数的数学期望随机变量函数的数学期望 定理定理:设Z是随机变量X,Y的函数Z=f(X,Y)(f是连续函数).(1)设二维随机向量(X,Y)的分布律为 (2)设二维随机向量(X,Y)的分布密度为p(x,y),若若则则 例例:已知随机变量XN(0,1),求E(X2).解法解法1 先求Y=X2 的概率密度函数:若y0,则所以Y=X2 的概率密度函数为解法解法2再求例例:设(X,Y)的联合分布律如下,Z=XY,求E(Z).解解 例例:设风速V在(0,a)上服从均匀分布,又设飞机机翼受到的正压力W是V的函数:W=kV2(k0,常数),求W的数学期望.解解 因为随机变量V的密度函数为所以 例例:设二维随机变量(X,Y)的概率密度为试求XY的数学期望.解解 例例:按季节出售的某种应时商品,每售出一公斤获利润b元.如到季末尚有剩余商品,则每公斤净亏损a元.设某商品在季节内这种商品的销售量X(以公斤计)是一随机变量,X在区间(s1,s2)上服从均匀分布.为使商店所获得利润的数学期望最大,问商店应进多少货?解解以s(公斤)表示进货数,进货s所得利润记为Ys(X),则X的概率密度为由得于是2.2 数学期望的性质数学期望的性质 1.若aXb,则E(X)存在,且有aE(X)b.特别,若C是常数,则E(C)=C.2.设X,Y是两个随机变量,若E(X),E(Y)存在,则对任意的实数a、b,E(aX+bY)存在,且有 E(aX+bY)=aE(X)+bE(Y)此性质可推广到有限个随机变量的线性组合的情况.3.设X,Y是互相独立的随机变量,则有 E(XY)=E(X)E(Y)此性质可推广到有限个互相独立的随机变量之积的情况.定理:定理:若aXb,则E(X)存在,且有aE(X)b.特别,若C是常数,则E(C)=C.证明证明(1)设离散型随机向量X分布列为X=xi=pi,i=1,2,则(2)设连续型随机变量X的概率密度为p(x),则(3)因为PX=C=1,故E(C)=E(X)=C1=C 定理定理:设X,Y是两个随机变量,若E(X),E(Y)存在,则对任意的实数a、b,E(aX+bY)存在,且有 E(aX+bY)=aE(X)+bE(Y)证明证明(1)设离散型随机向量(X,Y)的联合分布列和边际分布列分别为PX=xi,Y=yj=pij,i,j=1,2,PX=xi=pi.,i=1,2,PY=yj=p.j,j=1,2,则(2)设连续型随机向量(X,Y)的联合概率密度和边际概率密度分别为p(x,y)和pX(x),pY(y)则 定理定理:设X,Y是互相独立的随机变量,则有 E(XY)=E(X)E(Y)证明证明(1)设离散型随机向量(X,Y)的联合分布列和边际分布列分别为PX=xi,Y=yj=pij,i,j=1,2,PX=xi=pi.,i=1,2,PY=yj=p.j,j=1,2,则(2)设连续型随机向量(X,Y)的联合概率密度和边际概率密度分别为p(x,y)和pX(x),pY(y)则 例例:一民航送客车载有20位旅客自机场开出,旅客有10个车站可以下车.如到达一个车站没有旅客下车就不停车.以X表示停车的次数,求E(X).解解:引入随机变量易知X=X1+X2+X10任一旅客在第i站不下车的概率为9/10.因此20位旅客都不在第i站下车的概率为(9/10)20,在第i站有人下车的概率为1-(9/10)20.即PXi=0=(9/10)20,PXi=1=1-(9/10)20所以E(Xi)=1-(9/10)20,i=1,2,10进而E(X)=E(X1+X2+X10)=E(X1)+E(X2)+E(X10)=101-(9/10)20=8.784 注注:本题的特点是将X分解为数个随机变量的和,再求数学期望.此种方法具有普遍意义.解解 例例:设一电路中电流I(安)与电阻R(欧)是两个相互理独立的随机变量,其概率密度分别为求电压V=IR的数学期望.解解 因此,有 又当-1x1时,故得 同理可得 由于 所以X与Y不相互独立 例例:抛掷6颗骰子,X表示出现的点数之和,求E(X).从而由期望的性质可得 3 随机变量的随机变量的方差方差 例:例:A,B两种手表的日走时误差分别具有如下的分布律:易知E(XA)=E(XB)=0.由数学期望无法判别两种手表的优劣.但直觉告诉我们A优于B,怎么样用数学的方法把这种直觉表达出来呢?3.1 方差的概念方差的概念 分析原因:分析原因:A手表之所以优于B手表,是因为A手表的日走时较B手表稳定.其日走时与其日平均误差的偏离程度小.研究随机变量与其均值的偏离程度是有必要的.怎么样去度量这个偏离程度呢?(1)xk-E(X)表示xk与E(X)之间的偏差;(2)EX-E(X)不能反映X与E(X)之间的整体偏差;(3)E|X-E(X)|可以度量X与E(X)之间的整体偏差,但运算不方便;(4)EX-E(X)2可以度量X与E(X)之间的整体偏差,且运算也较方便.定义:定义:设X是一个随机变量,若EX-E(X)2存在,则称EX-E(X)2为X的方差方差.记为D(X)或Var(X),即D(X)=Var(X)=EX-E(X)2称为X的标准差标准差或均方差均方差.定理定理:证明证明 D(X)=EX-E(X)2 =EX2-2XE(X)+E(X)2 =E(X2)-2E(X)E(X)+E(X)2 =E(X2)-E(X)2 方差实际上是随机变量X的函数f(X)=X-E(X)2的数学期望.于是 (1)对于离散型随机变量X,若PX=xk=pk,k=1,2,则 (2)对于连续型随机变量X,若其概率密度为p(x),则 例:例:A,B两种手表的日走时误差分别具有如下表的分布律.问哪种手表质量好些?解解 易知E(XA)=E(XB)=0.所以由于D(XA)D(XB),因此A手表较B手表的质量好.例例:设随机变量X概率密度为p(x),求D(X).解解于是,D(X)=E(X2)-E(X)2=1/63.2 常见分布的方差常见分布的方差 3.2.1(0-1)分布的方差)分布的方差 定理:定理:若PX=0=q,PX=1=p,则D(X)=pq.证明证明3.2.2 二项分布的方差二项分布的方差 定理定理:若随机变量X服从二项分布XB(n,p),则 D(X)=npq.证明证明3.2.3 泊松分布的方差泊松分布的方差 定理:定理:设随机变量X服从泊松分布X(),则D(X)=.证明证明3.2.4 均匀分布的方差均匀分布的方差 定理定理:设随机变量X服从均匀分布XU(a,b),则D(X)=(b-a)2/12.证明证明3.2.5 指数分布的方差指数分布的方差 定理定理:设随机变量X服从参数为 的指数分布,则证明证明3.2.6 正态分布的方差正态分布的方差 定理定理:设随机变量X服从正态分布XN(,2),则D(X)=2.证明证明常见分布的期望和方差表常见分布的期望和方差表 解法解法1 1 X的边缘密度函数是 故 解法解法2 于是 解解 由于 所以 3.3 随机变量方差的性质随机变量方差的性质 (1)设C是常数,则D(C)=0 (2)设C是常数,X是随机变量,则有 D(CX)=C2D(X)(3)设X,Y是两个相互独立的随机变量,则有 D(X+Y)=D(X)+D(Y)(5)D(X)=0的充要条件是X以概率1取常数C,即 PX=C=1 (4)对于任意常数CE(X),有 D(X)E(X-C)2 定理定理:D(aX+b)=a2D(X)证明证明 D(aX+b)=E(aX+b)-E(aX+b)2 =E(aX+b)-E(aX)-b2 =EaX-E(aX)2 =Ea(X-E(X)2 =a2EX-E(X)2 =a2D(X)定理定理:设X,Y是两个相互独立的随机变量,则有D(X+Y)=D(X)+D(Y)证明证明 D(X+Y)=E(X+Y)-E(X+Y)2 =E(X-E(X)+(Y-E(Y)2 =E X-E(X)2+PY-E(Y)2 +2EX-E(X)Y-E(Y)由于X,Y相互独立,知X-E(X)与Y-E(Y)也相互独立,从而有2EX-E(X)Y-E(Y)=2EX-E(X)E Y-E(Y)=0.于是得 D(X+Y)=D(X)+D(Y)定理定理:对于任意常数CE(X),有 D(X)0从而有D(X)0,D(Y)0,协方差Cov(X,Y)均存在,则称为随机变量X与Y的相关系数相关系数或标准协方差标准协方差.4.2 相关系数相关系数 引理引理:对于二维随机向量(X,Y),若E(X2),E(Y2)存在,则有|E(XY)|2E(X2)E(Y2)证明证明:考虑实变量t的二次函数h(t)=E(tX-Y)2=t2 E(X2)-2tE(XY)+E(Y2)因为对一切t,有(tX-Y)20,所以h(t)0.从而二次方程h(t)=0或者没有实根,或者只有重根,因而,由二次方程根的判别式知识得|E(XY)|2E(X2)E(Y2)4.2.1 相关系数的性质相关系数的性质 性质性质1:随机变量X和Y的相关系数满足|XY|1.性质性质2:|XY|=1 的充要条件是,存在常数a,b使得PY=a+bX=1.性质性质3:若X与Y相互独立,则XY=0.性质性质1:随机变量X和Y的相关系数满足|XY|1.证明证明 令则从而|XY|1.性质2:|XY|=1 的充要条件是的充要条件是,存在常数存在常数a,b使得使得PY=aX+b=1证明证明 令由XY2=E(X*Y*)2E(X*)E(Y*)=1 知|XY|=1等价于E(X*Y*)2-E(X*)E(Y*)=0 它又等价于h(t)=E(tX*-Y*)2=0有重根t0.又因为E(t0X*-Y*)=t0E(X*)-E(Y*)=0所以D(t0X*-Y*)=0,由方差的性质知它等价于 Pt0X*-Y*=0=1,即PY=aX+b=1其中a=t0(Y)/(X),b=E(Y)-t0 E(X)(Y)/(X).性质性质3:若X与Y相互独立,则XY=0.证明证明 若X与Y相互独立,则E(XY)=E(X)E(Y),又 Cov(X,Y)=E(XY)-E(X)E(Y),所以4.2.2 相关系数的含义相关系数的含义 考虑以X的线性函数a+bX来近似表示Y.以均方误差e=EY-(a+bX)2 =E(Y2)+b2E(X2)+a2-2bE(XY)+2abE(X)-2aE(Y)来衡量以a+bX近似表达Y的好坏程度.e的值越小表示a+bX与Y的近似程度越好.为此令从而得解得 相关系数只是随机变量间线性关系强弱的一个度量.当|XY|=1 时,说明X与Y间存在着线性关系(除去一个零概率事件以外).当|XY|1 时,这种线性相关程度随着XY的减小而减弱.定义定义:(1)当XY=1 时,称X与Y正线性相关;(2)当XY=-1 时,称X与Y负线性相关;(3)当XY=0时,称X与Y不相关.注注:(1)X与Y不相关,只是意味着X与Y不线性相关,但可能存在着别的函数关系;(2)若XY存在,则当X与Y独立时,X与Y一定不相关;但X与Y不相关时,X与Y不一定独立.oXYoooXXXYYY01-10=1=-1相关情况示意图证证 由协方差的定义及数学期望的性质,得 定理定理:4.3 协方差的协方差的关系式关系式证证 由方差公式及协方差的定义,得 定理定理:Y X-10100.070.180.1510.080.320.20解解 X与Y的分布律分别为 X-101P0.150.50.35Y01P0.40.6于是 解解 则 于是 解解 所以因此 例例:设随机变量在-,上服从均匀分布,又X=sin,Y=cos试求X与Y的相关系数.解解 这时有这时有Cov(X,Y)=E(XY)-E(X)E(Y)=0,即=0.从而X与Y不相关,没有线性关系;但是X与Y存在另一个函数关X2+Y2=1,从而X与Y是不独立的.性质性质1:随机变量X和Y的相关系数满足|XY|1.证明证明 由可知 性质2:|XY|=1 的充要条件是的充要条件是,存在常数存在常数a,b使得使得PY=a+bX=1 证明证明:(1)若|XY|=1,则由 (2)若存在常数a*,b*使得PY=a*+b*X=1,则有PY-(a*+b*X)2=0=1.即得E Y-(a*+b*X)2=0,又由即得|XY|=1 5 独立性与不相关性、矩独立性与不相关性、矩 5.1 独立性与不相关性独立性与不相关性 定理定理:随机变量随机变量X与与Y不相关与下列结论之一等价不相关与下列结论之一等价.1.2.3.解解 同理可得 E(Y)=0 于是 即X与Y相关,从而X与Y不独立.Y X-101-11/61/31/611/601/6解解 X与Y的分布律分别为 X-101P1/31/31/3Y-11P2/31/3则有 于是 即 亦即X与Y相关.而 故X与Y不相互独立.例例:设(X,Y)N(1,2,12,22,),求X和Y的相关系数,并分析X与Y的相关性和独立性.解解设(X,Y)的概率密度为f(x,y),则因此,X和Y的相关系数当=0时,X与Y不相关.二维正态分布的联合密度函数为:X与Y的边缘密度函数为:5.2 随机变量的矩随机变量的矩 定义定义:设设X和和Y是随机变量是随机变量,(1)若若E(Xk)(k=1,2,)存在存在,则称它为则称它为X的的k阶阶原点矩原点矩,简称简称k阶矩阶矩.(2)若若EX-E(X)k(k=1,2,)存在存在,则称它为则称它为X的的k阶中心矩阶中心矩.更一般地更一般地,若若a是一常数是一常数,p是一正数是一正数,如果如果E(X-a)p存在存在,则称它是关于则称它是关于a点的点的p阶矩阶矩.(3)若若E(XkYl)(k,l=1,2,)存在存在,则称它为则称它为X和和Y的的k+l阶混合矩阶混合矩.(4)若若EX-E(X)kY-E(Y)l(k,l=1,2,)存存在在,则称它为则称它为X和和Y的的k+l阶混合中心矩阶混合中心矩.随机变量X与Y的二阶中心矩共有四个,分别记为:定义定义:设n维随机变量(X1,X2,Xn)的二阶混合中心矩cij=Cov(Xi,Xj)=EXi-E(Xi)Xj-E(Xj),i,j=1,2,n,都存在,则称矩阵为n维随机变量(X1,X2,Xn)的协方差矩阵协方差矩阵.例例:设X,Y的联合分布列如表所示试求X和Y的协方差矩阵.解解 因为E(X)=0(1-p)+00+10+1p=p,同样E(Y)=p.所以,c11=D(X)=(0-p)2(1-p)+(1-p)2p=p(1-p),同样c22=p(1-p)c12=c21=EX-E(X)Y-E(Y)=(0-p)(0-p)(1-p)+(0-p)(1-p)0+(1-p)(0-p)0+(1-p)(1-p)p=p(1-p)故协方差矩阵为 例例:设(X,Y)在矩形区域G=(x,y)|axb,cyd上服从均匀分布,试求X和Y的协方差矩阵.解解同样得所以X和Y的协方差矩阵为 例例:设(X,Y)N(1,2,12,22,),求X和Y的协方差矩阵.解解 因为