第四章随机变量的数字特征-.pdf
第四章 随机变量的数字特征讨论随机变量数字特征的原因(1)在实际问题中,有的随机变量的概率分布难确定,有的不可能知道,而它的一些数字特征较易确定。(2)实际应用中,人们更关心概率分布的数字特征。(3)一些常用的重要分布,如二项分布、泊松分布、指数分布、正态分布等,只要知道了它们的某些数字特征,就能完r r 全确定其具体的分布。4.1 数学期望一、数学期望的概念1.离散性随机变量的数学期望例 41:大学一年级某班有32 名同学,年龄情况如下:年龄17 18 19 20 21 22 ft-.,ra-.,|人数2 7 10 8 4 1 求该班同学的平均年龄。解:平均年龄=1481072122421820101971821725.19把上式改写为:3212232421328203210193271832217设 X为从该班任选一名同学的年龄,其概率分布为X 17 18 19 20 21 22 ft-.,ra-.,|P 2/32 7/32 10/32 8/32 4/32 1/32 定义 4.1:设离散型随机变量X的分布列为:Xx1 x2 x3.xk.Pp1 p2 p3.Pk.若kkkpx绝对收敛(即kkkkkkpxpx),则称它为X的数学期望或均值(此时,也称X的ft-.,ra-.,|数学期望存在),记为 E(X),即若kkkpx发散,则称X 的数学期望不存在。说明:(1)随机变量的数学期望是一个实数,它体现了随机变量取值的平均;(2)要注意数学期望存在的条件:kkkpx绝对收敛;(3)当 X服从某一分布时,也称某kkkpxEXft-.,ra-.,|分布的数学期望为 EX。例 42:设 X服从参数为 p 的两点分布,求 EX EX=p 例 43:设 X B(n,p),求 EX EX=np 例 44:设 X服从参数为的泊松分布,求 EX EX=r r 2.连续型随机变量的数学期望定义 4.2:设连续型随机变量X 的概率密度为 f(x).若积分dxxxf)(绝对收敛,(即dxxfx)(),则称它为 X的数学期望或均值(此时,也称 X的数学期望存在),记为 E(X),即)()(dxxxfXE若ft-.,ra-.,|dxxfx)(,则称 X 的数学期望不存在。例 4.5:设 X服从 Ua,b,求 E(X)。EX=2ba例 4.6:设 X 服从参数为的指数分布,求 EX EX=例 4.7:),(2NX,求 EX EX=ft-.,ra-.,|下面分析书上 P101-P104 例。例1P101 例2P101 例3P102-103 解:注意由于 8:00 9:00,9:0010:00都恰有一辆车到站,所以(i)8:00 到车站的旅客在8:50 前一定会上车,而(ii)8:20到 车 站 的 旅 客 则 可 以 直 到9:50 才会上车。例 4 P103 r r 3.随机变量函数得数学期望定理 4.1:设随机变量X 的函数为Y=g(X),(1)若离散型随机变量X的分布律为)(kkxXPp,k=1,2,,kkkpxg)(绝对收敛,则 Y的数学期望存在,且)()()(kkkpxgXgEYE(2)若连续型随机变量X的概率密度为f(x),Y=g(X)也是连续型随机变量,dxxfxg)()(绝对收敛,则 Y的数r r 学期望存在,且)()()()(dxxfxgXgEYE定理 4.2:设二维随机变量(X,Y)的函数 Z=g(x,y)(1)若二维离散型随机变量(X,Y)的联合分布律为,.2,1,),(jiyYxXPpjiijr r 且有jiijjipyxg,),(绝对收敛,则Z的数学期望存在,且),(),()(,jiijjipyxgYXgEZE(2)若二维连续型随机变量(X,Y)的联合概率密度为f(x,y),Z=g(X,Y)也是连续型随机变量,并且dxdyyxfyxg),(),(绝对收敛,则 Z的数学期望存在,且),(),(),()E(dxdyyxfyxgYXgEZr r 例 5 P106 例 6 P107 例 7 P107 以下为第一版例。例 4.8:设 X U0,,Y=Xsin,求E(Y)。例 4.9:设(X,Y)的联合分布律为emnmppmYnXPmnmn!)-(!)1(),(ft-.,ra-.,|其中,1,0;,2,1,0;10;0nmnp求 E(XY)。二.数学期望的性质性质 1:若 c 为常数,则E(c)=c。性质 2:若 c 为常数,随机变量X 的数学期望存在,则:cX 的数学期望存在,且 E(cX)=cE(X)性质 3:若二维随机变量(X,Y)的分量r r X,Y 的数学期望都存在,则X+Y的数学期望存在,且 E(X+Y)=E(X)+E(Y)推论:若 n 维随机变量(X1,X2,.,nX)的分量 X1,X2,.,nX的数学期望都存在,则 X1+X2+.+nX的数学期望存在,且)()(11niiniiXEXE性质 4:若随机变量 X,Y 相互独立,它们的数学期望都存在,则X?Y的数学r r 期望存在,且推论:若随机变量X1,X2,.,Xn相互独立,它们的数学期望都存在,则X1X2Xn的数学期望存在,且性质 5:若随机变量只取非负值,又E(X)存在,则 E(X)0。若YX对任何S,)(),(YEXE存在,则)()(YEXE。r r 特别地,若babXa,为常数,)(XE存在,则bXEa)(。例 8 P109 例 9 P110 第一版例例 4.14:设一批同类型的产品共有N件,其中次品有M件。今从中任取n(假定 nN-M)件,记这 n 件中所含次品数为 X,求 E(X)。r r 三.综合性的例题(第一版)例:设 X的概率密度为其它010)(2xbxaxf,其中 a,b 为常数,且 E(X)=53。求a,b 的值。注意:f(x)中有几个未知数要建几个方程来求之。例:射击比赛规定:每位射手向目标独立重复射击四法子弹,全未中的0ft-.,ra-.,|分,仅中一发得15 分,恰中两发得30 分,恰中三发得 55 分,全中得 100分。若某射手的命中率为0.6,求他得分的数学期望。例:某水果商店,冬季每周购进一批苹果。已知该店一周苹果销售量X(单位:kg)服从 U1000,2000。购进的苹果在一周内售出,1kg 获纯利 1.5 元;一周内没售出,1kg 需付耗损、储藏等费用 0.3 元。问一周应购进多少千克苹果,商店才能获得最大的平均利r r 润。4-2 方差一.方差的概念1、定义 4.3:设 随机变量 X的数学期望为 E(X),若 E(X-E(X)2存在,则称它为 X的方差(此时,也称X的方差存在),记为 D(X)或 Var(X),即D(X)=E(X-E(X)2称 D(X)的算术平方根DX()为 X 的标准差或均方差,记为)(X,即)()(XDXft-.,ra-.,|由数学期望的性质5 知,若随机变量 X的方差 D(X)存在,则 D(X)0。简言之,方差是一个非负实数。当 X服从某分布时,我们也称某分布的方差为 D(X)。2、计算方差(1)若 X 是离散型随机变量,其分布律为 pi=P(X=xi),i=1,2,.,且 D(X)存在,则)(D(X)2iiipXEx(2)若 X 是连续型随机变量,其概率密度为 f(x),且 D(X)存在,则r r)(E(X)-(xD(X)2dxxf(第一版)例 1:设 X B(1,p),求 D(X)例 2:设 X N(,2),求 D(X)例 3:设 X Ua,b,求 D(X)(3)D(X)=E(X2)-(EX)2 证明:P112.r r 例1P112 例2P112(第一版)例 4:设 X(),求 D(X)例 5:已知X)3(),2,10(2YN,求)2(22YXE二.方差的性质性质 1:若 C为常数,则 D(C)=0 性质 2:若 C为常数,随机变量 X的方r r 差存在,则 CX的方差存在,且 D(CX)=C2D(X)证明由自己完成性质 3:若随机变量 X,Y 相互独立,它们的方差都存在,则 X Y的方差也存在,且D(X Y)=D(X)+D(Y)证明:P113 推论:若随机变量X1,X2,Xn相互独立,它 们 的 方 差 都 存 在,则r r X1+X2+.+Xn的方差存在,且性质 4:若随机变量 X的方差存在,对任意的常数 C E(X),则 D(X)=2)(EXXE E(X-C)2即函数 g(C)=E(X-C)2在 C=E(X)处达到最小值 D(X)。性质 5 若 D(X)存在,则 D(X)=0 的充要条件是:P(X=E(X)=1 r r 例 3 P113 第一版例:例 6:X服从 B(n,p),求 D(X).例 7:某种商品每件表面上的疵点数X 服从泊松分布,平均每件上有0.8个疵点。若规定表面不超过一个疵点的为一等品,价值十元,表面疵点数大于 1 不多于 4 的为二等品,价值8元。某件表面疵点数是4 个以上着为废品,求产品价值的均值和方差。已知)8.0(X设产品价值为YVR.r r Y取值0 8 1X(X4)(41X)(X1P(Y=k)P(X4=1-0.8088-0.1898 P(41X)=P(4X)-P(1X)=1-P(5X)-1-P(2X)=0.1898 P(X=1-P(X=0.806.98088.0101898.08)(XE元03.938088.0101898.080222EX8672.0)()()(22XEXEXD例:设随机变量 X的方差 D(X)存在,ft-.,ra-.,|且 D(X)0 令)()(XDXEXX,其中E(X)是X的 数 学 期 望,求)D(X)(和XE。三契比雪夫不等式(Chebyshev)契比雪夫不等式:设随机变量X的方差 D(X)存在,则对任意的0,均有 PX-E(X)2)(XD或等价地ft-.,ra-.,|J PX-E(X)1-2)(XD例:P X-E(X)3 0.8889 P X-E(X)4 0.9375 解:P X-E(X)3 1-22)3(=1-91P X-E(X)4 1-161Data;A=8/9;put a=;A=15/16;put a=;Run;ft-.,ra-.,|A=0.8888888889 A=0.9375 4.3 几种生要随机变量的数学期望与方差P115 这部分结果很重要,要牢记。P117,关于正态随机变量的三个重要数据:)1()1(XP1)1(2=0.6826894921r r)2()2(22XP1)2(2=0.9544997361)3()3(33XP1)3(2=0.9973002039 SAS的两种计算公式:data;r r p1=PROBNORM(1)-PROBNORM(-1);put p1=;p2=PROBNORM(2)-PROBNORM(-2);put p2=;p3=PROBNORM(3)-PROBNORM(-3);put p3=;run;p1=0.6826894921 p2=0.9544997361 p3=0.9973002039 data;p1=2*PROBNORM(1)-1;put p1=;p2=2*PROBNORM(2)-1;put p2=;p3=2*PROBNORM(3)-1;put p3=;run;ft-.,ra-.,|-il刷刷刷刷刷刷刷且二p1=0.6826894921 p2=0.9544997361 p3=0.9973002039 也可以验证数据,即以为中心,需要几倍的标准差距离所构成的区间,其区间内的概率为上述所示。Data;q1=abs(probit(1-0.6826894921)/2);put q1=;q2=abs(probit(1-0.9544997361)/2);put q2=;q3=abs(probit(1-0.9973002039)/2);put q3=;run;q1=0.9999999999 q2=2 r r q3=2.9999999959 data;q1=probit(1-(1-0.6826894921)/2);put q1=;q2=probit(1-(1-0.9544997361)/2);put q2=;q3=probit(1-(1-0.9973002039)/2);put q3=;run;q1=0.9999999999 q2=2 q3=2.9999999959 注意:为中心,概率为90%,95%,98%,99%的区间,需要几倍的标准差距离。Data;r r q1=abs(probit(1-0.9)/2);put q1=;q2=abs(probit(1-0.95)/2);put q2=;q3=abs(probit(1-0.98)/2);put q3=;q3=abs(probit(1-0.99)/2);put q3=;run;q1=1.644853627 q2=1.9599639845 q3=2.326347874 q3=2.5758293035 比如,96.196.1XP=0.95 64485.164485.1XP =0.9 r r 等的结论也是常用的。几乎都成常识了。书示附表 1中列出了多种常用的随机变量的数据期望和方差。4.4 协方差及相关系数一.协方差与相关系数的概念1.定义定义 4.4:设二维随机变量(X,Y),它的分量的数学期望为E(X),E(Y),若r r E(X-E(X)(Y-E(Y)存在,则称它为 X,Y 的协方差,记为Cov(X,Y),即Cov(X,Y)=E(X-E(X)(Y-E(Y)2.计算(1)用定义计算若二维离散型随机变量(X,Y)的联合概率分布律),(jiijyYxXPpi,j=1,2,,且Cov(X,Y)存在,则Cov(X,Y)=r r jiijjipYEyXEx,)()(若二维连续型随机变量(X,Y)的联合概率密度为f(x,y),且 Cov(X,Y)存在,则),()()(),(dxdyyxfYEyXExYXCov(2)、公式在计算Cov(X,Y)时,除用定义外,有时用下述公式较方便:Cov(X,Y)=E(XY)-E(X)E(Y)第一版例:不讲。r r 例:设(X,Y)在圆域上服从均匀分布,判断X,Y 是否不相关。并求Cov(X,Y)。例:设(X,Y)的联合分布律为emppmYnXPmnmn!m)-(n!)1(),(其中nmnp,2,1,0,2,1,0,10,0求 Cov(X,Y),并讨论 X,Y 的相关性。说明:r r(1)Cov(X,Y)能反映 X 与 Y 之间某种联系的程度。(2)Cov(X,Y)是有量纲的量,其值与(X,Y)的取值单位有关。3.相关系数定义 4.5:若二维随机变量(X,Y)的分量 的 方 差D(X),D(Y)都 存 在,且D(X)0,D(Y)0,则 称)()(),(YDXDYXCov为 X,Y 的相关系数,记为XY,即XY=)()(),(YDXDYXCov定义 4.6:若XY=0 则称 X,Y 不相关;ft-.,ra-.,|J一JJ J 若0XY称 X,Y 正相关;若0XY则称 X,Y 负相关。4.随机变量 X,Y 独立性与不相关的关系(1)一般情况下,设xy存在,若 X,Y相互独立,则0 xy,即 X,Y 不相关。反之,X,Y不相关,但 X,Y不一定独立。如 例:(书4.31)(X,Y)在222:ryxD上均匀分布。可知X,Y 不相关,但 X,Y不独立。r r(2)特别,对于二维正态分布(X,Y)服从有),;(22,221,1NX,Y 相互独立0 X,Y 不相关。二 协方差与相关系数的性质1.性质性质 1:若 X,Y 的协方差 Cov(X,Y)存在,则r r E(XY)=E(X)E(Y)+Cov(X,Y)性质 2:若(X,Y)两个分量的方差都存在,则D(X Y)=D(X)+D(Y)2Cov(X,Y)推论:若(X1,X2,.Xn)各分量的方差都存在,则nininjijiiiYXCovXDXD111),(2)()(性质 3:设下述各式所出现的协方差都存在,则有 Cov(X,Y)=Cov(Y,X)Cov(aX,Y)=a Cov(X,Y),(),(),(1121YXCovYXCovYXXCovr r Cov(X,X)=D(X)Cov(a,X)=0 其中 a为常数例3(第 一 版):设(X,Y)2222221),(yxeyxf,求Cov(2X+Y,YX2)性质 4:若 X,Y 的相关系数XY存在,则(1)XY1;(2)XY=1的充要条件是:存在常数ft-.,ra-.,|a,b 且 a 0,使 得 概 率 为1 的 有Y=aX+b,即P(Y=aX+b)=1 证法一见书 P-120.几点说明:(1)由性质的证明可见:11XY1baXYP,a0,这时称 X与 Y完全正相关;21XYft-.,ra-.,|-il刷刷刷刷刷刷刷且()()1baXYP,a0,这时称 X与 Y完全负相关。完全正相关和完全负相关统称为完全相关,当X 与 Y 完全相关时,(X,Y)可能取的值概率为1的集中在一条直线上。(2)相关系数XY是用来刻画X,Y 线性相关性程度的一个数量。当|XY越接近于 1 时,X 与 Y 之间越近似有线性关系;当|XY较小时,X 与 Y之间不能认为有近似的线性关系。(3)当0XY时,X,Y 不相关,X,Yr r 之间没有线性关系。这时,X,Y之间的关系较复杂;可能 X,Y 相互独立(如二维正态分布),可能(X,Y)在平面的某个区域内服从均匀分布(如例 4.31),可能X,Y 之间有某种非线性的函数关系(如下面的例 4.33)。例 1 P121 4.5 矩、协方差矩阵定义 4.7:设二维随机变量(X,Y),k,lr r 为非负整数。若 E(Xk)存在,则称它为X 的 k阶原点矩,简称 k 阶矩;若 EX-EXk,k=1,2,.存在,则称它为 X 的 k 阶中心矩。若 E(XkYl)存在,则称它为 X和 Y的(k,l)阶 混 合 矩,记 作mkl,即mkl=E(XkYl);若 E(X-E(X)k(Y-E(Y)l 存在,则称它为 X 和 Y 的(k,l)阶混合中心矩,记作kl,即kl=E(X-E(X)k(Y-E(Y)l。显然,数学期望 E(X)是 X的一阶r r 矩,方差 D(X)是 X 的二阶中心矩,协方差 Cov(X,Y)是 X和 Y的(1,1)阶混合中心矩.关于矩有下述结论:设k 为正整数。(1)若 E(Xk)存在,则对小于k 的一切非负整数l,E(Xl)存在.这由X1+Xk,即得 EXl1+E Xk(2)原点矩与中心矩可相互表示。协方差矩阵r r P123125.略。本章练习题5,6,7,8,9,10,15(1),16,17,22,23,26,28.r r