西北工业大学《概率论与数理统计》3-2 方差与矩.pdf
下下下下回回回回停停停停一、方差的概念二、方差的性质一、方差的概念二、方差的性质三、矩的概念三、矩的概念第二节 随机变量的方差和矩第二节 随机变量的方差和矩第二节 随机变量的方差和矩第二节 随机变量的方差和矩四、应用实例四、应用实例1.问题的提出问题的提出1.问题的提出问题的提出引例引例1 有两批灯泡有两批灯泡,其平均寿命都是其平均寿命都是 E(X)=1000 Ox Ox 1000 1000哪一批灯泡寿命更为稳定哪一批灯泡寿命更为稳定?小时小时.一、方差的概念一、方差的概念一、方差的概念一、方差的概念引例引例2比较两射手的技术比较两射手的技术 8910击中环数击中环数 8910击中环数击中环数 0.1 0.80.1概 率概 率 0.40.20.4概 率概 率甲射手乙射手甲射手乙射手显然二者的平均水平为显然二者的平均水平为9环环,也就是两射手的水也就是两射手的水如何描述这种差异呢如何描述这种差异呢?平相当平相当,但甲射手的波动性较大但甲射手的波动性较大,射击不够稳定射击不够稳定.由此可以引入由此可以引入方差方差的定义如下:设射手打中的环数为随机变量的定义如下:设射手打中的环数为随机变量X,其分布律为其分布律为 L,2,1,=ipxXPii=12)()(iiiXEXEpXEx()(),XExi 则该射手的平均射击波动为则该射手的平均射击波动为()XExi 其平均水平为其平均水平为E(X),则其每次射击的波动为为了数学处理上的方便则其每次射击的波动为为了数学处理上的方便,以以2)(XExi替代替代2.方差的定义方差的定义2.方差的定义方差的定义()2XEXE通过上述通过上述2个引例个引例,我们可以给出如下定义我们可以给出如下定义定义定义3.3设设X是一个随机变量是一个随机变量,若存在若存在,则称则称()2XEXE为为X的的方差方差,记为记为()()().22XEXEXXD=()()即或即或,2XXD()()().,XXD记为为标准差或均方差称记为为标准差或均方差称2方差方差D(X)是一个非负实数是一个非负实数,常用来体现随机变量常用来体现随机变量 X 取值分散程度的量取值分散程度的量,它反映了它反映了X偏离偏离其其数学期望数学期望的程度的程度.3如果如果D(X)值值大大,表示表示X 取值越取值越分散分散,以以E(X)作为随机变量的代表性作为随机变量的代表性差差;(小小)(集中集中)(好好).注注1由定义知由定义知,()().02=XEXEXD3、随机变量方差的计算、随机变量方差的计算3、随机变量方差的计算、随机变量方差的计算离散型随机变量的方差离散型随机变量的方差,)()(12kkkpXExXD =连续型随机变量的方差连续型随机变量的方差()()()(),d)(2xxpXExXD +=(1)利用定义计算利用定义计算.,2,1,的分布律是其中的分布律是其中XkpxXPkkL=其中其中p(x)为为X的概率密度的概率密度.例例1(正态分布正态分布)()()().,2XDNX求若求若()()()().,0,e212221+=+=xxpx(),XE=且=且解解()()=XD所以所以()()()()xxpXExd2 +()()()()xxpxd2+=()()()()xxxde2122212+=因为=因为X的概率密度为的概率密度为tx=令=令.2=tttde22-222+=+ttttdee2222222202+=+=因而正态分布的方差为因而正态分布的方差为.2(),2NX正态分布正态分布()().,2XDXE=),(21NX)(1xpy=xyOxyO)(2xpy=21 正态分布方差的直观图示正态分布方差的直观图示:),(22NX(2)利用公式计算利用公式计算(2)利用公式计算利用公式计算()()()().22XEXEXD=证证2)()(XEXEXD=)()(222XEXXEXE+=+=22)()()(2)(XEXEXEXE+=+=.)()(22XEXE=例例2例例2解解设随机变量设随机变量X具有概率密度具有概率密度()()试求试求(考研试题考研试题)例例3例例3()()+=+=xxXPXDXP1-de11e1e=+=x()()+=01.dexxx其中其中二、方差的性质二、方差的性质二、方差的性质二、方差的性质()()().2XDkkXD=()()()2kXEkXEkXD=证证()()()()22CECECD=性质性质3.5设设C 是常数是常数,则有则有().0=CD22CC =.0=性质性质3.6设设X是一个随机变量是一个随机变量,k是常数是常数,则有则有证证1.方差的性质方差的性质()().222XDkXEXEk=性质性质3.7设随机变量设随机变量X,Y 相互独立相互独立,且且D(X),D(Y)存在)存在,则则D(X Y)=)=D(X)+)+D(Y).性质性质3.7设随机变量设随机变量X,Y 相互独立相互独立,且且D(X),D(Y)存在)存在,则则D(X Y)=)=D(X)+)+D(Y).()nnXaXaXaD L2211证证2)()()(YXEYXEYXD=2)()(YEYXEXE=22)()(YEYEXEXE+=+=).()(YDXD+=推广推广则有相互独立若则有相互独立若,21nXXXL()()().2222121nnXDaXDaXDa+=+=L)()(2YEYXEXE 例例4()()()().022=YEXEYXEZEQ(),1,0,NXYX相互独立与设随机变量相互独立与设随机变量()()()().,2,43,0ZDZEYXZNY及若及若=解解()()()()()()()().4434142=+=+=+=+=YDXDYXDZD()()()().1,02,4,0NZUNZ=()()()()()()uuuUEZEd22=+uuude21222+=()()()()22ZEZEZD=Q()()()().404222=+=+=+=+=ZEZDZEZE而而.24e24de2422-0202=+uuuu()().2142442 =ZD性质性质3.8(切比谢夫不等式切比谢夫不等式)()(),2XD则对于任意正整数方差=则对于任意正整数方差=切比谢夫不等式切比谢夫不等式切比谢夫切比谢夫设随机变量设随机变量X具有数学期望具有数学期望E(X)=)=,22XP成立成立.不等式不等式证证 仅选择仅选择连续型随机变量连续型随机变量的情况来证明的情况来证明.22XP()()()()+xxpxd122.122=()()xxpxxd22得得 XP()=xxxpd122x.122XP设设X的概率密度为的概率密度为p(x),则有则有切比谢夫不等式的切比谢夫不等式的意义意义:给出了在给出了在X的分布未知的情形下的分布未知的情形下,估计概率估计概率 XEXP )(的方法的方法;注注2说明了说明了D(X)的确刻划了的确刻划了X对对E(X)的偏离程度的偏离程度,(),1)(2XDXEXP由可知由可知:D(X)越小越小(X偏离偏离E(X)程度越小程度越小),这表明这表明:X取值越集中在取值越集中在E(X)附近附近.注注3它是大数定理的理论基础它是大数定理的理论基础.注注1 XEXP )(越大越大.例例5例例5已知正常男性成人血液中已知正常男性成人血液中,每一毫升所每一毫升所解解 设设X为每毫升血液中含白细胞数为每毫升血液中含白细胞数.依题意依题意,有有.700)(,7300)(22=XDXE 94005200 XP()7300940073005200 =XEXP含白细胞数的平均数是含白细胞数的平均数是7300,均方差是均方差是700,试利用切比谢夫不等式估计每毫升含白细胞数在试利用切比谢夫不等式估计每毫升含白细胞数在52009400之间的概率之间的概率p.()7300940073005200 =XEXP()21002100 =XEXP()2100 =XEXP2)(1)(XDXEXP()221001XD .8889.094005200 XP即即2221007001=.8889.098=性质性质3.9性质性质3.9 .,1为常数为常数CCXP=(),0)(02=XDXEXP证证 必要性必要性:由于而充分性可由由于而充分性可由性质性质3.5直接得到直接得到.随机变量随机变量X的方差的方差D(X)=)=0的充要条件是的充要条件是:的任意性可知而由 的任意性可知而由().1=XEXP性质性质3.10性质性质3.10证证()()()2XEXEXD=()则若对任意则若对任意,XECRC ()().2CXEXD()()2XECCXE+=+=()()()CXEXECCXE+=+=22()()22XECCXE=()()().2时当时当XECCXE()2XEC+例例6显然答案为显然答案为D.设设X是随机变量是随机变量,()()2,XDXE=()()()()222cXEcXEA=()()()()22XEcXEB=()()()()22XEcXEC()()()()22XEcXEDD)(,),(有则对任意的常数均为常数与有则对任意的常数均为常数与c2.常见概率分布相应的方差常见概率分布相应的方差2.常见概率分布相应的方差常见概率分布相应的方差()()nkppCkXPknkkn,2,1,0,1L=例例7(二项分布二项分布)解解.10 =Lk.)()()(22XEXEXD=(),XE=设设X P(),且分布律为且分布律为)1()(2XXXEXE+=+=)()1(XEXXE+=+=+=0e!)1(kkkkk =+=+=222)!2(ekkk+=ee2.2+=所以所以22)()()(XEXEXD=22+=.=因而因而,泊松分布的数学期望与方差都等于参数泊松分布的数学期望与方差都等于参数.例例9(几何分布几何分布)例例9(几何分布几何分布)10,2,1;1,1=pkpqpqkXPkL()(),1pXE=解解则又因为设随机变量则又因为设随机变量X服从几何分布服从几何分布,设随机变量设随机变量X的分布律为的分布律为.)()()(22XEXEXD=()().1122 =kkpqkXE求求D(X).()()()()XEpqkkkk+=+=111()()()()XEqkkpqkk+=+=121()()()()XEqpqkk+=+=1pqqpq112+=.122ppq+=+=()XD.112222pqpppq=+=+=()()=+=+=11112kkkkpqkpqkk所以所以例例10(均匀分布均匀分布)例例10(均匀分布均匀分布)()其分布密度函数为设其分布密度函数为设,baUX()()()(),21baXE+=+=()().122ba=解解222d1 +=+=baxabxba22)()()(XEXEXD=设随机变量设随机变量X服从均匀分布服从均匀分布,()()=.,0,1其它其它bxaabxp则有则有求求D(X).例例11(指数分布指数分布)例例11(指数分布指数分布)()().,ExpXDX求设随机变量求设随机变量()(),1XE=解解22)()()(XEXEXD=2-021de =+xxx.1112222 =设随机变量设随机变量X Exp(),则则泊松分布几何分布泊松分布几何分布np(1p)np二项分布二项分布XB(n,p)p(1p)p0-1分布分布XB(1,p)D(X)E(X)分布律分布分布律分布()PX kkppkXP=1)1(k=0,1knkknppCkXP=)1(k=0,1,2,nkkkXP=e!k=0,1,2,ppkXPk 1)1(=k=1,2,2pqp1常见离散型分布对应的数学期望与方差常见离散型分布对应的数学期望与方差常见离散型分布对应的数学期望与方差常见离散型分布对应的数学期望与方差三、矩的概念三、矩的概念三、矩的概念三、矩的概念()()nkXEXkL,1,=若是一随机变量设若是一随机变量设),2,1()(nkXEakkL=特例特例:1.矩的概念矩的概念定义定义3.4定义定义3.5().22的方差是 的方差是XXEXE=存在=存在,则称它为则称它为X的的k 阶原点矩阶原点矩 ak,即设即设X是一随机变量是一随机变量,且且 a1=E(X),特例特例:a1=E(X)是)是X的数学期望的数学期望.()()nkXEXEkL,2,1=若=若存在存在,则称它为则称它为X的的k阶中心矩阶中心矩,记为记为().,kkkXEXE=2.原点矩与中心矩的关系原点矩与中心矩的关系2.原点矩与中心矩的关系原点矩与中心矩的关系()()=kiikiikaaC01()()()()()()=kiikiikkkXEXECXEXE0二者之间可以相互唯一表达二者之间可以相互唯一表达,关系如下关系如下:()()()kkkaaXEXEa11+=+=()()=kiikiikaXEaC011=kiikiikaC01 注注1注注1 以上数值特征都是以上数值特征都是随机变量函数的数学期望随机变量函数的数学期望;k阶原点矩和阶原点矩和k阶中心矩可以互相唯一表示阶中心矩可以互相唯一表示.随机变量随机变量X的数学期望的数学期望E(X)是)是X的一阶原点矩的一阶原点矩,方差为二阶中心矩方差为二阶中心矩;三阶中心矩三阶中心矩E X E(X)3,主要用来衡量随机变量的分布是否有偏主要用来衡量随机变量的分布是否有偏.2在实际中在实际中,高于四阶的矩很少使用高于四阶的矩很少使用.四阶中心矩四阶中心矩E X E(X)4,主要用来衡量随机变量的分布在均值附近的陡峭程度如何主要用来衡量随机变量的分布在均值附近的陡峭程度如何.3例例12例例12+=+=uuukkde222xuxxxk=+de)(21222)(.)(),(2kkXEXENX=求设=求设有对于任意有对于任意,1 kkkXEXE)(=解解 =为奇数为偶数 =为奇数为偶数kkkkk,0,13)3)(1(四、应用实例四、应用实例四、应用实例四、应用实例=65.035.0nXP nnnXnnP5.065.05.05.035.0 ()()95.015.025.0115.05.02nnnXP解解设设X为为n次试验中事件次试验中事件A发生的次数发生的次数,则则例例13在每次实验中在每次实验中,事件事件A发生的概率为发生的概率为0.5,XB(n,0.5),要使得事件出现的频率在要使得事件出现的频率在0.350.65之间的概率不小于之间的概率不小于0.95,至少需要做多少次重复实验至少需要做多少次重复实验?因此因此,n 222.2,所以至少需要所以至少需要223次独立实验次独立实验.例例14现代证券组合理论现代证券组合理论(Markowitz均值-方差模型均值-方差模型)例例14现代证券组合理论现代证券组合理论(Markowitz均值-方差模型均值-方差模型),1iniiXX=()()()()iniiXEXE=1在证券投资中在证券投资中,为了分散风险为了分散风险,采取证券组合投资的方式采取证券组合投资的方式,如何衡量哪一种组合投资更有效呢如何衡量哪一种组合投资更有效呢?一般采用提高平均收益一般采用提高平均收益,降低投资风险的方法降低投资风险的方法.设投资组合收益为设投资组合收益为()()()()()()=ninjiijjijXDXDXD11证券组合投资问题就转化为证券组合投资问题就转化为,寻找寻找n种证券的投资比例种证券的投资比例 1,2,n使得平均收益最大使得平均收益最大,而组合投资的方差越小而组合投资的方差越小.内容小结内容小结内容小结内容小结1.方差是一个常用来体现随机变量方差是一个常用来体现随机变量X 取值分散程度的量取值分散程度的量.如果如果D(X)值大值大,表示表示X 取值分散程度大取值分散程度大,E(X)的代表性差的代表性差;而如果而如果D(X)值小值小,则表示则表示X的取值比较集中的取值比较集中,以以E(X)作为随机变量的代表性好作为随机变量的代表性好.,)()()(22XEXEXD=2.方差的计算公式方差的计算公式,)()(12kkkpXExXD =()()()()()()xxpXExXDd2 +=3.方差的性质方差的性质+=+=).()()(3);()(2;0)(10200YDXDYXDXDCCXDCD22XP.122XP4.切比谢夫不等式随机变量切比谢夫不等式随机变量X的数学期望的数学期望E(X)是是X的一阶原点矩的一阶原点矩;方差为二阶中心矩方差为二阶中心矩.5.矩是随机变量的数字特征矩是随机变量的数字特征.备用题例备用题例1-1备用题例备用题例1-1(),12)(22+=Y,PX+Y 1400.),25,640(2NY求求Z1=2X+Y,Z2=X Y解解)()(2)2()(1YEXEYXEZE+=+=,20806407202=+=)()(4)2()(1YDXDYXDZD+=+=,42252530422=+=+=由由X,Y相互独立相互独立,且且),30,720(2NX),25,640(2NY则则Z1=2X+Y,Z2=X Y设设X,Y相互独立相互独立,且且),30,720(2NX服从正态分布服从正态分布.并且并且)()()()(2YEXEYXEZE=,80640720=故有故有)()()()(2YDXDYXDZD+=.1525253022=+=).1525,80(),4225,2080(21NZNZ002=ZPYXPYXP)1525800(1012=ZP,9798.0)0486.2(=而而140011400+=+YXPYXP又因为又因为 X+Y N(E(X)+E(Y),D(X)+D(Y),)02.1(1)152513601400(1=.1539.08461.01=即即 X+Y N(1360,1525).故有故有设每次试验中设每次试验中,事件事件A发生的概率为发生的概率为0.5.共进行了共进行了1000次试验次试验,用切比谢夫不等式估计用切比谢夫不等式估计:A发生次数在发生次数在400到到600之间的概率之间的概率.例例5-1例例5-1(),5.0,1000,=pnpnBX ()100|600400 =XEXPXP.975.010025012=解解设事件设事件A发生的次数为随机变量发生的次数为随机变量X,则并且则并且()()().2501,500=pnpXDnpXE由切比谢夫不等式得由切比谢夫不等式得切比谢夫切比谢夫(Pafnuty Chebyshev)切比谢夫切比谢夫(Pafnuty Chebyshev)1821-1894俄国数学家、机械学家俄国数学家、机械学家.对数论、积分理论、概率论和力学都有很大贡献对数论、积分理论、概率论和力学都有很大贡献.证明了贝尔特兰公式证明了贝尔特兰公式,关于自然数列中素数分布的定理关于自然数列中素数分布的定理,大数定律的一般公式以及中心极限定理大数定律的一般公式以及中心极限定理.创立了切比谢夫多项式创立了切比谢夫多项式.