应用统计-第03章-概率与概率分布.pdf
第三章 概率与概率分布第三章 概率与概率分布2 2应应应应用用用用统统统统计计计计第第第第三三三三章章章章第三章 概率与概率分布第三章 概率与概率分布?3.1 随机事件及其概率随机事件及其概率?3.2 随机变量及其概率分布随机变量及其概率分布?3.3 大数定律与中心极限定理大数定律与中心极限定理?本章小结本章小结3 3应应应应用用用用统统统统计计计计第第第第三三三三章章章章3.1 随机事件及其概率随机事件及其概率必然现象与随机现象必然现象与随机现象?必然现象(确定性现象)必然现象(确定性现象)?变化结果是事先可以确定的,一定的条件必然导致某一结果变化结果是事先可以确定的,一定的条件必然导致某一结果?这种关系通常可以用公式或定律来表示这种关系通常可以用公式或定律来表示?随机现象(偶然现象、不确定现象)随机现象(偶然现象、不确定现象)?在一定条件下可能发生也可能不发生的现象在一定条件下可能发生也可能不发生的现象?个别观察的结果完全是偶然的、随机会而定个别观察的结果完全是偶然的、随机会而定?大量观察的结果会呈现出某种规律性(随机性中寓含着规律性)大量观察的结果会呈现出某种规律性(随机性中寓含着规律性)统计规律性统计规律性一、随机试验与随机事件一、随机试验与随机事件十五的月亮比初十圆!十五的夜晚能看见月亮?4 4应应应应用用用用统统统统计计计计第第第第三三三三章章章章随机试验随机试验?严格意义上的随机试验满足三个条件:严格意义上的随机试验满足三个条件:?试验可以在系统条件下重复进行;试验可以在系统条件下重复进行;?试验的所有可能结果是明确可知的;试验的所有可能结果是明确可知的;?每次试验前不能肯定哪一个结果会出现。每次试验前不能肯定哪一个结果会出现。?广义的随机试验是指对随机现象的观察(或实验)。广义的随机试验是指对随机现象的观察(或实验)。?实际应用中多数试验不能同时满足上述条件,常常从广义角度来理解。实际应用中多数试验不能同时满足上述条件,常常从广义角度来理解。5 5应应应应用用用用统统统统计计计计第第第第三三三三章章章章随机事件(事件)随机事件(事件)?随机事件(简称事件)随机事件(简称事件)?随机试验的每一个可能结果随机试验的每一个可能结果?常用大写英文字母常用大写英文字母A、B、来表示、来表示?基本事件(样本点)基本事件(样本点)?不可能再分成为两个或更多事件的事件不可能再分成为两个或更多事件的事件?样本空间(样本空间()?基本事件的全体(全集)基本事件的全体(全集)6 6应应应应用用用用统统统统计计计计第第第第三三三三章章章章随机事件(续)随机事件(续)?复合事件复合事件?由某些基本事件组合而成的事件由某些基本事件组合而成的事件?样本空间中的子集样本空间中的子集?随机事件的两种特例随机事件的两种特例?必然事件必然事件?在一定条件下,每次试验都必然发生的事件在一定条件下,每次试验都必然发生的事件?只有样本空间只有样本空间 才是必然事件才是必然事件?不可能事件不可能事件?在一定条件下,每次试验都必然不会发生的事件在一定条件下,每次试验都必然不会发生的事件?不可能事件是一个空集(不可能事件是一个空集()7 7应应应应用用用用统统统统计计计计第第第第三三三三章章章章?概率概率?用来度量随机事件发生的可能性大小的数值用来度量随机事件发生的可能性大小的数值?必然事件的概率为必然事件的概率为1,表示为,表示为P()=1?不可能事件发生的可能性是零,不可能事件发生的可能性是零,P()=0?随机事件随机事件A的概率介于的概率介于0和和1之间,之间,0P(A)02020应应应应用用用用统统统统计计计计第第第第三三三三章章章章例例2?某公司甲乙两厂生产同种产品。甲厂生产某公司甲乙两厂生产同种产品。甲厂生产400件,其中一级品为件,其中一级品为280件;乙厂生产件;乙厂生产600件,其中一级品有件,其中一级品有360件。若要从该厂的全部产品中任意抽取一件,试求:抽出产品为一级品的条件下该产品出自甲厂的概率;抽出产品出自甲厂的条件下该产品为一级品的概率。解:设件。若要从该厂的全部产品中任意抽取一件,试求:抽出产品为一级品的条件下该产品出自甲厂的概率;抽出产品出自甲厂的条件下该产品为一级品的概率。解:设A“甲厂产品甲厂产品”,B“一级品一级品”,则:,则:P(A)0.4,P(B)0.64,P(AB)0.28 所求概率为事件 所求概率为事件B发生条件下发生条件下A发生的条件概率发生的条件概率P(A|B)0.28/0.64所求概率为事件所求概率为事件A发生条件下发生条件下B发生的条件概率发生的条件概率P(B|A)0.28/0.42121应应应应用用用用统统统统计计计计第第第第三三三三章章章章(2)事件的独立性)事件的独立性?两个事件独立两个事件独立?一个事件的发生与否并不影响另一个事件发生的概率?P(A|B)P(A),或 P(B|A)P(B)?独立事件的乘法公式:独立事件的乘法公式:P P(AB)AB)P P(A)A)P P(B)B)推广到推广到n个独立事件,有:个独立事件,有:P P(A A1A An)P P(A A1)P P(A A2)P P(A An)2222应应应应用用用用统统统统计计计计第第第第三三三三章章章章(3)全概率公式)全概率公式?完备事件组完备事件组?事件A1、A2、An互不相容,?AA2An?且P(Ai)0(i=1、2、.、n)?对任一事件B,它总是与完备事件组A1、A2、An之一同时发生,则有求P(B)的全概率公式全概率公式:=niiiABPAPBP1)|()()(2323应应应应用用用用统统统统计计计计第第第第三三三三章章章章例例3:?假设有一道四选一的选择题,某学生知道正确答案的可能性为假设有一道四选一的选择题,某学生知道正确答案的可能性为2/3,他不知道正确答案时猜对的概率是,他不知道正确答案时猜对的概率是1/4。试问该生作出作答的概率?解:设。试问该生作出作答的概率?解:设 A知道正确答案,知道正确答案,B选择正确。选择正确。“选择正确选择正确”包括:包括:?“知道正确答案而选择正确知道正确答案而选择正确”(即(即AB)?“不知道正确答案但选择正确不知道正确答案但选择正确”(即)(即)P(B)(2/3)1(1/3)()(1/4)3/4BA)|()()|()()()()(ABPAPABPAPBAPABPBP+2424应应应应用用用用统统统统计计计计第第第第三三三三章章章章3.全概率公式全概率公式贝叶斯公式贝叶斯公式?全概率公式的直观意义:全概率公式的直观意义:?每一个Ai的发生都可能导致B出现,每一个Ai导致B发生的概率为,因此作为结果的事件B发生的概率是各个“原因”Ai引发的概率的总和?相反,在观察到事件B已经发生的条件下,确定导致B发生的各个原因Ai的概率贝叶斯公式贝叶斯公式(逆概率公式)(后验概率公式)2525应应应应用用用用统统统统计计计计第第第第三三三三章章章章贝叶斯公式贝叶斯公式?若若A1、A2、An为完备事件组,则对于任意随机事件为完备事件组,则对于任意随机事件B,有:,有:?计算事件计算事件Ai在给定在给定B条件下的条件概率公式。条件下的条件概率公式。?公式中,公式中,P(Ai)称为事件称为事件Ai的先验概率的先验概率?P(Ai|B)称为事件称为事件Ai的后验概率的后验概率=niiiiiiiABPAPABPAPBPBAPBAP1)|()()|()()()()|(2626应应应应用用用用统统统统计计计计第第第第三三三三章章章章3.2 随机变量及其概率分布随机变量及其概率分布?随机变量随机变量随机变量随机变量表示随机试验结果的变量表示随机试验结果的变量表示随机试验结果的变量表示随机试验结果的变量?取值是随机的,事先不能确定取哪一个值取值是随机的,事先不能确定取哪一个值取值是随机的,事先不能确定取哪一个值取值是随机的,事先不能确定取哪一个值?一个取值对应随机试验的一个可能结果一个取值对应随机试验的一个可能结果一个取值对应随机试验的一个可能结果一个取值对应随机试验的一个可能结果?用大写字母如用大写字母如用大写字母如用大写字母如X X、Y Y、Z Z.来表示,具体取值来表示,具体取值来表示,具体取值来表示,具体取值则用相应的小写字母如则用相应的小写字母如则用相应的小写字母如则用相应的小写字母如x x、y y、z z来表示来表示来表示来表示?根据取值特点的不同,可分为:根据取值特点的不同,可分为:根据取值特点的不同,可分为:根据取值特点的不同,可分为:?离散型离散型随机变量随机变量取值可以一一列举取值可以一一列举?连续型连续型随机变量随机变量取值不能一一列举取值不能一一列举一、随机变量的概念一、随机变量的概念2727应应应应用用用用统统统统计计计计第第第第三三三三章章章章?X的概率分布的概率分布X的有限个可能取值为的有限个可能取值为xi与其概率与其概率 pi(i=1,2,3,n)之间的对应关系。)之间的对应关系。?概率分布具有如下两个基本性质:(概率分布具有如下两个基本性质:(1)pi0,i=1,2,n;(;(2)二、随机变量的概率分布二、随机变量的概率分布1.离散型随机变量的概率分布离散型随机变量的概率分布1=iip2828应应应应用用用用统统统统计计计计第第第第三三三三章章章章离散型概率分布的表示离散型概率分布的表示?概率函数:概率函数:P(X=xi)=pi?分布列:分布列:?分布图分布图pnp2p1P(X=xi)=pixnx2x1X=xi0.60.300 1 2 xP(x)图图3-5 例例3-9的概率分布的概率分布2929应应应应用用用用统统统统计计计计第第第第三三三三章章章章2.连续型随机变量的概率密度连续型随机变量的概率密度?连续型随机变量的概率分布只能表示为:连续型随机变量的概率分布只能表示为:?数学函数数学函数概率密度函数概率密度函数f(x)和分布函数和分布函数F(x)?图形图形概率密度曲线和分布函数曲线概率密度曲线和分布函数曲线?概率密度函数概率密度函数f(x)的函数值不是概率。的函数值不是概率。?连续型随机变量取某个特定值的概率等于连续型随机变量取某个特定值的概率等于0?只能计算随机变量落在一定区间内的概率只能计算随机变量落在一定区间内的概率由由x轴以上、概率密度曲线下方面积来表示轴以上、概率密度曲线下方面积来表示3030应应应应用用用用统统统统计计计计第第第第三三三三章章章章概率密度概率密度f(x)的性质的性质?(1)f(x)0。概率密度是非负函数。概率密度是非负函数。?(2)?所有区域上取值的概率总和为所有区域上取值的概率总和为1。?随机变量随机变量X在一定区间(在一定区间(a,b)上的概率:)上的概率:1d)(=xxfdxxfbXaPba=)()(f f(x x)xab3131应应应应用用用用统统统统计计计计第第第第三三三三章章章章3.分布函数分布函数?适用于两类随机变量概率分布的描述适用于两类随机变量概率分布的描述?分布函数的定义:分布函数的定义:F(x)PXx?离散型随机变量的分布函数离散型随机变量的分布函数?F(x)?连续型随机变量的分布函数连续型随机变量的分布函数 xxiipdxxfxFx)()(f f(x x)xx0F F(x x0 0)分布函数与概率密度分布函数与概率密度3232应应应应用用用用统统统统计计计计第第第第三三三三章章章章?又称均值又称均值?描述一个随机变量所有可能取值的平均值。描述一个随机变量所有可能取值的平均值。?离散型随机变量离散型随机变量 X的数学期望:的数学期望:?相当于所有可能取值以概率为权数的平均值相当于所有可能取值以概率为权数的平均值?连续型随机变量连续型随机变量X 的数学期望:的数学期望:iiipxXE)(三、随机变量的数字特征1.随机变量的数学期望1.随机变量的数学期望dxxxfxE=)()(3333应应应应用用用用统统统统计计计计第第第第三三三三章章章章数学期望的主要数学性质数学期望的主要数学性质?若若k是一常数,则是一常数,则E(kX)kE(X)?对于任意两个随机变量对于任意两个随机变量X、Y,有,有E(X+Y)E(X)E(Y)?若两个随机变量若两个随机变量X、Y相互独立,则相互独立,则E(XY)E(X)E(Y)3434应应应应用用用用统统统统计计计计第第第第三三三三章章章章2.随机变量的方差和标准差随机变量的方差和标准差?方差是它的各个可能取值偏离其均值的离差平方的均值,记为方差是它的各个可能取值偏离其均值的离差平方的均值,记为D(x)或或 2?离散型随机变量的方差:离散型随机变量的方差:?连续型随机变量的方差:连续型随机变量的方差:iiipxXD22)()(dxxfxXD)()(2222)()(XEXD3535应应应应用用用用统统统统计计计计第第第第三三三三章章章章?方差和标准差都反映随机变量取值的分散程度。方差和标准差都反映随机变量取值的分散程度。?它们的值越大,说明离散程度越大,其概率分布曲线越扁平。它们的值越大,说明离散程度越大,其概率分布曲线越扁平。?方差的主要数学性质:方差的主要数学性质:?若若k是一常数,则是一常数,则 D(k)0;?D(kX)=k2D(X)?若两个随机变量若两个随机变量X、Y相互独立,则相互独立,则D(X+Y)=D(X)+D(Y)3636应应应应用用用用统统统统计计计计第第第第三三三三章章章章例例4?试求优质品件数的数学期望、方差和标准差。试求优质品件数的数学期望、方差和标准差。2.13.026.011.00)(+iiipxXE36.03.0)2.12(6.0)2.11(1.0)2.10()()(2222+iiipxXD =0.60.30.60.1pi210 xi解:3737应应应应用用用用统统统统计计计计第第第第三三三三章章章章3.两个随机变量的协方差和相关系数两个随机变量的协方差和相关系数?协方差的定义协方差的定义?如果如果X,Y独立(不相关),则独立(不相关),则Cov(X,Y)0 即即E(XY)=E(X)E(Y)?协方差在一定程度上反映了协方差在一定程度上反映了X、Y之间的相关性之间的相关性?协方差受两个变量本身量纲的影响。协方差受两个变量本身量纲的影响。)()(),(YEYXEXEYXCov=)()()(YEXEXYE=3838应应应应用用用用统统统统计计计计第第第第三三三三章章章章相关系数相关系数?相关系数相关系数 具有如下的性质:具有如下的性质:?相关系数相关系数 是一个无量纲的值是一个无量纲的值?0|0?当当=0,两个变量不相关(不存在线性相关),两个变量不相关(不存在线性相关)?当当|=1,两个变量完全线性相关,两个变量完全线性相关YXXYYXCov),(=3939应应应应用用用用统统统统计计计计第第第第三三三三章章章章n重贝努里试验:重贝努里试验:?一次试验只有两种可能结果一次试验只有两种可能结果?用用“成功成功”代表所关心的结果,相反的结果为代表所关心的结果,相反的结果为“失败失败”?每次试验中每次试验中“成功成功”的概率都是的概率都是 p?n 次试验相互独立。次试验相互独立。四、常见离散型随机变量的概率分布1.二项分布二项分布4040应应应应用用用用统统统统计计计计第第第第三三三三章章章章?在在n重贝努里试验中,重贝努里试验中,“成功成功”的次数的次数X服从参数为服从参数为n、p的二项分布,记为的二项分布,记为 XB(n,p)?二项分布的概率函数为:二项分布的概率函数为:?二项分布的数学期望和方差:二项分布的数学期望和方差:?n=1时,二项分布就成了二点分布(时,二项分布就成了二点分布(0-1分布)分布)xnxxnppCxXP=)1()()1()(,)(2pnpXDnpXE4141应应应应用用用用统统统统计计计计第第第第三三三三章章章章例例5?某单位有某单位有4辆汽车,假设每辆车在一年中至多只发生一次损失,且损失的概率为辆汽车,假设每辆车在一年中至多只发生一次损失,且损失的概率为0.1。试求在一年内该单位:。试求在一年内该单位:?(1)没有汽车发生损失的概率;没有汽车发生损失的概率;?(2)有有1辆汽车发生损失的概率;辆汽车发生损失的概率;?(3)发生损失的汽车不超过发生损失的汽车不超过2辆的概率。辆的概率。4242应应应应用用用用统统统统计计计计第第第第三三三三章章章章?解:这里每辆汽车是否发生损失应该是相互独立的。因此,据题意,在解:这里每辆汽车是否发生损失应该是相互独立的。因此,据题意,在4辆汽车中发生损失的汽车数辆汽车中发生损失的汽车数XB(4,0.1)。由公式。由公式(3.18)可得所求概率分别为:可得所求概率分别为:?(1)?(2)?(3)6561.09.01.0)0(4004=CXP2916.09.01.0)1(3114=CXP)2()1()0()2(=+=+=XPXPXPXP9963.00486.02916.06561.0=+=4343应应应应用用用用统统统统计计计计第第第第三三三三章章章章2.泊松分布泊松分布?1837年法国数学家泊松首次提出。年法国数学家泊松首次提出。?通常用来描述一指定时间范围内,或者一定的长度体积、面积内,某一事件出现次数的分布。通常用来描述一指定时间范围内,或者一定的长度体积、面积内,某一事件出现次数的分布。?泊松分布的例子:泊松分布的例子:?一段时间内某繁忙十字路口发生交通事故的次数一段时间内某繁忙十字路口发生交通事故的次数?一定时间段内某电话交换台接到的电话呼叫次数一定时间段内某电话交换台接到的电话呼叫次数?一匹布上发现瑕点的个数一匹布上发现瑕点的个数?一段时间内,在车站等候公共汽车的人数一段时间内,在车站等候公共汽车的人数4444应应应应用用用用统统统统计计计计第第第第三三三三章章章章?X 服从泊松分布,记为服从泊松分布,记为XP():?为给定时间间隔、长度、面积、体积内为给定时间间隔、长度、面积、体积内“成功成功”的平均数的平均数?x为给定时间间隔、长度、面积、体积内成功的次数为给定时间间隔、长度、面积、体积内成功的次数?E(X)=D(X)=?当当 很小时,泊松分布呈偏态,并随着很小时,泊松分布呈偏态,并随着 增大而趋于对称增大而趋于对称?当当n很大而很大而p很小时,二项分布近似服从参数很小时,二项分布近似服从参数=np的泊松分布的泊松分布=e!)(xxXPx4545应应应应用用用用统统统统计计计计第第第第三三三三章章章章例例6?设某种报刊的每版上错别字个数服从的泊松分布。现随机翻看一版,试求:设某种报刊的每版上错别字个数服从的泊松分布。现随机翻看一版,试求:(1)没有错别字的概率;没有错别字的概率;(2)至多有至多有5个错别字的概率。个错别字的概率。1353.0!02)0(20=eXP9834.0!2)5(502=xxexXP解:设解:设X=“每版上错别字个数每版上错别字个数”,则所求概率为:,则所求概率为:;4646应应应应用用用用统统统统计计计计第第第第三三三三章章章章3.超几何分布超几何分布?二项分布适合于独立重复试验,如果对总体采用不重复抽样,那么样本中二项分布适合于独立重复试验,如果对总体采用不重复抽样,那么样本中“成功成功”的次数则服从超几何分布。记为的次数则服从超几何分布。记为XH(n,N,M)?(N为总体单位数、为总体单位数、M为具有某种特征的单位数)为具有某种特征的单位数)?数学期望和方差数学期望和方差:nNxnMNxMCCCxXP=)(1)1()(,)(2NnNpnpXDnpXE4747应应应应用用用用统统统统计计计计第第第第三三三三章章章章?X只在有限区间只在有限区间 a,b 上取值上取值?且概率密度是一个常数且概率密度是一个常数?其概率密度为:其概率密度为:?X 落在子区间落在子区间 c,d 内的概率与该子区间的长度成正比,与具体位置无关内的概率与该子区间的长度成正比,与具体位置无关五、常见的连续型概率分布五、常见的连续型概率分布1.均匀分布均匀分布bxaabxf=,1)(f(x)a c d b xP(cXd)4848应应应应用用用用统统统统计计计计第第第第三三三三章章章章2.正态分布正态分布?XN(,2),其概率密度为:,其概率密度为:?正态分布随机变量的均值和标准差均值正态分布随机变量的均值和标准差均值E(X)=方差方差D(X)=2222)(21)(=xexf-x x 4949应应应应用用用用统统统统计计计计第第第第三三三三章章章章正态分布曲线的主要特性正态分布曲线的主要特性?关于关于x=对称的钟形曲线对称的钟形曲线?参数参数 决定正态曲线的中心位置决定正态曲线的中心位置?参数参数决定正态曲线的陡峭或扁平程度决定正态曲线的陡峭或扁平程度?以以X轴为渐近线,即当轴为渐近线,即当x 时,时,f(x)0相同而相同而不同的正态曲线不同的正态曲线 1 1 2 xf(x)相同而相同而不同的正态曲线不同的正态曲线f(x)较小较小较大较大 x5050应应应应用用用用统统统统计计计计第第第第三三三三章章章章标准正态分布标准正态分布?=0、=1的正态分布,记为的正态分布,记为N(0,1)?其概率密度其概率密度(x),分布函数分布函数(x)?XN(,2),则:则:ZN(0,1)?若若 ZN(0,1),则有:,则有:?P(|Z|a)2(a)-1?(-a)=1-(a)=XZ标准化标准化标准正态曲线标准正态曲线-a0 a(z)z z(a)5151应应应应用用用用统统统统计计计计第第第第三三三三章章章章例例7?某厂生产的某种节能灯管的使用寿命服从正态分布,对某批产品测试的结果,平均使用寿命为某厂生产的某种节能灯管的使用寿命服从正态分布,对某批产品测试的结果,平均使用寿命为1050小时,标准差为小时,标准差为200小时。试求:小时。试求:?使用寿命在使用寿命在500小时以下的灯管占多大比例?小时以下的灯管占多大比例??使用寿命在使用寿命在8501450小时的灯管占多大比例?小时的灯管占多大比例??以均值为中心,以均值为中心,95的灯管的使用寿命在什么范围内?的灯管的使用寿命在什么范围内?5252应应应应用用用用统统统统计计计计第第第第三三三三章章章章解:解:?设设X使用寿命,使用寿命,XN(1050,2002)(1)()(2)()(3)75.22001050500)500(=3 的概率很小,因此可认为正态随机变量的取值几乎全部集中在的概率很小,因此可认为正态随机变量的取值几乎全部集中在-3,+3 区间内区间内?广泛应用广泛应用:产品质量控制判断异常情况产品质量控制判断异常情况常用的正态概率值(在一般正态分布及标准正态分布中)常用的正态概率值(在一般正态分布及标准正态分布中)-3-2-1 0+1 +2 +3 z-3-2-+2 +3 x99.73%95.45%68.27%5454应应应应用用用用统统统统计计计计第第第第三三三三章章章章正态分布最常用、最重要正态分布最常用、最重要?大千世界中许多常见的随机现象服从或近似服从正态分布?例如,测量误差,同龄人的身高、体重,一批棉纱的抗拉强度,一种设备的使用寿命,农作物的产量?特点是“中间多两头少”?由于正态分布特有的数学性质,正态分布在很多统计理论中都占有十分重要的地位?正态分布是许多概率分布的极限分布?统计推断中许多重要的分布(如2分布、t分布、F分布)都是在正态分布的基础上推导出来的。5555应应应应用用用用统统统统计计计计第第第第三三三三章章章章3.3 大数定律与中心极限定理大数定律与中心极限定理?大数定律是阐述大量同类随机现象的平均结果的稳定性的一系列定理的总称。大数定律是阐述大量同类随机现象的平均结果的稳定性的一系列定理的总称。一、大数定律5656应应应应用用用用统统统统计计计计第第第第三三三三章章章章1.独立同分布大数定律独立同分布大数定律?设设X1,X2,是独立同分布的随机变量序列,且存在有限的数学期望是独立同分布的随机变量序列,且存在有限的数学期望E(Xi)=和方差和方差D(Xi)=2(i=1,2,),则对任意小的正数),则对任意小的正数,有:有:?该定理给出了平均值具有稳定性的科学描述,从而为使用样本均值去估计总体均值(数学期望)提供了理论依据。该定理给出了平均值具有稳定性的科学描述,从而为使用样本均值去估计总体均值(数学期望)提供了理论依据。1|1|lim1=0,有:,有:?它表明,当重复试验次数它表明,当重复试验次数n充分大时,事件充分大时,事件A发生的频率发生的频率m/n依概率收敛于事件依概率收敛于事件A发生的概率发生的概率?阐明了频率具有稳定性,提供了用频率估计概率的理论依据。阐明了频率具有稳定性,提供了用频率估计概率的理论依据。1|lim=YPYPYP 6262应应应应用用用用统统统统计计计计第第第第三三三三章章章章2.棣莫佛拉普拉斯中心极限定理棣莫佛拉普拉斯中心极限定理?设随机变量设随机变量X服从二项分布服从二项分布B(n,p)的,那么当的,那么当n 时,时,X服从均值为服从均值为np、方差为、方差为 np(1-p)的正态分布,即:的正态分布,即:?上述定理表明:上述定理表明:n很大,很大,np 和和 np(1p)也都不太小时,二项分布可以用正态分布去近似。也都不太小时,二项分布可以用正态分布去近似。)1(pnpnpNX,)10()1(,NpnpnpX或:或:6363应应应应用用用用统统统统计计计计第第第第三三三三章章章章例例9:?假设有一批种子的发芽率为假设有一批种子的发芽率为0.7。现有这种种子。现有这种种子1000颗,试求其中有颗,试求其中有720颗以上发芽的概率。解:设颗以上发芽的概率。解:设X发芽种子颗数,发芽种子颗数,XB(1000,0.7)。近似地。近似地XN(700,210)。P(X720)P(Z1.38)1P(Z1.38)10.91620.0838 6464应应应应用用用用统统统统计计计计第第第第三三三三章章章章本章小结本章小结?随机现象是指在一定条件下可能出现这种结果、也可能出现那种结果的现象。对随机现象进行观察或试验,每一个可能结果称为一个随机事件。最简单的、不能再分解的事件称为基本事件(也称为样本点)。由两个或多个基本事件构成的事件称为复合事件。所有样本点构成样本空间。在每次试验中都必定发生的事件称为必然事件。在每次试验中都必定不发生的事件称为不可能事件。?用来度量随机事件发生的可能性大小的数值称为该随机事件发生的概率。概率的定义有三种:古典概率、统计概率和主观概率。确定概率的方法也有相应的三种:利用等可能事件的比值、利用大量观察的频率以及主观估计。概率必须具备三条最基本的性质:非负性、规范性和可加性。6565应应应应用用用用统统统统计计计计第第第第三三三三章章章章?概率运算最基本的法则是概率的加法公式和乘法公式。?求任意两事件A与B“至少有一个发生”的概率要用到加法公式,需注意A与B两个事件是否互斥。计算两事件A与B同时发生的概率通常要应用乘法公式,此时需注意A与B是否独立,如果不独立,则要涉及条件概率。?全概率公式和贝叶斯公式是加法公式和乘法公式的综合运用。前者描述事件B发生的概率是其各个“原因”Ai引发的概率的总和,后者用于计算事件Ai在给定条件B之下的条件概率(后验概率)。6666应应应应用用用用统统统统计计计计第第第第三三三三章章章章?随机变量是对随机现象的试验结果的数量化描述。了解随机变量的概率分布,关注随机变量的主要数字特征。数学期望(均值)是对随机变量集中趋势的度量,方差和标准差反映随机变量可能取值的离散程度。?离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有泊松分布、超几何分布。?连续型随机变量概率分布可以用概率密度和分布函数以及对应的曲线图来表示。常见的连续型随机变量的概率分布有正态分布、均匀分布等。所有正态分布都可以通过线性变换转变为标准正态分布。许多常见的随机现象服从或近似服从正态分布。由于正态分布特有的数学性质,它在很多统计理论中都占有十分重要的地位。6767应应应应用用用用统统统统计计计计第第第第三三三三章章章章?大数定律是阐述大量同类随机现象的平均结果的稳定性的一系列定理的总称。独立同分布大数定律和伯努利大数定律在推断统计具有重要理论意义。?中心极限定理是阐述大量随机变量之和的分布趋近于正态分布的一系列定理的总称。其中最简单但也是最实用的是独立同分布的中心极限定理和棣莫佛一拉普拉斯中心极限定理。