《概率论及数理统计概率分布 .ppt》由会员分享,可在线阅读,更多相关《概率论及数理统计概率分布 .ppt(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2024/6/121第二章第二章 概率分布概率分布2024/6/122引引 言言l由于存在个体差异,即使从同一总体中抽取的由于存在个体差异,即使从同一总体中抽取的两份样本之间也会有所不同,因此需要对总体两份样本之间也会有所不同,因此需要对总体特征做出描述。特征做出描述。l随机变量的分布常见的有三种类型:随机变量的分布常见的有三种类型:正态分布(正态分布(normaldistribution)二项分布(二项分布(binominaldistribution)Poisson分布(分布(Poissondistribution)离散型变量离散型变量连续型变量连续型变量2024/6/123了解了解l正态分
2、布的密度函数正态分布的密度函数l二项分布的应用二项分布的应用lPoisson分布的应用分布的应用掌握掌握l正态分布曲线的特征正态分布曲线的特征及应用及应用l二项分布的概念与特二项分布的概念与特征征lPoisson分布的概念与分布的概念与特征特征【教学目的教学目的】2024/6/1241.概念概念频率密度图的绘制频率密度图的绘制例例:随随机机调调查查某某医医院院1402例例待待分分娩娩孕孕妇妇,测测得得她她们们的的体体重重。体体重重在在各各组组段段的的频频数数分分布布见见表表1第第2列列,并并求求得得体体重重落落在在各各组组段段的的频频率率(表表1的的第第3列列)。现现以以体体重重测测量量值值为
3、为横横轴轴,以以频频率率与与组组距距的的比比值值为为纵纵轴轴作作出出直直方方图图。由由于于该该直直方方图图的的纵纵轴轴表表示示在在每每个个组组段段内内单单位位长长所所占占有有的的频频率率,相相当当于于频频率率密密度度,因因此此我我们们将将此此图图称称为为频频率率密度图(见图密度图(见图1)。)。一、正态分布2024/6/125表表1某医院某医院1402例分娩孕妇体重频数分布例分娩孕妇体重频数分布体重组段体重组段 频数频数频率频率(频数频数/总频数总频数)累积频率累积频率频率密度频率密度(频率频率/组距组距)48-60.00430.00430.001152-540.03850.04280.009
4、656-1620.11550.15830.028960-2930.20900.36730.052264-3590.25610.62340.064068-2980.21260.83590.053172-1400.09990.93580.025076-700.04990.98570.012580-170.01210.99790.003084-30.00211.00000.0005合计合计14021.0000图图1体重频率密度图体重频率密度图2024/6/127若若将将各各直直条条顶顶端端的的中中点点顺顺次次连连接接起起来来,得得到到一一条条折折线线。当当样样本本量量n越越来来越越大大时时,组组段段
5、越越分分越越细细,此此时时直直方方渐渐进进直直条条,这这条条折折线线就就越越来来越越接接近近于于一一条条光光滑滑的的曲曲线线(见见图图1、2),我我们们把把这这条条呈呈中中间间高高,两两边边低低,左左右右基基本本对对称称的的“钟钟型型”曲曲线线称称为为正正态态分分布布曲曲线线,近近似似于于数数学学上上的正态分布(高斯分布的正态分布(高斯分布;Gauss)。)。2024/6/128 图图1 体重频率密度图体重频率密度图 图图2 概率密度曲线示意图概率密度曲线示意图 2024/6/129正态分布的密度函数正态分布的密度函数 式式中中,m m为为总总体体均均数数,s s为为总总体体标标准准差差,为为
6、圆圆周周率,率,e为自然对数的底,仅为自然对数的底,仅x为变量。为变量。当当x确确定定后后,f(x)为为X相相应应的的纵纵坐坐标标高高度度,则则X服服从从参参数数为为和和2的的正正态态分分布布(normaldistribution),记记作作XN(,s s2)。2024/6/1210一一般般地地,若若连连续续型型随随机机变变量量,设设其其概概率率密密度度函函数数为为,则则X取取值值落落在在区区间间内内的的累累积积概概率率为为概概率率密密度度曲曲线线下下位位于于的的图图形形面面积积,等等于于其其概概率率密密度度函函数数在在到到x上上的的积积分分,记记作作。称称为为正正态态分分布布的的概概率率密密
7、度度函函数数。其其值值表表示示变变量量落落在在区区间间的的概概率率,对对应应于于从从-到到x概概率率密密度度曲曲线线下下的的阴阴影影的的面面积(常称为左侧尾部面积),见图积(常称为左侧尾部面积),见图3。2024/6/1212图图3 正态分布的概率密度函数正态分布的概率密度函数 2024/6/1213 于是,利用概率密度函数于是,利用概率密度函数 可以计算正态可以计算正态分布变量取值在任意区间(分布变量取值在任意区间(a,b)的概率为)的概率为P(aX5,且,且n(1-)5时,二项分布趋于正态分布。时,二项分布趋于正态分布。图7 二项分布的概率分布示意图 2024/6/12534.二项分布的应
8、用二项分布的应用4.1应用条件应用条件(1)各观察单位只具有相互对立的两种结果;各观察单位只具有相互对立的两种结果;(2)已知发生某一结果的概率为已知发生某一结果的概率为,其对立结果的概,其对立结果的概率则为率则为1-;(3)n个观察单位的观察结果相互独立。个观察单位的观察结果相互独立。4.2应用应用概率计算;概率计算;2024/6/1254例:据报道,有例:据报道,有10%的人对某药有肠道反应。为考的人对某药有肠道反应。为考察此药的质量,现随机选察此药的质量,现随机选5人服用此药,试求人服用此药,试求:(1)其中其中k个人个人(k=0,1,2,3,4,5)有反应的概率;有反应的概率;(2)不
9、不多于多于2人有反应的概率;人有反应的概率;(3)有人有反应的概率。有人有反应的概率。X=k012345P(X=K)0.59049 0.32805 0.07290 0.00810 0.00045 0.00001例例:设设在在人人群群中中感感染染某某种种疾疾病病的的概概率率为为20%,现现有有两两种种疫疫苗苗,用用疫疫苗苗A注注射射了了15人人后后无无一一感感染染,用用疫疫苗苗B注注射射15人人后后有有1人人感感染染,设设人人群群没没有有相相互互传传染疾病的可能,问:应该如何评价这两种疫苗?染疾病的可能,问:应该如何评价这两种疫苗?解解:假假设设疫疫苗苗A、B完完全全无无效效,那那么么注注射射后
10、后感感染染的的概概率率仍仍为为20%,则则15人人中中染染病病人人数数XB(15,0.20)。X=0的概率为的概率为X1的概率为的概率为2024/6/1256 Poisson分分布布是是一一个个重重要要的的离离散散型型概概率率分分布布。一一般般地地,Poisson分分布布应应用用于于观观察察例例数数n很很大大、而而 发发生生的的概概率率很很小小的的情情况况。如如,交交通通事事故故发发生生数数,某某些些罕罕见见疾疾病病发发生生数数,单单位位容容积积中中的的细细菌菌计计数数、细细胞胞计计数数,放放射射性性物物质质在在单单位位时时间间内内放放射射的的粒粒子子数数,单单位位空空间间的的粉粉尘尘个个数数
11、等等等等。此此时时,随随机机变变量量X(发发生生数数等等)所所有有可可能能的的取取值值以以及及相相应应的的概概率率分分布布即即为为Poisson分布。分布。三、三、Poisson分布分布历史上,历史上,Poisson分布是作为二项分布的近分布是作为二项分布的近似,于似,于1837年由法国数学家年由法国数学家Poisson引入引入。近近年年来来,PoissonPoisson分分布布日日益益显显示示其其重重要要性性,成为概率论中最重要的几个分布之一。成为概率论中最重要的几个分布之一。在实际生活中,许多随机现象服从或近在实际生活中,许多随机现象服从或近似服从泊松分布。似服从泊松分布。在生物学、医学、
12、工业统计、保险科学等问在生物学、医学、工业统计、保险科学等问题中题中,泊松分布是常见的。如地震、火山爆发、特泊松分布是常见的。如地震、火山爆发、特大洪水、交通事故次数等大洪水、交通事故次数等,都服从泊松分布。都服从泊松分布。地地震震火火山山爆爆发发特特大大洪洪水水交交通通事事故故次次数数泊松分布的图形泊松分布的图形图图8Poisson分布的示意图分布的示意图2024/6/12601.Poisson分布的概率函数:分布的概率函数:此此处处m m0,是是某某一一常常数数,e是是自自然然对对数数的的底底数数,称称X服从参数为服从参数为 的的Poisson分布,记为分布,记为XP()可可见见,Pois
13、son分分布布可可作作为为二二项项分分布布的的极极限限而而得得到到。换换言言之之,如如果果XB(n,),当当 很很小小,而而n很很大大时时,可可以认为以认为X近似服从近似服从m m=n 的的Poisson分布分布P(m m)。2024/6/1261(1)Poisson分分布布属属于于离离散散型型分分布布,是是Poisson分分布布的的总总体体参参数,也是唯一的参数。数,也是唯一的参数。(2)方方差差s s2与与均均数数 相相等等,即即=s s2。这这是是Poisson分分布布的的一一个个非非常常重重要要而而且且非非常常独独特特的的性性质质,经经常常用用于于判判断断某某随随机机事事件件是是否服从
14、否服从Poisson分布。分布。(3)设设且且,并且,并且X1与与X2相互独立,则相互独立,则服从总体均数为服从总体均数为的的Poisson分布。分布。(4)当当20时,时,poisson分布近似正态分布分布近似正态分布2.Poisson分布的特性分布的特性2024/6/12623.应用应用应用条件:应用条件:由由于于Poisson分分布布可可以以看看作作二二项项分分布布的的极极限限分分布布,二二项项分分布布的的应应用用条条件件也也是是Poisson分分布布的的应应用用条条件件。此此外外,Poisson分分布布还还要要求求试试验验次次数数n很很大大,而而所所关心的事件发生的概率关心的事件发生的
15、概率 很小。很小。2024/6/1263概率计算概率计算例例:为监测饮用水的污染情况,现检验某社区每毫升为监测饮用水的污染情况,现检验某社区每毫升饮用水中细菌数,共得饮用水中细菌数,共得400个,记录如下表:个,记录如下表:表表5 5 某社区每毫升饮用水中细菌数某社区每毫升饮用水中细菌数1ml水中细菌水中细菌数数0123合计合计次数次数f243120316400试试分分析析饮饮用用水水中中细细菌菌数数的的分分布布是是否否服服从从Poisson分分布布。若若服服从从,计计算算每每毫毫升升水水中中细细菌菌数数的的概概率率及及理理论论次次数数,并并将将次次数数分分布布与与Poisson分分布布做做直
16、直观比较观比较2024/6/1264得:经计算得每毫升水中平均细菌数得:经计算得每毫升水中平均细菌数=0.5,方差,方差S2=0.496。两者接近,近似服从。两者接近,近似服从Poisson分布。分布。细菌数细菌数 实际次数实际次数频率频率概率概率理论次数理论次数0243 0.6075 0.6065242.601120 0.3000 0.3033121.32231 0.0775 0.075830.3236 0.0150 0.01445.76合计合计400 1.0000 1.0000400.002024/6/1265例如某均匀的溶液中,每例如某均匀的溶液中,每ml含有含有3个细菌,即个细菌,即X
17、P(3)。现考虑)。现考虑5ml溶液中的细菌的分布情况。溶液中的细菌的分布情况。由于由于XiP(3)i=1,2,3,4,5。据。据Poisson分布的分布的可加性可得:可加性可得:X1 X2 X3X4X5P(15)即即5ml溶液中的细菌数仍然服从溶液中的细菌数仍然服从Poisson分布,均分布,均数为数为15。2024/6/1266 选择题选择题 1.理论上,二项分布是一种理论上,二项分布是一种A连续性分布连续性分布B离散分布离散分布C均匀分布均匀分布D标准正态分布标准正态分布2.在样本例数不变的情况下,下列何种情况时,二在样本例数不变的情况下,下列何种情况时,二项分布越接近对称分布。项分布越
18、接近对称分布。A总体比例总体比例越大越大B样本比例样本比例P越大越大C总体比例总体比例越接近越接近0.5D总体比例总体比例越小越小2024/6/12673.某某种种人人群群(如如成成年年男男子子)的的某某个个生生理理指指标标(如如收收缩缩压压)或或生化指标(如血糖水平)的正常值范围一般生化指标(如血糖水平)的正常值范围一般A.该指标在所有人中的波动范围该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围该指标在少部分正常人中的波动范围E.该指标在一个
19、人不同时间的波动范围该指标在一个人不同时间的波动范围2024/6/12684.4.正态分布的特点有正态分布的特点有A.A.算术均数算术均数=几何均数几何均数 B.B.算术均数算术均数=中位数中位数C.C.几何均数几何均数=中位数中位数 D.D.算术均数算术均数=几何均数几何均数=中位数中位数E.E.以上都没有以上都没有2024/6/12695.5.正态分布曲线下右侧正态分布曲线下右侧5 5对应的分位点为对应的分位点为A.+1.96 A.+1.96 B.-1.96B.-1.96C.+2.58 C.+2.58 D.+1.64D.+1.64E.-2.58E.-2.582024/6/1270计算题计算题某地某地1998年抽样调查了年抽样调查了100名名18岁男大学生身高,岁男大学生身高,其均数其均数=172.70cm,标准差,标准差=4.01cm。(1)估计该地)估计该地18岁男大学生身高在岁男大学生身高在168cm以下者占以下者占该地该地18岁男大学生总数的百分数;岁男大学生总数的百分数;(2)估计该地)估计该地18岁男大学生身高在岁男大学生身高在177cm以下者占以下者占该地该地18岁男大学生总数的百分数。岁男大学生总数的百分数。2024/6/1271
限制150内