《常用概率分布 (4)讲稿.ppt》由会员分享,可在线阅读,更多相关《常用概率分布 (4)讲稿.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于常用概率分布(4)第一页,讲稿共八十五页哦随机事件的观察结果称之为随机变量随机事件的观察结果称之为随机变量随机变量连续型随机变量 某区间概率某区间概率离散型随机变量 某取值概率某取值概率概率密度概率密度函数函数概率分布概率分布第二页,讲稿共八十五页哦一、正态分布的概念和特征一、正态分布的概念和特征常用概率分布常用概率分布 第一节第一节 正态分布正态分布正态分布是自然界最常见的一种分布,正态分布是自然界最常见的一种分布,若指标若指标X X的频率密度曲线对应于数学上的正态分布曲线,的频率密度曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。则称该指标服从正态分布。第三页,讲稿共八十五页哦
2、概率概率密度密度第四页,讲稿共八十五页哦第五页,讲稿共八十五页哦正态分布的密度函数密度函数,即正态曲线的方程为正态曲线的方程为-X+第六页,讲稿共八十五页哦均数为均数为0 0,标准差为,标准差为1 1的正态分布,这种正态分布称为的正态分布,这种正态分布称为标标准正态分布准正态分布。-Z+标准正态分布的密度函数:标准正态分布的密度函数:为标准正态分布的密度函数,即纵坐标的高度为标准正态分布的密度函数,即纵坐标的高度。对于任意一个服从正态分布对于任意一个服从正态分布N(,N(,2 2)的随机变量,可的随机变量,可作如下的作如下的标准化变换标准化变换,也称,也称Z Z变换变换,(教材教材57)57)
3、第七页,讲稿共八十五页哦正态分布的特征正态分布的特征1.关于关于对称。即正态分布以均数为中心,对称。即正态分布以均数为中心,左右对称。左右对称。2.在处取得概率密度函数的最大值,在处有拐点拐点,表现为钟形曲线。即正态曲线在横轴上方均数正态曲线在横轴上方均数处最高。处最高。第八页,讲稿共八十五页哦3.正态分布有两个参数,即均数正态分布有两个参数,即均数和标准差和标准差。是是位置参数位置参数,是是变异度参数变异度参数(形状参数形状参数)。常用。常用N(,2)表表示均数为示均数为,标准差为,标准差为的正态分布;用的正态分布;用N(0,1)表示标准正表示标准正态分布。态分布。4.正态曲线下面积分布有一
4、定规律。横轴上正态曲线下面积分布有一定规律。横轴上正态曲线下的面积等于正态曲线下的面积等于100%或或1。第九页,讲稿共八十五页哦二、正态曲线下面积的分布规律二、正态曲线下面积的分布规律正态方程的积分式正态方程的积分式(分布函数分布函数):F(X)为正态变量X的累计分布函数,反映正态曲线下,横轴尺度自到X的面积,即下侧累计面积。标准正态分布方程积分式标准正态分布方程积分式(分布函数分布函数):(Z)为标准正态变量u的累计分布函数,反映标准正态曲线下,横轴尺度自到Z的面积,即下侧累计面积。第十页,讲稿共八十五页哦第十一页,讲稿共八十五页哦在实际工作中为了方便用查表代替计算(教材(教材432页)页
5、)1)表中曲线下面积为)表中曲线下面积为到到Z的面积。的面积。2)当当,和和X已知时已知时,先求出,先求出Z值,值,再用再用Z值查表,得所求区间占总面积的比例。值查表,得所求区间占总面积的比例。当当和和未知时未知时,要用样本均数和样本标准差,要用样本均数和样本标准差S来估计来估计Z值。值。3)曲线下对称于)曲线下对称于0的区间,面积相等。的区间,面积相等。4)曲线下横轴上的面积为)曲线下横轴上的面积为100%或或1。三、标准正态分布表三、标准正态分布表第十二页,讲稿共八十五页哦正态分布是一种对称分布,其对称轴为直线正态分布是一种对称分布,其对称轴为直线X=,即均数,即均数位置,理论上:位置,理
6、论上:1范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的68.27%1.96范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的95%2.58范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的99%实际应用中实际应用中:1S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的68.27%1.96S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的95%2.58S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的99%第十三页,讲稿共八十五页哦第十四页,讲稿共八十五页哦标准正态分布的标准正态分布的=0,=1,则,则相当于区间相当于区间(-1,1),1.96相当于
7、区间相当于区间(-1.96,1.96),2.58的区间相当于区间的区间相当于区间(-2.58,2.58)。区间区间(-1,1)的面积:的面积:1-2(-1)=1-20.1587=0.6826=68.26%区间区间(-1.96,1.96)的面积:的面积:1-2(-1.96)=1-20.0250=0.9500=95%区间区间(-2.58,2.58)的面积:的面积:1-2(-2.58)=1-20.0049=0.9902=99.02%第十五页,讲稿共八十五页哦正态曲线下面积对称,则区间(正态曲线下面积对称,则区间(1.96,)的面积也是)的面积也是0.025。Z取值于(取值于(-1.96,1.96)的
8、概率为)的概率为1-20.025=0.95,即,即X取值在区间取值在区间上的概率为上的概率为95%。例例4-10X服从均数为服从均数为,标准差为,标准差为的正态分布,的正态分布,试估计试估计(1)X取值在区间取值在区间上的概率;(上的概率;(2)X取值取值在区间在区间上的概率;上的概率;先做标准化变化:第十六页,讲稿共八十五页哦例例4-11已知某地已知某地1986年年120名名8岁男童身高数岁男童身高数,S=4.79cm,估计,估计(1)该地该地8岁男孩身高在岁男孩身高在130cm以上者占该地以上者占该地8岁男孩总数的百分比;岁男孩总数的百分比;(2)身高界于身高界于120cm128cm者占该
9、地者占该地8岁男孩总数的比例;岁男孩总数的比例;(3)该地该地80%男孩身高集中在哪个范围?男孩身高集中在哪个范围?先做标准化变化先做标准化变化:理论上该地8岁男孩身高在130cm以上者占该地8岁男孩总数的7.21%。第十七页,讲稿共八十五页哦(2)第十八页,讲稿共八十五页哦(3)查附表查附表1,标准正态分布曲线下左侧面积为,标准正态分布曲线下左侧面积为0.10所对应的所对应的Z值为值为-1.28,所以,所以80%的的8岁男孩身高值集中在岁男孩身高值集中在区间内,即区间内,即116.9cm129.2cm第十九页,讲稿共八十五页哦(一)制定医学参考值范围(一)制定医学参考值范围v参考值范围:指特
10、定的参考值范围:指特定的“正常正常”人群的解剖、生理、生化、免疫等各人群的解剖、生理、生化、免疫等各种数据的波动范围。种数据的波动范围。v制定参考值范围的步骤:制定参考值范围的步骤:1.选择选择“正常正常”人作为调查对象。人作为调查对象。2.样本含量足够大。样本含量足够大。3.确定取单侧还是取双侧正常值范围。确定取单侧还是取双侧正常值范围。4.选择适当的百分界限。选择适当的百分界限。5.选择适当的方法。选择适当的方法。四、四、正态分布的应用正态分布的应用第二十页,讲稿共八十五页哦v估计医学参考值范围的方法:估计医学参考值范围的方法:1.正态近似法正态近似法:适用于正态分布或近似正态分布的资料。
11、:适用于正态分布或近似正态分布的资料。2.百分位数法百分位数法:适用于偏态分布资料。:适用于偏态分布资料。过低异常过低异常过低异常过低异常过高异常过高异常过高异常过高异常第二十一页,讲稿共八十五页哦例例4-12某地调查某地调查120名健康女性血红蛋白,直方图显名健康女性血红蛋白,直方图显示,其分布近似于正态分布,得均数为示,其分布近似于正态分布,得均数为117.4g/L,标准差为,标准差为10.2g/L,试估计该地正常女性血红蛋白的,试估计该地正常女性血红蛋白的95%医学参考值医学参考值范围。范围。分析:分析:正常人的血红蛋白过高过低均为异常,要制定双侧正常人的血红蛋白过高过低均为异常,要制定
12、双侧正常值范围。正常值范围。该指标的该指标的95%医学参考值范围为医学参考值范围为第二十二页,讲稿共八十五页哦例例3.6某地调查某地调查110名正常成年男子的第一秒肺通气量,名正常成年男子的第一秒肺通气量,得均数为得均数为4.2L,标准差为,标准差为0.7L,试估计该地正常成年男子,试估计该地正常成年男子第一秒肺通气量的第一秒肺通气量的95%参考值范围。参考值范围。该地正常成年男子第一秒肺通气量的该地正常成年男子第一秒肺通气量的95%参考值范围为:参考值范围为:不低于不低于3.052L。分析:分析:正常人的第一秒肺通气量近似正态分布,且只以正常人的第一秒肺通气量近似正态分布,且只以过低为异常,
13、要制定单侧下限。过低为异常,要制定单侧下限。第二十三页,讲稿共八十五页哦例例3某年某市调查了某年某市调查了200例正常成人血铅含量例正常成人血铅含量(g/100g)如下,试估计该市成人血铅含量的如下,试估计该市成人血铅含量的95%医学参医学参考值范围。考值范围。第二十四页,讲稿共八十五页哦分析:血铅的分布为偏态分布,且血铅含量只以过高为分析:血铅的分布为偏态分布,且血铅含量只以过高为异常,要用百分位数法制定单侧上限。异常,要用百分位数法制定单侧上限。第二十五页,讲稿共八十五页哦二、质量控制二、质量控制为了控制实验中的检测误差,常用2S作上下警戒线,以3S作为上下控制线。这里的2S和3S可视为1
14、.96S和2.58S的约数。其依据是正常情况下检测误差是服从正态分布的。但影响某一指标的随机因素很多,如果该指标的随机波动属于随机误差,则往往符合正态分布,如果不服从正态分布,则有可能存在系统误差7条线分别表示的意义第二十六页,讲稿共八十五页哦判断异常的判断异常的8 8种情况是:种情况是:v有一个点距中心线的距离超过有一个点距中心线的距离超过3 3个标准差(个标准差(控制限控制限以外)以外)v在中心线的一侧连续有在中心线的一侧连续有9 9个点个点v连续连续6 6个点稳定地增加或减少个点稳定地增加或减少v连续连续1414个点交替上下个点交替上下v连续连续3 3个点中有两个点距中心线距离超过个点中
15、有两个点距中心线距离超过2 2个标准差(个标准差(警戒限警戒限以外)以外)v连续连续5个点中有个点中有4个点距中心线距离超过个点距中心线距离超过1个标准差个标准差v中心线一侧或两侧连续中心线一侧或两侧连续15个点距中心线距离都超出个点距中心线距离都超出1个标准差以内个标准差以内v中心线一侧或两侧连续中心线一侧或两侧连续8个点距中心线距离都超出个点距中心线距离都超出1个标准差范围。个标准差范围。第二十七页,讲稿共八十五页哦三、统计处理方法的理论基础三、统计处理方法的理论基础如如统计描述中计算算术平均数、标准差、统计描述中计算算术平均数、标准差、统计推断中进行总体均数置信区间估计、统计推断中进行总
16、体均数置信区间估计、t检验、检验、F检验、相关与回归等分析检验、相关与回归等分析第二十八页,讲稿共八十五页哦(一)成败型实验(一)成败型实验(BernoulliBernoulli实验实验)在医学卫生领域的许多实验或观察中,人们感兴趣的在医学卫生领域的许多实验或观察中,人们感兴趣的是某事件是否发生。如用白鼠做某药物的毒性实验,关心是某事件是否发生。如用白鼠做某药物的毒性实验,关心的是白鼠是否死亡;某种新疗法临床实验观察患者是否治的是白鼠是否死亡;某种新疗法临床实验观察患者是否治愈;观察某指标的化验结果是否呈阳性等愈;观察某指标的化验结果是否呈阳性等。将我们关心的将我们关心的事件事件A A出现称为
17、成功,不出现称为失败,这类试验就称为成出现称为成功,不出现称为失败,这类试验就称为成-败型实验。指定性资料中的二项分类实验。败型实验。指定性资料中的二项分类实验。第二节第二节二项分布二项分布(教材教材48页和页和60页页)一、二项分布的概念与特征一、二项分布的概念与特征第二十九页,讲稿共八十五页哦 成成-败型败型(BernoulliBernoulli)实验序列:实验序列:满足以下三个条件的满足以下三个条件的n n次实验构成的序列称为成次实验构成的序列称为成-败型实验序败型实验序列。列。1 1)每次实验结果,只能是两个互斥的结果之一()每次实验结果,只能是两个互斥的结果之一(A A或非或非A A
18、)。)。2)2)相同的实验条件下,每次实验中事件相同的实验条件下,每次实验中事件A A的发生具有相同的发生具有相同的概率的概率。3)3)各次实验独立。各次的实验结果互不影响。各次实验独立。各次的实验结果互不影响。第三十页,讲稿共八十五页哦(二)二项分布的概率函数(二)二项分布的概率函数 二项分布是指在只能产生两种可能结果(如二项分布是指在只能产生两种可能结果(如“阳性阳性”或或“阴性阴性”)之一的)之一的n次独立重复实验中,当每次试验的次独立重复实验中,当每次试验的“阳性阳性”概率保持不变时,出现概率保持不变时,出现“阳性阳性”的次数的次数X=0,1,2,nX=0,1,2,n的的一种概率分布。
19、一种概率分布。若从阳性率为若从阳性率为的总体中随机抽取大小为的总体中随机抽取大小为n的样本,则出的样本,则出现现“阳性阳性”数为数为X X的概率分布即呈现二项分布的概率分布即呈现二项分布,记作,记作B B(X;(X;n,)或或B(B(n,)。第三十一页,讲稿共八十五页哦举例举例 设实验白鼠共设实验白鼠共3 3只,要求它们同种属、同只,要求它们同种属、同性别、体重相近,且他们有相同的死亡概率,性别、体重相近,且他们有相同的死亡概率,即事件即事件“白鼠用药后死亡白鼠用药后死亡”为为A A,相应死亡概率,相应死亡概率为为。记事件。记事件“白鼠用药后不死亡白鼠用药后不死亡”为为 ,相,相应不死亡概率为
20、应不死亡概率为1-1-。设实验后。设实验后3 3只白鼠中死亡只白鼠中死亡的白鼠数为的白鼠数为X X,则,则X X的可能取值为的可能取值为0 0,1 1,2 2和和3 3,则死亡鼠数为则死亡鼠数为X X的概率分布即表现为二项的概率分布即表现为二项分分布。布。第三十二页,讲稿共八十五页哦独独立立事事件件的的乘法定理乘法定理互互不不相相容容事事件件的的加法定理加法定理第三十三页,讲稿共八十五页哦 构成成构成成-败型实验序列的败型实验序列的n次实验中,事件次实验中,事件A A出现出现 的次数的次数X X的概率分布为:的概率分布为:其中其中X=0X=0,1 1,22,n。n n,是二是二项项分布的两个参
21、数分布的两个参数 。对于任何二项分布,总有对于任何二项分布,总有第三十四页,讲稿共八十五页哦例例4-2 4-2 临床上用针灸治疗某型头疼,有效的概率为临床上用针灸治疗某型头疼,有效的概率为60%60%,现以该疗法治疗现以该疗法治疗3 3例,其中例,其中2 2例有效的概率是多大?例有效的概率是多大?分析:治疗结果为有效和无效两类,每个患者是否有分析:治疗结果为有效和无效两类,每个患者是否有效不受其他病例的影响,有效概率均为效不受其他病例的影响,有效概率均为0.60.6,符合二项分布,符合二项分布的条件。的条件。2 2例有效的概率是例有效的概率是0.4320.432第三十五页,讲稿共八十五页哦一例
22、以上有效的概率为:一例以上有效的概率为:或第三十六页,讲稿共八十五页哦(三)二项分布的特征(三)二项分布的特征1.二项分布的图形特征二项分布的图形特征n,是二项分布的两个参数,所以二项分布的形状取决是二项分布的两个参数,所以二项分布的形状取决于于n,。可以看出,当。可以看出,当=0.5时分布对称,近似对称分布。时分布对称,近似对称分布。当当0.5时,分布呈偏态,特别是时,分布呈偏态,特别是n较小时,较小时,偏离偏离0.5越远,越远,分布的对称性越差,但只要不接近分布的对称性越差,但只要不接近1和和0时,随着时,随着n的增大,的增大,分布逐渐逼近正态。因此,分布逐渐逼近正态。因此,或或1-不太小
23、,而不太小,而n足够大,我足够大,我们常用正态近似的原理来处理二项分布的问题。们常用正态近似的原理来处理二项分布的问题。第三十七页,讲稿共八十五页哦第三十八页,讲稿共八十五页哦第三十九页,讲稿共八十五页哦2.二项分布的均数和标准差二项分布的均数和标准差对于任何一个二项分布B(X;n,),如果每次试验出现“阳性”结果的概率均为,则在n次独立重复实验中,出现阳性次数X的总体均数为方差为标准差为第四十页,讲稿共八十五页哦例例实验白鼠实验白鼠3只,白鼠用药后死亡的死亡只,白鼠用药后死亡的死亡概率概率=0.6,则,则3只白鼠中死亡鼠数只白鼠中死亡鼠数X的总体的总体均数均数=30.6=1.8(只)(只)方
24、差为方差为标准差为标准差为第四十一页,讲稿共八十五页哦如果以率表示,将阳性结果的频率记为如果以率表示,将阳性结果的频率记为,则则P的总体均数的总体均数总体方差为总体方差为总体标准差为总体标准差为式中式中是频率是频率p的标准误的标准误,反映阳性频率的抽样反映阳性频率的抽样误差的大小。误差的大小。第四十二页,讲稿共八十五页哦二、二项分布的应用二、二项分布的应用概率估计概率估计例例4-5如果某地钩虫感染率为如果某地钩虫感染率为13%,随机观察当地,随机观察当地150人,其中有人,其中有10人感染钩虫的概率有多大人感染钩虫的概率有多大?第四十三页,讲稿共八十五页哦单侧累计概率估计单侧累计概率估计二项分
25、布出现阳性次数二项分布出现阳性次数至少至少为为K次的概率为次的概率为阳性次数阳性次数至多至多为为K次的概率为次的概率为第四十四页,讲稿共八十五页哦例例4-6如果某地钩虫感染率为如果某地钩虫感染率为13%,随机观察当地,随机观察当地150人,其中人,其中至多至多有有2人感染钩虫的概率有多大人感染钩虫的概率有多大?至少至少有有2人人感染钩虫的概率有多大感染钩虫的概率有多大?至少至少有有20人感染钩虫的概率有多大人感染钩虫的概率有多大?至多有至多有2名感染的概率为名感染的概率为:第四十五页,讲稿共八十五页哦至少有至少有2名感染的概率为名感染的概率为:至少有至少有20名感染的概率为名感染的概率为:第四
26、十六页,讲稿共八十五页哦第三节第三节Poisson分布的概念与特征分布的概念与特征一、Poisson分布的概念分布的概念PoissonPoisson分布也是一种离散型分布,用以描述分布也是一种离散型分布,用以描述罕见事件罕见事件发发生次数的概率分布。生次数的概率分布。PoissonPoisson分布也可用于研究单位时间内分布也可用于研究单位时间内(或或单位空间、容积内单位空间、容积内)某罕见事件发生次数的分布,如分析某罕见事件发生次数的分布,如分析在单位面积或容积内细菌数的分布,在单位空间中某种在单位面积或容积内细菌数的分布,在单位空间中某种昆虫或野生动物数的分布,粉尘在观察容积内的分布,昆虫
27、或野生动物数的分布,粉尘在观察容积内的分布,放射性物质在单位时间内放射出质点数的分布等。放射性物质在单位时间内放射出质点数的分布等。PoissonPoisson分布一般记作分布一般记作 。第四十七页,讲稿共八十五页哦Poisson分布可以看作是发生的概率分布可以看作是发生的概率很小,而观察例很小,而观察例数很大时的二项分布。除要符合二项分布的三个基本条件外,数很大时的二项分布。除要符合二项分布的三个基本条件外,Poisson分布还要求分布还要求或或1-接近于接近于0和和1。有些情况。有些情况和和n都都难以确定,只能以观察单位难以确定,只能以观察单位(时间、空间、容积、面积时间、空间、容积、面积
28、)内某内某种稀有事件的发生数种稀有事件的发生数X等来表示,如每毫升水中大肠杆菌等来表示,如每毫升水中大肠杆菌数,每个观察单位中粉尘的记数,单位时间内放射性质数,每个观察单位中粉尘的记数,单位时间内放射性质点数等,只要细菌、粉尘、放射性脉冲在观察时间内满点数等,只要细菌、粉尘、放射性脉冲在观察时间内满足以上条件,就可以近似看为足以上条件,就可以近似看为Poisson分布。分布。Poisson分布作为二项分布的一种极限情况分布作为二项分布的一种极限情况第四十八页,讲稿共八十五页哦 二、二、PoissonPoisson分布的函数式和特征分布的函数式和特征1.Poisson1.Poisson分布的概率
29、函数为分布的概率函数为:式中式中 为为PoissonPoisson分布的总体均数,分布的总体均数,X X为观察单为观察单位时间内某稀有事件的发生次数;位时间内某稀有事件的发生次数;e e为自然对数的底,为自然对数的底,为常数,约等于为常数,约等于2.718282.71828。第四十九页,讲稿共八十五页哦 如某地如某地2020年间共出生短肢畸形儿年间共出生短肢畸形儿1010名,平均每年名,平均每年0.50.5名。就名。就可用可用 代入代入PoissonPoisson分布的概率函数来估计该地每年出生分布的概率函数来估计该地每年出生此类短肢畸形儿的人数为此类短肢畸形儿的人数为0 0,1 1,22的概
30、率的概率P(X)P(X)。第五十页,讲稿共八十五页哦第五十一页,讲稿共八十五页哦2.Poisson2.Poisson分布的特性:分布的特性:(1 1)PoissonPoisson分布的的总体分布的的总体均数均数与总体与总体方差方差相等,均为相等,均为 。(2)PoissonPoisson分布的观察结果有分布的观察结果有可加性可加性。即对于服从。即对于服从PoissonPoisson分布的分布的m m个互相独立的随机变量个互相独立的随机变量X X1 1,X,X2 2XXM M,它们之和,它们之和也服从也服从PoissonPoisson分布,其分布,其均数为这均数为这m m个随机变量的均数之和。个
31、随机变量的均数之和。第五十二页,讲稿共八十五页哦 Poisson Poisson分布的这些性质还可以推广到多个分布的这些性质还可以推广到多个PoissonPoisson分布的情形。例如,从同一水源独立地取分布的情形。例如,从同一水源独立地取水样水样5 5次,进行细菌培养,每次水样中的菌落数分次,进行细菌培养,每次水样中的菌落数分别为别为 ,均服从,均服从PoissonPoisson分布,分别记分布,分别记 为为 ,把,把5 5份水样混合,其合计菌落份水样混合,其合计菌落数数 也服从也服从PoissonPoisson分布,记为分布,记为 ,其均数为其均数为 。医学研究中常利用医学研究中常利用Po
32、issonPoisson分布的可加性,将分布的可加性,将小的观察单位合并以增大发生次数小的观察单位合并以增大发生次数X X,以便用正态,以便用正态近似法进行统计推断。近似法进行统计推断。第五十三页,讲稿共八十五页哦三、三、PoissonPoisson分布分布的应用的应用(一)(一)概率估计概率估计例例4-7如果某地新生儿先天性心脏病的发病概率为如果某地新生儿先天性心脏病的发病概率为80/00,那么该地那么该地120名新生儿中有名新生儿中有4人患先天性心脏病的概率人患先天性心脏病的概率有多大有多大?第五十四页,讲稿共八十五页哦(二二)单侧累计概率计算单侧累计概率计算PoissonPoisson分
33、布出现阳性次数分布出现阳性次数至多至多为为K次次的概率为的概率为阳性次数阳性次数至少至少为为K次的概率为次的概率为第五十五页,讲稿共八十五页哦例例4-8如果某地新生儿先天性心脏病的发病概如果某地新生儿先天性心脏病的发病概率为率为80/00,那么该地,那么该地120名新生儿中名新生儿中至多至多有有4人患先人患先天性心脏病的概率有多大天性心脏病的概率有多大?至少至少有有5人患先天性心脏人患先天性心脏病的概率有多大病的概率有多大?至多有至多有4人患先天性心脏病的概率:人患先天性心脏病的概率:至少有至少有5人患先天性心脏病的概率人患先天性心脏病的概率第五十六页,讲稿共八十五页哦二项分布、二项分布、Po
34、issonPoisson分布的的正态近似分布的的正态近似1.1.二项分布的正态近似二项分布的正态近似 二项分布的形状取决于二项分布的形状取决于n,n,,当,当=0.5=0.5时分布对称,当时分布对称,当0.50.5时,分布呈偏态,特别是时,分布呈偏态,特别是n n较小时,较小时,偏离偏离0.50.5越远,分布的对称性越差,随着越远,分布的对称性越差,随着n n的增大,分布逐渐趋向的增大,分布逐渐趋向于对称。理论上可以证明,不管于对称。理论上可以证明,不管如何,当如何,当n n相当大时,相当大时,只要只要不接近不接近1 1和和0 0时,时,特别是当特别是当n n和和n n(1-1-)都大)都大于
35、于5 5时时,二项分布,二项分布B(X;n,)B(X;n,)近似正态分布近似正态分布N(nN(n,n,n(1-(1-)。第五十七页,讲稿共八十五页哦二项分布累积概率的正态近似公式为:二项分布累积概率的正态近似公式为:为标准正态分布的分布函数为标准正态分布的分布函数教材61页第五十八页,讲稿共八十五页哦例例4-14如果某地钩虫感染率为如果某地钩虫感染率为13%,随机观察当地,随机观察当地150人人,其中其中至少至少有有20人感染钩虫的概率有多大人感染钩虫的概率有多大?n=1500.13=19.5n(1-)=150(1-0.13)=130.5至少有至少有20人感染钩虫的概率为人感染钩虫的概率为50
36、%。第五十九页,讲稿共八十五页哦2.PoissonPoisson分布的正态近似分布的正态近似 PoissonPoisson分布,当总体均数分布,当总体均数 小于小于5 5时,时,越小,分越小,分布越呈偏态,随着布越呈偏态,随着 的增大,分布逐渐趋向于对称。的增大,分布逐渐趋向于对称。理论上可以证明,随着理论上可以证明,随着PoissonPoisson分布也渐近分布也渐近为正态分布。为正态分布。当当 时,时,PoissonPoisson分布资料可按分布资料可按正态分布处理。正态分布处理。第六十页,讲稿共八十五页哦PoissonPoisson分布累积概率的正态近似公式为:分布累积概率的正态近似公式
37、为:为标准正态分布的分布函数为标准正态分布的分布函数见教材62页第六十一页,讲稿共八十五页哦例例4-15实验显示某放射性物质实验显示某放射性物质半小时半小时内发出的脉冲数服内发出的脉冲数服从从PoissonPoisson分布,平均为分布,平均为360个,试估计该放射性物质个,试估计该放射性物质半小时半小时内内发出的脉冲数大于发出的脉冲数大于400个的概率。个的概率。试估计该放射性物质半小时内发出的脉冲数大于试估计该放射性物质半小时内发出的脉冲数大于400个的概率为个的概率为1.66%。第六十二页,讲稿共八十五页哦小结掌握内容:掌握三个常用概率分布的概念、特征及应用、参考值范围的估计熟悉内容:二
38、项分布、Poisson分布的概率函数,正态分布的正态曲线下面积分布规律了解内容:二项分布、Poisson分布的的正态近似性及近似正态分布的条件第六十三页,讲稿共八十五页哦软件操作SPSS(Statistical Package for the Social Science,Statistical Product and Service Solutions)SAS(Statistical Analysis System)STATA(Statistic Data)第六十四页,讲稿共八十五页哦标准正态转换第六十五页,讲稿共八十五页哦第六十六页,讲稿共八十五页哦第六十七页,讲稿共八十五页哦第六十八页,
39、讲稿共八十五页哦正态性检验第六十九页,讲稿共八十五页哦第七十页,讲稿共八十五页哦第七十一页,讲稿共八十五页哦第七十二页,讲稿共八十五页哦第七十三页,讲稿共八十五页哦第七十四页,讲稿共八十五页哦第七十五页,讲稿共八十五页哦案例讨论P62第七十六页,讲稿共八十五页哦习题第七十七页,讲稿共八十五页哦1.标准正态分布的均数与标准差是(标准正态分布的均数与标准差是()A0,1B1,0C0,0D1,12.正态分布的两个参数正态分布的两个参数与与,(,()对应的正态曲线愈趋)对应的正态曲线愈趋扁平。扁平。A愈大愈大B愈小愈小C愈大愈大D愈小愈小3.正态分布的两个参数正态分布的两个参数与与,(,()对应的正态
40、曲线平行右)对应的正态曲线平行右移。移。A增大增大B减小减小C增大增大D减小减小第七十八页,讲稿共八十五页哦4.随机变量随机变量X服从正态分布服从正态分布N(1,12),随机变量,随机变量Y服从正态服从正态分布分布N(2,22),X与与Y独立,则独立,则X-Y服从(服从()AN(1+2,12-22)BN(1-2,12-22)CN(1-2,12+22)DN(012+22)5.二项分布的概率分布图在(二项分布的概率分布图在()条件下为对称图形。)条件下为对称图形。An50B=0.5C=1Dn56.()的均数等于方差。的均数等于方差。A正态分布正态分布B二项分布二项分布CPoisson分布分布D对称
41、分布对称分布第七十九页,讲稿共八十五页哦7.设设X1,X2分别服从以分别服从以1,2为均数的为均数的Poisson分布,且分布,且X1,X2独独立,则立,则X1+X2服从以(服从以()为方差的)为方差的Poisson分布。分布。A12+22B1+2C(1+2)2D(1+2)-1/28.满足(满足()时,二项分布)时,二项分布B(n,)近似正态分布。近似正态分布。An和和n(1-)均大于等于均大于等于5Bn或或n(1-)均大于等于均大于等于5Cn50Dn足够大足够大9.满足(满足()时,)时,Poisson分布分布P()近似正态分布。近似正态分布。A无限大无限大B20C=1D=0.5第八十页,讲
42、稿共八十五页哦10.满足(满足()时,二项分布)时,二项分布B(n,)近似近似Poisson分布。分布。An和和n(1-)均大于等于均大于等于5BnCn很大且很大且接近接近0.5Dn很大且很大且接近接近011.观察某地观察某地100名名12岁男孩身高,均数为岁男孩身高,均数为138.00cm,标准标准差为差为4.12cm,Z=(128.00-138.00)/4.12。(Z)是标准正态分布是标准正态分布的分布函数,的分布函数,1-(Z)=1-(-2.43)=0.9925,结论是(结论是()A理论上身高低于理论上身高低于138.00cm的的12岁男孩占岁男孩占99.25%B理论上身高高于理论上身高
43、高于138.00cm的的12岁男孩占岁男孩占99.25%C理论上身高低于理论上身高低于128.00cm的的12岁男孩占岁男孩占99.25%D理论上身高高于理论上身高高于128.00cm的的12岁男孩占岁男孩占99.25%第八十一页,讲稿共八十五页哦作作业业1 1 根据根据19991999年某地某单位的体检资料,年某地某单位的体检资料,116116名正常成年名正常成年女子的血清甘油三酯(女子的血清甘油三酯(mmol/Lmmol/L)测量结果如下表,)测量结果如下表,请据此资料:请据此资料:描述集中趋势应选择何指标?并计算之。描述集中趋势应选择何指标?并计算之。描述离散趋势应选择何指标?并计算之。描述离散趋势应选择何指标?并计算之。求该地正常成年女子血清甘油三酯的求该地正常成年女子血清甘油三酯的95%95%参考值范围。参考值范围。试估计该地正常成年女子血清甘油三酯在试估计该地正常成年女子血清甘油三酯在0.8 0.8 mmol/Lmmol/L以下者及以下者及1.5mmol/L1.5mmol/L以下者各占正常女子总以下者各占正常女子总人数的百分比。人数的百分比。第八十二页,讲稿共八十五页哦第八十三页,讲稿共八十五页哦谦受益,满招损第八十四页,讲稿共八十五页哦感谢大家观看第八十五页,讲稿共八十五页哦
限制150内