第5章常用概率分布(NXPowerLite)课件.ppt
《第5章常用概率分布(NXPowerLite)课件.ppt》由会员分享,可在线阅读,更多相关《第5章常用概率分布(NXPowerLite)课件.ppt(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、中山大学医学统计与流行病学系中山大学医学统计与流行病学系张晋昕张晋昕2008.09.16第五章第五章常用概率分布常用概率分布2/8/202312/8/20232一、正态分布的概念一、正态分布的概念第五章第五章常用概率分布常用概率分布第一节第一节正态分布正态分布正态分布是自然界最常见的一种分布,正态分布是自然界最常见的一种分布,若指标若指标X的频率分布曲线对应于数学上的正态分布曲线,的频率分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。则称该指标服从正态分布。2/8/202332/8/202342/8/20235正态分布的概率密度函数(即纵轴的高度)正态分布的概率密度函数(即纵轴的高
2、度)-X+2/8/20236均数为均数为0,标准差为,标准差为1的正态分布,这种正态分布的正态分布,这种正态分布称为称为标准正态分布标准正态分布。-Z+标准正态分布的密度函数:标准正态分布的密度函数:对于任意一个服从正态分布对于任意一个服从正态分布N(,2)的随机变量,的随机变量,可作如下的可作如下的标准化变换标准化变换,也称,也称Z变换变换,2/8/20237正态分布的特征正态分布的特征 1.关于关于对称。即正态分布以均数为中对称。即正态分布以均数为中心,左右对称。心,左右对称。2.在在处取得概率密度函数的最大值,处取得概率密度函数的最大值,在在处有处有拐点拐点,表现为,表现为钟形曲线。即正
3、钟形曲线。即正态曲线在横轴上方均数处最高。态曲线在横轴上方均数处最高。2/8/202383.正态分布有两个参数,即均数正态分布有两个参数,即均数和标准差和标准差。是是位置参数位置参数,是是变异度参数变异度参数(形状参数形状参数)。常用。常用N(,2)表示均数为表示均数为,标准差为标准差为的正态分布;用的正态分布;用N(0,1)表示标准正态分布。表示标准正态分布。4.正态曲线下面积分布有一定规律。横轴上正态曲线下面积分布有一定规律。横轴上正态曲线下的面积等于正态曲线下的面积等于1(也常写作也常写作100%)。2/8/20239二、正态曲线下面积的分布规律二、正态曲线下面积的分布规律正态方程的积分
4、式正态方程的积分式(分布函数分布函数):F(X)为正态变量X的累计分布函数,反映正态曲线下,横轴尺度自到X的面积,即下侧累计面积。标准正态分布方程积分式标准正态分布方程积分式(分布函数分布函数):(Z)为标准正态变量 Z的累计分布函数,反映标准正态曲线下,横轴尺度自到Z的面积,即下侧累计面积。2/8/2023102/8/202311 用查表代替计算必须注意:1)表中曲线下面积为)表中曲线下面积为到到Z的面积。的面积。2)当当,和和X已知时已知时,先求出,先求出Z值,值,再用再用Z值查表,得所求区间占总面积的比例。值查表,得所求区间占总面积的比例。当当和和未知时未知时,要用样本均数和样本标准,要
5、用样本均数和样本标准差差S来估计来估计Z值。值。3)曲线下对称于)曲线下对称于0的区间,面积相等。的区间,面积相等。4)曲线下横轴上的面积为)曲线下横轴上的面积为1(即(即100%)。)。三、标准正态分布表三、标准正态分布表2/8/202312正态分布是一种对称分布,其对称轴为直线正态分布是一种对称分布,其对称轴为直线X=,即均数即均数位置,理论上:位置,理论上:1范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的68.27%1.96范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的95%2.58范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的99%实际应用中实际应用中:1
6、S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的68.27%1.96S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的95%2.58S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的99%2/8/2023132/8/202314标准正态分布的标准正态分布的=0,=1,则则相当于区间相当于区间(-1,1),1.96相当于区间相当于区间(-1.96,1.96),2.58的区间相当于区间的区间相当于区间(-2.58,2.58)。区间区间(-1,1)的面积:的面积:1-2(-1)=1-20.1587=0.6826=68.26%区间区间(-1.96,1.96)的面积:的面积:1
7、-2(-1.96)=1-20.0250=0.9500=95.00%区间区间(-2.58,2.58)的面积:的面积:1-2(-2.58)=1-20.0049=0.9902=99.02%2/8/202315正态曲线下面积对称,则区间(正态曲线下面积对称,则区间(1.96,)的面积也是)的面积也是0.025。Z取值于(取值于(-1.96,1.96)的概率为)的概率为1-20.025=0.95,即,即X取值在区间取值在区间上的概率为上的概率为95%。例例5-11X服从均数为服从均数为,标准差为,标准差为的正态分的正态分布,试估计布,试估计(1)X取值在区间取值在区间上的概率;上的概率;(2)X取值在区
8、间取值在区间上的概率;上的概率;先做标准化变换:2/8/202316例例5-12已知某地已知某地1986年年120名名8岁男童身高均数岁男童身高均数,S=4.79cm,估计估计(1)该地该地8岁男孩身高在岁男孩身高在130cm以上者占该地以上者占该地8岁男孩总数的百分比;岁男孩总数的百分比;(2)身高界于身高界于120cm128cm者占该地者占该地8岁男岁男孩总数的比例;孩总数的比例;(3)该地该地80%男孩身高集中在哪个范围?男孩身高集中在哪个范围?先做标准化变化先做标准化变化:理论上该地8岁男孩身高在130 cm以上者占该地8岁男孩总数的7.21%。2/8/202317(2)2/8/202
9、318(3)查查附表附表1,标准正态分布曲线下左侧面积为,标准正态分布曲线下左侧面积为0.10所对应所对应的的Z值为值为-1.28,所以,所以80%的的8岁男孩身高值集中在岁男孩身高值集中在区间内,即区间内,即116.9cm129.2cm2/8/202319(一)制定医学参考值范围(一)制定医学参考值范围v参考值范围:指特定的参考值范围:指特定的“正常正常”人群的解剖、生理、生化、免人群的解剖、生理、生化、免疫等各种数据的波动范围。疫等各种数据的波动范围。v制定参考值范围的步骤:制定参考值范围的步骤:1.选择足够数量的正常人作为调查对象。选择足够数量的正常人作为调查对象。2.样本含量足够大。样
10、本含量足够大。3.确定取单侧还是取双侧正常值范围。确定取单侧还是取双侧正常值范围。4.选择适当的百分界限。选择适当的百分界限。5.选择适当的计算方法。选择适当的计算方法。四、四、正态分布的应用正态分布的应用2/8/202320v估计医学参考值范围的方法:估计医学参考值范围的方法:1.正态近似法正态近似法:适用于正态分布或近似正态分布的资料:适用于正态分布或近似正态分布的资料。2.百分位数法百分位数法:适用于偏态分布资料。:适用于偏态分布资料。过低过低过低过低异常异常异常异常过低过低过低过低异常异常异常异常过高异常过高异常过高异常过高异常过高异常过高异常过高异常过高异常2/8/202321例例5
11、-13某地调查某地调查120名健康女性血红蛋白,直方图名健康女性血红蛋白,直方图显示,其分布近似于正态分布,得均数为显示,其分布近似于正态分布,得均数为117.4g/L,标标准差为准差为10.2g/L,试估计该地正常女性血红蛋白的试估计该地正常女性血红蛋白的95%医学参考值范围。医学参考值范围。分析:分析:正常人的血红蛋白过高过低均为异常,要制正常人的血红蛋白过高过低均为异常,要制定双侧正常值范围。定双侧正常值范围。该指标的该指标的95%医学参考值范围为医学参考值范围为2/8/202322例例5.14某地调查某地调查110名正常成年男子的第一秒肺名正常成年男子的第一秒肺通气量,得均数为通气量,
12、得均数为4.2L,标准差为标准差为0.7L,试估计该地试估计该地正常成年男子第一秒肺通气量的正常成年男子第一秒肺通气量的95%参考值范围。参考值范围。该地正常成年男子第一秒肺通气量的该地正常成年男子第一秒肺通气量的95%参考值参考值范围为:不低于范围为:不低于3.052L。分析:分析:正常人的第一秒肺通气量近似正态分布,且只正常人的第一秒肺通气量近似正态分布,且只以过低为异常,要制定单侧下限。以过低为异常,要制定单侧下限。2/8/202323例例5.15某年某市调查了某年某市调查了200例正常成人血铅含例正常成人血铅含量(量(g/100g)如下,试估计该市成人血铅含量的如下,试估计该市成人血铅
13、含量的95%医学参考值范围。医学参考值范围。2/8/202324 分析:血铅的分布为偏峰分布,且血铅含量只以分析:血铅的分布为偏峰分布,且血铅含量只以过高为异常,要用百分位数法制定单侧上限。过高为异常,要用百分位数法制定单侧上限。2/8/202325二、质量控制二、质量控制 为了控制实验中的检测误差,常用 2S作上下警戒线,以 3S作为上下控制线。这里的2S和3S可视为1.96S 和2.58S的约数。其依据是正常情况下检测误差是服从正态分布的。2/8/202326第三节第三节 正态分布及其应用正态分布及其应用判断异常的判断异常的8 8种情况是:种情况是:v有一个点距中心线的距离超过有一个点距中
14、心线的距离超过3 3个标准差(控制限以外)个标准差(控制限以外)v在中心线的一侧连续有在中心线的一侧连续有9 9个点个点v连续连续6 6个点稳定地增加或减少个点稳定地增加或减少v连续连续1414个点交替上下个点交替上下v连连续续3 3个个点点中中有有两两个个点点距距中中心心线线距距离离超超过过2 2个个标标准准差差(警警戒戒限限以外)以外)2/8/202327第三节第三节 正态分布及其应用正态分布及其应用v连续连续5 5个点中有个点中有4 4个点距中心线距离超过个点距中心线距离超过1 1个标准差个标准差v中中心心线线一一侧侧或或两两侧侧连连续续1515个个点点距距中中心心线线距距离离都都在在1
15、 1个个标标准准差差以以内内v中中心心线线一一侧侧或或两两侧侧连连续续8 8个个点点距距中中心心线线距距离离都都超超出出1 1个个标标准准差差范围。范围。2/8/202328三、统计处理方法的理论基础三、统计处理方法的理论基础如如统计描述中计算算术平均数、标准差、统计描述中计算算术平均数、标准差、统计推断中进行总体均数置信区间估计、统计推断中进行总体均数置信区间估计、t检验、检验、F检验、相关与回归等分析检验、相关与回归等分析2/8/202329(一)成败型实验(一)成败型实验(BernoulliBernoulli实验实验)在医学卫生领域的许多实验或观察中,人们感兴在医学卫生领域的许多实验或观
16、察中,人们感兴趣的是某事件是否发生。如用白鼠做某药物的毒性实趣的是某事件是否发生。如用白鼠做某药物的毒性实验,关心的是白鼠是否死亡;某种新疗法临床实验观验,关心的是白鼠是否死亡;某种新疗法临床实验观察患者是否治愈;观察某指标的化验结果是否呈阳性察患者是否治愈;观察某指标的化验结果是否呈阳性等等。将我们关心的事件将我们关心的事件A A出现称为成功,不出现称为失出现称为成功,不出现称为失败,这类试验就称为成败,这类试验就称为成-败型实验。指定性资料中的二败型实验。指定性资料中的二项分类实验。项分类实验。第二节第二节二项分布二项分布一、二项分布的概念与特征一、二项分布的概念与特征2/8/202330
17、 成成-败型败型(BernoulliBernoulli)实验序列:实验序列:满足以下三个条件的满足以下三个条件的n n次实验构成的序列称为成次实验构成的序列称为成-败型实败型实验序列。验序列。1 1)每次实验结果,只能是两个互斥的结果之一()每次实验结果,只能是两个互斥的结果之一(A A或或非非A A)。)。2)2)相同的实验条件下,每次实验中事件相同的实验条件下,每次实验中事件A A的发生具有的发生具有相同的概率相同的概率。(非。(非A A的概率为的概率为1-1-)。)。实际工作中要求实际工作中要求是从是从大量观察中获得的较稳定的数值。大量观察中获得的较稳定的数值。3)3)各次实验独立。各次
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常用 概率 分布 NXPowerLite 课件
限制150内