《正态分布 (2)2幻灯片.ppt》由会员分享,可在线阅读,更多相关《正态分布 (2)2幻灯片.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、正态分布第1页,共32页,编辑于2022年,星期一图形图形:正态分布曲线是一条高峰位于中:正态分布曲线是一条高峰位于中央,均数处最高,两侧逐渐下降并完全央,均数处最高,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟对称,曲线两端永远不与横轴相交的钟形曲线。形曲线。特征特征:正态分布的频数分布高峰在中间,:正态分布的频数分布高峰在中间,两端完全对称,并逐步减少,这种分布两端完全对称,并逐步减少,这种分布即为正态分布。即为正态分布。面积面积:正态曲线与横轴所夹的面积为:正态曲线与横轴所夹的面积为1 1。第2页,共32页,编辑于2022年,星期一第3页,共32页,编辑于2022年,星期一第4页
2、,共32页,编辑于2022年,星期一正态分布的密度函数,即正态曲线的函数表达方程为正态分布的密度函数,即正态曲线的函数表达方程为-X+上式中:为圆周率,e为自然对数的底,(总体均数)和(总体标准差)为正态分布的参数。如果连续型随机变量X具有如上式的概率密度函数,则称随机变量X服从参数为和2的正态分布,记为XN(,2)。第5页,共32页,编辑于2022年,星期一标准正态分布标准正态分布:均数为:均数为0,标准差为,标准差为1的正态分的正态分布,这种正态分布称为标准正态分布。布,这种正态分布称为标准正态分布。对于任意一个服从正态分布对于任意一个服从正态分布N(,2)的随机变量,的随机变量,可作如下
3、的可作如下的标准化变换,也称标准化变换,也称u变换。变换。第6页,共32页,编辑于2022年,星期一二、正态分布的特征二、正态分布的特征1.关于关于对称。即正态分布以均数为中心,左对称。即正态分布以均数为中心,左右对称。右对称。2.在在处取得概率密度函数的最大值,在处取得概率密度函数的最大值,在处有处有拐点拐点,表现为钟形曲线。即正态曲线在横轴上方均数处,表现为钟形曲线。即正态曲线在横轴上方均数处最高。最高。第7页,共32页,编辑于2022年,星期一3.正态分布有两个参数,即均数正态分布有两个参数,即均数和标准差和标准差。是是位置参数位置参数,是是变异度参数变异度参数(形状参数形状参数)。常用
4、。常用N(,2)表表示均数为示均数为,标准差为,标准差为的正态分布;用的正态分布;用N(0,1)表示标准正表示标准正态分布。态分布。4.正态曲线下面积分布有一定规律。横轴上正态曲线下面积分布有一定规律。横轴上正态曲线下的面积等于正态曲线下的面积等于100%或或1。第8页,共32页,编辑于2022年,星期一第9页,共32页,编辑于2022年,星期一第10页,共32页,编辑于2022年,星期一三、正态曲线下面积的分布规律三、正态曲线下面积的分布规律正态方程的积分式正态方程的积分式(分布函数分布函数):F(X)为正态变量为正态变量X的累计分布函数,反映正态曲线下,横轴尺的累计分布函数,反映正态曲线下
5、,横轴尺度自度自到到X的面积,即下侧累计面积的面积,即下侧累计面积。标准正态分布方程积分式标准正态分布方程积分式(分布函数分布函数):(u)为标准正态变量为标准正态变量u的累计分布函数,反映标准正态曲线的累计分布函数,反映标准正态曲线下,横轴尺度自下,横轴尺度自到到u的面积,即下侧累计面积的面积,即下侧累计面积。第11页,共32页,编辑于2022年,星期一第12页,共32页,编辑于2022年,星期一标准正态分布曲线下面积(u)附表1 u 0.00 0.02 0.04 0.06 0.08-3.00.0013 0.0013 0.0012 0.0011 0.0010-2.50.0062 0.0059
6、 0.0055 0.0052 0.0049-2.00.0228 0.0217 0.0207 0.0197 0.0188-1.90.0287 0.0274 0.0262 0.0250 0.0239-1.60.0548 0.0526 0.0505 0.0485 0.0465-1.00.1587 0.1539 0.1492 0.1446 0.1401-0.50.3085 0.3015 0.2946 0.2877 0.2810 00.5000 0.4920 0.4840 0.4761 0.46810u第13页,共32页,编辑于2022年,星期一 利利用用标标准准正正态态分分布布,可可以以计计算算出出正
7、正态态分分布布曲曲线线下下常用的几个面积:常用的几个面积:(1)(1)位位于于 内内的的面面积积为为O O9090,即即正正态态变变量量在在 范范围围内内取取值值的的概概率率为为O O9090,在在该该区间以外取值的概率区间以外取值的概率(两侧的阴影面积之和两侧的阴影面积之和)为为0 01010。(2)(2)位位于于 内内的的面面积积为为0 09595,即即正正态态变变量量在在 范范围围内内取取值值的的概概率率为为0 09595,在在该该区区间间以以外外取值的概率取值的概率(两侧的阴影面积之和两侧的阴影面积之和)为为O O0505。(3)(3)位位于于 内内的的面面积积为为0 09999,即即
8、正正态态变变量量在在 范范围围内内取取值值的的概概率率为为099,在在该该区区间间以以外取值的概率外取值的概率(两侧的阴影面积之和两侧的阴影面积之和)为为001第14页,共32页,编辑于2022年,星期一第15页,共32页,编辑于2022年,星期一1.表中曲线下面积为表中曲线下面积为到到u的面积。的面积。2.当当,和和X已知时已知时,先求出,先求出u值,值,再用再用u值查表,得所求区间占总面积的比例。值查表,得所求区间占总面积的比例。当当和和未知时未知时,要用样本均数和样本标准差要用样本均数和样本标准差S来估计来估计u值。值。3.曲线下对称于曲线下对称于0的区间,面积相等。的区间,面积相等。4
9、.曲线下横轴上的面积为曲线下横轴上的面积为100%或或1。四、标准正态分布表四、标准正态分布表第16页,共32页,编辑于2022年,星期一正态分布是一种对称分布,其对称轴为直线正态分布是一种对称分布,其对称轴为直线X=,即均数位置,理论上:,即均数位置,理论上:1范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的68.27%1.96范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的95%2.58范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的99%实际应用中实际应用中:1S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的68.27%1.96S范围内曲线下的面积占总面
10、积的范围内曲线下的面积占总面积的95%2.58S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的99%第17页,共32页,编辑于2022年,星期一第18页,共32页,编辑于2022年,星期一【例例2 21515】在在例例2-12-1中中,已已求求得得某某市市100100名名1818岁岁女女孩孩身身高高均均数数为为163.8cm163.8cm,标标准准差差为为3.8 3.8 cmcm,试试估估计计该该地地1818岁岁女女孩孩身身高高介介于于166166170cm170cm的的比比例例及及人人数。数。本本例例由由于于是是大大样样本本,可可用用样样本本均均数数和和样样本本标标准准差差分分别别
11、作作为为总总体体 的的估估计计值值,即即将将该该地地1818岁岁女女孩孩的的身身高高(记记作作X)X)近近似似看看作作服服从从N(1638N(1638,3.83.82 2)的正态分布。做如下标准化变换:的正态分布。做如下标准化变换:第19页,共32页,编辑于2022年,星期一查标准正态分布表得:查标准正态分布表得:先做标准化变化先做标准化变化:第20页,共32页,编辑于2022年,星期一(一)制定医学参考值范围(一)制定医学参考值范围 医学参考值范围:又称正常值范围,指包括了绝大多医学参考值范围:又称正常值范围,指包括了绝大多数的特定的数的特定的“正常正常”人群的解剖、生理、生化、免疫等各人群
12、的解剖、生理、生化、免疫等各种数据的波动范围,这里所谓种数据的波动范围,这里所谓“正常正常”并非指没有任何疾并非指没有任何疾病的人,而是指排除了影响研究指标的疾病和有关因素的病的人,而是指排除了影响研究指标的疾病和有关因素的同质人群,同质人群,“绝大多数绝大多数”习惯上包括正常人的习惯上包括正常人的9090、9595、9999等,如无特殊说明一般默认为等,如无特殊说明一般默认为9595。五、五、正态分布的应用正态分布的应用第21页,共32页,编辑于2022年,星期一制定参考值范围的步骤:制定参考值范围的步骤:1.1.依据观察指标的特点、背景和已知的影响因素,依据观察指标的特点、背景和已知的影响
13、因素,确定抽样的入选标准。确定抽样的入选标准。(如在制定正常成年女子血红蛋白含量的参考值范围研究中,要排除贫血的成年女子。)2.根据指标特点及专业知识决定单侧还是双侧。根据指标特点及专业知识决定单侧还是双侧。3.确定置信度(选择适当的百分界限)。确定置信度(选择适当的百分界限)。4.按资料分布特征选取不同方法计算正常值范围。按资料分布特征选取不同方法计算正常值范围。第22页,共32页,编辑于2022年,星期一估计医学参考值范围的方法:估计医学参考值范围的方法:1.正态近似法正态近似法:适用于正态分布或近似正态分布的资料。:适用于正态分布或近似正态分布的资料。2.百分位数法百分位数法:适用于偏态
14、分布资料。:适用于偏态分布资料。过低异常过低异常过低异常过低异常过低异常过低异常过低异常过低异常过高异常过高异常过高异常过高异常过高异常过高异常过高异常过高异常第23页,共32页,编辑于2022年,星期一单侧下限单侧下限异常异常正常正常单侧上限单侧上限异常异常正常正常异常异常正常正常双侧下限双侧下限双侧上限双侧上限异常异常单侧下限单侧下限-过低异常过低异常单侧上限单侧上限-过高异常过高异常双侧双侧-过高、过低均异常过高、过低均异常如肺活量如肺活量如尿铅值如尿铅值如体重如体重第24页,共32页,编辑于2022年,星期一分析:正常人的血清总蛋白分析:正常人的血清总蛋白过高过低过高过低均为异常,要制
15、定均为异常,要制定双双侧侧95%正常值范围。正常值范围。该指标的该指标的95%医学参考值范围为医学参考值范围为【例例2 21616】已已知知某某地地正正常常成成年年女女子子的的血血清清总总蛋蛋白白数数近近似似服服从从正正态态分分布布。调调查查了了该该地地110110名名正正常常成成年年女女子子,得得样样本本血血清清总总蛋蛋白白均均数数为为72.8(g72.8(gL)L),标标准准差差为为3.8(g3.8(gL)L),试试估计该地正常成年女子血清总蛋白的估计该地正常成年女子血清总蛋白的9595参考值范围。参考值范围。第25页,共32页,编辑于2022年,星期一【例【例2-172-17】某地调查某
16、地调查120名正常成年男子的第一秒肺通气量,名正常成年男子的第一秒肺通气量,得均数为得均数为4.2L,标准差为,标准差为0.7L,试估计该地正常成年男子第,试估计该地正常成年男子第一秒肺通气量的一秒肺通气量的95%参考值范围。参考值范围。该地正常成年男子第一秒肺通气量的该地正常成年男子第一秒肺通气量的95%参考值范参考值范围为:不低于围为:不低于3.05L。分析分析:正常人的第一秒肺通气量近似正态分布,且只以正常人的第一秒肺通气量近似正态分布,且只以过过低低为异常,要制定为异常,要制定单侧单侧下限。下限。第26页,共32页,编辑于2022年,星期一【例例2-182-18】为为估估计计某某地地居
17、居民民发发汞汞值值的的参参考考值值范范围围,测测得得某某地地284284名名正正常常成成人人的的发发汞汞值值如如表表2-72-7(P15P15)。计计算算得得该该样样本本资资料料的的均均数数为为7.1l 7.1l molmolkgkg,标标准准差差s=2.84 s=2.84 moLmoLkgkg,由由于于发发汞汞仅仅过过高高为为异异常常,于于是是估估计计该该地地居居民民发汞值的发汞值的9595正常值上限为正常值上限为 +1.64s=11.77 moL +1.64s=11.77 moLkgkg。【问题【问题2 25 5】(1)(1)该该资资料料是是正正态态分分布布资资料料还还是是偏偏态态分分布布
18、资资料料?(2)(2)应当选用什么方法计算正常值范围应当选用什么方法计算正常值范围?第27页,共32页,编辑于2022年,星期一【分分析析】从从频频数数表表2-72-7可可以以看看出出,该该样样本本资资料料呈呈偏偏态态分分布布,故故不不能能用用正正态态分分布布法法计计算算正正常常值值范范围围,而而应应该该用用适适合合偏偏态态分分布布的的百百分分位位数数法法,计计算算P P9595=12.64=12.64 molmolkgkg,故故估估计计该该地地居居民民发发汞汞值值的的9595正正常常值值不不高高于于12.64mol12.64molkgkg。第28页,共32页,编辑于2022年,星期一(二)质
19、量控制(二)质量控制若若实实验验误误差差仅仅由由随随机机误误差差引引起起,不不存存在在系系统统误误差差,则则指指标标的的波波动动应服从正态分布。根据这一原理,可以实现测量过程的质量控制。应服从正态分布。根据这一原理,可以实现测量过程的质量控制。为为控控制制检检验验误误差差,通通常常以以 2s2s作作为为上上下下警警戒戒限限,以以 3s3s作作为上下控制限。为上下控制限。根根据据正正态态分分布布曲曲线线下下的的面面积积规规律律,落落在在(-2s-2s,+2s)+2s)区区域域的的概概率率约约为为9595,而而落落在在(-3s-3s,+3s)+3s)区区域域的的概概率率约约为为9999,从从而而在
20、在一一次次测测量量中中落落在在(-3s-3s,+3s)+3s)区区域域以以外外的的概概率率几几乎乎为为O O,可可以以认认为为是是不不可可能能事事件件。若若一一测测量量值值落落在在控控制制限限以以外外,则则有有理理由由认认为为数数据据的的波波动动不不仅仅仅仅是是由由随随机机测测量量误误差差引引起起的的,可可能能存存在在某某种种非非随机的系统误差。随机的系统误差。第29页,共32页,编辑于2022年,星期一第30页,共32页,编辑于2022年,星期一(三三)正态分布是许多统计方法的理论基础正态分布是许多统计方法的理论基础统计描述中计算算术平均数、标准差均要求指标服统计描述中计算算术平均数、标准差
21、均要求指标服从正态分布;统计推断中进行总体均数置信区间估计、从正态分布;统计推断中进行总体均数置信区间估计、t t检验、检验、F F检验、相关与回归等分析也都是在正态分布检验、相关与回归等分析也都是在正态分布的基础上推演而来的。的基础上推演而来的。对于非正态分布的资料,实施统计处理的一个重要途径对于非正态分布的资料,实施统计处理的一个重要途径就是对其进行变量变换,使其转换后的资料近似服从正态就是对其进行变量变换,使其转换后的资料近似服从正态分布,然后按照正态分布的方法进行统计学处理。分布,然后按照正态分布的方法进行统计学处理。第31页,共32页,编辑于2022年,星期一小小 结结重点重点描述计量资料集中趋势、离描述计量资料集中趋势、离散趋势统计指标的概念、计散趋势统计指标的概念、计算方法及适用条件;算方法及适用条件;正态分布的概念与特征、正态曲正态分布的概念与特征、正态曲线的概念和曲线下面积分布规律;线的概念和曲线下面积分布规律;医学参考值范围的计算及应医学参考值范围的计算及应用。用。难点难点不同资料集中趋势和不同资料集中趋势和离散趋势指标的选择。离散趋势指标的选择。第32页,共32页,编辑于2022年,星期一
限制150内