统计学-正态分布和参考值范围.ppt
正态分布正态分布和参考值范围的估计和参考值范围的估计医学统计学医学统计学供研究生用供研究生用12/28/20221医学统计学-研究生用第四节第四节 正态分布正态分布(normal distribution)A 正态分布的概念和特征正态分布的概念和特征正态分布正态分布正态分布的两个参数正态分布的两个参数正态曲线下面积分布规律正态曲线下面积分布规律A 标准正态分布标准正态分布标准正态分布与标准化变换标准正态分布与标准化变换标准正态分布表标准正态分布表A 正态分布的应用正态分布的应用估计频数分布估计频数分布制定参考值范围制定参考值范围质量控制质量控制统计方法的基础统计方法的基础12/28/20222一、正态分布一、正态分布(一)正态分布的图形(一)正态分布的图形(一)正态分布的图形(一)正态分布的图形例:某地例:某地7 7岁男童身高的岁男童身高的频数分布频数分布12/28/20223正态分布图形特点正态分布 频数分布是中间(靠近均数)频数多,两边频数少,且左右对称。正态曲线呈钟型:两头低中间高,左右对称若指标X的频数分布图接近正态分布曲线,则初步判断该指标服从正态分布。12/28/20224正态分布的概率密度函数:正态分布的概率密度函数:为总体均数,为标准差,4记为:记为:XN(,)12/28/20225记为:记为:XN(,)如某年某地7岁男孩的身高X服从均数为121(cm)、标准差为5(cm)的正态分布,可记为X N(122,5)12/28/20226(二)二)正态分布的两个参数正态分布的两个参数 描述了正态分布的集中趋势位置。描述了正态分布的集中趋势位置。描述正态分布的离散程度。描述正态分布的离散程度。s越小,曲线越瘦高,分布越集中;反之,.12/28/20227二、正态曲线下面积的分布规律F(X)为正态变量X的分布函数,即对概率密度函数求积分12/28/20228正态曲线下面积的分布规律正态曲线下面积的分布规律-续续(-1,+1)的面积占总面积的的面积占总面积的68.27%(-1.96,+1.96)的面积占总面积的的面积占总面积的95.00%(-2.58,+2.58)的面积占总面积的的面积占总面积的99.00%12/28/20229三、标准正态分布三、标准正态分布标准正态分布与标准化变换标准正态分布与标准化变换标准正态分布表标准正态分布表12/28/202210?标准化变换:标准化变换:u变换变换这样可将所有不同均数和标准差的资料这样可将所有不同均数和标准差的资料都转换为都转换为均数为均数为0,标准差为,标准差为1的分布,的分布,即即标准正态分布标准正态分布。12/28/202211v标准正态分布的累计函数标准正态分布的累计函数v标准正态分布图形标准正态分布图形-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 312/28/202212标准正态分布表标准正态分布表(P803附表1)把标准正态分把标准正态分布曲线下的面积编制成工具表布曲线下的面积编制成工具表列出标准正态曲线下从列出标准正态曲线下从-到到u u范围内的面积范围内的面积F(u)F(u)值。值。而且而且F(u)F(u)F(F(u)u)。-到到u=-0.50u=-0.50范围内的面积:范围内的面积:F(-0.5)=0.3085F(-0.5)=0.3085-到到u=0.50 u=0.50 范围内的面积为多少呢范围内的面积为多少呢 F(0.5)=1-F(-0.5)F(0.5)=1-F(-0.5)1-0.3085=0.69151-0.3085=0.6915-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 312/28/202213标准正态分布标准正态分布面积分布规律面积分布规律-到到u=-2.58范围内的面积:范围内的面积:0.0049-到到u=-1.96范围内的面积范围内的面积:0.0250-到到u=0.00范围内的面积范围内的面积:0.5000(-1,1)的面积占总面积的的面积占总面积的68.27%(-1.96,1.96)的面积占总面积的的面积占总面积的95.00%(-2.58,2.58)的面积占总面积的的面积占总面积的99.00%-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 312/28/202214标准正态分布,求曲线下任意标准正态分布,求曲线下任意(X1,X2)范围内的面积范围内的面积例例 u1-1.50,u2-0.31,欲求标准正态欲求标准正态曲线下曲线下(-1.50,-0.31)范围内的面积。范围内的面积。(-(-,u1)u1)的面积的面积F(-1.50)=0.0668F(-1.50)=0.0668;(-(-,u2)u2)的面积的面积F(-0.31)F(-0.31)0.37830.3783。则则(-1.50(-1.50,-0.31)-0.31)的面积的面积D=F(u2)-F(u1)D=F(u2)-F(u1)0.3783-0.06680.3783-0.0668 O.3115O.3115。12/28/202215对于非标准正态分布,求曲线下任意对于非标准正态分布,求曲线下任意(X1,X2)范范围内的面积围内的面积例例 Mean121.95,s4.72,n=110(1)估计界于估计界于116.5119.0范围内范围内7岁男童的比例岁男童的比例(2)(2)估计界于估计界于116.5119.0范围的男童人数。范围的男童人数。u1=(116.5-121.95)/4.72=-1.15;u1=(116.5-121.95)/4.72=-1.15;u2=(119.0-121.95)/4.72=-0.63u2=(119.0-121.95)/4.72=-0.63。F(-1.15)=0.1251F(-1.15)=0.1251;F(-0.63)=0.2643F(-0.63)=0.2643。(1)0.2643-0.1251=13.92%(1)0.2643-0.1251=13.92%;(2)110(2)11013.92%=1513.92%=15。12/28/202216正态分布的特征正态分布的特征正态曲线呈钟型,在横轴的上方,均数位正态曲线呈钟型,在横轴的上方,均数位置最高;置最高;正态分布以均数为中心,左右对称;正态分布以均数为中心,左右对称;正态分布有两个参数,即均数和标准差;正态分布有两个参数,即均数和标准差;标准正态分布的均数为标准正态分布的均数为0 0,标准差为,标准差为1 1;正态曲线在正态曲线在1 1 各有一拐点;各有一拐点;正态分布的面积分布有一定的规律性。正态分布的面积分布有一定的规律性。12/28/202217正态分布的应用正态分布的应用估计频数分布估计频数分布制定参考值范围制定参考值范围质量控制质量控制统计方法的基础统计方法的基础12/28/202218估计频数分布估计频数分布 若某项研究得出某地婴儿出生体重均数若某项研究得出某地婴儿出生体重均数为为3200克,标准差为克,标准差为350克,克,估计该地估计该地当年低体重儿所占的比例。当年低体重儿所占的比例。U=(2500-3200)/350=-2查标准正态表得:F(-2)=0.0228估计该地当年低体重儿所占的比例为估计该地当年低体重儿所占的比例为2.28%例例出生体重低于出生体重低于2500克为低体重儿。克为低体重儿。12/28/202219第五节第五节 医学参考值范围的制定医学参考值范围的制定reference ranges亦称亦称正常值范围正常值范围绝大多数正常人某指标测定值所在的范围绝大多数正常人某指标测定值所在的范围绝大多数绝大多数:90%、95%、99%等等。等等。正常人是指正常人是指排除了影响所研究指标的疾病和有排除了影响所研究指标的疾病和有关因素的同质人群。关因素的同质人群。应遵循一定步骤确定参考值范围。应遵循一定步骤确定参考值范围。计算方法有正态分布法和百分位数法。计算方法有正态分布法和百分位数法。12/28/202220一、确定参考值范围基本步骤一、确定参考值范围基本步骤从正常人总体中抽取足够含量的样本;从正常人总体中抽取足够含量的样本;n 100控制测量误差下进行准确而统一的测定;控制测量误差下进行准确而统一的测定;判定是否需要分组;有无年龄、性别差异等?判定是否需要分组;有无年龄、性别差异等?确定取单侧还是双侧范围值:红细胞?肺通气确定取单侧还是双侧范围值:红细胞?肺通气量?尿铅?量?尿铅?选定适当的百分界限;选定适当的百分界限;对资料进行正态性检验;对资料进行正态性检验;计算参考值范围。计算参考值范围。12/28/202221正常人与病人的分布有重叠正常人与病人的分布有重叠减少假阳性可选用减少假阳性可选用95%95%或或99%99%:鉴定诊断。:鉴定诊断。减少假阴性可选用减少假阴性可选用80%80%或或90%90%:筛选可疑者。:筛选可疑者。12/28/202222正常人和病人的分布重叠较多正常人和病人的分布重叠较多需要确定可疑范围。需要确定可疑范围。如如 舒张压舒张压=90mmHg 且且=95mmHg:高血压高血压12/28/202223参考值范围的确定参考值范围的确定方法:方法:正态近似法,百分位数法正态近似法,百分位数法95%参考值(正常值)范围 正态近似法正态近似法 百分位数法百分位数法双侧 1.96s P2.5 P97.5单侧下限 -1.64s P5 单侧上限 +1.64s P9512/28/202224例例1 1:某地农村某地农村19991999年年130130名名1414岁女孩身高岁女孩身高资料(资料(cmcm)均数为均数为143.08143.08,标准差为,标准差为6.586.58。求该地求该地1414岁女孩身高的岁女孩身高的95%95%参考值范围。参考值范围。下限为:143.08 1.96 6.58=130.18(cm)上限为:143.08+1.96 6.58=155.98(cm)该地该地14岁女孩身高的岁女孩身高的95%参考值范围为参考值范围为130.2156.0(cm)。二、正态近似法二、正态近似法12/28/202225例例2 2 :某地调查某地调查110110名健康成年男性的第名健康成年男性的第一秒肺通气量的均数为一秒肺通气量的均数为4.2(4.2(L)L),标准差标准差为为0.7(0.7(L)L)。请据此估计该地成年男子第请据此估计该地成年男子第一秒肺通气量的一秒肺通气量的95%95%参考值范围。参考值范围。下限为:下限为:4.2-1.640.7=3.052(4.2-1.640.7=3.052(L)L)该地成年男性的第一秒肺通气量该地成年男性的第一秒肺通气量95%参考值范参考值范围为:不低于围为:不低于3.052(L)。参考值范围参考值范围 :3.052(L)12/28/202226三、三、百百分分位位数数法法200名血铅频数表及名血铅频数表及P95计算表计算表组段组段频数频数f累计频数累计频数 f累计频率(累计频率(%)3 363618.58 397537.512 4712261.018 2015276.023 1817085.028 1618693.033 318994.038 719698.043 119798.548 119899.053 119999.558621200100.012/28/202227SPSSSPSS下的正态性检验下的正态性检验正态性检验有两大类:图示法和计算法。SPSS下可以采用图示法中的概率图进行正态性检验;概率图概率图(probability-probability plot,P-P plot)或分位数图分位数图(quantile-quantile plot,Q-Q plot);如果散点图几乎在一条直线上,可认为该资料服从正态分布。12/28/202228正态性检验的计算法正态性检验的计算法矩法(method of moment):对偏度和峰度进行检验。偏度(skewness):反映分布的对称情况。峰度(kurtosis):反映分布的尖峭程度。分别用偏度系数r1(coefficient of skewness)和峰度系数r2(coefficient of kurtosis)表示。12/28/202229正态分布时:偏度系数偏度系数r1=0;峰度系数峰度系数r2=0 非正态分布时:非正态分布时:R10 正偏态;正偏态;r1 0 尖峭峰;尖峭峰;r2 0 平阔峰平阔峰12/28/202230作业 p3132 三、三、计算分析题题题 1.2.3.要求:要求:*不必抄题目,只写明页数和题号*能用spss计算的均用spss计算*写出主要的命令和结果如:weight case,frequencies12/28/202231