《第三章正态分布精选文档.ppt》由会员分享,可在线阅读,更多相关《第三章正态分布精选文档.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章正态分布本讲稿第一页,共五十九页 医学统计学医学统计学第三章第三章 正态分布及其应用正态分布及其应用本讲稿第二页,共五十九页第一节第一节 正态分布的概念和特征正态分布的概念和特征一、正态分布一、正态分布(normal distribution)的概念的概念A.De Moivre:德国数学家和天文学家德国数学家和天文学家Gauss:高斯(高斯(Johann Carl Friedrich Gau(Gauss)(17771855),德国著名),德国著名数学家、物理学家、天文学家、大地测量学数学家、物理学家、天文学家、大地测量学家。高斯被认为是家。高斯被认为是最重要的数学家最重要的数学家,并有,
2、并有“数学王子数学王子”的美誉。的美誉。本讲稿第三页,共五十九页正态分布图形正态分布图形 例数更多,分组更细例数更多,分组更细频数分布图频数分布图频数分布图频数分布图全部观察对象全部观察对象Bell ShapedSymmetrical医学上很多资料符合正态分布医学上很多资料符合正态分布两头低,中间高,左右对称,两头低,中间高,左右对称,呈钟型的单峰曲线。呈钟型的单峰曲线。本讲稿第四页,共五十九页二、正态分布的特征二、正态分布的特征1、连续型随机变量及其概率分布、连续型随机变量及其概率分布变量变量研究指标,身高,体重等随机变量随机变量可以等于任意数,不确定的值连续型连续型 X+,中途不间断,即包
3、含小数离散型离散型 中途间断,即只有整数,没有小数本讲稿第五页,共五十九页Probability DistributionsContinuous Probability DistributionsBinomialPoissonProbability DistributionsDiscrete Probability DistributionsNormalCh.6Ch.3本讲稿第六页,共五十九页2 2、连续型随机变量的分布函数、连续型随机变量的分布函数二、正态分布的特征二、正态分布的特征(1 1)概率密度函数(曲线的高度)概率密度函数(曲线的高度)(2 2)概率分布函数(曲线的面积)概率分布函数
4、(曲线的面积)总体标准差总体标准差总体均数总体均数圆周率,圆周率,3.14159.本讲稿第七页,共五十九页(3)正态分布特征)正态分布特征 曲线在横轴上方曲线在横轴上方均数均数处处最高最高;以以均数均数为为中心中心,左右对称;,左右对称;正态分布有两个参数:正态分布有两个参数:位置参数位置参数、形状参数、形状参数 正态分布曲线下的面积有一定的分布规律。正态分布曲线下的面积有一定的分布规律。二、正态分布的特征二、正态分布的特征本讲稿第八页,共五十九页正态分布的两个参数正态分布的两个参数(1)位置参数位置参数:当当 一一定定时时,越越大大,曲曲线线越越向向右右移移动动;越越小小,曲曲线越向左移动。
5、线越向左移动。(2)离散度参数离散度参数,决定曲线的形态:,决定曲线的形态:当当一定时,一定时,越大,表示数据越分散,曲线越越大,表示数据越分散,曲线越“胖胖”;越小,表示数据越集中,曲线越越小,表示数据越集中,曲线越“瘦瘦”。本讲稿第九页,共五十九页正态分布的两个参数正态分布的两个参数本讲稿第十页,共五十九页正态曲线下面积分布规律正态曲线下面积分布规律无论无论 取什么值取什么值,正态曲线与横轴间的面积总等,正态曲线与横轴间的面积总等于于1面积总面积总等于等于1这个面积等于多少?这个面积等于多少?这个面积等于多少?这个面积等于多少?x本讲稿第十一页,共五十九页熟熟记记下下列列常常用用的的曲曲线
6、线下下面积分布规律:面积分布规律:1、的的区区间间占占总总面面积的积的68.27 2、1.96的的区区间间占占总总面积的面积的95 3、2.58的的区区间间占占总面积的总面积的99本讲稿第十二页,共五十九页三、正态分布的应用三、正态分布的应用1、估计频数分布(见例、估计频数分布(见例3-2)2、质量控制、质量控制3、制定医学参考值范围(见第三节)、制定医学参考值范围(见第三节)4、正态分布是许多统计处理方法的理论基础、正态分布是许多统计处理方法的理论基础本讲稿第十三页,共五十九页质量控制质量控制 2S3S上控制线上控制线下控制线下控制线 警戒线警戒线警戒线警戒线 2S 3S本讲稿第十四页,共五
7、十九页第二节第二节 标准正态分布及其应用标准正态分布及其应用1 1、标准正态分布与标准化变换、标准正态分布与标准化变换 正态分布是一个正态分布是一个分布族。对应于不同分布族。对应于不同的参数的参数和和会产生不会产生不同位置不同形状的正同位置不同形状的正态分布。态分布。本讲稿第十五页,共五十九页本讲稿第十六页,共五十九页(1 1)概率密度函数(曲线的高度)概率密度函数(曲线的高度)(2 2)概率分布函数(曲线的面积)概率分布函数(曲线的面积)总体标准差总体标准差总体均数总体均数圆周率,圆周率,3.14159.本讲稿第十七页,共五十九页这个面积等于多少?这个面积等于多少?这个面积等于多少?这个面积
8、等于多少?x本讲稿第十八页,共五十九页为了应用方便,令为了应用方便,令u u服从均数为服从均数为0 0、标准差为、标准差为1 1的正态分布的正态分布标准正态标准正态分布分布u变换变换当和未知时,用 和s 来估计u值。标准正态分布:凡均数为标准正态分布:凡均数为0 0、标准差为、标准差为1 1的正态分布。的正态分布。所有的正态分布,经所有的正态分布,经u u变换后,都可以转为标准正态分布。变换后,都可以转为标准正态分布。本讲稿第十九页,共五十九页2 2、标准正态分布表、标准正态分布表 3 2 1 0 1 2 3 (u)附表附表本讲稿第二十页,共五十九页 查表确定标准正态分布曲线下的面积时,必查表
9、确定标准正态分布曲线下的面积时,必须须注意注意:(1)u变换变换 当当,已知时,先按已知时,先按u变换公式求得变换公式求得u值,值,再用再用u值查表;值查表;本讲稿第二十一页,共五十九页 当当,未知未知时,用样本均数时,用样本均数 和样本标准和样本标准差差s代替求代替求u值。值。本讲稿第二十二页,共五十九页(2)查查表表时时,可可以以利利用用标标准准正正态态分分布布的的两两个个特征:特征:a.曲线下对称于曲线下对称于0的区间,面积相等;的区间,面积相等;b.曲线下横轴上的总面积为曲线下横轴上的总面积为100或或1。本讲稿第二十三页,共五十九页例例 3-1 求x1=-1.96与x2=+1.96区
10、间的面积。查附表查附表1,1(-1.96)=0.025,2(1.96)=1-(-1.96)=1-0.025=0.975,区间面积区间面积=2-1=0.975-0.025=0.95=95%本讲稿第二十四页,共五十九页例3-2 已知 X=36.3kg,S=6.19kg欲估计体重大于50kg男童的比例。36.3 50该面积等于多少?该面积等于多少?122=1-1-+2=1-(2.2132)=(-2.2132)=0.0136本讲稿第二十五页,共五十九页欲估计体重在30-40kg范围内男童的比例。=(x2)(x1)(-1.02)0.1539(0.60)1(-0.60)1-0.27430.7257 0.7
11、2570.1539 0.5718本讲稿第二十六页,共五十九页估计该地80%的男童体重的分布范围(中间)。(本题为从面积查(本题为从面积查u u值)值)10%10%80%-1.28 1.28即:即:本讲稿第二十七页,共五十九页第三节第三节 医学参考值范围的制定医学参考值范围的制定医学参考值范围意义:医学参考值范围意义:医学参考值范围(亦称为正常值范围)是指医学参考值范围(亦称为正常值范围)是指正常人的解剖、生理、生化等各种指标的波动范正常人的解剖、生理、生化等各种指标的波动范围。它主要用于划分正常与异常的界限。围。它主要用于划分正常与异常的界限。本讲稿第二十八页,共五十九页本讲稿第二十九页,共五
12、十九页医学参考值范围制定的一般原则医学参考值范围制定的一般原则2、对选定的正常人进行统一而准确的测定、对选定的正常人进行统一而准确的测定4、确定取单侧还是双侧医学参考值范围、确定取单侧还是双侧医学参考值范围5、选定适当的百分界限、选定适当的百分界限6、选择适当制定方法、选择适当制定方法3、考虑是否应按性别、年龄、职业等因素分组确定、考虑是否应按性别、年龄、职业等因素分组确定 医学参考值范围医学参考值范围1 1、抽取足够数量的、抽取足够数量的“正常人正常人”作为调查对象作为调查对象本讲稿第三十页,共五十九页一、医学参考值范围制定的一般原则:一、医学参考值范围制定的一般原则:1、抽取足够数量的、抽
13、取足够数量的“正常人正常人”作为调查对象作为调查对象“正常人正常人”不是指任何一点小病都没有的人,不是指任何一点小病都没有的人,而是指排除影响被研究指标的疾病和因素的人。而是指排除影响被研究指标的疾病和因素的人。本讲稿第三十一页,共五十九页例例如如,制制定定SGPTSGPT(谷谷丙丙转转氨氨酶酶)正正常常值值范范围围,“正常人正常人”的条件是:的条件是:a.a.无肝、肾、心、脑、肌肉等疾患;无肝、肾、心、脑、肌肉等疾患;b.b.近近期期无无服服用用损损肝肝的的药药物物(如如氯氯丙丙嗪嗪,异烟肼)异烟肼)c.c.测定前未作剧烈运动。测定前未作剧烈运动。本讲稿第三十二页,共五十九页(2)医学参考值
14、范围制定所需的样本例数)医学参考值范围制定所需的样本例数一般要求一般要求 n1002、对选定的正常人进行统一而准确的测定:、对选定的正常人进行统一而准确的测定:(1)测测定定的的方方法法、仪仪器器、试试剂剂,操操作作的的熟熟练练程程度度,方方法的精确度均要统一;法的精确度均要统一;(2)要尽量与应用医学参考值范围时的实际情况一致。要尽量与应用医学参考值范围时的实际情况一致。本讲稿第三十三页,共五十九页3、考虑是否应按性别、年龄、职业等因素分组确、考虑是否应按性别、年龄、职业等因素分组确定医学参考值范围。定医学参考值范围。原则上,组间差别明显,并有实际意义,应分开原则上,组间差别明显,并有实际意
15、义,应分开制定,否则应合并。制定,否则应合并。本讲稿第三十四页,共五十九页考察组间考察组间差别差别最简便而有效的最简便而有效的方法方法是:是:从频数分布表,直接比较各组的分布范围,从频数分布表,直接比较各组的分布范围,高峰位置,分布趋势等是否相近,如相近就合并,高峰位置,分布趋势等是否相近,如相近就合并,如差异明显,就分组。如差异明显,就分组。或或做两样本均数的假设检做两样本均数的假设检验,有差别就分组,无差别就合并。验,有差别就分组,无差别就合并。本讲稿第三十五页,共五十九页 4、确定取单侧还是双侧医学参考值范围。、确定取单侧还是双侧医学参考值范围。(1)白细胞数过高和过低均属于异常,需制)
16、白细胞数过高和过低均属于异常,需制定下限(最小值)和上限(最大值),称定下限(最小值)和上限(最大值),称双侧双侧医学参考值范围医学参考值范围。(2)肺活量肺活量只过低为异常,只需制定医学参考值范只过低为异常,只需制定医学参考值范围的下限;围的下限;尿铅尿铅只过高为异常,只需制定医学参考只过高为异常,只需制定医学参考值范围的上限;均称值范围的上限;均称单侧医学参考值范围单侧医学参考值范围。本讲稿第三十六页,共五十九页5、选定适当的百分界限。、选定适当的百分界限。正常值范围的意思正常值范围的意思:绝大多数正常人的某项:绝大多数正常人的某项观察值均在该范围之内。这个绝大多,习惯上指观察值均在该范围
17、之内。这个绝大多,习惯上指正常人的正常人的80、90、9595、99(最常用是最常用是95)。本讲稿第三十七页,共五十九页 根据所选定的百分界限,会造成假阳性或根据所选定的百分界限,会造成假阳性或/和和假阴性。假阴性。如何选定百分位数,以平衡假阳性和假阴性:如何选定百分位数,以平衡假阳性和假阴性:(1)正常人的分布和病人的分布没有重叠)正常人的分布和病人的分布没有重叠,这,这是只要求减少假阳性,则取是只要求减少假阳性,则取99较为理想。较为理想。本讲稿第三十八页,共五十九页正常人正常人病人病人诊断界值诊断界值本讲稿第三十九页,共五十九页(2)正常人分布与病人分布有重叠)正常人分布与病人分布有重
18、叠诊断界值诊断界值正常人正常人病人病人假阳性(误诊)假阳性(误诊)假阴性(漏诊)假阴性(漏诊)本讲稿第四十页,共五十九页a.如需兼顾假阳性和假阴性如需兼顾假阳性和假阴性,取,取95较适当;较适当;b.如如主主要要目目的的是是减减少少假假阳阳性性(如如用用于于确确诊诊病病人人或或选定科研病例),宁取选定科研病例),宁取99。c.如主要目的是减少假阴性如主要目的是减少假阴性(如用于初筛搜查病(如用于初筛搜查病人),宁取人),宁取80或或90。d.根据根据ROC曲线来判断曲线来判断(见第十三章,(见第十三章,P209)即:即:选择选择灵敏度灵敏度和和特异度特异度均均高高的的切点切点。本讲稿第四十一页
19、,共五十九页 6、选择适当制定方法(见下)。、选择适当制定方法(见下)。二、制定医学参考值范围常用方法二、制定医学参考值范围常用方法本讲稿第四十二页,共五十九页 1、正态分布法、正态分布法适用范围:(近似)正态分布或对数正态分适用范围:(近似)正态分布或对数正态分 布资料布资料 2、百分位数法、百分位数法 适用范围:适用范围:a.偏态分布资料偏态分布资料 b.分布不清资料分布不清资料 c.开口资料开口资料二、制定医学参考值范围常用方法二、制定医学参考值范围常用方法本讲稿第四十三页,共五十九页医学参考值范围的题目:医学参考值范围的题目:(1)判断分布类型:正态分布或偏态分布?)判断分布类型:正态
20、分布或偏态分布?(2)判断:单侧或双侧?)判断:单侧或双侧?本讲稿第四十四页,共五十九页例例3-3 1003-3 100名正常人血铅含量名正常人血铅含量步骤:步骤:1、判断分布类型:偏态、判断分布类型:偏态2、处理:对数变换、处理:对数变换3、再判断分布类型:正态分布(对数正态分布)、再判断分布类型:正态分布(对数正态分布)4、按正态分布法计算、按正态分布法计算95%参考值范围(注:必须在对数的条件参考值范围(注:必须在对数的条件下;双侧或单侧?)(如果仍是偏态分布:百分位数法)下;双侧或单侧?)(如果仍是偏态分布:百分位数法)5、还原:取反对数、还原:取反对数本讲稿第四十五页,共五十九页(原
21、始数据频数分布图)(原始数据频数分布图)本讲稿第四十六页,共五十九页本讲稿第四十七页,共五十九页例例3-4步骤:步骤:1、判断分布类型:正态分布、判断分布类型:正态分布2、按正态分布法计算、按正态分布法计算95%参考值范围(注:双侧或单侧?)参考值范围(注:双侧或单侧?)本讲稿第四十八页,共五十九页例例3-5本讲稿第四十九页,共五十九页(原始数据取对数后的频数分布图)(原始数据取对数后的频数分布图)本讲稿第五十页,共五十九页第四节第四节 正态性判定正态性判定1 1、根据专业知识和经验判定、根据专业知识和经验判定2 2、图示法(目测法):、图示法(目测法):主观主观3 3、计算法:、计算法:客观
22、客观判定方法:判定方法:注意:注意:用于判定正态分布的资料,例数应用于判定正态分布的资料,例数应足够大(足够大(100例以上)例以上)本讲稿第五十一页,共五十九页一、图示法一、图示法1 1、频数表或直方图、频数表或直方图(histogram)2、P-P图和图和Q-Q图:图:散点在直线上,正态分布散点在直线上,正态分布本讲稿第五十二页,共五十九页例例3-33-3原始数原始数据据对数数对数数据据本讲稿第五十三页,共五十九页例例3-33-3原始数原始数据据对数数对数数据据本讲稿第五十四页,共五十九页二、计算法二、计算法方法:方法:1、矩法、矩法2、W检验检验3、D检验检验本讲稿第五十五页,共五十九页
23、正态分布正态分布包括:包括:对称性对称性和和正态峰正态峰判断方法:判断方法:一、综合评定:一、综合评定:对对称性(偏度)和正态峰(峰度)进对对称性(偏度)和正态峰(峰度)进行综合评定。包括:行综合评定。包括:W检验检验,D检验检验二、分别评定:二、分别评定:分别对偏度和峰度进行评定。分别对偏度和峰度进行评定。矩法矩法(最准确最准确的方法)。的方法)。本讲稿第五十六页,共五十九页1、矩法矩法一阶中心矩:一阶中心矩:二阶中心矩:二阶中心矩:(方差方差)四阶中心矩:(峰度)四阶中心矩:(峰度)三阶中心矩:(偏度)三阶中心矩:(偏度)本讲稿第五十七页,共五十九页理论上:理论上:偏度系数偏度系数(g1):g1=0,对称对称;g10,正偏正偏峰度系数峰度系数(g2):g2=0,正态正态;g20,尖峭尖峭检验:检验:如果:如果:Ug11.65,偏态,反之,正态偏态,反之,正态如果:如果:Ug21.65,非正态峰,反之,正态峰非正态峰,反之,正态峰本讲稿第五十八页,共五十九页2、W检验检验3、D检验检验(用(用SPSS软件可直接计算)软件可直接计算)本讲稿第五十九页,共五十九页
限制150内