正态分布和参考值范围.ppt
关于正态分布与参考值范围第一张,PPT共八十七页,创作于2022年6月第一节正态分布第二张,PPT共八十七页,创作于2022年6月正态分布正态分布 正态分布正态分布(normal distributionnormal distribution)也叫高斯分布)也叫高斯分布(Gaussian distributionGaussian distribution),是最常见、最重要的一种连续型分),是最常见、最重要的一种连续型分布布 一、正态分布的数学形式和正态曲线下面积的规律一、正态分布的数学形式和正态曲线下面积的规律 二二、正态分布的、正态分布的特征特征 三三、标准正态分布、标准正态分布 第三张,PPT共八十七页,创作于2022年6月频数分布图第四张,PPT共八十七页,创作于2022年6月频数分布逐渐接近正态分布示意图频数分布逐渐接近正态分布示意图第五张,PPT共八十七页,创作于2022年6月(一)、(一)、正态分布的概率密度函数正态分布的概率密度函数第六张,PPT共八十七页,创作于2022年6月正态分布的概率分布函数正态分布的概率分布函数第七张,PPT共八十七页,创作于2022年6月(二)、正态曲线(二)、正态曲线(normal curve)Xf(X)m第八张,PPT共八十七页,创作于2022年6月 正态曲线的定义正态曲线是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟形曲线第九张,PPT共八十七页,创作于2022年6月正态分布的特征正态分布是单峰分布,曲线以均数为中心,左右完全对称,正态曲线以X轴为渐近线,曲线两端无线接近X轴,但不相交;正态曲线在均数处取得该概率密度函数的最大值,X越远离均数,f(X)值越小,在x=处有拐点,表现为钟形曲线;X取值范围理论上没有边界,应为:-+,X离离越远,函数f(X)值越接近0,但不会等于0。第十张,PPT共八十七页,创作于2022年6月正态分布的特征正态分布有两个参数,决定曲线在横轴上的位置,增大,曲线沿横轴向右移;反之,减小,曲线沿横轴向左移;决定曲线的形状,当 恒定时,越大,数据越分散,曲线越“矮胖”;反之,越小,数据越集中,曲线越“瘦高”;习惯上用N(,2);表示均数为、标准差为的正态分布;正态分布的特殊形式:标准正态分布N(0,1);第十一张,PPT共八十七页,创作于2022年6月正态分布的特征正态曲线下的面积分布有一定的规律:1.曲线下的面积即为概率,可以通过式3-2求得。2.曲线下的总面积为1或100%,以为中心左右两侧面积各占50%,越靠近处,曲线下面积越大,两边逐渐减少,超过一定范围以外的面积(概率)可以忽略。3.所有正态曲线,在左右的任意个标准差范围内面积相同。第十二张,PPT共八十七页,创作于2022年6月正态分布曲线下面积规律图图2-+-1.96+1.96-2.58+2.5868.27%95.00%99.00%第十三张,PPT共八十七页,创作于2022年6月 第十四张,PPT共八十七页,创作于2022年6月正态分布数列中的每个个体加上一个不为零的常数K后,均数的变化均数改变为原均数+K第十五张,PPT共八十七页,创作于2022年6月标准差的变化标准差不变,等于原数列的标准差第十六张,PPT共八十七页,创作于2022年6月正态分布数列中的每个个体乘以一个不为零或一的常数K后,均数的变化均数改变为原均数 K第十七张,PPT共八十七页,创作于2022年6月标准差的变化标准差改变,等于原数列标准差的K倍第十八张,PPT共八十七页,创作于2022年6月 三三 标准正态分布标准正态分布标准正态分布标准正态分布(standard normal distribution)的两个的两个参数为:参数为:=0,=1 记为记为 N(0,12)任意一个服从任意一个服从N(,2)分布的随机变量)分布的随机变量X经过标准经过标准化变换,也叫化变换,也叫z变换(变换(u变换),均可转换为变换),均可转换为=0,=1的标准正态分布。的标准正态分布。第十九张,PPT共八十七页,创作于2022年6月标准正态分布的概率密度函数标准正态分布的概率密度函数第二十张,PPT共八十七页,创作于2022年6月标准正态分布的分布函数标准正态分布的分布函数经常会用到正态分布曲线下一定范围的面积占总面积的百分数,用以估计落在该范围内的频数占总频数的百分比。可通过对式(3-1)积分求得,表示从-到x或z的面积F(x)或(z)(总面积为1)。见图3-5。第二十一张,PPT共八十七页,创作于2022年6月 曲线下面积曲线下面积u-附表1(P213)就是根据标准正态分布的分布函数制定的第二十二张,PPT共八十七页,创作于2022年6月标准正态曲线下的面积特点附表1 为标准正态分布曲线下的面积,表上所查到的面积为从-到z的面积;假设横轴上曲线下的面积为1,即100曲线下,横轴上对称于0的面积相等实际工作中经常要用的面积分布规律有以下三点,68.27%,95%,99%的面积公式见表1和下图。第二十三张,PPT共八十七页,创作于2022年6月标准正态分布曲线下面积规律标准正态分布曲线下面积规律0-11-1.961.96-2.582.5868.27%95.00%99.00%第二十四张,PPT共八十七页,创作于2022年6月正态曲线下的面积特点,已知时,进行标准正态变换再查表,未知时,用样本均数 和样本标准差s代替总体参数进行标准正态变换后再查表95%,99%的面积公式见表1第二十五张,PPT共八十七页,创作于2022年6月正态分布曲线下面积规律的推导正态分布曲线下面积规律的推导双侧双侧95%的面积的公式的面积的公式第二十六张,PPT共八十七页,创作于2022年6月正态分布曲线下面积规律图图2-+-1.96+1.96-2.58+2.5868.27%95.00%99.00%第二十七张,PPT共八十七页,创作于2022年6月表表1 正态分布曲线下面积规律正态分布曲线下面积规律第二十八张,PPT共八十七页,创作于2022年6月计算正态曲线下面积实例计算正态曲线下面积实例例例1试估计该地正常女子血清甘油三脂在1.10mmol/L以下者占正常女子血清甘油三脂总人数的百分比。将X=1.10代入标准正态变量变换公式,得:第二十九张,PPT共八十七页,创作于2022年6月计算正态曲线下面积实例计算正态曲线下面积实例查附表1,在表的左侧找到0.1,在表的上方找到0.04,两者的相交处为0.4443=44.43%。即该地正常女子血清甘油三脂在1.10mmol/L以下者,估计占总人数的44.43%。例3-1和3-2见P22。第三十张,PPT共八十七页,创作于2022年6月实例图示实例图示44.43第三十一张,PPT共八十七页,创作于2022年6月 概率密度函数与累积分布函数概率密度函数与累积分布函数第三十二张,PPT共八十七页,创作于2022年6月三、正态分布的应用一种最常见、最重要的连续分布很多正常人的生理、生化指标的理论分布数理统计中发展得最为完善的一种分布很多统计推断都是在正态分布条件下进行很多非正态分布的资料,当观察例数足够多时,可以用正态分布作为它的极限分布有时,也将非正态分布资料转化为正态分布来处理第三十三张,PPT共八十七页,创作于2022年6月正态分布的应用深入统计描述和推断的基础 计算参考值范围的基础 计算可信区间的基础 进行假设检验的基础质量控制图二项分布、Poisson分布的正态分布近似第三十四张,PPT共八十七页,创作于2022年6月第二节医学参考值范围第三十五张,PPT共八十七页,创作于2022年6月由于存在个体变异,来自正常人群的生由于存在个体变异,来自正常人群的生理、生化指标在不同个体之间存在着差理、生化指标在不同个体之间存在着差异,即使是同一个个体,某些指标也会异,即使是同一个个体,某些指标也会因时间、空间的改变而有一定程度的波因时间、空间的改变而有一定程度的波动。动。因此,很有必要制定一个正常人群的参考值因此,很有必要制定一个正常人群的参考值范围以判断某个个体某项指标正常与否。范围以判断某个个体某项指标正常与否。第三十六张,PPT共八十七页,创作于2022年6月一、医学参考值范围的概念又称参考值范围又称参考值范围(reference range)(reference range),是指是指“正常正常”人的人的解剖,解剖,生理、生化生理、生化等等数据数据大多数个体值大多数个体值的波动范围。的波动范围。常用常用9595的参考值范围的参考值范围第三十七张,PPT共八十七页,创作于2022年6月The Purpose of the Reference Range第三十八张,PPT共八十七页,创作于2022年6月Judge the index value of someone is normal or not?因为参考值范围覆盖了绝大多数个体,所以因为参考值范围覆盖了绝大多数个体,所以 如果某个个体的测量值超出此范围,我们可以据此推如果某个个体的测量值超出此范围,我们可以据此推断他的这项指标存在着异常。断他的这项指标存在着异常。基于临床实践,从个体角度,作为临床上判定正常与异基于临床实践,从个体角度,作为临床上判定正常与异常的参考标准常的参考标准基于预防医学实践,从人群角度,可用来评价儿童的基于预防医学实践,从人群角度,可用来评价儿童的发育水平发育水平第三十九张,PPT共八十七页,创作于2022年6月正常人的手指血流正常人的手指血流呈黃藍色呈黃藍色 (perfusion unitperfusion unit約約215215)參考值:參考值:PU150PU150手指潰爛之病人血流手指潰爛之病人血流呈紫灰藍色呈紫灰藍色(PUPU約为約为1919)第四十张,PPT共八十七页,创作于2022年6月Indexabnormalsickorunhealthiness?Help us to judge whether someone is sick.?第四十一张,PPT共八十七页,创作于2022年6月姚明:2.26米,身高高于正常人参考值范围的上限,属于身高指标异常。但是他很健康,并没有相关的疾病。第四十二张,PPT共八十七页,创作于2022年6月Two、How to Make Reference Range 第四十三张,PPT共八十七页,创作于2022年6月First stepSampling from Normal Population确定同质的参照总体第四十四张,PPT共八十七页,创作于2022年6月The choice of sample首先,正常人不是指完全健康的人,首先,正常人不是指完全健康的人,而是指而是指符合特定健康水平的人。在符合特定健康水平的人。在使用或指定临床参考值范围时,使用或指定临床参考值范围时,“正常人正常人”是指是指相对于我们所研究的相对于我们所研究的指标正常的人,即排除了指标正常的人,即排除了对研究指对研究指标有标有影响的疾病或影响的疾病或有关有关因素的因素的同质同质人群人群。第四十五张,PPT共八十七页,创作于2022年6月例如:例如:制定血清谷丙转氨酶的参考值范围,你认为正常人的条件是什么呢?无肝肾心脑肌肉等疾病无肝肾心脑肌肉等疾病近期未服用对肝脏有损伤的药物如氯丙嗪,异烟肼等近期未服用对肝脏有损伤的药物如氯丙嗪,异烟肼等检测前未作剧烈运动检测前未作剧烈运动第四十六张,PPT共八十七页,创作于2022年6月例如:如果我们想制定某市成人居民中血铅的例如:如果我们想制定某市成人居民中血铅的参考值范围,我们规定凡是满足下列条件的参考值范围,我们规定凡是满足下列条件的个体均可进入我们的研究:个体均可进入我们的研究:1:adult people wuho have stayed in the city for more than one year 2:without obvious liver or kidney diseases 3:without the history of obvious lead contact or lead-related occupation第四十七张,PPT共八十七页,创作于2022年6月Second stepSelect enough sample选择足够例数的参照样本第四十八张,PPT共八十七页,创作于2022年6月选择足够例数的参照样本The choice of sample随机选取样本 Random 样本含量(n)Sample size:the bigger the better,but in common sense the sample should involve at least 100 individuals.第四十九张,PPT共八十七页,创作于2022年6月Third stepMinimize Measure Error 控制检测误差第五十张,PPT共八十七页,创作于2022年6月Minimize Measure Error Standardize 标准化统一测量方法统一仪器统一试剂统一精密度统一操作熟练度第五十一张,PPT共八十七页,创作于2022年6月 Fourth stepGrouping or not?第五十二张,PPT共八十七页,创作于2022年6月分组的原则:如果组间差异有统计学意义,而且分组具有实际意义,则一定应分组。例如:如果我们想制定身高的参考值范围,不仅应考虑性别,年龄的差异,而且还应将地区之间的差异考虑在内。For example,we we want to make a reference range of height.Not only gender,age,but also geographic factors should be considered.第五十三张,PPT共八十七页,创作于2022年6月第五十四张,PPT共八十七页,创作于2022年6月婴儿身体发育的参考值婴儿身体发育的参考值(均值均值)男孩男孩女孩女孩头围头围(cm)体重体重kgkg身长身长cmcm头围头围(cm)cm)体重体重(kg)kg)身长身长(cm)(cm)第一周第一周34.0034.003.003.0050.050.034.034.03.003.0050.050.0第一个月第一个月35.8135.813.823.8253.153.135.0835.083.643.6451.951.9第二个月第二个月 37.70 37.70 5.005.0056.256.236.7036.704.604.6054.954.9第三个月第三个月39.5039.505.835.8359.659.638.2038.205.205.2057.757.7第四个月第四个月40.6040.606.436.4361.861.839.6039.606.056.0560.960.9第五个月第五个月41.7041.707.017.0164.264.240.7040.706.586.5863.163.1第六个月第六个月42.7342.737.687.6866.466.441.3841.386.926.9264.564.5第七个月第七个月43.2943.298.048.0468.168.142.2242.227.497.4967.167.1第八个月第八个月43.8543.858.378.3769.969.942.7542.757.697.6968.168.1第九个月第九个月44.3544.358.778.7771.371.343.2343.238.058.0569.869.8第十个月第十个月44.9544.959.039.0372.972.943.6643.668.368.3670.870.8第十一个月第十一个月45.4845.489.279.2773.773.743.8643.868.538.5372.172.1第五十五张,PPT共八十七页,创作于2022年6月Fifth stepA One-Side Range or A Two-Sides Range 第五十六张,PPT共八十七页,创作于2022年6月One side or two sides?决定选用单侧范围还是双侧范围要根据我们的科研设计、积累的经验及指标的实际用途而定。The choice of a one-or two-sides range is determined by your scientific research design or your experience.第五十七张,PPT共八十七页,创作于2022年6月如果某个指标(如身高)过高和过低均为异常,我们就应该制定它的双侧范围,即找到正常人群的上限和下限。If an index is thought to be abnormal when it is too high or too low,we must find the lower and upper limits of normal population,that means two sides range.第五十八张,PPT共八十七页,创作于2022年6月 血清蛋白电泳扫描结果血清蛋白电泳扫描结果 正常参考值范围:正常参考值范围:Alb(Alb(白蛋白):57%-68%:57%-68%1:11:1.0%-5.7%0%-5.7%2 :4.9%-11.2%2 :4.9%-11.2%:7.0%-13%:7.0%-13%:9.8%-18.2%:9.8%-18.2%第五十九张,PPT共八十七页,创作于2022年6月双白蛋白血症先天性白蛋白缺陷症第六十张,PPT共八十七页,创作于2022年6月Two-sides rangeTheseindexesinclude:height,weight,bloodpressure,pulse,hb,etal.第六十一张,PPT共八十七页,创作于2022年6月但是如果这个指标仅在过高或过低时但是如果这个指标仅在过高或过低时异常,那我们就应找到正常人群的上异常,那我们就应找到正常人群的上限或下限,即制定单侧范围。限或下限,即制定单侧范围。But if an index is abnormal only when it is too high(or too low),we then should make a one-side range with upper(lower)limit.第六十二张,PPT共八十七页,创作于2022年6月One side range(one)Take blood lead(血铅)(血铅)for example,it is abnormal only when it is too high.The content of mercury(发汞发汞)in the hair is the same kind.第六十三张,PPT共八十七页,创作于2022年6月第六十四张,PPT共八十七页,创作于2022年6月One side range(another)Vital capacity(肺活量)is another kind of one-side range.It is abnormal only when it is too low,so we must find the lower limit of normal population第六十五张,PPT共八十七页,创作于2022年6月Sixth step Choose an Appropriate Confidence(%)Level选择适当的百分数范围第六十六张,PPT共八十七页,创作于2022年6月Determining the confidence level原则:根据科学常规,选择合适的百分界限,最常用的范围为95。当然,我们也可以根据特定的研究目的做适当的调整。Principal:According scientific regulations,choose an appropriate confidence level.95%is used most frequently.It also can be adjusted according to your specific aim.第六十七张,PPT共八十七页,创作于2022年6月Determining the confidence level如果我们想降低漏诊率(the rate of missed diagnosis),也就是希望发现更多的病人,我们可以通过缩窄正常人群的范围,从具有较高的测量值的个体中找到潜在的病人,所以可以选择一个比较低的百分界值,90%或 80%都可以第六十八张,PPT共八十七页,创作于2022年6月95%,normalvalue5%,abnormal value(latent patient)90%,normalvalue10%,abnormal value(latent patient)第六十九张,PPT共八十七页,创作于2022年6月Determining the confidence level另一方面,如果我们希望降低误诊率(the rate of misdiagnosis),也就是希望诊断更精确,我们应该扩大参考值的范围。这样,具有更高的测量值的个体患相关疾病的概率就增加了,降低了误诊的概率。所以我们可以选择一个更高的百分界限,如99。第七十张,PPT共八十七页,创作于2022年6月95%,normalvalue5%,abnormal value(latent patient)99%,normalvalue1%,abnormal value(latent patient)第七十一张,PPT共八十七页,创作于2022年6月Seventh stepDecide the Distribution Type第七十二张,PPT共八十七页,创作于2022年6月正态性检验是决定这个资料是否满足正态分布的金标准。但是正态性检验必须通过统计软件在计算机上运算才可以实现。第七十三张,PPT共八十七页,创作于2022年6月我们可以通过经验公式大致判断资料的分布类型:正常人的各种生理、生化、解剖值数据分布比较均匀,而且算术平均数是标准差的3倍以上。算术平均数和中位数比较接近,中位数和算术平均数的比值在(0.95-1.05)之间。第七十四张,PPT共八十七页,创作于2022年6月Last step Choose a Best Method to Compute It第七十五张,PPT共八十七页,创作于2022年6月计算方法:正态分布法、对数正态分布法和百分位数法。选择何种方法依据我们的资料的类型,由第6步决定。计算方法如下,以95参考值范围为例第七十六张,PPT共八十七页,创作于2022年6月正态分布法应用条件:正态分布或近似正态分布资料计算公式:95%医学参考值范围双侧:单侧:或 第七十七张,PPT共八十七页,创作于2022年6月对数正态分布法应用条件:对数正态分布资料计算公式:95%医学参考值范围双侧:单侧:或 第七十八张,PPT共八十七页,创作于2022年6月百分位数法 应用条件:偏态分布资料 计算公式:95参考值范围:双侧界值:P 2.5 P 97.5 单侧 上界:P 95 单侧 下界:P 5 第七十九张,PPT共八十七页,创作于2022年6月95%参考值范围的估计方法 方法方法 适用资料类型适用资料类型 双侧界限值双侧界限值 单侧上限单侧上限 单侧下限单侧下限 正态法正态法 正态正态对数正态 对数正态分布法 百分位数法百分位数法 偏态偏态 P2.5 P97.5 P95 P5 第八十张,PPT共八十七页,创作于2022年6月例3-3利用表3-1 某地140名正常男子红细胞数的频数表,求95的参考值范围。第八十一张,PPT共八十七页,创作于2022年6月要点总结:红细胞数过高或过低都是异常的,因此应该选择双侧范围。95%是最常用和最好的百分界限。根据我们的经验,这个指标呈正态分布。当然,最好通过正态性检验证实。第八十二张,PPT共八十七页,创作于2022年6月正态性检验证实资料呈正态分布正态性检验证实资料呈正态分布(P0.200),因此我,因此我们选择正态分布法计算双侧们选择正态分布法计算双侧95%的参考值范围。的参考值范围。下限为下限为4.78-1.960.38=4.04(1012/L)上限为上限为4.78+1.960.38=5.52(1012/L)所以该地成年男子红细胞数的所以该地成年男子红细胞数的95%参考值范围是参考值范围是4.045.52(1012/L)第八十三张,PPT共八十七页,创作于2022年6月例题3-5根据表2-4资料,估计该地区5060岁女性血清甘油三酯含量的95参考值范围?第八十四张,PPT共八十七页,创作于2022年6月要点总结:甘油三酯只在过高是异常的,因此应该选择单侧上限范围。95%是最常用和最好的百分界限。根据我们的经验,这个指标呈偏态分布。当然,最好通过正态性检验证实。第八十五张,PPT共八十七页,创作于2022年6月正态性检验证实资料呈正态分布正态性检验证实资料呈正态分布(P0.01),因此我们,因此我们选择百分位数法计算单侧上限的选择百分位数法计算单侧上限的95%正常值范围。正常值范围。上限为所以所以该地区5060岁女性血清甘油三酯的甘油三酯的95%参考值范围是小于参考值范围是小于2.098mmol/L。第八十六张,PPT共八十七页,创作于2022年6月感谢大家观看第八十七张,PPT共八十七页,创作于2022年6月