统计学正态分布.ppt
第3章 正态分布1 正态分布概念正态分布概念 正态分布正态分布(normal distributionnormal distribution)也叫高斯)也叫高斯分布(分布(Gaussian distributionGaussian distribution),一种最常见、),一种最常见、最重要的连续型对称分布。最重要的连续型对称分布。(正态分布是对称分布,但对称分布不一定是正态分布)(正态分布是对称分布,但对称分布不一定是正态分布)2.2.实实 际际 频频 数数 分分 布布:中中 间间 频频 数数 多多,两两 端端 越越 来来 越少,且左右大致对称越少,且左右大致对称 理论频数分布:正态分布曲线。理论频数分布:正态分布曲线。l l 设想当原始数据的频数分布图的观察数逐渐增加且组段不断分细时,图中的直条就不断变窄,其顶端则逐渐接近于一条光滑的曲线。这条曲线形态呈钟形,两头低、中间高,左右对称,近似于数学上的正态分布。在处理资料时,我们就把它看成是正态分布。正态分布曲线的数学函数表达式:正态分布曲线的数学函数表达式:如果随机变量如果随机变量 的分布服从概率密度函数:的分布服从概率密度函数:2、正态曲线特点特点1.钟型钟型2.中间高中间高3.两头低两头低4.左右对称左右对称5.最高处对应于最高处对应于X轴轴的值就是均数的值就是均数6.曲线下面积为曲线下面积为17.标准差决定曲线标准差决定曲线的形状的形状X Xf f(X X)m mnormal curve 位置参数位置参数决定曲线的位置,形态参数决定曲线的位置,形态参数决定曲线的形态决定曲线的形态X Xf f(X X)m m 三、标准正态分布三、标准正态分布标准正态分布(standard normal distribution)的两个参数为:=0,=1 记为 N(0,1)一般正态分布为一个分布族:N(m,s2);标准正态分布只有一个 N(0,1);这样简化了应用 四、曲线下面积四、曲线下面积u-二、正态分布的应用二、正态分布的应用1、估计医学参考值范围2、质量控制3、正态分布是许多统计方法的理 论基础医学参考值范围 临床上常用的参考值是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及生化指标,过去称正常值。步骤:1.从“正常人”总体中抽样:明确研究总体 2.统一测定方法以控制系统误差。3.判断是否需要分组(如性别、年龄)确定。4.根据专业知识决定单侧还是双侧。单侧下限单侧下限-过低异常过低异常 单侧上限单侧上限-过高异常过高异常 双侧双侧-过高、过低均异常过高、过低均异常 单侧下限单侧下限异常异常正常正常单侧上限单侧上限异常异常正常正常异常异常正常正常双侧下限双侧下限双侧上限双侧上限异常异常1.正态分布法正态分布法方法:方法:1.正态分布法正态分布法 2.百分位数法百分位数法 双侧双侧1-参考值范围:参考值范围:单侧单侧1-参考参考值范围:值范围:双侧双侧95%正常值范围:正常值范围:单侧单侧95%正常值范围:正常值范围:正态分布除了可估计频数分布外,还是许多统计方法的基础,并可应用于质量控制及制定医学参考值范围。医学参考值范围的制定一、基本概念一、基本概念 医医学学参参考考值值(reference reference valuevalue)是是指指包包括括绝绝大大多多数数正正常常人人的的人人体体形形态态、机机能能和和代代谢谢产产物物等等各各种生理及生化指标常数,也称正常值。种生理及生化指标常数,也称正常值。由由于于存存在在个个体体差差异异,生生物物医医学学数数据据并并非非常常数数而而是是在在一一 定定 范范 围围 内内 波波 动动,故故 采采 用用 医医 学学 参参 考考 值值 范范 围围(medical medical reference reference rangerange)作作为为判判定定正正常常和和异异常的参考标准。常的参考标准。医学参考值范围涉及到采用单侧界值还是双侧界值的问题,这通常依据医学专业知识而定。l l双侧:l l血清总胆固醇无论过低或过高均属异常l l白细胞数无论过低或过高均属异常l l单侧:l l1、血清转氨酶仅过高异常 l l2、肺活量仅过低异常 l l医学参考值范围有 90%、95%、99%、等,最常用的为 95%。l l计算医学参考值范围的常用方法:l l1、正态分布法l l 2、百分位数法二、方法l l1、正态分布法:l l 许多生物医学数据服从或近似服从正态分布,如同年龄同性别儿童的身高值、体重值,同性别健康成人的红细胞数等;l l 有些医学资料虽然呈偏态分布,但若能通过适当的变量变换转换为正态分布,也可采用正态分布法制定参考值范围。l适用:正态分布资料2.百分位数法百分位数法 双侧双侧95%参考值范围:参考值范围:P2.5P97.5 单侧单侧95%参考值范围:参考值范围:P5(下限)(下限)适用于偏态分布资料适用于偏态分布资料 第三节 t t 分布分布t t 分布分布随机变量随机变量X XN N(m m,s s2 2)标准正态分布标准正态分布N N(0 0,1 12 2)u变换均数均数标准正态分布标准正态分布N N(0 0,1 12 2)Student Student t t分布分布自由度:自由度:n n-1-1t分布的概率密度函数式中式中 为伽玛函数;为伽玛函数;圆周率;圆周率;V V 为为自由度(自由度(degree of freedomdegree of freedom),是),是t t分布的分布的唯一参数;唯一参数;t t为随机变量。为随机变量。以以t t 为横轴,为横轴,f f(t t)为纵轴为纵轴,可绘制可绘制t t分布分布曲线。曲线。t t分布分布曲线曲线性质:性质:单峰分布,曲单峰分布,曲线在线在t t0 0 处最高,处最高,并以并以t t0 0为中心左右为中心左右对称对称与正态分布相比,与正态分布相比,曲线最高处较矮,两曲线最高处较矮,两尾部翘得高尾部翘得高(见绿线)(见绿线)随自由度增大,随自由度增大,曲线逐渐接近正态分曲线逐渐接近正态分布;分布的极限为标布;分布的极限为标准正态分布。准正态分布。t分布曲线下面积(附表)双侧双侧t t0.05/20.05/2,9 92.2622.262 单侧单侧t t0.0250.025,9 9单侧单侧t t0.050.05,9 91.8331.833双侧双侧t t0.01/20.01/2,9 93.2503.250 单侧单侧t t0.0050.005,9 9单侧单侧t t0.010.01,9 92.8212.821双侧双侧t t0.05/20.05/2,1.961.96 单侧单侧t t0.0250.025,单侧单侧t t0.050.05,1.641.64查查t 界值表界值表