《第章-节正态分布容许区间.ppt》由会员分享,可在线阅读,更多相关《第章-节正态分布容许区间.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、12 六月 2023第章 节正态分布容许区间第四节 正态分布(normal distribution)1.正态分布的密度函数f(x)的图形即正态曲线2.正态变量的分布函数F(x)正态变量在(-,x)内取值的累计概率.f(X)=(X)F(x)=P(Xx)=正态分布3标准正态分布的密度函数和分布函数=0,=1的正态分布称为标准正态分布。标准正态曲线的方程即标准正态密度函数,记为(z)标准正态变量的分布函数记为(z)。(Z)=,(Z)(z)=P(Zz)=4.标准正态变换:Z=式3-175正态分布的特征(1)正态分布具有集中性、对称性和均匀变动性.(2)正态分布的图形由参数和确定。(3)任何均数为,标
2、准差为的正态变量x,都可通过式(3-17)变换为标准正态变量z。zN(0,1)。(4)正态变量的分布有一定规律.6正态分布规律(1)标准正态变量的分布规律(Z)=P(Z z)=1-(z)随机变量概率分布的双侧尾部概率(或单侧尾部概率)为时,对应的变量值称为双侧(或单侧)临界值,简称界值或界值。6正态分布规律双侧:P(Z Z/2)=/2P(-z/2 Z z/2)=1-即 P(Z z/2)=1-例3-10 查表6正态分布规律单侧:右侧尾部面积为时的Z界值记为Z,左侧尾部面积为时的Z界值为-ZP(Z z)=P(Z-z)=P(Z z)=1-例3-10 查表界值-Z(2)一般正态曲线下面积的分布规律 求
3、均数为方差为2的正态曲线下面积,先按标准正态变换z=(x-)/求得x值对应的Z值,再用z值查附表1,得(z),即所求区间面积占总面积的比例。(2)一般正态曲线下面积的分布规律【例3-11】若已知健康女大学生血清总蛋白含量服从正态分布,均数=73.8g/L,标准差=3.9g/L,试估计168名健康女大学生血清总蛋白含量在72.078.6g/L范围内的人数。7正态分布的应用(P38)8统计推断和计算公式的推导中经常应用到的正态变量性质(P39)9对数正态分布(P39)第五节 变量变换变量变换即将原始数据转换成某种函数值,目的是使变换后的数据达到统计分析要求。对数变换平方根反正弦变换1对数变换 y=
4、lgx或y=lnxy=ln(x+k)、y=ln(x-k)n 常用于:n 使服从对数正态分布的资料正态化。n 标准差与均数成比例的资料。n 若方差不齐,但是变异系数接近甚至等于某一常数的资料,可经对数变换以缩小各方差间的差别,使资料达到方差齐性要求。n 使曲线直线化,常用于曲线拟合。2平方根反正弦变换 原数据为百分数p且接近于0或1时,分布为偏态,作平方根反正弦变换,可改善正态性和方差齐性。平方根反正弦变换最适用于各组百分比的极差较大的资料,也可用于S形曲线或反S形曲线的直线化。=sin1 或=2sin1第六节 容许区间与参考值范围 1.容许区间(参考值范围)、医学参考值范围概念(toleran
5、ce limit of population)又称预测区间,指的是总体中绝大多数个体观察值可能出现的范围。指“正常”人体和动物的各种生理常数、体液、排泄物中各种成分含量及人体对各种试验的反应值,是一个范围。95参考值范围的含义是指样本中有95的个体其测定值在所求的范围之内。二、制定参考值范围的基本步骤(自学)n 确定“正常人”对象的范围:即根据研究目的确定的未患被研究疾病的个体。n 统一测定标准:即检验用的试剂批号、仪器、人员、条件等应相同。n 确定分组:一般需用年龄、性别等对“正常人”对象进行分组,分组特征也可根据检验判断。n 样本含量确定:一般来讲,正态分布资料所需的样本含量应在100以上
6、,偏态或未知分布时样本含量应更大。n 确定参考值范围的单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧。n 确定百分位点:一般取95%或99%。双侧1-容许区间计算公式的推导:(略)n P(z/2 z z/2)=1-nP(z/2 z/2)=1nP(z/2 x-z/2)=1nP(z/2 x+z/2)=1n(-z/2,+z/2)nz/2(z/2表示双侧z界值)勇于开始,才能找到成功的路单侧时1-容许区间计算公式推导(略)P(z-z)=1-or P(z z)=1-P(-z)=1-nP(x-z)=1nP(x-z)=1-zP(z)=1-nP(x-z)=1nP(x+z)=1+z 当和未知时,可用大样本
7、的 和s分别作为和的估计值,来计算的参考值范围。2.求参考值范围的方法(1)正态分布法 正态变量x的双侧(1-)参考值范围计算公式为:(-z/2s,+z/2s),缩写为 z/2s(3-30)正态变量x的单侧(1-)参考值范围为:(-zs),或(+zs)(3-31)xx xxx【例3-12】若已知健康女大学生血清总蛋白含量服从正态分布,用大样本资料算出=73.708 g/L,s=3.8759 g/L,求健康女大学生血清总蛋白含量的95%参考值范围。(2)对数正态分布法 先将变量值作对数变换,计算对数值的均数与标准差后,计算对数值的参考值范围,再求反对数,即得所求参考值范围。双侧95%的界限值为:
8、lg-1(1.96slgx)单侧95%的上限值为:lg-1(+1.645slgx)单侧95%的下限值为:lg-1(1.645slgx)(3)百分位数法 适用于偏态分布或分布型不明资料的参考值范围估计。双侧公式:P 100/2 X P 100-100/2单侧公式:P 100,P 100-100【例3-13】调查得某市某年996名女大学生月经初潮年龄分布如表3-5第1、2行。(自学)Px=L+i(nx%-fL)/fx 3.制定医学参考值范围的注意事项(自学)(1)按随机化方法从正常人总体中抽取样 本含量足够大的样本。(n100)(2)根据指标的实际用途,结合专业知识 来决定应取单侧还是双侧。第七节
9、 离群值(outlier)的取舍 测量数据中有时会有个别过大或过小,与群体数据严重偏离的可疑数据,又极端值(extreme value)。局内值 局外值 1.计量资料判断局外值(1)x 3s 法 两个前提条件:资料在总体上服从正态分布:样本含量n较大。x 3s法是在例数n=的前提下作出的,当n60时较好,当n较小时,此法不适用,至少要n10,当n10时,无论可疑值是多大,它都不会超过(x 3s)。(2)Q 检验法(略)Q(x2x1)/RQ(xnx n-1)/R极差R xnx1 Q1/3 DPS操作(3)间距法(略)QRP75P25 上或下截界值CU、CL的公式分别为:CU P752QR CL P252QR【例3-14】研究一批人工培植人参中M物质的含量(g),54次测得的结果(略)31 43 37 43 48 44 43 47 45 42 41 43 48 44 41 42 41 41 38 41 32 41 43 47 41 43 41 41 49 41 41 46 41 42 51 39 39 43 41 44 49 41 50 51 42 51 38 39 58 39 44 45 50 51
限制150内