卫生统计学 基本分布.ppt
《卫生统计学 基本分布.ppt》由会员分享,可在线阅读,更多相关《卫生统计学 基本分布.ppt(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第五章 基本分布 Oct 20,2009第一节第一节 随机变量及其分布随机变量及其分布一、随机变量(一、随机变量(random variable)n 随机现象,也称不确定现象,指在相同条件下重复试验可 得到不同结果的现象。n 必然现象,也称确定性现象 n 随机试验所得到的每一种可能的结果称为 随机事件。数学上可用一个变量,如X来描 述,称为随机变量。n 随机变量的每一取值一般都有确定的概率,如P(治愈)=P(X=1)=0.60等。因此每一随机变量 都有一定的概率分布,其分布的类型有两种,即离散型分布和连续型分布。Oct 20,20091 1、离散型随机变量、离散型随机变量 (discrete
2、(discrete random variable)random variable)随机变量X只能取有限个数值X1,X2,Xn或无限个可数数值X1,X2,Xn,则X定义为离散型随机变量。当X=Xk ,概率为P(Xk)则有随机变量的概率分布 Oct 20,2009离散型随机变量的分布函数:Oct 20,20092 2、连续型随机变量、连续型随机变量 (continuous(continuous random variable)random variable)像某地某年正常成年男子身高这样的随机变量,由于其可能取值不能一一列举出来,而是在实数轴上的某一确定区间内连续分布,称之为连续分布型随机变量,
3、简称连续型随机变量。随机变量X的分布函数F(x)为:概率密度函数 f(x):表示随机变量X在取值X附近单位长度内的概率的大小。为分布函数F(x)的导数。所以,对于连续型随机变量来说,要掌握其概率分布规律,其关键是求出其概率密度函数。Oct 20,2009第二节第二节 正态分布正态分布Oct 20,2009正态分布曲线的演变正态分布曲线的演变 频率5-2 a1251291331371411451491531571610.1.2.3.4身高(cm)5-2 bOct 20,2009这条曲线称为频率曲线,略呈钟型,两侧低,中间高,左右对称,近似于概率分布中的正态分布。频率的总和为1,故正态分布曲线下横
4、轴上的面积也应为1。正态分布的概率密度函数,也称为正态分布曲线方程为:Oct 20,2009正态分布的特性 正态分布只有一个峰值,位于x=处正态分布以x=对称轴左右对称正态分布的两个参数 和 决定分布位置和形状 正态分布曲线下面积分布有规律 Oct 20,2009Oct 20,2009对于正态分布常用 xN(,)Oct 20,2009Oct 20,2009标准正态分布标准正态分布与标准化变换:(,)v标准化变换:v令=0,=1v标准正态分布:(0,1)Oct 20,2009Oct 20,2009Oct 20,2009标准正态分布的应用标准正态分布的应用例53 已知某地2003年120名7岁男童
5、身高 =122.0cm,s=4.7cm,试估计该地7岁男童身高介于118cm和124cm范围内的比例及110名7岁男童介于此范围内的人数。Oct 20,2009Oct 20,2009 D=0.6646-0.1989=0.4657=46.57%(u1)=(-0.8511)=0.1989(u2)=(0.4255)=1-(-0.4255)=1-0.3354=0.6646 Oct 20,2009三、参考值范围定义:绝大多数正常人的解剖,生理,生化各种指标的波动范围,称作为医学参考值范围(medical reference ranges)。正常人:并非指机体任何器官、组织的形态和机能都正常的人,而是指排
6、除了影响所研究指标的疾病和有关因素的人 Oct 20,2009步骤和原则步骤和原则抽取足够大例数的正常人作为样本(n=100)控制测量误差 确定是否需要分组确定参考值范围 决定取双侧还是取单侧 选定合适的百分界限 两种方法:正态分布法和百分位数法Oct 20,2009正态分布法正态分布法当资料符合正态分布时双侧1正常值范围公式为:单侧上限1正常值范围公式为:Oct 20,2009u u界值的概念界值的概念 u/2 为标准正态分布下双侧尾部面积为时的u值(绝对值)u2为标准正态分布下单侧尾部面积为时的u值(绝对值)特别地:u0.05/21.96;u0.01/22.58;u0.05 1.64;u0
7、.01 2.33;Oct 20,2009Oct 20,2009Oct 20,2009百分位数法百分位数法用于任何分布的资料(n150)。当资料为偏态分布时,不能用正态分布法,而用百分位数法得到1 正常值范围双侧1正常值范围:P100/2 P 100(1-/2)单侧1正常值范围上限:P 100Oct 20,2009Oct 20,2009Oct 20,2009第三节第三节 t t分布分布一、抽样误差和样本均数分布一、抽样误差和样本均数分布n抽样误差由于抽样引起的总体参数与样本统计量之间的差异叫抽样误差。总体均数与样本均数之间的差异叫均数抽样误差。Oct 20,2009样本均数分布和抽样误差大小的估
8、计样本均数分布和抽样误差大小的估计Oct 20,2009抽样试验抽样试验某市1999年18岁男生身高服从均数=167.7cm,=5.3cm的正态分布;从XN(167.7,5.32)的正态总体中随机抽样,样本含量nj=10,g=100;共抽100次;Oct 20,2009图图3.1 19993.1 1999年某市年某市1818岁男生身高岁男生身高 N(167.7,5.3N(167.7,5.32 2)的抽样示意的抽样示意=167.7cm=5.3cmX1,X2,X3Xj,167.41,2.74165.56,6.57 168.20,5.36 :165.69,5.09100个个Oct 20,2009样本
9、均数组成一个新的分布特点样本均数组成一个新的分布特点各样本均数未必等于总体均数;各样本均数未必等于总体均数;各样本均数间存在差异;各样本均数间存在差异;样本均数的分布很有规律;样本均数的分布很有规律;u ,100个样本均数的均数为个样本均数的均数为167.69cm,而原总体均数为而原总体均数为167.7cm u样本均数的变异范围较原变量的变异范围大大缩小;样本均数的变异范围较原变量的变异范围大大缩小;标准差为标准差为1.69(5.3);Oct 20,2009中心极限定理若若 服从正态分布,则服从正态分布,则 服从正态分布;服从正态分布;若若 不服从正态分布,不服从正态分布,n较大则较大则 服从
10、正服从正态分布;态分布;n较小,较小,为非为非正态分布;正态分布;Oct 20,2009标准误:估计抽样误差大小的指标标准误:估计抽样误差大小的指标标准误标准误(standard error,SE):样本统计量的标准差;样本统计量的标准差;样本均数的标准误样本均数的标准误(standard error of mean,SEM):;样本均数的标准误的估计值:样本均数的标准误的估计值:Oct 20,2009例例 20002000年某研究者随机调查某地健康成年年某研究者随机调查某地健康成年男子男子2727人,得到血红蛋白含量的均数为人,得到血红蛋白含量的均数为125g/L125g/L,标准差为标准差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生统计学 基本分布 卫生 统计学 基本 分布
限制150内