研究生医学统计学-概率分布.ppt
《研究生医学统计学-概率分布.ppt》由会员分享,可在线阅读,更多相关《研究生医学统计学-概率分布.ppt(106页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2022/12/143.3.常用概率分布常用概率分布 l正态分布正态分布l二项分布二项分布lPoisson Poisson 分布分布2022/12/143.1 3.1 正态分布正态分布 n正态分布的图形正态分布的图形n正态分布的特征正态分布的特征n正态曲线下面积分布的规律正态曲线下面积分布的规律n标准正态分布标准正态分布n正态分布的应用正态分布的应用2022/12/14一、一、正态分布曲线正态分布曲线(normal distribution curve)1.1.正态分布的图形正态分布的图形2022/12/14频数分布逐渐接近正态分布示意图频数分布逐渐接近正态分布示意图 2022/12/14图图
2、 体模体模“骨密度骨密度”测量值的分布接近正态分布示意图测量值的分布接近正态分布示意图(频率密度(频率密度=频率频率/组距)组距)面积的意义2022/12/14正态分布曲线图示正态分布曲线图示2022/12/14n n该曲线表现为中间高,两边低,左右对称,略该曲线表现为中间高,两边低,左右对称,略显钟形,类似于数学上的正态分布曲线。因而显钟形,类似于数学上的正态分布曲线。因而这种分布也称为正态分布。这种分布也称为正态分布。n n正态曲线正态曲线(normal curve)(normal curve)是一条高峰位于中央,是一条高峰位于中央,两侧完全对称,而且逐渐降低,两端在无穷远两侧完全对称,而
3、且逐渐降低,两端在无穷远处与底线相靠,但永远不与横轴相交的钟型曲处与底线相靠,但永远不与横轴相交的钟型曲线。线。n n正态曲线是有固定函数式的一条曲线。因为频正态曲线是有固定函数式的一条曲线。因为频率的总和等于率的总和等于1 1,因此横轴上曲线下的总面积,因此横轴上曲线下的总面积为为100100或或1 1,其面积分布有一定的规律性,其面积分布有一定的规律性。2022/12/14正态分布又称正态分布又称Gauss分布,是医学上分布,是医学上和生物界常见的分布形式。和生物界常见的分布形式。是指变量值以均数为中心,左右两是指变量值以均数为中心,左右两侧完全对称,靠近均数两侧的频数侧完全对称,靠近均数
4、两侧的频数较多,而远离均数两侧的频数逐渐较多,而远离均数两侧的频数逐渐减少。减少。2022/12/14 2.2.正态分布的概率密度函数正态分布的概率密度函数2022/12/14二、正态分布的特征二、正态分布的特征n n正态分布以均数为中心(正态分布以均数为中心(=),左右对称),左右对称;n n正态分布有两个参数,即均数正态分布有两个参数,即均数和标准差和标准差,正,正态分布记作态分布记作XN(,2),决定曲线在横轴决定曲线在横轴上的位置上的位置,决定曲线的形状。决定曲线的形状。n n正态曲线在横轴上方均数处最高正态曲线在横轴上方均数处最高(在在=处取得处取得密度函数的最大值密度函数的最大值)
5、,表现为钟型曲线表现为钟型曲线n n正态正态曲线下总面积为曲线下总面积为1 1,正态曲线下的面积分正态曲线下的面积分布有一定规律。布有一定规律。三、面积规律2022/12/14正态分布正态分布 1 2 3 不同不同均数均数2022/12/14正态分布正态分布不同标准差2022/12/14a.尖峭峰尖峭峰b.正态峰正态峰c.平阔峰平阔峰正态分布的特征2022/12/14三、正态曲线下面积分布规律三、正态曲线下面积分布规律1.1.正态曲线下面积的意义:正态曲线下面积的意义:表示该区间(表示该区间(x x1 1,x x2 2)包含的观察例)包含的观察例数占总例数的百分数或变量值落在数占总例数的百分数
6、或变量值落在该区间的概率。该区间的概率。频数分布图示2022/12/14正态曲线下面积示意图正态曲线下面积示意图x1 x22022/12/142022/12/14图图图图3-3 3-3 正态分布的概率密度函数与分布函数正态分布的概率密度函数与分布函数正态分布的概率密度函数与分布函数正态分布的概率密度函数与分布函数2022/12/14图图3-4 正态分布的概率正态分布的概率2022/12/142.正态正态曲线下面积的分布规律曲线下面积的分布规律2022/12/142022/12/142022/12/14四、标准正态分布四、标准正态分布 (standard normal distribution)
7、n n标准正态分布变换标准正态分布变换n n标准正态分布曲线下面积的分布规律标准正态分布曲线下面积的分布规律n n标准正态分布表的使用标准正态分布表的使用2022/12/141、标准正态分布变换、标准正态分布变换n n一般正态分布为一个分布族一般正态分布为一个分布族:N N(,2 2)。为为了应用方便,可以进行变量变换,正态分布了应用方便,可以进行变量变换,正态分布就变换为标准正态分布。就变换为标准正态分布。n n标准正态分布的标准正态分布的=0,=1,记为记为 N N(0,1)(0,1)2022/12/14n n2022/12/14z(z)2022/12/14(z)2022/12/14z(z
8、)(z)02022/12/141.961.960.0250.0252022/12/142 2、标准正态曲线下面积分布规律、标准正态曲线下面积分布规律0-11-1.961.96-2.582.5868.27%95.00%99.00%2022/12/14正态曲线与标准正态曲线的面积分布规律正态曲线与标准正态曲线的面积分布规律 2022/12/142022/12/143、标准正态分布表的使用、标准正态分布表的使用附表附表附表附表c1c1c1c1标准正态分布表标准正态分布表标准正态分布表标准正态分布表p559p559p559p559查表求面积时注意:查表求面积时注意:查表求面积时注意:查表求面积时注意:
9、表中曲线下面积为表中曲线下面积为表中曲线下面积为表中曲线下面积为-到到到到z z的面积;的面积;的面积;的面积;当当当当、已知时,先进行变量变换求得已知时,先进行变量变换求得已知时,先进行变量变换求得已知时,先进行变量变换求得z z值,再值,再值,再值,再 查表;查表;查表;查表;当当当当、未知且样本含量足够大时,可用未知且样本含量足够大时,可用未知且样本含量足够大时,可用未知且样本含量足够大时,可用 和和和和S S S S 分别代替分别代替分别代替分别代替和和和和,求得,求得,求得,求得z z的估计值,再查表。的估计值,再查表。的估计值,再查表。的估计值,再查表。曲线下对称于曲线下对称于曲线
10、下对称于曲线下对称于0 0 0 0的区间面积相等;的区间面积相等;的区间面积相等;的区间面积相等;曲线下横轴上的总面积为曲线下横轴上的总面积为曲线下横轴上的总面积为曲线下横轴上的总面积为100%100%100%100%或或或或1 1 1 1。2022/12/14五、正态分布的应用五、正态分布的应用(一)(一)确定医学参考值(正常值)范围确定医学参考值(正常值)范围(二)(二)质量控制图。警戒限质量控制图。警戒限 ,控制限,控制限(三)统计方法的理论基础。(三)统计方法的理论基础。二项分布2022/12/14vv医学研究中的某些观察指标服从或近似服从正态分布;医学研究中的某些观察指标服从或近似服
11、从正态分布;医学研究中的某些观察指标服从或近似服从正态分布;医学研究中的某些观察指标服从或近似服从正态分布;vv很多统计方法是建立在正态分布的基础之上的,很多统计方法是建立在正态分布的基础之上的,很多统计方法是建立在正态分布的基础之上的,很多统计方法是建立在正态分布的基础之上的,如如如如t t分布、分布、分布、分布、2 2分布、分布、分布、分布、F F分布都是在正态分布的基础上推演分布都是在正态分布的基础上推演分布都是在正态分布的基础上推演分布都是在正态分布的基础上推演出来的。出来的。出来的。出来的。vv很多其他分布的极限为正态分布。很多其他分布的极限为正态分布。很多其他分布的极限为正态分布。
12、很多其他分布的极限为正态分布。二项分布和二项分布和二项分布和二项分布和PoissionPoission分布样本含量足够大时近似正态分布。分布样本含量足够大时近似正态分布。分布样本含量足够大时近似正态分布。分布样本含量足够大时近似正态分布。2022/12/14医学参考值范围医学参考值范围n1.1.正态分布法正态分布法n2.2.百分位数法百分位数法 3.3.对数正态分布法对数正态分布法2022/12/141.1.医学参考值概念医学参考值概念是指大多数处于相同生理状态下的是指大多数处于相同生理状态下的“正常人正常人”的某项指标(形态、机能及代谢产物等)的某项指标(形态、机能及代谢产物等)数值变化波动
13、的范围。数值变化波动的范围。由于正常个体间存由于正常个体间存在变异、机体内外环境改变,时间、地点、在变异、机体内外环境改变,时间、地点、条件的不同,使这些生理指标有一定的波条件的不同,使这些生理指标有一定的波动范围,因此,实际应用中,一般采用正动范围,因此,实际应用中,一般采用正常值范围常值范围.2022/12/142.用途用途1.划分正常与异常的界限。划分正常与异常的界限。如作诊断如作诊断指标。指标。2.反映某人群的某项指标的动态变化。反映某人群的某项指标的动态变化。如某地不同时期发汞值的正常范围如某地不同时期发汞值的正常范围可反映环境污染的变化或环境保护可反映环境污染的变化或环境保护的效果
14、。的效果。2022/12/143.确定医学参考值范围的方法确定一批样本含量足够大(确定一批样本含量足够大(n100n100)的)的“正常人正常人”或动物作为研究对象。或动物作为研究对象。“正常人正常人”不是指机体任何器官、组织的不是指机体任何器官、组织的形态及机能都正常的人形态及机能都正常的人,而是指排除了影,而是指排除了影响所研究指标的疾病和有关因素对所研究响所研究指标的疾病和有关因素对所研究指标的影响的同质人群。指标的影响的同质人群。2022/12/14根据指标的实际用途确定单、双侧。根据指标的实际用途确定单、双侧。确定百分数范围。确定百分数范围。根据资料的分布特点,选用恰当的界根据资料的
15、分布特点,选用恰当的界值计算方法。值计算方法。2022/12/144.常用参考值范围估计方法常用参考值范围估计方法95%95%正常值范围:正常值范围:同质总体中包含同质总体中包含95%95%的个体的个体值所在的范围。值所在的范围。.正态分布法正态分布法.百分位数法百分位数法.对数正态分布法对数正态分布法2022/12/141)正态分布法适应资料:适应资料:正态或近似正态分布资料。正态或近似正态分布资料。计算:计算:以以95%95%正常值范围为例正常值范围为例n n双侧双侧:n n单侧单侧:2022/12/142 2)百分位数法百分位数法适用资料:适用资料:适用于任意分布类型的资料,适用于任意分
16、布类型的资料,主要用于偏态分布或分布类型不清楚的资主要用于偏态分布或分布类型不清楚的资料。料。计算:计算:以以95%95%正常值范围为例正常值范围为例n n双侧:双侧:P2.5P97.5n n单侧:单侧:P5(下限)(下限)正态分布应用正态分布应用正态分布应用正态分布应用 200200例血铅值频数表及例血铅值频数表及Px计算表计算表 2022/12/142022/12/143 3)对数正态分布法)对数正态分布法适用资料:适用资料:适用于对数正态分布适用于对数正态分布资料。资料。计算:计算:n双侧:双侧:n单侧:单侧:200200例血铅值对数变换后的频数计算表例血铅值对数变换后的频数计算表 20
17、22/12/142022/12/143.2 3.2 二项分布二项分布n二项分布的概念二项分布的概念n二项分布的概率二项分布的概率n二项分布的条件二项分布的条件 n二项分布的均数与标准差二项分布的均数与标准差n二项分布的图形二项分布的图形 n二项分布应用实例二项分布应用实例2022/12/14一、二项分布的概念一、二项分布的概念uu一个袋子里有一个袋子里有5个乒乓球,其中个乒乓球,其中2个黄球,个黄球,3个白球,我们进行摸球游戏,每一次摸到个白球,我们进行摸球游戏,每一次摸到黄球的概率是黄球的概率是0.4,摸到白球的概率是,摸到白球的概率是0.6。uu三个特点:三个特点:1.各次摸球是彼此独立的
18、;各次摸球是彼此独立的;2.每每次摸球只有二种可能的结果,或黄球或白次摸球只有二种可能的结果,或黄球或白球;球;3.每次摸到黄球(或摸到白球)的概率每次摸到黄球(或摸到白球)的概率是固定的。是固定的。uun次中摸到次中摸到x次黄球(或白球)的概率分布次黄球(或白球)的概率分布就是二项分布。就是二项分布。2022/12/14 医学研究中很多现象观察结果是以两分医学研究中很多现象观察结果是以两分类变量来表示的,如阳性与阴性、治愈与类变量来表示的,如阳性与阴性、治愈与未愈、生存与死亡等等。如果每个观察对未愈、生存与死亡等等。如果每个观察对象阳性结果的发生概率均为象阳性结果的发生概率均为,阴性结果的,
19、阴性结果的发生概率均为(发生概率均为(1);而且各个观察对象);而且各个观察对象的结果是相互独立的,那么,重复观察的结果是相互独立的,那么,重复观察n个个人,发生阳性结果的人数人,发生阳性结果的人数x的概率分布为二的概率分布为二项分布。项分布。2022/12/14n n例例 设小白鼠接受某种毒物一定剂量时,其设小白鼠接受某种毒物一定剂量时,其死亡率为死亡率为80,对于每只小白鼠来说,其,对于每只小白鼠来说,其死死亡概率为亡概率为0.8,生存概率为,生存概率为0.2,若每组各用,若每组各用甲乙丙三只小白鼠甲乙丙三只小白鼠做实验,观察每只小白做实验,观察每只小白鼠存亡情况,如果计算生与死的顺序,则
20、鼠存亡情况,如果计算生与死的顺序,则共有共有8种排列方式种排列方式,如果只计生与死的数目,如果只计生与死的数目,则只有则只有四种组合方式四种组合方式,如下表,如下表表2022/12/142022/12/14概率的乘法法则概率的乘法法则 和加法法则和加法法则n n乘法法则乘法法则 :几个独立事件同时发生的概率,等于各几个独立事件同时发生的概率,等于各独立事件的概率之积。独立事件的概率之积。n n加法法则加法法则 :互不相容事件和的概率等于各事件的概互不相容事件和的概率等于各事件的概率之和率之和2022/12/143 3只小白鼠均生存的概率:只小白鼠均生存的概率:P=0.2P=0.2 0.20.2
21、 0.2=0.0080.2=0.0083 3只小白鼠只小白鼠2 2生生1 1死的概率:死的概率:P1=0.2P1=0.2 0.20.2 0.8=0.0320.8=0.032(甲生乙生丙死)(甲生乙生丙死)P2=0.2P2=0.2 0.80.8 0.2=0.0320.2=0.032(甲生乙死丙生)(甲生乙死丙生)P3=0.8P3=0.8 0.20.2 0.2=0.0320.2=0.032(甲死乙生丙生)(甲死乙生丙生)P=0.096P=0.0962022/12/143 3只小白鼠只小白鼠1 1生生2 2死的概率:死的概率:P P1 1=0.2=0.2 0.80.8 0.8=0.1280.8=0.
22、128(甲生乙死丙死)(甲生乙死丙死)P P2 2=0.8=0.8 0.20.2 0.8=0.1280.8=0.128(甲死乙生丙死)(甲死乙生丙死)P P3 3=0.8=0.8 0.80.8 0.2=0.1280.2=0.128(甲死乙死丙生)(甲死乙死丙生)P=0.384P=0.3843 3只小白鼠均死亡的概率:只小白鼠均死亡的概率:P=0.8P=0.8 0.80.8 0.8=0.5120.8=0.5122022/12/142022/12/14n n由于实验是逐只进行,因此实验结果是互由于实验是逐只进行,因此实验结果是互相独立的,如病人的治愈或死亡,性别的相独立的,如病人的治愈或死亡,性别
23、的雌雄,生存死亡,阳性或阴性。雌雄,生存死亡,阳性或阴性。n n根据根据概率的乘法法则概率的乘法法则(几个独立事件发生(几个独立事件发生的概率,等于各独立事件发生的概率之和)的概率,等于各独立事件发生的概率之和),可以算出,可以算出每种排列方式的概率每种排列方式的概率,也可以,也可以得到得到每种组合的概率每种组合的概率,它可以用二项式加,它可以用二项式加以概括,二项式展开的各项就是每种组合以概括,二项式展开的各项就是每种组合的概率。的概率。2022/12/14二项展开式:2022/12/142022/12/14n n二项分布的定义二项分布的定义 :n n从阳性率为从阳性率为的总体中随机抽取观察
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 研究生 医学 统计学 概率 分布
限制150内