总体均数的估计与假设检验(第3章).ppt
《总体均数的估计与假设检验(第3章).ppt》由会员分享,可在线阅读,更多相关《总体均数的估计与假设检验(第3章).ppt(88页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、总体均数的估计与假设检验(第3章) Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life, there is hope。有生命必有希望。有生命必有希望u了解总体特征的最好方法是对总体的每一了解总体特征的最好方法是对总体的每一 个体进行观察、试验,但这在医学研究实个体进行观察、试验,但这在医学研究实 际中往往不可行。际中往往不可行。u对对无限总体无限总体不可能对所有个体逐一观察,不可能对所有个体逐一观察, 对对有限总体有限总体限于人力、财力、物力、时间限于人力、财力、物力、时间 或个体过多等原因,不可能也没必要对所或个体过多等原因
2、,不可能也没必要对所 有个体逐一研究有个体逐一研究(如对一批罐头质量检查如对一批罐头质量检查)。u借助借助抽样研究抽样研究。 u欲了解某地欲了解某地18岁男生身高值的平均水平,岁男生身高值的平均水平, 随机抽取该地随机抽取该地10名男生身高值作为名男生身高值作为样本样本。u由于由于个体变异与抽样个体变异与抽样的影响,抽得的样本的影响,抽得的样本 均数不太可能等于总体均数,造成样本均数不太可能等于总体均数,造成样本统统 计量与总体参数间的差异计量与总体参数间的差异(表现为来自同一表现为来自同一 总体的若干样本统计量间的差异总体的若干样本统计量间的差异),称为,称为抽抽 样误差样误差。u抽样误差是
3、不可避免的。抽样误差是不可避免的。u抽样误差是有规律的。抽样误差是有规律的。1999年某市年某市18岁男生身高值岁男生身高值 XiN(, 2) =167.7cm =5.3cm样本号样本号iXiS 1 167.41 2.74 2 165.56 6.57 3 168.20 5.36 99 169.40 5.57100 165.69 5.09ni = 10样本均数抽样分布具有如下特点:样本均数抽样分布具有如下特点: u各样本均数未必等于总体均数各样本均数未必等于总体均数u各样本均数间存在差异各样本均数间存在差异u样本均数围绕样本均数围绕 =167.69cm呈正态分布呈正态分布u样本均数变异度样本均数
4、变异度( )较原总体个较原总体个 体值变异度体值变异度( = 5.3cm)大大缩小大大缩小cm69. 1SX X中心极限定理中心极限定理(central limit theorem) 从均数为从均数为 、标准差为、标准差为 的总体中独立随机的总体中独立随机抽样,当样本含量抽样,当样本含量n较大时,较大时, 样本均数的分布将趋于正态分布样本均数的分布将趋于正态分布 此分布的均数为此分布的均数为 nX 标准差为标准差为 中心极限定理中心极限定理(central limit theorem) 若若 X i 服从正态分布服从正态分布 则则 服从正态分布服从正态分布 若若 X i 不服从正态分布不服从正
5、态分布 n大大(n60):则:则 近似服从正态分布近似服从正态分布 n小小(n60) 按按u分布原理分布原理StStX,2X,2X , X 双侧双侧1、 未知未知3.641.151110XS 0.05 2,92.262t故该地故该地18岁男生身高均数的岁男生身高均数的95%可信区间为可信区间为(164.35, 169.55)cm。=167.7cm 双尾双尾例例 在例在例3-1中抽得第中抽得第15号样本的号样本的 =166.95(cm),S=3.64(cm), 求其总体均数的求其总体均数的95%可信区间。可信区间。 X166.952.2621.1511=164.35169.55(cm)X,2X,
6、2SX Xuu 或或双侧双侧2、 已知已知或或 未知但未知但n足够大足够大: 例例 某地抽取正常成年人某地抽取正常成年人200名,测得其血名,测得其血清胆固醇均数为清胆固醇均数为3.64 mmol/L,标准差为,标准差为1.20mmol/L,估计该地正常成年人血清胆,估计该地正常成年人血清胆固醇均数固醇均数95%可信区间。可信区间。 法,用近似正态分布的方60)/(81. 347. 30849. 096. 164. 320020. 196. 164. 3NLmmol三、可信区间的确切含义三、可信区间的确切含义u从从1999年某市年某市18岁男生身高值总体岁男生身高值总体N(=167.7cm,
7、=5.3cm)中随机抽取中随机抽取100个样本个样本计算了计算了100个估计个估计的的95%CIu其中有其中有95个个CI包含包含了了 有有5个不包含个不包含 =167.7cm20号号 161.00165.57 31号号 161.17167.3354号号 168.05171.00 76号号 167.71174.8482号号 167.98174.27 -2 -1 0 1 2 来自来自N(0,1)的的100个样本所计算的个样本所计算的95%可信区间示意可信区间示意 u正确性正确性:可信度:可信度1,即区间包含总体参数,即区间包含总体参数 的理论概率大小,愈接近的理论概率大小,愈接近1愈好。愈好。u
8、精确性精确性:区间的宽度,区间愈窄愈好。区间的宽度,区间愈窄愈好。u当样本含量为定值时,上述两者互相矛盾。当样本含量为定值时,上述两者互相矛盾。 若只顾提高可信度,则可信区间会变宽。若只顾提高可信度,则可信区间会变宽。评价可信区间估计的优劣:评价可信区间估计的优劣:四、可信区间与参考值范围的区别四、可信区间与参考值范围的区别u可信区间用于估计可信区间用于估计总体参数总体参数,总体参数只,总体参数只 有一个有一个 。u参考值范围用于估计参考值范围用于估计个体值个体值的分布范围,的分布范围, 个体值有很多个体值有很多 。u95%可信区间中的可信区间中的95%是是可信度可信度,即所求可,即所求可 信
9、区间包含总体参数的可信程度为信区间包含总体参数的可信程度为95%。u95%参考值范围中的参考值范围中的95%是一个是一个比例比例,即,即 所求参考值范围包含了所求参考值范围包含了95%的正常人。的正常人。例例 某医生测量了某医生测量了36名从事铅作业男性工人的名从事铅作业男性工人的血红蛋白含量,算得其均数为血红蛋白含量,算得其均数为130.83g/L,标,标准差为准差为25.74g/L。问从事铅作业工人的血红蛋。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值白是否不同于正常成年男性平均值140g/L?u样本均数与总体均数间差异的原因:样本均数与总体均数间差异的原因: 1.总体均数不同总
10、体均数不同? 2.总体均数相同,差异由抽样误差造成总体均数相同,差异由抽样误差造成?u统计推断方法统计推断方法 假设检验假设检验(hypothesis test)1.进行检验假设进行检验假设 假设样本来自某一特定总体假设样本来自某一特定总体2.确定检验水准确定检验水准 确定最大允许误差确定最大允许误差3.选定检验方法计算检验统计量选定检验方法计算检验统计量 计算样本与总体的偏离程度计算样本与总体的偏离程度4.计算与统计量对应的计算与统计量对应的P值值5.作出结论作出结论 根据小概率反证法思想作出推断根据小概率反证法思想作出推断假设检验一般步骤假设检验一般步骤 t 检验检验(Students t
11、-test) 设计设计 完全随机设计单样本完全随机设计单样本 完全随机设计两样本完全随机设计两样本 配对设计配对设计 要求要求 1.n较小较小(单组单组60或两组合计或两组合计60) 2.样本随机地取自样本随机地取自正态总体正态总体 3.两样本均数比较时所对应两总体两样本均数比较时所对应两总体 方差相等方差相等(homogeneity of variance)例例 某医生测量了某医生测量了36名从事铅作业男性工人的名从事铅作业男性工人的血红蛋白含量,算得其均数为血红蛋白含量,算得其均数为130.83g/L,标,标准差为准差为25.74g/L。问从事铅作业工人的血红蛋。问从事铅作业工人的血红蛋白
12、是否不同于正常成年男性平均值白是否不同于正常成年男性平均值140g/L?一、单样本一、单样本t 检验检验1.建立检验假设,确定检验水准建立检验假设,确定检验水准H0: = 0=140g/L 铅作业男性工人的平均血红蛋铅作业男性工人的平均血红蛋 白含量与正常成年男性的相等白含量与正常成年男性的相等H1: 0 =0.05 351361n138. 23674.2514083.130nSXSXt0X0 2.计算检验统计量计算检验统计量3.确定确定P值,作出推断结论值,作出推断结论 |2.138| t0.05/2,35=2.030 P 2 或或 1 2 单侧检验单侧检验H0: 1= 2 H1: 1 2
13、双侧检验。双侧检验。单双侧检验主要根据专业知识预先确定。单双侧检验主要根据专业知识预先确定。双侧检验较保守和稳妥。双侧检验较保守和稳妥。u检验水准检验水准:预先规定的拒绝:预先规定的拒绝假设假设H0时的最时的最大允许误差,它确定了小概率事件标准。大允许误差,它确定了小概率事件标准。在实际工作中常取在实际工作中常取0.05,但并非一成不变。,但并非一成不变。u应根据变量和资料类型、设计方案、统应根据变量和资料类型、设计方案、统 计推断的目的、方法的适用条件等选择计推断的目的、方法的适用条件等选择 检验统计量。检验统计量。u所有检验统计量都是在所有检验统计量都是在H0成立的前提条成立的前提条 件下
14、计算出来的。件下计算出来的。u检验统计量大小反映样本与总体的偏离检验统计量大小反映样本与总体的偏离 程度(如程度(如t值反映样本均数与总体均数值反映样本均数与总体均数 的偏离程度,以标准误进行标准化)的偏离程度,以标准误进行标准化)2.计算检验统计量计算检验统计量 uP值是决策的依据值是决策的依据uP的含义是指从的含义是指从H0规定的总体中随机抽样,规定的总体中随机抽样,其检验统计量等于及大于现有样本的检验其检验统计量等于及大于现有样本的检验统计量的概率。即从统计量的概率。即从H0假设总体中随机抽假设总体中随机抽到差别至少等于现有样本差别的机会到差别至少等于现有样本差别的机会。u根据获得的事后
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 总体 估计 假设检验
限制150内