总体均数的估计和假设检验 .ppt
总体均数的估计和假设检验 现在学习的是第1页,共54页第一节 均数的抽样误差与标准误一、概念一、概念1.统计推断统计推断 在医学研究中,通常在总体中随机抽取一定数量观察单位作为样本进行抽样研究,然后由样本信息推断总体特征,这一过程称为统计推断。2.均数的抽样误差:均数的抽样误差:由抽样造成的样本均数与总体均数的差异。3.均数的标准误:均数的标准误:反映均数抽样误差大小的指标。意义:意义:标准误越大,抽样误差越大。样本均数代表总体均数的可靠性越差。现在学习的是第2页,共54页n若某市1999年12岁男生身高总体均=138.7cm,现在随机抽取一个200例12岁男孩的样本,计算身高的样本均数得139.6cm,两均数之差即为抽样误差。若再次随机抽取200例12岁男孩身高,由于个体差异,其平均身高不一定是139.6cm,也不大可能等于该地12岁男孩身高的总体均数。从上例说明:抽样误差是不可避免的,但抽样误差具有一定的规律性。数理统计学证明:若从正态总体N(,2)中,反复多次随机抽取样本含量固定为n的样本(n足够大),那么这些样本均数 也服从正态分布。现在学习的是第3页,共54页n参数估计参数估计 是指用样本指标值(统计量)推断总体指标值(参数)。方法有点估计和区间估计。1.1.点估计点估计 就是用相应样本统计量直接作为其总体参数的估计值。2.2.区间估计区间估计 是按预先给定的概率所确定的包含未知总体参数的一个范围,该范围称为参数的可信区间或置信区间。第二节 总体均数的估计现在学习的是第4页,共54页一一.假设检验假设检验 也称显著性检验。它是利用小概率反证法思想,从问题的对立面出发间接判断要解决的问题是否成立。然后在对立面成立的条件下计算检验统计量,最后获得P值来判断。二二.基本步骤基本步骤第三节 假设检验的基本步骤及注意事项现在学习的是第5页,共54页 (1 1)无效假设:又称检验假设)无效假设:又称检验假设/零零/原假设原假设 符号为H0,即样本均数所代表的总体均数与假设的总体均数0相同,记为H0:=0 或-0=0(若不拒绝若不拒绝H H0 0 ,是由于抽样误差所致,是由于抽样误差所致)(2 2)备择假设:又称对立假设)备择假设:又称对立假设 符号为H1,它是在拒绝H0的情况而接受的假设,即样本的均数所代表的总体均数与假设的总体均数0不同,记为H1:0 或0或,不拒绝H0,无统计学意义(统计结论),还不能认为不同或不等(专业结论)下结论时,对H0只能说:拒绝或不拒绝;而对H1只能说:接受2 2、选择检验方法和统计推断分析、选择检验方法和统计推断分析现在学习的是第7页,共54页1.要有严格的研究设计2.不同资料应选择不同检验方法3.正确理解“显著性”一词的含义4.结论不能绝对化5.统计“显著性”与医学、临床、生物学“显著性”6.可信区间与假设检验的区别和联系三三.假设检验的注意事项假设检验的注意事项现在学习的是第8页,共54页第四节 t检验和u检验n两种检验的关系两种检验的关系(1)计量资料的假设检验中,最为简单、常用的方法是t检验和u检验。(2)当样本含量n较小时(如n60),或n虽小但总体标准差已知。现在学习的是第9页,共54页 例:根据大量调查,已知健康成年男子的脉例:根据大量调查,已知健康成年男子的脉搏均数为搏均数为7272次次/分。某医生在某山区随机调查分。某医生在某山区随机调查3030名健康男子,求得脉搏均数为名健康男子,求得脉搏均数为74.274.2次次/分,分,标准差为标准差为6.56.5次次/分。能否认为该山区的成年男分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?子的脉搏均数高于一般成年男子的脉搏均数?t t检验的类型检验的类型现在学习的是第10页,共54页1 1、单个样本、单个样本t t检验检验 是指样本均数代表的总体均数和已知总体均数的比较。如前例资料进行t检验。已知0=72次/分,=74.2次/分,S=6.5次/分,n=30,由于已知0,故选用单样本t检验。建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:=0,山区成年男子平均脉搏数与一般成年男子相同 H1:0,山区成年男子平均脉搏数与一般成年男子不同=0.05现在学习的是第11页,共54页 计算检验统计量计算检验统计量 在=0成立的前提条件,计算统计量为:本例 确定确定P P值,做出推断结论值,做出推断结论(自由度自由度公式:=n-1,在数学上指能够自由取值的变量个数)在数学上指能够自由取值的变量个数)本例自由度=n-1=30-1=29,查表得t0.05(29)=2.045。因t0.05,无统计学意义,按=0.05水准,不拒绝H0,根据现有样本信息,尚不能认为该山区成年男子平均每分钟脉搏数高于一般成年男子。现在学习的是第12页,共54页n例:某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?112,137,129,126,88,90,105,178,130,128,126,103,172,116,125,90,96,162,157,151,135,113,175,129,165,171,128,128,160,110,140,163,100,129,116,127现在学习的是第13页,共54页1、建立数据文件SPSSSPSS操作分析步骤如下操作分析步骤如下现在学习的是第14页,共54页2、统计分析菜单选择现在学习的是第15页,共54页现在学习的是第16页,共54页SPSS程序现在学习的是第17页,共54页SPSS程序3、主要输出结果及解释现在学习的是第18页,共54页SPSS程序3、主要输出结果及解释现在学习的是第19页,共54页练习题练习题n某地区10年前进行人口普查时,13岁男孩平均身高为1.51m。现在抽查了该地区40个13岁男孩的身高如表所示。通过本例得出该地区现在男孩的身高与10年前相比是否有显著差异。现在学习的是第20页,共54页现在学习的是第21页,共54页2 2、配对样品、配对样品t t检验检验 适用于配对设计的计量资料。配对设计资料主要有三种情况:两种同质受试对象分别接受两种处理;同一受试对象或同一样本的两个部分,分别接受两种处理;同一受试对象处理前后的结果比较。基本原理基本原理:假设两种处理的效应相同,即1=2,则1-2=0(即已知总体均数d=0),即检验差数的样本均数 与所代表的未知总体均数d与0的比较。这是两均数间比较的特殊形式。若差数的总体均数不为0,说明两种处理的结果有差异或某种处理有作用。现在学习的是第22页,共54页其检验统计量检验统计量为:式中d为每对数据的差值,为差值的样本均数,为差值的标准差,为差值样本均数的标准误,n为对子数。现在学习的是第23页,共54页例例3-6 3-6 为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里罗紫法测定其结果如表3-3第(1)-(3)栏。问两法测定结果是否不同?现在学习的是第24页,共54页(1)(1)建立检验假设建立检验假设,确定检验水准确定检验水准H0:d=0,即两种方法的测量结果相同H1:d0,即两种方法的测量结果不同=0.05(2)(2)计算检验统计量计算检验统计量本例n=10,d=2.724,d2=0.8483,=d/n=2.724/10=0.2724按公式(3)(3)确定确定P P值,做出推断结论值,做出推断结论 查表t界值表得P0.001。按=0.05水准,拒绝H0,接受H1,有统计学意义。可认为两种方法对脂肪含量的测定结果不同。现在学习的是第25页,共54页SPSSSPSS操作分析步骤如下操作分析步骤如下1、建立数据文件现在学习的是第26页,共54页2、统计分析菜单选择现在学习的是第27页,共54页nSPSS程序现在学习的是第28页,共54页SPSS程序3、主要输出结果及解释现在学习的是第29页,共54页3、主要输出结果及解释现在学习的是第30页,共54页练习题练习题n为分析一种新药对某种地方病的效果,特选取10名病人进行试验,测量服药后血红蛋白的含量如表所示。问该药是否能够引起血红蛋白含量的明显变化?现在学习的是第31页,共54页3 3、两独立样本、两独立样本t t检验检验 适用于完全随机设计的两样本均数的比较。将受试对象完全随机地分配到两组中,每组患者分别接受不同的处理,这时只能进行两独立样本均数的比较。当两样本含量较小(如n160,n2 t0.05(23),P值0.05,差异有统计学意义,按=0.05的水准拒绝H0,接受H1,故可认为两组患者的血糖值总体均数不同。现在学习的是第37页,共54页现在学习的是第38页,共54页1、建立数据文件SPSSSPSS操作分析步骤如下操作分析步骤如下现在学习的是第39页,共54页2、统计分析菜单选择现在学习的是第40页,共54页nSPSS程序现在学习的是第41页,共54页SPSS程序3、主要输出结果及解释现在学习的是第42页,共54页现在学习的是第43页,共54页总体方差不等时的两样本t检验 当量总体方差不等时,两样本均数的比较,可采用近似t检验t检验 方差齐性检验方差齐性检验:由于存在抽样误差,即使两总体方差相等,两样本方差也可能不等。所以要判断两总体方差是否相等,可用方差齐性检验,即F检验,其检验统计量服从F分布,公式为:检验统计量F值为两样本方差之比,若仅为抽样误差的影响,它一般不会偏离1太远。现在学习的是第44页,共54页 求得F值后,查F界值表得P值,按所取的水准做出判断结论。若FF0.05(v1,v2),P0.05拒绝H0,接受H1,可认为两总体方差不具有齐性。若F0.05,可认为两总体方差具有齐性。方差齐性检步骤与前述假设检验的基本步骤相同。例:两组小白鼠,分别饲以高蛋白和低蛋白饲料,例:两组小白鼠,分别饲以高蛋白和低蛋白饲料,4 4周后记周后记录小白鼠体重增加量,如表,问两组动物增重的总体录小白鼠体重增加量,如表,问两组动物增重的总体方差是否相等?方差是否相等?现在学习的是第45页,共54页1、建立检验假设,确定检验水准H0:1=2,高蛋白组和低蛋白组体重的总体方差相同H1:12,高蛋白组和低蛋白组体重的总体方差不同=0.052、计算检验统计量编号高蛋白组体重增加量低蛋白组体重增加量1503624738342374433853936651397433784835951331042371150391243341336现在学习的是第46页,共54页3、确定P值,做出统计推断 自由度v1=12-1=11,v2=13-1=12 查表,F0.05(11,12)=3.34,F F0.05(11,12),故Pt0.05=2.198,得P60),t分布与标准正态分布很相近,则选用大样本u检验;如果有两个以上样本均数要做比较,则应选用方差分析法。单侧检验和双侧检验 假设检验有单侧检验和双侧检验之分。需根据研究目的和专业知识选择适当的方法。若没有相应的依据,一般选用双侧检验。现在学习的是第54页,共54页