单变量推论统计假设检验精选PPT.ppt
单变量推论统计假设检验第1页,此课件共28页哦第一节 基本概念及原理一、简单说明先成立一个关于总体情况的假设,继而抽取一个随机样本,然后用样本的统计值来验证假设。如:经验认为我国城市妇女的平均生育年龄大概为25岁,于是成立这样的假设:假设我国城市妇女的平均生育年龄大概为25岁。然后随机抽5000名城市女性,调查他们的结婚年龄,然后根据样本的这一统计值来验证假设(即:总体是不是这样)。第2页,此课件共28页哦二、H0和H1虚无假设、原假设、=研究假设、备择假设、写法:1:双侧,2:单侧,(左侧)3:单侧,(右侧)比较2、3种写法与第1种写法的不同之处。说明为什么。(本节结束时再介绍)第3页,此课件共28页哦三、基本原理社会现象:随机性和非确定性,但又具有规律性。小概率原理:人们习惯于把概率很小的事件,当作在一次观察中不可能出现的事件。假设检验的基本思想:在小概率的情况下检验原假设:在一次观察中出现了小概率事件H1成立,那么我们就否定这一事件是小概率事件的说法,即认为这一事件是可能发生的。如保定市的治安情况。第4页,此课件共28页哦例如:在a=0.05小概率的情况下,检验H0:总体中u=70的正确性。途径是利用抽样资料。结果有二:成立或者不成立(u70),成立的话就接受总体中u=70,不成立就认为其原假设的对立面:u70成立。因为在一次具体的观察中不会发生小概率事件,既然发生了就说明它的概率未必小,真实存在的可能性则很大。(基本原则:直接检验H0,间接检验H1。)第5页,此课件共28页哦四、几个重要概念1、否定域:抽样分布中一端或者两端的小区域,如果样本的统计值落在这个区域里面就否定H0。2、接受域:除否定域外的其他区域,也就是置信区间的区域。3、显著度:否定域在整个抽样分布中所占的比例。也就是样本统计值落在否定域内的机会。用a表示。4、临界值:将否定域与接受域分开的那一点的Z值。常用或者或者-或者-表示。5、相伴概率:Z值所对应的尾部累积概率称为Z值的相伴概率,用p表示。第6页,此课件共28页哦五、一端与两端检验一端检验:否定域只在概率分布曲线的一端。两端检验:否定域分布在概率分布曲线的两端。注意:a一定的情况下,两端检验比一端检验更难否定H0。第7页,此课件共28页哦第二节假设检验的步骤和两类错误一、步骤1、写出假设。包括原假设和研究假设。2、根据样本情况,计算在原假设成立的情况下,样本统计值所对应的Z值。3、结合给出的显著度a的大小,写出临界值与Z值作比较,看到底落在否定域还是接受域。4、结合以上的计算写出结果。第8页,此课件共28页哦二、两类错误1、第一类错误(甲种误差):弃真。(H0为真,我们却错误地认为它错了,拒绝了它,以为它落在了否定域这一阴影区域中,因为阴影部分的总面积为a,因此发生第一类错误的最大的可能性为a。)2、第二类错误(乙种误差):取伪。(H0为伪,我们却错误地认为它是真的,接受了它,以为它落在了空白区域中。用表示,其数值是不确定的,随着真实和原假设中的。的偏离程度而变化,=-。越小,的数值就越大。)可参看卢淑华P284。第9页,此课件共28页哦总结:1、甲种误差与乙种误差是对立的,成反比的。a越大,甲种误差越大。但接受域会越小,因此Z值落在接受域可能性较小,所以乙种误差小。2、n确定的情况下,不能同时减小甲、乙两种误差,如果想在若干程度上同时减少两者,方法是加大样本。第10页,此课件共28页哦3、检定力:检定法能准确测出“H0是正确的”的能力。检定力+=1,即检定力=1-,指的是犯第二种错误的概率,因此对于固定的样本容量,检验能够否定错误假设的能力越大(犯第二类错误越小),其相对检验力越大。参数检定法的检定力大于非参数检定法。非参数检定法:使用时不需要假定总体满足正态分布,同时也不是检验总体分布的某些参数(如均值、比例、方差等),而是检验总体某些有关的性质,不要求变量是定距层次的检定。方法。第11页,此课件共28页哦第三节单总体假设检验一、均值的检验1、大样本情况Z检验,要求n30。公式为Z=。例:为了验证统计报表的正确性,我们做了一个n=50个人的抽样调查,发现人均收入的结果有:=871元,S=21元,问:在a=0.05时,统计报表中的人均收入=880元是否正确?解:三种方法求。第12页,此课件共28页哦2、小样本情况。(n30)1)总体为正态分布,且已知,则Z检验。公式为:2)总体为正态分布,且未知,则t检验。公式为:例:已知人的初婚年龄服从正态分布,根据9个人的抽样调查,=23.5岁,S=3岁,问:是否可认为该地区平均初婚年龄已超过20岁(a=0.05)?解:第13页,此课件共28页哦二、大样本成数(比例)的检验np5,n(1-p)5Z检验,公式为:例:在全区随即抽取了150名工人,发现满意工作环境的比例为45%,问:1)a=0.05时,可否认为全区满意工作环境的人超过35%?2)a=0.005时,可否认为全区满意工作环境的人超过35%?第14页,此课件共28页哦作业:1、课本七A。(要求:用三种方法求解)以下题目要求任选一法求解。2、某城市居民彩电拥有率为60%,现根据n=100的抽样调查,彩电的拥有率为62%,问:能否认为彩电的拥有率有所增长?(a=0.05)(注意:研究假设的写法)3、资料显示,工人家庭平均子女数为2.5人,现做n=100名知识分子的抽样调查,发现=2.1人,S=1.1人,问:a=0.05时,知识分子的家庭平均子女数少于工人家庭子女数吗?第15页,此课件共28页哦4、根据某摊贩的上报,其平均营业额为每天55元,经6天的抽查发现,其营业额(设满足正态分布)为:59.2,68.3,57.8,56.5,63.7,57.3,问:原摊贩的上报数字是否可信?(a=0.05)第16页,此课件共28页哦第四节二总体假设检验一、总体均值差(1-2)的假设检验1、大样本n1+n2100Z检验,公式为:2、小样本n1+n21001)1和2已知,Z检验,公式为:2)1和2未知,t检验,公式为:第17页,此课件共28页哦二、大样本成数差(12)的检验Z检验,公式为:例:某校从住校的小学生中随机抽查了800名,发现平均学习成绩=520分,S=40分;从不住校的小学生中随机抽查1000名,发现平均学习成绩=505分,S=50分,问:1)a=0.05时,二者的学习成绩是否有差别?2)如有差别,哪种方式更好些?(a=0.05)解:三种方法 第18页,此课件共28页哦例:已知城市、农村人们的初婚年龄服从正态分布,分别抽取一个n=20,n=25的农村、城市青年的样本,发现在农村青年中,平均初婚年龄为22岁,S=3岁;城市青年平均初婚年龄26岁,S=5岁,问:是否可以认为农村青年平均初婚年龄低于城市?(a=0.05)第19页,此课件共28页哦例:从AB两厂分别抽取一个随机样本,调查其对工作环境是否满意,数值如下:n1=150,n2=200,p1=82%,p2=51%。求:a=0.01时,两厂工人对工作环境的满意程度是否相同?第20页,此课件共28页哦第五节配对样本的假设检验一、何为配对样本?配对样本或称非独立样本,相关样本,它实际上严格来说应该只有一个样本,但样本中的每一个个体都研究两次。例如某农村社区成员在经济体制改革前后的生活水平的变化。所以可见,配对样本的关键在于除了你要研究的变量之外,其他的变量都一致。但是有时候在某些情况下,无法做到对同一个被访者在两种情况下进行观察。例如,社工本科生的性别与专业满意度之间的关系这一课题,严格来说,应该是用同一个样本,在男性时调查其专业满意度,在女性时再调查其专业满意度,然后做比较。这个显然无法做到。因此我们这个时候只能采用两个样本,但对其样本中的个体,除了研究的变量之外,应做到其他变量如文化程度、家庭背景、年龄。等都大体一致,以达到配对的目的。第21页,此课件共28页哦需要注意的是:在非独立样本(配对样本)中,首先配对样本一般很少,因为计算中是一个个做比对的,也不可能太多,所以一般是小样本。(n30)分两种:1)单一实验组实验2)一实验组与一控制组的实验。单一实验组实验见课本171页。例:我们要研究某项计划生育宣传是否能减少男青年的理想儿女数目,因此从某个农村中抽取了6名男青年来研究,使他们参加该项计划生育宣传的活动,这六名青年(ABCDEF)在参加前的理想儿女数目X1和参加后的理想儿女数目X2如下图所示,问:a=0.05时,此项宣传可以减少男青年的理想儿女数目吗?第22页,此课件共28页哦个案X1X2X1-X2A431B312C220D12-1E624F211第23页,此课件共28页哦注意:m指的是对数,而不是样本数。因为配对样本包括2种情况,1)一个样本,前后测两次(m=n)2)两个样本,成立实验组和控制组。(m=n/2)为什么不能用均值差检验?因为n个样本不是全部独立抽取的,由于两两配对,实际上两个样本中只有n/2个具有独立性的单位。因此如果把每一个配对当作一个单位,才能合理应用统计检验。第24页,此课件共28页哦作业:1、假定实施一种新教学法有助于提高儿童的学习成绩,现将20名儿童两两匹配成对,分成一个实验组和一个控制组,然后对实验组实施新教学法两年,下表列示了控制组与实验组前测、后测的所有10组数据,试在0.05的显著度水平上进行检验。第25页,此课件共28页哦序号控制组实验组前测后测前测后测1234567891072654855815056647769756857647659595575786661425576526065676477754963876857747968第26页,此课件共28页哦注意:实验组:后测-前测=前测后测差控制组:后测-前测=前测后测差前测后测差(实验组)-前测后测差(控制组)=实验效应d第27页,此课件共28页哦1、为了了解大学生对不包分配的看法,对文科100名学生的抽样调查中,有45人表示赞成,对理科100名学生的抽样调查中,有63人表示赞成。问:文、理科学生赞成的比例是否有显著性差异?(a=0.05)2、为了研究距离城市距离对农村现代化观念的影响,对近郊农村12名居民进行了抽样调查,其现代化观念平均得分为6.8,标准差为1.5,对远郊农村12名居民进行了抽样调查,其现代化观念平均得分为5.3,标准差为0.9。问:近郊农村的现代化观念是否高于远郊农村?(a=0.05)第28页,此课件共28页哦