最新区间估计和假设检验PPT课件.ppt
2内容内容假设检验假设检验2可信区间与假设检验的关系可信区间与假设检验的关系3STATA命令命令4区间估计区间估计19假设检验假设检验(hypothesis testing)v样本均数与总体均数不等或两样本均数不等,有样本均数与总体均数不等或两样本均数不等,有两种可能:两种可能: 由抽样误差所致由抽样误差所致 两者来自不同的总体两者来自不同的总体 假设检验假设检验是用来判断样本与样本,样本与总体的差异是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法是由抽样误差引起还是本质差别造成的统计推断方法10总体总体随机抽样随机抽样不是抽样误差?不是抽样误差?即:即:0?X样本样本总体总体0 = 0?即:抽样误差?即:抽样误差?假设检验问题假设检验问题总体总体总体总体X总体总体总体总体0X总体总体不是抽样误差?不是抽样误差?即:即:0?总体总体0X总体总体 = 0?即:抽样误差?即:抽样误差?不是抽样误差?不是抽样误差?即:即:0?总体总体0X总体总体11总体总体2 2样本样本2随随机机抽抽样样样本均数不等的原因样本均数不等的原因统计推断统计推断抽样误差抽样误差即:即: 1= 2 ?样本样本1假设检验问题假设检验问题总体总体1 121XX 不是抽样误差不是抽样误差即:即: 12 ?12假设检验一般思想v小概率思想是指小概率事件(小概率思想是指小概率事件(P0.01P0.01或或P0.05P0=72为真,在大多数情况下, 应该远离72, 应该比较大。注意:X的总体均数不一定为72,只有H0为真时,X的总体均数为72,726/25XtXX726/25Xt72X 即:才是抽样误差72X 即:不一定是抽样误差72X 即:才是抽样误差72X 即:不一定是抽样误差726/25Xt72X 即:才是抽样误差72X 即:不一定是抽样误差X726/25Xt72X 即:才是抽样误差72X 即:不一定是抽样误差726/25XtX726/25Xt72X 即:才是抽样误差72X 即:不一定是抽样误差X726/25XtX726/25Xt72X 即:才是抽样误差72X 即:不一定是抽样误差26样本均数与总体均数比较样本均数与总体均数比较可以证明:当0为真时,检验统计量服从自由度为24的t分布(即:df=24),查t分布表,临界值t0.025=2.064,检验统计量t=3.52.064是小概率事件,对于一次随机抽样而言,一般是不会发生的,因此拒绝0,并且可以认为该山区成年男性的脉搏均数高于一般成年男性。27定义值和应用定义值和应用v 以下以单侧检验为例:v 即:在0为真的情况下,检验统计量大于样本计算的统计量数值的概率。也就是值=样本统计量数值开始的尾部面积(示意见图)。v 意义:如果t检验统计量样本值t=t0.05,则P=t0.05尾部的面积,故=0.05。值值=P(检验统计量检验统计量检验统计量样本值检验统计量样本值0)28定义值和应用定义值和应用v 如果检验统计量样本值tt0.05(u值比U0.05更右侧),则P=t尾部的面积t0.05尾部的面积,则P0.05。v 如果检验统计量样本值tt0.05尾部的面积,则P0.05。综合上述,综合上述,P 检验统计量值检验统计量值临界值临界值,不拒绝不拒绝H0 。 P临界值,拒绝临界值,拒绝H0。29值示意图值示意图在实际研究中,只需计算值并判断是否在实际研究中,只需计算值并判断是否P 决定是否拒绝决定是否拒绝0。30假设检验的基本步骤假设检验的基本步骤 若若P值小于预先设定的检验水准值小于预先设定的检验水准 ,则,则H0成立的可能性成立的可能性小,即拒绝小,即拒绝H0。 若若P值不小于预先设定的检验水准值不小于预先设定的检验水准 ,则,则H0成立的可能成立的可能性还不小,还不能拒绝性还不小,还不能拒绝H0。 P值的大小一般可通过查阅相应的界值表得到。值的大小一般可通过查阅相应的界值表得到。31定义值和应用定义值和应用v 确定概率,作出判断确定概率,作出判断 以自由度v=n-1查t界值表,0.025P 1 v =0.05v 计算计算t检验统计量检验统计量v 查查t检验的单侧界值检验的单侧界值 ,如果检验统计量,如果检验统计量v 则拒绝则拒绝H0,反之不能拒绝,反之不能拒绝H0。v 单侧的单侧的P值值=t分布中大于分布中大于t的右侧尾部面积的右侧尾部面积nSXt/00.05,1nt0.05tt33两类错误两类错误 H0是真的 H1是真的 拒绝H0的概率 (称为I类错误) 1 接受H0的概率 1 (称为II类错误) 34两类错误示意图两类错误示意图35检验效能检验效能H1是真的,实际拒绝是真的,实际拒绝H0的概率的概率= 1- 称为称为Power,又称为检验效能又称为检验效能36进行假设检验应注意的问题进行假设检验应注意的问题v做假设检验之前,应注意资料本身是否有可比性。v当差别有统计学意义时应注意这样的差别在实际应用中有无意义。v根据资料类型和特点选用正确的假设检验方法。v根据专业及经验确定是选用单侧检验还是双侧检验。37进行假设检验应注意的问题进行假设检验应注意的问题v当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的概率预先是知道的,即检验水准那么大;v当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。v当第一类错误增大时,第二类错误减小。38进行假设检验应注意的问题进行假设检验应注意的问题v判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。v报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围。39进行假设检验应注意的问题进行假设检验应注意的问题vt检验和u检验就是统计量为t,u的假设检验,两者均是常见的假设检验方法。 当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。 当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布) 当x为未知分布时应采用秩和检验。40可信区间与假设检验的关系可信区间与假设检验的关系v不同:不同: 可信区间可信区间量的问题量的问题 假设检验假设检验质的问题质的问题可信区间亦可用于回答假设检验的问题可信区间亦可用于回答假设检验的问题可信区间比假设检验提供更多的信息可信区间比假设检验提供更多的信息可以回答有无统计学意义,还可回答有无实际意义可以回答有无统计学意义,还可回答有无实际意义41可信区间与假设检验的关系可信区间与假设检验的关系42STATA命令命令正态分布总体均数的正态分布总体均数的9595可信区间可信区间命令为:命令为:cii cii 样本量样本量 样本均数样本均数 样本标准差样本标准差例4.1 cii 12 0.896 0.0549090可信区间可信区间例4.2 cii 110 121.72 4.74,level(90) level 括号中的数字表示可信度44 结束语结束语