假设检验与t检验.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《假设检验与t检验.doc》由会员分享,可在线阅读,更多相关《假设检验与t检验.doc(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第12章 分布类型的检验本章将涉及统计学分析中最为主要的理论之一:假设检验,它是分析统计数据、构建统计模型进行决策支持的基石。12.1 假设检验的基本思想12.1.1问题的提出12.1.2假设检验的基本步骤1. 小概率事件在讨论假设检验的基本思想之前,首先需要明确小概率事件这一概念。衡量一个事件发生与否可能性的标准是概率大小,通常概率大的事件容易发生,概率小的事件不容易发生。习惯上将发生概率很小,如P=0.05的事件称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,因此,如果只进行一次试验,可以视为不会发生。这里需要澄清一个事实:注意上面的表述是“一次试验中小概率事件不应当发生”,
2、这并不表示小概率事件不可能发生,也就是说,这里有一个前提:只进行一次试验,结果应当不会是小概率事件。如果进行多次(可能无穷多)试验,那么小概率事件就肯定会发生,或者说,小概率事件在一次试验中不大可能发生,然而在大量试验中几乎是必然发生的。2.小概率反证法假设检验的基本思想是统计学的“小概率反证法”原理:对于一个小概率事件而言,其对立面发生的可能性显然要大大高于这一小概率事件,可以认为,小概率事件在一次试验中不应当发生。因此可以首先假定需要考察的假设是成立的,然后基于此进行推导,来计算一下在该假设所代表的总体中进行抽样研究得到当前样本(及更极端样本)的概率是多少。如果结果显示这是一个小概率事件,
3、则意味着如果假设是成立的,则在一次抽样研究中竟然就发生了小概率事件!这显然违反了小概率原理,因此可以按照反证法的思路推翻所给出的假设,认为它们实际上是不成立的,这就是小概率反证法原理。假设检验的基本逻辑:先成立一个与H1相对立的H0。各种假设检验方法都是根据H0来成立抽样分布,然后求出H0是正确的可能性。如果我们能证明H0是对的可能性很小,那么就可以据此排除抽样误差的说法,认为H1可能是对的。简言之,假设检验的基本原则是直接检验H0 因而间接地检验H1,目的是排除抽样误差的可能性。否定域,就是抽样分布内一端或两端的小区域,如果样本的统计值落在此区域范围内,则否定虚无假设。显著度(level o
4、f significance)表示否定域在整个抽样分布中所占的比例,也即表示样本的统计值落在否定域内的机会。显著度愈小,便愈难否定虚无假设H0,也即愈难证明研究假设H1是对的。3.假设检验的标准步骤12.1.3 假设检验的两类错误(参见 李沛良社会研究的统计应用p157)第一类错误:弃真错误,型错误 ()第二类错误:存伪错误,II型错误 ()12.1.4假设检验中的其他问题-原假设-备择假设-单侧检验-双侧检验-参数检验-非参数检验 通常参数检验是在已经知道了相关数据的分布形式,只是不了解相应参数取值时采用的检验形式。而如果对相关数据的分布形式也并不了解,就必须先确定数据的分布形式,这样才可以
5、进一步对分布做出更为具体的说明以及解释。第13章 连续变量的统计推断(一) t 检验13.1 t 检验概述13.1.1 t 检验的基本原理在针对连续变量的统计推断方法中,最常用的有t 检验和方差分析(Analysis of Variance, ANOVA)两种,其中t检验是最基本的检验方法,也是统计学中跨里程碑的一个杰作。它最初是由W.S.Gosset 在1908年以笔名“Student”发表的一篇关于t分布的论文中提出的,并从此开始了利用小样本计量资料进行统计推断的先河,迎来了统计学的新纪元。1.均数比较的一个实例这里用一个典型的均数比较实例来引入t检验。例13.1 在CCSS项目中,以项目
6、启动时的2007年4月的数据作为指数基线,基线期指数值为100,随后各期所计算出的指数则代表当期数值相对于“基线”调查数值的变动比例。CCSS中提供了北京、上海、广州三个一线城市的调查数据,现希望考察2007年4月北京、上海、广州三个一线城市的消费者信心指数值是否和基准值100存在差异。如果从统计学的角度来看,这是一个典型的对总体均数进行假设检验的问题,在这种问题中,研究者所关心的变量为定距变量,因此可以使用均数来代表该定距变量的集中趋势。研究者对该样本所在总体的均数有一个事先的假设(本例中为指数100),而研究目的就是推断:实际上该样本所在总体的均数是否等于这一已知总体均数。根据假设检验知识
7、可以给出两种可能的假设如下:H0 :u=u0,样本均数与假定总体均数的差异完全是由抽样误差造成的。H1: uu0,样本均数与假定总体均数的差异除了由抽样误差造成外,确实也反映了实际的总体均数与假定的总体均数间的差异。那么,究竟哪一种假设才是正确的呢?根据假设检验的步骤,可以首先假定H0是成立的。那么,该样本就真的是从均数为100的总体中随机抽样而来的。但是,如果考察该样本的实际数据,则会发现,2007年4月北京、上海、广州三地的总样本均数不等于100,而是98.34。描述统计量(月份=)N极小值极大值均值标准差总指数30031.24140.5998.336318.92074有效的 N (列表状
8、态)300(注:利用以前学过的操作实现输出上面的表格)两者之间存在着差异,X(_)-u=-1.66,仅看这一个数字很难推断出这种差异究竟是大还是小,因为这还和数据的离散程度有关,如果消费者信心值差异较大,本身信心指数的离散程度就比较大,那么这一差值可能并不起眼。反之,则这一差值可能相对比较明显。为此,需要找到某种方式对这一差值进行标准化。T值的公式(见李沛良 p165)上图即为t分布。相应的标准化后的统计量为t统计量。显然,t统计量的分布规律是和样本量有关的,更准确地说是和自由度有关。自由度(Degree of Freedom,一般用v或者英文缩写df来表示)这个概念还出现在其他分布中,它基本
9、上是信息量大小的一个度量,描述了样本数据能自由取值的个数,在t分布中由于有给定的样本均数这一限定,所以自由度为df=n-1。从上图可以看出,当自由度增加时,它的分布就逐渐接近标准正态分布了。因此,在样本量较大时,可以用标准正态分布来近似t分布。t检验就是应用t分布的特征,将t 作为检验的统计量来进行的检验。13.1.2 SPSS中的相应功能t检验在SPSS中基本上被击中在“比较均值”子菜单中,具体如下。(1)单样本t检验过程:进行样本均数与已知总体均数的比较。(2)独立样本t检验过程:进行两样本均数差别的比较,即通常所说的两组资料的t检验。(3)配对样本t检验过程:进行配对资料的均数比较,即配
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设检验 检验
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内