统计分析与方法第五章假设检验幻灯片.ppt
《统计分析与方法第五章假设检验幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计分析与方法第五章假设检验幻灯片.ppt(89页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计分析与方法第五章假设检验第1页,共89页,编辑于2022年,星期二假假设设检检验验第2页,共89页,编辑于2022年,星期二假设检验的基本问题假设检验的基本问题第3页,共89页,编辑于2022年,星期二为什么要假设检验为什么要假设检验?例如,在例如,在20022002年对年对1000010000名妇女的身高进名妇女的身高进行了全面调查,得出行了全面调查,得出平均身高为平均身高为160cm160cm,标准差为标准差为5cm5cm。在在20042004年对该妇女(还是原总体)进行年对该妇女(还是原总体)进行了随机抽样调查,调查了了随机抽样调查,调查了100100名妇女,测名妇女,测得得样本身高
2、样本身高162cm162cm,标准差为,标准差为5cm5cm。请问:请问:调查结果是否说明这批妇女的身调查结果是否说明这批妇女的身高升高了?高升高了?第4页,共89页,编辑于2022年,星期二为什么要假设检验为什么要假设检验?为了回答这个问题,我们必须知道:样本平均身高与总体平均身高之差是由什么原因造成(或带来)的是由什么原因造成(或带来)的,即,即 是抽样误差造成的身高没变化是抽样误差造成的身高没变化 2cm产生的原因产生的原因 不仅是误差,不仅是误差,确实是身高发生了变化确实是身高发生了变化第5页,共89页,编辑于2022年,星期二为什么要假设检验为什么要假设检验?又如:同一位老师教授统计
3、系本科两个又如:同一位老师教授统计系本科两个班同一门课程,如果两个班考试内容和班同一门课程,如果两个班考试内容和形式完全一样,但是平均成绩却不同:形式完全一样,但是平均成绩却不同:一班一班42人,平均成绩人,平均成绩78分,标准差分,标准差15分分二班二班40人,平均成绩人,平均成绩75分,标准差分,标准差10分分请问:请问:这两个班的平均成绩是否有显著这两个班的平均成绩是否有显著的差异?的差异?第6页,共89页,编辑于2022年,星期二为什么要假设检验为什么要假设检验?还有:某减肥产品夸口说它的减肥效果还有:某减肥产品夸口说它的减肥效果是如何如何的好,如果我们有一些志愿是如何如何的好,如果我
4、们有一些志愿者对该产品试服减肥,减肥前和减肥后者对该产品试服减肥,减肥前和减肥后的体重发生了一些差异。(具体数据见的体重发生了一些差异。(具体数据见spss数据:数据:diet.sav)请问:体重发生的差异是否显著的?即请问:体重发生的差异是否显著的?即减肥是否真有效果,是否能相信该减肥减肥是否真有效果,是否能相信该减肥产品的减肥效果?产品的减肥效果?第7页,共89页,编辑于2022年,星期二为什么要假设检验为什么要假设检验?这样的例子很多,其实只要我们进行比这样的例子很多,其实只要我们进行比较、判断时:总体与样本比,不同总体较、判断时:总体与样本比,不同总体之间比之间比,样本与样本比等,都要
5、用到假设样本与样本比等,都要用到假设检验。检验。那么如何检验呢?那么如何检验呢?第8页,共89页,编辑于2022年,星期二如何假设检验如何假设检验?还是回到妇女身高的例子,已知样本均值与总体均值相差2cm,这2cm是如何造成的?是抽样误差造成的身高没变化 2cm产生的原因 不仅是误差,确实是身高发生了变化第9页,共89页,编辑于2022年,星期二如何假设检验如何假设检验?首先可假设这2cm的误差是由抽样误差造成的。上一章中我们介绍了样本均值的分布:即:第10页,共89页,编辑于2022年,星期二第11页,共89页,编辑于2022年,星期二1 68.27%第12页,共89页,编辑于2022年,星
6、期二2 95.45%第13页,共89页,编辑于2022年,星期二3 99.37%第14页,共89页,编辑于2022年,星期二如何假设检验如何假设检验?那么:如果 真是由抽样误差造成的,那么它就不应该大于2或3个标准差,即第15页,共89页,编辑于2022年,星期二如何假设检验如何假设检验?反之,如果:那么我们说不应该发生的小概率发生了,即2cm的误差不仅是由抽样误差带来的,而且确实是样本均值与总体均值发生了显著的差异。即这批妇女的身高增高了!第16页,共89页,编辑于2022年,星期二第17页,共89页,编辑于2022年,星期二第18页,共89页,编辑于2022年,星期二如何假设检验如何假设检
7、验?因此我们就需要计算:样本均值与总体均值的差究竟等于几个标准差,即:所以说明样本均值与总体均值的差不仅是抽样误差,而是确实两者之间存在着显著的差异,即该批妇女的身高增高了!第19页,共89页,编辑于2022年,星期二如何假设检验如何假设检验?小概率事件:在一次事件中几乎不可能发生的事件。一般称之为“显著性水平,用 表示。显著性水平一般取值为:第20页,共89页,编辑于2022年,星期二如何假设检验如何假设检验?在用计算机软件进行假设检验时,计算在用计算机软件进行假设检验时,计算机输出的检验结果是:机输出的检验结果是:t-值和值和p-值(值(p-value)T值就是我们刚才计算过的值就是我们刚
8、才计算过的t值,对于不值,对于不同的分布,计算同的分布,计算t值的方法和公式不一样。值的方法和公式不一样。p-值(值(p-value)就是对应于就是对应于t值及之外的双尾值及之外的双尾概率,即小概率概率,即小概率。第21页,共89页,编辑于2022年,星期二这就是双尾概率,这就是双尾概率,p值为值为0.045,即即p=4.5%第22页,共89页,编辑于2022年,星期二假设检验的过程-以妇女身高为例首首先先要要提提出出一一个个原原假假设设,如如妇妇女女身身高高的的均均值值等等于于160cm()。这这种种原原假假设设也也称称为为零零假假设设(null hypothesis),记记为为H0。与与此
9、此同同时时必必须须提提出出对对立立假假设设,如如妇妇女女身身高高均均值值不不等等于于160cm()。对对立立假假 设设 又又 称称 为为 备备 选选 假假 设设 或或 备备 择择 假假 设设(alternative hypothesis)记为)记为H1。第23页,共89页,编辑于2022年,星期二假设检验的过程-以妇女身高为例形形式式上上,上上面面的的关关于于总总体体均均值值的的H0相相对对于于H1的检验记为的检验记为:我我们们将将 的的假假设设称称为为双双尾尾检验检验,即前面说述的假设检验。,即前面说述的假设检验。第24页,共89页,编辑于2022年,星期二假设检验的过程-以妇女身高为例如果
10、备选假设为:或:则称为单尾检验。需要选择何种备选假设,则需根据需要决定。第25页,共89页,编辑于2022年,星期二假设检验的过程-以妇女身高为例需要注意的是:计算机输出结果中的需要注意的是:计算机输出结果中的p值值是双尾检验的概率。是双尾检验的概率。如果备选假设选择的是单尾检验,则要如果备选假设选择的是单尾检验,则要将计算机给的将计算机给的p值除以值除以2,即取,即取p值的一半值的一半。第26页,共89页,编辑于2022年,星期二计算机给的计算机给的p值为值为0.045,即即p=4.5%,如果是单尾检验,则如果是单尾检验,则p=0.045/2=0.0225第27页,共89页,编辑于2022年
11、,星期二假设检验的过程假设检验的过程第二,确定检验统计量第二,确定检验统计量 。有了两个假设,就要根据数据来对它们有了两个假设,就要根据数据来对它们进行判断。进行判断。根据零假设根据零假设(不是备选假设!)来判断:(不是备选假设!)来判断:如果是检验均值的,那么一般是在正态如果是检验均值的,那么一般是在正态总体分布的背景下检验的。总体分布的背景下检验的。如果是检验比例的,那么就要用到非参如果是检验比例的,那么就要用到非参数检验。数检验。第28页,共89页,编辑于2022年,星期二假设检验的过程假设检验的过程第三,确定显著性水平第三,确定显著性水平根据样本所得的数据来拒绝零假设的概根据样本所得的
12、数据来拒绝零假设的概率应小于率应小于0.050.05,当然也可能是,当然也可能是0.010.01,0.0050.005,0.0010.001等等。等等。显著性水平就是小概率水平,但小概率显著性水平就是小概率水平,但小概率并不能说明不会发生,仅仅是发生的概并不能说明不会发生,仅仅是发生的概率很小罢了。拒绝正确零假设的错误常率很小罢了。拒绝正确零假设的错误常被称为第一类错误(被称为第一类错误(type I errortype I error)。)。第29页,共89页,编辑于2022年,星期二假设检验的过程假设检验的过程有第一类错误,就有第二类错误;有第一类错误,就有第二类错误;那是备选假设正确时反
13、而说零假设正确那是备选假设正确时反而说零假设正确的错误,称为第二类错误(的错误,称为第二类错误(type II type II errorerror)。)。在一般的假设检验问题中,由于备选假在一般的假设检验问题中,由于备选假设往往不是一个点,所以无法算出犯第设往往不是一个点,所以无法算出犯第二类错误的概率。二类错误的概率。第30页,共89页,编辑于2022年,星期二假设检验的过程假设检验的过程第四,根据数据计算检验统计量的实现第四,根据数据计算检验统计量的实现值(值(t-t-值)和根据这个实现值计算值)和根据这个实现值计算p-p-值值;这一步一般都可由计算机软件来完成。这一步一般都可由计算机软
14、件来完成。第五,进行判断:如果第五,进行判断:如果p-p-值小于或等于值小于或等于a a,就拒绝零假设,就拒绝零假设,这时犯错误的概率最,这时犯错误的概率最多为多为 ;如果;如果p-p-值大于值大于 ,就不拒绝零,就不拒绝零假设,因为证据不足。假设,因为证据不足。第31页,共89页,编辑于2022年,星期二假设检验的过程假设检验的过程在这个意义上,p-值又称为观测的显著性观测的显著性水平(水平(observed significant level)。在统计软件输出p-值的位置,有的用“p-value”,有的用significant的缩写“Sig”就是这个道理。第32页,共89页,编辑于2022
15、年,星期二正态总体均值的检验正态总体均值的检验第33页,共89页,编辑于2022年,星期二正态总体均值检验的类型正态总体均值检验的类型 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验,如妇女身高的检验如妇女身高的检验 One-Sample T Test 根据来自两个总体的独立样本对其总体根据来自两个总体的独立样本对其总体均值的检验均值的检验,如两个班平均成绩的检验。如两个班平均成绩的检验。Indepent Two-Sample T Test成对样本的检验成对样本的检验,如减肥效果的检验。,如减肥效果的检验。Pari-Sample T Test 第34页,共89页,编辑
16、于2022年,星期二如果是两个以上总体的均值检验,则将用到方差分析,到方差分析一章时,再进行介绍。第35页,共89页,编辑于2022年,星期二根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验例5.1:如果你买了一包标有500g重的一包红糖,你觉得份量不足。于是你找到监督部门;当然他们会觉得一包份量不够可能是随机的。于是监督部门就去商店称了50包红糖(数据在sugar.sav);其中均值(平均重量)是498.35g;这的确比500g少,但这是否能够说明厂家生产的这批红糖平均起来不够份量呢?于是需要统计检验。首先,可以画出这些重量的直方图(图5.)第36页,共89页,编辑于
17、2022年,星期二图图6.506.50包红糖重量的直方图包红糖重量的直方图第37页,共89页,编辑于2022年,星期二根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验这个直方图看上去象是正态分布的样本。于是不妨假定这一批袋装红糖有正态分布。由于厂家声称每袋500g(标明重量),因此零假设为总体均值等于500g(被怀疑对象总是放在零假设);而且由于样本均值少于500g(这是怀疑的根据),把备选假设定为总体均值少于500g(这种备选假设为单向不等式的检验为单尾检验,)。第38页,共89页,编辑于2022年,星期二根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大
18、小进行检验即:或:第39页,共89页,编辑于2022年,星期二根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验检验统计量就是作为对均值的标准化的符号中的 通常表示为零假设中的均值(即总体的均值,这里是500)Spss选项:AnalyzeCompare mean One-Sample T Test 第40页,共89页,编辑于2022年,星期二Spss输出结果输出结果第41页,共89页,编辑于2022年,星期二根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验计算结果是t=-2.696(也称为t值),同时得到p-值为0.005(由于计算机输出的为双尾检
19、验的p-值,比单尾的大一倍,应该除以2)。看来可以选择显著性水平为0.005,并宣称拒绝零假设,而拒绝错误的概率为0.005。对于这里红糖的具体问题则可以认为,红糖标记重量为500g是不能接受的,实际上平均起来要少于500g。下面图6.2给出一个t分布图,让我们看看到底这t统计量取值在什么位置。看得出来,在直观上这也的确是个小概率事件。第42页,共89页,编辑于2022年,星期二第43页,共89页,编辑于2022年,星期二根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验例例5.2(Spss数数据据exh.sav)汽车厂商声称其发动机排放标准的一个指标平均低于20个单位。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计分析 方法 第五 假设检验 幻灯片
限制150内