《统计学假设检验概念和方法幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学假设检验概念和方法幻灯片.ppt(105页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学假设检验概念和方法第1页,共105页,编辑于2022年,星期二假设检验在统计方法中的地位第2页,共105页,编辑于2022年,星期二学习目标1.了解假设检验的基本思想了解假设检验的基本思想 2.掌握假设检验的步骤掌握假设检验的步骤3.对实际问题作假设检验对实际问题作假设检验4.利用置信区间进行假设检验利用置信区间进行假设检验5.利用利用P-值进行假设检验值进行假设检验第3页,共105页,编辑于2022年,星期二6.1 假设检验的基本问题一一.假设问题的提出假设问题的提出二二.假设的表达式假设的表达式三三.两类错误两类错误四四.假设检验中的值假设检验中的值五五.假设检验的另一种方法假设检验
2、的另一种方法六六.单侧检验单侧检验第4页,共105页,编辑于2022年,星期二让我们先看一个例子让我们先看一个例子.基本概念基本概念第5页,共105页,编辑于2022年,星期二 生产流水线上罐装可生产流水线上罐装可乐不断地封装,然后装箱乐不断地封装,然后装箱外运外运.怎么知道怎么知道这批罐装这批罐装可乐的容量是否合格可乐的容量是否合格呢?呢?罐装可乐的容量按标准应为罐装可乐的容量按标准应为355毫升毫升.基本概念基本概念第6页,共105页,编辑于2022年,星期二 每隔一定时间,抽查若干罐每隔一定时间,抽查若干罐.如每隔如每隔1小时,小时,抽查抽查5罐,得罐,得5个容量的值个容量的值X1,X5
3、,根据,根据这些值来判断生产是否正常这些值来判断生产是否正常.通常的办法是进行抽样检查通常的办法是进行抽样检查.基本概念基本概念第7页,共105页,编辑于2022年,星期二根根据据样样本本的的信信息息检检验验关关于于总总体体的的某某个个命命题题是是否正确否正确.这类问题称作这类问题称作假设检验假设检验问题问题.基本概念基本概念第8页,共105页,编辑于2022年,星期二什么是假设?(hypothesis)对总体参数的的数值所作的一种陈述总体参数包括总总体体均均值值、比例比例、方差方差等分析之前之前必需陈述我认为该地区新生婴儿的我认为该地区新生婴儿的平均体重为平均体重为31903190克克!第9
4、页,共105页,编辑于2022年,星期二什么是假设检验?(hypothesis testing)1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2.有参数假设检验和非参数假设检验3.采用逻辑上的反证法,依据统计上的小概率原理第10页,共105页,编辑于2022年,星期二假设检验的基本思想.因此我们拒因此我们拒因此我们拒因此我们拒绝假设绝假设绝假设绝假设 =50=50.如果这是如果这是如果这是如果这是如果这是如果这是总体的真实均总体的真实均总体的真实均总体的真实均总体的真实均总体的真实均值值值值值值样本均值样本均值 =50抽样分布抽样分布抽样分布抽样分布H0这个值不
5、像我这个值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的们应该得到的样本均值样本均值样本均值样本均值.2020第11页,共105页,编辑于2022年,星期二总体总体假设检验的过程抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 X X=20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设!别无选择别无选择.作出决策作出决策作出决策作出决策第12页,共105页,编辑于2022年,星期二假设检验的步骤假设检验的步骤提出假设提出假设确定适当的检验统计量确定适当的检验统计量规定显著性水平规定显著性水平
6、 计算检验统计量的值计算检验统计量的值作出统计决策作出统计决策第13页,共105页,编辑于2022年,星期二提出原假设和备择假设 什么是原假设?什么是原假设?(null hypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3.总是有等号 ,或 4.表示为 H0H0:某一数值 指定为=号,即 或 例如,H0:3190(克)为什么叫为什么叫为什么叫0 00假设假设假设?第14页,共105页,编辑于2022年,星期二为什么叫为什么叫 0 假设?假设?之所以用零来修饰原假设,其原因是原假设的内容总是没有差异或没有改变,或变量间没有关系等等零假设总是一个与总体参数有关
7、的问题,所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等第15页,共105页,编辑于2022年,星期二 什么是备择假设?什么是备择假设?(alternative hypothesis)1.与原假设对立的假设,也称“研究假设”2.研究者想收集证据予以支持的假设总是有不等号:,或 3.表示为 H1H1:某一数值,或 某一数值例如,H1:3910(克),或3910(克)提出原假设和备择假设提出原假设和备择假设第16页,共105页,编辑于2022年,星期二 什么检验统计量?什么检验统计量?1.用于假设检验决策的统
8、计量2.选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知3.检验统计量的基本形式为确定适当的检验统计量确定适当的检验统计量第17页,共105页,编辑于2022年,星期二规定显著性水平(significant level)什么显著性水平?什么显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的 值有0.01,0.05,0.104.由研究者事先确定第18页,共105页,编辑于2022年,星期二作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临界值z或z,t或t3.将检验统计量的值与 水
9、平的临界值进行比较4.得出拒绝或不拒绝原假设的结论第19页,共105页,编辑于2022年,星期二假设检验中的小概率原理 什么小概率?什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定什么是小什么是小什么是小概率?概率?概率?第20页,共105页,编辑于2022年,星期二什么是小概率?什么是小概率?概率是从0到1之间的一个数,因此小概率就应该是接近0的一个数著名的英国统计家Ronald Fisher 把20分之1作为标准,这也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher
10、没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的第21页,共105页,编辑于2022年,星期二假设检验中的两类错误1.第一类错误(弃真错误)第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为被称为显著性水平2.第二类错误(取伪错误)第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta)第22页,共105页,编辑于2022年,星期二H H0 0:无罪无罪无罪无罪假设检验中的两类错误假设检验中的两类错误(决策结果)(决策结果)陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H
11、0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假接受接受H0正确决策正确决策(1 )第二类错第二类错误误()拒绝拒绝H0第一类错第一类错误误()正确决策正确决策(1-(1-)假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程第23页,共105页,编辑于2022年,星期二 错误和 错误的关系 你不能同时减你不能同时减少两类错误少两类错误!和和和和 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板,小小小小 就就就就大,大,大,大,大大大大 就小就小就小就小第24页,共105页,编辑于2022年,星期二影响 错误的因素1.总体参数的真值随
12、着假设的总体参数的减少而增大2.显著性水平 当减少时增大3.总体标准差 当增大时增大4.样本容量 n当 n 减少时增大第25页,共105页,编辑于2022年,星期二什么是P 值?(P-value)1.是一个概率值2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于大于等于检验统计量部分的面积3.被称为观察到的(或实测的)显著性水平H0 能被拒绝的的最小值第26页,共105页,编辑于2022年,星期二双侧检验的P 值 /2 2 /2 2 Z拒绝拒绝拒绝拒绝拒绝拒绝拒绝拒绝H HH0 0
13、0值值值临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值第27页,共105页,编辑于2022年,星期二左侧检验的P 值H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本
14、统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值第28页,共105页,编辑于2022年,星期二右侧检验的P 值H H0 0值值临界值临界值 拒绝域拒绝域抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P 值值第29页,共105页,编辑于2022年,星期二利用 P 值进行检验(决策准则)1.单侧检验若p-值 ,不拒绝 H0若p-值 ,拒绝 H02.双侧检验若p-值 ,不拒绝 H0若p-值 ,拒绝 H0第30页,共105页,编辑于2022年,星期二双侧检验与单侧检验(假设的形式)假设假
15、设研究的问题研究的问题双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H0=0 0 0 0 0 0H1 0 0 0 0第31页,共105页,编辑于2022年,星期二双侧检验(原假设与备择假设的确定)1.属于决策中的假设检验决策中的假设检验2.不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施3.例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立4.建立的原假设与备择假设应为 H0:10 H1:10第32页,共105页,编辑于2022年,星期二双侧检验(显著性水平与拒绝域)抽样分布抽样分布抽样分布抽样分
16、布H HH000值值值临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平第33页,共105页,编辑于2022年,星期二双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第34页,共105页,编辑于2022年,星期二双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量拒绝
17、域拒绝域拒绝域拒绝域抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第35页,共105页,编辑于2022年,星期二双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第36页,共105页,编辑于2022年,星期二单侧检验(原假设与备择假设的确定)1.将研究者想收集证据予以支持的假设作为备择假设H1例如,一个研究者总是想证明自己的研究结论是正确的一个销售商总是想正确供货商的说法是不正确的备择假设的方向与想要证明其正确性的方向一致2.将研究者想收集证据证明其
18、不正确的假设作为原假设H03.先确立备择假设H1第37页,共105页,编辑于2022年,星期二单侧检验(原假设与备择假设的确定)q一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立研究者总是想证明自己的研究结论(寿命延长)是正确的备择假设的方向为“”(寿命延长)建立的原假设与备择假设应为 H0:1500 H1:1500第38页,共105页,编辑于2022年,星期二单侧检验(原假设与备择假设的确定)q一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立研究者总是想证明自己的研究结论(废品率降低)是正确的备择假设的方向
19、为“”(废品率降低)建立的原假设与备择假设应为 H0:2%H1:2%第39页,共105页,编辑于2022年,星期二单侧检验(原假设与备择假设的确定)q某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验检验权在销售商一方作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的备择假设的方向为“1020 =0.05n=16临界值临界值(s):检验统计量检验统计量:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0有证据表明这批灯泡的使用寿命有证据表明这批灯泡的使用寿命有显著提高有显著提高决策决策:结论结论:Z
20、0拒绝域拒绝域拒绝域拒绝域0.050.051.6451.645第54页,共105页,编辑于2022年,星期二2 未知大样本均值的检验(例题分析)【例例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(0.05)单侧检验单侧检验第55页,共105页,编辑于2022年,星期二2 未知大样本均值的检验(例题分析)H0:1200H1:1200 =0.05n=100临界值临界值(s):检验统计量检验统
21、计量检验统计量检验统计量:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该厂生产的元件寿命显不能认为该厂生产的元件寿命显著地高于著地高于12001200小时小时决策决策决策决策:结论结论:Z0拒绝域拒绝域拒绝域拒绝域0.050.051.6451.645第56页,共105页,编辑于2022年,星期二总体均值的检验(2未知小样本)1.假定条件总体为正态分布2未知,且小样本2.使用t 统计量第57页,共105页,编辑于2022年,星期二2 未知小样本均值的检验(例题分析)【例例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚
22、度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验双侧检验第58页,共105页,编辑于2022年,星期二2 未知小样本均值的检验(例题分析)H0:=5H1:5 =0.05df=10-1=9临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0说明该机器的性能不好说明该机器的性能不好 决策:决策:决策:决策:结论:结论:t0 02.2622.262-2.262-2.262.025025拒绝拒绝拒绝拒绝 H H0 0拒绝拒绝拒绝拒绝 H H0 0.025025第59页,共105页,编辑于
23、2022年,星期二2 未知小样本均值的检验(P 值的计算与应用)第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击,并在函数分类中点击“统 计”,然后,在函数名的菜单中选择字符 “TDIST”,确定第3步:在弹出的X栏中录入计算出的t值3.16 在自由度(Deg-freedom)栏中录入9 在Tails栏中录入2,表明是双侧检验(单测 检验则在该栏内录入1)P值的结果为0.011550.025,拒绝H0第60页,共105页,编辑于2022年,星期二2 未知小样本均值的检验(例题分析)【例例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件
24、下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05)单侧检验!单侧检验!第61页,共105页,编辑于2022年,星期二均值的单尾 t 检验(计算结果)H0:40000H1:40000 =0.05df=20-1=19临界值临界值(s):检验统计量检验统计量:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为制造商的产品同他所说不能认为制造商的产品同他所说的标准不相符的标准不相符决策决策:结论结论:-1
25、.7291-1.7291t0拒绝域拒绝域拒绝域拒绝域.05.05第62页,共105页,编辑于2022年,星期二总体比例的检验(Z 检验)第63页,共105页,编辑于2022年,星期二适用的数据类型第64页,共105页,编辑于2022年,星期二一个总体比例检验1.假定条件有两类结果总体服从二项分布可用正态分布来近似2.比例检验的 Z 统计量 0 0为假设的总体比例为假设的总体比例为假设的总体比例为假设的总体比例第65页,共105页,编辑于2022年,星期二一个总体比例的检验(例题分析)【例例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计
26、是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(=0.05)双侧检验双侧检验第66页,共105页,编辑于2022年,星期二一个总体比例的检验(例题分析)H0:=14.7%H1:14.7%=0.05n=400临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0该市老年人口比重为该市老年人口比重为14.7%14.7%决策决策决策决策:结论结论结论结论:Z01.961.96-1.96-1.96.025.025拒绝拒绝拒绝拒绝 H H0 0拒绝拒绝拒绝拒
27、绝 H H0 0.025.025第67页,共105页,编辑于2022年,星期二方差的卡方(2)检验1.检验一个总体的方差或标准差2.假设总体近似服从正态分布3.检验统计量样本方差样本方差样本方差样本方差假设的总体方差假设的总体方差假设的总体方差假设的总体方差第68页,共105页,编辑于2022年,星期二方差的卡方(2)检验(例题分析)【例例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分 别 进 行 测 定(用 样 本 减1000cm3),得到如下
28、结果。检验该机器的性能是否达到设计要求 (=0.05)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1双侧检验双侧检验第69页,共105页,编辑于2022年,星期二方差的卡方(2)检验(例题分析)H0:2=1H1:2 1 =0.05df=25-1=24临界值临界值(s):统计量统计量:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该机器的性能未达到设不能认为该机器的性能未达到设计要求计要求 2 20 039.3639.3612.4012.40 /2
29、=.05/2=.05决策决策:结论结论结论结论:第70页,共105页,编辑于2022年,星期二6.3 两个正态总体参数的检验一一.检验统计量的确定检验统计量的确定二二.两个总体均值之差的检验两个总体均值之差的检验三三.两个总体比例之差的检验两个总体比例之差的检验四四.两个总体方差比的检验两个总体方差比的检验五五.检验中的匹配样本检验中的匹配样本第71页,共105页,编辑于2022年,星期二两个正态总体参数的检验两个总体的检验两个总体的检验Z 检验检验(大样本大样本)t 检验检验(小样本小样本)t 检验检验(小样本小样本)Z 检验检验F 检验检验独立样本独立样本独立样本配对样本配对样本配对样本均
30、值均值比例比例方差方差第72页,共105页,编辑于2022年,星期二独立样本总体均值之差的检验第73页,共105页,编辑于2022年,星期二两个独立样本之差的抽样分布1 1总体总体1 2 2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2 1-1-2 2抽样分布抽样分布抽样分布抽样分布第74页,共105页,编辑于2022年,星期二两个总体均值之差的检验(12、22 已知)1.假定条件两个样本是独立的随机样本两个总体都是正态分布若不
31、是正态分布,可以用正态分布来近似(n130和 n230)2.检验统计量为第75页,共105页,编辑于2022年,星期二两个总体均值之差的检验(假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异均值均值1 1 均值均值2 2均值均值1 1 均值均值2 2H0 1 2=0 1 2 0 1 2 0H1 1 2 0 1 2 0第76页,共105页,编辑于2022年,星期二两个总体均值之差的检验(例题分析)双侧检验!双侧检验!【例例例例】有有两两种种方方法法可可用用于于制制造造某某种种以以抗抗拉拉强强度度为为重重要要特特征征的的产产品品。根根据据以以往往的的资资料料得得知知,第第一一种
32、种方方法法生生产产出出的的产产品品其其抗抗拉拉强强度度的的标标准准差差为为8 8公公斤斤,第第二二种种方方法法的的标标准准差差为为1010公公斤斤。从从两两种种方方法法生生产产的的产产品品中中各各抽抽取取一一个个随随机机样样本本,样样本本容容量量分分别别为为n n1 1=32=32,n n2 2=40=40,测测得得 x x2 2=5050公公斤斤,x x1 1=4444公公斤斤。问问这这两两种种方方法法生生产产的的产产品品平平均均抗抗拉拉强强度度是是否否有有显显著著差差别?别?(=0.05)=0.05)第77页,共105页,编辑于2022年,星期二两个总体均值之差的检验(例题分析)H0:1
33、1-2 2=0H1:1 1-2 2 0 =0.05n1=32,n2=40临界值临界值(s):检验统计量检验统计量:决策决策:结论结论:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0有证据表明两种方法生产的产品其有证据表明两种方法生产的产品其抗拉强度有显著差异抗拉强度有显著差异Z01.961.96-1.96-1.96.025.025拒绝拒绝拒绝拒绝 H H0 0拒绝拒绝拒绝拒绝 H H0 0.025.025第78页,共105页,编辑于2022年,星期二两个总体均值之差的检验(12、22 未知且不相等,小样本)1.检验具有不等方差的两个总体的均值2.假定条件两个样本是独立的随机样本
34、两个总体都是正态分布两个总体方差未知且不相等13.检验统计量其中:其中:其中:第79页,共105页,编辑于2022年,星期二两个总体均值之差的检验(12、22 未知但相等,小样本)1.检验具有等方差的两个总体的均值2.假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等1=3.检验统计量第80页,共105页,编辑于2022年,星期二两个总体均值之差的检验(例题分析)单侧检验单侧检验【例例】“多多吃吃谷谷物物,将将有有助助于于减减肥肥。”为为了了验验证证这这个个假假设设,随随机机抽抽取取了了3535人人,询询问问他他们们早早餐餐和和午午餐餐的的通通常常食食谱谱,根根据据他他
35、们们的的食食谱谱,将将其其分分为为二二类类,一一类类为为经经常常的的谷谷类类食食用用者者(总总体体1),一类为非经常谷类食用者(总体2)。然然后后测测度度每每人人午午餐餐的的大大卡卡摄摄取取量量。经经过过一一段段时时间间的的实实验验,得得到到如如下下结结果:检验该假设果:检验该假设(=0.05)第81页,共105页,编辑于2022年,星期二两个总体均值之差的检验(例题分析用统计量进行检验)H0:1 1-2 2 0H1:1 1-2 2 0 =0.05n1=15,n2=20临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:决策决策决策决策:结论结论结论结论:在在 =0.05=0.05的
36、水平上拒绝的水平上拒绝H H0 0没有证据表明多吃谷物将有助于减没有证据表明多吃谷物将有助于减肥肥-1.694-1.694t0拒绝域拒绝域拒绝域拒绝域.05.05第82页,共105页,编辑于2022年,星期二两个总体均值之差的检验(例题分析用R进行检验)第1步:选择“工具”下拉菜单,并选择“数据分析”选项第2步:选择“t检验,双样本异方差假设检验,双样本异方差假设”第3步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框内键入数据区域 在“假设平均差”的方框内键入0 在“”框内键入0.05 在“输出选项”中选择输出区域 选择确定 用用用用R R进进进进行行行行检验检
37、验检验检验第83页,共105页,编辑于2022年,星期二两个总体均值之差的检验(匹配样本的 t 检验)1.检验两个总体的均值配对或匹配重复测量(前/后)2.假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似(n1 30,n2 30)第84页,共105页,编辑于2022年,星期二匹配样本的 t 检验(假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异总体总体1 1 总体总体2 2总体总体1 1 总体总体2 2H0 D=0 D 0 D 0H1 D 0 D 0注:注:D Di i=X X1 1i i-X X2 2i i ,对第,对第 i i 对观察值对观察值第85
38、页,共105页,编辑于2022年,星期二匹配样本的 t 检验(数据形式)观察序号观察序号样本样本1 1样本样本2 2差值差值1x 11x 21D1=x 11-x 212x 12x 22D1=x 12-x 22M MM MM MM Mix 1ix 2iD1=x 1i-x 2iM MM MM MM Mnx 1nx 2nD1=x 1n-x 2n第86页,共105页,编辑于2022年,星期二匹配样本的 t 检验(检验统计量)样本差值均值样本差值均值样本差值标准差样本差值标准差自由度自由度df df n nD D-1-1统计量统计量D D0 0:假设的差值:假设的差值第87页,共105页,编辑于2022
39、年,星期二【例例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:匹配样本的 t 检验(例题分析)在 =0.05的显著性水平下,调查结果是否支持该俱乐部的声称?训练前训练前94.5101110103.59788.596.5101104116.5训练后训练后8589.5101.5968680.58793.593102单侧检验单侧检验第88页,共105页,编辑于2022年,星期二样本差值计算表样本差值计算表训练前训练前训练后训练后差值差值Di94.5101110103.5
40、9788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计合计98.5配对样本的 t 检验(例题分析)第89页,共105页,编辑于2022年,星期二配对样本的 t 检验(例题分析)差值均值差值均值差值均值差值均值差值标准差差值标准差第90页,共105页,编辑于2022年,星期二H0:1 2 8.5H1:1 2 8.5 =0.05df=10-1=9临界值临界值(s):检验统计量检验统计量:决策决策:结论结论结论结论:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该俱
41、乐部的宣称不可信不能认为该俱乐部的宣称不可信配对样本的 t 检验(例题分析)-1.833-1.833t0拒绝域拒绝域拒绝域拒绝域.05.05第91页,共105页,编辑于2022年,星期二配对样本的 t 检验(例题分析用R进行检验)第第1步:步:选择“工具”第第2步:步:选择“数据分析”选项第第3步步:在分析工具中选择“t检检验验:平平均均值值的的成成对对二二样样本本分分析析”第第4步:步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框内键入数据区域 在“假设平均差”方框内键入8.5 显著性水平保持默认值 用用R进进行行检验检验第92页,共105页,编辑于2022年
42、,星期二两个总体比例之差的检验第93页,共105页,编辑于2022年,星期二1.假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似2.检验统计量两个总体比例之差的Z检验第94页,共105页,编辑于2022年,星期二两个总体比例之差的检验(假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异比例比例1 1 比例比例2 2比例比例1 1 比例比例2 2H0P1P2=0P1P2 0P1P2 0H1P1P2 0P1P20第95页,共105页,编辑于2022年,星期二两个总体比例之差的Z检验(例题分析)单侧检验单侧检验 【例例】对两个大型企业青年工人参加技术培训的情况进行
43、调查,调查结果如下:甲厂:调查60人人,18人参加技术培训。乙厂调查4040人,1414人人参参加加技技术术培培训训。能能否否根根据据以以上上调调查查结结果果认认为为乙乙厂厂工工人人参参加加技技术术培培训训的的人人数数比例高于甲厂?比例高于甲厂?(=0.05)第96页,共105页,编辑于2022年,星期二两个总体比例之差的Z检验(例题分析)H0:1 1-2 2 0H1:1 1-2 2 0 =0.05n1=60,n2=40临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:决策决策决策决策:结论结论结论结论:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0没没有有证证
44、据据表表明明乙乙厂厂工工人人参参加加技技术术培训的人数比例高于甲厂培训的人数比例高于甲厂-1.645-1.645Z0拒绝域拒绝域拒绝域拒绝域 第97页,共105页,编辑于2022年,星期二两个总体方差比的检验(F 检验)1.假定条件两个总体都服从正态分布,且方差相等两个独立的随机样本2.假定形式H0:12=22 或 H0:12 22 (或)H1:12 22 H1:12)3.检验统计量F=S12/S22F(n1 1,n2 1)第98页,共105页,编辑于2022年,星期二两个总体方差的 F 检验(临界值)0不能拒绝不能拒绝H0F拒绝拒绝H0/2/2拒绝拒绝 H0第99页,共105页,编辑于202
45、2年,星期二两个总体方差的 F 检验(例题分析)H0 0:1 12 22 2=2 2 2 22 2 H H1 1:1 12 22 2 2 22 2 =0.05n1 1=15,n2 2 =20=20临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:决策决策决策决策:结论结论结论结论:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0不不能能认认为为这这两两个个总总体体的的方方差差有有显显著差异著差异 0FF F0.0975 0.0975=0.352=0.352.025.025拒绝拒绝拒绝拒绝 H H0 0拒绝拒绝拒绝拒绝 H H0 0.025.02
46、5F F0.025 0.025=2.62=2.62第100页,共105页,编辑于2022年,星期二6.4 假设检验中的其他问题一一.用置信区间进行检验用置信区间进行检验二二.单侧检验中假设的建立单侧检验中假设的建立第101页,共105页,编辑于2022年,星期二用置信区间进行检验(双侧检验)1.求出双侧检验均值的置信区间 2 2 2 2已知时:已知时:已知时:2 2 2 2未知时:未知时:未知时:2.若总体的假设值 0在置信区间外,拒绝H0 第102页,共105页,编辑于2022年,星期二用置信区间进行检验(单侧检验)1.左侧检验:求出单边置信下限2.2.若总体的假设值若总体的假设值 0 0小
47、于单边置信下限,拒绝H0 03.右侧检验:求出单边置信上限4.4.若总体的假设值若总体的假设值 0 0大于单边置信上限,拒绝大于单边置信上限,拒绝H H0 0第103页,共105页,编辑于2022年,星期二用置信区间进行检验(例题分析)【例例】一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?(=0.05)双侧检验!双侧检验!第104页,共105页,编辑于2022年,星期二用置信区间进行检验(例题分析)H0:=1000H1:1000 =0.05n=49临界值临界值(s):置信区间为置信区间为决策决策决策决策:结论结论:假设的假设的 00=1000=1000在置信区间在置信区间内,不拒绝内,不拒绝H H0 0不能认为这批产品的包装重量不合格不能认为这批产品的包装重量不合格Z01.961.96-1.96-1.96.025.025拒绝拒绝拒绝拒绝 H H0 0拒绝拒绝拒绝拒绝 H H0 0.025.025第105页,共105页,编辑于2022年,星期二
限制150内