《最新商务与经济统计——假设检验幻灯片.ppt》由会员分享,可在线阅读,更多相关《最新商务与经济统计——假设检验幻灯片.ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、STAT 随着我国加入WTO,我国的企业面临着异常严重的挑战,汽车行业的形势尤为严峻。是挑战也是机遇,为了迎接挑战,国内汽车行业纷纷采取各种应对措施。A汽车集团公司对本公司的A1型号汽车的发动机系统进行了一系列改进,提高了启动速度,降低了噪音,改称为A2型。其中,公司关心的一个重要问题是汽车的节能性。节油是汽车的一个卖点,改进前的A1型汽车油耗较高,每百公里油耗为8.48升,公司希望改进后的车型比改进前节油,至少不比改进前更废油。实践中的统计STAT 建立零假设和备择假设总结:设设 表示在零假设和备择假设中考虑的某一特定数值。一般来表示在零假设和备择假设中考虑的某一特定数值。一般来说,对总体均
2、值的假设检验采取下面的三种形式之一:说,对总体均值的假设检验采取下面的三种形式之一:0000:HH左侧检验000:HH右侧检验000:HH双侧检验STAT第一类错误:第一类错误: 拒绝正确的原假设,简称拒绝正确的原假设,简称“拒真拒真”;第二类错误第二类错误 :接受错误的原假设,简称:接受错误的原假设,简称“纳伪纳伪” 如下所示:如下所示: 我们把两类错误发生的概率表示如下:我们把两类错误发生的概率表示如下:第一类错误发生的概率;第一类错误发生的概率;第二类错误发生的概率;第二类错误发生的概率;9.2 第一类和第二类错误总体情况 结论 H0正确 H0错误接受H0 正确结论 第二类错误 拒绝H0
3、 第一类错误 正确结论 STAT 在实践中,我们通常确定允许犯第一类错误的概率的最大值,将其称为显著性水平。 可以选择= =0.05或= = 0.01。STAT 例:联邦贸易委员会定期进行调查,目的是检验生产商们对自己产品的陈述。例如,大听的Hilltop咖啡的标签标明:听内至少装有3磅的咖啡,我们用假设检验来检验标签的陈述是否正确。若抽取了36听咖啡作为样本。 步骤:1.建立零假设和备择假设。 若根据样本计算出来的样本平均重量低于3磅,我们就可以怀疑零假设的正确性。究竟样本低到什么程度我们才可以认为对总体所作的假定是错误的呢?即愿意冒第一类错误的风险,错误的控告该公司违背了标签的陈述。 这取
4、决于决策者的态度。 9.3 大样本情况下总体均值的单侧检验0:3:3HHSTAT 当n=36时,样本均值服从正态分布,我们可以用统计量 的取值来衡量样本均值偏离总体均值的程度。 我们先考察 的情况,下图表明观察到的样本均值低于总体均值的1.645倍标准差的概率是0.05。如果FTC认为,犯第一类错的概率为0.05是可以接受的,那么,只要统计量z的值显示样本均值低于总体均值的1.645倍的标准差以上,我们就可以拒绝零假设。也就是xxz01.645,Hz 我们就拒绝。3STATx 的抽样分布xn图1 样本均值低于总体均值的1.645倍的标准差的概率1.645x0.053STAT 在进行检验之前,我
5、们要确定犯第一类错误的最大允许概率,即显著性水平。 在上例中,假定FTC的检验计划的主管人员作出了下列陈述:如果公司的产品重量符合技术规格的要求 ,我们就有99%的概率对该公司采取不利的行动。当我们控告该公司的产品重量不足时,我们愿意冒的犯这类错误的风险的概率是1%。 可以推定, 。查标准正态分布表,可得临界值为2.33。30.01STAT若根据样本均值计算得Z值小于-2.33,就可以拒绝零假设,接受备择假设。 称 假定根据36个听装咖啡样本计算出的均值 ,有根据以前的研究,我们知道总体的标准差 ,计算z值:2.33z 为拒绝域。2.9232.670.18/362.33,xxzz 落入拒绝域,
6、则可以拒绝零假设。0.182.92x STAT 若 ,则统计量的值 如果 ,犯第一类错误的概率比 时犯第一类错的概率小。检验统计量的值在拒绝域内出现的可能性更小。 所以,确定检验的临界值时,只要假定 可以了。2.97x 2.9731.000.18/362.33,xxzz 落入接受域,则不能拒绝零假设。333STAT总结:在大样本情况下,无论总体标准差已知或未知,样本在大样本情况下,无论总体标准差已知或未知,样本均值总是服从正态分布,则可归纳左侧检验的一般步骤:均值总是服从正态分布,则可归纳左侧检验的一般步骤: 1 1、建立零假设和备择假设、建立零假设和备择假设 2 2、确定检验统计量,并计算其
7、值、确定检验统计量,并计算其值 3 3、根据事先确定的显著性水平,查标准正态分布表得临界值、根据事先确定的显著性水平,查标准正态分布表得临界值 4 4、拒绝规则:、拒绝规则:000:HH,xxxxsznn或 9.3.1 单个总体均值的单侧假设检验0,Hzz 拒绝。STAT同理,在大样本情况下,右侧检验的一般步骤:同理,在大样本情况下,右侧检验的一般步骤: 1 1、建立零假设和备择假设、建立零假设和备择假设 2 2、确定检验统计量,并计算其值、确定检验统计量,并计算其值 3 3、根据事先确定的显著性水平,查标准正态分布表得临界值、根据事先确定的显著性水平,查标准正态分布表得临界值 4 4、拒绝规
8、则:、拒绝规则:000:HH0,Hzz拒绝。,xxxxsznn或STAT 例:某市的一家公司生产一种新型的轮胎,这种新型轮胎的设计规格是平均行驶里程至少为28000英里。随机抽取了30只轮胎作为一个样本进行检验,结果,样本均值时27500英里,样本标准差是1000英里。采用0.05的显著性水平,检验是否有足够的证据拒绝轮胎的平均行驶里程至少为28000英里的陈述。解:已知1、建立零假设和备择假设 028000,30,27500,1000,0.05,1.645nxsz0:28000:28000HHSTAT 2、确定检验统计量,并计算其值3、4、27500280002.74/1000/30 xxx
9、zsn 0.05,1.645z02.741.645,Hzz 拒绝。即不能接受该公司关于轮胎的陈述。 练习:P272,T14STAT P值是指观察到的样本均值小于或等于观察值的概率。也可以称为观测的显著性水平。 以希尔托普公司的咖啡问题为例来计算样本均值 的P值。 我们已经给出检验统计量的值z=-2.67,查标准正态分布表,可以求出在均值与z=-2.67之间的区域面积是0.4962。由此得到样本均值小于或等于观察值 的概率是0.5000-0.4962=0.0038,即P值就是0.0038。2.92x 2.92x 9.3.2 P值的作用STAT P值可以用来进行假设检验的决策,如果P值比显著性水平
10、小,则检验统计量的值就在拒绝域内,若更大,则落入接受域内。上例中,P=0.0038, 假设检验的P值标准 0.01,P应该拒绝零假设。,P如果拒绝零假设。STAT例:根据美国高尔夫球协会的准则,只有射程和滚动距离平均为280码的高尔夫球可在比赛中使用。假定某公司最近开发了一种高技术生产方法,用这种方法生产的高尔夫球的射程和滚动距离平均为280码。现在抽取一个有36个高尔夫球的随机样本来检验该公司的陈述是否为真。数据如下表。(假定在显著性水平为0.05的条件下进行)。9.4大样本情况下总体均值的双侧检验26930129627528227628427226330029526528226328626
11、0285264268288271260270293299293273278278279266269274277281291STAT 该问题就是一个双侧检验的例子。 先建立如下的零假设和备择假设:在大样本的情况下,仍然选择统计量Z,和单侧检验不同的是,此时的拒绝域分布在正态曲线的两侧,对应的概率均为 。查表时应该查 对应的临界值0:280:280HH/xxxzsn22/2zSTAT 上例中,依据表中资料可计算得, 则统计量的值为根据给定的显著性水平278.5,12xs278.52800.75/12/36xxxzsn /20.05,1.96z可查表得/2/2,zzz落入接受域,不能拒绝零假设。ST
12、AT归纳:在大样本情况下,双侧检验的一般步骤:归纳:在大样本情况下,双侧检验的一般步骤: 1 1、建立零假设和备择假设、建立零假设和备择假设 2 2、确定检验统计量,并计算其值、确定检验统计量,并计算其值 3 3、根据事先确定的显著性水平,查标准正态分布表得临界值、根据事先确定的显著性水平,查标准正态分布表得临界值 4 4、拒绝规则:、拒绝规则:000:HH/2/20,Hzzzz 或拒绝。,xxxxsznn或STAT对于前面关于高尔夫球的例子,我们已知对应样本均值 的z值是-0.75,从标准正态分布表可以查到,在均值和z值-0.75只见的面积是0.2734。因此,左侧的面积为0.2266,而此
13、时左侧的拒绝域内的面积为 =0.025。0.22660.025,统计量不再拒绝域内,不能拒绝零假设,与前的结论相同。 P值为z值对应一侧面积的2倍。 此时,判断的标准仍然是 9.4.2双侧检验的P值278.5x 2,P如果拒绝零假设。STAT在大样本的情况下,给定置信水平 的总体均值的置信区间为:进行假设检验时,首先需要对总体的参数作出假定: 双侧检验双侧检验1已知时nZx2未知时2sxZn9.4.3 区间估计和假设检验的关系000:HH00/2/2根据拒绝规则,可知不能拒绝H 的区域包括位于的-z和z个标准差之间的所有样本均值。(1)STAT 因此,双侧假设检验的样本均值的非拒绝区域可以由下
14、式给出:双侧假设检验的非拒绝域和置信区间之间的关系:已知时02Zn未知时02sZn200如果x在式( )中所定义的非拒绝区域之内,假定的值就在式(1)所定义的置信区间之内。反过来说,如果假定值就在式(1)所定义的置信区间之内,样本均值就在(2)所定义的假设检验的非拒绝区域之内。(2)STAT 由此得到由置信区间方法到假设检验的运算过程:假设的形式:(1)从总体中抽取一个简单随即样本构建总体均值的置信区间:(2)如果置信区间包含假定的 值,则不拒绝零假设 。 否则,拒绝000:HH已知时nZx2未知时2sxZn00H0HSTAT 例:仍然采用前述关于高尔夫球的双侧检验的例子:根据样本数据我们已经
15、计算得到:对于给定的置信水平可以得到总体均值的95%的置信区间为: 0:280:280HH278.5,12xs2195%,1.96Z2sxZn12278.5 1.9636即274.58282.42总体均值的假设值 在这个区间,所以我们不能拒绝零假设。0280STAT在区间估计中我们已经知道,当总体服从正态分布且总体方差未知时,小样本下的统计量这时对总体均值的检验就应该采用t统计量来进行。例:如果机场的总体平均质量等级得分大于或等于7分,那么就可以认为该机场提供的服务质量为优良。现随机抽取了12个乘客作为样本,得到伦敦某机场的质量等级分数如下:7、8、10、8、6、9、6、7、7、8、9、8。假
16、定总体的等级近似服从标准正态分布,在0.05的显著性水平下可以认为该机场服务质量优良吗? (1)/xtt nsn 9.5小样本情况下总体均值检验STAT 1.建立零假设和备择假设 2.选择统计量t,并计算 3. 4.0:7:7HH7.7572.14/1.125/ 12xtsn7.75,1.215xs依题可计算0.05,(11)1.796可查t分布表得t0.0502.141.796,Htt落入拒绝域,拒绝。即可以认为该机场提供了优良的服务。STAT 注意:小样本的情况下的检验步骤与判断准则与大样本情况下的基本不同,唯一的不同是小样本对应t分布,而大样本对应正态分布。 另外,小样本下也可以运用P值
17、来判断,但是由于t分布的表编制不很详细,不能通过查表来准确计算P值,但是判断的原则依然与前相同,练习:P282,T34,P如果拒绝零假设。STAT 0用p表示总体比例,p 表示总体比例的某一特定假设值,总体比例的假设检验有如下形式:000:HpHp左侧检验000:HpHp右侧检验000:HpHp双侧检验9.6 总体比例的检验STAT 我们只考虑 的情况下,样本比例服从正态分布下的总体比例的假设检验。 由于比例是特殊的均值,因此对比例进行检验的步骤及判断准则与对均值的检验相同,只需要检验统计量中的均值换成比例对应的指标就可。 例:在过去的几个月中,在松树溪打高尔夫球的人中有20%是女性。为了提高
18、女性高尔夫球收的比例,球场采取了一项特殊的激励措施来吸引女性。一周以后,随机抽取了400名球手作为一个样本,结果有300名男性和100名女性。课程经理想知道这些数据是否支持他们的结论:松树溪的女性高尔夫球手的比例有所增加。30,5, (1)5nnpnpSTAT解:已知1、建立零假设和备择假设2、确定检验统计量,并计算其值3、4、00000.250.202.5(1) /0.20*0.80 /400pppppzppn0.05,1.645z若给定则有02.51.645,Hzz拒绝。即可以认为女性球手的比例有所增加。01000.20,400,0.25400pnp0:0.20:0.20HpHpSTAT
19、同样,我们可以计算该检验的P值,已知z=2.50,标准正态分布表显示均值与2.5之间的面积为0.4938,则P=0.5000-0.4938=0.0062。小于显著性水平0.05,拒绝零假设。 以下是关于本章内容的总结: 总结:单个总体的假设检验总结:单个总体的假设检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0: H1:22z(2) H0: H1:(3 )H0: H1:z0z00 xxZn正态总正态总体体2已已知知0Xx0Xx0Xx0Xx0Xx0XxZZ条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0: H1:22t(2) H0: H1:(3) H0: H1:t0t00 x xts n2t2t0正态总正态总体体2未未知知(n30)0Xx0Xx0Xx0Xx0Xx0Xxtt条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0: H1:22z(2) H0: H1:(3) H0: H1:z0z02Z2Z00 x xZn0 x xZS n非正态非正态总体总体n302已知已知或未知或未知0Xx0Xx0Xx0Xx0Xx0Xx0XxZZ条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:P=P0 H1:PP022z(2) H0:PP0 H1:PP0(3) H0:PP0 H1:PP0z0z02Z2Z0np5nq5000ppZp qnZZ
限制150内