商务与经济统计假设检验精品文稿.ppt
商务与经济统计假设检验第1页,本讲稿共43页 随着我国加入WTO,我国的企业面临着异常严重的挑战,汽车行业的形势尤为严峻。是挑战也是机遇,为了迎接挑战,国内汽车行业纷纷采取各种应对措施。A汽车集团公司对本公司的A1型号汽车的发动机系统进行了一系列改进,提高了启动速度,降低了噪音,改称为A2型。其中,公司关心的一个重要问题是汽车的节能性。节油是汽车的一个卖点,改进前的A1型汽车油耗较高,每百公里油耗为8.48升,公司希望改进后的车型比改进前节油,至少不比改进前更废油。实践中的统计第2页,本讲稿共43页为此,随机抽取了15辆A2型汽车做试验,测得15辆汽车的每百公里耗油量的数据如下表:15辆汽车每百公里耗油量(单位:升)其平均数为8.377。对此数据,技术部经理认为可以肯定改进后的汽车更省油。实践中的统计8.508.758.338.218.528.308.318.198.408.868.418.018.208.268.39第3页,本讲稿共43页公司质量部经理对此结论有不同看法,他认为这个现象有可能是由抽样的随机性造成的,现在就下结论说改进后的汽车更省油还为时过早,应该对此问题作统计上的假设检验。质量部的张工程师刚通过国家质量工程从业资格认证考试,学会了不少统计方法,质量部经理就派张工解决这个问题。通过简单的计算,很快张工就得得到结论,他说,以现有的数据并不能认为改进前后汽车的油耗有明显变化。那么,张工是怎样作出他的统计分析结论的呢?实践中的统计第4页,本讲稿共43页本章重点本章重点本章重点本章重点1、假设检验的基本原理;、假设检验的基本原理;2、假设检验的形式与种类;、假设检验的形式与种类;3、第一类错误与第二类错误;、第一类错误与第二类错误;4、区间估计与假设检验的方法。、区间估计与假设检验的方法。本章难点本章难点本章难点本章难点1、假设检验的基本原理;、假设检验的基本原理;2、第一类错误与第二类错误。、第一类错误与第二类错误。9章 假设检验第5页,本讲稿共43页 9.1.1对研究性假设的检验我们前面的案例就可以看成是一个研究性假设的例子。我们前面的案例就可以看成是一个研究性假设的例子。研究性假设是:改进后的车型更节油,即平均油耗低于研究性假设是:改进后的车型更节油,即平均油耗低于8.488.48升。升。通常,通常,研究性假设研究性假设作为备择假设。作为备择假设。则上例中我们可建立如下的零假设和备择假设:则上例中我们可建立如下的零假设和备择假设:9.1 零假设和择假设第6页,本讲稿共43页例:某饮料生产商声称例:某饮料生产商声称:他们生产的两升罐装饮料平均至少有他们生产的两升罐装饮料平均至少有67.667.6盎盎司中的饮料。为了检验该生产商的陈述,我们将抽取一个两升灌装饮司中的饮料。为了检验该生产商的陈述,我们将抽取一个两升灌装饮料的样本,然后对其中所装应料的重量进行测量。料的样本,然后对其中所装应料的重量进行测量。该问题即属于对该问题即属于对陈述正确性陈述正确性的检验,一般的,我们都先假定生产商的陈的检验,一般的,我们都先假定生产商的陈述属正确的。述属正确的。则上例中我们可建立如下的零假设和备择假设:则上例中我们可建立如下的零假设和备择假设:9.1.2对陈述正确性的检验第7页,本讲稿共43页 9.1.3对决策情况下的检验 不管接受零假设还是接受备择假设,都须作出决策。不管接受零假设还是接受备择假设,都须作出决策。例:根据从刚刚收到的货物中所抽取的零件的样本,质量控制检例:根据从刚刚收到的货物中所抽取的零件的样本,质量控制检验员就必须做出决策:是接受这批货物还是因为其不符合规格而向验员就必须做出决策:是接受这批货物还是因为其不符合规格而向供应商退回这批货物。假定零件的平均长度是供应商退回这批货物。假定零件的平均长度是2 2英寸。英寸。则上例中我们可建立如下的零假设和备择假设:则上例中我们可建立如下的零假设和备择假设:第8页,本讲稿共43页 建立零假设和备择假设总结:设设 表示在零假设和备择假设中考虑的某一特定数值。一般来说,表示在零假设和备择假设中考虑的某一特定数值。一般来说,对总体均值的假设检验采取下面的三种形式之一:对总体均值的假设检验采取下面的三种形式之一:第9页,本讲稿共43页第一类错误:第一类错误:拒绝正确的原假设,简称拒绝正确的原假设,简称“拒真拒真”;第二类错误第二类错误 :接受错误的原假设,简称:接受错误的原假设,简称“纳伪纳伪”如下所示:如下所示:我们把两类错误发生的概率表示如下:我们把两类错误发生的概率表示如下:第一类错误发生的概率;第一类错误发生的概率;第二类错误发生的概率;第二类错误发生的概率;9.2 第一类和第二类错误总体情况 结论 H0正确 H0错误接受H0 正确结论 第二类错误 拒绝H0 第一类错误 正确结论 第10页,本讲稿共43页 在实践中,我们通常确定允许犯第一类错误的概率的最大值,将其称为显著性水平。可以选择=0.05或=0.01。第11页,本讲稿共43页 例:联邦贸易委员会定期进行调查,目的是检验生产商们对自己产品的陈述。例如,大听的Hilltop咖啡的标签标明:听内至少装有3磅的咖啡,我们用假设检验来检验标签的陈述是否正确。若抽取了36听咖啡作为样本。步骤:1.建立零假设和备择假设。若根据样本计算出来的样本平均重量低于3磅,我们就可以怀疑零假设的正确性。究竟样本低到什么程度我们才可以认为对总体所作的假定是错误的呢?即愿意冒第一类错误的风险,错误的控告该公司违背了标签的陈述。这取决于决策者的态度。9.3 大样本情况下总体均值的单侧检验第12页,本讲稿共43页 当n=36时,样本均值服从正态分布,我们可以用统计量 的取值来衡量样本均值偏离总体均值的程度。我们先考察 的情况,下图表明观察到的样本均值低于总体均值的1.645倍标准差的概率是0.05。如果FTC认为,犯第一类错的概率为0.05是可以接受的,那么,只要统计量z的值显示样本均值低于总体均值的1.645倍的标准差以上,我们就可以拒绝零假设。也就是第13页,本讲稿共43页图1 样本均值低于总体均值的1.645倍的标准差的概率3第14页,本讲稿共43页 在进行检验之前,我们要确定犯第一类错误的最大允许概率,即显著性水平。在上例中,假定FTC的检验计划的主管人员作出了下列陈述:如果公司的产品重量符合技术规格的要求 ,我们就有99%的概率对该公司采取不利的行动。当我们控告该公司的产品重量不足时,我们愿意冒的犯这类错误的风险的概率是1%。可以推定,。查标准正态分布表,可得临界值为2.33。第15页,本讲稿共43页若根据样本均值计算得Z值小于-2.33,就可以拒绝零假设,接受备择假设。称 假定根据36个听装咖啡样本计算出的均值 ,有根据以前的研究,我们知道总体的标准差 ,计算z值:第16页,本讲稿共43页 若 ,则统计量的值 如果 ,犯第一类错误的概率比 时犯第一类错的概率小。检验统计量的值在拒绝域内出现的可能性更小。所以,确定检验的临界值时,只要假定 可以了。第17页,本讲稿共43页总结:在大样本情况下,无论总体标准差已知或未知,样本均在大样本情况下,无论总体标准差已知或未知,样本均值总是服从正态分布,则可归纳左侧检验的一般步骤:值总是服从正态分布,则可归纳左侧检验的一般步骤:1 1、建立零假设和备择假设、建立零假设和备择假设 2 2、确定检验统计量,并计算其值、确定检验统计量,并计算其值 3 3、根据事先确定的显著性水平,查标准正态分布表得临界值、根据事先确定的显著性水平,查标准正态分布表得临界值 4 4、拒绝规则:、拒绝规则:9.3.1 单个总体均值的单侧假设检验第18页,本讲稿共43页同理,在大样本情况下,右侧检验的一般步骤:同理,在大样本情况下,右侧检验的一般步骤:1 1、建立零假设和备择假设、建立零假设和备择假设 2 2、确定检验统计量,并计算其值、确定检验统计量,并计算其值 3 3、根据事先确定的显著性水平,查标准正态分布表得临界值、根据事先确定的显著性水平,查标准正态分布表得临界值 4 4、拒绝规则:、拒绝规则:第19页,本讲稿共43页 例:某市的一家公司生产一种新型的轮胎,这种新型轮胎的设计规格是平均行驶里程至少为28000英里。随机抽取了30只轮胎作为一个样本进行检验,结果,样本均值时27500英里,样本标准差是1000英里。采用0.05的显著性水平,检验是否有足够的证据拒绝轮胎的平均行驶里程至少为28000英里的陈述。解:已知1、建立零假设和备择假设 第20页,本讲稿共43页 2、确定检验统计量,并计算其值3、4、练习:P272,T14第21页,本讲稿共43页 P值是指观察到的样本均值小于或等于观察值的概率。也可以称为观测的显著性水平。以希尔托普公司的咖啡问题为例来计算样本均值 的P值。我们已经给出检验统计量的值z=-2.67,查标准正态分布表,可以求出在均值与z=-2.67之间的区域面积是0.4962。由此得到样本均值小于或等于观察值 的概率是0.5000-0.4962=0.0038,即P值就是0.0038。9.3.2 P值的作用第22页,本讲稿共43页 P值可以用来进行假设检验的决策,如果P值比显著性水平小,则检验统计量的值就在拒绝域内,若更大,则落入接受域内。上例中,P=0.0038,假设检验的P值标准 第23页,本讲稿共43页例:根据美国高尔夫球协会的准则,只有射程和滚动距离平均为280码的高尔夫球可在比赛中使用。假定某公司最近开发了一种高技术生产方法,用这种方法生产的高尔夫球的射程和滚动距离平均为280码。现在抽取一个有36个高尔夫球的随机样本来检验该公司的陈述是否为真。数据如下表。(假定在显著性水平为0.05的条件下进行)。9.4大样本情况下总体均值的双侧检验269301296275282276284272263300295265282263286260285264268288271260270293299293273278278279266269274277281291第24页,本讲稿共43页 该问题就是一个双侧检验的例子。先建立如下的零假设和备择假设:在大样本的情况下,仍然选择统计量Z,和单侧检验不同的是,此时的拒绝域分布在正态曲线的两侧,对应的概率均为 。查表时应该查 对应的临界值第25页,本讲稿共43页 上例中,依据表中资料可计算得,则统计量的值为根据给定的显著性水平第26页,本讲稿共43页归纳:在大样本情况下,双侧检验的一般步骤:归纳:在大样本情况下,双侧检验的一般步骤:1 1、建立零假设和备择假设、建立零假设和备择假设 2 2、确定检验统计量,并计算其值、确定检验统计量,并计算其值 3 3、根据事先确定的显著性水平,查标准正态分布表得临界值、根据事先确定的显著性水平,查标准正态分布表得临界值 4 4、拒绝规则:、拒绝规则:第27页,本讲稿共43页对于前面关于高尔夫球的例子,我们已知对应样本均值 的z值是-0.75,从标准正态分布表可以查到,在均值和z值-0.75只见的面积是0.2734。因此,左侧的面积为0.2266,而此时左侧的拒绝域内的面积为 =0.025。0.22660.025,统计量不再拒绝域内,不能拒绝零假设,与前的结论相同。P值为z值对应一侧面积的2倍。此时,判断的标准仍然是 9.4.2双侧检验的P值第28页,本讲稿共43页在大样本的情况下,给定置信水平 的总体均值的置信区间为:进行假设检验时,首先需要对总体的参数作出假定:双侧检验双侧检验9.4.3 区间估计和假设检验的关系(1)第29页,本讲稿共43页 因此,双侧假设检验的样本均值的非拒绝区域可以由下式给出:双侧假设检验的非拒绝域和置信区间之间的关系:(2)第30页,本讲稿共43页 由此得到由置信区间方法到假设检验的运算过程:假设的形式:(1)从总体中抽取一个简单随即样本构建总体均值的置信区间:(2)如果置信区间包含假定的 值,则不拒绝零假设 。否则,拒绝第31页,本讲稿共43页 例:仍然采用前述关于高尔夫球的双侧检验的例子:根据样本数据我们已经计算得到:对于给定的置信水平可以得到总体均值的95%的置信区间为:即274.58282.42总体均值的假设值 在这个区间,所以我们不能拒绝零假设。第32页,本讲稿共43页在区间估计中我们已经知道,当总体服从正态分布且总体方差未知时,小样本下的统计量这时对总体均值的检验就应该采用t统计量来进行。例:如果机场的总体平均质量等级得分大于或等于7分,那么就可以认为该机场提供的服务质量为优良。现随机抽取了12个乘客作为样本,得到伦敦某机场的质量等级分数如下:7、8、10、8、6、9、6、7、7、8、9、8。假定总体的等级近似服从标准正态分布,在0.05的显著性水平下可以认为该机场服务质量优良吗?9.5小样本情况下总体均值检验第33页,本讲稿共43页 1.建立零假设和备择假设 2.选择统计量t,并计算 3.4.第34页,本讲稿共43页 注意:小样本的情况下的检验步骤与判断准则与大样本情况下的基本不同,唯一的不同是小样本对应t分布,而大样本对应正态分布。另外,小样本下也可以运用P值来判断,但是由于t分布的表编制不很详细,不能通过查表来准确计算P值,但是判断的原则依然与前相同,练习:P282,T34第35页,本讲稿共43页 9.6 总体比例的检验第36页,本讲稿共43页 我们只考虑 的情况下,样本比例服从正态分布下的总体比例的假设检验。由于比例是特殊的均值,因此对比例进行检验的步骤及判断准则与对均值的检验相同,只需要检验统计量中的均值换成比例对应的指标就可。例:在过去的几个月中,在松树溪打高尔夫球的人中有20%是女性。为了提高女性高尔夫球收的比例,球场采取了一项特殊的激励措施来吸引女性。一周以后,随机抽取了400名球手作为一个样本,结果有300名男性和100名女性。课程经理想知道这些数据是否支持他们的结论:松树溪的女性高尔夫球手的比例有所增加。第37页,本讲稿共43页解:已知1、建立零假设和备择假设2、确定检验统计量,并计算其值3、4、第38页,本讲稿共43页 同样,我们可以计算该检验的P值,已知z=2.50,标准正态分布表显示均值与2.5之间的面积为0.4938,则P=0.5000-0.4938=0.0062。小于显著性水平0.05,拒绝零假设。以下是关于本章内容的总结:第39页,本讲稿共43页 总结:单个总体的假设检验总结:单个总体的假设检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:H1:z(2)H0:H1:(3)H0:H1:z0z0正态总正态总体体2已已知知第40页,本讲稿共43页条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:H1:t(2)H0:H1:(3)H0:H1:t0t00正态总正态总体体2未未知知(n30)第41页,本讲稿共43页条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:H1:z(2)H0:H1:(3)H0:H1:z0z00非正态非正态总体总体n302已知已知或未知或未知第42页,本讲稿共43页条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:P=P0 H1:PP0z(2)H0:PP0 H1:PP0(3)H0:PP0 H1:PP0z0z00np5nq5第43页,本讲稿共43页