统计学--假设检验课件.ppt
《统计学--假设检验课件.ppt》由会员分享,可在线阅读,更多相关《统计学--假设检验课件.ppt(99页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学统计学第第7 7章章 假设检验假设检验 正如一个法庭宣告某一判决为“无罪(not guilty)”而不为“清白(innocent)”,统计检验的结论也应为“不拒绝”而不为“接受”。 Jan KmentaJan Kmenta案例案例 辛普森杀妻案 辛普森案 (英语:O. J. Simpson murder caseO. J. Simpson murder case,又称加利福尼亚人民诉辛普森案,英语:People v.SimpsonPeople v.Simpson)是美国加利福尼亚州最高法院对前美式橄榄球明星、演员OO J J 辛普森进行的刑事诉讼,在该案中,辛普森被指控于19941994
2、年犯下两宗谋杀罪,受害人为其前妻妮克尔 布朗 辛普森及其好友罗纳德 高曼。该案被称为是美国历史上最受公众关注的刑事审判案件。 案发时间,1994年6月12日深夜 案发后凌晨,辛普森门外有血迹 现场滴落的血痕中有辛普森的血,辛普森家中血手套和辛普森的脏衣服都有被害人的血法庭战争检方的“铁证如山”与“梦幻律师团” 在检方看来,本案可谓是在检方看来,本案可谓是“铁证如山铁证如山”,本案中无论是证据数,本案中无论是证据数量,还是证据的可信程度,在检方看来,都达到了很高的标准。量,还是证据的可信程度,在检方看来,都达到了很高的标准。控辩双方几个关键的地方 控方:检方在审判的最初几周出示证据,证明辛普森曾
3、有对妮可尔的家庭暴力史。 辩方:时遭受丈夫家庭暴力中,遭受丈夫伤害的概率为1%1% 控方:鞋码与辛普森的相似,辛普森手上有划痕 辩方:世界上与辛普森鞋码一样的人数不胜数,在左手有伤痕的人也不尽其数,所以这样的证据对案件的判断是没有任何价值的。 控方:在犯罪现场发现的血液,DNADNA鉴定发现与辛普森是完全一致的,而DNADNA鉴定两个人一致的可能性只有万分之。 辩方:在洛杉矶300300万人口中,就有300300个人DANDAN一致,辛普森是洛杉矶人口的1 1人,所以,辛普森是杀人凶手的概率只有0.03%0.03%。如果认为新浦森有罪的话,那么误判的概率将高达99.97%.99.97%. 最终
4、无罪释放。 控方:平时遭受丈夫家庭暴力中,非正常死亡的,其凶手为丈夫的概率为80%80%。 控方:可能会有很多与辛普森鞋码一样的人,但也会有很多左手有划痕的人,但辛普森是一个嫌疑犯, 不能把他放在所有的人当中去进行归类,于是只能放在嫌疑犯中,在嫌疑犯中,跟辛普森鞋码吻合的人的概率非常之小法庭宣判过程 法官假定辛普森无罪控方搜集证据证明他有罪,只有当证据充足的时候才能宣判有罪,否则要接受法官的假定。辛浦森(Simpsons Paradox)悖论案例1: 是否存在种族歧视被告种族受害者种族死刑判决是否白人白人19132黑人09黑人白人1152黑人697 总的看总的看, 白人有白人有19/160=1
5、2% 的被告被判处死刑的被告被判处死刑, 与与之对应之对应, 黑人只有黑人只有17/166=10% 的被告被判死刑的被告被判死刑, 白人死白人死刑率要高一些刑率要高一些. 但如果考虑受害者的种族但如果考虑受害者的种族, 结论就相反结论就相反了了. 当受害者是白人时当受害者是白人时, 有有11/63=17.5% 的黑人被告被判的黑人被告被判死刑死刑, 而只有而只有 19/151=12.6% 的白人被告被判死刑的白人被告被判死刑. 当受当受害者是黑人时害者是黑人时, 白人被告没一个人白人被告没一个人( 0%)被判死刑被判死刑, 而黑而黑人被告确有人被告确有 6/103=5.8% 的被判死刑的被判死
6、刑. 控方:DNA鉴定 辩方:把辛普森至于300万人群当中,但新浦是是嫌疑犯,所以应把他放在嫌疑犯这个人群中,那么样本与他一致的也就他一个人综上,只有辛普森一个人符合三个条件第 7 7 章 假设检验7 7.1.1 假设检验的基本问题 7 7.2.2 一个总体参数的检验学习目标 1. 1.理解假设检验的基本思想和基本步骤 ; 2. 2.理解假设检验的两类错误及其关系; 3. 3.熟练掌握一个总体平均数、总体成数各种假设检验方法; 4. 4.利用P P - - 值进行假设检验。l用ExcelExcel进行检验假设检验知识结构总体参数检总体参数检验验均值均值比例比例方差方差均值差均值差比例差比例差方
7、差比方差比独立样本独立样本匹配样本匹配样本大样本大样本F F检验检验Z Z检验检验大样本大样本小样本小样本Z Z检验检验 1 12 2 2 22 2已知已知 1 12 2 2 22 2未知未知Z Z检验检验t t检验检验大样本大样本小样本小样本Z Z检验检验 2 2已知已知Z Z检验检验 2 2未知未知t t检验检验Z Z检验检验卡方检验卡方检验第 7 7 章 假设检验7.1.1 怎样提出假设?1.1.什么是假设? 假设:定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想。是对是对总体参数的一种假设。总体参数的一种假设。 常见的是对总体均值或比例和方差的检验; 在分析之前,被检
8、验的参数将被假定取一确定值。我认为到KFC消费的人平均花费2.5美元!2、市场调研中常见的假设检验问题市场调研中常见的假设检验问题 一项跟踪调查的结果表明,顾客对产品的了解程度比一项跟踪调查的结果表明,顾客对产品的了解程度比6个月个月前所做的类似调查中的显示要低。结果是否明显降低?是前所做的类似调查中的显示要低。结果是否明显降低?是否低到需要改变广告策略的程度?否低到需要改变广告策略的程度? 一位产品经理认为其产品购买者的平均年龄为一位产品经理认为其产品购买者的平均年龄为35岁。为岁。为检验其假设,他进行了一项调查,调查表明购买者平均年检验其假设,他进行了一项调查,调查表明购买者平均年龄为龄为
9、38.5岁。调查结果与其观点的差别是够足以说明此经岁。调查结果与其观点的差别是够足以说明此经理里的观点是不正确的理里的观点是不正确的?3、问题在哪里? 某广告商宣称其代理的A产品的合格率达到99%,质检人员为了验证,随机抽取了一件产品,发现是一件次品。质检人员会是什么反应呢?什么是假设检验? ? ( (hypothesis testhypothesis test) )1.1.先对总体的参数( (或分布形式) )提出某种假设,然后利用样本信息判断假设是否成立的统计方法2.2.有参数检验和非参数检验3.3.逻辑上运用反证法,统计上依据小概率原理小概率是在一次试验中,一个几乎不可能发生的事件发生的概
10、率在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设原假设(null hypothesis)(null hypothesis)1.1.又称“0 0假设”,研究者想收集证据予以反对的假设,用H H0 0表示2.2.所表达的含义总是指参数没有变化或变量之间没有关系 3.3.最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它 4.4.总是有符号 , , 或 H H0 0 : = = 某一数值H H0 0 : 某一数值H H0 0 : 某一数值l例如, , H H0 0 : 10cm10cm1.1.也称“研究假设”, ,研究者想收集证据予以支持的假设,用H H1 1或H Ha a表示2
11、.2.所表达的含义是总体参数发生了变化或变量之间有某种关系3.3.备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设 4.4.总是有符号 , , 或 H H1 1 : 某一数值H H1 1 : 某一数值H H1 1 : 某一数值备择假设备择假设(alternative hypothesis)【例】一种零件的生产标准是直径应为10cm10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常
12、的原假设和被择假设提出假设提出假设(例题分析例题分析)解:研究者想收集证据予以证明的假设应该是解:研究者想收集证据予以证明的假设应该是“生产生产过程不正常过程不正常”。建立的原假设和备择假设为。建立的原假设和备择假设为 H0 : 10cm H1 : 10cm 【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设提出假设(例题分析例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符
13、合说明书中的陈述净含量并不符合说明书中的陈述 。建立的原假设和备择。建立的原假设和备择假设为假设为 H0 : 500 H1 : 500【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设提出假设(例题分析例题分析)解:研究者想收集证据予以支持的假设是解:研究者想收集证据予以支持的假设是“该该城市中家庭拥有汽车的比例超过城市中家庭拥有汽车的比例超过30%”。建立的。建立的原假设和备择假设为原假设和备择假设为 H0 : 30% H1 : 30%提出假设 总结H H0 0: : 通常
14、是将研究者不愿相信的、不认可的、想拒绝的结论H H0 0 : = = 某一数值H H0 0 : 某一数值H H0 0 : 某一数值H H1 1: :与原假设是对立的,通常是研究者想要支持的、愿意相信的结果H H1 1 : 某一数值H H1 1 : 某一数值H H1 1 : ”或或“”的假的假设检验,称为单侧检验或单尾检验设检验,称为单侧检验或单尾检验(one-tailed test)(one-tailed test)备择假设的方向为备择假设的方向为“”,称为,称为右侧检验右侧检验 双侧检验与单侧检验双侧检验与单侧检验双侧检验与单侧检验 ( (假设的形式) )假设假设双侧检验双侧检验单侧检验左侧
15、检验左侧检验右侧检验右侧检验原假设H H0 0 : : = = 0 0H H0 0 : : 0 0H H0 0 : : 0 0备择假设H H1 1 : : 0 0H H1 1 : : 0 0以总体均值的检验为例以总体均值的检验为例7.1.2 怎样做出决策?7.1 假设检验的基本原理假设检验的基本原理假设检验的步骤 1.提出原假设H0和备择假设H1 2.构造适当的检验统计量 3.给定显著性水平 0.01, 0.05, 0.100.01, 0.05, 0.10 4.计算检验统计量的值 5.做出判断假设检验的基本思想 因此我们拒绝假因此我们拒绝假设设 = 50 如果这是总体的如果这是总体的假设均值假
16、设均值样本均值 = 50抽样分布抽样分布这个值不像我们应这个值不像我们应该得到的样本均值该得到的样本均值 .两类错误与显著性水平(了解)1.1. 研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误2.2. 原假设和备择假设不能同时成立,决策的结果要么拒绝H H0 0,要么不拒绝H H0 0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误 3.3. 第类错误( ( 错误) )原假设为正确时拒绝原假设第类错误的概率记为 ,被称为显著性水平 2.2.第类错误( ( 错误) )原假设为错误时未拒绝原假设第
17、类错误的概率记为 (Beta)(Beta)显著性水平 ( (significant levelsignificant level) )1.1.事先确定的用于拒绝原假设H H0 0时所必须的证据2.2.能够容忍的犯第类错误的最大概率( (上限值) )2.2.原假设为真时,拒绝原假设的概率 抽样分布的拒绝域3.3.表示为 (alpha)(alpha) 常用的 值有0.01, 0.05, 0.100.01, 0.05, 0.104.4.由研究者事先确定 错误和 错误的关系你不能同时减少两你不能同时减少两类错误类错误!依据什么做出决策?1. 1.若假设为若假设为H H0 0=500=500, H H1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 假设检验 课件
限制150内