3.2独立性检验-北师大版高中数学选修2-3课件(共26张PPT).pptx
2独立性检验,一,二,一、22列联表设A,B为两个变量,每一个变量都可以取两个值,若用a表示变量A取A1,且变量B取B1时的数据;用b表示变量A取A1,且变量B取B2时的数据;用c表示变量A取A2,且变量B取B1时的数据;用d表示变量A取A2,且变量B取B2时的数据,则会得到A,B之间的22列联表:,一,二,名师点拨22列联表实际就是一个两行两列的表,表中的四个值是两个变量A,B的取值,并且变量A取两个值,变量B取两个值.,一,二,【做一做1】下面是一个22列联表:则表中a,b处的值分别为()A.94,96B.52,50C.52,54D.54,52,答案:C,一,二,二、独立性检验设A,B为两个变量,A,B之间的22列联表如下:,用统计量2的大小来检验变量之间是否独立.2的公式为,一,二,(1)当22.706时,没有充分证据判定变量A,B有关联,可以认为变量A,B是没有关联的;(2)当2>2.706时,有90%的把握判定变量A,B有关联;(3)当2>3.841时,有95%的把握判定变量A,B有关联;(4)当2>6.635时,有99%的把握判定变量A,B有关联.,一,二,名师点拨1.独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的统计量,对假设的正确性进行判断.2.使用2统计量作22列联表的独立性检验时,一般要求表中的4个数据都大于5,数据越大,越能说明结果的普遍性.,一,二,【做一做2】想要检验喜欢参加体育活动是不是与性别有关,应该检验()A.H0:男性喜欢参加体育活动B.H0:女性不喜欢参加体育活动C.H0:喜欢参加体育活动与性别有关D.H0:喜欢参加体育活动与性别无关答案D,一,二,思考辨析判断下列说法是否正确,正确的在后面的括号内打“”,错误的打“”.(1)在22列联表中,若两个分类变量没有关系,则应满足ad-bc0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.()(2)独立性检验的基本思想实质上就是数学中的反证法.()(3)通过独立性检验验证有关系的两个变量之间其关联程度是百分之百.()(4)为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算20.99,根据这一数据分析没有理由认为电视栏目是否优秀与改革有关系.()答案(1)(2)(3)(4),探究一,探究二,思维辨析,【例1】某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213名.试作出22列联表.分析在22列联表中,共有两类变量,每一类变量都有两个不同的取值,然后算出相应的数据,列表即可.解列联表如下:,探究一,探究二,思维辨析,反思感悟分清类别是作列联表的关键步骤,对所给数据要明确属于哪一类.,探究一,探究二,思维辨析,变式训练1下面是一个22列联表,则表中a,b处的值分别为(),A.32,40B.42,50C.74,82D.64,72解析a=53-21=32,b=a+8=40.答案A,探究一,探究二,思维辨析,【例2】为了调查某生产线上质量监督员甲对产品质量的好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.能否有99%的把握认为质量监督员甲在不在生产现场与产品质量的好坏有关系?分析解答本题先分析列联表,后计算2,再与临界值比较,判断得到结论.,探究一,探究二,思维辨析,解22列联表如下:,由22列联表中数据,计算得到2的值为因此,有99%的把握认为质量监督员甲在不在生产现场与产品质量好坏有关系.,探究一,探究二,思维辨析,反思感悟独立性检验的具体做法(1)根据实际问题作出两个分类变量的22列联表.(3)比较2与临界值的大小,推断有多大把握认为两个分类变量之间有关系.,探究一,探究二,思维辨析,变式训练2某校对学生课外活动内容进行调查,结果整理成22列联表如下:试分析喜欢体育还是喜欢文娱与性别之间多大程度上有关.,因为8.106>6.635,所以有99%以上的把握认为喜欢体育还是喜欢文娱与性别有关.,探究一,探究二,思维辨析,因不理解独立性检验的含义而致误【典例】对于“有99%的把握认为吸烟与患肺癌是有关的”,以下理解正确的是.(1)100个吸烟的人中有99个患有肺癌;(2)吸烟者有可能不患肺癌,不吸烟者可能患肺癌;(3)吸烟者一定患肺癌,不吸烟者一定不患肺癌;(4)“吸烟与患肺癌有关系”这一结论准确性在99%以上.易错分析独立性检验的含义是指在犯错误的概率较小的情况下我们有多少把握认为两变量之间有关系,而没有表明有多大的关系.若理解有误,则会致误.,探究一,探究二,思维辨析,解析:吸烟与患肺癌有关系,并非吸烟一定患肺癌,所以(2)正确,(3)错误;吸烟与患肺癌之间有关系的概率为99%,并非指吸烟者中有99%的人患肺癌,而是指我们有99%的把握认为“吸烟与患肺癌有关系”,这里所说的“吸烟与患肺癌有关系”是指统计上的关系,而非因果关系,至于吸烟者患不患肺癌,应该由医学检查来确定,而非统计学上的事,所以(4)正确;(1)错误.答案:(2)(4)纠错心得强化对概念或原理的理解“两个变量之间有关系的概率”不同于“事件发生的概率”,“有99%的把握认为吸烟与患肺癌是有关的”是指吸烟与患肺癌之间有关系的概率是99%,而不是指吸烟者中有99%的人患有肺癌.,探究一,探究二,思维辨析,变式训练某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录进行比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用22列联表计算得23.918.则下列表述中正确的是()A.有95%的把握认为“这种血清能起到预防感冒的作用”B.若有人未使用该血清,则他一年中有95%的可能性得感冒C.这种血清预防感冒的有效率为95%D.这种血清预防感冒的有效率为5%,解析由题意可知根据23.918>3.841,因此有95%的把握认为“这种血清能起到预防感冒的作用”,B,C,D表达有误.答案A,1,2,3,4,5,1.对两个分类变量A,B的下列说法正确的个数为()A与B相关性越大,则2的值就越大;A与B无关,即A与B互不影响;2的大小是判定A与B是否相关的唯一依据.A.1B.2C.3D.0,1,2,3,4,5,2.某班主任对全班50名学生进行了作业量的调查,数据如下表:则有多大的把握推断“学生的性别与认为作业量大有关”()A.99%B.95%C.90%D.85%,1,2,3,4,5,3.下面是一个22列联表:则表中a,b的值分别为()A.94,96B.52,50C.47,46D.54,52解析:a=68-21=47,b=21+25=46.答案:C,1,2,3,4,5,4.在一个22列联表中,通过数据计算2=8.325,则这两个变量间有关系的可能性为.答案99%,1,2,3,4,5,5.在从烟台到大连的某次航运中,海上出现恶劣气候,随机调查男、女乘客在船上晕船的情况如下表所示:根据此资料:在恶劣气候航行中,晕船与性别关.(填“有”或“无”),1,2,3,4,5,所以我们没有充分的证据说晕船跟性别有关,可以认为晕船与性别无关.答案:无,