数学高考总复习重点独立性检验的基本思想及其初步应用新课标人教A.pptx
-
资源ID:87253276
资源大小:500.95KB
全文页数:28页
- 资源格式: PPTX
下载积分:20金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
数学高考总复习重点独立性检验的基本思想及其初步应用新课标人教A.pptx
分类变量和列联表分类变量和列联表(1)分类变量分类变量变量的不同变量的不同“值值”表示个体所属的表示个体所属的_,像这样,像这样的变量称为分类变量的变量称为分类变量(2)列联表列联表定义:列出的两个分类变量的定义:列出的两个分类变量的_,称为列联表,称为列联表22列联表列联表一般地,假设两个分类变量一般地,假设两个分类变量X和和Y,它们的取值分别为,它们的取值分别为x1,x2和和y1,y2,其样本频数列联表,其样本频数列联表(称称22列联表列联表)为为自学导引自学导引1不同类别频数表第1页/共29页y1y2总计总计x1ababx2cdcd总计总计acbdabcd想一想:如何理解分类变量?提示(1)这里的“变量”和“值”都应作为“广义”的变量和值来理解例如:对于性别变量,其取值有“男”和“女”两种,这里的“变量”指的是“性别”,这里的“值”指的是“男”或“女”因此,这里说的“变量”和“值”不一定是取具体的数值(2)分类变量是大量存在的例如:吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别第2页/共29页独立性检验独立性检验2定义定义利用随机变量利用随机变量K2来判断来判断“两个分类变量有关系两个分类变量有关系”的方法的方法称为独立性检验称为独立性检验公式公式K2_其中其中n_具体具体步骤步骤根据实际问题的需要,确定容许推断根据实际问题的需要,确定容许推断“两个分类变量两个分类变量有关系有关系”犯错误概率的上界犯错误概率的上界.然后查表然后查表确定确定_利用公式计算随机变量利用公式计算随机变量K2的的_如果如果_,就推断就推断“X与与Y有关系有关系”,这种,这种推断推断_不不超过超过,否则就认为在犯错误的概率,否则就认为在犯错误的概率不不超过超过的前提下不能推断的前提下不能推断“X与与Y有关系有关系”,或者在,或者在样本样本数据中数据中_支持支持结论结论“X与与Y有关系有关系”abcd临界值k0观测值k犯错误的概率没有发现足够证据kk0第3页/共29页独立性检验临界值表独立性检验临界值表P(K2k0)0.500.400.250.150.100.050.0250.010 0.0050.001k00.4550.7081.3232.0722.7063.8415.0246.635 7.879 10.828想一想想一想:在在K2运算时,在判断变量相关时,若运算时,在判断变量相关时,若K2的观测值的观测值k56.632,则,则P(K26.635)0.01和和P(K210.828)0.001,哪种说法是正确的?哪种说法是正确的?提示提示两种说法均正确两种说法均正确P(K26.635)0.01的含义是在犯错误的概率不超过的含义是在犯错误的概率不超过0.01的的前提下,认为两变量相关;前提下,认为两变量相关;而而P(K210.828)0.001的含义是在犯错误的概率不超过的含义是在犯错误的概率不超过0.001的前提下,认为两变量相关的前提下,认为两变量相关3.第4页/共29页在在22列联表中,如果两个分类变量没有关系,则应满足列联表中,如果两个分类变量没有关系,则应满足adbc0,因此,因此|adbc|越小,关系越弱;越小,关系越弱;|adbc|越大,越大,关系越强关系越强独立性检验的基本思想独立性检验的基本思想(1)独立性检验的基本思想类似于反证法,要确认独立性检验的基本思想类似于反证法,要确认“两个分两个分类变量有关系类变量有关系”这一结论成立的可信程度,首先假设该结这一结论成立的可信程度,首先假设该结论不成立,即假设结论论不成立,即假设结论“两个分类变量没有关系两个分类变量没有关系”成立,成立,在该假设下我们构造的随机变量在该假设下我们构造的随机变量K2应该很小,如果由观应该很小,如果由观测数据计算得到的测数据计算得到的K2的观测值很大,则在一定程度上说的观测值很大,则在一定程度上说明假设不合理,根据随机变量明假设不合理,根据随机变量K2的含义,可以通过的含义,可以通过P(K26.635)0.01来评价假设不合理的程度,由实际来评价假设不合理的程度,由实际计算出计算出k6.635,说明假设不合理,说明假设不合理名师点睛名师点睛12第5页/共29页的程度约为的程度约为99%,即,即“两个分类变量有关系两个分类变量有关系”这一结论成立这一结论成立的可信程度约为的可信程度约为99%.(2)在实际问题中要记住以下几个常用值:在实际问题中要记住以下几个常用值:k6.635有有99%的把握认为的把握认为“X与与Y有关系有关系”;k3.841有有95%的把握认为的把握认为“X与与Y有关系有关系”;k2.706有有90%的把握认为的把握认为“X与与Y有关系有关系”;k2.706就认为没有充分证据显示就认为没有充分证据显示“X与与Y有关系有关系”(3)反证法原理与独立性检验原理的比较反证法原理与独立性检验原理的比较反证法原理:在假设反证法原理:在假设H0下,如果推出一个矛盾,就证明了下,如果推出一个矛盾,就证明了H0不成立不成立独立性检验原理:在假设独立性检验原理:在假设H0下,如果出现一个与下,如果出现一个与H0相矛盾相矛盾的小概率事件,就推断的小概率事件,就推断H0不成立,且该推断犯错误的概率不成立,且该推断犯错误的概率不超过这个小概率不超过这个小概率第6页/共29页两个分类变量相关性检验方法两个分类变量相关性检验方法利用独立性检验来考察两个分类变量是否有关系,能利用独立性检验来考察两个分类变量是否有关系,能较精确地给出这种判断的可靠程度,具体的做法是:较精确地给出这种判断的可靠程度,具体的做法是:根据实际问题的需要确定容许推断根据实际问题的需要确定容许推断“两个分类变量有两个分类变量有关系关系”犯错误概率的上界犯错误概率的上界,然后查表确定临界值,然后查表确定临界值k0.计算随机变量计算随机变量K2的观测值的观测值k.如果如果kk0,就推断,就推断“X与与Y”有关系,这种推断犯错误的概率不超过有关系,这种推断犯错误的概率不超过,否则就认,否则就认为在犯错误的概率不超过为在犯错误的概率不超过的前提下不能推断的前提下不能推断“X与与Y有有关系关系”,或者在样本数据中没有发现足够证据支持结论,或者在样本数据中没有发现足够证据支持结论“X与与Y有关系有关系”3第7页/共29页题型一题型一有关有关“相关的检验相关的检验”某校对学生课外活动进行调查,结果整理成下表:某校对学生课外活动进行调查,结果整理成下表:试用你所学过的知识进行分析,能否在犯错误的概率试用你所学过的知识进行分析,能否在犯错误的概率不不超过超过0.005的前提下,认为的前提下,认为“喜欢体育还是文娱与性别喜欢体育还是文娱与性别有有关系关系”?【例1】体育体育文娱文娱总计总计男生男生212344女生女生62935总计总计275279第8页/共29页思路探索思路探索 可用数据计算可用数据计算K2,再确定其中的具体关系,再确定其中的具体关系解解判断方法如下:判断方法如下:假设假设H0“喜欢体育还是喜欢文娱与性别没有关系喜欢体育还是喜欢文娱与性别没有关系”,若,若H0成立,则成立,则K2应该很小应该很小a21,b23,c6,d29,n79,且P(K27.879)0.005即我们得到的K2的观测值k8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”第9页/共29页第10页/共29页为研究学生的数学成绩与对学习数学的兴趣是为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查得到如下数据:否有关,对某年级学生作调查得到如下数据:【变式1】成绩优秀成绩优秀成绩较差成绩较差总计总计兴趣浓厚的兴趣浓厚的643094 兴趣不浓厚的兴趣不浓厚的227395总计总计86103189判断学生的数学成绩好坏与对学习数学的兴趣是否有关?第11页/共29页第12页/共29页 为了探究学生选报文、理科是否与对外语的兴趣为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了有关,某同学调查了361名高二在校学生,调查结果如名高二在校学生,调查结果如下:理科对外语有兴趣的有下:理科对外语有兴趣的有138人,无兴趣的有人,无兴趣的有98人,人,文科对外语有兴趣的有文科对外语有兴趣的有73人,无兴趣的有人,无兴趣的有52人试分人试分析学生选报文、理科与对外语的兴趣是否有关?析学生选报文、理科与对外语的兴趣是否有关?思路探索思路探索 要在选报文、理科与对外语有无兴趣之间要在选报文、理科与对外语有无兴趣之间有无关系作出判断,可以运用独立性检验的方法进行有无关系作出判断,可以运用独立性检验的方法进行判断判断题型题型二二有关有关“无关的检验无关的检验”【例2】第13页/共29页解解列出列出22列联表列联表理理文文总计总计有兴趣有兴趣13873211无兴趣无兴趣9852150总计总计236125361规律方法规律方法运用独立性检验的方法:运用独立性检验的方法:(1)列出列出22列联表,根据公式计算列联表,根据公式计算K2的观测值的观测值k.(2)比较比较k与与k0的大小作出结论的大小作出结论第14页/共29页某教育机构为了研究人具有大学专科以上学历某教育机构为了研究人具有大学专科以上学历(包括大学专科包括大学专科)和对待教育改革态度的关系,随机抽取和对待教育改革态度的关系,随机抽取了了392名成年人进行调查,所得数据如下表所示:名成年人进行调查,所得数据如下表所示:【变式2】支持教育支持教育 改革改革情况情况学历学历积极支持积极支持教育改革教育改革不太赞成不太赞成教育改革教育改革总计总计大学专科以上学历大学专科以上学历39157196大学专科以下学历大学专科以下学历29167196总计总计68324392对于教育机构的研究项目,根据上述数据能得出什么结论第15页/共29页第16页/共29页 某企业有两个分厂生产某种零件,按规定内径尺某企业有两个分厂生产某种零件,按规定内径尺寸寸(单位:单位:mm)的值落在的值落在(29.94,30.06)的零件为优质品的零件为优质品从两个分厂生产的零件中各抽出从两个分厂生产的零件中各抽出500件,量其内径尺寸,件,量其内径尺寸,结果如下表:结果如下表:甲厂甲厂 题型题型三三独立性检验的基本思想独立性检验的基本思想【例3】分分组组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14)频频数数12638618292614第17页/共29页乙厂乙厂分分组组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14)频频数数297185159766218(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面22列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.甲厂甲厂乙厂乙厂总计总计优质品优质品非优质品非优质品总计总计第18页/共29页P(K2k0)0.050.01k03.8416.635审题指导审题指导 (1)分别计算甲、乙两厂优质品的频数与分别计算甲、乙两厂优质品的频数与500的的比值即为所求比值即为所求(2)根据已知数据填充根据已知数据填充22列联表,进行独立性检验列联表,进行独立性检验第19页/共29页(2)甲厂甲厂乙厂乙厂总计总计优质品优质品360320680非优质品非优质品140180320总计总计5005001 000(8分)第20页/共29页第21页/共29页下表是某地区的一种传染病与饮用水的调查表:下表是某地区的一种传染病与饮用水的调查表:【变式3】得病得病不得病不得病总计总计干净水干净水52466518不干净水不干净水94218312总计总计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异第22页/共29页得病得病不得病不得病总计总计干净水干净水55055不干净水不干净水92231总计总计147286第23页/共29页由于由于5.7855.024所以我们有所以我们有97.5%的把握认为该种疾病与饮用不干净的把握认为该种疾病与饮用不干净水有关水有关两个样本都能统计得到传染病与饮用不干净水有关这两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但一相同结论,但(1)中我们有中我们有99.9%的把握肯定结论的的把握肯定结论的正确性,正确性,(2)中我们只有中我们只有97.5%的把握肯定的把握肯定第24页/共29页 某小学对某小学对232名小学生调查中发现:名小学生调查中发现:180名男生名男生中有中有98名有多动症,另外名有多动症,另外82名没有多动症,名没有多动症,52名女生名女生中有中有2名有多动症,另外名有多动症,另外50名没有多动症,用独立性检名没有多动症,用独立性检验方法判断多动症与性别是否有关系?验方法判断多动症与性别是否有关系?错解错解 由题目数据列出如下列联表:由题目数据列出如下列联表:误区警示误区警示因未理解因未理解P(K2k0)的含义而致错的含义而致错【示例】多动症多动症无多动症无多动症总计总计男生男生9882180女生女生25052总计总计100132232第25页/共29页 应该是有应该是有(1P(K210.828)100%(10.001)100%的把握,的把握,而不是而不是P(K210.828)100%0.001100%的把握的把握正解 由题目数据列出如下列联表:多动症多动症无多动症无多动症总计总计男生男生9882180女生女生25052总计总计100132232第26页/共29页 本题的错误之处在于不能正确理解独本题的错误之处在于不能正确理解独立性检验步骤的含义,当计算的立性检验步骤的含义,当计算的K2的观测值的观测值k大于临界大于临界值值k0时,就可推断在犯错误的概率不超过时,就可推断在犯错误的概率不超过的前提下说的前提下说X与与Y有关系,这一点需牢记有关系,这一点需牢记第27页/共29页单击此处进入单击此处进入 活页规范训练活页规范训练第28页/共29页