独立性检验的基本思想及其初步应用教案.docx
精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -精品教学教案2.2.3独立性检验的基本思想及其初步应用授课类型: 新授课一、教学内容与教学对象分析通过典型案例,学习以下一些常用的统计方法,并能初步应用这些方法解决一些实际问题。通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究。明白独立性检验(只要求2× 2 列联表)的基本思想、方法及初步应用。通过对典型案例(如“人的体重与身高的关系”等)的探究,明白回来的基本思想、方法及其初步应用。二 . 学习目标1、学问与技能通过本节学问的学习,明白独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判定。明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。2、过程与方法在本节学问的学习中,应使同学从具体问题中熟悉进行独立性检验的作用及必要性,树立学好本节学问的信心,在此基础上学习三维柱形图和二维柱形图,并熟悉它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍 K 的平方的运算公式和K 的平方的观测值R 的求法,以及它们的实际意义。从中得出判定 “X与 Y 有关系 ”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较精确的给出这种判定的牢靠程度的具体做法和可信程度的大小。最终介绍了独立性检验思想的综合运用。3、情感、态度与价值观通过本节学问的学习,第一让同学明白对两个分类博变量进行独立性检验的必要性和作用,并引导同学留意比较与观测值之间的联系与区分,从而引导同学去探究新学问,培育同学全面的观点和辨证的分析问题,不为假想所困惑,寻求问题的内在联系,培育同学学习数学、应用数学的良好的数学品质。加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。明确数学在现实生活中的重要作用和实际价值。教学中,应多给同学供应自主学习、独立探究、合作沟通的机会。养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的学问来解决实际问题。三教学重点、难点教学重点 :懂得独立性检验的基本思想。独立性检验的步骤。教学难点 。 1、懂得独立性检验的基本思想。2、明白随机变量K 2 的含义。3、独立性检验的步骤。四、教学策略教学方法:诱思探究教学法学习方法:自主探究、观看发觉、合作沟通、归纳总结。教学手段:多媒体帮助教学五、教学过程:对于性别变量,其取值为男和女两种这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量 在现实生活中,分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍,等等在日常生活中,我们经常关怀两个分类变量之间是否有关系例如,吸烟与患肺癌是否有关系?性别对于是否喜爱数学课程有影响?等等为调查吸烟是否对肺癌有影响,某肿瘤讨论所随机的调查了9965 人,得到如下结果(单位:人)表 3-7吸烟与肺癌列联表可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 1 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -精品教学教案不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965那么吸烟是否对患肺癌有影响吗?像表 3 一 7 这样列出的两个分类变量的频数表,称为列联表由吸烟情形和患肺癌情形的列联表可以粗略估量出:在不吸烟者中, 有 0.54患有肺癌。在吸烟者中,有2.28 患有肺癌因此,直观上可以得到结论:吸烟者和不吸烟者患肺癌的可能性存在差异与表格相比,三维柱形图和二维条形图能更直观的反映出相关数据的总体状况图3.2 一 1 是列联表的三维柱形图,从中能清楚的看出各个频数的相对大小图 3.2 一 2 是叠在一起的二维条形图,其中浅色条高表示不患肺癌的人数,深色条高表示患肺癌的人数从图中可以看出,吸烟者中患肺癌的比例高于不吸烟者中患肺癌的比例为了更清楚的表达这个特点,我们仍可用如下的等高条形图表示两种情形下 患肺癌的比例如图3.2 一 3 所示,在等高条形图中,浅色的条高表示不患肺癌的百分比。深色的条高表示患肺癌的百分比通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关” 那么我们是否能够以肯定的把握认为“吸烟与患肺癌有关”了?为了回答上述问题,我们先假设H0 :吸烟与患肺癌没有关系用A 表示不吸烟,B 表示不患肺癌,就“吸烟与患肺癌没有关系”独立”,即假设 H 0 等价于PAB) =PA) +PB .把表 3 一 7 中的数字用字母代替,得到如下用字母表示的列联表: 表 3-8吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d在表 3 一 8 中, a 恰好为大事AB发生的频数。 a+b 和 a+c 恰好分别为大事 A 和 B 发生的频数 由于频率近似于概率,所以在 H0 成立的条件下应当有aabac可编辑资料 - - - 欢迎下载精品名师归纳总结,nnn总计a+cb+da+b+c+d可编辑资料 - - - 欢迎下载精品名师归纳总结其中 nabcd 为样本容量,a+b+c+d a+ba+c ,即 ad bc.因此, |ad-bc|越小,说明吸烟与患肺癌之间关系越弱。|ad -bc|越大,说明吸烟与患肺癌之间关系越强为了使不同样本容量的数据有统一的评判标准,基于上面的分析,我们构造一个随机变量2可编辑资料 - - - 欢迎下载精品名师归纳总结2nadbcKabcdacbd1可编辑资料 - - - 欢迎下载精品名师归纳总结其中 nabcd 为样本容量如 H 0 成立,即“吸烟与患肺癌没有关系”,就 K “应当很小依据表3 一 7 中的数据,利用公式(1)运算得到 K “的观测值为2K 29965 77754942209956.632,78172148987491这个值究竟能告知我们什么了?统计学家经过讨论后发觉,在H0 成立的情形下,2P K6.6350.01.2可编辑资料 - - - 欢迎下载精品名师归纳总结2 )式说明,在H0 成立的情形下,2K的观测值超过6. 635的概率特别小,近似为0 . 01,是一个小概可编辑资料 - - - 欢迎下载精品名师归纳总结率大事现在K 2 的观测值 k 56.632,远远大于6. 635 ,所以有理由肯定H0 不成立,即认为“吸烟与患肺癌可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 2 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -精品教学教案有关系”但这种判定会犯错误,犯错误的概率不会超过0.01 ,即我们有99的把握认为 “吸烟与患肺癌有关系”.可编辑资料 - - - 欢迎下载精品名师归纳总结在上述过程中,实际上是借助于随机变量K 2 的观测值 k 建立了一个判定H0 是否成立的规章:可编辑资料 - - - 欢迎下载精品名师归纳总结假如 k 6. 635,就判定H0 不成立,即认为吸烟与患肺癌有关系。否就,就判定H0 成立,即认为吸烟与患肺癌没有关系在该规章下,把结论“H 0 成立”错判成“H0 不成立”的概率不会超过可编辑资料 - - - 欢迎下载精品名师归纳总结P K 26.6350.01,可编辑资料 - - - 欢迎下载精品名师归纳总结即有 99的把握认为从不成立上面解决问题的想法类似于反证法要确认是否能以给定的可信程度认为“两个分类变量有关系”,第一假设该结论不成立,即H 0: “两个分类变量没有关系”可编辑资料 - - - 欢迎下载精品名师归纳总结成立 在该假设下我们所构造的随机变量K 2 应当很小 假如由观测数据运算得到的K 2 的观测值k 很大, 就在一可编辑资料 - - - 欢迎下载精品名师归纳总结定可信程度上说明H 0 不成立,即在肯定可信程度上认为“两个分类变量有关系”。假如 k 的值很小,就说明由样本观测数据没有发觉反对H 0 的充分证据可编辑资料 - - - 欢迎下载精品名师归纳总结怎样判定K 2 的观测值k 是大仍是小了?这仅需确定一个正数k , 当 kk 时就认为K 2 的观测值 k 大此可编辑资料 - - - 欢迎下载精品名师归纳总结00可编辑资料 - - - 欢迎下载精品名师归纳总结时相应于k0 的判定规章为:可编辑资料 - - - 欢迎下载精品名师归纳总结假如 kk0 ,就认为“两个分类变量之间有关系”。否就就认为“两个分类变量之间没有关系”.可编辑资料 - - - 欢迎下载精品名师归纳总结我们称这样的k0 为一个判定规章的临界值依据上述规章,把“两个分类变量之间没有关系”错误的判定为可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结“两个分类变量之间有关系”的概率为PK 2k0 .可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结2在实际应用中,我们把kk0 说明为有 1P K 2k0 100% 的把握认为“两个分类变量之间有关系”。可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结把 kk0 说明为不能以1PKk0 100% 的把握认为“两个分类变量之间有关系”,或者样本观测数据没可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结有供应“两个分类变量之间有关系”的充分证据上面这种利用随机变量K 2 来确定是否能以肯定把握认为“两可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结个分类变量有关系”的方法,称为两个分类变量的独立性检验 利用上面结论,你能从列表的三维柱形图中看出两个变量是否相关吗?一般的, 假设有两个分类变量X 和 Y ,它们的可能取值分别为x1 , x2 和y1 , y2 , 其样本频数列联表(称可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结为 2× 2 列联表)为:表 3 一 92× 2 列联表如要推断的论述为Hl:X 与 Y 有关系,y1y2总计x可编辑资料 - - - 欢迎下载精品名师归纳总结可以按如下步骤判定结论H l成立的可能性:1abab可编辑资料 - - - 欢迎下载精品名师归纳总结1通过三维柱形图和二维条形图,可以粗略的判定两个分类变量是否有关系,但是这种判定无法精确的给出所得结论的牢靠程度 在三维柱形图中,主对角线上两个柱形高度的乘积ad 与副对角线上的两个柱形高度的乘积bc 相差越大, H1 成立的可能性就越大x2cdcd总计acbdabcd可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 3 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -精品教学教案可编辑资料 - - - 欢迎下载精品名师归纳总结 在二维条形图中,可以估量满意条件X=x1 的个体中具有Y=y1 的个体所占的比例a,也可以估量满ab可编辑资料 - - - 欢迎下载精品名师归纳总结足条件 X=x 的个体中具有Y= y ,的个体所占的比例c.“ 两个比例的值相差越大,Hl 成立的可能性就越大可编辑资料 - - - 欢迎下载精品名师归纳总结22cd2可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确的给出这种判定的牢靠程度具体做法是:可编辑资料 - - - 欢迎下载精品名师归纳总结 依据实际问题需要的可信程度确定临界值k0 。可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结 利用公式(1 ,由观测数据运算得到随机变量K 2 的观测值 k ;可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结 假如kk0 ,就以 1P K 2k0 100% 的把握认为 “X 与 Y 有关系”。否就就说样本观测数据没有提可编辑资料 - - - 欢迎下载精品名师归纳总结供“ X 与 Y 有关系”的充分证据在实际应用中,要在猎取样本数据之前通过下表确定临界值:表 3 一 10可编辑资料 - - - 欢迎下载精品名师归纳总结P K 2k0k0 (四)、举例 :0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0721.3232.7063.8415.0246.63510.828例 1在某医院,由于患心脏病而住 院的665 名男性病可编辑资料 - - - 欢迎下载精品名师归纳总结人中,有214 人秃顶,而另外772 名不是由于患心脏病而住院的男性病人中有175 人秃顶1利用图形判定秃顶与患心脏病是否有关系2能够以99 的把握认为秃顶与患心脏病有关系吗?为什么?解:依据题目所给数据得到如以下联表:1相应的三维柱形图如图3.2 一 4 所示比较来说,底面副对角线上两个柱体高度的乘积要大一些,可以在某种程度上认为“秃顶与患心脏病有关”.2依据列联表3 一 11 中的数据,得到14372145971754512k16.373>6 .3891048665772因此有99 的把握认为“秃顶与患心脏病有关”.例 2为考察高中生的性别与是否喜爱数学课程之间的关系,在某城市的某校高中生中随机抽取300 名同学,得到如以下联表:表 3 一 12 性别与喜爱数学课程列联表喜爱数学课程不喜爱数学课程总计男3785122女35143178总计72228300可编辑资料 - - - 欢迎下载精品名师归纳总结由表中数据运算得K 2 的观测值 k4.514 能够以95的把握认为高中生的性别与是否喜爱数学课程之间有关可编辑资料 - - - 欢迎下载精品名师归纳总结系吗?请具体阐明得出结论的依据解:可以有约95以上的把握认为“性别与喜爱数学课之间有关系”作出这种判定的依据是独立性检验的可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 4 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -精品教学教案基本思想,具体过程如下:分别用 a , b , c , d 表示样本中喜爱数学课的男生人数、不喜爱数学课的男生人数、喜爱数学课的女生人数、可编辑资料 - - - 欢迎下载精品名师归纳总结不喜爱数学课的女生人数假如性别与是否喜爱数学课有关系,就男生中喜爱数学课的比例aab与女生中喜爱可编辑资料 - - - 欢迎下载精品名师归纳总结数学课的人数比例c cd应当相差许多,即可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结|acabcd| |adbc| abcd 应很大可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结将上式等号右边的式子乘以常数因子 abcd ab cd,可编辑资料 - - - 欢迎下载精品名师归纳总结然后平方得nadbc2K 2, abcd acbd ac bd 可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结其中 nabcd 因此K 2 越大,“性别与喜爱数学课之间有关系”成立的可能性越大可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结另一方面,在假设“性别与喜爱数学课之间没有关系”的前提下,大事A =K 2 3. 841的概率为P K 2 可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结3. 8410.05,因此大事A 是一个小概率大事而由样本数据运算得2K的观测值k=4.514 ,即小概率大事A 发生 因此应当断可编辑资料 - - - 欢迎下载精品名师归纳总结定“性别与喜爱数学课之间有关系”成立,并且这种判定结果出错的可能性约为5 %所以,约有95 的把握认为“性别与喜爱数学课之间有关系”.补充例题1:打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?患心脏病未患心脏病合计每一晚都打鼾30224254不打鼾2413551379合计5415791633解:略。补充例题2: 对 196 个接受心脏搭桥手术的病人和196 个接受血管清障手术的病人进行3 年跟踪讨论, 调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试依据上述数据比较两种手术对病人又发作心脏病的影响有没有差别。解略(四)课堂小结1学问梳理可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 5 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -精品教学教案2规律小结( 1)三维柱形图与二维条形图( 2)独立性检验的基本思想( 3)独立性检验的一般方法(五)作业:五课后反思:本节内容对独立性检验的探讨过程同学基本没什么困难,仍有同学提出了新的探讨路径和思想,同学思维活泼!对独立性检验的作用,本节课也作了系统总结比较。独立性检验练习题当堂自查题一、挑选题1对长期吃含三聚氰胺的婴幼儿奶粉与患肾结石这两个分类变量的运算中,以下说法正确选项()A. 如 K 2 的值大于6.635, 我们有 99%的把握认为长期吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系,那么在 100 个长期吃含三聚氰胺的三鹿奶粉的婴幼儿中必有99 人患有肾结石病;B.从独立性检验可知有99%的把握认为吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系时,我们说某一个婴幼儿吃含三聚氰胺的三鹿婴幼儿奶粉,那么他有99%的可能患肾结石病;C.如从统计量中求出有95% 的把握认为吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系,是指有5% 的可能性使得推判显现错误;D. 以上三种说法都不正确。2为了讨论色盲与性别的关系,调查了1 000 人,调查结果如下表所示:男女正常442514色盲386依据上述数据,试问色盲与性别关系是()A. 相互独立B. 不相互独立C. 有 99.9的把握认为色盲与性别无关D.只有 0.1的把握认为色盲与性别有关 3 给出 2× 2 列联表如下:优秀不优秀总计可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 6 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -精品教学教案甲班202545乙班182745总计385290依据表格供应的数据,估量“成果与班级有关系”犯错误的概率约是()A. 0.4B.0.5C.0.75D. 0.85课后检测题可编辑资料 - - - 欢迎下载精品名师归纳总结二、填空题4.通过运算高中生的性别与喜爱唱歌列联表中的数据,得到K 24.98 ,并且已知P K 23.8410.05, 那么可以可编辑资料 - - - 欢迎下载精品名师归纳总结得到的结论是5下面是一个2× 2 列联表y1y2总计x1a4268x2181230总计b54就表中 a、b 处的值分别为,6为了考查某种药物预防疾病的成效,进行动物试验,得到如下的列联表:患病未患病总计服用药104555没服用药203050总计3075105就 K 2三、运算题7. 某大型企业人力资源部为了讨论企业员工工作积极性和对企业改革态度的关系,随机抽取了189 名员工进行调查,所得数据如下表所示:积极支持企业改革不赞成企业改革合计工作积极544094可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 7 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -精品教学教案工作一般326395合计86103189对于人力资源部的讨论项目,依据上述数据能得出什么结论?独立性检验练习题参考答案当堂自查题可编辑资料 - - - 欢迎下载精品名师归纳总结一、挑选题1C 对于 A ,如K 2 的值为 6.635, 我们有 99%的把握认为吃含三聚氰胺的三鹿奶粉的婴幼儿与患肾结石有关系,可编辑资料 - - - 欢迎下载精品名师归纳总结但在 100 个吃含三聚氰胺的三鹿婴幼儿奶粉婴幼儿中未必有99 人患有肺病 ; 对于 B 同样不成立, C 是正确的 ,应选 C.可编辑资料 - - - 欢迎下载精品名师归纳总结2 Bk27.13910,828,所以的99.9的把握认为色盲与性别是有关的,从而拒绝原假设,可以认为色可编辑资料 - - - 欢迎下载精品名师归纳总结29020272518 2729000454538524001400盲与性别不是相互独立.可编辑资料 - - - 欢迎下载精品名师归纳总结3 B 运算 K0.182186232.706 可知, 没有充分理由说明“成果与班可编辑资料 - - - 欢迎下载精品名师归纳总结级有关系 ”,即成果的 “优秀与不优秀”与班级是相互独立的,所以估量“成果与班级有关系”犯错误的概率约是0.5.课后检测题二填空题4有约 95%以上的把握认为“性别与喜爱唱歌之间有关系”5 26, 44由于 a+42=68, b+54=68+30 ,所以 a=68-42=26 ,b=68+30-54=44三、解答题可编辑资料 - - - 欢迎下载精品名师归纳总结7. 解:依据列联表中的数据,得到2189546340322K10.76 949586103可编辑资料 - - - 欢迎下载精品名师归纳总结因 10.767.879 ,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业 的全体员工对待企业改革的态度与其工作积极性是有关的可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 8 页,共 8 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载