《43列联表独立性分析案例》教案.docx
4.3 列联表独立性分析案例教案教学目标一学问与技能:通过本节学问的学习,了解独立性检验的根本思想和初步应用,能对两个分类变量是否有关做出明确的推断。明确对两个分类变量的独立性检验的根本思想具 体步骤,会对具体问题作出独立性检验。二过程与方法: 在本节学问的学习中,应使学生从具体问题中生疏进展独立性检验的作用及必要性,树立学好本节学问的信念,在此根底上学习三维柱形图和二维柱形图,并生疏它们的根本作用和存在的缺乏,从而为学习下面作好铺垫,进而介绍 K 的平方的计算公式和 K 的平方的观测值R 的求法,以及它们的实际意义。从中得出推断“X 与 Y 有关系” 的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种推断的牢靠程度的具体做法和可信程度的大小。最终介绍了独立性检验思想的综合运用(三)情感、态度与价值观:通过本节学问的学习,首先让学生了解对两个分类博变量进 行独立性检验的必要性和作用,并引导学生留意比较与观测值之间的联系与区分,从而引导 学生去探究学问,培育学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的 内在联系,培育学生学习数学、应用数学的良好的数学品质。加强与现实生活相联系,从对 实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联 系,学习用图形、数据来正确描述两个变量的关系。明确数学在现实生活中的重要作用和实 际价值。教学中,应多给学生供给自主学习、独立探究、合作沟通的时机。养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的学问来解决实际问题。教学重点:理解独立性检验的根本思想及实施步骤.教学难点:了解独立性检验的根本思想、了解随机变量K教学方法:诱思探究教学法学习方法:2的含义.自主探究、观看觉察、合作沟通、归纳总结。教学过程:一、复习预备:回归分析的方法、步骤,刻画模型拟合效果的方法相关指数、残差分析、步骤. 二、讲授课:1. 教学与列联表相关的概念: 分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量. 分类变量的取值确定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等. 分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义. 如用“0”表示“男”,用“1”表示“女”.不患肺癌患肺癌总计不吸烟7775427817吸 烟2099492148总 计9874919965 列联表:分类变量的汇总统计表频数表.一般我们只争论每个分类变量只取两个值,这样的列联表称为2 2 . 如吸烟与患肺癌的列联表:2. 教学三维柱形图和二维条形图的概念: 由列联表可以粗略估量出吸烟者和不吸烟者患肺癌的可能性存在差异.教师在课堂上用 EXCEL 软件演示三维柱形图和二维条形图,引导学生观看这两类图形的特征,并分析由图形得出的结论3. 独立性检验的根本思想: 独立性检验的必要性为什么中能只凭列联表的数据和图形下结论?:列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体. 独立性检验的步骤略及原理与反证法类似:反证法假设检验要证明结论A备择假设H1在A 不成立的前提下进展推理在 H 不成立的条件下,即H 成立的条件下进展推理10推出冲突,意味着结论A 成立推出有利于H 成立的小概率大事概率不超过a 的大事1发生,意味着 H 1 成立的可能性可能性为1a 很大没有找到冲突,不能对 A 下任 推出有利于H 1成立的小概率大事不发生,承受原假设何结论,即反证法不成功 上例的解决步骤第一步:提出假设检验问题H 0 :吸烟与患肺癌没有关系«H 1 :吸烟与患肺癌有关系其次步:选择检验的指标K2=n(ad - bc)2它越小,原假设“H :(a + b)(c + d )(a + c)(b + d )0吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H :吸烟与患肺癌有关1系”成立的可能性越大.P(k2>k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.845.0246.6357.87910.83第三步:查表得出结论三,例题讲解1. 三维柱形图中柱的高度表示的是 )A 各分类变量的频数B 分类变量的百分比C 分类变量的样本数D 分类变量的具体值解析: 三维柱形图中柱的高度表示图中各个频数的相对大小.选 A2. 统计推断,当时,有95 的把握说大事A 与 B 有关;当时,认为没有充分的证据显示大事A 与 B 是有关的.解析:当k > 3.841时,就有 95 的把握说大事A 与 B 有关,当k £ 2.076时认为没有充分的证据显示大事A 与B 是有关的.3. 为了探究患慢性气管炎与吸烟有无关系,调查了却339 名 50 岁以上的人,结果如下表所示,据此数据请问:50 岁以上的人患慢性气管炎与吸烟习惯有关系吗?患慢性气管炎未患慢性气管炎合计吸烟43162205不吸烟13121134合计56283339分析:有表中所给的数据来计算K 2 的观测值k,再确定其中的具体关系. 解:设患慢性气管炎与吸烟无关. a=43,b=162,c=13,d=121,a+b=205,c+d=134,a+c=56,b+d=283,n=339所以 K 2的观测值为k =n(ad - bc)2(a + b)(c + d )(a + c)(b = d )= 7.469 .因此k > 6.635 ,故有 99%的把握认为患慢性气管炎与吸烟有关. 四,课后练习:1. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就A.越大B.越小C.无法推断D.以上都不对2.以下关于三维柱形图和二维条形图的表达正确的选项是: ()A .从三维柱形图可以准确地看出两个分类变量是否有关系B .从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小C .从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系D .以上说法都不对3. 对分类变量X 与Y 的随机变量 K 2 的观测值K ,说法正确的选项是) A . k 越大,“ X 与Y 有关系”可信程度越小;B . k 越小,“ X 与Y 有关系”可信程度越小; C . k 越接近于 0,“ X 与Y 无关”程度越小D . k 越大,“ X 与Y 无关”程度越大4. 在吸烟与患肺病这两个分类变量的计算中,以下说法正确的选项是A. 假设 K2 的观测值为 k=6.635,我们有 99%的把握认为吸烟与患肺病有关系,那么在 100个吸烟的人中必有 99 人患有肺病;B. 从独立性检验可知有 99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有 99%的可能患有肺病;C. 假设从统计量中求出有 95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判消灭错误;D. 以上三种说法都不正确.5. 假设由一个 2*2 列联表中的数据计算得 k2=4.013,那么有把握认为两个变量有关系性别非统计专业统计专业专业男1310女7206. 某高校“统计初步”课程的教师随机调查了选该课的一些学生状况,具体数据如下表:为了推断主修统计专业是否与性别有关系,依据表中的数据,得到k = 50 ´(13´ 20 -10 ´ 7)2 23´ 27 ´ 20 ´ 30» 4.844由于 K 2 ³ 3.841 ,所以判定主修统计专业与性别有关系,那么这种推断出错的可能性为 ;7. 在对人们的休闲方式的一次调查中,共调查了124 人,其中女性 70 人,男性 54 人。女性中有 43 人主要的休闲方式是看电视,另外 27 人主要的休闲方式是运动;男性中有 21 人主要的休闲方式是看电视,另外 33 人主要的休闲方式是运动。(1) 依据以上数据建立一个 2×2 的列联表;(2) 推断性别与休闲方式是否有关系。参考答案1.A2.C3.B4.C5. 95%6. 5%性别休闲看电视运动总计方式7.解:12×2 的列联表女432770男213354总计64601242假设“休闲方式与性别无关”计算k = 124 ´ (43 ´ 33 - 27 ´ 21)270 ´ 54 ´ 64 ´ 60» 6.201由于k ³ 5.024 ,所以有理由认为假设“休闲方式与性别无关”是不合理的, 即有 97.5%的把握认为“休闲方式与性别有关”五,课时小结你能依据上例“吸烟与患肺癌的案例探究”总结“独立性检验”的具体做法步骤第一步:依据实际问题需要的可信程度确定临界值;其次步:利用公式计算随机变量K2 的观测值k;第三步:查对临界值表得出结论. 六,布置作业:七,板书设计