【高中数学】分类变量与列联表教学课件 高二数学人教A版2019选择性必修第三册.pptx
-
资源ID:96593080
资源大小:869.70KB
全文页数:22页
- 资源格式: PPTX
下载积分:6金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
【高中数学】分类变量与列联表教学课件 高二数学人教A版2019选择性必修第三册.pptx
1人教人教A A版版20192019选择性必修第三册选择性必修第三册1.了解探究分类变量之间关系的方法2.制作、理解22列联表,用频率分析法、图形分析法探究两个分类变量之间的关系3.能够对统计数据进行简单整理、初步分析提升数学抽象、数据建模及数据分析素养学习目标吸烟是否会增加患肺癌的风险?吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低人们的生活质量、缩短人类寿命的紧迫问题为此,联合国固定每年5月31日为全球戒烟日环节一:创设情境,引入课题前面两节所讨论的变量,如人的身高、树的胸径、树的高度、短跑100m世界纪录和创纪录的时间等,都是数值变量数值变量的取值为实数,其大小和运算都有实际含义在现实生活中,人们经常需要回答一定范围内的两种现象或性质之间是否存在关联性或相互影响的问题例如,就读不同学校是否对学生的成绩有影响,不同班级学生用于体育锻炼的时间是否有差别,吸烟是否会增加患肺癌的风险,等等本节将要学习的独立性检验方法为我们提供了解决这类问题的方案在讨论上述问题时,为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量分类变量的取值可以用实数表示,例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示,等等在很多时候,这些数值只作为编号使用,并没有通常的大小和运算意义本节我们主要讨论取值于0,1的分类变量的关联性问题如何利用统计数据判断一对分类变量之间是否具有关联性呢?对于这样的统计问题,有时可以利用普查数据,通过比较相关的比率给出问题的准确回答,但在大多数情况下,需要借助概率的观点和方法我们先看下面的具体问题 问题 为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查全校学生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?那么,只要求出f0和f1的值,通过比较这两个值的大小,就可以知道女生和男生在锻炼的经常性方面是否有差异,由所给的数据,经计算得到这是一个简单的统计问题最直接的解答方法是,比较经常锻炼的学生在女生和男生中的比率为了方便,我们设环节二:观察分析,感知概念 上面的问题还可以通过建立一个古典概型,使用条件概率的语言,给出另外一种解答方法用表示该校全体学生构成的集合,这是我们所关心的对象的总体考虑以为样本空间的古典概型,并定义一对分类变量X和Y如下:对于中的每一名学生,分别令环节三:抽象概括,形成概念为了清楚起见,我们用表格整理数据,如表8.3-1所示 表8.3-1 单位:人性别性别锻炼锻炼合计合计不经常不经常(Y=0)经常经常(Y=1)女生女生(X=0)192331523男生男生(X=1)128473601合计合计3208041124环节四:辨析理解,深化概念在上面问题的两种解答中,使用了学校全部学生的调查数据,利用这些数据能够完全确定解答问题所需的比率和条件概率然而,对于大多数实际问题,我们无法获得所关心的全部对象的数据,因此无法准确计算出有关的比率或条件概率在这种情况下,上述古典概型和条件概率的观点为我们提供了一个解决问题的思路比较简单的做法是利用随机抽样获得一定数量的样本数据,再利用随机事件发生的频率稳定于概率的原理对问题答案作出推断将所关心的对象的体看成古典概型的样本空间,就可以用概率的语言刻画相关的问题,进而用频率稳定于概率的原理推断问题的答案很多统计方法都是基于这种思想建立起来的将所关心的对象的全体看成古典概型的样本空间,就可以用概率的语言刻画相关的问题,进而用频率稳定于概率的原理推断问题的答案很多统计方法都是基于这种思相建立起来的例1 为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀试分析两校学生中数学成绩优秀率之间是否存在差异我们将所给数据整理成表8.3-2学校学校数学成绩数学成绩合计合计不优秀不优秀(Y=0)优秀优秀(Y=1)甲校甲校(X=0)331043乙校乙校(X=1)38745合计合计711788环节五:课堂练习,巩固运用我们可以用等高堆积条形图直观地展示上述计算结果,如图8.3-1所示在图8.3-1中,左边的蓝色和红色条的高度分别是甲校学生中数学成绩不优秀和数学成绩优秀的频率;右边的蓝色和红色条的高度分别是乙校学生中数学成绩不优秀和数学成绩优秀的频率通过比较发现,两个学校学生抽样数据中数学成绩优秀的频率存在差异,甲校的频率明显高于乙校的频率依据频率稳定于概率的原理,我们可以推断 也就是说,如果从甲校和乙校各随机选取一名学生,那么甲校学生数学成绩优秀的概率大于乙校学生数学成绩优秀的概率因此,可以认为两校学生的数学成绩优秀率存在差异,甲校学生的数学成绩优秀率比乙校学生的高思考:你认为“两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的?事实上,“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差异推断出来的有可能出现这种情况:在随机抽取的这个样本中,两个频率间确实存在差异,但两校学生的数学成绩优秀率实际上是没有差别的这就是说,样本的随机性导致了两个频率间出现较大差异在这种情况下,我们推断出的结论就是错误的后面我们将讨论犯这种错误的概率大小问题1.牢牢记3个知个知识点点(1)分分类变量的概念;量的概念;(2)22列列联表;表;(3)等高堆等高堆积条形条形图.2.掌握掌握2个方法个方法(1)用用22列列联表分析两分表分析两分类变量量间关系的方法;关系的方法;(2)用等高堆用等高堆积条形条形图分析两分分析两分类变量量间关系的方法关系的方法.3.注意注意1个易个易错点点作作22列列联表表时,关,关键是是对涉及的涉及的变量分清量分清类别,计算算时要准确无要准确无误.4.要理解通过抽样数据得出的结论是有误差的,我们下一节将进一步学习如何评估结论的可靠性。环节六:归纳总结,反思提升5.22列联表 给出了两个分类变量数据的交叉分类频数 6.判断两个分类变量之间是否具有关联性的三种方法图形分析法频率分析法条件概率法这样得出的结论是否会出现错误呢?是由什么引起的?环节七:目标检测,作业布置完成教材:第127页练习第4题.练习 第127页1成语“名师出高徒”可以解释为“知名老师指导出高水平学生的概率较大“,即老师的名声与学生的水平之间有关联你能举出更多的描述生活中两种属性或现象之间关联的成语吗?例如:勤能补拙,水涨船高,登高望远2例1中的随机抽样数据是否足够确定与X和Y有关的所有概率和条件概率?为什么?不能因为随机抽样得到的样本具有随机性,根据样本数据计算出来的频率也具有随机性在统计推断中,依据频率稳定于概率的原理,可以利用频率推断与X和Y有关的概率和条件概率,但由于频率具有随机性,这种推断可能犯错误因此,随机抽样数据不足以确定与X和Y有关的所有概率和条件概率3根据有关规定,香烟盒上必须印上“吸烟有害健康”的警示语那么(1)吸烟是否对每位烟民一定会引发健康问题?(2)有人说吸烟不一定引起健康问题,因此可以吸烟这种说法对吗?(1)从已掌握的知识来看,吸烟会损害身体的健康但除了吸烟之外,身体的健康还受许多其他随机因素的影响,它是很多因素共同作用的结果吸烟导致患病的案例非常普遍,但也可以找到长寿的吸烟者因此健康与吸烟有关联,即从统计意义上讲,吸烟会损害健康,但不一定会对每位烟民都引起健康问题(2)这种说法不正确虽然吸烟不一定会对每个人都引起健康问题,但根据统计数据,吸烟比不吸烟引起健康问题的可能性大,因此“吸烟不一定引起健康问题,因此可以吸烟”的说法是不对的4假设在本小节“问题”中,只是随机抽取了44名学生,按照性别和体育锻炼情况整理为如下的列联表:性别性别锻炼锻炼合计合计不经常不经常经常经常女生女生51520男生男生61824合计合计113344单位:人(1)据此推断性别因素是否影响学生锻炼的经常性;(2)说明你的推断结论是否可能犯错,并解释原因(2)推断可能犯错误因为样本是通过随机抽样得到的,频率具有随机性,因此推断可能犯错误