【数学】分类变量与列联表-2023-2024学年高二数学 人教A版2019选择性必修第三册.pptx
-
资源ID:97252891
资源大小:42.19MB
全文页数:20页
- 资源格式: PPTX
下载积分:5金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
【数学】分类变量与列联表-2023-2024学年高二数学 人教A版2019选择性必修第三册.pptx
人教A版2019选修第三册第 八 章 成对数据的统计分析8.3.1 分类变量与列联表1.了解 探究分类变量之间关系的方法2.制作、理解 22列联表,用频率分析法、图形分析法探究两个分类变量之间的关系3.能够对统计数据进行简单整理、初步分析提升数学抽象、数据建模及数据分析素养教学目标教学目标 情境导入PART.01情境导入情境导入 有关法律规定:香烟盒上必须印上“吸烟有害健康”的警示语,那么吸烟和健康之间有因果关系吗?每一个吸烟者的健康问题都是由吸烟引起的吗?“如果你认为健康问题不一定是由吸烟引起的,那么可以吸烟”的说法对吗?要回答这个问题,我们先一起来学习本课时的知识吧!问题提出问题提出变量变量数值变量数值变量分类变量分类变量例:人的身高;100米短跑所用时间;产品月销量数值变量的取值为实数.其大小和运算都有实际含义.两个数值变量之间的关系:回归分析法;例:班级;性别;是否经常锻炼;是否每年体检分类变量的取值可以用实数来表示;这些数值只作为编号使用,用来表示不同的类别;并没有通常的大小和运算意义例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示 如何利如何利用统计数据判断一对分类变量之间是否具有关联性呢?对于这样的统计用统计数据判断一对分类变量之间是否具有关联性呢?对于这样的统计问题,有时可以利用普查数据,通过比较相关的比问题,有时可以利用普查数据,通过比较相关的比率率给出问题的准确回答,但在大给出问题的准确回答,但在大多数情况下,需要借助概率的观点和方法多数情况下,需要借助概率的观点和方法.我们先看下面的具体问题我们先看下面的具体问题.分类变量与列联表PART.02概念辨析概念辨析分类变量分类变量分类变量分类变量1是否吸烟、是否患肺癌是什么变量?提示分类变量2下列不是分类变量的是()A近视 B成绩 C血压 D饮酒 解析 近视变量有近视与不近视两种类别,血压变量有异常、正常两种类别,饮酒变量有饮酒与不饮酒两种类别故选B.答案B概念讲解概念讲解问题:问题:某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查生是否经常锻炼的情况进行了普查.全校学生的普查数据如下全校学生的普查数据如下:523名女生中有名女生中有331名经名经常锻炼常锻炼;601名男生中有名男生中有473名经常锻炼名经常锻炼.你能利用这些数据你能利用这些数据,说明该校女生和男生在体说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?育锻炼的经常性方面是否存在差异吗?方法方法1由频率估计概率由频率估计概率概念讲解概念讲解方法方法2借助条件概率借助条件概率为了清楚起见为了清楚起见,我们用表格整理数据我们用表格整理数据性别性别锻炼锻炼合计合计不经常不经常(Y=0)经常经常(Y=1)女生女生(X=0)192331523男生男生(X=1)128473601合计合计3208041124概念讲解概念讲解性别性别锻炼锻炼合计合计不经常不经常(Y=0)经常经常(Y=1)女生女生(X=0)192331523男生男生(X=1)128473601合计合计3208041124概念讲解概念讲解方法方法3借助等高堆积条形图借助等高堆积条形图性别性别锻炼锻炼合计合计不经常不经常(Y=0)经常经常(Y=1)女生女生(X=0)192331523男生男生(X=1)128473601合计合计3208041124女生男生0%10%20%30%40%50%60%70%80%90%100%331473192128经常不经常概念讲解概念讲解2 2 2 2列联表列联表列联表列联表 在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存据分类统计,并做成表格加以保存.我们将形如下表这种形式的数据统计表称为我们将形如下表这种形式的数据统计表称为22列联表列联表.22列联表给出了列联表给出了成对分类变量数据的交叉分类频数成对分类变量数据的交叉分类频数.组别组别甲甲(Y0)乙乙(Y1)合计合计A(X0)ababB(X1)cdcd合计合计acbdabcd概念辨析概念辨析1分类变量中的变量与函数中的变量是同一概念 ()提示分类变量中的变量是指一定范围内的两种现象或性质,与函数中的变量不是同一概念2列联表中的数据是两个分类变量的频数 ()3列联表、频率分析法、等高条形图都可初步分析两分类变量是否有关系 ()概念讲解概念讲解例例1.为比较甲、为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学名学生生.通过测验得到了如下数据通过测验得到了如下数据:甲校甲校43名学生中有名学生中有10 名数学成绩优秀名数学成绩优秀;乙校乙校45名学生名学生中有中有7名数学成绩优秀名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异试分析两校学生中数学成绩优秀率之间是否存在差异.概念讲解概念讲解学校学校数学成绩数学成绩合计合计不优秀不优秀(Y0)优秀优秀(Y1)甲校甲校(X0)331043乙校乙校(X1)38745合计合计711788概念讲解概念讲解我们可以用我们可以用等高堆积条形图等高堆积条形图等高堆积条形图等高堆积条形图直观地展示上述计算结果,如图所示直观地展示上述计算结果,如图所示.学校学校数学成绩数学成绩合计合计不优秀不优秀(Y0)优秀优秀(Y1)甲校甲校(X0)331043乙校乙校(X1)38745合计合计711788概念讲解概念讲解练习1与表格相比,能更直观地反映出相关数据总体状况的是()A列联表 B散点图 C残差图 D等高堆积条形图D2.根据如图所示的等高堆积条形图可知吸烟与患肺病_关系(填“有”或“没有”)解析从等高条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率有有概念讲解概念讲解C 课堂小结PART.03课堂小结课堂小结