【数学】列联表与独立性检验教学课件 2023-2024学年高二数学(人教A版2019选择性必修第三册).pptx
《【数学】列联表与独立性检验教学课件 2023-2024学年高二数学(人教A版2019选择性必修第三册).pptx》由会员分享,可在线阅读,更多相关《【数学】列联表与独立性检验教学课件 2023-2024学年高二数学(人教A版2019选择性必修第三册).pptx(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、选 修 三 第 八 章选 修 三 第 八 章 成 对 数 据 的 统 计 分 析 成 对 数 据 的 统 计 分 析 8.3 列联表与独立性检验列联表与独立性检验数值变量的取值为实数,数值变量的取值为实数,其大小和运算都有实际含义其大小和运算都有实际含义.分类分类变量的取值变量的取值可用可用实数实数表示表示,但数值只作为编号使用,没有但数值只作为编号使用,没有大小和运算大小和运算意义意义.本节只讨论取值本节只讨论取值0,1的分类变量的分类变量的关联性的关联性研究研究一定范一定范围内的两种围内的两种现象或性质现象或性质之间是否存之间是否存在在关联性关联性或或存在存在差异差异研究研究一定范一定范围
2、内的围内的两个两个变量的变量的相关相关关系关系选 修 三 第 八 章选 修 三 第 八 章 成 对 数 据 的 统 计 分 析 成 对 数 据 的 统 计 分 析 8.3.1 分类变量与分类变量与列联表列联表思考思考1:如何利如何利用统计数据判断一对分类变量之间是否具有关联性呢用统计数据判断一对分类变量之间是否具有关联性呢?问题背景:问题背景:为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查.全校学生的普查数据如下:523名女生中有名女生中有331名经常锻炼名经常锻炼;601名男生中有名男生中有473名经
3、常锻炼名经常锻炼.你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?该校的女生和男生在体育锻炼的经常性方面有差异,且男生更经常锻炼.在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成将数据分类统计,并做成22列联表列联表加以保存加以保存.问题背景:问题背景:全校学生的普查数据如下:523名女生中有名女生中有331名经常锻炼名经常锻炼;601名男生中有名男生中有473名经常锻炼名经常锻炼.你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?性别性别锻炼
4、锻炼合计合计不经常不经常(Y=0)经常经常(Y=1)女生女生(X=0)331523男生男生(X=1)473601合计合计22列联表1921281124320804列联表给出了成对分类变量数据的交叉分类频数列联表给出了成对分类变量数据的交叉分类频数.性别对体育锻炼的经常性有影响:性别对体育锻炼的经常性有影响:性别对体育锻炼的经常性性别对体育锻炼的经常性无无影响:影响:频率稳定于概率频率稳定于概率对于大多数实际问题,我们无法获得所关心的全部对象的数据,但可利用随机抽样对于大多数实际问题,我们无法获得所关心的全部对象的数据,但可利用随机抽样获得一定数量的获得一定数量的样本样本数据,再利用随机事件发生
5、的数据,再利用随机事件发生的频率稳定于概率频率稳定于概率的原理的原理作出推断作出推断.例例1.为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测试得到了如下数据:甲校甲校43名学生中有名学生中有10名数学成绩优秀;乙校名数学成绩优秀;乙校45名学名学生中有生中有7名数学成绩优秀名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异.性别性别锻炼锻炼合计合计不优秀不优秀(Y=0)优秀优秀(Y=1)甲校甲校(X=0)331043乙乙校校(X=1)38745合计合计711788甲校学生中数学成绩优秀的频率为:乙校学生中数学成绩优秀的频率为:依据频率稳定于概率的原
6、理,可推断P(Y=1|X=0)P(Y=1|X=1).故可认为两校学生的数学成绩优秀率存在差异,甲校学生的数学成绩优秀率比乙校学生的高.等高堆积条形图不优秀的频率为0.7674不优秀的频率为0.8444新知1:列联表XY合计合计Y=0Y=1X=0aba+bX=1cdc+d合计合计a+cb+da+b+c+d(样本容量样本容量n)若不相等,则推断两个分类变量有关联或存在明显差异.若相等,则推断两个分类变量无关联或没有明显差异.巩固:列联表练习练习1.假设有两个分类变量假设有两个分类变量X与与Y,它们的可能取值分别为,它们的可能取值分别为0,1和和0,1,其其22列联表为:列联表为:XY合计合计Y=0
7、Y=1X=0101828X=1m26m+26合计合计10+m44m+54则当则当m取取()时,时,X与与Y的关系最弱的关系最弱.A8B9C14D19X与与Y的关系几乎无关联的关系几乎无关联C新知2:等高堆积条形图等高条形图展示可列联表数据的频率特征,依据频率稳定与概率的原理,我们可以推断结果和表格相比,等高条形图更能直观地反映出两个分类变量间是否相互影响.比较同色的条形图高度差,若高度差明显,则判断两个分类变量有关系或存在明显差异.两个分类变量两个分类变量x,y之间之间关系最强关系最强的是的是()吸烟与患肺病有关联D巩固:等高堆积条形图练习练习2.某学校对高三学生做了一项调查发现:在平时的模拟
8、考试中,某学校对高三学生做了一项调查发现:在平时的模拟考试中,性格内向的性格内向的学生学生426人中有人中有332人在考前心情紧张,性格外向的学生人在考前心情紧张,性格外向的学生594人中有人中有213人在考前心人在考前心情紧张情紧张.作出等高堆积条形图,利用图形判断考前心情紧张与性格类别是否有关系作出等高堆积条形图,利用图形判断考前心情紧张与性格类别是否有关系.从图中可以看出性格内向从图中可以看出性格内向的的样本中考前心情紧张样本中考前心情紧张的的频率频率比性格比性格外外向向的的样本中考前心情紧张的样本中考前心情紧张的频率频率高,可以认为高,可以认为考前心情紧张与性格类型有关考前心情紧张与性
9、格类型有关联联.内向内向外向外向紧张紧张0.60920.60920.19790.1979不紧张不紧张0.39080.39080.80210.8021思考思考2:你认为你认为“两校学生的数学成绩优秀率存在差异两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的这一结论是否有可能是错误的?甲校学生中数学成绩优秀的频率为:乙校学生中数学成绩优秀的频率为:依据频率稳定于概率的原理,可推断P(Y=1|X=0)P(Y=1|X=1).即甲校学生的数学成绩优秀率比乙校学生的高,故可认为两校学生的数学成绩优秀率存在差异.“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差异推断出来的.但有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 【数学】列联表与独立性检验教学课件 2023-2024学年高二数学人教A版2019选择性必修第三册 列联表 独立性 检验 教学 课件 2023 2024 学年 人教 2019 选择性 必修 第三
链接地址:https://www.taowenge.com/p-96636407.html
限制150内