【数学课件】分类变量与列联表 2022-2023学年高二数学同步课件(人教A版2019选择性必修第三册).pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《【数学课件】分类变量与列联表 2022-2023学年高二数学同步课件(人教A版2019选择性必修第三册).pptx》由会员分享,可在线阅读,更多相关《【数学课件】分类变量与列联表 2022-2023学年高二数学同步课件(人教A版2019选择性必修第三册).pptx(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章 成对数据的统计分析8.3 8.3 列联表与独立性检验列联表与独立性检验 8.3.1 8.3.1 分类变量与列联表分类变量与列联表新课导入吸烟的危害吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低人们的生活质量、缩短人类寿命的紧迫问题为此,联合国固定每年5月31日为全球戒烟日 为什么将世界无烟日改为5月 31日呢?是因为第二天是国际儿童节,希望下一代免受烟草危害。世界无烟日的意义是宣扬不吸烟的观念。而每年皆会有一个中心主题。例如:例如:20192019年世界无烟日的重点是年世界无烟日的重点是“烟草和肺部健康”吸烟是否会增加患肺癌的风险?怎样用数学知识说明呢怎样用数学知识说明呢?新
2、知讲解 例如例如,就读不同学校是否对学生的成绩有影响就读不同学校是否对学生的成绩有影响,不同班级学不同班级学生用于体育锻炼的时间是否有差别生用于体育锻炼的时间是否有差别,吸烟是否会增加患肺癌的风吸烟是否会增加患肺癌的风险险,等等等等,本节将要学习的独立性检验方法为我们提供了解决这本节将要学习的独立性检验方法为我们提供了解决这类问题的方案类问题的方案.在现实生活中,人们经常需要回答一定范围内的两种现象或性质之间是否存在关联性或互相影响的问题.在讨论上述问题时在讨论上述问题时,为了表述方便为了表述方便,我们经常会使用我们经常会使用一种特殊一种特殊的随机变量的随机变量,以区别不同的现象或性质以区别不
3、同的现象或性质,这类随机变量称为这类随机变量称为分类分类变量变量.新知讲解变量数值变量分类变量数值变量的取值为实数数值变量的取值为实数.其大小和运算都有实际含义其大小和运算都有实际含义.例如例如:人的身高、树的胸径、树的高度、短跑人的身高、树的胸径、树的高度、短跑100m世界纪录和创纪录的时间世界纪录和创纪录的时间等等两个数值变量之间的关系:两个数值变量之间的关系:回归分析法回归分析法;由一个变量的变化去推测另一个变量的变化由一个变量的变化去推测另一个变量的变化分类分类变量的取值变量的取值可以用实数来表示可以用实数来表示;这些数值这些数值只作为编号使用,用来表示不同的类别只作为编号使用,用来表
4、示不同的类别;并并没有通常的大小和运算意义。没有通常的大小和运算意义。例例:性别、是否吸烟、是否患肺癌性别、是否吸烟、是否患肺癌、国籍等、国籍等例如例如,学生所在的班级可以用学生所在的班级可以用1,2,31,2,3等表示等表示,男性、女性可以用男性、女性可以用1,01,0表示表示本节我们主要讨论本节我们主要讨论取值是取值是0,1的分类的分类变量的关联性问题变量的关联性问题.新知探究问题1 为了有针对性地提高学生体育锻炼的积极性为了有针对性地提高学生体育锻炼的积极性,某中学需要了解某中学需要了解性别性别因素是否对本校学生体育锻炼的经常性有影响因素是否对本校学生体育锻炼的经常性有影响,为此对学生是
5、否经常锻炼的为此对学生是否经常锻炼的情况进行了普查情况进行了普查,全校学生的普查数据如下全校学生的普查数据如下:523:523名女生中有名女生中有331331名经常锻炼名经常锻炼;601601名男生中有名男生中有473473名经常锻炼名经常锻炼.你能利用这些数据你能利用这些数据,说明说明该校女生和男生在该校女生和男生在体育锻炼的经常性方面是否存在差异体育锻炼的经常性方面是否存在差异吗吗?这是一个简单的统计问题这是一个简单的统计问题,最直接的解答方法是最直接的解答方法是,比较经常锻炼的学生在女生和男生比较经常锻炼的学生在女生和男生中的比率中的比率.解法解法1 1:(:(由频率估计概率由频率估计概
6、率)结论:该校的女生和男生在体育锻炼的经常性方面存在差异,男生更经常锻炼。新知探究上面的问题还可以通过建立一个古典概型,上面的问题还可以通过建立一个古典概型,使用条件概率使用条件概率的语言,给出另外的语言,给出另外一一 种解答方法种解答方法.解法解法2 2:(:(借助条件概率借助条件概率)用用表示该校全体学生构成的集合,则表示该校全体学生构成的集合,则为样本空间,定义一对分类变量为样本空间,定义一对分类变量X和和Y如下如下:对于对于中的每一名学生,分别令中的每一名学生,分别令若从该校女生和男生中各随机选取一名学生,那么该女生属于经常锻炼群体若从该校女生和男生中各随机选取一名学生,那么该女生属于
7、经常锻炼群体的概率为的概率为 而该男生属于经常锻炼群体的概率为而该男生属于经常锻炼群体的概率为 我们希望通过比较条件概率我们希望通过比较条件概率P(Y=1|X=0)和和P(Y=1|X=1)回答上面的问题回答上面的问题性别对体育锻炼的经常性没有影响:性别对体育锻炼的经常性没有影响:性别对体育锻炼的经常性有影响:性别对体育锻炼的经常性有影响:新知探究为了清楚起见,我们用表格整理数据,如下表所示为了清楚起见,我们用表格整理数据,如下表所示.性别性别锻炼锻炼合计合计不经常不经常(Y=0)经常经常(Y=1)女生女生(X=0)192331523男生男生(X=1)128473601合计合计320804112
8、4X=0,Y=1:事件:事件X=0和和Y=1的积事件的积事件 X=1,Y=1:事件:事件X=1和和Y=1的积事件的积事件结论:该校的女生和男生在体育锻炼的经常性方面存在差异,男生更经常锻炼。该校的女生和男生在体育锻炼的经常性方面存在差异,男生更经常锻炼。在在上上面面问问题题的的两两种种解解答答中中,使使用用了了学学校校全全部部学学生生的的调调查查数数据据,利利用用这这些些数数据据能能够够完完全全确确定定解解答答问问题题所所需需的的比比率率和和条条件件概概率率.然然而而,对对于于大大多多数数实实际际问问题题,我我们们无无法法获获得得所所关关心心的的全全部部对对象象的的数数据据,因此无法准确计算出
9、有关的比率或条件概率因此无法准确计算出有关的比率或条件概率.在在这这种种情情况况下下,上上述述古古典典概概型型和和条条件件概概率率的的观观点点为为我我们们提提供供了了一一个个解解决决问问题题的的思思路路.比比较较简简单单的的做做法法是是利利用用随随机机抽抽样样获获得得一一定定数数量量的的样样本本数数据据,再再利利用用随随机机事事件件发发生生的的频频率率稳稳定定于于概概率率的的原原理理对对问题答案作出推断问题答案作出推断.(用样本估计总体)(用样本估计总体)方法归纳概念生成 列联表在在实实践中,由于保存原始数据的成本践中,由于保存原始数据的成本较较高,人高,人们经们经常按研究常按研究问题问题的需
10、要,的需要,将数据分将数据分类统计类统计,并做成表格加以保存,并做成表格加以保存.我我们们将形如下表将形如下表这这种形式的数据种形式的数据统计统计表称表称为为22列联表列联表.22列列联联表表给给出了出了成成对对分分类变类变量数据的交叉分量数据的交叉分类频类频数数.组别组别甲甲(Y0)乙乙(Y1)合合计计A(X0)ababB(X1)cdcd合合计计acbdabcd 以上表为例以上表为例,22列联列联包含了包含了X和和Y的如下信息的如下信息:最后一行的前两个数分别是事件最后一行的前两个数分别是事件Y=0和和Y=1中样本点的个数中样本点的个数;最后一列的前两个数分别是事件最后一列的前两个数分别是事
11、件 X=0和和 X=1中样本中样本点的个数点的个数;中间的四个格中的数是表格的核心部分中间的四个格中的数是表格的核心部分,给出了事件给出了事件X=x,Y=y(x,y=0,1)中中样本点的个数样本点的个数;右下角格中的数是样本空间中样本点的总数右下角格中的数是样本空间中样本点的总数.新知探究例1 为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取取88名学生名学生.通过测验得到了如下数据通过测验得到了如下数据:甲校甲校43名学生中有名学生中有10名数学成绩优名数学成绩优秀秀;乙校乙校45名学生中有名学生中有7名数学成绩优秀名
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学课件 【数学课件】分类变量与列联表 2022-2023学年高二数学同步课件人教A版2019选择性必修第三册 数学 课件 分类 变量 列联表 2022 2023 学年 同步 人教 2019 选择性
![提示](https://www.taowenge.com/images/bang_tan.gif)
链接地址:https://www.taowenge.com/p-96426765.html
限制150内