分类变量与列联表课件--高二下学期数学人教A版(2019)选择性必修第三册.pptx
《分类变量与列联表课件--高二下学期数学人教A版(2019)选择性必修第三册.pptx》由会员分享,可在线阅读,更多相关《分类变量与列联表课件--高二下学期数学人教A版(2019)选择性必修第三册.pptx(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、分类变量与列联表F F佳佳 20222022年年0606月月吸烟的危害吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低人们的生活质量、缩短人类寿命的紧迫问题为此,联合国固定每年5月31日为全球戒烟日 在现实生活中,人们经常需要回答一定范围内的两种现象或性质之间是否存在关联性或互相影响的问题.吸烟是否会增加患肺癌的风险? 例如例如 ,就读不同学校是否对学生的成绩有影响就读不同学校是否对学生的成绩有影响 , 不同班级学生不同班级学生用于体育锻炼的时间是否有差别用于体育锻炼的时间是否有差别 , 吸烟是否会增加患肺癌的风险吸烟是否会增加患肺癌的风险 , 等等等等 , 本节将要学习的独立性检验方
2、法为我们提供了解决这类问题本节将要学习的独立性检验方法为我们提供了解决这类问题的方案的方案. 在现实生活中,人们经常需要回答一定范围内的两种现象或性质之间是否存在关联性或互相影响的问题. 在讨论上述问题时在讨论上述问题时 , 为了表述方便为了表述方便 , 我们经常会使用我们经常会使用一种特殊的随机变量一种特殊的随机变量 , 以区别不同的现象或性质以区别不同的现象或性质 , 这类随这类随机变量称为机变量称为分类变量分类变量.两种变量两种变量分类变量:性别、是否吸烟、是否患分类变量:性别、是否吸烟、是否患肺癌、宗教信仰、国籍等等肺癌、宗教信仰、国籍等等变变量量对于性别变量,其取值为男和女两种. 这
3、种变量的不同“值”表示个体所属的不同类别,像这类变量称为.两种变量两种变量数值变量的取值一定是实数数值变量的取值一定是实数, , 例如身高、体重、考试成绩等,张明的身高是例如身高、体重、考试成绩等,张明的身高是180cm180cm,李立的身高是李立的身高是175cm175cm。数值变量:体重、身高、温度、考试成绩等等数值变量:体重、身高、温度、考试成绩等等两种变量两种变量分类变量:性别、是否吸烟、是否患肺癌、分类变量:性别、是否吸烟、是否患肺癌、宗教信仰、国籍等等宗教信仰、国籍等等变变量量数值变量的取值为实数,其大小和运算都有实际含义.分类变量分类变量是区别不同的现象和性质的一种特殊的随机变量
4、分类变量的取值也可以用实数来表示,例如男性,女性可以用1, 0表示,学生的班级可以用1, 2, 3来表示这些数值只作编号使用,并没有大小和运算意义分类变量是相对于数值变量来说的但要注意到:问题: 为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查.全校生的普查数据如下: 523名女生中有331名经常锻炼;601名男生中有473名经常锻炼. 你能利用这些数据, 说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?解法一: 比较经常锻炼的学生在女生和男生的比率.01.ff经常锻炼的女生数经常锻炼的男生数,女
5、生总数男生总数013314730.6330.787523601,ff10-0.787-0.6330.154.ff问题: 为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查.全校生的普查数据如下: 523名女生中有331名经常锻炼;601名男生中有473名经常锻炼. 你能利用这些数据, 说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?10-0.787-0.6330.154.ff 男生经常锻炼的比率比女生高出15.4个百分点,所以该校的女生和男生在体育锻炼的经常性方面有差异,而且男生更经常锻炼.解法二:
6、 对于中的每一名学生,分别令0,0,11XY该生不经常锻炼,该生为女生,该生经常锻炼,该生为男生,性别对体育锻炼的经常性没有影响:(10)(11)P YXP YX性别对体育锻炼的经常性有影响:(10)(11)P YXP YX合计男生(X=1)女生(X=0)经常(Y=1)不经常(Y=0)合计锻炼性别(1,0)(1,0)331(10)0.633(0)(0)523P YXn YXP YXP Xn X(1,1)(1,1)473(11)0.787(1)(1)601P YXn YXP YXP Xn X 由 可以作出判断,在该校的学生中,性别对体育锻炼的经常性有影响,男生更经常性的锻炼.(11)(10)P
7、YXP YX 在上面问题的两种解答中,使用了学校全部学生的调查数据,利用这些数据能够完全确定解答问题所需的比率和条件概率.然而,对于大多数实际问题,我们无法获得所关心的全部对象的数据,因此无法准确计算出有关的比率或条件概率. 在这种情况下,上述古典概型和条件概率的观点为我们提供了一个解决问题的思路.比较简单的做法是利用随机抽样获得一定数量的样本数据,再利用随机事件发生的频率稳定于概率的原理对问题答案作出推断.(用样本估计总体) 在实践中在实践中 , 由于保存原始数据的成本较高由于保存原始数据的成本较高 , 人们经常按研究问人们经常按研究问题的需要题的需要, 将数据分类统计将数据分类统计, 并做
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分类 变量 列联表 课件 下学 期数 学人 2019 选择性 必修 第三
限制150内