2022届高三数学一轮复习(原卷版)第二节 变量间的相关性与统计案例 教案.doc
《2022届高三数学一轮复习(原卷版)第二节 变量间的相关性与统计案例 教案.doc》由会员分享,可在线阅读,更多相关《2022届高三数学一轮复习(原卷版)第二节 变量间的相关性与统计案例 教案.doc(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 1 第二节第二节 变量间的相关性与统计案例变量间的相关性与统计案例 核心素养立意下的命题导向核心素养立意下的命题导向 1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系 2了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程,凸显数学了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程,凸显数学运算的核心素养运算的核心素养 3了解独立性检验了解独立性检验(只要求只要求 22 列联表列联表)的基本思想、方法及其应用,凸显数学建模、数据的基本思想、方法及其应用,凸显数学建模、数据分析的核心素养分
2、析的核心素养 4了解回归分析的基本思想、方法及其简单应用,凸显数学建模、数据分析的核心素养了解回归分析的基本思想、方法及其简单应用,凸显数学建模、数据分析的核心素养 理清主干知识理清主干知识 1变量间的相关关系变量间的相关关系 常见的两常见的两变量之间的关系有两类:一类是函数关系,另一类是变量之间的关系有两类:一类是函数关系,另一类是相关关系相关关系;与函数关系不同,;与函数关系不同,相关关系相关关系是一种非确定性关系是一种非确定性关系 2两个变量的线性相关两个变量的线性相关 (1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称从散点图上看,如果这些点从整体上看大
3、致分布在通过散点图中心的一条直线附近,称两个变量之间具有两个变量之间具有线性相关关系线性相关关系,这条直线叫,这条直线叫回归直线回归直线 (2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正正相关相关,点分布在左上角到右下角的区域内,两个变量的相关关系为,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关负相关 (3)回归方程为回归方程为ybxa,其中,其中bni1xiyin x yni1x2in x2,a y bx . (4)相关系数相关系数 当当 r0 时,表明两个变量时,表明两
4、个变量正相关正相关; 当当 r70(万元万元), 所以能把保费所以能把保费 x 定为定为 5 元元 考法考法(二二) 相关系数相关系数 6 例例 2 我国大力发展校园足球,为了解某地区足球特色学校的发展状况,社会调查小组得我国大力发展校园足球,为了解某地区足球特色学校的发展状况,社会调查小组得到如下统计数据:到如下统计数据: 年份年份 x 2014 2015 2016 2017 2018 足球特色学校足球特色学校 y(百个百个) 0.30 0.60 1.00 1.40 1.70 (1)根据上表数据根据上表数据,计算,计算 y 与与 x 的相关系数的相关系数 r,并说明,并说明 y 与与 x 的
5、线性相关性强弱;的线性相关性强弱; (已知:已知:0.75|r|1,则认为,则认为 y 与与 x 的线性相关性很强;的线性相关性很强;0.3|r|0.75,则认为,则认为 y 与与 x 的线的线性相关性一般;性相关性一般;|r|0.25,则认为,则认为 y 与与 x 的线性相关性较弱的线性相关性较弱) (2)求求 y 关于关于 x 的线性回归方程,并预测该地区的线性回归方程,并预测该地区 2021 年足球特色学校的个数年足球特色学校的个数(精确到个精确到个) 参考数据:参考数据:i15 (xi x )210,i15 (yi y )21.3,i15 (xi x ) (yi y )3.6, 13
6、3.605 6. 解解 (1)由题得由题得 x 15(2 0142 0152 0162 0172 018)2 016, y 15(0.300.601.001.401.70)1, ri15 xi x yi y i15 xi x 2 i15 yi y 23.610 1.33.63.605 60.9980.7. y 与与 x 的线性相关性很强的线性相关性很强 (2)设设 y 关于关于 x 的线性回归方程为的线性回归方程为yabx, 则则bi15 xi x yi y i15 xi x 23.6100.36, a y bx 10.362 016724.76, y 关于关于 x 的线性回归方程是的线性回归
7、方程是y0.36x724.76. 当当 x2 021 时,时,y0.362 021724.762.8,故预测该地区,故预测该地区 2021 年足球特色学校有年足球特色学校有 280个个 考法考法(三三) 非线性回归分析非线性回归分析 例例 3 已知某地区某种昆虫产卵数和温度有关现收集了一只该品种昆虫的产卵数已知某地区某种昆虫产卵数和温度有关现收集了一只该品种昆虫的产卵数 y(个个)和温度和温度 x()的的 7 组观测数据,其散点图如图所示:组观测数据,其散点图如图所示: 7 根据散点图,结合函数知识,可以发现产卵数根据散点图,结合函数知识,可以发现产卵数 y 和温度和温度 x 可用方程可用方程
8、 yebxa来拟合,来拟合,令令 zln y,结合样本数据可知,结合样本数据可知 z 与温度与温度 x 可用线性回归方程来拟合可用线性回归方程来拟合 根据收集到的数根据收集到的数据,计算得到如下值:据,计算得到如下值: x y z i17 (xi x )2 i17 (zi z )2 i17 (xi x )(zi z ) 27 74 3.537 182 11.9 46.418 表中表中 ziln yi, z 17i17zi. (1)求求 z 关于温度关于温度 x 的回归方程的回归方程(回归系数结果精确到回归系数结果精确到 0.001); (2)求产卵数求产卵数 y 关于温度关于温度 x 的回归方
9、程;若该地区一段时间内的气温在的回归方程;若该地区一段时间内的气温在 26 36 之间之间(包包括括 26 与与 36 ),估计该品种一只昆虫的产卵数的范围参考数据:,估计该品种一只昆虫的产卵数的范围参考数据:e3.28227,e3.79244,e5.832341,e6.087440,e6.342568. 解解 (1)由题意,由题意,z 和温度和温度 x 可以用线性回归方程拟合,可以用线性回归方程拟合, 设设zbxa, 则则bi17 xi x zi z i17 xi x 246.4181820.255, a z bx 3.5370.255273.348, 故故 z 关于关于 x 的线性回归方的
10、线性回归方程为程为z0.255x3.348. (2)由由(1)可得,可得,ln y0.255x3.348. 于是产卵数于是产卵数 y 关于温度关于温度 x 的回归方程为的回归方程为 ye0.255x3.348. 当当 x26 时,时,ye0.255263.348e3.28227; 当当 x36 时,时,ye0.255363.348e5.832341. 函数函数 ye0.255x3.348为增函数,为增函数, 在气温在在气温在 2636之间时,一只该品种昆虫的产卵数的估计范围是之间时,一只该品种昆虫的产卵数的估计范围是y|27y341,yN* 方法技巧方法技巧 8 1线性回归分析问题的类型及解题
11、方法线性回归分析问题的类型及解题方法 (1)求回归直线方程求回归直线方程 计算出计算出 x , y ,i1nx2i,i1nxiyi或或i1n (xi x )(yi y ),i1n (xi x )2的值;的值; 利用公式计算回归系数利用公式计算回归系数a,b; 写出回归直线方程写出回归直线方程ybxa. (2)回归模型的拟合效果:回归模型的拟合效果:利用相关系数利用相关系数 r 判断,当判断,当|r|越趋近于越趋近于 1 时,两变量的线性相关性越时,两变量的线性相关性越强强 2非线性回归方程的求法非线性回归方程的求法 (1)根据原始数据作出散点图;根据原始数据作出散点图; (2)根据散点图选择恰
12、当的拟合函数;根据散点图选择恰当的拟合函数; (3)作恰当变换,将其转化成线性函数,求线性回归方程;作恰当变换,将其转化成线性函数,求线性回归方程; (4)在在(3)的基础上通过相应变换,即可得非线性回归方程的基础上通过相应变换,即可得非线性回归方程 针对训练针对训练 1已知已知某种商品的广告费支出某种商品的广告费支出 x(单位:万元单位:万元)与销售额与销售额 y(单位:万元单位:万元)之间有如下表对应数之间有如下表对应数据,根据表中数据可得回归方程据,根据表中数据可得回归方程ybxa其中其中b11 据此估计,当投入据此估计,当投入 6 万元广告费时,万元广告费时,销售额约为销售额约为( )
13、 x 1 2 3 4 5 y 10 15 30 45 50 A60 万元万元 B63 万元万元 C65 万元万元 D69 万元万元 解析:解析:选选 B 由表格数据可知由表格数据可知 x 1234553, y 1015304550530, 因为回归方程过点因为回归方程过点( x , y ),所以,所以 303ba,且,且b11,得,得a3,所以,所以y11x3,代,代入入 x6,得,得y63,故选,故选 B. 2某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了医院抄录了 1 月份至
14、月份至 6 月份每月月份每月 10 号的昼夜温差情况与因患感冒而就诊的人数,得到如下号的昼夜温差情况与因患感冒而就诊的人数,得到如下数据:数据: 日期日期 1 月月 10 日日 2 月月 10 日日 3 月月 10 日日 4 月月 10 日日 5 月月 10 日日 6 月月 10 日日 昼夜温差昼夜温差 x/ 10 11 13 12 8 6 9 就诊人数就诊人数 y/个个 22 25 29 26 16 12 该兴趣小组确定的研究方案是:先从这该兴趣小组确定的研究方案是:先从这 6 组数据中选取组数据中选取 2 组,用剩下的组,用剩下的 4 组数据求线性回组数据求线性回归方程,再用被选取的归方程
15、,再用被选取的 2 组数据进行组数据进行检验检验 (1)求选取的求选取的 2 组数据恰好是相邻两个月的概率;组数据恰好是相邻两个月的概率; (2)若选取的是若选取的是 1 月份与月份与 6 月份的两组数据,请根据月份的两组数据,请根据 2 月份至月份至 5 月份的数据,求出月份的数据,求出 y 关于关于 x的线性回归方程的线性回归方程ybxa; (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2,则认为得到,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?的线性回归方程是理想的,试问该小组
16、所得线性回归方程是否理想? 参考数据:参考数据:1125132912268161 092, 11213212282498. 解:解:(1)设选到相邻两个月的数据为事件设选到相邻两个月的数据为事件 A.因为从因为从 6 组数据中选取组数据中选取 2 组数据共有组数据共有 15 种情况,种情况,且每种情况都是等可能的,其中,选到相邻两个月的数据的情况有且每种情况都是等可能的,其中,选到相邻两个月的数据的情况有 5 种,所以种,所以 P(A)51513. (2)由表中由表中 2 月份至月份至 5 月份的数据可得月份的数据可得 x 11, y 24,i14xiyi1 092,i14x2i498,所以,
17、所以bi14xiyi4 x yi14x2i4 x2187, 则则a y b x 307, 所以所以 y 关于关于 x 的线性回归方程为的线性回归方程为y187x307. (3)当当 x10 时,时,y1507, 150722 2; 当当 x6 时,时,y787, 78712 2. 所以该小组所得线性回归方程是理想的所以该小组所得线性回归方程是理想的 考点三考点三 独立性检验独立性检验 典例典例 (2020 全国卷全国卷)某学生兴趣小组随机调查了某市某学生兴趣小组随机调查了某市 100 天中每天天中每天的空气质量等级和的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表当天到某公园锻炼的人次
18、,整理数据得到下表(单位:天单位:天): 锻炼人次锻炼人次 空气质量等级空气质量等级 0,200 (200,400 (400,600 10 1(优优) 2 16 25 2(良良) 5 10 12 3(轻度污染轻度污染) 6 7 8 4(中度污染中度污染) 7 2 0 (1)分别估计该市一天的空气质量等级为分别估计该市一天的空气质量等级为 1,2,3,4 的概率;的概率; (2)求一天中到该公园锻炼的平均人次的估计值求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代同一组中的数据用该组区间的中点值为代表表); (3)若某天的空气质量等级为若某天的空气质量等级为 1 或或
19、 2,则称这天,则称这天“空气质量好空气质量好”;若某天的空;若某天的空气质量等级为气质量等级为 3或或 4,则称这天,则称这天“空气质量不好空气质量不好”根据所给数据,完成下面的根据所给数据,完成下面的 22 列联表,并根据列联列联表,并根据列联表,判断是否有表,判断是否有 95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关? 人次人次400 人次人次400 空气质量好空气质量好 空气质量不好空气质量不好 附:附:K2n adbc 2 ab cd ac bd , P(K2k) 0.050 0.010 0.001 k 3
20、.841 6.635 10.828 解解 (1)由所给数据,该市一天的空气质量等级为由所给数据,该市一天的空气质量等级为 1,2,3,4 的概率的估计的概率的估计值如下表:值如下表: 空气质量等级空气质量等级 1 2 3 4 概率的估计值概率的估计值 0.43 0.27 0.21 0.09 (2)一天中到该公园锻炼的平均人次的估计值为一天中到该公园锻炼的平均人次的估计值为 1100(100203003550045)350. (3)根据所给数据,可得根据所给数据,可得 22 列联表:列联表: 人次人次400 人次人次400 空气质量好空气质量好 33 37 空气质量不好空气质量不好 22 8 根
21、据列联表得根据列联表得 K2100 3382237 2554570305.820. 由于由于 5.8203.841,故有,故有 95%的把握认为的把握认为一天中到该公园锻炼的人次与该市当天的空气质量一天中到该公园锻炼的人次与该市当天的空气质量有关有关 方法技巧方法技巧 解独立性检验应用问题的解独立性检验应用问题的 2 个关注点个关注点 两个明确两个明确 明确两类主体;明确研究的两个问题明确两类主体;明确研究的两个问题 两个准确两个准确 准确画出准确画出 22 列联表;准确计算列联表;准确计算 K2 11 针对训练针对训练 (2021 大连一模大连一模)在某次测验中,某班在某次测验中,某班 40
22、 名考生的成绩满分名考生的成绩满分 100 分统计如图所示分统计如图所示 (1)估计这估计这 40 名学生的测验成绩的中位数名学生的测验成绩的中位数 x0(精确到精确到 0.1); (2)记记 80 分以上为优秀,分以上为优秀,80 分及以下为合格,结合频率分布直方图完成下表,并判断分及以下为合格,结合频率分布直方图完成下表,并判断是否是否有有 95%的把握认为数学测验成绩与性别有关?的把握认为数学测验成绩与性别有关? 合格合格 优秀优秀 总计总计 男生男生 16 女生女生 4 总计总计 40 解:解:(1)由频率分布直方图易知由频率分布直方图易知 0.01100.015100.02100.4
23、5,即分数在,即分数在)40,70 的的频率为频率为 0.45, 0.03()x070 0.50.45,解得,解得 x0215371.7, 40 名学生的测验成绩的中位数为名学生的测验成绩的中位数为 71.7. (2)由频率分布直方图,可得列联表如下:由频率分布直方图,可得列联表如下: 合格合格 优秀优秀 总计总计 男生男生 16 6 22 女生女生 14 4 18 总计总计 30 10 40 K240()164146230102218402970.1356.635,所以有,所以有 99%以上的把握认为以上的把握认为“生育意愿与城市级别有生育意愿与城市级别有关关”,故选,故选 C. 5(多选多
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022届高三数学一轮复习(原卷版)第二节变量间的相关性与统计案例教案
限制150内