高考数学一轮复习第9章算法初步统计与统计案例第4节变量间的相关关系与统计案例教师用书文新人教A版.doc
《高考数学一轮复习第9章算法初步统计与统计案例第4节变量间的相关关系与统计案例教师用书文新人教A版.doc》由会员分享,可在线阅读,更多相关《高考数学一轮复习第9章算法初步统计与统计案例第4节变量间的相关关系与统计案例教师用书文新人教A版.doc(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 / 17【2019【2019最新最新】精选高考数学一轮复习第精选高考数学一轮复习第9 9章算法初步统计与统计案例第章算法初步统计与统计案例第 4 4节变量间的相关关系与统计案例教师用书文新人教节变量间的相关关系与统计案例教师用书文新人教A A版版 考纲传真 1.会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归系数公式不要求记忆).3.了解回归分析的基本思想、方法及其简单应用.4.了解独立性检验(只要求22列联表)的思想、方法及其初步应用1回归分析回归分析是对具有相关关系的两个变量进行统计
2、分析的一种常用方法;判断相关性的常用统计图是散点图;统计量有相关系数与相关指数(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系2线性回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn),其回归方程为x,则,.其中,是回归方程的斜率,是在y轴上的截距3
3、残差分析(1)残差:对于样本点(x1,y1),(x2,y2),(xn,yn),它们的随机误差为eiyibxia,i1,2,n,其估计值为iyiiyixi,i1,2,n,i称为相应于点(xi,yi)的残差2 / 17(2)相关指数:R21.4独立性检验(1)利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验(2)列联表:列出的两个分类变量的频数表,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(22列联表)为y1y2总计x1ababx2cdcd总计acbdabcd则随机变量K2(其中nabcd为样本容量)1(思考辨析)判断下列结论的
4、正误(正确的打“”,错误的打“”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系( )(2)某同学研究卖出的热饮杯数y与气温x()之间的关系,得回归方程2.352x147.767,则气温为2时,一定可卖出143杯热饮( )(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验( )(4)若事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越小( )答案 (1) (2) (3) (4)2(教材改编)已知变量x与y正相关,且由观测数据算得样本平均数3,3.5,则由该观测数据算得的线性回归方程可能是( )A.0.4x2.3 B.2x2.4C.2x
5、9.5D.0.3x4.4A A 因为变量因为变量x x和和y y正相关,排除选项正相关,排除选项C C,D.D.又样本中心又样本中心(3,3.5)(3,3.5)在回归直线上,排除在回归直线上,排除B B3 / 17,选项,选项A A满足满足 3(2015全国卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )图941A逐年比较,2008年减少二氧化硫排放量的效果最显著B2007年我国治理二氧化硫排放显现成效C2006年以来我国二氧化硫年排放量呈减少趋势D2006年以来我国二氧化硫年排放量与年份正相关D D 对于对于A A选项,由图知从选项
6、,由图知从20072007年到年到20082008年二氧化硫排放量下降得最多,故年二氧化硫排放量下降得最多,故A A正确正确对于对于B B选项,由图知,由选项,由图知,由20062006年到年到20072007年矩形高度明显下降,因此年矩形高度明显下降,因此B B正确对于正确对于C C选项,由图知从选项,由图知从20062006年以后除年以后除20112011年稍有上升外,其余年份都是逐年下降的,所年稍有上升外,其余年份都是逐年下降的,所以以C C正确由图知正确由图知20062006年以来我国二氧化硫年排放量与年份负相关,故选年以来我国二氧化硫年排放量与年份负相关,故选D.D.4为了评价某个电
7、视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K20.99,根据这一数据分析,下列说法正确的是 ( )A有99%的人认为该电视栏目优秀B有99%的人认为该电视栏目是否优秀与改革有关系C有99%的把握认为该电视栏目是否优秀与改革有关系D没有理由认为该电视栏目是否优秀与改革有关系D D 只有只有K26.635K26.635才能有才能有99%99%的把握认为的把握认为“该电视栏目是否优秀与改革有关系该电视栏目是否优秀与改革有关系”,而即使而即使K26.635K26.635也只是对也只是对“该电视栏目是否优秀与改革有关系该电视栏目是否优秀与改革有关系”这个论断成立这个论断
8、成立的可能性大小的结论,与是否有的可能性大小的结论,与是否有99%99%的人等无关,故只有的人等无关,故只有D D正确正确 5(2017贵阳检测)若8名学生的身高和体重数据如下表:编号12345678身高/cm1651651571701751651551704 / 17体重/kg48575464614359第3名学生的体重漏填,但线性回归方程是0.849x85.712,则第3名学生的体重估计为_kg.50 设第3名学生的体重为a,则(4857a5464614359)0.849(1651651571701751 8165155170)85.712. 解得a50.相关关系的判断(1)(2015湖北
9、高考)已知变量x和y满足关系y0.1x1,变量y与z正相关下列结论中正确的是( )Ax与y正相关,x与z负相关Bx与y正相关,x与z正相关Cx与y负相关,x与z负相关Dx与y负相关,x与z正相关(2)x和y的散点图如图942所示,则下列说法中所有正确命题的序号为_图942x,y是负相关关系;在该相关关系中,若用yc1ec2x拟合时的相关指数为R,用x拟合时的相关指数为R,则RR;x,y之间不能建立线性回归方程(1)C (2) (1)因为y0.1x1的斜率小于0,故x与y负相关因为y与z正相关,可设zy,0,则zy0.1x,故x与z负相关(2)在散点图中,点散布在从左上角到右下角的区域,因此x,
10、y是负相关关系,故正确;由散点图知用yc1ec2x拟合比用x拟合效果要好,则RR,5 / 17故正确;x,y之间可以建立线性回归方程,但拟合效果不好,故错误规律方法 1.利用散点图判断两个变量是否有相关关系是比较直观简便的方法如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系若点散布在从左下角到右上角的区域,则正相关,若点散布在左上角到右下角的区域,则负相关2利用相关系数判定,当|r|越趋近于1,相关性越强当残差平方和越小,相关指数R2越大,相关性越强变式训练1 甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,
11、并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )A甲 B乙 C丙 D丁D D 在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1 1,相关性,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了有丁的残差平方和最小,综上可知丁的试验结果体现了A A,
12、B B两变量有更强的线性两变量有更强的线性相关性相关性 线性回归方程及应用(2016全国卷)如图943是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图图943注:年份代码17分别对应年份20082014.6 / 17(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量参考数据:yi9.32,tiyi40.17,0.55,2.646.参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式分别为,.解 (1)由折线图中的数据和附注中的参考数据得4, (ti
13、)228,0.55,2分t(ti)(yi)tiyiyi40.1749.322.89,7i1所以r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当大,从而可以用线性回归模型拟合y与t的关系.5分(2)由1.331及(1)得0.103.8分b1.3310.10340.92.a所以y关于t的回归方程为0.920.10t.10分将2016年对应的t9代入回归方程得0.920.1091.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.12分规律方法 1.在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,也可计算相关
14、系数r进行判断若具有线性相关关系,则可通过线性回归方程估计和预测变量的值2(1)正确运用计算,的公式和准确的计算,是求线性回归方程的关键(2)回归直线x必过样本点的中心(,)变式训练2 7 / 17(2014全国卷)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年 份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人
15、均纯收入附:回归直线的斜率和截距的最小二乘估计公式分别为:,.b解 (1)由所给数据计算得(1234567)4,(2.93.33.64.44.85.25.9)4.3,y(ti)2941014928,3分7i17i1(ti)(yi)(3)(1.4)(2)(1)(1)(0.7)00.110.520.931.614,0,5,b4.30.542.3,a所求回归方程为0.5t2.3.6分(2)由(1)知,0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.9分将2015年的年份代号t9代入(1)中的回归方程,得0.592.36.8,y故预测该地区2015年农村
16、居民家庭人均纯收入为6.8千元.12分独立性检验(2017郑州调研)某高校共有学生15 000人,其中男生10 8 / 17500人,女生4 500人为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图944所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12估计该校学生每周平均体育运动时间超过4小时的概率;【导学号:31222369】图944(3)在样本数据中,有60
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高考 数学 一轮 复习 算法 初步 统计 案例 变量 相关 关系 教师 用书文 新人
链接地址:https://www.taowenge.com/p-739266.html
限制150内