【人教A版】高考数学(文)一轮设计:第十章 第3讲 变量间的相关关系与统计案例.ppt
第3讲变量间的相关关系与统计案例,最新考纲1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程;3.了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用.,知 识 梳 理,1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:_;统计量有相关系数与相关指数. (1)在散点图中,点散布在从_到_的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从_到_的区域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在_附近,称两个变量具有线性相关关系.,散点图,左下角,右上角,左上角,右下角,一条直线,2.线性回归方程,距离的平方和,斜率,3.残差分析,4.独立性检验 (1)利用随机变量K2来判断“两个分类变量_”的方法称为独立性检验. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(22列联表)为,有关系,ab,bd,abcd,诊 断 自 测,1.判断正误(在括号内打“”或“”) 精彩PPT展示,答案(1)(2)(3)(4),解析由正负相关性的定义知一定不正确.,答案D,3.(2015全国卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是(),A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关,解析对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A正确.对于B选项,由图知,由2006年到2007年矩形高度明显下降,因此B正确.对于C选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,D不正确.,答案D,4.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K20.99,根据这一数据分析,下列说法正确的是() A.有99%的人认为该电视栏目优秀 B.有99%的人认为该电视栏目是否优秀与改革有关系 C.有99%的把握认为该电视栏目是否优秀与改革有关系 D.没有理由认为该电视栏目是否优秀与改革有关系,解析只有K26.635才能有99%的把握认为该电视栏目是否优秀与改革有关系,而既使K26.635也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,与是否有99%的人等无关.故只有D正确. 答案D,现发现表中有一个数据看不清,请你推断出该数据的值为_.,答案68,考点一相关关系的判断,【例1】 (1)(2015湖北卷)已知变量x和y满足关系y0.1x1,变量y与z正相关.下列结论中正确的是() A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关,(2)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:,则哪位同学的试验结果体现A,B两变量有更强的线性相关性() A.甲 B.乙 C.丙 D.丁,解析(1)由y0.1x1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相关,故选C. (2)在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两变量有更强的线性相关性.,答案(1)C(2)D,规律方法(1)利用散点图判断两个变量是否有相关关系是比较直观简便的方法.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关. (2)利用相关系数判定,当|r|越趋近于1相关性越强.当残差平方和越小,相关指数R2越大,相关性越强.,【训练1】 x和y的散点图如图所示,则下列说法中所有正确命题的序号为_.,答案,考点二线性回归方程及应用,【例2】 (2016全国卷)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.,注:年份代码17分别对应年份20082014. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.,【训练2】 (2017重庆一中质检)随着我国经济的发展,居民的储蓄存款逐年增长设某地区城乡居民人民币储蓄存款(年底余额)如下表:,解(1)列表计算如下,考点三独立性检验,【例3】 某高校共有学生15 000人,其中男生10 500人,女生4 500人为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集了300位学生每周平均体育运动时间的样本数据(单位:小时) (1)应收集多少位女生的样本数据? (2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为: 0,2,(2,4,(4,6,(6,8,(8,10,(10,12估计该校学生每周平均体育运动时间超过4小时的概率;,(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,(3)由(2)知,300位学生中有3000.75225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时 又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:,(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出22列联表;,解(1)由已知可得,该公司员工中使用微信的有20090%180(人),思想方法 1.求回归方程,关键在于正确求出系数 , ,由于 , 的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误 2. 回归分析是处理变量相关关系的一种数学方法主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程 3.独立性检测是根据K2的值判断两个分类变量有关的可信程度,易错防范 1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义根据回归方程进行预报,仅是一个预报值,而不是真实发生的值 2.独立性检验中统计量K2的观测值k0的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.,