2.3.2两个变量的线性相关-人教A版高中数学必修三课件(共61张PPT).pptx
变量之间的相关关系两个变量的线性相关,1.掌握两个变量间的相关关系及正相关负相关不具相关关系的判定.2.通过收集实际生活中两个变量的有关数据作出散点图.3.利用散点图直观地认识变量间的相关关系.4.正确理解回归直线方程最小二乘法的概念.5.能够根据散点图得到回归直线.6.掌握利用最小二乘法求回归直线方程的方法.,1.相关关系与函数关系不同,相关关系是一种_性关系.2.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为_,点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为_.3.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有_,这条直线叫_.,不确定,正相关,负相关,线性相关关系,回归直线,4.假设我们已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn).且所求回归方程是其中b是回归方程的_,是_,则有,斜率,截距,通过求Q=_的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.,(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2,1.变量之间的相关关系(1)相关关系自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系.(2)相关关系与函数关系的异同点相同点:两者均是指两个变量的关系;,不同点:函数关系是一种确定的关系.如匀速直线运动中时间t与路程s的关系;相关关系是一种非确定的关系.如一块农田的水稻产量与施肥量之间的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系,然而学会新词并不能使脚变大,而是涉及到第三个因素年龄,当儿童长大一些,他的阅读能力会提高,而且由于长大,脚也变大.,(3)相关关系的分析方向由于相关关系的不确定性,在寻找变量间相关关系的过程中,统计发挥非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.,2.两个变量的线性相关(1)回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析.通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性.(2)散点图将n个数据点(xi,yi),(i=1,2,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度.,(3)正相关负相关如果从散点图看到点散布的位置是左下角到右上角的区域.这种相关称为正相关.反之,如果两个变量的散点图中,点散布的位置是从左上角到右下角的区域.即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.如果关于两个变量统计数据的散点图呈现如图的形状,则这两个变量之间不具有相关关系.例如,学生的身高与学生的数学成绩没有相关关系.,利用散点图可以判断变量之间有无相关关系.,3.回归直线方程(1)回归直线观察散点图的特征,发现各点大致分布在一条直线的附近,就称这两个变量之间具有线性相关的关系,这条直线叫做回归直线.,(2)回归直线方程设x与y具有相关关系的两个变量,且相应于n组观测值的n个点大致分布在一条直线的附近,则由,其中,b是回归方程的斜率,a是截距.所得到的方程叫作回归直线方程,相应的直线叫作回归直线,而对两个变量所进行的统计分析叫作线性回归分析.,(3)最小二乘法设与n个观测点(xi,yi)(i=1,2,n)最接近的直线方程为(注意它与表示一次函数的习惯y=ax+b不同表示y的估算值).其中a,b是待定系数.用Q=(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2来刻画n个点与回归直线在整体上的偏差.上式展开后,是一个关于a,b的二次多项式,运用配方法,可求出使Q取得最小值时a,b的值(即上述公式中的a,b值).,上述求回归直线的方法,是使得样本数据的点到它的距离的平方和最小.由于平方又叫二乘方,所以这种使“偏差平方和为最小”的方法,叫做最小二乘法.,题型一相关关系的判断例1:下表是某地的年降雨量与年平均气温,两者是相关关系吗?求回归直线方程有意义吗?,分析:利用散点图进行判别.,解:以x轴为年平均气温,y轴为年降雨量,可得相应的散点图如下图所示:,因为图中各点并不在一条直线的附近,所以两者不具有相关关系,没必要用回归直线进行拟合,如果用公式求得回归直线也是没有意义的.规律技巧:用回归直线进行拟合两变量关系的一般步骤为:(1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式求出a,b并写出线性回归方程.,变式训练1:5个学生的数学和物理成绩如下表:,画出散点图,并判断它们是否有相关关系.,分析:解答本题可以以数学成绩为自变量,考察因变量物理成绩的变化趋势,从而作出判断.解:以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如图所示:由散点图可见,图中的点大致在一条直线附近,故两者之间具有相关关系.,题型二求回归直线方程例2:每立方米混凝土的水泥用量(单位:kg)与28天后混凝土的抗压强度(单位:kg/cm2)之间的关系有如下数据:,(1)画出散点图;(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的回归直线方程.分析:(1)将表中的各对数据在平面直角坐标系中描点,便得到具有相关关系的两个变量的一组数据的图形,即得散点图;(2)按照求回归直线方程的步骤和公式,写出回归直线方程.,解:(1)如下图.,(2)由散点图知,x与y之间具有线性相关关系,下面求回归直线方程.制表:,规律技巧:用公式求回归直线方程的一般步骤:(1)列表xi,yi,xiyi.(2)计算(3)代入公式求的值.(4)写出回归直线方程.,变式训练2:求变式训练1中的回归直线方程.解:列表:,题型三利用回归直线方程对总体进行估计例3:在7块并排形状大小相同的实验田上进行施化肥量对水稻产量影响的试验,得数据列表(单位:kg):,(1)画出散点图;(2)求水稻产量y与施化肥量x之间的回归直线方程;(3)当施化肥50kg时,对水稻的产量予以估计.分析:解答本题应先画散点图,判断其是否线性相关,再利用最小二乘法求其回归方程.,(1)画出散点图如图:由图可见是线性相关的.,(2)借助计算器列表:,(3)施化肥50kg时,可以估计水稻产量约为495kg.,规律技巧:(1)回归分析是寻找相关关系中非确定性关系的某种确定性;(2)求回归直线方程,关键在于正确地求出系数a,b,由于a,b的计算量大,计算时要仔细,避免计算失误.,变式训练3:改革开放以来,我国高等教育事业有了迅速发展,这里我们得到了某省从1990年到2000年18岁到20岁的青年人每年考入大学的百分比.我们把农村,县镇和城市分开统计.为了便于计算,把1990年编号为0,1991年编号为1,2000年编号为10.如果把每年考入大学的百分比作为因变量,把年份从0到10作为自变量,进行回归分析,可得到下面三条回归直线:城市:县镇:农村:,(1)在同一坐标系中作出这三条回归直线;(2)对于农村青年来讲,系数等于0.42意味着什么?(3)在这一阶段哪一组的大学入学率年增长最快?,解:(1)图象如下:,(2)对于农村青年来讲,0.42意味着考入大学的百分比平均以每年0.42的速度递增,由此可以看出农村经济条件及教育现状与城镇的差别.(3)城市组的大学入学率年增长最快.,基础强化1.下列两个变量具有相关关系且不是函数关系的是()A.正方形的边长与面积B.匀速行驶的车辆的行驶距离与时间C.人的身高与体重D.人的身高与视力解析:AB都是函数关系,C是相关关系,D中人的视力与身高没有关系.答案:C,2.下列关系是函数关系的是()A.产生样本与生产数量B.球的表面积与体积C.家庭的支出与收入D.人的年龄与学习成绩解析:球的表面积与体积存在函数关系,应选B.答案:B,3.如下图所示,有5组(x,y)数据,去掉()组数据后,剩下的4组数据的线性相关系数最大.(),解析:由相关关系及图象可知,去掉D(3,10)组数据后,余下的四组数据相关关系最大.答案:D,4.设有一个回归方程,则变量x增加一个单位时()A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位解析:由回归方程知,x与y负相关,即x增加一个单位,y平均减少1.5个单位.答案:C,5.线性回归方程必定过()A.(0,0)点B.(,0)点C.(0,)点D.()点解析:回归直线方程一定经过样本点的中心答案:D,6.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()解析:把四组实验值代入验证知,适合.答案:A,7.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回归方程为,张刚同学(20岁)身高178cm,他的体重应该在_kg左右.解析:回归方程对身高178cm的人的体重进行预测,当x=178时,69.96,8.下列关于回归直线方程=bx+a叙述正确的是_.反映与x之间的函数关系;反映y与x之间的函数关系;表示与x之间的不确定关系;表示最接近y与x之间直线关系的一条直线.解析:=bx+a表示与x之间的函数关系,而不是y与x之间的函数关系.但它反映的关系最接近y与x之间的真实关系,故选.,能力提升9.下列说法:线性回归方程适用于一切样本和总体;线性回归方程一般都有局限性;样本取值的范围会影响线性回归方程的适用范围;线性回归方程得到的预测值是预测变量的精确值.其中正确的是_.,解析:样本和总体具有线性相关关系时,才能求线性回归方程,而由线性回归方程得到的函数值是近似值,非精确值.因此线性回归方程有一定的局限性.,10.(2007广东)下表提供了某厂节能降耗技术,改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请据上表提供的数据,用最小二乘法求出y关于x的线性回归方程,(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考值:32.5+43+54+64.5=66.5),解:(1)由题设所给数据,可得散点图如下图所示:,(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗得降低的生产能耗约为:90-(0.7100+0.35)=19.65(吨标准煤).,品味高考11.(2009海南宁夏)对变量x,y有观测数据(xi,yi)(i=1,2,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,10),得散点图2.由这两个散点图可以判断(),A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关答案:C,12.(2010广东卷)某市居民2005-2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出_线性相关关系.,13,是,解析:由表易知,居民家庭年平均收入的中位数是13,把表中数作出散点图,如下图.由散点图知,家庭年平均收入与年平均支出是线性相关关系.,