2.3,2变量之间的相关关系.ppt
2.3 变量量间的相关关系的相关关系 思考思考:在日常生活中,在日常生活中,经经常能常能发现发现,若一位同学的若一位同学的数学成数学成绩绩好,好,则则他的物理成他的物理成绩绩一般也不差。那么是否一般也不差。那么是否物理成物理成绩绩与数学成与数学成绩绩之之间间存在着一种相关关系?存在着一种相关关系?这这种种说说法有没有根据呢?法有没有根据呢?物理成绩物理成绩数学成绩数学成绩学习时间学习时间学习兴趣学习兴趣其他因素其他因素结论结论:物理成物理成绩绩和数学成和数学成绩绩之之间间是一种不确定的关系是一种不确定的关系 两个两个变变量之量之间间可能是确定性关系可能是确定性关系(如函数关系如函数关系);也可能是不确定关系也可能是不确定关系(如如:物理成物理成绩绩与数学成与数学成绩绩)问题问题1:能否再能否再举举出几个出几个现实现实生活中相关关系的例子生活中相关关系的例子?(1)商品销售收入与广告支出之间的关系商品销售收入与广告支出之间的关系(2)粮食产量与施肥量之间的关系粮食产量与施肥量之间的关系(3)人体内脂肪含量与年龄之间的关系人体内脂肪含量与年龄之间的关系 当自变量取值一定时当自变量取值一定时,因变量的取值带有一定随机因变量的取值带有一定随机性的两个变量的关系性的两个变量的关系,叫做叫做相关关系相关关系.问题问题2:生活中非相关关系的例子生活中非相关关系的例子 如如:身高与数学成绩之间的关系身高与数学成绩之间的关系相关关系是一种非确定性关系相关关系是一种非确定性关系探究探究:在一次对人体脂肪含量和年龄关系的研究中在一次对人体脂肪含量和年龄关系的研究中,研研究究 人员获得了一组样本数据人员获得了一组样本数据:人体的脂肪百分比和年龄人体的脂肪百分比和年龄根据上述数据根据上述数据,人体的脂肪含量与年龄之间有怎样的人体的脂肪含量与年龄之间有怎样的关系关系?散点图散点图 正相关正相关:指的是两个变量有相同的变化趋势指的是两个变量有相同的变化趋势,即从整体即从整体上来看一个变量会随着另一个变量上来看一个变量会随着另一个变量变大而变大变大而变大.这在散点这在散点图上的反映就是散点的分布在斜率大于图上的反映就是散点的分布在斜率大于0 0的直线附近的直线附近;负相关负相关:指的是两个变量有相反的变化趋势指的是两个变量有相反的变化趋势,即从整体即从整体上来看一个变量会随着另一个变量上来看一个变量会随着另一个变量变大而变小变大而变小,正相关正相关:指的是两个变量有相同的变化趋势指的是两个变量有相同的变化趋势,即从整体即从整体上来看一个变量会随着另一个变量上来看一个变量会随着另一个变量变大而变大变大而变大,这在散点这在散点图上的反映就是散点的分布在图上的反映就是散点的分布在斜率大于斜率大于0 0的直线附近的直线附近;这在散点图这在散点图上的反映就是散点的分布在上的反映就是散点的分布在斜率小于斜率小于0 0的直线附近的直线附近.线性相关关系:线性相关关系:散点图散点图 如果散点图中点的分布从整体上看大致在一如果散点图中点的分布从整体上看大致在一条直线附近条直线附近,我们就称这两个变量之间具有我们就称这两个变量之间具有线性相线性相关关系关关系,这条直线叫做这条直线叫做回归直线回归直线.注意注意:利用利用散点图散点图可以判断变量之间有无相关关可以判断变量之间有无相关关系系.例例1:某机构曾研究温度对翻车鱼的影响,在一定温度下,经过某机构曾研究温度对翻车鱼的影响,在一定温度下,经过 x单位时间,翻车鱼的存活比例为单位时间,翻车鱼的存活比例为y,数据如下:,数据如下:(0.10,1.00),(0.15,0.95),(0.20,0.95),(0.25,0.90),(0.30,0.85),(0.35,0.70),(0.40,0.65),(0.45,0.60),(0.50,0.55),(0.55,0.40)(1)请作出这些数据的散点图;请作出这些数据的散点图;(2)关于这两个变量的关系,你能得出什么结论?关于这两个变量的关系,你能得出什么结论?解:以解:以x轴表示经过时间,轴表示经过时间,y轴表示存活比例,可得散点图如下:轴表示存活比例,可得散点图如下:如图可知,时间越久,翻车鱼的存活比例越低。如图可知,时间越久,翻车鱼的存活比例越低。回归直线回归直线:从整体上看各数据点与此直线的距离和最小从整体上看各数据点与此直线的距离和最小.思考思考:你认为回归直线应具有怎样特征你认为回归直线应具有怎样特征?如何求回归直线如何求回归直线?假设已经得到两个具有线性相关关系的变量的一组假设已经得到两个具有线性相关关系的变量的一组数据数据且所求回归方程是且所求回归方程是(其中(其中a,b是待定参数是待定参数.)问题问题:如何刻画如何刻画从整体上看各数据点与此直线的距离最小从整体上看各数据点与此直线的距离最小?假设已经得到两个具有线形相关关系的变量的一组假设已经得到两个具有线形相关关系的变量的一组数据数据可得到可得到 它与实际收集到的它与实际收集到的 之间的偏差是之间的偏差是当变量当变量x取取时,时,且所求回归方程是且所求回归方程是(其中(其中a,b是待定参数是待定参数.)由于含有绝对值,运算不方便,于是改用为由于含有绝对值,运算不方便,于是改用为来刻画来刻画 n 个点与回归直线在整体上的偏差个点与回归直线在整体上的偏差则则 n 个偏差的和可表达个偏差的和可表达为:为:所以,当所以,当 取最小值时,总体偏差最小。取最小值时,总体偏差最小。回回归归方程方程其中其中b是回是回归归方程的斜率,方程的斜率,a是截距是截距回归方程回归方程 的斜率与截距的一般公式的斜率与截距的一般公式:知知识识回回顾顾其中其中b是回是回归归方程的斜率,方程的斜率,a是截距是截距3.3.回归方程回归方程 的斜率与截距的一般公式的斜率与截距的一般公式:1.当自变量取值一定时当自变量取值一定时,因变量的取值带有一定随因变量的取值带有一定随机性的两个变量的关系机性的两个变量的关系,叫做叫做相关关系相关关系.相关关系是一种非确定性关系相关关系是一种非确定性关系2.正相关、正相关、负负相关、相关、线线性相关性相关 1.1.下列两个变量之间的关系是相关关系的是下列两个变量之间的关系是相关关系的是()()A A、正方体的棱长和体积、正方体的棱长和体积 B B、单位圆中角的度数和所对弧长、单位圆中角的度数和所对弧长C C、单产为常数时,土地面积和总产量、单产为常数时,土地面积和总产量 D D、日照时间与水稻的亩产量、日照时间与水稻的亩产量D C.D.表示的直表示的直线线必必经过经过的一个定点是的一个定点是()2.回回归归方程方程 A.B.C3.在下列各图中,每个图的两个变量具有相关关系的图是在下列各图中,每个图的两个变量具有相关关系的图是(1)(2)(3)(4)A.(1)()(2)B.(1)()(3)C.(2)()(4)D.(2)()(3)D例例1、假假设设关于某关于某设备设备的使用年限的使用年限x和所支出的和所支出的维维修修费费用用y(万元)有如下的(万元)有如下的统计资统计资料料使用年限使用年限x23456维维修修费费用用y2.23.85.56.57.0若由若由资资料知料知y对对x呈呈线线性相关关系,性相关关系,试试求求(1)线线性回性回归归方程方程 的回的回归归系数系数a,b解:解:制表:制表:i12345合合计计xi23456yi2.23.85.56.57.0 xiyixi220254.411.4 22.032.5 42.0 112.34 9 16 25 36 90计计算得:算得:解解:制表:制表:i12345合合计计xi23456yi2.23.85.56.57.0 xiyixi220254.411.422.032.5 42.0 112.34 9 16 25 36 90计计算得:算得:回回归归方程的求法方程的求法1、列表、列表xi,yi,xiyi,xi22、计计算算3、代入公式,求、代入公式,求a,b的的值值4、列出直、列出直线线方程方程例例1、假假设设关于某关于某设备设备的使用年限的使用年限x和所支出的和所支出的维维修修费费用用y(万元)有如下的(万元)有如下的统计资统计资料料使用年限使用年限x23456维维修修费费用用y2.23.85.56.57.0若由若由资资料知料知y对对x呈呈线线性相关关系,性相关关系,试试求求(1)线线性回性回归归方程方程 的回的回归归系数系数a,b(2)估)估计计使用年限使用年限为为10年年时时,维维修修费费用是多少?用是多少?解解:由(由(1)知:回)知:回归归直直线线:则则当当x=10时时,y=1.2310+0.08=12.38(万元万元)即估即估计计使用使用10年年时维时维修修费费用是用是12.38万元万元例例2 2、有一个同学家开了一个小卖部,他为了研究有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:的热饮杯数与当天气温的对比表:(1)(1)画出散点图画出散点图;(2)(2)从散点图中发现气温与热饮销售杯数之间关系的从散点图中发现气温与热饮销售杯数之间关系的 一般规律一般规律;(3)(3)求回归方程求回归方程;(4)(4)如果某天的气温是如果某天的气温是2,2,预测这天内卖出的热饮杯预测这天内卖出的热饮杯数数.解:散点图如图所示解:散点图如图所示(2)从图中看到从图中看到,各点散布在从左上角到右下角的区域里各点散布在从左上角到右下角的区域里,因此因此,气温与热饮销售杯数之间成负相关气温与热饮销售杯数之间成负相关,即气温越高,即气温越高,卖出去的热饮杯数越少卖出去的热饮杯数越少.2ndfDEL(清零清零)2ndfMODE2RCL(截距截距a)RCL)(斜率斜率b)-5M+STO1560M+STO1504M+STO1327M+STO 12815M+STO11612M+STO13019M+STO10423M+STO8927M+STO9331M+STO7636M+STO54 (3)从散点图可以看出,这些点大致分布在一条直线从散点图可以看出,这些点大致分布在一条直线的附近的附近,因此因此,可用公式求出回归方程的系数可用公式求出回归方程的系数.利用计算器得利用计算器得所以回所以回归归方程方程为为 (4)当当x=2时时,=143.063.因此因此,某天的气温为某天的气温为2时这天大约可以卖出时这天大约可以卖出143杯热饮杯热饮.思考思考:气温气温为为2 oC时时小小卖卖部一定能部一定能卖卖出出143杯左右杯左右 热饮吗热饮吗?为为什么?什么?练习练习一个一个车间为车间为了了规规定工定工时时定定额额,需要确定加工零件所花,需要确定加工零件所花费费的的时间时间,为为此此进进行了行了10次次试验试验,收集数据如下,收集数据如下零件件数零件件数零件件数零件件数x x x x(个)(个)(个)(个)1010 20203030404050506060 707080809090100100加工时间加工时间加工时间加工时间y y y y(minminminmin)6262 68687575818189899595 102102 108108 115115 122122(1)画出散点)画出散点图图(2)求回)求回归归方程方程(3)关于加工零件的个数与加工)关于加工零件的个数与加工时间时间,你能得出什么你能得出什么结论结论?(3)结论结论:加工零件的个数与所花加工零件的个数与所花费费的的时间时间成正成正 相关关系相关关系 作业作业:下表提供了某厂节能降耗技术改造后生产甲产下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量品过程中记录的产量x(吨吨)与相应的生产能耗与相应的生产能耗y(吨标准煤吨标准煤)的几组对照数据的几组对照数据 x3 456y2.5 344.5 (1)(1)请画出上表数据的散点图;请画出上表数据的散点图;(2)请根据上表提供的数据,求出请根据上表提供的数据,求出y关于关于x的线性的线性 回归方程回归方程(3)已知该厂技改前已知该厂技改前100吨甲产品的生产能耗为吨甲产品的生产能耗为90吨吨 标准煤标准煤.试根据试根据(2)求出的线性回归方程求出的线性回归方程,预测生产预测生产100 吨甲产品的生产能耗比技改前降低多少吨标准煤吨甲产品的生产能耗比技改前降低多少吨标准煤?作业作业:下表提供了某厂节能降耗技术改造后生产甲产品过程中下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量记录的产量x(吨吨)与相应的生产能耗与相应的生产能耗y(吨标准煤吨标准煤)的几组对照数据的几组对照数据 x3 456y2.5 344.5 (1)(1)请画出上表数据的散点图;请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出请根据上表提供的数据,用最小二乘法求出 y关于关于x的线性回归方程的线性回归方程(3)已知该厂技改前已知该厂技改前100吨甲产品的生产能耗为吨甲产品的生产能耗为90吨吨 标准煤标准煤.试根据试根据(2)求出的线性回归方程求出的线性回归方程,预测生产预测生产100 吨甲产品的生产能耗比技改前降低多少吨标准煤吨甲产品的生产能耗比技改前降低多少吨标准煤?解解:(1)散点图略散点图略 所求的回归方程为所求的回归方程为 (2)(3)预测生产预测生产100吨甲产品的生产能耗比技改前降低吨甲产品的生产能耗比技改前降低 90-70.35=19.65(吨吨)x3 456y2.5 344.5小小结结1、能利用散点、能利用散点图认识变图认识变量量间间的相关关系的相关关系2、体会最小二乘法的思想、体会最小二乘法的思想3、能利用、能利用计计算器、算器、线线性回性回归归方程的系数公式求方程的系数公式求 回回归归方程方程作作业业 习题习题2.3 A组组 2零件数零件数加工加工时间时间020406080100120020406080100120140(3)结论结论:加工零件的个数与所花加工零件的个数与所花费费的的时间时间成正成正相关关系相关关系 问题问题:根据根据该该散点散点图图,能否,能否进进一步得出:人的年一步得出:人的年龄龄增加增加时时,体内脂肪含量以什么,体内脂肪含量以什么样样的方式增加呢?的方式增加呢?散点图散点图