《两个变量间的相关关系优秀课件.ppt》由会员分享,可在线阅读,更多相关《两个变量间的相关关系优秀课件.ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、两个变量间的相关关系第1页,本讲稿共44页 世界是一个普遍联系的世界是一个普遍联系的整整 体,任何事物都与其它事体,任何事物都与其它事物相联系物相联系第2页,本讲稿共44页小明小明,你数学成绩不太好你数学成绩不太好,物理怎么样物理怎么样?也不太好啊也不太好啊.学不好数学学不好数学,物理也是学不好的物理也是学不好的?.第3页,本讲稿共44页你认为老师的说法对吗你认为老师的说法对吗?事实上事实上,我们在考察数学成绩对物理成绩影响的我们在考察数学成绩对物理成绩影响的同时同时,还必须考虑到其他的因素还必须考虑到其他的因素:爱好爱好,努力程度努力程度如果单纯从数学对物理的影响来考虑如果单纯从数学对物理的
2、影响来考虑,就是就是考虑这两者之间的考虑这两者之间的相关关系相关关系物理成绩物理成绩数数学学成成绩绩学习学习兴趣兴趣花费花费时间时间其他其他因素因素第4页,本讲稿共44页探究一探究一 阅读课本阅读课本P84-P85内容及课堂练习,内容及课堂练习,思考并讨论以下问题:思考并讨论以下问题:1.当两个变量之间是一种确定性关系时,这两个当两个变量之间是一种确定性关系时,这两个变量之间的关系是函数关系;变量之间的关系是函数关系;当两个变量之间当两个变量之间带有随机性时,这两个变量之间的关系是什么关系?带有随机性时,这两个变量之间的关系是什么关系?2.相关关系与函数关系有什么异同?相关关系与函数关系有什么
3、异同?3.请举出一两个现实生活中具有相关关系的例子或成请举出一两个现实生活中具有相关关系的例子或成语语4.思考回答思考回答P85课堂练习课堂练习1、2:第5页,本讲稿共44页探究一探究一 阅读课本阅读课本P84-P85内容及课堂练习,内容及课堂练习,思考并讨论以下问题:思考并讨论以下问题:1.当两个变量之间是一种确定性关系时,这两当两个变量之间是一种确定性关系时,这两个变量之间的关系是函数关系;个变量之间的关系是函数关系;当两个变量之当两个变量之间带有随机性时,这两个变量之间的关系是什间带有随机性时,这两个变量之间的关系是什么关系?么关系?变量间相关关系变量间相关关系:自变量取值一定时自变量取
4、值一定时,因变量的取值因变量的取值带有一定随机性的两个变量之间的关系带有一定随机性的两个变量之间的关系.第6页,本讲稿共44页2.相关关系与函数关系有什么异同?相关关系与函数关系有什么异同?相同点相同点:两者均是指两个变量间的关系两者均是指两个变量间的关系.不同点不同点:函数关系是一种函数关系是一种确定确定的关系;的关系;相关关系是一种相关关系是一种非确定非确定的关系的关系.第7页,本讲稿共44页商品销售收入商品销售收入广告支出经费广告支出经费?粮食产量粮食产量施肥量施肥量?学习成绩学习成绩学习时间学习时间?3.请举出一两个现实生活中具有相关关系的例子或成请举出一两个现实生活中具有相关关系的例
5、子或成语语第8页,本讲稿共44页生活中相关成语:生活中相关成语:“名师出高徒名师出高徒”,“瑞雪兆丰年瑞雪兆丰年”“强将手下无弱兵强将手下无弱兵”“虎父无犬子虎父无犬子”“老子英雄儿好汉,老子反动儿混蛋老子英雄儿好汉,老子反动儿混蛋”“上梁不正下梁歪上梁不正下梁歪”第9页,本讲稿共44页吸烟会损害身体的健康。但人体健康吸烟会损害身体的健康。但人体健康是由很多因素共同作用的结果,既有长是由很多因素共同作用的结果,既有长寿的吸烟者,又有发现由于吸烟而引发寿的吸烟者,又有发现由于吸烟而引发的患病者,吸烟与健康是一种相关关系的患病者,吸烟与健康是一种相关关系,所以吸烟不一定引起健康问题。,所以吸烟不一
6、定引起健康问题。1.有关法律规定,香烟盒上必须印上有关法律规定,香烟盒上必须印上“吸烟有害吸烟有害健康健康”的警示语。吸烟是否一定会引起健康问题?你认的警示语。吸烟是否一定会引起健康问题?你认为为“健康问题不一定是由吸烟引起的,所以可以吸烟健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?的说法对吗?但吸烟引起健康问题的可能性大,因此但吸烟引起健康问题的可能性大,因此“健康问题不一定健康问题不一定是由吸烟引起的,所以可以吸烟是由吸烟引起的,所以可以吸烟”的说法是不对的。的说法是不对的。4.思考回答思考回答P85课堂练习课堂练习1、2:第10页,本讲稿共44页没有根据说明没有根据说明“天鹅
7、能够带来孩子天鹅能够带来孩子”,完全可能存在既能吸引天鹅又使婴儿出完全可能存在既能吸引天鹅又使婴儿出生率高的第三个因素(例如独特的环境生率高的第三个因素(例如独特的环境因素),即天鹅与婴儿出生率之间没有因素),即天鹅与婴儿出生率之间没有直接的关系,因此直接的关系,因此“天鹅能够带来孩子天鹅能够带来孩子”的结论不可靠。的结论不可靠。2.某地区的环境条件适合天鹅栖息繁衍,有人统计发现了某地区的环境条件适合天鹅栖息繁衍,有人统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿出生率低。于是,他就得出
8、婴儿出生率也高,天鹅少的地方婴儿出生率低。于是,他就得出一个结论:天鹅能够带来孩子。你认为这样得到的结论可靠吗?一个结论:天鹅能够带来孩子。你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?如何证明这个结论的可靠性?可以通过试验来进行。相同的环境下将居民随机地分为可以通过试验来进行。相同的环境下将居民随机地分为两组,一组居民和天鹅一起生活(比如家中都饲养天鹅)两组,一组居民和天鹅一起生活(比如家中都饲养天鹅),而另一组居民的附近不让天鹅活动,对比两组居民的,而另一组居民的附近不让天鹅活动,对比两组居民的出生率是否相同。出生率是否相同。P85-练习练习2:第11页,本讲稿共44页1.下列关系
9、中下列关系中,是带有随机性相关关系的是(是带有随机性相关关系的是()正方形的边长与面积的关系正方形的边长与面积的关系;水稻产量与施水稻产量与施肥量之间的关系肥量之间的关系;人的身高与年龄之间的关系人的身高与年龄之间的关系;降雪量与交通事故发生之间的关系降雪量与交通事故发生之间的关系.2.下列两个变量之间的关系哪个不是函数关下列两个变量之间的关系哪个不是函数关系()系()A角度和它的余弦值角度和它的余弦值B.正方形边长和面积正方形边长和面积C正边形的边数和它的内角和正边形的边数和它的内角和 D.人体的脂肪含量与年龄人体的脂肪含量与年龄即学即用即学即用第12页,本讲稿共44页 以上种种问题中的两个
10、变量之间的相关以上种种问题中的两个变量之间的相关关系关系,我们都可以根据自己的生活我们都可以根据自己的生活,学习经验作学习经验作出相应的判断出相应的判断,“经验当中有规律经验当中有规律”,但是不管但是不管你多有经验你多有经验,只凭经验办事只凭经验办事,还是很容易出错的还是很容易出错的,在寻找变量间的相关关系时在寻找变量间的相关关系时,我们需要一些更我们需要一些更为科学的方法来说明问题为科学的方法来说明问题.在寻找变量间的相关关系时在寻找变量间的相关关系时,统计同样统计同样发挥了非常重要的作用发挥了非常重要的作用,我们是通过收集大量我们是通过收集大量的数据的数据,对数据进行统计分析的基础上对数据
11、进行统计分析的基础上,发现发现其中的规律其中的规律,才能对它们之间的关系作出判断才能对它们之间的关系作出判断.下面我们通过具体的例子来分析下面我们通过具体的例子来分析第13页,本讲稿共44页探究二探究二 阅读课本阅读课本P85-P86P85-P86思考,思考并讨论以下问题:思考,思考并讨论以下问题:1.1.根据表根据表2-32-3提供的相信,你认为人体的脂肪含量与年龄之间提供的相信,你认为人体的脂肪含量与年龄之间有怎样的关系?有怎样的关系?2.2.通过作图可以对两个变量之间的关系有一个直观的印象通过作图可以对两个变量之间的关系有一个直观的印象.将表将表2-32-3提供的数据转变成什么样的形式更
12、能直观的反映这种提供的数据转变成什么样的形式更能直观的反映这种关系?关系?3.3.两个变量的相关关系有正相关和负相关,它们在散点图两个变量的相关关系有正相关和负相关,它们在散点图上各有什么特点?上各有什么特点?4.4.你还能举出一些生活中的变量成正相关或负相关的例子吗?你还能举出一些生活中的变量成正相关或负相关的例子吗?第14页,本讲稿共44页正、负相关、线性相关正、负相关、线性相关 概念探究请同学们观察这请同学们观察这3幅图,看有什么特点?幅图,看有什么特点?11000.20.40.60.811.2-0.200.20.40.60.811.2第15页,本讲稿共44页正相关正相关:因变量随自变量
13、的增大而增大,图中因变量随自变量的增大而增大,图中的点分布在左下角到右上角的区域的点分布在左下角到右上角的区域负相关负相关:因变量随自变量的增大而减小,散点因变量随自变量的增大而减小,散点图中的点分布在左上角到右下角的区域图中的点分布在左上角到右下角的区域.无相关性无相关性:因变量与自变量不具备相关性:因变量与自变量不具备相关性小结:借助散点图可以直观判断两个小结:借助散点图可以直观判断两个变量间的相关关系变量间的相关关系第16页,本讲稿共44页强调强调:如果所有的样本都落在某一条函数曲线上如果所有的样本都落在某一条函数曲线上,就用该函数来描述就用该函数来描述变量之间的关系变量之间的关系,即变
14、量之间具有函数关系即变量之间具有函数关系.如果所有的样本都落在某一条函数曲线的附近如果所有的样本都落在某一条函数曲线的附近,变量之间具有相变量之间具有相关关系关关系.如果所有的样本都落在某一直线的附近如果所有的样本都落在某一直线的附近,变量之间具有线性相关变量之间具有线性相关关系关系.第17页,本讲稿共44页探究三探究三 阅读课本阅读课本P87-P89P87-P89思考,思考并讨论以下问题:思考,思考并讨论以下问题:1.1.什么是样本点的中心?什么是样本点的中心?2.2.什么是回归直线?什么是回归直线?回归直线一定经过样本点的中心吗?回归直线一定经过样本点的中心吗?3.3.你有哪些方案可以得到
15、回归直线?你有哪些方案可以得到回归直线?4.4.你能体会用最小二乘法得到回归直线是如你能体会用最小二乘法得到回归直线是如何体现何体现“从总体上看,各点与此直线的距离从总体上看,各点与此直线的距离最小最小”的含义的吗?的含义的吗?第18页,本讲稿共44页1.样本点的中心样本点的中心第19页,本讲稿共44页 我们再观察它的图像发现这些点大致分布在一条直线附近我们再观察它的图像发现这些点大致分布在一条直线附近 ,像这样,如果散点图中点的分布从整体上看大致在一条直线像这样,如果散点图中点的分布从整体上看大致在一条直线附近,附近,我们就称这两个变量之间具有线性相关关系我们就称这两个变量之间具有线性相关关
16、系我们就称这两个变量之间具有线性相关关系我们就称这两个变量之间具有线性相关关系,这条直线叫做这条直线叫做这条直线叫做这条直线叫做回归直线回归直线回归直线回归直线,该直线的方程叫,该直线的方程叫,该直线的方程叫,该直线的方程叫回归方程回归方程回归方程回归方程。脂肪含量202530 35 4045 50 55 60 65年龄05101520253035402.回归直线的定义及特征回归直线的定义及特征(2)回归直线的)回归直线的特征:特征:回归直线回归直线过过样本点的中样本点的中心心 。那么,我们该怎样来求那么,我们该怎样来求出这个回归方程?出这个回归方程?请同学们展开讨论,能请同学们展开讨论,能请
17、同学们展开讨论,能请同学们展开讨论,能得出哪些具体的方案?得出哪些具体的方案?得出哪些具体的方案?得出哪些具体的方案?第20页,本讲稿共44页1.测量法测量法:移动直线移动直线l使所有点到它的距离之和最小使所有点到它的距离之和最小2.两点确定法两点确定法:选取两点作直线选取两点作直线,使其两边点个数一使其两边点个数一样样3.分组法分组法:将点进行分组点将点进行分组点,分别求其斜率和截距分别求其斜率和截距,求平均值求平均值(1)(2)(3)第21页,本讲稿共44页 实际上实际上,求回归直线的关键是如何用数学的求回归直线的关键是如何用数学的方法来刻画方法来刻画“从整体上看从整体上看,各点到此直线的
18、距各点到此直线的距离小离小”。第22页,本讲稿共44页第23页,本讲稿共44页第24页,本讲稿共44页计算回归方程的斜率与截距的一般公式计算回归方程的斜率与截距的一般公式:第25页,本讲稿共44页求线性回归方程求线性回归方程例:观察两相关变量得如下表:例:观察两相关变量得如下表:x-1-2-3-4-553421y-9-7-5-3-115379求两变量间的回归方程求两变量间的回归方程解解1:列表:列表:i12345678910-1-2-3-4-553421-9-7-5-3-1153799141512551512149计算得计算得:第26页,本讲稿共44页所求回归直线方程为所求回归直线方程为 y=
19、x第一步:列表第一步:列表 ;第二步:计算第二步:计算 ;第三步:代入公式计算第三步:代入公式计算 ,的值;的值;第四步:写出直线方程。第四步:写出直线方程。小结:求线性回归直线方程的步骤:小结:求线性回归直线方程的步骤:第27页,本讲稿共44页探究四探究四 阅读课本阅读课本P89P89P91P91思考,思考并讨论思考,思考并讨论以下问题:以下问题:1.1.如何用计算机(计算器)求回归直线的方程?如何用计算机(计算器)求回归直线的方程?2.2.由回归直线方程得出的预测值与真实值一定相由回归直线方程得出的预测值与真实值一定相等吗?应该如何理解这种差异?等吗?应该如何理解这种差异?3.3.不使用计
20、算器,你能求得回归方程吗?不使用计算器,你能求得回归方程吗?应该计算哪些量?一般步骤是什么?应该计算哪些量?一般步骤是什么?第28页,本讲稿共44页总结总结基础知识框图表解基础知识框图表解基础知识框图表解基础知识框图表解变量间关系变量间关系函数关系函数关系相关关系相关关系 散点图散点图线形回归线形回归线形回归方程线形回归方程第29页,本讲稿共44页1 1、相关关系、相关关系 (1 1)概念:自变量取值一定时,因变量的取值带有一定)概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系。随机性的两个变量之间的关系叫相关关系。(2 2)相关关系与函数关系的异同点。)相关关
21、系与函数关系的异同点。相同点:两者均是指两个变量间的关系。相同点:两者均是指两个变量间的关系。不同点:函数关系是一种确定关系,是一种因果系;相不同点:函数关系是一种确定关系,是一种因果系;相关关系是一种非确定的关系,也不一定是因果关系(但可能关关系是一种非确定的关系,也不一定是因果关系(但可能是伴随关系)。是伴随关系)。(3 3)相关关系的分析方向。)相关关系的分析方向。在收集在收集大量数据的基础上,利用统计分析,发现规律,对它大量数据的基础上,利用统计分析,发现规律,对它们的关系作出判断。们的关系作出判断。第30页,本讲稿共44页2、两个变量的线性相关、两个变量的线性相关 (1 1)回归分析
22、)回归分析 对具有相关关系的两个变量进行统计分析的方法叫回归对具有相关关系的两个变量进行统计分析的方法叫回归分析。通俗地讲,回归分析是寻找相关关系中非确定关系的分析。通俗地讲,回归分析是寻找相关关系中非确定关系的某种确定性。某种确定性。(2 2)散点图)散点图 A A、定义;、定义;B B、正相关、负相关。、正相关、负相关。3 3、回归直线方程、回归直线方程 注注:如果关于两个变量统计数据的散点图呈现发散状如果关于两个变量统计数据的散点图呈现发散状,则这则这两个变量之间不具有相关关系两个变量之间不具有相关关系.第31页,本讲稿共44页3 3、回归直线方程、回归直线方程 (1 1)回归直线:观察
23、散点图的特征,如果各点大致分布在)回归直线:观察散点图的特征,如果各点大致分布在一条直线的附近,就称两个变量之间具有线性相关的关系,这一条直线的附近,就称两个变量之间具有线性相关的关系,这条直线叫做回归直线。条直线叫做回归直线。(2 2)最小二乘法)最小二乘法(3)(3)利用回归直线对总体进行估计利用回归直线对总体进行估计第32页,本讲稿共44页1、散点图、散点图2 2、从图、从图3-13-1看到,各点散布在从左上角到由下角的区看到,各点散布在从左上角到由下角的区域里,因此,气温与热饮销售杯数之间成负相关,即域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。气温越高
24、,卖出去的热饮杯数越少。3 3、从散点图可以看出,这些点大致分布在一条直线的附近,、从散点图可以看出,这些点大致分布在一条直线的附近,因此利用公式求出因此利用公式求出回归方程回归方程的系数。的系数。Y=-Y=-2.352x+147.7672.352x+147.7674 4、当、当x=2x=2时,时,Y=143.063 Y=143.063 因此,某天的气温为因此,某天的气温为2 2摄氏摄氏度时,这天大约可以卖出度时,这天大约可以卖出143143杯热饮。杯热饮。第33页,本讲稿共44页练习练习1 1:5 5个学生的数学和物理成绩如下表:个学生的数学和物理成绩如下表:ABCDE数学数学8075706
25、560物理物理7066686462画出散点图,并判断它们是否有相关关系。画出散点图,并判断它们是否有相关关系。数学成绩数学成绩解:解:由散点图可见,两者之间具有正相关关系。由散点图可见,两者之间具有正相关关系。第34页,本讲稿共44页练习练习2、求线性回归方程、求线性回归方程观察两相关变量得如下表:观察两相关变量得如下表:x24568y34657求两变量间的回归方程求两变量间的回归方程解解:列表:列表:i123452456834657616303056416253664第35页,本讲稿共44页练习练习2、求线性回归方程、求线性回归方程计算得计算得:所求线性回归方程为:所求线性回归方程为:第36
26、页,本讲稿共44页小结:求线性回归直线方程的步骤:小结:求线性回归直线方程的步骤:第一步:列表第一步:列表 ;第二步:计算第二步:计算 ;第三步:代入公式计算第三步:代入公式计算 的值;的值;第四步:写出直线方程。第四步:写出直线方程。第37页,本讲稿共44页探究五(课外探究)探究五(课外探究)1.1.研究研究P101-A8P101-A8 探究:回归方程中的回归系数探究:回归方程中的回归系数b b的意义是什么?的意义是什么?2.2.阅读阅读P92-P92-相关关系的强与弱相关关系的强与弱 探究:如何判断两个变量线性相关关系的强与探究:如何判断两个变量线性相关关系的强与弱?弱?第38页,本讲稿共
27、44页品味高考品味高考11.(2009海南海南 宁夏宁夏)对变量量x,y有有观测数据数据(xi,yi)(i=1,2,10),得散点得散点图1;对变量量u,v有有观测数据数据(ui,vi)(i=1,2,10),得散点得散点图2.由由这两个散点两个散点图可以判断可以判断()第39页,本讲稿共44页A.变量变量x与与y正相关正相关,u与与v正相关正相关B.变量变量x与与y正相关正相关,u与与v负相关负相关C.变量变量x与与y负相关负相关,u与与v正相关正相关D.变量变量x与与y负相关负相关,u与与v负相关负相关答案答案:C第40页,本讲稿共44页12.(2010广东卷广东卷)某市居民某市居民2005
28、2009年家庭年平均收入年家庭年平均收入x(单位单位:万元万元)与年平均支出与年平均支出Y(单位单位:万元万元)的统计资料如下表所的统计资料如下表所示示:根据根据统计资料料,居民家庭年平均收入的中位数是居民家庭年平均收入的中位数是_,家家庭年平均收入与年平均支出庭年平均收入与年平均支出_线性相关关系性相关关系.年份年份2005200520062006200720072008200820092009收入收入x x11.511.512.112.1131313.313.31515支出支出Y Y6.86.88.88.89.89.81010121213是是第41页,本讲稿共44页解析解析:由表易知由表易
29、知,居民家庭年平均收入的中位数是居民家庭年平均收入的中位数是13,把表中数把表中数作出散点图作出散点图,如下图如下图.由散点图知由散点图知,家庭年平均收入与年平均支出是线性相关关系家庭年平均收入与年平均支出是线性相关关系.第42页,本讲稿共44页变式训练变式训练3:改革开放以来改革开放以来,我国高等教育事业有了迅速发展我国高等教育事业有了迅速发展,这里我们得到了某省从这里我们得到了某省从1990年到年到2000年年18岁到岁到20岁的青年岁的青年人每年考入大学的百分比人每年考入大学的百分比.我们把农村我们把农村,县镇和城市分开统计县镇和城市分开统计.为了便于计算为了便于计算,把把1990年编号为年编号为0,1991年编号为年编号为1,2000年年编号为编号为10.如果把每年考入大学的百分比作为因变量如果把每年考入大学的百分比作为因变量,把年份把年份从从0到到10作为自变量作为自变量,进行回归分析进行回归分析,可得到下面三条回归直线可得到下面三条回归直线:城市城市:县镇:农村村:第43页,本讲稿共44页(1)在同一坐标系中作出这三条回归直线在同一坐标系中作出这三条回归直线;(2)对于农村青年来讲对于农村青年来讲,系数等于系数等于0.42意味着什么意味着什么?(3)在这一阶段哪一组的大学入学率年增长最快在这一阶段哪一组的大学入学率年增长最快?第44页,本讲稿共44页
限制150内