高一数学必修二课件第九章 第四节变量间的相关关系与统计案例.ppt
《高一数学必修二课件第九章 第四节变量间的相关关系与统计案例.ppt》由会员分享,可在线阅读,更多相关《高一数学必修二课件第九章 第四节变量间的相关关系与统计案例.ppt(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四节 变量间的相关关系与统计案例1.1.相关关系与回归方程相关关系与回归方程(1)(1)相关关系的分类相关关系的分类.正相关:从散点图上看,点散布在从正相关:从散点图上看,点散布在从_到到_的区域内;的区域内;负相关:从散点图上看,点散布在从左上角到负相关:从散点图上看,点散布在从左上角到_的区域内的区域内.左下角左下角右上角右上角右下角右下角(2)(2)线性相关关系线性相关关系.从散点图上看,如果这些点从整体上看大致分布在一条直从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫线叫_._
2、.回归直线回归直线(3)(3)回归方程回归方程.最小二乘法:使得样本数据的点到回归直线的最小二乘法:使得样本数据的点到回归直线的_最小的方法叫最小二乘法最小的方法叫最小二乘法.回归方程:两个具有线性相关关系的变量的一组数据:回归方程:两个具有线性相关关系的变量的一组数据:(x(x1 1,y,y1 1),(x),(x2 2,y,y2 2),),(x xn n,y,yn n),其回归方程为,其回归方程为则则其中其中,是回归方程的是回归方程的_,_,是在是在y y轴上的截距轴上的截距.距离平方和距离平方和斜率斜率(4)(4)样本相关系数样本相关系数.用它来衡量两个变量间的线性用它来衡量两个变量间的线
3、性相关关系相关关系.当当r r0 0时,表明两个变量时,表明两个变量_;当当r r0 0时,表明两个变量时,表明两个变量_;正相关正相关负相关负相关rr的绝对值越接近的绝对值越接近1 1,表明两个变量的线性相关性,表明两个变量的线性相关性_;r r的的绝对值越接近于绝对值越接近于0 0,表明两个变量之间几乎不存在线性相关关,表明两个变量之间几乎不存在线性相关关系系.通常当通常当|r|r|0.750.75时,认为两个变量有很强的线性相关关系时,认为两个变量有很强的线性相关关系.越强越强2.2.独立性检验独立性检验(1)22(1)22列联表列联表.假设有两个分类变量假设有两个分类变量X X和和Y
4、Y,它们的取值分别为,它们的取值分别为xx1 1,x x2 2 和和yy1 1,y y2 2,其样本频数列联表,其样本频数列联表(称称2222列联表列联表)为:为:(2)K(2)K2 2统计量统计量.K K2 2=(=(其中其中n=n=a+b+c+da+b+c+d为样本容量为样本容量).).y y1 1y y2 2总计总计x x1 1a ab b_x x2 2c cd dc+dc+d总计总计a+ca+c_a+b+c+da+b+c+da+ba+bb+db+d判断下面结论是否正确判断下面结论是否正确(请在括号中打请在括号中打“”或或“”).”).(1)(1)线性回归分析就是由样本点去寻找一条直线,
5、使之贴近这线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的方法些样本点的方法.().()(2)(2)利用样本点的散点图可以直观判断两个变量的关系是否可利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示以用线性关系去表示.().()(3)(3)通过回归方程通过回归方程 可以估计和观测变量的取值和变化可以估计和观测变量的取值和变化趋势趋势.().()(4)(4)因为由任何一组观测值都可以求得一个线性回归方程,所因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验以没有必要进行相关性检验.().()(5)(5)任意两个变量之间都存在着线性相关关系任
6、意两个变量之间都存在着线性相关关系.().()(6)(6)如果两个变量之间线性不相关,则这两个变量一定不存在如果两个变量之间线性不相关,则这两个变量一定不存在线性回归方程线性回归方程.().()【解析解析】(1)(1)正确正确.反映的是最小二乘法的思想反映的是最小二乘法的思想.(2)(2)正确正确.反映的是散点图的作用反映的是散点图的作用.(3)(3)正确正确.解释的是回归方程解释的是回归方程 的作用的作用.(4)(4)错误错误.在求回归方程之前必须进行相关性检验,以体现两变在求回归方程之前必须进行相关性检验,以体现两变量的关系量的关系.(5)(5)错误错误.变量之间还存在函数关系和非线性相关
7、关系变量之间还存在函数关系和非线性相关关系.(6)(6)错误错误.任意两个变量都可以利用公式求出线性回归方程任意两个变量都可以利用公式求出线性回归方程.答案答案:(1)(2)(3)(4)(1)(2)(3)(4)(5)(5)(6)(6)1.1.利用随机变量利用随机变量K K2 2来判断来判断“两个分类变量两个分类变量X,YX,Y有关系有关系”时,时,K K2 2的的观测值观测值k k的计算公式为:的计算公式为:则下列说法正确的是则下列说法正确的是()()(A)ad-bcA)ad-bc越小,说明越小,说明X X与与Y Y关系越弱关系越弱(B)ad-bcB)ad-bc越大,说明越大,说明X X与与Y
8、 Y关系越强关系越强(C)(ad-bc)(C)(ad-bc)2 2越大,说明越大,说明X X与与Y Y关系越强关系越强(D)(ad-bc)(D)(ad-bc)2 2越接近于越接近于0 0,说明,说明X X与与Y Y关系越强关系越强【解析解析】选选C.C.由由K K2 2的计算公式及其意义容易判断选的计算公式及其意义容易判断选C.C.2.2.某商品销售量某商品销售量y(y(件件)与销售价格与销售价格x(x(元元/件件)负相关,则其回归负相关,则其回归直线方程可能是直线方程可能是()()(A)=-10 x+200 (B)=10 x+200(A)=-10 x+200 (B)=10 x+200(C)=
9、-10 x-200 (D)=10 x-200(C)=-10 x-200 (D)=10 x-200【解析解析】选选A.A.商品销售量商品销售量y(y(件件)与销售价格与销售价格x(x(元元/件件)负相关,负相关,00,0,应选应选A.A.3.3.一位母亲记录了儿子一位母亲记录了儿子3 39 9岁的身高,数据岁的身高,数据(略略),由此建立的,由此建立的身高与年龄的回归模型为身高与年龄的回归模型为y y7.19x7.19x73.9373.93,用这个模型预测,用这个模型预测这个孩子这个孩子1010岁时的身高,则正确的叙述是岁时的身高,则正确的叙述是()()(A)(A)身高一定是身高一定是145.8
10、3 cm145.83 cm(B)(B)身高在身高在145.83 cm145.83 cm以上以上(C)(C)身高在身高在145.83 cm145.83 cm左右左右(D)(D)身高在身高在145.83 cm145.83 cm以下以下【解析解析】选选C.C.用回归模型用回归模型y y7.19x7.19x73.9373.93,只能作预测,其,只能作预测,其结果不一定是个确定值结果不一定是个确定值.4.4.给出下列关系:给出下列关系:正方形的边长与面积之间的关系;正方形的边长与面积之间的关系;某化妆品的销售量与广告宣传费之间的关系;某化妆品的销售量与广告宣传费之间的关系;人的身高与视力之间的关系;人的
11、身高与视力之间的关系;雾天的能见度与交通事故的发生率之间的关系;雾天的能见度与交通事故的发生率之间的关系;学生与其学号之间的关系学生与其学号之间的关系.其中具有相关关系的是其中具有相关关系的是_._.【解析解析】正方形的边长与面积之间的关系是函数关系;正方形的边长与面积之间的关系是函数关系;化妆品的销售量与广告宣传费之间的关系不是严格的函数关化妆品的销售量与广告宣传费之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系;系,但是具有相关性,因而是相关关系;人的身高与视力之间的关系既不是函数关系,也不是相关关人的身高与视力之间的关系既不是函数关系,也不是相关关系;系;能见度与交通事故的发
12、生率之间具有相关关系;能见度与交通事故的发生率之间具有相关关系;学生与其学号之间的关系是一种确定的对应关系学生与其学号之间的关系是一种确定的对应关系.综合以上可知,综合以上可知,具有相关关系,而具有相关关系,而是确定性的函数关是确定性的函数关系,系,两种关系都不具有两种关系都不具有.答案答案:5.5.某高校某高校“统计初步统计初步”课程的教师随机调查了选该课程的一些课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:学生的情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,为了判断主修统计专业是否与性别有关系,根据表中的数据,得到得到K K2 2 4.8444
13、.844,因为,因为K K2 23.8413.841,所以,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性判定主修统计专业与性别有关系,那么这种判断出错的可能性不超过不超过_._.专业性别专业性别非统计专业非统计专业统计专业统计专业男男13131010女女7 72020【解析解析】KK2 24.8444.8443.8413.841,在犯错误的概率不超过在犯错误的概率不超过0.050.05的前提下认为主修统计专业与性别有关系,的前提下认为主修统计专业与性别有关系,出错的可能性不出错的可能性不超过超过5%.5%.答案答案:5%5%考向考向 1 1 相关关系的判断相关关系的判断 【典例典
14、例1 1】(1)1)对变量对变量x x,y y有观测数据有观测数据(x(xi i,y yi i)(i)(i1,21,2,10)10),得散点图,得散点图(1)(1);对变量;对变量u u,v v有观测数据有观测数据(u ui i,v,vi i)(i)(i1,21,2,10)10),得散点图,得散点图(2).(2).由这两个散点图可以判断由这两个散点图可以判断()()(A)(A)变量变量x x与与y y正相关,正相关,u u与与v v正相关正相关(B)(B)变量变量x x与与y y正相关,正相关,u u与与v v负相关负相关(C)(C)变量变量x x与与y y负相关,负相关,u u与与v v正相
15、关正相关(D)(D)变量变量x x与与y y负相关,负相关,u u与与v v负相关负相关(2)(2012(2)(2012新课标全国卷新课标全国卷)在一组样本数据在一组样本数据(x(x1 1,y y1 1),(x(x2 2,y y2 2),(x xn n,y yn n)(n2)(n2,x x1 1,x,x2 2,x xn n不全相等不全相等)的散点图的散点图中,若所有样本点中,若所有样本点(x(xi i,y yi i)(i)(i=1,2,n)=1,2,n)都在直线都在直线 上,则这组样本数据的样本相关系数为上,则这组样本数据的样本相关系数为()()(A)-1 (B)0 (C)(D)1(A)-1
16、(B)0 (C)(D)1【思路点拨思路点拨】(1)(1)根据散点图的变化趋势判断根据散点图的变化趋势判断.(2)(2)理清相关系数与相关性强弱的关系是解决本题的关键理清相关系数与相关性强弱的关系是解决本题的关键.【规范解答规范解答】(1)(1)选选C.C.由题图由题图(1)(1)可知,各点整体呈递减趋势,可知,各点整体呈递减趋势,x x与与y y负相关;由题图负相关;由题图(2)(2)可知,各点整体呈递增趋势,可知,各点整体呈递增趋势,u u与与v v正正相关相关.(2)(2)选选D.D.样本相关系数越接近样本相关系数越接近1,1,相关性越强,现在所有的样本相关性越强,现在所有的样本点都在直线
17、点都在直线 上,样本的相关系数应为上,样本的相关系数应为1.1.【拓展提升拓展提升】线性相关关系与函数关系的区别线性相关关系与函数关系的区别(1)(1)函数关系中的两个变量间是一种确定性关系函数关系中的两个变量间是一种确定性关系.例如,正方形例如,正方形面积面积S S与边长与边长x x之间的关系之间的关系S Sx x2 2就是函数关系就是函数关系.(2)(2)相关关系是一种非确定性关系,即相关关系是非随机变量相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系与随机变量之间的关系.例如,商品的销售额与广告费是相关例如,商品的销售额与广告费是相关关系关系.两个变量具有相关关系是
18、回归分析的前提两个变量具有相关关系是回归分析的前提.【变式训练变式训练】某公司的科研人员在某公司的科研人员在7 7块并排、形状大小相同的块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量试验田上对某棉花新品种进行施化肥量x x对产量对产量y y影响的试验,影响的试验,得到如下表所示的一组数据得到如下表所示的一组数据(单位:单位:kg)kg):(1)(1)画出散点图画出散点图.(2)(2)判断是否具有相关关系判断是否具有相关关系.施化肥量施化肥量x x1515202025253030353540404545棉花产量棉花产量y y3303303453453653654054054454454
19、50450455455【解析解析】(1)(1)散点图如图所示散点图如图所示(2)(2)由散点图知,各组数据对应点大致都在一条直线附近,所由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量以施化肥量x x与产量与产量y y具有线性相关关系具有线性相关关系.考向考向 2 2 线性回归方程及其应用线性回归方程及其应用 【典例典例2 2】(2012(2012福建高考福建高考)某工厂为了对新研发的一种产品某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:下数据:单价单价x(x(元元)8 88.28.2
20、8.48.48.68.68.88.89 9销量销量y(y(件件)909084848383808075756868(1)(1)求回归直线方程求回归直线方程 其中其中(2)(2)预计在今后的销售中,销量与单价仍然服从预计在今后的销售中,销量与单价仍然服从(1)(1)中的关系,中的关系,且该产品的成本是且该产品的成本是4 4元元/件,为使工厂获得最大利润,该产品的件,为使工厂获得最大利润,该产品的单价应定为多少元?单价应定为多少元?(利润利润=销售收入销售收入-成本成本)【思路点拨思路点拨】(1)(1)先求出先求出 再利用再利用 求出求出 的值的值.(2)(2)利用利用“利润利润=销售收入成本销售收
21、入成本”列出函数关系式后再求解列出函数关系式后再求解.【规范解答规范解答】(1)(1)由于由于所以所以从而回归直线方程为从而回归直线方程为 =-20 x+250.=-20 x+250.(2)(2)设工厂获得的利润为设工厂获得的利润为L L元,依题意得元,依题意得L=x(-20 x+250)-4(-20 x+250)=-20 xL=x(-20 x+250)-4(-20 x+250)=-20 x2 2+330 x-1 000=+330 x-1 000=-20(x-)-20(x-)2 2+361.25,+361.25,当且仅当当且仅当x=8.25x=8.25时,时,L L取得最大值,取得最大值,故当
22、单价定为故当单价定为8.258.25元时,工厂可获得最大利润元时,工厂可获得最大利润.【互动探究互动探究】在本例中条件不变,预测当单价为在本例中条件不变,预测当单价为1010元时,销量元时,销量是多少件?是多少件?【解析解析】将将x=10 x=10代入代入 =-20 x+250=-20 x+250得,得,=50=50,即销量大约是,即销量大约是5050件件.【拓展提升拓展提升】最小二乘法估计的三个步骤最小二乘法估计的三个步骤(1)(1)作出散点图,判断是否线性相关作出散点图,判断是否线性相关.(2)(2)如果是,则用公式求如果是,则用公式求 ,写出回归方程,写出回归方程.(3)(3)根据方程进
23、行估计根据方程进行估计.【提醒提醒】回归直线方程恒过点回归直线方程恒过点【变式备选变式备选】某商场对每天进店人数和商品销售件数进行了统某商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:计对比,得到如下表格:其中其中i i1,2,3,4,5,6,7.1,2,3,4,5,6,7.人数人数x xi i1010151520202525303035354040件数件数y yi i4 47 712121515202023232727(1)(1)以每天进店人数为横轴,每天商品销售件数为纵轴,画出以每天进店人数为横轴,每天商品销售件数为纵轴,画出散点图散点图.(2)(2)求回归直线方程求回归直线
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高一数学必修二课件第九章 第四节变量间的相关关系与统计案例 数学 必修 课件 第九 第四 变量 相关 关系 统计 案例
限制150内