2022年知识讲解-回归分析的基本思想及其初步应用 .pdf
《2022年知识讲解-回归分析的基本思想及其初步应用 .pdf》由会员分享,可在线阅读,更多相关《2022年知识讲解-回归分析的基本思想及其初步应用 .pdf(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第1页共17页回归分析的基本思想及其初步应用【学习目标】1. 通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤。2. 能作出散点图,能求其回归直线方程。3. 会用所学的知识对简单的实际问题进行回归分析。【要点梳理】要点一、变量间的相关关系1. 变量与变量间的两种关系:1 函数关系: 这是一种确定性的关系,即一个变量能被另一个变量按照某种对应法则唯一确定例如圆的面积S与半径 r 之间的关系S=r2为函数关系2相关关系:这是一种非确定性关系当一个变量取值一定时,另一个变量的取值带有一定的随机性,这两个变量之间的关系叫做相关关系。例如人的身高不能确定体重,但一般来说“身高者,体重也重”
2、 ,我们说身高与体重这两个变量具有相关关系2. 相关关系的分类: 1在两个变量中,一个变量是可控制变量,另一个变量是随机变量,如施肥量与水稻产量; 2两个变量均为随机变量,如某学生的语文成绩与化学成绩 3. 散点图:将两个变量的各对数据在直角坐标系中描点而得到的图形叫做散点图它直观地描述了两个变量之间有没有相关关系这是我们判断的一种依据4. 回归分析:与函数关系不同,相关关系是一种非确定性关系,对具有相关关系的两个变量进行统计分析的方法叫做回归分析。要点二 、线性回归方程: 1 回归直线如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直
3、线。2回归直线方程?ybxa对于一组具有线性相关关系的数据11(,)xy,22(,)xy,(,)nnxy,其回归直线?ybxa的截距和斜率的最小二乘法估计公式分别为:121()()?()niiiniixxyybxx,? aybx其中x表示数据xi i=1 ,2, n的均值,y表示数据yii=1 ,2, n的均值,xy表示数据 xiyii=1 ,2, n的均值精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 17 页第2页共17页a、b的意义是:以a为基数, x 每增加一个单位,y 相应地平均变化b个单位要点诠释:回归系数121()()?(
4、)niiiniixxyybxx,也可以表示为1221?niiiniix ynx ybxnx,这样更便于实际计算。12111()ninixxxxxnn;12111()niniyyyyynn。( ,)x y称为样本中心点,回归直线?yabx必经过样本中心点( , )x y。回归直线方程?yabx中的?b表示 x 增加 1 个单位时? y的变化量,而? a表示? y不随 x 的变化而变化的量。3求回归直线方程的一般步骤:作出散点图由样本点是否呈条状分布来判断两个量是否具有线性相关关系,假设存在线性相关关系,进行第二步。求回归系数?b、? a计算121()nxxxxn,121()nyyyyn,1122
5、1niinnix yx yx yx y,2222121ninixxxx,利用公式1221?niiiniix ynx ybxnx求出?b,再由? aybx求出? a的值;写出回归直线方程;利用回归直线方程?yabx预报在 x 取某一个值时y 的估计值。要点诠释:一般地,我们可以利用回归直线方程进行预测,但这里所得到的值是预报值,而不是精确值,它带有很大的随机性,可能对于某一次的实际值而言会有很大的出入,这是因为:1回归直线的截距? a和斜率?b都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - -
6、- -第 2 页,共 17 页第3页共17页2即使截距和斜率的估计没有误差,也不可能保证对应于x 的预报值?y能够与实际值y 很接近。我 们 不 能 保 证 点 x , y 落 在 回 归 直 线 上 , 甚 至 不 能 保 证 它 落 在 回 归 直 线 的 附 近 , 事 实 上 ,?yxy,这里是随机变量,预报值? y与实际值y 的接近程度由随机变量决定。尽管我们利用回归直线方程所得到的值仅是一个预报值,它具有随机性,但它是我们根据统计规律所得到的结论,因而结论正确的概率很大。故我们可以放心地利用回归直线方程进行预测。要点三、相关性检验1相关系数r 的定义对 于 变 量x与y随 机 抽
7、取 到 的n对 数 据11(,)xy,22(,)xy, ,(,)nnxy, 称112222221111()()()()()()nniiiiiinnnniiiiiiiixxyyx ynx yrxxyyxnxyny为 x 与 y 的样本相关系数。2相关系数r 的作用样本相关系数r 用于衡量两个变量之间是否具有线性相关关系,描述线性相关关系的强弱:| 1r|r越接近 1,说明两个变量之间的线性相关程度越强;|r越接近 0,说明两个变量之间的线性相关程度越弱。当 r 0 时,说明两个变量正相关,即 x 增加, y 随之相应地增加,假设x 减少, y 随之相应地减少当 r 0 时,说明两个变量负相关,即
8、 x 增加, y 随之相应地减少;假设x 减少, y 随之相应地增加假设 r=0,则称 x 与 y 不相关。当| 0.75r,认为 x 与 y 之间具有很强的线性相关关系。当|r大于0.05r时,说明有 95% 的把握认为x 与 y 之间具有线性相关关系,这时求回归直线方程有必要也有意义,当0.05|rr时,寻找回归直线方程就没有意义。3利用相关系数r 检验的一般步骤:法一:作统计假设:x 与 y 不具有线性相关关系。根据样本相关系数计算公式算出r 的值。比较|r与 0.75 的大小关系,得出统计结论。如果| 0.75r,认为 x 与 y 之间具有很强的线性相关关系。法二:精选学习资料 - -
9、 - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 17 页第4页共17页作统计假设:x 与 y 不具有线性相关关系。根据样本相关系数计算公式算出r 的值。0.05rn 未数据的对数 。比较|r与0.05r, 作统计推断, 如果0.05|rr, 说明有 95% 的把握认为x 与 y 之间具有线性相关关系。如果0.05|rr,我们没有理由拒绝原来的假设,即不认为x 与 y 之间具有线性相关关系。这时寻找回归直线方程是毫无意义的。要点四、线性回归分析与非线性回归分析1线性回归分析对于回归分析问题,在解题时应首先利用散点图或相关性检验判断x 与 y 是否具有线性相关
10、关系,如果线性相关,才能求解后面的问题否则求线性回归方程没有实际意义,它不能反映变量x 与 y,之间的变化规律只有在x 与 y 之间具有相关关系时,求线性回归方程才有实际意义相关性检验的依据:主要利用检验统计量12211()()niiinnxyiiiix ynx yxyxyrS Sxxyy其中化简式容易记也好用求出检验统计量的样本相关系数,再利用r 的性质确定x 和 y 是否具有线性相关关系,r 具有的性质为:|r| 1 且|r|越接近于1,线性相关程度越强;|r|越接近于0,线性相关程度越弱2. 线性回归分析的一般步骤1确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;2判断两变量是
11、否具有线性相关关系作散点图由样本点是否呈条状分布来判断两个量是否具有线性相关关系。求相关系数r 当|0.75r,认为 x 与 y 之间具有很强的线性相关关系。 3假设两变量存在线性相关关系,设所求的线性回归方程为?ybxa,求回归系数?b、? a。 4写出回归直线方程; 5利用回归直线方程?yabx预报在 x 取某一个值时y 的估计值。 3 非线性回归分析1对于非线性回归分析问题,如果给出了经验公式可直接利用换元,使新元与y 具有线性相关关系,进一步求出, ,对新元的线性回归方程,换回x 即可得 y 对 x 的回归曲线方程2非线性回归问题有时并不给出经验公式,这时按以下步骤求回归方程:精选学习
12、资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 17 页第5页共17页画出已知数据的散点图,看是否是线性回归分析问题,如果不是, 把它与必修数学中学过的函数幂函数、指数函数、对数函数等图像作比较,挑选一种跟这些散点拟合得最好的函数,采用适当的变量置换,把非线性回归分析问题化为线性回归分析问题作相关性检验,即判断寻找线性回归方程是否有意义当寻找线性回归方程有意义时,计算系数a,b,得到线性回归方程代回 x 得 y 对 x 的回归曲线方程【典型例题】【高清课堂:回归分析的基本思想及其初步应用407591 例题 1】类型一、利用散点图判断两个变量的线
13、性相关性例 1在某种产品外表进行腐蚀刻线试验,得到腐蚀深度y 与腐蚀时间x 的一组数据如下表所示x秒5 10 15 20 30 40 50 60 y微米6 10 11 13 16 17 19 23 1画出散点图2根据散点图,你能得出什么结论?【思路点拨】利用散点图,直观地归结出相关关系的两个变量所具备的特点【解析】1如下图散点图2结论:设x 与 y 是具有相关关系的两个变量,且相应于n 组观测值的n 个点大致分布在一条直线附近,其中整体上与这n个点最接近的一条直线最能代表x 与 y 之间的关系【总结升华】解决此类问题,最直观也最直接的方法就是画散点图。如果散点图中的点分布在一条直线附近,那么就
14、可判断两个变量之间具有近似的线性相关关系。可进一步对它进行回归分析。解决此题的关键是正确建立坐标系,合理地选取单位长度准确地描出所有点,然后观察散点图中的点呈现在一条直线附近即说明二者具有线性相关关系。解决此类题目,由于有时数据较大,在建立平面直角坐标系时,假设单位长度确定不合适,往往容易造成描点的困难。因此必须选择适当的单位长度。举一反三:【变式 1】给出 x 与 y 的数据如下:x 2 4 5 6 8 y 30 40 60 50 70 画出散点图,并由图判断x、y 之间是否具有线性相关关系。【答案】散点图如下图:精选学习资料 - - - - - - - - - 名师归纳总结 - - - -
15、 - - -第 5 页,共 17 页第6页共17页从图中可以看出,各点散布在一条直线附近,即可认为x 与 y 具有线性相关关系。【变式 2】 如下图的5 组数据中,去掉_点,剩下的4 组数据的线性相关系数最大【答案】 D,由本图的直观性可得。【变式3】如下表所示,某地区一段时间内观察到的大于或等于某震级x 的地震个数为N,试画出散点图,并由图判断x、N之间是否具有线性相关关系。震级3 4 地震数28381 20380 14795 10695 7641 5502 3842 2698 1919 1356 973 震级6 7 地震数746 604 435 274 206 148 98 57 41 2
16、5 【答案】由表中数据得散点图如下:从散点图中可以看出,震级x 与大于该震级的地震次数N之间不呈线性相关关系,随着x 的减少,所考察的地震数N近似地以指数形式增长. 类型二、运用样本相关系数r 检验线性相关关系例 2下表是随机抽取的8对母女的身高数据, 试根据这些数据探讨y与x之间的关系母亲身高/x cm154157158159160161162163精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 17 页第7页共17页女儿身高/y cm155156159162161164165166【思路点拨】 相对于用散点图检验相关性,利用相关系数
17、r,检验两个变量之间的线性相关关系的强弱更为准确。【解析】所给数据的散点图如下图:由图可以看出,这些点在一条直线附近,因为154 1571638159.25x,155 1561668161y,82222218( )1541638 159.2559.5iixx,82222218( )1551668 161116iiyy,8181541551631668 159.25 16180iiix yxy1631668 159.2516180818154 155163 1668 159.2516180iiix yxy,所以963.01165 .5980r,由检验水平0.05及26n,在附录2中查得707.0
18、05.0r,因为0.9630.707, 所以可以认为x与y之间具有较强的线性相关关系【总结升华】1讨论 x 与 y 之间的线性相关关系,一般称之为相关性检验。一般地,相关性检验是讨论线性回归模型的第一步。当|0.75r时,可以认为两个变量有很强的线性相关关系,此时,建立线性回归模型是有意义的,其他情况下,建立线性回归模型意义就不大了,基本上没有什么价值。2相关系数r 的计算公式:112222221111()()()()( )( )nniiiiiinnnniiiiiiiixxyyx ynx yrxxyyxn xyn y精选学习资料 - - - - - - - - - 名师归纳总结 - - - -
19、 - - -第 7 页,共 17 页第8页共17页3利用相关系数r 检验两个变量之间的线性相关关系的强弱的步骤:运用公式求出相关系数r ;比较|r与 0.75 的大小关系,得出统计结论。如果| 0.75r,认为 x 与 y 之间具有很强的线性相关关系。举一反三:【变式 1】给出 x 与 y 的数据如下:x 2 4 5 6 8 y 30 40 60 50 70 判断 x 与 y 的线性相关性。【答案】相关性检验:5x,50y,515130iiix yxy,52215( )20iixx,52215( )1000iiyy,所以515522221155( )5( )iiiiiiix yx yrxxyy
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年知识讲解-回归分析的基本思想及其初步应用 2022 知识 讲解 回归 分析 基本 思想 及其 初步 应用
限制150内