一元线性回归模型及其应用课件——高二下学期数学人教A版(2019)选择性必修第三册.pptx
一元线性回归模型及其应用一、一元线性回归模型14有人调查了 名男大学生的身高及其父亲的身高,得到的数据如表所示生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父亲的身高较高时,儿子的身高通常也较高。为了进一步研究两者之间的关系,表明儿子身高和父亲身高正线性相关,且相关程度较高。散点大致分布在一条从左下角到右上角的直线附近,再将表中的成对样本数据表示为散点图,如图所示以横轴表示父亲身高、纵轴表示儿子身高建立直角坐标系,0.886r 利用统计软件,求得样本相关系数为表明儿子身高和父亲身高线性相关。根据下表中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?可见儿子身高和父亲身高之间不是函数关系,也就不能用函数模型刻画3,4170,173169.cmcmcm同样,第两个观测中,儿子身高都是而父亲身高分别为和68172,176174;cmcmcm例如,第 个和第 个观测的父亲身高均为而对应的儿子身高分别为和在上表的数据中,存在父亲身高相同,而儿子身高不同的情况思考其中,随机误差是一个随机变量如母亲身高、生活环境、饮食习惯等作为随机误差,而把影响儿子身高的其他因素,因此我们可以用一次函数来刻画父亲身高对儿子身高的影响,表明儿子身高和父亲身高这两个变量之间有较强的线性相关关系,散点图中的散点大致分布在一条直线附近,得到刻画两个变量之间关系的线性回归模型。0 ,eYx如果那么 与 之间的关系就可用一元线性函数模型来描述2(1)( )0 ,( )YbxaeE eD e则它们之间的关系可以表示为2,方差为与父亲身高无关的定值xYe用 表示父亲身高, 表示儿子身高, 表示随机误差Yx模型中的 也是随机变量,其值虽然不能由变量 的值确定,eYbxa是 与之间的随机误差。abab和 为模型的未知参数, 称为截距参数, 称为斜率参数;x解释变量称为自变量或Y量因变其中, 称量为响应变或)(1Yx型我于一元为线称性们式关回归模的x前一部分由 所确定,后一部分是随机的bxae但是却能表示为与 的和(叠加),0e假的定机误差均值为随2(1)( )0 ,( )YbxaeE eD e11iiiYbxaeiijxY父亲身高都为 的所有男大学生的身高组成一个子总体,)(1xY对于父亲身高 和儿子身高 的一元线性回归模型22iiiYbxae33iiiYbxaeiniinYbxaen将上面 个式子累加 得()( )iiinYn bxanE eiiYbxa( )0iE e 2(1)( )0 ,( )YbxaeE eD e()iiiebxay这个观测值与均值有一个误差项它仅是该子总体中的一个观测值,,iiixybxa而对于父亲身高为的某一名男大学生,他的身高 并不一定为即该子总体的均值与父亲身高是线性函数关系。ibxa该子总体的均值为ix可以解释为父亲身高为的所有男大学生的身高组成一个子总体,)(1xY对于父亲身高 和儿子身高的一元线性回归模型(1)你能结合具体实例解释产生模型中随机误差项的原因吗?思考(3)e实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性回归模型来近似这种关系,这种近似也是产生随机误差的原因e在研究儿子身高与父亲身高的关系时,产生随机误差的原因有:(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差;(1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食习惯和锻炼时间等;练习1.说明函数模型与回归模型的区别,并分别举出两个应用函数模型和回归模型的例子举例:路程与速度的关系,正方体体积与边长的关系可以应用函数模型刻画,体重与身高的关系、冷饮销售与气温的关系可以应用回归模型刻画即回归模型刻画的是两个变量之间的随机关系。回归模型刻画的是变量之间具有的相关关系不是一种确定性的关系,答:函数模型刻画的是变量之间具有的函数关系,是一种确定性的关系2,2(1)( )0( ).YbxaebE eD e中,参数 的含义是什么?在一元线性回归模型1751740.839cmcmcm例如,教科书中父亲身高为的儿子身高的均值比父亲身高为的儿子身高的均值高出1xYb变量 每增加 个单位,响应变量 的均值将增加 个单位。bxY答:参数 的含义可以解释为解释变量 对响应变量的均值的影响xYb所以不能解释成解释变量 ,每增加一个单位,响应变量 增加 个单位Yxe注意:因为响应变量 最终取值,除了受变量 的影响,还要受随机误差 的影响,3.将图中的点按父亲身高的大小次序用折线连起来,所得到的图象是一个折线图可以用这条折线表示儿子身高和父亲身高之间的关系吗?二是这组数据仅是总体的一个样本,不一定能很好地描述两个变量之间的关系答:不能一是父亲的身高与儿子的身高之间是随机关系,不是函数关系因此通过成对样本数据估计这两个参数,相当于寻找一条适当的直线,利用散点图找出一条直线,使各散点在整体上与此直线尽可能接近二、一元线性回归模型参数的最小二乘估计abYx由模型的建立过程可知,参数 和 刻画了变量 与变量 的线性关系,ab其中参数 和 未知,需要根据成对样本数据进行估计。YbxaeYx在一元线性回归模型中,表达式刻画的是变量 与变量 之间的线性相关关系,探究使表示成对样本数据的这些散点在整体上与这条直线最接近(1)有的同学可能会想,可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置。测量出此时的斜率和截距,就可得到一条直线,如图所示(2)有的同学可能会想,可以在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同,把这条直线作为所求直线,如图所示(3)还有的同学会想,在散点图中多取几对点,确定出几条直线的方程,再分别求出这些直线的斜率、截距的平均数,将这两个平均数作为所求直线的斜率和截距如图所示然后用所有“距离”之和刻画所有样本观测数据与该直线的接近程度。上面这些方法虽然有一定的道理,但比较难操作,我们需要另辟蹊径来刻画散点与该直线的接近程度,ybxa通常,我们会想到利用点到直线的“距离”从成对样本数据出发,用数学的方法刻画“从整体上看,各散点与直线最接近”。先进一步明确我们面临的任务:(1,2, )iiiybxinae由得ybxa来刻画各样本观测数据与直线的“整体接近程度”1122(),(),(,)nnnx yxyxy我们设满足一元线性回归模型的两个变量的对样本数据为|()iiibxaye1()|iniibxany因此,可以用这 个竖直距离之和 )0( ,iiiex y当时,表示点在这条直线上。ybxa即样本数据点离直线的竖直距离越小,)( ,),|(iiiiiex yx bxa显然越小,表示点与点的“距离”越小,:( ,)|cosiiil ybxaP x ylde设直线的倾斜角为则点到直线 的距离,Qa b作为截距和斜率的估计值。下面利用成对样本数据求使取最小值的11niiyynQabab所以由 和 所决定,即它是 和 的函数。(1 ,2 ,),iixiyn在上式中,是已知的成对样本数据,21()niiiQybxa所以人们通常用各散点到直线的竖直距离的平方之和来刻画“整体接近程度”在实际应用中,因为绝对值使得计算不方便,Qab所以我们取使达到最小的 和 的值,21,niiQe因为还可以表示为即它是随机误差的平方和,这个和当然越小越好,11niixxn01()()()niiiybxayyb xx1()()()niiiyyb xxybxa2112()()2()()()()nniiiiiiyyb xxyyb xxybxan ybxa21()()()niiiyyb xxybxa21()()niiiybxybxybxa21( , )()niiiQ a bybxa()()()ybxanynyb nxnx11()()()nniiiiybxayybxx121()()(2)()niiiniiabxxyybxxaybxQ 综上知,当 , 的取值为时,达到最小21( , )()()niiiQ a byyb xxaybx即0Q要使取得最小值,后一项的值应为na上式右边各项均为非负数,且前项与无关221( , )()()()niiiQ a byyb xxn ybxa121()()()niiiniixxyybxxQb因此要使取得最小值,当且仅当 的取值为b上式是关于 的二次函数,222111()2()()()nnniiiiiiibxxbyyxxyy此时1221niiiniix ynx yxnx,b ab a求得的。叫做的最小二乘估计这里的“”二乘是平方的意思0.83928.957yx这种求经验回归方程的方法叫做最小二乘法其图形称为经验回归直线。也称经验回归函数或经验回归公式,ybxaYx我们将称为 关于 的经验回归方程,相应的经验回归直线如图所示0.83928.957Yxyx得到儿子身高 关于父亲身高 的经验回归方程为(20.83928.)957ba本题中,利用公式可以计算出176177.176,177xycmcm当时,如果一位父亲的身高为他儿子长大成人后的身高一定是吗?为什么?英国著名统计学家高尔顿把这种后代的身高向中间值靠近的趋势称为“回归现象”后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析。177cm那么是这个子总体的均值的估计值思考176cm实际上,如果把这所学校父亲身高为的所有儿子身高作为一个子总体,176177cmcm不过,我们可以作出推测,当父亲身高为时,儿子身高一般在左右父亲身高不能完全决定儿子身高。因为还有其他影响儿子身高的因素,显然不一定,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析。10.839cmcm其斜率可以解释为父亲身高每增加,其儿子身高平均增加0.83928.957yx这里的经验回归方程170,171.58)7(.()xycmcm例如则矮个子父亲有生矮个子儿子的趋势,185,184.17)2(;()xycmcm例如则但一群高个子父亲的儿子们的平均身高要低于父亲们的平均身高,分析模型还可以发现,高个子父亲有生高个子儿子的趋势,通过对残差的分析可以判断模型刻画数据的效果,残差是随机误差的估计结果,观测值减去预测值称为残差。y通过经验回归方程得到的称为预测值,,Y对于响应变量通过观测得到的数据称为观测值,176 173.26)52.7(35 cm残差为66172,17)6(cmycm例如,本题中第 个观测,父亲身高为其儿子身高的观测值为60.839 17228.957173.265,()cmy 预测值为类似地,可以得到其他的残差,如下表所示为了使数据更加直观,用父亲身高作为横坐标,残差作为纵坐标,可以画出残差图4.413观察右表可以看到,残差有正有负,残差的绝对值最大是20说明残差比较符合一元线性回归模型的假定,是均值为 、方差为的随机变量的观测值观察残差的散点图可以发现,残差比较均匀地分布在横轴的两边。可见,通过观察残差图可以直观判断模型是否满足一元线性回归模型的假设借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析。思考观察下图中四幅残差图,你认为哪一个残差满足一元线性回归模型中对随机误差的假定?)(2图显示残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分;)(1图显示残差与观测时间有线性关系,应将时间变量纳入模型;20残差应是均值为、方差为的随机变量的观测值根据一元线性回归模型中对随机误差的假定,( )4可见,只有图满足一元线性回归模型对随机误差的假设(40)图的残差比较均匀地分布在以取值为的横轴为对称轴的水平带状区域内。)(3图说明残差的方差不是一个常数,随观测时间变大而变大;1.abab对一元线性回归模型参数 和 的估计中,有人认为:估计方法不止一种,根据不同的样本观测数据到直线“整体接近程度”的定义,可以得到参数 和 不同的估计,只要“整体接近程度”定义合理即可。你觉得这个说法对吗?练习1|niiiybxaab也可以用刻画“整体接近程度”得到参数和的估计,二者估计的结果一般不同21()niiiybxaab例如,我们可以用刻画“整体接近程度”得到参数和 的最小二乘估计,ab选择刻画散点趋势的折线可以有不同的标准,取决于“整体接近程度”的定义,定义不同,得到参数 和的估计往往也不同答:这个说法是对的2.0.8125.82 .1(75),(ycmxcmyxcm假如女儿身高单位:关于父亲身高单位:的经验回归方程为已知父亲身高为请估计女儿的身高168 cm估计女儿的身高为左右0.81 17525.82167.57y 解:3. 根据表中数据,建立人体的脂肪含量关于年龄的经验回归方程,画出残差图,描述残差图的特点可用一元线性回归模型刻画0.57650.4478yx可得到人体是脂肪含量关于年龄的经验回归方程为|由散点图可以发现人体的脂肪含量与年龄呈近似线性关系,解:先画人体的脂肪含量于年龄的散点图yx用 表示脂肪含量, 表示年龄3. 根据表中数据,建立人体的脂肪含量关于年龄的经验回归方程,画出残差图,描述残差图的特点说明残差比较符合一元线性回归模型对随机误差的假设可用看到,残差比较均匀地分布在横坐标的两边画残差图,如图所示|%4. 计算下表中的所有残差之和,你能发现什么规律?0所以理论上残差的总和应等于()0n ybxanynbxna1()niiiybxa这是由于计算过程中四舍五入的原因导致0.027解:经计算知残差的总和为11()nniiiiieyy因为112225.( ,) (,)(,)( ),0( ),nnxYnDxyx yYbxebExyee假设变量 与变量 的 对观测数据为两个变量满足一元线性回归模型.请写出参数 的最小二乘估计121niiiniiQbQx yybbxx则是关于 的二次函数,要使取得最小值当且仅当 的取值为2221112nnniiiiiiibxbx yy2221(2)niiiiix bx yby21()niiiQybx解:令)1.3(,m经验表明,一般树的胸径(树的主干在地面以上处的直径)越大,树就越高。由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高。在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据 如下表试根据这些数据建立树高关于胸径的经验回归方程例:2)(,b a如果是,再利用公式计算出即可进而得到散点图,再根据散点图推断树高与胸径是否线性相关。所以要以成对样本数据的胸径为横坐标、树高为纵坐标描出散点,分析:因为要由胸径预测树高,0.249314.84hd相应的经验回归直线,如图所示0.249314.84hd根据最小二乘法,可得经验回归方程为h 表示树高,d用 表示胸径,因此可以用一元线性回归模型刻画树高与胸径之间的关系。表明两个变量线性相关,并且是正相关,散点大致分布在一条从左下角到右上角的直线附近,解:以胸径为横坐标、树高为纵坐标作散点图.以胸径为横坐标,残差为纵坐标,作残差图(0.1)根据经验回归方程,由胸径的数据可以计算出树高的预测值 精确到以及相应的残差,如表所示我们可以根据经验回归方程由胸径预测树高可见经验回归方程较好地刻画了树高与胸径的关系,2所有残差分布在以横轴为对称轴、宽度小于 的带状区域内,0.8 ,观察残差表和残差图,可以看到,残差的绝对值最大是1001968100100mmm人们常将男子短跑的高水平运动员称为“百米飞人”。下表给出了年之前男子短跑世界纪录产生的年份和世界纪录的数据,试依据这些成对数据,建立男子短跑世界纪录关于纪录产生年份的经验回归方程问题以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图在散点图中画出经验回归直线来刻画世界纪录和世界纪录产生年份之间的关系。2( )(0 ,)YbtaeEDee利用一元线性回归模型100Ymt用 表示男子短跑的世界纪录, 表示纪录产生的年份,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程。10.0203374349.76913031.yt 根据最小二乘法,由表中的数据得到经验回归方程为从图中可以看到,经验回归方程较好地刻画了散点的变化趋势,请再仔细观察图形,你能看出其中存在的问题吗?观察中间时间段的散点都在经验回归直线的下方。以经验回归直线为参照,可以发现经验回归方程的不足之处,以及散点的更为精细的分布特征。并且前后两时间段中的散点都在经验回归直线的上方,例如,第一个世界纪录所对应的散点远离经验回归直线,你能对模型进行修改,以使其更好地反映散点的分布特征吗?ylnx 回顾已有的函数知识,可以发现函数的图象具有类似的形状特征。思考即成对样本数据呈现出明显的非线性相关的特征这说明散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,,仔细观察散点图 可以发现散点更趋向于落在中间下凸且递减的某条曲线附近1ln95 ,(8)tx通过将年份变量数据进行变换,得到新的成对数据1220ccc 其中和为未知的参数,且Yt进而可以得到 关于 的非线性经验回归方程12( )(1895)yfcc nttl因此可以认为散点是集中在曲线的周围1001896m注意到短跑的第一个世界纪录产生于年,(1895)lnxxt 我们引进一个中间变量令12cc现在问题转化为如何利用成对数据估计参数和12,cc其中是待定参数用上述函数刻画数据变化的趋势,这是一个非线性经验回归函数,12cc我们就可以借助一元线性回归模型和新的成对数据,对参数和作出估计,如果上表对应的散点图呈现出很强的线性相关特征,散点的分布呈现出很强的线性相关特征画出其经验回归直线在直角坐标系中画出表中成对数据的散点图20.426439811.8012653( )yx 拟合题中的成对数据得到经验回归方程212( )( )0 ,Yc xcuED uu用一元线性回归模型xY将两图进行对比,可以发现 和之间的线性相关程度比原始样本数据的线性相关程度强得多( ) 经验回归方程对于本题中的成对数据具有非常好的拟合精度22(0.426439811.801 651895)3ytln ln(1895)( )xt将代入式,得到由创纪录年份预报世界纪录的经验回归方程表明非线性经验回归方程对于原始数据的拟合效果远远好于经验回归方程我们发现,散点图中各散点都非常靠近的图象,在同一坐标系中画出成对数据散点图、非线性经验回归方程的图象(蓝色)以及经验回归方程的图象(青紫色),两个经验回归方程的残差如表所示观察各项残差的绝对值即经验回归方程的拟合效果要远远好于8(189,0.426439811.8012653 ,)1 ,52 ,iiiutylni0.0203374349.76913031 ,1 ,2 ,8iiieyti则经验回归方程和的残差计算公式分别为iitiyi用表示编号为 的年份数据,用表示编号为 的纪录数据,下面通过残差来比较这两个经验回归方程对数据刻画的好坏,发现经验回归方程各项残差的绝对值远远小于各项残差的绝对值212ln(1895)( )0( )YctcuE uD u因此在残差平方和最小的标准下,非线性回归模型的拟合效果要优于一元线性回归模型的拟合效果88221211( )0.669( )0.004iiiiQeQu由可以通过比较残差的平方和来比较两个模型的效果。因为在某些散点上一个模型的残差的绝对值比另一个模型的小,而另一些散点的情况则相反。在一般情况下,直接比较两个模型的残差比较困难,21.QQ可知小于因此经验回归方程的刻画效果比经验回归方程的好很多2R 越小拟合效果越差,表示残差平方和越大,即模型的21()niiiyy残差平方和与经验回归方程有关,221()niiRyy在表达式中,与经验回归方程无关,222121()1()niiiniiRyyRyy 的计算公式为2R果比也可以用来两决个模型定较系的拟合效数2R因此,表示残差平方和越小,即模型的;越大拟合效果越好20.73250.9983R容易算出经验回归方程和的分别约为和20.8989%RYx例如:的统计意义:响应变量 的变化,有的原因是因为解释变量 的变化而导致的2RxY率的统计意义:解释变量 对响应量 变化的贡献变1968100m事实上,我们还有年之后的男子短跑世界纪录数据,如表所示经验回归方程对于新数据的预报效果远远好于另外,我们还可以用新的观测数据来检验模型的拟合效果,100m在上述问题情境中,男子短跑世界纪录和纪录创建年份之间呈现出对数关系,能借助于样本相关系数刻画这种关系的强弱吗?事实上,它是响应变量的可能取值的平均值思考一般解释变量的取值在样本数据范围内,经验回归方程的预报效果会比较好,超出这个范围越远,预报的效果越差。2080例如,根据世纪年代的父亲身高与儿子身高的数据建立的经验回归方程,不能用来描述现在的父亲身高与儿子身高之间的关系。同样,根据生长在南方多雨地区的树高与胸径的数据建立的经验回归方程,不能用来描述北方干旱地区的树高与胸径之间的关系。在使用经验回归方程进行预测时,需要注意下列问题:例如,根据我国父亲身高与儿子身高的数据建立的经验回归方程,不能用来描述美国父亲身高与儿子身高之间的关系。(1)经验回归方程只适用于所研究的样本的总体(2)经验回归方程一般都有时效性(3)解释变量的取值不能离样本数据的范围太远(4)不能期望经验回归方程得到的预报值就是响应变量的精确值,1. 在回归分析中,分析残差能够帮助我们解决哪些问题?(1)寻找残差明显比其他残差大很多的异常点,如果有,检查相应的一般数据是否有错练习解:分析残差能够帮助我们解决以下几个问题(2)分析残差图可以诊断选择的模型是否合适,如果不合适,可以参考残差图提出修改模型的思路2.19972006()GDP年我国的国内生产总值的数据如下:)199720162017,GDPGDPGDP建立年份(为解释变量,为响应变量的经验回归方程,并预测年的与实际的误差是多少?你能发现什么?(1(2(320,)17(4(520076)201GDPGDPGDPGDPGDPGDP作和年份的散点图,根据该图猜想它们之间的关系可以用什么模型描述;建立年份为解释变量,为响应变量的一元线性回归模型,并计算残差;根据你得到的一元线性回归模型,预测年的看看你的预测值与实际的的误差是多少;你认为这个模型能较好地刻画和年份的关系吗?请说明理由随着时间的发展,又收集到年的数据如下(1)GDPGDPGDP解: 画与年份的散点图,如图所示随着年份的增加也随之增加值与年份呈近似线性关系,可以用一元线性回归模型刻画|14 854.753 33329 602 353.29yt计算得到经验回归方程为(2)yGDPt用 表示的值, 表示年份,用一元线性回归模型拟合数据(3)2017359 6842017820 754461 070GDPGDP年的预报值为亿元,年的实际的为亿元预测值比实际值少亿元2(4)0.92131.99720092 13%6RGGDPPD因为残差呈现一定的规律性,中间是负数,两边是正数,所以可以考虑用非线性回归模型拟合数据建能够解释上面建立的回归方程的,说明在年内,该模型年份,因此所立的模型较好地刻画了的的值变化和年份关系。但20172GDP通过两个模型预测年的值,发现第个模型预测的更准确,说明建立的模型自变量的取值范围决定了模型的适用范围,通常不能超出太多,否则会出现较大的误差2017704 0252017820 754116 729GDPGDP利用上述模型,预测年的值为亿元,而年的实际值亿元,预测值比实际值少亿元。(5)1997201636 820.088 49673 562 093.55yGDPtyt仍用 表示的值, 表示年份,用一元线性回归模型拟合年的数据。21.0(1(2)R如果散点图中所有的散点都落在一条斜率为非 的直线上,请回答下列问题:解释变量和响应变量的关系是什么?是多少?(1)解: 解释变量和响应变量是线性函数关系8.2习题2(2)1R 2.10一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了次试验,收集数据如表所示0.668554.933yx计算得经验回归方程为(1(2( ) 3)画出散点图;建立加工时间关于零件数的一元线性回归模型;关于加工零件的个数与加工时间,你能得出什么结论?|(3)0.6685 min零件数每增加一个,加工时间平均增加(2)yx解: 用 表示零件加工时间,表示零件数3.(1()2)40AAA根据下表中某城市居民年收入与 商品销售额的数据:建立 商品销售额关于居民年收入的一元线性回归模型;如果这座城市居民的年收入达到亿元,估计 商品的销售额是多少1.44715.843yx计算得经验回归方程为|yAx用 表示 商品销售额, 表示居民收入(1)A解: 画 商品销售额与居民年收入的散点图(2)1.447 40 15.84342.037A估计 商品的销售额约为万元4.xN在某地区的一段时间内观测到的不小于某震级 的地震数的数据如下表:|试建立经验回归方程表示二者之间的关系,该模型对预测地震有帮助吗?|xN随着 的增加,地震数近似地以指数形式衰减xN从散点图可以看见震级 与不小于该震级的地震数之间不线性相关解:先画出地震数与震级的散点图如图所示|lgyN作变换,得到的数据如下表|该模型不能直接用于预报地震,因为它不能预报何时发生地震,震级是多少。6.7014 0.740599.73%10 xNxNyx说明,因此可用经验回归方程系可以化描述 和的之释的变间的关解20.9973R 其决定系数6.70140.7405yx计算得经验回归方程为xy从散点图可以看见 和 之间有很强的线性相关性因此可以用一元线性回归模型拟合它们之间的关系xy和 的散点如图所示谢谢观看