第五章回归分析-统计计算及方法课件.ppt
第五章第五章 回归分析回归分析n回归分析回归分析n一元线性回归一元线性回归n多元线性回归多元线性回归n非线性回归非线性回归25.0 5.0 引言引言回归名称的由来回归名称的由来回归分析是研究变量之间相互依赖回归分析是研究变量之间相互依赖关系的一种统计方法,是数理统计关系的一种统计方法,是数理统计学中应用最广泛的分支之一学中应用最广泛的分支之一.3 回归分析的基本思想以及回归分析的基本思想以及 “回归回归”名称的由来最初是由名称的由来最初是由英国生物学家英国生物学家兼统计学家高尔顿兼统计学家高尔顿提出来的提出来的.他从一千多对父母身高与其子女身高他从一千多对父母身高与其子女身高的数据分析中得出:当父亲身高很高的数据分析中得出:当父亲身高很高时,儿子的身高并不像期待的那样高,时,儿子的身高并不像期待的那样高,而要稍矮一些,有向同龄人平均身高而要稍矮一些,有向同龄人平均身高靠拢的现象;而当父亲身高很矮时,靠拢的现象;而当父亲身高很矮时,儿子的身高要比预期的高,也有向同儿子的身高要比预期的高,也有向同龄人平均身高靠拢的现象龄人平均身高靠拢的现象.4 正是因为儿子的身高有回到同龄人正是因为儿子的身高有回到同龄人平均身高的这种趋势,才使人类的身平均身高的这种趋势,才使人类的身高在一定时间内相对稳定,没有出现高在一定时间内相对稳定,没有出现父辈个子高其子女更高,父辈个子矮父辈个子高其子女更高,父辈个子矮其子女更矮的两极分化现象,说明后其子女更矮的两极分化现象,说明后代的平均身高向中心靠拢了,这种现代的平均身高向中心靠拢了,这种现象叫象叫回归回归,这就是,这就是“回归回归”一词的最一词的最初含义初含义.现在的意思是:凡是利用一个现在的意思是:凡是利用一个变量或一组变量的变异来估计或预测变量或一组变量的变异来估计或预测另一个变量的变异情况都称之为回归。另一个变量的变异情况都称之为回归。在现实问题中处于同一个过程中的一些在现实问题中处于同一个过程中的一些变量往往是相互依赖和相互制约的,它们之变量往往是相互依赖和相互制约的,它们之间的相互关系大致可分为两种:间的相互关系大致可分为两种:(1)确定性关系确定性关系 -函数关系函数关系(2)非确定性关系非确定性关系 -相关关系相关关系:变量之间有一:变量之间有一定的依赖关系,但这种关系并不完全确定。定的依赖关系,但这种关系并不完全确定。可控变量:可以在某范围内随意地取指定数值可控变量:可以在某范围内随意地取指定数值-自变量自变量不可控变量不可控变量:可以观测但不可控制可以观测但不可控制(随机变量随机变量)-)-因变量因变量 6 例例2 2 人的血压人的血压y与年龄与年龄x之间的关之间的关 系,不可能由一个人的年龄完全确定系,不可能由一个人的年龄完全确定 他的血压他的血压.一般说人的年龄越大血压一般说人的年龄越大血压 越高,但年龄相同者,血压未必相同越高,但年龄相同者,血压未必相同.例例1 1 人的体重人的体重y与身高与身高x之间的关系之间的关系一一般来说,身高高一些,体重也要重般来说,身高高一些,体重也要重一些,但身高不能严格地确定体重,即一些,但身高不能严格地确定体重,即同样身高的人,体重可能不同同样身高的人,体重可能不同.7 这几个例子中的两个变量之间都有这几个例子中的两个变量之间都有一定的关系,且是一种一定的关系,且是一种非确定性非确定性的关系,的关系,称这类关系为称这类关系为相关关系相关关系.例例3 3 水稻亩产量水稻亩产量y与其施肥量与其施肥量x1 1、播种、播种量量x2 2、种子、种子x3 3有关系,但有关系,但 x1 1、x2 2、x3 3 取取相同的一组数值时,亩产量相同的一组数值时,亩产量y可取不同可取不同数值数值.8 上述例子中身高上述例子中身高x,年龄年龄x,施肥量施肥量 x1、播种量播种量x2、种子种子 x3 都是可以在一定范围都是可以在一定范围内随意的取指定数值内随意的取指定数值,是可控变量称之是可控变量称之为为自变量自变量,而体重而体重 y,血压血压 y,亩产量亩产量 y 都是不可控变量称为都是不可控变量称为因变量因变量.研究一个变量与一个研究一个变量与一个(或几个或几个)可控变量可控变量之间之间 相关关系相关关系的统计分析方法称为的统计分析方法称为回归回归分析分析.回归分析:回归分析:研究一个随机变量与一个(或几个)研究一个随机变量与一个(或几个)可控变量之间相关关系地统计方法。可控变量之间相关关系地统计方法。只有一个自变量的回归分析叫做只有一个自变量的回归分析叫做一元回归分析一元回归分析;多于一个自变量的回归分析叫做多于一个自变量的回归分析叫做多元回归分析多元回归分析。回归分析主要内容回归分析主要内容:(1)(1)提供建立有相关关系的变量之间的数学关系式提供建立有相关关系的变量之间的数学关系式(经验公式经验公式)的一般方法的一般方法;(2)判别所建立的经验公式是否有效判别所建立的经验公式是否有效;(3)利用所得到的经验公式进行预测和控制利用所得到的经验公式进行预测和控制.5.1 5.1 一元线性回归一元线性回归(一一)一元线性回归模型一元线性回归模型 设设 与与 有相关关系有相关关系,当自变量当自变量 时时,因因变量变量 并不取固定的值与其对应并不取固定的值与其对应.如果要用函数关如果要用函数关系近似系近似 与与 的相关关系的相关关系,很自然想到很自然想到,应该以应该以 作为作为 与与 相对应的数值相对应的数值.(51)其中其中 为常数,则称为常数,则称 与与 之间存在线性之间存在线性相关关系,称(相关关系,称(5 51 1)为一元正态线性回归模型,)为一元正态线性回归模型,简称一元线性模型,其回归函数记为简称一元线性模型,其回归函数记为称为称为 对对 的线性回归,的线性回归,称为回归常数,称为回归常数,称为回归系数。称为回归系数。由(由(5 51 1)得)得,可知可知 取取不同数值时,便得到不同的正态变量。不同数值时,便得到不同的正态变量。其中其中为未知的常数。为未知的常数。由由独立知道独立知道也相互独立,且也相互独立,且称为独立样本称为独立样本的一个(或一组)样本观测的一个(或一组)样本观测值,其中值,其中为取固定值取固定值时,对时,对进行一次试验所得到的观测值。进行一次试验所得到的观测值。利用独立样本及其样本值可得利用独立样本及其样本值可得的估计量及的估计量及估计值估计值和和从而得到回归函数从而得到回归函数的估计的估计称为称为 对对 的经验回归方程或经验公式。的经验回归方程或经验公式。注:确定变量间相关关系数学关系式的三种方法注:确定变量间相关关系数学关系式的三种方法1.1.经验公式。经验公式。2.2.假设检验。假设检验。3.3.散点图法。散点图法。把样本值把样本值作为平面直角坐标系的作为平面直角坐标系的 个点描出来,构成实验的个点描出来,构成实验的散点图。散点图。根据散点图,适当地选择一个函数根据散点图,适当地选择一个函数使得使得在一定意义下最好地吻合在一定意义下最好地吻合于观测结果于观测结果常用的是最小常用的是最小二乘法,即二乘法,即.二、未知参数的估计二、未知参数的估计1.1.正规方程组、回归系数的点估计正规方程组、回归系数的点估计根据最小二乘法求线性回归函数根据最小二乘法求线性回归函数的估计的估计就是求使得就是求使得取得最小值的取得最小值的即即根据微分学中的二元函数极值的充分条件根据微分学中的二元函数极值的充分条件,将将分别对分别对求一阶偏导数并令其为零求一阶偏导数并令其为零经过整理后得到线性方程组经过整理后得到线性方程组其中其中正正规规方方程程组组解此方程组即得使解此方程组即得使取得最小值的取得最小值的分别称为分别称为的最小二乘估计值的最小二乘估计值.于是于是,得到得到对对的经验回归方程的经验回归方程注注:用最小二乘法得到的经验回归直线通过已知用最小二乘法得到的经验回归直线通过已知个数据点个数据点的几何重心的几何重心把估计值中的把估计值中的分别用分别用来代替来代替,就得到了参数就得到了参数的估计量的估计量.为了方便为了方便,我们引进几个常用的记号我们引进几个常用的记号则则参数估计量参数估计量回归方程回归方程定理定理1:1:在一元线性回归模型中在一元线性回归模型中,和和相互相互独立独立.证明证明:即即与与不相关不相关.但但与与都是独立正态变量都是独立正态变量的线性组合的线性组合,因此因此,与与的联合分布为正的联合分布为正态分布态分布.对于正态随机向量来说不相关和相互独立是对于正态随机向量来说不相关和相互独立是等价的等价的.证毕证毕定理定理2:2:在一元线性回归模型中在一元线性回归模型中,的最小二的最小二 乘估计量乘估计量 的数学期望和方差为的数学期望和方差为证明证明:证毕证毕.由定理由定理2 2可看出可看出,当当 时时,取最小值取最小值 ;与与 成反比成反比.所以所以,为了提高为了提高 和和 的估计精度的估计精度,最最好选择好选择 使使 ,并且并且 应比较分散应比较分散.注注:的最小二乘估计量与极大似然估计量相等的最小二乘估计量与极大似然估计量相等.24实际上:实际上:在在 ,0和和 1的最大似的最大似然估计为最小二乘估计然估计为最小二乘估计2.2.参数参数 的点估计的点估计当当 的极大似然估计量的极大似然估计量 已得到后已得到后,的估计量可由似然方程的估计量可由似然方程可得可得 的极大似然估计量为的极大似然估计量为记记即即是是 的极大似然估计量的极大似然估计量.定理定理3:在一元线性模型中在一元线性模型中证明证明:而而又又于是有于是有证毕证毕.由定理由定理3 3可得可得是是 的无偏估计的无偏估计.3.3.估计量估计量 和和 的分布的分布定理定理4:4:在一元线性模型中在一元线性模型中(1)(2)(3)(4)(5)相互独立相互独立.4.4.未知参数未知参数 和和 的区间估计的区间估计定理定理5.5.在一元线性模型中在一元线性模型中证明证明:由定理由定理4,4,得得由定理由定理4 4的的(5)(5)可知可知,分别相互独立分别相互独立,再由再由t t分布的定义分布的定义,即得即得证毕证毕由定理由定理5 5及及t t分布的分位数分布的分位数,得得即得即得 的的 置信区间为置信区间为类似类似,的的 置信区间为置信区间为由由易得易得 的的 置信区间为置信区间为三、线性回归效果的显著性检验三、线性回归效果的显著性检验 我们在求我们在求 Y 对对 x 的线性回归之前,必须判断的线性回归之前,必须判断Y与与 x 的关系是否满足一元线性回归模型。理论上的关系是否满足一元线性回归模型。理论上讲,这要求检验讲,这要求检验(1)对对x取任一固定值时,取任一固定值时,Y都服从正态分布,而且都服从正态分布,而且 方差相同;方差相同;(2)x在某一范围取值时,在某一范围取值时,EY是是x的线性函数;的线性函数;(3)在在x取各个不同值时,相应的取各个不同值时,相应的Y是相互独立的。是相互独立的。但要检验这三条不仅需要大量的试验,还要进行大但要检验这三条不仅需要大量的试验,还要进行大量的计算,实际上很难办到。量的计算,实际上很难办到。(1)x对对Y没有显著影响,应丢掉自变量没有显著影响,应丢掉自变量x;(2)x对对Y有显著影响,但不能用线性相关关系来有显著影响,但不能用线性相关关系来 表示;表示;(3)除除x外还有其它不可忽略的变量对外还有其它不可忽略的变量对Y也有显著也有显著 影响,从而削弱了影响,从而削弱了x对对Y的影响,应考虑多元的影响,应考虑多元 线性回归。线性回归。1.F检验法检验法考虑考虑令令计算后可得一元线性模型中的平方和分解公式:计算后可得一元线性模型中的平方和分解公式:总总偏偏差差平平方方和和回回归归平平方方和和残残差差平平方方和和总偏差(离差)平方和总偏差(离差)平方和回归平方和回归平方和因为因为剩余平方和(或残差平方和)剩余平方和(或残差平方和)平方和分解公式:平方和分解公式:(1)由于)由于x对对Y的线性相关关系而引起的的线性相关关系而引起的Y的分散性。的分散性。(2)剩余因素引起的)剩余因素引起的Y的分散性。的分散性。定理定理6:证明:证明:对于检验对于检验证毕证毕2.t检验法检验法由定理由定理5知知3.r检验法检验法为了检验为了检验Y与与x是否有线性相关性,也可用统计量是否有线性相关性,也可用统计量相关系数相关系数进行检验进行检验两边平方得两边平方得于是得到于是得到即即这说明这说明Y与与x之间不存在线性相关关系。之间不存在线性相关关系。(2)(3)检验假设检验假设r检验法与检验法与F检验实质上是一回事,因为检验实质上是一回事,因为F检验法与检验法与r检验法的拒绝域是相同的。检验法的拒绝域是相同的。50对于一元线性回归模型,上述对于一元线性回归模型,上述3种检验的种检验的结果是完全一致的结果是完全一致的.4.4.三种检验的关系三种检验的关系(1)由于由于t分布与分布与F分布的关系分布的关系因此因此t检验与检验与F检验完全一致检验完全一致51r检验与检验与F检验也一致检验也一致因此因此等价于等价于四、利用回归方程进行预测四、利用回归方程进行预测预测:预测:对固定的对固定的x值预测它所对应的值预测它所对应的Y的取值。的取值。考虑考虑(1)点预测)点预测(2)区间预测)区间预测定理定理7:由定理由定理7知知即即其中其中其中其中56当当 x0 越靠近越靠近 ,区间宽度越窄,预测就越精确区间宽度越窄,预测就越精确 当当 x0 离离 不太远且不太远且n较大时较大时,而而于是于是,y0的的1置信区间可近似表示为置信区间可近似表示为57于是于是,y0的的95%置信区间可近似表示为置信区间可近似表示为于是于是,y0的的99%置信区间可近似表示为置信区间可近似表示为58控制问题控制问题对对x的控制范围的控制范围 当要求当要求 y 在某个区间范围内变化时,如在某个区间范围内变化时,如 ,如何求得如何求得 x 的相应控制范围的相应控制范围.即要求以即要求以 1 的置信度求出相应的的置信度求出相应的 使当使当 时时,x 所对应的所对应的 y落在落在59 只考虑只考虑 n 较大情形,令较大情形,令60 例 在在钢钢线线碳碳含含量量x对对于于电电阻阻效效应应y的的研研究究中中,得得到到了了以下数据以下数据:碳含量(%)0.10 0.30 0.40 0.55 0.70 0.80 0.95电阻(微欧)15 18 19 21 22.6 23.8 26假设对于给定的假设对于给定的 x,y 为正态变量为正态变量,且方差与且方差与 x 无关无关.如果如果x,y满足经验公式满足经验公式 求线性回归方程求线性回归方程 解解 设设现在现在 所求的线性回归方程为所求的线性回归方程为 的无偏估计的无偏估计.由例得 检验例中的线性回归是否显著.解解 检验假设 拒绝域为 由例2得=拒绝 即认为线性回归显著例例 求上例中当碳含量为0.50时,电阻的置信水平为0.95的置信区间 解解 由例1和例2可得 685.2 5.2 多元线性回归分析多元线性回归分析一一.多元线性回归模型多元线性回归模型模型模型1 1模型模型2 26970在模型在模型1 1下,有下,有在模型在模型2 2下,有下,有7172称模型称模型3和模型和模型4为为y关于关于x的的p元样本线性回归元样本线性回归模型模型.73对多元线性回归模型,需研究如下几个问题:对多元线性回归模型,需研究如下几个问题:(2)对建立的关系式进行统计假设检验对建立的关系式进行统计假设检验(3)对变量对变量y进行预测和对自变量进行预测和对自变量x进行控制进行控制74np1,记记75模型模型3和模型和模型4可表示为如下矩阵形式可表示为如下矩阵形式其中其中In为为 n 阶单位矩阵,矩阵阶单位矩阵,矩阵X是是n(p+1)矩阵称为设计矩阵,且秩矩阵称为设计矩阵,且秩(X)=p+176二二.未知参数的估计未知参数的估计1.1.最小二乘估计最小二乘估计 最小二乘法:求最小二乘法:求 使使误差平方和误差平方和77 求求 并令其都等于并令其都等于0 0,整理后得到如下整理后得到如下正规方程组正规方程组:78 正规方程组的解正规方程组的解就是就是 的最小二乘估计的最小二乘估计 由于由于79及及于是正规方程组用矩阵表示为于是正规方程组用矩阵表示为80 由于由于Rank(X)=p+1,因此因此 必存在必存在逆阵逆阵解正规方程组得到解正规方程组得到 的估计为的估计为 称之为称之为 的的最小二乘估计最小二乘估计.于是线性回归方程为于是线性回归方程为812.2.最大似然估计最大似然估计 多元线性回归系数的最大似然估计与一元线多元线性回归系数的最大似然估计与一元线性回归时求最大似然估计的想法一样性回归时求最大似然估计的想法一样 823.3.参数估计的性质参数估计的性质性质性质3性质性质1 估计量估计量 是随机变量是随机变量 的线性变换的线性变换 性质性质2 估计量估计量 是是 的无偏估计的无偏估计 在在模型模型1 1下有如下性质下有如下性质83性质性质4(2)性质性质4(1)在在模型模型2 2下有如下性质下有如下性质84三三.回归方程的显著性检验回归方程的显著性检验检验问题:检验问题:考虑模型考虑模型2 因变量因变量y的观测值的观测值 是不是不完全相同的,之所以不同,可能由于完全相同的,之所以不同,可能由于如下两个原因:一是随机因素引起的,如下两个原因:一是随机因素引起的,如随机误差;另一个是由自变量的变如随机误差;另一个是由自变量的变化引起的变化化引起的变化.为此,考虑平方和分为此,考虑平方和分解解85平方和分解平方和分解交叉项为交叉项为0 086称为总变差平方和,反映数据称为总变差平方和,反映数据 的的波动性,即这些数据的分散程度波动性,即这些数据的分散程度 越大表明越大表明n个观测值个观测值 的波动的波动越大即之间越分散,越大即之间越分散,反之反之 越小表明越小表明 的数值波动越的数值波动越小即小即 之间越接近之间越接近.87称为称为残差平方和残差平方和.Se反映了除掉由反映了除掉由 对对y的影响之的影响之外的剩余因素对外的剩余因素对 分散程度分散程度的作用,即随机因素引起的波动的作用,即随机因素引起的波动.称为称为回归平方和回归平方和反映了反映了 的波动程度的波动程度88 而而SR越小越小,Se越大越大,此时此时x 对对y 的的 线性影响线性影响不显著不显著.ST给定后给定后,SR越大越大,Se e越小越小,x对对y 的线性影响的线性影响越显著越显著;因此因此,F=SR/Se的比值反映了的比值反映了x 对对y 的线性影响的显著性,进而检验假设的线性影响的显著性,进而检验假设.89定理:定理:在在p元线性回归模型元线性回归模型2下,有下,有90根据定理构造根据定理构造F检验统计量检验统计量91对于给定的显著性水平对于给定的显著性水平 当当 时,拒绝时,拒绝 ,认为,认为线性回归效果显著,即线性回归效果显著,即y与与 之间之间存在显著的线性相关关系存在显著的线性相关关系;当当 时,接受时,接受 ,认为,认为线性回归效果不显著,即线性回归效果不显著,即y与与 之之间不存在显著的线性相关关系间不存在显著的线性相关关系;92上述分析方法通过下表来描述上述分析方法通过下表来描述n-1总变总变差差pn-p-1回归回归 残差残差 F均方均方和和自由自由度度平方和平方和方差方差来源来源93四四.回归系数的显著性检验回归系数的显著性检验在多元线性回归分析中,回归方程的显著性并在多元线性回归分析中,回归方程的显著性并不意味着每个自变量对因变量不意味着每个自变量对因变量y的影响都是显的影响都是显著的,实际上,某些回归系数仍有可能接近于著的,实际上,某些回归系数仍有可能接近于零,若某零,若某 接近于零,说明接近于零,说明 的变化对的变化对y的影响很小,甚的影响很小,甚至我们可以把至我们可以把 从回归方程中去从回归方程中去掉,从而得到更为简单的线性回归方程掉,从而得到更为简单的线性回归方程.因此因此在拒绝在拒绝 之后,需要进之后,需要进一步对每个自变量进行显著性检验一步对每个自变量进行显著性检验.94检验问题:检验问题:考虑模型考虑模型2 若接受若接受 ,表明,表明 对对y的影响不显著;的影响不显著;若拒绝若拒绝 ,表明,表明 对对y有一定的影响有一定的影响95根据性质根据性质4和定理,得到和定理,得到由此构造由此构造t检验统计量检验统计量96对于给定的显著性水平对于给定的显著性水平 当当 时,拒绝时,拒绝 ,认为,认为 对对 y的线性影响显著;的线性影响显著;当当 时,接受时,接受 ,认为,认为 对对 y的线性影响不显著;的线性影响不显著;975.35.3非线性回归非线性回归在很多实际问题中,两个或者多个变量在很多实际问题中,两个或者多个变量之间的关系不一定是线性关系之间的关系不一定是线性关系.若此时若此时建立线性回归方程,效果肯定不会好建立线性回归方程,效果肯定不会好.而如果观测值的散点图大致呈某一曲线,而如果观测值的散点图大致呈某一曲线,又存在某种变换可将该曲线转换成直线,又存在某种变换可将该曲线转换成直线,于是就可以选择该变换把问题转换成线于是就可以选择该变换把问题转换成线性回归的问题,从而利用线性回归的一性回归的问题,从而利用线性回归的一些结果解决问题些结果解决问题.我们主要介绍非线性我们主要介绍非线性回归方法回归方法.具体做法:具体做法:1 1)根据样本数据,在直角坐标系中画出散点图)根据样本数据,在直角坐标系中画出散点图2 2)根据散点图,推测出)根据散点图,推测出Y Y与与x x之间的函数关系之间的函数关系3 3)选择适当的坐标变换,使之变成线性关系)选择适当的坐标变换,使之变成线性关系4 4)用线性回归方法求出线性回归方程)用线性回归方法求出线性回归方程5 5)返回到原来的函数关系,得到要求的回归方程)返回到原来的函数关系,得到要求的回归方程可线性化的一元非线性回归可线性化的一元非线性回归1.1.双曲线双曲线:2.2.幂函数幂函数:3.3.指数曲线指数曲线:4.4.倒指数曲线倒指数曲线:取对数得 取对数得 5.5.对数曲线对数曲线:6、S型(型(Logistic)曲线)曲线 令令 变形变形 1027、多项式模型多项式模型任意连续函数都可由多项式逼近任意连续函数都可由多项式逼近例例1 1在彩色显影中,根据以往经验,形成染料光学密度与析出银的光学密度之间呈倒指数曲线关系:已测得11对数据见下表(1)求出经验回归曲线方程;(2)对回归曲线的显著性进行检验.x0.05 0.06 0.07 0.10 0.14 0.20 0.25 0.31 0.38 0.43 0.47 y0.10 0.14 0.23 0.37 0.59 0.79 1.00 1.12 1.19 1.25 1.29 解解 (1)由 令 经计算得=线性回归方程为=曲线回归方程为曲线回归方程为 (2)检验假设检验假设 拒绝域为现在 n=11,取(2)=拒绝原假设=y对x的回归方程是显著的.例例2 测定某肉鸡的生长过程,每两周记录一次鸡的重量,测定某肉鸡的生长过程,每两周记录一次鸡的重量,数据如下表数据如下表x/周2468101214y/kg0.30.861.732.22.472.672.8由经验知鸡的生长曲线为由经验知鸡的生长曲线为Logistic曲线,且极限生长量曲线,且极限生长量为为k=2.827,试求,试求y对对x的回归曲线方程。的回归曲线方程。解解 由题设可建立鸡重由题设可建立鸡重y与时间与时间x的相关关系为的相关关系为 令令 则有则有 列表计算列表计算 序号序号xyyX2y2xy120.32.13144.5414.262240.860.827160.6843.309361.73-0.456360.208-2.733482.2-1.255641.576-10.0425102.47-1.9341003.741-19.3426122.67-2.8341448.029-34.0037142.8-4.64219621.544-64.982 5613.03-8.16256040.323-123.531所以所以 所以所求曲线方程为所以所求曲线方程为 112需要指出一点的是新引进的自变量只能需要指出一点的是新引进的自变量只能依赖于原始变量,而与未知参数无关依赖于原始变量,而与未知参数无关.一般来说,变换的选择并不是一件容易一般来说,变换的选择并不是一件容易的事的事.事实上,根据散点图选择一种变事实上,根据散点图选择一种变换只能近似反映换只能近似反映y与与x的关系的关系.113应该指出,对原始数据变换,把曲线回应该指出,对原始数据变换,把曲线回归转化为线性回归,利用线性回归的性归转化为线性回归,利用线性回归的性质,即使对变换后的线性回归成立,也质,即使对变换后的线性回归成立,也不能保证对原始数据的曲线回归成立,不能保证对原始数据的曲线回归成立,即线性回归性质经过变换后不一定能保即线性回归性质经过变换后不一定能保持持.对于非线性回归模型的深入讨论,可以对于非线性回归模型的深入讨论,可以参阅何晓群,刘文卿编参阅何晓群,刘文卿编应用回归分析应用回归分析.