实验七-多元回归模型(共18页).doc
《实验七-多元回归模型(共18页).doc》由会员分享,可在线阅读,更多相关《实验七-多元回归模型(共18页).doc(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上实验七 多元回归模型(2学时)一、实验目的和要求1. 熟练掌握多元线性回归模型的建立方法,掌握并能检验所建立回归方程的显著性与方程系数的显著性,能根据实际问题作预测与控制;2.掌握平方和分解公式,会编程求总离差平方和TSS、回归平方和RSS、残差平方和ESS、复相关系数平方等统计量; 3.会根据实际问题对建立多元非线性回归模型,掌握多元线性回归的regress命令格式二、实验内容1.多元线性回归模型(1)多元线性回归模型多元线性回归模型待定常数,回归系数,.矩阵表示对进行次独立观测,得组数据 则有 ,其中 相互独立,且采用矩阵记号 -观测向量- 设计矩阵-待估回归参数
2、向量 -随机误差向量 多元线性回归模型(2)参数估计及性质-的最小二乘估计-随机误差项方差的无偏估计-回归方程给出,可由的观测值和经验回归方程求得的预测值%求回归参数命令(3)复相关系数及相关性检验总离差平方和分解 总离差残差平方和(Total Sum of Squares) 残差平方和(Error Sum of Squares) 回归平方和(Regression Sum of squares)复相关系数平方,回归愈越显著%求复相关系数平方命令TSS=sum(y-mean(y).2) %计算总离差平方和,y是因变量Y数据RSS=sum(y1-mean(y).2) %计算回归平方和ESS=sum
3、(y-y1).2) %计算残差平方和R2=RSS/ESS; %计算样本决定系数R2=RSS/TSS(4)回归方程的显著性检验检验假设: 统计量 给出显著性水平,检验值,当拒绝,认为与线性回归显著;否则线性关系不显著%回归方程显著性检验命令F=(n-p-1)*SSR/SSE %计算的F统计量,n是样本容量F1=finv(0.95,p,n-p-1) %查F统计量0.05的分位数F2=finv(0.99,p,n-p-1) %查F统计量0.01的分位数p=1-fcdf(F,p,n-p-1) %求检验P值,F是上面计算结果(5)回归系数的统计推断检验假设 统计量 检验值当,拒绝,认为与线性回归显著;否则
4、不显著%回归系数显著性的t检验命令T=b1/sqrt(SSE/(n-2)*sqrt(sum(x-mean(x).2) %t统计量观测值to, x是自变量,b1是X的回归系数T1=tinv(0.975,n-p-1) %t统计量0.05的分位数T2=tinv(0.995,n-p-1) %t统计量0.01的分位数p=2-2*tcdf(T,n-p-1) %t检验的p值(6)预测及统计推断 因变量的点估计和区间估计给出,的预测值的置信区间 4.多元线性回归建模的基本步骤(1)对问题进行直观分析,选择因变量与解释变量,作出因变量与各解释变量散点图,初步设定多元线性回归模型参数个数;(2) 多元回归建模命令
5、输入因变量与自变量的观测数据(y,X), 计算参数的估计regeress,调用格式有以下三种:(1)b = regress(Y,X)(2)b,bint,r,rint,stats = regress(Y,X)(3)b,bint,r,rint,stats = regress(Y,X,alpha) 输入参数:因变量观测向量;矩阵,第一列元素全为1,第j列是自变量Xj观测向量,对一元线性回归,取p=1即可;alpha为显著性水平.输出参数:向量b-回归系数估计值bint-回归系数的(1-alpha)置信区间;向量r-残差列向量;rint-模型的残差的(1- a)的置信区间;stats-用于检验回归模型
6、的统计量,有4个分量值:第一个是复相关系数平方,第二个是F统计量值,第三个是与统计量F对应的概率P,当P n,p=size(A); %读取A的行数和列数X=A(:,1:3) %X1-X3构成的数据矩阵 y=A(:,4)mmdl=LinearModel.fit(X,y) %调用LinearModel类的fit方法求解模型 结果输出:结果输出 mmdl = Linear regression model: y 1 + x1 + x2 + x3Estimated Coefficients:参数估计表 Estimate SE tStat pValue 参数估计 残差平方 t统计量 检验P值 (Inte
7、rcept) 162.06 346.15 0.46818 0.64686 x1 7.2739 1.3523 5.3787 9.7273e-05 x2 13.957 3.167 4.4071 0. x3 -4.3996 19.76 -0.22265 0.82702 以下是关于一些统计量的结果:Number of observations: 18, Error degrees of freedom: 14Root Mean Squared Error: 100R-squared: 0.957, Adjusted R-Squared 0.948F-statistic vs. constant mod
8、el: 105, p-value = 7.75e-10 其他结果,点击工作区mmdl,显示很多结果。包括给出3个平方和SSE、SST、SSR及MSE,残差Residuals,因变量拟合Fittde等诸多结果。说明:1),修正后的复相关系数平方 均认为和的线性关系显著.2)F统计量观测值,及检验概率均拒绝原假设,认为和的线性关系显著.3)从参数估计表看出, 认为, 认为认为与关系显著,与关系不显著,可进一步考虑是否剔除.此外,该类结果还给出了一系列统计量值,如Fitted-因变量拟合结果,Residual残差结果,平方和SSESSTSSR等。例3.2.3现代服务业是社会分工不断深化的产物,随着经
9、济的发展,科学技术的进步,现代服务业的发展受到多种因素和条件的影响。不仅受到经济总体发展水平的影响,还受到第二产业、就业、投入等因素的影响,从这几个主要方面出发,利用江苏省统计年鉴的有关数据,通过建立多元线性回归模型对1990-2008年各种因素对现代服务业的影响进行回归分析。假如构建如下江苏省服务业增长模型:,Y代表江苏省服务业的增加值(单位:亿元),反映了江苏省服务业发展的总体水平。x1x4表示影响江苏省服务业发展的四种主要因素和影响,其中x1代表江苏省人均GDP(单位:元),说明江苏省总体经济发展水平对服务业的影响;x2代表江苏省第二产业的增加值(单位:亿元),说明了工业发展对服务业的影
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 多元 回归 模型 18
限制150内