《回归分析(完整版).ppt》由会员分享,可在线阅读,更多相关《回归分析(完整版).ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、主要内容线性回归模型 MATLABMATLAB软件实现非线性回归模型及软件实现非线性回归模型及软件实现 实 验内容两个引例为为了了研研究究钢钢材材消消费费量量与与国国民民收收入入之之间间的的关关系,在统计年鉴上查得一组历史数据。系,在统计年鉴上查得一组历史数据。年 份196419651966197819791980消费(吨)698872988144627362825收入(亿)109712841502294831553372试分析预测若试分析预测若19811981年到年到19851985年我国国民收入年我国国民收入以以4.5%4.5%的速度递增,钢材消费量将达到什么样的速度递增,钢材消费量将达到
2、什么样的水平?的水平?引例1:钢材消费量与国民收入的关系 钢材消费量-试验指标(因变量)Y;国民收入-自变量X;作拟合曲线图形分析;建立数据拟合函数y=E(Y|X=x)=f(x)。假设引例1:钢材消费量与国民收入的关系 钢材消费量钢材消费量y y与国民收入与国民收入x x的散点图的散点图y=a+bx引例1:钢材消费量与国民收入的关系 回归分析是研究变量间相关关系的一种回归分析是研究变量间相关关系的一种回归分析是研究变量间相关关系的一种回归分析是研究变量间相关关系的一种统计方法统计方法统计方法统计方法。特点:试验指标(因变量)是随机变量。特点:试验指标(因变量)是随机变量。特点:试验指标(因变量
3、)是随机变量。特点:试验指标(因变量)是随机变量。假设:假设:1.线性函数线性函数 ax+b 2.正态性正态性xx0E(Y|x0)y0 x1E(Y|x1)一元一元线性回归模型:线性回归模型:引例1:钢材消费量与国民收入的关系 某建材公司对某年20个地区的建材销售量Y(千方)、推销开支、实际帐目数、同类商品竞争数和地区销售潜力分别进行了统计。试分析推销开支、实际帐目数、同类商品竞争数和地区销售潜力对建材销售量的影响作用。试建立回归模型,且分析哪些是主要的影响因素。引例:某建筑材料公司的销售量因素分析 x1x2x3x4 12345678910111213141516171819205.52.58.
4、03.03.02.98.09.04.06.55.55.06.05.03.58.06.04.07.57.031556750387130564273604450395570405062591081278121258511126101061111998691615178104167126441468131179.3200.1163.2200.1146.0177.730.9291.9160.0339.4159.686.3237.5107.2155.0201.4100.2135.8223.3195.0 x1x2x3x4y1111.11111X=统计数据引例:某建筑材料公司的销售量因素分析 数据能否可视化
5、?即通过散点图去发现y与x1,x2x4的函数关系?由一元回归模型得到启示,我们是否欲寻找关系:y=E(Y|x1,x2,x3,x4)即 y=f(x1,x2,x3,x4)?一元与多元任务:估计回归模型中的未知参数;检验模型假设的正确性;分析影响试验指标y的因素,挑选重要因素;应用预测与控制;线性与非线性一般的回归模型与任务一般的回归模型与任务返回多元线性回归模型任务:在回归模型中如何估计参数i(i=0,1,m)和2?模型的假设(线性)是否正确?判断每个自变量xi(i=1,m)对Y的影响是否显著?利用回归方程对试验指标 Y进行预测或控制?知识简介多元线性回归模型与任务矩阵表达形式拟合误差e=yy称为
6、残差向量y的估计值:残差平方和多元线性回归分析1)F-统计检验法任务二:模型检验多元线性回归分析提出问题2)相关系数 R检验法任务三:因素分析多元线性回归分析提出问题检验方法任务四:应用返回预测、控制MATLAB软件实现使用命令使用命令regress实现一实现一(多多)元线性回归模型的计算元线性回归模型的计算b=regress(Y,X)或 b,bint,r,rint,stats=regress(Y,X,alpha)回归系数回归系数a,b以及它们的置信区间以及它们的置信区间残差向量e=Y-Y及它们的置信区间相关系数相关系数R2,F-统计量和与统计量和与0对应的概率对应的概率p。残差及其置信区间可
7、以用残差及其置信区间可以用rcoplot(r,rint)画图。画图。默认值是默认值是0.05输入:(jzhui.m)x1=5.5 2.5 8 3 8 6 4 7.5 7;(20维)维)x2=31 55 67 55 70 40 50 62 59;x3=10 8 12 11 11 9 9;x4=8 6 9 16 8 13 11;y=79.3 200.1 135.8 223.3 195;X=ones(size(x1),x1,x2,x3,x4;b,bint,r,rint,stats=regress(y,X)引例2求解输出结果:输出结果:b=191.9158 -0.7719 3.1725 -19.681
8、1 -0.4501 0 1 2 3 4bint=103.1071 280.7245(系数的置信区间)系数的置信区间)r=-6.3045 -4.2215 8.4422 23.4625 3.3938rint=(略)略)stats=0.9034(R2)35.0509(F)0.0000(p)Q=r*r2=Q/(n-2)=537.2092(近似)近似)引例2求解残差向量分析图任务三(因素分析)如何实现?stepwise(X,y,inmodel,alfha)如上例,输入:如上例,输入:X=x1,x2,x3,x4;stepwise(X,y,1,2,3)逐步回归引例2求解b=191.9158 -0.7719
9、3.1725 -19.6811 -0.4501 0 1 2 3 4模型中均方差历模型中均方差历史数据记载表史数据记载表参参变量数变量数据分析表据分析表Stepwise语句功能介绍Stepwise语句功能介绍经过观察,得到各种情况下的均方差对比:变量组合x1,x2x1,x3x1,x4x2,x3x2,x4x3,x4RMSE5351.96 61.77 23.96 52.96 44.75变量组合x1,x2x3x1,x2x4x1,x3 x4x2,x3x4x1,x2x3,x4RMSE24.6554.4345.8624.6425.39引例2求解最佳回归方程思考:如何进行预测?restool(X,y,mode
10、l)引例2求解MATLAB 软件能否实现非线性回归分析?如果从数据的散点图上发现y与x没有直线关系,又如何计算?例1:试分析年龄与旋转定向(运动)能力之间的关系年龄年龄 17 19 21 23 25 27 29第第1人人第第2人人20.48 25.13 26.15 30.0 26.1 20.3 19.3524.35 28.11 26.3 31.4 26.92 25.7 21.3一元非线性回归分析一元非线性回归分析一元非线性回归分析一元非线性回归分析假设模型 一元多项式回归在matlab 软件中用命令polyfit实现。如前面的例子,具体计算如下:输入:(phg1.m)x1=17:2:29;x=
11、x1,x1;y=20.48 25.13 26.15 30.0 26.1 20.3 19.35 24.35 28.11 26.3 31.4 26.92 25.7 21.3;p,S=polyfit(x,y,2);p 注意:x,y向量的维数要一致。S是一个数据结构,用于其它函数的计算。一元非线性回归分析一元非线性回归分析计算计算y的拟合值:的拟合值:输入:输入:Y,delta=polyconf(p,x,S);Y结果:结果:Y=22.5243 26.0582 27.9896 28.3186 27.0450 24.1689 19.6904 22.5243 26.0582 27.9896 28.3186
12、27.0450 24.1689 19.6904拟合效果图:一元非线性回归分析一元非线性回归分析用用polytool(x,y,2)polytool(x,y,2)还可以得到一个交互式画面。还可以得到一个交互式画面。ExportParametersParametersCIPredictionPredictionCIResidualsAll一元非线性回归分析一元非线性回归分析在工作空间中,输入yhat,回车,得到预测值。一元非线性回归分析一元非线性回归分析返回 为了研究三种化学元素:氢、n戊烷和异构戊烷与生成物的反应速度Y(%)之间的关系,经试验测定得到某些数据。试建立非线性回归模型,并进行统计分析。
13、例2:某物质的化学反应问题多元非线性回归分析多元非线性回归分析y=b 0+b 1 x 1+b2x 2+b 3 x 3+(linearterms)b12 x 1x 2+b 13x 1 x3+b23 x2 x3+(interactionterms)b11 x 12+b 22 x22+b33 x 32+(quadraticterms)N(0,2)例2:某物质的化学反应问题假设与建模一 在各因素与指标(因变量)之间的信息“一无所知”的情况下,假设模型Y=f(x1,x2,x3)+中的函数f 是多项式形式,即linear:(缺省)y=0+1x1+mxmpurequadratic:y=0+1x1+mxm+j
14、=1tomj*xj2interaction:y=0+1x1+mxm+1jkmjkxjxkquadratic(完全二次,以上模型之和)其中model有以下四种选择:例2:某物质的化学反应问题rstool(X,y,model,alpha)(二次多项式回归分析的语句)MATLAB软件实现loadreaction(调出数据)Whos(查看数据名称及大小)NameSizeBytesClassbeta5x140doublearraymodel1x612chararrayrate13x1104doublearrayreactants13x3312doublearrayxn3x1060chararrayyn1
15、x1326chararray三个三个自变量自变量因变量因变量Y Y例2:某物质的化学反应问题X=reactants;y=rate;rstool(X,y,quadratic)ExportParametersRMSEResidualsAllLinearPureQuadraticInteractionsFullQuadraticUserSpecified例2:某物质的化学反应问题在工作空间可以分别给出在工作空间可以分别给出参数估计值、残差平方和、残差向量参数估计值、残差平方和、残差向量。例2:某物质的化学反应问题 假定由实际问题背景分析知经验公式为:MATLAB软件的非线性回归分析功能介绍nlintool(X,y,model,beta)以M-文件形式建立模型模型中未知参数向量例2:某物质的化学反应问题假设与建模二一般非线性回归模型建立与步骤 建立M-函数文件(huaxue1.m);执行(huaxue2.m)nlinfit(X,y,huaxue1,beta)nlintool(X,y,huaxue1,beta,0.02)要辩识的参数例2:某物质的化学反应问题返回
限制150内