多元回归分析精选PPT.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《多元回归分析精选PPT.ppt》由会员分享,可在线阅读,更多相关《多元回归分析精选PPT.ppt(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于多元回归分析第1页,讲稿共78张,创作于星期日一元线性回归模型复习一元线性回归模型复习一个自变量X与一个因变量Y作散点图模型形式 Y=0+1X+回归直线模型的F检验,T检验,(P值相同,作用等价)R2决定系数-相关系数第2页,讲稿共78张,创作于星期日房屋售价房价房价Y,受面积,受面积X1影响影响,还有影响因素吗?受地域x2(市中心与否),结构x3影响(高层与砖混)第3页,讲稿共78张,创作于星期日汽车销售汽车销售若公司管理人员要预测来年该公若公司管理人员要预测来年该公司的汽车销售额司的汽车销售额y时,影响销售时,影响销售额的因素额的因素-广告宣传费广告宣传费x1还有个人可还有个人可支配收
2、入支配收入x2,价格价格x3第4页,讲稿共78张,创作于星期日研究地区经济增长GDP,受劳动力投入人数x1影响!还有:资本要素,科技水还有:资本要素,科技水平的影响平的影响 第5页,讲稿共78张,创作于星期日多元回归应用例:财政收入y为因变量。自变量如下:x1工业总产值,x2农业总产值,x3建筑业总产值,x4人口数,x5社会商品零售总额。例:股票价格Y,自变量为每股收益X1,每股帐面价值X2。例:失业的时间长度Y(月),自变量有学历x1,年龄x2,工龄X3.第6页,讲稿共78张,创作于星期日多元回归模型(multiple regression model)描述因变量 y 依赖于自变量 x1,x
3、2,xk 和误差项 的方程,称为多元回归模型 0 0,1 1,2 2 ,k k是参数是参数 是被称为误差项的随机变量是被称为误差项的随机变量 包含在包含在y y里面但不能被里面但不能被k k个自变量的线性关系所解释的变异性个自变量的线性关系所解释的变异性第7页,讲稿共78张,创作于星期日地区地区GDPGDP就业人员就业人员(万人)(万人)投资投资(亿元亿元)北北 京京 3663.10858.62169.26 天天 津津 2447.66419.71039.39 河河 北北 7098.563389.52477.98 山山 西西 2456.591469.51100.86 内蒙古内蒙古 2150.41
4、1005.21174.66 辽辽 宁宁 6002.541861.32076.36 吉 林 2522.621044.6969.03 黑龙江 4430.001622.41166.18 多元回归样本数据多元回归样本数据第8页,讲稿共78张,创作于星期日多元多元回归模型回归模型模型矩阵表示模型矩阵表示第9页,讲稿共78张,创作于星期日多元回归模型基本假定多元回归模型基本假定1.误差项是一个期望值为0的随机变量,即E()=02.对于自变量x1,x2,xk的所有值,的方差 2都相同3.误差项是一个服从正态分布的随机变量,即N(0,2),且相互独立第10页,讲稿共78张,创作于星期日多多元线性回归方程元线性
5、回归方程的形式为 E(y)=0+1 x1+2 x2+k xk描述因变量 y 的平平均均值值或或期期望望值值如何依赖于自变量 x1,x2,xk的方程偏回归系数i表示假定其他变量不变,当 xi 每变动一个单位时,y 的平均变动值第11页,讲稿共78张,创作于星期日YX1X2Slope for variable X1Slope for variable X2多元回归方程几何意义Multiple Regression Equation第12页,讲稿共78张,创作于星期日最小二乘估计 最小 SSE:第13页,讲稿共78张,创作于星期日第14页,讲稿共78张,创作于星期日YX1X2Yi Yix2ix1i
6、The best fit equation,Y,is found by minimizing the sum of squared errors,e2 样本观测回归残差示意图Residual=i =(Yi Yi)第15页,讲稿共78张,创作于星期日普通最小二乘估计普通最小二乘估计对于随机抽取的n组观测值如果样本函数的参数估计值已经得到,则有:i=1,2n根据最小二乘原理,参数估计值应该是下列方程组的解 其中第16页,讲稿共78张,创作于星期日于是得到关于待估参数估计值的正规方程组:第17页,讲稿共78张,创作于星期日正规方程组的矩阵形式即由于XX满秩,故有 第18页,讲稿共78张,创作于星期日
7、多元回归方程模型系数由样本数据估计得到估计值估计值Estimated(orpredicted)valueofY斜率斜率Estimatedslopecoefficients截距截距Estimatedintercept用 Excel 计算得到回归系数第19页,讲稿共78张,创作于星期日馅饼Pie销售量sale,受价格price的影响。还受广告费Advertising 的影响第20页,讲稿共78张,创作于星期日馅饼销售Sales=0+1(Price)+2(Advertising)星期销售价格广告费WeekPieSalesPrice($)Advertising($100s)13505.503.3246
8、07.503.333508.003.044308.004.553506.803.063807.504.074304.503.084706.403.794507.003.5104905.004.0113407.203.5123007.903.2134405.904.0144505.003.5153007.002.7Multiple regression equation:第21页,讲稿共78张,创作于星期日多元回归结果RegressionStatisticsMultipleR0.72213RSquare0.52148AdjustedRSquare0.44172StandardError47.46
9、341Observations15ANOVAdfSSMSFSignificanceFRegression229460.02714730.0136.538610.01201Residual1227033.3062252.776Total1456493.333CoefficientsStandardErrortStatP-valueLower95%Upper95%Intercept306.52619114.253892.682850.0199357.58835555.46404Price-24.9750910.83213-2.305650.03979-48.57626-1.37392Adverti
10、sing74.1309625.967322.854780.0144917.55303130.70888第22页,讲稿共78张,创作于星期日多元回归方程b1=-24.975:表明每表明每周销售量将减少,价周销售量将减少,价格增加美元,销售格增加美元,销售量平均减少量平均减少24.975个,(假设广告的效个,(假设广告的效果不变)果不变)b2=74.131:表明销售表明销售量增加,广告费增量增加,广告费增加美元,销加美元,销售平均增加售平均增加74.131个周个周,(假设价格(假设价格不变)不变)第23页,讲稿共78张,创作于星期日用模型预测预测价格为$5.50,广告费为$350:预测销量为 42
11、8.62 pies注意:单位百元,$350 意味 X2=3.5第24页,讲稿共78张,创作于星期日模型的检验模型的检验系数的检验系数的检验拟合度检验决定系数拟合度检验决定系数第25页,讲稿共78张,创作于星期日误差平方和的分解误差平方和的分解SST=SSR+SSE总平方和总平方和总平方和总平方和(SSTSST)回归平方和回归平方和回归平方和回归平方和(SSRSSR)残差平方和残差平方和残差平方和残差平方和(SSESSE)越小越好越大越好反映自变量反映自变量 xi xi 的变化对因的变化对因变量变量 y y 取值变化的影响,取值变化的影响,假设不变反映除反映除 x ix i以外的其以外的其他因素
12、对他因素对 y y 取值的取值的影响影响第26页,讲稿共78张,创作于星期日多重判定系数-可决系数-拟合优度(multiple coefficient of determination)1.回归平方和占总平方和的比例2.计算公式为3.因变量取值的变差中,能被多元回归方程所解释的比例 第27页,讲稿共78张,创作于星期日RegressionStatisticsMultipleR0.72213RSquare0.52148AdjustedRSquare0.44172StandardError47.46341Observations15ANOVAdfSSMSFSignificanceFRegressi
13、on229460.02714730.036.538610.01201Residual1227033.3062252.776Total1456493.333CoefficientsStandardErrortStatP-valueLower95%Upper95%Intercept306.52619114.253892.682850.0199357.58835555.46404Price-24.9750910.83213-2.305650.03979-48.57626-1.37392Advertising74.1309625.967322.854780.0144917.55303130.70888
14、销量变化的销量变化的52.1%,由价格和广告因素解,由价格和广告因素解释释决定系数第28页,讲稿共78张,创作于星期日随着自变量个数的不断增加,会使得R2不断增加,因此在作拟合优度检验的判定时,一般采用调整的R2,以消除自变量的个数以及样本量的大小对R2的影响。第29页,讲稿共78张,创作于星期日修正多重判定系数修正多重判定系数(adjusted multiple coefficient of determination)1.为避免增加自变量而高估 R2,需要用样本量n和自变量的个数k去修正R2得到 计算公式为意义与 R2类似,数值小于R2目的是惩罚过多使用不重要的自变量目的是惩罚过多使用不重
15、要的自变量。用于比较多个模型用于比较多个模型第30页,讲稿共78张,创作于星期日RegressionStatisticsMultipleR0.72213RSquare0.52148AdjustedRSquare0.44172StandardError47.46341Observations15ANOVAdfSSMSFSignificanceFRegression229460.02714730.0136.538610.01201Residual1227033.3062252.776Total1456493.333CoefficientsStandardErrortStatP-valueLower
16、95%Upper95%Intercept306.52619114.253892.682850.0199357.58835555.46404Price-24.9750910.83213-2.305650.03979-48.57626-1.37392Advertising74.1309625.967322.854780.0144917.55303130.70888销量变化的销量变化的44.2%由价格和广告解释。由价格和广告解释。Adjusted r2第31页,讲稿共78张,创作于星期日回归方程显著性F检验1.提出假设H0:12k=0 线性关系不显著H1:1,2,k至少有一个不等于02 2.计算检验
17、统计量F3.分子自由度k、分母自由度n-k-1得出统计量F,得到检验值4.作出决策:确定显著性水平和比较,P 拒绝H0利用F统计量进行总体线性显著性检验第32页,讲稿共78张,创作于星期日RegressionStatisticsMultipleR0.72213RSquare0.52148AdjustedRSquare0.44172StandardError47.46341Observations15ANOVAdfSSMSFSignificanceFRegression229460.02714730.016.53860.01201Residual1227033.3062252.776Total1
18、456493.333CoefficientsStandardErrortStatP-valueLower95%Upper95%Intercept306.52619114.253892.682850.019957.58835555.46404Price-24.9750910.83213-2.305650.039-48.576-1.3739Advertising74.1309625.967322.854780.014917.553130.70888总体线性显著性检验F Test for Overall SignificanceP-valuefortheFTest第33页,讲稿共78张,创作于星期日
19、H0:1=2=0H1:1 和 2 不全为=.05df1=2 df2=12 检验统计量检验统计量:判定判定:结论结论:因为统计量在拒绝域(p-value .05),拒绝 H0结果说明至少有一个自变量影响结果说明至少有一个自变量影响0=.05F.05=3.885拒绝H0不能拒绝 H0临界值临界值:F=3.885F F 检验意义检验意义F第34页,讲稿共78张,创作于星期日检验的值计算F检验临界值第35页,讲稿共78张,创作于星期日单个自变量回归系数的检验1.提出假设H0:i=0 (自变量 xi 与 因变量 y 没有线性关系)H1:i 0 (自变量 xi 与 因变量 y有线性关系)2.计算检验的统计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 回归 分析 精选 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内