线性回归分析案例分析.pdf
128.05.20071Corporate Communication相关分析案例相关分析案例Justin Tao陶维胜陶维胜28.05.20072Corporate Communication散布图练习?某建筑公司想了解位于某街区的住宅地产的销售价格y与总评估价x之间的相关程度到底有多大?于是从该街区去年售出的住宅中随机抽10所住宅房作样本,分别的总评估价和销售资料如右表95,00079,7601156,900110,6553110,110100,8615170,400139,8508100,000105,2306y美元X美元房产111,00096,8594211,500170,3419116,50098,4802185,000155,1371094,798总评估价130,0007销售价格28.05.20073Corporate Communication绘制散布图,观察其相关关系?输入数据?点击GraphScatterPlot?弹出对话框,依次对应X、Y输入变量列?点击OK28.05.20074Corporate Communication散布图及关系分析?从散布图可以看出:总评估价值X与销售价格Y存在线性正相关,相关程度较大;随X增大,Y有增长趋势28.05.20075Corporate Communication计算相关系数?输入数据?点击StatBasic StatisticsCorrelation?弹出对话框,输入X、Y变量列?点击OK得出相关系数及检验p值28.05.20076Corporate Communication散布图(相关分析)案例?下面是表示某公司广告费用和销售额之间关系的资料。试求这家公司的广告费和销售额的相关系数2510186231215822910617720209销售额(100万)984广告费(10万)228.05.20077Corporate Communication散布图及关系分析28.05.20078Corporate Communication计算相关系数?相关系数相关系数r=0.853,有正相关关系,有正相关关系,p=0.002RegressionRegression?弹出对话框,依次选择输出变量列、选择输入变量列?点击OK28.05.200711Corporate Communication回归分析选择输出变量列选择输入变量列28.05.200712Corporate Communication回归分析?Regression Regression-Graphs:Graphs:选择为帮助最佳回归模型分选择为帮助最佳回归模型分选择为帮助最佳回归模型分选择为帮助最佳回归模型分析的残差析的残差析的残差析的残差 Plot 的形态的形态选择显示在残差选择显示在残差Graph的残差形态的残差形态选择显示在残差选择显示在残差Graph的残差形态的残差形态Residual PlotsResidual Plots328.05.200713Corporate Communication回归分析?Regression Regression-Options:Options:可以选择加重值列,预测新可以选择加重值列,预测新的观测值确认信赖区间的观测值确认信赖区间输入所需的输入所需的x 值,通过得出的回归方程式可以求值和信赖区间输入值,通过得出的回归方程式可以求值和信赖区间输入10,能计算出,能计算出10年后的设备费用年后的设备费用(预测值预测值)输入所需的输入所需的x 值,通过得出的回归方程式可以求值和信赖区间输入值,通过得出的回归方程式可以求值和信赖区间输入10,能计算出,能计算出10年后的年后的设备设备费用费用(预测值预测值)y 28.05.200714Corporate Communication回归分析回归分析 StorageStorage:选择从选择从Work sheet 的输入变量和输出变量列的下一个列开始被的输入变量和输出变量列的下一个列开始被Check的项目的项目28.05.200715Corporate Communication回归分析回归分析 ResultsResults:调整对显示在调整对显示在Window Section的回归模型的分析结果范围。的回归模型的分析结果范围。28.05.200716Corporate Communication设备费用和使用年限的回归方程式是设备费用和使用年限的回归方程式是设备费用和使用年限的回归方程式是设备费用和使用年限的回归方程式是决定系数R-Sq 值为61%,在全体变动中按回归直线说明的变动是61%.决定系数R-Sq 值为61%,在全体变动中按回归直线说明的变动是61%.决定系数R-Sq 值为61%,在全体变动中按回归直线说明的变动是61%.决定系数R-Sq 值为61%,在全体变动中按回归直线说明的变动是61%.使用年限10年的机械的设备费用期待值是165.48,对其的95%信赖区间是(123.66,207.29).使用年限10年的机械的设备费用期待值是165.48,对其的95%信赖区间是(123.66,207.29).使用年限10年的机械的设备费用期待值是165.48,对其的95%信赖区间是(123.66,207.29).回归分析使用年限10年的机械的设备费用期待值是165.48,对其的95%信赖区间是(123.66,207.29).回归分析xy6.131.29+=p 值为0.001小于留意水准0.05,所以认为上面的回归式有意义p 值为0.001小于留意水准0.05,所以认为上面的回归式有意义p 值为0.001小于留意水准0.05,所以认为上面的回归式有意义p 值为0.001小于留意水准0.05,所以认为上面的回归式有意义28.05.200717Corporate Communication回归分析回归分析 Fitted Line Plot:欲用欲用Graph分析时活用分析时活用。Stat Regression Fitted Line Plot28.05.200718Corporate Communication回归分析回归分析 Graph 结果确认结果确认428.05.200719Corporate Communication残差分析(同上例)?输入数据?点击StatRegressionRegression?弹出对话框,依次选择输出变量列、选择输入变量列?点击Storage,选择残差Residuals 和 Fits?点击OK28.05.200720Corporate Communication残差分析Step 1Work sheet 里输入里输入DATA28.05.200721Corporate CommunicationStep 2Stat Regression Regression 选择从属变量列选择从属变量列选择从属变量列选择从属变量列选择独立变量列选择独立变量列选择独立变量列选择独立变量列残差分析残差分析 StorageStorageFits(适合值)CheckFits(适合值)CheckFits(适合值)CheckFits(适合值)CheckResiduals(残差)CheckResiduals(残差)CheckResiduals(残差)CheckResiduals(残差)Check28.05.200722Corporate CommunicationStep 3Work sheet 结果确认结果确认残差和适合值被储存。残差和适合值被储存。残差和适合值被储存。残差和适合值被储存。Step 4Stat Regression Residual Plots选择适合值列选择适合值列选择适合值列选择适合值列选择残差列选择残差列选择残差列选择残差列残差分析残差分析28.05.200723Corporate CommunicationStep 5确认确认Graph残差分析残差分析28.05.200724Corporate Communication残差分析之结果分析?通过Normal Plot of Residuals 数据分布接近于对角线,所以可以说残差的分布接近于正态分布。(通过Stat Basic Statistics Normality Test 更仔细地做到正规性检定)?在I Chart of Residuals中不离开管理限界线,因不具有任何Perform,所以可以说残差的分布是稳定的。?Histogram of Residuals 是表示残差形态的Graph?Residuals vs.Fits 是残差对适合值的Graph,在0近处任意地分布。?因此,可以说回归模型是适合的。528.05.200725Corporate Communication一元线性回归练习?案例:下表是检查人的记忆力x 和判断力y的数据 记忆力 x 11 10 14 18 10 6 12 8 15 16 判断力 y 6 4 6 9 2 3 3 9 6 7?要求:按以下顺序分析数据:?记述X变量和Y变量之间的关系。(例:X减少时,Y增加)?解释残差:(残差Histogram 和正态性的点)?a)残差随正态性分布吗?b)在正态性检定中 P-Value为多少?