第四讲简单线性相关与回归精选文档.ppt
第四讲简单线性相关与回归本讲稿第一页,共三十六页本讲主题简单线性回归模型The Simple Linear Regression Model最小二乘法The Least Squares Method确定性系数The Coefficient of Determination模型假设及显著性检验Model Assumptions and Testing for Significance用于估计和预测Using for estimation and Prediction残差分析Residual Analysis本讲稿第二页,共三十六页现象之间的关系变量之间的关系函数关系:变量之间存在着确定的相互依存关系。当自变量取定一个值,因变量就有一个完全确定的量与之相对应。相关关系:变量之间存在着的数量上的不确定的依存关系。相关关系包括因果关系本讲稿第三页,共三十六页例:居民收入提高与银行存款上升;工资增长与价格增长;父母身高与子女身高;哥哥身高与弟弟身高;电话设备投资额与新建筑数量;产量与单位成本;受教育年限与工资;某种商品的价格与销售量。家庭收入与食物支出额本讲稿第四页,共三十六页相关关系的种类简单相关与复相关正相关与负相关线性相关与非线性相关完全相关,不完全相关,不相关本讲稿第五页,共三十六页相关关系的表示法散点图相关分析表相关变量的二元分布相关系数本讲稿第六页,共三十六页相关分析表 本讲稿第七页,共三十六页相关系数相关系数:是衡量变量之间线性相关密切程度的一个系数。式中:XY:X与Y的协方差;X-变量X的标准差;Y-变量Y的标准差。相关系数是将协方差进行标准化处理的结果。本讲稿第九页,共三十六页相关系数的意义-1 r 1 它是一个系数,不受变量值水平和计量单位的影响。r0,正相关。散点较为密集地分布在第I和第III象限。r0,正相关b t/2 ,拒绝H0,回归系数等于0的概率小于,可得出回归系数不等于0的结论。本讲稿第二十八页,共三十六页 4、回归方程的显著性检验由方差分析的原理我们知道,如果回归变差显著地大于剩余变差,则回归方程的回归效果是显著的。可以用F检验,根据给定的显著性水平,和两个自由度,查F分布表,得到临界值F,若F F ,拒绝H0,回归方程是显著的。本讲稿第二十九页,共三十六页回归分析应注意的问题因果关系r2=0.8,并不能说明Y的变动中有80%是由X引起的,X与Y之间的高度相关可能是第三个原因引起的。因此,我们只能说,Y的变动中有80%可由X的变动来解释。数据范围以外的外推估计方程是以一组特定观测值为基础的。如果发根据观测数据范围以外的某些自变量的值来推算应变量的值,那就必须十分谨慎。因为在缺少其他信息的情况下,我们根本不知道在观察数据范围以外,该估计方程的函数形式是否还同样有效。本讲稿第三十五页,共三十六页The endThank you very much本讲稿第三十六页,共三十六页