一元回归分析(第1讲)课件.ppt
《一元回归分析(第1讲)课件.ppt》由会员分享,可在线阅读,更多相关《一元回归分析(第1讲)课件.ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一元回归分析一元回归分析 上海上海*通信技术有限公司通信技术有限公司 Mr Jim()Mr Jim()2012-12 2012-12培训大纲培训大纲一、一、基础知识基础知识二、一元线性回归模型二、一元线性回归模型三、拟合优度检验三、拟合优度检验四、四、F F检验检验/t/t检验检验/相关系数检验相关系数检验五、预测和控制五、预测和控制六、六、SASSAS示例示例回归分析的相关背景1、回归分析的由来:英国统计学家高尔顿F.GALTON(1822-1911)和其学生皮尔逊K.Pearson(1856-1936)观察了1078对夫妇,以每对夫妇的平均身高为X,而取他们成年的儿子的身高为Y,得到如下经
2、验方程:Y=33.73+0.516X2、自1969年设立诺贝尔经济学奖以来,已有42名学者获奖,而其中有2/3的人是统计学家、计量经济学家、数学家。由获奖者克莱因发起的国际连接系统使用了7447个方程和3368个外生变量。英国剑桥大学的多部门动态模型有2759个方程和7484个变量。回归分析的相关背景3、回归分析的几个发展方向:1)、统计学的重要方法与回归的关系密切时间序列分析(BOX-JINKINS)、判别分析、主成分分析、因子分析、典型相关分析2)、回归分析自身的完善和发展自变量选择、稳健回归、回归诊断、投影寻踪、非参数回归3)、新的研究方法为回归分析提供了方法论非参数统计、自助法、刀切法
3、、经验贝叶斯估计4)、各种有偏估计出现:岭估计、压缩估计、主成分估计、STEN估计、特征根估计、偏最小二乘估计。术语术语OLSE:ordinaryleastsquareestimation普通最小二乘估计MLE:maximumlikelihoodestimation极大似然估计培训大纲培训大纲一、基础知识一、基础知识二、二、一元线性回归模型一元线性回归模型三、拟合优度检验三、拟合优度检验四、四、F F检验检验/t/t检验检验/相关系数检验相关系数检验五、预测和控制五、预测和控制六、六、SASSAS示例示例估计估计 估计的基本含义:使用已经收集的数据集,计算变量如何相关,接着使用相关系数以及X的
4、信息来估计Y。回归分析:回归分析:通过数学模型,研究一现象(变量)对其他现象(变量)依赖关系的具体形态的方法论 注意:回归分析研究一个变量对另一个(些)变量的统计依赖关系,但它们并不意味着一定有因果关系。回归分析回归分析回归分析回归分析回归分析的变量回归分析的变量l因变量因变量l自变量自变量因变量必须是间距测度等级以上的变量(连续变量)自变量可以是间距测度等级以上的变量(连续变量)、也可以是名义测度等级的变量(分类变量)。注意:注意:回归分析对变量的处理方法存在不对称性,即区分应变量回归分析对变量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量)。(被解释变量)和自变量(解
5、释变量)。一元线性回归模型一元线性回归模型回归模型建立的步骤回归模型建立的步骤l一般先做散点图,以便进行简单地观测l若散点图的趋势大概呈线性关系,可以建立线性方程,若不呈线性分布,可建立其它方程模型(曲线估计)!只有对有因果关系的变量,才更多地只有对有因果关系的变量,才更多地 做回归分析做回归分析一元线性回归分析模型1、一元线性回归模型的数学形式:1)、理论模型:2)、样本回归模型对于n组观测值有:3)、模型的矩阵表达:一元线性回归模型一元线性回归模型一元线性回归模型一元线性回归模型 只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示 式中:a和b为待定参数;为各组观测数据的下标;
6、为随机变量。一元线性回归模型参数的估计一元线性回归模型参数的估计 最小二乘法最小二乘法的基本思想:的基本思想:让所寻找的样本回归函数(线)上的点尽可能地接近实际观测点,即样本回归线上的点与实际观测点的离差平方和最小。回归分析的参数估计(OLSE)OrdinaryLeastSquareEstimation:对于已知n组观测值有:回归分析的参数估计(OLSE)回归分析的参数估计(OLSE)由此得回归方程:关于系数的几种表达方式OLSE的性质1、线性:2、无偏性3、参数的方差:4、协方差上面的公式表明,参数的准确性除受总体的差异外,还受X值的范围影响,X取值范围越大,参数就越稳定一元线性回归模型一元
7、线性回归模型一元线性回归模型的检验一元线性回归模型的检验 线性回归模型的检验分二大类:统计检验计量经济检验从统计学的角度检验所估计的样本回归函数的有效性从基本假设是否成立这一角度检验最小二乘估计法的适用性及其改进拟合优度检验显著性检验检验对各回归系数的检验对整个回归方程的检验回归方程的检验在得到回归方程后,必须运用统计检验方法分析该方程是否真正描述了Y与X之间的统计规律之后,才能进行分析预测等各种运用,检验的基本假设前提是:培训大纲培训大纲一、基础知识一、基础知识二、一元线性回归模型二、一元线性回归模型三、三、拟合优度检验拟合优度检验四、四、F F检验检验/t/t检验检验/相关系数检验相关系数
8、检验五、预测和控制五、预测和控制六、六、SASSAS示例示例一元线性回归模型一元线性回归模型1.1.拟合优度检验拟合优度检验是通过对是通过对YtYt的样本点距其样本均值的离差平方和的分解来进行的。的样本点距其样本均值的离差平方和的分解来进行的。对对全部样本点全部样本点来说,可以证明:来说,可以证明:总离差平方和SST回归平方和SSR残差平方和SSE来自样本回归线来自残差回归线上的点与样本均值离差的平方和实际观测点与回归线上的点的离差的平方和一元线性回归模型一元线性回归模型决定系数(coefficient of determination)取值范围:0,1,越接近1,说明实际观测点离样本线越近,
9、拟合优度越高。r2高并不表示模型选择正确。可决系数定义为:可决系数定义为:很显然,可决系数越大,方程的拟合度就越高。很显然,可决系数越大,方程的拟合度就越高。Adjusted R Square 为校正为校正 ,未校正时未校正时,是拟合度的不理是拟合度的不理想指标想指标,Adj R-Sq可以克服这一缺点。当模型中包括适当的变量集可以克服这一缺点。当模型中包括适当的变量集时,时,Adj R-sq趋向稳定于某一数值。对抽样数据更适用,而不适趋向稳定于某一数值。对抽样数据更适用,而不适合总体数据。合总体数据。可决系数的特性:1、具有非负性2、取值范围为:0,13、可决系数是样本观测值的函数决定系数的含
10、义回归方程的拟合优度检验1、检验公式:2、基本意义:表现回归方程总平方和中能够为回归平方和解释部分的比重,该值越大则拟合优度越好。但是,当观测样本量很大时,高度显著的检验结果也不能肯定自变量与因变量之间的关系就是线性的,产生这种结果的原因有:X与Y存在的关系不是线性关系而是非线性的。X与Y的线性相关关系确立,但是误差项方差太大,导致样本决定系数很小。培训大纲培训大纲一、基础知识一、基础知识二、一元线性回归模型二、一元线性回归模型三、拟合优度检验三、拟合优度检验四、四、F F检验检验/t/t检验检验/相关系数检验相关系数检验五、预测和控制五、预测和控制六、六、SASSAS示例示例一元线性回归模型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一元 回归 分析 课件
限制150内