第十二章回归分析.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第十二章回归分析.pptx》由会员分享,可在线阅读,更多相关《第十二章回归分析.pptx(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1一.回归分析将将存存在在相相关关的的两两个个变变量量,一一个个作作为为自自变变量量,另另一一个个作作为为因因变变量量,并并把把二二者者之之间间不不十十分分准准确确、稳稳定定的的关关系系,用用数数学学方方程程式式来来表表达达,则则可可利利用用该该方方程程由由自自变变量量的的值值来来估估计计、预预测测因因变量的估计值,这一过程称为变量的估计值,这一过程称为回归分析回归分析 。回回归归表表示示一一个个变变量量随随另另一一个个变变量量作作不不同同程程度度变化的单向关系。变化的单向关系。第1页/共80页2回归与相关的比较回归与相关的比较相关与回归是从不同角度对变量间关相关与回归是从不同角度对变量间关系
2、的分析:系的分析:相关关系相关关系是两个变量之间的是两个变量之间的双双向关系向关系,没有主从之分;而,没有主从之分;而回归关系回归关系是两是两个变量之间的个变量之间的单向关系单向关系,是自变量对因变,是自变量对因变量的影响关系。相关关系用量的影响关系。相关关系用相关系数相关系数来表来表示,而回归关系用示,而回归关系用数学模型数学模型来表示,这种来表示,这种数学模型称为回归方程(数学模型称为回归方程(regression regression equationequation)。第2页/共80页3回归与相关的选择回归与相关的选择当旨在分析变量之间关系的密切程度当旨在分析变量之间关系的密切程度时,
3、一般使用相关系数,时,一般使用相关系数,选择相关分析。选择相关分析。当研究的目的是确定变量之间数量关当研究的目的是确定变量之间数量关系的可能形式,找出表达它们之间依存关系的可能形式,找出表达它们之间依存关系的合适的数学模型,并用这个数学模型系的合适的数学模型,并用这个数学模型表示这种关系形式,则表示这种关系形式,则选择回归分析。选择回归分析。这这个用来表达变量之间规律的数学模型就称个用来表达变量之间规律的数学模型就称为为回归模型。回归模型。第3页/共80页4二一元线性回归方程的建立1 1回归分析的类别回归分析的类别 线性回归分析、非线性回归分析。根据自变量个数的多少,可分为:一元回归分析、多元
4、回归分析。一元回归分析、多元回归分析。第4页/共80页5二一元线性回归方程的建立2 2一元线性回归概念一元线性回归概念 线性回归(linear regression):自变量与因变量之间呈线性关系(linear relationship)的回归关系。一元线性回归一元线性回归是指只有一个自变量一个自变量的线性回归。又称为简单线性回归(simple linear regression)。第5页/共80页63 3一元线性回归方程的通一元线性回归方程的通式式式中:a 为直线在Y轴上的截距;b 为回归系数(也是回归直线的斜率)称为对应于X的Y变量的估计值。(公式12-1)第6页/共80页74 4一元线性
5、回归方程的建一元线性回归方程的建立立建立回归方程的步骤一般包括建立回归方程的步骤一般包括:根据数据资料作散点图,判断直线关系;选定计算回归系数的方法(平均数法和最小二乘法)并计算回归系数b和直线的截距a。将b和a代入直线方程的通式,得到回归方程。第7页/共80页8拟合直线拟合直线第8页/共80页9最小二乘法求回归系数最小二乘法求回归系数(method of least squaresmethod of least squares)常用的拟合这条回归线的原则,就是使各点与该线纵向距离的平方和平方和最小小,也就是使误差的平方和最小。这种求回归系数的方法称为最小二乘法最小二乘法。最小二乘法得到的是可
6、能的各条直线中拟合最好的一条。第9页/共80页10(xi,yi)第10页/共80页11图12-2-1 回归直线示意图(X,Y)YXO(X,)ah第11页/共80页12图12-2-2 回归直线示意图(X,Y)YXO(X,)h第12页/共80页13图中,Y与 的离差(残差)有大,有小,有正,有负,其总和为零。因此,在考虑最小总距离时需将残差值平方,取其平方和为最小值时的方程为回归方程。(12-2)第13页/共80页14分别对上式中a与b求偏导,经整理可得到回归系数的计算公式为(12-8)第14页/共80页15求直线的截距求直线的截距由回归系数公式的计算中可得(12-7)另一组计算公式为:第15页/
7、共80页16表表12-1 1012-1 10个学生初一与初二数学成绩回归系数计算表个学生初一与初二数学成绩回归系数计算表序号序号X XY Y1 174747676 3 3 3.7 3.711.111.1 9 9 13.69 13.692 271717575 0 0 2.7 2.70 0 0 0 7.29 7.293 372727171 1 1-1.3-1.3-1.3-1.3 1 1 1.69 1.694 468687070-3-3-2.3-2.3 6.9 6.9 9 9 5.29 5.295 576767676 5 5 3.7 3.718.518.52525 13.69 13.696 6737
8、37979 2 2 6.7 6.713.413.4 4 4 44.89 44.897 767676565-4-4-7.3-7.329.229.21616 53.29 53.298 870707777-1-1 4.7 4.7-4.7-4.7 1 1 22.09 22.099 954546262-6-6-10.3-10.361.861.83636106.09106.09101074747272 3 3-0.3-0.3-0.9-0.9 9 9 0.09 0.09合计合计710710723723134134110110268.10268.10第16页/共80页17回归方程为第17页/共80页18回归方
9、程为第18页/共80页19原始数据计算回归系数公式原始数据计算回归系数公式第19页/共80页20(12-9)5、回归系数与相关系数的关系Y Y对对X X的回归系数为:的回归系数为:X X对对Y Y的回归系数为:的回归系数为:(12-10)Y Y对对X X的回归方程为:的回归方程为:(12-11)综合综合12-912-9、12-1012-10有:有:(12-12)第20页/共80页215、回归系数与相关系数的关系 从从12-1212-12中看出,相关系数是两个回归系数的几何平均。中看出,相关系数是两个回归系数的几何平均。在进行回归分析时,由于目的在于用某一变量去预测另一变量的变化情形,往在进行回
10、归分析时,由于目的在于用某一变量去预测另一变量的变化情形,往往是单向地分析两变量的变化关系,即找出一个变量随另一个变量的变化而变化的往是单向地分析两变量的变化关系,即找出一个变量随另一个变量的变化而变化的关系,关系,X X与与Y Y两个变量各有其作用。两个变量各有其作用。第21页/共80页225、回归系数与相关系数的关系 在回归系数的计算中,反映当X X变化时Y Y的变化率,反映当Y Y变化时X X的变化率,因此它们分别用X XYY和 Y YXX表示,是一种不对称设计。在计算相关系数时,考虑的是两个变量的变化情况,相关表示两方面的平均关系,属于对称性设计,因此相关分析是双向的,不强调哪个是自变
11、量哪个是因变量,以Y Y X X表示。第22页/共80页23表表12-2 1012-2 10个学生初一与初二数学成绩回归系数计算表个学生初一与初二数学成绩回归系数计算表序号序号X XY YXYXY1 1747476765476547657765776562456242 2717175758041804156265626532553253 3727271715184518450415041511251124 4686870704624462449004900476047605 5767676765776577657765776577657766 6737379795329532962416241
12、576757677 7676765654489448942254225435543558 8707077774900490059295929539053909 954546262422542253844384440304030101074747272547654765184518453285328合计合计710710723723505205052052541525415146751467第23页/共80页24由估计的方程为:由估计的方程为:第24页/共80页25图12-2-3 学生初一与初二数学成绩的两条回归线第25页/共80页26三线性回归的基本假设 1 1两变量呈线性关系两变量呈线性关系
13、2 2因变量的分布为正因变量的分布为正态态 3 3独立性假设独立性假设 4 4方差齐性假设(即误方差齐性假设(即误差差 的等分散性)的等分散性)图12-3 回归样本示意图第26页/共80页27四.一元线性回归方程的检验1一元线性回归方程的检验的意义根据样本数据计算出的回归方程可能有一定的抽样误差。为了考查这两个变量在总体内是否存在线性关系,以及回归方程对估计预测因变量的有效性如何,在回归方程应用之前,首先应进行显著性检验。第27页/共80页282 2一元线性回归方程显著性检验的方一元线性回归方程显著性检验的方法法 有三种等效的方法 对回归方程回归方程进行方差分析 对两个变量的相相关关系系数数进
14、行总体零相关的显著性检验 对回归系数回归系数进行显著性检验 第28页/共80页293 3一元线性回归方程的方差分析一元线性回归方程的方差分析 变异的分解变异的分解 任意一点Y到其平均值 的距离都可分为两部分:如果各点都很接近回归线,则各点的如果各点都很接近回归线,则各点的Y值到其平值到其平均值的离差中大部分是由回归部分的差异造成的,均值的离差中大部分是由回归部分的差异造成的,这种情况说明回归误差小,回归的效率较高。这种情况说明回归误差小,回归的效率较高。12-13第29页/共80页30图12-2-2 回归直线示意图(X,)(X,Y)YXO第30页/共80页31分解平方和分解平方和 即:SST=
15、SSR+SSE 总平方和=回归平方和+残差平方和将12-13等式两边平方,并对所有的点求和:(12-14)第31页/共80页32分解自由度分解自由度 dfn1对于所有Y值而言,自由度为 n1。dfn2在误差平方和的计算中,由于用到平均值和回归系数,因此失去两个自由度。dfRdfTdfE1 第32页/共80页33计算方差计算方差回归方差残差方差残差方差计算计算F F值值第33页/共80页34(5 5)说明)说明如果 显著大于 ,则说明总变异中回归的贡献显著,即X与Y的线性关系显著(或称回归方程显著)。表明回归方程在整体上成立,进一步检验了变量X与Y之间是否存在线性关系。第34页/共80页35列回
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十二 章回 分析
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内