实用多元统计分析法讲稿.ppt
《实用多元统计分析法讲稿.ppt》由会员分享,可在线阅读,更多相关《实用多元统计分析法讲稿.ppt(87页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一页,讲稿共八十七页哦 本章学习要点:本章学习要点:本章主要介绍相关分析和回归分析的概念本章主要介绍相关分析和回归分析的概念 种种类和相互关系类和相互关系,重点是要掌握回归分析的原理与方重点是要掌握回归分析的原理与方法、步骤,特别是能从实际出发解决一元线性回法、步骤,特别是能从实际出发解决一元线性回归的预测问题。归的预测问题。第二页,讲稿共八十七页哦13.1 相关分析和回归分析相关分析和回归分析 当一个或几个变量取一定的值时,另一个变量有当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,这种关系为确定性的函数关系。确定值与之相对应,这种关系为确定性的函数关系。如某种商品的销售收入如
2、某种商品的销售收入Y Y与该商品的销售量与该商品的销售量X X以以及该商品价格及该商品价格P P之间的关系可以表示为之间的关系可以表示为Y=PXY=PX,这就,这就是一种函数关系。是一种函数关系。一般把作为影响因素的变量称为自变量;把发生一般把作为影响因素的变量称为自变量;把发生对应变化的变量称为因变量。对应变化的变量称为因变量。Y Y是因变量,是因变量,P P与与X X是自是自变量。变量。第三页,讲稿共八十七页哦 当一个或几个相互联系的变量取一定数值时,当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一
3、定的范围内变化,变量间的这种相互某种规律在一定的范围内变化,变量间的这种相互关系,称为具有不确定性的相关关系。关系,称为具有不确定性的相关关系。如:劳动生产率与工资水平的关系、投资额与如:劳动生产率与工资水平的关系、投资额与国民收入的关系。国民收入的关系。相关关系经常用一定的函数形式去近似地描相关关系经常用一定的函数形式去近似地描述。述。相关关系相关关系第四页,讲稿共八十七页哦相关关系的特点:相关关系的特点:相关关系的特点:相关关系的特点:(1)现象之间确实存在数量上的依存关系。)现象之间确实存在数量上的依存关系。(2)现象之间数量上的依存关系不是确定的。)现象之间数量上的依存关系不是确定的。
4、相关关系与函数关系在一定的条件下是可以相互转换的。相关关系与函数关系在一定的条件下是可以相互转换的。相关关系与函数关系在一定的条件下是可以相互转换的。相关关系与函数关系在一定的条件下是可以相互转换的。(1)本来具有函数关系的变量,当在观测误差时,其函数关系往往以相关的形式表现出来。)本来具有函数关系的变量,当在观测误差时,其函数关系往往以相关的形式表现出来。(2)如果我们对所研究对象有更深入的认识,便可以将影响因素全部纳入方程,使之成为)如果我们对所研究对象有更深入的认识,便可以将影响因素全部纳入方程,使之成为函数关系。函数关系。相关关系的特点第五页,讲稿共八十七页哦相关关系的种类相关关系的种
5、类(一)(一)按相关关系涉及因素的多少可以分按相关关系涉及因素的多少可以分为单相关和复相关为单相关和复相关(二)(二)按相关的形式不同可以分为直线相关按相关的形式不同可以分为直线相关和非直线相关和非直线相关(三)(三)直线相关按其变化的方向不同可以分直线相关按其变化的方向不同可以分为正相关和负相关为正相关和负相关(四)(四)按相关的程度可分为完全相关、不完按相关的程度可分为完全相关、不完全相关和不相关全相关和不相关虚假相关虚假相关第六页,讲稿共八十七页哦种类种类1 1按变量多少划分按变量多少划分 单相关:一个变量对另一个变量的相关关系,单相关:一个变量对另一个变量的相关关系,称为单相关。称为单
6、相关。复相关:当所研究的是一个变量对两个或两复相关:当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。如个以上其他变量的相关关系时,称为复相关。如某种商品的需求与其价格水平及人们收入水平之某种商品的需求与其价格水平及人们收入水平之间的相关关系就是一种复相关。间的相关关系就是一种复相关。偏相关第七页,讲稿共八十七页哦种类种类2 2按相关形式划分按相关形式划分 线性相关:当两种相关现象之间的关系大线性相关:当两种相关现象之间的关系大致呈现为线性关系时,称之为线性相关。如人致呈现为线性关系时,称之为线性相关。如人均消费水平与人均收入水平通常呈线性关系。均消费水平与人均收入水平通常
7、呈线性关系。非线性相关:如果两种相关现象之间,并不表非线性相关:如果两种相关现象之间,并不表现为直线的关系,而是近似于某种曲线方程的关系,现为直线的关系,而是近似于某种曲线方程的关系,则这种相关关系称为非线性相关。如产品的平均成则这种相关关系称为非线性相关。如产品的平均成本与产品总产量之间的相关关系就是一种非线性关本与产品总产量之间的相关关系就是一种非线性关系。系。第八页,讲稿共八十七页哦偏相关偏相关 在某一现象与多种现象相关的场合,当假定在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量的相关关系称为其他变量不变时,其中两个变量的相关关系称为偏相关偏相关。第九页,讲稿共八十七
8、页哦种类种类3直线相关按相关方向划分直线相关按相关方向划分 正相关正相关:当一个现象的数量由小变大,另:当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称一个现象的数量也相应由小变大,这种相关称为正相关。如工人的工资随劳动生产率的提高为正相关。如工人的工资随劳动生产率的提高而增加。而增加。负相关负相关:当一个现象的数量由小变大,而:当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关另一个现象的数量相反地由大变小,这种相关称为负相关。如商品流转的规模越大,流通费称为负相关。如商品流转的规模越大,流通费用水平则越低。用水平则越低。第十页,讲稿共八十七页哦正相关正
9、相关 强正相关强正相关强正相关强正相关 弱正相关弱正相关弱正相关弱正相关第十一页,讲稿共八十七页哦负相关负相关 强负相关强负相关强负相关强负相关 弱负相关弱负相关弱负相关弱负相关第十二页,讲稿共八十七页哦种类种类4按相关程度划分按相关程度划分 完全相关完全相关:当一种现象的数量变化完全由另一:当一种现象的数量变化完全由另一个现象的数量变化所确定时,这两种现象间的关系个现象的数量变化所确定时,这两种现象间的关系为完全相关。即函数关系。为完全相关。即函数关系。不完全相关:两个现象之间的关系介于完全相不完全相关:两个现象之间的关系介于完全相关和不相关之间,称为不完全相关。关和不相关之间,称为不完全相
10、关。不相关不相关:当两个现象彼此互不影响,其数:当两个现象彼此互不影响,其数量变化各自独立时,称为不相关。如:股票价量变化各自独立时,称为不相关。如:股票价格的高低与气温的高低是不相关的。格的高低与气温的高低是不相关的。第十三页,讲稿共八十七页哦完全相关完全相关第十四页,讲稿共八十七页哦不相关不相关第十五页,讲稿共八十七页哦种类种类5按相关性质划分按相关性质划分 真实相关:当两种现象之间的相关确实具有内真实相关:当两种现象之间的相关确实具有内在的联系时,称之为在的联系时,称之为“真实相关真实相关”。虚假相关:当两种现象之间的相关只是表面存虚假相关:当两种现象之间的相关只是表面存在,实质上并没有
11、内在的联系时,称之为在,实质上并没有内在的联系时,称之为“虚假相虚假相关关”。第十六页,讲稿共八十七页哦相关图相关图3 曲线相关曲线相关曲线相关曲线相关 不相关不相关不相关不相关第十七页,讲稿共八十七页哦相关分析与回归分析相关分析与回归分析相关分析相关分析 就是用一个指标来表明现象间相互依存关系就是用一个指标来表明现象间相互依存关系的密切程度。的密切程度。回归分析回归分析 就是根据相关关系的具体形态,选择一个合适就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。的数学模型,来近似地表达变量间的平均变化关系。区别第十八页,讲稿共八十七页哦区别 相关分析所研究的
12、变量是对等关系;回归分相关分析所研究的变量是对等关系;回归分析所研究的两个变量不是对等关系。析所研究的两个变量不是对等关系。对两个变量来说,相关分析只能计算出一个对两个变量来说,相关分析只能计算出一个相关系数,而回归分析,可分别建立两个不同的回相关系数,而回归分析,可分别建立两个不同的回归方程。归方程。相关分析要求两个变量都必须是随机的,而相关分析要求两个变量都必须是随机的,而回归分析的要求,自变量是给定的,因变量是随机回归分析的要求,自变量是给定的,因变量是随机的。的。第十九页,讲稿共八十七页哦直线相关系数直线相关系数 在统计研究中,对现象间相关关系的密切程在统计研究中,对现象间相关关系的密
13、切程度可用统计指标来测定,用相关系数度可用统计指标来测定,用相关系数r r或相关指数或相关指数R R来确定。来确定。对直线相关来说,可用对直线相关来说,可用r r或或R R的数值表示相关的的数值表示相关的程度;而对于曲线相关来说,只能用相关指数程度;而对于曲线相关来说,只能用相关指数R R来来衡量其相关程度。衡量其相关程度。第二十页,讲稿共八十七页哦计算公式计算公式计算公式计算公式例题例题第二十一页,讲稿共八十七页哦相关系数的解释相关系数的解释极端值极端值一般值一般值注意事项注意事项第二十二页,讲稿共八十七页哦极端值极端值第二十三页,讲稿共八十七页哦一般值一般值第二十四页,讲稿共八十七页哦注意
14、事项注意事项r值很小,说明X与Y之间没有线性相关关系,但并不意味着X与Y之间没有其它关系,如很强的非线性关系。直线相关系数一般只适用与测定变量间的线性相关关系,若要衡量非线性相关时,一般应采用相关指数R。第二十五页,讲稿共八十七页哦 回归分析预测就是通过对观察数回归分析预测就是通过对观察数回归分析预测就是通过对观察数回归分析预测就是通过对观察数据的统计分析和处理来研究与确定事物间相据的统计分析和处理来研究与确定事物间相据的统计分析和处理来研究与确定事物间相据的统计分析和处理来研究与确定事物间相互关系和联系形式的一种方法。是确定变量互关系和联系形式的一种方法。是确定变量互关系和联系形式的一种方法
15、。是确定变量互关系和联系形式的一种方法。是确定变量之间函数关系的一种有利的工具。之间函数关系的一种有利的工具。之间函数关系的一种有利的工具。之间函数关系的一种有利的工具。13.2 13.2 回归分析预测法概述回归分析预测法概述第二十六页,讲稿共八十七页哦回归预测分类:回归预测分类:一元线性回归一元线性回归 线性回归线性回归 二元线性回归二元线性回归 回归预测回归预测 多元线性回归多元线性回归 非线性回归非线性回归第二十七页,讲稿共八十七页哦回归预测的一般程序:回归预测的一般程序:n n确立相关因素确立相关因素确立相关因素确立相关因素 这是回归分析的基础,只有当各因素存在相关关系时,才可用回归这
16、是回归分析的基础,只有当各因素存在相关关系时,才可用回归这是回归分析的基础,只有当各因素存在相关关系时,才可用回归这是回归分析的基础,只有当各因素存在相关关系时,才可用回归分析进行预测。分析进行预测。分析进行预测。分析进行预测。n n建立数学模型建立数学模型建立数学模型建立数学模型 根据已知的数据资料,找出变量之间相关关系的类型,并选择与根据已知的数据资料,找出变量之间相关关系的类型,并选择与根据已知的数据资料,找出变量之间相关关系的类型,并选择与根据已知的数据资料,找出变量之间相关关系的类型,并选择与其最为吻合的数学模型。其最为吻合的数学模型。其最为吻合的数学模型。其最为吻合的数学模型。n
17、n检验和评价数学模型检验和评价数学模型检验和评价数学模型检验和评价数学模型 用数理统计方法检验数学模型,并测量其误差大小和精确程度。用数理统计方法检验数学模型,并测量其误差大小和精确程度。用数理统计方法检验数学模型,并测量其误差大小和精确程度。用数理统计方法检验数学模型,并测量其误差大小和精确程度。n n运用模型进行预测运用模型进行预测运用模型进行预测运用模型进行预测 数学模型经检验后如果正确,即可用来进行预测和控制了。数学模型经检验后如果正确,即可用来进行预测和控制了。数学模型经检验后如果正确,即可用来进行预测和控制了。数学模型经检验后如果正确,即可用来进行预测和控制了。第二十八页,讲稿共八
18、十七页哦13.3 13.3 一元线性回归一元线性回归一元线性回归预测的方程其中:其中:是自变量;是自变量;是因变量;是因变量;回归系数;回归系数;回归系数。回归系数。第二十九页,讲稿共八十七页哦最小二乘法求解回归系数:最小二乘法求解回归系数:最小二乘法就是从过去若干期实际资料中,找到一条有倾最小二乘法就是从过去若干期实际资料中,找到一条有倾最小二乘法就是从过去若干期实际资料中,找到一条有倾最小二乘法就是从过去若干期实际资料中,找到一条有倾向性的趋势直线向性的趋势直线向性的趋势直线向性的趋势直线回归直线,使回归直线到实际资料各点间回归直线,使回归直线到实际资料各点间回归直线,使回归直线到实际资料
19、各点间回归直线,使回归直线到实际资料各点间的距离平方和最短,即偏差的自乘之和最小。用最小二乘法所的距离平方和最短,即偏差的自乘之和最小。用最小二乘法所的距离平方和最短,即偏差的自乘之和最小。用最小二乘法所的距离平方和最短,即偏差的自乘之和最小。用最小二乘法所找出的倾向性回归直线,最能代表实际资料的变动趋势,因而找出的倾向性回归直线,最能代表实际资料的变动趋势,因而找出的倾向性回归直线,最能代表实际资料的变动趋势,因而找出的倾向性回归直线,最能代表实际资料的变动趋势,因而可作为预测之用。可作为预测之用。可作为预测之用。可作为预测之用。标准化方程组为:标准化方程组为:标准化方程组为:标准化方程组为
20、:第三十页,讲稿共八十七页哦最小二乘法求解回归系数:最小二乘法求解回归系数:解得回归系数:解得回归系数:解得回归系数:解得回归系数:一元线性回归模型为:一元线性回归模型为:一元线性回归模型为:一元线性回归模型为:回归模型中的系数回归模型中的系数回归模型中的系数回归模型中的系数b b,反映了,反映了,反映了,反映了x x变化变化变化变化 一个单位对一个单位对一个单位对一个单位对y y的的的的影响程度。即反映了影响因素影响程度。即反映了影响因素影响程度。即反映了影响因素影响程度。即反映了影响因素x x对预测对象对预测对象对预测对象对预测对象y y的影响大小的影响大小的影响大小的影响大小和方向。和方
21、向。和方向。和方向。第三十一页,讲稿共八十七页哦统计检验:统计检验:相关系数相关系数相关系数相关系数R R R R :R R R R 取值范围为取值范围为-1-1 R R +1 1 当当当当 R=+1R=+1R=+1R=+1时时时时,y y与与与与x x是完全正相关;是完全正相关;当当当当 R=-1 R=-1 时时,y y与与与与x x是完全负相关;是完全负相关;是完全负相关;是完全负相关;当当当当 R=0 R=0 时时,y y与与x x是完全不相关;是完全不相关;是完全不相关;是完全不相关;当当当当|R R|0.70.7时,叫强相关;时,叫强相关;时,叫强相关;时,叫强相关;|R R R R
22、|0.30.3时叫弱相关。时叫弱相关。时叫弱相关。时叫弱相关。第三十二页,讲稿共八十七页哦置信区间:置信区间:回归预测有两个内容回归预测有两个内容:n n一个是现有数据的规律化,即计算回归系数;一个是现有数据的规律化,即计算回归系数;一个是现有数据的规律化,即计算回归系数;一个是现有数据的规律化,即计算回归系数;n n另一个是对规律化了的数学模型进行置信估计。另一个是对规律化了的数学模型进行置信估计。另一个是对规律化了的数学模型进行置信估计。另一个是对规律化了的数学模型进行置信估计。一般取置信度为一般取置信度为95.45%,这时的预测区间为:,这时的预测区间为:第三十三页,讲稿共八十七页哦当影
23、响因素为时间时:当影响因素为时间时:即时间因素与预测对象有线性相关关系,对于时间序列一即时间因素与预测对象有线性相关关系,对于时间序列一即时间因素与预测对象有线性相关关系,对于时间序列一即时间因素与预测对象有线性相关关系,对于时间序列一元线性回归模型的回归系数的计算,可通过适当选择期数的元线性回归模型的回归系数的计算,可通过适当选择期数的元线性回归模型的回归系数的计算,可通过适当选择期数的元线性回归模型的回归系数的计算,可通过适当选择期数的标号,使得标号,使得标号,使得标号,使得t=0,这样这样可使回可使回归归系数的系数的计计算算简简化。化。对对期数期数为为奇数的奇数的时间时间序列,可令中序列
24、,可令中间间一期一期为为第第0期,两期,两边边分分别为别为11,22,33,;而对偶数期的时间序列,令中间;而对偶数期的时间序列,令中间;而对偶数期的时间序列,令中间;而对偶数期的时间序列,令中间两期分别为两期分别为两期分别为两期分别为11,其它各期分别为,其它各期分别为,其它各期分别为,其它各期分别为33,55,;这样就使;这样就使得得t=0t=0,简简简简化后的化后的化后的化后的计计计计算公式算公式算公式算公式为为为为:第三十四页,讲稿共八十七页哦例题:例题:某地区人均收入与耐用消费品销售情况如下表示,请根某地区人均收入与耐用消费品销售情况如下表示,请根据人均收入的变化来预测耐用品的销售额
25、。据人均收入的变化来预测耐用品的销售额。年份序号人均月收入 xi(百元)销售总额 yi(十万元)(十万元)计算栏xiyixi2yi2199611.54.87.202.2523.044.65199721.85.710.263.2432.495.53199832.47.016.805.7649.007.29199943.08.324.909.0068.899.05200053.510.938.1512.25118.8110.51200163.912.448.3615.21153.7611.69200274.413.157.6419.36171.6113.15200384.813.665.2823.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实用 多元 统计分析 讲稿
限制150内