统计方法与应用幻灯片.ppt
《统计方法与应用幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计方法与应用幻灯片.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计方法与应用1第1页,共70页,编辑于2022年,星期二主要内容主要内容一、统计的理解一、统计的理解二、统计方法的理解二、统计方法的理解三、向量自回归模型三、向量自回归模型四、结构方程模型四、结构方程模型五、五、Panel Data模型模型六、应用的思考六、应用的思考2第2页,共70页,编辑于2022年,星期二一、统计的理解一、统计的理解 数据采集数据采集 整理整理 分析分析 科学科学 艺术艺术 数据数据 规律规律 有用的信息有用的信息 目标目标 对象对象 数据的类型数据的类型 定性定性 定量定量 数据的分布数据的分布 已知已知 未知未知 正态正态 非正态非正态 数据不同,方法(模型)不同数
2、据不同,方法(模型)不同 3第3页,共70页,编辑于2022年,星期二 1.异常(缺失)值处理异常(缺失)值处理 数据的预处理数据的预处理数据表现数据表现 异常值的判断异常值的判断 观察数据的变化观察数据的变化 是否有异常数据出现是否有异常数据出现 原因分析原因分析 规律分析规律分析 是否有冲击或干扰是否有冲击或干扰 瞬间瞬间 持续持续4第4页,共70页,编辑于2022年,星期二6000080000100000120000140000989900010203Y5第5页,共70页,编辑于2022年,星期二5.0E+081.0E+091.5E+092.0E+092.5E+093.0E+093.5E
3、+0999:0199:0700:0100:0701:0101:0702:0102:07Y6第6页,共70页,编辑于2022年,星期二7第7页,共70页,编辑于2022年,星期二 2.数据的转换数据的转换 原因原因 现象的量变与质变现象的量变与质变 数据转换后将更有意义数据转换后将更有意义 更便于解释更便于解释 方法方法 重新分类编码重新分类编码 虚拟变量(哑变量)引入虚拟变量(哑变量)引入 连续变量离散化连续变量离散化 如年龄如年龄 收入收入 多项选择的转化多项选择的转化8第8页,共70页,编辑于2022年,星期二二、统计方法的理解二、统计方法的理解 1.数据的基本描述数据的基本描述 特点特点
4、 基本规律基本规律 表表 图图 特征值特征值(示例示例)分组分组(类类)检检验验 2.变量之间关系变量之间关系 截面截面 线性回归模型线性回归模型 被解释变量被解释变量:连续连续 离散离散 解释变量解释变量:连续连续 离散离散9第9页,共70页,编辑于2022年,星期二10第10页,共70页,编辑于2022年,星期二11第11页,共70页,编辑于2022年,星期二虚拟变量虚拟变量 当当解解释释变变量量不不是是定定量量测测量量数数据据,或或在在不不同同的的情情况况下下,所所产产生生的的结结果果不不同同,就就需需要要将将解解释释变变量量区区分分开开,可可以以采采用用设设虚虚拟拟变变量的方法。量的方
5、法。虚拟变量是取值仅取虚拟变量是取值仅取1或或0的变量。一般,基的变量。一般,基础类型、肯定类型取值础类型、肯定类型取值“1”,比较类型、,比较类型、否定类型取值否定类型取值“0”。12第12页,共70页,编辑于2022年,星期二13第13页,共70页,编辑于2022年,星期二 工具变量法工具变量法 引引入入工工具具变变量量的的目目的的是是改改善善由由解解释释变变量量与误差项相关导致与误差项相关导致OLS估计的不一致性估计的不一致性 工工具具变变量量Z是是与与解解释释变变量量X高高度度相相关关,但但与与误误差差项项不不相相关关的的一一组组变变量量,且且这这些些变变量量间是线性独立的间是线性独立
6、的 14第14页,共70页,编辑于2022年,星期二15第15页,共70页,编辑于2022年,星期二 线性回归模型线性回归模型 广义线性模型广义线性模型 因子分析因子分析潜变量潜变量 结构方程模型结构方程模型 3.变量随时间变化规律变量随时间变化规律 时序模型时序模型 纵向数据模型纵向数据模型 16第16页,共70页,编辑于2022年,星期二4.模型的应用模型的应用 分析实际现象之间变化关系分析实际现象之间变化关系现象之间关系有一定理论做依据现象之间关系有一定理论做依据,大体关系已知大体关系已知 回归模型回归模型 模型应用的条件模型应用的条件 多水平多水平 结构方程结构方程 联立方程联立方程
7、现象之间关系没有一定理论做依据现象之间关系没有一定理论做依据,但有相互关系但有相互关系 单变量时间序列模型单变量时间序列模型 AR MA ARMA ARIMA 多变量时间序列模型多变量时间序列模型 VAR SVAR VEC Panel Data 模型作用模型作用 定量的角度定量的角度 分析探讨现象或之间的数量关系分析探讨现象或之间的数量关系 17第17页,共70页,编辑于2022年,星期二VAR、SVAR与与VEC模型模型 多变量序列之间动态变化关系多变量序列之间动态变化关系 VAR(p)多平稳序列之间动态变化规律描述多平稳序列之间动态变化规律描述 没有变量序列之间同期的相互关系没有变量序列之
8、间同期的相互关系SVAR(p)多平稳序列之间动态变化规律描述多平稳序列之间动态变化规律描述 存在变量序列之间同期的相互关系存在变量序列之间同期的相互关系 VEC 具有协整关系的多变量序列之间动态具有协整关系的多变量序列之间动态 变化规律描述变化规律描述 三、向量自回归模型三、向量自回归模型18第18页,共70页,编辑于2022年,星期二(一一)向量平稳性检验向量平稳性检验 我国出口额(我国出口额()、进)、进口额(口额()和外汇储备()和外汇储备()示例、进出口与外汇储备示例、进出口与外汇储备19第19页,共70页,编辑于2022年,星期二序列序列 趋势类趋势类型型 t t 1%5%10%1%
9、5%10%y1 C C,t,0t,0 -3.7211 -4.0391 -3.4490 -3.1497 -3.7211 -4.0391 -3.4490 -3.1497y2C C,t,0 -4.1844 -4.0391 -3.4490 -3.1497t,0 -4.1844 -4.0391 -3.4490 -3.1497y3C C,t,0 0.1439 -4.0391 -3.4490 -3.1497t,0 0.1439 -4.0391 -3.4490 -3.1497dy3无无C C和和t,0 -3.2816 -2.5852 -1.9436 -1.6149t,0 -3.2816 -2.5852 -1.
10、9436 -1.614920第20页,共70页,编辑于2022年,星期二一阶差分后序列图一阶差分后序列图21第21页,共70页,编辑于2022年,星期二序列序列 趋势类趋势类型型 t t 1%5%10%1%5%10%dy1无无C C,t,0t,0-12.5844 -2.5876-1.9440 -1.6147-12.5844 -2.5876-1.9440 -1.6147dy2无无C C,t,0 -13.9201 -2.5876-1.9440 -1.6147t,0 -13.9201 -2.5876-1.9440 -1.6147dy3无无C C,t,0 -2.4107 -2.5876 -1.9440
11、 -1.6147t,0 -2.4107 -2.5876 -1.9440 -1.614722第22页,共70页,编辑于2022年,星期二(二)(二)模型识别模型识别 对模型阶数对模型阶数p作出选择作出选择 1.阶数的初选阶数的初选阶数阶数p的初选,通常可以借助序列间的互相关函数进行。的初选,通常可以借助序列间的互相关函数进行。阶数阶数p要足够大,以完整反映变量之间的动态特征;要足够大,以完整反映变量之间的动态特征;p不宜过大,模型待估计参数增多,自由度减少,不宜过大,模型待估计参数增多,自由度减少,没有足够的样本数目时,可能导致参数不能得到正确有效没有足够的样本数目时,可能导致参数不能得到正确有
12、效的估计。的估计。和普通线性回归一样,一个待估计参数,一般来说,至和普通线性回归一样,一个待估计参数,一般来说,至少需要少需要10个观测期的数据。个观测期的数据。23第23页,共70页,编辑于2022年,星期二2.利用评价指标确认利用评价指标确认利利用用初初选选的的阶阶数数p可可以以构构建建VAR模模型型,参参数数估估计计后后,可可以以利用几个评价指标帮助判断合适的阶数利用几个评价指标帮助判断合适的阶数(1)LR检验(似然比检验)检验(似然比检验):附加约束是正确的:附加约束是正确的 服从自由度为服从自由度为M的分布的分布(2)最终预测误差)最终预测误差FPE(Final prediction
13、 error)其中,其中,是滞后是滞后p期时模型残差的方差估计,期时模型残差的方差估计,n是样本量,是样本量,k是待估计参数的个数是待估计参数的个数。FPE(p)=24第24页,共70页,编辑于2022年,星期二(3)AIC(Akaike inof criterion)准则准则 其其中中:指指VAR(p)模模型型残残差差的的协协方方差差阵阵的的行行列列式式;n是是有有效效的的观测数目;观测数目;m是变量序列的数目;是变量序列的数目;p是阶数是阶数(4)SC(Schwarz criterion)准则)准则(5)HQ(Hannan-Quinn criterion)准则)准则 其其中中:L是是似似然
14、然函函数数,k是是待待估估计计参参数数的的个个数数,其其它它符符号号意义同上意义同上 AIC=log +2m2p/n,p=1,k SC=log+(logn),p=1,k+(logn)HQ=25第25页,共70页,编辑于2022年,星期二差分后序列滞后差分后序列滞后4阶检验结果阶检验结果 26第26页,共70页,编辑于2022年,星期二VAR(3)AR特征多项式系数特征多项式系数 27第27页,共70页,编辑于2022年,星期二AR特征多项式根的倒数分布图特征多项式根的倒数分布图 28第28页,共70页,编辑于2022年,星期二原序列原序列VAR(3)AR特征多项式系数特征多项式系数 29第29
15、页,共70页,编辑于2022年,星期二原序列原序列VAR(3)AR特征多项式根的倒数分布图特征多项式根的倒数分布图 30第30页,共70页,编辑于2022年,星期二迹检验结果迹检验结果(三三)变量间协整关系检验变量间协整关系检验 选择序列有线性趋势,选择序列有线性趋势,协整方程有截距的情况,并选协整方程有截距的情况,并选p=3 31第31页,共70页,编辑于2022年,星期二最大特征值检验结果最大特征值检验结果 32第32页,共70页,编辑于2022年,星期二(四四)向量误差修正模型向量误差修正模型 协整方程为协整方程为 VEC模型为模型为 33第33页,共70页,编辑于2022年,星期二34
16、第34页,共70页,编辑于2022年,星期二四、结构方程模型四、结构方程模型(StructuralEquationModeling,SEM)(一)(一)问题的提出问题的提出研究学生学习成绩与什么因素有关研究学生学习成绩与什么因素有关 学习成绩学习成绩 学习能力学习能力 教师要求教师要求 自信自信 同学关系同学关系35第35页,共70页,编辑于2022年,星期二回归分析回归分析 假设假设 自变量非随机(不存在测量误差)自变量非随机(不存在测量误差)自变量之间不存在相关关系自变量之间不存在相关关系学习成绩学习能力教师要求自 信同学关系因因变变量量自自变变量量36第36页,共70页,编辑于2022年
17、,星期二因果关系分析因果关系分析 直接因果效应直接因果效应 间接因果效应间接因果效应观测变量的变异:随机误差的变异、系统误差的变观测变量的变异:随机误差的变异、系统误差的变异、潜变量的变异异、潜变量的变异因子分析因子分析学习成绩教师要求自 信同学关系学习能力37第37页,共70页,编辑于2022年,星期二因子分析因子分析 探索性因子分析探索性因子分析 已有数据已有数据 探索其规律关系探索其规律关系 验证性因子分析验证性因子分析 已知可能有已知可能有 某种关系某种关系 利用数据验证利用数据验证38第38页,共70页,编辑于2022年,星期二结构方程模型(结构方程模型(StructuralEqua
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 方法 应用 幻灯片
限制150内