第四部分最小二乘(OLS)的大样本性质.31382.pdf
《第四部分最小二乘(OLS)的大样本性质.31382.pdf》由会员分享,可在线阅读,更多相关《第四部分最小二乘(OLS)的大样本性质.31382.pdf(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四部分 最小二乘(OLS)的大样本性质 一、背景 在有限样本条件下,OLS 估计的一系列优良特性都是建立在严格的古典假定上的。显然,在现实生活中,严格的古典假定并不都能得到满足。大样本性质就是在古典假定中的残差服从正态分布这一假定不成立的条件下,利用大数定律和中心极限定理对估计量渐进性质的讨论。二、知识要点 1、矩估计、样本矩代替总体矩 2、基本的大数定律和中心极限定理 3、大样本 OLS 估计的推导和性质 三、要点细纲 1、矩估计、样本矩和总体矩 矩估计方法(Method of Moments,简称MOM)是由英国统计学家K.Pearson提出的。其基本的思想就是可以用样本矩估计替换总体矩
2、,通过求解方程组的办法来得到相应的参数估计。(1)总体矩和样本矩的概念 总体矩 定义 设 X 为随机变量,c 为常数,k 是正整数,则()kE Xc称为 X 关于 c点的 k 阶总体矩。特别的,有以下两种请况:A、0c,这时,kkEX称为 X 的 k 阶总体原点矩;B、cEX,这时,()kkE XEX称为 X 的 k 阶总体中心矩。可以看出,一阶原点矩为随机变量的期望,二阶中心矩为随机变量的方差。扩展 关于偏度和峰度 A、偏度:偏度衡量的是一个随机变量的分布是否是对称分布,这里的对称指的是关于其均值(期望)对称。偏度是用随机变量的三阶中心矩来衡量的,其公式为:33()E XEX。如果30,则称
3、分布为右偏(或者正偏),如果30,则称分布为左偏(或者负偏)。遵循可比性的原则,将度量的单位标准化得到“偏度系数”的表达式如下所示:33332222()()vE XEXvE XEX B、峰度:峰度衡量的是一个随机变量的分布在均值附近的陡峭程度如何(注意:这里的陡峭程度有一个对比的标准正态分布)。峰度用随机变量的四阶矩来衡量。其公式为:44()E XEX。很显然,如果 X 的取值在概率上很集中在 EX 的附近,4就倾向于小;反之,则4就会比较大。同样遵循可比性的原则,进行标准化,得到峰度系数的表达式:4422 22()()vE XEXvE XEX 峰度大小(也就是分布在均值附件集中程度)的衡量是
4、有一个比较标准的,这个标准就是正态分布的峰度3。如果大于 3,就是常说的“尖峰”。这在金融时间序列数据中很常见。样本矩 和总体矩相对应,关于随机变量的样本矩有如下定义:定义 设 X 为随机变量,c 为常数,k 是正整数,则11()nkiXcn称为 X 关于 c 点的 k 阶样本矩。A、0c,这时,11nkkiigXn称为 X 的 k 阶样本原点矩;B、11niicXXn,这时,11()nkkigXXn称为 X 的 k 阶样本中心矩。同样采取“替换”的思想,可以得到样本的偏度和峰度。实际上,在具体的实践操作中,总体矩总是未知的,上述统计量都是用样本矩来近似的代替总体矩。(2)总体矩和样本矩的关系
5、 可以证明,样本矩依概率收敛于总体矩。因此,在大样本情况下,样本矩可以很好的近似替代总体矩。在计量经济学中,主要指的就是样本均值和样本方差可以很好的替代总体均值和总体方差。(二阶矩)具体证明过程如下:根据定理:如果一个随机样本具有有限的总体均值和总体方差,那么样本均值是总体均值的一致估计。再根据推论:一个关于随机样本的函数()g x,如果()E g x和()Var g x是有限的常数,那么有:11lim()()niipg xE g xn 即函数的样本均值是函数总体均值(期望)的一致估计。取2()g xx,得到样本的二阶矩(方差)是总体二阶矩(方差)的一致估计。2、基本的大数定律和中心极限定理
6、关于中心极限定理的内容有很多,根据收敛条件的强弱可以分为(1)几乎处处收敛、(2)依概率收敛(convergence in probability)和(3)依分布收敛(convergence in distribution)。其中,几乎处处收敛强于依概率收敛;依概率收敛又强于依分布收敛。但是,在众多的中心极限定理中,有两种重要的区别。那就是收敛于一个确定的数,以及收敛于一个已知分布的随机变量。这两者之间有很显著的不同。在计量经济学中关注的通常是一个未知分布的随机变量收敛于另一个已知分布的随机变量(一般而言是正态分布)。这就是依分布收敛的定义和极限分布的由来。需要注意的是大数定律一般是依概率收敛
7、,而中心极限定理一般是依分布收敛。在给出依分布收敛的定义后,就产生了渐进分布的概念。简单来说,当一个未知分布的随机变量依分布收敛于另一个已知分布的随机变量时,这个已知的分布就是该随机变量的渐进分布。而该分布的均值和方差就是这个未知分布随机变量的渐进均值和渐进方差。关于渐进分布的若干运算性质详见格林教材 P907页,定理 D.16(Theorem D.16)。若干重要的极限定理如下(1)Khinchine 弱大数定律 如果(1,2,)ix in是来自独立同分布总体的随机样本,且总体均值()iE x,则limnpx。(2)Chebychev 弱大数定律(1,2,)ix in是 n 个随机样本,满足
8、()iiE x,2()iiVar x,并且有222lim(/)lim(1/)0niinnpnpn。则lim()0nnpx(3)Kolmogorov 强大数定律(1,2,)ix in是分布相互独立的随机变量序列,满足()iiE x,2()iiVar x,并且有221lim(/)ninipi。则:.0a snnx (4)Slutskys Thoerem 如果存在一个连续的关于nx的函数()nf x,且该函数与 n 无关,那么有:lim()(lim)nnpg xg px(5)定义:1,2NZN 是一个KK的随机矩阵序列,且A 是一个非随机、可逆的KK矩阵,如果有pNZA,那么以下结论成立:1NZ以概
9、率 1 存在 11pNZA 或者11limNpZA(6)定义:1,2NXN 是一个1K的随机向量,NX依分布收敛于连续的随机向量 X,当且仅当对任意的满足1c c 的1K维的非随机向量 c,都有dNc Xc X。(7)LindebergLevy 中心极限定理:1,2iw i 是 一 个 独 立 同 分 布 的1N维 的 随 机 向 量 序 列,且 有2()igE w,(1,2gN)以及()0iE w,那么:1,2iw i 满足中心极限定理,也就是说:1 21(0,)NdiiNwNormalB。其中,()iiiBVar wEw w是一个半正定矩阵。(8)LindebergFeller 中心极限定
10、理:1,2iw i 是 一 个1n维 的 随 机 向 量 序 列,如 果 有()iiE w,()iiVar w Q,并且所有的混合三阶矩存在。令:11nniin 11nniinQQ 假设11limlimnninninQQQ是一个有限正定的矩阵,并且有:111limlimnniiinninQQQQ0 那么有:1 21()(0,)ndininwNormal Q。LindbergFeller 中心极限定理的应用。主要指的是异方差时候的情形(非同分布)。该定理的条件总是假定被满足的,因为在实际的问题中通常不能认为各个不同的指标有相同方差(或者分布)。因此,该定理保证了在更弱的条件下,中心极限定理仍然成
11、立。也就是说,在定理满足的条件下样本均值趋于一个正态分布。3、大样本 OLS 估计的推导和性质 大样本性质的推导不依赖于残差项服从正态分布的假设,它仅仅假定(,)iix是一个相互独立的观测序列。并且有如下条件成立:、limnpnXXQ是一个正定的矩阵。、lim()npEnXx0 在总体方程yx两边同乘 x并取期望,得到:1()()()()EyEEEyxxx xxx 根据样本矩代替总体矩的思想,有:1111111()nniiiiiiynnnnnn XXXyXXX bx xx 上式两边取极限,有:1limlimnnppnX bQ 所以,b是的一致估计量。在同方差假定下,根据LindebergLev
12、y 中心极限定理,有:210,dNn X Q 因此,可以得到以下结论:112110,()dNn QX QQ Q 也就是:1211()0,dnNn b-QX Q 对总体方差2的估计仍然可以采用21snk M的形式。但是,在大样本情况下,有如下结果:211snknk-1 M X(X X)X nnknnnn -1 XX XX 当n 时,21sn。因此有:1221limnpsnXXQ 21.()EstVarsbX X 四、思考题 1、说明依概率收敛和依分布收敛的区别和联系,阐述 LindebergLevy 中心极限定理和 LindebergFeller 中心极限定理假设条件的不同及其应用。2、假定在线
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 部分 最小 OLS 大样 性质 31382
限制150内