第01章概率与统计基础PPT讲稿.ppt
第01章概率与统计基础1第1页,共24页,编辑于2022年,星期日l 打开工作文件,双击一个序列名,即进入序列的对话框。单打开工作文件,双击一个序列名,即进入序列的对话框。单击击“view”可看到菜单分为四个区,第一部分为序列显示形式,可看到菜单分为四个区,第一部分为序列显示形式,第二和第三部分提供数据统计方法,第四部分是转换选项和标签。第二和第三部分提供数据统计方法,第四部分是转换选项和标签。2第2页,共24页,编辑于2022年,星期日1.11.1 描述统计量描述统计量描述统计量描述统计量 l 以以直直方方图图显显示示序序列列的的频频率率分分布布。直直方方图图将将序序列列的的长长度度按按等等间间距距划划分分,显示观测值落入每一个区间的个数。显示观测值落入每一个区间的个数。l 同直方图一起显示的还有一些标准的描述统计量。这些统计量都同直方图一起显示的还有一些标准的描述统计量。这些统计量都是由样本中的观测值计算出来的。如图是由样本中的观测值计算出来的。如图(例例1.1):3第3页,共24页,编辑于2022年,星期日l例例1.3中中GDP增长率的统计量:增长率的统计量:4第4页,共24页,编辑于2022年,星期日l 均值均值均值均值 (mean)(mean)即序列的平均值即序列的平均值,用序列数据的总和除以数据的个数。用序列数据的总和除以数据的个数。中位数中位数中位数中位数(median)(median)即从小到大排列的序列的中间值。是对序列分布中即从小到大排列的序列的中间值。是对序列分布中心的一个粗略估计。心的一个粗略估计。最大最小值最大最小值最大最小值最大最小值(max and min)(max and min)序列中的最大最小值。序列中的最大最小值。标准差标准差标准差标准差(Standard Deviation)(Standard Deviation)标准差衡量序列的离散程度。计算公标准差衡量序列的离散程度。计算公式如下式如下N 是样本中观测值的个数,是样本中观测值的个数,是样本均值。是样本均值。5第5页,共24页,编辑于2022年,星期日l l 偏度偏度偏度偏度(SkewnessSkewness)衡量序列分布围绕其均值的非对称性。计算衡量序列分布围绕其均值的非对称性。计算公式如下公式如下 是变量方差的有偏估计。如果序列的分布是对是变量方差的有偏估计。如果序列的分布是对称的,称的,S值为值为0;正的;正的S值意味着序列分布有长的右拖尾,负的值意味着序列分布有长的右拖尾,负的S值意味值意味着序列分布有长的左拖尾。例着序列分布有长的左拖尾。例1.1中中X的偏度为的偏度为0,说明,说明X的分布是对称的;的分布是对称的;而例而例1.3中中GDP增长率的偏度是增长率的偏度是0.78,说明,说明GDP增长率的分布是不对称的。增长率的分布是不对称的。6第6页,共24页,编辑于2022年,星期日l l 峰度峰度峰度峰度(KurtosisKurtosis)度量序列分布的凸起或平坦程度,计算公式度量序列分布的凸起或平坦程度,计算公式如下如下 分布的凸起程度大于分布的凸起程度大于 正态分布;如果正态分布;如果K值小于值小于3,序列分布相对于,序列分布相对于正态分布是平坦的。例正态分布是平坦的。例1.1中中X的峰度为的峰度为2.5,说明,说明X的分布相对于正的分布相对于正态分布是平坦的;而例态分布是平坦的;而例1.3中中GDP增长率的峰度为增长率的峰度为2.14,说明,说明GDP增长率的分布相对于正态分布也是平坦的。增长率的分布相对于正态分布也是平坦的。意义同意义同S中中,正态分布的正态分布的 K 值为值为3。如果。如果 K 值大于值大于3,7第7页,共24页,编辑于2022年,星期日l Jarque-Bera Jarque-Bera 检验检验检验检验 检验序列是否服从正态分布。统计量计算公检验序列是否服从正态分布。统计量计算公式如下式如下 S为偏度,为偏度,K为峰度,为峰度,k是序列估计式中参数的个数。是序列估计式中参数的个数。在正态分布的原假设下,在正态分布的原假设下,J-B统计量是自由度为统计量是自由度为2的的 2 分布。分布。J-B统计量下显示的概率值(统计量下显示的概率值(P值)是值)是J-B统计量超出原假设下的观统计量超出原假设下的观测值的概率。如果该值很小,则拒绝原假设。当然,在不同的显测值的概率。如果该值很小,则拒绝原假设。当然,在不同的显著性水平下的拒绝域是不一样的。例著性水平下的拒绝域是不一样的。例1.1中中X的的J-B统计量下显示统计量下显示的概率值(的概率值(P值)是值)是0.92,接受原假设,接受原假设,X 服从正态分布;而例服从正态分布;而例1.3中中GDP增长率的的增长率的的J-B统计量的概率值(统计量的概率值(P值)是值)是0.455,也接,也接受原假设受原假设,说明说明GDP增长率服从正态分布。增长率服从正态分布。8第8页,共24页,编辑于2022年,星期日1.2 1.2 均值、中位数、方差的假设检验均值、中位数、方差的假设检验均值、中位数、方差的假设检验均值、中位数、方差的假设检验l 这部分是对序列均值、中位数、方差的假设检验。在序列对象菜单这部分是对序列均值、中位数、方差的假设检验。在序列对象菜单选择选择View/tests for descriptive stats/simple hypothesis tests,就会出现,就会出现下面的序列分布检验对话框:下面的序列分布检验对话框:9第9页,共24页,编辑于2022年,星期日1.1.1.1.均值检验均值检验均值检验均值检验 如果不指定序列如果不指定序列 x 的标准差,的标准差,EViews将在将在 t 统计量中使用该标统计量中使用该标准差的估计值准差的估计值 s。是是 x 的样本估计值的样本估计值,N是是x的观测值的个数。在原假设下,如果的观测值的个数。在原假设下,如果x服从正态分布,服从正态分布,t 统计量是自由度为统计量是自由度为N-1的的t分布分布。l 原假设是序列原假设是序列 x 的期望值的期望值 m,备选假设是,备选假设是 m,即,即 10第10页,共24页,编辑于2022年,星期日l 如果给定如果给定x的标准差,的标准差,EViews计算计算t 统计量:统计量:是指定的是指定的x的标准差。的标准差。要要进进行行均均值值检检验验,在在Mean内内输输入入 值值。如如果果已已知知标标准准差差,想想要要计计算算t统统计计量量,在在右右边边的的框框内内输输入入标标准准差差值值。可可以以输输入入任任何何数数或或标标准准EViews表达式,下页我们给出检验的输出结果。表达式,下页我们给出检验的输出结果。11第11页,共24页,编辑于2022年,星期日 这是检验例这是检验例1.7中中GDP增长率的均值,增长率的均值,检验检验H0:X=10%,H1:X10%。表中的表中的Probability值是值是P值(边际显著水平)。在双边假值(边际显著水平)。在双边假设下,如果这个值小于检验的显著水平,如设下,如果这个值小于检验的显著水平,如0.05则拒绝原假设。这里则拒绝原假设。这里我们不能拒绝原假设。我们不能拒绝原假设。12第12页,共24页,编辑于2022年,星期日2.2.方差检验方差检验方差检验方差检验 l 检验的原假设为序列检验的原假设为序列 x 的方差等于的方差等于 2,备选假设为双边的,备选假设为双边的,x 的的方差不等于方差不等于 2,即,即 EViews计算计算 2统计量,计算公式如下统计量,计算公式如下 N为为观观测测值值的的个个数数,为为x的的样样本本均均值值。在在原原假假设设下下,如如果果x服服从正态分布,从正态分布,2 统计量是服从自由度为统计量是服从自由度为N-1的的 2分布分布。要要进行方差检验,在进行方差检验,在Variance处填入在原假设下的方差值。可处填入在原假设下的方差值。可以填入任何正数或表达式。以填入任何正数或表达式。13第13页,共24页,编辑于2022年,星期日3 3.中位数检验中位数检验中位数检验中位数检验 l 原假设为序列原假设为序列x的中位数等于的中位数等于m,备选假设为双边假设,备选假设为双边假设,x的中位数的中位数不等于不等于m,即,即 EViews提供了三个以排序为基础的无参数的检验统计量。方法的主要提供了三个以排序为基础的无参数的检验统计量。方法的主要参考来自于参考来自于Conover(1980)和)和Sheskin(1997)。)。进行中位数检验,在进行中位数检验,在Median右边的框内输入中位数的值,可以输入任右边的框内输入中位数的值,可以输入任何数字表达式。何数字表达式。14第14页,共24页,编辑于2022年,星期日1.31.3 分布函数分布函数分布函数分布函数 EViews提供了几种对数据进行初步分析的方法。在提供了几种对数据进行初步分析的方法。在1.1 我们我们已列出了几种图来描述序列分布特征。在本节,列出了几种散点图且允许已列出了几种图来描述序列分布特征。在本节,列出了几种散点图且允许我们可以用有参数或无参数过程来做拟合曲线图。我们可以用有参数或无参数过程来做拟合曲线图。这些图包含着复杂计算和大量的特殊操作,对某些完全技术性的介绍,这些图包含着复杂计算和大量的特殊操作,对某些完全技术性的介绍,不必掌握所有细节。不必掌握所有细节。EViews中设置的缺省值除了对极特殊的分析外,对中设置的缺省值除了对极特殊的分析外,对一般分析而言是足够用的。直接点击一般分析而言是足够用的。直接点击ok键接受缺省设置,就可以轻松的展键接受缺省设置,就可以轻松的展现出每个图。现出每个图。15第15页,共24页,编辑于2022年,星期日1 1.3.1 3.1 序列分布图序列分布图序列分布图序列分布图 本节列出了三种描述序列经验分布特征的图。本节列出了三种描述序列经验分布特征的图。1.CDFSurvivorQuantile1.CDFSurvivorQuantile图图图图 这个图描绘出带有加或减两个标准误差带的经验累积分布函数,这个图描绘出带有加或减两个标准误差带的经验累积分布函数,残存函数和分位数函数。在序列菜单中或组菜单中选择残存函数和分位数函数。在序列菜单中或组菜单中选择View/Distribution/CDFSurvivorQuantile时时(组菜单的组菜单的Multiple Graphs中中),就会出现下面的对话框:,就会出现下面的对话框:16第16页,共24页,编辑于2022年,星期日 其其中中,Cumulative Distribution(累累积积分分布布)操操作作用用来来描描绘绘序序列列的的经经验验累累积积函函数数(CDF)。CDF是是序序列列中中观观测测值值不不超超过过指指定定值值 r 的的概率概率 Survivor(残存残存)操作用来描绘序列的经验残存函数操作用来描绘序列的经验残存函数 17第17页,共24页,编辑于2022年,星期日 Quantile(分分位位数数)操操作作用用来来描描绘绘序序列列的的经经验验分分位位数数。对对 0 q 1,X 的分位数的分位数 x(q)满足下式:满足下式:,且 分分位位数数函函数数是是CDF的的反反函函数数,可可以以通通过过调调换换CDF的的横横纵纵坐坐标轴得到。标轴得到。All选项包括选项包括CDF,Survivor和和Quantile函数。函数。Saved matrix name可以允许把结果保存在一个矩阵内。可以允许把结果保存在一个矩阵内。Include standard errors(包括标准误差包括标准误差)操作标绘接近操作标绘接近95%的置信区的置信区间的经验分布函数。间的经验分布函数。18第18页,共24页,编辑于2022年,星期日 工作文件工作文件工作文件工作文件1_3.wf11_3.wf1中中中中GDPGDP增长率的分布图增长率的分布图增长率的分布图增长率的分布图19第19页,共24页,编辑于2022年,星期日2.QuantileQuantile2.QuantileQuantile图图图图 QuantileQuantile(QQ图图)对于比较两个分布是一种简单但重要的工具。对于比较两个分布是一种简单但重要的工具。这个图标绘出一个被选序列的分位数分布相对于另一个序列的分位数分布或一这个图标绘出一个被选序列的分位数分布相对于另一个序列的分位数分布或一个理论分布的异同。如果这两个分布是相同的,则个理论分布的异同。如果这两个分布是相同的,则QQ图将在一条直线上。如图将在一条直线上。如果果QQ图不在一条直线上图不在一条直线上,则这两个分布是不同的则这两个分布是不同的。当选择当选择View/Distribution Graphs/Quantile-Quantile.下下面的面的QQ Plot对话框会出现对话框会出现:20第20页,共24页,编辑于2022年,星期日 可以选与如下的理论分布的分位数相比较可以选与如下的理论分布的分位数相比较:Normal(正态正态)分布:钟形并且对称的分布分布:钟形并且对称的分布.Uniform(均匀均匀)分布:矩形密度函数分布分布:矩形密度函数分布.Exponential(指指数数)分分布布:联联合合指指数数分分布布是是一一个个有有着着一一条条长长右右尾尾的正态分布的正态分布.Logistic(逻逻辑辑)分分布布:除除比比正正态态分分布布有有更更长长的的尾尾外外是是一一种种近近似似于于正正态态的对称分布的对称分布.Extreme value(极极值值)分分布布:I型型极极小小值值分分布布是是有有一一条条左左长长尾尾的的负负偏分布偏分布,它非常近似于对数正态分布它非常近似于对数正态分布.可可以以在在工工作作文文件件中中选选择择一一些些序序列列来来与与这这些些典典型型序序列列的的分分位位数数相相比比较较,也也可可以以在在编编辑辑框框中中键键入入序序列列或或组组的的名名称称来来选选择择对对照照的的序序列列或或组组,EViews将针对列出的每个序列计算出将针对列出的每个序列计算出QQ图。图。21第21页,共24页,编辑于2022年,星期日 下图是下图是GDP增长率和指数分布的增长率和指数分布的Q-Q图:图:22第22页,共24页,编辑于2022年,星期日1.5 1.5 交叉相关交叉相关交叉相关交叉相关 交叉相关(交叉相关(交叉相关(交叉相关(Cross correlation and CorreligramsCross correlation and Correligrams)显示组中头两个序列的交叉相关。序列显示组中头两个序列的交叉相关。序列 X 与与 Y 的交叉相关的计算的交叉相关的计算公式如下:公式如下:注意与自相关不同,交叉相关不必围绕滞后期对称。交叉相注意与自相关不同,交叉相关不必围绕滞后期对称。交叉相关图中的虚线是二倍的标准差,近似计算。关图中的虚线是二倍的标准差,近似计算。23第23页,共24页,编辑于2022年,星期日 居民消费(居民消费(居民消费(居民消费(CSCS)和)和)和)和GDPGDP的交叉相关系数的交叉相关系数的交叉相关系数的交叉相关系数24第24页,共24页,编辑于2022年,星期日