序列的描述性统计和假设检验精.ppt
序列的描述性统计和假设检验1第1页,本讲稿共34页 单击单击“viewview”可看到菜单分为四个区,第一部分为可看到菜单分为四个区,第一部分为序列显示形式,第二和第三部分提供数据统计方法,第四序列显示形式,第二和第三部分提供数据统计方法,第四部分是转换选项和标签。部分是转换选项和标签。2第2页,本讲稿共34页 也就是分别用电子表也就是分别用电子表/统计图、统计量来统计图、统计量来描述该序列的数据,其中注意利用菜单描述该序列的数据,其中注意利用菜单“graph/bargraph/bar”与与“Descriptive Descriptive Statistics/Histogram and statsStatistics/Histogram and stats”制作图制作图形的区别。形的区别。3第3页,本讲稿共34页一、描述统计量一、描述统计量 1、以直方图显示序列的频率分布、以直方图显示序列的频率分布 直直方方图图将将序序列列的的长长度度按按等等间间距距划划分分,显显示示观观测测值值落落入入每每一个区间的个数。一个区间的个数。4第4页,本讲稿共34页同同直直方方图图一一起起显显示示的的还还有有一一些些标标准准的的描描述述统统计计量量。这些统计量都是由样本中的观测值计算出来的。这些统计量都是由样本中的观测值计算出来的。均值均值(mean)(mean)中位数中位数(median)(median)最大值最大值(max)(max)最小值最小值(min)(min)标准差标准差(Standard Deviation)(Standard Deviation)偏度(偏度(SkewnessSkewness)峰度(峰度(KurtosisKurtosis)5第5页,本讲稿共34页 Jarque-Bera Jarque-Bera 检验检验 检验序列是否服从正态分布。统检验序列是否服从正态分布。统计量计算公式如下计量计算公式如下 S S为偏度,为偏度,K K为峰度,为峰度,k k是序列估计式中参数的个数。是序列估计式中参数的个数。在正态分布的原假设下,在正态分布的原假设下,J-BJ-B统计量是自由度为统计量是自由度为2 2的的 2 2 分布。分布。J-B J-B统计量下显示的概率值大于统计量下显示的概率值大于0.05 0.05,接受,接受原假设原假设,说明序列服从正态分布。说明序列服从正态分布。6第6页,本讲稿共34页二、二、均值、中位数、方差的假设检验均值、中位数、方差的假设检验 在序列对象菜单选择在序列对象菜单选择View/tests for descriptive View/tests for descriptive stats/simple hypothesis testsstats/simple hypothesis tests,就会出现下面的序列分,就会出现下面的序列分布检验对话框。布检验对话框。例利用例利用 “5_25_2”数据,检验数据,检验GDPGDP均值是否等均值是否等于于40004000。检验假设为:。检验假设为:H H0 0:X X=40004000,H H1 1:X X40004000。7第7页,本讲稿共34页表中的表中的ProbabilityProbability值是概率值。在双边假设下,如果这个值小于检验设值是概率值。在双边假设下,如果这个值小于检验设定的显著水平(如定的显著水平(如0.050.05),则拒绝原假设。该例中拒绝原假设。),则拒绝原假设。该例中拒绝原假设。得到以下输出结果:得到以下输出结果:8第8页,本讲稿共34页三、分布函数三、分布函数 EViewsEViews提供了几种描述序列经验分布特征的图。提供了几种描述序列经验分布特征的图。9第9页,本讲稿共34页 1.CDFSurvivorQuantile图图 这个图描绘出带有加或减两个标准误差带的经验累积这个图描绘出带有加或减两个标准误差带的经验累积分布函数、残存函数和分位数函数。在序列菜单中或组菜分布函数、残存函数和分位数函数。在序列菜单中或组菜单中选择单中选择View/Distribution/CDFView/Distribution/CDFSurvivorSurvivorQuantileQuantile时时(组菜单的组菜单的Multiple GraphsMultiple Graphs中中),就会出,就会出现下面的对话框:现下面的对话框:10第10页,本讲稿共34页 其其中中,Cumulative Cumulative Distribution(Distribution(累累积积分分布布)用用来来描描绘绘序序列列的的经经验验累累积积函函数数(CDFCDF)。CDFCDF是是序序列列中中观观测测值值不不超超过指定值过指定值 r r 的概率的概率 :Survivor(Survivor(残存残存)操作用来描绘序列的经验残存函数:操作用来描绘序列的经验残存函数:11第11页,本讲稿共34页 Quantile(Quantile(分分位位数数)操操作作用用来来描描绘绘序序列列的的经经验验分分位位数数。对对 0 0 q q 1,1,X X 的分位数的分位数 x x(q q)满足下式:满足下式:,且 分位数函数是分位数函数是CDFCDF的反函数,可以通过调换的反函数,可以通过调换CDFCDF的横纵坐标轴得到。的横纵坐标轴得到。All All选项包括选项包括CDFCDF,SurvivorSurvivor和和QuantileQuantile函数。函数。Saved matrix name Saved matrix name可以允许把结果保存在一个矩阵内。可以允许把结果保存在一个矩阵内。Include standard errors(Include standard errors(包括标准误差包括标准误差)操作标绘接近操作标绘接近95%95%的置的置信区间的经验分布函数。信区间的经验分布函数。12第12页,本讲稿共34页2.QuantileQuantile2.QuantileQuantile图图图图 QuantileQuantileQuantile(QQQuantile(QQ图图)对于比较两个分布是一种简单但重要对于比较两个分布是一种简单但重要的工具。这个图标绘出一个被选序列的分位数分布相对于另一个序列的工具。这个图标绘出一个被选序列的分位数分布相对于另一个序列的分位数分布或一个理论分布的异同。如果这两个分布是相同的,则的分位数分布或一个理论分布的异同。如果这两个分布是相同的,则QQQQ图将在一条直线上。如果图将在一条直线上。如果QQQQ图不在一条直线上图不在一条直线上,则这两个分布是不同则这两个分布是不同的。的。当选择当选择View/Distribution View/Distribution Graphs/Quantile-QuantileGraphs/Quantile-Quantile.下面下面的的QQ PlotQQ Plot对话框会出现对话框会出现:13第13页,本讲稿共34页可以选与如下的理论分布的分位数相比较可以选与如下的理论分布的分位数相比较:Normal(Normal(正态正态)分布:钟形并且对称的分布分布:钟形并且对称的分布.Uniform(Uniform(均匀均匀)分布:矩形密度函数分布分布:矩形密度函数分布.Exponential(Exponential(指指数数)分分布布:联联合合指指数数分分布布是是一一个个有有着着一一条条长长右尾的正态分布右尾的正态分布.Logistic(Logistic(逻逻辑辑)分分布布:除除比比正正态态分分布布有有更更长长的的尾尾外外是是一一种种近似于正态的对称分布近似于正态的对称分布.Extreme Extreme value(value(极极值值)分分布布:I I型型极极小小值值分分布布是是有有一一条条左左长长尾尾的的负负偏偏分布分布,它非常近似于对数正态分布它非常近似于对数正态分布.可可以以在在工工作作文文件件中中选选择择一一些些序序列列来来与与这这些些典典型型序序列列的的分分位位数数相相比比较较,也也可可以以在在编编辑辑框框中中键键入入序序列列或或组组的的名名称称来来选选择择对对照照的的序序列列或组,或组,EViewsEViews将针对列出的每个序列作出将针对列出的每个序列作出QQQQ图。图。14第14页,本讲稿共34页 下图是下图是GDPGDP增长率和指数分布的增长率和指数分布的Q-QQ-Q图:图:15第15页,本讲稿共34页 3.Kernel Density3.Kernel Density(核密度核密度核密度核密度)这这个个视视图图标标绘绘出出序序列列分分布布的的核核密密度度估估计计。一一个个序序列列的的分分布布的的最最简简单单非非参参数数密密度度估估计计是是直直方方图图。通通过:过:View/View/Descriptive Descriptive Statistics/Statistics/Histogram Histogram and and StatsStats可可以以得得到到直直方方图图,直直方方图图对对原原点点的的选选择择比比较较敏敏感感并且是不连续的。并且是不连续的。16第16页,本讲稿共34页 核核密密度度估估计计用用“冲冲击击”代代替替了了直直方方图图中中的的“框框”,所所以以它它是是平平滑滑的的。平平滑滑是是通通过过给给远远离离被被估估计计的的点点的的观观测测值值以以小的权重来达到的。一个序列小的权重来达到的。一个序列 X X 在点在点x x 的核密度估计为:的核密度估计为:这里,这里,N N是观测值的数目,是观测值的数目,h h是带宽(或平滑参数),是带宽(或平滑参数),K K是合并为一体的核函数。是合并为一体的核函数。17第17页,本讲稿共34页 当选当选View/Distribution Graphs/Kernel DensityView/Distribution Graphs/Kernel Density会会出现下面的核密度对话框:出现下面的核密度对话框:18第18页,本讲稿共34页一、组对象的创建一、组对象的创建组对象是序列或者表达式的集合,组对象并不包组对象是序列或者表达式的集合,组对象并不包含实际的序列数据,而只是包括对序列数据的含实际的序列数据,而只是包括对序列数据的引用。引用。例如,有一个名为例如,有一个名为Group1 Group1 的组对象,包含序的组对象,包含序列列ser1 ser1、ser2 ser2 和和ser3ser3,Group1 Group1 中只是包含中只是包含对对ser1 ser1、ser2 ser2 和和ser3 ser3 的引用指针,实际数的引用指针,实际数据保存在序列据保存在序列ser1ser1、ser2 ser2 和和ser3 ser3 中。中。第二节第二节 多序列的描述性统计和假设检验多序列的描述性统计和假设检验19第19页,本讲稿共34页创建组对象的操作方法为:Objects/New Object 在打开对话框的Type of Object(对象类型)中选择Group,在Name for Object(对象名称)键入组对象名称,单击OK按钮,即创建了组对象20第20页,本讲稿共34页创建组对象的命令为:group 组对象名或:group 组对象名 序列或表达式列表例如:(1)group group1(在命令窗口)创建一个名为group1 的空组对象;(2)group group1 GDP CS创建包含序列GDP CS的组对象group1;(3)group group2 GDP GDP/CS创建一个包括序列GDP 和GDP与CS相除的组对象group221第21页,本讲稿共34页二、多序列的描述性统计和假设检验二、多序列的描述性统计和假设检验在组对象的视图中进行多序列的描述性统计和在组对象的视图中进行多序列的描述性统计和假设检验假设检验1、两个总体均值的差异性检验、两个总体均值的差异性检验例,利用例,利用“case2”数据检验数据检验X与与Y均值的差异显著均值的差异显著性(性(X与与Y分别为甲乙两地区的家庭收入,显著分别为甲乙两地区的家庭收入,显著性水平性水平0.05)。22第22页,本讲稿共34页在打开在打开XY组成的组对象后进行如下的操作:组成的组对象后进行如下的操作:View/tests of Equality23第23页,本讲稿共34页 结论:t0.87,相伴概率0.3865,大于0.05,说明检验结果是接受H024第24页,本讲稿共34页2、多个总体均值的差异性检验、多个总体均值的差异性检验-单因素方差分析单因素方差分析例:1996年分别在辽宁、河北、山西城市中调查了5个样本地区,得城镇居民人均年消费数据如下。用方差分析方法检验3省城镇居民人均年消费额是否有显著性差异25第25页,本讲稿共34页点transpose按钮,可以变换表格形式26第26页,本讲稿共34页View-tests of equality,选择均值27第27页,本讲稿共34页结论:相伴概率等于0.0279小于0.05的显著性水平拒绝原假设28第28页,本讲稿共34页3 3、相关及协方差矩阵、相关及协方差矩阵(Correlation/CovarianceCorrelation/Covariance)在打开组对象后,可计算各序列的相关矩阵在打开组对象后,可计算各序列的相关矩阵及协方差矩阵。及协方差矩阵。相关矩阵相关矩阵的操作:的操作:View/CorrelationCorrelation协方差矩阵协方差矩阵的操作的操作 :View/CovarianceCovariance29第29页,本讲稿共34页计算相关及协方差时,有两种选择数据方式:计算相关及协方差时,有两种选择数据方式:Common SampleCommon Sample使任何缺数据的序列都被排除在相关使任何缺数据的序列都被排除在相关及协方差计算之外。及协方差计算之外。Pairwise SamplesPairwise Samples用相关序列的所有无丢失观察值用相关序列的所有无丢失观察值计算。此方法使用样本的最大数计算。此方法使用样本的最大数,但可能导致不确定但可能导致不确定矩阵。矩阵。30第30页,本讲稿共34页 4 4 4 4、相关图与交叉相关(、相关图与交叉相关(、相关图与交叉相关(、相关图与交叉相关(Correlogram and Cross Correlogram and Cross Correlogram and Cross Correlogram and Cross correlation correlation correlation correlation)相关图相关图相关图相关图(Correlogram Correlogram):是对显示组序列的第一个):是对显示组序列的第一个序列作自相图和偏自相关图序列作自相图和偏自相关图,与打开第一个序列在与打开第一个序列在VIEWVIEW中作中作相关分析结果相同。相关分析结果相同。31第31页,本讲稿共34页交叉相关图交叉相关图交叉相关图交叉相关图(Cross correlation Cross correlation):是对显示组序列头):是对显示组序列头两个序列计算交叉相关。序列两个序列计算交叉相关。序列 X X 与与 Y Y 的交叉相关的计算的交叉相关的计算公式如下:公式如下:32第32页,本讲稿共34页 例如,利用文件例如,利用文件“3_13_1”中的数据计算中的数据计算incinc与与taxtax的交叉的交叉相关系数相关系数:33第33页,本讲稿共34页练习:1、利用文件“case11”数据进行以下练习:1)计算出口贸易额(expo)与进口贸易额(impo)之和;2)对序列expo计算自然对数、3期滞后值、2阶差分值。3)计算序列的expo的自相关系数与偏相关系数。4)作序列expo、impo的相关图和交叉相关图。2、利用文件“个人工资模拟数据.sav”数据进行以下练习:1)检验男性收入(income)与6000有无明显的差异;2)检验男性与女性收入有无明显的差异。34第34页,本讲稿共34页