《连续性抽样:理论及应用.ppt》由会员分享,可在线阅读,更多相关《连续性抽样:理论及应用.ppt(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、连续性抽样调查:理论及应用连续性抽样调查:理论及应用目目 录录q 研究背景及意义q 理论研究现状及述评q 主要研究内容q 研究总结 一、一、研究背景及意义研究背景及意义 时间序列数据以及随后出现的面板数据都是经济统计分析和计量分析中非常重要的数据类型。当我们在研究应该应用什么统计和计量的方法去分析既定的时间序列数据时,是否考虑过以下几个问题?时间序列数据是如何产生的?时间序列数据是如何产生的?所产生的时间序列数据是否准确?所产生的时间序列数据是否准确?如何让时间序列数据更加准确?如何让时间序列数据更加准确?1.研究背景研究背景 随着社会经济现象的不断变化和发展,很多调查对象的总体也在不断变化和
2、发展。为了能够及时反映调查总体的这种变化和发展,调查部门就需要对同一总体在不同时间上进行连续性抽样调查(Successive Sampling Survey),并定期公布调查结果,形成一系列时序统计数据。因此,社会经济抽样调查一般都应该是连续性的定期调查。一次性抽样调查与截面数据一次性抽样调查与截面数据 连续性抽样调查与时间序列数据及面板数据连续性抽样调查与时间序列数据及面板数据连续性抽样调查的优势连续性抽样调查的优势 与传统的调查方法相比,连续性抽样与传统的调查方法相比,连续性抽样调查具有以下特有的优势:调查具有以下特有的优势:节省调查费用和调查资源节省调查费用和调查资源 减轻被调查者回答负
3、担减轻被调查者回答负担 提高估计精度提高估计精度国内外很多大规模的抽样调查都是国内外很多大规模的抽样调查都是连续性调查连续性调查 qThe Current Population Survey of the U.S.Bureau of the CensusqThe Census Bureaus Retail Trade SurveyqThe Monthly Canadian Labour Force Surveyq城市住户抽样调查q规模以下工业企业抽样调查q农产量抽样调查连续性抽样调查在我国应用现状连续性抽样调查在我国应用现状 我国现有的很多大型调查没有充分利用连续性抽样调查方法,存在调查方案设
4、计不合理,抽样估计方法不科学等问题,因而导致调查结果很难准确地反映现期调查总体的变化情况和发展趋势,比如政府统计部门定期发布的很多经济统计数据并不十分准确。如果社会经济学者应用了不准确的统计数据进行经济分析,即使运用了科学的统计分析方法和经济理论也很难得出正确的结论。我国1996年新修订的统计法第十条明确规定:“统计调查应当以周期性普查为基础,以经常性抽样调查为主体,以必要的统计报表、重点调查、综合分析等为补充,搜集、整理基本统计资料。”因此,在今后我国政府统计部门开展的统计调查制度与方法改革的过程中,最重要的就是围绕如何更好地发挥经常性抽样调查的主体作用,研究并应用更加符合我国国情的经常性抽
5、样调查方法,以此得出更加准确的统计数据,为我国政府部门、研究机构以及各类企事业单位等社会各界服务。2.研究意义研究意义因此,就我国来说,我们有必要选择连续性抽样调查理论作为研究对象,将连续性抽样调查理论与我国抽样调查制度改革相结合,希望最终能够在我国建立起一套适应我国政府统计管理体制的连续性抽样调查体系,用这套科学的调查体系产生更加准确的社会经济时间序列统计数据,以供社会经济学者进行更加准确的分析,从而更好地体现出经常性抽样调查的主体地位。我国政府统计部门建立连续性抽样我国政府统计部门建立连续性抽样调查体系的优势调查体系的优势(1)建立更加规范的抽样调查体系,便于中央政府和各级地方政府进行科学
6、合理的财政预算,使各项调查经费能够得到稳定和充足的保证。(2)建立统一的地域和名录抽样框体系,整合各类调查项目,从而节省调查经费和调查资源。(3)连续性抽样调查体系能够产生更加准确的时间序列统计数据。二、连续性抽样调查理论研究现二、连续性抽样调查理论研究现状及述评状及述评 通过搜集、整理有关连续性抽样调查方面的文献,可以发现近60多年来不同的学者针对不同的问题,依据不同的理论,从不同的角度进行了广泛的研究。连续性抽样调查的设计方法连续性抽样调查的设计方法 连续性抽样调查的估计方法连续性抽样调查的估计方法1.连续性抽样设计方法连续性抽样设计方法单水平轮换单水平轮换不完全的单水平轮换不完全的单水平
7、轮换多水平轮换多水平轮换轮换模式应用举例轮换模式应用举例加拿大劳动力调查(LFS)使用60单水平轮换模式美国现时人口调查(CPS)使用484不完全单水平轮换模式美国消费者支出的季度调查(CEQ)便采用40三水平轮换模式 2.连续性抽样估计方法连续性抽样估计方法q广义最小二乘法广义最小二乘法(Patterson,1950;Eckler,1955)qK组合估计量组合估计量(Hansen et al.,1955)qAK组合估计量组合估计量(Gurney and Daly,1965)qAKC组合估计量组合估计量(Fuller,1990,1999)q修正回归估计量修正回归估计量(Singh,1994,1
8、995,1996,1997,2000,2001)q回归组合估计量回归组合估计量(Fuller and Rao,2001;Singh et al.,2001和和Gambino et al.,2001)现行各种轮换模式存在的问题现行各种轮换模式存在的问题q第一,由于各种轮换模式未能在统一模式下进行研究,第一,由于各种轮换模式未能在统一模式下进行研究,导致了各种连续性抽样估计方法。西方国家学者一般导致了各种连续性抽样估计方法。西方国家学者一般根据某项实际调查所使用的轮换模式对估计方法进行根据某项实际调查所使用的轮换模式对估计方法进行研究,比如以美国为主的学者基于美国现时人口调查研究,比如以美国为主的
9、学者基于美国现时人口调查使用的不完全单水平轮换模式研究了使用的不完全单水平轮换模式研究了K组合估计量和组合估计量和AK组合估计量等;以加拿大为主的学者基于加拿大组合估计量等;以加拿大为主的学者基于加拿大劳动力调查使用的单水平轮换模式研究了劳动力调查使用的单水平轮换模式研究了MR估计量估计量和回归组合估计量等。因此,由于轮换模式不统一导和回归组合估计量等。因此,由于轮换模式不统一导致了连续性抽样估计方法存在较大差异,进而很难推致了连续性抽样估计方法存在较大差异,进而很难推广使用,因而也就限制了连续性抽样方法在其他国家、广使用,因而也就限制了连续性抽样方法在其他国家、地区或者在其它调查领域的推广使
10、用。地区或者在其它调查领域的推广使用。q第二,现行的各种轮换模式存在显著的轮换偏差,第二,现行的各种轮换模式存在显著的轮换偏差,而且在连续性抽样估计中很难用精确的公式表达而且在连续性抽样估计中很难用精确的公式表达出来,因而很难消减轮换偏差的影响。出来,因而很难消减轮换偏差的影响。Bailar(1975,1978)最早提出了轮换偏差的问)最早提出了轮换偏差的问题,并将轮换样本调查中产生的轮换偏差归纳为题,并将轮换样本调查中产生的轮换偏差归纳为轮换组偏差(轮换组偏差(Rotation Group Bias)和固定偏)和固定偏差(差(Panel Imbalance)。)。Bailar(1975,19
11、78)认为轮换组偏差是由于)认为轮换组偏差是由于同一个调查月份中同一个调查月份中的轮换样本存在不同的调查次数而产生的的轮换样本存在不同的调查次数而产生的;Cantwell and Caldwell(1998)认为固定偏差)认为固定偏差是由于不同是由于不同轮换组之间的不平衡性轮换组之间的不平衡性导致的。在现导致的。在现行的各种轮换模式下,很难精确地表达这两类轮行的各种轮换模式下,很难精确地表达这两类轮换偏差,因而使得现行的各种连续性抽样估计方换偏差,因而使得现行的各种连续性抽样估计方法都是有偏估计。法都是有偏估计。q第三,在现行各种轮换模式下很难准确地度量轮第三,在现行各种轮换模式下很难准确地度
12、量轮换样本之间的相关关系,进而很难准确地推导出换样本之间的相关关系,进而很难准确地推导出估计量的方差公式。在轮换样本调查中,一般都估计量的方差公式。在轮换样本调查中,一般都存在两类相关关系,第一类相关是同一轮换样本存在两类相关关系,第一类相关是同一轮换样本在不同调查时期之间的相关,可称为一阶相关;在不同调查时期之间的相关,可称为一阶相关;第二类相关是从同一轮换组中抽出不同的轮换样第二类相关是从同一轮换组中抽出不同的轮换样本之间的相关,可称为二阶相关。在现行的各种本之间的相关,可称为二阶相关。在现行的各种轮换模式下,虽然能够很容易表达出一阶相关关轮换模式下,虽然能够很容易表达出一阶相关关系,但却
13、不能表达出二阶相关关系。系,但却不能表达出二阶相关关系。Park,et al.(2001)还利用加拿大劳动力调查数据进行了)还利用加拿大劳动力调查数据进行了实证分析,显示二阶相关将能够提高方差估计的实证分析,显示二阶相关将能够提高方差估计的准确性,如果忽略二阶相关,估计量方差将会在准确性,如果忽略二阶相关,估计量方差将会在一定程度上被低估。一定程度上被低估。现行连续性抽样估计方法存在的现行连续性抽样估计方法存在的问题问题q第一,如何更好地度量轮换偏差的影响,得第一,如何更好地度量轮换偏差的影响,得出更加准确的偏差公式?出更加准确的偏差公式?q第二,如何更好地度量轮换样本之间的两类第二,如何更好
14、地度量轮换样本之间的两类相关关系,得出更加准确的方差公式?相关关系,得出更加准确的方差公式?q第三,在多目标调查中,如何恰当地确定连第三,在多目标调查中,如何恰当地确定连续性抽样估计量的权重系数?实际调查往往续性抽样估计量的权重系数?实际调查往往是多目标调查,需要同时估计不同类型的估是多目标调查,需要同时估计不同类型的估计量,此时又有必要将不同类型估计量的权计量,此时又有必要将不同类型估计量的权重系数保持一致,同时兼顾各类估计量的精重系数保持一致,同时兼顾各类估计量的精度要求,这也是未来研究的一个重要方向。度要求,这也是未来研究的一个重要方向。三、三、主要研究内容主要研究内容连续性抽样调查理论
15、研究连续性抽样调查理论的应用研究1.连续性抽样调查理论研究连续性抽样调查理论研究连续性的样本轮换方法连续性抽样估计方法连续性的样本轮换方法连续性的样本轮换方法二维平衡单水平轮换模式三维平衡多水平轮换模式 二维平衡单水平轮换模式的轮换过程二维平衡单水平轮换模式的轮换过程 二维平衡单水平轮换模式的轮换过程二维平衡单水平轮换模式的轮换过程 平衡轮换模式的优势平衡轮换模式的优势在平衡轮换模式下,可以很容易用一般的公式表达出轮换偏差,并将轮换偏差引入到连续性抽样估计量中,从而尽量削减轮换偏差的影响。在平衡轮换模式下,能够更加准确地计算出轮换样本之间的两类相关关系,提高轮换样本之间的相关性,从而能够更加准
16、确地给出估计量方差公式。2.连续性估计方法连续性估计方法q 基于二维平衡单水平轮换模式的广义基于二维平衡单水平轮换模式的广义组合估计量和固定窗宽的最优线性无偏组合估计量和固定窗宽的最优线性无偏估计量估计量q 基于三维平衡多水平轮换模式的广义基于三维平衡多水平轮换模式的广义组合估计量和固定窗宽的最优线性无偏组合估计量和固定窗宽的最优线性无偏估计量估计量基于二维平衡单水平轮换模式的广基于二维平衡单水平轮换模式的广义组合估计量义组合估计量基于二维平衡单水平轮换模式的固基于二维平衡单水平轮换模式的固定窗宽的最优线性无偏估计量定窗宽的最优线性无偏估计量多目标调查下最优系数的确定多目标调查下最优系数的确定
17、多目标调查下最优系数的确定多目标调查下最优系数的确定连续性抽样调查理论的应用研究连续性抽样调查理论的应用研究建立适应我国政府管理体制的连续性抽样调查体系 我国建立连续性抽样调查体系的我国建立连续性抽样调查体系的步骤步骤改革政府统计抽样调查机构与队伍精简、整合及增加各类抽样调查项目建立和维护地域抽样框和名录抽样框体系明确连续性抽样设计与轮换模式确定连续性抽样估计方法连续性抽样调查数据的发布与分析机制 四、研究总结四、研究总结目前已取得的研究成果未来值得进一步深入研究的领域1.目前已取得的研究成果目前已取得的研究成果第一,形成了一套连续性抽样调查理论研究体系。首先,系统地归纳和总结了各种连续性调查
18、方法,即重复样本调查、固定样本调查、轮换样本调查和分裂样本调查等四种连续性调查方法。然后,对使用频率最高的轮换样本调查的轮换模式设计和连续性抽样估计方法进行了系统研究,研究了基于平衡轮换模式的广义组合估计方法和固定窗宽的最优线性估计方法。第二,形成了一套连续性抽样调查应用研究体系。首先,在理论研究的基础上,考虑到我国国情的特殊性和连续性抽样调查理论的适用性,提出从调查组织体系和方法体系等方面进行相应的改革,最终构建一套适应我国政府管理体制的连续性抽样调查体系。这套应用研究体系大致勾画出应用连续性抽样调查理论的整体框架和思路。虽然在未来的实际应用与改革过程中会不断出现新情况和新问题,但是均可在该
19、体系的整体框架和思路的指导下具体地分析问题,解决问题。2.未来值得进一步深入研究的未来值得进一步深入研究的领域领域 在研究过程中形成了连续性抽样调查理论研究和应用研究两套体系。由于本人能力及研究时间有限,还存在很多不足之处,后续的研究者可在此基础上进行更加深入和具体的研究。由于研究时间有限,本人未能在连续性抽样调查的背景下对诸如抽样框的维护和更新、小区域估计以及无回答等问题进行有针对性的研究。在未来的研究过程中,本人计划在连续性抽样调查理论及应用研究的背景下,结合中国现行抽样调查制度的实际情况,有针对性地研究和解决这些问题。另外,应用科学的连续性抽样调查理论时,必须面对我国既定的政府管理体制。我国政府管理体制是多年以来多方相关利益主体博弈的结果,理论研究学者和实际调查组织者往往没有能力去改变现行的政府管理体制以适应调查理论的需要,而只能在自身能力允许的范围内尽量改革抽样调查制度,并对不适应政府管理体制的理论与方法进行修改和调整,使得调查制度与理论方法尽量取得吻合。因此,所研究的理论与方法虽然很科学、合理,但是在实际应用过程中可能还必须根据具体情况加以修改和调整,而本人提出的连续性抽样调查体系可能也存在与当前政府管理体制不相适应的地方,这些都需要在以后的应用过程中加以修补和完善。
限制150内