6抽样调查.pptx
《6抽样调查.pptx》由会员分享,可在线阅读,更多相关《6抽样调查.pptx(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、浙江财经大学浙江财经大学2022-1-121第六章抽样调查第六章抽样调查 浙江财经大学浙江财经大学2022-1-122本本 章章 要要 求求1、基本概念2、抽样指标计算3、抽样平均误差的影响因素及计算4、全及指标推断:抽样极限误差计算、置信区间计算5、简单随机抽样重复抽样的必要抽样单位数计算掌握掌握浙江财经大学浙江财经大学2022-1-1231、抽样调查分类2、抽样调查特点3、全及总体分类及全及指标4、抽样方式分类5、抽样误差概念及分类6、抽样平均误差影响因素7、可信程度、概率度8、抽样方案设计基本原则9、主要的抽样组织方式种类理解理解浙江财经大学浙江财经大学2022-1-1241、抽样调查的
2、意义2、抽样调查的适用范围3、不同抽样方式的可能样本数目4、抽样调查的理论依据5、抽样平均误差的意义6、各种抽样组织方式介绍7、不重复抽样的必要抽样单位数计算了了 解解浙江财经大学浙江财经大学2022-1-125第一节 概述第二节 基本概念及理论依据第三节 抽样平均误差第四节 全及指标推断第五节 抽样方案设计浙江财经大学浙江财经大学2022-1-126第一节 概 述浙江财经大学浙江财经大学2022-1-1271、抽样调查概念、抽样调查概念广义:抽取部分单位观察,并根据观察结果推断全体。广义:抽取部分单位观察,并根据观察结果推断全体。随机抽样:随机抽样:保证总体中各单位具有同等机会被抽中,保证总
3、体中各单位具有同等机会被抽中,客观地抽取样本,并推断总体。客观地抽取样本,并推断总体。狭义:按照随机原则抽取部分单位观察,并运用数理狭义:按照随机原则抽取部分单位观察,并运用数理统计方法,由部分对总体做出数量上的推断分析。统计方法,由部分对总体做出数量上的推断分析。 浙江财经大学浙江财经大学2022-1-1282 2、特点、特点1 1)只抽取部分单位;)只抽取部分单位;2 2)用部分推断总体;)用部分推断总体;3 3)抽样遵循随机原则;)抽样遵循随机原则;4 4)会产生抽样误差,但误差可以计算和控制。)会产生抽样误差,但误差可以计算和控制。3 3、统计误差、统计误差统计数字与各种实际数量之间的
4、差别。统计数字与各种实际数量之间的差别。登记误差:登记误差:代表性误差:代表性误差:调查误差或工作误差,指在登记、汇总计调查误差或工作误差,指在登记、汇总计算过程中产生的误差。(可以避免的)算过程中产生的误差。(可以避免的)用部分去推断总体产生的误差。用部分去推断总体产生的误差。(一般不可避免)(一般不可避免)返回目录返回目录浙江财经大学浙江财经大学2022-1-129第二节 基本概念及理论依据浙江财经大学浙江财经大学2022-1-1210一、基一、基 本本 概概 念念1 1、全及总体:、全及总体:所要认识对象的全体。它是唯一的、确定的。所要认识对象的全体。它是唯一的、确定的。变量总体:变量总
5、体:属性总体:属性总体:总体中总体单位的标志为品质标志总体中总体单位的标志为品质标志2 2、抽样总体:、抽样总体:从全及总体随机抽取得部分单位的集合体。从全及总体随机抽取得部分单位的集合体。 一个全及总体中,可以抽取多个抽样总体,即抽样总体一个全及总体中,可以抽取多个抽样总体,即抽样总体不是唯一的、确定的。一般认为,样本容量不是唯一的、确定的。一般认为,样本容量n大于或等于大于或等于30个单位数时称为大样本,小于个单位数时称为大样本,小于30个单位数时称为小样本。个单位数时称为小样本。总体中总体单位的标志为数量标志总体中总体单位的标志为数量标志( (一一) )全及总体和抽样总体全及总体和抽样总
6、体浙江财经大学浙江财经大学2022-1-12111 1、全及指标:、全及指标:根据全及总体中的各单位标志值或标志特征根据全及总体中的各单位标志值或标志特征 计算的、反映总体某种属性的综合指标。又计算的、反映总体某种属性的综合指标。又 称统计参数。它是唯一确定的。称统计参数。它是唯一确定的。变量总体:变量总体:属性总体:属性总体: N N1 1具有某种属性的单位数,具有某种属性的单位数, N N0 0 不具有某种属性的单位数。不具有某种属性的单位数。 10QPNNQNXXNXX2)(称为总体标准差(二二)全及指标和抽样指标全及指标和抽样指标PQPPQNNPP)1 (11浙江财经大学浙江财经大学2
7、022-1-1212属性总体成数方差公式推导:属性总体成数方差公式推导:则属性总体的平均数则属性总体的平均数PNNNNNNFXFX1010101XF及格及格1 N1不及格不及格0 N00102122)0()1 ()(NNNPNPffXXPPQPPPPPP)1 ()1 ()1 (22浙江财经大学浙江财经大学2022-1-12132 2、抽样指标:、抽样指标:根据抽样总体中的各单位标志值或标志特征根据抽样总体中的各单位标志值或标志特征 计算的综合指标。又称统计量,是一个随机计算的综合指标。又称统计量,是一个随机 变量。变量。变量总体:变量总体:1)(2nxxSnxx称为样本标准差S属性总体:属性总
8、体:01nqnpq n n1 1 具有某种属性的单位数,具有某种属性的单位数, n n0 0 不具有某种属性的单位数。不具有某种属性的单位数。 pqppsqnnpp)1 (11浙江财经大学浙江财经大学2022-1-1214(三三)抽样方法和样本可能数目抽样方法和样本可能数目1 1、抽样方法:从全及总体随机抽取得部分单位的取样方法。、抽样方法:从全及总体随机抽取得部分单位的取样方法。 样本数目与样本容量有关,也与抽样方法有关,样本容样本数目与样本容量有关,也与抽样方法有关,样本容量既定,则样本数目取决于抽样的方法。量既定,则样本数目取决于抽样的方法。根据取样的方式不同根据取样的方式不同重复抽样重
9、复抽样不重复抽样不重复抽样根据对样本的要求不同根据对样本的要求不同考虑顺序抽样考虑顺序抽样不考虑顺序抽样不考虑顺序抽样 以上结合为四种抽样方法:考虑顺序的重复抽样、考虑顺以上结合为四种抽样方法:考虑顺序的重复抽样、考虑顺序的不重复抽样、不考虑顺序的重复抽样和不考虑顺序的不重序的不重复抽样、不考虑顺序的重复抽样和不考虑顺序的不重复抽样。复抽样。浙江财经大学浙江财经大学2022-1-12152 2、样本可能数目、样本可能数目2)考虑顺序的不重复抽样)考虑顺序的不重复抽样!(1)(1)()!nNNAkN NNnNn3)不考虑顺序的不重复抽样)不考虑顺序的不重复抽样(1)(1)!()!nNN NNnN
10、CknnNnnnNBkN1)考虑顺序的重复抽样)考虑顺序的重复抽样1(1)!(1)!nnNNnNnDkCnN 4)不考虑顺序的重复抽样)不考虑顺序的重复抽样浙江财经大学浙江财经大学2022-1-1216例如:一个盒子里有三个球,标号分别为例如:一个盒子里有三个球,标号分别为1 1、2 2、3 3,现从中随,现从中随机抽取两个。即机抽取两个。即N=3N=3,n=2n=2:1)考虑顺序的重复抽样)考虑顺序的重复抽样123111121322122233313233239nNBk2)考虑顺序的不重复抽样)考虑顺序的不重复抽样3!6(32)!nNAk23 2 16nNDkC 3)不考虑顺序的重复抽样)不
11、考虑顺序的重复抽样4)不考虑顺序的不重复抽样)不考虑顺序的不重复抽样3!32!(32)!nNCk浙江财经大学浙江财经大学2022-1-1217二、抽样调查的理论依据二、抽样调查的理论依据1 1、大数定律:、大数定律:该定律表明,当样本单位数该定律表明,当样本单位数n n足够大时,抽样平均数足够大时,抽样平均数趋近于总体平均数,抽样成数趋近于总体平均数,抽样成数p p趋近于总体成数趋近于总体成数P P。这。这为抽样推断提供了重要依据。为抽样推断提供了重要依据。2 2、中心极限定律:、中心极限定律:该定律证明,不论总体服从何种分布,只要它的数学该定律证明,不论总体服从何种分布,只要它的数学期望和方
12、差存在,从中抽取容量为期望和方差存在,从中抽取容量为n n的样本,当的样本,当n n足够大,足够大,则这个样本的平均数趋于正态分布。这为抽样误差的概则这个样本的平均数趋于正态分布。这为抽样误差的概率估计提供了依据。率估计提供了依据。xXx返回目录返回目录浙江财经大学浙江财经大学2022-1-1218第三节 抽样平均误差浙江财经大学浙江财经大学2022-1-1219一、抽样误差的概念和理解一、抽样误差的概念和理解1 1、抽样误差:、抽样误差:来源于登记性误差和代表性误差。来源于登记性误差和代表性误差。调查误差或工作误差,指在调查、编辑、编调查误差或工作误差,指在调查、编辑、编码、汇总过程中由于观
13、察、测量、登记、计码、汇总过程中由于观察、测量、登记、计算上的差错或被调查者提供虚假资料而引起算上的差错或被调查者提供虚假资料而引起的误差。的误差。 这种误差的直接表现就是没有真实客观地搜集或记录被这种误差的直接表现就是没有真实客观地搜集或记录被调查单位的标志值或标志特征,从而使所计算的统计量偏离调查单位的标志值或标志特征,从而使所计算的统计量偏离其真实值。其真实值。 登记性误差存在于所有的统计调查中,而且调查的范围登记性误差存在于所有的统计调查中,而且调查的范围越大、调查单位越多,产生误差的可能性越大。越大、调查单位越多,产生误差的可能性越大。 登记性误差与测量工具的精度、测量技术、调查人员
14、的登记性误差与测量工具的精度、测量技术、调查人员的责任心、被调查者的合作态度等密切相关。责任心、被调查者的合作态度等密切相关。登记性误差:登记性误差:浙江财经大学浙江财经大学2022-1-1220代表性误差:代表性误差:抽样过程中产生的以及用部分去推断总体过抽样过程中产生的以及用部分去推断总体过程中产生的误差。(一般不可避免)程中产生的误差。(一般不可避免)代表性误差又分为两种:代表性误差又分为两种:偏差:系统性误差偏差:系统性误差 由非随机因素(违背随机原则)造成样本代表性不足而由非随机因素(违背随机原则)造成样本代表性不足而产生的误差。表现为样本统计量的值系统性偏高或偏低。这产生的误差。表
15、现为样本统计量的值系统性偏高或偏低。这种误差也属于工作态度、水平、技术等的问题。应尽量避免。种误差也属于工作态度、水平、技术等的问题。应尽量避免。随机误差:偶然性误差随机误差:偶然性误差 遵循了随机原则的原则,由偶然因素引起样本结构不能遵循了随机原则的原则,由偶然因素引起样本结构不能完全代表总体结构而产生的误差。偶然误差不可避免,即使完全代表总体结构而产生的误差。偶然误差不可避免,即使没有登记误差和系统性误差,仍会存在误差。没有登记误差和系统性误差,仍会存在误差。 虽然不可避免,虽然不可避免,但可以估计和控制。偶然误差总和等于但可以估计和控制。偶然误差总和等于0 0。 全面调查不存在偶然误差。
16、全面调查不存在偶然误差。浙江财经大学浙江财经大学2022-1-1221抽样中的抽样中的总误差总误差登记性误差登记性误差代表性误差代表性误差系统性误差系统性误差随机误差:偶然误差随机误差:偶然误差偏差:偏差:实际误差实际误差抽样平均误差抽样平均误差随机误差又可以分为实际误差和抽样平均误差。随机误差又可以分为实际误差和抽样平均误差。 实际误差:样本指标与总体指标之间的实际差别,这种实际误差:样本指标与总体指标之间的实际差别,这种无法直接计算。无法直接计算。 抽样平均误差:所有可能抽取的样本的指标的标准差,代抽样平均误差:所有可能抽取的样本的指标的标准差,代表了所有样本平均数(成数)与总体平均数(成
17、数)的差距的表了所有样本平均数(成数)与总体平均数(成数)的差距的平均,可以计算,我们讨论的就是这种误差。平均,可以计算,我们讨论的就是这种误差。浙江财经大学浙江财经大学2022-1-1222二、抽样平均误差的计算二、抽样平均误差的计算1 1、理论公式、理论公式kPpkikXxipix22(), 2 , 1()()属性总体变量总体 实际上,全及指标是未知的,而且实践中只会抽实际上,全及指标是未知的,而且实践中只会抽样一个样本。所以这个公式实践中不采用。样一个样本。所以这个公式实践中不采用。浙江财经大学浙江财经大学2022-1-12232 2、实际使用公式、实际使用公式nnx2变量总体:公式说明
18、了,抽样平均误差仅为全及总体标准差的公式说明了,抽样平均误差仅为全及总体标准差的 。n1为总体标准差为总体标准差(1 1)重复抽样:)重复抽样:nPPP)1 ( 属性总体:P P为总体成数为总体成数浙江财经大学浙江财经大学2022-1-1224(2)不重复抽样:)不重复抽样:很大时)当NNnnNnNnx()1 ()1(22当抽样比大大小于当抽样比大大小于1时,不重复抽样的抽样时,不重复抽样的抽样平均误差与重复抽样的平均误差就非常接近。平均误差与重复抽样的平均误差就非常接近。)1()1(NnnPPP浙江财经大学浙江财经大学2022-1-1225前面公式中用的是总体标准差和总体成数,而总体标准差前
19、面公式中用的是总体标准差和总体成数,而总体标准差和总体成数是未知的,实际运用中,常采用以下方法估计:和总体成数是未知的,实际运用中,常采用以下方法估计:1、用过去的取得的资料;、用过去的取得的资料;2、用样本方差和成数代替总体方差和成数;、用样本方差和成数代替总体方差和成数;3、用小规模的调查资料;、用小规模的调查资料;4、用预估的资料。、用预估的资料。 一般采用第二种方法,即用样本方差和成数代替总体方一般采用第二种方法,即用样本方差和成数代替总体方差和成数。差和成数。浙江财经大学浙江财经大学2022-1-12261 1、抽样平均误差计算总结、抽样平均误差计算总结变量总体变量总体重复抽样重复抽
20、样不重复抽样不重复抽样xsnn22(1)(1)xnsnnNnN属性总体属性总体重复抽样重复抽样不重复抽样不重复抽样(1)(1)pPPppnn(1)(1)(1)(1)pPPnnNppnnN 现实中,总体标准差往往是未知的,此时采用样本标准差现实中,总体标准差往往是未知的,此时采用样本标准差和样本成数作为总体标准差和总体成数的估计值。当总体单位和样本成数作为总体标准差和总体成数的估计值。当总体单位总数未知时,则默认采用重复抽样的计算公式。若总数未知时,则默认采用重复抽样的计算公式。若N N已知,未表已知,未表明重复或不重复抽样,则一律采用不重复抽样的计算公式。明重复或不重复抽样,则一律采用不重复抽
21、样的计算公式。例例浙江财经大学浙江财经大学2022-1-12272 2、抽样平均误差的影响因素:、抽样平均误差的影响因素:1)全及总体标志变动程度。总体标志变动越大,)全及总体标志变动程度。总体标志变动越大,抽样平均误差越大,反之则越小。抽样平均误差越大,反之则越小。2)抽样单位数的多少。其他条件不变,抽取的)抽样单位数的多少。其他条件不变,抽取的单位数越多,抽样平均误差越小,反之越大。单位数越多,抽样平均误差越小,反之越大。3)抽样方法。重复抽样的平均误差大,不重复)抽样方法。重复抽样的平均误差大,不重复抽样的平均误差小。抽样的平均误差小。返回目录返回目录4)抽样的组织方式。)抽样的组织方式
22、。 浙江财经大学浙江财经大学2022-1-1228第四节 全及指标的推断浙江财经大学浙江财经大学2022-1-1229一、概述 抽样调查的目的是为了用样本指标推断总体抽样调查的目的是为了用样本指标推断总体指标。对总体指标的估计方法有两种:一种是点指标。对总体指标的估计方法有两种:一种是点估计,另一种是区间估计。估计,另一种是区间估计。1、点估计:、点估计: 或或 它不能说明误差大小,意义不大。但它可以它不能说明误差大小,意义不大。但它可以说明优良估计的标准。(无偏性、一致性和有效说明优良估计的标准。(无偏性、一致性和有效性)性)2、区间估计、区间估计 可以将误差控制在一定的范围内(即说明总可以
23、将误差控制在一定的范围内(即说明总体指标在某一范围内的可能性大小)体指标在某一范围内的可能性大小) 。pPxX浙江财经大学浙江财经大学2022-1-1230二、抽样极限误差二、抽样极限误差XxxPpp 由于存在误差,而且抽样指标会随着样本的不同由于存在误差,而且抽样指标会随着样本的不同而变动。这样,可以在统计意义上,推断总体指标在而变动。这样,可以在统计意义上,推断总体指标在一定范围内。样本指标与总体指标的离差绝对值就是一定范围内。样本指标与总体指标的离差绝对值就是抽样极限误差抽样极限误差 。由于离差可正可负,整个变动的。由于离差可正可负,整个变动的范围区间称为置信区间。范围区间称为置信区间。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查
限制150内