抽样调查讲稿.ppt
《抽样调查讲稿.ppt》由会员分享,可在线阅读,更多相关《抽样调查讲稿.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于抽样调查课件第一页,讲稿共五十五页哦问题:问题:1、某研究人员想要了解杭州在校大学生每周的自习时间,、某研究人员想要了解杭州在校大学生每周的自习时间,然而对于一个拥有几十万大学生的城市来说,他的调查经费然而对于一个拥有几十万大学生的城市来说,他的调查经费是远远不够的,那么这项调查还能进行吗?如果能进行,他是远远不够的,那么这项调查还能进行吗?如果能进行,他该怎么进行,并判断结论的可靠性呢?该怎么进行,并判断结论的可靠性呢?2、某企业想调查消费者对它的产品的认知程度,如何进行,并判断、某企业想调查消费者对它的产品的认知程度,如何进行,并判断结论的可靠性呢?结论的可靠性呢?第二页,讲稿共五十五
2、页哦抽样调查概述抽样调查概述基本概念及理论依据基本概念及理论依据 抽样平均误差抽样平均误差抽样推断抽样推断均值的推断均值的推断抽样方案的设计抽样方案的设计必要抽样单位数的确定必要抽样单位数的确定第三页,讲稿共五十五页哦第一节第一节 抽样调查概述抽样调查概述第四页,讲稿共五十五页哦 概念概念u广义:抽取部分单位观察,并根据观察结果推断总体。广义:抽取部分单位观察,并根据观察结果推断总体。n非随机抽样:非随机抽样:n随机抽样:随机抽样:通过主观判断,选取若干个有代表性的单位来推断总体。通过主观判断,选取若干个有代表性的单位来推断总体。保证总体中每个单位具有同等机会被抽中机会,抽取保证总体中每个单位
3、具有同等机会被抽中机会,抽取样本,并推断总体。样本,并推断总体。u狭义:按照随机原则抽取部分单位观察,并运用数理统计原理,由部狭义:按照随机原则抽取部分单位观察,并运用数理统计原理,由部分对总体做出数量上的推断分析。分对总体做出数量上的推断分析。一般地,属于随机抽样。一般地,属于随机抽样。第五页,讲稿共五十五页哦特特 点点u只抽取部分单位;只抽取部分单位;u用部分推断总体;用部分推断总体;u抽样遵循随机原则;抽样遵循随机原则;u会产生抽样误差,但误差可以计算和控制。会产生抽样误差,但误差可以计算和控制。统计误差统计误差统计数字与实际数量之间的差别。统计数字与实际数量之间的差别。u登记误差:登记
4、误差:u代表性误差:代表性误差:调查误差或工作误差,指在登记、汇总计算过程中产生的调查误差或工作误差,指在登记、汇总计算过程中产生的误差。(可以避免的)误差。(可以避免的)用部分去推断总体产生的误差。(一般不可避免)用部分去推断总体产生的误差。(一般不可避免)第六页,讲稿共五十五页哦第二节第二节 基本概念及理论依据基本概念及理论依据第七页,讲稿共五十五页哦第八页,讲稿共五十五页哦基本概念基本概念u全及总体:所要认识对象的全体。全及总体:所要认识对象的全体。n变量总体:数量标志;变量总体:数量标志;n 属性总体:品质标志;属性总体:品质标志;具有某种属性的单位占总体单位总数的比重,称为总体具有某
5、种属性的单位占总体单位总数的比重,称为总体成数成数P P,标准差也用,标准差也用表示。表示。一般以一般以N N表示全及总体的单位总数,表示全及总体的单位总数,表示全及总体表示全及总体的平均数,的平均数,表示全及总体的标准差。表示全及总体的标准差。第九页,讲稿共五十五页哦全及总体特征的描述全及总体特征的描述 描述总体的特征一般采用均值和标准差。描述总体的特征一般采用均值和标准差。全及总体是确定的,唯一的,因此全及指标也是确定的,全及总体是确定的,唯一的,因此全及指标也是确定的,唯一的。唯一的。变量总体:变量总体:属性总体:属性总体:N N1 1 具有某种属性具有某种属性 ,N N0 0 不具有某
6、种属性不具有某种属性 第十页,讲稿共五十五页哦u抽样总体(样本):从全及总体随机抽取得部分单位的集合体。抽样总体(样本):从全及总体随机抽取得部分单位的集合体。样本容量:一般样本容量大于样本容量:一般样本容量大于3030的称为大样本,小于的称为大样本,小于3030个单位数个单位数的称为小样本。的称为小样本。抽样比:抽样比:一般地,一般地,一般地,一个全及总体中,可以抽取多个抽样总体,即抽一般地,一个全及总体中,可以抽取多个抽样总体,即抽样总体不是唯一的,全部样本的可能数目与每个样本的容量以样总体不是唯一的,全部样本的可能数目与每个样本的容量以及抽样方法有关。及抽样方法有关。第十一页,讲稿共五十
7、五页哦抽样总体(样本)特征的描述抽样总体(样本)特征的描述 抽样总体(样本)特征也是通过均值和标准差来描述的。抽样总体(样本)特征也是通过均值和标准差来描述的。不是确定的、唯一的,因此抽样指标也不是确定的、唯一的,是不是确定的、唯一的,因此抽样指标也不是确定的、唯一的,是样本变量的函数,是随机变量。样本变量的函数,是随机变量。u变量总体:变量总体:对于分组资料采用加权的计算公式。(见第三章)对于分组资料采用加权的计算公式。(见第三章)第十二页,讲稿共五十五页哦u属性总体:属性总体:n n1 1 具有某种属性具有某种属性 ,n n0 0 不具有某种属性不具有某种属性 抽样的目的就是通过观察样本的
8、特征来推断总体的特征抽样的目的就是通过观察样本的特征来推断总体的特征,即,即用样本平均数用来推断总体平均数,而样本标准差作为总体标准用样本平均数用来推断总体平均数,而样本标准差作为总体标准差估计值(当总体标准差未知)用来计算总体平均数的估计区间差估计值(当总体标准差未知)用来计算总体平均数的估计区间(置信区间)。(置信区间)。第十三页,讲稿共五十五页哦例例 某全及总体由某全及总体由1 1、2 2、3 3、4 4、5 5六个数字构成。六个数字构成。全及总体:全及总体:1 1、2 2、3 3、4 4、5 5。假设样本容量为。假设样本容量为3 3,则从全及总体,则从全及总体中采用不考虑顺序不重复的简
9、单随机抽样,可以抽取出中采用不考虑顺序不重复的简单随机抽样,可以抽取出1010个抽样总体,个抽样总体,这样就有这样就有1010个样本平均数个样本平均数.1,2,31,2,31,3,41,3,41,4,51,4,52,3,42,3,42,4,52,4,51,3,51,3,51,2,51,2,53,4,53,4,51,2,41,2,42,3,52,3,5第十四页,讲稿共五十五页哦抽样方法和样本可能数目抽样方法和样本可能数目u抽样方法抽样方法 样本数目与样本容量有关,也与抽样方法有关,样本容量既定,样本数目与样本容量有关,也与抽样方法有关,样本容量既定,则样本数目取决于抽样的方法。则样本数目取决于抽
10、样的方法。抽样方式不同抽样方式不同重复抽样重复抽样不重复抽样不重复抽样样本要求不同样本要求不同考虑顺序抽样考虑顺序抽样不考虑顺序抽样不考虑顺序抽样 以上结合为四种抽样方法:考虑顺序的重复抽样、考虑顺以上结合为四种抽样方法:考虑顺序的重复抽样、考虑顺序的不重复抽样、不考虑顺序的重复抽样和不考虑顺序的不重序的不重复抽样、不考虑顺序的重复抽样和不考虑顺序的不重复抽样。复抽样。第十五页,讲稿共五十五页哦u不同抽样方法的样本可能数目不同抽样方法的样本可能数目n考虑顺序的不重复抽样考虑顺序的不重复抽样n不考虑顺序的不重复抽样不考虑顺序的不重复抽样n考虑顺序的重复抽样考虑顺序的重复抽样n不考虑顺序的重复抽样
11、不考虑顺序的重复抽样第十六页,讲稿共五十五页哦抽样调查的理论依据抽样调查的理论依据u大数定律:证明了抽样平均数(成数)趋近于总体平均数(成大数定律:证明了抽样平均数(成数)趋近于总体平均数(成数)的趋势。数)的趋势。1 1)独立同分布大数定律:)独立同分布大数定律:2 2)贝努力大数定律:)贝努力大数定律:u中心极限定律:证明了多个随机变量和的分布趋近于正态分布。抽中心极限定律:证明了多个随机变量和的分布趋近于正态分布。抽样平均数就是一种随机变量。样平均数就是一种随机变量。1 1)独立同分布中心极限定律:)独立同分布中心极限定律:2 2)德莫佛)德莫佛拉普拉斯中心极限定律:拉普拉斯中心极限定律
12、:第十七页,讲稿共五十五页哦第三节第三节 抽样平均误差抽样平均误差第十八页,讲稿共五十五页哦抽样误差的概念和理解抽样误差的概念和理解u抽样误差:来源于登记性误差和代表性误差抽样误差:来源于登记性误差和代表性误差 调查误差或工作误差,指在调查、编辑、编码、汇总过程中由调查误差或工作误差,指在调查、编辑、编码、汇总过程中由于观察、测量、登记、计算上的差错或被调查者提供虚假资料而引于观察、测量、登记、计算上的差错或被调查者提供虚假资料而引起的误差。起的误差。这种误差的直接表现就是没有真实客观地搜集或记录被调查单位这种误差的直接表现就是没有真实客观地搜集或记录被调查单位的标志值或标志特征,从而使所计算
13、的统计量偏离其真实值。的标志值或标志特征,从而使所计算的统计量偏离其真实值。登记性误差存在于所有的统计调查中,而且调查的范围越大、调登记性误差存在于所有的统计调查中,而且调查的范围越大、调查单位越多,产生误差的可能性越大。查单位越多,产生误差的可能性越大。登记性误差与测量工具的精度、测量技术、调查人员的责任心、登记性误差与测量工具的精度、测量技术、调查人员的责任心、被调查者的合作态度等密切相关。被调查者的合作态度等密切相关。n登记性误差登记性误差第十九页,讲稿共五十五页哦n代表性误差代表性误差 由于样本的分布结构与总体分布不一致所差生的误差。这部由于样本的分布结构与总体分布不一致所差生的误差。
14、这部分误差来源于抽样过程以及推断总体过程中(一般不可避免)。分误差来源于抽样过程以及推断总体过程中(一般不可避免)。代表性误差又分为两种:代表性误差又分为两种:l偏差:系统性误差偏差:系统性误差 由非随机因素(违背随机原则)造成样本代表性不足而产生由非随机因素(违背随机原则)造成样本代表性不足而产生的误差。表现为样本统计量数值系统性偏高或偏低。这种误差的误差。表现为样本统计量数值系统性偏高或偏低。这种误差也属于工作态度、水平、技术等的问题。应尽量避免。也属于工作态度、水平、技术等的问题。应尽量避免。l随机误差:偶然性误差随机误差:偶然性误差 遵循了随机原则的原则,由偶然因素引起样本结构不能完全
15、遵循了随机原则的原则,由偶然因素引起样本结构不能完全代表总体结构而产生的误差。偶然误差不可避免,即使没有登代表总体结构而产生的误差。偶然误差不可避免,即使没有登记误差和系统性误差,仍会存在误差。记误差和系统性误差,仍会存在误差。虽然不可避免,但可虽然不可避免,但可以估计和控制。偶然误差总和等于以估计和控制。偶然误差总和等于0 0。全面调查不存在偶然误差。全面调查不存在偶然误差。第二十页,讲稿共五十五页哦抽样中的抽样中的总误差总误差登记性误差登记性误差代表性误差代表性误差系统性误差系统性误差随机误差:偶然误差随机误差:偶然误差偏差:偏差:实际误差实际误差抽样平均误差抽样平均误差随机误差可以分为实
16、际误差和抽样平均误差随机误差可以分为实际误差和抽样平均误差 实际误差:样本指标与总体指标之间的差别,无法计算。实际误差:样本指标与总体指标之间的差别,无法计算。抽样平均误差:所有样本平均指标的标准差。可以计算。抽样平均误差:所有样本平均指标的标准差。可以计算。第二十一页,讲稿共五十五页哦抽样平均误差的影响因素抽样平均误差的影响因素主要受到三个因素影响:主要受到三个因素影响:l全及总体标志变动程度全及总体标志变动程度2 2。总体标志值变动越大,抽样平。总体标志值变动越大,抽样平均误差越大,反之则越小。均误差越大,反之则越小。l抽样单位数(样本容量)的多少抽样单位数(样本容量)的多少n n。其他条
17、件不变,抽取的。其他条件不变,抽取的单位数越多,抽样平均误差越小,反之越大。单位数越多,抽样平均误差越小,反之越大。l抽样组织的方式和抽样组织形式。抽样组织的方式和抽样组织形式。第二十二页,讲稿共五十五页哦抽样平均误差的计算抽样平均误差的计算u理论公式理论公式 实际上,全及指标是未知的,而且实践中只会抽样一个实际上,全及指标是未知的,而且实践中只会抽样一个样本。所以这个公式实践中不采用。样本。所以这个公式实践中不采用。第二十三页,讲稿共五十五页哦u实际使用公式推导实际使用公式推导n 重复抽样下变量全及总体的抽样平均误差公式推导重复抽样下变量全及总体的抽样平均误差公式推导第二十四页,讲稿共五十五
18、页哦所以:所以:公式说明了,抽样平均误差仅为全及总体标准差的公式说明了,抽样平均误差仅为全及总体标准差的 。第二十五页,讲稿共五十五页哦n不重复抽样下变量全及总体的抽样平均误差公式推导不重复抽样下变量全及总体的抽样平均误差公式推导其中其中第二十六页,讲稿共五十五页哦其中:第二十七页,讲稿共五十五页哦因此因此第二十八页,讲稿共五十五页哦因此,抽样平均误差为因此,抽样平均误差为 抽样比大大小于抽样比大大小于1 1时,不重复抽样的抽样平均误差与重复抽样时,不重复抽样的抽样平均误差与重复抽样的很接近的很接近第二十九页,讲稿共五十五页哦n属性全及总体的抽样平均误差公式推导:属性全及总体的抽样平均误差公式
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 讲稿
限制150内