抽样调查 (2)PPT讲稿.ppt
《抽样调查 (2)PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《抽样调查 (2)PPT讲稿.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、抽样调查第1页,共55页,编辑于2022年,星期日问题:问题:1、某研究人员想要了解杭州在校大学生每周的自习时间,、某研究人员想要了解杭州在校大学生每周的自习时间,然而对于一个拥有几十万大学生的城市来说,他的调查经费然而对于一个拥有几十万大学生的城市来说,他的调查经费是远远不够的,那么这项调查还能进行吗?如果能进行,他是远远不够的,那么这项调查还能进行吗?如果能进行,他该怎么进行,并判断结论的可靠性呢?该怎么进行,并判断结论的可靠性呢?2、某企业想调查消费者对它的产品的认知程度,如何进行,并判断、某企业想调查消费者对它的产品的认知程度,如何进行,并判断结论的可靠性呢?结论的可靠性呢?第2页,共
2、55页,编辑于2022年,星期日抽样调查概述抽样调查概述基本概念及理论依据基本概念及理论依据 抽样平均误差抽样平均误差抽样推断抽样推断均值的推断均值的推断抽样方案的设计抽样方案的设计必要抽样单位数的确定必要抽样单位数的确定第3页,共55页,编辑于2022年,星期日第一节第一节 抽样调查概述抽样调查概述第4页,共55页,编辑于2022年,星期日 概念概念u广义:抽取部分单位观察,并根据观察结果推断总体。广义:抽取部分单位观察,并根据观察结果推断总体。n非随机抽样:非随机抽样:n随机抽样:随机抽样:通过主观判断,选取若干个有代表性的单位来推断总通过主观判断,选取若干个有代表性的单位来推断总体。体。
3、保证总体中每个单位具有同等机会被抽中机会,抽取保证总体中每个单位具有同等机会被抽中机会,抽取样本,并推断总体。样本,并推断总体。u狭义:按照随机原则抽取部分单位观察,并运用数理统计原理,由部分狭义:按照随机原则抽取部分单位观察,并运用数理统计原理,由部分对总体做出数量上的推断分析。对总体做出数量上的推断分析。一般地,属于随机抽样。一般地,属于随机抽样。第5页,共55页,编辑于2022年,星期日特特 点点u只抽取部分单位;只抽取部分单位;u用部分推断总体;用部分推断总体;u抽样遵循随机原则;抽样遵循随机原则;u会产生抽样误差,但误差可以计算和控制。会产生抽样误差,但误差可以计算和控制。统计误差统
4、计误差统计数字与实际数量之间的差别。统计数字与实际数量之间的差别。u登记误差:登记误差:u代表性误差:代表性误差:调查误差或工作误差,指在登记、汇总计算过程中产生的误调查误差或工作误差,指在登记、汇总计算过程中产生的误差。(可以避免的)差。(可以避免的)用部分去推断总体产生的误差。(一般不可避免)用部分去推断总体产生的误差。(一般不可避免)第6页,共55页,编辑于2022年,星期日第二节第二节 基本概念及理论依据基本概念及理论依据第7页,共55页,编辑于2022年,星期日第8页,共55页,编辑于2022年,星期日基本概念基本概念u全及总体:所要认识对象的全体。全及总体:所要认识对象的全体。n变
5、量总体:数量标志;变量总体:数量标志;n 属性总体:品质标志;属性总体:品质标志;具有某种属性的单位占总体单位总数的比重,称为总体成具有某种属性的单位占总体单位总数的比重,称为总体成数数P P,标准差也用,标准差也用表示。表示。一般以一般以N N表示全及总体的单位总数,表示全及总体的单位总数,表示全及总表示全及总体的平均数,体的平均数,表示全及总体的标准差。表示全及总体的标准差。第9页,共55页,编辑于2022年,星期日全及总体特征的描述全及总体特征的描述 描述总体的特征一般采用均值和标准差。描述总体的特征一般采用均值和标准差。全及总体是确定的,唯一的,因此全及指标也是确定的,唯一的。全及总体
6、是确定的,唯一的,因此全及指标也是确定的,唯一的。变量总体:变量总体:属性总体:属性总体:N N1 1 具有某种属性具有某种属性 ,N N0 0 不具有某种属性不具有某种属性 第10页,共55页,编辑于2022年,星期日u抽样总体(样本):从全及总体随机抽取得部分单位的集合体。抽样总体(样本):从全及总体随机抽取得部分单位的集合体。样本容量:一般样本容量大于样本容量:一般样本容量大于3030的称为大样本,小于的称为大样本,小于3030个单个单位数的称为小样本。位数的称为小样本。抽样比:抽样比:一般地,一般地,一般地,一个全及总体中,可以抽取多个抽样总体,即抽样一般地,一个全及总体中,可以抽取多
7、个抽样总体,即抽样总体不是唯一的,全部样本的可能数目与每个样本的容量以及抽总体不是唯一的,全部样本的可能数目与每个样本的容量以及抽样方法有关。样方法有关。第11页,共55页,编辑于2022年,星期日抽样总体(样本)特征的描述抽样总体(样本)特征的描述 抽样总体(样本)特征也是通过均值和标准差来描述的。抽样总体(样本)特征也是通过均值和标准差来描述的。不是确定的、唯一的,因此抽样指标也不是确定的、唯一的,不是确定的、唯一的,因此抽样指标也不是确定的、唯一的,是样本变量的函数,是随机变量。是样本变量的函数,是随机变量。u变量总体:变量总体:对于分组资料采用加权的计算公式。(见第三章)对于分组资料采
8、用加权的计算公式。(见第三章)第12页,共55页,编辑于2022年,星期日u属性总体:属性总体:n n1 1 具有某种属性具有某种属性 ,n n0 0 不具有某种属性不具有某种属性 抽样的目的就是通过观察样本的特征来推断总体的特征抽样的目的就是通过观察样本的特征来推断总体的特征,即用样本平,即用样本平均数用来推断总体平均数,而样本标准差作为总体标准差估计值(当均数用来推断总体平均数,而样本标准差作为总体标准差估计值(当总体标准差未知)用来计算总体平均数的估计区间(置信区间)。总体标准差未知)用来计算总体平均数的估计区间(置信区间)。第13页,共55页,编辑于2022年,星期日例例 某全及总体由
9、某全及总体由1 1、2 2、3 3、4 4、5 5六个数字构成。六个数字构成。全及总体:全及总体:1 1、2 2、3 3、4 4、5 5。假设样本容量为。假设样本容量为3 3,则从全及,则从全及总体中采用不考虑顺序不重复的简单随机抽样,可以抽取出总体中采用不考虑顺序不重复的简单随机抽样,可以抽取出1010个抽样总体,这样就有个抽样总体,这样就有1010个样本平均数个样本平均数.1,2,31,2,31,3,41,3,41,4,51,4,52,3,42,3,42,4,52,4,51,3,51,3,51,2,51,2,53,4,53,4,51,2,41,2,42,3,52,3,5第14页,共55页,
10、编辑于2022年,星期日抽样方法和样本可能数目抽样方法和样本可能数目u抽样方法抽样方法 样本数目与样本容量有关,也与抽样方法有关,样本容量既定,样本数目与样本容量有关,也与抽样方法有关,样本容量既定,则样本数目取决于抽样的方法。则样本数目取决于抽样的方法。抽样方式不同抽样方式不同重复抽样重复抽样不重复抽样不重复抽样样本要求不同样本要求不同考虑顺序抽样考虑顺序抽样不考虑顺序抽样不考虑顺序抽样 以上结合为四种抽样方法:考虑顺序的重复抽样、考虑顺序以上结合为四种抽样方法:考虑顺序的重复抽样、考虑顺序的不重复抽样、不考虑顺序的重复抽样和不考虑顺序的不重复抽的不重复抽样、不考虑顺序的重复抽样和不考虑顺序
11、的不重复抽样。样。第15页,共55页,编辑于2022年,星期日u不同抽样方法的样本可能数目不同抽样方法的样本可能数目n考虑顺序的不重复抽样考虑顺序的不重复抽样n不考虑顺序的不重复抽样不考虑顺序的不重复抽样n考虑顺序的重复抽样考虑顺序的重复抽样n不考虑顺序的重复抽样不考虑顺序的重复抽样第16页,共55页,编辑于2022年,星期日抽样调查的理论依据抽样调查的理论依据u大数定律:证明了抽样平均数(成数)趋近于总体平均数大数定律:证明了抽样平均数(成数)趋近于总体平均数(成数)的趋势。(成数)的趋势。1 1)独立同分布大数定律:)独立同分布大数定律:2 2)贝努力大数定律:)贝努力大数定律:u中心极限
12、定律:证明了多个随机变量和的分布趋近于正态分布。中心极限定律:证明了多个随机变量和的分布趋近于正态分布。抽样平均数就是一种随机变量。抽样平均数就是一种随机变量。1 1)独立同分布中心极限定律:)独立同分布中心极限定律:2 2)德莫佛)德莫佛拉普拉斯中心极限定律:拉普拉斯中心极限定律:第17页,共55页,编辑于2022年,星期日第三节第三节 抽样平均误差抽样平均误差第18页,共55页,编辑于2022年,星期日抽样误差的概念和理解抽样误差的概念和理解u抽样误差:来源于登记性误差和代表性误差抽样误差:来源于登记性误差和代表性误差 调查误差或工作误差,指在调查、编辑、编码、汇总过程调查误差或工作误差,
13、指在调查、编辑、编码、汇总过程中由于观察、测量、登记、计算上的差错或被调查者提供虚假中由于观察、测量、登记、计算上的差错或被调查者提供虚假资料而引起的误差。资料而引起的误差。这种误差的直接表现就是没有真实客观地搜集或记录被调查这种误差的直接表现就是没有真实客观地搜集或记录被调查单位的标志值或标志特征,从而使所计算的统计量偏离其真实值。单位的标志值或标志特征,从而使所计算的统计量偏离其真实值。登记性误差存在于所有的统计调查中,而且调查的范围越大、调登记性误差存在于所有的统计调查中,而且调查的范围越大、调查单位越多,产生误差的可能性越大。查单位越多,产生误差的可能性越大。登记性误差与测量工具的精度
14、、测量技术、调查人员的责登记性误差与测量工具的精度、测量技术、调查人员的责任心、被调查者的合作态度等密切相关。任心、被调查者的合作态度等密切相关。n登记性误差登记性误差第19页,共55页,编辑于2022年,星期日n代表性误差代表性误差 由于样本的分布结构与总体分布不一致所差生的误差。这部分误由于样本的分布结构与总体分布不一致所差生的误差。这部分误差来源于抽样过程以及推断总体过程中(一般不可避免)。差来源于抽样过程以及推断总体过程中(一般不可避免)。代表性误差又分为两种:代表性误差又分为两种:l偏差:系统性误差偏差:系统性误差 由非随机因素(违背随机原则)造成样本代表性不足而产生的误由非随机因素
15、(违背随机原则)造成样本代表性不足而产生的误差。表现为样本统计量数值系统性偏高或偏低。这种误差也属于工差。表现为样本统计量数值系统性偏高或偏低。这种误差也属于工作态度、水平、技术等的问题。应尽量避免。作态度、水平、技术等的问题。应尽量避免。l随机误差:偶然性误差随机误差:偶然性误差 遵循了随机原则的原则,由偶然因素引起样本结构不能完遵循了随机原则的原则,由偶然因素引起样本结构不能完全代表总体结构而产生的误差。偶然误差不可避免,即使没全代表总体结构而产生的误差。偶然误差不可避免,即使没有登记误差和系统性误差,仍会存在误差。有登记误差和系统性误差,仍会存在误差。虽然不可避免,虽然不可避免,但可以估
16、计和控制。偶然误差总和等于但可以估计和控制。偶然误差总和等于0 0。全面调查不存在偶然误差。全面调查不存在偶然误差。第20页,共55页,编辑于2022年,星期日抽样中的抽样中的总误差总误差登记性误差登记性误差代表性误差代表性误差系统性误差系统性误差随机误差:偶然误差随机误差:偶然误差偏差:偏差:实际误差实际误差抽样平均误差抽样平均误差随机误差可以分为实际误差和抽样平均误差随机误差可以分为实际误差和抽样平均误差 实际误差:样本指标与总体指标之间的差别,无法计算。实际误差:样本指标与总体指标之间的差别,无法计算。抽样平均误差:所有样本平均指标的标准差。可以计算。抽样平均误差:所有样本平均指标的标准
17、差。可以计算。第21页,共55页,编辑于2022年,星期日抽样平均误差的影响因素抽样平均误差的影响因素主要受到三个因素影响:主要受到三个因素影响:l全及总体标志变动程度全及总体标志变动程度2 2。总体标志值变动越大,抽样平均。总体标志值变动越大,抽样平均误差越大,反之则越小。误差越大,反之则越小。l抽样单位数(样本容量)的多少抽样单位数(样本容量)的多少n n。其他条件不变,抽取的单。其他条件不变,抽取的单位数越多,抽样平均误差越小,反之越大。位数越多,抽样平均误差越小,反之越大。l抽样组织的方式和抽样组织形式。抽样组织的方式和抽样组织形式。第22页,共55页,编辑于2022年,星期日抽样平均
18、误差的计算抽样平均误差的计算u理论公式理论公式 实际上,全及指标是未知的,而且实践中只会抽样一个样本。实际上,全及指标是未知的,而且实践中只会抽样一个样本。所以这个公式实践中不采用。所以这个公式实践中不采用。第23页,共55页,编辑于2022年,星期日u实际使用公式推导实际使用公式推导n 重复抽样下变量全及总体的抽样平均误差公式推导重复抽样下变量全及总体的抽样平均误差公式推导第24页,共55页,编辑于2022年,星期日所以:所以:公式说明了,抽样平均误差仅为全及总体标准差的公式说明了,抽样平均误差仅为全及总体标准差的 。第25页,共55页,编辑于2022年,星期日n不重复抽样下变量全及总体的抽
19、样平均误差公式推导不重复抽样下变量全及总体的抽样平均误差公式推导其中其中第26页,共55页,编辑于2022年,星期日其中:第27页,共55页,编辑于2022年,星期日因此因此第28页,共55页,编辑于2022年,星期日因此,抽样平均误差为因此,抽样平均误差为 抽样比大大小于抽样比大大小于1 1时,不重复抽样的抽样平均误差与重时,不重复抽样的抽样平均误差与重复抽样的很接近复抽样的很接近第29页,共55页,编辑于2022年,星期日n属性全及总体的抽样平均误差公式推导:属性全及总体的抽样平均误差公式推导:具有某标志(取值具有某标志(取值1 1)的单位比重)的单位比重不具有某标志(取值不具有某标志(取
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 2PPT讲稿 PPT 讲稿
限制150内