《抽样的基本知识及类型.ppt》由会员分享,可在线阅读,更多相关《抽样的基本知识及类型.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章 抽样的原理及类型,主要内容 一、抽样的意义与作用 二、抽样的类型与抽样程序 三、样本规模与抽样误差,第一节 抽样的意义与作用,一、抽样及其相关的概念 1. 概念: 抽样指的是从调查对象的总体中,按照一定的方式选择或抽取一部分调查对象的过程。,2.基本术语 总体与元素:总体通常与构成它的元素共同定义: 总体是构成它的所有元素的集合,而元素则是构成 总体的最基本单位。总体中所包含的元素数目用字母N表示。(如对某省大学生择业倾向的社会调查) PS:定义的总体称为目标总体,从目标总体中去掉一部分无法接触的元素后的总体称为调查总体。(调查总体略小于目标总体),样本 样本就是从总体中按一定方式抽取
2、出的一部分元素的集合。或者说,一个样本就是总体的一个子集。样本中所包含元素数目用字母n表示。 如从某省总共32万名大学生的总体中,按一定的方式抽取出1000名大学生进行调查,这1000名大学生就构成该总体的一个样本。,抽样,从组成某个整体的所有元素的集合中,按一定的方式选择或抽取一部分元素的过程。 比如,从1000户家庭构成的总体中,按一定的方式抽取一个由100户家庭构成的样本的过程。,抽样单位 抽样单位就是一次直接的抽样所使用的基本单位。抽样单位与构成总体的元素有时是相同的,有时又是不同的。 如从32万名大学生抽取1000大学生,单个大学生既是元素,又是抽样单位;但是,抽取40个班级(假定正
3、好是1000名)时,抽样单位与构成总体的元素就不一样了。,抽样框 抽样框又叫抽样范围,它指的是一次抽样时总体中所有抽样单位的名单。 如从一所中学的所有学生中,直接抽取200名学生作为调查的样本,那么,这所中学全体学生的名单就是这次抽样的抽样框。,参数值 参数值也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。在统计中最常见的参数值是总体某一变量的平均数。 如某市待业青年的平均年龄、某工厂工人的平均收入等。,统计值 统计值也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。,置信度 又称置信水平,指的是总体
4、参数值落在样本统计值某一区间内的概率。反映的是抽样的可靠性程度。,置信区间 指在一定的置信度下,样本统计值与总体参数值之间的误差范围。反映的是抽样的精确性程度。,二、抽样的作用 向人们提供一种实现“由部分认识整体”这一目标的途径和手段。,日常生活中的抽样,第二节 抽样的类型与抽样程序,一、抽样的类型 从大的方面看,各种抽样都可以归为概率抽样与非概率抽样两大类,这是两种有着本质区别的抽样类型。,概率抽样是依据概率论的基本原理,按照随机原则进行的抽样,因而它能够避免抽样过程中的人为误差,保证样本的代表性。 而非概率抽样则主要是依据研究者的主观意愿、判断或是否方便等因素来抽取对象,它不考虑抽样中的等
5、概率原则,因而往往产生较大的误差,难以保证样本的代表性。,在概率抽样与非概率抽样这两大类中,还可以细分出若干不同的形式,具体情况见下图,二、 概率抽样的基本原理 概率抽样是按照随机原则选择样本,完全不带调查者的主观意识,使总体中每一个体都具有一个已知不为零的被选机会进入样本。如果总体中的每一个体被抽取为样本的概率相同,那么从这个总体抽取的样本,就具有对该总体的代表性。,三、抽样分布 根据概率的原则而成立的理性分布,显示出从一个总体中不断抽取样本时,各种可能出现的样本统计值的分布情况。,四、抽样的一般程序,界定总体,制定抽样框,决定抽样方案,实际抽取样本,评估样本质量,界定总体 界定总体就是在具
6、体抽样前,首先对从中抽取样本的总体范围与界限作明确的界定。这一方面是由抽样的目的所决定的,因为抽样虽然只是对总体中的一部分个体实施,但其目的却是为了描述和认识总体的状况与特征,是为了发现总体中存在的规律性,因此必须事先明确地界定总体的范围;另一方面,界定总体也是达到良好的抽样效果的前提条件。如果不清楚明确地界定总体的范围与界限,那么,即使采用严格的抽样方法,也可能抽出对总体严重缺乏代表性的样本来。 1936年美国总统大选的民意测验 文摘,2. 制定抽样框 这一步骤的任务就是依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框。 对某大学进
7、行一项该校大学生就业观的抽样调查,3. 决定抽样的方案 从前面有关抽样类型的介绍中,我们已经了解到具体的抽样方法有好几种,而各种不同的抽样方法都有自身的特点和适用范围。因此,对于具有不同研究目的、不同范围、不同对象和不同客观条件的社会科学研究来说,所适用的抽样方法也不一样。这就需要我们在具体实施抽样之前,依据研究的目的要求、依据各种抽样方法的特点,以及其它有关因素决定具体采用哪种抽样方法。除了抽样方法的确定性以外,还要根据要求确定样本的规模以及主要目标量的精确程度。,4. 实际抽取样本 实际抽取样本的工作就是在上述几个步骤的基础上,严格按照所选定的抽样方法,从抽样框中抽取一个个的抽样单位,构成
8、样本。依据抽样方法的不同,以及依据抽样框是否可以事先得到等因素,实际的抽样工作既可能在研究者到达实地之前就完成,也可能需要到达实地后才能完成。即既可能先抽好样本,再下去直接对预先抽好的对象进行调查或研究;也可能一边抽取样本一边就开始调查或研究。,5. 评估样本质量 评估样本的基本方法是:将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标的资料进行对比。若二者之间的差别很小,则可认为样本的质量较高,代表性较大;反之,若二者之间的差别十分明显,那么样本的质量和代表性就一定不会很高。 男生78%,女生22%,本省64%,外省36% 男生76%,女生24%,本省67%,外省33%,五、抽
9、样设计的原则 1.目的性原则 2.可行性原则 3.高效性原则,第三节 样本规模与抽样误差,一、 样本规模及其计算 1.定义:样本规模又称样本容量,指的是样本中所含元素的多少。确定样本规模是每一项具体的社会调查所必须解决的问题之一。 不能少于100个元素,2.简单随机抽样中样本规模计算公式: a,推论总体平均数,b,推论总体成数(百分比),当P=0.5时,以上公式变为:,二、影响样本规模确定的因素 1.总体的规模 样本规模与总体规模有关,这不难理解。按一般的想法,总体越大时,则样本也要越大,这样才能保证一定的精度。但是,这种想法只在一定程度上是正确的。当总体规模大到一定程度时,样本规模的增加与它
10、并不保持同等的增长速度。,2.抽样的精确性要求 抽样的目的往往是要从样本去推论总体。影响样本规模确定的第二个因素,就与这种推论的可靠性和精确性密切相关。在社会科学研究中,我们用置信度与置信区间这两个概念来说明样本规模与抽样的可靠性及精确性之间的关系。,3.总体的异质性程度 一般来说,要达到同样的精确性,在同质性程度高的总体中抽样时,所需要的样本就小一些;而在异质性程度高的总体中抽样时,所需要的样本规模就大一些。,4.调查者所拥有的经费、人力和时间 从样本的代表性、抽样的精确性考虑,则样本规模当然是越大越好;但抽样所得到的样本是要用来进行调查的。样本规模越大,同时也意味着所需要投入的人力、物力和
11、时间越多;意味着所可能受到的限制和障碍也就越多。,三、样本规模与抽样误差 1.定义:抽样误差就是用样本统计值去估计总体参数值时所出现的误差,它是由于抽样本身的随机性所引起的误差,无论采取什么样的抽样方式,这种误差都是不可避免的。 ps:抽样误差的的大小是可以在样本设计中事先进行控制的。,2.抽样误差的决定因素: 总体的分布方差+抽样规模,3.样本规模与抽样误差关系: 第一, 对于较小的样本来说,样本规模小幅度变化,便会带来精确性方面很明显的变化。 第二, 对于比较大的样本来说,样本规模小幅度变化,不会对精确度造成明显影响。,4.度量误差 指除抽样误差之外,抽样调查中存在的另外一种误差。也称作非抽样误差。是在整个调查过程中产生的,在调查访问、回答、记录、填写、汇总、录入等工作中所出现的各种误差。,一项调查的总误差中,既包含抽样误差,又包含非抽样误差。这两者同时与样本规模有关。样本规模扩大,抽样误差会减少,但非抽样误差又会增大。正确的做法是在抽样误差和非抽样误差间保持适当的平衡。,
限制150内