大众传播学研究方法抽样课件.pptx
《大众传播学研究方法抽样课件.pptx》由会员分享,可在线阅读,更多相关《大众传播学研究方法抽样课件.pptx(73页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1第五章第五章 抽样抽样第一节第一节 抽样的基本抽样的基本概念概念第二节第二节 非概率抽样非概率抽样第三节第三节 概率抽样概率抽样2 抽样设计将要解决的是调查谁的问题,即抽样设计将要解决的是调查谁的问题,即如何挑选调查对象的问题。如何挑选调查对象的问题。 要解决包括选择哪一部分作为调查对象,要解决包括选择哪一部分作为调查对象,这部分应包含的个体有多少,用什么样的这部分应包含的个体有多少,用什么样的方法进行选择,以及所选出来这一部分调方法进行选择,以及所选出来这一部分调查对象与总体间的关系是什么等问题。查对象与总体间的关系是什么等问题。3 一、为什么需要抽样一、为什么需要抽样 普查普查45 抽样
2、调查起源于统计学,抽样调查起源于统计学,18951895年,挪威统年,挪威统计学家凯尔在国际统计学会计学家凯尔在国际统计学会(International Statistical Institute, International Statistical Institute, ISI)ISI)第五届大会上提出第五届大会上提出“用代表性样本方用代表性样本方法来代替全面调查法来代替全面调查”的建议,这一年被认的建议,这一年被认为是抽样调查历史的开端。为是抽样调查历史的开端。6 抽样抽样就是从一个总体中抽取部分个体或元就是从一个总体中抽取部分个体或元素组成样本的过程。素组成样本的过程。 原因:原因: 1
3、、节省研究经费和时间、节省研究经费和时间 2、提高研究者对研究过程的管理效率、提高研究者对研究过程的管理效率7抽样的假设:抽样的假设: 1、部分是含于整体之中;、部分是含于整体之中; 2、部分与整体具有相同的特征、规律、相、部分与整体具有相同的特征、规律、相互关系及变化过程;互关系及变化过程; 3、部分能够为研究者提供一个有关整体状、部分能够为研究者提供一个有关整体状态、态度、意见和行为更加清晰的脉络。态、态度、意见和行为更加清晰的脉络。8 抽样的目的抽样的目的获得具有代表性的样本获得具有代表性的样本 代表性意味着:代表性意味着: 1、样本和总体的分布系统相同、样本和总体的分布系统相同 2、总
4、体和样本的均值相同、总体和样本的均值相同 3、总体和样本里变量之间的关系相同、总体和样本里变量之间的关系相同9二、抽样的基本概念二、抽样的基本概念 (一)总体和元素(一)总体和元素 1、总体总体 总体总体是是研究中所涉及的所有个体的集合研究中所涉及的所有个体的集合,它,它可以是一群人,一批文件,一些事件或观念可以是一群人,一批文件,一些事件或观念。 2、元素、元素 构成总体的每一个个体就是元素。构成总体的每一个个体就是元素。 例如例如,研究我国媒体对艾滋病的报道,那么研究我国媒体对艾滋病的报道,那么上万家媒体就成为本研究的总体,每一家具上万家媒体就成为本研究的总体,每一家具体的媒体是构成总体的
5、元素。体的媒体是构成总体的元素。10 确定研究的总体和元素,要依赖研究者个确定研究的总体和元素,要依赖研究者个人的判断。人的判断。 例如调查我国新闻工作者的职业意识,例如调查我国新闻工作者的职业意识,“新闻工作者新闻工作者”都包括哪些人?都包括哪些人?11 (二)样本(二)样本(sample) 按照一定方法,从按照一定方法,从总总体抽取出的部分个体体抽取出的部分个体就组成了就组成了样本样本,用它来代表总体。,用它来代表总体。 如果对如果对总总体中所有元素进行研究,称为普体中所有元素进行研究,称为普查查 (census)。)。12 如:上海地区记者生存状态调查总体限定为上海地区报纸、广播电视、杂
6、志的拥有记者证的一线采编人员,主要媒体单位包括SMG、文新集团、解放日报集团、第一财经日报、新民周刊、瞭望东方等上海主流媒体集团。被调查的200名记者以报纸平媒体记者为主要组成部分,占到样本总数的60.67%。因此本次调查样本偏向于报纸、杂志平面媒体记者。主要基于以下因素考虑:上海主流媒体中广播电视呈现一家独大的局面,文广集团是上海最大的广播电视集团,而竞争相对激烈的领域在于平面媒体。13 抽样框抽样框指的是包含总体所有元素的详细名单、指的是包含总体所有元素的详细名单、地图或其他形式的资料。可以分为名单抽样地图或其他形式的资料。可以分为名单抽样框、地图抽样框、时间抽样框等。框、地图抽样框、时间
7、抽样框等。 在抽样框中,每个元素都有自己的对应位置在抽样框中,每个元素都有自己的对应位置或顺序,通常通过编号来实现。或顺序,通常通过编号来实现。抽样框抽样框14第一节第一节 抽样的基本概念抽样的基本概念几个概念的区别几个概念的区别总体总体样本样本抽样框抽样框抽样抽样研究对象研究对象的总体的总体总总体中抽出体中抽出的成员的成员总总体的列体的列表名单表名单抽出样本抽出样本的过程的过程15假定要进行一项有关改革开放假定要进行一项有关改革开放30年来全国性报纸年来全国性报纸的广告内容方面的研究,试说明抽样过程的广告内容方面的研究,试说明抽样过程 为了简化问题,假定研究的主要目的是改革开放为了简化问题,
8、假定研究的主要目的是改革开放30年年来来人民日报人民日报、中国青年报中国青年报、光明日报光明日报三三份全国性报纸的广告规模、内容及形式等方面的变化;份全国性报纸的广告规模、内容及形式等方面的变化; 总体:总体:1978年年1月月1日至日至2007年年12月月31日在上述三份日在上述三份报纸上刊出的全部广告;报纸上刊出的全部广告; 抽样框:北京图书馆内可以查阅到的在此抽样框:北京图书馆内可以查阅到的在此30年期间上年期间上述三份报纸上的广告;述三份报纸上的广告; 抽样单位:报纸,可以按照等距抽样来进行;抽样单位:报纸,可以按照等距抽样来进行; 记录单位:每份报纸上各个版面各种类型的广告;记录单位
9、:每份报纸上各个版面各种类型的广告; 总体参数:各类报纸和版面上不同时期刊出的平均广总体参数:各类报纸和版面上不同时期刊出的平均广告条数、平均面积数、各种类型广告条数所占的比重、告条数、平均面积数、各种类型广告条数所占的比重、面积所占的比重等。面积所占的比重等。16(三)概率抽样和非概率抽样(三)概率抽样和非概率抽样 概率抽样概率抽样是根据随机原则进行的选择,每个是根据随机原则进行的选择,每个个体被选择的概率是已知的。它可以在抽样个体被选择的概率是已知的。它可以在抽样过程中避免人为因素造成的误差,还可以计过程中避免人为因素造成的误差,还可以计算出由样本推断总体时的抽样误差,因而其算出由样本推断
10、总体时的抽样误差,因而其样本能够推断总体;样本能够推断总体; 非概率抽样非概率抽样并不遵循随机原则,而是根据主并不遵循随机原则,而是根据主观意识在研究对象中进行的选择,它无法确观意识在研究对象中进行的选择,它无法确定每个个体被选中的概率是多少,无法计算定每个个体被选中的概率是多少,无法计算抽样误差,所以不能从样本推断总体。抽样误差,所以不能从样本推断总体。17(四)随机性(四)随机性 随机性随机性意味着没有任何已知的准则能够描意味着没有任何已知的准则能够描述事件或解释结果。述事件或解释结果。 随机不等于随意或随便,它是根据概率论随机不等于随意或随便,它是根据概率论的基本原理来确定样本,不遵循任
11、何已知的基本原理来确定样本,不遵循任何已知的确定的准则。的确定的准则。18三、抽样的原理三、抽样的原理 小样本、大样本小样本、大样本 为什么大样本能够代表总体?为什么大样本能够代表总体? 大数法则:总体中的每一个元素都包含着大数法则:总体中的每一个元素都包含着能够体现总体规律的稳定特征和不能体现能够体现总体规律的稳定特征和不能体现总体规律的偶然现象。总体规律的偶然现象。对某个元素来讲,对总体的结论可能不成对某个元素来讲,对总体的结论可能不成立;立;但当总体规模很大的时候,偶然现象可以但当总体规模很大的时候,偶然现象可以相互抵消,总体呈现出稳定特征。相互抵消,总体呈现出稳定特征。19 对大样本进
12、行统计分析所得出的并非是针对大样本进行统计分析所得出的并非是针对所有个体都适用的结论,而是估计一定对所有个体都适用的结论,而是估计一定概率机会下总体特征出现的可能性有多大,概率机会下总体特征出现的可能性有多大,个体所体现出的无规律的偶然性被限制在个体所体现出的无规律的偶然性被限制在“一定概率机会一定概率机会”这个前提之下。这个前提之下。2034标准常态曲线标准常态曲线21中心极限定理中心极限定理 当样本数量足够大的时候(如大于当样本数量足够大的时候(如大于30),),那么,无论总体的分布如何,其样本的平均那么,无论总体的分布如何,其样本的平均值所构成的分布都趋于正态分布。值所构成的分布都趋于正
13、态分布。 当无穷次地按照同一原则进行抽样时,虽然当无穷次地按照同一原则进行抽样时,虽然每次抽取出来的样本所包含的个体并不相同,每次抽取出来的样本所包含的个体并不相同,但是这些样本的均值的分布呈现正态分布,但是这些样本的均值的分布呈现正态分布,而且这个正态分布的中间位置(即样本的平而且这个正态分布的中间位置(即样本的平均值的平均值)就是总体的平均值。均值的平均值)就是总体的平均值。22四、抽样过程中的误差四、抽样过程中的误差 1、随机误差随机误差:不可控因素造成的误差,:不可控因素造成的误差,降低了个体被选入样本或被分析的机会。降低了个体被选入样本或被分析的机会。 案例:案例:文学摘要文学摘要的
14、厄运的厄运预测结果预测结果实际结果实际结果阿尔夫阿尔夫. .伦敦伦敦55%55%阿尔夫阿尔夫. .伦敦伦敦37%37%富兰克林富兰克林. .罗斯福罗斯福41%41%富兰克林富兰克林. .罗斯福罗斯福61%61%23文学摘要文学摘要为什么会出现为什么会出现这样严重的错误?这样严重的错误? 原因之一是抽样框和总体不原因之一是抽样框和总体不符:抽样框主要是根据电话符:抽样框主要是根据电话号码簿和汽车登记册建立的。号码簿和汽车登记册建立的。 另一个原因是由于回收率低另一个原因是由于回收率低引起的误差:总共寄出了一引起的误差:总共寄出了一百多万份问卷,但是返回的百多万份问卷,但是返回的问卷不足问卷不足2
15、5%。24 2、抽样误差抽样误差:抽样误差是指在采用随机抽:抽样误差是指在采用随机抽样技术,由调查结果推算全体时,预先能样技术,由调查结果推算全体时,预先能算出来的误差。算出来的误差。 抽样误差会受到样本规模的影响抽样误差会受到样本规模的影响:一般而一般而言,采用随机抽样时,样本规模愈大,抽言,采用随机抽样时,样本规模愈大,抽样误差愈小。样误差愈小。 抽样误差是衡量样本代表性强弱的标准。抽样误差是衡量样本代表性强弱的标准。25 样本规模样本规模是指抽样单位数,在随机抽样时是指抽样单位数,在随机抽样时必须确定必要的样本数。必须确定必要的样本数。样本数过多,浪费人力、物力、财力和样本数过多,浪费人
16、力、物力、财力和时间;时间;样本数过少,会影响调查结果的精确度,样本数过少,会影响调查结果的精确度,造成较大误差。造成较大误差。五、样本规模五、样本规模26影响样本规模的因素:影响样本规模的因素: (一)对精确性的要求(一)对精确性的要求 置信置信水平水平(confidence level):从样本推论:从样本推论总总体时,我们有多大的信心确定样本会在体时,我们有多大的信心确定样本会在可容忍误差内正确反映可容忍误差内正确反映总总体。体。 一般有一般有90%、95或或99置信置信水平。水平。 社会科学研究通常把社会科学研究通常把置信置信水平定为水平定为95。27 简单随机抽样中推论总体平均数的样
17、本规模计算公式为: 推论总体成数(或百分比)的样本规模计算公式为:222etn221epptn224etn 28简单随机抽样所需要的最小样本量简单随机抽样所需要的最小样本量抽样误抽样误差差()置信水平置信水平90%时的样时的样本规模本规模置信置信水平水平95时的时的样本规模样本规模置信置信水平水平99时的时的样本规模样本规模168069604166412170224014160375610671849442560010405272384666618926746229 (二)研究者的精力和经费(二)研究者的精力和经费 (三)总体的异质性程度(三)总体的异质性程度 总体异质性程度越高,需要的样本量
18、越大。总体异质性程度越高,需要的样本量越大。 (四)研究方法和研究目的(四)研究方法和研究目的 (五)数据分析里所涉及的变量数目(五)数据分析里所涉及的变量数目 一般来说,多变量数据分析比一元二元变一般来说,多变量数据分析比一元二元变量分析要求更大的样本规模。量分析要求更大的样本规模。30 我们能不能说我们能不能说“总体越大,样本规总体越大,样本规模越大模越大” ?31第二节第二节 非概率抽样非概率抽样 优点:优点:1.按一定的主观标准抽选样本,可以充分利按一定的主观标准抽选样本,可以充分利用已知资料。用已知资料。2.可以缩小抽样范围,节约调查时间、调查可以缩小抽样范围,节约调查时间、调查人员
19、和调查费用。人员和调查费用。 不足:不足:无法判断其误差,检查调查结果的准确性。无法判断其误差,检查调查结果的准确性。32一、偶遇抽样一、偶遇抽样(accidental or haphazard sampling) 或任意抽样、方便抽样:研究者把一定时间内或任意抽样、方便抽样:研究者把一定时间内一定环境里最容易接触到的人作为样本的方法,一定环境里最容易接触到的人作为样本的方法,如街头拦访、商业调查、试测。如街头拦访、商业调查、试测。 但是偶遇抽样不是随机的,但是偶遇抽样不是随机的, 结果偏差较大,可信程度结果偏差较大,可信程度 较低,没有足够代表性。较低,没有足够代表性。33 志愿者抽样(志愿
20、者抽样(volunteer sampling)34 志愿者抽样存在的问题:志愿者抽样存在的问题: 1、回收率低;、回收率低; 2、参加研究的志愿者往往更倾向于、参加研究的志愿者往往更倾向于“夸大夸大”真实情况。真实情况。35二、立意抽样(二、立意抽样(purposive sampling) 或目的抽样、判断抽样:指研究者根据特定或目的抽样、判断抽样:指研究者根据特定目的和主观判断而确定研究样本。目的和主观判断而确定研究样本。 适用情况:适用情况: 1、研究对象是那些难以接触的、特定总体、研究对象是那些难以接触的、特定总体中的个体中的个体 2、研究对象是独一无二的个案、研究对象是独一无二的个案
21、3、研究者清楚地知道自己的目的是试图深、研究者清楚地知道自己的目的是试图深入了解某些特定类型的人群入了解某些特定类型的人群36 三、配额抽样(三、配额抽样(quota sampling ) 根据调查目的找出与研究目的关系密切的根据调查目的找出与研究目的关系密切的特性作为配额指标,抽样时保证样本中具特性作为配额指标,抽样时保证样本中具有某种特性的比例与总体中具有这种特性有某种特性的比例与总体中具有这种特性的比例一致。的比例一致。37 配额抽样法是在分层基础上进行的。配额抽样法是在分层基础上进行的。配额抽样法的基本步骤:配额抽样法的基本步骤: 1、选择控制特性作为分层标准选择控制特性作为分层标准
22、2、分层、分层 3、确定各层样本额、确定各层样本额 4、配额指派、配额指派38 配额抽样根据其抽样方法可以分为: 1、独立控制配额抽样独立控制配额抽样,规定按独立的控制特征分配并抽取样本,即对调查对象只规定具有一定控制特征的样本抽取数目并规定配额,而不是规定具有两种或两种以上控制特征的样本抽取数目并规定配额。 2、非独立控制配额抽样非独立控制配额抽样,也称为相互控制的配额抽样或交叉控制配额抽样。是同时对具有两种或两种以上控制特征的每一个样本数目都作出具体的规定。39独立控制配额抽样案例独立控制配额抽样案例 一项研究要调查400名北京市区18-42岁的白领阶层对时尚的看法,配额的重要指标是城区、
23、性别、年龄、职业。根据已知的资料得知总体中这四个指标的大致比例,则400人的样本也应该与总体中各项指标的比例相一致:城区东城西城朝阳海淀宣武崇文合计50501001005050400性别男女400人200200年龄18-28岁29-35岁36-42岁400人100200100职业公务员企业管理公司行政事业单位大学生400人8060140804040非独立控制配额抽样非独立控制配额抽样 某大学有4000名学生,其中男生占60%,女生占40%,管理类和理工类学生各占50%,大一、大二、大三、大四的学生比例分别为40%、30%、20%和10%,现在要抽取500人进行调查,按非独立控制配额抽样,其情况
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大众 传播学 研究 方法 抽样 课件
限制150内