第7章抽样与抽样分布.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第7章抽样与抽样分布.pptx》由会员分享,可在线阅读,更多相关《第7章抽样与抽样分布.pptx(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023/2/171本章学习目标本章学习目标1.1.理解随机抽样、非随机抽样两类不同抽样方法理解随机抽样、非随机抽样两类不同抽样方法的本质区别的本质区别2.2.了解重复抽样、不重复抽样下的样本可能数目了解重复抽样、不重复抽样下的样本可能数目3.3.区别简单随机抽样、类型抽样、等距抽样、整区别简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样等不同的随机抽样组织形式群抽样、多阶段抽样等不同的随机抽样组织形式4.4.了解总体分布、样本分布、抽样分布的关系,了解总体分布、样本分布、抽样分布的关系,明确二项分布、正态分布、明确二项分布、正态分布、t t分布、分布、2 2分布等重要分布等重要分布的特
2、征分布的特征5.5.理解抽样分布的理论基础理解抽样分布的理论基础6.6.重点掌握样本均值、样本比例在不同条件下的重点掌握样本均值、样本比例在不同条件下的抽样分布抽样分布第1页/共81页2023/2/172一、抽样概述一、抽样概述(一)(一)抽样的方法抽样的方法(二)(二)随机抽样的组织形式随机抽样的组织形式(三)(三)抽样方案的设计抽样方案的设计第2页/共81页2023/2/173(一)(一)抽样的方法抽样的方法随机抽样方便抽样方便抽样判断抽样判断抽样自愿样本自愿样本滚雪球抽样滚雪球抽样定额抽样定额抽样非随机抽样非随机抽样常用的抽样方法常用的抽样方法重复抽样不重复抽样考虑顺序抽样不考虑顺序抽样
3、第3页/共81页2023/2/174根根据据随随机机原原则则从从总总体体中中直直接接抽抽选选部部分分单单位位构构成成样样本本的的方方法法。也称概率抽样也称概率抽样特点特点按随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的 某一总体单位能否被抽中,与其它单位是否被抽中没有关联。随机抽样随机抽样第4页/共81页2023/2/175重复抽样重复抽样从总体从总体N N个单位中随机抽取一个样本容量个单位中随机抽取一个样本容量为为n n的样本,每次从总体中抽取一个,并的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新参把结果登记下来,又
4、放回总体中重新参加下一次的抽选。又称加下一次的抽选。又称放回抽样放回抽样不重复抽样不重复抽样每次从总体中抽选一个单位后就不每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又再将其放回参加下一次的抽选。又称称不放回抽样不放回抽样.总体单位数总体单位数N N不变,同一单位可能不变,同一单位可能多次被抽中。多次被抽中。总体单位数减少总体单位数减少n n,同一单位只可能,同一单位只可能被抽中一次。被抽中一次。随机抽选样本的方式随机抽选样本的方式 第5页/共81页2023/2/176考虑顺序的重复抽样考虑顺序的重复抽样可能的样本数目可能的样本数目不考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺
5、序的不重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样考虑顺序的不重复抽样考虑各单位的中选顺序ABBAABBA不考虑各单位的中选顺序。ABABBABA第6页/共81页2023/2/177【例例1 1】某一总体含有某一总体含有A A、B B、C C、D D、E E共共5 5个总体单位,从个总体单位,从中随机抽取中随机抽取2 2个单位构成样本,可能的样本数目有多少?个单位构成样本,可能的样本数目有多少?采用考虑顺序的重复抽样,样本可能数目为采用考虑顺序的重复抽样,样本可能数目为55=2555=25个个 采用不考虑顺序的重复抽样,样本可能数目为(采用不考虑顺序的重复抽样,样本可能数目为(5 52
6、2+5+5)/2=15/2=15个个 采用不考虑顺序的不重复抽样,样本可能数目为采用不考虑顺序的不重复抽样,样本可能数目为 5 5!/(2 2!(5-25-2)!)!=10=10个个 采用考虑顺序的不重复抽样,样本可能数目为采用考虑顺序的不重复抽样,样本可能数目为54=2054=20个个 第7页/共81页2023/2/178相对于概率抽样而言抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查有方便抽样、判断抽样、自愿样本、定额抽样等方式 非随机抽样非随机抽样第8页/共81页2023/2/179方便抽样方便抽样调查过程中由调查员依据方便的原则,
7、自行确定入抽样本的单位调查员在街头、公园、商店等公共场所进行拦截调查厂家在出售产品柜台前对路过顾客进行的调查优点:容易实施,调查的成本低缺点:样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体第9页/共81页2023/2/1710判断抽样判断抽样研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本有重点抽样,典型抽样,代表抽样等方式判断抽样是主观的,样本选择的好坏取决于调研者的判断、经验、专业程度和创造性抽样成本比较低,容易操作样本是人为确定的,没有依据随机的原则,调查结果不能用于对推断总体第10页/共81页2023/2/1711自愿样本自愿样本被调查
8、者自愿参加,成为样本中的一分子,向调查人员提供有关信息例如,参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等,都属于自愿样本自愿样本与抽样的随机性无关样本是有偏的不能依据样本的信息推断总体第11页/共81页2023/2/1712定额抽样定额抽样先将体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位操作简单,可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似抽取具体样本单位时,不是依据随机原则,属于非概率抽样 第12页/共81页2023/2/1713随机抽样与非随机抽样的比随机抽样与非随机抽样的比
9、较较随机抽样依据随机原则抽选样本样本统计量的理论分布存在可根据调查的结果推断总体非随机抽样不是依据随机原则抽选样本样本统计量的分布是不确定的使用样本结果推断总体的效果要差一些第13页/共81页2023/2/17141 1 简单随机抽样(纯随机抽样)简单随机抽样(纯随机抽样)根据随机原则直接从总体中抽取单位构成样根据随机原则直接从总体中抽取单位构成样本的一种抽样方式。本的一种抽样方式。仅适用于规模不大、分布比较均匀的总体仅适用于规模不大、分布比较均匀的总体(二)随机抽样的组织方式(二)随机抽样的组织方式每个容量为每个容量为n n的样本都有同等机会的样本都有同等机会(概率概率)被抽中被抽中简单、直
10、观,是最简单、最基本、最符合随机原简单、直观,是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式则,但同时也是抽样误差最大的抽样组织形式一般有抽签、抓阄、随机数码表、抽样函数等一般有抽签、抓阄、随机数码表、抽样函数等 第14页/共81页2023/2/171563271 59986 71744 51102 15141 80714 58683 93108 13554 7994588547 09896 95436 79115 08303 01041 20030 63754 08459 28364 55957 57243 83865 09911 19761 66355 40102
11、26646 60147 1570246276 87453 44790 67122 45573 84358 21625 16999 13385 2278255363 07449 34835 15290 76616 67191 12777 21861 68689 0326369393 92785 49902 58447 42048 30378 87618 26933 40640 1628113186 29431 88190 04588 38733 81290 89541 70290 40113 0824317726 28652 56836 78351 47327 18518 92222 55201
12、 27340 1049336520 64465 05550 30157 82242 29520 69753 72602 23756 5493581628 36100 39254 56835 37636 02421 98063 89641 64953 99337 在随机数码表中,可以从任何一个位置、任何方在随机数码表中,可以从任何一个位置、任何方向开始挑选随机数字。一旦选择一个任意起点,就采向开始挑选随机数字。一旦选择一个任意起点,就采用事先确定的程序抽取样本。用事先确定的程序抽取样本。随机数字表随机数字表(摘录)(摘录)第15页/共81页2023/2/17162 2 类型抽样(分类抽样或分层抽
13、样)类型抽样(分类抽样或分层抽样)将总体全部单位分类,形成若干个类型组,然后从将总体全部单位分类,形成若干个类型组,然后从各类型中分别随机抽取若干单位组成样本的抽样形式。各类型中分别随机抽取若干单位组成样本的抽样形式。总体总体N N样本样本n n等比例抽取等比例抽取不等比例抽取不等比例抽取 能使样本结构更接近于总体结构,提高样本的能使样本结构更接近于总体结构,提高样本的代表性,适宜于单位标志值差异程度较大的总体,代表性,适宜于单位标志值差异程度较大的总体,能同时推断总体指标和各组的指标能同时推断总体指标和各组的指标第16页/共81页2023/2/17173 3 等距抽样(机械抽样或系统抽样)等
14、距抽样(机械抽样或系统抽样)将总体单位按某一标志排序,然后按相等间隔将总体单位按某一标志排序,然后按相等间隔抽取样本单位构成样本的抽样形式抽取样本单位构成样本的抽样形式随机起点随机起点半距起点半距起点对称起点对称起点(总体单位按某一标志排序)(总体单位按某一标志排序)按无关标志排队,其抽样效果相当于简单随机抽样;按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。按有关标志排队,其抽样效果相当于类型抽样。第17页/共81页2023/2/17184 4 整群抽样整群抽样 将总体全部单位分为若干将总体全部单位分为若干“群群”,然后随机抽,然后随机抽取一部分取一部
15、分“群群”,被抽中群体的所有单位构成样本,被抽中群体的所有单位构成样本的抽样方式。的抽样方式。例:总体群数例:总体群数R=16 R=16 样本群数样本群数r=4r=4A AB BC CD DE EF FG GH HI IJ JK KL LM MN NO OP PL LH HP PD D样本容量样本容量 简单、方便,能节省人力、物力、财力和时间,简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差,产生的抽样误差较大。但其样本代表性可能较差,产生的抽样误差较大。第18页/共81页2023/2/17195 5多阶段抽样多阶段抽样 指分两个或两个以上的阶段来完成抽取样本指分两个或两个以上
16、的阶段来完成抽取样本单位过程的抽样方式单位过程的抽样方式例:在某省有例:在某省有100100多万农户,需要抽取多万农户,需要抽取10001000户户调查农户生产性投资情况。调查农户生产性投资情况。第一阶段:从该省所有县中抽取第一阶段:从该省所有县中抽取5 5个县个县 第二阶段:从被抽中的第二阶段:从被抽中的5 5个县中各抽个县中各抽4 4个乡个乡 第三阶段:从被抽中的第三阶段:从被抽中的2020个乡中各抽个乡中各抽5 5个村个村 第四阶段:从被抽中的第四阶段:从被抽中的100100个村中各抽个村中各抽1010户户样本样本n=10010=1000(n=10010=1000(户户)既可以相对节约人
17、力和物力,又可以利用现成既可以相对节约人力和物力,又可以利用现成的行政区划、组织系统作为划分各阶段的依据,但的行政区划、组织系统作为划分各阶段的依据,但抽样误差的计算要复杂得多。抽样误差的计算要复杂得多。第19页/共81页2023/2/1720q调查对象的性质特点调查对象的性质特点q对调查对象的了解程度(抽样框的特点)对调查对象的了解程度(抽样框的特点)q抽样误差的大小抽样误差的大小q人力、财力和物力等条件的限制人力、财力和物力等条件的限制在实际工作中,选择适当的抽样组在实际工作中,选择适当的抽样组织方式主要应考虑:织方式主要应考虑:如何确定抽样组织方式如何确定抽样组织方式第20页/共81页2
18、023/2/1721明确调查目 的 明确总体及抽样单位 确定或构建抽样框 提出指标精度要求 选择抽样组织形式(三)抽样方案的设计(三)抽样方案的设计 确定样本容量 制定具体办法步骤 1.1.抽样方案的设计内容抽样方案的设计内容第21页/共81页2023/2/17222.2.抽样方案设计的基本原则抽样方案设计的基本原则(1 1)保证实现抽样随机性的原则)保证实现抽样随机性的原则(2 2)保证实现最大的抽样效果原则)保证实现最大的抽样效果原则3.3.抽样方案设计中的重要问题抽样方案设计中的重要问题(1 1)保证随机原则的实现)保证随机原则的实现(2 2)要考虑样本容量和结构问题)要考虑样本容量和结
19、构问题 (3 3)关于抽样的组织形式问题)关于抽样的组织形式问题(4 4)关于调查费用的问题)关于调查费用的问题第22页/共81页2023/2/1723(一)关于分布的几个概念(二)抽样分布的理论基础(三)样本均值的抽样分布(四)样本比例的抽样分布二、抽样分布二、抽样分布第23页/共81页2023/2/17241.总体变量x的概率分布,它由变量x的所有取值和与之相应的概率组成。2.反映总体分布特征的常用指标有总体均值和总体标准差1.总体分布通常是未知的总体(一)关于分布的几个概念(一)关于分布的几个概念总体分布总体分布N=FP=F/F第24页/共81页2023/2/17251.样本中各观察值的
20、概率分布,它由一个样本的所有观察值x和与之相应的概率p组成。2.样本分布的特征值主要有样本均值 与样本标准差s 3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 样样本本样本分布样本分布第25页/共81页2023/2/17261.样本统计量(样本均值,样本比例,样本方差等)的概率分布,由各样本统计量的值和与之相应的概率组成。2.样本统计量是随机变量,其结果来自容量相同的所有可能样本3.是一种理论概率分布。提供了样本统计量稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布抽样分布第26页/共81页2023/2/1727总体样本样本样本抽样分布的形成过程抽样分布的形成过
21、程计算样本统计量如:样本均值第27页/共81页2023/2/1728【例例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差及分布如下:总体分布总体分布1 14 42 23 30 00.10.10.20.20.30.3均值和方差均值和方差第28页/共81页2023/2/1729 现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,在在重重复复抽抽样条件下,共有样条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,
22、44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2 的样本(共16个)第29页/共81页2023/2/1730 计计算算出出各各样样本本的的均均值值,如如下下表表。并并给给出出样样本本均均值值的抽样分布的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)X样本均值的抽样分布1.00.10.20.3P(X)1.53.04.03.52.02.50第30页/共81页2023/2/1731比较及结论:1.样本均值的均值(数学期望)等于总体均值
23、 2.样本均值的方差等于总体方差的1/n第31页/共81页2023/2/1732 =2.5 2=1.25总体分布总体分布142300.10.20.3抽样分布抽样分布P(X)1.000.10.20.31.53.04.03.52.02.5XP(X)第32页/共81页2023/2/17331.1.进进行行 n n 次次重重复复试试验验,出出现现“成成功功”的的次次数数X X的的概概率分布称为二项分布率分布称为二项分布,记为:记为:2.2.设设X X为为 n n 次次重重复复试试验验中中事事件件A A出出现现的的次次数数,X X 取取 x x 的概率为的概率为P P二项分布二项分布X=xix1,x2,
24、xnP(X=xi)=PiP1,P2,Pn重复试验的条件:重复试验的条件:一次试验只有两个可能结果;一次试验只有两个可能结果;试验可以重复进行;试验可以重复进行;每一次试验成功的概率都是每一次试验成功的概率都是p p。第33页/共81页2023/2/17341.1.二项分布的数学期望为二项分布的数学期望为 E(X)np2.2.方差为方差为 D(X)npq二项分布的数学期望和方差二项分布的数学期望和方差:第34页/共81页2023/2/17351.1.描述连续型随机变量的最重要的分布描述连续型随机变量的最重要的分布2.2.经典统计推断的基础经典统计推断的基础3.3.若随机变量的概率密度函数为:若随
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 分布
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内