抽样技术第二章_简单随机抽样xx.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《抽样技术第二章_简单随机抽样xx.pptx》由会员分享,可在线阅读,更多相关《抽样技术第二章_简单随机抽样xx.pptx(129页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 简单随机抽样简单随机抽样第二章第二章 简单随机抽样简单随机抽样2.1 概述概述2.2 简单估计量及其性质简单估计量及其性质2.3 比率估计量及其性质比率估计量及其性质2.4 回归估计量及其性质回归估计量及其性质2.5 简单随机抽样的实施简单随机抽样的实施概述概述一、简单随机抽样一、简单随机抽样(或单纯随机抽样)(或单纯随机抽样) 本书一般局限于不放回随机抽样本书一般局限于不放回随机抽样二、实施方法二、实施方法三、地位、作用三、地位、作用 是其他抽样方法基础是其他抽样方法基础l案例案例 在在19361936年美国总统选举前,一份颇有名气的杂年美国总统选举前,一份颇有名气的杂志进行了
2、民意测验,调查兰登与罗斯福谁将当选下志进行了民意测验,调查兰登与罗斯福谁将当选下届总统。为了了解公众意向,调查者通过电话簿和届总统。为了了解公众意向,调查者通过电话簿和汽车登记簿给大批人发了调查表,通过分析回收的汽车登记簿给大批人发了调查表,通过分析回收的调查表,显示兰登非常受欢迎。因此该杂志预测兰调查表,显示兰登非常受欢迎。因此该杂志预测兰登将获胜。登将获胜。 实际选举结果正好相反,最后罗斯福在选举中实际选举结果正好相反,最后罗斯福在选举中获胜。其数据如下:获胜。其数据如下: 候选人候选人 预测结果预测结果(%) 选举结果(选举结果(%) Landon 57 38 Roosevelt 43
3、62l问题一:对于一个确定的总体其样本唯一吗?问题一:对于一个确定的总体其样本唯一吗?l问题二:如何科学地抽取样本?怎样使抽取问题二:如何科学地抽取样本?怎样使抽取的样本充分地反映总体的情况?的样本充分地反映总体的情况? 合理、公平合理、公平2.1定义与符号定义与符号l定义定义2.1 从总体的从总体的N个单元中,一次整批抽取个单元中,一次整批抽取n个单元,使任何一个单元被抽中的概率都相等,个单元,使任何一个单元被抽中的概率都相等,任何任何n个不同单元组成的组合被抽中的概率也个不同单元组成的组合被抽中的概率也都相等,这种抽样称为简单随机抽样都相等,这种抽样称为简单随机抽样.l定义定义2.2 从总
4、体的从总体的N个单元中,逐个不放回抽个单元中,逐个不放回抽取单元,每次抽取到尚未入样的任何一个单元取单元,每次抽取到尚未入样的任何一个单元的概率都相等,直到抽足的概率都相等,直到抽足n个单元为止,这样个单元为止,这样所得的所得的n个单元组成一个简单随机样本个单元组成一个简单随机样本.l定义定义2.3 按照从总体的按照从总体的N个单元中抽取个单元中抽取n个单元的个单元的所有可能不同组合构造所有可能的所有可能不同组合构造所有可能的 个样本,个样本,从中随机抽取一个样本,使每个样本被抽到的从中随机抽取一个样本,使每个样本被抽到的概率都等于概率都等于1/ ,这种抽样称为简单随机抽样。,这种抽样称为简单
5、随机抽样。l注意:定义注意:定义2.1与定义与定义2.3是等价的。是等价的。l 三个定义之间的联系三个定义之间的联系nNCnNCl证明不放回无序:按定义证明不放回无序:按定义1,每个样本被抽中的概率相,每个样本被抽中的概率相同,即为同,即为 。 证明:设被抽中的单元号码:证明:设被抽中的单元号码:1,2,3n 对应的观察值为:对应的观察值为: 在有序逐个抽取时,样本的概率为:在有序逐个抽取时,样本的概率为:在无序情况下,一个包含在无序情况下,一个包含n 个指定单元的样本,其单元抽个指定单元的样本,其单元抽取的顺序共有取的顺序共有 种不同的形式,因此抽取到包含这种不同的形式,因此抽取到包含这n个
6、样个样本的总概率:本的总概率:nNC1nyyy.2, 1 !111.11.1,././,.12, 11212, 1NnNPnNNNyyyyPyyPyPyyyPnNnnn! nnNCnNnN1!.! 抽取抽取原则原则:A.随机原则随机原则B.每个抽样单元被抽中的概率已知或事先确定每个抽样单元被抽中的概率已知或事先确定C.每个抽样单元被抽中的概率相等每个抽样单元被抽中的概率相等l注意:注意:(1)它要求被抽取的样本)它要求被抽取的样本是是有限总体有限总体、具体总体、具体总体、 与抽样框一致的总体与抽样框一致的总体;(2)它是从总体中逐个抽取;)它是从总体中逐个抽取;(3)它是一种不放回的抽样;)它
7、是一种不放回的抽样;(4)它是一种等概率的抽样)它是一种等概率的抽样。 (二)类型:(二)类型: 放回放回简单随机抽样:有序、无序简单随机抽样:有序、无序 不放回不放回简单随机抽样:有序、无序简单随机抽样:有序、无序放回简单随机抽样放回简单随机抽样【例】【例】设总体有设总体有5个单元(个单元(1,2,3,4,5),按),按放回简单随机抽样的方式抽取放回简单随机抽样的方式抽取2个单元,则所有个单元,则所有可能的样本个数为:可能的样本个数为: 1,12,13,14,15,11,22,23,24,25,21,32,33,35,35,31,42,43,44,45,41,52,53,54,55,5放回简
8、单随机抽样所有可能的样本放回简单随机抽样所有可能的样本:重复重复顺序顺序放回有序放回有序SRSWR (考虑样本单元的顺序):(考虑样本单元的顺序): 如如1,2和和2,1作为不同的样本。作为不同的样本。 所有可能的样本个数:所有可能的样本个数: 每个样本被抽中的概率为每个样本被抽中的概率为 。2552nNnN1l放回无序(不考虑样本单元的顺序):放回无序(不考虑样本单元的顺序):151025261CCnnN1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5l特点:特点: 每次抽样时,总体的结构不
9、变,抽样是每次抽样时,总体的结构不变,抽样是相互独立进行的;相互独立进行的; 总体单元有可能多次被抽中的机会。总体单元有可能多次被抽中的机会。 不放回简单随机抽样不放回简单随机抽样l不放回有序不放回有序 (考虑样本单元的顺序):(考虑样本单元的顺序):2052525 PPnNnNP1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5l不放回无序不放回无序SRSWOR(不考虑样本单元的顺序):(不考虑样本单元的顺序): 每个样本被抽中的概率相同,即为每个样本被抽中的概率相同,即为nNCnNC110n
10、NC1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5特点:总体单元最多只有一次被抽中的机特点:总体单元最多只有一次被抽中的机会,且被抽会,且被抽中的中的机会随抽选的次数增多而机会随抽选的次数增多而增增多。多。放回或放回或不不放回简单随机抽样的放回简单随机抽样的比较比较l由于放回简单随机抽样的特点,在实际操作中,由于放回简单随机抽样的特点,在实际操作中,人们不太可能心甘情愿地用两倍以上的费用去人们不太可能心甘情愿地用两倍以上的费用去访问同一个单元。因此,不放回简单随机抽样访问同一个单元。因此,不
11、放回简单随机抽样通常比放回简单随机抽样通常比放回简单随机抽样“有效有效”些,但由于些,但由于总体单元数多,而抽中的单元数相对较少,有总体单元数多,而抽中的单元数相对较少,有许多事件的概率习性对于放回或许多事件的概率习性对于放回或不不放回两种情放回两种情况几乎差不多,因而有时候我们常从随机放回况几乎差不多,因而有时候我们常从随机放回这一最简单的形式入手讨论问题,而将有关结这一最简单的形式入手讨论问题,而将有关结果近似地套到随机不放回的情况。果近似地套到随机不放回的情况。l本书中简单随机抽样若不特指,一般都是指本书中简单随机抽样若不特指,一般都是指不不放回抽样放回抽样( (无序无序) )。 思考:
12、思考:1.下列抽样方式是否属于简单随机抽样方式?为什下列抽样方式是否属于简单随机抽样方式?为什么?么?(1)从无限多个个体中抽出)从无限多个个体中抽出500个个体作为样本。个个体作为样本。(2)箱子里共有)箱子里共有100个零件,从中选出个零件,从中选出10个零件进个零件进行质量检验。在抽样操作中,从中任意取一个零行质量检验。在抽样操作中,从中任意取一个零件进行质量检验后,再把它放回箱子。件进行质量检验后,再把它放回箱子。2.在简单随机抽样中,某一个个体被抽中的可能在简单随机抽样中,某一个个体被抽中的可能性是(性是( )。)。A.与第与第n次抽样无关,第一次抽中的可能性大些;次抽样无关,第一次
13、抽中的可能性大些;B.与第与第n次抽样无关,每次抽中的可能性都相等;次抽样无关,每次抽中的可能性都相等;C.与第与第n次抽样无关,最后一次抽中的可能性大些;次抽样无关,最后一次抽中的可能性大些;D.与第与第n次抽样无关,每次都是等可能抽样,但每次抽样无关,每次都是等可能抽样,但每次抽中的可能性不一样;次抽中的可能性不一样; 答:答:B简单随机抽样的具体实施方法简单随机抽样的具体实施方法l常用的有抽签法和随机数法两种。常用的有抽签法和随机数法两种。l(一一)抽签法抽签法l抽签法是先对总体抽签法是先对总体N个抽样单元分别编上个抽样单元分别编上1到到N的号码,再制的号码,再制作与之相对应的作与之相对
14、应的N个号签并充分摇匀后,从中随机地抽取个号签并充分摇匀后,从中随机地抽取n个个号签号签(可以是一次抽取可以是一次抽取n个号签,也可以一次抽一个号签,连个号签,也可以一次抽一个号签,连续抽续抽n次次),与抽中号签号码相同的,与抽中号签号码相同的n个单元即为抽中的单元,个单元即为抽中的单元,由其组成简单随机样本。由其组成简单随机样本。l抽签法在技术上十分简单,但在实际应用中,对总体各单元抽签法在技术上十分简单,但在实际应用中,对总体各单元编号并制作号签的工作量可能会很繁重,尤其是当总体容量编号并制作号签的工作量可能会很繁重,尤其是当总体容量比较大时,抽签法并不是很方便,而且也往往难以保证做到比较
15、大时,抽签法并不是很方便,而且也往往难以保证做到等概率。因此,实际工作中常常使用随机数法。等概率。因此,实际工作中常常使用随机数法。 l(二二)随机数法随机数法l随机数法就是利用随机数表、随机数骰子或计随机数法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样。由于计算机产生算机产生的随机数进行抽样。由于计算机产生的随机数实际上是伪随机数,不是真正的随机的随机数实际上是伪随机数,不是真正的随机数,特别是直接采用一般现成程序时,产生的数,特别是直接采用一般现成程序时,产生的随机数往往不能保证其随机性。因此,一般使随机数往往不能保证其随机性。因此,一般使用随机数表,或用随机数骰子产生的随机数
16、,用随机数表,或用随机数骰子产生的随机数,特别在特别在n比较大时。比较大时。l1、随机数表及其使用方法、随机数表及其使用方法l随机数表是由随机数表是由0到到9的的10个阿拉伯数字进行随机排列个阿拉伯数字进行随机排列组成的表。组成的表。l所谓随机排列,即每个数字都是按等概和重复独立抽所谓随机排列,即每个数字都是按等概和重复独立抽取的方式排定的。在编制时,使用一种特制的电器或取的方式排定的。在编制时,使用一种特制的电器或用计算机,将用计算机,将0至至9的的10个数字随机地自动摇出,每个数字随机地自动摇出,每个摇出的数字就是一个随机数字。为使用方便,可依个摇出的数字就是一个随机数字。为使用方便,可依
17、其出现的次序,按行或按列分成几位一组进行排列。其出现的次序,按行或按列分成几位一组进行排列。根据不同的需要,它们所含数字的多少以及分位和排根据不同的需要,它们所含数字的多少以及分位和排列的方式尽可以不同。列的方式尽可以不同。l目前,世界上已编有许多种随机数表。其中较目前,世界上已编有许多种随机数表。其中较大的有兰德公司编制,大的有兰德公司编制,1955年出版的年出版的100万数万数字随机数表,它按五位一组排列,共有字随机数表,它按五位一组排列,共有20万组;万组;肯德尔和史密斯编制,肯德尔和史密斯编制,1938年出版的年出版的10万数万数字随机数表,它也按五位一组排列,共有字随机数表,它也按五
18、位一组排列,共有25000组。我国常用的是中国科学院数学研究组。我国常用的是中国科学院数学研究所概率统计室编印的所概率统计室编印的常用数理统计表常用数理统计表中的中的随机数表。随机数表。简单随机抽样属等概率抽样,在使用简单随机抽样属等概率抽样,在使用随机数表时,要注意以下几点:随机数表时,要注意以下几点:l每次使用时,确定使用哪页及哪行哪列的数每次使用时,确定使用哪页及哪行哪列的数字为起点,必须是随机的。字为起点,必须是随机的。 l设总体容量为设总体容量为N,若,若N的位数为的位数为r,则一定要,则一定要从从r位数中抽取。遇到位数中抽取。遇到1至至N的数可直接使用;的数可直接使用;遇到其它的数
19、不能直接使用。遇到其它的数不能直接使用。l当当r2时,可从含有起点数字左边的时,可从含有起点数字左边的r位数开位数开始,也可从右边的始,也可从右边的r位数开始。可从起点开始位数开始。可从起点开始向下抽取,也可向右抽取。但一经确定使用哪向下抽取,也可向右抽取。但一经确定使用哪一种方式,就必须用一种方式抽取全部单元号,一种方式,就必须用一种方式抽取全部单元号,中途不能变更。中途不能变更。 l在重复抽样时,遇到重复的数字应重复使用;在重复抽样时,遇到重复的数字应重复使用;在不重复抽样时,遇到重复的数字应舍去不用。在不重复抽样时,遇到重复的数字应舍去不用。随机数表法一般分下述几步:随机数表法一般分下述
20、几步:l第一步:确定起点页码,如用笔尖在随机数表上随机第一步:确定起点页码,如用笔尖在随机数表上随机指定一点,若落点数字指定一点,若落点数字(或距落点最近的数字或距落点最近的数字)为奇数,为奇数,则确定起点在第则确定起点在第1页;否则,起点在第二页。页;否则,起点在第二页。 l第二步:确定起点的行数与列数,先在表上随机指定第二步:确定起点的行数与列数,先在表上随机指定一点,由落点处的两位数确定起点的行数。由于每页一点,由落点处的两位数确定起点的行数。由于每页只有只有50行,所以当落点处的两位数大于行,所以当落点处的两位数大于50时,则取时,则取其减去其减去50的差数为行数。为保证等概性,当落点
21、处的的差数为行数。为保证等概性,当落点处的数为数为“00”时,则行数应取作时,则行数应取作50。然后依同样的方。然后依同样的方法再确定起点的列数。法再确定起点的列数。 l第三步:确定所抽样本单元的号码。从上述确定的起第三步:确定所抽样本单元的号码。从上述确定的起点开始向下点开始向下(或向右或向右),每次取一个,每次取一个r位数。通常,若所位数。通常,若所需抽的数是一位数或两位数需抽的数是一位数或两位数(即即r1或或2),则由起点开,则由起点开始,依次向右抽取较方便,达到该行右端时,从下一始,依次向右抽取较方便,达到该行右端时,从下一行左端开始继续向右抽取;若所需抽的数是三位及以行左端开始继续向
22、右抽取;若所需抽的数是三位及以上上(即即r3)则由起点开始依次向下抽取较方便,达到最则由起点开始依次向下抽取较方便,达到最后一行时,向右移后一行时,向右移10位位(或或r位位),再从第一行开始向下,再从第一行开始向下继续抽取,直到取足所需的继续抽取,直到取足所需的n个个r位数为止,以这位数为止,以这n个个r位数所对应的总体单元组成样本。位数所对应的总体单元组成样本。2、随机数骰子及其使用方法、随机数骰子及其使用方法l随机数骰子是由均匀材料制成的正二十面体随机数骰子是由均匀材料制成的正二十面体(通常的骰子是通常的骰子是正六面体,即正方体正六面体,即正方体),面上刻有,面上刻有09的数字各的数字各
23、2个。每盒骰个。每盒骰子由盒体、盒盖、泡沫塑料垫及若干个子由盒体、盒盖、泡沫塑料垫及若干个(通常是通常是36个个)不同不同颜色的骰子组成。使用随机数骰子时可以像普通骰子那样用颜色的骰子组成。使用随机数骰子时可以像普通骰子那样用投掷的方法。但正规的方法是将一个或投掷的方法。但正规的方法是将一个或n个骰子放在盒中,个骰子放在盒中,拿去泡沫塑料垫,水平地摇动盒子,使骰子充分旋转,最后拿去泡沫塑料垫,水平地摇动盒子,使骰子充分旋转,最后打开盒子,读出骰子表示的数字。一个骰子一次产生一个打开盒子,读出骰子表示的数字。一个骰子一次产生一个09的随机数。要产生一个的随机数。要产生一个m位数字的随机数,就需要
24、同时位数字的随机数,就需要同时使用使用m个骰子个骰子(事先规定好每种颜色所代表的位数,例如红色事先规定好每种颜色所代表的位数,例如红色表示百位数,蓝色表示十位数,黄色表示个位数等表示百位数,蓝色表示十位数,黄色表示个位数等),或将,或将一个骰子使用一个骰子使用m次次(规定第一次产生的数字为最高位数,最后规定第一次产生的数字为最高位数,最后一次产生的数字为最末位即个位数字等一次产生的数字为最末位即个位数字等)。特别规定。特别规定m个骰子个骰子的数字的数字(或一个骰子或一个骰子m次产生的数字次产生的数字)都为都为0时,表示时,表示1m。 l也许有人会认为,在抽样时不用随机数表,而也许有人会认为,在
25、抽样时不用随机数表,而采取随意抽选的办法也可以达到预期的抽样效采取随意抽选的办法也可以达到预期的抽样效果。表面上看,这种想法似乎有一定道理,但果。表面上看,这种想法似乎有一定道理,但实际试验的结果证明随意抽样不等于随机抽样。实际试验的结果证明随意抽样不等于随机抽样。 简单随机抽样的方法评估简单随机抽样的方法评估 l简单随机抽样对总体不加任何限制,等概率地简单随机抽样对总体不加任何限制,等概率地从总体中直接抽取样本,是最简单、最单纯的从总体中直接抽取样本,是最简单、最单纯的抽样技术,它具有计算简便的优点,是研究其抽样技术,它具有计算简便的优点,是研究其它复杂抽样技术的基础,也是比较各种抽样技它复
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 技术 第二 简单 随机 xx
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内