应用抽样技术课件第三章.ppt
《应用抽样技术课件第三章.ppt》由会员分享,可在线阅读,更多相关《应用抽样技术课件第三章.ppt(66页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 简单随机抽样简单随机抽样 本章要点本章要点 简单随机抽样是抽样中最基本、最成熟、也简单随机抽样是抽样中最基本、最成熟、也是最简单的抽样设计方式,是所有概率抽样方法是最简单的抽样设计方式,是所有概率抽样方法发展、比较的基础。发展、比较的基础。要求熟练掌握简单随机抽样的要求熟练掌握简单随机抽样的抽样方式和抽样方式和样本抽选方法样本抽选方法;熟知熟知总体均值、总体总值和总体比例总体均值、总体总值和总体比例的简的简单估计;单估计;掌握掌握样本量样本量的确定。的确定。2n从三皇五帝时的黄帝算起,直到从三皇五帝时的黄帝算起,直到19111911年清王朝灭亡,中年清王朝灭亡,中国经历了数千年的
2、漫长历史时期,在这漫长的历史长河国经历了数千年的漫长历史时期,在这漫长的历史长河之中,先后经历了之中,先后经历了8383个王朝,个王朝,出现了出现了559559位帝王位帝王。在封。在封建皇朝,臣下叩见皇帝时,先要三呼建皇朝,臣下叩见皇帝时,先要三呼 万岁万岁,这,这 万岁万岁 二字,等于是皇帝的尊称,其实真是莫大的讽刺。有史二字,等于是皇帝的尊称,其实真是莫大的讽刺。有史以来,皇帝总是要比普通人短命得多,而且大都是开国以来,皇帝总是要比普通人短命得多,而且大都是开国的皇帝比较长寿,越到后来,就越是短命。的皇帝比较长寿,越到后来,就越是短命。研究目的:为了估计我国历史上的这研究目的:为了估计我国
3、历史上的这559559位位帝王的平均寿命帝王的平均寿命,拟采用简单拟采用简单随机抽样方式随机抽样方式从历代帝王中抽选三十位作为样本。从历代帝王中抽选三十位作为样本。问题问题1 1:如何实现简单随机抽样?:如何实现简单随机抽样?问题问题2 2:如何做出具有一定可靠程度的区间估计?:如何做出具有一定可靠程度的区间估计?帝王寿命的抽样估计帝王寿命的抽样估计帝王寿命的抽样估计帝王寿命的抽样估计3第一节第一节 抽样方式抽样方式4 简单随机抽样也称纯随机抽样简单随机抽样也称纯随机抽样。(Simple Random Sampling)Simple Random Sampling)对于容量为对于容量为N N的
4、总体,抽取样本量为的总体,抽取样本量为n n的样本,的样本,若全若全部可能的样本被抽中的概率都相等部可能的样本被抽中的概率都相等,则称这样的抽,则称这样的抽样为简单随机抽样。样为简单随机抽样。一、什么是简单随机抽样一、什么是简单随机抽样例:从全班例:从全班100名学生中名学生中选出出10人作人作为代表参加座代表参加座谈会,会,将每个学生的姓名写在同将每个学生的姓名写在同样质地、同地、同样大小的大小的纸条上,投条上,投入一个入一个纸箱中充分混合均匀。然后从箱中充分混合均匀。然后从纸箱中一箱中一张接一接一张共共抽出抽出10张纸条。条。这10张纸条和其他任何条和其他任何10张纸条,被抽中条,被抽中的
5、机会都一的机会都一样。5根据抽样单位是否放回可分为根据抽样单位是否放回可分为 放回简单随机抽样(重复抽样)放回简单随机抽样(重复抽样)不放回简单随机抽样(不重复抽样)不放回简单随机抽样(不重复抽样)6(一)放回简单随机抽样(重复抽样)(一)放回简单随机抽样(重复抽样)重复抽样一般是重复抽样一般是考虑样本单位的顺序的,考虑样本单位的顺序的,可能的样本为可能的样本为 个,每个样本被抽中的概率个,每个样本被抽中的概率为为随机抽取随机抽取样本本单位位调查观测放回放回总体体继续随随机抽取机抽取特点:每次抽取都是从特点:每次抽取都是从N个总体单位中抽取,个总体单位中抽取,同一个单位有可能在同一个样本中重复
6、出现同一个单位有可能在同一个样本中重复出现7n例:用重复抽样方法(考虑顺序)例:用重复抽样方法(考虑顺序)从从5个人(年龄为个人(年龄为34,38,42,46,50岁)中随机抽取岁)中随机抽取2人构成样人构成样本本,样本个数为样本个数为 个,如下个,如下:(34,34)(34,38)(34,42)(34,46)(34,50)(38,34)(38,38)(38,42)(38,46)(38,50)(42,34)(42,38)(42,42)(42,46)(42,50)(46,34)(46,38)(46,42)(46,46)(46,50)(50,34)(50,38)(50,42)(50,46)(50,
7、50)每个样本被抽中的概率都是每个样本被抽中的概率都是1/2552=258(二)不放回简单随机抽样(不重复抽样)(二)不放回简单随机抽样(不重复抽样)不重复抽样一般是不考虑样本单位顺序的。不重复抽样一般是不考虑样本单位顺序的。样本个数:样本个数:每个样本被抽中的概率为每个样本被抽中的概率为 。随机抽取随机抽取样本本单位位调查观测继续抽抽取下一个取下一个特点特点:即同一个单位不能在样本中重复出现。:即同一个单位不能在样本中重复出现。9例:用不重复抽样方法(不考虑顺序)例:用不重复抽样方法(不考虑顺序)从从5个个人(年龄为人(年龄为34,38,42,46,50岁)岁)中中随机抽取随机抽取2人构成样
8、本共人构成样本共 个样本。所有可能样本为:个样本。所有可能样本为:每个样本被抽中的概率都是每个样本被抽中的概率都是1/10(34,38)(34,42)(34,46)(34,50)(38,42)(38,46)(38,50)(42,46)(42,50)(46,50)10实践中一般实践中一般多采用不放回简单随机抽样(不考虑顺多采用不放回简单随机抽样(不考虑顺序)序),以下讨论如无特别说明,都指这一类简单随,以下讨论如无特别说明,都指这一类简单随机抽样。机抽样。由于在重复抽样中一个单位有可能在一套样本中重由于在重复抽样中一个单位有可能在一套样本中重复多次出现,造成信息的重复,因此,复多次出现,造成信息
9、的重复,因此,在样本量一定的条件下,在样本量一定的条件下,不放回抽样提供的信息量不放回抽样提供的信息量大于放回抽样,其抽样效率更高大于放回抽样,其抽样效率更高。11二、简单随机样本的抽选方法二、简单随机样本的抽选方法n首先要将总体首先要将总体 N N 个单位从个单位从1到到 N N 编号编号,每个单位对,每个单位对应一个号;应一个号;n然后从所编的号中随机然后从所编的号中随机抽号抽号,如果抽到某个号,则,如果抽到某个号,则对应的那个单位入样,直到抽够对应的那个单位入样,直到抽够 n n 个单位为止。个单位为止。具体方法:具体方法:(一)抽签法(一)抽签法 (二)随机数法(二)随机数法 12(一
10、)抽签法(一)抽签法 当当总体不大总体不大时采用。用时采用。用同质均匀的材料同质均匀的材料制作制作N N个签,并个签,并充分混合充分混合。按这两种方法抽到的按这两种方法抽到的n个单位的个单位的样本是等价样本是等价的,的,每个样本被抽到的概率都等于每个样本被抽到的概率都等于全样本抽选法全样本抽选法全样本抽选法全样本抽选法逐个抽选法逐个抽选法逐个抽选法逐个抽选法一次抽取一个签但不放回,接着一次抽取一个签但不放回,接着抽下一个签,直到抽够抽下一个签,直到抽够n个签为个签为止,签上号码所对应的单位入样止,签上号码所对应的单位入样 从从从从N N个签中一次抽取个签中一次抽取个签中一次抽取个签中一次抽取n
11、 n个,这个,这个,这个,这n n个个个个签上的号码即为入样的单位号码签上的号码即为入样的单位号码签上的号码即为入样的单位号码签上的号码即为入样的单位号码 方方方方法法法法13随随随随机机机机数数数数法法法法利用随机数表进行抽选利用随机数表进行抽选利用随机数表进行抽选利用随机数表进行抽选利用随机数骰子进行抽选利用随机数骰子进行抽选利用随机数骰子进行抽选利用随机数骰子进行抽选 利用摇奖机进行抽选利用摇奖机进行抽选利用摇奖机进行抽选利用摇奖机进行抽选 利用计算机产生的伪随机数进行抽选利用计算机产生的伪随机数进行抽选利用计算机产生的伪随机数进行抽选利用计算机产生的伪随机数进行抽选(二)随机数法(二)
12、随机数法 当当总体较大总体较大时采用。时采用。141、利用、利用随机数表随机数表进行抽选。进行抽选。随机数表是一张由随机数表是一张由0,1,2,9这十个数字组成这十个数字组成的表,一般常用的是五位数的随机数字表。的表,一般常用的是五位数的随机数字表。10个数字在表中出现的顺序是随机的,每个数字都个数字在表中出现的顺序是随机的,每个数字都有同样的机会被抽中。有同样的机会被抽中。抽选时,可根据总体容量抽选时,可根据总体容量N N的位数决定在表中随机的位数决定在表中随机抽取相邻的几列数字。抽取相邻的几列数字。15(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)1320446903729
13、655921148103440582015847718485762465052238219607082592816420897107441090378153056195984253823839498766441286779596178346379160941642438484324683102179271635860893815795620967187955450209177055948567694022165014140141337231055093748956459529836950006195883430982507003005436748144597809277138277207646
14、463811359325568982202713812935297025080335558714011796450940957533490593566363187953051105269529384647570716750613710152369205321220343614489020861059442592477495582835983788351347870207950135289906111181840951992793222275433279374621448872265364104212667856837964830023058220097560053317614981448242
15、7130593369834574023516854138448501152705692848104410914317229733477178703611581935037463192108537957051021595118883732693442991001429085214199935937602823664随机数表随机数表 若若若若N=99N=99,n=10n=10,哪些单位入样?,哪些单位入样?,哪些单位入样?,哪些单位入样?若若若若N=830N=830,n=8n=8,哪些单位入样?,哪些单位入样?,哪些单位入样?,哪些单位入样?若若若若N=327N=327,n=8n=8,哪些单位入样
16、?,哪些单位入样?,哪些单位入样?,哪些单位入样?16 N m 1N10 1 11N100 2 101N1000 3随机数骰子是均匀材料制成的正随机数骰子是均匀材料制成的正20面体,面体,09共共10个数字随机出现在个数字随机出现在20个面上,每个数字出现个面上,每个数字出现2次。次。根据需要选取一定骰子数根据需要选取一定骰子数m,规定每种颜色的骰子,规定每种颜色的骰子所代表的位数。所代表的位数。例如,选用红、黄、蓝例如,选用红、黄、蓝3种颜色的骰子,规定红色种颜色的骰子,规定红色骰子出现的数字表示百位数,黄色骰子出现的数骰子出现的数字表示百位数,黄色骰子出现的数字表示十位数,蓝色骰子出现的数
17、字表示个位数。字表示十位数,蓝色骰子出现的数字表示个位数。所有所有m个骰子的数字均为个骰子的数字均为0时,表示时,表示10m。2 2、利利利利用用用用随随随随机机机机数数数数骰骰骰骰子子子子抽抽抽抽选选选选 173、利用摇奖机进行抽选、利用摇奖机进行抽选 各类彩票的抽奖活动通常是各类彩票的抽奖活动通常是各类彩票的抽奖活动通常是各类彩票的抽奖活动通常是利用摇奖机来完成的,我们利用摇奖机来完成的,我们利用摇奖机来完成的,我们利用摇奖机来完成的,我们也可以借助这一方法完成简也可以借助这一方法完成简也可以借助这一方法完成简也可以借助这一方法完成简单随机样本的抽取单随机样本的抽取单随机样本的抽取单随机样
18、本的抽取 184、利用计算机产生的、利用计算机产生的伪随机数伪随机数进行抽选进行抽选大多数统计软件都有现成的产生随机数的程序大多数统计软件都有现成的产生随机数的程序大多数统计软件都有现成的产生随机数的程序大多数统计软件都有现成的产生随机数的程序 利用计算机产生的随机数具有快捷、方便的特点。利用计算机产生的随机数具有快捷、方便的特点。利用计算机产生的随机数具有快捷、方便的特点。利用计算机产生的随机数具有快捷、方便的特点。但是利用计算机产生的随机数是伪随机数,并不能但是利用计算机产生的随机数是伪随机数,并不能但是利用计算机产生的随机数是伪随机数,并不能但是利用计算机产生的随机数是伪随机数,并不能保
19、证其随机性,通常产生的伪随机数有循环周期。保证其随机性,通常产生的伪随机数有循环周期。保证其随机性,通常产生的伪随机数有循环周期。保证其随机性,通常产生的伪随机数有循环周期。一般不建一般不建一般不建一般不建议使用此种方法!议使用此种方法!议使用此种方法!议使用此种方法!19第二节第二节 总体均值与总体总值总体均值与总体总值的简单估计的简单估计20春秋晋文公春秋晋文公2929岁、战国秦孝公岁、战国秦孝公5656岁、秦朝秦始皇岁、秦朝秦始皇4949岁、新朝王岁、新朝王莽莽6868岁、东汉光武帝刘秀岁、东汉光武帝刘秀6363岁、东汉顺帝刘保岁、东汉顺帝刘保3030岁、西汉哀帝岁、西汉哀帝刘欣刘欣25
20、25岁、魏文帝曹丕岁、魏文帝曹丕3939岁、昭烈帝刘备岁、昭烈帝刘备6161岁、吴大帝孙权岁、吴大帝孙权7171岁、西晋武帝司马炎岁、西晋武帝司马炎5555岁、东晋成帝司马衍岁、东晋成帝司马衍2222岁、南朝顺帝李岁、南朝顺帝李淮淮1212岁、金章宗完颜达葛岁、金章宗完颜达葛4040岁、元世祖忽必烈岁、元世祖忽必烈7979岁、北朝孝庄岁、北朝孝庄帝元子攸帝元子攸2424岁、隋炀帝杨广岁、隋炀帝杨广4949岁、唐太宗李世民岁、唐太宗李世民5151岁、唐武宗岁、唐武宗李炎李炎3232岁、南唐后主李煜岁、南唐后主李煜4242岁、北宋赵匡胤岁、北宋赵匡胤4949岁、北宋英宗赵岁、北宋英宗赵曙曙3535
21、岁、南宋宁宗赵扩岁、南宋宁宗赵扩5757岁、辽太祖耶律阿保机岁、辽太祖耶律阿保机5555岁、元太祖岁、元太祖铁木真铁木真6565岁、元文宗图帖木尔岁、元文宗图帖木尔2828岁、明太祖朱元璋岁、明太祖朱元璋7070岁、明熹岁、明熹宗朱由校宗朱由校2323岁、清圣祖玄烨岁、清圣祖玄烨6868岁、清光绪帝载恬岁、清光绪帝载恬3737岁。岁。如何根据以上数据,以如何根据以上数据,以95%95%的概率保证程度,对我国的概率保证程度,对我国559559位帝王位帝王的平均寿命作出估计?的平均寿命作出估计?从我国历史上的从我国历史上的559559位帝王中用随机数表选取了以位帝王中用随机数表选取了以下三十位,他
22、们的寿命如下下三十位,他们的寿命如下:帝王寿命帝王寿命的抽样估计的抽样估计21有关指标与符号有关指标与符号指指 标标 总总 体体 样样 本本 总值总值均值均值比例比例有限总有限总体方差体方差无限总无限总体方差体方差22一、总体均值的简单估计一、总体均值的简单估计(一)(一)简单估计量简单估计量的定义的定义n总体均值总体均值 的简单估计量为样本均值:的简单估计量为样本均值:n 23(二(二)简单估计量简单估计量 的期望与方差的期望与方差对于对于简单随机抽样(不放回),简单随机抽样(不放回),是是 的无偏估计,的无偏估计,即有即有 f=f=n n/N N 为抽样比为抽样比;1-f 1-f 为有限总
23、体校正系数。为有限总体校正系数。的方差的方差:由于每个单位的入样概率都是由于每个单位的入样概率都是n/Nn/N,不放回简单随机不放回简单随机抽样是等概率抽样。抽样是等概率抽样。24 是是 的无偏估计的无偏估计。样本方差样本方差 是总体方差是总体方差S S2 2的无偏估计量,所以的无偏估计量,所以 由于总体方差由于总体方差S2未知,需用样本方差未知,需用样本方差 估计它估计它。25(三)放回简单随机抽样的简单估计(三)放回简单随机抽样的简单估计 对于对于放回简单随机抽样(考虑顺序放回简单随机抽样(考虑顺序),),是是 的无的无偏估计偏估计由于每次抽取时总体中任一单位都有由于每次抽取时总体中任一单
24、位都有1/N1/N的概率被抽的概率被抽中,中,考虑样本单位顺序的放回简单随机抽样也是等考虑样本单位顺序的放回简单随机抽样也是等概率抽样。概率抽样。由于由于N往往很大,往往很大,N-1N,所以,所以26由于由于样本方差样本方差 是总体方差是总体方差 的无偏估计量的无偏估计量,所以,所以 可得到可得到 的无偏估计量的无偏估计量27这说明除非这说明除非 n n=1,否则在相同的样本量下,否则在相同的样本量下,放回简单随放回简单随机抽样的方差总是大于不放回的方差,机抽样的方差总是大于不放回的方差,即它的抽样效率即它的抽样效率一般比不放回简单随机抽样的低。一般比不放回简单随机抽样的低。根据抽样设计效应定
25、义:根据抽样设计效应定义:放回简单随机抽样的放回简单随机抽样的 为:为:28n【例例3.1】在某区在某区10000户家庭中,按简单随机抽样户家庭中,按简单随机抽样抽取抽取400户,调查每个月的人均伙食费(单位:元)户,调查每个月的人均伙食费(单位:元)。经计算:。经计算:n若对该地区平均每人每月的伙食费做估计,则抽若对该地区平均每人每月的伙食费做估计,则抽样标准误是多少?样标准误是多少?29n1、计算估计量、计算估计量 和样本方差和样本方差 n2、计算抽样标准误、计算抽样标准误n3、计算置信区间、计算置信区间 (1)根据给定的)根据给定的 1-1-,找到相应的,找到相应的 t 值值 (2)计算
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 抽样 技术 课件 第三
限制150内