《统计学原理第五版精选PPT.ppt》由会员分享,可在线阅读,更多相关《统计学原理第五版精选PPT.ppt(72页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、STAT关于统计学原理第五关于统计学原理第五版版第1页,讲稿共72张,创作于星期二教学重点与难点:教学重点与难点:重点:抽样误差的特点及计算,总体参数的区间重点:抽样误差的特点及计算,总体参数的区间 估计法。估计法。难点:抽样平均误差的涵义与计算、区间难点:抽样平均误差的涵义与计算、区间 估计的原理及过程。估计的原理及过程。第2页,讲稿共72张,创作于星期二教学方式与学时安排教学方式与学时安排内内 容容教学方式教学方式学时学时抽样推断的抽样推断的一般问题一般问题 讲讲 授授2H2H抽样误差抽样误差讲授、讨论讲授、讨论2H2H抽样估计抽样估计抽样估计抽样估计讲授、讨论讲授、讨论2H2H抽样的组织
2、形式,抽样的组织形式,抽样必要数目的确定抽样必要数目的确定讲授、讨论讲授、讨论2H2H总学时总学时-8H8H思考练习题思考练习题抽样误差的影响因素抽样误差的影响因素样本容量的影响因素样本容量的影响因素第3页,讲稿共72张,创作于星期二5.1 抽样推断的一般问题抽样推断的一般问题一、一、抽样推断的意义抽样推断的意义概念概念 抽样推断法又称为抽样调查法,简称抽样法抽样推断法又称为抽样调查法,简称抽样法 指样本单位的抽取不受主观因素及其他系指样本单位的抽取不受主观因素及其他系指样本单位的抽取不受主观因素及其他系指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等统性因素的影响,每
3、个总体单位都有均等统性因素的影响,每个总体单位都有均等统性因素的影响,每个总体单位都有均等的被抽中机会的被抽中机会的被抽中机会的被抽中机会按照按照随机原则随机原则 从调查对象中抽取一部分单位从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总具有一定可靠程度的估计与推断,从而认识总体的一种统计方法体的一种统计方法第4页,讲稿共72张,创作于星期二特点特点 q按随机原则抽取样本单位按随机原则抽取样本单位q以部分推断总体的数量特征以部分推断总体的数量特征q抽样误差可以事先计算并控制抽样误差可以事先计算并控
4、制q抽样法运用概率估计的方法抽样法运用概率估计的方法 作用作用(见第二章)(见第二章)第5页,讲稿共72张,创作于星期二全及总体全及总体全及总体即统计总体,所要研究的调查单位的全及总体即统计总体,所要研究的调查单位的全及总体即统计总体,所要研究的调查单位的全及总体即统计总体,所要研究的调查单位的全体,简称总体或母体;全体,简称总体或母体;全体,简称总体或母体;全体,简称总体或母体;分:分:分:分:有限总体和无限总体有限总体和无限总体有限总体和无限总体有限总体和无限总体。用用用用N N表示有限总体的单位数,称表示有限总体的单位数,称表示有限总体的单位数,称表示有限总体的单位数,称总体容量总体容量
5、总体容量总体容量。样本总体样本总体样本总体或抽样总体,简称样本或子样。样本总体或抽样总体,简称样本或子样。用用n表示表示表示表示样本容量。样本容量。样本容量。样本容量。n30n30,为大样本;,为大样本;n 30n 30,为小样本,为小样本,为小样本,为小样本二、抽样估计的基本概念二、抽样估计的基本概念对同一问题,全及总体是唯一的,样本总体不唯一对同一问题,全及总体是唯一的,样本总体不唯一对同一问题,全及总体是唯一的,样本总体不唯一对同一问题,全及总体是唯一的,样本总体不唯一 第6页,讲稿共72张,创作于星期二总体单位和样本单位总体单位和样本单位 总体单位:总体单位:总体单位:总体单位:组成全
6、及总体的每一个单位或分子组成全及总体的每一个单位或分子样本单位:样本单位:样本单位:样本单位:抽样单位,构成样本的每一个单位或分子抽样单位,构成样本的每一个单位或分子 又称为又称为又称为又称为全及指标,全及指标,全及指标,全及指标,用来描述全及总体特征的综用来描述全及总体特征的综用来描述全及总体特征的综用来描述全及总体特征的综合指标。合指标。合指标。合指标。总体指标只有唯一确定的值,也称为参数总体指标只有唯一确定的值,也称为参数总体指标只有唯一确定的值,也称为参数总体指标只有唯一确定的值,也称为参数 总体指标总体指标a、总体平均数(又叫总体均值):总体平均数(又叫总体均值):第7页,讲稿共72
7、张,创作于星期二b、总体方差总体方差 ,总体标准差,总体标准差 c c、总体成数、总体成数、总体成数、总体成数 P P对总体中不能用数量表示的单位品质标志,总体参数是对总体中不能用数量表示的单位品质标志,总体参数是对总体中不能用数量表示的单位品质标志,总体参数是对总体中不能用数量表示的单位品质标志,总体参数是以总体中具有某种性质的单位数占总体全部单位数的比以总体中具有某种性质的单位数占总体全部单位数的比以总体中具有某种性质的单位数占总体全部单位数的比以总体中具有某种性质的单位数占总体全部单位数的比重来反映,这种参数称为重来反映,这种参数称为重来反映,这种参数称为重来反映,这种参数称为成数成数成
8、数成数,用,用P P表示,表示,表示,表示,QQ表示另一部表示另一部表示另一部表示另一部分成数。分成数。分成数。分成数。设总设总体容量体容量N,具有某种性质,具有某种性质,不具有某种性质不具有某种性质 第8页,讲稿共72张,创作于星期二具有某种性质的具有某种性质的单位数所占的成数单位数所占的成数不具有某种性质不具有某种性质不具有某种性质不具有某种性质的单位数所占的成数的单位数所占的成数的单位数所占的成数的单位数所占的成数若品质标志表现为若品质标志表现为“是是”、“非非”两种,称两种,称是非标志是非标志,用,用1表示表示“是是”,用,用0表示表示“非非”,则是非标志可看成,则是非标志可看成(0,
9、1)分布)分布,P是(是(0,1)分布的平均数。)分布的平均数。第9页,讲稿共72张,创作于星期二分分 组组单位数单位数变量值变量值具有某一性质具有某一性质不具有某一性质不具有某一性质N1N210合计合计均均值值第10页,讲稿共72张,创作于星期二标标准准差差方方差差当当P=1/2时时,达最大,达最大值值 第11页,讲稿共72张,创作于星期二a、样本平均数(又叫样本均值):样本平均数(又叫样本均值):用来描述样本特征的综合指标,也叫用来描述样本特征的综合指标,也叫统计量统计量,又被称为又被称为估计量或统计量估计量或统计量样本指标样本指标样本指标是随机变量,不同样本有不同的样本指标是随机变量,不
10、同样本有不同的样本指标样本指标 第12页,讲稿共72张,创作于星期二b、样本方差、标准差:样本方差、标准差:c、样本成数:样本成数:第13页,讲稿共72张,创作于星期二重复抽样重复抽样又被称作重置抽样、有放回抽样又被称作重置抽样、有放回抽样抽出抽出个体个体登记登记特征特征放回放回总体总体继续继续抽取抽取特点特点同一总体单位有可能被重复抽中,同一总体单位有可能被重复抽中,而且每次抽取都是独立进行而且每次抽取都是独立进行第14页,讲稿共72张,创作于星期二不重复抽样不重复抽样又被称作不重置抽样、不放回又被称作不重置抽样、不放回抽样抽样抽出抽出个体个体登记登记特征特征继续继续抽取抽取特点特点同一总体
11、中每个单位被抽中的机会并不同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是均等,在连续抽取时,每次抽取都不是独立进行独立进行是最为常用的抽样方法。是最为常用的抽样方法。第15页,讲稿共72张,创作于星期二样本的可能数目样本的可能数目在考虑顺序的抽样条件下,从总在考虑顺序的抽样条件下,从总体体N中随机抽取中随机抽取n个样本单位共有个样本单位共有多少种可能的抽选结果多少种可能的抽选结果 重复抽样的可能样本数目:重复抽样的可能样本数目:不重复抽样的可能样本数目:不重复抽样的可能样本数目:共共n个个第16页,讲稿共72张,创作于星期二在不考虑顺序的抽样条件下:在不考虑顺序的抽样条件
12、下:在不考虑顺序的抽样条件下:在不考虑顺序的抽样条件下:重复抽样的可能样本数目:重复抽样的可能样本数目:不重复抽样的可能样本数目:不重复抽样的可能样本数目:第17页,讲稿共72张,创作于星期二抽样单元抽样单元抽样框抽样框将总体划分成互不重叠又穷尽的有限多个部分,每个部分称为将总体划分成互不重叠又穷尽的有限多个部分,每个部分称为抽样单元。抽样单元。抽样单元有若干个体组成,当然也可以只包含一个个体抽样单元有若干个体组成,当然也可以只包含一个个体。又叫抽样结构,一份包含所有抽样单元的名单或清册。又叫抽样结构,一份包含所有抽样单元的名单或清册。在抽样框中,每个抽样单元被编上一个号码。在抽样框中,每个抽
13、样单元被编上一个号码。抽样框可以多种形式:除名单或清册外,还可以是一抽样框可以多种形式:除名单或清册外,还可以是一张地图或其他适当的形式张地图或其他适当的形式 第18页,讲稿共72张,创作于星期二一、抽样误差的概念一、抽样误差的概念5.2 抽样误差抽样误差调查结果与总体真实值之差。调查结果与总体真实值之差。抽样调查方式所产生的调查误差抽样调查方式所产生的调查误差调查误差:调查误差:抽样调查误差:抽样调查误差:抽抽样调查误样调查误差差=登登记记性性误误差差+系系统统性性误误差差+用部分推断总体而引用部分推断总体而引起的误差,可控制,起的误差,可控制,不可避免。不可避免。抽样误差抽样误差第19页,
14、讲稿共72张,创作于星期二二、抽样误差的实质二、抽样误差的实质1 1、抽样实际误差、抽样实际误差 一个总体有多个样本,每一个样本与总体之间有一个总体有多个样本,每一个样本与总体之间有一个离差,叫抽样实际误差。一个离差,叫抽样实际误差。例例5.1,设设有有4个工人,其每周工个工人,其每周工资资分分别为别为70,90,130,150元,元,从从4人中随机抽取人中随机抽取2人构成样本:人构成样本:可能产生的样本如下:可能产生的样本如下:第20页,讲稿共72张,创作于星期二重复抽样重复抽样 样本变量样本变量样本平均样本平均平均数离差平均数离差1 12 23 34 45 56 67 78 89 9101
15、011111212131314141515161670 7070 7070 9070 9070 13070 13070 15070 15090 7090 7090 9090 9090 13090 13090 15090 150130 70130 70130 90130 90130 130130 130130 150130 150150 70150 70150 90150 90150 130150 130150 150150 15070708080100100110110808090901101101201201001001101101301301401401101101201201401401
16、50150-40-40-30-30-10-100 0-30-30-20-200 01010-10-100 0202030300 0101030304040合合计计176017600 0样样本平均数本平均数的平均数的平均数等等于总体平均于总体平均数数 抽样实际抽样实际误差误差第21页,讲稿共72张,创作于星期二不重复抽样不重复抽样 样本变量样本变量样本平均样本平均平均数离差平均数离差1 12 23 34 45 56 67 78 89 910101111121270 9070 9070 13070 13070 15070 15090 7090 70 90 130 90 13090 15090 15
17、0130 70130 70130 90130 90 130 150 130 150150 70150 70150 90150 90150 130 150 130 80 801001001101108080 110 110120120100100110110 140 140110110120120140 140 -30-30-10-100 0-30-30 0 01010-10-100 0 30 300 0101030 30 合合计计1320 0 0抽样实际抽样实际误差误差第22页,讲稿共72张,创作于星期二2 2、抽样误差抽样误差抽样误差抽样误差不是某个抽样实际误差,而是所有可能的不是某个抽样实
18、际误差,而是所有可能的不是某个抽样实际误差,而是所有可能的不是某个抽样实际误差,而是所有可能的 抽样实际误差的平均值抽样实际误差的平均值抽样实际误差的平均值抽样实际误差的平均值,称抽样平均误差或平均抽,称抽样平均误差或平均抽,称抽样平均误差或平均抽,称抽样平均误差或平均抽 样误差样误差。3 3、抽样平均误差是反映抽样误差一般水平的指标,用、抽样平均误差是反映抽样误差一般水平的指标,用 表示。简称为表示。简称为表示。简称为表示。简称为抽样误差抽样误差抽样误差抽样误差。用抽样平均数(或成数)的标准差来表示用抽样平均数(或成数)的标准差来表示 令:令:M M为为全部全部样样本数,本数,总体平均数,总
19、体平均数,P总体成数。总体成数。第23页,讲稿共72张,创作于星期二抽样成数的平均误差:抽样成数的平均误差:抽样成数的平均误差:抽样成数的平均误差:抽样平均数的平均误差:抽样平均数的平均误差:抽样平均数的平均误差:抽样平均数的平均误差:第24页,讲稿共72张,创作于星期二1 1、抽样平均数的抽样误差、抽样平均数的抽样误差、抽样平均数的抽样误差、抽样平均数的抽样误差(平均数指标抽样误差)(平均数指标抽样误差)(平均数指标抽样误差)(平均数指标抽样误差)重复抽样:重复抽样:重复抽样:重复抽样:不重复抽样:不重复抽样:不重复抽样:不重复抽样:三、抽样误差的计算三、抽样误差的计算当总体很大,当总体很大
20、,n很小,可代替不重复抽样很小,可代替不重复抽样 当当N远远大于远远大于n时时 第25页,讲稿共72张,创作于星期二总体方差总体方差(总总体方差不知,用体方差不知,用样样本方差本方差如果如果n很大,也可以用很大,也可以用)代替,代替,分析:分析:*是是总总体的差异程度,反映体的差异程度,反映总总体特征,其大小与体特征,其大小与样样本本大小无关;大小无关;*不重复抽不重复抽样误样误差小于重复抽差小于重复抽样误样误差;差;受受样样本大小影响,本大小影响,n n越大,越大,越小,越小,*第26页,讲稿共72张,创作于星期二重复抽样重复抽样 样本变量样本变量样本平均样本平均平均数离差平均数离差1 12
21、 23 34 45 56 67 78 89 9101011111212131314141515161670 7070 7070 9070 9070 13070 13070 15070 15090 7090 7090 9090 9090 13090 13090 15090 150130 70130 70130 90130 90130 130130 130130 150130 150150 70150 70150 90150 90150 130150 130150 150150 150707080801001001101108080909011011012012010010011011013013
22、0140140110110120120140140150150-40-40-30-30-10-100 0-30-30-20-200 01010-10-100 0202030300 0101030304040合合计计176017600 0 离差平方离差平方160016009009001001000 09009004004000 01001001001000 04004009009000 01001009009001600160080008000第27页,讲稿共72张,创作于星期二第28页,讲稿共72张,创作于星期二不重复抽样不重复抽样 样本变量样本变量样本平均样本平均平均数离差平均数离差1 12
23、 23 34 45 56 67 78 89 910101111121270 9070 9070 13070 13070 15070 15090 7090 70 90 130 90 13090 15090 150130 70130 70130 90130 90 130 150 130 150150 70150 70150 90150 90150 130 150 130 80 801001001101108080 110 110120120100100110110 140 140110110120120140 140 -30-30-10-100 0-30-30 0 01010-10-100 0 3
24、0 300 0101030 30 合合计计1320 0 0离差平方离差平方9009001001000 09009000 01001001001000 09009000 010010090090040004000第29页,讲稿共72张,创作于星期二第30页,讲稿共72张,创作于星期二2 2、抽样成数的抽样误差(成数指标抽样误差)、抽样成数的抽样误差(成数指标抽样误差)、抽样成数的抽样误差(成数指标抽样误差)、抽样成数的抽样误差(成数指标抽样误差)重复抽样:重复抽样:不重复抽样:不重复抽样:P:总体成数,可用样本成数代替:总体成数,可用样本成数代替 第31页,讲稿共72张,创作于星期二例例5.2
25、要估计某地区要估计某地区100000名适龄儿童的入学率,名适龄儿童的入学率,随机从这一地区抽取随机从这一地区抽取500名儿童,检查有名儿童,检查有400 名儿童入学,求抽样误差。名儿童入学,求抽样误差。或:或:第32页,讲稿共72张,创作于星期二例例例例5.35.3:对某天生产的:对某天生产的:对某天生产的:对某天生产的20002000件电子元件的耐用时间件电子元件的耐用时间件电子元件的耐用时间件电子元件的耐用时间进行全面检测,又抽取进行全面检测,又抽取进行全面检测,又抽取进行全面检测,又抽取5%5%进行复测进行复测进行复测进行复测耐用时间耐用时间(小时)(小时)全面检测全面检测(件)(件)抽
26、样复测抽样复测(件)(件)3000以下以下3000-40004000-50005000以上以上506009903602305018合计合计2000100根据规定耐用时间在根据规定耐用时间在根据规定耐用时间在根据规定耐用时间在30003000小时以下为不合格品,小时以下为不合格品,小时以下为不合格品,小时以下为不合格品,根据以上资料,计算该电子元件平均耐用时间及根据以上资料,计算该电子元件平均耐用时间及根据以上资料,计算该电子元件平均耐用时间及根据以上资料,计算该电子元件平均耐用时间及合格率的抽样平均误差合格率的抽样平均误差合格率的抽样平均误差合格率的抽样平均误差第33页,讲稿共72张,创作于星
27、期二平均耐用时间的抽样平均误差平均耐用时间的抽样平均误差第34页,讲稿共72张,创作于星期二合格率的抽样平均误差合格率的抽样平均误差第35页,讲稿共72张,创作于星期二四、影响抽样误差的因素四、影响抽样误差的因素 总体各单位的差异程度(即标准差的大小):总体各单位的差异程度(即标准差的大小):越大,抽样误差越大;越大,抽样误差越大;抽样组织方式:抽样组织方式:对相同的对相同的n n,类型抽样和等距抽,类型抽样和等距抽,类型抽样和等距抽,类型抽样和等距抽 样小于简单随机抽样,单个抽样小于简单随机抽样,单个抽样小于简单随机抽样,单个抽样小于简单随机抽样,单个抽 样小于整群抽样样小于整群抽样样小于整
28、群抽样样小于整群抽样 。抽样方法抽样方法:不重复抽样的抽样误差比重复抽样的不重复抽样的抽样误差比重复抽样的不重复抽样的抽样误差比重复抽样的不重复抽样的抽样误差比重复抽样的 抽样误差小;抽样误差小;样本容量:样本容量:越大,抽样误差越小;越大,抽样误差越小;越大,抽样误差越小;越大,抽样误差越小;第36页,讲稿共72张,创作于星期二在进行抽样估计时,根据总体标志变异程度和抽样在进行抽样估计时,根据总体标志变异程度和抽样调查的任务要求确定一个可允许的误差范围,调查的任务要求确定一个可允许的误差范围,也称也称作作允许误差、误差范围允许误差、误差范围等。等。五、抽样极限误差五、抽样极限误差设:设:抽样
29、平均数极限误差抽样平均数极限误差 抽样成数极限误差抽样成数极限误差 第37页,讲稿共72张,创作于星期二或:或:第38页,讲稿共72张,创作于星期二F(t)六、抽样误差的概率度六、抽样误差的概率度 通常以抽样误差通常以抽样误差为尺度来度量抽样极限为尺度来度量抽样极限误差误差的大小,它们的数量关系为:的大小,它们的数量关系为:1 1、t t表示误差范围的倍数,称为表示误差范围的倍数,称为表示误差范围的倍数,称为表示误差范围的倍数,称为概率度。概率度。概率度。概率度。2 2、调查结果落在一定平均误差范围的概率,称为、调查结果落在一定平均误差范围的概率,称为 把握程度、概率保证程度把握程度、概率保证
30、程度把握程度、概率保证程度把握程度、概率保证程度或或置信度。置信度。置信度。置信度。第39页,讲稿共72张,创作于星期二3 3、根据大数定律的正态分布定理,抽样误差范围、根据大数定律的正态分布定理,抽样误差范围、根据大数定律的正态分布定理,抽样误差范围、根据大数定律的正态分布定理,抽样误差范围 的大小和概率的关系是:的大小和概率的关系是:的大小和概率的关系是:的大小和概率的关系是:t值值 概率保证程度概率保证程度F(t)1.00 0.6827(68.27%)1.65 0.9000(90%)1.96 0.9500(95%)2.00 0.9545(95.45)2.58 0.9900(99%)3.0
31、0 0.9973(99.73%)抽样极限误差与把握程度的大小成正比,但和准确性的要求成反比。抽样极限误差与把握程度的大小成正比,但和准确性的要求成反比。第40页,讲稿共72张,创作于星期二例例5.4,调查某县的水稻产量调查某县的水稻产量,从,从150个村中抽个村中抽30个村,若个村,若=5公斤,若要求调查结果的把握程度在公斤,若要求调查结果的把握程度在95.45%,则:,则:若若公斤,公斤,则则:公斤公斤 t=2即有即有95.45%的把握:的把握:第41页,讲稿共72张,创作于星期二5.3 抽样估计抽样估计1、指直接以样本指标估计总体指标,估指直接以样本指标估计总体指标,估 计一个确定的值。计
32、一个确定的值。简单,具体明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度与可靠程度要求不高的情况一、点估计一、点估计第42页,讲稿共72张,创作于星期二2、抽样估计量的优良标准、抽样估计量的优良标准设为待估计的总体参数,设为待估计的总体参数,为样本统为样本统计量,则的优良标准为:计量,则的优良标准为:若,则称为的无偏若,则称为的无偏估计量估计量指样本指标的均值应等于被估指样本指标的均值应等于被估计的总体指标计的总体指标无偏性无偏性第43页,讲稿共72张,创作于星期二若,则称为比更有效的估计量若,则称为比更有效
33、的估计量作为优良的估计量,除了满足无偏作为优良的估计量,除了满足无偏性的要求外,其方差应比较小性的要求外,其方差应比较小有效性有效性指随着样本单位数指随着样本单位数 的增大,样本的增大,样本估计量将在概率意义下越来越接近估计量将在概率意义下越来越接近于总体真实值于总体真实值一致性一致性第44页,讲稿共72张,创作于星期二q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量。为的无偏、有效、一致估计量。数理统计证明:数理统计证明:第45页,讲稿共72张,创作于星期二二、区间估计二、区间估计1、在一定
34、误差范围内,估计出一个可能区间、在一定误差范围内,估计出一个可能区间 2、参数区间估计三要素、参数区间估计三要素 估计值(统计量的值、样本指标值)估计值(统计量的值、样本指标值)抽样误差抽样误差 概率度(置信度)概率度(置信度)第46页,讲稿共72张,创作于星期二例例5.5,某灯具厂生产日光灯管,某灯具厂生产日光灯管100000只,从中随机抽只,从中随机抽取取500只测定其寿命,分组资料如下:只测定其寿命,分组资料如下:按日光灯耐用按日光灯耐用时间时间分分组组(小(小时时)组组中中值值x x日光灯只数日光灯只数f f850850以下以下85085095095095095010501050105
35、0105011501150115011501250125012501250以上以上80080090090010001000110011001200120013001300505010010015015011011070702020合合 计计500500试根据上述资料,以试根据上述资料,以95.45%的把握程度估计这的把握程度估计这100000只只灯管的平均耐用时间。灯管的平均耐用时间。第47页,讲稿共72张,创作于星期二解:解:或:或:第48页,讲稿共72张,创作于星期二区间估计:区间估计:有有95.45%的把握,总的把握,总体平均数落在估计区间体平均数落在估计区间内。内。置信度为置信度为95
36、.45%的置的置信区间。信区间。第49页,讲稿共72张,创作于星期二例例5.6,若灯管寿命低于,若灯管寿命低于850小时以下为不合格品,小时以下为不合格品,假设用不重复抽样抽取样本,试以假设用不重复抽样抽取样本,试以68.27%的把握程度,的把握程度,对这批灯管的不合格品率作区间估计。对这批灯管的不合格品率作区间估计。解:解:第50页,讲稿共72张,创作于星期二区间估计:区间估计:置信度为置信度为68.27%的置的置信区间。信区间。第51页,讲稿共72张,创作于星期二q调查对象的性质特点调查对象的性质特点q对调查对象的了解程度(抽样框的特点)对调查对象的了解程度(抽样框的特点)q抽样误差的大小
37、抽样误差的大小q人力、财力和物力等条件的限制人力、财力和物力等条件的限制在实际工作中,选择适当的抽样组织方在实际工作中,选择适当的抽样组织方式主要应考虑:式主要应考虑:5.4 抽样调查的组织方式抽样调查的组织方式第52页,讲稿共72张,创作于星期二一、简单随机抽样一、简单随机抽样按随机原则直接从总体中抽出若干单位构成按随机原则直接从总体中抽出若干单位构成样本。样本。是最简单、最基本、最符合随机原则,是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式但同时也是抽样误差最大的抽样组织形式又称又称完全随机抽样完全随机抽样或或纯随机抽样纯随机抽样,适用于均匀总体。,适用于均匀总体。
38、*直接抽选法直接抽选法*抽签法抽签法*随机数码表法随机数码表法 第53页,讲稿共72张,创作于星期二二、类型抽样(分层抽样)二、类型抽样(分层抽样)将总体全部单位分类,形成若干个类型组,然后将总体全部单位分类,形成若干个类型组,然后从各类型中按水剂随机原则分别抽取样本单位组成样从各类型中按水剂随机原则分别抽取样本单位组成样本。本。是一种限制随机性抽样方式,适用于情况复杂、是一种限制随机性抽样方式,适用于情况复杂、各单位之间差异较大、单位数量较多的情况。各单位之间差异较大、单位数量较多的情况。优越性优越性*提高样本代表性,提高样本指标对总体指标估计提高样本代表性,提高样本指标对总体指标估计 的准
39、确性。的准确性。*分层抽样不仅可以得到总体指标的估计值,而且分层抽样不仅可以得到总体指标的估计值,而且 可以得到各层子总体指标的估计值。可以得到各层子总体指标的估计值。第54页,讲稿共72张,创作于星期二总体总体N样本样本n等额抽取等额抽取等比例抽取等比例抽取最优抽取最优抽取抽取方式抽取方式 等比例分层抽样等比例分层抽样:各各组应组应抽取的抽取的样样本本单单位数的位数的计计算公式算公式为为:第55页,讲稿共72张,创作于星期二抽样误差的计算抽样误差的计算 先求出各先求出各层层的方差的方差(或(或)总总体方差体方差(或(或)或或 或或 为为各各层单层单位数,位数,第56页,讲稿共72张,创作于星
40、期二分层抽样的抽样平均误差与组间方差无关,分层抽样的抽样平均误差与组间方差无关,取决于组内方差的平均水平。取决于组内方差的平均水平。注意注意 应扩大组间方差,缩小组内方差应扩大组间方差,缩小组内方差 总方差总方差=组内方差组内方差+组间方差组间方差 分层抽样误差小于简单抽样误差分层抽样误差小于简单抽样误差第57页,讲稿共72张,创作于星期二三、等距抽样(机械抽样或系统抽样)三、等距抽样(机械抽样或系统抽样)将总体单位按某一标志排序,而后按一定的将总体单位按某一标志排序,而后按一定的顺序和间隔抽取样本单位。顺序和间隔抽取样本单位。随机起点随机起点随机起点随机起点(总体单位按某一标志排序)(总体单
41、位按某一标志排序)无关标志排队等距抽样无关标志排队等距抽样 抽样距离:抽样距离:起点起点 第58页,讲稿共72张,创作于星期二有关标志排队等距抽样有关标志排队等距抽样 中点等距法中点等距法 对称等距法对称等距法 第59页,讲稿共72张,创作于星期二抽样误差的计算抽样误差的计算 先求出各距离的方差先求出各距离的方差总总体方差体方差 或或 第60页,讲稿共72张,创作于星期二四、整群抽样(集体抽样)四、整群抽样(集体抽样)将总体全部单位分为若干将总体全部单位分为若干“群群”,然后随,然后随机抽取一部分机抽取一部分“群群”,对被抽中群体的所有单,对被抽中群体的所有单位进行全面调查。位进行全面调查。群
42、的抽取方法可按前面三种方法。群的抽取方法可按前面三种方法。群的抽取方法可按前面三种方法。群的抽取方法可按前面三种方法。简单、方便,能节省人力、物力、财力和时间,简单、方便,能节省人力、物力、财力和时间,简单、方便,能节省人力、物力、财力和时间,简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差。但其样本代表性可能较差。当群内差异大、群间差异小,代表性较好当群内差异大、群间差异小,代表性较好当群内差异大、群间差异小,代表性较好当群内差异大、群间差异小,代表性较好 群的划分群的划分 自然划分:自然划分:家庭,学校,村庄。家庭,学校,村庄。人为划分:人为划分:一打帽子,一箱钉子。一打帽
43、子,一箱钉子。群内单位数可相同,可不同。群内单位数可相同,可不同。第61页,讲稿共72张,创作于星期二抽样误差的计算抽样误差的计算 N分分为为R群,每群群,每群M个个单单位,位,N=RM,随机抽取,随机抽取r群。群。表示群平均数,表示群平均数,表示群的方差表示群的方差 注注整群抽样取决于群间方差,与群内方差无关。整群抽样取决于群间方差,与群内方差无关。第62页,讲稿共72张,创作于星期二五、多阶段抽样五、多阶段抽样 指分两个或两个以上的阶段来完成抽取样指分两个或两个以上的阶段来完成抽取样本单位的过程。本单位的过程。例:在某省例:在某省100多万农户抽取多万农户抽取1000户调查农户调查农户生产
44、性投资情况。户生产性投资情况。第一阶段:从该省所有县中抽取第一阶段:从该省所有县中抽取5个县个县第二阶段:从被抽中的第二阶段:从被抽中的5个县中各抽个县中各抽4个乡个乡 第三阶段:从被抽中的第三阶段:从被抽中的20个乡中各抽个乡中各抽5个村个村 第四阶段:从被抽中的第四阶段:从被抽中的100个村中各抽个村中各抽10户户样本样本n=10010=1000(户户)第63页,讲稿共72张,创作于星期二5.5 必要抽样数目的确定必要抽样数目的确定 一、意义一、意义 1、合理确定抽样必要单位数,可以控制抽样误差。、合理确定抽样必要单位数,可以控制抽样误差。2、合理确定抽样必要单位数,可以在确保样本对总、合
45、理确定抽样必要单位数,可以在确保样本对总 体的代表性的前提下,提高抽样调查的效率及经体的代表性的前提下,提高抽样调查的效率及经 济效益。济效益。二、确定抽样单位数的依据二、确定抽样单位数的依据 (或:影响抽样单位数的依据)(或:影响抽样单位数的依据)1、调查者对一项抽样推断的可靠程度和精确程度调查者对一项抽样推断的可靠程度和精确程度 的要求。的要求。(估计的概率保证程度,极限误差)(估计的概率保证程度,极限误差)第64页,讲稿共72张,创作于星期二2、总体各单位的差异程度。总体各单位的差异程度。3、抽样组织形式。抽样组织形式。类型抽样和等距抽样比简单随机抽样需要的抽样单类型抽样和等距抽样比简单
46、随机抽样需要的抽样单 位数少,单个抽样比整群抽样需要的抽样单位数少位数少,单个抽样比整群抽样需要的抽样单位数少 4、抽样方法。抽样方法。不重复抽样比重复抽样需要的抽样单位数少不重复抽样比重复抽样需要的抽样单位数少 5、另外,还要考虑人力、物力和财力的许可情况。另外,还要考虑人力、物力和财力的许可情况。三、计算公式三、计算公式 原理:原理:原理:原理:事先确定极限事先确定极限误误差,根据抽差,根据抽样误样误差公式求差公式求第65页,讲稿共72张,创作于星期二 重复抽样条件下:重复抽样条件下:第66页,讲稿共72张,创作于星期二 不重复抽样条件下:不重复抽样条件下:第67页,讲稿共72张,创作于星
47、期二【例例A A】某食品厂要检验本月生产的某食品厂要检验本月生产的1000010000袋某产品的重量,根据上月资袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为料,这种产品每袋重量的标准差为2525克。要求在克。要求在95.4595.45的概率保证程的概率保证程度下,平均每袋重量的误差范围不超度下,平均每袋重量的误差范围不超过过5 5克,应抽查多少袋产品?克,应抽查多少袋产品?第68页,讲稿共72张,创作于星期二第69页,讲稿共72张,创作于星期二【例例B】某企业对一批总数为某企业对一批总数为5000件的产件的产品进行质量检查,过去几次同类调查所品进行质量检查,过去几次同类调查所得的产品合格率为得的产品合格率为93、95、96,为了,为了使合格率的允许误差不超过使合格率的允许误差不超过3,在,在99.73 的概率保证程度下,应抽查多少件产品的概率保证程度下,应抽查多少件产品?【分析分析】因为共有三个过去的合格率的因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其资料,为保证推断的把握程度,应选其中方差最大者,即中方差最大者,即P=93。第70页,讲稿共72张,创作于星期二解:解:第71页,讲稿共72张,创作于星期二STAT感感谢谢大大家家观观看看第72页,讲稿共72张,创作于星期二
限制150内