抽样调查 (2)PPT讲稿.ppt
抽样调查第1页,共55页,编辑于2022年,星期日问题:问题:1、某研究人员想要了解杭州在校大学生每周的自习时间,、某研究人员想要了解杭州在校大学生每周的自习时间,然而对于一个拥有几十万大学生的城市来说,他的调查经费然而对于一个拥有几十万大学生的城市来说,他的调查经费是远远不够的,那么这项调查还能进行吗?如果能进行,他是远远不够的,那么这项调查还能进行吗?如果能进行,他该怎么进行,并判断结论的可靠性呢?该怎么进行,并判断结论的可靠性呢?2、某企业想调查消费者对它的产品的认知程度,如何进行,并判断、某企业想调查消费者对它的产品的认知程度,如何进行,并判断结论的可靠性呢?结论的可靠性呢?第2页,共55页,编辑于2022年,星期日抽样调查概述抽样调查概述基本概念及理论依据基本概念及理论依据 抽样平均误差抽样平均误差抽样推断抽样推断均值的推断均值的推断抽样方案的设计抽样方案的设计必要抽样单位数的确定必要抽样单位数的确定第3页,共55页,编辑于2022年,星期日第一节第一节 抽样调查概述抽样调查概述第4页,共55页,编辑于2022年,星期日 概念概念u广义:抽取部分单位观察,并根据观察结果推断总体。广义:抽取部分单位观察,并根据观察结果推断总体。n非随机抽样:非随机抽样:n随机抽样:随机抽样:通过主观判断,选取若干个有代表性的单位来推断总通过主观判断,选取若干个有代表性的单位来推断总体。体。保证总体中每个单位具有同等机会被抽中机会,抽取保证总体中每个单位具有同等机会被抽中机会,抽取样本,并推断总体。样本,并推断总体。u狭义:按照随机原则抽取部分单位观察,并运用数理统计原理,由部分狭义:按照随机原则抽取部分单位观察,并运用数理统计原理,由部分对总体做出数量上的推断分析。对总体做出数量上的推断分析。一般地,属于随机抽样。一般地,属于随机抽样。第5页,共55页,编辑于2022年,星期日特特 点点u只抽取部分单位;只抽取部分单位;u用部分推断总体;用部分推断总体;u抽样遵循随机原则;抽样遵循随机原则;u会产生抽样误差,但误差可以计算和控制。会产生抽样误差,但误差可以计算和控制。统计误差统计误差统计数字与实际数量之间的差别。统计数字与实际数量之间的差别。u登记误差:登记误差:u代表性误差:代表性误差:调查误差或工作误差,指在登记、汇总计算过程中产生的误调查误差或工作误差,指在登记、汇总计算过程中产生的误差。(可以避免的)差。(可以避免的)用部分去推断总体产生的误差。(一般不可避免)用部分去推断总体产生的误差。(一般不可避免)第6页,共55页,编辑于2022年,星期日第二节第二节 基本概念及理论依据基本概念及理论依据第7页,共55页,编辑于2022年,星期日第8页,共55页,编辑于2022年,星期日基本概念基本概念u全及总体:所要认识对象的全体。全及总体:所要认识对象的全体。n变量总体:数量标志;变量总体:数量标志;n 属性总体:品质标志;属性总体:品质标志;具有某种属性的单位占总体单位总数的比重,称为总体成具有某种属性的单位占总体单位总数的比重,称为总体成数数P P,标准差也用,标准差也用表示。表示。一般以一般以N N表示全及总体的单位总数,表示全及总体的单位总数,表示全及总表示全及总体的平均数,体的平均数,表示全及总体的标准差。表示全及总体的标准差。第9页,共55页,编辑于2022年,星期日全及总体特征的描述全及总体特征的描述 描述总体的特征一般采用均值和标准差。描述总体的特征一般采用均值和标准差。全及总体是确定的,唯一的,因此全及指标也是确定的,唯一的。全及总体是确定的,唯一的,因此全及指标也是确定的,唯一的。变量总体:变量总体:属性总体:属性总体:N N1 1 具有某种属性具有某种属性 ,N N0 0 不具有某种属性不具有某种属性 第10页,共55页,编辑于2022年,星期日u抽样总体(样本):从全及总体随机抽取得部分单位的集合体。抽样总体(样本):从全及总体随机抽取得部分单位的集合体。样本容量:一般样本容量大于样本容量:一般样本容量大于3030的称为大样本,小于的称为大样本,小于3030个单个单位数的称为小样本。位数的称为小样本。抽样比:抽样比:一般地,一般地,一般地,一个全及总体中,可以抽取多个抽样总体,即抽样一般地,一个全及总体中,可以抽取多个抽样总体,即抽样总体不是唯一的,全部样本的可能数目与每个样本的容量以及抽总体不是唯一的,全部样本的可能数目与每个样本的容量以及抽样方法有关。样方法有关。第11页,共55页,编辑于2022年,星期日抽样总体(样本)特征的描述抽样总体(样本)特征的描述 抽样总体(样本)特征也是通过均值和标准差来描述的。抽样总体(样本)特征也是通过均值和标准差来描述的。不是确定的、唯一的,因此抽样指标也不是确定的、唯一的,不是确定的、唯一的,因此抽样指标也不是确定的、唯一的,是样本变量的函数,是随机变量。是样本变量的函数,是随机变量。u变量总体:变量总体:对于分组资料采用加权的计算公式。(见第三章)对于分组资料采用加权的计算公式。(见第三章)第12页,共55页,编辑于2022年,星期日u属性总体:属性总体:n n1 1 具有某种属性具有某种属性 ,n n0 0 不具有某种属性不具有某种属性 抽样的目的就是通过观察样本的特征来推断总体的特征抽样的目的就是通过观察样本的特征来推断总体的特征,即用样本平,即用样本平均数用来推断总体平均数,而样本标准差作为总体标准差估计值(当均数用来推断总体平均数,而样本标准差作为总体标准差估计值(当总体标准差未知)用来计算总体平均数的估计区间(置信区间)。总体标准差未知)用来计算总体平均数的估计区间(置信区间)。第13页,共55页,编辑于2022年,星期日例例 某全及总体由某全及总体由1 1、2 2、3 3、4 4、5 5六个数字构成。六个数字构成。全及总体:全及总体:1 1、2 2、3 3、4 4、5 5。假设样本容量为。假设样本容量为3 3,则从全及,则从全及总体中采用不考虑顺序不重复的简单随机抽样,可以抽取出总体中采用不考虑顺序不重复的简单随机抽样,可以抽取出1010个抽样总体,这样就有个抽样总体,这样就有1010个样本平均数个样本平均数.1,2,31,2,31,3,41,3,41,4,51,4,52,3,42,3,42,4,52,4,51,3,51,3,51,2,51,2,53,4,53,4,51,2,41,2,42,3,52,3,5第14页,共55页,编辑于2022年,星期日抽样方法和样本可能数目抽样方法和样本可能数目u抽样方法抽样方法 样本数目与样本容量有关,也与抽样方法有关,样本容量既定,样本数目与样本容量有关,也与抽样方法有关,样本容量既定,则样本数目取决于抽样的方法。则样本数目取决于抽样的方法。抽样方式不同抽样方式不同重复抽样重复抽样不重复抽样不重复抽样样本要求不同样本要求不同考虑顺序抽样考虑顺序抽样不考虑顺序抽样不考虑顺序抽样 以上结合为四种抽样方法:考虑顺序的重复抽样、考虑顺序以上结合为四种抽样方法:考虑顺序的重复抽样、考虑顺序的不重复抽样、不考虑顺序的重复抽样和不考虑顺序的不重复抽的不重复抽样、不考虑顺序的重复抽样和不考虑顺序的不重复抽样。样。第15页,共55页,编辑于2022年,星期日u不同抽样方法的样本可能数目不同抽样方法的样本可能数目n考虑顺序的不重复抽样考虑顺序的不重复抽样n不考虑顺序的不重复抽样不考虑顺序的不重复抽样n考虑顺序的重复抽样考虑顺序的重复抽样n不考虑顺序的重复抽样不考虑顺序的重复抽样第16页,共55页,编辑于2022年,星期日抽样调查的理论依据抽样调查的理论依据u大数定律:证明了抽样平均数(成数)趋近于总体平均数大数定律:证明了抽样平均数(成数)趋近于总体平均数(成数)的趋势。(成数)的趋势。1 1)独立同分布大数定律:)独立同分布大数定律:2 2)贝努力大数定律:)贝努力大数定律:u中心极限定律:证明了多个随机变量和的分布趋近于正态分布。中心极限定律:证明了多个随机变量和的分布趋近于正态分布。抽样平均数就是一种随机变量。抽样平均数就是一种随机变量。1 1)独立同分布中心极限定律:)独立同分布中心极限定律:2 2)德莫佛)德莫佛拉普拉斯中心极限定律:拉普拉斯中心极限定律:第17页,共55页,编辑于2022年,星期日第三节第三节 抽样平均误差抽样平均误差第18页,共55页,编辑于2022年,星期日抽样误差的概念和理解抽样误差的概念和理解u抽样误差:来源于登记性误差和代表性误差抽样误差:来源于登记性误差和代表性误差 调查误差或工作误差,指在调查、编辑、编码、汇总过程调查误差或工作误差,指在调查、编辑、编码、汇总过程中由于观察、测量、登记、计算上的差错或被调查者提供虚假中由于观察、测量、登记、计算上的差错或被调查者提供虚假资料而引起的误差。资料而引起的误差。这种误差的直接表现就是没有真实客观地搜集或记录被调查这种误差的直接表现就是没有真实客观地搜集或记录被调查单位的标志值或标志特征,从而使所计算的统计量偏离其真实值。单位的标志值或标志特征,从而使所计算的统计量偏离其真实值。登记性误差存在于所有的统计调查中,而且调查的范围越大、调登记性误差存在于所有的统计调查中,而且调查的范围越大、调查单位越多,产生误差的可能性越大。查单位越多,产生误差的可能性越大。登记性误差与测量工具的精度、测量技术、调查人员的责登记性误差与测量工具的精度、测量技术、调查人员的责任心、被调查者的合作态度等密切相关。任心、被调查者的合作态度等密切相关。n登记性误差登记性误差第19页,共55页,编辑于2022年,星期日n代表性误差代表性误差 由于样本的分布结构与总体分布不一致所差生的误差。这部分误由于样本的分布结构与总体分布不一致所差生的误差。这部分误差来源于抽样过程以及推断总体过程中(一般不可避免)。差来源于抽样过程以及推断总体过程中(一般不可避免)。代表性误差又分为两种:代表性误差又分为两种:l偏差:系统性误差偏差:系统性误差 由非随机因素(违背随机原则)造成样本代表性不足而产生的误由非随机因素(违背随机原则)造成样本代表性不足而产生的误差。表现为样本统计量数值系统性偏高或偏低。这种误差也属于工差。表现为样本统计量数值系统性偏高或偏低。这种误差也属于工作态度、水平、技术等的问题。应尽量避免。作态度、水平、技术等的问题。应尽量避免。l随机误差:偶然性误差随机误差:偶然性误差 遵循了随机原则的原则,由偶然因素引起样本结构不能完遵循了随机原则的原则,由偶然因素引起样本结构不能完全代表总体结构而产生的误差。偶然误差不可避免,即使没全代表总体结构而产生的误差。偶然误差不可避免,即使没有登记误差和系统性误差,仍会存在误差。有登记误差和系统性误差,仍会存在误差。虽然不可避免,虽然不可避免,但可以估计和控制。偶然误差总和等于但可以估计和控制。偶然误差总和等于0 0。全面调查不存在偶然误差。全面调查不存在偶然误差。第20页,共55页,编辑于2022年,星期日抽样中的抽样中的总误差总误差登记性误差登记性误差代表性误差代表性误差系统性误差系统性误差随机误差:偶然误差随机误差:偶然误差偏差:偏差:实际误差实际误差抽样平均误差抽样平均误差随机误差可以分为实际误差和抽样平均误差随机误差可以分为实际误差和抽样平均误差 实际误差:样本指标与总体指标之间的差别,无法计算。实际误差:样本指标与总体指标之间的差别,无法计算。抽样平均误差:所有样本平均指标的标准差。可以计算。抽样平均误差:所有样本平均指标的标准差。可以计算。第21页,共55页,编辑于2022年,星期日抽样平均误差的影响因素抽样平均误差的影响因素主要受到三个因素影响:主要受到三个因素影响:l全及总体标志变动程度全及总体标志变动程度2 2。总体标志值变动越大,抽样平均。总体标志值变动越大,抽样平均误差越大,反之则越小。误差越大,反之则越小。l抽样单位数(样本容量)的多少抽样单位数(样本容量)的多少n n。其他条件不变,抽取的单。其他条件不变,抽取的单位数越多,抽样平均误差越小,反之越大。位数越多,抽样平均误差越小,反之越大。l抽样组织的方式和抽样组织形式。抽样组织的方式和抽样组织形式。第22页,共55页,编辑于2022年,星期日抽样平均误差的计算抽样平均误差的计算u理论公式理论公式 实际上,全及指标是未知的,而且实践中只会抽样一个样本。实际上,全及指标是未知的,而且实践中只会抽样一个样本。所以这个公式实践中不采用。所以这个公式实践中不采用。第23页,共55页,编辑于2022年,星期日u实际使用公式推导实际使用公式推导n 重复抽样下变量全及总体的抽样平均误差公式推导重复抽样下变量全及总体的抽样平均误差公式推导第24页,共55页,编辑于2022年,星期日所以:所以:公式说明了,抽样平均误差仅为全及总体标准差的公式说明了,抽样平均误差仅为全及总体标准差的 。第25页,共55页,编辑于2022年,星期日n不重复抽样下变量全及总体的抽样平均误差公式推导不重复抽样下变量全及总体的抽样平均误差公式推导其中其中第26页,共55页,编辑于2022年,星期日其中:第27页,共55页,编辑于2022年,星期日因此因此第28页,共55页,编辑于2022年,星期日因此,抽样平均误差为因此,抽样平均误差为 抽样比大大小于抽样比大大小于1 1时,不重复抽样的抽样平均误差与重时,不重复抽样的抽样平均误差与重复抽样的很接近复抽样的很接近第29页,共55页,编辑于2022年,星期日n属性全及总体的抽样平均误差公式推导:属性全及总体的抽样平均误差公式推导:具有某标志(取值具有某标志(取值1 1)的单位比重)的单位比重不具有某标志(取值不具有某标志(取值0 0)的单位比重)的单位比重则属性总体的平均数则属性总体的平均数第30页,共55页,编辑于2022年,星期日 根据前面推导的重复抽样和不重复抽样的公式,可得到属性根据前面推导的重复抽样和不重复抽样的公式,可得到属性总体的抽样平均误差:总体的抽样平均误差:重复抽样:重复抽样:不重复抽样:不重复抽样:第31页,共55页,编辑于2022年,星期日 实际运用中,总体标准差是未知的,采用以下实际运用中,总体标准差是未知的,采用以下方法估计:方法估计:1 1、用过去取得总体资料的标准差;、用过去取得总体资料的标准差;2 2、用样本方差代替总体方差;、用样本方差代替总体方差;3 3、用小规模的调查资料;、用小规模的调查资料;4 4、用预估的资料。、用预估的资料。进行推断时,如果总体方差未知,一般采用样本进行推断时,如果总体方差未知,一般采用样本标准差作为总体标准差的估计。标准差作为总体标准差的估计。第32页,共55页,编辑于2022年,星期日抽样平均误差计算总结抽样平均误差计算总结变量总体变量总体重复抽样重复抽样不重复抽样不重复抽样属性总体属性总体重复抽样重复抽样不重复抽样不重复抽样 不重复抽样的抽样平均误差小于重复抽样的,当抽不重复抽样的抽样平均误差小于重复抽样的,当抽样比远小于样比远小于1 1时,两者非常接近。时,两者非常接近。第33页,共55页,编辑于2022年,星期日 通过样本推断总体指标时,总体标准差往往是未知的,此时如果通过样本推断总体指标时,总体标准差往往是未知的,此时如果存在过去资料,则采用过去资料的最大标准差作为总体标准差的估计存在过去资料,则采用过去资料的最大标准差作为总体标准差的估计值;如果没有过去资料,则采用样本标准差作为总体标准差的估计值。值;如果没有过去资料,则采用样本标准差作为总体标准差的估计值。不重复抽样情况下,当总体单位总数未知时,则认为抽样比大大小不重复抽样情况下,当总体单位总数未知时,则认为抽样比大大小于于1 1,而采用重复抽样的抽样平均误差的计算公式。,而采用重复抽样的抽样平均误差的计算公式。第34页,共55页,编辑于2022年,星期日例例 某公司进口一批电子器件某公司进口一批电子器件50005000件,为了检测其寿命,抽取了件,为了检测其寿命,抽取了500500件进行件进行检验,结果如下:检验,结果如下:分别计算重复抽样和不重复抽样方式下电子器件的抽样分别计算重复抽样和不重复抽样方式下电子器件的抽样平均误差。平均误差。寿命寿命(千小时)(千小时)器件数器件数(只)(只)8 8以下以下20208-98-970709-109-1034034010-1110-1140401111以上以上3030合合 计计500500组中值组中值1501505955953230323042042034534547404740112511255057.55057.53068530685441044103967.53967.5452454524578.4178.4167.2367.230.1360.13641.6241.62122.41122.41309.8309.87.57.58.58.59.59.510.510.511.511.5第35页,共55页,编辑于2022年,星期日重复抽样下:重复抽样下:不重复抽样下:不重复抽样下:第36页,共55页,编辑于2022年,星期日例例 上题中,如果寿命低于上题中,如果寿命低于90009000小时的产品是不合格品,计算不合格小时的产品是不合格品,计算不合格率(合格率)的抽样平均误差。率(合格率)的抽样平均误差。不合格率:不合格率:重复抽样下:重复抽样下:不重复抽样下:不重复抽样下:第37页,共55页,编辑于2022年,星期日课堂练习课堂练习 某超市第三次购进福临门某超市第三次购进福临门5 5升装食用油,抽取升装食用油,抽取3030瓶进行检瓶进行检验。经检验,这验。经检验,这3030瓶食用油的平均容量为瓶食用油的平均容量为4.994.99升,以往两批食用油升,以往两批食用油容量的标准差为容量的标准差为0.120.12升和升和0.100.10升。升。1 1、计算这次检验的抽样平均误差。、计算这次检验的抽样平均误差。2 2、按规定容量、按规定容量4.94.9升为合格,这升为合格,这3030瓶食用油有瓶食用油有2 2瓶不合格,计算这批食用瓶不合格,计算这批食用油合格率的抽样平均误差。油合格率的抽样平均误差。第38页,共55页,编辑于2022年,星期日第39页,共55页,编辑于2022年,星期日第四节第四节 抽样推断抽样推断均值的推断均值的推断第40页,共55页,编辑于2022年,星期日概述概述 抽样调查的目的是为了用样本指标推断总体指标。抽样调查的目的是为了用样本指标推断总体指标。由于样本分布不可能与总体完全一致,因此存在抽样误由于样本分布不可能与总体完全一致,因此存在抽样误差(指抽样平均误差)。差(指抽样平均误差)。对总体指标的估计有两种,一种是点估计,一对总体指标的估计有两种,一种是点估计,一种是区间估计。点估计不能说明误差大小,意义不种是区间估计。点估计不能说明误差大小,意义不大,而采用区间估计,可以将误差控制在一定的范大,而采用区间估计,可以将误差控制在一定的范围内(即说明总体指标在某一范围内的可能性大小)围内(即说明总体指标在某一范围内的可能性大小)。区间估计涉及抽样极限误差、置信区间、可信程度、区间估计涉及抽样极限误差、置信区间、可信程度、概率度等概念,概率度等概念,第41页,共55页,编辑于2022年,星期日抽样极限误差抽样极限误差 由于存在误差,而且样本指标会随着样本的不同而变动,但是由于存在误差,而且样本指标会随着样本的不同而变动,但是都是围绕着总体指标变动。这样,在一定的概率下,样本指标偏离都是围绕着总体指标变动。这样,在一定的概率下,样本指标偏离总体指标的最大幅度,即样本指标与总体指标的最大离差的绝对值,总体指标的最大幅度,即样本指标与总体指标的最大离差的绝对值,称为抽样极限误差。也可以说,总体指标在一定概率下会处于样本称为抽样极限误差。也可以说,总体指标在一定概率下会处于样本指标的一定范围内,这个范围称为置信区间,即置信区间是以样本指标的一定范围内,这个范围称为置信区间,即置信区间是以样本指标为中心,以抽样极限误差为半径为一个范围。指标为中心,以抽样极限误差为半径为一个范围。变量总体变量总体属性总体属性总体第42页,共55页,编辑于2022年,星期日置信区间:置信区间:对上式去掉绝对值符号,并且移项可得到:对上式去掉绝对值符号,并且移项可得到:说明在一定可能下,总体说明在一定可能下,总体指标落在样本指标的一定指标落在样本指标的一定范围内。范围内。置信区间是统计意义上的,即一定概率下,总体指标所置信区间是统计意义上的,即一定概率下,总体指标所落在的区间,其长度等于两倍的抽样极限误差。落在的区间,其长度等于两倍的抽样极限误差。第43页,共55页,编辑于2022年,星期日可信程度可信程度 抽样平均误差说明估计的准确程度,因此可以将抽样平均抽样平均误差说明估计的准确程度,因此可以将抽样平均误差作为一种误差计量单位(当然在不同的条件下,这个单位误差作为一种误差计量单位(当然在不同的条件下,这个单位的具体值是不同的),抽样极限误差可以表示为多少个误差单的具体值是不同的),抽样极限误差可以表示为多少个误差单位(即抽样平均误差的多少倍),表示为:位(即抽样平均误差的多少倍),表示为:抽样极限误差为抽样极限误差为t t个抽样平均误差,或者是抽样极限误差的个抽样平均误差,或者是抽样极限误差的t t倍。倍。这个这个t t就称为概率度或置信度。就称为概率度或置信度。显然,概率度与抽样极限误差成正比。显然,概率度与抽样极限误差成正比。第44页,共55页,编辑于2022年,星期日(概率)(概率)第45页,共55页,编辑于2022年,星期日总体平均指标的区间估计计算步骤总体平均指标的区间估计计算步骤 根据上面的讨论,总体平均指标推断的最终结果表现为根据上面的讨论,总体平均指标推断的最终结果表现为一定概率保证程度下的置信区间。一定概率保证程度下的置信区间。l根据调查资料计算出抽样平均误差。根据调查资料计算出抽样平均误差。l根据概率保证要求,查表得出根据概率保证要求,查表得出t t值,然后计算抽样极值,然后计算抽样极 限误差。限误差。l 得出置信区间。得出置信区间。第46页,共55页,编辑于2022年,星期日简单随机抽样的必要样本容量的确定简单随机抽样的必要样本容量的确定u确定抽样单位数的原则和依据确定抽样单位数的原则和依据原则:原则:保证抽样推断能达到预期的可靠程度和精确度的要求下,确保证抽样推断能达到预期的可靠程度和精确度的要求下,确定一个适当的样本容量。定一个适当的样本容量。依据:依据:1 1、推断可靠程度和精确度要求。高则抽样单位多,反之少。、推断可靠程度和精确度要求。高则抽样单位多,反之少。2 2、总体变异程度。大则多,小则少。、总体变异程度。大则多,小则少。3 3、采用何种抽样组织方法。简单随机抽样所需要的抽样单位数、采用何种抽样组织方法。简单随机抽样所需要的抽样单位数一般大于其他抽样方法,不重复抽样需要的单位数少于重复抽样。一般大于其他抽样方法,不重复抽样需要的单位数少于重复抽样。4 4、根据成本效益原则。、根据成本效益原则。在抽样之前,要根据如概率保证程度、误差大小等要求,确定在抽样之前,要根据如概率保证程度、误差大小等要求,确定最少抽取的样本单位数量,使结论满足调查的要求。最少抽取的样本单位数量,使结论满足调查的要求。第47页,共55页,编辑于2022年,星期日u已知置信区间或抽样极限误差,总体方差或样本方差,在一定已知置信区间或抽样极限误差,总体方差或样本方差,在一定概率保证程度下,计算所需要的最少样本容量:概率保证程度下,计算所需要的最少样本容量:重复抽样:重复抽样:不重复抽样:不重复抽样:从以上公式可看出,不重复抽样的单位数少于重复抽样的单从以上公式可看出,不重复抽样的单位数少于重复抽样的单位数。位数。第48页,共55页,编辑于2022年,星期日例例 某公司对第一批次新产品的使用寿命进行测试,随机抽取了某公司对第一批次新产品的使用寿命进行测试,随机抽取了200200个产品,测得其平均寿命为个产品,测得其平均寿命为28002800小时,标准差小时,标准差100100小时。小时。1 1)以)以95%95%的可靠程度估计这批次新产品的平均使用寿命;的可靠程度估计这批次新产品的平均使用寿命;2 2)假如有需要采用相同方法对第二批次相同产品进行抽样检查,要求)假如有需要采用相同方法对第二批次相同产品进行抽样检查,要求误差不超过误差不超过1212小时,概率保证程度为小时,概率保证程度为95%95%,则最少应该抽取多少个产品,则最少应该抽取多少个产品进行测试?进行测试?在在95%95%的概率保证程度下,这批新产品的置信区间为的概率保证程度下,这批新产品的置信区间为(2800-13.862800-13.86,2800+13.862800+13.86)=(2786.142786.14,2813.862813.86)小时。)小时。1 1)第49页,共55页,编辑于2022年,星期日2)在在95%95%的可靠程度的可靠程度,至少需要抽取至少需要抽取267267个产品,才可能满足可靠个产品,才可能满足可靠性和精确度要求。性和精确度要求。第50页,共55页,编辑于2022年,星期日第五节第五节 抽样方案设计抽样方案设计第51页,共55页,编辑于2022年,星期日抽样方案设计的原则抽样方案设计的原则1 1)保证实现抽样随机性的原则;)保证实现抽样随机性的原则;2 2)保证实现最大抽样效果原则。)保证实现最大抽样效果原则。简单随机抽样简单随机抽样前面讲述的都是简单随机抽样情况。具体方法:前面讲述的都是简单随机抽样情况。具体方法:1 1)直接抽选法;)直接抽选法;2 2)抽签法)抽签法3 3)随机数码表法)随机数码表法第52页,共55页,编辑于2022年,星期日其他抽样组织形式介绍其他抽样组织形式介绍类型抽样(分类抽样、分层抽样)类型抽样(分类抽样、分层抽样)机械抽样(等距抽样、系统抽样)机械抽样(等距抽样、系统抽样)整群抽样整群抽样多阶段抽样多阶段抽样第53页,共55页,编辑于2022年,星期日课堂练习课堂练习 某研究人员想从某研究人员想从20072007年第一学期开始跟踪了解杭州高校年第一学期开始跟踪了解杭州高校在校学生每周的自习时间,他计划采用抽样调查方式。在校学生每周的自习时间,他计划采用抽样调查方式。20072007年第一年第一学期开始调查,设定这次调查结论可靠程度为学期开始调查,设定这次调查结论可靠程度为95.45%95.45%,误差不超过,误差不超过0.50.5小时。小时。1 1、20072007年第一学期至少需要调查多少学生?调查后得到被调查年第一学期至少需要调查多少学生?调查后得到被调查学生每周平均自习时间为学生每周平均自习时间为1010小时,方差为小时,方差为8 8小时,那么自习时间小时,那么自习时间的置信区间为多少?的置信区间为多少?2 2、此后每个学期该研究人员对相同样本学生进行跟踪调查,、此后每个学期该研究人员对相同样本学生进行跟踪调查,20072007年第二学期自习时间的标准差为年第二学期自习时间的标准差为8.28.2小时,小时,20082008年第一学期年第一学期自习时间的标准差为自习时间的标准差为9.39.3小时。小时。20082008年第二学期,每周平均自习年第二学期,每周平均自习时间为时间为9.69.6小时,计算小时,计算95.45%95.45%概率保证程度下,该次调查每周自概率保证程度下,该次调查每周自习时间的置信区间。习时间的置信区间。第54页,共55页,编辑于2022年,星期日在在95.45%95.45%概率保证程度下,这次调查的每周自习时间的置信区间概率保证程度下,这次调查的每周自习时间的置信区间为(为(9.029.02,10.1810.18)小时。)小时。第55页,共55页,编辑于2022年,星期日