《第六章--抽样推断-《统计学基础》课件.ppt》由会员分享,可在线阅读,更多相关《第六章--抽样推断-《统计学基础》课件.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、目录目录了解抽样推断的含义、特点及作用;理解抽样推断中常用的基本概念;掌握抽样平均误差和抽样极限误差的计算方法;掌握区间估计的计算方法;学习目标知识目标知识目标理解必要样本容量确定的基本知识。目录目录学会运用Excel进行区间估计能够将抽样推断的方法应运于统计实践工作中能力目标能力目标学习目标目录目录一、抽样推断的含义和特点一、抽样推断的含义和特点 抽样推断是指按照随机性原则,从研究对象中抽取一部分进行观察,并根据所得到的观察数据,对研究对象的数量特征作出具有一定可靠程度的估计和推断,以达到认识总体的一种统计方法。含义含义第一节抽样推断的一般问题第一节抽样推断的一般问题目录目录(1 1)按照随
2、机原则从按照随机原则从按照随机原则从按照随机原则从总体中抽取样本单位总体中抽取样本单位总体中抽取样本单位总体中抽取样本单位抽样推断的特点(3)抽样误差可以事抽样误差可以事先计算并加以控制。先计算并加以控制。(2 2)以部分单位的数以部分单位的数以部分单位的数以部分单位的数值推断总体的数值。值推断总体的数值。值推断总体的数值。值推断总体的数值。一、抽样推断的含义和特点一、抽样推断的含义和特点第一节抽样推断的一般问题第一节抽样推断的一般问题目录目录目录目录某集团准备在某地新建一家零售商店,命令企划部经理王先生做好商店选址的准备工作。王先生明白,经过该地的行人数量是要重点考虑的对象。于是,他委托相关
3、人员进行了两个星期的观察,得到每天经过该地的人数。具体如下:544,468,399,759,526,212,256,456,553,259,469,366,197,178如果设立商店要求的最低行人数量为520人,则根据上述观察数据,能否支持设店的决策呢?将14天经过该地的行人数量作为样本,商店开张后经过该地的行人数量作为总体。显然,这是个抽样推断的问题。根据样本数据,可计算出样本均值为403人,样本标准差为168.48人。设置信度为95,则可估计出平均每天经过此地的人数为306500人。这就意味着,如果观察100天,则有95天的行人数位于上述区间。那么如果设立商店要求行人数不得低于520人的话
4、,显然在这一地点设立商店是不明智的。商 店 选 址第一节抽样推断的一般问题第一节抽样推断的一般问题小案例小案例小案例小案例目录目录三、抽样推断中的一些概念三、抽样推断中的一些概念(一)总体和样本一)总体和样本总体是由研究范围内具有某种相同性质的全体单位所组成的整体。为了与样本总体相对应,又称其为全及总体或母体。用字母N表示。样本是指从总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。为了与全及总体相对应,又称其为样本总体或子体。通常用字母n来表示。第一节抽样推断的一般问题第一节抽样推断的一般问题抽取样本的目的是推断总体,这就必然要求样本能够代表总体。样本代表总体的程度越高,由样本计算的
5、指标与总体指标的误差就越小。因此,研究者总希望样本具有较高的代表性。目录目录(二)二)总体总体指标指标和样和样本指本指标标三、抽样推断中的一些概念三、抽样推断中的一些概念第一节抽样推断的一般问题第一节抽样推断的一般问题1.1.总体指标总体指标总体指标是指根据总体各单位标志值或标志属性计算的反映总体数量特征的综合指标,又称为全及指标或参数。由于总体是唯一的、确定的,因此,根据总体计算的总体指标也必定是唯一的、确定的。目录目录目录目录(三)(三)重复重复抽样抽样和不和不重复重复抽样抽样三、抽样推断中的一些概念三、抽样推断中的一些概念第一节抽样推断的一般问题第一节抽样推断的一般问题重复抽样重复抽样又
6、称重置抽样,是指在逐个抽取样本单位时,被抽中的总体单位经登记、观察后,再放回总体中,接着继续抽取下一个样本单位的抽样方法。这种抽样方法使每个单位都有重复被抽中的可能,每个单位的中选概率在各次抽选中是相同的。目录目录(三)(三)重复重复抽样抽样和不和不重复重复抽样抽样三、抽样推断中的一些概念三、抽样推断中的一些概念第一节抽样推断的一般问题第一节抽样推断的一般问题不重复抽样不重复抽样又称不重置抽样,是指在逐个抽取样本单位时,被抽中的总体单位经登记、观察后,不再放回总体中去参加下一次抽选的抽样方法。这样,每进行一次抽选,总体中的单位数就减少一个,每次抽取的结果都影响到下一次的抽取。目录目录目录目录(
7、一)简单随机抽样一)简单随机抽样 简单随机抽样是指从含有N个单位的总体中,随机抽取n个单位作为样本,使得每一个容量为n的样本都有相同的概率被抽中,这样的抽样方式又称纯随机抽样。具体做法分为以下两种:(1)抽签法(2)随机数字法四、抽样的组织形式四、抽样的组织形式第一节抽样推断的一般问题第一节抽样推断的一般问题目录目录目录目录(一)简单随机抽样一)简单随机抽样(2)随机数字法。随机数字法。随机数字可以借助计算机获得,也可应用随机数表,其中随机数表方法应用较为普遍。利用随机数表进行抽样时,首先为每个总体单位编码,根据编码的最大位数确定将要使用随机数表的列数;然后从表中任意一列、任意一行开始,由纵向
8、或横向画线取数,遇到属于总体单位编码范围内的数组就确定为样本单位,接着继续往下找。如果要求不重复抽样时,遇到重复出现的数字(组)就弃之,直到取足要求的单位数为止。四、抽样的组织形式四、抽样的组织形式第一节抽样推断的一般问题第一节抽样推断的一般问题目录目录(二)分层抽样二)分层抽样二)分层抽样二)分层抽样 分层抽样又称分类抽样,是指在抽样之前先将总体划分为若干层,然后从各层中抽取一定数量的单位组成样本的抽样组织形式。分层抽样的具体方法有很多,常见的有以下三种。四、抽样的组织形式四、抽样的组织形式第一节抽样推断的一般问题第一节抽样推断的一般问题目录目录目录目录(二)分层抽样二)分层抽样二)分层抽样
9、二)分层抽样(1)等数分配分层抽样。等数分配分层抽样。它是在各类型组中分配同等的样本单位数的方法。这种方法只在各类型的总体单位数相等或差异不大时使用,它可使综合计算变得简单。四、抽样的组织形式四、抽样的组织形式第一节抽样推断的一般问题第一节抽样推断的一般问题目录目录(二)分层抽样二)分层抽样二)分层抽样二)分层抽样(2)等比例分层抽样。等比例分层抽样。它是按照类型的大小以相等的比例分配样本的方法。通常是按各组总体单位数占全及总体单位数的一定比例来抽取样本,单位数较多的组应该多取样,单位数较少的组则少取样,保持各组样本单位数与样本容量之比等于各组总体单位数与全及总体单位数之比。四、抽样的组织形式
10、四、抽样的组织形式第一节抽样推断的一般问题第一节抽样推断的一般问题目录目录(二)分层抽样二)分层抽样二)分层抽样二)分层抽样(3)不等比例分层抽样。不等比例分层抽样。它是在各类型组中按不同的比例分配样本单位数的方法,又称最优分配法。当各类型组的单位数相差悬殊或标志变异程度相差较大时,采用等数或等比例分配方法的抽样效果较差,这时宜采用不等比例类型抽样法进行抽样。四、抽样的组织形式四、抽样的组织形式第一节抽样推断的一般问题第一节抽样推断的一般问题目录目录(三)系统抽样(三)系统抽样(三)系统抽样(三)系统抽样系统抽样又称等距抽样或机械抽样,是指先将总体各单位按某种顺序排列,并按某种规则确定一个随机
11、起点,然后每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本的抽样方式。四、抽样的组织形式四、抽样的组织形式第一节抽样推断的一般问题第一节抽样推断的一般问题目录目录(三)系统抽样(三)系统抽样(三)系统抽样(三)系统抽样采用系统抽样时,必须首先对总体单位进行排序。排序的标志可以是无关标志,也可以是有关标志。所谓无关标志,是指排序的标志与单位标志值的大小无关或不起主要影响作用,如时间、地理位置、门牌号码、姓氏比例标志等。四、抽样的组织形式四、抽样的组织形式第一节抽样推断的一般问题第一节抽样推断的一般问题目录目录目录目录(四)整群抽样(四)整群抽样(四)整群抽样(四)整群抽样整群抽样时群可以
12、按自然的或行政的区域进行划分,也可以是人为组成的群。由于整群抽样是以抽中的群作为样本,因此,要使样本具有较好的代表性,群与群之间的差异越小越好。所以,群的划分要遵循“群间同质、群内差异”的原则来进行。四、抽样的组织形式四、抽样的组织形式第一节抽样推断的一般问题第一节抽样推断的一般问题目录目录第二节抽样误差第二节抽样误差一、一、误差与抽样误差误差与抽样误差目录目录第二节抽样误差第二节抽样误差在统计分析中,误差在统计分析中,误差的种类可表达如下的种类可表达如下一、一、误差与抽样误差误差与抽样误差(1 1)登记性误差。登记性误差是指在调查过程)登记性误差。登记性误差是指在调查过程中,由于观察、测量、
13、登记、计算上的差错所引中,由于观察、测量、登记、计算上的差错所引起的工作误差。起的工作误差。(2 2)代表性误差。代表性误差是指由于样代表性误差。代表性误差是指由于样本单位的分布结构不足以代表总体的特征而本单位的分布结构不足以代表总体的特征而产生的样本指标与总体指标之间的误差。产生的样本指标与总体指标之间的误差。目录目录目录目录 1.1.抽样平均误差的概念抽样平均误差的概念抽样平均误差的概念抽样平均误差的概念遵循随机原则从一个总体中抽取若干样本单位,遵循随机原则从一个总体中抽取若干样本单位,可能组成很多样本。因此,样本指标(样本平均数、可能组成很多样本。因此,样本指标(样本平均数、样本成数)会
14、有许多不同的数值,它是一个随机变样本成数)会有许多不同的数值,它是一个随机变量。这样,抽样误差也有大有小,也是一个随机变量。这样,抽样误差也有大有小,也是一个随机变量。所以,有必要对所有抽样误差计算平均数,用量。所以,有必要对所有抽样误差计算平均数,用这个平均数来衡量抽样误差的一般水平。这个平均数来衡量抽样误差的一般水平。(二)抽样平均误差(二)抽样平均误差第二节抽样误差第二节抽样误差二、抽样误差的表现形式二、抽样误差的表现形式目录目录 1.1.抽样平均误差的概念抽样平均误差的概念抽样平均误差的概念抽样平均误差的概念所谓抽样平均误差,是指所有可能出现的样本所谓抽样平均误差,是指所有可能出现的样
15、本指标与总体指标之间的平均离差,用以指标与总体指标之间的平均离差,用以 反映抽样误反映抽样误差的一般水平。其理论公式如下:差的一般水平。其理论公式如下:(二)抽样平均误差(二)抽样平均误差第二节抽样误差第二节抽样误差二、抽样误差的表现形式二、抽样误差的表现形式目录目录目录目录2.实际工作中抽样平均误差的计算数理统计证明,在实际工作中,可以采用以下公式计算平均抽样误差。(二)抽样平均误差(二)抽样平均误差第二节抽样误差第二节抽样误差二、抽样误差的表现形式二、抽样误差的表现形式目录目录抽样平均误差说明了某一总体的所有样本指标与总体指标间误差的平均数,但在实际工作中往往只能抽取一个样本,因此实际抽样
16、误差一般不会等于抽样平均误差,可能大于或小于抽样平均误差。所以,用抽样平均误差无法准确地推断总体指标值。此时,就需要引入抽样极限误差。(三)抽样极限误差(三)抽样极限误差第二节抽样误差第二节抽样误差二、抽样误差的表现形式二、抽样误差的表现形式目录目录所谓抽样极限误差,是指样本指标与总体指标之间抽样误差的最大可能范围,又称为允许误差。以和p 分别表示样本平均数和样本成数的抽样极限误差,则:(三)抽样极限误差(三)抽样极限误差第二节抽样误差第二节抽样误差二、抽样误差的表现形式二、抽样误差的表现形式目录目录实际上,抽样极限误差是一个可能而非完全肯定的范围,这个可能范围的大小是与可能性大小相对应的。在
17、抽样推断中,表示这个可能性大小的概念称为置信度,习惯上称为可靠程度、把握程度或概率保证程度,用F(Z)表示。其中的Z值称为概率度。(三)抽样极限误差(三)抽样极限误差第二节抽样误差第二节抽样误差二、抽样误差的表现形式二、抽样误差的表现形式目录目录抽样误差的大小主要受到以下因素的影响。(1)样本单位数的多少。(2)总体各单位标志变异程度的大小。(3)抽样组织形式。不同组织形式的抽样所抽取出来的样本对总体的代表性不同,会产生不同的抽样误差。(4)抽样方法。当其他条件相同时,不重复抽样的抽样误差小,重复抽样的抽样误差大。第二节抽样误差第二节抽样误差三、影响抽样误差的因素三、影响抽样误差的因素目录目录
18、点估计又称定值估计,是指根据样本统计量直接估计出总体参数的值。其常用方法有两种:矩估计法和极大似然估计法。第三节参第三节参 数数 估估 计计一、点估计一、点估计1.1.矩估计法矩估计法用样本矩的函数作为总体用样本矩的函数作为总体矩的函数的估计量。矩的函数的估计量。皮尔逊皮尔逊 (K.Pearson)目录目录1.1.1.1.矩估计法矩估计法矩估计法矩估计法矩估计法的基本思想是:由于样本来源于总体,样本矩在一定程度上反映了矩估计法的基本思想是:由于样本来源于总体,样本矩在一定程度上反映了矩估计法的基本思想是:由于样本来源于总体,样本矩在一定程度上反映了矩估计法的基本思想是:由于样本来源于总体,样本
19、矩在一定程度上反映了总体矩,且由大数定律可知,样本矩按概率收敛于总体矩,因此,只要总体的总体矩,且由大数定律可知,样本矩按概率收敛于总体矩,因此,只要总体的总体矩,且由大数定律可知,样本矩按概率收敛于总体矩,因此,只要总体的总体矩,且由大数定律可知,样本矩按概率收敛于总体矩,因此,只要总体的K K K K阶原点矩存在,就可以用样本矩作为相应总体矩的估计量,用样本矩的函数作为阶原点矩存在,就可以用样本矩作为相应总体矩的估计量,用样本矩的函数作为阶原点矩存在,就可以用样本矩作为相应总体矩的估计量,用样本矩的函数作为阶原点矩存在,就可以用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的
20、估计量。矩估计法简单、直观,且不必知道总体的分布类型,因总体矩的函数的估计量。矩估计法简单、直观,且不必知道总体的分布类型,因总体矩的函数的估计量。矩估计法简单、直观,且不必知道总体的分布类型,因总体矩的函数的估计量。矩估计法简单、直观,且不必知道总体的分布类型,因此得到了广泛的应用。此得到了广泛的应用。此得到了广泛的应用。此得到了广泛的应用。按照矩估计法,可以用样本平均数直接作为总体平均数的估计值,用样本成按照矩估计法,可以用样本平均数直接作为总体平均数的估计值,用样本成按照矩估计法,可以用样本平均数直接作为总体平均数的估计值,用样本成按照矩估计法,可以用样本平均数直接作为总体平均数的估计值
21、,用样本成数直接作为总体成数的估计值,用样本方差直接作为总体方差的估计值等。数直接作为总体成数的估计值,用样本方差直接作为总体方差的估计值等。数直接作为总体成数的估计值,用样本方差直接作为总体方差的估计值等。数直接作为总体成数的估计值,用样本方差直接作为总体方差的估计值等。第三节参第三节参 数数 估估 计计一、点估计一、点估计目录目录设总体分布的函数形式已知,但有未知参设总体分布的函数形式已知,但有未知参数数,可以取很多值,在可以取很多值,在 的一切可能取值中的一切可能取值中选一个使样本观察值出现的概率为最大的值作选一个使样本观察值出现的概率为最大的值作为其估计值,称为为其估计值,称为 的极大
22、似然估计值,这种的极大似然估计值,这种求估计值的方法称为极大似然估计法。求估计值的方法称为极大似然估计法。费雪 (Fisher)第三节参第三节参 数数 估估 计计一、点估计一、点估计2.极大似然估计法目录目录1.1.区间估计的含义及表达式区间估计的含义及表达式区间估计的含义及表达式区间估计的含义及表达式 所谓区间估计,是指以一定的概率保证估计总体参数的一个所谓区间估计,是指以一定的概率保证估计总体参数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围,值域,即根据样本指标和抽样平均误差推断总体指标的可能范围,这个范围又称为置信区间。这个范围又称为置信区间。一般地说,对于总体被估计参
23、数,由样本构造出两个估计量 和 (其中 ),使得区间 涵盖被估计参数真值的概率为F(Z),即:第三节参第三节参 数数 估估 计计二、区间估计二、区间估计目录目录2.2.区间估计的具体方法区间估计的具体方法区间估计的具体方法区间估计的具体方法根据前述抽样极限误差的概念,将式(6-19)和式(6-20)进行变形可得:这两个公式是对总体平均数和总体成数进行区间估计的公式第三节参第三节参 数数 估估 计计二、区间估计二、区间估计目录目录资料卡资料卡优良估计量的评价标准优良估计量的评价标准优良估计量的评价标准优良估计量的评价标准 在进行参数估计时,人们总是希望这种估计是合理的、准确的、可靠的,或者说是优
24、秀的、良好的、标准的。那么,如何达到这个标准呢?事实上,这个标准是从总体上来综合评价的,主要取决于估计量的优良性。优良估计量有三个标准:无偏性、一致性和有效性。第三节参第三节参 数数 估估 计计目录目录第四节必要样本容量的确定第四节必要样本容量的确定一、必要样本容量的概念必要样本容量是指能够保证抽样推断的把握程度和精确必要样本容量是指能够保证抽样推断的把握程度和精确程度的尽量小的样本容量。在进行实际抽样调查之前,样本程度的尽量小的样本容量。在进行实际抽样调查之前,样本单位数是未知的。样本单位在抽样调查之前就应该确定下来,单位数是未知的。样本单位在抽样调查之前就应该确定下来,然后才能从总体中抽取
25、样本单位,按照抽样原理进行统计推然后才能从总体中抽取样本单位,按照抽样原理进行统计推断。样本单位数要根据统计总体的特点、统计条件和所要求断。样本单位数要根据统计总体的特点、统计条件和所要求的精确度来确定,不能抽得太多,也不能抽得太少。的精确度来确定,不能抽得太多,也不能抽得太少。目录目录(4)抽样的组织形式和方法1.2.3.4.(2)抽样极限误差的大小(3)抽样推断的置信度(1)总体各单位标志值的差异程度第四节必要样本容量的确定第四节必要样本容量的确定二、影响必要样本容量的因素目录目录第四节必要样本容量的确定第四节必要样本容量的确定二、影响必要样本容量的因素(1)总体各单位标志值的差异程度。在
26、其他条件不变的情况下,总体各单位标志值的差异度越大,样本对总体的代表性就越小,就需要多抽取样本单位来满足调查的需要;反之,抽样的单位数目则可少些。目录目录第四节必要样本容量的确定第四节必要样本容量的确定二、影响必要样本容量的因素(2)抽样极限误差的大小。要求的抽样极限误差越小,说明要求的精确度越高,则需要多抽取一些样本单位;反之,则可以少抽取一些样本单位。但两者并不是保持等比例的变化。就重复抽样而言,在其他条件不变的情况下,当误差范围缩小1/2,则样本单位数必须增加4倍;而误差范围扩大1倍,则样本单位数只需原来的1/4。目录目录第四节必要样本容量的确定第四节必要样本容量的确定二、影响必要样本容
27、量的因素(3)抽样推断的置信度。抽样推断要求的置信度越高,则需要抽取的样本单位数目越多;反之,如果要求的置信度低,抽样单位数目则可以少些。目录目录第四节必要样本容量的确定第四节必要样本容量的确定二、影响必要样本容量的因素(4)抽样的组织形式和方法。对于同一个总体,在相同的精确度和置信度的要求下,重复抽样方法需要抽取的样本单位数多,不重复抽样需要抽取的样本单位数少;在不同组织形式下,以机械抽样和类型抽样抽取的样本单位数可少些,以纯随机抽样和整群抽样抽取的样本单位数就要多些。目录目录(1 1)抽样平均数推断全及平均数时的必要样本容量。)抽样平均数推断全及平均数时的必要样本容量。重复抽样条件下,由于
28、:重复抽样条件下,由于:则必要样本容量为:则必要样本容量为:不重复抽样条件下,由于:不重复抽样条件下,由于:则必要样本容量为:则必要样本容量为:第四节必要样本容量的确定第四节必要样本容量的确定三、必要样本容量的计算目录目录资料卡资料卡在计算必要样本容量时,应注意以下几点。在计算必要样本容量时,应注意以下几点。在计算必要样本容量时,应注意以下几点。在计算必要样本容量时,应注意以下几点。(1 1 1 1)当计算的必要样本容量为小数时,不能采用四舍五入原则,而应采用小当计算的必要样本容量为小数时,不能采用四舍五入原则,而应采用小当计算的必要样本容量为小数时,不能采用四舍五入原则,而应采用小当计算的必
29、要样本容量为小数时,不能采用四舍五入原则,而应采用小数进位原则。数进位原则。数进位原则。数进位原则。(2 2 2 2)在确定样本容量时,需要知道总体的方差,这在抽样调查中是不可能的。在确定样本容量时,需要知道总体的方差,这在抽样调查中是不可能的。在确定样本容量时,需要知道总体的方差,这在抽样调查中是不可能的。在确定样本容量时,需要知道总体的方差,这在抽样调查中是不可能的。(3 3 3 3)对同一总体既要进行样本平均数的推断,又要进行样本成数的推断时,对同一总体既要进行样本平均数的推断,又要进行样本成数的推断时,对同一总体既要进行样本平均数的推断,又要进行样本成数的推断时,对同一总体既要进行样本
30、平均数的推断,又要进行样本成数的推断时,为了兼顾两者共同的需要,通常采用其中较大的为了兼顾两者共同的需要,通常采用其中较大的为了兼顾两者共同的需要,通常采用其中较大的为了兼顾两者共同的需要,通常采用其中较大的n n n n值作为统一的抽样单位数。值作为统一的抽样单位数。值作为统一的抽样单位数。值作为统一的抽样单位数。(4 4 4 4)在实际工作中,由于抽样比例一般很小,虽然采用的是不重复抽样,但在实际工作中,由于抽样比例一般很小,虽然采用的是不重复抽样,但在实际工作中,由于抽样比例一般很小,虽然采用的是不重复抽样,但在实际工作中,由于抽样比例一般很小,虽然采用的是不重复抽样,但仍可按重复抽样的
31、公式来计算必要样本容量。仍可按重复抽样的公式来计算必要样本容量。仍可按重复抽样的公式来计算必要样本容量。仍可按重复抽样的公式来计算必要样本容量。第四节必要样本容量的确定第四节必要样本容量的确定目录目录第五节第五节Excel在抽样推断中的应用在抽样推断中的应用(一)根据未分组的样本数据进行估计(一)根据未分组的样本数据进行估计(一)根据未分组的样本数据进行估计(一)根据未分组的样本数据进行估计根据未分组的样本数据计算总体平均数区间估计所需的指标,可以使用Excel中的有关函数或者直接输入计算公式,也可以使用“描述统计”分析工具。利用“描述统计”分析工具,能够直接得到估计总体平均数的区间所需的样本
32、平均数、样本标准差、抽样平均误差和抽样极限误差。一、Excel在总体平均数区间估计中的运用目录目录如果掌握的是已分组样本数据,要想估计总体平均如果掌握的是已分组样本数据,要想估计总体平均数,只能运用数,只能运用ExcelExcel的函数及公式来实现。的函数及公式来实现。若已经给定或计算出了样本平均数和样本标准差,若已经给定或计算出了样本平均数和样本标准差,可通过输入公式来计算抽样平均误差和抽样极限误差。可通过输入公式来计算抽样平均误差和抽样极限误差。第五节第五节Excel在抽样推断中的应用在抽样推断中的应用一、Excel在总体平均数区间估计中的运用目录目录请看下面的例题请看下面的例题第五节第五
33、节Excel在抽样推断中的应用在抽样推断中的应用一、Excel在总体平均数区间估计中的运用目录目录 【例例6-106-10】某企业生产一种新型产品,以简单随机重复抽样方式抽取某企业生产一种新型产品,以简单随机重复抽样方式抽取100100个作耐用时间测试,结果发现,平均寿命为个作耐用时间测试,结果发现,平均寿命为6 0006 000小时,标准差为小时,标准差为300300小时。小时。试在试在95.45%95.45%的置信度下,估计这种新型产品的平均寿命区间。的置信度下,估计这种新型产品的平均寿命区间。解:(1)打开一张空白的Excel工作表,输入已知数据及待计算指标名称。(2)计算抽样平均误差。
34、选定单元格B4,输入公式“=300/1000.5”或“=300/SQRT(100)”,按下Enter键可得到计算结果30。第五节第五节Excel在抽样推断中的应用在抽样推断中的应用一、Excel在总体平均数区间估计中的运用目录目录(3 3)确定置信度对应的确定置信度对应的Z Z值。选定单元格值。选定单元格B6B6,输入公式,输入公式“=NORMSINV(0.977 25)”=NORMSINV(0.977 25)”,按下,按下EnterEnter键可得到计算结果键可得到计算结果2.002.00。其中,。其中,该函数的参数该函数的参数0.977 250.977 25的计算如下:的计算如下:F(Z)
35、+F(Z)+1-F(Z)1-F(Z)/2=0.954 5+/2=0.954 5+(1-0.954 51-0.954 5)/2=0.977 25/2=0.977 25(4 4)计算抽样极限误差。选定单元格计算抽样极限误差。选定单元格B7B7,输入公式,输入公式“=2*30”=2*30”或或“=B6*30”=B6*30”,可得到计算结果,可得到计算结果6060。(5 5)计算估计区间的下限和上限。选定单元格计算估计区间的下限和上限。选定单元格B8B8和和B9B9,分别输入公,分别输入公式式“=6 000-60”=6 000-60”和和“=6 000+60”=6 000+60”,计算结果分别为,计算
36、结果分别为5 9405 940和和6 0606 060。相关计算公式和结果如图相关计算公式和结果如图6-66-6所示。所示。第五节第五节Excel在抽样推断中的应用在抽样推断中的应用一、Excel在总体平均数区间估计中的运用目录目录Excel的的运用运用如果样本数据是未分组的调查数据,则可如果样本数据是未分组的调查数据,则可先利用函数先利用函数COUNTCOUNT或或COUNTIFCOUNTIF来统计出来统计出具有某一属性的观测数(其具有某一属性的观测数(其ExcelExcel操作方操作方法在前面的章节已作介绍,此处不再赘述)法在前面的章节已作介绍,此处不再赘述),再将具有某一属性的观测数与样
37、本容量,再将具有某一属性的观测数与样本容量n n对比求出样本成数对比求出样本成数p p。第五节第五节Excel在抽样推断中的应用在抽样推断中的应用二、Excel在总体成数区间估计中的运用目录目录本章共五节,主要介绍了抽样推断的含义、特点、作用和常用概念,以及四种常见的抽样组织形式;抽样误差的基本知识,重点介绍了抽样平均误差和抽样极限误差的含义和计算方法;参数估计的相关知识,重点介绍了区间估计的具体方法;必要样本容量确定的一般问题;同时以实例具体介绍了Excel在参数估计中的操作程序。目的是使学生掌握统计推断的基本知识及具体方法,并能在统计实践中灵活运用参数估计对总体指标进行推断。知识小结知识小
38、结目录目录知识巩固知识巩固一、一、单项选择题单项选择题1.1.用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低降低50%50%,则样本容量需扩大为原来的()。,则样本容量需扩大为原来的()。A.3A.3倍倍B.5B.5倍倍C.2C.2倍倍D.4D.4倍倍2.2.抽样调查的主要目的是()。抽样调查的主要目的是()。A.A.用样本指标来推算总体指标用样本指标来推算总体指标B.B.广泛运用数学方法广泛运用数学方法C.C.对调查单位进行深入研究对调查单位进行深入研究D.D.计算和控制抽样误差计算和控制抽样误差3.3.某企业连续
39、生产其产品,为了检查产品的质量,在某企业连续生产其产品,为了检查产品的质量,在2424小时内每隔小时内每隔3030分分钟取出下一分钟的产品进行全部检查,这种方法是()。钟取出下一分钟的产品进行全部检查,这种方法是()。A.A.简单随机抽样简单随机抽样B.B.整群抽样整群抽样C.C.分层抽样分层抽样D.D.系统抽样系统抽样目录目录知识巩固知识巩固一、一、单项选择题单项选择题4.4.抽样成数是一个()。抽样成数是一个()。A.A.结构相对数结构相对数B.B.比较相对数比较相对数 C.C.比例相对数比例相对数D.D.强度相对数强度相对数5.5.对对400400名大学生抽取名大学生抽取19%19%进行
40、不重复抽样调查,其中优等生比重为进行不重复抽样调查,其中优等生比重为20%20%,置信度为置信度为95.45%95.45%,则优等生比重的极限抽样误差为()。,则优等生比重的极限抽样误差为()。A.4.13%B.4%A.4.13%B.4%C.9.18%D.8.26%C.9.18%D.8.26%6.6.抽样分析中产生的误差()。抽样分析中产生的误差()。A.A.既可以避免,又可以控制既可以避免,又可以控制B.B.可以避免,但不能控制可以避免,但不能控制C.C.既不可以避免,又不可以控制既不可以避免,又不可以控制D.D.不能避免,但可以控制不能避免,但可以控制目录目录实践技能训练实践技能训练 通过
41、实训,使学生深入理解和熟练掌握参数估计的基本原理和计算方法;加强理论和实践的联系,提高学生将统计方法应用于社会实践的能力。目录目录实践技能训练实践技能训练 在全校学生中随机抽取一个样本,调查他们某个月的在全校学生中随机抽取一个样本,调查他们某个月的在全校学生中随机抽取一个样本,调查他们某个月的在全校学生中随机抽取一个样本,调查他们某个月的生活消费额以及手机拥有情况。并根据调查得到的数据,生活消费额以及手机拥有情况。并根据调查得到的数据,生活消费额以及手机拥有情况。并根据调查得到的数据,生活消费额以及手机拥有情况。并根据调查得到的数据,推断全校同学某个月的平均生活消费额的置信区间和手机推断全校同学某个月的平均生活消费额的置信区间和手机推断全校同学某个月的平均生活消费额的置信区间和手机推断全校同学某个月的平均生活消费额的置信区间和手机拥有率的置信区间。拥有率的置信区间。拥有率的置信区间。拥有率的置信区间。目录目录实践技能训练实践技能训练成果成果成果成果检验检验检验检验每位学生形成一份完整的实训报告,由老师根据抽样每位学生形成一份完整的实训报告,由老师根据抽样设计的合理性和推断方法的正确性进行综合评定。设计的合理性和推断方法的正确性进行综合评定。成果成果成果成果检验检验检验检验成果成果成果成果检验检验检验检验
限制150内