《抽样与抽样估计》PPT课件.ppt
《《抽样与抽样估计》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《抽样与抽样估计》PPT课件.ppt(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 抽样估计抽样估计什么是抽样估计抽样估计的基本概念与点估计抽样误差与区间估计什么是抽样估计?什么是抽样估计?The purpose of Statistics inference is to obtain information about a population from information contained in sample.例例1 一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。120个个样本样本测试平均里程:36,500公里推断新轮胎新轮胎平均寿命平均寿命:36,500公里400个样本 支持人数:160推断支持该候选人的选民支持该候选人的选民占全部选民的比例:占
2、全部选民的比例:160/400=40%例例2:某党派想支持某一候选人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估计支持该候选人的民众支持该候选人的民众占全部登记投票人总数的比例占全部登记投票人总数的比例。由于时间及财力的限制:抽样估计方法主要用在下列两种情况抽样估计方法主要用在下列两种情况:注意:注意:抽样估计只得到对总体特征的近似测度,因此,抽样估计还必须同时考察所得结果的“可能范围可能范围”与“可靠程度可靠程度”。1、对所考查的总体不可能进行全部测度;2、从理论上理论上说可以对所考查的总体进行全部测度,但实践上实践上由于人力、财力、时间等方面的原因,无法(不划算)进行全部测
3、度。第一节第一节 抽样推断的基本概念与点估计抽样推断的基本概念与点估计例例3:某大公司人事部经理整理其2500个中层干部的档案。其中一项内容是考察考察这些中层干部的平均年薪平均年薪及参加过参加过公司培训计划的比例公司培训计划的比例。总体:总体:2500名中层干部(population),如果:如果:上述上述情况可由每个人的个人档案中得知,可容易地测出这2500名中层干部的平均年薪及标准差。假如假如:1:已经得到了如下的结果:总体均值总体均值(population mean):):=51800 总体标准差总体标准差(Population standard deviation):):=4000 参
4、数参数是总体的是总体的数值特征数值特征 A parameter is a numerical characteristic of a population。上述总体均值、总体标准差、比例均称为总体的参参数数 2、同时,有1500人参加了公司培训,则则参加公司培训计划的参加公司培训计划的比例比例为:为:P=1500/2500=0.60如:如:例3中的中层干部平均年薪平均年薪,年薪标准差年薪标准差及受培训人数受培训人数所占比例所占比例均为该公司中层干部这一总体的参数。抽样估计抽样估计就是要通过样本而非总体来估计总体参数就是要通过样本而非总体来估计总体参数。一、简单随机抽样(一、简单随机抽样(Sim
5、ple Random Sampling)注意:注意:在有限总体的简单随机抽样中,由抽样是否具有可重是否具有可重复性复性,又可分为重复抽样重复抽样与不重复抽样不重复抽样。而且,根据抽样中是否排序是否排序,所能抽到的样本个数往往不同。简单随机抽样可根据总体的有限性或无限性分为有限总体随机抽样有限总体随机抽样与无限总体随机抽样无限总体随机抽样。无限总体简单随机抽样:无限总体简单随机抽样:1、每一个体来自同一总体;2、每一个体是独立抽取的。有限总体简单随机抽样有限总体简单随机抽样:每个样本点(个体)能以相同的概率被抽出。1、考虑顺序的不重复抽样:N(N-1)(N-2)(N-n+1)2、考虑顺序的重复抽
6、样:Nn 在总体单位数为N的总体中抽取容量为n的样本,样本个数可能有:在社会经济统计中,往往采用的是较大总体较大总体(视为无限总体)下的下的无序不重复抽样无序不重复抽样。3、不考虑顺序的不重复抽样:4、不考虑顺序的重复抽样:在例在例3中,假如随机抽取了一个容量为30的样本:Annual Salary Management Training Program?49094.3 Yes 53263.9 Yes 49643.5 Yes 二、点估计(二、点估计(Point Estimation)假如假如根据该样本求得的年薪样本年薪样本平均数平均数、标准差标准差及参参加过培训计划人数的加过培训计划人数的比例
7、比例分别为:则可用上述结果分别代表2500名中层干部的平平均年薪均年薪、年薪的标准差年薪的标准差及受训比例受训比例。上述估计总体参数的过程被称为点估计点估计(point estimation);样本均值(标准差/比例)称为总体均值(标准差/比例)的点估计量点估计量(point estimator);样本均值(标准差/比例)的具体数值称为总体均值(标准差/比例)的点估计值点估计值(point estimate)。由于点估计量是由样本测算的,因此也称为样本样本统计量。统计量。在上述某公司30个中层干部的简单随机抽样中,如果再一次抽样的样本与前一次的不同,则可得到另外的平均年薪样本均值、标准差以及受
8、训干部的比例。同样地,如果多次抽样,则可得到多个不同的结果。表4.1是一个假设的经过500次抽样后的情况表。三、抽样分布三、抽样分布 表4.2给出了500个 的频数分布频数分布与相对频数分布相对频数分布,图图4.1 500个个 的相对频数分布的相对频数分布 这里,这里,的相对频数分布,就称为的相对频数分布,就称为 的的抽样分布抽样分布。正是抽样分布抽样分布及其特征特征使得用样本统计量样本统计量估计总体参数总体参数的“精确程度精确程度”能够给予概率上的描述。一般地一般地,样本统计量样本统计量的可能取值及其取值概率所形成的概率分布,统计上称为抽样分布抽样分布(sampling distributi
9、on)。精确度可靠度 (一)样本平均数的抽样分布(一)样本平均数的抽样分布 (Sampling Distribution of )考察样本均值的概率分布形式样本均值的概率分布形式。分两种况:1)总体分布已知且为正态分布总体分布已知且为正态分布;2)总体分布未知;总体分布未知;1、样本均值抽样分布的形状、样本均值抽样分布的形状(1)当总体分布已知且为正态分布或接近正态分布时,则无论样本容量大小如何,样本均值则无论样本容量大小如何,样本均值都为正态分布都为正态分布。(2)当总体分布未知时,需要用到中心极限定中心极限定中心极限定中心极限定理(理(理(理(Central limit Theorem)对
10、容量为对容量为n 的简单随机样本,样本均值的分布的简单随机样本,样本均值的分布随样本容量的增大而趋于随样本容量的增大而趋于正态分布正态分布。经验上验证经验上验证,当样本容量等于或大于30时,无论总体的分布如何,样本均值的分布则非常接近正态分布。因此统计上常称容量在30(含30)以上的样本为大样本大样本(large-sample-size)。例例3中中,中层干部年薪的总体均值为51800,因此所有可能的样本平均数的均值所有可能的样本平均数的均值也为51800。可证明在简单随机抽样中 2、样本均值抽样分布的数值特征、样本均值抽样分布的数值特征 n=样本容量;N=总体单位个数可以证明可以证明样本均值
11、的标准差样本均值的标准差:如果总体单位数很如果总体单位数很“大大”而样本容量很而样本容量很“小小”,则该,则该修正因子趋近于修正因子趋近于1 1,这时,对有限总体可直接按无限总体的公式去计算。一个经验的衡量标准个经验的衡量标准是n/N=0.05。有限总体:无限总体:称为有限总体修正因子有限总体修正因子(finite population correction factor)。样本容量与总体单位数的比值为 n/N=30/2500=0.012,样本均值的标准差样本均值的标准差可用来测度样本均值与总体均值的“距离”,即可用来计算可能的误差,它也被称为均值标准误均值标准误(standard error
12、 of the mean)。例例3中中:因此,样本均值的标准差可计算如下:样本统计量的估计值与其所要测度的总体参数值之间的绝对差距,被称为抽样误差抽样误差(sampling error)。抽样分布能够用来提供抽样分布能够用来提供抽样误差抽样误差大小的可能性(概率)。大小的可能性(概率)。3、样本均值抽样分布的实际应用、样本均值抽样分布的实际应用 在例例3中,如果人事部经理认为在一次抽样中所得到的中层干部的平均年薪与总体均值(51800$)误差在500元以内,他就可以接受样本估计值。则问题归结为在一次抽样中,误差在500元以内的可能性(概率)有多大?由于样本容量为30,可认为样本均值服从正态分布
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样与抽样估计 抽样 估计 PPT 课件
限制150内