《第6章--抽样与抽样分布ppt课件.ppt》由会员分享,可在线阅读,更多相关《第6章--抽样与抽样分布ppt课件.ppt(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、6-1统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统你不必吃完整一头牛,才知道它的肉是咬不动的。Samel Johnson6-2统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统第 6 章 抽样与抽样分布作者:中国人民大学统计学院贾俊平统计学6-3统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统统计应用“抓阄”
2、征兵计划 在在美美国国的的对对越越战战争争中中,为为使使前前线线有有足足够够的的士士兵兵,美美国国政政府府制制定定了了一一个个“抓抓阄阄”的的征征兵兵计计划划。该该计计划划打打算算把把11到到366366的的号号码码随随机机地地分分配配给给一一年年中中每每一一天天,然然后后由由军军事事部部门门按按分分配配的的号号码码顺顺序序把把生生日日与与之之对对应应的的年年轻轻人人分分批批征征召召入入伍伍。这这种种方方法法的的目目的的是是为为了了给给大大家家相相等等的的机机会会卷卷入入这这场场不不受受欢欢迎迎的的战战争争中中,因因此此被被征召的可能性应该是随机的征召的可能性应该是随机的在在第第一一年年的的征
3、征兵兵计计划划中中,号号码码11被被分分配配给给了了99月月1414日日,分分配配方方法法是是随随机机抽抽取取一一个个大大容容器器中中的的366366个个写写上上了了日日子子的的乒乒乓乓球球。结结果果所所有有年年满满1818岁岁且且生生于于99月月1414日日的的合合格格青青年年将将作作为为第第一一批批被被征征召召入入伍伍。生生日日被被分分配配为为号号码码22的青年则在第二批被征召入伍,以此类推的青年则在第二批被征召入伍,以此类推6-4统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统统计应用“抓阄”
4、征兵计划我我们们知知道道,并并不不是是所所有有的的人人都都被被征征召召入入伍伍,因因此此,生生日日被分配的号码较大的人也许永远轮不上到军队服役被分配的号码较大的人也许永远轮不上到军队服役这这种种抓抓阄阄看看起起来来对对决决定定应应该该被被征征召召入入伍伍是是一一个个相相当当不不错错的的方方法法。然然而而,在在抓抓阄阄的的第第二二天天,当当所所有有的的日日子子和和它它们们对对应应的的号号码码公公布布以以后后,统统计计学学家家们们开开始始研研究究这这些些数数据据。经经过过观观察察和和计计算算,统统计计学学家家们们发发现现了了一一些些规规律律。例例如如,我我们们本本应应期期望望应应该该有有差差不不多
5、多一一半半的的较较小小的的号号码码(1(1到到183)183)被被分分配配给给前前半半年年的的日日子子,即即从从11月月份份到到66月月份份;另另外外一一半半较较小小的的号号码码被被分分配配给给后后半半年年的的日日子子,从从77月月到到1212月月份份。由由于于抓抓阄阄的的随随机机性性,前前半半年年中中可可能能不不会会分分到到正正好好一一半半较较小的号码,但是应当接近一半小的号码,但是应当接近一半6-5统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统统计应用“抓阄”征兵计划然然而而结结果果是是,有有
6、7373个个较较小小的的号号码码被被分分配配给给了了前前半半年年的的日日子子,同同时时有有110110个个较较小小的的号号码码被被分分配配给给了了后后半半年年的的日日子子。换换句句话话说说,如如果果你你生生于于后后半半年年的的某某一一天天,那那么么,你你因因为为被被分分配配给给一一个个较较小小号号码码而而去去服服兵兵役的机会要大于生于前半年的人役的机会要大于生于前半年的人在在这这种种情情况况下下,两两个个数数字字之之间间只只应应该该有有随随机机误误差差,而而7373和和110110之之间间的的差差别别超超出出了了随随机机性性所所能能解解释释的的范范围围。这这种种非非随随机机性性是是由由于于乒乒
7、乓乓球球在在被被抽抽取取之之前前没没有有被被充充分分搅搅拌拌造造成成的的。在在第第二二年年,主主管管这这件件事事的的部部门门在在抓抓阄阄之之前前去去咨咨询询了了统统计计学学家家(这这可可能能使使生生于于后后半半年的人感觉稍微舒服些年的人感觉稍微舒服些)6-6统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统第 6 章 抽样与抽样分布6.1 概率抽样方法6.2 三种不同性质的分布 6.3 一个总体参数推断时样本统计量的抽样 分布6.4 两个总体参数推断时样本统计量的抽样 分布6-7统计学STATISTI
8、CS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统学习目标1.了解概率抽样方法2.区分总体分布、样本分布、抽样分布3.理解抽样分布与总体分布的关系4.掌握单总体参数推断时样本统计量的分布5.掌握双总体参数推断时样本统计量的分布6-8统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统6.1 概率抽样方法6.1.1 简单随机抽样6.1.2 分层抽样6.1.3 系统抽样6.1.4 整群抽样6-9统计学STATISTICS(第二版)篮球比
9、赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统抽样方法6-10统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统概率抽样(probability sampling)1.根据一个已知的概率来抽取样本单位,也称随机抽样2.特点n n按一定的概率以随机原则抽取样本按一定的概率以随机原则抽取样本l l 抽取样本时使每个单位都有一定的机会被抽中 抽取样本时使每个单位都有一定的机会被抽中n n每每个个单单位位被被抽抽中中的的概概率率是是已已知知的的,或或是是
10、可可以以计计算算出来的出来的 n n当用样本对总体目标量进行当用样本对总体目标量进行 估计时,要考虑到每个样本估计时,要考虑到每个样本 单位被抽中的概率单位被抽中的概率6-11统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统简单随机抽样(simple random sampling)1.从从总总体体NN个个单单位位(元元素素)中中随随机机地地抽抽取取nn个个单单位位作作为为样样本本,使使得得总总体体中中每每一一个个元元素素都都有有相相同同的的机机会会(概概率率)被抽中被抽中 2.抽取元素的具体方法有
11、重复抽样和不重复抽样抽取元素的具体方法有重复抽样和不重复抽样3.特点特点n n 简单、直观,在抽样框完整时,可直接从中抽取样本 简单、直观,在抽样框完整时,可直接从中抽取样本n n 用样本统计量对目标量进行估计比较方便 用样本统计量对目标量进行估计比较方便4.局限性局限性n n 当 当N N很大时,不易构造抽样框 很大时,不易构造抽样框n n 抽出的单位很分散,给实施调查增加了困难 抽出的单位很分散,给实施调查增加了困难n n 没有利用其他辅助信息以提高估计的效率 没有利用其他辅助信息以提高估计的效率6-12统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决
12、定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统简单随机样本(simple random sample)1.由简单随机抽样形成的样本2.从总体N个单位中随机地抽取n个单位作为样本,使得 每 一 个 容 量 为n 样 本都有相同的机会(概率)被抽中 3.参数估计和假设检验所依据的主要是简单随机样本6-13统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统简单随机抽样(用Excel 对分类数据随机抽样)【例例】某某班班级级共共有有3030名名学学生生,他他们们的的名名单单如如右右表表。用用Exc
13、elExcel抽抽出出一一个个由由55个个学学生生构构成成的的随随机机样本样本 6-14统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统简单随机抽样(用Excel 对分类数据随机抽样)第 第1 1 步:步:将 将30 30个学生的名单录入到 个学生的名单录入到Excel Excel工作表中的一列 工作表中的一列第 第2 2 步:步:给每个学生一个 给每个学生一个 数字代码 数字代码,分别为,分别为1 1,2 2,30 30,并按,并按 顺序排列,将代码录入到 顺序排列,将代码录入到Excel Exc
14、el工作表中的一列,与 工作表中的一列,与 学生名单相对应 学生名单相对应第 第3 3 步:步:选择【选择【工具 工具】下拉菜单,并选择【】下拉菜单,并选择【数据分析 数据分析】选项,】选项,然后在【数据分析】选项中选择【然后在【数据分析】选项中选择【抽样 抽样】第 第4 4 步:步:在【抽样】对话框中的【输入区域】中输入学生代码 在【抽样】对话框中的【输入区域】中输入学生代码 区域,在【抽样方法】中单击【区域,在【抽样方法】中单击【随机 随机】。在【样本。在【样本 数】中输入需要抽样的学生个数。在【数】中输入需要抽样的学生个数。在【输出区域 输出区域】中】中 选择抽样结果放置的区域。【确定】
15、后即得到要抽取 选择抽样结果放置的区域。【确定】后即得到要抽取 的样本 的样本 用用ExcelExcel对分类数据抽样对分类数据抽样6-15统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统简单随机抽样(用Excel 对数值型数据随机抽样)第 第1 1 步:步:将原始数据录入到 将原始数据录入到Excel Excel工作表中的一列 工作表中的一列第 第2 2 步:步:选择【选择【工具 工具】下拉菜单,并选择【】下拉菜单,并选择【数据分析 数据分析】选项】选项,然后在【数据分析】选项中选择【然后在【数据
16、分析】选项中选择【抽样 抽样】第 第3 3 步:步:在【抽样】对话框中的【输入区域】中输入原始数据 在【抽样】对话框中的【输入区域】中输入原始数据 区域,在【抽样方法】中单击【区域,在【抽样方法】中单击【随机 随机】。在【样本】。在【样本 数】中输入需要抽样的数据个数。在【输出区域】数】中输入需要抽样的数据个数。在【输出区域】中选择抽样结果放置的区域。【确定】后即得到要 中选择抽样结果放置的区域。【确定】后即得到要 抽取的样本数据 抽取的样本数据 用用ExcelExcel对数值型数据抽样对数值型数据抽样6-16统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来
17、决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统分层抽样(stratified sampling)1.将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本2.优点n n保保证证样样本本的的结结构构与与总总体体的的结结构构比比较较相相近近,从从而提高估计的精度而提高估计的精度n n组织实施调查方便组织实施调查方便n n既既可可以以对对总总体体参参数数进进行行估估计计,也也可可以以对对各各层层的目标量进行估计的目标量进行估计6-17统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是
18、一种得分类型的系统系统抽样(systematic sampling)1.将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位n n先先从从数数字字11到到kk之之间间随随机机抽抽取取一一个个数数字字rr作作为为初始单位,以后依次取初始单位,以后依次取rr+kk,rr+2+2kk等单位等单位2.优点:操作简便,可提高估计的精度3.缺点:对估计量方差的估计比较困难6-18统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统整群抽样
19、(cluster sampling)1.将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查2.特点n n抽样时只需群的抽样框,可简化工作量抽样时只需群的抽样框,可简化工作量n n调调查查的的地地点点相相对对集集中中,节节省省调调查查费费用用,方方便便调查的实施调查的实施n n缺点是估计的精度较差缺点是估计的精度较差6-19统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统多阶段抽样(multi-stage sampling)1.1.先先抽抽取取群群,但但并并不不是
20、是调调查查群群内内的的所所有有单单位位,而而是是再再进进行行一一步步抽抽样样,从从选选中中的的群群中中抽抽取取出出若若干干个个单单位位进进行调查行调查n n 群 群是 是初 初级 级抽 抽样 样单 单位 位,第 第二 二阶 阶段 段抽 抽取 取的 的是 是最 最终 终抽 抽样 样单 单位 位。将该方法推广,使抽样的段数增多,就称为多阶段抽样 将该方法推广,使抽样的段数增多,就称为多阶段抽样2.2.具具有有整整群群抽抽样样的的优优点点,保保证证样样本本相相对对集集中中,节节约约调调查费用查费用3.3.需需要要包包含含所所有有低低阶阶段段抽抽样样单单位位的的抽抽样样框框;同同时时由由于于实行了再抽
21、样,使调查单位在更广泛的范围内展开实行了再抽样,使调查单位在更广泛的范围内展开4.4.在大规模的抽样调查中,经常被采用的方法在大规模的抽样调查中,经常被采用的方法 6-20统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统6.2 三种不同性质的分布6.2.1 总体分布6.2.2 样本分布6.2.3 抽样分布6-21统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统1.总体中各元素的观察值所形成的分布 2.分布通常是未知的3.可以假定它服从某种分布 总体分布(population distribution)总体 总体6-22统计学STATISTICS(第二版)篮球比赛是根据运动队在规定的比赛时间里得分多少来决定胜负的,因此,篮球比赛的计时计分系统是一种得分类型的系统1.一个样本中各观察值的分布 2.也称经验分布 3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 样本分布(sample distribution)样 样本 本
限制150内