《必修三统计小结.pptx》由会员分享,可在线阅读,更多相关《必修三统计小结.pptx(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、本章回顾(知识结构)总体抽样分析估计简单随机抽样 系 统 抽 样 分 层 抽 样 样 本 分 布样 本 特 征 数 总 体 分 布 总 体 特 征 数第1页/共30页说明:1.抽样公平性原则等概率随机性;2.抽签法适用与总体中个数N不大的情形.1.将总体中的所有个体编号(号码可以从到);2.将到 这 个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作);3.将号签放在同一箱中,并搅拌均匀;4.从箱中每次抽出个号签,并记录其编号,连续抽取次;5.从总体中将与抽到的签的编号相一致的个体取出.2.1 2.1 抽样方法抽样方法1.简单随机抽样()抽签法第2页/共30页例题例题1 系统抽
2、样(等距抽样)系统抽样(等距抽样)例子.为了解高一年级500名同学的视力情况,试用系统抽样从中抽取50名同学进行检查。S1:把500人从1到500编号;S3:在第一段110号中用的 的方法 抽取一个号码,比如3;S4:依次抽取 这50个号码。这样就得到了一个容量为50的样本。S2:计算分段间隔为 k=人。把编号从小 到大依次分成 段,每段 人;编号编号分段分段定首号定首号取余号取余号501050050=10简单简单随机抽随机抽随机抽随机抽样样3 3,1313,2323,3333,第3页/共30页2.1 抽样方法(2).随机数表法:将总体中的N个个体编号时可以从0开始,例如当N=100时,编号可
3、以是00,01,02,99.这样,总体中的所有个体均可用两位数字号码表示,便于使用随机数表 当随机地选定开始的数后,读数的方向可以向右,也可以向左、向上、向下等由此可见,用随机数表法抽取样本的步骤是:()对总体中的个体进行编号(每个号码位数一致);()在随机数表中任选一个数作为开始;()从选定的数开始按一定的方向读下去,得到的数码若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满为止;()根据选定的号码抽取样本第4页/共30页将总体中的N个个体编号时可以从0开始,例如当N=100时,编号可以是00,01,02,99.这样,总体中的所有个体均可用
4、两位数字号码表示,便于使用随机数表 当随机地选定开始的数后,读数的方向可以向右,也可以向左、向上、向下等由此可见,用随机数表法抽取样本的步骤是:()对总体中的个体进行编号(每个号码位数一致);()在随机数表中任选一个数作为开始;()从选定的数开始按一定的方向读下去,得到的数码若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满为止;()根据选定的号码抽取样本第5页/共30页例子:下面我们用随机数表法求解本节开头的问题()对50个同学进行编号,编号分别为01,02,03,50;()在随机数表中随机地确定一个数作为开始,如第行第29列的数开始为便于说
5、明,我们将附表中的第行至第行摘录如下:16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42
6、 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28 第29列第行()从数开始向右读下去,每次读两位,凡不在01到50中的数跳过去不读,遇到已经读过的数也跳过去,便可依次得到12,07,44,39,38,33,21,34,29,42这10个号码,就是所要抽取的10个样本个体的号码第6页/共30页小结:小结:1.抽样无放回;2.抽样公平性;3.抽签法,随机数表法简单的随机抽样.第7页/共30页系统抽样的步骤为:()采用随机的方式将总体中的个体编号;()将整个的编号按一定
7、的间隔(设为k)分段,当 (N为总体中的个体数,n为样本容量)是整数时,k=;当 不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数能被 整除,这时k=,并将剩下的总体重新编号;()在第一段中用简单随机抽样确定起始的个体编号l;()将编号为l l,l l+k,l l+2k,l l+(n-1)k的个体抽出2.系统抽样:第8页/共30页第四步将编号为 ,+10,+20,+610 的个体抽出,组成样本第三步在第一段000,001,002,009这十个编号中用简单随机抽样确定起始号码 ;因为624的10约为62,624不能被62整除,为了保证“等距”分段,应先剔除人例;某单位在岗职工共624人
8、,为了调查工人用于上班途中的时间,决定抽取10的工人进行调查如何采用系统抽样方法完成这一抽样?分析:第一步将624名职工用随机方式进行编号;解:第二步从总体中剔除人(剔除方法可用随机数表法),将剩下的620名职工重新编号(分别为000,001,002,619),并分成62段;第9页/共30页小结:小结:1.适用与总体中个体无明显的层次差异;2.系统抽样等距抽样.第10页/共30页 一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样(stratified
9、 sampling),其中所分成的各个部分称为“层”分层抽样的步骤是:()将总体按一定标准分层;()计算各层的个体数与总体的个体数的比;()按各层个体数占总体的个体数的比确定各层应抽取的样本容量;()在每一层进行抽样(可用简单随机抽样或系统抽样)第11页/共30页3.分层抽样例某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为1200人,其中持各种态度的人数如下表所示:很喜爱很喜爱喜爱喜爱一般一般不喜爱不喜爱24352435456745673926392610721072电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应怎样进行抽样?分析:因
10、为总体中人数较多,所以不宜采用简单随机抽样又由于持不同态度的人数差异较大,故也不宜用系统抽样方法,而以分层抽样为妥第12页/共30页说明:说明:1.适用与总体中个体有明显的层次差异,层次分明的特点;2.总体中个体数 N较大时,系统抽样,分层抽样二者选其一.第13页/共30页类别类别类别类别特点特点特点特点相互联系相互联系相互联系相互联系适用范围适用范围适用范围适用范围共同点共同点共同点共同点简单随简单随简单随简单随机抽样机抽样机抽样机抽样l l从总体中逐个从总体中逐个从总体中逐个从总体中逐个抽取抽取抽取抽取l l总体中总体中总体中总体中的个体个的个体个的个体个的个体个数较少数较少数较少数较少l
11、 l抽样抽样抽样抽样过程中过程中过程中过程中每个个每个个每个个每个个体被抽体被抽体被抽体被抽到的可到的可到的可到的可能性相能性相能性相能性相同同同同系统系统系统系统抽样抽样抽样抽样l l将总体平均分将总体平均分将总体平均分将总体平均分成几部分,按事成几部分,按事成几部分,按事成几部分,按事先确定的规则分先确定的规则分先确定的规则分先确定的规则分别在各部分中抽别在各部分中抽别在各部分中抽别在各部分中抽取取取取l l在起始部在起始部在起始部在起始部分抽样时,采分抽样时,采分抽样时,采分抽样时,采用用用用 简简简简 单随机单随机单随机单随机抽样抽样抽样抽样l l总体中总体中总体中总体中的的的的 个体
12、个体个体个体个数较多个数较多个数较多个数较多分层分层分层分层抽样抽样抽样抽样l l将总体分成几将总体分成几将总体分成几将总体分成几层,按各层个体层,按各层个体层,按各层个体层,按各层个体数之比抽取数之比抽取数之比抽取数之比抽取l l各层抽样时各层抽样时各层抽样时各层抽样时采用简单随机采用简单随机采用简单随机采用简单随机抽样或系统抽抽样或系统抽抽样或系统抽抽样或系统抽样样样样l l总体由总体由总体由总体由差差差差 异明异明异明异明显的显的显的显的 几几几几部分组成部分组成部分组成部分组成 以上我们学习了三种抽样方法,这些抽样方法的特点及适用范围可归纳如下:第14页/共30页 1.现有以下两项调查
13、:某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检查其装订质量状况;某市有大型、中型与小型的商店共1500家,三者数量之比为1 5 9为了调查全市商店每日零售额情况,抽取其中15家进行调查.完成、这两项调查宜采用的抽样方法依次是 ()A、简单随机抽样法,分层抽样法 B、分层抽样法,简单随机抽样法C、分层抽样法,系统抽样法 D、系统抽样法,分层抽样法D第15页/共30页2.要从已编号(160)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是 ()A5,10,15,20,25,30 B3,13
14、,23,33,43,53 C1,2,3,4,5,6 D2,8,14,20,26,32B第16页/共30页3.某校有行政人员、教学人员和教辅人员共200人,其中教学人员与教辅人员的比为10 1,行政人员有24人,现采取分层抽样容量为50的样本,那么行政人员应抽取的人数为 ()A 3 B 4 C 6 D 8C教学人员和教辅人员应抽取的人数分别为_和_.404第17页/共30页用样本估计总体用样本估计总体 1.作作样本本频率分布直方率分布直方图的步的步骤:(1 1)求极差;)求极差;(2 2)决定)决定组距与距与组数数;(;(组数极差数极差/组距距)(3 3)将数据分)将数据分组;(4 4)列)列频
15、率分布表(分率分布表(分组,频数,数,频率);率);(5 5)画)画频率分布直方率分布直方图。第18页/共30页例子:例子:2009年年义乌小商品博小商品博览会共会共设国国际标准展位准展位5000个。个。为了解展了解展览期期间成交状况,成交状况,现从中抽取从中抽取100展位的展位的成交成交额(万元),制成如下(万元),制成如下频率分布表和率分布表和频率分布直方率分布直方图:分分分分组组频频数数数数频频率率率率 频频率率率率/组组距距距距150,170150,170)40.4170,190170,190)0.5190,210190,210)210,230210,230)230,250230,25
16、0 5合合合合计计1 15 536365050100100频率/组距150 170 190 210 230 2500.0060.0100.0140.0180.0220.026万元0.040.050.360.500.05第19页/共30页例子:例子:2009年年义乌小商品博小商品博览会共会共设国国际标准展位准展位5000个。个。为了解展了解展览期期间成交状况,成交状况,现从中抽取若干展位的从中抽取若干展位的成交成交额(万元),制成如下(万元),制成如下频率分布表和率分布表和频率分布直方率分布直方图:频率/组距150 170 190 210 230 2500.0060.0100.0140.0180
17、.0220.026万元0.040.050.360.500.05试试通通通通过过直方直方直方直方图图估估估估计计:(1 1)众数;)众数;(2 2)中位数;)中位数;(3 3)平均数;)平均数;最高矩形区最高矩形区间中点中点面面积相等(概率)相等(概率)区区间中点与相中点与相应概率概率之之积的和的和220220万元万元万元万元212212万元万元万元万元万元万元万元万元第20页/共30页小结:小结:1.频率直方图中矩形条的面积=组距=频率;2.频率分布表 频率直方图 后者更直观形象地反映样本的分布规律.第21页/共30页2.3 总体特征数的估计1.平均数2.方差,标准差设一组样本数据 ,其平均数
18、为 ,则称为这个样本的方差,其算术平方根 为样本的标准差,分别简称样本方差、样本标准差小结:小结:1.方差,标准差是用来刻画样本的稳定性;2.比较的标准越小越好。第22页/共30页2.4线性相关关系:能用直线方程近似表示的相关关系叫做线性相关关系.第23页/共30页线性回归方程:一般地,设有n个观察数据如下:当a,b使取得最小值时,就称这n对数据的线性回归方程,该方程所表示的直线称为回归直线.为拟合第24页/共30页第25页/共30页7.7.小王小王记录了了产量量x x(吨)和能耗(吨)和能耗y y(吨(吨标准煤)准煤)对应的四的四组数据,用最小二乘法求出了数据,用最小二乘法求出了 ,不慎将一
19、滴墨水滴于表内,表中第二行第四列的数据不慎将一滴墨水滴于表内,表中第二行第四列的数据已无法看清,据您判断已无法看清,据您判断这个数据个数据应该是多少?是多少?x3456y2.5344.5思考:您如何判断思考:您如何判断思考:您如何判断思考:您如何判断 x 与与与与 y 成成成成线线性相关关系?性相关关系?性相关关系?性相关关系?思考:您思考:您思考:您思考:您认为认为小王求出的小王求出的小王求出的小王求出的线线性回性回性回性回归归直直直直线线方程方程方程方程对吗对吗?思考:如果原来思考:如果原来思考:如果原来思考:如果原来100100吨吨吨吨产产品的能耗品的能耗品的能耗品的能耗为为9090吨煤;吨煤;吨煤;吨煤;试预测试预测现现在的能耗比技在的能耗比技在的能耗比技在的能耗比技术术改造前降低了多少吨煤?改造前降低了多少吨煤?改造前降低了多少吨煤?改造前降低了多少吨煤?第26页/共30页x3456y2.5344.5第27页/共30页解:解:所以所以线性回性回归方程方程为 y=0.7x+0.35由系数公式可知,由系数公式可知,第28页/共30页4.4.三点(3,10),(7,20),(11,24)(3,10),(7,20),(11,24)的线性回归方程是 ()()D第29页/共30页感谢您的观看!第30页/共30页
限制150内