数学必修三统计复习学习教案.pptx
会计学1数学必修三统计数学必修三统计(tngj)复习复习第一页,共30页。本章本章(bn zhn)回回顾顾 本章介绍了从总体中抽取样本的常用方法,并通过本章介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的分布规律、整体实例,研究了如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计水平、稳定程度及相关关系等特性进行估计(gj)和预和预测测总体总体(zngt)抽样抽样分析分析估计估计简简单单随随机机抽抽样样 系系 统统 抽抽 样样 分分 层层 抽抽 样样 样样 本本 分分 布布样样 本本 特特 征征 数数 总总 体体 分分 布布 总总 体体 特特 征征 数数第1页/共30页第二页,共30页。说明说明(shumng):1.抽样公平性原则抽样公平性原则(yunz)等概率等概率随随机性;机性;2.抽签抽签(chu qin)法适用与总体中个数法适用与总体中个数N不大的情形不大的情形.1.将总体中的所有个体编号(号码可以从到将总体中的所有个体编号(号码可以从到);2.将到将到 这这 个号码写在形状、大小相同的号签上个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作);(号签可以用小球、卡片、纸条等制作);3.将号签放在同一箱中,并搅拌均匀;将号签放在同一箱中,并搅拌均匀;4.从箱中每次抽出个号签,并记录其编号,连续抽取从箱中每次抽出个号签,并记录其编号,连续抽取次;次;5.从总体中将与抽到的签的编号相一致的个体取出从总体中将与抽到的签的编号相一致的个体取出.2.1 2.1 抽样方法抽样方法1.简单随机抽样简单随机抽样()抽签法()抽签法第2页/共30页第三页,共30页。例题例题(lt)1 系统抽样(等距系统抽样(等距抽样)抽样)例子例子.为了解高一年级为了解高一年级500名同学的视力情况,试用名同学的视力情况,试用(shyng)系统抽样从中抽取系统抽样从中抽取50名同学进行检查。名同学进行检查。S1:把:把500人从人从1到到500编号编号(bin ho);S3:在第一段:在第一段110号中用的号中用的 的方法的方法 抽取一个号码,比如抽取一个号码,比如3;S4:依次抽取:依次抽取 这这50个号码。个号码。这样就得到了一个容量为这样就得到了一个容量为50的样本。的样本。S2:计算分段间隔为:计算分段间隔为 k=人。把编号从小人。把编号从小 到大依次分成到大依次分成 段,每段段,每段 人;人;编号编号分段分段定首号定首号取余号取余号501050050=10简单随机抽样简单随机抽样简单随机抽样简单随机抽样3 3,1313,2323,3333,第3页/共30页第四页,共30页。2.1 抽样(chu yn)方法(2).随机数表法:随机数表法:将总体中的将总体中的N个个体编号时可以个个体编号时可以(ky)从从0开始,例如当开始,例如当N=100时,时,编号可以是编号可以是00,01,02,99.这样,总体中的所有个体均可用两位这样,总体中的所有个体均可用两位数字号码数字号码(hom)表示,便于使用随机数表表示,便于使用随机数表 当随机地选定开始的数后,读数的方向可以向右,也可以向当随机地选定开始的数后,读数的方向可以向右,也可以向左、向上、向下等由此可见,用随机数表法抽取样本的步骤是:左、向上、向下等由此可见,用随机数表法抽取样本的步骤是:()对总体中的个体进行编号(每个号码位数一致);()对总体中的个体进行编号(每个号码位数一致);()在随机数表中任选一个数作为开始;()在随机数表中任选一个数作为开始;()从选定的数开始按一定的方向读下去,得到的数码()从选定的数开始按一定的方向读下去,得到的数码若不在编号中,则跳过;若在编号中,则取出;如果得到若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满的号码前面已经取出,也跳过;如此继续下去,直到取满为止;为止;()根据选定的号码抽取样本()根据选定的号码抽取样本第4页/共30页第五页,共30页。将总体中的将总体中的N个个体编号时可以从个个体编号时可以从0开始开始(kish),例如当,例如当N=100时,时,编号可以是编号可以是00,01,02,99.这样,总体中的所有个体均可用两位这样,总体中的所有个体均可用两位数字号码表示数字号码表示(biosh),便于使用随机数表,便于使用随机数表 当随机地选定当随机地选定(xun dn)开始的数后,读数的方向可以向右,也可以向开始的数后,读数的方向可以向右,也可以向左、向上、向下等由此可见,用随机数表法抽取样本的步骤是:左、向上、向下等由此可见,用随机数表法抽取样本的步骤是:()对总体中的个体进行编号(每个号码位数一致);()对总体中的个体进行编号(每个号码位数一致);()在随机数表中任选一个数作为开始;()在随机数表中任选一个数作为开始;()从选定的数开始按一定的方向读下去,得到的数码()从选定的数开始按一定的方向读下去,得到的数码若不在编号中,则跳过;若在编号中,则取出;如果得到若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满的号码前面已经取出,也跳过;如此继续下去,直到取满为止;为止;()根据选定的号码抽取样本()根据选定的号码抽取样本第5页/共30页第六页,共30页。例子(l zi):下面我们用随机数表法求解本节开头的问题下面我们用随机数表法求解本节开头的问题()对()对50个同学进行编号个同学进行编号(bin ho),编号,编号(bin ho)分别为分别为01,02,03,50;()在随机数表中随机地确定一个()在随机数表中随机地确定一个(y)数作为开始,如第行第数作为开始,如第行第29列的数开始列的数开始为便于说明,我们将附表中的第行至第行摘录如下:为便于说明,我们将附表中的第行至第行摘录如下:16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28 第第29列列第行第行()从数开始向右读下去,每次读两位,凡不在()从数开始向右读下去,每次读两位,凡不在01到到50中的数跳过去不读,中的数跳过去不读,遇到已经读过的数也跳过去,便可依次得到遇到已经读过的数也跳过去,便可依次得到12,07,44,39,38,33,21,34,29,42这这10个号码,就是所要抽取的个号码,就是所要抽取的10个样本个体的号码个样本个体的号码第6页/共30页第七页,共30页。小结小结(xioji):1.抽样抽样(chu yn)无放回;无放回;2.抽样抽样(chu yn)公平性;公平性;3.抽签法,随机数表法抽签法,随机数表法简单的随机抽样简单的随机抽样.第7页/共30页第八页,共30页。系统抽样的步骤系统抽样的步骤(bzhu)为:为:()采用随机()采用随机(su j)的方式将总体中的个体编号;的方式将总体中的个体编号;()将整个的编号按一定的间隔(设为()将整个的编号按一定的间隔(设为k)分段,)分段,当当 (N为总体中的个体数,为总体中的个体数,n为样本容量)是整数为样本容量)是整数时,时,k=;当;当 不是不是(b shi)整数时,从总体中剔整数时,从总体中剔除一些个体,使剩下的总体中个体的个数除一些个体,使剩下的总体中个体的个数能被能被 整除,这时整除,这时k=,并将剩下的总体重新编号;,并将剩下的总体重新编号;()在第一段中用简单随机抽样确定起始的个体编号()在第一段中用简单随机抽样确定起始的个体编号l;()将编号为()将编号为l l,l l+k,l l+2k,l l+(n-1)k的个体的个体抽出抽出2.系统抽样:系统抽样:第8页/共30页第九页,共30页。第四步将编号第四步将编号(bin ho)为为 ,+10,+20,+610 的个体的个体抽出,组成样本抽出,组成样本第三步在第一段第三步在第一段000,001,002,009这十个这十个编号中用简单编号中用简单(jindn)随机抽样确定起始号码随机抽样确定起始号码 ;因为因为624的的10约为约为62,624不能被不能被62整除,为了保整除,为了保证证“等距等距”分段分段(fn dun),应先剔除人,应先剔除人例;例;某单位在岗职工共某单位在岗职工共624人,为了调查工人用于上班途中的时间,人,为了调查工人用于上班途中的时间,决定抽取决定抽取10的工人进行调查如何采用系统抽样方法完成这一的工人进行调查如何采用系统抽样方法完成这一抽样?抽样?分析分析:第一步将第一步将624名职工用随机方式进行编号;名职工用随机方式进行编号;解:解:第二步从总体中剔除人(剔除方法可用随机数表第二步从总体中剔除人(剔除方法可用随机数表法),将剩下的法),将剩下的620名职工重新编号(分别为名职工重新编号(分别为000,001,002,619),并分成),并分成62段;段;第9页/共30页第十页,共30页。小结小结(xioji):1.适用与总体中个体无明显适用与总体中个体无明显(mngxin)的层的层次差异;次差异;2.系统抽样系统抽样(chu yn)等距抽样等距抽样(chu yn).第10页/共30页第十一页,共30页。一般地,当总体由差异明显的几个部分组成时,为了一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况使样本更客观地反映总体情况(qngkung),我们常常将,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样方法然后按各部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样(叫分层抽样(stratified sampling),其中所分成的各个),其中所分成的各个部分称为部分称为“层层”分层抽样的步骤分层抽样的步骤(bzhu)是:是:()将总体按一定()将总体按一定(ydng)标准标准分层;分层;()计算各层的个体数与总体的个体数的()计算各层的个体数与总体的个体数的比;比;()按各层个体数占总体的个体数的比确定各层应()按各层个体数占总体的个体数的比确定各层应抽取的样本容量;抽取的样本容量;()在每一层进行抽样(可用简单随机抽样或()在每一层进行抽样(可用简单随机抽样或系统抽样)系统抽样)第11页/共30页第十二页,共30页。3.分层抽样分层抽样例某电视台在因特网上就观众对某一节目的例某电视台在因特网上就观众对某一节目的(md)喜爱程度进行调查,参加调查的总人数为喜爱程度进行调查,参加调查的总人数为1200人,其中持各种态度的人数如下表所示:人,其中持各种态度的人数如下表所示:很喜爱喜爱一般不喜爱2435456739261072电视台为进一步了解观众的具体想法和意见,打算电视台为进一步了解观众的具体想法和意见,打算(d sun)从中抽取从中抽取60人进行更为详细的调查,应怎样进行抽样?人进行更为详细的调查,应怎样进行抽样?分析:因为总体中人数较多,所以不宜采用简单随机抽样分析:因为总体中人数较多,所以不宜采用简单随机抽样又由于持不同又由于持不同(b tn)态度的人数差异较大,故也不宜态度的人数差异较大,故也不宜用系统抽样方法,而以分层抽样为妥用系统抽样方法,而以分层抽样为妥第12页/共30页第十三页,共30页。说明说明(shumng):1.适用与总体中个体适用与总体中个体(gt)有明显的层次差异,层次有明显的层次差异,层次分明的特点;分明的特点;2.总体总体(zngt)中个体数中个体数 N较大时,系统抽样,分层抽样较大时,系统抽样,分层抽样二者选其一二者选其一.第13页/共30页第十四页,共30页。类别类别特点特点相互联系相互联系适用范围适用范围共同点共同点简单随简单随机抽样机抽样l从总体中逐个从总体中逐个抽取抽取l总体中总体中的个体个的个体个数较少数较少l抽样抽样过程中过程中每个个每个个体被抽体被抽到的可到的可能性相能性相同同系统系统抽样抽样l将总体平均分将总体平均分成几部分,按事成几部分,按事先确定的规则分先确定的规则分别在各部分中抽别在各部分中抽取取l在起始部在起始部分抽样时,采分抽样时,采用用 简简 单随机单随机抽样抽样l总体中总体中的的 个体个体个数较多个数较多分层分层抽样抽样l将总体分成几将总体分成几层,按各层个体层,按各层个体数之比抽取数之比抽取l各层抽样时各层抽样时采用简单随机采用简单随机抽样或系统抽抽样或系统抽样样l总体由总体由差差 异明异明显的显的 几几部分组成部分组成 以上我们学习了三种抽样方法,这些以上我们学习了三种抽样方法,这些(zhxi)抽样方法的特点及适用范围可归纳如下:抽样方法的特点及适用范围可归纳如下:第14页/共30页第十五页,共30页。3.某校有行政人员、教学人员和教辅某校有行政人员、教学人员和教辅人员共人员共200人,其中教学人员与教辅人,其中教学人员与教辅人员的比为人员的比为101,行政人员有,行政人员有24人,人,现采取分层抽样容量为现采取分层抽样容量为50的样本的样本(yngbn),那,那么行政人员应抽取的人数为么行政人员应抽取的人数为 ()A 3 B 4 C 6 D 8C教学人员和教辅人员应抽取教学人员和教辅人员应抽取(chu q)的人数的人数分别为分别为_和和_.404第15页/共30页第十六页,共30页。用样本估计用样本估计(gj)总体总体 1.作样本(yngbn)频率分布直方图的步骤:(1 1)求极差;)求极差;(2 2)决定)决定(judng)(judng)组距与组数组距与组数;(;(组数极差组数极差/组距组距)(3 3)将数据分组;)将数据分组;(4 4)列频率分布表(分组,频数,频率);)列频率分布表(分组,频数,频率);(5 5)画频率分布直方图。)画频率分布直方图。第16页/共30页第十七页,共30页。例子:例子:2009年义乌小商品博览会共设国际标准展位年义乌小商品博览会共设国际标准展位5000个。个。为了解为了解(lioji)展览期间成交状况,现从中抽取展览期间成交状况,现从中抽取100展位展位的成交额(万元),制成如下频率分布表和频率分布直方的成交额(万元),制成如下频率分布表和频率分布直方图:图:分组分组分组分组频频频频数数数数频率频率频率频率 频率频率频率频率/组距组距组距组距150,170150,170)4 40.040.04170,190170,190)0.050.05190,210190,210)210,230210,230)230,250230,250 5 5合计合计合计合计1 15 5363650500.500.500.050.05100100频率频率(pnl)/组距组距0.0020.002150 170 190 210 230 2500.0060.0100.0140.0180.0220.026万元万元0.360.360.040.050.360.500.050.0020.0020.00250.00250.0180.0180.0250.0250.0020.0025 5第17页/共30页第十八页,共30页。例子:例子:2009年义乌小商品博览会共设国际标准展位年义乌小商品博览会共设国际标准展位5000个。个。为了解展览期间成交状况,现从中抽取若干展位的成交额为了解展览期间成交状况,现从中抽取若干展位的成交额(万元),制成如下频率(万元),制成如下频率(pnl)分布表和频率分布表和频率(pnl)分布分布直方图:直方图:频率频率(pnl)/组组距距0.0020.002150 170 190 210 230 2500.0060.0100.0140.0180.0220.026万元万元0.040.050.360.500.05试通过直方图估计:试通过直方图估计:试通过直方图估计:试通过直方图估计:(1 1)众数;)众数;(2 2)中位数;)中位数;(3 3)平均数;)平均数;最高矩形最高矩形(jxng)区区间中点间中点面积相等(概率面积相等(概率0.5)区间中点与相应概率之区间中点与相应概率之积的和积的和220220万元万元万元万元212212万元万元万元万元209.4209.4万元万元万元万元第18页/共30页第十九页,共30页。小结小结(xioji):1.频率频率(pnl)直方图中矩形条的面积直方图中矩形条的面积=组距组距=频率频率(pnl);2.频率频率(pnl)分布表分布表 频率频率(pnl)直方图直方图 后者更直观后者更直观形象地反映样本的分布规律形象地反映样本的分布规律.第19页/共30页第二十页,共30页。2.3 总体(zngt)特征数的估计1.平均数平均数2.方差方差(fn ch),标,标准差准差设一组样本设一组样本(yngbn)数据数据 ,其平均数为其平均数为 ,则称则称为这个样本的方差,其算术平方根为这个样本的方差,其算术平方根 为样本的标准差为样本的标准差,分别简称样本方差、样本标准差分别简称样本方差、样本标准差小结:小结:1.方差,标准差是用来刻画样本的稳定性;方差,标准差是用来刻画样本的稳定性;2.比较的标准比较的标准越小越好。越小越好。第20页/共30页第二十一页,共30页。例:甲、乙两种冬水稻试验品种连续例:甲、乙两种冬水稻试验品种连续5年的平均单位面积产年的平均单位面积产量如下量如下(rxi)(单位:(单位:t/hm2),试根据这组数据估计哪),试根据这组数据估计哪一种水稻品种的产量比较稳定一种水稻品种的产量比较稳定品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8第21页/共30页第二十二页,共30页。2.4线性相关关系线性相关关系:能用直线方程能用直线方程近似表示的相关关系叫做近似表示的相关关系叫做线性相关关系线性相关关系.第22页/共30页第二十三页,共30页。线性回归方程线性回归方程:一般地一般地,设有设有n个观察数据如下:个观察数据如下:当当a,b使使取得最小值时取得最小值时,就称就称这这n对数据的对数据的线性回归方程线性回归方程,该方程所表该方程所表示的直线称为示的直线称为回归直线回归直线.为拟合为拟合第23页/共30页第二十四页,共30页。11.69第24页/共30页第二十五页,共30页。7.7.小王记录了产量小王记录了产量x x(吨)和能耗(吨)和能耗y y(吨标准煤)对应(吨标准煤)对应的四组数据,用最小二乘法的四组数据,用最小二乘法(chngf)(chngf)求出了求出了 ,不慎将一滴墨水滴于表内,表中第二行第四列的数,不慎将一滴墨水滴于表内,表中第二行第四列的数据已无法看清,据您判断这个数据应该是多少?据已无法看清,据您判断这个数据应该是多少?x3456y2.5344.5思考思考思考思考(sko)(sko):您如何判断:您如何判断:您如何判断:您如何判断 x x 与与与与 y y 成线性相关关成线性相关关成线性相关关成线性相关关系?系?系?系?思考:您认为思考:您认为思考:您认为思考:您认为(rnwi)(rnwi)小王求出的线性回归直线方小王求出的线性回归直线方小王求出的线性回归直线方小王求出的线性回归直线方程对吗?程对吗?程对吗?程对吗?思考:如果原来思考:如果原来思考:如果原来思考:如果原来100100吨产品的能耗为吨产品的能耗为吨产品的能耗为吨产品的能耗为9090吨煤;试预测吨煤;试预测吨煤;试预测吨煤;试预测现在的能耗比技术改造前降低了多少吨煤?现在的能耗比技术改造前降低了多少吨煤?现在的能耗比技术改造前降低了多少吨煤?现在的能耗比技术改造前降低了多少吨煤?第25页/共30页第二十六页,共30页。x3456y2.5344.5第26页/共30页第二十七页,共30页。解:解:所以线性回归方程为所以线性回归方程为 y=0.7x+0.35由系数由系数(xsh)公式可知,公式可知,第27页/共30页第二十八页,共30页。C第28页/共30页第二十九页,共30页。4.4.三点三点(sn din)(3,10),(7,20),(11,24)(sn din)(3,10),(7,20),(11,24)的的线性回归方程是线性回归方程是 ()()D第29页/共30页第三十页,共30页。