必修三统计(小结与复习)12页.doc
如有侵权,请联系网站删除,仅供学习与交流必修三统计(小结与复习)【精品文档】第 10 页广州市学乐教育高中数学培优系列统计姓名:李日智年级:高二【考点审视】 高考对概率与统计的要求基本上控制在了解基本概念,掌握基本方法,会根据基本公式解决一些与概率统计有关的应用题。掌握随机抽样、系统抽样、分层抽样三种常用的抽样方法。了解正态分布的意义和主要性质,了解线形回归的方法。了解随机变量,离散型随机变量的意义,会求离散型随机变量的分布列、期望值和方差。【教学内容】简单随机抽样、系统抽样、分层抽样三种常用的抽样方法。用样本的数字特征估计总体的数字特征。用样本的数字特征估计总体的数字特征【重难点】用样本的数字特征估计总体的数字特征。用样本的数字特征估计总体的数字特征【知识框架】知识精讲:一、随机抽样三种常用抽样方法:1简单随机抽样:设一个总体的个数为N。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。实现简单随机抽样,常用抽签法和随机数表法。(1)抽签法制签:先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌;抽签:抽签时,每次从中抽出1个号签,连续抽取次;成样:对应号签就得到一个容量为的样本。抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。(2)随机数表法编号:对总体进行编号,保证位数一致;数数:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。在读数过程中,得到一串数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。成样:对应号签就得到一个容量为的样本。结论: 用简单随机抽样,从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为; 基于此,简单随机抽样体现了抽样的客观性与公平性; 简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样。2系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。系统抽样的步骤可概括为:(1)将总体中的个体编号。采用随机的方式将总体中的个体编号;(2)将整个的编号进行分段。为将整个的编号进行分段,要确定分段的间隔.当是整数时,;当不是整数时,通过从总体中剔除一些个体使剩下的个体数N´能被整除,这时;(3)确定起始的个体编号。在第1段用简单随机抽样确定起始的个体边号;(4)抽取样本。按照先确定的规则(常将加上间隔)抽取样本:。3分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层。结论:(1)分层抽样是等概率抽样,它也是公平的。用分层抽样从个体数为N的总体中抽取一个容量为的样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于;(2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,在实践的应用更为广泛。典型例题:【例1】某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适A.系统抽样 B.简单随机抽样C.分层抽样 D.随机数表法【例2】为了解1200名学生对学校教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为A.40 B.30 C.20 D.12【例3】从N个编号中要抽取n个号码入样,若采用系统抽样方法抽取,则分段间隔应为A. B.n C. D.+1【例】系统抽样适用的总体应是A.容量较少的总体 B.总体容量较多C.个体数较多但均衡的总体 D.任何总体【例5】下列说法正确的个数是总体的个体数不多时宜用简单随机抽样法在总体均分后的每一部分进行抽样时,采用的是简单随机抽样百货商场的抓奖活动是抽签法整个抽样过程中,每个个体被抽取的机率相等(有剔除时例外)A.1 B.2 C.3 D.4【例6】一批灯泡400只,其中20 W、40 W、60 W的数目之比为4,现用分层抽样的方法产生一个容量为40的样本,三种灯泡依次抽取的个数为_.【例7】从总体为N的一批零件中用分层抽样抽取一个容量为的样本,若每个零件被抽取的机率为.25,则N等于A.150B.200C.120D.100【例8】一个总体的60个个体的编号为0,1,2,59,现要从中抽取一个容量为10的样本,请根据编号按被6除余3的方法,取足样本,则抽取的样本号码是_.【例9】体育彩票000001100000编号中,凡彩票号码最后三位数为345的中一等奖,采用的是系统抽样法吗?为什么? 【例10】某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示.很喜爱喜爱一般不喜爱2435456739261072电视台为了了解观众的具体想法和意见,打算从中抽选出60人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中各应抽选出多少人?分析:首先确定抽取比例,然后再根据各层人数确定各层要抽取的人数.二、用样本估计总体一频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:1、求极差,计算一组数据中最大值与最小值的差2、决定组距与组数3、将数据分组4、列频率分布表5、画频率分布直方图二频率分布直方图的特征:1、从频率分布直方图可以清楚的看出数据分布的总体趋势。2、从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。3、在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。三频率分布折线图、总体密度曲线1频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。2总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。根据这条曲线,可求出总体在区间(a,b)内取值的百分比(概率)等于该区间上总体密度曲线与x轴、直线x=a、x=b所围成曲边梯形的面积。总体密度曲线函数y=f(x)的两条基本性质:f(x) 0(xR); 由曲线y=f(x)与x轴围成面积为1。四众数、中位数、平均数、标准差、方差平均数:一组数据的总和除以这组数据个数所得到的商叫这组数据的平均数。 中位数:将一组数据按大小顺序排列,处在最中间位置的一个数叫做这组数据的中位数。如果数据的个数是偶数,则中间两个数据的平均数是这组数据的中位数。 众数: 在一组数据中出现次数最多的数叫做这组数据的众数。如果有两个或两个以上个数出现次数都是最多的,那么这几个数都是这组数据的众数。标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差。标准差是样本数据到平均数的一种平均距离,一般用s表示。样本数据的标准差的算法:() 算出样本数据的平均数。() 算出每个样本数据与样本数据平均数的差:() 算出()中的平方。() 算出()中n个平方数的平均数,即为样本方差。() 算出()中平均数的算术平方根,即为样本标准差。其计算公式为:方差:标准差的平方为方差 典型例题:【例1】为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?90100110120130140150次数o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036 【例2】某班学生在一次数学考试中成绩分布如下表:分数段0,80)80,90)90,100)人数256分数段100,110)110,120) 120,130)人数8126分数段130,140)140,150)人数42那么分数在100,110)中的频率和分数不满110分的累积频率分别是_、_(精确到0.01). 【例5】对某电子元件进行寿命追踪调查,情况如下:寿命(h)100200200300300400400500500600个 数2030804030(1)列出频率分布表;(2)估计电子元件寿命在100400 h以内的概率;(3)估计电子元件寿命在400 h以上的概率.分析:通过本题可掌握总体分布估计的各种方法和步骤.【例6】求出下列每组数据的众数、中位数、平均数、标准差及方差。并画出样本数据的条形图。(1),(2),(3),三、变量间的相关关系1、相关关系的概念:自变量取值一定时,因变量的取值带有一定的随机性,则两个变量之间的关系叫做相关关系.2、回归分析:对具有相关关系的两个变量进行统计分析的方法叫回归分析.例如,施化肥量对水稻产量影响的试验数据:施化肥量x15202530354045水稻产量y330345365405445450455观察表中数据,大体上随着施化肥量的增加,水稻的产量也在增加.我们可以作统计图、表,以便对两者有一个直观的印象和判断.散点图是研究相关关系最常用的一种统计图.它能形象地反映各对数据的密切程度.我们把表示具有相关关系的两个变量的一组数据的图形,叫做散点图.上例的散点图如下图.从散点图可以看出因变量随自变量的增大而增大,图中的点分布在左下角到右上角的区域,这种相关关系称作正相关.若图中的点分布在左上角到右下角的区域.则称作负相关。图中的点分布在一条直线附近,这条直线叫回归直线。一般用最小二乘法求回归直线。.3、最小二乘法:求回归直线方程的步骤:(1)将已知的数据列表,列出x,y,并求出,,xy(2)利用公式 , a=b,计算回归系数b,a.(3)写出回归直线方程=bx+a.典型例题:【例1】一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次实验,收集数据如下:零件数x(个)1020304050607080加工时间y(分钟)626875818995102108(1)画出散点图;(2)求回归方程;(3)关于加工零件的个数与加工时间,你能得出什么结论?解析:(1)散点图略.(2).先把数据列成表.项 目类 型零件数x加工时间Yx2Y2xYA10621003844620B206840046241360C307590056252250D4081160065613240E5089250079214450F6095360090255700G701024900104047140H801086400116648640360680204005966833400.计算b,a的值.由上表分别计算x,Y的平均数得=,=.代入公式b=,a=b,(注意:不必把,化为小数,以减小误差)求得:b=0.666667,a=0.666667×=8530=55.写出回归直线方程.=55+0.666667x.(3)回归直线方程=55+0.666667x中的回归系数b=0.666667,它的意义是:零件数每增加一个,加工时间平均增加0.666667 min.练习巩固:一随机抽样1 为了了解参加运动会的名运动员的年龄情况,从中抽取名运动员;就这个问题,下列说法中正确的有( ) 名运动员是总体;每个运动员是个体;所抽取的名运动员是一个样本;样本容量为;这个抽样方法可采用按年龄进行分层抽样;每个运动员被抽到的概率相等 2 要从已编号()的枚最新研制的某型导弹中随机抽取枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的枚导弹的编号可能是()A B C D 3若总体中含有1650个个体,现在要采用系统抽样,从中抽取一个容量为35的样本,分段时应从总体中随机剔除个个体,编号后应均分为段,每段有个个体4某学校有1 6 0名教职工,其中教师1 20名,行政人员1 6名,后勤服务人员24名,今从中抽取一个容量为20的样本,采用( )较为合适 A简单随机抽样 B系统抽样 C分层抽样 D其他抽样5.某初级中学共有学生2000名,各年级男、女生人数如下表:初一年级初二年级初三年级女生373380男生377370现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取( )名?A10 B12 C14D与和的值有关6某校有行政人员、教学人员和教辅人员共200人,其中教学人员与教辅人员的比为10:1,行政人员有24人,现采取分层抽样容量为50的样本,那么行政人员应抽取的人数为( )A 3 B 4 C6 D. 8 7一个单位的职工有500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁以上的有95人,为了了解这个单位职工与身体状况有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?二用样本的数字特征估计总体的数字特征1、样本容量为200的频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在内的频数为( ),A.16 B.32C.64 D.1602 容量为的样本数据,按从小到大的顺序分为组,如下表:组号12345678频数1013x141513129第三组的频数和频率分别是 ( )A 和 B 和 C 和 D 和2400 2700 3000 3300 3600 3900 体重00 001频率/组距3.观察新生婴儿的体重,其频率分布直方图如下图所示,则新生婴儿体重在的频率为 4、在抽查产品尺寸的过程中,将其尺寸分成若干组,a,b是其中的一组,抽查出的个体在该组上的频率为,该组上的直方图的高为,则( )A B CD5、某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(均为整数)分成六段40,50),50,60)90,100后画出如下部分频率分布直方图观察图形的信息,回答下列问题:(1)求第四小组的频率,并补全这个频率分布直方图;(2)估计这次考试的及格率(60分及以上为及格) 三用样本的数字特征估计总体的数字特征1、甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):甲:25 41 40 37 22 14 19 39 21 42乙:27 16 44 27 44 16 40 40 16 40问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?四、课堂小结:简单随机抽样、系统抽样、分层抽样三种常用的抽样方法。用样本的数字特征估计总体的数字特征。用样本的数字特征估计总体的数字特征