tk高中数学统计单元复习PPT课件新人教A版必修.ppt
第二章第二章 统计统计 单元复习单元复习 唐克唐克高中数学(必修高中数学(必修3 3)统计初步知识框架图:统计初步知识框架图:如何描如何描述一组述一组数据的数据的情况?情况?从从特征数特征数上描述上描述从从整体分整体分布上描述布上描述描述其集描述其集中趋势中趋势描述其波描述其波动大小动大小平均数平均数众众数数中位数中位数方方差差标准差标准差描述其在描述其在整体上的整体上的分布规律分布规律频率分布频率分布如何用样本如何用样本情况估计总情况估计总体情况?体情况?提出总体、个体、样本、样本容量等概念。提出总体、个体、样本、样本容量等概念。介绍如何用样本平均数去估计总体平均数。介绍如何用样本平均数去估计总体平均数。知识结构知识结构统计统计用样本估计总体用样本估计总体随机抽样随机抽样简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样变量间的相关关系变量间的相关关系用样本的频率用样本的频率布估计总体分布布估计总体分布用样本的数字特征用样本的数字特征估计总体数字特征估计总体数字特征线性回归分析线性回归分析基本概念总体:把所有考察对象的某一数值指标的全体构成的集合看作总体。个体:构成总体的每一个元素作为个体。样本:从总体中抽出若干个体所组成的集合叫样本。注意以下四点:注意以下四点: (1)它要求被抽取样本的总体的个体数有限;)它要求被抽取样本的总体的个体数有限; (2)它是从总体中逐个进行抽取;)它是从总体中逐个进行抽取; (3)它是一种不放回抽样;)它是一种不放回抽样;(4)它是一种)它是一种每个个体被抽到的机会都相等的每个个体被抽到的机会都相等的抽样。抽样。 一般地,设一个总体含有一般地,设一个总体含有N个个体,从中逐个不放个个体,从中逐个不放回地抽取回地抽取n个个体作为样本(个个体作为样本(nN),如果每次抽取时),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。方法叫做简单随机抽样。1、简单随机抽样、简单随机抽样抽签法抽签法2.随机抽样的具体实施方法:随机抽样的具体实施方法:随机数表法随机数表法1、抽签法、抽签法 先将总体中的所有个体(共先将总体中的所有个体(共N个)编号(号个)编号(号码可以从码可以从1到到N),并把号码写在形状、大小相同),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出均匀搅拌。抽签时,每次从中抽出1个号签,连个号签,连续抽取续抽取n次,就得到一个容量为次,就得到一个容量为n的样本。的样本。2 2、用随机数表法进行抽取、用随机数表法进行抽取 随机抽样并不是随意或随便抽取,因为随意或随便抽随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素取都会带有主观或客观的影响因素(1)随机数表是统计工作者用计算机生成的随机数,并保)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。证表中的每个位置上的数字是等可能出现的。(2)随机数表并不是唯一的,因此可以任选一个数作为开)随机数表并不是唯一的,因此可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。始,读数的方向可以向左,也可以向右、向上、向下等等。(3)用随机数表进行抽样的步骤:)用随机数表进行抽样的步骤:将总体中个体编号;将总体中个体编号;选定开始的数字;选定开始的数字;获取样本号码。获取样本号码。(4)由于随机数表是等概率的,因此利用随机数表抽取样)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。本保证了被抽取个体的概率是相等的。当总体的个数较多时,采用简单随机抽样太麻烦,这当总体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成均衡的部分,然后按照预先定出的规则,时将总体分成均衡的部分,然后按照预先定出的规则,从每一部分中抽取从每一部分中抽取1个个体,得到所需要的样本,这种个个体,得到所需要的样本,这种抽样称为系统抽样。抽样称为系统抽样。2系统抽样系统抽样 系统抽样的步骤为:系统抽样的步骤为:(1)采取随机方式将总体中的个体编号。)采取随机方式将总体中的个体编号。(2)将整个的编号均衡地分段,确定分段间隔)将整个的编号均衡地分段,确定分段间隔k。 是整数时,是整数时, ; 不是整数时,从不是整数时,从N中剔除一些个体,使得其为整数为止。中剔除一些个体,使得其为整数为止。nNnNk nN(3)第一段用简单随机抽样确定起始号码)第一段用简单随机抽样确定起始号码l(lk)。(4)按照规则抽取样本:)按照规则抽取样本:l;lk;l2k;lnk3 3分层抽样分层抽样 当已知总体由差异明显的几部分组成时,为了使样本当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样。这种抽样叫做分层抽样。部分所占的比例进行抽样。这种抽样叫做分层抽样。例、一个单位的职工有例、一个单位的职工有500人,其中不到人,其中不到35岁的有岁的有125人,人,3549岁的有岁的有280人,人,50岁以上的有岁以上的有95人。为了了解该单位人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取职工年龄与身体状况的有关指标,从中抽取100名职工作为名职工作为样本,应该怎样抽取?样本,应该怎样抽取?(1)抽取人数与职工总数的比是)抽取人数与职工总数的比是100:5001:5,2 25 5, ,5 51 1为为1 12 25 5取取不不到到3 35 5岁岁的的职职工工数数5 56 65 51 14 49 9岁岁的的人人数数为为2 28 80 0取取3 35 51 19 95 51 19 95 5取取5 50 0岁岁以以上上的的人人数数为为1、 简单随机抽样的方法:简单随机抽样的方法:、抽签法、抽签法、随机数表法、随机数表法用随机数表进行抽样的步骤用随机数表进行抽样的步骤:将总体中个体编号;将总体中个体编号;选定开始的数字,制定规则;选定开始的数字,制定规则;获取样本号码。获取样本号码。2, 系统抽样的步骤为:系统抽样的步骤为:(1)采取随机方式将总体中的个体编号。)采取随机方式将总体中的个体编号。(2)将整个的编号均衡地分段,确定分段间隔)将整个的编号均衡地分段,确定分段间隔k。 是整数时,是整数时, ; 不是整数时,从不是整数时,从N中剔除一些个体,使得其为整数为止。中剔除一些个体,使得其为整数为止。nNnNk nN(3)第一段用简单随机抽样确定起始号码)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:)按照规则抽取样本:l;lk;l2k;lnk3, 分层抽样的抽取步骤:分层抽样的抽取步骤:(1)总体与样本容量确定抽取的比例。)总体与样本容量确定抽取的比例。(2)由分层情况,确定各层抽取的样本数。)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量。)各层的抽取数之和应等于样本容量。(4)对于不能取整的数,求其近似值。)对于不能取整的数,求其近似值。各层个数各层个数总体个数总体个数样本容量样本容量各层抽取个数各层抽取个数总体个数总体个数样本容量样本容量抽取比例抽取比例4三种抽样方法的比较三种抽样方法的比较 类别类别特点特点相互联系相互联系适用范围适用范围共同点共同点简单随简单随机抽样机抽样l从总体中逐个从总体中逐个抽取抽取l总体中总体中的个体个的个体个数较少数较少l抽样抽样过程中过程中每个个每个个体被抽体被抽到的可到的可能性相能性相同同系统系统抽样抽样l将总体平均分将总体平均分成几部分,按事成几部分,按事先确定的规则分先确定的规则分别在各部分中抽别在各部分中抽取取l在起始部在起始部分抽样时,分抽样时,采用采用 简简 单随单随机抽样机抽样l总体中总体中的的 个体个体个数较多个数较多分层分层抽样抽样l将总体分成几将总体分成几层,按各层个体层,按各层个体数之比抽取数之比抽取l各层抽样时各层抽样时采用简单随采用简单随机抽样或系机抽样或系统抽样统抽样l总体由总体由差差 异明异明显的显的 几几部分组成部分组成1如果采用分层抽样,从个体数为如果采用分层抽样,从个体数为N的总体中,抽的总体中,抽取一个容量为取一个容量为n的样本,那么每个个体被抽到的概率的样本,那么每个个体被抽到的概率等于等于 ( )n nNND D. ., ,n n1 1C C. ., ,NN1 1B B. ., ,NNn nA A. .2某小礼堂有座位某小礼堂有座位25排,每排有排,每排有20个座位。一次心理个座位。一次心理讲座,礼堂中坐满了学生,会后为了了解有关情况,留讲座,礼堂中坐满了学生,会后为了了解有关情况,留下了座位号是下了座位号是15的所有的的所有的25名学生测试,这里运用的抽名学生测试,这里运用的抽样方法是(样方法是( ) A.抽签法抽签法 B随机数表法随机数表法 C系统抽样法系统抽样法 D分层抽样法分层抽样法5 5课堂练习课堂练习 3某校高中生共有某校高中生共有900人,其中高一年级人,其中高一年级300人,高二人,高二年级年级200人,高三年级人,高三年级400人,现采取分层抽样抽取容量人,现采取分层抽样抽取容量为为45的样本,那么高一、高二、高三各年级抽取的人数的样本,那么高一、高二、高三各年级抽取的人数分别为(分别为( ) A15,5,25 B15,15,15 C10,5,30 D15,10,204某单位有老年人某单位有老年人28人,中年人人,中年人54人,青年人人,青年人81人,为了调人,为了调查他们身体状况的某项指标,需要从他们中抽取一个容量为查他们身体状况的某项指标,需要从他们中抽取一个容量为36的样本,适合抽取样本的方法是(的样本,适合抽取样本的方法是( )A简单随机抽样简单随机抽样 B系统抽样系统抽样 C分层抽样分层抽样D先从老年人中剔除先从老年人中剔除1人,然后再分层抽样。人,然后再分层抽样。5, 某公司在某公司在A,B,C,D四个地区分别有四个地区分别有150个个,120个个,180个个150个销售点个销售点, 公司为了调查产品销售情况公司为了调查产品销售情况,需从这需从这600个个销售点中抽取容量为销售点中抽取容量为100的样本的样本,记这项调查为记这项调查为; 在在C地区有地区有20个特大型销售点个特大型销售点,现从中抽取现从中抽取7个调查它的销售个调查它的销售收入和销后服务情况收入和销后服务情况,记这项调查为记这项调查为;则完成则完成,这两这两项调查应采取的抽样方法依次为项调查应采取的抽样方法依次为( )A, 分层抽样法分层抽样法, 系统抽样法系统抽样法;B, 分层抽样法分层抽样法, 简单随机抽样法简单随机抽样法;C, 系统抽样法系统抽样法, 分层抽样法分层抽样法;D, 简单随机抽样法简单随机抽样法, 分层抽样法分层抽样法;5某中学有学生某中学有学生2000名,高一、高二、高三的学生人数之比名,高一、高二、高三的学生人数之比为为5:3:2,现要抽取一个容量为,现要抽取一个容量为200的样本,则学生甲被抽的样本,则学生甲被抽到的概率是到的概率是_。若高一学生抽取。若高一学生抽取50人,则样本人,则样本的容量为的容量为_.6某中学高中部一年级有学生某中学高中部一年级有学生400人,二年级有学生人,二年级有学生320人,人,三年有学生三年有学生280人,以每人被抽取的概率为人,以每人被抽取的概率为0.2,向该中学高中,向该中学高中部抽取一个容量为部抽取一个容量为n的样本,则的样本,则n=_。7为了了解某地区参加某项竞赛的为了了解某地区参加某项竞赛的1005名学生的成绩,名学生的成绩,打算从中抽取一个容量为打算从中抽取一个容量为50的样本,现用系统抽样的方的样本,现用系统抽样的方法,需要从总体中剔除法,需要从总体中剔除5个个体,在整个抽样过程中,个个体,在整个抽样过程中,每个个体被剔除的概率和每个个体被抽取的概率分别是每个个体被剔除的概率和每个个体被抽取的概率分别是_和和_。100510055050100510055 5 1005100550501000100050501005100510001000.一个电视台在因特网上就观众对其某一节目的喜爱程一个电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为度进行调查,参加调查的总人数为12000人,其中持各种人,其中持各种态度的人数如下所示:态度的人数如下所示:很喜爱很喜爱 喜爱喜爱 一般一般 不喜爱不喜爱2400 4200 3800 1600打算从中抽取打算从中抽取60人进行详细调查,如何抽取?人进行详细调查,如何抽取?10.某校有职工某校有职工140名,其中教师名,其中教师91名,行政人员名,行政人员28人,后勤人人,后勤人员员21人,为了职工的某种情况,要从中抽取一个容量为人,为了职工的某种情况,要从中抽取一个容量为20的的样本,如何抽取?样本,如何抽取?11 某单位有老年人某单位有老年人28人,中年人人,中年人54人,青年人人,青年人81人为了调查人为了调查他们的身体状况,需从他们中抽取一个容量为他们的身体状况,需从他们中抽取一个容量为36的样本,最适的样本,最适合抽取样本的方法是合抽取样本的方法是( )A简单随机抽样简单随机抽样 B系统抽样系统抽样 C分层抽样分层抽样 D先从老年人中剔除先从老年人中剔除 一人,然后分层抽样一人,然后分层抽样4. 4. 频率分布表频率分布表(1 1)含义:)含义:表示样本数据分布规律的表表示样本数据分布规律的表格格. .(2 2)作法:)作法:第一步,求极差第一步,求极差. .第二步,决定组距与组数第二步,决定组距与组数. .第三步,确定分点,将数据分组第三步,确定分点,将数据分组. .第四步,统计频数,计算频率,制成表第四步,统计频数,计算频率,制成表格格. .5. 5. 频率分布直方图频率分布直方图(1 1)含义:)含义:表示样本数据分布规律的图表示样本数据分布规律的图形形. .(2 2)作法:)作法:第一步,画平面直角坐标系第一步,画平面直角坐标系. .第二步,在横轴上均匀标出各组分点,第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度在纵轴上标出单位长度. .第三步,以组距为宽,各组的频率与组第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长距的商为高,分别画出各组对应的小长方形方形. .6. 6. 频率分布折线图频率分布折线图 在频率分布直方图中,依次连接各在频率分布直方图中,依次连接各小长方形上端中点得到的一条折线,称小长方形上端中点得到的一条折线,称为频率分布折线图为频率分布折线图. .7. 7. 总体密度曲线总体密度曲线 当总体中的个体数很多时,随着样当总体中的个体数很多时,随着样本容量的增加,所分的组数增多,组距本容量的增加,所分的组数增多,组距减少,相应的频率分布折线图越来越接减少,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线曲线为总体密度曲线. .8. 8. 茎叶图茎叶图作法:作法:第一步,将每个数据分为第一步,将每个数据分为“茎茎”(高位)(高位)和和“叶叶”(低位)两部分;(低位)两部分;第二步,将最小的茎和最大的茎之间的第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)数按大小次序排成一列,写在左(右)侧;侧;第三步,将各个数据的叶按大小次序写第三步,将各个数据的叶按大小次序写在茎右(左)侧在茎右(左)侧. .9. 9. 众数、中位数和平均数众数、中位数和平均数众数:众数:频率分布直方图最高矩形下端中频率分布直方图最高矩形下端中点的横坐标点的横坐标. .中位数:中位数:频率分布直方图面积平分线的频率分布直方图面积平分线的横坐标横坐标. .平均数:平均数:频率分布直方图中每个小矩形频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的面积与小矩形底边中点的横坐标之积的总和的总和. .10. 10. 标准差标准差22212()()()nxxxxxxsn-+-+-=L11. 11. 相关关系相关关系 自变量取值一定时,因变量的取值带自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,有一定随机性的两个变量之间的关系,叫做相关关系叫做相关关系. .12. 12. 散点图散点图 在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图. 如果散点图中的点的分布,从整体上如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫量之间具有线性相关关系,这条直线叫做回归直线做回归直线. .13. 13. 回归直线回归直线14. 14. 回归方程回归方程ybxa=+1122211()(),()nniiiiiinniiiixxyyx ynx ybaybxxxxnx巩固练习巩固练习例例1 1 为了了解某地参加计算机水平测试为了了解某地参加计算机水平测试的的50005000名学生的成绩,从中抽取了名学生的成绩,从中抽取了200200名名学生的成绩进行统计分析,在这个问题学生的成绩进行统计分析,在这个问题中,中,50005000名学生成绩的全体是名学生成绩的全体是 ( )A. A. 总体总体 B. B. 个体个体 C. C. 从总体中抽取的一个样本从总体中抽取的一个样本 D. D. 样本的容量样本的容量A A 例例2 2 在在20022002年春季,一家著名的全国性年春季,一家著名的全国性连锁服装店,进行了一项关于当年秋季服装连锁服装店,进行了一项关于当年秋季服装流行色的民意调查流行色的民意调查. .调查者通过向顾客发放饮调查者通过向顾客发放饮料,并让顾客通过挑选饮料杯上印着的颜色料,并让顾客通过挑选饮料杯上印着的颜色来对自己喜欢的服装颜色来对自己喜欢的服装颜色“投票投票”. .根据这次根据这次调查,在某大城市调查,在某大城市A A,服装颜色的众数是红色,服装颜色的众数是红色,而当年全国服装协会发布的是咖啡色而当年全国服装协会发布的是咖啡色. .(1 1)这个结果是否代表)这个结果是否代表A A城市的人的想法?城市的人的想法?(2 2)你认为这两种调查的差异是由什么原因)你认为这两种调查的差异是由什么原因引起的?引起的?(1 1)这个结果只能说明)这个结果只能说明A A城市中光顾这城市中光顾这家连锁服装店的人,比其他人较少倾向家连锁服装店的人,比其他人较少倾向于选择咖啡色,同时由于光顾连锁店的于选择咖啡色,同时由于光顾连锁店的人是一种方便样本,不能代表人是一种方便样本,不能代表A A城市其他城市其他人的想法人的想法. .(2 2)是由样本的代表性引起的)是由样本的代表性引起的. .因为因为A A城城市的调查结果来自于该市光顾这家连锁市的调查结果来自于该市光顾这家连锁服装店的人群,这个样本不能很好地代服装店的人群,这个样本不能很好地代表全国民众的观点表全国民众的观点. . 例例3 3 某初级中学有学生某初级中学有学生270270人,其中七年级人,其中七年级108108人,八、人,八、九年级各九年级各8181人,现要利用抽样方法抽取人,现要利用抽样方法抽取1010人参加某项调人参加某项调查查. .使用分层抽样时,将学生按七、八、九年级依次统使用分层抽样时,将学生按七、八、九年级依次统一编号为一编号为1 1,2 2,270270;使用系统抽样时,将学生随;使用系统抽样时,将学生随机编号为机编号为1 1,2 2,270270,并将整个编号依次分为,并将整个编号依次分为1010段段. .如果抽到的号码有下列四种情况:如果抽到的号码有下列四种情况: 7 7,3434,6161,8888,115115,142142,169169,196196,223223,250250; 5 5,9 9,100100,107107,111111,121121,180180,195195,200200,265265; 1111,3838,6565,9292,119119,146146,173173,200200,227227,254254; 3030,5757,8484,111111,138138,165165,192192,219219,246246,270.270. 那么下列判断正确的是那么下列判断正确的是 ( )A. A. 都不能为系统抽样都不能为系统抽样 B. B. 都不能为分层抽样都不能为分层抽样C. C. 都可能为系统抽样都可能为系统抽样 D. D. 都可能为分层抽样都可能为分层抽样D D