高中数学必修第二章复习课.ppt
必修必修3 第二章第二章统计复习课统计复习课知识结构知识结构统计统计用样本估计总体用样本估计总体随机抽样随机抽样简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样变量间的相关关系变量间的相关关系用样本的频率用样本的频率布估计总体分布布估计总体分布用用样样本本的的数数字字特特征征估计总体数字特征估计总体数字特征线性回归分析线性回归分析知识梳理知识梳理1.1.简单随机抽样简单随机抽样 (1 1)思想:)思想:设一个总体有设一个总体有N N个个体,个个体,从中从中逐个逐个不放回不放回地抽取地抽取n n个个体作为样本,个个体作为样本,如果每次抽取时如果每次抽取时总体内的总体内的各个个体被抽到的机会都相等各个个体被抽到的机会都相等,则这种抽则这种抽样方法叫做简单随机抽样样方法叫做简单随机抽样.抽签法:抽签法:第一步,将总体中的所有个体编号,并把号码第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上写在形状、大小相同的号签上.第二步,将号签放在一个容器中,并搅拌均匀第二步,将号签放在一个容器中,并搅拌均匀.第三步,每次从中抽取一个号签,连续抽取第三步,每次从中抽取一个号签,连续抽取n n次,就得到一个容量为次,就得到一个容量为n n的样本的样本.(2 2)步骤:)步骤:随机数表法:随机数表法:第一步,将总体中的所有个体编号第一步,将总体中的所有个体编号.第二步,在随机数表中任选一个数作为起始数第二步,在随机数表中任选一个数作为起始数.第三步,从选定的数开始依次向右(向左、向第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满外的数去掉,直到取满n n个号码为止,就得到一个个号码为止,就得到一个容量为容量为n n的样本的样本.2.2.系统抽样系统抽样 (1 1)思想:)思想:将总体分成均衡的将总体分成均衡的n n个部分,再按照预先个部分,再按照预先定出的规则,从每一部分中抽取定出的规则,从每一部分中抽取1 1个个体,即得到容量为个个体,即得到容量为n n的样本的样本.(2 2)步骤:)步骤:第一步,将总体的第一步,将总体的N N个个体编号个个体编号.第二步,确定分段间隔第二步,确定分段间隔k k,对编号进行分段,对编号进行分段.第三步,在第第三步,在第1 1段用简单随机抽样确定起始个体编号段用简单随机抽样确定起始个体编号.第四步,按照一定的规则抽取样本第四步,按照一定的规则抽取样本.3.3.分层抽样分层抽样 (1 1)思想:)思想:若总体由差异明显的几部分组成,抽样时,若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本一起作为样本.(2 2)步骤:)步骤:第一步,计算样本容量与总体的个体数之比第一步,计算样本容量与总体的个体数之比.第二步,将总体分成互不交叉的层,按比例确定各层第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数要抽取的个体数.第三步,用简单随机抽样或系统抽样在各层中抽取相第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体应数量的个体.第四步,将各层抽取的个体合在一起,就得到所取样第四步,将各层抽取的个体合在一起,就得到所取样本本.4.4.频率分布表频率分布表(1)(1)含义:含义:表示样本数据分布规律的表格表示样本数据分布规律的表格.(2)(2)作法:作法:第一步,求极差第一步,求极差.第二步,决定组距与组数第二步,决定组距与组数.第三步,确定分点,将数据分组第三步,确定分点,将数据分组.第四步,统计频数,计算频率,制成表格第四步,统计频数,计算频率,制成表格.9 分分 组组 频频数累数累计计 频频数数 频频率率 0 0,0.50.5)4 0.04 4 0.04 0.5 0.5,1 1)正正 8 0.08 8 0.08 1 1,1.51.5)正正 正正 正正 15 0.15 15 0.15 1.5 1.5,2 2)正正 正正 正正 正正 22 0.22 22 0.22 2 2,2.52.5)正正 正正 正正 正正 正正 25 0.25 25 0.25 2.5 2.5,3 3)正正 正正 14 0.14 14 0.14 3 3,3.53.5)正正 一一 6 0.06 6 0.06 3.5 3.5,4 4)4 0.04 4 0.04 4 4,4.5 2 0.024.5 2 0.02 合合计计 100 1.00 100 1.005.5.频率分布直方图频率分布直方图(1 1)含义:)含义:表示样本数据分布规律的图形表示样本数据分布规律的图形.(2 2)作法:)作法:第一步,画平面直角坐标系第一步,画平面直角坐标系.第二步,在横轴上均匀标出各组分点,在纵轴第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度上标出单位长度.第三步,以组距为宽,各组的频率与组距的商第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形为高,分别画出各组对应的小长方形.00.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5频率频率/组距组距 月均用水量月均用水量/t/t (组距组距=0.5)=0.5)0.080.160.30.440.50.30.10.080.04频率分布直方图如下频率分布直方图如下:6.6.频率分布折线图频率分布折线图 在频率分布直方图中,依次连接各小长方形上在频率分布直方图中,依次连接各小长方形上端中点得到的一条折线,称为频率分布折线图端中点得到的一条折线,称为频率分布折线图.13月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图中连接频率分布直方图中各小长方形上端的中点各小长方形上端的中点,得到得到频率分布折线图频率分布折线图07.7.总体密度曲线总体密度曲线 当总体中的个体数很多时,随着样本容量的增当总体中的个体数很多时,随着样本容量的增加,所分的组数增多,组距减少,相应的频率分布加,所分的组数增多,组距减少,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线光滑曲线为总体密度曲线.频率频率组距组距月均用水量月均用水量(mm)当样本容量无限增大,分组的组距无限缩小,那么频率分当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线布直方图就会无限接近一条光滑曲线总体密度曲线总体密度曲线8.8.茎叶图茎叶图 作法:作法:第一步,将每个数据分为第一步,将每个数据分为“茎茎”(高位)和(高位)和“叶叶”(低位)两部分;(低位)两部分;第二步,将最小的茎和最大的茎之间的数按大第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;小次序排成一列,写在左(右)侧;第三步,将各个数据的叶按大小次序写在茎右第三步,将各个数据的叶按大小次序写在茎右(左)侧(左)侧.茎叶图茎叶图甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 336 83 8 9 1甲:甲:13,51,23,8,26,38,16,33,14,28,39乙乙:49,24,12,31,50,31,44,36,15,37,25,36,399.9.众数、中位数和平均数众数、中位数和平均数 众数:众数:频率分布直方图最高矩形下端中点的频率分布直方图最高矩形下端中点的横坐标横坐标.中位数:中位数:频率分布直方图面积平分线的横坐标频率分布直方图面积平分线的横坐标.平均数:平均数:频率分布直方图中每个小矩形的面积频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和与小矩形底边中点的横坐标之积的总和.10.10.标准差标准差11.11.相关关系相关关系 自变量取值一定时,因变量的取值带有一定随自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系机性的两个变量之间的关系,叫做相关关系.如果散点图中的点的分布,从整体上看大致在如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线关系,这条直线叫做回归直线.13.13.回归直线回归直线12.12.散点图散点图 在平面直角坐标系中,表示具有相关关系的两在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图个变量的一组数据图形,称为散点图.14.14.回归方程回归方程巩固练习巩固练习 1.1.为了了解某地参加计算机水平测试的为了了解某地参加计算机水平测试的50005000名名学生的成绩学生的成绩,从中抽取了从中抽取了200200名学生的成绩进行统计名学生的成绩进行统计分析,在这个问题中,分析,在这个问题中,50005000名学生成绩的全体是名学生成绩的全体是()A.A.总体总体 B.B.个体个体 C.C.从总体中抽取的一个样本从总体中抽取的一个样本 D.D.样本的容量样本的容量A A 2.一个总体中共有一个总体中共有10个个体,用简单随个个体,用简单随机抽样的方法从中抽取一容量为机抽样的方法从中抽取一容量为3的样本,则的样本,则某特定个体被抽到的概率是某特定个体被抽到的概率是()3/10 3.要从已编号(要从已编号(160)的)的60枚最新研制枚最新研制的导弹中随机抽取的导弹中随机抽取6枚来进行发射试验枚来进行发射试验,用每部用每部分选取的号码间隔一样的系统抽样方法所确定的分选取的号码间隔一样的系统抽样方法所确定的编号可能是编号可能是()A5,10,15,20,25,30 B3,13,23,33,43,53 C1,2,3,4,5,6 D2,8,14,20,26,32B 4.在一次有奖明信片的在一次有奖明信片的100 000个有机会个有机会中奖的号码中奖的号码(编号编号0000099999)中,邮政部门中,邮政部门按照随机抽取的方式确定后两位是按照随机抽取的方式确定后两位是23的作为中的作为中奖号码,这是运用了奖号码,这是运用了_抽样方法抽样方法.系系统统 5.从从800袋牛奶中抽取袋牛奶中抽取60袋进行检验,利用随机数袋进行检验,利用随机数表抽样本时,先将表抽样本时,先将800袋牛奶按袋牛奶按000,001,799进进行编号,如果从随机数表行编号,如果从随机数表第第8行第行第18列列的数开始向右读,的数开始向右读,请你依次写出最先检测的请你依次写出最先检测的5袋牛奶的编号(下面摘取了袋牛奶的编号(下面摘取了一随机数表的第一随机数表的第7行至第行至第9行)行)84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 62 58 7973 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 06 13 42 99 66 02 79 54 解解 719,050,717,512,358,6.如果一组数中每个数减去同一个非零常数,则这一组数的()A平均数不变,方差不变 B平均数改变,方差改变 C平均数不变,方差改变 D平均数改变,方差不变D 7.已知数据已知数据x1、x2、x3的中位数的中位数为k,众数众数为m,平均数平均数为n,方差方差为p,则下列下列说法中法中,错误的是的是()A.数据数据2x1、2x2、2x3的中位数的中位数为2k B.数据数据2x1、2x2、2x3的众数的众数为2m C.数据数据2x1、2x2、2x3的平均数的平均数为2n D.数据数据2x1、2x2、2x3的方差的方差为2p解析解析:2x1、2x2、2x3的方差的方差应为4p,选项D错.D 8.现实生活中存在许多相关关系,现实生活中存在许多相关关系,在下列两在下列两个变量的关系中,哪些是相关关系?个变量的关系中,哪些是相关关系?正方形边长与面积之间的关系;正方形边长与面积之间的关系;作文水平与课外阅读量之间的关系;作文水平与课外阅读量之间的关系;人的身高与体重之间的关系;人的身高与体重之间的关系;人的身高与视力之间的关系;人的身高与视力之间的关系;商品销售收入与广告支出经费之间的关系;商品销售收入与广告支出经费之间的关系;粮食产量与施肥量之间的关系;粮食产量与施肥量之间的关系;匀速行驶的车辆的行驶距离与时间匀速行驶的车辆的行驶距离与时间.9.9.某商场为了调查旅游鞋的销售情况,抽取了部分某商场为了调查旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得数据整理后,画出频率分布直顾客购鞋的尺寸,将所得数据整理后,画出频率分布直方图如下:已知图中从左到右前方图如下:已知图中从左到右前 3 3个小矩形的面积之比个小矩形的面积之比为为1 12 23 3,第二小组的频数为,第二小组的频数为101035.5 37.5 39.5 41.5 43.5 45.5 35.5 37.5 39.5 41.5 43.5 45.5 尺寸尺寸频率频率组距组距0.03750.03750.08750.0875 (1 1)求出第二个小矩形的面积)求出第二个小矩形的面积;(2 2)求样本容量的值)求样本容量的值.解解 (1)前三个面积之和为前三个面积之和为 1-2(0.0875+0.0375)=0.75第二个小矩形的面积为第二个小矩形的面积为0.75(26)=0.25(2)样本容量为样本容量为100.25=40 10.10.对某种新品电子元件进行寿命终极度实验,实对某种新品电子元件进行寿命终极度实验,实 验数据如下:验数据如下:试估计总体寿命的众数、中位数、平均数试估计总体寿命的众数、中位数、平均数.30304040808030302020个个 数数500500600600400400500500300300400400200200300300100100200200寿命寿命(h)(h)解解 众数为众数为 (300+400)/2=350(h)中位为中位为 300+100(5080)=362.5(h)平均数为平均数为 1500.1+2500.15+3500.4 +4500.2+5500.15=365(h)x x3 34 45 56 67 78 89 9y y6666696973738181898990909191 11.某个体服装店经营各种服装某个体服装店经营各种服装,在某周内获纯利润在某周内获纯利润y(元元)与该周每天销售这种服装件数与该周每天销售这种服装件数x之间的一组数据之间的一组数据关系如下表关系如下表:(1)画出散点图画出散点图;(2)观察散点图观察散点图,若若y与与x线性相关线性相关,试求出试求出y与与x之之间的回归直线方程间的回归直线方程.解解 (1)散点图如图散点图如图: