第14章 章末复习课.docx
章末复习课理清脉络纲举目张N突破重点抓住核心知识网络考点突破一、抽样方法的选取及应用1 .抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量 较大,样本容量较小时,可采用随机数表法;当总体中个体差异较显著时,可采用分层抽样.2 .掌握抽样方法,提升数据分析素养.例1 (1)假设要考察某公司生产的500克袋装牛奶的三聚氧胺是否超标,现从800袋牛奶中 抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,799进行 编号,如果从随机数表第7行第8列的数开始向右读,那么得到的第4个样本个体的编号是F面摘取了随机数表第7行至第984 42 17 53 3121 76 33 50 2563 01 63 78 5912 86 73 58 0733 21 12 34 2915 51 00 13 42 答案06857 24 55 06 8883 92 12 06 7616 95 55 67 1944 39 52 38 7978 64 56 07 8299 66 02 79 5477 04 74 47 6798 10 5071 7552 42 07 44 38并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了 100 位学生,其中阅读过西游记或红楼梦的学生共有90位,阅读过红楼梦的学生共 有80位,阅读过西游记且阅读过红楼梦的学生共有60位,那么该校阅读过西游记 的学生人数与该校学生总数比值的估计值为()A. 0.5 B. 0.6 C. 0.7 D. 0.8答案C解析 根据题意阅读过红楼梦西游记的人数用Venn图表示如下:所以该校阅读过西游记的学生人数与该校学生总数比值的估计值为而=074 .(2020全国HI)设一组样本数据羽,出 ,x的方差为0.01,那么数据10xi,10x2,,10x 的方差为()A. 0.01 B. 0.1 C. 1 D. 10答案C解析 10xi,10x2,,10x的方差为 102X0.01 = 1.5 . (2020江苏)一组数据4,2d3。,5,6的平均数为4,那么a的值是.答案2解析 由题意,得 4+2+(3。)+5+6=4* 5 = 20,所以a = 2.解析 由随机数表可以看出前4个样本的个体的编号是331,572,455,068.于是第4个样本个体 的编号是068.(2)一个单位有职工800人,其中具有高级职称的有160人,具有中级职称的有320人,具有 初级职称的有200人,其他人员有120人.为了解职工收入情况,决定采用分层抽样的方法, 从中抽取容量为40的样本.那么从上述各层中依次抽取的人数分别是()A. 12,24,15,9B. 9,12,12,7C. 8,15,12,5D. 8,16,10,6答案D解析 由题意知,各种职称的人数比为160 : 320 : 200 : 120=4 : 8 : 5 : 3,所以抽取的具有 高、中、初级职称的人数和其他人员的人数分别为40义4=8,40义叫=16,40></=10,40乂京=6.反思感悟(1)随机数法的步骤.对总体中的个体编号(每个号码位数一致);在随机数表中任选一个数;从选定的数开始按一定的方向读下去,假设得到的号码在编号中,那么取出;假设得到的号码不 在编号中或前面已经取出,那么跳过,如此继续下去,直到取满为止;根据选定的号码抽取样本.(2)分层抽样的特点是“按比例分配”,即每层祟:吃J数=' ,该层的个体数尽体谷重跟踪训练1 (1)以下抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号 码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否 合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革 的意见D.用抽签法从10件产品中选取3件进行质量检验答案D解析 选项A, B不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C不是简单 随机抽样,因为总体的个体有明显的层次;选项D是简单随机抽样.某校为了了解学生学习的情况,采用分层抽样的方法从高一 1 000人,高二1 200人,高三人中抽取81人进行问卷调查,高二被抽取的人数为30,那么等于()B. 720A. 860C. 1 020C. 1 020D. 1 040答案D解析 分层抽样是按比例抽样的,所以 81 义ooo+i 200+=3°,解得 =1 040-二、用样本的取值规律估计总体的取值规律1 .根据样本容量的大小,我们可以选择利用样本的频率分布表、频率直方图对总体情况作出 估计.2 .掌握频率直方图的绘制及应用,提升数据分析和数学运算素养.例2为了解高一年级学生的智力水平,某校按1 : 10的比例对700名高一学生按性别分别 进行“智力评分”抽样检查,测得“智力评分”的频数分布表如表1、表2.表1:男生“智力评分”频数分布表智力评分(分)160,165)165J70)170,175)频数2514智力评分(分)175,180)180,185)185,190频数1342表2:女生“智力评分”频数分布表智力评分(分)150,155)155,160)160,165)频数1712智力评分(分)165,170)170,175)175J80频数631(1)求高一年级的男生人数,并完成下面男生“智力评分”的频率直方图;频率 丽 ().0711t11110.06-; :- ;- )0.0511t11110.04-;j;才0.03!4!10.02-J1LJJ10.011-4-I!)°花行0廿5血)-5 16().力评分/分估计该校高一年级学生“智力评分”在口65175)内的人数.解(1)样本中男生人数是40,由抽样比例是1 : 10可得高一年级男生人数是400, 男生“智力评分”的频率直方图如下图.1频率频率I1i1%。向市)向 %)看力评分/分(2)样本中“智力评分”在165,175)内的频数为28,所以估计该校高一年级学生“智力评分” 在165,175)内的学生人数为28X 10 = 280.反思感悟(1)绘制频率直方图时需注意的两点制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.频率直方图的纵坐标是频率 组距而不是频率.(2)与频率直方图计算有关的两个关系式频率X组距=频率.组。巳频数样本容量=频率'此关系式的变形为频数样本容量=频率'此关系式的变形为频数频率=样本容量,样本容量X频率=频数.跟踪训练2某电子商务公司对10 000名网络购物者2021年度的消费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率直方图如下图.(1)直方图中的。=;(2)在这些购物者中,消费金额在区间0.5。9内的购物者的人数为答案(1)3 (2)6 000解析 (1)由 0.1 X 1.5 + 0.1 X2.5 + 0.U+0.1 X2.0 + 0.1 X0.8 + 0.1 xo.2= 1,解得 a=3.(2)消费金额在区间0.3,0.5)内的频率为0.1 X 1.5 + 0.1X2.5 = 0.4,故在0.5。9内的频率为1一0.4 = 06因此,消费金额在区间0.5,0.9内的购物者的人数为0.6X10000=6000.三、样本的百分位数. 一般地,一组数据的人百分位数是这样一个值小,它使得这组数据中至少有核的数据小 于或等于Pk,且至少有(100%)%的数据大于或等于外可以用样本数据的百分位数估计总体 的百分位数.1 .掌握百分位数的计算及应用,重点提升数据分析与数学运算的核心素养.例3欧洲联盟委员会和荷兰环境评估署公布了 2013年全球主要20个国家和地区的二氧化碳排放总量及人均二氧化碳排放量,结果如下表:国家和地区排放总量/千吨人均排放量/吨国家和地区排放总量/千吨人均排放量/吨中国10 330 0007.4沙特阿拉伯490 00016.6美国5 300 00016.6巴西480 0002.0欧盟3 740 0007.3英国480 0007.5印度2 070 0001.7墨西哥470 0003.9俄罗斯1 800 00012.6伊朗410 0005.3日本1 360 00010.7澳大利亚390 00016.9德国840 00010.2意大利390 0006.4韩国630 00012.7法国370 0005.7加拿大550 00015.7南非330 0006.2印度尼西亚510 0002.6波兰320 0008.5那么这些国家和地区人均二氧化碳排放量的四分位数是多少.解 把这20个国家和地区的人均二氧化碳排放量按从小到大的顺序排列.1. 7,2.0,2.6,3.9,5.3,5.7,6.2,6.4,7.3,7.4,7.5,8.5,10.2,10.7,12.6,12.7/5.7,16.6/6.616.9.20202025 X-=5,50 X= 10,75 义面=15,5 3 + 5 7所以这20个数的25百分位数为. ) . =557 4+7 550百分位数为一V=7.45.一八八业乙、工12.6+12.775百分位数为5=12.65.所以这20个国家和地区的人均二氧化碳排放量的四分位数为25百分位数50百分位数75百分位数5.5吨7.45 吨12.65 吨反思感悟 计算一组n个数据的k百分位数的一般步骤第1步将所有数值按从小到大的顺序排列;第2步计算攵忐;Yl第3步 如果结果为整数,那么左百分位数位于第上面位和下一位数之间,通常取这两个位 置上数值的平均数为k百分位数;第4步 如果左而不是整数,那么将其向上取整(即其整数局部加上1),在该位置上的数值 即为上百分位数.跟踪训练3某产品售后服务中心随机选取了 10个工作日,分别记录了每个工作日接到的客 户服务 的数量(单位:次):63 38 25 42 56 48 53 39 28 47那么上述数据的50百分位数为.答案44.5解析 把这组数据从小到大排序:25,28,38,39,42,47,48,53,56,63,50X=5,42+47所以50百分位数为1=445四'用样本的集中趋势、离散程度估计总体.为了从整体上更好地把握总体规律,我们还可以通过样本数据的众数、中位数、平均数估 计总体的集中趋势,通过样本数据的方差或标准差估计总体的离散程度.1 .掌握样本数据的众数、中位数、平均数及方差的计算方法,提升数据分析和数学运算素养.例4某工厂36名工人的年龄数据如下表:工人编号年龄工人编r年龄工人编号年龄工人编勺年龄014010361927283402441131204329390340123821413043044113392237313805331443232432420640154524423353074516392537343708421738264435490943183627423639利用简单随机抽样法抽取容量为9的样本,其年龄数据为44,40,36,43,36,37,44,43,37.(1)计算样本的平均数三和方差H(2)36名工人中年龄在三一s与三+s之间有多少人?所占的百分比是多少?(精确到0.01%) 44+40+ 37解(1)由平均数公式知,x =3=40,y由方差公式知,?=1x (4440)2+(4040)2 + + (3740)2=粤.9_100_10(2)因为 s-9 , s,所以36名工人中年龄在三s和三+s之间的人数等于年龄在区间37,43上的人数,即 40,40,41,,39,共 23 人.23所以36名工人中年龄在x s和x +s之间的人数所占的百分比为云X100%p63.89%.反思感悟 通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准 差),呈现样本数据的集中趋势及波动大小,从而实现对总体的估计.(1)一般情况下,需要将平均数和标准差结合,得到更多样本数据的信息,从而对总体作出较 好的估计.因为平均数容易掩盖一些极端情况,使我们对总体作出片面的判断,而标准差较 好地防止了极端情况.(2)假设两组数据的平均数差异很大,也可以只比拟平均数,估计总体的平均水平,从而作出判断. 跟踪训练4某汽车租赁公司为了调查/型汽车与8型汽车的出租情况,现随机抽取这两种 车各50辆,分别统计每辆车在某个星期内的出租天数,统计数据如下表:A型汽车出租天数34567车辆数330575B型汽车出租天数34567车辆数101015105试根据上面的统计数据,判断这两种车在某个星期内的出租天数的方差的大小关系(只需写 出结果);(2)如果4型汽车与3型汽车每辆车每天出租获得的利润相同,该公司需要购买一辆汽车,请 你根据所学的统计知识,给出建议应该购买哪一种车,并说明你的理由.解(1)由数据的离散程度,可以看出5型汽车在某个星期内出租天数的方差较大.(2)50辆4型汽车出租天数的平均数为3X3+4X30 + 5X5 + 6X7+7X550=4.62,50辆B型汽车出租天数的平均数为 4.8,3X10+4X10 + 5X15 + 6X10+7X5答案一:一辆/型汽车在某个星期内出租天数的平均值为4.62, 8型汽车在某个星期内出租天数的平均值为4.8,选择3型汽车出租的利润较大,应该购买3型汽车.答案二:一辆4型汽车在某个星期内出租天数的平均值为4.62, 8型汽车在某个星期内出租天数的平均值为4.8,而8型汽车出租天数的方差较大,所以应该购买/型汽车.实战高考超越创新真题体验.(多项选择X2021 新高考全国I)有一组样本数据修,也,心,由这组数据得到新样本数据 ,32,其中=x1+c(i=l,2,,),c为非零常数,那么()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同答案CD解析 设样本数据xi, %2,,x 的平均数、中位数、标准差、极差分别为三,m,。,t,依题意得,新样本数据yi, >2,,为的平均数、中位数、标准差、极差分别x +c, m+c, o, t,因为cWO,所以C, D正确.1 .(2020天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组: 5.31,5.33), 5.33, 5.35),5.45,5.47), 5.47,5.49,并整理得到如下频率直方图,那么在被抽取的零件中,直径落在区间5.43,5.47内的个数为()频率组距10.008.757.5()6.255.003.752.50直径/mm直径/mm1.2505.31 5.33 5.35 5.37 5.39 5.41 5.43 5.45 5.47 5.49A. 10 B. 18C. 20 D. 36答案B解析 因为直径落在区间5.43,5.47内的频率为0. 02X(6.25 + 5.00) = 0.225, 所以个数为0.225X80=18.2 .(2019全国HI)西游记三国演义水浒传和红楼梦是中国古典文学瑰宝,