2022届高三数学一轮复习(原卷版)第1讲 随机抽样、用样本估计总体.doc
《2022届高三数学一轮复习(原卷版)第1讲 随机抽样、用样本估计总体.doc》由会员分享,可在线阅读,更多相关《2022届高三数学一轮复习(原卷版)第1讲 随机抽样、用样本估计总体.doc(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第 1 讲 随机抽样、用样本估计总体 一、知识梳理 1随机抽样 (1)简单随机抽样 定义:一般地,设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本(nN),且每次抽取时总体内的各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样 常用方法:抽签法和随机数法 (2)分层抽样 定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样 适用范围:适用于总体由差异比较明显的几个部分组成时 2统计图表 (1)频率分布直方图的画法步骤 求极差(即一组数据中最大值与最小值的差); 决
2、定组距与组数; 将数据分组; 列频率分布表; 画频率分布直方图 (2)频率分布折线图和总体密度曲线 频率分布折线图: 连接频率分布直方图中各小长方形上端的中点, 就得到频率分布折线图; 总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线 3样本的数字特征 (1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数 (2)中位数:把 n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数 据的平均数)叫做这组数据的中位数 (3)平均数:把a1a2ann称为 a1,a2,an这 n 个数的
3、平均数 (4)标准差与方差:设一组数据 x1,x2,x3,xn的平均数为 x,则这组数据的标准差和方差分别是 s 1n(x1 x)2(x2 x)2(xn x)2, s21n(x1 x)2(x2 x)2(xn x)2 常用结论 1不论哪种抽样方法,总体中的每一个个体入样的概率是相同的 2会用三个关系 频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数 (2)中位数左边和右边的小长方形的面积和是相等的 (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和 3巧用四个有关的结论 (1)若 x1,x2,xn
4、的平均数为 x,那么 mx1a,mx2a,mxna 的平均数为 m xa; (2)数据 x1,x2,xn与数据 x1x1a,x2x2a,xnxna 的方差相等,即数据经过平移后方差不变; (3)若 x1,x2,xn的方差为 s2,那么 ax1b,ax2b,axnb 的方差为 a2s2; (4)s21nni1 (xi x)21nni1x2i x2,即各数平方的平均数减去平均数的平方 二、教材衍化 1某校为了解学生学习的情况,采用分层抽样的方法从高一 2 400 人、高二 2 000 人、高三 n 人中,抽取 90 人进行问卷调查已知高一被抽取的人数为 36,那么高三被抽取的人数为_ 解析:由分层
5、抽样可得2 4002 4002 000n9036,则 n1 600,所以高三被抽取的人数为1 6002 4002 0001 6009024. 答案:24 2已知一组数据 6,7,8,8,9,10,则该组数据的方差是_ 答案:53 3 某仪器厂从新生产的一批零件中随机抽取 40 个检测, 如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分 8 组,分别为80,82),82,84),84,86),86,88),88,90),90,92),92,94),94,96,则样本的中位数在第_组 解析:由题图可得,前四组的频率为(0.037 50.062 50.0750.1)20.5
6、5,则其频数为 400.5522,且第四组的频数为 400.128,故中位数落在第 4 组 答案:4 一、思考辨析 判断正误(正确的打“”,错误的打“”) (1)简单随机抽样是一种不放回抽样( ) (2)在抽签法中,先抽的人抽中的可能性大( ) (3)一组数据的方差越大,说明这组数据的波动越大( ) (4)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大( ) (5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观( ) (6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值( ) 答案:(1) (2) (3) (4) (5)
7、(6) 二、易错纠偏 常见误区| (1)随机数表法的规则不熟出错; (2)频率分布直方图识图不清; 1假设要考察某公司生产的狂犬疫苗的剂量是否达标,现用随机数法从 500 支疫苗中抽取 50 支进行检验,利用随机数表抽取样本时,先将 500 支疫苗按 000,001,499 进行编号,若从随机数表第 7 行第 8 列的数开始向右读,则抽取的第 3 支疫苗的编号为 _(下面摘取了随机数表的第 7 行至第 9 行) 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16
8、 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 解析:由题意得,从随机数表第 7 行第 8 列的数开始向右读,符合条件的前三个编号依次是 331,455,068,故抽取的第 3 支疫苗的编号是 068. 答案:068 2我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为20,40),40,60),60,80),80,100,若低于 60 分的人数是 15,则
9、该班的学生人数是_ 解析:依题意得,成绩低于 60 分的相应的频率等于(0.0050.01)200.3,所以该班的学生人数是 15 0.350. 答案:50 考点一 随机抽样(基础型) 复习指导| 1.理解随机抽样的必要性和重要性 2学会用简单随机抽样的方法从总体中抽取样本 3通过对实例的分析,了解分层抽样的方法 核心素养:数据分析 1(2020 重庆中山外国语学校模拟)如饼图,某学校共有教师 120 人,从中选出一个 30人的样本,其中被选出的青年女教师的人数为( ) A12 B6 C4 D3 解析:选 D青年教师的人数为 12030%36, 所以青年女教师为 12 人,故青年女教师被选出的
10、人数为 12301203.故选 D 2 (2020 武汉市武昌区调研考试)已知某射击运动员每次射击击中目标的概率都为 80%.现采用随机模拟的方法估计该运动员 4 次射击至少 3 次击中目标的概率: 先由计算器产生 0到 9 之间取整数值的随机数,指定 0,1 表示没有击中目标,2,3,4,5,6,7,8,9 表示击中目标;再以每 4 个随机数为一组,代表 4 次射击的结果经随机模拟产生了如下 20 组随机数: 7527 0293 7140 9857 0347 4373 8636 6947 1417 4698 0371 6233 2616 8045 6011 3661 9597 7424 76
11、10 4281 据此估计,该射击运动员 4 次射击至少 3 次击中目标的概率为_ 解析:4 次射击中有 1 次或 2 次击中目标的有:0371,6011,7610,1417,7140,所以所求概率 P152015200.75. 答案:0.75 3一支田径队有男运动员 56 人,女运动员 m 人,用分层抽样抽出一个容量为 n 的样本,在这个样本中随机取一个当队长的概率为128,且样本中的男队员比女队员多 4 人,则 m_ 解析:由题意知 n28,设其中有男队员 x 人,女队员有 y 人 则xy28,xy4,56mxy.解得 x16,y12,m42. 答案:42 (1)抽签法与随机数法的适用情况
12、抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况 一个抽样试验能否用抽签法,关键看两点: 一是制签是否方便;二是号签是否易搅匀一般地,当总体容量和样本容量都较小时可用抽签法 (2)分层抽样问题类型及解题思路 求某层应抽个体数量,根据该层所占总体的比例计算 已知某层个体数量,求总体容量,根据分层抽样即按比例抽样,列比例式进行计算 确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况 考点二 样本的数字特征(应用型) 复习指导| 1.通过实例理解样本数据的标准差的意义和作用,学会计算数据的标准差 2能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(
13、如平均数、标准差),并作出合理的解释 核心素养:数据分析、数学运算 (1)在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93.去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为( ) A92,2.8 B92,2 C93,2 D93,2.8 (2)(2020 盐城模拟)已知一组数据 x1,x2,x3,x4,x5的方差是 2,则数据 2x1,2x2,2x3,2x4,2x5的标准差为_ 【解析】 (1)由题意得所剩数据:90,90,93,94,93. 所以平均数 x9090939493592. 方差 s215(9092)2(9092)2(9392)2(
14、9392)2(9492)22.8. (2)由 s21ni1n (xi x)22,则数据 2x1,2x2,2x3,2x4,2x5的方差是 8,标准差为 2 2. 【答案】 (1)A (2)2 2 【迁移探究】 (变条件)本例(2)增加条件“x1,x2,x3,x4,x5的平均数为 2”,求数据2x13,2x23,2x33,2x43,2x53 的平均数和方差 解:数据 2x13,2x23,2x33,2x43,2x53 的平均数为 2237,方差为 2228. 众数、中位数、平均数、方差的意义及常用结论 (1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义
15、,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小 (2)方差的简化计算公式:s21n(x21x22x2n)n x2,或写成 s21n(x21x22x2n) x2,即方差等于原数据平方的平均数减去平均数的平方 1(2020 昆明市诊断测试)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了 n 座城市作试验基地这 n 座城市共享单车的使用量(单位:人次/天)分别为 x1,x2,xn,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是( ) Ax1,x2,xn的平均数 Bx1,x2,xn的标准差 Cx1,x2,xn的最大值 Dx1,x2,x
16、n的中位数 解析:选 B平均数、中位数可以反映一组数据的集中程度;方差、标准差可以反映一组数据的波动大小,同时也反映这组数据的稳定程度故选 B 2(2020 甘肃、青海、宁夏联考)从某小学随机抽取 100 名同学,将他们的身高(单位:厘米)分布情况汇总如下: 身高 (100,110 (110,120 (120,130 (130,140 (140,150 频数 5 35 30 20 10 由此表估计这 100 名小学生身高的中位数为(结果保留 4 位有效数字)( ) A119.3 B119.7 C123.3 D126.7 解析:选 C由题意知身高在(100,110,(110,120,(120,1
17、30内的频率依次为 0.05,0.35, 0.3, 前两组频率和为0.4, 组距为 10, 设中位数为x, 则(x120)0.3100.1, 解得x123.3.故选 C 3一组数据 1,10,5,2,x,2,且 2x5,若该数据的众数是中位数的23倍,则该数据的方差为_ 解析:根据题意知,该组数据的众数是 2,则中位数是 2233,把这组数据从小到大排列为 1,2,2,x,5,10, 则2x23,解得 x4,所以这组数据的平均数为 x16(1224510)4, 方差为 s216(14)2(24)22(44)2(54)2(104)29. 答案:9 考点三 频率分布直方图(应用型) 复习指导| 1
18、.通过实例体会分布的意义和作用, 在表示样本数据的过程中, 学会列频率分布表、画频率分布直方图、频率折线图,体会它们各自的特点 2会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性 核心素养:直观想象、数据分析 角度一 求样本的频率、频数 (2020 福建五校第二次联考)某服装店对过去 100 天其实体店和网店的销售量(单 位:件)进行了统计,制成频率分布直方图如下: (1)若将上述频率视为概率,已知该服装店过去 100 天的销售中,实体店和网店销售量都不低于 50 的概率为 0.24,求过去 100 天的销售中,实体店和网店至
19、少有一边销售量不低于 50 的天数; (2)若将上述频率视为概率,已知该服装店实体店每天的人工成本为 500 元,门市成本为 1 200 元,每售出一件利润为 50 元,求该实体店一天获利不低于 800 元的概率 【解】 (1)由题意知, 网店销售量不低于 50 共有(0.0680.0460.0100.008)510066(天),实体店销售量不低于 50 共有(0.0320.0200.0122)510038(天),实体店和网店销售量都不低于 50 的天数为 1000.2424, 故实体店和网店至少有一边销售量不低于 50 的天数为 66382480. (2)由题意,设该实体店一天售出 x 件,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 届高三 数学 一轮 复习 原卷版 随机 抽样 样本 估计 总体
限制150内