统计与概率——2023届高考数学一轮复习学案.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《统计与概率——2023届高考数学一轮复习学案.pdf》由会员分享,可在线阅读,更多相关《统计与概率——2023届高考数学一轮复习学案.pdf(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023 届高考数学一轮复习统计与概率第 1 页 共 64 页统计与概率【知识点讲解】一、随机抽样1.样本、样本量我们把从总体中抽取的那部分个体称为样本, 样本中包含的个体数称为样本容量, 简称样本量。 调查样本获得的变量值称为样本的观测数据, 简称样本数据。例 1下列调查中,调查方式选择合理的是()A了解某市高一年级学生的身高情况,选择普查B了解长征运载火箭的设备零件质量情况,选择抽样调查C了解一批待售袋装牛奶的细菌数是否达标,选择普查D了解病人血液中血脂的含量,选择抽样调查【答案】D【详解】AC 的总量太大,不适合普查,AC 不正确;火箭的设备零件质量情况应该选择普查,B 不正确;病人血液
2、中血脂的含量应选择抽样调查,D 正确.2.简单随机抽样(1)定义一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1nN)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的, 且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样 放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样(2)常用方法:抽签法、随机数法。例 2对 50 件样品进行编号 01,02,50,在如下随机数表中,指定从 2 行第 3 组第一个数开始,从左往右抽取两个数字,抽
3、取 5 个编号,则抽到的第 3个编号是()2023 届高考数学一轮复习统计与概率第 2 页 共 64 页486285008938155698822776173903536660891248395326163490563640006207961329901923643865964526A48B24C26D49【答案】C【详解】按随机数表法,从随机数表从 2 行第 3 组第一个数开始,从左往右抽取两个数字,则编号依次为 48,39,26,16,34,则抽到的第 3 个编号是 26,故选:C3.分层随机抽样(1)定义一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在
4、每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层。在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配。(2)总体平均数比例分配的分层随机抽样中,总体平均数=+=+= 。例 3某区域大型城市中型城市小型城市的数量之比为2:1m,为了解该区域城市的空气质量情况,现用比例分配的分层抽样方法抽取一个容量为n的样本.在样本中,中型城市比大型城市多 4 个,比小型城市多 8 个,则n ()A24B28C32D36【答案】A【详解】根据分成抽样等比例关系可设抽取的大中小型城市的数量分别为
5、2 ,x mx x,则248mxxmxx,解得43xm,所以224nxmxx.2023 届高考数学一轮复习统计与概率第 3 页 共 64 页二、常用统计图表1.频率分布直方图(1)画法第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表。(2)特点纵轴表示频率组距,即小长方形的高频率组距;小长方形的面积组距频率组距频率;各小长方形的面积的总和等于 1例 4某品牌家电公司从其全部 200 名销售员工中随机抽出 50 名调查销售情况,销售额都在区间5,25(单位: 百万元) 内, 将其分成
6、5 组:5,9,9,13,13,17,17,21,21,25, 并整理得到如下的频率分布直方图, 下列说法正确的是 ()A频率分布直方图中 a 的值为 0.07B估计全部销售员工销售额的众数与中位数均为 15C估计全部销售员工中销售额在 17 百万元以上的有 12 人D估计全部销售员工销售额的第 20 百分位数约为 10.5【答案】D【详解】由频率分布直方图可知4 (0.020.090.030.03)1a,解得0.08a ,所以 A 错误,由频率分布直方图可知众数为 15,2023 届高考数学一轮复习统计与概率第 4 页 共 64 页因为前 2 组的频率和为4 0.024 0.080.40.5
7、 ,前 3 组的频率和为4 0.024 0.084 0.090.760.5 ,所以中位数在第 3 组,设中位数为x,则0.40.09(13)0.5x,解得14.1x ,所以 B 错误,由频率分布直方图可知销售额在 17 百万元以上的频率为4 (0.030.03)0.24,所以全部销售员工中销售额在 17 百万元以上的约有0.24 20048人,所以 C 错误,因为第 1 组的频率为0.08, 前 2 组的频率和为0.4, 所以第 20 百分位数在第 2 组,设第 20 百分位数为y,则4 0.020.08(9)0.2y,解得10.5y ,所以全部销售员工销售额的第 20 百分位数约为 10.5
8、,所以 D 正确,2条形图建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量, 根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图;3.折线图建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量, 根据样本值和数量的多少描出相应各点, 然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图;例 5如图是民航部门统计的 2021 年春运期间 12 个城市售出的往返机票的平均价格以及相
9、比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是()2023 届高考数学一轮复习统计与概率第 5 页 共 64 页A深圳的变化幅度最小,北京的平均价格最高B天津和重庆的春运期间往返机票价格同去年相比有所上升C平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门D平均价格从高到低居于前三位的城市为北京、深圳、广州【答案】C【详解】从折线图看,深圳的涨幅最接近0%,从条形图看,北京的平均价格最高,故 A 正确;从折线图看,天津和重庆的的涨幅均为正值,故 B 正确;从折线图看,平均价格的涨幅从高到低居于前三位的城市为天津、西安、南京,故 C 错误;从条形图看,平均价格从高到低居于前
10、三位的城市为北京、深圳、广州,故 D 正确.4.扇形图用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小, 这样的一种表示和分析数据的统计图称为扇形图例 6南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔(FlorenceNightingale 1820-1910)设计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小某机构统计了近几年中国知识付费用户数量(单位:亿人次),并绘制成南丁格尔玫瑰图如下,根据此图,下列说法错误的是()2023 届高考数学一轮复习统计与概率第 6 页 共 64 页A2015 年至 2022 年,知识付费
11、用户数量逐年增加B2016 年至 2022 年,知识付费用户数量逐年增加量 2018 年最多C2022 年知识付费用户数量超过 2015 年知识付费用户数量的 10 倍D2016 年至 2022 年,知识付费用户数量的逐年增加量逐年递增【答案】D【详解】对于 A,由图可知,2015 年至 2022 年,知识付费用户数量逐年增加,故 A 正确;对于 BD,知识付费用户数量的逐年增加量分别为:2016 年,0.960.480.48;2017 年,1.880.960.92;2018 年,2.95 1.881.07;2019 年,3.562.950.61;2020 年,4.153.560.59; 20
12、21 年,4.774.150.62;2022 年,5.274.770.5,可知知识付费用户数量逐年增加量 2018 年最多,故 B 正确,D 错误;对于 C,由5.270.48 10,即 2022 年知识付费用户数量超过 2015 年知识付费用户数量的 10 倍,故 C 正确;三、用样本的数字特征估计总体1.百分位数(1)一般地,一组数据的第 百分位数是这样一个值,它使得这组数据中至少有% 的数据小于或等于这个值,且至少有 100 % 的数据大于或等于这个值。例 7某校从参加高一年级期中考试的学生中随机抽取 10 名学生,统计他们的数学成绩如下:(满分:100 分)学生ABCDEFGHIJ成绩
13、(分)82816578687596908872由此可知,这 10 名学生期中考试数学成绩的75%分位数是()分.A81B82C85D88【答案】D【详解】10 名学生期中考试数学成绩由小到大排列为65,68,72,75,78,81,82,88,90,96,因为10 75%=7.5,故这 10 名学生期中考试数学成绩的75%分位数为 88,2023 届高考数学一轮复习统计与概率第 7 页 共 64 页(2)四分位数常用的分位数有第 25 百分位数,第 50 百分位数(即中位数),第 75 百分位数。 这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数。 其中第 25 百分位数也称
14、为第一四分位数或下四分位数,第 75 百分位数也称为第三四分位数或上四分位数。例 8按从小到大顺序排列的 9 个数据:10,16,25,33,39,43,m,65,70,若这组数据的第一四分位数与第三四分位数的和是 73,则 m 等于()A40B48C50D57【答案】B【详解】对于已知9个数据:1016 253339,43,65 70m, , , ,,9 25%2.25,第一四分位数为25,9 75%6.75,第三四分位数为m,2573m,解得48m .2.总体集中趋势的估计(1)中位数:将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数(2)
15、众数:一组数据中出现次数最多的数据叫做这组数据的众数(3)平均数:一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,xn的平均数x1n(x1x2xn)4.总体离散程度的估计(1)假设一组数据是1,2, ,用表示这组数据的平均数,则我们称1=1 2?为这组数据的方差。有时为了计算方差的方便, 我们还把方差写成1=12? 2的形式。我们对方差开平方,取它的算术平方根1=1 2?,称为这组数据的标准差。(2)方差和标准差反映了数据波动程度的大小。方差:2=1 1 2+ 2 2+ + 2 。2023 届高考数学一轮复习统计与概率第 8 页 共 64 页标准差: =1 1 2+ 2 2+ +
16、 2 。补充:若数据x1,x2,xn的平均数为x,则mx1a,mx2a,mx3a,mxna的平均数是mxa;若数据x1,x2,xn的方差为s2,则数据ax1b,ax2b,axnb的方差为a2s2四、变量的相关关系及回归模型1.变量的相关关系(1)定义:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系。(2)散点图每个编号下的成对样本数据都可用直角坐标系中的点表示出来, 由这些点组成了统计图。我们把这样的统计图叫做散点图。(3)正相关、负相关、线性相关如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果
17、当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关。一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关。一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关。2.样本相关系数(1)定义: =1?=12?=12?,我们称 为变量 和变量 的样本相关系数。当 0 时,称成对样本数据正相关。这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大。2023 届高考数学一轮复习统计与概率第 9 页 共 64 页当 0 , 我们称 | = 为
18、在事件 发生的条件下,事件 发生的条件概率,简称条件概率。(2)条件概率公式2023 届高考数学一轮复习统计与概率第 19 页 共 64 页 | = 。 | = , 表示事件 与 积事件的概率。(3)条件概率的性质0 | 1 , | = 1 。如果 和 是两个互斥事件,则 | = | + |。设和 互为对立事件,则 | = 1 |。概率的乘法公式:对任意两个事件 与 ,若 0 ,则 = |例 14一个箱子中有大小形状完全相同的 3 个黑球和 5 个白球,从中取出 2 个球,下列几个命题中正确的是()A若是不放回地抽取,则取出 2 个黑球和取出 2 个白球是对立事件B若是不放回地抽取,则第 2
19、次取出黑球的概率小于第 1 次取出黑球的概率C若是有放回地抽取,则取出 1 个黑球 1 个白球的概率为1532D若是有放回地抽取,则在至少取出 1 个白球的条件下,第 2 次取出白球的概率是811【答案】CD【详解】对于 A,不放回地抽取两个球,包括两个都是黑球、两个都是白球和一个黑球一个白球,共 3 种情况,所以取出两个黑球和取出两个白球不是对立事件,所以 A错误;对于 B,不放回地抽取,第 2 次取到黑球的概率为3253387878,第 1 次取得黑球的概率为38,所以第 2 次取到黑球的概率等于第 1 次取到黑球的概率,所以 B错误;对于 C, 有放回地抽取, 取出 1 个黑球 1 个白
20、球包括第 1 次为黑球第 2 次为白球、第 1 次为白球第 2 次为黑球,所以所求概率为533515888832,所以 C 正确,对于 D,有放回地抽取,至少取出一个白球的条件下,第 2 次取出白球包括第 12023 届高考数学一轮复习统计与概率第 20 页 共 64 页次黑球第2次白球、 第1次白球第2次白球, 所以所求概率为3555+88888=53355511+888888,4.全概率公式一般地, 设1, 2, ,是一组两两互斥的事件, 1 2 = ,且 0, = 1 ,2,则对任意的事件 ,有 =1? |。我们称其为全概率公式。八、离散型随机变量及其分布列1.随机变量(1)定义式:一般
21、地,对于随机试验样本空间 中的每个样本点 ,都有唯一的实数 与之对应,我们称 为随机变量。(2)性质:取值依赖于样本点;所有可能取值是明确的。(3)离散型随机变量变量可能取值为有限个或可以一一列举的随机变量, 我们称为离散型随机变量。通常用大写英文字母表示随机变量,例如 , , ;用小写英文字母表示随机变量的取值,例如 , , 。2.离散型随机变量的分布列(1)一般地,设离散型随机变量 的可能取值为1,2, ,我们称取每一个值的概率 = = , = 1 , 2 , , 为 的概率分布列,简称分布列。(2)表示方法:公式法;列表法;图形法。3.离散型随机变量的均值(1)随机变量的数字特征类似于研
22、究一组数据的均值和方差, 我们也可以研究离散型随机变量的均值和方差,它们统称为随机变量的数字特征。2023 届高考数学一轮复习统计与概率第 21 页 共 64 页(2)随机变量的均值(期望)称 = 11+ 22+ + =1?为随机变量 的均值或数学期望,数学期望简称期望。一般地,如果随机变量 服从两点分布(0 1 分布),那么 = 。(3)均值的性质设 的分布列为 = = , = 1 ,2 , , 。 + = + 。 = 。 + = + 。4.离散型随机变量的方差(1)方差、标准差 = 1 21+ 2 22+ + 2=1? 2为随机变量 的方差,有时也记为 ,并称 为随机变量 的标准差,记为
23、。公式: =12? 2。(2)方差的性质: + = 2 。例 15已知两组数据,第一组1x,2x,7x和第二组1y,2y,7y,8y,其中1,2,7iixy i,78117iiyx,第一组数据不全相同,则这两组数据相比,下列说法正确的是()A平均数一定相等B中位数一定相等C极差一定相等D第一组数据的方差大于第二组数据的方差【答案】ACD【详解】对于 A,因为1,2,7iixy i,所以7711iiiixy,所以77111177iiiixy,所以7117iixx,777871111117887iiiiiiiiyyxxyx,所以xy,所以 A 正确,2023 届高考数学一轮复习统计与概率第 22
24、页 共 64 页对于 B,因为第一组数的中位数为4x,第二组数的中位数为452yy,44xy,但4x不一定等于5y,所以两组数的中位数不一定相等,所以 B 错误,对于 C,由选项 A 的计算可知,8yy,所以第一组数据的最大值和最小值与第二组数据的最大值和最小值分别相等,所以两组数据有极差相等,所以 C 正确,对于 D,第一组数据的方差为222211271()()() 7Sxxxxxx,第二组数据的方差为22222212781()()()() 8Syyyyyyyy2221271()()() 8xxxxxx,所以2212SS,即第一组数据的方差大于第二组数据的方差,所以 D 正确九、二项分布、超
25、几何分布与正态分布1.二项分布(1) 重伯努利试验我们把只包含两个可能结果的试验叫做伯努利试验。我们将一个伯努利试验独立地重复进行 次所组成的随机试验称为 重伯努利试验。显然, 重伯努利试验具有如下共同特征:同一个伯努利试验重复做 次;各次试验的结果相互独立。(2)二项分布一般地,在 重伯努利试验中,设每次试验中事件 发生的概率为 0 0 为参数, 则称随机变量 服从正态分布, 记为 ,2。特别地,当 = 0 , = 1 时,称随机变量 服从标准正态分布。(2)正态曲线的特点曲线是单峰的,它关于直线 = 对称。曲线在 = 处达到峰值1 2。当 无限增大时,曲线无限接近 轴。(3)3 原则 +
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中数学精品资料 新高考数学精品专题 高考数学压轴冲刺 高中数学课件 高中数学学案 高一高二数学试卷 数学模拟试卷 高考数学解题指导
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内