高考解答题专项六 概率与统计.pptx
概率与统计高考解答题专项六考情分析从近五年的高考试题来看,对概率与统计的考查主要有四个方面:一是统计与统计案例,其中回归分析、相关系数的计算、独立性检验、用样本的数字特征估计总体的数字特征是考查重点,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查;二是统计与概率分布的综合,常与抽样方法、茎叶图、频率分布直方图、频率、概率以及函数知识、概率分布列等知识交汇考查;三是期望与方差的综合应用,常与离散型随机变量、概率、相互独立事件、二项分布等知识交汇考查;四是以生活中的实际问题为背景将正态分布与随机变量的期望和方差相结合综合考查.增素能精准突破考向1.用样本估计总体例1.(2021 全国乙,理17)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7新设备10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5解:(1)由题中数据可得,反思感悟用样本估计总体的方法:用样本估计总体实质上是用样本的数字特征估计总体的数字特征,包括众数、中位数、均值、标准差和方差.均值反映了样本和总体的平均水平,方差和标准差反映了样本和总体的波动程度.对点训练1某行业主管部门为了解本行业中小企业的生产情况,随机调查了100家企业,得到这些企业第一季度相对于去年第一季度产值增长率y的频数分布表.y 的分组-0.20,0)0,0.20)0.20,0.40)0.40,0.60)0.60,0.80)企业数2 24 53 14 7(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)解:(1)根据产值增长率频数分布表得,用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.考向2.相关关系的判断及回归分析例2.(2021 江苏南京二模)某公司对项目A进行生产投资,所获得的利润有如下统计数据表:项目A 投资金额x/百万元1 2 3 4 5所获利润y/百万元0.3 0.3 0.5 0.9 1(1)请用线性回归模型拟合y与x的关系,并用相关系数加以说明;(2)该公司计划用7百万元对A,B两个项目进行投资.若公司对项目B投资x(1x6)百万元所获得的利润y近似满足:y=0.16x-+0.49,求A,B两个项目投资金额分别为多少时,获得的总利润最大?(2)由题意,公司对项目B 投资x(1x6)百万元,则对项目A 投资(7-x)百万元,即x=2.5时等号成立,此时取到最大值为1.65百万元,而7-x=4.5(百万元).答:对A,B 两个项目投资金额分别为4.5百万元、2.5百万元时,获得的总利润最大,最大为1.65百万元.突破技巧提高运算准确性的方法:在求相关系数和回归方程的系数时,由于r 和b的公式组成比较复杂,求它们的值计算量比较大,为了计算准确,可将其分成几个部分分别计算,这样等同于分散难点,各个攻破,提高了计算的准确度.对点训练2(2020 全国,理18)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法.并说明理由.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.考向3.独立性检验与概率的综合例3.(2021 山东青岛二模)现对某市工薪阶层对于“楼市限购令”的态度进行调查,随机抽调了50人,他们月收入(单位:百元)的频数分布及对“楼市限购令”赞成人数如表:月收入25,35)35,45)45,55)55,65)65,75)75,85)频数5 10 15 10 5 5赞成人数4 8 12 5 2 1(1)根据以上统计数据完成下面的22列联表,并判断某市工薪阶层对于“楼市限购令”的态度与月收入以6 500元为分界点是否有关?态度月收入不低于65百元的人数月收入低于65百元的人数合计赞成 不赞成 合计(2)若对月收入在55,65)和65,75)的被调查人中各随机选取两人进行追踪调查,求在选中的4人中有人不赞成的条件下,赞成“楼市限购令”的人数的分布列及数学期望.P(2k)0.10 0.05 0.01k 2.706 3.841 6.635解:(1)22 列联表为 态度月收入不低于65百元的人数月收入低于65百元的人数合计赞成3 29 32不赞成7 11 18合计10 40 50所以有95%的把握认为某市工薪阶层对于“楼市限购令”的态度与月收入以6 500元为分界点有关.反思感悟对点训练3(2021江苏淮安二模)为了调查学生喜欢跑步是否与性别有关,某高中选取了200名学生进行了问卷调查,得到如下的22列联表性别 喜欢跑步 不喜欢跑步 合计男80 女 20 合计 已知在这200名学生中随机抽取1人抽到喜欢跑步的概率为0.6.(1)试问:喜欢跑步与性别有关吗?(2)从上述不喜欢跑步的学生中按性别用分层抽样的方法抽取8名学生,再在这8人中抽取3人调查其喜欢的运动,用X表示这3人中女生的人数,求X的分布列及数学期望.P(2k)0.10 0.05 0.01k 2.706 3.841 6.635解:(1)在这200名学生中随机抽取1人抽到喜欢跑步的概率为0.6,喜欢跑步的人数为2000.6=120,可得22 列联表如下.性别 喜欢跑步 不喜欢跑步 合计男80 60 140女40 20 60合计120 80 200因此没有充分的证据判定喜欢跑步与性别有关.(2)由题意,选取的8名学生中男生6人,女生2人,随机变量X 的取值为0,1,2.考向4.离散型随机变量的分布列、均值与方差例4.(2021 安徽合肥一模)某厂将一种坯件加工成工艺品需依次经过A,B,C为废品.(1)求一个坯件在加工过程中成为废品的概率;(2)已知坯件加工成本为A,B,C三道工序加工成本之和,求每个坯件加工成本的数学期望.反思感悟概率问题的解题步骤的规范写法使用简洁、准确的数学语言描述解答过程是解答这类问题并得分的根本保证.引进字母表示事件可使得事件的描述简单而准确,使得问题描述有条理,不会有遗漏,也不会重复.对点训练4(2021 山东淄博一模)某市会展公司计划在未来一周组织5天广场会展.若会展期间有风雨天气,则暂停该天会展,根据该市气象台预报得知,未来一周从周一到周五的5天时间内出现风雨天气情况的概率是:前3天(1)求未来一周从周一到周五5天中至少有一天暂停会展的概率;(2)求这次会展活动展出的平均天数.(结果保留整数)考向5.二项分布的均值与方差例5.(2021 广东广州一模)某中学举行趣味投篮比赛,比赛规则如下:每位选手各投5个球,每一个球可以选择在A区投篮也可以选择在B区投篮,在A区每投进一球得2分,投不进球得0分;在B区每投进一球得3分,投不进球得0分,得分高的选手胜出.已知参赛选手甲在A区和B区每次投篮进球的概率分别为,且各次投篮的结果互不影响.(1)若甲投篮得分的期望值不低于7分,则甲选择在A区投篮的球数最多是多少个?(2)若甲在A区投3个球且在B区投2个球,求甲在A区投篮得分高于在B区投篮得分的概率.解:(1)设甲选择在A 区投篮的球数为a(a=0,1,2,3,4,5),进球数为X1,得分为Y1,则Y1=2X1.(2)设“甲在A 区投篮得分高于在B 区投篮得分”为事件C,“甲在A 区投篮得分6分且在B 区投篮得分3分或0分”为事件D,“甲在A 区投篮得分4分且在B 区投篮得分3分或0分”为事件E,“甲在A 区投篮得分2分且在B 区投篮得分0分”为事件F,则事件C=D E F,且事件D、事件E 与事件F 之间两两互斥.反思感悟求随机变量的分布列、均值与方差的技巧要熟练掌握离散型随机变量的各种分布模型,对它们的均值与方差,能简便计算的要简便计算,如二项分布、超几何分布等,不然要用均值与方差的公式计算,这时要认真仔细.对点训练5某兴趣小组在科学馆的帕斯卡三角仪器前进行探究实验.如图所示,每次使一个实心小球从帕斯卡三角仪器的顶部入口落下,当它在依次碰到每层的菱形挡板时,会等可能地向左或者向右落下,在最底层的7个出口处各放置一个容器接住小球,该小组连续进行200次试验,并统计容器中的小球个数得到柱状图:(1)用该实验来估测小球落入4号容器的概率,若估测结果的误差小于5%,则称该实验是成功的.试问:该兴趣小组进行的实验是否成功?(2)再取3个小球进行试验,设其中落入4号容器的小球个数为X,求X的分布列与数学期望.(计算时采用概率的理论值)解:(1)由题意,走6步,取3步向左,3步向右就可以落入4号容器,也就是每一个落入4号容器的路径中有3步向左,3步向右.X 的分布列为 考向6.概率与统计的综合应用例6.(2021 北京海淀一模)每年的4月23日是联合国教科文组织确定的“世界读书日”.为了解某地区高一学生阅读时间的分配情况,从该地区随机抽取了500名高一学生进行在线调查,得到了这500名学生的周平均阅读时间(单位:小时),并将样本数据分成0,2,(2,4,(4,6,(6,8,(8,10,(10,12,(12,14,(14,16,(16,18九组,绘制成如图所示的频率分布直方图.(1)求a的值;(2)为进一步了解这500名学生数字媒体阅读时间和纸质图书阅读时间的分配情况,从周平均阅读时间在(12,14,(14,16,(16,18三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人,记周平均阅读时间在(14,16内的学生人数为X,求X的分布列;(3)以调查结果的频率估计概率,从该地区所有高一学生中随机抽取20名学生,用“P20(k)”表示这20名学生中恰有k名学生周平均阅读时间在(10,12(单位:小时)内的概率,其中k=0,1,2,20.当P20(k)最大时,写出k的值.(只需写出结论)解:(1)由频率分布直方图得2(0.02+0.03+0.05+0.05+0.15+a+0.05+0.04+0.01)=1,解得a=0.10.(2)由频率分布直方图得,这500名学生中周平均阅读时间在(12,14,(14,16,(16,18 三组内的学生人数分别为5000.10=50,5000.08=40,5000.02=10,若采用分层抽样的方法抽取了10人,(3)学生周平均阅读时间在(10,12 的概率P=0.12=0.2,则P20(k)=(0.2)k(0.8)20-k.当P20(k)最大时,k=4.易错警示谨防概率与统计综合题的三处错误点破解频数分布表、独立性检验、离散型随机变量的分布列与期望相交汇题的易错点有三处:一是忽视关键字眼,导致所得的数据出错;二是计算2时不会利用分子、分母先约分再计算的技巧,导致计算结果出错,从而推断出错;三是二项分布与超几何分布搞混,或把非二项分布误以为二项分布,导致求期望值出错.对点训练6(2021 甘肃高考一诊)某地积极开展中小学健康促进行动,发挥以体育智、以体育心功能,决定在体育中考中再增加一定的分数,规定:考生须参加立定跳远、掷实心球、一分钟跳绳三项测试,其中一分钟跳绳满分20分.学校为掌握九年级学生一分钟跳绳情况,随机抽取了100名学生测试,其成绩均在165,215间,并得到如图所示频率分布直方图,计分规则如表:一分钟跳绳个数165,175)175,185)185,195)195,205)205,215得分16 17 18 19 20(1)补全频率分布直方图,并根据频率分布直方图估计样本中位数;(2)若两人可组成一个小队,并且两人得分之和小于35分,则称该小队为“潜力队”,用频率估计概率,求从进行测试的100名学生中任意选取2人,恰好选到“潜力队”的概率.解:(1)195,205)的频率为1-10(0.005+0.006+0.009+0.050)=0.3,补全频率分布直方图如图所示,(0.005+0.009)10=0.140.5,样本的中位数落在185,195)内,设中位数为m,则0.14+(m-185)0.05=0.5,解得m=192.2,故样本中位数为192.2.(2)一分钟跳绳个数在165,175)内的可得16分,人数为1000.00510=5;一分钟跳绳个数在175,185)内的可得17分,人数为1000.00910=9;一分钟跳绳个数在185,195)内的可得18分,人数为1000.0510=50,“潜力队”的两人组合有4种情况,得分之和分别为32,33,34,34,考向7.概率与函数的综合问题例7.(2021 福建龙岩三模)甲、乙两人进行对抗比赛,每场比赛均能分出胜负.已知本次比赛的主办方提供8 000元奖金并规定:若有人先赢4场,则先赢4场者获得全部奖金同时比赛终止;若无人先赢4场且比赛意外终止,则甲、乙便按照比赛继续进行各自赢得全部奖金的概率之比分配奖金.已知每场比赛甲赢的概率为p(0p1),乙赢的概率为1-p,且每场比赛相互独立.(1)设每场比赛甲赢的概率为,若比赛进行了5场,主办方决定颁发奖金,求甲获得奖金的分布列;(2)规定:若随机事件发生的概率小于0.05,则称该随机事件为小概率事件,我们可以认为该事件不可能发生,否则认为该事件有可能发生.若本次比赛p,且在已进行的3场比赛中甲赢2场、乙赢1场,请判断:比赛继续进行乙赢得全部奖金是否有可能发生,并说明理由.解:(1)因为进行了5场比赛,所以甲、乙之间的输赢情况有以下四种:比赛输赢的情况共有4+10+10+4=28(种).设甲可能获得的奖金为X 元,则甲获得奖金的所有可能取值为8 000,6 000,2 000,0.(2)设A 表示事件“比赛继续进行Y 场乙赢得全部奖金”,则最后一场必然乙赢,当Y=3时,乙以42赢,P(Y=3)=(1-p)3;所以,乙赢得全部奖金的概率为P(A)=(1-p)3+3p(1-p)3=(1+3p)(1-p)3,设f(p)=(1+3p)(1-p)3.f(p)=3(1-p)3+(1+3p)3(1-p)2(-1)=-12p(1-p)2,故事件“乙赢得全部奖金”是小概率事件.所以认为比赛继续进行乙不可能赢得全部奖金.反思感悟解决概率与函数的综合问题的方法用函数的知识解决概率问题通常是求概率的最值问题,求离散型随机变量分布列的均值、方差的最值问题.此类问题一般方法是先建立函数模型,再用函数的有关知识求解,通常是利用一元二次函数求最值,或利用函数的单调性求最值,确定函数的单调区间常用导数的方法.对点训练7A,B两个投资项目的利润率分别为随机变量X1和X2.根据市场分析,X1和X2的分布列分别为X15%10%P 0.8 0.2X22%8%12%P 0.2 0.5 0.3(1)在A,B两个项目上各投资100万元,Y1和Y2分别表示投资项目A和B所获得的利润,求方差D(Y1),D(Y2);(2)将x(0 x100)万元投资A项目,(100-x)万元投资B项目,f(x)表示投资A项目所得利润的方差与投资B项目所得利润的方差的和.求f(x)的最小值,并指出x为何值时,f(x)取到最小值.解:(1)由题设可知Y1和Y2的分布列分别为 Y15 10P 0.8 0.2Y22 8 12P 0.2 0.5 0.3EY1=50.8+100.2=6,DY1=(5-6)20.8+(10-6)20.2=4.EY2=20.2+80.5+120.3=8,DY2=(2-8)20.2+(8-8)20.5+(12-8)20.3=12.当x=75时,f(x)取得最小值,且最小值为3.考向8.概率与数列的综合问题例8.为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得-1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为和,一轮试验中甲药的得分记为X.(1)求X的分布列;(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,pi=api-1+bpi+cpi+1(i=1,2,7),其中a=P(X=-1),b=P(X=0),c=P(X=1).假设=0.5,=0.8.()证明:pi+1-pi(i=0,1,2,7)为等比数列;()求p4,并根据p4的值解释这种试验方案的合理性.解:(1)X 的所有可能取值为-1,0,1.P(X=-1)=(1-),P(X=0)=+(1-)(1-),P(X=1)=(1-).所以X 的分布列为X-1 0 1P(1-)+(1-)(1-)(1-)(2)()由(1)得a=0.4,b=0.5,c=0.1.因此pi=0.4pi-1+0.5pi+0.1pi+1,故0.1(pi+1-pi)=0.4(pi-pi-1),即pi+1-pi=4(pi-pi-1).又因为p1-p0=p10,所以pi+1-pi(i=0,1,2,7)为公比为4,首项为p1的等比数列.反思感悟求解概率与数列的综合问题的思路若离散型随机变量分布列与其他知识交汇综合,则需把问题分解成各个基础知识进行逐个求解.本题就是利用递推关系式证明等比数列、累加法求解数列通项公式和数列中的项的问题.对点训练8中国女排,曾经十度成为世界冠军,铸就了响彻中华的女排精神.女排精神的具体表现为:扎扎实实,勤学苦练,无所畏惧,顽强拼搏,同甘共苦,团结战斗,刻苦钻研,勇攀高峰.女排精神对各行各业的劳动者起到了激励、感召和促进作用,给予全国人民巨大的鼓舞.(1)看过中国女排的纪录片后,某大学掀起“学习女排精神,塑造健康体魄”的年度主题活动,一段时间后,学生的身体素质明显提高,将该大学近5个月体重超重的人数进行统计,得到如下表格:月份x1 2 3 4 5体重超重的人数y640 540 420 300 200若该大学体重超重人数y与月份变量x(月份变量x依次为1,2,3,4,5)具有线性相关关系,请预测从第几月份开始该大学体重超重的人数降至10人以下?()若n=3,记B队员控制球的次数为X,求EX;所以y=bx+a=-112x+756.当y=-112x+75610(x N+)时,x7,所以可以预测从第7月份开始该大学体重超重的人数降至10人以下.