2019届高考数学总复习模块六概率与统计第20讲概率与统计学案理(共20页).docx
精选优质文档-倾情为你奉上第20讲概率与统计1.2018·全国卷某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0.(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX.(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验? 试做 2.2018·全国卷图M6-20-1是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:y=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:y=99+17.5t.图M6-20-1(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值.(2)你认为用哪个模型得到的预测值更可靠?并说明理由.试做 3.2017·全国卷海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图M6-20-2所示:图M6-20-2(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50 kg箱产量50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:P(K2k)k0.0500.0100.0013.8416.63510.828,K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).试做 命题角度概率与统计的实际问题求随机变量分布列的主要步骤:a.明确随机变量的取值,并确定随机变量服从何种概率分布;b.求随机变量取每一个值的概率;c.列成表格.求离散型随机变量均值的一般步骤:a.理解随机变量X的意义,写出X可能取得的全部值;b.求X取每个值的概率;c.写出X的分布列;d.由均值定义求出E(X).解决线性回归方程的求解与应用问题,一般是根据最小二乘法求出线性回归方程,再根据所给变量求出预测值.注意:回归直线方程y=bx+a必过样本点的中心(x,y).由频率分布直方图进行相关计算时,要注意:a.频率分布表中各组的频率之和为1;b.频率组距×组距=频率;c.频数样本容量=频率.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度.具体做法是根据公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)计算随机变量的观测值k,k越大,说明“两个变量有关系”的可能性越大.解答1以互斥或独立事件为背景的期望与方差1 某智能共享单车公司备有A,B两种车型,采用分段计费的方式营运:A型单车每30分钟收费0.5元(不足30分钟的部分按30分钟计算),B型单车每30分钟收费1元(不足30分钟的部分按30分钟计算).现有甲、乙、丙三人,分别相互独立地到租车点租车骑行(各租一车一次).已知甲、乙、丙不超过30分钟还车的概率分别为34,23,12,且这三人每人租车的时间都不会超过60分钟,甲、乙均租用A型单车,丙租用B型单车.(1)求甲、乙两人所付费用之和等于丙所付费用的概率;(2)设甲、乙、丙三人所付费用之和为随机变量,求的分布列和数学期望.听课笔记 【考场点拨】求解与独立事件有关的期望或方差问题,关键是计算相应事件的概率,通常结合题意,并利用互斥事件的概率加法公式和相互独立事件的概率计算公式求解.【自我检测】经销商第一年购买某工厂商品的单价为a(单位:元),在下一年购买时,购买单价与其上年度销售额(单位:万元)相联系,销售额越多,得到的优惠力度越大,具体情况如下表:上一年度销售额/万元0,100)100,200)200,300)300,400)400,500)500,+)商品单价/元a0.9a0.85a0.8a0.75a0.7a为了研究该商品购买单价的情况,调查并整理了50个经销商一年的销售额,得到如图M6-20-3所示的统计图.图M6-20-3已知某经销商下一年购买该商品的单价为X(单位:元),且以经销商在各段销售额的频率作为概率.(1)估计X的平均值h.(2)该工厂针对此次的调查制定了如下奖励方案:经销商购买单价不高于h的获得两次抽奖机会,高于h的获得一次抽奖机会.每次抽奖的获奖金额和对应的概率为获奖金额/元500010 000概率3414记Y(单位:元)表示某经销商参加这次抽奖活动获奖的金额,求Y的分布及数学期望. 解答2以二项分布为背景的期望与方差2 为了了解校园噪音情况,学校环保协会对校园噪音值(单位:分贝)进行了50天的监测,得到如下统计表:噪音值(单位:分贝)55,57(57,59(59,61(61,63(63,65(65,67频数14122085(1)根据该统计表,求这50天校园噪音值的样本平均数(同一分组的数据用该分组区间的中点值代表).(2)根据相关规定,“环境噪音值超过65分贝,视为重度噪音污染;环境噪音值不超过59分贝,视为轻度噪音污染.”如果把由上述统计表计算得到的频率视作概率,回答下列问题:求周一到周五的5天中恰有两天校园出现重度噪音污染而其余3天都是轻度噪音污染的概率.学校要举行为期3天的“汉字听写大赛”校园选拔赛,把这3天校园出现的重度噪音污染天数记为X,求X的分布列和方差D(X).听课笔记 【考场点拨】利用二项分布解题的一般步骤:根据题意设出随机变量,分析随机变量服从二项分布,找到参数n,p,写出二项分布的概率表达式,求解相关概率.【自我检测】在某校举行的航天知识竞赛中,参与竞赛的文科生与理科生人数之比为13,且成绩(单位:分)分布在40,100内,规定成绩在80分以上(含80分)的同学获奖,按文理科用分层抽样的方法抽取了200人的成绩作为样本,得到成绩的频率分布直方图如图M6-20-4所示.(1)填写下面的2×2列联表,并判断能否有超过95%的把握认为是否获奖与学生的文理科有关?(2)将上述调查所得的频率视为概率,现从参赛学生中,任意抽取3名学生,记“获奖”学生的人数为X,求X的分布列及数学期望.文科生理科生总计获奖5不获奖总计200附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828图M6-20-4听课笔记 解答3以超几何分布为背景的期望与方差3 某高中组织高一年级学生开展了一次“百里远足”活动.本次远足活动结束后,该校课外兴趣小组在高一某班进行了对“本次远足活动同学们的表现”的满意度调查(结果只有“满意”和“不满意”两种),按分层抽样的方法从被调查的学生中随机抽取了11人,具体调查结果如下表:满意不满意男生23女生42(1)若该班女生人数比男生人数多4,求该班男生人数和女生人数;(2)在该班随机抽取一名学生,根据以上统计数据估计该同学持满意态度的概率;(3)若从该班抽出的11名学生中任选2人,记选中的2人中对“本次远足活动同学们的表现”满意的人数为,求随机变量的分布列和数学期望.听课笔记 【考场点拨】求超几何分布的分布列的一般步骤:确定参数N,M,n的值;明确随机变量的所有可能取值,并求出随机变量取每一个值时对应的概率;列出分布列.解答4统计与统计案例的交汇问题4 为了响应中国大豆参与世界贸易的号召,农科院积极研究,加大优良大豆品种的培育工作,其中一项基础工作就是研究昼夜温差大小与大豆发芽率之间的关系,为此科研人员分别记录了5天中每天100粒大豆的发芽数,得如下数据:日期4月4日4月5日4月6日4月7日4月8日温差x()101113128发芽数y(粒)2326322616科研人员确定的研究方案是从5组数据中选3组数据求线性回归方程,再用求得的回归方程对剩下的2组数据进行检验. (1)求剩下的2组数据恰好是不相邻的2天数据的概率.(2)若选取的是4月5日、6日、7日三天的数据,据此求y关于x的线性回归方程y=bx+a.(3)若由线性回归方程得到的估计数据与实际数据的误差的绝对值均不超过1,则认为得到的线性回归方程是可靠的,请检验(2)中得到的线性回归方程是否可靠?注:b=i=1nxiyi-nxyi=1nxi2-nx2,a=y-bx.听课笔记 5 为了推行“智慧课堂”教学,某老师分别用传统教学和“智慧课堂”教学两种不同的教学方式,在甲、乙两个平行班级进行教学实验,为了比较教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,结果如下表:分数50,60)60,70)70,80)80,90)90,100甲班频数56441乙班频数13655记成绩不低于70分者为“成绩优良”.(1)由以上统计数据填写下面2×2列联表,并判断“成绩是否优良与教学方式是否有关”?甲班乙班总计成绩优良成绩不优良总计(2)现从上述40人中,按成绩是否优良采用分层抽样的方法抽取8人进行考核.在这8人中随机抽取3人,记成绩不优良的人数为X,求X的分布列及数学期望.附:K2=n(ad-bc)2(a+c)(b+d)(a+b)(c+d),其中n=a+b+c+d.P(K2k0)0.100.050.0250.010k02.7063.8415.0246.635听课笔记 【考场点拨】(1)解决回归分析问题要注意:回归直线恒过样本点的中心(x ,y);利用回归直线方程只能进行预测与估计,而得不到准确数值.(2)解决统计案例问题关键是过好三关:假设关,即假设两个分类变量无关;应用公式关,把相关数据代入独立性检验公式求出K2的观测值k;对比关,将k与临界值进行对比,进而作出判断.【自我检测】某中学统计了甲、乙两个班级一模的数学成绩(单位:分,满分150),得到如图M6-20-5所示的茎叶图.图M6-20-5 (1)根据茎叶图分别求出甲、乙两班学生数学成绩的中位数,并将乙班学生数学成绩的频率分布直方图(如图M6-20-6所示)填充完整;图M6-20-6(2)根据茎叶图比较在一模考试中甲、乙两班学生数学成绩的平均水平和成绩的分散程度(不要求计算出具体值,给出结论即可);(3)若规定分数在100,120)内的成绩为良好,分数在120,150)内的成绩为优秀,现从甲、乙两班成绩为优秀的学生中,按照各班成绩为优秀的学生人数比例用分层抽样的方法,共选出12位学生参加数学提优培训,求这12位学生中恰含甲、乙两班所有140分以上的学生的概率. 第20讲概率与统计典型真题研析1.解:(1)20件产品中恰有2件不合格品的概率为f(p)=C202p2(1-p)18,因此f'(p)=C2022p(1-p)18-18p2(1-p)17=2C202p(1-p)17(1-10p).令f'(p)=0,得p=0.1.当p(0,0.1)时,f'(p)>0;当p(0.1,1)时,f'(p)<0.所以f(p)的最大值点为p0=0.1.(2)由(1)知,p=0.1.(i)令Y表示余下的180件产品中的不合格品件数,依题意知YB(180,0.1),X=20×2+25Y,即X=40+25Y,所以EX=E(40+25Y)=40+25EY=490.(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费用为400元.由于EX>400,故应该对余下的产品作检验.2.解:(1)利用模型,该地区2018年的环境基础设施投资额的预测值为y=-30.4+13.5×19=226.1(亿元).利用模型,该地区2018年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿元).(2)利用模型得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可)3.解:(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.由题意知P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)×5=0.66,故P(C)的估计值为0.66.因此,事件A的概率估计值为0.62×0.66=0.409 2.(2)根据箱产量的频率分布直方图得列联表:箱产量<50 kg箱产量50 kg旧养殖法6238新养殖法3466K2=200×(62×66-34×38)2100×100×96×10415.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新养殖法箱产量的中位数的估计值为50+0.5-0.340.06852.35(kg).考点考法探究解答1例1解:(1)由题意,甲、乙、丙三人在30分钟以上且不超过60分钟还车的概率分别为14,13,12.设“甲、乙两人所付费用之和等于丙所付费用”为事件M,则P(M)=34×23×12+14×13×12=724.(2)随机变量的所有可能取值为2,2.5,3,3.5,4.由题意知P(=2)=34×23×12=14,P(=2.5)=34×13×12+14×23×12=524,P(=3)=34×23×12+14×13×12=724,P(=3.5)=34×13×12+14×23×12=524,P(=4)=14×13×12=124,所以甲、乙、丙三人所付费用之和的分布列为22.533.54P14524724524124所以E()=2×14+2.5×524+3×724+3.5×524+4×124=6724.【自我检测】解:(1)由题可知:商品单价/元a0.9a0.85a0.8a0.75a0.7a频率0.20.30.240.120.10.04所以估计X的平均值h=a×0.2+0.9a×0.3+0.85a×0.24+0.8a×0.12+0.75a×0.1+0.7a×0.04=0.873a.(2)经销商购买单价不高于h的概率为0.24+0.12+0.1+0.04=12,高于h的概率为0.2+0.3=12.Y的可能取值为5000,10 000,15 000,20 000.则P(Y=5000)=12×34=38,P(Y=10 000)=12×14+12×34×34=1332,P(Y=15 000)=12×C21×14×34=316,P(Y=20 000)=12×14×14=132.所以Y的分布列为Y500010 00015 00020 000P381332316132E(Y)=5000×38+10 000×1332+15 000×316+20 000×132=9375.解答2例2解:(1)由题意可知,样本平均值x=56×1+58×4+60×12+62×20+64×8+66×550=61.8.(2)由题意得,校园某天出现重度噪音污染的概率为110,出现轻度噪音污染的概率为110.设事件A为“周一至周五的五天中恰有两天校园出现重度噪音污染而其余三天都是轻度噪音污染”,则P(A)=C×1103=110 000.由题意得XB3,110,则P(X=k)=C3k110k9103-k,k=0,1,2,3.故X的分布列为X0123P11000D(X)=np(1-p)=27100.【自我检测】解:(1)完整的2×2联表如下:文科生理科生总计获奖53540不获奖45115160总计50150200由表中数据可得K2的观测值k=200×(5×115-35×45)240×160×50×150=2564.167>3.841,所以有超过95%的把握认为是否获奖与学生的文理科有关.(2)由表中数据可知,抽到获奖学生的概率为15,将频率视为概率,所以X可取0,1,2,3且XB3,15,则P(X=k)=C3k15k1-153-k(k=0,1,2,3),故X的分布列为X0123P6412548125121251125E(X)=np=3×15=35.解答3例3解:(1)设该班男生人数为x,则女生人数为x+4,由条件可得x2x+4=511,解得x=20,故该班男生有20人,女生有24人.(2)由条件知在该班随机抽取一名学生,估计该同学持满意态度的概率为611.(3)由题意知的可能取值为0,1,2,服从超几何分布,则P(=0)=C60C52C112=211,P(=1)=C61C51C112=611,P(=2)=C62C50C112=311,故的分布列为012P211611311E()=0×211+1×611+2×311=1211.解答4例4解:(1)剩下的2组数据恰好是不相邻的2天数据的概率是1-4C52=35. (2)由已知数据得i=13xiyi=11×26+13×32+12×26=1014,x=13×(11+13+12)=12,y=13×(26+32+26)=28,3xy=3×12×28=1008,i=13xiyi-3xy=1014-1008=6.i=13xi2=112+132+122=434,3x2=3×122=432,i=13xi2-3x2=434-432=2,b=i=13xiyi-3xyi=13xi2-3x2=62=3,a=y-bx=28-3×12=-8.故y关于x的线性回归方程为y=3x-8.(3)当x=10时,y =3x-8=3×10-8=22,|22-23|1;当x=8时,y =3x-8=3×8-8=16,|16-16|1.故(2)中得到的线性回归方程是可靠的.例5解:(1)2×2列联表如下:甲班乙班总计成绩优良91625成绩不优良11415总计202040根据表中的数据,得K2的观测值k=40×(9×4-16×11)225×15×20×205.227>5.024,在犯错的概率不超过0.025的前提下认为“成绩是否优良与教学方式有关”.(2)由表可知在8人中成绩不优良的人数约为1540×8=3,则X的可能取值为0,1,2,3.P(X=0)=C53C83=528,P(X=1)=C31C52C83=1528,P(X=2)=C32C51C83=1556,P(X=3)=C33C83=156.X的分布列为X0123P52815281556156E(X)=0×528+1×1528+2×1556+3×156=98.【自我检测】解:(1)甲班学生数学成绩的中位数为122+1142=118,乙班学生数学成绩的中位数为128+1282=128.补充完整的乙班学生数学成绩的频率分布直方图如图所示. (2)由茎叶图可知,乙班学生数学成绩的平均水平高于甲班学生数学成绩的平均水平.甲班学生数学成绩的分散程度高于乙班学生数学成绩的分散程度.(3)由茎叶图可知,甲、乙两班数学成绩为优秀的人数分别为10,14.若从中用分层抽样的方法选出12人,则应从甲、乙两班分别选出5人、7人.设“选出的12人中恰含有甲、乙两班所有140分以上的学生”为事件A,则P(A)=C22C83C105×C33C114C147=29×552=5234.所以选出的12人中恰含有甲、乙两班所有140分以上的学生的概率为5234.备选理由 所给3个例题分别围绕二项分布的期望,超几何分布的期望,统计与概率的综合等知识展开,旨在强化解题训练,熟悉试题题型与处理方法.例1配例1使用 2018·北京卷 电影公司随机收集了电影的有关数据,经分类整理得到下表:电影类型第一类第二类第三类第四类第五类第六类电影部数14050300200800510好评率0.40.20.150.250.20.1好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“k=1”表示第k类电影得到人们喜欢,“k=0”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差D1,D2,D3,D4,D5,D6的大小关系.解:(1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000,第四类电影中获得好评的电影部数是200×0.25=50.故所求概率为=0.025.(2)设事件A为“从第四类电影中随机选出的电影获得好评”,事件B为“从第五类电影中随机选出的电影获得好评”.故所求概率为P(AB+AB)=P(AB)+P(AB)=P(A)(1-P(B)+(1-P(A)P(B).由题意知:P(A)估计为0.25,P(B)估计为0.2.故所求概率估计为0.25×0.8+0.75×0.2=0.35.(3)D1>D4>D2=D5>D3>D6.例2配例3使用 为发展业务,某公司市场部准备从国内n(nN*)个人口超过1000万的超大城市和8个人口低于100万的小城市中随机抽取若干个进行调查统计.若一次抽取2个城市,则全是小城市的概率为415.(1)求n的值.(2)若一次抽取4个城市,假设取出小城市的个数为X,求X的分布列和期望;求取出的4个城市是同一类城市且全为超大城市的概率.解:(1)从n+8个城市中取出2个城市,共有Cn+82种情况,其中全是小城市的情况有C82种,故全是小城市的概率是C82Cn+82=8×7(n+8)(n+7)=415,(n+8)(n+7)=210=15×14,n+7=14,故n=7.(2)X的可能取值为0,1,2,3,4.则P(X=0)=C80C74C154=139,P(X=1)=C81C73C154=839,P(X=2)=C82C72C154=2865,P(X=3)=C83C71C154=56195,P(X=4)=C84C70C154=239.故X的分布列为X01234P139839286556195239E(X)=0×139+1×839+2×2865+3×56195+4×239=3215.若4个城市全是超大城市,共有C74=35(种)情况;若4个城市全是小城市,共有C84=70(种)情况.故所求概率为C74C84+C74=3570+35=13.例3配例4使用 某市气象站观测点记录的连续4天AQI指数(空气质量指数)M与当天的水平能见度y(单位:km)的情况如表1:表1M400300200100y0.53.56.59.5该市某月AQI指数的频数分布表如表2:表2M0,100(100,200(200,300(300,400(400,500频数361263(1)设x=M100,根据表1的数据,求出y关于x的回归方程;(参考公式:y=bx+a,其中b=i=1nxiyi-nxyi=1nxi2-nx2,a=y-bx)(2)小张开了一家洗车店,经统计,当M不大于200时,洗车店平均每天亏损约2000元;当M大于200不大于400时,洗车店平均每天收入约4000元;当M大于400时,洗车店平均每天收入约7000元.根据表2估计小张的洗车店该月平均每天的收入.解:(1)x=14×(4+3+2+1)=2.5,y=14×(0.5+3.5+6.5+9.5)=5,则b=4×0.5+3×3.5+2×6.5+1×9.5-4×2.5×542+32+22+1-4×2.52=-3,a=5-(-3)×2.5=12.5,故y=-3x+12.5. (2)由表2知AQI指数不大于200的频率为930=0.3,AQI指数大于200不大于400的频率为1830=0.6,AQI指数大于400的频率为0.1,设洗车店每天的收入为X,则X的分布列为X-200040007000P0.30.60.1则E(X)=-2000×0.3+4000×0.6+7000×0.1=2500.故小张的洗车店该月平均每天的收入为2500元.专心-专注-专业