2018大二轮高考总复习理数文档:解答题3 概率、随机变量及其分布列 .doc
第一单元高考中档大题突破解答题03:概率、随机变量及其分布列年 份卷 别具体考查内容及命题位置命题分析2017卷频率分布直方图、独立性检验等知识的综合应用T191.概率、统计的解答题为必考内容,经常出现在18题或19题位置,难度中等2统计问题多考查用最小二乘法求线性回归方程、样本的相关性检验、用样本估计总体等3概率问题多以交汇性的形式考查,交汇点主要有两种:一是两图(频率分布直方图与茎叶图)择一与频率与概率的关系、数据的数字特征相交汇来考查;二是两图(频率分布直方图与茎叶图)择一与线性回归或独立性检验相交汇来考查.卷相关系数、均值与标准差的应用T19卷古典概型、频数、频率的概念及综合应用T182016甲卷互斥事件、条件概率,随机变量的分布列T18乙卷随机变量的分布列及数学期望T19丙卷两个变量间的线性相关性、线性回归方程的求解与应用T182015卷散点图、求回归方程、回归分析问题T19卷茎叶图、数据的平均值和方差、相互独立事件的概率T182014卷频率分布直方图、样本的数字特征、正态分布、二项分布及期望T18卷最小二乘法求线性回归方程T192013卷相互独立事件的概率、条件概率、离散型随机变量的分布列与期望T19卷频率分布直方图、分段函数解析式的求法、频率与概率的关系、离散型随机变量的分布列与期望T19基本考点相互独立事件与独立重复试验的概率、统计、统计案例考向01:相互独立事件、独立重复试验的概率1相互独立事件同时发生的概率P(AB)P(A)P(B)2独立重复试验如果事件A在一次试验中发生的概率是p,那么它在n次独立重复试验中恰好发生k次的概率为Pn(k)Cpk(1p)nk,k0,1,2,n3互斥事件的概率加法公式(1)如果事件A与B互斥,那么P(AB)P(A)P(B);(2)一般地,如果事件A1,A2,An彼此互斥,那么P(A1A2An)P(A1)P(A2)P(An)4对立事件及其概率公式若事件B与事件A互为对立事件,则P(A)P(B)1,即P(A)1P(B)1一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个的概率;(2)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列,期望E(X)及方差D(X)解:(1)设A1表示事件“日销售量不低于100个”,A2表示事件“日销售量低于50个”,B表示事件“在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个”,因此P(A1)(0.0060.0040.002)500.6,P(A2)0.003500.15,P(B)0.60.60.1520.108(2)X可能取的值为0,1,2,3,相应的概率为P(X0)C(10.6)30.064,P(X1)C0.6(10.6)20.288,P(X2)C0.62(10.6)0.432,P(X3)C0.630.216分布列为X0123P0.0640.2880.4320.216因为XB(3,0.6),所以期望E(X)30.61.8,方差D(X)30.6(10.6)0.722(2016北京卷)A,B,C三个班共有100名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部分学生一周的锻炼时间,数据如下表(单位:小时):A班66.577.58B班6789101112C班34.567.5910.51213.5(1)试估计C班的学生人数;(2)从A班和C班抽出的学生中,各随机选取1人,A班选出的人记为甲,C班选出的人记为乙. 假设所有学生的锻炼时间相互独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;(3)再从A,B,C三个班中各任取一名学生,他们该周的锻炼时间分别是7,9,8.25(单位:小时)这3个新数据与表格中的数据构成的新样本的平均数记为1,表格中数据的平均数记为0,试判断0和1的大小(结论不要求证明)解:(1)C班学生人数约为10010040(人)(2)设事件Ai为“甲是现有样本中A班的第i个人”,i1,2,5事件Cj为“乙是现有样本中C班的第j个人”,j1,2,8由题意可知P(Ai),i1,2,5;P(Cj),j1,2,8P(AiCj)P(Ai)P(Cj),i1,2,5,j1,2,8设事件E为“该周甲的锻炼时间比乙的锻炼时间长”,由题意知,EA1C1A1C2A2C1A2C2A2C3A3C1A3C2A3C3A4C1A4C2A4C3A5C1A5C2A5C3A5C4因此P(E)P(A1C1)P(A1C2)P(A2C1)P(A2C2)P(A2C3)P(A3C1)P(A3C2)P(A3C3)P(A4C1)P(A4C2)P(A4C3)P(A5C1)P(A5C2)P(A5C3)P(A5C4)15(3)10考向02:用样本估计总体1频率分布直方图中横坐标表示组距,纵坐标表示,频率组距2频率分布直方图中各小长方形的面积之和为13利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者的含义:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和11(2017潍坊模拟)某高中为了解全校学生每周参与体育运动的情况,随机从全校学生中抽取100名学生,统计他们每周参与体育运动的时间如下:每周参与运动的时间(单位:小时)0,4)4,8)8,12)12,16)16,20频数24402862(1)作出样本的频率分布直方图;(2)估计该校学生每周参与体育运动的时间的中位数及平均数;若该校有学生3 000人,根据以上抽样调查数据,估计该校学生每周参与体育运动的时间不低于8小时的人数解:(1)频率分布直方图如图所示:(2)由数据估计中位数为446.6,估计平均数为20.2460.4100.28140.06180.026.88将频率看作概率知P(t8)0.36,3 0000.361 080即该校每周参与体育运动的时间不低于8小时的人数为1 080人2(2017合肥模拟)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h)试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:061.22.71.52.81.82.22.33.23.5252.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:321.71.90.80.92.41.22.61.31.4160.51.80.62.11.12.51.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A药观测数据的平均数为x,B药观测数据的平均数为,由观测结果可得(0.61.21.21.51.51.82.22.32.32.42.52.62.72.72.82.93.03.13.23.5)2.3,(0.50.50.60.80.91.11.21.21.31.41.61.71.81.92.12.42.52.62.73.2)1.6由以上计算结果可得>,因此可看出A药的疗效更好(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2.,3.上,而B药疗效的试验结果有的叶集中在茎0.,1.上,由此可看出A药的疗效更好考向03:统计案例1回归分析方程x称为线性回归方程,其中,;(,)称为样本点的中心2独立性检验K2,若k0>3.841,则有95%的把握认为两个事件有关;若k0>6.635,则有99%的把握认为两个事件有关1某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20082010201220142016需求量(万吨)236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程x;(2)利用(1)中所求出的回归直线方程预测该地2018年的粮食需求量解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:年份2 01242024需求量257211101929对预处理后的数据,容易算得,0,3.2,6.5,3.2由上述计算结果知,所求回归直线方程为257(x2 012)6.5(x2 012)3.2,即6.5(x2 012)260.2(2)利用(1)中所求回归直线方程,可预测2018年的粮食需求量为6.5(2 0182 012)260.26.56260.2299.2(万吨)2(2017九江模拟)某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生的成绩分为6组,得到如下所示的频数分布表.分数段40,50)50,60)60,70)70,80)80,90)90,100男39181569女64510132(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,数学成绩与性别是否有关;(2)规定80分以上为优分(含80分),请你根据已知条件作出22列联表,并判断是否有90%以上的把握认为“数学成绩与性别有关”.优分非优分总计男生女生总计100附表及公式:P(K2k0)0.1000.0500.0100.001k02.7063.8416.63510.828K2解:(1)男450.05550.15650.3750.25850.1950.1571.5,女450.15550.1650.125750.25850.325950.0571.5,从男、女生各自的平均分来看,并不能判断数学成绩与性别有关(2)由频数分布表可知,在抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得22列联表如下:优分非优分总计男生154560女生152540总计3070100可得K21.79,因为1.79<2.706,所以没有90%以上的把握认为“数学成绩与性别有关”常考热点离散型随机变量的分布列概率模型多考查独立重复试验、相互独立事件、互斥事件及对立事件等;对离散型随机变量的分布列及期望的考查是重点中的“热点”,多在解答题的前三题的位置呈现,常考查独立事件的概率,超几何分布和二项分布的期望等(2017天津卷)从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为,.(1)记X表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X的分布列和数学期望;(2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率【解】(1)随机变量X的所有可能取值为0,1,2,3P(X0)111,P(X1)111111,P(X2)111,P(X3)所以随机变量X的分布列为X0123P随机变量X的数学期望E(X)0123(2)设Y表示第一辆车遇到红灯的个数,Z表示第二辆车遇到红灯的个数,则所求事件的概率为P(YZ1)P(Y0,Z1)P(Y1,Z0)P(Y0)P(Z1)P(Y1)P(Z0)所以这2辆车共遇到1个红灯的概率为求相互独立事件和独立重复试验的概率的方法(1)直接法:正确分析复杂事件的构成,将复杂事件转化为几个彼此互斥的事件的和事件或几个相互独立事件同时发生的积事件或独立重复试验问题,然后用相应概率公式求解(2)间接法:当复杂事件正面情况比较多,反面情况较少,则可利用其对立事件进行求解对于“至少”“至多”等问题往往也用这种方法求解(2016山东高考)某联欢晚会举行抽奖活动,举办方设置了甲、乙两种抽奖方案,方案甲的中奖率为,中奖可以获得2分;方案乙的中奖率为,中奖可以获得3分;未中奖则不得分每人有且只有一次抽奖机会,每次抽奖中奖与否互不影响,晚会结束后凭分数兑换奖品.(1)若小明选择方案甲抽奖,小红选择方案乙抽奖,记他们的累计得分为X,求X3的概率;(2)若小明、小红两人都选择方案甲或都选择方案乙进行抽奖,问:他们选择何种方案抽奖,累计得分的数学期望较大?【解】法一:(1)由已知得,小明中奖的概率为,小红中奖的概率为,且两人中奖与否互不影响记“这两人的累计得分X3”的事件为A,则事件A的对立事件为“X5”,因为P(X5),所以P(A)1P(X5),即这两人的累计得分X3的概率为(2)设小明、小红都选择方案甲抽奖中奖次数为X1,都选择方案乙抽奖中奖次数为X2,则这两人选择方案甲抽奖累计得分的数学期望为E(2X1),选择方案乙抽奖累计得分的数学期望为E(3X2)由已知可得,X1B(2, ),X2B(2, ),所以E(X1)2,E(X2)2,因此E(2X1)2E(X1),E(3X2)3E(X2)因为E(2X1)>E(3X2),所以他们都选择方案甲进行抽奖时,累计得分的数学期望较大法二:(1)由已知得,小明中奖的概率为,小红中奖的概率为,且两人中奖与否互不影响记“这两人的累计得分X3”的事件为A,则事件A包含有“X0”,“X2”,“X3”三个两两互斥的事件,因为P(X0)(1)(1),P(X2)(1),P(X3)(1),所以P(A)P(X0)P(X2)P(X3),即这两人的累计得分X3的概率为(2)设小明、小红都选择方案甲所获得的累计得分为X1,都选择方案乙所获得的累计得分为X2,则X1,X2的分布列如下:X1024PX2036P所以E(X1)024,E(X2)036因为E(X1)>E(X2),所以他们都选择方案甲进行抽奖时,累计得分的数学期望较大对于实际问题中的随机变量X,如果能够断定它服从二项分布B(n,p),则其概率、期望与方差可直接利用公式P(Xk)Cpk(1p)nk(k0,1,2,n),E(X)np,D(X)np(1p)求得,因此,熟记二项分布的相关公式,可以避免繁琐的运算过程,提高运算速度和准确度(2017合肥二模)为推动乒乓球运动的发展,某乒乓球比赛允许不同协会的运动员组队参加现有来自甲协会的运动员3名,其中种子选手2名;乙协会的运动员5名,其中种子选手3名从这8名运动员中随机选择4人参加比赛(1)设A为事件“选出的4人中恰有2 名种子选手,且这2名种子选手来自同一个协会”,求事件A发生的概率;(2)设X为选出的4人中种子选手的人数,求随机变量X的分布列和数学期望【解】(1)由已知,有P(A)所以,事件A发生的概率为(2)随机变量X的所有可能取值为1,2,3,4P(Xk)(k1,2,3,4)所以随机变量X的分布列为X1234P随机变量X的数学期望E(X)1234抽取的4人中,运动员可能为种子选手或一般运动员,并且只能是这两种情况之一,符合超几何概型的特征,故可利用超几何分布求概率1(2017大庆二模)某市随机抽取部分企业调查年上缴税收情况(单位:万元),将所得数据绘制成频率分布直方图(如图),年上缴税收范围是0,100,样本数据分组为0,20),20,40),40,60),60,80),80,100(1)求直方图中x的值;(2)如果年上缴税收不少于60万元的企业可申请政策优惠,若共抽取企业1200个,试估计有多少企业可以申请政策优惠;(3)从企业中任选4个,这4个企业年上缴税收少于20万元的个数记为X,求X的分布列和数学期望(以直方图中的频率作为概率)解:(1)由直方图可得:20(x0.0250.00650.0032)1,解得x0.0125(2)企业缴税收不少于60万元的频率0.0032200.12,12000.121441200个企业中有144个企业可以申请政策优惠(3)X的可能取值为0,1,2,3,4由(1)可得:某个企业缴税少于20万元的概率0.0125200.25因此XB(4,),分布列为P(Xk)Ck4k,(k0,1,2,3,4),E(X)412(2017长春三模)据中国新闻网10月21日报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改”引起广泛关注为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3 600人调查,就是否“取消英语听力”的问题,调查统计的结果如下表:态度调查人群应该取消应该保留无所谓在校学生2100人120人y人社会人士600人x人z人已知在全体样本中随机抽取1人,抽到持“应该保留”态度的人的概率为0.05(1)现用分层抽样的方法在所有参与调查的人中抽取360人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?(2)在持“应该保留”态度的人中,用分层抽样的方法抽取6人平均分成两组进行深入交流,求第一组中在校学生人数的分布列和数学期望解:(1)抽到持“应该保留”态度的人的概率为0.05,0.05,解得x60. 持“无所谓”态度的人数共有3 6002 10012060060720. 应在“无所谓”态度抽取72072人(2)由(1)知持“应该保留”态度的一共有180人,在所抽取的6人中,在校学生为64人,社会人士为62人,于是第一组在校学生人数1,2,3,P(1),P(2),P(3),即的分布列为:123PE()1232. 3(2016全国甲卷)某险种的基本保费为a(单元:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:上年度出险次数012345保费0.85aa1.25a1.5a1.75a2a设该险种一续保人一年内出险次数与相应概率如下:一年内出险次数012345概率0.300.150.200.200.100.05(1)求一续保人本年度的保费高于基本保费的概率;(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;(3)求续保人本年度的平均保费与基本保费的比值解:(1)设A表示事件“一续保人本年度的保费高于基本保费”,则事件A发生当且仅当一年内出险次数大于1,故P(A)1(0.300.15)0.55(2)设B表示事件“一续保人本年度的保费比基本保费高出60%”,则事件B发生当且仅当一年内出险次数大于3,故P(B)0.10.050.15又P(AB)P(B),故P(B|A)因此所求概率为(3)记续保人本年度的保费为X,则X的分布列为X0.85aa1.25a1.5a1.75a2aP0.300.150.200.200.100.05E(X)0.85a0.30a0.151.25a0.201.5a0.201.75a0.102a0.051.23a因此续保人本年度的平均保费与基本保费的比值为1.234(2017全国卷)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完根据往年销售经验,每天需求量与当天最高气温(单位:)有关如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温10,15)15,20)20,25)25,30)30,35)35,40)天数216362574以最高气温位于各区间的频率代替最高气温位于该区间的概率(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?解:(1)由题意知,X所有可能取值为200,300,500,由表格数据知P(X200)0.2,P(X300)0.4,P(X500)0.4因此X的分布列为X200300500P0.20.40.4(2)由题意知,这种酸奶一天的需求量至多为500,至少为200,因此只需考虑200n500当300n500时,若最高气温不低于25,则Y6n4n2n;若最高气温位于区间20,25),则Y63002(n300)4n1 2002n;若最高气温低于20,则Y62002(n200)4n8002n因此E(Y)2n0.4(1 2002n)0.4(8002n)0.26400.4n当200n300时,若最高气温不低于20,则Y6n4n2n;若最高气温低于20,则Y62002(n200)4n8002n,因此E(Y)2n(0.40.4)(8002n)0.21601.2n所以n300时,Y的数学期望达到最大值,最大值为520元5(2017开封二模)为了打好脱贫攻坚战,某贫困县农科院针对玉米种植情况进行调研,力争有效地改良玉米品种,为农民提供技术支援现对已选出的一组玉米的茎高进行统计,获得茎叶图如图(单位:厘米),设茎高大于或等于180厘米的玉米为高茎玉米,否则为矮茎玉米(1)完成22列联表,并判断是否可以在犯错误概率不超过1%的前提下,认为抗倒伏与玉米矮茎有关?(2)(i)按照分层抽样的方式,在上述样本中,从易倒伏和抗倒伏两组中抽出9株玉米,设取出的易倒伏矮茎玉米株数为X,求X的分布列(概率用组合数算式表示)(ii)若将频率视为概率,从抗倒伏的玉米试验田中再随机取出50株,求取出的高茎玉米株数的数学期望和方差.P(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828(K2,其中nabcd)解:(1)根据统计数据做出22列联表如下:抗倒伏易倒伏合计矮茎15419高茎101626合计252045经计算K27.2876.635,因此可以在犯错误概率不超过1%的前提下,认为抗倒伏与玉米矮茎有关(2)(i)按照分层抽样的方式抽到的易倒伏玉米共4株,则X的可能取值为0,1,2,3,4.P(X0),P(X1),P(X2),P(X3),P(X4)即X的分布列为:X01234P(ii)在抗倒伏的玉米样本中,高茎玉米有10株,占,即每次取出高茎玉米的概率均为,设取出高茎玉米的株数为,则B(50,),即E()np5020,Dnp(1p)50126(2017全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量50 kg箱产量50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)附:P(K2k)0.0500.0100.001k3.8416.63510.828,K2(1)解:记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”由题意知P(A)P(BC)P(B)P(C)旧养殖法的箱产量低于50 kg的频率为(0.0120.0140.0240.0340.040)50.62,故P(B)的估计值为0.62新养殖法的箱产量不低于50 kg的频率为(0.0680.0460.0100.008)50.66,故P(C)的估计值为0.66因此,事件A的概率估计值为0.620.660.409 2(2)解:根据箱产量的频率分布直方图得列联表箱产量<50 kg箱产量50 kg旧养殖法6238新养殖法3466K215.705由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关(3)解:因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.0040.0200.044)50.34<0.5,箱产量低于55 kg的直方图面积为(0.0040.0200.0440.068)50.68>0.5,故新养殖法产量的中位数的估计值为5052.35(kg)