2024年高考数学专项概率统计大题综合(解析版).pdf
1概率统计大题综合概率统计大题综合知识点总结知识点总结1.1.数字样本特征(1)众数:在一组数据中出现次数最多的数(2)中位数:将一组数据按从小到大(或从大到小)的顺序排列,如果为奇数个,中位数为中间数;若为偶数个,中位数为中间两个数的平均数(3)平均数:x=x1+x2+xnn,反映样本的平均水平(4)方差:s2=(x1x)2+(x2x)2+(xnx)2n反映样本的波动程度,稳定程度和离散程度;s2越大,样本波动越大,越不稳定;s2越小,样本波动越小,越稳定;(5)标准差:=s2,标准差等于方差的算术平方根,数学意义和方差一样(6)极差:等于样本的最大值最小值2.2.求随机变量X的分布列的步骤:(1)理解X的意义,写出X可能取得全部值;(2)求X取每个值的概率;(3)写出X的分布列;(4)根据分布列的性质对结果进行检验.还可判断随机变量满足常见分布列:两点分布,二项分布,超几何分布,正态分布.3.3.求随机变量的期望和方差的基本方法:(1)已知随机变量的分布列,直接利用期望和方差公式直接求解;(2)已知随机变量 X 的期望、方差,求 aX+b a,bR的期望与方差,利用期望和方差的性质E aX+b=aE X+b,D aX+b=a2D X进行计算;(3)若能分析出所给的随机变量服从常用的分布(如:两点分布、二项分布等),可直接利用常用分布列的期望和方差公式进行计算,若B(n,p),则E=np,D=np(1-p).4.4.求解概率最大问题的关键是能够通过P=kP=k+1P=kP=k-1 构造出不等关系,结合组合数公式求解结果5.5.线性回归分析解题方法:(1)计算x,y,ni=1xi2,ni=1xiyi的值;(2)计算回归系数a,b;(3)写出回归直线方程y=bx+a.线性回归直线方程为:y=bx+a,b=ni=1xixyiyni=1xix2=ni=1xiyinxyni=1xi2nx2,a=ybx其中 x,y为样本中心,回归直线必过该点2024年高考数学专项概率统计大题综合(解析版)2(4)线性相关系数(衡量两个变量之间线性相关关系的强弱)r=ni=1xixyiyni=1xix2ni=1yiy2=ni=1xiyinxyni=1xi2nx2ni=1yi2ny2r0,正相关;r0元.该团队研发的疫苗每次接种后产生抗体的概率为p 0p1,如果一个周期内至少2次出现抗体,则该周期结束后终止试验,否则进入第二个周期.若p=23,试验人数为1000人,试估计该试验用于接种疫苗的总费用.5K2=n ad-bc2a+bc+da+cb+d,P K2k00.100.050.010.0050.001k02.7063.8416.6357.87910.8286.6.(2023(2023安徽蚌埠安徽蚌埠统考三模统考三模)某校为了丰富学生课余生活,组建了足球社团.为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各100名进行调查,部分数据如表所示:喜欢足球不喜欢足球合计男生40女生30合计(1)根据所给数据完成上表,依据=0.001的独立性检验,能否认为该校学生喜欢足球与性别有关?(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球射门.已知这两名男生进球的概率均为23,这名女生进球的概率为12,每人射门一次,假设各人射门相互独立,求3人进球总次数X的分布列和数学期望.附:2=n ad-bc2a+bc+da+cb+d0.10.050.010.0050.001x2.7063.8416.6357.87910.82867.7.(2023(2023海南海口海南海口海南华侨中学校考模拟预测海南华侨中学校考模拟预测)在以视觉为主导的社交媒体时代,人们常借助具有美颜功能的产品对自我形象进行美化.移动端的美颜拍摄类APP主要有两类:A类是以自拍人像、美颜美妆为核心功能的APP;B类是图片编辑、精修等图片美化类APP.某机构为调查市民对上述A,B两类APP的使用情况,随机调查了部分市民.已知被调查的市民中使用过A类APP的占60%,使用过B类APP的占50%,设个人对美颜拍摄类APP类型的选择及各人的选择之间相互独立.(1)从样本人群中任选1人,求该人使用过美颜拍摄类APP的概率;(2)从样本人群中任选5人,记X为5人中使用过美颜拍摄类APP的人数,设X的数学期望为E X,求P X=E X;(3)在单独使用过A,B两类APP的样本人群中,按类型分甲、乙两组,并在各组中随机抽取8人,甲组对A类APP,乙组对B类APP分别评分如下:甲组评分9486929687939082乙组评分8583859175908380记甲、乙两组评分的平均数分别为x1,x2,标准差分别为s1,s2,试判断哪组评价更合理.(设Vi=sixi(i=1,2),Vi越小,则认为对应组评价更合理.)参考数据:0.1925 0.439,0.2325 0.482.8.8.(2023(2023广东广东统考模拟预测统考模拟预测)某工厂车间有6台相同型号的机器,各台机器相互独立工作,工作时发生故障的概率都是14,且一台机器的故障由一个维修工处理已知此厂共有甲、乙、丙3名维修工,现有两种配备方案,方案一:由甲、乙、丙三人维护,每人负责2台机器;方案二:由甲乙两人共同维护6台机器,丙负责其他工作.(1)对于方案一,设X为甲维护的机器某一时刻发生故障的台数,求X的分布列与数学期望E(X);(2)在两种方案下,分别计算某一时刻机器发生故障时不能得到及时维修的概率,并以此为依据来判断,哪种方案能使工厂的生产效率更高?79.9.(2023(2023福建福州福建福州福建省福州第一中学校考模拟预测福建省福州第一中学校考模拟预测)相关统计数据显示,中国经常参与体育锻炼的人数比例为37.2%,城乡居民达到 国民体质测定标准 合格以上的人数比例达到90%以上.某健身连锁机构对其会员的年龄等级和一个月内到健身房健身次数进行了统计,制作成如下两个统计图.图1为会员年龄分布图(年龄为整数),其中将会员按年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或40岁及以上)两类;图2为会员一个月内到健身房次数分布扇形图,其中将一个月内到健身房锻炼16次及以上的会员称为“健身达人”,15次及以下的会员称为“健身爱好者”,且已知在“健身达人”中有56是“年轻人”.(1)现从该健身连锁机构会员中随机抽取一个容量为100的样本,根据图表数据,补全22列联表,并依据小概率值=0.05的独立性检验,是否可以认为“健身达人”与年龄有关?年轻人非年轻人合计健身达人健身爱好者合计(2)该健身机构在今年年底将针对全部的150名会员举办消费返利活动,预设有如下两种方案.方案1:按分层抽样从健身爱好者和健身达人中总共抽取20位“幸运之星”给予奖励.其中,健身爱好者和健身达人中的“幸运之星”每人分别奖励500元和800元.方案2:每位会员均可参加摸奖游戏,游戏规则如下:从一个装有3个白球、2个红球(球只有颜色不同)的箱子中,有放回地摸三次球,每次只能摸一个球.若摸到红球的总数为2,则可获得100元奖励金;若摸到红球的总数为3,则可获得300元奖励金;其他情况不给予奖励.如果每位健身爱好者均可参加1次摸奖游戏;每位健身达人均可参加3次摸奖游戏(每次摸奖的结果相互独立).以方案的奖励金的数学期望为依据,请你预测哪一种方案投资较少?并说明理由.附:2=n(ad-bc)2a+bc+da+cb+d.0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828810.10.(2023(2023云南昭通云南昭通校联考模拟预测校联考模拟预测)为了检测某种抗病毒疫苗的免疫效果,需要进行临床人体试验.研究人员将疫苗注射到200名志愿者体内,一段时间后测量志愿者的某项指标值,按 0,20,20,40,40,60,60,80,80,100分组,绘制频率分布直方图如图所示.试验发现志愿者体内产生抗体的共有160人,其中该项指标值不小于60的有110人.假设志愿者注射疫苗后是否产生抗体相互独立.(1)填写下面的22列联表,并根据列联表及小概率值=0.05的独立性检验,判断能否认为注射疫苗后志愿者产生抗体与指标值不小于60有关.抗体指标值合计小于60不小于60有抗体没有抗体合计(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40名志愿者进行第二次注射疫苗,结果又有m名志愿者产生抗体.(i)用频率估计概率,已知一名志愿者注射2次疫苗后产生抗体的概率p=0.9,求m的值;()以(i)中的概率p作为人体注射2次疫苗后产生抗体的概率,再进行另一组人体接种试验,记110名志愿者注射2次疫苗后产生抗体的数量为随机变量X,求P X=k最大时的k的值.参考公式:2=n ad-bc2a+bc+da+cb+d(其中n=a+b+c+d为样本容量).0.500.400.250.150.1000.0500.025x0.4550.7081.3232.0722.7063.8415.024911.11.(2023(2023湖南长沙湖南长沙长沙市实验中学校考二模长沙市实验中学校考二模)首批全国文明典范城市将于2023年评选,每三年评选一次,2021年长沙市入选为全国文明典范城市试点城市,目前我市正全力争创首批全国文明典范城市,某学校号召师生利用周末从事创建志愿活动.高一(1)班一组有男生4人,女生2人,现随机选取2人作为志愿者参加活动,志愿活动共有交通协管员、创建宣传员、文明监督员三项可供选择,每名女生至多从中选择参加2项活动,且选择参加1项或2项的可能性均为12;每名男生至少从中选择参加2项活动,且选择参加2项或3项的可能性也均为12,每人每参加1项活动可获得综合评价10分,选择参加几项活动彼此互不影响,求:(1)在有女生参加活动的条件下,恰有一名女生的概率;(2)记随机选取的两人得分之和为X,求X的期望12.12.(2023(2023江苏南京江苏南京南京市第一中学校考模拟预测南京市第一中学校考模拟预测)为了宣传航空科普知识,某校组织了航空知识竞赛活动活动规定初赛需要从8道备选题中随机抽取4道题目进行作答假设在8道备选题中,小明正确完成每道题的概率都是34且每道题正确完成与否互不影响,小宇能正确完成其中6道题且另外2道题不能完成(1)求小明至少正确完成其中3道题的概率;(2)设随机变量X表示小宇正确完成题目的个数,求X的分布列及数学期望;(3)现规定至少完成其中3道题才能进入决赛,请你根据所学概率知识,判断小明和小宇两人中选择谁去参加市级比赛(活动规则不变)会更好,并说明理由1013.13.(2023(2023广东广东校联考模拟预测校联考模拟预测)某商场在五一假期间开展了一项有奖闯关活动,并对每一关根据难度进行赋分,竞猜活动共五关,规定:上一关不通过则不进入下一关,本关第一次未通过有再挑战一次的机会,两次均未通过,则闯关失败,且各关能否通过相互独立,已知甲、乙、丙三人都参加了该项闯关活动.(1)若甲第一关通过的概率为23,第二关通过的概率为56,求甲可以进入第三关的概率;(2)已知该闯关活动累计得分服从正态分布,且满分为450分,现要根据得分给共2500名参加者中得分前400名发放奖励.假设该闯关活动平均分数为171分,351分以上共有57人,已知甲的得分为270分,问甲能否获得奖励,请说明理由;丙得知他的分数为430分,而乙告诉丙:“这次闯关活动平均分数为201分,351分以上共有57人”,请结合统计学知识帮助丙辨别乙所说信息的真伪.附:若随机变量ZN,2,则P-X+0.6827;P-2X+20.9545;P-3X+30.9973.1114.14.(2023(2023广东韶关广东韶关统考模拟预测统考模拟预测)研究表明,如果温差本大,人们不注意保暖,可能会导致自身受到风寒刺激,增加感冒患病概率,特别是对于几童以及年老体弱的人群,要多加防范某中学数学建模社团成员研究了昼夜温差大小与某小学学生患感冒就诊人数多少之间的关系,他们记录了某六天的温差,并到校医室查阅了这六天中每天学生新增感冒就诊的人数,得到数据如下:日期第一天第二天第三天第四天第五天第六天昼夜温差x(C)47891412新增感就诊人数y(位)y1y2y3y4y5y6参考数据:6iy2i=3463,6iyi-y2=289(1)已知第一天新增感冒就的学生中有4位男生,从第一天多增的感冒就诊的学生中随机取2位,其中男生人数记为X,若抽取的2人中至少有一位女生的概率为56,求随机变量X的分布列和数学期望;(2)已知两个变量x与y之间的样本相关系数r=1617,请用最小二乘法求出y关于x的经验回归方程y=bx+a,据此估计昼夜温差为15C时,该校新增感冒就诊的学生人数.参考数据:r=nixi-xyi-yni=1xi-x2ni=1yi-y2,b=nixi-xyi-yni=1xi-x215.15.(2023(2023重庆重庆统考模拟预测统考模拟预测)某地区由于农产品出现了滞销的情况,从而农民的收入减少,很多人开始在某直播平台销售农产品并取得了不错的销售量.有统计数据显示2022年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示,若将销售主12播按照年龄分为“年轻人”(20岁39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,且“经常使用直播销售用户”中有34是“年轻人”.(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成22列联表,依据小概率值=0.05的2独立性检验,能否认为经常使用网络直播销售与年龄有关?使用直播销售情况与年龄列联表年轻人非年轻人合计经常使用直播销售用户不常使用直播销售用户合计(2)某投资公司在2023年年初准备将1000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:方案一:线下销售、根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不是不赚,且这三种情况发生的概率分别为35,15,15;方案二:线上直播销售,根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为12,310,15.针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.参考数据:独立性检验临界值表0.150.100.050.0250.0100.0050.001x2.0722.7063.8415.0246.6357.87910.828其中2=n ad-bc2a+bc+da+cb+d,n=a+b+c+d1316.16.(2023(2023河北衡水河北衡水衡水市第二中学校考三模衡水市第二中学校考三模)某医疗科研小组为研究某市市民患有疾病A与是否具有生活习惯B的关系,从该市市民中随机抽查了100人,得到如下数据:疾病A生活习惯B具有不具有患病2515未患病2040(1)依据=0.01的独立性检验,能否认为该市市民患有疾病A与是否具有生活习惯B有关?(2)从该市市民中任选一人,M表示事件“选到的人不具有生活习惯B”,N表示事件“选到的人患有疾病A”,试利用该调查数据,给出P NM的估计值;(3)从该市市民中任选3人,记这3人中具有生活习惯B,且末患有疾病A的人数为X,试利用该调查数据,给出X的数学期望的估计值附:2=n(ad-bc)2a+bc+da+cb+d,其中n=a+b+c+d0.100.050.0100.001x2.7063.8416.63510.82817.17.(2023(2023江苏扬州江苏扬州统考模拟预测统考模拟预测)随着网络技术的迅速发展,各种购物群成为网络销售的新渠道在凤梨销售旺季,某凤梨基地随机抽查了100个购物群的销售情况,各购物群销售凤梨的数量情况如下:凤梨数量(盒)100,200200,300300,400400,500500,60014购物群数量(个)12m2032m(1)求实数m的值,并用组中值估计这100个购物群销售风梨总量的平均数(盒);(2)假设所有购物群销售凤梨的数量X服从正态分布N,2,其中为(1)中的平均数,2=12100若该凤梨基地参与销售的购物群约有1000个,销售风梨的数量在 266,596(单位:盒)内的群为“一级群”,销售数量小于266盒的购物群为“二级群”,销售数量大于等于596盒的购物群为“优质群”该凤梨基地对每个“优质群”奖励1000元,每个“一级群”奖励200元,“二级群”不奖励,则该风梨基地大约需要准备多少资金?(群的个数按四舍五入取整数)附:若X服从正态分布XN,2,则P(-X+)0.683,P(-2X+2)0.954,P(-3X0,一般来说在室外温度低于10度的情况下学生去打乒乓球的概率会比室外温度不低于10度的情况下去打乒乓球的概率要大,证明:P(A|B)P(A|B).19.19.(2023(2023广东深圳广东深圳统考二模统考二模)某校体育节组织定点投篮比赛,每位参赛选手共有3次投篮机会.统计数据显示,每位选手投篮投进与否满足:若第k次投进的概率为p(0p1),当第k次投进时,第k+1次也投进的概率保持p不变;当第k次没能投进时,第k+1次能投进的概率降为p2.(1)若选手甲第1次投进的概率为p(0p1),求选手甲至少投进一次的概率;(2)设选手乙第1次投进的概率为23,每投进1球得1分,投不进得0分,求选手乙得分X的分布列与数学期望.20.20.(2023(2023湖北武汉湖北武汉华中师大一附中校考模拟预测华中师大一附中校考模拟预测)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:A区B区C区D区16外来务工人数x/万3456就地过年人数y/万2.5344.5(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程y=a+bx和A区的残差(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴若该市E区有2万名外来务工人员,根据(1)的结论估计该市政府需要给E区就地过年的人员发放的补贴总金额;若A区的外来务工人员中甲、乙选择就地过年的概率分别为p,2p-1,其中12p1,该市政府对甲、乙两人的补贴总金额的期望不超过1400元,求p的取值范围参考公式:相关系数r=ni=1xiyi-nxyni=1x2i-nx2ni=1y2i-ny2,回归方程y=a+bx中斜率和截距的最小二乘估计公式分别为b=ni=1xiyi-nxyni=1x2i-nx2,a=y-bx21.21.(2023(2023山西运城山西运城山西省运城中学校校考二模山西省运城中学校校考二模)甲乙两人进行象棋比赛,赛前每人发3枚筹码.一局后负的一方,需将自己的一枚筹码给对方;若平局,双方的筹码不动,当一方无筹码时,比赛结束,另一方最终获胜.由以往两人的比赛结果可知,在一局中甲胜的概率为0.3乙胜的概率为0.2.17(1)第一局比赛后,甲的筹码个数记为X,求X的分布列和期望;(2)求四局比赛后,比赛结束的概率;(3)若Pii=0,1,6表示“在甲所得筹码为i枚时,最终甲获胜的概率”,则P0=0,P6=1.证明:Pi+1-Pii=0,1,2,5为等比数列.22.22.(2023(2023湖北襄阳湖北襄阳襄阳四中校考三模襄阳四中校考三模)为倡导公益环保理念,培养学生社会实践能力,某中学开展了旧物义卖活动,所得善款将用于捐赠“圆梦困境学生”计划.活动共计50多个班级参与,1000余件物品待出售.摄影社从中选取了20件物品,用于拍照宣传,这些物品中,最引人注目的当属优秀毕业生们的笔记本,已知高三1,2,3班分别有12,13,14的同学有购买意向.假设三个班的人数比例为6:7:8.(1)现从三个班中随机抽取一位同学:(i)求该同学有购买意向的概率;(ii)如果该同学有购买意向,求此人来自2班的概率;(2)对于优秀毕业生的笔记本,设计了一种有趣的“掷骰子叫价确定购买资格”的竞买方式:统一以0元为初始叫价,通过掷骰子确定新叫价,若点数大于2,则在已叫价格基础上增加1元更新叫价,若点数小于3,则在已叫价格基础上增加2元更新叫价;重复上述过程,能叫到10元,即获得以10元为价格的购买资格,未出现叫价为10元的情况则失去购买资格,并结束叫价.若甲同学已抢先选中了其中一本笔记本,试估计其获得该笔记本购买资格的概率(精确到0.01).23.23.(2023(2023广东茂名广东茂名统考二模统考二模)春节过后,文化和旅游业逐渐复苏,有意跨省游、出境游的旅客逐渐增多.某旅游景区为吸引更多游客,计划在社交媒体平台和短视频平台同时投放宣传广告并进行线上售票,通过近18些年的广告数据分析知,一轮广告后,在短视频平台宣传推广后,目标用户购买门票的概率为29,在社交媒体平台宣传推广后,目标用户购买门票的概率为q;二轮广告精准投放后,目标用户在短视频平台进行复购的概率为p,在社交媒体平台复购的概率为1727.(1)记在短视频平台购票的4人中,复购的人数为X,若D X=34,试求X的分布列和期望;(2)记在社交媒体平台的3名目标用户中,恰有1名用户购票并复购的概率为P,当P取得最大值时,q为何值?(3)为优化成本,该景区决定综合渠道投放效果的优劣,进行广告投放战略的调整.已知景区门票100元/人,在短视频平台和社交媒体平台的目标用户分别在90万人和17万人左右,短视频平台和社交媒体平台上的广告投放费用分别为4元/100人和5元/100人,不计宣传成本的景区门票利润率分别是2%和5%,在第(2)问所得q值的基础上,试分析第一次广告投放后,景区在两个平台上的目标用户身上可获得的净利润总额.24.24.(2023(2023全国全国模拟预测模拟预测)甲袋中装有3个红球,2个白球,乙袋中装有5个红球,5个白球,两个袋子均不透明,其中的小球除颜色外完全一致.现从甲袋中一次性抽取2个小球,记录颜色后放入乙袋,混匀后从乙袋一次性抽取3个小球,记录颜色.设随机变量X表示在甲袋中抽取出的红球个数,Y k表示X=k时,在乙袋中抽取出的红球个数,Z表示在乙袋中抽取出的红球个数.(1)求X的分布列;(2)求Y k的数学期望E Y k(用含k的代数式表示);(3)记X的所有可取值为a1,a2,an,证明:E Z=nk=1pX=akE Y ak,并求E Z.25.25.(2023(2023河北河北统考模拟预测统考模拟预测)为切实做好新冠疫情防控工作,有效、及时地控制和消除新冠肺炎的危害,增加学生对新冠肺炎预防知识的了解,某校举办了一次“新冠疫情”知识竞赛.竞赛分个人赛和团体赛两19种.个人赛参赛方式为:组委会采取电脑出题的方式,从题库中随机出10道题,编号为A1,A2,A3,A4,A10,电脑依次出题,参赛选手按规则作答,每答对一道题得10分,答错得0分.团体赛以班级为单位,各班参赛人数必须为3的倍数,且不少于18人,团体赛分预赛和决赛两个阶段,其中预赛阶段各班可从以下两种参赛方案中任选一种参赛:方案一:将班级选派的3n名参赛选手每3人一组,分成n组,电脑随机分配给同一组的3名选手一道相同的试题,3人均独立答题,若这3人中至少有2人回答正确,则该小组顺利出线;若这n个小组都顺利出线,则该班级晋级决赛.方案二:将班级选派的3n名参赛选手每n人一组,分成3组,电脑随机分配给同一组的n名选手一道相同的试题,每人均独立答题,若这n个人都回答正确,则该小组顺利出线;若这3个小组中至少有2个小组顺利出线,则该班级晋级决赛.(1)郭靖同学参加了个人赛,已知郭靖同学答对题库中每道题的概率均为45,每次作答结果相互独立,且他不会主动放弃任何一次作答机会,求郭靖同学得分的数学期望与方差;(2)在团体赛预赛中,假设A班每位参赛选手答对试题的概率均为常数p 0p1,A班为使晋级团体赛决赛的可能性更大,应选择哪种参赛方式?请说明理由.26.26.(2023(2023安徽黄山安徽黄山屯溪一中校考模拟预测屯溪一中校考模拟预测)现有一种不断分裂的细胞X,每个时间周期T内分裂一次,一个X细胞每次分裂能生成一个或两个新的X细胞,每次分裂后原X细胞消失,设每次分裂成一个新X细胞的概率为p,分裂成两个新X细胞的概率为1-p;新细胞在下一个周期T内可以继续分裂,每个细胞间相互独立.设有一个初始的X细胞,在第一个周期T中开始分裂,其中p12,1.(1)设2T结束后,X细胞的数量为,求的分布列和数学期望;(2)设nT nN*结束后,X细胞数量为m的概率为 Pmn.(i)求P2n;(ii)证明:P3n827p2.27.27.(2023(2023山东潍坊山东潍坊统考模拟预测统考模拟预测)2023年3月某学校举办了春季科技体育节,其中安排的女排赛事共有12个班级作为参赛队伍,本次比赛启用了新的排球用球MIKASA_V200W已知这种球的质量指标(单20位:g)服从正态分布XN,2,其中=270,=5.比赛赛制采取单循环方式,即每支球队进行11场比赛,最后靠积分选出最后冠军,积分规则如下(比赛采取5局3胜制):比赛中以3:0或3:1取胜的球队积3分,负队积0分;而在比赛中以3:2取胜的球队积2分,负队积1分.9轮过后,积分榜上的前2名分别为1班排球队和2班排球队,1班排球队积26分,2班排球队积22分.第10轮1班排球队对抗3班排球队,设每局比赛1班排球队取胜的概率为p 0p1.(1)令=-,则N 0,1,且 a=P a,求-2,并证明:-2+2=1;(2)第10轮比赛中,记1班排球队3:1取胜的概率为 f p,求出 f p的最大值点p0,并以p0作为p的值,解决下列问题.()在第10轮比赛中,1班排球队所得积分为X,求X的分布列;()已知第10轮2班排球队积3分,判断1班排球队能否提前一轮夺得冠军(第10轮过后,无论最后一轮即第11轮结果如何,1班排球队积分最多)?若能,求出相应的概率;若不能,请说明理由.参考数据:XN,2,则P-X+0.6827,P-2X+20.9545,P-30,均有P XE X,马尔科夫不等式给出了随机变量取值不小于某正数的概率上界,阐释了随机变量尾部取值概率与其数学期望间的关系当X为非负离散型随机变量时,马尔科夫不等式的证明如下:设X的分布列为P X=xi=pi,i=1,2,n,其中pi(0,+),xi0,+)(i=1,2,n),ni=1pi=1,则对任意0,P(X)=xipixixipi=1xixipi1ni=1xipi=E(X),其中符号xiAi表示对所有满足xi的指标i所对应的Ai求和切比雪夫不等式的形式如下:设随机变量X的期望为E X,方差为D X,则对任意0,均有P X-E XD X2(1)根据以上参考资料,证明切比雪夫不等式对离散型随机变量X成立(2)某药企研制出一种新药,宣称对治疗某种疾病的有效率为80%现随机选择了100名患者,经过使用该药治疗后,治愈的人数为60人,请结合切比雪夫不等式通过计算说明药厂的宣传内容是否真实可信30.30.(2023(2023福建福州福建福州福建省福州第一中学校考模拟预测福建省福州第一中学校考模拟预测)某知识测试的题目均为多项选择题,每道多项选择题有A,B,C,D这4个选项,4个选项中仅有两个或三个为正确选项.题目得分规则为:全部选对的得235分,部分选对的得2分,有选错的得0分.已知测试过程中随机地从四个选项中作选择,每个选项是否为正确选项相互独立.若第一题正确选项为两个的概率为13,并且规定若第i i=1,2,n-1题正确选项为两个,则第i+1题正确选项为两个的概率为13;第i i=1,2,n-1题正确选项为三个,则第i+1题正确选项为三个的概率为13.(1)若第二题只选了“C”一个选项,求第二题得分的分布列及期望;(2)求第n题正确选项为两个的概率;(3)若第n题只选择B、C两个选项,设Y表示第n题得分,求证:E Y1718.1概率统计大题综合概率统计大题综合知识点总结知识点总结1.1.数字样本特征(1)众数:在一组数据中出现次数最多的数(2)中位数:将一组数据按从小到大(或从大到小)的顺序排列,如果为奇数个,中位数为中间数;若为偶数个,中位数为中间两个数的平均数(3)平均数:x=x1+x2+xnn,反映样本的平均水平(4)方差:s2=(x1x)2+(x2x)2+(xnx)2n反映样本的波动程度,稳定程度和离散程度;s2越大,样本波动越大,越不稳定;s2越小,样本波动越小,越稳定;(5)标准差:=s2,标准差等于方差的算术平方根,数学意义和方差一样(6)极差:等于样本的最大值最小值2.2.求随机变量X的分布列的步骤:(1)理解X的意义,写出X可能取得全部值;(2)求X取每个值的概率;(3)写出X的分布列;(4)根据分布列的性质对结果进行检验.还可判断随机变量满足常见分布列:两点分布,二项分布,超几何分布,正态分布.3.3.求随机变量的期望和方差的基本方法:(1)已知随机变量的分布列,直接利用期望和方差公式直接求解;(2)已知随机变量 X 的期望、方差,求 aX+b a,bR的期望与方差,利用期望和方差的性质E aX+b=aE X+b,D aX+b=a2D X进行计算;(3)若能分析出所给的随机变量服从常用的分布(如:两点分布、二项分布等),可直接利用常用分布列的期望和方差公式进行计算,若B(n,p),则E=np,D=np(1-p).4.4.求解概率最大问题的关键是能够通过P=kP=k+1P=kP=k-1 构造出不等关系,结合组合数公式求解结果5.5.线性回归分析解题方法:(1)计算x,y,ni=1xi2,ni=1xiyi的值;(2)计算回归系数a,b;(3)写出回归直线方程y=bx+a.线性回归直线方程为:y=bx+a,b=ni=1xixyiyni=1xix2=ni=1xiyinxyni=1xi2nx2,a=ybx其中 x,y为样本中心,回归直线必过该点2(4)线性相关系数(衡量两个变量之间线性相关关系的强弱)r=ni=1xixyiyni=1xix2ni=1yiy2=ni=1xiyinxyni=1xi2nx2ni=1yi2ny2r0,正相关;r5.024P K25.024=0.025,认为“药物对预防疾病有效”犯错误的概率是2.5%5(3)根据题意,10只未患病动物中,有6只服用药物,4只未服用药物,所以的值可能为0,1,2,3,4,则P(=0)=C46C410=15210,P(=1)=C36C14C410=80210,P(=2)=C26C24C410=90210,P(=3)=C16C34C410=24210,P(=4)=C44C410=1210,的分布列如下:01234P152108021090210242101210则E()=015210+180210+290210+324210+41210=1.64.4.(2023(2023江苏常州江苏常州校考一模校考一模)设 X,Y是一个二维离散型随机变量,它们的一切可能取的值为 ai,bj,其中i,jN N*,令pij=P X=ai,Y=bj,称piji,jN N*是二维离散型随机变量 X,Y的联合分布列,与一维的情形相似,我们也习惯于把二维离散型随机变量的联合分布列写成下表形式;X,Yb1b2b3a1p11p12p13a2p21p22p23a3p31p32p33现有n nN N*个球等可能的放入编号为1,2,3的三个盒子中,记落入第1号盒子中的球的个数为X,落入第2号盒子中的球的个数为Y(1)当n=2时,求 X,Y的联合分布列,并写成分布表的形式;(2)设pk=nm=0P X=k,Y=m,kN N且kn,求nk=0kpk的值(参考公式:若XB n,p,则nk=0kCknpk1-pn-k=np)【答案】(1)答案见解析(2)n3【分析】(1)X的取值为0,1,2,Y的取值为0,1,2,分别计算概率即可;(2)计算得 pk=Ckn13k23n-k,则nk=0kpk=nk=0kCkn13k23n-k,最后利用二项分布的期望公式即可得到答案.【详解】(1)若n=2,X的取值为0,1,2,Y的取值为0,1,2,则P X=0,Y=0=132=19,P X=0,Y=1=C121313=29,P X=0,Y=2=132=19,P X=1,Y=0=C121313=29,P X=1,Y=1=C121313=29,P X=2,Y=0=132=19,6P X=1,Y=2=P X=2,Y=1=P X=2,Y=2=0,故 X,Y的联合分布列为X,Y012019291912929021900(2)当k+mn时,P X=k,Y=m=0,故pk=nm=0P X=k,Y=m=n-km=0P X=k,Y=m=n-km=0P CknCmn-k13n=Ckn3nn-km=0Cmn-k=Ckn3n2n-k=Ckn13k23n-k所以nk=0kpk=nk=0kCkn13k23n-k,由二项分布的期望公式可得nk=0kpk=n35.5.(2023(2023江苏南京江苏南京南京市第九中学校考模拟预测南京市第九中学校考模拟预测)某种疾病可分为A,B两种类型,为了解该疾病的类型与患者性别是否相关,在某地区随机抽取了若干名该疾病的患者进行调查,发现女性患者人数是男性患者的2倍,男性患A型疾病的人数占男性患者的56,女性患A型疾病的人数占女性患者的13.A型病B型病合计男女合计(1)填写22列联表,若本次调查得出“在犯错误的概率不超过0.005的前提下认为 所患疾病的类型与性别有关”的结论,求被调查的男性患者至少有多少人?(2)某团队进行预防A型疾病的疫苗的研发试验,试验期间至多安排2个周期接种疫苗,每人每个周期接种3次,每次接种费用为m m0元.该团队研发的疫苗每次接种后产生抗体的概率为p 0p7.879,解得x11.8185,因为x6Z,x3Z,所以x的最小整数值为12,因此,男性患者至少有12人.(2)设该试验每人的接种费用为元,则的可能取值为3m,6m.则P=3m=C23p21-p+p3=-2p3+3p2,P=6m=1+2p3-3p2,所以E=3m-2p3+3p2+6m 1+2p3-3p2=3m 2p3-3p2+2,因为p=23,试验人数为1000人,所以该试验用于接种疫苗的总费用为1000E,所以10003m 2233-3232+2=340009m元.6.6.(2023(2023安徽蚌埠安徽蚌埠统考三模统考三模)某校为了丰富学生课余生活,组建了足球社团.为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各100名进行调查,部分数据如表所示:喜欢足球不喜欢足球合计男生40女生30合计(1)根据所给数据完成上表,依据=0.001的独立性检验,能否认为该校学生喜欢足球与性别有关?(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球射门.已知这两名男生进球的概率均为23,这名女生进球的概率为12,每人射门一次,假设各人射门相互独立,求3人进球总次数X的分布列和数学期望.附:2=n ad-bc2a+bc+da+cb+d0.10.050.010.0050.001x2.7063.8416.6357.87910.828【答案】(1)有99.9%的把握认为该校学生喜欢足球与性别有关;8(2)分布列见解析,数学期望为116.【分析】(1)完善列联表,计算 2的观测值,再与临界值表比对作答.(2)求出X的可能值,求出各个值对应的概率,列出分布列并求出期望作答.【详解】(1)依题意,22列联表如下:喜欢足球不喜欢足球合计男生6040100女生3070100合计90110200零假设H0:该校学生喜欢足球与性别无关,2的观测值为 2=200(6070-3040)21001009011018.18210.828=x0.001,根据小概率值=0.001的独立性检验,推断H0不成立,所以有99.