2024步步高考二轮数学新教材讲义专题五 第3讲 统计与成对数据的分析11.docx
2024步步高考二轮数学新教材讲义第3讲统计与成对数据的分析考情分析高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度考点一统计图表、数字特征核心提炼1频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率组距×.2在频率分布直方图中各小长方形的面积之和为1.3利用频率分布直方图求众数、中位数与平均数(1)最高的小长方形底边中点的横坐标即众数(2)中位数左边和右边的小长方形的面积和相等(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和例1(1)(多选)(2023·海南模拟)为了向社会输送优秀毕业生,中等职业学校越来越重视学生的实际操作(简称实操)能力的培养中职生小王在对口工厂完成实操产品100件,质检人员测量其质量(单位:克),将所得数据分成5组:95,97),97,99),99,101),101,103),103,105根据所得数据制成如图所示的频率分布直方图,其中质量在99,101)内的为优等品对于这100件产品,下列说法正确的是()A质量的平均数为99.7克(同一区间的平均数用区间中点值代替)B优等品有45件C质量的众数在区间98,100)内D质量的中位数在区间99,101)内(2)(多选)(2023·新高考全国)有一组样本数据x1,x2,x6,其中x1是最小值,x6是最大值,则()Ax2,x3,x4,x5的平均数等于x1,x2,x6的平均数Bx2,x3,x4,x5的中位数等于x1,x2,x6的中位数Cx2,x3,x4,x5的标准差不小于x1,x2,x6的标准差Dx2,x3,x4,x5的极差不大于x1,x2,x6的极差易错提醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义(2)频率分布直方图中纵坐标不要误以为是频率跟踪演练1(1)(多选)(2023·盐城模拟)随机抽取6位影迷对某电影的评分,得到一组样本数据如下:92,93,95,95,97,98,则下列关于该样本的说法中正确的有()A平均数为95 B极差为6C方差为26 D第80百分位数为97(2)(2023·葫芦岛模拟)游戏对青少年的影响巨大某市青少年健康管理委员会对该市下学年度青少年上网打游戏的情况进行统计,作出如图所示的人数变化走势图根据该走势图,下列结论正确的是()A这半年中,青少年上网打游戏的人数呈周期性变化B这半年中,青少年上网打游戏的人数不断减少C从青少年上网打游戏的人数来看,10月份的方差小于11月份的方差D从青少年上网打游戏的人数来看,12月份的平均数大于1月份的平均数考点二回归分析核心提炼求经验回归方程的步骤(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略)(2)计算出,.(3)写出经验回归方程例2(2023·唐山模拟)据统计,某城市居民年收入(所有居民在一年内收入的总和,单位:亿元)与某类商品销售额(单位:亿元)的10年数据如下表所示:第n年12345678910居民年收入x32.231.132.935.737.138.039.043.044.646.0商品销售额y25.030.034.037.039.041.042.044.048.051.0依据表格数据,得到下面一些统计量的值ii(xi)2(yi)2(xi)·(yi)379.6391246.904568.9m(1)根据表中数据,得到样本相关系数r0.95.以此推断,y与x的线性相关程度是否很强?(2)根据统计量的值与样本相关系数r0.95,建立y关于x的经验回归方程(系数精确到0.01);(3)根据(2)的经验回归方程,计算第1个样本点(32.2,25.0)对应的残差(精确到0.01);并判断若剔除这个样本点再进行回归分析,的值将变大还是变小?(不必说明理由,直接判断即可)附:样本相关系数r,1.518,._易错提醒(1)样本点不一定在经验回归直线上,但点(,)一定在经验回归直线上(2)求时,灵活选择公式,注意公式的推导和记忆(3)利用样本相关系数判断相关性强弱时,看|r|的大小,而不是r的大小(4)区分样本相关系数r与决定系数R2.(5)通过经验回归方程求的都是估计值,而不是真实值跟踪演练2(2023·雅安模拟)2023年5月17日,318·川藏线零公里自驾游大本营旅游推介暨“5·17我要骑”雅安站活动在雨城区拉开帷幕,318·川藏线零公里自驾游大本营再次成为关注焦点.318·川藏线零公里自驾游大本营项目以“此生必驾318,首站打卡在雅安”,“世界第三极,雅安零公里”的交旅IP为文化指引,利用雅安交通区位和品牌资源优势,创新打造吸引力体验项目,提高雅安川藏游的话语权和影响力近段时间某骑行爱好者在专业人士指导下对骑行情况进行了统计,各次骑行期间的身体综合指标评分x与对应用时y(单位:小时)如表:身体综合指标评分(x)12345用时(y/小时)9.58.67.876.1(1)由上表数据看出,可用线性回归模型拟合y与x的关系,请用样本相关系数加以说明;(2)建立y关于x的经验回归方程参考数据和参考公式:样本相关系数r,84._考点三独立性检验核心提炼独立性检验的一般步骤(1)根据样本数据列2×2列联表(2)根据公式2,计算2的值(3)查表比较2与临界值的大小关系,作统计判断2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大例3我国综合性太阳探测专用卫星“夸父一号”是中国科学院空间科学二期先导专项研制的一颗空间科学卫星,卫星以“一磁两暴”为科学目标,即同时观测太阳磁场和太阳上两类最剧烈的爆发现象耀斑和日冕物质抛射某学校为了解该校某兴趣小组对“夸父一号”探测卫星相关知识是否感兴趣,对该兴趣小组的100位学生进行了问卷调查,已知被调查学生中男生占调查人数的55%,其中感兴趣的有45人,余下的不感兴趣,在被调查的女生中,感兴趣的有20人,其余人不感兴趣(1)请补充完整2×2列联表,并依据小概率值0.005的独立性检验,能否认为对“夸父一号”探测卫星相关知识感兴趣与学生的性别有关联?感兴趣不感兴趣合计男生女生合计(2)从兴趣小组100人中任选1人,A表示事件“选到的人是男生”,B表示事件“选到的人对夸父一号探测卫星相关知识不感兴趣”,求P(B|A);(3)按随机抽样的方法从感兴趣的学生中抽取4名男生和3名女生,组成一个容量为7的样本,再从抽取的7人中随机抽取3人,随机变量X表示3人中女生的人数,求X的分布列和均值附:参考公式:2,其中nabcd.临界值表:0.150.100.050.010.005x2.0722.7063.8416.6357.879_易错提醒(1)2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性(2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.跟踪演练3(2023·湖南四大名校联考)某学校有A,B两家餐厅,王同学第1天午餐时随机选择一家餐厅用餐如果第1天去A餐厅,那么第2天去A餐厅的概率为0.6;如果第1天去B餐厅,那么第2天去A餐厅的概率为0.8.(1)求王同学第2天去A餐厅用餐的概率;如果王同学第2天去A餐厅用餐,求他第1天在A餐厅用餐的概率;(2)A餐厅对就餐环境、菜品种类与品质等方面进行了改造与提升,改造提升后,A餐厅对就餐满意程度进行了调查,统计了100名学生的数据,如表(单位:人)就餐满意程度A餐厅改造提升情况合计改造提升前改造提升后满意285785不满意12315合计4060100依据小概率值0.005的独立性检验,能否认为学生对于A餐厅的满意程度与餐厅的改造提升有关联?附:2,其中nabcd.0.10.050.010.005x2.7063.8416.6357.879_规范答题5概率与统计(12分)(2023·新高考全国)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.(1)求第2次投篮的人是乙的概率;(2)求第i次投篮的人是甲的概率;切入点:pi1与pi之间的关系(3)已知:若随机变量Xi服从两点分布,且P(Xi1)1P(Xi0)qi,i1,2,n,则E(i)i.记前n次(即从第1次到第n次投篮)中甲投篮的次数为Y,求E(Y)关键点:利用给出的公式i解(1)记“第i次投篮的人是甲”为事件Ai,“第i次投篮的人是乙”为事件Bi,(1分)所以0.5×(10.6)0.5×0.80.6.(3分)(2)设P(Ai)pi,依题可知,P(Bi)1pi,(5分)构造等比数列pi,设pi1(pi),解得,则pi1,(7分)又p1,p1,所以是首项为,公比为的等比数列,即pi×i1,pi×i1. (9分)(3)因为pi×i1,i1,2,n,所以当nN*时,E(Y)p1p2pn×,故E(Y).(12分)处写出P(B2)的概率计算公式处写出P(Ai1)的概率计算公式处写出pi1与pi的关系处构造出等比数列处计算出pi处利用题干结论计算E(Y)培优点6概率与统计的创新题型概率与统计问题在近几年的高考中背景取自现实,题型新颖,综合性增强,难度加深,主要考查学生的阅读理解能力和数据分析能力要从已知数表、题干信息中经过阅读分析判断获取关键信息,搞清各数据、各事件间的关系,建立相应的数学模型求解考点一概率和数列的综合问题例1(2023·晋中模拟)晋中市是晋商文化的发源地,且拥有丰富的旅游资源,其中有保存完好的大院人文景观(如王家大院,常家庄园等),也有风景秀丽的自然景观(如介休绵山,石膏山等)某旅行团带游客来晋中旅游,游客可自由选择人文景观和自然景观中的一处游览若每位游客选择人文景观的概率是,选择自然景观的概率为,游客之间选择意愿相互独立(1)从游客中随机选取5人,记5人中选择人文景观的人数为X,求X的均值与方差;(2)现对游客进行问卷调查,若选择人文景观记2分,选择自然景观记1分,记已调查过的累计得分为n分的概率为Pn,求Pn._规律方法概率问题与数列的交汇,综合性较强,主要有以下类型:(1)求通项公式:关键是找出概率Pn或均值E(Xn)的递推关系式,然后根据构造法(一般构造等比数列),求出通项公式(2)求和:主要是数列中的倒序相加法求和、错位相减法求和、裂项相消法求和(3)利用等差、等比数列的性质,研究单调性、最值或求极限跟踪演练1(2023·邯郸模拟)某市为了让广大市民更好地了解并传承成语文化,当地文旅局拟举办猜成语大赛比赛共设置n道题,参加比赛的选手从第一题开始答题,一旦答错则停止答题,否则继续,直到答完所有题目设某选手答对每道题的概率均为p(0<p<1),各题回答正确与否相互之间没有影响(1)记答题结束时答题个数为X,当n3时,若E(X)>1.75,求p的取值范围;(2)记答题结束时答对题的个数为Y,求E(Y);当p时,求使E(Y)>4的n的最小值参考数据:lg 20.301,lg 30.477._考点二概率和函数的综合问题例2(2023·淮北模拟)社会人口学是研究人口因素对社会结构和社会发展的影响和制约的一门社会学分支学科其基本内容包括:人口作为社会变动的原始依据的探讨,将人口行为作为引起社会体系特征变动的若干因素中的一个因素来研究根据社会人口学研究发现,一个家庭有个孩子(仅考虑不超过3个孩子家庭)的分布列为:1230Pmm(1p)m(1p)2其中m>0,0<p<1,每个孩子的性别是男孩还是女孩的概率均为且相互独立,记A表示事件“一个家庭有i个孩子(i0,1,2,3)”,B表示事件“一个家庭的男孩比女孩多(若一个家庭只有一个孩子且恰为男孩,则该家庭男孩多)”(1)若p,求P(B);(2)参数p受到各种因素的影响(如生育保险的增加,教育、医疗福利的增加等),通过改变参数p的值来调控未来人口结构若希望P(2)增大,如何调控p的值?参考公式:P(M|N),P(M)(M|Nk)P(Nk)_规律方法构造函数求最值时,要注意变量的选取,以及变量自身的隐含条件对变量范围的限制跟踪演练2(2023·浙江金丽衢十二校联考)某公司生产一种大件产品的日产为2件,每件产品质量为一等的概率为0.5,二等的概率为0.4,若达不到一、二等,则为不合格,且生产两件产品品质结果相互独立已知生产一件产品的利润如下表:等级一等二等三等利润(万元/每件)0.80.60.3(1)求生产两件产品中至少有一件一等品的概率;(2)求该公司每天所获利润(万元)的均值;(3)若该工厂要增加日产量,需引入设备及更新技术,但增加n件,其成本也将相应提升nln n(万元),假如你作为工厂决策者,你觉得该厂目前该不该增产?请回答,并说明理由(ln 20.69,ln 31.1)_第3讲统计与成对数据的分析例1(1)ABD对于选项A,质量的平均数为(96×0.02598×0.15100×0.225102×0.075104×0.025)×299.7(克),选项A正确;对于选项B,优等品有0.225×2×10045(件),选项B正确;对于选项C,质量的众数不一定落在区间98,100)内,所以选项C错误;对于选项D,质量在99,101)内的有45件,质量在101,103)内的有15件,质量在103,105内的有5件,所以质量的中位数一定落在区间99,101)内,所以选项D正确(2)BD取x11,x2x3x4x52,x69,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,x6的平均数等于3,标准差为,故A,C均不正确;根据中位数的定义,将x1,x2,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,x6的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,x6的极差,故D正确跟踪演练1(1)ABD(2)D例2解(1)根据样本相关系数r0.95,可以推断y与x的线性相关程度很强(2)由r0.95及,可得 ,所以r0.95×1.5181.442,又因为37.96,39.1,所以15.64,所以y关于x的经验回归方程为1.44x15.64.(3)第一个样本点(32.2,25.0)的残差为25.0(1.44×32.215.64)5.7285.73,由于该点在经验回归直线的左下方,故将其剔除后,的值将变小跟踪演练2解(1)3,7.8,(xi)2(13)2(23)2(33)2(43)2(53)21