2024年高考数学概率论专题1 线性回归方程.pdf
《2024年高考数学概率论专题1 线性回归方程.pdf》由会员分享,可在线阅读,更多相关《2024年高考数学概率论专题1 线性回归方程.pdf(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、专题1 1 线性回归方程1.蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率 x(每分钟鸣叫的次数)与气温 y(单位:C)存在着较强的线性相关关系某地观测人员根据如表的观测数据,建立了 y 关于 x 的线性回归方程y=0.25x+,则当蟋蟀每分钟鸣叫56次时,该地当时的气温预报值为()x(次数/分钟)2030405060y(C)2527.52932.536A.33CB.34CC.35CD.35.5C【解析】解:由题意,得x=20+30+40+50+605=40,y=25+27.5+29+32.5+365=30,则=y-0.25x=30-0.2540=20;当x=56时,y=34故选
2、:B2.已知下列说法:对于线性回归方程y=3-5x,变量x增加一个单位时,y平均增加5个单位;在线性回归模型中,相关指数R2越接近于1,则模型回归效果越好;两个随机变量的线性相关性越强,则相关系数就越接近1;互斥事件不一定是对立事件,对立事件一定是互斥事件;演绎推理是从特殊到一般的推理,它的一般模式是“三段论”其中说法错误的个数为()A.1B.2C.3D.4【解析】解:对于线性回归方程y=3-5x,变量x增加一个单位时,y平均减少5个单位,故不正确;在线性回归模型中,相关指数R2越接近于1,则模型回归效果越好,故正确;两个随机变量的线性相关性越强,则相关系数的绝对值就越接近1,故不正确;互斥事
3、件不一定是对立事件,对立事件一定是互斥事件,所以正确;演绎推理是从一般到特殊的推理,它的一般模式是“三段论”所以不正确;故选:C3.变量 x,y 之间的一组相关数据如表所示:若 x,y 之间的线性回归方程为 y=bx+12.28,则 b的值为()x4567y8.27.86.65.4A.-0.92B.-0.94C.-0.96D.-0.98【解析】解:x=4+5+6+74=5.5,y=8.2+7.8+6.6+5.44=7,则样本点的中心的坐标为(5.5,7),代入y=bx+12.28,得7=5.5b+12.28,则b=-0.96故选:C4.我国5G技术研发试验在2016-2018年进行,分为5G关
4、键技术试验、5G技术方案验证和5G系统验证三个阶段实施 2020 年初以来,5G技术在我国已经进入高速发展的阶段,5G手机的销量也逐渐上升,某手机商城统计了近5个月来5G手机的实际销量,如表所示:月份2020年6月2020年7月2020年8月2020年9月2020年10月月份编号x123452024年高考数学概率论专题1 线性回归方程销量y/部5096a185227若y与x线性相关,且求得线性回归方程为y=45x+5,则下列说法正确的是()A.a=142B.y与x正相关C.y与x的相关系数为负数D.12月份该手机商城的5G手机销量约为365部【解析】解:根据表中数据,可得x=1+2+3+4+5
5、5=3,y=453+5=140,于是,50+96+a+185+227=1405=700,即a=142,故A正确;由回归方程中x的系数大于0,可知y与x正相关,且相关系数r0,故B正确,C错误;12月份时,x=7,y=457+5=320部,故D错误故选:AB5.已知x与y之间的一组数据:x0123ym35.57已求得关于y与x的线性回归方程y=2.3x+0.85,则m的值为0.5【解析】解:x=0+1+2+34=32,y=m+3+5.5+74=m+15.54,这组数据的样本中心点是32,m+15.54,关于y与x的线性回归方程y=2.1x+0.85,m+15.54=2.132+0.85,解得m=
6、0.5,m的值为0.5故答案为:0.56.邢台市物价部门对市区的天一城、北国商城、恒大城、家乐园、中北世纪城 5 家商场的某件商品在 7 月 15号一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如表所示:价格x8.59m1111.5销售量y12n675已知销售量y与价格x之间有较强的线性相关关系,其线性回归方程是y=-3.2x+40,且m+n=20,则其中的m=10【解析】解:依题意x=40+m5,y=30+n5,代入回归直线方程得30+n5=-3.240+m5+40,根据题意m+n=20,解组成的方程组得m=n=10,故答案为:107.已知一组数据点:xx1x2x8
7、yy1y2y8用最小二乘法得到其线性回归方程为y=-2x+4,若数据x1,x2,x8的平均数为1,则8i=1yi=16【解析】解:由题意,x=1,设样本点的中心为(1,y),又线性回归方程为y=-2x+4,则y=-21+4=2,8i=1yi=82=16故答案为:168.垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理某市为调査产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据(xi,yi)(i=1,2,20),其中xi和yi分别表示第i个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得20i
8、=1xi=80,20i=1yi=4000,20i=1(xi-x)2=80,20i=1(yi-y)2=8000,20i=1(xi-x)(yi-y)=7000(1)请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合;(2)求y关于x的线性回归方程;(3)某科研机构研发了两款垃圾处理机器,如表是以往两款垃圾处理机器的使用年限(整年)统计表:使用年限台数款式1年2年3年4年5年甲款520151050乙款152010550某环保机构若考虑购买其中一款垃圾处理器,以使用年限的频率估计概率根据以往经验估计,该机构选择购买哪一款垃圾处理机器,才能使用更长久?参考公式:相关系数r=ni=1(xi
9、-x)(yi-y)ni=1(xi-x)ni=1(yi-y)2对于一组具有线性相关关系的数据(xi,yi)(i=1,2,n),其回归直线y=bx+a的斜率和截距的最小二乘估计分别为:b=ni=1(xi-x)(yi-y)ni=1(xi-x)2,a=y-bx【解析】解:(1)由题意知相关系数r=20i=1(xi-x)(yi-y)20i=1(xi-x)220i=1(yi-y)2=700808000=78=0.875,因为y与x的相关系数接近1,所以y与x之间具有较强的线性相关关系,可用线性回归模型进行拟合(2)由题意可得,b=20i=1(xi-x)(yi-y)20i=1(xi-x)2=70080=8.
10、75,a=y-bx=400020-8.75 8020=200-8.754=165,所以y=8.75x+165(3)以频率估计概率,购买一台甲款垃圾处理机器节约政府支持的垃圾处理费用 X(单位:万元)的分布列为X-50050100P0.10.40.30.2E(X)=-500.1+00.4+500.3+1000.2=30(万元)购买一台乙款垃圾处理机器节约政府支持的垃圾处理费用Y(单位:万元)的分布列为:Y-302070120P0.30.40.20.1E(Y)=-300.3+200.4+700.2+1200.1=25(万元)因为E(X)E(Y),所以该县城选择购买一台甲款垃圾处理机器更划算9.近年
11、来,高铁的发展逐渐改变了人们的出行方式,我国2015-2019年高铁运营里程的数据如表所示年份20152016201720182019年份代码x12345高铁运营里程y(万千米)1.92.22.52.93.5()求y关于x的线性回归方程;()每一年与前一年的高铁运营里程之差即为该年新增的里程,若用 20162019年每年新增里程的频率代替之后每年新增相应里程的概率,求2023年中国高铁运营里程大于或等于5万千米的概率附:线性回归方程y=a+bx中斜率和截距的最小二乘估计公式分别为:b=ni=1xiyi-nxyni=1xi2-nx2,a=y-bx【解析】解:()x=15(1+2+3+4+5)=3
12、,y=15(1.9+2.2+2.5+2.9+3.5)=2.6,5i=1xiyi=11.9+22.2+32.5+42.9+53.5=42.9,5i=1xi2=1+4+9+16+25=55,b=42.9-532.655-532=0.39,a=2.6-0.393=1.43y关于x的线性回归方程为:y=0.39x+1.43()设每年新增高铁运营里程为x万千米,由条件知X的分布列为:X0.30.40.6P121414若2023年中国高铁运营里程小于5万平方千米,则20202023年每年新增的高铁运营里程有三种情况:0.34,0.33+0.4,0.32+0.42,相应的概率为P=124+C1412314+
13、C24122142=9322023年中国高铁运营里程大于或等于5万千米的概率为93210.某地区2013年至2019年居民纯收入y(单位:千元)的部分数据如表所示:年份2013201420152016201720182019年份代号t1234567人均纯收入y3.94.34.65.45.82018 和2019 年的居民纯收入 y(单位:千元)数据采用随机抽样的方式获得,用样本的均值来代替当年的居民人均纯收入,其数据如下:2018年抽取的居民纯收入(单位:千元)数据:5.2 4.8 6.5 5.6 6.0 7.1 6.1 7.3 5.9 7.52019年抽取的居民纯收入(单位:千元)数据:6.2
14、 7.8 6.6 5.8 7.1 6.8 7.2 7.9 5.9 7.7()求y关于t的线性回归方程;()当地政府为了提高居民收入水平,现从 2018和2019年居民纯收入(单位:千元)高于7.0千元的样本中随机选择 3 人进行座谈,了解其工作行业及主要收入来源设 X 为选出的 3 人中 2018 年纯收入高于7.0千元的人数,求随机变量X的分布列和数学期望附:回归直线的斜率和截距的最小二乘法估计公式分别为:b=ni=1(ti-t)2(yi-y)ni=1(ti-t)2,a=y-bt【解析】解:()根据 2018 年的抽样数据可得 2018 年的人均纯收入为110(5.2+4.8+6.5+5.6
15、+6.0+7.1+6.1+7.3+5.9+7.5)=6.2 千元,根据 2019 年的抽样数据可得 2019 年的人均纯收入为110(6.2+7.8+6.6+5.8+7.1+6.8+7.2+7.9+5.9+7.75)=6.9千元,由所给的数据得 t=17(1+2+3+4+5+6+7)=4,y=17(3.9+4.3+4.6+5.4+5.8+6.2+6.9)=5.3,7i=1(ti-t)2=9+4+1+0+1+4+9=28,7i=1(ti-t)(yi-y)=(-3)(-1.4)+(-2)(-1)+(-1)(-0.7)+00.1+10.5+20.9+31.6=14,b=7i=1(ti-t)(yi-y
16、)7i=1(ti-t)2=1428=0.5,则a=y-bt=5.3-0.54=3.3,则所求y关于t的线性回归方程为y=0.5t+3.3;()由 2018 年和 2019 年的抽样数据可知,2018 年居民纯收入高于 7.0 千元的有 3 人,2019 年居民纯收入高于7.0千元的有5人,由题意可得,随机变量X的可能取值为0,1,2,3,则P(X=0)=C35C38=528,P(X=1)=C13C25C38=1528,P(X=2)=C23C15C38=1556,P(X=1)=C33C38=156,随机变量X的分布列为则X的分布列为:X0123P52815281556156则E(X)=0528+
17、11528+21556+3156=9811.为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量某地车牌竞价的基本规则是:“盲拍”,即所有参与竞拍的人都是网络报价,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额某人拟参加2020年12月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的公告统计了最近 5个月参与竞拍的人数(见表):月份2020.072020.082020.092020.102020.11月份编号t12345竞拍人数y(万人)0.50.611.41.7(1)由收集数据的散点图发现1可用
18、线性回归模型拟合竞拍人数y(万人)与月份编号t之间的相关关系请用最小二乘法求y关于t的线性回归方程:y=bt+a,并预测2020年12月份参与竞拍的人数(2)某市场调研机构对200位拟参加2020年12月份车牌竞拍人员的报价价格进行了一个抽样调查,得到如下的一份频数表:报价区间(万元)1,2)2,3)3,4)4,5)5,6)6,7频数206060302010()求这200为竞拍人员报价 X的平均数值x和样本方差s2(同一区间的报价可用该价格区间的中点值代替);()假设所有参与竞价人员的报价 X可视为服从正态分布N(,2),且 与2可分别由()中所求的样本平均数x及s2估值若2020年12月份实
19、际发放车牌数量是 3174,请你合理预测(需说明理由)竞拍的最低成交价参考公式及数据:回归方程y=bx+a,其中b=ni=1xiyi-xyni=1xi2-nx2,a=y-bx;5i=1t2i=55,5i=1tiyi=18.8,1.7 1.3;若随机变量 Z 服从正态分布 N(,2),则 P(-Z +)=0.6826,P(-2 Z +2)=0.9544,P(-3Z+3)=0.9974方差S2=1nni=1(xi-x)2=ni=1(xi-x)2Pi【解析】解:(1)由题意得 t=1+2+3+4+55=3,y=0.5+0.6+1+1+1.75=1.04,5i=1t2i=55,5i=1tiyi=18.
20、8,b=ni=1xiyi-xyni=1xi2-nx2=18.8-531.0455-532=0.32,a=y-bx=1.04-0.323=0.08,y关于t的线性回归方程为y=0.32t+0.08当t=6时,y=0.326+0.08=2预测2020年12月份参与竞拍的人数为2万人(2)(i)依题意可得这200人报价的平均值为:x=1.50.1+2.50.3+3.50.3+4.50.15+5.50.1+6.50.05=3.5这200人报价的方差为:S2=(1.5-3.5)20.1+(2.5-3.5)20.3+(3.5-3.5)20.3+(4.5-3.5)20.15+(5.5-3.5)20.1+(6
21、.5-3.5)20.05=1.7(ii)2020年12月份实际发放车牌数量是3174,根据竞价规则,报价在最低成交价以上人数占总人数比例为317420000100%=15.87%,根据假设报价X可视为服从正态分布N(,2),=3.5,2=1.7,=1.7 1.3,P(x+)=1-P(-x+)2=0.1587,P(X4.8)=0.1587,预测竞拍的最低成交价为4.8万元12.某医疗专家组为了研究新冠肺炎病毒在特定环境下一周内随时间变化的繁殖情况,得到如下的实验数据:天数t(天)1234567繁殖个数y(千个)1123446(1)由如表数据可知,可用线性回归模型拟合y与t的关系,求y关于t的线性
22、回归方程;()若由线性回归方程得到的估计数据与实验数据的误差不超过 0.5,则该实验数据是“理想数据”,现从实验数据中随机抽取3个,求“理想数据”的个数X的分布列和数学期望参考公式:回归方程y=bt+a中斜率和截距的最小二乘估计公式分别为 b=ni=1(ti-t)(yi-y)ni=1(ti-t)2,a=y-bt【解析】解:()由题意,t=4,y=3,7i=1tiyi=107,7i=1ti2=140,b=7i=1tiyi-7ty7i=1ti2-7t2=107-84140-112=2328,a=y-bt=3-23284=-27y关于t的线性回归方程为y=2328t-27;()由题意将估计数据与实验
23、数据列表:天数t(天)1234567繁 殖 个数y(千个)1123446估 计 个数y(千个)152819146128310728651415328由列表和题意可知该实验数据为“理想数据”的有5个,故X的所有可能取值为1,2,3P(X=1)=C15C22C37=17,P(X=2)=C25C12C37=47,P(X=3)=C35C37=27“理想数据”个数X的分布列为:X123P174727则E(X)=117+247+327=15713.在线教育的发展,有利于弥补乡村教育短板,为我国各地区教育均衡发展提供了条件.2019年 政府工作报告 明确提出发展“互联网+教育”促进优质资源共享下面是 201
24、5-2019 年我国在线教育网络使用率的统计表:年份t20152016201720182019使用率y(%)1618.820.124.327.2其散点图如图:设日期代码x=t-2017()求y关于x的线性回归方程;()根据线性回归方程,预测2025年我国在线教育网络使用率约达到多少?附:回归直线y=bx+a中斜率和截距的最小二乘估计公式:b=ni=1(xi-x)(yi-y)ni=1(xi-x)2=ni=1xiyi-nxyni=1xi2-nx2,a=x-bx【解析】解:()由x=t-2017,得5组对应数据为(-2,16),(-1,18.8),(0,20.1),(1,24.3),(2,27.2)
25、,则x=15-2+(-1)+0+1+2=0,y=15(16+16.8+20.1+24.3+27.2)=21.28,求出5i=1x2i=10,5i=1xiyi=27.9,所以:b=ni=1(xi-x)(yi-y)ni=1(xi-x)2=ni=1xiyi-nxyni=1xi2-nx2=27.9-5021.2810-502=2.79,a=x-bx=21.28-2.790=21.28,所以y关于x的线性回归方程为y=bx+a=2.79x+21.28()当t=2025时,x=2025-2017=8,此时y=2.798+21.28=43.6,所以预测2025年我国在线教育网络使用率约达到43.6%14.学
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024年高考数学概率论专题1 线性回归方程 2024 年高 数学 概率论 专题 线性 回归 方程
限制150内