突破2023年高考数学题型之2022年数学高考真题(全国通用)专题37 成对数据的统计问题(原卷版).pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《突破2023年高考数学题型之2022年数学高考真题(全国通用)专题37 成对数据的统计问题(原卷版).pdf》由会员分享,可在线阅读,更多相关《突破2023年高考数学题型之2022年数学高考真题(全国通用)专题37 成对数据的统计问题(原卷版).pdf(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、专题3 7成对数据的统计问题【高考真题】1.(2 0 2 2.全国乙理)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了 1 0 棵这种树木,测量每棵树的根部横截面积(单位:|蜡)和材积量(单位:m,得到如下数据:样本号i1234567891 0总和根部横截面积不0.0 4 0.0 6 0.0 4 0.0 8 0.0 8 0.0 5 0.0 5 0.0 7 0.0 7 0.0 6 0.6材积量当0.2 5 0.4 0 0.2 2 0.5 4 0.5 10.3 4 0.3 6 0.4 6 0.4 2 0.4 03.910 10 10并计算得工 累=0
2、0 3 8,Zy=1-6 1 5 8,Z x/=0.2 4 7 4 .i=l i=l i=l(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.0 1);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为1 8 6 m 2 .已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数1=,颉,1.3 7 7.、区(X 于之(y 寸V i=l i=l1.解 析(1)样本中1 0 棵这种树木的根部横截面积的平均值彳=辞=0.0 63
3、 9样本中1 0 棵这种树木的材积量的平均值尸=转=0.3 9据此可估计该林区这种树木平均一棵的根部横截面积为0.0 6 m 2,平均一棵的材积量为O.3 9 m 310 10g用厝-。铲2 )0.2 4 7 4-1 0 x 0.0 6 x 0.3 9 0.0 1 3 4 0.0 1 3 4 3=/=/-0.9/r八 Q77(0.0 3 8 -1 0 x 0.0 62)(1.6 1 5 8 -1 0 x 0.3 92)V 0.0 0 0 1 8 9 6 0.0 1 3 7 7(3)设该林区这种树木的总材积量的估计值为y n?,又已知树木的材积量与其根部横截面积近似成正比,可 得 黑=竿,解之得
4、y=1 2 0 9 m 3.则该林区这种树木的总材积量估计为1209m3.2.(2022.新高考I)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了 100例(称为病例组),同时在未患该疾病的人群中随机调查了 100人(称为对照组),得到如下数据:不够良好良好病例组4060对照组1090(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病?(B|A).-?(B|A)P(BA)P(B|A)的比值是
5、卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为 R.(i)证明:P(AB)P(AB)K=-=-=-P(A|B)P(AB)(i i)利用该调查数据,给出P(A IB),P(A|豆)的估计值,并 利 用(i)的结果给出R 的估计值.附 犬n(ad-hc)2尸(心“)0.0500.0100.001(a+b)(c 4-d)(a+c)(b+d)2.解析(1)由已知k3.8416.63510.828n(ad-bc)2 _ 200(40 x90-60 x10)2(+b)(c+d)(a+c)(b+d)50 x150 x100 x100又尸(片 2 6.635)=0.01,24 6.635,所以有
6、99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.(2)因为R=P(8|A)P(BA)P(BA)P(BA)P(48)P(A)P(而)P(A)P(A)P(AB)P(A)P(AB)所以R=P(AB)P(B)P(AB)P(B)P(B)P(AB)P(B)P(AB)所以R=.小P(A|B)P(A|B)40(ii)由已知P(A|8)=而1 0 -6 0 -9 0P(.AB)=,又尸(A|B)=,P(A|B)=,1 0 0 1 0 0 1 0 0P(AB)P(l g)_6P(A|8)P(A|B)所以R=【知识总结】1.变量的相关关系(1)相关关系两个变量有关系,但又没有确切到可由其中的一个去精确
7、地决定另一个的程度,这种关系称为相关关系.(2)相关关系的分类:正相关和负相关.(3)线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.2.样本相关系数(1)相关系数r 的计算变量x和变量y的样本相关系数r 的计算公式如下:n _ _Z(X,X)(y,y )i=l二二二二A /Z (X L X )2X(y,y )2I=I ri(2)相关系数r 的性质 当 r 0 时,称成对样本数据正相关;当 K0时,成对样本数据负相关;当 r=0 时,成对样本数
8、据间没有线性相关关系.样本相关系数/的取值范围为-1,1 J.当K 越接近1 时,成对样本数据的线性相关程度越强;当|r|越接近。时,成对样本数据的线性相关程度越弱.3.一元线性回归模型(1)经验回归方程与最小二乘法A A A我们将称为关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的2,1 叫做6,。的最小二乘估计,(k x)G i-y)ixiyi-n x A/=1 l=A _ A _其中=,a=y b x(XT)2i=li=(2)利用决定系数R?刻画回归效果 (-)j/?2=1-,R2越大,即拟合效果越好,R2越小,
9、模型拟合效果越差.I(9-y )2户14.列联表与独立性检验(1)2X2列联表一般地,假设有两个分类变量X 和匕它们的取值分别为 XI,汹 和 M,/,其 2X 2 列联表为Xy合计y=yiy=y2X=Xaba+bX=X2cdc+d合计a+cb+dn=a+b+c+d(2)临界值一=(+份(;鬻%)(6+4 忽略炉的实际分布与该近似分布的误差后对于任何小概率值a,可以找到相应的正实数X.,使得P仍 落 尸a成立.我们称x.为a的临界值,这个临界值就可作为判断x2大小的标准.(3)独立性检验基于小概率值a 的检验规则是:当X22/时,我们就推断Ho不成立,即认为X 和 Y不独立,该推断犯错误的概率
10、不超过a;当/羽时,我们没有充分证据推断为不成立,可以认为X 和 y 独立.这种利用犬的取值推断分类变量X和 Y是否独立的方法称为炉独立性检验,读 作“卡方独立性检验”,简称独立性检验.下表给出了/独立性检验中几个常用的小概率值和相应的临界值a0.10.050.010.0050.001xa2.7063.8416.6357.87910.828【题型突破】考向一概率与回归分析综合问题1.(2020全国H)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据
11、,y;)(i=l,2,,2 0),其中方,和y,分别表示第,个样区的植物覆盖20 20 20 _面积(单位:公顷)和这种野生动物的数量,并计算得官=6 0,产1 20 0,Z(x=x )2=80,1=1 =1 i=i20 _ 20 _ _E(y i-y)2=9 ooo,Z (为一、)8 y)=80 0.i=l i=l(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(如)(i=l,2,,20)的相关系数(精确到0.0 1);(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量
12、更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:样本相关系数厂=E (即 一 x)(y,y)i=,山七 1.4 1 4.(x,X)2X (y,y)22.如图给出了根据我国20 1 2年20 1 8年水果人均占有量),(单位:kg)和年份代码x绘制的散点图和经验回归方程的残差图(20 1 2年20 1 8年的年份代码x为1 7).户.nJI,(V nfvn/I8765432我 国2012年2018年 水 果 人 均 占 有 量 散 点 图-.-.;-a 24 我 国2。12年2018年 水 果 人 均占有量残 差 图二二二二二十二二二二二二二二 i;1 2 3 4 5 6 7年
13、份 代 码x酸-2车份代 码x(l)根据散点图分析y与x之间的相关关系;77(2)根据散点图相应数据计算得力产1 0 74,沙=45 17,求),关于x的经验回归方程(精确到0.0 1);/=1 尸 I(3)根据经验回归方程的残差图,分析经验回归方程的拟合效果.n _ _Z (无 一 x)8 -y)A A A A I A附:经验回归直线y=a+法中斜率和截距的最小二乘估计公式分别为6=-,。=亍 一Z(X/-X)2i=Ab x.3.小 区 门 口有一个熟食摊位,经过一段时间的统计,发现菜品种类和日销售收入之间有一定关系,具体统计数据如下表:(1)建 立y关 于,的线性回归方程;(j保留整数)(
14、2)根据所求线性回归方程,预测如果希望日销售收入菜品种类f4567891 0日销售收入y1 4 71 591 711 841 9721 0221超过3 0 0 元,则菜品种类至少多少种?X QL t)8-y )附:线性回归直线的斜率和截距的最小二乘估计公式分别为-,a=y b t ,(L7)27 _ _ 7 _参考数据:z(ti-t)(J,-y )=3 5 0,z(/,t)2=2 8.i=l)A _ A_回归 方程:y=/zx+a 中,b=-二-,a=y-b x .(%/x)2i=i7.近年来,高铁的发展逐渐改变了人们的出行方式,我国20162020年高铁运营里程的数据如下表所示.年份2016
15、2017201820192020年份代码X12345高铁运营里程y(万千米)1.92.22.52.93.5(1)若犬与、具有线性相关关系,求 y 关于x 的线性回归方程;(2)每一年与前一年的高铁运营里程之差即为该年新增的里程,根据这五年的数据,若用20172020年每年新增里程的频率代替之后每年新增相应里程的概率,求 2024年中国高铁运营里程大于或等于5 万千米的概率.A A A L xiyi-n x y附:线性回归方程y=a+b x 中斜率和截距的最小二乘估计公式分别为:=匕-在 后 一“x2a y-b x.8.每年春天,婺源的油菜花海吸引数十万游客纷至沓来,油菜花成为“中国最美乡村”的
16、特色景观,三月,婺源篁岭油菜花海进入最佳观赏期.现统计了近七年每年(2015年用x=l 表示,2016年用x=2 表示)来篁岭旅游的人次y(单位:万人次)相关数据,如下表所示:X1234567y29333644485259 若 y 关于x 具有较强的线性相关关系,求 y 关于x 的线性回归方程=源+2,并预测2022年来篁岭旅游的人次;(2)为维持旅游秩序,今需A,B,C,。四位公务员去各景区值班,已知A,B,C 去篁岭值班的概率均为|,。去篁岭值班的概率为/且每位公务员是否去篁岭值班不受影响,用 X 表示此4 人中去篁岭值班的人数,求 X的分布列与均值.z(X,x )8 y)A L 1 八
17、A参考公式:b=-,a=y-b x.S(为-X )2i=l7 7 _ _参考数据:2y=3 0 1,ZGL x )8-y)=1 4 0./=i=l9.研究机构对某校学生往返校时间的统计资料表明:该校学生居住地到学校的距离M单位:千米)和学生花费在上学路上的时间y(单位:分钟)有如下的统计数据:到学校的距离M千米)1.82.63.14.35.56.1花费的时间y(分钟)1 7.81 9.62 7.53 1.33 6.04 3.2由统计资料表明y 与 x具有线性相关关系.(1)判断y 与 x的相关程度;(相关系数r的绝对值大于0.7 5 时,认为两个变量相关程度很强,精确到0 0 1)(2)求线性
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 突破2023年高考数学题型之2022年数学高考真题全国通用专题37 成对数据的统计问题原卷版 突破 2023 年高 数学 题型 2022 高考 全国 通用 专题 37 成对 数据 统计 问题 原卷版
![提示](https://www.taowenge.com/images/bang_tan.gif)
链接地址:https://www.taowenge.com/p-88920547.html
限制150内