考点47 变量间的相关关系、统计案例 (3).docx
考点47 变量间的相关关系、统计案例一、选择题1.(2020·全国卷高考文科·T5 理科·T5)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,20)得到下面的散点图:由此散点图,在10至40之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+bln x【命题意图】本题考查的内容为回归分析,涉及非线性的相关关系,主要观察散点图的分布,结合多类函数图像增长趋势即可判断,属于基础题.【解析】选D.由散点图分布可知,散点图分布在一个对数函数的图像附近,因此,最适合作为发芽率y和温度x的回归方程类型的是y=a+bln x.二、 填空题 无三、 解答题2.(2020·全国卷文科·T18文理科·T18)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i=120xi=60,i=120yi=1 200,i=120(xi-x)2=80,i=120(yi-y)2=9 000,i=120(xi-x)(yi-y)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2,21.414.【命题意图】本题考查平均数的估计值、相关系数的计算以及抽样方法的选取,意在考查学生的数据处理能力和解决实际问题的能力.【解析】(1)样区这种野生动物数量的平均数为120i=120yi=120×1 200=60,地块数为200,该地区这种野生动物数量的估计值为200×60=12 000.(2)样本(xi,yi)的相关系数r=i=120(xi-x)(yi-y)i=120(xi-x)2i=120(yi-y)2=80080×9000=2230.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各地块的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的办法较好地保持了样本结构与总体结构的一致性,提高了样本代表性,从而可以获得该地区这种野生动物数量更准确的估计.3.(2020·全国卷理科·T18)(12分)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级0,200(200,400(400,6001(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次400人次>400空气质量好空气质量不好附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(K2k)0.0500.0100.001k3.8416.63510.828【命题意图】本题考查利用频数分布表计算概率和平均数,同时也考查了独立性检验的应用,考查数据处理能力.【解析】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为2+16+25100=0.43,等级为2的概率为5+10+12100=0.27,等级为3的概率为6+7+8100=0.21,等级为4的概率为7+2+0100=0.09.(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100×20+300×35+500×45100=350.(3)2×2列联表如下:人次400人次>400空气质量好3337空气质量不好228K2的观测值k=100×33×8-37×22270×30×55×455.820>3.841,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.3.(2020·新高考全国卷)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:g/m3),得下表: SO2PM2.50,50(50,150(150,4750,3532184(35,756812(75,1153710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面2×2列联表: SO2PM2.50,150(150,4750,75(75,115(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2k)0.0500.0100.001k3.8416.63510.828【命题意图】本题考查概率与统计的知识,涉及知识点:利用频率来估计概率,利用列联表计算K2的值,独立性检验,体现了逻辑推理与数据分析的核心素养.【解析】(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=0.64.(2)根据抽查数据,可得2×2列联表: SO2PM2.50,150(150,4750,756416(75,1151010(3)根据(2)的列联表得K2的观测值k=100×(64×10-16×10)280×20×74×267.484.由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.