2020高考数学刷题首秧第八章概率与统计考点测试56变量间的相关关系与统计案例文.docx
-
资源ID:2863431
资源大小:346.93KB
全文页数:14页
- 资源格式: DOCX
下载积分:5金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
2020高考数学刷题首秧第八章概率与统计考点测试56变量间的相关关系与统计案例文.docx
考点测试56变量间的相关关系与统计案例高考概览考纲研读1会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程3了解独立性检验的基本思想、方法及其简单应用4了解回归分析的基本思想、方法及其简单应用一、基础小题1已知回归直线的斜率的估计值是123,样本点的中心为(4,5),则回归直线的方程是()A123x4 B123x5C123x008 D008x123答案C解析选项D显然错误因为回归方程必过样本中心点,把点(4,5)代入选项A,B,C检验,满足的只有选项C故选C2在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()A1 B0 C D1答案D解析由题设知,这组样本数据完全正相关,故其相关系数为1故选D3甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:甲乙丙丁r082078069085m106115124103则试验结果体现A,B两变量有更强的线性相关性的是()A甲 B乙 C丙 D丁答案D解析r越大,m越小,线性相关性越强,丁同学的试验结果体现A,B两变量有更强的线性相关性故选D4在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是()A100个吸烟者中至少有99人患肺癌B1个人吸烟,那么这人有99%的概率患有肺癌C在100个吸烟者中一定有患肺癌的人D在100个吸烟者中可能一个患肺癌的人也没有答案D解析统计的结果只是说明事件发生可能性的大小,具体到一个个体不一定发生故选D5设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为085x8571,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加085 kgD若该大学某女生身高为170 cm,则可断定其体重必为5879 kg答案D解析由于线性回归方程中x的系数为085,因此y与x具有正的线性相关关系,故A正确又线性回归方程必过样本点的中心(,),因此B正确由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加085 kg,故C正确当某女生的身高为170 cm时,其体重估计值是5879 kg,而不是具体值,因此D不正确6以模型ycekx去拟合一组数据时,为了求出回归方程,设zln y,其变换后得到线性回归方程z03x4,则c_答案e4解析因为ycekx,所以两边取对数,可得ln yln (cekx)ln cln ekxln ckx,令zln y,可得zln ckx因为z03x4,所以ln c4,所以ce4二、高考小题7(2017山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系设其回归直线方程为x已知i225,i1600,4该班某学生的脚长为24,据此估计其身高为()A160 B163 C166 D170答案C解析i225,i225i1600,i160又4,160422570回归直线方程为4x70将x24代入上式得42470166故选C8(2017全国卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是()A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在7,8月D各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A解析对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确故选A三、模拟小题9(2018合肥质检)某公司一种型号的产品近期销售情况如下表:月份(x)23456销售额y/万元151163170172184根据上表可得到回归直线方程075x,据此估计,该公司7月份这种型号产品的销售额约为()A195万元 B1925万元C1915万元 D1905万元答案D解析由表可知(23456)4,(15116317172184)168,则样本中心点(4,168)在线性回归直线上,故1680754,得138故当x7时,07571381905故选D10(2019衡阳模拟)某城市收集并整理了该市2018年1月份至10月份每月最低气温与最高气温(单位:)的数据,绘制了下面的折线图已知该市每月的最低气温与当月的最高气温两变量具有较好的线性关系,则根据该折线图,下列结论错误的是()A每月的最低气温与当月的最高气温两变量为正相关B10月份的最高气温不低于5月份的最高气温C月温差(最高气温减最低气温)的最大值出现在1月份D最低气温低于0 的月份有4个答案D解析由图观察可得,当最低气温较大时,最高气温也较大,故A正确;10月份的最高气温大于20 ,而5月份的最高气温不超过20 ,故B正确;从各月的温差看,1月份的温差最大,故C正确;而最低气温低于0 的月份是1,2,4三个月份故选D11(2018河北邯郸二模)观察下面频率等高条形图,其中两个分类变量x,y之间关系最强的是()答案D解析在频率等高条形图中,与相差很大时,我们认为两个分类变量有关系,在四个选项中(等高的条形图)中,若x1,x2所占比例相差越大,则分类变量x,y的相关性越强故选D12(2018河北武邑中学调研)为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是()Al1和l2有交点(s,t)Bl1与l2相交,但交点不一定是(s,t)Cl1与l2必定平行Dl1与l2必定重合答案A解析由题意知(s,t)是甲、乙两位同学所做试验的样本点的中心,而线性回归直线恒过样本点的中心故选A13(2018大连双基测试)已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程为x若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是()A>b,>a B>b,<aC<b,>a D<b,<a答案C解析解法一:由两组数据(1,0)和(2,2)可求得直线方程为y2x2,从而b2,a2而利用线性回归方程的公式与已知表格中的数据,可求得,所以<b,>a选C解法二:根据所给数据画出散点图,如图所示,可直接判断:从l2旋转到l1,斜率变大,纵截距变小,即<b,>a选C一、高考大题1(2018全国卷)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:304135t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:99175t(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由解(1)利用模型,该地区2018年的环境基础设施投资额的预测值为304135192261(亿元)利用模型,该地区2018年的环境基础设施投资额的预测值为9917592565(亿元)(2)利用模型得到的预测值更可靠理由如下:()从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y304135t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型99175t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值2261亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠2(2018全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2,P(K2k0)005000100001k03841663510828解(1)第二种生产方式的效率更高理由如下:()由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为855分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为735分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分)(2)由茎叶图知m80列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)由于K2的观测值k10>6635,所以有99%的把握认为两种生产方式的效率有差异3(2017全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50 kg箱产量50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到001)P(K2k)005000100001k3841663510828,K2解(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”由题意知P(A)P(BC)P(B)P(C)旧养殖法的箱产量低于50 kg的频率为(00120014002400340040)5062,故P(B)的估计值为062新养殖法的箱产量不低于50 kg的频率为(0068004600100008)5066,故P(C)的估计值为066因此,事件A的概率的估计值为06206604092(2)根据箱产量的频率分布直方图得列联表箱产量<50 kg箱产量50 kg旧养殖法6238新养殖法3466K215705由于15705>6635,故有99%的把握认为箱产量与养殖方法有关(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(000400200044)5034<05,箱产量低于55 kg的直方图面积为(0004002000440068)5068>05,故新养殖法产量的中位数的估计值为505235(kg)二、模拟大题4(2018厦门质检一)为了解学生的课外阅读时间情况,某学校随机抽取了50人进行统计分析,把这50人每天阅读的时间(单位:分钟)绘制成频数分布表,如下表所示:阅读时间0,20)20,40)40,60)60,80)80,100)100,120)人数810121172若把每天阅读时间在60分钟以上(含60分钟)的同学称为“阅读达人”,根据统计结果中男女生阅读达人的数据,制作出如图所示的等高条形图(1)根据抽样结果估计该校学生的每天平均阅读时间(同一组数据用该区间的中点值作为代表);(2)根据已知条件完成下面的22列联表,并判断是否有99%的把握认为“阅读达人”跟性别有关?男生女生总计阅读达人非阅读达人总计附:参考公式:K2,其中nabcd临界值表:P(K2k0)0100005000100001k027063841663510828解(1)该校学生的每天平均阅读时间为1030507090110166121541264452(分钟)(2)由频数分布表得“阅读达人”的人数是117220(人),根据等高条形图得22列联表如下:男生女生总计阅读达人61420非阅读达人181230总计242650K24327,由于4327<6635,故没有99%的把握认为“阅读达人”跟性别有关5(2018湖北第二次联考)菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但蔬菜上市时仍存在少量的残留农药,食用时需要用清水清洗干净,下表是用清水x(单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y(单位:微克)的统计表:x12345y5854392910(1)在右面的坐标系中,描出散点图,并判断变量x与y是正相关还是负相关;(2)若用解析式cx2d作为蔬菜上农药残留量与用水量x的回归方程,令wx2,计算平均值与,完成以下表格,求出与x的回归方程(c,d保留两位有效数字);w1491625y5854392910wiyi(3)对于某种残留在蔬菜上的农药,当它的残留量低于20微克时对人体无害,为了放心食用该蔬菜,请估计需要用多少千克的清水清洗一千克蔬菜?(精确到01,参考数据:2236)附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线u的斜率和截距的最小二乘估计分别为,解(1)变量x与y是负相关(2)由题中表格易得11,38,w1491625y5854392910wi1072514yi20161928c20,dc381160,20w6020x260(3)当<20时,20x260<20,即x>245,为了放心食用该蔬菜,估计需要用45千克的清水清洗一千克蔬菜