第九章 §9.3 成对数据的统计分析.docx
§9.3成对数据的统计分析考试要求1.了解样本相关系数的统计含义.2.理解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.3.会利用统计软件进行数据分析知识梳理1变量的相关关系(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系(2)相关关系的分类:正相关和负相关(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关2样本相关系数(1)r.(2)当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关(3)|r|1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱3一元线性回归模型(1)我们将x称为Y关于x的经验回归方程,其中(2)残差:观测值减去预测值,称为残差4列联表与独立性检验(1)关于分类变量X和Y的抽样数据的2×2列联表:XY合计Y0Y1X0ababX1cdcd合计acbdnabcd(2)计算随机变量2,利用2的取值推断分类变量X和Y是否独立的方法称为2独立性检验0.100.050.0100.0050.001x2.7063.8416.6357.87910.828常用结论1经验回归直线过点(,)2求时,常用公式.3回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误思考辨析判断下列结论是否正确(请在括号中打“”或“×”)(1)散点图是判断两个变量相关关系的一种重要方法和手段()(2)经验回归直线 x 至少经过点(x1,y1),(x2,y2),(xn,yn)中的一个点(×)(3)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强()(4)若分类变量X,Y关系越密切,则由观测数据计算得到的2的观测值越小(×)教材改编题1实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的经验回归方程为()A.x1 B.x2C.2x1 D.x1答案A解析由已知可得×(1234)2.5,×(2345)3.5,所以经验回归直线过点(2.5,3.5),所以把点(2.5,3.5)代入四个选项中验证,可得只有x1成立2(多选)下列关于成对样本数据的统计分析的判断中正确的有()A若样本相关系数r0,则说明成对样本数据没有相关性B样本相关系数r越大,成对样本数据的线性相关性越强C用最小二乘法求得的一元线性回归模型的残差和一定是0D决定系数R2越大,残差平方和越小,模型的拟合效果越好答案CD解析对于A,当r0时,只表明成对样本数据间没有线性相关关系,但是不排除它们之间有其他相关关系,故A错误;对于B,样本相关系数|r|越大,成对样本数据的线性相关性越强,故B错误;对于C,残差和为(yii)yi(xi)iinnnn()0,故C正确;对于D,决定系数R2越大,表示残差平方和越小,即模型的拟合效果越好,故D正确3(多选)为了解阅读量多少与幸福感强弱之间的关系,一个调查机构根据所得到的数据,绘制了如下所示的2×2列联表(个别数据暂用字母表示):幸福感强幸福感弱合计阅读量多m1872阅读量少36n78合计9060150计算得:212.981,参照下表:0.100.050.0250.0100.0050.001x2.7063.8415.0246.6357.87910.828对于下面的选项,正确的为()A根据小概率值0.010的独立性检验,可以认为“阅读量多少与幸福感强弱无关”Bm54C根据小概率值0.005的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”Dn52答案BC解析 212.981>7.879>6.635,根据小概率值0.010的独立性检验,可以在犯错误的概率不超过1%的前提下认为“阅读量多少与幸福感强弱有关”,根据小概率值0.005的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”,A错,C对,m3690,18n60,m54,n42,B对,D错.题型一成对数据的相关性例1(1)对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图如图1,对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图如图2.由这两个散点图可以判断()图1图2A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关答案C解析由题图可得两组数据均线性相关,且图1的经验回归直线的斜率为负,图2的经验回归直线的斜率为正,则由散点图可判断变量x与y负相关,u与v正相关(2)(多选)下列有关经验回归分析的说法中正确的有()A经验回归直线必过点(,)B经验回归直线就是散点图中经过样本数据点最多的那条直线C当样本相关系数r>0时,两个变量正相关D如果两个变量的相关性越弱,则|r|就越接近于0答案ACD解析对于A,经验回归直线必过点(,),故A正确;对于B,经验回归直线在散点图中可能不经过任一样本数据点,故B不正确;对于C,当样本相关系数r>0时,则两个变量正相关,故C正确;对于D,如果两个变量的相关性越弱,则|r|就越接近于0,故D正确教师备选1在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()A1 B0 C. D1答案D解析所有样本点均在同一条斜率为正数的直线上,则样本相关系数最大,为1.2(多选)下列选项中正确的是()A经验回归分析中,R2的值越大,说明残差平方和越小B若一组观测数据(x1,y1),(x2,y2),(xn,yn)满足yibxiaei(i1,2,n),若ei恒为0,则R21C经验回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法D画残差图时,纵坐标为残差,横坐标一定是编号答案ABC解析对于A,经验回归分析中,R2的值越大,说明模型的拟合效果越好,则残差平方和越小,A对;对于B,若一组观测数据(x1,y1),(x2,y2),(xn,yn)满足yibxiaei(i1,2,n),若ei恒为0,则R21,B对;对于C,经验回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,C对;对于D,残差图中横坐标可以是样本编号,也可以是身高数据,还可以是体重的估计值等,D错思维升华判定两个变量相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关(2)样本相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近于1,相关性越强(3)经验回归方程:当>0时,正相关;当<0时,负相关跟踪训练1(1)已知变量x和y满足关系y0.1x1,变量y与z正相关下列结论中正确的是()Ax与y正相关,x与z负相关Bx与y正相关,x与z正相关Cx与y负相关,x与z负相关Dx与y负相关,x与z正相关答案C解析因为y0.1x1的斜率小于0,故x与y负相关因为y与z正相关,可设zy,0,则zy0.1x,故x与z负相关(2)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是()Ar2<r4<0<r3<r1 Br4<r2<0<r1<r3Cr4<r2<0<r3<r1 Dr2<r4<0<r1<r3答案A解析由散点图知图(1)与图(3)是正相关,故r1>0,r3>0,图(2)与图(4)是负相关,故r2<0,r4<0,且图(1)与图(2)的样本点集中在一条直线附近,因此r2<r4<0<r3<r1.题型二回归模型命题点1一元线性回归模型例2(2022·广州模拟)2021年2月25日,在全国脱贫攻坚总结表彰大会上,习近平总书记庄严宣告:我国脱贫攻坚战取得全面胜利目前,河南省53个贫困县已经全部脱贫摘帽,退出贫困县序列.2016年起,我省某贫困地区创新开展产业扶贫,响应第三产业的扶贫攻坚政策,经济收入逐年增加该地的经济收入变化及构成比例如图所示:年份2016年2017年2018年2019年2020年年份代号x12345经济收入y(单位:百万元)59141720(1)根据以上图表,试分析:与2016年相比,2020年第三产业与种植业收入变化情况;(2)求经济收入y关于x的经验回归方程,并预测2025年该地区的经济收入解(1)与2016年相比,2020年第三产业的收入占比大幅度增加;2016年第三产业的收入为0.3百万元,2020年第三产业的收入为6百万元,收入大幅度增加;与2016年相比,种植业收入占比减少,但种植业收入依然保持增长(2)由表格中的数据可知,3,13,122232425255,iyi1×52×93×144×175×20233,则3.8,所以1.6,故经济收入y关于x的经验回归方程为3.8x1.6,当x10时,39.6,则预测2025年该地区的经济收入为39.6百万元命题点2非线性回归模型例3(2022·吉林模拟)全球化时代,中国企业靠什么在激烈的竞争中成为世界一流企业呢?由人民日报社指导,中国经济周刊主办的第十八届中国经济论坛在人民日报社举行,就中国企业如何提升全球行业竞争力进行了研讨数据显示,某企业近年加大了科技研发资金的投入,其科技投入x (百万元)与收益y (百万元)的数据统计如下:科技投入x1234567收益y19202231405070根据数据特点,甲认为样本点分布在指数型曲线y2bxa的周围,据此他对数据进行了一些初步处理如下表:iyiizi(yi)2(yi)251401 2391492 134130其中zilog2yi,i.(1)请根据表中数据,建立y关于x的经验回归方程(系数精确到0.1);(2)乙认为样本点分布在直线ymxn的周围,并计算得经验回归方程为8.25x3,以及该回归模型的决定系数R0.893,试比较甲、乙两人所建立的模型,谁的拟合效果更好?由所得的结论,计算该企业欲使收益达到1亿元,科技投入的费用至少要多少百万元?(精确到0.1)附:决定系数:R21.参考数据:log252.3.解(1)将y2bxa两边取对数得log2ybxa,令zlog2y,则x,4,根据最小二乘估计可知,0.32,50.32×43.723.7,经验回归方程为0.3x3.7,即20.3x3.7.(2)甲建立的回归模型的R10.939>R0.893.甲建立的回归模型拟合效果更好由知,甲建立的回归模型拟合效果更好设20.3x3.7100,解得0.3x3.7log210022log25,解得x9.7.科技投入的费用至少要9.7百万元,下一年的收益才能达到1亿元教师备选1(2022·湖北九师联盟联考)下表是关于某设备的使用年限x(单位:年)和所支出的维修费用y(单位:万元)的统计表x23456y3.44.25.15.56.8由上表可得经验回归方程0.81x,若规定:维修费用y不超过10万元,一旦大于10万元时,该设备必须报废据此模型预测,该设备使用年限的最大值约为()A7 B8 C9 D10答案D解析由表格,得×(23456)4,×(3.44.25.15.56.8)5,因为经验回归直线恒过点(,),所以50.81×4,解得1.76,所以经验回归方程为0.81x1.76,由y10,得0.81x1.7610,解得x10.17,由于xN*,所以据此模型预测,该设备使用年限的最大值约为10.2用模型ycekx拟合一组数据时,为了求出经验回归方程,设zln y,其变换后得到经验回归方程为z0.5x2,则c等于()A0.5 Be0.5 C2 De2答案D解析因为ycekx,两边取对数得,ln yln(cekx)ln cln ekxkxln c,则zkxln c,而z0.5x2,于是得ln c2,即ce2.思维升华求经验回归方程的步骤跟踪训练2为实施乡村振兴,科技兴农,某村建起了田园综合体,并从省城请来专家进行技术指导根据统计,该田园综合体西红柿亩产量的增加量y(千克)与某种液体肥料每亩使用量x(千克)之间的对应数据如下x(千克)24568y(千克)300400400400500(1)由上表数据可知,可用经验回归模型拟合y与x的关系,请计算样本相关系数r并加以说明(若|r|>0.75,则线性相关程度很高,可用经验回归模型拟合);(2)求y关于x的经验回归方程,并预测当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为多少千克?参考数据:3.16.解(1)由已知数据可得5,400,所以(xi)(yi)(3)×(100)(1)×00×01×03×100600,2,100,所以样本相关系数r0.95.因为|r|>0.75,所以可用经验回归模型拟合y与x的关系(2)30,4005×30250,所以经验回归方程为30x250.当x15时,30×15250700,即当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为700千克题型三列联表与独立性检验例4(2021·全国甲卷改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)依据小概率值0.01的独立性检验,能否以此推断甲机床的产品质量与乙机床的产品质量有差异?解(1)根据题表中数据知,甲机床生产的产品中一级品的频率是0.75,乙机床生产的产品中一级品的频率是0.6.(2)零假设为H0:甲机床的产品质量与乙机床的产品质量无差异根据2×2列联表,可得210.2566.635x0.01.根据小概率值0.01的独立性检验,我们推断H0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异教师备选1为了解某大学的学生是否爱好体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:男女合计爱好ab73不爱好c25合计74则abc等于()A7 B8 C9 D10答案C解析根据题意,可得c120732522,a742252,b735221,abc5221229.2(多选)某医疗研究机构为了了解免疫与注射疫苗的关系,进行一次抽样调查,得到数据如表1.免疫不免疫合计注射疫苗101020未注射疫苗63440合计164460(表1)0.100.0500.0100.001x2.7063.8416.63510.828(表2)则下列说法中正确的是()A28.35BP(26.635)0.001C依据小概率值0.01的独立性检验,我们认为免疫与注射疫苗有关系D依据小概率值0.001的独立性检验,我们认为免疫与注射疫苗有关系答案AC解析由表中数据,得28.3528.35,所以A正确;因为P(26.635)0.01,所以B错误;28.352>6.635x0.01,依据小概率值0.01的独立性检验,我们认为免疫与注射疫苗有关系,所以C正确;28.352<10.828x0.001,依据小概率值0.001的独立性检验,我们认为免疫与注射疫苗没有关系,故D错误思维升华独立性检验的一般步骤(1)根据样本数据制成2×2列联表(2)根据公式2计算(3)比较2与临界值的大小关系,作统计推断跟踪训练3(2022·太原模拟)为进一步保护环境,加强治理空气污染,某市环保监测部门对市区空气质量进行调研,随机抽查了市区100天的空气质量等级与当天空气中SO2的浓度(单位:g/m3),整理数据得到下表: SO2的浓度空气质量等级0,50(50,150(150,4751(优)28622(良)5783(轻度污染)3894(中度污染)11211若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”,根据上述数据,回答以下问题(1)估计事件“该市一天的空气质量好,且SO2的浓度不超过150”的概率;(2)完成下面的2×2列联表,SO2的浓度空气质量0,150(150,475合计空气质量好空气质量不好合计(3)根据(2)中的列联表,依据小概率值0.01的独立性检验,能否据此推断该市一天的空气质量与当天SO2的浓度有关?解(1)由表格可知,该市一天的空气质量好,且SO2的浓度不超过150的天数为2865746,则“该市一天的空气质量好,且SO2的浓度不超过150”的概率P0.46.(2)由表格数据可得列联表如下,SO2的浓度空气质量0,150(150,475合计空气质量好461056空气质量不好242044合计7030100(3)零假设为H0:该市一天的空气质量与当天SO2的浓度无关由(2)知28.936>6.635x0.01,根据小概率值0.01的独立性检验,我们推断H0不成立,即认为该市一天的空气质量与当天SO2的浓度有关课时精练1如表是2×2列联表,则表中的a,b的值分别为()y1y2合计x1a835x2113445合计b4280A.27,38 B28,38 C27,37 D28,37答案A解析a35827,ba11271138.2(2022·湘豫名校模拟)根据如表样本数据:x23456y42.50.523得到的经验回归方程为x,则()A.>0,>0 B.>0,<0 C.<0,>0 D.<0,<0答案B解析由表中的数据可得,变量y随着x的增大而减小,则<0,4,0.2,又经验回归方程x经过点(4,0.2),可得>0.3某种产品的广告费支出x与销售额y(单位:万元)之间的关系如表:x24568y3040605070y与x的经验回归方程为6.5x17.5,当广告支出6万元时,随机误差的残差为()A5 B5.5C6 D6.5答案D解析由题意结合经验回归方程的预测作用可得,当x6时,6.5×617.556.5,则随机误差的残差为5056.56.5.4(2022·泉州模拟)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:)存在着较强的线性相关关系某地观测人员根据如表的观测数据,建立了y关于x的经验回归方程0.25xk,则下列说法不正确的是()x(次数/分钟)2030405060y()2527.52932.536A.k的值是20B变量x,y呈正相关关系C若x的值增加1,则y的值约增加0.25D当蟋蟀52次/分鸣叫时,该地当时的气温预测值为33.5 答案D解析由题意,得×(2030405060)40,×(2527.52932.536)30,则k0.25300.25×4020,故A正确;由经验回归方程可知,0.25>0,变量x,y呈正相关关系,故B正确;若x的值增加1,则y的值约增加0.25,故C正确;当x52时,0.25×522033,故D不正确5(多选)下列说法正确的是()A设有一个经验回归方程35x,变量x增加一个单位时,y平均增加5个单位B若两个具有线性相关关系的变量的相关性越强,则样本相关系数r的值越接近于1C在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高D在一元线性回归模型中,决定系数R2越接近于1,说明回归的效果越好答案CD解析A选项,因为35x,所以变量x增加一个单位时,y平均减少5个单位,故A错误;B选项,线性相关性具有正负,相关性越强,则样本相关系数r的绝对值越接近于1,故B错误;C选项,在残差图中,残差点分布的水平带状区域越窄,说明波动越小,即模型的拟合精度越高,故C正确;D选项,在一元线性回归模型中,决定系数R2越接近于1,说明模型拟合的精度越高,即回归的效果越好,故D正确6(多选)2021年5月18日,佛山市第七次全国人口普查公报发布公报显示,佛山市常住人口为9 498 863人为了进一步分析数据特征,某数学兴趣小组先将近五次人口普查数据作出散点图(横坐标为人口普查的序号,第三次普查记为1,第七次普查记为5,纵坐标为当次人口普查佛山市人口数(单位:万人),再利用不同的函数模型作出回归分析,如图,以下说法正确的是()A佛山市人口数与普查序号呈正相关关系B散点的分布呈现出很弱的线性相关特征C经验回归方程2的拟合效果更好D应用经验回归方程1可以预测第八次人口普查时佛山市人口会超过1 400万人答案AC解析对于A,散点图中的点的分布从左下方至右上方,故呈正相关关系,故A正确;对于B,利用模型1,样本点基本分布在直线的两侧,故具有较强的线性相关特征,故B错误;对于C,因为0.979 4>0.972 6,所以经验回归方程2的拟合效果更好,故C正确;对于D,利用模型1,当x6时,y183.5×61.71 099.3<1 400,故D错误7(2022·广州模拟)某车间为了提高工作效率,需要测试加工零件所花费的时间,为此进行了5次试验,这5次试验的数据如下表:零件数x(个)1020304050加工时间y(min)62a758189若用最小二乘法求得经验回归方程为0.67x54.9,则a的值为_答案68解析由已知30,61,所以610.67×3054.9,解得a68.8(2022·青岛模拟)某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过_附:2,其中nabcd;0.050.0250.0100.001x3.8415.0246.63510.828答案0.025解析由题意可得列联表如下,集中培训分散培训合计一次考过453075一次未考过102030合计555010526.109>5.024x0.025.9(2022·河南九师联盟联考)机动车行经人行横道时,应当减速慢行:遇行人正在通过人行横道,应当停车让行,俗称“礼让行人”如表是某市一主干路口监控设备所抓拍的15月份驾驶员不“礼让行人”行为统计数据:月份12345违章驾驶员人数1201051009580(1)请利用所给数据求违章人数y与月份x之间的经验回归方程x,并预测该路口10月份的不“礼让行人”违章驾驶员人数;(2)交警从这5个月内通过该路口的驾驶员中随机抽查70人,调查驾驶员不“礼让行人”行为与驾龄的关系,如表所示:不礼让行人礼让行人驾龄不超过1年2416驾龄1年以上1614依据小概率值0.1的独立性检验,能否据此判断“礼让行人”行为与驾龄有关?解(1)由表中的数据可知,3,100,所以9,故100(9)×3127,所以所求的经验回归方程为9x127;令x10,则9×1012737.(2)零假设为H0:“礼让行人”行为与驾龄无关,由表中的数据可得20.311<2.706x0.1,根据小概率值0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即依据小概率值0.1的独立性检验,不能判断“礼让行人”行为与驾龄有关10现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素某企业去年前八个月的物流成本和企业利润的数据(单位:万元)如表所示:月份12345678物流成本x8383.58086.58984.57986.5利润y114116106122132114m132残差yi0.20.61.8314.61根据最小二乘法估计公式求得经验回归方程为3.2x151.8.(1)求m的值,并利用已知的经验回归方程求出8月份对应的残差值8;(2)请先求出一元线性回归模型3.2x151.8的决定系数R2(精确到0.000 1);若根据非线性回归模型y267.76ln x1 069.2求得解释变量(物流成本)对于响应变量(利润)的决定系数R0.905 7,请说明以上两种模型哪种模型拟合效果更好?(3)通过残差分析,怀疑残差绝对值最大的那组数据有误,经再次核实后发现其真正利润应该为116万元请重新根据最小二乘法的思想与公式,求出新的经验回归方程附(修正前的参考数据):iyi78 880,56 528,84,(yi)2904.解(1)因为3.2x151.8,84,所以3.2×84151.8117,114116106122132114m132117×8,解得m100,所以8月份对应的残差值81323.2×86.5151.87.(2)由已知公式得(yi)20.220.621.82(3)2(1)2(4.6)2(1)27284.8,R2110.906 2>R,所以一元线性回归模型3.2x151.8拟合效果更好(3)第八组数据的利润应为116万元,此时iyi78 88086.5×1677 496,又56 528,84,117115,所以2.7,1152.7×84111.8,所以重新采集数据后,经验回归方程为2.7x111.8.11某中学调查了高一年级学生的选科倾向,随机抽取300人,其中选考物理的有220人,选考历史的有80人,统计各选科人数如表,则下列说法正确的是()选择科目选考类别思想政治地理化学生物物理类80100145115历史类504530350.100.050.0250.0100.0050.001x2.7063.8415.0246.6357.87910.828A.物理类的学生中选择政治的比例比历史类的学生中选择政治的比例高B物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高C根据小概率值0.1的独立性检验,我们认为选择生物与选考类别无关D根据小概率值0.1的独立性检验,我们认为选择生物与选考类别有关答案C解析对于A,物理类的学生中选择政治的比例为,历史类的学生中选择政治的比例为,因为<,故选项A不正确;对于B,物理类的学生中选择地理的比例为,历史类的学生中选择地理的比例为,因为<,故选项B不正确;对于C和D,零假设为H0:选择生物与选考类别无关根据已知数据可得2×2列联表如表:选生物不选生物合计物理类115105220历史类354580合计150150300所以21.705<2.706x0.1,根据小概率值0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为选择生物与选考类别无关,故选项C正确,选项D不正确12.已知变量y与x的一组数据如表所示,根据数据得到y关于x的经验回归方程为ebx1.x1234ye2e3e5e6若e13,则x等于()A6 B7 C8 D9答案B解析由ebx1,得ln bx1,令zln y,则bx1,由题意知,2.5,4,因为(,)满足bx1,所以4b×2.51,解得b2,所以2x1,所以e2x1,令e2x1e13,解得x7.13(多选)(2022·武汉联考)下列选项中,正确的是()A对于回归分析,样本相关系数r的绝对值越小,说明拟合效果越好B以模型yc·ekx去拟合一组数据时,为了求出经验回归方程,设zln y,将其变换后得到经验回归方程0.3x4,则c,k的值分别是e4和0.3C经验回归方程x中,的符号和样本相关系数r的符号一致D通过经验回归直线x及回归系数,可以精确反映变量的取值和变化趋势答案BC解析对于A,回归分析中,样本相关系数绝对值越大,拟合效果越好,A不正确;对于B,由yc·ekx两边取对数得ln ykxln c,依题意,k0.3,ln c4,即ce4,B正确;对于C,由公式知,C正确对于D,经验回归直线x及回归系数,不能精确反映变量的取值和变化趋势,D不正确14(2022·漳州模拟)根据下面的数据:x1234y32487288求得y关于x的经验回归方程为19.2x12,则这组数据相对于所求的经验回归方程的4个残差的方差为_(注:残差是指实际观测值与预测值之间的差)答案3.2解析把x1,2,3,4依次代入经验回归方程19.2x12,所得预测值依次为131.2,250.4,369.6,488.8,对应的残差依次为0.8,2.4,2.4,0.8,它们的平均数为0,所以4个残差的方差为s23.2.15(多选)已知由样本数据(xi,yi),i1,2,3,4,5,6求得的经验回归方程为2x1,且3.现发现一个样本数据(8,12)误差较大,去除该数据后重新求得的经验回归直线l的纵截距依然是1,则下列说法正确的是()A去除前变量x每增加1个单位,变量y一定增加2个单位B去除后剩余样本数据中x的平均数为2C去除后的经验回归方程为2.5x1D去除后样本相关系数r变大答案BCD解析当3时,2×317,则i618,i642,去除样本数据(8,12)后的新数据,2,6,设去除样本数据(8,12)后重新求得的经验回归方程为x1,则216,解得2.5,故去除后的经验回归方程为2.5x1,C正确;对于A选项,去除前变量x每增加1个单位,变量y大约增加2个单位,A错误;对于B选项,去除后剩余样本数据中x的平均数为2,B正确;对于D选项,去除了误差较大的样本数据后,线性相关性变强,因为y关于x为正相关,则r>0,所以,样本相关系数r变大,D正确16(2022·梅州模拟)某市某医疗器械公司转型升级,从9月1日开始投入呼吸机生产,该公司9月1日9月9日连续9天