第八章 成对数据的统计分析 单元检测(中等生)(原卷版).docx
第八章成对数据的统计分析章末检测2 (中)第I卷(选择题)一、单选题(每小题5分,共40分)1 .下列两个变量间的关系,是相关关系的是()A.任意实数和它的平方B.圆半径和圆的周长C.正多边形的边数和内角度数之和D.天空中的云量和下雨2 .某学校开展研究性学习活动,某同学获得一组实验数据如下表:X1.99345.16.12y1.54.047.51218.01对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是()A. y = 2x-2B. y = 2x-2(1 VC. y=-D. = log2 xD.3 .已知变量X与y相对应的一组数据为(10,1), (11.3,2), (11.8,3), (12.5,4), (13,5),变量U与V相对应 的一组数据为(0,5), (11.3,4), (11.8,3), (12.5,2), (13,1). 4表示变量X与丫之间的线性相关系数,与表 示变量U与V之间的线性相关系数,则下列结论中正确的是()A.弓 0B.()弓4C.弓 ()4D. r2 = r4 .根据最小二乘法由一组样本点(x,j)(其中i = l,2,L,300),求得的回归方程是¥ =%+机则下列说法 正确的是()A.至少有一个样本点落在回归直线与=加+加上B.若所有样本点都在回归直线§ =耳+上,则变量间的相关系数为1C.当务=_2时,X增加1个单位时,y平均增加2个单位D.若回归直线与=队+的斜率0,则变量x与y正相关5.中国是茶的故乡,也是茶文化的发源地.为了弘扬中国茶文化,某酒店推出特色茶食品"排骨茶",为了 解每壶“排骨茶”中所放茶叶克数与食客的满意率y的关系,调查研究发现,可选择函数模型y =来拟合y与x的关系,根据以下统计数据:茶叶克数X12345ln(100y)4.344.364.444.454.51可求得y关于x的非线性经验回归方程为()a 、,1 0.043a+4.291n 、,1 rtA. y =eB. y =e100100C 、,1rtc 1 -0.043.r+4.291C. y =eD. y =e1001006 .已知变量羽y之间满足线性相关关系9 = L3九-1,且,之间的相关数据如下表所示:则2=()Xi234y0.1m3.14A. 0.8B. 1.8C. 0.6D. 1.67 .某种细胞的存活率y (%)与存放温度x (0)之间具有线性相关关系,其样本数据如下表所示:存放温度x/回20151050-5-10存活率y/%614263343606377计算得1 = 5, 3 = 35, »%=-175, »;=875,并求得经验回归方程为3 = -2x + 45 ,但实验人员发现 i=Z=1表中数据x = -5的对应值y=60录入有误,更正为y = 53.则更正后的经验回归方程为()A. y =-1.94-43.5 B. 5 = 1.9x + 43.5C. $ = L2x + 40D. y = -1.2x+328 .在考察儿童出生月份X与学习成绩V是否优秀的独立性检验中,得出如图的列联表:如果最后发现,这两个分类变量X和y没有任何关系,则表中正数。的值最有可能是()上半年出生下半年出生合计学习成绩优秀2008001000学习成绩非优秀180a180 +。合计380800 + a1180+qA. 200B. 720C. 100D. 690二、多选题(每小题5分,共20分)9 .如图,5个数据(乐),去掉点。(3,10)后,下列说法正确的是()斗E(10,12)0(3,10)f(4,5) 8(2,4)41,3)A.相关系数一变大B.残差平方和变大C.变量x与变量y呈正相关D.变量x与变量y的相关性变强10.下列关于相关系数的说法中,正确的是()A.相关系数-越大,两个变量间线性相关性越强B.相关系数的取值范围是C.相关系数尸0时两个变量正相关,rv。时两个变量负相关D.相关系数 =1时,样本点在同一直线上 11.某班级学生开展课外数学探究活动,将一杯冷水从冰箱中取出后静置,在25。的室温下测量水温y(单位°。)随时间X (单位:min)的变化关系,在测量了 15个数据后,根据这些实验数据(4,)(,= 1,2,15)得到如下的散点图:t温度/2520一,1105-0102030时间/mm现需要选择合适的回归方程进行回归分析,则根据散点图,合适的回归方程类型有()A. y = 25-e ,2'vB. y = 25 + Jqx+C2C. ,= 25-7777D. y = q(x-25)+ C2C Jv I12 .某市为了研究该市空气中的PM2.5浓度和SO2浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了 100天空气中的PM2.5浓度和SC)2浓度(单位:/zg/m3),得到如下所示的2x2列联表:so2PM2.50,150(150,4750,756416(75,1151010n(ad-hcY(a + b)(c + d)(a + c)(b + d)经计算小气掾脏啜J7.4844,则可以推断出()附:K2 =P(K2>k0)0.0500.0100.001k。3.8416.63510.828A.该市一天空气中PM2.5浓度不超过75/0?,且SO?浓度不超过150陷/n?的概率估计值是0.64B.若2x2列联表中的天数都扩大到原来的10倍,片的观测值不会发生变化C.有超过99%的把握认为该市一天空气中PM2.5浓度与SO?浓度有关D.在犯错的概率不超过1%的条件下,认为该市一天空气中PM2.5浓度与SO?浓度有关第H卷(非选择题)三、填空题(每小题5分,共20分)13 .下列说法正确的命题是 (填序号).回归直线过样本点的中心(%,亍);线性回归方程对应的直线m = % + &至少经过其样本数据点(石,凹),。2,必),(天,)中的一个点;在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高;在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好.14 .为了判断某高中学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2x2列联表:已知尸(犬2 3.841)“0.05产仅26.635卜0.01 .根据表中数据,得到三50x(13x20-10x7)2-23x27x20x30« 4.844理科文科男1310女720认为选修文科与性别有关系出错的概率约为15 .以模型y = c*去拟合一组数据时,为了求出回归方程,设z = lny ,其变换后得到线性回归方程z=0.3x+4.则 c=.16 .某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店的个数,先在其中5个地区进行试点,得到试点地区加盟店个数x及单店日平均营业额y (万元)的:数据如下:X12345y10.910.29.07.87.1根据上表可得y关于x线性相关,为保证规模和效益,该公司要求在其他5个地区需满足同一地区所有加盟 店的日平均营业额预计值总和不低于35万元,则一个地区开设的加盟店个数2的所有可能取值为.55(参考数据:2>/ = 125, W>;=55)/=1i=l四、解答题(第17题10分,1822题每题12分,共70分)17.某企业为了对新研发的一批产品进行合理定价,将产品按事先拟定的价格进行试销,得到一组销售数据(七,乂)0 = 1, 2,6),如表所示:试销单价%(元)456789产品销量y(件)90848380q68已知y=80 .求表格中的值;已知变量x, y具有线性相关性,试利用最小二乘法原理,求产品销量V关于试销单价X的线性回归方程66灰歹£ = % + ©(参考数据: »)= 3050,»:=271,参考公式:B = Rya = y-hx);22九;一位2z=l用中的回归方程得到的与工对应的产品销量的估计值记为y(i = l, 2,,6) .当It-xl,l时,则称(以V)为一个“理想数据”.试确定销售单价分别为4, 5, 6时有哪些是“理想数据”.18.购鞋时常常看到下面的表格.脚长与鞋号对应表脚长(mm)220225230235240245250255260鞋号343536373839404142若将表中两行数据看成数列,记脚长为数列%,鞋号为数列抄,试写出/关于的表达式,并估计30号童鞋所对应的脚长是多少mm?有人认为可利用线性回归模型拟合脚长xmm和鞋号y之间的关系,请说明合理性;若一名篮球运动员脚£=21(七一 司(一歹) 一八a = y-bx长为282mm,请判断该运动员穿多大号的鞋?请说明理由.元)5-9)参考公式:一厂I无)5(»-丹V /=1/=119. 2021年8月8日是我国第13个全民健身日,社会上参与全民健身活动的人越来越多,小明也有大量好友参与了健步团,他随机选取了其中的40人,记录了他们某一天的走路步数,并将数据整理如下:性别步量50016000600170007001800080019000>9000男12368女021062若在小明该日走路不超过7000步的好友中任选2人,求至少有1名男性的概率;如果每人一天的走路步数超过8000步就会被系统评定为健步型,否则为良好型,根据题意完成下面 的2x2列联表,并据此判断能否有95%以上的把握认为评定类型与性别有关健步型良好型总计男女总计附:先考八个Ki=几皿一儿丫多个么八 一(Q + 0)(c+d)(a + c)(b + d)临界值表:P(K2 > k)0.100.050.0250.010k。2.7063.8415.0246.63520.新个体经济是中国经济社会数字化转型条件下出现的新生事物,指微商电商,网络直播、职业创作者等,下表是2021年1至4月份某市新增微商电商的统计数据:月份1234新增微商电商个数90105125140请利用所给数据求新增微商电商个数与月份x之间的线性回归方程与二/+机并预测该市2021年5月新增微商电商的个数(结果用四舍五入法保留整数);一般认为当卜|20.9时-,线性回归方程的拟合效果非常好;当0.754M<0.9时,线性回归方程的拟合效果x-nxyi=lTn/_、( 一2、;一小)一4;-心) /=!/=!J良好.试问该线性回归方程的拟合效果是非常好还是良好?说明你的理由.X xj 一 x y力(七一 4 (必 一 y)/=,=i“/ 2 -"/=1 /=13=$发,V290« 17.0294, a/330 « 18.1659 , 7370 « 19.2354 .21.某县为了解乡村经济发展情况,对全县乡村经济发展情况进行调研,现对2012年以来的乡村经济收入y (单位:亿元)进行了统计分析,制成如图所示的散点图,其中年份代码X的值110分别对应2012年至2021年. 乡村经济收入y(亿元)90 80 -. 70 . 60-.0123456789 10 年份代码 x若用模型/ = & +5-a + B五拟合y与X的关系,其相关系数分别为4=。.8519, 4=0.9901,试判断哪个模型的拟合效果更好?根据(1)中拟合效果更好的模型,求y关于X的回归方程(系数精确到0.01),并估计该县2025年的乡村经济收入(精确到0.01).公式分别为人=J;, a = y-ht.X") i=l22.某印刷企业为了研究某种图书每册的成本费y (单位:元)与印刷数量白了些数据并进行了初步整理,得到了下面的散点图及些统计量的值.1每册成本费历元20 15 -10 -5 -.:?Pa0 5 10 15 20 25 30印刷数量x/千册:(单位:千册)的关系,收集参考公式:对于一组数据(4,x),(G%),(*以),回归方程$ = © +所中的斜率和截距的最小二乘估计_10ytf=li=io /i=10 ,i=l72.652.25126.254.52235.4849.16参考数据:募,/旧。3.605, 7143,742,3.8731U ;=i1 VX7U力(百一到 i=72(玉-可(x歹)Z = 17.£(%-拓) / = !7Z(%万)(%歹)/=153.50.22300.77表中%=,"=亍2?仇Xi/ /=1根据散点图判断:尸。+版与y = c+&哪一个模型更适合作为该图书每册的成本费y与印刷数量%的回归 X方程?(只要求给出判断,不必说明理由)根据(1)的判断结果及表中数据建立y关于X的回归方程(结果精确到0.1);若该图书每册的定价为9元,则至少应该印刷多少册,才能使销售利润不低于80000元(假设能够全部售出).附:对于一组数据(外,匕),(?,岭),(4#),其回归直线u =的斜率和截距的最小二乘法估计人 £(秋一句(匕一万)分别为:8 = 、, a = v-p(d.之(利一而/=1