《第3讲 变量间相关关系与统计案例.docx》由会员分享,可在线阅读,更多相关《第3讲 变量间相关关系与统计案例.docx(35页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第3讲变量间相关关系与统计案例第 第 3 讲变量间的相关关系与统计案例考纲解读 1.会作两个相关变量的数据的散点图,会利用散点图相识变量间的相关关系;依据最小二乘法求出回来直线方程(重点) 2了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其初步应用考向预料 从近三年高考状况来看,本讲是高考中的一个热点考查内容预料2021 年将会考查:回来直线方程的推断、求解及相关系数的意义,并用其解决实际问题;独立性检验思想在实际问题中的应用试题以解答题的形式呈现,难度为中等此外,也可能出现在客观题中,此时试题难度不大,属中、低档题型.1.相关关系与回来方程 (1)相关关系的分类 正相
2、关:从散点图上看,点散布在从 01 左下角到 02 右上角的区域内,如图 1; 负相关:从散点图上看,点散布在从 03 左上角到 04 右下角的区域内,如图 2.(2)线性相关关系:从散点图上看,假如这些点从整体上看大致分布在 05 一条直线旁边,则称这两个变量之间具有线性相关关系,这条直线叫做 06 回来直线.(3)回来方程 最小二乘法:使得样本数据的点到回来直线的 07 距离的平方和最小的方法叫做最小二乘法 回来方程:两个具有线性相关关系的变量的一组数据(x 1 ,y 1 ),(x 2 ,y 2 ),(x n ,y n ),其回来方程为y b xa,则bi 1n (x i x )(y i
3、y )i 1n (x i x ) 2i 1nx i y i n xyi 1nx 2 i n x 2,a yb x .其中,b是回来方程的 08 斜率,a是在 y 轴上的 09 截距,x 1n ∑ni 1 x i ,y 1n ∑ni 1 y i , 10 ( x , y )称为样本点的中心 说明:回来直线y b xa必过样本点的中心( x , y ),这个结论既是检验所求回来直线方程是否精确的依据,也是求参数的一个依据 (4)样本相关系数 ri 1n (x i x )(y i y )i 1n (x i x ) 2 i 1n (y i y ) 2,用它来衡量两个变量间的线性相关关系
4、 当 r>0 时,表明两个变量 11 正相关; 当 r<0 时,表明两个变量 12 负相关; r 的肯定值越接近 1,表明两个变量的线性相关性 13 越强;r 的肯定值接近于 0,表明两个变量之间几乎不存在线性相关关系通常当|r|>0.75 时,认为两个变量有很强的线性相关关系 2残差分析 (1)残差:对于样本点(x 1 ,y 1 ),(x 2 ,y 2 ),(x n ,y n ),它们的随机误差为 e iy i bx i a,i1,2,n,其估计值为ei y i yi y i bx i a,i1,2,n,ei 称为相应于点(x i ,y i )的残差 (2)残差平方和为&s
5、um;ni 1(y i yi ) 2 . (3)相关指数:R 2 1 01∑ni 1(y i yi ) 2∑ni 1(y i y ) 2 . 3独立性检验 (1)分类变量:变量的不同值表示个体所属的 01 不同类别,像这类变量称为分类变量 (2)列联表:列出两个分类变量的 02 频数表,称为列联表假设有两个分类变量 X 和 Y,它们的可能取值分别为x 1 ,x 2 和y 1 ,y 2 ,其样本频数列联表(称为2×2 列联表)为2×2 列联表y 1y 2总计 x 1a b ab x 2c d cd 总计 ac Bd abcd 构造一个随机变量 K 2 03
6、n(adbc) 2(ab)(cd)(ac)(bd) ,其中 n 04 abcd 为样本容量 (3)独立性检验 利用随机变量 05 K 2 来推断两个分类变量 06 有关系的方法称为独立性检验1概念辨析 (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系() (2)名师出高徒可以说明为老师的教学水平与学生水平成正相关关系() (3)只有两个变量有相关关系,所得到的回来模型才有预料价值() (4)事务 X,Y 关系越亲密,则由观测数据计算得到的 K 2 的观测值越大() (5)由独立性检验可知,有 99%的把握认为物理成果优秀与数学成果有关,某人数学成果优秀,则他有 99%的可能物理优
7、秀() 答案 (1)× (2)√ (3)√ (4)√ (5)× 2小题热身 (1)设回来方程为y 35x,则变量 x 增加一个单位时() Ay 平均增加 3 个单位By 平均削减 5 个单位 Cy 平均增加 5 个单位Dy 平均削减 3 个单位 答案 B 解析 因为5 是斜率的估计值,说明 x 每增加一个单位,y 平均削减 5 个单位故选 B. (2)在下列各图中,两个变量具有相关关系的图是()AB CD 答案 D 解析 为函数关系;明显成正相关;明显成负相关;没有明显相关性 (3)随着国家二孩政策的全面放开,为了调查一线城市和非一线
8、城市的二孩生育意愿,某机构用简洁随机抽样方法从不同地区调查了 100 位育龄妇女,结果如表非一线 一线 总计 愿生 45 20 65 不愿生 13 22 35 总计 58 42 100 算得 K 2 100×(45×2220×13)258×42×35×65≈9.616. 附表:P(K 2 ≥k 0 ) 0.050 0.010 0.001 k 03.841 6.635 10.828 参照附表,得到的正确结论是() A在犯错误的概率不超过0.1%的前提下,认为生育意愿与城市级别有关 B在犯错误的概率不超过 0
9、.1%的前提下,认为生育意愿与城市级别无关 C有 99%以上的把握认为生育意愿与城市级别有关 D有 99%以上的把握认为生育意愿与城市级别无关 答案 C解析 因为 K 2 ≈9.616>6.635,所以有 99%以上的把握认为生育意愿与城市级别有关 (4)已知变量 x,y 具有线性相关关系,它们之间的一组数据如下表所示,若 y关于 x 的回来方程为y 1.3x1,则 m_. x 1 2 3 4 y 0.1 1.8 m 4 答案 3.1 解析 由已知得 x 14 ×(1234)2.5, y 14 (0.11.8m4)14 ×(5.9m) 因为( x ,
10、y )在直线y 1.3x1 上, 所以 y 1.3×2.512.25, 所以 14 ×(5.9m)2.25,解得 m3.1. 题型 一 相关关系的推断1下列两变量中不存在相关关系的是() 人的身高与视力;曲线上的点与该点的坐标之间的关系;某农田的水稻产量与施肥量;某同学考试成果与复习时间的投入量;匀速行驶的汽车的行驶距离与时间;商品的销售额与广告费 AB CD 答案 A 解析 依据相关关系的定义知,中两个变量不存在相关关系 2下列命题中正确的为()A线性相关系数 r 越大,两个变量的线性相关性越强 B线性相关系数 r 越小,两个变量的线性相关性越弱 C残差平方和越小的模
11、型,模型拟合的效果越好 D用相关指数 R 2 来刻画回来效果,R 2 越小,说明模型的拟合效果越好 答案 C 解析 线性相关系数 r 的肯定值越接近于 1,两个变量的线性相关性越强,故 A,B 错误;残差平方和越小,相关指数 R 2 越大,越接近于 1,拟合效果越好,故 C 正确,D 错误 3对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()Ar 2 <r 4 <0<r 3 <r 1 Br 4 <r 2 <0<r 1 <r 3Cr 4 <r 2 <0<r 3 <r 1 Dr 2 <r 4 &
12、lt;0<r 1 <r 3答案 A 解析 易知题中图与图是正相关,图与图是负相关,且图与图中的样本点集中分布在一条直线旁边,则 r 2 <r 4 <0<r 3 <r 1 .故选 A.1判定两个变量正、负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关 (2)相关系数:r>0 时,正相关;r<0 时,负相关|r|越趋近于 1 相关性越强见举例说明 3. (3)线性回来直线方程中:b>0 时,正相关;b<0 时,负相关 2推断拟合效果的两个方法 (1)残差平方和越小,拟合效果
13、越好见举例说明 2. (2)相关指数 R 2 越大,越接近于 1,拟合效果越好1在一组样本数据(x 1 ,y 1 ),(x 2 ,y 2 ),(x n ,y n )(n≥2,x 1 ,x 2 ,x n 不全相等)的散点图中,若全部样本点(x i ,y i )(i1,2,n)都在直线 y 12 x1 上,则这组样本数据的样本相关系数为() A1B0 C. 12 D1 答案 D 解析 全部点均在直线上,则样本相关系数最大即为 1,故选 D. 2四名同学依据各自的样本数据探讨变量 x,y 之间的相关关系,并求得线性回来方程,分别得到以下四个结论:y 与 x 负相关且y 2.347x6.423;
14、 y 与 x 负相关且y 3.476x5.648; y 与 x 正相关且y 5.437x8.493; y 与 x 正相关且y 4.326x4.578. 其中肯定不正确的结论的序号是() AB CD 答案 D 解析 由回来方程y b xa知当b>0 时,y 与 x 正相关,当b<0 时,y 与 x 负相关,∴肯定错误 题型 二 回来分析 角度 1 线性回来方程及应用 1某汽车的运用年数 x 与所支出的修理总费用 y 的统计数据如表:运用年数 x/年 1 2 3 4 5 修理总费用 y/万元 0.5 1.2 2.2 3.3 4.5 依据上表可得 y 关于 x 的线性回来方
15、程y b x0.69,若该汽车修理总费用超过 10 万元就不再修理,干脆报废,据此模型预料该汽车最多可运用(不足 1 年按1 年计算)() A8 年B9 年 C10 年D11 年 答案 D 解析 由y关于x的线性回来直线y b x0.69过样本点的中心(3,2.34),得b1.01,即线性回来方程为y 1.01x0.69,令y 1.01x0.6910,得 x≈10.6,所以预料该汽车最多可运用 11 年故选 D. 2(2019东北三省三校三模)现代社会,鼠标手已成为常见病一次试验中,10 名试验对象进行 160 分钟的连续鼠标点击嬉戏,每位试验对象完成的嬉戏关卡一样,鼠标点击频率平
16、均为 180 次/分钟,试验探讨人员测试了试验对象运用鼠标前后的握力改变,前臂表面肌电频率(sEMG)等指标 (1)10 名试验对象试验前、后握力(单位:N)测试结果如下:试验前:346,357,358,360,362,362,364,372,373,376. 试验后:313,321,322,324,330,332,334,343,350,361. 完成茎叶图,并计算试验后握力平均值比试验前握力的平均值下降了多少 N?(2)试验过程中测得时间 t(分)与 10 名试验对象前臂表面肌电频率(sEMG)的中位数 y(Hz)的九组对应数据(t,y)为(0,87),(20,84),(40,86),(6
17、0,79),(80,78),(100,78),(120,76),(140,77),(160,75)建立 y 关于时间 t 的线性回来方程; (3)若肌肉肌电水平显著下降,提示肌肉明显进入疲惫状态,依据(2)中九组数据分析,运用鼠标多少分钟就该进行休息了? 参考数据:∑9i 1(t i t )(y i y )1800; 参考公式:回来方程y b ta中斜率和截距的最小二乘估计公式分别为:b∑ni 1(t i t )(y i y )∑ni 1(t i t )2,a y b t . 解 (1)依据题意得到茎叶图如右图所示:由图中数据可得 x 1 110 ×(346
18、357358360362362364372373376)363, x 2 110 ×(313321322324330332334343350361)333, ∴ x 1 x 2 36333330(N), ∴故试验前后握力的平均值下降了 30 N. (2)由题意得 t 19 ×(020406080100120140160)80, y 19 ×(878486797878767775)80, ∑9i 1(t i t )2 (080) 2 (2080) 2 (4080) 2 (6080) 2 (8080) 2 (10080) 2
19、(12080) 2 (14080) 2 (16080) 2 24000, 又∑9i 1(t i t )(y i y )1800,∴b∑9i 1(t i t )(y i y )∑9i 1(t i t )2 1800240000.075, ∴a y b t 80(0.075)×8086, ∴y 关于时间 t 的线性回来方程为y 0.075t86. (3)九组数据中 40 分钟到 60 分钟 y 的下降幅度最大,提示 60 分钟时肌肉已经进入疲惫状态,故运用鼠标 60 分钟就该休息了 角度 2 非线性回来模型的应用 3(2
20、019莆田二模)某芯片公司为制定下一年的研发投入安排,需了解年研发资金投入量 x i (单位:亿元)对年销售额 y i (单位:亿元)的影响该公司对历史数据进行对比分析,建立了两个函数模型:yαβx 2 ,ye λx t ,其中 α,β,λ,t 均为常数,e 为自然对数的底数 现该公司收集了近 12 年的年研发资金投入量 x i 和年销售额 y i 的数据,i1,2,12,并对这些数据作了初步处理,得到了如下的散点图及一些统计量的值令 u i x 2 ,v i ln y i (i1,2,12),经计算得如下数据:xyi 1
21、12 (x i x ) 2i 112 (y i y ) 2uv20 66 770 200 460 4.20i 112 (u i u ) 2i 112 (u i u ) i 112 (v i v ) 2i 112 (x i x )(y i y ) (v i v ) 3125000 21500 0.308 14 (1)设u i 和y i 的相关系数为 r 1 ,x i 和v i 的相关系数为 r 2 ,请从相关系数的角度,选择一个拟合程度更好的模型; (2)依据(1)的选择及表中数据,建立 y 关于 x 的回来方程(系数精确到 0.01); 若下一年销售额 y 需达到 90 亿元,预料下一年的研发
22、资金投入量 x 是多少亿元? 附:相关系数 ri 1n (x i x )(y i y )i 1n (x i x ) 2 i 1n (y i y ) 2, 回来直线yabx 中斜率和截距的最小二乘估计公式分别为bi 1n (x i x )(y i y )i 1n (x i x ) 2,a y b x ; 参考数据:3084×77, 90≈9.4868,e 4.4998 ≈90. 解 (1)由题意,r 1 i 112 (u i u )(y i y )i 112 (u i u ) 2 i 112 (y i y ) 2 215003125000×200
23、2150025000 4350 0.86, r 2 i 112 (x i x )(v i v )i 112 (x i x ) 2 i 112 (v i v ) 214770×0.3081477×0.2 1011 ≈0.91, 则|r 1 |<|r 2 |,因此从相关系数的角度,模型 ye λx t 的拟合程度更好 (2)先建立 v 关于 x 的线性回来方程, 由 ye λx t ,得 ln ytλx,即 vtλx; 由于 λi 112 (x i x )(v i v )i 112 (x
24、 i x ) 214770 ≈0.018, t v λ x 4.200.018×203.84, 所以 v 关于 x 的线性回来方程为v0.02x3.84, 所以 ln y 0.02x3.84, 则y e 0.02x 3.84 . 下一年销售额 y 需达到 90 亿元,即 y90, 代入y e 0.02x 3.84 ,得 90e 0.02x 3.84 , 又 e 4.4998 ≈90,所以 4.4998≈0.02x3.84, 所以 x≈ 4.49983.840.0232.99, 所以预料下一年的研发资金投入量约是 32.9
25、9 亿元1利用线性回来方程时的关注点 (1)正确理解计算b,a的公式和精确的计算是求线性回来方程的关键 (2)回来直线方程y b xa必过样本点中心( x , y )见举例说明 1. (3)在分析两个变量的相关关系时,可依据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回来方程来估计和预料 2非线性回来方程的求法(1)依据原始数据(x,y)作出散点图 (2)依据散点图选择恰当的拟合函数 (3)作恰当的变换,将其转化成线性函数,求线性回来方程 (4)在(3)的基础上通过相应变换,即可得非线性回来方程见举例说明 3.1(2019南宁二模)一汽车销售公司对开业
26、 4 年来某种型号的汽车五一实惠金额与销售量之间的关系进行分析探讨并做了记录,得到如下资料 日期 第 1 年 第 2 年 第 3 年 第 4 年 实惠金额 x(千元) 10 11 13 12 销售量 y(辆) 22 24 31 27 经过统计分析(利用散点图)可知 x,y 线性相关 (1)用最小二乘法求出 y 关于 x 的线性回来方程y b xa; (2)若第 5 年实惠金额为 8.5 千元,估计第 5 年的销售量 y(辆)的值 参考公式:bi 1n (x i x )(y i y )i 1n (x i x ) 2i 1nx i y i n xyi 1nx 2 i n x 2, a y b x
27、. 解 (1)由题意,得 x 11.5, y 26, i 14x i y i 1211, i 14x 2 i 534, ∴bi 14x i y i 4 xyi 14x 2 i 4 x 2 12114×11.5×265344×11.5 2 1553, 则a y b x 263×11.58.5.∴y 3x8.5. (2)当 x8.5 时,y 17,∴第 5 年实惠金额为 8.5 千元时,销售量估计为 17辆2对某地区儿童的身高与体重的一组数据,我们用两种模型:ybxa,yce dx 拟合,得到回来方程分别为y
28、 (1) 0.24x8.81,y (2) 1.70e 0.022x ,作残差分析,如下表:身高 x(cm) 60 70 80 90 100 110 体重 y(kg) 6 8 10 14 15 18 e (1)0.41 0.011.21 0.19 0.41 e (2)0.36 0.07 0.12 1.69 0.34 1.12 (1)求表中空格内的值; (2)依据残差比较模型的拟合效果,确定选择哪个模型; (3)若残差大于 1 kg 的样本点被认为是异样数据,应剔除,剔除后对(2)所选择的模型重新建立回来方程(结果保留到小数点后两位) 附:对于一组数据(x 1 ,y 1 ),(x 2 ,y 2 )
29、,(x n ,y n ),其回来直线y b xa的斜率和截距的最小二乘估计分别为b∑ni 1(x i x )(y i y )∑ni 1(x i x ) 2,a y b x . 解 (1)依据残差分析,把 x80 代入y (1) 0.24x8.81 中,得y (1) 10.39. 1010.390.39, ∴表中空格内的值为0.39. (2)模型残差的肯定值的和为 0.410.010.391.210.190.412.62, 模型残差的肯定值的和为 0.360.070.121.690.341.123.7. 2.62<3.7, ∴模型的拟合效果比较好
30、,选择模型. (3)残差大于 1 kg 的样本点被剔除后,剩余的数据如下表:身高 x(cm) 60 70 80 100 110 体重 y(kg) 6 8 10 15 18 e (1)0.41 0.01 0.39 0.19 0.41则 x 84, y 11.4, i 15 (x i x )(y i y )412, i 15 (x i x ) 2 1720, 由公式b∑ni 1(x i x )(y i y )∑ni 1(x i x ) 2,a y b x , 得b≈0.24,a8.76, 得回来方程为y 0.24x8.76. 题型 三 独立性检验1假设有两个分类变量 X
31、 和 Y 的 2×2 列联表如下:Y Xy 1y 2总计 x 1a 10 a10 x 2c 30 c30 总计 60 40 100 对同一样本,以下数据能说明 X 与 Y 有关系的可能性最大的一组为() Aa45,c15Ba40,c20 Ca35,c25Da30,c30 答案 A 解析 依据 2×2 列联表与独立性检验可知,当aa10 与cc30 相差越大时,X与 Y 有关系的可能性越大,即 a,c 相差越大,aa10 与cc30 相差越大故选 A. 2(2019南昌三模)某校高三文科(1)班共有学生 45 人,其中男生 15 人,女生 30 人在一次地理考试后,对成果
32、作了数据分析(满分 100 分),成果为 85 分以上的同学称为地理之星,得到了如下列联表和条形图:地理之星 非地理之星 合计 男生女生合计假如从全班 45 人中随意抽取 1 人,抽到地理之星的概率为 13 .(1)完成地理之星与性别的 2×2 列联表,并回答是否有 90%以上的把握认为获得地理之星与性别有关? (2)若已知此次考试中获得地理之星的同学的成果平均值为 90,方差为7.2,请你推断这些同学中是否有得到满分的同学,并说明理由(得分均为整数分) 参考公式:K 2 n(adbc) 2(ab)(cd)(ac)(bd) ,其中 nabcd. 临界值表:P(K 2 ≥k 0
33、 ) 0.10 0.05 0.010 0.005 0.001 k 02.706 3.841 6.635 7.879 10.828 解 (1)依据题意知地理之星总人数为 45× 13 15,填写列联表如下:地理之星 非地理之星 合计 男生 7 8 15 女生 8 22 30 合计 15 30 45 依据表中数据,计算 K 2 45×(7×228×8)215×30×15×301.8<2.706,所以没有 90%的把握认为获得地理之星与性别有关 (2)没有得满分的同学 记各个分值由高到低分别为 x 1 ,x 2
34、 ,x 15 .若有 2 个以上的满分,则 s 2 115 ×(10090)2 (10090) 2 (x 15 90) 2 > 403>7.2,不符合题意 若恰有 1 个满分,为使方差最小,则其他分值需集中分布在平均数 90 的旁边,且为保证平均值为 90,则有 10 个得分为 89,其余 4 个得分为 90,此时方差取得最小值, ∴s 2 min 115 ×(10090)2 4×(9090) 2 10×(8990) 2 223>7.2,与题意方差为 7.2 不符合, 所以这些同学中没有得满分的同学独立性检验的一般
35、步骤 (1)依据样本数据列出 2×2 列联表; (2)计算随机变量 K 2 的观测值 k,查表确定临界值 k 0 ; (3)假如 k≥k 0 ,就推断X 与 Y 有关系,这种推断犯错误的概率不超过P(K 2 ≥k 0 );否则,就认为在犯错误的概率不超过 P(K 2 ≥k 0 )的前提下不能推断X与 Y 有关系1学生会为了调查学生对 2018 年俄罗斯世界杯的关注是否与性别有关,抽样调查 100 人,得到如下数据:不关注 关注 总计 男生 30 15 45 女生 45 10 55 总计 75 25 100 依据表中数据,通过计算统计量 K 2 n(adbc) 2(
36、ab)(cd)(ac)(bd) ,并参考以下临界数据:P(K 2≥k 0 ) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 若由此认为学生对 2018 年俄罗斯世界杯的关注与性别有关,则此结论出错的概率不超过() A0.10B0.05 C0.025D0.01 答案 A 解析 由题意可得 K 2 100×(30×1015×45)245×55×75
37、×25≈3.030>2.706,由此认为学生对 2018 年俄罗斯世界杯的关注与性别有关出错的概率不超过 0.10.故选A. 2(2018全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取 40 名工人,将他们随机分成两组,每组 20 人,第一组工人用第一种生产方式,其次组工人用其次种生产方式依据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)依据茎叶图推断哪种生产方式的效率更高?并说明理由; (2)求 40 名工人完成生产任务所需时间的中位数 m,并将完成生产任务所需时间超过
38、m 和不超过 m 的工人数填入下面的列联表:超过 m 不超过 m 第一种生产方式 其次种生产方式(3)依据(2)中的列联表,能否有 99%的把握认为两种生产方式的效率有差异? 附:K 2 n(adbc) 2(ab)(cd)(ac)(bd) ,P(K 2 ≥k 0 ) 0.050 0.010 0.001 k 03.841 6.635 10.828 解 (1)其次种生产方式的效率更高理由如下:由茎叶图可知:用第一种生产方式的工人中,有 75%的工人完成生产任务所需时间超过 80 分钟,用其次种生产方式的工人中,有 75%的工人完成生产任务所需时间不超过 79 分钟因此其次种生产方式的效率更高
39、 由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为 85.5 分钟,用其次种生产方式的工人完成生产任务所需时间的中位数为 73.5分钟因此其次种生产方式的效率更高 由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80 分钟;用其次种生产方式的工人完成生产任务平均所需时间低于 80 分钟,因此其次种生产方式的效率更高 由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8 上的最多,关于茎 8 大致呈对称分布;用其次种生产方式的工人完成生产任务所需时间分布在茎 7 上的最多,关于茎 7 大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的
40、区间相同,故可以认为用其次种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此其次种生产方式的效率更高 (以上给出了 4 种理由,考生答出其中随意一种或其他合理理由均可) (2)由茎叶图知 m 7981280.列联表如下:超过 m 不超过 m 第一种生产方式 15 5 其次种生产方式 5 15(3)由于 K 2 的观测值 k 40×(15×155×5)220×20×20×2010>6.635,所以有 99%的把握认为两种生产方式的效率有差异 课时作 业组 基础关 1视察下列各图形:其中两
41、个变量 x,y 具有相关关系的图是() AB CD 答案 C 解析 视察散点图可知,两个变量 x,y 具有相关关系的图是. 2甲、乙、丙、丁四位同学各自对 A,B 两变量的线性相关性做试验,并用回来分析方法分别求得相关系数 r 与残差平方和 m 如下表:甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103 则哪位同学的试验结果体现 A,B 两变量有更强的线性相关性() A甲B乙 C丙D丁 答案 D 解析 在验证两个变量之间的线性相关关系时,相关系数的肯定值越接近 1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差
42、平方和最小,综上可知丁的试验结果体现了 A,B 两个变量有更强的线性相关性故选 D. 3(2019湖北省七市(州)教科研协作体联考)为了规定工时定额,须要确定加工零件所花费的时间,为此进行了 5 次试验,得到 5 组数据:(x 1 ,y 1 ),(x 2 ,y 2 ),(x 3 ,y 3 ),(x 4 ,y 4 ),(x 5 ,y 5 )依据收集到的数据可知 x 1 x 2 x 3 x 4 x 5 100,用最小二乘法求得回来直线方程为y0.67x54.8,则 y 1 y 2 y 3 y 4 y 5 的值为() A68.2B341 C355D366.2 答案 B 解析 由题意,得 x 1005
43、20,将其代入回来直线方程y 0.67x54.8 中,得 y 0.67×2054.868.2,所以 y 1 y 2 y 3 y 4 y 5 5 y 341.故选 B. 4(2020兰州模拟)依据如下样本数据:x 1 2 3 4 5 y a1 1 0.5 b1 2.5 得到的回来方程为y bxa.样本点的中心为(3,0.1),当 x 增加 1 个单位,则 y近似() A增加 0.8 个单位B削减 0.8 个单位 C增加 2.3 个单位D削减 2.3 个单位 答案 A 解析 由题意,知 x 15 ×(12345)3, y 15 ×(a1)(1)0.5(b1)2.5 ab250.1, 又回来直线方程过样本中心点(3,0.1),得 3ba0.1, 由联立,解得 a2.3,b0.8,所以回来直线方程为y 0.8x2.3,所以当 x 增加 1 个单位时,y 近似增加 0.8 个单位 5已知两个随机变量 x,y 之间的相关关系如下表所示:x 4 2 1 2 4y 5 3 1 0.5 1 依据上述数据得到的回来方程为y b xa,则大致可以推断() 参考公式:b∑ni 1 x i y i n xy∑ni 1 x2i n x 2,a y b x A.a>0,b>0B.a>0,b<0 C.a<0,b>0D.a
限制150内