2025高考帮备考教案数学第九章 统计与成对数据的统计分析第3讲 成对数据的统计分析含答案.docx
-
资源ID:97492428
资源大小:537.51KB
全文页数:28页
- 资源格式: DOCX
下载积分:9.99金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
2025高考帮备考教案数学第九章 统计与成对数据的统计分析第3讲 成对数据的统计分析含答案.docx
2025高考帮备考教案数学第九章统计与成对数据的统计分析第3讲成对数据的统计分析课标要求命题点五年考情命题分析预测1.了解样本相关系数的统计含义,了解样本相关关系与标准化数据向量夹角的关系;会通过相关系数比较多组成对数据的相关性.2.了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法;针对实际问题,会用一元线性回归模型进行预测.3.理解2×2列联表的统计意义;了解2×2列联表独立性检验及其应用.成对数据的相关性2023天津T7,2022全国卷乙T19;2020全国卷T18本讲是高考命题热点.对于回归分析,主要考查散点图,回归方程类型的识别,求相关系数和回归方程,利用回归方程进行预测等;对于独立性检验,主要考查列联表和依据小概率值的独立性检验,常与概率综合命题.题型以解答题为主,难度中等.预计2025年高考会以创新生产生活实践情境为载体考查回归分析和独立性检验.回归模型及其应用2020全国卷T5列联表与独立性检验2023全国卷甲T19;2022新高考卷T20;2022全国卷甲T17;2021全国卷甲T17;2020新高考卷T19;2020全国卷T18学生用书P2171.变量的相关关系(1)正相关和负相关:从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.(2)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.(3)非线性相关或曲线相关:一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.2.样本相关系数(1)样本相关系数ri=1n(xix)(yiy)i=1n(xix)2i=1n(yiy)2.(2)样本相关系数r的性质当r0时,称成对样本数据正相关;当r0时,称成对样本数据负相关;当r0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.r1.当r越接近于1,成对样本数据的线性相关性越强;r越接近于0,成对样本数据线性相关性越弱.3.一元线性回归模型(1)一元线性回归模型我们称Ybxae,E(e)=0,D(e)2为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bxa之间的随机误差.(2)经验回归方程与最小二乘估计经验回归方程:ybxa.最小二乘估计:bni=1(xix)(yiy)ni=1(xix)2ni=1xiyinx yni=1xi2nx2,aybx.说明经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.经验回归直线过点(x,y).(3)残差对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的y称为预测值,观测值减去预测值称为残差.(4)决定系数决定系数R2用来比较两个模型的拟合效果,R21i=1n(yiyi)2i=1n(yiy)2.其中i=1n(yiyi)2是残差平方和,R2越大(越接近1),表示残差平方和越小,即模型的拟合效果越好;R2越小,表示残差平方和越大,即模型的拟合效果越差.4.列联表与独立性检验(1)2×2列联表一般地,假设有两个分类变量X和Y,它们的取值为0,1,其样本频数列联表(称为2×2列联表)为:XY合计Y0Y1X0ababX1cdcd合计acbdnabcd(2)独立性检验2=n(adbc)2(ab)(cd)(ac)(bd).利用2的取值推断分类变量X和Y是否独立的方法称为2独立性检验,读作“卡方独立性检验”,简称独立性检验.(3)临界值对于任何小概率值,可以找到相应的正实数x,使得P(2x)成立,我们称x为的临界值,这个临界值可作为判断2大小的标准.概率值越小,临界值x越大.下表给出了2独立性检验中5个常用的小概率值和相应的临界值.0.10.050.010.0050.001x2.7063.8416.6357.87910.828(4)基于小概率值的检验规则当2x时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;当2x时,我们没有充分证据推断H0不成立,可以认为X和Y独立.说明若2越大,则两个分类变量有关的把握越大.1.下列四个散点图中,变量x与y之间具有负的线性相关关系的是(D)2.下列说法正确的是(D)A.在经验回归方程y0.85x2.3中,当解释变量x每增加1个单位时,响应变量平均减少2.3个单位B.若两个变量的相关性越强,则r越接近于1C.在回归分析中,决定系数R20.80的模型比决定系数R20.98的模型拟合的效果要好D.残差平方和越小的模型,拟合的效果越好解析对于A,根据经验回归方程,当解释变量x每增加1个单位时,响应变量y平均减少0.85个单位,故A错误;对于B,若两个变量的相关性越强,则r越接近于1,故B错误;对于C,用决定系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好,所以C错误;对于D,由残差的统计学意义知,D正确.3.为考查某种营养品对儿童身高增长的影响,选取部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表,由表可知下列说法正确的是(D)营养品身高合计有明显增长无明显增长食用a1050未食用b3050合计6040100A.ab30B. 212.667C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是35D.根据小概率值0.001的独立性检验,可以认为该营养品对儿童身高增长有影响解析由题可知a501040,b503020,所以A错误;2100×(40×3010×20)250×50×60×4016.667 10.828x0.001,所以根据小概率值0.001的独立性检验,可以认为该营养品对儿童身高增长有影响,所以B错误,D正确;从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是4010025,所以C错误.4.2023福州5月质检已知变量x和y的统计数据如下表:x678910y3.54566.5若由表中数据得到经验回归方程为y0.8xa,则x10时的残差为0.1.(注:观测值减去预测值称为残差)解析易知x8,y5,a50.8×81.4,x10时,y81.46.6,x10时的残差为6.56.60.1.学生用书P219命题点1成对数据的相关性角度1判断两个变量的相关性例1 (1)已知变量x和y近似满足关系式y0.1x1,变量y与z正相关.下列结论中正确的是(C)A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关解析由y0.1x1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,随y的减小而减小,所以z随x的增大而减小,x与z负相关.(2)2023湖北仙桃中学模拟对四组数据进行统计后,获得了如图所示的散点图,四组数据的相关系数分别为r1,r2,r3,r4,对各组的相关系数进行比较,正确的是(C)第一组第二组第三组第四组A.r3r20r1r4B.r4r10r2r3C.r2r30r4r1D.r1r40r3r2解析由题图可知,第一、四组数据均正相关,第二、三组数据均负相关,当相关系数的绝对值越大时,数据的线性相关性越强.第一组数据的线性相关性较第四组强,则r1r40,第二组数据的线性相关性较第三组强,则r2r3,且r20,r30,则r2r30.因此,r2r30r4r1.故选C.方法技巧判断两个变量相关性的3种方法画散点图若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关.利用样本相关系数r0时,正相关;r0时,负相关;r越接近于1,线性相关性越强.利用经验回归方程b0时,正相关;b0时,负相关.角度2相关系数的计算例2 2022全国卷乙某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i12345678910总和根部横截面积xi0.040.060.040.080.080.050.050.070.070.060.6材积量yi0.250.400.220.540.510.340.360.460.420.403.9并计算得10i=1xi20.038,10i=1yi21.615 8,10i=1xiyi0.247 4.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数rni=1(xix)(yiy)ni=1(xix)2ni=1(yiy)2,1.8961.377.解析(1)估计该林区这种树木平均一棵的根部横截面积xi=110xi100.6100.06,估计该林区这种树木平均一棵的材积量yi=110yi103.9100.39.(2)i=110(xix)(yiy)i=110xiyi10xy0.013 4,i=110(xix)2i=110xi210x20.002,i=110(yiy)2i=110yi210y20.094 8,所以i=110(xix)2i=110(yiy)20.002×0.094 80.000 1×1.8960.01×1.3770.013 77,所以样本相关系数ri=110(xix)(yiy)i=110(xix)2i=110(yiy)20.013 40.013 770.97.(3)设该林区这种树木的总材积量的估计值为Y m3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以0.390.06Y186,所以Y186×0.390.061 209,即该林区这种树木的总材积量的估计值为1 209 m3.训练1 变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则(C)A.r2r10B.0r2r1C.r20r1D.r2r1解析由题中的数据可知,变量Y与X正相关,相关系数r10,变量V与U负相关,相关系数r20,即r20r1.故选C.命题点2回归模型及其应用角度1一元线性回归模型例3 2023广西联考某省为调查北部城镇2022年GDP,抽取了20个城镇进行分析,得到样本数据(xi,yi)(i1,2,20),其中xi和yi分别表示第i个城镇的人口(单位:万人)和该城镇2022年GDP(单位:亿元),计算得i=120xi100,i=120yi800,i=120(xix)270,i=120(yiy)2280,i=120(xix)(yiy)120.(1)请用相关系数r判断该组数据中y与x之间线性相关关系的强弱(若r0.75,1,相关性较强;若r0.30,0.75),相关性一般;若r0.25,0.25,相关性较弱).(2)求y关于x的线性回归方程.(3)若该省北部某城镇2024年的人口约为5万人,根据(2)中的线性回归方程估计该城镇2024年的GDP.参考公式:相关系数ri=1n(xix)(yiy)i=1n(xix)2i=1n(yiy)2,对于一组具有线性相关关系的数据(xi,yi)(i1,2,n),其回归直线ybxa的斜率和截距的最小二乘估计分别为bi=1n(xix)(yiy)i=1n(xix)2,aybx.解析(1)由题意知,相关系数ri=120(xix)(yiy)i=120(xix)2i=120(yiy)212070×2801201400.857,因为y与x的相关系数r满足r0.75,1,所以y与x之间具有较强的线性相关关系.(2)bi=120(xix)(yiy)i=120(xix)212070127,aybx80020127×100202207,所以y127x2207.(3)由(2)可估计该城镇2024年的GDP y127×5220740(亿元).方法技巧回归模型问题的类型及解题方法(1)求经验回归方程:利用数据,求出x,y;利用公式,求出回归系数b;利用经验回归直线过样本点的中心(x,y),求a .(2)利用经验回归方程进行预测:直接将已知的自变量的某个数值代入经验回归方程求得特定要求下的预测值.(3)判断回归模型的拟合效果:利用残差平方和或决定系数R2判断,R2越大,表示残差平方和越小,即模型的拟合效果越好.角度2非线性回归模型例4 2023重庆市三检已知变量y关于x的经验回归方程为y=ebx-0.6,若对y=ebx-0.6两边取自然对数,可以发现ln y与x线性相关,现有一组数据如表所示:x12345yee3e4e6e7则当x6时,预测y的值为(C)A.9B.8C.e9D.e8解析对yebx0.6两边取自然对数,得ln ybx0.6,令zln y,则 zbx0.6,数据为x12345yee3e4e6e7z13467由表格数据,得x1+2+3+4+553,z1+3+4+6+754.2.将(3,4.2)代入zbx0.6,得4.2=3b-0.6,(方法技巧:经验回归方程只含一个未知数问题主要是依据经验回归直线y=bxa必过样本点的中心(x,y)求解)解得b1.6,所以z1.6x-0.6,即y=e1.6x-0.6.当x6时,y=e1.6×6-0.6=e9,故选C.方法技巧1.解决非线性回归模型问题的思路:根据数据的散点图,选择恰当的拟合函数,用适当的变量进行转换,如通过换元或取对数等方法,把问题化为线性回归模型问题,使之得到解决.2.常见的非线性回归模型及转换技巧(1)y=a+bx,令v1x,则y=a+bv;(2)y=a+bln xb0,令vln x,则yabv;(3)yaxb(a0,b0),令cln a,vln x,uln y,则ucbv;(4)yaebx(a0,b0),令cln a,uln y,则ucbx.训练2 2023合肥市质检研究表明,温度的突然变化会引起机体产生呼吸道上皮组织的生理不良反应,从而导致呼吸系统疾病的发生或恶化.某中学数学建模社团成员欲研究昼夜温差大小与该校高三学生患感冒人数多少之间的关系,他们记录了某周连续六天的昼夜温差,并到校医务室查阅了这六天中每天高三学生新增患感冒而就诊的人数(假设患感冒必到校医务室就诊),得到资料如下:日期第一天第二天第三天第四天第五天第六天昼夜温差x/47891412新增就诊人数y/位y1y2y3y4y5y6参考数据:i=16yi23 160,i=16(yiy)2256.(1)已知第一天新增患感冒而就诊的学生中有7位女生,从第一天新增患感冒而就诊的学生中随机抽取3位,若抽取的3人中至少有一位男生的概率为1724,求y1的值;(2)已知两个变量x与y之间的样本相关系数r1516,试用最小二乘法求出y关于x的经验回归方程ybxa,据此估计昼夜温差为15 时,该校高三新增患感冒而就诊的学生数(结果保留整数).参考公式:bi=1n(xix)(yiy)i=1n(xix)2,ri=1n(xix)(yiy)i=1n(xix)2·i=1n(yiy)2.解析(1)1C73Cy131724,7×6×5y1(y11)(y12)724,y1(y11)(y12)72010×9×8,y110.(2)i=16xi54,x9,i=16(xix)264.ri=16(xix)(yiy)i=16(xix)2·i=16(yiy)2i=16(xix)(yiy)8×161516,i=16(xix)(yiy)8×15,bi=16(xix)(yiy)i=16(xix)28×1564158.又i=16(yiy)2i=16yi22y·i=16yi6y2i=16yi26y2256,解得y22,aybx22158×9418,y418158x,当x15时,y418158×1533,故可以估计昼夜温差为15 时,该校高三新增患感冒而就诊的学生数为33.命题点3列联表与独立性检验例5 2022全国卷甲改编甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)依据小概率值0.1的独立性检验,分析甲、乙两城之间的长途客车是否准点与客车所属公司有关.附: 2n(adbc)2(ab)(cd)(ac)(bd),nabcd.0.10.0500.0100.001x2.7063.8416.63510.828解析(1)由题表可得A公司甲、乙两城之间的长途客车准点的概率为240240+201213,B公司甲、乙两城之间的长途客车准点的概率为210210+3078.(2)零假设为H0:甲、乙两城之间的长途客车是否准点与客车所属公司无关.根据2×2列联表,可得2500×(240×3020×210)2(240+20)×(210+30)×(240+210)×(20+30)3.2052.706x0.1,根据小概率值0.1的独立性检验,我们推断H0不成立,即认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.方法技巧独立性检验的一般步骤(1)提出零假设H0;(2)根据样本数据制成2×2列联表;(3)根据公式2n(adbc)2(ab)(cd)(ac)(bd)计算2;(4)比较2与临界值x的大小关系,根据检验规则得出推断结论.训练3 某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1 000名骑行人员中,记录其年龄(单位:岁)和是否佩戴头盔情况,得到如图所示的统计图:(1)估算该市电动自行车骑乘人员的平均年龄.(2)根据所给的数据,完成下面的列联表:单位:名年龄/岁是否佩戴头盔合计是否20,40)40,70合计(3)根据(2)中的列联表,依据0.010的独立性检验,能否认为遵守佩戴安全头盔规则与年龄有关?附:2n(adbc)2(ab)(cd)(ac)(bd),nabcd.0.0500.0100.001x3.8416.63510.828解析(1)该市电动自行车骑乘人员的平均年龄为25×0.2535×0.3545×0.255×0.1565×0.0539(岁).(2)依题意,完成列联表如下:单位:名年龄/岁是否佩戴头盔合计是否20,40)5406060040,7034060400合计8801201 000(3)零假设为H0:遵守佩戴安全头盔规则与年龄无关.由表得21 000×(540×60340×60)2600×400×880×120125225.6826.635x0.010,根据小概率值0.010的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为遵守佩戴安全头盔规则与年龄无关.1.命题点1角度1/2023天津高考调查某种群花萼长度和花瓣长度,所得数据如图所示.其中相关系数r0.824 5,下列说法正确的是(C)A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈负相关C.花瓣长度和花萼长度呈正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5解析因为相关系数r0.824 50.75,所以花瓣长度和花萼长度的相关性较强,并且呈正相关,所以选项A,B错误,选项C正确;因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也会发生变化,所以选项D错误.故选C.2.命题点1,2/2024济南市摸底考试随着科技的发展,网购成了人们购物的重要选择,并对实体经济产生了一定影响.为了解实体经济的现状,某研究机构统计了一个大商场20182022年的线下销售额,如下表:年份编号x12345年份20182019202020212022销售额y/万元1 5131 4651 2021 060860(1)由表中数据可以看出,可用经验回归模型拟合销售额y与年份编号x的关系,请用相关系数加以说明;(2)建立y关于x的经验回归方程,并预测2024年该商场的线下销售额.参考公式及数据:相关系数ri=1nxiyinx y(i=1nxi2nx2)(i=1nyi2ny2).对于一组数据(x1,y1),(x2,y2),(xn,yn),其经验回归直线yabx的斜率和截距的最小二乘估计公式分别为bi=1nxiyinx yi=1nxi2nx2,aybx.i=15yi6 100,i=15xiyi16 589,(i=15xi25x2)(i=15yi25y2)1 736.解析(1)由已知数据可得,x1+2+3+4+553,yi=15yi56 10051 220,所以i=15xiyi5x y16 5895×3×1 2201 711,所以相关系数ri=15xiyi5x y(i=15xi25x2)(i=15yi25y2)1 7111 7360.985 6.因为r非常接近1,所以可用经验回归模型拟合销售额y与年份编号x的关系.(2)由已知数据可得,i=15xi2122232425255,所以bi=15xiyi5x yi=15xi25x21 711555×32171.1,aybx1 220(171.1)×31 733.3,所以y关于x的经验回归方程为y171.1x1 733.3.令x7,则y171.1×71 733.3535.6(万元),所以预测2024年该商场的线下销售额为535.6万元.3.命题点3/2021全国卷甲改编甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:单位:件一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)依据小概率值0.01的独立性检验,分析甲机床的产品质量与乙机床的产品质量是否有差异.附:2n(adbc)2(ab)(cd)(ac)(bd),nabcd.0.0500.0100.001x3.8416.63510.828解析(1)由题意,可得甲机床、乙机床生产的产品总数均为200件,因为甲机床生产的产品中一级品的频数为150,所以甲机床生产的产品中一级品的频率为1502000.75,因为乙机床生产的产品中一级品的频数为120,所以乙机床生产的产品中一级品的频率为1202000.6.(2)零假设为H0:甲机床的产品质量与乙机床的产品质量无差异.则根据列联表中的数据计算得2400×(150×8050×120)2200×200×270×13010.2566.635x0.01.所以依据小概率值0.01的独立性检验,推断H0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异,此推断犯错误的概率不大于0.01.学生用书·练习帮P3781.在用经验回归方程研究四组数据的拟合效果时,分别作出下列四个关于四组数据的残差图,则用线性回归模型拟合效果最佳的是(A)ABCD解析用残差图判断模型的拟合效果时,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合效果越好.故选A.2.全国卷某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i1,2,20)得到如图所示的散点图.由此散点图,在10 至40 之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是(D)A.yabxB.yabx2C.yabexD.yabln x解析由散点图可以看出,随着温度x的增加,发芽率y增加到一定程度后,变化率越来越慢,符合对数型函数的图象特征.3.2024江苏徐州模拟如图,在一组样本数据A(2,2),B(4,3),C(6,4),D(8,7),E(10,6)的散点图中,若去掉D(8,7),则下列说法正确的为(D)A.样本相关系数r变小B.残差平方和变大C.决定系数R2变小D.自变量x与因变量y的相关程度变强解析由散点图分析可知,只有D点偏离直线较远,去掉D点后,x与y的线性相关程度变强,且为正相关,所以样本相关系数r变大,决定系数R2变大,残差平方和变小,故选D.4.2024青岛市检测已知某设备的使用年限x(年)与年维护费用y(千元)的对应数据如下表:x24568y34.56.57.59由所给数据分析可知:x与y之间具有线性相关关系,且y关于x的经验回归方程为y1.05xa,则a(B)A.0.75B.0.85C.0.95D.1.05解析由题意可知x2+4+5+6+855,y3+4.5+6.5+7.5+956.1,则6.11.05×5a,所以a6.11.05×50.85,故选B.5.多选/2024九江模拟根据最小二乘法,由一组样本点(xi,yi)(其中i1,2,300)求得的经验回归方程是ybxa,则下列说法正确的是(BD)A.至少有一个样本点落在经验回归直线ybxa上B.若所有样本点都在经验回归直线ybxa上,则变量间的相关系数为±1C.对所有的解释变量xi(i1,2,300),bxia的值一定与yi有误差D.若经验回归直线ybxa的斜率b0,则变量x与y正相关解析经验回归直线必过样本点的中心,但样本点可能都不在经验回归直线上,故A错误;若所有样本点都在经验回归直线ybxa上,则变量间的相关系数为±1,故B正确;若所有的样本点都在经验回归直线ybxa上,则bxia的值与yi相等,故C错误;相关系数r与b符号相同,若经验回归直线ybxa的斜率b0,则r0,样本点散布在从左下角到右上角的区域,则变量x与y正相关,故D正确.故选BD.6.多选/2024贵州统考某学校高三年级甲、乙两班共105人进行了一次数学测试.按照成绩大于或等于120分(满分150分)的同学评价为“优秀生”,其他分数的同学评价为“潜力生”进行整体水平评价,得到下面表(1)所示的列联表.已知在这105人中随机抽取1人,“优秀生”的概率为27,根据表(2)的数据,可断定下列说法正确的是(BC)表(1)单位:人班级成绩合计优秀生潜力生甲班10b乙班c30合计105表(2)0.050.010.001x3.8416.63510.828A.列联表中c的值为30,b的值为35B.列联表中c的值为20,b的值为45C.根据列联表中的数据,有95的把握认为成绩与班级有关D.根据列联表中的数据,没有95的把握认为成绩与班级有关解析因为在这105人中随机抽取1人,“优秀生”的概率为27,所以“优秀生”的人数为105×2730,“潜力生”的人数为1053075,所以c301020,b753045,故A错B对;因为2105×(10×3020×45)230×75×50×556.1093.841,所以有95的把握认为成绩与班级有关,故C对D错.故选BC.7.多选/2024云南师大附中月考已知变量x,y之间的经验回归方程为y10.30.7x,且变量x,y的数据如表所示,则下列说法正确的是(BC)x681012y6m32A.变量x与y正相关B.实数m的值为5C.该经验回归直线必过点(9,4)D.相应于(10,3)的残差为0.3解析由表格数据得,x6+8+10+1249,y6+m+3+2411+m4,将点(9,11+m4)代入经验回归方程y10.30.7x得,11+m410.30.7×9,解得m5,所以选项B正确;11+m44,即样本点的中心为(9,4),所以选项C正确;当变量x增加时,变量y相应值减少,两个变量负相关,所以选项A错误;由残差的定义知,观测值减去预测值为残差,由经验回归方程y10.30.7x,令x10,得预测值y3.3,则相应于(10,3)的残差为33.30.3,所以选项D错误.故选BC.8.2024海南月考某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:单位:人性别专业合计非统计专业统计专业男131023女72027合计203050为了判断主修统计专业是否与性别有关系,根据表中的数据,得到250×(13×2010×7)223×27×20×304.844,因为23.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性最大为 5.附:0.100.050.0100.001x2.7063.8416.63510.828解析因为23.841x0.05,所以依据小概率值0.05的独立性检验,认为主修统计专业与性别有关,出错的可能性最大为5.9.某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内、国外潜在用户代表各100名,调查用户对是否使用该手机的态度,得到如图所示的等高堆积条形图.根据等高图,依据小概率值0.005的独立性检验,能(填“能”或“不能”)认为持乐观态度和国内外差异有关.附: 2n(adbc)2(ab)(cd)(ac)(bd),nabcd.0.010.0050.001x6.6357.87910.828解析零假设为H0:持乐观态度和国内外差异无关.由题填写2×2列联表如下,单位:名潜在客户态度合计乐观不乐观国内代表6040100国外代表4060100合计100100200根据列联表得2200×(60×6040×40)2100×100×100×10087.879x0.005,所以依据小概率值0.005的独立性检验,我们推断H0不成立,即能认为持乐观态度和国内外差异有关.10.2024武汉部分学校调考某校为考查学生对紧急避险知识的掌握情况,从全校学生中选取200名学生进行紧急避险知识测试,其中男生110名,女生90名.所有学生的测试成绩(单位:分)都在区间50,100内,由测试成绩数据作出如图所示的频率分布直方图.(1)若从频率分布直方图中估计出样本的平均数与中位数相等,求图中m的值;(2)规定测试成绩不低于80分为优秀,已知共有45名男生测试成绩优秀,完成下面的列联表,并根据小概率值0.05的独立性检验,能否推断男生和女生的测试成绩优秀率有差异?单位:人性别