2025高考帮备考教案数学第九章 统计与成对数据的统计分析第3讲 成对数据的统计分析含答案.docx
《2025高考帮备考教案数学第九章 统计与成对数据的统计分析第3讲 成对数据的统计分析含答案.docx》由会员分享,可在线阅读,更多相关《2025高考帮备考教案数学第九章 统计与成对数据的统计分析第3讲 成对数据的统计分析含答案.docx(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2025高考帮备考教案数学第九章统计与成对数据的统计分析第3讲成对数据的统计分析课标要求命题点五年考情命题分析预测1.了解样本相关系数的统计含义,了解样本相关关系与标准化数据向量夹角的关系;会通过相关系数比较多组成对数据的相关性.2.了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法;针对实际问题,会用一元线性回归模型进行预测.3.理解22列联表的统计意义;了解22列联表独立性检验及其应用.成对数据的相关性2023天津T7,2022全国卷乙T19;2020全国卷T18本讲是高考命题热点.对于回归分析,主要考查散点图,回归方程类型的识
2、别,求相关系数和回归方程,利用回归方程进行预测等;对于独立性检验,主要考查列联表和依据小概率值的独立性检验,常与概率综合命题.题型以解答题为主,难度中等.预计2025年高考会以创新生产生活实践情境为载体考查回归分析和独立性检验.回归模型及其应用2020全国卷T5列联表与独立性检验2023全国卷甲T19;2022新高考卷T20;2022全国卷甲T17;2021全国卷甲T17;2020新高考卷T19;2020全国卷T18学生用书P2171.变量的相关关系(1)正相关和负相关:从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个
3、变量的相应值呈现减小的趋势,则称这两个变量负相关.(2)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.(3)非线性相关或曲线相关:一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.2.样本相关系数(1)样本相关系数ri=1n(xix)(yiy)i=1n(xix)2i=1n(yiy)2.(2)样本相关系数r的性质当r0时,称成对样本数据正相关;当r0时,称成对样本数据负相关;当r0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.r1.当r越接近于1,成对样本数据的线
4、性相关性越强;r越接近于0,成对样本数据线性相关性越弱.3.一元线性回归模型(1)一元线性回归模型我们称Ybxae,E(e)=0,D(e)2为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bxa之间的随机误差.(2)经验回归方程与最小二乘估计经验回归方程:ybxa.最小二乘估计:bni=1(xix)(yiy)ni=1(xix)2ni=1xiyinx yni=1xi2nx2,aybx.说明经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.经验回归直线过点(x,y).(3)残差对
5、于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的y称为预测值,观测值减去预测值称为残差.(4)决定系数决定系数R2用来比较两个模型的拟合效果,R21i=1n(yiyi)2i=1n(yiy)2.其中i=1n(yiyi)2是残差平方和,R2越大(越接近1),表示残差平方和越小,即模型的拟合效果越好;R2越小,表示残差平方和越大,即模型的拟合效果越差.4.列联表与独立性检验(1)22列联表一般地,假设有两个分类变量X和Y,它们的取值为0,1,其样本频数列联表(称为22列联表)为:XY合计Y0Y1X0ababX1cdcd合计acbdnabcd(2)独立性检验2=n(adbc)2(ab
6、)(cd)(ac)(bd).利用2的取值推断分类变量X和Y是否独立的方法称为2独立性检验,读作“卡方独立性检验”,简称独立性检验.(3)临界值对于任何小概率值,可以找到相应的正实数x,使得P(2x)成立,我们称x为的临界值,这个临界值可作为判断2大小的标准.概率值越小,临界值x越大.下表给出了2独立性检验中5个常用的小概率值和相应的临界值.0.10.050.010.0050.001x2.7063.8416.6357.87910.828(4)基于小概率值的检验规则当2x时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;当2x时,我们没有充分证据推断H0不
7、成立,可以认为X和Y独立.说明若2越大,则两个分类变量有关的把握越大.1.下列四个散点图中,变量x与y之间具有负的线性相关关系的是(D)2.下列说法正确的是(D)A.在经验回归方程y0.85x2.3中,当解释变量x每增加1个单位时,响应变量平均减少2.3个单位B.若两个变量的相关性越强,则r越接近于1C.在回归分析中,决定系数R20.80的模型比决定系数R20.98的模型拟合的效果要好D.残差平方和越小的模型,拟合的效果越好解析对于A,根据经验回归方程,当解释变量x每增加1个单位时,响应变量y平均减少0.85个单位,故A错误;对于B,若两个变量的相关性越强,则r越接近于1,
8、故B错误;对于C,用决定系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好,所以C错误;对于D,由残差的统计学意义知,D正确.3.为考查某种营养品对儿童身高增长的影响,选取部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表,由表可知下列说法正确的是(D)营养品身高合计有明显增长无明显增长食用a1050未食用b3050合计6040100A.ab30B. 212.667C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是35D.根据小概率值0.001的独立性检验,可以认为该营养品对儿童身高增长有影响解析由题可知a501040,b503020,所
9、以A错误;2100(40301020)25050604016.667 10.828x0.001,所以根据小概率值0.001的独立性检验,可以认为该营养品对儿童身高增长有影响,所以B错误,D正确;从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是4010025,所以C错误.4.2023福州5月质检已知变量x和y的统计数据如下表:x678910y3.54566.5若由表中数据得到经验回归方程为y0.8xa,则x10时的残差为0.1.(注:观测值减去预测值称为残差)解析易知x8,y5,a50.881.4,x10时,y81.46.6,x10时的残差为6.56.60.1.学生用书P
10、219命题点1成对数据的相关性角度1判断两个变量的相关性例1 (1)已知变量x和y近似满足关系式y0.1x1,变量y与z正相关.下列结论中正确的是(C)A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关解析由y0.1x1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,随y的减小而减小,所以z随x的增大而减小,x与z负相关.(2)2023湖北仙桃中学模拟对四组数据进行统计后,获得了如图所示的散点图,四组数据的相关系数分别为r1,r2,r3,r4,对各组的相关系数进行比较,正确的是(C)第一组第二
11、组第三组第四组A.r3r20r1r4B.r4r10r2r3C.r2r30r4r1D.r1r40r3r2解析由题图可知,第一、四组数据均正相关,第二、三组数据均负相关,当相关系数的绝对值越大时,数据的线性相关性越强.第一组数据的线性相关性较第四组强,则r1r40,第二组数据的线性相关性较第三组强,则r2r3,且r20,r30,则r2r30.因此,r2r30r4r1.故选C.方法技巧判断两个变量相关性的3种方法画散点图若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关.利用样本相关系数r0时,正相关;r0时,负相关;r越接近于1,线性相关性越强.利用经验回归
12、方程b0时,正相关;b0时,负相关.角度2相关系数的计算例2 2022全国卷乙某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i12345678910总和根部横截面积xi0.040.060.040.080.080.050.050.070.070.060.6材积量yi0.250.400.220.540.510.340.360.460.420.403.9并计算得10i=1xi20.038,10i=1yi21.615 8,10i=1xiyi0.247 4.(1
13、)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数rni=1(xix)(yiy)ni=1(xix)2ni=1(yiy)2,1.8961.377.解析(1)估计该林区这种树木平均一棵的根部横截面积xi=110xi100.6100.06,估计该林区这种树木平均一棵的材积量yi=110yi103.9100.3
14、9.(2)i=110(xix)(yiy)i=110xiyi10xy0.013 4,i=110(xix)2i=110xi210x20.002,i=110(yiy)2i=110yi210y20.094 8,所以i=110(xix)2i=110(yiy)20.0020.094 80.000 11.8960.011.3770.013 77,所以样本相关系数ri=110(xix)(yiy)i=110(xix)2i=110(yiy)20.013 40.013 770.97.(3)设该林区这种树木的总材积量的估计值为Y m3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以0.390.06Y18
15、6,所以Y1860.390.061 209,即该林区这种树木的总材积量的估计值为1 209 m3.训练1 变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则(C)A.r2r10B.0r2r1C.r20r1D.r2r1解析由题中的数据可知,变量Y与X正相关,相关系数r10,变量V与U负相关,相关系数r20,即r20r1.故选C.命题点2回归模型及其应用
16、角度1一元线性回归模型例3 2023广西联考某省为调查北部城镇2022年GDP,抽取了20个城镇进行分析,得到样本数据(xi,yi)(i1,2,20),其中xi和yi分别表示第i个城镇的人口(单位:万人)和该城镇2022年GDP(单位:亿元),计算得i=120xi100,i=120yi800,i=120(xix)270,i=120(yiy)2280,i=120(xix)(yiy)120.(1)请用相关系数r判断该组数据中y与x之间线性相关关系的强弱(若r0.75,1,相关性较强;若r0.30,0.75),相关性一般;若r0.25,0.25,相关性较弱).(2)求y关于x的线性回归方程.(3)若
17、该省北部某城镇2024年的人口约为5万人,根据(2)中的线性回归方程估计该城镇2024年的GDP.参考公式:相关系数ri=1n(xix)(yiy)i=1n(xix)2i=1n(yiy)2,对于一组具有线性相关关系的数据(xi,yi)(i1,2,n),其回归直线ybxa的斜率和截距的最小二乘估计分别为bi=1n(xix)(yiy)i=1n(xix)2,aybx.解析(1)由题意知,相关系数ri=120(xix)(yiy)i=120(xix)2i=120(yiy)2120702801201400.857,因为y与x的相关系数r满足r0.75,1,所以y与x之间具有较强的线性相关关系.(2)bi=1
18、20(xix)(yiy)i=120(xix)212070127,aybx80020127100202207,所以y127x2207.(3)由(2)可估计该城镇2024年的GDP y1275220740(亿元).方法技巧回归模型问题的类型及解题方法(1)求经验回归方程:利用数据,求出x,y;利用公式,求出回归系数b;利用经验回归直线过样本点的中心(x,y),求a .(2)利用经验回归方程进行预测:直接将已知的自变量的某个数值代入经验回归方程求得特定要求下的预测值.(3)判断回归模型的拟合效果:利用残差平方和或决定系数R2判断,R2越大,表示残差平方和越小,即模型的拟合效果越好.角度2非线性回归模
19、型例4 2023重庆市三检已知变量y关于x的经验回归方程为y=ebx-0.6,若对y=ebx-0.6两边取自然对数,可以发现ln y与x线性相关,现有一组数据如表所示:x12345yee3e4e6e7则当x6时,预测y的值为(C)A.9B.8C.e9D.e8解析对yebx0.6两边取自然对数,得ln ybx0.6,令zln y,则 zbx0.6,数据为x12345yee3e4e6e7z13467由表格数据,得x1+2+3+4+553,z1+3+4+6+754.2.将(3,4.2)代入zbx0.6,得4.2=3b-0.6,(方法技巧:经验回归方程只含一个未知数问题主要是依据经验回归直线y=bxa
20、必过样本点的中心(x,y)求解)解得b1.6,所以z1.6x-0.6,即y=e1.6x-0.6.当x6时,y=e1.66-0.6=e9,故选C.方法技巧1.解决非线性回归模型问题的思路:根据数据的散点图,选择恰当的拟合函数,用适当的变量进行转换,如通过换元或取对数等方法,把问题化为线性回归模型问题,使之得到解决.2.常见的非线性回归模型及转换技巧(1)y=a+bx,令v1x,则y=a+bv;(2)y=a+bln xb0,令vln x,则yabv;(3)yaxb(a0,b0),令cln a,vln x,uln y,则ucbv;(4)yaebx(a0,b0),令cln a,uln y,则ucbx.
21、训练2 2023合肥市质检研究表明,温度的突然变化会引起机体产生呼吸道上皮组织的生理不良反应,从而导致呼吸系统疾病的发生或恶化.某中学数学建模社团成员欲研究昼夜温差大小与该校高三学生患感冒人数多少之间的关系,他们记录了某周连续六天的昼夜温差,并到校医务室查阅了这六天中每天高三学生新增患感冒而就诊的人数(假设患感冒必到校医务室就诊),得到资料如下:日期第一天第二天第三天第四天第五天第六天昼夜温差x/47891412新增就诊人数y/位y1y2y3y4y5y6参考数据:i=16yi23 160,i=16(yiy)2256.(1)已知第一天新增患感冒而就诊的学生中有7位女生,从第一天新增患感冒而就诊的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2025 高考 备考 教案 数学 第九 统计 成对 数据 统计分析 答案
链接地址:https://www.taowenge.com/p-97492428.html
限制150内