2019数学新设计人教A选修1-2课件:第一章 统计案例 1.1 .ppt
1.1回归分析的基本思想及其初步应用,1.回归分析(1)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)回归分析的基本步骤是:画出两个变量的散点图,求回归直线方程,用回归直线方程进行预报.(3)求线性回归方程的步骤:确定两个变量具有相关关系;,【做一做1】如图四个散点图中,适合用线性回归模型拟合其中两个变量的是()A.B.C.D.解析:图,中的点大致在一条直线附近,适合用线性回归模型拟合.答案:B,2.线性回归模型(1)线性回归模型为y=bx+a+e,其中a和b为模型的未知参数,e称为随机误差,自变量x称为解释变量,因变量y称为预报变量.(2)随机误差产生的原因,(3)刻画回归分析效果的参数,名师点拨在线性回归模型中,R2的取值范围为0,1,R2表示解释变量对于预报变量变化的贡献率,1-R2表示随机误差对于预报变量变化的贡献率.R2越接近于1,表示回归的效果越好.,【做一做2】已知回归直线方程为,而试验得到的一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是()A.0.01B.0.02C.0.03D.0.04解析:(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.答案:C,3.建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解析变量,哪个变量是预报变量.(2)画出解析变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);或者通过计算相关系数来判断两个变量之间的关系.(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程).(4)按一定规则(如最小二乘法)估计回归方程中的参数,得到回归方程.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律等).若存在异常,则检查数据是否有误,或模型是否合适等.,名师点拨非线性回归分析在散点图中,如果样本点没有分布在某个带状区域内,那么两个变量不呈线性相关关系,就不能直接利用线性回归方程来建立两个变量之间的关系,这就是所谓的非线性回归问题.对于此类问题,我们可以画出已知数据的散点图,通过对散点图的观察,把它与我们已经学过的各种函数(幂函数、指数函数、对数函数等)的图象做比较,挑选一种与这些散点拟合的最好的函数,然后转化为线性函数,通过最小二乘法公式计算求得回归方程.,思考辨析判断下列说法是否正确,正确的在后面的括号内打“”,错误的打“”.(1)判断两个变量是否相关的唯一办法是通过散点图确定.()(2)在残差图中,残差点比较均匀地落在水平带状区域内,说明选用的模型比较合适.()(3)在残差图中,纵坐标为残差,横坐标可以选为样本编号.()(4)残差平方和越大,说明回归模型的拟合精度越高,预报越准确.()(5)相关指数越大,说明回归模型的拟合精度越高,预报越准确.()答案:(1)(2)(3)(4)(5),探究一,探究二,探究三,线性回归方程及其应用【例1】某地区2010年至2016年农村居民家庭人均纯收入y(单位:千元)的数据如表:,(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2010年至2016年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2018年农村居民家庭人均纯收入.思路分析:(1)根据回归系数的计算公式求出的值,代入即得回归直线方程;(2)将t=9代入回归直线方程计算求解.,探究一,探究二,探究三,探究一,探究二,探究三,探究一,探究二,探究三,探究一,探究二,探究三,变式训练1某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:,(1)试根据数据预报当广告费支出为1000万元时的销售额;(2)若广告费支出为1000万元时的实际销售额为8500万元,求误差.,探究一,探究二,探究三,探究一,探究二,探究三,(2)8500万元即85百万元,实际数据与预报值的误差为85-82.5=2.5(百万元).,探究一,探究二,探究三,回归模型的误差分析【例2】已知x,y的取值如表所示:,(1)求y与x之间的回归方程;(2)计算残差平方和;(3)判断该回归模型的好坏.思路分析:首先画出散点图,通过散点图确定y与x之间的线性相关关系,套用公式求得回归直线方程;然后根据公式计算残差平方和;最后可求出相关指数R2,进行模型好坏的评判.,探究一,探究二,探究三,解:(1)画出散点图如下:由图可以看出,样本点呈条状分布,有较好的线性相关关系,因此可用线性回归方程刻画它们之间的关系.,探究一,探究二,探究三,探究一,探究二,探究三,探究一,探究二,探究三,变式训练2关于x与y有如下数据:,探究一,探究二,探究三,非线性回归分析【例3】在某一化学反应过程中,其化学物质的反应速度y(单位:g/min)与一种催化剂的量x(单位:g)有关,现收集了8组测验数据列于下表中,试建立y与x之间的回归方程.,思路分析:先画出散点图,由此确定拟合曲线的类型,再进行非线性回归分析.,探究一,探究二,探究三,解:根据测验数据可以作出散点图,如图所示:,根据y与x的散点图,可以认为样本点集中在某一条指数函数曲线(c1,c2为待定参数)的附近,令z=lny,则z=lny=c2x+lnc1,即变换变量后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的附近.z与x的数据如下表所示:,探究一,探究二,探究三,画出z与x的散点图,如图所示.观察散点图可知,样本点近似地分布在一条直线附近,因此,可以用线性回归模型来拟合它.,探究一,探究二,探究三,反思感悟求非线性回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)关系变换,通过关系变换把非线性回归问题转化为线性回归问题,并求出线性回归方程.(4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性回归方程.,探究一,探究二,探究三,1.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是()A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R2解析:由残差平方和的定义及计算公式可知.答案:B2.甲、乙、丙、丁四名同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:,建立的回归模型拟合效果最好的同学是()A.甲B.乙C.丙D.丁解析:相关指数R2越大,表示回归模型的效果越好.答案:A,3.已知回归直线方程中斜率的估计值为5.43,样本点的中心为(1,2),则回归直线在y轴上截距为()A.-3.43B.3.43C.1D.2解析:回归直线方程过样本点的中心,把点(1,2)代入求得y轴上截距为-3.43.答案:A4.已知工厂加工零件的个数x与花费时间y(单位:h)之间的线性回归方程为=0.01x+0.5,则加工200个零件大约需要h.解析:将200代入线性回归方程=0.01x+0.5,得y=2.5.答案:2.5,5.某个服装店经营某种服装,在某周内获纯利y(单位:元),与该周每天销售这种服装件数x之间的一组数据关系见表:,(2)已知纯利y与每天销售件数x之间线性相关,求出y关于x的回归直线方程;(3)求残差平方和、相关指数.,