【高中数学】一元线性回归模型及其应用课件 2022-2023学年高二数学人教A版(2019)选择性必修第三册.pptx
《【高中数学】一元线性回归模型及其应用课件 2022-2023学年高二数学人教A版(2019)选择性必修第三册.pptx》由会员分享,可在线阅读,更多相关《【高中数学】一元线性回归模型及其应用课件 2022-2023学年高二数学人教A版(2019)选择性必修第三册.pptx(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、8.2一元线性回归模型及其应用1.1.结合具体实例,了解一元线性回归模型的含义结合具体实例,了解一元线性回归模型的含义2.2.了解模型参数的统计意义,了解最小二乘原理了解模型参数的统计意义,了解最小二乘原理3.3.会通过分析残差和利用会通过分析残差和利用 R2 判断回归模型的拟合效果判断回归模型的拟合效果4.4.了解非线性回归模型了解非线性回归模型 通通过过前面的学前面的学习习我我们们已已经经了解到,根据成了解到,根据成对样对样本数据的散点本数据的散点图图和和样样本本相关系数,可以推断两个相关系数,可以推断两个变变量是否存在相关关系、是正相关量是否存在相关关系、是正相关还还是是负负相关,相关,
2、以及以及线线性相关程度的性相关程度的强强弱等弱等.进进一步地,如果能像建立函数模型刻画两个一步地,如果能像建立函数模型刻画两个变变量之量之间间的确定性关系那的确定性关系那样样,通,通过过建立适当的建立适当的统计统计模型刻画两个随机模型刻画两个随机变变量量的相关关系,那么我的相关关系,那么我们们就可以利用就可以利用这这个模型研究两个个模型研究两个变变量之量之间间的随机关系,的随机关系,并通并通过过模型模型进进行行预测预测.下面我下面我们们研究当两个研究当两个变变量量线线性相关性相关时时,如何利用成,如何利用成对样对样本数据建立本数据建立统计统计模型,并利用模型模型,并利用模型进进行行预测预测的的
3、问题问题.生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父亲的身高较高时,儿子的身高通常也较高是正相关,即父亲的身高较高时,儿子的身高通常也较高.为了进一步研为了进一步研究两者之间的关系,有人调查了某所高校究两者之间的关系,有人调查了某所高校1414名男大学生的身高及其父亲的名男大学生的身高及其父亲的身高,得到的数据如表所示身高,得到的数据如表所示.一元线性回归模型一元线性回归模型编号编号1 12 23 34 45 56 67 78 89 910101111121213131414父亲身高父亲身高/cm/cm
4、174174170170173173169169182182172172180180172172168168166166182182173173164164180180儿子身高儿子身高/cm/cm176176176176170170170170185185176176178178174174170170168168178178172172165165182182 利用前面表示数据的方法,以横轴表示父亲身高、纵轴表示儿子身高利用前面表示数据的方法,以横轴表示父亲身高、纵轴表示儿子身高建立直角坐标系,再将表中的成对样本数据表示为散点图建立直角坐标系,再将表中的成对样本数据表示为散点图.可以发现,散
5、可以发现,散点大致分布在一条从左下角到右点大致分布在一条从左下角到右上角的直线附近,表明儿子身高上角的直线附近,表明儿子身高和父亲身高线性相关和父亲身高线性相关.利用统计利用统计软件,求得样本相关系数为,表软件,求得样本相关系数为,表明儿子身高和父亲身高正线性相明儿子身高和父亲身高正线性相关,且相关程度较高关,且相关程度较高.思考思考1 1:根据表中数据,儿子身高和父亲身高这两两个变量之间的关系可以根据表中数据,儿子身高和父亲身高这两两个变量之间的关系可以用函数模型刻画吗?用函数模型刻画吗?表中所示数据,存在父亲身高相同,而儿子身高不同的情况表中所示数据,存在父亲身高相同,而儿子身高不同的情况
6、.可见儿可见儿子身高和父亲身高之间不是函数关系,也就不能用函数模型刻画子身高和父亲身高之间不是函数关系,也就不能用函数模型刻画.但散点图表明儿子身高和父亲身高这两个变量之间有较强的线性相关但散点图表明儿子身高和父亲身高这两个变量之间有较强的线性相关关系,因此我们可以用一次函数来刻画父亲身高对儿子身高的影响,而把关系,因此我们可以用一次函数来刻画父亲身高对儿子身高的影响,而把影响儿子身高的其他因素,如母亲身高、饮食习惯等作为随机误差,得到影响儿子身高的其他因素,如母亲身高、饮食习惯等作为随机误差,得到刻画两个变量之间关系的线性回归模型刻画两个变量之间关系的线性回归模型.其中,随机误差是一个随机变
7、量其中,随机误差是一个随机变量.用用 x 表示父亲身高,表示父亲身高,Y 表示儿子身高,表示儿子身高,e 表示随机误差表示随机误差.假定随机假定随机误差误差 e 的均值为的均值为0 0,方差为与父亲身高无关的定值,方差为与父亲身高无关的定值 2,则它们之间的关系,则它们之间的关系可以表示为可以表示为我们称上式为我们称上式为 Y 关于关于 x 的的一元线性回归模型一元线性回归模型.其中,其中,Y 称为称为因变量因变量或或响应响应变量变量,x 称为称为自变量自变量或或解释变量解释变量;a 和和 b 为模型的未知参数,为模型的未知参数,a 称为称为截距参截距参数数,b 称为称为斜率参数斜率参数;e
8、是是 Y 与与 之间的随机误差之间的随机误差.例例1 1 在一元线性回归模型在一元线性回归模型 中,下列说法正确的是中,下列说法正确的是()A A 是一次函数是一次函数B B响应变量响应变量 Y 是由解释变量是由解释变量 x 唯一确定的唯一确定的C C响应变量响应变量 Y 除了受解释变量除了受解释变量 x 的影响外,可能还受到其他因素的影响,的影响外,可能还受到其他因素的影响,这些因素会导致随机误差这些因素会导致随机误差 e 的产生的产生D D随机误差随机误差 e 是由于计算不准确造成的,可通过精确计算避免随机误差是由于计算不准确造成的,可通过精确计算避免随机误差 e 的的产生产生C1.1.关
9、于一元线性回归模型关于一元线性回归模型 给出下列说法:给出下列说法:表达式表达式 刻画的是变量刻画的是变量 Y 与变量与变量 x 之间的线性相关关系;之间的线性相关关系;反映了由于反映了由于 x 的变化而引起的的变化而引起的 Y 的线性变化;的线性变化;误差项误差项 e 是一个期望值为是一个期望值为0 0的随机变量,即的随机变量,即 E(e)0 0;对于所有的对于所有的 x 值,值,e 的方差都相同的方差都相同其中正确的是其中正确的是_(填序号填序号)一元线性回归模型参数的最小二乘估计一元线性回归模型参数的最小二乘估计思考思考2 2:如何利用散点图找出一条直线,使各散点在整体上与此直线尽可如何
10、利用散点图找出一条直线,使各散点在整体上与此直线尽可能接近?能接近?先进一步明确我们面临的任先进一步明确我们面临的任务:从成对样本数据出发,用数务:从成对样本数据出发,用数学的方法刻画学的方法刻画“从整体上看,各从整体上看,各散点与直线最接近散点与直线最接近”.”.我们设满足一元线性回归模型的两个变量的我们设满足一元线性回归模型的两个变量的 n 对样本数为对样本数为 ,.,由,由 ,得得 .通常,我们会想到利用点到直线通常,我们会想到利用点到直线 的的“距离距离”来刻画散点与来刻画散点与该直线的接近程度,然后用所有该直线的接近程度,然后用所有“距离距离”之和刻画所有样本观测数据与该之和刻画所有
11、样本观测数据与该直线的接近程度直线的接近程度.显然,显然,越小,表示点越小,表示点 与点与点 的的“距离距离”越小,越小,即样本数据点离直线即样本数据点离直线 的竖直距离越小的竖直距离越小.特别地,当特别地,当 时,表时,表示点示点 在这条直线上在这条直线上.因此,可以用这因此,可以用这 n 个竖直距个竖直距离之和离之和来刻画各样本观测数据与直线的来刻画各样本观测数据与直线的“整体接近程度整体接近程度”.”.在实际应用中,因为绝对值使得计算不方便,所以人们通常用各散点在实际应用中,因为绝对值使得计算不方便,所以人们通常用各散点到直线的竖直距离的平方之和到直线的竖直距离的平方之和来刻画来刻画“整
12、体接近程度整体接近程度”.”.在上式中,在上式中,xi,yi(i=1 1,2 2,.,n)是已知的成对样本数据,所以是已知的成对样本数据,所以 Q由由 a 和和 b 所决定,即它是所决定,即它是 a 和和 b 的函数的函数.因为因为 Q 还可以表示为,即它是随还可以表示为,即它是随机误差的平方和,这个和当然是越小越好,所以我们取使机误差的平方和,这个和当然是越小越好,所以我们取使 Q 达到最小的达到最小的 a 和和 b 的值,作为截距和斜率的估计值的值,作为截距和斜率的估计值.下面利用成对样本数据求使下面利用成对样本数据求使 Q 取最小值的取最小值的 a,b.记记 ,.因为因为注意到注意到 所
13、以所以 上式右边各项均为非负数,且前上式右边各项均为非负数,且前 n 项与项与 a 无关无关.所以要使所以要使 Q 取到最小取到最小值,值,的值应为的值应为0 0,即,即.此时此时上式是关于上式是关于 b 的二次函数,因此要使的二次函数,因此要使 Q 取得最小值,当且仅当取得最小值,当且仅当 b 的取值为的取值为综上,当综上,当 a,b 的取值为的取值为时,时,Q 达到最小值达到最小值.我们将我们将 称为称为 Y 关于关于 x 的的经验回归方程经验回归方程,也称,也称经验回归函数经验回归函数或或经验回归公式经验回归公式,其图形称为,其图形称为经验回归直线经验回归直线.这种求经验回归方程的方法这
14、种求经验回归方程的方法叫做叫做最小二乘法最小二乘法,求得的,求得的 ,叫做叫做 b,a 的最小二乘估计的最小二乘估计.把由一个或把由一个或多个变量的变化去推测另一个变量的变化的方法称为多个变量的变化去推测另一个变量的变化的方法称为回归分析回归分析.对于前面儿子和父亲的身高数据,利用公式可以计算出对于前面儿子和父亲的身高数据,利用公式可以计算出 ,得到儿子身高,得到儿子身高 Y 关于父亲身高关于父亲身高 x 的经验回归方程为的经验回归方程为 .思考思考3 3:当时当时 ,.如果一位父亲的身高为如果一位父亲的身高为176cm176cm,他儿子长,他儿子长大成人后的身高一定是大成人后的身高一定是17
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中数学 【高中数学】一元线性回归模型及其应用课件 2022-2023学年高二数学人教A版2019选择性必修第三册 一元 线性 回归 模型 及其 应用 课件 2022 2023 学年 高二数 学人
链接地址:https://www.taowenge.com/p-90953649.html
限制150内