【数学】一元线性回归模型及其应用教学课件 2023-2024学年高二数学(人教A版2019选择性必修第三册).pptx
《【数学】一元线性回归模型及其应用教学课件 2023-2024学年高二数学(人教A版2019选择性必修第三册).pptx》由会员分享,可在线阅读,更多相关《【数学】一元线性回归模型及其应用教学课件 2023-2024学年高二数学(人教A版2019选择性必修第三册).pptx(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、选修三选修三选修三选修三 第八章第八章第八章第八章 成对数据的统计分析成对数据的统计分析成对数据的统计分析成对数据的统计分析8.2.1 一元线性回归模型一元线性回归模型课时目标:课时目标:研究当两个变量线性相关时,如何研究当两个变量线性相关时,如何利用利用成对成对样本数据样本数据建立适建立适当的统计模型当的统计模型,能结合具体实例,能结合具体实例了解模型及其参数的含义了解模型及其参数的含义.提出问题确定研究变量收集数据画散点图求回归模型做出预报(一元线性回归模型)在统计学中,回归分析指的是定量分析两种或两种以上变量间相关关系的一种统计分析方法。回归分析按照涉及的变量的个数,分为一元回归分析和多
2、元回归分析。回归回归回归分析回归分析定相关关系计算r问题背景确定两个变量的相关关系及强弱生活经验告诉我们,生活经验告诉我们,儿子身高儿子身高与与父亲身高父亲身高存在存在正线性相关正线性相关关系,即父亲的身高较关系,即父亲的身高较高时,儿子的身高通常也较高高时,儿子的身高通常也较高.以横轴表示父亲身高、纵轴表示儿子身高建立直角坐标系,由表中的成对样本数据作散点图,如图所示.可以发现,散点大致分布在一条从左下角到右上角的直线附近,表明儿子身高和父亲身高线性相关.利用统计软件,求得样本相关系数为r0.886,表明儿子身高和父亲身高正线性相关,且相关程度较高.为了进一步研究两者之间的关系,有人调查了为
3、了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高名男大学生的身高及其父亲的身高,得到的数据如表所示,得到的数据如表所示.问题提出建立两个相关变量的关系式思考思考1:根据上表中的数据或散点图,儿子身高和父亲根据上表中的数据或散点图,儿子身高和父亲身高这两个变量之间的关系身高这两个变量之间的关系可以用函数模型刻画吗可以用函数模型刻画吗?存在父亲身高相同,而儿子身高不同的情况.也存在儿子身高相同,而父亲身高不同的情况。不符合函数的定义,可见儿子身高和父亲身高之间不是函数关系,不能用函数模型刻画.思考思考2:为什么为什么儿子身高和父亲身高有相关关系而不是函数关系儿子身高和父亲身
4、高有相关关系而不是函数关系?因为影响儿子身高的因素除了父亲身高这个主要因素外,还受其他随机因素的影响,如母亲身高、生活环境、饮食习惯、锻炼时间等.思考思考3:考虑上述随机因素的影响考虑上述随机因素的影响,你能否你能否用类似于函数的表达式用类似于函数的表达式来表示父亲身高来表示父亲身高x和儿子身高和儿子身高Y的关系?的关系?问题解决建立两个相关变量的统计模型用x表示父亲身高,Y表示儿子身高,e表示随机误差.假定随机误差e的均值为0,方差为与父亲身高无关的定值2,则它们之间的关系可以表示为:称为Y关于x的一元线性回归模型一元线性回归模型.Y称为因变量或响应变量;x称为自变量或解释变量;a称为截距参
5、数,b称为斜率参数;e是Y与bx+a之间的随机误差.思考思考4:为什么要假设为什么要假设E(e)=0,而不假设它为某个不,而不假设它为某个不为为0的常数?的常数?因为随机误差表示大量已知和未知的影响因素之和,因为误差是随机的,即取各种正负误差的可能性一样,它们会相互抵消,所以随机误差的期望值应为0.理解模型一元线性回归模型的实际意义用x表示父亲身高,Y表示儿子身高,e表示随机误差.则它们之间的关系可以表示为下面的一元线性回归模型:思考思考5:你能结合身高案例解释上述模型的意义吗?你能结合身高案例解释上述模型的意义吗?由于E(Y)=bx+a,故模型可解释为父亲身高为xi的所有男大学生的身高(子总
6、体)的均值E(Y)为bxi+a,即该子总体的均值与父亲身高是线性函数关系。yi不一定为bxi+a,yi=bxi+a+ei,bxi+a是子总体的均值,yi只是该子总体中的一个样本值,这个样本值yi与均值E(Y)有一个误差项ei=yi(bxi+a).思考思考6:父亲身高为父亲身高为xi的的某一名某一名男大学生,他的身高男大学生,他的身高yi一定为一定为bxi+a吗?吗?理解为理解模型一元线性回归模型的实际意义思考思考7:你能结合你能结合上述身高案上述身高案例解释模型中例解释模型中产生随机误差项产生随机误差项e的原因的原因吗?吗?(1)存在其他可能影响儿子身高Y的因素,如母亲身高、生活环境、饮食习惯
7、和锻炼时间等;(2)测量身高时,可能存在由测量工具、测量精度导致的测量误差;(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,而利用一元线性回归模型来近似刻画这种关系,这种近似产生了误差.用x表示父亲身高,Y表示儿子身高,e表示随机误差.则它们之间的关系可以表示为下面的一元线性回归模型:理解为若Y与x呈现线性相关,则Y关于x的一元线性回归模型一元线性回归模型为:Y称为因变量或响应变量;x称为自变量或解释变量;a,b为参数;e是Y与bx+a之间的随机误差.可理解为E(Y)=bx+a课堂小结yi不一定为bxi+a,观测值yi与子总体的均值E(Y)有一个误差项ei=yi(bxi+a).
8、选修三选修三选修三选修三 第八章第八章第八章第八章 成对数据的统计分析成对数据的统计分析成对数据的统计分析成对数据的统计分析8.2.2 一元线性回归模型参数的一元线性回归模型参数的最小二乘估计最小二乘估计课时目标:课时目标:利用利用最小二乘法最小二乘法和成对和成对样本数据样本数据估计估计一元线性回归模型一元线性回归模型Y=bx+a+e中中的的参数参数a和和b;了解最小二乘法的原理,能利用该原理;了解最小二乘法的原理,能利用该原理推导参数估计推导参数估计值的计算公式值的计算公式.提出问题确定研究变量收集数据画散点图建立回归模型做出预报(一元线性回归模型)定相关关系计算r求解回归直线方程y=bx+
9、a(估计参数a,b)问题提出由散点图寻找一条适当的直线思考思考1:如何如何从散点图中从散点图中寻找到一条适当的直线,使得寻找到一条适当的直线,使得这些这些散点在整体上与这条直线最接近散点在整体上与这条直线最接近?方案1:先画出一条直线,测量出各点与直线的距离,然后移动直线,到达一个使距离的和最小的位置.测量出此时的斜率和截距,就可得到一条直线,如图.方案2:在图中选择两点画直线,使得直线两侧的点的个数基本相同,把这条直线作为所求直线,如图.方案3:在散点图中多取几对点,确定出几条直线的方程,再分别求出这些直线的斜率、截距的平均数,将这两个平均数作为所求直线的斜率和截距.上面这些方法虽然有一定的
10、道理,但比较难操作,我们需要另辟蹊径上面这些方法虽然有一定的道理,但比较难操作,我们需要另辟蹊径.问题提出利用样本数据寻找一条适当的直线思考思考2:如何如何利用利用成对样本数据成对样本数据,用数学方法刻画,用数学方法刻画“从从整体整体上看,各散点与直线上看,各散点与直线最接近最接近”?析:可令n个样本点与直线的竖直距离之和最小y=bx+a问题分析利用样本数据寻找一条适当的直线最最小小二二乘乘法法经验回归直线及其方程经验回归直线及其方程问题解决最小二乘法求经验回归方程图形图形推导推导模型运用求身高案例的经验回归方程模型理解身高案例的经验回归方程含义2:父亲身高为176 cm的所有儿子身高的均值的
11、估计值为177 cm.斜率可以解释为父亲身高每增加1 cm,其儿子身高平均增加0.839 cm.含义1:由方程作出推测,当父亲身高为176 cm时,儿子身高一般在177 cm左右.思考思考5:根据方程,父亲身高为多少时,长大成人的儿根据方程,父亲身高为多少时,长大成人的儿子身高和父亲身高一样?子身高和父亲身高一样?模型理解身高案例的经验回归方程高个子父亲有生高个子儿子的趋势,矮个子父亲有生矮个子儿子的趋势,思考思考6:分析案例中的经验回归方程分析案例中的经验回归方程可得到什么结论?可得到什么结论?儿子身高有向平均身高回归的趋势英国统计学家高尔顿把这种后代身高向中间值靠近的趋势称为“回归现象”(
12、自阅课本P122-123了解“回归的含义”)随机抽查了205对夫妇及其928个成年子女的身高数据记中亲身高为X,子女身高为Y女子身高1.08换算为男子升高父母身高取平均数得中亲身高新知:残差的定义父亲身高父亲身高x174170173169182172180172168166182173164180儿子身高儿子身高观测值观测值yi176176170170185176178174170168178172165182174.943 171.587 174.104 170.748 181.655 173.265 179.977 173.265 169.909 168.231 181.655 174.1
13、04 166.553 179.9771.057 4.413-4.104-0.748 3.345 2.735-1.977 0.735 0.091-0.231-3.655-2.104-1.553 2.023残差表:残差表:残差残差=观测值预报值观测值预报值残差之和为残差之和为0.027(计算或测量时数据四舍五入计算或测量时数据四舍五入)新知:残差分析2.残差的作用:残差的作用:判断回归模型刻画数据的效果;发现原始数据中是否存在可疑数据,对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.1.残差分析途径:残差分析途径:列残差表、作残差图.以以残差残差为纵坐标,以为纵坐标,以样本编号样本
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 【数学】一元线性回归模型及其应用教学课件 2023-2024学年高二数学人教A版2019选择性必修第三册 一元 线性 回归 模型 及其 应用 教学 课件 2023 2024 学年 人教 2019
链接地址:https://www.taowenge.com/p-96636428.html
限制150内