人教版2017高中数学选修1-2《回归分析》课件PPT.ppt
《人教版2017高中数学选修1-2《回归分析》课件PPT.ppt》由会员分享,可在线阅读,更多相关《人教版2017高中数学选修1-2《回归分析》课件PPT.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3.13.1回归分析的基本回归分析的基本思想思想及其初步应用及其初步应用(第一课时)(第一课时)1 1通通过过典典型型案案例例的的探探究究,进进一一步步了了解解回回归归分分析析的的基基本本思思想想、方法及其初步应用方法及其初步应用 2 2让让学学生生经经历历数数据据处处理理的的过过程程,培培养养他他们们对对数数据据的的直直观观感感觉觉,体体会会统统计计方方法法的的特特点点,认认识识统统计计方方法法的的应应用用,通通过过使使用用转转化化后后的的数数据据,求求相相关关指指数数,运运用用相相关关指指数数进进行行数数据据分分析析、处处理理的的方方法法 3 3从从实实际际问问题题中中发发现现已已有有知知
2、识识的的不不足足,激激发发好好奇奇心心,求求知知欲欲,通通过过寻寻求求有有效效的的数数据据处处理理方方法法,开开拓拓学学生生的的思思路路,培培养养学学生生的的探探索索精精神神和和转转化化能能力力,通通过过案案例例的的分分析析使使学学生生了了解解回回归归分分析析在在实实际际生生活活中中的的应应用用,增增强强数数学学取取之之生生活活,用用于于生生活活的的意意识识,提提高高学习兴趣学习兴趣 本本节节课课通通过过必必修修3 3熟熟悉悉有有例例题题回回顾顾线线性性相相关关关关系系知知识识,通通过过实实际际问问题题中中发发现现已已有有知知识识的的不不足足,引引出出随随机机误误差差、残残差差、残残差差分分析
3、析的的概概念念,进进而而运运用用残残差差来来进进行行数数据据分分析析,通通过过例例题题讲讲解解掌掌握握用用残残差差分分析析判判断断线线性性回回归模型的拟合效果。掌握建立回归模型的步骤。归模型的拟合效果。掌握建立回归模型的步骤。本本节节内内容容学学生生内内容容不不易易掌掌握握,通通过过知知识识整整理理与与比比较较引引导导学学生生进进行行区区分分、理理解解。通通过过对对典典型型案案例例的的探探究究,练练习习进进行行巩巩固固了了解解回回归归分分析析的的基基本本思思想想方方法法和和初初步步应应用用从从某某大大学学中中随随机机选选取取8 8名名女女大大学学生生,其其身身高高和和体体重重数数据如下表所示:
4、据如下表所示:怎怎样样根根据据一一名名女女大大学学生生的的身身高高预预报报她她的的体体重重,并并预预报一名身高为报一名身高为172 cm172 cm的女大学生的体重?的女大学生的体重?编号12345678身高/cm165165157170175165155170体重/kg4857505464614359根据必修根据必修3 2.33 2.3变量相关关系解决这个问题的方法:变量相关关系解决这个问题的方法:1.1.先判断是两个变量是否具有线性相关关系先判断是两个变量是否具有线性相关关系(1)(1)作散点图,如图所示作散点图,如图所示(见课本见课本P82P82:图:图3.1-1)3.1-1)2.2.根
5、据线性回归的系数公式,根据线性回归的系数公式,求回归直线方程求回归直线方程 0.849x-85.7120.849x-85.7123.3.由线性回归方程可以估计其位由线性回归方程可以估计其位置值为置值为 60.316(60.316(千克千克)左右。左右。具有较好的线性相关关系具有较好的线性相关关系性质:回归直线一定过样本中心点性质:回归直线一定过样本中心点(2)(2)计算计算相关系数相关系数这这些些点点并并不不都都在在同同一一条条直直线线上上,上上述述直直线线并并不不能能精精确确地地反反映映x与与y之之间间的的关关系系,y 的的值值不不能能完完全全由由x 确确定定,它它们们之之间间是是统统计计相
6、相关关关关系系,y 的的实实际际值值与与估估计计值值之之间间存在着误差存在着误差因此因此,在统计学中设它们的线性回归模型为在统计学中设它们的线性回归模型为:其其中中a,ba,b为为模模型型的的未未知知参参数数,e,e为为y y与与bx+abx+a之之间间的的误误差差,称它为随机误差,它是随机变量。且称它为随机误差,它是随机变量。且线性回归模型完整表达式为线性回归模型完整表达式为x x称为称为_变量变量,y,y称为称为_变量变量.解释解释预报预报线性回归模型中随机误差的主要来源线性回归模型中随机误差的主要来源线性回归模型中的预报值线性回归模型中的预报值 与真实情况与真实情况y y引引起的误差;起
7、的误差;观测与计算观测与计算(用用 代替代替b a)b a)产生的误差;产生的误差;省略了一些因素的影响省略了一些因素的影响(如生活习惯等)产如生活习惯等)产生的误差生的误差.在线性回归模型中,在线性回归模型中,e e为用为用bx+abx+a的预报真实值的预报真实值y y的随机误的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差,它是一个不可观测的量,那么应该怎样研究随机误差?差?在实际应用中,我们用在实际应用中,我们用 估计估计 bx+a 所以所以 的估计量为的估计量为对于样本点对于样本点它们的随机误差为它们的随机误差为估计值为估计值为称相应于点称相应于点 的残差的残差坐标纵轴为残差
8、变量,横轴可以有不同的选择;坐标纵轴为残差变量,横轴可以有不同的选择;若若模模型型选选择择的的正正确确,残残差差图图中中的的点点应应该该分分布布在在以以横横轴轴为中心的带形区域;为中心的带形区域;对于远离横轴的点,要特别注意。对于远离横轴的点,要特别注意。错误数据模型问题身高与体重残差图异常点残差的作用残差的作用1.1.通过残差表或残差图发现原始数据中的可疑数据通过残差表或残差图发现原始数据中的可疑数据通过残差通过残差 来判断模型拟合的效果这种分来判断模型拟合的效果这种分析工作称为析工作称为残差分析残差分析通过残差表或残差图判断模型拟合的效果是直观判断,通过残差表或残差图判断模型拟合的效果是直
9、观判断,如何精确判断模型拟合的效果?如何精确判断模型拟合的效果?引入参数引入参数R R2 2来精确该画模型拟合效果来精确该画模型拟合效果对对于于己己获获取取的的样样本本数数据据,在在上上式式子子中中 是是定定值值,越越小小,即即残残差差平平方方和和越越小小,R R2 2越越大大,说说明模型拟合效果越好。明模型拟合效果越好。引引入入例例中中参参数数R R2 2计计算算得得约约为为0.640.64说说明明女女大大学学生生体体重重差差异有百分之六十四是由身高引起的异有百分之六十四是由身高引起的.知识点知识点 线性回归分析线性回归分析1.1.对线性回归模型的三点说明对线性回归模型的三点说明(1)(1)
10、非非确确定定性性关关系系:线线性性回回归归模模型型y=bx+a+ey=bx+a+e与与确确定定性性函函数数y=bx+ay=bx+a相相比比,它它表表示示y y与与x x之之间间是是统统计计相相关关关关系系(非非确确定定性性关关系系),),其其中中的的随随机机误误差差e e提提供供了了选选择择模模型型的的准准则则以以及及在在模模型型合合理理的的情情况况下下探探求求最最佳估计值佳估计值a a,b b的工具的工具.(2)(2)线性回归方程线性回归方程 中中 ,的意义是:以的意义是:以 为基为基数,数,x x每增加每增加1 1个单位,个单位,y y相应地平均增加相应地平均增加 个单位个单位.(3)(3
11、)线性回归模型中随机误差的主要来源线性回归模型中随机误差的主要来源线性回归模型与真实情况引起的误差;线性回归模型与真实情况引起的误差;观测与计算产生的误差;观测与计算产生的误差;省略了一些因素的影响产生的误差省略了一些因素的影响产生的误差.2.2.线性回归模型的模拟效果线性回归模型的模拟效果(1)(1)残差图法残差图法:观察残差图观察残差图,如果残差点比较均匀如果残差点比较均匀地落在水平的带状区域中地落在水平的带状区域中,说明选用的模型比较说明选用的模型比较合适合适,这样的带状区域的宽度越窄这样的带状区域的宽度越窄,说明模型拟合说明模型拟合精度越高精度越高,回归方程的预报精度越高回归方程的预报
12、精度越高.(2)(2)残残差差的的平平方方和和法法:一一般般情情况况下下,比比较较两两个个模模型型的的残残差差比比较较困困难难(某某些些样样本本点点上上一一个个模模型型的的残残差差的的绝绝对对值值比比另另一一个个模模型型的的小小,而而另另一一些些样样本本点点的的情情况况则则相相反反),),故故通通过过比比较较两两个个模模型型的的残残差差的的平平方方和和的的大大小小来来判判断断模模型型的的拟拟合合效效果果.残残差差平平方方和和越越小小的的模模型型,拟拟合合的的效效果果越越好好.(3)R(3)R2 2法法:R:R2 2的的值值越越大大,说说明明残残差差平平方方和和越越小小,也也就就是是说说模型拟合
13、的效果越好模型拟合的效果越好.3.3.相关系数与相关系数与R R2 2(1)R(1)R2 2是是相相关关系系数数的的平平方方,其其变变化化范范围围为为0,1,0,1,而而相相关系数的变化范围为关系数的变化范围为-1,1.-1,1.(2)(2)相相关关系系数数可可较较好好地地反反映映变变量量的的相相关关性性及及正正相相关关或或负相关负相关,而而R R2 2反映了回归模型拟合数据的效果反映了回归模型拟合数据的效果.(3)(3)当当|r|r|接接近近于于1 1时时说说明明两两变变量量的的相相关关性性较较强强,当当|r|r|接接近近于于0 0时时说说明明两两变变量量的的相相关关性性较较弱弱,而而当当R
14、 R2 2接接近近于于1 1时时,说明线性回归方程的拟合效果较好说明线性回归方程的拟合效果较好.【微思考微思考】(1)(1)残差与我们平时说的误差是一回事儿吗残差与我们平时说的误差是一回事儿吗?提提示示:这这两两个个概概念念在在某某程程度度上上具具有有很很大大的的相相似似性性,都都是是衡衡量量不不确确定定性性的的指指标标,二二者者的的区区别别是是:误误差差与与测测量量有有关关,误误差差可可以以衡衡量量测测量量的的准准确确性性,误误差差越越大大表表示示测测量量越越不不准准确确;残残差差与与预预测测有有关关,残残差差大大小小可可以以衡衡量量预预测的准确性测的准确性,残差越大表示预测越不准确残差越大
15、表示预测越不准确.(2)R(2)R2 2与原来学过的相关系数与原来学过的相关系数r r有区别吗有区别吗?提提示示:它它们们都都是是刻刻画画两两个个变变量量之之间间的的的的相相关关关关系系的的,区区别别是是R R2 2表表示示解解释释变变量量对对预预报报变变量量变变化化的的贡贡献献率率,其其表表达式为达式为R R2 2=1-;=1-;相关系数相关系数r r是检验两个变量相关性的强弱程度是检验两个变量相关性的强弱程度,其表达式为其表达式为 建立回归模型的基本步骤建立回归模型的基本步骤(1)(1)确确定定研研究究对对象象,明明确确哪哪个个变变量量是是解解释释变变量量,哪哪个个变变量量是预报变量是预报
16、变量(2)(2)画画出出确确定定好好的的解解释释变变量量和和预预报报变变量量的的散散点点图图,观观察察它它们之间的关系们之间的关系(如是否存在线性关系等如是否存在线性关系等)(3)(3)由由经经验验确确定定回回归归方方程程的的类类型型(如如我我们们观观察察到到数数据据呈呈线线性关系,则选用线性回归方程性关系,则选用线性回归方程)(4)(4)按一定规则按一定规则(如最小二乘法如最小二乘法)估计回归方程中的参数估计回归方程中的参数(5)(5)得得出出结结果果后后分分析析残残差差图图是是否否有有异异常常(如如个个别别数数据据对对应应残残差差过过大大,或或残残差差呈呈现现不不随随机机的的规规律律性性等
17、等)若若存存在在异异常常,则检查数据是否有误,或模型是否合适等则检查数据是否有误,或模型是否合适等 为研究重量为研究重量x x(单位:克单位:克)对弹簧长度对弹簧长度y y(单位:厘单位:厘米米)的影响,对不同重量的的影响,对不同重量的6 6个物体进行测量,数据如个物体进行测量,数据如下表所示:下表所示:x51015202530y7.258.128.959.9010.911.8(1)(1)作出散点图并求线性回归方程;作出散点图并求线性回归方程;(2)(2)求出求出R R2 2;(3)(3)进行残差分析进行残差分析作残差分析时,一般从以下几个方面予以说明:作残差分析时,一般从以下几个方面予以说明
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归分析 人教版 2017 高中数学 选修 回归 分析 课件 PPT
限制150内