【高中数学】一元线性回归模型参数的最小二乘估计(2) 高二数学人教A版(2019)选择性必修第三册.pptx





《【高中数学】一元线性回归模型参数的最小二乘估计(2) 高二数学人教A版(2019)选择性必修第三册.pptx》由会员分享,可在线阅读,更多相关《【高中数学】一元线性回归模型参数的最小二乘估计(2) 高二数学人教A版(2019)选择性必修第三册.pptx(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、8.2.2 8.2.2 一元线性回归模型参数一元线性回归模型参数的最小二乘估计的最小二乘估计(2)(2)8.2 8.2 一元线性回归模型及其应用一元线性回归模型及其应用1.经验回归方程:经验回归方程:2.最小二乘估计:最小二乘估计:复习回顾复习回顾3.分析模型的回归效果分析模型的回归效果方法方法:利用残差图直观判断模型是否满足一元线性回归模型的假设。残差散点图应均匀地分布在横轴两侧,呈带状,宽度越窄,说明模型拟合精度越高。也可以利用决定系数决定系数R2判断回归模型的拟合效果。编号12345678年份18961912192119301936195619601968记录/s 11.80 10.60
2、10.4010.3010.2010.10 10.009.95问题情境 人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程 解:解:以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图,得到散点图.图中,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程.相关系数r=-0.86 编号12345678年份18961912192119301936195619601968记录/s 11.80 10.6010.
3、4010.3010.2010.10 10.009.95问题情境 人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程 解:解:用Y表示男子短跑100m的世界纪录,t表示纪录产生的年份 根据最小二乘法,由表中的数据得到经验回归方程为:将经验回归直线叠加到散点图上。观察观察:从图中可以看到,经验回归方程较好地刻画了散点的变化趋,请再仔细观察图形,你能看出其中存在的问题吗?例如,第一个第一个世界纪录所对应的散点远离远离经验回归直线,并且前后两时
4、间前后两时间段中段中的散点都在经验回归直线的上方上方,中间中间时间段的散点都在经验回归直线的下方下方.答案:答案:散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,即成对样本数据呈现出明显的非线性相关的特征.修正模型修正模型,以使其更好地反映散点的分布特征:仔细观察右图,可以发现散点更趋向于落在中间下凸且递减的某条曲线附近.函数y=-lnx的图象具有类似的形状特征.由于由于到到100100m短跑的第一个世界纪录产生于短跑的第一个世界纪录产生于18961896年年,因此可因此可设设非线性非线性回归方程回归方程为:为:y=f(t)=c1+c2ln(t-1895)(其中
5、其中c1、c2为未知参数,且为未知参数,且c2 R R1 12 2 ,因此经验回归方程的刻画效果比经验回归方程的好很多.分析模型分析模型的回归效果方法:的回归效果方法:(2 2)残差平方和)残差平方和(1 1)残差分析)残差分析好的回归方程对应的残差散点图应是均匀地分布在横轴两侧的带状区域内.且带状区域越窄,说明模型拟合效果越好列残差表列残差表画画残差残差图图(3 3)决定系数)决定系数R R2 2法法残差平方和越小,说明模型拟合效果越好.R2越大,说明模型拟合效果越好.线性相关线性相关非非线性相关线性相关 对于非线性经验回归问题,可以画出已知数据的散点图,把它与学过的各种函数(幂函数、对数函
6、数、指数函数等)的图像作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题转化为经验回归方程问题来解决解决解决非线性回归非线性回归问题的步骤问题的步骤画散点图根据散点图,选择恰当的拟合函数恰当的拟合函数进行恰当的变换,转化成线性函数转化成线性函数,用最小二乘法求经验回归方程通过相应的变换,即可得非线性经验回归方程选拟合函数根据原始数据(x,y)画散点图变换变换求解求解变换变换还原还原 得出结果后需进行线性回归分析.决定系数R2取值越大,说明模型的拟合效果越好.知识海洋非线性非线性经验经验回归方程回归方程当经验回归方程并非形如y=bx+a(a,bR)时,称之为非线性经验回非
7、线性经验回归方程归方程,当两个变量不呈线性相关关系时,依据样本点的分布选择合适的选择合适的曲线方程来模拟曲线方程来模拟,常见的非线性经验回归方程的转换方式总结如下:曲线方程曲线方程变换公式变换公式变换后的线性关系式变换后的线性关系式y=axb c=ln a,v=ln x,u=ln yu=c+bv c=ln a,u=ln yu=c+bxu=c+bvy=a+bln x v=ln xy=a+bvu=a+bv拓展练习拓展练习1 某企业为确定下一年投入某种产品的研发费用,需了解年研发费用x(单位:千万元)对年销售量y(单位:千万件)的影响,统计了近10年投入的年研发费用xi与年销售量yi(i=1,2,1
8、0)的数据,得到散点图如图所示.(1)利用散点图判断y=a+bx和y=cxd(其中c,d均为大于0的常数)哪一个更适合作为年销售量y和年研发费用x的回归方程类型(只要给出判断即可,不必说明理由);(2)对数据作出如下处理,令ui=lnxi,vi=lnyi,得到相关统计量的值如下.根据第(1)问的判断结果及表中数据,求y关于x的回归方程.附附:对于一组数据对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线,其回归直线 的斜率的斜率和截距的最小二乘估计分别为和截距的最小二乘估计分别为解:解:(1)由散点由散点图图可知,可知,选择选择回回归类归类型型y=cxd更合适更合适.(2)
9、对对y=cxd两两边边取取对对数,的数,的lny=lnc+dlnx,拓展练习拓展练习2 某地今年上半年患某种传染病的人数y(人)与月份x(月)之间满足函数关系,模型为yaebx,确定这个函数解析式月份月份x/月月123456人数人数y/人人526168747883解:x123456u=lny3.95124.11094.21954.30414.35674.4188(1)作作GDP和年份的散点图,根和年份的散点图,根据该图猜想它们之间的关系可据该图猜想它们之间的关系可以用什么模型描述;以用什么模型描述;(2)建立年份为解释变量,建立年份为解释变量,GDP为响应变量的一元线性回归模为响应变量的一元线
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中数学 【高中数学】一元线性回归模型参数的最小二乘估计2 高二数学人教A版2019选择性必修第三册 一元 线性 回归 模型 参数 最小 估计 高二数 学人 2019 选择性 必修 第三

链接地址:https://www.taowenge.com/p-92314020.html
限制150内