【数学】最小二乘估计第一课时课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册.pptx
《【数学】最小二乘估计第一课时课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册.pptx》由会员分享,可在线阅读,更多相关《【数学】最小二乘估计第一课时课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册.pptx(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第一课时第一课时 (最小二乘估计最小二乘估计)一、知识回顾一、知识回顾 我们称上式为我们称上式为Y Y关于关于x x的的一元线性回归模型一元线性回归模型其中,其中,Y Y称为称为因变因变量量或或响应变量响应变量,x x称为称为自变量自变量或或解释变量解释变量;a;a和和b b为模型的未知参数,为模型的未知参数,a a称为截距参数称为截距参数,b b称为斜率称为斜率参数参数;e;e是是Y Y与与b bx xa a之间的之间的随机误差随机误差.模模型中的型中的Y Y也是随机变量,其值虽然不能由变量也是随机变量,其值虽然不能由变量x x的值确定的值确定,但是却能但是却能表示为表示为bxbxa a与
2、与e e的和的和(叠加叠加),前一部分由,前一部分由x x所确定,后一部分是随所确定,后一部分是随机的机的.如果如果e=0e=0,那么,那么Y Y与与x x之间的关系就可用一元线性函数模型来之间的关系就可用一元线性函数模型来描述描述.在一元线性回归模型中在一元线性回归模型中,表达式表达式Y=bY=bx xa+ea+e刻画的是变量刻画的是变量Y Y与变与变量工之间的线性相关关系,其中参数量工之间的线性相关关系,其中参数和和b b未知,需要根据成对样未知,需要根据成对样本数据进行估计本数据进行估计.由模型的建立过程可知,参数由模型的建立过程可知,参数a a和和b b刻画了变量刻画了变量Y Y与变量
3、与变量x x的线性关系,因此通过成对样本数据估计这两个参数,相的线性关系,因此通过成对样本数据估计这两个参数,相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近体上与这条直线最接近.二、探究新知二、探究新知 利用利用下面下面父亲身高与儿子身高的父亲身高与儿子身高的散点图找出一条直线,使各散散点图找出一条直线,使各散点在整体上与此直线尽可能接近点在整体上与此直线尽可能接近.二、探究新知二、探究新知 有的同学可能会想,可以采用测量的方法,先画出一条直线,有的同学可能会想,可以采用测量的方法,先画出一条直线,测量出各
4、点与它的距离,然后移动直线,到达一个使距离的和最小测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置的位置.测量出此时的斜率和截距测量出此时的斜率和截距,就可得到一条直线就可得到一条直线,如如上上图所示图所示.父亲身高父亲身高/cm/cm185185165165170170175175180180160160185185165165170170175175180180160160190190儿子身高儿子身高/cm/cm二、探究新知二、探究新知 有的同学可能会想,可以在图中选择这样的两点画直线,使得有的同学可能会想,可以在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同直线
5、两侧的点的个数基本相同,把这条直线作为所求直线把这条直线作为所求直线,如如上上图图所示所示.父亲身高父亲身高/cm/cm185185165165170170175175180180160160185185165165170170175175180180160160190190儿子身高儿子身高/cm/cm 利用利用下面下面父亲身高与儿子身高的父亲身高与儿子身高的散点图找出一条直线,使各散散点图找出一条直线,使各散点在整体上与此直线尽可能接近点在整体上与此直线尽可能接近.二、探究新知二、探究新知 还有的同学会想,在散点图中多取几对点,确定出几条直线的还有的同学会想,在散点图中多取几对点,确定出几条
6、直线的方程,再分别求出这些直线的斜率、截距的平均数,将这两个平均方程,再分别求出这些直线的斜率、截距的平均数,将这两个平均数作为所求直线的斜率和截距如数作为所求直线的斜率和截距如上上图所示图所示.父亲身高父亲身高/cm/cm185185165165170170175175180180160160185185165165170170175175180180160160190190儿子身高儿子身高/cm/cm 利用利用下面下面父亲身高与儿子身高的父亲身高与儿子身高的散点图找出一条直线,使各散散点图找出一条直线,使各散点在整体上与此直线尽可能接近点在整体上与此直线尽可能接近.二、探究新知二、探究新知
7、 先进一步明确我们面临的任务先进一步明确我们面临的任务:从成对样本数据出发,用数学从成对样本数据出发,用数学的方法刻画的方法刻画“从整体上看从整体上看,各散点与直线最接近各散点与直线最接近”.”.同学们不妨去实践一下同学们不妨去实践一下,看看这些方法是不是真的可行看看这些方法是不是真的可行.上面这些方法虽然有一定的道理上面这些方法虽然有一定的道理,但比较难操作,我们需要另但比较难操作,我们需要另辟蹊径辟蹊径.通常,我们会想到利用点到直线通常,我们会想到利用点到直线y=by=bx x+a+a的的“距离距离”来刻画散点来刻画散点与该直线的接近程度,然后用所有与该直线的接近程度,然后用所有“距离距离
8、”之和刻画所有样本观测之和刻画所有样本观测数据与该直线的接近程度数据与该直线的接近程度.我们设满足一元线性回归模型的两个变我们设满足一元线性回归模型的两个变量的量的n n对样本数据为对样本数据为(x x1 1,y y1 1),(x x2 2,y y2 2),(x xn n,y yn n).由由y yi i=bx=bxi i+a+ae ei i(i=1(i=1,2 2,n)n),得,得|y|yi i-(bx-(bxi i+a)|=|e+a)|=|ei i|显然显然|e|ei i|越小越小,表示表示点点(x(xi i,y,yi i)与点与点(x(xi i,bx,bxi i+a)+a)的的“距离距离
9、”越小越小,即样本数据点离直线即样本数据点离直线y=bx+ay=bx+a的竖直距离越的竖直距离越小小,如如右右图所示特别地图所示特别地,当当e ei i=0=0时时,表示表示点点(x(xi i,y yi i)在这条直线上在这条直线上.二、探究新知二、探究新知 因此,可以用这因此,可以用这n n个竖直距离之和个竖直距离之和|yi-(bxyi-(bxi i+a)|+a)|来刻画各样本观测数据与直线来刻画各样本观测数据与直线y=bxy=bxa a的的“整体接近程度整体接近程度”.”.在实际应用中,因为绝对值使得计算不方便,所以人们通常用在实际应用中,因为绝对值使得计算不方便,所以人们通常用各散点到直
10、线的竖直距离的平方之和各散点到直线的竖直距离的平方之和 Q=Q=(y yi i-ba-bai i-a)a)2 2来刻画来刻画“整体接近程度整体接近程度”.”.在上式中,在上式中,x xi i、y yi i(i=1(i=1,2 2,3 3,n)n)是已知的成对样本数据,是已知的成对样本数据,所以所以Q Q由由a a和和b b所决定,即它是所决定,即它是a a和和b b的函数的函数.因为因为Q Q还可以表示为还可以表示为 e ei i2 2,即它是随机误差的平方和,这个和当然越小越好,所以我们取使即它是随机误差的平方和,这个和当然越小越好,所以我们取使Q Q达到最小的达到最小的a a和和b b的值
11、,作为截距和斜率的估计值的值,作为截距和斜率的估计值.下面利用成对样本数据求使下面利用成对样本数据求使Q Q取最小值的取最小值的a a,b.b.记记 .因为因为注意到注意到二、探究新知二、探究新知所以所以 上式右边各项均为非负数,且前上式右边各项均为非负数,且前n n项与项与a a无关无关.所以,要使所以,要使Q Q取取到最小值,后一项的值应为到最小值,后一项的值应为0 0,即,即 .此时此时 上式是关于上式是关于b b的二次函数,因此要使的二次函数,因此要使Q Q取得最小值,当且仅当取得最小值,当且仅当b b的取值为的取值为二、探究新知二、探究新知 综上,当综上,当a a、b b的取值为的取
12、值为 时,时,Q Q达到最小达到最小.二、探究新知二、探究新知三、三、最小二乘法最小二乘法 将将 称为称为Y Y关于关于x x的的经验回归方程经验回归方程,也称,也称经验回归函数经验回归函数或或经验回归公式经验回归公式,其图形称为其图形称为经验回归直线经验回归直线.这种求经验回归方程这种求经验回归方程的方法叫做的方法叫做最小二乘法最小二乘法,求得的求得的 叫做叫做b b、a a的最小二乘估计的最小二乘估计.其中其中这里的这里的“二乘二乘”是平方的意思是平方的意思.编号编号1 12 23 34 45 56 67 78 89 910101111121213131414父亲身高父亲身高/cm/cm1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 最小 估计 第一 课时 课件 2023 2024 学年 下学 期数 学人 2019 选择性 必修 第三
链接地址:https://www.taowenge.com/p-97120532.html
限制150内