8.2.2一元线性回归模型的最小二乘估计 课件(共23张PPT).pptx
《8.2.2一元线性回归模型的最小二乘估计 课件(共23张PPT).pptx》由会员分享,可在线阅读,更多相关《8.2.2一元线性回归模型的最小二乘估计 课件(共23张PPT).pptx(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、8.2.2 一元线性回归模型一元线性回归模型参数的最小二乘法估计参数的最小二乘法估计复习回顾复习回顾1.一元线性回归模型一元线性回归模型2.一元线性回归模型与函数模型的区别一元线性回归模型与函数模型的区别Y称为称为因变量因变量或或响应变量,响应变量,x称为称为自变量自变量或或解释变量,解释变量,e是是Y与与bx+a之间的随机误差之间的随机误差a称为称为截距参数,截距参数,b称为称为斜率参数斜率参数.在一元线性回归模型中,表达式在一元线性回归模型中,表达式Y=bx+a+e刻画的是变刻画的是变量量Y与变量与变量x之间的线性相关关系,其中参数之间的线性相关关系,其中参数a和和b未知,未知,需需要根据
2、成对样本数据进行估计要根据成对样本数据进行估计.由模型的建立过程可知,由模型的建立过程可知,参数参数a和和b刻画了变量刻画了变量Y与变与变量量x的线性关系的线性关系,因此通过成对样本数据估计这两个参数,因此通过成对样本数据估计这两个参数,相当于寻找一条适当的直线,使表示成对样本数据的这些相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近散点在整体上与这条直线最接近.探究!探究!利用前面的散点图找出一条直线,使各散点在利用前面的散点图找出一条直线,使各散点在整体上与此直线尽可能接近整体上与此直线尽可能接近.有的同学可能会想,可以采用测量的方法,先画出一有的同学可能会想
3、,可以采用测量的方法,先画出一条直线,测量出各点到直线的距离,然后移动直线,到达条直线,测量出各点到直线的距离,然后移动直线,到达一个使距离的和最小的位置一个使距离的和最小的位置 .测量出此时的斜率和截距,测量出此时的斜率和截距,就得到一条直线就得到一条直线 有的同学可能会想,可以在散点图中选则这样的两点有的同学可能会想,可以在散点图中选则这样的两点画一条直线,使得直线两侧点的个数基本相同,把这条直画一条直线,使得直线两侧点的个数基本相同,把这条直线作为所求直线如图所示线作为所求直线如图所示.还有的同学会想,在散点图中多取几对点,确定出几还有的同学会想,在散点图中多取几对点,确定出几条直线的方
4、程,再分别求出这些直线的斜率、截距的平均条直线的方程,再分别求出这些直线的斜率、截距的平均数,将这两个平均数作为所求直线的斜率和截距如图数,将这两个平均数作为所求直线的斜率和截距如图.同学们不妨去实践一下,看看这些方法是不是真的可行同学们不妨去实践一下,看看这些方法是不是真的可行.上面这些方法虽然有一定的道理,但比较难操作,我上面这些方法虽然有一定的道理,但比较难操作,我们需要另辟蹊径们需要另辟蹊径.先进一步明确我们面临的任务先进一步明确我们面临的任务:从成对样本数据出发,从成对样本数据出发,用数学的方法刻画用数学的方法刻画“从整体上看从整体上看,各散点与直线最接近各散点与直线最接近”.通常,
5、我们会想到通常,我们会想到利用利用点到直线点到直线y=bx+a的的“距离距离”来来刻画散点与该直线的接近程度,然后用刻画散点与该直线的接近程度,然后用所有所有“距离距离”之和之和刻画所有样本观测数据与该直线的接近程度刻画所有样本观测数据与该直线的接近程度.我们设满足一元线性回归模型的两个变量的我们设满足一元线性回归模型的两个变量的n对样本对样本数据为数据为(x1,y1),(x2,y2),),(xn,yn),由由yi=bxi+a+ei(i=1,2,n),得,得|yi(bxi+a)|=|ei|.由由yi=bxi+a+ei(i=1,2,n),得,得|yi(bxi+a)|=|ei|.显然显然|ei|越
6、小,表示点越小,表示点(xi,yi)与点与点(xi,bxi+a)的的“距离距离”越小,即样本数据点离直线越小,即样本数据点离直线y=bx+a的的竖直距离竖直距离越小越小,如图,如图所示所示.特别地,当特别地,当ei=0时,表示点时,表示点(xi,yi)在这条直线上在这条直线上.来刻画各样本观测数据与直线来刻画各样本观测数据与直线y=bx+a的的“整体接近程度整体接近程度”.因此可以用这因此可以用这n个竖直距离之和个竖直距离之和 在实际应用中,因为绝对值使得计算不方便,所以人在实际应用中,因为绝对值使得计算不方便,所以人们通常用各散点到直线的竖直距离的平方之和们通常用各散点到直线的竖直距离的平方
7、之和刻画刻画“整体接近程度整体接近程度”.在上式中,在上式中,xi,yi(i=1,2,n)是已知的成对样本是已知的成对样本数据数据,所以所以Q由由a和和b所决定,即它是所决定,即它是a和和b的函数的函数.这个和当然越小越好这个和当然越小越好.所以我们取使所以我们取使Q达到最小的达到最小的a和和b值值,作为截距作为截距a和斜率和斜率b的估计值的估计值.Q越小越好越小越好.下面利用成对样本数据求使下面利用成对样本数据求使Q取最小值的取最小值的a和和b.上式是关于上式是关于b的二次函数,因此要使的二次函数,因此要使Q取得最小值,取得最小值,当且仅当当且仅当b的取值为的取值为时,时,Q达到最小达到最小
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 8.2.2一元线性回归模型的最小二乘估计 课件共23张PPT 8.2 一元 线性 回归 模型 最小 估计 课件 23 PPT
限制150内