《统计学》线性回归模型-PPT课件.ppt
《《统计学》线性回归模型-PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计学》线性回归模型-PPT课件.ppt(92页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 第八章回归和相关分析第八章回归和相关分析1在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确1 导言导言2在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 在自然界和人类社会中,经常会遇到一些变量共处于一个统一体中,他们相互联系,相互制约,在一定条件下相互转化。社会经济现象尤其如此。例如某生产厂家的生产费用由所生产的产品数量和各种生产投入要素的价格等因素所决定。3在整堂
2、课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 在社会经济现象中,变量之间的关系大致可以分为两种:1).函数关系 2).统计关系。4在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 函数关系:变量之间依一定的函数形式形成的一一对应关系称为函数关系。若两个变量分别记作y和x,则当y 与x之间存在函数关系时,x值一旦被指定,y值就是唯一确定的。函数关系可以用公式确切的反映出来,一般记为y=f(x)。5在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入
3、深,所提出的问题也很明确 例如,某种商品的销售额(y)与销售量(x)之间的关系,在销售价格(p)一定的条件下,只要给定一个商品销售量,就有一个唯一确定的商品销售额与之对应,用公式表示为y=p(x)。6在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 统计关系:两个变量之间存在某种依存关系,但变量Y并不是由变量X唯一确定的,它们之间没有严格的一一对应关系。两个变量之间的这种关系就是统计关系,也称为相关关系。7在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 相关关系与函数关系有
4、十分密切的联系。在实际中,由于观察和测量误差等原因,函数关系往往是通过相关关系表现的,而在研究相关关系时,又常用函数关系作为工具,以相应的函数关系数学表达式表现相关关系的一般数量关系。8在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 例如:同样收入的家庭,用于食品的消费支出往往并不相同。因为对家庭食品费用的影响,不仅有家庭收入的多少,还有家庭人口,生活习惯等因素,所以,家庭食品费用支出与家庭收入之间不是函数关系,而是相关关系。9在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明
5、确 在含有变量的系统中,考察一些变量对另一些变量的影响,它们之间可能存在一种简单的函数关系,也可能存在一种非常复杂的函数关系。有些变量之间的关系是非确定性的关系,这种关系无法用一个精确的数学来表示。10在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 我们需要区分两种主要类型的变量。一种变量相当于通常函数关系中的自变量,它或者能控制或者虽不能控制但可观测,这种变量称为自变量。自变量的变化能波及另一些变量,这样的变量称为因变量。人们通常感兴趣的问题是自变量的变化对因变量的取值有什么样的影响。11在整堂课的教学中,刘教师总是让学生带着问题
6、来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 回归分析正是研究自变量的变动对因变量的变动的影响程度,其目的在于根据已知自变量的变化来估计或预测因变量的变化情况。12在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 回归的内容包括如何确定因变量与自变量之间的回归模型;如何根据样本观测数据估计并检验回归模型及未知参数;在众多的自变量中,判断哪些变量对因变量的影响是显著的,哪些变量的影响是不显著的;根据自变量的已知值或给定值来估计和预测因变量的平均值等等。13在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设
7、置具有一定的梯度,由浅入深,所提出的问题也很明确 线性回归分析是研究变量与变量之间的线性相关关系。从分析的内容上看,线性回归是建立变量间的拟合线性相关模型,主要用于估计和预测。线性回归模型应用领域极为广泛,在许多领域里都有应用非常成功的例子,它是现代应用统计分析方法中的重要内容之一。14在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 一元线性回归模型一元线性回归模型15在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确8.2.1 一元线性回归模型的数学表示式一元线性回归模型的
8、数学表示式 如果两个变量之间存在相关关系,并且一个变量的变化会引起另一个变量按某一线性关系变化,则两个变量间的关系可以用一元线性回归模型描述。16在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 其数学模型为:y=(8-1)其中,y 为因变量,x为自变量,为模型参数,为回归截距,为回归系数,为随机误差项,且N(0,).17在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 在实际问题中,(8-1)中的模型参数 是未知的,通常只能在自变量的一些点上对因变量进行观测,得到一定量的数
9、据,由数据出发对模型进行推断。18在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确8.2.2 回归系数回归系数 的最小二乘估计。的最小二乘估计。假定(),(),()为n次独立试验所得到的样本观测值,则有 ,i=1,2,n (8-2)其中i,i=1,2,n为随机误差项,对i,i=1,2,n的基本假定是i,i=1,2,n相互独立,服从N(0,)分布。19在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 记 Q()=Q()是直线y=对于所有数据点的偏差平方和。取直线y=使得 Q()
10、达到最小 即 Q()=Q(),z用y=来估计回归直线,这种方法称为最小二乘法最小二乘法。20在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 为求与 分别对应的最小二乘估计 ,注意到Q()是 的非负二次函数,因此最小值点存在且唯一,应满足以下方程组:21在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 求解方程组得:其中 ,22在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确8.2.3利用最小二乘法所得到的估计量利用
11、最小二乘法所得到的估计量 有如下性质:有如下性质:(1)分别是 的无偏估计。(2)和 的最小二乘估计 和 为“方差最小”线性无偏估计(3)的无偏估计为 :23在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 在实际中,方差 是未知的,因此,可用估计量 来估计 。24在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 例题例题1、在某类企业中随机抽取10个企业,搜集它们的产量和生产费用情况,获得数据如表1所示:25在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有
12、一定的梯度,由浅入深,所提出的问题也很明确表1 企业产量和生产费用 26在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 我们可作出散点图,易看出变量x与y之间的关系近似可看作是线性关系,根据表1的数据,利用最小二乘法,求一元线性回归方程,27在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确以下列出的为计算表28在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 29在整堂课的教学中,刘教师总是让学生带着问题来学习,而
13、问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 =134.7909+0.3978x为所求的一元回归模型。30在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确8.2.4 一元线性回归模型的检验一元线性回归模型的检验 我们根据样本观测值,利用最小二乘法建立起一元线性回归模型 =,该模型是否满足回归模型的基本假设,还需要进行统计检验。31在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 统计检验应包括两方面的内容:一是回归方程的显著性检验,即反映回归模型 =对样本观测值的
14、拟合程度如何;一是回归系数的显著性检验,即检验变量y与变量x之间是否能用线性关系来描述;以下介绍三种检验的方法:32在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确(1)回归模型的拟合程度的测度 变量y的各个观测点聚集在回归直线 =周围的紧密程度,称为回归直线对样本数据点的拟合程度,常用可决系数R2来表示。33在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 总的离差平方和 SST=+34在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,
15、所提出的问题也很明确 因为 =0 故 SST=记 SSR=,SSE=则 SST=SSR+SSE (8-5)SSR称为回归平方和,SSE称为残差平方和35在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 (8-5)可作如下解释:因变量的总变化量(有SST表示)可分成两部分之和,其中一部分是由自变量所引起的变化(由SSR刻画),另一部分是随机误差所引起的变化(由SSE刻画)。变量y的各个观测值点与回归直线越靠近,SSR在SST中所占的比重越大,可见,比值SSR/SST的大小,能反映回归模型拟合程度的优劣。36在整堂课的教学中,刘教师总是让
16、学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 由此,可定义统计量:R2=R2称为“可决系数”,显然,0R21。当R2接近于1时,回归平方和SSR在总的平方和SST中所占的比重大,说明自变量对因变量的影响较大;反之,当R2接近与0时,回归平方和SSR在总的平方和SST中所占的比重小,说明自变量对因变量的影响较小。综上所述,R2越接近与1,说明模型越有效,R2越接近与0,说明模型越无效。应该注意的是,R2通常只用于模型有效性的一个大致的判断。37在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 R2称为“
17、可决系数”,显然,0R21。当R2接近于1时,回归平方和SSR在总的平方和SST中所占的比重大,说明自变量对因变量的影响较大;反之,当R2接近与0时,回归平方和SSR在总的平方和SST中所占的比重小,说明自变量对因变量的影响较小。综上所述,R2越接近与1,说明模型越有效,R2越接近与0,说明模型越无效。应该注意的是,R2通常只用于模型有效性的一个大致的判断。38在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 可决系数R2只说明了回归方程对样本观察值拟合程度的好坏,却不能表示回归直线估计值与变量y的各实际观察值的绝对离差的数额。估计标
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 线性 回归 模型 PPT 课件
限制150内