第二章 一元线性回归模型.ppt





《第二章 一元线性回归模型.ppt》由会员分享,可在线阅读,更多相关《第二章 一元线性回归模型.ppt(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1第二章第二章 一元线性回归模型一元线性回归模型2.0 随机变量及其数字特征(补充)随机变量及其数字特征(补充)2.1 模型的建立及其假定条件模型的建立及其假定条件2.2 一元线性回归模型的参数估计一元线性回归模型的参数估计2.3 最小二乘估计量的统计性质最小二乘估计量的统计性质2.4 样本可决系数与样本可决系数与拟合优度拟合优度2.5 参数参数估计值的显著性检验和置信区间估计值的显著性检验和置信区间2.6 预测预测2.7 小结小结2.8 案例分析案例分析2第一节第一节 随机变量及其数字特征随机变量及其数字特征(补充内容补充内容)1.1.随机变量随机变量2.2.随机变量的数字特征随机变量的数字
2、特征3随机变量随机变量随机变量随机变量(stochastic/random variable)一个变量若它的值是由随机试验决定的,称其为随机变量。一个变量若它的值是由随机试验决定的,称其为随机变量。离散型随机变量离散型随机变量(discrete random variable)可能取到的值是有限个的随机变量可能取到的值是有限个的随机变量连续型随机变量连续型随机变量(continuous random variable)可能取到的值是无限个的随机变量可能取到的值是无限个的随机变量实例实例离散型随机变量:扔一次骰子出现的点数;未出生婴儿的性别离散型随机变量:扔一次骰子出现的点数;未出生婴儿的性别连
3、续型随机变量:人的身高;百米跑速度连续型随机变量:人的身高;百米跑速度4离散型变量的概率密度函数离散型变量的概率密度函数/概率分布概率分布(probability density function/probability distribution)实例实例X:投掷两颗骰子出现的点数之和:投掷两颗骰子出现的点数之和f(X):X的的PDFX23456789101112f(X)1/362/363/364/365/366/365/364/363/362/361/36F(X)1/363/366/3610/36 15/36 21/36 26/36 30/36 33/36 35/3615连续型变量的概率密度
4、函数连续型变量的概率密度函数(PDF)6连续型变量的概率密度函数连续型变量的概率密度函数(PDF)f(x)xabF(x)常用的概率分布常用的概率分布 1.正态分布正态分布 2.x x2 分布 3.t分布分布 4.F分布分布,则则三大抽样分布三大抽样分布1 1.分布定理定理2 2 设设 分布的密度函数分布的密度函数为为自由度为自由度为 的的 分布分布(1)(1)卡方分布卡方分布n=2n=3n=5n=10n=15分布图分布图分布密度图形分布密度图形(红色的是标准正态分布)分布图分布图t 分布分布密度图密度图m=10,n=4m=10,n=10m=10,n=15m=4,n=10m=10,n=10m=1
5、5,n=10分布图分布图16随机变量的数字特征随机变量的数字特征以上讨论了随机变量的概率密度函数以上讨论了随机变量的概率密度函数PDF,但在处理实际,但在处理实际问题时,往往不需要求出这些函数,而是只需要了解变量问题时,往往不需要求出这些函数,而是只需要了解变量的某些特征值。的某些特征值。这些特征值包括三类:这些特征值包括三类:度量变量分布的集中趋势(度量变量分布的集中趋势(central tendency):数学):数学期望或均值期望或均值度量变量分布的离散性(度量变量分布的离散性(dispersion):方差;标准差):方差;标准差度量两个变量的相关性(度量两个变量的相关性(correla
6、tion):协方差;相关):协方差;相关系数系数17数学期望(数学期望(expectation)或均值()或均值(mean)离散型变量的期望:离散型变量的期望:实例:扔两个骰子的点数之和实例:扔两个骰子的点数之和x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/3618随机变量的数字特征随机变量的数字特征连续型变量的期望:连续型变量的期望:实例:实例:19随机变量的数字特征随机变量的数字特征期望的性质:期望的性质:20方差(方差(variance)方差被定义为随机变量对其均值的期望距离,用于表示随方差被定义为随机变量对其均
7、值的期望距离,用于表示随机变量与其均值的偏离程度。方差较小说明变量的分布比机变量与其均值的偏离程度。方差较小说明变量的分布比较集中,反之则说明变量的分布很分散较集中,反之则说明变量的分布很分散方差的性质方差的性质21实例:实例:x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/3622标准差(标准差(standard deviation)方差的量纲与变量的量纲不同,为此引入与变量具有相同方差的量纲与变量的量纲不同,为此引入与变量具有相同量纲的数字特征量纲的数字特征标准差,同样度量变量的离散程度标准差,同样度量变量的离散程度
8、标准差的性质:标准差的性质:23协方差(协方差(covariance)协方差度量两个随机变量的相关(协方差度量两个随机变量的相关(correlation)程度)程度协方差大于协方差大于0表示两个变量正相关(表示两个变量正相关(positively correlated),),即其中一个变量随着另一个变量的增大而增大即其中一个变量随着另一个变量的增大而增大协方差小于协方差小于0表示两个变量负相关(表示两个变量负相关(negatively correlated),),即其中一个变量随着另一个变量的增大而减小即其中一个变量随着另一个变量的增大而减小协方差等于协方差等于0表示两个变量不相关(表示两个变
9、量不相关(uncorrelated)24第一节第一节 模型的建立及其假定条件模型的建立及其假定条件一、回归分析的概念二、一元线性回归模型三、随机误差项的假定条件25变量间关系的分类变量间关系的分类确定的函数关系确定的函数关系:如圆的面积如圆的面积:非确定非确定的的依赖依赖关系关系:如如广告支出与商品销售额广告支出与商品销售额 为了分析和利用变量间非确定的依赖关系,为了分析和利用变量间非确定的依赖关系,人们建立了各种统计分析方法,人们建立了各种统计分析方法,回归分析方法回归分析方法是是最常用的经典方法之一。最常用的经典方法之一。26回归分析的概念o最初的涵义:最初的涵义:“回归回归”一词最早由英
10、国生理学一词最早由英国生理学家高尔顿(家高尔顿(Galton,1886Galton,1886)提出,用以指儿女的)提出,用以指儿女的身高有回复到同龄人口总体平均身高的趋势。身高有回复到同龄人口总体平均身高的趋势。o回归分析研究因变量对一个或多个自变量的依回归分析研究因变量对一个或多个自变量的依赖关系,其用意在于通过后者的已知值,去估赖关系,其用意在于通过后者的已知值,去估计或预测前者的总体均值(计或预测前者的总体均值(GujaratiGujarati,19951995)o回归分析与回归分析与相关性分析相关性分析(对应依赖关系与对应依赖关系与相关关相关关系系)27一元线性回归模型一元线性回归模型
11、学习成绩学习成绩YiYi与自习时间与自习时间XiXi之间的非确定依赖关系之间的非确定依赖关系 y yi i=0 0+1 1x xi i +u ui i 其中其中 y yi i 被解释变量(因变量),被解释变量(因变量),x xi i 解释变量(自变量),解释变量(自变量),u ui i 随机误差项,随机误差项,0 0 截距项(常数项),截距项(常数项),0 0,1 1一起称为回归系数(待定系数或待定参数)一起称为回归系数(待定系数或待定参数),。上式称为上式称为一元一元线性线性回归回归模型。模型。28y yi i=0 0+1 1x xi i +u ui i包括两部分:包括两部分:(1 1)线性
12、部分线性部分(确定性部分确定性部分),0 0+1 1x xi i,称为总体回归直线;称为总体回归直线;(2 2)随机部分)随机部分(非确定性部分非确定性部分)u ui i,是对上,是对上述线性关系的扰动。述线性关系的扰动。29y yi i=0 0+1 1x xi i +u ui i随机部分随机部分(非确定性部分非确定性部分)u ui i的内容;的内容;1 1、人们的随机行为;、人们的随机行为;2 2、回归模型中省略的变量;、回归模型中省略的变量;3 3、数学模型不够完善;、数学模型不够完善;4 4、经济变量之间的合并误差;、经济变量之间的合并误差;5 5、数据测量误差;、数据测量误差;30总体
13、回归直线总体回归直线 通常线性回归函数通常线性回归函数E(E(y yi i)=)=0 0+1 1x xi i是观察不到是观察不到的,利用样本得到的只是对它的估计,也就是对的,利用样本得到的只是对它的估计,也就是对 0和和 1的估计。的估计。31有关随机误差项的假定有关随机误差项的假定 1.1.零均值性零均值性,E(E(u ui i)=0)=0。2.2.同方差性同方差性,Var(Var(u ui i)=)=u u2 2。(Y Yi i与与u ui i也有相同的方差)也有相同的方差)3.3.无序列相关性无序列相关性(非自相关性),(非自相关性),Cov(Cov(u ui i,u uj j)=0)=
14、0,(i i j j)。4.4.u ui i 与与x xi i不相关不相关,Cov(Cov(u ui i,x xi i)=0)=0。.u ui i 为正态分布为正态分布,u ui i N(0 N(0,u u )。32第二节一元线性回归模型的参数估计第二节一元线性回归模型的参数估计普通最小二乘法()普通最小二乘法()几个常用的结果几个常用的结果截距为零的一元线性回归模型的参数估计截距为零的一元线性回归模型的参数估计一元线性回归模型举例一元线性回归模型举例33总体与样本总体(总体(population)研究对象的全体,记为研究对象的全体,记为X随机样本(随机样本(random sample)/样本
15、(样本(sample)在相同条件下对总体在相同条件下对总体X进行进行n次重复的、独立的次重复的、独立的观测,每次观测结果都是与观测,每次观测结果都是与X具有相同分布的、相具有相同分布的、相互独立的随机变量,记为互独立的随机变量,记为X1,X2,Xn,把它们称,把它们称为来自总体的一个简单随机样本,简称样本,称为来自总体的一个简单随机样本,简称样本,称n为为样本容量样本容量。当观测完成后,得到一组观测值。当观测完成后,得到一组观测值x1,x2,xn,称为,称为样本值样本值.34总体回归模型与总体回归方程总体回归模型与总体回归方程 y yi i=0 0+1 1x xi i +u ui i这个式子表
16、示的是变量和之间的某种这个式子表示的是变量和之间的某种非确定依赖关系(真实的),称为它们的非确定依赖关系(真实的),称为它们的总体总体回归模型回归模型。由于随机扰动项的存在,使得变量由于随机扰动项的存在,使得变量i i和和i i不是总在一条直线上,但是不是总在一条直线上,但是i i的均值总是和的均值总是和i i在一条直线上。因为,在一条直线上。因为,(i i)0 0+1 1x xi i 这个式子称为变量和之间的这个式子称为变量和之间的总体回归总体回归方程或总体回归线方程或总体回归线。35样本回归模型与样本回归方程样本回归模型与样本回归方程由于我们不可能从总体中得到所有可能的和由于我们不可能从总
17、体中得到所有可能的和的值,从而也就无法求出的值,从而也就无法求出 0 0和和 1 1的值。但是,我的值。但是,我们可以用抽样方法从总体中得到一些们可以用抽样方法从总体中得到一些和的值,和的值,从而可以得出这个样本中和的非确定依赖关系,从而可以得出这个样本中和的非确定依赖关系,即即样本回归模型样本回归模型36样本回归模型与样本回归方程样本回归模型与样本回归方程样本回归方程或样本回归线样本回归方程或样本回归线表示的是表示的是,由样本由样本回归模型得到的样本观测值的拟合值与解释变量回归模型得到的样本观测值的拟合值与解释变量之间的关系。之间的关系。37总体回归线与样本回归线图示总体回归线与样本回归线图
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二章 一元线性回归模型 第二 一元 线性 回归 模型

限制150内