《简单线性回归》PPT课件.pptx
《《简单线性回归》PPT课件.pptx》由会员分享,可在线阅读,更多相关《《简单线性回归》PPT课件.pptx(115页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章一元线性(简单)回归模型计量经济学附录:几个 数学和统计概念1.总体和样本总体:所研究问题中涉及到的全部个体的总和。又称为样本空间。样本:总体中的一部分。2.概率与随机变量令A表示样本空间中的一个事件。概率P(A)指在重复实验中时间A将出现次数的比例。P(A)的性质:(1)对每个A有0P(A)1(2)如果A,B,C.构成事件的穷举集,则P(A+B+C+.)=1,其中A+B+C表示A或B或C(3)如果A,B,C.是互斥事件,则P(A+B+C+.)=P(A)+P(B)+P(C)+.概率:例考虑投掷一颗骰子的实验。样本空间由结果1,2,36构成。这6个事件穷举了整个样本空间。任一结果都有相同的
2、概率出现,P(1)=P(2)=P(3)=1/6。由于穷尽,P(1)+P(2)+P(6)=1又由于互斥,P(1+2+3+6)=P(1)+P(2)+P(6)=13.随机变量在数学上,一个变量如果它的值由随机试验的结果决定,就称为随机变量。随机变量分为离散和连续随机变量两种。离散随机变量只取有限多个值,例如投掷两颗骰子,将随机变量X定义为两骰子出现的数字之和,则X将取如下数字之一:2,3,4,5.12.连续随机变量可以取某一区间的任何值。4.概率密度函数(1)离散随机变量的概率密度函数令X为取x1,x2,xn的一个离散随机变量,则函数:f(x)=P(X=xi)对于i=1,2,n =0 对于xxi叫做
3、X的离散概率密度函数,其中P(X=xi)表示离散变量X取值xi的概率例:两颗骰子定义随机变量X表示投掷两颗骰子所出现的数字之和,可取的数值共有11个。此变量的概率密度函数可表示如下:x=23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/36(2)连续随机变量的概率密度函数令X为一连续随机变量,如果满足以下条件,则称f(x)是X的概率密度函数:P(ax b)是指x落在a到b区间上的概率.例:连续随机变量的概率密度分布考虑如下密度分布验证上述条件,并求X落在(0,1)区间上的概率。5.集中趋势的度量:期望(均值)对于随机变量X,
4、其期望值E(X)就是对X的所有可能值得加权平均,权数为概率密度函数。当X为离散时容易说明。如假定X分别以概率1/8,1/2和3/8取值-1,0,2则E(X)=(-1)1/8+01/2+23/8=5/8期望对于一个随机变量,其期望E(X)为离散变量:其中连续变量:例续:期望的性质性质1:E(c)=c,c为常数性质2:E(aX+b)=aE(x)+b性质3:E(iaiXi)=iaiE(Xi),i=1,2,n6.变异性的度量:方差对于随机变量X,通常记期望E(X)=,反映集中情况方差则度量X距离其期望多远。Var(X)=E(X-)2有用的表述:Var(X)=E(X2)-2标准差:是方差的正的平方根7:
5、样本方差和标准误从样本实际计算估计总体方差和标准差。样本方差:标准误:方差的性质性质1:var(c)=0性质2:var(aX+b)=a2var(X)均值相同方差不同的两个概率密度函数第一节模型的建立和假设条件一、简单回归模型的定义最基本的计量分析研究如下问题:y和x是两个代表某个总体的变量,如中国居民的储蓄和收入。感兴趣的是在其他条件不变的情况下,x对y的影响,或研究y如何随x变化。一般性的,可表示为y=f(x)。有三个问题:(1)y和x的确切关系;(2)其他影响y的因素;(3)如何保证是在其他条件不变的情况下刻画了y和x之间的关系?简单回归方程y=b0+b1x+u或yi=b0+b1xi+ui
6、上式定义了简单线性回归方程,简单回回归的的术语yx因变量被解释变量响应变量回归子自变量解释变量控制变量回归元简单线性回归y=b0+b1x+u简单:只有2个变量,因此也称为双变量线性回归模型。线性:y和x之间、y和b之间为线性关系。从表达式中可以看出,对于三个基本问题,第一个问题由线性函数解决;第二个问题由误差项u解决,将其他因素都归入其中;第三个问题由假设Du=0解决。如果Du=0,Dy=b1Dx,参数b1称为斜率参数,反映了其他条件不变时x对y的影响;参数b1称为截距参数。例2.1大豆收成与施肥量农业研究者常假设大豆收成由以下模型决定:yield=b0+b1fertilizer+uyield
7、表示大豆收成(y);fertilizer表示施肥量(x)。感兴趣的是,在其他因素不变的情况下,施肥量如何影响大豆收成。这一影响由b1给出,误差项u包括了诸如土地质量、降雨量等因素。系数b1度量了在其他条件不变的情况下,施肥量对产出量的影响:Dyield=b1Dfertilizer 例2.2工资与教育程度许多研究都分析了工资与受教育程度之间的关系,我们一般预计,受教育程度越高,收入也越高。以下模型表示一个人的工资水平与他的受教育程度及其他不可观测因素之间的关系:如果工资和教育分别以每小时美元数和受教育的年数来度量,则b1度量了在其他条件不变的情况下,多接受一年教育导致的小时工资的增长量。强调:线
8、性线形一词是指参数和干扰项进入方程的方式,而不一定是指变量之间的关系。如y=b0+b1x+u,y=b0+b1cos(x)+u,y=b0+b1/x+u,ln(y)=b0+b1ln(x)+u 等均为线形方程。关于误差项加入u的原因:(1)省略的变量(2)随机行为(3)数学模型近似(4)总量误差(5)测量误差.二、总体回归线先看一个重要结论。只要方程中包含截距项只要方程中包含截距项b b0,我们总可以假设,我们总可以假设E(u)=0。E为期望符号。为什么?对y=b0+b1x+u求期望,由于和的期望等于期望的和,因此,E(y)=b0+b1x+E(u)如果E(u)=a0,令b b0+a,则E(y)=b+
9、b1x+E(u)-a=b+b1x25.y4y1y2y3x1x2x3x4u1u2u3u4xy简单回归方程的分解:ui=yi(b0+b1xi)总体回归线:E(y)b0+b1x三、关于误差项的假设条件1.零均值假定为了能够估计未知参数b,需要作出u和x之间关系的一个根本假设:假设1:E(u|x)=E(u)=0 第一个等式说的是给定x,u的条件期望等于0,它表明,对于任意给定的x,无法观测因素的平均值(期望)都相等,并因此必然与总体中u的平均值也相等,该假定称为“零条件均值假定零条件均值假定”。在该假定下,总体回归线往往表示为:E(y|x)b0+b1x27.x1x2总体回归线E(y|x)是x的线性函数
10、,对于任何给定的x,y的分布都 以直线E(y|x)=b0+b1x为中心。E(y|x)=b0+b1xyf(y|x)总体回归线关于给定X例(续)为简化,假定u就是不可观测的天生能力。零条件均值的假定有什么含义呢?该假定要求,无论受教育程度如何,能力的平均水平都相同。例如E(abil|9)表示受过9年义务教育者的平均能力,E(abil|16)表示受过16年教育(本科生)的平均能力,零条件均值假定意味着两者相等。事实上所有所有教育程度的人都具有相同的平均能力。如果我们认为平均能力随着受教育程度的增加而增加,即存在相关关系,该假定就是错误的。思考:在大豆收成例中,零条件均值假定有什么含义?2.外生性假定
11、假设2:Cov(u,x)=E(ux)=0即u和x之间的协方差为0,也就是两者之间不存在相关关系。协方差:Cov(x,y)=E(xy)-E(x)E(y)或 Cov(x,y)=E(x-E(x)(y-E(y)相关系数:3.同方差假定假设3:var(u)=2该假定意味着,每个x所对应的随机误差项u都具有相同的常数方差,因此称为同方差方差:var(x)=E(x-)2=E(x2)-2其中,=E(x)为x的均值(期望)在现代计量经济学中,同样以条件方差的形式:var(u|x)=23.同方差假定(续)y的方差与u的方差相同var(y)=var(b0+b1x+u)=var(u)=2或var(y|x)=var(b
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 简单线性回归 简单 线性 回归 PPT 课件
限制150内