计量经济学的数理统计学基础.ppt
计量经济学的数理统计学基础计量经济学的数理统计学基础第一节第一节 基本概念基本概念第二节第二节 对总体的描述对总体的描述随机变量的数字特征随机变量的数字特征第三节第三节 对样本的描述对样本的描述样本分布的数字特征样本分布的数字特征第四节第四节 随机变量的分布随机变量的分布总体和样本的连接点总体和样本的连接点第五节第五节 通过样本,估计总体(一)通过样本,估计总体(一)估计量的估计量的特征特征第六节第六节 通过样本,估计总体(二)通过样本,估计总体(二)估计方法估计方法第七节第七节 通过样本,估计总体(三)通过样本,估计总体(三)假设检验假设检验 2022/12/22中山学院经济与管理系1第一节第一节 基本概念基本概念总体和个体总体和个体样本和样本容量样本和样本容量随机变量随机变量随机变量的分布函数和分布密度函数随机变量的分布函数和分布密度函数2022/12/22中山学院经济与管理系21.1 总体(集合)、个体(构成总体(集合)、个体(构成集合的元素)、样本和样本容量集合的元素)、样本和样本容量研究对象的全体称为总体或母体,组成总体的每研究对象的全体称为总体或母体,组成总体的每个基本单位称为个体。个基本单位称为个体。总体中抽出若干个个体组成的集体称为样本。样总体中抽出若干个个体组成的集体称为样本。样本中包含的个体的个数称为样本的容量,又称为本中包含的个体的个数称为样本的容量,又称为样本的大小。样本的大小。注意:抽样是按注意:抽样是按随机原则随机原则选取的,即总体中每个个体有同选取的,即总体中每个个体有同样的机会被选入样本样的机会被选入样本2022/12/22中山学院经济与管理系31.2 随机变量随机变量根据概率不同而取不同数值的变量称为随机变量根据概率不同而取不同数值的变量称为随机变量(Random Variable)一个随机变量具有下列特性:可以取许多不同的一个随机变量具有下列特性:可以取许多不同的数值,取这些数值的概率为数值,取这些数值的概率为p,2022/12/22中山学院经济与管理系4样本是总体的一部分。总体一般是未知的,样本是总体的一部分。总体一般是未知的,一般要通过样本才能部分地推知总体的情一般要通过样本才能部分地推知总体的情况。况。2022/12/22中山学院经济与管理系51.3随机变量的分布函数随机变量的分布函数定义定义 若若X为一随机变量,对任意实数为一随机变量,对任意实数x,称称 F(x)P(X x)为随机变量为随机变量X的的分布函数分布函数。2022/12/22中山学院经济与管理系6连续型随机变量的分布密度连续型随机变量的分布密度定义:对于任何实数定义:对于任何实数x,如果随机变量,如果随机变量X的分布函的分布函数数F(x)可以写成)可以写成2022/12/22中山学院经济与管理系7第二节第二节 对总体的描述对总体的描述 随机变量的数字特征随机变量的数字特征2.1、数学期望、数学期望2.2、方差、方差2.3、数学期望与方差的图示、数学期望与方差的图示2022/12/22中山学院经济与管理系82.1.1 数学期望:一个加权平均数学期望:一个加权平均值值数学期望描述随机变量(总体)的一般水平。数学期望描述随机变量(总体)的一般水平。定义定义2.1离散型随机变量数学期望的定义:离散型随机变量数学期望的定义:定义定义2.2 连续型随机变量数学期望的定义连续型随机变量数学期望的定义2022/12/22中山学院经济与管理系9变量X的取值x1x2xn相应概率Pp1p2pn2.1.2数学期望的性质数学期望的性质(1)如果)如果a、b为常数,则为常数,则 E(aX+b)=aE(X)+b(2)如果)如果X、Y为两个随机变量,则为两个随机变量,则 E(X+Y)=E(X)+E(Y)(3)如果)如果g(x)和和f(x)分别为分别为X的两个函数,则的两个函数,则 Eg(X)+f(X)=Eg(X)+Ef(X)(4)如果)如果X、Y是两个独立的随机变量,则是两个独立的随机变量,则 E(X.Y)=E(X).E(Y)2022/12/22中山学院经济与管理系102.2.1 方差的定义方差的定义定义定义 离均差离均差 如果随机变量如果随机变量X的数学期望的数学期望E(X)存在,称存在,称X-E(X)为随机变量为随机变量X的离均差。显然,随机变量离的离均差。显然,随机变量离均差的数学期望是均差的数学期望是0,即,即 E X-E(X)=0定义定义 方差、标准差方差、标准差 随机变量离均差平方的数学期望随机变量离均差平方的数学期望 叫随机变量的方差,记作叫随机变量的方差,记作Var(x)或或D(x)。方差的算术平方根叫标准差。方差的算术平方根叫标准差。2022/12/22中山学院经济与管理系112.2.2方差的意义方差的意义(1)离均差和方差都是用来描述离散程度的,)离均差和方差都是用来描述离散程度的,即描述即描述X对于它的期望的偏离程度,这种偏差越对于它的期望的偏离程度,这种偏差越大,表明变量的取值越分散。大,表明变量的取值越分散。(2)一般情况下,我们采用方差来描述离散程)一般情况下,我们采用方差来描述离散程度。因为离均差的和为度。因为离均差的和为0,无法体现随机变量的,无法体现随机变量的总离散程度。方差中由于有平方,从而消除了正总离散程度。方差中由于有平方,从而消除了正负号的影响,并易于加总。负号的影响,并易于加总。2022/12/22中山学院经济与管理系122.2.3 方差的性质方差的性质(1)Var(c)=0(2)Var(c+x)=Var(x)(3)Var(cx)=c2Var(x)(4)x,y为相互独立的随机变量,则为相互独立的随机变量,则 Var(x+y)=Var(x)+Var(y)=Var(x-y)(5)Var(x)=E(x2)-(E(x)22022/12/22中山学院经济与管理系13数学期望与方差的图示数学期望与方差的图示数学期望描述随机变量的集中程度,方差描述随数学期望描述随机变量的集中程度,方差描述随机变量的分散程度。机变量的分散程度。1.方差同、期望变大方差同、期望变大 2.期望同、方差变小期望同、方差变小 2022/12/22中山学院经济与管理系1451055第四节第四节 随机变量的分布随机变量的分布 总体和样本的连接点总体和样本的连接点4.1 几种重要的分布几种重要的分布4.2 分布:总体和样本之间的连接点分布:总体和样本之间的连接点 学习的重点应放在确定随机变量学习的重点应放在确定随机变量X服从什么分布服从什么分布和各种分布的联系上。和各种分布的联系上。2022/12/22中山学院经济与管理系154.1 几种重要的分布几种重要的分布4.1.1 正态分布正态分布4.1.2 卡方分布卡方分布4.1.3 t分布分布4.1.4 F分布分布4.1.5 临界值点临界值点2022/12/22中山学院经济与管理系164.1.1 正态分布正态分布定义定义 正态分布的定义正态分布的定义定理定理 正态分布的数学期望和方差正态分布的数学期望和方差2022/12/22中山学院经济与管理系17正态分布图示正态分布图示2022/12/22中山学院经济与管理系18x2x2f(x)F(x)x1x1XX正态分布的标准化正态分布的标准化定义定义 标准正态分布标准正态分布定理定理 正态分布标准化正态分布标准化2022/12/22中山学院经济与管理系194.1.2 2 分布分布 2 分布的定义分布的定义2022/12/22中山学院经济与管理系20N=7N=11概概率率xN为自由度为自由度4.1.3 t分布分布t分布的定义分布的定义2022/12/22中山学院经济与管理系21概率密度概率密度x标准正态分布标准正态分布t-分布分布04.1.4 F分布分布F分布的定义分布的定义2022/12/22中山学院经济与管理系22x概率密概率密度度4.1.5 临界值点临界值点:(1)标准正态)标准正态分布、分布、t分布临界值点(双侧)分布临界值点(双侧)2022/12/22中山学院经济与管理系23/2/21-临界值点:临界值点:(2)卡方分布(双侧)卡方分布(双侧)、F分布(单侧)临界值点分布(单侧)临界值点x概率密度概率密度1-/2/21-x第五节第五节 通过样本,估计总体(一)通过样本,估计总体(一)估计量的特征估计量的特征什么是估计?估计量?点估计?区间估计?什么是估计?估计量?点估计?区间估计?无偏性无偏性有效性有效性一致性一致性n大样本下,具一致性的估计量具大样本下,具一致性的估计量具“无偏无偏”和和“有有效效”特性。特性。5.1 无偏性定义无偏性定义 的真值的真值 的真值的真值有偏有偏无偏无偏5.2 有效性定义有效性定义第六节第六节 通过样本,估计总体(二)通过样本,估计总体(二)估计方法估计方法区间估计区间估计n区间估计的概念、步骤区间估计的概念、步骤n应用:对总体期望的区间估计应用:对总体期望的区间估计 1、已知方差,对数学期望、已知方差,对数学期望E 进行区间估计进行区间估计w 正态总体正态总体w 一般总体大样本下一般总体大样本下 6.1 区间估计的概念区间估计的概念所谓区间估计就是所谓区间估计就是以一定的可靠性以一定的可靠性给出被估计给出被估计参数的参数的一个可能的取值范围一个可能的取值范围。具体做法是找出两个统计量具体做法是找出两个统计量 1(x1,xn)与与 2(x1,xn),使使 P(1 2)=1-(1,2)称为置信区间,称为置信区间,1-称为置信系数称为置信系数(置信度),(置信度),称为冒险率或者显著性水平,称为冒险率或者显著性水平,一般取一般取5%或或1%。对区间估计的形象比喻对区间估计的形象比喻我们经常说某甲的成绩我们经常说某甲的成绩“大概大概80分左右分左右”,可以看成,可以看成一个区间估计。(某甲的成绩一个区间估计。(某甲的成绩 为被估计的参数为被估计的参数)P(1 2)=大概的准确程度(大概的准确程度(1-)如:如:P(75 85)=95%=1-5%“大概大概80分左右分左右”冒险率(也叫冒险率(也叫显著水平显著水平 )下限下限上限上限置信系数置信系数1 6.2 区间估计的区间估计的步骤步骤:1)找一个含有该参数的统计量找一个含有该参数的统计量;2)构造一个概率为构造一个概率为 的事件的事件;3)通过该事件解出该参数的区间估计通过该事件解出该参数的区间估计.6.3 已知方差,对总体期望值已知方差,对总体期望值E=的的区间估计区间估计(1)正态总体;)正态总体;(1)正态总体,方差已知,估计)正态总体,方差已知,估计均值均值u/2/21-图示如下图示如下区间估计,统计量的选择小结区间估计,统计量的选择小结第七节第七节 通过样本,估计总体(三)通过样本,估计总体(三)假设检验假设检验基本概念:假设检验,原假设基本概念:假设检验,原假设/备择假设备择假设小概率事件原理在假设检验中的应用小概率事件原理在假设检验中的应用置信水平置信水平假设检验的步骤假设检验的步骤应用:应用:n正态总体期望的假设检验(方差已知正态总体期望的假设检验(方差已知/方差未知)方差未知)(t检验等)检验等)n方差的假设检验方差的假设检验7.1 假设检验的概念假设检验的概念定义:称对任何一个随机变量未知的分布类型或定义:称对任何一个随机变量未知的分布类型或参数的假设为统计假设,简称假设。参数的假设为统计假设,简称假设。检验该假设检验该假设是否正确称为假设检验是否正确称为假设检验。在统计假设中在统计假设中,被检验的假设称为原假设被检验的假设称为原假设,记为记为H0.原假设的对立假设称为备择假设原假设的对立假设称为备择假设,记为记为H1例如检验一个射击运动员射中靶的概率是否为例如检验一个射击运动员射中靶的概率是否为0.5.H0:p=0.5 (称为原假设)(称为原假设)H1:p 0.5 (称为备择假设)(称为备择假设)显著性水平显著性水平 是小概率事件发生的概率;是小概率事件发生的概率;在假设检验中也称为显著性水平。在假设检验中也称为显著性水平。7.2 假设检验的步骤:假设检验的步骤:Step1:分析问题,提出原假设和备择假设;分析问题,提出原假设和备择假设;Step2:在假定原假设成立的条件下确定检验统在假定原假设成立的条件下确定检验统计量,并根据原假设和已知样本计算统计量的计量,并根据原假设和已知样本计算统计量的值值Step3:给定显著性水平,查对应统计量分布:给定显著性水平,查对应统计量分布表得到原假设的拒绝域。表得到原假设的拒绝域。Step4:如果统计量值落在拒绝域内,则拒绝:如果统计量值落在拒绝域内,则拒绝原假设,否则接受原假设。原假设,否则接受原假设。假设检验的具体操作步骤假设检验的具体操作步骤(以正态总体、已知方差,检验均值(以正态总体、已知方差,检验均值u为例)为例)1、提出原假设、提出原假设 H0:=0 H1:03、确定显著水平,如、确定显著水平,如=0.05,查表得相应的,查表得相应的临界值临界值 /24、判断和下结论:若、判断和下结论:若|U|/2 ,拒绝,拒绝H0;若若|U|/2,接受接受H0;(判断区域图示)(判断区域图示)5、依据结论,作出经济学上的解释。、依据结论,作出经济学上的解释。7.3 假设检验的应用假设检验的应用正态总正态总体均值体均值u的假设检验的假设检验 设总体设总体 N(,2),),0是已知数。对于其是已知数。对于其参数参数 的假设检验,讨论的假设检验,讨论2种情况:种情况:1.已知方差已知方差 2,H0:=0,H1:0 2.未知方差未知方差 2,H0:=0,H1:0临界值点临界值点:(1)标准正态分布、)标准正态分布、t分布临界值点(双侧)分布临界值点(双侧)/2/21-类似:类似:返回返回临界值点临界值点:(2)卡方分布(双侧)卡方分布(双侧)、F分布(单侧)临界值点分布(单侧)临界值点x概率密度概率密度1-/2/21-x返回返回判断区域图示如下判断区域图示如下x f(x)不拒绝不拒绝H0区域区域拒绝域拒绝域拒绝域拒绝域返回返回