《计量经济学概率统计基础课件.ppt》由会员分享,可在线阅读,更多相关《计量经济学概率统计基础课件.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计量经济学概率统计基础第1页,此课件共58页哦第2章 概率统计基础n计量经济学分析的变量多是随机变量,模型都有随机误差项n介绍计量经济分析的概率统计基础知识第2页,此课件共58页哦内容提要1 1随机性与概率随机性与概率2 2随机变量和概率分布随机变量和概率分布3 3参数估计和假设检验参数估计和假设检验第3页,此课件共58页哦第一节 随机性和概率一、计量经济分析、随机性和概率一、计量经济分析、随机性和概率二、概率的频率定义二、概率的频率定义三、概率的古典定义三、概率的古典定义四、概率的公理化定义四、概率的公理化定义五、概率的性质五、概率的性质六、条件概率和统计独立性六、条件概率和统计独立性第4页
2、,此课件共58页哦一、计量经济分析、随机性和概率一、计量经济分析、随机性和概率(一)计量经济分析和随机性(一)计量经济分析和随机性 n随机性指事物的结果、水平不能完全事先确定 n计量经济分析的对象必然有随机性,随机性是计量经济模型的根本特征之一n来源:行为随机性、模型简化、观测统计误差n随机变量,随机误差项,计量经济模型是随机模型、随机变量模型。n随机性是计量经济分析的矛盾焦点,也是计量经济学产生发展的原因 第5页,此课件共58页哦(二)随机性和概率(二)随机性和概率 n随机事物比确定性事物难以预测和把握n但随机性和随机事物并不是无规律。表面偶然性背后有内在必然性随机事物或者其特定结果发生的可
3、能性大小,“概率”(Probability)。n概率由随机事物本身特征决定n概率是描述、分析和利用随机事物的关键n研究概率的几种主要方法概率的频率定义、古典定义和公理化定义第6页,此课件共58页哦二、概率的频率定义二、概率的频率定义概率定义:伯奴里大数定律(法则)的支持(P48)第7页,此课件共58页哦三、概率的古典定义三、概率的古典定义(一)随机试验和样本空间(一)随机试验和样本空间随机试验、样本点、基本事件、样本空间随机试验、样本点、基本事件、样本空间随机事件随机事件样本点组合,性质同集合(交、样本点组合,性质同集合(交、并、和、等价、包含、逆、互斥、差、完备并、和、等价、包含、逆、互斥、
4、差、完备事件组)事件组)第8页,此课件共58页哦(二)古典概型和概率的古典定义(二)古典概型和概率的古典定义古典概型古典概型三个特征:三个特征:有限结果、互不相容、等可能有限结果、互不相容、等可能第9页,此课件共58页哦古典概型局限性:(1)古典概型要求试验的可能结果总数有限,又要求某种等可能性(2)推广到几何概率时还会导致一些矛盾(几何概率不是结果数量有限,而是范围、测度有限)第10页,此课件共58页哦四、概率的公理化定义四、概率的公理化定义 柯尔莫哥洛夫(Kolmogorov)(1933年)在集合论和测度论的基础上建立了概率论公理体系。克服古典定义的缺陷第11页,此课件共58页哦(一)事件
5、和事件域(一)事件和事件域柯尔莫哥洛夫概率论公理化体系:基本概念是样本点,不是事件。样本点相应于随机试验的结果。样本点看作抽象的点,它们的全体构成样本空间,仍用 表示。第12页,此课件共58页哦事件定义为 的一个子集,它包含若干个样本点,事件发生当且仅当A所包含的样本点中有一个发生 事件域就是由全体事件构成的集类,我们用F表示。一般要求F满足下列三个要求:(i)F;(ii)若 F,则 F;(iii)若 F;,则 F。满足这三点集类称“-域”或“-代数”事件域F就是定义在样本空间的 -域 和 都包含在F中。第13页,此课件共58页哦(二)概率(二)概率定义 概率是从事件(也是集合)到实数的映射,
6、是一种集合函数。定义定义:对事件域F中的每个元素A,概率是定义在事件域F上,满足如下三个条件的集合函数 :(i),对一切 F;非负(ii)完备(iii)若 F,且两两互不相容,则 完全可加、可列可加五、概率的性质:五、概率的性质:P29 第14页,此课件共58页哦六、条件概率和统计独立性六、条件概率和统计独立性(一)条件概率(一)条件概率 n已知B发生的条件下,事件A发生的概率,称为A以B为条件的“条件概率”。n性质:非负、规范、可列可加等(P31)第15页,此课件共58页哦n条件概率条件概率的含义:贝叶斯定理。n在具体行动之前,无论决策如何制定,在结果的证据收集并确认后,决策时可以改变的。n
7、例如:某人认为A超市东西比B超市便宜第16页,此课件共58页哦(二)全概率公式和贝叶斯公式(二)全概率公式和贝叶斯公式 是样本空间的一个完全分割,即两两互不相容。那么由概率完全可加性和乘法定理得 全概率公式全概率公式第17页,此课件共58页哦n贝叶斯公式若 能且只能与 之一同时发生,那么 第18页,此课件共58页哦(三)事件独立性(三)事件独立性n对事件A和B,若则称它们是“统计独立的”。n可扩展到更多事件的独立性n若事件A和B独立,则 第19页,此课件共58页哦第二节第二节 随机变量和概率分布随机变量和概率分布n在概率统计和计量经济分析中,人们更关心的是有随机性的经济指标水平,都是数量化的随
8、机事件。n例如某时刻的股票价格,某天某银行吸收的存款数量,某商场某月的销售额,某商品的市场价格水平等。第20页,此课件共58页哦一、随机变量及其概率分布一、随机变量及其概率分布(一)随机变量(一)随机变量(二)概率分布(二)概率分布(三)分布函数(三)分布函数(四)密度函数(四)密度函数(五)随机变量函数的概率分布(五)随机变量函数的概率分布 第21页,此课件共58页哦(一)随机变量(一)随机变量n数量化的随机事件通常称为“随机变量”(Random variable)n随机变量是从样本空间扩张而成的 -域到实数集的函数。n随机变量也可以是通过对定性事件的数量化转化而得到。n“离散型随机变量”和
9、“连续型随机变量”。第22页,此课件共58页哦(二)概率分布(二)概率分布n随机变重要的是它们取特定值的可能性,称为随机变量的“概率分布”(Probability distribution)。n离散型随机变量只能取有限或可数个值,概率分布可以用罗列、表格、图形表示等。n连续要用分布函数。第23页,此课件共58页哦(三)分布函数(三)分布函数n连续型随机变量可能取值无穷多,每个值取到概率无穷小,无法用罗列概率方法表达研究。n只能用反映随机变量取特定范围值可能性大小的“分布函数”(Distribution function),也称“累积分布函数”(Accumulated distribution
10、function)描述研究。n分布函数随机变量取值不大于给定水平的概率构成的函数:第24页,此课件共58页哦离散型随机变量分布函数随机变量的分布函数有如下性质 (P35)已知随机变量的分布函数就知道了随机变量在任何区间上取值的概率,分布函数完整地描述了随机变量的情况,掌握分布函数就等于掌握了随机变量的随机性规律。第25页,此课件共58页哦(四)密度函数(四)密度函数n连续型随机变量概率分布另一个概念,“密度函数”(Density function)或称“概率密度函数”。n密度函数密度与分布函数关系第26页,此课件共58页哦(五)随机变量函数的概率分布(五)随机变量函数的概率分布如果 是随机变量
11、 的函数 设 的分布函数为 ,则 的分布函数为第27页,此课件共58页哦二、多元分布和条件分布二、多元分布和条件分布(一)随机向量和多元分布(一)随机向量和多元分布 n“随机向量随机向量”概念研究一组有关联的随机变量概念研究一组有关联的随机变量 n 一个一个n n个分量的随机向量个分量的随机向量 n随机向量的随机向量的“多元分布多元分布”。n“联合分布函数联合分布函数”两个或多个随机变量取一组两个或多个随机变量取一组特定值的概率分布特定值的概率分布n随机变量边际分布随机变量边际分布 第28页,此课件共58页哦(二)条件分布和随机变量的独立性(二)条件分布和随机变量的独立性n条件分布条件分布n随
12、机变量的相互独立性随机变量的相互独立性第29页,此课件共58页哦三、概率分布的数字特征三、概率分布的数字特征(一)期望(一)期望(二)方差(二)方差(三)期望和方差的性质(三)期望和方差的性质(四)条件期望和全数学期望(四)条件期望和全数学期望(五)高阶矩(五)高阶矩(六)协方差和相关系数(六)协方差和相关系数 第30页,此课件共58页哦四、常见分布四、常见分布(一)正态分布(一)正态分布(二)(二)分布分布(三)(三)t分布分布(四)(四)F分布分布 第31页,此课件共58页哦(一)正态分布取值于()的连续分布正态分布完全由期望和方差决定分布密度函数 数学期望 方差 正态分布记为 第32页,
13、此课件共58页哦正态分布是以数学期望为中心的对称分布正态分布密度函数具有“钟形”特征95%左右集中分布在期望加减2倍标准差范围99%以上集中在期望加减3倍标准差范围内正态分布偏度为 =0正态分布密度函数有常峰态,峰度 接近3第33页,此课件共58页哦一般正态分布随机变量变换成“标准正态分布”密度函数 第34页,此课件共58页哦判断正态分布n根据密度函数的形态进行判断:用频数直方图的上方边缘作为密度函数的近似,判断随机变量是否服从正态分布。n根据偏度、峰度特征检验:利用观测样本计算三阶矩和四阶矩的近似值(与后面讲的抽样分布有关),偏度和峰度近似值,如果接近0和3,则认为随机变量服从正态分布,也称
14、“通过了正态性检验”。第35页,此课件共58页哦(二)分布n标准正态分布随机变量的平方所服从的分布。n取值范围是(),显然是非对称分布。n数学期望等于自由度 ,方差为2 第36页,此课件共58页哦(三)三)t分布设 服从标准正态分布 服从自由度为 的 分布则随机变量服从自由度为 的t分布t分布概率密度函数形态类似标准正态分布方差为 ,比标准正态分布平坦,尾部厚 第37页,此课件共58页哦(四)四)F分布分布 服从自由度 的 分布,服从自由度 的 分布,相互独立,那么随机变量 服从的分布称为有两个自由度 和 的F分布记为 第38页,此课件共58页哦五、随机变量的收敛性和极限理论五、随机变量的收敛
15、性和极限理论(一)随机变量的收敛性(一)随机变量的收敛性 n大量随机变量之和的概率分布是通过随机变量序列极限分布表现的,极限定理的基础是随机变量序列的收敛性。n随机变量序列的收敛性与一般变量不同,是概率、概率分布或者分布特征的收敛性,有依分布收敛和依概率收敛等。n不同的收敛性定义将导致不同的极限定理。第39页,此课件共58页哦分布函数弱收敛分布函数弱收敛:对于分布函数序列 (为了简单起见,常常直接写成 ),如果存在函数 使得 在 的每个连续点上都成立,则称“弱收敛于 ”。第40页,此课件共58页哦 依分布收敛依分布收敛:设随机变量序列 的分布函数序列为 ,随机变量 的分布函数为 ,如果 弱收敛
16、于 ,则称“依分布收敛于 ”。第41页,此课件共58页哦依概率收敛依概率收敛:对于随机变量序列 和随机变量 ,如果 或 对任意的 成立,则称“依概率收敛于 ”。有时候也称 的“概率极限”是 ,并可记为第42页,此课件共58页哦(二)大数法则(二)大数法则 伯奴利大数定理(P48)独立同分布场合的大数定律(P48)第43页,此课件共58页哦(三)中心极限定理(三)中心极限定理 独立同分布场合的中心极限定理(P49)非独立同分布场合的中心极限定理(P49)第44页,此课件共58页哦第三节第三节 参数估计和假设检验参数估计和假设检验 n随机变量取值往往无穷多,不可能通过全面调查了解总体分布,只能根据
17、从总体抽取的部分样本推断总体情况。根据从总体抽取的部分样本推断总体情况。这称为这称为“统计推断统计推断”,包括参数估计和假设检验等,包括参数估计和假设检验等。n计量经济分析的观测数据相当于随机变量总体抽取的样观测数据相当于随机变量总体抽取的样本本,计量经济的回归分析就是根据样本推断总体情况回归分析就是根据样本推断总体情况,因此计量经济分析与统计推断有非常密切的联系。n计量经济分析的样本不是按标准抽样方法抽取,是通过通过受客观条件限制的观测得到,推断分析的难度更大受客观条件限制的观测得到,推断分析的难度更大。第45页,此课件共58页哦一、随机抽样和抽样分布一、随机抽样和抽样分布(一)随机抽样和样
18、本统计量样本、抽样、样本统计量抽样:一般随机、重复等样本统计量:样本均值 样本方差 第46页,此课件共58页哦(二)抽样分布1、正态总体小样本分布,样本均值、方差的分布,样本线性函数的分布2、一般总体的大样本抽样分布 中心极限定理与渐近正态分布 第47页,此课件共58页哦二、参数估计二、参数估计(一)最大似然估计(二)矩估计(三)最小二乘估计(四)估计量的性质(五)参数估计方法的归纳和比较 第48页,此课件共58页哦(一)最大似然估计(一)最大似然估计(Maximum likelihood estimates,ML)n基本原理:随机变量的分布参数水平在数据生成过程中起着作用,不同参数水平生成特
19、定数据集的可能性不同,可以根据生成样本的可能性大小估计参数水平。根据事物出现的概率(几率、可能性)的大小推断参数水平。n如:一个老战士和一个军训学生各射击一次,但只有一枪中靶。问可能是谁打中的。第49页,此课件共58页哦n最大似然估计的核心是似然函数(Likelihood function)。样本同时出现的联合概率密度n对数似然函数 第50页,此课件共58页哦例例2-11:正态分布参数的估计(:正态分布参数的估计(53)已知一随机变量服从未知参数的正态分布 ,并且已经观测到一组样本 ,要求估计分布参数。第51页,此课件共58页哦例例2-12:泊松分布参数的估计(:泊松分布参数的估计(53)观测
20、到一个服从未知参数的泊松分布的随机变量的10个数据的样本,这些数据分别为5、0、1、2、3、2、3、4、1、1,要求估计出该泊松分布的未知分布参数 。根据泊松分布的概率公式,该随机变量的数值为 的概率为10个数据出现的联合分布概率为第52页,此课件共58页哦这个联合分布概率就是生成上述10个数据的似然函数,记作 ,即它的对数似然函数是求导可得 的最大似然估计 必须满足所以 。第53页,此课件共58页哦(二)矩估计(54)(Method of moments,MM)n矩估计,也称为“矩方法”。n基本原理:样本统计量依概率收敛于未知参数的一个函数,可利用样本矩作为总体矩的近似,获得未知参数的估计值
21、。第54页,此课件共58页哦(三)最小二乘估计(56)least squaren最小二乘法是估计随机变量参数最基本的方法,也是计量经济分析中运用最广泛的参数估计方法。n基本原理:根据随机变量理论值与实际观测值的偏差平方和最小估计参数。n最小二乘估计不要求知道随机变量服从的分布。第55页,此课件共58页哦(四)估计量的性质(56)n线性性n无偏性(渐近无偏)n有效性(渐近有效)n一致性n最小方差线性无偏估计BLUEn均方误(Mean squared error,MSE)第56页,此课件共58页哦(五)参数估计方法的归纳和比较nML小样本不保证无偏和有效,但一般有一致估计、渐近正态分布和渐近有效的大样本性质。如果参数存在最小方差边界估计量,一定是最大似然估计量。n最大似然估计在线性非线性回归、联立方程组模型、各种特殊变量和数据模型、时间序列分析的概率模型等中都有重要应用。n最大似然估计需要知道随机变量的概率分布形式,这是构造似然函数的基础。第57页,此课件共58页哦n矩估计小样本也不保证无偏和有效。但根据独立同分布随机变量的极限定理,矩估计通常具有大样本一致估计的性质。n矩估计主要适用要求一致估计,但对有效性相对不重视的参数估计问题。n矩估计可以不需要知道随机变量服从的概率分布名称而直接进行估计。n矩估计在计量经济分析中同样也有许多应用。第58页,此课件共58页哦
限制150内