本科经济计量学第2章(第3版)LY.ppt
第一部分概率论与统计学基础第2章概率与概率分布第2章22.1 一些符号一些符号2.2 试验试验 样本空间样本空间 样本点和事件样本点和事件2.3 随机变量随机变量2.4 概率概率2.5 随机变量及随机变量及其概率分布其概率分布2.6 多元多元 随机变量的概率密度函数随机变量的概率密度函数2.7 总结总结第2章32.1 2.1 一些符号一些符号一些符号一些符号或求和符号:求和符号:求和符号的性质:求和符号的性质:1.若若k为常数,则有:为常数,则有:2.若若k为常数,则有:为常数,则有:3.4.若若 a,b为常数,则有:为常数,则有:第2章42.2 2.2 试验试验试验试验 样本空间样本空间样本空间样本空间 样本点样本点样本点样本点 事件事件事件事件1.1.随机试验随机试验随机试验随机试验(random experimentrandom experiment)是指至少有两是指至少有两个可能结果,但不确定哪一个结果会出现的过程。个可能结果,但不确定哪一个结果会出现的过程。例例2.12.1:抛一枚硬币抛一枚硬币 掷一颗骰子掷一颗骰子 从一副纸牌中抽取一张牌从一副纸牌中抽取一张牌?你还有其它的例子吗?你还有其它的例子吗?抛币?抛币100100次,正面朝上次,正面朝上7070次,你会认为该币均匀吗?次,你会认为该币均匀吗?第2章52.2.样本空间或总体样本空间或总体样本空间或总体样本空间或总体(population or sample spacepopulation or sample space):):):):随机试验所有可能结果的集合。随机试验所有可能结果的集合。例例2.2:抛两枚同样的均匀硬币。抛两枚同样的均匀硬币。H代表正面朝上,代表正面朝上,T代代表正面朝下。则有四种结果:表正面朝下。则有四种结果:HH,HT,TH,TT。样本空间样本空间(HH,HT,TH,TT)例例2.3:在一种双回合游戏中在一种双回合游戏中,O1表示两个回合全部获胜表示两个回合全部获胜;O2表示第一回合获胜,第二回合失败;表示第一回合获胜,第二回合失败;O3表示第一回合表示第一回合失败,但第二回合获胜;失败,但第二回合获胜;O4表示两个回合全部失败。表示两个回合全部失败。样本空间(样本空间(O1,O2,O3,O4)3.3.样本点样本点样本点样本点(sample pointsample pointsample pointsample point)样本空间的每一元素,即样本空间的每一元素,即每一种每一种基本基本结果。结果。4.4.4.4.事件(事件(事件(事件(eventseventseventsevents):):):):随机试验的可能结果组成的集随机试验的可能结果组成的集合。它是样本空间的一个子集。合。它是样本空间的一个子集。例例2.4 2.4:在例在例2.22.2中,若事件中,若事件 A 表示一枚硬币正面朝表示一枚硬币正面朝上,一枚硬币正面朝下。则事件上,一枚硬币正面朝下。则事件 A 由由2 2个样本点构成:个样本点构成:HT、TH。即。即A=(HT,TH)。若考察事件若考察事件B:两枚硬币中至少有一枚正面朝上,则:两枚硬币中至少有一枚正面朝上,则B B事件由事件由3 3个样本点构成,即个样本点构成,即B=(HH,HT,TH)。第2章72.3 随机变量随机变量例例例例2.52.52.52.5:再来看例再来看例2.22.2,若变量,若变量 X X 表示抛两枚硬币正面朝表示抛两枚硬币正面朝上的个数。有如下情况:上的个数。有如下情况:第一枚硬币第一枚硬币 第二枚硬币第二枚硬币 正面朝上的次数正面朝上的次数 T T 0T T 0 T H 1 T H 1 H T 1 H T 1 H H 2 H H 2随机变量(随机变量(随机变量(随机变量(stochastic or random variablestochastic or random variablestochastic or random variablestochastic or random variable):):):):取值取值由随机试验的结果所决定的变量称为随机变量。由随机试验的结果所决定的变量称为随机变量。X X的取值可能是的取值可能是0 0,也可能是,也可能是1 1或或 2 2。其取值与随机。其取值与随机试验的结果有关,试验的结果有关,X X是一个随机变量是一个随机变量(R.V(R.V或或r.v)r.v)。返回第2章8随机变量可分为:随机变量可分为:离散型(离散型(discretediscrete)随机变量)随机变量(随机变量的取值是离(随机变量的取值是离散的,只能取有限多个或可列多个);散的,只能取有限多个或可列多个);连续型(连续型(continuouscontinuous)随机变量)随机变量(随机变量的取值是(随机变量的取值是在连续区间内,可以取在某一区间的任一值),如某在连续区间内,可以取在某一区间的任一值),如某年龄的人的身高、体重等随机变量。年龄的人的身高、体重等随机变量。第2章92.4 2.4 概率概率1.事件概率的古典定义:事件概率的古典定义:事件概率的古典定义:事件概率的古典定义:如果一个随机试验的如果一个随机试验的n n种种可能可能结果是结果是互斥互斥的,且每个结果的,且每个结果等可能等可能发生,事件发生,事件A A含有含有m m个基本结果,则事件个基本结果,则事件A A发生的概率发生的概率(probability)(probability),即,即P(A)P(A)就是:就是:第2章10 例例例例2.62.6掷一颗均匀骰子,有掷一颗均匀骰子,有6种可能结果:种可能结果:1,2,3,4,5,6。这些结果互斥并且等可能发生(为什么)?因。这些结果互斥并且等可能发生(为什么)?因而,根据古典概率定义,任何一个数字朝上的概率而,根据古典概率定义,任何一个数字朝上的概率为为1/6。这里,。这里,m=1,n=6?在一副有在一副有52张的扑克中,抽一张为张的扑克中,抽一张为K的概率为多的概率为多少少?返回第2章11?在此定义中要求试验的结果互斥且等可能发在此定义中要求试验的结果互斥且等可能发生吗?生吗?2.2.概率的频率定义(经验定义)概率的频率定义(经验定义)概率的频率定义(经验定义)概率的频率定义(经验定义):如果在如果在n次试验次试验(或(或n 个观察值)中,个观察值)中,事件事件A出现出现 m次,假定次,假定n足够大,足够大,那么,事件那么,事件A发生的频率就很好地测度了事件发生的频率就很好地测度了事件A发生发生的概率的概率P(A)。即:。即:第2章12重要性质重要性质1.1.1.1.事件事件事件事件A A A A的概率满足:的概率满足:的概率满足:的概率满足:0P0P0P0P(A A A A)11112.2.2.2.若事件若事件若事件若事件A A A A,B B B B,C C C C,为互斥事件,则为互斥事件,则为互斥事件,则为互斥事件,则 P P P P(A+B+C+A+B+C+A+B+C+A+B+C+)=P=P=P=P(A A A A)+P+P+P+P(B B B B)+P+P+P+P(C C C C)+3.3.3.3.若事件若事件若事件若事件A A A A,B B B B,C C C C,为互斥事件,且为一完备事件为互斥事件,且为一完备事件为互斥事件,且为一完备事件为互斥事件,且为一完备事件组,则组,则组,则组,则 P P P P(A+B+C+A+B+C+A+B+C+A+B+C+)=P=P=P=P(A A A A)+P+P+P+P(B B B B)+P+P+P+P(C C C C)+=1=1=1=13.3.概率的性质概率的性质概率的性质概率的性质第2章13常用性质常用性质1.1.1.1.事件事件事件事件A A A A,B B B B 称为相互独立事件,若称为相互独立事件,若称为相互独立事件,若称为相互独立事件,若 P P P P(ABABABAB)=P=P=P=P(A A A A)P P P P(B B B B)2.2.2.2.若事件若事件若事件若事件A A A A,B B B B 不是互斥事件,则有不是互斥事件,则有不是互斥事件,则有不是互斥事件,则有 P P P P(A+BA+BA+BA+B)=P=P=P=P(A A A A)+P+P+P+P(B B B B)-P-P-P-P(ABABABAB)3.3.3.3.对应任一事件对应任一事件对应任一事件对应任一事件A A A A,都有互补事件,都有互补事件,都有互补事件,都有互补事件AAAA,并且,并且,并且,并且,第2章14例例2.92.9:在例在例2.5中,两枚正面都朝上的概率是多少?中,两枚正面都朝上的概率是多少?令令A表示第一枚正面朝上,表示第一枚正面朝上,B表示第二枚正面朝上,表示第二枚正面朝上,因此现在要求概率因此现在要求概率P(AB)P(AB)=P(A)P(B)=1/21/2=1/4第2章154.4.事件事件事件事件A A的条件概率:的条件概率:的条件概率:的条件概率:在事件在事件B发生的条件下事件发生的条件下事件A发生的概率。用符号发生的概率。用符号P(P(A|B)表示。有下列公式:表示。有下列公式:第2章16例例2.11 会计入门班有会计入门班有500500个学生,其中男生个学生,其中男生300300人,女生人,女生200200人。人。在这些学生中,在这些学生中,100100个男生和个男生和6060个女生计划主修会计学。现在,个女生计划主修会计学。现在,随机抽取一人,发现该学生计划主修会计学。那么,该学生是随机抽取一人,发现该学生计划主修会计学。那么,该学生是男生的概率是多少?男生的概率是多少?令令A表示学生是男生,表示学生是男生,B表示学生主修会计学,则要求的概率表示学生主修会计学,则要求的概率为:为:P(A|B)P(A|B)。可知:可知:P(AB)=100/500P(AB)=100/500,P(B)=160/500P(B)=160/500 则:则:P(A|B)=P(AB)/P(B)=5/8P(A|B)=P(AB)/P(B)=5/8 LY:LY:P(A|B)=100/(100+60)可以把可以把 160学生看成新的学生看成新的总体!总体!?一般地,一般地,P P(A|BA|B)是否等于)是否等于P P(A A)?何时相等?)?何时相等?第2章17 度量连续型随机变量概率分布的函数是概率密度函数。度量连续型随机变量概率分布的函数是概率密度函数。概率密度函数(概率密度函数(probabiltity density function,PDFprobabiltity density function,PDF)度量的是连续随机变量在某一特定范围或区间内的概率。度量的是连续随机变量在某一特定范围或区间内的概率。LY:从概率(分布函数)引入密度函数比较直观。从概率(分布函数)引入密度函数比较直观。如如X代表一连续随机变代表一连续随机变量量:身高,我们欲求身高,我们欲求“人的身高人的身高”在某一区间在某一区间内内(如如60606868英寸英寸)的概的概率,图率,图2-32-3中的阴影部中的阴影部分即为该区间的概率。分即为该区间的概率。0 60 68 0 60 68 身高身高 图图2-3 2-3 连续型随机变量的连续型随机变量的PDFPDF概概 率率 密密 度度 2.5.2 连续型随机变量的概率分布连续型随机变量的概率分布第2章18连续型随机变量的PDF也记为f(x),有:PDF具有如下一些性质:连续随机变量取单点值的概率为0。第2章19 2.5.3 累积分布函数累积分布函数(cumulative distribution function,CDF)F(x)定义如下:定义如下:F(x)=P(Xx)其中,其中,P(Xx)表示随机变量表示随机变量X取小于或等于取小于或等于x的概率。的概率。具有如下性质:第2章20P 0 1 CDF图图2-5 2-5 连续连续 R.V 的累积分布函数的累积分布函数第2章212.6 2.6 2.6 2.6 多元概率密度函数多元概率密度函数多元概率密度函数多元概率密度函数 用用多个随机变量多个随机变量来描述一个试验的结果,求得来描述一个试验的结果,求得的概率密度称为的概率密度称为多元概率密度。多元概率密度。多元概率密度。多元概率密度。若若X1,X2,X3,Xn都是随机变量,则都是随机变量,则(X1,X2,X3,Xn)构成一个构成一个n维的随机向量,也称维的随机向量,也称n元随机变量。元随机变量。常见的是二维随机向量。常见的是二维随机向量。第2章22例例例例2.172.172.172.17 一个计算机零售店出售个人电脑和打印机。每天一个计算机零售店出售个人电脑和打印机。每天售出的电脑和打印机数量不同,店主记录了过去售出的电脑和打印机数量不同,店主记录了过去200200天每天天每天的销售状况,见表的销售状况,见表2-22-2。6 6 4 4 26 6 4 4 2 4 10 12 4 2 4 10 12 4 2 2 4 20 10 10 2 4 20 10 10 2 2 10 20 20 2 2 10 20 20 2 2 2 10 30 2 2 2 10 30 16 24 48 48 6416 24 48 48 64 0 0 1 1 2 2 3 3 4 4 总计 出售个人电脑的数量(X)0 1 2 3 40 1 2 3 4表表2-2 2-2 二元二元频数频数分布:分布:售出的个人电脑数量售出的个人电脑数量X X和打印机数量和打印机数量Y Y总计 22 32 46 54 46200出售打印机的数量(Y)第2章23 表表2-32-3提供了一个双变量(或联合)概率密度函数,提供了一个双变量(或联合)概率密度函数,通常用通常用f f(X,YX,Y)表示。表中每值均为联合概率。)表示。表中每值均为联合概率。一般地,令一般地,令X X、Y Y是两个离散型随机变量,那么函数:是两个离散型随机变量,那么函数:f(X,Y)=P(X=x,Y=y)f(X,Y)=P(X=x,Y=y)独立性 0.03 0.03 0.02 0.02 0.010.03 0.03 0.02 0.02 0.01 0.02 0.05 0.06 0.02 0.01 0.02 0.05 0.06 0.02 0.01 0.01 0.02 0.10 0.05 0.05 0.01 0.02 0.10 0.05 0.05 0.01 0.01 0.05 0.10 0.10 0.01 0.01 0.05 0.10 0.10 0.01 0.01 0.01 0.05 0.15 0.01 0.01 0.01 0.05 0.15 0.08 0.12 0.24 0.24 0.320.08 0.12 0.24 0.24 0.32 0 1 2 3 4 总计f(x)出售个人电脑的数量(X)0 1 2 3 40 1 2 3 4表表2-3 2-3 个人电脑售出数量个人电脑售出数量X X和打印机售出数量和打印机售出数量Y Y的二元概率分布的二元概率分布总计f(y)0.11 0.16 0.23 0.27 0.2 31.00出售打印机的数量(Y)第2章242.6.1 2.6.1 2.6.1 2.6.1 边缘概率边缘概率边缘概率边缘概率密度函数密度函数边缘概率密度函数:边缘概率密度函数:当当X取一给定值,而无论取一给定值,而无论Y取值如何时的取值如何时的概率称为概率称为X的边缘概率,其概率密度称为的边缘概率,其概率密度称为X的边缘概率密度函的边缘概率密度函数。数。下表是例下表是例2.142.14中随机变量中随机变量X,Y的边缘分布。的边缘分布。0 0.08 0 0.11 1 0.12 1 0.16 2 0.24 2 0.23 3 0.24 3 0.27 4 0.32 4 0.23总计总计 1.00 总计总计 1.00 X f(X)Y f(Y)表表2-4 2-4 个人电脑售出数量个人电脑售出数量X和打印机售出数量和打印机售出数量Y的的边缘分布边缘分布第2章252.6.2 2.6.2 2.6.2 2.6.2 条件概率条件概率条件概率条件概率 函数(离散型)函数(离散型)在给定在给定 条件下条件下Y取值的概率称为取值的概率称为Y的条件概率密的条件概率密度函数度函数计算条件概率密度的方法计算条件概率密度的方法?在例?在例2.172.17中,求中,求P(Y=4|X=4)=P(Y=4|X=4)=?第2章262.6.3 2.6.3 2.6.3 2.6.3 统计独立性统计独立性统计独立性统计独立性统计独立性:统计独立性:统计独立性:统计独立性:两个变量两个变量X X和和Y Y称为统计独立的,当且仅当它们称为统计独立的,当且仅当它们的联合分布密度函数可以表示成其边缘密度函数之积。即的联合分布密度函数可以表示成其边缘密度函数之积。即例例例例2.182.182.182.18 一个袋子里放着分别一个袋子里放着分别写有写有1 1,2 2,3 3的小球。现从袋的小球。现从袋中有放回地随机抽取两球。中有放回地随机抽取两球。X X表示第一次抽取球的数字,表示第一次抽取球的数字,Y Y表示第二次抽取球的数字。表表示第二次抽取球的数字。表2-52-5给出给出X X和和Y Y的联合概率密度的联合概率密度和边缘概率密度。和边缘概率密度。表表2-5 2-5 两随机变量的统计独立性两随机变量的统计独立性?例?例2.172.17中个人电脑和打印机的售出数量是独立随机变量吗?中个人电脑和打印机的售出数量是独立随机变量吗?1 1/9 1/9 1/9 3/91 1/9 1/9 1/9 3/9 2 1/9 1/9 1/9 3/9 2 1/9 1/9 1/9 3/9 3 1/9 1/9 1/9 3/9 3 1/9 1/9 1/9 3/9 3/9 3/9 3/9 1 3/9 3/9 3/9 1 Y Y 1 2 3 1 2 3 X X 第2章272.7 2.7 2.7 2.7 总结总结总结总结 1.1.1.1.样本空间、样本点、事件样本空间、样本点、事件样本空间、样本点、事件样本空间、样本点、事件 2.2.2.2.事件的概率事件的概率事件的概率事件的概率 3.3.3.3.随机变量随机变量随机变量随机变量 4.4.4.4.随机变量的概率分布随机变量的概率分布随机变量的概率分布随机变量的概率分布 5.5.5.5.多元概率分布、联合概率分布、边缘概率分布多元概率分布、联合概率分布、边缘概率分布多元概率分布、联合概率分布、边缘概率分布多元概率分布、联合概率分布、边缘概率分布 6.6.6.6.条件概率分布、独立性条件概率分布、独立性条件概率分布、独立性条件概率分布、独立性第2章28作业:作业:第第2章书后习题:章书后习题:2.9、2.12、2.13、2.14、2.17