【精品】一维随机变量及其分布(可编辑.ppt
一维随机变量及其分布非等可能事件的概率怎么计算?非等可能事件的概率怎么计算?非等可能事件的概率怎么计算?非等可能事件的概率怎么计算?在概率论中怎么应用微积分理论?在概率论中怎么应用微积分理论?在概率论中怎么应用微积分理论?在概率论中怎么应用微积分理论?样本空间样本空间样本空间样本空间 中的元素与试验有关中的元素与试验有关中的元素与试验有关中的元素与试验有关,从从从从数学角度看数学角度看数学角度看数学角度看,希望希望希望希望 是抽象的集合是抽象的集合是抽象的集合是抽象的集合为了全面地研究随机试验的结果,揭示随机现象的统计规律性,我们将随机试验的结果与实数对应起来,将随机试验的结果数量化为什么引入随机变量?为什么引入随机变量?随机变量的引入使得对事件的研究转化为对随机变量的研究,对于理论研究和数学运算都带来极大的便利2.1一维随机变量一维随机变量1、有些试验结果本身与数值有关(本身就、有些试验结果本身与数值有关(本身就是一个数)是一个数).例如,掷一颗骰子面上出现的点数;例如,掷一颗骰子面上出现的点数;每天从济南下火车的人数;每天从济南下火车的人数;七月份济南的最高温度;七月份济南的最高温度;随机变量随机变量 例如,从某一学校随机选一学生,测量他的身例如,从某一学校随机选一学生,测量他的身高高.我们可以把可能的身高看作随机变量我们可以把可能的身高看作随机变量X,然后我们可以提出关于然后我们可以提出关于X的各种问题的各种问题.如如 P(X1.7)=?P(X1.5)=?P(1.5X1.7)=?这时这时,要么要么x1.7米,要么米,要么x 1.7米,再去求米,再去求P(x 1.7米米)就没有什么意义了就没有什么意义了.一旦我们实际选定了一个学生并量了他的身一旦我们实际选定了一个学生并量了他的身高之后,我们就得到高之后,我们就得到X的一个具体的值,记作的一个具体的值,记作x.有了随机变量有了随机变量,随机试验中的各种事件,随机试验中的各种事件,就可以通过随机变量的关系式表达出来就可以通过随机变量的关系式表达出来.引入随机变量的意义引入随机变量的意义 如:单位时间内某电话交换台收到的呼如:单位时间内某电话交换台收到的呼叫次数用叫次数用X表示,它是一个随机变量表示,它是一个随机变量.事件事件收到不少于收到不少于1次呼叫次呼叫 X 1 没有收到呼叫没有收到呼叫 X=0 可见,随机事件这个概念实际上是包可见,随机事件这个概念实际上是包容在随机变量这个更广的概念内容在随机变量这个更广的概念内.也可以也可以说,随机事件是从静态的观点来研究随机说,随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点,现象,而随机变量则是一种动态的观点,就象数学分析中常量与变量的区别那样就象数学分析中常量与变量的区别那样.随机变量概念的产生是概率论发展随机变量概念的产生是概率论发展史上的重大事件史上的重大事件.引入随机变量后,对引入随机变量后,对随机现象统计规律的研究,就由对事件随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及及事件概率的研究扩大为对随机变量及其取值规律的研究其取值规律的研究.事件及事件及事件概率事件概率随机变量及其随机变量及其取值规律取值规律随机变量的分类随机变量的分类 通常分为两类:通常分为两类:如如“抽验一批产品中次抽验一批产品中次 品的个数品的个数”,“电话交换台在一定时电话交换台在一定时间内收到的呼叫次数间内收到的呼叫次数”等等.随随机机变变量量离散型随机变量离散型随机变量连续型随机变量连续型随机变量所有取值可以逐个所有取值可以逐个一一列举一一列举例如,例如,“电视机的寿命电视机的寿命”,实际,实际中常遇到的中常遇到的“测量误差测量误差”等等.全部可能取值不全部可能取值不仅有无穷多,而且还仅有无穷多,而且还不能一一列举,而是不能一一列举,而是充满一个区间充满一个区间.这两种类型的随机变量因为都是随机变这两种类型的随机变量因为都是随机变量,自然有很多相同或相似之处;但因其取量,自然有很多相同或相似之处;但因其取值方式不同,又有其各自的特点值方式不同,又有其各自的特点.随随机机变变量量连续型随机变量连续型随机变量离散型随机变量离散型随机变量学习时请注意它们各自的特点和描述方法学习时请注意它们各自的特点和描述方法.2.2离散型随机变量离散型随机变量用这两条性质判断用这两条性质判断一个函数是否是一个函数是否是概率函数概率函数 这样,我们就掌握了这样,我们就掌握了X这个这个随机变量取值的概率规律随机变量取值的概率规律.从中任取从中任取3 个球个球取到的白球数取到的白球数X是一个随机变量是一个随机变量X可能取的值是可能取的值是0,1,2取每个值的概率为取每个值的概率为例例1且且二、表示方法二、表示方法(1)列表法:)列表法:(2)图示法)图示法(3)公式法)公式法再看例再看例1任取任取3 个球个球X为为取到的白球数取到的白球数X可能取的值可能取的值是是0,1,20.10.30.6kPK012几何级数几何级数1 2 3 40.4 0.3 0.2 0.1三、常见的离散型随机变量的分布三、常见的离散型随机变量的分布1、(、(0-1)分布(两点分布)分布(两点分布)设随机变量X只可能取0与1两个值,它的分布律是:则称X服从(0-1)分布或两点分布(0-1)分布的分布律也可写成对于一个随机试验,如果它的样本空间只包含两个元素,即我们总能在S上定义一个服从(0-1)分布的随机变量例如:若令投硬币得到的正面为1,反面为0。即得到一个“0-1”分布的随机变量X2、二项分布、二项分布若随机变量X的所有可能取值为0,1,n,且它的分布律为称称X服从参数为服从参数为n和和p的二项分布,记作的二项分布,记作 XB(n,p)当当n=1时,时,P(X=k)=pk(1-p)1-k,k=0,1称称X服从两点分布服从两点分布若用若用X表示表示n重贝努里试验中事件重贝努里试验中事件A出现的次数,出现的次数,则则 ,其中其中 p=P(A).p=P(A).XB(n,p)不难验证:不难验证:例1 按规定,某种型号电子元件的使用寿命超过1500小时的为一级品。已知某一大批产品的一级品率为0.2,现从中随机地抽查20只。问20只元件恰有k只(k=0,1,20)为一级品的概率是多少?例2 某炮击中目标的概率为0.2,现在共发射了14发炮弹。若至少有两发炮弹击中目标才能摧毁它,试求摧毁目标的概率。XB(20,0.2)XB(14,0.2)因为“摧毁目标”等价于事件 ,所以摧毁目标的概率为3、泊松分布、泊松分布设随机变量X所有可能取的值为0,1,2,而取各个值的概率为其中 是常数。则称X服从参数为 的泊松分布,记为不难验证:不难验证:例如:某一段时间内电话某一段时间内电话用户对电话站的呼用户对电话站的呼唤次数唤次数某一段时间内候车某一段时间内候车的旅客数的旅客数一本书中某一页上一本书中某一页上印刷错误的个数印刷错误的个数例例例例1 1 在一部篇幅很大的书籍中,发现只有在一部篇幅很大的书籍中,发现只有13.5%的页数的页数没有印刷错误,如果我们假定每页的错字数是服从没有印刷错误,如果我们假定每页的错字数是服从 Poisson Poisson 分布的,求正好有一个错字的页数的百分比分布的,求正好有一个错字的页数的百分比分布的,求正好有一个错字的页数的百分比分布的,求正好有一个错字的页数的百分比.解解 设为每页的错字个数,由已知得设为每页的错字个数,由已知得又已知又已知 例例2.2.设每对夫妇的子女数设每对夫妇的子女数X X服从参数为服从参数为 的泊松分布的泊松分布,且知一对夫妇有不超过且知一对夫妇有不超过1 1个孩子的概率为个孩子的概率为3e3e-2-2.求任选求任选一对夫妇一对夫妇,至少有至少有3 3个孩子的概率。个孩子的概率。解解:由题意由题意,可以证明可以证明 当当n很大很大,p很小很小,=np是一个不太大的常数时是一个不太大的常数时,可以用泊可以用泊松分布作为二项分布的近似松分布作为二项分布的近似.即即解解 1月月1日公司收入日公司收入 (元元)设一年中死亡人数为(人),则设一年中死亡人数为(人),则 例例例例4 4 在保险公司里有在保险公司里有2500个同一年龄和同社会阶层的个同一年龄和同社会阶层的人参加了人寿保险。在一年里每个人死亡的概率为人参加了人寿保险。在一年里每个人死亡的概率为0.002,每个参加保险的人在,每个参加保险的人在 1月月1日付日付 12 元保险费,元保险费,而在死亡时家属可从保险公司领取而在死亡时家属可从保险公司领取2000元,问下元,问下列事件的概率各为多少?列事件的概率各为多少?(1)保险公司亏本保险公司亏本(2)保险公司获利不少于保险公司获利不少于10000元元(1)保险公司亏本保险公司亏本=(2)保险公司获利不少于保险公司获利不少于10000元元=1、设某机器加工一种产品的次品率为0.1,检验员每天检验4次,每次随机地抽取5件产品进行检验,如果发现次品多于一件,就要调整机器。求一天中调整机器次数的概率分布。2、在一本200页的书中,共有100个错误。假设每个错误等可能的出现在每一页上,试求:(1)在给定的一页上恰好有两个错误的概率(2)在给定的一页上至少有一个错误的概率2.3 随机变量的分布随机变量的分布函数函数 1、分布函数的概念、分布函数的概念的函数值的含义:表示X落在上的概率.2、随机变量分布函数的性质、随机变量分布函数的性质上述上述4条性质是判别函数是否是分布函数的充要条件。条性质是判别函数是否是分布函数的充要条件。试说明F(x)能否是某个随机变量的分布函数.例如:设有函数 F(x)解:注意到函数 F(x)在 上下降,不满足性质(3),故F(x)不能是分布函数.不满足性质(2),可见F(x)也不能是随机变量 的分布函数.或者例如例如:解:解:2.4 连续型随机连续型随机变量变量 引例引例 在区间4,10上任意抛掷一个质点,用X表示这个质点与原点的距离,则X是一个随机变量。若这个质点落在4,10上任一子区内的概率与这个区间长度成正比,求X的分布函数。解:X可以取4,10上的一切实数,该区间将整个数轴分成了部分我们分下列种情况讨论F(x)的值于是,F(x)的表达式为F(x)1410 xF(x)是非降的连续函数,在整个数轴上没有一个跳跃点。1、连续型随机变量及其概率密度函数的定义、连续型随机变量及其概率密度函数的定义2、概率密度函数的性质概率密度函数的性质这两条性质是判定一个这两条性质是判定一个函数函数 f(x)是否为某随机变量是否为某随机变量X的的概率密度函数的充要条件概率密度函数的充要条件.f(x)xo面积为面积为1 故 X的密度 f(x)在 x 这一点的值,恰好是X落在区间 上的概率与区间长度 之比的极限.这里,如果把概率理解为质量,f(x)相当于线密度.若x是 f(x)的连续点,则:=f(x)4.对 f(x)的进一步理解:要注意的是,密度函数 f(x)在某点处a的高度,并不反映X取值的概率.但是,这个高度越大,则X取a附近的值的概率就越大.也可以说,在某点密度曲线的高度反映了概率集中在该点附近的程度.f(x)xo若不计高阶无穷小,有:它表示随机变量 X 取值于 的概率近似等于 .在连续型随机变量理论中所起的作用与在离散型随机变量理论中所起的作用相类似.连续型随机变量取任一指定值的概率为0.即:a为任一指定值这是因为需要指出的是:由此得由此得,1)对连续型对连续型随机变量X,有有2)由由P(X=a)=0 可推知可推知而而 X=a 并非不可能事件并非不可能事件并非必然事件并非必然事件称称A为为几乎不可能事件几乎不可能事件,B为为几乎必然事件几乎必然事件.可见,可见,由由P(A)=0,不能推出不能推出由由P(B)=1,不能推出不能推出 B=S例1:设随机变量X具有概率密度(1)确定常数k;(2)求X的分布函数F(x);(3)求例例2 设连续型随机变量设连续型随机变量X的分布函数为的分布函数为求:(1)A,B;(2)P(-1X0,则称X服从参数为 和 的正态分布或高斯(Gauss)分布.正态分布有些什么性质呢?正态分布有些什么性质呢?由于连续型随机变量唯一地由它由于连续型随机变量唯一地由它的密度函数所描述,我们来看看正态的密度函数所描述,我们来看看正态分布的密度函数有什么特点分布的密度函数有什么特点.正态分布正态分布 的图形特点的图形特点 正态分布的密度曲线是一条关于正态分布的密度曲线是一条关于 对对称的钟形曲线称的钟形曲线.特点是特点是“两头小,中间大,左右对称两头小,中间大,左右对称”.”.决定了图形的中心位置,决定了图形的中心位置,决定了图形决定了图形中峰的陡峭程度中峰的陡峭程度.正态分布正态分布 的图形特点的图形特点 能不能根据密度函数的表达式,能不能根据密度函数的表达式,得出正态分布的图形特点呢?得出正态分布的图形特点呢?容易看到,容易看到,f(x)0即整个概率密度曲线都在即整个概率密度曲线都在x轴的上方轴的上方;故故f(x)以以为对称轴,并在为对称轴,并在x=处达到最大处达到最大值值:令令x=+c,x=-c(c0),分别代入分别代入f(x),可可得得f(+c)=f(-c)且且 f(+c)f(),f(-c)f()这说明曲线这说明曲线 f(x)向左右伸展时,越来越向左右伸展时,越来越贴近贴近x轴轴.即即f(x)以以x轴为渐近线轴为渐近线.当当x 时,时,f(x)0,用求导的方法可以证明,用求导的方法可以证明,为为f(x)的两个拐点的横坐标的两个拐点的横坐标.x=这是高等数学的内容,如果忘记了,课下这是高等数学的内容,如果忘记了,课下再复习一下再复习一下.服从正态分布服从正态分布 的随机变量的随机变量X的的概率密度是概率密度是X的分布函数的分布函数P(Xx)是怎样的呢?是怎样的呢?设设X ,X的分布函数是的分布函数是 正态分布由它的两个参数正态分布由它的两个参数和和唯一确唯一确定,定,当当和和不同时,是不同的正态分布不同时,是不同的正态分布.下面我们介绍一种最重要的正态分布下面我们介绍一种最重要的正态分布标准正态分布标准正态分布标准正态分布标准正态分布的正态分布称为标准正态分布的正态分布称为标准正态分布.其密度函数和分布函数常用其密度函数和分布函数常用和表示它的依据是下面的定理:它的依据是下面的定理:标准正态分布的重要性在于,任何一个标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为一般的正态分布都可以通过线性变换转化为标准正态分布标准正态分布.根据定理根据定理1,1,只要将标准正态分布的分布只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概函数制成表,就可以解决一般正态分布的概率计算问题率计算问题.,则则 N(0,1)设设定理定理1 书末附有标准正态分布函数数值表,有了书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表它,可以解决一般正态分布的概率计算查表.表中给的是表中给的是x0时时,(x)的值的值.当当-x0时时若若N(0,1)若若 XN(0,1),例如:设 查表得由标准正态分布的查表计算可以求得,由标准正态分布的查表计算可以求得,这说明,这说明,X的取值几乎全部集中在的取值几乎全部集中在-3,3 区间区间内,超出这个范围的可能性仅占不到内,超出这个范围的可能性仅占不到0.3%.当当XN(0,1)(0,1)时,时,P(|X|1)=2 (1)-)-1=0.6826 P(|X|2)=2 (2)-)-1=0.9544P(|X|3)=2 (3)-)-1=0.9974准则将上述结论推广到一般的正态分布将上述结论推广到一般的正态分布,时,时,可以认为,可以认为,Y 的取值几乎全部集中在的取值几乎全部集中在区间内区间内.这在统计学上称作这在统计学上称作“3 3 准则准则”(三倍标准差原则)(三倍标准差原则).0 x解解P(X h)0.01或或 P(X h)0.99,下面我们来求满足上式的最小的下面我们来求满足上式的最小的h.例例7 7 公共汽车车门的高度是按男子与车门顶头公共汽车车门的高度是按男子与车门顶头碰头机会在碰头机会在0.01以下来设计的以下来设计的.设男子身高设男子身高XN(170,62),问车门高度应如何确定问车门高度应如何确定?设车门高度为设车门高度为h cm,按设计要求按设计要求因为因为 XN(170,62),),故 PX0.99因而因而 =2.33,即 h=170+13.98 184设计车门高度为设计车门高度为184厘米时,可使厘米时,可使男子与车门碰头男子与车门碰头机会不超过机会不超过0.01.P(X h)0.99求满足求满足 的最小的的最小的 h.所以所以 .一、问题的提出一、问题的提出 在实际中,人们常常对随机变量的函数在实际中,人们常常对随机变量的函数更感兴趣更感兴趣.求截面面积求截面面积 A=的分布的分布.例如,已知圆轴截面直径例如,已知圆轴截面直径 d 的分布,的分布,第四节第四节 随机变量的函数的分布随机变量的函数的分布一、问题的提出一、问题的提出 在实际中,人们常常对随机变量的函数在实际中,人们常常对随机变量的函数更感兴趣更感兴趣.已知已知t=t0 时刻噪声电压时刻噪声电压 V的分布,的分布,求功率求功率 W=V2/R (R为电阻)为电阻)的分布等的分布等.设随机变量设随机变量X 的分布已知,的分布已知,Y=g(X)(设设g是连续函数),如何由是连续函数),如何由 X 的分布求的分布求出出 Y 的分布?的分布?下面进行讨论下面进行讨论.这个问题无论在实践中还是在理论这个问题无论在实践中还是在理论上都是重要的上都是重要的.二、离散型随机变量二、离散型随机变量函数的分布函数的分布解:解:当当 X 取值取值 1,2,5 时,时,Y 取对应值取对应值 5,7,13,例例1设设X求求 Y=2X+3 的概率函数的概率函数.而且而且X取某值与取某值与Y取其对应值是两个同时发生取其对应值是两个同时发生的事件,两者具有相同的概率的事件,两者具有相同的概率.故故如果如果g(xk)中有一些是相同的,把它们作适当中有一些是相同的,把它们作适当并项即可并项即可.一般,若一般,若X是离散型随机变量是离散型随机变量,X的概率函数为的概率函数为X 则则 Y=g(X)如:如:X 则则 Y=X2 的概率函数为:的概率函数为:Y 三、连续型随机变量函数的分布三、连续型随机变量函数的分布解:设解:设Y的分布函数为的分布函数为 FY(y),例例2设设 X 求求 Y=2X+8 的概率密度的概率密度.FY(y)=P Y y =P(2X+8 y)=P X =FX()于是于是Y 的密度函数的密度函数故故注意到注意到 0 x 4 时,时,即即 8 y 0 时时,注意到注意到 Y=X2 0,故当,故当 y 0时,时,解:解:设设Y和和X的分布函数分别为的分布函数分别为 和和 ,若若则则 Y=X2 的概率密度为:的概率密度为:从上述两例中可以看到,在求从上述两例中可以看到,在求P(Yy)的过的过程中,关键的一步是设法从程中,关键的一步是设法从 g(X)y 中解出中解出X,从而得到与从而得到与 g(X)y 等价的等价的X的不等式的不等式.例如,用例如,用 代替代替 2X+8 y X 用用 代替代替 X2 y 这样做是为了利用已知的这样做是为了利用已知的 X的分布,从的分布,从而求出相应的概率而求出相应的概率.这是求随机变量的函数的分布的一种常用方法这是求随机变量的函数的分布的一种常用方法.例例4 设随机变量设随机变量X在在(0,1)上服从均匀分布,求上服从均匀分布,求Y=-2lnX的概率密度的概率密度.解:解:在区间在区间(0,1)上上,函数函数lnx0,于是于是 y在区间在区间(0,1)上单调下降,有反函数上单调下降,有反函数由前述定理得由前述定理得注意取注意取绝对值绝对值已知已知X在在(0,1)上服从均匀分布,上服从均匀分布,代入代入 的表达式中的表达式中得得即即Y服从参数为服从参数为1/2的指数分布的指数分布.例:设 ,试证明当 时,有 对于连续型随机变量,在求对于连续型随机变量,在求Y=g(X)的的分布时,关键的一步是把事件分布时,关键的一步是把事件 g(X)y 转转化为化为X在一定范围内取值的形式,从而可以在一定范围内取值的形式,从而可以利用利用 X 的分布来求的分布来求 P g(X)y.我们介绍了随机变量函数的分布我们介绍了随机变量函数的分布.