大学概率统计随机变量及其分布课件.ppt
第四章 随机变量及其分布 第一节 随机变量及其分布函数一、随机变量 用数量来表示试验的基本事件 定义1 设试验 的基本空间为 ,如果对试验 的每一个基 本事件 ,规定一个实数记作 与之对应,这样就得到一个定义在基本空 间 上的一个单值实函数 ,称变量 为随机变量 随机变量常用字母 、等表示或用 、等表示所谓所谓随机变量随机变量,不过是随机试验的,不过是随机试验的试验结果试验结果和和实数实数之间的一个对应关系之间的一个对应关系引例引例1 1 投掷一枚硬币,观察出现正反面的情形。试投掷一枚硬币,观察出现正反面的情形。试验有两个可能结果:验有两个可能结果:我们引入一个变量如下:我们引入一个变量如下:出现正面出现正面 出现反面出现反面这个变量可以看作是定义在样本空间这个变量可以看作是定义在样本空间上的函数,称其为随机变量。实际上此变量上的函数,称其为随机变量。实际上此变量是依试验结果的不同而随机地取值是依试验结果的不同而随机地取值1 1或或0 0。引例引例2 2 掷一枚骰子面上出现的点数。掷一枚骰子面上出现的点数。这个试验结果本身就是一个数这个试验结果本身就是一个数.(与数值有关)(与数值有关)当当 时,时,这里这里 是随机变量,是随机变量,我们引入一个变量我们引入一个变量它是依试验结果的不同而随机地取值它是依试验结果的不同而随机地取值1 1,2 2,3 3,4 4,5 5,6 6。昆虫的产卵数;昆虫的产卵数;每天从太原站下火车的人数;每天从太原站下火车的人数;类似的例子:类似的例子:七月份太原的最高温度;七月份太原的最高温度;在奥尼尔的一次罚篮中,可能出现罚中、罚不中这两种情况,这个随机试验的结果不具备数量性质,我们仍可以用数量来表示它。例如:用变量来表示这个随机试验的结果:=0,表示没罚中;=1,表示罚中。而表示随机变量所取的值而表示随机变量所取的值时时,一般采用小写字母一般采用小写字母x,y,z等等.随机变量通常用大写字母随机变量通常用大写字母X,Y,Z或希腊字母或希腊字母,等表示等表示例如,从某一学校随机选一例如,从某一学校随机选一学生,测量他的身高学生,测量他的身高.我们可以把可能的身高看作随机变量我们可以把可能的身高看作随机变量X X,然后我们可以提出关于然后我们可以提出关于X X 的各种问题的各种问题.如如 P(X1.7)=?P(X1.5)=?P(1.5X1.7)=?2 2 2 2、随机变量的分类、随机变量的分类、随机变量的分类、随机变量的分类 通常分为两类:通常分为两类:随随机机变变量量离散型随机变量离散型随机变量连续型随机变量连续型随机变量所有取值可以逐个所有取值可以逐个一一列举一一列举全部可能取值不仅全部可能取值不仅无穷多,而且还不无穷多,而且还不能一一列举,而是能一一列举,而是充满一个区间充满一个区间.这两种类型的随机变量因为都是随机这两种类型的随机变量因为都是随机变量,自然有很多相同或相似之处,但因其取变量,自然有很多相同或相似之处,但因其取值方式不同,又有其各自的特点。值方式不同,又有其各自的特点。学习时请注意它们各自的特点和描述方法。学习时请注意它们各自的特点和描述方法。随机变量概念的产生是概率论发展史随机变量概念的产生是概率论发展史上的重大事件。引入随机变量后,对随机现象上的重大事件。引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究。究扩大为对随机变量及其取值规律的研究。注:1随机变量 是基本事件的函数,具体问题里具体规定 2对于不同的基本事件,的取值亦要不同 3每一基本事件都可用随机变量的取值来表示如 ,则 4当 时,事件 与 互不相容 5 表示 取小于等于 的每一个值所对应的基本事件的和事件二、随机变量的分布函数 定义2 设 是一个随机变量,对任意实数 ,令称 为随机变量 的分布函数 分布函数是定义在 上的函数具有如下性质:1 1且 ,2 是单调不减函数3 是右连续的 4对任意 ,有 第二节 离散型随机变量及其概率分布 定义3 设 E 是一个试验,X 为 E 中的随机变量,如果 X 只取有限个数值或可数无穷多个数值,则称 X 为离散型随机变量 一、离散型随机变量及其分布律 定义4 分布律:PX=xk =pk,k=1,2,即 例如抛硬币的试验1/21/210掷骰子的试验 1/61/61/61/61/61/6123456分布律的性质:1 0,=1,2,;2 例1 某人射击命中率为 ,不断地独立射击目标,直到命中为止,求发射子弹数 的分布律(概率分布)解 可取值为1,2,表示事件“前 次不中,第次击中”,则 ,因此1 2 3 例2 设 1/21/2 1 0,求 为分布函数 解 。例3 ,1 2 3 4 5 61/6 1/6 1/6 1/6 1/6 1/6求分布函数 解 。对离散型随机变量 ,书中例五:袋中有5个球,分别编号为1,2,5,从中同时取出3个球,以X表示取出的球的最小号码,求X的分布律与分布函数。解:由于X表示取出的3个球中的最小号码,因此X的可能值为1,2,3。X=1表示3个球中的最小号码为1,则另两个球可在2,3,4,5中产生,取法有 种;X2的取法有 种;X=3的取法有一种。则 因此,所求的分布律为X概率1 2 30.6 0.3 0.1二、几种常用的离散型随机变量及其概率分布 1(0-1)分布 若随机变量 只取0与1两个值,其概率分布为或写成 则称 服从参数为 的(0-1)分布或两点分布 分布函数 X 0 1P 1-p p 2二项分布如果随机变量 的取值为0,1,2,其分布律为 ,0,1,2,;则称 服从参数为 ,的二项分布,证作 (或 )当 =1时,二项分布 就是(0-1)分布 在 重贝努利概型中,事件 发生的次数 就服从 ,3泊松分布如果随机变量 可能取值为0,1,2,并且,0,1,2,其中 为常数,则称 服从参数为 的泊松分布,记作 显然 ,0,1,2,泊松定理 设 为一常数,为任意正 整数,则对于任一固定的非负整数 ,有 证 由 ,有由泊松定理可知,当 很大,很小时有近似公式 :即二项分布近似于泊松分布,而泊松分布有表可查 例4 一部电话交换台每分钟接到的呼叫次数服从参数为4的泊松分布,求:(1)每分钟恰有6次呼叫的概率;(2)每分钟的呼叫次数大于5的概率解 以 表示每分钟呼叫的次数,则 ,0,1,2,(1)(2)例5 某人进行射击,每次命中率为0.02,独立射击400次,求至少击中两次的概率 解 (400,0.02),,400 所求概率为 Poisson分布主要用于描述在单位时间分布主要用于描述在单位时间(空间空间)中中稀有事件的发生数稀有事件的发生数例如:例如:1.放射性物质在单位时间内的放射次数;放射性物质在单位时间内的放射次数;2.在单位容积充分摇匀的水中的细菌数;在单位容积充分摇匀的水中的细菌数;3.野外单位空间中的某种昆虫数等。野外单位空间中的某种昆虫数等。变量的取值充满整个数值区间,无法一一列变量的取值充满整个数值区间,无法一一列出其每一个可能值。出其每一个可能值。一般将连续型随机变量整理成频数表,对频数一般将连续型随机变量整理成频数表,对频数作作直方图直方图,直方图的每个矩形顶端连接的阶梯形,直方图的每个矩形顶端连接的阶梯形曲线来描述连续型变量的频数分布。曲线来描述连续型变量的频数分布。第三节 连续型随机变量及其概率密度 一、连续型随机变量的概率密度及其性质 如果样本量很大,组段很多,矩形顶端组成的如果样本量很大,组段很多,矩形顶端组成的阶梯型曲线可变成光滑的分布曲线。阶梯型曲线可变成光滑的分布曲线。大多数情况下,大多数情况下,可采用一个函数拟合这一光滑曲线。这种函数称为可采用一个函数拟合这一光滑曲线。这种函数称为概率概率密度函数密度函数(probability density functionprobability density function)定义4 设随机变量 的分布函数为 ,如果存在一个 非负函数 ,使对于任意实数 ,有,则称 为连续型随机变量,其中 称为 的概率密度性质:1 0 2 3 连续 4 5 6 例1 设 的概率密度为(1)求 ;(2)求 ;(3)解 (1)由 ,有 (2)(3)例2 设连续型随机变量 的概率密度为 (1)求 ,(2)求 ;(3)分布函数 解 (1)由 ,而 有 (2)(3)当时 ,当 时,当 2时,所以 二、几种常见的连续型随机变量及其概率密度 (一)均匀分布 若连续型随机变量 具有概率密度则称 在区间 上服从均匀分布其分布函数为 对于任意 ,若 ,则有 这说明 取值落在 内任一子区间 内的概率,只依赖于子区间的长度 ,而与子区间位置无关 例3 设连续型随机变量 的分布函数为 (1)求密度 ;(2)若 求 解 (1)在(-3,9)上服从均匀分布 (2)102102电车每电车每5 5分钟发一班,在任一时刻分钟发一班,在任一时刻 某一乘客到了车站。某一乘客到了车站。求乘客候车时间不超过求乘客候车时间不超过2 2分钟的概率。分钟的概率。解解例例 设随机变量设随机变量X为候车时间,则为候车时间,则X服从(服从(0 0,5 5)上的均匀分布)上的均匀分布XU(0,5)几何概型(一维)几何概型(一维)15154545解解 设设 A =“乘客候车时间超过乘客候车时间超过10分钟分钟”X表示乘客于某时过表示乘客于某时过X分钟到达分钟到达,则则X U(0,60)。(二)指数分布若连续型随机变量若连续型随机变量X的概率密度为的概率密度为n 定义定义则称则称X服从参数为服从参数为 的指数分布的指数分布.记为记为分布函数为设某设某产品寿命产品寿命X服从指数分布服从指数分布,其平均寿命为其平均寿命为2年年.求求(1)X的密度函数的密度函数 f(x)和分布函数和分布函数F(x);(2)任取一产品任取一产品,寿命在寿命在2年以上的概率年以上的概率;(3)若其中一个产品使用一年未坏若其中一个产品使用一年未坏,求还能使用至少求还能使用至少一年的概率一年的概率;(4)从中任取两个从中任取两个,寿命最短的在一年以上的概率寿命最短的在一年以上的概率.解解因为平均寿命为因为平均寿命为2年年,故故(1)(2)(3)(4)(三)正态分布1、正态分布的定义与性质 若连续型随机变量 的概率密度为其中 为常数,则称 服从参数为 的正态分布,记作 其分布函数为性质 关于直线 对称,并在 处取最大值 实际问题中,许多随机变量都服从正态分布,如测量长度的误差,机器包装货物的重量等2 对密度曲线的影响对密度曲线的影响应用场合应用场合 若随机变量若随机变量 X X 受到众多相互独立的随机因受到众多相互独立的随机因素的影响,而每一个别因素的影响都是微小的,素的影响,而每一个别因素的影响都是微小的,且这些影响可以叠加且这些影响可以叠加,则则 X X 服从正态分布服从正态分布.可用正态变量描述的实例非常之多:可用正态变量描述的实例非常之多:各种测量的误差;各种测量的误差;人的生理特征;人的生理特征;工厂产品的尺寸;工厂产品的尺寸;农作物的收获量;农作物的收获量;海洋波浪的高度;海洋波浪的高度;金属线的抗拉强度;金属线的抗拉强度;热噪声电流强度;热噪声电流强度;学生们的考试成绩;学生们的考试成绩;正态分布是概率论中最重要的分布,这可以由以下正态分布是概率论中最重要的分布,这可以由以下情形加以说明:情形加以说明:正态分布是自然界及工程技术中最常见的分布正态分布是自然界及工程技术中最常见的分布之一,大量的随机现象都是服从或近似服从正态分之一,大量的随机现象都是服从或近似服从正态分布的可以证明,如果一个随机指标受到诸多因素布的可以证明,如果一个随机指标受到诸多因素的影响,但其中任何一个因素都不起决定性作用,的影响,但其中任何一个因素都不起决定性作用,则该随机指标一定服从或近似服从正态分布则该随机指标一定服从或近似服从正态分布 正态分布有许多良好的性质,这些性质是其它许正态分布有许多良好的性质,这些性质是其它许多分布所不具备的多分布所不具备的 正态分布可以作为许多分布的近似分布正态分布可以作为许多分布的近似分布正态分布的重要性正态分布的重要性小结小结概念概念具体内容具体内容随机变量随机变量离散型离散型随机变量随机变量连续型连续型随机变量随机变量随机变量是关于试验结果的函数,即每一个试验结果对应着一个实数对于随机变量可能取的值,我们可以对于随机变量可能取的值,我们可以按一定次序一一列出,这样的随机变按一定次序一一列出,这样的随机变量叫做离散型随机变量。量叫做离散型随机变量。随机变量可以取某一曲间内的一切值,随机变量可以取某一曲间内的一切值,这样的随机变量叫作连续型随机变量。这样的随机变量叫作连续型随机变量。如果随机试验的结果可以用一个变量来如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量。表示,那么这样的变量叫做随机变量。随机变量的线性组合=a+b(其中a、b是常数)也是随机变量