数理统计CH1-概率分布.ppt
《数理统计CH1-概率分布.ppt》由会员分享,可在线阅读,更多相关《数理统计CH1-概率分布.ppt(176页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、f(x)Area under curvesums to one.Random variable range第第1 1章章 概率分布概率分布Probability Distribution10/28/20221n事件和概率:讨论描述随机现象及其统计规律的术语及概念、现象发生可能性的计量、相互关系和运算;n随机变量及分布:讨论随机现象的确定性数学表达,相同条件、大量重复观测下随机变量所遵循的取值规律;n数字特征:讨论分布特征的数字表达;n大数定律:讨论重复试验次数对频率和均值观测稳定性的影响。1 概率分布本章内容10/28/202221.1 事件与概率Event and Probability1
2、概率分布10/28/20223 自然界存在两种现象,自然界存在两种现象,确定性现象:确定性现象:一定条件下必然发生;一定条件下必然发生;随机性现象:一定随机性现象:一定条件下可能发生,但结果不止一个,哪个结条件下可能发生,但结果不止一个,哪个结果发生预先并不知道。果发生预先并不知道。随机现象虽然表现为不确定性,但在大大量量、相同条件重复试验相同条件重复试验下,其观测结果会呈现出某种特定的规律,称作随机现象的统计规律。比如,多次抛掷一枚均质硬币,正面朝上的频率接近。随机现象(Random Phenomenon)事件与概率10/28/20224 数理统计学就是研究大量的随机现象,但限定为一类特定的
3、随机现象,即在相同条件重复试验相同条件重复试验下所能观测到的随机现象。它研究随机现象的发生机制、统计规律和统计特征,研究解决工程实际问题的统计方法。随机现象(Random Phenomenon)事件与概率10/28/202251.1.1 事件Random Event 事件与概率10/28/20226满足下述三个条件的试验称为随机试验:(1)试验可在相同条件下重复进行;(2)试验的所有可能结果是明确可知的,并且不止一个;(3)每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定会出现哪一个结果。随机试验随机试验在统计学里可简称为试验试验。事件(1)随机试验(Random Experi
4、ment)10/28/20227 事件(1)随机试验(Random Experiment)10/28/20228 广义地讲,对任何一个特定对象的随机抽查或观测,均可看作是随机试验。比如,多次抛一枚均质硬币是随机试验,观测一个种族的身高、体重等是随机试验,观测某作物的株高是随机试验,观测条件近似动物对某种药物的生理反应是随机试验,小区测产是随机试验,等等。事件(1)随机试验(Random Experiment)10/28/20229 事件 随机试验的每一个可能结果,称作基本事件(elementary event),亦称作简单事件(simple event),基本事件是描述随机试验不可能再分的事件
5、。(2)基本事件(Elementary Event)10/28/202210 事件 抛硬币试验,正面朝上是一个基本事件,反面朝上也是一个基本事件。观测一个种族的身高状况,米是一个基本事件,米是一个基本事件,米也是一个基本事件。小区测产,是一个基本事件,也是一个基本事件。花括弧括内容表达事件,常用于利用文字或表达式陈述事件的场合。(2)基本事件(Elementary Event)10/28/202211 事件 由若干个基本事件组合而成的事件,称作复合事件(compound event),也称作复杂事件。通常所说的随机事件(random event)是基本事件和复合事件的统称,即可指基本事件又可指
6、复合事件。(3)复合事件(Compound Event)10/28/202212 事件(3)复合事件(Compound Event)10/28/202213 事件 连续两次抛掷一枚硬币,均出现正面是一个复合事件,出现一正一反是一个复合事件,均出现反面也是一个复合事件。观测一个种族分区域的身高,平均米、平均米均是复合事件。小区测产,产量在10kg20kg之间是一个复合事件,产量在20kg30kg之间也是一个复合事件。(3)复合事件(Compound Event)10/28/202214 事件 每次试验中一定发生的事件称作必然事件(certain event),在任何一次试验中都不可能发生的事件称
7、作不可能事件(impossible event)。随机事件简称作“事件事件”,而将不可能事件和必然事件视作随机事件的两个极端事件。(4)必然事件与不可能事件(Certain and Impossible Event)10/28/202215 掷一枚均质硬币试验,出现两个面之一是必然事件,两个面谁也不出现是不可能事件。小区测产,产量小于0kg是不可能事件,产量大于等于0kg是必然事件。事件(4)必然事件与不可能事件(Certain and Impossible Event)10/28/202216我们称一个随机事件发生,当且仅当它所我们称一个随机事件发生,当且仅当它所包含的一个基本事件在试验中出
8、现包含的一个基本事件在试验中出现 事件考察抛一枚硬币的试验,事件 A=出现正面若试验结果为出现反面,则事件A未发生若试验结果为出现正面,则事件A发生考察小区测产的事件 A=产量大于10kg若试验结果为,则事件A发生若试验结果为,则事件A未发生(5)事件发生(Event come about)10/28/2022171.1.2 概率Probability 事件与概率10/28/202218 用于度量事件发生可能性大小的数值称作事件的概率(probability)。事件通常可用大写字母表示,如A、B等,相应的概率可用P(A)、P(B)等表示。概率(1)事件的概率10/28/202219概率具有下述
9、性质:设A为任一事件,则0P(A)1;对于必然事件,有P()=1;对于不可能事件,有P()=0。概率(2)概率的性质10/28/202220不可能事件P()=0,必然事件P()=1。但反过来不成立,因为概率只代表“可能性”的大小,可能性为0的事件不一定总不发生,可能性为1的事件不一定总是发生比如小区测产,事件产量是25kg的概率等于0,但它不一定总不发生;事件产量不是25kg的概率等于1,但它不一定总是发生 概率(2)概率的性质10/28/202221 在相同的条件下进行了n次试验,在这n 次试验中,事件A发生的次数nA 称为事件A发生的频数。比值nA/n 称为事件A发生的频率,并记成fn(A
10、),即 概率(3)概率的统计定义10/28/202222 历史上曾有几个著名的抛一枚均质硬币试验,试验者观测了抛掷次数、正面出现次数和正面出现频率等。结果发现,频率在附近摆动,详见表。试验重复次数愈大频率与的偏差愈小,表现出向稳定趋近的倾向,因此预测事件的概率为。试验次数愈大,事件频率在某个定值两侧摆动的幅度愈小,称作事件频率具有稳定性事件频率具有稳定性。概率(3)概率的统计定义10/28/202223 251 249 256 253 251 246 244 nAfn(A)n=500时抛硬币试验 实 验 者 德摩根 蒲丰K 皮尔逊K 皮尔逊 n nH fn(H)2048 40401200024
11、000 1061 2048 601912012表表 概率(3)概率的统计定义10/28/202224 概率 随试验次数n的增大,若事件A的频率fn(A)越来越幅度变小地在某一常数p两侧摆动摆动,则称常数p为事件A的概率(probability),记作P(A)=p。称此陈述为概率的统计定义。(statistical probability)。(3)概率的统计定义10/28/2022251.2 随机变量及分布Random Variable and Probability Distribution1 概率分布10/28/202226前面事件与概率的研究仅仅实现了随机现象及其关系的概念描述,远没有达到
12、工程应用的程度,难于解决复杂多样的实际问题;引入人们熟悉的微积分实现随机现象的数值化定量分析,使能用计算机高效地处理工程实际的统计学问题;随机变量及其分布的理论和方法,实质上就是利用确定性数学方法研究和解决随机数学(统计学)问题。随机变量及分布(1)随机现象定量分析的意义10/28/202227实施某随机试验,若用实数变量X表示试验结果,则X的取值明确可知且不止一个,试验前并不知道X会取那个值,表征随机试验结果的实数变量X称作随机变量;X的值用实数x表示,即一次试验的结果,是所有可能试验结果中的一个,称x为X的观察值,简称观测(observation);(2)随机变量(Random Varia
13、ble)随机变量及分布10/28/202228 由于随机变量X量化(数值化或数字化)表达了随机试验结果,因此它也具有随机试验的三个基本特征:随机变量X可在相同条件下重复观测;随机变量X的所有可能值明确可知,并且不止一个;每次观测总是恰好获得X所有可能值中的一个,但观测前却不能肯定是哪一个。随机变量及分布(2)随机变量(Random Variable)10/28/202229掷一枚均质硬币试验:样本空间1=H,T,随机变量表达该问题,以“X=1”表示正面向上的事件,以“X=0”表示反面向上的事件;掷一枚骰子试验:样本空间=1,2,3,4,5,6,随机变量表达该问题,以“X=1”表示出现1点的事件
14、,“X=2”表示出现2点,以此类推;作物育种试验:以“”表示产量大于的事件,不等式表达一个基本事件的集合。随机变量及分布(3)随机事件(Random Event)10/28/202230用随机变量X和某指定观测x可定义下述3种随机事件:试验结果为x的事件:X=x试验结果小于或等于x的事件:Xx试验结果大于x的事件:Xx 随机变量及分布(3)随机事件(Random Event)10/28/202231概率分布是概率论的基本概念之一,它用函数和微积分描述随机变量取值的概率规律。考察随机变量X与某指定观测x的关系,用事件概率P(Xx)以及事件概率的变化速率P(Xx)/1或dP(Xx)/dx描述概率分
15、布;离散随机变量用求和函数描述概率分布;连续随机变量用积分函数描述概率分布。随机变量及分布(4)概率分布(Probability Distribution)10/28/202232本节主要讨论下述几个问题:随机变量、随机变量的观测、事件、概率四者之间的关系;离散变量的分布函数和概率密度;连续变量的分布函数和概率密度;常见离散分布和连续分布;随机变量的标准化变换;正态分布的概率计算。随机变量及分布本节内容10/28/202233离散变量的概率分布Discrete Variable and Probability Distribution 随机变量及分布10/28/202234若随机变量X或事件X
16、=x的所有可能取值为有限个或可列个,即取值存在间隔,则称X为离散随机变量(discrete variable)。比如,抛硬币试验取值0,1,播种穴粒数取值0,1,2,,以及其它“计数”类的随机变量。为便于数学处理,经常将随机变量的取值范围扩展到离散无穷域0,1,2,+,只不过取某些值的概率等于0。离散变量的概率分布(1)离散随机变量(Discrete Variable)10/28/202235离散随机变量用X表示,它的观察值用实数x表示,则离散变量随机试验中所发生的随机事件用等式表示:离散变量的概率分布(2)随机变量、观察值和随机事件随机事件随机事件观察值观察值10/28/202236观察值x
17、按大小顺序分别记作xi,xixi-1,i=1,2,,则离散随机变量X的分布函数F(xi)定义如下:分布函数亦称作概率累积函数Cumulative Distribution Function(3)分布函数(Distribution Function)离散变量的概率分布10/28/202237事件X=xi的概率记作pi=P(X=xi)。则离散随机变量X的概率密度f(xi)定义分布函数的变化率:(4)概率密度(Probability Density)离散变量的概率分布概率密度记为离散变量的概率密度Probability Density亦称作概率函数Probability Function10/28/
18、202238 概率密度表征离散随机变量取值x与取该值概率的函数关系,即描述按观测值大小顺序排列的概率分布规律。按定义,概率密度可理解为观察值的一个单位增量所对应的分布函数增量,或者发生事件离散随机变量X等于某指定观测x的概率。离散变量的概率分布(4)概率密度(Probability Density)10/28/202239概率密度可表示成如下的矩阵形式 矩阵的第1行为随机变量的观察值,第2行为事件X=xi的概率pi,矩阵元素上下对应。离散变量的概率分布(4)概率密度(Probability Density)10/28/202240抛硬币试验抛骰子试验 离散变量的概率分布(4)概率密度(Prob
19、ability Density)10/28/202241 所谓离散随机变量X的概率分布,就是指分布函数F(xi)和概率密度f(xi)两个基本函数,它们提供了随机变量概率分布规律的完整信息。(5)概率分布(Probability Distribution)离散变量的概率分布10/28/202242概率值非负:全概率和等于1:两极端事件的分布函数值:(6)离散变量概率分布的性质 离散变量的概率分布10/28/202243若离散随机变量X的随机试验仅有两个可能结果,可将其表述为X=1和X=0两个事件,则X服从0-1分布。抛硬币试验,出现正面为1,出现反面为0种子发芽试验,发芽为1,不发芽为0杀虫剂试
20、验,有效为1,无效为0田间播种出苗试验,出苗为1,不出苗为0(7)0-1分布(0-1 Distribution)离散变量的概率分布10/28/2022440-1分布概要:(7)0-1分布(0-1 Distribution)离散变量的概率分布10/28/202245(7)0-1分布(0-1 Distribution)离散变量的概率分布10/28/202246遵循0-1分布规律的试验称作贝努利试验(binomial experiment)做n次贝努利试验称作n重贝努利试验n次抛硬币试验,统计正面出现的次数发芽试验,统计n粒种子中发芽的种子个数杀虫剂试验,统计n条虫子中被灭杀虫口数播种试验,统计n粒
21、种子中出苗的种子个数(8)二项分布(Binomial Distribution)离散变量的概率分布10/28/202247 设贝努里试验随机变量 仅取0和1两个观察值,对于n重贝努里试验,若每次试验中事件=1发生的概率记为p,那么用以描述n次试验中事件=1发生次数的随机变量X可用随机变量系之和表示:(8)二项分布(Binomial Distribution)离散变量的概率分布10/28/202248=1代表什么与我们所关心的问题有关(8)二项分布(Binomial Distribution)离散变量的概率分布10/28/202249随机变量系之和服从参数为n,p的贝努利分布(binomial
22、distribution),亦称二项分布,记作XB(n,p),其中0p1。二项分布的概率密度为:(8)二项分布(Binomial Distribution)离散变量的概率分布10/28/202250Binomial分布概要:(8)二项分布(Binomial Distribution)离散变量的概率分布10/28/202251(8)二项分布(Binomial Distribution)离散变量的概率分布10/28/202252(8)二项分布(Binomial Distribution)离散变量的概率分布事件X=x的概率等于n个0-1积事件的条件概率10/28/202253P(8)二项分布(Bin
23、omial Distribution)离散变量的概率分布10/28/202254 设Y=X/n,相当于X乘了一个常数1/n,它指n重贝努利试验中事件出现的频率。不难推论,频率Y仍服从二项分布。即(8)二项分布(Binomial Distribution)离散变量的概率分布10/28/202255二项分布是具有n重贝努里试验背景的一种重要分布当n=1时,二项分布转化成0-1分布。因此0-1分布可被视作二项分布的一个特例由于二项分布随机变量X是0-1分布随机变量的线性组合,因而X可被视作0-1总体抽样获得的统计量(8)二项分布(Binomial Distribution)离散变量的概率分布10/2
24、8/202256 观察某作物田间出苗状况,若每穴粒数相同,则沿播行单位长度上(当作小区)的出苗数或出苗率服从泊松分布;对一个容器按等时间间隔(看作小区)观测细菌的存活数;公路交叉路口单位时间间隔内过往的汽车数;汽车站或理发馆单位时间间隔内到达的顾客数等均服从泊松分布。(9)泊松分布(Poisson Distribution)离散变量的概率分布10/28/202257Poisson分布概要:(9)泊松分布(Poisson Distribution)离散变量的概率分布10/28/202258以顾客去理发馆为例导出Poisson分布:设每人去理发馆的概率是p,则不去的概率是1-p;当顾客源容量n与理
25、发馆容量处于供需平衡状态时,有np=,且n愈大p愈小顾客是否去理发馆是n重贝努利试验,设去理发馆的人数为X,则人数为x的概率为(9)泊松分布(Poisson Distribution)离散变量的概率分布10/28/202259顾客源容量n很大时则概率p很小,去理发馆人数X等于x的概率可用下述极限近似(9)泊松分布(Poisson Distribution)离散变量的概率分布10/28/202260 离散随机变量的概率分布(9)泊松分布(Poisson Distribution)10/28/202261分布函数概率本质:全概率和:(9)泊松分布(Poisson Distribution)离散变量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 CH1 概率 分布
限制150内