第二概率与概率分布课件.ppt
《第二概率与概率分布课件.ppt》由会员分享,可在线阅读,更多相关《第二概率与概率分布课件.ppt(63页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二概率与概率分布第二概率与概率分布第1页,此课件共63页哦2.1 2.1 概率的统计定义概率的统计定义思考:投掷一枚硬币,出现正面的概率是多大?(0表示反面,1表示正面)反复做它,那么所有出现正面的结果平均值是多少?英国数学家皮尔逊做24000次抛硬币试验正面向上12012次频率=随着试验次数的增多,正面朝上的频率越来越接近0.5.反面向上11988次频率=第2页,此课件共63页哦频率是由样本数据计算得到的。由于样本分布的不均衡性,不同的随机试验,一个事件的出现频率也不一样,有一定的波动。随着试验次数的增大,频率将围绕着某一确定的常数P做平均幅度愈来愈小的变动,这就是所谓频率的稳定性,其中P
2、即为概率(表2-1)。简单的说概率就是频率的稳定值。在试验次数较多时,可以用频率作为概率的近似值。第3页,此课件共63页哦概率是事件在试验结果中出现可能性大小的定量计量概率是事件在试验结果中出现可能性大小的定量计量。概率是事件固有的属性,有以下明显的概率是事件固有的属性,有以下明显的性质性质:随机事件随机事件A A的概率:的概率:0 0P P(A A)1 1必然事件必然事件WW的概率为的概率为1 1,即,即P P(WW)=1=1不可能事件(不可能事件(V V)的概率为)的概率为0 0,即,即P P(V V)=0=0概率接近于概率接近于0 0(如(如P0.05P0.05)的事件称为小概率事件。的
3、事件称为小概率事件。第5页,此课件共63页哦2.2 2.2 概率分布概率分布一、一、随机变量随机变量表示随机现象结果的变量,也就是在随机试验中被测定的量,所取得的值称为观察值。随机变量随机变量离散型离散型连续型连续型(与我们前面所讲的连续型数据和离散型数据的意义一样)(与我们前面所讲的连续型数据和离散型数据的意义一样)第6页,此课件共63页哦二、离散型变量的概率分布随机变量取得的数值为有限个,或为无穷个孤立的值。将随机变量X所取得值x的概率P(X=xi)写成x的函数pi,称为随机变量X的概率函数pi=P(X=xi)。将X的一切可能值x1,x2,x3,xn,以及取得这些值的概率p1,p2,pn,
4、排列起来,构成了离散型随机变量的概率分布。常用概率分布表或概率分布图表示(如,p27表2-2图2-1)。概率函数应满足的条件:第7页,此课件共63页哦离散型变量概率的累积分布函数:离散型变量概率的向上累积。其公式为 ,即随机变量小于等于某一可能值(x0)的概率。第9页,此课件共63页哦离散型概率分布的例子离散型概率分布的例子例例:从从100件件产产品品(其其中中合合格格品品95件件,废废品品5件件)。任任意意抽抽取取10件,求每次抽到废品数的概率分布。件,求每次抽到废品数的概率分布。xp(x)0 123450.5837523670.3393909110.0702188090.006383528
5、0.0002510380.000003347 累积分布函数图累积分布函数图0 00.20.20.40.40.60.60.80.81 10 01 12 23 34 45 5xF(x)0 123450.5837523670.9231432780.9933620770.9997456050.9999966531.000000000概率分布表概率分布表概率分布表概率分布表累积概率分布表累积概率分布表累积概率分布表累积概率分布表第10页,此课件共63页哦离散型随机变量概率分布的特点离散型随机变量概率分布的特点列出随机变量所有可能值的列出随机变量所有可能值的xi,pi 组合组合 xi=随机变量值(取值)随
6、机变量值(取值)pi 为为 xi 的值对应的概率的值对应的概率互斥性互斥性(不相交不相交/无重复)无重复)0 p(xi)1p(xi)=1对于对于离散型离散型随机变量的任何值,都可以求出它的随机变量的任何值,都可以求出它的概率概率。第11页,此课件共63页哦三、三、连续型概率分布连续型概率分布连连续续型型随随机机变变量量(如如体体长长、体体重重、卵卵重重)则则不不同同,连连续续型型随随机机变变量量任任何值的概率都为何值的概率都为0 0。连续型连续型随机变量,仅研究随机变量,仅研究某一区间某一区间内取值的概率。内取值的概率。例例如如,某某品品种种小小麦麦的的高高度度为为100cm100cm120c
7、m120cm。我我们们可可以以说说该该品品种种的的任任何何一一株株小小麦麦的的高高度度准准确确地地等等于于某某一一标标准准高高度度(如如105cm105cm)的的概概率率等等于于0 0。我我们们只只能能确确定定它它高高度度的的范范围围在在某某一一固固定定的的区区间间内内,在在实实际际中中无限提高测定的精确度也无意义。无限提高测定的精确度也无意义。连连续续型型随随机机变变量量的的概概率率分分布布不不能能用用分分布布列列来来表表示示,改改用用随随机机变变量量x x在在某个区间内取值的概率某个区间内取值的概率P(P(axbaxb)来表示。来表示。随随机机变变量量X X的的值值落落在在区区间间(x x
8、,x x+x x)内内的的概概率率为为P P(x xX Xx x+x x)其中其中x x为区间长度。为区间长度。第12页,此课件共63页哦当当x趋于零时,此时区间概率称为趋于零时,此时区间概率称为密度函数密度函数:概率密度的图形概率密度的图形y=f(x),称为分布曲线。,称为分布曲线。概率是曲线下面积概率是曲线下面积概率是曲线下面积概率是曲线下面积!f(x)Xab概率密度曲线概率密度曲线概率密度曲线概率密度曲线f f(x x)与与与与x x轴所围成的面积为轴所围成的面积为轴所围成的面积为轴所围成的面积为1 1 分分分分布布布布函函函函数数数数(或或或或称称称称为为为为累累积积分分布布函函数数)
9、是是是是随随随随机机机机变变变变量量量量X X取取取取得得得得小小小小于于于于x x0 0的值的概率的值的概率的值的概率的值的概率第13页,此课件共63页哦概率密度函数图和概率分布函数图概率密度函数图和概率分布函数图概率密度函数图概率密度函数图 概率分布函数图概率分布函数图yp(x)yF(x)x1x2x2x1P(x1xx2)=F(x2)F(x1)第14页,此课件共63页哦连续型随机变量概率分布的性质:分布密度函数总是大于或等于0,即f(x)0;当随机变量x取某一特定值时,其概率等于0;即 (c为任意实数)因而,对于连续型随机变量,仅研究其在某一个区间内取值的概率,而不去讨论取某一个值的概率。第
10、15页,此课件共63页哦2.3 2.3 离散型概率分布离散型概率分布二项分布(binomial distribution)泊松分布(poisson distribution)超几何分布(hypergeometric probability distritution)负二项分布(Negative binomial distribution)第16页,此课件共63页哦u贝努利试验(Bernoulli trial):我们把只有两种可能观测值(每次试验只可能是两个对立事件之一)的随机试验统称为贝努利试验。这种试验在实际中广泛存在,如观察某一实验动物的卵孵化与否、某一实验动物是雌性还是雄性、实验反应是阴
11、性还是阳性等。un次独立地贝努利试验称为n重贝努利试验,其试验结果的分布(一种结果出现x次的概率是多少的分布)即为二项分布。u应用二项分布的重要条件是:每一种试验结果在每次试验中都有恒定的概率,各试验之间是重复独立的。一、二项分布一、二项分布 B(n,p)第17页,此课件共63页哦例:例3.1注意:1)放回式抽样适用于二项分布,非放回式抽样适用于超几何分布;2)通式为:n=试验次数;x=在n次试验中事件A出现的次数p=事件A发生的概率(每次试验都是恒定的)1p=事件 发生的概率P(x)=X 的概率函数为 P(X=x);F(x)=P(Xx)xnxxnppcxP-=)1()(第18页,此课件共63
12、页哦服从二项分布的随机变量的特征数服从二项分布的随机变量的特征数总体平均数总体平均数:np,p(用比率表示时)总体方差总体方差:(用比率表示时)偏斜度:偏斜度:峭度:峭度:从以上公式可以看出二项分布决定于两个参考数:试验次数n 和概率P,因此其图形变化趋势与这两个参数有关。第20页,此课件共63页哦 1 13.113.11 2 29.509.50 1 10 0 2 20 0 1 10 0 2 20.020.02 1 10 0 2 20.200.20 1 10.120.12 2 20.010.01 1 10.270.27 2 20.050.05 1 10.440.44 2 20.190.19 1
13、 10.980.98 2 20.950.95 1 10.840.84 2 20.510.51n=10,p0.0100.20.40.60.810246810n=100,p0.0100.10.20.30.40.50255075100n=500,p0.0100.10.20.30.40.50100200300400500n=10,p0.1000.10.20.30.40.50246810n=100,p0.1000.050.10.150.20255075100n=500,p0.1000.020.040.060.080.10100200300400500n=10,p0.5000.10.20.30246810
14、n=100,p0.5000.020.040.060.080.10255075100n=500,p0.5000.010.020.030.040.050100200300400500第21页,此课件共63页哦二项分布的应用条件有三:二项分布的应用条件有三:(1)各观察单位只具有互相对立的一种结果,如阳性或阴性,生存或死亡等,属于二项分类资料;(2)已知发生某一结果(如死亡)的概率为p,其对立结果的概率则为1-p=q,实际中要求 p 是从大量观察中获得的比较稳定的数值;(3)n个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其它观察单位的观察结果。第23页,此课件共63页哦二、泊松分
15、布二、泊松分布P(P()在生物学研究中,有许多事件出现的概率很小,而样本容量或试验次数却往往很大,即有很小的p值和很大的n值。这时二项分布就变成另外一种特殊的分布,即泊松分布。如,显微镜视野内染色体有变异的细胞计数、单位容积的水中细菌数目的分布、作物种子内杂草的分布以及样方内少见植物的个体数等都属于泊松分布。其概率函数可由二项分布的概率函数推导。第24页,此课件共63页哦1、泊松分布概率函数的推导、泊松分布概率函数的推导(将系数的分子分母同乘以(将系数的分子分母同乘以nx)(当(当(当(当n n时,系数的极限为时,系数的极限为时,系数的极限为时,系数的极限为1 1,且,且,且,且n n =)第
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 概率 分布 课件
限制150内