《第三几种常见的概率分布率.pptx》由会员分享,可在线阅读,更多相关《第三几种常见的概率分布率.pptx(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第1页/共37页 第2页/共37页第3页/共37页第4页/共37页第5页/共37页第6页/共37页第7页/共37页第8页/共37页第9页/共37页第10页/共37页第11页/共37页第12页/共37页第13页/共37页第14页/共37页第15页/共37页2.普阿松分布:-小概率事件(p 0.1)符合普阿松式分布.同样:把样本看作一个整体,则:f(x)=1故:式中任一项出现的概率为:x -平均数 P(x)=e-x!x-第x项为自然数:1,2,3,e-常数=2.7182813.Poisson分布的特征:1).小概率事件.P 0.1.2).n ,越大越好,但事实上不可能,因此,所得的分布是个近似分布
2、.3).=n p 大小适中,恰好为e-.即:与自然数e的负指数为宜.4).样本平均数就是总体平均数.X=.5).平均数等于方差.X=2 6).偏斜度:1=1/n 7).峭度:2=1/4.Poisson 分布的应用:例:麦田内杂草的分布:调查已知每10平方米有一株杂草.问:100平方米有0株,1株,2株,3株10株杂草的概率?第16页/共37页解:100 =10 =1 0株杂草数(x)概率杂草数(x)概率0P(0)=e-10.100/0!=0.0000458P(8)=e-10.108/8!=0.11261P(1)=e-10.101/1!=0.0004509P(9)=e-10.109/9!=0.1
3、2512P(2)=e-10.102/2!=0.002310P(10)=e-10.1010/10!=0.12513P(3)=e-10.103/3!=0.007611P(11)=e-10.1011/11!=0.11374P(4)=e-10.104/4!=0.018912P(12)=e-10.1012/12!=0.09485P(5)=e-10.105/5!=0.037813P(13)=e-10.1013/13!=0.07296P(6)=e-10.106/6!=0.063114P(14)=e-10.1014/14!=0.05217P(7)=e-10.107/7!=0.0901 15P(15)=e-10
4、.1015/15!=0.0835第17页/共37页例:卢瑟福(Rutherford)物理实验:观察在7.5秒时间间隔内放射性物质放射的质粒数到达某指定区域的质点数:X=f x/N=10086/2608=3.8672 3.877.5秒内质点数(x)观察频率(f)f x xP(x)=e .x!N P(x)0570P(0)=e-3.87 3.870/0!=0.020954.50721203203P(0)=e-3.87 3.871/1!=0.0807210.46562283766P(0)=e-3.87 3.872/2!=0.1562407.369635251575P(0)=e-3.87 3.873/3
5、!=0.2015525.512045322128P(0)=e-3.87 3.874/4!=0.1949508.299254082040P(0)=e-3.87 3.875/5!=0.1509393.547262731638P(0)=e-3.87 3.876/6!=0.0973253.75847139973P(0)=e-3.87 3.877/7!=0.0538140.3104845360P(0)=e-3.87 3.878/8!=0.026067.8080927243P(0)=e-3.87 3.879/9!=0.011229.20961016160P(0)=e-3.873.8710/10!=0.00
6、6617.2128N=260810086 1.00002608.0000第18页/共37页五、超几何分布:C x n C n-x N-K P(x)=C n N x-0,1,2,3,n N-总体中的个体数.K-两种类型中某一种类型的个体数.n-非放回式抽样的次数.n k x-在n次抽样中某一种类型的个体数.=N n k(N-K)(N-n)S2=N2(N-1)n k N-群体大小的估计.N=x K-加有标记的个体数.n-第二次抽样抽中的个体数.x-在含有为n的样本中加有标记的个体数.例:某野外实习队用网捕捉到金丝燕100只,做好标记后仍放回大自然,一月后 重新捕捉到500只金丝燕,其中有24只带有
7、标记.问:该山区金丝燕的群体数目?解:K=100 n=500 x=24 n k 100500 .N=x =24 =2083第19页/共37页5.负二项分布:negative binomial distribution P(x)=CK-1x-1 p k q x-k六、核心分布-以某一中心作放射状分布,中央概率 p大,外围概率p逐渐减小的分布,称为核心分布.大小相等的核心分布 可分为两种类型 大小不均等的核心分布 大小均等大小不均等 由于这类分布具有明显的核心,故各核心的边缘,事件成功的概率极小,而位于核心中央,事件成功的概率极大,因此,计算理论分布时,第0项以及第一项以上的概率所采用的公式不一样
8、.第20页/共37页P(0)=e m1(1 e m2)m1.m2.e-m2 mk2P(x)=x k!.P(x-k-1)式中:X2 S2-X m1=S2-X m2=Xx-第x项k-第x-1项n-总项数(即实验次数)例:茶葶子属植物在林地上的分布:第21页/共37页每样点中植株数(x)实际样点数(f)f x理论概率P(0)或:P(x)理论分布调整前 调整后04300.5330.53342.6442.64115150.3090.202424.7216.19228160.27750.134522.210.7636180.20240.084316.1926.74443120.13450.050310.7
9、64.02454200.08430.02886.7442.3046160.05030.01784.0241.42480871.5911.0511127.2884.088X=87/80=1.0875 S2=2.41m1=(1.0875)2/(2.41-1.0875)=0.8943 m2=(2.41-1.0875)/1.0875=1.2161第22页/共37页第一项:P(0)=e m1(1 e m2)=2.7183-0.8943(1-2.7183-1.2161)=0.533第二项:m1.m2.e-m2 mk2 P(x)=x k!=(0.89431.21612.7183-1.2161)1(1.216
10、1)0/0!p0 =0.3090第三项:m1.m2.e-m2 mk2 P(x)=x k!m1.m2.e-m2 mk2 m12 =x 0!1!=0.5797/2(1/10.3090+1.2161/10.533)=0.2775第四项:=0.2024 第七项:=0.0503第五项:=0.1345 第八项:=0.0288第六项:=0.0843 第九项:=0.0178注意:第二项和第三项的和约等于第一项,故从总体分布中减去这两项.P(x-k-1).P(x-k-1).P1+.P0 第23页/共37页七.正态分布(常态分布,高斯分布)normal distribution1).高斯公式(高斯定理)设:空间二
11、维单连通区域v的边界曲面是光滑的,则函数P(x,y,z);Q(x,y,z);R(x,y,z)在v及s上具有关于x,y,z的连续偏导数:P Q R x y z =P c o s(n,x)+Q c o s(n,y)+R c o s(n,z)d s =P d y d z +Q d z d x +R d x d y(+)d x d y d zVSS 这个公式具有立体感,意思是:P Q R函数的累计积分为V的空间区域.zyxn s2n s1Z=z2(x,y)Z=z1(x,y)第24页/共37页 既然一个空间是各个位点函数的累计积分,那么,一个曲面也必然是各个微分区间函数的积分.即:S S1+S2+S3+
12、.S x 则:S=-(函数)xSS1S2S3S x第25页/共37页第26页/共37页3).标准正态分布 a.平均数与正态分布的关系:000b.标准差与正态分布的关系:(的负正与x轴的左右摆动)0标准差越小,曲线越陡,数据越集中标准差越大,曲线越平坦,数据越分散第27页/共37页定义:当=0 =1 时的正态分布称为标准正态分布.代入公式:1 1 则:()=21 e-(-0)2/212=2.e-2/2 (=0,=1)表示 变量区间范围内事件发生的概率.而整个u分布的概率为:1 (u)=2 u-e-u2/2 d u 4).正态分布的性质:a.在=0 时,分布函数 ()值最大.b.不论是向正方远离或
13、是向负方远离,e 的指数都变成一个绝对值愈来愈大 的负数因此,()减小 c.曲线纵坐标两侧对称 ()=(-)d.曲线在=-1=1 处有两个拐点.e.曲线和横坐标轴所夹的面积是1.f.分布函数曲线旋转180度仍然对称 g.u=-1 到+1 面积=0.6827 u=-2 到+2 面积=0.9543 u=-3 到+3 面积=0.9973 u=-1.96到+1.96 面积=0.95 u=-2.576到+2.576 面积=0.99第28页/共37页X1=68.27%X1.96=95%X2.576=99%h.1=0 2=0例:高粱”三尺三”的株高服成正态分布N(X=156.2,=4.82).求:1).X1
14、64厘米的概率.3).X在152厘米到162厘米之间的概率.第29页/共37页 x-161-156.2解:1).U=4.82 =1 P(x164)=1-(u)=1-(1.62)=1-0.94738=0.05262 162-156.2 152-156.2 3).U1=4.82 =1.20 U2=4.82 =-0.87 P(152x162)=(U1)-(U2)=(1.2)-(-0.87)=0.88493-0.19215 =0.69278第30页/共37页例:140行水稻产量的正态分布:组限中值(x)次数(f)区间概率PN67.5-82.5752(-2.07)-(-2.48)0.012661.764
15、82.5-97.5907(-1.66)-(-2.07)0.029234.10297.5-112.51057(-1.25)-(-1.66)0.057197.994112.5-127.512013(-0.84)-(-1.25)0.0948113.286127.5-142.513517(-0.42)-(-0.84)0.1367819.138142.5-157.515020 0.158822.232157.5-172.516525 0.159422.316172.5-187.518021 0.135618.984187.5-202.519513 0.097813.692202.5-217.52109
16、0.06078.498217.5-232.52253 0.03034.242232.5-247.52402 0.01331.862247.5-262.525551 0.00480.672140 0.9913138.782第31页/共37页 f x 22110 X=N =140 =157.93(g)f x2-(f x)2/N 3676500-(22110)2/140=N-1 =140-1 36.4(g)X u x-157.93U=36.4 然后查表,计算区间概率。5).正态分布的单侧分位数:注意:检查资料是否符合正态分布,只要检查三个数据:1.X1 是否占样本频率的68.27%.2.X2 是否占
17、样本频率的95.43%.X3 是否占样本频率的99.738%.(如:上例:X1=70.71%X2=95.71%X3=100%)第32页/共37页八.指数分布(exponential distribution)F(x)=1 e-x/特性:E(x)=1=2 2=6第33页/共37页九样本统计量的分布样本平均数的分布设:x =x=n 称为标准误(standard error of mean)当总体标准差已知时:x-U=/n当总体标准差未知时:x-t=s/n (df=n-1)第34页/共37页十t分布(学生式分布1808 w.s.Gosset首先提出)t=(x-)/sx式中:x 样本平均数理论平均数sx=s/n 样本标准误s2/n=s2/n (x-x)2 (x-x)2 =n-1 =n(n-1)n第35页/共37页t分布与t值 2 (r-1)/2!1 Y c=.(r-2)/2!.(1+t2/r)(r+1)/2式中:Y c对应于t值的概率.t t值.自由度:单个样本=n-1.k个等大的样本=k(n-1)以上的计算已列成表格,应用时可根据需要由t值,自由度查概率;也可以由概率,自由度查t值.第36页/共37页感谢您的观看!第37页/共37页
限制150内