几种常见的概率分布律.ppt
第三章 几种常见的概率分布律离散型变量离散型变量连续型变量连续型变量二项分布二项分布泊松分布泊松分布超几何分布负二项分布指数分布正态分布正态分布第一节第一节 二项分布二项分布(Binomial Distribution)1.贝努利试验和在什么情形下应用二项分布贝努利贝努利试验试验(Bernoulli trial):试验只有两种可能的结果,并且发生每种结果的概率是一定的。例如:抛一枚硬币,看得到正面还是反面;掷一次骰子,看得到6还是没有得到6;随机抽查一名婴儿的性别,看是男是女 在贝努利试验里,两种结果可分别称为“成功成功”和和“失败失败”,或者“事件A发生”和“事件A没有发生”。什什么么情情形形时时应应用用二二项项分分布布:实验中进行了n次独立的贝努利试验,统计在这n次试验中总共获得了多少次“成功”。“成功”的次数,记为变量Y;Y称为二项分布变量,Y的概率分布称为二项分布。(1)连续抛硬币100次,统计总共出现正面的次数。次数Y服从二项分布。Y的可能取值为0,1,2,n。所以Y是个离散型变量。二项分布变量的一些例子:二项分布变量的一些例子:(2)调查250名新生婴儿的性别,记男婴的总数为Y,则Y服从二项分布。(3)调查n枚种蛋的出雏数,出雏数Y服从二项分布。(4)n头病畜治疗后的治愈数Y,Y服从二项分布。(5)n尾鱼苗的成活数Y,Y服从二项分布。2.二项分布的常用符号3.二项分布的概率函数P(y)v怎样得到P(y)?以以n4,y2为例,欲求为例,欲求P(y2)?。每种方式发生的概率为:其它5种方式发生的概率也是如此。例一,纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子二代中白猪与黑猪的比率为3:1。求窝产仔10头,有7头白猪的概率。所以,窝产仔10头,有7头白猪的概率是0.2503。例二,有一批玉米种子,出苗率为0.67。现任取6粒种子种1穴中,问这穴至少有1粒种子出苗的概率是多少?这说明每穴种6粒种子,几乎肯定出苗。4 二项分布的概率分布表和概率分布图除以P(y)表示,二项分布也可通过表或图来直观显示。YP(y)00.06210.25020.37530.25040.062例如,抛硬币4次,获得的正面数记为Y,则Y服从二项分布。Y的概率分布表为Y的概率分布图为注意:5 二项分布变量的平均数和标准差v平均数v方差和标准差例三,某树种幼苗成材率为70,现种植2000株,问成材幼苗数的平均值和标准差是多少?二项分布(实例)【例例】已知100件产品中有5件次品,现从中任取一件,有放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的概率 解解:设 Y 为所抽取的3件产品中的次品数,则根据二项分布公式有 二项分布的程序计算方法v二项分布函数Binomdist(k,n,p,false/true)v某数阶乘的计算函数Factv从给定元素数目m的集合中抽取若干n元素的排列组合数 计算函数Combin(m,n)第二节第二节 泊松分布泊松分布(Poisson Distribution)1.在什么情形下应用泊松分布泊松分布是一种用来描述一定的空间或时间里稀有事件发生次一定的空间或时间里稀有事件发生次数数的概率分布。服从泊松分布的变量的一些例子:一定畜群中某中患病率很低的非传染性疾病患病数或死亡数。畜群中遗传的畸形怪胎数单位空间内某些野生动物或昆虫数每升饮水中的大肠杆菌数2.泊松分布的概率函数与特征数泊松分布变量Y只取零和正整数:0,1,2,其概率函数为v泊松分布的平均数v泊松分布的方差和标准差例一,显微镜下观察一种悬浮液中的某种颗粒,据前人报告,平均每张样片可以观察到3个微粒,问在一次观察中看到3个微粒的概率是多大?少于3个微粒的概率是多少?若观察100张片子,大约有多少张片子看到的微粒数少于3个?程序计算vPoisson(y,true or false)超几何分布v适用范围:多次完全相同并且相互独立的重复试验,如果在有限总体中不重复抽样,抽样成功的次数Y的概率分布服从超几何分布,如福利彩票v数学期望与方差v计算程序:P(Y)=hypgeomdist(y,n,M,N)例子v四川卧龙大熊猫自然保护区共有野生大熊猫100只,其中10只做了标记。某小组去调查研究大熊猫的生活习性,随机观察了15只大熊猫,问这15只大熊猫中有5只做了标记的概率?v解:依题意有N=100,M=10,n=15,y=5,求p(5)vp(5)=hypgeomdist(y,n,M,N)=hypgeomdist(5,15,10,100)=0.00569第三节第三节 正态分布正态分布(Normal Distribution)正态分布是一种最重要的连续型变量的概率分布。在生物科学研究里,有许多变量是服从或近似服从正态分布的,如水稻产量、小麦株高、玉米百粒重等;许多统计分析方法是以正态分布为基础的。不少随机变量的概率分布在样本容量增大时趋于正态分布。因此,在统计学里,正态分布无论在理论研究上还是在实际应用中均占有重要的地位。1 正态分布的定义与主要特征v定义:若变量Y的概率分布的密度函数为f(y)的曲线为Y的分布函数没有更简化的形式v正态分布曲线的主要特征:(1)曲线是单峰、对称的“悬钟”形曲线,对称轴是x=(2)曲线是非负函数,以x轴为渐近线,分布从到(3)曲线在x=处各有一个拐点,即在-,+范围内是上凸,其余是下凸。(4)曲线有两个参数:和。代表平均数,代表标准差,和一起决定曲线的位置和形状。越大,则曲线沿x轴越向右移动;反之向左。是变异度参数,愈大则曲线愈“胖”;反之则愈瘦。(5)曲线下和x轴所夹的总面积为1=0.5=1=22 标准正态分布v定义:=0,=1时的正态分布称为标准正态分布。标准正态分布变量记为U,写作 UN(0,1)。3 标准正态分布的概率计算v查表法:附表2(325页)列出了标准正态变量的累积分布函数值,即U小于某个值u的概率:P(Uu)关系式:定理:4 一般正态分布的概率计算通过如下定理,将一般正态分布变量转化成标准正态分布变量来求。关于一般的正态分布,以下的一些概率经常用到:变量Y落在的不同倍数区间的概率。这些结论可以用一个实例来印证:以第一章里的120头母羊的体重资料为例:由表可见,实际频率与理论概率相当接近,说明120头基础母羊体重资料的频率分布接近正态分布,从而可推断基础母羊体重这一随机变量很可能是服从正态分布的。5 正态分布的单侧、双侧临界值(分位数)附表2列出了概率的数值,即对于给定的u,列出了曲线下u左边的面积。在以后的统计推断中,我们经常需要做与上面相反的工作:即已知曲线下右侧尾区的一定面积,求对应的临界值u 注意:这些临界值在第五章假设检验时经常用到