数理统计概率与概率分布.pptx
要点概率基础知识几种常见的理论分布 统计数的分布第1页/共47页事件在自然界中,有许多现象是可以预言在一定条件下是否出现.例如 水在标准大气压条件下,温度加热到100100时肯定沸腾-必然事件(记为U)U)又如 必然事件的反面,种子的发芽率不可能超过100%-100%-不可能事件(记为V)V)再如 小麦播种后可能发芽也可能不发芽,这种在确定条件下可能出现也可不出现的现象-随机事件,简称事件概率基础知识第2页/共47页频率和概率事件A在n次重复试验中发生了m次,则事件A发生的频率为W(A)=m/n事件A发生的概率为P(A)第3页/共47页种子总数种子总数(n)(n)10102020505010010020020050050010001000发芽种子数发芽种子数(m)(m)9 9191947479191186186458458920920种子发芽率种子发芽率(m/n)(m/n)0.90.90.950.950.940.940.910.910.930.930.9180.9180.920.92例 某批玉米种子的发芽试验结果0W(A)10P(A)1第4页/共47页概率的计算事件的相互联系(韦恩图)和事件A+B积事件ABAB互斥事件AB=VAB=V对立事件 A+B=U A+B=U AB=VAB=VABAAABBB第5页/共47页独立事件事件A A的发生与事件B B的发生毫无联系,反之亦然,则称事件A A和时间B B互为独立事件.完全事件系A1+A2+An=UA1+A2+An=UA1A1、A2A2、AnAn两两互斥第6页/共47页概率的计算法则加法定理互斥事件的和事件等于事件A A和B B的概率之和P(A+B)=P(A)+P(B)P(A+B)=P(A)+P(B)A A、B B为对立事件,概率之和为1 1P(A)+P(B)=1 P(B)=P()=1-P(A)P(A)+P(B)=1 P(B)=P()=1-P(A)完全事件系的和事件的概率为1 1P(A1+A2+An)=P(A1)+P(A2)+P(An)=1P(A1+A2+An)=P(A1)+P(A2)+P(An)=1第7页/共47页例调查某玉米田,一惠株占67.2%,双惠株占30.7%空惠占2.1%,试计算一惠株和双惠株的概率。第8页/共47页乘法定理如果事件A A和事件B B为独立事件,则事件A A与事件B B同时发生的概率即它们的积事件等于事件A A和事件B B各自概率的乘积P(AB)=P(A)P(B)P(AB)=P(A)P(B)如果A1A1、A2A2、AnAn彼此独立P(A1A2An)=P(A1)P(A2)P(An)P(A1A2An)=P(A1)P(A2)P(An)对于混合事件P(A+B)=P(A)+P(B)-P(A+B)=P(A)+P(B)-P(A)P(B)第9页/共47页例播种玉米时,每穴播种两粒种子,已知玉米种子的发芽率为90%,试求每穴两粒种子均发芽的概率和一粒种子发芽的概率。第10页/共47页条件概率是指一个事件给定下另一事件发生的可能性:给定事件B发生,事件A发生的概率P(A/B)=例如:P(RedCard给定是一张 Ace)=计算条件概率第11页/共47页概率分布离散随机变量随机变量:是一次试验的结果的数值性描述离散随机变量:q指有限个数值或一系列无穷个数值的随机变量第12页/共47页例值概率01/4=0.2512/4=0.5021/4=0.25事件:抛2个硬币.数是正面的个数TTTT第13页/共47页离散概率分布列出所有可能的 Xi,f(Xi)Xi=随机变量的值(结果)P(Xi)=取这个值的概率q相互排斥(没有重叠)q穷举性(没有漏下)0f(Xi)1f(Xi)=1第14页/共47页离散随机变量的度量数学期望(ExpectedValue)或平均值度量随机变量的中心位置E E(x x)=)=xp xp(x x)方差(Variance)随机变量的取值离均值的变异程度Var(Var(x x)=)=2 2=(x x-)2 2p p(x x)标准差标准差 =(=(x x-)2 2p p(x x)第15页/共47页现有甲、乙两种股票,在未来不同经济状况下的可能报酬率和相应的概率如下:经济状况可能的报酬率(%)状况发生的概率经济过热30-450.1繁荣20-150.2正常10150.3衰退0450.3萧条-10750.1试计算两种股票的预期报酬率和标准差。并比较风险的大小。第16页/共47页即乙股票的报酬率高,风险也高。第17页/共47页重要的离散概率分布离散概率分布Binomial二项分布Hypergeometric超几何分布Poisson泊松分布第18页/共47页BinomialProbabilityDistributions二项分布二项试验的性质o试验由一个包括n次相同的试验的序列组成o每次试验只有两个结果,构成对立事件o成功的概率为p,每次试验都相同o试验都是独立的第19页/共47页BinomialProbabilityDistributions二项分布二项分布函数二项分布函数其中其中 f f(x x)=)=n n 次试验中成功次试验中成功 x x 次的概率次的概率 n n=试验次数试验次数 p p=每次试验中成功的概率每次试验中成功的概率第20页/共47页 例:某车间里共有9台车床,每台车床使用电力是间歇的,平均每小时约有12分钟使用电力。假定车工们使用电力与否是相互独立的,试问在同一时刻有7台或7台以上的车床使用电力的概率为多少?最多有一台使用电力的概率为多少?解:设同一时刻使用电力的车床数为X,则服从二项分布。第21页/共47页例、滨海市保险公司发现索赔要求中有15%是因为被盗而提出的。现在知道1999年中,公司共收到20个索赔要求,试求其中包含7个或7个以上被盗索赔的概率。第22页/共47页BinomialDistributionCharacteristics二项分布的特征n=5p=0.1n=5p=0.5数学期望(均值)标准方差msE Xnpnpp=-()()10.2.4.6012345XP(X).2.4.6012345XP(X)e.g.m m=5(0.1)=0.5e.g.s s=5(0.5)(1-0.5)=1.118 0第23页/共47页PoissonDistribution泊松分布泊松试验的性质:o有很小的p值和很大的n值的二项分布p0.1andnp5o实验独立.第24页/共47页PoissonProbabilityDistributionFunction泊松概率分布函数泊松概率分布函数:其中f(x)=在一个区间发生x次的概率=np=2e=2.71828第25页/共47页PoissonDistributionCharacteristics泊松分布的特征l l=0.5l l=6数学期望标准方差mlsliiNiE XX P X=()()10.2.4.6012345XP(X)0.2.4.60246810XP(X)第26页/共47页HypergeometricProbabilityDistribution超几何分布超几何试验的性质试验由n 次试验组成.每次试验有两个结果,成功和失败.成功的概率为p,每次试验中是变化的.试验不是独立的第27页/共47页HypergeometricProbabilityDistribution超几何概率分布超几何概率分布函数其中f(x)=n次试验中成功x 次的概率n=试验次数N=总体中元素个数r=总体中成功的元素个数第28页/共47页HypergeometricCharacteristics超几何分布的特征数学期望标准方差msE Xn nA N A=()N nN 1有限总体矫正系数ANN2第29页/共47页TheNormalDistribution正态分布钟形对称均值,中位数,众数相等随机变量无限取值Xf(X)m m第30页/共47页TheMathematicalModel数学模型f(X)=随机变量X的分布密度函数p p=3.14159;e=2.71828s s=总体标准方差X=随机变量取值(-X)m m=总体均值 f(X)=1e(-1/2)(X-m)/sm)/s)2第31页/共47页ManyNormalDistributions许多正态分布变动参数s s和m m,我们得到许多不同的正态分布第32页/共47页标准正态分布:当正态分布,时,则称服从标准正态分布,分别用表示概率密度函数和分布函数,即标准化:若,则可以将其标准化。即服从标准正态分布。第33页/共47页例服从标准正态分布,查标准正态分布表求概率。第34页/共47页TheStandardizedNormalDistribution标准正态分布标准正态分布表m m=0ands s=1Z=0.12Z.00.010.0.0000.0040.0080.0398.04380.2.0793.0832.08710.3.0179.0217.0255.0478.020.1.0478Probabilities第35页/共47页StandardizingExample标准化例Zm m=0s sZ=1.12正态分布标准正态分布Xm m=5s s=106.2第36页/共47页Example:P(2.9X7.1)=.1664举例计算P(2.9X7.1)0s s=1-.21Z.21正态分布.1664.0832.0832标准正态分布5s s=102.97.1 X第37页/共47页FindingZValuesforKnownProbabilities已知概率找Z值Z.000.20.0.0000.0040.00800.1.0398.0438.04780.2.0793.0832.0871.1179.1255Zm m=0s s=1.31.1217.010.3标准正态分布表.1217第38页/共47页ShadedAreaExaggeratedZm m=0s s=1.31Xm m=5s s=10?正态分布标准正态分布.1217.1217X8.1=m+=m+Zs s=5+(0.31)(10)=FindingXValuesforKnownProbabilities已知概率找X值第39页/共47页例 意趣玩具厂准备实行计件超产奖,为此需要对生产定额做出新规定。根据以往的记录,可知各个工人每月装配的产品数服从正态分布 。假定车间希望有10%的工人能拿到超产奖,试问工人每月需完成多少件产品才能或得奖金?解:设X为工人每月装配的产品数,设C是能拿到超产奖的工人完成定额。根据题意,有能拿到超产奖的工人完成定额4077件。第40页/共47页 查表求解正态分布的概率:用Excel计算正态分布的概率 插入/fx/fx/统计函数/Normdist/按对话框的提示键入所需变量(Cumulation是逻辑值,true是要求计算累计概率,flase是要求计算概率密度值)。用Excel计算已知累计概率相对应的x 插入/fx/fx/统计/Norminv/按对话框的提示键入所需变量。第41页/共47页ExponentialDistributions指数分布e=2.71828Parrivaltime X()=1-e-l lxl l =到达的均值 X =连续随机变量f(X)Xl l=0.5l l=2.0第42页/共47页TheUniformProbabilityDistribution均匀分布随机变量在一个区间内均匀分布,对应的概率与区间的长度成正比例均匀分别密度函数f(x)=1/(b-a)foraxb=0elsewhere数学期望E(x)=(a+b)/2方差 Var(x)=(b-a)2/12第43页/共47页大数定律大量随机变量的平均数具有统计稳定性的总称。贝努里大数定律:设是次重复独立试验中事件发生的次数,是事件在每次试验中发生的概率,则取任意小数,有即当试验次数足够大时,有事件发生的频率接近于概率。第44页/共47页SessionSummary本讲小结小结我们介绍了一些基本的概率概念然后介绍了贝叶斯定理对随机变量进行了离散和连续的区分介绍了各种离散随机变量及其特征介绍了各种连续随机变量及其特征第45页/共47页TheEndofSession3第46页/共47页感谢您的观看!第47页/共47页