56 节 概率论与数理统计.ppt
《56 节 概率论与数理统计.ppt》由会员分享,可在线阅读,更多相关《56 节 概率论与数理统计.ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、5.6节节 概率论与数理统计概率论与数理统计一一 各种统计分布函数各种统计分布函数表5-6-1中列出了20种分布函数,统计工具箱提供了包括分布函数cdf(Cumulattive Distribution Function)、概率密度函数pdf(Probability Distribution Function)、分布函数的逆函数inv(Inverse Cumulattive Distribution Function)以及这些分布的理论统计特性(均值和方差)计算函数stat。表5-6-1 MATLAB中表示各种概率分布的前缀文字连续(数据)连续(统计量)离散(数据)贝塔分布(beta)2分布(
2、Chi2)二项式分布(bino).指数分布(exp)非中心2分布(ncx2)离散均匀分布(unid)-分布(gam)F-分布(f).几何分布(geo).对数正态分布(logn)非中心F-分布(ncf)超几何分布(hyge)正态分布(norm)T-分布(t).负二项式分布(nbin)瑞利分布(rayl)非中心T分布-(nct)泊松分布(poiss)均匀分布(unif)韦伯.分布(weib)表5-6-1的使用方法把表中不同分布后面括号中的文字作为前缀,把所需计算的特性作为后缀,就可以组合成一个函数。例如离散类的二项式分布有binopdf,binocdf,binoinv,binostat四个函数,连
3、续类数据的标准正态分布有normpdf,normcdf,norminv,normstat四个函数,连续类统计量的2分布有chi2pdf,chi2cdf,chi2inv,chi2stat四个函数,等等,20种分布就有80个函数。由于各种分布函数的解析形式都是已知的,这些子程序的编写并不困难。【例5-6-1】概率分布曲线的绘制【例5-6-1】(a)求标准正态分布N(0,1),自由度V=10的2分布和N=10,p=0.2的二项式分布B(10,0.2)的分布函数,并画出其概率密度曲线和分布曲线;(b)。求出分布函数为0.05和0.95处的随机变量值;(c)。求出这几个分布的均值和方差。解:分别键入he
4、lp normpdf,help binopdf,help chi2pdf 以了解它们的用法,特别是了解输入变元的意义,得知:f=normpdf(x,mu,sigma)其中x为随机变量数组,mu为均值,sigma为标准差。f=chi2pdf(x,V)其中x为随机变量数组,V为自由度数(整数),f=binopdf(x,N,p)其中x为随机变量整数数组,N为次数,0p1为成功概率概率分布参数的选择题目中给出的变元参数应足以用来调用这些概率密度函数,只有随机变量x的取值及范围,需要事先对该分布的特性有所了解。首先要弄清它是离散量还是连续量,其次要取适当的范围。范围取小了不能显示分布的全局,取大了又可能
5、显示不出细节。正确的取法应该使该范围内分布函数F(x)的左边界值略小于0.025,右边界值略大于0.975,这就可以基本涵盖随机变量以概率95%存在的主要区域,又不致涉及关系不大的区域。初学者往往要作几次试探才能做到。好在在计算机上改几个参数、作几次试探是很简便的事。绘制概率分布函数的程序exn561x1=-3:0.1:3;%标准正态随机变量取值范围f1=normpdf(x1,0,1);%标准正态分布的概率密度函数F1=normcdf(x1,0,1);%标准正态分布的分布函数subplot(2,2,1),plot(x1,f1,:,x1,F1,-),grid on%绘曲线line(-4,4,0.
6、025,0.025),line(-4,4,0.975,0.975)%画横线x2=0:0.1:20;%试探得出的范围f2=chi2pdf(x2,10);%2分布的概率密度函数F2=chi2cdf(x2,10);%2分布的分布函数subplot(2,2,2),plot(x2,f2,:,x2,F2,-),grid on%绘曲线line(0,20,0.025,0.025),line(0,20,0.975,0.975)%画横线);.运行程序得出图5-40,其中实线是分布函数的曲线,虚线则是密度函数的曲线。上下两根横线分别为0.975和0.025,三种分布的概率密度和分布曲线 对分布函数图形的改进第三个子
7、图中,随机变量是离散取值的,在两个相邻的取值点之间的概率不会变化,所以它的分布函数表现为阶梯形。密度函数是分布函数的导数,所以在阶梯突变处导数为无穷大,宽度又为无穷小,面积等于阶梯的高度,通常用一个脉冲表示。脉冲的高度表示它所包含的面积,也就等于阶梯波形的高度。而plot函数画图是把各离散点之间用直线联接,所得的曲线是不对的。应该要用stairs命令画阶梯图,用stem命令画脉冲图。改正后的程序如下:subplot(2,2,4),stairs(x3,F3,-),stem(x3,f3,:),图中第四子图给出了改正后的结果,可见其概率密度函数是离散的脉冲。从中还可以判断,x3的取值范围不必为0:1
8、0,取0:5就够了。另外,第二子图上的密度函数波形太小,如果对f和F取不同的纵坐标,那样可以得出更好的图形。分布函数逆函数的用途(b)给定分布函数F=(1)求出的x,简称下分位点,习惯上用表示。这和已知x求cdf恰好是逆函数的关系,即输入变元与输出变元恰好调换了位置,对正态分布情况,逆函数norminv的调用格式为X=NORMINV(F,MU,SIGMA)其中F为给定的分布函数值,而X为对应的随机变量边界值。题目中给定了的两个边界值Fb=0.05,0.95,即求对应的随机变量x的边界值xb。,随机变量在上下两个边界值xb(即/2,1-/2)之间取值的置信度等于1-,其他参数与normpdf和n
9、ormcdf中的相同。对于其他分布,可依此类推,不再赘述。用逆函数求上下分位点将边界值Fb作为输入变元,可求得相应的分位点。:alpha=0.1;%取双边90%的置信区间Fb=alpha/2,1-alpha/2%输入变元%三种分布的双侧分位点lambda1=norminv(Fb,0,1)lambda2=chi2inv(Fb,10)lambda3=binoinv(Fb,10,0.2)程序运行后得到lambda1=-1.6449 1.6449lambda2=3.9403 18.3070lambda3=0 4这就是三种分布函数下的双边90%置信区间改变alpha的值,可得到各种不同置信度下的置信区间
10、。各种分布理论统计特性的计算(c)。对以上3种分布,MATLAB还给出了它们的理论统计参数,即理论均值Mu和方差值var的计算方法,所用的命令为stat。例如:Mu1,var1=normstat(0,1)Mu2,var2=chi2stat(10)Mu3,var3=binostat(10,.2)运行结果为:Mu1=0,var1=1Mu2=10,var2=20Mu3=2,var3=1.6000本题虽然只给出了3种分布的计算,这些概念和方法可以类推到表5-6-1中20种分布的理论计算中。概率分布演示工具disttool 键入disttool就会出现一个图形界面(右图),其中有分布曲线,周围有各种参数
11、和类型的选择窗。可以很方便地用鼠标操作改变参数和选择类型,得到相应的曲线。二二 随机样本数据的生成随机样本数据的生成stats工具箱同时也提供了这20种分布的随机数生成程序rnd。均匀分布随机数的计算机生成本身就是一个研究了几十年的专题,其他分布的随机数通常又由均匀分布随机数进行变换而得。本书将不讨论它们的编程,只着重于它们的应用。下面的例子将说明这类函数的调用方法。【例5-6-2】按例5-6-1的三种分布,分别生成10000个随机数,画出它们的直方图(分布图),并计算各自的数学期望和方差。随机数生成及其直方图绘制各种分布的随机数生成函数名为rnd。其中表示分布类型的前缀由表5-6-1给出。绘
12、制统计数据Y直方图的命令为hist(Y,N),其中N为直方图的分区数目,其缺省值为10。例如:Y1=normrnd(0,1,1,10000);subplot(2,2,1),hist(Y1,50)Y2=chi2rnd(10,1,10000);subplot(2,2,2),hist(Y2,50)Y3=binornd(10,0.2,1,10000);subplot(2,2,3),hist(Y3,50)subplot(2,2,4),hist(Y3,8)得出的图5-42。三种分布的随机数统计分布图 实际统计参数的计算其中第三个分图的直方图各条宽度不均匀,这是由于二项式分布是离散数据,它的取值最大只可能到
13、10。在目前实际数据中,最大只到8。因此,可改用以下的命令:subplot(2,2,4),hist(Y3,8)得到符合一般直方图要求的第四个分图。把这些图与图5-40中的密度分布曲线相比,可见是非常相似的。实际随机变量的样本均值Xbar,样本的标准差sigma和样本方差s2(标准差的平方)可用以下命令计算Xbar1=mean(Y1),sigma1=std(Y1),s21=var(Y1)得出Xbar1=0.0246,sigma1=1.0059,s21=1.0119Xbar2=mean(Y2),sigma2=std(Y2),s22=var(Y2)得出Xbar2=9.9947,sigma2=4.44
14、53,s22=19.7605Xbar3=mean(Y3),sigma3=std(Y3),s23=var(Y3)得出Xbar3=1.9745,sigma3=1.2520,s23=1.5676演示工具randtool生成的图形界面 键入randtool也会出现一个图形界面,如右图。其中有实际生成的随机数样本分布的曲线,周围有各种参数和类型的选择窗。可以方便地用鼠标和键盘改变参数,得到相应的曲线。三三 用样本推断总体的统计量用样本推断总体的统计量 由实际样本值算出的统计量与例5-6-1中的理论值之间存在误差,而且样本统计量也是随机量。计算机每运行一次,所得到一组观察值Yi的统计量也会不同。它们也有各
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 56 概率论与数理统计 概率论 数理统计
限制150内