《MATLAB数学手册教程 第4章概率统计.doc》由会员分享,可在线阅读,更多相关《MATLAB数学手册教程 第4章概率统计.doc(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第4章 概率统计本章介绍MATLAB在概率统计中的若干命令和使用格式,这些命令存放于MatlabR12ToolboxStats中。4.1 随机数的产生4.1.1 二项分布的随机数据的产生命令 参数为N,P的二项随机数据函数 binornd格式 R = binornd(N,P) %N、P为二项分布的两个参数,返回服从参数为N、P的二项分布的随机数,N、P大小相同。R = binornd(N,P,m) %m指定随机数的个数,与R同维数。R = binornd(N,P,m,n) %m,n分别表示R的行数和列数例4-1 R=binornd(10,0.5)R = 3 R=binornd(10,0.5,1
2、,6)R = 8 1 3 7 6 4 R=binornd(10,0.5,1,10)R = 6 8 4 6 7 5 3 5 6 2 R=binornd(10,0.5,2,3)R = 7 5 8 6 5 6n = 10:10:60;r1 = binornd(n,1./n)r1 = 2 1 0 1 1 2r2 = binornd(n,1./n,1 6)r2 = 0 1 2 1 3 14.1.2 正态分布的随机数据的产生命令 参数为、的正态分布的随机数据函数 normrnd格式 R = normrnd(MU,SIGMA) %返回均值为MU,标准差为SIGMA的正态分布的随机数据,R可以是向量或矩阵。R
3、 = normrnd(MU,SIGMA,m) %m指定随机数的个数,与R同维数。R = normrnd(MU,SIGMA,m,n) %m,n分别表示R的行数和列数例4-2n1 = normrnd(1:6,1./(1:6)n1 = 2.1650 2.3134 3.0250 4.0879 4.8607 6.2827n2 = normrnd(0,1,1 5)n2 = 0.0591 1.7971 0.2641 0.8717 -1.4462n3 = normrnd(1 2 3;4 5 6,0.1,2,3) %mu为均值矩阵n3 = 0.9299 1.9361 2.9640 4.1246 5.0577 5
4、.9864 R=normrnd(10,0.5,2,3) %mu为10,sigma为0.5的2行3列个正态随机数R = 9.7837 10.0627 9.4268 9.1672 10.1438 10.59554.1.3 常见分布的随机数产生常见分布的随机数的使用格式与上面相同表4-1 随机数产生函数表函数名调用形式注 释Unifrndunifrnd ( A,B,m,n)A,B上均匀分布(连续) 随机数Unidrndunidrnd(N,m,n)均匀分布(离散)随机数Exprndexprnd(Lambda,m,n)参数为Lambda的指数分布随机数Normrndnormrnd(MU,SIGMA,m,
5、n)参数为MU,SIGMA的正态分布随机数chi2rndchi2rnd(N,m,n)自由度为N的卡方分布随机数Trndtrnd(N,m,n)自由度为N的t分布随机数Frndfrnd(N1, N2,m,n)第一自由度为N1,第二自由度为N2的F分布随机数gamrndgamrnd(A, B,m,n)参数为A, B的分布随机数betarndbetarnd(A, B,m,n)参数为A, B的分布随机数lognrndlognrnd(MU, SIGMA,m,n)参数为MU, SIGMA的对数正态分布随机数nbinrndnbinrnd(R, P,m,n)参数为R,P的负二项式分布随机数ncfrndncfrn
6、d(N1, N2, delta,m,n)参数为N1,N2,delta的非中心F分布随机数nctrndnctrnd(N, delta,m,n)参数为N,delta的非中心t分布随机数ncx2rndncx2rnd(N, delta,m,n)参数为N,delta的非中心卡方分布随机数raylrndraylrnd(B,m,n)参数为B的瑞利分布随机数weibrndweibrnd(A, B,m,n)参数为A, B的韦伯分布随机数binorndbinornd(N,P,m,n)参数为N, p的二项分布随机数georndgeornd(P,m,n)参数为 p的几何分布随机数hygerndhygernd(M,K,
7、N,m,n)参数为 M,K,N的超几何分布随机数Poissrndpoissrnd(Lambda,m,n)参数为Lambda的泊松分布随机数4.1.4 通用函数求各分布的随机数据命令 求指定分布的随机数函数 random格式 y = random(name,A1,A2,A3,m,n) %name的取值见表4-2;A1,A2,A3为分布的参数;m,n指定随机数的行和列例4-3 产生12(3行4列)个均值为2,标准差为0.3的正态分布随机数 y=random(norm,2,0.3,3,4)y = 2.3567 2.0524 1.8235 2.0342 1.9887 1.9440 2.6550 2.3
8、200 2.0982 2.2177 1.9591 2.01784.2 随机变量的概率密度计算4.2.1 通用函数计算概率密度函数值命令 通用函数计算概率密度函数值函数 pdf格式 Y=pdf(name,K,A)Y=pdf(name,K,A,B)Y=pdf(name,K,A,B,C)说明 返回在X=K处、参数为A、B、C的概率密度值,对于不同的分布,参数个数是不同;name为分布函数名,其取值如表4-2。表4-2 常见分布函数表name的取值函数说明beta或BetaBeta分布bino或Binomial二项分布chi2或Chisquare卡方分布exp或Exponential指数分布f或FF分
9、布gam或GammaGAMMA分布geo或Geometric几何分布hyge或Hypergeometric超几何分布logn或Lognormal对数正态分布nbin或Negative Binomial负二项式分布ncf或Noncentral F非中心F分布nct或Noncentral t非中心t分布ncx2或Noncentral Chi-square非中心卡方分布norm或Normal正态分布poiss或Poisson泊松分布rayl或Rayleigh瑞利分布t或TT分布unif或Uniform均匀分布unid或Discrete Uniform离散均匀分布weib或WeibullWeibull
10、分布例如二项分布:设一次试验,事件A发生的概率为p,那么,在n次独立重复试验中,事件A恰好发生K次的概率P_K为:P_K=PX=K=pdf(bino,K,n,p)例4-4 计算正态分布N(0,1)的随机变量X在点0.6578的密度函数值。解: pdf(norm,0.6578,0,1)ans = 0.3213例4-5 自由度为8的卡方分布,在点2.18处的密度函数值。解: pdf(chi2,2.18,8)ans = 0.03634.2.2 专用函数计算概率密度函数值命令 二项分布的概率值函数 binopdf格式 binopdf (k, n, p) %等同于, p 每次试验事件A发生的概率;K事件
11、A发生K次;n试验总次数命令 泊松分布的概率值函数 poisspdf格式 poisspdf(k, Lambda) %等同于命令 正态分布的概率值函数 normpdf(K,mu,sigma) %计算参数为=mu,=sigma的正态分布密度函数在K处的值专用函数计算概率密度函数列表如表4-3。表4-3 专用函数计算概率密度函数表函数名调用形式注 释Unifpdfunifpdf (x, a, b)a,b上均匀分布(连续)概率密度在X=x处的函数值unidpdfUnidpdf(x,n)均匀分布(离散)概率密度函数值Exppdfexppdf(x, Lambda)参数为Lambda的指数分布概率密度函数值
12、normpdfnormpdf(x, mu, sigma)参数为mu,sigma的正态分布概率密度函数值chi2pdfchi2pdf(x, n)自由度为n的卡方分布概率密度函数值Tpdftpdf(x, n)自由度为n的t分布概率密度函数值Fpdffpdf(x, n1, n2)第一自由度为n1,第二自由度为n2的F分布概率密度函数值gampdfgampdf(x, a, b)参数为a, b的分布概率密度函数值betapdfbetapdf(x, a, b)参数为a, b的分布概率密度函数值lognpdflognpdf(x, mu, sigma)参数为mu, sigma的对数正态分布概率密度函数值nbi
13、npdfnbinpdf(x, R, P)参数为R,P的负二项式分布概率密度函数值Ncfpdfncfpdf(x, n1, n2, delta)参数为n1,n2,delta的非中心F分布概率密度函数值Nctpdfnctpdf(x, n, delta)参数为n,delta的非中心t分布概率密度函数值ncx2pdfncx2pdf(x, n, delta)参数为n,delta的非中心卡方分布概率密度函数值raylpdfraylpdf(x, b)参数为b的瑞利分布概率密度函数值weibpdfweibpdf(x, a, b)参数为a, b的韦伯分布概率密度函数值binopdfbinopdf(x,n,p)参数
14、为n, p的二项分布的概率密度函数值geopdfgeopdf(x,p)参数为 p的几何分布的概率密度函数值hygepdfhygepdf(x,M,K,N)参数为 M,K,N的超几何分布的概率密度函数值poisspdfpoisspdf(x,Lambda)参数为Lambda的泊松分布的概率密度函数值例4-6 绘制卡方分布密度函数在自由度分别为1、5、15的图形 x=0:0.1:30; y1=chi2pdf(x,1); plot(x,y1,:) hold on y2=chi2pdf(x,5);plot(x,y2,+) y3=chi2pdf(x,15);plot(x,y3,o) axis(0,30,0,
15、0.2) %指定显示的图形区域则图形为图4-1。4.2.3 常见分布的密度函数作图1二项分布图4-1例4-7x = 0:10;y = binopdf(x,10,0.5);plot(x,y,+)2卡方分布例4-8 x = 0:0.2:15;y = chi2pdf(x,4);plot(x,y) 图4-23非中心卡方分布例4-9x = (0:0.1:10);p1 = ncx2pdf(x,4,2);p = chi2pdf(x,4);plot(x,p,-,x,p1,-)4指数分布例4-10x = 0:0.1:10;y = exppdf(x,2);plot(x,y) 图4-35F分布例4-11x = 0:
16、0.01:10;y = fpdf(x,5,3);plot(x,y)6非中心F分布例4-12x = (0.01:0.1:10.01);p1 = ncfpdf(x,5,20,10);p = fpdf(x,5,20);plot(x,p,-,x,p1,-) 图4-47分布例4-13x = gaminv(0.005:0.01:0.995),100,10);y = gampdf(x,100,10);y1 = normpdf(x,1000,100);plot(x,y,-,x,y1,-.)8对数正态分布例4-14x = (10:1000:);y = lognpdf(x,log(20000),1.0);plot
17、(x,y)set(gca,xtick,0 30000 60000 90000 )set(gca,xticklabel,str2mat(0,$30,000,$60,000, $90,000,$120,000) 图4-59负二项分布例4-15x = (0:10);y = nbinpdf(x,3,0.5);plot(x,y,+)10正态分布例4-16 x=-3:0.2:3; y=normpdf(x,0,1); plot(x,y) 图4-611泊松分布例4-17x = 0:15;y = poisspdf(x,5);plot(x,y,+)12瑞利分布例4-18x = 0:0.01:2;p = raylp
18、df(x,0.5);plot(x,p) 图4-713T分布例4-19x = -5:0.1:5;y = tpdf(x,5);z = normpdf(x,0,1);plot(x,y,-,x,z,-.)14威布尔分布例4-20 t=0:0.1:3; y=weibpdf(t,2,2); plot(y) 图4-84.3 随机变量的累积概率值(分布函数值)4.3.1 通用函数计算累积概率值命令 通用函数cdf用来计算随机变量的概率之和(累积概率值)函数 cdf格式 说明 返回以name为分布、随机变量XK的概率之和的累积概率值,name的取值见表4-1 常见分布函数表例4-21 求标准正态分布随机变量X落
19、在区间(-,0.4)内的概率(该值就是概率统计教材中的附表:标准正态数值表)。解: cdf(norm,0.4,0,1)ans = 0.6554例4-22 求自由度为16的卡方分布随机变量落在0,6.91内的概率 cdf(chi2,6.91,16)ans = 0.02504.3.2 专用函数计算累积概率值(随机变量的概率之和)命令 二项分布的累积概率值函数 binocdf格式 binocdf (k, n, p) %n为试验总次数,p为每次试验事件A发生的概率,k为n次试验中事件A发生的次数,该命令返回n次试验中事件A恰好发生k次的概率。命令 正态分布的累积概率值函数 normcdf格式 norm
20、cdf() %返回F(x)=的值,mu、sigma为正态分布的两个参数例4-23 设XN(3, 22)(1)求(2)确定c,使得解(1) p1= p2=p3=p4=则有:p1=normcdf(5,3,2)-normcdf(2,3,2)p1 = 0.5328p2=normcdf(10,3,2)-normcdf(-4,3,2)p2 = 0.9995p3=1-normcdf(2,3,2)-normcdf(-2,3,2)p3 = 0.6853p4=1-normcdf(3,3,2)p4 = 0.5000专用函数计算累积概率值函数列表如表4-4。表4-4 专用函数的累积概率值函数表函数名调用形式注 释un
21、ifcdfunifcdf (x, a, b)a,b上均匀分布(连续)累积分布函数值 F(x)=PXxunidcdfunidcdf(x,n)均匀分布(离散)累积分布函数值 F(x)=PXx expcdfexpcdf(x, Lambda)参数为Lambda的指数分布累积分布函数值 F(x)=PXxnormcdfnormcdf(x, mu, sigma)参数为mu,sigma的正态分布累积分布函数值 F(x)=PXxchi2cdfchi2cdf(x, n)自由度为n的卡方分布累积分布函数值 F(x)=PXxtcdftcdf(x, n)自由度为n的t分布累积分布函数值 F(x)=PXxfcdffcdf
22、(x, n1, n2)第一自由度为n1,第二自由度为n2的F分布累积分布函数值gamcdfgamcdf(x, a, b)参数为a, b的分布累积分布函数值 F(x)=PXxbetacdfbetacdf(x, a, b)参数为a, b的分布累积分布函数值 F(x)=PXxlogncdflogncdf(x, mu, sigma)参数为mu, sigma的对数正态分布累积分布函数值 nbincdfnbincdf(x, R, P)参数为R,P的负二项式分布概累积分布函数值 F(x)=PXxncfcdfncfcdf(x, n1, n2, delta)参数为n1,n2,delta的非中心F分布累积分布函数
23、值 nctcdfnctcdf(x, n, delta)参数为n,delta的非中心t分布累积分布函数值 F(x)=PXxncx2cdfncx2cdf(x, n, delta)参数为n,delta的非中心卡方分布累积分布函数值raylcdfraylcdf(x, b)参数为b的瑞利分布累积分布函数值 F(x)=PXxweibcdfweibcdf(x, a, b)参数为a, b的韦伯分布累积分布函数值 F(x)=PXxbinocdfbinocdf(x,n,p)参数为n, p的二项分布的累积分布函数值 F(x)=PXxgeocdfgeocdf(x,p)参数为 p的几何分布的累积分布函数值 F(x)=P
24、Xxhygecdfhygecdf(x,M,K,N)参数为 M,K,N的超几何分布的累积分布函数值 poisscdfpoisscdf(x,Lambda)参数为Lambda的泊松分布的累积分布函数值 F(x)=PXx说明 累积概率函数就是分布函数F(x)=PXx在x处的值。4.4 随机变量的逆累积分布函数MATLAB中的逆累积分布函数是已知,求x。逆累积分布函数值的计算有两种方法4.4.1 通用函数计算逆累积分布函数值命令 icdf 计算逆累积分布函数格式 说明 返回分布为name,参数为,累积概率值为P的临界值,这里name与前面表4.1相同。如果,则例4-24 在标准正态分布表中,若已知=0.
25、975,求x解: x=icdf(norm,0.975,0,1)x = 1.9600例4-25 在分布表中,若自由度为10,=0.975,求临界值Lambda。解:因为表中给出的值满足,而逆累积分布函数icdf求满足的临界值。所以,这里的取为0.025,即 Lambda=icdf(chi2,0.025,10)Lambda = 3.2470例4-26 在假设检验中,求临界值问题:已知:,查自由度为10的双边界检验t分布临界值lambda=icdf(t,0.025,10)lambda = -2.22814.4.2 专用函数-inv计算逆累积分布函数命令 正态分布逆累积分布函数函数 norminv格式
26、 X=norminv(p,mu,sigma) %p为累积概率值,mu为均值,sigma为标准差,X为临界值,满足:p=PXx。例4-27 设,确定c使得。解:由得,=0.5,所以X=norminv(0.5, 3, 2)X= 3关于常用临界值函数可查下表4-5。表4-5 常用临界值函数表函数名调用形式注 释unifinvx=unifinv (p, a, b)均匀分布(连续)逆累积分布函数(P=PXx,求x)unidinvx=unidinv (p,n)均匀分布(离散)逆累积分布函数,x为临界值expinvx=expinv (p, Lambda)指数分布逆累积分布函数norminvx=Norminv
27、(x,mu,sigma)正态分布逆累积分布函数chi2invx=chi2inv (x, n)卡方分布逆累积分布函数tinvx=tinv (x, n)t分布累积分布函数finvx=finv (x, n1, n2)F分布逆累积分布函数gaminvx=gaminv (x, a, b)分布逆累积分布函数betainvx=betainv (x, a, b)分布逆累积分布函数logninvx=logninv (x, mu, sigma)对数正态分布逆累积分布函数 nbininvx=nbininv (x, R, P)负二项式分布逆累积分布函数ncfinvx=ncfinv (x, n1, n2, delta)
28、非中心F分布逆累积分布函数 nctinvx=nctinv (x, n, delta)非中心t分布逆累积分布函数ncx2invx=ncx2inv (x, n, delta)非中心卡方分布逆累积分布函数raylinvx=raylinv (x, b)瑞利分布逆累积分布函数weibinvx=weibinv (x, a, b)韦伯分布逆累积分布函数binoinvx=binoinv (x,n,p)二项分布的逆累积分布函数geoinvx=geoinv (x,p)几何分布的逆累积分布函数hygeinvx=hygeinv (x,M,K,N)超几何分布的逆累积分布函数 poissinvx=poissinv (x,
29、Lambda)泊松分布的逆累积分布函数例4-28 公共汽车门的高度是按成年男子与车门顶碰头的机会不超过1%设计的。设男子身高X(单位:cm)服从正态分布N(175,36),求车门的最低高度。解:设h为车门高度,X为身高求满足条件的h,即,所以h=norminv(0.99, 175, 6)h = 188.9581例4-29 卡方分布的逆累积分布函数的应用在MATLAB的编辑器下建立M文件如下:n=5; a=0.9; %n为自由度,a为置信水平或累积概率x_a=chi2inv(a,n); %x_a 为临界值x=0:0.1:15; yd_c=chi2pdf(x,n); %计算的概率密度函数值,供绘图
30、用plot(x,yd_c,b), hold on %绘密度函数图形xxf=0:0.1:x_a; yyf=chi2pdf(xxf,n); %计算0,x_a上的密度函数值,供填色用fill(xxf,x_a, yyf,0, g) %填色,其中:点(x_a, 0)使得填色区域封闭图4-9text(x_a*1.01,0.01, num2str(x_a) %标注临界值点text(10,0.10, fontsize16Xchi2(4) %图中标注text(1.5,0.05, fontsize22alpha=0.9 ) %图中标注结果显示如图4-9。4.5 随机变量的数字特征4.5.1 平均值、中值命令 利用
31、mean求算术平均值格式 mean(X) %X为向量,返回X中各元素的平均值mean(A) %A为矩阵,返回A中各列元素的平均值构成的向量mean(A,dim) %在给出的维数内的平均值说明 X为向量时,算术平均值的数学含义是,即样本均值。 例4-30 A=1 3 4 5;2 3 4 6;1 3 1 5A = 1 3 4 5 2 3 4 6 1 3 1 5 mean(A)ans = 1.3333 3.0000 3.0000 5.3333 mean(A,1)ans = 1.3333 3.0000 3.0000 5.3333命令 忽略NaN计算算术平均值格式 nanmean(X) %X为向量,返回
32、X中除NaN外元素的算术平均值。 nanmean(A) %A为矩阵,返回A中各列除NaN外元素的算术平均值向量。例4-31 A=1 2 3;nan 5 2;3 7 nanA = 1 2 3 NaN 5 2 3 7 NaN nanmean(A)ans = 2.0000 4.6667 2.5000命令 利用median计算中值(中位数)格式 median(X) %X为向量,返回X中各元素的中位数。median(A) %A为矩阵,返回A中各列元素的中位数构成的向量。median(A,dim) %求给出的维数内的中位数例4-32 A=1 3 4 5;2 3 4 6;1 3 1 5A = 1 3 4 5
33、 2 3 4 6 1 3 1 5 median(A)ans = 1 3 4 5命令 忽略NaN计算中位数格式 nanmedian(X) %X为向量,返回X中除NaN外元素的中位数。 nanmedian(A) %A为矩阵,返回A中各列除NaN外元素的中位数向量。例4-33 A=1 2 3;nan 5 2;3 7 nanA = 1 2 3 NaN 5 2 3 7 NaN nanmedian(A)ans = 2.0000 5.0000 2.5000 命令 利用geomean计算几何平均数格式 M=geomean(X) %X为向量,返回X中各元素的几何平均数。 M=geomean(A) %A为矩阵,返
34、回A中各列元素的几何平均数构成的向量。说明 几何平均数的数学含义是,其中:样本数据非负,主要用于对数正态分布。例4-34 B=1 3 4 5B = 1 3 4 5 M=geomean(B)M = 2.7832 A=1 3 4 5;2 3 4 6;1 3 1 5A = 1 3 4 5 2 3 4 6 1 3 1 5 M=geomean(A)M = 1.2599 3.0000 2.5198 5.3133命令 利用harmmean求调和平均值格式 M=harmmean(X) %X为向量,返回X中各元素的调和平均值。 M=harmmean(A) %A为矩阵,返回A中各列元素的调和平均值构成的向量。说明
35、 调和平均值的数学含义是,其中:样本数据非0,主要用于严重偏斜分布。例4-35 B=1 3 4 5B = 1 3 4 5 M=harmmean(B)M = 2.2430 A=1 3 4 5;2 3 4 6;1 3 1 5A = 1 3 4 5 2 3 4 6 1 3 1 5 M=harmmean(A)M = 1.2000 3.0000 2.0000 5.29414.5.2 数据比较命令 排序格式 Y=sort(X) %X为向量,返回X按由小到大排序后的向量。 Y=sort(A) %A为矩阵,返回A的各列按由小到大排序后的矩阵。 Y,I=sort(A) % Y为排序的结果,I中元素表示Y中对应元
36、素在A中位置。sort(A,dim) %在给定的维数dim内排序说明 若X为复数,则通过|X|排序。例4-36 A=1 2 3;4 5 2;3 7 0A = 1 2 3 4 5 2 3 7 0 sort(A)ans = 1 2 0 3 5 2 4 7 3 Y,I=sort(A)Y = 1 2 0 3 5 2 4 7 3I = 1 1 3 3 2 2 2 3 1命令 按行方式排序函数 sortrows格式 Y=sortrows(A) %A为矩阵,返回矩阵Y,Y按A的第1列由小到大,以行方式排序后生成的矩阵。 Y=sortrows(A, col) %按指定列col由小到大进行排序 Y,I=sort
37、rows(A, col) % Y为排序的结果,I表示Y中第col列元素在A中位置。说明 若X为复数,则通过|X|的大小排序。例4-37 A=1 2 3;4 5 2;3 7 0A = 1 2 3 4 5 2 3 7 0 sortrows(A)ans = 1 2 3 3 7 0 4 5 2 sortrows(A,1)ans = 1 2 3 3 7 0 4 5 2 sortrows(A,3)ans = 3 7 0 4 5 2 1 2 3 sortrows(A,3 2)ans = 3 7 0 4 5 2 1 2 3 Y,I=sortrows(A,3)Y = 3 7 0 4 5 2 1 2 3I = 3 2 1命令 求最大值与最小值之差函数 range格式 Y=range(X) %X为向量,返回X中的最大值与最小值之差。 Y=range(A) %A为矩阵,返回A中各列元素的最大值与最小值之差。例4-38 A=1 2 3;4 5 2;3 7 0A = 1 2 3 4 5 2 3 7 0 Y=range(A)Y = 3 5 34.5.3 期望命令 计算样本均值函数 mean格式 用法与前面一样例4-39 随机抽取6个滚珠测得直径如下:(直径:mm)14.70 15.21 14.90 14.91 15.32 15.32试求样本平均值解:X=14.70 15.2
限制150内