MATLAB在概率统计中的应用.pdf
《MATLAB在概率统计中的应用.pdf》由会员分享,可在线阅读,更多相关《MATLAB在概率统计中的应用.pdf(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、MATLABMATLABMATLABMATLAB 在概率统计中的应用在概率统计中的应用在概率统计中的应用在概率统计中的应用目录一 概率部分1.随机变量概率分布的概率计算以及数字特征21.1 随机变量概率分布的概率计算21.2 随机变量概率分布的数字特征7二 统计部分2数理统计的基础概念103.参数估计 114.假设检验165.一元线性回归分析 271随机变量概率分布的概率计算以及数字特征1.1随机变量概率分布的概率计算在 MATLAB 中列举了多种常见的概率分布,给出了这些概率分布的分布密度函数、分布函数、逆分布函数、随机数发生函数等等,在这一节中,主要研究的是常见概率分布的数字特征(数学期望
2、,方差,协方差以及相关系数)和一些概率的计算MATLAB 中列举的离散型随机变量包括:离散均匀分布、二项分布、泊松分布、几何分布、超几何分布、负二项分布(Pascal 分布):连续型随机变量包括:连续均匀分布、指数分布、正态分布、对数正态分布、2分布、非中心2分布、t分布、非中心t分布、F分布、非中心F分布、分布、分布、Rayleigh 分布、Weibull 分布。下表是对这 20 种分布中的常见分布在 Matlab 中的应用的总结表一常见分布的密度函数在x处的值分布类型名称函数名称函数调用格式备注正态分布normpdfp=normpdf(X,MU,SIGMA)计算正态分布),(2N的密度函数
3、在x处的值,其中参数 SIGMA 是,MU 是二项分布binopdfp=binopdf(x,n,p)均匀分布unifpdfp=unifpdf(x,a,b)计算均匀分布,baU的密度函数在x处的值几何分布geopdfp=geopdf(a,p)超 几 何 分布hygepdfp=hygepdf(x,m,k,n)指数分布exppdfp=exppdf(x,)计算指数分布的密度函数在x处的值泊松分布poisspdfp=poisspdf(x,)t分布tpdfp=tpdf(x,n)计算t分布的密度函数在x处的2分布chi2pdfp=chi2pdf(x,n)计算2分布的密度函数在x处的值F分布fpdfp=fpd
4、f(x,n1,n2)计算F分布的密度函数在x处的值表二运用 matlab 计算常见分布的分布函数分布类型名称函数名称函数调用格式以及意义备注正态分布normcdfp=normcdf(x,mu,sigma)计算服从正态分布的随机变量落在,(x的概率,其中 mu 是参数,sigma 是参数若),(2NX,计算xXP可用p1=normcdf(x,mu,sigma)p=1-p1若),(2NX,计算xXPx21可用p1=normcdf(x1,mu,sigma)1p2=normcdf(x2,mu,sigma)1p=p2-p11或者 p=normspec(x1x2,mu,sigma)二项分布binocdfp
5、=binocdf(x,n,p)计算服从二项分布的随机变量落在,(x的概率若求)(xP则 p=1-binocdf(x,n,p)若求)(xP则 p=1-binocdf(x-1,n,p)均匀分布unifcdfY=unifcdf(x,a,b计算服从均匀分布的随机变量落在,(x的概率若,baUX,计算xXP可用p1=unifcdf(x,a,b)p=1-p1若,baUX,计算xXPx21可用p1=normcdf(x1,a,b)p2=normcdf(x2,a,b)p=p2-p1几何分布geocdfp=geocdf(a,p)计算服从几何分布的随机变量落在,(x的概率若求)(xP则 p=1-geocdf(k,p
6、)若求)(xP则 p=1-geocdf(k-1,p)超 几 何 分布hygecdfp=hygecdf(x,m,k,n)计算服从超几何分布的随机变量落在,(x的概率若求)(xP则 p=1-hygecdf(x,m,k,n)若求)(xP则 p=1-hygecdf(x,m,k,n)指数分布expcdfY=expcdf(x,)计算服从指数分布的随机变量落在,(x的概率若 X 服从参数为的指数分布,计算xXP可用p1=unifcdf(x,)p=1-p1若 X 服从参数为的指数分布,计算xXPx21可用p1=normcdf(x1,)p2=normcdf(x2,)p=p2-p1泊松分布poisscdfp=po
7、isscdf(x,)计算服从泊松分布的随机变量落在,(x的概率若求)(xP则 p=1-poisscdf(x,m,k,n)若求)(xP则 p=1-poisscdf(x,m,k,n)t分布tcdfY=tcdf(x,n)计算服从t分布的随机变量落在,(x的概率若 X服从自由度为 n的 t 分布,计算xXP可用p1=chi2cdf(x,n)p=1-p1若 X 服从自由度为 n 的 t 分布,计算xXPx21可用p1=chi2cdf(x,n)p=1-p1若 X 服从自由度为 n 的2分布,计算xXPx21可用p1=fcdf(x,n),p=1-p1若 X 服从自由度为(n1,n2)的 F 分布,计算Px1
8、X p=normpdf(2,3,1.5)p=0.2130所以X的密度函数在x=2 是的值是 0.2130(2)令 p1=1 p1=normcdf(1,3,1.5)结果:p1=0.0912令 p2=31 p=normcdf(1,3,1.5);q=normcdf(3,3,1.5);p2=q-p结果:p2=0.4088方法二:p2=normspec(1,3,3,1.5)结果:p2=0.40879Critical Value 即临界值Density 即密度图中蓝色部分表示随机变量)5.1,3(2NX,变量X在1.5,3的概率为 0.48079由蓝色曲线与横轴围成的部分的概率为 1令 p3=24xP,因
9、此 p3=241xP=621xPp3=1-normcdf(6,3,1.5)+normcdf(2,3,1.5)结果:p3=0.2752或者 p3=1-normspec(2,6,3,1.5)结果:p3=0.2752例 2:生产某种产品的废品率为 0.1,抽取 20 件产品,初步检查已发现有 2 件废品,问这20 件中,废品不少于 3 件的概率。4解:设抽取 20 件产品中废品的个数为,则)1.0,20(B,由于初步检查已发现有 2 件废品,说明已知 20 件产品中废品数2,因此是求在给定2的条件概率于是2322,32|3=PPPPP令 P=2|3P p=(1-binocdf(3,20,0.1)/(
10、1-binocdf(2,20,0.1)结果:p=0.4115例 3:某人进行射击试验,假定在 300 米处向目标射击的命中率为 0.02,现独立射击 500次,问至少命中 3 发的概率是多少?4解:将每次射击视为一次试验 E,500 次射击相当于作 500 重 Bernouli 试验 E500.用表示E500 击 中 目 标 的 次 数,依 题 意,服 从 参 数 为 n=500,p=0.02 的 二 项 分 布)02.0,500,(xb,于是,所求概率为)2()1()0(1)2(1)3(=PPPPP由于 n 足够大,p 足够小,所以可以用泊松分布近似,10,500,02.0=npnp在 ma
11、tlab 中的实现程序为:p=1-poisspdf(0,10)-poisspdf(1,10)-poisspdf(2,10)结果:p=0.9972所以)3(P0.9972例 4:修理某机器所需时间(单位:小时)服从参数=0.5 指数分布,试求(1)修理时间超过 2 小时的概率是多少?(2)若已经持续修理了 9 小时,问还需要至少一小时才能修好的概率是多少?4解:(1)表示修理时间,服从参数=0.5 指数分布,实际是求212=Pp程序如下:p=1-expcdf(2,0.5)结果:p=0.0183(3)由指数分布的无记忆性可知)1(1)1()9|91(=+PPP程序如下:p=1-expcdf(1,0
12、.5)结果:p=0.1353例 5:设随机变量服从5,0U上均匀分布,问方程,02442=+xx有两个不同的实数根的概率是多少?解:,02442=+xx有两个不同的实数根,则(),0216162+=则1P(有两个不同的实数根)=p(1)=1+p(1 p=1+unifcdf(-1,0,5)-unifcdf(2,0,5)结果:p=0.6000所以有两个不同实数根的概率是 0.61.2随机变量概率分布的数字特征随机变量的分布函数完整地描述了随机变量的统计特征,但在实际问题中,常常不容易求出分布函数,而许多时候只是需要知道它的某些特征就足够了,例如期望,方差,协方差以及分位数等,在 MATLAB6.5
13、 的工具箱中提供了求 20 种分布的数字特征的函数,以下是对本科中常见的 10 中分布进行归纳总结以及对 MATLAB 程序的纠正,对于求一般的概率分布期望与方差则用其定义进行求解表一:常见 10 种分布的数学期望与方差分布类型名称函数名称函数调用格式备注正态分布normstatM,V=normstat(MU,SIGMA)(1)M 是期望,V 是方差2,不是标准方差,指数分布的期望为-1,方差为-2,在 MATLAB 中的 expstate.m 的程序中有错误:应将 m=mu,v=mu.2 改为v=mu.-2;这里的 m 表示期望,v 表示方差,mu 表示参数(2)如果变量i,ni,.,3,2
14、,1=相互独立则=niiniiEE11,=niiniiDD11=niiniiEE11(3)如果只是单独求期望或者方差,下面举例说明:二项分布binostatM,V=binostat(n,p)均匀分布unifstatM,V=unifstat(a,b)几何分布geostatM,V=geostat(p)超 几 何 分布hygestathygestat(m,k,n)指数分布expstatM,V=expstat()泊松分布poisstatp=poisstat()t分布tstatM,V=tstat(n)2分布chi2statM V=chi2stat(5)求正态分布的均值:M=normstat(MU,SIG
15、MA)求正态分布的方差:V=normstat(MU,SIGMA)对于其他分布调用格式类似F分布fstatp=fstat(n1,n2)例 3:计算服从均匀分布4,2U的方差与期望在 MATLAB 中实现为:M,V=unifstat(2,4)结果:M=3,V=0.3333例 4:计算服从参数=0.5 的指数分布的方差与期望 M,V=expstat(0.5)结果:M=2,V=4例 5:设随机变量();9,4;1,1(,rN,求)12(+E解:由边缘分布可知)4,1(N,)9,1(N12)12(+=+EEEM1=normstat(1,2);M2=normstat(1,3);E=M1-2*M2+1结果
16、E=0例 6:设随机变量服从区间21,21上均匀分布,求=的数学期望解:因为服从区间21,21上均匀分布,所以服从区间2,2上均匀分布,所以 M=unifstat(-pi/2,pi/2)结果 M=0,所以=的数学期望是 0表二:常见 10 种分布的 p 分位数分布类型名称函数名称函数调用格式正态分布norminvxp=normminv(p,mu,sigma)二项分布binoinvxp=binoinv(p,n,p1)均匀分布unifinvxp=normminv(a,b)几何分布geoinvxp=geoniv(k,p)k=0,1,2超 几 何 分布hygeinvxp=hygeinv(p,m,k,n
17、)指数分布expinvxp=expinv()泊松分布poissinvxp=poissinv()t分布tinvxp=tinv(n)2分布chi2invxp=chi2inv(n)F分布fstatxp=finv(n1,n2)例 7:某工厂生产的产品中废品率为 0.005,任意取出 1000 件,计算(1)其中至少 2 件废品的概率:(2)其中不超过 5 件废品的概率(3)能以 0.9 以上的概率保证废品件数不超过多少?解:用 x 表示取出的 1000 件中的废品数,则 X 近似服从二项分布 B(1000,0.005)(1)所求概率为11212=p1=1-binocdf(1,1000,0.005)结果
18、 p1=0.9599所以其中至少 2 件废品的概率是 0.9559(2)所求概率为5 xP p2=binocdf(5,1000,0.005)结果 p2=0.6160(3)由题意,求 n,使 PX=0.9,我们只求 n 满足 PX n=binoinv(0.9,1000,0.005)结果 n=8所以能以 0.9 以上的概率保证废品数不超过 8 件2数理统计的基础概念2.1总体与样本在统计学中把研究的对象全体称为全体,确切地说,应该是这些对象的某个或某些指标值全体称为总体,为了了解总体的分布,从总体中抽取n个个体,记其指标值为nxxx,.,21,称nxxx,.,21为总体的一个样本,n为样本的大小或
19、容量利用 MATLAB 数理统计工具箱中的函数可以直接计算样本的均值,方差以及其他数字特征表一:MATLAB 中计算样本的数字特征的函数数字特征调用函数备注样本平均值M=mean(X)若X为向量,返回X中各元素的平均值若X为矩阵,返回X中各列元素的平均值构成的向量中位数N=median(X)若X为向量,返回X中各元素的平均值若X为矩阵,返回X中各列元素的平均值构成的向量样本方差D=var(X)var(X)=niiXxn12)(11若X为向量,则返回向量的样本方差。若X为矩阵,则 D 为X的列向量的样本方差构成的行向量样本标准方差D=std(X)返回向量(矩阵)X 的样本标准差(置前因子为1n1
20、)即:=n1iiXx1n1std协方差C=cov(X)返回向量X的协方差相关系数P=corrcoef(X,Y)返回列向量X,Y的相关系数,等同于corrcoef(XY)众数hist(x,k)hist(x,nb)n,x=hist(x,k)n,x=hist(x,nb)众数通常是从频数直方图上近似看出来,因此求众数调用的是画直方图的函数,其中x是由数据组成的向量,参数k表示将区间k等分,默认值为 10,参数nb为事先给出的小区间的区间图,命令 1 和 2 能画直方图,命令 3 和 4 不画出直方图,其输出参数n为落入每个小区间的频数,x为区间的中点例子 8:统计某班 30 人某门课程某次考试成绩的分
21、布情况,考试成绩为93 75 83 93 91 85 84 82 77 76 95 94 89 91 88 86 83 96 81 7997 78 75 67 69 68 84 83 81 75 66 85 70 94 83 82 80 78 74 7376 70 86 76 90 89 71 66 86 73 80 84 79 78 77 63 53 55求平均成绩与成绩的中位数以及方差和标准差和众数5解:x=93 75 83 93 91 85 84 82 77 76 95 94 89 91 88 86 83 96 81 79.97 78 75 67 69 68 84 83 81 75 66
22、 85 70 94 83 82 80 78 74 73.76 70 86 76 90 89 71 66 86 73 80 84 79 78 77 63 53 55;M=mean(x)N=median(x)D1=var(x)D2=std(x)hist(x,4)结果:M=79.9138N=80.5000D1=94.0100D2=9.6959所以平均成绩是 79.9138,成绩中位数是 80.5000,方差是 94.0100,标准差是 9.6959从直方图中可以近似看出众数为 803参数估计3.1 矩估计设总体X具有分布函数);(xF,为p维待估参数,X的k阶中心矩为kkXEXEm)(=,样本nXX
23、X,.,21的k阶中心矩为kniikXXnA=1)(1,样本的 k 阶中心矩的计算可用函数moment,其调用格式是B=moment(X,k)当1=p时,由XXE=)(求出的矩估计,其中样本均值X可用函数mean(X)计算当1p时,令pkAmXXEkk,.3,2,)()(=解此方程组,即可得到的矩估计例 9:设变量X服从区间,0上的均匀分布,即分布函数为其他=xxp0,0,1);(现得样本值为 1.3,0.6,1.7,2.2,0.3,1.1,试用矩估计法求参数的估计解:dxxXEX=01)(Syms x;Syms sita;y=int(x./sita,0,sita)(求dxx01的值,其中记为
24、 sita)结果:y=1/2*sita,所以2110=dxx X=1.3 0.6 1.7 2.2 0.3 1.1;mean(X)结果:ans=1.2000所以X=1.2,所以2.121=,所以4.2=例 10:已知某种灯泡的寿命(单位:h)服从正态分布,在某周所生产的该种灯泡中随机抽取10 只,测得其寿命为 1067,919,1196,785,1126,936,918,1156,920,948.设总体参数为都未知,试用矩估计求出参数,的估计值解:pkDXXEXEXXE,.3,2,)()(2=pkDXX,.3,2,2=X=1067 919 1196 785 1126 936 918 1156 9
25、20 948;mean(X)%求样本均值var(X)%求样本方差结果:ans=997.1000ans=1.7305e+004 sqrt(1.7305e+004)%求样本均方差结果ans=131.5485所以=997.1000,=131.54853.2 极大似然估计与区间估计在 MATLAB 中,这两种估计可同时给出,对于二项分布,泊松分布,正态分布,分布,分布,均匀分布,指数分布,威布尔分布在 MATLAB 中可将这些分布的分布命令字符和函数命令字符 fit 连接起来(除均匀分布连接后为 unifit),得到这些分布中参数的极大似然估计值以及置信水平为1的置信区间.表一:MATLAB 中求极大
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MATLAB 概率 统计 中的 应用
限制150内