第9章概率论与数理统计的MATLAB实现讲稿(共65页).doc





《第9章概率论与数理统计的MATLAB实现讲稿(共65页).doc》由会员分享,可在线阅读,更多相关《第9章概率论与数理统计的MATLAB实现讲稿(共65页).doc(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上第9章 概率论与数理统计的MATLAB实现 MATLAB总包提供了一些进行数据统计分析的函数,但不完整。利用MATLAB统计工具箱,可以进行基本概率和数理统计分析,以及进行比较复杂的多元统计分析。本章主要针对大学本科的概率统计课程介绍工具箱的部分功能。9.1随机变量及其分布 利用统计工具箱提供的函数,可以比较方便地计算随机变量的分布律(概率密度函数)和分布函数。9.1.1 离散型随机变量及其分布律如果随机变量全部可能取到的不相同的值是有限个或可列个无限多个,则称为离散型随机变量。MATLAB提供的计算常见离散型随机变量分布律的函数及调用格式:函数调用格式(对应的分布)
2、 分布律y=binopdf(x,n,p)(二项分布) y=geopdf(x,p)(几何分布) y=hygepdf(x,M,K,n)(超几何分布) y=poisspdf(x,lambda)(泊松分布) y=unidpdf(x,n)(离散均匀分布) 9.1.2 连续型随机变量及其概率密度对于随机变量的分布函数,如果存在非负函数,使对于任意实数有则称为连续型随机变量,其中函数称为的概率密度函数。MATLAB提供的计算常见连续型随机变量分布概率密度函数的函数及调用格式:函数调用格式(对应的分布) 概率密度函数y=betapdf(x,a,b)(分布) y=chi2pdf(x,v)(卡方分布) y=exp
3、pdf(x,mu)(指数分布) y=fpdf(x,v1,v2)(F分布) y=gampdf(x,a,b)(伽马分布) y=normpdf(x,mu,sigma)(正态分布) y=lognpdf(x,mu,sigma)(对数正态分布) y=raylpdf(x,b)(瑞利分布) y=tpdf(x,v)(学生氏t分布) y=unifpdf(x,a,b)(连续均匀分布) y=weibpdf(x,a,b)(威布尔分布) 比如,用normpdf函数计算正态概率密度函数值。该函数的调用格式为:Y=normpdf(X,MU,SIGMA)计算数据X中各值处参数为MU和SIGMA的正态概率密度函数的值。参数SIG
4、MA必须为正。正态概率密度函数的计算公式为:9.1.3分布函数对于离散型随机变量,设为任意实数,的分布函数为:对于连续型随机变量,假设其概率密度函数为,则其分布函数为:MATLAB提供了专门的函数求解各种随机变量的分布函数,具体如下:函数调用格式 对应的分布p=betacdf(x,a,b) 分布p=binocdf(x,n,p) 二项分布p=chi2cdf(x,v) 卡方分布p=expcdf(x,mu) 指数分布p=fcdf(x,v1,v2) F分布p=gamcdf(x,a,b) 伽马分布p=geocdf(x,p) 几何分布p=hygecdf(x,M,K,n) 超几何分布p=normcdf(x,
5、mu,sigma) 正态分布p=logncdf(x,mu,sigma) 对数正态分布p=poisscdf(x,lambda) 泊松分布p=raylcdf(x,b) 瑞利分布p=tcdf(x,v) 学生氏t分布p=unidcdf(x,n) 离散均匀分布p=unifcdf(x,a,b) 连续均匀分布p=weibcdf(x,a,b) 威布尔分布例如,用normcdf函数计算正态分布的分布函数。该函数的调用格式为:P=normcdf(X,MU,SIGMA)计算参数为MU和SIGMA的正态分布函数在数据X中每个值处的值。参数SIGMA必须为正。正态分布的分布函数为:结果为取自参数为和的正态分布总体的单个
6、观测量落在区间中的概率。例91某仪器需安装一个电子元件,需要电子元件的使用寿命不低于1000小时即可。现有甲乙两厂的电子元件可供选择,甲厂生产的电子元件的寿命服从正态分布,乙厂生产的电子元件的寿命服从正态分布。问应选哪个工厂的产品呢?解:设,。则有:0.9772 (命令为1-normcdf(1000,1100,50))0.9696(命令为1-normcdf(1000,1150,80))因此,应选甲厂生产的产品。9.1.4逆累加分布函数 逆累加分布函数是累加分布函数的逆函数。利用逆累加分布函数,可以求得满足给定概率时随机变量对应的置信区间。常见分布的逆累加分布函数及其调用格式:函数调用格式 对应
7、的分布p=betainv(P,a,b) 分布p=binoinv(P,n,p) 二项分布p=chi2inv(P,v) 卡方分布p=expinv(P,mu) 指数分布p=finv(P,v1,v2) F分布p=gaminv(P,a,b) 伽马分布p=geoinv(P,p) 几何分布p=hygeinv(P,M,K,n) 超几何分布p=norminv(P,mu,sigma) 正态分布p=logninv(P,mu,sigma) 对数正态分布p=poissinv(P,lambda) 泊松分布p=raylinv(P,b) 瑞利分布p=tcdfinv(P,v) 学生氏t分布p=unidinv(P,n) 离散均匀
8、分布p=unifinv(P,a,b) 连续均匀分布p=weibinv(P,a,b) 威布尔分布例92有同类设备300台,各台工作状态相互独立。已知每台设备发生故障的概率为0.01,若一台设备发生故障需要1人去处理,问至少需要多少工人,才能保证设备发生故障而不能及时维修的概率小于0.01?解:设表示同一时刻发生故障的设备台数,则有。再设配备位维修人员,则有:即键入命令:p=binoinv(0.99,300,0.01)运行结果:p =8键入命令:binocdf(8,300,0.01)binocdf(7,300,0.01)运行结果:ans =0.9964ans =0.9885因此,至少需要8个工人,
9、才能保证设备发生故障而不能及时维修的概率小于0.01。9.2多维随机变量及其分布9.2.1二维随机变量用mvnpdf和mvncdf函数可以计算二维正态分布随机变量在指定位置处的概率和累积分布函数值。例93计算服从二维正态分布的随机变量在指定范围内的概率密度值并绘图。程序:%二维正态分布的随机变量在指定范围内的概率密度函数图形mu=0 0;sigma=0.25 0.3;0.3 1;%协方差阵x=-3:0.1:3;y=-3:0.15:3;x1,y1=meshgrid(x,y);%将平面区域网格化取值f=mvnpdf(x1(:) y1(:),mu,sigma);%计算二维正态分布概率密度函数值F=r
10、eshape(f,numel(y),numel(x);%矩阵重塑surf(x,y,F);caxis(min(F(:)-0.5*range(F(:),max(F(:);%range(x)表示最大值与最小值的差,即极差。axis(-4 4 -4 4 0 0.5);xlabel(x);ylabel(y);zlabel(Probability Density);运行结果见图91。图91二维正态分布的随机变量的概率密度函数例94计算服从二维正态分布的随机变量在指定范围内的累积分布函数值并绘图。程序:%二维正态分布的随机变量在指定范围内的累积分布函数图形mu=0 0;sigma=0.25 0.3;0.3
11、1;%协方差阵x=-3:0.1:3;y=-3:0.2:3;x1,y1=meshgrid(x,y);%将平面区域网格化取值f=mvncdf(x1(:) y1(:),mu,sigma);%计算累积分布函数值F=reshape(f,numel(y),numel(x);%矩阵重塑surf(x,y,F);caxis(min(F(:)-0.5*range(F(:),max(F(:);%range(x)表示最大值与最小值的差,即极差。axis(-3 3 -3 3 0 0.5);xlabel(x);ylabel(y);zlabel(Probability Density);9.2.2边缘分布对于连续型随机变量
12、,关于和的边缘概率密度和分别为:例95设具有概率密度确定常数;求边缘概率密度和。解:由可得;计算程序为:syms x y Cfxy=C*x*x*y;g=int(int(fxy,y,x*x,1),x,-1,1);C=double(solve(g-1)程序:syms x yfxy=5.25*x*x*y;fx=int(fxy,y,x*x,1)fy=int(fxy,x,-sqrt(y),sqrt(y)运行结果:fx =21/8*x2*(1-x4)fy =7/2*y(5/2)因此,9.3随机变量的数字特征在解决实际问题过程中,往往并不需要全面了解随机变量的分布情况,而只需要知道它们的某些特征,这些特征通
13、常称为随机变量的数字特征。常见的有数学期望、方差、相关系数和矩等。9.3.1 数学期望 离散型随机变量的数学期望设离散型随机变量的分布律为:,如果绝对收敛,则称的和为随机变量的数学期望。例96设表示一张彩票的奖金额,的分布列如下:500005000500501000.0.0.000090.00090.0090.090.9试求。求解程序:x= 50000 5000 500 50 10 0;p=0. 0. 0.00009 0.0009 0.009 0.09 0.9;Ex=x*p运行结果:Ex=3.2000例97设,求。求解程序:syms p kEx=symsum(k*p*(1-p)(k-1),k,
14、1,inf)运行结果:Ex=1/p 连续型随机变量的数学期望设连续型随机变量的概率密度为,若积分绝对收敛,则称该积分的值为随机变量的数学期望。例98设的概率密度为,求。求解程序:syms xf1=x/15002;f2=(3000-x)/15002;Ex=int(x*f1,0,1500)+int(x*f2,1500,3000)运行结果:Ex =1500 二维随机变量及其函数的数学期望计算公式:例99设二维随机变量的概率密度为求。求解程序:syms x yf=x+y;Ex=int(int(x*y*f,y,0,1),0,1)运行结果:Ex =1/39.3.2 方差设是一个随机变量,若存在,则称为的方
15、差,记为。即9.3.3 常见分布的数学期望和方差MATLAB提供了常见分布的均值和方差的计算函数,其调用格式如下:函数调用格式 对应的分布M,V=betastat(a,b) 分布M,V=binostat (n,p) 二项分布M,V=chi2stat(v) 卡方分布M,V=expstat(mu) 指数分布M,V=fstat(v1,v2) F分布M,V=gamstat(a,b) 伽马分布M,V=geostat(p) 几何分布M,V=hygestat(M,K,n) 超几何分布M,V=normstat(mu,sigma) 正态分布M,V=lognstat(mu,sigma) 对数正态分布M,V=poi
16、sstat(lambda) 泊松分布M,V=raylstat(b) 瑞利分布M,V=tstat(v) 学生氏t分布M,V=unidstat(n) 离散均匀分布M,V=unifstat(a,b) 连续均匀分布M,V=weibstat(a,b) 威布尔分布9.3.4 协方差及相关系数随机变量与的协方差:。随机变量与的相关系数:。设是容量为的二维样本,则样本的相关系数为:相关系数常常用来衡量两套变量之间的线性相关性,相关系数的绝对值越接近1,表示相关性越强,反之越弱。用cov函数计算样本协方差矩阵。其语法格式为:C=cov(X)C=cov(X,Y)=cov(X,Y) 其中X,Y为长度相等的列向量。对
17、于单一矢量而言,cov(X)返回一个包含协方差的标量。对于列为变量观测值的矩阵而言,cov(X)为协方差矩阵。cov函数的算法为:n,p=size(X);Y=X-ones(n,1)*mean(X);C=Y*Y./(n-1)用函数计算样本数据的相关系数矩阵。R=corrcoef(X):返回源于矩阵的相关系数矩阵。例910程序:%协方差的计算x=1050 1100 1120 1250 1280;a=cov(x)n,p=size(x);y=x-ones(n,1)*mean(x);b=y*y/(n-1)运行结果:a =9950b =9950例911程序:%协方差阵的计算x=1050 1038;1100
18、 1089;1120 1118;1250 1256;1280 1300;a=cov(x)n,p=size(x);y=x-ones(n,1)*mean(x);b=y*y/(n-1)运行结果:a = 1.0e+004 * 0.9950 1.1200 1.1200 1.2626b = 1.0e+004 * 0.9950 1.1200 1.1200 1.26269.3.5 矩和协方差矩阵MATLAB中可以利用moment函数计算样本的中心矩。该函数的调用格式为:m=moment(X,order):返回X的order阶中心矩。对于矢量,moment(X,order)函数返回X数据的指定阶次中心矩。对于矩
19、阵,moment(X,order)返回X数据的每一列的指定阶次中心矩。注意:一阶中心矩为0,二阶中心矩为用除数n(而非n-1)得到的方差,其中n为矢量X的长度或是矩阵X的行数。如果维随机变量两两之间的协方差都存在,则它们构成的矩阵称为这个随机变量的协方差矩阵。在MATLAB中,协方差矩阵仍然用cov函数计算。9.4样本描述采集到大量的样本数据以后,常常需要用一些统计量来描述数据的集中程度和离散程度,并通过这些指标来对数据的总体特征进行归纳。描述样本数据集中趋势的统计量有算术平均、中位数、众数、几何均值、调和均值和截尾均值等。描述样本数据离散趋势的统计量包括极差、平均差、平均绝对差、方差和标准差
20、等。9.4.1 集中趋势 几何均值样本数据的几何均值:。用geomean函数计算几何均值。m=geomean(X):计算样本的几何均值。对于矢量,geomean(X)为数据X中元素的几何均值。对于矩阵,geomean(X)为一行矢量,包含每列数据的几何均值。 调和均值样本数据的调和平均值。用harmmean函数计算样本数据的调和平均值。m=harmmean(X):计算样本的调和平均值。对于矢量,harmmean(X)函数为X中元素的调和平均值。对于矩阵,harmmean(X)函数为包含每列元素调和平均值的行向量。 算术平均值样本数据的算术平均值。用mean函数计算矢量和矩阵中元素的均值。语法格
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论 数理统计 MATLAB 实现 讲稿 65

限制150内