精通MATLAB科学计算(第3版)(王正林)13-3r.pdf
《精通MATLAB科学计算(第3版)(王正林)13-3r.pdf》由会员分享,可在线阅读,更多相关《精通MATLAB科学计算(第3版)(王正林)13-3r.pdf(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 章概率统计计算概率论与数理统计是一门研究随机现象并找出其统计规律的学科,广泛应用于社会、经济、科学等各个领域。MATLAB中的统计工具箱(Statistics Toolbox)包含了 200多个用于概率统计方面的功能函数,且具有简单的接口操作。通过本章学习,读者能利用统计工具箱中相关函数进行统计量计算、参数估计、假设检验、方差分析和回归分析等计算,而且还能使用统计学中的一些特殊的绘图工具,直观地认识样本的结构和分布特征。13.1MATLAB统计工具箱介绍MATLAB中的统计工具箱是一套建立在MATLAB数值计算环境下的统计分析工具,能够支持范围广泛的统计计算任务。统计工具箱主要包括如下两类
2、工具。(1)概率统计的数值计算函数该函数可以通过命令行或用户的应用程序调用,多数为MATLAB中的M 文件。(2)交互式图形工具函数该函数是能够通过图形用户界面(GUI)来使用的交互式图形工具。表 13-1给出了统计工具箱中函数的主要分类。表 1 3-1 统计工具箱中函数的主要分类函数分类具体描述概率分布参数估计累积分布函数概率密度函数概率分布逆累积分布函数随机数产生器分配函数的矩实验设计构建统计模型主成分分析对数据进行降维处理假设检验假设的统计检验描述统计学针对数据抽样的描述统计第1 3 章概率统计计算统计作图统计的作图统计的过程控制统计的过程控制续表函数分类具体描述聚集分析有相似的特性的项
3、目列入群体中线性模型对数据进行线性模型拟合非线性回归非线性回归模型的拟合文件输入,输出对操作系统文件读写数据数据示范的数据13.2随机变量的数字特征随机变量的数字特征是与随机变量有关的某些数值,它们虽然不能完整地描述随机变量,但能描述随机变量在某些方面的重要特征。本节主要讲述用MATLAB求解随机变量的期望(均 值 X 方差、矩、协方差矩阵、相关系数等数字特征。该部分所用到的命令函数属于统计工具的描述统计学(Descriptive Statistics)部分。13.2.1期望设离散性随机变量的分布律为:?X=x*=p*,&=1,2,则定义X 的期望为:c oE(X)=xkPkk=l而对于来自总
4、体X 的一个样本,设其样本值为X=(X1,X2,X),则定义样本均值为:可以证明F 依概率收敛于X 的均值。因此通常用亍来近似代替X 的均值。MATLAB中提供了函数mean。来计算这种较为简单的均值,其调用格式如下。1.m=mean(X)若X 为向量形式,则 mean(X)为向量中各元素的平均值;若X 为矩阵,则 mean(X)为一个行向量,其中的每一个元素是矩阵X 各列元素的平均值。307精通MATLAB科学计算(第2忡-2.m=mean(X,dim)函数返回X 在某一维上的均值,其中维数由标量dim设置。例如X 为一个矩阵时,mean(X,2)是一个列向量,包含矩阵X 每一行的均值。di
5、m的默认值为lo【例 13-1 样本均值计算实例l o 下面给出一组样本值来自于某一个未知分布,计算该分布的样本均值。191,135,1 2.6,1 0,1 4.6,2 4,13.7,1 5,2 0,1 3.5解:通过在MATLAB中编写程序exl301.m来实现。%exl301.m用mean()计算样本均值x=1 9.1,1 3.5,1 2.6,1 0,1 4.6,2 4,1 3.7,15,20,1 3.5 ;m=mean(x)命令窗口中输出结果为:exl301m=15.6000由以上计算结果可知,该分布的样本均值为15.6。【例 132】样本均值计算实例2O如下为来自于总体的三个样本的样本
6、值,分别计算其均值。天:2.1 3.5 5.0 1.5 3.0X2:3.2 3.0 4.5 4.2 1.4X3:2.4 2.6 4.2 3.5 3.23.2 4.2 2.5 3.0 1.81.5 5.0 4.5 3.5 3.03.3 4.0 4.2 3.6 2.8解:用矩阵的均值形式计算,在 MATLAB中编写程序exl302.m来实现。%exl302.m分别计算三个样本的均值X l=2.1X 2=3.2X3=2.43.55.01.53.03.2 4.22.53.01.8 ;备第一个样本3.04.54.21.41.5 5.04.53.53.0;%第二个样本2.64.23.53.23.3 4.0
7、4.23.62.8 ;%第三个样本X=X1;X2;X3;m l=m ean(X,2)X=X 1ZX2,ZX3,;m2=mean(X)务将三个样本作为X的各行%计 算X各 行 的 均 值,即得各样本均值8将三个样本作为X的各列省得各列均值命令窗口输出为:exl302ml=2.9800308 -第 章概率统计计算3.38003.3800m2=2.9800 3.3800 3.3800由以上计算结果可知,样本X I的均值为2.98,样本A 2的均值为3.38,样本X3的均值为3.38。【例 13-3】样本均值计算实例3。设随机变量X、丫的联合分布律如表13-2所 示,分别计算 E(X),E(Y),E(
8、R 3)以及 E(X+Y)O表 13-2 x、丫联合分布律1234p(y=j)01/100001/10104/102/101/107/1020002/102/100g)1/104/102/103/101解:用均值定义计算,通过在MATLAB中编写程序exl303.m来实现,具体代码如下所示。%exl303.m分别计算二维离散分布的均值X=0,l,2;Y=l,2,3,4;Px=0.1,0.7,0.2;%x各点对应的概率Py=0.1,0.4,0.2z0.3;mX=sum(X.*Px)mY=sum(Y.*Py)z=X+3;%Y各点对应概率%E(X)sum为求和函数。mX3=sum(z.*Px)mXY
9、=mX+mY%E(X+3)%E(X+Y)命令窗口输出为:exl303mX=1.1000mY=2.7000mX3=4.1000mXY=%E(x)%E(Y)%E(X+3)3.8000%E(X+Y)在 MATLAB中还给出了求其他形式均值的一些函数,其命令形式与mean相同。各命令具体含义详见表13-3。309精通MATLAB科学计算(第2蚪表1 3-3几种均值函数函 数 名功能geomean求样本几何均值harmmcan求样本调和平均值nanmean可忽略样本中的非数值输入,并计算相应均值trimmean除去输入样本中一些数值变化太大的值,然后再计算样本均值如需了解表13-3中函数的详细用法,可到
10、MATLAB的 Help中的相关部分检索查询函数的详细使用说明。310 第13章概率统计计算13.2.2方差、标准差、矩方差是用来刻画随机变量x 取值分散程度的一个量。其一般用下式表达:D(X)=Ex-E(x)1在应用上还引入与随机变量X 具 有 相 同 量 纲 的 量 向 方,记为b(X),称为标准差或均方差。X 的左阶中心矩应为:EX-E(X)k,k=2,3,-可知方差即为二阶中心矩。对于一个样本来说,样本方差通常有两种形式表达,如下所示。无偏估计式:有偏估计式:)2 /=!样本标准差也对应有如下两种形式:s=*3a或S=g=I眩(XL 4 2V,=1样本的Z阶中心矩为:MATLAB中用方
11、差函数var()来计算样本方差,用标准差函数std()来计算样本的标准差,用矩函数moment。计算样本的各阶中心矩,具体用法如下。1.var()方差函数k=var(X)若X 为向量则返回向量的样本方差值,若 X 为矩阵则返回矩阵各列向 311精通MATLAB科学计算(第2忡-量方差组成的行向量。其采用无偏式计算方差。V=var(X,1)函数采用有偏估计式计算X 的方差,即 前 置 因 子 为 var(X,O)等同于 var(X),其采用无偏式计算方差,前置因子为K=var(X,w)函数返回X 以 w,为权的方差。对于矩阵X,w 的元素个数必须等于X的行数;对于向量X,w 的元素个数与X 元素
12、个数相同。V=var(X,flag,dim)函数返回X 在特定维上的方差,dim指定维数,flag指定选择的计算式。即 flag=O,选择无偏式计算;flag=l,选择有偏式计算。此 外,nanvar()是忽略非数(NaNs)的方差计算函数,调用格式与var()相同。2.std()标准差函数s=std(X)函数返回向量(矩 阵)X 的标准差(前置因子/n-卜s=std(X,flag)flag=O,前置因子为!n-;flag=l,前置因子为 l/n0s=std(X,flag,dim)函数返回X 在特定维上的标准差,dim 指定维数,flag指定选择的计算式。nanstd()函数用法同std(),
13、忽略非数的标准差计算函数。【例 13-4】样本方差、标准差计算实例。分别计算向量*=1,-1,1,2的方差和标准差以及加权后的方差和标准差,其中加权向量为v=l,2,3,4o(加权方差和标准差值指的是计算样本方差或标准差时,各样本值要乘以相应的权值,然后再除以总的权值。)解:通过在MATLAB中编写程序exl304.m来实现,具体代码如下所示。%exl304.m 计算x的方差和标准差x=-l-112;w=l 2 3 4;当用各种命令形式计算方差vl=var(x)v2=var(x,0)v3=var(x,1)v4=var(x,w)v5=var(x,1,w)多用各种命令形式计算向量标准差sl=std
14、(x)s2=std(x,1)s3=std(x,w)在命令窗口中运行该文件,得如下结果:3输入向量X告权向量W exl304vl=2.2500%var(X)v2=312 第13章概率统计计算2.2500%var(X,0)v3=1.6875%var(X,1)v4=1.5600%var(X,w)v5=0 00 0%var(X,1,w)s i=1.5000%std(X)s2=1.2990%std(Xz1)s3=1.2490%std.(X,w)3.moment。矩函数 7=moment(X,o rd e r)函数返回向量(矩 阵)X 的左阶中心矩。order规定中心矩的阶数。?=moment(X ord
15、er,dim)函数返回dim维上的X 的中心矩。【例 13-5】中心矩计算实例。随机产生正态分布的一组随机数,计算其3 阶中心矩。解:通过在MATLAB中编写程序exl305.m来实现。%exl305.m 计算正态随机数的3 阶矩X=randn(5 4)%产生正态分布的随机数矩阵,行数为5,列数为4ml=moment(X,3)%计算矩阵X 各列的3 阶矩m2=moment(X,3,2)%计算矩阵X 各行的3 阶 矩,并返回2 维上的中心矩 exl305X=-0.43261.1909-0.18670.1139-1.66561.18920.72581.06680.1253-0.0376-0.588
16、30.05930.28770.32732.1832-0.0956-1.14650.1746-0.1364-0.8323ml=-0.11350.03620.87800.0586m2=0.1983-1.7088-0.02270.7167-0.000413.2.3协方差、相关系数随机变量X、y 的协方差和相关系数的定义式如下:313精通MATLAB科学计算(第2忡-cov(x,y)=x-E(x)y-E(y)c t、cov(x,y)cof(x,y)=i J对 于n维随机变量,通常用协方差矩阵描述它的2 阶中心矩。如对于二维随机变量(XD,定义协方差矩阵形式为:(C C 12。22 J其 中:cix=E
17、x-E(x)2cl 2=Ex-E(x)y-E(y)c2 i=Ey-E(y)x-E(x)c2 2=Ey-E(y)2其相应的样本协方差形式此处不再给出。与样本方差形式类似,也具有两种形式。MATLAB中用cov()和 corrcoef。计算协方差和相关系数。具体用法如下。1.COV。计算协方差C=cov(X)X 为向量时,函数返回此向量的方差。X 为矩阵时,矩阵的每一行表示一组观察值,每一列代表一个变量。函数返回此矩阵的协方差矩阵,其中协方差矩阵的对角元素是X 矩阵的列向量的方差值。c=cov(x,F)返回x、y 的协方差矩阵,其中x、y 行数和列数相同。C=cov(X,l),C=cov(X,y,
18、l)计算协方差矩阵时前置系数取1/rto cov(X,0)与 cov(X)相同,都是取前置系数为1/n-l,此用法可参考var函数。2.corrcoe%)计算相关系数R=corrcoef(X)返回矩阵X 的相关系数矩阵,其各点值对应于相关矩阵的各点值除以相应的标准差。7?=corrcoef(x,y)返回x、y 的相关系数矩阵。若 x、y 分别为列向量,则该命令等同于 7?=corrcoef(,r y)o7?,P=concoef(.)返回的P矩阵是不相关假设检验的p值。R,P,RLO,RUP=corrco砥 )对于每一个R值 返回的95%置信区间为RLO,RUP。.=corrcoef(.,par
19、am 1,vail,param2,v al2,.)设定特殊的可选项。corrcoef函数功能强大,本节仅讨论它的前两种常用用法。【例 13-6】协方差和相关系数计算实例。计算向量x 和向量y 的协方差和相关系数。314 第13章概率统计计算向量X与向量J,分别如下所示:x=1,222,1,2y=2,3,2,2,3,2解:通过在MATLAB中编写程序cxl306.m来实现,具体代码如下所示。%exl306.m计算向量之间的协方差和相关系数x=1,2,2,2,1,2;y=2,3,2,2,3,2;cx=cov(x)vx=var(x)cxy=cov(x,y)cor=corrcoef(x,y)exl30
20、6ex=0.2667vx=0.2667exy=0.2667-0.0667cor=1.0000-0.2500-0.06670.2667-0.25001.0000金计算向量X 的协方差,可知其等于X 方差3x方差用 x、y 协方差%x.y 相关系数号运行exl306【例 13-7】随机变量数字特征综合计算实例。根据表13-4中所示的数据计算各变量的均值、方差以及它们之间的协方差矩阵和相关系数。表 1 3 4 几组变量数据VOLHPMPGSP894965.496925555.99792704 9.0105925346.59689704 6.2105925545.497948043.410789733
21、 9.310389663 9.6100917838.9106解:通过在MATLAB中编写程序exl307.m来实现,具体代码如下所示。%exl307.m 计算各变量均值、方差以及它们之间的协方差矩阵和相关系数矩阵 315精通MATLAB科学计算(第2版i-VOL=89 92 92 92 89 92 94 89 89 9 1,HP=49 55 70 53 70 55 80 73 66 7 8 1;MPG=65.4 55.9 49.0 46.5 46.2 45.4 43.4 39.3 39.6 38.9 1;SP=96 97 105 96 105 97 107 103 100 1 0 6 1;X=
22、VOLZHPZMPG,SP;%将变量数据按列存到一个矩阵中m=mean(X)%计算X 均 值,得各变量样本的均值v=v a r(X)3计算X方 差,得各个变量样本值之间方差cX=cov(X)%计算变量之间的相关矩阵cv=diag(cX)corX=corrcoef(X)%取相关矩阵对角元素S计算变量之间的相关系数输出计算结果为:3.2111123.211168.647119.9556 exl307m=90.9000 64.9000v=3.2111 123.2111cX=3.2111 2.43332.4333 123.2111-0.7822-64.86001.0222 47.8000cv=46.9
23、600 101.200068.6471 19.9556-0.7822 1.0222-64.8600 47.800068.6471-20.4356-20.4356 19.9556corX=1.0000 0.12230.1223 1.0000-0.0527-0.70520.1277 0.9640-0.0527 0.1277-0.7052 0.96401.0000-0.5521-0.5521 1.000013.2.4偏斜度和峰度偏斜度和峰度是用来描述随机变量分布的形状与对称形式,或正态分布型的偏离程度的统计量,其分别定义如下。随机变量工的偏斜度:E(x-E(x)3一卬(x)产2随机变量X的峰度:,(
24、x-(x)4卬(x)在 MATLAB中分别用函数skewness。、kurtosis。来实现上述计算。316 第1 3章概率统计计算1.skewness 函数调用格式如下:y=skewness(X),X为向量时,函数返回此向量的倾斜度;X为矩阵时,矩阵的每一行表示一组观察值,每一列代表一个变量,函数返回此矩阵的每一列的倾斜度。y=skewness(X,fla g),fla g用于设定是否要修正偏差。若fla g=O,则计算倾斜度时修正系统偏差;fla g=l(默认值)时不修正偏差。y=skewness(X,fla g,d i m),在矩阵X的d i m维上计算倾斜度。通常对于二维矩阵,d im
25、=l,函数计算各列的倾斜度;d im=2,函数计算各行的倾斜度。2.kurtosis 函数调用格式如下:k=kurtosis(X),函数返回X的峰度。k=kurtosis(X,flag),flag 意义同 skewness。k=kurtosis(X,flag,dim),参数意义同 skewness通过上面各式可以计算出向量(矩 阵)X的偏斜度和峰度。式中fla g默认值为I表示不进行偏移修正;fla g可以赋值为0,表示进行偏移修正。d im指定在矩阵X的特定维上求相应统计量。下面是一段在M A T L A B命令窗口中输入的计算偏斜度和峰度的例子:x=20.1,12.4,22,2,18.0,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精通 MATLAB 科学 计算 王正林 13
限制150内