MATLAB基本统计分析.ppt
《MATLAB基本统计分析.ppt》由会员分享,可在线阅读,更多相关《MATLAB基本统计分析.ppt(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、随机变量随机变量名称名称MATLAB密度函数密度函数随机变量随机变量名称名称MATLAB密度函数密度函数Beta分布分布betapdf标准正态分布标准正态分布normpdf二项分布二项分布binopdf泊松分布泊松分布poisspdf卡方分布卡方分布chi2pdf瑞利分布瑞利分布raylpdf指数分布指数分布exppdfT分布分布tpdfF分布分布fpdf均匀分布均匀分布unifpdf伽马分布伽马分布gampdfWeibull分布分布weibpdf几何分布几何分布geopdf非中心非中心F分布分布ncfpdf超几何分布超几何分布hygepdf非中心非中心T分布分布nctpdf对数正态分布对数正
2、态分布lognpdf非中心卡方布非中心卡方布ncx2pdf 如果将上述命令中的后缀如果将上述命令中的后缀pdf分别改为分别改为cdf,inv,rnd,stat 就得到相应就得到相应的随机变量的分布函数、分位数、随机数的生成以及均值与方差的随机变量的分布函数、分位数、随机数的生成以及均值与方差.一一.随机变量与分布随机变量与分布第九讲第九讲 数据的基本统计分析数据的基本统计分析 我们利用我们利用MATLAB中的函数来计算正态分布的分中的函数来计算正态分布的分布函数、概率密度函数值、做出密度函数曲线、分位数布函数、概率密度函数值、做出密度函数曲线、分位数.在在MATLAB中计算上述分布函数的命令为
3、:中计算上述分布函数的命令为:P=NORMCDF(x,mu,sigma)Default values for MU and SIGMA are 0 and 1 respectively.例例1 已知已知 试求:试求:解:解:normcdf(3,2,0.5)=0.9772;normcdf(2,2,0.5)-normcdf(1,2,0.5)=0.4772 1.计算分布函数与概率密度函数值计算分布函数与概率密度函数值:2.做出密度函数曲线、求分位数做出密度函数曲线、求分位数已知已知X的均值和标准差及概率的均值和标准差及概率p=PXx,求求x的命令为的命令为:X=NORMINV(P,MU,SIGMA)
4、例例2.XN(1,0.04),pXx=0.6827 求求x解:解:x=norminv(0.6827,1,0.2)=1.0951 NORMSPEC(a,b,MU,SIGMA)用于做出随机变量在区间用于做出随机变量在区间a,b上的正态密度曲线上的正态密度曲线例例3.若若XN(2,4),作出,作出X在在-1,3上的曲线上的曲线解:解:normspec(-1,3,2,2)图形如右图所示图形如右图所示(图图7.1)二二.数据特征数据特征 设设 是取自总体是取自总体X的一个简单随机样本,的一个简单随机样本,在在n次抽样以后得到样本的一组观测值次抽样以后得到样本的一组观测值 我我们通过对数据的分析研究可以得
5、到总体们通过对数据的分析研究可以得到总体X的有关信息,的有关信息,在在MATLAB中有专门的函数分析数据特征,如下表所中有专门的函数分析数据特征,如下表所示示.位置特征位置特征MATLAB函函数数变异特征变异特征MATLAB函数函数算术平均算术平均mean极差极差range中位数中位数median方差方差var切尾平均切尾平均trimmean标准差标准差std几何平均几何平均geomean四分位极差四分位极差iqr调和平均调和平均harmmean平均绝对偏差平均绝对偏差mad 例例4.已知数据:已知数据:459 362 624 542 509 584 433 748 815 505 612 4
6、52 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 649 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496
7、468 499 544 645 764 558 378 765 666 763 217 715 310 851计算该数据特征计算该数据特征.解:解:a=459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 649 697 515 628 954 771 609 402 960 885 610 292 837
8、 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851;b=a(:);%将矩阵变成数列将矩阵变成数列T=mean(b),median(b),trimmean(b,10),geomean(b),harmmean(b),range(b),var(b),std(b),iqr(b),mad(b)位置特征位置特
9、征计算结果计算结果变异特征变异特征计算结果计算结果算术平均算术平均600极差极差1069中位数中位数599.5方差方差38663.03切尾平均切尾平均600.64标准差标准差196.629几何平均几何平均559.68四分位极差四分位极差243.5调和平均调和平均499.06平均绝对偏差平均绝对偏差150.86计算结果如下:计算结果如下:例例5.已知数据:已知数据:1,1,1,1,1,1,100;计算其数;计算其数据特征,由此你有何发现?据特征,由此你有何发现?解:解:x=1,1,1,1,1,1,100;y=mean(x),median(x),geomean(x),harmmean(x),tri
10、mmean(x,25);range(x),var(x),std(x),iqr(x),mad(x)计算结果为:计算结果为:y=15.143 1 1.9307 1.1647 1 99 1400.1 37.418 0 24.245 如果例如果例5的数据全部为的数据全部为1,则各种平均值都应等于,则各种平均值都应等于1,所有的变异特征全部为零,由于有一个异常值,所有的变异特征全部为零,由于有一个异常值100,于是导致上述的一些特征受影响(不稳健),但是中位于是导致上述的一些特征受影响(不稳健),但是中位数、切尾平均与四分位极差没有改变,它们对异常值是数、切尾平均与四分位极差没有改变,它们对异常值是稳健
11、的稳健的.三三.异常值的判别异常值的判别 在探索性数据分析时,有一种判别异常值的简单在探索性数据分析时,有一种判别异常值的简单方法,首先计算数据的下、上截断点,数据中小于下截方法,首先计算数据的下、上截断点,数据中小于下截断点的数据为特小值,大于上截断点的数据为特大值,断点的数据为特小值,大于上截断点的数据为特大值,二者都是异常值二者都是异常值.1.数据的下、上截断点数据的下、上截断点计算上、下截断点的公式如下:计算上、下截断点的公式如下:其中,其中,R为四分位极差,为四分位极差,分别称为下四分位数与分别称为下四分位数与上四分位数上四分位数.对于对于0p0时称正偏,当时称正偏,当s3则表明数则
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MATLAB 基本 统计分析
限制150内