常用数据分析软.ppt
常用数据分析软件简介常用数据分析软件简介常用的数据分析软件Matlab(Matrix Laboratory)SAS(Statistical Analysis System)SPSS(Statistical Product and Service Solutions)Eviews(Econometrics Views)ExcelMatlabMATLAB是矩阵实验室(Matrix Laboratory)的简称,是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。20世纪70年代 Cleve Moler1984年 MathWorks成立 MATLABMATLAB和和MathematicaMathematica、MapleMaple并称为三大数学并称为三大数学软件。软件。MATLABMATLAB的基本数据单位是的基本数据单位是矩阵矩阵矩阵矩阵,它的指令表达,它的指令表达式与数学、工程中常用的形式十分相似,故用式与数学、工程中常用的形式十分相似,故用MATLABMATLAB来解算问题要比用来解算问题要比用C C,FORTRANFORTRAN等语言等语言完成相同的事情简捷得多。完成相同的事情简捷得多。在新的版本中也加入了对在新的版本中也加入了对C C,FORTRANFORTRAN,C+C+,JAVAJAVA的支持。可以直接调用的支持。可以直接调用,用户也可以将自用户也可以将自己编写的实用程序导入到己编写的实用程序导入到MATLABMATLAB函数库中方便函数库中方便自己以后调用。自己以后调用。Matlab的主要功能可用于技术计算可用于技术计算 开发环境可对代码、文件和数据进行管理开发环境可对代码、文件和数据进行管理 交互式工具可以按迭代的方式探查、设计及求解交互式工具可以按迭代的方式探查、设计及求解问题问题 数学函数可用于线性代数、统计、傅立叶分析、数学函数可用于线性代数、统计、傅立叶分析、筛选、优化以及数值积分等筛选、优化以及数值积分等 二维和三维图形函数可用于可视化数据二维和三维图形函数可用于可视化数据 各种工具可用于构建自定义的图形用户界面各种工具可用于构建自定义的图形用户界面 各种函数可将基于各种函数可将基于 MATLAB MATLAB 的算法与外部应用程的算法与外部应用程序和语言(如序和语言(如 C C、C+C+、FortranFortran、JavaJava、COM COM 以及以及 Microsoft Excel Microsoft Excel)集成)集成 请关注:Matlab统计工具箱Matlab的最新版本Matlab R2010aSASSAS(Statistical Analysis System)SAS(Statistical Analysis System)统计分析系统计分析系统统.于于19661966年由美国年由美国North CarolinaNorth Carolina州立大学开始研制州立大学开始研制.类似于类似于MATLABMATLAB工具箱工具箱,它有它有l l基本模块基本模块:Base SAS;:Base SAS;l l统计分析模块统计分析模块SASSASSTAT;STAT;l l高级绘图模块高级绘图模块:SAS:SASGRAPH;GRAPH;l l矩阵运算模块矩阵运算模块:SAS:SASIML;IML;l l运筹学和线性规划模块运筹学和线性规划模块:SAS:SASOR;OR;l l经济预测和时间序列分析模块经济预测和时间序列分析模块SASSASETSETS等等.SAS的主要功能数据管理,包括高效、方便地访问大型数据库;统计分析;报表图形;信息体统开发SAS的最新版本SAS 9.2SPSSStatistical Product and Service Solutions“统计产品与服务解决方案”最初软件全称为l lSolutionsStatistical Package for the Social SolutionsStatistical Package for the Social SciencesSciencesSPSS的主要功能SPSSSPSS的数据编辑功能的数据编辑功能l l在在SPSSSPSS数据编辑窗口中,不仅可以对打开的数据文件数据编辑窗口中,不仅可以对打开的数据文件进行增加、删除、复制、剪切和粘贴等常规操作,还进行增加、删除、复制、剪切和粘贴等常规操作,还可以对数据文件中的数据进行排序、转化、拆分、聚可以对数据文件中的数据进行排序、转化、拆分、聚合、加权等操作,可以对多个数据文件可以合并。合、加权等操作,可以对多个数据文件可以合并。SPSSSPSS的图形生成和编辑功能的图形生成和编辑功能l l条形图、线图、面积图、饼图、高低图、箱图、误差条形图、线图、面积图、饼图、高低图、箱图、误差条图、散点图、直方图等条图、散点图、直方图等l l条形交互图、点型交互图、线形交互图、带形交互图、条形交互图、点型交互图、线形交互图、带形交互图、饼形交互图、箱型交互图、误差条形交互图、直方交饼形交互图、箱型交互图、误差条形交互图、直方交互图和散点交互图互图和散点交互图SPSS的主要功能(续)SPSS的统计功能 l l包括样本数据的描述和预处理、假设检验、非包括样本数据的描述和预处理、假设检验、非参数检验、均值比较与参数检验、均值比较与T T检验、方差分析、列检验、方差分析、列联表、相关分析、回归分析、对数线性分析、联表、相关分析、回归分析、对数线性分析、聚类分析、判别分析、因子分析、可靠性分析聚类分析、判别分析、因子分析、可靠性分析SPSS的最新版本SPSS 18.0IBM公司2009年7月28日宣布将用12亿美元收购分析软件提供商SPSS。SPSS称将在2009年10月2日召开特别股东大会投票表决有关将该公司出售给IBM的交易。如今SPSS已出至版本18.0,而且更名为PASW Statistics。EviewsEviewsEviews是是Econometrics ViewsEconometrics Views的缩写,直译为计的缩写,直译为计量经济学观察,通常称为计量经济学软件包。它量经济学观察,通常称为计量经济学软件包。它的本意是对社会经济关系与经济活动的数量规律,的本意是对社会经济关系与经济活动的数量规律,采用计量经济学方法与技术进行采用计量经济学方法与技术进行“观察观察”。另外另外EviewsEviews也是美国也是美国QMSQMS公司研制的在公司研制的在WindowsWindows下专门从事下专门从事数据分析、回归分析和预测数据分析、回归分析和预测的工具。的工具。使用使用EviewsEviews可以迅速地从数据中寻找出统计关系,可以迅速地从数据中寻找出统计关系,并用得到的关系去预测数据的未来值。并用得到的关系去预测数据的未来值。EviewsEviews的应用范围包括:科学实验数据分析与评的应用范围包括:科学实验数据分析与评估、金融分析、宏观经济预测、仿真、销售预测估、金融分析、宏观经济预测、仿真、销售预测和成本分析等。和成本分析等。Eviews的主要功能采用统一的方式管理数据,通过对象、视图和过采用统一的方式管理数据,通过对象、视图和过程实现对数据的各种操作;程实现对数据的各种操作;输入、扩展和修改时间序列数据或截面数据,依输入、扩展和修改时间序列数据或截面数据,依据已有序列按任意复杂的公式生成新的序列;据已有序列按任意复杂的公式生成新的序列;计算描述统计量:相关系数、协方差、自相关系计算描述统计量:相关系数、协方差、自相关系数、互相关系数和直方图;数、互相关系数和直方图;进行进行T T 检验、方差分析、协整检验、检验、方差分析、协整检验、Granger Granger 因因果检验;果检验;执行普通最小二乘法、带有自回归校正的最小二执行普通最小二乘法、带有自回归校正的最小二乘法、两阶段最小二乘法和三阶段最小二乘法、乘法、两阶段最小二乘法和三阶段最小二乘法、非线性最小二乘法、广义矩估计法、非线性最小二乘法、广义矩估计法、ARCH ARCH 模型模型估计法等;估计法等;Eviews的主要功能(续)对二择一决策模型进行对二择一决策模型进行ProbitProbit、logit logit 和和Gompit Gompit 估计;估计;对联立方程进行线性和非线性的估计;对联立方程进行线性和非线性的估计;估计和分析向量自回归系统;估计和分析向量自回归系统;多项式分布滞后模型的估计;多项式分布滞后模型的估计;回归方程的预测;回归方程的预测;模型的求解和模拟;模型的求解和模拟;数据库管理;数据库管理;与外部软件进行数据交换。与外部软件进行数据交换。最新版本EViews 7.0Matlab使用简介MATLAB 的主界面工作区窗口命令历史窗口命令窗口工具栏菜单栏MATLAB 的窗口命令窗口MATLAB 命令窗口。打开 MATLAB 时,命令窗口自动显示于 MATLAB 界面中。运算提示符,表示 MATLAB 处于准备状态,用户可以输入命令,按下回车键执行,并在命令窗口中显示运行结果 MATLAB 的窗口命令历史窗口默认情况下命令历史窗口位于左下角,显示用户曾经默认情况下命令历史窗口位于左下角,显示用户曾经输入过的命令,并显示输入的时间,方便用户查询。输入过的命令,并显示输入的时间,方便用户查询。对于命令历史窗口中的命令,用户可以点击右键进行对于命令历史窗口中的命令,用户可以点击右键进行相应的操作。相应的操作。用户可以双击再次执行命令窗口中的命令。用户可以双击再次执行命令窗口中的命令。命令历史窗口MATLAB 的窗口工作区窗口 工作区窗口工作区窗口与与当前路径窗口当前路径窗口共享一块空间,可以通过标签共享一块空间,可以通过标签显示或隐藏。工作区窗口中显示当前工作区中的所有变量显示或隐藏。工作区窗口中显示当前工作区中的所有变量及其大小和类型等。通过工作区可以对这些变量进行管理。及其大小和类型等。通过工作区可以对这些变量进行管理。其中包含了工作区工具栏和显示窗口。通过工具栏可以新其中包含了工作区工具栏和显示窗口。通过工具栏可以新建或删除变量、导入导出数据、绘制变量的图形等。另外建或删除变量、导入导出数据、绘制变量的图形等。另外右键单击变量名可以对该变量进行操作。右键单击变量名可以对该变量进行操作。工作区窗口MATLAB 的窗口当前路径窗口 当前路径窗口显示当当前路径窗口显示当前路径下的所有文件前路径下的所有文件和文件夹及其相关信和文件夹及其相关信息,并且可以通过当息,并且可以通过当前路径工具栏或右键前路径工具栏或右键菜单对这些文件进行菜单对这些文件进行操作操作 。当前路径窗口Mat lab的帮助系统的帮助系统(1)帮助命令)帮助命令help;(2)帮助窗口。)帮助窗口。进入帮助窗口的步骤如下进入帮助窗口的步骤如下 Launch Pad(分类帮助窗口)分类帮助窗口)选中选中“Help”打开打开命令行基础命令行基础1、简单的运算、简单的运算步骤如下:步骤如下:(1)用键盘在命令窗口)用键盘在命令窗口输入输入以下以下内容内容:(12+2*(7-4)/(32)(2)按)按Enter键,该指令就被执行。键,该指令就被执行。(3)命令窗口)命令窗口显示显示所得所得结果结果:ans=2 2、Mat lab表达式的输入表达式的输入Mat lab语句由表达式和变量组成,有两语句由表达式和变量组成,有两种常见的形式:种常见的形式:(1)表达式)表达式;(;(2)变量)变量=表达式表达式(1)输入输入:(2)按)按 Enter 键。键。(3)显示显示:y=(12+2*(7-4)/(32)y=2练习练习1 计算下列各题计算下列各题1、2、3、(1)输入输入:(2)按)按 Enter 键。键。(3)显示显示:x=3 y=x3-x(1/4)+2.15*sin(x)y=25.9873练习练习2 计算下列各函数的值计算下列各函数的值1、,求,求2、,求,求3、,求,求3、指令的续行输入、指令的续行输入若一个表达式在一行写不下,可若一个表达式在一行写不下,可换行换行,但,但必须在行尾必须在行尾加加上上四个英文句号四个英文句号。(1)输入输入:(2)按)按 Enter 键。键。(3)显示显示:s=1-1/2+1/3-1/4+1/5-1/6.+1/7-1/8s=0.63454、用、用键重新显示该语句,键重新显示该语句,输入输入:y1=2*sin(0.3*pi)/(1+sqrt(5)y1=0.5000注意:注意:(1)当命令行有错误,)当命令行有错误,Mat lab会用红色会用红色字体提示;字体提示;(2)同一行中若有多个表达式,则必须用)同一行中若有多个表达式,则必须用分号或逗号隔开,若表达式后面是分号,分号或逗号隔开,若表达式后面是分号,将不显示结果。将不显示结果。(3)输入为:输入为:Mat lab的变量及管理的变量及管理1、变量名的命名规则、变量名的命名规则(1)以字母开头,后面可跟字母、数字和)以字母开头,后面可跟字母、数字和下短线;下短线;(2)大小写字母有区别;)大小写字母有区别;(3)不超过)不超过31个字符。个字符。Example:fun,Zheng122、Mat lab的预定义变量的预定义变量ansans用于结果的缺省变量名用于结果的缺省变量名用于结果的缺省变量名用于结果的缺省变量名pipi圆周率圆周率圆周率圆周率epseps计算机的最小数计算机的最小数计算机的最小数计算机的最小数=infinf无穷大无穷大无穷大无穷大NaNNaN不定值不定值不定值不定值i i 或或或或 j j-1-1的开方的开方的开方的开方=realminrealmin最小可用正实数最小可用正实数最小可用正实数最小可用正实数=realmaxrealmax最大可用正实数最大可用正实数最大可用正实数最大可用正实数=3、Mat lab的变量管理的变量管理(1)who-查询查询Mat lab内存变量;内存变量;whos-查询全部变量详细情况查询全部变量详细情况。(2)clear-清除内存中的全部变清除内存中的全部变量。量。(3)save sa X -将将X 变量保存到变量保存到sa.mat文件。文件。(4)load sa X -调用调用sa.mat文件中变量文件中变量X。注意:注意:save只对数据和变量保存,不能保存命令只对数据和变量保存,不能保存命令。Mat lab的函数的函数函数名函数名函数名函数名解释解释解释解释Mat labMat lab函数命令函数命令函数命令函数命令幂函数幂函数幂函数幂函数xaxasqrt(x)=x(1/2)sqrt(x)=x(1/2)指数函数指数函数指数函数指数函数axaxexp(x)exp(x)对数函数对数函数对数函数对数函数log(x)log(x)log2(x)log2(x)log10(xlog10(x)函数名函数名函数名函数名 解释解释解释解释Mat labMat lab函数命令函数命令函数命令函数命令三三三三角角角角函函函函数数数数sin(x)sin(x)cos(x)cos(x)tan(x)tan(x)cot(x)cot(x)sec(x)sec(x)csc(x)csc(x)函数名函数名函数名函数名解释解释解释解释Mat labMat lab函数命函数命函数命函数命令令令令反反反反三三三三角角角角函函函函数数数数asin(x)asin(x)acos(x)acos(x)atan(x)atan(x)acot(x)acot(x)asec(x)asec(x)acsc(x)acsc(x)绝对值绝对值绝对值绝对值函数函数函数函数abs(x)abs(x)Matlab矩阵基本操作手动输入矩阵;Matlab提供了四个生成矩阵的基本函数Matlab常用命令最大值和最小值:max,min求和,乘积和差分:sum,cumsum乘积:prod,cumprod统计命令:mean,median,median,std协方差和相关系数:cov,corrcoef排序:sort,sortrows统计频数直方图和棒图:hist,bar,stairs,barth,stem,pareto,pie