应用统计分析实验R软.ppt
《应用统计分析实验R软.ppt》由会员分享,可在线阅读,更多相关《应用统计分析实验R软.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用统计分析实验应用统计分析实验 R R软件软件SPSS:这是一个很受欢迎的统计软件这是一个很受欢迎的统计软件u容易操作,容易操作,u输出漂亮,输出漂亮,u功能齐全,功能齐全,u价格合理。价格合理。u对于非统计工作者是很好的选择。对于非统计工作者是很好的选择。ExcelExcel:严格说来不是统计软件,但作为数据表:严格说来不是统计软件,但作为数据表格软件,必然有一定统计计算功能。格软件,必然有一定统计计算功能。u多数装多数装OfficeOffice时没有装数据分析的功能,画图时没有装数据分析的功能,画图功能都具备功能都具备(虽然不好看虽然不好看)。u对于简单分析,对于简单分析,ExcelEx
2、cel还算方便,但随着问题还算方便,但随着问题的深入,就不那么的深入,就不那么“傻瓜傻瓜”,需要很麻烦地使,需要很麻烦地使用函数,甚至根本没有相应的方法了。用函数,甚至根本没有相应的方法了。SAS:这是功能这是功能非常非常齐全的软件;齐全的软件;u美国政府政策倾斜美国政府政策倾斜(“权威性权威性”)u许多美国公司使用。许多美国公司使用。u价格不菲价格不菲,每年交费每年交费.即使赠送即使赠送,条件苛刻条件苛刻u尽管现在已经尽量尽管现在已经尽量“傻瓜化傻瓜化”,仍然需要一定的,仍然需要一定的训练才可以进入。训练才可以进入。S-plus:这是统计学家喜爱的软件。:这是统计学家喜爱的软件。u功能齐全,
3、图形漂亮功能齐全,图形漂亮u有不断加入的各个方向统计学家编写的统计软件有不断加入的各个方向统计学家编写的统计软件包。也可以自己加入算法包。也可以自己加入算法.u强大而又方便的编程功能,使得研究人员可以编强大而又方便的编程功能,使得研究人员可以编制自己的程序来实现自己的理论和方法。制自己的程序来实现自己的理论和方法。u它也在进行它也在进行“傻瓜化傻瓜化”以争取顾客。但主要以其以争取顾客。但主要以其方便的编程为顾客所青睐。但是对于不会编程者方便的编程为顾客所青睐。但是对于不会编程者,不那么不那么“傻瓜傻瓜”R软件软件:免费的:免费的,志愿者管理的软件。志愿者管理的软件。u编程方便,语言灵活,图形功
4、能强大编程方便,语言灵活,图形功能强大u有不断加入的各个方向统计学家编写的统计软件有不断加入的各个方向统计学家编写的统计软件包。也可以自己加入自己算法的软件包包。也可以自己加入自己算法的软件包.u这是发展最快的软件,受到世界上统计师生的欢这是发展最快的软件,受到世界上统计师生的欢迎。是用户量增加最快的统计软件。迎。是用户量增加最快的统计软件。u对于一般非统计工作者来说,主要问题是它没有对于一般非统计工作者来说,主要问题是它没有“傻瓜化傻瓜化”。Minitab:这个软件是很方便的功能强大而又齐:这个软件是很方便的功能强大而又齐全的软件,也已经全的软件,也已经“傻瓜化傻瓜化”,在我国用的不如,在我
5、国用的不如SPSS与与SAS那么普遍。那么普遍。Eviews:这是一个主要处理回归和时间序列的:这是一个主要处理回归和时间序列的软件。软件。GAUSS:这是一个很好用的统计软件,许多搞:这是一个很好用的统计软件,许多搞经济的喜欢它。主要也是编程功能强大。目前在经济的喜欢它。主要也是编程功能强大。目前在我国使用的人不多。我国使用的人不多。MATLAB:这也是应用于各个领域的以编程为主这也是应用于各个领域的以编程为主的软件,在工程上应用广泛。但是统计方法不多。的软件,在工程上应用广泛。但是统计方法不多。使用傻瓜软件的问题使用傻瓜软件的问题.无法任意取出计算过程中产生的任何中间结果无法任意取出计算过
6、程中产生的任何中间结果;只能输出软件规定的输出只能输出软件规定的输出.无法在中间插入任何算法无法在中间插入任何算法.无法实现软件所没有的计算无法实现软件所没有的计算.无法实现任何方法无法实现任何方法或计算方面的创新或计算方面的创新.是输入输出皆有限制的黑盒子是输入输出皆有限制的黑盒子.用语句的任何计算用语句的任何计算(即使即使1+1=2)1+1=2)都需类似八股都需类似八股文的文的“花架子花架子”.”.搞统计是否不需要学习编程语言,可以不学习搞统计是否不需要学习编程语言,可以不学习,如果你如果你搞纯粹数学推导的搞纯粹数学推导的,只搞只搞“理论理论”,”,不面对数据不面对数据,不用计算机不用计算
7、机觉得岁数太大觉得岁数太大,学不会学不会“非傻瓜非傻瓜”的计算的计算不想有创新不想有创新,仅使用现成方法套用仅使用现成方法套用但如果你要创新但如果你要创新你需要反复试验你的新方法你需要反复试验你的新方法需要用各种数据来检验你的新方法需要用各种数据来检验你的新方法需要把你的方法和老方法进行比较需要把你的方法和老方法进行比较需要介绍自己的新方法需要介绍自己的新方法使用编程语言不可避免使用编程语言不可避免R软件R免费免费 资源公开资源公开(不是黑盒子不是黑盒子,也不是吝啬鬼也不是吝啬鬼)R可以在可以在UNIX,Windows和和Macintosh运行运行.R 有优秀的有优秀的内在帮助系统内在帮助系统
8、.R有优秀的有优秀的画图功能画图功能学生能够轻松地学生能够轻松地转转到商业支持的到商业支持的 S-Plus程序程序(如如果需要使用商业软件果需要使用商业软件)R语言有一个语言有一个强大的强大的,容易学习容易学习的语法的语法,有许多内有许多内在的统计函数在的统计函数.通过用户自编程序通过用户自编程序,R语言很容易延伸和扩大语言很容易延伸和扩大.它就是这样成长的它就是这样成长的.R 是计算机编程语言是计算机编程语言.类似于类似于UNIX语言语言,C语言语言,Pascal,Gauss语言等语言等.对于熟练的编程者对于熟练的编程者,它将觉得该语言比其他语言它将觉得该语言比其他语言更熟悉更熟悉.而对计算
9、机初学者而对计算机初学者,学习学习R语言使得学习下一步语言使得学习下一步的其他编程不那么困难的其他编程不那么困难.那些傻瓜软件那些傻瓜软件(SAS,SPSS等等)语言的语法则完全不语言的语法则完全不同同.R的历史的历史S语言在语言在1980年代后期在年代后期在AT&T实验室开发实验室开发.R 项目由项目由Auckland 大学统计系的大学统计系的Robert Gentleman和和Ross Ihaka于于1995年开始的年开始的.它很快得到广泛用户的欢迎它很快得到广泛用户的欢迎.目前它是由目前它是由R核心核心发展团队维持发展团队维持;它是一个由志愿者组成的工作努它是一个由志愿者组成的工作努力的
10、国际团队力的国际团队下载下载R软件软件学习网站1R软件的使用软件的使用1.基本语法基本语法2.向量、矩阵向量、矩阵 3.list与与4.读写数据文件读写数据文件5.控制语句与自定义函数控制语句与自定义函数二二.数据描述性分析数据描述性分析1.分布分布2.统计量统计量3.一维数据的统计图形一维数据的统计图形4.多维数据的图形表示多维数据的图形表示R软件三三.回归分析回归分析四四.判别分析判别分析五五.聚类分析聚类分析六六.主成分分析主成分分析n 基本语法基本语法1.1.变量使用即定义变量使用即定义变量使用即定义变量使用即定义,变量名区分大小写变量名区分大小写变量名区分大小写变量名区分大小写,可用
11、中文命名可用中文命名可用中文命名可用中文命名 变量赋值可采用变量赋值可采用变量赋值可采用变量赋值可采用4 4种形式:种形式:种形式:种形式:=,,assign(),assign()变量类型自动由变量赋值确定。变量类型自动由变量赋值确定。变量类型自动由变量赋值确定。变量类型自动由变量赋值确定。#注释符号注释符号注释符号注释符号,分号分号分号分号;语句连接符语句连接符语句连接符语句连接符例子:例子:例子:例子:a=10 aa assign(“a”,10)a=10 aa assign(“a”,10)A=10 AA assgin(ab,200)A=10 AA assgin(ab,200)中国中国中国中
12、国=“=“中华人民共和国中华人民共和国中华人民共和国中华人民共和国”#生成字符串变量生成字符串变量生成字符串变量生成字符串变量assign(“assign(“中国中国中国中国”,“”,“中华人民共和国中华人民共和国中华人民共和国中华人民共和国”)a=10;A=10;a;A2.算术运算符算术运算符:+,-,*,/,(乘方乘方),%(模模),%/%(整整除除)3.常用的数学函数有常用的数学函数有:abs,sign,log,log2,log10,sqrt,exp,sin,cos,tan,acos,asin,atan,cosh,sinh,tanh4.查看帮助,例如:help(round),?absn
13、向量、矩阵向量、矩阵 1.1.向量向量向量向量 (一维数组一维数组一维数组一维数组,下标从下标从下标从下标从1 1开始开始开始开始)2.2.a=c(d1,d2,d3,)a=c(d1,d2,d3,)间隔为间隔为间隔为间隔为1 1的等差序列的等差序列的等差序列的等差序列:a:ba:b 指定间隔的等差序列指定间隔的等差序列指定间隔的等差序列指定间隔的等差序列:seq(from,to,byseq(from,to,by)seq(lengthseq(length=,from=,by=)=,from=,by=)重复函数:重复函数:重复函数:重复函数:rep(vecrep(vec,times),times)r
14、ep(vec,times,lenrep(vec,times,len=,each=)=,each=)a=c(3,5,8,10)a=c(3,5,8,10)a=1:10;b=seq(1,10,2);c=rep(a,2,each=3)a=1:10;b=seq(1,10,2);c=rep(a,2,each=3)a=seq(-pi,pi,0.2)a=seq(-pi,pi,0.2)随机向量随机向量 rnorm(10)#10个服从标准正态分布的随机数个服从标准正态分布的随机数z=1:5z7=8;z1 1 2 3 4 5 NA 8#缺失数据缺失数据 NAzc(1,3,5)=1:3;z1 1 2 2 4 3 NA
15、 8 zis.na(z)=0 zis.na(z)=0#函数函数()判断数据是否缺失判断数据是否缺失,将其为真的赋为将其为真的赋为0 zz0,1#第第1列大于列大于0的元素的元素x,-c(1,3)#没有第没有第1、3列的列的x.x-2,-c(1,3)#没有第没有第2行、第行、第1、3列的列的x.5.5.基本矩阵运算基本矩阵运算基本矩阵运算基本矩阵运算 矩阵间四则运算:矩阵间四则运算:矩阵间四则运算:矩阵间四则运算:+,-,*,/+,-,*,/分别是对应元素的四则运算分别是对应元素的四则运算分别是对应元素的四则运算分别是对应元素的四则运算 向量矩阵间:向量按列匹配与矩阵运算向量矩阵间:向量按列匹配
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计分析 实验
限制150内