应用统计分析实验R软件分析解析ppt课件.ppt
《应用统计分析实验R软件分析解析ppt课件.ppt》由会员分享,可在线阅读,更多相关《应用统计分析实验R软件分析解析ppt课件.ppt(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用统计分析实验应用统计分析实验 R R软件软件R软件软件:免费的:免费的,志愿者管理的软件。志愿者管理的软件。u编程方便,语言灵活,图形功能强大编程方便,语言灵活,图形功能强大u有不断加入的各个方向统计学家编写的统计软有不断加入的各个方向统计学家编写的统计软件包。也可以自己加入自己算法的软件包件包。也可以自己加入自己算法的软件包.u这是发展最快的软件,受到世界上统计师生的这是发展最快的软件,受到世界上统计师生的欢迎。是用户量增加最快的统计软件。欢迎。是用户量增加最快的统计软件。u对于一般非统计工作者来说,主要问题是它没对于一般非统计工作者来说,主要问题是它没有有“傻瓜化傻瓜化”。 R免费免费
2、 资源公开资源公开(不是黑盒子不是黑盒子,也不是吝啬鬼也不是吝啬鬼) R可以在可以在UNIX, Windows和和Macintosh运行运行. R 有优秀的有优秀的内在帮助系统内在帮助系统. R有优秀的有优秀的画图功能画图功能 学生能够轻松地学生能够轻松地转转到商业支持的到商业支持的 S-Plus程序程序(如如果需要使用商业软件果需要使用商业软件) R语言有一个语言有一个强大的强大的,容易学习容易学习的语法的语法,有许多内有许多内在的统计函数在的统计函数. 通过用户自编程序通过用户自编程序, R语言很容易延伸和扩大语言很容易延伸和扩大. 它它就是这样成长的就是这样成长的. R 是计算机编程语言
3、是计算机编程语言. 类似于类似于UNIX语言语言,C语语言言,Pascal,Gauss语言等语言等. 对于熟练的编程者对于熟练的编程者, 它将觉得该语言比其他语言它将觉得该语言比其他语言更熟悉更熟悉. 而对计算机初学者而对计算机初学者, 学习学习R语言使得学习下一步语言使得学习下一步的其他编程不那么困难的其他编程不那么困难. 那些傻瓜软件那些傻瓜软件(SAS,SPSS等等)语言的语法则完全语言的语法则完全不同不同.R的历史的历史 S语言在语言在1980年代后期在年代后期在AT&T实验室开发实验室开发. R 项目由项目由Auckland 大学统计系的大学统计系的Robert Gentleman和
4、和Ross Ihaka于于1995年开始的年开始的. 它很快得到广泛用户的欢迎它很快得到广泛用户的欢迎. 目前它是由目前它是由R核心核心发展团队维持发展团队维持;它是一个由志愿者组成的工作努它是一个由志愿者组成的工作努力的国际团队力的国际团队下载下载R软件软件http:/www.r-project.org学习网站http:/www.biosino.org/pages/newhtm/r/schtml/一一R软件的使用软件的使用1. 基本语法基本语法2. 向量、矩阵向量、矩阵 3. list与与data.frame4. 读写数据文件读写数据文件5. 控制语句与自定义函数控制语句与自定义函数二二.
5、数据描述性分析数据描述性分析1.分布分布2.统计量统计量3.一维数据的统计图形一维数据的统计图形4.多维数据的图形表示多维数据的图形表示R软件三三. 回归分析回归分析四四. 判别分析判别分析五五. 聚类分析聚类分析六六. 主成分分析主成分分析4. 查看帮助,例如: help(round), ?abs随机向量随机向量 rnorm(10) #10个服从标准正态分布的随机数个服从标准正态分布的随机数z=1:5z7=8;z1 1 2 3 4 5 NA 8 # 缺失数据缺失数据 NAzc(1,3,5)=1:3; z1 1 2 2 4 3 NA 8 # 函数函数is.na()判断数据是否缺失判断数据是否缺
6、失 ,将其为真的赋为将其为真的赋为0zz0,n #第第n列大于列大于0的元素的元素x,-c(1,3) #没有第没有第1、3列的列的x.x-2,-c(1,3) #没有第没有第2行、第行、第1、3列的列的x. names(stu) #得到所有的变量名得到所有的变量名 stu=data.frame(name=c(“john”,”wuji”), age=c(30,32) x=data.frame(matrix(1:6,nrow=2) names(stu) #得到所有的变量名得到所有的变量名 rownames(stu) #得到行名得到行名 attach(x) #把数据框中的变量链接到内存中把数据框中的变
7、量链接到内存中 x=matrix(1:6,2,3)x=data.frame(x);x X1 X2 X31 1 3 52 2 4 6x$X21 3 4attributes(x)$names1 “X1 “X2 “X3“$row.names1 1 2“$class1 data.framex=data.frame(id=101:120,score=round(rnorm(20,70,10)xseq(1,10,2),xorder(x2,decreasing = T ),xx260,dnorm() #计算正态分布的密度函数计算正态分布的密度函数pnorm() #计算正态分布的分布函数计算正态分布的分布函数
8、qnorm() #计算正态分布的分位数计算正态分布的分位数rnorm() #计算正态分布的随机数计算正态分布的随机数其它分布的关键词:其它分布的关键词:unif , exp,chisq, t, f, binom, poisdexp(2,10 )runif(10,0,10)mean(), median(),quantile(),var(),sd(),cor()sum(),max(),min()summary()table() #列联表列联表x = c(10,71:78, 90) xm - mean(x) c(xm, mean(x, trim = 0.10) A = cbind(c(90,60,7
9、0),c(85,66,95)apply(A,1,mean) # 对每一行取平均apply(A,2,mean) #对每一列取平均var(A)cor(A)x=seq(-10,10,2); y=rnorm(11)plot(x, y) plot(x, y,main=散点图散点图,xlab=横坐标横坐标x,ylab=纵坐标纵坐标y)text(x,y, 1:length(x),-1) # 写入点序号写入点序号,第三个参数默认如此第三个参数默认如此plot(x,y,type = o, col = red,pch=2,lty=3)1.散点图散点图 plot(x,y,) type=“p” #散点图,默认散点图,
10、默认type=“l #绘实线绘实线type=“o” #实线通过所有的点实线通过所有的点type=“n” #不画点不画点参数参数lty表示线的类型表示线的类型0=blank, 1=solid (default), 2=dashed, 3=dotted, 4=dotdash, 5=longdash, 6=twodash 低水平作图函数还有低水平作图函数还有points()lines()ablines()text()legend()x=seq(-10,10,2); y=rnorm(11)par(mfrow=c(3,1) #准备画准备画3个图个图plot(x, y) plot(x, y,main=散点
11、图散点图,xlab=横坐标横坐标x,ylab=纵坐标纵坐标y)text(x,y, 1:length(x),-1) # 写入点序号写入点序号plot(x,y,type = o, col = red,pch=2,lty=3)2.散点图矩阵散点图矩阵 pairs(x,)A=matrix(rnorm(12,70,20),nrow=4)pairs(A)3. 多组散点图多组散点图matplot(x,y,)x=seq(0,2*pi,0.2)matplot(x,cbind(sin(x),cos(x),type=c(“o”,”o”),col=2:3)4.星座图星座图 5.脸谱图脸谱图library(aplpac
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计分析 实验 软件 分析 解析 ppt 课件
限制150内