R语言(第一课)共13页word资料.doc
《R语言(第一课)共13页word资料.doc》由会员分享,可在线阅读,更多相关《R语言(第一课)共13页word资料.doc(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、如有侵权,请联系网站删除,仅供学习与交流R语言(第一课)【精品文档】第 12 页R语言基础篇简介:R语言在英文里写成R或R-project,最开始的时候,国内将R语言翻译成R软件,后来觉得不妥,翻译成R语言或R或环境,R语言是S语言的一种实现。S语言是国外学者开发的用来做数据探索、统计分析、作图的语言。R软件是一套完整的数据处理、计算和制图软件。用户可通过R软件的网站(http:/www.r_project.org)获得最新的R软件信息,并得到最新的应用统计软件包。说R是统计软件,还不如说是数学计算软件,因为它提供了若干统计程序包,各种数学计算、统计计算函数,包含了很多程序包。国外好多大学学生
2、,学的统计工具都是R语言,而国内最早应用它的大学是清华大学,学生为了参加世界数学建模大赛,目前只有中国人大、广东暨南大学统计专业才有教授R语言课程,人大肖凯老师在网上讲授R语言课程目前比较畅销。R语言是一种用于开源免费的用于数据分析的计算环境,是用于统计分析、绘图的语言和操作环境,是一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R语言参考书:R语言实用教程,薛毅,陈立萍编著,清华大学出版社,2014年10月第一版。1.下载安装R软件:R的网站:www.r-project.org,进入网站后出现画面:第一步:点击“CRAN”链接第二步:选择镜像china“ ”第三步
3、:选择“Download R for Windows”根据你的操作系统选择第四步:选择“base”第五步:选择“Download R 3.2.0 for Windows”下载安装.完成.二. R基础(用help(), 或 ? 求帮助, getwd()获得R的当前工作目录,#是注释符)1. R有两个主要概念:对象和函数,用赋值运算符赋给对象内容。 赋值运算符赋:尖括号和减号- 组成:- R变量x - 945xy - 39yy - 43 #刷新前面y的内容yz - 5w - z2wi - (z*2 + 45)/2 #用赋值表达式赋给对象内容i(34 + 90)/12.5 #只想知道结果 ls()
4、#知道当前对象rm(y) #删除当前对象,释放空间rm(z,w,i).完. R向量对象都有模式和长度属性,数据类型有:字符串、数值型、逻辑型、复数型。用小写c加括号建立向量,数值向量可以做四则运算v c(1,1,4,5) #向量做比较,产生的是逻辑向量F,T,F,F一个向量的所有元素必须具有相同的模式,即数据类型,否则强制转换v - c(4,7,23.5,76.2,80,rrt) #执行强制转换,字符值用单引号或双引号vu - c(4,6,NA,2) # NA代表缺失值uk - c(T,F,NA,TRUE)kv2 #向量的某个元素 v1 - hello vx - vector() #创建空向量
5、x3 - 45xlength(x)x10x5 - 4xv - c(45,243,78,343,445,44,56,77)vv - c(v5,v7) #创建向量子集v.完.# Vectorization R向量化函数的向量化,函数可以直接对向量的每个元素进行操作v - c(4,7,23.5,76.2,80)x - sqrt(v) #算术平方根xv1 - c(4,6,87)v2 - c(34,32,12)v1+v2v1 - c(4,6,8,24)v2 - c(10,2,4) #重复循环短的向量v1+v2v1 - c(4,6,8,24)2*v1ages-c(li=33,zhang=29,liu=18
6、) #带字符下标的向量names(ages) #给向量各元素起名字ages“liu”或agesliu或ages3 #取向量某元素fruit-c(5,10,1,20)names(fruit)-c(orange,banana,apple,peach) #给向量取名字fruit与数值向量有关的函数max(x) # 求向量最大值min(x) # 求向量最小值range(x) # 求向量的范围sum(x) # 求向量各分量之和prod(x) # 求向量各分量之积length(x) # 求向量各分量的个数(维数).完.# Factors 因子因子处理分类数据,数据集中有取值个数固定的名义变量,因子特别有用
7、,因子用水平来表示所有可能的数值。factor(x=character,levels,labels=levels,exclude=NA,ordered=is.ordered(x)X为数据向量,也是被转换成因子的向量,levels为可选向量,表示因子水平,当此参数取默认值时,由x元素中的不同值来确定,labels指定各水平名称,默认时取levels值,exclude为从x中删除的水平值,默认值NA,ordered为逻辑变量,取TURE为水平有次序,否则FALSE无次序。g - c(f,m,m,m,f,m,f,m,f,f) #有10个人的性别向量gg - factor(g) #把这个向量转换为因子
8、g gg - factor(c(m,m,m,m,m),levels=c(f,m) #有5个男性,要与g有相同的水平(数值个数) gggg - factor(c(m,m,m,m,m) #否则只有1个水平个数ggtable(g) # table()计算每个值的发生次数table(gg)is.factor(g) #查看对象是否为因子as.factor() #强制转化为因子levels(g) #查看因子的水平 g - c(1,2,3,2,3,1,1,1) g - factor(g) levels(g)-c(I,II,III) #为因子的水平赋值 gg - factor(c(f,m,m,m,f,m,f,
9、m,f,f) a - factor(c(adult,adult,juvenile,juvenile,adult,adult, adult,juvenile,adult,juvenile)t - table(a) #统计各因子水平出现的频数t - table(g) t - table(a,g) # table()用于获取多个因子的交叉表margin.table(t,1) # a的水平数margin.table(t,2) # g的水平数prop.table(t,1) # 按行算总数,table(a,g)阵中的元素与总数比prop.table(t,2) # 按列算总数,table(a,g)阵中的元素
10、与总数比prop.table(t) # 各元素总和算总数,table(a,g)阵中的元素与总数比 生成序列seq(),rep() ,gl()x - 1:100010:15-1 #冒号优先10:(15-1)5:0 #递减seq(-4,1,0.5) # seq()生成实数序列,步长0.5seq(from=1,to=5,length=4) # 生成4个数seq(from=1,to=5,length=2)seq(length=10,from=-2,by=0.2) #从-2开始生成10个数,步长0.2rep(5,10) # 生成10个5rep(hi,3)rep(1:2,3)rep(1:2,each=3)
11、gl(k,n)生成带有因子的序列,k因子水平个数,n每个水平的重复数gl(3,5)gl(2,5,labels=c(female,male) # labels代表因子数值名称rnorm(10) # 生成10个正态分布数# Indexing 数据子集x 0 #结果是逻辑值xx0 #结果是数值型xx 5xx 40 & x 100xc(4,6) #提取所在向量位置的元素x1:3 #提取前3个y - c(1,4)xyx-1 #排除第1个x-c(4,6)x-(1:3)x-0 #所有元素赋予0值x-0 矩阵和数组矩阵:数组储存的是多维数据元素,矩阵是数组的特殊情况matrix(data=NA,nrow=1,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语言 第一 13 word 资料
限制150内