教学课件(02)第2章R语言数据处理(R 语言-1).pptx





《教学课件(02)第2章R语言数据处理(R 语言-1).pptx》由会员分享,可在线阅读,更多相关《教学课件(02)第2章R语言数据处理(R 语言-1).pptx(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、教材配套资源页完整PPT课件教学课件(02)第2章 R语言数据处理(R 语言-1)2 - 2数据分析基础R语言实现(贾俊平)2022-7-11课程结构第1章 数据分析与R语言第2章 R语言数据处理第3章 数据可视化分析第4章 数据的描述分析第5章 推断分析基本方法第6章 相关与回归分析第7章 时间序列分析2 - 3数据分析基础R语言实现(贾俊平)2022-7-112 - 4数据分析基础R语言实现(贾俊平)2022-7-11l 学习目标学习目标掌握R语言的数据类型及其处理方法使用R语言进行数据抽样和筛选掌握数据类型转换的方法用R语言生成频数分布表l 思政目标思政目标数据处理是数据分析的前期工作。
2、在数据处理过程中要本着实事求是的态度,避免为达到个人目的而有意加工和处理数据数值数据分组的目的是通过数据组别对实际问题进行分类,分组的应用要反映社会正能量,避免利用不合理的分组歪曲事实学习目标和思政目标2 - 5数据分析基础R语言实现(贾俊平)2022-7-11l在R中分析数据或创建一个图形时,首先要有分析或绘图的数据集(data set)lR处理的数据集类型包括向量(vector)、矩阵(matrix)、数 组 ( a r r a y ) 、 数 据 框( d a t a f r a m e ) 、 因 子(factor)、列表(list)等 R 的数据类型及其操作向量向量l向量是个一维数组
3、,其中可以是数值型数据,也可以是字符数据或逻辑值(如TRUE或FALSE)l要在R中录入一个向量,可以使用c函数,将不同元素组合成向量。也可以使用seq函数、rep函数等产生向量l同一个向量中的元素只能是同一类型的数据,不能混杂访问向量中的元素访问向量中的元素l使用表示下标的方括号“ ”可以访问向量中的元素2 - 6数据分析基础R语言实现(贾俊平)2022-7-11矩阵矩阵l 二维数组,其中的每个元素都是相同的数据类型l 用matrix函数可以创建矩阵l 使用as.matrix函数可以将其他类型的数据转化成矩阵l 使用rownames函数和colnames函数可以矩阵添加行名和列名l 可使用t
4、函数可以对矩阵做转置 R 的数据类型及其操作2 - 7数据分析基础R语言实现(贾俊平)2022-7-11数据框数据框l数据框是一种表格结构的数据,类似于Excel中的数据表,也是较为常见的数据形式 创建数据框创建数据框l 使用data.frame函数可创建数据框 R 的数据类型及其操作查看数据框查看数据框l输入数据的名称可以显示全部数据;使用head(数据框名称)默认显示数据的前6行;使用tail(数据框名称)默认显示数据的后6行;使用class函数可以查看数据的类型;使用nrow函数和ncol函数可以查看数据框的行数和列数;使用dim函数可以同时查看数据框的行数和列数;当数据量比较大时,可以
5、使用str函数查看数据的结构2 - 8数据分析基础R语言实现(贾俊平)2022-7-11访问数据框访问数据框l如果需要访问数据框中的某个变量或某些变量,也就是要对数据框中的特定变量进行分析,需用“$”符号指定要分析的变量,也可以使用下标 进行指定 数据框数据框的合并的合并l使用rbind函数可以将不同的数据框按行合并;使用cbind函数可以将不同的数据框按列合并。需要注意,按行合并时,数据框中的列名称必须相同,按列合并时,数据框中的行名称必须相同,否则合并是没有意义的 R 的数据类型及其操作数据框排序数据框排序l使用sort函数可以对向量排序,函数默认decreasing=FALSE(默认的参
6、数设置可以省略不写),即升序排列,降序时,可设置参数decreasing=TRUEl如果要对整个数据框中的数据进行排序,排序结果与数据框中的行变量对应,则可以使用base包中的order函数、dplyr包中的arrange函数等,函数默认按升序排列,降序时,设置参数desc(变量名)即可2 - 9数据分析基础R语言实现(贾俊平)2022-7-11因子因子l类别变量在R语言中称为因子(factor),因子的取值称为水平(level)。很多数据结构中都包含因子,分析或绘图时通常会按照因子的水平进行分类处理l使用factor函数可以将向量编码为因子l使用as.numeric函数将因子转换为数值l使用
7、factor函数(参数设置ordered=TRUE)还可以将无序因子编码为有序因子 R 的数据类型及其操作列表列表l列表是一些对象的集合,它是R语言中较复杂的数据形式l一个列表中可能包含若干向量、矩阵、数据框等。使用list函数可以创建列表l读者使用help(list)查阅帮助2 - 10数据分析基础R语言实现(贾俊平)2022-7-11抽取简单随机样本抽取简单随机样本l从一个已知的总体数据集中抽取随机样本可以采取不同的抽样方法,对应的R函数也不同l使用base包中的sample函数可以从一个已知的数据集中抽取简单随机样本,也可以用于抽取符合特定条件的数据l使用sampling包中的strat
8、a函数可以进行分层抽样l使用srswr函数采取有放回抽样方式抽取简单随机样本,使用srswor 函数可以采取无放回抽样方式抽取简单随机样本l使用doBy包的systematic函数可以进行系统抽样 数据抽样和筛选R 函数函数 sample2 - 11数据分析基础R语言实现(贾俊平)2022-7-11数据筛选数据筛选(data filter)l根据需要找出符合特定条件的某类数据。比如,找出每股盈利在2元以上的上市公司;找出考试成绩在90分及以上的学生,等等l使用R中的sample函数和which函数、dplyr包中的filter函数等均可以阿数据筛选 数据抽样和筛选生成随机数生成随机数l生成某种
9、分布的随机数用于模拟分析l用R软件产生随机数十分简单,只需在相应分布函数的前面加上字母r即可l由于是随机生成,每次运行会得到不同的随机数。要想每次运行都产生相同的一组随机数,可在生成随机数之前使用函数set.seed()设定随机数种子。可在括号内可输入任意数字,如set.seed(12)。使用相同的随机数种子,每次运行都会产生一组相同的随机数2 - 12数据分析基础R语言实现(贾俊平)2022-7-11将变量转换成向量将变量转换成向量l为方便分析,可以将数据框中的某个变量转换为一个向量,也可以将几个变量合并转换成一个向量(注意:只有数据合并有意义时转换才有价值) 数据类型的转换将数据框转换成矩
10、阵将数据框转换成矩阵R 函数函数 as.vector 学生姓名 统计学 数学 经济学1 刘文涛 68 85 842 王宇翔 85 91 633 田思雨 74 74 614 徐丽娜 88 100 495 丁文彬 63 82 89 统计学 数学 经济学刘文涛 68 85 84王宇翔 85 91 63田思雨 74 74 61徐丽娜 88 100 49丁文彬 63 82 89数据框数据框矩阵矩阵2 - 13数据分析基础R语言实现(贾俊平)2022-7-11 数据类型的转换将将短格式转化成长格式短格式转化成长格式l将短格式数据转化成长格 式 数 据 , 可 以 使 用reshape2包中的melt函数、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件02第2章 R语言数据处理R 语言-1 教学 课件 02 语言 数据处理

限制150内