R语言数据分析与挖掘(谢佳标微课版) 习题及答案chapter05.docx
《R语言数据分析与挖掘(谢佳标微课版) 习题及答案chapter05.docx》由会员分享,可在线阅读,更多相关《R语言数据分析与挖掘(谢佳标微课版) 习题及答案chapter05.docx(1页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一、多选题1 .常用的数据变换手段有(A BCD)A.产生衍生变量B.标准化变换C.连续型离散化变换D.改善变量分布的变换2 .数据清洗常用在以下方面(ABC D)A.数据不一致情况B.统一维度编码C.异常值处理D.缺失值处理3 .异常值判断及处理常用手段有(ABCDE)A.简单统计分析B. 3sigma 原则C.箱型图分析D.聚类分析E. LOF (局部异常因子)检测异常值4.识别缺失值常用函数有(AC )A. is.na 函数B. is.NA 函数C. complete.cases 函数D. complete.case 函数 二、上机题1.导入贷款数据accepts.csv到R中,对数据集
2、accepts按照变量badjnd进行等比例分析, 分成75%: 25%两份。#导入数据accepts - read.csv(accepts.csv)#对accepts按照变量badjnd进行等比例分析,分成75%: 25%两份 libra ry(caret)prop.table(table(accepts$bad_ind)index - createDataPartition(accepts$bad_ind,times = l,p = 0.75Jist = F)train - acceptsindex, test - accepts-index, prop.table(table(train$badjnd) prop.table(table(test$bad ind)2.对缺失值模式进行探索,利用表格和可视化的方式进行展示。 对缺失值模式进行查看library(mice)md.pattern(accepts)library(VIM)aggr(accepts?prop=F,numbers=T)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- R语言数据分析与挖掘谢佳标微课版 习题及答案chapter05 语言 数据 分析 挖掘 谢佳标微课版 习题 答案 chapter05
限制150内