广金大数据工具应用第二次实验报告答案(共12页).doc
《广金大数据工具应用第二次实验报告答案(共12页).doc》由会员分享,可在线阅读,更多相关《广金大数据工具应用第二次实验报告答案(共12页).doc(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上广东金融学院实验报告课程名称:大数据工具应用实验编号及实验名称实验二 数据分析入门(一)学院姓 名学 号班 级实验地点新电1001实验日期2018.11.19实验时数2指导老师钟雪灵同组其他成员无成 绩一、实验目的及要求通过实验进一步掌握大数据工具的基础知识,独立使用工具获取网页数据并对数据进行预处理。二、实验环境及相关情况(包含使用软件、实验设备、主要仪器及材料等)1使用软件:Weka2 实验设备:装有Windows 7的联网的个人计算机三、实验内容1. 完成bank-data.xlsx文件到arff文件的转换。2. 对weather.nominal.arff数据集
2、中的数值型属性“温度(temperature)”离散成低温(cool),中温(mild),高温(hot)三个等级。3. 生成weather.nominal.arff数据集的决策树。4. 对CPU.arff数据集使用M5P分类器进行线性回归。5. 使用SimpleKMeans聚类器对weather.numeric.arff数据集进行聚类,选择2个簇和欧氏距离,其他参数保持默认值,忽略play属性。6. 使用EM聚类器对weather.numeric.arff数据集进行聚类,选择2个簇,其他参数保持默认值,忽略play属性。四、实验结果(对必要的实验步骤进行截图,并加以文字描述)1、完成bank-
3、data.xlsx文件到arff文件的转换。(1)打开“bank-data.xlsx”-点击“文件”-点击“另存为”-保存类型选中“CSV(逗号分隔)”-点击“保存”。(2)打开weka-点击“Tools”-点击“ArffViewer”-点击“File-open” 文件类型选中“所有文件”-选中“bank-data.csv”-“打开” 点击“file”-点击“save as”-文件类型选中“Arff data files ”-“保存”2、对weather.nominal.arff数据集中的数值型属性“温度(temperature)”离散成低温(cool),中温(mild),高温(hot)三个等
4、级。(1)打开weka-点击“Explorer”-点击“Open file”-选中“weather.numeric.arff”-点击“打开”点击“Choose”-选中“Discretize”-点击空白处-在 “attributelndices”中输入2,在“bins”中输入3,其他保持不变-点击“OK”,再点击“Apply”为避开可读性较差的问题,先另存为,点击“Save”。(2)打开“word”,打开“weather.numeric.arff”这个文件选中“(-inf-71”,点击“替换”选中 “(71-78”,替换成“mild”选中“(78-inf)”,替换成“hot”点击“保存”。(3)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 广金大 数据 工具 应用 第二次 实验 报告 答案 12
限制150内