数据分析与数据挖掘.docx
《数据分析与数据挖掘.docx》由会员分享,可在线阅读,更多相关《数据分析与数据挖掘.docx(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、实验目的1,使用数据挖掘中的算法,使用IBK, tree.J48, bayes.BayesNet三个算法2,应用不同的分类算法,比拟他们之间的差距,选出最正确算法3, 了解weka平台的基本操作还有使用的方法实验的环境Windows7+weka实验内容与步骤1,数据的准备及预处理:使用数据集为weather.symbolic2,数据集属性:序号标签计数权重1sunny55.02overcast44.03rainy55.0选择属性剔重:3名称:outlook 丧失:0 (0%)类型:标准唯一:0 (0%)3,数据集的可视化:4,三种分类算法并进行分析IBK算法(k最近邻算法分类),数据集weat
2、her.symbolic的拆分比例为66%,使用交叉验 证,从图中可以看出,在IBK算法下weather.symbolic数据集正确分类的数据量为8, 成功率为57.1429%,错误分类的数据量为6,失败率为42.8571%。tree.48算法(决策树算法分类),数据集weather.symbolic的拆分比例为66%,使用交 叉验证,从图中可以看出,在IBK算法下weather.symbolic数据集正确分类的数据量为 7,成功率为50%,错误分类的数据量为7,失败率为50虬bayes.BayesNet算法),数据集weather.symbolic的拆分比例为66%,使用交叉验证, 从图中可
3、以看出,在IBK算法下weather.symbolic数据集正确分类的数据量为8,成功 率为57.1429%,错误分类的数据量为6,失败率为42.8571%。5 .比拟三种分类算法方法的实验结果根据实验的结果,比拟每种算法的结果,那么可以使用IBK算法和算 法,因为他们两个的成功率为57.1429%,失败率为42.8571%,而使用48算法的时候成 功率为50%,失败率为50%,数据集weather.symbolic使用IBK算法和 算法最好,准确率高。6 .实验总结在这个wake平台,在实验的过程中,了使用三种算法来比拟他们的实验结果, 从而选择一个最好的算法进行数据的挖掘,我们学会了怎样使用这个平台, 对我们有极大的帮助和了解。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 挖掘
限制150内