欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    数据挖掘实验报告_计算机-数据挖掘与模式识别.pdf

    • 资源ID:94889297       资源大小:811.05KB        全文页数:16页
    • 资源格式: PDF        下载积分:5.3金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要5.3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数据挖掘实验报告_计算机-数据挖掘与模式识别.pdf

    .资料.数据挖掘实验报告 实验序号:实验项目名称:C4.5 算法 学 号 姓 名 专业、班 12 数学金融 实验地点 实验楼 5-510 指导教师 巍巍 实验时间 2014.12.24 一、实验目的及要求 1:选择一个数据挖掘标准数据集,采用 C4.5 算法进行分类,给出分类精度,画出用 C4.5 算法诱导的树并写出生成的规则集合。2:在数据挖掘标准数据集上,实验对比剪枝与未剪枝的树的分类性能。3:总结 C4.5 算法的优缺点 二、实验设备(环境)及要求 电脑 WEKA 3.6.1 三、实验容与步骤(3)数据分类(c4.5 算法实现)1.导入数据 .资料.实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.(2)选择 C4.5 分类器进行分类 结果为 其中分类精度为 50%生成的决策树为 实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.分类规则:J48 pruned tree-outlook=sunny|humidity=high:no(3.0)|humidity=normal:yes(2.0)outlook=overcast:yes(4.0)outlook=rainy|windy=TRUE:no(2.0)|windy=FALSE:yes(3.0)剪枝后结果为 实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.分类精度变为57.1%性能变好 (1)C4.5 算法优缺点 优点:分类精度高,生成的分类规则比较简单,易于理解。缺点:需要多次扫描数据集,比较低效 五、分析与讨论 六、教师评语 签名:日期:成绩 实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.数据挖掘实验报告 实验序号:实验项目名称:KNN 算法 学 号 姓 名 专业、班 12 数学金融 实验地点 实验楼 5-510 指导教师 巍巍 实验时间 2014.12.24 一、实验目的及要求 1:KNN 算法的基本思路、步骤。2:选择 UCI 中的 5 个标准数据集,使用 KNN 算法在该数据集上计算混淆矩阵。3:选择 2 个数据集,选择不同的 k 值,k=1,3,5,7,9,对比 KNN 算法计算结果的差异。二、实验设备(环境)及要求 电脑 WEKA 3.6.1 四、实验容与步骤 1.数据集 contact-lenses.arff Glass.arff 两者的混淆矩阵分别为 实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.(2)两个数据集在 K=1,3,5,7,9下结果分别为 Glass:K=1;=Summary=Correctly Classified Instances 151 70.5607%Incorrectly Classified Instances 63 29.4393%Kappa statistic 0.6005 Mean absolute error 0.0897 Root mean squared error 0.2852 Relative absolute error 42.3747%Root relative squared error 87.8627%Total Number of Instances 214 =Detailed Accuracy By Class=TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.786 0.167 0.696 0.786 0.738 0.806 build wind float 0.671 0.13 0.739 0.671 0.703 0.765 build wind non-float 0.294 0.051 0.333 0.294 0.313 0.59 vehic wind float 0 0 0 0 0?vehic wind non-float 0.769 0.03 0.625 0.769 0.69 0.895 containers 0.778 0.015 0.7 0.778 0.737 0.838 tableware 0.793 0.011 0.92 0.793 0.852 0.884 headlamps Weighted Avg.0.706 0.109 0.709 0.706 0.704 0.792 =Confusion Matrix=a b c d e f g -classified as 55 9 6 0 0 0 0|a=build wind float 15 51 4 0 3 2 1|b=build wind non-float 9 3 5 0 0 0 0|c=vehic wind float 0 0 0 0 0 0 0|d=vehic wind non-float 0 2 0 0 10 0 1|e=containers 0 1 0 0 1 7 0|f=tableware 0 3 0 0 2 1 23|g=headlamps K=3;实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.=Summary=Correctly Classified Instances 154 71.9626%Incorrectly Classified Instances 60 28.0374%Kappa statistic 0.6097 Mean absolute error 0.0983 Root mean squared error 0.2524 Relative absolute error 46.4438%Root relative squared error 77.7792%Total Number of Instances 214 =Detailed Accuracy By Class=TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.843 0.215 0.656 0.843 0.738 0.865 build wind float 0.711 0.138 0.74 0.711 0.725 0.835 build wind non-float 0.176 0.015 0.5 0.176 0.261 0.672 vehic wind float 0 0 0 0 0?vehic wind non-float 0.615 0.015 0.727 0.615 0.667 0.913 containers 0.778 0.01 0.778 0.778 0.778 0.914 tableware 0.793 0.011 0.92 0.793 0.852 0.885 headlamps Weighted Avg.0.72 0.123 0.718 0.72 0.708 0.847 =Confusion Matrix=a b c d e f g -classified as 59 10 1 0 0 0 0|a=build wind float 19 54 2 0 1 0 0|b=build wind non-float 10 4 3 0 0 0 0|c=vehic wind float 0 0 0 0 0 0 0|d=vehic wind non-float 0 3 0 0 8 0 2|e=containers 0 1 0 0 1 7 0|f=tableware 2 1 0 0 1 2 23|g=headlamps K=5;=Summary=Correctly Classified Instances 145 67.757%Incorrectly Classified Instances 69 32.243%Kappa statistic 0.5469 Mean absolute error 0.1085 实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.Root mean squared error 0.2563 Relative absolute error 51.243%Root relative squared error 78.9576%Total Number of Instances 214 =Detailed Accuracy By Class=TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.843 0.229 0.641 0.843 0.728 0.867 build wind float 0.684 0.174 0.684 0.684 0.684 0.848 build wind non-float 0 0.01 0 0 0 0.642 vehic wind float 0 0 0 0 0?vehic wind non-float 0.385 0.025 0.5 0.385 0.435 0.952 containers 0.667 0.01 0.75 0.667 0.706 0.909 tableware 0.793 0.016 0.885 0.793 0.836 0.89 headlamps Weighted Avg.0.678 0.142 0.635 0.678 0.651 0.853 =Confusion Matrix=a b c d e f g -classified as 59 10 1 0 0 0 0|a=build wind float 20 52 1 0 3 0 0|b=build wind non-float 12 5 0 0 0 0 0|c=vehic wind float 0 0 0 0 0 0 0|d=vehic wind non-float 0 5 0 0 5 0 3|e=containers 0 2 0 0 1 6 0|f=tableware 1 2 0 0 1 2 23|g=headlamps K=7;=Summary=实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.Correctly Classified Instances 137 64.0187%Incorrectly Classified Instances 77 35.9813%Kappa statistic 0.4948 Mean absolute error 0.1147 Root mean squared error 0.2557 Relative absolute error 54.1689%Root relative squared error 78.7876%Total Number of Instances 214 =Detailed Accuracy By Class=TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.829 0.271 0.598 0.829 0.695 0.876 build wind float 0.605 0.181 0.648 0.605 0.626 0.852 build wind non-float 0.059 0.005 0.5 0.059 0.105 0.71 vehic wind float 0 0 0 0 0?vehic wind non-float 0.308 0.03 0.4 0.308 0.348 0.939 containers 0.556 0.015 0.625 0.556 0.588 0.976 tableware 0.793 0.016 0.885 0.793 0.836 0.89 headlamps Weighted Avg.0.64 0.158 0.636 0.64 0.617 0.864 =Confusion Matrix=a b c d e f g -classified as 58 11 1 0 0 0 0|a=build wind float 26 46 0 0 4 0 0|b=build wind non-float 11 5 1 0 0 0 0|c=vehic wind float 0 0 0 0 0 0 0|d=vehic wind non-float 0 5 0 0 4 1 3|e=containers 1 2 0 0 1 5 0|f=tableware 1 2 0 0 1 2 23|g=headlamps 实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.K=9;=Summary=Correctly Classified Instances 135 63.0841%Incorrectly Classified Instances 79 36.9159%Kappa statistic 0.4782 Mean absolute error 0.1196 Root mean squared error 0.2581 Relative absolute error 56.4924%Root relative squared error 79.5178%Total Number of Instances 214 =Detailed Accuracy By Class=TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.829 0.278 0.592 0.829 0.69 0.881 build wind float 0.645 0.174 0.671 0.645 0.658 0.853 build wind non-float 0 0.005 0 0 0 0.694 vehic wind float 0 0 0 0 0?vehic wind non-float 0.231 0.03 0.333 0.231 0.273 0.933 containers 0.222 0.015 0.4 0.222 0.286 0.964 tableware 0.793 0.027 0.821 0.793 0.807 0.888 headlamps Weighted Avg.0.631 0.159 0.58 0.631 0.597 0.864 =Confusion Matrix=a b c d e f g -classified as 58 11 1 0 0 0 0|a=build wind float 23 49 0 0 3 1 0|b=build wind non-float 13 4 0 0 0 0 0|c=vehic wind float 0 0 0 0 0 0 0|d=vehic wind non-float 实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.0 6 0 0 3 0 4|e=containers 3 1 0 0 2 2 1|f=tableware 1 2 0 0 1 2 23|g=headlamps contact-lenses:K=1;=Summary=Correctly Classified Instances 19 79.1667%Incorrectly Classified Instances 5 20.8333%Kappa statistic 0.6262 Mean absolute error 0.2262 Root mean squared error 0.3165 Relative absolute error 59.8856%Root relative squared error 72.4707%Total Number of Instances 24 =Detailed Accuracy By Class=TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.8 0.053 0.8 0.8 0.8 0.958 soft 0.75 0.1 0.6 0.75 0.667 0.925 hard 0.8 0.222 0.857 0.8 0.828 0.896 none Weighted Avg.0.792 0.167 0.802 0.792 0.795 0.914 =Confusion Matrix=a b c -classified as 4 0 1|a=soft 0 3 1|b=hard 1 2 12|c=none K=3;=Summary=Correctly Classified Instances 19 79.1667%Incorrectly Classified Instances 5 20.8333%Kappa statistic 0.6262 Mean absolute error 0.2262 Root mean squared error 0.3165 实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.Relative absolute error 59.8856%Root relative squared error 72.4707%Total Number of Instances 24 =Detailed Accuracy By Class=TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.8 0.053 0.8 0.8 0.8 0.958 soft 0.75 0.1 0.6 0.75 0.667 0.925 hard 0.8 0.222 0.857 0.8 0.828 0.896 none Weighted Avg.0.792 0.167 0.802 0.792 0.795 0.914 =Confusion Matrix=a b c -classified as 4 0 1|a=soft 0 3 1|b=hard 1 2 12|c=none K=5;=Summary=Correctly Classified Instances 16 66.6667%Incorrectly Classified Instances 8 33.3333%Kappa statistic 0.3356 Mean absolute error 0.2793 Root mean squared error 0.3624 Relative absolute error 73.9227%Root relative squared error 82.9705%Total Number of Instances 24 =Detailed Accuracy By Class=TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.6 0.053 0.75 0.6 0.667 0.947 实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.soft 0.25 0.1 0.333 0.25 0.286 0.856 hard 0.8 0.556 0.706 0.8 0.75 0.859 none Weighted Avg.0.667 0.375 0.653 0.667 0.655 0.877 =Confusion Matrix=a b c -classified as 3 0 2|a=soft 0 1 3|b=hard K=7;=Summary=Correctly Classified Instances 14 58.3333%Incorrectly Classified Instances 10 41.6667%Kappa statistic -0.0619 Mean absolute error 0.3188 Root mean squared error 0.387 Relative absolute error 84.3959%Root relative squared error 88.61%Total Number of Instances 24 =Detailed Accuracy By Class=TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0 0.053 0 0 0 0.947 soft 0 0 0 0 0 0.831 hard 0.933 1 0.609 0.933 0.737 0.807 none Weighted Avg.0.583 0.636 0.38 0.583 0.461 0.841 =Confusion Matrix=a b c -classified as 实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.0 0 5|a=soft 0 0 4|b=hard 1 0 14|c=none K=9;=Summary=Correctly Classified Instances 14 58.3333%Incorrectly Classified Instances 10 41.6667%Kappa statistic -0.0619 Mean absolute error 0.3188 Root mean squared error 0.387 Relative absolute error 84.3959%Root relative squared error 88.61%Total Number of Instances 24 =Detailed Accuracy By Class=TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0 0.053 0 0 0 0.947 soft 0 0 0 0 0 0.831 hard 0.933 1 0.609 0.933 0.737 0.807 none Weighted Avg.0.583 0.636 0.38 0.583 0.461 0.841 =Confusion Matrix=a b c -classified as 0 0 5|a=soft 0 0 4|b=hard 1 0 14|c=none 可以看出第一个数据集在 K=3 时分类精度最高,而第二个数据集在 K=1 或 3 时分类精度最高。实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料.资料.五、分析与讨论 实验目的及要求选择一个数据挖掘标准数据集采用算法进行分类给出分类精度画出用算法诱导的树并写出生成的规则集合在数据挖掘标准数据集上实验对比剪枝与未剪枝的树的分类性能总结算法的优缺点二实验设备环境及要求电脑资料分类规则剪枝后结果为资料分类精度变为性能变好算法优缺点优点分类精度高生成的分类规则比较简单易于理解缺点需要多次扫描数据集比较低效五分析与讨论六教师评语成绩签名日期资料数据挖掘实验报告实验序号实验项目选择中的个标准数据集使用算法在该数据集上计算混淆矩阵选择个数据集选择不同的值对比算法计算结果的差异二实验设备环境及要求电脑四实验容与步骤数据集两者的混淆矩阵分别为资料两个数据集在下结果分别为资料资料资料

    注意事项

    本文(数据挖掘实验报告_计算机-数据挖掘与模式识别.pdf)为本站会员(c****3)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开