实验二分类挖掘算法(共4页).doc
《实验二分类挖掘算法(共4页).doc》由会员分享,可在线阅读,更多相关《实验二分类挖掘算法(共4页).doc(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上实验二 分类挖掘算法(ID3)一、实验目的1、理解分类2、掌握分类挖掘算法ID33、为改进ID3打下基础二、实验内容1、选定一个数据集(可以参考教学中使用的数据集)2、选择合适的实现环境和工具实现算法 ID33、给出分类规则三、实验原理决策树是一种最常见的分类算法,它包含有很多不同的变种,ID3算法是其中最简单的一种。ID3算法中最主要的部分就是信息熵和信息增益的计算。信息熵的计算公式如下。信息增益的计算公式为:其中P(ui)为类别ui在样本S中出现的概率,A是样本的属性,Value(A)是属性A所有取值的集合,v是得其中一个属性值。Sv是S中A的值为v的样例集合。I
2、D3算法的流程就是在属性集A中寻找信息增益值最大的属性,作为根节点,按照根节点属性的取值将样本集合分成几个子集,将此属性从属性集中去掉,在每个子集中选择信息增益值最大的属性,作为当前子集的根节点,上层集合的根节点的子节点,如此循环递归,如果得到的子集中所有的样本属于一个类别,则递归停止。四、实验要求1、数据集具有一定的代表性,可以使用数据库技术管理2、实现界面友好3、提交实验报告:实验题目、目的、数据集描述、实验环境、过程、结果和分析等。五、 实验步骤1、所采用的数据集,如图1所示:2、具体步骤构造决策树的方法是采用自上而下的递归构造,其思路是:1)以代表训练样本的单个结点开始建树(步骤1)。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 分类 挖掘 算法
限制150内