模式识别决策树分类.ppt





《模式识别决策树分类.ppt》由会员分享,可在线阅读,更多相关《模式识别决策树分类.ppt(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、模式识别决策树分类2022-9-71现在学习的是第1页,共12页数据实例 PlayTennis数据库片段:2022-9-72现在学习的是第2页,共12页决策树实例 关于PlayTennis的决策树:High Overcast Normal Strong Weak Sunny Rain Outlook Wind Humidity No Yes Yes No Yes 2022-9-73现在学习的是第3页,共12页决策树学习算法的代表 早在1986年的时候,Quinlan就提出了著名的ID3算法。(Published on MLJ)用ID3算法长树的基本思想:分类能力最好的属性被测试并创建树的根结点
2、 测试属性每个可能的值产生一个分支 训练样本划分到适当的分支形成儿子结点 重复上面的过程,直到所有的结点都是叶子结点两个问题:什么属性最好?什么结点才是叶子结点?两个问题:什么属性最好?什么结点才是叶子结点?2022-9-74现在学习的是第4页,共12页信息增益(Information Gain)属性A划分样本集S的信息增益Gain(S,A)为:Gain(S,A)=E(S)E(S,A)其中,E(S)为划分样本集S为c个类的熵;E(S,A)为属性A划分样本集S导致的期望熵。2022-9-75现在学习的是第5页,共12页熵(Entropy)划分样本集S为c个类的熵E(S)为:其中,pi ni/n,
3、为S中的样本属于第i类Ci的概率,n为S中样本的个数。ciiippSE12log2022-9-76现在学习的是第6页,共12页期望熵(Expected Entropy)属性A划分样本集S导致的期望熵E(S,A)为:其中,Values(A)为属性A取值的集合;Sv为S中A取值为v的样本子集,Sv=sSA(s)=v;E(Sv)为将Sv中的样本划分为c个类的信息熵。|Sv|/|S|为Sv和S中的样本个数之比。AValuesvvvSESSASE,2022-9-77现在学习的是第7页,共12页回味ID3算法 ID3算法每一步选择具有最大信息增益的属性作为测试属性来长树。直到最大的信息增益为也零为止。(两
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 决策树 分类

限制150内