(41)--ch2决策树模式识别.pdf
《(41)--ch2决策树模式识别.pdf》由会员分享,可在线阅读,更多相关《(41)--ch2决策树模式识别.pdf(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、决策树方法引言引言决策树原理决策树原理决策树决策树ID3ID3方法构建方法构建过学习与剪枝过学习与剪枝随机森林随机森林主要内容引言引言 决策树学习决策树学习 有监督有监督学习 属性为离散值离散值 应用广泛 表示为if if-thenthen规则引言引言 决策树的结构决策树的结构引言引言 决策树分类决策树分类 训练阶段训练阶段从给定的训练数据集DB,构造出一棵决策树=()分类阶段分类阶段从根开始按照决策树的分类属性逐层往下划分,直到叶节点,获得分类结果=()引言引言 决策树举例决策树举例引言引言 决策树举例决策树举例引言引言 决策树举例决策树举例引言引言 决策树举例决策树举例决策树原理决策树原理
2、 基本算法基本算法 贪心算法贪心算法 自上而下自上而下 开始时所有数据所有数据在根节点根节点 选择某属性某属性对样本进行划分决策树原理决策树原理 中止条件:中止条件:一个节点上的数据属于同一个类别同一个类别 没有属性没有属性可以再用于分割决策树原理决策树原理 算法过程算法过程1 Samples=1,2,3,4,5,6,7,8,9,101 Samples=1,2,3,4,5,6,7,8,9,10Attribute_listAttribute_list=颜色,形状,尺寸颜色,形状,尺寸 Samples=1,4,7Samples=1,4,7决策树原理决策树原理 算法过程算法过程2 Samples=2
3、,3,5,6,8,9,102 Samples=2,3,5,6,8,9,10Attribute_listAttribute_list=形状,尺寸形状,尺寸 Samples=2,6,9Samples=2,6,9决策树原理决策树原理 算法过程算法过程2 Samples=3,5,8,102 Samples=3,5,8,10Attribute_listAttribute_list=尺寸尺寸 决策树原理决策树原理 算法过程算法过程2 Samples=3,8,5,102 Samples=3,8,5,10Attribute_listAttribute_list=决策树原理决策树原理 算法过程算法过程1,4,7
4、1,4,72,6,92,6,93,83,85,105,10本节结束本节结束决策树方法引言引言决策树原理决策树原理ID3ID3方法方法过学习与剪枝过学习与剪枝随机森林随机森林主要内容ID3ID3方法方法 信息熵(信息熵(EntropyEntropy)熵熵:描述物质系统状态 平均信息量平均信息量:系统中存在事件事件,每个事件出现的概率概率,=ID3ID3方法方法 系统越无序无序越混乱混乱熵越大大 结点的类值均匀分布均匀分布结点熵最大最大 结点上的数据类值相同类值相同结点熵最小最小ID3ID3方法方法 选择一个属性,使子结点数据类值相同类值相同 通过分裂,得到尽可能纯尽可能纯的结点 降低系统熵降低系
5、统熵ID3ID3方法方法 信息增益信息增益 属性属性对于数据集数据集的信息增益信息增益(,),=()ID3ID3方法方法 天气数据天气数据 是否打网球是否打网球OutlookTemperatureHumidityWindyPlay?sunnyhothighfalseNosunnyhothightrueNoovercasthothighfalseYesrainmildhighfalseYesraincoolnormalfalseYesraincoolnormaltrueNoovercastcoolnormaltrueYessunnymildhighfalseNosunnycoolnormalfa
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 41 ch2 决策树 模式识别
限制150内