机器学习决策树学习ppt课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《机器学习决策树学习ppt课件.ppt》由会员分享,可在线阅读,更多相关《机器学习决策树学习ppt课件.ppt(35页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第1.2节节 决策树学习决策树学习(Decision Tree)内容决策树的基本原理和算法熵、信息增益和特征选择决策树学习中的过拟合问题交叉验证与树的修剪内容决策树的基本原理和算法熵、信息增益和特征选择决策树学习中的过拟合问题交叉验证与树的修剪决策树学习决定是否打网球看看天气看看湿度阳光明媚下雨看看风速高正常不去打球去打球大小不去打球去打球节点:每一个节点测试一个特征节点:每一个节点测试一个特征,分支:特征的可选数值(此处为离散值)分支:特征的可选数值(此处为离散值)叶子节点:最终预测叶子节点:最终预测去打球阴天ix(|)Y or P Y YLeaf基本的决策树学习算法(ID3, C4.5)
2、node = root 循环循环 1. 为当下一个节点选择一个最好的属性为当下一个节点选择一个最好的属性 x 2. 将属性将属性x分配给节点分配给节点node 3. 对于对于x的所有可能数值,创建一个降序排列的节点的所有可能数值,创建一个降序排列的节点node 4. 将所有训练样本在叶子节点排序分类将所有训练样本在叶子节点排序分类 5. 如果分类结果达到了错误率要求,跳出循环,否则,如果分类结果达到了错误率要求,跳出循环,否则, 在叶子节点开始新循环在叶子节点开始新循环-递归递归决策树学习的适用问题l 适用问题的特征 实例由“特征-值”对表示 目标函数具有离散的输出值 训练数据可以包含一定的错
3、误 训练数据可以包含缺少特征值的实例l 问题举例 根据天气好坏确定是否去打球 根据疾病分类患者 根据起因分类设备故障 根据拖欠支付的可能性分类贷款申请l 分类问题 核心任务是把样例分类到各可能的离散值对应的类别基本的决策树学习算法(ID3, C4.5)l ID3的思想 自顶向下构造决策树 从“哪一个特征将在树的根节点被测试”开始 使用统计测试来确定每一个实例特征单独分类训练样例的能力l ID3的过程 分类能力最好的特征被选作树的根节点 根节点的每个可能值产生一个分支 训练样例排列到适当的分支 重复上面的过程基本的决策树学习算法(ID3, C4.5)编号编号天气天气温度温度湿度湿度风风是否去打球
4、是否去打球1晴天炎热高弱不去2晴天炎热高强不去3阴天炎热高弱去4下雨适中高弱去5下雨寒冷正常弱去6下雨寒冷正常强不去7阴天寒冷正常强去8晴天适中高弱不去9晴天寒冷正常弱去10下雨适中正常弱去11晴天适中正常强去12阴天适中高强去13阴天炎热正常弱去14下雨适中高强不去表-1:是否去打球的数据统计训练数据决策树学习原理简介(ID3, C4.5算法)湿度高正常(3+, 4-)(6+, 1-)S: (9+, 5-)风 弱强(6+, 2-)(3+, 3-)S: (9+, 5-)问题:哪一个属性(特征)更好?问题:哪一个属性(特征)更好?内容决策树的基本原理和算法熵、信息增益和特征选择决策树学习中的过拟
5、合问题交叉验证与树的修剪熵:物理学概念宏观上:宏观上:热力学定律体系的熵变等于可逆过程吸收或耗散的热量除以它的绝对温度(克劳修斯,1865)微观上:微观上:熵是大量微观粒子的位置和速度的分布概率的函数,是描述系统中大量微观粒子的无序性的宏观参数(波尔兹曼,1872)结论:结论:熵是描述事物无序性的参数,熵越大则无序性越强,在信息领域定义为“熵越大,不确定性越大”(香浓,1948年)熵随机变量的熵 ()I X熵 比较多的用于信源编码,数据压缩,假设是最有效的编码方式是使用 位编码于是对于随即变量的最有效编码位之和:Xi21()()log()niI XP XiP Xi 熵熵表示训练集合中的样本S表
6、示训练集合中反例样本的比例p表示训练集合中正例样本的比例p22( )log ()log ()I Spppp 表示训练集合的熵信息增益(Information Gain) 信息的增加意味着不确定性的减少,也就是熵的减小; 信息增益在诸多系统中定义为: 在某一个操作之前的系统熵与操作之后的系统熵的差值 也即是不确定性的减小量信息增益(Information Gain)l 原来的不确定性l 知道x之后的不确定性l 信息增益: 原来-知道x之后的原来不确定性-经过属性x划分以后的不确定性信息增益(Information Gain)l 选择特征的标准:选择具有最大信息增益(Information Gai
7、n)的特征l 假设有两个类, + 和 -假设集合S中含有p个类别为+的样本,n个类别为-的样本将S中已知样本进行分类所需要的期望信息定义为:npnnpnnppnppnpI22loglog),(l 假设特征x将把集合S划分成 K份 S1, S2 , , SK 如果 Si 中包含 pi 个类别为 “+”的样本, ni 个类别为 “-”,的样本。那么划分后的熵就是:l 在x上进行决策分枝所获得的信息增益为:1( )(,)KiiiiipnE xI p npn( )( , )( )Gain xI p nE x信息增益(Information Gain)( , )Gain S x( )( , )( )()
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习 决策树 ppt 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内