机器学习算法 综述入门.docx
《机器学习算法 综述入门.docx》由会员分享,可在线阅读,更多相关《机器学习算法 综述入门.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、机器学习算法综述(入门)1.决策树这个监视式学习算法通常被用于分类问题。它同时适用于分类变量以及连续因变量。在这个算法中我们将总体分成两个或者更多的同类群。这是根据属性或自变量来分成尽可能不同的组别。如下图根据一些feature特征进展分类每个节点提一个问题通过判断将数据分为两类再继续提问。这些问题是根据已有数据学习出来的再投入新数据的时候就可以根据这棵树上的问题将数据划分到适宜的叶子上。经典的决策书是ID3其中有两个重要的概念熵以及信息增益熵是描绘混乱的程度在模型中熵越小较好信息增益是描绘属性非子叶节点对模型的奉献信息增益越大对模型的奉献越大优点计算复杂度不高输出结果易于理解对中间值的缺失不
2、敏感可以处理不相关特征数据。缺点可能会产生过度匹配问题。2.线性回归线性回归是用于回归的对某一现象或者类进展归纳为线性模型通过连续的输入变量预测出一个值通过拟合最正确直线来建立自变量以及因变量的关系而这条最正确直线就叫做回归线并且可以用Ya*Xb线性等式来表示一元线性回归Y:因变量X:自变量a:斜率b:截距一元线性回归的特点是只有一个自变量。多元线性回归Ya1*X1a2*X2a3*X3an*Xnb多元线性回归存在多个自变量找最正确拟合直线的时候可以拟合到多项或曲线回归。线性回归不像Logistic回归是用于分类其根本思想是用梯度下降法对最小二乘法形式的误差函数进展优化当然可以以用normale
3、quation直接求得参数的解结果为而在LWLR部分加权线性回归中参数的计算表达式为:由此可见LWLR与LR不同LWLR是一个非参数模型因为每次进展回归计算都要遍历训练样本至少一次。优点实现简单计算简单缺点不能拟合非线性数据.3.逻辑回归这是一个分类算法通过将数据拟合进一个逻辑函数来预估一个事件出现的概率。对于01之间的概率值当概率大于0.5预测为1小于0.5预测为0。它属于判别式模型有很多正那么化模型的方法L0L1L2etc。假如需要一个概率架构比方简单地调节分类阈值指明不确定性或是要获得置信区间或你祈望以后将更多的训练数据快速整合到模型中去可以使用逻辑回归。Sigmoid函数使用算法首先我
4、们需要输入一些数据并将其转换成对应的构造化数值接着基于训练好的回归系数就可以对这些数值进展简单的回归计算断定它们属于哪个类别在这之后我们就可以夺输出的类别上做一些其他分析工作。优点实现简单广泛的应用于工业问题上分类时计算量非常小速度很快存储资源低便利的观测样本概率分数对逻辑回归而言多重共线性并不是问题它可以结合L2正那么化来解决该问题缺点当特征空间很大时逻辑回归的性能不是很好容易欠拟合一般准确度不太高只能处理两分类问题在此根底上衍生出来的softmax可以用于多分类且必须线性可分对于非线性特征需要进展转换4.支持向量机SVM这是一种分类方法。在这个算法中我们将每个数据在N维空间中用点标出N是你
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器学习算法 综述入门 机器 学习 算法 综述 入门
限制150内