分类问题和回归问题.docx
《分类问题和回归问题.docx》由会员分享,可在线阅读,更多相关《分类问题和回归问题.docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、分类问题和回归问题一、回归问题和分类问题的区别回归问题0分类问题a连续变量1离散变量a定量一定性”对真实值的一种逼近预测,输入变量输出确定的数值二将事物打上一个标签,输入变量输出标签类别”用函数拟合已知数据并对新数据的函数值进行预测“寻找有助于将数据分为几个类别的模型3均方误差一分类准确性回归树、线性回归决策树、逻囱圆归:区别简单概括为上图,具体举例如下:机器学习的思想和教小孩一样,拿识物卡片给她,告诉她这是猫、这 是狗、这是苹果,下次遇到真猫真狗的时候你问她这是啥,如果她 准确说出这是猫还是狗还是苹果,那么这个小孩训练成功了。那么机器学习就是把机器当小孩,给它一些历史数据,告诉机器,这 些数
2、据是什么,然后再给它一些新数据,让它告诉你新数据是什么。是5: 1,如果低于这个比例,婚姻就遇到问题了。最后,将结果放 在一个数学模型上,这个模型用差分方程式凸显出成功婚姻的潜在特 点。戈特曼根据得分,将这些夫妻分成5组:幸福的夫妻:冷静、亲密、相互扶持、关系友好。他们更喜欢 分享经验。无效的夫妻:他们尽最大努力避免冲突,只是通过积极回应对 方的方式。多变的夫妻:他们浪漫而热情,可争论异常激烈。他们时而稳 定时而不稳定,可总的来说不怎么幸福。敌对的夫妻:一方不想谈论某件事,另一方也同意,所以,两 者之间没有交流。彼此无感的夫妻:一方兴致勃勃地想要争论一番,可另一方对 讨论的话题根本不感兴趣。该
3、数学模型呈现了稳定型夫妻和不稳定型夫妻(敌对夫妻和无感夫妻) 之间的区别。而据预测,不稳定的夫妻可能会一直保持婚姻关系,尽 管他们的婚姻不稳定。对新用户进行预测12年以来,每隔一两年,默里和戈特曼都会与参与研究的那700对 夫妻交流。公式对离婚率的预测达到了 94%的准确率。在模型评估时,分类与回归也有区别。在回归中要考虑的是答案不完 全一致时的误差,而分类中要考虑的是答案是否正确。白话机器学习的数学一书中分别讲解了如何验证回归问题和分类 问题。你给它数据并且教它的过程就是力I练过程,它告诉你新数据是什么的 过程是测试过程。好的机器学习模型要求测试集和力I练集数据表征不 同、本质相同,希望模型
4、在没见过的数据上有良好的表现。分类问题:输入数据后输出为数据所代表的类别,例如水果分类器, 输入一个苹果它能告诉你这是苹果(归到苹果这一类),输入一个香 蕉它告诉你这是香蕉(归到苹果这一类),使用分类准确率来度量分 类模型的好坏。(准确率二分类正确的样本数/测试集的样本数)回归问题 输入数据后输出为预测值例如房价走势曲线拟合问题(房 价随房子面积变化的曲线),输入一个房子面积,它能告诉你这个面 积的房子价格,使用均方误差(Mean Square Error, MSE )来度量 回归模型的好坏,se= i 3 (筑-切2)。二、回归问题和分类问题相互转化有些问题只能是分类问题,例如类别标签具有平
5、行属性的问题:水果 分类(苹果、香蕉、石榴),疾病诊断(心脏病、外伤、心理疾 病、肺病)有些问题只能是回归问题,例如没有明确的类别的问题:股票价格走 势拟合(股票价格随时间变化的曲线) 有些问题可以相互转化,例如类别标签具有连续属性、程度属性(即 类别标签取值连续)的问题:酒店星级、产品等级、随面积增大逐渐增加的房价、情感由强到弱等问题(可以将类别范围表示成一个连续 的数字范围)理论上到底如何将这两类问题转化呢?回归问题转化为分类问题:以房价回归模型为例,假设分类精度 为 ,我们将某个范围内的面积作为输入50,200平方米,得到对 应面积的房价50w,500w将50,500分成m份每份的大小为
6、 , 此时,就将回归问题转为为了分类问题(在训练过程完成转化),在 测试阶段,给定一个面积,预测出一个房价(本质还是预测),当这 个价格位于第i份时,就说这个房子属于第i类分类问题转化为回归问题:例如情感分类问题,情感的强弱不是离 散值,而是连续的,因为大喜大悲的情况概率极小,所以我们可以将 情感类别用数字区间表示,不同的区间代表不同的类,使用回归的方 法完成情感分类,具体实现细节和上例类似不学了,睡觉,明早健身。分类与回归 分类预测建模问题不同于回归预测建模问题。分类是预测离散类标签的任务。回归是预测连续数量的任务。分类 和回归算法之间存在一些重叠;例如:分类算法可以预测一个连续值,但连续值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分类 问题 回归
限制150内