带你轻松看懂机器学习工作流——以点一份披萨外卖为例15801.pdf
《带你轻松看懂机器学习工作流——以点一份披萨外卖为例15801.pdf》由会员分享,可在线阅读,更多相关《带你轻松看懂机器学习工作流——以点一份披萨外卖为例15801.pdf(2页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-.z.作者|Daniel Godoy翻译|Mika本文为 CDA 数据分析师原创作品,需授权 想象一下你点了一份披萨外卖,过了一会儿美味热腾腾的披萨就送到家门口了。你有没有想过从下单点外卖到披萨送过来当中的工作流程呢.我指的是完成的工作流程,包括从种下披萨上的西红柿到外卖骑手送单到你的楼下。其实这一系列过程与与机器学习工作流程并没有什么不同。不妨让我们来看看。这篇文章的灵感来自 Google 首席决策科学家 Cassie Kozyrkov 在柏林 Data Natives Conference 上发表的演讲。1.播种 农民播种的种子之后会长为披萨的配料,比如西红柿等。这相当于数据生成过程,例
2、如用户操作、移动、触发传感器等。2.收获 接着到了收获的时节,也就是蔬菜或水果成熟的时候。这相当于数据收集,也就是浏览器或传感器将用户操作或触发传感器的事件转换为实际数据。3.运输 收获后,产品会被运到目的地,作为披萨中的原料。这相当于将数据提取到存储库中,以便之后从中获取数据库,如数据库或数据湖。4.选择厨具和设备 每种原料都需要适合的用具来处理。如果要切片,就用刀;如果要搅拌,就用勺子。设备方面也是如此,如果要烤,就用烤箱;如果要炒,就用炉子。你还可以使微波炉等更复杂的设备。在机器学习中,厨具是用于预处理数据的技术,而设备就相当于线性回归、随机森林等算法。你也可以使用微波炉等复杂的设备,这
3、也就相当于深度学习。当中不同的就是超参数,在简单的设备(算法)中只有少数参数;而复杂设备(算法)中,涉及到的参数更多。但这并不意味着复杂的算法就能提供更好的性能。因此,你需要明智地选择算法。5.选择菜谱 仅有原料和用具是不够的。你还需要菜谱,当中包括你准备这道菜的所有步骤。这就是模型,记住模型与算法不同,模型包括所有算法需要的预处理和之后的处理过程。6.准备配料 我敢打赌,大多数菜谱的第一条指令都是:“切片”,削皮等等。而不是洗蔬菜等,因为这是理所当然的,没人想吃没洗的蔬菜。同样,数据也是如此,没有人想要脏数据。你必须清理数据,即处理缺失值和异常值。然后需要进行削皮和切片,也就是进行预处理,对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 轻松 看懂 机器 学习 工作流 一份 外卖 15801
限制150内