GitHub超全机器学习工程师成长路线图开源两日收获3700+Star!.docx
-
资源ID:73273777
资源大小:20.69KB
全文页数:13页
- 资源格式: DOCX
下载积分:14.8金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
GitHub超全机器学习工程师成长路线图开源两日收获3700+Star!.docx
GitHub超全机器学习工程师成长路线图,开源两日收获3700+Star! 11月30日,2021亚马逊云科技 re:Invent全球大会,即将浩大开启! 2021 re:Invent 十周年度十分活动,内容的饕餮盛宴,涵盖产品、行业、社区等专题!立即预约 参加 2019 Python开发者日 请扫码咨询 | 琥珀 出品 | AI科技大本营 ID:rgznai100 近日 一个在 GitHub 上开源即收获了 3700 Star 的工程 引起了营长的注意。据介绍 该工程以 TensorFlow 以及 Scikit-learn 的机器学习框架的根底库为例 详细介绍了怎样成为一名机器学习工程师的成长途径。 该工程的还是一位来自意大利的 IT 工程师 名叫 Giacomo Ciarlini 特别帅气的有没有 GitHub 传送门 s:/github /clone95/Machine-Learning-Study-Path-March-2019/tree/master/Career%20Paths/Machine%20Learning%20Engineer%20Career%20Path 首先强烈推荐了?Scikit-Learn 与 TensorFlow 机器学习实用指南?一书。之外 他还上传了全球顶尖大学以及开源组织的学习资源 并采集了理论以及例如 和对选择最正确资源的建议。 内容主要分为四大局部 一、先决条件 Python Jupyter Notebook 需要掌握的根本数学知识 机器学习全貌 二、使怎样使用 Scikit-Learn 进展机器学习 为什么是 Scikit-Learn 端到端机器学习工程 线性回归 分类 训练模型 支持向量机 决策树 合奏学习以及随机森林 无监视学习 结语以及期待 三、通过 TensorFlow 训练的神经网络 为何选择 TensorFlow 使用 TensorFlow ANN - 人工神经网络 CNN - 卷积神经网络 RNN - 递归神经网络 训练网络 最正确理论 自动编码 强化学习 四、工具 机器学习工程 数据科学工具 boke / YouTube 频道 / 网站 每个标签下 都有详细的解释并给出了实战操作的资源 实乃良心之作 下面 就由营长来详细介绍下这个工程里有哪些值得一看的资源 并附上局部教程链接 。 一、先决条件 Python 根底知识 s:/ 还建议 除了对 Python 熟悉掌握外 还可以解析下 Numpy 它是数学运算的重要模块 可以有助于你在后面 Python 环境中导入 Tensor 数据类型。 Python3 安装地址 s:/realpython /installing-python/ PyCharm Community Edition 一个用于 Python 开发的完好 IDE 为实验设置一个新的 Python 虚拟环境 安装地址 s:/ jetbrains /pycharm/download/#section windows Jupyter Notebook 是一个开源的 Web 应用程序 帮助用户创立以及分享文档 包括 live code 方程 可视化 表达文本。例如 数据清洗、数值模拟、统计建模、数据可视化、机器学习等。 需要掌握的根本数学知识 在看来 数学是机器学习背后的重要根底。但重要的是 掌握主要概念并认识到这些数学方法的应用领域以及局限性。 他给出了三个课程链接 分别是 线性代数 s:/ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2020/ 概率根底以及统计 s:/ edx.org/course/introduction-to-probability-0 其他数学资源 s:/explained.ai/matrix-calculus/index.html#sec4.5 机器学习全貌 最后 还要通过一篇科普读物 解析整个机器学习全貌 s:/ oreilly /library/view/hands-on-machine-learning/9781491962282/ch01.html 二、怎样使用 Scikit-Learn 进展机器学习 安装 Scikit-Learn python pip install -U scikit-learn 假如安装时遇到一些问题 可能是你更新到最新版本的 pip 所以在同一个文件夹内运行 python -m pip install -upgrade pip 为什么是 Scikit-Learn Scikit-Learn 是机器学习任务中最完好、最成熟 且记录完好的库之一。它开箱即用 具有强大而先进的模型。 端到端机器学习工程 Kaggle 作为机器学习以及通用数据科学工程的首选平台 它提供了大量免费数据集 和有趣的挑战以及 ML 模型实验。 线性回归 线性回归是最简单的机器学习形式 也是模型训练的起点。 可以参看吴恩达的理论课程 s:/ youtube /watch?v W46UTQ_JDPk list PLoR5VjrKytrCv-Vxnhp5UyS1UjZsXP0Kj index 2 分类 假如想要从不同的可能性中预测结果 分类那么是最重要的机器学习任务之一。最简单的情况是二元分类问题。 训练模型 列举了 ML 任务中训练模型的一些技术 在 Google Crash 教程中可以找到 梯度下降 s:/developers.google /machine-learning/crash-course/reducing-loss/gradient-descent 学习率 s:/developers.google /machine-learning/crash-course/reducing-loss/learning-rate SGD s:/developers.google /machine-learning/crash-course/reducing-loss/stochastic-gradient-descent 正那么化 s:/ youtube /watch?v Q81RR3yKn30 支持向量机 是创立 ML 模型的另一种经典算法。 除了理论解释外 还有更多实战策略 s:/ youtube /watch?v g8D5YL6cOSE 决策树 集成学习以及随机森林 集成学习 Ensemble Learning 的思路是利用了几款 ML 模型的所有不同特征、优优势 以期得到最有可能性的预测结果。 集成学习根底知识 s:/ youtube /watch?v 9VmKYwX_U7s 随机森林最经典理论 s:/ youtube /watch?v 3kYujfDgmNk 无监视学习 涵盖了无监视学习的介绍、解释 和与监视学习、强化学习之间的差异。 关于涉及的两个重要技术 关联规那么 Association Rules 以及聚类 分别提供了例如以及教程。 三、通过 TensorFlow 训练的神经网络 在本节中 主力推荐斯坦福大学深度学习课程和其他网络教程 帮助学习者快速解析这些内容。其中包括 ANN、CNN、RNN 等不同种类的机器学习模型。实际上 花了很长时间去理解神经网络的理论以及应用 包括浏览boke、官网论坛、学习途径。 他给出了“三步走的建议 通过斯坦福大学教程解析神经网络的主要概念 不要太多担忧一些数学解释 而要关注什么以及为什么 使用理论 教程 例如 如 RNN 理论 RNN 教程 RNN 例如 每次只深度讨论一个主题 每讨论完一个主题 就回溯一遍斯坦福大学的课程。这种方式将帮助你完全理解所有公式 并将课程中提到的 “数学 相关知识联络起来 触类旁通。 表示 以上这种方式可根据需要重复屡次 然后在你的头脑中构建一个良好的通用模型。 斯坦福大学课程 PPT 地址 :/cs231n.stanford.edu/slides/2018/ 为何选择 TensorFlow 目前 TensorFlow 已经企业里实现机器学习算法的事实标准。 在安装 TensorFlow 库之前 你只需在 Python 安装文件夹中翻开一个终端并运行此命令 python pip install tensorflow ANN - 人工神经网络 CNN - 卷积神经网络 RNN - 递归神经网络 训练网络 最正确理论 自动编码 强化学习 以上细节就不一一细讲了。 四、其他资源 除了上述内容之外 还采集了大量文章、网络应用程序、最正确理论、工程以及存储库。 机器学习工程 工具 YouTube 频道 boke 和 其他值得一看的网站 最后表示 将在接下来的时间里对不同的主题进展扩大 包括 无监视学习、机器学习心态框架 怎样像数据科学家一样考虑 、使用 Pandas 进展数据处理以及准备、特征选择、特色工程、扩展参数优化局部、Keras 库、TensorFlow 2.0、怎样在 AWS、Azure 上部署模型等。 本文为 AI科技大本营原创文章 转载请微信联络 1092722531 精彩推荐 2019 Python开发者日7折票限时开售 这一次我们仍然“只讲技术 回绝空谈10余位一线Python技术专家共同打造一场硬核技术大会。更有深度培训实操环节 为开发者们带来更多深度实战时机。 目前演讲嘉宾议题已确认 扫描海报二维码 即刻抢购7折优惠票价 更多详细信息请咨询13581782348 微信同号 。 推荐浏览 李沐团队新作Gluon 复现CV经典模型到BERT 简单好用 | 强烈推荐 你可以以点击浏览原文 查看大会详情。