(1.1.1)--机器学习简介.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《(1.1.1)--机器学习简介.pdf》由会员分享,可在线阅读,更多相关《(1.1.1)--机器学习简介.pdf(63页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、赵卫东 复旦大学Copyright 2019机器学习导论Introduction to Machine Learning复旦大学计算机科学技术学院博士/副教授赵卫东 2001年4月毕业于东南大学,获博士学位。2001年6月起在复旦大学做博士后。2003年5月进入复旦大学软件学院,主要负责本科生和各类研究生商务数据分析、大数据核心技术和机器学习等课程的教学,2011年纽约大学访问学者。目前主要研究方向包括电子推荐、智能决策和大数据分析等。主持国家自然科学基金2项、中国博士后科研基金、上海市浦江人才、IBM Shared University Research以及20多项企业合作课题等项目。论文与
2、著作论文与著作 已在管理科学学报、系统工程学报、Knowledge and Information Systems,Information Processing&Management,Information Systems Frontiers等国内外刊物和学术会议发表论文90多篇,其中被SCI、EI收录40多篇。出版著作智能化的流程管理以及教材电子商务模式(第二版)商务智能(第四版)机器学习案例实战商务智能 数据分析的管理视角(第四版)人机共生:洞察与规避数据分析中的机遇与误区等10多部。荣誉与奖励荣誉与奖励 主持上海市精品课程商务智能,获得上海市高等教育教学成果奖二等奖。获得上海市2015年
3、上海市科技进步二等奖。教育部在线教育中心智慧教学之星。互联网+各行各业内容内容第1模块 机器学习概论机器学习的发展简史什么是机器学习?机器学习能做什么?机器学习与人工智能机器学习与大数据分析、商务智能、商务数据分析、数据挖掘的区别与联系第2模块 机器学习方法及其应用机器学习的常用方法以及应用(分类、聚类、统计学习等)机器学习的典型应用行业和场景机器学习的典型应用案例机器学习项目的流程机器学习的主流平台机器学习的相关语言第3模块 从事机器学习工作的准备机器学习带来的新商业机会和就业机会从事机器学习的基本要求常见的机器学习企业职位SAP机器学习学习路径与相关素材机器学习概论机器学习常见问题机器学习
4、方法及其应用从事机器学习工作的准备机器学习机器学习定义定义 机器学习(Machine Learning)是计算机科学的子领域,也是人工智能的一个分支和实现方式。Tom Mitchell在他1997年出版的Machine Learning一书中指出机器学习这门学科所关注的是计算机程序如何随着经验积累自动提高性能。同时给出了形式化的描述:对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么就称这个计算机程序在从经验E学习。机器学习主要的理论基础涉及到概率论、数理统计、数值逼近、最优化理论、计算复杂理论等,核心要素是数据、算法和模型。机器学习的发展机器学习的发
5、展 机器学习的发展分为知识推理期、知识工程期、浅层学习(Shallow Learning)和深度学习(Deep Learning)几个阶段。在机器学习的发展过程中,随着人们对智能的理解和现实问题的解决方法演变,大致出现了符号主义、贝叶斯、联结主义、进化主义、行为类推主义五大流派。机器学习的演化机器学习的演化时间主要成果代表人物19431956MP模型、自动机模型、符号演算、逻辑主义Warren McCullochWalter PittsAlan TuringJohn von NeumannShannon19561960sLISP、框架知识表示McCarthy/MinskyNewell&Simo
6、n1960s1970s遗传算法、进化策略、模糊集RechenbergHollandZadeh1970s1980s专 家 系 统、DENDRAL、MYCIN、PROSPECTOR、PROLOG、EMCIN等Feigenbaum Buchanan Lederberg Shortliffe1980s1990sHopfield网络、自组织网络、多层神经网络、知识工程、模糊逻辑、决策树算法等HopfieldKohonenFeigenbaumZadehQuinlan1990s2000sBoosting算法、AdaBoost、SVM、随机森林SchapireFreundVapnik2000s至今深度学习、自
7、我特征学习、无导式学习、增强学习、分布式机器学习Hinton LeCun Bengio AndrewNg Mitchell机器学习、人工智能和数据挖掘机器学习、人工智能和数据挖掘机器学习、人工智能和数据挖掘机器学习、人工智能和数据挖掘机器学习是人工智能的一个分支,它是实现人工智能的一个核心技术,即以机器学习为手段解决人工智能中的问题。机器学习是通过一些让计算机可以自动“学习”的算法并从数据中分析获得规律,然后利用规律对新样本进行预测。数据挖掘是从大量的业务数据中挖掘隐藏、有用的、正确的知识促进决策的执行。数据挖掘的很多算法都来自于机器学习,并在实际应用中进行优化。机器学习最近几年也逐渐跳出实验
8、室,解决从实际的数据中学习模式,解决实际问题。数据挖掘和机器学习的交集越来越大。议程机器学习典型应用领域机器学习典型应用领域艺术创作金融领域医疗领域自然语言处理网络安全工业领域娱乐行业机器学习应用人机大战AlphaGo本质上是深度卷积神经网络CNN、加强学习RL、蒙特卡洛树搜索MCTS三者相结合的产物多分类问题输入:棋局盘面输出:各个位置的落子概率模型:卷积神经网络CNN数据来源:KGS Go Server上的16万盘6-9段的棋谱,共近3000万步机器学习应用趋势预测Google流感趋势预测社保欺诈机器学习应用反垃圾邮件系统训练email邮件预处理自动分词分类向量库词典参考待分类email初
9、级过滤初级分类库自动分词基于内容的二次过滤用户用户参考训练模块初级分类模块基于内容的二次过滤模块机器学习应用个性化推荐社交网络分析 新时代的网络营销 为什么赢得政治选举与大数据分析联系在一起?“我们的数据将会指示我们客户该将他们的竞选广告放到哪才能让他们的目标人群最有可能看到。”机器学习应用机器学习流程机器学习是一门入门容易但精通难的学科机器学习分析人员需要掌握行业知识以了解业务流程、理解数据背后的隐含信息以合理解读数据、从变化的角度和时间维度把握需求以确定使用哪些数据,这是数据分析的基础机器学习的主要流程是明确分析目标、数据收集、数据预处理、建模分析、结果评估、部署使用以及学习更新。机器学习
10、机器学习怎么怎么做做明确数据分析目标 思考:经营活动中有哪些困惑 案例分析:用户换机,23转4G,离网率上升等 明确数据分析目标是机器学习首要的重要步骤,这个步骤需要与用户进行充分的沟通。项目主题:中国移动客户细分模型中国移动客户细分模型 项目范围:本期项目以乐山市为试点城市 项目目的:按用户行为进行细分,客观反映用户需求。通过对各类人群的深入分析,为相关部门制订资费、服务、市场策略提供基础。项目内容:建立客户细分模型 结合各部门需求对客户细分群进行详细分析 协助市场经营部进行相关服务、市场活动的策划机器学习机器学习怎么怎么做做数据收集 思考:离网用户特征,23转4G,IPTV内容推荐等 收集
11、相关的数据(内部业务系统的数据、外部数据)外部数据可以通过网络爬虫、购买或交易方式获得。充足、全面的高质量数据是机器学习的基础。机器学习机器学习怎么怎么做做数据预处理 数据可能存在着噪声、不一致、异常、个人隐私保护等各类问题。数据清理 为保证数据的质量,必要的数据治理是需要的。思考:数据的质量满足机器学习的要求吗?机器学习机器学习怎么怎么做做数据建模 思考:用户换机模型 算法本身没有绝对的好坏,不同的机器学习算法都有各自的使用范围。选择合适的建模方法或算法,算法的好坏需要实验比较确定。此阶段是机器学习的核心部分,使用精巧复杂的分析方法从数据中提取知识,包括选择建模技术、生成测试设计以及构建和评
12、估模型。算法调优(包括参数或结构等方面)机器学习算法是科学,应用是艺术。机器学习机器学习怎么怎么做做效果评估 思考:用户换机模型效果评估?选定模型之后,就可以评估机器学习结果在多大程度上能够帮助实现业务目标。此阶段的要素包括评估学习结果,以便为机器学习的过程提供反馈。样本测试、现场抽样实验等。机器学习机器学习怎么怎么做做部署使用更新 思考:机器学习的模型是否真正解决了客户的问题?有效的机器学习结果会改善客户业务决策的效果,给客户带来价值。因为业务可能发生变化,在部署过程中需要更新机器学习的模型等。机器学习不是一劳永逸的事情(递增式学习)。机器学习概论机器学习常见问题机器学习方法及其应用从事机器
13、学习工作的准备机器学习机器学习常用常用算法算法 为什么需要算法?算法很高冷吗?为什么要学习算法?机器学习算法分类数据可视化在机器学习中的作用:(1)视觉是人类获得信息的最主要途径;(2)可视化本身就是一种机器学习方法;(3)可视化可以作为数据预处理的方法或者是机器学习过程的表示方式。(4)机器学习的结果也可以用可视化的形式表示。数据可视化数据可视化IIIIIIIVxyxyxyxy10.08.0410.09.1410.07.468.06.588.06.958.08.148.06.778.05.7613.07.5813.08.7413.012.748.07.719.08.819.08.779.07
14、.118.08.8411.08.3311.09.2611.07.818.08.4714.09.9614.08.1014.08.848.07.046.07.246.06.136.06.088.05.254.04.264.03.104.05.3919.012.5012.010.8412.09.1312.08.158.05.567.04.827.07.267.06.428.07.915.05.685.04.745.05.738.06.89可视化技术案例可视化技术案例机器学习机器学习常用常用算法算法 分类算法 分类与回归的区别 决策树原理分类算法 相亲模型 根据用户ARPU值预估用户收入 回归分析是分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 1.1 机器 学习 简介
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内