项目八:旅游电子商务数据挖掘(授课PPT)教学课件.ppt
《项目八:旅游电子商务数据挖掘(授课PPT)教学课件.ppt》由会员分享,可在线阅读,更多相关《项目八:旅游电子商务数据挖掘(授课PPT)教学课件.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、项目八旅游电子商务数据挖掘知识目标:理解数据挖掘的概念和内涵;理解机器学习、数据挖掘之间的区别和联系;理解旅游数据挖掘的意义。学习目标项目八 旅游电子商务数据挖掘技能目标:能够运用Python语言从旅游网站上提取有用信息,并保存至本地存储;能够对中文文本进行文本分析,提取关键词,分析词频;能够运用情感分析技术对游客对景区的网络点评进行舆情分析。素质目标:提升学生对旅游数据挖掘工作的理解和职业热爱;培养学生的创意创新思维和团队协作精神;培养学生认真细致的工作态度和工匠精神;通过中文分词的学习,让学生感悟汉字与中文之美,坚定文化自信。任务一:新媒体的概念与发展历程任务导入:近年来,大数据和数据挖掘
2、的概念频繁出现在各类媒体上,“曝光率”和“回头率”都非常高,在旅游业中也不例外,请阅读“第一财经”的这篇报道:你有没有看懂旅游大数据?课堂讨论以4人为一个小组,查阅大数据与数据挖掘在旅游业应用的案例,分组讨论:什么是数据挖掘?数据挖掘在电子商务业务上有哪些成功的案例?旅游业是否也需要进行旅游数据挖掘?虽然有些数据挖掘技术非常新颖并且看上去非常酷,但是数据挖掘本身并不是一种新的技术,自从世界上第一台计算机发明并投入实用以来,各行各业的人们就一起通过计算机进行数据分析,并把结果应用到各自的领域。在计算机发明之前的数个世纪里,人们在没有计算机的情况下,同样分析数据,只不过速度要慢上许多。Gordon
3、 S.Linoff对数据挖掘的定义是:数据挖掘是一项分析大量数据以发现有意义的模式和规则的业务流程。一、什么是数据挖掘自动预测趋势和行为,数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。关联分析,数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。聚类,数据库中的记录可被划分为一系列有意义的子集,即聚类。二、数据挖掘功能概念描述,就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。偏差检
4、测,数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。二、数据挖掘功能三、数据挖掘技术包括关联分析主要用于发现不同事件之间的关联性,即一个事件发生的同时,另一个事件也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事件。其主要依据是事件发生的概率和条件概率应该符合一定的统计意义。序列分析序列分析技术主要用于发现一定时间间隔内接连发生的事件。这些事件构成一个序列,发现的序列应该具有普遍意义。三、数据挖掘技术包括分类分析分类分析通过分析具有类别的样本的特点,得到决定样本属于各种类别的规则或方法。主要方法有基于统计学的贝叶斯方法、神经网络方法、决策树方法及支持向量机。聚类
5、分析聚类分析是根据物以类聚的原理,将本身没有类别的样本聚集成不同的组,并且对每一个这样的组进行描述的过程。其主要依据是聚到同一个组中的样本应该彼此相似,而属于不同组的样本应该足够不相似。三、数据挖掘技术包括预测预测与分类类似,但预测是根据样本的已知特征估算某个连续类型的变量的取值的过程,而分类则只是用于判别样本所属的离散类别而已。预测常用的技术是回归分析。时间序列分析时间序列分析的是随时间而变化的事件序列,目的是预测未来发展趋势,或者寻找相似发展模式或者是发现周期性发展规律。四、机器学习与数据挖掘机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论
6、、凸分析、算法复杂度理论等多门学科。它专门研究计算机是怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。数据挖掘是从海量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘中用到了大量的机器学习界提供的数据分析技术和数据库界提供的数据管理技术。四、机器学习与数据挖掘Tom Mitchell在1997年出版的Machine Learing一书中指出,从数据分析的角度来看,数据挖掘与机器学习有很多相似之处,但不同之处也十分明显,例如,数据挖掘并没有机器学习中所包含的探索人的学习机制这一科学发现任务,数据挖掘中的数据分析是针对
7、海量数据进行的,等等。从某种意义上说,机器学习的科学成分更重一些,而数据挖掘的技术成分更重一些。任务拓展咨询一下你在旅行社、酒店、景区等旅游企业实习或工作的师兄弟师姐,了解一下,他们的公司有没有采用数据挖掘技术为公司的业务开展提供数据支持。任务二:电商数据挖掘工具任务导入:张大方是朝阳旅行社的电商部经理,近日接到公司的通知,要在他的部门里成立一个旅游数据挖掘的项目小组,目的是分析商业数据,为公司的决策和业务开展提供数据支持。张大方是学旅游管理的,学过Visual Basic和SPSS,对数据统计也有些了解,但对数据挖掘还是有些陌生,作为部门负责人,当然要对这个数据挖掘小组的业务有深层次的了解,
8、所以他决定要好好恶补一下。他发现部门实习生手中有本旅游电子商务,其中有一部分是对数据挖掘的介绍,倒也通俗易懂,于是,用了三天的时间阅读了数据挖掘的内容,学习过后,心中对成立这一项目小组有了底。任务二:电商数据挖掘工具以4人为一个小组,分组讨论三种以上的大数据分析工具,你们认为哪种工具比较适合自己,为什么? 一、常见数据挖掘工具Rapid Miner,是一个用于机器学习和数据挖掘实验的环境,用于研究和实际的数据挖掘任务。毫无疑问,这是世界领先的数据挖掘开源系统。该工具以Java编程语言编写,通过基于模板的框架提供高级分析。一、常见数据挖掘工具IBM SPSS Modeler工具工作台最适合处理文
9、本分析等大型项目,其可视化界面非常有价值。 它允许您在不编程的情况下生成各种数据挖掘算法。 它也可以用于异常检测、贝叶斯网络、CARMA、Cox回归以及使用多层感知器进行反向传播学习的基本神经网络。一、常见数据挖掘工具Oracle Data Miner GUI使数据分析师、业务分析师和数据科学家能够使用相当优雅的拖放解决方案处理数据库内的数据。 它还可以为整个企业的自动化、调度和部署创建SQL和PL / SQL脚本。一、常见数据挖掘工具KNIME(Konstanz information miner)信息采集器是一个用户友好、可理解、全面的开源数据集成、处理、分析和探索平台。它有一个图形用户界
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 项目 旅游 电子商务 数据 挖掘 授课 PPT 教学 课件
限制150内