Hadoop大数据开发基础-教学大纲.docx
《Hadoop大数据开发基础-教学大纲.docx》由会员分享,可在线阅读,更多相关《Hadoop大数据开发基础-教学大纲.docx(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Hadoop大数据开发基础教学大纲课程名称:Hadoop大数据开发基础课程类别:必修适用专业:大数据技术类相关专业总学时:48学时(其中理论26学时,实验22学时)总学分:3.0学分一、课程的性质本课程是为大数据技术类相关专业学生开设的课程。随着时代的发展,大数据已经成为 一个耳熟能详的词汇。与此同时,针对大数据处理的新技术也在不断的开发和运用中,逐渐 成为数据处理挖掘行业广泛使用的主流技术之一。Hadoop作为处理大数据的分布式存储和 计算框架,得到了国内外大小型企业广泛的应用。Hadoop是一个可以搭建在廉价服务器上 的分布式集群系统架构,它具有可用性高、容错性高和可扩展性高等优点。由于它
2、提供了一 个开放式的平台,用户可以在完全不了解底层实现细节的情形下,开发适合自身应用的分布 式程序。经过十多年的发展,目前Hadoop已经成长为一个全栈式的大数据技术生态圈,并 在事实上成为应用最广泛最具有代表性的大数据技术。因此,学习Hadoop技术是从事大数 据行业工作所必不可少的一步。二、课程的任务通过本课程的学习,使学生学会搭建Hadoop完全分布式集群,掌握HDFS的原理和基 础操作,掌握MapReduce原理架构、MapReduce程序的编写。为将来从事大数据挖掘研究 工作以及后续课程的学习奠定基础。三、课程学时分配序号教学内容理论学时实验学时其它1第1章Hadoop介绍202第2
3、章Hadoop集群的搭建及配置463第3章Hadoop集群基础操作424第4章MapReduce入门编程545第5章MapReduce进阶编程666第6章项目案例:电影网站用户性别预测54总计2622四、教学内容及学时安排.理论教学序 号章节名称主要内容教学目标学时1Hadoop介绍L Hadoop的发展历史2. Hadoop的特点3. Hadoop的核心组件4. Hadoop的生态系统5. Hadoop的应用场景1 .了解Hadoop的来 源与特点2 .掌握Hadoop的核 心组件内容22Hadoop集群的搭建及配置1 .设置固定IP的方法2 .设置远程连接虚拟机3 . Linux在线安装软
4、件的方法4 .在 Window 和 Linux 下安装 Java5 .了解Hadoop集群相关配置文件6 . SSH免密码登录配置7 .时间同步服务配置8 .启动关闭Hadoop集群以及查看 Hadoop集群监控1 .掌握安装配置虚 拟机和安装JDK2 .掌握搭建Hadoop 完全分布式集群环 境的方法43Hadoop集群基础操作1. 了解HDFS的操作方法2. MapReduce任务的运行和中断方法3. 集群监控的查看方法1.学会查看Hadoop 集群的基本信息2,掌握HDFS的基 本操作3.掌握运行 MapReduce任务的 命令44MapReduce 入门编程1. Eclipse 安装2
5、. MapReduce 原理3. MapReduce的编程逻辑1 ,掌握 MapReduce 的原理2,掌握 MapReduce 程序的编程逻辑55MapReduce 进阶编程1. MapReduce的输入及输出格式2. Hadoop Java API 使用方法3. 自定义键值对方法4. Combiner 及 Partitioner 的原理与编 程5. 在Eclipse中提交MapReduce任务的 方法1.掌握 MapReduce 框架中的进阶应用, 包括自定义键值对、 Combiner Partitioner 等66项目案例:电影 网站用户性别 预测1 . KNN算法原理与实现步骤2 .案
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Hadoop 数据 开发 基础 教学大纲
限制150内