《大数据技术综合实训2》课程教学大纲.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《《大数据技术综合实训2》课程教学大纲.docx》由会员分享,可在线阅读,更多相关《《大数据技术综合实训2》课程教学大纲.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据技术综合实训2教学大纲一、课程基本信息课程名称大数据技术综合实训Comprehensive Actual Training Of Big Data Technology课程编码SCC320811030开课院部理学院课程团队数据科学团队学分3.0课内学时 3周|讲授|0实聆0上机0|实践3周课外学时0适用专业数据科学与大数据技术授课语言中文先修课程Python语言与实训、大数据技术基础实训课程简介 (必修)大数据技术综合实训是数据科学与大数据技术专业的一门必修课,通过本课程的实机操作,使学生掌握在本机与多台机器集群执 行Spark应用程序,并运用MLlih机器学习演算法进行数据处理、训练、
2、建立模型、训练验证模型、预测结果。另外.以大数据实际案例 示范使用Spark ML Pipeline机器学习流程进行二元分类、多元分类、回归分析,将机器学习的每一个步骤建立成Pipel ine流程.通过 对Spark MLlib机器学习算法和应用案例的研究,进一步锻炼学生的动手能力.培养学生处理大数据问题的能力。The Comprehensive Training of Big Data Technology is a compulsory course for the major of Data Science and Big Data Technology. Through the rea
3、l-time operation of this course, students can master how to execute Spark application program with multiple machine clusters on their own, and use MLlib machine learning algorithm to process data, train, build mode 1s, train validation mode 1s and predict results. In addition, we use Spark MI. Pipel
4、ine machine learning process to carry out binary classification, multiple classification and regression analysis with large data examples, and build every step of machine learning into Pipeline process. Through the study of Spark MLlib machine learning algorithm and application cases, the students p
5、ractical ability is further trained and their ability to deal with big data problems is trained.负责人大纲执笔人审核人二 课程目标序号代号课程目标0BE毕业要月R指标点任务自选1Ml目标1 :掌握在本机与多台机器集群执行Spark应用程序.系统掌握大数据技术的实验方法,培养学 生实践实验技能是3.22M2目标2 :运用Spark YLlib和Spark ML Pipel ine机器学习流程进行二元分类、多元分类、回归分 析,能够量化分析问题,具备分析和建立大数据模型的能力是3.2, 4.23M3目标
6、3:通过对Spark迎lib机器学习算法和应用案例的研究,进一步锻炼学生的团队协作能力,培 养创新精神.训练创新思维,培育创新创业实践能力、科学研究能力和技术开发能力是7. 2, 8. 1, 8.24Ml目标4 :能保障课程正常秩序(政治层面、课堂保障层面.非学生能力层面)否三、il程内容序号章节号标题课程内容/重难点支撑课 程目标课内 学时教学方式课外学时课外环节1第1章第1章Spark的 介绍与安装本章重点难点:不同模式下运行spark程序/21. 11. 1 Spark的介绍 与安装Spark的介绍与安装Ml0. 25 天讲授、讨 论/31.21. 2运行spark程 序与 Spark
7、WebUI界面本地运行spark程序、在Hadoop YARN运行spark、构建Spark Standalone Cluster 运行环境、在 Spark Standalone 运行 spark x Spark leb UI 界面Ml0. 25 天讲授、讨 论/4实验1实验1 : Spark的生态环境与安装实 验Spark的生态环境与安装实验Ml0.5 天实验、上 机/5第2章第 2 章 Spark RDD本章重点难点:RDD “转换”运算、RDD “动作”运算、 Broadcast 广播变量、accumulator 累加器、RDD Persistence 持久化/62. 12.1 “转换”
8、运算基本RDD “转换”运算、多个RDD “转换”运算、RDD Key-Value 基本“转换”运算、多个RDD KeyTalue “转换”运算Ml0. 25 天讲授、讨 论/72.22.2 “动作”运算基本“动作”运算、Key-Value “动作”运算Ml0. 25 天讲授、讨 论/82.32.3 RDD相关概念Broadcast 广播变量、accumulator 累加器、RDD Persistence 持久化Ml0. 25 天讲授、讨 论/92.72.4使用Spark创建 lordCount使用 Spark 创建 WordCountMl0. 25 天讲授、讨 论/10实验2实哙 2 : S
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据技术综合实训2 数据 技术 综合 课程 教学大纲
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内