《大数据原理与软件应用》课程教学大纲.docx
大数据原理与软件应用课程教学大纲一、课程名称1 .中文名称:大数据原理与软件应用2 . 英文名称:Big data principle and software application二、课程概况课程类别:专业选修课学时数:16学时学分数:1学分适用专业:产业经济学、国际贸易、金融学专业开课学期:第一学期开课单位:经济管理学院三、四、教学目的及要求大数据原理与软件应用为学生搭建起通向“大数据知识空间”的桥梁和纽带,以“构建知识体系、说明基本原理、引导初级实践、了解相关应用”为原 那么,为学生在大数据领域“深耕细作”奠定基础、指明方向。课程将系统讲授大 数据的基本概念、大数据处理架构Hadoop.关联分析建模与挖掘算法的实现原 理和技术应用、回归分析模型与预测算法、神经网络与深度学习算法模型及其应 用实践等重要章节,安排了入门级的实践操作,让学生更好地学习和掌握大数据 关键技术。五、课程主要内容及先修课程第一章:认识大数据(2课时)基本内容:1 .大数据的价值所在2 .大数据产生的时代背景3 .大数据的概念和特点4 .大数据的类型及价值第二章:Stata软件应用和大数据挖掘分析(2课时)基本内容:1 . Stata软件应用基本知识2 .大数据挖掘的相关算法和过程3 .从网络中挖掘大数据的研究价值第三章:R软件的应用和大数据分析挖掘工具(2课时)主要内容:1 .R软件应用的基本知识2 .大数据分析挖掘的基本工具3 .大数据分析挖掘工程的实施步骤第四章:关联分析建模与挖掘算法的实现原理和技术应用(2课时)1 .预测、推荐分析建模与算法原理及其在Spark MLlib中的实现与应用,包 括:2 . Spark 频繁模式挖掘算法(parallel FP Growth Algorithm)应用3 . Spark关联规那么挖掘(Apriori)算法及其应用4 .以上算法在Spark MLib中的实现原理和实际场景中的应用案例。第五章:回归分析模型与预测算法(2课时)1 .利用线性回归(多元回归)实现访问量预测2 .利用非线性回归预测成交量和访问量的关系3 .基于R+Spark实现回归分析模型及其应用操作4 . Spark回归程序实现异常点检测的程序例如第六章:神经网络与深度学习算法模型及其应用实践(3课时)1 .神经网络算法Neural Network的实现方法和挖掘模型应用2 .基于人工神经网络的深度学习的训练过程3 .传统神经网络的训练方法4 . Deep Learning的训练方法5 .深度学习的常用模型和方法:卷积神经网络;循环神经网络模型;限制波尔 兹曼机论文阅读报告:1学时期末考试:2学时先修课程包括:数学:微积分和线性代数基础,统计学基础统计软件应用六、课程教学方法大数据原理与软件应用是一门经济统计类专业的选修课程,具有实时性强、 内容综合、实践性强等特点。本课程教学环节除课堂讲授外,还包括了学生自主 讲解和展示课、案例分析课、讨论课、软件实操局部。通过学生的自主查询、实 践和讨论,激发学生的学习积极性和主动性,培养学生自主学习和表达自我的能 力,同时提高学生在分析问题、总结问题上的灵敏度,在此过程中,让学生更加 深入理解所学内容,充分感受大数据在各领域的应用,到达学有所用的目的,提 高学生的实践能力。七、课程考核方式考试,笔试(闭卷)各考核环节占总分的比例:平时:30%,期末考试:70%平时成绩主要依据是课后作业的完成、论文阅读报告、小组讨论等。八、课程使用教材大数据技术原理与应用一概念、存储、处理、分析与应用林子雨编著,人民 邮电出版社,2015年8月九、课程主要参考资料1陆嘉恒.Hadoop实战.机械工业出版社.2011年.2曾大聃,周傲英(译).Hadoop权威指南中文版.清华大学出版社.2010年.3迪米达克(Nick Dimiduk),卡拉纳(Amandeep Khurana),谢磊.HBase 实战 中文版.人民邮电出版社;第1版(2013年9月1日)分委员会主席审批:年月日学院主管院长审批:年月日编号:C3/研部03/002注:(1)英文课程名称务必写准确;(2)需编写的内容统一用宋小四号,行间距固定值22磅。