《《数据挖掘》教学大纲.docx》由会员分享,可在线阅读,更多相关《《数据挖掘》教学大纲.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、河北经贸大学课程水平认定数据挖掘学习大纲课程名称数据挖掘课程类型必修课总学时32学时学 分2学分合用专业统计学开课单位数统学院一、学习性质数据挖掘是大数据背景下现代统计数据分析不可缺少的重要工具。通过本课程的学习,培 养学生的数据分析技能,熟悉和掌握大数据信息提取与结果分析,培养适应社会数据分析岗位需求 的专业人材。二、学习目的本课程目的主要是让学生在学习期间掌握数据挖掘理论以及如何用数据挖掘来解决实际问题, 了解某个数据挖掘解决方案对特定问题是否切实可行,学习知识发现的过程,利用基本的统计和非 统计技术评估数据挖掘对话的结果等。三、学习要求重点掌握几种数据挖掘策略及每种策略的合用时机;如何通
2、过几种数据挖掘技术建立模型来解 决问题。四、课程内容与学时分配课程内容与学时分配课程内容学时分配自学自学研讨调研第一章引言22第二章数据预处理22第三章分类和预测48第四章复杂类型数据的挖掘44第五章数据挖掘的应用和发展趋势22五、课程考核和成绩评定课程考核为闭卷考试。成绩评定:考试成绩实行百分制,其中基础知识测试题的分值掌握在40分摆布;综合能力测 试题的分值掌握在60分摆布。60分为及格。六、推荐教材和学习参考书推荐教程作者出版社及出版时间数据挖掘:概念与技术JIAW日 HANMICHELINE KAMBER机械工业出版社,2022学习参考书作者出版社及出版时间数据挖掘导论范明,范红建人民
3、邮电出版社,2022数据挖掘与应用张俊妮北京大学出版社,2022数据挖掘-概念、模型、方法和算法闪四清,陈茵,程雁清华大学出版社,2003七、学习具体内容第一章引言一、基本要求要求学生重点了解当今世界上流行数据挖掘技术的应用范围和流程,对数据挖掘有一个总体 的认识;重点掌握Clementine基本功能和操作;海量数据的选择,会正确解释软件处理的结果, 特别掌握样本信息的解释。二、授课方法自学。三、学习内容(一)什么激发了数据挖掘以及它的重要性(二)数据挖掘定义(三)在何种数据上进行数据挖掘1、关系数据库2、数据仓库3、事务数据库4、高级数据库系统和高级数据库应用(四)数据挖掘功能一一可以挖掘什
4、么类型的模式1、关联分析2、分类和预测3、聚类分析4、孤立点分析5、演变分析(五)数据挖掘软件Clementine的基本功能和操作四、重点难点数据挖掘的概念和基本功能五、思量与讨论1、什么是数据挖掘?2、数据挖掘的对象是什么?3、数据挖掘的主要功能有哪些?4、Clementine的基本功能和操作。第二章数据预处理一、基本要求要求学生重点掌握数据预处理的用途,能正确解释软件处理的结果,特别是样本信息的解释; 同时要求学生阅读一定数量的文献资料,加深理解如何对数据集进行合理的数据预处理。二、授课方法自学。三、学习内容(一)数据预处理的原因(二)数据集成和变换1、数据集成2、数据变换(三)缺失值处理
5、的方法1、处理带有缺失值的记录2、处理带有缺失值的字段3、归因或者填充缺失值4、用于缺失值的CLEM函数四、重点难点数据集中缺失值的处理方法及Clementine软件实现。五、思量与讨论1、为什么进行数据预处理?2、数据预处理的主要方法和合用范围是什么?第三章分类和预测一、基本要求要求学生理解分类、预测的各种建模方法的基本思想,掌握分类、预测建模方法的软件实现, 了解分类、预测方法的基本应用。二、授课方法自学。三、学习内容(一)什么是分类,什么是预测(二)分类预测:决策树1、决策树的基本思想2、C5.0算法及软件实现3、决策树的案例及分析(三)分类预测:神经网络1、神经网络的基本思想2、神经网
6、络的软件实现3、神经网络的案例及分析(四)预测1、线性回归和多元回归2、非线性回归3、其他回归模型(五)分类预测的准确性1、评估分类法的准确率2、提高分类法的准确率3、准确率足够判定分类法吗四、重点难点分类、预测的各种建模方法、软件实现及应用五、思量与讨论1、分类预测的作用和基本思想是什么?2、决策树的基本思想和软件实现。3、神经网络的基本思想和软件实现。4、分类预测模型的评估。第四章 复杂类型数据的挖掘一、基本要求要求学生对复杂类型数据的挖掘方法有一个概括的认识,理解并掌握时间序列数据挖掘模型 的构建方法及应用。二、授课方法自学。三、学习内容(一)复杂数据对象的多维分析和描述性挖掘1、结构化
7、数据的概化2、空间和多媒体数据概化中的会萃和近似计算3、对象标识符和类4、类复合层次的概化5、对象立方体的构造与挖掘6、用分而治之方法对规则数据库进行基于概化的挖掘(二)空间数据库挖掘1、空间数据立方体构造和空间OLAP2、空间关联分析3、空间聚类方法4、空间分类和空间趋势分析5、光栅数据库挖掘(三)时序数据和序列数据的挖掘1、趋势分析2、时序分析中的相似搜索3、序列模式挖掘4、周期分析四、重点难点时间序列数据挖掘模型的构建方法及应用五、思量与讨论1、什么是复杂类型数据?2、复杂类型数据的数据挖掘模型主要有哪些?3、时间序列数据挖掘模型的构建方法及软件实现。第五章 数据挖掘的应用和发展趋势一、基本要求要求学生了解数据挖掘的应用和发展趋势。二、授课方法自学。三、学习内容(一)数据挖掘的应用1、针对生物医学和DNA数据分析的数据挖掘2、针对金融数据分析的数据挖掘3、零售业中的数据挖掘4、电信业中的数据挖掘(二)数据挖掘的发展趋势四、重点难点数据挖掘的应用范围和发展趋势。五、思量与讨论1、数据挖掘的主要应用领域。2、数据挖掘的发展趋势。
限制150内