数据挖掘与数据仓库实验课程教学大纲.docx
数据挖掘与数据仓库实验教学大纲课程编号Xx408313课程名称数据挖掘与数据仓库总学时32学分数2适用专业计算机科学与技术先修课程离散数学、概率统计、线性代数、数据库原理、 MySQL数据库技术、数据结构、算法设计与分析一、实验教学的目的和任务数据挖掘是20世纪末刚刚兴起的数据智能分析技术,由于有广阔的应用前 景而备受重视。数据挖掘作为一门新兴的学科,在它的形成和开展过程中表现出 了强大的生命力,广大从事数据库应用与决策支持,以及数据分析等学科的科研 工作者和工程技术人员迫切需要了解和掌握它。数据挖掘涉及的内容较为广泛, 已成为迅速开展并在信息社会中广泛应用的一门综合性学科。数据挖掘已成为信 息类专业的一门重要课程。通过数据挖掘课程的教学,使学生理解数据挖掘的基 本概念和方法,为进入更深入的智能数据分析研究打好基础。本课程的任务是:通过实践,学生对常用数据挖掘中的基本概念及其不同算 法的实现方法的理论得到进一步的掌握,并对数据挖掘中的数据预处理、分类与 聚类方法的具体实现及作用有所体会。二、实验教学的基本要求本课程是一门实践性很强的专业课,只有了解这门课程的特点和基本要求, 学习时才能做到有的放矢,举一反三,本课程特点主要有以下几个方面:(1)内容丰富,理论性强。本课程为以后更深入的进行智能数据分析研究打 下良好的基础。(2)注重理论联系实际,加强实验环节的训练。只有通过实验,才能透彻理 解基本原理。三、实验工程设置' 学时分配序 号实验工程名称实验目的实验 学时实验类型开出要求1数据仓库的设计在学习的过程中,学生需要 在教材的基础上搜索相关的 文献资料,对于研究内容,4验证性必做只要能够形成决策的数据环 境即可,同时对于研究方法 也不做具体的限制;对于研 究内容,要能表达出数据仓 库设计的各个阶段和方法侧 重点。2实践 SQL Server 数据多维分析环 境学习和掌握Sql Server 2005 Analysis Services 工具集, 包括如何在BI Development Studio 的 Analysis Services工程中定义数据 源、数据源视图、维度、属 性、层次结构和多维数据集, 如何查看多维数据集和维 度,理解并掌握OLAP分析的 基本过程与方法。4验证性必做3数据预处理在学习的过程中,学生需要 在教材的基础上搜索相关的 文献资料,采用任何数据预 处理方法,只要能到达相应 的决策目的即视为有效;对 于研究内容,只要能够为以 后的数据挖掘提供准备功能 即可,同时对于研究方法也 不做具体的限制,但是要能 表达出数据预处理的合理 性。4综合性必做4Apriori 算法掌握Apriori算法模型的实 现过程及基本方法。掌握Apriori算法的实现。4综合性必做5贝叶斯分类器的 设计掌握Naive Bayes算法模型 的实现过程及基本方法。掌握Naive Bayes算法的实 现。4综合性必做6决策树算掌握决策树算法模型的实现 过程及基本方法。掌握决策树算法的实现4综合性必做7KNN分类器的设 计掌握最近邻算法模型的实现 过程及基本方法。掌握最近邻算法的实现。4综合性必做8k-Means 算法掌握k-Means算法模型的实 现过程及基本方法。掌握k-Means算法的实现4设计性必做注:1. “实验类型”分为验证性、综合性、设计性、创新性等类型。2. “开出要求”分为“必做”和“选做”。3.每个实验工程学时一般以2学时为宜,最多不超过4学时4.注意不同课程之间实验工程不要重复编制四、考核方式与评分标准(注:实验考核方式至少应当包含上述内容,教师根据实际情况还可以增加,实验课程成绩 为100分制,单独录入教务管理系统)考核环节评分依据占总成绩的比重平时实验出勤上课缺席一次扣2分,缺课达1/3取消资格10%平时实验完成情况对每个实验工程的内容逐个检查,实验工程按要求 完成记总分值,其他情况酌减20%实验报告确保实验报告上的实验现象正确、实验过程规范、 实验内容完整,有遗漏的酌情减分20%实验考核根据完成情况酌情给分50%五、实验教材或参考书(1)张云涛、龚玲著,数据挖掘原理与技术,电子工业出版社,2004.(2)陈京民编著,数据仓库与数据挖掘技术,电子工业出版社,2002.(3)林杰斌主编,数据挖掘与OLAP理论与实务,清华大学出版社,2003.(4)朱明编著,数据挖掘,中国科学技术大学出版社,2002.(5) Richard J. Roiger, Michael W. Geatz著,翁敬农 译,数据挖掘教程, 清华大学出版社,2003.(6) David Hand, Heikki Mannila, Padhraic Smyth 著,张银奎、廖丽、宋 俊等译,数据挖掘原理,机械工业出版社,2003.(7) Jiawei Han. Micheline Kamber著,范明等译,数据挖掘:概念与技术(第三版),机械工业出版社,2012.