数据挖掘+数据挖掘实验教学大纲(共8页).docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《数据挖掘+数据挖掘实验教学大纲(共8页).docx》由会员分享,可在线阅读,更多相关《数据挖掘+数据挖掘实验教学大纲(共8页).docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上数据挖掘教学大纲课程类别:专业任选修课程 课程名称:数据挖掘开课单位:理学院 课程编号:B总学时:40 学 分:4适用专业:统计学专业先修课程:概率论、数理统计、多元统计分析等 一、课程在教学计划中地位、作用数据挖掘是20世纪末刚刚兴起的数据智能分析技术,由于有广阔的应用前景而备受重视。数据挖掘作为一门新兴的学科,在它的形成和发展过程中表现出了强大的生命力,广大从事数据科学和统计科学的科研工作者和工程技术人员迫切需要了解和掌握它。数据挖掘自产生以来就是以分析数据、理解数据的实际需求为推动力的,其研究发展也逐步渗透到工业、农业、医疗卫生和商业的实际需求当中。数据挖掘涉及
2、的内容较为广泛,已成为迅速发展并在信息社会中广泛应用的一门综合性学科。数据挖掘已成为计算机、统计学专业的一门重要课程,也是从事相关研究和应用人员必须掌握的重要知识。二、课程目标通过本课程的实验教学,使学生具备下列能力:(1)全面而深入地掌握数据挖掘的基本概念和原理,了解模型精度的评价方法。(2)深入地掌握线性回归分析及模型的改进与评价,掌握各种分类方法以及对其进行比较。能够对实际数据进行分类模型的建立,具有比较各方法的能力。(3)通过学习关联分析、社交网络分析以及文本挖掘,能够对实际数据进行处理、分析,并建立解释合理的统计模型。三、课程内容及基本要求第一章 数据挖掘概述1、理解和掌握数据挖掘的
3、基本概念、数据挖掘过程以及数据挖掘功能;2、了解数据挖掘的应用和面临的问题;3、对数据挖掘能够解决的问题和解决问题思路有清晰的认识。第二章 数据探索1、了解数据的导入与导出;2、了解单变量数据的探索方法;3、了解多变量数据的探索方法;4、掌握图表的意义以及数据的描述统计。第三章 回归分析1、理解多元线性回归模型的确定方法以及模型的检验方法; 2、理解基于树的回归分析方法; 3、了解非线性回归方法。第四章 分类1、了解分类及预测的基本思想、概念和意义;2、掌握逻辑斯蒂回归,掌握线性判别分析,了解非线性判别分析;3、了解分类方法的比较。第五章 聚类分析1、了解聚类分析的基本思想、概念和意义;2、
4、掌握相似度(或相异度)的常用度量方法;3、 掌握常用的聚类算法,包括K-Means、SOM 、BIRCH、DBSCAN、STING;4、了解孤立点分析的三类方法;了解其它方法的内容;了解聚类分析的研究动态。第六章 关联规则 1、了解关联规则的基本思想、概念和意义;2、了解关联规则挖掘的应用背景; 3、掌握常用的关联规则算法,包括Apriori、GRI、Sequence Detection;4、了解关联规则挖掘的研究动态。第七章 文本挖掘1、了解文本挖掘的基本思想、概念和意义;2、掌握常用的文本挖掘的软件包,了解分词方法,掌握词项-文档矩阵的建立方法。3、能够进行词频统计分析以及词项聚类; 3、
5、能够利用文本挖掘工具对实际文本数据进行建模分析。第八章 社交网络分析1、了解社交网络分析的基本思想、概念和意义;2、了解社交网络分析的应用背景;3、掌握社交网络分析方法。第九章 综合案例分析1、了解数据挖掘课程所学内容,能够利用所学统计模型建立合适的回归方程;2、了解关联规则和社交网络分析在商品销售中应用;四、学时分配章节名称讲授(学时)实验(学时)小计第一章 数据挖掘概述202第二章 数据探索202第三章 回归分析808第四章 分类404第五章 聚类分析404第六章 关联规则404第七章 文本挖掘606第八章 社交网络分析404第九章 综合案例分析606合计40040五、课程目标达成评价的途
6、径和措施本课程通过“平时成绩”、 “综合数据分析答辩成绩”两种方式对课程目标达成进行评价,考核成绩计算公式如下(本大纲中成绩均采用百分制):考核成绩 = 平时成绩30% +综合数据分析答辩成绩70%平时成绩 = 出勤成绩 1.平时成绩 平时成绩给定方法如下表所示:序号出勤次数成绩12010021990-9531880-8541770-7551660-6561550-5571440-454小于等于130在课堂上能积极主动回答问题,并回答正确者每次加10分;能积极主动回答问题,但有缺陷者每次加5分,该成绩加入平时成绩中。如平时成绩超过100分者,按最高分100分计。2、综合数据处理答辩成绩 综合数
7、据处理答辩成绩给定方法如下表所示:序号综合数据处理答辩情况成绩1统计描述恰当、图表使用正确、统计方法正确,结论合理,检验有效90-1002统计描述和图表解释不详,统计模型正确,结论合理,检验有效80-893统计描述恰当,图表适用正确,模型合理,结论合理,缺失模型检验70-794数据处理恰当,统计模型正确,结论较为合理,缺失模型检验60-695数据处理有错误,建立统计模型,结论没有有效分析31-596数据处理有错误,模型建立不合理0-30六、主要参考书1. Yanchang Zhao (陈健 黄琰 译). R语言与数据挖掘 最佳实践和经典案例. 机械工业出版社2. Luis Torgo (李洪成
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 实验教学 大纲
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内