《《高级算法分析与设计》课程教学大纲.docx》由会员分享,可在线阅读,更多相关《《高级算法分析与设计》课程教学大纲.docx(3页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、高级算法分析与设计课程教学大纲一、课程基本信息中文名称:高级算法分析与设计英文名称:Advanced Algorithm Design and Analysis开课学院:计算机科学学院课程编码:学分:总学时:36适用专业:修读基础:数据结构,离散数学,数据库原理,面向对象程序设计语言(简述,修读本课程需要具备的基础)课程负责人:闵帆(教授)主讲教师:闵帆(教授)二、课程目的任务L课程地位作用(课程在实现培养目标中的地位作用)数据挖掘从上世纪70年代开始被研究,近年来获得飞速发展。本课程在计算机专 业处于核心地位。理论方面,数据挖掘涉及图论、信息熠、高维空间,NP问题等专业 基础。该课程有助于培
2、养研究生的建模能力。算法方面,数据挖掘需要多种启发式搜索算法,包括仿生算法的设计,对开拓研究 生的创造力有非常大的好处。应用方面,数据挖掘已在各行各业获得广泛应用。随着大数据时代的到来,数据挖 掘正在扮演越来越重要的角色。如何将数据挖掘应用于实际问题,并提出合适的解决方 案,有助于提高研究生的实践能力。从实际问题中抽象出模型,并设计高效、结果好的算法,最终应用于实际问题或公 开数据库,有助于全面提升研究生的科研能力。2 .课程主要内容(简述:主要内容、重点、难点等)课程主要包括数据挖掘的十大经典算法,仿生算法,以及回溯算法。具体包括:(1) kNN算法(重点)。(2) k-means算法(重点
3、)(3) Apriori算法(重点)(4) ID3算法(重点)CART算法(6) EM算法(7) PageRank 算法(难点)(8) AdaBoost 算法(9) Naive Bayes 算法(10) SVM (难点)(11)遗传算法(12)蜂群算法(13蚁群算法(14)回溯算法(重点).学生应达到的基本要求掌握各算法的原理,熟练掌握算法的基础版本的编码实现。掌握两种算法的最新发展。熟悉至少一种算法的最新研究动向,改进它并写出一篇论文。三、教学内容与学时分配(含各时段学生课外学习要求)(l)kNN算法(重点)。决策表,分类(监督学习)的概念。kNN分类算法的设计与 实现,各种距离的定义,k值
4、的选择。分类算法的实现。课时分配:原理1课时, 设计与实现2课时,讨论1课时,共4课时。课外要求:kNN分类算法的实现,及在多个UCI数据中的性能测试。推荐系统中 的kNN算法,以及其代码实现。在Movie-lens数据库中测试。(2) k-means算法(重点)。信息表,聚类(无监督学习)的概念,k-means聚类算 法的设计与实现。聚类中心点的选择。随机算法的引入。课时分配:原理1课时, 设计与实现2课时,讨论1课时,共4课时。课外要求:根据不同的k-means中心点随择和距离生成方案,获得不同算法,并 在多个UCI数据库中比较其性能。(3) Apriori算法(重点)。交易数据的定义。A
5、priori性质。频繁项挖掘算法、关联 规则挖掘算法的设计与实现。量化数据的关联分析。课时分配:原理1课时,设 计与实现1课时,讨论1课时,共3课时。课外要求:Apriori算法的实现,FP-growth算法的实现,量化数据的关联分析。(4) ID3与C4.5算法(重点)。名词型数据。信息端,树型分类器。ID3算法的设计 与实现。剪枝技术。课时分配:原理1课时,设计与实现1课时,讨论1课时, 共3课时。课外要求:ID3算法的实现,在多个UQ数据库中的性能测试。(5) CART算法。CART算法。课时分配:原理1课时,设计与实现1课时,讨论1课 时,共3课时。课外要求:CART算法的实现,在多个
6、UQ数据库中与ID3进行效果对比。(6) EM算法。聚类问题的进一步研究。EM算法设计与实现。课时分配:原理1课时, 设计与实现1课时,讨论1课时,共3课时。课外要求:CART算法的实现,在多个UCI数据库中与k-means进行效果对比。(7) PageRank算法(难点)。搜索引擎的原理,网页的组织形式,倒排文件。课时分 配:原理1课时,设计与实现1课时,讨论1课时,共3课时。课外要求:实现爬虫,获得部分网页数据,并实现简单的搜索引擎。(8) AdaBoost算法。随机决策树,Boost方法。AdaBoost算法的设计与实现。课时分 配:原理1课时,设计与实现1课时,讨论1课时,共3课时。课
7、外要求:实现算法,并与ID3和CART进行对比。(9) Naive Bayes算法。概率论,条件概率,Bayes公式。Bayes算法的设计与实现。 课时分配:原理1课时,设计与实现1课时,共2课时。课外要求:实现算法,并与【D3和CART进行对比。(10) SVM (难点)。SVM原理,核函数。SVM分类算法的设计与实现。课时分配:原理1课时,讨论1课时,共2课时。课外要求:在小数据集中,利用简单的核心函数进行分类。(11)遗传算法。编码、选择、变异、交叉。用遗传算法解决属性选择问题。课时分 配:原理1课时,讨论1课时,共2课时。(12)蜂群算法。算法原理及应用。课时分配:原理1课时。(13)蚁群算法。算法原理及应用。课时分配:原理1课时。(14)回溯算法(重点)。课时分配:原理1课时,设计与实现1课时,共2课时。四、考核方式与成绩评定.考核方式:(笔试、论文、口试等)综述论文:某一数据挖掘算法的最新研究进展报告(可两人合作) 小论文:新算法(每人一篇).成绩评定办法:(平时成绩、期末考试成绩等比例)平时成绩30分,论文70分五、教材及主要参考书目教材:数据挖掘十大算法,吴信东等著。算法分析与设计,张晓东等六:其他需要说明的问题无 大纲执笔人:闵帆大纲审批机构:计算机科学学院教授委员会2015年8月 26 日
限制150内