《《商务智能与数据挖掘》课程教学大纲.docx》由会员分享,可在线阅读,更多相关《《商务智能与数据挖掘》课程教学大纲.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、商务智能与数据挖掘教学大纲一、课程基本信息课程名称商务智能与数据挖掘Business Intelligence and Data Mining课程编码SEM221411035开课院部经济管理学院课程团队数据挖掘与智能决策教学团队学分3.5课内学时60讲授48实验12上机0实践0课外学时48适用专业信息管理与信息系统授课语言中文先修课程程序设计(Python)、线性代数、概率论与数理统计、运筹学、管理统计学课程简介 (必修)本课程是信息管理与信息系统专业学生必修的一门重要的学科基础课。课程主要讲授商务智能与数据挖掘标准流程和典型机器学习算 法,介绍Python数据挖掘与应用。通过本课程的学习,学
2、生应了解商务智能的系统架构和数据挖掘标准流程,理解商务智能与数据挖掘 的基本概念和方法,掌握数据挖掘相关模型的基础理论知识;针对数据挖掘的分类、聚类、关联分析等问题,能对数据进行有效的预处 理,选择合适的算法并进行参数调优,进行数据分析与挖掘以获得商务智能决策支持信息;掌握专门面向机器学习的Python包Scikit learn,能够通过Python编程进行具体的数据挖掘,具备商务数据分析和挖掘的能力。This course is an important compulsory basic course for students majoring in information manageme
3、nt and information systems. The course mainly teaches business intelligence and data mining standard processes and typical machine learning algorithms, and introduces Python data mining and application. Through the study of this course, students should understand the system architecture of business
4、intelligence and the standard process of data mining, and understand the basic concepts and methods of business intelligence and data mining, master the basic theoretical knowledge of data mining related models. Focusing on the classification, clustering, association analysis and other issues of dat
5、a mining, students should know how to effectively preprocess the data, select the appropriate algorithm and perform parameter tuning, and conduct data analysis and mining to obtain business intelligence decision support information. Students should master the Python package Scikit-learn which is spe
6、cifically used for machine learning and be able to analyze and mine business data with Python programming.负责人大纲执笔人审核人二、课程目标序号代号课程目标OBE毕业要求指标点任务自选1Ml目标1 : 了解商务智能的系统架构和数据挖掘标准流程是3.23.22M2目标2 :理解商务智能与数据挖掘的基本概念和方法,掌握数据挖掘相关算法的基础理论知识是4.24.23M3目标3 :针对具体数据挖掘问题,能选择合适的算法,通过Python编程进行数据分析与挖掘,获得 商务智能决策支持信息是3.33.
7、3三、课程内容序号章节号标题课程内容/重难点支撑课 程目标课内 学时教学方式课外 学时课外环节1第1章第1章商务智能 与数据挖掘概述本章重点难点:商务智能与数据挖掘的概念、数据挖掘的流程 及主要任务、商务智能的系统架构及实施 课程思政:遵纪守 法,尊重个人隐私/21. 11. 1商务智能与数 据挖掘简介商务智能与数据挖掘的需求和基本定义,应用案例讨论,商务 智能支撑技术Ml1讲授、讨 论1自主学习31.21.2数据挖掘的流 程数据挖掘涉及的领域,数据挖掘的流程,数据挖掘的主要任 务,常见的数据挖掘软件Ml2讲授、讨 论2自主学习41.31.3商务智能的系 统架构及实施商务智能系统架构,商务智能
8、系统要素,商务智能系统实施Ml1讲授、讨 论1自主学习5第2章第2章数据的理 解与预处理本章重点难点:数据对象与属性类型、数据的基本统计描述与 可视化、数据预处理方法/62. 12.1数据对象与属 性类型数据对象与属性术语表达,标称属性、二元属性、有序属性、 数值型属性M21讲授1自主学习72.22. 2数据的基本统 计描述与可视化集中趋势的度量,离散度的度量,数据的图形描述与可视化M21讲授1作业82.32. 3数据预处理方 法数据清洗,数据整合,数据缩减,数据变换与离散化M22讲授2自主学习9第3章第3章数据仓库 与在线分析处理本章重点难点:数据仓库设计与应用、联机分析处理的实现/103.
9、 13. 1数据仓库基本 概念数据管理与数据库,数据仓库定义,数据仓库模型,数据抽取一 转换-装载,数据仓库设计与应用M22讲授、讨 论2自主学习113.23. 2联机分析处理联机分析处理简介、分类,基本概念和典型操作,实现途径及 实施过程,评价准则M22讲授、讨 论2自主学习12第4章第4章模型评价 与选择本章重点难点:交叉验证、超参数选择、数据挖掘方法比较/134. 14.1旁置法估计训练和测试集合的划分,预测性能的置信区间,旁置法、交叉 验证、留一交叉验证法、自助法,验证集与超参数选择Ml2讲授2作业144.24. 2数据挖掘方法 比较T检验比较,损失函数,分类模型评价指标,成本计算,回
10、归 性能指标Ml2讲授2自主学习15第5章第5章贝叶斯网 络本章重点难点:朴素贝叶斯分类器、贝叶斯网络学习算法/165. 15.1朴素贝叶斯分 类器类别型朴素贝叶斯分类器、高斯朴素贝叶斯、多项式朴素贝叶 斯M22讲授2作业175.25.2贝叶斯网络贝叶斯网络定义,贝叶斯网络学习算法的构建,K2, TANM22讲授2自主学习18第6章第6章决策树本章重点难点:决策树常用算法、剪枝/196. 16.1决策树常用算 法OneR算法,连续性数据离散化方法,ID3算法,C. 5算法,CART算法M21讲授1作业206.26. 2决策树剪枝方 法预剪枝,后剪枝,后剪枝的两种方式,剪枝的原则M21讲授1自主
11、学习216.36.3集成学习装袋法、提升法、随机森林M22讲授2自主学习22第7章第7章聚类分析本章重点难点:K-Means聚类、层次聚类,DBSCAN聚类/237. 17. 1 K-Means 聚类相似度测度,K-Means聚类算法,对变量的预处理,K-Means聚 类的提升M21讲授1作业247.27. 2层次聚类层次聚类的特点,类别层次合并的方法,聚类数目的确定M21讲授1自主学习257.37. 3 DBSCAN 聚类DBSCAN聚类方法的基本参数、基本概念和算法,聚类质量的评 价M22讲授2自主学习26第8章第8章关联规则 挖掘本章重点难点:覆盖算法、Apriori算法/278. 18
12、.1覆盖算法:建 立规则规则与树,覆盖算法,规则与决策列表M22讲授2自主学习288.28. 2 Apriori 算法产生频繁项集,寻找频繁项集,依据频繁项集产生关联规则, 高效地生成规则,关联规则测度指标M22讲授2作业29第9章第9章线性模型本章重点难点:线性回归模型正则化项,logistic回归,感知 机的线性分类/309. 19.1线性回归模型线性回归模型表达及求解,正则化项对应的算法,logistic回 归模型表达及求解M22讲授2自主学习319.29. 2感知机感知机的线性分类,Winnow的线性分类M22讲授2自主学习32第10 章第10章神经网络本章重点难点:误差逆传播算法,全
13、局最小与局部最小,深度 学习/3310. 110. 1多层神经网 络神经元模型,多层神经网络,误差逆传播算法,全局最小与局 部最小M22讲授2自主学习3410.210.2深度学习卷积神经网络,循环神经网络,深度学习流行框架M22讲授2自主学习35第11第11章支持向量 机本章重点难点:支持向量机的模型求解、核函数的应用,支持 向量回归/3611.11L1支持向量机 分类间隔与支持向量,对偶问题,核函数,软间隔与正则化M22讲授2作业3711.211.2支持向量回 归基于线性和非线性核函数的支持向量回归M22讲授2自主学习38第12第12章商务智能 系统与应用本章重点难点:基于SAP的商务智能系
14、统,商品个性化推荐的 客户智能应用M2/3912. 112. 1基于SAP的 商务智能系统SAP商务智能系统在SAP应用系统中的地位,商务智能平台, 基于SAP的商务智能系统案例M22翻转课堂2自主学习4012.212.2客户智能应客户智能推荐系统应用案例,商品个性化推荐的客户智能应M22翻转课堂2自主学习用用,工业互联网中的客户智能应用41实验1实验1 :分类问题 一银行理财产品电 话销售预测针对于银行有关客户个人信息、通话过程、以往销售活动等因 素的数据,进行描述性分析,选取合适的特征,构建合理的模 型,并根据分类准确度等指标和工具评估模型的预测效果。M34上机2撰写报告42实验2实验2
15、:聚类分析 一网络零售客户聚 类通过对网络零售客户个人信息的聚类,发现客户群的特征,以 实现对目标客户的准确理解和客户定位,便于后期针对不同特 点的客户采用不同的营销策略。M34上机2撰写报告43实验3实验3 :预测问题 一工业蒸汽量预测选择经脱敏后的锅炉传感器采集的数据(采集频率是分钟级 别),根据锅炉的工况,预测产生的蒸汽量。M34上机2撰写报告四、考核万式序号考核环节操作细节总评占比1平时作业1 .每周布置1道题目。2 .成绩采用白分制,根据作业完成准确性、是否按时上交、是否独立完成评分。3 .考核学生对数据挖掘基本知识的掌握能力,学生综合运用所学知识分析问题、解决问题的能力题型主要有论
16、述、分析 和计算题。15%2实验1 .本课程12个学时实验,共3次实验。2 .成绩采用白分制,根据实验完成情况评分。3 .考核学生对机器学习算法包Scikit-learn的应用能力,针对不同的数据挖掘问题,进行数据分析与挖掘以获得商务 智能决策支持信息。15%3结课报告考核学生能够应用数据挖掘的相关理论方法,对数据进行科学的加工和分析处理,提供决策支持并进行阐述和交流的能 力:1 .从业务需求出发,解析为合适的数据挖掘问题,能对数据进行有效的预处理和统计性描述。2 .针对数据挖掘的分类、聚类、关联分析等问题,能够选择合适的算法并进行参数调优,进行数据分析与挖掘。3 .将数据挖掘结果进行解释和可
17、视化,能够获得商务智能决策支持信息。40%4课堂表现随机检查学生上课精神状态、回答问题情况10%5线上互动使用雨课堂随堂测验,主要考核学生对数据挖掘基本知识的掌握,学生综合运用所学知识分析问题、解决问题的能力,20%五、评分细则题型主要有简答题、选择题、填空题、计算题等。序号课程目标考核环节大致占比评分等级1Ml平时作业50%A-按时提交作业,商务智能架构和数据挖掘基本流程理解无误。B-按时提交作业,商务智能架构和数据挖 掘基本流程理解存在少量错误。c-不按时提交作业,商务智能架构和数据挖掘基本流程理解存在少量错 误。D-不按时提交作业,商务智能架构和数据挖掘基本流程理解存在错误。E-不按时提
18、交作业,商务智能 架构和数据挖掘基本流程理解存在大量错误。2Ml结课报告50%A-按时提交报告,商务智能架构和数据挖掘基本流程理解无误。B-按时提交报告,商务智能架构和数据挖 掘基本流程理解存在少量错误。c-不按时提交报告,商务智能架构和数据挖掘基本流程理解存在少量错 误。D-不按时提交报告,商务智能架构和数据挖掘基本流程理解存在错误。E-不按时提交报告,商务智能 架构和数据挖掘基本流程理解存在大量错误。3M2平时作业40%A-按时提交作业,数据挖掘和模型算法等基本知识点理解无误。B-按时提交作业,数据挖掘和模型算法等 基本知识点理解存在少量错误。C-不按时提交作业,数据挖掘和模型算法等基本知
19、识点理解存在少量错 误。D-不按时提交作业,数据挖掘和模型算法等基本知识点理解存在错误。E-不按时提交作业,数据挖掘 和模型算法等基本知识点理解存在大量错误。4M2线上互动40%A, B, C, D, E = 90-100, 80-89, 70-79, 60-69, 0-595M2课堂表现10%A-回答问题积极,数据挖掘和模型算法等基本知识点理解无误。B-回答问题积极,数据挖掘和模型算法等 基本知识点理解存在少量错误。C-回答问题不积极,数据挖掘和模型算法等基本知识点理解存在少量错 误。D-回答问题不积极,数据挖掘和模型算法等基本知识点理解存在错误。E-回答问题不积极,数据挖掘 和模型算法等基
20、本知识点理解存在大量错误。6M3实验50%A-按时提交实验报告,针对具体数据挖掘问题,能选择合适的算法,Python编程正确,算法性能优秀,能 得到较好的数据分析与挖掘结果。B-按时提交实验报告,针对具体数据挖掘问题,能选择该问题所属类的 算法,Pylhon编程正确,但算法性能不好,能得到数据分析与挖掘的结果。C-不按时提交实验报告,针对 具体数据挖掘问题,能选择该问题所属类的算法,Python编程正确或有少量错误,算法性能不好,能得到 数据分析与挖掘的结果。D-不按时提交实验报告,针对具体数据挖掘问题,能选择该问题所属类的算法, Python编程不止确,算法性能不好,数据分析与挖掘的结果错误
21、。E-不按时提交实验报告,针对具体数据 挖掘问题,不能选择该问题所属类的算法,Python编程不止确,得到的数据分析与挖掘结果错误。7M3结课报告50%A-按时提交结课报告,针对具体数据挖掘问题,能选择合适的算法,Python编程正确,算法性能优秀,能合理地阐释和可视化数据分析与挖掘结果。B-按时提交结课报告,针对具体数据挖掘问题,能选择该问题 所属类的算法,Python编程正确,但算法性能不好,能合理地阐释和可视化数据分析与挖掘的结果。C-不 按时提交结课报告,针对具体数据挖掘问题,能选择该问题所属类的算法,Pylhon编程正确或有少量错 误,算法性能不好,能合理地阐释和可视化数据分析与挖掘
22、的结果。D-不按时提交结课报告,针对具体数 据挖掘问题,能选择该问题所属类的算法,Python编程不止确,算法性能不好,不能合理地阐释和可视化 数据分析与挖掘的结果。E-不按时提交结课报告,针对具体数据挖掘问题,不能选择该问题所属类的算 法,Python编程不正确,不能合理地阐释和可视化数据分析与挖掘的结果。评分等级说明:A, B, C, D, E = 90-100, 80-89, 70-79, 60-69, 0-59;六、教材与参考资料序号教学参考资料明细1图书 Data Mining: Concepts and Techniques (英文版第三版),Jiawei Han,机械工业出版社,
23、2014. 07, ISBN:9787111374312. (*主教材)2图书1商务智能与数据挖掘,陈晓红,高等教育出版社,2018. 09, ISBN:9787040497946.3图书1机器学习,周志华,清华大学出版社,2016.01, ISBN:9787302423287.4M00C| Python快速入门,张敏,泰迪云课堂.5期干IJ论文 UC Irvine Machine Learning Repository, Dua, D. , University of California, School of Information and Computer Science, 2017.6期干论文 A data-driven approach to predict the success of bank telemarketing, Sergio Moro, Decision Support Systems, 2014. 06.七、实验项目信息序号项目名称实验室名称门牌号组人数学时实验类别要求实验类型上机1分类问题一银行理财产品电话销售预 测机房24专业必做验证性是2聚类分析一网络零售客户聚类机房24专业必做验证性是3预测问题一工业蒸汽量预测机房24专业必做验证性是
限制150内