《《金融数据挖掘》教学大纲(本科).docx》由会员分享,可在线阅读,更多相关《《金融数据挖掘》教学大纲(本科).docx(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、金融数据挖掘教学大纲课程英文名Financial Data Mining课程代码I0203Y12学分2.5总学时40理论学时28实验/实践学时12课程类别学科基础课课程性质任选先修课程应用统计学、多元统计适用专业金融工程开课学院经济与管理学院执笔人审定人制定时间2018年4月注:课程类别是指公共基础课/学科基础课/专业课;课程性质是指必修/限选/任选。一、课程地位与课程目标(一)课程地位金融实证研究的一个显著特点是数据分析量大、不确定性因素多,面对当今时代的海量金融 数据,基于传统统计技术建立的模型假设条件多,实际应用难以奏效。数据挖掘20世纪90年代 中期兴起的新技术,是发现数据中有用模式的
2、过程,其目的在于使用所发现的模式帮助解释当前 的行为或预测未来的结果,以人们容易理解的形式提供有用的决策信息。通过本课程的学习,使 学生初步掌握金融数据分析的基本方法,掌握几种重要的数据挖掘方法,掌握如何利用计算软件 分析数据、解决问题、完成相关研究。通过本课程的学习和相关软件的使用,使学生了解数据分 析和数据挖掘在金融领域的重要运用,使之能够利用所学到的数据分析与数据挖掘方法开展金融 领域的应用研究,并有进一步学习的基础与能力。(二)课程目标.理解数据挖掘的特点和基本流程,掌握数据挖掘的重要思想;1 .掌握不同类别的数据挖掘方法,包括回归、分类、聚类、降维等;.能够运用工具语言,如R、Pyt
3、hon等,进行数据挖掘;2 .学会运用数据挖掘的方法解决金融研究中的问题。二、课程目标达成的途径与方法本课程本着学以致用的原则,结合最新的发展,以课堂教学为主,结合实践教学、课堂讨论、 课外作业等方式来达成课程的学习目标。通过讲解数据挖掘的重要思想、建模方法、软件实现的 理论教学,使学生理解数据挖掘的建模思想、解决实际问题的办法和思路,掌握数据挖掘的常用 工具方法;通过课外实践和课外作业,使学生能够学以致用,学会用数据挖掘的方法解决金融研 究中的实际问题,并掌握一门编程语言作为后续学习和研究的工具。三、课程目标与相关毕业要求的对应关系注:1.支撑强度分别填写H、M或L (其中H表示支撑程度高、
4、M为中等、L为低)。课程目标课程目标对毕业要求的支撑程度(H、M、L)毕业要求4毕业要求7课程目标1ML课程目标2HH课程目标3MM课程目标4MH2.毕业要求须根据课程所在专业培养方案进行描述。四、课程主要内容与基本要求第一章数据挖掘概述(1)主要内容:数据挖掘的概念,数据挖掘的主要功能,数据挖掘的方法论,软件介绍。(2)基本要求:理解数据挖掘的概念及其主要功能,了解其应用领域及常用软件。第二章金融数据预处理(1)主要内容:数据理解与准备,数据预处理的任务与技术。(2)基本要求:理解并掌握利用工具软件进行数据预处理的基本方法。第三章回归类方法(1)主要内容:线性回归与非参数回归;(2)基本要求
5、:掌握回归建模方法,理解回归方法在数据挖掘中的应用;理解数据挖掘中 的交互验证的思想方法及应用第四章惩罚回归与特征变量选择(1)主要内容:岭回归、LASSO,弹性网等惩罚压缩类回归方法。(2)基本要求:理解各种分类方法的原理,能够利用工具软件实现惩罚回归方法的参数估 计、模型选择、模型应用等;第五章 基于logistic回归的分类方法(1)主要内容:logisti回归模型、分类结果的评价准则、多项式logistics回归;(2)基本要求:理解logistic回归的原理方法及应用,掌握二元分类方法的评价方法。第六章其它分类方法(1)主要内容:最近邻算法、决策树,集成方法:Bagging算法、Bo
6、osting算法和随机森林 算法、支持向量机与神经网络。(2)基本要求:理解各种分类方法,理解集成方法的一般原理,了解支持向量机和神经网 络在金融中的应用。第七章聚类方法(1)主要内容:k均值聚类(2)基本要求:掌握k均值聚类的原理和应用;第八章数据降维方法(1)主要内容:主成分分析、因子模型(2)基本要求:理解主成分分析方法原理及实现,了解主成分分析的实际应用。五、课程学时安排章节号教学内容学时 数学生任务(作业、自学、讨 论等任务要求)对应课程目 标第1章数据挖掘概述监督学习与非监督学习方法;数据挖掘的一般步骤软件介绍R、Python21、自学相关统计软件1、2第2章金融数据预处理不同数据
7、类型的描述性分析方法R软件讲解实例研究61、上机实践一次,2、作业一:完成数据的描述性分析1、3第3章回归类方法线性回归非参数回归-局部多项式方法模型的评价与选择41、完成软件实例研究1、2、3第4章惩罚回归与特征变量选择 岭回归、LASSO、弹性网 实例研究R或Python语言实现61、上机实践一次2、作业二:完成回归分析及 特征变量的选择3、实例金融数据挖掘1、 2、 3、 4第5章基于logistic回归的分类方法Logistics 回归二分类回归方法的评价 多项式logistics回归R软件实现61、上机实践一次2、作业三: 基于logistics 回归的分类判别1、 2、 3、 4第
8、6章其它分类方法KNN方法集成方法:Boosting随机森林支持向量机神经网络81、上机实践一次2、作业四:不同分类方法的 分类效果比较3、讨论神经网络的最新研 究进展及应用2、3、4第7章聚类方法K-均值聚类其他聚类方法简介41、上机实践一次2、大作业2、3、4第8章降维方法主成分分析、因子模型41、上机实践一次2、3、4六、实践环节及基本要求注:1,实验性质指演示性、验证性、设计性、综合性等;2.实验类别指必做、选做等。序 号实验项目名称学 时基本要求学生任务实验 性质实验 类别1数据预处理与描述性统 计分析2利用R软件掌握数 据集的读取与描述 性统计分析R软件相关功能 的学习与实例研 究
9、验证 性必做2回归分析与变量选择2掌握回归分析及压 缩回归分析的软件 实现完成给定数据集 的多种回归分析 及特征变量选择验证 性必做3Logistic回归与模型评 价2掌握二分类别及多 分类别的 logistic回归方 法及模型评价方法完成给定数据集 的分类判别验证 性必做4其他分类方法的软件实 现2理解并验证多种分 类方法包括KNN 集成方法及SVM等利用数据集和软 件包实现多种分 类方法的实证分验证 性必做5聚类分析方法2验证聚类方方法, 并开始大作业的选 题及准备工作完成k均值聚类 方法的验证,准 备大作业的选题综合 性必做6降维2验证PCA,完成大 作业的数据分析等 工作验证主成分分 析,并完成大作 业的内容综合 性必做七、考核方式及成绩评定考核内容考核方式评定标准(依据)占总成绩比例过程考核含到课率、平时作 业、大作业到课率、平时作业成绩及大作业成绩平时成绩占40%期末考核开卷卷面成绩考试成绩占80%考核类别考查成绩登记方式百分制八、推荐教材与主要参考书(一)推荐教材:数据挖掘与商务分析:R语言,Johannes Ledolter (美)著,宋涛等译,机械工业出版社, 2016.(二)主要参考书:1、机器学习与R语言,Brett Lantz (美)著,李洪成等译,机械工业出版社,2017。2、量化投资以R语言为工具,蔡立能著,电子工业出版社,2015o
限制150内