《数据科学导论》教学大纲(本科).docx
数据科学导论教学大纲课程英文名Introduction to Data Science课程代码J0701Z81学分3总学时48理论学时24实验/实践学时 24课程类别专业课课程性质任选先修课程Python程序设计适用专业信息与计算科学、数学与应用数学开课学院理学院执笔人审定人制定时间2018年05月注:课程类别是指公共基础课/学科基础课/专业课;课程性质是指必修/限选/任选。一、课程地位与课程目标(一)课程地位数据科学导论是信息与计算科学和数学与应用数学两个专业的数据科学与技术方向的一 门方向导论性质的专业基础课,是数据科学技术的重要理论基础,主要介绍基本数据结科学技术 及其应用。本课程在专业培养体系中具有重要的地位,是数据科学技术应用基础,对许多数据科 学技术的相关课程起到支撑的作用。(二)课程目标L 了解数据科学的基本概念;2 .熟悉常用数据科学技术;3 .培养学生具有基本的数据分析处理能力;4 .培养学生的程序设计能力。二、课程目标达成的途径与方法以课堂教学为主,结合自学、课堂讨论、课外作业、实验验证等。课堂教学,采用ppt和板书结合讲解,并通过程序演示课堂讨论,围绕一个关键问题,分组讨论,并选派学生阐述自己的观点课外作业,在教材每个章节后面的练习中选择有代表性的问题作为学生课后的书面作业,检 查学生对知识的掌握程度实验验证,选择适当的案例,通过仿照例子编写一定的程序代码,验证理论,提高能力三、课程目标与相关毕业要求的对应关系课程目标课程目标对毕业要求的支撑程度(H、M、L)毕业要求4毕业要求6毕业要求10课程目标1HMM课程目标2HMM课程目标3HMM课程目标4HMM注:1.支撑强度分别填写H、M或L (其中H表示支撑程度高、M为中等、L为低)。四、课程主要内容与基本要求第1章绪论内容:数据科学的概念,数据分析的步骤,数据的获取途径要求:了解数据科学概念;掌握数据分析步骤;了解数据获取途径第2章 数据科学的Python核心内容:Python基础要求:掌握Python基本程序设计方法第3章使用文本数据内容:处理HTML文件;处理CSV文件;读取JS0N文件要求:掌握处理HTML文件、CSV文件和读取JS0N文件的基本方法第4章使用数据库内容:设置和使用MySQL数据库要求:掌握MySQL数据库的应用方法第5章使用表格形式的数值数据内容:numpy数组的创建及应用要求:掌握numpy数组的应用第6章使用series和frame内容:pandas模块的结构及其应用要求:掌握pandas模块在数据科学中的应用第7章使用网络数据内容:Networkx模块及网络数据处理要求:掌握Networkx模块基本应用及网络数据简单处理第8章可视化内容:PyPlot模块进行基本绘图;绘图装饰;pandas绘图要求:掌握利用PyPlot模块进行基本绘图;了解绘图装饰;掌握pandas绘图第9章概率和统计内容:概率分布;统计度量;Python实现概率和统计计算要求:了解概率分布和统计度量;掌握概率统计计算方法的Python语言实现第10章机器学习内容:线性回归拟合;k均值聚类;随机森林要求:掌握线性回归拟合和K均值聚类方法;了解随机森林算法五、课程学时安排章节号教学内容学时 数学生任务对应课程目 标第1章数据科学的概念, 数据分析的步骤, 数据的获取途径21 .完成本章编程练习2 .预习下一章内容课程目标1课程目标2第2章Python基础41 .完成本章编程练习2 .预习下一章内容课程目标4第3章处理HTML文件; 处理CSV文件; 读取JS0N文件41 .完成本章编程练习2 .预习下一章内容课程目标1 课程目标2 课程目标3 课程目标4第4章设置和使用MySQL数据库41 .完成本章编程练习2 .预习下一章内容课程目标1 课程目标2 课程目标3 课程目标4第5章numpy数组的创建及应用41 .完成本章编程练习2 .预习下一章内容课程目标1 课程目标2 课程目标3 课程目标4第6章pandas模块的结构及其应用41 .完成本章编程练习2 .预习下一章内容课程目标1 课程目标2 课程目标3 课程目标4第7章Networkx模块及网络数据处理81 .完成本章编程练习2 .预习下一章内容课程目标1 课程目标2 课程目标3 课程目标4第8章PyPlot模块进行基本绘图; 绘图装饰;pandas绘图41 .完成本章编程练习2 .预习下一章内容课程目标1 课程目标2 课程目标3 课程目标4第9章概率分布;统计度量;Python实现概率和统计计算41 .完成本章编程练习2 .预习下一章内容课程目标1 课程目标2 课程目标3 课程目标4第10章线性回归拟合; k均值聚类; 随机森林101.完成本章编程练习课程目标1 课程目标2 课程目标3 课程目标4六、实践环节及基本要求序 号实验项目名称学时基本要求学生任务实验 性质实验 类别1Python基础复习2验证Python语法完成编程验证验证必做2文本文件处理2文本数据分析完成编程验证验证必做3MySQL数据库2数据库数据分析完成编程验证验证必做4Numpy基本操作2验证Numpy基本 操作完成编程验证验证必做5Pandas基本操作2验证pandas基本 操作完成编程验证验证必做6网络数据处理4验证Networkx基本操作和算法完成编程验证验证必做7可视化2验证PyPlot绘画完成编程验证验证必做8概率和统计2验证概率计算的Python实现完成编程验证验证必做9机器学习6验证机器学习算 法完成编程验证验证必做注:L实验性质指演示性、验证性、设计性、综合性等;2,实验类别指必做、选做等。七、考核方式及成绩评定考核内容考核方式评定标准(依据)占总成绩比例过程考核含到课率、课堂讨论发言、平时 作业等平时成绩记录40%期末考核开卷卷面评阅成绩60%考核类别考试成绩登记方式百分制八、推荐教材与主要参考书(一)推荐教材:1 .Python数据科学入门,Dmitry Zinoviev著,熊子源译,人民邮电出版社,2017.112 .数据科学导论:Python语言实现,Alberto Boschetti, Luca Massaron,于俊伟译,机械工业 出版社,2016.8(-)主要参考书:1 .数据科学,朝乐门著,清华大学出版社,2016.8.2 .数据科学理论与实践,朝乐门著,清华大学出版社,2017.10.