Python机器学习编程与实战教学教案04pandas进阶.docx
-
资源ID:39814624
资源大小:14.04KB
全文页数:5页
- 资源格式: DOCX
下载积分:15金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
Python机器学习编程与实战教学教案04pandas进阶.docx
第4章pandas进阶教案课程名称:Python机器学习编程与实战课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)总学分:4.0学分本章学时:8学时一、材料清单(1)Python机器学习编程与实战教材。(2)配套 PPT。(3)数据(4)代码(5)引导性提问。(6)探究性问题。(7)拓展性问题。二、教学目标与基本要求.教学目标介绍文本文件,Excel数据和数据库数据三种常用的数据读取与写入方式。介绍 DataFrame的常用描述性统计分析方法。介绍时间序列的移动窗口方法。剖析分组聚合方法 groupby的原理,用法和三种分组计算方法。展现透视表与交叉表的制作方法。介绍缺失值 与重复数据的检测和处理方法。介绍连续型数据离散化的方法和类别型数据的哑变量处理方 法。为使用pandas进行机器学习中的数据准备工作打下基础。1 .基本要求(1)掌握常见的数据读写方式。(2)掌握常用的描述性统计分析方法。(3)掌握移动窗口的方法。(4)掌握分组聚合的原理与方法。(5)掌握透视表与交叉表的制作。(6)掌握缺失值与重复数据的检测和处理方法。(7)掌握连续型数据离散化的方法。(8)掌握哑变量处理类别型数据的方法。三、问题1 .引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问 题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。(1)常见的结构化数据读取方式有哪些?(2)常见的描述性统计分析指标有哪些?(3) Excel透视表如何制作?2 .探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的 基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课 文中又是重要的问题加以设问。(1)读取数据库数据为什么需要别的库?(2)重复值是否一定要处理?(3)以百万级的数据为例,Excel制作透视表和Python制作透视表哪个速度更快?3.拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提 出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问 题。(1)能否读取word数据,该如何做?(2)除了哑变量处理外,还有那些方法可以处理离散型特征?(3)能否将这些方法写成自定义函数?四、主要知识点、重点与难点1.主要知识点(1)常见的数据读写方式。(2)常用的描述性统计分析方法。(3)时间序列的移动窗口方法。(4)分组聚合的原理与方法。(5)透视表与交叉表的制作。(6)缺失值的检测与处理。(7)重复值的检测与处理。(8)连续型特征离散化。(9)类别型特征哑变量处理。2.重点(1)常见的数据读写方式。(2)常用的描述性统计分析方法。(3)分组聚合的原理与方法。(4)透视表与交叉表的制作。(5)缺失值的检测与处理。(6)重复值的检测与处理。(7)连续型特征离散化。(8)类别型特征哑变量处理。3.难点(1)常见的数据读写方式。(2)分组聚合的原理与方法。(3)透视表与交叉表的制作。(4)类别型特征哑变量处理。五、教学过程设计1.理论教学过程(1)读写文本文件。(2)读写Excel文件。(3)读写数据库数据。(4)介绍DataFrame的常用描述性统计分析方法。(5)使用rolling方法移动窗口。(6)使用groupby方法拆分数据。(7)使用agg方法聚合数据。(8)使用apply方法聚合数据。(9)使用transform方法聚合数据。(10)使用povit_table函数创建透视表。(11)使用crosstab函数创建交叉表。(12)检测与处理缺失值。(13)检测与处理重复值。(14)离散化连续型数据。(15)哑变量处理类别型数据。2.实验教学过程(1)读写文本文件。(2)读写Excel文件。(3)读写数据库数据。(4)描述分析DataFrame数据。(5)移动窗口时间序列。(6)使用groupby方法拆分数据。(7)使用agg、叩ply、transform方法聚合数据。(8)制作透视表。(9)制作交叉表。(10)检测与处理重复值、缺失值。(11)离散化连续型数据。(12)哑变量处理类别型数据。六、教材与参考资料1.教材林耀进,张良均.Python机器学习编程与实战M.北京:人民邮电出版社.2020.2.参考资料1张健,张良均.Python编程基础M.北京:人民邮电出版社.2018.谭立云,2黄红梅,张良均.Python数据分析与应用M.北京:人民邮电出版社.2018.3张良均.Python数据分析与挖掘实战(第2版)M.北京:机械工业出版社.2019.4李明江,张良均,周东平,张尚佳.Python3智能数据分析快速入门M.北京: 机械工业出版社.2016.5张良均.Python与数据挖掘M.北京:机械工业出版社.2016.