《Python数据分析与应用案例教程》教案 第8课数据的清洗.docx
《《Python数据分析与应用案例教程》教案 第8课数据的清洗.docx》由会员分享,可在线阅读,更多相关《《Python数据分析与应用案例教程》教案 第8课数据的清洗.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、课题第8课数据的清洗课时2 课时(90 min )教学目标知识技能目标:(1 )掌握处理缺失值和重复值的方法(2 )掌握握处理重复值的方法(3 )能对数据进行清洗等预处理操作素质目标:养成分析问题、事前做好准备的良好习惯教学重难点教学重点:处理缺失值和重复值的方法教学难点:能对数据进行清洗等预处理操作教学方法案例分析法、问答法、讨论法、讲授法教学用具电脑、投影仪、多媒体课件、教材、APP教学设计第1节课:考勤(2 min )一问题导入(5 min ) 一传授新知(28 min ) 一课堂实践(10 min )第2节课:问题导入(8 min ) 一传授新知(20 min ) 一课堂实践(12 m
2、in )一课堂小结(3 min ) 一作 业布置(2 min )教学过程主要教学内容及步骤设计意图第一节课考勤(2 min)【教师】使用APP迸行签到【学生】按照老师要求签到培养学生的组 织纪律性,掌握学 生的出勤情况问题导入(5 min)【教师】提出问题在进行数据分析之前要进行数据预处理,数据预处理包含哪些工作?【学生】思考、举手回答通过提问的方 法,了解学生对上 节课知识的掌握 程度,进而引出新 知传授新知(28 min )【教师】总结学生的回答,并引入新知,讲解数据清洗的相关知识3.1.1 缺失值的处理*【教师】请同学们扫描二维码学习数据缺失值的处理,并回答以下问题:什么是缺失值?小【学
3、生】扫描二维码、思考、回答问题小【教师】总结学生的回答,并讲解新知缺失值是指数据集中某个或某些值是不完整的,它会导致数据样本信息减少, 不仅增加了数据分析的难度,还会使数据分析的结果产生偏差。1 .检查缺失值DalaFrame对象中数据的修改包括修改索引和数据。十【教师】多媒体出示了 duplicated。函数的一般格式(详见教材),并详细通过教师讲解、 课堂讨论、多媒体 演示等方式,使学 生了解数据清洗 的相关内容,包括数据缺失值等相 关知识讲解各部分表示的内容Pandas提供了 isnull。函数和nolnull。函数用于检查缺失值(NaN ),它们的一 般格式如下。DataFrame.i
4、snull()DataFrame.notnullO使用isnull()函数检查缺失值时缺失值位置返回True等缺失值位置返回False ; 而notnullO函数正好相反,缺失值位置返回False ,非缺失值位置返回True,此外,isnullO函数和nomullO函数还可以结合sum。函数,统计数据中每的缺 失值个数。A【教师】按照教材步骤逐步分析并进行演示例3-1 (详见教材)的程序编写 步骤:import pandas as pddf = pd.DataFramc(商品苹果香蕉丁梨 1单价(元):5. 5. 4,销量(kg) ,:100, None, None,库存(kg ) *: 50
5、, None. 70|)print(原始数据:n. df)prin【(检直缺失值:n, df.isnullO)print。检查非缺失值:n. df.notnullO)prim(统计每列缺失值的个数:n, df.isnull().suin()(详见教材)【学生】现察、记录、理解)【学生】教师演示完成后,学生按照教材提示和教师演示进行实际操作,并 对比程序运行结果(详见教材)【教师】巡视课堂记录,对学生进行个别指导【教师】提出学习任务:对比程序结果,进行程序分析.【学生】观察、记录、理解、分析中【教师】总结学生的任务完成情况,并讲解新知Pandas中,缺失值默认的数据类型为浮点型,包含缺失值的列中
6、整型雌会自 动转换为浮点型。因此,不包含缺失值的单价列中数据仍为整型,而包含缺失值的 销量列和库存列中数据变成了浮点型。2.处理缺失值Pandas提供了 dropnaO函数和fillna。函数用于处理缺失值。1 ) dropnaO函数小【教师】多媒体出示了 dropnaO函数的一般格式(详见教材),并详细讲 解各部分表示的内容dropnaO函数用于删除包含缺失值的行或列,其一般格式如下。DataFrame.dropna(axis=0, how=any*. thresh=None. subset=None. inplace=False)(I )axis表示删除行或列,如果取0或index,表示删
7、除包含缺失值的行; 如果取1或columns,表示删除包含缺失值的列;默认为0。(2 ) how表示删除的标准,如果取any”,表示删除包含缺失值的行或列; 如果取all,表示删除所有值都为缺失值的行或列;默认为“any。(3 ) thresh表示非缺失值个数的最小要求。例如,thresh为2时,删除少于两 个非缺失值的行或列。(4 ) subset表示列索引或标签列表,删除指定列包含缺失值的行。(5 ) inplace表示是否在原数据上删除,如果为True则直接在原数据上删除; 如果为False则不在原数据上删除,返回一个新对象;默认为False.【教师】按照教材步骤逐步分析并进行演示例3-
8、2 (详见教材)的程序编写 步骤:mport pandas as pddf = pd.DataFrame(商品,:苹果香蕉丁梨I,单价(元):5, 5, 4,销量(kg 八100, None, None,库存(kg ),: 50, None, 70)print(原始数据:n df)print(删除包含缺失值的行:n, df.dropna()print(删除包含缺失值的列:n, df.dropna(axis=i)print(删除少于3个非缺失值的行:n; df.dropna(thresh=3)print(删除库存列包含缺失值的行:n, df.dropna($ubscl=库存(kg )1)(详见教
9、材)沙【学生】观察、记录、理解【学生】教师演示完成后,学生按照教材提示和教师演示进行实际操作,并 对比程序运行结果(详见教材)小【教师】巡视课堂记录,对学生进行个别指导2) rillna()函数十【教师】多媒体出示了 fillna()函数的一般格式(详见教材),并详细讲解 各部分表示的内容DataFrame.flllna(value=None, method=None. inplace=False)(1 ) value表示用于替换的数据,可以是单个数值,表示将所有的缺失值都替 换为value ;也可以是字典,字典的键为列标签,字典的值为替换的数据,表示将指 定列的缺失值替换为字典的值。(2 )
10、 method表示替换方式,如果是pad或ffill,表示使用每列第一个 缺失值前面的非缺失值替换该列的所有缺失值;如果是backfill或bfill”,表 示使用每列最后一个缺失值后面的非缺失值替换该列的所有缺失值。(3 ) inplace同样表示是否在原数据上替换。此处需要特别注意的是,value参数和method参数不能同时使用。【教师】按照教材步骤逐步分析并进行演示例3-3 (详见教材)的程序编写步骤:import pandas as pddf = pd.DaiaFramc(商品苹果丁香蕉丁梨1,单价(元):5,5,4,销量(kg ) ,: 100, None, None,库存(kg
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python数据分析与应用案例教程 Python数据分析与应用案例教程教案 第8课 数据的清洗 Python 数据 分析 应用 案例 教程 教案 清洗
限制150内