Python数据分析与可视化教案3.3 数据的新增与删除.docx
《Python数据分析与可视化教案3.3 数据的新增与删除.docx》由会员分享,可在线阅读,更多相关《Python数据分析与可视化教案3.3 数据的新增与删除.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、课 题3.3数据的新增与删除课 型讲练授课班级大数据授课时数2教学目标1 .能够利用多种方法按列新增数据。2 .能够利用按列或按行删除数据。教学重点1 .能够利用多种方法按列新增数据。2 .能够利用按列或按行删除数据。教学难点1.能够利用按列或按行删除数据。学情分析删除行或列的数据时,需要使用axis参数进行控制,这一点很容易被 学生忽略。DataFrame作为一种二维表的数据结构,能够像数据库一样实现增加和删除操作, 如增删行或增删列,在实际应用新增列的情况比拟多。一、新增列数据在DataFrame中,添加一列有多种方法。而在新建列的时候,首先需要先创立一 个列名,再通过直接赋值、公式计算或
2、函数等方法生成列数据。比方可以根据单价和 数量计算出总价,再比方根据地区提取出省份和城市等。1 .利用直接赋值生成新列数据利用直接赋值生成新列数据最为简单,只需要将值赋给新列即可,其一般格式为:DataFrame new_column=value例如代码如下:import numpy as npimport pandas as pddata = pd.DataFrame(np.arange( 1,10).reshape(3,3),columns= index=,00r;002,;003,)print(初始数据为:n n,data)datafd1 = 2020-02-02print(通过直接赋值
3、新增列数据的结果为:n”,data)输出结果如图3-*所示。Run:3-3初始数据为:001 1 2 3002 4 5 6003 7 8 9通过直接赋值新增列数据的结果为:a b c I001123202002456202003789202)D-02-02 卜0202Process finished ijith exit code 0图3-*利用直接赋值生成新列数据例如结果2 .利用公式计算生成新列数据利用两列数据或多列数据,通过运算符经过公式计算也可生成新列数据,其一般 格式为:DataFrame!new_column = DataFrame|column 1 ( +-*/ ) DataFr
4、ame|column2 (+-*/)例如代码如下:data*e* = datafa1 + datafb1 + datafc1print。通过公式计算机新增列数据的结果为:n,data)输出结果如图3-*所示。Run:3-3C:UsersliliangAnaconda3python.exe C:/Users/liliang/PycharmProjects/sjfx/3-3.py 初始数据为:a b c001 1 2 3002 4 5 6a bcde0011232020-02-0260024562020-02-02150037892020-02-0224a bcde0011232020-02-02
5、60024562020-02-02150037892020-02-0224通过公式计算新增列数据的结果为:Process finished with exit code 0003 7 8 9图3-*利用公式计算生成新列数据例如结果3 .利用字符串拆分生成新列数据除了可以通过直接赋值和公式计算生成列数据以外,还可以通过字符串的拆分方 法str.split生成新列数据,其一般格式为:DataFramenew_column = DataFramecolumn .str.split(sep, expand)其中,sep表示分隔符,如逗号(,)、分号(;)、tab(t)、竖线(I)等。Expand表示是
6、否 把切割出来的内容生成新列,如果要生成新列,那么使用expand=True,如果不需生成 新列,就可以使用Falseo当DataFrame某一列被拆分后,可用str.split(sep,expand)i (i=0,l,2, )来表示拆分后的分列数据。str.split(sep,expand)。表示拆分后的第1列的 数据,str.split(sep, expand)表示拆分后的第2列数据,以此类推。例如代码如下:datayearr = datad .str. split,-,expand=True)0 datarmonth1 = data|d1 | .str.splitC-expand=Tru
7、e)! 1 print(”通过字符串拆分新增列数据的结果为:n”,data) 输出结果如图3-*所示。Run:3-3AC:UsersliliangAnaconda3python.exe C:/Users/liliang/PycharmProjects/sjfx/3-3.py初始数据为: a b cip001123002456”.003789通过字符串拆分新增列数据的结果为:a b cd e yea、month001 1 2 3 2020-02-026 202002002 4 5 6 2020-02-02 15 202。02003 7 8 9 2020-02-02 24 202002Proces
8、s finished with exit code 0二、数据的删除在DataFrame中,如果不需要某些行或某些列,可以使用drop函数删除数据。 drop函数的一般格式为:DataFrame.drop(labels, axis, inplace)其中,各个参数如下:labels表示表示删除的行或列的标签。axis表示删除的行还是列,axis=0表示行,axis=l表示列。在根据行索引删除多 行数据时,可以使用列表表示行索引。如删除第3行和第7行,可用labels=3,7。如 果删除第4行到第6行,可用labels=4,5,6,或者用range函数来表示,即 labels=range(4,7
9、)oinplace表示删除结果是否替换原表,即删除结果是否在原表显示,inplace=True 表示操作在原表生效,inplace=False表示操作在新表生效。默认是False,即如果要在 新表生效,可以不设置该参数。一定需要注意的是,如果使用inplace=False,必须要 把结果赋给一个新的DataFrame,否那么就看不到任何效果。例如代码如下:print(data 数据为:n”,data)data.drop(labels=*e,axis= 1 ,inplace=True)print(删除e列后结果在原表示的结果为:n”,data)data_new = data.drop(label
10、s=,001 ,axis=O,inplace=False)print。删除行索引为001后结果在新表示的结果为:n”,data_new)输出结果如图3-*所示。Run:3-3C:UsersliliangAnaconda3python.exe C:/Users/liliang/PycharmProjects/sjfx/3-3.py data数据为:abcdeyearmonth0011232020-02-0262020020024562020-02-02152020020037892020-02-0224202002删除。列后结果在原表示的结果为:abcdyearmonth0011232020-0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python数据分析与可视化 教案3.3 数据的新增与删除 Python 数据 分析 可视化 教案 3.3 新增 删除
限制150内