欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    Python数据分析与可视化教案3.3 数据的新增与删除.docx

    • 资源ID:86359222       资源大小:65.55KB        全文页数:7页
    • 资源格式: DOCX        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    Python数据分析与可视化教案3.3 数据的新增与删除.docx

    课 题3.3数据的新增与删除课 型讲练授课班级大数据授课时数2教学目标1 .能够利用多种方法按列新增数据。2 .能够利用按列或按行删除数据。教学重点1 .能够利用多种方法按列新增数据。2 .能够利用按列或按行删除数据。教学难点1.能够利用按列或按行删除数据。学情分析删除行或列的数据时,需要使用axis参数进行控制,这一点很容易被 学生忽略。DataFrame作为一种二维表的数据结构,能够像数据库一样实现增加和删除操作, 如增删行或增删列,在实际应用新增列的情况比拟多。一、新增列数据在DataFrame中,添加一列有多种方法。而在新建列的时候,首先需要先创立一 个列名,再通过直接赋值、公式计算或函数等方法生成列数据。比方可以根据单价和 数量计算出总价,再比方根据地区提取出省份和城市等。1 .利用直接赋值生成新列数据利用直接赋值生成新列数据最为简单,只需要将值赋给新列即可,其一般格式为:DataFrame new_column=value例如代码如下:import numpy as npimport pandas as pddata = pd.DataFrame(np.arange( 1,10).reshape(3,3),columns= index=,00r;002,;003,)print("初始数据为:n n,data)datafd1 = '2020-02-02'print(通过直接赋值新增列数据的结果为:n”,data)输出结果如图3-*所示。Run:3-3初始数据为:001 1 2 3002 4 5 6003 7 8 9通过直接赋值新增列数据的结果为:a b c I001123202002456202003789202)D-02-02 卜0202Process finished ijith exit code 0图3-*利用直接赋值生成新列数据例如结果2 .利用公式计算生成新列数据利用两列数据或多列数据,通过运算符经过公式计算也可生成新列数据,其一般 格式为:DataFrame!new_column = DataFrame|column 1 ( +-*/ ) DataFrame|column2 (+-*/)例如代码如下:data*e* = datafa1 + datafb1 + datafc1print。通过公式计算机新增列数据的结果为:n",data)输出结果如图3-*所示。Run:3-3C:UsersliliangAnaconda3python.exe C:/Users/liliang/PycharmProjects/sjfx/3-3.py 初始数据为:a b c001 1 2 3002 4 5 6a bcde0011232020-02-0260024562020-02-02150037892020-02-0224a bcde0011232020-02-0260024562020-02-02150037892020-02-0224通过公式计算新增列数据的结果为:Process finished with exit code 0003 7 8 9图3-*利用公式计算生成新列数据例如结果3 .利用字符串拆分生成新列数据除了可以通过直接赋值和公式计算生成列数据以外,还可以通过字符串的拆分方 法str.split生成新列数据,其一般格式为:DataFramenew_column = DataFramecolumn .str.split(sep, expand)其中,sep表示分隔符,如逗号(,)、分号(;)、tab(t)、竖线(I)等。Expand表示是否 把切割出来的内容生成新列,如果要生成新列,那么使用expand=True,如果不需生成 新列,就可以使用Falseo当DataFrame某一列被拆分后,可用str.split(sep,expand)i (i=0,l,2, )来表示拆分后的分列数据。str.split(sep,expand)。表示拆分后的第1列的 数据,str.split(sep, expand)表示拆分后的第2列数据,以此类推。例如代码如下:datayearr = datad .str. split,-',expand=True)0 datarmonth1 = data|'d1 | .str.splitC-expand=True)! 1 print(”通过字符串拆分新增列数据的结果为:n”,data) 输出结果如图3-*所示。Run:3-3AC:UsersliliangAnaconda3python.exe C:/Users/liliang/PycharmProjects/sjfx/3-3.py初始数据为: a b cip001123002456”.003789通过字符串拆分新增列数据的结果为:a b cd e yea、month001 1 2 3 2020-02-026 202002002 4 5 6 2020-02-02 15 202。02003 7 8 9 2020-02-02 24 202002Process finished with exit code 0二、数据的删除在DataFrame中,如果不需要某些行或某些列,可以使用drop函数删除数据。 drop函数的一般格式为:DataFrame.drop(labels, axis, inplace)其中,各个参数如下:labels表示表示删除的行或列的标签。axis表示删除的行还是列,axis=0表示行,axis=l表示列。在根据行索引删除多 行数据时,可以使用列表表示行索引。如删除第3行和第7行,可用labels=3,7。如 果删除第4行到第6行,可用labels=4,5,6,或者用range函数来表示,即 labels=range(4,7)oinplace表示删除结果是否替换原表,即删除结果是否在原表显示,inplace=True 表示操作在原表生效,inplace=False表示操作在新表生效。默认是False,即如果要在 新表生效,可以不设置该参数。一定需要注意的是,如果使用inplace=False,必须要 把结果赋给一个新的DataFrame,否那么就看不到任何效果。例如代码如下:print("data 数据为:n”,data)data.drop(labels=*e,axis= 1 ,inplace=True)print("删除e列后结果在原表示的结果为:n”,data)data_new = data.drop(labels=,001 ',axis=O,inplace=False)print。删除行索引为001后结果在新表示的结果为:n”,data_new)输出结果如图3-*所示。Run:3-3C:UsersliliangAnaconda3python.exe C:/Users/liliang/PycharmProjects/sjfx/3-3.py data数据为:abcdeyearmonth0011232020-02-0262020020024562020-02-02152020020037892020-02-0224202002删除。列后结果在原表示的结果为:abcdyearmonth0011232020-02-022020020024562020-02-022020020037892020-02-02202002删除行索引为后结果在新表示的结果为:abcdyearmonth0024562020-02-022020020037892020-02-02202002Process finished with exit code 0图3-*数据的删除例如结果任务实训任务 1:利用 read_excel 导入 supermarket.xlsx (supermarket.xlsx 存放在 c:data 路 径中)中的“销售统计”工作表(第1张工作表),数据命名为datal,任务1源数据 如图3-*所示。为:X剪切 粘贴心复制. y格式刷剪贴板宋体-11 X葭三三三涉,于自动换行=率季强合并后居中,对齐方式常规,吗,%,养装数字胤城二条件格式套用单元格样式表格格式样式一身串 插入删除格式 单元格文件开始 插入页面布局公式 数据 审阅 视图2日非 图境充<2消除023£ ACDEFGHIJKL1产品名称子类别客户地区细分订单日期发货日期邮寄方式单价数量折汨2Fiskars剪刀,蓝色用品曾惠一14485浙江-杭州公司2018/4/272018/4/29二级6520.43GlobeWeis搭扣信封,红色信封许安-10165四川-内江消费者2018/6/152018/6/19标准级632(4Cardinal孔加固材料,回收装订机许安-10165四川-内江消费者2018/6/152018/6/19标准级1620.45Kleencut开信刀,工业用品宋良-17170江苏-镇江公司2018/12/92018/12/13标准级8040.46 _KitchenAid搅拌机,黑色器具万兰-15730广东-汕头消费者2017/5/312017/6/2二级4593(7柯尼卡打印机,红色设备俞明-18325江西-景德镇消费者2016/10/272016/10/31标准级12379(8_Ibico订书机,实惠装订机俞明T8325江西-景德镇消费者2016/10/272016/10/31标准级2402(9SAFC0扶手椅,可调椅子俞明-18325江西-景德镇消费者2016/10/272016/10/31标准级21654(10Green Bar计划信息表,各色纸张俞明T8325江西-景德镇消费者2016/10/272016/10/31标准级1185(图3-*任务1源数据(局部)完成:(1)生成新列“支付方式”,全部赋值“银行转账”。(2)生成新列“销售金额”,计算公式为“销售金额”=“单价” * “数量”。(3)根据“客户”列生成“客户姓名”和“客户ID”。具体代码如下:#设置显示的最大列数为12列1,1 2)pd.set_option('display.width',None)# 设置不限制显示宽度pd.set_option(,True) # 设置数据与列名对齐 datal = pd.read_excel('c:datasupermarket.xlsx,) data"'支付方式廿银行转账, datal销售金额'=datal'单价'* datal'数量'datal '客户姓名'=datal/客户'.str.split('-',expand=True)Odatal'客户 ID' = datal '客户'.str.split('-',expand=True)lprint。data 1 的数据为:n",data 1 .head()输出结果如图3-*所示。Run:3-3订单10产品ID产品名琳子类别客户地区.数B折抵支付方式悄售金1®客户姓名客户1)0US-2018-1357144办公用-用品-10002717Fiskars剪刀,蓝色用品苫惠-14485浙江-杭州.2 0.4胆行转账1301448 51CN-2018-1973789办公用信封-10004832GlobeWeis修扣信封,红色信封许安-10165四川内江.2 0.0银行杼繇126许安1016 »2CN-2018>1973789办公用装订-10001505Cardinal孔加固材料,回收装订机许安-10165四川-内江.2 0.4银行精炼32许安10163US-2018-3017568办公用-用品-10003746Kleencut开信刀,工业用品宋良-1717。江苏俄江.4 0.4银行转诔320宋良1717)4CN-2017-2975416办公用器具-10003452KitchenAid搅拌机,黑色具万兰-1573。广东-汕头.3 0.0根行转赛1377万兰1573)订单10产品ID产品名琳子类别客户地区.数B折抵支付方式悄售金1®客户姓名客户1)0US-2018-1357144办公用-用品-10002717Fiskars剪刀,蓝色用品苫惠-14485浙江-杭州.2 0.4胆行转账1301448 51CN-2018-1973789办公用信封-10004832GlobeWeis修扣信封,红色信封许安-10165四川内江.2 0.0银行杼繇126许安1016 »2CN-2018>1973789办公用装订-10001505Cardinal孔加固材料,回收装订机许安-10165四川-内江.2 0.4银行精炼32许安10163US-2018-3017568办公用-用品-10003746Kleencut开信刀,工业用品宋良-1717。江苏俄江.4 0.4银行转诔320宋良1717)4CN-2017-2975416办公用器具-10003452KitchenAid搅拌机,黑色具万兰-1573。广东-汕头.3 0.0根行转赛1377万兰1573)C:UsersliliangAnaconda3python.exe C:/Users/liliang/PycharmProjects/sjfx/3-3.py datal的数据为:5 rows x 17 columnsProcess finished with exit code 0图3-*任务1输出结果任务2:根据任务1完成的datal,完成:(1)利用重设索引set_index,将datatl的“客户ID”设为索引,并命名为data2o(2)删除行索引“客户ID”为“17170”的行,再删除“子类别”列和“客户” 列,结果重新命名为data2_new。_具体代码如下:_data2 = datal .set_index(datal客户 ID')print("根据 datal 重设索引后的 data2 为:n",data2.head()data2.drop(labels=' 17170axis=0,inplace=True) data2_new = data2.drop(labels=子类另 ij1客户',axis=l) print("删除指定行与列后的结果为:n” ,data2_new.head() 输出结果如图3-*所示。Run:3-3datal的数据为:datal的数据为:订单ID产品ID产品名称子类别客户地区.数量折扣支付方式销售金颔客户姓8 客户ID0US-2018-1357144办公用-用品-10002717Fiskars剪刀,蓝色用品曹惠-14485浙江-杭州.20.4银行特曝1308惠 144851CN-2018-1973789办公用-信封-10004832Globeweis搭扣信封,红色信封许安-10165四川-内江20.0银行痔账126许交 101652CN-2018-1973789办公用-装订-10GG1505Cardinal孔加固材料,回收奘订机许安-10165四川-内江.20.4银行将账32许:?101653US-2018-3017568办公用-用品-10003746Kleencut开信刀,工业用品宋良-17170江苏镇江.40.4银行转账320中良 171704CN-2017-2975416办公用-器具-10003452KitchenAid搅拌机,黑色器具万兰-1573。广东-汕头.30.0银行转账1377万丝 15730C:UsersliliangAnaconda3python.exe C:/Users/liliang/PycharmProjects/sjfx/3-3.py5 rows x 17 columns根据datal重设索引后的data2为:订单ID产品ID产品名称子类别客户地区.数量折扣支付方式销售金额::户姓名客户ID客户ID.14485 US-2018-1357144 办公用-用品-10002717Fiskars剪刀,蓝色 用品 普惠-14485浙江-杭州.2 0.4 银行转账130普惠 1448510165CN-2018-1973789 办公用-信封-10004832 GlobeWeis搭扣信封,红色 信封 许安-10165四川-内江.2 0.0 银行转账126许安 1016510165CN-2018-1973789 办公用-装订-10001505 Cardinal孔加固材料,回收 装订机 许安-10165四川-内江.2 0.4 银行转账32许安 1016517170US-2018-3017568办公用-用品-10003746Kleencut开信刀,工业用品宋良-1717。江苏镇江.4 0.4 根行转账320宋良 1717015730CN-2017-2975416办公用-器具-10003452 KitchenAid搅拌机,黑色 盖具万兰-15730广东-汕头.3 0.0根行转账1377万兰 157305 rows x 17 columns删除指定行与列后的结果为:订单ID产品ID产品名称地区 细分 订单日期.数量折扣 支付方式 销售金额客户姓名客户ID客户ID14485US-2018-1357144 办公用-用品-10002717Fiskars 剪刀,蓝色浙江-杭州公司 2018-04-27 .2 0.4 银行转账130鸿惠 1448510165 CN-2018-1973789 办公用-信封-10004832Globeweis搭扣信封,红色四川-内江消费者2018-06-15 .2 0.0根行糙账126许安 1016510165CN-2018-1973789 办公用-装订-10001505 Cardinal孔加固材料,回收四川-内江消费者2018-06-15 .2 0.4银行转账32许安 1016515730CN-2017-2975416办公用-盖具-10003452KitchenAid搅拌机,黑色 广东-汕头消费者2017-05-31 .3 0.0银行转账1377万兰 1573。18325CN-2016-4497736 技术-设备-1000164。柯尼卡打印机,红色 江西景锤镇 消费者2016-10-27 .9 0.0 银行料账11133俞明18325图3-*任务2输出结果巩固训练根据导入的数据datal,完成:(1)将“地区”列拆分为“省份”列和“城市”歹U。“销售金额”* (1- "折(2)生成新列“折扣金额”,计算公式为“折扣金额” 扣”)。(3)删除索引号5到10的行,再删除“地区”歹U。

    注意事项

    本文(Python数据分析与可视化教案3.3 数据的新增与删除.docx)为本站会员(太**)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开