4-1-1数据结构与数据类型教学课件PPT.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《4-1-1数据结构与数据类型教学课件PPT.pptx》由会员分享,可在线阅读,更多相关《4-1-1数据结构与数据类型教学课件PPT.pptx(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、4-1-1数据结构与数据类型弘 德 明 志 博 学 笃 行第第4 4章章 数据处理和分析数据处理和分析-Pandas-Pandas第第0101讲讲 数据结构与数据类型数据结构与数据类型主讲人:马学强弘 德 明 志 博 学 笃 行Contents目录01PandasPandas主要功能特点主要功能特点PandasPandas的安装和导入的安装和导入02常用常用数据结构数据结构03数据类型数据类型04弘 德 明 志 博 学 笃 行01Pandas的主要功能特点弘 德 明 志 博 学 笃 行弘 德 明 志 博 学 笃 行Pandas主要功能特点Pandas是完成数据工程任务的理想工具,其主要功能有:
2、u 在浮点和非浮点数据中轻松处理缺失数据(NaN);u大小可变性:可以从DataFrame或更高维度的对象中插入和删除;u自动或显式数据对齐:对象可以明确地与一组标签对齐,用户也可以简单地忽略标签,让Series、DataFrame等在计算中自动对齐数据;u强大、灵活的“组”功能,可以对数据集进行拆分、组合操作,用于数据的分组、聚合和转换;Pandas(Python Data Analysis Library)是基于Numpy库的数据分析库,能够提供快速、灵活和富有表现力的数据结构,旨在使“关系”或“标记”数据的使用既简单又直观,成为Python环境下高效且强大的数据分析包之一。弘 德 明 志
3、 博 学 笃 行弘 德 明 志 博 学 笃 行Pandas主要功能特点(续)u基于智能标签的切片、花式索引和数据子集;u灵活的数据重塑和数据集的旋转、合并、分类等;u轴的分层标记,使得每个刻度可能有多个标签;u强大的I/O工具,用于从不同类型的文件(如CSV、TXT、XML、XLSX、HDFS等)和数据库中保存或加载数据;u特定的时间序列功能:日期范围生成和频率转换、移动窗口统计、移动窗口线性回归、日期转换和滞后等。弘 德 明 志 博 学 笃 行02Pandas的安装和导入弘 德 明 志 博 学 笃 行弘 德 明 志 博 学 笃 行Pandas安装与导入Pandas作为Python的外部扩展库
4、,使用前必须进行下载、安装和导入。以Windows环境为例:Pandas下载安装完成以后,要使用Pandas的相应功能,需要首先导入到Python环境:import pandas as pdimport pandas as pd 在线安装:命令提示符下,执行命令pip install pandaspip install pandas,会自动选择版本和依赖库进行安装。 离线安装:从网站www.lfd.uci.edu/gohlke/pythonlibs/或/预先下载相应版本的whl文件,然后在命令提示符下执行pip install 弘 德 明 志 博 学 笃 行03Pandas常用数据结构弘 德
5、明 志 博 学 笃 行弘 德 明 志 博 学 笃 行数据结构Pandas建立在Numpy库之上,关注数据的应用,积极表达数据与索引间的关系,提供了许多适合计算和分析的数据结构与类型,主要有:(1) 具有异构类型列的表格数据,如SQL或Excel电子表格;(2) 有序和无序的时间序列数据;(3) 具有行和列标签的任意矩阵数据(均匀类型或异构);(4) 任何其他形式的观察、统计数据集。良好的数据结构及其运算,是有效进行数据处理的前提和基础。Pandas最重要的结构:系列(Series)、数据帧(DataFrame)、面板(Panel),Panel在目前的版本中已弃用)。弘 德 明 志 博 学 笃
6、行弘 德 明 志 博 学 笃 行数据结构主要特点使用时,主要考虑的因素:使用时,主要考虑的因素:较高维是较低维的容器:如DataFrame是Series的容器;数据集的方向,减少用户思考:如DataFrame使用行列,而不是轴为0或1;结构的可变性:允许操作的前提,包括结构大小是否可变、值是否可变。数据结构数据结构英文名称英文名称维数维数描述描述系列系列Series1使用一维标记的均匀数组,结构大小不变。数据帧数据帧DataFrame2使用二维标记,表结构大小可变,列为潜在的异质类型。面板面板Panel3使用三维标记,是大小可变的数组。弘 德 明 志 博 学 笃 行弘 德 明 志 博 学 笃
7、行Series与DataFrame销售团队绩效评级表Series-系列系列是具有均匀数据的一维数组结构。如,由10,23,56,.组成的整数集合可以是一个系列。系列具有数据均匀、尺寸大小不变、数据的值可变等特点。采用的数据类型DataFrame-数据帧数据帧是一个具有异构数据的二维数组,大小可变、值可变的特点。姓名姓名年龄年龄性别性别等级等级Maxsu25男4.45Katie34女2.78Vina46女3.9Lia42女4.6列列类型类型姓名姓名字符串年龄年龄整数性别性别字符串等级等级浮点型弘 德 明 志 博 学 笃 行04数据类型弘 德 明 志 博 学 笃 行弘 德 明 志 博 学 笃 行基
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据结构 数据类型 教学 课件 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内