Python数据分析常用方法手册29139.pdf
《Python数据分析常用方法手册29139.pdf》由会员分享,可在线阅读,更多相关《Python数据分析常用方法手册29139.pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1.Python 数据处理和分析常用语句 数据分析的一般步骤包括数据获取、数据整理、数据描述、数据分析 1.1数据获取 1.1.1数据获取方式 1.1.2查看数据属性 Data.shape 查看数据多少行、多少列 Data.colu mns 查看数据列 Data.dtypes 查看各数据字段的属性 1.2数据整理#第二步:做一些数据的基本处理:1.2.1数据基本处理(类 excel)#0.数据类型的转换 例如:如果要做时间序列分析,首先要将交易日期从通用对象(object)转换为日期对象(datetime)dfdate=pd.to_datetime(dfdate)#1.如何获取导入的数据有几行
2、几列?直接用 df.shape,返回一个维度(几行,几列)的元组;df.colu mn s.size#获取列数 df.iloc:,0.size#获取行数#2.如何查看指定行、列、子集?#df=pandas.read_excel(1.xls,sheetname=店铺分析日报)df=df.loc:,股票代码,股票名称,营业总收入#访问指定的列#df=df股票代码#DataFrame.ixi ndex_ name#查看指定列#查看指定行#dataframem:n#选择多行#dataframedataframecol35#条件筛选#dataframe.ix0:3,0:5#选择子集#3.如何添加新的列
3、例 1:添加一个总和栏来显示 Jan、Feb 和 Mar 三个月的销售总额 dftotal=dfJa n+dfFeb+dfMa 门 例 2:把计算结果添加为一个新的列 dfP/E=df.收盘价/df.基本每股收益#新的列名,后面是对应的数值 例 3:在 excel 表最后加一行求各列和 sum_row=dfJa n,Feb,Mar,total.sum()#4.如何删除行列#df_delete=df.drop(result,axis=1)#删除列#DataFrame.drop(index1,index2.)#删除行#5.如何对数据进行排序?dfP/E.size#获取P/E 这列共有多少行 n e
4、wdf=df_delete.sort(P/E)#默认升序排列 sort_index也可以进行排序#6.如何对数据进行筛选?#1筛选出 predictaqi_norm1 这一列大于 100 的行;aqicsvaqicsvpredictaqi_ no rm1100 也可以写为:datadata.收盘价100#2使用&(并)与|(或)实现多条件筛选 aqicsv(aqicsvFID37898)&(aqicsvFID150)|(aqicsv.predictaqi_ no rm110000)|(aqicsv.predictaqi_ norm1 150)#4i sin()用法:筛选某一列数据符合等于规定值
5、(它使得我们可以定义一个列表,里面包含我们所希望查找的值);data7=datadata股票代码.isin(sh600141,sh600754,sh603017,sh603198)#同样,以上这个语句可以用 query()函数来查询,需要安装 numexpr;data8=data.query(股票代码=sh600141,sh600754,sh603017,sh603198)#map()函数也有这个功能,样式如下:dfdfsku.map(lambda x:x.startswith(BI)&(dfqua ntity>22).head()如果只需要其中的某#5字符串方法:筛选某一列内容
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python 数据 分析 常用 方法 手册 29139
限制150内