最新Python大数据可视化编程实践-绘制图表.doc
《最新Python大数据可视化编程实践-绘制图表.doc》由会员分享,可在线阅读,更多相关《最新Python大数据可视化编程实践-绘制图表.doc(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品资料Python大数据可视化编程实践-绘制图表.Python数据可视化编程实践-绘制图表准备工作打开Jupyter Notebook,导入需要的包,并配置好图片交互和中文显示环境:import pandas as pdimport numpy as npimport sysreload(sys)sys.setdefaultencoding(utf-8)import matplotlib as mplimport matplotlib.pyplot as pltimport matplotlib.cm as cm%matplotlib inlineplt.rcParamsfont.sans-
2、serif=SimHei #用来正常显示中文标签plt.rcParamsaxes.unicode_minus=False #用来正常显示负号定义图表类型柱状图、线形图和堆积柱状图调用figure()方法,创建一个新的图表,接下来的绘图操作都在此图表中进行,参数figsize=(12,6)表示该图表的大小。调用subplot(231)方法把图表分割成2行3列的网格,1表示图形的标号。x = 1, 2, 3, 4y =5, 4, 3, 2plt.figure(figsize=(12,6)plt.subplot(231)plt.plot(x,y) # 折线图plt.subplot(232)plt.b
3、ar(x,y) # 垂直柱状图plt.subplot(233)plt.barh(x,y) # 水平柱状图plt.subplot(234)plt.bar(x,y)y1= 7,8,5,3plt.bar(x,y1,bottom=y,color=r) # 堆叠柱状图 设置参数bottom=yplt.subplot(235)plt.boxplot(x) # 箱线图plt.subplot(236)plt.scatter(x,y) # 散点图plt.show()具体解释下箱线图中的几个最重要的显示选项。首先,我们可以添加从箱体延伸出来的箱须来展示数据集合的整个范围。箱体和箱须主要用于表现一个或多个数据集合中
4、数据的编号,容易对数据进行对比而且易于理解。在同一个箱线图中可以呈现5种数据。最小值:数据集合的最小值。第二四分位数:其以下为数据集合中较低的25%数据。中值:数据集合的中值第三四分位数:其以上为数据集合中较高的25%数据。最大值:给定数据集合的最大值。dataset = 113, 115, 119, 121, 124,124, 125, 126, 126, 126,127, 127, 128, 129, 130,130, 131, 132, 133, 136plt.figure(figsize=(10,6)plt.subplot(121)plt.boxplot(dataset, vert =
5、 False)plt.subplot(122)plt.hist(dataset)plt.show()我们用同一个数据集合来绘制箱线图和直方图,观察两种图表在数据展现上的差异。左图呈现了五个统计数据,右图展示了数据集合在给定范围内的分组情况。简单的正弦图和余弦图我们对从-Pi到Pi之间具有相同线性距离的256个点来计算正弦值和余弦值,然后把sin(x)值和cos(x)值在用以图表中绘制出来。x = np.linspace(-np.pi, np.pi, 256, endpoint=True)y = np.cos(x)y1 = np.sin(x)plt.figure(figsize=(10,6)pl
6、t.plot(x, y)plt.plot(x, y1)plt.title(Functions $sin$ and $cos$) #设置图标题plt.xlim(-3.0, 3.0) #设置x轴范围plt.ylim(-1.0, 1.0) #设置y轴范围plt.xticks(-np.pi, -np.pi/2, 0, np.pi/2, np.pi,r$-pi$, r$-pi/2$, r$0$, r$+pi/2$, r$+pi$) # 用希腊字母标注x轴标签plt.yticks(-1, 0, +1,r$-1$, r$0$, r$+1$)plt.show()设置坐标轴长度和范围如果不实用axis()或者其
7、他参数设置,matplotlib会自动使用最小值,刚好可以让我们在一个图中看到所有的数据点。调用autoscale()方法,会以坐标轴的最佳大小适应数据的显示。axis()里面的值分别表示坐标轴上xmin、xmax、ymin、ymaxaxhline()表示绘制了一条y=0的水平线axvline()表示绘制了一条x=0的垂直线axhline(4)表示绘制了一条y=4的水平线l=-1, 1, -10, 10plt.axis(l)plt.axhline()plt.axvline()plt.axhline(4)设置图表的线型、属性和格式化字符串常见的线条样式:- 直线-虚线-. -.形式: 细小虚线常
8、见的点样式:s-方形h-六角形H-六角形*-星号+-加好x-x型d-菱形D-菱形p-五角形常见的颜色样式:c-cyan-青色r-red-红色m-magente-品红g-green-绿色b-blue-蓝色y-yellow-黄色k-black-黑色w-white-白色# plot(x轴数据,y轴数据,展现形式)x = 1, 2, 3, 4, 8y = 5, 7, 2, 1, 5plt.plot(x, y, -, color=g, linewidth=0.8)plt.plot(x, y,*,color=r) #散点图plt.show()设置刻度、刻度标签和网格刻度是图形的一部分,由刻度定位器(指定刻
9、度所在的位置)和刻度格式器(指定刻度显示的样式)组成。刻度有主刻度和次刻度,默认次刻度不显示。locator_params()方法控制刻度定位器,可以控制刻度的数目。plt.figure(figsize=(10,6)# 获取当前坐标ax = plt.gca()# 设置紧凑视图,设置刻度间隔最大为10ax.locator_params(tight=True, nbins = 10)# 生成100个正态分布值ax.plot(np.random.normal(10, .1, 100)plt.show()使用dates模块的一个例子来说明刻度格式器的配置。刻度格式器规定了值的显示方式。import d
10、atetimefig = plt.figure(figsize=(10,6)# 获取当前的坐标轴ax = plt.gca()# 设置一些日期区间start = datetime.datetime(2013, 01, 01)stop = datetime.datetime(2013, 12, 31)delta = datetime.timedelta(days = 1)# 转换日期dates = mpl.dates.drange(start, stop, delta)# 产生一些随机值values = np.random.rand(len(dates)ax = plt.gca()# 用日期值画图
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 Python 数据 可视化 编程 实践 绘制 图表
限制150内