第2章数据可视化分析(DA)教学ppt课件数据分析基础—基于Python的实现电子教案.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第2章数据可视化分析(DA)教学ppt课件数据分析基础—基于Python的实现电子教案.pptx》由会员分享,可在线阅读,更多相关《第2章数据可视化分析(DA)教学ppt课件数据分析基础—基于Python的实现电子教案.pptx(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2章 数据可视化分析(DA)教学课件数据分析基础基于Python的实现 电子教案第 1 章1-2统计学Python实现贾俊平2023/5/162023/5/16贾俊平俊平2023/5/162023/5/16数据分析基础数据分析基础贾俊平俊平 2023/5/162023/5/16Fundamentals of data Fundamentals of data analysis with Pythonanalysis with Python基于基于 Python 的实现的实现第 2 章2-3数据分析基础基于Python的实现2023/5/162023/5/16贾俊平俊平2023/5/16202
2、3/5/162.12.1 类别数据可视化类别数据可视化2.2 2.2 数据分布可视化数据分布可视化3.3 3.3 变量间关系可视化变量间关系可视化2.4 2.4 样本相似性可视化样本相似性可视化2.5 2.5 时间序列可视化时间序列可视化2.6 2.6 可视化可视化的注意事项的注意事项第 2 章 数据可视化分析第 2 章2-4数据分析基础基于Python的实现2023/5/162023/5/16 2.1 类别数据可视化类别数据图形及使用的数据类别数据图形及使用的数据第 2 章2-5数据分析基础基于Python的实现2023/5/162023/5/16 2.1 类别数据可视化条形图条形图简单条形
3、图简单条形图例题分析例题分析【例例例例2-12-1】(数数据据:example1_1.csvexample1_1.csv)沿沿用用第第1 1章章的的例例1-11-1。绘绘制制不不同同性性别别、态度和社区被调查者人数的简单条形图态度和社区被调查者人数的简单条形图第 2 章2-6数据分析基础基于Python的实现2023/5/162023/5/16 2.1 类别数据可视化条形图及其变种条形图及其变种并列条形图和堆叠条形图并列条形图和堆叠条形图例题分析例题分析l l制制两两个个类类别别变变量量的的条条形形图图时时,可可以以使使用用原原始始数数据据绘绘图图,也也可可以以先先生生成成二二维维列联表再绘图
4、列联表再绘图l l根根据据绘绘制制方方式式不不同同有有并并列列条条形形图图(juxtaposed juxtaposed bar bar plotplot)和和堆堆叠叠条条形形图图(stacked bar plotstacked bar plot)等)等在在并并列列条条形形图图中中,一一个个类类别别变变量量作作为为坐坐标标轴轴,另另一一个个类类别别变变量量各各类类别别频数的条形并列摆放频数的条形并列摆放在在堆堆叠叠条条形形图图中中,一一个个类类别别变变量量作作为为坐坐标标轴轴,另另一一个个类类别别变变量量各各类类别别的频数按比例堆叠在同一个条中的频数按比例堆叠在同一个条中第 2 章2-7数据分析
5、基础基于Python的实现2023/5/162023/5/16 2.1 类别数据可视化条形图及其变种条形图及其变种为条形图添加标签为条形图添加标签例题分析例题分析第 2 章2-8数据分析基础基于Python的实现2023/5/162023/5/16 2.1 类别数据可视化条形图及其变种条形图及其变种百分比条形图百分比条形图例题分析例题分析l l百百分分比比条条形形图图(Percentage Percentage bar bar plotplot)是是根根据据各各类类别别的的比比例例绘绘制制的的一一种种条条形形图图,它它可可以以看看作作堆叠条形图的变种堆叠条形图的变种l l绘绘百百分分比比形形图
6、图时时,将将某某个个类类别别各各条条的的高高度度都都设设定定为为1 1或或100%100%,条条内内每每一一段段的的高高度度表表示示另另一一个类别变量各类别的频数比例个类别变量各类别的频数比例第 2 章2-9数据分析基础基于Python的实现2023/5/162023/5/16 2.1 类别数据可视化饼图和环形图饼图和环形图饼图饼图例题分析例题分析l l饼饼图图(pie pie chartchart)是是用用圆圆形形及及圆圆内内扇扇形形的的角角度度来来表表示示数数值值大大小小的的图图形形。它它主主要要用用于于表表示示一一个个样样本本(或或总总体体)中中各各类类别别的的频频数数占占全全部部频频数
7、数的的百百分比,分比,l l对对于于研研究究结结构构性性问问题题十十分有用分有用【例例2-2】(数据:example2_2.csv)表2-1是2019年北京、天津、上海和重庆的人均各项消费支出数据。绘制饼图,分析人均各项消费支出的构成支出支出项目目北京北京天津天津上海上海重重庆食品烟酒食品烟酒8488.58983.710952.66666.7衣着衣着2229.51999.52071.81491.9居住居住15751.46946.115046.43851.2生活用品及服生活用品及服务2387.31956.72122.81392.5交通通信交通通信4979.04236.45355.72632.8教
8、育文化教育文化娱乐4310.93584.45495.12312.2医医疗保健保健3739.72991.93204.81925.4其他用品及服其他用品及服务1151.01154.01355.9501.3第 2 章2-10数据分析基础基于Python的实现2023/5/162023/5/16 2.1 类别数据可视化饼图和环形图饼图和环形图饼图饼图例题分析例题分析【例例2-2】(数 据:example2_2.csv)表 2-1是2019年北京、天津、上海和重庆的人均各项消费支出数据。绘制饼图,分析人均各项消费支出的构成第 2 章2-11数据分析基础基于Python的实现2023/5/162023/5
9、/16 2.1 类别数据可视化饼图饼图环形图环形图例题分析例题分析l l环环形形图图(donut donut chartchart)是是将将饼饼图图的的中中间间挖挖掉掉后后剩剩下下的的环环形形,也称为甜甜圈图也称为甜甜圈图l l环环形形图图可可以以看看做做饼饼图图的的变变种种,它它是是用用环环形形的的各各段段表表示示各各类类别频数的百分比别频数的百分比l l当当有有两两个个及及两两个个以以上上类类别别变变量量时时,可可以以绘绘制制出出每每个个变变量量各各类类别别百百分分比比的的环环形形,并并将将各各个个环环嵌嵌套套在在一一起起。环环形形图图可可以以用用于于两两个个或或两两个个以以上上类类别变量
10、的结构比较别变量的结构比较【例例2-2】(数据:example2_2.csv)表2-1是2019年北京、天津、上海和重庆的人均各项消费支出数据。绘制饼图,分析人均各项消费支出的构成第 2 章2-12数据分析基础基于Python的实现2023/5/162023/5/16l数数据据的的分分布布特特征征:主要是指分布的形状是否对称、分布偏斜的方向和程度、分布中是否存在离群点等,其可视化图形主要有直方图、核密度图、箱线图、小提琴图和点图等l本本节节图图适适用用的的数数据据类类型型包包括括:一个或多个数值变量(数据),如一年中每一天的空气质量指数,一年中每一天的PM2.5、PM10等;按因子(类别变量)
11、分类的一个或多个数值变量(数据),如按空气质量等级(优、良、轻度污染、中度污染、重度污染、严重污染)分类的空气质量指数,等等 2.2 数据分布可视化分布图形及其所有的数据分布图形及其所有的数据第 2 章2-13数据分析基础基于Python的实现2023/5/162023/5/16 2.2 数据分布可视化直方图与核密度图直方图与核密度图直方图直方图例题分析例题分析l l将将数数据据分分组组后后,在在x x轴轴上上用用矩矩形形的的宽宽度度表表示示每每个个组组的的组组距距,在在y y轴轴上上用用矩矩形形的的高高度度表表示示每每个个组组的的频频数数或或密密度度,多多个个矩矩形形并并列列在在一一起起就就
12、是直方图是直方图l l利利用用直直方方图图的的形形状状可可以以观观察察数数据据分布的特征分布的特征【例例2-2】(数据:example2_2.csv)2020年1月1日12月31日几个主要城市的AQI数据。绘制出6个城市AQI的直方图分析其分布的特征第 2 章2-14数据分析基础基于Python的实现2023/5/162023/5/16 2.2 数据分布可视化直方图与核密度图直方图与核密度图核密度图核密度图例题分析例题分析l l核核密密度度图图(kernel kernel density density plotplot)是是用用于于描描述述估估计计核核密密度度估估计计的的一一种种图图形形,它
13、它使使用用一一定定的的核核函函数数和和带带宽宽为为数数据据的的分分布布提提供供了了一一种种平平滑滑曲线,从中可以看出数据分布的大致形状曲线,从中可以看出数据分布的大致形状l l核密度图可以替代直方图来观察数据的分布核密度图可以替代直方图来观察数据的分布l l核密度曲线的平滑程度取决于带宽(核密度曲线的平滑程度取决于带宽(bandwidthbandwidth,bwbw)。)。bwbw的值越大,曲线越平滑利用直方图的形状可以观察数据分布的特征的值越大,曲线越平滑利用直方图的形状可以观察数据分布的特征第 2 章2-15数据分析基础基于Python的实现2023/5/162023/5/16 2.2 数
14、据分布可视化直方图与核密度图直方图与核密度图核密度图核密度图例题分析例题分析6个城市AQI的核密度图第 2 章2-16数据分析基础基于Python的实现2023/5/162023/5/16 2.2 数据分布可视化直方图与核密度图直方图与核密度图核密度山峦图核密度山峦图例题分析例题分析l l山峦图(山峦图(ridgeline diagramridgeline diagram)l l用用于于多多数数据据系系列列或或按按因因子子分分类类的的核核密密度度估计的可视化估计的可视化l l绘绘制制的的数数据据通通常常是是相相同同的的x x轴轴(如如同同一一个个变量)和不同的变量)和不同的y y轴(如不同的分
15、类)轴(如不同的分类)l l将将多多个个分分类类下下的的同同一一个个数数据据系系列列的的核核密密度度估估计计图图以以交交错错堆堆叠叠的的方方式式绘绘制制在在一一幅幅图图中中,看看起起来来像像山山峦峦起起伏伏,从从而而有有利利于于比较不同数据系列的分布特征比较不同数据系列的分布特征第 2 章2-17数据分析基础基于Python的实现2023/5/162023/5/16 2.2 数据分布可视化箱线图和小提琴图箱线图和小提琴图箱线图箱线图示意图示意图第 2 章2-18数据分析基础基于Python的实现2023/5/162023/5/16 2.2 数据分布可视化箱线图和小提琴图箱线图和小提琴图箱线图箱
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第2章 数据可视化分析DA 教学ppt课件数据分析基础基于Python的实现 电子教案 数据 可视化 分析 DA 教学 ppt 课件 基础 基于 Python 实现 电子 教案
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内