Python数据分析与可视化教案 6.5 工业数据分析与可视化.docx
《Python数据分析与可视化教案 6.5 工业数据分析与可视化.docx》由会员分享,可在线阅读,更多相关《Python数据分析与可视化教案 6.5 工业数据分析与可视化.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、6.5工业数据分析与可视化作为清洁能源的太阳能相对煤炭石油等能源来说是可再生、无污染的,只要有太阳就 有太阳能,所以太阳能的利用被很多国家列为重点开发工程。太阳能具有波动性和间歇性的特性,太阳能电站的输出功率受光伏板本体性能、气象 条件、运行工况等多种因素影响,具有很强的随机性,由此带来的大规模并网困境严重制 约着光伏发电的开展。因此挖掘光伏发电数据中的价值,对光伏数据进行分析尤为重要。一、数据源分析本案例包括三个数据集:photovoltaic.csv、wind_direction.xlsxs wind_speed.txto ID :表示记录编号。板温:表示光伏电池板背测温度。现场温度:表示
2、光伏电站现场温度。转换效率A :表示数据采集点A处的光伏板转换效率。转换效率B :表示数据采集点B处的光伏板转换效率。转换效率C:表示数据采集点C处的光伏板转换效率。电压A :表示数据采集点A处汇流箱电压值。电压B :表示数据采集点B处汇流箱电压值。电压C :表示数据采集点C处汇流箱电压值。电流A:表示采集点A处汇流箱电流值。电流B :表示采集点B处汇流箱电流值。电流C :表示采集点C处汇流箱电流值。功率A :表示采集点A处的功率Pa. P=UIO功率B :表示采集点B处的功率Pb, P二UI。功率C :表示采集点C处的功率Pc, P=UI。发电量:表示光伏电厂现场发电量。数据源1如图6-*所
3、示。Z| photovoltaic.csv -记事本文件(F)编辑(E)格式(0)查看(V)喏助(H)时间,ID,光照强度,功率A,功率B,功率C,板温现场温度,电压A,电压B,电压C,电流A用流B,电流C,转换效率A,转换效率B,转换效率C,发电量 2018-06-01 08:31:30,9,13,909.72,148.05,1031.03,-19.33,-17.5,722.0,705.0,721.0,1.26,0.21,1.43,259.11,42.17,293.66,1.2899280687752308 2018-06-01 08:34:30,10,34,976.86,155.98,10
4、87.5,-19.14,-17.4729.0,709.0,725.0,1.34,0.22,1.5,106.32,1698,118.36,1.437751581 2018-06-01 08:37:30,11,30,1128.4,172.08,1132.56,-18.73,-17.3,728.0,717.0,726.0,1.55,024,1.56,139.0,21.2,139.51,1.692574814 2018-06-01 08:40:30,12,41,1279.25,166.06,1310.4,-17.54,-17.0,731.0,722.0,720.0,1.75,0.23,1.82,114
5、.86,14.91,117.66,1.975787459 2018-06-01 08:43:30,13,50,1334.07,200.2,1472.58,-16.68,-16.6,729.0,715.0,729.0,1.83,08:46:30,14,53,1474.6,225.37/517.34,-15.43,-16.6,730.0,727.0,726.0,2.02,0.31,2.09,101.72,15.55,104.67,2.370655595 2018-06-01 08:49:30,15,65,1548.51,233.28,1674.4,-14.6,-16.3,727.0,729.0,7
6、28.0,2.13,0.32,2.3,86.86,13.09,93.92,2.532091305 2018-06-01 08:52:30,16,76,1619.93,538.72,1723.12,-141,-16.2,733.0,728Q724Q2.21,0.74,2.38,77.59,25.8,82.53,2.779719016 2018-06-01 08:55:30,17,83,1681.68,1677.36,1810.0,-13.27,-16.2,728.0,723.0,724.0,2.31,2.32,2.5,73.55,73.36,79.16,3.3760893010660133 20
7、18-06-01 08:58:30,18,86,1802.96/756.89,1861.12,12.41,16.2,727.0,729.0,727.0248241,2.56,75.89,73.95,78.34,3.6370823761186575 2018-06-01 09:01:30,19,96,1865.82,1865.82,1979.25,-11.25,-159726.0,726.0,725.0,2.57257273,70.09,70.09,74.35,3.832377845 2018-06-01 09:04:30,20,1000923.9,1900.8,2011.59, 10.77,1
8、58726Q720.0,721.0265,2.64,2.79,69.27,68.43,72.42,3.956691872ID :表ZF记录编号。风向:表示光伏电厂现场风的来向。* Figure 1簧G6 中Q三上 El不同板温数据段的频数饼图图6-*步骤10 (2)输出结果四、结论1 .从数据筛选分析的结果中可以看出,发电量排名前10条数据中,在可能影响发电量 的四个因素中,转换效率和风速变化没有明显的规律,说明这两个因素可能不是影响发电 量的主要因素。2 .从描述性统计分析的结果中可以看出,在所有统计的月份中,8月的总发电量最高,3 .在统计小时段中,12:00-12:59时间段的平均发电量
9、最大。4 .从相关性分析的结果中可以看出,发电量与光照强度的相关系数最高,说明光照强 度大可以增加发电量。5 .从板温直方图的结果中可以看出,板温基本集中在-20到30,在。到10之间的数据 最多,而且数据有左偏的趋势。6 .从发电量和光照强度双重图折线的结果中可以看出,发电量与光照强度属于紧密相 关,所以如果想要提高发电量,应该想方法增加光照强度。7 .从板温段频数饼图的结果中可以看出,(-5, 5的数据最多,占了 30.8%数据源2如图6-*所示。ID :表示记录编号。风速:表示光伏电厂现场风速测量值。 数据源3如图6-*所示。wind_speed.txt - i己事本 文件(F)编辑(E
10、)格式(0)查看(V)帮助(H) ID风速10.19 030.610 0.81.111 0.90.912 1.10.913 0.71.014 1.51.5图6.*数据源3 (局部) 二、目标1 .根据三个点A、B、C的转换效率、电流、电压、功率计算出综合转换效率、电流、 电压、功率。2 .筛选出板温在10到30之间,发电量排名前10对应的发电量、板温、光照强度、转 换效率、风速,查看是否有一些因素可能对于发电量有影响作用。3 .计算不同月份总发电量,分析哪些月份的总发电量较高。4 ,计算不同小时段的平均发电量,分析哪些小时段平均发电量最高。5 .计算发电量与光照强度、转换效率、板温之间之间的相
11、关系数,分析哪些因素是发 电量的主要因素。6 .根据板温绘制直方图,查看板温的数据分布。7 .根据发电量和光照强度两列数据绘制双重折线图,并查看其关系,因为两列数据的 数据量纲不同,可以先对数据进行标准化再画图。8 .将板温进行数据分段,再绘制段的饼图,分析哪个板温段占比做多。三、分析步骤步骤1:导入库,设置参数。(1)导入所需要的库 pandas、numpy、matplotlib.pyploto(2)利用pd.set_option解除显示宽度的显示,设置数据对齐。(3)利用reParams设置相关参数,将显示字体设置为黑体,设置显示负号,字体大 小设置为15。步骤1代码如下:import p
12、andas as pdimport matplotlib.pyplot as pitpd.set_optionCdisplay.unicode.east_asian_widthTrue)pd.seCoptionCdisplay.widthNone)pltrcParams,font.sans-serif=,Simhei,plt.rcParamsaxes.unicode_minus=Falseplt.rcParams font, size =15步骤2:读入数据,合并数据,显示数据形状。(1)导入光伏数据的 photovoltaic.csv、wind_direction.xlsxs wind_sp
13、eed.txt (三个文件 均存放在c:data路径中),将导入的数据命名为datal、data2、data3o其中,wind_speed.txt 文件的分隔符是Tab, wind_direction.xlsx的数据在Sheetl工作表内。(2)利用merge函数将data 1、data2s data3三个数据按照关键字段“ID”进行合并, 合并方式为内连接,命名为data。(3)输出data的行数、列数、列名以及前5行。步骤2 (1)代码如下:datal = pd.read_csv(nc:/data/photovoltaic.csvn)data2 = pd.read_excel(nc:/da
14、ta/wind_direction.xlsxn)data3 = pd.read_csv(nc:/data/wind_speed.txtn, sep=t)步骤2 (2)代码如下:data = pd.merge(datal,data2,on=ID)data = pd.merge(data,data3,on=TD)步骤2 (3)代码如下:print(数据的行数=%dn 数据的列数=%dH%(data.shapeO,data.shape 1 )print(数据的列名为:n”, data, columns)print(数据的前 5 行为:n”,data.head。)输出结果如图6-*所不。Run:6-5
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python数据分析与可视化 教案 6.5 工业数据分析与可视化 Python 数据 分析 可视化 工业
限制150内