智能电网电力数据存储以及数据分析,职称论文.docx
《智能电网电力数据存储以及数据分析,职称论文.docx》由会员分享,可在线阅读,更多相关《智能电网电力数据存储以及数据分析,职称论文.docx(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、智能电网电力数据存储以及数据分析,职称论文内容摘要:智能电网是一个完好的自动化系统,现有的电网系统中嵌入了大量传感器,利用当代信息技术对其进行控制和监控。从这些传感器收集的数据量非常庞大,具备了大数据的所有特征,因而提出采用大数据手段对智能电网的电力数据进行处理、分析,进而使智能电网愈加智能化。本文以Apache spark作为一个统一的集群计算平台,用于智能电网电力数据存储以及数据分析阶段,为电力企业、终端用户提供准确、实时的数据支持。 本文关键词语:智能电网; 传感器; 电力大数据;Apache spark; Smart Grid Power Big Data Analysis Techn
2、ology Based on Cloud Computing CHEN Qing-ming XU Huan YE Pei-shan Southern Power Grid Media Co., Ltd. China Southern Power Grid Co., Ltd. Abstract:Smart grid is a complete automation system. A large number of sensors are embedded in the existing grid system, which is controlled and monitored by mode
3、rn information technology. The amount of data collected from these sensors is very large, and it has all the characteristics of big data. Therefore, it is proposed to use big data means to process and analyze the power data of the smart grid, so that the smart grid is more intelligent. This paper us
4、es Apache spark as a unified cluster computing platform for smart grid power data storage and data analysis, providing accurate and real-time data support for power companies and end users. 1 引言 随着信息和通信系统新兴技术的不断发展,当今的电网运行正逐步演变成以传感器嵌入式的网络(即智能电网),它能够控制电网运行的整个经过。各种类型的传感器部署在智能电网运行的各处,所有这些传感器产生不同类型的数据(异构
5、数据),然后在电网专用数据中心进行数据的采集。造成在数据管理存在数据量大、数据类型冗杂等情况,根据传统的数据处理形式无法知足。因而提出采用大数据手段,对所收集的数据进行分析,以挖掘隐藏在大数据中并可用于制定战略、战术及运营决策的数据支撑,该经过的关键在于数据挖掘,常用的数据挖掘方式方法如下: 形式匹配和关联规则:牵涉学习数据中经常出现的趋势,以便为将来的决策制定规则。形式匹配算法包括Eclat,FP-Tree等。 分类:一种监督机器学习方式方法,华而不实数据分为训练和测试集。然后,使用训练集来训练分类器模型,以预测给定测试数据的类标签。一些最广泛使用的分类算法是决策树,K-近期邻(K-NN),
6、支持向量机(SVM)和朴素贝叶斯等。 聚类:这是一个无监督的学习经过。聚类的目的是将数据集中的数据点一起分为多个组,详细取决于其在更高层次维空间中的分布。集群数量的选择取决于数据和问题定义。一些最常用的聚类算法是k-均值,期望最大化和层次聚类。 回归:使用给定数据辨别独立变量和因变量之间的关系模型的经过。然后,该模型用于预测即将到来的独立变量的值。这是一种有监督的机器学习方式方法。一些广泛使用的回归算法,包括Logistic回归,支持向量回归(SVR)和Gauss-Newton算法。 本文具体介绍了Apache Spark在大数据分析中的作用,主要从电网中各数据源、相关的数据处理技术以及在电网
7、中的应用,并且以电网价格为应用背景,提出了统一处理应用的数据平台。 2 智能电网数据流分析 智能电网当前已成为数据科学家的一个有趣的研究领域。智能电网数据大致分为发电数据、传输/分配数据和消费者数据。以数据为中心的传感器网络视图和智能电网中的数据分布如此图1所示。能够对这些数据进行大量数据分析,使智能电网愈加智能化。 图1 智能电网数据分布图 (1)面向发电的数据 在发电厂中,发电方式不同,如水,煤,潮汐,风,核等.Swartz等。文献1中提出了一种利用无线传感器和行动者网络,能够在风电场上无缝地进行数据采集,如可提取有关风力涡轮机动态状态行为的数据。Li等人2提到了一种使用关联规则挖掘的煤电
8、厂故障分析和诊断系统。通过对发电厂运行负荷的预测提供了技术手段,为将来的需求做好规划,该方式方法这有助为公用事业行业每年节省数百万美元。 (2)输电配电数据 通常,分布式控制系统(distributed control system,DCS)和监督控制和数据采集(supervisory control and data acquisition,SCADA)是用于输电和配电的专有控制和监测系统。近年来,已经征对电网输配电开发了很多电网监测技术,部分采集手段介绍如下: 电网监控系统:使用GPS(全球定位系统)的相量测量单元(Phasor Measurement Unit,PMU)测量来自所选电网位
9、置的电压和电流的自发幅度。然后将其传输到具有时间戳的服务器,该系统开拓了电力系统的全域和动态视角。 反向散射无线电:为传输和分配组件失败的注意事项提供改良的数据。 从这些源收集的数据可用于分析电力系统状态估计,电力系统状态估计用于确保电网运行的稳定性并防止停电。文献3中利用加权最小二乘法计算电力系统状态预测,当网络的某些部分与网格分离时,将发生孤岛化,并且此类事件可能导致网格(电网)中的稳定性问题。文献4中使用SQL Server和OLAP开发了电能质量数据分析框架。在电力系统中,电网故障辨别、故障原因辨别是确保电网正常工作的核心问题。 (3)功耗数据 分布式电力将对来自各个区域的用户的消费进
10、行分析,例如住宅(个人住宅和公寓),商业(例如:保险),工业(例如:工厂),运输(铁路),紧急服务(例如:医院)和公共服务,以上通过在服务对象端配备智能电表,以规则的时间间隔感测并向服务提供商通报利用数据。这些数据有两种类型,分解数据(分解单个定向电路中每个组件或诸多组件的数据)或聚合数据(所有设备的集合数据)。这些数据首先在数据集中器处汇总,然后将其传输到云端处理。 对于宏大的经济和工业消费者而言,负荷预测在优化电力消耗以促进其将来发展方面发挥着重要作用。文献5比拟了大规模工业和公寓负荷预测的流行数据挖掘方式方法的效率,客户分析有助于他们的行为预测和提供知足其要求的动态定价。 以上所讨论列出
11、的各种各样的应用,其能够通过利用从电网产生的数据,应用各种机器学习技术来执行。随着数据变为 大数据 ,存储和处理成为关键问题,这需要设计统一的智能电网数据处理框架,可提供智能电网数据处理分析所需的数据和处理能力。 3 智能电网上的大数据分析 根据电网生成和使用系统的传感器和运行数据,大数据分析和机器学习的性能是精到准确的。为了实现这一点,系统需要灵敏地近实时地评估所有电力系统和消耗数据的收集。当聚合来自相量监测单元(Phasor Monitoring Units,PMU)、广域测量(WAM)、高级计量基础设施系统、基于IP的设备等系统的所有用电数据和运营网格系统数据时,数据集往往容易到达P字节
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文化交流
限制150内