基于数据的流程工业生产过程指标预测方法综述-陈龙.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《基于数据的流程工业生产过程指标预测方法综述-陈龙.pdf》由会员分享,可在线阅读,更多相关《基于数据的流程工业生产过程指标预测方法综述-陈龙.pdf(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第43卷第6期2017年6月自动化学报ACTA AUTOMATICA SINICAV0143No6June,2017基于数据的流程工业生产过程指标预测方法综述陈龙1 刘全利- 王霖青1 赵琚 王伟1摘要生产过程关键指标的预测对于流程工业生产调度,安全生产和节能环保有着重要作用目前,已有多种基于工业生产数据提出的生产过程指标预测方法,主要涉及特征(变量)选择,预测模型构建及其模型参数优化这三方面本文分别针对以上三方面论述了基于数据的工业生产过程指标预测国内外研究现状,分析了各种方法的优缺点最后,指出了流程工业生产过程指标预测方法在工业大数据及知识自动化等方面的未来研究方向和前景关键词生产过程,特
2、征选择,预测模型,参数优化,工业大数据引用格式 陈龙,刘全利,王霖青,赵瑶,王伟基于数据的流程工业生产过程指标预测方法综述自动化学报,2017,43(6):944-954DoI 1016383jaas2017c170136Data-driven Prediction on Performance Indicators in Process Industry:A SurveyCHEN Lon91 LIU QuanLil WANG LinQin91 ZHAO Junl WANG WeilAbstract It is of great significance to predict producti
3、on process indicators in process industry for production scheduling,safety production and energy savingCurrently,various data-driven approaches for predicting these indicators areproposed,including the following three aspects:feature selection,prediction model construction and model parameteroptimiz
4、ationThis paper surveys the above three aspects and summaries the merits and demerits of these approachesFinally,future research directions of production process prediction of key indicators in process industry are suggested withrespect to industrial big data and knowledge automationKey words Produc
5、tion process,feature selection,prediction model,parameter optimization,industrial big dataCitation Chen Long,Liu QuanLi,Wang LinQing,Zhao Jun,Wang WeiData-driven prediction on performanceindicators in process industry:a surveyActa Automatica Sinica,2017,43(6):944-954流程工业是通过分离、混合、成型或物理、化学变化使生产原材料增值的行
6、业,其生产过程一般是连续或成批进行,主要包括化工、冶金、石油、橡胶、轻工、制药等现如今我国流程工业发展迅速,主要产品产量居世界前列以粗钢生产为例,2015年全球粗钢产量达到1621亿吨,其中中国粗钢产量达到8038亿吨,占全球粗钢总产量的496然而目前我国流程工业普遍面临着过程结构复杂,工序设备多,能耗高等突出问题因此,提高我国流程工业自动化水平以达到降低能耗和提高效率的目标迫在眉睫流程工业普遍包含诸多重要的生产过程指标或收稿日期2017-0313 录用日期2017-0506Manuscript received March 13,2017;accepted May 6,2017国家自然科学基
7、金(61473056,61533005,61522304,U1560102),国家科技支撑计划(2015BAF22801),中央高校基本科研基金(DUTl6RC(3)031)资助Supported by National Natural Science Foundation of China(61473056,6153300561522304,U1560102),National Key Technology Support Program f2015BAF22801),Fundamental Research Funds for the Central Universities(DUTl6R
8、C(3)031)本文责任编委侯忠生Recommended by Associate Editor HOU Zhong-Sheng1大连理工大学控制科学与工程学院大连1160241SchOOl of Control Science and EngineeringDalian University of rilechnologyDalian 116024变量,现场操作人员往往会根据经验对某些特别关注的关键指标进行监测,从而调控整个生产过程,最终达到稳定生产的目标,如高炉炼铁过程中铁水温度,硅含量【3】以及多种质量指标【4j等生产过程指标一般分为两类,一类是生产过程运行参数,如温度、压力等;另一类是
9、定义的生产过程指标,如选矿过程中的精尾矿品位等,而此类指标往往与其他过程变量之间存在着复杂的非线性关系考虑到工业生产过程通常具有非线性和大滞后等特征,对这些指标的测量往往耗时长,难以检测,或根本无法检测,因此针对其建立有效的数学模型进行实时预测(估计)就显得尤为重要【5】另一方面,从实时生产调度角度来讲,操作人员希望预先了解某些关键指标的未来变化趋势,这也使得指标趋势预测成为目前流程工业生产过程监控的重要任务【6-引传统的生产过程指标预测采用基于机理建模的方法,此类方法在工艺机理分析的基础上,依据物料平衡、热量平衡和动力学建立数学模型【8J然而机理建模很大程度上依赖于对过程机理的认知,由于工业
10、生产常具有非平衡、非稳定和强非线性等特点,此类机理模型成本高、难度大,其准确性和可靠性难以保证,往往存在模型精度低和容易失配等问题【8J万方数据6期 陈龙等:基于数据的流程工业生产过程指标预测方法综述随着计算机和网络技术的发展,流程工业企业基于监控与数据采集系统(Supervisory control anddata acquisition,SCADA)获取了大量涉及生产过程特点、设备、质量和能源的历史数据目前基于数据的方法成为较盛行的生产过程指标预测方法,此类方法通过建立输入一输出数据变量间的关系模型完成预测任务,而无需对生产过程的反应或动力学等机理信息进行研究通常基于数据的生产过程指标预测
11、过程包含三个方面,即1)特征(变量)选择;2)预测模型建立;3)模型参数优化特征(变量)选择过程指从大量的候选输入特征中挑选出与预测指标最相关的特征作为预测模型的输人变量通常数据特征选择包括经验知识手动选择和基于数据分析的选择方法基于经验知识的方法虽然方便快捷,但时常会因经验不足出现错选漏选或特征冗余的情况基于数据的预测建模可采用机器学习方法(如人工神经网络9】9、支持向量机10】等)来完成,与机理模型不同的是此类方法只关注模型的输入和输出模型的输入是选择的相关特征变量,模型输出即是待预测的关键指标预测模型参数选取对模型精度影响较大,模型参数优化过程通常以减小预测误差为目标,使模型获得较好的预
12、测精度最常见的模型参数优化方法有基于梯度的方法,如梯度下降法【11j、共轭梯度法11】等;智能优化方法如遗传算法112J、模拟退火算法13】等图1给出了基于数据的生产过程指标预测方法的基本流程预测阶段图1 基于数据生产关键指标预测的基本流程图Fig1 A flow chart of data-based prediction onperformance indicators in process industry本文针对目前基于数据的生产过程指标预测在上述三个方面进行综述,并结合当前最新的机器学习技术、自动化发展趋势以及工业过程的需求,探讨基于工业数据的生产过程指标预测方法的可能发展方向1生产
13、过程指标的特征(变量)选择被预测的指标值往往与生产过程中的多个过程变量相关,进行生产过程指标预测首先需将与被预测指标最相关的特征变量从众多候选变量中挑选出来以热轧生产过程为例,针对板带厚度的预测问题,经过特征选择最终得到影响板带厚度的输入因素多达20个【14J基于数据的特征选择根据是否独立于后续的建模算法,可分为过滤式(Filter)和封装式(Wrapper)两种【15】过滤式特征选择的基本思路是采用一种评价准则来增强特征与输出的相关性,削减各个特征之间的相关性从而选择最相关特征,再将被选择的最相关特征参与建模而封装式方法则将特征选择步骤与建模过程融合,其缺点在于与过滤式方法相比较为耗时目前,
14、应用在工业生产过程中最常见的特征选择方法有过滤式方法,如基于相关性分析的方法【16_19等;封装式方法,如变量修剪方法20】、基于遗传算法的方法【21等基于相关性分析的方法如灰色关联分析法【22J,其基本思路是通过线性插值将时间离散观测值转化为分段连续的折线,进而根据折线的几何特征构造测度关联程度模型来评价各状态变量之间的关联程度如文献23针对烧结过程中烧结质量的预测问题,将8个过程变量分别与烧结质量进行灰色关联分析,并最终挑选了4个与烧结质量最相关的因素来作为预测模型的输入文献24针对钢铁工业转炉煤气系统中煤气柜位预测问题提出了一种一致T型灰色关联分析算法来确定转炉煤气柜位的主要影响因素文献
15、【25针对炼焦生产过程综合生产指标(焦炭质量、产量和焦炉能耗)预测,采用主元分析和灰色关联分析确定了神经网络预测模型的输入输出因素针对硫酸锌溶液净化过程中钴离子浓度预测和高炉炉温预测【27】问题,灰色关联方法表现出较好的精度优势此外,基于F评分的方法也是一类基于相关性分析的特征选择方法【19J,该方法通过定义一种F评分来表示每个输入特征与输出之间的相关程度,F值越大说明该特征与输出的相关性越大如文献28】针对高炉炉温变化趋势预测问题,提出了一种依次验证和F评分方法相结合的特征选择方法,从所有的高炉炼铁过程变量中找出与炉温变化趋势最相关的8个输入特征目前大部分基于相关性分析的特征选择方法仅仅分析
16、了候选特征与被预测指标之间的关联性,而未考虑各输入特征之间可能存在的联系,从而导致选出的特征中存在冗余,也会在一定程度上影响预测模型的建模效率变量修剪算法是一种封装式特征选择方法,其思路是基于前馈神经网络回归模型从复杂的初始模型出发,以最小化预测误差为目标,通过逐个将相万方数据自 动 化 学 报 43卷应输入权值设置为零来剔除不相关变量【20】该算法在修剪输入变量的同时优化模型的网络结构(隐含节点数目)如针对高炉铁水硅含量预测问题,文献29301分别采用前馈神经网络模型作为基础预测模型,并采用变量修剪算法来去除不相关变量,最终找到了影响铁水硅含量的主要输入因素此外,基于遗传算法的封装式方法是将
17、候选特征随机构造预测模型组成种群并进行遗传操作来选择最优的输入特征如文献31提出了一种基于遗传算法优化的神经网络非线性建模算法,建模过程中采用遗传算法同时最小化预测误差和模型复杂度两个目标,从而得到最优输入特征组合和网络结构,并将其应用到高炉炼铁过程中的铁水硅含量预测问题文献f211针对石油化学制品工业中的质量指标预测问题,将候选输入变量随机构造的一系列预测模型组成一个种群,以最小化预测误差为目标,通过类似遗传算法的策略来找到最优的候选变量组合封装式特征选择方法由于以最小化预测误差为目标进行特征选择,其预测精度可能优于基于相关性分析的方法,但是由于其在建模过程中融入了特征选择步骤,算法的时问成
18、本也相对较高以上针对特定工业应用的无论是基于相关性分析的方法还是封装式特征选择方法大都是以离线的方式完成,这对于具有时变特性的工业生产过程并不总是适合因此针对实际工业问题开展实时在线式的特征选择对基于数据的特征选择方法尚具有一定的挑战2生产过程指标预测建模针对工业生产过程建模问题,传统基于物理、化学机理建立精确数学模型的方法已越来越困难而相当数量的工业企业每天都在产生并存储着大量隐含工艺变动和设备运行等信息的生产、设备和过程数据,如何有效利用大量的离线、在线数据和知识,在难于建立系统机理模型的情况下,实现对生产过程和设备的优化控制和评价,已成为迫切需要解决的问题数据驱动的方法是解决机理不明确或
19、含不确定性机理模型对象建模问题的有效方法【32J,此类方法利用离线、在线数据来描述对象的运行规律和相关模式,并结合反映系统参数、结构等数据,来实现复杂系统的建模33j近年来,针对工业系统的指标预测问题,已有不少数据驱动方法(如迭代学习34、无模型自适应方法【35】和自适应动态规划【36等)被提出基于数据的预测建模方法中,根据是否嵌入了机理模型,可将建模方法分为基于数据的方法和数据一机理相结合的方法21基于数据的预测建模机器学习技术的发展为基于数据的生产过程指标预测奠定了建模基础如针对炼铁过程铁水硅含量预测、产品质量指标预测、选矿生产指标预测等问题f37-3引较为常用的方法如人工神经网络【40、
20、支持向量机【4l】、高斯过程回归方法【42J以及偏最小二乘回归方法【43】等文献f441针对铁水硅含量预测,通过联合人工神经网络和定性分析的方法建立预测模型文献4546采用人工神经网络分别对钢板轧制过程中的轧制力和串联轧制机组的震颤进行了预测文献47针对高炉炼铁过程中的硅含量变化趋势预测,提出了二编码支持向量机模型基于偏最小二乘回归方法和核偏最小二乘法的预测模型也应用于化工生产过程的产品质量【48J和铜转炉吹炼过程的关键操作参数预测【49】基于混沌的多步迭代预测和基于AdaBoost的预测模型也分别应用于铁水硅含量预测50 J和选矿生产指标预测【51 J中此外,基于数据的预测模型不仅被应用在生
21、产监控与调度需求中,也被应用在预测优化控制中52-53J,而采用基于数据的机器学习方法(如人工神经网络、支持向量机等)来进行预测建模是当前较为流行的方法54山引其基本思路是将当前时刻的系统输入值和真实输出值作为基于数据预测模型的输入来预测系统的输出,并将此预测输出值反馈到系统输入端以进行滚动优化此类方法充分利用了机器学习技术较强的非线性拟合能力,而无需关注系统内在机理,具有较强的可应用性;但却需要大量的历史数据来作为预测模型的建模基础根据生产过程中不同的预测需求或不同的生产状况,基于数据的预测建模通常有以下几种分类方法根据预测时长需求,可分为长期预测模型和短期预测模型;根据预测输出指标的数量,
22、可分为多输出预测和单输出预测;根据模型中是否考虑时滞因素,可以分为时滞因素模型和非时滞模型;根据是否有在线更新模型参数,可分为离线模型和在线模型;根据是否使用单一的机器学习预测模型,可以分为多模型集成和单一模型等下面将重点综述几类预测建模问题,包括长期预测模型、多输出模型、时滞因素模型、在线预测模型、集成预测模型和时间序列预测模型1)长期预测模型流程工业生产中为了达到生产资源的合理配置,通常需要一个相对长期生产规划(如天、月等),因此对生产过程指标的长期预测就显得尤为重要短期预测一般采用单步迭代的方法,然而此方法应用在长期预测问题时预测误差会随着迭代步数的增加而积累,导致最终的误差很大【59-
23、61|如文献611针对转炉煤气流量的长期预测,提出了一种基于钢铁生产状态估计的转炉煤气流量长期预测方法,通过特征提取和特征融合得到全局性特征,利用全局性特万方数据6期 陈龙等:基于数据的流程工业生产过程指标预测方法综述 947征来实现转炉煤气流量的长期预测文献【62l提出粒度时间序列的概念,并采用模糊聚类方法构造时间粒度以进行长期趋势预测针对钢铁能源系统的副产煤气流量长期预测问题,文献163I提出了一种基于粒度计算的长期预测方法,通过对工业原始数据根据过程操作工艺进行时间上的粒度划分,采用动态时间弯曲技术和模糊聚类产生类别实现长期预测而文献旧41针对钢铁工业中氧氮能源系统的调度问题,采取了预测
24、一调度两阶段的调度方法,其中长期预测部分同样采用了基于时间粒度划分的方法基于时间粒度划分的方法虽然可以有效地避免单步迭代预测带来的误差积累问题,但是以上文献中的时间粒度划分都是采用人工划分的方式,极度依赖于人工经验,粒度划分的效果很难科学评判,而且难以推广到其他工业应用,有一定的局限性因此更智能的自动划分方法以及更合理的粒度划分评判方法是目前研究的重点【6引2)多输出预测模型工业生产过程往往需要同时关注多个关键预测指标,分别对各个指标建立预测模型的方法会丢失被预测指标之间的内在关联耦合信息,从而导致预测精度不高如钢铁工业转炉炼钢生产中,文献24,65】针对两个转炉煤气柜柜位预测,考虑两个煤气柜
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数据 流程 工业 生产过程 指标 预测 方法 综述 陈龙
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内