基于基团拓扑的遗传神经网络工质临界温度预测-苏文.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《基于基团拓扑的遗传神经网络工质临界温度预测-苏文.pdf》由会员分享,可在线阅读,更多相关《基于基团拓扑的遗传神经网络工质临界温度预测-苏文.pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2016 年 11 月 CIESC Journal 4689 November 2016第 67 卷 第 11 期 化 工 学 报 Vol.67 No.11DOI: 10.11949/j.issn.0438-1157.20160289 基于基团拓扑的遗传神经网络工质临界温度预测 苏文,赵力,邓帅 (天津大学中低温热能高效利用教育部重点实验室,天津 300072) 摘要 :用遗传神经网络预测工质的临界温度,网络的输入参数为分子基团和拓扑指数,输出参数为临界温度。所划分的 16 个分子基团涵盖了制冷、热泵及有机朗肯循环系统中的大部分工质,所选拓扑指数能够分辨工质中所有的同分异构体。通过遗传算法优化
2、得到网络结构及初始参数后,由神经网络对工质临界温度进行预测,同时为了提高网络对临界温度预测的泛化能力,将 200 种工质划分成训练集、验证集及测试集。所得网络能够区分所有的同分异构体,且与实验值相比,各数据集临界温度的平均相对误差分别为 1.18%、 1.69%、 1.28%,表明该网络对工质临界温度具有很好的预测能力。 关键词 :热力学性质;临界温度;工质;分子基团;拓扑指数;遗传算法;神经网络 中图分类号 : TK 123 文献标志码 : A 文章编号 : 0438 1157( 2016) 11 4689 07 Prediction of refrigerant critical temp
3、erature with genetic neural network based on group topology SU Wen, ZHAO Li, DENG Shuai (Key Laboratory of Efficient Utilization of Low and Medium Grade Energy, Ministry of Education, School of Mechanical Engineering, Tianjin University, Tianjin 300072, China) Abstract: A genetic neural network was
4、presented to predict the critical temperature of refrigerants. The inputs of the network included molecular groups and a topological index, and the output was the critical temperature. 16 molecular groups divided can cover most of the refrigerants or working fluids in refrigeration, heat pump and Or
5、ganic Rankine Cycle research. The chosen topological index was able to distinguish all refrigerant isomers. The critical temperatures of refrigerants were estimated by the neural network after obtaining the optimized network structure and initial parameters by genetic algorithm. At the same time, in
6、 order to improve network generalization ability of prediction, 200 data points were divided into three data sets including the training, validation, and test sets. The calculated results based on the developed network showed a good agreement with experimental data. The network can distinguish all r
7、efrigerant isomers and compared with the experimental data. The average absolute relative deviations for training, validation and test sets were 1.18%, 1.69% and 1.28%, respectively. Key words: thermodynamics property; critical temperature; refrigerant; molecular groups; topological index; genetic a
8、lgorithm; neural network 引 言 工质作为实现热力循环热功转换的流动介质,其基础物性是热力循环构建、控制和优化的基础,同时也决定着循环系统的安全性、经济性。虽然,已有文献都收集有大量可靠的热物性数据1-2, 但随2016-03-11 收到初稿, 2016-08-25 收到修改稿。 联系人 :赵力。 第一作者 :苏文( 1991) ,男,博士研究生。 基金项目 :国家自然科学基金项目 (51276123, 51476110)。 Received date: 2016-03-11. Corresponding author: Prof. ZHAO Li, Foundati
9、on item: supported by the National Natural Science Foundation of China (51276123, 51476110). 万方数据 化 工 学 报 第 67 卷 4690 着人们对温室效应及臭氧空洞等环境问题的日益重视,研发高效、低 ODP( ozone depletion potential) 、低 GWP( global warming potential)的循环工质迫在眉睫。通过分子设计逆向工程,高效率地寻找具有特定性质的分子已成为工质研发的主要手段3。分子设计的主要依据是分子构效关系,关键在于建立高精度的结构 -物性预测模
10、型。 作为亚临界与跨临界热力循环的分界点,工质临界温度 (Tc)不仅是工质重要的基础物性,也是估算工质其他物性的基础4。目前,估算物性最通用的方法便是基团贡献法5-8。在临界温度方面,Joback 等9提出了估算有机物临界温度的基团法;Constantinou 等10在 UNIFAC 基团的基础上,发展了一种考虑邻近基团影响的基团法,提高了预测精度; Marrero 等11论述了键贡献法,采用单一原子形成原子对的值,预测了临界温度。国内方面,许文12建立了估算临界温度的三基团参数关联式 ; 马沛生等13在系统整理大量临界温度数据的基础上 ,提出了新基团估算法及基团贡献值,提高了估算精度 ; W
11、ang 等14提出了定位分布贡献法,其能够区分大部分的同分异构体。但以上提出的方法针对的是全体有机物,缺乏对工质展开有针对性的研究,且已有方法不能完全区分异构体,基团划分复杂,不利于分子设计中的物性快速估算。因此,本文引入了拓扑指数以区分异构体,并划分了工质基团。 近年来,由于神经网络的高度非线性功能,已成为物性预测的有力工具15。众多学者将神经网络和基团贡献法相结合,估算了有机物的沸点、临界参数等重要物性16-18。其中,旷戈等19提出了估算有机物临界温度的基团贡献人工神经网络集成法。但在相关研究中发现,神经网络具有网络结构难以确定,容易陷入局部极小点等固有缺陷20。因此,本文将进化计算中的
12、遗传算法引入神经网络,通过分子基团及拓扑指数, 实现对工质临界温度的预测。 1 分子基团及拓扑指数 1.1 基团划分 工质研究最早始于 19 世纪 30 年代, Midgely等21从元素周期表出发,在综合考虑工质热物理性能、毒性、稳定性等条件下,认为工质应由 C、 H、N、 O、 F、 Cl、 Br、 I 8 种元素构成。但随着环境的恶化,工质正从最初的 CFC、 HCFC 等氟氯工质向具有低 ODP、低 GWP 的环保型工质发展,氟氯工质逐渐被淘汰。因此,基于分子基团的工质构效关系,采用分子设计逆向思维研发符合应用需求的高效工质已引起各国学者的广泛关注22。根据已有工质构型及分子设计结果2
13、3,可以得出热力循环中有机工质主要由烷烃、烯烃、卤代烃、醚、醇、胺六类有机物构成,同时考虑分子基团划分的简易性,将工质按照官能团划分为 16 个基团,如图 1 所示。 图 1 工质基团 Fig.1 Refrigerant groups 1.2 拓扑指数 引入分子拓扑指数 EATII 辨别工质中存在的大量同分异构体。 EATII 是从分子结构图中衍生出来的一种数学量,依据分子拓扑结构及分子组成计算得到24,不仅与物质性质具有较好地相关性,也对不同的分子结构具有唯一性, 能唯一地区分 22 个碳原子内形成的所有异构体25。图 2 表示拓扑指数EATII 计算流程, 所需的基团共价半径 Radii
14、和连接度 如表 1 所示。 图 2 拓扑指数计算流程 Fig.2 Flow of calculating topological index 万方数据第 11 期 苏文等:基于基团拓扑的遗传神经网络工质临界温度预测 4691表 1 基团共价半径及连接度 Table 1 Covalence radii and connected degree of groups Group Radii CH3 0.74 1 CH2 0.74 2 0.74 3 0.74 4 CH2 0.74 2 CH 0.74 3 0.74 4 F 0.72 7 Cl 0.994 7 Br 1.142 7 I 1.334 7 O
15、H 0.74 5 O0.74 6 NH2 0.74 3 0.74 4 0.74 5 2 遗传神经网络 神经网络是由具有适应性的简单单元组成的广泛并行互连网络, 其 3 层 BP ( back propagation)网络能以任意精度逼近任意有理函数26。因此,本文采用包括输入层、隐层和输出层的 BP 神经网络建立基团、结构与临界温度之间的非线性关系。输入层由 17 个节点构成,分别代表 16 个基团和 1 个拓扑指数,其中基团输入值为该基团在分子中出现的次数。输出层只有一个节点,表示临界温度。同时,利用遗传算法 (GA)优化得到网络的隐层节点数和初始参数值。 200 种不同工质用于建立遗传神经
16、网络,碳元素最多为 8 个,临界温度值来源于美国Chemical Abstracts Service,并且所有的数据在使用前都作归一化处理。 2.1 遗传算法 遗传算法 GA 最早由 Holland27提出,采用全体进化的方式,将优化问题的解以某种形式编码,产生个体,由适应度函数指导搜索方向,再通过选择、交叉、变异操作产生新一代个体,如此反复进行,直到搜索到最优解为止。为使 GA 能同时优化BP 网络的初始参数值和隐层节点数, 本文采用递阶编码机制,每个个体的染色体由控制基因和参数基因构成。 控制基因决定每个隐层神经元是否被激活,采用二进制编码;参数基因用来表示每个神经元权值和阀值,采用实数编
17、码28。 GA 的适应度函数由网络的误差函数和复杂度函数构成, 误差函数 MSE可由式 (1)算得 2exp, cal,11MSE ( )NiiiTTN=(1) 式中, N 为工质总数; Texp,i为临界温度实验值,Tcal,i为临界温度计算值。 网络复杂度函数由隐层节点个数决定,假设隐层节点数为 m,则复杂度函数 NC 如式 (2)所示29NC exp2m= (2) 由于 GA 总是朝着适应度函数增大的方向迭代,因此个体适应度函数 定义如式 (3)所示 10.2MSE 0.8NCf =+(3) 对于遗传算子,本文采用正常几何分布的选择算法、线性组合的算术交叉算法和所有基因随机扰动的非均匀变
18、异算法。 同时考虑到工质总数为 200,设最大隐层节点数为 15,种群大小为 100,最大迭代次数为 500。遗传算法流程如图 3 所示。 图 3 遗传算法流程 Fig.3 Flow diagram of genetic algorithm 2.2 BP 神经网络 基于误差反向传播的 BP 网络主要由正向传播和反向传播两部分组成。在正向传播中,输入参数从输入层经隐含层神经元处理后,传至输出层,如果输出层得到的不是期望输出,就转为反向传播,依据网络的实际输出和期望输出之间误差的负梯度方向,从后往前逐层地迭代修正各层神经元之间的万方数据 化 工 学 报 第 67 卷 4692 连接权值和阀值。基于
19、 GA 得到的网络初始参数及隐层节点数,本文采用收敛快且精度高的Levenberg-Marquardt(LM)学习算法对 3 层 BP 网络进行训练30。网络神经元的传递函数主要有 3 类,分别为 purelin、 logsig、 tansig,其中传递函数 tansig在定位分布贡献法被用来预测物质的临界温度14。因此,本文隐层和输出层分别采用传递函数 tansig和 purelin,定义如下 图 4 BP 网络算法流程 Fig.4 Flow diagram of BP algorithm tansig( ) 2 / 1 exp( 2 ) 1xx=+ (4) purelin( )x x= (
20、5) 式中, x 表示函数参数。 为提高 BP 网络预测临界温度的泛化能力,防止网络出现数据过拟合,本文将 200 种工质分为 3类,分别为训练集、验证集、测试集,比例依次为70%、 15%、 15%30。 BP 网络算法流程如图 4 所示。 3 结果与讨论 通过遗传算法得网络最优隐层节点数为 6, 因此,BP 网络的拓扑结构为 17-6-1。利用 LM 算法从 GA得到的初始参数开始对该网络进行训练,得到如表 2所示的网络优化值。同时,根据 BP 网络传递函数,建立基团、结构与临界温度之间的关系,得式 (6) 6c16112262.745EATII1exp 498.584511.3205ii
21、kik ie ik kWTNWW bC=+(6)式中, Wi是隐层神经元 i 的权重; Wik 是基团 k对神经元 i 的输入权重; Wie是拓扑指数 EATII 对神经元 i 的输入权重; b 是隐层神经元常数; Ck是基团 k 常数; Nk 是工质所含基团 k 的个数。 b 和 Ck列于表 2。 训练所得 BP 网络预测临界温度的性能可由以下统计参数评价 表 2 网络优化值及参数 Table 2 Optimum values of network and parameters of correlation Input weights CH3 CH2CH CNH N EATII Thresh
22、old neuron 1#0.20843 1.23913 0.42884 0.04153 0.05146 0.16829 0.544328 0.066391 1.03895348 neuron 2#0.49325 0.076965 0.533135 1.147835 0.39391 0.26404 0.521666 0.544438 0.8768804 neuron 3#0.39346 2.422521 0.313667 0.145749 0.11889 0.193188 0.70491 0.43111 1.6296647 neuron 4#0.741119 0.12014 0.82773 0
23、.29531 0.16037 0.431272 0.188162 0.76962 1.0664064 neuron 5#0.12689 0.22303 0.42313 1.252756 0.25818 0.51317 0.954504 0.69275 1.4490524 neuron 6#0.225885 0.37853 0.545349 0.019373 0.135826 0.498882 0.1713 0.091656 3.82156294 C 2 1 2 2 1 1 1 Neuron 1 2 3 4 5 6 Threshold layer weights 1.02158 0.00334
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 基团 拓扑 遗传 神经网络 工质 临界温度 预测 苏文
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内