基于偏最小二乘回归模型的带钢热镀锌质量监控方法.pdf
《基于偏最小二乘回归模型的带钢热镀锌质量监控方法.pdf》由会员分享,可在线阅读,更多相关《基于偏最小二乘回归模型的带钢热镀锌质量监控方法.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 2 9卷第 6期 2 0 0 7 年6月 北 京 科 技 大 学 学 报 J o u r n a l o f Un i v e r s i t y o f S c i e n c e a n d T e c h n o l o g y B e Ui n g VO 1 2 9 NO 6 J u n 2 0 0 7 基于偏最小二乘回归模型的带钢热镀锌质量监控方法 姚 林,2 阳建宏 徐金梧 王 植 1)北京科技大学机械工程学院,北京 1 0 0 0 8 3 2)鞍 山钢铁集团公司,鞍山 1 1 4 0 2 1 3)鞍钢股份有限公司冷轧厂,鞍 山 1 1 4 0 3 0 摘要提出了基于偏最小二乘
2、回归模型的带钢热镀锌质量监控方法以带钢热镀锌生产中带钢力学性能和锌层质量的质 量监控 为研 究对象,用偏最小二乘方法建立 了生产过 程参数与 质量结果之 问的 回归模型,对生产过 程控制 能力进行 了分 析,并给出了产 品质量 的预测方法 用鞍钢股份有 限公 司带钢热镀锌 的实际生产数据进行验证 结果表 明,偏最 小二乘法 比传统 的多元线性 回归方法具有更好 的预测精度,基于偏最 小二乘 回归的锌层质量预测模型,其相对预测误差可达到 5 9 3 关键词带钢热镀锌;偏最小二乘法;质量监控;预测方法 分类号T G3 3 5 2 2;02 1 3 1 随着国民经济的发展,对热镀锌钢板 的质量要 求
3、也越来越高 由于工艺流程复杂,生产过程对产 品质量的影响常常是多因素的,例如原板 的化学成 分、带钢的退火温度、光整延伸率等都会对钢板的力 学性能造成影响 1-2 J 建立工艺过程参数与产品质 量之间的回归模型,可 以为生产过程监控和质量管 理提供有力的数据支持和分析手段多元线性回归(mu l t i p l e l i n e a r r e g r e s s i o n,ML R)是常用 的回归方 法,但在变量间多重相关性 问题上存在一定的局限 性 而神经网络等方法虽在回归精度上有些优势,却在模型对应关系的解释上不够明确 偏最小二乘法(p a r t i a l l e a s t s
4、q u a r e,P L S)是 由 Wo l d 和 Al b a n o等提出的多因变量对多 自变量的回 归建模方法,通过对系统数据进行有效的分解和筛 选,提取对因变量解释性最强的综合变 量辨识 系统中的信息与噪声,从而较好地克服 了变量多重 相关在系统建模中的不良影响 3-5 本文将偏最小二乘法引入到带钢热镀锌生产的 质量监控中,提出了基于偏最d -乘法的带钢热镀 锌工艺过程参数与产品质量的回归建模方法及产品 质量的预测模型,并结合鞍钢股份有限公司带钢热 镀锌实际生产对建模方法的有效性进行了验证 偏最小二乘回归建模方法 对 P个 自变量 X 一,X p 和 q个 因变量 Y l,Y 获
5、取 个观测样本,可 以获得关于 自变量和 收稿日期:2 0 0 6 1 0 3 1 修回日期:2 0 0 7 0 卜2 5 基 金项 且:北京 市自然科学基金资助项 目(No 3 0 6 2 0 1 2)作者简介:姚林(1 9 6 5 一),男,教授 级高级 工程 师,博 士研 究生 徐金梧(1 9 4 9 一),男,教授,博士生导师 因变量 的数据 表 x=X l,X 和 Y=Y l,Y。偏最小二乘 回归建模方法的主要 思路 是:在 x和 y中分别提取 出成分 t】和 U】,t】是 X】,的线性组合,U l 是 Y 一,Y。的线性组合,并 且满足:0 3 t,和 U 应尽可能大地携带各 自数
6、据表 中的变异信息,即 t 和 U 尽可能好地代表数据表 x和 Y;t,和 U】之间的相关程度达到最大,即自 变量的成分 t 对因变量的成分 U 具有最强的解释 能力 利用偏最小二乘法的简化算法,不需要提取因 变量的成分,算法具体计算步骤如下:(1)将原始数据表 x 和 y标准化后分别得 到 自变量矩阵E 和因变量矩阵 F n (2)计算矩阵 E F o Fo Eo 最大特征值对应的正 则化特征 向量 Wl,得第一成分 t l=E0 Wl,其 中 E 和 F 分别是 E0 和 F0 的转置 (3)分别求 E0 和 F0 对 t】的 回归方程 E0=t l P i+El 和 F0=t l r i
7、+F l,其中,Eo t l p F i t l n (1)(2)El 和 F】分别是 E0和 F 0 的残差矩阵(4)检验收敛性 利用交叉有效性判断是否满 足精度要求,若不满足则 E0=E】,F 0=F】,然后重 复步骤(2)和(3),计算下一个成分,直至满足要求;若有 h个成分计算终止,则:F o=t l r i+f 2 r i+f r (3)(5)建 立 E o和 F o的 回归方程 F o=Eo B+维普资讯 http:/ 北京科技大学学报 第 2 9 卷 FA,其中,h 广J 一1 B=I(卜,)w J(4)I为单位向量,FA为残差矩阵(6)通过对 E0 和 F0 进行反标准 化,建
8、立原始 自变量 x 和因变量 l,之间的回归方程:Y=X Bg+C (5)其中,Bg D二 1 B D (6)C m m g (7)D 和D 分别是矩 阵x 和 l,各列方差组成的对角 矩阵,m 和m 分别是矩阵x和 l,各列均值组成的 行向量 2 基于 P L S的质量监控模型 在过程参数与产品质量的回归模型中,回归系 数可以定性或定量地描述各生产过程参数对产品质 量性能的影响程度和影响方式因此。结合生产工 艺原理,根据过程参数对质量性能的影响关系分析 实际生产过程中对各个工艺参数的控制情况,从而 达到质量监控的目的此外,也可以根据 回归模型,利用监测到的生产过程参数对产品质量性能进行预 测
9、,为实际生产中工艺改进和生产质量控制提供必 要的决策支持和分析手段 6-7 J 2 1 建立质量监控模型的步骤 2 1 1 质量监控回归模型的输入和输出 在生产质量监控的回归模型中,自变量通常对 应于过程参数,因变量通常对应于质量 指标 建立 模型时,必须结合实际生产工艺和 已有的工艺参数 收集手段,对模型的输入量(自变量)和输出量(因变 量)进行仔细筛选,使模型既能反映主要工艺流 程,又需保证模型数据在采样间隔上的一致性 2 1 2 样本数据的预处理(1)异 常数据的筛除为保证建模 的准确性,由于异常原因而产生的、不满足带钢热镀锌生产技 术规程的过程参数 或质量 数据,在建模前 要加 以 筛
10、除(2)数据的标准化处理在对生产数据进行回 归建模之前,必须要对数据进行标准化处理即对 样本数据进行零均值化后再 除以数据 的标准差,保 证处理后的每一个变量的数据均值 为 0,方差为 1,以消除过程参数及质量指标间量纲不一致对数据分 析造成的影响 2 1 3 P L S成分数 目的确定与回归建模 确定 P L S成分数目的常用方法是交叉验证法,其主要思想是:(1)先取出 S 个样本点,将原始的 个样本点分成两部分,即用于回归建模 的数据(S个样本点)和用于预测校验的数据(S个样本点)(2)用 S个样本点根据给定的 P L S成分数 目,建立回归模型,计算出 s 个样本的预测值,并求出预 测误
11、差(3)用抽样测试 的方法重复上述两步,得 出总的平均预测误差;如果新增 了成分数 目并没有 明显减少总的平均预测误差,则应舍弃最后新增的 成分 P L S成分数 目确定后,即可根据偏最小二乘的 算法步骤求出式(5)中的 B 和 c,得到回归模型 2 1 4 基于回归模型的产品质量预测 建立工艺参数与产品质量 回归模型后,即可根 据式(5),利用工艺过程参数的回归系数对产品质量 进行 预测 2 1 5 对模型的精度评价 评价 回归建模方法的常用指标是复相关 系数,它是反映一个因变量和多个 自变量之间相关程度的 指标,取值在 0到 1之 间复相关 系数越接近 1表 明该因变量和多个 自变量之间相
12、关程度越显著,回 归模型越适用 R=Q U (8)式中,R表示复 相关系 数,Q=(一 )为回 =1 归平方和,U=(一 )为总偏差平方和,=1 表示预测值,表示真值,表示 真值 的平均值,表示预测样本数 此外,评价回归模型预测精度的常用指标是预 测 误 差 平 方 和(p r e d i c t i o n e r r o r s u m o f s q u a r e s,P E S S):P E S S=(多 )(9)=1 预测误差平方和越小,表 明该模型具有越高的 预测精度 2 2 热镀锌带钢力学性能的质量监控 本文以鞍钢股份有限公司某带钢热镀锌生产线 的实际生产数据作为数据样本空 间
13、,以某结构钢为 研究对象,共收集到 4 9 0个样本,每个样本包括一卷 带钢的原板化学成分(如碳、硅、锰、磷、硫、钛等化学 元素的含量)、带钢退火温度(实验 中所取数据为带 钢在退火炉区均热段 出I;1 平均温度,即影响晶粒 回 复和再结晶的决定性温度)、光整延伸率、光整轧制 力以及镀锌板成品的力学性能数据(如屈服强度、抗 拉强度、断裂延伸率、塑性 应变 比和应变硬化指数 维普资讯 http:/ 第6期 姚林等:基于偏最I J -乘回归模型的带钢热镀锌质量监控方法 等)一 数据样本的统计结果如表 1所示 根据交叉验 证法,取 P L S成分 的数 目为 5,运用偏最小二乘回归 建模得到的回归系
14、数如表 2所示回归模型中对各 质量指标的复相关系数分别为:屈服强度 9 5 9 2,抗拉强度 9 3 7 5,断裂延伸率 8 5 8 5,塑性 应变 比 7 4 0 4,应变硬化指数 8 4 8 9 从复相关系数 可以看出,回归模型具有较好的建模精度 表 1 样本数据统计结果 T a b l e 1 S t a t i s t i c a l r e s u l t s o f s a mp l e d a t a 输 出量 c质量分 数s i 质量分 数 Mn质量分 数 P质量分数 s质量分数Ti 质量分数 退火温度 光整轧制力光整延伸率 借助回归系数可以定性和定量地分析工艺参数 对产品质量
15、的影响程度及影响方式 回归系数绝对 值越大,表示影响程度越大;反之,回归系数 的绝对 值越小,则表示影响程度越小回归系数的符号为 正,表示过程参数对质量指标的影响为正相关,即质 量指标随着过程参数的变大而变大;反之,回归系数 的符号为负,表示过程参数对质量指标的影响为负 相关,即质量指标随着过程参数 的变大而变小如 果 回归系数绝对值较小,即影响程度很小时,其符号 的正负容易随数据的波动而变化 从 回归系数上看,碳、硅、锰、磷、硫、钛等化学元 素的含量对带钢力学性能的影响与金属学工艺原理 和实际生产经验基本吻合 原板的化学成分在上游 工序中就 已确定,在带钢热镀锌 的生产工 艺中已经 很难改变
16、,因此原板化学成分的回归系数所反映的 主要是上游工序对热镀锌带钢力学性能的影响因 为样本数据来 自于相对稳定 的实际生产过程,带钢 退火温度的波动都是在热镀锌带钢退火工艺规定的 范围之内 所以,带钢退火温度 的回归系数较小,其 含义是在工艺规程范围内带钢退火温度的波动对带 钢力学性能的影响 比较小,也说明在生产过程中对 带钢退火温度的控制能力较好,这与实际 的生产情 况是相 吻合的而光整轧制力的 回归系数较大,说 明在样本数据所对应 的实际生产过程中,光整轧制 力的波动对带钢力学性能的波动影响较大,也说明 在生产过程中对光整轧制力的控制能力较差,应该 在人员、设备、工艺、原料、环境等各种生产要
17、素中找 出薄弱环节,加以改善,以提高对光整轧制力的生产 维普资讯 http:/ 北京科技大学学报 第 2 9卷 过程控制能力,进而提高产品质量的控制能力 模型的回归精度代表 了对学习样本的拟 合程 度,预测精度代表了模型的泛化能力为分析 回归 模型的预测精度,采用分批交叉验证方法,将 4 9 0个 样本平均分成 7组,每组 7 0个样本,分别 用偏最小 二乘回归方法和多元线性 回归方法建模,进行 7次 预测实验,每次选其中的 6组作为回归数据集,剩下 的 1 组作为检验数据集,最终可以得到所有数据 总 的预测误差平方和 P E S S,结果如表 3所示 从表 3 中可以看出,偏最小二乘 回归模
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 最小 回归 模型 带钢 镀锌 质量 监控 方法
限制150内