基于svrm的不同氨、碱化处理玉米秸秆粗蛋白定量分析模型研究-沈维政.pdf
《基于svrm的不同氨、碱化处理玉米秸秆粗蛋白定量分析模型研究-沈维政.pdf》由会员分享,可在线阅读,更多相关《基于svrm的不同氨、碱化处理玉米秸秆粗蛋白定量分析模型研究-沈维政.pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第48卷第12期2017年12月东北农业大学学报Journal of Northeast Agricultural University48(12):68-79December 2017网络出版时间2017-12-18 13:44:50 【URLhttp:knscnkinetkcmsdetail231391S201712181344016html基于SVRM的不同氨、碱化处理玉米秸秆粗蛋白定量分析模型研究沈维政,胡枫竹,王艳,于海礁,孔庆明(东北农业大学电气与信息学院,哈尔滨150030)摘要:文章采用近红外光谱分析方法验证不同条件下氯化和碱化处理玉米秸秆粗蛋白含量测定效果。选择不同超声条件对
2、玉米秸秆样品前处理,获取54种样品,粗蛋白含量为2535 668547,依据xY残差法剔除29、30、38、51号异常样本,交互验证决定系数R2C由0679升至0840,将剩余50个样品划分为校正集(40s锄ples)及验证集(10 samples),选用OSC方法对光谱去噪处理,对比平滑处(windowsizel5),R2C由0827升至0865,选取波段9 781。1 093 cm-1作为特征波段,对比SVRM、PCR及PLS 3种粗蛋白定量分析模型,选取SVRM(C=001。Gamma=100)为最佳模型,校正集决定系数R2C为0833,RMSEC为0389,验证集决定系数R2P为091
3、4,RMSEP为0296。结果表明,近红外光谱分析方法测定玉米秸秆氨化、碱化处理后粗蛋白含量可行。关键词:玉米秸秆;氨化处理;碱化处理;SVMR;PCR中图分类号:06573 文献标志码:A 文章编号:10059369(2017)120068-12沈维政,胡枫竹,王艳,等基于SVRM的不同氨、碱化处理玉米秸秆粗蛋白定量分析模型研究【J】东北农业大学学报,2017,48(12):6879Shen Weizheng,Hu Fengzhu。Wang Yah,et a1Study on com straw crude protein quantitative analysis model with d
4、ifferentammonia and alkalization treatmentsJJournal of Northeast Agricultural University,2017,48(12):68-79(in Chinese withEnglish abstmcI)Study on corn straw crude protein quantitative analysis model withdifferent ammonia and alkalization treatmentsSHEN Weizheng,HU Fengzhu,WANG Yan,YU Haijiao,KONG Q
5、-ngming(Sch00l of Electrical Engineenng and InformaUon,NoflheastAgdcultural University,Harbin 1 50030,China)Abstract:A rapid detection method based on near infrared spectroscopy(NIR)was used toquickly vedfy the crude protein of com straw in ammoniation and alkalization under different conditionsin t
6、his paperDifferent ultrasonic conditions were selected to pretreat the com strawA total of 54samples were obtainedThe crude protein content was 25356一68547Four abnormal samples,29,30,38 and 51,were excludedThe cross validation coefficient of determination(R2C)of the remaining50 samples rose from 067
7、9 to 084All the remaining 50 samples were divided into calibration set(40samples)and test set(1 0 samples)After denoising the spectrum by way of OSC and contrasting收稿日期:20171113基金项目:国家重点研发计划项目(2016YFD070020402)作者简介:沈维政(1977一),男,教授,博士,博士生导师,研究方向为农业信息化。Email:wzshenneaueducn万方数据第12期 沈维政等:基于SVRM的不同氨、碱化处
8、理玉米秸秆粗蛋白定量分析模型研究smoothing(windowsize 1 5)R2C increased from 0827 to 0865The 9 781-1 093 cm“band wasselected as the characteristic band to compare three crude protein quantitative analysis models,SVRM,PCR and PLSFinally,SVRM(C=001,Gamma=l 00)was chosen as the best modelIts correctiondecision COeffici
9、ent R2C was 0833,RMSEC was 0389,validation set decision coefficient R2P was0914and RMSEP iS 0296The results showed that it is feasible tO use near inf怕red spectroscopyanalysis method to determine the crude protein contents of corn straw under ammoniation andalkalization conditionsKey words:com stalk
10、;ammoniaUon treatment;alkalization treatment;SVMR;PCR我国是世界秸秆产量大国,每年玉米秸秆产量达265亿t,但利用率很低。玉米秸秆是反刍动物重要粗饲料来源n,。玉米秸秆资源饲料化是现代畜牧业发展方向,但其粗蛋白含量低、中性洗涤剂纤维含量低、适口性差。玉米秸秆氨化、碱化处理技术是将一定浓度酸碱液按比例喷洒于玉米秸秆,打破纤维素、半纤维素与木质素间连接,微生物附和消化方法。玉米秸秆氨化、碱化处理具有提高粗蛋白含量,改善适口性,提高秸秆消化率、操作简单易行、成本低等特点。实际应用中,氨化与碱化处理后,秸秆粗蛋白含量是决定其饲用品质的重要指标。目前常
11、规蛋白测定方法速度慢、成本高,不适合大批量样品测定和筛选。近红外光谱分析技术作为快速无损检测方法,广泛应用于饲料及畜牧行业。Michacl等利用MRS技术建立秸秆NDF、ADF、活体外消化率及代谢能测定定标模型,各指标模型决定系数(R2)均08闭,为技术可行性奠定基础。白琪林采用PLS回归模型在国内首次建立玉米青贮样NDF、ADF、脂肪、维生素测定校正模型,定量分析模型适配性和稳定性较好,可满足玉米秸秆品质快速分析需要oI。吴军采用PLS方法建立普通品种、高油品种、高油群体玉米秸秆粉定量分析模型,明确NIRS在青贮玉米育种中应用嗍。采用近红外方法检测玉米秸秆主要成分(纤维素、半纤维素、木质素、
12、粗蛋白含量)研究较少,目前研究多集中在玉米籽粒品质快速测定。本文基于杠杆值浓度残差法,结合支持向量回归法初步建立玉米秸秆粗蛋白近红外定标模型,实现秸秆粗蛋白快速检测与模型解析,为玉米秸秆粗蛋白快速检测提供参考,为其饲用品质分析评价提供简便、准确的低成本测定方法。1 原理与方法11 SVMR支持向量回归支持向量机SVM(Support vector machine)方法是建立在SLT(Statistic learn yheory)VC(Vapnik-Chervonenkis)维理论和结构风险最小原理基础上,根据有限样本信息在模型复杂性与学习能力问寻求最佳折中,使用效果较好。SVM是新模式识别方法
13、,在小样本数、非线性和高维数据空间模式识别问题上优于传统算法。近年来,SVM已成功推广到函数逼近、信息融合等领域。最小二乘估计作为函数回归最基本工具之一,可解决最小二乘问题转化为SVM形式问题,保证函数具有最小预测风险降_9】。SVM数学模型如下:用线性回归函数厂=WX+b拟合数据k Yil,i=1,7,,茗iER问题,根据SVM理论,若采用线性占不敏感损失函数,I厂(功-yI。=I,(功一0yl一占l,(功一ylF其他引入松弛因子茧10和孝:10,则约束条件为扛?i“二+l江1,2,乃 (1)b【埘墨+一Yi占+ 。 工一 一。 最小化目标函数为,西,错沪丢卅+cn(fi+孝 (2)常数c0
14、控制对超出误差s样本惩罚程度,采用优化算法可得到其对偶问题,即约束条件,j善时-0,2,n (3)Io仪:C万方数据东北农业大学学报 第48卷对Lagrange因子a;,d:最大化目标为,形,Q)=一占i+a;)+),;(仪i-“:)一 。扛1 扣1(4) n 、-r,吉;一a:)(呼一)oi誓)。“=1得到回归模型:,=(训+6=Ori-a溉功+矿 (5)i=l其中ai,a:不为0,对应样本为支持向量,如果用核函数KGi,菇i)替代(4),(5)中内积运算可确定非线性拟合函数,(功=;一a:)Ki功+矿 (6)i=l式(5)(6)中b+取在边界上1点。12 PCR主成分回归在多元线性回归分析
15、中,自变量存在程度相关性。若相关程度较高,则各回归系数估计方差较大,无法准确解释因变量变化【101。主成分回归为多变量回归方法,可诊断自变量间共线性,首先对数据矩阵x主要成分分析(PCA),得到变量转换成新变量,再对新变量采用多元回归建模【1】主成分分析数学模型如下。x=隔,X2,X3,五r为np数据矩阵,对X奇异值分解(SVD),得到等式:x。p=以。A帅Ppp=L。,Pp。, (7)式中u为标准化得分矩阵,r为未标准化得分矩阵,P为权重矩阵,P列向量为x特征向量或主成分(PCs)。A为对角矩阵,对角线上前P个元素Ai为奇异值,是协方差矩阵xx各特征值平方根。Ai与第一个主要成分(PCI)得
16、分相关,由第一个主成分PCI所解释方差,有A,A:A。13样品采集制备及标定131样品采集制备选取东北农业大学阿城实验实习基地玉米秸秆作为试验样品,仪器为微型植物粉碎机、超声仪和50 mL离心管;化学试剂为干物质5尿素和4NaOH溶液。收获后秸秆切割成23 cm长度后备用。132标准化学标定氨化处理:干物质5尿素溶水,均匀喷洒在秸秆上,塑料袋密封,处理30 d后,72 h放氨后制样、称重。处理后将秸秆65下烘箱中烘干48 h至恒重,烘干秸秆粉碎、称重。碱化处理:取秸秆干物质4NaOH溶水,均匀喷洒于秸秆上,塑料袋中密封,处理7 d后打开,72 h放碱后制样、称重。处理后将秸秆65下烘箱中烘干4
17、8 h至恒重,烘干秸秆粉碎、称重。无处理空白样:晾晒风干秸秆,未经其他处理,称重后将秸秆65下烘箱中烘干48 h至恒重,烘干秸秆粉碎、称重。133超声波处理取过100目筛秸秆粉末在水浴条件下超声波处理。超声功率分别为60、75、90、105和120W,超声时间分别为5、10、15、20、25 min,固液比分别为1:5、1:10、1:15、1:20、1:25,容器内声功率密度分别为12、15、18、21、24 WmL。处理后烘干,密封,保证良好厌氧环境,置于室温内预处理,试验结束后测定秸秆水分、蛋白质、半纤维素、纤维素和木质素含量。经过范式法测定得到玉米秸秆粗蛋白54个样品,其中粗蛋白含量为2
18、535668547,平均值为37 15。14光谱采集试验采用Thermo公司Antaris II近红外光谱仪对玉米秸秆样本光谱扫描。秸秆样品为固体粉末,漫反射光谱扫描光谱范围4 00012 000 cm-1,对应波长范围2 500。1 000 nm,共计519个波长点,最小光谱扫描分辨率为4 cm,采用积分球扫面方式,光源为119 w厂7 Vw卤钨灯,SabIR光纤探测器,工作电压6 V,选用空气作对比对象,样品扫描前背景扫面设定64次,试验中扫描次数设定64次,横坐标为波数范围4 00012 000 cm,纵坐标为样品吸光度,扫描结果如图1所示。2结果与分析21异常样本剔除异常样品称界外样品
19、(Ouiliers),在近红外光谱分析过程中异常样品识别主要用于模型建立过程中界外样品识别和预测分析时待测样品是否为模型界外样品判断。校正过程中会出现两类异常样品:一是含有极端组成样品,成为高杠杆点样品,影响回归结果;二是参考数据与预测值在统计意义上有差异校正样品。预测过程界外样品识别主要是用来检测待测样品是否在所见校正模型覆盖范围内,确保其预测结果准确性。模型界外样品主要包括:浓度界外样品,光谱残差界外样品和最邻近距离界外样品n2】。万方数据第12期 沈维政等:基于sVRM的不同氨、碱化处理玉米秸秆粗蛋白定量分析模型研究褂萎耋波长(rm。)Wawdcnth图l玉米秸秆近红外光谱图像Fig1
20、Near infrared sp蚓image of corn触211霍特林(Hotelling)慨计采用光谱方法和常规方法对比检测不同样品测量值,也称为成对t检验,实质是判断两种方法间偏差均值(接近零)是否与期望值(零)存在显著性差异,即判断光谱方法与常规方法是否存在系统误差。霍特林个统计是重要统计方法,基于主成分分析椭圆二维模型,多用以检验多元变量稳定性,如果一个观测量主成分保持稳定,则该观测量严统计量应保持在稳定水平。检测用来判断均值与x或与真值显著性差蘸曼耋蟛异,t值按下式计算:萨堕S(8)式中,d为两种方法多测样品间对应差值平均值;S为两种方法所测样品间对应差值标准偏差;为样品数目。通
21、过显著性检测,若发现分析结果存在显著性差异,结果存在系统误差;若无显著性差异,则表明此分析结果差异来自偶然误差。本文设定缺省P值为5,由图2可知,选择临界极限5时,玉米秸秆粗蛋白模型中46、47、28、7号样品超出极限值,予以剔除。最佳主因子l(77)Factor 1(77)图2玉米秸秆粗蛋白模型主成分得分Fig2 PCA scores of corn stalk crude protein model万方数据东北农业大学学报 第48卷212 XY残差对校正模型样品xY方差分析,其中X(Residual sample X-variance)表示样品光谱,Y(Residual sample Y-
22、variance)表示样品化学数值。计算Y残差,Y方差越大,校正模型对其拟合能力越弱,雏扣解释能力越低n 31。由图3a可知,玉米秸秆粗蛋白模型中30、38号样品具有较高残差,予以剔除,对剩余50个样品再次统计残差,由图3b可知,29、51号样品具有较明显残差,剔除。样品(最佳主因子3)Samples(factor-3)a一54个样品残差统计结果aStatistical results of 54 sample residuals川JLuIL 血11IJO 10 20 30 40 50 60样品(最佳主因子3)Samples(factor一3)b一剔除30、38号后样品残差统计结果b-Stat
23、istical results of 52 sample residuals图3玉米秸秆粗蛋白模型xY残差统计结果Fig3 XY residual statistical results of corn straw crude protein model213 3D视图分析除采用Y方差判断异常样本外,Leverage也是重要异常样本判定方法,可弥Sh Y方差判定单一性不足,本文采用Residual sample Xvariance作为x轴,Leverage作为Y轴,Residual sample Y-variance作为z轴3D视图方法判定。该方法工作原理:计算校正模型杠杆值。其中杠杆值用于检
24、测样品是否远离该模型描述空间中心有效,高杠杆值样品为异常值。计算校正模型xY残差residual。建立Residual sample Xvariance作为x轴,Leverage作为Y轴,Residual sample Yvariance作为z轴3D模型。由图4可知,大部分样品均匀分布在3D视图圆心处,但部分样品距离圆心较远,距离较远样品杠杆值及xY方差较大。30、38及29、51号样品明显距离圆心较远,综合3个方向数值判定4个样品可剔除。42O86420l11OOO00o岳盘矗面一涮鼷净万方数据第12期 沈维政等:基于SVRM的不同氨、碱化处理玉米秸秆粗蛋白定量分析模型研究咯婪翻j苴a-54
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 svrm 不同 碱化 处理 玉米 秸秆 蛋白 定量分析 模型 研究 沈维政
限制150内