2022年近红外光谱分析技术在烟草质检质控中应用研究报告与实践.docx
精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用近红外光谱分析技术在烟草质检质控中的应用争论与实践王家俊1,陈国辉2,王保兴2,梁逸曾31 红河烟草 <集团)有限责任公司技术中心云南弥勒县桃园路 50号 652300 2 云南瑞升烟草技术 <集团)有限公司昆明市高新技术开发区科医路 41号 650106 3.中南高校化学化工学院,长沙市岳麓区麓山南路 410083 摘要: 本文主要介绍了近红外光谱技术与化学计量学方法在烟草种植、原料收购、烟叶复烤、烟叶醇化、卷烟工业制造以及其它诸如烟用材料、烟用添加剂、卷烟烟气等方面的应用争论和一些实践体会,并简要探讨了基于近红外光谱分析的数据挖掘技术在烟草品质争论中的应用;关键词: 近红外光谱法;化学计量学方法;烟草质量争论1968 年 , McClure 首 次 应 用 近 红 外 光 谱 <NIRS ) 技 术1 研 究 了 未 经 破 坏 烟 叶 的 透 射 比<transmittance properties ),标志着近红外光谱分析技术在烟草领域的应用起始;近红外光谱分析技术以其特殊的快速、无损等优势在烟草领域中的应用得到快速扩展2-9 ;国内报道始见于1995年10,随后几年,在国内烟草领域掀起了近红外光谱技术的应用争论热潮,并进一步将过程化学计量学方法与近红外光谱分析结合,不断挖掘量测数据中潜在的信息价值伺服产品质量争论,也取得了较快的进展,争论主要包括烟叶及烟气化学成分分析10-20,30 、烟叶类型识别及卷烟配方结构猜测21,22 、卷烟配方过程评判 23,24 、卷烟制丝线评判 25 等方面的争论;近几年来,笔者协同国内化学计量学专家和相关领域专家连续寻求化学计量学方法在烟草领域中的应用争论 16, 20, 23,26-34,为提高近红外光谱分析技术在烟草领域中的应用水平做了一些微薄工作,本文仅为作者的体会之谈和一些实践体会,不足之处,敬请学者同仁批判指正;1 基本思路烟草是一个复杂的多组分灰色体系<组分尚未全部清晰),品质特性的发挥与构成烟草的各组分具有协同效应,传统单变量“ 一对一 ” 的分析观念,揭示烟草品质内在规律的整体性存在肯定的局限性;面对烟草这种复杂的化学分析体系,应考虑以“系统性 ”,“ 模糊性 ” 的现代分析科学思想进行探索争论,同时引进相应的分析技术硬件,近红外光谱分析技术就是一个典型的应用实例 <见图 1),它既能应用多元校正方法 <如PLS)处理两个数据阵之间的定量关系,同时定量复杂体系中的多个组分,且实际操作简洁,分析速度快,不需消耗化学试剂;此外,应用模式识别 <如SIMCA )方法,仍可以进一步挖掘样品之间的隐含关系,这比传统方法更进一步的是,它最大限度地直接应用量测数据整体性争论样品之间的相互关系,防止了隐性信息的流失;实践说明,化学计量学方法与名师归纳总结 - - - - - - -第 1 页,共 16 页精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用现代仪器分析技术结合,对处理复杂多组分体系表达出了显著的应用价值;烟bsorbance A 0.8Signature: Not signed 8000 6000 多元校正定量多整 0.7如 PLS 组分信息 0.6体模式识别挖掘隐含品草 0.5质 0.4信 0.3如 SIMCA 品质关系息 10000 Wavenumbers cm-1NIR 光谱图 1 近红外光谱分析与化学计量学方法的应用2近红外光谱定量分析技术的应用争论及实践近些年来,笔者将近红外光谱技术结合多元校正方法<如偏最小二乘法),对烟草农业生产、工业制造以及其它诸如卷烟辅料<如卷烟纸)、填充料<如再造烟叶)、香精香料等方面涉及到的相关品质指标的定量测定作了探究争论和实践;2.1 青烟叶中氮磷钾氯的近红外测定青烟根、茎、叶中氮、磷、氯、钾的含量在判定烟株长势,优化施肥策略和改进种植技术有重要的作用,因此,快速测定青烟根、茎、叶等各个部位中氮、磷、氯、钾等的含量的对评判烤烟生长具有重要的指导意义;采纳 FT-NIR 光谱结合 PLS法建立了青烟的根、茎、叶中的氮、磷、氯、钾等含量定量校正模型 16,在实际应用中收到了较好的成效,校正模型的参数列于表 1中;表 1 测定青烟 <根、茎、叶)氮磷氯钾FT-NIR 校正模型的统计结果类别模型名称校正集相关系数最优RMSECV 猜测范畴 <%)样品数量主因子根氮514 0.9749 11 0.0860 0.802.30 氯512 0.9960 21 0.0450 0.141.35 茎钾533 0.9931 21 0.1063 0.502.80 烟氮619 0.9960 14 0.1062 0.904.80 氯580 0.9709 18 0.0968 0.701.85 叶磷432 0.9230 7 0.1860 1.002.70 钾621 0.9920 15 0.2162 1.105.80 2.2 烟叶品质指标的近红外测定将 NIRS 技术结合 PLS 应用到烟叶原料 <初烤烟叶、复烤烟叶、陈化烟叶、配方烟叶等)或卷烟制品重要品质指标 <其中涉及到的常规化学成分、有机酸类以及其它重要化学成分)的定量测定29,30 ,对评判原料质量和监测产品质量,取到了重要的作用,其建立的校正模型,数理统计参数见表 2 所列;表 2 烟叶品质指标的近红外校正模型的统计结果名师归纳总结 常模型名称校正集相关系数最优RMSECV 猜测范畴第 2 页,共 16 页样品数量主因子总 糖373 0.9918 7 0.5090 14.00-31.00 % 规仍原糖387 0.9878 8 0.5430 13.00-28.00 % 成烟 碱457 0.9968 11 0.0474 1.40-3.70 % - - - - - - -精选学习资料 - - - - - - - - - 分总 氮405 0.9844 个人资料整理仅限学习使用7 0.0475 1.60-2.80 % 挥氯415 0.9800 32 0.0063 0.06-0.22 % 钾470 0.9738 17 0.0587 1.68-2.95 % 钙424 0.9524 12 0.1100 2.50-4.38 % 镁451 0.9790 18 0.0245 0.40-1.11 % 灰 分448 0.9851 10 0.1630 9.30-14.10 % PH 值439 0.9846 11 0.0280 4.80-5.50 % 醚提物总量399 0.9405 10 0.1510 3.30-5.50 % 丁酸255 0.8519 10 0.8770 0.316-7.380 g/g戊酸255 0.7723 7 0.1770 0.670-1.960 g/g异戊酸255 0.9282 13 4.2700 5.130-52.660 g/g发己酸255 0.9407 14 0.1440 0.540-2.380 g/g性辛酸229 0.9458 10 0.0788 0.630-1.780 g/g有3-甲基戊酸245 0.9238 15 0.0719 0.518-1.500 g/g机苯甲酸254 0.9211 10 0.2530 1.984-5.240 g/g酸苯乙酸255 0.9426 11 0.5500 3.157-11.680 g/g非十六 烷 >酸255 0.9868 15 0.0627 1.060-2.648 g/g柠檬酸255 0.9438 8 0.8880 3.640-16.647 mg/g 丁二酸255 0.9240 13 0.0174 0.180-0.417 mg/g 挥苹果酸255 0.9492 11 4.0000 27.640-97.219 mg/g 发草酸255 0.8974 12 0.7080 9.446-16.980 mg/g 性马来酸254 0.9671 12 0.1910 1.220-5.290 mg/g 有亚油酸255 0.9944 16 0.0529 0.180-1.738 mg/g 机油酸255 0.9812 14 0.0877 1.040-3.000 mg/g 酸硬脂酸255 0.9805 12 0.0267 0.080-0.514 mg/g 其总挥发碱700 0.9576 0.9354 6 11 0.3410 0.0048 2.00-8.00 % 0.10-0.17 % 总挥发酸淀粉0.9785 14 0.4420 1.00-10.00 % 纤维素0.9266 10 0.6400 10.00-18.00 % 它硫酸盐0.9823 16 0.0836 0.40-3.00 % 组醚提物0.9731 11 0.2560 2.00-8.00 % -800 分中性总量多酚0.9543 14 0.1580 3.00-5.50 % 水溶性碱度0.9478 15 0.1040 0.23-1.60 % 蛋白质0.8880 12 0.2550 2.00-5.00 % 2.3 卷烟烟气指标的近红外测定 一般认为,卷烟中的总糖、总氮和烟碱等主要化学成分含量,及其燃烧时主流烟气中的焦油、烟碱和一氧化碳等释放量可作为品质指标衡量卷烟的内在品质,其中,焦油、烟碱和一氧化碳的释 放量又打算了卷烟能否入市的质量标准;按国家烟草行业标准,卷烟的内在品质检测通常分为两个 部分,一是采纳连续流淌法测定烟丝中的总氮、总糖、烟碱等主要化学成分含量;二是通过烟气分 析测定焦油、烟碱和一氧化碳的释放量;对于品牌规模化的生产,按以上方法进行大批量质检,需要较多的分析仪器,消耗大量的化学试剂,速度慢,且分析费用高;采纳PLS 结合卷烟 <烟丝制成粉末)的 FT-NIR 漫反射光谱建立了测定卷烟主流烟气中焦油、烟碱、一氧化碳释放量等的校正模型 30 ,见表 3,实际应用成效令人中意;值得留意的是,在建模时,由于卷烟辅料 <盘纸、嘴棒等)的变化,对焦油、烟碱和一氧化碳释放量有着明显的影响,所以,选入校正集的样品,应保持相应卷烟辅料特性的相应稳固,以免引入较多的背景误差;对规模较大品牌生产,本方法用于卷烟主流烟气品质指标的监控,具有良好的有用性;名师归纳总结 - - - - - - -第 3 页,共 16 页精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用表 3 卷烟主流烟气品质指标的校正模型的统计结果模型名称校正集相关系数最优RMSECV 猜测范畴 毫克 /支> 样品数量主因子焦油208 0.9505 3 0.2262 12.0-15.0 烟碱191 0.8945 5 0.0350 1.10-1.50 一氧化碳136 0.9625 4 0.3685 12.0-17.0 2.4 卷烟纸 <盘纸)理化指标的近红外测定长度为 84mm的一般卷烟,尽管卷烟纸占烟支总重量很小的比例<5%左右),但它对静态燃烧率、通风度、烟气递送量,乃至卷烟的外观特点都有较大的影响;通常,是按国标 GB/T 12655 对卷烟纸的定量、水分、透气度和灰分等进行质检;而检测这些理化指标,整个分析过程涉及较多的仪器,操作繁琐,难于满意大批量质量检测的需要;应用PLS结合卷烟纸的 FT-NIR 漫反射光谱建立了测定卷烟纸定量、厚度、透气度、水分和灰分等性质的校正模型 31,见表 4;就很简洁地实现了卷烟纸理化指标的同时快速测定;表 4 卷烟纸定量、厚度、透气度、水分和灰分等的校正模型的有关数理指标物理模型名称校正集相关系数最优主RMSECV 猜测范畴样品数量因子定量700 0.9768 7 0.5614 24.00-34.00 g/m2> 厚度500 0.9664 11 0.0950 4.20-5.40 ×10-2 mm> 51.00-66.00 CU> 指标透气度400 0.9470 15 1.2741 化学450 0.9563 5 0.0967 3.90-5.10 %> 水分指标灰分550 0.9759 16 0.2503 16.60-21.00 %> 2.5 再造烟叶品质指标的近红外测定再造烟叶是以烟梗末、烟叶末和其他烟草碎末等“下脚料 ”为主要原料,通过造纸法、辊压法或稠浆法等工艺制作的、性状接近自然烟叶的烟草薄片,是卷烟制造中内在质量可调、可控的填充物料,其内在化学成分含量打算了再造烟叶的质量优劣;对薄片质量的评判是通过测定其总糖、仍原糖、总氮和烟碱等主要指标来实现的,通常采纳传统方法 标,与测定烟叶的步骤类似,费工费时,而采纳近红外方法测定<流淌注射分析法)测定这些主要化学指 32 ,仍旧可以获得比较精确结果;无论定量何种组分,往往需要建立可行性争论模型,探讨是否可采纳近红外分析的可能性,在 实际应用中,可在可行性争论模型的基础上,进一步添加有代表性样品进入校正集,这样可获得更 为抱负的校正模型,见表 5;表 5 应用 PLS 建立再造烟叶中多种组分的有关参数设置及数理指标统计模型名称校正集相关系数最优RMSECV 猜测范畴 %> 样品数量主因子总糖544 0.9645 12 0.2500 11.00-17.00 仍原糖556 0.9727 14 0.2022 10.00-14.00 烟碱465 0.9853 22 0.0143 0.60-1.10 氯501 0.9746 12 0.0321 0.30-1.00 3 近红外定性分析技术的应用争论及实践名师归纳总结 - - - - - - -第 4 页,共 16 页精选学习资料 - - - - - - - - - 3.1 近红外光谱分析结合个人资料整理仅限学习使用MSPC应用于卷烟配方过程质量评判与监测卷烟制造是一种多品种、多批次配方模块组配的间歇过程Batch processes>,在肯定的时间内、按预先设计、优化好的工序,将不同品质特性的配方模块组配成预期质量要求的产品;所以,配方模块的稳固性和匀称性对产品质量有着重要的影响;在国内卷烟制造业中,对卷烟配方过程质量的评判与监测主要以物理质量<如填充值、含水率和烟丝宽度等)为主体,欲监测多个理化信息表征配方模块特点质量变异,就存在肯定的局限性;采纳近红外光谱分析技术与多元校正、模式识 别等方法结合,不但可同时监测配方模块的多组分定量信息,仍可以利用整体特点信息对其过程质 量的稳固性和匀称性进行评判与监测;通常, MSPC<Multivariate Statistical Process Control)技术应用于过程质量监测,主要是通过在过程正常状态下建立的多元统计模型,结合Hotelling T2、Q 等统计量建立MSPC 图,从而对过程质量进行评判与监测;然而,在实际应用过程中,采纳基于得分运算的马氏距离等统计量建立MSPC 图,仍旧可以获得中意的成效;在工况正常的条件下,采纳主成分分析-马氏距离 PCA - MD> 法结合配方模块的近红外光谱建立了不同卷烟配方模块的类模型,因类模型中各样本马氏距离的分布具有正态特性,故可利用经典的 3 方式来构造 MSPC 图,将马氏距离的掌握上限 <UCL )设定在该类平均马氏距离 <)的 +3 范畴之内,即:;就可实现对未知过程样本的马氏距离进行监测,用马氏距离对时序作图,便可反映出模块在加工过程中的质量波动情形;应用该方法可充分地提取光谱隐含的特点信息,较好地表征模块中样本点集合程度,即模块过程质量的稳定状态,有关争论见文献 23 ;将类似的方法应用于再造烟叶生产的过程质量监测,也收到了较好的应用成效,见文献34 ;方法建模外,SIMCA也是除了使用PCA-MD一种较为有用的建模手段,特殊是面对卷烟制造这一种多品种、多批次配方模块组配的间歇过程,如图 2 B 、 P 和 X 配方模块的SIMCA 分类图通过 SIMCA 分类法建立了配方过程中B、 P、X 等三个模块的类模型,见图2,通过设置合适的置信概率或风险水平,即可用类模型监测未知过程样本的距离,判别样本的质量特性归属;同时,通过建立MSPC 图,即可较为简洁地监测在加工或配方过程中 B、P、X 等三个配方模块总体质量特性的稳固状态;见图 3,其中 B 模块 50 个样本 <序号: 1-50),前 30 个批次的样本获得了正确的预报,且稳固性和匀称性较好 <与相关配方人员评吸结果吻合),后采集的 20 个样本, 15 个样本超限 <P>0.95 ), 5 个样本接近 0.95,20 个样本的距离趋势是远离模型,见图 3<a)和 <b),因后 20 个样本作了配方调整,总体评吸结果和调整前比较有明显差异,这与实测结果基本一样;在P 模块的 54 个样本 <序号: 51-104)和 X 模块的 53 个样本<序号: 105-157)中,分别有2 个和1 个样本接近0.95,其余的均未见反常,过程质量表现稳定,实测结果与实际吻合,分别见图3<c)、 <d)、 <e)和 <f);总之,监测配方过程中模块总体名师归纳总结 - - - - - - -第 5 页,共 16 页精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用质量特性的变化趋势,采纳“距离 ”和“置信度 ” 这两张掌握图基本可满意需求,且简洁直观,简洁把 握应用;但值得留意的是,卷烟制造是一个多批次配方模块组配的间歇过程,经常会遇到卷烟配方 模块烟叶 <丝)的调整和优化,这时,模块的整体特性也随之转变,必需在新的正常过程状态下,重建与之相应的类模型,才能进行有效的 MSPC 监测,有关争论见文献 24 ;图 3 B、P 和 X 等三个配方模块的 MSPC 掌握图基于分类模型建立 MSPC 图,实现的不是观测模块各组分的质量参数,而是对模块整体宏观质 量特性的监测;与此同时,如要监测模块一个或多个特定质量参数的变化,就必需捆绑预先建立的 校正模型,见文献 23所述;近红外光谱包含比较丰富的理化信息,结合多变量分析方法既可充分 利用量测信息表征过程整体质量,同时又能通过定量校正模型快速获得多组分品质信息,将近红外 光谱分析技术应用于过程质量监测、产品品质保证等方面具有较好的应用潜力;3.2烟用香精合成过程质量的近红外监测 应用近红外光谱分析仍可监测烟用香精合成过程中中间体的质量稳固状态,如某一香精是由原料途径仍原 <A 中间体)、酯化<B 中间体)、氧化<C 中间体)和热裂解<D 中间体)等步骤最终合成得到成品 <E),为了争论合成过程质量稳固性;采纳主成分分析-马氏距离法 <PCA-MD )结合各中间体合成品的近红外光谱建模 <表 6 和图 4),可以充分提取中间体样品光谱的特点信息,以马氏距离这一统计量为依据判定样本的稳固性,结合3 原理用马氏距离对时序作图,即可表征合成过程的稳固性情形;图 5 显示了合成过程中对 52 个 D 中间体监测的 MSPC 图,其中的样本 D16 和D18 远超出了阈值,分别归属到 A 类和 C 类,这就可以判定合成过程中 D16 样本的酯化过程没有完成, D18 样本的仍原、酯化作用都已顺当进行,但氧化作用受阻;有关争论见文献 33;表 6 在类模型各类中样本马氏距离的有关数理统计结果名师归纳总结 掌握点样本容量平均值 <)标准偏差 < )变异系数 <%)掌握阈值 < +3)第 6 页,共 16 页A 81 0.9495 0.2954 31.1127 1.8357 B 83 0.9600 0.2591 26.9874 1.7373 C 31 0.9543 0.2429 25.4585 1.6831 - - - - - - -精选学习资料 - - - - - - - - - D 46 0.9579 个人资料整理仅限学习使用0.2489 25.9793 1.7045 E 60 0.9609 0.2470 25.7033 1.7019 图 4 4 种中间体及成品的分类示意图 3.3近红外光谱分析用于甄别卷烟品质真伪图 5 对中间体 D 的 52 个样本的检测结果卷烟产品内在化学组分比较复杂,燃吸烟草时,构成烟草各复杂组分协同作用的结果打算了烟 草吸食的风格特点,依靠传统单一的几个质量参数,如焦油、烟气烟碱,一氧化碳等烟气化学指标来判定卷烟内在品质真伪几乎很难;由于这些单一的质量参数比较简洁“ 仿照 ” ;然而,烟草的内在复杂组分的量比关系,几乎不能“ 仿制 ” ,这些内在复杂组分以及相应的量比关系是烟草吸食风格特征的化学基础,这些特点信息大都可以通过近红外光谱表征,采纳 SIMCA 分类法结合卷烟的近红外光谱建立了不同风格特点卷烟的类模型30,较简洁的实现了卷烟内在品质真伪的甄别;很明显,是基于 PCA 的 SIMCA 模式识别方法能够最大限度地利用近红外量测数据,挖掘样品之间的特点的隐含关系所为;采纳类似的方法,也很简洁实现卷烟辅材<如盘纸)内在品质真伪的判别31 ;4 红外光谱分析技术在卷烟帮助材料质检质控中的应用争论 卷烟帮助材料,如烟用香精,对改善烟草制品的香吃味质量有着重要的作用;通常是依照行业 系列标准方法测定酸值、相对密度、折光指数和溶混度等理化指标来监控质量,一是检测步骤烦 琐,仪器较多,二是采纳有限的理化指标表征品质,信息单一,如对其宏观整体品质特点监控,就存在肯定的局限性;烟用香精是一种组成比较复杂的多组分体系,其红外光谱<4000-400 cm-1)包含着比较丰富的理化信息,特殊是在其指纹区域,是组成它们的全部组分的红外光谱的叠加;不同 特性的香精,其组分或是组重量比关系上的差异信息,最终在指纹图谱中都得到了整体表征,采纳 主成分分析 -马氏 <Mahalanobis)距离分类法对烟用香精的 FT-IR-ATR 指纹图谱进行分类建模,并 应用类模型对烟用香精配制的过程质量进行 MSPC 监测,实现了对香精整体宏观特性的监控 35 ;因 ATR 采样技术操作简洁、快速无损等优点,采纳该项分析技术结合PLS 方法对烟用香精的密度、折光指数;BOPP<Biaxially-Oriented Polypropylene )薄膜的厚度、定量和卷烟主流烟气中的烟碱量、焦油量、水分含量等质量指标作了定量争论 5 建立校正模型的一些体会36-38 ,获得了中意的结果;通过多年的实践说明,对复杂体系的多组分定量,近红外多变量校正技术的应用,突破了传统 化学方法标量分析中被认为是不行能,甚至难以想象的问题,使经典烟草化学分析实现了从长周期名师归纳总结 - - - - - - -第 7 页,共 16 页精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用离线式小批量的分析走向快速大批量的现场分析;使现场质量掌握、品质评判从定性走向定量、从 外观走向与内在的结合,获得了更为即时的数据支持;无疑,这在肯定程度上对原料品质分析与质 量掌握发挥了积极的作用,同时,数据的积存为将来深化挖掘品质的潜在信息奠定了良好的基础;对多组分体系的近红外定量分析,化学计量学中有多种多变量校正方法,如 PCR,PLS1 ,PLS2,ANN 等,通过实际应用成效对比来看,仍是 PLS1<即通常所指的 PLS)方法比较有用,拟合成效抱负,所建的模型相对稳健,猜测精确性高;近年,笔者也采纳OSC<正交信号校正)与PLS 结合建立校正模型,建模的物理思路比较清晰,简洁懂得,猜测结果与 PLS 方法相当,但 OSC-PLS 方法只有少数商业软件 <如 Umetrics 公司的 SIMCA-P +软件, Ume., Sweden>搭载;把 OSC-PLS 方法投入实际应用的企业不多;建立一个抱负校正模型,挑选样品进入校正集,应值得留意的是:样品应包含使用该模型猜测 未知样品中可能存在的全部化学组分,且样品的化学组分浓度范畴应超过使用该模型猜测未知样品 中可能遇到的浓度范畴,以保证使用模型内插进行分析;在整个变量范畴内,样品的化学浓度是均 匀分布的,且样品数量足够多,以能统计确定光谱变量与待校正组分浓度或性质之间的关系;然 而,校正所需的样品数量,以待测样品的复杂性而定;如待测样品含有较少的变化组分,较少的校 正样品便可确定光谱与组分浓度或性质之间的关系;如待测样品含有较多的变化组分,建立模型时 就需较多的校正样品;对组分复杂的化学体系,只有前期的可行性争论模型建立后,初步确定模型 所需的光谱变量,才能估量校正样品是否足够;诸如类似烟草的自然植物,由于种植生态多样,内 PCA 方法对进入校正集的样品进行探干脆分析,检查校正集是否有异 在化学组分随机易变,采纳 常的分布或聚类是特别必要的,同时初步剔除奇特样品和极为相像的样品,防止不抱负样品的产生 及不必要的参考数据 <基础数据)测定;在光谱数据的前处理方法挑选上,笔者认为中心化处理、标准化处理这两种方法成效较好;对 固体粉末,加上 MSC 或 SNV 进行处理,可降低因样品粒径大小散射引起的光谱误差,实际应用表 MSC ;平滑光谱,降噪,校正基线漂移,排除高频随机噪音,以提高光 明, SNV 的处理成效优于谱的信噪比,有利于建立较为稳健的模型,通常采纳Savitzky-Golay 或 Karl Norris 平滑滤波器,一阶微分或二阶微分进行处理,对有颜色变化的烟草样品,使用二阶微分结合 Karl Norris 平滑滤波器处理可获得抱负的建模成效,但值得留意的是,无论采纳何种平滑滤波器,窗口宽度的挑选有较强的体会性,应依据详细分析对象设定;近年,笔者也采纳小波技术对光谱进行降噪处理,建模成效令人中意;遗憾的是,大多数商业软件没有搭载小波降噪这一功能,而使其难于普及应用;在建立模型时,选取多少变量<PCR 或 PLS 中的潜变量或称主成分)用于校正是关键的一步;遗憾的是没有一个严格的、快速的方法用于变量数的选取;如所用的变量过少,未充分利用信息,就模型欠拟合,导致模型猜测精度下降;如所用的变量过多,引入不必要的噪声,就模型过拟合,将产生不稳固的猜测值,即光谱噪音水平上的微小变化将对猜测结果产生明显的转变;通常,只要 所建立的模型有足够的精度并通过有效检验,可使用较少的变量建立模型;采纳交互验证方法来评 估模型的正确变量数是一种较为有效的手段;在交互验证过程中,从光谱阵中剔除一个或多个样品名师归纳总结 - - - - - - -第 8 页,共 16 页精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用的光谱,对应的参考数据也从参考数据阵中剔除,用剩余的样品建立模型,并用来运算被剔除样品的猜测值;重复循环直至全部样品都被剔除过;将 PRESS 值<或 RMSECV 值)作为 y 轴与变量数作为 x 轴作图确定最小的 PRESS 值,函数中的最小值即为新用变量数的最大值;假如没有最小值,当 PRESS 值<RMSECV 值)约达到稳固水平的第一个点,可作为最大变量数;从理论上来说,PCR 或 PLS 的数据降维作用可以提取回来分析所需要的信息,但在实际应用中,通过优选光谱区域建模的成效要优于采纳全光谱<10000-4000 cm-1)建模的成效,在商品化的化学计量学软件中,一般都具备样品吸取光谱光度变化与性质变异相关性的统计分析功能,在校正之前,使用这些统计功能来估量校正所需的原始变量数<光谱区域)是特别有用的;有的商品化的化学计量学软件具备了“最优建模光谱区域”的挑选功能,但值得留意的是,尚如校正集中仍存在奇异样品干扰,使用这种功能来挑选最优建模光谱区域是很危急的;在应用 PLS 方法的建模过程中,如何剔除奇特样品是优化模型的一个关键步骤;奇特样本通常有两类,第一类奇特样本也称为产生强影响点的样品>,其组成、结构较为特殊或是测量仪器工作状态反常所致,其光谱不具代表性,为远离模型整体的平均光谱,常表现出残差值不肯定很大,甚至很小,但杠杆 Leverage>值较大,具有较强的相互掩蔽效应,对模型的稳健性有剧烈的扰动作用,一般可采纳马氏 <Mahalanobis)距离、杠杆值和同学化残差等指标联合诊断,并在交互校验过程中逐步剔除,循环校正,进而确定建模的最优主因子数;其次类奇特样品是由来自参考数据的测定误差较大所致,对回来分析影响明显,一般通过残差分析,比较简洁剔除,或再次测定样品参考数据进行修正;对线性校正方法,平均来说,每个样品奉献了光谱变量的 k/n, k 为回来中的变量数<MLR 中的波长、 PCR 或 PLS 中的潜变量或称主成分),n 为校正样品的个数;对于杠杆值大于3k/n 的样品,其光谱变量对回来具有显著的奉献;在校正时应从校正集中剔除,并重建模型;时常,对新模型仍会识别出额外杠杆值大于3k/n 的光谱;这种情形发生最可能的缘由是样品的剔除引起 k 值减小,也可能是由于校正样品数量的转变引起多元空间的转变;假如重复应用 3k/n 规章继 续识别奇特样品,该检测称为“ 滚雪球 ” ;如 “ 滚雪球 ” 现象发生了,说明校正集的光谱数据结构可能 显现问题;应检查模型的变量空间是否有反常分布或聚类;故,在建模之前,对进入校正集的样本 进行 PCA 或 HCA 探干脆分析是特别有益的;校正模型在应用之前,必需验证模型的有效性,验证校正模型应使用独立的验证样品集来完 t 检验 <a=5% )来估量 成,并对这些样品的猜测值与已知参考数据进行统计学比较,一般采纳配对 两者的差异;验证校正模型,对验证样品集的挑选,应值得留意的是:样品应包含使用该模型猜测 未知样品中可能存在的全部化学组成,验证样品仍应当掩盖模型建立时的浓度或性质变化范畴,其 浓度和性质值在整个范畴内尽可能是匀称分布的,且掩盖模型建立时间谱变量的变化范畴;验证样品不得含奇特样品,数量最好不低于30 个;在测量和猜测验证样品集的光谱时,应当使用与采集校正样品集光谱完全一样的步骤采集验证样品的光谱;验证样品的参考数据也应使用测定校正样品 所用的参考方法;对现有模型增加校正样品以增强模型的适用范畴是极为常见的;可能新的校正样品含有与原先名师归纳总结 - - - - - - -第 9 页,共 16 页精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用校正样品相同的组分,但有更极端的浓度;也可能新的校正样品含有原先校正样品中不存在的新组 分;假如添加的样品扩大了模型的掩盖范畴,就需加入多个新类型的样品,否就,添加的样品将被 当作奇特样品被剔除;模型更新后,必需重新对其进行验证;对验证更新模型的样品要求同于原先 模型;可将验证原先模型的光谱用于更新模型的验证,对更新模型,验证集加入新样品的百分比至 少与校正集加入新样品的百分比相同;模型传递是在一台光谱仪上采集光谱数据建立的模型通过可能的调整可对另一台光谱仪上采集 的光谱进行猜测的过程;实现模型传递需要在两台仪器上同时测量一些共同样品的光谱,建立用于 光谱或模型的转换函数,在实际中,应用工程师特别难操作,不易实现;目前,模型传递方法始终 是化学计量学专家的争论热点,方法层出不穷,也很少有商业软件搭载模型传递所需要的运算程 序;仪器标准化是指在其次台光