茶籽含油量高光谱检测技术研究.pdf
《茶籽含油量高光谱检测技术研究.pdf》由会员分享,可在线阅读,更多相关《茶籽含油量高光谱检测技术研究.pdf(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 茶籽含油量高光谱检测技术研究 摘 要:为了研究油茶籽含油量高光谱检测技术,本试验采用了神经网络、主成分分析法、偏最小二乘法等算法,分析处理了油茶籽的高光谱数据,提取相应特征值(面积参数)。对高光谱数据进行建模,通过模型预测油茶籽含油量的面积参数。通过预测面积与实际面积的偏差值,评价所建模型的预测能力。研究包括使用 FieldSpec HH 2 光谱仪测出 27 组油茶籽光谱,然后使用气相色谱法对样品进行标定,从而得到高光谱模型和实际含油量的对应关系,并进行外部验证。其具备对预测集油茶籽含油量的检测。关键词:近红外;ANN 神经网络;主成分分析;偏最小二乘法 2 Research on Det
2、ection of Camellia Oilfera Abel Seed Oleaginousness by Hyperspectral Technology Abstract:Artificial neural network,principal component analysis,partial least squares etc.were used to analyze the hyper spectral data of oil tea camellia for the research on detection of Camellia Oilfera Abel seeds olea
3、ginousness by hyper spectral technology,extracting the appropriate characteristics(area parameters).As a result,a model was built to predict the area parameters of oil tea camellia seed oleaginousness successfully and to study the deviation of the forecast area and actual area,to evaluate the predic
4、tive ability of the model.The result proved the model was capable to achieve the detection of camellia seed oil content This approach was composed of four major procedures:Measuring spectrum corresponding to the 27 group of seed by the Field Spec HH2 hyper spectral instrument,Quantitative analysis o
5、f the sample by gas chromatography technology,Building a model of the correspondence between oleaginousness and spectral data and recalibrating externally.Especially,a novel methodology,model based on spectral analysis method,was proposed to accomplish measuring the obscured oleaginousness of Camell
6、ia Oilfera Abel seed by utilizing the property of model.Key words:NIR(Near Infrared Spectroscopy);ANN(Artificial Neural Network);PCA(Principal Component Analysis);PLS(Partial Least Squares)3 目 录 摘要1 关键词1 1 前言2 1.1 课题背景2 1.1.1 油茶籽的简介2 1.1.2 含油量检测技术的目的和意义2 1.2研究进展和国内外现状2 1.3研究内容与技术路线3 1.3.1 研究内容3 1.3.
7、2 技术路线4 2 总体方案设计4 2.1近红外光谱定量分析理论依据 4 2.1.1 近红外光谱产生机理4 2.1.2 油茶籽分子光谱特性4 2.2试验原理5 2.3试验方案6 3 试验方法与过程6 3.1试验材料6 3.2样品的光谱采集7 3.3 采集的部分高光谱数据9 3.4高光谱数据处理的必要性11 4 油茶籽光谱特性12 4.1 分析软件和方法12 4.2 光谱数据预处理13 4 4.2.1 平滑处理提高信噪比13 4.2.2 峰值及峰位13 4.3 光谱数据降维17 4.3.1 PCA 降维17 4.3.2 NEWC 降维22 4.3.3 反射峰积分26 4.4 BP 神经网络建模
8、27 4.5 外部验证31 5 结束语32 参考文献33 致谢34 附录35 1 1 前言 1.1 课题背景 1.1.1 油茶籽的简介 茶油全称是油茶籽油,是油茶树(Camellia oleiferaAbel)所产富含脂肪的种子经压榨或浸提得到的植物油脂。茶油的高营养价值与其脂肪酸组成有关,茶油主要由脂肪酸组成,即油酸(C18:1)74%87%、亚油酸(C18:2)7.0%14%、饱和酸 7%11%1。故采用油茶籽油的特征指标即脂肪酸组成,作为油茶籽油真实属性的主要判定依据。茶油中油酸的含量为天然植物油中之冠,含有的亚油酸、亚麻酸等多不饱和脂肪酸为人体生长和生理活动不可缺少的必需脂肪酸,茶油食
9、用后人体的消化吸收率达97%。优质茶油富含生理活性物质甾醇、生育酚、角鲨烯等,对提高人体抗病能力,延缓衰老等有重要作用2,其市场价格大约是普通食用油的 36 倍3。1.1.2 含油量检测技术的目的和意义 随着科技的进步和人们健康意识的增强,相比食品的色香味,人们更看重食品的营养价值和安全性。消费者普遍关心的是市售品牌油、散装油、以及餐饮用油的品质。近年来出口和国内市场的食用油脂中掺伪现象也日趋严重。茶油因其种类不同、营养价值不同而价格差异很大。一些生产经营者为了获取暴利,在高价茶油籽中掺入廉价的茶油籽。甚至还有的厂家将过期变质油茶籽掺入合格油茶籽中以次充好,但茶农和消费者很难从外观上识别掺杂的
10、油茶籽。掺伪茶油籽不仅影响品质和营养成分,而且危害到茶农的利益和消费者的健康。为了保护合法生产经营者和消费者的利益,能否找到快速准确检测油茶籽品质和进行油茶籽种类鉴别的方法成为当务之急。传统的检测油茶籽含油量主要有理化检验方法、气相色谱法、高效液相色谱法及同位素比值法等方法。传统化学方法往往需要多种化学仪器和试剂,样品需要预处理,操作繁琐,耗时费力。因此,寻求出一种能快速、准确、在线、无损检测油茶籽品质的新方法对提高油茶籽市场实时质量监控能力,规范油茶籽市场,保障茶农权利等方面具有十分重要的意义。1.2 研究进展和国内外现状 国内外许多学者利用电学特性、声学特性、光学特性、声波振动特性、太赫兹
11、、核磁共振、X 射线、电子鼻、机器视觉等技术对种子的品质进行无损检测4。种子品质无损检测是在不破坏被检测种子的情况下,应用一定的检测技术和分析方法对其外部特征和内部品质加以测定,并按一定的标准对其做出评价的过程。油茶籽含油量用传 2 统的检测方法进行测量费时、费力,且内部组织成分的测定需依靠破坏性检测方法,受人工影响较大,这严重影响了对油茶籽进行快速、无损、准确的评价。因此研究快速、无损、准确的油茶籽含油量的检测技术,对推动农业的健康、持续发展,提高油茶籽的交易价格,增加果农收入,具有十分重要的现实意义。众所周知,光谱分析是自然科学中一种重要的研究手段,光谱技术能检测到被测物体的物理结构、化学
12、成分等指标。高光谱遥感技术在植被生化成分定量提取与作物农学参数估算研究上的逐步深入,高光谱数据与叶绿素含量(Chlorophyll Content,CH.C)、叶绿素密度(Chlorophyll Density,CH.D)等农学参数之间的相关关系的研究已日渐增多5。吴长山等通过微分光谱与水稻、玉米 CH.D 的相关分析,选出 CH.D 相关性高且受植被种类影响很小的特征波段,建立了统一的线性模型,模型精度达 80.6%6。国内有关含油率 NIR 模型分析的研究有油菜、玉米、黄豆、棉籽等植物油种类,如李钧等研究的油菜籽含油量 NIR模型的内部交叉验证的决定系数和均方差分别为 0.98 为 0.7
13、557。方彦等建立的玉米NIR 模型其定标集、检验集的相关系数分别为 0.958 和 0.9578。这些模型都有很好的预测结果,为近红外光谱分析技术在植物油含量的快速检测奠定良好的理论基础。原姣姣等人1通以索氏提取法分析了30份油茶籽的含油量,通过多种预处理方法和回归方法建立了较精准的分析模型。其校正相关系数(RC)0.92567、外部验证系数(r)0.8978 其最优波段为 4200.204088.35 cm-1和 4666.894639.89 cm-1。这模型为高光谱检测技术的发展起到了积极的意义。近红外光谱定量和定性分析在农副产品及食品的研究方面有较广泛的研究,而关于高光谱在油茶籽品质检
14、测与掺假鉴别分析尚无较深入的研究。1.3 研究内容与技术路线 1.3.1 研究内容 该课题研究目标是:采用不同的高光谱预处理,降维方法建模,得出最佳模型。具体的研究内容包括:(1)收集油茶籽样品,其中包括了含油量差别较大的品种。使茶油籽含油量的变幅尽可能包含待检测茶油籽的含油量,便于选出有代表性的样品参加标定计算。(2)采集油茶籽的高光谱。(3)对高光谱进行预处理,提高信噪比。(4)降维处理,便于软件分析。(5)特征值提取,对高光谱进行主成分分析,NEWC 和积分面积处理,提取其特 3 征值。(6)使用 BP 网络对高光谱进行建模。(7)外部验证,验证模型的可行性。1.3.2技术路线(1)选择
15、有代表性的校正集样本,并测量其近红外光谱。(2)采用气相色谱法进行化学成分标定。(3)根据测量的光谱和化学数据通过合理的化学计量学方法建立校正模型。(4)根据校正模型对预测集样品的组成及性质进行测定。2 总体方案设计 2.1 近红外光谱定量分析理论依据 2.1.1 近红外光谱产生机理 在分子中,如果成键的两个原子的正负电荷中心不重合,这两个原子就形成一对电偶极子9。电偶极子以一定的频率振动时,能吸收光子,因而会对吸收谱产生影响。若某物质中的原子完全非极性且完全对称,该物质在不同波长处的吸收就相等,吸收谱就会是一条直线10。实际中的分子并非如此,其吸收谱中的每一波峰或每一波谷都反映了分子的组成结
16、构特征。这就是光谱分析的物理基础。近红外波段的吸收一般是由质量最小的氢原子 H 引起。氢原子不仅能引起分子的基频吸收,还会产生非简谐振动并引起较强的倍频吸收11。H 基频吸收在 28003700cm-1,绝大多数倍频在 450025000cm-1,(约 4002200nm)内,40005500cm-1(约18002500nm)为合频区域。H 的基频和倍频与分子中的其它振动会产生了遍布整个近红外区域的合频吸收12。每个分子都会有许多个吸收带,吸收带的强弱还受分子浓度的影响,这是利用近红外光谱分析样品的浓度的化学基础13。2.1.2 油茶籽分子光谱特性 查找相关文献和化学分析方法,确定油茶籽中的主
17、要成份为油酸1。根据红外光谱的波数范围为 1280010 cm-1(0.751000um)。近红外区处于可见区和中红外之间,吸收带主要是由低能电子跃进、含氢原子团(如 O-H、N-H、C-H)伸缩振动的倍频及组合频吸收。基于 O-H 伸缩振动的第一泛音吸收带出现在 7100 cm-1,可以测定各种试剂中的水分,以及甘油、肼、发烟硝酸等14,可以定量测定酚、醇、有机酸等。基于羟基伸缩的第一泛音吸收带出现在 33303600 cm-1,可以测定酯、酮。它的测量准确度与紫外、可见吸收光谱相当15。另外,漫反射可测定未处理的固体和液体试样,例如油茶籽16。4 在通常情况下,分子都处于基态振动,一般极性
18、分子吸收红外光主要属于从基态到第一激发态之间的跃迁,其振动能量变化为 /2/khE (1)对应的谱带称为基频反射带或基本振动谱带,若用波数表示,可以表示成 /1370 k(cm-1)(2)其中由公式(2)可见键力常数 k 应采用 N.cm-1为单位,而 应采用原子质量单位(u)为单位。由公式(2)可见理论上油茶籽的油酸 C18H34O2的基频为:/k1370 =1370*sqrt(5.1/(18*12+34+32)*(18+34+2)=1353.873167 cm-1 根据这个公式可以测量各种类型的化学键力常数 k,一般来说单键常数的平均值约为 5N.cm-1,而双键和三键的键力常数分别大约是
19、此值的两倍和三倍17。相反可以利用实验得到的键力常数的平均值估算吸收频率应为 2993cm-1而实际光谱实际测值为2885cm-1。由公式(2)可见化学键的力常数 k 越大,原子折合的质量 就越小,则原子间的振动频率就越高,吸收峰将出现在高波数区;反之,将出现在低波数区18。例如,叁键双键单键,吸收峰出现的位置不同;叁键(2222cm-1)双键(1667cm-1)单键(1429cm-1)此外多原子分子的振动,不仅包括双原子分子沿核-核的伸缩运动,还有键角渗入的各种可能的变形振动:伸缩运动和变形运动19。综上所述,油茶籽分子这种多原子分子,由于组成原子数目增多,加之分子原子排布情况的不同,及组成
20、分子的键或基团和空间结构的不同,其振动光谱远比双原子复杂得多20,。故其光谱数据具有很多的变量。因此在分析油茶籽高光谱数据时,需对其进行优化,分离出相应分子的高光谱值,才能建立相应的模型。2.2 试验原理 本试验主要是检测油茶籽油脂肪酸含量。采用 NIR 数据结合气相色谱法测定的含量,建立高光谱与含油量的模型,从而达到快速用 NIR 测量油茶籽的含油量,甄别油茶籽的优劣属性20。高光谱的数据与油茶籽分子振动有密切的关系。分子的振动自由度可以通过红外光谱的吸收峰来体现。从原则上讲,每一个振动自由度相当于红外区的一个吸收峰,但实际的红外吸收峰的数目常少于振动自由度的数目。因为不伴随偶极变化的振动没
21、 5 有红外吸收峰;振动频率相同的不同振动形式会重叠。在建立油茶籽模型之前,高光谱数据需要进行预处理,然后再利用优化之后光谱,分析出其相应的特性,建立高光谱数据与含油量的模型。检测未知油茶籽含油量,测量其光谱数据,并优化处理,进行模式识别即可得到含油量。2.3 试验方案 选取 27 种相同质量,不同品种的油茶籽并编号;在相同的光照、湿度和温度下,利用高光谱分析仪测量其对应的高光谱数据并记录;使用 ViewSpec 软件中的修正功能对数据进行修正,并生成.mat 文件;用 SPSS、SAS、MATLAB 等软件进行 PCA、NEWC、积分面积等分析,得到油茶籽的特性;使用气相色谱法对其进行含油量
22、定标;结合实际油茶籽的含油量和高光谱数据特征值,用 BP 神经网络等进行建模分析,建立起高光谱与含油量的相关数据处理模型,从而实现利用高光谱对样品进行含油量的检测。图 1 总体方案框图 Fig.1 Diagram of the overall program 3 试验方法与过程 3.1 试验材料(1)样品筛选。27 组油茶籽样品(产自江西南昌、湖北武汉、江西平南、徐州、淮安等,部分样品产于长沙、常德市、益阳市、等地网购)。由于不同地区的生长条件诸如土壤、光照、温湿度、肥力、季节等因数的不同,所搜集的样品包括了含油量差别较大的品种。这样才能使茶油籽含油量的变幅尽可能包含待检测茶油籽的含油量,便于
23、选出有代表性的样品参加标定计算。表 1 油茶籽的种类分布表 Table 1 Camellia species distribution table 编号 油茶籽产地 重量(500g)编号 油茶籽产地 重量(500g)1 江西南昌 1 15 湖北观音湖 2 2 湖北武汉 1 16 湖北仙居定顶 2 3 广西平南县 1 17 湖北木兰湖 2 4 徐州 1 18 湖北省阳新县 2 用已建的模型计算预测集样本的含油量 降维后的光谱和含油量建模 气相色谱法测量含油量 光谱数据 物理特性 27 组油茶籽样品 光谱使用SPSS、MATLAB等软件进行降维处理 模型的评价 6 5 淮安 1 19 湖北大悟山
24、2 编号 油茶籽产地 重量(500g)编号 油茶籽产地 重量(500g)6 山东日照 1 20 湖北小悟山 2 7 江苏宿迁 1 21 上海 1 8 广东沐阳 1 22 长沙县 14 9 广东梅州 1 23 长沙葵花山庄 4 10 江苏 1 24 长沙黄花机场 14 11 湖北随州 1 25 湖南绥宁 4 12 浏阳小河中学 1 26 广西柳州 1 13 江苏花卉种植园 1 27 福建 1 14 湖北悟峰 2 (2)样品制备。由于环境温度,特别是湿度对光谱测量有较大的影响,所以必须把环境温湿度控制在一定的范围内,以保证采集光谱过程中免受温湿度变化的影响。油茶籽中的水分对其他成分的标定的影响不可
25、忽视,因为水的基频吸收带为 3650cm-1、3750cm-1(-OH 的对称与不对称伸缩振动)与 1595cm-1,而-OH 的合频吸收带为5160cm-1,故应使水分严格保持一致,才能获得稳定的光谱。其具体的实施办法是将待测的各组油茶籽在测量之前同时进行干燥。3.2 样品的光谱采集 试验采用 FieldSpec HandHeld 2 光谱仪(图 2)进行实验。图 2 FieldSpec HandHeld 2 光谱仪外表结构 Fig.2 Feature of the FieldSpec HandHeld 表 2 光谱仪的外部个接口 Table 2 Import and outport of
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 含油量 光谱 检测 技术研究
限制150内