基于分数阶微分预处理高光谱数据的荒漠土壤有机碳含量估算-王敬哲.pdf
《基于分数阶微分预处理高光谱数据的荒漠土壤有机碳含量估算-王敬哲.pdf》由会员分享,可在线阅读,更多相关《基于分数阶微分预处理高光谱数据的荒漠土壤有机碳含量估算-王敬哲.pdf(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 32 卷 第 21 期 农 业 工 程 学 报 Vol.32 No.21 2016 年 11月 Transactions of the Chinese Society of Agricultural Engineering Nov. 2016 161 基于分数阶微分预处理高光谱数据的荒漠土壤有机碳含量估算王敬哲,塔西甫拉提特依拜,丁建丽,张 东,刘 巍 ( 1. 新疆大学资源与环境科学学院,乌鲁木齐 830046; 2. 新疆大学绿洲生态教育部重点实验室 , 乌鲁木齐 830046) 摘 要: 对光谱数据进行预处理是提升高光谱建模精度十分必要和有效的途径。为了研究分数阶微分预处理方法在高光
2、谱数据估算荒漠土壤有机碳含量中的应用,该研究以艾比湖流域为研究靶区,利用 2015 年 5 月采集的 103 个表层土壤样本的实测有机碳数据和室内测定的高光谱数据,以 0.2 阶为步长对原始光谱反射率及对应的倒数变换、对数变换、对数倒数变换、均方根变换的 0-2 阶微分进行分数阶运算预处理并研究其与土壤有机碳含量相关性,基于通过 0.01 显著性检验的特征波段对土壤有机碳含量进行偏最小二乘回归建模并进行精度分析。结果表明: 1)分数阶微分预处理可以细化土壤有机碳及其光谱反射率相关性的变化趋势; 2)各阶微分预处理后的相关系数通过显著性检验波段的数量均呈现先增后减的趋势,但波段数量最多的对应阶数
3、并不统一; 3)对数变换的 1.6 阶微分所建立的模型为最优模型,该模型的RMSEC=2.433 g/kg, R2c=0.786, RMSEP=2.263 g/kg, R2p=0.825, RPD=2.392。说明了分数阶预处理过后的模型精度和稳健性较整数阶微分有了大幅提升,并且运用在高光谱反演土壤有机碳含量上是可行的。 关键词: 土壤;有机碳;光谱分析;分数阶微分;高光谱;预处理 doi: 10.11975/j.issn.1002-6819.2016.21.021 中图分类号: TP79; S127 文献标志码: A 文章编号: 1002-6819(2016)-21-0170-09 王敬哲,
4、塔西甫拉提特依拜,丁建丽,张 东,刘 巍 . 基于分数阶微分预处理高光谱数 据的荒漠土壤有机碳含量估算J. 农业工程学报,2016,32(21):161169. doi: 10.11975/j.issn.1002-6819.2016.21.021 http:/www.tcsae.org Wang Jingzhe, TashpolatTiyip, Ding Jianli, Zhang Dong, Liu Wei. Estimation of desert soil organic carbon content based on hyperspectral data preprocessing w
5、ith fractional differentialJ. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(21): 161 169. (in Chinese with English abstract) doi :10.11975/j.issn.1002-6819.2016.21.021 http:/www.tcsae.org 0 引 言陆地生态系统碳循环是全球碳循环中的重要环节,土壤碳库是其中最大的碳库,主要由有机碳库和无机碳库两部分组成
6、1-3。有机碳库的变化对全球气候变暖、维护区域生态平衡有着极其重要的意义4。 伴随着全球气候的急剧变化,人类活动的加剧等因素造成干旱区、半干旱区土壤有机碳库的损失愈发严重,使得土壤环境性状发生变化,土壤作为陆地生态系统碳循环功能的日渐削弱5-6。土壤有机碳( soil organic carbon, SOC)的储量、密度、影响因素等研究受到广大学者的高度关注并日渐成为全球变化的热点。 近几十年,国内外学者主要就干旱、半干旱区的湿地、森林、草地、农田等不同生态系统类型的 SOC 储量及其影响因素进行了研究7-12。遥感技术特别是高光谱技术凭借其极高的光谱分辨率和其高效率、无损害、安全、 收稿日期
7、: 2016-08-27 修订日期: 2016-09-29 基金项目:国家自然科学基金( 41130531、 U1503302、 41561089) ;国家科技支撑计划项目( 2014BAC15B01) 作者简介:王敬哲,男,河南郑州人,博士生,主要研究方向为陆地遥感与全球变化。乌鲁木齐 新疆大学资源与环境科学学院、新疆大学绿洲生态教育部重点实验室, 830046。 E-mail: wjzf- 通信作者:塔西甫拉提 特依拜,男,维吾尔族,新疆伊宁人,教授,博士生导师,主要研究方向为地图学与地理信息系统。乌鲁木齐 新疆大学资源与环境科学学院、新疆大学绿洲生态教育部重点实验室, 830046。 E
8、-mail: 环保等特性而广泛应用于 SOC 含量的估算, 为 SOC 的定量研究提供了新途径13-15。杨爱霞等14采用原始及倒数对数一阶微分预处理分别利用蚁群 -区间偏最小二乘、支持向量机两种方法,建立了 4 种预测模型对艾比湖湿地的 SOC 含量进行了预测,得到了较好的预测效果。 Peng等16的研究指出基于 Savitzky-Golay 平滑,一阶导数等 8种预处理方法可以提高支持向量机回归模型反演 SOC 的精度。 Minasny 等17利用 EPO ( external parameter orthogonalisation)算法对实测的光谱数据进行预处理从而去除水分影响,对威尔
9、士地区 SOC 预测模型进行了改进并提高了其稳定性与精确度。这些针对 SOC 所建立的高光谱反演模型,主要基于原始光谱反射率、倒数、对数等变换及其一、二阶微分等光谱预处理方法所构建。但相关研究指出,对于高光谱这类具有海量信息的高维数据源,传统的整数阶微分变换会忽略其中渐变的分数阶微分信息,可能造成某些信息丢失并对有效信息的提取造成困难,建模的精度也会受到制约18-19。而分数阶微分对整数阶微分的概念进行了拓展,并在系统控制与诊断、数字滤波、信号与图像处理等领域有着较为广泛的应用20-23。在光谱分析领域,徐继刚等18指出经分数阶微分处理后的红外光谱数据相较于整数阶运算的精度有所提升。此外,张东
10、等24-25将分数阶微分应用在盐渍土高光谱数据的预处理中,表明利用分数阶微分对干旱荒漠区土壤光谱数据进行潜在信息挖掘是可取的。 基于此,本研究选取内陆干旱区湖泊艾比湖流域为万方数据农业工程学报( http:/www.tcsae.org) 2016 年 162研究靶区,利用 103 个表层土壤样品的室内高光谱数据,并结合实测 SOC 含量,研究分数阶微分预处理在高光谱数据估算荒漠 SOC 含量的可能性,以期丰富土壤高光谱数据预处理方法,提高干旱区荒漠 SOC 的高光谱预测精度,为土壤碳库等相关研究及当地精准农业提供科学支持和应用参考。 1 材料与方法 1.1 研究区概况 艾比湖流域位于亚欧大陆腹
11、地,新疆维吾尔自治区准噶尔盆地西南部;西、北、南三面环山,东接古尔班通古特沙漠,地理坐标为 82368310E, 44304509N26(图 1a)。艾比湖流域是天山北坡生态防护体系中重要的防沙、治尘功能区4-5,对区域生态环境和经济发展有着举足轻重的影响。研究区极度干旱,受西北部阿拉山口的影响, 全年 8 级以上大风达 164 d, 区域年平均气温 7.7 、年均降水量 102 mm,潜在蒸散量达 1447 mm,属北温带大陆性干旱气候。广泛分布石漠、砾漠、沙漠、盐漠、沼泽、 滩涂等。 典型土壤为灰漠土、 灰棕漠土及风沙土等27-28。 1.2 土壤样品采集与分析 土壤样品的采样时间为 20
12、15 年 5 月 18 日 -29 日,针对绿洲、荒漠及交错带等研究区典型景观特征,设置 103个 30 m 30 m 样方(图 1b) 。每个样方内,利用 GPS 记录位置后, 采用 5点混合法进行样品采集, 采样深度为 020 cm,共计 103 个土壤样品。土壤样品带回实验室后经自然风干、研磨并通过 2 mm 孔筛后分为 4 份,分别用于土壤有机碳化学分析和室内高光谱数据采集。 其中, SOC的测定采取重铬酸钾容量 -稀释热法29。 图 1 研究区位置和采样点分布 Fig.1 Location of study area and distribution of sampling site
13、s 1.3 光谱测定及预处理 土壤的光谱反射率测定使用美国 ASD( Analytical Spectral Devices)公司生产的 FieldSpec3 型光谱仪(波段范围 3502500 nm)在可控光照条件的暗室内进行。光谱的采样间隔分别为 1.4, 2 nm( 3501000 与 10002500 nm区间) ,重采样间隔为 1 nm。将制备好的 103 个土壤样品分别装入黑色盛样皿(直径 12 cm,深 1.8 cm)中,装满后将表面小心刮平。光谱测定的光源为 50 W 卤素灯,测量时距土壤样品表面 50 cm,光源的天顶角为 15,探头至测量待测样品的表面距离为 10 cm。每
14、次光谱测定之前均进行白板标定,每个样品重复测量 10 次,取 10 条光谱曲线的算术平均值作为该样品的实际光谱反射率。 1.4 数据处理与研究方法 为减少噪声影响, 剔除信噪比较低的边缘波段 ( 350 400 nm 及 24012500 nm)后,利用 Savitzky-Golay 滤波对 103 个土壤样本的 4012400 nm 的反射光谱数据进行平滑去噪,去噪后的光谱曲线如图 2 所示。 分数阶微分对整数阶微分的概念进行了扩展,是专门研究任意阶微分数学性质及应用的领域30。常用的分数阶微分运算主要基于 Grnwald-Letnikov( G-L)分数 阶微分一元函数差分表达式(式 (1
15、))来实现,其中 x 为对应点的值, v 为阶数, () 为 Gamma 函数, n 为微分上下限之差24。若阶数为 0,则表示未经微分处理即函数本身。 () ( )( 1)() ( ) ( 1) ( 2) +2(1)()!( 1)vvdfx v vfx vfx fxdxvfx nnvn ( 1)课题组利用 Java 语言,结合式( 1) ,在 Eclipse 4.5平台下开发了高光谱数据分数阶微分计算软件 V1.0(登记编号: 2016SR006487),通过该软件对 103 个土壤样品的光谱反射率 R 以及对应的倒数变换( 1/R)、对数变换 ( lgR) 、 对数倒数变换 ( 1/lgR
16、) 、 均方根变换 ()R进行 0-2 阶微分(间隔 0.2)处理。 在高光谱建模应用中,常用的方法有遗传算法,蚁群算法,偏最小二乘回归法,多元线性逐步回归法以及支持向量机回归等。其中偏最小二乘回归法汲取了主成分分析、典型相关分析和多元线性回归等方法的优点,在建模过程中通过降维、信息的综合与筛选等处理方法,极大地提高了系统对综合成分提取能力,因而在光谱数据建模中得以广泛应用。 万方数据第 21 期 王敬哲等:基于分数阶微分预处理高光谱数据的荒漠土壤有机碳含量估算 163 a. 全部样品反射率 b. 反射率均值 a. Reflectance of all samples b. Average r
17、eflectance 图 2 平滑处理后的土壤样本光谱反射率 Fig.2 Spectral reflectance of soil samples after smoothing 将 103 个样本按 SOC 含量从高到低进行排序,等间隔选取 69 个作为建模集, 34 个作为验证集,分别用于模型的建立以及精度验证。将通过显著性检验( P=0.01)的波段作为自变量,利用偏最小二乘回归法( partial least-squares regression, PLSR)建立 SOC 含量的估算模型,通过对比各模型的校正均方根误差( root mean square error of calibr
18、ation, RMSEC )、建模决定系数( determination of coefficients, R2c) 、 预测均方根误差 ( root mean square error of prediction, RMSEP) 、预测决定系数( predicting determination of coefficients, R2p) 、 相对分析误差( relative prediction deviation, RPD) ,筛选出最优模型用以研究区 SOC 含量的反演。 R2c、 R2p用以判定模型的稳定程度,越接近于 1 说明 模型的稳定性越好; RMSEC 及 RMSEP 用于表
19、征模型的准确性, 其值越小表明模型的精度越高。 另外, 当 RPD1.4 时,模型几乎不可用; 1.4 RPD 2 时,模型估算效果一般, RPD 2 时,模型具有较好的定量预测能力31。 2 结果与分析 2.1 SOC 含量统计分析 由 SOC 含量的描述性统计特征(表 1)可见,建模集和验证集对应的 SOC 含量均值分别为 12.48 和 12.33 g/kg, 变异系数分别为 53.26%和 43.22%; 研究区所有土壤样本的 SOC 含量平均值为 12.43 g/kg,变异系数为 50.22%,属中等变异程度,介于建模集和验证集 SOC含量的均值和变异系数之间。 表 1 土壤样品的有
20、机碳含量统计特征 Table 1 Statistical characteristics of organic carbon content of soil samples 样本集 Type of samples 样本数 Observations 最大值 Maximum/(gkg1) 最小值 Minimum/(gkg1) 均值 Mean/(gkg1)标准差 Standard deviation/(gkg1) 变异系数 Coefficient of variation/%全部 Whole set 103 45.47 0.40 12.43 6.24 50.22 建模集 Calibration se
21、t 69 45.47 0.40 12.48 6.64 53.26 验证集 Validation set 34 23.00 2.80 12.33 5.33 43.22 2.2 土壤光谱曲线分析 为研究 SOC 含量对土壤光谱反射率的影响,选取 5个代表性含量的土壤样本,绘制不同 SOC 含量土壤样本的光谱曲线(图 3) 。有机质为土壤重要的赋色成分,其含量高低会对土壤反射光谱产生一定影响32-33。 研究区不同 SOC 含量的土壤样本光谱反射曲线形态基本一致。且土壤样品的光谱反射率与其 SOC 含量呈负相关关系,即SOC 含量越高,土壤反射率越低,反之同理。从图 3 中可以看出,在可见光波段(
22、400 760 nm)范围内光谱曲线呈快速上升态势,在近红波段( 760 2400 nm)范围趋于平缓,并在 1413、 1952 和 2200 nm 处有 3 个较为明显的水分吸收谱段。就整体而言,除 400600 nm 波段范围和 1952 nm 波段左右,不同 SOC 含量土壤样本的光谱反射率曲线较为容易区分。 2.3 分数阶微分对波段显著性的影响 在 SOC 含量高光谱数据建模的过程中,特征波段的选取往往通过 SOC 含量与光谱反射率的相关性来确定,相 关性越强,该波段越有可能入选特征波段。因此,以光谱原始反射率 R 为例,将 SOC 含量与光谱各波段反射率的 0-2 阶微分进行相关性
23、分析,并在 0.01 水平上进行显著性检验(阈阈阈0.253),如图 4 所示。原始光谱反 射率 R 在 00.4 阶并没有相关系数通过显著性检验的波段。但是随着阶数增加, 0.6 阶时通过显著性检的波段达145 个。在 450600 nm、 14001500 nm 等相关系数呈降低趋势的波段范围,随着阶数的增加,这种趋势更为显著;而以 640700 nm 为代表等相关系数有增加趋势的波段内,伴随着阶数的增加也显得更为剧烈。这说明经过分数阶微分预处理过后的数据能够细化变化趋势并呈现出更多的信息,减少信息丢失,避免精度下降。 对原始光谱反射率 R 及其 4 种数学变换( 1/R、 lgR、1/l
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 分数 微分 预处理 光谱 数据 荒漠 土壤 有机 含量 估算 王敬哲
限制150内