基于支持向量机方法的土地退化信息提取

发布网友 发布时间:2022-04-24 02:24

我来回答

1个回答

热心网友 时间:2022-04-18 07:00

研究区土地具有明显的侵蚀特征,基于野外调查,确定为无退化土地类型和三种退化类型:

1)轻度退化类型:土壤质地以砂壤土为主,部分表土被搬运,受地面径流和片蚀影响,例如种植农作物的黄土洼川坝地和果园地等。

2) 中度退化类型: 土壤质地以壤砂土为主,大部分表土被运移,植被稀疏处主要受细沟侵蚀即线蚀,也受地面径流和片蚀影响; 植被覆盖以牧草和灌木林为主,主要为牧草地和灌木覆盖度较高的山坡。

3) 高度退化类型: 土壤质地以沙土为主,全部表土和部分亚表土或底土被搬移,表面受细沟、冲沟、塌堤等侵蚀影响,主要位于植被覆盖度低的肋型墚顶,以及植被覆盖度较低 ( <5%) 的沙土地 ( 图 3 -6) 。

图 3 -6 土地退化的不同类型

( 一) 土地退化监测指标体系建立

土地退化的发生和分布与区域气候、地形、地貌、土壤质地、水文状况等方面密切相关,因此需要综合考虑不同因素,结合横山县地处农牧交错地带的地理特征,以及植被退化和土壤退化对当地生产、生活和经济发展的影响,选择能够突出反映研究区土地退化特征并对土地退化影响最大的指标 ( 表 3 -3) 。

表 3 -3 评价因子的选择

董荣万等 ( 1998) 提出了植被覆盖度与土壤侵蚀量的计算模型,具体表达式如下:

退化废弃地遥感信息提取研究

式中: M 为土壤平均侵蚀量; X 为植被覆盖度 ( %) 。计算公式为 ,此模型在本研究中被定义为土壤侵蚀指数 ( Soil Erosion Index,SEI) 。

Huete ( 1988) 提出了土壤调整植被指数 ( Soil-Adjusted Vegetation Index,SAVI) ,在高光谱 Hyperion 数据中,它的计算公式如下:

退化废弃地遥感信息提取研究

式中: ρ 为反射率; L 为调整参数,其作用是消除 ( 或减小) 植被反射率中土壤光学性质以及背景的影响,从而达到增强植被信息的目的。L 值的确定需要较多先验知识,Huete( 1988) 研究表明当 L 取 0. 5 时,能够很好地消除 ( 减少) 土壤背景的影响。本研究的 L取 0. 5,进行 SAVI 计算。

为进一步消除土壤背景的影响,突出植被特征,Qi 等 ( 1994) 提出了改进土壤调整植被指数 ( MSAVI) ,在高光谱 Hyperion 数据当中,计算公式如下:

退化废弃地遥感信息提取研究

式中: ρ 为各个波段的反射率。

何挺 ( 2003) 在陕西省横山地区通过测量土样的水分含量,采用多元统计回归的方法与高光谱 Hyperion 数据反射率建立反演模型,此模型在本研究中定义为土壤湿度指数( Soil Moisture Index,SMI) ,它的计算公式如下:

退化废弃地遥感信息提取研究

式中: X 为反射率 ρ 的对数的一阶微分,即 X = ( lgρ) '。

上述指标从不同侧面综合反映了土地退化特征。土壤的理化性质与土壤的化学成分关系密切,土壤有机质含量高,土壤越肥沃,退化程度就越低; 植被覆盖度高 ( SAVI 和MSAVI 指数大) ,反映抗风蚀和水蚀的能力越强,地表的蒸降比越大,相应表土的土壤湿度越小,土壤旱情越严重,水土流失现象越明显,土地退化程度越高。在此,根据各指标对土地退化特征的反映情况,参考半干旱地区 MODIS 数据土地退化监测指标的标准,结合 2000 年全国 1∶ 10 万土地退化现状图以及野外实地调查与采样,最终确定出不同指标的分级阈值,建立研究区 Hyperion 高光谱数据的土地退化监测指标体系 ( 表 3 -4) 。

表 3 -4 研究区土地退化监测指标体系

( 二) 支持向量机方法与神经网络方法

1. 支持向量机方法

支持向量机方法 ( Support Vector Machines,SVM) 是建立在统计学习理论基础上的一种新兴的学习方法,应用思路充分体现了统计学习理论中关于学习过程一致性和结构风险最小化的思想,它的设计方法是在保持经验风险固定 ( 甚至为零) 的基础上最小化其置信范围 ( 彭望绿等,2002) 。SVM 的核心思想就是把学习样本非线性映射到高维核空间,在高维核空间创建具有低 VC 维的最优分类超平面,通过综合考虑经验风险和置信范围的大小,根据结构风险最小化原则确定其经验风险和置信范围,取其折中,得到风险上界最小的分类函数。

Vapnik 的统计学习理论指出,如果输出变量和输入变量之间存在一个未知但是固定的分布,要使其实际输出和理想输出之间的偏差最小,则应该遵从结构风险最小化原理。结构风险最小化就是在确定的置信范围内寻找最小经验风险。随着函数复杂度增加,置信范围会增大,而经验风险会减小。选择最小期望风险与置信之和最小的函数子集就可达到期望风险最小,这个函数子集中经验风险最小的函数即最优函数。

支持向量机方法的设计思想就是通过一个事先选择的非线性映射将处于低维空间中的向量映射到一个高维的特征空间中,然后在特征空间中构建具有较低 VC 维的最优分类超平面。如果用核函数K(Xi,X)代替上面最优超平面中的点积运算,就相当于把样本从原来所在的空间变换到了一个新的特征空间中。支持向量机方法避免了传统的广义线性分类思路带来的缺点,即在构建判别函数的时候,不是直接将低维空间中的样本向量映射到高维的特征空间中求解,而是先在原空间中对向量做某种比较(例如求点积和某种距离),然后再对其做非线性变换,直接得到高维空间中的内积结果。这样,大量的实际运算工作是在输入空间而不是在高维的特征空间中完成,因此也就避免了所谓的“维数灾难”。支持向量机方法的分类函数在形式上类同于一个神经网络,其输出结果是中间节点的线性组合,而每一个中间节点对应的是输入向量和一个支持向量的内积运算。

在支持向量机方法的应用中,采用不同的内积核函数,就能够构造不同类型的非线性分类面的学习机器。常见的内积核函数有三类:多项式核函数、径向基函数和S型内积核函数。

2.神经网络方法

神经网络方法需要对土地退化指标建立评价分级标准,根据人工神经网络建模原理,以分级标准数据和野外调查GPS定位样本作为训练样本,通过人工神经网络学习与训练,进行模拟、建模以及土地退化程度的综合评价。利用人工神经网络进行指标预测可以选择多种网络模型,一般选择最常用而且具有函数*近、模式识别、分类和预测等多功能的BP网络模型。

神经网络系统是由大量处理单元(神经元)相互连接的网络结构,能被用于多源数据的综合分析,特别是处理没有特定分布(例如正态分布)、定性的数据,这种模型已经在遥感图像分类、自然资源分析与预测及特征提取中得到广泛应用。前馈型神经网络模型(BP神经网络)是一种常用的模型。

神经元网络结构由输入层、隐含层和输出层组成,在前馈型网络模型中,第一隐含层的节点输入值等于输入层诸节点输出值的加权和,对于第一隐含层的一个节点,其网络输入值μj

退化废弃地遥感信息提取研究

式中:ωji为两个节点间的连接权重(从输入层i到它的下一层);xi为输入样本点。第j层上节点的输入值Oj采用激励函数计算:

退化废弃地遥感信息提取研究

式中:θj为阈值或偏倚,它的作用是沿着水平轴变化激励函数。θ0的作用是修改函数线形。θ0值高将会引起θj缓慢变化。

学习算法由信息的正向传播和误差的反向传播构成。在正向传播过程中,输入信息从输入层经隐含层处理,并传向输出层,每一层神经元只影响下一层神经元的输入。如果不能在输入层得到期望的输入,则转入后向传播过程,将连接权值关于误差函数的导数沿原来的连接通路返回,通过修改各层的权值以减少网络输出误差。

神经网络分辨地物的能力包含在它的权重中,在学习过程中,它们的值被迭代式调整到一种能使神经网络区分感兴趣的原型结构,神经网络的向后传递算法能使输出的所有模型的平方误差最小化,这是一种迭代渐降式算法。简单地说,学习过程就是希望网络找到一组权重和阈值系数,并使这组系数满足实际输出值与预期输出值之间的误差达到要求的精度。

在遥感影像分析应用中,需先选择一组训练样本和一组测试样本,每个样本由像元波段向量和该像元的各个成分光谱的分量组成。输入层神经元节点值由像元波段向量值指定,输出层神经元节点值由像元各个成分光谱分量指定,实验确定学习系数、动量系数、隐含层数和各个隐含层上的神经元节点数,迭代终止由测试样本精度控制 ( 同时参照训练样本的系统误差) 。

( 三) 土地退化信息提取

在 ENVI 软件中,将计算出的 6 个指标影像堆栈成一个具有 6 个波段的新影像文件,作为输入层。依据前面的土地退化监测指标体系,将 6 个指标影像按照分级的阈值进行密度分割,根据不同的退化等级,进行逻辑交集运算 ( 在 ERDAS 软件中通过空间建模实现) ,确定每种退化等级的交集范围,从而选取训练样本。

在神经网络方法中,选择隐含层层数为 1,训练的次数为 1000,RMS 均方根误差阈值为 0. 08,训练到 70 多次的时候就已经达到了误差阈值,说明分解的精度比较高。

在支持向量机模型中,选择径向基核函数 ( RBF) ,因为它适合于绝大多数的情况,并且能取得很好的效果,特别在处理具有相似波谱的不同地物类型的问题上,选取 100 为惩罚系数,0 为分类的可能阈值,运用支持向量机方法完成土地退化程度分类图。最终评价结果如图 3 -7 和图 3 -8 所示。

图 3 -7 神经网络法评价结果

图 3 -8 支持向量机法评价结果

采用 Kappa 系数和误差矩阵进行精度的评价,每个类型随机选取 100 个样本点,然后根据野外采样数据和相关影像资料,完成分类精度的评价。精度评价结果见表 3 -5。

表 3 -5 分类精度评价表

比较最终评价结果图,两者十分相似。精度评价比较结果表明,支持向量机方法的精度 ( 总体精度0. 93) 略高于神经网络模型的精度 ( 总体精度0. 88) 。通过进一步分析,两种方法在分析高度退化土地和无退化土地方面有着十分相似的结果,但是中度退化土地和轻度退化土地分类存在一些差异,比如说在神经网络模型中有 32. 48% 的中度退化土地,而在支持向量机方法中则有 38. 34% 的中度退化土地; 在神经网络模型中有 35. 43% 的轻度退化土地,而在支持向量机模型中则只有 29. 21% 的轻度退化土地,说明有可能其中一部分中度退化土地被神经网络法错分到轻度退化土地当中,导致两者最终精度存在差别。

分析其根 本 原 因,可 能 与 神 经 网 络 法 采 用 的 是 一 种 非 线 性 的 优 化 算 法 有 关( Shanmugama et al. ,2006) 。有研究表明,一般情况下,用神经网络模型进行分类,可以得到与传统方法相同甚至更高的精度,但是事实并非总是如此 ( 曾志远,2004) 。而支持向量机方法具有以下几方面的优势: 一是具有良好的理论基础,在统计学习理论的指导下,支持向量机方法可以克服其他一些机器学习方法的缺陷,例如神经网络法的 “过学习”问题。二是在结构风险最小化的指导下,使得学习机器具有良好的分类推广能力,从而使得支持向量机方法在小样本学习的条件下具有较好的学习分类效果。三是支持向量机方法将复杂的学习问题转化为高维线性空间中的简单问题来解决,增强了分类的可靠性和控制能力; 同时,通过引入核函数的思想,使得该方法适合解决特征维数较高的学习问题; 通过选择不同的核函数,还能依据不同问题选择不同解决方法,从而取得最好的效果。四是通过引入不同的优化策略,可以对支持向量机方法的训练过程进行全局优化,提高机器训练学习的效率。以上优势可能正是支持向量机方法能够获得更高制图精度的根本原因。具体来看,研究区中度与轻度退化土地占的比例较大,达到了 62. 28%,这与野外调查实际情况基本吻合,如果不采取有效的措施加以控制和保护,这两种退化土地类型都有向高度退化方向恶化的趋势。

( 四) 小结

1) 运用多指标多角度评价法,通过分析选取土壤侵蚀、植被覆盖度、土壤理化性质、土壤湿度和地形地貌等不同指标,建立研究区土地退化监测指标体系。

2) 利用支持向量机方法和神经网络法对研究区土地退化情况进行评价,结果显示支持向量机方法的精度要略高于神经网络方法,分析根本原因可能是与神经网络法本身采用的非线性的优化算法有关。另外,支持向量机方法有着许多优势,其中一点就是可以克服神经网络法中的 “过学习”问题。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com