基于机器学习的冰川自动分类方法研究
Posted 对地观测水循环与全球变化
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于机器学习的冰川自动分类方法研究相关的知识,希望对你有一定的参考价值。
2019年2月,中国科学院空天信息创新研究院张静潇博士生(第一作者)、贾立研究员(通讯作者)等共同撰写的题为“Glacier Facies Mapping Using a Machine-Learning Algorithm: The Parlung Zangbo Basin Case Study”的研究论文发表于Remote Sensing(IF=4.509,中科院2区)。本研究得到了中国科学院战略性先导专项项目、中国科学院国际伙伴计划项目及国家自然科学基金项目等共同资助。
该研究发展了基于机器学习并融合多时相影像信息的冰川边界及冰川表碛特征的自动提取方法,获取了藏东南地区表碛覆盖冰川(表面覆盖沙、石、岩屑堆积物的冰川)和无表碛覆盖冰川的空间分布信息。结果表明:1)冰川分类结果取得了较好的精度;2)表碛全覆盖型冰川大约占该区域冰川总面积的20.7%,主要分布在海拔4600m - 4800m范围之间;3)小规模冰川(面积<1km²)主要分布在低海拔地;4)地形坡度在20° - 30°范围内的冰川面积最大且数量最多,42.1%的冰川分布在东北坡和北坡。
本研究以青藏高原东南帕隆藏布流域为研究区,该区域是中国西部海洋性冰川集中分布的重要地区之一。本研究将研究区冰川区域分为裸冰川、混合型表碛冰川、表碛全覆盖型冰川、阴影区冰川,将非冰川区分为裸地、水体、植被、山体阴影、云和其它土地覆盖类型。研究区地理位置如图1所示。
本研究使用的数据包括2015年多时相Landsat-8卫星影像、GF-1卫星影像、多源数字高程模型(包括三种DEM数据:ASTER GDEM V2,30m;SRTM DEM,30m;TanDEM-X DEM,90m)。
图1 青藏高原东南帕隆藏布流域的研究区地理位置图
本研究以冰川为主要研究对象,通过结合地形、光谱和纹理特征分析的机器学习分类方法(随机森林)对帕隆藏布流域高山冰川边界进行自动提取并进行表碛及无表碛覆盖冰川分类。研究方法主要包括两部分:(1)对数据进行预处理后,结合光谱、地形和纹理特征分析并利用随机森林方法进行冰川分类。(2)将年内多期影像的冰川分类结果进行叠加,并利用收集的验证样本进行精度分析。具体技术流程如图2所示。
图2 总体技术流程图
1. 分类特征的重要性评估
随机森林分类器可以对输入的分类特征的重要性进行评估,结果如下所示。在本研究的冰川(表碛及非表碛)信息提取和分类中,地表温度是所有分类特征中最重要的输入特征,其次是高程和NDWI (归一化水体指数)。12个地形特征中最重要的4个特征是高程、坡度、阴影地貌和绝对高程变化。此外,Landsat-8影像每个波段的平均值纹理特征比其它纹理特征更重要(图3)。
图3 a. 随机森林分类中各个特征的归一化特征重要性;b. Landsat-8各波段的8个纹理特征的归一化特征重要性
2. 分类结果与精度评价
基于随机森林算法的分类结果可以很好地提取冰川覆盖及其它土地覆盖类型的空间分布,并能较好区分表碛覆盖冰川和无表碛覆盖冰川。通过叠加同年不同时相卫星影像的冰川边界结果,可以消除云覆盖的影响和消除错分的冻结湖泊(湖冰),并将季节性降雪的影响降至最低(图4)。从精度验证指标来看,分类结果能够取得较好的精度,总体精度为98.6%,Kappa系数为0.98。
图 4 a. 初步分类结果;b. 多时相影像叠加后的最终分类结果
3. 冰川分布特征
分类结果表明,研究区冰川规模等级越小,所占总面积越小,冰川数量越多。小规模冰川(面积<1km²)的冰川数量之和占冰川总数量的88.3%,但其冰川面积仅占该区域冰川总面积的9.4%。并且,小规模冰川(<1km²)主要分布在低海拔地区。大部分冰川的坡度在20° - 30°范围内,且42.1%的冰川分布在东北坡和北坡。表碛全覆盖型冰川大约占该区域冰川总面积的20.7%,主要分布在海拔4600m - 4800m范围内;而无表碛覆盖冰川主要分布在海拔5200m - 5400m范围内。
图 5 a. 研究区不同规模冰川数量、面积和平均高程分布; b. 不同坡度冰川数量和面积分布; c. 不同坡向冰川数量和面积分布
图 6 a. 研究区冰川高程分布; b. 不同高程无表碛覆盖冰川、表碛覆盖冰川和总冰川分布
本研究结合地物光谱、地表温度、地形和纹理特征分析,通过机器学习分类方法(随机森林)对研究区无表碛覆盖冰川和表碛覆盖冰川进行自动识别,该算法基于多时相影像有效地减少了云层和季节性积雪对冰川信息提取的影响,获取了藏东南帕隆藏布地区无表碛覆盖冰川和表碛覆盖冰川的空间分布信息。精度验证的结果显示,分类结果取得了较好的精度。结果表明:研究区共有1476条冰川(面积>0.01km²),总面积为2011.32km²。其中,表碛全覆盖型冰川大约占该区域冰川总面积的20.7%,主要分布在海拔4600m - 4800m范围内。小规模冰川(面积<1km²)主要分布在低海拔地区。坡度在20° - 30°范围内的冰川面积最大且数量最多,42.1%的冰川分布在东北坡和北坡。通过讨论分析可知,本研究方法的不确定性主要在于训练样本的选取和DEM数据的精度两方面。引入更丰富的实测样本和高精度的DEM数据将有助于提高表碛覆盖冰川的分类精度。
引用格式:Zhang J., Jia L., Menenti M., Hu G. Glacier Facies Mapping Using a Machine-Learning Algorithm: The Parlung Zangbo Basin Case Study. Remote Sensing, 2019, 11, 452. doi: 10.3390/rs11040452
供稿 / 张静潇 制作 / 曾业隆 审核 / 蒋敏 指导 / 贾立
戳“阅读原文”我们一起进步
以上是关于基于机器学习的冰川自动分类方法研究的主要内容,如果未能解决你的问题,请参考以下文章