高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码


基于全球开源DEM的高程误差预测数据集说明

数据主编:中山大学王青松副教授团队


DEEP-DatasetDEM Elevation Error Prediction Dataset, DEM高程误差预测数据集)是利用地形特征因子与高程误差的关联关系建立DEM高程误差预测模型的数据集。该数据集包括四个子数据集,分别基于中国广东省研究区域的TanDEM-X DEMAW3D30 DEM以及澳大利亚北领地研究区域的SRTM DEMASTER DEM构成。其中,广东省研究区域的样本数量约为40,000,北领地研究区域的样本数约量为1,600,000。数据集中的每个样本均由10个特征组成,涵盖了地理空间、地物种类以及地表形态等特征信息。

SRTM DEM2000年由航天飞机InSAR系统测量获得的全球数字高程模型,由美国国家测绘局和美国太空总署(National Aeronautics and Space Administration, NASA)发布,并经过多次修订和优化,其高程精度LE90(Linear Error at 90%)优于16米。ASTER GDEM是由先进星载热发射和反射辐射仪测量获得的全球数字高程模型,由日本和美国NASA合作开发并免费提供,高程精度LE95(Linear Error at 95%)优于20米。TanDEM-X DEM数据由TerraSAR-XTanDem-X卫星组成的双星系统对地干涉测量得到。它涵盖了从南极到北极的所有地球陆地区域,高程精度LE90优于4米。AW3D30 DEM数据由日本太空发展署研制的ALOSAdvanced Land Observing Satellite)卫星搭载的全色立体测绘遥感仪仪器拍摄的立体影像制作,均方根误差(Root Mean Squard ErrorRMSE)优于5米。ICESat-2即冰、云和陆地高程卫星,其搭载了先进的地形激光测高系统。ICESat-2 平面精度RMSE优于6.5 m,高程精度RMSE约为0.1 m。自产品发布以来,ATL08陆地高程数据被广泛应用于DEM误差校正和精度评定,因此在本文中作为参考数据。需要说明的是由于不同来源DEM的高程基准和精度指标定义方式存在差异,本文遵循各全球开源DEM用户手册中的精度指标定义方式。在开源DEM实际使用过程中,用户体验的产品精度往往优于用户手册给出的精度。DEM数据产品的详细信息介绍如表1所示。

1 DEMICESat-2产品基本属性介绍

DEM

传感器类型

空间分辨率

坐标系

覆盖范围

SRTM

雷达

30 m

WGS84

56°S~60°N

ASTER

光学

30 m

WGS84

83°S~83°N

TanDEM-X

雷达

30 m

WGS84

90°S~90°N

AW3D30

光学

30 m

WGS84

84°S~84°N

ICESat-2

激光

\

WGS84

88°S~88°N

 

本文的两个研究区域分别为中国广东省和澳大利亚北领地。如下图12所示。

1 广东省区域内ICESat-2控制点分布、TanDEM-X DEMAW3D30 DEM


2 澳大利亚北领地区域内ICESat-2控制点分布、SRTM DEMASTER DEM

DEEP-Dataset构建流程包括四个部分,分别是数据预处理、特征构建、目标变量构建以及数据集评估,DEEP-Dataset构建流程如图3所示。

DEEP-Dataset的构建遵循以下步骤。首先,确认研究区域,并获取与该区域相关的DEM产品,以及相应的高精度控制点数据;然后,对采集到的DEM数据进行统一高程基准处理,对ICESat-2控制点数据进行异常值筛选和滤除处理;其次,将筛选后的控制点数据的经纬度坐标读取到表格中作为数据集地理空间特征,再提取对应位置DEM的地物覆盖数据和地形因子等作为数据集地物种类特征以及地表形态特征;接着,计算控制点和DEM产品之间的高程误差值作为目标变量,构建成以控制点经纬度坐标为索引的表格数据集,其中表格中一行代表一个样本点,包含10种特征和1个目标变量;最后,对构建好的数据集采用K-折交叉验证方法在多种先进的机器学习方法上进行验证和评估,并根据实验结果对评估后的数据集进行多次调整,从而得到更合理、更丰富和更有效的数据集。


3 DEEP-Dataset构建流程图

2介绍了DEEP-Dataset的四个子数据集研究区域的基本情况,DEM产品,样本数量,特征属性以及目标变量等。

 2  DEEP-Dataset介绍

研究区域

面积(km2

地形特点

DEM

样本数量

特征属性

目标变量

中国广东省

179 725

高山、丘陵、台地和平原

TanDEM-X

18 415

经度、纬度、地物种类、坡度、坡向、坡位、地形起伏度、地表粗糙度、坡度变率、坡向变率

高程误差

AW3D30

18 439

澳大利亚北领地

1 420 968

平原、高原、山地和沙漠

SRTM

795 391

ASTER

795 495

使用声明:
若在论文、学术报告中使用该数据集,请引用以下数据论文文献:


引用本文:余翠琳, 王青松, 钟梓炫, 张君豪, 赖涛, 黄海风. 利用全球开源数字高程模型的高程误差预测数据集[J]. 电子与信息学报. doi: 10.11999/JEIT240062 
Citation:YU Cuilin, WANG Qingsong, ZHONG Zixuan, ZHANG Junhao, LAI Tao, HUANG Haifeng. Elevation Error Prediction Dataset Using Global Open-source Digital Elevation Model[J]. Journal of Electronics & Information Technologydoi: 10.11999/JEIT240062 


下载168.36MB(6)