邮件订阅
基于全球开源DEM的高程误差预测数据集
基于全球开源DEM的高程误差预测数据集说明
数据主编:中山大学王青松副教授团队
DEEP-Dataset(DEM Elevation Error Prediction Dataset, DEM高程误差预测数据集)是利用地形特征因子与高程误差的关联关系建立DEM高程误差预测模型的数据集。该数据集包括四个子数据集,分别基于中国广东省研究区域的TanDEM-X DEM和AW3D30 DEM以及澳大利亚北领地研究区域的SRTM DEM和ASTER DEM构成。其中,广东省研究区域的样本数量约为40,000,北领地研究区域的样本数约量为1,600,000。数据集中的每个样本均由10个特征组成,涵盖了地理空间、地物种类以及地表形态等特征信息。
SRTM DEM是2000年由航天飞机InSAR系统测量获得的全球数字高程模型,由美国国家测绘局和美国太空总署(National Aeronautics and Space Administration, NASA)发布,并经过多次修订和优化,其高程精度LE90(Linear Error at 90%)优于16米。ASTER GDEM是由先进星载热发射和反射辐射仪测量获得的全球数字高程模型,由日本和美国NASA合作开发并免费提供,高程精度LE95(Linear Error at 95%)优于20米。TanDEM-X DEM数据由TerraSAR-X和TanDem-X卫星组成的双星系统对地干涉测量得到。它涵盖了从南极到北极的所有地球陆地区域,高程精度LE90优于4米。AW3D30 DEM数据由日本太空发展署研制的ALOS(Advanced Land Observing Satellite)卫星搭载的全色立体测绘遥感仪仪器拍摄的立体影像制作,均方根误差(Root Mean Squard Error,RMSE)优于5米。ICESat-2即冰、云和陆地高程卫星,其搭载了先进的地形激光测高系统。ICESat-2 平面精度RMSE优于6.5 m,高程精度RMSE约为0.1 m。自产品发布以来,ATL08陆地高程数据被广泛应用于DEM误差校正和精度评定,因此在本文中作为参考数据。需要说明的是由于不同来源DEM的高程基准和精度指标定义方式存在差异,本文遵循各全球开源DEM用户手册中的精度指标定义方式。在开源DEM实际使用过程中,用户体验的产品精度往往优于用户手册给出的精度。DEM数据产品的详细信息介绍如表1所示。
表1 DEM和ICESat-2产品基本属性介绍
DEM | 传感器类型 | 空间分辨率 | 坐标系 | 覆盖范围 |
SRTM | 雷达 | 30 m | WGS84 | 56°S~60°N |
ASTER | 光学 | 30 m | WGS84 | 83°S~83°N |
TanDEM-X | 雷达 | 30 m | WGS84 | 90°S~90°N |
AW3D30 | 光学 | 30 m | WGS84 | 84°S~84°N |
ICESat-2 | 激光 | \ | WGS84 | 88°S~88°N |
本文的两个研究区域分别为中国广东省和澳大利亚北领地。如下图1和2所示。
图1 广东省区域内ICESat-2控制点分布、TanDEM-X DEM和AW3D30 DEM
图2 澳大利亚北领地区域内ICESat-2控制点分布、SRTM DEM和ASTER DEM
DEEP-Dataset构建流程包括四个部分,分别是数据预处理、特征构建、目标变量构建以及数据集评估,DEEP-Dataset构建流程如图3所示。
DEEP-Dataset的构建遵循以下步骤。首先,确认研究区域,并获取与该区域相关的DEM产品,以及相应的高精度控制点数据;然后,对采集到的DEM数据进行统一高程基准处理,对ICESat-2控制点数据进行异常值筛选和滤除处理;其次,将筛选后的控制点数据的经纬度坐标读取到表格中作为数据集地理空间特征,再提取对应位置DEM的地物覆盖数据和地形因子等作为数据集地物种类特征以及地表形态特征;接着,计算控制点和DEM产品之间的高程误差值作为目标变量,构建成以控制点经纬度坐标为索引的表格数据集,其中表格中一行代表一个样本点,包含10种特征和1个目标变量;最后,对构建好的数据集采用K-折交叉验证方法在多种先进的机器学习方法上进行验证和评估,并根据实验结果对评估后的数据集进行多次调整,从而得到更合理、更丰富和更有效的数据集。
图3 DEEP-Dataset构建流程图
表2介绍了DEEP-Dataset的四个子数据集研究区域的基本情况,DEM产品,样本数量,特征属性以及目标变量等。
表2 DEEP-Dataset介绍
研究区域 | 面积(km2) | 地形特点 | DEM | 样本数量 | 特征属性 | 目标变量 |
中国广东省 | 179 725 | 高山、丘陵、台地和平原 | TanDEM-X | 18 415 | 经度、纬度、地物种类、坡度、坡向、坡位、地形起伏度、地表粗糙度、坡度变率、坡向变率 | 高程误差 |
AW3D30 | 18 439 | |||||
澳大利亚北领地 | 1 420 968 | 平原、高原、山地和沙漠 | SRTM | 795 391 | ||
ASTER | 795 495 |
使用声明:
若在论文、学术报告中使用该数据集,请引用以下数据论文文献:
引用本文: | 余翠琳, 王青松, 钟梓炫, 张君豪, 赖涛, 黄海风. 利用全球开源数字高程模型的高程误差预测数据集[J]. 电子与信息学报. doi: 10.11999/JEIT240062 |
Citation: | YU Cuilin, WANG Qingsong, ZHONG Zixuan, ZHANG Junhao, LAI Tao, HUANG Haifeng. Elevation Error Prediction Dataset Using Global Open-source Digital Elevation Model[J]. Journal of Electronics & Information Technology. doi: 10.11999/JEIT240062 |
请关注公众号,获取验证码后下载