
Citation: | REN Junyu, YU Ningning, ZHOU Chengwei, SHI Zhiguo, CHEN Jiming. DroneRFb-DIR: An RF Signal Dataset for Non-cooperative Drone Individual Identification[J]. Journal of Electronics & Information Technology. doi: 10.11999/JEIT240804 |
在2024年3月全国两会中,低空经济首次被写入政府工作报告。两会提出要发展新质生产力,积极培育新兴产业和未来产业,打造低空经济等新增长引擎。随着低空领域技术的不断创新,低空智联网(Low Altitude Intelligent Network, LAIN)作为一种新质生产力,成为发展低空经济、防护低空安全、提升网络空间监管与治理能力的重要途径[1]。LAIN依托3 km以下范围的空域,集成先进的无人机(Unmanned Aerial Vehicle, UAV)技术、通信技术、人工智能以及大数据处理能力,推动移动通信网络朝着智能化、数字化方向稳步发展,为智能交通、农业、环境监测、公共安全等领域提供更加可靠、高效的数据支持,促进低空经济产业的发展以及低空经济与数字经济的深度融合。作为LAIN的重要组成和技术支撑,UAV以其低成本、操作灵活、按需部署等优势,在军事、工业等领域发挥着不可或缺的作用[2–4]。首先,UAV能够快速响应需求,收集实时数据信息,为生产管理和质量控制提供有价值的数据支撑,从而提高作业效率,降低成本。此外,随着人工智能、边缘计算等技术的不断发展,UAV推动第5代通信系统(Fifth Generation of communication system, 5G)网络向3维立体结构延伸,助力构建空天地一体化信息网络,以实现第六代通信系统(Sixth Generation of communication system, 6G)“一念天地、万物随心”的美好愿景,在工业数字化转型中发挥着重要作用[5–7]。
LAIN依托大量分布式的UAV设备实现数据采集、传输和处理,在智能交通、环境监测、灾害应急等方面展现出巨大的应用潜力。然而,在UAV执行任务过程中,会生成定位数据、视频流、图像、传感器数据等多源异构数据。这些数据不仅格式各异、语义多样,且来源广泛,信息间高度耦合,为数据处理、集成和分析带来了巨大的挑战。因此,为解决这一问题,需构建统一的数据描述模型,以规范化的方式,对各种不同来源和类型的数据进行统一描述和表征,消除数据之间的异构性,减少信息系统中的冗余和数据孤岛现象。通过有效表征和整合不同格式的数据,实现跨平台、跨领域的信息互通,提升智联环境中数据利用的效率和效果,为数据的集成与分析奠定坚实的基础。
本文旨在研究并构建面向LAIN的异构信息统一表征模型,以应对6G背景下低空智联环境中复杂数据与信息耦合所带来的挑战,为LAIN的数据管理和应用提供新的思路和解决方案。首先,综述LAIN数据融合和表征方法的国内外研究现状,总结LAIN中常见的异构数据类型及其特征,并探讨数据异构性带来的主要问题;其次,设计了面向LAIN多源多维数据的安全态势系统;再次,剖析并总结当前LAIN多维信息统一表征技术所面临的难题和挑战;然后,针对多源异构数据环境中的关键问题,探讨如何解决数据格式不统一和信息耦合的问题,消除数据异构性,提取关键信息,构建低空飞行器运营知识库;最后,总结本文的主要内容,并据此提出未来研究展望。
LAIN场景中不同来源、不同结构、不同模态的数据丰富了UAV等低空飞行器的感知能力,推动了智联网络的发展[8]。然而,如何实现异构数据之间的无缝对接、融合和多维信息的统一表征,是当前主要面临的困难之一。现有的研究面向数据多源性、格式差异性、模态多样性等挑战,积极探索各种创新方法与技术路径,旨在构建高效、可靠且具有广泛适应性的LAIN体系。
目前,国内的研究多聚焦于多源数据的语义、模态统一表征,鲜少面向低空网络中的数据源展开相关研究。文献[9]提出基于统一语义表征的单编码器-单解码器框架,以构建多用户异构语义网络,增强语义可解释性和可扩展性,实现统一的语义表征。为了应对异构异源的多媒体数据,文献[10]综述了目前跨模态表征与生成领域的发展现状,梳理跨模态统一表征、跨模态协同表征、多模态大模型表示学习、跨模态转换的前沿动态和发展趋势。文献[11]提出坐标转换和多传感器的数据融合方法,并设计了涵盖目标检测、多传感器、多视角技术的无人机目标检测方案,实现无人机对环境的多维度感知。相比之下,国外的研究更加丰富。文献[12]基于扩展卡尔曼滤波算法,对来自多个异构传感器的数据进行融合,以对多环境下UAV的状态信息进行评估,并通过实飞实验验证了所提出的多传感器数据融合系统的鲁棒性和有效性。文献[13]提出多尺度信息融合网络,以提高航空遥感的检测精度。文献[14]研究面向UAV的数据融合、描述性现实和控制解决方案,通过使用传感器群、云架构中的安全通信和分布式处理,保证了实时的数据处理、上下文态势感知和分散的数据融合。文献[15]提出多传感器数据融合模型,有效解决高分辨率航拍图像中的语义分割问题。然而,LAIN数据源种类更多,冗余性、异构性、时变性更强,目前缺少针对性的研究和标准,弥补LAIN多源数据信息难以统一表征的缺陷。这不仅制约了LAIN系统数据处理效率的提升,也阻碍了其在复杂实际场景中的广泛应用。
异构数据是指来源不同、格式多样、结构复杂的数据集合,包括频谱、图像、传感器、定位等多种数据类型。异构数据类型的处理和利用已经成为关键的挑战和研究热点。由于数据的多样性和复杂性,在存储、处理和分析过程中,需要采用不同的方法和技术,以有效地融合和利用异构数据。通过捕获动态特征,能够揭示出单一数据源难以发现的深层信息和模式,进而提升数据驱动决策的准确性和可靠性。在LAIN环境下,潜在的异构数据类型主要包括如下几类。
频谱感知数据反映了信号在频域内的特性,包括频率成分、幅度、相位等信息,反映了信号在时间和频率、能量谱上的分布情况[16]。频谱数据的主要来源包括UAV、地面基站、移动设备和卫星。其中,UAV在飞行与通信过程中可能产生涉及通信、导航、载荷等多方面的频谱数据,以进行实时通信、态势感知、飞行安全保障。地面基站通过频谱信息与UAV和其他电子设备保持连接,管理通信流量,实现信号覆盖。各类移动通信设备作为LAIN中的数据采集和传输节点,也会生成大量的频谱数据。而高低轨卫星则辅助LAIN实现广域覆盖和长距离通信,并提供低空区域的频谱使用信息。
由于无线电频谱信息复杂且电磁波干扰严重,合理开发和利用LAIN中的频谱数据至关重要[17]。监测无线电频谱的使用情况,可以实时监控检测低空区域内各类无线电活动,从而快速发现和应对潜在的危险,确保通信链路的稳定性和可靠性。因此,LAIN中的频谱数据在优化频谱资源的分配、减少无线电设备间的干扰、提高频谱利用率以及保障低空域内的通信安全与提高网络的整体性能将起到关键性作用[18]。然而,由于飞行器和无线电设备等直接采集到的原始频谱数据异构冗余,因此在利用频谱数据时,需进行数据预处理,包括去噪、滤波、归一化等操作。然后,可以采取频谱分析技术深入解析频谱数据,提取有用的信息和模式,并基于当前态势信息预测未来趋势。通过滤除噪声、平滑信号,可以进一步提高数据质量,并揭示信号的频率成分及其变化,提高信号的清晰度,规避可能出现的风险,增强低空区域的安全性和可靠性。
定位数据是LAIN中各类低空飞行器安全高效运营的基础。基于定位数据提供的精确、实时的位置信息,能够支持多种场景下UAV导航、路径规划、智能城市管理等功能实现,提高系统的智能化水平和决策能力。具体的,定位数据主要由全球定位系统(Global Positioning System, GPS)和北斗卫星导航系统(BeiDou navigation satellite System, BDS)模块提供。通过接收来自多个卫星的信号,GPS和BDS接收器可以计算出设备的经度、纬度和高度信息,生成NMEA(National Marine Electronics Association), GPX(GPS Exchange format)等格式的位置信息和定位数据[19]。特别的,BDS作为中国自主建设和独立运行的全球卫星导航系统,不仅在卫星数量和轨道分布上具有优势(BDS拥有45颗卫星,分布在多种轨道上),还能够降低对美国GPS系统的依赖。在某些特殊情况下,当GPS无法使用时,BDS能够确保UAV系统继续正常工作,从而提高系统的抗风险能力[20]。然而,由于建筑物、森林等地形的遮挡,GPS和BDS定位精度可能受限,易出现定位误差和信号丢失等问题,影响定位数据的精确度和可靠性。为弥补高精度场景中GPS定位精度的不足,实时动态差分技术通过地面基站提供的差分校正信号,将定位精度提高到厘米级,增强了系统的可靠性和稳定性。此外,惯性导航系统集成加速度计和陀螺仪,提供低空飞行器的位移和角速度数据,与GPS的绝对位置信息互为补充。在GPS信号较弱或失效的场景中,依然能够保证低空飞行器的高效运营,降低定位信号缺失所带来的影响,增强系统的鲁棒性,实现高动态环境或复杂地形中的高精度定位。
为保障LAIN的安全运营,飞行器和地面监测站中配备了各种类型的传感器,提供环境监测、飞行控制和设备状态监测等方面所需的数据信息,为各类异质低空飞行器提供了全面的信息支持。其中,环境监测传感器包括温度传感器、湿度传感器、压力传感器和气体传感器等,将实时测得环境的温度、湿度、大气压力等信息,辅助分析环境条件,预测天气变化,评估飞行条件,帮助低空飞行器实时调整飞行策略。同时,这类传感器能够识别污染源、监测气象变化,支持灾害应急响应和环境保护工作,为农业、工业排放监控和空气质量评估等领域提供重要支持。飞行控制传感器则提供飞行器运营的关键参数,包括位置、速度、加速度、倾斜角度和航向。这些数据来源于GPS, BDS、加速度计、陀螺仪和磁力计等设备,确保飞行器能够稳定、安全地执行飞行任务。通过实时监测和调整飞行姿态、轨迹和速度,这些传感器能够辅助飞行器实现自主优化飞行路径、提高导航精度并避免碰撞。设备状态监测传感器关注飞行器本身的健康状况,监测电池电量、引擎温度、振动水平、结构应力和磨损情况等,确保飞行器处于良好运行状态。
UAV等低空飞行器通常配备各种高清摄像头,以捕捉的高质量图像,可支持实时监控、导航以及目标识别和追踪,并广泛应用于农业监测、灾难救援、城市规划、交通管理等领域。图像数据在格式上具有显著的多样性和复杂性,常见格式包括JPG, PNG, TIFF和RAW等。其中,JPG和PNG格式压缩率高、质量较好,便于存储和传输,应用范围最广。TIFF格式支持无损压缩,分辨率高,但占用内存大,常应用于需要高质量和精度的场景,如地理信息系统和专业摄影。RAW格式直接采集自摄像头传感器,保留了最完整的图像信息,适合于需要后期处理和分析的专业应用。这些图像数据本质上是由像素构成的2维矩阵,每个像素包含不同的颜色信息[21]。此外,在需要动态图像采集、连续特征捕捉和实时监控的场景中,还可能存在MP4, AVI等视频格式。这些视频占用内存更大,对设备的传输、存储和分析能力要求更高。在整合图像数据时,首先需进行预处理,包括去噪、滤波、增强等操作,以提高图像的质量。然后,可通过阈值分割、区域生长、边缘检测等方法,将图像划分为多个区域。在此基础上,提取图像的边缘、纹理、轮廓、几何等特征,并基于深度学习、卷积网络等算法对提取的特征进行进一步的处理和分析,从而将图像数据嵌入在LAIN场景下的态势分析和具体应用中[22,23]。
面向LAIN的安全管控,团队首创开发了一套低空信息融合与监控系统,针对LAIN中的复杂数据环境进行融合与利用,如图1所示。该平台旨在实现高效的数据采集与预处理,提升态势感知能力,并为低空空域的安全运营提供坚实的基础。该平台集成了多种先进技术,包括广播式自动相关监视技术(Automatic Dependent Surveillance-Broadcast, ADS-B)、UAV远程识别(Remote IDentification, Remote ID)、5G通信模块、自组网模块、GPS/BDS双模定位等,形成一个高效、统一的数据采集和处理系统。通过集成机载多接入设备,所开发的系统能够在LAIN的复杂环境中实现精确的数据采集和传输,整合多源定位数据和图像数据,优化数据的获取和传输过程,实时处理来自不同数据源的数据。
具体的,ADS-B是一种空域通信与监视技术,使得低空飞行器可以全天时、全天候地向周围设备和地面站广播其状态信息,从而实现信息交互和态势评估[24–27]。Remote ID基于蓝牙和Wi-Fi等无线通信技术,能够持续向周围环境广播UAV的身份、位置、标识等信息,为未来的空中交通管理系统提供精准的UAV识别和跟踪[28–30]。自组网模块支持网络节点间的多格式数据包传输和转发,增强了数据的灵活性和可靠性。5G模块利用其高传输速率和大带宽优势,使得机载摄像头捕捉的图像和视频数据能够高效传输。通过ADS-B, Remote ID、自组网和5G模块的综合运作,该平台可以将UAV机载的GPS/BDS定位数据及身份标识信息实时传输到地面数据中心。同时,利用5G和自组网模块的高速传输能力,平台能够高效处理来自机载摄像头的图像和视频数据。地面数据中心将收集并整合这些数据,进行初步预处理后,将空域态势信息进行可视化展示,及时发出多种风险预警,从而实现对LAIN的全面风险管控和安全保障。
基于大量分布式UAV设备和先进的网络通信技术,LAIN可实现广泛的数据采集、传输和处理任务,赋能智慧城市建设与低空经济发展。然而,由于各类异构数据来源广泛、格式多样,LAIN在数据处理和系统集成方面面临重大挑战。这些问题不仅严重影响了数据和决策的精准性,而且制约了LAIN的进一步融合发展。具体而言,LAIN异构数据信息统一表征面临以下挑战。
与地面基础设施网络相比,低空环境中的数据处理面临诸多挑战。一方面,低空环境内气候条件、自然环境变化剧烈,地形起伏、建筑遮挡无可避免,信号传播过程中存在遮蔽、反射、衍射等问题;另一方面,空域范围内大量异构飞行器并存,网络拓扑结构动态多变,电磁干扰现象频发。这种空地融合的组网结构加剧了LAIN的不稳定性,多源传感器采集的数据在传输和存储过程中极易受到周围环境的影响,导致丢包、误传等现象,影响数据的完整性和准确性。此外,由于空域的开放性,低空飞行器与地面设备的通信信号往往暴露在外界环境中,传输的数据易受到来自窃听设备干扰或恶意攻击,进而被伪造或篡改。因此,在对多源异构数据进行处理时,需综合考虑数据完整性、实时性和安全性等方面的要求,设计合理的数据预处理机制,对所采集的数据进行整合、清洗,补全缺失,剔除冗余,甄别虚假,保障数据的质量和可靠性。
LAIN中传感器设备种类多样,数据来源多样且分散,数据格式和类型丰富,包括图像、视频、GPS位置信息、气象数据、环境参数等,形成了复杂的多源数据生态系统。这些传感器所采集的数据具有不同的格式、维度、物理属性和语义信息,且存在采样频率、数据精度和时空分辨率上的差异。此外,由于多源数据存储格式不统一,不同设备和系统可能采用不同的存储格式和数据库结构,因此,在跨系统共享和数据交换时,往往面临格式不兼容的问题,不仅增加了数据整合的难度,还可能导致数据在转换的过程中发生丢失或变形,影响数据的完整性和准确性。综上,在实现LAIN异构数据统一表征时,需要构建一个整体的数据处理和融合框架,采用标准化的数据描述语言和统一的语义模型,在统一的框架下对数据进行管理和分析,从而确保数据的一致性和完整性。同时,还需建立高效的数据检索和查询机制,保障数据在不同系统和平台间的共享和交换过程中的高效性和可靠性。
由于传感器数据多源性,不同传感器采集的数据往往包含不同的语义信息。然而,不同数据源的语义层次和粒度可能不同,且系统之间缺乏统一的语义标准,导致数据的可解释性差,进而产生语义歧义,难以实现不同平台和系统之间的互操作。因此,需要将不同数据源的语义信息映射到统一的语义空间中,明确语义信息,进行消歧处理,从而实现跨领域跨知识跨系统的有机融合。此外,与传统地面网络相比,飞行器的高速移动性和低空环境下信息的时空变化性使得信息的时效性和一致性更加关键。为确保信息的实时性和准确性,需要综合考虑信息的时间属性,开发实时更新和推理机制,准确描述和处理飞行器移动过程中数据的时空变化,捕捉数据在时间和空间上的动态属性,及时调整和优化语义模型,实现信息时空属性的语义关联和分析。
在LAIN中,环境的复杂性、数据的多源性以及语义的歧义性制约着多维、多源数据的融合与统一表征。在实际应用中,由于缺乏统一的处理框架和方法,难以对来自不同接入设备和数据源的数据信息进行有效处理和融合。因此,如何有效地对来自不同接入设备和数据源的数据信息进行处理和融合,成为亟待解决的问题。针对这一问题,本文探讨了4类关键技术在LAIN异构数据统一表征中的应用和作用,包括数据融合技术、时空栅格化技术、多模态协同推理技术以及知识图谱(Knowledge Graph, KG)技术,如图2所示。具体而言,数据融合技术能够整合、处理来自不同传感器的多维信息,实现对数据的深度分析和对环境态势的全面感知;时空栅格化技术通过引入时空属性,捕捉多维传感器数据的时空属性,并对异构数据进行标准化处理,能够在统一的框架下对异构数据进行分析和表征;多模态协同推理技术作为支撑技术,通过对不同类型数据的综合利用,增强了数据的表达能力和信息的互操作性,支撑以UAV为基石、以GPS/BDS为辅助的智联、互联场景;KG通过构建和推理语义网络,实现对多源异构数据的有效关联,构建低空飞行器知识属性网络,有效服务和助力LAIN的安全运营。
LAIN服务于导航、通信、监视等多应用场景,集成地面监视、UAV飞行控制、传感器节点的数据采集以及环境监测等多种系统,涵盖大量且冗余的结构化、半结构化、非结构化数据。此外,由于环境干扰频发、传感器精度受限等原因,多传感器所采集的信息具有显著的不确定性。因此,基于数据融合技术实现多维信息统一表征,是LAIN中解决飞行器异构性、成分复杂性和应用广泛性的关键步骤[31–33]。通过数据融合技术,可以将来自不同传感器和数据源的多维信息整合在一个统一的框架下,增强数据的可理解性和可用性[34]。
在LAIN系统中,针对不同的数据和应用场景,数据的融合方法主要分为数据级融合、特征级融合以及决策级融合3种,如表1所示。对于未经处理的原始数据,可采用数据级融合的方法进行融合处理和分析,尽可能地保存更多的现场数据和细节信息,将不同来源的数据合并,形成一个综合的数据集。然而,由于低空传感器所采集的信息可能会存在数据缺失、噪声干扰、信息冗余等状况,往往需要在融合前进行预处理。
融合方法 | 主要特点 | 优缺点 | 应用场景 |
数据级融合 | 整合原始数据,保留完整信息,存储、处理开销高 | 信息完整性高,同时对数据质量要求高 | 数据量大且多源数据具有高度互补性,需要直接整合原始数据的场景 |
特征级融合 | 整合数据主要特征,可提高数据表示和分析效果,实时性强 | 鲁棒性更强,能综合多源数据特征,但特征提取算法依赖度高,可能导致信息损失 | 智能交通、农业监测、公共安全等需要从多源数据中提取和综合多源数据 特征的场景 |
决策级融合 | 不同数据源的数据或特征进行分析和决策后,整合独立决策结果,可有效提高决策准确性和可靠性,灵活性高,鲁棒性强,抗干扰能力强 | 灵活性高,鲁棒性强,但融合算法 相对复杂 |
UAV导航、目标识别、灾害预警等需进行独立决策以提高决策准确性和 可靠性的场景 |
首先,对于异质飞行器采集的原始数据,需要从时域、频域、空域以及能量域的角度进行预处理。预处理的第1步是数据清洗,主要包括去除噪声和补全缺失数据。这一步骤可以采用滤波技术,例如基于卡尔曼滤波的算法,有效去除高低频段的噪声干扰,减少数据的不确定性。接下来,进行信息补全,以填补数据在时域、频域和空域中的缺失部分,确保数据的完整性。最后,剔除冗余信息,以降低数据存储和处理的复杂性,从而减少数据融合和分析过程中冗余信息带来的负面影响[35]。对于不同格式的数据,需要先将其转换为统一的标准格式,并进行归一化处理。这一步骤旨在消除由于单位和量纲差异所带来的影响,使得不同来源的数据能够在同一尺度上进行比较和分析,从而简化后续的处理工作。此外,还需对来自不同传感器的数据进行时间和空间上的对齐处理。为此,可以采用时间戳标记、时间插值、空间坐标变换以及配准算法等方法,以消除多源数据在时间和空间维度上的不连续性和不一致性,确保数据的同步性[34]。
如图3所示,为实现特征级数据融合,需要通过特征提取技术获取低空飞行器的关键属性和特征,包括飞行轨迹、速度、状态信息以及环境参数等。具体的,可以采用信号处理技术和基于概率的统计方法,从预处理后的多维原始数据(包括频谱数据、定位数据、图像数据及其它数据)中提取低级特征;或基于深度学习模型(包括卷积网络、长短期记忆网络等),提取高级特征,以捕捉低空飞行器运营的复杂模式和结构。此过程中,通过降维技术减少数据特征维度,去除冗余信息。同时,考虑传感器所采集数据的潜在不确定性,可以使用基于概率统计和贝叶斯方法进行模糊建模,量化传感器数据的不确定性,并基于量化结果对数据进行加权处理,增强数据融合的鲁棒性[36]。最后,将提取的特征向量化,并通过特征组合和转换,构建新的特征,进一步提高数据的表达能力和分析效果。从而提取飞行器运营的多维信息特征。对于提取的数据特征,进行特征拼接、特征选择、特征加权等操作,将不同来源的特征整合在一起,或基于深度学习模型进行联合训练,实现特征的深度融合。最终,生成综合的特征表征模型,以提高数据的表示能力和分析效果[37]。例如,在智能交通场景中,通过对低空飞行器采集的交通流量图像数据和道路传感器数据进行特征级融合,提取车辆流量、速度等关键特征,能够更及时准确地分析交通态势。相较于数据级融合,特征级融合在处理前需进行特征提取,这一步骤可有效减少数据量,降低存储和计算压力。但在特征提取过程中可能会损失部分原始数据信息,且对特征提取算法的准确性和有效性依赖较高。
此外,在LAIN的应用场景下,来自地面基础设施和各异构低空飞行器的不同传感器和数据源可能会分别进行独立决策,例如,执行任务的UAV会根据环境态势做出自主避障和轨迹规划决策。决策性数据融合综合考虑各决策源的可信度和重要性,根据具体应用场景的需求,灵活地整合不同来源的决策信息,为跨域的综合决策提供支持。具体而言,基于预处理后的数据,各数据源可以先独立生成决策,然后通过加权平均、投票机制或贝叶斯推理等算法对这些独立决策结果进行融合。决策级融合具有高鲁棒性、高可靠性的优势,能够充分利用多源异构数据的优势,有效应对LAIN下的信息不确定性,有效减少单一数据源的不确定性和误差,实现更加全面和准确的决策支持[38]。但决策级融合需要等待各数据源完成独立决策后再进行融合,相对而言实时性较差,且对各数据源决策的准确性和一致性要求较高,否则可能导致融合结果不理想。
栅格数据是一种以2维矩阵的形式来表示某一特定事件的数据组织方式,每个矩阵单位称为栅格单元,代表地理空间中的一个小区域。所有栅格单元的大小相同,每个单元存储一个值,反映该区域内的某种特定属性。栅格化数据呈规则的网格状结构,能够清晰地表达空间信息,具备结构规则、处理简便和分析能力强的特点,广泛应用于地理信息系统、遥感、环境监测和资源管理等领域。基于数据栅格化技术,可以将来自不同传感器的数据,如图像、视频、气象数据等,统一转化为栅格格式,从而有效处理和整合多源、多维度的空间数据[39]。
首先,针对LAIN下多模态传感器网络所采集的环境、位置、频谱等多维数据信息,需对其进行清洗和归一化等预处理操作,确保数据的准确性和一致性。然后,将低空空域划分为栅格单元,以空域栅格数值信息为基础,构建“空间-属性”的空域信息模型。在每个栅格单元中存储该空间和时间点的多维数据,从而量化空域单元的空间特征,并在同一坐标系中对数据进行分类、存储和统一表示,实现对低空环境的全面感知和分析,使得数据的对比、融合和综合分析直观化。
针对低空飞行器在智联网络中导航、监视、情报以及态势感知等信息格式不一、数据标准各异的问题,可以在栅格数据模型中引入时间维度,将传统的栅格模型扩展为时空数据模型。基于数字栅格技术,可以对融合得到的数据信息进行时空栅格化处理,将其统一表示为时空栅格数据。这种处理方法能够有效捕捉数据的历史变化信息,跟踪数据变化的趋势,掌握事件的固有属性和时空特征。通过时空栅格化操作,可以实现多源监视数据的自动补全和态势融合,精确刻画事件或对象的空间属性及其随时间的变化状态,从而准确预测未来的态势变化[39]。这种时空栅格数据格式的标准化显著简化了数据处理流程,促进了不同数据源之间的融合和共享。此外,栅格数据在格式上的统一性,能够实现在同一框架下对不同类型的数据进行对比和分析,消除因数据格式不同带来的障碍,获取更全面的环境信息。通过将多源数据栅格化处理,可以构建统一的数据集,用于监督学习、半监督学习或无监督学习模型的训练,提高决策的准确性和效率。
传统单模态数据处理方法仅依赖单一类型的数据,信息相对单一,在面对复杂低空场景时,难以全面准确地理解和表征环境信息。由于异构模态的信息具有互补性,多模态技术通过整合、分析和利用异构的模态数据进行协同推理,能够充分利用不同数据类型的优势,从多个角度全面理解低空场景。通过融合多模态数据,不仅可以获取充分更丰富、更全面的信息,还能降低单一模态数据的不确定性,弥补单模态在信息统一表征和综合分析的局限性。通过在底层上融合图像、视频、文本等异构数据,多模态协同推理技术利用特征提取方法获取低空飞行器的关键属性和特征,突破传统单模态数据处理方法在特征提取和表示的局限。该技术能够更全面地理解低空环境,提高数据分析和决策的准确性,实现对复杂低空场景的精确表征,从而更准确地把握低空环境态势,为低空飞行器的智能决策提供可靠的信息支持[40]。
对于LAIN中多模态传感器所采集的异构数据,为实现协同推理和统一表征,如图4所示,需要建立完整的数据融合框架。该框架基于标准化处理和特征提取等技术,获取包括UAV运动轨迹、姿态变换、环境的态势信息、频谱感知等在内的低空飞行器安全运营的关键特征。
其次,通过对特征向量进行对齐处理,采用基于相似度度量的对齐方法,计算不同模态特征向量之间的相似度,并通过优化算法调整特征向量,以衡量跨模态子元素的关联性。对齐过程能够识别和匹配同一时刻相互对应的不同模态数据,消除空间位置差异的影响,使对应同一语义概念的特征向量在空间上尽可能接近。这样可以确保不同模态数据在时间和空间维度上的一致性,降低时空信息不一致对融合结果的影响,从而减少不确定性。同时,结合上下文信息进一步提高对齐的准确性,利用循环神经网络或图神经网络对多模态数据的上下文信息进行建模,从而更好地理解特征向量之间的语义关系,减少因上下文缺失导致的语义歧义。
再次,依据不同模态数据信息的维度和物理属性,结合数据的时空信息,设计多模态特征提取器,运用模态编码器对多模态数据进行编码,将非文本模型编码成特征信息,并映射到一个共享的语义空间。综合利用图像、视频、频谱和传感器等数据,应用长短期记忆网络、卷积神经网络等算法和模型进行处理和分析,并结合注意力机制动态调整不同模态特征的权重,优化各模态数据的特征表示[41–43]。然后,基于自然语言处理(Natural Language Processing, NLP)技术,对文本信息进行翻译,基于语义识别技术提取语义向量,将源模态映射到目标模态中,并转化为结构化数据。采用监督学习、半监督学习或无监督学习的方法,根据具体任务需求选择合适的训练策略,进行模型训练和优化,提升模型性能。最后,在多模态数据的基础上,通过协同学习的方式,联合训练不同模态的数据,提升模型的性能和泛化能力。通过设计合适的损失函数,使模型能够学习到不同模态数据之间的语义一致性关系,进一步提高跨模态数据的语义对齐与消歧能力。经过训练和优化的多模态模型具备在线学习和更新能力,能够不断积累不同场景下的多模态数据样本,增强模型的语义理解能力。通过根据态势信息实时修正传感器数据误差,该模型可有效减少单一数据源失效或误差带来的影响,并持续优化跨模态数据的语义对齐与消歧效果,从而提高系统的鲁棒性。该技术有望为LAIN下的环境监测、灾难救援等实际场景提供准确可靠的服务支持。
针对所提取的多维数据特征和融合得到的结果,仍需进行深入分析,以提供有效的低空环境感知和管控决策支持。KG是一种结构化的知识表示技术,通过构建实体和实体间的相互关系,可以将不同来源、不同格式、不同语义的信息进行标准化描述和关联,从而促进数据之间的共享与协作,构建开放的知识生态系统[44]。因此,在智联环境中,构建低空飞行器运营知识网络是实现LAIN多维数据统一表征的关键步骤。如图5所示,首先,在特征提取和数据融合的基础上,需进一步深入挖掘数据间的隐含关系和数据的潜力。具体地,以无监督的聚类算法为手段,分析数据的内在规律和结构,并基于决策树、神经网络等监督学习模型,对特征数据进行精准分类和回归建模,从而预测未来变化趋势,提高系统决策能力;同时,采用关联规则挖掘技术,识别不同设备和场景间的关联模式,挖掘特征间的隐含关系,深化对多维数据的理解,发现异构数据间的复杂关系,完善低空系统的功能。
语义识别技术是构建低空飞行器运行KG的关键,由于数据所包含的语义信息具有显著差别,结合特征提取和数据挖掘技术,语义识别能够从LAIN中的不同实体和概念中提取信息,并将其转化为语义向量,存储LAIN下的海量多源结构化知识数据,实现知识的表示和推理[45]。基于数据挖掘所得到的低空飞行器运营关键属性和特征,为构建知识网络,还需进行语义识别和关系映射,实现对低空飞行器运营态势信息的多维度动态描述,便于进一步的查询和利用。具体地,如图5所示,基于NLP技术,结合上下文,建立有效的语义解析和融合机制,提取关键信息。利用融合后的特征,自动识别并解析数据中的关键实体,包括“飞行器”“位置”“事件”等,同时捕捉其语义特征。通过学习和推理实体间的语义关系,将实体和关系嵌入向量空间,并对KG中的实体和关系进行语义分析。结合上下文,模型能够理解这些实体和关系在LAIN特定场景中的含义,并将其与其他模态数据中的相关信息关联,建立准确的语义关联,从而实现对复杂场景的深度理解和推理支持。随后,构建“实体-关系-实体”3元组,利用图数据库工具完善和管理低空飞行器运营知识网络。基于多维信息搭建LAIN环境数据知识库,通过语义对齐算法确保不同模态数据生成的3元组在语义上的一致性。这样可以直观表示低空场景中飞行器、环境态势及其相互关系,形成完整的场景描述。该知识网络能够实现LAIN环境下图像、频谱、定位、文本等多维数据的统一表征,为低空飞行器的安全运营提供重要的语义支持和决策依据[46]。
LAIN环境的高度异构动态性和指数性增长的多源数据规模向KG表征框架的扩展性提出了更高的要求。在LAIN运营过程中,需实时更新各类数据,不断添加新的实体和关系,调整现有的知识结构,确保KG始终反映最新的飞行器运营信息和环境状况。当不同数据源中存在对同一实体的多种描述时,语义识别技术,能够有效对齐、整合不同数据源的信息,确保内部KG与外部知识库的实体正确对应,并结合多种评分函数衡量实体相似度,减少重复冗余的数据,提高利用效率,修正语义冲突和错误。从而为解决数据异构问题、确保知识的一致性和完整性提供语义支持。通过知识推理和补全技术,KG能够根据内部知识库对不完整或模糊的信息进行推理和补充,从而更好地适应动态变化的LAIN环境,增强鲁棒性。随着数据规模的增长,KG将不断优化自身结构和功能,不断适应新的数据和语义变化,进一步提升跨模态数据的语义对齐与消歧能力,提升框架在复杂环境下的扩展性,为LAIN中的信息共享和统一表征框架提供坚实的语义基础。
通信系统和技术的智能化发展为LAIN中来源广泛、模态各异的多维异构数据的深度融合提供了技术支撑,并推动了信息处理的高效化和精准化发展。未来,面向LAIN的多维数据统一表征技术有望与其它模型、算法和架构集成融合,实现低空系统的智能分析和自主决策,推动LAIN的全面应用和广泛部署,助力构建6G网络“空天地一体化泛在互联”的美好愿景。在当前LAIN发展的挑战背景下,本文讨论了以下潜在研究方向,集成边缘计算技术、无线电知识描述语言(Radio Knowledge Representation Language, RKRL)以及大语言模型技术,以期实现LAIN数据进一步融合和统一表征,为未来的LAIN研究提供参考:
随着通信网络的发展,边缘计算技术将边缘服务器部署在靠近终端的一侧,在数据源头进行预处理和初步分析。通过分布式处理,边缘计算显著降低了数据传输延迟和网络带宽压力,同时分担了中心服务器的计算负荷。这种技术不仅提高了系统的实时响应能力,还有效减轻了中心服务器的运算压力,提升了整体系统的效率和可靠性[47]。LAIN场景对数据的实时性具有高要求,UAV等低空飞行器搭载边缘计算服务器,可以快速处理和分析回传图像、视频流和传感器数据,生成实时的环境感知信息和应急决策[48]。通过在边缘设备上进行初步的数据清洗、过滤和特征提取,边缘计算可以显著降低传输到中心服务器的数据量,优化数据融合和分析的流程,提高应答速度和数据融合处理的效率,为LAIN信息的快速获取和统一表征提供高质服务[49,50]。然而,受限于计算能力、存储容量等因素,边缘设备在处理复杂的数据任务时,仍可能面临资源瓶颈,影响数据处理速度和效率,尤其是在应对大规模数据实时处理需求时,资源不足的问题将更加凸显。为了应对这些问题,需设计轻量级、模块化的边缘计算架构,开发智能的资源分配和管理算法,通过简化模型结构、减少参数数量、预训练模型和迁移学习等方式降低计算负担,使其能够根据不同的低空飞行器任务需求和资源状况进行灵活配置和动态调整,优先保障关键任务的资源需求。
在多模态协同推理模型和KG的构建与应用方面,也需要进行针对性优化。具体而言,通过简化模型结构、削减参数数量等手段,开发轻量化的多模态协同推理模型和KG,降低计算负担,减少在边缘设备上的训练时间和计算资源消耗。利用数据预处理技术,能够有效减少数据量和计算量,提升模型的运行速度。此外,采用分布式计算和缓存技术,将计算任务合理分配至多个边缘设备或云端进行处理,能够切实提高计算效率,从而确保多模态协同推理模型得以顺畅运行,KG得以有效构建和维护。
RKRL是一种用于描述和表达与无线电知识相关信息的语言,用于描述无线电信号的特征、传播环境、设备性能以及操作行为等信息。它提供基础性的可扩展标记语言(Extensible Markup Language, XML)格式框架,可以用来统一不同类型和来源的无线电信息,并使得这些信息能够被不同系统和设备理解和利用[51]。由于目前许多编程语言都支持XML数据交换格式,因此,RKRL技术允许以一种有序和结构化的方式来对数据进行表征和描述,有助于实现不同系统之间的数据交换。此外,RKRL采用异构模型,通过数学映射和标准化描述,可在数学框架中容纳从自然语言到半正式模型再到正式公理模型的各种模型。因此,在LAIN等复杂应用场景中,RKRL技术能够有效整合来自多种传感器和系统的数据。它通过标准化的数据描述方法,将不同来源的数据无缝地集成到统一的语义框架中,从而提高数据处理的效率,增强系统的兼容性和互操作性。这种能力使得多源数据能够在同一平台上进行分析和决策,保障系统的兼容性和互操作性,为各种数据密集型应用提供可靠的支持。由于无线电数据在频率、信号强度、调制方式等方面具有高度的复杂性和多样性,复杂多样的数据特征以及不同设备和系统之间的数据差异对RKRL的数据建模和描述能力提出了更高的要求。因此,还需进一步提高RKRL对复杂数据的建模和描述精度,建立详细的标准和规范,明确数据格式、语义定义、接口协议等方面的要求,保证整个LAIN系统中无线电知识的语义一致性。
大语言模型在NLP和语义理解方面逐渐展现出强大的优势。嵌入了大语言模型的LAIN通过深度学习技术,可以基于解析和理解多种数据格式中的自然语言描述,对复杂的语义关系进行推理,自动识别并提取关键实体和概念,捕捉数据之间的隐含关系,形成“实体-关系-实体”的3元组结构,从而帮助构建、完善和扩展低空飞行器运营KG,提升多源数据的语义对齐和融合效率,提高KG的准确性和完整性,增强系统的语义分析和知识推理能力[52,53]。基于大语言模型,LAIN有望有效处理和理解多源数据,从而推动低空飞行器运营和管理的智能化发展。然而,由于LAIN环境的复杂多变性,所提出的大语言模型需根据复杂的场景需求,准确理解和处理各种自然语言任务,避免出现误解或错误判断,这对模型的泛化能力和领域适应性提出了很高要求。此外,大语言模型通常需要大量的计算资源进行训练和推理,因此,需结合边缘计算技术,开发针对LAIN场景的轻量化大语言模型架构,优化模型结构和算法,提高计算效率。
随着通信技术的进一步革新和飞跃式发展,LAIN作为一种新质生产力,将在智慧场景中发挥与日俱增的重要作用。本文针对LAIN中多维、多源数据表征难题,总结了领域内的当前国内外相关工作,介绍了低空网络中的主要数据类型和格式,提出了一项面向LAIN多维多源数据的采集与预处理示范系统,深度剖析了数据统一表征所面临的主要困难,并重点介绍了解决这一难题的潜在技术和关键方法,包括数据融合、数据时空栅格化技术、多模态协同推理技术以及KG统一表征技术。这些技术的有效集成,有望提高LAIN中异构数据的处理效率和准确性,实现多源数据的统一表征,并为智能交通、环境监测、灾害应急等领域提供了强有力的技术支撑,从而推动低空经济和未来产业的蓬勃发展。
[1] |
SHI Xiufang, YANG Chaoqun, XIE Weige, et al. Anti-drone system with multiple surveillance technologies: Architecture, implementation, and challenges[J]. IEEE Communications Magazine, 2018, 56(4): 68–74. doi: 10.1109/MCOM.2018.1700430.
|
[2] |
陈新颖, 盛敏, 李博, 等. 面向6G的无人机通信综述[J]. 电子与信息学报, 2022, 44(3): 781–789. doi: 10.11999/JEIT210789.
CHEN Xinying, SHENG Min, LI Bo, et al. Survey on unmanned aerial vehicle communications for 6G[J]. Journal of Electronics & Information Technology, 2022, 44(3): 781–789. doi: 10.11999/JEIT210789.
|
[3] |
KAUFMANN E, BAUERSFELD L, LOQUERCIO A, et al. Champion-level drone racing using deep reinforcement learning[J]. Nature, 2023, 620(7976): 982–987. doi: 10.1038/s41586-023-06419-4.
|
[4] |
KUNERTOVA D. The war in Ukraine shows the game-changing effect of drones depends on the game[J]. Bulletin of the Atomic Scientists, 2023, 79(2): 95–102. doi: 10.1080/00963402.2023.2178180.
|
[5] |
国务院, 中央军委. 无人驾驶航空器飞行管理暂行条例[EB/OL]. https://www.gov.cn/zhengce/content/202306/content_6888799.htm, 2023.
The State Council of the People’s Republic of China, The Central Military Commission of the Communist Party of China. Interim regulations on the management of unmanned aircraft flights[EB/OL]. https://www.gov.cn/zhengce/content/202306/content_6888799.htm, 2023.
|
[6] |
聂伟, 戴琪霏, 杨小龙, 等. 基于多维信号特征的无人机探测识别方法[J]. 电子与信息学报, 2024, 46(3): 1089–1099. doi: 10.11999/JEIT230302.
NIE Wei, DAI Qifei, YANG Xiaolong, et al. Unmanned aerial vehicle detection and recognition method based on multi-dimensional signal feature[J]. Journal of Electronics & Information Technology, 2024, 46(3): 1089–1099. doi: 10.11999/JEIT230302.
|
[7] |
SHI Zhiguo, CHANG Xianyu, YANG Chaoqun, et al. An acoustic-based surveillance system for amateur drones detection and localization[J]. IEEE Transactions on Vehicular Technology, 2020, 69(3): 2731–2739. doi: 10.1109/TVT.2020.2964110.
|
[8] |
SI Zheng, LIU Chao, LIU Jianyu, et al. Application of SNNS model based on multi-dimensional attention in drone radio frequency signal classification[C].2024 IEEE International Conference on Acoustics, Speech and Signal Processing, Seoul, Republic of Korea, 2024: 231–235. doi: 10.1109/ICASSP48485.2024.10446694.
|
[9] |
GLÜGE S, NYFELER M, AGHAEBRAHIMIAN A, et al. Robust low-cost drone detection and classification using convolutional neural networks in low SNR environments[J]. IEEE Journal of Radio Frequency Identification, 2024, 8: 821–830. doi: 10.1109/JRFID.2024.3487303.
|
[10] |
俞宁宁, 毛盛健, 周成伟, 等. DroneRFa: 用于侦测低空无人机的大规模无人机射频信号数据集[J]. 电子与信息学报, 2024, 46(4): 1147–1156. doi: 10.11999/JEIT230570.
YU Ningning, MAO Shengjian, ZHOU Chengwei, et al. DroneRFa: A large-scale dataset of drone radio frequency signals for detecting low-altitude drones[J]. Journal of Electronics & Information Technology, 2024, 46(4): 1147–1156. doi: 10.11999/JEIT230570.
|
[11] |
YU Ningning, WU Jiajun, ZHOU Chengwei, et al. Open set learning for RF-based drone recognition via signal semantics[J]. IEEE Transactions on Information Forensics and Security, 2024, 19: 9894–9909. doi: 10.1109/TIFS.2024.3463535.
|
[12] |
彭鸿飞, 朱鑫潮, 周成伟, 等. 基于静动态综合估计的无人机蜂群态势感知技术[J]. 信号处理, 2024, 40(5): 826–838. doi: 10.16798/j.issn.1003-0530.2024.05.003.
PENG Hongfei, ZHU Xinchao, ZHOU Chengwei, et al. UAV swarm situational awareness technology based on static and dynamic comprehensive estimations[J]. Journal of Signal Processing, 2024, 40(5): 826–838. doi: 10.16798/j.issn.1003-0530.2024.05.003.
|
[13] |
ZHOU Chengwei, GU Yujie, SHI Zhiguo, et al. Structured nyquist correlation reconstruction for DOA estimation with sparse arrays[J]. IEEE Transactions on Signal Processing, 2023, 71: 1849–1862. doi: 10.1109/TSP.2023.3251110.
|
[14] |
ZHENG Hang, ZHOU Chengwei, SHI Zhiguo, et al. Coarray tensor direction-of-arrival estimation[J]. IEEE Transactions on Signal Processing, 2023, 71: 1128–1142. doi: 10.1109/TSP.2023.3260559.
|
[15] |
郑航, 周成伟, 王勇, 等. EMVS互质面阵张量波束成形[J]. 信号处理, 2024, 40(2): 250–262. doi: 10.16798/j.issn.1003-0530.2024.02.003.
ZHENG Hang, ZHOU Chengwei, WANG Yong, et al. Tensor beamforming for EMVS coprime planar array[J]. Journal of Signal Processing, 2024, 40(2): 250–262. doi: 10.16798/j.issn.1003-0530.2024.02.003.
|
[16] |
WANG Qiexiang, WANG Longhui, YU Lebin, et al. An ID-based robust identification approach toward multitype noncooperative drones[J]. IEEE Sensors Journal, 2023, 23(9): 10179–10192. doi: 10.1109/JSEN.2023.3259203.
|
[17] |
ZHAO Zheng, SÄRKKÄ S, SJÖLUND J, et al. Probabilistic estimation of instantaneous frequencies of chirp signals[J]. IEEE Transactions on Signal Processing, 2023, 71: 461–476. doi: 10.1109/TSP.2023.3245720.
|
[18] |
KHODARAHMI M and MAIHAMI V. A review on Kalman filter models[J]. Archives of Computational Methods in Engineering, 2023, 30(1): 727–747. doi: 10.1007/s11831-022-09815-7.
|
融合方法 | 主要特点 | 优缺点 | 应用场景 |
数据级融合 | 整合原始数据,保留完整信息,存储、处理开销高 | 信息完整性高,同时对数据质量要求高 | 数据量大且多源数据具有高度互补性,需要直接整合原始数据的场景 |
特征级融合 | 整合数据主要特征,可提高数据表示和分析效果,实时性强 | 鲁棒性更强,能综合多源数据特征,但特征提取算法依赖度高,可能导致信息损失 | 智能交通、农业监测、公共安全等需要从多源数据中提取和综合多源数据 特征的场景 |
决策级融合 | 不同数据源的数据或特征进行分析和决策后,整合独立决策结果,可有效提高决策准确性和可靠性,灵活性高,鲁棒性强,抗干扰能力强 | 灵活性高,鲁棒性强,但融合算法 相对复杂 |
UAV导航、目标识别、灾害预警等需进行独立决策以提高决策准确性和 可靠性的场景 |