Threat Assessment Based Sensor Control for Multi-target Tracking
-
摘要: 该文基于随机有限集的多目标滤波器提出一种基于目标威胁度评估的传感器控制策略。首先,在部分可观测马尔科夫决策过程(POMDP)的理论框架下,给出基于信息论的传感器控制一般方法。其次,结合目标运动态势对影响目标威胁度的因素进行分析。然后,基于粒子多目标滤波器估计多目标状态,依据多目标运动态势的评估研究建立多目标威胁水平,并从多目标分布特性中深入分析并提取出当前时刻最大威胁度目标的分布特性。最后,利用Rényi散度作为传感器控制的评价指标,以最大威胁度目标的信息增益最大化为准则进行最终控制方案的求解。仿真实验验证了该方法的实用性和有效性。
-
关键词:
- 多目标跟踪 /
- 目标威胁度 /
- 战术重要性标绘 /
- 传感器控制 /
- 部分可观测马尔科夫决策过程
Abstract: This paper proposes a threat assessment based sensor control by using multi-target filter with random finite set. First, the general sensor control approach based on information theory is presented in the framework of Partially Observable Markov Decision Process (POMDP). Meanwhile, combined with target movement situation, the factors that affect the target threat degree are analyzed. Then, the multi-target state is estimated based on the particle multi-target filter, the multi-target threat level is established according to the multi-target motion situation, and the maximum threat target distribution characteristic is analyzed and extracted from the multi-target distribution characteristic. Finally, the Rényi divergence is used as the evaluation index in sensor control, and the final control policy is solved with the maximum information gain as the criterion. The simulation results verify the feasibility and effectiveness of the proposed method. -
1. 引言
传感器控制[1,2]的核心思想是根据某种评价体系动态地选择出传感器的控制方案,即控制传感器的动作方式及运行参数,确保最大程度优化接收信息的质量。目标威胁评估一直是战场态势信息融合的一个重要组成部分,其评估结果会直接影响到战术决策(例如传感器控制),如果通过信息处理结果对跟踪环境中的目标做实时评估,能够控制传感器集中现有资源对更感兴趣或威胁等级最高目标进行优先跟踪,并对其信息进行深度挖掘,这将对作战效能产生深远的影响。从本质上讲,依据目标威胁度评估进行传感器控制属于多属性决策问题[3]。这类问题的研究主要是利用已有的信息对各个威胁因素进行分析、排序、评价和择优,最终决策出更切合实际的控制方案。对于此类背景下的传感器控制方法研究也更为复杂。
最为直观的威胁评估方式就是结合多目标运动态势(例如速度、敌我距离、目标航向等)建立相应目标的威胁等级。而如何在具有目标不确定性和量测不确定性的复杂环境中,从多目标整体运动态势中实时、有效评估各目标的威胁水平,对多目标跟踪系统和传感器控制决策系统都提出了非常高的要求。近些年来,基于随机有限集(Random Finite Set, RFS)理论[1,4]的多目标跟踪算法得到了空前的发展,其中核心的部分就是建立了有限集统计(Finite Set Statistics, FISST)[1,4]理论体系。这套理论体系的最大优势在于其避免了多目标跟踪中的数据关联问题。最近几年,已经有一些学者在FISST理论的框架下提出了相应的传感器控制策略[5–10],这些策略大多是以多目标整体跟踪性能达到最优进行相应的控制。但截止到目前,结合RFS多目标滤波器进行威胁评估为任务决策的传感器控制策略,仍然没有得到系统性的方法研究。
本文的主要贡献是基于多目标威胁度评估进行多目标跟踪中传感器控制问题的研究。首先,利用RFS建模多目标状态与量测,基于目标运动态势对影响目标威胁度的因素进行分析。其次,利用粒子概率假设密度滤波器(Particle Probability Hypothesis Density Filter, P-PHDF)[11]来估计多目标状态,然后依据目标的运动态势评估各目标的威胁水平,选取威胁度最大的目标为优先跟踪目标,并从递推的多目标分布特性中提取威胁目标的分布特性,基于Rényi散度作为传感器控制的评价函数,在信息增益最大化的准则下,最终实现基于目标威胁度的传感器控制,最后通过仿真实验验证本文算法的有效性。
2. 问题提出
先定义在POMDP理论框架下传感器控制的相关要素。首先是在RFS框架下
k 时刻的多目标后验概率密度函数pk(⋅|Z1:k) ,k 时刻向后H 步的多目标预测概率密度pk+H(⋅|Z1:k) ,H≥1 。其次,用Uk 表示可实现的传感器控制集合。最后,对于每一个传感器运动υ∈Uk 给定一个相应的评价函数R(υ) ,最优控制的准则是使最优控制序列uk 对应的评价函数Rk+H(υH) 最大化,表示为uk=argmaxυH∈Uk+1:k+HE[Rk+H(υH)] (1) 其中,
Uk+1:k+H 表示为向后H 步总的控制方案的集合。此外,评价函数可由多目标先验概率密度和后验概率密度之间的信息距离(信息增益)
Dr(⋅,⋅) 确定,即Rk+H(υH)=Dr(pk+H(X|Z1:k),pk+H(X|Z1:k,Zk+1:k+H(υH))) (2) 其中,
Zk+1:k+H(υH) 表示由控制方案υH 决定的量测集。考虑到随着H 的增大,控制集合Uk+1:k+H 的势会呈指数增长,为了便于计算,本文基于“近视”(“Myopic”)控制方案进行传感器控制方法的研究[12],即H=1 。一般情况下,为了从全局上使得监控系统的整体性能(例如多目标整体跟踪质量)达到最优,本文可采用基于整体多目标信息增益的传感器控制策略,即依据多目标信息增益最大化准则进行传感器控制。但是,很多情况下,传感器控制的目的并不是控制传感器去优化任何可能目标的跟踪性能,而是控制传感器去跟踪那些在战术重要性(威胁程度)上具有更高价值且更感兴趣的目标。为此,如何根据目标的运动态势的变化对多目标进行威胁程度的优先级排序,从而提炼出那些更感兴趣的目标(最大威胁度目标),并对这类目标进行优先跟踪,这对我方的战术决策有着重要的现实意义。进一步,结合RFS多目标滤波器,如何从多目标分布特性中提取特殊目标(威胁目标)的分布特性,并结合式(1)和式(2)去构造基于最大威胁度目标优先跟踪的传感器控制的评价函数,最终得到基于威胁度评估的最优传感器控制策略已成为亟待解决的问题。有鉴于此,下文将深入探讨基于威胁度评估的传感器控制方法。3. 基于目标威胁度的传感器控制
在实际跟踪环境当中,影响目标对我方威胁度的因素多种多样。本文选取易于量化而且代表性比较强的3种运动态势因素:目标速度、航向及距离。以下将结合目标运动态势对影响目标威胁度的因素进行分析。然后,基于粒子多目标滤波器估计多目标状态,依据多目标运动态势的评估研究建立多目标威胁水平,并从多目标分布特性中深入分析并提取出当前时刻最大威胁度目标的分布特性,最终决策得到评价准则最优的传感器控制方案。以下重点给出基于最大威胁度目标的传感器控制的实现流程。
3.1 预测强度函数的粒子表示及状态提取
假设
k−1 时刻的后验多目标强度(PHD)可由一组带权值的随机样本粒子集{w(i)k−1,x(i)k−1}Lk−1i=1 来表示,即Dk−1(x)≈Lk−1∑i=1w(i)k−1δx(i)k−1(x) (3) 其中,
δ(x) 是狄拉克德尔塔函数,w(i)k−1 为相应的第i 个粒子的权重。预测强度函数由存活目标和新生目标两部分组成。其中,存活目标依据重要性密度函数
qk(⋅|x(i)k−1,Zk) 进行采样,即˜x(i)k∼qk(⋅|x(i)k−1,Zk) ,i=1,2,···,Lk−1 ,对应的预测粒子权重为w(i)k|k−1=Φk|k−1(˜x(i)k,x(i)k−1)qk(˜x(i)k|x(i)k−1,Zk)w(i)k−1 (4) 其中,
Φk|k−1(x,ξ)=pS,kfk|k−1(x|ξ) 。假设
pk(⋅|Zk) 为新生目标的概率密度函数,则采样新生粒子˜x(i)k∼pk(⋅|Zk) ,i=Lk−1+1,Lk−1 +2,···,Lk−1+Jk ,对应的权重为w(i)k|k−1=1Jkγk(˜x(i)k)pk(˜x(i)k|Zk) (5) 依据P-PHD滤波算法,用一组带权值的随机样本粒子集
{w(i)k|k−1,˜x(i)k}Lk−1+Jki=1 来表示预测强度函数,即Dk|k−1(x)≈Lk−1+Jk∑i=1w(i)k|k−1δ˜x(i)k(x) (6) 为了进行后续的传感器控制,可依据加权粒子集表示的预测强度,利用峰值提取技术(一般基于聚类算法),得到相应的目标状态集合
ˆXk|k−1 ,利用该集合去生成控制方案决策所需的量测集合。3.2 最大威胁度目标的确立及控制方案的决策
按目标运动参数计算威胁水平通常有两种方法,第1种是将距离、速度等各因素决定的威胁水平进行加权[13],该方法需要在不同的跟踪场景和态势评估条件下对权值进行赋值,对于环境的适应性较差。第2种是经典的(Tactical Significance Map, TSM)函数[14,15],TSM可译作目标战术重要性标绘,该方法考虑了各因素对综合威胁水平贡献程度的非线性变化,处理方式简单。为此,本文依据提取的各目标预测状态
ˆxk|k−1∈ˆXk|k−1 ,选择TSM函数来确定当前时刻各目标的威胁程度。假设当前时刻目标
i 的状态矢量可表示为xi=[pi;˙pi]=[px,i,py,i,˙px,i,˙py,i]T ,其中pi 和˙pi 分别表示目标i 的位置矢量和速度矢量,又假设监测区域中心的位置(本文为传感器的位置)为x0=[px,0,py,0]T ,则目标距离可表示为di=√(px,i−px,0)2+(py,i−py,0)2 (7) 考虑到目标的战术重要性相关于目标与监控区域中心的距离
di ,那么此时的TSM函数表达式为fTSM(xi)∼exp(−d2i2σ2TSM) (8) 由式(8)可以看出,目标距离监控区域中心越近,则其威胁度越高。其中,
σTSM 相关于目标的速度和航向。因此,可将目标速度和航向相互决定的σTSM 描述为σTSM(pi,˙pi)=(1−θ(pi,˙pi)π)(k0‖ (9) 其中,
{k_0} 和{m_0} 为常数,\theta ({{{p}}_i},{\dot {{p}}_i}) 为目标i 的航向角,即目标位置矢量和速度矢量的夹角,求解的表达式为\theta ({{{p}}_i},{\dot {{p}}_i}) = {\cos}^{ - 1}\left( {\frac{{({{{p}}_i},{{\dot {{p}}}_i})}}{{\left\| {{{{p}}_i}} \right\|\left\| {{{\dot {{p}}}_i}} \right\|}}} \right) (10) 其中,
({{{p}}_i},{\dot {{p}}_i}) 表示标量积。综上可得TSM函数的最终表达式为
\begin{align}& {f_{{\rm{TSM}}}}({{{x}}_i}) \\& = \exp \left( {\frac{{ - d_i^2}}{{2{{\left( {1 - \displaystyle\frac{{\theta ({{{p}}_i},{{\dot {{p}}}_i})}}{{{π}} }} \right)}^2}{{({k_0}\left\| {{{\dot {{p}}}_i}} \right\| + {m_0})}^2}}}} \right)\end{align} (11) 依据式(11),可在预测多目标状态集合
{\hat X_{k|k - 1}} 中确定当前时刻最大威胁度目标\hat {{x}}_{{\rm{th}},k|k - 1}^{} 。利用强度粒子云(集合)的聚类结果,提取威胁目标所对应的粒子云,如图1和图2所示。在局部状态空间上,威胁目标的粒子云可对威胁目标强度进行近似描述,它们能够加权近似威胁目标的分布特性。假设对近似强度的粒子集通过K-means进行聚类后,可提取出用来表示威胁目标强度的粒子集为\left\{ w_{{\rm{th}},k|k - 1}^{(i)}, {x}_{{\rm{th}},k|k - 1}^{(i)}\right\} _{i = 1}^{{L_T}} (图1中黑色点所示),即最大威胁度目标的预测强度函数可近似表示为{D_{{\rm{th}},k|k - 1}}({{x}}) \approx \sum\limits_{i = 1}^{{L_T}} {w_{{\rm{th}},k|k - 1}^{(i)}{\delta _{{x}_{{\rm{th}},k|k - 1}^{(i)}}}({{x}})} (12) 其中,
{L_T\,} 表示最大威胁度目标对应的粒子总数。本文研究以最大威胁度目标的信息增益作为评价指标去对传感器控制做决策,控制的目的是使得对威胁度最大目标的跟踪性能达到最优。在这种情况下,本文提出一种控制决策方法,需要计算威胁目标分布特性的信息增益,以它作为传感器控制的评价函数,最终按目标威胁度的优先等级为传感器控制做决策指导,从而全面改善威胁目标的跟踪效果。
对于可行的传感器控制集合
{{U}_k} ,对每一个{{υ}} \in {{U}_k} 确定传感器的位置{{{x}}_{s,k}}({{υ}} ) 。一般来说,可依据检测概率{p_{D,k}}({{x}}) 和杂波强度{\lambda _c} 生成量测,但会造成极大的计算负担。可借鉴传统的处理方法[5–10],即在检测概率{p_{D,k}}({{x}}) = 1 ,以及不考虑量测噪声和杂波的理想情况下,对于每一个{{υ}} \in {{U}_k} 仅生成一个相应的量测。因为我们已经提取了最大威胁目标的分布特性的近似描述,可研究利用最大威胁目标在传感器控制前后的信息增益为传感器控制做最优决策。最大威胁目标的理想量测集可表示为
{{z}_k}({{υ}} ) = h({\hat {{x}}_{{\rm{th}},k|k - 1}},{{{x}}_{s,k}}({{υ}} )) (13) 在执行传感器控制方案
{{υ}} \in {{U}_k} 时,按照式(13)所给定的威胁目标的理想量测集去对预测强度的粒子集进行更新,更新后粒子集只是权值发生了变化。威胁目标强度的粒子权值计算有如下推导,首先根据强度更新公式\begin{align}{D_{k{\rm{|}}k}}({{x}}) =& (1 - {p_{D,k}}({{x}})) \cdot {D_{k|k - 1}}({{x}}) \\& +\!\!\!\sum\limits_{{z} \in {Z_k}} {\frac{{{D_{k|k - 1}}({{x}}){p_{D,k}}({{x}}){g_k}(z|{{x}})}}{{{\kappa _k}({z}) + <\! {p_{D,k}}({{x}}){g_k}({z}|{{x}}){D_{k|k - 1}}({{x}})\! > }}}\end{align} (14)
在局部状态空间上,最大威胁目标强度在其理想量测集合的更新下,考虑到理想量测集合的生成条件,并将式(12)代入式(14),则其强度函数可表示为
\begin{align}& {D_{{\rm{th}},k{\rm{|}}k}}({{x}};{{υ}} ) \\& \quad\approx \sum\limits_{i = 1}^{{L_T}} {\left( {\sum\limits_{{z} \in {{z}_k}({{υ}} )} {\frac{{w_{{\rm{th}},k|k - 1}^{(i)}{g_k}\left({{z}_k}({{υ}} )|{{x}}_{{\rm{th}},k|k - 1}^{(i)}\right)}}{{\displaystyle\sum\limits_{i = 1}^{{L_T}} {w_{{\rm{th}},k|k - 1}^{(i)}} {g_k}\left({{z}_k}({{υ}} )|{{x}}_{{\rm{th}},k|k - 1}^{(i)}\right)}}} } \right)} \\& \quad\quad \cdot {\delta _{x_{{\rm{th}},k|k - 1}^{(i)}}}({{x}})\end{align} (15) 根据式(15)可得更新强度函数为
{D_{{\rm{th}},k|k}}({{x}};{{υ}} ) \approx \sum\limits_{i = 1}^{{L_T}} {w_{{\rm{th}},k|k}^{(i)}({{υ}} ){\delta _{{{x}}_{{\rm{th}},k|k - 1}^{(i)}}}({{x}})} (16) 其中,
\begin{align}w_{{\rm{th}},k|k}^{(i)}{\rm{(}}{{υ}} {\rm{) = }}& w_{{\rm{th}},k|k - 1}^{(i)} \\& \cdot \sum\limits_{{z} \in {{z}_k}({{υ}} )} {\frac{{{g_k}\left({z_k}({{υ}} )|{{x}}_{{\rm{th}},k|k - 1}^{(i)}\right)}}{{\displaystyle\sum\limits_{i = 1}^{{L_T}} {{g_k}\left({{z}_k}({{υ}} )|{{x}}_{{\rm{th}},k|k - 1}^{(i)}\right)w_{{\rm{th}},k|k - 1}^{(i)}} }}} \end{align} (17)
此外,选取Rényi散度作为评价函数,Rényi散度是信息相对熵方法中用来描述两个概率分布之间信息的差异,假设多目标的先验概率密度函数和后验概率密度函数分别为
{p_0} 和{p_1} ,则Rényi散度可表示为{D_r}({p_0},{p_1}) = \frac{1}{{\alpha - 1}}\lg \int {{p_1}{{(X)}^\alpha }{p_0}{{(X)}^{1 - \alpha }}{\rm{d}}X} (18) Ristic[8]依据近似多目标滤波器的统计假设条件推导了Rényi散度的PHD表达式,即以多目标1阶统计矩(PHD)表示多目标Rényi散度。此时,可将评价函数写成式(19)形式
\begin{align}\cal{R}({{υ}} ) =& \int {{D_{k|k - 1}}} ({{x}}){\rm{d}}{{x}} + \frac{\alpha }{{1 - \alpha }}\int {{D_{k|k}}} ({{x}};{{υ}} ){\rm{d}}{{x}} \\&- \frac{1}{{1 - \alpha }}\int \!\!{{D_{k|k - 1}}} {({{x}})^{1 - \alpha }}{D_{k|k}}{({{x}};{{υ}} )^\alpha }{\rm{d}}{{x}} \end{align} (19) 通过上述分析,得到威胁目标的预测强度函数与更新强度函数的粒子近似表示,将式(12)和式(16)代入式(19),进而得到反映传感器控制前后威胁目标信息增益的评价函数,即
\begin{align} {\cal{R}_{{\rm{th}}}}({{υ}} ) =& \int {\sum\limits_{i = 1}^{{L_T}} {w_{{\rm{th}},k|k - 1}^{(i)}{\delta _{{{x}}_{{\rm th},k|k - 1}^{(i)}}}({{x}})} } {\rm{d}}{{x}} \\& + \frac{\alpha }{{1 - \alpha }}\int {\sum\limits_{i = 1}^{{L_T}} {w_{{\rm{th}},k|k}^{(i)}({{υ}} ){\delta _{{{x}}_{{\rm{th}},k|k - 1}^{(i)}}}({{x}})} {\rm{d}}{{x}}} \\& - \frac{1}{{1 - \alpha }}\int {{{\left(\sum\limits_{i = 1}^{{L_T}} {w_{{\rm{th}},k|k - 1}^{(i)}{\delta _{{{x}}_{{\rm{th}},k|k - 1}^{(i)}}}({{x}})} \right)}^{1 - \alpha }}} \\& \cdot {\left(\sum\limits_{i = 1}^{{L_T}} {w_{{\rm{th}},k|k}^{(i)}({{υ}} ){\delta _{{{x}}_{{\rm{th}},k|k - 1}^{(i)}}}({{x}})} \right)^\alpha }{\rm{d}}{{x}} \\ \end{align} (20) 最终,评价函数可写成
\begin{align}{\cal{R}_{{\rm{th}}}}({{υ}} ) \approx &\sum\limits_{i = 1}^{{L_T}} {w_{{\rm{th}},k|k - 1}^{(i)}} + \frac{\alpha }{{1 - \alpha }}\sum\limits_{i = 1}^{{L_T}} {w_{{\rm{th}},k|k}^{(i)}} ({{υ}} ) \\& -\frac{1}{{1 - \alpha }}\sum\limits_{i = 1}^{{L_T}} \left(\!w_{{\rm{th}},k|k - 1}^{(i)} \!\right)^{{1 - \alpha }}\!\!{\left(\!w_{{\rm{th}},k|k}^{(i)}({{υ}} )\!\right)^\alpha }\quad\quad\ \end{align} (21) 其中,
0 < \alpha < 1 。可调整参数\alpha 去强调两个分布拖尾处的Rényi散度。为获取较好的收敛效果,本文选用\alpha = 0.5 进行后续的仿真实验,此时Rényi散度等价于黑林格相似度(Hellinger affinity)。3.3 更新强度函数及重采样
依据式(21)确定传感器在新位置
{{{x}}_{s,k}} 接收到的量测{Z_k} ,对于每个观测值{z} \in {Z_k} ,计算{C_k}({z}) = \displaystyle\sum\nolimits_{j = 1}^{{L_{k - 1}} + {J_k}} \!\!{{\varphi _{k,z}}\!\left(\tilde {{x}}_k^{(j)}\right)\!w_{k|k - 1}^{(j)}} , {\varphi _{k,z}}({{x}}) \!=\! {p_{D,k}}({{x}}){g_k}({z}|{{x}}) ,然后更新粒子权重得到\begin{align} \tilde w_{k|k}^{(i)} =& \left[1 - {p_{D,k}}\left(\tilde {{x}}_k^{(i)}\right) + \sum\limits_{{z} \in {Z_k}} {\frac{{{\varphi _{k,z}}\left(\tilde {{x}}_k^{(i)}\right)}}{{{\kappa _k} + {C_k}({z})}}} \right]\\& \cdot w_{k|k - 1}^{(i)}, \ i = 1,2,·\!·\!· ,{L_{k - 1}} + {J_k}\end{align} (22) 计算目标的估计数目:
{\hat N_{k|k}} = \sum\limits_{j = 1}^{{L_{k - 1}} + {J_k}} {\tilde w_{k|k}^{(j)}} (23) 对归一化的粒子集
\left\{ \left(\tilde w_{k|k}^{(i)}\Bigr/{\hat N_{k|k}}\right),\tilde {{x}}_k^{(i)}\right\} _{i = 1}^{{L_{k - 1}} + {J_k}} 重新采样,得到粒子集\left\{ w_{k|k}^{(i)}\Bigr/{\hat N_{k|k}},{{x}}_k^{(i)}\right\} _{i = 1}^{{L_k}} ,并通过{\hat N_{k|k}} 对权值进行调整得到\left\{ w_{k|k}^{(i)},{{x}}_k^{(i)}\right\} _{i = 1}^{{L_k}} 。4. 仿真
4.1 传感器控制集合
如果
k 时刻传感器的实际控制位置为{{{x}}_{s,k}} = {[{x_{s,k}},{y_{s,k}}]^{\rm{T}}} ,那么k + 1 时刻传感器所有可能出现的位置集合{{U}_{k + 1}} 可表示为\begin{align}{{U}_{k + 1}} =& \{ ({x_{s,k}} + (j{v_{s,c}}T/{N_R}) \cdot \cos (l \times 2{{π}} /{N_\theta });\\&\quad {y_{s,k}} + (j{v_{s,c}}T/{N_R}) \cdot \sin (l \times 2{{π}} /{N_\theta })),\\ &\quad j = 1,2,·\!·\!· ,{N_R};l = 1,2, ·\!·\!· ,{N_\theta }\} \end{align} (24) 本文选用
{N_R} = 2,{N_\theta } = 8 ,则传感器的控制方案共有17种(包含传感器处于静默状态)。{v_{s,c}} 是传感器自身的容许控制速度,取值为10 m/s。4.2 场景
设定监控区域为
[ - {{π}} ,{{π}} ] \times [0, 1500 m],并在该区域中构造场景进行Monte Carlo仿真。T = 1 s为量测采样周期,总共采样50次。检测概率{p_{D,k}}{\rm{ = 0}}{\rm{.98}} ,目标存活概率{p_{S,k}}{\rm{ = 0}}{\rm{.99}} ,杂波是一个泊松RFS,且在监控区域内服从平均数\lambda = 5 的均匀分布。单目标粒子采样数为500。设置TSM函数的参数,{k_0} = 500 ,{m_0} = 1250 。本文选用K-means算法对强度的加权粒子集进行聚类。另外,本文采用OSPA(Optimal SubPattern Assignment)距离[16]评估多目标跟踪的性能。先给出其定义:设多目标状态集合为
X = \{ {{x}_1}{\rm{,}}{{x}_2}{\rm{,}}·\!·\!· {\rm{, }}{{x}_n}\} ,相应的状态估计集合为Y = \{ {{y}_1}{\rm{,}}{{y}_2}{\rm{,}}·\!·\!· {\rm{, }}{{y}_m}\} ,若n \le m ,则OSPA距离定义为\begin{align}& \bar d_p^{(c)}(X{\rm{,}}Y\,) \\& \quad =\! {\left(\! {\frac{1}{m}\left(\!\mathop {{\rm{min}}}\limits_{{{π}} \in {{Π} _m}} \sum\limits_{i = 1}^n {{d^{(c)}}{{\left({{x}_i}{\rm{, }}{{y}_{{{π}} (i)}}\right)}^p} \!+\! {c^p}(m - n)} \right)}\!\! \right)^{{1/p}}}\end{align} (25)
其中,
{\bar d^{(c)}}({x}{\rm{, }}{y}) = {\rm{min(}}c{\rm{,}}\left\| {{x} - {y}} \right\|{\rm{)}} ,{{Π}\!_m} 表示所有\{ 1{\rm{,2,}} ·\!·\!· {\rm{,}}m\} 的排列构成的集合,如果n > m ,则\bar d_p^{(c)}(Y{\rm{,}}X) = \bar d_p^{(c)}(X{\rm{,}}Y\;) 。距离阶次p \ge 1 ,截断系数c > 0 。实验中选取c = 40 m,p = 1 。场景中目标轨迹均为近常速运动模型,共计出现5个目标。状态转移密度为
f\left( {{{x}_k}|{{x}_{k - 1}}} \right) = \cal{N}\left( {{{x}_k};{{F}_k}{{x}_{k - 1}},{{Q}_k}} \right) (26) 其中,
{{{F}}\!_k} = \left[ {\begin{array}{*{20}{c}} 1&T \\ 0&1 \end{array}} \right] \otimes {{{I}}_2},{{{Q}}_k} = \sigma _v^2\left[ \begin{gathered} {{{T\;^2}}/2} \\ T \\ \end{gathered} \right] \otimes {{{{{I}}}}_2} (27) 其中,
\otimes 是Kronecker积,{{I}_d} 代表d \times d 的单位阵,{\sigma _v} = 5 m/s2。新生目标随机集服从泊松分布,其PHD为
{\gamma _k}({{x}}) = \sum\limits_{i = 1}^5 {w_\gamma ^{} \cdot \cal{N}\left( {{x};{{m}}_\gamma \!\!\!^{(i)},{{P}}\!_\gamma} \right)} (28) 其中,
w_\gamma ^{} = 0.1 ,{{m}}_\gamma\!\! ^{(1)} = {[ - 450, \ - 450,\ 0,\ 0]^{\rm{T}}} ,{{m}}_\gamma\!\!^{\raisebox{1pt}{(2)}} = {[300, - 300,0,0]^{\rm{T}}} ,{{m}}_\gamma\!\!^{\raisebox{1pt}{(3)}} = {[400,300,0,0]^{\rm{T}}} ,{{m}}_\gamma\!\!^{\raisebox{1pt}{(4)}} = {[ - 300,200,0,0]^{\rm{T}}} ,{{m}}_\gamma\!\!^{\raisebox{1pt}{(5)}} = {[300, - 200,0,0]^{\rm{T}}} ,{{P}}\!\!_\gamma = {\rm{diag}}\left({[100,100,100,100]^{\rm{T}}}\right) 。按式(28)所给定的新生强度分布进行新生粒子采样。对于距离方位跟踪(Range-Bearing Tracking, RBT),量测方程有式(29)形式
{{z}_k} = \left[ \begin{gathered} \sqrt {{{({x_k} - {x_{s,k}})}^2} + {{({y_k} - {y_{s,k}})}^2}} \\{{\rm tan}^{ - 1}}\left( {\frac{{{y_k} - {y_{s,k}}}}{{{x_k} - {x_{s,k}}}}} \right) \\ \end{gathered} \right] + {{v}_k} (29) 量测噪声服从高斯分布,即
{{v}_k}\sim\cal{N}\left( { \cdot ;{0_{2 \times 1}},{R_k}} \right) ,{R_k} = {\rm{diag}}\{ {[\sigma _r^2,\sigma _\theta ^2]^{\rm{T}}}\} ,{\sigma _r} = 5 m,{\sigma _\theta } = \left( {{{π}} /180 } \right) rad。4.3 仿真实验
通过多目标距离方位跟踪(RBT)的仿真实验,目标轨迹如图3所示,传感器的初始位置位于坐标原点。
首先选择P-PHDF在设定的场景下进行多目标跟踪实验。方案1是基于最大威胁度目标的传感器控制方法。方案2是基于多目标整体的信息增益作为评价函数进行的传感器控制。
多目标跟踪效果如图4所示,在跟踪过程中,依据多目标的运动态势(位置、速度和航向角)来评估目标的威胁水平,并借助TSM函数来确立各个时刻最大威胁目标(如图4中“+”所示)。从单次实验对多目标RBT跟踪中的传感器控制轨迹(放大图如图5所示)可以看出,在整个控制过程中,传感器会依据最大威胁度目标控制前后所带来的信息增益最大化为准则对传感器的位置进行调节,始终保证并改进对威胁目标的跟踪估计水平。此外,因为各个目标和传感器之间的相对运动和距离也在不断发生变化,所以各目标的威胁水平也在时刻变化,伴随着最大威胁度目标的转变,在整个跟踪过程中,传感器会发生明显的机动控制作用去适应最大威胁度目标及其概率密度的变化。最终获取能使威胁目标跟踪性能达到最优的传感器控制方案。
同时,进行100次Monte Carlo (MC) 仿真实验,两种控制方案的多目标状态估计的OSPA距离统计如图6所示。可以看出,两种控制方案都有着不错的跟踪性能,方案2的跟踪效果整体上要略优于方案1。这是因为,方案2是在多目标整体信息增益最大化的准则下,得到相应的传感器控制方案,目的是要使多目标的整体跟踪性能达到最优,所以方案2在OSPA统计量的评价上略优于方案1是不难理解的。
此外,图7给出了两种控制方案中仅对最大威胁度目标状态估计的OSPA距离统计。可以看出,方案1的跟踪效果大体上要优于方案2,这也验证了,针对威胁度评估的传感器控制方法确实明确了传感器的跟踪优先级。方案1依据传感器控制前后最大威胁度目标所带来的信息增益最大化准则进行传感器控制的决策,进而求解出适应于当前条件下(基于实时多目标威胁评估)的最优传感器控制方案。
图8显示了多目标跟踪中基于威胁度评估的传感器控制方案在100次MC仿真中所有传感器控制的位置。可以看出,每次独立仿真实验中传感器的运动轨迹都不大一致(受杂波和噪声的影响),但是该轨迹云仍能够充分呈现出仿真场景下多目标RBT中的基于威胁度评估的传感器最优轨迹控制的总体趋势。
5. 结束语
本文的重点和创新点在于提出一种基于目标威胁度评估的传感器控制策略。首先,基于目标运动态势评估多目标威胁水平,并借助TSM函数选取最大威胁度目标,利用强度粒子云(集合)的聚类结果,提取威胁目标所对应的粒子云。进而在局部状态空间上,依据Rényi散度的PHD表达式,求解出最终的传感器控制方案。最后,通过仿真实验验证算法的有效性。在今后的研究中,可以将本文的研究思路推广到其他基于RFS的近似多目标滤波器,去研究基于威胁评估的传感器控制方法,例如势概率假设密度(Cardinalized PHD, CPHD)滤波器,多伯努利(MBer)滤波器,以及带航迹标识的广义标签多伯努利(Generalized Labeled Multi-Bernoulli, GLMB)滤波器。
-
MAHLER R P S. Advances in Statistical Multisource-Multitarget Information Fusion[M]. Norwood, MA: Artech House, 2014: 825–860. GOSTAR A K, HOSEINNEZHAD R, RATHNAYAKE T, et al. Constrained sensor control for labeled multi-Bernoulli filter using Cauchy-Schwarz divergence[J]. IEEE Signal Processing Letters, 2017, 24(9): 1313–1317 doi: 10.1109/LSP.2017.2723924 CHANGWEN Q and YOU H. A method of threat assessment using multiple attribute decision making[C]. The 6th IEEE International Conference on Signal Processing, Beijing, China, 2002: 1091–1095. doi: 10.1109/ICOSP.2002.1179979. MAHLER R P S. Statistical Multisource-Multitarget Information Fusion[M]. Norwood, MA: Artech House, 2007: 655–667. 陈辉, 韩崇昭. 机动多目标跟踪中的传感器控制策略的研究[J]. 自动化学报, 2016, 42(4): 512–523 doi: 10.16383/j.aas.2016.c150529CHEN Hui and HAN Chongzhao. Sensor control strategy for maneuvering multi-target tracking[J]. Acta Automatica Sinica, 2016, 42(4): 512–523 doi: 10.16383/j.aas.2016.c150529 HOANG H G and VO B T. Sensor management for multi-target tracking via multi-Bernoulli filtering[J]. Automatica, 2014, 50(4): 1135–1142 doi: 10.1016/j.automatica.2014.02.007 RISTIC B and ARULAMPALAM S. Bernoulli particle filter with observer control for bearings-only tracking in clutter[J]. IEEE Transactions on Aerospace and Electronic Systems, 2012, 48(3): 2405–2415 doi: 10.1109/TAES.2012.6237599 RISTIC B, VO B N, and CLARK D. A note on the reward function for PHD filters with sensor control[J]. IEEE Transactions on Aerospace and Electronic Systems, 2011, 47(2): 1521–1529 doi: 10.1109/TAES.2011.5751278 RISTIC B and VO B T. Sensor control for multi-object state space estimation using random finite sets[J]. Automatica, 2010, 46(11): 1812–1818 doi: 10.1016/j.automatica.2010.06.045 陈辉, 贺忠良, 刘备. 多目标跟踪中基于信息熵测度的传感器控制方法[J]. 控制与决策, 2018, 33(2): 337–344 doi: 10.13195/j.kzyjc.2016.1424CHEN Hui, HE Zhongliang, and LIU Bei. Sensor control method based on information entropy measure for multi-target tracking[J]. Control and Decision, 2018, 33(2): 337–344 doi: 10.13195/j.kzyjc.2016.1424 VO B N, SINGH S, and DOUCET A. Sequential Monte Carlo methods for multitarget filtering with random finite sets[J]. IEEE Transactions on Aerospace and Electronic Systems, 2005, 41(4): 1224–1245 doi: 10.1109/TAES.2005.1561884 MAHLER R P S. Multitarget Sensor Management of Dispersed Mobile Sensors[M]. Singapore: World Scientific Publishing, 2004: 239–310. KATSILIERIS F, DRIESSEN H, and YAROVOY A. Threat-based sensor management for target tracking[J]. IEEE Transactions on Aerospace and Electronic Systems, 2015, 51(4): 2772–2785 doi: 10.1109/TAES.2015.140052 EL-FALLAH A, ZATEZALO A, MAHLER R P S, et al. Unified Bayesian situation assessment sensor management[C]. Proceedings of SPIE Signal Processing, Sensor Fusion, and Target Recognition, Orlando, USA, 2005: 253–264. doi: 10.1117/12.605435. EL-FALLAH A, ZATEZALO A, MAHLER R P S, et al. Advancements in situation assessment sensor management[C]. Defense and Security Symposium. International Society for Optics and Photonics, FL, USA, 2006: 62350M. doi: 10.1117/12.665933. SCHUHMACHER D, VO B T, and VO B N. A consistent metric for performance evaluation of multi-object filters[J].IEEE Transactions on Signal Processing, 2008, 56(8): 3447–3457 doi: 10.1109/TSP.2008.920469 期刊类型引用(8)
1. 田金龙,鲍鹏飞. 基于熵权-AHP的海空目标威胁度评估方法. 雷达与对抗. 2024(02): 32-35 . 百度学术
2. 陈辉,魏凤旗,韩崇昭. 多扩展目标跟踪中基于多特征优化的传感器控制方法. 电子与信息学报. 2023(01): 191-199 . 本站查看
3. 宋晓程,李陟,任海伟,易伟. 目标动态威胁度驱动的分布式组网相控阵雷达资源优化分配算法. 雷达学报. 2023(03): 629-641 . 百度学术
4. 张恺桐,闫涛,韩崇昭,田梦. 基于威胁程度的目标跟踪传感器管理方法. 指挥信息系统与技术. 2022(01): 39-44 . 百度学术
5. 单甘霖,庞策,段修生. 面向作战任务的最小风险传感器调度方法. 国防科技大学学报. 2020(02): 186-193 . 百度学术
6. 田晨,裴扬,侯鹏,赵倩. 基于决策不确定性的多目标跟踪传感器管理. 航空学报. 2020(10): 267-280 . 百度学术
7. 庞策,单甘霖,段修生. 目标威胁等级风险控制传感器管理方法. 西安电子科技大学学报. 2019(02): 95-100 . 百度学术
8. 庞策,单甘霖,段修生,崔魁文. 基于风险理论的主动传感器管理方法及应用研究. 电子学报. 2019(07): 1425-1433 . 百度学术
其他类型引用(12)
-