Loading [MathJax]/jax/output/HTML-CSS/jax.js
高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

高分辨率遥感图像的聚类

邓湘金 王彦平 彭海良

殷礼胜, 唐圣期, 李胜, 何怡刚. 基于整合移动平均自回归和遗传粒子群优化小波神经网络组合模型的交通流预测[J]. 电子与信息学报, 2019, 41(9): 2273-2279. doi: 10.11999/JEIT181073
引用本文: 邓湘金, 王彦平, 彭海良. 高分辨率遥感图像的聚类[J]. 电子与信息学报, 2003, 25(8): 1073-1080.
Lisheng YIN, Shengqi TANG, Sheng LI, Yigang HE. Traffic Flow Prediction Based on Hybrid Model of Auto-Regressive Integrated Moving Average and Genetic Particle Swarm Optimization Wavelet Neural Network[J]. Journal of Electronics & Information Technology, 2019, 41(9): 2273-2279. doi: 10.11999/JEIT181073
Citation: Deng Xiangjin, Wang Yanping, Peng Hailiang. The clustering of high resolution remote sensing imagery[J]. Journal of Electronics & Information Technology, 2003, 25(8): 1073-1080.

高分辨率遥感图像的聚类

The clustering of high resolution remote sensing imagery

  • 摘要: 高分辨率遥感图像中的细小目标(如道路等)使图像的同类区域表现变得不一致,从而增加了高分辨率图像聚类的难度,本文提出了一种高分辨率遥感图像的聚类方法,其聚类过程包括如下三个步骤:第一步,在滑动窗口内使用消除次要成分法处理遥感图像,该处理过程使用一维形态学分水岭技术获得直方图中的左侧阈值和右侧阈值,再根据这两个阈值滤除图像中的次要成分;第二步,计算滑动窗口内的图像特征;第三步根据图像特征量利用BPC(Back Propagation and Competitive)网络进行图像聚类。三组试验(本文提出的聚类算法,最邻近距离聚类法,K均值聚类法)表明本文提出的图像聚类方法可以有效实现高分辨率遥感图像的聚类。
  • 短时交通流预测的实时性和准确性决定了交通流的控制精度和诱导效果,其研究成为交通领域研究的重要内容之一[1,2]。短时交通流预测方法大致分为基于数理统计方法和基于智能算法方法[3,4]。其中数理统计方法包括基于整合移动平均自回归(ARIMA)模型等,这种方法模型简单,但所需数据量大且预测精度差。智能算法方法包括人工神经网络(Artificial Neural Network, ANN)等,这种方法预测精度较好,但易出现过拟合和收敛速度慢。近年来对两种方法进行组合的研究越来越流行,李松等人[5]采用遗传算法优化BP神经网络的方法来预测短时交通流,该方法克服了易陷入局部最优等缺陷,但会增加其预测时间。谭满春等人[6]采用ARIMA模型对短时交通流时间序列线性部分进行预测,用人工神经网络对其非线性残差部分进行预测,但其方法依然是ARIMA模型作为主要的预测模型,神经网络仅仅用于修正预测误差。从而当交通流发生急剧振荡时会严重影响模型预测性能。

    综上所述,仅用某一种模型进行预测,很难进一步提高短时交通流预测的准确性。为突出平稳段和非平稳段相结合的预测优势,本文尝试在灰色关联分析法进行对遗传粒子群优化小波神经网络(Genetic Particle Swarm Optimization Wavelet Neural Network, GPSOWNN)输入结构简化的基础上,增加了ARIMA模型预测值输入的组合形式。该方法克服了平稳段与非平稳段的预测数据在单一预测模型的预测精度的局限性,并且增加遗传粒子群算法进行优化,以达到加快网络训练收敛速度和使其结果不易陷入局部最优的效果,最终实现对短时交通流预测性能的改善。

    自回归移动平均模型的基本模型是ARMA(p, q),其表达式为

    Yt=φ1Yt1+φ2Yt2+···+φpYtp+εtθ1εt1θ2εt2···θqεtq (1)

    其中,Yt为预测的时间序列,φ为AR模型参数,θ为MA模型参数,ε为零均值白噪声,p为自回归项,q为移动平均项数,t是时间索引。其模型针对的是平稳时间序列,而差分自回归滑动平均模型(ARIMA)是在ARMA模型基础上加了差分变换[79]。差分变换能使非平稳时间序列平稳化,所以ARIMA模型也可以用于非平稳时间序列,它的模型一般简化为ARIMA(p, d, q),其表达式为

    φp(B)(1B)dYt=θq(B)εt (2)

    其中,B是后移算子,BYt=Yt1, d是差分次数。

    遗传算法是模拟优胜劣汰法则和生物进化过程的优化搜索算法,它将输入参数进行编码,再通过交叉、变异等运算改变编码参数信息,然后计算适应度来筛选出优良的参数[10]。粒子群算法是通过对鸟类群体的行为规律进行总结提出的,它是通过跟随单个粒子和粒子群极值来完成极值寻优[11]。遗传粒子群算法继承了粒子群算法的编码方式,并应用了遗传算法中通过交叉、变异等运算寻找最优解的方式,从而能够结合两种算法快速收敛和全局寻优的优点。

    小波神经网络的结构与BP神经网络相似,不同点是小波神经网络的激活函数选用的是Morlet小波基函数[12,13]。小波神经网络的基函数是根据小波理论确定的,从而避免了结构设计的盲目性,小波神经网络结合了小波变换的时域局部特性和神经网络的自学习、鲁棒性、自适应的优势。小波神经网络预测步骤如下:

    步骤 1 初始化小波平移因子bj,伸缩因子aj,连接权值和阈值wij等参数。

    步骤 2 将样本分为训练样本和测试样本,根据训练样本计算隐含层输出和输出层输出。小波神经网络隐含层输出公式为

    hj=Mj(ki=1wijxibjaj),j=1,2,···,l (3)

    其中,hj为隐含层第j个节点的输出,Mj为小波基函数,wij为输出层和隐含层的连接权值,bj为小波基函数的平移因子,aj为小波基函数的伸缩因子,l为隐含层节点数。

    步骤 3 计算预测输出和测试样本的误差。

    步骤 4 根据步骤3计算出的误差调整小波神经网络的权值和阈值,判断误差是否小于可接受最大误差或者迭代次数是否大于最大迭代次数,如果是则输出预测值,否则转到步骤3。

    本文的实验数据提取于纽约Huguenot Ave 2013年的2月2日~2月8日之间300个数据样本,每个数据样本之间相隔15 min。针对这些数据,设实时交通流数据的表达式为X(t)={x(t),x(t1),···,x(tp)},其中X(t)为实时时刻后连续p个时刻的交通流数据,历史交通流数据为X(t1)={x(t1),x(t2),···,x(tp1)},X(t2)={x(t2),x(t3),···,x(tp2)},···,X(tn)={x(tn),x(tn2),···,x(tpn)},其中X(tn)为实时时刻前第n时刻后连续p个时刻的交通流数据。

    3.2.1   模型选择

    构建ARIMA模型最主要的工作是确定ARIMA模型中参数pdq的值。首先确定差分次数d的值,通过单位根检验对交通流数据样本进行平稳性检验,对于非平稳时间序列反复进行差分处理,直到修正后的时间序列平稳化为止。由3.1节提取的交通流时间序列通过1次差分处理即能平稳,从而该模型差分系数d为1。然后确定自回归项p和移动平均项q的值,首先观察自相关图和偏相关图来确定pq的可能值。图1为自相关图,可以观察到自相关在滞后lag=1时拖尾,从而p值的可能值为1或2。图2为偏自相关图,可以观察到偏自相关在滞后lag=2时拖尾,从而q值的可能值为2或3。然后用赤池信息量准则(Akaike Information Criterion, AIC)对p, q进行最佳估计,AIC值可以反映数据拟合程度,AIC值越小拟合越优良。将交通流数据代入到ARIMA(1,1,2), ARIMA(2,1,2), ARIMA(1,1,3), ARIMA(2,1,3)4种模型并分别计算AIC值,结果如表1, ARIMA(1,1,2)模型的AIC值最小,从而可断定该交通流序列最适合ARIMA(1,1,2)模型。选用前250个数据样本作为训练样本,用来预测后面50个数据样本。训练过程为用最小二乘法估计模型的参数,拟合结果如图3。在3.2.2节进一步对模型的好坏进行检验。

    图 1  自相关分析
    图 2  偏自相关分析
    表 1  4组模型的AIC值
    模型AIC值
    ARIMA(1, 1, 2)7.210306
    ARIMA(2, 1, 2)7.426953
    ARIMA(1, 1, 3)7.250197
    ARIMA(2, 1, 3)7.509981
    下载: 导出CSV 
    | 显示表格
    图 3  ARIMA(1,1,2)模型预测值和实际值对比
    3.2.2   模型检验

    交通流数据的变化率越大则其变化更剧烈,由图4可知,如24~25, 26~27以及47~48的交通流时间序列段,其交通流实际值的斜率变化都非常大,这些序列段的交通流数据变化较其他序列段更剧烈,而由图5可知,上述序列段与其他序列段相比误差绝对值更大,可以判断ARIMA模型对剧烈变化的时间序列预测效果差,从而仅用ARIMA模型并不能达到很好的预测效果,在3.3节中会将ARIMA模型和GPSOWNN模型进行结合。

    图 4  交通流实际值各点斜率
    图 5  ARIMA(1, 1, 2)模型预测值和实际值的误差绝对值

    构建神经网络模型应首先确定模型的输入和输出,以及隐含层节点数。本文模型的输入是由ARIMA模型预测值和预测时刻的历史数据组成,为了排除相关性小的历史数据以提升模型的预测速度,先通过灰色关联分析法计算预测时刻与历史时刻的灰色关联系数。灰色关联分析法是作为衡量序列间关联程度的一种方法,灰色关联系数越大则相关性越大[14]。最后筛选出关联系数大的历史数据。

    算法1 灰色关联分析法

    步骤 1 求各交通流时间序列的初值像,计算式子如式(4)

    Xki=Xki/xki(1)=(xki(1),xki(2),···,xki(j)),i=1,2,···,n;j=1,2,···,m (4)

    其中,xki为前第i个历史时刻的交通流时间序列的初值像,Xki为前第i个历史时刻的交通流时间序列,xki(j)为前第i个历史时刻的交通流时间序列的初值像的第j数据。

    步骤 2 对各历史时刻的交通流时间序列的初值像进行求差运算,计算式子如式(5)

    Δi(j)=|xk(j)xki(j)|,j=1,2,···,m (5)

    其中,xk(j)为预测时刻的交通流时间序列的初值像的第j数据,Δi(j)为前第i个历史时刻的交通流时间序列的初值像与预测时刻的交通流时间序列的初值像的差的绝对值。

    步骤 3 找出步骤2求得的求差序列中的最大值与最小值,计算式子如式(6)和式(7)

    M=maximaxjΔi(j) (6)

    其中,M为求差序列的最大值。

    m=miniminjΔi(j) (7)

    其中,m为求差序列的最小值。

    步骤 4 计算每个历史时刻的交通流时间序列中的每个数据与对应的预测时刻的交通流时间序列数据的灰色关联系数,计算式如式(8)

    γi(j)=m+ξMΔi(j)+ξM,j=1,2,···,m;ξ(0,1) (8)

    其中,γi(j)为前第i个历史时刻的交通流时间序列的第j数据与预测时刻的交通流时间序列的第j数据的灰色关联系数,ξ为常数通常为0.5。

    步骤 5 得到每个历史时刻的交通流时间序列与预测时刻的交通流时间序列的灰色关联系数为

    γi=1mmj=1γi(j),i=1,2,···,n (9)

    其中,γi为前第i个历史时刻的交通流时间序列与预测时刻的交通流时间序列的灰色关联系数。

    步骤 6 输出实时时刻与各历史时刻的灰色关联系数。

    将预测时刻与前7个历史时刻的交通流时间序列(每个序列100个数据)用灰色关联分析法进行计算。计算结果为表2

    表 2  实时时刻与历史时刻的灰色关联系数
    交通流历史时刻时间
    序列xki (i=1, 2, ···, 7)
    xk的灰色关联系数
    xk10.8271
    xk20.8155
    xk30.6546
    xk40.5346
    xk50.5146
    xk60.5126
    xk70.5453
    下载: 导出CSV 
    | 显示表格

    当两个时间序列的灰色关联系数大于0.6时,可认为它们之间有很强的相关性,由表2可知只有前3个时刻与实时时刻的相关性强,从而将预测时刻的前3个时刻的时间序列和用ARIMA模型算出的实时数据预测值作为GPSOWNN模型的4个输入,模型输出为预测时刻交通流值。现有能确定神经网络隐含层节点数的方法只有经验法,本文采用的是一个经验公式确定隐含层节点数,如式(10)

    h=m+n+α (10)

    其中,h为隐含层节点数目,m为输入层节点数目,n为输出层节点数目,α为10以内的常数。通过修改α的值,反复试凑选取最优值,当隐含层节点数为6时预测效果最好。具体的结构图如图6

    图 6  ARIMA-GPSOWNN组合网络拓扑结构

    图6中,wijwjk分别是输入层到隐含层和隐含层到输出层的连接权值。其初始值都是由遗传粒子群算法计算得到。

    ARIMA-GPSOWNN算法是利用遗传粒子群算法、灰色关联分析法对ARIMA和小波神经网络组合模型进行优化的算法,其结合了遗传粒子群算法加快模型网络的收敛速度的优势以及灰色关联分析法减少干扰项对预测性能的影响的优点,最终达到优化预测模型效果。

    算法2 ARIMA-GPSOWNN算法

    步骤 1 选取构建好的交通流时间序列的前250个数据作为ARIMA模型的训练样本;

    步骤 2 对训练样本进行归一化处理,将数据值投射到[0, 1]区间;

    步骤 3 将步骤2中处理后的数据输入到3.2节已构建好的ARIMA(1, 1, 2)模型中;

    步骤 4 利用ARIMA模型进行预测,得到ARIMA模型预测交通流数据集;

    步骤 5 对步骤4中的预测结果进行反归一化处理,将其作为ARIMA模型预测序列;

    步骤 6 调用算法1得到的与实时时间序列相关性强的历史时间序列与步骤5中的ARIMA模型预测序列作为GPSOWNN网络的输入;

    步骤 7 利用遗传粒子群算法对小波神经网络的伸缩因子、平移因子、连接权值和阈值的初始值进行最优选取;

    步骤 8 计算隐含层输出和输出层输出,利用误差的反向传播调整小波神经网络的参数,目的是使误差函数达到最小值。为了加速算法的收敛速度,采用熵函数作为误差函数,它与2次误差函数相比,能够提高神经网络的收敛速度,当误差相同时,与2次误差函数相比,熵函数调节的梯度更大,从而使权重w调整的更快,最终使训练速度更快。具体公式如式(11)

    e=mk=1|yn(k)lny(k)+(1yn(k))ln(1y(k))|

    (11)

    其中,yn(k)为期望输出,y(k)为实际输出;

    步骤 9 判断误差是否小于可接受最大误差以及迭代次数是否达到最大值。如果是则保存调整好的小波神经网络参数,并输出实时交通流预测值。否则转到步骤8。

    本文以标准偏差为评判模型预测精度好坏的标准,标准偏差公式为

    σ=1nni=1(xr(i)x(i))2 (12)

    其中,σ为标准偏差,n为交通流数据的个数,xr为实际交通流数据,x为预测交通流数据。

    一个模型预测性能的好坏可以由该模型的收敛速度和预测精度反映出来。取一组交通流数据样本输入到GWNN和GPSOWNN模型中,分别画出两个模型的进化过程,通过图7图8可得GWNN需要在迭代6次后才能找到全局最优解,而GPSOWNN只需迭代4次就可以找到全局最优解,显然使用遗传粒子群算法优化后的小波神经网络的收敛速度更快,从而GPSOWNN模型的预测性能要优于GWNN模型。

    图 7  GWNN进化过程
    图 8  GPSOWNN进化过程

    为了比较ARIMA模型与GPSOWNN模型以及其组合模型的预测精度,分别用ARIMA模型和GPSOWNN组合模型、ARIMA模型、WNN模型对交通流进行预测,并画出预测样本的预测图和偏差图。

    图9图10可知当在比较平稳的时间段,如交通流时序数据在5~10段或35~40段,ARIMA模型的预测精度明显比GPSOWNN模型更精准,而在数据急剧变化时,如交通流时序数据在25~30段或45~50段,GPSOWNN模型的预测精度明显比ARIMA模型更精准,而其组合模型综合了两者的优点。由表3可得ARIMA模型预测精度最粗略,GPSOWNN模型预测精度其次,两者组合模型预测精度最精准,其相对于ARIMA模型和GPSOWNN模型总标准误差分别降低了35.8%和20.3%。综上所述,ARIMA和GPSOWNN组合模型的预测性能比其单个模型更好。

    图 9  各模型预测结果与实际值的比较
    图 10  各模型的预测误差对比
    表 3  3种模型的总标准误差
    模型总标准误差
    GPSOWNN和ARIMA组合模型294.5303
    GPSOWNN模型369.7026
    ARIMA模型459.0784
    下载: 导出CSV 
    | 显示表格

    本文根据短时交通流量的实时数据,从预测模型的简化和算法优化两方面,提出一种ARIMA与GPSOWNN组合模型对其进行预测。通过仿真结果可知,其预测性能明显优于ARIMA模型和GPSOWNN模型,在一定程度上提高了短时交通流预测性能。这种组合模型的方式为交通流预测的研究提供了新思路。但本文并没有分析天气以及其他路口对本路段交通流的影响,因此对这类问题的研究将是下一步的研究内容。

  • 骆剑承.周成虎,杨艳,人工神经网络遥感影像分类模型及其与知识集成方法研究,遥感学报,2001,5(2),122-129.[2]A. Banerjee, P. Burlina, F. Alajaji, Image segmentation and labeling using the Polya Urn model,IEEE Trans. on Image Processing, 1999, 8(9), 1243-1253.[3]G. Kuntimad, H. S. Ranganath, Perfect image segmentation using pulse coupled neural networks,IEEE Trans. on Neural Networks, 1999, 10(3), 591-598.[4]Y.A. Tolias, S. M. Panas, Image segmentation by a fuzzy clustering algorithm using adaptive spatially constrained membership functions, IEEE Trans. on Syst., Man, and Cybernetics, part A: Syst. and Humans, 1998, 28(3), 359-369.[5]Y. Dong, A. K. Milne, B. C. Forster, Segmentation and classification of vegetated areas using polarimetric SAR image data, IEEE Trans. on Geoscience and Remote Sensing, 2001, 39(2),321-329.[6]S.R. Seethalakshmy, P. Srivastava, J. Majumdar, Multi-modal image segmentation using a modified Hopfield neural network, Pattern Recognition, 1998, 31(6), 743-750.[7]J.E. Koss, F. D. Newman, T. K. Johnson, D. L. Kirch, Abdominal organ segmentation using texture transforms and a Hopfield neural network, IEEE Trans. on Medical Imaging, 1999, 18(7),640-648.[8]T. Nelson, K. O. Niemann, M. Wulder, Spatial statistical techniques for aggregating point objects extracted from high spatial resolution imagery, IEEE IGARSS(International Geoscience and Remote Sensing Symposium), 2001, (from the CD-ROM of 2001 IEEE IGARSS).Q. Zhang, J. Wang, P. Gong, P. Shi, Texture analysis for urban spatial pattern study usingSPOT imagery, IEEE IGARSS(International Geoscience And Remote Sensing Symposium), 2001. (from the CD-ROM of 2001 IEEE IGARSS)[9]J. A. Bendiktsson, M. Pesaresi, Feature extracted and classification of urban high-resolution satellite imagery based on morphological preprocessing, IEEE IGARSS(International Geoscience And Remote Sensing Symposium), 2001, (from the CD-ROM of 2001 IEEE IGARSS).[10]P. Soille, Morphological Image Analysis: Principles and Applications, New York, Springer-Verlag,1999, 1-158.[11]Cris L. Luengo Hendriks, Marjolein van der Glas, Lucas J. van Vliet, Image Analysis, CSP:Computer Service Labs, Delft University, Holland, November 6, 2001, 28-30.[12]Chris Oliver, Shaun Quegan, Understanding Synthetic Aperture Radar Images, Boston/London,Artech House, Inc., 1998, 195-295.[13]M.B. Charles, F. D. Timothy, D. Kevin, Automatic land-cover classification of a Barrier Island in the Virginia coast, IEEE IGARSS(International Geoscience And Remote Sensing Symposium),2001, (from the CD-ROM of 2001 IEEE IGARSS).[14]边肇祺,等编著,模式识别,北京,清华大学出版社,1988,216-284[15]姚天任,孙洪著,现代数字信号处理,武汉,华中科技大学出版社,1999,183-201.[16]邹谋炎,反卷积和信号复原,北京,国防工业出版社,1999,12-63.
  • 期刊类型引用(0)

    其他类型引用(1)

  • 加载中
计量
  • 文章访问数:  2629
  • HTML全文浏览量:  104
  • PDF下载量:  497
  • 被引次数: 1
出版历程
  • 收稿日期:  2002-01-24
  • 修回日期:  2002-06-17
  • 刊出日期:  2003-08-19

目录

/

返回文章
返回