高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于多尺度多方向Gabor变换的Tsallis熵阈值分割方法

邹耀斌 张进玉 周欢 孙水发 夏平

邹耀斌, 张进玉, 周欢, 孙水发, 夏平. 基于多尺度多方向Gabor变换的Tsallis熵阈值分割方法[J]. 电子与信息学报, 2023, 45(2): 707-717. doi: 10.11999/JEIT211306
引用本文: 邹耀斌, 张进玉, 周欢, 孙水发, 夏平. 基于多尺度多方向Gabor变换的Tsallis熵阈值分割方法[J]. 电子与信息学报, 2023, 45(2): 707-717. doi: 10.11999/JEIT211306
ZOU Yaobin, ZHANG Jinyu, ZHOU Huan, SUN Shuifa, XIA Ping. Tsallis Entropy Thresholding Based on Multi-scale and Multi-direction Gabor Transform[J]. Journal of Electronics & Information Technology, 2023, 45(2): 707-717. doi: 10.11999/JEIT211306
Citation: ZOU Yaobin, ZHANG Jinyu, ZHOU Huan, SUN Shuifa, XIA Ping. Tsallis Entropy Thresholding Based on Multi-scale and Multi-direction Gabor Transform[J]. Journal of Electronics & Information Technology, 2023, 45(2): 707-717. doi: 10.11999/JEIT211306

基于多尺度多方向Gabor变换的Tsallis熵阈值分割方法

doi: 10.11999/JEIT211306
基金项目: 国家自然科学基金(62172255, 61871258)
详细信息
    作者简介:

    邹耀斌:男,副教授,主要研究方向为数字图像处理、大数据分析、机器学习

    张进玉:女,硕士生,研究方向为数字图像处理

    周欢:男,教授,主要研究方向为移动社交网络、智能信息处理、车联网以及无线传感器网络

    孙水发:男,教授,主要研究方向为智能信息处理、计算机视觉、多媒体信息处理、3维处理及可视化

    夏平:男,教授,主要研究方向为机器学习、智能信息处理、多尺度几何分析及其应用

    通讯作者:

    周欢 zhouhuan117@163.com

  • 中图分类号: TN911.73

Tsallis Entropy Thresholding Based on Multi-scale and Multi-direction Gabor Transform

Funds: The National Natural Science Foundation of China (62172255, 61871258)
  • 摘要: 为了能在统一框架内处理无模态、单模态、双模态或者多模态直方图情形下的自动阈值选取问题,该文提出一种基于多尺度多方向Gabor变换的Tsallis熵阈值分割方法(MGTE)。该方法先通过Gabor变换得到多尺度乘积图像,然后利用内外轮廓图像从多尺度乘积图像中重构1维直方图,并在重构1维直方图上采用Tsallis熵计算模型来选取4个方向Tsallis熵取最大值时对应的阈值,最后对4个方向的阈值进行加权求和作为最终分割阈值。将提出的方法和5个分割方法在4幅合成图像和40幅真实世界图像上进行了实验。结果表明提出的方法虽然计算效率不占优势,但它的分割适应性和分割精度有明显的提高。
  • 图像分割是计算机视觉研究领域低层次视觉中重要的研究方向之一[1,2]。在已有的图像分割方法中,例如阈值分割、区域分割、聚类分割、深度学习分割,阈值分割因其简单和易于实现的优势而被广泛地应用到不同图像处理任务中[3],其基本原则是将图像中每个像素的灰度值与选取的阈值进行大小比较,以此来决定该像素是属于目标还是背景,因而阈值分割的关键在于如何确定合适的阈值。

    在众多阈值分割方法中,应用了信息论中熵概念的熵阈值法颇具代表性,它们大体可以分为两类:一类以最大化图像中背景熵和目标熵的和为原则来选择阈值,由该思想衍生而来的方法主要有最大香农熵法[4,5]、最大Rényi熵法 [6-8]、最大Tsallis熵法[9-11]、最大Arimoto熵法[12,13]、最大Masi熵法[14]和最大Kaniadakis熵法[15]等。另一类则以图像分割前后信息量差异最小化为原则来选择阈值,其代表性的方法是最小熵阈值法[16]。在第1类方法中,除最大香农熵法,其他方法涉及的熵计算模型都有熵参数。分割不同直方图模态的灰度图像通常对应不同的熵参数,而自动选取合理熵参数的算法依旧缺乏,这在很大程度上限制了这些最大熵阈值方法的适应性。第2类方法将二值化问题转换为最小熵高斯拟合问题,它忽略了目标和背景之间的相互关系,难以分割非对称性直方图模态的灰度图像[16,17]

    不少熵阈值法结合离散概率分布和熵计算模型来计算相关的熵[4,6,9,12,14,15],但它们都有一个共同的不足:没有考虑图像像素间的相关性,这使得同一个熵阈值法对于具有相同直方图的两幅不同图像将产生相同的阈值。此外,当一个灰度值的离散概率非常小的时候,容易引入大的计算误差从而降低获得阈值的鲁棒性。后续研究相继提出2维阈值法和3维阈值法。2维阈值法同时考虑图像灰度信息和邻域平均灰度信息,分割效果一般要优于1维阈值法[5,10,11,13]。3维阈值法在2维阈值法的基础上又加入了邻域的中值信息,这类算法对于具有混合噪声的图像有较好的分割效果[7,8]。2维或3维阈值法虽在一定程度上弥补了1维阈值法的不足,但其计算复杂度却远高于1维阈值法[8,11]

    现有熵阈值法除了上述不足外,还有一个关键问题是分割适应性较差。许多灰度图像因受噪声、点扩散或者背景和目标大小等因素影响,其灰度直方图呈现为无模态、单模态、双模态或者多模态,而现有熵阈值法一般较适合处理具有单模态长拖尾直方图的灰度图像,却难以兼顾其他情形。为了在统一的方法框架内从上述4种不同直方图模态的灰度图像中自动地选择出合理的分割阈值,提出了一种基于多尺度多方向Gabor变换的Tsallis熵阈值分割方法(Tsallis Entropy thresholding based on Multi-scale and multi-direction Gabor transform, MGTE)。MGTE方法将不同灰度直方图模态转换成统一的单模态,这种转换借助多尺度乘积效应来实现,其转换方式兼顾像素的灰度分布和像素间的空间位置。在获得4个方向上的单模态灰度直方图后,采用Tsallis熵作为熵计算模型来分别选取4个方向上的阈值,最后通过对4个方向上的阈值进行加权求和以作为最终分割阈值。

    2维Gabor滤波器由高斯信号和复正弦信号调制而成[18],它可以表示为

    δ(x,y,σ,w,θ)=g(x,y,σ)ejw(xcosθ+ysinθ)
    (1)

    其中,g(x,y,σ)=12πσ2e(x2y2)2σ2。从式(1)中可以推导出2维Gabor滤波器的奇偶部分函数

    δodd(x,y,σ,w,θ)=g(x,y,σ)[jsin[w(xcosθ+ysinθ)]]
    (2)
    δeven(x,y,σ,w,θ)=g(x,y,σ)cos[w(xcosθ+ysinθ)]
    (3)

    对于一幅灰度图像f,用符号kθ(σ)表示2维Gabor滤波器奇部对图像f的滤波响应的模,即

    kθ(σ)=|f(x,y)δodd(x,y,σ,w,θ)|
    (4)

    其中,表示2维卷积运算。图像kθ(σ)与空间尺度σ、方向角度θ密切相关,不同的σ值与θ值将产生不同的图像kθ(σ),这样在尺度为σi且方向为θr时,2维Gabor滤波器奇部对图像f的滤波响应的模可以表示为

    kθr(σi)=|f(x,y)δodd(x,y,σi,w,θr)|
    (5)

    注意到大小为(8σ+1)×(8σ+1)的高斯核与图像进行卷积所得结果可以充分逼近完整高斯分布与图像进行卷积所得结果[19],且在对数字图像卷积时,卷积核大小一般为奇数,由此可以推出σi=0.25×i(i1)。Gabor滤波核中平行条带的方向角具有中心对称性,又因方向角等间距取值,即θr=rπ/rπmm(r=0,1,,m),而式(5)又通过模运算计算图像kθ(σ),故θr取值可限制在[0,π/π22]内。另外,方向太多容易造成图像方向性信息冗余并显著增加运算时间,而方向太少则可能遗漏重要方向性信息,经过反复试验最终确定使用4个方向角:0π/π772π/2π773π/3π77

    对2维Gabor滤波器的某一方向角度θr,定义图像f在该方向上的多尺度乘积图像为

    Kuθr=uθri=1kθr(σi)
    (6)

    其中,uθr表示在方向角度为θr时参与多尺度乘积变换的图像数量。多尺度乘积变换使得图像f的边缘信号和噪声呈现不同响应特点:当空间尺度增大时,噪声的响应值相对快速地减小,而边缘信号附近位置的响应值能相对保持良好。在图像Kuθr的灰度值被规范化到[0, 255]的前提下,随着uθr的增加,图像Kuθr的灰度直方图的众数逐渐趋于0,并且随着众数逐渐左移,灰度直方图中频数为0的灰度级逐渐增多,结果是[0, 255]的灰度分布越来越稀疏。Kuθr的灰度直方图与uθr之间的关系表明:存在合适的uθr使得Kuθr中灰度级为0的频数足够大以抑制噪声,同时又保证频数为0的灰度级不能太多以维持边缘响应的多样性。为了自动计算这样的uθr值,第3节将引出Tsallis熵差的概念。

    用灰度l将灰度直方图分成左右两部(见图1)。设左部共M个灰度级,其概率分布为di(1iM)Mi=1di=1,其对应总频数为L;右部共N个灰度级,其概率分布为pj(1jN)Nj=1pj=1,其对应总频数为R。记左部的Tsallis熵为S,右部的Tsallis熵为S+,整幅直方图的Tsallis熵为S。按Tsallis熵定义[20],有

    图 1  灰度直方图的左右划分示意图
    S=Mi=1dqi11q
    (7)
    S+=Nj=1pqj11q
    (8)
    S=M+Ni=1oqi11q
    (9)

    其中,

    oi={LL+Rdi,1iMRL+Rpj,M+1iM+N,j=iM
    (10)

    定义S+S为Tsallis熵差,下面4个命题揭示了Tsallis熵差的重要性质。值得注意的是,基于S+S定义的Tsallis熵差不同于闫海霞等人[21]定义的局部Tsallis熵差。

    命题1 S+S=(1(1λ)q)S+λqS11q(λq+(1λ)q1),其中,λ=LL+R

    证明

    S=M+Ni=1oqi11q=(Mi=1oqi+M+Ni=M+1oqi)11q=Mi=1(LL+Rdi)q+Nj=1(RL+Rpj)q11q=(LL+R)qMi=1dqi11q+(RL+R)qNj=1pqj11q+(LL+R)q+(RL+R)q11q=λqS+(1λ)qS++11q(λq+(1λ)q1)

    S+S=(1(1λ)q)S+λqS11q(λq+(1λ)q1)。 证毕

    命题2 当λ>11+((1q)S++1(1q)S+1)11q, S+S是关于λ的单调递增函数。

    证明 求S+S关于λ的偏导数,令(S+S)λ=q(1λ)q1S+qλq1S11q(qλq1q(1λ)q1)=0,求得λ=11+((1q)S++1(1q)S+1)11q。根据函数导数和函数单调性的关系知,当λ>11+((1q)S++1(1q)S+1)11q时,S+S是关于λ的单调递增函数。 证毕

    命题3 S+S是关于S+的单调递增函数。

    证明 求S+S关于S+的偏导数,则有(S+S)S+=1(1λ)q。当求最大Tsallis熵时,熵参数需满足q>0[22],因为0<λ<1,故1(1λ)q>0。据函数导数和函数单调性的关系,S+S是关于S+的单调递增函数。 证毕

    命题4 S+S是关于S的单调递减函数。

    证明 求S+S关于S的偏导数,则有(S+S)S=λq。因为0<λ<1,所以λq<0。根据函数导数和函数单调性的关系知,S+S是关于S的单调递减函数。 证毕

    由命题1—命题4可知,当λ>11+((1q)S++1(1q)S+1)11qq>0时,λS+越大且S越小,将使S+S越大。分析λ=LL+R以及S+S之间的联系可推论:L相对更大或R相对更小,以及S+相对更大或S相对更小,将使S+S越大。因LR分别是左右部直方图的总频数,上述推论可转化为由相对多像素构成的左部Tsallis熵S要尽可能小,而由相对少像素构成的右部Tsallis熵S+要尽可能大,将使S+S越大。根据q>0时Tsallis熵的性质:概率分布越趋向均匀则Tsallis熵越大[22],使S+S倾向于取更大值的直方图类型是:由相对少像素构成的右部直方图应尽可能在更广的灰度级范围内分布均匀,而由相对多像素构成的左部直方图应尽可能在更窄的灰度级范围内集中分布。基于Tsallis熵差的性质并结合第2节多尺度乘积效应,可通过最大化Kuθr的灰度直方图的Tsallis熵差来找到合适的uθr

    (uθr,lθr)=argmaxuθrZ+maxlθr[0,255](S+S)
    (11)

    对一幅灰度图像f,在方向角θr0π/π772π/2π773π/3π77时分别对图像f进行多尺度Gabor变换,并按式(6)和式(11)得到4个方向上的多尺度乘积图像Kuθr。用灰度值t对图像f阈值化得到二值图像bt,再从bt中提取内外轮廓图像ct,然后用ct中值为1的像素对θr方向上的图像Kuθr进行取样,用取样得到的像素重构灰度直方图Hθr,再根据式(13)利用直方图Hθr选取出θr方向上阈值tθr,最后利用式(12)对4个方向上的阈值tθr进行加权得到最终阈值t。式(12)给出了选择最终阈值t的目标函数

    t=3r=0Wrtθr
    (12)

    其中,tθr表示在θr方向上选取的阈值,其计算方法如式(13);Wr表示加权系数,其计算方法如式(14)

    tθr=argmaxt[tmin,tmax](SHθr)
    (13)
    Wr=1|tθrto|/1|tθrto|3r=01|(tθrto)|3r=01|(tθrto)|
    (14)
    to=3r=0tθr4
    (15)

    式(13)中,tmintmax分别表示图像f的最小和最大灰度值,SHθr表示θr方向利用灰度直方图Hθr计算的Tsallis熵,Tsallis熵指数q=0.5;式(14)中Wr代表4个方向上的tθr与中心阈值的偏离程度,而中心阈值由式(15)计算。MGTE方法的具体算法步骤如下:

    步骤1 用Sdθr记录4个方向的Tsallis熵差,Sdθr记录最大的Sdθruθr记录根据Sdθr计算出每个方向参与多尺度乘积变换的图像数量,Kuθr记录根据uθr确定的多尺度乘积图像。初始化各参数,然后根据式(2)、式(5)、式(6)和式(11)计算4个方向的图像Kuθr,其中,θr=rπ/rπ77

    步骤2 令Hθr表示用内外轮廓图像ct对4个方向的图像Kuθr采样重构所得灰度直方图,SHθr(t)记录步骤3到6循环处理中根据Hθr得到的Tsallis熵,SHθr记录循环处理中最大的SHθr(t)值,tθr记录SHθr对应的灰度值。它们的初始值均为0,灰度值范围t[tmin,tmax]。按t从小到大的顺序重复执行步骤3到6。

    步骤3 用灰度值t对图像f进行阈值化可得二值图像bt

    步骤4 用二值图像bt构建同样大小的内外轮廓图像ct:(1)令ct的初始像素值全为1;(2)遍历bt的每个像素并进行判断,若bt的某个像素值及其4邻域的像素值都为1,则设置该像素在ct中对应位置的像素值为0;(3)对bt进行取反操作得到~bt,然后在~bt上按(2)中同样方法进行操作,最终获得内外轮廓图像。

    步骤5 利用图像ct中像素值为1的像素对4个方向的图像Kuθr进行采样,再用采样得到的像素重构直方图Hθr,在直方图Hθr上计算4个方向的Tsallis熵SHθr(t)

    步骤6 判断SHθrSHθr(t)的大小关系:对于θr=rπ/rπ77,若SHθr(t)>SHθr,则令SHθr=SHθr(t),并令tθr=t

    步骤7 在步骤3到6的循环处理结束后,根据式(12)、式(14)和式(15)可计算最终阈值t。用阈值t对图像f进行阈值化可得到二值图像bt,最后输出tbt

    实验的主要软硬件参数如下:Intel Core i5-9300H 2.4 GHz CPU, 16 GB DDR2内存,Windows 10 64位操作系统,MATLAB 2018a 64位。测试图像包含合成图像4幅和真实世界图像40幅,它们以及对应的分割参考图像可以访问https://share.weiyun.com/UAmqSFkl获得。MGTE方法与交互式阈值(Interactive Thresholding, IT)方法[23]、迭代3类阈值(Iterative Triclass Thresholding, ITT)方法[24]、Tsallis熵阈值(Tsallis Entropy Thresholding, TET)方法[9]、快速鲁棒模糊C-均值聚类(Fast and Robust Fuzzy C-Means, FRFCM)方法[25]、迭代卷积活动轮廓分割(Iterative Convolution Active Contour, ICAC)方法[26]进行比较。其中,IT方法通过交互式选取分割阈值,该阈值对应的二值图像具有最小的误分类率(Misclassification Error, ME)。ME是一个常用的分割精度评估指标[3],它表示在分割结果图像中误将背景作为目标及目标作为背景的百分比。IT方法可作为其他比较方法在分割精度方面的参考。

    为了检验6个方法对4种不同直方图模态图像的分割适应性,将它们分别在4幅合成图像上进行分割实验(见图2),它们的灰度直方图分别呈现为无模态、单模态、双模态和多模态(见图3)。图3图4以及表1给出了6个方法在这4幅合成图像上的定性和定量比较结果。值得注意的是,图3中间绿色区域显示了对应的灰度直方图,4条垂直线及旁边的数字标示了4个阈值分割方法选择的阈值。表1中前面4个方法为阈值分割方法,后面2个方法为非阈值分割方法,因此后面2个方法的阈值用*代替。

    图 2  分割实验
    图 3  4个模态合成图像的灰度直方图及不同方法所得阈值比较
    图 4  不同分割方法在4个模态合成图像上的分割比较
    表 1  6个分割方法在4幅合成图像上的分割阈值t和ME值(%)
    分割方法无模态单模态双模态多模态
    t, MEt, MEt, MEt, ME
    IT201, 0.00214, 0.00129, 0.01209, 0.00
    MGTE201, 0.00212, 0.01129, 0.01214, 0.01
    ITT133, 22.22162, 28.80128, 0.01146, 17.40
    TET126, 24.00151, 48.5773, 21.7098, 28.16
    FRFCM*, 1.17*, 39.43*, 0.17*, 0.87
    ICAC*, 19.58*, 0.02*, 0.00*, 2.95
    下载: 导出CSV 
    | 显示表格

    第1组实验测试了无模态合成图像,结合图3(a)图4(a)以及表1的第1列数据,可以观察到:(1)TET和ITT的总体分割结果最差,它们的ME值分别是24%和22.22%,远大于其他方法的ME值;(2)ICAC的分割结果虽优于TET和ITT,但也存在明显误分割,其ME值为19.58%;(3)FRFCM的分割结果要优于ITT,TET和ICAC,其ME值为1.17%,但它的分割结果不稳定;(4)MGTE的分割结果明显优于其他4个方法,其分割结果和IT完全一致,ME值为0%,达到理论上的最优分割;(5)IT, MGTE, ITT和TET所得阈值分别为201, 201, 133, 126,MGTE方法与IT方法所得阈值一致,优于其他2个阈值方法所得阈值。这些量化指标值显示MGTE在分割无模态合成图像上的相对优势。

    第2组实验测试了单模态合成图像,结合图3(b)图4(b)以及表1的第2列数据,可以观察到:(1)TET, ITT和FRFCM的误分割都很严重,它们的ME值分别达到48.57%, 28.80%, 39.43%;(2)ICAC和MGTE的ME值分别为0.02%和0.01%;(3)IT, MGTE, ITT和TET所得阈值分别为214, 212, 162, 151。其中,MGTE与IT所得阈值差距甚小,明显优于其他2个阈值方法所得阈值。这些量化指标值显示MGTE在分割单模态合成图像上的相对优势。

    第3组实验测试了双模态合成图像,结合图3(c)图4(c)以及表1的第3列数据,可以观察到:(1)TET的误分割比较严重,其ME值达到了21.70%,远大于其他方法的ME值;(2)FRFCM的分割结果虽优于TET,其ME值为0.17%,但它的分割结果不稳定性;(3)MGTE和ITT的分割结果与IT完全一致,ME值都为0.01%;(4)ICAC的分割结果略优于MGTE,ITT和IT,其ME值为0%;(5)IT, MGTE, ITT和TET所得阈值分别为129, 129, 128, 73,其中,MGTE方法与IT方法所得阈值再次保持一致。这些量化指标值显示MGTE方法在分割双模态合成图像上的相对优势。

    第4组实验测试了多模态合成图像,结合图3(d)图4(d)以及表1的第4列数据,可以观察到:(1)TET和ITT的误分割都较严重,它们的ME值分别达到28.16%和17.40%,远大于其它方法的ME值;(2)ICAC的分割结果优于TET和ITT,但在多模态合成图像上仍存在误分割,其ME值为2.95%;(3)FRFCM的分割结果虽优于TET, ITT和ICAC,其ME值为0.87%,但它的分割结果不稳定;(4)MGTE与IT的分割结果差距甚小,它们的ME值分别为0.01%和0%;(5)IT, MGTE, ITT和TET所得阈值分别为209, 214, 146, 98。其中,MGTE与IT所得阈值差为5,明显优于其它2个阈值方法所得阈值。这些量化指标值显示MGTE在分割多模态合成图像上的相对优势。

    为了进一步比较MGTE方法与其它5个方法的分割适应性,将6个方法分别在40幅真实世界图像上进行分割实验。这40幅测试图像中编号1~10, 11~20, 21~30和31~40的图像分别对应无模态、单模态、双模态、多模态真实世界图像。

    作为定性比较的代表性示例,图5(a)图5(d)显示了编号为4, 17, 27和37的图像灰度直方图及4个阈值方法所得阈值,而图6展示了6个方法在这4幅图像上的分割结果。从图5(a)图5(d)可以看到,MGTE所得阈值几乎非常接近IT所得阈值,而图6(a)图6(d)也验证了MGTE能够相对成功地对这4幅测试图像进行目标和背景的分离。图7全面展示了6个方法在40幅真实世界图像上的ME量化结果,在每幅子图中,蓝色、红色、绿色和紫色的竖条分别标示了各分割方法在无模态、单模态、双模态和多模态情况下的ME值,而深蓝色水平虚线及其上的数字标示了对应情形下ME值的平均值。可以观察到:(1)对于无模态、单模态、双模态和多模态真实图像,MGTE的ME均值总体上更接近IT的ME均值,其对应的ME均值都小于0.9%;而其它方法,除ITT和FRFCM在双模态真实图像以及ICAC在单、双模态真实图像外,每种方法对应模态上的ME均值都大于14%;(2)ITT对于双模态真实图像有明显的分割效果,其ME均值为2.47%,但它对于无模态、单模态和多模态真实图像存在明显的误分割,其各自的ME均值都超过了19%;(3)TET对于无模态、单模态、双模态和多模态真实图像的误分割都很严重,各自的ME均值都超过28%;(4)FRFCM虽对双模态真实图像有明显的分割效果,其ME均值为4.71%,但FRFCM的分割结果不稳定,它在对同一幅图像进行多次聚类时,其ME值会存在很大差异;(5)ICAC虽适合单模态和双模态真实图像,其ME均值分别为5.25%和1.80%,但不适合无模态和多模态真实图像。这些都表明MGTE对无模态、单模态、双模态和多模态真实图像具有更强的分割适应性。

    图 5  4个不同编号真实世界图像的灰度直方图及不同方法所得阈值比较
    图 6  不同分割方法在4个编号真实世界图像上的分割结果比较
    图 7  6个分割方法在40幅测试图像上的ME值比较

    在相同软硬件参数下,同一个方法多次作用在同一幅图像上的CPU运行时间会在一定范围内波动。为了降低CPU运行时间波动的影响,每个方法将对同一幅图像分别进行10次测试,记录10次的CPU运行时间再求均值,以此均值作为该图像上的CPU耗时。依次可计算出5个自动分割方法在4幅合成图像和40幅真实世界图像上CPU耗时的均值和标准偏差。由表2可知:MGTE的CPU耗时最长,ITT, TET, FRFCM和ICAC的CPU耗时相对较短。

    表 2  5个分割方法的计算效率比较(s)
    分割方法合成图像上CPU耗时真实世界图像上CPU耗时
    均值标准偏差均值标准偏差
    MGTE0.4530.0750.6510.312
    ITT0.0030.0020.0030.002
    TET0.0100.0020.0110.003
    FRFCM0.0650.0640.0300.027
    ICAC0.0270.0190.1940.206
    下载: 导出CSV 
    | 显示表格

    当灰度图像的灰度直方图呈现为无模态、单模态、双模态或者多模态时,相对于ITT, TET, FRFCM以及ICAC方法,MGTE方法的分割结果更加接近分割参考方法IT方法。MGTE方法的计算效率虽不及ITT, TET, FRFCM和ICAC方法,但它的分割精度更高,且在阈值选取方面具有更强的适应性。MGTE方法能够在分割精度、分割适应性上取得一定优势主要得益于:(1)MGTE方法的多尺度乘积效应能够将不同模态直方图转化成统一的单模态直方图;(2)在不同方向上,MGTE方法自动计算参与多尺度乘积变换的图像数量;(3)对不同方向上重构的灰度直方图进行Tsallis熵运算,所得阈值进行加权计算,这种加权策略使得选取的阈值更加接近合理阈值。

  • 图  1  灰度直方图的左右划分示意图

    图  2  分割实验

    图  3  4个模态合成图像的灰度直方图及不同方法所得阈值比较

    图  4  不同分割方法在4个模态合成图像上的分割比较

    图  5  4个不同编号真实世界图像的灰度直方图及不同方法所得阈值比较

    图  6  不同分割方法在4个编号真实世界图像上的分割结果比较

    图  7  6个分割方法在40幅测试图像上的ME值比较

    表  1  6个分割方法在4幅合成图像上的分割阈值t和ME值(%)

    分割方法无模态单模态双模态多模态
    t, MEt, MEt, MEt, ME
    IT201, 0.00214, 0.00129, 0.01209, 0.00
    MGTE201, 0.00212, 0.01129, 0.01214, 0.01
    ITT133, 22.22162, 28.80128, 0.01146, 17.40
    TET126, 24.00151, 48.5773, 21.7098, 28.16
    FRFCM*, 1.17*, 39.43*, 0.17*, 0.87
    ICAC*, 19.58*, 0.02*, 0.00*, 2.95
    下载: 导出CSV

    表  2  5个分割方法的计算效率比较(s)

    分割方法合成图像上CPU耗时真实世界图像上CPU耗时
    均值标准偏差均值标准偏差
    MGTE0.4530.0750.6510.312
    ITT0.0030.0020.0030.002
    TET0.0100.0020.0110.003
    FRFCM0.0650.0640.0300.027
    ICAC0.0270.0190.1940.206
    下载: 导出CSV
  • [1] 吴一全, 孟天亮, 吴诗婳. 图像阈值分割方法研究进展20年(1994–2014)[J]. 数据采集与处理, 2015, 30(1): 1–23. doi: 10.16337/j.1004-9037.2015.01.001

    WU Yiquan, MENG Tianliang, and WU Shihua. Research progress of image thresholding methods in recent 20 years (1994–2014)[J]. Journal of Data Acquisition and Processing, 2015, 30(1): 1–23. doi: 10.16337/j.1004-9037.2015.01.001
    [2] 范九伦, 雷博. 倒数粗糙熵图像阈值化分割算法[J]. 电子与信息学报, 2020, 42(1): 214–221. doi: 10.11999/JEIT190559

    FAN Jiulun and LEI Bo. Image thresholding segmentation method based on reciprocal rough entropy[J]. Journal of Electronics &Information Technology, 2020, 42(1): 214–221. doi: 10.11999/JEIT190559
    [3] SEZGIN M and SANKUR B. Survey over image thresholding techniques and quantitative performance evaluation[J]. Journal of Electronic Imaging, 2004, 13(1): 146–168. doi: 10.1117/1.1631315
    [4] KAPUR J N, SAHOO P K, and WONG A K C. A new method for gray-level picture thresholding using the entropy of the histogram[J]. Computer Vision, Graphics, and Image Processing, 1985, 29(3): 273–285. doi: 10.1016/0734-189X(85)90125-2
    [5] 吴一全, 张金矿. 二维直方图θ划分最大Shannon熵图像阈值分割[J]. 物理学报, 2010, 59(8): 5487–5495. doi: 10.7498/aps.59.5487

    WU Yiquan and ZHANG Jinkuang. Image thresholding based on θ-division of 2-D histogram and maximum Shannon entropy[J]. Acta Physica Sinica, 2010, 59(8): 5487–5495. doi: 10.7498/aps.59.5487
    [6] SAHOO P, WILKINS C, and YEAGER J. Threshold selection using Rényi's entropy[J]. Pattern Recognition, 1997, 30(1): 71–84. doi: 10.1016/S0031-3203(96)00065-9
    [7] WEI Wei. Gray image thresholding based on three-dimensional Rényi entropy[C]. The 6th International Congress on Image and Signal Processing, Hangzhou, China, 2013: 599–603.
    [8] 龙建武, 申铉京, 魏巍, 等. 一种结合纹理信息的三维Rényi熵阈值分割算法[J]. 小型微型计算机系统, 2011, 32(5): 948–952.

    LONG Jianwu, SHEN Xuanjing, WEI Wei, et al. 3-D Rényi entropy thresholding algorithm combining with the texture[J]. Journal of Chinese Computer Systems, 2011, 32(5): 948–952.
    [9] DE ALBUQUERQUE M P, ESQUEF I A, MELLO A R G, et al. Image thresholding using Tsallis entropy[J]. Pattern Recognition Letters, 2004, 25(9): 1059–1065. doi: 10.1016/j.patrec.2004.03.003
    [10] 吴一全, 张金矿. 二维直方图θ-划分Tsallis熵阈值分割算法[J]. 信号处理, 2010, 26(8): 1162–1168. doi: 10.3969/j.issn.1003-0530.2010.08.008

    WU Yiquan and ZHANG Jinkuang. Image thresholding based on 2-D histogram θ-division and Tsallis entropy[J]. Signal Processing, 2010, 26(8): 1162–1168. doi: 10.3969/j.issn.1003-0530.2010.08.008
    [11] YE Zhiwei, YANG Juan, WANG Mingwei, et al. 2D Tsallis entropy for image segmentation based on modified chaotic bat algorithm[J]. Entropy, 2018, 20(4): 239. doi: 10.3390/e20040239
    [12] ZHANG Hong. One-dimensional Arimoto entropy threshold segmentation method based on parameters optimization[C]. 2011 International Conference on Applied Informatics and Communication, Xi’an, China, 2011: 573–581.
    [13] 卓问, 曹治国, 肖阳. 基于二维Arimoto熵的阈值分割方法[J]. 模式识别与人工智能, 2009, 22(2): 208–213. doi: 10.3969/j.issn.1003-6059.2009.02.007

    ZHUO Wen, CAO Zhiguo, and XIAO Yang. Image thresholding based on two-dimensional Arimoto entropy[J]. Pattern Recognition and Artificial Intelligence, 2009, 22(2): 208–213. doi: 10.3969/j.issn.1003-6059.2009.02.007
    [14] NIE Fangyan, ZHANG Pingfeng, LI Jianqi, et al. A novel generalized entropy and its application in image thresholding[J]. Signal Processing, 2017, 134: 23–34. doi: 10.1016/j.sigpro.2016.11.004
    [15] SPARAVIGNA A C. Bi-level image thresholding obtained by means of Kaniadakis entropy[EB/OL]. https://arxiv.org/vc/arxiv/papers/1502/1502.04500v2.pdf, 2021.
    [16] LI C H and LEE C K. Minimum cross entropy thresholding[J]. Pattern Recognition, 1993, 26(4): 617–625. doi: 10.1016/0031-3203(93)90115-D
    [17] AL-OSAIMI G and EL-ZAART A. Minimum cross entropy thresholding for SAR images[C]. The 3rd International Conference on Information and Communication Technologies: From Theory to Applications, Damascus, Syria, 2008: 1245–1250.
    [18] ZHU Zhenfeng, LU Hanqing, and ZHAO Yao. Scale multiplication in odd Gabor transform domain for edge detection[J]. Journal of Visual Communication and Image Representation, 2007, 18(1): 68–80. doi: 10.1016/j.jvcir.2006.10.001
    [19] LINDEBERG T. Scale-space for discrete signals[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1990, 12(3): 234–254. doi: 10.1109/34.49051
    [20] SUYARI H and TSUKADA M. Law of error in Tsallis statistics[J]. IEEE Transactions on Information Theory, 2005, 51(2): 753–757. doi: 10.1109/TIT.2004.840862
    [21] 闫海霞, 赵晓晖. 基于Tsallis熵差的遥感图像边缘检测方法[J]. 计算机应用研究, 2009, 26(9): 3598–3600. doi: 10.3969/j.issn.1001-3695.2009.09.117

    YAN Haixia and ZHAO Xiaohui. Edge detection method based on Tsallis entropy difference of remote sensing image[J]. Application Research of Computers, 2009, 26(9): 3598–3600. doi: 10.3969/j.issn.1001-3695.2009.09.117
    [22] TSALLIS C. Possible generalization of Boltzmann-Gibbs statistics[J]. Journal of Statistical Physics, 1988, 52(1/2): 479–487. doi: 10.1007/BF01016429
    [23] BEMIS R. Thresholding tool[EB/OL]. http://cn.mathworks.com/matlabcentral/fileexchange/6770-thresholding-tool, 2022.
    [24] CAI Hongmin, YANG Zhong, CAO Xinhua, et al. A new iterative triclass thresholding technique in image segmentation[J]. IEEE Transactions on Image Processing, 2014, 23(3): 1038–1046. doi: 10.1109/TIP.2014.2298981
    [25] LEI Tao, JIA Xiaohong, ZHANG Yanning, et al. Significantly fast and robust fuzzy C-means clustering algorithm based on morphological reconstruction and membership filtering[J]. IEEE Transactions on Fuzzy Systems, 2018, 26(5): 3027–3041. doi: 10.1109/TFUZZ.2018.2796074
    [26] WANG Dong and WANG Xiaoping. The Iterative Convolution-Thresholding Method (ICTM) for image segmentation[EB/OL]. https://arxiv.org/pdf/1904.10917.pdf, 2021.
  • 期刊类型引用(3)

    1. 李辉,郝翠萍,常欢欢. 基于朴素贝叶斯的多模态异构大数据分类优化方法. 电子设计工程. 2025(02): 158-162 . 百度学术
    2. 吕强,李朝奎,谢梦愿,李豪,陈军. 多尺度引导滤波对多光谱遥感影像分类精度的影响. 测绘通报. 2024(02): 58-62 . 百度学术
    3. 杨呈哲,张玉强,郭兴,刘育佳. 一种用于医学图像去噪的Kuwahara滤波改进算法. 电子设计工程. 2024(17): 175-179 . 百度学术

    其他类型引用(6)

  • 加载中
图(7) / 表(2)
计量
  • 文章访问数:  805
  • HTML全文浏览量:  416
  • PDF下载量:  103
  • 被引次数: 9
出版历程
  • 收稿日期:  2021-11-22
  • 修回日期:  2022-05-04
  • 录用日期:  2022-05-17
  • 网络出版日期:  2022-05-25
  • 刊出日期:  2023-02-07

目录

/

返回文章
返回