Loading [MathJax]/jax/output/HTML-CSS/jax.js
高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于自适应快速S变换和XGBoost的心电信号精确快速分类方法

袁莉芬 李松 尹柏强 李兵 佐磊

袁莉芬, 李松, 尹柏强, 李兵, 佐磊. 基于自适应快速S变换和XGBoost的心电信号精确快速分类方法[J]. 电子与信息学报, 2023, 45(4): 1464-1474. doi: 10.11999/JEIT220217
引用本文: 袁莉芬, 李松, 尹柏强, 李兵, 佐磊. 基于自适应快速S变换和XGBoost的心电信号精确快速分类方法[J]. 电子与信息学报, 2023, 45(4): 1464-1474. doi: 10.11999/JEIT220217
YUAN Lifen, LI Song, YIN Baiqiang, LI Bing, ZUO Lei. Accurate and Fast ElectroCardioGram Classification Method Based on Adaptive Fast S-Transform and XGBoost[J]. Journal of Electronics & Information Technology, 2023, 45(4): 1464-1474. doi: 10.11999/JEIT220217
Citation: YUAN Lifen, LI Song, YIN Baiqiang, LI Bing, ZUO Lei. Accurate and Fast ElectroCardioGram Classification Method Based on Adaptive Fast S-Transform and XGBoost[J]. Journal of Electronics & Information Technology, 2023, 45(4): 1464-1474. doi: 10.11999/JEIT220217

基于自适应快速S变换和XGBoost的心电信号精确快速分类方法

doi: 10.11999/JEIT220217
基金项目: 国家自然科学基金(61971175),中央高校基本科研业务费(JZ2019YYPY0025)
详细信息
    作者简介:

    袁莉芬:女,博士,教授,研究方向为射频识别技术

    李松:男,硕士生,研究方向为信号处理与分析

    尹柏强:男,博士,教授,研究方向为电能质量先进检测与控制方法

    李兵:男,博士,教授,研究方向为智能电网信息工程

    佐磊:男,博士,副研究员,研究方向为智能感知技术及应用

    通讯作者:

    尹柏强 yinbaiqiang123@163.com

  • 中图分类号: TN911.7; R540.41

Accurate and Fast ElectroCardioGram Classification Method Based on Adaptive Fast S-Transform and XGBoost

Funds: The National Natural Science Foundation of China (61971175), The Fundamental Research Funds for the Central Universities (JZ2019YYPY0025)
  • 摘要: 针对心电信号(ECG)传统分类方法效率较低的问题,该文提出一种基于自适应快速S变换(AFST)和XGBoost的心电信号精确快速分类方法。该方法首先通过快速定位算法确定心电信号特征频率点,再根据特征频率点自适应调节S变换窗宽因子,增强S变换的时频分辨率的同时避免迭代计算,大大减少运行时间。其次,基于自适应快速S变换的时频矩阵提取12个特征量来表征5种心电信号的特征信息,特征向量维数低,识别能力强。最后,利用XGBoost算法对特征向量进行识别。MIT-BIH心律失常数据库和患者实测数据验证表明,该方法显著地缩短了分类时间,对5种心电信号的分类准确率分别为99.59%和97.32%,适用于实际检测系统中心律失常疾病的快速诊断。
  • 近年来,心血管病的发病率呈明显上升趋势,而心律失常是心血管疾病中最常见的一种病症,研究表明,到2035年,心血管疾病将成为死亡的主要原因,并将严重影响国家的金融和卫生保健系统[1,2]。因此,研究心律失常是诊治该类疾病患者的重要工作之一。心电图(ElectroCardioGram, ECG)信号是心脏电活动的记录器,可提供有关心脏性能的重要信息,可作为心血管疾病诊断的有效手段[3]。传统方法依赖于心脏疾病专家凭借经验判断,具有很强的主观性,并且效率非常低。因此,设计一种高效的心律失常自动诊断方法显得尤为重要。

    目前心电信号的分类技术主要包括信号预处理、特征提取、自动分类3个环节[4]。信号预处理包括去除心电信号中的工频干扰、肌电信号干扰、基频漂移等噪声,并将心电信号进行分拍。针对心电信号的特征提取,国内外广大学者提出了不同的方法,目前主要有时域分析法、经验模态分解法、小波变换和S变换等。Chazal等人[5]基于心电信号本身特征,利用形态学方法提取ECG形态、R-R间期、T波持续时间,取得了85.88%的分类准确率。Mar等人[6]选择R-R间期、QRS波群和T波持续时间等作为心电信号特征,对5类心电信号分类准确率为89.0%。时域信息作为心电信号最有效的信息,可以反映心律异常的主要特征,但通常无法揭示心电信号隐藏的细节信息。王金海等人[7]提出一种近似熵和经验模态分解结合的新方法,对心电信号进行分解得到有限个模态分量,并计算近似熵来代表心电信号特征向量。Jacob等人[8]利用小波变换提取了心电信号的小波系数、R-R间期等特征,获得了94.5%的准确率。上述变换法提取特征时,没有加入能够直接反映信号特征的时频信息,分类准确率不足。对比上述方法,S变换能更好地提取到心电信号附加时间特征的形态特征,具有更强的时频表征能力[9]。Das等人[10]和Yang等人[11]分析了心电信号的主要特点,将S变换(S-Transform, ST)引入到心电信号的特征提取工作中,为心电信号分类工作提供了新思路。然而考虑到S变换在心电信号分析中的时频分辨率较低,难以充分提取心电信号的主要特征;同时S变换需要极大的计算量,当心电信号数据量较大时,会严重影响心电信号特征提取效率。

    心电信号的模式识别方法主要有支持向量机(Support Vector Machine, SVM)[12,13]、神经网络[14,15]、集成学习[16,17]。在这个研究领域,仍然亟待解决的问题有两个:第一,分类器模型的分类效率有待提升。心电信号的诊断有很高的时效性要求,对于分类准确率低、训练时间长的分类器已不再适用于心电信号的快速分类;第二,心电信号数据常具有类别不平衡的特点,这要求分类器考虑心电信号类别权重,对所有样本都能充分学习。

    基于上述问题,本文从诊断心律失常的临床需求出发,提出一种心电信号5分类方案。针对心电信号设计自适应快速S变换(Adaptive Fast S-Transform, AFST)算法,降低计算复杂度,提取高时频分辨率特征集;提出一种自定义损失函数的XGBoost模型,克服了不平衡数据集对分类模型的影响,实现了对5类心电信号的精确、快速分类。在MIT-BIH心律失常数据库验证算法有效性的基础上,通过采集中国科学技术大学附属医院的患者实测数据进行验证,实验结果表明,本文所提算法的准确率和时效性能够满足临床实时诊断的要求。

    S变换是一种时频分析工具,十分适合非平稳信号的分析,信号x(t)的S变换为

    S(τ,f)=+x(t)w(τt,f)ej2πftdt (1)
    w(τt,f)=1σ(f)2πe(τt)22σ(f)2 (2)

    其中,w(τt,f)为高斯窗函数;σ(f)=1/|f|为窗宽调节因子;τ为时移因子;f为频率。令fn/NTτkT,则S变换的离散形式为

    S[kT,nNT]=N1m=0X[m+nNT]e2π2m2n2ej2πmkN,n0S[kT,0]=1NN1m=0x[mT],n=0} (3)

    其中,N为心电信号采样点数;T为心电信号采样间隔;m,n,k的取值为0~N1。心电信号经过S变换后得到一个2维复数矩阵,矩阵的行与列分别代表时间采样点与频率采样点。

    目前在ECG的分类研究中,ST并未得到广泛应用,主要是由于ST对信号进行变换使用高斯窗口,存在低频段时间分辨率较低、高频段频率分辨率较低的情况。另外,对于采样频率较高的ECG信号,采样点增多会使得S变换计算量剧增,限制了其在心电信号特征提取中的应用。

    本文提出基于Kaiser窗函数的自适应窗宽S变换(Adaptive S-Transform, AST)。相较于高斯窗口,Kaiser窗频带内能量主要集中在主瓣中,对于旁瓣有很好的抑制能力,并且Kaiser窗由于存在窗宽调节因子,使得它在时频性要求不同的场景中可以灵活转换。基于Kaiser窗S变换的表达式为

    S(τ,f,β)=+x(t)wK(τt,β)ej2πftdt (4)

    其中,wK(τt,β)为Kaiser窗函数;β为窗宽调节因子。通过对不同频段设置合适的参数β,即可达到不同的时频分辨率。由于临床诊断的心电信号频率范围要求在0.05~125 Hz,临床监护的频率范围要求0.05~45 Hz[18]。由此可见心电信号的能量主要集中在45 Hz以内,其中QRS波群能量更是集中在2~15 Hz。因此,为了满足心电信号分析的时频性要求,对Kaiser窗需要设置合适的参数,使不同频段采用不同的窗宽是很有必要的。通过文献[19]对不同信号的Kaiser参数选取标准可知,为均衡时间分辨率和频率分辨率,β的选取范围是2~8。

    β较大时,Kaiser窗函数的主瓣较宽,旁瓣较低,并且旁瓣的衰减速率增加,时间分辨率高,频率分辨率下降,不利于心电信号的特征提取。当选择较小的β值时,Kaiser窗函数频域窗口较窄,频率分辨率升高,时间分辨率会下降,影响模式识别精度。因此,需要选择合适的β以准确提取心电信号的特征,减小扰动的干扰和算法误差。将心电信号频率范围分段,分别设置不同β值:在0~2 Hz的低频段,为减小基频漂移成分干扰,在此频段设置较大β值获取高时间分辨率;在2~15 Hz频段,频率成分丰富,设置较低β值,提高频率分辨率以检测心电信号有用信息;在15~45 Hz频率区间,心电信号频率成分相对较少,使β值随频率逐渐增大,从高频率分辨率过渡到高时间分辨率;当频率高于45 Hz,β统一选取8。因此本文针对心电信号特征提取提出了一种通过调节窗函数参数β的自适应窗长S变换。具体做法为

    wK(t,β(f))=I0[β(f)1(12tL)2]I0[β(f)] (5)
    β(f)={8k1f,f(0,2)2,f(2,15)2+k2(f15),f(15,45) (6)

    其中,I0()为第1类修正0阶贝塞尔函数,L为心电信号长度,k1,k2是控制β(f)变换率的固定参数,取值分别为3, 0.2。图1β(f)对应的Kaiser窗函数幅频特性。

    图 1  不同β(f)对应Kaiser窗幅频特性

    为证明AST相对于ST具有较好的时频分辨率,以NORM类型心电信号为例展开时频分析对比试验。图2展示了ST, AST对类型心电信号频率包络线,通过对比可以看出,在心电信号集中的低频段,ST的频率分辨率较低,很难识别出不同频率成分。原因在于心电信号不同于其他信号,其频率范围相对集中,传统的高斯窗函数不具备识别此类信号的能力。改进的自适应Kaiser窗,考虑到心电信号的特异性,保证了在心电信号的主要频率段有足够的频率分辨率,因此能够识别更多的频率成分。

    图 2  心电信号频率包络线

    图3为心电信号的ST,AST时域累积特性曲线,可以看出,在心电信号的R波附近,ST和AST都识别出了心电信号的特征,时间分辨率接近。在P波和T波附近,AST能够识别出更多的尖峰,时间分辨率优于ST。

    图 3  心电信号时域累积特性曲线

    已知N点心电信号的ST需要进行离散傅里叶变换与离散傅里叶逆变换,完成整个ST运算的时间复杂度为O(N3)。用快速傅里叶变换(Fast Fourier Transform, FFT)实现的快速S变换(Fast S-Transform, FST)[20],将ST的时间复杂度降低到O(N2log2N),即便如此,随着采样点数的增加FST的运行时间可能仍无法满足实时信号分析要求。

    对于心电信号来说,频率范围主要位于45 Hz区间内,ST矩阵中大多数列对于信号的频谱分析并没有贡献,也就不存在计算的必要。如何剔除非特征频率点所在列,保留特征频率点所在列是实现快速算法的关键。据此,本文提出特征频率点快速定位算法来实现快速运算的S变换,即自适应快速S变换。在2~15 Hz区间,设置FFT归一化阈值ξ1=0.05,15~45 Hz区间ξ2=0.025,高于45 Hz阈值ξ3=0.005。自适应快速S变换的实现步骤如下:

    (1)计算ECG信号x(nT)的快速傅里叶变换(FFT)频谱X(λ/NT)

    (2)特征点快速定位算法:对频谱取极大值,定位特征频率点λiλi满足

    |X(λiNT)|>ξk (7)
    |X(λi1NT)|<|X(λiNT)|>|X(λi+1NT)| (8)

    其中,i=1,2,,qq是ECG信号中特征频率点的数目,ξk为设定阈值,k=1,2,3

    (3)根据特征频率点λi,确定窗宽调节因子β(λi/NT)并计算Kaiser窗的FFT频谱

    W(rNT,λiNT)=1N|N1n=0wK(n,β(λiNT))ej2πnrN| (9)

    (4)将X(λi/NT)频移得到X((λi+r)/NT)

    (5)求X((λi+r)/NT)W(r/(NT),λi/(NT))的乘积B(r,λi)

    B(r,λi)=X(λi+rNT)W(rNT,λiNT) (10)

    (6)对特征频率点λi,计算B(r,λi)的快速傅里叶逆变换(Inverse Fast Fourier Transform, IFFT),得到λi对应的自适应快速S变换

    AFST(m,λi)=N1r=0B(r,λi)ej2πrmN (11)

    (7)重复步骤(3)—步骤(6)对所有特征频率点完成AFST。

    当采用AFST去分析一个N点ECG信号时,假设特征频率点的个数为q,此时时间复杂度为O(qNlog2N)。由于q远小于N/2,AFST的运算量相对于FST进一步减少。表1为3种算法运量分析。

    表 1  不同算法运算量分析
    算法运算量
    复数乘法复数加法时间复杂度
    ST(N2+N3)/2(N3N2)/2O(N3)
    FST(2N2+N2log2N)/4(N2log2N)/2O(N2log2N)
    AFSTq(2N+Nlog2N)/2qNlog2NO(qNlog2N)
    下载: 导出CSV 
    | 显示表格

    为验证实际变换过程中AFST的计算效率,分别利用ST, FST以及AFST对不同样本点数心电信号样本进行运算,对比3种算法的运行时间,结果如图4所示。

    图 4  不同样本长度算法运行时间对比

    当心电信号样本点数增加时,3种算法的运算量都呈增大趋势。同样长度的样本下,AFST时间均优于ST和FST,在本文选取的300样本点数据,ST的运算时间为0.018 s,FST的运算时间为0.013 s,AFST的运算时间仅为0.002 5 s。当数据样本逐渐增大时,AFST由于计算复杂度较低,在运算时间上相对ST和FST具有更明显的优势。这表明,对不同长度的心电信号样本,本文所提的AFST都能够较快地完成信号变换,适用于时效性要求较高的临床环境。

    集成算法是通过构建并结合多个学习器完成学习任务[21]。XGBoost算法是在自适应增强(Adaptive Boosting, AdaBoost)算法和梯度提升迭代决策树(Gradient Boosting Decision Tree, GBDT)算法基础上优化形成的,通过不断拟合优化目标函数,从而达到准确预测分类结果[22]。XGBoost算法在原函数的基础上增加了2阶导数和正则项,加之系统层面的一些优化,使得该算法减小了过拟合的可能性,大大缩短了训练时间,并且能够保持较高的准确性。

    对于心电信号的分类而言,不同心率类型在心电图中所占比例不同,通常表现为正常心率类型占比较高,而异常心率类型占比较低,即数据集具有类别不平衡的特点。这会导致分类器训练过程中对占比较少的类别样本学习不充分,对心电信号识别能力不足。为解决上述问题,通过改进XGBoost损失函数并在损失函数中引入L2正则项对XGBoost进行改进。

    改进后的第m棵树的损失函数为

    Lm=1N(Ni=1αiL(yi,Fm1(xi;Am1))+ω2a22) (12)

    其中,Fm1(xi;Am1)表示前m1棵树组成的模型在参数为Am1的条件下对输入xi的预测值,这里的Am1包括前m1棵树的参数a1,a2,,am1L(yi,Fm1(xi;Am1))是描述真实值yi与当前模型预测值误差的函数,对XGBoost来说是对数损失函数。ω是正则化系数,系数αi的取值为

    αi={1,yi=0NCN(yi),yi0 (13)

    其中,yi=0表示正常样本,样本权重设置为1;yi0表示非正常样本,样本权重由总样本数量N、总样本类别数C与标签为yi的样本总数N(yi)决定。

    当数据集为不平衡数据集时,通过对异常样本加权,可以使得异常样本在训程中获得更大的梯度,从而减小样本比例差异带来的影响,最终提升XGBoost在不平衡数据集上的表现能力。当数据集为平衡数据集时,上述改进的XGBoost自动退化为传统XGBoost。

    本文使用准确率(Accuracy, Acc)、灵敏度(Sensitivity, Sen)、特异性(Specificity, Spe)、阳性预测率(Positive Predictive Value, PPV)4种度量指标描述分类器的性能,公式为

    Acc=TP + TNTP + FP + FN + TN×100% (14)
    Sen=TPTP + FN×100% (15)
    Spe=TNTN + FP×100% (16)
    PPV = TPTP + FP×100% (17)

    其中,TP为样本被正确分类的个数;TN不属于某类且被分为其他类的个数;FP为其他类样本被分类为某类样本的总数;FN为某样本分类为其他类样本的总数。

    本文首先采用MIT-BIH公开数据集验证本文方法的有效性。MIT-BIH心律失常数据库中共包含了47名受试者的48条带注释的ECG记录,采样频率360 Hz,每条记录都有对应的标签注释。实验选取MIT-BIH数据库中MILI导联的5类心电信号的数据作为研究对象,包括正常心电图(NORM beat, NORM)、左束支传导阻滞(Left Bundle Branch Block beat, LBBB)、右束支传导阻滞(Right Bundle Branch Block beat, RBBB)、房性早搏(Atrial Premature Contraction, APC)和室性早搏(Premature Ventricular Contraction, PVC)。

    由于心电信号在采集过程中受到基频漂移、工频干扰、肌电噪声等因素的影响[15],本文先采用简单的低通滤波器和小波阈值降噪对数据进行预处理,再采用Pan等人[23]提出的R波检测方法,以R波波峰为基准,向前取120个点,向后取180个点,共计300个点的长度作为一个心电信号样本。最终从48条记录中提取出了5类心电信号的全部数据共99 325个样本,对应的样本数量分别为77 495, 8 061, 7 255, 2 543, 6 971,按照3:1的比例构建实验训练集和测试集。

    本文将特征分为频域特征和时域特征。首先采用AFST算法对5类心电信号变换,将心电信号从时域转换到时间-频率下的时频图,如图5图6所示。

    图 5  心电信号时域波形图
    图 6  心电信号AFST变换时频3维图

    频域特征用特征频率点及其对应的幅值表示,对特征频率点按照幅值升序排列,选取最大4组作为频率特征,计为[P1,P2,P3,P4,Q1,Q2,Q3,Q4]。时域特征的提取依靠心电信号变换后的时域累计特性曲线,选取最大值、最小值、均值、方差4种时域特征指标;由于心电信号的AFST只对特征频率点进行变换,因此AFST特征提取时,时域特征指的是最大特征频率点所对应行的最大值、最小值、均值、方差4种时域特征指标,计为[A1,A2,A3,A4]。为此,本文从时域和频域两个角度提取特征,构成特征向量[P1,P2,P3,P4,Q1,Q2,Q3,Q4,A1,A2,A3,A4]

    对5类心电信号分别采用ST和AFST方法提取特征,得到样本容量为400的特征向量。为比较不同特征区分能力的差异,分别使用频率特征子集

    F1=[P1,P2,P3,P4,Q1,Q2,Q3,Q4] (18)

    原始时频特征

    F2=[P1,P2,P3,P4,Q1,Q2,Q3,Q4,A1,A2,A3,A4] (19)

    利用相同参数的核主成分分析法将特征向量转换成3维特征分布图,对特征进行评价。图7结果表明,基于ST提取的频率特征和时频特征不能清晰地将5类心电信号类型进行区分,其原因在于ST的高斯窗不能根据心电信号的自适应调节频率分辨率,在提取频率特征时各种频率之间相互干扰,特征之间界限不明显;其次由于ST对于心电信号之间相互关联,不具有很好的类间离散度。

    图 7  基于ST提取的特征可视化分布情况

    图8为AFST的特征分布情况。图8(a)表明单纯的频率特征能够较好地区分5类心电信号的特征,其中,LBBB, RBBB和PVC 3类心电信号之间边界清晰,易于区分。只有NORM和APC两类心电信号之间存在局部混叠现象。图8(b)表明加入AFST时域特征之后,5类心电信号明显分离开来,进一步提升了特征区分度。

    图 8  基于AFST提取的特征可视化分布情况

    综上表明,ST由于时频分辨率较低,无法准确提取心电信号特征;AFST根据心电信号自适应调节时频分辨率,提取的时频特征区分度较高,更有利于分类器进行识别。此外在特征选择上,同时选取时域信息与频域信息作为心电信号特征,特征维度低,识别能力强。

    为保证数据验证的准确性,加入5折交叉验证。表2显示了测试集的分类结果,对5种异常心电信号的识别上平均准确率为99.59%,总体灵敏度为99.25%,特异性为99.47%,阳性预测率为99.45%。重复实验20次,并计算标准差,标准差为0.0959,证明了实验的稳定性和可靠性。

    表 2  分类结果(%)
    心电类型AccSenSpePPV
    NORM99.6899.0699.3098.95
    LBBB99.4398.8399.5899.64
    RBBB99.5299.5499.9099.96
    APC99.7099.3698.8699.43
    PVC99.6199.4899.7199.29
    总计99.5999.2599.4799.45
    下载: 导出CSV 
    | 显示表格

    为验证自适应快速S变换算法的有效性,将ST作为对比算法,使用不同分类器进行模式识别,结果如表3所示。容易看出在特征提取方面,AFST用时更短,同时分类准确率更高,这证明了AFST在心电信号的特征提取上具有优越性。在分类器的对比上,XGBoost相对于随机森林和GBDT,分类准确率和训练时间都具有明显优势。改进后的XGBoost,克服了不平衡数据集对模型的影响,提高了模型的泛化能力,因此相对于传统的XGBoost,对应的分类准确率得到了进一步的提升。

    表 3  各算法性能对比
    特征提取方法分类器特征提取
    时间(s)
    分类器运行
    时间(s)
    准确率
    (%)
    ST随机森林389.106.4284.14
    GBDT4.9880.29
    XGBoost4.3585.95
    改进XGBoost4.3588.53
    AFST随机森林152.076.4798.42
    GBDT4.9897.74
    XGBoost4.3699.06
    改进XGBoost4.3699.59
    下载: 导出CSV 
    | 显示表格

    将本文提出的心电信号分类方法与先前工作对比,结果见表4,所得分类效果均基于MIT-BIH数据集。从特征提取上看,本文方法采用自适应快速S变换只提取了心电信号的时频信息作为特征,简化了心电信号的分析。而其他方法需要从多个角度提取不同特征,信号分析过程复杂,特征提取效率较低;从4个分类评价指标上看,本文方法显著优于前5种方法,略低于文献[11]方法。考虑到文献[11]采用的是传统S变换和形态学提取的特征高达316维,忽视了算法的运行效率,在分类总体性能上不如本文方法。

    表 4  不同分类方法对比(%)
    方法分类器ECG特征AccSenSpePPV
    Wavelet[24]E-SVM小波系数、R-R间期、形态特征94.5094.7093.90
    Wavelet[8]RNN-LSTM小波系数、R-R间期、形态特征97.1085.7094.2898.35
    TSFEL[16]RT+SVM统计学特征、时频特征98.2184.2195.9592.81
    XWT[8]SVM小波系数、R-R间期、时域特征98.5099.6998.80
    SST[25]SVMSST系数、R-R间期、形态特征84.7180.4370.75
    ST[11]GA-SVMR-R间期、时频特征、形态特征99.7499.4299.83
    AFST改进XGBoost时频特征99.5999.2599.4799.45
    下载: 导出CSV 
    | 显示表格

    为了验证本文算法在实际的医学诊断中的应用价值,联合中国科学技术大学第一附属医院心电科室,征集20名具有心脏病史患者,作为志愿者参与在线心电信号分类试验。采用12导联设备采集心电信号,采样频率为1 kHz,采样时间2 h。对所得的数据样本按照前文方法进行预处理、分拍,同时根据心脏病临床专家的建议对数据进行标注,筛选出本文研究的5类心电信号,选取正常心电信号1 200例、左束支传导阻滞200例、右束支传导阻滞200例、房性早搏200例和室性早搏200例,共计2 000个心电信号样本构成不平衡数据集,按照3:1的比例构建训练集和测试集,进行特征提取和模式识别,实验结果如图9图10所示。

    图 9  不同特征提取方法性能比较
    图 10  不同分类器性能比较

    通过图9图10的对比,可以得到如下结论:

    (1)自适应快速S变换在实测心电信号数据集上表现优异,5类心电信号准确率维持在96.5%以上,平均准确率为97.32%,显著高于ST和FST。在特征提取时间上,AFST时间最短,约为FST的47%,ST的28%。

    (2)改进的XGBoost在4类分类器中性能最佳,在保持了传统XGBoost较快运行速度的同时,获得了最高的识别准确率。

    实验证明了本文提出的算法的高效性和可靠性,适用于数据样本不平衡的现场实测环境。

    心电信号的检测和分类,有利于各类心脏疾病的诊断和治疗,有利于促进心血管疾病的临床研究,具有极其重要的临床意义。本文针对心电信号传统分类方法效率较低的问题,提出了一种自适应快速S变换和XGBoost的心电信号快速分类方法,实现了5类常见心电信号类型的快速准确分类。与传统方法相比,本文提出的方法准确率更高、算法耗时更短,满足心电信号分类的临床需求。由于本文只研究了5类常见心电信号类型,在未来工作中,可以继续应用本文方法开展更多心电信号类型的诊断研究。

  • 图  1  不同β(f)对应Kaiser窗幅频特性

    图  2  心电信号频率包络线

    图  3  心电信号时域累积特性曲线

    图  4  不同样本长度算法运行时间对比

    图  5  心电信号时域波形图

    图  6  心电信号AFST变换时频3维图

    图  7  基于ST提取的特征可视化分布情况

    图  8  基于AFST提取的特征可视化分布情况

    图  9  不同特征提取方法性能比较

    图  10  不同分类器性能比较

    表  1  不同算法运算量分析

    算法运算量
    复数乘法复数加法时间复杂度
    ST(N2+N3)/2(N3N2)/2O(N3)
    FST(2N2+N2log2N)/4(N2log2N)/2O(N2log2N)
    AFSTq(2N+Nlog2N)/2qNlog2NO(qNlog2N)
    下载: 导出CSV

    表  2  分类结果(%)

    心电类型AccSenSpePPV
    NORM99.6899.0699.3098.95
    LBBB99.4398.8399.5899.64
    RBBB99.5299.5499.9099.96
    APC99.7099.3698.8699.43
    PVC99.6199.4899.7199.29
    总计99.5999.2599.4799.45
    下载: 导出CSV

    表  3  各算法性能对比

    特征提取方法分类器特征提取
    时间(s)
    分类器运行
    时间(s)
    准确率
    (%)
    ST随机森林389.106.4284.14
    GBDT4.9880.29
    XGBoost4.3585.95
    改进XGBoost4.3588.53
    AFST随机森林152.076.4798.42
    GBDT4.9897.74
    XGBoost4.3699.06
    改进XGBoost4.3699.59
    下载: 导出CSV

    表  4  不同分类方法对比(%)

    方法分类器ECG特征AccSenSpePPV
    Wavelet[24]E-SVM小波系数、R-R间期、形态特征94.5094.7093.90
    Wavelet[8]RNN-LSTM小波系数、R-R间期、形态特征97.1085.7094.2898.35
    TSFEL[16]RT+SVM统计学特征、时频特征98.2184.2195.9592.81
    XWT[8]SVM小波系数、R-R间期、时域特征98.5099.6998.80
    SST[25]SVMSST系数、R-R间期、形态特征84.7180.4370.75
    ST[11]GA-SVMR-R间期、时频特征、形态特征99.7499.4299.83
    AFST改进XGBoost时频特征99.5999.2599.4799.45
    下载: 导出CSV
  • [1] KREATSOUS C and ANAND S S. The impact of social determinants on cardiovascular disease[J]. Canadian Journal of Cardiology, 2010, 26 Suppl C: 8C–13C.
    [2] World Health Organization. Cardiovascular disease (CVDs)[EB/OL].https://www.who.int/en/news-room/fact-sheets/detail/cardiovascular-diseases-(cvds), 2021.
    [3] AMORIM P, MORAES T, FAZANARO D, et al. Shearlet and contourlet transforms for analysis of electrocardiogram signals[J]. Computer Methods and Programs in Biomedicine, 2018, 161: 125–132. doi: 10.1016/j.cmpb.2018.04.021
    [4] 吴志勇, 丁香乾, 许晓伟, 等. 基于深度学习和模糊C均值的心电信号分类方法[J]. 自动化学报, 2018, 44(10): 1913–1920. doi: 10.16383/j.aas.2018.c170417

    WU Zhiyong, DING Xiangqian, XU Xiaowei, et al. A method for ECG classification using deep learning and fuzzy C-means[J]. Acta Automatica Sinica, 2018, 44(10): 1913–1920. doi: 10.16383/j.aas.2018.c170417
    [5] DE CHAZAL P, O’DWYER M, and REILLY R B. Automatic classification of heartbeats using ECG morphology and heartbeat interval features[J]. IEEE Transactions on Biomedical Engineering, 2004, 51(7): 1196–1206. doi: 10.1109/TBME.2004.827359
    [6] MAR T, ZAUNSEDER S, MARTÍNEZ J P, et al. Optimization of ECG classification by means of feature selection[J]. IEEE Transactions on Biomedical Engineering, 2011, 58(8): 2168–2177. doi: 10.1109/TBME.2011.2113395
    [7] 王金海, 史梦颖, 张兴华. 基于EMD和ApEn特征提取的心律失常分类研究[J]. 仪器仪表学报, 2016, 37(S1): 168–173. doi: 10.19650/j.cnki.cjsi.2016.s1.028

    WANG Jinhai, SHI Mengying, and ZHANG Xinghua. Classification of arrhythmias based on EMD and ApEn feature extraction[J]. Chinese Journal of Scientific Instrument, 2016, 37(S1): 168–173. doi: 10.19650/j.cnki.cjsi.2016.s1.028
    [8] JACOB N and JOSEPH L A. Classification of ECG beats using cross wavelet transform and support vector machines[C]. 2015 IEEE Recent Advances in Intelligent Computational Systems (RAICS), Trivandrum, India, 2015.
    [9] 尹柏强, 邓影, 王署东, 等. 时频广义S变换和VL-MOBP神经网络在人体动作识别中的应用[J]. 电子测量与仪器学报, 2020, 34(11): 1–9. doi: 10.13382/j.jemi.B2003032

    YIN Baiqiang, DENG Ying, WANG Shudong, et al. Application of time-frequency generalized S transform and VL-MOBP neural network in human motion recognition[J]. Journal of Electronic Measurement and Instrumentation, 2020, 34(11): 1–9. doi: 10.13382/j.jemi.B2003032
    [10] DAS M K and ARI S. Electrocardiogram beat classification using S-transform based feature set[J]. Journal of Mechanics in Medicine and Biology, 2014, 14(5): 1450066. doi: 10.1142/S0219519414500663
    [11] YANG Jianyong and YAN Ruqiang. A multidimensional feature extraction and selection method for ECG arrhythmias classification[J]. IEEE Sensors Journal, 2021, 21(13): 14180–14190. doi: 10.1109/JSEN.2020.3047962
    [12] RAJ S and RAY K C. ECG signal analysis using DCT-Based DOST and PSO optimized SVM[J]. IEEE Transactions on Instrumentation and Measurement, 2017, 66(3): 470–478. doi: 10.1109/TIM.2016.2642758
    [13] SINHA N and DAS A. Identification and localization of myocardial infarction based on analysis of ECG signal in cross spectral domain using boosted SVM classifier[J]. IEEE Transactions on Instrumentation and Measurement, 2021, 70: 4007409. doi: 10.1109/TIM.2021.3117663
    [14] HOU Borui, YANG Jianyong, WANG Pu, et al. LSTM-based auto-encoder model for ECG arrhythmias classification[J]. IEEE Transactions on Instrumentation and Measurement, 2020, 69(4): 1232–1240. doi: 10.1109/TIM.2019.2910342
    [15] 柯丽, 王丹妮, 杜强, 等. 基于卷积长短时记忆网络的心律失常分类方法[J]. 电子与信息学报, 2020, 42(8): 1990–1998. doi: 10.11999/JEIT190712

    KE Li, WANG Danni, DU Qiang, et al. Arrhythmia classification based on convolutional long short term memory network[J]. Journal of Electronics &Information Technology, 2020, 42(8): 1990–1998. doi: 10.11999/JEIT190712
    [16] BHATTACHARYYA S, MAJUMDER S, DEBNATH P, et al. Arrhythmic heartbeat classification using ensemble of random forest and support vector machine algorithm[J]. IEEE Transactions on Artificial Intelligence, 2021, 2(3): 260–268. doi: 10.1109/TAI.2021.3083689
    [17] KUNG B H, HU P Y, HUANG C C, et al. An efficient ECG classification system using resource-saving architecture and random forest[J]. IEEE Journal of Biomedical and Health Informatics, 2021, 25(6): 1904–1914. doi: 10.1109/JBHI.2020.3035191
    [18] 王帅, 赵钟瑶, 张翔宇, 等. 穿戴式心电信号质量的三分类评估方法[J]. 中国生物医学工程学报, 2020, 39(5): 550–556. doi: 10.3969/j.issn.0258-8021.2020.05.005

    WANG Shuai, ZHAO Zhongyao, ZHANG Xiangyu, et al. Three-type classification method for wearable ECG signal quality[J]. Chinese Journal of Biomedical Engineering, 2020, 39(5): 550–556. doi: 10.3969/j.issn.0258-8021.2020.05.005
    [19] 喻玲, 符玲, 熊思宇, 等. 基于最优Kaiser窗的动态同步相量测量算法[J]. 电网技术, 2022, 46(3): 1100–1108. doi: 10.13335/j.1000-3673.pst.2021.0602

    YU Ling, FU Ling, XIONG Siyu, et al. A dynamic synchrophasor estimation algorithm based on optimal Kaiser window[J]. Power System Technology, 2022, 46(3): 1100–1108. doi: 10.13335/j.1000-3673.pst.2021.0602
    [20] 尹柏强, 何怡刚, 朱彦卿. 一种广义S变换及模糊SOM网络的电能质量多扰动检测和识别方法[J]. 中国电机工程学报, 2015, 35(4): 866–872. doi: 10.13334/j.0258-8013.pcsee.2015.04.013

    YIN Baiqiang, HE Yigang, and ZHU Yanqing. Detection and classification of power quality multi-disturbances based on generalized s-transform and fuzzy SOM neural network[J]. Proceedings of the CSEE, 2015, 35(4): 866–872. doi: 10.13334/j.0258-8013.pcsee.2015.04.013
    [21] 王奕森, 夏树涛. 集成学习之随机森林算法综述[J]. 信息通信技术, 2018, 12(1): 49–55. doi: 10.3969/j.issn.1674-1285.2018.01.009

    WANG Yisen and XIA Shutao. A survey of random forests algorithms[J]. Information and Communications Technologies, 2018, 12(1): 49–55. doi: 10.3969/j.issn.1674-1285.2018.01.009
    [22] 赵洪山, 闫西慧, 王桂兰, 等. 应用深度自编码网络和XGBoost的风电机组发电机故障诊断[J]. 电力系统自动化, 2019, 43(1): 81–86. doi: 10.7500/AEPS20180708001

    ZHAO Hongshan, YAN Xihui, WANG Guilan, et al. Fault diagnosis of wind turbine generator based on deep autoencoder network and XGBoost[J]. Automation of Electric Power Systems, 2019, 43(1): 81–86. doi: 10.7500/AEPS20180708001
    [23] PAN Jiapu and TOMPKINS W J. A real-time QRS detection algorithm[J]. IEEE Transactions on Biomedical Engineering, 1985, BME-32(3): 230–236. doi: 10.1109/TBME.1985.325532
    [24] CHIA N G, HAU Y W, and JAMALUDIN M N. Robust arrhythmia classifier using wavelet transform and support vector machine classification[C]. The 13th International Colloquium on Signal Processing & its Applications (CSPA), Penang, Malaysia, 2017.
    [25] HERRY C L, FRASCH M, SEELY A J, et al. Heart beat classification from single-lead ECG using the synchrosqueezing transform[J]. Physiological Measurement, 2017, 38(2): 171–187. doi: 10.1088/1361-6579/aa5070
  • 期刊类型引用(3)

    1. 陈文杰,苏振兴,孙先涛,刘远远,胡祥涛,智亚丽. 噪声环境下外骨骼设备语音信号的特征提取. 吉林大学学报(工学版). 2024(10): 3050-3057 . 百度学术
    2. 曹缘,王振华,张继红,刘宁宁,李文昊,张金珠. 基于WOA-XGBoost的膜下滴灌棉花蒸散量预测模型. 排灌机械工程学报. 2024(12): 1280-1286 . 百度学术
    3. 陈岚,张华琳,汪波,文斌,邱丽霞,段卿. 基于XGBoost和改进LSTNet的气温预测设计. 无线电工程. 2023(03): 591-600 . 百度学术

    其他类型引用(1)

  • 加载中
图(10) / 表(4)
计量
  • 文章访问数:  436
  • HTML全文浏览量:  616
  • PDF下载量:  88
  • 被引次数: 4
出版历程
  • 收稿日期:  2022-03-02
  • 修回日期:  2022-07-10
  • 网络出版日期:  2022-07-19
  • 刊出日期:  2023-04-10

目录

/

返回文章
返回