Accurate and Fast ElectroCardioGram Classification Method Based on Adaptive Fast S-Transform and XGBoost
-
摘要: 针对心电信号(ECG)传统分类方法效率较低的问题,该文提出一种基于自适应快速S变换(AFST)和XGBoost的心电信号精确快速分类方法。该方法首先通过快速定位算法确定心电信号特征频率点,再根据特征频率点自适应调节S变换窗宽因子,增强S变换的时频分辨率的同时避免迭代计算,大大减少运行时间。其次,基于自适应快速S变换的时频矩阵提取12个特征量来表征5种心电信号的特征信息,特征向量维数低,识别能力强。最后,利用XGBoost算法对特征向量进行识别。MIT-BIH心律失常数据库和患者实测数据验证表明,该方法显著地缩短了分类时间,对5种心电信号的分类准确率分别为99.59%和97.32%,适用于实际检测系统中心律失常疾病的快速诊断。Abstract: Considering the low efficiency of traditional ElectroCardioGram(ECG) classification methods, an accurate and fast ElectroCardioGram classification method based on Adaptive Fast S-Transform (AFST) and XGBoost is proposed. Firstly, the main feature points of the ECG signals are determined through a fast positioning algorithm, and then the S-Transform window width factor is adjusted adaptively according to the main feature points to enhance the time-frequency resolution of the S-transform while avoiding iterative calculation and reducing the running time greatly; Secondly, based on the time-frequency matrix of AFST, 12 eigenvalues are extracted to represent the characteristic information of 5 kinds of ECG signals, with low eigenvector dimension and strong recognition ability. Finally, XGBoost is used to identify the eigenvectors. The experimental studies based on the MIT-BIH arrhythmia database and the verification of patient measurement data show that, with the proposed method, the classification time of ECG signals is significantly shortened and classification accuracy of 99.59%, 97.32% is obtained respectively, which is suitable for the rapid diagnosis of abnormal diseases in the center rate of the actual detection system.
-
1. 引言
近年来,心血管病的发病率呈明显上升趋势,而心律失常是心血管疾病中最常见的一种病症,研究表明,到2035年,心血管疾病将成为死亡的主要原因,并将严重影响国家的金融和卫生保健系统[1,2]。因此,研究心律失常是诊治该类疾病患者的重要工作之一。心电图(ElectroCardioGram, ECG)信号是心脏电活动的记录器,可提供有关心脏性能的重要信息,可作为心血管疾病诊断的有效手段[3]。传统方法依赖于心脏疾病专家凭借经验判断,具有很强的主观性,并且效率非常低。因此,设计一种高效的心律失常自动诊断方法显得尤为重要。
目前心电信号的分类技术主要包括信号预处理、特征提取、自动分类3个环节[4]。信号预处理包括去除心电信号中的工频干扰、肌电信号干扰、基频漂移等噪声,并将心电信号进行分拍。针对心电信号的特征提取,国内外广大学者提出了不同的方法,目前主要有时域分析法、经验模态分解法、小波变换和S变换等。Chazal等人[5]基于心电信号本身特征,利用形态学方法提取ECG形态、R-R间期、T波持续时间,取得了85.88%的分类准确率。Mar等人[6]选择R-R间期、QRS波群和T波持续时间等作为心电信号特征,对5类心电信号分类准确率为89.0%。时域信息作为心电信号最有效的信息,可以反映心律异常的主要特征,但通常无法揭示心电信号隐藏的细节信息。王金海等人[7]提出一种近似熵和经验模态分解结合的新方法,对心电信号进行分解得到有限个模态分量,并计算近似熵来代表心电信号特征向量。Jacob等人[8]利用小波变换提取了心电信号的小波系数、R-R间期等特征,获得了94.5%的准确率。上述变换法提取特征时,没有加入能够直接反映信号特征的时频信息,分类准确率不足。对比上述方法,S变换能更好地提取到心电信号附加时间特征的形态特征,具有更强的时频表征能力[9]。Das等人[10]和Yang等人[11]分析了心电信号的主要特点,将S变换(S-Transform, ST)引入到心电信号的特征提取工作中,为心电信号分类工作提供了新思路。然而考虑到S变换在心电信号分析中的时频分辨率较低,难以充分提取心电信号的主要特征;同时S变换需要极大的计算量,当心电信号数据量较大时,会严重影响心电信号特征提取效率。
心电信号的模式识别方法主要有支持向量机(Support Vector Machine, SVM)[12,13]、神经网络[14,15]、集成学习[16,17]。在这个研究领域,仍然亟待解决的问题有两个:第一,分类器模型的分类效率有待提升。心电信号的诊断有很高的时效性要求,对于分类准确率低、训练时间长的分类器已不再适用于心电信号的快速分类;第二,心电信号数据常具有类别不平衡的特点,这要求分类器考虑心电信号类别权重,对所有样本都能充分学习。
基于上述问题,本文从诊断心律失常的临床需求出发,提出一种心电信号5分类方案。针对心电信号设计自适应快速S变换(Adaptive Fast S-Transform, AFST)算法,降低计算复杂度,提取高时频分辨率特征集;提出一种自定义损失函数的XGBoost模型,克服了不平衡数据集对分类模型的影响,实现了对5类心电信号的精确、快速分类。在MIT-BIH心律失常数据库验证算法有效性的基础上,通过采集中国科学技术大学附属医院的患者实测数据进行验证,实验结果表明,本文所提算法的准确率和时效性能够满足临床实时诊断的要求。
2. 自适应快速S变换
2.1 传统S变换及其在ECG识别应用中的局限性
S变换是一种时频分析工具,十分适合非平稳信号的分析,信号
x(t) 的S变换为S(τ,f)=+∞∫−∞x(t)w(τ−t,f)e−j2πftdt (1) w(τ−t,f)=1σ(f)√2πe−(τ−t)22σ(f)2 (2) 其中,
w(τ−t,f) 为高斯窗函数;σ(f)=1/|f| 为窗宽调节因子;τ 为时移因子;f 为频率。令f→n/NT ,τ→kT ,则S变换的离散形式为S[kT,nNT]=N−1∑m=0X[m+nNT]e−2π2m2n2ej2πmkN,n≠0S[kT,0]=1NN−1∑m=0x[mT],n=0} (3) 其中,
N 为心电信号采样点数;T 为心电信号采样间隔;m ,n ,k 的取值为0~N−1 。心电信号经过S变换后得到一个2维复数矩阵,矩阵的行与列分别代表时间采样点与频率采样点。目前在ECG的分类研究中,ST并未得到广泛应用,主要是由于ST对信号进行变换使用高斯窗口,存在低频段时间分辨率较低、高频段频率分辨率较低的情况。另外,对于采样频率较高的ECG信号,采样点增多会使得S变换计算量剧增,限制了其在心电信号特征提取中的应用。
2.2 Kaiser窗的自适应S变换
本文提出基于Kaiser窗函数的自适应窗宽S变换(Adaptive S-Transform, AST)。相较于高斯窗口,Kaiser窗频带内能量主要集中在主瓣中,对于旁瓣有很好的抑制能力,并且Kaiser窗由于存在窗宽调节因子,使得它在时频性要求不同的场景中可以灵活转换。基于Kaiser窗S变换的表达式为
S(τ,f,β)=+∞∫−∞x(t)wK(τ−t,β)e−j2πftdt (4) 其中,
wK(τ−t,β) 为Kaiser窗函数;β 为窗宽调节因子。通过对不同频段设置合适的参数β ,即可达到不同的时频分辨率。由于临床诊断的心电信号频率范围要求在0.05~125 Hz,临床监护的频率范围要求0.05~45 Hz[18]。由此可见心电信号的能量主要集中在45 Hz以内,其中QRS波群能量更是集中在2~15 Hz。因此,为了满足心电信号分析的时频性要求,对Kaiser窗需要设置合适的参数,使不同频段采用不同的窗宽是很有必要的。通过文献[19]对不同信号的Kaiser参数选取标准可知,为均衡时间分辨率和频率分辨率,β 的选取范围是2~8。当
β 较大时,Kaiser窗函数的主瓣较宽,旁瓣较低,并且旁瓣的衰减速率增加,时间分辨率高,频率分辨率下降,不利于心电信号的特征提取。当选择较小的β 值时,Kaiser窗函数频域窗口较窄,频率分辨率升高,时间分辨率会下降,影响模式识别精度。因此,需要选择合适的β 以准确提取心电信号的特征,减小扰动的干扰和算法误差。将心电信号频率范围分段,分别设置不同β 值:在0~2 Hz的低频段,为减小基频漂移成分干扰,在此频段设置较大β 值获取高时间分辨率;在2~15 Hz频段,频率成分丰富,设置较低β 值,提高频率分辨率以检测心电信号有用信息;在15~45 Hz频率区间,心电信号频率成分相对较少,使β 值随频率逐渐增大,从高频率分辨率过渡到高时间分辨率;当频率高于45 Hz,β 统一选取8。因此本文针对心电信号特征提取提出了一种通过调节窗函数参数β 的自适应窗长S变换。具体做法为wK(t,β(f))=I0[β(f)√1−(1−2tL)2]I0[β(f)] (5) β(f)={8−k1f,f∈(0,2)2,f∈(2,15)2+k2(f−15),f∈(15,45) (6) 其中,
I0(⋅) 为第1类修正0阶贝塞尔函数,L 为心电信号长度,k1,k2 是控制β(f) 变换率的固定参数,取值分别为3, 0.2。图1为β(f) 对应的Kaiser窗函数幅频特性。为证明AST相对于ST具有较好的时频分辨率,以NORM类型心电信号为例展开时频分析对比试验。图2展示了ST, AST对类型心电信号频率包络线,通过对比可以看出,在心电信号集中的低频段,ST的频率分辨率较低,很难识别出不同频率成分。原因在于心电信号不同于其他信号,其频率范围相对集中,传统的高斯窗函数不具备识别此类信号的能力。改进的自适应Kaiser窗,考虑到心电信号的特异性,保证了在心电信号的主要频率段有足够的频率分辨率,因此能够识别更多的频率成分。
图3为心电信号的ST,AST时域累积特性曲线,可以看出,在心电信号的R波附近,ST和AST都识别出了心电信号的特征,时间分辨率接近。在P波和T波附近,AST能够识别出更多的尖峰,时间分辨率优于ST。
2.3 自适应快速S变换
已知N点心电信号的ST需要进行离散傅里叶变换与离散傅里叶逆变换,完成整个ST运算的时间复杂度为
O(N3) 。用快速傅里叶变换(Fast Fourier Transform, FFT)实现的快速S变换(Fast S-Transform, FST)[20],将ST的时间复杂度降低到O(N2log2N) ,即便如此,随着采样点数的增加FST的运行时间可能仍无法满足实时信号分析要求。对于心电信号来说,频率范围主要位于45 Hz区间内,ST矩阵中大多数列对于信号的频谱分析并没有贡献,也就不存在计算的必要。如何剔除非特征频率点所在列,保留特征频率点所在列是实现快速算法的关键。据此,本文提出特征频率点快速定位算法来实现快速运算的S变换,即自适应快速S变换。在2~15 Hz区间,设置FFT归一化阈值
ξ1=0.05 ,15~45 Hz区间ξ2=0.025 ,高于45 Hz阈值ξ3=0.005 。自适应快速S变换的实现步骤如下:(1)计算ECG信号
x(nT) 的快速傅里叶变换(FFT)频谱X(λ/NT) 。(2)特征点快速定位算法:对频谱取极大值,定位特征频率点
λi ,λi 满足|X(λiNT)|>ξk (7) |X(λi−1NT)|<|X(λiNT)|>|X(λi+1NT)| (8) 其中,
i=1,2,⋯,q ,q 是ECG信号中特征频率点的数目,ξk 为设定阈值,k=1,2,3 。(3)根据特征频率点
λi ,确定窗宽调节因子β(λi/NT) 并计算Kaiser窗的FFT频谱W(rNT,λiNT)=1N|N−1∑n=0wK(n,β(λiNT))e−j2πnrN| (9) (4)将
X(λi/NT) 频移得到X((λi+r)/NT) 。(5)求
X((λi+r)/NT) 与W(r/(NT),λi/(NT)) 的乘积B(r,λi) B(r,λi)=X(λi+rNT)W(rNT,λiNT) (10) (6)对特征频率点
λi ,计算B(r,λi) 的快速傅里叶逆变换(Inverse Fast Fourier Transform, IFFT),得到λi 对应的自适应快速S变换AFST(m,λi)=N−1∑r=0B(r,λi)ej2πrmN (11) (7)重复步骤(3)—步骤(6)对所有特征频率点完成AFST。
当采用AFST去分析一个
N 点ECG信号时,假设特征频率点的个数为q ,此时时间复杂度为O(qNlog2N) 。由于q 远小于N/2 ,AFST的运算量相对于FST进一步减少。表1为3种算法运量分析。表 1 不同算法运算量分析算法 运算量 复数乘法 复数加法 时间复杂度 ST (N2+N3)/2 (N3−N2)/2 O(N3) FST (2N2+N2log2N)/4 (N2log2N)/2 O(N2log2N) AFST q(2N+Nlog2N)/2 qNlog2N O(qNlog2N) 为验证实际变换过程中AFST的计算效率,分别利用ST, FST以及AFST对不同样本点数心电信号样本进行运算,对比3种算法的运行时间,结果如图4所示。
当心电信号样本点数增加时,3种算法的运算量都呈增大趋势。同样长度的样本下,AFST时间均优于ST和FST,在本文选取的300样本点数据,ST的运算时间为0.018 s,FST的运算时间为0.013 s,AFST的运算时间仅为0.002 5 s。当数据样本逐渐增大时,AFST由于计算复杂度较低,在运算时间上相对ST和FST具有更明显的优势。这表明,对不同长度的心电信号样本,本文所提的AFST都能够较快地完成信号变换,适用于时效性要求较高的临床环境。
3. XGBoost分类模型
集成算法是通过构建并结合多个学习器完成学习任务[21]。XGBoost算法是在自适应增强(Adaptive Boosting, AdaBoost)算法和梯度提升迭代决策树(Gradient Boosting Decision Tree, GBDT)算法基础上优化形成的,通过不断拟合优化目标函数,从而达到准确预测分类结果[22]。XGBoost算法在原函数的基础上增加了2阶导数和正则项,加之系统层面的一些优化,使得该算法减小了过拟合的可能性,大大缩短了训练时间,并且能够保持较高的准确性。
对于心电信号的分类而言,不同心率类型在心电图中所占比例不同,通常表现为正常心率类型占比较高,而异常心率类型占比较低,即数据集具有类别不平衡的特点。这会导致分类器训练过程中对占比较少的类别样本学习不充分,对心电信号识别能力不足。为解决上述问题,通过改进XGBoost损失函数并在损失函数中引入L2正则项对XGBoost进行改进。
改进后的第
m 棵树的损失函数为Lm=−1N(N∑i=1αiL(yi,Fm−1(xi;Am−1))+ω2‖a‖22) (12) 其中,
Fm−1(xi;Am−1) 表示前m−1 棵树组成的模型在参数为Am−1 的条件下对输入xi 的预测值,这里的Am−1 包括前m−1 棵树的参数a1,a2,⋯,am−1 。L(yi,Fm−1(xi;Am−1)) 是描述真实值yi 与当前模型预测值误差的函数,对XGBoost来说是对数损失函数。ω 是正则化系数,系数αi 的取值为αi={1,yi=0NC⋅N(yi),yi≠0 (13) 其中,
yi=0 表示正常样本,样本权重设置为1;yi≠0 表示非正常样本,样本权重由总样本数量N 、总样本类别数C 与标签为yi 的样本总数N(yi) 决定。当数据集为不平衡数据集时,通过对异常样本加权,可以使得异常样本在训程中获得更大的梯度,从而减小样本比例差异带来的影响,最终提升XGBoost在不平衡数据集上的表现能力。当数据集为平衡数据集时,上述改进的XGBoost自动退化为传统XGBoost。
本文使用准确率(Accuracy,
Acc )、灵敏度(Sensitivity,Sen )、特异性(Specificity,Spe )、阳性预测率(Positive Predictive Value,PPV )4种度量指标描述分类器的性能,公式为Acc=TP + TNTP + FP + FN + TN×100% (14) Sen=TPTP + FN×100% (15) Spe=TNTN + FP×100% (16) PPV = TPTP + FP×100% (17) 其中,
TP 为样本被正确分类的个数;TN 不属于某类且被分为其他类的个数;FP 为其他类样本被分类为某类样本的总数;FN 为某样本分类为其他类样本的总数。4. 心电信号分类实验
4.1 信号预处理
本文首先采用MIT-BIH公开数据集验证本文方法的有效性。MIT-BIH心律失常数据库中共包含了47名受试者的48条带注释的ECG记录,采样频率360 Hz,每条记录都有对应的标签注释。实验选取MIT-BIH数据库中MILI导联的5类心电信号的数据作为研究对象,包括正常心电图(NORM beat, NORM)、左束支传导阻滞(Left Bundle Branch Block beat, LBBB)、右束支传导阻滞(Right Bundle Branch Block beat, RBBB)、房性早搏(Atrial Premature Contraction, APC)和室性早搏(Premature Ventricular Contraction, PVC)。
由于心电信号在采集过程中受到基频漂移、工频干扰、肌电噪声等因素的影响[15],本文先采用简单的低通滤波器和小波阈值降噪对数据进行预处理,再采用Pan等人[23]提出的R波检测方法,以R波波峰为基准,向前取120个点,向后取180个点,共计300个点的长度作为一个心电信号样本。最终从48条记录中提取出了5类心电信号的全部数据共99 325个样本,对应的样本数量分别为77 495, 8 061, 7 255, 2 543, 6 971,按照3:1的比例构建实验训练集和测试集。
4.2 特征提取
本文将特征分为频域特征和时域特征。首先采用AFST算法对5类心电信号变换,将心电信号从时域转换到时间-频率下的时频图,如图5和图6所示。
频域特征用特征频率点及其对应的幅值表示,对特征频率点按照幅值升序排列,选取最大4组作为频率特征,计为
[P1,P2,P3,P4,Q1,Q2,Q3,Q4] 。时域特征的提取依靠心电信号变换后的时域累计特性曲线,选取最大值、最小值、均值、方差4种时域特征指标;由于心电信号的AFST只对特征频率点进行变换,因此AFST特征提取时,时域特征指的是最大特征频率点所对应行的最大值、最小值、均值、方差4种时域特征指标,计为[A1,A2,A3,A4] 。为此,本文从时域和频域两个角度提取特征,构成特征向量[P1,P2,P3,P4,Q1,Q2,Q3,Q4,A1,A2,A3,A4] 。4.3 特征评价
对5类心电信号分别采用ST和AFST方法提取特征,得到样本容量为400的特征向量。为比较不同特征区分能力的差异,分别使用频率特征子集
F1=[P1,P2,P3,P4,Q1,Q2,Q3,Q4] (18) 原始时频特征
F2=[P1,P2,P3,P4,Q1,Q2,Q3,Q4,A1,A2,A3,A4] (19) 利用相同参数的核主成分分析法将特征向量转换成3维特征分布图,对特征进行评价。图7结果表明,基于ST提取的频率特征和时频特征不能清晰地将5类心电信号类型进行区分,其原因在于ST的高斯窗不能根据心电信号的自适应调节频率分辨率,在提取频率特征时各种频率之间相互干扰,特征之间界限不明显;其次由于ST对于心电信号之间相互关联,不具有很好的类间离散度。
图8为AFST的特征分布情况。图8(a)表明单纯的频率特征能够较好地区分5类心电信号的特征,其中,LBBB, RBBB和PVC 3类心电信号之间边界清晰,易于区分。只有NORM和APC两类心电信号之间存在局部混叠现象。图8(b)表明加入AFST时域特征之后,5类心电信号明显分离开来,进一步提升了特征区分度。
综上表明,ST由于时频分辨率较低,无法准确提取心电信号特征;AFST根据心电信号自适应调节时频分辨率,提取的时频特征区分度较高,更有利于分类器进行识别。此外在特征选择上,同时选取时域信息与频域信息作为心电信号特征,特征维度低,识别能力强。
4.4 XGBoost模式识别
为保证数据验证的准确性,加入5折交叉验证。表2显示了测试集的分类结果,对5种异常心电信号的识别上平均准确率为99.59%,总体灵敏度为99.25%,特异性为99.47%,阳性预测率为99.45%。重复实验20次,并计算标准差,标准差为0.0959,证明了实验的稳定性和可靠性。
表 2 分类结果(%)心电类型 Acc Sen Spe PPV NORM 99.68 99.06 99.30 98.95 LBBB 99.43 98.83 99.58 99.64 RBBB 99.52 99.54 99.90 99.96 APC 99.70 99.36 98.86 99.43 PVC 99.61 99.48 99.71 99.29 总计 99.59 99.25 99.47 99.45 为验证自适应快速S变换算法的有效性,将ST作为对比算法,使用不同分类器进行模式识别,结果如表3所示。容易看出在特征提取方面,AFST用时更短,同时分类准确率更高,这证明了AFST在心电信号的特征提取上具有优越性。在分类器的对比上,XGBoost相对于随机森林和GBDT,分类准确率和训练时间都具有明显优势。改进后的XGBoost,克服了不平衡数据集对模型的影响,提高了模型的泛化能力,因此相对于传统的XGBoost,对应的分类准确率得到了进一步的提升。
表 3 各算法性能对比特征提取方法 分类器 特征提取
时间(s)分类器运行
时间(s)准确率
(%)ST 随机森林 389.10 6.42 84.14 GBDT 4.98 80.29 XGBoost 4.35 85.95 改进XGBoost 4.35 88.53 AFST 随机森林 152.07 6.47 98.42 GBDT 4.98 97.74 XGBoost 4.36 99.06 改进XGBoost 4.36 99.59 将本文提出的心电信号分类方法与先前工作对比,结果见表4,所得分类效果均基于MIT-BIH数据集。从特征提取上看,本文方法采用自适应快速S变换只提取了心电信号的时频信息作为特征,简化了心电信号的分析。而其他方法需要从多个角度提取不同特征,信号分析过程复杂,特征提取效率较低;从4个分类评价指标上看,本文方法显著优于前5种方法,略低于文献[11]方法。考虑到文献[11]采用的是传统S变换和形态学提取的特征高达316维,忽视了算法的运行效率,在分类总体性能上不如本文方法。
表 4 不同分类方法对比(%)方法 分类器 ECG特征 Acc Sen Spe PPV Wavelet[24] E-SVM 小波系数、R-R间期、形态特征 94.50 94.70 93.90 – Wavelet[8] RNN-LSTM 小波系数、R-R间期、形态特征 97.10 85.70 94.28 98.35 TSFEL[16] RT+SVM 统计学特征、时频特征 98.21 84.21 95.95 92.81 XWT[8] SVM 小波系数、R-R间期、时域特征 98.50 99.69 98.80 – SST[25] SVM SST系数、R-R间期、形态特征 84.71 80.43 70.75 – ST[11] GA-SVM R-R间期、时频特征、形态特征 99.74 99.42 99.83 – AFST 改进XGBoost 时频特征 99.59 99.25 99.47 99.45 4.5 实测数据验证
为了验证本文算法在实际的医学诊断中的应用价值,联合中国科学技术大学第一附属医院心电科室,征集20名具有心脏病史患者,作为志愿者参与在线心电信号分类试验。采用12导联设备采集心电信号,采样频率为1 kHz,采样时间2 h。对所得的数据样本按照前文方法进行预处理、分拍,同时根据心脏病临床专家的建议对数据进行标注,筛选出本文研究的5类心电信号,选取正常心电信号1 200例、左束支传导阻滞200例、右束支传导阻滞200例、房性早搏200例和室性早搏200例,共计2 000个心电信号样本构成不平衡数据集,按照3:1的比例构建训练集和测试集,进行特征提取和模式识别,实验结果如图9和图10所示。
(1)自适应快速S变换在实测心电信号数据集上表现优异,5类心电信号准确率维持在96.5%以上,平均准确率为97.32%,显著高于ST和FST。在特征提取时间上,AFST时间最短,约为FST的47%,ST的28%。
(2)改进的XGBoost在4类分类器中性能最佳,在保持了传统XGBoost较快运行速度的同时,获得了最高的识别准确率。
实验证明了本文提出的算法的高效性和可靠性,适用于数据样本不平衡的现场实测环境。
5. 结束语
心电信号的检测和分类,有利于各类心脏疾病的诊断和治疗,有利于促进心血管疾病的临床研究,具有极其重要的临床意义。本文针对心电信号传统分类方法效率较低的问题,提出了一种自适应快速S变换和XGBoost的心电信号快速分类方法,实现了5类常见心电信号类型的快速准确分类。与传统方法相比,本文提出的方法准确率更高、算法耗时更短,满足心电信号分类的临床需求。由于本文只研究了5类常见心电信号类型,在未来工作中,可以继续应用本文方法开展更多心电信号类型的诊断研究。
-
表 1 不同算法运算量分析
算法 运算量 复数乘法 复数加法 时间复杂度 ST (N2+N3)/2 (N3−N2)/2 O(N3) FST (2N2+N2log2N)/4 (N2log2N)/2 O(N2log2N) AFST q(2N+Nlog2N)/2 qNlog2N O(qNlog2N) 表 2 分类结果(%)
心电类型 Acc Sen Spe PPV NORM 99.68 99.06 99.30 98.95 LBBB 99.43 98.83 99.58 99.64 RBBB 99.52 99.54 99.90 99.96 APC 99.70 99.36 98.86 99.43 PVC 99.61 99.48 99.71 99.29 总计 99.59 99.25 99.47 99.45 表 3 各算法性能对比
特征提取方法 分类器 特征提取
时间(s)分类器运行
时间(s)准确率
(%)ST 随机森林 389.10 6.42 84.14 GBDT 4.98 80.29 XGBoost 4.35 85.95 改进XGBoost 4.35 88.53 AFST 随机森林 152.07 6.47 98.42 GBDT 4.98 97.74 XGBoost 4.36 99.06 改进XGBoost 4.36 99.59 表 4 不同分类方法对比(%)
方法 分类器 ECG特征 Acc Sen Spe PPV Wavelet[24] E-SVM 小波系数、R-R间期、形态特征 94.50 94.70 93.90 – Wavelet[8] RNN-LSTM 小波系数、R-R间期、形态特征 97.10 85.70 94.28 98.35 TSFEL[16] RT+SVM 统计学特征、时频特征 98.21 84.21 95.95 92.81 XWT[8] SVM 小波系数、R-R间期、时域特征 98.50 99.69 98.80 – SST[25] SVM SST系数、R-R间期、形态特征 84.71 80.43 70.75 – ST[11] GA-SVM R-R间期、时频特征、形态特征 99.74 99.42 99.83 – AFST 改进XGBoost 时频特征 99.59 99.25 99.47 99.45 -
[1] KREATSOUS C and ANAND S S. The impact of social determinants on cardiovascular disease[J]. Canadian Journal of Cardiology, 2010, 26 Suppl C: 8C–13C. [2] World Health Organization. Cardiovascular disease (CVDs)[EB/OL].https://www.who.int/en/news-room/fact-sheets/detail/cardiovascular-diseases-(cvds), 2021. [3] AMORIM P, MORAES T, FAZANARO D, et al. Shearlet and contourlet transforms for analysis of electrocardiogram signals[J]. Computer Methods and Programs in Biomedicine, 2018, 161: 125–132. doi: 10.1016/j.cmpb.2018.04.021 [4] 吴志勇, 丁香乾, 许晓伟, 等. 基于深度学习和模糊C均值的心电信号分类方法[J]. 自动化学报, 2018, 44(10): 1913–1920. doi: 10.16383/j.aas.2018.c170417WU Zhiyong, DING Xiangqian, XU Xiaowei, et al. A method for ECG classification using deep learning and fuzzy C-means[J]. Acta Automatica Sinica, 2018, 44(10): 1913–1920. doi: 10.16383/j.aas.2018.c170417 [5] DE CHAZAL P, O’DWYER M, and REILLY R B. Automatic classification of heartbeats using ECG morphology and heartbeat interval features[J]. IEEE Transactions on Biomedical Engineering, 2004, 51(7): 1196–1206. doi: 10.1109/TBME.2004.827359 [6] MAR T, ZAUNSEDER S, MARTÍNEZ J P, et al. Optimization of ECG classification by means of feature selection[J]. IEEE Transactions on Biomedical Engineering, 2011, 58(8): 2168–2177. doi: 10.1109/TBME.2011.2113395 [7] 王金海, 史梦颖, 张兴华. 基于EMD和ApEn特征提取的心律失常分类研究[J]. 仪器仪表学报, 2016, 37(S1): 168–173. doi: 10.19650/j.cnki.cjsi.2016.s1.028WANG Jinhai, SHI Mengying, and ZHANG Xinghua. Classification of arrhythmias based on EMD and ApEn feature extraction[J]. Chinese Journal of Scientific Instrument, 2016, 37(S1): 168–173. doi: 10.19650/j.cnki.cjsi.2016.s1.028 [8] JACOB N and JOSEPH L A. Classification of ECG beats using cross wavelet transform and support vector machines[C]. 2015 IEEE Recent Advances in Intelligent Computational Systems (RAICS), Trivandrum, India, 2015. [9] 尹柏强, 邓影, 王署东, 等. 时频广义S变换和VL-MOBP神经网络在人体动作识别中的应用[J]. 电子测量与仪器学报, 2020, 34(11): 1–9. doi: 10.13382/j.jemi.B2003032YIN Baiqiang, DENG Ying, WANG Shudong, et al. Application of time-frequency generalized S transform and VL-MOBP neural network in human motion recognition[J]. Journal of Electronic Measurement and Instrumentation, 2020, 34(11): 1–9. doi: 10.13382/j.jemi.B2003032 [10] DAS M K and ARI S. Electrocardiogram beat classification using S-transform based feature set[J]. Journal of Mechanics in Medicine and Biology, 2014, 14(5): 1450066. doi: 10.1142/S0219519414500663 [11] YANG Jianyong and YAN Ruqiang. A multidimensional feature extraction and selection method for ECG arrhythmias classification[J]. IEEE Sensors Journal, 2021, 21(13): 14180–14190. doi: 10.1109/JSEN.2020.3047962 [12] RAJ S and RAY K C. ECG signal analysis using DCT-Based DOST and PSO optimized SVM[J]. IEEE Transactions on Instrumentation and Measurement, 2017, 66(3): 470–478. doi: 10.1109/TIM.2016.2642758 [13] SINHA N and DAS A. Identification and localization of myocardial infarction based on analysis of ECG signal in cross spectral domain using boosted SVM classifier[J]. IEEE Transactions on Instrumentation and Measurement, 2021, 70: 4007409. doi: 10.1109/TIM.2021.3117663 [14] HOU Borui, YANG Jianyong, WANG Pu, et al. LSTM-based auto-encoder model for ECG arrhythmias classification[J]. IEEE Transactions on Instrumentation and Measurement, 2020, 69(4): 1232–1240. doi: 10.1109/TIM.2019.2910342 [15] 柯丽, 王丹妮, 杜强, 等. 基于卷积长短时记忆网络的心律失常分类方法[J]. 电子与信息学报, 2020, 42(8): 1990–1998. doi: 10.11999/JEIT190712KE Li, WANG Danni, DU Qiang, et al. Arrhythmia classification based on convolutional long short term memory network[J]. Journal of Electronics &Information Technology, 2020, 42(8): 1990–1998. doi: 10.11999/JEIT190712 [16] BHATTACHARYYA S, MAJUMDER S, DEBNATH P, et al. Arrhythmic heartbeat classification using ensemble of random forest and support vector machine algorithm[J]. IEEE Transactions on Artificial Intelligence, 2021, 2(3): 260–268. doi: 10.1109/TAI.2021.3083689 [17] KUNG B H, HU P Y, HUANG C C, et al. An efficient ECG classification system using resource-saving architecture and random forest[J]. IEEE Journal of Biomedical and Health Informatics, 2021, 25(6): 1904–1914. doi: 10.1109/JBHI.2020.3035191 [18] 王帅, 赵钟瑶, 张翔宇, 等. 穿戴式心电信号质量的三分类评估方法[J]. 中国生物医学工程学报, 2020, 39(5): 550–556. doi: 10.3969/j.issn.0258-8021.2020.05.005WANG Shuai, ZHAO Zhongyao, ZHANG Xiangyu, et al. Three-type classification method for wearable ECG signal quality[J]. Chinese Journal of Biomedical Engineering, 2020, 39(5): 550–556. doi: 10.3969/j.issn.0258-8021.2020.05.005 [19] 喻玲, 符玲, 熊思宇, 等. 基于最优Kaiser窗的动态同步相量测量算法[J]. 电网技术, 2022, 46(3): 1100–1108. doi: 10.13335/j.1000-3673.pst.2021.0602YU Ling, FU Ling, XIONG Siyu, et al. A dynamic synchrophasor estimation algorithm based on optimal Kaiser window[J]. Power System Technology, 2022, 46(3): 1100–1108. doi: 10.13335/j.1000-3673.pst.2021.0602 [20] 尹柏强, 何怡刚, 朱彦卿. 一种广义S变换及模糊SOM网络的电能质量多扰动检测和识别方法[J]. 中国电机工程学报, 2015, 35(4): 866–872. doi: 10.13334/j.0258-8013.pcsee.2015.04.013YIN Baiqiang, HE Yigang, and ZHU Yanqing. Detection and classification of power quality multi-disturbances based on generalized s-transform and fuzzy SOM neural network[J]. Proceedings of the CSEE, 2015, 35(4): 866–872. doi: 10.13334/j.0258-8013.pcsee.2015.04.013 [21] 王奕森, 夏树涛. 集成学习之随机森林算法综述[J]. 信息通信技术, 2018, 12(1): 49–55. doi: 10.3969/j.issn.1674-1285.2018.01.009WANG Yisen and XIA Shutao. A survey of random forests algorithms[J]. Information and Communications Technologies, 2018, 12(1): 49–55. doi: 10.3969/j.issn.1674-1285.2018.01.009 [22] 赵洪山, 闫西慧, 王桂兰, 等. 应用深度自编码网络和XGBoost的风电机组发电机故障诊断[J]. 电力系统自动化, 2019, 43(1): 81–86. doi: 10.7500/AEPS20180708001ZHAO Hongshan, YAN Xihui, WANG Guilan, et al. Fault diagnosis of wind turbine generator based on deep autoencoder network and XGBoost[J]. Automation of Electric Power Systems, 2019, 43(1): 81–86. doi: 10.7500/AEPS20180708001 [23] PAN Jiapu and TOMPKINS W J. A real-time QRS detection algorithm[J]. IEEE Transactions on Biomedical Engineering, 1985, BME-32(3): 230–236. doi: 10.1109/TBME.1985.325532 [24] CHIA N G, HAU Y W, and JAMALUDIN M N. Robust arrhythmia classifier using wavelet transform and support vector machine classification[C]. The 13th International Colloquium on Signal Processing & its Applications (CSPA), Penang, Malaysia, 2017. [25] HERRY C L, FRASCH M, SEELY A J, et al. Heart beat classification from single-lead ECG using the synchrosqueezing transform[J]. Physiological Measurement, 2017, 38(2): 171–187. doi: 10.1088/1361-6579/aa5070 期刊类型引用(3)
1. 陈文杰,苏振兴,孙先涛,刘远远,胡祥涛,智亚丽. 噪声环境下外骨骼设备语音信号的特征提取. 吉林大学学报(工学版). 2024(10): 3050-3057 . 百度学术
2. 曹缘,王振华,张继红,刘宁宁,李文昊,张金珠. 基于WOA-XGBoost的膜下滴灌棉花蒸散量预测模型. 排灌机械工程学报. 2024(12): 1280-1286 . 百度学术
3. 陈岚,张华琳,汪波,文斌,邱丽霞,段卿. 基于XGBoost和改进LSTNet的气温预测设计. 无线电工程. 2023(03): 591-600 . 百度学术
其他类型引用(1)
-