
Citation: | Liya HUANG, Yibo SU, Junkai MA, Weiwei DING, Chuancheng SONG. Research on Support Tensor Machine Based on Synchronous Brain Network for Emotion Classification[J]. Journal of Electronics & Information Technology, 2020, 42(10): 2462-2470. doi: 10.11999/JEIT190882 |
一直以来,情绪是心理学、教育学、信息科学等多个学科的研究热点[1]。传统的情绪识别方法是通过面部表情、文字、语音语调等特征进行情绪信息的提取。近年来,脑电信号因其客观、不易伪装的特点,在情绪识别领域受到广泛关注。脑机接口技术发展迅速,脑电信号采集设备的采样频率以及采样精度越来越高,为脑电情绪识别技术的发展提供了巨大的助力。
传统情绪研究试图对不同头皮位置处的脑电信号(Electro EncephaloGram, EEG) 进行特征提取。主要包括小波特征、节律波幅值变化、熵特征和功率谱特征等进行特征提取。主要包括小波特征、节律波幅值变化、熵特征和功率谱特征等[2-4]。然而人类的大脑是一个大型的网络,情绪的加工需要多个脑区的共同参与和相互作用,对特定脑区EEG导联信号进行单独分析的研究方法无法反映情绪加工过程中脑区间的信息流向或因果关系,也无法精确地对不同情绪进行分类。因此,本文拟建立各导联信号之间的统计关系,构建EEG脑网络进行情绪分类研究。目前,基于EEG信号的脑网络研究通常从多导联信号间的依赖程度(相关系数、互信息等)、同步或异步性(互近似熵等)、因果关系(格兰杰因果关系指数,定向传递函数、部分定向相干等)、信息传递(转移熵、符号转移熵等)等角度构建脑网络[5-9]。考虑到情绪的产生是人脑前额叶脑区多个部位共同作用的结果[10],同步性能更好地描述情绪产生时人脑的活动机理,本文拟通过EEG信号计算前额叶处各导联EEG信号之间的相位锁定值(Phase Locking Value, PLV),来描述EEG信号的时频关联度,识别大脑各区域之间的同步性,构建同步性脑网络,研究情绪与大脑各区域同步性的关系。
目前的脑电情绪分类算法较多采用支持向量机(Support Vector Machine, SVM), K-最近邻(K-Nearest Neighbor, KNN),决策树等分类模型,其输入特征多为向量形式[2-4]。由于本文构建的EEG同步性脑网络特征集维数较大,如果降维成特征向量作为分类模型输入,容易丢失脑网络不同维度间的结构信息,忽略大脑各区域之间的联系。为了有效保存特征集不同模态之间的相关性、互补性等结构特征,有效地解决特征向量的高维度问题,基于张量的分类方法在人工智能等领域得到了广泛应用[11,12]。因此,本文拟采用支持张量机作为分类模型,以减少脑网络结构信息的丢失。综上所述,本文拟从不同情绪下各导联EEG的同步性为切入点,提出一种基于支持张量机的同步性脑网络情绪分类方法(Support Tensor Machine based on Synchronous Brain Network, SBN-STM),对算法参数的选取进行深入研究,并基于DEAP情绪数据库对算法进行仿真比较,来验证算法的有效性。
本文提出的基于支持张量机的同步性脑网络情绪分类方法SBN-STM架构如图1所示。第1步构建同步性脑网络。基于多导联的脑电情绪数据,通过计算导联间的相位锁定值PLV构建同步性脑网络,并设定合适的阈值,得到同步性脑网络。第2步选取最优训练集。确定最优张量序列窗口中点以及窗口半径,在保证模型分类准确率的前提下尽可能减小训练集大小,提高模型训练速度。第3步完成支持张量机STM的情绪分类。将训练集作为STM的输入,训练STM模型,求解模型判别式,获得情绪的正负二分类类别。
EEG相位锁定值(PLV)[13]描述了脑电信号导联对之间的相位同步性,其数值仅与导联对信号的相位有关,忽略了信号幅值差异。导联信号通过小波分解进行时频映射,得到该导联在时频坐标下的瞬时相位值,记为
PLVx,y(t,f)=1N|N∑n=1exp(j{ΔΦn(t,f)})| | (1) |
其中
ΔΦn(t,f)=Φx(t,f)−Φy(t,f) | (2) |
记时频映射中频率点数目为
PLVx,y(t)=1N×L∑f|N∑n=1exp(j{ΔΦn(t,f)})| | (3) |
根据式(3)计算各导联对在
¯PLV={PLV,PLV≥PLVT0,PLV<PLVT | (4) |
若
本文提出的SBN-STM算法选取同步性脑网络作为特征张量,输入支持张量机模型进行训练。本小节对张量和支持张量机的基础理论进行简要介绍。
张量的本质是多维数组,可以看作是向量、矩阵的高阶扩展[14,15]。记
Cai等人[16]于2006年以支持向量机为基础,将向量扩展为张量,提出了支持张量机(Support Tensor Machine, STM)模型。对于给定训练样本集
f(X)=sgn(X×1w1×2w2···×KwK+b)=sgn(XK∏d=1×dwd+b) | (5) |
其中
类似于支持向量机,STM同样基于最大间隔的思想,旨在寻找一个可以在张量空间中将不同类别样本尽可能分开的超平面[17-19],因此STM的优化问题可以表示为
minwi∈Rni,b∈R,ζ∈Rl12||K∏i=1⊗wi||+Cl∏i=1ζi,s.t.yi(Φ(Xi)K∏d=1×dwd+b)≥1−ζiζi≥0,i=1,2,···,l | (6) |
其中
在训练分类模型时,训练集的选取对分类准确率以及模型训练时间有很大影响。由于同步性脑网络反映了人脑在某一时刻的区域同步性特征,为了提取不同时间段的同步性特征,需要设置一个时间窗,以窗口内的特征序列作为训练集。窗口位置以及窗口大小是窗口的基本属性。考虑到张量数据计算的复杂性以及支持张量机适用于小样本分类的特性,为减少训练时间,提高效率,本文首先设定一个固定窗口
选定最优张量序列窗口中点位置后,进行最优窗口大小的选取。以最优张量序列窗口中点位置为起始点,设置正负情绪样本空间窗口半径初始值为
假设窗口半径为1 s,则正负情绪样本各3个,训练集共包含6个样本,窗口如图3所示。
由于本文采用的特征张量——同步性脑网络为2阶张量,故仅介绍2阶支持张量机模型求解方法。2阶支持张量机的权重张量为秩1的2阶张量,可秩1分解为两个向量的外积形式,记这两个向量为
步骤 1 固定
步骤 2 令
min12μ1||v||+Cl∏i=1ζi,s.t.yi(v⋅xi+b)≥1−ζiζi≥0,i=1,2,···,l | (7) |
步骤 3 构造拉格朗日函数
L(v,b,ζ,α,β)=12vTv+Cl∑i=1ζi−l∑i=1αi(yi(vTxi+b)−1+ζi)−l∑i=1βiζi | (8) |
步骤 4 对式(8)各变量求偏导,得
l∑i=1αiyi=0v=2l∑i=1αiyixiC=αi+βi} | (9) |
步骤 5 将式(9)代入式(8),则问题转化为仅对
minW(α)=12l∑i=1l∑j=1αiαjyiyjK(Xi,Xj)−l∑i=1αi | (10) |
其中
K(Xi,Xj)=Φ(Xi)ΦT(Xj)=[e−||zi1−zj1||2/2σ2···e−||zi1−zjq||2/2σ2⋮⋱⋮e−||ziq−zj1||2/2σ2···e−||ziq−zjq||2/2σ2] | (11) |
其中
步骤 6 求解式(10)可得最优解
步骤 7 令
min12μ2||u||+Cl∏i=1ζi,s.t.yi(uT⋅x′i+b)≥1−ζi,ζi≥0,i=1,2,···,l | (12) |
类似于求
f(Xj)=sgn(1μ1l∑i=1αi∗uTK(Xj,Xi)u+b) | (13) |
本文的实验采用DEAP数据集[24]进行情绪分类研究。DEAP数据集记录了32名被试在观看40段音乐视频节选时的EEG信号。其中,40段视频MV具有情绪诱发作用,可以诱发被试较为明显的情绪活动。EEG信号通过“10-20”国际导联标准的32导联电极帽采集,32导联位置如图4所示。
观看完MV后,所有被试均进行打分,按照1~9的分值区间,标记所观看MV的有效价(Valence)、唤醒度(Arousal)、优势度(Dominance)数值。其中Valence表征了被试者观看完视频后的情绪状况,Valence值越高表示被试者情绪为正向情绪,反之,Valence值越低表示被试者情绪为负向情绪。为避免出现模棱两可的非标准情绪,本文根据Valence值对被试情绪进行式(14)的划分
情绪类别={正,5.5≤Valence≤9负,1≤Valence≤3.5 | (14) |
同时设置标签序列
本文选取DEAP数据库中的S01, S02, S03, S07, S08, S12 6个被试的脑电数据进行实验。有研究表明[10],情绪的产生主要与人类大脑前额叶的活动有关。因此,为减小张量维度,避免信息冗余,本文仅研究人脑前额叶及其附近的导联信号。选取FP1, FP2, AF3, AF4, F7, F8, F3, F4 8个导联进行数据分析,上述8个导联位置在图4中采用灰色标记。
DEAP数据集信号时长为63 s,前3 s为基线时间,默认被试此时处于平静状态,无情绪波动。后60 s为被试观看音乐视频的时间。本文仅研究被试观看音乐视频的后60 s的EEG数据。取每秒第1个采样时刻的EEG数据,计算8个导联之间的各导联对的PLV值,生成当前时刻的PLV矩阵。共计生成60个PLV矩阵。被试S01在第1, 15, 35, 60 s起始时刻的正向情绪PLV矩阵生成的灰度图片如图5所示。
图6显示,被试S01在第15 s时刻以及第60 s时刻,被试的前额叶仅有少数节点连接,此时被试的前额叶处于低同步状态。在第35 s时刻前额叶有多个节点连接,此时被试的前额叶处于高度同步状态。
支持张量机适用于小样本分析,为提高训练效率,选择小窗口进行训练。因此固定窗口半径为5 s,此时最小初始中点位置为第6 s,即正负情绪样本各11个,训练集包含22个样本。以5 s为步长滑动窗口,依次训练模型,计算测试集分类准确率。其中测试集为样本空间中的22个随机样本。窗口各中点位置下的模型准确率如图7—图9所示。
由图8可知,当窗口中点为第36 s时,模型分类准确率均值最高,为77.3%。图9中,当窗口中点为第36 s时,模型分类准确率的中值最高,且离散程度最小,对不同被试的分类差别小,此时分类器性能最稳定。因此,选取第36 s为窗口中点最为合适。由此可见,被试在进行实验时,其情绪激发是一个从平静到情绪波动的过程,因此实验的中间时刻附近被试的情绪最为强烈,被试的情绪在实验的起始和终止阶段趋于平静,不适于模型的训练。
以第36 s为窗口中点,设置窗口半径初始值为1 s,此时正负情绪样本各3个,训练集包含6个样本。以1 s为步长扩展窗口半径,依次进行STM训练,测试集为样本空间中的20个随机样本。各窗口半径下的模型准确率如图10—图12所示。
由图11可知,当窗口半径为6 s和16 s时,模型分类准确率最高,均为78.3%。由图12可知,窗口半径为6 s时的模型分类准确率的中值略高于窗口半径为16 s时的模型分类准确率。同时,考虑到窗口半径越小,则训练集规模越小,训练时间越短,因此选取6 s为窗口半径最为合适。
为直观展现以同步性脑网络作为特征的SBN-STM分类算法的情绪二分类性能,本文将其与支持向量机(SVM)、C4.5决策树、K近邻(KNN)、人工神经网络(ANN)以及线性回归分类器(LR)5个传统的分类模型进行比较,如表1所示。为避免不同样本集对各分类算法性能的影响,本文选取的5个用于比较的分类算法以及本文提出的SBN-STM分类算法均使用DEAP数据集进行分类研究。
文献[2]采用支持向量机模型(SVM)以及C4.5决策树算法进行情绪二分类,提取EEG信号各频段的功率谱密度(PSD)作为特征,分别输入SVM以及C4.5决策树模型进行训练。文献[3]将EEG信号进行小波分解,计算各小波频段的小波能量、小波熵以及统计特征,训练K近邻模型(KNN)。文献[4]提取EEG信号在α, β, θ 3个频段上的双谱(Bispectrum),输入人工神经网络模型(ANN)进行训练。文献[25]采用线性回归算法,根据皮尔逊相关系数建立脑功能连接网络,将脑功能连接网络输入LR分类器进行线性分类训练。
其中,支持向量机(SVM), C4.5决策树,K近邻(KNN)以及人工神经网络(ANN)这4个算法的特征提取方式均为谱分析,采用传统的信号处理方法进行脑电信号特征提取,将各导联的脑电信号单独分析,情绪二分类的准确率在70%左右。本文提出的SBN-STM算法在特征提取时考虑情绪处理脑区(前额叶)各部位的协作特征,建立同步性脑网络,表征人脑在处理情绪问题时的同步性特征,保留了人脑情绪处理脑区的整体信息,对各导联EEG信号进行整合,在一定程度上减小了信息丢失,从而提高了模型的分类性能。SBN-STM算法分类方法实现的正负情绪二分类准确率为78.3%,相比较于以功率谱密度、小波能量、小波熵、双谱等数据作为特征向量的传统分类模型,本文所提算法的正负情绪二分类准确提升了6%以上。
文献[25]的线性回归分类器(LR)同样是以构建脑网络的方式提取情绪特征,并对特征集进行线性划分,从而进行情绪二分类。考虑到情绪相关的脑网络并非处于线性样本空间,本文提出的SBN-STM分类算法采用支持张量机(STM)作为分类器,将非线性样本空间进行高维映射,进而将非线性空间转换为类线性样本空间,从而提高分类器的性能,提高情绪分类准确率。通过对比可以发现,SBN-STM分类算法的情绪二分类性能优于线性回归分类算法,分类准确率提升了8%以上。
本文将支持张量机与同步性脑网络相结合,提出了一种基于支持张量机的同步性脑网络情绪分类方法。实验表明,本方法对正向情绪和负向情绪有较好的分类效果,分类准确率均值为78.3%,优于支持向量机,C4.5决策树,人工神经网络,K近邻等以向量为特征的情绪分类模型。同时,本文对同步性脑网络张量序列的选取进行了研究,发现采用DEAP数据集进行情绪分类研究时,选取中点为第36 s,半径为6 s的张量序列窗口组成训练集,分类准确率最高,此时训练集样本大小为26个,正负情绪样本各13个。在保证最高分类准确率的同时,实现的较小的训练集,由此解决了传统情绪分类算法特征冗余的问题,提高了模型的训练速度。
同时发现,被试在第35 s时刻前额叶处于高度同步状态。在第15 s时刻以及第60 s时刻,被试的前额叶仅有少数节点连接,此时被试的前额叶处于低同步状态。这一现象进一步证实了最优张量序列窗口的合理性与科学性:在测试的起始阶段以及结束阶段,被试的情绪波动不明显;在测试的第36 s左右被试的情绪波动最强烈,适合进行模型的训练。
同时,本文对同步性脑网络张量序列的选取进行了研究,得到了采用DEAP数据集进行情绪分类研究时的最佳张量序列窗口,解决了传统情绪分类算法特征冗余的问题。在未来的工作中,可以提高张量阶数,考虑时间维度,对3阶同步性脑网络张量实施进一步的研究。
赵国朕, 宋金晶, 葛燕, 等. 基于生理大数据的情绪识别研究进展[J]. 计算机研究与发展, 2016, 53(1): 80–92. doi: 10.7544/issn1000-1239.2016.20150636
ZHAO Guozhen, SONG Jinjing, GE Yan, et al. Advances in emotion recognition based on physiological big data[J]. Journal of Computer Research and Development, 2016, 53(1): 80–92. doi: 10.7544/issn1000-1239.2016.20150636
|
THAMMASAN N, MORIYAMA K, FUKUI K I, et al. Familiarity effects in EEG-based emotion recognition[J]. Brain Informatics, 2017, 4(1): 39–50. doi: 10.1007/s40708-016-0051-5
|
MERT A and AKAN A. Emotion recognition from EEG signals by using multivariate empirical mode decomposition[J]. Pattern Analysis and Applications, 2018, 21(1): 81–89. doi: 10.1007/s10044-016-0567-6
|
KUMAR N, KHAUND K, and HAZARIKA S M. Bispectral analysis of EEG for emotion recognition[J]. Procedia Computer Science, 2016, 84: 31–35. doi: 10.1016/j.procs.2016.04.062
|
PINCUS S M and VISCARELLO R R. Approximate entropy: A regularity measure for fetal heart rate analysis[J]. Obstetrics and Gynecology, 1992, 79(2): 249–255.
|
郝志峰, 谢蔚涛, 蔡瑞初, 等. 基于因果强度的时序因果关系发现算法[J]. 计算机工程与设计, 2017, 38(1): 132–137. doi: 10.16208/j.issn1000-7024.2017.01.025
HAO Zhifeng, XIE Weitao, CAI Ruichu, et al. Causal inference on time series using causal strength[J]. Computer Engineering and Design, 2017, 38(1): 132–137. doi: 10.16208/j.issn1000-7024.2017.01.025
|
刘澄玉, 赵莉娜, 刘常春. 生理信号时间序列周期性和平稳性对近似熵和样本熵算法的影响分析[J]. 北京生物医学工程, 2012, 31(2): 154–158, 163. doi: 10.3969/j.issn.1002-3208.2012.02.09
LIU Chengyu, ZHAO Li’na, and LIU Changchun. Influence analysis of physiological time-series periodicity and stability for approximate entropy and sample entropy[J]. Beijing Biomedical Engineering, 2012, 31(2): 154–158, 163. doi: 10.3969/j.issn.1002-3208.2012.02.09
|
ITO T, HEARNE L, MILL R, et al. Discovering the computational relevance of brain network organization[J]. Trends in Cognitive Sciences, 2020, 24(1): 25–38. doi: 10.1016/j.tics.2019.10.005
|
高佳, 王蔚. 基于稀疏贝叶斯网络的情绪脑电的有效性脑网络研究[J]. 生物医学工程学杂志, 2015, 32(5): 945–951. doi: 10.7507/1001-5515.20150169
GAO Jia and WANG Wei. Research of effective network of emotion electroencephalogram based on sparse Bayesian network[J]. Journal of Biomedical Engineering, 2015, 32(5): 945–951. doi: 10.7507/1001-5515.20150169
|
武杰, 周春宇, 杨叶, 等. 基于组独立成分分析方法的情绪刺激对脑部激活区域的研究[J]. 生物医学工程学进展, 2018, 39(3): 125–129. doi: 10.3969/j.issn.1674-1242.2018.03.001
WU Jie, ZHOU Chunyu, YANG Ye, et al. Research on the brain activation region from emotion stimulation based on the group ICA method[J]. Progress in Biomedical Engineering, 2018, 39(3): 125–129. doi: 10.3969/j.issn.1674-1242.2018.03.001
|
MAHYARI A G, ZOLTOWSKI D M, BERNAT E M, et al. A tensor decomposition-based approach for detecting dynamic network states from EEG[J]. IEEE Transactions on Biomedical Engineering, 2017, 64(1): 225–237. doi: 10.1109/TBME.2016.2553960
|
金广智, 石林锁, 崔智高, 等. 结合GLCM与三阶张量建模的在线目标跟踪[J]. 电子与信息学报, 2016, 38(7): 1609–1615. doi: 10.11999/JEIT151108
JIN Guangzhi, SHI Linsuo, CUI Zhigao, et al. Online object tracking based on gray-level co-occurrence matrix and third-order tensor[J]. Journal of Electronics &Information Technology, 2016, 38(7): 1609–1615. doi: 10.11999/JEIT151108
|
LIU Chuanwei, FU Yunfa, YANG Jun, et al. Discrimination of motor imagery patterns by electroencephalogram phase synchronization combined with frequency band energy[J]. IEEE/CAA Journal of Automatica Sinica, 2017, 4(3): 551–557. doi: 10.1109/JAS.2016.7510121
|
CHEN Yanyan, WANG Kuaini, and ZHONG Ping. One-class support tensor machine[J]. Knowledge-Based Systems, 2016, 96: 14–28. doi: 10.1016/j.knosys.2016.01.007
|
DIAN Renwei, LI Shutao, and FANG Leyuan. Learning a low tensor-train rank representation for hyperspectral image super-resolution[J]. IEEE Transactions on Neural Networks and Learning Systems, 2019, 30(9): 2672–2683. doi: 10.1109/TNNLS.2018.2885616
|
CAI Deng, HE Xiaofei, WEN Jirong, et al. Support tensor machines for text categorization[R]. UIUCDCS-R-2006-2714, 2006: 2222–6990.
|
CHEN Yuee and REN Baili. Research on large scale data set processing based on SVM[J]. Advanced Materials Research, 2011, 216: 738–741. doi: 10.4028/www.scientific.net/amr.216.738
|
ZHOU Bingyin, SONG Biao, HASSAN M M, et al. Multilinear rank support tensor machine for crowd density estimation[J]. Engineering Applications of Artificial Intelligence, 2018, 72: 382–392. doi: 10.1016/j.engappai.2018.04.011
|
CHEN Yanyan, LU Liyun, and ZHONG Ping. One-class support higher order tensor machine classifier[J]. Applied Intelligence, 2017, 47(4): 1022–1030. doi: 10.1007/s10489-017-0945-9
|
LI Zhibao, DAI Yuhong, and GAO Huan. Alternating projection method for a class of tensor equations[J]. Journal of Computational and Applied Mathematics, 2019, 346: 490–504. doi: 10.1016/j.cam.2018.07.013
|
冯翔, 陈志坤, 赵宜楠, 等. 基于联合优化松弛交替投影的组网雷达恒模波形设计[J]. 电子与信息学报, 2016, 38(7): 1745–1751. doi: 10.11999/JEIT151152
FENG Xiang, CHEN Zhikun, ZHAO Yi’nan, et al. Unimodular waveforms design for netted radar system via joint optimization relaxed alternating projection[J]. Journal of Electronics &Information Technology, 2016, 38(7): 1745–1751. doi: 10.11999/JEIT151152
|
SHI Haifa, ZHAO Xinbin, and JING Ling. Tensor distance based least square twin support tensor machine[J]. Applied Mechanics and Materials, 2014, 668. doi: 10.4028/www.scientific.net/amm.668-669.1170
|
CYGANEK B and WOZNIAK M. Efficient computation of the tensor chordal kernels[J]. Procedia Computer Science, 2016, 80: 1702–1711. doi: 10.1016/j.procs.2016.05.511
|
KOELSTRA S, MÜHL C, SOLEYMANI M, et al. DEAP: A database for emotion analysis; Using physiological signals[J]. IEEE Transactions on Affective Computing, 2012, 1(3): 18–31. doi: 10.1109/t-affc.2011.15
|
赵少楷. 基于EEG脑网络特征的情绪识别研究[D]. [硕士论文], 杭州电子科技大学, 2018.
ZHAO Shaokai. The research of emotion recognition based on features of brain networks[D]. [Master dissertation], Hangzhou Dianzi University, 2018.
|