基于Sinkhorn距离特征缩放的多约束非负矩阵分解算法

李松涛; 李维刚; 甘平; 蒋林

doi:10.11999/JEIT210946

基于Sinkhorn距离特征缩放的多约束非负矩阵分解算法

doi: 10.11999/JEIT210946

李松涛¹,
李维刚^1, ,,
甘平¹,
蒋林²

1.
武汉科技大学冶金自动化与检测技术教育部工程研究中心武汉 430081
2.
武汉科技大学冶金装备及其控制教育部重点实验室武汉 430081

基金项目: 国家重点研发计划(2019YFB1310000)，湖北省揭榜制科技项目(2020BED003)，湖北省重点研发计划(2020BAB098)

详细信息

作者简介:
李松涛：男，博士生，研究方向为多媒体数据降维与模式感知算法

李维刚：男，教授，研究方向为人工智能与机器学习算法

甘平：男，硕士生，研究方向为小样本学习与度量学习

蒋林：男，教授，研究方向为室内移动机器人地图构建、定位、导航及液压机器人

通讯作者:
李维刚　liweigang.luck@foxmail.com

中图分类号: TN911.73; TP391
计量
- 文章访问数: 1409
- HTML全文浏览量: 953
- PDF下载量: 107
- 被引次数: 6
出版历程
- 收稿日期: 2021-09-06
- 修回日期: 2021-11-18
- 录用日期: 2021-11-23
- 网络出版日期: 2021-11-26
- 刊出日期: 2022-12-16

Multi-constrained Non-negative Matrix Factorization Algorithm Based on Sinkhorn Distance Feature Scaling

1.
Engineering Research Center for Metallurgical Automation and Measurement Technology, Ministry of Education, Wuhan University of Science and Technology, Wuhan 430081, China
2.
Key Laboratory of Metallurgical Equipment and Control Technology, Ministry of Education, Wuhan University of Science and Technology, Wuhan 430081, China

Funds: The National Key R&D Program (2019YFB1310000), Hubei Province Science and Technology Projects (2020BED003), Hubei Province Key R&D Program (2020BAB098)

摘要

摘要: 为了减少原始特征对非负矩阵分解(NMF)算法的共适应性干扰，并提高NMF的子空间学习能力与聚类性能，该文提出一种基于Sinkhorn距离特征缩放的多约束半监督非负矩阵分解算法。首先该算法通过Sinkhorn距离对原始输入矩阵进行特征缩放，提高空间内同类数据特征之间的关联性，然后结合样本标签信息的双图流形结构与范数稀疏约束作为双正则项，使分解后的基矩阵具有稀疏特性和较强的空间表达能力，最后，通过KKT条件对所提算法目标函数的进行优化推导，得到有效的乘法更新规则。通过在多个图像数据集以及平移噪声数据上的聚类实验结果对比分析，该文所提算法具有较强的子空间学习能力，且对平移噪声有更强的鲁棒性。
- 非负矩阵分解 /
- 特征缩放 /
- 子空间流形正则化 /
- 稀疏约束 /
- 聚类
Abstract: In order to reduce the co-adaptability interference of the original feature to the Non-negative Matrix Factorization (NMF) algorithm and improve the performance of non-negative matrix factorization subspace learning and clustering performance, a novel multi-constrained semi-supervised non-negative matrix factorization algorithm based on Sinkhorn distance feature scaling is proposed. First, the algorithm is feature-scaled by the Sinkhorn distance to the original input matrix to improve the correlation between features of the same type of data in the space, then, the dual graph manifold structure combined with the sample label information and the norm sparsity constraint are embedded in the model as a dual regular term, so that the decomposed base matrix has sparse characteristics and strong spatial expression ability. Finally, the objective function of the proposed algorithm is optimized by Karush-Kuhn-Tucker (KKT) conditions, and effective multiplication update rules are obtained. Through the comparative analysis of the results of multiple clustering experiments on multiple image data sets and translational noise data, the algorithm proposed in this paper has a strong subspace learning ability and is more robust to translational noise.
- Non-negative Matrix Factorization(NMF) /
- Feature scaling /
- Subspace manifold regularization /
- Sparse constraint /
- Clustering

HTML全文

1. 引言

近年来，随着电子信息技术的发展，图像数据在维度与数量上双重爆发式增长，导致视觉特征与高层语义之间“语义鸿沟”逐渐增大，成为视觉感知领域的瓶颈，因此如何从图像中提取有效的低维数据来提高视觉感知的性能成为一个重要的问题^[1-3]。作为一种著名的子空间学习方法，非负矩阵分解(Nonnegative Matrix Factorization, NMF)可以以适当的方式在低维子空间中表达高维数据，进而可以更好地揭示数据的潜在结构信息，并提高各种模式感知算法的能力^[4]。由于NMF算法的非负性子空间表达更符合人们心理学和生理学对整体数据感知的描述，而且其对整体数据的分解符合纯加性的感知，这也更易于直观的理解，因此它在某种意义上抓住了数据描述的本质，这与其他子空间学习方法(例如矢量量化(Vector Quantization, VQ)、主成分分析(Principal Component Analysis, PCA)、奇异值分解(Singular Value Decomposition, SVD)等)相区别。NMF在多种任务中取得了令人印象深刻的性能，例如社区检测^[5]、高光谱解混^[6]、面部特征提取^[7]、推荐系统^[8]等。

传统NMF算法的缺点之一是忽略了数据集的固有结构，该问题表现在多个方面。首先，样本之间的相关性可能存在于原始数据集中，所以希望可以利用这些相关性信息来提高NMF的性能；其次，特征之间存在一定的相关性，基于高斯误差的 ${L_2}$ 距离方法不能准确度量特征之间的距离，这使得样本内部特征的相关性较弱，导致NMF算法对高维空间的平移噪声有着不准确的预估，抑制了算法的性能；最后，原NMF算法在分解过程由于其非负性的约束条件，忽略了编码矩阵的稀疏性约束，导致分解结果的稀疏性较低，进而影响全局的稀疏表达。

为了克服上述限制，研究人员主要从两个方面着手优化研究，多数研究围绕算法本身改进展开，如Shirdhonkar等人^[9]使用地球真实距离(Earth Mover's Distance, EMD)来测量原始数据矩阵与乘积矩阵之间的差异，从而提出了EMD NMF。由于EMD对不同维度之间的关系敏感，与其他测量方法相比，EMD在感知空间差异上更加准确，因此EMD NMF能提高样本的子空间区分能力；Cai等人^[10]结合流形学习的图结构理论提出了GNMF (Graph regularized Nonnegative Matrix Factorization)算法，其使用最近邻图对局部模型进行几何结构建模，旨在找到保留图结构的矩阵分解，因此GNMF保留了固有的几何结构，同时获得了隐藏语义信息的紧凑表示；Qian等人^[11]结合EMD NMF与GNMF的建模思想，将Sinkhorn距离以损失函数的形式置入GNMF算法，而提出了SDNMF (Non-negative Matrix Factorization with Sinkhorn Distance)算法，该方法在EMD NMF的基础上提高了计算速度，并保留了空间的结构与特征关联能力，有较好的子空间学习能力；Hoyer^[12]提出了一种稀疏的非负矩阵分解方法(Non-negative Matrix Factorization with Sparseness constrains, SNMF)，将稀疏约束引入到NMF目标函数中，以控制分解因子的稀疏表示程度，这可以保证基于特征的零件信息表示形式的直接可解释性；Liu等人^[13]提出了一种称为CNMF (Constrained Nonnegative Matrix Factorization)的半监督NMF算法，它将一些先验标签信息视为附加的硬约束，并将其集成到NMF模型中以提高区分能力。同时也有研究人员从特征选择与缩放方向入手，优化算法性能，如Li等人^[14]通过K邻近算法缩放有效特征，进而放大其他非核心特征的差距，使整体数据更易被定位捕获，Jimenez-Cordero等人^[15]通过同性高斯核结合特征关联方法实现特征的缩放处理，从而提出了一种高精度的支持向量机批量分类方法。

但是，这些NMF算法的变体仍然存在各种缺陷。例如，EMD NMF与SDNMF在分解过程中需要重复计算分解因子乘积与原始矩阵之间的距离，这使算法计算非常耗时，虽然SDNMF算法在计算过程中使用熵正则方法去估算整体距离而提高了计算速度，但是整体速度仍然十分缓慢；GNMF缺乏对原始矩阵特征向量之间关系的考虑，导致在处理平移噪声时性能较差；SNMF仅对分解过程施加稀疏约束，但缺乏对输入数据原始结构的约束，导致其子空间学习能力较弱；CNMF使用原始数据的标签信息，尽管提高了算法的性能，但在分解过程中未能充分利用原始数据的局部几何特征和潜在的结构信息，从而限制算法的应用范围及性能。

考虑到NMF中各种信息结构与原始特征向量之间相关性的重要性，本文提出一种基于Sinkhorn距离特征缩放的多约束非负矩阵分解算法(Semi-Supervised Sinkhorn distance sparse and dual-Graph regularized Non-negative Matrix Factorization, S3GNMF)，本算法充分利用了流形图结构、稀疏约束以及标签信息来诱导分解，同时基于Sinkhorn距离对原始特征矩阵进行缩放，提高了输入数据中的特征关联性，解决了将Sinkhorn距离引入损失函数而导致的计算效率缓慢问题，同时也提高了算法性能。在数学上，将算法公式化为定义明确的非负约束优化问题，利用KKT (Karush–Kuhn–Tucker)条件推导出交叉迭代规则。此外，通过多组算法在不同的真实数据集和平移噪声数据集上的聚类实验结果证明了所提算法的有效性。

2. 基于Sinkhorn距离特征缩放的多约束非负矩阵分解

作为一种优秀的NMF变种算法，SDNMF算法通过Sinkhorn距离构造损失函数及流形图结构来保持数据的几何特征结构，提高了算法的子空间学习能力，但其缺乏考虑稀疏性与先验标签的诱导分解，因此算法整体子空间学习能力不强，同时由于反复利用Sinkhorn距离计算分解误差值，导致算法速度十分缓慢。为了克服上述问题，本文提出基于Sinkhorn距离特征缩放的多约束非负矩阵分解(S3GNMF)算法。本算法不仅首次将Sinkhorn距离作为原始矩阵的特征缩放工具，提高了特征关联性，而且将标签信息纳入双流形图结构正则化，提高了算法的子空间学习能力，同时引入稀疏约束到NMF框架中，使分解因子稀疏化并提高了算法速度，也使算法更加稳定；最后，综合上述方法建立一个集成的S3GNMF算法的目标函数，算法流程示意图如图1所示。

图 1 S3GNMF算法示意图

下载: 全尺寸图片幻灯片

2.1 基于Sinkhorn距离的特征缩放

给定两个离散的直方图 ${{\boldsymbol{P}}_x}$ 与 ${{\boldsymbol{P}}_y}$ ，距离度量矩阵 ${\boldsymbol{M}}$ 以及单位距离运输量矩阵 ${\boldsymbol{T}}$ ，EMD距离^[16]定义了从 ${{\boldsymbol{P}}_x}$ 到 ${{\boldsymbol{P}}_y}$ 的最小运输量，该距离定义为

$\begin{split} & {d_{\boldsymbol{M}}}\left( {{{\boldsymbol{P}}_x},{{\boldsymbol{P}}_y}} \right) = \mathop {\min }\limits_{\pi \left( {x,y} \right)} \sum\limits_{x,y = 1}^m {{{\boldsymbol{M}}_{xy}}{{\boldsymbol{T}}_{xy}}}, \\ & {\rm{s.t.}}{\text{ }}\sum\limits_y {{{\boldsymbol{T}}_{xy}} = {{\boldsymbol{S}}_x}} ,\forall x{\text{ }}\sum\limits_x {{{\boldsymbol{M}}_{xy}} = {{\boldsymbol{E}}_y}} ,\forall y \end{split}$

(1)

${{\boldsymbol{T}}_{xy}}$ 表示由 $x$ 到 $y$ 的运输量， ${{\boldsymbol{M}}_{xy}}$ 则表示 $x$ 到 $y$ 的地面距离(通常以 ${L_1}$ 或 ${L_2}$ 距离来定义) ， ${{\boldsymbol{S}}_x}$ 代表在 $x$ 处需要运输的总量， ${{\boldsymbol{E}}_y}$ 是 $y$ 处的总运输成本。Cuturi^[17]提出了一种利用熵正则化来加速EMD距离的计算方法，该方法称为Sinkhorn距离，Frogner等人^[18]提出了一种将平滑传输扩展到非标准化措施的松弛方法，该方法对Sinkhorn距离中传输边缘的平等约束施加了KL散度的软惩罚，得到了一个无约束的近似运输模型，在理论上加速了Sinkhorn距离的计算。该距离方法可表示如式(2)所示

$\begin{split} {d}_{{\boldsymbol{M}}}^{\alpha,\epsilon }\left({{\boldsymbol{P}}}_{x},{{\boldsymbol{P}}}_{y}\right)=& \underset{\pi \left(x,y\right)}{\mathrm{min}}\Biggr\{{\displaystyle \sum _{x,y=1}^{m}{{\boldsymbol{M}}}_{xy}{{\boldsymbol{T}}}_{xy}}\text+\frac{1}{\alpha }H\left({\boldsymbol{T}}\right) \\ & + \varepsilon \left(\widetilde{{\rm{KL}}}\left({\boldsymbol{T}}_1\left|\right|{{\boldsymbol{P}}}_{x}\right) + \widetilde{{\rm{KL}}}\left({{\boldsymbol{T}}}^{{\rm{T}}}_1\left|\right|{{\boldsymbol{P}}}_{y}\right) \right) \Biggr\} \end{split}$

(2)

其中， $\widetilde {{\rm{KL}}}\left( {{\boldsymbol{T}}_1||{{\boldsymbol{P}}_x}} \right)$ 表示 ${\boldsymbol{T}}_1$ 与 ${{\boldsymbol{P}}_x}$ 之间的KL散度，当 $\varepsilon$ 足够大时，式(2)满足 $\displaystyle\sum\nolimits_t {{P_{xt}} = \sum\nolimits_t {{P_{yt}} = 1} }$ 。假设式(2)中 ${{\boldsymbol{P}}_x}$ 与 ${{\boldsymbol{P}}_y}$ 相等，可以通过 $\alpha$ 与 $\varepsilon$ 的大小来调整 ${{\boldsymbol{P}}_x}$ 矩阵的缩放。由于Sinkhorn距离能有效地表达在高维距离空间上的实际运输消耗，所以Sinkhorn距离缩放方法更能体现样本内特征的关联性。文献[18]实验数据证明 $\alpha$ 为10， $\varepsilon$ 为100时，缩放效率最高，Sinkhorn迭代次数为10，输入矩阵为 ${\boldsymbol{X}}$ ，则有

$\begin{split} {\boldsymbol{S}}=&{d}_{{\boldsymbol{M}}}^{10,100}\left({{\boldsymbol{X}}}_{i},{{\boldsymbol{X}}}_{j}\right)= \underset{\pi \left(i,j\right)}{\mathrm{min}}\Biggr\{{\displaystyle \sum _{i,j=1}^{m}{{\boldsymbol{M}}}_{ij}{{\boldsymbol{T}}}_{ij}}\text+\frac{1}{10}H\left({\boldsymbol{T}}\right)\\ & \text{+100}\left(\widetilde{{\rm{KL}}}\left({\boldsymbol{T}}_1\left|\right|{\boldsymbol{X}}\right)+\widetilde{{\rm{KL}}}\left({{\boldsymbol{T}}}^{{\rm{T}}}_1\left|\right|{\boldsymbol{X}}\right)\right)\Biggr\}\\[-21pt] \end{split}$

(3)

${\boldsymbol{S}}$ 矩阵可以有效地实现输入矩阵的特征缩放，从而达到数据预处理的目的。

2.2 融合标签信息的双图流形结构

为了充分地利用流形结构对分解过程的正则化约束，本文分别构建了两个图流形结构，在NMF分解过程中对分解因子 ${\boldsymbol{V}}$ 和 ${\boldsymbol{U}}$ 进行正则化处理。具体而言，首先构造一个真实的最近邻数据图 $G$ ，并连接 ${\boldsymbol{X}}{\text{ = }}[{x_1},{x_2},\cdots,{x_n}]$ 中的近邻点。为方便起见，采用0-1加权法构造数据图的权重矩阵，定义为

${\boldsymbol{W}}=\left\{\begin{array}{c}1,\;\;{x}_{i}与{x}_{j}有连接\\ 0,\;\;{x}_{i}与{x}_{j}无连接\end{array} \right.$

(4)

${\boldsymbol{V }}$ 的流形图结构的拉普拉斯矩阵被定义为： ${\boldsymbol{L}} = {\boldsymbol{D}} - {\boldsymbol{W}}$ ，其中 ${\boldsymbol{D}}$ 是一个对角矩阵，其对角元素 ${{\boldsymbol{D}}_{ii}}$ 为矩阵 ${\boldsymbol{W}}$ 的第 $i$ 行的元素和(或者为对应第 $i$ 列的元素和) 。 ${\boldsymbol{L}}$ 是描述空间结构特征的拉普拉斯矩阵。若有一组低维数据 ${\boldsymbol{V}}\text{=}[{{\boldsymbol{v}}}_{1}^{{\rm{T}}},{{\boldsymbol{v}}}_{2}^{{\rm{T}}},\cdots,{{\boldsymbol{v}}}_{n}^{{\rm{T}}}]\in {{\boldsymbol{R}}}^{n\times k}$ ，各点之间平滑度关系如式(5)所示

$\begin{split} R\left( {\boldsymbol{V}} \right) & = \frac{1}{2}\sum\limits_{i,j = 1}^n ||{{\boldsymbol{v}}_i} - {{\boldsymbol{v}}_j}|{|^2}{\boldsymbol{W}} \\ & = \left( {\sum\limits_{i = 1}^n {{{\boldsymbol{v}}_i}{\boldsymbol{v}}_i^{\rm{T}}{\boldsymbol{D}}_{ii}^{}} - \sum\limits_{i,j = 1}^n {{{\boldsymbol{v}}_i}{\boldsymbol{v}}_j^{\rm{T}}{\boldsymbol{W}}_{ij}^{}} } \right) \\ & {\text{ = }}{\rm{Tr}}\left( {{{\boldsymbol{V}}^{\rm{T}}}{\boldsymbol{DV}}} \right) - {\rm{Tr}}\left( {{{\boldsymbol{V}}^{\rm{T}}}{\boldsymbol{WV}}} \right) \\ & = {\rm{Tr}}\left( {{{\boldsymbol{V}}^{\rm{T}}}{\boldsymbol{LV}}} \right) \end{split}$

(5)

为提高数据图结构的正则化能力，将部分原始标签信息引入图结构中，有 ${\boldsymbol{V}} = {\boldsymbol{AZ}}$ ，其中 ${\boldsymbol{Z}}$ 为辅助矩阵， ${\boldsymbol{A}}$ 为标签约束矩阵，并带有原始标签约束信息。可将 $R\left( {\boldsymbol{V}} \right)$ 重写为

$R\left( {\boldsymbol{V}} \right){\text{ = }}{\rm{Tr}}\left( {{{\boldsymbol{V}}^{\rm{T}}}{\boldsymbol{LV}}} \right) = {\rm{Tr}}\left( {{{\boldsymbol{Z}}^{\rm{T}}}{{\boldsymbol{A}}^{\rm{T}}}{\boldsymbol{LAZ}}} \right)$

(6)

相同地，也以同样的方式构造了一个最近邻 ${\boldsymbol{U}}$ 的流形图结构，其各点平滑度关系为

$\begin{split} R\left( {\boldsymbol{U}} \right)& {\text{ = }}{\rm{Tr}}\left( {{{\boldsymbol{U}}^{\rm{T}}}{{\boldsymbol{D}}_{\boldsymbol{U}}}{\boldsymbol{U}}} \right) - {\rm{Tr}}\left( {{{\boldsymbol{U}}^{\rm{T}}}{{\boldsymbol{W}}_{\boldsymbol{U}}}{\boldsymbol{U}}} \right) \\ & = {\rm{Tr}}\left( {{{\boldsymbol{U}}^{\rm{T}}}{{\boldsymbol{L}}_{\boldsymbol{U}}}{\boldsymbol{U}}} \right) \end{split}$

(7)

该流形图拉普拉斯矩阵为 ${{\boldsymbol{L}}_{\boldsymbol{U}}} = {{\boldsymbol{D}}_{\boldsymbol{U}}} - {{\boldsymbol{W}}_{\boldsymbol{U}}}$ 。

2.3 L_2,1/2范数稀疏约束

基于稀疏约束的方法可以发掘特征空间的潜在关联，很多研究表明稀疏约束可以选择鉴别性稀疏特征来提高算法的效率和有效性，稀疏约束旨在使用适当的稀疏模型来实现稀疏数据表示。该方法通常使用 ${{{L}}_{p,q}}$ 的范数形式对分解过程进行约束，是一种常见的提高矩阵分解性能的方法。例如，SNMF^[12]在分解过程中对分解因子施加 ${{{L}}_2}$ 范数稀疏约束使因子更加稀疏，SGCNMF^[5]在全局分解误差上添加 ${{{L}}_{2,1}}$ 范数稀疏约束使分解误差更加平滑，RGNMF^[19]在输入数据的噪声中添加 ${{{L}}_1}$ 范数约束，以提高对噪声特征的屏蔽能力，但是近年来Xu等人^[20]发现 ${{{L}}_p}$ 为标准范数，且 $q$ 为 $1/2$ 时，即 ${{{L}}_{p,1/2}}$ 类的范数约束具有较好的稀疏性约束。因此，S3GNMF算法的基矩阵 ${\boldsymbol{U}}$ 上的 ${{{L}}_{2,1/2}}$ 范数稀疏约束为

$||{\boldsymbol{U}}|{|_{2,1/2}} = {\left( {\sum\limits_{i = 1}^m {||{U_i}||_2^{1/2}} } \right)^2}$

(8)

将 $||{\boldsymbol{U}}|{|_{2,1/2}}$ 作为正则化项加入目标函数，在优化目标函数时，使用最小化 ${L_{2,1/2}}$ 范数能保证矩阵行列均稀疏，可以提高矩阵整体的稀疏性，使算法局部特征特异性降低，既可以降低噪声对算法的影响，又可以提高算法的泛化能力与计算速度。

2.4 S3GNMF目标函数

通过将特征缩放、 $R\left( {\boldsymbol{V}} \right)$ , $R\left( {\boldsymbol{U}} \right)$ 、稀疏性约束和NMF集成到目标函数中，从而可以得到S3GNMF算法的目标函数为

$\begin{split} &\mathop {\min }\limits_{{\boldsymbol{U}},{\boldsymbol{Z}}} {{\boldsymbol{O}}_{{\rm{S3GNMF}}}} = ||{\boldsymbol{S}} - {{\boldsymbol{UZ}}^{\rm{T}}}{{\boldsymbol{A}}^{\rm{T}}}||_{\rm{F}}^2 + \lambda {\rm{Tr}} \left( {{{\boldsymbol{Z}}^{\rm{T}}}{{\boldsymbol{A}}^{\rm{T}}} {{\boldsymbol{L}}_{\boldsymbol{Z}}}{\boldsymbol{AZ}}} \right) \\ & \qquad\qquad\qquad\quad + \beta {\rm{Tr}}\left( {{{\boldsymbol{U}}^{\rm{T}}}{{\boldsymbol{L}}_{\boldsymbol{U}}}{\boldsymbol{U}}} \right) + \theta ||{\boldsymbol{U}}||_{2,1/2}^{1/2},\\ & \qquad {\rm{s.t.}}{\text{ }}{\boldsymbol{U}} \ge 0,{\boldsymbol{Z}} \ge 0\\[-10pt] \end{split}$

(9)

其中， $\lambda$ , $\beta$ 为流形图正则化系数， $\theta$ 为稀疏系数， ${\boldsymbol{S}}$ 为输入原始矩阵的Sinkhorn距离特征缩放结果。

3. S3GNMF算法求解

由于S3GNMF算法的非凸性，很难获得全局最优解，所以我们采用梯度下降法来优化目标函数。将算法的目标函数展开重写为

$\begin{split} {{\boldsymbol{O}}_{{\rm{S3GNMF}}}} =& {\rm{Tr}}\left( {\left( {{\boldsymbol{S}} - {{\boldsymbol{UZ}}^{\rm{T}}}{{\boldsymbol{A}}^{\rm{T}}}} \right){{\left( {{\boldsymbol{S}} - {{\boldsymbol{UZ}}^{\rm{T}}}{{\boldsymbol{A}}^{\rm{T}}}} \right)}^{\rm{T}}}} \right) \\ &+ \lambda {\rm{Tr}}\left( {{{\boldsymbol{Z}}^{\rm{T}}}{{\boldsymbol{A}}^{\rm{T}}}{{\boldsymbol{L}}_{\boldsymbol{Z}}}{\boldsymbol{AZ}}} \right) \\ &+ \beta {\rm{Tr}}\left( {{{\boldsymbol{U}}^{\rm{T}}}{{\boldsymbol{L}}_{\boldsymbol{U}}}{\boldsymbol{U}}} \right) + \theta ||{\boldsymbol{U}}||_{2,1/2}^{1/2} \\ =& {\rm{Tr}}\left( {{{\boldsymbol{S}}^{\rm{T}}}{\boldsymbol{S}}} \right) - 2{\rm{Tr}}\left( {{{\boldsymbol{SAZU}}^{\rm{T}}}} \right) \\ &+ {\rm{Tr}}\left( {{{\boldsymbol{UZ}}^{\rm{T}}}{{\boldsymbol{A}}^{\rm{T}}}{{\boldsymbol{AZU}}^{\rm{T}}}} \right) \\ &+ \lambda {\rm{Tr}}\left( {{{\boldsymbol{Z}}^{\rm{T}}}{{\boldsymbol{A}}^{\rm{T}}}{{\boldsymbol{L}}_{\boldsymbol{Z}}}{\boldsymbol{AZ}}} \right) \\ &+ \beta {\rm{Tr}}\left( {{{\boldsymbol{U}}^{\rm{T}}}{{\boldsymbol{L}}_{\boldsymbol{U}}}{\boldsymbol{U}}} \right) + \theta ||{\boldsymbol{U}}||_{2,1/2}^{1/2}\\[-10pt] \end{split}$

(10)

令 $\delta$ 与 $\varphi$ 分别为 ${\boldsymbol{U}} \ge 0$ , ${\boldsymbol{Z}} \ge 0$ 的非负约束下的拉格朗日乘子，可以得到目标函数的拉格朗日函数 ${{\boldsymbol{L}}_{{\rm{S3GNMF}}}}$ ，其定义为

${{\boldsymbol{L}}_{{\rm{S3GNMF}}}}{\text{ = }}{{\boldsymbol{O}}_{{\rm{S3GNMF}}}} + {\rm{Tr}}\left( {\delta {{\boldsymbol{U}}^{\rm{T}}}} \right) + {\rm{Tr}}\left( {\varphi {{\boldsymbol{Z}}^{\rm{T}}}} \right)$

(11)

${{\boldsymbol{L}}_{{\rm{S3GNMF}}}}$ 分别对 ${\boldsymbol{U}}$ , ${\boldsymbol{Z}}$ 求偏导并令其偏导数为0，有

$\frac{{\partial {\boldsymbol{L}}}}{{\partial {\boldsymbol{U}}}} = - 2{\boldsymbol{SAZ}} + 2{{\boldsymbol{UZ}}^{\rm{T}}}{{\boldsymbol{A}}^{\rm{T}}}{\boldsymbol{AZ}} + 2\beta {{\boldsymbol{L}}_{\boldsymbol{U}}}{\boldsymbol{U}} + 2\theta {\boldsymbol{U}} + \delta$

(12)

$\frac{{\partial {\boldsymbol{L}}}}{{\partial {\boldsymbol{Z}}}} = - 2{{\boldsymbol{A}}^{\rm{T}}}{{\boldsymbol{S}}^{\rm{T}}}{\boldsymbol{U}} + 2{{\boldsymbol{A}}^{\rm{T}}}{{\boldsymbol{AZU}}^{\rm{T}}}{\boldsymbol{U}} + 2\lambda {{\boldsymbol{A}}^{\rm{T}}}{{\boldsymbol{L}}_{\boldsymbol{Z}}}{\boldsymbol{AZ}} + \varphi$

(13)

对式(12)和式(13)应用KKT条件，即 ${\delta _{ij}}{{\boldsymbol{u}}_{ij}} = 0$ 和 ${\varphi _{ij}}{{\boldsymbol{z}}_{ij}} = 0$ ，代入其中，可得

${\left( { - 2{\boldsymbol{SAZ}} + 2{{\boldsymbol{UZ}}^{\rm{T}}}{{\boldsymbol{A}}^{\rm{T}}}{\boldsymbol{AZ}} + 2\beta {{\boldsymbol{L}}_{\boldsymbol{U}}}{\boldsymbol{U}} + 2\theta {\boldsymbol{U}}} \right)_{ij}}{{\boldsymbol{u}}_{ij}} = 0$

(14)

${\left( { - 2{{\boldsymbol{A}}^{\rm{T}}}{{\boldsymbol{S}}^{\rm{T}}}{\boldsymbol{U}} + 2{{\boldsymbol{A}}^{\rm{T}}}{{\boldsymbol{AZU}}^{\rm{T}}}{\boldsymbol{U}} + 2\lambda {{\boldsymbol{A}}^{\rm{T}}}{{\boldsymbol{L}}_{\boldsymbol{Z}}}{\boldsymbol{AZ}}} \right)_{ij}}{{\boldsymbol{z}}_{ij}} = 0$

(15)

将数据流形图拉普拉斯矩阵 ${{\boldsymbol{L}}_{\boldsymbol{U}}} = {{\boldsymbol{D}}_{\boldsymbol{U}}} - {{\boldsymbol{W}}_{\boldsymbol{U}}}$ 和特征流形图拉普拉斯矩阵 ${{\boldsymbol{L}}_{\boldsymbol{Z}}} = {{\boldsymbol{D}}_{\boldsymbol{Z}}} - {{\boldsymbol{W}}_{\boldsymbol Z}}$ 代入式(14)和式(15)，可得乘法更新规则，如式(16)和式(17)所示

${{\boldsymbol{u}}_{ij}} \leftarrow {{\boldsymbol{u}}_{ij}}\frac{{{{\left( {{\boldsymbol{SAZ}} + \beta {{\boldsymbol{W}}_{\boldsymbol{U}}}{\boldsymbol{U}}} \right)}_{ij}}}}{{{{\left( {{{\boldsymbol{UZ}}^{\rm{T}}}{{\boldsymbol{A}}^{\rm{T}}}{\boldsymbol{AZ}} + \beta {{\boldsymbol{D}}_{\boldsymbol{U}}}{\boldsymbol{U}} + \theta {\boldsymbol{U}}} \right)}_{ij}}}}$

(16)

${{\boldsymbol{z}}_{ij}} \leftarrow {{\boldsymbol{z}}_{ij}}\frac{{{{\left( {{{\boldsymbol{A}}^{\text{T}}}{{\boldsymbol{S}}^{\text{T}}}{\boldsymbol{U}} + \lambda {{\boldsymbol{A}}^{\text{T}}}{{\boldsymbol{W}}_{\boldsymbol{Z}}}{\boldsymbol{AZ}}} \right)}_{ij}}}}{{{{\left( {{{\boldsymbol{A}}^{\text{T}}}{{\boldsymbol{AZU}}^{\text{T}}}{\boldsymbol{U}} + \lambda {{\boldsymbol{A}}^{\text{T}}}{{\boldsymbol{D}}_{\boldsymbol{Z}}}{\boldsymbol{AZ}}} \right)}_{ij}}}}\;\;$

(17)

推导出 ${\boldsymbol{U}}$ , ${\boldsymbol{Z}}$ 的乘法更新规则后，S3GNMF算法可以总结如表1所示。

表 1 基于Sinkhorn距离特征缩放的多约束非负矩阵分解算法S3GNMF (算法1)

输入：原始矩阵 ${\boldsymbol{X}}$ ，聚类数 $k$ ，流形正则化系数 $\lambda$ 和 $\beta$ ，稀疏约束　　　　系数 $\theta$ 和最大迭代次数 $M$
(1)对原始矩阵 ${\boldsymbol{X}}$ 进行特征缩放得到矩阵 ${\boldsymbol{S}}$ ；
(2)随机初始化基矩阵 ${\boldsymbol{U}}$ 和辅助矩阵 ${\boldsymbol{Z}}$ ；　(3)更新 ${\boldsymbol{U}}$ ${ {\boldsymbol{u} }_{ij} } \leftarrow { {\boldsymbol{u} }_{ij} }\dfrac{ { { {\left( { {\boldsymbol{SAZ} } + \beta { {\boldsymbol{W} }_{\boldsymbol{U} } }{\boldsymbol{U} } } \right)}_{ij} } } }{ { { {\left( { { {\boldsymbol{UZ} }^{\rm{T} } }{ {\boldsymbol{A} }^{\rm{T} } }{\boldsymbol{AZ} } + \beta { {\boldsymbol{D} }_{\boldsymbol{U} } }{\boldsymbol{U} } + \theta {\boldsymbol{U} } } \right)}_{ij} } } }$ ；
(4)更新 ${\boldsymbol{Z}}$ ${ {\boldsymbol{z} }_{ij} } \leftarrow { {\boldsymbol{z} }_{ij} }\dfrac{ { { {\left( { { {\boldsymbol{A} }^{\text{T} } }{ {\boldsymbol{S} }^{\text{T} } }{\boldsymbol{U} } + \lambda { {\boldsymbol{A} }^{\text{T} } }{ {\boldsymbol{W} }_{\boldsymbol{Z} } }{\boldsymbol{AZ} } } \right)}_{ij} } } }{ { { {\left( { { {\boldsymbol{A} }^{\text{T} } }{ {\boldsymbol{AZU} }^{\text{T} } }{\boldsymbol{U} } + \lambda { {\boldsymbol{A} }^{\text{T} } }{ {\boldsymbol{D} }_{\boldsymbol{Z} } }{\boldsymbol{AZ} } } \right)}_{ij} } } }$ ；
(5)执行算法步骤(3)和步骤(4) 至最大迭代次数或收敛；
输出：矩阵 ${\boldsymbol{U}}$ 和 ${\boldsymbol{Z}}$

下载: 导出CSV

| 显示表格

4. 实验结果与分析

标准的图像数据集中图像数据大多是对齐且居中的，而在现实世界中，真实图像可能十分复杂而且主体难以居中，导致无法完美地对齐；在校准主体后仍可能存在局部变形。这些问题均会导致针对标准数据集设计的算法性能受到极大的影响。所以我们尝试在多类标准数据集与非对齐的平移噪声数据上进行算法子空间聚类实验。在第1个实验中，本文使用多种算法对5个标准数据集分别进行了聚类实验，并表明了本文所提算法对标准对齐数据有着更强的子空间学习能力，在第2个实验中，本文使用小范围随机平移的COIL20数据集来模拟非对齐数据，并证明了本方法比以往方法具有更强的鲁棒性。为了公平地比较验证各算法在多方面的有效性，本文将所提算法与其他各NMF算法结果进行比较，所有的实验均基于MATLABR2018b模拟，CPU为Intel Core I7-9700 K。

4.1 数据集

本文基于COIL20与Faces95数据集设计了2个平移噪声数据集，分别在2个平移噪声数据集与5个标准数据集(COIL20, PIE, Faces95, Pixraw10P, JAFFE)上进行了聚类实验，数据集详细说明如表2所示。

表 2 各数据集的详细说明

数据集名称	维度大小	类别数	总样本数	数据集类型
COIL20	1024	20	1440	物品
PIE	1024	68	2586	人脸
Faces95	4096	20	400	人脸
Pixraw10P	10000	10	100	人脸
JAFFE	676	10	213	人脸
COIL20-noise	1024	20	1440	人脸+平移噪声
Faces95-noise	4096	20	400	人脸+平移噪声

下载: 导出CSV

| 显示表格

需要注意的是，所有的标准数据集全是对齐数据，为了考验所提算法针对非对齐数据的学习能力，本文使用小的随机平移来模拟局部变形并在新的数据集上测试了本文方法，以显示其鲁棒性。具体来说，本文的数据集是由以下方法生成的：将数据集中每张图片调整为 $\left( {32 - \omega } \right) \times \left( {32 - \omega } \right)$ 大小，其中 $\omega \in \left[ {1,4} \right]$ 的整数，然后将调整的图像以随机位置放入32×32的空白图像中，图2—图6展示了上述数据集原始数据以及原始数据与平移噪声数据对比。

图 2 PIE数据集

下载: 全尺寸图片幻灯片

图 3 Pixraw10P数据集

下载: 全尺寸图片幻灯片

图 4 JAFFE数据集

下载: 全尺寸图片幻灯片

图 5 COIL20数据集与平移噪声数据集对比

下载: 全尺寸图片幻灯片

图 6 Faces95数据集与平移噪声数据集对比

下载: 全尺寸图片幻灯片

4.2 参数分析

如上所述，将Sinkhorn距离特征缩放过程中的两个参数 $\alpha$ 和 $\varepsilon$ 设为固定值( $\alpha {\text{ = }}10$ , $\varepsilon {\text{ = }}100$ )，所以本节主要讨论 $\lambda ,\beta ,\theta$ 3个约束参数。在参数对比实验中，本文在COIL20, PIE, Faces95, Pixraw10P和JAFFE 5个标准数据集，以最大类别数做聚类对比，可以得出最佳的参数组合。例如：COIL20数据集以20作为 $k$ 值，然后分别使 $\lambda ,\beta ,\theta$ 以[0.001, 0.01, 0.1, 0, 1, 10, 100, 1000]，进行20次综合实验，取最终聚类结果的平均值做对比，S3GNMF参数对比实验如图7所示。

图 7 S3GNMF在5个标准数据集上的参数表现

下载: 全尺寸图片幻灯片

图7中每个点的位置代表了 $\lambda ,\,\beta ,\,\theta$ 3个参数的具体值，颜色代表了实际的聚类精度，颜色越黄，表示实际聚类精度越高，颜色越蓝表示聚类精度越低。

由图7得知， $\lambda$ 和 $\beta$ 作为流形正则化参数， $\beta$ 的取值在10以上时能取得较好效果， $\lambda$ 更多的是作为特征空间的约束，做整体子空间表达的一个微调，参数取值不宜过大，当 $\lambda$ 取值到1000时，对整体算法效果有负反馈。稀疏系数 $\theta$ 在上述实验过程中，更多起到的是对分解因子的稀疏约束与平滑噪声中野值点作用，对准确度提升不大，但是对算法性能稳定性有显著提升。

4.3 聚类结果与分析

本实验中，以本文所提算法S3GNMF与多个先进NMF算法(NMF^[21], CNMF^[13], GNMF^[10], SNMF^[12], SDNMF^[11], DSDNMF^[22], SODNMF^[23], AGNMF^[24], ONMF^[25], DENMF^[26])对上述5个数据集进行子空间学习聚类对比，聚类评价指标为准确度(ACcuracy, AC)与归一化互信息(Normalized Mutual Information, NMI)，对应指标越高则表明子空间特征学习能力越强。由于S3GNMF, CNMF, SODNMF, DENMF算法需要部分标签信息，上述半监督NMF方法均抽取了实验数据集的前20%的数据标签作为标记样本。所有的算法最大迭代次数为100，对比算法参数均为参考文献中的最佳参数(例如SODNMF取 $\alpha = 100,\,\beta = 0.01,\,\theta = 0.1$ )，S3GNMF的参数设置为4.2节中实验对比得出的最佳参数组合，实验流程如下：

(1) 以原始数据集作为输入数据，实验中设置 $k$ 值为数据集的最大类别数，并作为 $k - {\rm{means}}$ 的聚类数；

(2) 以学习到的低维子空间特征表示作为输入，进行 $k - {\rm{means}}$ 聚类，对聚类结果进行AC和NMI评估；

(3) 重复执行步骤(1)和步骤(2) 20次，取其平均值与标准差作为最终实验结果。

表3显示了不同算法在5个数据集上的详细聚类结果(每个聚类实验中有两行数据展示，第1行数值代表聚类准确度，第2行数据代表归一化互信息)。

表 3 各算法在标准数据集上的对比(%)

数据集	NMF	CNMF	GNMF	SNMF	SDNMF	DSDNMF	SODNMF	AGNMF	ONMF	DENMF	S3GNMF
COIL20	64.2±2.4	69.6±1.6	68.1±1.5	66.9±1.2	71.2±1.0	72.1±1.3	78.9±0.8	73.1±1.1	66.0±1.5	74.7±1.7	84.1±0.9
COIL20	77.0±1.4	79.8±1.3	80.8±1.0	71.8±2.0	78.6±1.4	79.7±0.8	86.1±1.5	81.0±0.6	70.9±2.2	82.6±1.7	91.6±1.3
PIE	71.3±0.7	68.8±0.8	72.4±0.9	71.9±0.8	74.6±0.8	75.2±0.6	79.3±1.8	75.8±1.1	74.1±1.5	77.2±1.4	81.5±0.8
PIE	67.9±0.7	70.7±0.8	80.5±0.9	72.8±0.8	82.1±0.5	81.2±0.7	85.3±0.5	82.4±0.6	76.0±2.0	84.1±1.8	91.8±0.8
Faces95	43.7±1.2	48.6±1.7	50.2±2.3	49.5±1.8	51.2±2.0	50.6±1.8	53.9±1.5	52.2±1.1	49.2±1.1	53.6±0.9	55.1±1.7
Faces95	50.8±0.6	57.0±1.3	57.7±1.5	55.0±1.3	60.7±1.2	58.1±1.1	60.7±0.8	60.3±1.0	55.3±1.0	60.1±1.6	62.3±1.1
Pixraw10P	68.7±1.8	80.4±1.7	87.4±2.3	71.4±1.1	83.7±2.4	84.0±2.0	89.0±3.6	84.4±2.0	76.3±2.4	84.3±2.9	90.8±3.8
Pixraw10P	73.8±1.5	83.8±1.2	88.0±1.4	73.7±1.6	84.0±1.6	84.7±1.8	89.7±2.9	86.0±1.8	78.7±1.6	86.0±2.7	93.8±0.7
JAFFE	66.2±1.8	81.1±2.7	82.8±1.2	76.2±0.8	80.1±1.0	80.4±0.8	90.8±1.9	81.4±1.5	77.5±1.2	90.1±0.5	98.1±0.2
JAFFE	68.9±1.5	82.8±1.9	84.0±1.4	78.0±0.6	81.7±1.3	82.0±0.8	92.1±1.4	83.7±1.3	80.0±1.1	88.7±0.6	97.4±0.4

下载: 导出CSV

| 显示表格

各算法在两个平移噪声数据集上的聚类实验结果如表4和表5所示，其中 $\omega$ 表示空间平移尺度， $\omega$ 越大，平移越剧烈。

表 4 各算法在平移噪声COIL20数据集上的对比(%)

$\omega$	NMF	CNMF	GNMF	SNMF	SDNMF	DSDNMF	SODNMF	AGNMF	ONMF	DENMF	S3GNMF
1	63.2±2.2	67.6±1.2	69.0±1.5	67.4±1.5	72.3±1.5	74.1±1.8	75.1±1.2	71.7±1.4	65.7±2.2	72.7±2.7	87.2±2.1
1	75.0±1.4	77.2±1.3	80.5±1.1	70.5±1.3	79.3±1.1	79.9±0.9	84.0±1.1	78.8±0.7	68.1±1.4	74.7±1.9	94.6±0.5
2	52.1±2.3	55.2±1.5	57.7±1.3	56.8±1.6	68.6±1.8	70.1±2.2	63.4±1.6	62.7±1.6	54.0±2.7	61.8±2.6	73.2±2.5
2	66.7±1.6	69.1±1.5	75.7±1.2	73.9±1.4	80.0±1.5	82.6±1.5	76.1±1.2	75.5±0.8	71.7±1.4	74.5±1.3	85.5±0.9
3	49.8±1.8	50.0±1.3	58.2±1.1	55.6±1.8	60.4±1.9	58.8±2.2	57.2±1.7	56.6±2.0	54.9±2.0	55.0±2.3	63.8±1.9
3	58.8±0.9	61.9±1.6	69.8±1.1	60.7±1.6	73.4±0.9	73.1±1.3	70.9±0.9	68.4±1.1	60.4±1.4	70.1±2.1	80.8±0.6
4	43.5±1.9	46.7±2.4	48.9±1.6	47.3±2.0	52.5±2.3	53.3±2.5	51.8±1.7	50.9±2.3	47.1±2.1	51.9±1.9	57.6±2.2
4	55.2±1.1	58.0±1.6	62.2±1.2	60.8±1.2	70.9±0.6	71.3±1.1	65.9±0.8	63.0±1.4	60.4±1.5	64.7±1.7	74.7±0.8

下载: 导出CSV

| 显示表格

表 5 各算法在平移噪声Faces95数据集上的对比(%)

$\omega$	NMF	CNMF	GNMF	SNMF	SDNMF	DSDNMF	SODNMF	AGNMF	ONMF	DENMF	S3GNMF
1	45.1±0.7	46.2±2.2	49.6±1.8	48.2±1.2	54.1±2.1	53.8±2.5	49.3±1.4	48.2±1.3	47.1±1.8	48.8±1.7	53.4±1.3
1	53.7±0.6	58.6±1.8	60.3±1.5	55.9±0.9	65.8±1.7	62.7±1.2	55.2±1.7	58.4±1.8	53.4±1.6	58.0±1.4	63.9±0.8
2	44.1±1.0	43.1±1.7	45.6±1.3	43.5±1.2	48.9±2.0	49.2±2.1	46.9±1.3	46.2±1.1	42.9±1.9	47.2±1.3	53.2±0.6
2	51.8±0.7	50.2±0.8	53.1±1.1	49.9±0.6	58.1±1.7	59.3±1.5	50.2±0.7	49.7±1.2	49.1±1.2	50.6±1.7	62.5±0.7
3	38.5±1.1	37.9±1.3	41.8±1.5	38.5±1.1	45.8±1.7	47.3±1.9	43.2±1.7	42.9±2.2	38.9±2.2	44.2±1.5	49.8±1.5
3	45.1±0.8	43.7±0.7	44.7±1.1	45.9±0.6	53.1±1.3	55.7±1.3	46.8±0.9	46.4±1.8	45.4±1.8	49.4±2.0	59.9±1.0
4	34.1±1.2	33.7±1.5	38.3±1.7	34.2±1.2	38.9±1.6	39.4±1.7	39.9±1.7	38.5±1.8	34.5±1.8	40.1±1.6	43.5±1.3
4	40.4±1.1	40.0±0.9	45.9±0.8	39.7±0.5	47.5±1.1	48.0±0.9	47.1±0.9	46.2±0.9	39.2±1.3	47.3±1.9	53.4±0.7

下载: 导出CSV

| 显示表格

为验证本文所提Sinkhorn距离特征缩放的作用，在S3GNMF基础上移除特征缩放处理后，得到新的算法为(Semi-Supervised sparse and dual-Graph regularized Non-negative Matrix Factorization, S2GNMF)，S2GNMF与S3GNMF在上述多个数据集的详细聚类结果如表6所示。

表 6 S2GNMF与S3GNMF的聚类效果对比(%)

数据集	PIE	Pixraw10P	JAFFE	COIL20	COIL20 ( $\omega$ =2)	COIL20 ( $\omega$ =4)	Faces95	Faces95 ( $\omega$ =2)	Faces95 ( $\omega$ =4)
S2GNMF	77.6±1.1	83.7±3.7	90.7±0.7	81.5±1.4	69.0±2.9	55.3±2.0	51.0±2.2	48.7±1.1	38.3±0.9
S2GNMF	90.2±0.3	85.4±1.2	92.9±0.8	89.9±0.4	85.1±0.6	72.1±1.1	61.8±1.0	58.6±0.6	48.2±0.6
S3GNMF	81.5±0.8	90.8±3.8	98.1±0.2	84.1±0.9	73.2±2.5	57.6±2.2	55.1±1.7	53.2±0.6	43.5±1.3
S3GNMF	91.8±0.8	93.8±0.7	97.4±0.4	91.6±1.3	85.5±0.9	74.7±0.8	62.3±1.1	62.5±0.7	53.4±0.7

下载: 导出CSV

| 显示表格

上述实验数据表明：

(1) 基于流形正则化的算法GNMF, SDNMF, DSDNMF, SODNMF, AGNMF, DENMF, S3GNMF在实验中表现要明显优于其他非流行正则化算法，证明了子空间学习中流形正则化在隐式结构的重要性。

(2) 基于稀疏约束的各类算法在实验中，准确度和归一化互信息的标准差均低于其他非稀疏约束算法，证明了稀疏约束能增加局部学习能力与鲁棒性。

(3) 对于半监督学习算法CNMF, DENMF, SODNMF, S3GNMF，多混合约束算法明显优于单一约束算法，即部分标签信息能提高算法的学习能力，但是仍然需要有其他的子空间学习增强方法来针对有效数据进行学习。

(4) 随着平移噪声强度的增加，S3GNMF算法的性能明显优于其他算法，证明了本文所提的Sinkhorn距离特征缩放与多约束的有效性，其中Sinkhorn距离特征缩放简化了特征矩阵的距离度量，平滑了特征矩阵中野值点对分解结果的影响，而结合多流形隐式结构的正则化使整体算法泛化能力得到了提高，结合 ${L_{2,1/2}}$ 的稀疏约束，使实验数据十分稳定，而且基矩阵表达的局部特征更为稀疏，更有利于子空间的学习表达。

(5) 由表6中S3GNMF和S2GNMF的对比结果可知，Sinkhorn距离对不同维度之间的关系更加敏感，能更好地捕获类间关联，所以S3GNMF中基于Sinkhorn距离特征缩放处理能有效地提高各特征类别之间的关联，从而提高NMF算法的子空间学习能力。

4.4 算法复杂度与速度对比

本节首先分析了S3GNMF算法的复杂度，并讨论了几种对比算法的复杂度，最后设计了一组实验来计算各算法实际运算时间。

假设输入矩阵大小为 $m \times n$ ，算法最终迭代次数为 $t$ ， $k$ 为分解后的维度。根据本文所提算法步骤，首先输入数据经过Sinkhorn距离特征缩放得到处理后的数据，该步骤算法复杂度为 $O\left( {{n^2}} \right)$ ，算法1中构造双图流形结构复杂度为 $O\left( {m{n^2} + {m^2}n} \right)$ ，非负矩阵分解阶段复杂度为 $O\left( {tmnk} \right)$ ，所以本文所提算法复杂度为 $O\left( {{n^2} + tmnk + m{n^2} + {m^2}n} \right)$ 。根据参考文献[ 11-13, 21-26]对各对比算法的复杂度描述，NMF, CNMF, SNMF, ONMF算法复杂度均为 $O\left( {tmnk} \right)$ ，GNMF算法复杂度为 $O\left( {tmnk + m{n^2}} \right)$ ，SDNMF算法复杂度为 $O\left( {{t^2}{n^2} + tmnk + m{n^2}} \right)$ ，DSDNMF算法复杂度则为 $O\left( {{t^2}{n^2} + tmnk + m{n^2} + {m^2}n} \right)$ , SODNMF, AGNMF, DENMF算法复杂度均为 $O\left( {tmnk + m{n^2} + {m^2}n} \right)$ 。可以看到单约束NMF算法在复杂度上具有明显优势，但是缺乏适当的约束导致算法性能不高，S3GNMF与其他多约束NMF算法在复杂度方面比较类似，其避开了SDNMF与DSDNMF中复杂的 $O\left( {{t^2}{n^2}} \right)$ 计算，所以相较于这两种算法有着更小的算法复杂度。

接下来本文对比了各算法在COIL20, PIE, Faces95, Pixraw10P和JAFFE 5个数据集上的运算速度，来验证算法的实际计算速度。实验中各算法单独运行20次，且设定最大迭代次数为100， $k$ 为数据集最大样本种类数，将最终耗时平均值作为对比数值，详细对比数据如表7所示。

表 7 各算法在不同数据集的运算速度对比(s)

数据集	NMF	CNMF	GNMF	SNMF	SDNMF	DSDNMF	SODNMF	AGNMF	ONMF	DENMF	S3GNMF
COIL20	0.16	1.17	0.24	0.14	161.52	165.94	0.54	26.74	0.21	2.82	1.25
PIE	0.54	2.33	0.69	0.46	328.17	340.75	1.38	40.88	0.69	7.01	2.61
Faces95	0.08	0.65	0.13	0.07	108.41	132.67	0.38	20.62	0.23	3.53	0.43
Pixraw10P	0.14	1.02	0.19	0.14	138.45	155.90	0.41	37.61	0.12	1.67	0.29
JAFFE	0.04	0.41	0.08	0.03	82.07	94.74	0.20	17.84	0.07	1.42	0.17

下载: 导出CSV

| 显示表格

由表7可知，SNMF算法分解效率最高，因为适当的稀疏约束有利于算法速度的提高；而以Sinkhorn距离作为损失函数度量方法的SDNMF与DSDNMF计算十分缓慢，这两种方法对平移噪声有一定的鲁棒性提升，结合流形图结构正则化也提高了算法性能，但是计算效率十分低下，其根本原因是Sinkhorn距离计算消耗极大，算法每次迭代均以分解因子的乘积与原始矩阵做距离对比，导致算法计算效率极低。基于欧氏距离的损失函数方法则明显速度更优，AGNMF算法虽然也有着不错的子空间学习能力，但是与SDNMF，DSDNMF算法类似，均在每次迭代中需要进行重复的耗时计算，导致整体运行速度不高，本文所提S3GNMF算法将Sinkhorn距离提取至迭代过程之外，直接对原始矩阵做缩放处理，避免了对Sinkhorn距离的反复计算，结合多流形正则与稀疏约束等，提高了算法性能的同时也提高了算法速度。

5. 结论

本文基于Sinkhorn距离特征缩放结合多流形学习和半监督稀疏非负矩阵分解，提出一种多约束非负矩阵分解算法S3GNMF。首先利用Sinkhorn距离对输入矩阵进行特征缩放，在充分利用缩放矩阵的流形图结构正则化与部分标签信息约束的同时，向基矩阵添加了高效的 ${L_{2,1/2}}$ 范数稀疏约束，并通过KKT条件推导出算法的乘法交叉更新规则。实验结果表明，S3GNMF算法不论是在标准数据集或是平移噪声数据集上，都取得了十分优秀的子空间学习结果，具有良好的鲁棒性，相比于SDNMF与DSDNMF算法，其在大幅度提高算法速度的同时，也提升了算法的性能。但本算法在运算速度上仍有优化空间，相较于其他单约束NMF算法，不仅运算复杂度更高且运算速度更慢，所以未来将着重研究具有高性能的NMF算法，并将所提算法结合应用在不同的领域^[27,28]，如信息推荐、图像标记、网络安全等。

图 1 S3GNMF算法示意图

下载: 全尺寸图片幻灯片

图 2 PIE数据集

下载: 全尺寸图片幻灯片

图 3 Pixraw10P数据集

下载: 全尺寸图片幻灯片

图 4 JAFFE数据集

下载: 全尺寸图片幻灯片

图 5 COIL20数据集与平移噪声数据集对比

下载: 全尺寸图片幻灯片

图 6 Faces95数据集与平移噪声数据集对比

下载: 全尺寸图片幻灯片

图 7 S3GNMF在5个标准数据集上的参数表现

下载: 全尺寸图片幻灯片

表 1 基于Sinkhorn距离特征缩放的多约束非负矩阵分解算法S3GNMF (算法1)

输入：原始矩阵 ${\boldsymbol{X}}$ ，聚类数 $k$ ，流形正则化系数 $\lambda$ 和 $\beta$ ，稀疏约束　　　　系数 $\theta$ 和最大迭代次数 $M$
(1)对原始矩阵 ${\boldsymbol{X}}$ 进行特征缩放得到矩阵 ${\boldsymbol{S}}$ ；
(2)随机初始化基矩阵 ${\boldsymbol{U}}$ 和辅助矩阵 ${\boldsymbol{Z}}$ ；　(3)更新 ${\boldsymbol{U}}$ ${ {\boldsymbol{u} }_{ij} } \leftarrow { {\boldsymbol{u} }_{ij} }\dfrac{ { { {\left( { {\boldsymbol{SAZ} } + \beta { {\boldsymbol{W} }_{\boldsymbol{U} } }{\boldsymbol{U} } } \right)}_{ij} } } }{ { { {\left( { { {\boldsymbol{UZ} }^{\rm{T} } }{ {\boldsymbol{A} }^{\rm{T} } }{\boldsymbol{AZ} } + \beta { {\boldsymbol{D} }_{\boldsymbol{U} } }{\boldsymbol{U} } + \theta {\boldsymbol{U} } } \right)}_{ij} } } }$ ；
(4)更新 ${\boldsymbol{Z}}$ ${ {\boldsymbol{z} }_{ij} } \leftarrow { {\boldsymbol{z} }_{ij} }\dfrac{ { { {\left( { { {\boldsymbol{A} }^{\text{T} } }{ {\boldsymbol{S} }^{\text{T} } }{\boldsymbol{U} } + \lambda { {\boldsymbol{A} }^{\text{T} } }{ {\boldsymbol{W} }_{\boldsymbol{Z} } }{\boldsymbol{AZ} } } \right)}_{ij} } } }{ { { {\left( { { {\boldsymbol{A} }^{\text{T} } }{ {\boldsymbol{AZU} }^{\text{T} } }{\boldsymbol{U} } + \lambda { {\boldsymbol{A} }^{\text{T} } }{ {\boldsymbol{D} }_{\boldsymbol{Z} } }{\boldsymbol{AZ} } } \right)}_{ij} } } }$ ；
(5)执行算法步骤(3)和步骤(4) 至最大迭代次数或收敛；
输出：矩阵 ${\boldsymbol{U}}$ 和 ${\boldsymbol{Z}}$

下载: 导出CSV

表 2 各数据集的详细说明

数据集名称	维度大小	类别数	总样本数	数据集类型
COIL20	1024	20	1440	物品
PIE	1024	68	2586	人脸
Faces95	4096	20	400	人脸
Pixraw10P	10000	10	100	人脸
JAFFE	676	10	213	人脸
COIL20-noise	1024	20	1440	人脸+平移噪声
Faces95-noise	4096	20	400	人脸+平移噪声

下载: 导出CSV

表 3 各算法在标准数据集上的对比(%)

数据集	NMF	CNMF	GNMF	SNMF	SDNMF	DSDNMF	SODNMF	AGNMF	ONMF	DENMF	S3GNMF
COIL20	64.2±2.4	69.6±1.6	68.1±1.5	66.9±1.2	71.2±1.0	72.1±1.3	78.9±0.8	73.1±1.1	66.0±1.5	74.7±1.7	84.1±0.9
COIL20	77.0±1.4	79.8±1.3	80.8±1.0	71.8±2.0	78.6±1.4	79.7±0.8	86.1±1.5	81.0±0.6	70.9±2.2	82.6±1.7	91.6±1.3
PIE	71.3±0.7	68.8±0.8	72.4±0.9	71.9±0.8	74.6±0.8	75.2±0.6	79.3±1.8	75.8±1.1	74.1±1.5	77.2±1.4	81.5±0.8
PIE	67.9±0.7	70.7±0.8	80.5±0.9	72.8±0.8	82.1±0.5	81.2±0.7	85.3±0.5	82.4±0.6	76.0±2.0	84.1±1.8	91.8±0.8
Faces95	43.7±1.2	48.6±1.7	50.2±2.3	49.5±1.8	51.2±2.0	50.6±1.8	53.9±1.5	52.2±1.1	49.2±1.1	53.6±0.9	55.1±1.7
Faces95	50.8±0.6	57.0±1.3	57.7±1.5	55.0±1.3	60.7±1.2	58.1±1.1	60.7±0.8	60.3±1.0	55.3±1.0	60.1±1.6	62.3±1.1
Pixraw10P	68.7±1.8	80.4±1.7	87.4±2.3	71.4±1.1	83.7±2.4	84.0±2.0	89.0±3.6	84.4±2.0	76.3±2.4	84.3±2.9	90.8±3.8
Pixraw10P	73.8±1.5	83.8±1.2	88.0±1.4	73.7±1.6	84.0±1.6	84.7±1.8	89.7±2.9	86.0±1.8	78.7±1.6	86.0±2.7	93.8±0.7
JAFFE	66.2±1.8	81.1±2.7	82.8±1.2	76.2±0.8	80.1±1.0	80.4±0.8	90.8±1.9	81.4±1.5	77.5±1.2	90.1±0.5	98.1±0.2
JAFFE	68.9±1.5	82.8±1.9	84.0±1.4	78.0±0.6	81.7±1.3	82.0±0.8	92.1±1.4	83.7±1.3	80.0±1.1	88.7±0.6	97.4±0.4

下载: 导出CSV

表 4 各算法在平移噪声COIL20数据集上的对比(%)

$\omega$	NMF	CNMF	GNMF	SNMF	SDNMF	DSDNMF	SODNMF	AGNMF	ONMF	DENMF	S3GNMF
1	63.2±2.2	67.6±1.2	69.0±1.5	67.4±1.5	72.3±1.5	74.1±1.8	75.1±1.2	71.7±1.4	65.7±2.2	72.7±2.7	87.2±2.1
1	75.0±1.4	77.2±1.3	80.5±1.1	70.5±1.3	79.3±1.1	79.9±0.9	84.0±1.1	78.8±0.7	68.1±1.4	74.7±1.9	94.6±0.5
2	52.1±2.3	55.2±1.5	57.7±1.3	56.8±1.6	68.6±1.8	70.1±2.2	63.4±1.6	62.7±1.6	54.0±2.7	61.8±2.6	73.2±2.5
2	66.7±1.6	69.1±1.5	75.7±1.2	73.9±1.4	80.0±1.5	82.6±1.5	76.1±1.2	75.5±0.8	71.7±1.4	74.5±1.3	85.5±0.9
3	49.8±1.8	50.0±1.3	58.2±1.1	55.6±1.8	60.4±1.9	58.8±2.2	57.2±1.7	56.6±2.0	54.9±2.0	55.0±2.3	63.8±1.9
3	58.8±0.9	61.9±1.6	69.8±1.1	60.7±1.6	73.4±0.9	73.1±1.3	70.9±0.9	68.4±1.1	60.4±1.4	70.1±2.1	80.8±0.6
4	43.5±1.9	46.7±2.4	48.9±1.6	47.3±2.0	52.5±2.3	53.3±2.5	51.8±1.7	50.9±2.3	47.1±2.1	51.9±1.9	57.6±2.2
4	55.2±1.1	58.0±1.6	62.2±1.2	60.8±1.2	70.9±0.6	71.3±1.1	65.9±0.8	63.0±1.4	60.4±1.5	64.7±1.7	74.7±0.8

下载: 导出CSV

表 5 各算法在平移噪声Faces95数据集上的对比(%)

$\omega$	NMF	CNMF	GNMF	SNMF	SDNMF	DSDNMF	SODNMF	AGNMF	ONMF	DENMF	S3GNMF
1	45.1±0.7	46.2±2.2	49.6±1.8	48.2±1.2	54.1±2.1	53.8±2.5	49.3±1.4	48.2±1.3	47.1±1.8	48.8±1.7	53.4±1.3
1	53.7±0.6	58.6±1.8	60.3±1.5	55.9±0.9	65.8±1.7	62.7±1.2	55.2±1.7	58.4±1.8	53.4±1.6	58.0±1.4	63.9±0.8
2	44.1±1.0	43.1±1.7	45.6±1.3	43.5±1.2	48.9±2.0	49.2±2.1	46.9±1.3	46.2±1.1	42.9±1.9	47.2±1.3	53.2±0.6
2	51.8±0.7	50.2±0.8	53.1±1.1	49.9±0.6	58.1±1.7	59.3±1.5	50.2±0.7	49.7±1.2	49.1±1.2	50.6±1.7	62.5±0.7
3	38.5±1.1	37.9±1.3	41.8±1.5	38.5±1.1	45.8±1.7	47.3±1.9	43.2±1.7	42.9±2.2	38.9±2.2	44.2±1.5	49.8±1.5
3	45.1±0.8	43.7±0.7	44.7±1.1	45.9±0.6	53.1±1.3	55.7±1.3	46.8±0.9	46.4±1.8	45.4±1.8	49.4±2.0	59.9±1.0
4	34.1±1.2	33.7±1.5	38.3±1.7	34.2±1.2	38.9±1.6	39.4±1.7	39.9±1.7	38.5±1.8	34.5±1.8	40.1±1.6	43.5±1.3
4	40.4±1.1	40.0±0.9	45.9±0.8	39.7±0.5	47.5±1.1	48.0±0.9	47.1±0.9	46.2±0.9	39.2±1.3	47.3±1.9	53.4±0.7

下载: 导出CSV

表 6 S2GNMF与S3GNMF的聚类效果对比(%)

数据集	PIE	Pixraw10P	JAFFE	COIL20	COIL20 ( $\omega$ =2)	COIL20 ( $\omega$ =4)	Faces95	Faces95 ( $\omega$ =2)	Faces95 ( $\omega$ =4)
S2GNMF	77.6±1.1	83.7±3.7	90.7±0.7	81.5±1.4	69.0±2.9	55.3±2.0	51.0±2.2	48.7±1.1	38.3±0.9
S2GNMF	90.2±0.3	85.4±1.2	92.9±0.8	89.9±0.4	85.1±0.6	72.1±1.1	61.8±1.0	58.6±0.6	48.2±0.6
S3GNMF	81.5±0.8	90.8±3.8	98.1±0.2	84.1±0.9	73.2±2.5	57.6±2.2	55.1±1.7	53.2±0.6	43.5±1.3
S3GNMF	91.8±0.8	93.8±0.7	97.4±0.4	91.6±1.3	85.5±0.9	74.7±0.8	62.3±1.1	62.5±0.7	53.4±0.7

下载: 导出CSV

表 7 各算法在不同数据集的运算速度对比(s)

数据集	NMF	CNMF	GNMF	SNMF	SDNMF	DSDNMF	SODNMF	AGNMF	ONMF	DENMF	S3GNMF
COIL20	0.16	1.17	0.24	0.14	161.52	165.94	0.54	26.74	0.21	2.82	1.25
PIE	0.54	2.33	0.69	0.46	328.17	340.75	1.38	40.88	0.69	7.01	2.61
Faces95	0.08	0.65	0.13	0.07	108.41	132.67	0.38	20.62	0.23	3.53	0.43
Pixraw10P	0.14	1.02	0.19	0.14	138.45	155.90	0.41	37.61	0.12	1.67	0.29
JAFFE	0.04	0.41	0.08	0.03	82.07	94.74	0.20	17.84	0.07	1.42	0.17

下载: 导出CSV

参考文献(28)

[1]	钱智明, 钟平, 王润生. 基于图正则化与非负组稀疏的自动图像标注[J]. 电子与信息学报, 2015, 37(4): 784–790. doi: 10.11999/JEIT141282 QIAN Zhiming, ZHONG Ping, and WANG Runsheng. Automatic image annotation via graph regularization and non-negative group sparsity[J]. Journal of Electronics &Information Technology, 2015, 37(4): 784–790. doi: 10.11999/JEIT141282
[2]	刘正, 张国印, 陈志远. 基于特征加权和非负矩阵分解的多视角聚类算法[J]. 电子学报, 2016, 44(3): 535–540. doi: 10.3969/j.issn.0372-2112.2016.03.006 LIU Zheng, ZHANG Guoyin, and CHEN Zhiyuan. A Multiview clustering algorithm based on feature weighting and non-negative matrix factorization[J]. Acta Electronica Sinica, 2016, 44(3): 535–540. doi: 10.3969/j.issn.0372-2112.2016.03.006
[3]	马源培, 杨卓璇, 李慧嘉. 结合Bass模型和LTV的创新产品扩散预测[J]. 聊城大学学报:自然科学版, 2020, 33(4): 26–32. MA Peiyuan, YANG Zhuoxuan, and LI Huijia. Innovative product diffusion forecasting combined bass model and LTV[J]. Journal of Liaocheng University:Natural Science Edition, 2020, 33(4): 26–32.
[4]	JIA Yuheng, KWONG S, HOU Junhui, et al. Semi-supervised non-negative matrix factorization with dissimilarity and similarity regularization[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020, 31(7): 2510–2521.
[5]	邱飞岳, 陈博文, 陈铁明, 等. 稀疏诱导流形正则化凸非负矩阵分解算法[J]. 通信学报, 2020, 41(5): 84–95. doi: 10.11959/j.issn.1000-436x.2020064 QIU Feiyue, CHEN Bowen, CHEN Tieming, et al. Sparsity induced convex nonnegative matrix factorization algorithm with manifold regularization[J]. Journal on Communications, 2020, 41(5): 84–95. doi: 10.11959/j.issn.1000-436x.2020064
[6]	陈善学, 刘荣华. 基于子空间结构正则化的L₂₁非负矩阵分解高光谱解混[J]. 电子与信息学报, 2022, 44(5): 1704–1713. doi: 10.11999/JEIT210232 CHEN Shanxue and LIU Ronghua. L₂₁ Nonnegative matrix factorization based on subspace structure regularization for hyperspectral unmixing[J]. Journal of Electronics &Information Technology, 2022, 44(5): 1704–1713. doi: 10.11999/JEIT210232
[7]	CHEN Wensheng, LIU Jingmin, PAN Binbin, et al. Face recognition using nonnegative matrix factorization with fractional power inner product kernel[J]. Neurocomputing, 2019, 348: 40–53. doi: 10.1016/j.neucom.2018.06.083
[8]	YANG Zhen, CHEN Weitong, and HUANG Jian. Enhancing recommendation on extremely sparse data with blocks-coupled non-negative matrix factorization[J]. Neurocomputing, 2018, 278: 126–133. doi: 10.1016/j.neucom.2017.04.080
[9]	SHIRDHONKAR S and JACOBS D W. Approximate earth mover’s distance in linear time[C]. 2008 IEEE Conference on Computer Vision and Pattern Recognition, Anchorage, USA, 2008: 1–8.
[10]	CAI Deng, HE Xiaofei, HAN Jiawei, et al. Graph regularized nonnegative matrix factorization for data representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(8): 1548–1560. doi: 10.1109/TPAMI.2010.231
[11]	QIAN Wei, HONG Bin, CAI Deng, et al. Non-negative matrix factorization with Sinkhorn distance[C]. The 25th International Joint Conference on Artificial Intelligence, New York, USA, 2016: 1960–1966.
[12]	HOYER P O. Non-negative matrix factorization with sparseness constraints[J]. Journal of Machine Learning Research, 2004, 5(9): 1457–1469.
[13]	LIU Haifeng, WU Zhaohui, LI Xuelong, et al. Constrained nonnegative matrix factorization for image representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(7): 1299–1311. doi: 10.1109/TPAMI.2011.217
[14]	LI Dong, ZHANG Baoxian, YAO Zheng, et al. A feature scaling based k-nearest neighbor algorithm for indoor positioning system[C]. 2014 IEEE Global Communications Conference, Austin, USA, 2014: 436–441.
[15]	JIMÉNEZ-CORDERO A and MALDONADO S. Automatic feature scaling and selection for support vector machine classification with functional data[J]. Applied Intelligence, 2021, 51(1): 161–184.
[16]	RUBNER Y, TOMASI C, and GUIBAS L J. The earth mover’s distance as a metric for image retrieval[J]. International Journal of Computer Vision, 2000, 40(2): 99–121. doi: 10.1023/A:1026543900054
[17]	CUTURI M. Sinkhorn distances: Lightspeed computation of optimal transport[C]. The 26th International Conference on Neural Information Processing Systems, Lake Tahoe, Spain, 2013: 2292–2300.
[18]	FROGNER C, ZHANG Chiyuan, MOBAHI H, et al. Learning with a Wasserstein loss[C]. The 28th International Conference on Neural Information Processing Systems, Montreal, Canada, 2015: 2053–2061.
[19]	HUANG Shudong, WANG Hongjun, LI Tao, et al. Robust graph regularized nonnegative matrix factorization for clustering[J]. Data Mining and Knowledge Discovery, 2018, 32(2): 483–503. doi: 10.1007/s10618-017-0543-9
[20]	XU Zongben, CHANG Xiangyu, XU Fengmin, et al. L_1/2 regularization: A thresholding representation theory and a fast solver[J]. IEEE Transactions on Neural Networks and Learning Systems, 2012, 23(7): 1013–1027. doi: 10.1109/TNNLS.2012.2197412
[21]	LEE D D and SEUNG H S. Learning the parts of objects by non-negative matrix factorization[J]. Nature, 1999, 401(6755): 788–791. doi: 10.1038/44565
[22]	ZHANG Yunmeng, SHU Zhenqiu, ZHANG Jie, et al. Dual Graph regularized NMF with Sinkhorn Distance[C]. The 19th International Symposium on Distributed Computing and Applications for Business Engineering and Science, Xuzhou, China, 2020: 146–149.
[23]	MENG Yang, SHANG Ronghua, JIAO Licheng, et al. Dual-graph regularized non-negative matrix factorization with sparse and orthogonal constraints[J]. Engineering Applications of Artificial Intelligence, 2018, 69: 24–35. doi: 10.1016/j.engappai.2017.11.008
[24]	ZHANG Lin, LIU Zhonghua, PU Jiexin, et al. Adaptive graph regularized nonnegative matrix factorization for data representation[J]. Applied Intelligence, 2020, 50(2): 438–447. doi: 10.1007/s10489-019-01539-9
[25]	CHOI S. Algorithms for orthogonal nonnegative matrix factorization[C]. Proceedings of 2008 IEEE International Joint Conference on Neural Networks, Hong Kong, China, 2008: 1828–1832.
[26]	WU Wenhui, KWONG S, HOU Junhui, et al. Simultaneous dimensionality reduction and classification via dual embedding regularized nonnegative matrix factorization[J]. IEEE Transactions on Image Processing, 2019, 28(8): 3836–3847. doi: 10.1109/TIP.2019.2907054
[27]	LIANG Naiyao, YANG Zuyuan, LI Zhenni, et al. Multi-view clustering by non-negative matrix factorization with co-orthogonal constraints[J]. Knowledge-Based Systems, 2020, 194: 105582. doi: 10.1016/j.knosys.2020.105582
[28]	QIU Xiru, CHEN Zhikui, ZHAO Liang, et al. Unsupervised multi-view non-negative for law data feature learning with dual graph-regularization in smart Internet of Things[J]. Future Generation Computer Systems, 2019, 100: 523–530. doi: 10.1016/j.future.2019.05.055

施引文献

期刊类型引用(4)

1.	倪力政，陈颖，李翔，邓修涵，马腾. 融合注意力与多尺度特征的遥感图像配准. 计算机工程与应用. 2025(03): 275-285 . 百度学术
2.	黎捷，杨林峰. 基于改进kNN算法的非侵入式电力负荷监测仿真. 计算机仿真. 2025(01): 81-84+91 . 百度学术
3.	赵一诺. 基于广义模糊聚类的图像分割算法分析. 电子技术与软件工程. 2022(04): 169-172 . 百度学术
4.	曾德宇，梁泽逍，吴宗泽 . 基于加权核范数和L_(2, 1)范数的最优均值线性分类器. 电子与信息学报. 2022(05): 1602-1609 . 本站查看

其他类型引用(2)

资源附件(0)

访问统计

图(7) / 表(7)

计量

文章访问数: 1409
HTML全文浏览量: 953
PDF下载量: 107
被引次数: 6

1. 引言
2. 基于Sinkhorn距离特征缩放的多约束非负矩阵分解
2.1 基于Sinkhorn距离的特征缩放
2.2 融合标签信息的双图流形结构
2.3 L2,1/2范数稀疏约束
2.4 S3GNMF目标函数
3. S3GNMF算法求解
4. 实验结果与分析
4.1 数据集
4.2 参数分析
4.3 聚类结果与分析
4.4 算法复杂度与速度对比
5. 结论

1. 引言
2. 基于Sinkhorn距离特征缩放的多约束非负矩阵分解
2.1 基于Sinkhorn距离的特征缩放
2.2 融合标签信息的双图流形结构
2.3 L_2,1/2范数稀疏约束
2.4 S3GNMF目标函数
3. S3GNMF算法求解
4. 实验结果与分析
4.1 数据集
4.2 参数分析
4.3 聚类结果与分析
4.4 算法复杂度与速度对比
5. 结论

参考文献(28)

施引文献

资源附件(0)

访问统计

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于Sinkhorn距离特征缩放的多约束非负矩阵分解算法

doi: 10.11999/JEIT210946

通讯作者:
李维刚　liweigang.luck@foxmail.com

计量

Multi-constrained Non-negative Matrix Factorization Algorithm Based on Sinkhorn Distance Feature Scaling

1. 引言

2. 基于Sinkhorn距离特征缩放的多约束非负矩阵分解

2.1 基于Sinkhorn距离的特征缩放

2.2 融合标签信息的双图流形结构

2.3 L_2,1/2范数稀疏约束

2.4 S3GNMF目标函数

3. S3GNMF算法求解

4. 实验结果与分析

4.1 数据集

4.2 参数分析

4.3 聚类结果与分析

4.4 算法复杂度与速度对比

5. 结论

期刊类型引用(4)

其他类型引用(2)

计量

目录

1. 引言

2. 基于Sinkhorn距离特征缩放的多约束非负矩阵分解

2.1 基于Sinkhorn距离的特征缩放

2.2 融合标签信息的双图流形结构

2.3 L_2,1/2范数稀疏约束

2.4 S3GNMF目标函数

3. S3GNMF算法求解

4. 实验结果与分析

4.1 数据集

4.2 参数分析

4.3 聚类结果与分析

4.4 算法复杂度与速度对比

5. 结论

留言板

基于Sinkhorn距离特征缩放的多约束非负矩阵分解算法

doi: 10.11999/JEIT210946

通讯作者: 李维刚 liweigang.luck@foxmail.com

计量

出版历程

Multi-constrained Non-negative Matrix Factorization Algorithm Based on Sinkhorn Distance Feature Scaling

1. 引言

2. 基于Sinkhorn距离特征缩放的多约束非负矩阵分解

2.1 基于Sinkhorn距离的特征缩放

2.2 融合标签信息的双图流形结构

2.3 L2,1/2范数稀疏约束

2.4 S3GNMF目标函数

3. S3GNMF算法求解

4. 实验结果与分析

4.1 数据集

4.2 参数分析

4.3 聚类结果与分析

4.4 算法复杂度与速度对比

5. 结论

期刊类型引用(4)

其他类型引用(2)

计量

出版历程

目录

1. 引言

2. 基于Sinkhorn距离特征缩放的多约束非负矩阵分解

2.1 基于Sinkhorn距离的特征缩放

2.2 融合标签信息的双图流形结构

2.3 L2,1/2范数稀疏约束

2.4 S3GNMF目标函数

3. S3GNMF算法求解

4. 实验结果与分析

4.1 数据集

4.2 参数分析

4.3 聚类结果与分析

4.4 算法复杂度与速度对比

5. 结论

通讯作者:
李维刚　liweigang.luck@foxmail.com

2.3 L_2,1/2范数稀疏约束

2.3 L_2,1/2范数稀疏约束