非晶硅少子扩散长度的测量

徐乐; 刘启一

摘要: 正 (一)引言非晶硅少子扩散长度对非晶硅太阳电池的性能有重要影响,它是表征非晶硅材料质量的重要参数。最近Dresner和Moore分别用表面光电压法(SPV法)测量非晶硅少于扩散长度获得成功。但前者需要超高真空系统,样品表面要经过溅射和退火,后者使用非晶硅液体肖特基势垒,装置较烦。我们试用顶层淀积了金属镍的非晶硅薄膜作样品,利用镍和非晶硅膜构成的金属肖特基势垒进行表面光电压测量,获得成功。这样

关键词:

Abstract: The results of a study in the diffusion length of holes in a-Si:H by measuring the sur-face photovoltage of the metal (Ni) Schottky barrier is reported. The change of field-assis-ted hole transport with bias light was observed. It is believed that measurement of diffusion length by this method may become a useful way of detecting and improving the quality of a-Si:H.

1. 引言

滚动轴承是旋转机械设备的重要部件，由于高强度的运动和摩擦损耗，滚动轴承极易损坏^[1,2]。滚动轴承一旦发生故障，轻则导致机械设备停工，影响生产，重则可能对人身安全造成严重伤害^[3,4]。目前滚动轴承的智能故障诊断技术大多以深度学习为基础，诊断耗时较长，另外，滚动轴承在实际工作时，负载常常是变化的，因此，快速实现不同负载下滚动轴承状态诊断具有重要意义。

深度学习在滚动轴承智能故障诊断领域受到越来越多的关注^[5]。文献[6]采用salp算法优化深度信念网络(Deep Belief Network, DBN)的超参数，避免人为选择，实验证明该方法在滚动轴承故障诊断中有较高的诊断精度；文献[7]将注意力机制引入到1维卷积神经网络(Convolutional Neural Network, CNN)中，进一步增强了CNN对滚动轴承故障特征的学习能力，获得了较高的分类准确率。

上述深度学习方法虽在滚动轴承故障诊断中取得了较好的效果，但不同负载下的滚动轴承状态诊断存在以下限制：(1) 深度学习网络一般需要较大的训练样本，而工程实践中，带标记信息的振动数据稀缺，且故障状态下获取的样本量有限；(2) 不同负载下滚动轴承的数据分布差异较大，单独的深度学习网络对不同负载下滚动轴承状态诊断的适应性较差。

迁移学习通过挖掘源域与目标域的内部知识联系，借助源域知识帮助目标域网络学习，实现领域之间的知识迁移^[8]。其中，基于模型的迁移学习策略简单易行，微调算法可以借助目标域少量带标签数据完成网络的训练，同时提升模型迁移的效果。文献[9]以CNN和模型迁移思想为基础，提出迁移梯度特征到目标域，得到状态识别模型，实现了不同负载下滚动轴承剩余寿命预测；文献[10]提出一种长短时记忆网络(Long Term and Short Term Memory, LSTM)与迁移学习相结合的模型迁移学习方法，实现了不同负载下滚动轴承故障诊断，并获得了较高的准确率。

上述深度迁移学习方法突破了深度学习在不同负载下滚动轴承状态诊断中存在的2个限制，但深度学习网络一般结构复杂、训练参数多，训练过程缓慢，因此，深度迁移学习网络存在训练耗时的问题。

文献[11]提出一种“扁平”的神经网络结构，即宽度学习系统(Broad Learning System, BLS)，其具有网络结构简单、计算参数少和训练速度快的优点。文献[12]将CNN与BLS结合，提出一种基于领域知识的深-宽度学习框架，并在滚动轴承和管道缺陷数据集上测试其性能，结果表明，该框架相比传统学习方法性能优越；文献[13]提出一种自适应BLS，该网络快速并以较高的准确率实现了滚动轴承的故障诊断。由上可知，BLS已在滚动轴承故障诊断领域得到了一定的应用。

受深度模型迁移学习方法的启发，将BLS网络与模型迁移方法结合理论上可实现不同负载下滚动轴承的快速诊断。但BLS网络的层数少，依赖特征节点和增强节点提取数据特征，故其特征提取能力和泛化能力有待进一步提高，同时，网络节点结构的自适应确定也需进一步研究。

综上所述，本文提出采用循环扩展方式建立BLS网络的增强节点，并在增强层引入Maxout激活函数，构建改进的BLS网络，在此基础上，进一步结合迁移学习方法提出改进宽度模型迁移学习网络，实现不同负载下滚动轴承状态快速分类。同时，针对如何自适应确定网络节点结构问题，提出结合遗传算法(Genetic Algorithm, GA)自适应确定改进BLS网络的节点结构，以提高改进宽度模型迁移学习网络的泛化能力。

2. 原理

2.1 BLS网络

BLS网络为解决分类问题提供了一种高效的方法。BLS方法中，首先，输入数据X进行线性变换后形成映射特征；其次，映射特征经过非线性激活函数连接到增强层形成增强特征；最后，增强特征与映射特征合并共同输入到输出层。图1为BLS网络的结构示意图。

图 1 BLS网络的结构示意图

下载: 全尺寸图片幻灯片

BLS网络的具体训练过程：给定训练数据集{X,Y}，X∈R^N×M表示训练数据集有N个训练样本，每个训练样本有M维特征，Y∈R^N×C表示N个训练样本有C个类别标签。假定BLS网络每个特征节点窗口有N₁个映射特征，则第i个映射特征表示为

${{\boldsymbol{z}}_i} = \varphi ({\boldsymbol{X}}{{\boldsymbol{W}}_{{e_i}}} + {{\boldsymbol{\beta}} _{{e_i}}}) , i = 1,2,\cdots ,{N_1}$

(1)

其中，权重 ${{\boldsymbol{W}}_{{e_i}}}$ 和偏差 ${{\boldsymbol{\beta}} _{{e_i}}}$ 随机产生并通过稀疏自动编码器优化，ϕ通常是线性变换。

定义 ${\boldsymbol{Z}}_m^{}\mathop = \limits^\Delta [{{\boldsymbol{z}}_1},{{\boldsymbol{z}}_2},\cdots ,{{\boldsymbol{z}}_{{N_1}}}]$ , $m = 1,2,\cdots ,{N_2}$ 为一个特征节点窗口的映射特征，最终特征层N₂个特征节点窗口的映射特征表示为 ${\boldsymbol{Z}}\mathop = \limits^\Delta [{\boldsymbol{Z}}_1^{},{\boldsymbol{Z}}_2^{},\cdots ,{\boldsymbol{Z}}_{{N_2}}^{}]$ 。映射特征Z通过非线性变换连接到增强层形成增强特征，假定BLS网络有N₃个增强节点，第j个增强特征表示为

${{\boldsymbol{h}}_j} = \xi ({\boldsymbol{Z}}{{\boldsymbol{W}}_{{h_j}}} + {{\boldsymbol{\beta}} _{{h_j}}}) , j = 1,2,\cdots ,{N_3}$

(2)

其中，激活函数 $\xi = \tanh (x)$ ， ${{\boldsymbol{W}}_{{h_j}}}$ 和 ${{\boldsymbol{\beta}} _{{h_j}}}$ 随机产生。

增强层的增强特征表示为 ${\boldsymbol{H}}\mathop = \limits^\Delta [{{\boldsymbol{h}}_1},{{\boldsymbol{h}}_2},\cdots ,{{\boldsymbol{h}}_{{N_3}}}]$ ，映射特征Z和增强特征H共同输入到BLS网络的输出层，已知输入数据X的标签为Y，则映射特征Z、增强特征H和Y的关系表示为

${\boldsymbol{Y}} = [{\boldsymbol{Z}}|{\boldsymbol{H}}]{\boldsymbol{W}}$

(3)

其中，W是连接特征层和增强层到输出层的权重，W的计算方式为

${\boldsymbol{W}} = {[{\boldsymbol{Z}}|{\boldsymbol{H}}]^ + }{\boldsymbol{Y}}$

(4)

其中，令特征矩阵 ${\boldsymbol{A}} = [ {\boldsymbol{Z}}|{\boldsymbol{H}} ]$ ，则W=A⁺Y，A⁺为A的伪逆矩阵。

伪逆是线性方程的最小二乘估计量，其目标是在训练误差最小时求解输出权值W，特别是当特征矩阵A不是一个满秩矩阵时，无法直接求解A⁺。因此，引入岭回归算法，采用式(5)求解W。

${\rm{argmin}}:\left\| {{\boldsymbol{AW}} - {\boldsymbol{Y}}} \right\|_u^{{\sigma _1}} + \lambda \left\| {\boldsymbol{W }}\right\|_v^{{\sigma _2}}$

(5)

其中，σ₁>0，σ₂>0，u，v表示范数正则化，通过σ₁=σ₂=u=v=2将式(5)优化问题设置为L2范数正则化；λ>0，表示对权重的限制。

式(5)表示的正则化函数为凸函数，具有较好的泛化性能。理论上，如果λ=0，式(5)演变为求最小平方问题；如果 $\lambda \to \infty$ ，式(5)的解受到严格的限制并将趋向于0。因此，通常设置λ→0。将式(5)求导，令导数等于0，可得

${\boldsymbol{W}} = {(\lambda {\boldsymbol{I}} + {\boldsymbol{A}}{{\boldsymbol{A}}^{\rm{T}}})^{ - 1}}{{\boldsymbol{A}}^{\rm T}}{\boldsymbol{Y}}$

(6)

其中，I表示单位阵。

2.2 BLS网络改进

BLS网络的非线性结构主要体现在增强层。为进一步增强BLS网络的非线性表达能力，本文在BLS网络的基础上，设计N₄个增强节点窗口，每个增强节点窗口随机产生增强特征权重矩阵，并进一步采用Maxout激活函数生成增强特征，构建改进BLS网络。Maxout激活函数的核心是取一系列线性函数的最大值作为激活函数的激活值，且当线性函数的数量趋于无穷时，可以拟合任意维度的函数。因此，与传统的Sigmoid和ReLU激活函数相比，Maxout激活函数的拟合能力更强。所提改进BLS网络生成增强特征的过程如图2所示。

图 2 改进BLS网络生成增强特征的过程示意图

下载: 全尺寸图片幻灯片

结合图2和2.1节，描述改进BLS网络生成增强特征的具体过程。假设每个增强节点窗口有N₃个增强映射，则第k个增强特征为

${h_k} = {\boldsymbol{Z}}{{\boldsymbol{W}}_{{h_k}}} + {\beta _{{h_k}}} , k = 1,2,\cdots ,{N_3}$

(7)

其中， ${{\boldsymbol{W}}_{{h_k}}}$ 和 ${\beta _{{h_k}}}$ 随机产生。

定义 ${H_n}$ 为一个增强节点窗口的增强特征，采用Maxout激活函数生成 ${H_n}$ ，则 $H_n^{} = {\rm{max}} \{ {h_1},{h_2},\cdots , {h_{{N_3}}}\}$ , $n = 1,2,\cdots ,{N_4}$ 。最终，增强层N₄个增强节点窗口的增强特征为

${\boldsymbol{H}}\mathop = \limits^\Delta [{\boldsymbol{H}}_1^{},{\boldsymbol{H}}_2^{},\cdots ,{\boldsymbol{H}}_{{N_4}}^{}]$

(8)

改进BLS网络获得增强特征H的算法如算法1所示。

算法1 改进BLS网络获得增强特征算法
输入：映射特征Z
输出：增强特征H
(1) for n = 1 to N₄ //n表示增强节点窗口数目，N₄表示增强节　点窗口的最大数目
(2) 　随机生成 ${W_{{h_k}}}$ 并对 ${W_{{h_k}}}$ 进行正交规范化
(3) 　OutofEachWindow←np.dot(Z× ${{\boldsymbol{W}}_{{h_k}}}$ + ${{\boldsymbol{\beta}} _{{h_k}}}$ ) // ${{\boldsymbol{\beta}} _{{h_k}}}$ 表示偏　置，随机生成
(4) 　OutofAllWindow[：，n：n+1]←np.max 　(OutofEachWindow, axis=1)
(5) end for
(6) H←OutofAllWindow

下载: 导出CSV

| 显示表格

2.3 基于改进宽度学习网络的模型迁移策略

基于模型的迁移学习方法通过参数传递的形式将源域的相关知识迁移至目标域，简单易行，此外，微调算法在深度模型迁移学习方法中的成功应用，极大地提升了基于模型的迁移策略研究的空间^[14]。

与深度学习网络相比，宽度学习网络更倾向于向“宽度”方向构造，改进宽度模型迁移学习是将迁移学习思想嵌入到改进宽度学习网络中。Yosinski等人^[15]指出迁移神经网络的前几层参数效果较好，故本文方法选择迁移改进宽度学习网络的特征层权重参数W_e与增强层权重参数W_h，并使用岭回归方法微调目标域网络的输出层权重W。改进宽度模型迁移学习采用的参数迁移策略示意图如图3所示。

图 3 基于改进宽度学习网络的模型迁移策略

下载: 全尺寸图片幻灯片

3. 改进宽度模型迁移学习的快速分类方法

改进宽度模型迁移学习的性能较依赖以下4个参数：每个特征节点窗口的特征节点数量、特征节点窗口数量、每个增强节点窗口的增强节点数量和增强节点窗口数量，分别用N₁, N₂, N₃和N₄表示。引入GA优化改进宽度模型迁移学习的源域网络的参数，提高源域网络对某种负载下滚动轴承状态知识的挖掘能力，帮助目标域网络更好地实现其他负载下滚动轴承状态的快速分类。不同负载下基于改进宽度模型迁移学习的滚动轴承状态快速分类方法的整体流程框图如图4所示。

图 4 基于改进宽度模型迁移学习的滚动轴承状态快速分类方法流程框图

下载: 全尺寸图片幻灯片

所提分类方法的具体流程步骤为

(1) 数据预处理。对滚动轴承原始振动信号进行快速傅里叶变换(FFT)，得到频域幅值序列，某种(某些)负载下的幅值序列作为源域样本，其他负载下的幅值序列作为目标域样本。

(2) 构建预训练模型。

(a)初始化GA：对种群大小、交叉概率、变异概率、染色体编码方式、下一代种群选择方式以及迭代停止条件进行设置；

(b)定义搜索空间：改进宽度模型迁移学习的源域网络参数N₁, N₂, N₃和N₄构成GA的搜索空间，搜索空间的变化范围为1～50；

(c)获得GA种群中个体的适应度值：源域训练样本通过权重参数W_e和线性激活函数得到映射特征，映射特征进一步通过权重参数W_h和Maxout激活函数得到增强特征，映射特征和增强特征共同作为源域改进宽度学习网络输出层的输入，利用岭回归算法计算源域网络输出层的权重W，得到分类准确率，将其作为个体的适应度值；

(d)比较种群中个体的适应度值，根据GA初始化参数得到下一代种群；

(e)判断是否达到迭代停止条件，若是，获得预训练模型，若否，重复步骤(c)—步骤(e)；

(f)将源域测试样本输入预训练模型，测试预训练模型。

(3) 构建状态分类模型。将预训练模型的N₁, N₂, N₃和N₄以及W_e和W_h迁移至目标域网络，使用目标域少量的训练样本，并结合岭回归方法微调目标域改进宽度学习网络的输出层权重W，构建滚动轴承状态分类模型。

(4) 不同负载下滚动轴承状态测试。将目标域测试集样本输入(3)中已建立的诊断模型，得到分类结果。

4. 应用与分析

4.1 实验数据与环境

实验数据来源于美国凯斯西储大学的CWRU数据库^[16]，采集滚动轴承振动数据的测试系统包括驱动电机、负载和控制电路，实验装置示意图如图5所示。本文使用采样频率为48 kHz，驱动端SKF6205型号滚动轴承的状态数据，共包含0 kW, 0.75 kW, 1.50 kW, 2.25 kW负载数据，对应电机转速分别为1797 r/min, 1772 r/min, 1750 r/min和1730 r/min。

图 5 实验装置示意图

下载: 全尺寸图片幻灯片

滚动轴承状态共10种，具体为B07, B14, B21, IR07, IR14, IR21, OR07, OR14, OR21和N。其中，N表示正常状态，B表示故障位置在滚动体, IR表示故障位置在内圈， OR表示故障位置在外圈，07, 14和21分别代表滚动轴承产生直径0.1778 mm, 0.3556 mm和0.5334 mm的故障。

不同负载下滚动轴承10种状态分类实验首先将滚动轴承振动数据每个样本取4096点，并对其进行FFT，获得2048点的频域幅值序列。以某种(某些)负载频域幅值序列为源域数据，其他负载频域幅值序列为目标域数据，验证滚动轴承实际工作中负载变化时，改进宽度模型迁移学习方法的分类性能。本文实验所用计算机为Windows10操作系统，内存大小为16 GByte，处理器型号为Intel Core i5-8265U。

4.2 实验与分析

4.2.1 样本集构成和GA参数设置

不同负载下滚动轴承状态分类实验的迁移任务构成如表1所示。迁移任务2_3表示1.50 kW负载的源域样本集知识迁移至2.25 kW负载的目标域样本集。同理，其他迁移任务表示含义以此类推。

表 1 迁移任务构成

迁移任务	源域样本集负载 (kW)	目标域样本集负载 (kW)	源域样本数 (个)	目标域样本数 (个)	总样本数 (个)
2_3	1.50	2.25	600	600	1200
2_13	1.50	1.50, 2.25	600	1200	1800
3_012	2.25	0, 0.75, 1.50	600	1800	2400
13_2	0.75, 2.25	1.50	1200	600	1800
02_13	0, 1.50	0.75, 2.25	1200	1200	2400
023_1	0, 1.50, 2.25	0.75	1800	600	2400

下载: 导出CSV

| 显示表格

实验中GA参数设置为种群大小为8，交叉概率0.95，变异概率0.05，染色体编码方式为二进制编码，下一代种群选择方式为精英保留锦标赛选择，迭代停止条件设置为“迭代停滞”判断阈值大小为1×10^–5，当判断GA连续迭代停滞1代时结束寻优。

4.2.2 所提方法的各部分改进前后对比实验

在目标域训练样本比例为20%的前提下，采用消融实验分别阐述BLS网络改进、GA优化和模型迁移的效果。在验证BLS网络改进以及模型迁移效果的对比实验中，对表1列出的6组迁移任务分别进行5次重复实验，取准确率和训练时间的平均值作为每组的实验结果，并将6组迁移任务的实验结果平均，得到最终的对比结果。

在使用模型迁移以及GA优化网络节点结构的前提下，对BLS网络改进前后进行对比实验分析，结果如表2所示。由表2可知，相比BLS网络，改进BLS网络建立模型的平均训练时间略有增加，但平均测试准确率提高了1.4%，故说明改进BLS网络保持了BLS网络快速分类的优势，同时增强了BLS网络的特征提取能力。

表 2 BLS网络改进前后实验结果

网络模型	平均测试准确率 (%)	平均训练时间 (s)
基于BLS网络的迁移模型	97.0	27.4
基于改进BLS网络的迁移模型	98.4	35.1

下载: 导出CSV

| 显示表格

在基于改进BLS网络进行模型迁移的前提下，为了分析GA优化的作用，将GA优化与人为随机设置网络参数的实验结果进行对比分析。为避免人为随机设置网络参数的偶然性，共随机设置5组网络参数，如表3所示，N₁, N₂, N₃和N₄的含义同第3节。

表 3 随机设置的5组网络参数

组数	N₁	N₂	N₃	N₄
1	5	1	30	10
2	30	40	5	20
3	50	20	40	30
4	20	5	10	40
5	10	30	20	50

下载: 导出CSV

| 显示表格

以迁移任务2_3与2_13为例，将随机设置网络参数与GA优化网络参数的实验结果对比，并进行可视化，结果如图6所示。图6中用3维坐标和圆形表示网络参数N₁, N₂, N₃和N₄，颜色表示目标域的测试准确率，特殊标记X及图中箭头指向的圆形表示GA优化后的实验结果，其余5个圆形表示表3中随机设置5组网络参数的实验结果。以图6(a)为例，1.5 kW负载样本作为源域，2.25 kW负载样本作为目标域，可以看出，源域网络参数N₁, N₂, N₃和N₄的选择对目标域的测试准确率影响较大。所有坐标值和圆大小所代表的网络参数中，经GA优化的网络参数相比其他随机设置的，目标域2.25 kW负载故障的测试准确率更高。说明GA优化的源域改进宽度学习网络，增强了源域网络对某种负载滚动轴承故障知识的挖掘能力，提高了目标域其他负载滚动轴承故障的测试准确率，即GA优化提升了改进模型对不同负载诊断的泛化性能。

图 6 网络参数优化前后对比实验结果的可视化

下载: 全尺寸图片幻灯片

在使用改进BLS网络以及GA优化网络节点结构的前提下，对模型迁移前后进行对比实验分析。其中，未采用模型迁移方法的实验以表1中源域为训练集，目标域为测试集；模型迁移实验将表1中源域样本按照2:1划分源域训练集和源域测试集，目标域的20%样本为训练集，用于微调目标域网络输出层权重，其余样本为目标域测试集，2种方法的对比实验结果如表4所示。

表 4 模型迁移前后实验结果

是否迁移	平均测试准确率 (%)	平均训练时间 (s)
是	98.4	35.1
否	90.1	29.1

下载: 导出CSV

| 显示表格

由表4可知，采用模型迁移方法后的平均测试准确率提高了8.3%，而两者建立模型的训练时间相差不多。因此，模型迁移方法更适合解决不同负载下滚动轴承状态诊断问题。

4.2.3 与其他方法的对比实验

为进一步验证所提方法的有效性，本文基于表1的6组迁移任务，将所提改进宽度模型迁移学习与CNN, LSTM, BPNN, DBN^[17], 文献[18]和文献[19]对比，其中，CNN, LSTM, BPNN和DBN^[18]以表1的源域数据为训练集，目标域数据为测试集。7种方法对表1列出的6组迁移任务分别进行5次重复实验，取准确率和训练时间的平均值作为每组的实验结果，并将6组实验结果进行平均，得到最终的对比结果。CNN, LSTM, BPNN, DBN^[17], 文献[18]和文献[19]分别记为方案1—方案6，7种不同方法的对比实验结果如图7所示。

图 7 所提方法与其他方法对比的实验结果

下载: 全尺寸图片幻灯片

由图7可知，与方案1—方案4深度学习方法相比，所提方法的平均测试准确率分别高出19.4%、17.8%、19.7%和12.0%，而所提方法的训练时间均少于方案1—方案4。方案5采用深度迁移学习方法，方案6采用宽度特征迁移学习方法，与方案5、方案6相比，所提方法的测试准确率相差不多，但训练时间分别少1400 s和80 s左右。综上所述，与所对比的深度学习方法、深度迁移学习方法和宽度特征迁移学习方法相比，本文所提方法在解决不同负载下滚动轴承状态诊断问题上有明显优势，可在较短的训练时间内获得良好的测试准确率。

4.3 滚动轴承其他振动数据库的验证实验

为验证所提方法在其他数据库上的有效性，利用MFPT数据库^[20]进行实验。使用负载为121.5 kg工况的正常数据以及负载为22.5 kg, 45 kg, 67.5 kg, 190 kg工况的轴承内圈故障和外圈故障数据，采用同4.1节的数据预处理方式处理轴承原始振动数据，并将不同负载下包含正常状态、外圈故障和内圈故障的数据分别组成样本集A, B, C和D。不同负载下MFPT数据库的迁移实验任务构成如表5所示。

表 5 迁移任务构成 (MFPT数据库)

迁移任务	源域样本集	目标域样本集	源域样本数 (个)	目标域样本数 (个)	总样本数 (个)
A_C	A	C	180	180	360
A_CD	A	C D	180	360	540
D_ABC	D	A B C	180	540	720
CD_B	C D	B	360	180	540
AB_CD	A B	C D	360	360	720
ACD_B	A C D	B	540	180	720

下载: 导出CSV

| 显示表格

根据表5构造源域样本集和目标域样本集，不同迁移任务分别进行5次实验，取测试准确率和训练时间的平均值作为每个迁移任务的实验结果，如图8所示。由图8可见，所提方法实现6组迁移任务的平均测试准确率均接近100.0%。图8中训练时间由两部分组成：预训练模型建立时间和目标域网络微调时间，CWRU数据集的平均训练时间35.1 s, MFPT数据库的平均训练时间同样不超过40 s。MFPT数据库实验进一步验证了所提方法可以在较短的时间内建立分类模型，同时以良好的分类准确率实现不同负载下滚动轴承的故障诊断，具有良好的泛化性能。

图 8 迁移实验结果 (MFPT数据库)

下载: 全尺寸图片幻灯片

为进一步验证所提方法各部分改进的作用，基于MFPT数据库进行消融实验，实验结果得出过程类比4.2.2节，实验结果如图9所示。图9中方案a、方案b和方案c表示的消融模块与4.2.2节顺序对应。由图9可见，虽然所提方法的训练时间多于其他方案，但所提方法的测试准确率最高，说明本文所提出的各部分改进方式有助于提高不同负载下滚动轴承故障诊断准确率。

图 9 所提方法改进前后对比实验结果 (MFPT数据库)

下载: 全尺寸图片幻灯片

为进一步验证所提方法相比其他方法的有效性，基于MFPT数据库，将所提方法与CNN, LSTM, BPNN, DBN^[17], 文献[18]和文献[19]的实验结果进行对比分析，结果如表6所示，具体的计算过程同4.2.3节。由表6可见，相比其他几种方法，所提方法在解决不同负载下滚动轴承故障诊断问题时的训练时间更少，且平均分类准确率达到了99.4%，进一步证明了所提方法相比其他方法可快速建立模型并获得良好准确率。

表 6 所提方法与其他方法的对比实验结果 (MFPT数据库)

方法	平均训练时间 (s)	平均测试准确率 (%)
CNN	71.6	90.8
LSTM	57.8	90.0
BPNN	135.1	93.7
DBN^[17]	565.7	89.7
文献[18]	1076.4	99.1
文献[19]	105.6	100.0
所提方法	30.0	99.4

下载: 导出CSV

| 显示表格

5. 结束语

(1) 本文提出一种改进BLS网络的方法，所提改进方法按循环方式建立增强节点窗口，横向扩展了BLS网络增强层，并在增强层引入Maxout激活函数，提升了BLS网络的特征提取能力。与BLS网络相比，改进后的BLS网络在文中两个数据集上对不同负载下滚动轴承状态的平均分类准确率提升了2.5%；

(2) 提出一种新的模型迁移学习网络，将改进后的BLS网络与迁移学习结合，形成改进宽度模型迁移学习网络，采用迁移方法后，所提网络在文中两个数据集上的平均分类准确率提升了4.7%，可以有效解决不同负载下滚动轴承的源域数据和目标域数据分布差异较大问题；

(3) 基于所提改进宽度模型迁移学习网络的参数少的特点，借助GA优化网络节点结构，从可视化的角度验证引入GA算法可以提高网络的泛化性能；

(4) 与文中其他方法相比，所提方法的训练时间更少，在文中两个数据集上以平均训练时间32.6 s快速建立分类模型，其建立模型的效率是其他方法的1.7～39.9倍，并以平均分类准确率98.9%实现不同负载下滚动轴承故障诊断。

下一步工作将继续深入研究宽度学习结合迁移学习的方法，同时获取更多的滚动轴承振动数据，进一步探究不同型号滚动轴承状态之间的知识快速迁移问题。

J. Dresner, D. J. Szostak and B. Goldstein, Appl. Phys. Lett., 38(1981), 998.[3]A. R. Moore, Appl. Phys. Lett., 40(1982), 403.[7]R. O. Bell, Appl. Phys. Lett., 36(1980), 936.

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板