基于小波神经网络的与文本无关说话人识别方法研究

白莹; 赵振东; 戚银城; 王斌; 郭建勇

摘要: 基于神经网络的说话人识别方法可以在一定程度上模仿人脑的功能，是说话人识别中的一种主要技术，但它通常难以确定隐层单元的数目，收敛速度慢，易于收敛到极小点。该文研究了一种用于说话人识别的小波神经网络模型，给出了网络结构和学习算法。采用Mel频率倒谱系数作为与文本无关的说话人识别的特征参数，并利用该模型进行了5个人的说话人识别实验，得到99.5%的识别率。实验结果表明，小波网络和传统的BP网络相比，训练速度和识别率都有了较大提高，具有良好的应用前景和进一步研究的价值。

关键词:

说话人识别;小波神经网络;BP网络;Mel频率倒谱系数

Abstract: The approach for speaker recognition based on neural networks is able to emulate the function of human brain in some degree, so it is a main implementation technology in the speaker recognition. But it is difficult to determine the number of hidden layer neurons, slowly convergent and easy to fall into local minimum point. The model of wavelet neural networks is studied. The structure of the network and learning algorithm are given. The recognition correctness reaches to 99.5% for 5 speakers using Mel frequency cepstral coefficient as feature parameters. The experimental at results show that the learning rate and recognition correctness are improved much compared to the BP networks. It has a good application prospect and worth to research further more.

1. 引言

在国民经济快速发展的背景下，电力需求不断增长，电网规模急速扩大，电网行业逐步加强对电力设备安全稳定运行的管控。电力设备存在的隐患、故障等极易引起“链式反应”致使电网瘫痪，从源头波及社会有序发展。近年来，电力设备缺陷引发的事故再一次敲响了警钟。2019年山东某1000 kV变电站发生电力设备爆炸^[1]；2020年云南某水电站发生电力设备爆燃^[2]。这些事故导致了不同程度的人员伤亡及经济损失。通过视频图像智能巡检技术对关键电力设备运行状态进行高频率的监控与分析，精准预测故障隐患，及时发现电力设备异常状态，是保障电网安全的有效手段。

随着智能电网的规模化发展，机器人、无人机和固定摄像头等巡检设备在电网中广泛应用，应运而生的海量巡检视频带来了人工复核效率低、缺陷检测准确率低、成本日益增加等问题。同时，电力设备的异常状态呈现种类多样、形态多变、异常交互关联、样本过少、数据分散等特点，对其进行智能分析具有一定的难度。在此背景下，传统图像处理方法与基于深度学习的图像处理方法逐渐应用于智能电网领域中。

视频图像是电力设备监测最直接、最安全的手段。全国超80%的变电站配备了视频监控设备，其监视对象覆盖了90%以上的设备区域，产生了海量视频图像。以浙江某110 kV变电站为例，全站覆盖80个高清摄像头，视频存储量巨大。我国35 kV及以上等级的变电站约43441座，其中浙江省110 kV及以上等级变电站约1300座，可见，全国电网中仅变电站产生的视频量就庞大无比。然而，基于视频图像的电力设备异常状态检测研究尚处于起步阶段，大部分检测任务仍需人工对海量视频进行判断、提取和筛选^[3]。目前，对于输变电设备的巡检视频图像处理仍存在以下问题：(1)视频数量大，存储困难，大量数据未能被有效利用；(2)人工查看设备异常状况的技能水平参差不齐，平均检测速度慢，效率低；(3)过多的视频巡检任务容易引发工作人员的视觉疲劳，从而导致缺陷漏检、误检或故障发现不及时等问题。随着视频图像处理技术的不断发展，上述问题得到了有效解决^[4]。本文的主要贡献可概括为以下4点：

(1)列举了输变电智能巡检过程中重点关注的设备缺陷类型及当前人工巡检方式的人力消耗。

(2)总结了基于视频图像的输变电设备外部缺陷检测技术及其应用现状。通过典型设备缺陷检测技术的对比，分析了传统图像处理方法与基于深度学习方法的优劣。

(3)分析了当前图像算法开发平台在输变电巡检领域应用的现状，总结了智能电网推动过程中输变电智能巡检系统开发及应用情况。

(4)指出了图像处理技术在输变电设备巡检领域应用存在的问题，阐述了未来研究方向。

2. 输变电设备外部缺陷种类及巡检方式

在基于视频图像的电网安全运行巡检过程中，主要关注的输变电设备缺陷可分为设备损坏和状态异常两类。表1列举了输变电场景中典型设备的缺陷类型。其中，设备破损包括设备外壳破损、渗漏油、金属锈蚀等能够从外部直接观测到的缺陷。状态异常包括设备读数异常、油位计读数异常等，此类缺陷检测需要首先获取状态读数，再对读数进行分析计算，探查设备运行状态。综上，本文所述的基于视频图像的设备缺陷检测技术主要针对表1所列举出的缺陷类型，通过外观变化判断、状态读数识别等手段，实现输变电设备的智能巡检。

表 1 输变电设备外部缺陷示例

设备	部件	缺陷
变压器电抗器	本体	渗漏油，金属锈蚀，油位计破损，部件外观变形，呼吸器破损，硅胶变色，油位、表计读数异常
	端子箱	箱门闭合异常，金属锈蚀
	套管	渗漏油、油位计破损、绝缘子破损、表面污秽、油位异常
	冷却系统	渗漏油，金属锈蚀，部件外观变形，表面污秽
	分接开关	渗漏油，金属锈蚀，油位计破损，呼吸器破损，硅胶变色，油位异常
	构架及基础	金属锈蚀，异物
断路器	本体	异物悬挂，金属锈蚀，套管破损，渗漏油，分合闸指示破损，油位计破损，表面污秽，部件外观变形，呼吸器破损，硅胶变色，分合闸指示状态异常，油位状态异常，表计读数异常
断路器	操作机构	金属锈蚀，渗漏油，油位计破损，箱门闭合异常，部件外观变形，表计读数异常
隔离开关和接地开关	本体	异物悬挂，分合闸指示破损，瓷柱破损，支柱绝缘子破损，金属锈蚀，部件外观变形，表面污秽，分合闸指示状态异常
隔离开关和接地开关	操作机构	异物悬挂，金属锈蚀，部件外观变形，箱门闭合异常
母线	母线导体	异物悬挂，金属锈蚀，导线破损，部件外观变形，
	引流线	异物悬挂，导线破损，表面污秽
	绝缘子串	异物悬挂，绝缘子破损，表面污秽
	支柱绝缘子，构架及基础	异物悬挂，伞裙破损，金属锈蚀，表面污秽，外观变形
	母线绝缘子	异物悬挂，瓷瓶破损，金属锈蚀，表面污秽
输电线路	绝缘子	金属锈蚀，污秽，均压环损伤，均压环脱落，均压环位移
输电线路	杆塔	螺栓缺失，塔身锈蚀，异物

下载: 导出CSV

| 显示表格

当前，基于视频图像的变电站巡检任务通过调用固定摄像头、巡检机器人等方式采集变电站运行过程中的视频图像。输电设备巡检任务则通过人工拍摄及无人机拍摄等方式采集视频图像。采集到的输变电设备图像数据主要依靠人工筛查的方式检测输变电设备缺陷，具有准确度高、故障发现及时的优点，却耗费了大量人力资源。以浙江某110 kV变电站每天产生的数据量为例，按照每人0.25 fps的速度进行筛查，完成全部筛查任务需要1000工时(单人)以上，这种程度的人力消耗远超出站内运维承受能力。此外，输电设备巡检环境复杂，图像的采集与分析受环境影响较大，人工拍摄困难，无法满足缺陷检测的实时性要求。在新一代智能电网、无人值守变电站等发展需求下，利用智能视频图像算法筛查设备缺陷成为无人变电站、输电设备智能巡检领域的研究热点。

3. 输变电设备外部缺陷检测

3.1 图像处理任务

图像处理旨在利用计算机从视频图像中获取高级、抽象的信息。在输变电设备外部缺陷巡检任务中，主要涉及图像处理任务中个重要分支：图像分类、目标检测和图像分割。

3.1.1 图像分类

图像分类任务通过获取输入图像的特征，判断拍摄内容的具体类别。在输变电设备外部缺陷检测任务中，图像分类方法多用于判断所拍摄图像中的设备外观是否有明显破损或是否处于异常状态。

传统的图像分类方法包含贝叶斯法^[5]、费希尔(Fisher)分类器^[6]、支持向量机^[7]、提升方法(Boosting)^[8]等。这些方法的分类理论相对完善，但对图像内部语义信息提取能力较差，准确率有待提高。基于神经网络的图像分类方法通过构建神经元连接的网络结构，在训练中获取图像内部特征，完成分类任务。早期的神经网络主要有反向传播(Back Propagation, BP)网络、霍普菲尔德(Hopfield)神经网络与自适应共振理论(Adaptive Resonance Theory, ART)等。此类网络虽然结构简单、训练方便、拟合能力强，但存在学习速度慢、容易陷入局部极值以及梯度消失或梯度爆炸等问题。近年来，深度神经网络在图像分类任务表现优异。2107年，Krizhevsky等人^[9]提出的深度卷积神经网络提升了神经网络在分类任务中的准确率。残差网络(Resnet)、挤压激励网络(Senet)等在网络结构设计上实现模型架构的优化^[10,11]。与传统机器学习相比，深度神经网络模型利用训练好的模型，采用端到端的方式将特征提取与分类目标结合在一起，学习能力较强。然而，基于深度学习的图像分类方法存在模型正确性验证复杂、模型训练依赖大量样本、计算量大等问题。

3.1.2 目标检测

目标检测通过模型定位图像中的所有目标并判断其类别。该任务可以在输变电设备监控图像中自动框定设备区域或搜寻设备异常发生的位置，实现智能故障检测。

传统的目标检测算法包括基于方向梯度直方图(Histogram of Oriented Gradients, HOG)的检测算法、可变形组件模型(Deformable Part Model, DPM)算法等。基于深度学习的检测算法包括，区域卷积神经网络(Region-based Convolutional Neural Network, RCNN)^[12]、快速区域卷积神经网络(Faster RCNN)算法等^[13]。此外，为加快网络运行，研究者又提出了以SSD^[14]和YOLO^[15]为代表的1阶段检测器。近年来，无锚(Anchor-Free)算法成为新的热点，主要包括DenseBox^[16], CornerNet^[17], ExtremeNet^[18], FSAF^[19], FCOS^[20]和FoveaBox^[21]等。深度学习模型的不断完善，提升了目标检测任务的准确率，加速了技术落地应用。

3.1.3 图像分割

图像分割任务对目标图像的密集像素进行预测，实现像素的标记和分类。在输变电设备监控图像中，图像分割主要用于自动分割出设备所在区域，为后续异常判断提供精准轮廓与像素级类别信息。

传统的图像分割方法包括基于阈值的分割方法^[22]，基于边缘的分割方法^[23]，基于区域生长的分割方法^[24]，基于聚类的图像分割方法^[25]，基于图论的分割方法等^[26]。传统图像分割方法流程简单，重点关注像素变化中的边界信息，但缺少对图像中语义信息的关注。基于深度学习的图像分割方法对关注区域的像素进行特征提取与分析，利用轮廓信息及语义信息进行分类，实现目标分割。代表性方法包括：多尺度图像区块提取法^[27]，基于循环神经网络的图像区块预测法^[28]，全卷积神经网络FCN^[29]，Deeplab^[30]系列等。上述方法虽然能够更加高效地提取图像中的语义特征，却存在计算量大、效率低、训练困难等缺点。

3.2 基于视频图像的电力设备缺陷检测方法

电力设备运行环境复杂，种类众多，动态过程快。输变电设备故障严重影响社会稳定和经济发展。近年来，输变电设备视频图像的异常检测成为新的研究热点，现有研究方法主要有：

(1) 基于传统图像处理算法的电力设备缺陷检测方法。结合电力设备的形态、特征分布等信息，识别设备状态，从而判断异常。

(2) 基于深度学习的电力设备缺陷检测方法。根据已有数据集对神经网络进行训练，训练所得模型能够识别输变电设备的运行状态，及时检测设备缺陷。

3.2.1 基于传统图像处理算法的输变电设备缺陷检测

传统图像处理算法能够识别设备特征，根据特征差异性进行异常状态判断。这一类方法依赖人工设计，难以应对复杂多变的场景，识别准确率较差，但对硬件设备与样本量要求较低，算法流程易于实现。本章列举了5种基于传统图像处理算法的输变电设备缺陷检测的典型应用场景。

(1)隔离开关。在输变电设备巡检任务中，需要判断隔离开关的开、合及闭合不到位等状态，如图1中第1列所示。当前方法包括：基于局部区域的设备边缘检测方法^[31]，基于尺度不变特征变换、霍夫变换和K临近算法的检测方法^[32]，基于霍夫森林的检测方法^[33]等。该类方法在图像拍摄质量较好时，具有较高的检测准确率，但由于隔离开关运行环境复杂多变，噪声干扰严重，现有方法主要实现了分、合两个状态的自动识别，而对于临界状态的识别准确率较低。

图 1 输变电设备缺陷检测典型应用场景

下载: 全尺寸图片幻灯片

(2)绝缘子破损。绝缘子破损检测是输变电巡检领域中最为重要的任务之一，视频图像巡检技术能够提高巡检频率及效率。郭威等人^[34]利用Canny算子提取到的绝缘子轮廓信息标记绝缘子位置判定绝缘子是否缺失；李浩然等人^[35]利用改进的Canny算子检测绝缘子裂纹，优化了航拍绝缘子裂纹检测结果；严宇等人^[36]提出了基于霍夫变换的绝缘子视觉检测方法。绝缘子破损特征明显，识别准确率较好。

(3)指针式仪表。仪表读数识别任务的重点在于识别仪表指针与仪表刻度，如图1中第3列图像所示。考虑到仪表指针呈直线的特点，大部分方法采用霍夫变换获取指针的方向和位置，从而获取仪表读数^[37]。仪表刻度识别主要包括模版匹配、多阶段刻度识别等方法。文献[38]利用预先构建的双针仪表设备图像模板及尺度不变特征变换算法识别仪表读数；文献[39]首先粗识别出表盘刻度候选区域，再细识别精准定位刻度。上述方法在指针数量较少、表盘刻度均匀且图像拍摄质量较好时，具有较高的准确率，但每种算法只能应对一种表盘或指针类型的仪表，难以适应变电站内表计种类复杂的环境。

(4)输电线路。输电线路巡检任务通过无人机等对线路上的输电设备进行图像采集，并完成缺陷检测，所拍摄图像如图1第4列所示。文献[40]通过建立图像样本库及提取图像梯度直方图(Histogram of Oriented Gradients, HOG)特征的方法，检测输电线路螺栓缺陷；文献[41]利用超像素图像分割技术，对变电设备红外图像进行分割，提取发热故障区域。上述传统分类方法的识别准确率依赖于现场拍摄设备及拍摄条件，算法识别精度难以进一步提升。

(5)温度检测。输变电设备温度检测任务可分为目标设备定位与温度分析。设备在红外监控图像中的自动定位通过图像处理方法实现。现有的解决方案有：杨洋^[42]提出基于Canny边缘特征提取与k-means聚类的目标设备区域检测方法；郭文诚等人^[43]针对设备图像倾斜、缩放等问题，采用具有旋转与缩放不变性的Zernike矩阵作为待识别设备的特征，并使用支持向量机进行设备分类与识别；冯振新等人^[44]针对目标边界模糊、区域灰度变化等问题，结合灰度相似度聚类与阈值分割机制，快速分割相似像素，获取红外故障区域。传统的温度检测方法测温精度高、灵敏度强，但存在测温区域边界模糊等问题。

3.2.2 基于传统图像处理算法的输变电设备缺陷检测

基于深度学习的缺陷检测方法利用电力设备缺陷样本训练神经网络模型，使模型能够学习到样本特征并应对不同的背景环境。总体来说，这一类方法的主要步骤为：(1) 设计基于深度学习的网络模型结构。(2) 制作数据集，收集并标注待检测的电力设备缺陷图像。(3) 利用标注好的图像训练网络模型，保存最优模型参数。(4) 使用最优网络模型进行设备缺陷检测。基于深度学习算法的输变电设备缺陷检测典型应用场景如下：

(1) 隔离开关。主要通过深度网络模型识别隔离开关当前状态。文献[45]通过融合非下采样轮廓波变换(Contourlet)和2维最大熵分割方法，完成闸刀位置的自动识别。文献[46]利用深度卷积对抗网络识别开关状态，实现隔离开关状态的“双确认”。此外，文献[47]针对隔离开关故障类型和故障发生位置难以被有效识别的问题，利用ReliefF算法优化隔离开关多路特征，并使用BP网络进行融合决策。然而，算法准确率过分依赖样本数据量。

(2) 绝缘子破损。通过神经网络模型定位绝缘子并判断是否发生破损。唐小煜等人^[48]利用目标检测与图像分割算法综合判断绝缘子缺陷；朱明州等人^[49]利用改进的目标检测算法对绝缘子进行检测；王道累等人^[50]提出了改进生成对抗网络，完成玻璃绝缘子自爆缺陷检测。相比于其他类型的输变电设备缺陷，绝缘子破损特征较为明显，深度学习模型能够较好地提取特征，具有较好的检测准确率。

(3) 指针式仪表。此类任务主要通过深度模型获取仪表刻度与指针位置。例如，文献[51]通过卷积神经网络与文本检测器获取表盘刻度位置与数值信息，并通过位置信息定位指针位置。文献[52]通过目标检测算法Faster RCNN确定表盘位置及表计种类，通过图像分割算法U-Net获取表盘刻度及指针位置，获取表计读数。相比于传统方法，同一深度学习算法模型能够适应不同种类的表计，鲁棒性较强，但也存在训练所需数据量大、识别效果受限于样本质量等问题。

(4) 输电线路。主要通过目标检测模型对输电线路上的设备缺陷进行自动识别。例如，文献[53]利用YOLO-v3网络对输电线路防震锤和线夹进行检测；文献[54]设计输电线路典型缺陷图像智能解译模型，获取线路上的缺陷位置；文献[55]通过Faster RCNN检测器在无人机巡检过程中自动识别输电线路杆塔关键结构。输电线路设备缺陷的智能识别是电力领域应用较为成熟的一个方向，但仍存在缺陷样本少、识别率较低等问题。

(5) 温度检测。温度检测任务的重点在于通过识别算法自动框定监控画面中待测温区域。例如，文献[56]采用Faster RCNN算法实现对红外图像发热故障区域的检测；文献[57]利用目标检测算法对变电设备进行精准定位，再通过温度阈值判别法对设备区域进行过热缺陷判定。上述方法均采用非接触式方式实现设备温度的实时监测，算法准确率过分依赖数据集。

相比于传统方法，基于深度学习的图像处理方法在输变电设备外观缺陷检测中具有不依赖人工经验，智能化程度高，鲁棒性强，算法精度较高等优点。然而，网络模型的优化依赖大量训练数据，而实际的电力场景中，缺陷图像的数量无法满足网络模型的训练需求，难以发挥深度学习算法的优势。

综上所述，基于视频图像的电力设备缺陷检测技术虽然发展迅速，但仍然难以应对复杂的电力场景。

目前，该技术存在以下问题：

(1) 输变电设备公开数据集较少，论文中算法大多是在各自未开源的数据集上测试。算法准确率缺少统一的衡量标准，难以进行横向比较。

(2) 对于电网内部已有的数据集来说，输变电设备异常状态出现频率低，缺陷数据集正负样本数据严重不平衡。变电站内长期积累的数据未能有效整理，数据资源浪费严重。

(3) 电力设备种类多、拍摄环境背景复杂，电力异常状态的结构与形状随机性大，现有算法大都针对某种特殊设备或特殊场景进行开发和定制，泛化能力有限，给实际应用和推广带来了诸多困难。

4. 图像处理平台与缺陷检测系统

4.1 图像算法训练平台

输变电智能巡检领域的图像处理算法开发专业壁垒高，算法模型的设计与优化依赖专业技术人员，导致输变电现场模型迭代更新不及时。随着图像处理技术的发展，集成多种算法模型的图像算法训练平台逐步兴起，为研究者提供了便捷的学习平台与开发工具，为电力领域工作人员设计、修改、更新图像处理模型提供了可能。

目前，图像算法训练平台主要有微软公司开发的计算机视觉开源云计算平台CustomVision.AI^[58]、谷歌公司开发的Cloud AutoML^[59]、图森未来的SimpleDet^[60]、 Facebook AI研究院开发的Detectron2^[61]、商汤科技与香港中文大学开源的mmDetection^[62]以及百度公司开源的PaddlePaddle^[63]平台。以上平台可分为两类：

(1) 商业开发的图像处理平台，以微软CustomVision.AI、谷歌Cloud AutoML为代表，主要为工业场景下的图像处理问题提供企业级付费服务，存在价格高、源代码不开源、支持模型种类有限等缺点。

(2) 开源的图像处理平台，以SimpleDet, Detectron2, mmDetection 和PaddlePaddle为代表，这些平台侧重学术研究，支持源代码开源，是面向专业开发者的深度学习算法模型工具箱。

微软CustomVision.AI支持用户通过平台创建神经网络模型并进行训练。训练好的模型可直接导出到移动设备端运行，然而，该平台不支持数据在线标注功能。谷歌Cloud AutoML平台支持人脸、标牌、地标识别等任务，支持用户人工标注，但不支持代码导出及离线使用功能。SimpleDet集成了目标检测与物体识别模型，主要有Faster RCNN, Mask RCNN^[64], Cascade RCNN^[65], RetinaNet^[66], Knowledge Distillation^[67]等。mmDetection由香港中文大学开发，支持当前业内先进的目标检测算法，如Faster RCNN, Mask RCNN, R-FCN, Cascade RCNN, SSD和RetinaNet等。该开源库集成了训练、测试、模型权重下载等功能。

PaddlePaddle深度学习平台，包含图像分类、目标检测、图像分割以及文字识别等模块，提供了模型压缩及部署功能。然而，该平台缺乏上层封装，电力行业人员使用困难。总体来说，mmDetection, SimpleDet和Detectron2是面向计算机视觉专业开发者的工具，训练时缺少简单便捷的人机交互功能，缺少数据预处理、标注和模型部署等功能。

综上所述，现有的通用图像算法训练平台虽然能够提供模型训练功能，但使用群体仍然局限于图像专业技术开发人员，平台开发的模型难以直接移植至电力领域，其面临的困难主要有：(1) 目前的算法训练平台环境配置各不相同、代码缺少封装，对于非专业人士应用壁垒较高；(2) 现有平台缺乏数据标注、预处理及数据集构建功能，无法解决电力行业现有大量视频数据未能有效利用的问题；(3) 现有平台缺少模型评测及部署功能，不同模型间缺少横向对比，无法有效判断算法水平，制约了算法开发进程。

4.2 基于视频图像的输变电设备缺陷检测系统

在智能电网发展过程中，视频图像是最为重要的辅助监控方法之一。目前，基于视频图像的输变电设备缺陷检测平台主要以变电站为建设核心，通过调用变电站内安装的摄像头及巡检机器人等拍摄设备，建立基于视频图像的电力设备缺陷检测体系，构建变电站智能巡检系统等。此外，在室外环境下，以无人机、巡检机器人作为主要图像采集设备，构建相应的输电设备巡检系统。

输变电设备缺陷检测系统主要是通过将变电站内不同位置的监控图像集成到平台中，利用智能分析算法，协助站内工作人员在监控端对站内设备运行状态进行监控、查看及缺陷自动检测。平台中嵌入的电力设备缺陷检测算法，包括基于传统图像理论与基于机器学习的图像处理方法，如1.2节所述内容。

然而，基于视频图像的电力设备缺陷检测平台仍存在众多不足之处。王勋等人^[68]认为当前的智能巡检系统标准化不足，智能化程度差，误报率高，各厂家开发的平台智能化水平良莠不齐。严太山等人^[69]认为目前的缺陷检测平台没有充分发挥现有视频技术的作用，智能化程度不足且与电网业务相对孤立。张海华等人^[70]认为目前变电站智能巡检系统建立过程中存在数据冗余、效率低、巡检范围有限等问题。

综上所述，目前的电力设备缺陷检测平台在界面设计、视频监控、信息传输等方面已相对成熟，但在功能模块、智能化程度以及与电网行业要求匹配程度方面仍存在以下不足：

(1) 目前的系统重点关注实时监测、监控和远程报警等与电网运行密切相关的辅助功能，设备缺陷的精细定位及可视化能力有限。

(2) 监控对象及监控任务细化和覆盖面不够，与电力行业的结合度低，准确率提升困难。

(3) 目前系统仍需要人工辅助检查，缺乏设备缺陷的深入分析及预警功能。

5. 总结与展望

5.1 问题分析

本文对输变电智能巡检领域中的图像处理技术、电力设备缺陷检测算法、图像处理算法训练平台及智能巡检系统进行了综述，对比并总结了现有方法的优缺点。综上所述，当前基于视频图像的输变电设备缺陷检测技术及平台虽发展迅速，依然有以下问题待解决：

(1)有效数据匮乏。海量输变电巡检视频图像样本数据标注、清洗及预处理能力亟待提升。近年来，输变电视频图像巡检领域积累了大量数据，而电力视频数据统一管理机制尚属空白，数据资源浪费严重，数据价值无法体现。针对不同的设备缺陷，其标注及管理方法不尽相同。设备及缺陷类别标注通常需要电力行业专业知识，开源的图像标注平台无法满足电力高质量、高效率标注及安全保密管理需求。此外，输变电设备缺陷样本数据少，目前大部分图像数据是设备运行正常数据，样本数据不均衡影响着检测模型的泛化能力。

(2)模型鲁棒性差、迭代优化慢。目前，基于视频图像的输变电设备缺陷检测模型智能化水平有待提高。现有缺陷检测模型大多针对某种特殊设备开发，泛化能力有限。并且输变电设备种类多，异常结构与形状随机性大，同一算法在不同视频图像拍摄环境中表现不稳定，鲁棒性较差，远不能满足大规模应用的要求。此外，电力行业中图像专业技术人员缺乏，模型迭代更新速度无法满足实用要求，模型运行过程中积累的误差数据很难得到再利用，模型长时间运行效果差。

(3)模型评价标准缺失。为提高设备缺陷检测模型在实际场景应用的有效性，对模型的标准客观评价体系不可或缺。目前的评价体系多从计算机视觉领域出发，重点关注模型的准确率，未能从设备场景、缺陷严重等级、任务难度、漏检率、误报率等电力业务角度设计评价体系。另外，由于公开的输变电领域有效图像数据较少，算法模型间无法衡量比较，模型在电力现场的应用效果更是无法验证。

综上，电力设备运维图像的智能处理技术仍将是下一步的研究热点，其技术水平将对电网智能化进程的推进起到极大的支撑作用。

5.2 未来工作展望

5.2.1 数据集构建

如上所述，基于视频图像处理技术的输变电设备缺陷检测算法的开发，依赖输变电设备图像数据的数量、质量。目前电力系统内虽已存储海量监控数据，但其整理、筛选、标注仍然面临巨大挑战。因此，输变电设备缺陷标准化数据集的构建将是未来智能巡检、无人值守变电站发展的重要基础。数据集的构建需要有针对性地面向不同电力任务场景，在数据标注时结合电力行业专业知识，将专家信息融入到数据标注中，为后续算法开发提供数据基础。在技术方面，重点开发样本自动标注技术，解决海量数据标注耗时耗力的问题。另外，为解决缺陷样本均衡问题，研究针对输变电设备缺陷检测的半监督学习、小样本学习及样本扩充技术。

5.2.2 算法定制开发与综合应用

如表2所示，传统图像处理方法与深度学习方法在处理输变电领域图像任务时优缺点明显。实际应用时，受现场条件、计算资源、拍摄角度、任务需求等约束，算法开发可综合利用传统图像处理方法与深度学习方法，并融合电力专业知识。一般来说，传统方法对于图像内像素信息具有准确的边、线提取能力，深度学习方法对于图像内部语义信息的挖掘更具有优势。同一任务中，使用不同的图像信息能够更加高效地实现目标。

表 2 基于视频图像的输变电设备缺陷检测算法对比

任务	方法	优点	缺点
隔离开关	传统方法	能够实现分、合状态的自动识别	临界状态的识别准确率较低
隔离开关	深度学习方法	分、合、不到位3种状态识别准确	算法准确率依赖样本数据量
绝缘子破损	传统方法	模型简单，常规巡检准确率高	复杂拍摄背景下误差高
绝缘子破损	深度学习方法	在复杂拍摄背景下算法表现较好	训练需大量绝缘子破损图像数据
指针式仪表	传统方法	在指针数量较少、表盘刻度均匀且图像质量好时，具有较高的准确率	每种算法对应一种仪表，鲁棒性差
指针式仪表	深度学习方法	同一个模型对应多种仪表，鲁棒性较强	训练所需数据量大
输电线路	传统方法	算法准确率较高	算法效果过分依赖拍摄清晰度
输电线路	深度学习方法	算法成熟，同一模型对应多种缺陷	缺陷样本数据获取困难
温度检测	传统方法	测温精度及灵敏度高	测温区域边界模糊等问题
温度检测	深度学习方法	测温区域自动标定，边帧界清晰	红外数据集少，获取困难

下载: 导出CSV

| 显示表格

此外，基于视频图像的输变电设备缺陷检测算法应结合电力现场需求进行定制开发，脱离电力任务的开发方式将会出现算法能力冗余或精确度不足等问题。算法模型应涵盖不同输变电巡检专家知识，提高模型实用性。

在对算法进行评价时，除利用标准输变电数据集进行评估外，还要构建服务器数据集测试与现场应用联合测试机制，将实用性、新环境场景适应性、算法提升潜力纳入算法评估机制中。

5.2.3 基于视频图像的多维度智能训练及管控平台研制

目前的变电站智能巡检系统、机器人巡检系统、无人机巡检系统等大多功能单一，算法准确率低，智能化程度不足，资源浪费严重。此外，现有巡检系统大多不支持算法训练与更新功能，电力行业人员无法在发现问题时自行对算法模型进行优化调整，智能巡检系统运行过程中积累的大量数据未能被有效利用。

总体来说，应建立基于视频图像的多维度智能训练及管控平台，将固定摄像头、巡检机器人及未来应用更广的无人机等融入到平台中，从数据采集与管理、部署框架统一、模型算法训练与优化、现场巡检系统匹配与应用、分布式计算与模型下发等方面来构建平台，注重日常使用过程中的图像分类收集、标注及模型更新迭代，提升电力运维智能化水平。

Zhang Qinhua, Benveniste Al. Wavelet networks[J].IEEE Trans. on Neural Networks.1992, 3(6):889-[2]Szu H, Telfer B, Kadambe S. Neural network adaptive wavelets for signal representation and classification. Optical Engineering, 1992, 31(9)：907.1016.[3]彭玉华. 小波变换与工程应用. 北京: 科学出版社, 2002：7.8[4]Zhang J, Walter G. Wavelet neural networks for function learning[J].IEEE Trans. on Signal Processing.1995, 43(6):1485-[5]李卫斌, 刘芳.小波神经网络的构造. 模式识别与人工智能，2003, 16(4)：403.406.[6]焦李成. 神经网络的应用与实现. 西安：西安电子科技大学出版社, 1996, 第一章.[7]Yoshihiro Yamamoto, Nikiforuk P N. A new supervised learning algorithm for multilayered and inter-connected neural networks[J].IEEE Trans. on Neural Network.2000,11(1):36-[8]李金平，王风涛，杨波. BP小波神经网络快速学习算法研究. 系统工程与电子技术，2001, 23(8)：72.75.[9]赵学智，邹春华，陈统坚. 小波神经网络的参数初始化研究. 华南理工大学学报(自然科学版), 2003, 31 (2)：77.80.[10]Lamel L F, Kessel R H, Seneff S. Speech database development :Design and analysis of the acoustic-phonetic corpus. Proc.Speech Recognition Workshop(DARPA), 1986: 100.109.[11]甄斌，吴玺宏，刘志敏. 语音识别和说话人识别中各倒谱分量的相对重要性. 北京大学学报, 2001, 37(3): 371.378.

期刊类型引用(5)

1.	何宽，郁滨. ZigBee网络按需干扰攻击检测方案. 电子测量与仪器学报. 2019(01): 128-134 . 百度学术
2.	周伟伟，郁滨. WSNs多阶段入侵检测博弈最优策略研究. 电子与信息学报. 2018(01): 63-71 . 本站查看
3.	周伟伟，郁滨. 基于不等簇半径和动态簇头的WSN能量空洞攻击抑制模型研究. 通信学报. 2017(11): 93-102 . 百度学术
4.	郁滨，黄美根，黄一才，孔志印. ZigBee网络抵御Sybil攻击的自适应链路指纹认证方案. 电子与信息学报. 2016(10): 2627-2632 . 本站查看
5.	陈长庆，魏波. 网络光纤通信中的噪声干扰去除方法研究. 计算机仿真. 2016(10): 166-169+182 . 百度学术

其他类型引用(4)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板