第1章绪论 1.1背景概述 随着工业现代化和科学技术的快速发展,机械装备系统日趋智能化、精密化和集成化,各种机械装备在航空航天、石油化工、海洋船舶、轨道交通、工业制造和国防军工领域发挥着重大作用。当前,世界各国都在大力发展高新技术制造业,德国的“工业4.0”、美国的“制造业回流”,以及我国的“中国制造2025”都旨在提升制造业智能化水平。其中,机电装备的投入是保障工业制造能力和水平的核心因素之一。 机电装备的长期使用、人为操作违规、零部件的磨损、疲劳损伤、维修不当等,会导致机电装备的健康状况出现异常,如果不能及时地发现装备存在的早期异常症状,一旦装备的健康状况持续恶化,就会轻则影响产品的质量或者武器装备的性能,重则造成机电装备系统的损坏,导致设备的停机或者武器的停射,甚至引起人员伤亡等灾难性事故。比如: 1985年大同二电厂2号机组联轴器螺栓断裂; 1988年秦岭发电厂200MW汽轮发电机5号机组主轴断裂毁机的特大事故,造成重大经济损失,严重影响华北和西北电网的运行; 1986年苏联切尔诺贝利核电站爆炸引起的历史上最严重的放射性物质泄漏核事故; 1998年从德国慕尼黑开往汉堡的城际特快列车(ICE)因双层钢轨的外圈产生疲劳裂纹故障而断裂引起脱轨,造成重大人员伤亡事故; 2016年伊朗塞姆南省两辆客运火车相撞,事故原因为低温引发的机械故障; 2016年阿联酋一架波音777在迪拜机场降落时起落架出现故障导致飞机起火。造成这些悲剧发生的主要原因是未能在机电装备出现异常时给出预警,未能在早期微弱故障发生后给出有效的诊断,未能在装备状态持续恶化阶段给出有效的解决方案,从而导致了严重的后果。为避免灾难性事故的发生,提高机电装备运行的安全可靠性,故障诊断技术迅速成为国内外工业界和学术界关注的热点,我国的《国家中长期科学和技术发展规划纲要(2006—2010)》[1]和《机械工程学科发展战略报告(2011—2020)》[2]也已将重大设备的运行可靠性、可维护性、故障诊断等技术的研究列为重要研究方向。 在现代工业设备中,机械装备的传动部件,如齿轮、轴承、轴等是压缩机、鼓风机、柴油机、风力电机、离心泵、汽轮机等机械的基本部件,其健康状态影响机械装备的运行状况。轴在传动系统中起着连接作用,若轴安装不当或者存在制造缺陷,将导致不对中、不平衡等问题,在长期的高负载高转速工况下,轴容易产生弯曲,甚至断裂,进而影响齿轮和轴承的正常运行; 轴承是主要的承重部件,通常工作环境较恶劣,一旦出现润滑不足、偏载或负载过大的情况,在长期运行条件下,轴承的内圈、外圈、滚动体及保持架会出现不同程度的磨损、裂纹、断裂等故障,导致轴承的失效; 齿轮在变负载、瞬时大载荷、润滑不良等情况下,容易出现齿面胶合、磨损、疲劳裂纹和断齿等故障。机电装备的维护检测修理手段已逐步经历了从故障后维修、周期性预防维修到基于装备状态的智能检修,在装备出现早期微弱异常状态时就能实施定位、跟踪评估,掌握当前时刻装备的运行状态,减少了以往通行的停机检修、拆机检修频次,避免了不必要的经济损失。 故障诊断技术已应用于大型机电装备的制造、使用全寿命周期过程,但在实际复杂环境的诊断评估上,误诊、漏诊仍有发生,故障诊断技术还有很大的发展空间。机电装备结构的集成性和复杂性增加了故障诊断的难度,在电气控制系统的故障诊断方面,由于故障机理较明晰,研究进展较迅速; 然而,在机械部件的故障诊断方面,由于多数故障的机理模糊不清,研究进展和突破较缓慢。在实际的工业和国防装备的诊断中,对机械诊断的需求非常迫切。当前,在诊断技术的发展中,基于模型驱动的故障诊断方法和基于数据驱动的故障诊断方法一直是研究的热点。基于模型驱动的故障诊断是通过建立机械结构的非线性动力学模型,研究故障机理及故障传播模式,这在理论上是一种非常有效的诊断方法,但是由于机械组成的复杂性,难以构建准确的模型方程,该方法在实际的故障诊断中应用有限,通用性不强。基于数据驱动的故障诊断不需要建立复杂的动力学模型,直接使用传感器采集装备的动态信号,利用信号处理技术和机器学习等方法评估装备的状态,通用性较强。2002年美国明尼苏达大学举办了IMF Hot Topics Workshop: DataDriven Control and Optimization研讨会; IEEE从2008年开始举办The IEEE International Workshop on Defect and DataDriven Testing,讨论基于数据的异常检测与故障诊断技术。然而,采用数据驱动的诊断方法也存在以下问题[3]: (1) 故障特征微弱。机械故障信号具有非线性、非平稳性、强噪声的特点,受信号传播途径、传感器位置、噪声影响,故障特征信息容易被淹没。 (2) 故障样本不完整、缺乏样本。受机械结构和传感器的限制,在机械中某些需要采集信号的位置不便安置传感器,导致采集的数据不完整。另外,由于以往不重视数据的价值,也导致收集装备的历史故障数据信息较少。 (3) 故障模式与故障原因模糊。机械运行中部件间的相互关联、相互耦合也使装备在故障时,同一故障模式对应多个故障原因,单个故障原因也可能生成多个故障模式,故障原因与故障模式间不是简单的一一对应关系,而是复杂的非线性映射关系。 由上述分析可知,研究精确有效的机械装备故障诊断方法是迫切需要解决的热点问题。本书拟基于智能诊断技术进行机械传动部件故障诊断与性能退化评估方法的研究,这对保持装备完好性、提高装备工作性能及可靠性具有十分重要的意义。 1.2智能诊断方法研究现状 1.2.1基于非平稳信号去噪的故障诊断方法 在机电装备运行过程中,装备表面的振动响应蕴含了丰富的运行状态信息,利用谱分析法提取采集的振动信号中的频谱成分,即能对传动部件的典型故障进行诊断。然而,由于装备运行中受到零部件的相互接触碰撞、电磁、振动等环境的影响,采集的振动信号中包含了有用信号、噪声及干扰成分。若噪声较强,有用信号容易被淹没,直接采用傅里叶变换或者希尔伯特包络解调等谱分析方法难以进行准确的诊断。因此,采用去噪方法减弱噪声和干扰成分,提高信噪比,才能更准确地提取微弱故障特征频率。信号去噪方法可分为线性去噪方法和非线性去噪方法。线性去噪方法主要是通过设计滤波器(低通、高通、带通等)滤去信号频谱中多余的成分,保留有用的成分,但基于滤波器的信号去噪方法主要适用于单一信号及平稳性信号,而机电装备故障振动信号的时频特性随时间变化,具有非平稳性和非线性,由于噪声与故障信号具有相似的宽谱特性,并在频谱上相互混叠,采用线性去噪局限性较大[4]。非平稳信号去噪的研究有多种方法,如奇异值分解去噪、经验模态分解去噪、小波去噪等。 奇异值分解(singular value decomposition,SVD)是一种性能优良的非线性滤波方法,其基本思路是: 对原始信号进行相空间重构,将包含噪声和有用信号的矩阵分解到一系列正交子空间,分解得到的奇异值反映了数据的内在属性,由于有用信号和噪声对奇异值的贡献程度不一致,通过选择合适的奇异值可以最大限度地保留有用信号,消除信号中的噪声成分,达到去噪的效果[56]。赵洪山等[7]提出了将变分模态分解和奇异值分解结合的降噪方法,提高了滚动轴承故障信号的信噪比; 王建国等[8]将SVD和局部均值分解结合,可有效辨识轴承的典型故障。然而,在信噪比较低的情况下,SVD方法对噪声比较敏感,难以取得较好的去噪效果。曾鸣等[9]将时域约束估计应用于SVD的子空间去噪,能够抑制噪声贡献占主导的奇异值对去噪后信号的贡献量,在强噪声环境下可有效地提取齿轮故障特征。由于汉克尔矩阵(Hankel matrix)无法表征信号中的冲击成分,传统SVD方法不能将冲击特征奇异值和噪声奇异值有效分离,郭远晶等[10]提出了在S变换时频谱上进行SVD去噪,可获取低信噪比下的信号冲击特征。有效秩阶次的选择是SVD去噪方法的关键,影响去噪效果,常用的方法是试凑法和阈值法,但依赖于经验,缺乏理论依据。Zhao等[11]提出了一种基于奇异值差分谱的奇异值自适应选择方法,在信噪比较高的情况下去噪明显,但没有考虑有用信号的奇异值差分谱也可能出现单边极大值的情况,对于具有明显趋势的信号不能准确地选择有效的奇异值,可能导致过去噪。针对SVD有效秩阶次的选择,还有许多学者进行了研究[1213],也取得了一些成果,但也存在计算复杂、健壮性有待提高等不足。 集成经验模态分解(ensemble empirical mode decomposition,EEMD)是一种多尺度信号分解方法,能有效地抑制经验模态分解(empirical mode decomposition,EMD)频率混叠的缺陷,并且分解得到的本征模态函数(intrinsic model function,IMF)分量能完整地反映原始信号的特性。各IMF分量表示原始信号中不同的频段,选择IMF分量进行组合即能达到低通、高通及带通滤波器的去噪效果。陈仁祥等[14]提出了基于相关系数的EEMD去噪方法,利用信号的相关性原理,可分离噪声和有用信号。张志刚等[15]利用灰色关联度和互信息法剔除虚假IMF分量,对余下的IMF分量进行重构以提高信号信噪比。基于相关性原理的去噪方法简单,易于实现,但是去噪方法不精细,去噪的同时也易造成部分有用信号的缺失。余发军等[16]提出利用随机噪声和故障信号的自相关函数特性的不同,找到各IMF分量中噪声分量的分界点,采用软阈值的方法对IMF分量进行去噪,能有效提取故障信号中的微弱冲击特征。张文忠等[17]提出了利用白噪声分解特征的EEMD阈值去噪方法,在滤去噪声的同时保留了高频有效信息。基于阈值的去噪方法简单且计算量小,但阈值的选择通常由人为经验估计。与其他方法的结合及改进EEMD的方法也能达到去噪的目的,如徐元博等[18]将形态滤波法与EEMD结合进行去噪,能突出故障信号的特征参数; 王志坚等[19]利用最小熵解卷积作为集成经验模态分解去噪方法的前置滤波器,可提高强噪声背景下的微弱冲击特征。在各种算法中总体平均次数、白噪声幅值系数这两个参数的选取对EEMD方法去噪效果及计算效率影响较大,在实际的工程应用中,往往信号噪声较大,使用EEMD去噪方法耗时较长。 小波分析是多尺度的非平稳信号分析方法,随着小波理论的不断完善和发展,小波包变换、卷积小波包变换、多小波包、双树复小波包变换等小波分析方法在机械故障诊断中得到广泛的应用。小波去噪技术一般可以分为阈值去噪方法、模极大值去噪方法、尺度模型去噪方法等。Donoho等[20]提出了阈值去噪方法,并给出了阈值计算的经验公式,但这类阈值去噪方法只是确定了一个全局阈值,没有考虑相邻小波系数之间的相关性,容易在去除噪声的同时将高频信号的有用成分也一并去除。阈值去噪方法计算简单、速度快,但是在实际工程应用中估计噪声的方差比较困难。模极大值去噪是利用信号与噪声在不同尺度上模极大值的不同传播特性,选择由信号产生的模极大值点来重构信号,实现对信号的去噪。秦毅等[21]利用模极大值法无须计算噪声方差的特性,有效地提高了软阈值小波去噪法的误差下界,然而,去噪后的信号在奇异点存在振荡; 张翠芳等[22]提出对模极大值去噪后的信号进行软阈值去噪,使得去噪后的信号更加光滑。模极大值去噪方法比较稳定,存在的不足是由模极大值重构小波系数的计算复杂,效率低于阈值去噪法,并且需要选择合适的尺度。尺度模型去噪法是考虑尺度间小波系数相关性、尺度内小波系数相关性及综合尺度内、尺度间模型相关性的去噪方法。Liu等[23]提出了考虑同一层和不同层小波分解系数之间相关性的去噪方法,将具有相关性的小波系数作为整体来设定阈值,在去除噪声的同时可以有效地保留信号的特征信息。杨绍普等[24]根据信号的三阶矩比二阶矩能更好地反映冲击信号特征,改进了小波相邻系数去噪方法。双树复小波包变换是在离散小波包变换和双树复小波变换的基础上提出的小波分析方法,保留了小波包变换和复小波变换的优良特性,具有近似平移不变性、有限数据冗余、完全重构和抑制频带重叠的特性。双树复小波、双树复小波包与其他方法结合,在机械故障诊断中得到广泛的应用。苏文胜等[25]提出了利用双树复小波变换的近似平移不变性和隐马尔可夫树模型刻画小波系数间相关特性的去噪方法; 吴定海等[26]在研究双树复小波包的基础上,提出了自适应分块阈值的降噪方法; 胥永刚等[27]提出了利用峭度和相关系数选择双树复小波包分解的频带分量,进行软阈值去噪消除振动信号中噪声的干扰。基于阈值的去噪方法在一定程度上能取得较好的效果,但在强噪声干扰下,仅采用阈值去噪的方法往往难以获得满意的去噪结果。进一步,胥永刚等提出选择周期性较明显层上的小波系数进行形态分量分析去噪,能有效去除信号中的强噪声[28]。王奉涛等[29]提出将信号进行对偶树复小波分解,并由分解子频带构造高维信号空间,利用最大方差展开流形算法提取高维空间中的真实信号子空间,实现噪声与有用信号的分离。 相空间重构技术是一种非线性时间序列分析方法,根据高维相空间吸引子所在的主流形主要分布在某个低维子空间,而噪声则分布在相空间的所有维度中。黄艳林等[30]将独立分量分析方法用于高维相空间的去噪; Qiu等[31]提出利用相空间重构和奇异值分解来优化小波基参数以实现振动信号的去噪。然而,这些去噪方法都是基于局部邻域的迭代修正,没有考虑主流形的全域信息和整体结构。流形学习是一类维数约简的方法,通过提取高维信号的低维流形,能更准确地表征信号的本质特征,将其用于提取信号中有用成分的主流形,Wang[32]提出了局部切空间排列算法和分形维的非线性去噪方法; 苏祖强等[33]通过研究小波包分解和局部切空间排列算法相结合的主流形识别,实现了信号与噪声的分离,达到了非线性去噪的效果。将流形学习方法用于信号的去噪,是近年来研究的热点。 1.2.2基于流形学习的故障诊断方法 流形是拓扑学中的概念,表示一个局部处于欧几里得的拓扑空间。局部欧几里得特性意味着对于空间上任一点都有邻域,即流形是一个局部可坐标化的拓扑空间,是从拓扑空间的一个开集到欧几里得空间的开子集的同胚映射,使每个局部可坐标化。 流形学习是一类数据降维分析方法,高维观测空间中的样本可以认为是由少数变量同时作用于测量空间所张成的一个流形,利用流形学习方法进行维数约简的目标就是提取由这些少数主要变量张成的低维流形,通过对低维流形进行分析就能获得对应的高维空间样本的各种性质。2000年Science上发表的三篇论文奠定了流形学习的理论基础: Seung等[34]提出了人类感知能力的非线性流形学习方法,人脑在长期进化过程中,逐渐能从复杂环境的表面排除相干扰因素,从而发现事物的内在本质,人类感知和表达外界事物的方式类似于流形感知; Tenenbaum等[35]提出了等距映射(isometrical mapping,ISOMAP)流形学习算法,该方法利用局部几何测地距离代替欧氏距离,采用多维尺度方法建立高维样本间的局部几何测地距离与低维特征空间的对应关系,保持高维样本在低维空间的测地距离不变,从而提取最优的低维流形; Roweis等[36]也提出了局部线性嵌入(locally linear embedding,LLE)流形学习算法,使高维样本局部近邻数据结构在低维空间保持不变,提取低维流形表示。至此,国内外学者针对流形学习理论展开了大量的研究,相继提出了其他的流形学习方法: 拉普拉斯特征映射算法(Laplacian eigenmaps,LE)[37]、随机近邻嵌入算法(stochastic neighbor embedding,SNE)[38]、局部切空间排列算法(local tangent space alignment,LTSA)[39]、局部保持投影算法(locality preserving projection,LPP)[40]、最大方差展开算法(maximun variance unfolding,MVU)[41]、近邻保持嵌入算法(neighborhood preserving embedding,NPE)[42]、t分布随机近邻嵌入算法(tdistributed stochastic neighbor embedding,tSNE)等。 不同流形学习算法的区别主要在于保持的局部邻域结构信息及构造全局嵌入方法。流形学习能突出高维样本的内在本质信息,在故障诊断领域得到广泛地应用。在信号去噪方面,阳建宏等[43]提出利用相空间重构理论将含噪信号重构到高维相空间,采用LTSA算法从高维含噪相空间中识别低维主流形,依据主流形反求出一维时间序列,达到去噪的效果。张赟等[44]采用MVU算法识别相空间中代表吸引子的低维子流形,并将其与噪声子空间分离。栗茂林等[45]利用连续小波变换分解振动信号,得到包含冲击特征的最优小波系数矩阵,采用LTSA算法提取小波系数低维流形结构,去除噪声的干扰。马婧华等[46]提出了自适应维数估计的LTSA流形学习去噪方法,克服了维数估计不当带来的不完全去噪或者过度去噪。在特征提取方面,包括敏感特征选择方法和特征融合方法。其中,特征选择是保留部分敏感特征,但丢掉了其他特征中蕴含的有用信息,也没有消除特征间存在的非线性耦合关系,并且采用不同的特征选择方法优选出的敏感特征子集可能存在较大的差别。基于流形学习的特征提取属于特征融合的方法,采用流形学习方法挖掘原始高维特征的低维流形表达,去除干扰和冗余信息,实现对数据特征和内在本质信息的学习与增强。张晓涛等[47]提出了多尺度正交PCALPP的流形学习算法,改进了LPP算法表征全局分布特征效果不佳的问题,增强了齿轮箱振动信号的故障特征。Dong等[48]在对振动信号进行形态学滤波的基础上,采用EMD构建高维特征,利用LTSA算法降维获取低维本质特征; Li等[49]利用EMD和AR模型系数构建高维特征空间,采用线性局部切空间算法提取低维特征,训练支持向量机(support vector machines,SVM)模型获得了较高的故障识别正确率。 邻域图中近邻点数的选择依赖人为经验,影响流形学习算法的性能。万鹏等[50]采用启发式算法优化邻域参数k,得到了全局一致的邻域大小。该方法只适用于均匀分布的流形。对于非均匀分布的流形,需要依据流形局部几何特征动态调整邻域大小。Wang等[51]和詹宇斌等[52]基于流形曲率提出了自适应变化的k的选择方法,但每次调整邻域大小都需要重新计算样本中心化矩阵奇异值。Nathan等[53]和Karina等[54]基于局部切空间偏离距离动态调整k值大小,算法较烦琐。利用聚类线性分块[55]、曲率和局部弯曲度[56]等自适应邻域选择方法在一定程度上提高了流形学习的处理效果。对于在线监测机械装备运行状态,不断增加的动态数据对诊断算法的快速处理能力要求较高。LTSA,MVU,tSNE等流形学习算法是一类批量处理方法,每次将新增样本加入到原始训练样本中,全部样本重新进行一次维数约简,无法利用原始训练样本集降维的结果,随着动态数据的增加,批处理的方式耗时过长,不适合在线数据的处理。在增量流形学习方面,相关的研究方法主要有: ①线性化增量方法,如迹比线性判别分析[57]、线性局部切空间排列。Liu等[58]提出了增量监督局部线性嵌入方法,用于地下泵电机轴承状态的实时监测; Su等[5960]提出了增量式监督局部线性嵌入算法和监督扩展局部切空间排列算法,充分利用了训练样本的标签信息,将新增样本进行分块迭代获取低维特征信息,避免了将新增样本与训练样本混合进行维数约简,提高了识别正确率与计算效率。Cheng等[61]提出了监督增量t分布随机近邻嵌入算法,以获取降维投影矩阵。②基于标志点的增量学习,将标志点作为两个线性块的重叠点,利用重叠点在两线性块中低维嵌入坐标差值最小化原则,对新增样本低维坐标进行旋转、平移和缩放整合到原有样本中[6263]。③采用迭代的方法更新样本低维坐标。Gao等[64]对动态增加的全局坐标矩阵采用瑞利里兹法(RayleighRitz method)加速特征值的迭代计算,Tan等[65]提出迭代更新新增样本局部坐标矩阵,都是将高阶矩阵特征分解转化为低阶矩阵特征分解,降低了算法复杂度。④采用最近邻近似方法,赵辽英[66]提出了利用新增样本最近邻点低维坐标线性估计新增样本点低维坐标。上述增量学习方法尚存在部分不足: ①利用原有样本低维坐标获取新增样本低维坐标后,没有更新原有样本的低维坐标,随着新增样本的增加,新增样本与原有样本低维坐标间的差距会增大。②对新增样本的处理是逐个进行的,不适合在线数据处理。③获取高维空间样本向低维投影的映射矩阵,在一定程度上可实现新增样本的实时处理,但新增样本数据存在波动,映射矩阵的固定性将会导致较大的误差。 流形学习在非线性维数约简方面的性能突出,展现了其挖掘高维数据集内在本质信息的优势,在机械故障诊断方面,还需进一步加强对样本标签信息的利用,在监督式、半监督式流形学习方法,以及提高泛化性方面,需进一步研究更为高效和准确的新增样本扩展维数约简方法。 1.2.3基于深度学习的故障诊断方法 在故障诊断领域,大多数的诊断模型都是首先构造多个特征组成高维特征集,然后采用特征选择或者基于流形学习维数约简的方法提取低维特征集,将其作为支持向量机、神经网络、隐马尔可夫模型、模糊C均值聚类等模型的输入进行诊断识别。Li等[67]通过提取振动信号的均值、峰值、波峰因子、能量熵等特征,采用核边际费希尔分析进行特征选择,利用最近邻分类器进行模式识别。李宏坤等[68]利用希尔伯特谱生成振动谱图,提取信息熵及三维中心表征图像特征。刘占生[69]、窦唯等[70]分别对时频图和三维谱图进行了识别研究,利用改进共生矩阵表示图形纹理特征,采用免疫算法进行故障识别; 利用小波包变换、EEMD提取齿轮箱振动信号的故障特征,如小波包分解频带能量[71]、IMF分量能量[72]、多尺度峭度[73]等作为BP神经网络的输入,建立了齿轮箱运行状态识别模型。神经网络的结构参数如初始权值及阈值的选取不当会使网络难以收敛,影响诊断结果。刘永前等[74]利用引力搜索算法的全局搜索能力优化BP神经网络的结构参数,其他的方法如混合蛙跳优化算法[75]、自适应遗传算法[76]也用于优化神经网络参数。支持向量机适合小样本情况下的分类识别。Wu等[77]提出对转子故障状态下的加速度信号进行全谱分析,提取故障特征采用支持向量机进行识别诊断。支持向量机核函数的构造、核参数和惩罚系数的选择影响模型的性能: Sakthivel等[78]对比了四类核函数并进行优选; Widodo等[79]利用交叉验证法确定支持向量机的核参数和惩罚系数,遗传算法、人工免疫算法等也用于优化核参数[8082]。由上述诊断模型可知,特征的输入对诊断模型的性能影响较大,采用不同的特征选择方法可能导致诊断的结果偏差较大。另外,模型的输入需要人为参与,特征的构造依赖专业背景知识,并且,当工况变化时将数据输入已训练完成的诊断模型,可能取得较差的结果,即诊断模型的泛化性不强。 深度学习是相对于传统浅层机器学习模型而言的,可通过多层神经网络模拟人脑对外界信号的处理。2006年Hinton等[83]提出了一种深度网络模型,此后,深度学习迅速成为研究的热点,并广泛应用于自然语言处理、语音识别、计算机视觉等领域[8486]。由于深度学习的深层网络结构能处理浅层神经网络难以表达的复杂高维函数,学习表示能力更强。自2013年Tamilselvan等[87]第一次把深度学习应用到飞机发动机的故障诊断以来,越来越多的学者也将其用于故障诊断领域的研究。常用的深度学习模型有稀疏自动编码器(sparse autoencoder,SAE)[88]、深度信念网络(deep belief network,DBN)[89]、卷积神经网络(convolutional neural network,CNN)[9091]、深度残差神经网络(deep residual network,DRN)[92]等。在诊断识别方面,深度学习模型是一类端到端的模型,输入可以是原始振动数据、频谱数据、人工提取的特征集、图像等。将传感器采集的数据或者利用傅里叶变换后的频谱数据作为模型的输入[9395],可减少人为因素的干扰。Kang等[96]将一维时域振动信号作为CNN的输入。Jing等[97]利用傅里叶变换将一维时域振动信号转换为频谱信息作为CNN的输入。Jiang等[98]将齿轮箱频谱数据作为堆栈降噪自编码的输入,并改变网络中噪声的强度,能提取健壮性和辨识性强的特征。Wang等[99]对比分析了将原始时域数据作为CNN的输入,以及将原始时域数据经小波分解后优选子频带并提取频谱数据作为输入,实验结果表明后一种输入的诊断正确率高于前一种。人工提取时域、频域、时频域等特征作为深度网络的输入,由于提取的特征相对于时域数据能更好地反映部件的状态,经深度学习可能会获得健壮性与敏感性更好的特征,但输入特征的性质会影响诊断结果[100101]。Chen等[102]首先提取了18个时域和频域特征,然后利用SAE进行特征融合,再将融合的特征作为DBN模型的输入。Liu等[103]为各个传感器三通道采集的数据提取时域、时频域特征,将3个传感器提取的特征融合成一个高维特征集,用于训练SAE。Shao等[104]利用双树复小波包变换对振动信号进行分解,将各子频带上构建的特征作为DBN的输入,在滚动轴承故障诊断中可取得较好的效果。Sun等[105]提出构建二维信号作为CNN的输入,对齿轮箱振动信号进行双树复小波分解,将各子频带进行单支重构,并将各重构信号按列排成二维矩阵。Jing等[106]分别将齿轮箱的原始时域数据、频域数据及人工特征作为CNN的输入,实验结果表明频域数据作为模型的输入能获取最高的诊断正确率。机械振动信号时频分析得到的时频图像是时域与频域的联合分布信息,反映了信号中各频率随时间变化的关系,时频图中包含了丰富的设备运行状态信息,将不同方法构造的时频图作为深度网络输入,也会导致不同的诊断结果[107109]。Zhao等[110]采用离散小波包分析将齿轮箱振动信号转换为二维时频图,作为DRN网络的输入进行故障诊断。Guo等[111]采用连续小波变换将一维电流信号转换为二维灰度图,对卷积神经网络进行训练。Zhang等[112]利用短时傅里叶变换构建振动信号的时频图,训练CNN进行诊断。由于利用小波变换、短时傅里叶变换、S变换将振动信号转换为图像都需要专业背景知识,为减少人工选择干扰,Wen等[113]直接将原始数据处理后作为像素值排列组成灰度图,结合CNN进行诊断。 卷积神经网络是最早实现深度网络结构的一种方法,局部感知受启发于视觉皮层中的细胞对视觉输入空间的局部区域很敏感,即“感受野”。由于CNN最接近生物视觉神经网络,当前在各领域发展迅速,并且从结构上来看,AlexNet,VGG,GoogleNet及ResNet等模型的一个典型发展趋势都是网络深度越来越深[114]。自编码器和深度置信网络模型中神经元一般采用全连接,而CNN网络采用局部连接和权值共享方式,网络中的池化操作也大幅减少了参数训练,降低了模型的复杂度[115116]; 深层结构使得CNN具备非常强的非线性表达和学习能力,能自动学习非线性特征,代替人工设计的特征; 丢失数据Dropout技术和批规范化减小网络过拟合,可使网络泛化性更强,神经元能学习到健壮性更好的特征[117118]。迁移学习是一种利用已有的知识研究不同领域相关问题的机器学习方法,故障诊断中数据的一个特点是少量有标签信息或者没有标签信息,而迁移学习能迁移已有的知识解决这类争端问题,结合深度学习方法,能提升诊断可信度[119120]。 深度学习方法有许多优势,但也存在不少问题,还需要更深入的研究,如网络层数、隐含层神经元数量、卷积核大小、学习率等网络参数的选择,也有学者利用经验公式、人工鱼群算法、遗传算法等仿生学方法优选参数,但搜索效率、易陷入局部收敛等缺陷还值得继续研究[121122]。在大多数的故障诊断研究中,深度网络参数的选择与调整依赖人工经验,其科学性有待提高。 1.2.4决策融合诊断方法 通常将信息融合划分为3个层次: 数据级、特征级和决策级。其中,数据级融合一般是将多传感器采集的数据进行预处理,统一作为诊断模型的输入; 特征级融合一般是在构建高维特征集的基础上,利用特征选择、特征维数约简等融合方法