(论文速读)SRNet:稀疏表示网络实现振动信号特征学习与机械故障诊断

张开发
2026/4/14 20:00:02 15 分钟阅读

分享文章

(论文速读)SRNet:稀疏表示网络实现振动信号特征学习与机械故障诊断
论文题目Sparse-Representation-Network-Based Feature Learning of Vibration Signal for Machinery Fault Diagnosis基于稀疏表示网络的机械故障诊断振动信号特征学习期刊IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS摘要虽然深度神经网络在机械故障诊断中得到了广泛的应用但其学习过程中的脉冲分量提取和噪声滤波等关键问题并没有得到很好的解决。为此提出了一种稀疏表示网络(SRNet)从采集到的信号中提取脉冲信号并将其用于机械故障识别。为了提高SRNet的特征提取能力在稀疏表示层中开发了卷积稀疏图来抑制噪声并保留信号的脉冲特性。为了有效优化梯度传播进一步提高SRNet的特征学习性能提出了一种选择性残差学习方法。最后以两个齿轮箱为例对SRNet的特征学习和故障分类能力进行了评价。在两种情况下SRNet的识别准确率分别为98.72%和99.68%表明了SRNet与其他dnn相比的有效性。用稀疏表示网络SRNet实现振动信号特征学习与机械故障诊断一、研究背景与问题提出在旋转机械如齿轮箱、轴承的健康监测领域振动信号是最常用的故障感知手段。机械发生故障时振动信号的频谱会发生改变并在时域中产生周期性的冲击成分impulsive components这些冲击成分是判断故障类型和严重程度的关键依据。然而实际采集到的振动信号往往面临两个严峻挑战信号非平稳且含噪传感器缺陷、恶劣运行环境等因素导致采集信号中混杂大量噪声冲击特征被掩盖冲击成分难以提取现有深度学习方法1-D CNN、ResNet等侧重于通用特征学习对去噪 冲击保留这一组合任务的针对性处理能力不足。现有方法的不足11-D CNN的局限一维卷积神经网络1-D CNN可以直接从原始振动信号中提取特征免去了人工将信号转换为图像的繁琐步骤。但它仍难以同时实现噪声抑制与冲击特征保留且随着网络加深梯度消失问题日益突出。2残差学习ResNet的缺陷残差网络通过残差连接Residual Connection有效缓解了梯度消失问题。但在传统残差连接中输入特征不加筛选地直接传入深层大量冗余特征随之传播劣化了深层网络的特征学习性能。3稀疏表示Sparse Representation, SR方法的瓶颈稀疏表示是一种经典的信号去噪方法通过求解优化问题能有效提取振动信号中的故障冲击成分。已有研究如 Kim et al.、Cui et al.、Chen et al.证明了 SR 在去噪和冲击提取上的优越性。然而这些 SR 方法都是独立的信号处理工具并未嵌入深度网络无法与后续分类任务进行端到端的协同优化。二、SRNet 的整体架构配图Fig. 1 — SRNet 整体网络结构图针对上述问题作者提出了稀疏表示网络Sparse Representation Network, SRNet其核心思路是将稀疏表示机制以可学习层的形式嵌入深度网络同时引入选择性残差学习从而在一个统一的端到端框架内完成信号去噪 → 冲击特征提取 → 故障分类的全流程。SRNet 由三个主要模块串联构成模块功能SR 层Sparse Representation Layer对原始振动信号去噪保留冲击成分多层 1-D CNN 选择性残差学习块深层特征提取选择有效特征解决梯度消失分类器Classifier两层全连接层输出故障类别整个网络的损失函数由两部分构成SR 层的稀疏损失Loss1和分类交叉熵损失Loss2并采用两阶段训练策略分别优化。三、核心创新一稀疏表示层SR Layer配图Fig. 2 — SR 层结构图Fig. 3 — 卷积稀疏图D的细节Fig. 4 — 稀疏向量的细节3.1 问题建模实际采集到的振动信号 x 可以被建模为其中是含有故障冲击信息的目标信号n 是噪声。SR 层的目标就是从 x 中恢复出。在稀疏表示框架下信号 x 可以用字典 A 和系数向量 B 表示最优稀疏系数通过求解以下优化问题得到3.2 卷积稀疏图Convolutional Sparse Graph, D在 SRNet 中SR 中的字典被替换为卷积稀疏图 D。具体做法是用 m 个一维卷积核对输入振动信号进行卷积每个卷积核的输出 ck 经过 ReLU 激活后沿通道维度拼接得到卷积稀疏图其中每个原子D 的形状为L×m。卷积核的参数随整个网络一起训练因此 D 是一个自适应可学习的字典。3.3 稀疏向量Sparse Vector, VSR 中的系数向量被替换为稀疏向量 V由两层全连接层生成其中 r 是服从标准正态分布的随机初始输入。FC1 的神经元数量为初始层的一半FC2 与初始层神经元数相同。3.4 稀疏表示的计算最终第 i 个样本的稀疏表示输出为即卷积稀疏图与稀疏向量的矩阵乘法。3.5 SR 层的损失函数SR 层的损失由两项构成1保真项Fidelity Term确保稀疏表示与原始信号的冲击成分一致2l1 范数稀疏正则化项抑制噪声使表示稀疏化总损失超参数为稀疏系数平衡两项之间的权重。实验中确定最优值为20。配图Fig. 5 — 振动信号经 SR 处理前后的对比图如图所示原始振动信号经过 SR 层处理后噪声和冗余特征被压制为零而关键的冲击成分图中绿色椭圆标注得到了显著保留这大幅提升了后续卷积层的特征学习质量。四、核心创新二选择性残差学习Selective Residual Learning配图Fig. 6 — 选择机制结构图Fig. 7 — 选择性残差学习块结构图4.1 传统残差学习的缺陷标准 ResNet 的残差块定义为这种设计能有效传播梯度但 $x$ 是不加筛选地直接加到输出上的意味着残差连接中可能携带大量冗余特征进而影响深层网络的学习效果。4.2 选择机制Selective Mechanism为了解决这一问题作者在残差连接中引入了选择机制其核心步骤如下Step 1对输入特征图 P 分别做最大池化和平均池化得到两个空间上下文描述符Step 2将两个描述符相加并经过两层全连接降维 → 升维后通过 ReLU 激活得到通道权重Step 3对特征图的每个通道施加对应权重输出选择后的特征这一机制使得重要通道被赋予更高权重、冗余通道的权重被压制为零从而在残差连接中只传递有效特征。4.3 梯度传播的改善由于选择性残差连接的存在SR 层接收到的梯度来自两条路径两条梯度路径共同作用有效缓解了深层网络的梯度消失问题。五、两阶段训练策略SRNet 的总损失函数采用分阶段切换的形式稀疏阶段仅更新 SR 层的参数卷积核权重和全连接层权重目标是让网络学会有效的稀疏表示微调阶段冻结 SR 层更新其余所有层的参数目标是优化最终的分类性能。这种两阶段设计的好处是两项损失的量级差异较大分阶段训练避免了它们之间相互干扰保证各阶段优化目标清晰。六、实验设置6.1 Case 1单工况行星齿轮箱配图Fig. 9 — 行星齿轮箱测试台Fig. 10 — 代表性健康状态照片Fig. 11 — 11类健康状态的振动信号波形实验平台由行星齿轮箱太阳齿轮75齿行星齿轮25齿、驱动电机、加速度传感器、磁制动器和传动轴构成采样频率为30 kHz。配表Table I — 行星齿轮箱数据集详情11类健康状态每类1000个样本训练/测试比例8:2数据集共包含11 类健康状态1类正常 5级磨损齿 点蚀齿 裂纹齿 内圈缺陷 滚珠缺陷 保持架缺陷每类 1000 个样本按 8:2 比例划分训练集与测试集。配表Table II — 振动信号的定量分析均值、峭度、峰值因子、脉冲因子值得注意的是信号的峭度值普遍大于3且接近4说明振动信号中确实存在冲击成分验证了 SRNet 设计思路的合理性。配表Table III — SRNet 的详细参数配置SRNet 的关键参数通过试错法在离线训练阶段确定最终网络的稀疏系数20维度压缩比 a 2批大小为50学习率为0.005。6.2 Case 2变工况齿轮箱配表Table VII — 变工况数据集详情5类故障2种工况每类2000个样本该数据集包含两种运行工况20 Hz, 0V 和 30 Hz, 2V共5 类健康状态正常、缺齿、齿面缺失、根部缺陷、表面缺陷两种工况的数据混合后共同用于训练和测试每类共 2000 个样本。该实验用于验证 SRNet 在变工况场景下的泛化能力。七、实验结果与分析7.1 训练过程配图Fig. 12 — SRNet 训练过程中的准确率曲线Fig. 13 — 各损失项的收敛曲线a-d训练过程中分类准确率和各损失项均在迭代初期迅速收敛随后平稳提升。测试集最终诊断精度达到99.29%充分证明了 SRNet 的有效性。7.2 超参数敏感性分析配图Fig. 14 — 不同 λ 值下 SRNet 的收敛过程作者对稀疏系数取值10、20、30、40进行了敏感性分析。结果表明增大时收敛性能先改善后劣化20 时稀疏损失收敛到最小值为最优选择。7.3 消融实验配图Fig. 15 — 消融分析结果对比图为验证各模块的贡献作者进行了消融实验分别去除 SR 层和选择性残差学习观察对各类别识别精度的影响。结果显示去除 SR 层S2、S3 等相似故障类别的识别率大幅下降去除选择性残差学习整体性能同样显著劣化两者缺一不可共同构成 SRNet 出色性能的基础。7.4 可视化分析配图Fig. 16 — 振动信号与稀疏表示的对比S2 和 S7Fig. 17 — 选择性残差连接中各通道的权重分布Fig. 18 — t-SNE 可视化4个阶段SR 层可视化两个故障样本S2、S7经 SR 层处理后原始信号中的冗余成分被压制为零冲击特征得到清晰保留。选择机制可视化选择性残差连接中大多数通道的权重被压制为零仅少数通道被赋予显著权重体现了精准筛选的特点。t-SNE 可视化展示了特征在网络各阶段的演变(a) 输入原始信号11类样本的特征杂乱分布无明显分界(b) SR 层输出部分类别如S5开始聚类分离(c) 选择性残差学习输出更多类别S5、S6、S9、S11清晰分离(d) 分类器输出11类健康状态完全分离聚类效果极佳。7.5 与现有方法的对比配表Table V — 对比方法的网络结构详情Table VI — SRNet 与各对比方法的识别精度和 F1 分数对比在 Case 1 中SRNet 与 8 种最先进方法IMSN、1-D SCRCNet、1-D RCAE、MBCNN、ResNet、SENet、SCNet、ECANet进行比较结果汇总如下SRNet 在准确率和 F1 分数上均排名第一验证了 SR 层与选择性残差学习协同作用的优越性。配图Fig. 19 — Case 2 中 SRNet 与各方法的5折交叉验证准确率对比在 Case 2 变工况场景下SRNet 的 5 折平均准确率达到99.68%同样显著优于所有对比方法其中包括基于深度迁移学习Deep Transfer Learning的方法。八、总结与展望主要贡献回顾SR 层首次将稀疏表示以可训练层的形式嵌入深度网络实现端到端的冲击特征提取与去噪无需任何手动信号预处理卷积稀疏图自适应字典替代固定字典表达能力更强选择性残差学习在残差连接中引入通道注意力机制同时解决梯度消失和冗余特征传递两大问题两阶段训练合理分离稀疏损失与分类损失的优化训练过程更加稳定高效。实验结论SRNet 在两个齿轮箱数据集上分别取得了98.72%和99.68%的识别精度在与多个领域内最先进的 DNN 方法的对比中均展现出最优性能。未来研究方向作者指出未来可将新型稀疏表示方法嵌入自编码器Autoencoder中探索无监督特征学习的可能性进一步扩展 SRNet 的应用范围。

更多文章