双向小波卷积长短时记忆网络风力发电机故障诊断方法

文档序号:32442574发布日期:2022-12-06 22:41阅读:62来源:国知局
双向小波卷积长短时记忆网络风力发电机故障诊断方法

1.本发明涉及故障诊断技术领域,更具体的说是涉及一种双向小波卷积长短时记忆网络风力发电机故障诊断方法。


背景技术:

2.目前,传统故障诊断方法如专家系统,经验模态分解,支持向量机等依赖人工提取和选择特征,模型泛化能力差。深度学习方法摆脱了对人工提取特征的依赖,在故障诊断领域得到了广泛的应用。例如,hsueh等采用经验小波变换结合cnn的方法对感应电机故障进行诊断,实验结果表明,该方法优于支持向量机等传统故障诊断方法。祝文颖等针对振动信号具有复杂多分量和调幅-调频的特点,通过经验小波变换通过对信号fourier频谱的分割构造一组正交滤波器组,能提取具有紧支撑fourier频谱的单分量成分,再对单分量成分运用hilbert变换实现信号的解调分析。zeng等采用一种分层稀疏性策略来改进堆叠稀疏自编码器,并利用粒子群优化算法获得最佳稀疏参数以提高网络性能。与传统故障诊断方法相比,深度学习方法能够自动提取故障特征,达到更好的诊断效果。由于单传感器信号包含的故障信息不全面,采用多传感器信息融合能够形成故障信息互补,使得故障信息更加全面,达到比单信号更好的诊断效果。杨洁等基于多传感器信息融合的轴承故障诊断模型,对航空发动机轴承进行故障诊断。该模型采用一维卷积神经网络(1d-cnn)对实验获取的航空发动机的轴承故障振动数据进行特征提取与分类,直接将不同传感器采集的波形信号作为输入,舍弃了传统的基于信号分析故障诊断的繁琐步骤。实验采用4个加速度传感器输入该模型对轴承故障进行分类与识别,取得很好的故障诊断效果。wang等提出了一种融合多模态传感器信号的方法,利用一维cnn对振动和声学信号进行融合实现了更准确的轴承故障诊断。peng等提出了一种通过多个转速表的数据来提取它们之间的不平衡相位特征,从而识别行星齿轮故障的诊断方法。由于设备当前运行状态与之前的运行状态有关,因此故障信号在时间维度上也包含着丰富的信息,但是采用cnn等空间特征提取方法并不能提取时序特征。
3.因此,提供一种双向小波卷积长短时记忆网络风力发电机故障诊断方法,提取高质量的时间和空间特征的同时实现故障特征互补是本领域技术人员亟需解决的问题。


技术实现要素:

4.有鉴于此,本发明提供了一种双向小波卷积长短时记忆网络风力发电机故障诊断方法,采用bicovlstm融合多传感器数据,形成特征互补,并在一个时间步内提取时空特征,减少关键故障信息丢失;在bicovlstm结构中结合小波变换,增强特征;计算相邻时间步输出之间的余弦距离,以达到更好的诊断效果。
5.为了实现上述目的,本发明采用如下技术方案:
6.一种双向小波卷积长短时记忆网络风力发电机故障诊断方法,包括以下步骤:
7.s1、建立多源故障数据集,给每类故障打上标签,划分训练集与测试集;
8.s2、构建bwcovlstm网络模型,将多源故障数据集样本分割成若干个时间步长的输入矩阵,作为网络模型的输入;
9.s3、对由输入矩阵和短时记忆状态拼接的数据矩阵做二维离散小波变换,得到近似细节、水平细节、垂直细节、对角细节四个特征矩阵;
10.s4、将得到的四个特征矩阵与权重矩阵卷积作为

门’操作的输入,最终得到当前时间步的输出特征;
11.s5、计算相邻时间步输出的余弦距离,最后输入全连接层获得诊断结果,计算交叉熵损失函数,调整模型参数;
12.s6、将测试集输入训练好的网络,得到模型的准确率和t-sen可视化图。
13.优选的,所述步骤s2具体包括:
14.将长短时记忆网络lstm单元数据矩阵与权重矩阵的点乘操作替换为卷积,使得网络的输入从一维信号拓展到多维信号,在一个时间步内提取时空特征;
15.f
t
、i
t
、o
t
分别表示遗忘门,输入门和输出门。将上一时间步的输出h
t-1
信息和当前的输入信号x
t
拼接成[h
t-1
,x
t
]作为卷积长短时记忆网络covlstm单元的输入与对应权重w相乘,然后经过小波变换和卷积操作,分别经sigmoid或tanh激活函数处理作为“门”操作的输入;遗忘门根据当前输入控制丢弃多少上一个时间步长时记忆状态c
t-1
中的信息,如式(1)所示;
[0016]ft
=sigmoid(cov(wf,[h
t-1
,x
t
])+bf)
ꢀꢀ
(1)
[0017]
输入门根据当前输入控制向当前时间步长时记忆状态c
t
中添加多少信息,如式(2)(3)(4)所示:
[0018]it
=sigmoid(cov(wi,[h
t-1
,x
t
])+bi)
ꢀꢀ
(2)
[0019]ot
=sigmoid(cov(wo,[h
t-1
,x
t
])+bo)
ꢀꢀ
(3)
[0020]ct
=f
t
*c
t-1
+i
t
*tanh(cov(wt(wc,[h
t-1
,x
t
]))+bc)
ꢀꢀ
(4)
[0021]
输出门根据当前输入控制当前长时记忆状态选择哪些信息作为当前时间步的输出h
t
,如式(5)所示:
[0022]ht
=o
t
*tanh(c
t
)
ꢀꢀ
(5)
[0023]
优选的,所述步骤s3具体包括:
[0024]
获取haar小波的分解滤波器值,即dec_lo,dec_ho,求内积,如式(6)-(9)所示:
[0025]
ll=dec_lo
·
dec_lo
ꢀꢀ
(6)
[0026]
lh=dec_ho
·
dec_lo
ꢀꢀ
(7)
[0027]
lh=dec_lo
·
dec_ho
ꢀꢀ
(8)
[0028]
hh=dec_ho
·
dec_ho
ꢀꢀ
(9)
[0029]
其中,ll、lh、lh、hh分别表示近似、水平、对角、垂直方向的滤波器;将ll、lh、hl、hh设置为固定的卷积核,设置合适的步长,通过卷积的方式来实现批量小波变换。
[0030]
优选的,所述步骤s4具体包括:
[0031]
将近似细节、水平细节、垂直细节、对角细节,拼接成一个特征矩阵,然后通过卷积、激活函数分别通过遗忘门、输入门,输出门控制长时记忆状态c
t
和输出h
t
的信息。
[0032]
优选的,所述步骤s5具体包括:
[0033]
将时间步输出特征作为向量,计算相邻时间步输出的余弦距离:
[0034][0035]ht
为当前时间步输出,h
t-1
为上一时间步的输出,x表示特征点;
[0036]
全连接层的每一个结点都与上一层的所有结点相连,用来把前边提取到的特征综合起来。可表述为:
[0037]
α=w1cosθ1+w2cosθ2+

+wncosθn[0038]
α为全连接层中一个节点输出值,w为权重系数,cosθ为余弦距离,节点输出值个数由故障类型个数决定,如m个分类就有m个节点输出[α1,α2,

,αm],其最大值对应的位置序号就是故障类型对应的标签;
[0039]
交叉损失函数可表述为:
[0040][0041]
yi为标签值,y'i为预测值,交叉熵损失函数能够衡量真实概率分布与预测概率分布之间的差异,其值越小,诊断效果越好。
[0042]
优选的,所述步骤s6具体包括:
[0043]
准确率计算公式可表述为:
[0044][0045]
t_sne是常用的数据可视化方法,它是通过放射变换将数据点映射到概率分布上,分为两个步骤:
[0046]
(1)构建高维对象之间的概率分布,使得相似的对象有更高的概率被选择,而不相似的对象有更低的概率。
[0047]
(2)sne在低维空间中构建这两个分布,使得两个概率分布尽可能相似。
[0048]
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种双向小波卷积长短时记忆网络风力发电机故障诊断方法,采用bicovlstm融合多传感器数据,形成特征互补,并在一个时间步内提取时空特征,减少关键故障信息丢失;在bicovlstm结构中结合小波变换,增强特征;计算相邻时间步输出之间的余弦距离,以达到更好的诊断效果。
附图说明
[0049]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0050]
图1附图为本发明提供的covlstm单元结构示意图。
[0051]
图2附图为本发明提供的余弦距离示意图。
[0052]
图3附图为本发明提供的bwcovlstm单元结构示意图。
[0053]
图4附图为本发明提供的bwcovlstm故障诊断流程结构示意图。
[0054]
图5附图为本发明提供的帕德博恩数据集实验结果可视化结构示意图。
[0055]
图6附图为本发明提供的bwcovlstmc不同工况下诊断结果示意图。
[0056]
图7附图为本发明提供的加噪波形结构示意图。
[0057]
图8附图为本发明提供的bwcovlstmc不同噪声下诊断结果示意图。
具体实施方式
[0058]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0059]
本发明实施例公开了一种双向小波卷积长短时记忆网络风力发电机故障诊断方法,包括以下步骤:
[0060]
s1、建立多源故障数据集,给每类故障打上标签,划分训练集与测试集;
[0061]
s2、构建bwcovlstm网络模型,将多源故障数据集样本分割成若干个时间步长的输入矩阵,作为网络模型的输入;
[0062]
s3、对由输入矩阵和短时记忆状态拼接的数据矩阵做二维离散小波变换,得到近似细节、水平细节、垂直细节、对角细节四个特征矩阵;
[0063]
s4、将得到的四个特征矩阵与权重矩阵卷积作为

门’操作的输入,最终得到当前时间步的输出特征;
[0064]
s5、计算相邻时间步输出的余弦距离,最后输入全连接层获得诊断结果,计算交叉熵损失函数,调整模型参数;
[0065]
s6、将测试集输入训练好的网络,得到模型的准确率和t-sen可视化图。
[0066]
为进一步优化上述技术方案,步骤s2具体包括:
[0067]
将长短时记忆网络lstm单元数据矩阵与权重矩阵的点乘操作替换为卷积,使得网络的输入从一维信号拓展到多维信号,在一个时间步内提取时空特征;
[0068]ft
、i
t
、o
t
分别表示遗忘门,输入门和输出门。将上一时间步的输出h
t-1
信息和当前的输入信号x
t
拼接成[h
t-1
,x
t
]作为卷积长短时记忆网络covlstm单元的输入与对应权重w相乘,然后经过小波变换和卷积操作,分别经sigmoid或tanh激活函数处理作为“门”操作的输入;遗忘门根据当前输入控制丢弃多少上一个时间步长时记忆状态c
t-1
中的信息,如式(1)所示;
[0069]ft
=sigmoid(cov(wf,[h
t-1
,x
t
])+bf)
ꢀꢀ
(1)
[0070]
输入门根据当前输入控制向当前时间步长时记忆状态c
t
中添加多少信息,如式(2)(3)(4)所示:
[0071]it
=sigmoid(cov(wi,[h
t-1
,x
t
])+bi)
ꢀꢀ
(2)
[0072]ot
=sigmoid(cov(wo,[h
t-1
,x
t
])+bo)
ꢀꢀ
(3)
[0073]ct
=f
t
*c
t-1
+i
t
*tanh(cov(wt(wc,[h
t-1
,x
t
]))+bc)
ꢀꢀ
(4)
[0074]
输出门根据当前输入控制当前长时记忆状态选择哪些信息作为当前时间步的输出h
t
,如式(5)所示:
[0075]ht
=o
t
*tanh(c
t
)
ꢀꢀ
(5)。
[0076]
为进一步优化上述技术方案,步骤s3具体包括:
[0077]
获取haar小波的分解滤波器值,即dec_lo,dec_ho,求内积,如式(6)-(9)所示:
[0078]
ll=dec_lo
·
dec_lo
ꢀꢀ
(6)
[0079]
lh=dec_ho
·
dec_lo
ꢀꢀ
(7)
[0080]
lh=dec_lo
·
dec_ho
ꢀꢀ
(8)
[0081]
hh=dec_ho
·
dec_ho
ꢀꢀ
(9)
[0082]
其中,ll、lh、lh、hh分别表示近似、水平、对角、垂直方向的滤波器;将ll、lh、hl、hh设置为固定的卷积核,设置合适的步长,通过卷积的方式来实现批量小波变换。
[0083]
为进一步优化上述技术方案,步骤s4具体包括:
[0084]
将近似细节、水平细节、垂直细节、对角细节,拼接成一个特征矩阵,然后通过卷积、激活函数分别通过遗忘门、输入门,输出门控制长时记忆状态c
t
和输出h
t
的信息。
[0085]
为进一步优化上述技术方案,步骤s5具体包括:
[0086]
将时间步输出特征作为向量,计算相邻时间步输出的余弦距离:
[0087][0088]ht
为当前时间步输出,h
t-1
为上一时间步的输出,x表示特征点;
[0089]
全连接层的每一个结点都与上一层的所有结点相连,用来把前边提取到的特征综合起来。可表述为:
[0090]
α=w1cosθ1+w2cosθ2+

+wncosθn[0091]
α为全连接层中一个节点输出值,w为权重系数,cosθ为余弦距离,节点输出值个数由故障类型个数决定,如m个分类就有m个节点输出[α1,α2,

,αm],其最大值对应的位置序号就是故障类型对应的标签;
[0092]
交叉损失函数可表述为:
[0093][0094]
yi为标签值,y'i为预测值,交叉熵损失函数能够衡量真实概率分布与预测概率分布之间的差异,其值越小,诊断效果越好。
[0095]
为进一步优化上述技术方案,步骤s6具体包括:
[0096]
准确率计算公式可表述为:
[0097][0098]
t_sne是常用的数据可视化方法,它是通过放射变换将数据点映射到概率分布上,分为两个步骤:
[0099]
(1)构建高维对象之间的概率分布,使得相似的对象有更高的概率被选择,而不相似的对象有更低的概率。
[0100]
(2)sne在低维空间中构建这两个分布,使得两个概率分布尽可能相似。
[0101]
实验数据来源于德国帕德伯恩大学轴承数据集,使用的是在转速1500r/min工作
条件下三种工况的电流传感器采集的电流相位1和电流相位2数据,实验条件如表1所示。实验数据集中有正常、内圈损伤、外圈损伤三种轴承状态,每个样本包含1024个采样点,共1000个实验样本,训练集与测试集样本数量之比为7:3,训练集样本信息见表2。
[0102]
表1帕德伯恩大学电机运行信息
[0103][0104]
表2帕德伯恩大学数据训练集信息
[0105][0106]
将电流相位1和电流相位2数据组合成二维数据矩阵,以窗口长度1024,步长28的滑动窗口取样,得到[1024,2]的数据样本。实验网络的biwtcovlstm单元个数设定为32个,需将数据样本分割成32个时间步依次输入网络,一次输入500个样本进行训练。损失函数采用交叉熵函数,学习率设定为0.01。对比实验方法总览见表3。
[0107]
表3故障诊断方法总览
[0108][0109]
实验结果t_sne可视化图如图5所示,从图中可以看出本文提出的方法在工况0条件将三种轴承状态数据完全分开,在工况1和工况2条件下仅有极个别样本分类错误。对比实验结果如表4所示,在工况0条件下除lstm的诊断准确率仅为37.6%,其他方法均取得了很好的诊断效果;从工况1和工况2可以看出本位提出的方法较未改进的bcovlstm诊断准确分别从97.3%、98.7%提升至了99.5%、99.8%;而使用相位1数据诊断准确率75.5%、99.3%,相位2数据故障准确率95.6%、94.3%。实验结果表明使用双传感器数据融合进行故障诊断效果优于单传感器数据,本文所提改进方法在三种工况下均取得了很好的故障诊断效果。
[0110]
表4帕德博恩大学轴承数据对比实验结果
[0111][0112]
凯斯西储大学轴承数据集验证
[0113]
实验数据来自美国凯斯西储大学(case western reserve university)的滚动轴承数据中心。本文采用的数据采样频率为48khz,电机在负荷0、1、2、3马力工作条件下驱动端和风扇端传感器记录的振动加速度信号数据,如表5所示。
[0114]
数据集中共有内圈、外圈、滚动体故障3种类型,每种故障类型有0.18mm、0.38mm、0.54mm三种损伤直径,加上正常运行状态,共有10种状态,在四种工况下分别进行了实验。训练集与测试集为7:3,训练样本信息如表6所示。
[0115]
表5电机运行信息
[0116][0117]
表6训练集信息
[0118][0119][0120]
实验t-sen可视化图见图6,从图中可以看出,除极少数样本分类错误,十类样本数据已经形成了很明显的类别聚集蔟。对比实验结果如表7所示,在工况0条件下各故障诊断方法均取得了很好的故障诊断效果,准确率均在98%以上,在工况1、2、3工作条件下,除本文所提方法仍达到了99.8%以上的诊断精度,其他故障诊断方法诊断精度均出现了不同程
度下降。实验结果表明在不同工况条件下,本文所提故障诊断方法在不同工况下均具有很强的特征能力,达到了很好的故障诊断效果。
[0121]
抗噪实验
[0122]
为验证模型的抗噪性能,对西储大学电机轴承工况0数据加噪,信噪比设置为10db、5db、0db、-2db、-5db,其他实验参数与凯斯西储大学轴承数据集验证实验参数保持一致。图7展示了驱动端和风扇端数据加噪后的部分波形图。不同信噪比下的实验结果如图8所示,实验表明在大信噪比条件下,故障诊断效果几乎没有下降,在-5db的小信噪比,即噪声功率是原始信号功率的3倍多的实验条件下,诊断精度依然达到了97.8%,说明了模型具有良好的抗噪声性能。对比实验结果如表8所示,采用多源信号进行故障诊断效果要优于单信号,在-2db条件下单信号诊断精度分别为98.9%、94.3%,采用多源信号则达到了99.5%;对比双向卷积长短时记忆网络(bcovlstm)、卷积神经网络(cnn)、长短时记忆网络(lstm),本文方法的抗噪性能更强,在强噪声条件下仍具有较好的故障诊断效果。
[0123]
表7西储大学轴承数据对比实验结果
[0124][0125]
表8噪实验结果
[0126][0127]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0128]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一
致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1