一种使用QR-RLS算法对多通道语音信号去混响方法与流程

文档序号:14680760发布日期:2018-06-12 22:12阅读:来源:国知局
一种使用QR-RLS算法对多通道语音信号去混响方法与流程

技术特征:

1.一种使用QR-RLS算法对多通道语音信号去混响方法,其特征在于,该方法具体包括以下步骤:

S1:使用麦克风在封闭房间内采集带混响的语音信号;

S2:使用赛宾公式估计房间的混响时间T60,即直达声声压级下降60dB对应的时间,计算公式如下:

其中,α为房间吸声系数,V和S分别为房间的体积和表面积;

S3:将采集得到的带混响语音信号进行短时傅里叶变换,把信号由时域转化为频域,并在频域对带混响语音信号进行延迟处理得到延迟信号,信号延迟的阶数由预测滤波器的长度决定;

S4:通过混响时间T60计算混响语音信号的衰减常数Δ,从而估计出晚期混响信号和期望信号的功率谱密度,Δ的计算公式如下:

其中,Td为语音早期反射成分的时间;

S5:根据S4得到的期望信号功率谱密度的估计值计算期望信号2范数的加权系数;

S6:将延迟信号和带混响语音信号作为基于QR分解的RLS算法(QR-decomposition-based recursive least squares,QR-RLS)算法的输入数据,对其进行迭代更新,最后输出预测滤波器系数;

S7:将延迟信号与预测滤波器系数相乘得到晚期混响信号,带混响语音信号减去晚期混响信号等于去混响后的期望信号,对去混响后的期望信号进行逆傅里叶变换,得到时域上的去混响后的期望信号。

2.如权利要求1所述的一种使用QR-RLS算法对多通道语音信号去混响方法,其特征在于,所述步骤S4中,采用间隔一定距离的麦克风对混响语音进行采集,产生带混响语音数据,采用多通道线性预测(MCLP)模型对晚期混响信号进行建模,晚期混响信号成分u(n)即为延迟信号的和,即:

其中G(n)=[g1(n),…,gM(n)]代表多输入多输出预测滤波器的预测系数,gM(n)为第M个麦克风的预测系数,为延迟后的带混响数据。

3.如权利要求1所述的一种使用QR-RLS算法对多通道语音信号去混响方法,其特征在于,所述步骤S4中,晚期混响信号和期望信号的功率谱密度的估计:

假设晚期混响信号的功率谱密度是基于指数衰减的模型,首先计算衰减系数Δ,估计房间的混响时间T60、语音早期反射成分的时间Td;然后估计晚期混响信号和带混响语音信号的功率谱密度(power spectral density,PSD),两者相减得到期望信号的PSD;在期望信号PSD的计算中需要对其平滑处理。

4.如权利要求1所述的一种使用QR-RLS算法对多通道语音信号去混响方法,其特征在于,所述步骤S5中,所述期望信号2范数的加权系数计算为:

线性预测滤波器系数估计基于期望信号在时域的最大稀疏性,即期望信号的混合p范数;预测滤波器系数的最优化问题使用QR-RLS算法来解决,使用加权2范数来近似表示p范数,加权2范数的权系数依赖于期望信号PSD,则期望信号2范数的加权系数计算公式如下:

其中,M是麦克风的数量,ε是非常小的正数,p是范数,是期望信号的PSD估计值。

5.如权利要求1所述的一种使用QR-RLS算法对多通道语音信号去混响方法,其特征在于,所述步骤S6中,QR-RLS算法自适应计算预测滤波器的预测系数:

首先对QR-RLS算法中的参数进行初始化,对输入数据的矩阵进行对角化,通过基本的Givens旋转矩阵得到所有的三角化矩阵;计算Givens旋转元素,将旋转元素分别用于信息矩阵和期望的信息向量,应用Givens旋转余弦元素计算误差信号,最后通过迭代更新的方式得到预测滤波器的预测系数。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1