一种使用QR-RLS算法对多通道语音信号去混响方法与流程

文档序号：14680760发布日期：2018-06-12 22:12阅读：来源：国知局

技术特征：

1.一种使用QR-RLS算法对多通道语音信号去混响方法，其特征在于，该方法具体包括以下步骤：

S1：使用麦克风在封闭房间内采集带混响的语音信号；

S2：使用赛宾公式估计房间的混响时间T60，即直达声声压级下降60dB对应的时间，计算公式如下：

其中，α为房间吸声系数，V和S分别为房间的体积和表面积；

S3：将采集得到的带混响语音信号进行短时傅里叶变换，把信号由时域转化为频域，并在频域对带混响语音信号进行延迟处理得到延迟信号，信号延迟的阶数由预测滤波器的长度决定；

S4：通过混响时间T60计算混响语音信号的衰减常数Δ，从而估计出晚期混响信号和期望信号的功率谱密度，Δ的计算公式如下：

其中，Td为语音早期反射成分的时间；

S5：根据S4得到的期望信号功率谱密度的估计值计算期望信号2范数的加权系数；

S6：将延迟信号和带混响语音信号作为基于QR分解的RLS算法(QR-decomposition-based recursive least squares,QR-RLS)算法的输入数据，对其进行迭代更新，最后输出预测滤波器系数；

S7：将延迟信号与预测滤波器系数相乘得到晚期混响信号，带混响语音信号减去晚期混响信号等于去混响后的期望信号，对去混响后的期望信号进行逆傅里叶变换，得到时域上的去混响后的期望信号。

2.如权利要求1所述的一种使用QR-RLS算法对多通道语音信号去混响方法，其特征在于，所述步骤S4中，采用间隔一定距离的麦克风对混响语音进行采集，产生带混响语音数据，采用多通道线性预测(MCLP)模型对晚期混响信号进行建模，晚期混响信号成分u(n)即为延迟信号的和，即：

其中G(n)＝[g1(n),…,gM(n)]代表多输入多输出预测滤波器的预测系数，gM(n)为第M个麦克风的预测系数，为延迟后的带混响数据。

3.如权利要求1所述的一种使用QR-RLS算法对多通道语音信号去混响方法，其特征在于，所述步骤S4中，晚期混响信号和期望信号的功率谱密度的估计：

假设晚期混响信号的功率谱密度是基于指数衰减的模型，首先计算衰减系数Δ，估计房间的混响时间T60、语音早期反射成分的时间Td；然后估计晚期混响信号和带混响语音信号的功率谱密度(power spectral density,PSD)，两者相减得到期望信号的PSD；在期望信号PSD的计算中需要对其平滑处理。

4.如权利要求1所述的一种使用QR-RLS算法对多通道语音信号去混响方法，其特征在于，所述步骤S5中，所述期望信号2范数的加权系数计算为：

线性预测滤波器系数估计基于期望信号在时域的最大稀疏性，即期望信号的混合p范数；预测滤波器系数的最优化问题使用QR-RLS算法来解决，使用加权2范数来近似表示p范数，加权2范数的权系数依赖于期望信号PSD，则期望信号2范数的加权系数计算公式如下：

其中，M是麦克风的数量，ε是非常小的正数，p是范数，是期望信号的PSD估计值。

5.如权利要求1所述的一种使用QR-RLS算法对多通道语音信号去混响方法，其特征在于，所述步骤S6中，QR-RLS算法自适应计算预测滤波器的预测系数：

首先对QR-RLS算法中的参数进行初始化，对输入数据的矩阵进行对角化，通过基本的Givens旋转矩阵得到所有的三角化矩阵；计算Givens旋转元素，将旋转元素分别用于信息矩阵和期望的信息向量，应用Givens旋转余弦元素计算误差信号，最后通过迭代更新的方式得到预测滤波器的预测系数。

完整全部详细技术资料下载

当前第2页1 2 3