信号编码方法及设备的制造方法_3

文档序号:9472492阅读:来源:国知局
D帖, 将根据SID帖生成舒适噪声,而编码器可W预测到该舒适噪声。然后,编码器可W估计该舒 适噪声与输入编码器的实际静音信号的偏离程度。此处的偏离程度也可W理解为近似程 度。如果预测到的舒适噪声与实际静音信号足够接近,那么编码器可W认为无需设置拖尾 区间或者无需继续延长拖尾区间。
[0108] 在现有技术中,通过简单地统计语音活动帖的数量来确定是否执行固定长度的拖 尾区间。也就是,如果有足够数量的语音活动帖被连续编码,那么就设置固定长度的拖尾区 间。不论当前输入帖为第一个静音帖还是处于拖尾区间的第n个静音帖,当前输入帖均会 被编码为拖尾帖。然而,不必要的拖尾帖会造成通信带宽的浪费。而本发明实施例中,通过 根据预测的舒适噪声与实际静音信号的偏离程度确定当前输入帖的编码方式,而非简单地 依据语音活动帖的数量来确定当前输入帖编码为拖尾帖,因此能够节省通信带宽。
[0109] 本发明实施例中,通过在当前输入帖的前一帖的编码方式为连续编码方式的情况 下,预测在当前输入帖被编码为SID帖的情况下解码器根据当前输入帖生成的舒适噪声, 并确定舒适噪声与实际静音信号的偏离程度,根据该偏离程度确定当前输入帖的编码方式 为拖尾帖编码方式或SID帖编码方式,而非简单地根据统计得到的语音活动帖的数量将当 前输入帖编码为拖尾帖,从而能够节省通信带宽。
[0110] 可选地,作为一个实施例,在步骤210中,编码器可W采用第一预测方式,预测舒 适噪声,其中第一预测方式与解码器用于生成舒适噪声的方式相同。 阳111] 具体地,编码器与解码器可W采用相同的方式确定舒适噪声。或者,编码器与解码 器也可W分别采用不同的方式确定舒适噪声。本发明实施例对此不做限定。
[0112] 可选地,作为一个实施例,在步骤210中,编码器可W预测舒适噪声的特征参数, 并确定实际静音信号的特征参数,其中舒适噪声的特征参数与实际静音信号的特征参数是 一一对应的。在步骤220中,编码器可W确定舒适噪声的特征参数与实际静音信号的特征 参数之间的距离。
[0113] 具体地,编码器可W比较舒适噪声的特征参数与实际静音信号的特征参数之间的 距离,从而确定舒适噪声与实际静音信号的偏离程度。舒适噪声的特征参数与实际静音信 号的特征参数应当是一一对应的。也就是说,舒适噪声的特征参数的类型与实际静音信号 的特征参数的类型是相同的。例如,编码器可W将舒适噪声的能量参数与实际静音信号的 能量参数进行比较,也可W将舒适噪声的谱参数与实际静音信号的谱参数进行比较。
[0114] 本发明实施例中,当特征参数为标量时,特征参数之间的距离可W指特征参数之 间的差值的绝对值,即标量距离。当特征参数为矢量时,特征参数之间的距离可W是指特征 参数之间对应元素的标量距离的和。
[0115] 可选地,作为另一实施例,在步骤230中,编码器可W在舒适噪声的特征参数与实 际静音信号的特征参数之间的距离小于阔值集合中对应阔值的情况下,确定当前输入帖的 编码方式为SID帖编码方式,其中舒适噪声的特征参数与实际静音信号的特征参数之间的 距离与阔值集合中的阔值是一一对应的。编码器也可W在舒适噪声的特征参数与实际静音 信号的特征参数之间的距离大于或等于阔值集合中对应阔值的情况下,确定当前输入帖的 编码方式为拖尾帖编码方式。
[0116] 具体地,舒适噪声的特征参数和实际静音信号的特征参数均可W包括至少一个参 数,因此,舒适噪声的特征参数与实际静音信号的特征参数之间的距离也可W包括至少一 种参数之间的距离。阔值集合也可W包括至少一个阔值。每种参数之间的距离可W对应于 一个阔值。在确定当前输入帖的编码方式时,编码器可W分别将至少一种参数之间的距离 与阔值集合中对应的阔值进行比较。阔值集合中的至少一个阔值可W是预先设定的,也可 W是由编码器根据当前输入帖之前的多个静音帖的特征参数确定的。
[0117] 如果舒适噪声的特征参数与实际静音信号的特征参数之间的距离小于阔值集合 中对应阔值,编码器可w认为舒适噪声与实际静音信号足够接近,从而可w将当前输入帖 编码为SID帖。如果舒适噪声的特征参数与实际静音信号的特征参数之间的距离大于或等 于阔值集合中对应阔值,那么编码器可W认为舒适噪声与实际静音信号偏离较大,从而可 W将当前输入帖编码为拖尾帖。
[0118] 可选地,作为另一实施例,上述舒适噪声的特征参数可W用于表征W下至少一种 信息:能量信息,谱信息。
[0119] 可选地,作为另一实施例,上述能量信息可W包括CELP激励能量。上述谱信息可W包括W下至少一种:线性预测滤波器系数,FFT系数,MDCT系数。线性预测滤波器系数可 W包括W下至少一种:LSF系数,LSP系数,ISF系数,ISP系数,反射系数,LPC系数。
[0120] 可选地,作为另一实施例,在步骤210中,编码器可W确定当前输入帖的特征参数 作为实际静音信号的特征参数。或者,编码器可W对M个静音帖的特征参数进行统计处理, W确定实际静音信号的特征参数。 阳121] 可选地,作为另一实施例,上述M个静音帖可W包括当前输入帖W及当前输入帖 之前的(M-1)个静音帖,M为正整数。
[0122] 例如,如果当前输入帖为第一个静音帖,那么实际静音信号的特征参数可W是当 前输入帖的特征参数;如果当前输入帖为第n个静音帖,那么实际静音信号的特征参数可 W是编码器对包含当前输入帖在内的M个静音帖的特征参数进行统计处理得到的。M个静 音帖可W是连续的,也可W是不连续的,本发明实施例对此不做限定。
[0123]可选地,作为另一实施例,在步骤210中,编码器可W根据当前输入帖的前一帖的 舒适噪声参数和当前输入帖的特征参数,预测舒适噪声的特征参数。或者,编码器可W根据 当前输入帖之前的L个拖尾帖的特征参数和当前输入帖的特征参数,预测舒适噪声的特征 参数,L为正整数。
[0124] 例如,如果当前输入帖为第一个静音帖,那么编码器可W根据前一帖的舒适噪声 参数和当前输入帖的特征参数预测舒适噪声的特征参数。编码器对每一帖进行编码时,会 在编码器内部保存每一帖的舒适噪声参数。通常只有在输入帖为静音帖时,运个保存的舒 适噪声参数才会较前一帖时发生变化,因为编码器可能会根据当前输入静音帖的特征参数 对保存的舒适噪声参数进行更新,而在当前输入帖为语音活动帖时通常不对舒适噪声参数 进行更新。因此,编码器可W获取内部存储的前一帖的舒适噪声参数。例如,舒适噪声参数 可W包括静音信号的能量参数和谱参数。
[01巧]此外,如果当前输入帖正处于拖尾区间,编码器可W根据当前输入帖之前的L个 拖尾帖的参数进行统计,根据统计得到的结果和当前输入帖的特征参数,得到舒适噪声的 特征参数。
[01%] 可选地,作为另一实施例,舒适噪声的特征参数可W包括舒适噪声的CELP激励能 量和舒适噪声的LSF系数,实际静音信号的特征参数可W包括实际静音信号的CELP激励能 量和实际静音信号的LSF系数。在步骤220中,编码器可W确定舒适噪声的CELP激励能量 与实际静音信号的CELP激励能量之间的距离De,并可W确定舒适噪声的LSF系数与实际静 音信号的LSF系数之间的距离Dlsf。
[0127]应注意,此处距离De和距离D1sf可W包含一个变量,也可W包含一组变量。例如, 距离Dlsf可W包含两个变量,一个可W是平均的LSF系数的距离,即每个对应LSF系数的 距离的均值。另一个可W是LSF系数间的最大距离,即距离最大的那对LSF系数之间的距 离。
[0128] 可选地,作为另一实施例,在步骤230中,在距离De小于第一阔值,且距离Dlsf小 于第二阔值的情况下,编码器可W确定当前输入帖的编码方式为SID帖编码方式。在距离 De大于或等于第一阔值,或者距离Dlsf大于或等于第二阔值的情况下,编码器可W确定当 前输入帖的编码方式为拖尾帖编码方式。其中,第一阔值和第二阔值均属于上述阔值集合。
[0129] 可选地,作为另一实施例,当De或Dlsf包含一组变量时,编码器将一组变量中的 每个变量与其相对应的阔值做比较,从而确定W何种方式编码当前输入帖。
[0130] 具体地,编码器可W根据距离De和距离Dlsf,确定当前输入帖的编码方式。如果 距离De<第一阔值,并且距离Dlsf<第二阔值,则可W表明预测的舒适噪声的CELP激励能 量和LSF系数与实际静音信号的CELP激励能量和LSF系数差别都不大,则编码器可W认为 舒适噪声和实际静音信号足够接近,可W将当前输入帖编码为SID帖。否则,可W将当前输 入帖编码为拖尾帖。 阳131] 可选地,作为另一实施例,在步骤230中,编码器可W获取预设的第一阔值和预设 的第二阔值。或者,编码器可W根据当前输入帖之前的N个静音帖的CELP激励能量确定第 一阔值,并根据N个静音帖的LSF系数确定第二阔值,其中N为正整数。
[0132] 具体地,第一阔值和第二阔值均可W是预设的固定值。或者,第一阔值和第二阔值 均可W是自适应的变量。例如,第一阔值可W是编码器对当前输入帖之前的N个静音帖的 CELP激励能量统计得到的。第二阔值可W是编码器对当前输入帖之前的N个静音帖的LSF 系数统计得到的。N个静音帖可W是连续的,也可W是不连续的。
[0133] 下面将结合具体例子详细描述上述图2的具体过程。在下面图3a和图3b的例子 中,将W本发明实施例可应用的两个场景来进行描述。应理解,运些例子只是为了帮助本领 域技术人员更好地理解本发明实施例,而非限制本发明实施例的范围。
[0134] 图3a是根据本发明一个实施例的信号编码方法的过程的示意性流程图。在图3a 中,假设当前输入帖的前一帖的编码方式为连续编码方式,编码器内部的VAD确定当前输 入帖为输入语音信号进入静音段后的第一个静音帖。那么,编码器将需要确定是否设置拖 尾区间,也就是需要确定是将当前输入帖编码为拖尾帖还是SID帖。下面将详细描述该过 程。
[0135] 301a,确定实际静音信号的CELP激励能量和LSF系数。
[0136] 具体地,编码器可W将当前输入帖的CELP激励能量e作为实际静音信号的 CELP激励能量eSI,可W将当前输入帖的LSF系数Isf(i)作为实际静音信号的LSF系数 IsfSI(i),i= 0, 1,…,K-1,K为滤波器阶数。编码器可W参照现有技术,确定当前输入帖 的CELP激励能量W及LSF系数。
[0137] 302a,预测在当前输入帖被编码为SID帖的情况下解码器根据当前输入帖生成的 舒适噪声的CELP激励能量和LSF参数。
[0138] 编码器可W假设当前输入帖编码为SID帖,那么解码器将根据该SID帖生成舒适 噪声。对于编码器而言,其能够预测该舒适噪声的CELP激励能量eCN和LSF系数1sfCN(i), i= 0, 1,…,K-1,K为滤波器阶数。编码器可W根据编码器内部存储的前一帖的舒适噪声 参数和当前输入帖的CELP激励能量和LSF系数,分别确定舒适噪声的CELP激励能量和LSF 系数。
[0139] 例如,编码器可W按照等式(1)预测舒适噪声的CELP激励能量eCN:
[0140]eCN=0.4*eCN[1]+0.6*e (1) 阳141] 其中,eCN^可W表示前一帖的CELP激励能量,e可W表示当前输入帖的CELP激 励能量。 阳14引编码器可W按照等式(2)预测舒适噪声的LSF系数IsfCN(i),i=0,1,…,K-1,K为滤波器阶数。 阳 14引IsfCN(i) = 0. 4*lsfCN[i](i)+0. 6*lsf(i) 似
[0144] 其中,IsfCN^a)可W表示前一帖的LSF系数,Isf(i)可W表示当前输入帖的第 i个LSF系数。
[0145] 303a,确定舒适噪声的CELP激励能量与实际静音信号的CELP激励能量之间的距 离De,并确定舒适噪声的LSF系数与实际静音信号的LSF系数之间的距离Dlsf。 阳146] 具体地,编码器可W根据等式(3)确定舒适噪声的CELP激励能量与实际静音信号 的CELP激励能量之间的距离De: 阳 147]De=IlogzeCN-logzeI (3)
[0148] 编码器可W根据等式(4)确定舒适噪声的LSF系数与实际静音信号的LSF系数之 间的距离Dlsf:
[0149]
[0150] 304a,确定距离De是否小于第一阔值,并且距离Dlsf是否小于第二阔值。 阳151] 具体地,第一阔值和第二阔值均可W是预设的固定值。
[0152] 或者,第一阔值和第二阔值可W是自适应的变量。编码器可W根据当前输入帖之 前的N个静音帖的CELP激励能量确定第一阔值,例如,编码器可W按照等式(5)确定第一 阔值thrl: 阳 153]
[0154] 编码器可W根据N个静音帖的LSF系数确定第二阔值,例如,编码器可W按照等式 (6)确定第二阔值thr2 : 阳1巧]
阳156] 其中,在等式妨和等式(6)中,[X]可W表示第X帖,X可W为n、m或P。例如, e[m]可W表示第m帖的CELP激励能量。Isf[n] (i)可W表示第n帖的第i个LSF系数,IsfW(i)可W表示第P帖的第i个LSF系数。 阳157] 305曰,如果距离De小于第一阔值并且距离Dlsf小于第二阔值,则确定不设置拖尾 区间,将当前输入帖编码为SID帖。
[0158] 如果距离De小于第一阔值并且距离Dlsf小于第二阔值,则编码器可W认为解码 器能够生成的舒适噪声与实际的静音信号足够接近,那么可w不设置拖尾区间,那么将当 前输入帖编码为SID帖。 阳159] 306a,如果距离De大于或等于第一阔值,或者距离Dlsf大于或等于第二阔值,贝U 确定设置拖尾区间,将当前输入帖编码为拖尾帖。
[0160] 本发明实施例中,通过在根据在当前输入帖被编码为SID帖的情况下解码器根据 当前输入帖生成的舒适噪声与实际静音信号的偏离程度,确定当前输入帖的编码方式为拖 尾帖编码方式或SID帖编码方式,而非简单地根据统计得到的语音活动帖的数量将当前输 入帖编码为拖尾帖,从而能够节省通信带宽。 阳161] 图3b是根据本发明另一实施例的信号编码方法的过程的示意性流程图。在图3b 中,假设当前输入帖已处于拖尾区间。那么,编码器需要确定是否结束拖尾区间,也就是需 要确定是将当前输入帖编码继续为拖尾帖还是编码为SID帖。下面将详细描述该过程。 阳162] 30化,确定实际静音信号的CELP激励能量和LSF系数。 阳163] 可选地,类似于步骤301a,编码器可W将当前输入帖的CELP激励能量和LSF系数 作为实际静音信号的CELP激励能量和LSF系数。
[0164] 可选地,编码器可W对包括当前输入帖在内的M个静音帖的CELP激励能量进行统 计处理,得到实际静音信号的CELP激励能量。其中,M《拖尾区间内当前输入帖之前的拖 尾帖的数目。 阳1化]例如,编码器可W按照等式(7)确定实际静音信号的CELP激励能量eSI: 阳166]
[0167] 再例如,编码器可W按照等式(8)确定实际静音信号的LSF系数IsfSI(i),i= 0,1,…,K-1,K为滤波器阶数。
[0168]
[0169] 其中,在上述等式(7)和等式(8)中,w(j)可W表示加权系数,eLU可W表示当前 输入帖之前的第j个静音帖的CELP激励能量。
[0170] 302b,预测在当前输入帖被编码为SID帖的情况下解码器根据当前输入帖生成的 舒适噪声的CELP激励能量和LSF系数。 阳171] 具体地,编码器可W根据当前输入帖之前的L个拖尾帖的CELP激励能量和LSF系 数,分别确定舒适噪声的CELP激励能量eCN和LSF系数IsfCN(i),i= 0, 1,…,K-1,K为 滤波器阶数。 阳172] 例如,编码器可W按照等式(9)确定舒适噪声的CELP激励能量eCN: 阳173]
[0174] 其中,細〇LU可W表示当前输入帖之前的第j个拖尾帖的激励能量。
[01巧]再例如,编码器可W按照等式(10)确定舒适噪声的LSF系数IsfCN(i),i= 0, 1,…,K-1,K为滤波器阶数。 阳176]
[0177] 其中,Is甜0(i)W可W表示当前输入帖之前的第j个拖尾帖的第i个Isf系数。 阳17引在等式(9)和(10)中,wCi)可W表示加权系数。 阳1巧]303b,确定舒适噪声的CELP激励能量与实际静音信号的CELP激励能量之间的距 离De,并确定舒适噪声的LSF系数与实际静音信号的LSF系数之间的距离Dlsf。
[0180] 例如,编码器可W按照等式做确定舒适噪声的CELP激励能量与实际静音信号的 CELP激励能量之间的距离De。编码器可W根据等式(4)确定舒适噪声的LSF系数与实际 静音信号的LSF系数之间的距离Dlsf。 阳181] 304b,确定距离De是否小于第一阔值,并且距离Dlsf是否小于第二阔值。 阳182] 具体地,第一阔值和
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1