用于确定编码模式的方法和设备、用于对音频信号进行编码的方法和设备以及用于对音...的制作方法_3

文档序号：9204315阅读：来源：国知局

所述误差概率。
[0077] 接下来，可根据下面的等式8,针对与恒定拖尾长度相同数量的多个帧，计算所有帧仅包括音乐信号的音乐概率P m和所有帧仅包括语音信号的语音概率P s。拖尾长度可被设置为8,但不限于此。八个帧可包括当前帧和7个先前帧。
[0078] [等式 8]
[0081] 接下来，可通过使用利用等式5或等式6获取的音乐概率Pm或语音概率Ps来计算多个状况（condition)集合 {<}和{1^}(3下面将参照图6给出其详细描述。这里，可按照每个状况对于音乐具有值1并且对于语音具有值0的方式进行设置。
[0082] 参照图6,在操作610和操作620,可从通过使用音乐概率Pm和语音概率Ps计算出的多个状况集合{<}和丨^^}来获取音乐状况之和M以及语音状况之和S。换句话说，音乐状况之和M以及语音状况之和S可如下面的等式9中所示来表达。
[0083] [等式 9]
[0086] 在操作630,将音乐状况之和M与指定的阈值Tm进行比较。如果音乐状况之和M 大于所述阈值Tm，则当前帧的编码模式被切换为音乐模式（即，谱域编码模式）。如果音乐状况之和M小于或等于阈值Tm，则当前帧的编码模式不被改变。
[0087] 在操作640,将语音状况之和S与指定阈值Ts进行比较。如果语音状况之和S大于阈值Ts，则当前帧的编码模式被切换为语音模式（即，线性预测域编码模式）。如果语音状况之和S小于或等于阈值Ts，则当前帧的编码模式不被改变。
[0088] 阈值Tm和阈值Ts可被设置为预先经由实验或仿真而获取的值。
[0089] 图5是示出根据示例性实施例的特征参数提取单元500的配置的框图。
[0090] 图5中示出的初始编码模式确定单元500可包括变换单元510、频谱参数提取单元 520、时间参数提取单元530和确定单元540。
[0091] 在图5中，变换单元510可将原始音频信号从时域变换到频域。这里，变换单元 510可应用各种任意变换技术以将音频信号从时域表示为谱域。所述技术的实例可包括快速傅里叶变换（FFT)、离散余弦变换（DCT)或改进离散余弦变换（MDCT)，但不限于此。
[0092] 频谱参数提取单元520可从由变换单元510提供的频域音频信号提取至少一个频谱参数。频谱参数可被归类为短期特征参数和长期特征参数。可从当前帧获取短期特征参数，而可从包括当前帧和至少一个先前帧的多个帧获取长期特征参数。
[0093] 时间参数提取单元530可从时域音频信号提取至少一个时间参数。时间参数也可被归类为短期特征参数和长期特征参数。可从当前帧获取短期特征参数，而可从包括当前帧和至少一个先前帧的多个帧获取长期特征参数。
[0094] (图4的）确定单元（430)可通过使用由频谱参数提取单元520提供的频谱参数以及由时间参数提取单元530提供的时间参数来确定音频信号的类别，并可基于所确定的类别来确定初始编码模式。（图4的）确定单元（430)可采用软判决机制。
[0095] 图7是示出根据示例性实施例的编码模式校正单元310的操作的示图。
[0096] 参照图7,在操作700,由初始编码模式确定单元310确定的初始编码模式被接收，并且可确定编码模式是时域模式（即，时域激励模式）还是谱域模式。
[0097] 在操作701，如果在操作700确定初始编码模式是谱域模式（stateTS= = 1)，则可检查指示频域激励编码是否更加合适的索引Statenss。可通过使用不同频段的音调来获取指示频域激励编码（例如，GSC)是否更加合适的索引State nss。下面将给出其详细描述。
[0098] 低频段信号的音调可被获取为具有包括最小值的多个较小值的多个频谱系数之和与具有针对给定频段的最大值的频谱系数之间的比率。如果给定频段是 0~IkHzU~ 2kHz和2~4kHz，则各个频段的音高tQ1、心2和1 24以及低频段信号（即，核心频段）的音调\可如下面的等式10中所示被表达。
[0099] [等式 10]
[0104] 同时，线性预测误差可通过使用线性预测编码（LPC)滤波器来获取并可被用于去除强音调分量。换句话说针对强音调分量，谱域编码模式比频域激励编码模式更加有效。
[0105] 用于通过使用如上所述获取的音调和线性预测误差切换到频域激励编码模式的前置条件(3〇11(1 &_可如下面的等式11中所示被表达。
[0106] [等式 11]
[0107] COndfront - t 12〉t 12frontJl t 24〉t 24fr〇ntJl t L〉t 1^。111；且 err〉err from
[0108] 这里，t12fMnt、t24fMnt、I^fwnt和err fMnt是阈值，并可具有预先经由实验或仿真而获取的值。
[0109] 同时，用于通过使用如上所述获取的音调和线性预测误差来完成频域激励编码模式的后置条件Cond badt可如下面的等式12中所示被表达。
[0110] [等式 12]
[0111] Condback - t i2< t 12back且 124< 124back且 t L< t Lbock
[0112] 这里，t12baek、t24baek、Uadt是阈值并可具有预先经由实验或仿真而获取的值。
[0113] 换句话说，可通过确定等式11中所示的前置条件是否被满足或是等式12中所示的后置条件是否被满足来确定索引State nss是否为1，其中，索引state ^^^指不频域激励编码（例如，GSC)是否比谱域编码更加合适。这里，对图12中示出的后置条件的确定可以是可选的。
[0114] 在操作702,如果索引1，则频域激励编码模式可被确定为最终编码模式。在这种情况下，作为初始编码模式的谱域编码模式被校正为作为最终编码模式的频域激励编码模式。
[0115] 在操作705,如果在操作701确定索引0,则可检查用于确定音频信号是否包括强语音特性的索引State ss。如果在对谱域编码模式的确定中存在错误，则频域激励编码模式会比谱域编码模式更加有效。可通过使用浊音参数和相关度参数之间的差VC 来获取用于确定音频信号是否包括强语音特性的索引statess。
[0116] 用于通过使用浊音参数和相关度参数之间的差vc来切换到强语音模式的前置条件(：〇11(1 &_可如下面的等式13中所示被表达。
[0117] [等式 13]
[0118] Condfront= vc > vc front
[0119] 这里，％&_是阈值并可具有预先经由实验或仿真而获取的值。
[0120] 同时，用于通过使用浊音参数和相关度参数之间的差vc来结束强语音模式的后置条件Cond badt可如下面的等式14中所示被表达。
[0121] [等式 14]
[0122] Condback= vc < vc back
[0123] 这里，Vcbadt是阈值并可具有预先经由实验或仿真而获取的值。
[0124] 换句话说，在操作705,可通过确定等式13中示出的前置条件是否被满足或是等式14中示出的后置条件是否未被满足来确定索引State ss是否为1，其中，索引StatesJg 示频域激励编码（例如，GSC)是否比谱域编码更加合适。这里，对等式14中示出的对后置条件的确定可以是可选的。
[0125] 在操作706,如果在操作705确定索引statessS〇(即，音频信号不包括强语音特性），则谱域编码模式可被确定为最终编码模式。在这种情况下，作为初始编码模式的谱域编码模式被保持为最终编码模式。
[0126] 在操作707,如果在操作705确定索引StatessS 1( 即，音频信号包括强语音特性），则频域激励编码模式可被确定为最终编码模式。在这种情况下，作为初始编码模式的谱域编码模式被校正为作为最终编码模式的频域激励编码模式。
[0127] 通过执行操作700、701和705,对作为初始编码模式的谱域编码模式的确定中的错误可被校正。详细地讲，作为初始编码模式的谱域编码模式可被保持作为最终编码模式，或可被切换为频域激励编码模式作为最终编码模式。
[0128] 同时，如果在操作700确定初始编码模式是线性预测域编码模式（stateTS= = 0)，则用于确定音频信号是否包括强音乐特性的索引被检查。如果在对线性预测域编码模式（即，时域激励编码模式）的确定中存在错误，则频域激励编码模式可能比时域激励编码模式更加有效。可通过使用从1减去浊音参数和相关度参数之间的差vc而获取的值1-vc来获取用于确定音频信号是否包括强音乐特性的state SM。
[0129] 用于通过使用通过从1减去池音参数和相关度参数之间的差vc而获取的值1-vc 而切换到强音乐模式的前置条件(3〇11(1&_可如下面的等式15中所示被表达。
[0130] [等式 15]
[0131 ] COndfront= 1-vc > Vcmfront
[0132] 这里，阈值并可具有预先经由实验或仿真而获取的值。
[0133] 同时，用于通过使用

完整全部详细技术资料下载

当前第3页1 2 3 4