音频信号处理装置的制造方法_5

文档序号：9355743阅读：来源：国知局

可以考虑更多的标准。正如2003年C.Faller和F.Baumgarte在《IEEE语音和音频处理汇刊》第十一卷(第六期)中刊登的《双耳线索编码第二部分:方案及其应用》中所描述的，更多的标准如声道间相干性或互关联性可以用来评估音频信号的浸入感。
[0176]在一种实现方式中，所述确定705以如下方式实现:可以确定所述信号的浸入感。为实现此目的，所有上述的标准可以用来获得所述信号浸入程度。例如，对于包含大量声源的场景，且这些声源有位于两个扬声器和/或耳机之间的线段外的感知相关的一致的定位线索，进一步增强立体声基线的处理可能没有益处。所述声源位置标准可以与一致性标准或程度结合。在感知中，定位线索的一致性非常重要。如果有更多一致的定位线索，所述感知就会更加自然且所述场景就更具有浸入感。
[0177]在一种实现方式中，所述生成707以如下方式实现:基于根据上述任一标准的分析，可以生成所述指示信号405，该指示信号指示立体声增强技术是否应该应用到所述立体声音频信号中以加强所述听觉体验。
[0178]下面给出了所述分析方法700的四种可选的实现方式，以增大复杂性。
[0179]在一种实现方式中，所述分析方法700包括分析所述音频声道的相似度。所述定位线索可以包括描述所述音频信号的音频声道的相似度如关联性的量的声道间相干性(IC)程度，其值在O和I之间。可以分析所述IC程度来获得所述边信息信号。IC越低，所感知的宽度越大，所述音频信号更可能是双耳音频信号，从立体声增强中受益越小。这可以通过基于阈值的决策来实现。
[0180]因此，在一种实现方式中，例如，所述方法700包括:从所述输入音频信号407中提取IC值，例如，全频带IC值或一个、若干或所有子带的IC值；将所述IC值与预先确定的IC阈值比较，并生成包含第一值的所述指示信号，其中，如果所述全频带IC值、所述一个IC值或者所述若干或所有IC值的子集小于所述预先确定的IC阈值，则所述第一值指示所述音频信号是双耳信号，和/或生成包含第二值的所述指示信号，其中，如果全频带IC值、所述一个IC值或者若干或所有IC值的子集大于或等于所述预先确定的IC阈值，则所述第二值表示所述音频信号是立体声信号。
[0181]在一种实现方式中，所述分析方法700包括分析声源的位置。所述定位线索可以包括声道间时间差以及声道间电平差的大小。简单的三角测量可以以角度的方式测量声源的方向。O度角可以认为是在中心，±90°可以在左边或右边。声源的角度偏离O度越多，感知到的宽度越大，且所述信号更不可能从增强中获益。这可以是一个基于阈值的简单判决。典型地，对于立体声信号，可以假设声源在±45°或±60°的范围内。
[0182]因此，在一种实现方式中，所述方法700包括:从所述输入音频信号407中提取如ITD和/或ILD值等IC值，例如，全频带IC值或一个、若干或所有子带的IC值；确定所述全频带IC值的角度或一个、若干或所有子带的角度，以将所述角度与预先确定的角度阈值±45°或±60°比较，并生成包含第一值的所述指示信号，其中，如果全频带IC值的角度、所述一个角度或者若干或所有角度的子集大于所述预先确定的角度阈值，则所述第一值指示所述音频信号是双耳信号，和/或生成包含第二值的所述指示信号，其中，如果全频带IC值的角度、所述一个角度或者若干或所有角度的子集小于或等于所述预先确定的角度阈值，则所述第二值表示所述音频信号是立体声信号。
[0183]在一种实现方式中，所述分析方法700包括分析定位线索的一致性。所述定位线索可以包括声道间时间差和声道间电平差的大小。对于所述声道间时间差和声道间电平差，可以分别确定声源的方向或角度。对于每一个声源，可以获得两个单独的声源角度估算结果。可以确定两个角度估算间的绝度角度差。差值大于10°或20°会造成不一致的定位结果。大量的不一致定位结果可以表示音频信号是立体声信号，其中，声源位置是手动平移的。对于双耳信号，所述定位结果通常是一致的，因为这些结果是从自然场景的描述中得到的。
[0184]因此，在一种实现方式中，所述方法700包括:从所述输入音频信号407中提取如ITD和ILD值的两种IC值，比如，两个全频段IC值或一个子带、若干或所有子带中每个子带的两个IC值；确定两个全频段IC值的角度、以及所述一个、若干或所有子带中每个子带的两个角度，以将第一 IC类型的角度与第二 IC类型的角度比较，将所述角度间的差与预先确定的角度差阈值如±10°或±20°比较，且生成包含第一值的所述指示信号，其中，如果全频带角度差、所述一个角度差或者若干或所有角度差的子集小于所述预先确定的角度阈值，则所述第一值指示所述音频信号是双耳信号，和/或生成包含第二值的所述指示信号，其中，如果全频带角度差、所述一个角度差或者若干或所有角度差的子集大于或等于所述预先确定的角度阈值，则所述第二值指示所述音频信号是立体声信号。
[0185]在一种实现方式中，所述分析方法700包括HRTF匹配。所述定位线索可以使用头部相关传输函数(HRTF)进行编码。头部相关传输函数(HRTF)可以针对给定的声源角度，捕获一套完整的定位线索。所述一套完整的定位线索可能存在于双耳音频信号中，但不可能在立体声音频信号中存在。当采用仿真头录制双耳音频信号时，声源发出的信号可以被与所述声源的角度对应的一对左耳HRTF和/或右耳HRTF滤波，以获得所述双耳音频信号。因此，通过采用与所述声源角度对应的这对左耳HRTF和/或右耳HRTF来对双耳音频信号进行逆滤波，可以获得两个信道的原始信号。在双耳音频信号的情况下，这两个信号是几乎完全相同的。在一种实现方式中，所述HRTF匹配以如下方式实现:对于所有可能的声源角度，可以给出一套左耳和/或右耳HRTF对。可以采用每对HRTF对所述信号进行逆滤波以及计算所述产生的左耳信号和/或右耳信号之间的关联性。得出最大关联性的这对HRTF可以定义声源的位置和/或角度。关联性在O到I之间相对应的值可以说明所述信号中定位线索的一致性程度。较大的值可以说明所述音频信号是双耳信号，较小的值可以说明所述音频信号是立体声信号。该步骤通常是最准确的步骤，但在计算中却花费更多。
[0186]图8示出了一种音频信号处理系统800的示意图。所述音频信号处理系统800包括基于图4示例性地描述的音频信号处理装置400和基于图5和图6示例性地描述的分析器 500 和 600。
[0187]所述音频信号处理装置400包括转换器401和确定器403。向所述确定器403提供指示信号405和输入音频信号407。所述音频信号处理装置400提供了输出音频信号409。所述确定器403提供了确定器信号411和确定器信号413。所述转换器401提供了转换器信号415。
[0188]所述分析器500和600用于分析所述输入音频信号407，以生成指示所述输入音频信号407是立体声音频信号还是双耳音频信号的所述指示信号405。所述分析器500和600还用于从所述输入音频信号407中提取定位线索，其中，所述定位线索指示音频源的位置。另外，所述分析器500和600用于分析所述定位线索以生成所述指示信号405。
[0189]在这种实现方式中，所述分析器500和600还用于在所述分析器500和600的输出端口向所述确定器403提供所述输入音频信号407。
[0190]在一种实现方式中，所述音频信号处理系统800根据所述信号的内容实现了用于自适应处理输入音频信号407的全自动化系统。
[0191]在一种实现方式中，所述音频信号处理系统800实现了对输入音频信号407基于内容的全自动自适应处理。该系统可以在智能手机、MP3播放器和PC声卡中实现，以在无需听者的进行任何人工干预的情况下提供浸入式听觉体验。所述系统可以接收输入音频信号407并输出输出音频信号409，该输出音频信号409营造了浸入式听觉体验。特别地，所述系统可以自动地决策是应该加入合成双耳线索以增强立体声信号的宽度还是保留所述输入音频信号407的原始双耳线索。所述决策可以基于对所述输入音频信号407的内容分析。
[0192]在一种实现方式中，如果有输入音频信号407，所述分析器500和600分析所述信号，以确定所述信号的声音场景是否营造了浸入式听觉体验。所述分析结果可以以所述指示信号405的形式提供，该指示信号指示所述声音场景是否是浸入式。基于所述指示信号405，所述确定器403可以对所述信号进行处理。如果所述输入音频信号407的声音场景是浸入式，所述原始双耳线索和所述原始声音场景能够得以保留。如果所述输入音频信号407的声音场景不是浸入式，应用立体声增强技术，以创造更宽的立体声声场和/或声源在头部以外的感觉。返回所述输出音频信号409，以营造浸入式听觉体验。
[0193]在一种实现方式中，根据所述信号的内容全自动地对所述输入音频信号407进行处理。不需要任何人工干预。
[0194]在一种实现方式中，所述分析器500和600用于确定所述输入音频信号407是否为双耳音频信号。
[0195]图9示出了一种用于处理音频信号的方法900的示意图。所述方法900包括:根据指示信号405确定901所述音频信号是立体声音频信号还是双耳音频信号，该指示信号405指示所述音频信号是立体声音频信号还是双耳音频信号。所述方法900还包括:如果所述音频信号是立体声音频信号，则将所述立体声音频信号转换903为双耳音频信号。
[0196]图10示出了一种用于分析音频信号的方法1000的示意图。所述方法1000用于分析所述音频信号以生成指示所述音频信号是立体声音频信号还是双耳音频信号的指示信号405。所述方法1000包括从所述音频信号中提取1001定位线索，所述定位线索指示音频源的位置。所述方法1000还包括分析1003所述定位线索以生成所述指示信号405。
[0197]在一种实现方式中，所述用于分析音频信号的方法1000包括所述分析方法700。
[0198]在本发明上述的实现方式中，如所述分析器、确定器以及所述分析结果的存储和传输可以应用到一些不同的可能的实施例中。这些实施例可以针对不同的场景并在所有考虑到的场景中，在无需听者进行任何人工干预的情况下就能提供浸入式听觉体验。
[0199]正如1997年Blauert，J.在马萨诸塞州剑桥市的MIT出版社出版的《空间听觉:人类声定位的心理物理学》中所描述的，人类听觉系统可以采用若干种线索

完整全部详细技术资料下载

当前第5页1 2 3 4 5 6