一种修复输入语音的方法及其装置的制造方法_4

文档序号：9709482阅读：来源：国知局

看图5，所述替换模块33包括修复替换单元331和通顺评估单元332。所述修复替换单元331分别将各纠正语音字段替换所述输入语音中的待修复语音字段，得到多条修复后的输入语音。所述通顺评估单元332对每一条修复后的输入语音进行语句通顺评估，根据所述语句通顺评估的结果确定最终修复的输入语音。
[0074]所述语句通顺评估是根据语音输入所使用的语言特点预设的规则，如每句话结束词特点、转折词特点、连词特点等。
[0075]例如，输入语音“不和你*#”中存在待修复的语音字段“*”、“#”，则从预设语音识别库中采用不同的语音识别算法获取与待修复的语音字段对应的纠正语音字段“说”、“了”以及与待修复的语音字段对应的纠正语音字段“所”、“在”。将待修复的语音字段替换成对应的纠正语音字段“说”、“了”或者“所”、“在”。输入语音“不和你*#，，修复成为“不和你说了”和“不和你所在”。对“不和你说了”和“不和你所在”进行语句通顺评估，得到“不和你说了”作为最终修复的输入语音。
[0076]所述服务器11将最终修复的输入语音发送给终端设备12，终端设备12选择发送原始输入语音或者经过修复后的输入语音进行通讯。当然所述服务器11也可以从所有修复的输入语音中选择语句通顺评估排名靠前的多条(如，三条)修复的输入语音发送给终端设备12，用户选择发送原始输入语音或者经过修复后的任一输入语音进行通讯。具体地，所述服务器11还将修复的语音字段发送给用户，令用户选择发送原始输入语音或者修复后的输入语音时进行参考。
[0077]本申请对接收的输入语音中的语音字段进行识别，以确定输入语音中是否存在待修复的语音字段，获取与待修复的语音字段相匹配的纠正语音字段。并将纠正语音字段替换所述输入语音中的待修复语音字段，得到修复后的输入语音。因此，本申请对输入语音进行了识别与修复，保证了输入语音的完整性，提升了用户体验。
[0078]下面以一具体实现来进一步说明本申请原理。
[0079]用户通过终端设备12输入语音“我先去买东西//不和你*#”，先对输入语音“我先去买东西//不和你*#”进行端点检测和语音增强。处理后的输入语音“我先去买东西//不和你*#”进行拆分后得到2句话，分别为“我先去买东西”、“不和你*#”，其中*、#为模糊发音。分别对上述2句话进行字段切分，将“我先去买东西”切分成为“我”、“先”、“去”、“买东西”;将“不和你*#”切分成为“不”、“和”、“你”、“*”、“#”。分别针对上述语音字段“我”、“先”、“去”、“买东西”和“不”、“和”、“你”、在本申请预设的语音识别库中进行识别，其中命中所述语音识别库的检索索引，被确定为待修复的语音字段。确定存在待修复的语音字段“*”、“#”，则从预设语音识别库中采用不同的语音识别算法获取与待修复的语音字段对应的纠正语音字段“说”、“了”以及与待修复的语音字段对应的纠正语音字段“所”、“在”。将待修复的语音字段替换成对应的纠正语音字段“说”、“了”或者“所”、“在”。输入语音“不和你*# ”修复成为“不和你说了 ”和“不和你所在”。对“不和你说了”和“不和你所在”进行语句通顺评估，得到“不和你说了”作为最终修复的输入语音。所述服务器11将最终修复的输入语音发送给终端设备12。参见图6，所述终端设备12接收修复后的输入语音和修复的语音字段，用户参考修复的语音字段选择发送原始输入语音或者经过修复后的输入语音进行通讯。
[0080]本申请对输入语音进行了识别与修复，保证了输入语音的完整性，提升了用户体验。
[0081]以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。
【主权项】
1.一种修复输入语音的方法，其特征在于，包括: 根据预设的语音识别库对接收的输入语音中的语音字段进行识别，确定所述输入语音中是否存在待修复的语音字段；如所述输入语音中存在待修复的语音字段，则从所述预设的语音识别库中获取与所述待修复的语音字段相匹配的纠正语音字段；以及将所述纠正语音字段替换所述输入语音中的待修复语音字段，得到修复后的输入语曰。2.根据权利要求1所述的方法，其特征在于，所述根据预设的语音识别库对接收的输入语音中的语音字段进行识别包括: 根据预设拆分规则将接收的输入语音拆分成至少一句话；根据预设的语音识别库分别对每句话中的语音字段进行识别。3.根据权利要求2所述的方法，其特征在于，所述拆分规则包括语速、间隔、关键语音字段中至少一种。4.根据权利要求3所述的方法，其特征在于，所述如输入语音中存在待修复的语音字段，则从所述预设的语音识别库中获取与所述待修复的语音字段相匹配的纠正语音字段还包括: 如所述预设的语音识别库中未能获取与所述待修复的语音字段相匹配的纠正语音字段，则根据预设的模糊音选优填字算法选择语音字段作为纠正语音字段。5.根据权利要求4所述的方法，其特征在于，所述与待修复的语音字段相匹配的纠正语音字段为至少两个纠正语音字段；所述将纠正语音字段替换所述输入语音中的待修复语音字段，得到修复后的输入语音包括: 分别将各纠正语音字段替换所述输入语音中的待修复语音字段，得到多条修复后的输入语音；对每一条修复后的输入语音进行语句通顺评估，根据所述语句通顺评估的结果确定最终修复的输入语音。6.一种修复输入语音的装置，其特征在于，包括: 检索模块，用于根据预设的语音识别库对接收的输入语音中的语音字段进行识别，确定所述输入语音中是否存在待修复的语音字段；修复模块，用于当所述输入语音中存在待修复的语音字段，则从所述预设的语音识别库中获取与所述待修复的语音字段相匹配的纠正语音字段；以及替换模块，用于将所述纠正语音字段替换所述输入语音中的待修复语音字段，得到修复后的输入语音。7.根据权利要求6所述的装置，其特征在于，所述检索模块中根据预设的语音识别库对接收的输入语音中的语音字段进行识别包括: 根据预设拆分规则将接收的输入语音拆分成至少一句话；根据预设的语音识别库分别对每句话中的语音字段进行识别。8.根据权利要求7所述的装置，其特征在于，所述拆分规则包括语速、间隔、关键语音字段中至少一种。9.根据权利要求8所述的装置，其特征在于，所述修复模块还用于当所述预设的语音识别库中未能获取与所述待修复的语音字段相匹配的纠正语音字段，则根据预设的模糊音选优填字算法选择语音字段作为纠正语音字段。10.根据权利要求9所述的装置，其特征在于，所述与待修复的语音字段相匹配的纠正语音字段为至少两个纠正语音字段；所述替换模块包括: 修复替换单元，用于分别将各纠正语音字段替换所述输入语音中的待修复语音字段，得到多条修复后的输入语音；通顺评估单元，用于对每一条修复后的输入语音进行语句通顺评估，根据所述语句通顺评估的结果确定最终修复的输入语音。
【专利摘要】本申请提供一种修复输入语音的方法及其装置，所述方法包括：根据预设的语音识别库对接收的输入语音中的语音字段进行识别，确定所述输入语音中是否存在待修复的语音字段；如所述输入语音中存在待修复的语音字段，则从所述预设的语音识别库中获取与所述待修复的语音字段相匹配的纠正语音字段；以及将所述纠正语音字段替换所述输入语音中的待修复语音字段，得到修复后的输入语音。本申请对输入语音进行修复，保证了输入语音的完整性。
【IPC分类】G10L21/00
【公开号】CN105469801
【申请号】CN201410462543
【发明人】陈紫微
【申请人】阿里巴巴集团控股有限公司
【公开日】2016年4月6日
【申请日】2014年9月11日

完整全部详细技术资料下载

当前第4页1 2 3 4