语音交互系统及其创建方法和装置与流程

文档序号:11155573阅读:来源:国知局

技术特征:

1.一种用于创建语音交互系统的方法,其特征在于,包括:

接收语音用户交互流程图,所述语音用户交互流程图包括依照预定流程流转的多个流程;

基于所述多个流程创建知识库,所述知识库包括与所述多个流程相对应的多个知识点,每个知识点包括问题及其答案,

其中,所述多个流程包括第一流程和位于所述第一流程下游的第二流程,所述第一流程所对应的第一知识点的答案为问句型答案,且与所述第二流程所对应的第二知识点的问题是对所述第一知识点的问句型答案的响应;

提供语言模型以用于对用户的语音输入执行语音识别;以及

提供所述知识库中的知识点以用于对获得的语音识别结果执行语义识别。

2.如权利要求1所述的方法,其特征在于,每个知识点中的所述问题包括标准问以及该标准问的扩展问。

3.如权利要求2所述的方法,其特征在于,所述扩展问采用以下方式建立:

提供抽象语义数据库,所述抽象语义数据库包括多个抽象语义表达式,所述抽象语义表达式包括缺失语义成分;

根据所述抽象语义数据库对所述标准问进行抽象语义推荐处理,当获得与所述标准问对应的一个或多个抽象语义表达式时,从所述标准问中提取与一个或多个抽象语义表达式的缺失语义成分对应的内容,并将提取的内容填充到对应的缺失语义成分中以得到与所述标准问对应的一个或多个具体语义表达式,所述具体语义表达式作为所述标准问的扩展问。

4.如权利要求3所述的方法,其特征在于,所述抽象语义推荐处理包括:

对所述标准问进行分词处理,得到若干单词,所述单词为语义规则词或非语义规则词;

分别对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息;

分别对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息;

根据所述词性信息和词类信息对抽象语义数据库进行搜索处理,得到与所述标准问匹配的抽象语义表达式。

5.如权利要求4所述的方法,其特征在于,所述抽象语义表达式还包括语义规则词,与所述标准问匹配的抽象语义表达式满足以下条件:

抽象语义表达式的缺失语义成分对应的词性包括标准问对应的填充内容的词性;

抽象语义表达式和标准问中对应的语义规则词相同或属于同一词类;

抽象语义表达式的顺序与标准问的表达顺序相同。

6.如权利要求1所述的方法,其特征在于,所述提供语言模型包括:

针对每个流程,训练专用于该流程的下游流程的语言模型,以用来关于所述下游流程执行用户语音输入的语音识别。

7.如权利要求6所述的方法,其特征在于,所述训练包括利用与所述下游流程相对应的知识点中的问题作为语音训练语料训练语言模型。

8.如权利要求7所述的方法,其特征在于,所述语言模型通过采用SRILM工具进行训练。

9.如权利要求1所述的方法,其特征在于,所述提供所述知识库中的知识点包括:

针对每个流程,提供与该流程的下游流程所对应的知识点,以用来关于所述下游流程执行语音识别结果的语义识别。

10.一种用于创建语音交互系统的装置,其特征在于,包括:

接收模块,用于接收语音用户交互流程图,所述语音用户交互流程图包括依照预定流程流转的多个流程;

知识库创建模块,用于基于所述多个流程创建知识库,所述知识库包括与所述多个流程相对应的多个知识点,每个知识点包括问题及其答案,

其中,所述多个流程包括第一流程和位于所述第一流程下游的第二流程,所述第一流程所对应的第一知识点的答案为问句型答案,且与所述第二流程所对应的第二知识点的问题是对所述第一知识点的问句型答案的响应;

语言模型训练模块,用于提供语言模型以用于对用户的语音输入执行语音识别;以及

知识点分配模块,提供所述知识库中的知识点以用于对获得的语音识别结果执行语义识别。

11.如权利要求10所述的装置,其特征在于,每个知识点中的所述问题包括标准问以及该标准问的扩展问。

12.如权利要求11所述的装置,其特征在于,还包括

抽象语义数据库,所述抽象语义数据库包括多个抽象语义表达式,所述抽象语义表达式包括缺失语义成分;

其中,所述知识库创建模块包括扩展单元,用于根据所述抽象语义数据库对所述标准问进行抽象语义推荐处理,当获得与所述标准问对应的一个或多个抽象语义表达式时,从所述标准问中提取与一个或多个抽象语义表达式的缺失语义成分对应的内容,并将提取的内容填充到对应的缺失语义成分中以得到与所述标准问对应的一个或多个具体语义表达式,所述具体语义表达式作为所述标准问的扩展问。

13.如权利要求12所述的装置,其特征在于,所述扩展单元包括:

分词子单元,用于对所述标准问进行分词处理,得到若干单词,所述单词为语义规则词或非语义规则词;

词性标注子单元,用于分别对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息;

词类判断子单元,用于分别对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息;

搜索子单元,用于根据所述词性信息和词类信息对抽象语义数据库进行搜索处理,得到与所述标准问匹配的抽象语义表达式。

14.如权利要求13所述的装置,其特征在于,所述抽象语义表达式还包括语义规则词,与所述标准问匹配的抽象语义表达式满足以下条件:

抽象语义表达式的缺失语义成分对应的词性包括标准问对应的填充内容的词性;

抽象语义表达式和标准问中对应的语义规则词相同或属于同一词类;

抽象语义表达式的顺序与标准问的表达顺序相同。

15.如权利要求10所述的装置,其特征在于,所述语言模型训练模块针对每个流程,训练专用于该流程的下游流程的语言模型,以用来关于所述下游流程执行用户语音输入的语音识别。

16.如权利要求15所述的装置,其特征在于,所述语言模型训练模块利用与所述下游流程相对应的知识点中的问题作为语音训练语料训练语言模型。

17.如权利要求16所述的装置,其特征在于,所述语言模型训练模块采用SRILM工具训练语言模型。

18.如权利要求10所述的装置,其特征在于,所述知识点分配模块针对每个流程,提供与该流程的下游流程所对应的知识点,以用来关于所述下游流程执行语音识别结果的语义识别。

19.一种语音交互系统,其特征在于,包括:

如权利要求1-9中任一项所述的方法创建的知识库;

语音识别模块,用于采用如权利要求1-9中任一项所述的方法所提供的语言模型对用户语音输入执行语音识别;

语义识别模块,用于采用所述知识库中的相应知识点对所述语音识别结果执行语义识别;以及

输出模块,用于基于语音识别结果向用户提供响应输出。

20.如权利要求19所述的语音交互系统,其特征在于,所述语义识别模块包括:

语义相似度计算模块,将所述语音识别结果与相应知识点中的问句执行语义相似度计算计算,语义相似度高于阈值的问句中具有最高语义相似度的问句被确定为匹配问句,

所述输出模块将与所述匹配问题相关联的答案提供给用户作为所述响应输出。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1