用认知洞察力导航视频场景的制作方法

文档序号：20167394发布日期：2020-03-24 21:54阅读：来源：国知局

技术特征：

1.一种用于从数据库获取场景的计算机实现的方法，该方法包括：

从用户接收对存储在数据库中的场景的搜索请求，该数据库包括带注释的视频内容；

从搜索请求中提取一个或多个关键词；

为所述一个或多个关键词中的每一个生成一个或多个扩展关键词；

将所述一个或多个扩展关键词和所述一个或多个关键词与所述带注释的视频内容进行比较，以识别一个或多个目标场景，所述一个或多个目标场景各自包括目标场景注释；

至少部分基于一个或多个目标场景的每个的目标场景注释与所述一个或多个扩展关键词和一个或多个关键词之间的相关性，为所述一个或多个目标场景的每个指定置信度等级；以及

向用户显示所述一个或多个目标场景中的至少一个，其中，基于所述置信度等级确定所述一个或多个目标场景中的所述至少一个。

2.根据权利要求1所述的方法，还包括：

从用户接收对所述一个或多个目标场景中的一个目标场景的选择的指示；以及

至少部分基于所述选择更新所述目标场景注释。

3.根据权利要求1所述的方法，还包括：

向用户显示所述一个或多个目标场景；

从用户接收对所述一个或多个目标场景中的一个目标场景的拒绝的指示；以及

至少部分基于所述拒绝更新所述目标场景注释。

4.根据权利要求2所述的方法，还包括：

监视用户以确定用户在观看目标场景时的情绪反应；

将用户的情绪反应与所述目标场景注释进行比较，以确定情绪反应与目标场景注释之间的相关性；以及

至少部分基于所述情绪反应与所述目标场景注释之间的相关性更新所述目标场景注释。

5.根据权利要求1所述的方法，其中所述搜索请求是用户音频输入，所述提取一个或多个关键词包括：

对所述搜索请求执行自然语言处理，以将用户音频输入转换为文本；

将文本分割成一个或多个单独的短语；以及

分析所述一个或多个单独的短语以确定关键词。

6.根据权利要求1所述的方法，还包括：

向用户显示所述一个或多个目标场景；以及

按照所述置信度等级排定显示所述一个或多个目标场景的顺序。

7.一种用于从数据库获取场景的计算机系统，所述计算机系统包括与存储器可通信地耦合的处理器，所述处理器被配置为：

从用户接收对存储在数据库中的场景的搜索请求，该数据库包括带注释的视频内容；

从搜索请求中提取一个或多个关键词；

为所述一个或多个关键词中的每一个生成一个或多个扩展关键词；

将所述一个或多个扩展关键词和所述一个或多个关键词与所述带注释的视频内容进行比较，以识别一个或多个目标场景，所述一个或多个目标场景各自包括目标场景注释；以及

至少部分基于一个或多个目标场景的每个的目标场景注释与所述一个或多个扩展关键词和一个或多个关键词之间的相关性，为所述一个或多个目标场景的每个指定置信度等级。

8.根据权利要求7所述的计算机系统，其中，所述处理器被进一步配置为：

向用户显示所述一个或多个目标场景；

从用户接收对所述一个或多个目标场景中的一个目标场景的选择的指示；以及

至少部分基于所述选择更新所述目标场景注释。

9.根据权利要求7所述的计算机系统，其中，所述处理器被进一步配置为：

向用户显示所述一个或多个目标场景；

从用户接收对所述一个或多个目标场景中的一个目标场景的拒绝的指示；以及

至少部分基于所述拒绝更新所述目标场景注释。

10.根据权利要求8所述的计算机系统，其中，所述处理器被进一步配置为：

监视用户以确定用户在观看目标场景时的情绪反应；

将用户的情绪反应与所述目标场景注释进行比较，以确定情绪反应与目标场景注释之间的相关性；以及

至少部分基于所述情绪反应与所述目标场景注释之间的相关性更新所述目标场景注释。

11.一种用于从数据库获取场景的计算机程序产品，所述计算机程序产品包括具有其中体现程序指令的计算机可读存储介质，所述程序指令可由处理器执行以使所述处理执行：

从用户接收对存储在数据库中的场景的搜索请求，该数据库包括带注释的视频内容；

从搜索请求中提取一个或多个关键词；

为所述一个或多个关键词中的每一个生成一个或多个扩展关键词；

12.根据权利要求11所述的计算机产品，进一步包括：

向用户显示所述一个或多个目标场景；

从用户接收对所述一个或多个目标场景中的一个目标场景的选择的指示；以及

至少部分基于所述选择更新所述目标场景注释。

13.根据权利要求11所述的计算机产品，进一步包括：

向用户显示所述一个或多个目标场景；

从用户接收对所述一个或多个目标场景中的一个目标场景的拒绝的指示；以及

至少部分基于所述拒绝更新所述目标场景注释。

14.根据权利要求12所述的计算机产品，进一步包括：

监视用户以确定用户在观看目标场景时的情绪反应；

将用户的情绪反应与所述目标场景注释进行比较，以确定情绪反应与目标场景注释之间的相关性；以及

至少部分基于所述情绪反应与所述目标场景注释之间的相关性更新所述目标场景注释。

15.根据权利要求12所述的计算机产品，其中所述搜索请求是用户音频输入，所述提取一个或多个关键词包括：

对所述搜索请求执行自然语言处理，以将用户音频输入转换为文本；

将文本分割成一个或多个单独的短语；以及

分析所述一个或多个单独的短语以确定关键词。

16.一种用于注释视频场景的计算机实现的方法，该方法包括：

由处理器接收一个或多个视频；

将所述一个或多个视频分割成场景集合；

分析所述场景集合中的第一场景以确定第一场景的标签集合；

用所述标签集合注释第一场景；以及

将第一场景存储在数据库中。

17.根据权利要求16所述的方法，还包括：

至少部分基于第一场景的所述标签集合确定扩展关键词；以及

用第一场景注释所述扩展关键词。

18.根据权利要求16所述的方法，其中确定第一场景的标签集合包括：

对第一场景进行图像识别以为第一场景中的一个或多个对象生成标签。

19.根据权利要求16所述的方法，其中确定第一场景的标签集合还包括：

对第一场景进行语音分析以提取一个或多个关键词；

至少部分基于所述一个或多个关键词为第一场景生成标签；

用所述一个或多个关键词注释第一场景。

20.根据权利要求19所述的方法，还包括：

至少部分基于第一场景的所述一个或多个关键词确定扩展关键词；以及

用第一场景注释所述扩展关键词。

21.一种用于注释视频场景的计算机系统，所述计算机系统包括通信地耦合到存储器的处理器，所述处理器被配置为：

由处理器接收一个或多个视频；

将所述一个或多个视频分割成场景集合；

分析所述场景集合中的第一场景以确定第一场景的标签集合；

用所述标签集合注释第一场景；以及

将第一场景存储在数据库中。

22.根据权利要求21所述的计算机系统，所述处理器被进一步配置为:

至少部分基于第一场景的所述标签集合确定扩展关键词；以及

用第一场景注释所述扩展关键词。

23.根据权利要求21所述的计算机系统，其中确定第一场景的标签集合包括：

由所述处理器对第一场景进行图像识别以为第一场景中的一个或多个对象生成标签。

24.根据权利要求21所述的计算机系统，其中确定第一场景的标签集合还包括：

由所述处理器对第一场景进行语音分析以提取一个或多个关键词；

由所述处理器至少部分基于所述一个或多个关键词为第一场景生成标签；

由所述处理器用所述一个或多个关键词注释第一场景。

25.根据权利要求24所述的计算机系统，所述处理器被进一步配置为:

由所述处理器至少部分基于第一场景的所述一个或多个关键词确定扩展关键词；以及

由所述处理器用第一场景注释所述扩展关键词。

完整全部详细技术资料下载

当前第2页1 2 3