属性、行为习惯或个性化属性,当系统再次接收到输入信息时,则需返回的与用户属性、行为习惯或个性化属性相关的意图分值较尚O
[0081]此处仍以用户输入信息为“晚秋”为例进行说明。在步骤120中识别到可能的潜在意图有“搜索晚秋这首歌曲”和“搜索晚秋这部电影”,在步骤S130中确定“了解晚秋季节的天气状况”为用户当前的群体意图。在步骤S140中若用户个性化特征库中存储了个性化属性为“音乐”,则“搜索晚秋这首歌曲”的分值最高,为用户的目标意图;“搜索晚秋这部电影”的分值排序为第二位,也是一种个性化意图。
[0082]接下来,在步骤S150中若判断出“搜索晚秋这首歌曲”的分值与“搜索晚秋这部电影”的分值相差足够大,则可以确定“搜索晚秋这首歌曲”为符合用户特征的用户意图。可以看出,这时的意图识别结果已将“了解晚秋季节的天气状况”这个群体意图舍弃。
[0083]相反地,如果在步骤S150中若判断出“搜索晚秋这首歌曲”的分值与“搜索晚秋这部电影”的分值相差不大,或者,在步骤S140中“搜索晚秋这首歌曲”的分值与“搜索晚秋这部电影”的分值同样为最高分值,则执行步骤S170,利用上下文系统与用户进行主动交互。
[0084]此外,本实施例的方法还包括对群体化特征库进行更新的步骤(S180),结合互联网数据和用户数据,促进群体特征库的积累。具体而言,采集网络群体数据,对网络群体数据进行分析以提取群体特征和群体意图倾向性,对群体化特征库进行更新。对于互联网数据的分析包括对群体知识库的分析,如:歌手、菜谱名称、电影名称等等,也包括对当前热点信息的分析,如“屌丝”等,同时也包括对用户群体意图倾向性的分析,如对于“北京”,群体意图中北京百科的意图倾向性明显高于天气。
[0085]以及/或者,从接收到的用户反馈信息中提取多数用户的当前意图,更新所述群体特征库。也就是说,将确定出的具有个性化的用户意图反馈至群体化特征库,单一用户的倾向性意图会对其所属群体的群体意图产生影响,从而提高在群体意图识别步骤(S130)中识别结果的准确性。
[0086]此外,本实施例的方法还包括积累所述用户参数以及/或者所述用户反馈信息,对个性化特征库进行更新的步骤(S190)。对采集到的用户输入信息,以及/或者用户对提问的反馈信息进行挖掘,获取用户属性、行为习惯和个性化属性,对个性化特征库进行更新。
[0087]其中,对用户信息进行收集包括用户的位置信息、声音信息、网络信息以及用户输入的职业、年龄、性别、爱好等;同时对用户数据进行挖掘,通过对用户的提问数据进行挖掘,分析出用户的兴趣爱好、行为习惯等,促进个性化特征库的积累;最后还对用户回答进行分析,分析用户意图的倾向性。从而在个性化特征库中补充新的可能意图,并根据更新后的个性化特征库对用户意图进行分析和排序。用户个性化特征库可以结构化和非结构化的方式存储数据,关于用户个性化特征库的数据存储方式,因其是本领域技术人员公知的技术,在此不再对其进行详细的赘述。
[0088]至此为止完成意图识别方法的整个流程,采用对用户个性化的意图分析,当接收用户输入时,能够根据用户的性格偏好、年龄性别职业、语言行为习惯、知识特征等特性给出更人性化和个性化的服务。
[0089]实施例二
[0090]考虑到用户参数的多样化,本实施例主要提供在步骤S140中采用的几种个性化特征排序的方法,用于在不同的应用场景中选择性特定的用户参数进行排序,以增强个性化意图识别的应用灵活性。以下依照图2a至图2c对各种排序方法的步骤流程进行说明。
[0091]在图2a中,按照先后顺序依次调用用户个性特征库中的用户原生属性、行为习惯和个性化属性,当在步骤S120和S130中识别到的潜在意图和群体意图能够匹配这些用户参数时,则确定为个性化意图并为其赋予一定的分值。这样以来,一种潜在意图或群体意图匹配到的用户参数越多,则其被赋予的分值的累计值越高。
[0092]而在图2b中,先为用户原生属性、行为习惯和个性化属性分别赋予权重系数x、y和z,再按照先后顺序依次调用用户个性特征库中的用户原生属性、行为习惯和个性化属性。其中各个系数的数值大小可以根据智能机器人的需求进行调整。例如,在某一公司内部用户的行为习惯比较近似,则可以减小行为习惯的权重系数y,而增大权重系数X和z,从而增强用户原生属性和个性化属性在个性化意图判断中的比重,这样使得基于个性化特征的意图排序结果具备较强的适应性。
[0093]图2c是一种极端的示例,在用户的行为习惯完全相同的情况下可以完全忽略这一参数,也就是将权重系数y的取值设定为O。这样仅仅选择用户属性和个性化特征进行组合来排序,方法更为简单。
[0094]实施例三
[0095]本实施例提供一种意图识别系统。如图3所示,该系统主要包括获取模块310、意图识别模块320、群体特征排序模块330和个性化特征排序模块340。
[0096]获取模块310配置为获取待识别的输入信息。具体来说,获取模块310包括采集子模块311、转换子模块312和预处理子模块313。其中,采集子模块311配置为采集用户输入的语音信息并提取用户参数;转换子模块312配置为将所述语音信息和所述用户参数转换为文本格式信息;预处理子模块313配置为对所述文本格式信息进行预处理得到所述待识别的输入信息。
[0097]意图识别模块320配置为通过领域模型对所述待识别的输入信息进行意图识别得到潜在意图,所述潜在意图至少有一个。
[0098]群体特征排序模块330配置为调用群体特征库,基于群体特征针对所述潜在意图进行排序,得到用户当前群体意图。该群体特征库包括群体的兴趣爱好、知识、意图倾向性等,群体特征越明显,倾向性的强度排序就会越加靠前。优选采用计分值对所有可能的潜在意图进行排序,分值越高的潜在意图表示群体倾向性越高。
[0099]个性化特征排序模块340配置为调用用户个性特征库,基于个性化特征针对所述用户当前群体意图以及所述潜在意图进行排序,确定用户当前意图。
[0100]需要说明的是,个性化特征排序模块340主要采用计分值对基于个性化特征识别到的个性化意图进行排序,此外还能通过上下文系统主动输出针对用户当前意图的提问信息,
[0101]如图3所示,个性化特征排序模块340包括分值判断子模块341、问题输出子模块342、反馈接收子模块343和意图输出子模块344。其中,分值判断子模块341用于基于个性化特征的排序结果中存在分值最高的目标意图,且该目标意图与分值排序为第二位的个性化意图之间的分值差超出预设值的情况下,确定该目标意图为用户当前意图。
[0102]此外,在该目标意图与分值排序为第二位的个性化意图之间的分值差低于预设值的情况下,表明用户的目标意图不是很明显,基于系统的自动排序不能确定用户的当前意图。此时,由问题输出子模块342和反馈接收子模块343配合,通过对用户主动提问询问用户的意图。
[0103]具体的,问题输出子模块342在基于个性化特征的排序结果中存在分值最高的目标意图,而该目标意图与分值排序为第二位的个性化意图之间的分值差低于预设值的情况下,利用上下文系统输出针对用户当前意图的提问信息。反馈接收子模块343用于接收对所述提问信息的用户反馈信息,根据该反馈信息获得用户当前意图。
[0104]进而意图输出子模块344将分值判断子模块341确定的用户意图,或者反馈接收子模块343接收的用户意图输出。
[0105]此外,本实施例的意图识别系统还包括第一群体更新模块351和/或第二群体更新模块352。第一群体更新模块351采集互联网数据更新群体特征库,第二群体更新模块352从接收到的用户反馈信息中提取多数用户的当前意图,更新所述群体特征库。
[010