信息查询方法及装置、存储介质、智能终端与流程

文档序号:19879734发布日期:2020-02-08 06:52阅读:145来源:国知局
信息查询方法及装置、存储介质、智能终端与流程

本发明涉及自然语言处理技术领域,尤其涉及一种信息查询方法及装置、存储介质、智能终端。



背景技术:

对于目前面向客户的虚拟产品,例如基金产品和保险产品等,产品种类繁多。如对于同样类型的基金,可能由于基金经理或者基金公司的不同而有很大收益差距,面对如此众多的基金,普通用户很难去选择比较。

现有技术中,获取上述产品相关信息的方式通常是通过搜索引擎去查询,例如在搜索引擎中输入“华夏沪深300指数基金”来查询。

但是,现有技术中的查询方式查询到的信息一般都是笼统而冗杂的,而用户通常是带有明确意图去查询的,例如用户可能只想看下这个基金持仓的股票有哪些,或者看下某个基金的基金经理的历史业绩如何,现有技术中的搜索引擎很难一步查询到位,需要在首次查询后在进行信息的二次筛选过滤才能获到有效信息。



技术实现要素:

本发明解决的技术问题是如何提升查询的准确性和便捷性。

为解决上述技术问题,本发明实施例提供一种信息查询方法,所述信息查询方法包括:获取用户输入的自然语言查询语句;从知识库中确定所述自然语言查询语句中的待查询实体,所述待查询实体包括查询实体名称;识别所述自然语言查询语句的查询意图;根据所述查询实体名称和所述查询意图的组合与预设映射关系确定所述自然语言查询语句对应的答案。

可选的,所述根据所述查询实体名称和所述查询意图的组合与预设映射关系确定所述自然语言查询语句对应的答案包括:将所述查询实体名称与多个预设映射关系中的实体名称进行匹配;如果存在预设映射关系中的实体名称与所述查询实体名称相匹配,则将匹配的预设映射关系中的意图与所述查询意图进行匹配;如果所述匹配的预设映射关系中的意图与所述查询意图相匹配,则将所述匹配的预设映射关系中的答案作为所述自然语言查询语句对应的答案。

可选的,所述将所述匹配的预设映射关系中的答案作为所述自然语言查询语句对应的答案包括:直接将所述匹配的预设映射关系中实体名称和意图的组合对应的答案作为所述自然语言查询语句对应的答案;或者,确定所述匹配的预设映射关系中实体名称和意图的组合对应的查询指令,并将执行所述查询指令得到的答案作为所述自然语言查询语句对应的答案。

可选的,所述从知识库中确定所述自然语言查询语句中的待查询实体包括:根据用户输入的所述自然语言查询语句,对所述知识库中的实体列表进行排序,并将排序靠前的实体作为所述待查询实体。

可选的,采用以下算法对所述知识库中的实体列表进行排序:learning-to-rank模型,或者句法分析。

可选的,所述识别所述自然语言查询语句的查询意图包括:根据所述待查询实体以及所述自然语言查询语句,对所述待查询实体所对应的有限意图集合进行排序。

可选的,采用以下算法对所述待查询实体所对应的有限意图集合进行排序:learning-to-rank模型,或者句法分析的方式。

可选的,所述从知识库中确定所述自然语言查询语句中的待查询实体之前还包括:将所述自然语言查询语句中各个词语的拼音与预设实体名称列表中各个预设实体名称的拼音进行匹配,以得到匹配结果,所述预设实体名称列表包括多个预设实体名称及其拼音;如果所述匹配结果表示存在预设实体名称的拼音与所述自然语言查询语句中的词语的拼音相匹配,则将所述词语更新为匹配的预设实体名称。

可选的,所述从知识库中确定所述自然语言查询语句中的待查询实体之前还包括:对所述自然语言查询语句进行预处理操作,所述预处理操作选自过滤敏感词和字体转换。

可选的,所述实体名称选自基金产品、基金经理以及基金公司的名称,或者选自保险产品、保险经理以及保险公司的名称,或者选自理财产品、理财经理以及理财公司的名称。

为解决上述技术问题,本发明实施例还公开了一种信息查询装置,信息查询装置包括:自然语言查询语句获取模块,用以获取用户输入的自然语言查询语句;实体名称识别模块,用以从知识库中确定所述自然语言查询语句中的待查询实体,所述待查询实体包括查询实体名称;意图识别模块,用以识别所述自然语言查询语句的查询意图;答案确定模块,用以根据所述查询实体名称和所述查询意图的组合与预设映射关系确定所述自然语言查询语句对应的答案。

本发明实施例还公开了一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行所述信息查询方法的步骤。

本发明实施例还公开了一种智能终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行所述信息查询方法的步骤。

与现有技术相比,本发明实施例的技术方案具有以下有益效果:

本发明技术方案中,对于用户输入的自然语言查询语句,可以识别确定自然语言查询语句中的查询实体名称以及自然语言查询语句的查询意图;通过预先建立的预设映射关系,可以确定实体名称和意图的组合与答案的对应关系,由此,可以利用自然语言查询语句中的查询实体名称、自然语言查询语句的查询意图以及预设映射关系确定自然语言查询语句的答案。本发明技术方案利用实体名称与意图的组合来确定答案的方式,可以保证答案确定的准确性和针对性,避免了现有技术中需要用户二次查询才能确定答案的方式,提升了信息查询的便捷性以及用户体验。

进一步地,在确定自然语言查询语句的答案时,需要确定预设映射关系中的实体名称与查询实体名称相匹配,并且该预设映射关系中的意图与查询意图相匹配,才确定该预设映射关系中的答案为自然语言查询语句的答案,通过实体名称和意图均匹配的方式来保证匹配到的答案的准确性。

进一步地,将所述实体名称的拼音与预设实体名称列表中各个预设实体名称的拼音进行模糊匹配,以得到匹配结果,所述预设实体名称列表包括多个预设实体名称及其拼音;如果所述匹配结果表示匹配,则将所述实体名称更新为匹配的预设实体名称。本发明技术方案中,为了避免用户输入的自然语言查询语句中的错别字导致的查询错误,可以通过拼音匹配的方式更新实体名称,从而进一步保证最终匹配到的答案的准确性。

附图说明

图1是本发明实施例一种信息查询方法的流程图;

图2是图1所示步骤s104的一种具体实施方式的流程图;

图3是本发明实施例一种信息查询方法的部分流程图;

图4是本发明实施例一种信息查询装置的结构示意图。

具体实施方式

如背景技术中所述,现有技术中的查询方式查询到的信息一般都是笼统而冗杂的,而用户通常是带有明确意图去查询的,例如用户可能只想看下这个基金持仓的股票有哪些,或者看下某个基金的基金经理的历史业绩如何,现有技术中的搜索引擎很难一步查询到位,需要在首次查询后在进行信息的二次筛选过滤才能获到有效信息。

本发明技术方案中,对于用户输入的自然语言查询语句,可以识别确定自然语言查询语句中的查询实体名称以及自然语言查询语句的查询意图;通过预先建立的预设映射关系,可以确定实体名称和意图的组合与答案的对应关系,由此,可以利用自然语言查询语句中的查询实体名称、自然语言查询语句的查询意图以及预设映射关系确定自然语言查询语句的答案。本发明技术方案利用实体名称与意图的组合来确定答案的方式,可以保证答案确定的准确性和针对性,避免了现有技术中需要用户二次查询才能确定答案的方式,提升了信息查询的便捷性以及用户体验。

本发明实施例所称“自然语言查询语句”是指,用户输入的用于查询的语句,具体可以是文本或语音数据。

本发明实施例所称“查询实体名称”是指,自然语言查询语句中出现的实体的名称,例如基金名称、基金经理姓名、基金公司名称等。

本发明实施例所称“查询意图”是指,自然语言查询语句所表示的意图,如,查询持仓、查询公司概况等。

本发明实施例所称“预设映射关系”是指,预先建立的实体名称和意图的组合与答案的对应关系,具体地,预设映射关系可以包括多个实体名称和意图的组合及其对应的答案。

为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。

图1是本发明实施例一种信息查询方法的流程图。

图1所示的信息查询方法可以由任意能够与用户进行交互的智能终端设备来执行,所述智能终端设备具体可以是计算机、智能机器人等任意能够与用户进行交互的设备。

所述信息查询方法可以包括以下步骤:

步骤s101:获取用户输入的自然语言查询语句;

步骤s102:从知识库中确定所述自然语言查询语句中的待查询实体,所述待查询实体包括查询实体名称;

步骤s103:识别所述自然语言查询语句的查询意图;

步骤s104:根据所述查询实体名称和所述查询意图的组合与预设映射关系确定所述自然语言查询语句对应的答案。

需要指出的是,本实施例中各个步骤的序号并不代表对各个步骤的执行顺序的限定。例如,步骤s102与步骤103可以是同时执行的,也可以是步骤s102早于步骤s103执行,或者步骤s103早于步骤s102执行,本发明实施例对此不作限制。

本实施例中,用户输入的自然语言查询语句可以是自然语言。更具体地,自然语言查询语句可以是文本、语音等格式。例如在一个具体应用场景中,用户输入语音数据,可以先将该语音数据转换为文本,后续的实体名称识别以及意图识别过程均以该文本为基础进行。

在步骤s102的具体实施中,可以对知识库的实体列表,针对用户输入的自然语言查询语句进行排序,以排序的top1结果确定自然语言查询语句中的查询实体名称。关于具体的排序算法,可以采用基于深度学习的learning-to-rank算法,也可以使用其他任意可实施的实体名称识别算法,例如句法分析算法,本发明实施例对此不作限制。

关于learning-to-rank算法(或learning-to-rank模型)、句法分析算法的具体实施方式可参照现有技术,本发明实施例在此不再赘述。

以基金产品为例,实体名称可以包括以下三种类别:基金产品、基金经理以及基金公司。用户输入自然语言查询语句“天虹基金公司好不好”,通过步骤s102可以得到实体名称“天虹基金公司”。

在步骤s103的具体实施中,可以识别获得自然语言查询语句的查询意图。具体可以通过预先训练好的模型,根据确定的实体名称,对该实体所对应的意图进行排序,以排序的top1结果作为意图结果。关于具体的排序算法,可以采用基于深度学习的learning-to-rank算法,也可以使用其他任意可实施的算法,例如句法分析算法,本发明实施例对此不作限制。

具体地,利用训练完成的神经网络训练learning-to-rank模型对所述自然语言查询语句进行意图识别。

例如,用户输入自然语言查询语句“天虹基金公司好不好”,通过步骤s103可以得到查询意图为“公司概况”。

至此,通过步骤s102和步骤s103可以确定自然语言查询语句的查询实体名称以及查询意图,上述两种参数的组合可以明确地指示用户想要的内容。

本实施例中,在获取用户的自然语言查询语句之前,可以预先建立预设映射关系,以建立实体名称和意图的组合与答案的对应关系。

进而在步骤s104中,可以利用自然语言查询语句中的查询实体名称、自然语言查询语句的查询意图以及预设映射关系确定自然语言查询语句的答案。所述预设映射关系包括多个实体名称和意图的组合及其对应的答案。

在具体的实现中,预设映射关系还可以是实体名称和意图的组合与查询指令的映射关系,每一查询指令可以通过查询操作确定唯一的答案。例如,查询指令可以是结构化查询语言(structuredquerylanguage,sql)语句,通过该sql语句可以在数据库中查询到答案,并将该答案反馈给用户。

具体地,预设映射关系可以存储在数据库中,在需要时,可以从数据库中调用预设映射关系。

本发明实施例利用实体名称与意图的组合来确定答案的方式,可以保证答案确定的准确性和针对性,避免了现有技术中需要用户二次查询才能确定答案的方式,提升了信息查询的便捷性以及用户体验。

本发明一个非限制性的实施例中,所述实体名称选自基金产品、基金经理以及基金公司的名称,或者选自保险产品、保险经理以及保险公司的名称,或者选自理财产品、理财经理以及理财公司的名称。

换句话说,本发明实施例的信息查询方法可以对基金相关信息、保险相关信息以及理财相关信息进行查询,以满足用户在不同应用场景下的不同需求。

在本发明一个具体实施例中,图1所示信息查询方法还可以包括以下步骤:将所述答案反馈给所述用户。

具体而言,可以将所述答案以预设的格式展示给用户,例如可以以文本的方式进行展示;或者,可以将所述答案以语音的方式进行播报,还可以将所述答案以文字和答案相结合的方式进行展示。

在本发明一个具体实施例中,请参照图2,图1所示步骤s104可以包括以下步骤:

步骤s201:将所述查询实体名称与多个预设映射关系中的实体名称进行匹配;

步骤s202:如果存在预设映射关系中的实体名称与所述查询实体名称相匹配,则将匹配的预设映射关系中的意图与所述查询意图进行匹配;

步骤s203:如果所述匹配的预设映射关系中的意图与所述查询意图相匹配,则将所述匹配的预设映射关系中的答案作为所述自然语言查询语句对应的答案。

需要指出的是,关于步骤s201和步骤s202,也可以替换为以下步骤:先将查询意图与多个预设映射关系中的意图进行匹配;如果存在预设映射关系中的意图与所述查询意图相匹配,则将所述预设映射关系中的实体名称与所述查询实体名称进行匹配,本发明实施例对此不作限制。

本实施例中,在确定自然语言查询语句的答案时,需要确定预设映射关系中的实体名称与查询实体名称相匹配,并且该预设映射关系中的意图与查询意图相匹配,才确定该预设映射关系中的答案为自然语言查询语句的答案,通过实体名称和意图均匹配的方式来保证匹配到的答案的准确性。

进一步而言,如果同一预设映射关系中仅存在意图与查询意图相匹配,或者实体名称与查询实体名称相匹配,则不能确定自然语言查询语句对应的答案。在这种情况下,可以向用户返回预设引导语句,以指示用户更新自然语言查询语句。例如“您的问题可以再具体一些吗”、“您可以问我基金相关的一些知识”等。

更具体地,图2所示步骤s203可以包括以下步骤:直接将所述匹配的预设映射关系中实体名称和意图的组合对应的答案作为所述自然语言查询语句对应的答案;或者,确定所述匹配的预设映射关系中实体名称和意图的组合对应的查询指令,并将执行所述查询指令得到的答案作为所述自然语言查询语句对应的答案。

也就是说,预设映射关系中实体名称和意图的组合可以直接与答案相对应,预设映射关系包括实体名称和意图的组合以及答案,在这种情况下,可以直接将匹配的预设映射关系中的答案作为自然语言查询语句对应的答案。

预设映射关系中实体名称和意图的组合可以间接地与答案相对应,也即预设映射关系包括实体名称和意图的组合以及查询指令,通过执行查询指令可以获得答案,在这种情况下,可以将执行所述查询指令得到的答案作为所述自然语言查询语句对应的答案。

需要说明的是,所述查询指令可以是sql语句,也可以是其他任意可实施的能够执行查询操作的非结构化的查询指令,本发明实施例对此不作限制。

在本发明一个优选实施例中,图1所示步骤s102可以包括以下步骤:将所述自然语言查询语句输入至预先训练完成的实体名称识别模型,以得到所述自然语言查询语句中的实体名称,其中,在利用训练数据对所述实体名称识别模型进行训练时,训练数据包括各个实体名称的全称以及简称。

在实际的应用中,用户需要查询的实体名称的全称比较长,而用户通常会使用实体名称的简称来进行查询,以基金产品为例,基金的名称通常都很长,例如“华夏乐享健康混合”、“华夏行业龙头混合”,“博时月月盈短期理财债券”等,但是用户一般记不住基金的全称,输入的自然语言查询语句中通常都是省略过的基金名称,例如“华夏乐享”、“华夏龙头混合”,“博士月月盈”,导致查询不到结果。

在利用实体名称识别模型对自然语言查询语句进行实体名称识别时,为了保证实体名称识别的全面性和准确性,可以利用各个实体名称的全称以及简称来构建训练数据,并利用上述训练数据对实体名称识别模型进行训练,从而使得训练完成的实体名称识别模型可以对各个实体名称的全称或简称进行识别,避免遗漏实体名称,进而保证信息查询的准确性。

本发明一个非限制性的实施例中,请参照图3,图1所示步骤s102之前还可以包括以下步骤:

步骤s301:将所述自然语言查询语句中各个词语的拼音与预设实体名称列表中各个预设实体名称的拼音进行匹配,以得到匹配结果,所述预设实体名称列表包括多个预设实体名称及其拼音;

步骤s302:如果所述匹配结果表示存在预设实体名称的拼音与所述自然语言查询语句中的词语的拼音相匹配,则将所述词语更新为匹配的预设实体名称。

具体实施中,由于自然语言查询语句是用户通过输入法输入的,难免会出现错别字,或者用户故意输入错误的情况,因此需要对自然语言查询语句中的错别字进行纠正,尤其是针对自然语言查询语句中的实体名称进行错别字纠正,以保证后续步骤中实体名称识别的正确性。

具体可以预先建立预设实体名称列表,预设实体名称列表包括多个预设实体名称及其拼音。还可以对自然语言查询语句进行拼音转换,以得到自然语言查询语句中各个词语的拼音。

在步骤s301和步骤s302的具体实施中,可以分别将自然语言查询语句中各个词语的拼音与预设实体名称列表中各个预设实体名称的拼音进行匹配,例如可以进行模糊匹配。如果存在与词语的拼音相匹配的预设实体名称的拼音,则将所述词语更新为匹配的预设实体名称。

本发明实施例中,为了避免用户输入的自然语言查询语句中的错别字导致的查询错误,可以通过拼音匹配的方式更新实体名称,从而进一步保证最终匹配到的答案的准确性。

在一个具体的应用场景中,用户输入自然语言查询语句“天虹基金公司好不好”,其中,“天虹基金”的拼音与预设实体名称列表中“天弘基金”的拼音相同,故而将“天虹基金”更新为“天弘基金”;通过实体名称识别步骤识别得到查询实体名称为“天弘基金”,自然语言查询语句的意图为“公司概况”。

本发明一个非限制性的实施例中,图1所示步骤s102之前还可以包括以下步骤:对所述自然语言查询语句进行预处理操作,所述预处理操作选自过滤敏感词和字体转换。

具体实施中,在执行实体名称识别和意图识别之前,可以对自然语言查询语句中的敏感词进行过滤,例如敏感词可以包括辱骂词语、敏感性人名、敏感性名词等。当在自然语言查询语句中匹配到了敏感词时,可以直接将该敏感词进行过滤,并进行后续的步骤。或者也可以直接返回预设的语句,不会进行后续的处理流程。

具体实施中,在执行实体名称识别和意图识别之前,还可以对自然语言查询语句的字体进行字体转换,以使得自然语言查询语句中各个词语的字体一致。具体如自然语言查询语句为中文时,将自然语言查询语句统一转为为简体中文。

关于具体的敏感词的设置或者具体的转换字体的设置,可以根据实际的应用环境进行适应性的配置和修改,本发明实施例对此不作限制。

在一个具体的应用场景中,用户输入自然语言查询语句“华夏公司垃圾”,识别出敏感词“垃圾”,在这种情况下可以直接返回特定的话术,也可以将该敏感词过滤,得到“华夏公司”,并继续执行后续的步骤。

请参照图4,本发明实施例还公开了一种信息查询装置40,信息查询装置40可以包括自然语言查询语句获取模块401、实体名称识别模块402、意图识别模块403和答案确定模块404。

其中,自然语言查询语句获取模块401用以获取用户输入的自然语言查询语句;实体名称识别模块402用以通过所述自然语言查询语句,对实体列表中的实体进行排序;意图识别模块403用以通过实体名称识别模块402所确定的实体名称,对该实体对应的意图进行排序,以得到所述自然语言查询语句的查询意图;答案确定模块404用以根据所述查询实体名称和所述查询意图的组合与预设映射关系确定所述自然语言查询语句对应的答案,所述预设映射关系包括多个实体名称和意图的组合及其对应的答案。

本发明实施例中,对于用户输入的自然语言查询语句,可以识别确定自然语言查询语句中的查询实体名称以及自然语言查询语句的查询意图;通过预先建立的预设映射关系,可以确定实体名称和意图的组合与答案的对应关系,由此,可以利用自然语言查询语句中的查询实体名称、自然语言查询语句的查询意图以及预设映射关系确定自然语言查询语句的答案。本发明实施例利用实体名称与意图的组合来确定答案的方式,可以保证答案确定的准确性和针对性,避免了现有技术中需要用户二次查询才能确定答案的方式,提升了信息查询的便捷性以及用户体验。

关于所述信息查询装置40的工作原理、工作方式的更多内容,可以参照图1至图3中的相关描述,这里不再赘述。

本发明实施例还公开了一种存储介质,其上存储有计算机指令,所述计算机指令运行时可以执行图1、图2或图3中所示方法的步骤。所述存储介质可以包括rom、ram、磁盘或光盘等。所述存储介质还可以包括非挥发性存储器(non-volatile)或者非瞬态(non-transitory)存储器等。

本发明实施例还公开了一种智能终端,所述智能终端可以包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令。所述处理器运行所述计算机指令时可以执行图1、图2或图3中所示方法的步骤。所述智能终端包括但不限于手机、计算机、平板电脑等终端设备。

虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1