本发明涉及信息检索技术领域,特别是涉及一种基于知识图谱的空间关键字查询方法、装置、设备以及计算机可读存储介质。
背景技术:
随着包括智能手机、平板电脑等一系列便携式通讯设备的产生和广泛使用,移动互联网呈现井喷式的发展态势。海量的空间文本信息,例如社交媒体信息、公共服务信息以及兴趣点信息在互联网上涌现。这些信息催生了大量以谷歌地图、百度地图等为代表的基于位置信息服务工具的产生和发展。其中空间关键字查询作为这些基于位置信息服务(locationbasedservice,lbs)工具的核心技术,旨在从海量的空间文本对象中高效并且精确地理解用户的搜索意图进而找到用户满意的查询结果。
对于用户搜索意图的理解决定着空间关键字查询的准确程度。一般来说,空间关键字查询中用户搜索有以下两种特征:(1)搜索意图的覆盖面广。例如,用户在搜索餐厅的时候可能对餐厅的菜式、价位、交通便利情况等都有要求。(2)用户搜索通常为短文本。短文本描述的搜索意图通常是不清楚的甚至是有歧义的;例如,用户输入查询“苹果”,搜索引擎通常无法区分用户是查询水果“苹果”还是电子产品“苹果”。
近些年来,学术界以及工业界的相关研究人员对空间关键字查询开展了广泛并且深入的研究,这些研究主要集中在对用户搜索意图的理解。相关研究可以分为传统方法和机器学习方法。
传统方法主要是通过对查询关键字进行字符串匹配来解析用户搜索意图。基于传统方法的空间关键字查询主要应用于关键词匹配的场景,其采用字符串精确匹配或模糊匹配的方法实现搜索意图理解。例如:空间关键字布尔查询和空间关键字近似查询。其中空间关键字布尔查询要求查询关键字与空间文本对象之间完全精确匹配,而空间关键字近似查询则需要查询关键字与空间文本对象模糊匹配即可。
近些年随着机器学习和深度学习的不断发展,越来越多的研究者开始使用机器学习和深度学习技术进行用户搜索意图的解析。基于机器学习方法的空间关键字查询通过引入词嵌入技术将用户搜索映射为语义空间的一点,从而将用户的查询转化为隐式语义向量。基于语义的空间关键字查询主要利用词嵌入(wordembedding)技术将查询关键字映射到语义空间中的一点,从而实现用户搜索到语义向量的转化。除此之外,针对用户搜索意图的解析,也有学者研究通过与用户进行交互从而理解用户搜索意图。交互式空间关键字查询构建了一个交互式框架从用户反馈中学习用户搜索中的不同关键字的权重。
由于短文本天然存在信息量不足、歧义等特点,传统方法和机器学习方法都无法处理查询为短文本的空间关键字查询。而实际应用场景中存在大量查询为短文本的情况,因而上述两种方法都在实际应用中存在不小的限制。
综上所述可以看出,如何加强对用户短文本搜索意图的理解是目前有待解决的问题。
技术实现要素:
本发明的目的是提供一种基于知识图谱的空间关键字查询方法、装置、设备以及计算机可读存储介质,以解决现有技术中空间关键字查询的方法无法理解用户短文本的搜索意图的问题。
为解决上述技术问题,本发明提供一种基于知识图谱的空间关键字查询方法,包括:利用映射于知识图谱的空间关键字查询对用户查询输入进行知识图谱标注,获得代表用户查询意图的目标概念标签集;确定所述目标概念标签集内各个概念标签和映射于所述知识图谱的空间文本对象集合内各个空间文本对象之间的相关性;依据所述相关性的大小,选取k个最大相关性数值对应的空间文本对象作为目标查询结果。
优选地,所述利用映射于知识图谱的空间关键字查询对用户查询输入进行知识图谱标注,获得代表用户查询意图的目标概念标签集包括:
在所述知识图谱上所有的概念中查找所述用户查询输入的上层概念,根据所述上层概念确认所述代表用户查询意图的概念标签候选集;
利用贪心算法对所述概念标签候选集进行迭代运算,在所述概念标签候选集中选择相关性评估值最大的一组概念标签作为所述代表用户查询意图的目标概念标签集。
优选地,所述利用贪心算法对所述概念标签候选集进行迭代运算,在所述概念标签候选集中选择相关性评估值最大的一组概念标签作为所述代表用户查询意图的目标概念标签集包括:
迭代执行每次在所述概念标签候选集中任选一个候选概念标签添加至初始概念标签集合中,计算并记录更新后的概念标签集合和所述用户查询输入的相关性评估值的步骤,直至将所述概念标签候选集中全部候选概念标签添加至所述初始概念标签集合中,选择最大相关性评估值对应的一组概念标签集合作为第一目标概念标签集合;
迭代执行每次在所述概念标签候选集中任选一个候选概念标签与所述初始概念标签集合中的任一概念标签进行替换后,计算并记录更新后的概念标签集合和所述用户查询输入的相关性评估值的步骤,直至将所述概念标签候选集中全部候选概念标签添加至所述初始概念标签集合中,选择最大相关性评估值对应的一组概念标签集合作为第二目标概念标签集合;
迭代执行每次删除所述初始概念标签集合中的任意一个概念标签后,计算并记录更新后的概念标签集合和所述用户查询输入的相关性评估值的步骤,直至将所述初始概念标签集合中的概念标签完全删除,选择最大相关性评估值对应的一组概念标签集合作为第三目标概念标签集合;
在所述第一目标概念标签集合、所述第二目标概念标签集合和所述第三标签集合中选取与所述用户查询输入间相关性评估值最大的概念标签集合作为所述代表用户查询意图的目标概念标签集。
优选地,所述计算并记录更新后的概念标签集合和所述用户查询输入的相关性评估值包括:
基于朴素贝叶斯模型确定所述更新后的概念标签集合和所述用户查询输入的典型性评估值;
根据所述更新后的概念标签集合下的实体数目和所述更新后的概念标签集合和所述用户查询输入的距离评估值,确定所述更新后的概念标签集合和所述用户查询输入的标准粒度评估值;
结合典型性评估和所述标签粒度评估,得到所述更新后的概念标签集合和用户查询输入的相关性评估值,并记录所述相关性评估值。
优选地,所述用户查询输入包括:用户输入的查询关键字和所述用户的查询位置。
本发明还提供了一种基于知识图谱的空间关键字查询装置,包括:
获取模块,用于利用映射于知识图谱的空间关键字查询对用户查询输入进行知识图谱标注,获得代表用户查询意图的目标概念标签集;
确定模块,用于确定所述目标概念标签集内各个概念标签和映射于所述知识图谱的空间文本对象集合内各个空间文本对象之间的相关性;
选取模块,用于依据所述相关性的大小,选取k个最大相关性数值对应的空间文本对象作为目标查询结果。
优选地,所述获取模块包括:
查找单元,用于在所述知识图谱上所有的概念中查找所述用户查询输入的上层概念,根据所述上层概念确认所述代表用户查询意图的概念标签候选集;
选择单元,用于利用贪心算法对所述概念标签候选集进行迭代运算,在所述概念标签候选集中选择相关性评估值最大的一组概念标签作为所述代表用户查询意图的目标概念标签集。
优选地,所述选择单元包括:
添加子单元,用于迭代执行每次在所述概念标签候选集中任选一个候选概念标签添加至初始概念标签集合中,计算并记录更新后的概念标签集合和所述用户查询输入的相关性评估值的步骤,直至将所述概念标签候选集中全部候选概念标签添加至所述初始概念标签集合中,选择最大相关性评估值对应的一组概念标签集合作为第一目标概念标签集合;
替换子单元,用于迭代执行每次在所述概念标签候选集中任选一个候选概念标签与所述初始概念标签集合中的任一概念标签进行替换后,计算并记录更新后的概念标签集合和所述用户查询输入的相关性评估值的步骤,直至将所述概念标签候选集中全部候选概念标签添加至所述初始概念标签集合中,选择最大相关性评估值对应的一组概念标签集合作为第二目标概念标签集合;
删除子单元,用于迭代执行每次删除所述初始概念标签集合中的任意一个概念标签后,计算并记录更新后的概念标签集合和所述用户查询输入的相关性评估值的步骤,直至将所述初始概念标签集合中的概念标签完全删除,选择最大相关性评估值对应的一组概念标签集合作为第三目标概念标签集合;
选取子单元,用于在所述第一目标概念标签集合、所述第二目标概念标签集合和所述第三标签集合中选取与所述用户查询输入间相关性评估值最大的概念标签集合作为所述代表用户查询意图的目标概念标签集。
本发明还提供了一种基于知识图谱的空间关键字查询设备,包括:
存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种基于知识图谱的空间关键字查询方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种基于知识图谱的空间关键字查询方法的步骤。
本发明所提供的基于知识图谱的空间关键字查询方法,利用知识图谱驱动的空间关键字查询对用户查询输入进行知识图谱标注,得到一个代表用户查询意图的目标概念标签集。计算所述目标概念标签集中各个概念标签与映射于所述知识图谱的空间文本对象集合中各个空间文本对象之间的相关性。根据所述相关性的大小,选取与用户查询意图关联程度最高的k个空间文本对象作为最终的查询结果。本发明所提高的空间关键字查询方法,引入了结构化的图谱知识,将搜索输入、空间文本对象和图谱中的概念、实体进行关联,从而形式化的定义了一种图谱知识驱动的空间关键字查询,有效加强了对用户短文本搜索意图的理解。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的基于知识图谱的空间关键字查询方法的第一种具体实施例的流程图;
图2为本发明所提供的基于知识图谱的空间关键字查询方法的第二种具体实施例的流程图;
图3为本发明所提供的基于知识图谱的空间关键字查询方法的第三种具体实施例的流程图;
图4为本发明实施例提供的一种基于知识图谱的空间关键字查询装置的结构框图。
具体实施方式
本发明的核心是提供一种基于知识图谱的空间关键字查询方法、装置、设备以及计算机可读存储介质,有效加强了对用户短文本搜索意图的理解。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明所提供的基于知识图谱的空间关键字查询方法的第一种具体实施例的流程图;具体操作步骤如下:
步骤s101:利用映射于知识图谱的空间关键字查询对用户查询输入进行知识图谱标注,获得代表用户查询意图的目标概念标签集;
所述用户查询输入包括用户输入的查询关键字和所述用户的查询位置。空间关键字查询将所述用户的查询关键字和查询位置作为输入,结合空间文本对象与所述用户查询输入之间的空间位置度量和文本相似性度量,返回与所述用户查询输入最相似的空间文本对象。
知识图谱是一个数据驱动的概念语料库,主要由一系列的概念、实体以及概念与实体之间的关系构成。典型的知识图谱包括以微软的probase、谷歌的freebase为代表的英文知识图谱以及以哈尔滨工业大学的大词林、复旦大学的cn-dbpedia为代表的中文知识图谱。
由于知识图谱主要基于大型语料库中用户频繁浏览和使用的数据进行构建,因此包括两大主要特征。其中一个特征为知识图谱具有一个庞大并且细粒度的概念结构。基于这些细粒度的概念,机器能够将用户的查询输入归结为更加具体的概念和标签。例如,给定一个查询输入为{喜来登酒店、希尔顿酒店},归结这个查询输入的最佳概念是豪华酒店,而不是酒店这种虽然正确但过于宽泛的概念。另外一个特征为知识图谱中概念和实体之间的关系不仅仅归结为是或否,根据概念和实体之间共现的频繁程度,概念和实体通常以概率或者权重来衡量两者之间联系的紧密程度。因此,知识图谱能够支持概念推理。例如,沃尔玛和麦德龙同样是购物中心,但在一般用户的认知中,沃尔玛在购物中心这个概念上比麦德龙更具典型性。这种用户的直觉认知可以用条件概率进行形式化的描述:p(沃尔玛|购物中心)>p(麦德龙|购物中心)。
在本发明实施例中,主要使用的是知识图谱中的isa关系。给定一个实体o和一个概念c,o和c之间的isa关系意味着o是概念c下的实体以及c是实体o的一个概念。同时每一组概念和实体的isa关系同时包含一个衡量频繁程度的n(o,c),它代表了实体o和概念c在预料库中同时出现在isa句式中的次数。在此基础上,概念c是实体o的一个上层概念的概率可以表示为:
同时,实体o属于概念c的概率可以表示为:
除此之外,图谱中任意一个概念c和实体o的先验概率可以表示为:
在本实施例中,空间关键字查询形式化为q=(q.loc,q.term),其中q.loc是查询点的地理位置即用户所在的空间位置,通常用二维空间坐标表示;q.term是用户的查询输入,在本实施例中,查询输入可以映射为知识图谱中的一组概念和实体。例如“喜来登酒店、希尔顿酒店”,用于描述用户的查询意图。
步骤s102:确定所述目标概念标签集内各个概念标签和映射于所述知识图谱的空间文本对象集合内各个空间文本对象之间的相关性;
一个空间文本对象可以形式化为o=(o.loc,o.term),其中o.loc是空间文本对象所在地理位置,通常用二维空间坐标表示;o.term是空间文本对象的所有的上层概念集合。在本实施例中,每一个空间文本对象都可以映射为知识图谱中的一个实体。
步骤s103:依据所述相关性的大小,选取k个最大相关性数值对应的空间文本对象作为目标查询结果。
在本实施例中,结合知识图谱,给定一个空间关键字查询q和一个空间文本对象集合o,图谱知识驱动的空间关键字查询首先对用户查询输入进行知识图谱标注,得到一个概念标签集c代表用户的查询意图,进而结合空间距离和语义相关性返回与用户查询意图关联程度最高的k个空间文本对象作为最终的查询结果。
基于上述实施例中,在本实施例中,根据贪心算法在概念标签候选集中选择代表用户意图的目标概念标签集。请参考图2,图2为本发明所提供的基于知识图谱的空间关键字查询方法的第二种具体实施例的流程图;具体操作步骤如下:
步骤s201:利用映射于知识图谱的空间关键字查询对用户查询输入进行知识图谱标注;
步骤s202:在所述知识图谱上所有的概念中查找所述用户查询输入的上层概念,根据所述上层概念确认所述代表用户查询意图的概念标签候选集;
步骤s203:利用贪心算法对所述概念标签候选集进行迭代运算,在所述概念标签候选集中选择相关性评估值最大的一组概念标签作为所述代表用户查询意图的目标概念标签集;
由于知识图谱存在百万数量级的概念和关系,通过穷举来搜索这个概念空间的代价巨大,无法满足现实应用的需求;因此,在本实施例中,需要一种标签搜索的方法来快速搜索标注用户查询意图的最优概念标签集合。
在本实施例中,采用了启发式的贪心策略,并提出了一种搜索意图标注的贪心搜索方法。首先在所述知识图谱上所有的概念中查找所述用户查询输入的上层概念,忽略了只有少量实体关系的概念标签(因为这些概念不可能是一个合适的描述用户意图的标签)。通过对概念的过滤得到了一个概念标签候选集q。并定义c为当前选择的概念集合并初始化为空集。然后,进行一个贪心搜索的迭代过程。在每次迭代中,可以重复尝试以下三种操作:
1)添加:即将q\c中一个未访问过的概念加入当前集合c。每次在所述概念标签候选集中任选一个候选概念标签添加至初始概念标签集合中,计算并记录更新后的概念标签集合和所述用户查询输入的相关性评估值,直至将所述概念标签候选集中全部候选概念标签添加至所述初始概念标签集合。
2)删除:即从当前集合c中随机移除一个概念标签。每次删除所述初始概念标签集合中的任意一个概念标签后,计算并记录更新后的概念标签集合和所述用户查询输入的相关性评估值,直至将所述初始概念标签集合中的概念标签完全删除、
3)替换:即从q\c中随机选择一个概念标签替换c中的一个随机概念标签。每次在所述概念标签候选集中任选一个候选概念标签与所述初始概念标签集合中的任一概念标签进行替换后,计算并记录更新后的概念标签集合和所述用户查询输入的相关性评估值,直至将所述概念标签候选集中全部候选概念标签添加至所述初始概念标签集合中。
对于上述的三种操作,进行多次尝试后,并在每一次迭代过程中选择能够使得相关性评估值增加最大(相关性评估值最大)的一组概念标签作为当前的描述用户查询意图的目标概念标签集。当相关性无法增长时,迭代将结束并返回最终用户搜索意图的概念标签集。由于标签集c与用户搜索的相关性在整个迭代过程中是单调递增的,所以我们能确保整个搜索意图标注的贪心搜索过程是收敛的。选择三种操作中选取与所述用户查询输入间相关性评估值最大的概念标签集合作为所述代表用户查询意图的目标概念标签集。
步骤s204:确定所述目标概念标签集内各个概念标签和映射于所述知识图谱的空间文本对象集合内各个空间文本对象之间的相关性;
步骤s205:依据所述相关性的大小,选取k个最大相关性数值对应的空间文本对象作为目标查询结果。
在本实施例中,利用贪心算法,可以在所述用户的查询关键字的上层概念中,快速搜索代表用户查询意图的目标概念标签集合。
基于上述实施例中,在本实施例中,在知识图谱的基础上,为了实现对用户搜索意图的准确理解,同时也为了避免查询点周围存在较少与学习到的用户意图相匹配的空间文本对象,本实施例提出了一种面向空间关键字搜索意图表示的多概念标签集合式评估方法。
请参考图3,图3为本发明所提供的基于知识图谱的空间关键字查询方法的第三种具体实施例的流程图;具体操作步骤如下:
步骤s301:利用映射于知识图谱的空间关键字查询对用户查询输入进行知识图谱标注;
步骤s302:在所述知识图谱上所有的概念中查找所述用户查询输入的上层概念,根据所述上层概念确认所述代表用户查询意图的概念标签候选集;
步骤s303:利用贪心算法和所述概念标签候选集,分别对初始概念标签集执行迭代添加、替换和删除的操作,得到更新后的概念标签集合;
步骤s304:基于朴素贝叶斯模型确定所述更新后的概念标签集合和所述用户查询输入的典型性评估值;
面向空间关键字搜索意图表示的多概念标签集合式评估方法在评估用户搜索与概念标签时主要考虑与以下两个方面:(1)典型性评估。典型性要求概念标签与查询关键字之间具有强相关性。(2)标签粒度评估。粒度评估要求描述用户查询的概念标签不能过于宽泛。例如,考虑典型性评估,查询关键字“喜来登酒店、希尔顿酒店”的概念标签可以是“酒店”或者“豪华酒店”,但很显然“豪华酒店”是一个更为细粒度且适合的概念标签。
典型性评估主要要求概念标签与查询关键字之间存在强相关性,同时这些概念标签下的空间文本对象在查询点位置附近分布较为频繁。考虑到朴素贝叶斯模型能够对相关性进行有效建模,同时能够合理地嵌入概念标签的空间分布状况,在本实施例中使用朴素贝叶斯模型对典型性进行建模。
标准的朴素贝叶斯模型评估公式如下:
其中q为用户查询,c为一组概念标签,p(c|q)代表了c是q的一组概念标签的概率。由于p(q)的大小仅取决于用户查询,所以在对概念标签进行排序度量时可以忽略,我们进而可以得到:
p(c|q)=p(q|c)p(c)
考虑到查询位置与查询关键字在逻辑上是相互独立的,因此:
其中p(q.loc|c)和p(word|c)分别从空间维度和文本相关性方面度量了概念标签集c在查询q下被选择的概率。
在空间维度方面,我们希望概念标签集c在查询位置q.loc周围频繁分布。这种概念的空间分布概率可以建模为:
考虑到概念标签在某个空间位置单点上的分布肯定是稀疏的,因此对于概念的空间分布度量需要以更粗的粒度来计算概率,进而得到最终的概念标签的空间分布概率。因此我们引入了网格索引(gridindex)的方法将整个地理空间划分为n×n个单元格(cell)。这样我们可以重新对p(q.loc|c)进行建模得到:
其中gj是网格索引中的第j号单元格。由于我们希望距离查询位置所在单元格越近的概念标签有更高的概率成为最终用户查询意图的标签,因此p(gj)可以被定义为如下形式:
其中gq代表查询位置所在的单元格,dc(gj,gq)表示单元格gj和单元格gq之间的切比雪夫距离。λ∈(01)是一个衰减系数,它表明了距离查询位置所在单元格越远的概念成为用户查询意图概念标签的可能性越低。
在概念集合c和用户查询关键字的文本相关性度量方面,我们希望能够衡量查询与概念集合整体(而非单个概念)的相关性。从直觉上考虑,当我们观察到更多的概念标签时,我们可以得到一个更具体、更精确的对象。这一观察意味着,当我们观察到更多的概念时,这组概念标签与查询之间的相关性应当被增强。因此我们使用一个基于噪声减弱的建模方式来度量概念集合c和用户查询关键字的文本相关性,其形式化如下:
步骤s305:根据所述更新后的概念标签集合下的实体数目和所述更新后的概念标签集合和所述用户查询输入的距离评估值,确定所述更新后的概念标签集合和所述用户查询输入的标准粒度评估值;
在本实施例中希望模型在描述用户查询关键字时更倾向于使用细粒度的概念,因为细粒度的概念标签更加接近用户查询的真实意图。然而,在对概念标签和用户查询的典型性评估中,宽泛的概念往往具有较高的典型性,因为它可能与更多的查询关键字相关联。因此,本实施例所提供的标注模型还考虑了概念标签的粒度。本实施例发现了宽泛的概念有两个主要特征:(1)宽泛的概念标签具有大量的实体;(2)知识图谱中宽泛的概念到实体的距离更长。因此在概念粒度评估中考虑了基于实体数目的评估和基于距离的评估。
直观上本实施例发现和较多实体相关联的概念标签往往是宽泛的,而本实施例中只希望学习到概念标签下有较少的关联实体,这样的概念标签越贴近用户的查询意图。因此定义了一个基于实体数目的评估:
其中o是整个实体(空间文本对象)集合,number(c)代表了与概念集合c相关的所有实体的数目。很显然可以得到基于实体数目的评估与具体的用户查询无关,所以这种评估方式偏向于细粒度的概念。
基于距离的评估利用了知识图谱的层次结构,并通过查询关键字到知识图谱中的目标概念的距离来衡量概念标签的粒度。在本实施例中使用了随机游走的期望命中次数来作为距离度量。简单来说,查询关键字在知识图谱上通过随机遍历访问到宽泛的概念需要更长的距离。例如,马克西姆餐厅既是一家餐厅,又是一家豪华餐厅,而豪华餐厅也是餐厅。因此从马克西姆餐厅到餐厅的访问路径必然会经过豪华餐厅。因此使用期望命中次数的倒数来定义基于距离的评估:
其中h(c|word)代表在知识图谱中从关键字word通过随机游走访问到概念标签c的期望步数。
其中hyperm(word)是知识图谱中word的所有上层概念标签,p(c’|word)表示在知识图谱中通过随机游走从word到c’的转移概率。
上述基于实体数目的评估和基于距离的评估分别从不同的特征来衡量概念标签与查询的相关性。由于基于实体数目的评估偏向于细粒度的概念,从而会导致标注结果的高准确率和低召回率。因此本实施例中引入了f值概念进而定义了一个基于f值的粒度评估公式:
步骤s306:结合典型性评估和所述标签粒度评估,得到所述更新后的概念标签集合和用户查询输入的相关性评估值,并记录所述相关性评估值;
将面向空间关键字搜索意图表示的典型性评估和标签粒度评估结合,从而定义了用户查询与概念标签之间综合的相关性评估公式:
rel(c|q)=p(c|q)θ(c|q)
其中,p(c|q)和θ(c|q)分别代表了概念标签集c的典型性和粒度。
步骤s307:在所述更新后的概念标签集合中选择最大相关性评估值对应的一组概念标签集合作为代表用户查询意图的目标概念标签集;
步骤s308:确定所述目标概念标签集内各个概念标签和映射于所述知识图谱的空间文本对象集合内各个空间文本对象之间的相关性;
步骤s309:依据所述相关性的大小,选取k个最大相关性数值对应的空间文本对象作为目标查询结果。
在本实施例中,引入了结构化的图谱知识,将搜索输入、空间文本对象和图谱中的概念、实体进行关联,从而形式化了定义了一种图谱知识驱动的空间关键字查询。其次,结合空间关键字查询的空间属性,提出了一种面向空间关键字搜索意图表示的多概念标签集合式评估方法,通过在搜索意图理解中结合用户的空间位置,对距离用户查询点较远的概念标签进行惩罚,从而使得学习到的用户搜索意图标签在查询点周围有较为频繁的空间分布,避免了用户查询位置周围存在较少甚至没有与查询语义相关的空间文本对象的情况出现。最后,为了进一步提高搜索意图标注的效率,提出了一种面向空间关键字搜索意图标注的贪心搜索方法,通过添加、删除和替换操作来搜索与用户搜索相关性最高的一组标签,同时确保了该贪心搜索方法的收敛性。
请参考图4,图4为本发明实施例提供的一种基于知识图谱的空间关键字查询装置的结构框图;具体装置可以包括:
获取模块100,用于利用映射于知识图谱的空间关键字查询对用户查询输入进行知识图谱标注,获得代表用户查询意图的目标概念标签集;
确定模块200,用于确定所述目标概念标签集内各个概念标签和映射于所述知识图谱的空间文本对象集合内各个空间文本对象之间的相关性;
选取模块300,用于依据所述相关性的大小,选取k个最大相关性数值对应的空间文本对象作为目标查询结果。
本实施例的基于知识图谱的空间关键字查询装置用于实现前述的基于知识图谱的空间关键字查询方法,因此基于知识图谱的空间关键字查询装置中的具体实施方式可见前文中的基于知识图谱的空间关键字查询方法的实施例部分,例如,获取模块100,确定模块200,选取模块300,分别用于实现上述基于知识图谱的空间关键字查询方法中步骤s101,s102和s103所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
本发明具体实施例还提供了一种基于知识图谱的空间关键字查询设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种基于知识图谱的空间关键字查询方法的步骤。
本发明具体实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种基于知识图谱的空间关键字查询方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的基于知识图谱的空间关键字查询方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。