一种地图区域词识别方法、装置、电子设备和存储介质与流程

文档序号:23133891发布日期:2020-12-01 13:08阅读:来源:国知局

技术特征:

1.一种地图区域词识别方法,包括:

获取地图的兴趣点poi数据;

将所述poi数据中的至少一个文本词作为目标词,根据所述目标词所属poi数据的位置信息进行聚类处理;

根据位置信息的聚类结果,对所述目标词进行地图区域词的识别。

2.根据权利要求1所述的方法,其中,将所述poi数据中的至少一个文本词作为目标词,包括:

针对每个所述poi数据,生成对应的词位置集合,其中,所述词位置集合包括至少一个元素,且每个元素包括一个文本词和文本词所属poi数据的位置信息;

将各个所述词位置集合中的至少一个文本词作为目标词。

3.根据权利要求2所述的方法,其中,根据所述目标词所属poi数据的位置信息进行聚类处理,包括:

确定各个所述词位置集合中包括所述目标词的目标元素,并获取所述目标元素中包括的目标词所属poi数据的位置信息;

对所述目标词所属poi数据的位置信息进行聚类。

4.根据权利要求2所述的方法,其中,针对每个所述poi数据,生成对应的词位置集合,包括:

针对任一poi数据,获取该poi数据中的poi名称和位置信息;

对所述poi名称进行分词处理,得到至少一个文本词;

基于至少一个文本词和所述位置信息,生成该poi数据对应的词位置集合。

5.根据权利要求3所述的方法,其中,在对所述目标词所属poi数据的位置信息进行聚类之前,还包括:

确定所述目标元素的数量,并在所述目标元素的数量大于第一数量阈值时,触发执行对所述目标词所属poi数据的位置信息进行聚类的操作。

6.根据权利要求1所述的方法,其中,根据位置信息的聚类结果,对所述目标词进行地图区域词的识别,包括:

获取聚类结果中聚类中心的数量,若该数量不大于第二预设数量阈值,则确定所述目标词为地图区域词。

7.根据权利要求1所述的方法,其中,根据所述目标词所属poi数据的位置信息进行聚类处理,包括:

采用基于密度的聚类算法,对所述目标词所属poi数据的位置信息进行聚类处理。

8.一种地图区域词识别装置,包括:

poi数据获取模块,用于获取地图的兴趣点poi数据;

目标词确定与聚类模块,用于将所述poi数据中的至少一个文本词作为目标词,根据所述目标词所属poi数据的位置信息进行聚类处理;

区域词识别模块,用于根据位置信息的聚类结果,对所述目标词进行地图区域词的识别。

9.根据权利要求8所述的装置,其中,目标词确定与聚类模块,包括:

词位置集合生成单元,用于针对每个所述poi数据,生成对应的词位置集合,其中,所述词位置集合包括至少一个元素,且每个元素包括一个文本词和文本词所属poi数据的位置信息;

目标词确定单元,用于将各个所述词位置集合中的至少一个文本词作为目标词。

10.根据权利要求9所述的装置,其中,目标词确定与聚类模块,包括:

目标元素确定单元,用于确定各个所述词位置集合中包括所述目标词的目标元素,并获取所述目标元素中包括的目标词所属poi数据的位置信息;

聚类单元,用于对所述目标词所属poi数据的位置信息进行聚类。

11.根据权利要求9所述的装置,其中,词位置集合生成单元具体用于:

针对任一poi数据,获取该poi数据中的poi名称和位置信息;

对所述poi名称进行分词处理,得到至少一个文本词;

基于至少一个文本词和所述位置信息,生成该poi数据对应的词位置集合。

12.根据权利要求10所述的装置,其中,还包括:

触发模块,用于在对所述目标词所属poi数据的位置信息进行聚类之前,确定所述目标元素的数量,并在所述目标元素的数量大于第一数量阈值时,触发执行对所述目标词所属poi数据的位置信息进行聚类的操作。

13.根据权利要求8所述的装置,其中,区域词识别模块具体用于:

获取聚类结果中聚类中心的数量,若该数量不大于第二预设数量阈值,则确定所述目标词为地图区域词。

14.根据权利要求8所述的装置,其中,目标词确定与聚类模块还用于:

采用基于密度的聚类算法,对所述目标词所属poi数据的位置信息进行聚类处理。

15.一种电子设备,其特征在于,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的地图区域词识别方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的地图区域词识别方法。


技术总结
本申请公开了一种地图区域词识别方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及大数据、智能交通技术。具体实现方案为:获取地图的兴趣点POI数据;将所述POI数据中的至少一个文本词作为目标词,根据所述目标词所属POI数据的位置信息进行聚类处理;根据位置信息的聚类结果,对所述目标词进行地图区域词的识别。本申请实施例中,在POI数据中直接识别区域词,避免了通过人工方式确定区域词,提升了区域词的识别效率;而且相比于通过爬虫技术爬取区域词,利用所有的POI数据进行区域词挖掘,得到的区域词更全面。

技术研发人员:李岩岩;段建国
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2020.09.25
技术公布日:2020.12.01
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1