1.一种地点数据集建立方法,其特征在于,所述方法包括:
采集地点数据,将所述地点数据划分为多个类别,其中,第i+1类别的每条地点数据从属于第i类别的一条地点数据,每条地点数据分别对应一个地理区域,第i+1类别的第一地点数据对应的地理区域为第i类别的第二地点数据对应的地理区域的子区域;其中,所述第一地点数据从属于所述第二地点数据,i为正整数;
采集至少一个地理区域的特征信息和图像;
分别将所述特征信息和图像与对应的地点数据相关联,并根据各个地点数据及其所属的类别以及相关联的特征信息和图像,建立地点数据集。
2.根据权利要求1所述的方法,其特征在于,所述采集地点数据,包括:
采集原始数据;
从所述原始数据中过滤掉非地点数据,得到所述多个类别的地点数据。
3.根据权利要求2所述的方法,其特征在于,所述从所述原始数据中过滤掉非地点数据,包括:
在所述原始数据中不包括地理位置信息的情况下,和/或,在所述原始数据对应的实体识别结果指示所述原始数据对应的目标对象不属于地点类别的实体对象的情况下,过滤掉述目标对象对应的原始数据。
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述方法还包括:
在分别将所述特征信息和图像与对应的地点数据相关联之前,对所述图像进行去重处理。
5.根据权利要求4所述的方法,其特征在于,所述对所述图像进行去重处理,包括:
获取至少部分图像的哈希值;
根据所述至少部分图像的哈希值对所述至少部分图像进行去重处理。
6.根据权利要求1至5任意一项所述的方法,其特征在于,各个类别的地点数据对应的地理区域包括洲、国家、地区、省、州、市、县、镇中的一者;和/或
第j类别的地点数据对应的地理区域的特征信息包括以下至少一项:国内生产总值、人口密度信息、人口总数信息、海拔信息、时区信息、面积信息、陆域信息、海域信息、第一地理位置信息、建立时间信息;和/或
第k类别的地点数据对应的地理区域的特征信息包括以下至少一项:访问时间信息、第二地理位置信息、描述信息、消费信息、功能信息;
其中,j与k为小于类别总数的正整数,且j小于k。
7.一种地点数据集,其特征在于,所述地点数据集基于权利要求1至6任意一项所述的方法而建立。
8.一种数据处理方法,其特征在于,所述方法包括:
将待处理数据输入预先训练的地点数据处理模型;
通过所述地点数据处理模型对所述待处理数据进行处理,得到处理结果;
其中,所述地点数据处理模型根据从预先建立的地点数据集中获取的训练样本数据训练得到,并基于预先确定的任务类型对所述待处理数据进行处理;
所述地点数据集中包括多个类别的地点数据,第i+1类别的每条地点数据从属于第i类别的一条地点数据,每条地点数据对应一个地理区域,第i+1类别的第一地点数据对应的地理区域为第i类别的第二地点数据对应的地理区域的子区域;其中,所述第一地点数据从属于所述第二地点数据,至少一个类别的地点数据与对应地理区域的特征信息和图像相关联,i为正整数。
9.根据权利要求8所述的方法,其特征在于,所述任务类型包括:地点检索任务,地点分类任务,地点功能分类任务或者地点识别任务中的至少一项。
10.根据权利要求8或9所述的方法,其特征在于,所述方法还包括:
根据基于所述任务类型而确定的评估参数,对所述地点数据处理模型的处理结果的准确率进行评估。
11.根据权利要求10所述的方法,其特征在于,在所述任务类型包括地点检索任务的情况下,所述评估参数包括所述地点数据处理模型的检索准确率;和/或
在所述任务类型包括地点分类任务的情况下,所述评估参数包括所述地点数据处理模型的分类准确率;和/或
在所述任务类型包括地点功能分类任务的情况下,所述评估参数包括所述地点数据处理模型的分类准确率;和/或
在所述任务类型包括地点识别任务的情况下,所述评估参数包括所述地点数据处理模型的识别准确率。
12.一种数据处理方法,其特征在于,所述方法包括:
从地点数据集中采集多个目标地理区域对应的目标地点数据;
对于每个目标地理区域对应的目标地点数据,根据与所述目标地点数据相关联的特征信息以及从属于所述目标地点数据的地点数据的图像,对所述目标地理区域进行向量化处理,得到所述目标地理区域的表示向量;
根据所述多个目标地理区域对应的表示向量确定所述多个目标地理区域之间的关联关系;
其中,所述地点数据集基于权利要求1至6任意一项所述的方法获取。
13.根据权利要求12所述的方法,其特征在于,所述根据与所述目标地点数据相关联的特征信息以及从属于所述目标地点数据的地点数据的图像,对所述目标地理区域进行向量化处理,得到所述目标地理区域的表示向量,包括:
将与所述目标地点数据相关联的特征信息以及从属于所述目标地点数据的地点数据的图像分别输入预先建立的地点数据处理模型,并获取所述地点数据处理模型输出的所述目标地理区域的表示向量。
14.根据权利要求13所述的方法,其特征在于,所述地点数据处理模型通过以下方式获取所述目标地理区域的表示向量:
获取所述目标地点数据相关联的特征信息对应的特征向量;
将所述特征向量作为所述目标地理区域的表示向量;
或者
获取从属于所述目标地点数据的地点数据的图像对应的图像向量;
将所述图像向量作为所述目标地理区域的表示向量;
或者
获取所述目标地点数据相关联的特征信息对应的特征向量,以及从属于所述目标地点数据的地点数据的图像对应的图像向量;
根据所述特征向量和图像向量生成所述目标地理区域的表示向量。
15.根据权利要求14所述的方法,其特征在于,所述根据所述特征向量和图像向量生成所述目标地理区域的表示向量,包括:
获取各个图像向量的平均向量;
根据所述特征向量和平均向量生成所述目标地理区域的表示向量。
16.一种地点数据集建立装置,其特征在于,所述装置包括:
第一采集模块,用于采集地点数据,将所述地点数据划分为多个类别,其中,第i+1类别的每条地点数据从属于第i类别的一条地点数据,每条地点数据分别对应一个地理区域,第i+1类别的第一地点数据对应的地理区域为第i类别的第二地点数据对应的地理区域的子区域;其中,所述第一地点数据从属于所述第二地点数据,i为正整数;
第二采集模块,用于采集至少一个地理区域的特征信息和图像;
建立模块,用于分别将所述特征信息和图像与对应的地点数据相关联,并根据各个地点数据及其所属的类别以及相关联的特征信息和图像,建立地点数据集。
17.一种数据处理装置,其特征在于,所述装置包括:
输入模块,用于将待处理数据输入预先训练的地点数据处理模型;
任务处理模块,用于通过所述地点数据处理模型对所述待处理数据进行处理,得到处理结果;
其中,所述地点数据处理模型根据从预先建立的地点数据集中获取的训练样本数据训练得到,并基于预先确定的任务类型对所述待处理数据进行处理;
所述地点数据集中包括多个类别的地点数据,第i+1类别的每条地点数据从属于第i类别的一条地点数据,每条地点数据对应一个地理区域,第i+1类别的第一地点数据对应的地理区域为第i类别的第二地点数据对应的地理区域的子区域;其中,所述第一地点数据从属于所述第二地点数据,至少一个类别的地点数据与对应地理区域的特征信息和图像相关联,i为正整数。
18.一种数据处理装置,其特征在于,所述装置包括:
第三采集模块,用于从地点数据集中采集多个目标地理区域对应的目标地点数据;
向量化处理模块,用于对于每个目标地理区域对应的目标地点数据,根据与所述目标地点数据相关联的特征信息以及从属于所述目标地点数据的地点数据的图像,对所述目标地理区域进行向量化处理,得到所述目标地理区域的表示向量;
确定模块,用于根据所述多个目标地理区域对应的表示向量确定所述多个目标地理区域之间的关联关系;
其中,所述地点数据集基于权利要求1至6任意一项所述的方法获取。
19.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至13任意一项所述的方法。
20.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至13任意一项所述的方法。