本公开涉及人工智能,具体地涉及一种地理特征生成方法、装置、设备、介质和程序产品。
背景技术:
1、在大数据和人工智能领域,数据和特征对于统计分析和机器学习具有十分重要的作用,数据和特征决定了机器学习模型训练的上限,而好的机器学习算法能无限逼进这个上限,由此可见特征的设计对于大数据及机器学习的重要性。在很多领域,一些行为特征据通常带有一定的地域性特点,比如金融骗团等,往往呈现一种人员聚集的现象,通常呈现某一地域特别多发的情况。
2、随着大数据和人工智能领域快速发展,对于海量数据如何使用,变成一个越来重要和棘手的问题,运用数据构建特征工程是大数据和人工智能的基础。大数据特征工程中往往涉及地理位置信息,由于人为表达的不规范性,体现在数据上存在差异,对于机器学习来说很难从字面意义上判断两个地址是否具有地域特征。
技术实现思路
1、鉴于上述问题,本公开提供了一种地理特征生成方法、装置、设备、介质和程序产品。
2、根据本公开的第一个方面,提供了一种地理特征生成方法,其中,包括:
3、获取地址信息集,所述地址信息集包括至少一个文本形式的地址信息;
4、将所述至少一个地址信息发送至地图引擎中进行定位;
5、根据定位的结果,生成与所述至少一个地址信息相匹配的地理特征数据;
6、将所述至少一个地址信息和与所述至少一个地址信息相匹配的所述地理特征数据进行关联,并存储至地理特征表中。
7、根据本公开的实施例,所述根据定位的结果,生成与所述至少一个地址信息相匹配的地理特征数据,包括:
8、获取所述至少一个地址信息的经纬度数据;
9、根据所述经纬度数据,生成所述至少一个地址信息所在区域的地图,所述地图中标注有所述至少一个地址信息在所述地图中所对应的位置;
10、响应于用户的预设操作,根据所述至少一个地址信息在所述地图中所对应的位置,获取gis信息,以得到与所述至少一个地址信息相匹配的地理特征数据。
11、根据本公开的实施例,至少一个地址信息包括多级地址,多级地址包括第一级地址和第二级地址;所述至少一个地址信息通过以下步骤获取:
12、向用户提供数据字典,所述数据字典包括多个预设地址;
13、响应于用户在所述数据字典中选中的所述预设地址,确定至少一个地址信息的所述第一级地址;
14、根据用户在地址信息输入栏输入的内容,确定至少一个地址信息的所述第二级地址;和/或,
15、利用图像识别技术,对目标对象进行扫描;
16、根据扫描结果,确定至少一个地址信息的所述第一级地址;
17、将确定出的所述第一级地址和所述第二级地址进行拼接,以得到所述至少一个地址信息。
18、根据本公开的实施例,所述将所述至少一个地址信息发送至地图引擎中进行定位,包括:
19、获取所述至少一个地址信息;
20、对所述至少一个地址信息进行更正;
21、从更正后的所述地址信息中,提取地址关键元信息;
22、将获取到的所述地址关键元信息发送至所述地图引擎中进行定位。
23、根据本公开的实施例,所述将获取到的所述地址关键元信息发送至所述地图引擎中进行定位,包括:
24、在预先配置的标准地址库中进行检索,以获得与所述地址关键元信息相匹配的标准地址关键元信息;
25、将获取到的所述标准地址关键元信息发送至地图引擎中进行定位。
26、根据本公开的实施例,所述地理特征处理方法,还包括:
27、对所述至少一个地址信息和所述地理特征数据进行扩展处理,以构建新的地址信息和所述地理特征数据;
28、将新的地址信息和所述地理特征数据进行关联后,存储至地理特征表中。
29、本公开的第二方面提供了一种地理特征生成装置,其中,包括:
30、第一获取模块,用于获取地址信息集,所述地址信息集包括至少一个文本形式的地址信息;
31、定位模块,用于将所述至少一个地址信息发送至地图引擎中进行定位;
32、生成模块,用于根据定位的结果,生成与所述至少一个地址信息相匹配的地理特征数据;
33、存储模块,用于将所述至少一个地址信息和与所述至少一个地址信息相匹配的所述地理特征数据进行关联,并存储至地理特征表中。
34、本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述的地理特征生成方法。
35、本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述的地理特征生成方法。
36、本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的地理特征生成方法。
37、上述一个或多个实施例具有如下优点或益效果:
38、本公开的实施例根据地址信息,通过地图引擎生成地图,在确认生成的地图与地址信息表述为同一地址时,获取相应的地理特征,并将地址信息和地理特征进行关联,然后存储到地理特征表中,以供大数据分析或者模型训练。本公开的实施例有效解决了文本形式的地址信息难以用于进行大数据分析或者进行模型训练的问题,通过合理运用地图引擎,将文本形式的地址信息转处理为地理特征,进而,能够将地理特征作为样本供大数据分析或者模型训练。
1.一种地理特征生成方法,其特征在于,包括:
2.根据权利要求1所述的地理特征生成方法,其特征在于,所述根据定位的结果,生成与所述至少一个地址信息相匹配的地理特征数据,包括:
3.根据权利要求1所述的地理特征生成方法,其特征在于,至少一个地址信息包括多级地址,多级地址包括第一级地址和第二级地址;所述至少一个地址信息通过以下步骤获取:
4.根据权利要求1所述的地理特征生成方法,其特征在于,所述将所述至少一个地址信息发送至地图引擎中进行定位,包括:
5.根据权利要求4所述的地理特征生成方法,其特征在于,所述将获取到的所述地址关键元信息发送至所述地图引擎中进行定位,包括:
6.根据权利要求1所述的地理特征生成方法,其特征在于,所述地理特征处理方法,还包括:
7.一种地理特征生成装置,其特征在于,包括:
8.一种电子设备,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~6中任一项所述的地理特征生成方法。
10.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~6中任一项所述的地理特征生成方法。