本申请涉及地理变化信息检测,尤其是涉及一种基于事件图谱的地理变化信息的检测方法、装置和设备。
背景技术:
1、目前,获取地理信息变化的方式主要是人工实地查找地理空间变化信息,然而,该方式存在人力成本投入大、费用高、时效性差等问题,且很多地理信息发生变化后难以发现,大量地理信息的现实性跟不上实际地物的变化速度,已经远远不能满足当前社会经济发展和公众的需求。
技术实现思路
1、本申请的目的在于提供一种基于事件图谱的地理变化信息的检测方法、装置和设备,将传统地理空间变化监测从被动督促转变为主动发现模式,降低了地理变化信息获取的时间成本和人力成本,提升了地理变化信息获取的及时性。
2、第一方面,本发明提供一种基于事件图谱的地理变化信息的检测方法,所述方法包括:构建地理变化信息本体,所述地理变化信息本体包括地理实体类型和事件角色;基于所述地理变化信息本体和预设语料标注框架对语料进行标注,得到标注实体,并将所述标注实体与所述地理实体类型和事件角色进行关联,得到关联数据样本;通过所述关联数据样本对预先构建的目标检测模型进行训练,得到地理变化信息检测模型;通过所述地理变化信息检测模型对采用预先配置的爬虫工具进行爬虫得到的地理信息进行知识抽取,得到目标地理变化信息;将所述目标地理变化信息进行可视化展示;其中,所述可视化展示包括地图展示和/或列表展示。
3、在可选的实施方式中,所述地理实体类型包括:包括自然地理实体类型、人工地理实体类型、管理地理实体类型;所述事件角色至少包括触发词、来源名称、来源网址、变化日期、变化主体,其中,所述变化主体为发生变化的所述地理实体类型。
4、在可选的实施方式中,所述预先构建的目标检测模型包括自底向上包括3层:embedding层、双向lstm层、crf层;其中,embedding层用于表征句子中的词向量,作为双向lstm的输入,通过词向量学习模型获得;双向lstm层通过一个正向lstm和一个反向lstm的输入,分别计算每个词考虑左侧和右侧词时对应的向量,然后将每个词的两个向量进行连接,形成词的向量输出;crf层以双向lstm输出的向量作为输入,对句子中的命名实体进行序列标注。
5、在可选的实施方式中,所述方法还包括:通过预先配置的爬虫工具进行地理信息爬虫处理,具体的:创建至少一个爬虫任务;响应针对规则配置组件的选择操作或组合操作,配置爬虫规则;所述规则配置组件至少包括开始组件、爬取组件、定义变量组件、输出节点组件、循环节点组件、等待组件、数据库交互组件、子流程组件、执行函数组件和状态流转组件;采用预设的正则表达式配置爬虫任务的执行时间;采用quartz分布式任务调度框架进行多线程周期性的执行网站数据爬取任务,获取地理信息。
6、在可选的实施方式中,所述方法还包括:基于jsoup库对爬取到的网站数据进行数据清洗处理,去除html标签,得到经过数据清洗处理后的地理信息;其中,所述地理信息为不带html标签的非结构化的纯文本数据。
7、在可选的实施方式中,通过所述地理变化信息检测模型对采用预先配置的爬虫工具进行爬虫得到的地理信息进行知识抽取,得到目标地理变化信息,包括:通过所述地理变化信息检测模型对采用预先配置的爬虫工具进行爬虫得到的地理信息进行知识抽取,得到结构化的目标地理变化信息,所述目标地理变化信息至少包括地理实体的变化主体、变化时间、变化地点、来源名称、来源网址;将结构化的目标地理变化信息保存到postgresql数据库中。
8、在可选的实施方式中,所述方法还包括:在所述目标地理变化信息生效前,对所述目标地理变化信息进行可信度审核;若可信度审核通过,则所述目标地理变化信息确定生效。
9、第二方面,本发明提供一种基于事件图谱的地理变化信息的检测装置,所述装置包括:本体构建模块,用于构建地理变化信息本体,所述地理变化信息本体包括地理实体类型和事件角色;实体关联模块,用于基于所述地理变化信息本体和预设语料标注框架对语料进行标注,得到标注实体,并将所述标注实体与所述地理实体类型和事件角色进行关联,得到关联数据样本;模型训练模块,用于通过所述关联数据样本对预先构建的目标检测模型进行训练,得到地理变化信息检测模型;知识抽取模块,用于通过所述地理变化信息检测模型对采用预先配置的爬虫工具进行爬虫得到的地理信息进行知识抽取,得到目标地理变化信息;结果展示模块,用于将所述目标地理变化信息进行可视化展示;其中,所述可视化展示包括地图展示和/或列表展示。
10、第三方面,本发明提供一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现前述实施方式任一项所述的基于事件图谱的地理变化信息的检测方法。
11、第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现前述实施方式任一项所述的基于事件图谱的地理变化信息的检测方法。
12、本申请提供的基于事件图谱的地理变化信息的检测方法、装置和设备,首先基于知识图谱技术构建地理变化事件知识的本体模型,然后结合地理变化事件语料进行事件知识抽取模型训练,生成地理变化信息检测模型;随后采用预先配置的爬虫工具爬取包含地理变化信息内容,并根据包含地理变化信息的内容抽取得到结构化的目标地理变化信息,并通过前端页面可视化技术展示在地图上,对目标地理变化信息进行展示,将传统地理空间变化监测从被动督促转变为主动发现模式,降低了地理变化信息获取的时间成本和人力成本,提升了地理变化信息获取的及时性。
1.一种基于事件图谱的地理变化信息的检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于事件图谱的地理变化信息的检测方法,其特征在于,所述地理实体类型包括:包括自然地理实体类型、人工地理实体类型、管理地理实体类型;所述事件角色至少包括触发词、来源名称、来源网址、变化日期、变化主体,其中,所述变化主体为发生变化的所述地理实体类型。
3.根据权利要求1所述的基于事件图谱的地理变化信息的检测方法,其特征在于,所述预先构建的目标检测模型包括自底向上包括3层:embedding层、双向lstm层、crf层;
4.根据权利要求1所述的基于事件图谱的地理变化信息的检测方法,其特征在于,所述方法还包括:
5.根据权利要求4所述的基于事件图谱的地理变化信息的检测方法,其特征在于,所述方法还包括:
6.根据权利要求5所述的基于事件图谱的地理变化信息的检测方法,其特征在于,通过所述地理变化信息检测模型对采用预先配置的爬虫工具进行爬虫得到的地理信息进行知识抽取,得到目标地理变化信息,包括:
7.根据权利要求1所述的基于事件图谱的地理变化信息的检测方法,其特征在于,所述方法还包括:
8.一种基于事件图谱的地理变化信息的检测装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至7任一项所述的基于事件图谱的地理变化信息的检测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现权利要求1至7任一项所述的基于事件图谱的地理变化信息的检测方法。