基于突发事件应急管理的知识库引擎构建及其查询方法

文档序号:6385174阅读:480来源:国知局
专利名称:基于突发事件应急管理的知识库引擎构建及其查询方法
技术领域
本发明涉及城市综合应急管理技术领域,具体涉及一种基于突发事件应急管理的知识库引擎构建及其查询方法。
背景技术
随着城市的急速发展和现代科学技术的运用,城市系统日趋复杂,综合风险与日俱增,特别是近年来自然灾害和人为灾害频发,给城市安全带来前所未有的挑战。因此,如何强化城市安全机制,对随时可能的突发事件做出及时、有效的响应是当前急需解决的重大课题。通过信息化手段来推动政府职能的现代化建设是各级管理部门的共识。在应急管理领域,各种城市综合应急管理平台应运而生。应急平台使得各行业管理工作得到集中管理和统一指挥,信息实现了互联互通和共享使用,事件处置过程更加规范,有效提高了政府部门的应急处置能力。从知识库平台方面,目前有覆盖广泛领域的、通用的网络版知识库,如百度文库、豆丁网等,也有一些专业的知识库,如深蓝KMPRO知识管理平台、CYC海量知识库等,以及一些特定领域如机械设计领域、故障诊断知识库、论文和专利领域知识库等。这些知识库涉及的领域多种多样,依据知识表示方式的不同以及行业的区别,他们的知识平台构建方式和信息查询使用方式也有很大差异。这些知识库平台的优势在于提供了巨大容量的知识存储空间,形成了高效知识查询。缺陷在于知识的构建,特别是在突发事件应急管理领域知识的分类存储和精确查询还不成熟。而且,由于构建上的缺陷,无法实现智能化的查询。

发明内容
本发明解决的技术问题之一在于提供一种基于突发事件应急管理的知识库引擎构建;根据应急知识库的特点,使用标准的突发事件分类标准和要素,对应急知识库进行分类和结构化组织,并依照分类处理算法,建立类别库,分类出的数据结构化更完善、信息覆盖面更全面,更切合突发事件应急管理专业化实际。本发明解决的技术问题之二在于提供一种基于突发事件应急管理的知识库查询方法;通过利用依据突发事件建立起来的同义词字典、类型词语字典等专有词典,结合特征库和类别库,实现信息的智能化分类查询,查询出的结果精确度更高,显示方式更友善。本发明解决上述技术问题之一的技术方案是将整个应用架构分为应用层、应用支撑层、数据层和基础支撑层;应用层主要包括信息录入和信息查询两部分;应用支撑层主要包括信息提取模块、自动分词处理模块和分类处理模块、语义理解模块、知识理解模块、知识检索模块等六大模块;数据层主要包括知识库、特征库和类型库,另外还包括同义词字典、类型词语字典等;基础支撑层主要包括分布式数据库、存储设备、服务器设备和应用工作站、网络、操作系统和中间件等;中间件位于异构的硬件平台和操作系统之上,屏蔽异构的硬件平台和操作系统的差异,并为上层的应用提供诸如负载均衡、事务管理、可靠消息传递等服务。从非结构化文本信息中抽取相关的数据,滤除无用数据并且改进它的结构,确保数据的匀称性;对提取的信息文本内容结构化分析,提取其特征存入特征库,作为该知识的特征词语;对提取的信息经自动分词处理后,对结果进行分类处理,依据信息分类标准进行分类处理,建立该知识与分类信息的关联;特征库和类型库用于用户信息查询时的模式匹配;分析信息查询的日志,把用户的行为习惯挖掘出来反馈给信息录入模块。在信息提取时利用二叉树对自然语言进行分拆,并利用同义词字典实现对同义词的处理。本发明解决上述技术问题之二的技术方案是查询主要步骤分为语义理解、知识理解和知识检索;在语义理解中是利用智能分词技术将组成语句的核心词提炼出来供语义分析模块使用;在分词的过程中,首先利用整个语句中的标点符号,把整条语句划分为几个短句,对短句按照字符长短进行划分,划分为词语,遍历到的词语与词典库中的词语进行对比,如在字典中,则提取取出,如果不在字典中,则作为冗余信息过滤掉;知识理解将语义理解过程中提取出的关键字,通过同义词字典,自动联想到同义词,从而利用同义词在特征库中进行关键字查找,对用户提出的问题给出准确度最高、相关性最强、最全面检索结果;知识检索主要包括关键字查找和类型查找,关键字查找是依据同义词字典,在特征库中查找,进而找到相关知识;类型查找是利用该知识与类型建立的关联,确定该知识的类型信息,主要是根据知识库的结构化关联,将通过知识理解查找到的具体知识信息进行知识归纳为具体的类别,给用户以清晰的信息显示。在查询系统中设置用户信息反馈机制,对用户信息进行挖掘;用户根据对查询出的信息内容进行评价和打分,其打分结果影响着信息的判断。本发明以突发事件应急处理为主题进行知识库构建,根据应急突发事件处理知识库的特点,分别建立突发事件专有的同义词字典、类型词语字典,依据事件分类标准和知识分类处理方法,实现了突发事件应急处理知识库有效构建、信息快速查询等功能。


下面结合附图对本发明进一步说明图1是本发明总体框架图;图2是本发明应急知识库构建图;图3是本发明应急知识库查询流程图;图4是本发明知识库分类图。
具体实施方式
基于突发事件应急管理的知识库引擎是一个以突发事件应急管理行业为导向,可有效地沉淀行业知识,生成解决方案,快速的知识获取及知识库建立、更新、维护、管理、使用的应用平台。它打破了一般的知识库平台的应用模式,专门针对该领域进行了分析与实现,从而使得突发事件应急管理领域知识库知识资产得到最大限度的共享和复用,更有效率的在更大范围内发挥突发事件应急管理领域知识库的核心价值。如图1所示,本发明整个应用的架构共分为4层,分别为应用层、应用支撑层、数据层和基础支撑层。知识库引擎设计从应用角度主要包括信息录入和信息查询两部分。信息录入是建立知识库的源泉,信息查询是知识库的具体应用。从支撑功能模块上划分,知识库引擎主要包括信息提取模块、自动分词处理模块和分类处理模块、语义理解模块、知识理解模块、知识检索模块等六大模块。从数据层上划分主要包括知识库、特征库和类型库,另外还包括同义词字典、类型词语字典等。基础支撑层主要包括分布式数据库、存储设备、服务器设备和应用工作站、网络、操作系统和中间件等。中间件位于异构的硬件平台和操作系统之上,它屏蔽了异构的硬件平台和操作系统的差异,并为上层的应用提供诸如负载均衡、事务管理、可靠消息传递等服务。如图2所示,本发明知识库引擎构建时,信息录入是基于突发事件应急管理知识库引擎的核心之一,是知识库的数据来源,也是建立高效的知识应用,即信息查询的基础。信息录入处理的好坏影响着信息查询结果以及智能化实现的程度。突发事件知识库信息没有统一的规范,极少数是结构化文本,大部分是非结构化文本。要规范化表达,就要从大量的非结构化文本信息中提取有用的信息进行分析,在数据库中形成结构化而又相互关联的知识库。信息提取是指从非结构化文本信息中抽取相关的数据,滤除无用数据并且改进它的结构,确保数据的匀称性。信息提取的关键是自然语言的理解,我们利用二叉树对自然语言进行分拆,并利用同义词字典实现对同义词的处理。例如2012年4月9日4时31分,位于我市中堂镇的东莞建晖纸业有限公司发生火灾。首先利用标点符号进行分割,分为“2012年4月9日4时31分”,“位于我市中堂镇的东莞建晖纸业有限公司发生火灾”两个短句,针对两个短句,遍历出其中的实词如“中堂镇”、“东莞”、“建晖纸业有限公司”、“火灾”等,利用该实词与字典中的词进行比较,如果在字典中,则提取出来,否则过滤掉。对提取的信息文本内容结构化分析,提取其特征存入特征库,作为该知识的特征词语。对提取的信息经自动分词处理后,对结果进行分类处理,建立该知识与分类信息的关联。信息分类依据4大类、44个子类、320多个小类的突发事件分类标准作为分类标准。从提取的信息中,可以对比出火灾应该属于事故灾害类。通过上述处理,对信息进行了分类和关键字特征信息的建立。为信息的高效检索提供了条件。
特征库和类型库的建立用于用户信息查询时的模式匹配。分析信息查询的日志,把用户的行为习惯挖掘出来反馈给信息录入模块,以便于进行不断的学习改进。应急知识库查询如图3所示,信息查询接口提供了简单的查询接口和复杂的查询接口,显示的结果分为罗列式和信息归纳式两种。复杂的查询接口与自然语言进行交互,得到的信息更加准确。信息归纳式结果显示方便用户对信息的比较。尤其是突发应急事件分类规范、清晰,基于突发事件分类标准进行信息归纳式结果显示,信息的归纳汇总让人一目了然。实现智能查询的过程主要分3部分语义理解、知识理解和知识检索。其中,知识库是实现智能查询的基础和核心。知识库提供的是语义理解中最终将要提供给用户的结果O在语义理解的整个过程中,智能分词技术是最初的一个环节,它将组成语句的核心词提炼出来供语义分析模块使用。在分词的过程中,首先利用整个语句的中的标点符号,把整条语句划分为几个短句,对短句按照字符长短进行划分,划分为词语,遍历到的词语与词典库中的词语进行对比,如在字典中,则提取取出,如果不在字典中,则作为冗余信息过滤掉。知识理解则用到同义词字典,将语义理解过程中提取出的关键字,通过同义词字典,自动联想到同义词,从而利用同义词在特征库中进行关键字查找,对用户提出的问题给出准确度最高,相关性最强的、最全面检索结果。知识检索主要包括关键字查找和类型查找,关键字查找依据同义词字典,在特征库中查找,进而找到相关知识。类型查找是利用该知识与类型建立的关联,确定该知识的类型信息。知识与分类的关联信息在知识录入的过程中建立起来,并存在于类型库中。类型查找主要是根据知识库的结构化关联,通过知识理解,查找到的具体知识信息,将知识归纳为具体的类别,给用户以清晰的信息显示。在信息查询系统中,设置了用户信息反馈机制,对用户信息进行挖掘。用户根据对查询出的信息内容进行评价和打分,其打分结果影响着信息的判断本发明涉及的知识库分类如图4所示,突发事件处理知识库按照知识类型一般划分为3层、4大类、44个子类、320多个小类。第一层包括自然灾害类、事故灾害类、公共卫生类、社会安全类;第二层是对第一层中的各种类型进行细分,比如自然灾害类包括森林火灾、地震、气象灾害、地质灾害、海洋灾害、生物灾害、其他。第三层是在第二层类型基础上继续进行细分,比如水害灾害包括台风、高温、暴雨、雷电、冰雹、寒流、大雾、其他。突发事件按照要素划分为突发事件定义、成因、发展规律、临界条件、灾害后果、应对措施、典型案例、典型图片、典型视频、典型危险源、对应的应急物质和装备等。在分类处理过程中,分类处理分为训练和分类两个阶段,具体过程如下(I)依照突发事件的分类标准建立事件的类别集。分为4大类、44个子类、320多个小类。(2)给出训练文档集,训练文档集从突发应急事件应急处理知识库中抽取。抽取时应按照均匀性、多样性原则进行。即在每种类型下均抽取一定数量的文档,相同类别的文档尽量保持差异性,建立词条与类别集之间关系库,即类型库。
(3)统计各词条在训练文档集中出现的频率,根据统计词频,提取训练文档集中所有文档的特征矢量。分类过程是(I)对于测试文档集合中的每一个待分类文档,提取待分类文档的特征向量。(2)计算待分类文档的特征矢量与每一个类型词条之间的距离测度,即相似度,根据与各文档主题类别的距离测度来确定待分类文档的归属。(3)选择相似度最大的一个类别,作为测试文档的最终分类。
权利要求
1.一种基于突发事件应急管理的知识库构建,其特征在于将整个应用架构分为应用层、应用支撑层、数据层和基础支撑层;应用层主要包括信息录入和信息查询两部分;应用支撑层主要包括信息提取模块、自动分词处理模块和分类处理模块、语义理解模块、知识理解模块、知识检索模块等六大模块;数据层主要包括知识库、特征库和类型库,另外还包括同义词字典、类型词语字典等;基础支撑层主要包括分布式数据库、存储设备、服务器设备和应用工作站、网络、操作系统和中间件等;中间件位于异构的硬件平台和操作系统之上,屏蔽异构的硬件平台和操作系统的差异,并为上层的应用提供诸如负载均衡、事务管理、可靠消息传递等服务。
2.根据权利要求1所述的知识库构建,其特征在于从非结构化文本信息中抽取相关的数据,滤除无用数据并且改进它的结构,确保数据的匀称性;对提取的信息文本内容结构化分析,提取其特征存入特征库,作为该知识的特征词语;对提取的信息经自动分词处理后,依据信息分类标准进行分类处理,建立该知识与分类信息的关联;特征库和类型库用于用户信息查询时的模式匹配;分析信息查询的日志,把用户的行为习惯挖掘出来反馈给信息录入模块。
3.根据权利要求2所述的知识库构建,其特征在于在信息提取时利用二叉树对自然语言进行分拆,并利用同义词字典实现对同义词的处理。
4.一种权利要求1-3任一项所构建知识库的查询方法,其特征在于查询主要步骤分为语义理解、知识理解和知识检索;在语义理解中是利用智能分词技术将组成语句的核心词提炼出来供语义分析模块使用;在分词的过程中,首先利用整个语句中的标点符号,把整条语句划分为几个短句,对短句按照字符长短进行划分,划分为词语,遍历到的词语与词典库中的词语进行对比,如在字典中,则提取取出,如果不在字典中,则作为冗余信息过滤掉;知识理解将语义理解过程中提取出的关键字,通过同义词字典,自动联想到同义词,从而利用同义词在特征库中进行关键字查找,对用户提出的问题给出准确度最高、相关性最强、最全面的检索结果;知识检索主要包括关键字查找和类型查找,关键字查找是依据同义词字典,在特征库中查找,进而找到相关知识;类型查找是利用该知识与类型建立的关联,确定该知识的类型信息,主要是根据知识库的结构化关联,将通过知识理解查找到的具体知识信息进行知识归纳为具体的类别,给用户以清晰的信息显示。
5.根据权利要求4所述的查询方法,其特征在于在查询系统中设置用户信息反馈机制,对用户信息进行挖掘;用户根据对查询出的信息内容进行评价和打分,其打分结果影响着信息的判断。
全文摘要
本发明涉及城市综合应急管理技术领域,具体涉及一种基于突发事件应急管理的知识库引擎构建及其查询方法。本发明构建知识库时从非结构化文本信息中抽取相关的数据,滤除无用数据并且改进它的结构,确保数据的匀称性;对提取的信息文本内容结构化分析,提取其特征存入特征库,作为该知识的特征词语;对提取的信息经自动分词处理后,依据信息分类标准进行分类处理,建立该知识与分类信息的关联。将知识库的查询主要步骤分为语义理解、知识理解和知识检索。本发明有效解决了现有知识库的分类存储和精确查询等缺陷;可以应用于突发事件应急管理的知识库引擎构建和查询。
文档编号G06F17/30GK103049532SQ20121056433
公开日2013年4月17日 申请日期2012年12月21日 优先权日2012年12月21日
发明者贺忠堂, 李新安, 赵锋伟, 李智勇 申请人:东莞中国科学院云计算产业技术创新与育成中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1