面向本体的时空信息挖掘及可视化展示方法与流程

文档序号:12666512阅读:220来源:国知局
面向本体的时空信息挖掘及可视化展示方法与流程
本发明涉及计算机应用中的数据挖掘和信息可视化领域,具体来说涉及一种面向本体的时空信息挖掘及可视化展示方法。
背景技术
:本体(Ontology)是对客观世界概念化和结构化的明确描述,揭示知识本身含义和知识之间的联系,以还原世界本来面目。本体研究特定领域知识的对象分类、对象属性和对象间的关系,其最著名的定义是由Gruber提出的“本体是概念模型的明确的规范说明”。本体通常被看作是一个领域的知识基础,它使得应用程序可以方便地获取,并促进领域知识的共享。目前,本体已广泛应用于语义web、智能信息检索、信息集成、问答系统等领域。随着本体研究的发展,可视化成为反映本体的直观而简洁的方式,本体的特点使得它易于用可视化的方法来描述,本体可视化能够从图示中清晰地看到概念的层次结构、属性关系、实例等内容,并可以直观、简便地进行正确性检查。本体可视化的工具主要分两种,一种是基于Protégé的可视化插件;另一种是独立于本体领域的通用可视化工具。第一种方便快捷,如TGViz、Jambalaya、OntoViz等,第二种易于扩展,如Piccolo、Processing、TheVisualizationToolkit(VTK)、JUNG等。时间和空间是人类永恒的话题,任何事物都与时间和空间密切相关,时空问题普遍存在于各领域中。对本体的时空信息挖掘及可视化呈现对于解决不同领域之间的信息交互、信息集成、资源共享、资源重用等问题有着重要的意义,从而更好地服务于语义web、智能信息检索、信息集成、智能问答系统等应用。然而,当前本体的可视化仅从本体的组织体系和内容定义层面进行展示,尚未对本体隐含的深层信息,尤其是时空信息,进行分析及显示。有鉴于此,特提出本发明。技术实现要素:针对上述现有技术存在的不足,本发明提供一种面向本体的时空信息挖掘及可视化展示方法,以解决如何实现对本体隐含的时空信息进行挖掘并给予可视化呈现的技术问题。为了实现上述目的,提供以下技术方案:一种面向本体的时空信息挖掘及可视化展示方法,该方法包括:对本体的概念进行分类;将分类后的本体中的概念在时空特征上进行关联;针对分类后的概念,以图层的形式对本体进行时空可视化展示。优选地,对本体的概念进行分类具体包括:将本体的概念分为人物概念、事件概念和其他概念。优选地,将分类后的本体中的概念在时空特征上进行关联,具体包括:分别对分类后的本体进行时间信息挖掘和空间信息挖掘,将分类后的本体中的概念在时空特征上进行关联。优选地,对分类后的本体进行时间信息挖掘的步骤具体包括:建立分类后的本体的时间同义词集合,将本体中的非规范时间描述信息关联起来;针对分类后的本体,抽取出同一时间范围内的概念。优选地,针对分类后的本体,抽取出同一时间范围内的概念,具体包括:对于每一时间同义词集合,根据所有概念的属性值,按照时间度量,抽取出同一时间范围内的概念。优选地,对分类后的本体进行空间信息挖掘的步骤具体包括:建立分类后的本体的空间同义词集合,将本体中的非规范空间描述信息关联起来;针对分类后的本体,抽取出同一空间范围内的概念。优选地,针对分类后的本体,抽取出同一空间范围内的概念,具体包括:对每一空间同义词集合,根据所有概念的属性值,按照空间度量,抽取出同一空间范围内的概念。优选地,针对分类后的概念,以图层的形式对本体进行时空可视化展示,具体包括:基于二维GIS地理信息系统,针对分类后的概念,建立可视化界面;以图层表示分类后的概念,并用图标进行区别;在可视化界面上,以横向滑动的形式显示时间信息;在可视化界面上,以不同填充颜色的形式显示空间信息。优选地,方法还包括:当定位到可视化界面上任一概念时,以文本形式显示概念的属性、关系及公理信息。本发明实施例提供一种面向本体的时空信息挖掘及可视化展示方法。其中,该方法包括对本体的概念进行分类;将分类后的本体中的概念在时空特征上进行关联;针对分类后的所述概念,以图层的形式对本体进行时空可视化展示。本发明实施例通过将本体中的概念在时空特征上关联起来,并且以概念图层的形式实现信息可视化展示。由此,解决了如何实现对本体隐含的时空信息进行挖掘并给予可视化呈现的技术问题。通过对本体隐含的时空信息进行抽取、关联和可视化呈现,具有语义深度,能够实现对本体深层信息的挖掘与描述。附图说明图1是根据本发明实施例的面向本体的时空信息挖掘及可视化展示方法的流程示意图;图2是根据本发明实施例的本体为“丝绸之路著名史实”的组织示意图;图3是根据本发明实施例的示例本体的时空信息可视化展示示意图。具体实施方式下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。在实际应用中,为了解决了如何实现对本体隐含的时空信息进行挖掘并给予可视化呈现的技术问题,本发明实施例提供一种面向本体的时空信息挖掘及可视化展示方法。如图1所示,该方法可以包括:S100:对本体的概念进行分类。其中,本体的概念包括但不限于层级概念集和概念属性。其中,概念属性可以用属性名和属性值构成的二元组{属性名:属性值}来表示。具体地,步骤S100对本体定义的概念进行二次分类,以重新进行组织。将本体概念可以分为但不限于人物概念、事件概念和其他概念。其中,其他概念可以为文物概念。图2示例性地示出了本体为“丝绸之路著名史实”的组织示意图。如图2所示,将该本体定义的概念分为著名人物、著名事件以及著名文物三大类。其中,著名人物包括“张骞”、“玄奘”、“郑和”等概念;著名事件包括“张骞出使西域”、“玄奘西天取经”、“郑和下西洋”等概念;著名文物包括“三彩釉陶载乐骆驼”、“越窑青瓷摩羯纹虎枕”、“胡人备马图壁画”等概念。其中,每个概念都有其属性定义。例如,人物概念“玄奘”的属性包括“{译典著作:《大般若经》、《心经》、《解深密经》、《瑜伽师地论》、《成唯识论》等}”,“{所属年代:唐朝}”,“{身份:唐代著名高僧、法相宗创始人、佛学翻译家}”,“{籍贯:河南洛州缑氏}”,“{别名:唐僧、唐三藏、陈祎}”,“{出生日期:仁寿二年(公元602年)}”和“{逝世日期:麟德元年(公元664年)}”等。S110:将分类后的本体中的概念在时空特征上进行关联。具体地,本步骤可以包括:分别对分类后的本体进行时间信息挖掘和空间信息挖掘,将分类后的本体中的概念在时空特征上进行关联。进一步地,对本体进行时间信息挖掘的步骤可以通过步骤S111至步骤S112来实现。S111:建立分类后的本体的时间同义词集合,将本体中的非规范时间描述信息关联起来。举例来说,本步骤可以将本体中的各种非规范时间描述信息关联起来,为每个时间同义词集合设置标识。例如:以“ST”开头,并在其后加上具体数字,以此来设置标识。表1示例性地示出了示例本体的时间同义词集合。其中包括ST1“唐、唐代、唐朝、大唐、贞观”、ST2“汉、汉朝、大汉、大汉王朝、大汉帝国”、ST3“公元前XX年、前XX年、约前XX年”、ST4“公元607年、607年、约607年”等时间同义词集合。表1:标识时间同义词集ST1唐、唐代、唐朝、大唐、贞观ST2汉、汉朝、大汉、大汉王朝、大汉帝国ST3公元前XX年、前XX年、约前XX年ST4公元627年、627年、约627年…………S112:针对分类后的本体,抽取出同一时间范围内的概念。进一步地,本步骤可以包括:对于每一个时间同义词集合,根据所有概念的属性值,按照时间度量,抽取出同一时间范围内的概念。本步骤对每个时间同义词集合ST,在所有概念的属性值范围内进行其集合成员的检索,判断属性值中涉及到时间的信息的时间跨度(时间最大值和时间最小值)是否包含了被检索的时间同义词集合成员,并把检索所得概念以某一时间度量进行分类,从而抽取出同一时间范围内的概念。其中,时间跨度也即时间度量,其包括但不限于年、月、日等度量单位。例如,沿用表1示例,时间同义词集合ST4的集合成员为“公元627年、627年、约627年”;人物概念“玄奘”的属性值中涉及到时间的信息为“麟德元年(公元664年)”和“仁寿二年(公元602年)”;集合成员“公元627年”包含在人物概念“玄奘”的属性值时间跨度内。表2沿用表1示例,其示例性地示出了时间同义词集合在时间度量为627年时的概念。其中描述了时间同义词集合ST4在同一时间范围内的概念特征示意情况,表2中列出了示例本体“丝绸之路著名史实”在时间度量为627年时检索得到的人物概念、事件概念以及文物概念。表2:具体地,对本体进行空间信息挖掘的步骤可以进一步通过步骤S113至步骤S114来实现。S113:建立分类后的本体的空间同义词集合,将本体中的非规范空间描述信息关联起来。举例来说,本步骤可以将本体中的各种非规范空间描述信息关联起来,并为每个空间同义词集合设置特定的标识,例如,以“SS”开头,并在其后加上具体数字,以为每个空间同义词集合设置标识。表3示例性地示出了示例本体的空间同义词集合。如表3所示,其中包括SS1“长安、西安、镐京、西京、大兴、宝鸡、陈仓、咸阳……”、SS2“兰州、金城、陆都、酒泉、平凉……”、SS3“太原、并、并州……”等空间同义词集合。表3:S114:针对分类后的本体,抽取出同一空间范围内的概念。具体地,本步骤可以进一步包括:对每个空间同义词集合,根据所有概念的属性值,按照空间度量,抽取出同一空间范围内的概念。本步骤对每个空间同义词集合SS,在所有概念的属性值范围内进行其集合成员的检索,判断其属性值中涉及到空间的信息的地域范围是否包含了被检索的空间同义词集合成员,并把检索所得概念以某一具体空间度量进行分类,从而抽取出同一空间范围内的概念。在本发明实施例中,空间度量包括但不限于省/直辖市、市、县/乡等度量单位。下面沿用表3示例,以空间同义词集合SS1为例进行详细说明。空间同义词集合SS1的成员为“长安、西安、镐京、西京、大兴、宝鸡、陈仓、咸阳……”;人物概念“班超”的属性值中涉及到空间的信息为“陕西咸阳东北”;成员“咸阳”包含在人物概念“班超”的属性值地域范围内。表4示例性地示出了抽取出同一空间范围内的概念。表4中列出了示例本体“丝绸之路著名史实”在空间度量为陕西省时检索得到的人物概念、事件概念以及文物概念。表4:本发明实施例通过对本体隐含的时空信息进行抽取、关联和可视化呈现,具有语义深度,能够实现对本体深层信息的挖掘与描述。S120:针对分类后的概念,以图层的形式对本体进行时空可视化展示。具体地,本步骤可以通过步骤S121至步骤S124来实现。S121:基于二维GIS地理信息系统,建立可视化界面。S122:以图层表示分类后的概念,并用图标进行区别。例如:可以分为人物概念层、事件概念层及其他概念层,从而使得可视化界面包括三个图层,然后,不同图层的概念用不同的图标进行区别。S123:在可视化界面上,以横向滑动的形式显示时间信息。S124:在可视化界面上,以不同填充颜色的形式显示空间信息。举例来说,在实际应用中可以使用不同省或直辖市用不同颜色进行填充,以进行可视化显示。在本发明的一优选实施例中,在具体应用过程中,当定位到可视化界面上某个概念时,还可以用文本形式自动显示此概念的属性、关系及公理等描述信息。图3示例性地示出了示例本体的时空信息可视化展示示意图。本发明实施例解决了如何实现对本体隐含的时空信息进行挖掘并给予可视化呈现的技术问题。通过对本体隐含的时空信息进行抽取、关联和可视化呈现,能够实现对本体深层信息的挖掘与描述;具有语义深度,能够实现对本体深层信息的挖掘与描述,还对本
技术领域
内或领域间的信息交互、信息集成、知识获取、知识重用及知识共享等问题有着重要的意义。上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述,但是本领域技术人员可以理解,为了实现本实施例的效果,不同的步骤之间不必按照这样的次序执行,其可以同时(并行)执行或以颠倒的次序执行,这些简单的变化都在本发明的保护范围之内。本发明实施例通过的方法既可以在个人计算机、工控机及服务器上以软件的形式安装并执行,也可将方法做成嵌入式芯片以硬件的形式来体现。本发明实施例提供的方法还可以实施为计算机程序软件或程序模块(其包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件或数据结构等等),例如根据本发明的实施例可以是一种计算机程序产品,运行该计算机程序产品使计算机执行用于所示范的方法。所述计算机程序产品包括计算机可读存储介质,该介质上包含计算机程序逻辑或代码部分,用于实现所述方法。所述计算机可读存储介质可以是被安装在计算机中的内置介质或者可以从计算机主体上拆卸下来的可移动介质(例如:采用热插拔技术的存储设备)。所述内置介质包括但不限于可重写的非易失性存储器,例如:RAM、ROM、快闪存储器和硬盘。所述可移动介质包括但不限于:光存储介质(例如:CD-ROM和DVD)、磁光存储介质(例如:MO)、磁存储介质(例如:磁带或移动硬盘)、具有内置的可重写非易失性存储器的媒体(例如:存储卡)和具有内置ROM的媒体(例如:ROM盒)。至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1