一种适用于互联网分析的本体构建方法

文档序号:6512390阅读:201来源:国知局
一种适用于互联网分析的本体构建方法
【专利摘要】本发明公开了一种适用于互联网分析的本体构建方法,本体分为行业本体、通用本体两个部分。其中通用本体又包括公职人员负面本体、机构组织负面本体、职位库、地域库。对于行业本体构建采用手工结合自动的构建方法。首先手工分类好公安、消防等行业,定义关键词进行采集信息得到信息集合S,并对信息集合S进行关键词提取并进行手工筛选。对于公职人员、组织机构负面本体本体构建方法与行业本体基本相同,增加了对于关键词的同义词、关联词关系的添加。本发明有效的提高了互联网信息检索、扩展。
【专利说明】一种适用于互联网分析的本体构建方法

【技术领域】
[0001] 本发明属于信息系统建模和知识工程领域,具体地说是适用于互联网分析的本体 构建方法。

【背景技术】
[0002] 随着社会信息化的迅猛发展,网络已经成为人们获取信息的重要来源。而网络信 息具有海量,复杂,非结构化等特点,为网络信息的获取以及基于网络信息搜集的分析与 研究工作都带来了很大困难。本体(Ontology)的概念起源于哲学领域,指的是对客观存 在系统的解释和说明,近几十年来,在人工智能、计算机科学和知识工程等诸多领域得到 了迅速发展。本体可以实现某种程度的知识共享和重用,使得计算机对信息和对语言的理 解上升到语义层次,并在一定程度上解决语义异构问题,在信息互操作、知识理解和信息 集成等领域具有很大的应用前景。
[0003] 适用于互联网分析的本体构建方法,一方面应用于舆情管理领域,对搜索采集进 行扩展;另一方面,可以根据本体对采集信息的进行分类。
[0004] 现有构建本体方法主要分为两类:手工构建和半自动构建。手工构建是以本体描 述捕获方法为代表,将本体构建的过程分为目标和团队建立、原始素材采集、素材分析、本 体初步构建、本体精化和验证等5个步骤,每一步都由人手工完成。半自动构建又称本体 学习,由计算机程序自动地从文本中抽取出表示概念、概念间关系等的术语,形成初步的本 体,再经过人手工精化和验证。然而,目前计算机程序自动构建的初步本体在质量上通常很 差,并不能有效降低对人工的依赖,因此手工构建仍是主流方法。


【发明内容】

[0005] 鉴于以上所述现有技术存在的问题和不足,本发明要解决的技术问题是提供一种 可以有效的指导搜索采集信息的适用于互联网分析的本体构建方法。
[0006] 本发明所要解决的技术问题是通过下述技术方案来实现的,本发明是一种适用于 互联网分析的本体构建方法,其特点是:其步骤如下: A、 构建行业本体;其操作步骤如下: A1.手工整理归纳面向搜集监测的行业部门; A2.整理行业名称的同义指代; A3.整理行业的特定职位; A4.整理业务相关的正、负面词; A5.整理人员相关的正、负面词; B、 构建通用本体;其操作步骤如下: B1.构建公职人员本体; B2.对公职人员本体分为负面词和正面词; B3.其中正面词又分为核心词与普通词; B4.其中每个词都可以手工构建其同义词、关联词; B5.构建组织机构与构建公职人员本体同理; C、 构建地域本体;其操作步骤如下: C1.手工整理省级地域; C2.扩展整理地市县地域名,最小化到镇乡; C3.其中针对有别名的地名进行同义化处理; D、 构建职位本体;其操作步骤如下: D1.对各部门共有的领导职位进行整理; D2.对普通员工职位进行整理; D3.定义上下级关系及同义指代; 适用于互联网分析的本体构建方法到此结束。
[0007] 与现有技术相比,本发明的适用于互联网分析的本体构建方法具有以下效果: 1、 对搜索采集规则进行有效的扩展; 2、 对信息分类进行有效指导。

【专利附图】

【附图说明】
[0008] 图1是本发明方法的一种流程框图; 图2是图1中步骤102所述为构建行业本体过程流程图; 图3是图1中步骤103所述为构建通用本体的流程结构图; 图4是图1中步骤104所述的构建地域本体的流程图。
[0009] 图5是图1中步骤105所述的是构建职位本体的流程图。

【具体实施方式】
[0010] 下面结合附图和【具体实施方式】对本发明作进一步详细的描述。
[0011] 实施例1,一种适用于互联网分析的本体构建方法,其步骤如下: A、 构建行业本体;其操作步骤如下: A1.手工整理归纳面向搜集监测的行业部门; A2.整理行业名称的同义指代; A3.整理行业的特定职位; A4.整理业务相关的正、负面词; A5.整理人员相关的正、负面词; B、 构建通用本体;其操作步骤如下: B1.构建公职人员本体; B2.对公职人员本体分为负面词和正面词; B3.其中正面词又分为核心词与普通词; B4.其中每个词都可以手工构建其同义词、关联词; B5.构建组织机构与构建公职人员本体同理; C、 构建地域本体;其操作步骤如下: C1.手工整理省级地域; C2.扩展整理地市县地域名,最小化到镇乡; C3.其中针对有别名的地名进行同义化处理; D、构建职位本体;其操作步骤如下: D1.对各部门共有的领导职位进行整理; D2.对普通员工职位进行整理; D3.定义上下级关系及同义指代; 适用于互联网分析的本体构建方法到此结束。
[0012] 实施例2, 一种适用于互联网分析的本体构建方法进行的操作实验,步骤如下: 步骤102、构建行业本体,参照图2,包括如下步骤: 步骤201.手工整理归纳面向搜集监测的行业部门 步骤202.整理行业名称的同义指代 步骤203.整理行业的特定职位 步骤204.整理业务相关的正、负面词 步骤205.整理人员相关的正、负面词 步骤103构建通用本体,参照图3,包括如下步骤: 步骤301.构建公职人员本体 步骤302.对公职人员本体分为负面词和正面词 步骤303.其中正面词又分为核心词与普通词 步骤304.其中每个词都可以手工构建其同义词、关联词。
[0013] 步骤305.构建组织机构与构建公职人员本体同理 步骤104、构建地域本体,参照图3,包括如下步骤: 步骤401.手工整理省级地域 步骤402.扩展整理地市县地域名,最小化到镇乡 步骤403.其中针对有别名的地名进行同义化处理 步骤105、对于职位本体,参照图4包括如下步骤: 步骤501.对各部门共有的领导职位进行整理 步骤502.对非领导职位进行整理 步骤503.定义职位上下级关系 职位同义指代。
【权利要求】
1. 一种适用于互联网分析的本体构建方法,其特征在于:其步骤如下: A、 构建行业本体;其操作步骤如下: A1.手工整理归纳面向搜集监测的行业部门; A2.整理行业名称的同义指代; A3.整理行业的特定职位; A4.整理业务相关的正、负面词; A5.整理人员相关的正、负面词; B、 构建通用本体;其操作步骤如下: B1.构建公职人员本体; B2.对公职人员本体分为负面词和正面词; B3.其中正面词又分为核心词与普通词; B4.其中每个词都可以手工构建其同义词、关联词; B5.构建组织机构与构建公职人员本体同理; C、 构建地域本体;其操作步骤如下: C1.手工整理省级地域; C2.扩展整理地市县地域名,最小化到镇乡; C3.其中针对有别名的地名进行同义化处理; D、 构建职位本体;其操作步骤如下: D1.对各部门共有的领导职位进行整理; D2.对普通员工职位进行整理; D3.定义上下级关系及同义指代; 适用于互联网分析的本体构建方法到此结束。
【文档编号】G06F17/30GK104063412SQ201310430787
【公开日】2014年9月24日 申请日期:2013年9月22日 优先权日:2013年9月22日
【发明者】乔磊, 陈永江, 仲兆满, 姜剑, 陈宗华 申请人:江苏金鸽网络科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1