分层网状知识模型建模方法及知识仓库系统建立方法

文档序号:6598476阅读:906来源:国知局

专利名称::分层网状知识模型建模方法及知识仓库系统建立方法
技术领域
:本发明涉及电子商务
技术领域
,特别涉及一种分层网状知识模型建模方法及知识仓库系统建立方法。
背景技术
:与大多数基于文档展现的互联网应用不同,电子商务系统需要对大量数据进行存储和处理。这些数据包括产品信息、商家信息、买家信息和交易物流信息等。如何安全高效地对这些数据进行逻辑层面上的整合、分析是电子商务系统面临的首要问题。另外,如何提升系统的信息处理智能化和自动化程度以减少系统研发和维护成本,缩短研发周期也是决定电子商务系统运营成败的关键因素。众所周知,目前的电子商务系统以及其他的互联网应用系统均使用关系数据库来进行数据存储,例如0RACLE、MYSQL、DB2、SQLServer等知名的关系数据库系统在电子商务领域扮演着数据管理者的角色。在这些数据库系统中,数据被分别存储于一张张表格(Table)之中。系统架构师通过指定数据表格中的主键(PrimaryKey)、外键(ForeignKey)或数据索引(Index)来对数据进行整合,以提高数据检索效率。在研发基于关系数据库的Web应用时,首先需要经验丰富的系统架构师与领域专家进行充分的沟通,然后由架构师决定本系统需要哪些数据表格,每个表格中需要哪些数据字段。这通常是一件非常复杂、艰难和容易出错的过程。一个成熟的电子商务系统往往需要上百张数据表格,如果由于和领域专家沟通不全面、架构师经验不够丰富或表格之间的数据关系没有设定正确,都会很大程度影响到上层应用的开发,最终将导致客户体验性差的致命结果。即使通过增大研发成本、延长研发周期的方法避免了在数据库表格设计阶段可能产生的问题,这种模式在应用开发中仍然面临考验。按照MVC(展现、逻辑和数据分离)的设计模式,在Web页面中不应存在初始数据库链接和查询数据库所用到的Sql语句,这就需要使用存储过程(Procedure/Package)对数据进行访问,这在很大程度上加大了系统研发工作量,不利于控制研发成本和周期。在目前关系数据库的基础上搭建一套智能化和自动化程度足够高的应用系统即使是在有众多资深领域专家、系统架构师和编程人员的参与下也是非常困难的。具体来说,目前的互联网电子商务系统在数据建模和存取方面存在如下缺陷1、数据建模困难。一个完善的电子商务系统的数据通常需要近百张数据库表格进行存储,表格的结构和表之间的关联需要架构师与领域专家进行高效的沟通后才能确定,但往往领域专家并不是IT专家,架构师又对于商务领域知之甚少,产生于两者之间的沟通障碍在很大程度上将影响数据模型的准确型和有效性,这个问题往往会直接影响到整个应用系统的搭建和客户体验;2、数据完整性差,逻辑性差,数据之间关联性低。基于数据库表格的设计模式,每张数据库表格是相对独立的,但是实际的应用系统往往要求这些分布于不同数据表格之中的数据能够产生各种各样的关联,以备上层的搜索引擎、导购系统或推荐系统所使用。目前的方法是通过外键设定和指定查询条件的方式将数据表格之间产生硬关联,而从建模初期考虑整个系统的数据完整性、关联性和逻辑性是非常困难甚至是不可能达成的目标。这就导致了应用系统所能提供的智能化服务、自动化服务受到了极大的限制。3、系统研发和维护成本难于控制,研发周期长。目前的电子商务数据系统的设计包含如下几种成本领域专家的数据设计成本、领域专家与IT专家的沟通成本、IT专家的数据库设计成本、数据库程序员建设数据库表格的成本、建立数据库表格之间关联的成本和数据库程序员编写存储过程对数据库进行操作的成本。这些复杂的过程不但会消耗大量的资金,同时使系统的研发周期变得难以控制。
发明内容(一)要解决的技术问题本发明的目的是提供一种分层网状知识模型建模方法以及利用该知识模型建立知识仓库系统的方法,以解决数据建模困难,数据完整性差,逻辑性差,数据之间关联性低,系统研发和维护成本难于控制,研发周期长等技术问题。(二)技术方案为达到上述目的,本发明提供了一种分层网状知识模型建模方法,包括以下步骤Sl确定要建模的知识领域;S2对所述知识领域按如下公式建立知识模型,所述知识模型KM包括顶层知识模型u(k),中层知识模型m(k)和底层知识模型1(k),D表示知识领域,KM=f(D,u(k)Um(k)Ul(k))所述u(k)包含D中的概念,m(k)定义u(k)中的子概念,1(k)包含所述概念和子概念的实例;S3利用RACER逻辑推理工具对所述知识模型进行验证,对于不满足逻辑条件要求的知识模型,需要进行修改使其能够通过RACER的验证。其中,所述步骤S2中顶层知识模型u(k)建模包括步骤根据知识领域确定顶层知识模型中的概念;判断是否需要为顶层知识模型中的概念指定限制和注释,如果需要则直接指定限制和注释;定义顶层知识模型中的概念的属性,同时将属性的属性域和值域进行关联,所述属性包括概念属性和数据属性;判断是否需要为所述属性指定限制,如果需要则直接定义属性限制;利用RACER逻辑推理工具对所述顶层知识模型进行验证,对于不满足逻辑条件要求的顶层知识模型,需要进行修改使其能够通过RACER的验证。其中,所述步骤S2中中层知识模型m(k)建模包括步骤定义顶层知识模型中的概念的子概念;判断是否需要为所述子概念指定限制和注释,如果需要则直接指定限制和注释;定义所述子概念的属性,同时将属性的属性域和值域进行关联,所述属性包括子概念属性和数据属性;判断是否需要为所述属性指定限制,如果需要则直接定义属性限制;利用RACER逻辑推理工具对所述中层知识模型进行验证,对于不满足逻辑条件要求的中层知识模型,需要进行修改使其能够通过RACER的验证。其中,所述步骤S2中底顶层知识模型1(k)建模包括步骤确定实例所属的概念或子概念;为所述每个实例指定唯一ID来表示该实例;判断是否需要为所述实例指定注释,如果需要则直接指定注释;将所述实例所属概念或子概念的属性进行实例化,包括属性域实例化和值域实例化;利用RACER逻辑推理工具对所述底层知识模型进行验证,对于不满足逻辑条件要求的底层知识模型,需要进行修改使其能够通过RACER的验证。为了达到上述目的,本发明还提供了一种基于上述知识模型建立的电子商务知识仓库系统的方法,包括以下步骤建立知识数据库群,所述知识数据库群包括η台知识数据库服务器,用于存储顶层知识模型和中层知识模型中的概念及所述概念在底层知识模型中对应的实例,其中η为正整数;建立非知识数据库,在所述非知识数据库中创建知识实例路由表,用于记录每个实例在知识数据库群中的知识数据库服务器的IP地址;建立知识版本数据库,所述知识版本数据库用于根据顶层知识模型和中层知识模型的的变化控制所述数据仓库版本。其中,所述建立知识数据库群步骤中包括设置每台知识数据库服务器存储实例数量阈值的步骤,当第一台服务器存储达到阈值时,则将新增的实例存储到第二台服务器。其中,所述方法还包括建立备份数据库,用于对所述知识数据库群中的数据进行备份。其中,所述方法还包括分别创建知识数据库群、非知识数据库、知识版本数据库和备份数据库的管理模块。其中,所述方法还包括创建用于中间件访问知识数据库群和非知识数据库的接口,所述中间件包括=JENA语义网中间件和数据管理中间件。(三)有益效果本发明具有如下有益效果1、创建可扩展的逻辑知识模型。本发明使用独创的分层网状知识建模方法,创建了电子商务领域的知识模型。该知识模型具有可扩展、完整性强、逻辑性强、无二义性等优点ο2、提供智能电子商务服务。本发明通过提供完整的知识仓库框架,使得电子商务上层应用能够通过JENA中间件进行知识获取和管理。这可大幅推进电子商务系统搜索引擎、导购系统和推荐系统等的智能化和自动化进程。3、减少数据系统设计成本,缩短研发时间。领域专家可以按照分层网状知识建模方法直接进行领域知识的可视化建模。这将大大减少与IT专家的沟通成本、减少数据系统的设计成本、减少修改数据设计的成本和保证数据一致性的成本。本发明符合国际最先进的语义网知识描述规范0WL2.0,此设计能够完全支持JENA中间件规范,通过JENA进行知识数据访问能够在很大程度上减少数据访问的代码量,从而大幅缩短系统研发时间。4、知识仓库系统容错性强、健壮性强、可恢复性强。本发明中知识仓库的设计采用知识模型多机互被,知识实例负载均衡,知识数据与非知识数据存储和访问分离的理念。这样的设计减少了数据访问间的负面相互影响,使得整个知识仓库系统具有极强的容错性、健壮性和可恢复性。图1是根据本发明的分层网状知识模型建模方法流程图;图2是根据本发明的分层网状知识模型建模方法顶层知识模型建模流程图;图3是根据本发明的分层网状知识模型建模方法中层知识模型建模流程图;图4是根据本发明的分层网状知识模型建模方法底层知识模型建模流程图;图5是根据本发明的分层网状知识模型建模方法底层知识模型的一个实施例;图6是根据本发明的基于上述知识模型建立电子商务知识仓库系统流程图;图7是根据本发明建立的电子商务知识仓库系统实施例框架图;图8是图7中电子商务知识仓库系统的实验结果图。具体实施例方式本发明提出的一种分层网状知识模型建模方法,结合附图和实施例说明如下。本发明的分层网状知识模型建模方法中分层建模法和网状建模法是本方法的核心。其中分层建模是指将领域知识模型的创建逻辑上分成“顶层知识模型”,“中层知识模型”和“底层知识模型”。知识建模的过程要按照顶层建模、中层建模和底层建模的顺序“自顶向下”逐一进行。网状建模表示领域专家为概念设定灵活的概念属性和数据属性,将领域概念网状拓扑最终形成一个可扩展的知识网络。以下为知识模型的相关逻辑定义定义1领域领域是客观世界的一部分,是问题空间中所有概念的有穷并集。dec1uc2u...ucn,c,〔ω(\)(1)式中,D表示领域,Ε表示逻辑上等于,Ci表示概念,Ω表示问题空间。定义2知识知识即在某一领域所有概念和所有公理的并集。K=DUA,A=f(d,p,r,a)(2)(2)式中,K表示知识,A表示公理,f表示抽象函数(下文中的g同样表示抽象函数),P表示领域中概念的属性,r表示领域中对于知识的限制,a表示对于知识的补充文本说明。所谓公理即对于领域中知识的断言,是对概念的判定性描述,下面将详细介绍公理的各项内容。定义3概念和实例知识中的一个概念表示客观世界中一类具有共同性质的实例的集合。例如,在电子商务领域,数码产品、家用电器、化妆品等均是概念。实例即客观世界中存在的某个个体,每个实例至少隶属于一个概念。例如,jason是客户概念的一个实例。定义4:属性属性是连接两个概念实例或连接一个概念实例和一个数据之间的谓语关系。属性分为概念属性和数据属性两类,概念属性表示两个概念之间的关系,数据属性表示一个概念和一个数据之间的关系。可由公式(3)表示<formula>formulaseeoriginaldocumentpage8</formula>例如,在电子商务领域中一个概念属性“hasBrand”(“拥有品牌”)可以表示为hasBrand(某产品,某品牌)。一个数据属性“hasSize”(“尺码为”)可以表示为hasSize(某件衣服,L)。属性往往是建立在两个概念之间或概念与数据类型之间的关联,其中第一个概念Cl称为属性的源域(Domain),第二个概念c2或数据类型称为属性的值域(Range)。事实上,在现实世界中,一个属性是指定在两个概念实例或一个概念实例与一个数据实例之间的关联,但在建模时,为保证模型的抽象性和通用性建模者需要在概念或数据类型级别定义属性。例如hasBrand(商品,品牌)。在创建实例时再将属性具体化,例如haSBrand(某手机,NOKIA)。其中某手机是商品的一个实例而“NOKIA”是品牌的一个实例。定义5:限制限制(r)为指派于概念或属性之上的数学逻辑描述,其目的为限定概念的实例创建或属性的某些特性。公式(4)给出了限制的定义<formula>formulaseeoriginaldocumentpage8</formula>定义5.1概念限制本发明中所使用的概念限制主要为相等限制(equal)和分离限制(disjoint)。(1)如果两个概念满足如下条件则CiECj。<formula>formulaseeoriginaldocumentpage8</formula>(2)如果n个概念满足如下条件nc2n...ncn=4)(6)则这n个概念是分离的,其含义为n个概念中任意两个概念的实例均不同。定义5.2属性限制本发明中所使用的属性限制分为概念属性限制和数据属性限制。概念属性限制应用于概念属性,主要使用的是概念属性值数量限制。概念属性值数量限制主要用来限制一个属性可拥有属性值的个数,该类限制可分为三种(1)最小概念属性值数量限制,约定某属性的值至少包含实例的数量。该限制的逻辑表达式为≥ObjectProperty(numberofinstance)(7)其中0bjectProperty表示某个概念属性,该函数中的自变量为逻辑允许的实例数量。例如haSSeller(商品,销售商)属性中可指派限制彡hasSelleHl),该限制的逻辑含义为“每件商品至少有一个销售商”。(2)最大概念属性值数量限制,约定某属性的值最多包含实例的数量。该限制的逻辑表达式为^ObjectProperty(numberofinstance)(8)例如haSBrand(商品,品牌)属性中可指派限制彡hasBrancKl),该限制的逻辑含义为“每件商品至多有一个品牌”。(3)精确概念属性值数量限制,约定某属性的值所允许的实例的精确数量。该限制的逻辑表达式为=ObjectProperty(numberofinstance)(9)例如hasSeX(客户,性别)属性可指派限制=hasSexd),该限制的逻辑含义为“一个客户有且只有一个性别”。与概念属性限制类似,本发明主要使用的数据属性限制是数据属性值数量限制,区别仅在于数据属性值数量限制主要用于限制数据属性可取的数据个数。数据属性值数量限制可简单表示为^(=)DatatypeProperty(numberofdata)(10)其中DatatypeProperty表示某个数据属性,该函数中的自变量为逻辑允许的数据数量。例如hasProduCtID(商品,String)属性可指派限制=hasProductID(1),其逻辑含义为“每件商品有且只有一个以字符串描述的ID”。定义6注释注释是以字符串方式对概念、属性或实例进行的补充性文本描述。本发明的分层网状知识模型建模方法遵循以上描述的逻辑理论,流程图如图1所示步骤S101,确定建模的知识领域,该步骤需要根据应用系统的需求确定知识模型的客体,即客观世界的某个子集。本发明要确定的是电子商务知识领域,例如可将知识领域定为数码产品领域、陶瓷产品领域等。步骤S102,根据所确定的知识领域建立知识模型,按分层建模的思想将知识模型分成顶层知识模型建模、中层知识模型建模和底层知识模型建模。如图2所示,为顶层知识模型建模流程图。根据所选定的知识领域确定顶层知识模型中的概念,即顶层概念。该步骤需由领域专家对领域进行深入的研究,抽象出本领域中的顶层概念,电子商务中顶层知识包括产品、客户、销售商、品牌、地理信息等重要概念,这些概念对于电子商务系统来说是必不可少的,是刻画中层知识本体,保障智能商务系统运行的根本;领域专家判断是否需要为顶层概念指定限制和注释,如果需要则直接指定限制和注释,设置良好的知识限制能够保证整个知识体系的完整性和逻辑性,特别是在增加新的知识内容时不会产生二义性问题,可保持知识系统与客观世界的一致性;定义顶层概念的属性,这些属性描述了概念之间或概念与数据之间的联系,如顶层概念定义了如下属性purchaseBy(产品,客户),语义为“被购买”,表示了产品和客户之间是被购买关系,同时将属性的属性域和值域进行关联,所述属性包括概念属性和数据属性;领域专家判断是否需要为所述属性指定限制,如果需要则直接定义属性限制;最后要对顶层知识模型进行验证,利用RACER逻辑推理工具对所述顶层知识模型进行验证,对于不满足逻辑条件要求的顶层知识模型,需要进行修改使其能够通过RACER的验证,该步骤有助于在第一时间发现知识中的错误、有二义性或违反知识限制的内容。如图3所示,为中层知识模型建模流程图。对顶层概念分类,该步骤需要根据应用系统的需求对顶层概念进行细化,这主要体现在由领域专家设计一套语义精确的分类系统,在电子商务系统中主要涉及对于产品类型的分类,根据分类定义顶层知识模型中的概念的子概念;领域专家判断是否需要为所述子概念指定限制和注释,如果需要则直接指定限制和注释;定义所述子概念的属性,同时将属性的属性域和值域进行关联,所述属性包括子概念属性和数据属性;领域专家判断是否需要为所述属性指定限制,如果需要则直接定义属性限制;最后和顶层知识模型一样的方式要对中层知识模型进行验证。如图4所示,为底层知识模型建模流程图。确定实例所属的概念或子概念,对于顶层知识和中层知识中的每个概念都必须拥有实例(子概念的实例在逻辑上也是上层概念的实例);为所述每个实例指定唯一ID来表示该实例,实例建模,即建立以上述ID为标识的实例;判断是否需要为所述实例指定注释,如果需要则直接指定注释;将所述实例所属概念或子概念的属性进行实例化,包括属性域实例化和值域实例化,即根据属性类型,将概念属性的实例和属性值实例相关联,数据属性的实例和具体数据相关联;最后对底层知识模型进行验证,此次验证是将知识库作为一个整体验证,利用RACER逻辑推理工具对知识的逻辑进行检验,如验证失败则解决相应的问题后进行再次验证,直到通过验证。以下是一个电子商务知识建模的实际模型Koeb(KnowledgeofElectronicBusiness)的顶层概念为商品、客户、销售商、概念属性、品牌和地理信息。其中,概念属性为知识模型中所有概念属性的值域。顶层知识模型中知识的网状拓扑如下(DpurchaseBy(产品,客户),语义为“被购买”。(2)haSSeller(产品,销售商),语义为“拥有销售商”。(3)hasBrand(产品,品牌),语义为“拥有品牌”。(4)haSAddreSS(客户/销售商,地理信息),语义为“拥有地址”。(5)hasProducePlace(产品,地理信息),语义为“产地为”。(6)haS0riginPlace(品牌,地理信息),语义为“品牌发源地为”。顶层知识模型中还包括如下限制(Ddisjoint(产品,客户,销售商,品牌,地理信息),语义为“顶层概念之间是分离的”。(2)^hasBrand(l)(3)彡hasSeller(l)本发明的中层知识模型中包含的概念为顶层知识模型中概念的子概念,具体来说包括商品的分类、客户的分类、销售商的分类等概念。其中,属性概念的子概念为客户属性、销售商属性、通用产品属性、多类产品属性和细分产品属性。(1)客户属性用于描述客户所具有的性质。(2)销售商属性用于描述销售商所具有的性质。(3)通用产品属性用于描述所有产品均具有的性质。(4)多类产品属性用于描述几类产品均具有的性质。(5)细分产品属性用于描述某类产品所独有的性质。10下面举一个香水概念的例子来说明Koeb中层知识模型的网状知识拓扑结构。香水是商品中化妆品概念的子概念,Koeb中为香水指定的概念属性如下(DpurchaseBy(香水,客户),语义为“被购买”。该属性只有在订单生成时才生效。(2)haSSeller(香水,销售商),语义为“拥有销售商”。(3)hasBrand(香水,品牌),语义为“拥有品牌”。(4)hasProducePlace(香水,地理信息),语义为“产地为”。(5)hasFitPurpose(香水,购买目的),语义为“购买目的为”。购买目的为通用产品属性的子概念。(6)haSFitPe0pleType(香水,客户类型),语义为“适合的客户类型为”。客户类型为客户属性的子概念。(7)haSFitHobby(香水,爱好),语义为“适合的爱好”。爱好为客户属性的子概念。(8)hasFitSeX(香水,性别),语义为“适合的性别”。性别为客户属性的子概念。(^hasFitCharacter(香水,性格),语义为“适合的性格”。性格为客户属性的子概念。(10)hasFitJob(香水,职业),语义为“适合的职业”。职业为客户属性的子概念。(IDhasFitTime(香水,节日),语义为“适合的节日”。节日为多类产品属性的子概念。(12)haSPreTaSte(香水,香型),语义为“前香为”。香型为多类产品属性的子概O(13)haSMidTaSte(香水,香型),语义为“中香为”。香型为多类产品属性的子概O(lphasLastTaste(香水,香型),语义为“后香为”。香型为多类产品属性的子概O(15)haSRanking(香水,商品级别),语义为“商品级别为”。商品级别为通用产品属性的子概念。Koeb中为香水指定的数据属性如下(l)hasProductName(香水,String),语义为“产品名称为”。其值为一字符串型数据。(2)haSFitAge(香水,String),语义为“适合的年龄段为”。其值为一字符串型数据。(3)haSPr0dUCeDate(香水,Date),语义为“生产日期为”。其值为一日期型数据。(4)hasExpDate(香水,Date),语义为“保质日期为”。其值为一日期型数据。(5)haSV0lUme(香水,String),语义为“容量为”。其值为一字符串型数据。按照分层网状知识建模法的要求,对于底层知识的建模实际上就是将上层概念和属性实例化。此处给出一款香水实例的知识模型,其产品ID为“FPL010301000000000001"。图5是知识模型对于该实例的描述(以0WL2.O规范给出)。该例将上面描述的香水概念的概念属性和数据属性均进行了详细的实例化描述。由于OWL文档具有极高的易读性,此处不在详述该实例的描述细节。本发明还提出了一种基于上述知识模型建立知识仓库系统的方法,如图6所示,步骤S601,建立知识数据库群,电子商务系统中包含大量的产品和客户信息,这些信息都将被保存在知识模型中。知识数据库群是知识的分布式存储系统,完成知识备份和负载均衡任务,以提高上层应用的知识访问效率。知识数据库群中包括n台数据库服务器,在实例数量达到一定程度时,n取值越大,分布式系统的知识访问效率越高。本发明在每台数据库服务器中均部署知识模型中的顶层知识模型和中层知识模型,即将知识模型中的抽象描述部分冗余存储于知识数据库群的每一台数据库服务器上。在电子商务系统中,实例的增加一般来自客户或销售商。新增的实例先记录于第一台数据库服务器中,每个新增的实例会导致数据库中数据增加m行(一个实例会涉及m条公理,每条公理在数据库中对应一行数据。m的数值不是固定的,这个实例的属性和限制越多m越大)。当其中的实例数量达到u时,即数据库中的数据行数为uXm(这里假设每个实例对应m个公理)时,新的实例信息将会被记录于第二台数据库服务器,以此类推。u是一个阈值,其数值的确定要视具体系统情况(决定因素有服务器性能、负载、网络服务质量等)而定,如果数值取得过小则会增加空间开销,过大则会增大时间开销。另外,知识数据库群中还至少需要n台数据库服务器分别作双机备份,以方便进行应急操作和数据恢复。步骤S602,建立非知识数据库,电子商务系统中不但需要知识数据库群,同时也需要一些非知识数据的存储。这些数据在知识获取过程中将起到索引和辅助的作用。这些非知识数据存储于非知识数据库中,本发明中使用的最重要的非知识数据是知识实例路由表。该表主要记录每个实例的存储位置。该表的结构如下<table>tableseeoriginaldocumentpage12</column></row><table>该表主要记录实例的ID,实例的中文名称,实例所属的概念和实例知识存储的数据库ip地址(以及所有具有相同知识内容的备机地址,本发明支持将客户活动转移至备机进行响应)。知识系统新增实例时,系统会自动按照知识数据库群的存储情况,为该实例的存储指定数据库服务器。同时,该实例的相关信息会记录在非知识数据库的知识实例路由表中。上层应用在进行知识获取时,系统将首先检索知识实例路由表,找到目标实例对应的存储地址,随后在此存储地址指定的知识数据库服务器上进行知识检索。另外,非知识数据库中还保存其他一些信息,例如,交易流水、系统日志等。步骤S603,建立知识版本数据库,领域知识是不断变化的,实例的变化比较频繁,但是这不影响知识模型的版本。如果顶层知识或中层知识的产生变化将导致知识模型结构上的变化。本发明使用独立的知识版本数据库对于模型中的顶层知识和中层知识的OWL描述文档,知识版本数据库使用SVN版本控制系统进行知识版本控制,以方便查询以前的知识版本和在必要的时候回退版本。具体地,所述方法还包括分别创建知识数据库群、非知识数据库、知识版本数据库和备份数据库的管理模块。所述方法还包括创建用于中间件访问知识数据库群和非知识数据库的接口,所述中间件包括JENA语义网中间件和数据管理中间件。如图7所示,为本发明的建立知识仓库系统的方法建立的电子商务知识仓库系统框架图。本系统框架逻辑上可分为三个层次(自下而上为)知识数据存储层、逻辑控制层和智能应用中间件。1、知识存储层中主要包括知识数据库群、知识数据库群备机、数据安全数据库及备机、知识版本管理数据库及备机和非知识数据库及备机。其中知识模型分布于知识数据库群中,备份于知识数据库群备机中。知识版本管理数据库及备机使用SVN版本管理系统对于抽象知识的OWL文档进行版本管理。非知识数据库及备机中主要存储知识实例路由表和其他非知识化系统数据,2、逻辑控制层主要负责知识获取和非知识数据提取操作,包含如下系统模块(1)负载均衡控制模块。该模块主要负责判定负载转移条件,即实例阈值。当一台知识数据库服务器中存储的实例数量超过该阈值时,新增实例将被路由至负载较低的一台服务器进行存储。另外,该模块还负责将客户活动从源数据库群路由至数据库群备机以平衡客户活动给服务器带来的压力。(2)知识路由逻辑模块。该模块的主要任务是在相应客户的知识获取需求时,实时读取知识实例路由表,找到该存储该实例的具体服务器。(3)知识管理模块。主要处理来自于应用的知识变更请求和提供版本控制服务。当知识模型中增加实例或上层知识结构产生变化时,都需要通过该模块进行知识数据库的更新,并将知识结构的变化记入知识版本管理数据库。(4)数据管理模块。该模块主要负责更新系统中的非知识数据。(5)备份管理模块。该模块主要控制在一定的时间对知识数据或非知识数据进行备份。另外,逻辑控制层还为应用中间件提供如下知识操作接口(1)模型持久化接口。JENA语义网中间件可通过该接口将知识模型(OWL文档)中的全部公理保存至知识数据库群中。(2)知识获取接口。JENA语义网中间件可通过该接口对知识数据进行提取。(3)知识管理接口。JENA语义网中间件可通过该接口对知识数据进行版本管理。(4)数据管理接口。数据管理中间件可通过该接口对非知识数据进行管理。3、智能应用中间件层只要包括JENA语义网中间件和数据管理中间件两个组件。JENA语义网中间件负责响应应用逻辑提出的知识获取请求,并进行知识查询和管理等操作。数据管理中间件主要用于管理非知识数据。根据本发明的方法建立的电子商务知识仓库系统进行实验,其实验条件和结果如下采用分布式多机互备的方法进行知识模型存储,共使用10台DELLR300服务器(CPU:至强4核3323,RAM:4G)。其中5台为知识库分布式存储服务器,其上安装了MYSQL2.0,JENA等软件,另5台服务器为备机。图8给出本发明实例的性能数据。如图8所示,折线图中的横坐标表示实例数量,纵坐标表示检索一个实例的时间花销,η表示实例分布存储的服务器数量。性能测试中,每个实例包含5条公理,图中的实验结果为特定条件下100次测试结果的平均值。其中η为1时,检索一个实例的公理的时间花销为38.87ms-1045.78ms,η为5时,检索一个实例的公理的时间花销为10.12ms_604.12ms。由实验结果可见,提供知识分布式存储服务的数据库服务器越多,其实例检索效率越高。本发明中使用5台数据库服务器进行知识存储已经足够满足电子商务系统的数据检索效率需求。以上实施方式仅用于说明本发明,而并非对本发明的限制,有关
技术领域
的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。权利要求一种分层网状知识模型建模方法,其特征在于,包括以下步骤S1确定要建模的知识领域;S2对所述知识领域按如下公式建立知识模型,所述知识模型KM包括顶层知识模型u(k),中层知识模型m(k)和底层知识模型l(k),D表示知识领域,KM=f(D,u(k)∪m(k)∪l(k))所述u(k)包含D中的概念,m(k)定义u(k)中的子概念,l(k)包含所述概念和子概念的实例;S3利用RACER逻辑推理工具对所述知识模型进行验证,对于不满足逻辑条件要求的知识模型,需要进行修改使其能够通过RACER的验证。2.如权利要求1所述的分层网状知识模型建模方法,其特征在于,所述步骤S2中顶层知识模型u(k)建模包括步骤根据知识领域确定顶层知识模型中的概念;判断是否需要为顶层知识模型中的概念指定限制和注释,如果需要则直接指定限制和注释;定义顶层知识模型中的概念的属性,同时将属性的属性域和值域进行关联,所述属性包括概念属性和数据属性;判断是否需要为所述属性指定限制,如果需要则直接定义属性限制;利用RACER逻辑推理工具对所述顶层知识模型进行验证,对于不满足逻辑条件要求的顶层知识模型,需要进行修改使其能够通过RACER的验证。3.如权利要求2所述的分层网状知识模型建模方法,其特征在于,所述步骤S2中中层知识模型m(k)建模包括步骤定义顶层知识模型中的概念的子概念;判断是否需要为所述子概念指定限制和注释,如果需要则直接指定限制和注释;定义所述子概念的属性,同时将属性的属性域和值域进行关联,所述属性包括子概念属性和数据属性;判断是否需要为所述属性指定限制,如果需要则直接定义属性限制;利用RACER逻辑推理工具对所述中层知识模型进行验证,对于不满足逻辑条件要求的中层知识模型,需要进行修改使其能够通过RACER的验证。4.如权利要求3所述的分层网状知识模型建模方法,其特征在于,所述步骤S2中底顶层知识模型1(k)建模包括步骤确定实例所属的概念或子概念;为所述每个实例指定唯一ID来表示该实例;判断是否需要为所述实例指定注释,如果需要则直接指定注释;将所述实例所属概念或子概念的属性进行实例化,包括属性域实例化和值域实例化;利用RACER逻辑推理工具对所述底层知识模型进行验证,对于不满足逻辑条件要求的底层知识模型,需要进行修改使其能够通过RACER的验证。5.一种基于权利要求1-4任一所述的知识模型建立知识仓库系统的方法,其特征在于,包括以下步骤建立知识数据库群,所述知识数据库群包括η台知识数据库服务器,用于存储顶层知识模型和中层知识模型中的概念及所述概念在底层知识模型中对应的实例,其中η为正整数;建立非知识数据库,在所述非知识数据库中创建知识实例路由表,用于记录每个实例在知识数据库群中的知识数据库服务器的IP地址;建立知识版本数据库,所述知识版本数据库用于根据顶层知识模型和中层知识模型的的变化控制所述数据仓库版本。6.如权利要求5所述的建立知识仓库系统的方法,其特征在于,所述建立知识数据库群步骤中包括设置每台知识数据库服务器存储实例数量阈值的步骤,当第一台服务器存储达到阈值时,则将新增的实例存储到第二台服务器。7.如权利要求5的建立知识仓库系统的方法,其特征在于,所述方法还包括建立备份数据库,用于对所述知识数据库群中的数据进行备份。8.如权利要求6的建立知识仓库系统的方法,其特征在于,所述方法还包括分别创建知识数据库群、非知识数据库、知识版本数据库和备份数据库的管理模块。9.如权利要求6的建立知识仓库系统的方法,其特征在于,所述方法还包括创建用于中间件访问知识数据库群和非知识数据库的接口,所述中间件包括JENA语义网中间件和数据管理中间件。全文摘要本发明公开了一种分层网状知识模型建模方法,包括确定要建模的知识领域;对所述知识领域建立知识模型;检验所述知识模型是否符合逻辑。本发明还公开了一种利用上述知识模型建立知识仓库系统的方法,包括建立知识数据库群,用于存储知识概念及其实例;建立非知识数据库,用于记录每个实例在知识数据库群中的存储位置;建立知识版本数据库,用于对知识仓库中的不同知识版本进行管理。本发明使用分层网状知识建模方法使数据建模更加容易,同时为知识模型提供最大程度上的可扩展性,对系统中涉及的所有知识采用分布存储、多机自动互备的策略进行组织,形成真正意义上的数据仓库,提升整个系统的健壮性、容错性和可恢复性。文档编号G06Q30/00GK101799822SQ201010113228公开日2010年8月11日申请日期2010年2月23日优先权日2010年2月23日发明者李祯申请人:李祯
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1