一种基于元数据的流程模型相似性度量方法与流程

文档序号:15198296发布日期:2018-08-19 02:08阅读:151来源:国知局
本发明涉及信息处理
技术领域
,更具体地,涉及一种基于元数据的流程模型相似性度量方法。
背景技术
:全球化、虚拟化、网络化组织或企业的业务过程管理的日益复杂化,对业务过程的柔性建模、高效调度、智能分析、合规控制等提出了新挑战,业务流程的相似性度量受到越来越广泛的重视。业务流程的相似性度量可用于发现企业或组织业务流程间的流程重用,从而发掘满足用户需求的服务。两个流程模型间的相似性度量通常涉及三个方面,即文本概念相似性、结构相似性和行为相似性。其中:文本概念相似性通常是指从流程文本概念的角度来评估相似性,或者是综合度量流程每个节点文本概念的相似性,并将其作为度量两个流程模型相似性的一个重要指标。同时,也可以通过度量语法,语义和结构相似性来评估两个流程元素之间的语义相似性,然后将这些相似性度量指标集成到流程模型整体的相似性度量中。结构相似性是指选择特定特征来描述业务流程模型,然后通过两个流程模型间匹配的特征个数来评估其相似性,也可以用最大公共图代替图编辑距离来度量流程结构相似性。基于行为相似性的流程模型搜索同样也受到人们的广泛关注。基于转换邻接关系集(tar)的流程相似性度量,从流程模型中提取四类行为特征:存在性、因果关系、冲突关系和并发关系,然后基于这些特征计算两个流程模型的行为相似性。同时,也有基于行为使用索引来度量流程模型之间的相似性。但是,无论是上述哪一种流程模型相似性度量方法,均存在度量维度单一,从而导致度量结果不具有代表性,度量结果不精确的问题。技术实现要素:为了克服上述问题或者至少部分地解决上述问题,本发明提供一种基于元数据的流程模型相似性度量方法,用以有效提高对流程模型相似性的度量精度,从而为流程推荐等提供决策支持,并更好地满足用户需求。本发明提供一种基于元数据的流程模型相似性度量方法,包括:s1,基于流程注册元模型框架mfi-5构建流程模型描述框架pmdf,并基于所述流程模型描述框架pmdf定义流程模型相似性特征集;s2,基于所述流程模型相似性特征集,分别对各目标业务流程bpmn模型进行标识与量化,获取各所述目标业务流程bpmn模型分别对应的多个特征向量;s3,分别计算所有所述目标业务流程bpmn模型中任意二者间关于所述多个特征向量的相似性,获取模型间特征向量相似性;s4,基于所述模型间特征向量相似性,计算对应目标业务流程bpmn模型间的相似性。其中,步骤s1中所述基于流程注册元模型框架mfi-5构建流程模型描述框架pmdf的步骤进一步包括:s11,在所述流程注册元模型框架mfi-5中,对位于抽象元类层的元数据进行裁剪,并对在实际应用中不直接参与流程构建的元数据进行删减;s12,在经过元数据裁剪和元数据删减后的流程注册元模型框架mfi-5中,添加用于描述流程执行顺序的有向关联特征,构建所述流程模型描述框架pmdf。其中,步骤s1中所述基于所述流程模型描述框架pmdf定义流程模型相似性特征集的步骤进一步包括:确定所述流程模型描述框架pmdf的基础特征,并基于所述基础特征构成所述流程模型相似性特征集。其中,确定所述流程模型描述框架pmdf的基础特征包括:流程process、资源resource、事件event、顺序依赖sequence_dependency、分支依赖split_dependency、联结依赖join_dependency和关联association;相应的,所述基于所述基础特征构成所述流程模型相似性特征集的步骤进一步包括:构建包含元素流程process、资源resource、事件event、顺序依赖sequence_dependency、分支依赖split_dependency、联结依赖join_dependency和关联association的集合作为所述流程模型相似性特征集;其中,所述流程process用于特定目标的结构化活动或任务,所述资源resource包括流程利用、创建或消耗的实体或虚拟资源,所述事件event用于标记特定事件的发生,所述顺序依赖sequence_dependency用于指明流程按顺序执行,所述分支依赖split_dependency用于指明若一个前驱流程执行完毕,一个或多个后继流程将并行执行,所述联结依赖join_dependency用于指明若前驱的多个流程执行完毕,后继的一个流程将开始执行,所述关联association用于指明流程间有向的关联关系。其中,所述s3的步骤进一步包括:利用基于距离的相似性算法,分别计算每个所述目标业务流程bpmn模型与其余各目标业务流程bpmn模型关于所述多个特征向量中每个特征向量间的相似性,获取所述模型间特征向量相似性。其中,所述s4的步骤进一步包括:计算所述模型间特征向量相似性的代数平均值,作为所述对应目标业务流程bpmn模型间的相似性。进一步的,在所述s2的步骤之前,所述方法还包括:以业务流程建模标注bpmn语言作为流程建模语言,对实际的目标业务流程进行描述,获取所述目标业务流程bpmn模型和bpmn模型集。其中,所述s3的步骤进一步包括:基于谷本系数法,定义所述bpmn模型集中任意两个元素间关于所述多个特征向量中每个特征向量的相似性计算公式,并基于所述bpmn模型集中各元素的所述多个特征向量,利用所述相似性计算公式计算所述模型间特征向量相似性。其中,所述基于谷本系数法,定义所述bpmn模型集中任意两个元素间关于所述多个特征向量中每个特征向量的相似性计算公式的步骤进一步包括:基于谷本系数法,定义如下相似性计算公式:ma,mb∈ms,i=1,2,...,n;式中,ma、mb表示bpmn模型集ms中的任意两个模型,mai、mbi分别表示模型ma和mb的第i个特征,i的取值为1至n间的正整数,n表示流程模型描述框架pmdf的基础特征的总个数,sim(mai,mbi)表示特征向量mai与mbi间的相似性,其值等于tanimoto(mai,mbi),即特征向量mai与mbi间的距离。进一步的,在所述s4的步骤之后,所述方法还包括:根据所述目标业务流程建模标注bpmn模型间的相似性,构建流程模型相似性矩阵,并基于所述流程模型相似性矩阵对度量结果进行分析评价。本发明提供的一种基于元数据的流程模型相似性度量方法,针对现有技术度量维度单一而导致度量不精准的问题,利用流程注册元模型框架mfi-5,构建流程模型描述框架pmdf,有效实现对流程模型相似性度量的维度扩展,从而有效提高对流程模型相似性的度量精度,为流程推荐等提供决策支持,并更好地满足用户需求。附图说明图1为本发明实施例一种基于元数据的流程模型相似性度量方法的流程图;图2为根据本发明实施例一种基于元数据的流程模型相似性度量方法中流程注册元模型框架mfi-5的结构框架示意图;图3为根据本发明实施例一种基于元数据的流程模型相似性度量方法中流程模型描述框架pmdf的结构框架示意图;图4为根据本发明实施例一种基于元数据的流程模型相似性度量方法中pmdf模型数为3的bpmn模型集示例图;图5为根据本发明实施例一种基于元数据的流程模型相似性度量方法中构建流程模型描述框架pmdf的流程图;图6为本发明实施例另一种基于元数据的流程模型相似性度量方法的流程图。具体实施方式为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。作为本发明实施例的一个实施例,本实施例提供一种基于元数据的流程模型相似性度量方法,参考图1,为本发明实施例一种基于元数据的流程模型相似性度量方法的流程图,包括:s1,基于流程注册元模型框架mfi-5,构建流程模型描述框架pmdf,并基于所述流程模型描述框架pmdf,定义流程模型相似性特征集;s2,基于所述流程模型相似性特征集,分别对各目标业务流程bpmn模型进行标识与量化,获取各所述目标业务流程bpmn模型分别对应的多个特征向量;s3,分别计算所有所述目标业务流程bpmn模型中任意二者间关于所述多个特征向量的相似性,获取模型间特征向量相似性;s4,基于所述模型间特征向量相似性,计算对应目标业务流程bpmn模型间的相似性。可以理解为,本实施例针对目前流程相似性度量方法所依据的结构相似性、文本标签相似性和行为相似性等存在单一性的问题,而导致度量结果的不精确,提出同时关注业务流程多个维度的度量方法。利用流程注册元模型框架mfi-5,构建流程模型描述框架pmdf,而将流程模型相似性度量的依据从结构相似性、文本标签相似性和行为相似性扩展到更多更全面的维度。具体的,在步骤s1中,首先通过流程注册元模型框架mfi-5的处理,构建得到流程模型描述框架pmdf。然后通过对流程模型描述框架pmdf的分析,定义流程模型相似性特征集sfs。例如,通过分析pmdf的类特征和关联特征,确定pmdf的特征组成,并根据该特征组成定义流程模型相似性特征集sfs。其中:参考图2,为根据本发明实施例一种基于元数据的流程模型相似性度量方法中流程注册元模型框架mfi-5的结构框架示意图,流程注册元模型框架(meta-modelforprocessmodelregistration,mfi-5)表示,采用一种具体的建模语言来描述特定的流程模型,然后从该模型中选择出相关的元数据,并利用mfi-5对所选的元数据进行注册与管理的模型框架。其中,流程模型(process_model)是一种元类,用于表达一个流程,并在使用一个具体的流程建模语言(process_modelling_language)时,描述所包含的流程模型元素(process_model_element)。流程模型元素包括流程(process)以及流程间的依赖关系(dependency)。对于每一个流程模型元素,存在某些事件(event)能够触发该流程模型元素,或者由该流程模型元素产生相应的事件。为了实现特定的业务目标,在执行一个流程模型元素时,会创建、使用或消耗相关的资源(resource)。依赖用于表达流程间的控制约束,并能够特化为顺序依赖(sequence_dependency),分支依赖(split_dependency),以及连接依赖(join_dependency)。顺序依赖指明流程模型元素是按照一定的顺序执行的。分支依赖则指出当前驱的流程模型元素执行完后,将并行的执行一个或多个后继的流程模型元素。联结依赖指出当前驱的一个或多个流程模型元素执行完后,将开始执行后续的流程模型元素。分支依赖的类型用于为后继流程指明逻辑选择。同理,联结依赖的类型则为前驱流程指明逻辑选择。分支依赖类型以及联结依赖类型的值可以为异或(xor)、或(or)以及和(and)。分支依赖类型xor意味着有且仅一个后继流程模型元素允许执行,or是指一个或多个后继流程模型元素允许执行,而and指出所有后继流程模型元素必须执行。联结依赖类型xor意味着当且仅当一个前驱的流程模型元素执行完成,后继的单个流程模型元素才可执行,or是指当且仅当一个或多个前驱的流程模型元素执行完成,后继的单个流程模型元素才可执行。and是指当且仅当全部的前驱流程模型元素执行完成,后继的单个流程模型元素才可执行。此外,在分支依赖类型的值确定以后,分支依赖选项(split_dependency_option)表达了后继流程模型元素执行的安全条件,类似的,在联结依赖类型的值确定后,联结依赖选项(join_dependency_option)指明前驱流程模型元素执行的安全条件。参考图3,为根据本发明实施例一种基于元数据的流程模型相似性度量方法中流程模型描述框架pmdf的结构框架示意图,在流程模型描述框架(processmodeldescriptionframework,pmdf)中,pmdf由6个类特征(class)和1个关联特征(association)共7个相似性特征组成。其中类特征为:process、resource、event、sequence_dependency、split_dependency、join_dependency,分别用于指出流程模型执行过程中涉及的各种流程模型元素,关联特征是指任意两个类特征间的关联关系,用于指出流程模型元素的执行顺序。流程模型相似性特征集(similarityfeatureset,sfs)用于载入bpmn模型集ms中任意两个模型间的相似性数据。具体在步骤s2中,在根据上述实施例定义了流程模型相似性特征集sfs之后,利用sfs对事先构建的目标业务流程bpmn模型进行标识和量化。即根据相似性特征集sfs,对获取的ms中任意两个bpmn模型在每个特征向量进行标识与量化,得到两个模型在每个特征中的向量mai和mbi。由于进行相似度度量涉及的模型至少有两个,因此需要分别对各个目标业务流程bpmn模型进行标识和量化处理,得到各个目标业务流程bpmn模型分别对应的特征向量。考虑到本发明实施例是对模型的多维度进行考量,因此得到的特征向量也是对应的多个。例如,根据上述实施例定义的包含7个元素的sfs,根据其对目标业务流程bpmn模型进行标识和量化得到的特征向量为7个。其中,bpmn由于其具有图形化特征,且其抽象级别位于实际流程与mfi-5之间,尤其能描述多方参与的复杂应用场景,因此适合进行流程的描述。为了度量流程模型间的相似性,采用sfs对bpmn模型进行标识与量化,得到模型在多个特征中的向量,为基于距离的特征向量相似性计算奠定基础。以图4中所示的3个在线售货服务bpmn模型为例(记model1为m1、model2为m2、model3为m3),通过7个相似性特征中的向量来对目标业务流程bpmn模型进行标识和量化时,按如下流程进行:相似性特征1(process):图4中的bpmn模型包含4种不同类型的流程(矩形框):购买商品(bg)、获得商品(rg)、验证发票(vi)、储存商品(sg)。在process特征中,采用具有4个特征值的向量对3个模型分别进行描述,每个特征值对应于一种类型的流程,4个特征值分别为bg、rg、vi、sg,每个特征值用数字标识了一个模型包含该特征值的数量。3个模型在process特征中的向量表示如表1所示。表1,bpmn模型在process特征中的向量表示模型编号bgrgvisg111112110131111相似性特征2(resource):m1的直接参与者为jack、brook、lily,因此m1的resource为jack、brook、lily。同理可知,m2的resource为jack、brook;m3的resource为jack。所以,图4中的bpmn模型包含3种不同类型的资源:jack、brook、lily。在resource特征中,采用具有3个特征值的向量对3个模型分别进行描述,每个特征值对应于一种类型的资源,3个特征值分别为jack、brook、lily,每个特征值用数字标识了一个模型包含该特征值的数量。3个模型在resource特征中的向量表示如表2所示。表2,bpmn模型在resource特征中的向量表示模型编号jackbrooklily111121103100相似性特征3(event):图4中的bpmn模型包含2种不同类型的事件(圆形框):启动(start)、结束(end)。在event特征中,采用具有2个特征值的向量对3个模型分别进行描述,每个特征值对应于一种类型的事件,2个特征值分别为start、end,每个特征值用数字标识了一个模型包含该特征值的数量。3个模型分别在event特征中的向量表示如表3所示。表3,bpmn模型在event特征中的向量表示模型编号startend111211311相似性特征4(sequence_dependency):图4中的bpmn模型包含顺序依赖。在sequence_dependency特征中,采用具有2个特征值的向量对3个模型分别进行描述,每一个特征值对应于顺序依赖特征在3个模型实例中分别出现的次数。2个特征值分别为sequence_dependency、substitution,每个特征值用数字标识了一个模型包含该特征值的数量。3个模型分别在sequence_dependency特征中的向量表示如表4所示。表4,bpmn模型在sequence_dependency特征中的向量表示模型编号sequence_dependencysubstitution100200310注:特征值substitution为补充值,以使其符合向量的形式化定义,后文同理。相似性特征5(split_dependency):图4中的bpmn模型包含分支依赖。在split_dependency特征中,采用具有2个特征值的向量对3个模型分别进行描述,每一个特征值对应于分支依赖特征在3个模型实例中分别出现的次数。2个特征值分别为split_dependency、substitution,每个特征值用数字标识了一个模型包含该特征值的数量。3个模型分别在split_dependency特征中的向量表示如表5所示。表5,bpmn模型在split_dependency特征中的向量表示模型编号split_dependencysubstitution120210310相似性特征6(join_dependency):图4中的bpmn模型包含联结依赖。在join_dependency特征中,采用具有2个特征值的向量对3个模型分别进行描述,每一个特征值对应于联结依赖特征在3个模型实例中分别出现的次数。2个特征值分别为join_dependency、substitution,每个特征值用数字标识了一个模型包含该特征值的数量。3个模型分别在join_dependency特征中的向量表示如表6所示。表6,bpmn模型在join_dependency特征中的向量表示模型编号join_dependencysubstitution120210310相似性特征7(association)图4中的bpmn模型包含5中不同类型的关联:购买商品→获得商品(bg→rg)、购买商品→验证发票(bg→vi)、获得商品→储存商品(rg→sg)、即购买商品→储存商品(bg→sg)、获得商品→验证发票(rg→vi)。在association特征中,采用5个特定值的向量对3个模型分别进行描述,每个特征值对应于一种类型关联,5个特征值分别为(bg→rg)、(bg→vi)、(rg→sg)、(bg→sg)、(rg→vi),每个特征值用数字标识了一个模型包含该特征值的数量。3个模型分别在association特征中的向量表示如表7所示。表7,bpmn模型在association特征中的向量表示模型编号bg→rgbg→virg→sgbg→sgrg→vi111101210110310101具体在步骤s3中,在根据上述步骤处理得到各个目标业务流程bpmn模型分别对应的特征向量之后,依次任意选取所有目标业务流程bpmn模型中的两个,计算这两个模型分别对应的特征向量间的相似性。直至所有目标业务流程bpmn模型中任意两个模型间都进行了特征向量相似性的计算。应当理解的是,根据上述步骤获取的特征向量有多个,因此在进行两个模型对应特征向量间的相似性计算时,需要分别将其中一个模型的多个特征向量中的每个特征向量与另一个模型的对应特征向量进行相似度计算,得到的所有向量间相似度值组成模型间特征向量相似性。具体在步骤s4中,根据上述步骤计算得到任意两个目标业务流程bpmn模型关于各特征向量的相似性值,根据上述计算结果均等权衡两个模型关于上述多个特征向量的相似性,进而获取两个目标业务流程bpmn模型的相似性。本发明实施例提供的一种基于元数据的流程模型相似性度量方法,针对现有技术度量维度单一而导致度量不精准的问题,利用流程注册元模型框架mfi-5,构建流程模型描述框架pmdf,有效实现对流程模型相似性度量的维度扩展,从而有效提高对流程模型相似性的度量精度,为流程推荐等提供决策支持,并更好地满足用户需求。其中可选的,步骤s1中所述基于流程注册元模型框架mfi-5构建流程模型描述框架pmdf的进一步处理步骤参考图5,为根据本发明实施例一种基于元数据的流程模型相似性度量方法中构建流程模型描述框架pmdf的流程图,包括:s11,在所述流程注册元模型框架mfi-5中,对位于抽象元类层的元数据进行裁剪,并对在实际应用中不直接参与流程构建的元数据进行删减;s12,在经过元数据裁剪和元数据删减后的流程注册元模型框架mfi-5中,添加用于描述流程执行顺序的有向关联特征,构建所述流程模型描述框架pmdf。可以理解为,本实施例通过对mfi-5基于元数据的处理,构建出流程模型描述框架pmdf。具体在步骤s11中,对mfi-5中位于抽象元类(abstractmetaclass)层的元数据进行适当裁剪,同时对在实际应用中不直接参与流程构建的元数据进行删减。其中,所述的裁剪是指,对不直接参与流程相似性度量的元类进行删减。在步骤s12中,考虑到流程注册元模型框架mfi-5忽略了业务流程的顺序特征,导致缺少用于描述不同流程元素间执行顺序的特征,在根据上述步骤对mfi-5中抽象元层的元数据进行适当裁剪并进行相关元数据的删减后,向mfi-5框架中添加适当的有向关联特征(associationfeature)。其中的有向关联特征用于描述流程的执行顺序。有向关联特征添加完成,构成流程模型描述框架pmdf。其中,在一个实施例中,步骤s1中所述基于所述流程模型描述框架pmdf定义流程模型相似性特征集的步骤进一步包括:确定所述流程模型描述框架pmdf的基础特征,并基于所述基础特征构成所述流程模型相似性特征集。可以理解为,在根据上述实施例构建流程模型描述框架pmdf之后,通过对pmdf框架的分析,确定能够体现pmdf基本特性的各项特征,作为pmdf的基础特征。然后根据这些基础特征来构成流程模型相似性特征集sfs。例如,在确定pmdf的基础特征之后,将这些基础特征归入一个特征集合,并将该特征集合作为流程模型相似性特征集sfs。在其中的另一个实施例中,确定所述流程模型描述框架pmdf的基础特征包括:流程process、资源resource、事件event、顺序依赖sequence_dependency、分支依赖split_dependency、联结依赖join_dependency和关联association;相应的,所述基于所述基础特征构成所述流程模型相似性特征集的步骤进一步包括:构建包含元素流程process、资源resource、事件event、顺序依赖sequence_dependency、分支依赖split_dependency、联结依赖join_dependency和关联association的集合作为所述流程模型相似性特征集;其中,所述流程process用于特定目标的结构化活动或任务,所述资源resource包括流程利用、创建或消耗的实体或虚拟资源,所述事件event用于标记特定事件的发生,所述顺序依赖sequence_dependency用于指明流程按顺序执行,所述分支依赖split_dependency用于指明若一个前驱流程执行完毕,一个或多个后继流程将并行执行,所述联结依赖join_dependency用于指明若前驱的多个流程执行完毕,后继的一个流程将开始执行,所述关联association用于指明流程间有向的关联关系。可以理解为,考虑到pmdf可以由6个类特征(classfeature)和1个关联特征(associationfeature)共7个特征组成,其中类特征包括process、resource、event、sequence_dependency、split_dependency和join_dependency,关联特征为association。则,在pmdf中须均等考虑上述7个特征。于是,确定pmdf的基础特征包括process、resource、event、sequence_dependency、split_dependency、join_dependency和association。其中,对pmdf的上述7个特征说明如表8所示:表8,pmdf模型中的特征表示然后,将这些基础特征进行整合,归入同一个集合,构成流程模型相似性特征集sfs。具体构成sfs如下:其中,在又一个实施例中,在所述s2的步骤之前,所述方法还包括:以业务流程建模标注bpmn语言作为流程建模语言,对实际的目标业务流程进行描述,获取所述目标业务流程bpmn模型和bpmn模型集。可以理解为,本发明实施例是对不同的实际流程之间的相似性进行度量。由于对实际流程的处理存在困难,需要先将实际流程进行量化处理,构建相应的模型,再通过对对应模型的处理,度量对应流程的相似性。因此,需要预先根据实际流程构建对应的流程模型。具体采用业务流程建模标注语言bpmn作为流程建模语言,对待度量的实际业务流程,即目标业务流程进行描述,得到相应的目标业务流程bpmn模型(图形)和bpmn模型集(ms)。其中可选的,所述s3的步骤进一步包括:利用基于距离的相似性算法,分别计算每个所述目标业务流程bpmn模型与其余各目标业务流程bpmn模型关于所述多个特征向量中每个特征向量间的相似性,获取所述模型间特征向量相似性。可以理解为,其中基于距离的相似性算法是指通过对两个特征向量间对应距离的计算,得到该两个特征向量的相似性。例如,计算两个向量间的距离作为该两个向量间的相似性。对于本发明实施例,待度量的目标业务流程bpmn模型可能有多个,因此,为了得到所有目标业务流程bpmn模型整体的相似性度量结果,需要对所有目标业务流程bpmn模型中任意两个模型进行基于距离的特征向量相似性计算。并且,在对任意两个模型的特征向量进行相似性计算时,需要针对每个特征向量进行对应向量相似性的计算。例如,根据上述实施例的7个特征向量,对任意两个模型需要分别计算关于这7个特征分别对应的相似度值,所得相似度值的整体构成模型间特征向量相似性。本实施例通过将bpmn模型间的相似性计算过程转换为计算两个模型在多个特征向量间的距离,获取特征向量间相似性,即依据多个特征中向量的相似性值,计算出两个流程模型间的相似性。在计算两个流程模型间相似性的过程中,均等权衡每个特征向量的相似性,以综合获取流程模型的相似性,能够有效降低对相似性计算的复杂程度,从而提高对流程模型相似性的度量精度和度量效率。其中,在又一个实施例中,所述s3的步骤进一步包括:基于谷本系数法,定义所述bpmn模型集中任意两个元素间关于所述多个特征向量中每个特征向量的相似性计算公式,并基于所述bpmn模型集中各元素的所述多个特征向量,利用所述相似性计算公式计算所述模型间特征向量相似性。可以理解为,根据上述实施例,在初始构建目标业务流程bpmn模型时,同时构建了bpmn模型集,bpmn模型集中包含了所有目标业务流程bpmn模型。例如,定义bpmn模型集包含3个bpmn模型,则bpmn模型集表示如下:ms={m1,m2,m3,};式中,ms表示bpmn模型集,m1~m3分别表示bpmn模型集中的三个目标业务流程bpmn模型。本实施例根据谷本系数(tanimotocoefficient)理论,定义任意两个目标业务流程bpmn模型间关于各个特征向量的相似性计算公式,并利用该公式计算bpmn模型集中任意两个模型在每个特征中向量的相似性。即计算任意两个目标业务流程bpmn模型关于每个特征中向量的相似性。其中,谷本系数主要用于计算符号度量或布尔值度量的个体间的相似度。因为个体的特征属性都是由符号度量或者布尔值标识,所以无法衡量差异具体值的大小,只能获得“是否相同”这个结果。因此,谷本系数只关注个体间共同具有的特征是否一致的问题,其值等于两个用户共同关联的物品数量除于两个用户分别关联的所有物品数量。其中,所述基于谷本系数法,定义所述bpmn模型集中任意两个元素间关于所述多个特征向量中每个特征向量的相似性计算公式的步骤进一步包括:基于谷本系数法,定义如下相似性计算公式用以对ms中任意两个bpmn模型关于某一特征向量的相似性进行计算:ma,mb∈ms,i=1,2,...,n;式中,ma、mb表示bpmn模型集ms中的任意两个模型,mai、mbi分别表示模型ma和mb的第i个特征,i的取值为1至n间的正整数,n表示流程模型描述框架pmdf的基础特征的总个数,sim(mai,mbi)表示特征向量mai与mbi间的相似性,其值等于tanimoto(mai,mbi),即特征向量mai与mbi间的距离。根据上述实施例计算的向量间的相似性计算结果处于[0,1]的范围内。通过上述计算公式计算得到ms中任意两个bpmn模型关于n个基础特征的相似性值。如根据上述实施例的7个特征构成的特征向量,bpmn模型集ms中的任意两个模型ma和mb的相似性计算如下:ma,mb∈ms,i=1,2,...,7;其中,i取值为1至7间的正整数,7表示上述7个特征的总数7。其中,在一个实施例中,所述s4的步骤进一步包括:计算所述模型间特征向量相似性的代数平均值,作为所述对应目标业务流程bpmn模型间的相似性。可以理解为,本实施例通过定义如下bpmn模型间的相似性计算公式,对ms中任意两个模型的相似性进行计算:式中,sim(ma,mb)表示目标业务流程bpmn模型ma与mb间的相似性,ma、mb表示bpmn模型集ms中的任意两个模型,mai、mbi分别表示模型ma和mb的第i个特征,i的取值为1至n间的正整数,n表示流程模型描述框架pmdf的基础特征的总个数,sim(mai,mbi)表示特征向量mai与mbi间的相似性。即,根据上述步骤s3,将mai和mbi作为输入,利用基于距离的相似性算法计算两个模型在n个特征向量的相似性sim(mai,mbi)。然后根据上述计算公式均等权衡两个模型在每个特征向量的相似性,计算两个模型的相似性sim(ma,mb)。进一步的,在所述s4的步骤之后,所述方法还包括:根据所述目标业务流程建模标注bpmn模型间的相似性,构建流程模型相似性矩阵,并基于所述流程模型相似性矩阵对度量结果进行分析评价。可以理解为,为了便于更为直观的展示度量结果,根据任意两个流程模型间的相似性值,构建流程模型相似性矩阵,并根据该相似性矩阵分析并讨论度量结果。其中,在根据上述实施例的另一个实施例中,提供如图6所示的处理流程,图6为本发明实施例另一种基于元数据的流程模型相似性度量方法的流程图,包括:构建pmdf并定义sfs,即构建基于mfi-5的流程模型描述框架pmdf并定义流程模型相似性特征集sfs;bpmn模型的标识与量化,即基于sfs从pmdf的7个特征维度对bpmn模型进行向量化,得到流程模型在7个特征中的向量;通过利用基于距离的算法计算两个模型在7个特征中向量的相似性,分别计算任意两个模型在每个特征向量的相似性;综合度量流程模型的相似性,即均等权衡两个模型在7个特征中向量的相似性,计算获取两个流程模型间的相似性值;为便于更为直观的展示度量结果,依据任意两个流程模型间的相似性值,构建流程模型相似性矩阵,分析并讨论度量结果。另外,本领域内的技术人员应当理解的是,在本发明的申请文件中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本发明的说明书中,说明了大量具体细节。然而应当理解的是,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1