用于配置策略提取的系统和方法

文档序号:6484718阅读:278来源:国知局
用于配置策略提取的系统和方法
【专利摘要】一种用于针对具有多个复合配置项目的组织进行配置策略提取的方法可以包括计算复合配置项目之间在配置空间中的距离。该方法还可以包括基于计算的距离将复合配置项目聚类成一个或多个簇。该方法还可以包括标识这些簇的一个或多个中的配置模式,并基于所标识的配置模式来提取至少一个配置策略。还公开了用于针对具有多个复合配置项目的组织进行配置策略提取的非暂态计算机可读介质和系统。
【专利说明】用于配置策略提取的系统和方法
【背景技术】
[0001]在大型信息技术(IT)组织中的配置管理实践正朝策略驱动的过程前进,其中贯穿组织一致地管理IT资产。
[0002]在许多组织中,配置策略可能没有具体定义、不是已知的,并且即使是已知的或者定义的,也可能与其资产的实际配置状态不相关。此外,在许多组织中,资产的状态可能动态改变,使IT管理者甚至更加难以监视资产配置,更不用说针对他们的资产决定配置策略。
【专利附图】

【附图说明】
[0003]在本说明书的结论部分具体指出并清楚主张了视为本发明的主题。然而,通过在跟着附图阅读时参考以下详细描述,可以最佳地理解关于组织和操作方法二者的本发明连同其目的、特征和优势,在附图中:
图1示出了根据本发明的实施例的用于配置策略提取的方法。
[0004]图2示出了示例性“ j2ee-d0man”的复合配置项目(Cl)树。
[0005]图3示出了根据本发明的实施例的、通过使用二部图来解决最小流问题(连续最短路径)而在复合Cl中的节点之间进行匹配的多分配问题的建立。
[0006]图4描绘了根据本发明的实施例的从大型数据库提取的简单策略规则400。
[0007]图5示出了根据本发明的实施例的用于配置策略提取的系统。
[0008]图6示出了根据本发明的一些实施例的配置策略提取器设备。
[0009]将意识到,为了说明的简单和清楚,图中示出的元素并不一定是按比例绘制的。例如,为了清楚,可以相对于其他元素增大一些元素的尺寸。此外,在认为适当的情况下,参考标号可以在图间重复以指示对应或者类似的元素。
【具体实施方式】
[0010]IT从业者典型地负责配置项目的特定集合,并由此具有整个组织的有限视图。在许多组织中,没有人实际知道配置项目是如何贯穿组织被管理的。如实践中所经常发生的,用配置策略管理工具(并且这样的工具是已知的)存在风险,即,由于缺少关于组织中实际配置状态的知识而将不合适地使用这样的工具,并因此,组织不能享用这样的工具可以提供的益处。
[0011]图1示出了根据本发明的实施例的用于配置策略提取的方法。
[0012]根据本发明的实施例,用于配置策略提取的方法100可以包括计算102组织的复合配置项目(Cl)之间在配置空间中的距离。该方法还可以包括基于计算的距离将复合配置项目聚类104成一个或多个簇。每个簇可以通过其复合配置项目之间的距离来表征(例如,这样的距离不大于最大阈值距离)。该方法还可以包括标识106所述一个或多个簇的一个或多个中的配置模式,并基于所标识的配置模式来提取108至少一个配置策略。该方法还可以包括收集101关于组织的复合Cl的配置数据。本发明的上下文中的“组织”可以包括公司、机构和其他组织。其还可以包括任何这样的企业,其具有许多Cl、可能希望监视其Cl的配置和/或基于当前Cl配置来得到配置策略。
[0013]在本发明的上下文中,“策略”的意思是可以向组织建议的任何配置标准。配置策略可以例如基于规划的目标和计划来手动生成,或者可以例如基于对于该组织可用的处理配置信息。,配置策略典型地可以针对将其实施为该组织的配置标准。
[0014]配置数据可以存储在例如配置管理数据库(CMDB )中。根据本发明的一些实施例,可以例如通过每当现有复合Cl的配置中发生改变时记录配置数据或者每当添加新复合Cl时输入配置数据来手动收集配置数据。根据本发明的其他实施例,可能通过采用不断地、周期地或者以其他方式搜索组织网络以确定其复合Cl的配置状态的爬虫应用来自动收集和存储配置数据。
[0015]根据本发明的实施例,IT从业者可以使用所提出的方法来分析组织的Cl的配置。当计划采购(planning acquisition)或者登入(on boarding)新客户时,这对应管理服务提供商(MSP)可以是有用的。
[0016]为了清楚起见,后文提供了一些基本定义和注释。复合配置项目(Cl)在CMDB中典型地表示为树。显式复合或者简单Cl将用Cl来标示。每个简单Cl可以具有用type(CI)标示的类型和属性值集合
,其中為是第i个属性的一组可能的值。例如,复合Cl可以具
有类型NT,并且在例如指定“操作系统”的第i个属性中具有值“Windows-7”。其可能具有不同的孩子Cl,例如类型“CPU”的Cl。当人们提到Cl时,其可能仅仅考虑的是简单Cl (及其属性),或者考虑的是整个树,其中Cl是该树的根。本文中使用术语简单Cl和复合Cl是为了在不清楚时区分上下文。
[0017]复合Cl由用T(CI)标示的Cl的树构成。该上下文中的树可以是有向图G(V,E),其中V是节点的集合并且E是有向边的集合。如果(u,V) e E,则人们可以称u是V的父亲并且V是u的孩子。如果进一步(u, w) e E,其中w * V,则人们可以称w是V的兄弟节点。树T的根节点可以用root (T)来标示,并且节点V的孩子可以用children (V)来标示。如果(V, u) e E或者如果存在V1,…,vk使得(ν,ν^,(vk, u) e E并且对于所有I< i < k -1, (Vi, Vi +1) e E,则可以说V和u之间存在路径。这样的路径可以用V
u来标示。有时可以根据某种顺序来遍历树。在该情况中,IT(V)可以标示树T的该顺序的
V的索引。如果上下文是清楚的,则人们可以忽略T下标。矢量可以用? = A、来标
/Jn ο
[0018]计算复合Cl之间在配置空间中的距离可以等同于确定复合Cl之间的相似度。可以典型地在树结构中表示复合Cl。因此,计算Cl之间的距离的问题可以表示为确定树之间的相似度,这通常在设置树编辑距离算法中进行研究。树编辑算法已经用于解决分子生物学、XML文档处理以及其他学科(discipline)中的问题。过去提出的针对带标记有序树(labeled ordered tree)的编辑距离的定义允许对节点进行三种编辑操作——“删除”、“插入”和“重新标记(relabel)”。对于无序树,已经知道问题是NP困难(NPhard)的。另一方面,对于有序树,基于动态规划技术存在多项式算法。若干研究人员已经标识了对编辑距离的该定义的限制。Cl相似度可以表示对于树编辑的约束的独特集合。[0019]为了保存Cl结构,“删除”和“插入”操作将不应用于单个节点,相反,它们可以应用于完全子树。例如,图2描绘了 “j2ee-doman”202的复合Cl树200。在该示例中,“i2ee_doman” 202 是 jdbc 数据源 204 和 j2eeapplication 206、207 的父亲。此外,j2eeapplication 206、207 (分别)是 ejb 模块 208、web 模块 209 和 ejb 模块 210、web 模块211的父亲。此外,ejb模块208、210 (分别)是无状态会话bean 212、214的父亲,并且web模块209、211 (分别)是服务小程序(servlet)213、215的父亲。ejb模块208、210必须(分另1J)是 j2eeapplication 206、207 的孩子。人们不能删除 j2eeapplication (206,207)并
将 ejbmodule 添加为 j2ee_domain 202 的孩子-j2eeapplication 206、207 的父亲。在
重新标记操作中改变Cl的一些属性是可能的,但是不能改变其类型。因此,为了计算单独节点之间的距离,可以比较Cl的属性。
[0020]因为Cl的孩子Cl是无序的,所以两个Cl的孩子之间的匹配典型地不是一对一的。例如,j2eedomain可以由任意数量的j2eeapplication构成。如果一个j2eedomain包括五个j2eeapplication而另一个包括五十个j2eeapplication,则这人们可能不希望将这两个j2eed0main视为是非常不同的。因此,一边的多个孩子可以映射到另一边的单个孩子,反之亦然。另一方面,例如,具有一个中央处理单元(CPU)的Windows NT服务器与具有四个CPU的Windows NT服务器是非常不同的。因此,可以考虑关于多个分配的惩罚,这取决于Cl类型。这些约束可以在指导Cl编辑距离测量的设计的考虑之中。关于“删除”和“插入”操作的约束允许人们将自顶向下方法类似地用于计算编辑距离。另一方面,人们可以不采用动态规划来在孩子节点之间进行匹配,因为其假设有序的一对一匹配。替代地,可以定义多分配。该分配可以缩减为最小代价流问题,其可以例如通过使用多项式时间的连续最短路径算法来解决。通过递归地激活该过程来计算完全树编辑距离,并且完全树编辑距离也具有多项式运行时间。
[0021]为了自组织配置,人们可能希望找到Cl的频繁模式。因为Cl是树,所以人们可能需要用于频繁树挖掘的算法。这样的算法用于在树的输入收集中搜索重复的子树结构。这些算法可以在重复结构必须遵守的限制上和搜索的树的类型上变化。为了挖掘配置项目,人们可能对具体的树挖掘场景感兴趣。
[0022]在计算复合Cl之间的距离之后,可以基于计算的距离对复合Cl进行聚类。
[0023]可以使用各种有效的非参数聚类算法。根据本发明的实施例,考虑所有复合Cl之间的距离,包括作为在其他复合Cl内的子树的那些复合Cl。因此,如果人们可以将复合Cl的给定集合视为森林,则可以考虑该森林中每两个子树之间的距离。在根级的复合Cl的簇可以帮助确定配置策略。例如,内部Cl的Cl簇可以表示这样的策略的普遍模式。
[0024]Cl的输入集合可以通过Cl聚类算法来计算,或者其可以由用户手动选择。
[0025]为了生成基线策略,人们可以收集关于每个Cl模式的统计。然后,可以通过例如以贪心方式一次添加一种模式同时确保策略充分覆盖Cl的输入集合来提取策略。
[0026]为了陈述的简单起见,如同聚类正在输出Cl的单个最大簇并提取针对该簇的策略那样编写本文中描述的算法。平常地,聚类可以输出所有簇并然后可以产生多个策略一针对每个簇一个策略或者针对若干簇一个策略。
[0027]可以考虑诸如本文给出的算法那样的算法:
算法-,GeneratePolicy (ΟΙ,Θ,α)(I)
【权利要求】
1.一种用于针对具有多个复合配置项目的组织的配置策略提取的方法,所述方法包括: 计算复合配置项目之间在配置空间中的距离; 基于计算的距离将复合配置项目聚类成一个或多个簇; 标识所述一个或多个簇的一个或多个中的配置模式;以及 基于所标识的配置模式来提取至少一个配置策略。
2.如权利要求1所述的方法,还包括收集关于组织的复合配置项目的配置数据。
3.如权利要求1所述的方法,其中,计算复合配置项目之间的距离包括使用树编辑距离算法来确定树之间的相似度。
4.如权利要求3所述的方法,其中,计算复合配置项目之间的距离是通过递归解决最小流问题来完成的。
5.如权利要求4所述的方法,其中,最小流问题用于在多个复合配置项目的复合配置项目的节点之间进行匹配。
6.如权利要求5所述的方法,还包括向复合配置项目的属性分配权重。
7.如权利要求5所述的方法,还包括分配重复惩罚,所述惩罚取决于复合配置项目的属性。
8.一种其上存储有用于配置策略提取的指令的非暂态计算机可读介质,当由处理器执行时,所述指令导致处理器执行以下方法: 计算复合配置项目之间在配置空间中的距离; 基于计算的距离将复合配置项目聚类成一个或多个簇; 标识所述一个或多个簇的一个或多个中的配置模式;以及 基于所标识的配置模式来提取至少一个配置策略。
9.如权利要求8所述的非暂态计算机可读介质,包括还使得处理器执行收集关于组织的复合配置项目的配置数据的方法的指令。
10.如权利要求8所述的非暂态计算机可读介质,其中,计算复合配置项目之间的距离包括使用树编辑距离算法来确定树之间的相似度。
11.如权利要求10所述的非暂态计算机可读介质,其中,计算复合配置项目之间的距离是通过递归解决最小流问题来完成的。
12.如权利要求11所述的非暂态计算机可读介质,其中,最小流问题用于在多个复合配置项目的复合配置项目的节点之间进行匹配。
13.如权利要求12所述的非暂态计算机可读介质,包括使得处理器执行向复合配置项目的属性分配权重的方法的指令。
14.如权利要求12所述的非暂态计算机可读介质,包括使得处理器执行分配重复惩罚的方法的指令,所述惩罚取决于复合配置项目的属性。
15.一种用于针对具有多个复合配置项目的组织的配置策略提取的配置策略提取系统,所述系统包括处理器,所述处理器被配置为: 计算复合配置项目之间在配置空间中的距离; 基于计算的距离将复合配置项目聚类成一个或多个簇; 标识所述一个或多个簇的一个或多个中的配置模式;以及基于所标识的配置模式来提取至少一个配置策略。
16.如权利要求15所述的系统,包括存储设备,用于存储配置信息。
17.如权利要求15所述的系统,包括爬虫应用,用于自动搜索组织的配置数据。
18.如权利要求15所述的系统,还包括输入或输出设备。
19.如权利要求15所述的系统,包括通信模块,用于与一个或多个其他设备进行通信。
【文档编号】G06F17/00GK103534700SQ201180071007
【公开日】2014年1月22日 申请日期:2011年5月20日 优先权日:2011年5月20日
【发明者】Y.卡梅尔, O.巴科尔, R.伯格曼, O.齐林斯基, I.伊什-赫维奇, S.戈兰, R.班纳 申请人:惠普发展公司,有限责任合伙企业
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1