背景技术:
1、本发明一般涉及用于对在计算机化系统中检测到的异常进行聚类的计算机实现的方法和计算机程序产品的领域。具体地,本发明涉及一种依赖于完全无监督流水线的方法,其学习与关键性能指标的时间序列集合相对应的输入数据集合的固定大小代表,并且对所学习的代表进行聚类以获得异常的聚类。
2、在分类标签很少或很少可用并且检测模式的能力很关键的情况下,时间序列聚类是重要的。最近,通过使用表示学习,深度学习模型在监督任务中已经示出了显著的结果。然而,确保这样的表示是聚类友好的并且有效地捕获可变长度时间序列的时间和多维动态仍然是一个挑战。
技术实现思路
1、根据第一方面,本发明被实现为一种用于对在计算机化系统中检测到的异常进行聚类的计算机实现的方法。所提出的方法利用无监督认知模型,其基于输入数据集执行以获得异常的聚类。通过该方法访问输入数据集;它们对应于检测到的计算机化系统的异常。这些异常跨越相应的时间窗口。每个相应的输入数据集包括关键性能指标(kpi)的时间序列的集合。每个输入数据集的kpi在相应的时间窗口上扩展。也就是说,每个异常对应于相应的时间窗口。在执行无监督认知模型之前,将其加载(例如,在执行该方法的计算机的主存储器中)。该模型包括第一阶段和第二阶段。第一阶段包括设计成学习输入数据集的固定大小的表示的编码器,而第二阶段是聚类阶段。基于所访问的输入数据集来执行该模型,以便第一阶段学习输入数据集的固定大小的表示,并且第二阶段对所学习的表示进行聚类,使得通过该方法最终获得异常的聚类。
2、在实施例中,使用组合的损失函数来执行无监督认知模型,该组合的损失函数组合第一损失函数和第二损失函数。第一损失函数和第二损失函数被设计用于分别优化表示和聚类。
3、优选地,第一损失函数被设计为三重损失函数。后者确保针对输入数据集的每个数据集的参考部分(对应于相应异常)所学习的表示比针对输入数据集中的其他数据集的其他部分所学习的表示平均更接近针对所述每个数据集的不同部分所学习的表示。参考部分、不同部分和其它部分中的每一个对应于相应的时间段。而且,每个部分聚合若干kpi,即,各个异常的所有kpi(尽管在特定时间段上延伸)。针对每个参考部分所学习的表示可以用作针对应异常的表示。结果,针对参考异常所学习的表示平均起来比针对不相似异常所学习的表示更接近对其他相似异常所学习的表示。
4、根据另一方面,本发明被实现为一种用于对在计算机化系统中检测到的异常进行聚类的计算机程序。该计算机程序产品包括具有程序指令的计算机可读存储介质。程序指令可由处理装置执行以使处理装置执行诸如上述的方法。
1.一种用于对在计算机化系统中检测到的异常进行聚类的计算机实现的方法,其中,所述方法包括:
2.根据权利要求1所述的方法,其中:
3.根据权利要求2所述的方法,其中:
4.根据权利要求2所述的方法,其中:
5.根据权利要求4所述的方法,其中:
6.根据权利要求5所述的方法,其中:
7.根据权利要求6所述的方法,其中,每一次所述迭代包括:
8.根据权利要求1所述的方法,其中:
9.根据权利要求8所述的方法,其中:
10.根据权利要求9所述的方法,其中:
11.根据权利要求10所述的方法,其中:
12.根据权利要求11所述的方法,其中:
13.根据权利要求12所述的方法,其中:
14.根据权利要求12所述的方法,其中:
15.根据权利要求14所述的方法,其中:
16.根据权利要求1所述的方法,其中,所述方法进一步包括:
17.根据权利要求1所述的方法,其中:
18.一种用于对在计算机化系统中检测到的异常进行聚类的计算机程序,所述计算机程序产品包括:
19.根据权利要求18所述的计算机程序,其中:
20.根据权利要求18所述的计算机程序,其中: