技术特征:
技术总结
本发明公开了一种频繁模式挖掘方法及装置,该方法包括:根据PrefixSpan算法,基于待分析的事务数据集生成数据库树;遍历数据库树中所有结点,并在遍历过程中根据预设剪枝条件按顺序对数据库树进行剪枝,从至少一个频繁模式中挖掘出至少一个满足预设胜任条件的频繁模式;按照各满足预设胜任条件的频繁模式的胜任值从大到小的顺序,输出前k个满足预设胜任条件的频繁模式。本发明提出将支持度、占有度、全置信度线性组合为胜任值来综合评价模式的优劣,从而以新的兴趣度量或约束来指导挖掘过程,并据此在挖掘过程中进行了对搜索空间的剪枝操作,不仅能够聚焦在用户真正感兴趣的模式上,而且能够压缩搜索空间,提高挖掘效率。
技术研发人员:杜雪盈;李亚敏;尤涛;陈进朝;李宇博
受保护的技术使用者:西北工业大学
技术研发日:2019.06.03
技术公布日:2019.08.30