1.一种基于非易失性存储器的频繁模式挖掘方法,其特征是,包括以下步骤:
步骤1、利用多核系统对频繁模式树进行并行构建
先将数据库中的多条交易记录大致均匀地分配到每个核中,利用CN106250549A记载的方法,在每一个核上构建一棵本地频繁模式树;
步骤2、对步骤1所构建的频繁模式树进行合并
将本地频繁模式树的信息搜集起来,合并成一棵大的全局频繁模式树。
2.根据权利要求1所述的基于非易失性存储器的频繁模式挖掘方法,其特征是:在所述步骤1中,构建本地频繁模式树时,采用左孩子右兄弟链表结构;在所述步骤2中,包括以下步骤:
步骤(1)、从根结点出发,将树1的根结点的最末孩子结点的兄弟指针指向树2的根结点的第一个孩子结点;
步骤(2)、利用所建立的哈希表查找树1和树2根结点的孩子结点中是否存在相同结点,如存在,用T1和T2分别表示树1和树2中相同的结点,然后执行步骤(3);如不存在,则执行步骤(5);
步骤(3)、T1计数域的值=T1计数域的值+T2计数域的值,并将T2结点从该链表中删除;
步骤(4)、将T1和T2分别作为树1和树2的根结点,返回步骤(1);
步骤(5)、结束程序。
3.根据权利要求1或2所述的基于非易失性存储器的频繁模式挖掘方法,其特征是:在所述步骤1中,在构建频繁模式初始树过程中创建新节点时,为根结点T以下的孩子结点建立了哈希表。