1.一种双阈值顺序聚类方法,其特征在于,应用于顺序聚类系统中,所述顺序聚类系统包括数据库与处理器,所述方法包括以下步骤:
s1:处理器从数据库提取数据集x={x}n,规模为n,n∈n;
s2:处理器确定阈值
s3:处理器确定聚类簇数量q的值;
s4:根据阈值
2.根据权利要求1所述的双阈值顺序聚类方法,其特征在于,步骤s2中确定阈值
s2.1:每次以相同的顺序表示数据,不同的阈值
s2.2:根据不同阈值
s2.3:以横坐标为
s2.4:阈值
3.根据权利要求2所述的双阈值顺序聚类方法,其特征在于,步骤s3中确定聚类簇数量q的值,具体为:
以不同的顺序表示数据,以相同的阈值,执行多次顺序聚类,取不同顺序情况下各聚类簇数量平均值q作为聚类簇数量q。
4.根据权利要求3所述的双阈值顺序聚类方法,其特征在于,步骤s4中根据阈值
s4.1:通过顺序排列好数据集中的所有数据,依次进行运算:
以第一个数据点作为初始质心,并归为a簇,依次算出其他点到a簇质心的距离d:
(1)若
(2)若
s4.2:后面的数据点要同时计算与现有的所有簇的质心距离,重复步骤s4.1,直到所有点都被第一次归类;
s4.3:第一次遍历数据集x’,并且留下一项x’的待分类数据集,保持已归类的数据结果,将x’中的数据依次执行步骤s4.1至s4.2,直到所有点都被归类。
5.根据权利要求4所述的双阈值顺序聚类方法,其特征在于,步骤s4.1中质心的计算为所有数据点的横坐标和纵坐标分别加起来再分别求均值点横坐标和纵坐标。
6.根据权利要求5所述的双阈值顺序聚类方法,其特征在于,执行创建新的簇时,检测已建立的簇个数q’是否等于q,若q’=q,则此后不再新建簇,将
7.根据权利要求6所述的双阈值顺序聚类方法,其特征在于,步骤s4还包括:
s4.4:对聚类后的簇进行合并。
8.根据权利要求7所述的双阈值顺序聚类方法,其特征在于,步骤s4.4中簇的合并具体为:
定义一个距离值r,用来衡量簇之间的接近程度,比较两个簇的质心,若小于r值,则将两个簇合并。