1.一种基于多视图结构的图卷积神经网络聚类方法,其特征在于,其步骤为:
2.根据权利要求1所述的一种基于多视图结构的图卷积神经网络聚类方法,其特征在于:步骤1中对图数据进行预处理的过程为:选取预训练好的图自编码器作为边缘预测器,将图的初始节点属性和结构信息作为预测器的输入并得出边缘概率矩阵;再根据边缘概率矩阵,添加高概率可能存在的边,删除低概率冗余的边,更新图的结构信息。
3.根据权利要求1或2所述的一种基于多视图结构的图卷积神经网络聚类方法,其特征在于:步骤2中构建的网络模型是基于多视图结构的双分支网络,每个分支包括:图自编码器,聚类模块以及交叉更新模块。
4.根据权利要求3所述的一种基于多视图结构的图卷积神经网络聚类方法,其特征在于:步骤2所述模型的训练过程如下:将图的节点属性和不同视图下的结构信息作为不同分支的输入,通过图自编码器完成嵌入,得到嵌入特征与重构后的结构信息;之后利用聚类模块,根据嵌入特征计算出图的初始概率分布与目标分布,最后通过交叉更新模块,更新不同分支下的结构信息,并交叉传递到不同分支进行下一轮迭代训练。
5.根据权利要求4所述的一种基于多视图结构的图卷积神经网络聚类方法,其特征在于:步骤2中,图自编码器提取嵌入特征的具体过程如下:
6.根据权利要求5所述的一种基于多视图结构的图卷积神经网络聚类方法,其特征在于:图自编码器中的编码器分别通过两层图卷积层和两层图注意力层提取出图的两种特征表示z和z′,再通过特征融合机制得出融合特征z″;
7.根据权利要求6所述的一种基于多视图结构的图卷积神经网络聚类方法,其特征于:图自编码器的解码器采用内积编码器。
8.根据权利要求7所述的一种基于多视图结构的图卷积神经网络聚类方法,其特征在于:聚类模块将最终嵌入特征表示作为输入,利用t-学生分布计算初始概率分布q,并根据初始概率分布计算目标概率分布p。
9.根据权利要求8所述的一种基于多视图结构的图卷积神经网络聚类方法,其特征在于:根据初始概率分布q按照一定的阙值选取高置信度节点,得到高置信度节点集;然后从高置信节点集中按照1-nn算法选取离高置信度聚类质心最近的点,并根据初始概率分布q判断高置信度节点集中的节点是否与离所属类别质心最近的节点标签一致,如果一致,则为这两个节点之间添加边;否则,删除这两个节点之间的边;最终得到更新后面向聚类的结构信息,并作为重构时的监督信息。
10.根据权利要求9所述的一种基于多视图结构的图卷积神经网络聚类方法,其特征在于:模型在迭代一定轮数后,在交叉更新模块中,通过计算重构的结构信息和初始结构信息的线性加权和,得出图更新后的结构信息,并将两个分支更新后的结果交叉输入到不同分支,然后参与网络的迭代更新。