一种基于孪生图神经网络和集群结构的文献分类方法及系统

文档序号:35469372发布日期:2023-09-16 13:19阅读:39来源:国知局
一种基于孪生图神经网络和集群结构的文献分类方法及系统

本发明属于文献分类领域,涉及一种基于孪生图神经网络和集群结构的文献分类方法及系统。


背景技术:

1、许多实际应用场景中的数据是从非欧式空间生成的,传统的深度学习方法在处理非欧式空间数据上的表现难以使人满意。通过定义图和信号之间的卷积算子,图卷积网络(gcns)将卷积神经网络(cnns)推广到包含属性的图结构输入。

2、然而,gcn存在训练时间长,模型参数量大,模型的性能会随着深度的提高而产生过平滑的问题,所以其只考虑到每个节点在多跳之内的邻居,因此不足以捕获大型图的全局集群结构,限制了其聚合高阶邻居节点特征的能力,使得分类准确度下降。


技术实现思路

1、目的:为了克服现有技术的不足,本发明提供一种基于孪生图神经网络和聚类算法的文献分类方法及系统,利用聚类算法和孪生神经网络保留了引文网络中的集群结构,并利用县线性多分类器进行文献分类。

2、技术方案:为解决上述技术问题,本发明采用的技术方案为:

3、第一方面,提供一种基于孪生图神经网络和集群结构的文献分类方法,包括利用聚类算法检测图中的集群结构,获取集群结构信息;对集群间连接的权重进行自适应调制;将经过权重调制后的引文网络和原始引文网络通过孪生图神经网络结构进行特征传播,获取邻居节点信息,得到节点特征矩阵;将经过特征传播后的带有集群结构的特征与原来的特征输入特征融合模块进行特征融合;将融合后的特征输入到线性分类器中得到最终分类结果。

4、进一步地,利用高斯核函数构建引文网络中文献节点的相似矩阵,利用谱聚类算法为每一个文献节点赋予类别标签,拥有相同标签的文献节点属于同一个集群,得到集群信息。

5、进一步地,将每一个集群内的文献节点特征取平均值作为集群的中心,计算出每个集群中心的欧式距离d,将w=1/d作为集群间连接的权重并进行归一化处理,以保证集群间连接的权重在0和1之间,而集群内部连接的权重不变且为1。

6、进一步地,将经过权重调制后的引文网络和原本的引文网络分别输入到简化后的图神经网络sgc中,sgc通过去除图神经网络gcn的非线性激活函数大幅减少了计算量,经过多层特征传播后得到带有集群信息的节点特征h1和原本的特征h2。

7、进一步地,将经过特征传播后的带有集群信息的特征与原来的特征输入特征融合模块进行特征融合,包括:将h1和h2求平均作为最终节点输出特征h0。

8、进一步地,将融合后的特征h0输入到softmax多分类器中,根据公式y=softmax(h0θ)得到最终的分类结果y=(y1,y2,…,yn),其中n为文献个数,yi,i=1,2…n为文献的类别标签,θ为权重矩阵。

9、第二方面,提供一种基于孪生图神经网络和集群结构的文献分类系统,包括集群检测模块,用于检测引文网络中的集群结构;自适应权重调制模块,用于对引文网络的集群间连接进行权重调制,保留引文网络的集群结构;特征融合模块,用于将文献节点的特征矩阵分别使用权重调制后的引文网络和原始引文网络分别进行特征传播,融合邻居节点信息;还用于将集群信息融合到原有的信息表示中;文献分类模块,用于利用处理后的文献节点的特征矩阵进行文献分类。

10、与现有技术相比,本发明所达到的有益效果:

11、本发明利用聚类算法检测引文网络中的集群结构,获取集群结构信息;对集群间连接的权重进行自适应调制;将经过权重调制后的引文网络和原本的引文网络通过孪生图神经网络结构进行特征传播,获取邻居节点信息,得到节点特征矩阵;将经过特征传播后的带有集群结构的特征与原来的特征输入特征融合模块进行特征融合;将融合后的特征输入到线性分类器中得到最终分类结果,有效的提高了分类的准确率。



技术特征:

1.一种基于孪生图神经网络和聚类算法的文献分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于孪生图神经网络和聚类算法的文献分类方法,其特征在于,利用聚类算法检测引文网络中的集群结构,获取集群结构信息,包括:

3.根据权利要求1所述的基于孪生图神经网络和聚类算法的文献分类方法,其特征在于,对集群间连接的权重进行自适应调制,包括:

4.根据权利要求1所述的基于孪生图神经网络和聚类算法的文献分类方法,其特征在于,将经过权重调制后的引文网络和原始引文网络通过孪生图神经网络结构进行特征传播,获取邻居节点信息,得到文献节点的两种不同的特征表示,包括:

5.根据权利要求1所述的基于孪生图神经网络和聚类算法的文献分类方法,其特征在于,将经过特征传播后的带有集群结构的特征与原来的特征输入特征融合模块进行特征融合,包括:将h1和h2取平均作为最终节点输出特征h0。

6.根据权利要求1所述的基于孪生图神经网络和聚类算法的文献分类方法,其特征在于,将融合后的特征输入到线性多分类器中得到最终分类结果,包括:


技术总结
本发明公开一种基于孪生图神经网络和集群结构的文献分类方法及系统,方法包括:利用聚类算法检测引文网络中的集群结构,获取集群结构信息;对集群间连接的权重进行自适应调制;将经过权重调制后的引文网络和原始引文网络通过孪生图神经网络结构进行特征传播,获取邻居节点信息,得到文献节点的两种不同的特征表示;将经过特征传播后的带有集群信息的特征与原始特征输入特征融合模块进行特征融合;将融合后的特征输入到线性多分类器中得到最终分类结果。本发明通过保留引文网络中的集群结构,有效的提高了分类的准确率。

技术研发人员:朱胡悦,姚潇
受保护的技术使用者:河海大学
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1