本发明涉及排序算法的,特别涉及一种基于主动学习的科研合作网络中节点排序方法。
背景技术:
1、在当今数字化时代,网络数据的爆炸式增长引发了对网络分析技术的高需求。在科研领域,科研合作网络扮演着连接研究者、学术机构和知识资源的重要桥梁,是促进知识交流、合作和创新的关键平台。然而,在庞大的科研合作网络中,节点的排序问题成为一个挑战。节点的排序决定了其在网络中的重要性和影响力,进而影响到合作伙伴选择、资源分配等方面。因此,设计一种高效的节点排序模型对于优化科研合作网络的运作至关重要。
2、传统节点排序方法往往依赖于静态的网络特征,利用节点度中心性、接近中心性拓扑网络指标以及pagerank等传统的图论算法,来评估节点的重要性和影响力。虽然这些方法在一定程度上能够提供有用的排序结果,但它们往往忽略了节点的属性特征。另一些方法采用机器学习算法技术来学习节点排序模型的方法。通过对节点特征和关系的学习,建立节点排序模型,并根据学习到的模型对节点进行排序。
3、基于pagerank等传统的图论算法,依赖于静态的网络特征,虽然在一定程度上能够提供有用的排序结果,但它们无法捕捉到网络的动态性和复杂性,尤其在科研合作网络这种存在大量的噪声、不完整信息以及动态变化的情况下。机器学习网络节点排序方法是一种利用机器学习算法和技术来学习节点排序模型的方法。该方法可以通过对节点特征和关系的学习,建立节点排序模型,并根据学习到的模型对节点进行排序,往往需要大量的已标记数据进行训练,且在处理大规模科研合作网络时面临着计算复杂度高、效率低下等问题。
技术实现思路
1、针对现有技术中存在的不足之处,本发明的目的是提供一种基于主动学习的科研合作网络中节点排序方法,能够在数据标签稀缺和噪声干扰较大的情况下,自适应地根据网络中节点的重要性进行排序。为了实现根据本发明的上述目的和其他优点,提供了一种基于主动学习的科研合作网络中节点排序方法,包括:
2、s1、基于图卷积网络的节点学习排序模型进行节点排序预测;
3、s2、引入预测的top-one概率作为辅助指标,对每个节点进行预测时,根据节点排序预测结果的概率确定节点的排名;
4、s3、基于高置信度与不确定性的主动学习节点排序,更进一步精确节点排序;
5、步骤s1中基于图卷积网络的节点学习排序模型包括图卷积聚合模块、多层叠加模块、特征提取模块及节点向量重要性评分模块;
6、其中图卷积聚合模块用于对每个节点利用其自身的属性特征和邻居节点的特征进行特征聚合;
7、多层叠加模块用于将多层图卷积网络叠加在一起,进一步丰富节点的特征表示;
8、特征提取模块用于当每一层节点的特征根据其邻居节点的信息进行更新后,进行深层次的特征提取;
9、节点向量重要性评分模块用于对节点进行重要性评分,且该评分结果表示了节点在图中的排名,即为节点的重要性。
10、优选的,图卷积聚合模块进行图卷积操作将节点的特征与邻居节点的特征进行加权组合,从而更新节点的表示,使得每个节点能获得来自邻居节点的信息,并且随着多层卷积的叠加,节点可以接收到更远邻居的信息。
11、优选的,步骤s2中采用多任务框架训练主任务和辅助任务,且使用图卷积网络进行节点排序预测时,输出的后验分布通常表示了每个节点属于不同排名的概率分布,每个节点的后验分布可以通过softmax函数应用于节点的原始输出得到,进而通过对原始输出向量进行softmax操作,将原始输出进行归一化,得到节点在不同排名的概率分布。
12、优选的,步骤s3中包括预测结果的不确定性衡量模块、预测结果的置信度衡量模块及标签更新模块;
13、其中预测结果的不确定性衡量模块用于在每一轮训练过程中衡量模型节点预测结果的不确定性,通过最小置信度、边缘抽样和熵三个不确定数据的查询策略,对预测结果的不确定性进行度量和排序;
14、预测结果的置信度衡量模块用于衡量预测结果的置信度,依据置信度对预测结果进行排序;
15、标签更新模块用于综合考虑节点预测结果的不确定性和置信度,同时对节点预测结果进行评估,赋予高不确定性和置信度的数据以真实标签,通过增广后的训练集迭代改进模型。
16、本发明与现有技术相比,其有益效果是:所提出的方法结合了深度学习的优势以及主动学习的查询策略,能够在数据标签稀缺和噪声干扰较大的情况下,自适应地根据网络中节点的重要性进行排序。利用深度学习模型从节点的多模态特征中进行表示学习,将节点表示与其重要性相结合,形成一个综合的排序指标。然后,通过主动学习的方法选择那些对排序结果具有较大影响的节点进行标注,从而逐步优化排序模型。
1.一种基于主动学习的科研合作网络中节点排序方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于主动学习的科研合作网络中节点排序方法,其特征在于,图卷积聚合模块进行图卷积操作将节点的特征与邻居节点的特征进行加权组合,从而更新节点的表示,使得每个节点能获得来自邻居节点的信息,并且随着多层卷积的叠加,节点可以接收到更远邻居的信息。
3.如权利要求1所述的一种基于主动学习的科研合作网络中节点排序方法,其特征在于,步骤s2中采用多任务框架训练主任务和辅助任务,且使用图卷积网络进行节点排序预测时,输出的后验分布通常表示了每个节点属于不同排名的概率分布,每个节点的后验分布可以通过softmax函数应用于节点的原始输出得到,进而通过对原始输出向量进行softmax操作,将原始输出进行归一化,得到节点在不同排名的概率分布。
4.如权利要求1所述的一种基于主动学习的科研合作网络中节点排序方法,其特征在于,步骤s3中包括预测结果的不确定性衡量模块、预测结果的置信度衡量模块及标签更新模块;