本发明涉及专利评价领域,具体来说是一种基于引用时间差和社群分类的专利评价方法。
背景技术:
1、专利作为科技成果的一种呈现形式,对企业科创能力评价有重要参考作用。一般而言,专利的评价指标包括新颖性和创造性、技术原创性和重要性、专利运用和专利保护、社会效益和行业影响力等,其中,专利被引用情况可以作为专利技术先进性和影响力的重要体现。一篇专利被较多专利引用,或被质量较高的专利引用,能够间接说明该专利的先进性。
2、现有的专利定量评价标准多为不同指标或属性的罗列,如专利权利要求数、同族专利数、专利权人数等,对于专利之间的相互作用,也就是专利引用的考量,基本停留在专利被引数。部分研究人员也尝试建立专利引用网络,并使用互联网链接分析领域的pagerank算法进一步分析专利之间的相互作用关系,评价专利的重要性。但是,主流的专利定量评价由于评价指标的选择具有片面性、局限性,使得评价结果不够客观,容易引起争议。pagerank算法的简单迁移,则忽视了不同引用之间重要性差异的问题;同时,专利引用网络的链接关系与网页链接关系的特性也不尽相同,例如一篇专利只能引用发布时间之前公开的专利等。
技术实现思路
1、本发明要解决的技术问题是克服现有技术的不足,提供一种借助pagerank算法,定量分析专利引用网络,从而获得专利重要性的排序结果,挖掘核心专利的专利评价方法。
2、为了实现上述目的,设计一种基于引用时间差和社群分类的专利评价方法,所述方法具体如下:
3、s1.构建全量专利引用网络,根据全量专利引用关系数据,以专利作为网络中的节点,在存在引用关系的两个节点之间构建一条从引用专利指向被引专利的有向边,形成有向图,初始状态下所有有向边的都没有权重,记该有向图的节点总数为n,边的总数为e;
4、s2.获得有向图的邻接矩阵a={aij,i∈[0,n-1],j∈[0,n-1]},aij=1表示从节点i出发有一条指向节点j的有向边,aij=0则表示没有有向边;
5、s3.获得在有向图上随机游走的转移矩阵表示节点i随机游走到节点j的概率,定义为
6、
7、其中转移矩阵a*的每一行元素和为1;
8、s4.遍历有向图的所有节点,根据网络链接关系,即专利引用关系,对节点进行社群分类;s5.根据专利被引用数随引用时间差的变化关系,赋予不同的引用关系不同的权重;s6.使用pagerank算法在有向图上迭代,直至连续两次获得的各节点pagerank值差距小于10-12,将最终结果按大小降序排列获得专利重要性排名。
9、本发明还具有如下优选的技术方案:
10、1.所述步骤s4具体如下:s4.1使用node2vec算法无监督地学习网络中所有节点的向量表示,在模型收敛后每个节点获得一个64维的向量作为节点的特征向量;
11、s4.2以节点的向量表示作为输入,使用kmeans算法对所有节点进行聚类,将节点聚类为8个社群,记每个社群为gk,k=1,2,...,8,每个社群的大小为nk,k=1,2,...,8,每个社群中边的数量为ek,k=1,2,...,8;
12、s4.3计算基于社群分类的链接权重矩阵wc=(a+wc)/n,其中为节点i和节点j之间边的权重,定义为
13、
14、2.所述步骤s5具体如下:
15、s5.1根据各个存在引用关系的专利之间的公开时间差,统计不同引用时间差下专利的累计被引数,除以专利引用网络中存在被引的专利数,获得不同引用时间差下专利的平均被引数;
16、s5.2计算基于引用时间差的链接权重矩阵其中
17、t为节点i和节点j所代表专利的公开时间差,如图3所示。该函数的特点是,当t≤36时,权重随着t变大而变大,且考虑到专利的老化因素,增加的速率逐渐变缓;当t>36时,权重为固定值。
18、3.所述步骤s6中每一轮迭代时,pagerank值的计算公式为
19、
20、其中α为阻尼系数,本发明中取0.85;β为节点社群属性的权重,本发明中取0.4。
21、本发明同现有技术相比,其优点在于:
22、1.本发明采用无监督的学习和训练方法,不需要数据标注工作;
23、2.本发明建立专利引用网络,从节点图结构特征出发优化pagerank算法;
24、3.本发明考虑专利老化对于专利重要性的作用,排除了专利发布时间对于排序结果的影响。
1.一种基于引用时间差和社群分类的专利评价方法,其特征在于所述方法具体如下:
2.如权利要求1所述的一种基于引用时间差和社群分类的专利评价方法,其特征在于所述步骤s4具体如下:
3.如权利要求1所述的一种基于引用时间差和社群分类的专利评价方法,其特征在于所述步骤s5具体如下:
4.如权利要求1所述的一种基于引用时间差和社群分类的专利评价方法,其特征在于所述步骤s6中每一轮迭代时,pagerank值的计算公式为