一种基于技术主题识别的科研合作机构推荐方法、装置及存储介质与流程

文档序号:34440663发布日期:2023-06-13 01:24阅读:29来源:国知局
一种基于技术主题识别的科研合作机构推荐方法、装置及存储介质与流程

本发明属于数据挖掘,具体地说,涉及一种基于技术主题识别的科研合作机构推荐方法、装置及存储介质。


背景技术:

1、随着社会的不断发展进步,开放式创新成为热门话题,合作创新成为创新主体实现资源互补、提高创新效率、降低新品开发成本的最优选择。企业、高校、科研院所、政府机构或者社会组织参与合作创新,逐渐形成产学研合作、高等院校合作、校企合作、产业联盟合作、科研机构合作等组织形式的创新合作网络。然而,由于资源的稀缺性与有限性,寻找研究领域相近、有意向合作的伙伴机构变得越来越困难。

2、目前对于合作伙伴的推荐方法包括基于未来共同邻居相似性的合作伙伴推荐方法,该方法根据企业在供应链网络中连接关系计算待推荐节点和待考察节点与包括待推荐节点、待考察节点、未来共同邻居节点的所有节点之间的相似度,从而得出待推荐节点与待考察之间的合作最终分数,以提高推荐结果的准确性。然而,供应链网络是在产品生产和流通过程中形成的,网络节点包括原材料供应商、生产商、分销商、零售商以及消费者等,这种网络更侧重于企业间的上下游关系而非合作创新。因此,不能用于寻找研发能力强、水平高的创新主体。还包括基于专利数据的合作机构推荐方法及系统,该方法在协同过滤的基础上,加入反距离权重进行优化推荐排序,能够有效提高合作机构的推荐精度。基于专利文本相似性的候选集的推荐方法可以更好地挖掘与目标企业的需求,然而,专利数据作为单一数据的局限性,不能兼顾前沿科学与前沿技术。此外,该方法不涉及候选机构的合作意向、研发活跃度方面的考量,所选机构还需进一步甄别。

3、有鉴于此特提出本发明。


技术实现思路

1、本发明要解决的技术问题在于克服现有技术的不足,提供一种基于技术主题识别的科研合作机构推荐方法,从而使目标科研机构对于合作机构的选择更便捷。

2、为解决上述技术问题,本发明采用技术方案的基本构思是:根据本发明实施例的第一方面,提供一种基于技术主题识别的科研合作机构推荐方法,所述方法包括:获取目标科研机构的研发活动范围;基于所述研发活动范围,生成主题分类词;基于对所述主题分类词检索生成的文献数据集,标记文献数据对应的前沿技术;提取从事所述前沿技术的创新主体的数据信息,建立创新主体数据集;通过计算所述创新主体数据集中创新主体的推荐评分,确定所述目标科研机构的合作机构。

3、可选的,所述基于所述研发活动范围,生成主题分类词的方法,包括:基于获取的目标科研机构的研发活动范围,生成技术分解表,其中,所述技术分解表至少包括第一技术分支和第二技术分支;根据所述技术分解表的分支,确定所述主题分类词。

4、可选的,所述标记文献数据对应的前沿技术的方法,包括:统计所述文献数据集中技术主题词的比重,得到所述技术主题词的第一词频,其中,所述技术主题词包括所述主题分类词;根据预设的频率阈值,通过比较所述第一频率与所述频率阈值的大小,确定高频技术主题词;基于所述高频技术主题词的共现关系,构建高频技术主题词共现网络,并总结高频技术主题词词簇的特征;将同一词簇的高频技术主题词确定为一个前沿技术主题,形成所述前沿技术主题清单;根据tf-idf算法计算所述前沿技术主题单中的前沿技术主题在所述文献数据集中的比重,得到所述前沿技术主题的第二词频;基于所述第二词频,标记文献数据对应的前沿技术。

5、可选的,所述建立创新主体数据集的方法,包括:根据对所述前沿技术的标记,提取创新主体信息,其中,所述创新主体信息至少包括:创新主体的范围信息、创新主体数据集的字段信息、创新主体的评价指标信息等。

6、可选的,确定所述目标科研机构的合作机构的方法,包括:获取提前预设的所述创新主体的评价指标权重;基于所述指标权重,计算所述创新主体的推荐评分;对所述推荐评分进行降序排列,得到合作机构列表,并确定所述目标科研机构的合作机构。

7、可选的,所述创新主体的评价指标的确定方法,包括:基于所述创新主体学术论文产出数量,计算所述创新主体参与目标前沿技术主题的理论型研究指标ti;基于所述创新主体专利申请数量,计算所述创新主体参与目标前沿技术主题的应用型研究指标ai;基于创新主体科技文献产出增长率,计算所述创新主体参与目标前沿技术主题的研发活跃度指标ri;基于创新主体合作机构数量,计算所述创新主体参与目标前沿技术主题的合作活跃度指标ci;对所述理论型研究指标、所述应用型研究指标、所述研发活跃度指标和所述合作活跃度指标进行归一化处理,确定所述评价指标的归一化数值。

8、可选的,计算所述创新主体的推荐评分的方法,包括:根据以下公式计算所述创新主体的推荐评分:

9、推荐评分=ti*wit+ai*wia+ri*wir+ci*wic;

10、其中,wit+wia+wir+wic=1;wit是理论型研究指标权重;wia是应用型研究指标权重;wir是研发活跃度指标权重;wic是合作活跃度指标权重;ti是理论型研究指标;ai是应用型研究指标;ri是研发活跃度指标;ci是合作活跃度指标;i是目标前沿技术主题。

11、根据本发明实施例的第二方面,提供一种基于技术主题识别的科研合作机构推荐装置,所述装置包括:获取装置,被配置为获取目标科研机构的研发活动范围;生成装置,被配置为基于所述研发活动范围,生成主题分类词;标记装置,被配置为基于对所述主题分类词检索生成的文献数据集,标记文献数据对应的前沿技术;建立装置,被配置为提取从事所述前沿技术的创新主体的数据信息,建立创新主体数据集;确定装置,被配置为通过计算所述创新主体数据集中创新主体的推荐评分,确定所述目标科研机构的合作机构。

12、可选的,所述生成装置,用于基于所述研发活动范围,生成主题分类词的方法,包括:基于获取的目标科研机构的研发活动范围,生成技术分解表,其中,所述技术分解表至少包括第一技术分支和第二技术分支;根据所述技术分解表的分支,确定所述主题分类词。

13、可选的,所述标记装置用于标记文献数据对应的前沿技术的方法,包括:统计所述文献数据集中技术主题词的比重,得到所述技术主题词的第一词频,其中,所述技术主题词包括所述主题分类词;根据预设的频率阈值,通过比较所述第一频率与所述频率阈值的大小,确定高频技术主题词;基于所述高频技术主题词的共现关系,构建高频技术主题词共现网络,并总结高频技术主题词词簇的特征;将同一词簇的高频技术主题词确定为一个前沿技术主题,形成所述前沿技术主题清单;根据tf-idf算法计算所述前沿技术主题单中的前沿技术主题在所述文献数据集中的比重,得到所述前沿技术主题的第二词频;基于所述第二词频,标记文献数据对应的前沿技术。

14、可选的,所述建立装置用于建立创新主体数据集的方法,包括:根据对所述前沿技术的标记,提取创新主体信息,其中,所述创新主体信息至少包括:创新主体的范围信息、创新主体数据集的字段信息、创新主体的评价指标信息等。

15、可选的,所述确定装置用于确定所述目标科研机构的合作机构的方法,包括:获取提前预设的所述创新主体的评价指标权重;基于所述指标权重,计算所述创新主体的推荐评分;对所述推荐评分进行降序排列,得到合作机构列表,并确定所述目标科研机构的合作机构。

16、可选的,所述确定装置用于创新主体的评价指标的确定方法,包括:基于所述创新主体学术论文产出数量,计算所述创新主体参与目标前沿技术主题的理论型研究指标ti;基于所述创新主体专利申请数量,计算所述创新主体参与目标前沿技术主题的应用型研究指标ai;基于创新主体科技文献产出增长率,计算所述创新主体参与目标前沿技术主题的研发活跃度指标ri;基于创新主体合作机构数量,计算所述创新主体参与目标前沿技术主题的合作活跃度指标ci;对所述理论型研究指标、所述应用型研究指标、所述研发活跃度指标和所述合作活跃度指标进行归一化处理,确定所述评价指标的归一化数值。

17、可选的,所述确定装置用于计算所述创新主体的推荐评分的方法,包括:根据以下公式计算所述创新主体的推荐评分:

18、推荐评分=ti*wit+ai*wia+ri*wir+ci*wic;

19、其中,wit+wia+wir+wic=1;wit是理论型研究指标权重;wia是应用型研究指标权重;wir是研发活跃度指标权重;wic是合作活跃度指标权重;ti是理论型研究指标;ai是应用型研究指标;ri是研发活跃度指标;ci是合作活跃度指标;i是目标前沿技术主题。

20、根据本技术实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时用于实现本公开第一方面或第一方面任意一种所述实施方式所提供的一种基于技术主题识别的科研合作机构推荐方法。

21、根据本技术实施例的第四方面,提供一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行本公开第一方面或第一方面任意一种所述实施方式所提供的一种基于技术主题识别的科研合作机构推荐方法。

22、采用上述技术方案后,本发明与现有技术相比具有以下有益效果:首先获取目标科研机构的研发活动范围;基于所述研发活动范围,生成主题分类词;然后基于对所述主题分类词检索生成的文献数据集,标记文献数据对应的前沿技术;其次提取从事所述前沿技术的创新主体的数据信息,建立创新主体数据集;最后通过计算所述创新主体数据集中创新主体的推荐评分,确定所述目标科研机构的合作机构。本技术提供的方法一方面以目标科研机构的研发活动范围为依据,可以保证最后确定的合作机构与目标科研机构的研究领域相似;另一方面通过生成文献数据集,可以全方面通过多个角度提取创新主体,使得创新主体数据集的建立更客观;再一方面,通过对创新主体进行量化指标,计算推荐评分,可以使得用户根据需求优化推荐排序实现对合作机构的选择。

23、下面结合附图对本发明的具体实施方式作进一步详细的描述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1