基于科技知识图谱的产业链分析应用方法和装置与流程

文档序号:34975952发布日期:2023-08-01 21:50阅读:81来源:国知局
基于科技知识图谱的产业链分析应用方法和装置与流程

本公开的实施例涉及自然语言处理,具体涉及基于科技知识图谱的产业链分析应用方法和装置。


背景技术:

1、随着自然语言处理技术的发展,将其与其他任务相结合作为辅助信息已经成为热门的选择。如知识图谱(knowledge graph),在图书情报界通常称为知识域可视化或知识领域映射地图。知识图谱的主要目标一般是用来描述真实世界中存在的各种实体和概念,以及它们之间的关系。

2、然而,发明人发现,现有的产业链知识图谱存在如下技术问题:

3、第一,目前的知识图谱往往只停留在图谱表面分析,没有更深的分析节点之间的关系。因此依据目前的知识图谱,通常不能获知各技术可以用于哪些产品的生产,从而影响产品的生产质量或生产效率。

4、第二,对于研发出的新技术,通过现有产业链知识图谱往往也很难分析出,这些新技术能够应用到哪些现有产品的改进生产。即新技术可以对哪些产品做技术支撑,实现产品的更新改善。从而影响产品的更新周期。

5、第三,在进行实体关系分析时,通常根据实际需求进行选择取舍,采用单一的相似度分析方法。而不同相似度分析方法的确定结果往往存在一定差异。这样确定的技术与产品之间的关系,会影响技术应用到产品生产的可行性概率,从而造成产品原材料的浪费。


技术实现思路

1、本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了基于知识图谱的生产控制方法、生产控制装置、电子设备和计算机可读介质,来解决以上背景技术部分提到的技术问题中的一项或多项。

2、第一方面,本公开的一些实施例提供了一种基于科技知识图谱的产业链分析应用方法,包括:响应于接收到产业链企业的终端发送的数据分析请求,获取数据分析请求所指示的候选产业链知识图谱;对候选产业链知识图谱中的实体数据进行预处理,得到候选数据,其中,实体数据包括项目实体数据和物品实体数据;将候选数据输入句向量预训练模型,输出得到句子向量,其中,句子向量包括项目句子向量和物品句子向量;基于项目句子向量与物品句子向量之间的相似度,确定项目实体与物品实体之间的关系;根据项目实体与物品实体之间的关系、项目实体对应的技术数据,建立物品实体与技术数据的关系;根据物品实体与技术数据的关系,生成新的三元组图谱数据;将三元组图谱数据发送给产业链企业的终端,以控制产业链企业相关物品的生产。

3、在一些实施例中,该方法还包括:利用归一化指数函数,确定项目句子向量与物品句子向量之间的相似度。

4、在一些实施例中,利用归一化指数函数,确定项目句子向量与物品句子向量之间的相似度,包括:确定项目句子向量与物品句子向量之间的向量差;对向量差、项目句子向量和物品句子向量进行拼接处理,得到拼接向量;根据拼接向量和归一化类概率分类器,得到项目句子向量与物品句子向量的相似度。

5、在一些实施例中,基于项目句子向量与物品句子向量之间的相似度,确定项目实体与物品实体之间的关系,包括:响应于相似度值大于目标阈值,确定对应的项目实体与物品实体存在关联关系;以及建立物品实体与技术数据的关系,包括:将关联关系所指示的项目实体所使用的技术数据,与关联关系所指示的物品实体建立关联关系。

6、在一些实施例中,该方法还包括:将三元组图谱数据存入图数据库,以代替候选产业链知识图谱。

7、在一些实施例中,该方法还包括:响应于接收到新技术数据,确定三元组图谱数据中,与新技术数据相似的技术数据,以作为目标技术数据;将三元组图谱数据中,与目标技术数据关联的物品实体,确定为目标物品实体;根据目标物品实体的数据,生成新技术数据的应用推荐信息;将应用推荐信息发送给生产目标物品的产业链企业的终端,以利用新技术数据进行目标物品的生产。

8、在一些实施例中,确定三元组图谱数据中,与新技术数据相似的技术数据,包括:对于三元组图谱数据中的各技术数据,确定该技术数据与新技术数据之间的语义相似度;分别获取与该技术数据相关的第一专利文献数据,以及与新技术数据相关的第二专利文献数据;根据第一专利文献数据和第二专利文献数据,确定该技术数据与新技术数据的技术领域相似度;基于语义相似度和技术领域相似度,确定该技术数据与新技术数据的相似度;将三元组图谱数据中相似度值最大的技术数据,确定为与新技术数据相似的技术数据。

9、第二方面,本公开的一些实施例提供了一种基于科技知识图谱的产业链分析应用装置,包括:获取单元,被配置成响应于接收到产业链企业的终端发送的数据分析请求,获取数据分析请求所指示的候选产业链知识图谱;预处理单元,被配置成对候选产业链知识图谱中的实体数据进行预处理,得到候选数据,其中,实体数据包括项目实体数据和物品实体数据;向量确定单元,被配置成将候选数据输入句向量预训练模型,输出得到句子向量,其中,句子向量包括项目句子向量和物品句子向量;项目关系确定单元,被配置成基于项目句子向量与物品句子向量之间的相似度,确定项目实体与物品实体之间的关系;技术关系确定单元,被配置成根据项目实体与物品实体之间的关系、项目实体对应的技术数据,建立物品实体与技术数据的关系;新图谱生成单元,被配置成根据物品实体与技术数据的关系,生成新的三元组图谱数据;发送单元,被配置成将三元组图谱数据发送给产业链企业的终端,以控制产业链企业相关物品的生产。

10、在一些实施例中,该产业链分析应用装置还包括相似度确定单元,被配置成利用归一化指数函数,确定项目句子向量与物品句子向量之间的相似度。

11、在一些实施例中,相似度确定单元进一步被配置成确定项目句子向量与物品句子向量之间的向量差;对向量差、项目句子向量和物品句子向量进行拼接处理,得到拼接向量;根据拼接向量和归一化类概率分类器,得到项目句子向量与物品句子向量的相似度。

12、在一些实施例中,项目关系确定单元进一步被配置成响应于相似度值大于目标阈值,确定对应的项目实体与物品实体存在关联关系;以及技术关系确定单元进一步被配置成将关联关系所指示的项目实体所使用的技术数据,与关联关系所指示的物品实体建立关联关系。

13、在一些实施例中,新图谱生成单元进一步被配置将三元组图谱数据存入图数据库以代替候选产业链知识图谱。

14、在一些实施例中,该产业链分析应用装置还包括推荐信息生成单元,被配置成响应于接收到新技术数据,确定三元组图谱数据中,与新技术数据相似的技术数据,以作为目标技术数据;将三元组图谱数据中,与目标技术数据关联的物品实体,确定为目标物品实体;根据目标物品实体的数据,生成新技术数据的应用推荐信息;将应用推荐信息发送给生产目标物品的产业链企业的终端,以利用新技术数据进行目标物品的生产。

15、在一些实施例中,推荐信息生成单元进一步被配置成对于三元组图谱数据中的各技术数据,确定该技术数据与新技术数据之间的语义相似度;分别获取与该技术数据相关的第一专利文献数据,以及与新技术数据相关的第二专利文献数据;根据第一专利文献数据和第二专利文献数据,确定该技术数据与新技术数据的技术领域相似度;基于语义相似度和技术领域相似度,确定该技术数据与新技术数据的相似度;将三元组图谱数据中相似度值最大的技术数据,确定为与新技术数据相似的技术数据。

16、第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面中,任一实现方式所描述的基于科技知识图谱的产业链分析应用方法。

17、第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,计算机程序被处理器执行时,实现上述第一方面中任一实现方式所描述的基于科技知识图谱的产业链分析应用方法。

18、本公开的上述各个实施例具有如下有益效果:本公开的一些实施例的基于科技知识图谱的产业链分析应用方法,可以对现有产业链知识图谱建立更深的关系,从而能够得到将不同技术可以应用于哪些物品的生产,提高物品的质量或生产效率。具体来说,依据现有产业链知识图谱不能获知各技术可以用于哪些产品的生产,进行产业支撑的原因在于:目前的知识图谱在不同技术如何支撑产品方面分析的不够全面,往往只停留在图谱表面分析,没有更深的分析节点之间的关系。也就是说,通常只利用词级别的信息,匹配分析了项目实体与产品实体之间关系,而没有体现出技术与产品之间的关系。

19、基于此,本公开实施例的基于科技知识图谱的产业链分析应用方法,对于现有的产业链知识图谱,使用语义分析的方式将产品和项目名称之间建立关系。即利用句子级别的语义信息进行匹配分析。由于句子比词包含了更多的信息,因此可以提高关系确定的准确度。然后,再根据科研项目和使用技术之间的关系,对产品和研究成果技术建立关系,以生成更加完善的产业链知识图谱。也就是说,本发明在知识图谱基础之上,以其中的物品节点和项目节点为数据基础,通过使用语义匹配技术,可以对科学研究成果和产业进行关系建立,分析成果技术可以对哪些产业(产品)有生产的支撑作用,从而找到产业可以使用的成果技术。也因为生成的新三元组图谱数据,分析了技术数据与物品实体之间的关系。从而可以根据该关系,将技术数据所指示的技术应用到对应产品的生产中。这样有助于产品的更新升级或生产工艺改进,使得产品质量更高或者功能更加全面,从而促进产品的生产数量和出库数量。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1