本申请属于数据处理,本申请尤其涉及一种催化知识图谱的构建及基于其的多步催化路径推荐方法。
背景技术:
1、多步串联催化过程因其在促进热力学和动力学效率、提高选择性和原子经济性等方面的优势,近年来受到催化领域的广泛关注。然而,想要设计出高效的多功能催化剂和确定最佳反应条件面临着许多挑战,其一就是许多反应实验数据分散在不同的文献中,难以有效地整合和利用。汇总梳理这些知识不仅费时费力,还容易产生信息遗漏和冗余。由此,如何有效且快速地获取并整理相关反应实验数据以供多步串联催化研究成为了亟待解决的技术问题。
技术实现思路
1、本申请的实施例提供了一种催化知识图谱的构建及基于其的多步催化路径推荐方法,进而至少在一定程度上可以有效且快速地获取并整理相关反应实验数据以供多步串联催化研究。
2、本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
3、根据本申请实施例的一个方面,提供了一种催化知识图谱的构建方法,包括:
4、获取与目标催化反应相关的若干文献;
5、对每一所述文献进行解析,确定各所述文献中与催化反应相关的目标文献内容,所述目标文献内容包括文本信息、表格信息以及图片信息;
6、分别针对所述目标文献内容中的文本信息、表格信息以及图片信息进行反应数据提取,得到对应的催化反应数据;
7、根据各所述催化反应数据,建立若干用于描述物质转化关系及其反应参数的rdf三元组,且为每一反应和物质确定对应的标识信息,以形成催化知识图谱。
8、根据本申请实施例的一个方面,提供了一种基于催化知识图谱的多步催化路径推荐方法,包括:
9、根据目标搜索对象对应的标识信息,在如上述实施例所述的催化知识图谱的构建方法构建的催化知识图谱中进行查询,确定与所述目标搜索对象的标识信息相关的rdf三元组,以形成对应的搜索子图;
10、根据所述搜索子图,确定将所述目标搜索对象列为产物的目标反应的标识信息;
11、根据每一所述目标反应的标识信息,确定所述目标反应对应的反应物,以得到单步合成路径;
12、将每一所述单步合成路径中的反应物作为产物进行搜索,确定对应的相关合成路径;
13、根据各所述单步合成路径和各所述相关合成路径,在所述催化知识图谱中检索得到对应的具体反应信息;
14、根据所述单步合成路径、所述相关合成路径及二者对应的具体反应信息,生成至少一条候选反应路径;
15、根据至少一条所述候选反应路径进行路径推荐。
16、根据本申请实施例的一个方面,提供了一种催化知识图谱的构建装置,包括:
17、获取模块,用于获取与目标催化反应相关的若干文献;
18、解析模块,用于对每一所述文献进行解析,确定各所述文献中与催化反应相关的目标文献内容,所述目标文献内容包括文本信息、表格信息以及图片信息;
19、提取模块,用于分别针对所述目标文献内容中的文本信息、表格信息以及图片信息进行反应数据提取,得到对应的催化反应数据;
20、构建模块,用于根据各所述催化反应数据,建立若干用于描述物质转化关系及其反应参数的rdf三元组,且为每一反应和物质确定对应的标识信息,以形成催化知识图谱。
21、根据本申请实施例的一个方面,提供了一种基于催化知识图谱的多步催化路径推荐装置,包括:
22、第一检索模块,用于根据目标搜索对象对应的标识信息,在如上述实施例所述的催化知识图谱的构建方法构建的催化知识图谱中进行查询,确定与所述目标搜索对象的标识信息相关的rdf三元组,以形成对应的搜索子图;
23、第一确定模块,用于根据所述搜索子图,确定将所述目标搜索对象列为产物的目标反应的标识信息;
24、第二确定模块,用于根据每一所述目标反应的标识信息,确定所述目标反应对应的反应物,以得到单步合成路径;
25、第三确定模块,用于将每一所述单步合成路径中的反应物作为产物进行搜索,确定对应的相关合成路径;
26、第二检索模块,用于根据各所述单步合成路径和各所述相关合成路径,在所述催化知识图谱中检索得到对应的具体反应信息;
27、生成模块,用于根据所述单步合成路径、所述相关合成路径及二者对应的具体反应信息,生成至少一条候选反应路径;
28、处理模块,用于根据至少一条所述候选反应路径进行路径推荐。
29、根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的催化知识图谱的构建或基于催化知识图谱的多步催化路径推荐方法。
30、根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的催化知识图谱的构建或基于催化知识图谱的多步催化路径推荐方法。
31、根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中提供的催化知识图谱的构建或基于催化知识图谱的多步催化路径推荐方法。
32、在本申请的一些实施例所提供的技术方案中,通过获取与目标催化反应相关的若干文献,并对每一文献进行解析,确定各文献中与催化反应相关的目标文献内容,该目标文献内容包括文本信息、表格信息以及图片信息,分别针对目标文献内容中的文本信息、表格信息以及图片信息进行反应数据提取,得到对应的催化反应数据,再基于各催化反应数据,建立若干用于描述物质转化关系及其反应参数的rdf三元组,且为每一反应和物质确定对应的标识信息,以形成催化知识图谱。
33、由此,根据文献中的文本信息、表格信息以及图片信息进行反应数据提取,不仅能够有效且快速地获取并整理相关反应实验数据,还能够避免信息遗漏。另外,根据提取到的催化反应数据进行融合以形成催化知识图谱,该催化知识图谱包括若干用于描述物质转化关系及其反应参数的rdf三元组,且每一反应和物质均存在对应的标识信息,能够便于后续的查询,提高查询效率且保证查询结果。
34、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
1.一种催化知识图谱的构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在针对所述目标文献内容中的表格信息进行反应数据提取时,包括:
3.根据权利要求1所述的方法,其特征在于,在针对所述目标文献内容中的图片信息进行反应数据提取时,包括:
4.根据权利要求1-3中任一项所述的方法,其特征在于,在根据各所述催化反应数据,建立若干用于描述物质转化关系及其反应参数的rdf三元组,且为每一反应和物质确定对应的标识信息,以形成催化知识图谱之前,所述方法还包括:
5.一种基于催化知识图谱的多步催化路径推荐方法,其特征在于,包括:
6.根据权利要求5所述的方法,其特征在于,根据至少一条所述候选反应路径进行路径推荐,包括:
7.根据权利要求6所述的方法,其特征在于,所述筛选规则包括以下规则中的至少一条:
8.根据权利要求6所述的方法,其特征在于,根据所述目标反应路径进行路径推荐,包括:
9.一种催化知识图谱的构建装置,其特征在于,包括:
10.一种基于催化知识图谱的多步催化路径推荐装置,其特征在于,包括: