本申请涉及代谢组学,具体而言,本申请涉及一种代谢组学的参考谱图数据库的建立方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术:
1、代谢组学是系统生物学研究的重要组成部分,是一种对特定条件下生物体内所有内源性小分子未知代谢物进行全面定性和定量分析的技术。
2、非靶向代谢组学实验数据的可注释信息有限,使得发现的大量差异未知代谢物由于结构未知,无法用于后续的功能机制等研究。
3、现有的未知代谢物鉴定分析途径主要包括:
4、途径一,基于标准品数据库的数据依赖分析(data dependent analysis,dda)鉴定方法,将样本数据中未知特征的二级质谱图与标准品数据库中已经注释的标准品的二级质谱图进行相似度计算,若相似度大于一定阈值,则可以实现未知代谢物分子注释。途径一需要花费较高的费用购买标准品,并且只能鉴定出现有已经分离纯化的未知代谢物。
5、途径二,通过未知代谢物的结构特性进行未知代谢物分子注释。途径二鉴定分析途径中的未知代谢物的结构特性数据,来源于人工定义的代谢反应定义,只能基于已有的代谢反应推断出数量有限的化合物,并且人工推测的未知代谢物与实际质谱检测的化合物的质谱数据存在差异,存在一定的鉴定误差。
技术实现思路
1、本申请实施例提供了一种代谢组学的参考谱图数据库的建立方法、装置、电子设备、计算机可读存储介质及计算机程序产品,可以解决现有技术的上述问题。所述技术方案如下:
2、根据本申请实施例的一个方面,提供了一种代谢组学的参考谱图数据库的建立方法,该方法包括:
3、确定代谢组学样本中多个未知代谢物的第一质谱数据;
4、从与所述代谢组学样本相关的文献中,确定所述代谢组学样本中疑似存在的各个化合物以及各个化合物的参考数据,所述参考数据为分子结构信息和真实质谱数据中的至少一种;
5、根据各个第一质谱数据和各个化合物的参考数据,确定与各个化合物分别关联的第一质谱数据。
6、根据本申请实施例的另一个方面,提供了一种代谢组学的参考谱图数据库的建立装置,该装置包括:
7、采样模块,用于确定代谢组学样本中多个未知代谢物的第一质谱数据;
8、参考数据确定模块,用于从与所述代谢组学样本相关的文献中,确定所述代谢组学样本中疑似存在的各个化合物以及各个化合物的参考数据,所述参考数据为分子结构信息和真实质谱数据中的至少一种;
9、关联模块,用于根据各个第一质谱数据和各个化合物的参考数据,确定与各个化合物分别关联的第一质谱数据。
10、根据本申请实施例的另一个方面,提供了一种电子设备,该电子设备包括存储器、处理器及存储在存储器上的计算机程序,处理器执行所述计算机程序以实现上述方法的步骤。
11、根据本申请实施例的再一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。
12、根据本申请实施例的一个方面,提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现上述方法的步骤。
13、本申请实施例提供的技术方案带来的有益效果是:
14、在确定代谢组学样本中多个未知代谢物的质谱数据后,通过从与代谢组学样本相关的文献中,确定代谢组学样本中疑似存在的各个化合物以及各个化合物的参考数据,文献中可能直接包括化合物的真实质谱数据,也可能仅有分子结构信息,根据各个第一质谱数据和各个化合物的参考数据,确定与各个化合物分别关联的第一质谱数据,相比现有技术不需要购买标准品,并且在实际应用时用于可获得的文献的数量是充沛的,所以相应获得的疑似存在的化合物的数量也是很多的,并且参考数据也是比较准确的,最终获得的关联关系的误差相比现有技术的途径二更小。
1.一种代谢组学的参考谱图数据库的建立方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述第一质谱数据包括多个第一二级质谱图以及与每个第一二级质谱图对应的至少一个第一母离子质谱信息;
3.根据权利要求1所述的方法,其特征在于,所述第一质谱数据包括多个第一二级质谱图以及与每个第一二级质谱图对应的至少一个第一母离子质谱信息;
4.根据权利要求1所述的方法,其特征在于,所述第一质谱数据包括多个第一二级质谱图以及与每个第一二级质谱图对应的至少一个第一母离子质谱信息;
5.根据权利要求1所述的方法,其特征在于,所述第一质谱数据包括多个第一二级质谱图以及与每个第一二级质谱图对应的至少一个第一母离子质谱信息;
6.根据权利要求4所述的方法,其特征在于,所述根据所述第一聚类簇、各个化合物的分子结构信息和理论质谱数据,确定与各个化合物分别关联的第一质谱数据,包括:
7.根据权利要求4所述的方法,其特征在于,所述确定与各个化合物分别关联的第一质谱数据,之前还包括:
8.根据权利要求7所述的方法,其特征在于,所述根据所述第一聚类簇、各个化合物的分子结构信息和理论质谱数据,确定与各个化合物分别关联的第一质谱数据,包括:
9.根据权利要求7所述的方法,其特征在于,所述根据所述第一聚类簇、各个化合物的分子结构信息和理论质谱数据,确定与各个化合物分别关联的第一质谱数据,包括:
10.一种代谢组学的参考谱图数据库的建立装置,其特征在于,包括:
11.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-9任一项所述的代谢组学的参考谱图数据库的建立方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-9任一项所述的代谢组学的参考谱图数据库的建立方法的步骤。