本申请涉及生物高通量数据分析,特别是涉及一种调控细菌形状的候选基因的鉴定方法、装置、设备和介质。
背景技术:
1、生物学作为一门基础科学,具有广泛的学科交叉性和应用价值,它为提高人类对生命的认识、推动科技和经济发展、解决人类面临的问题等方面做出了重要的贡献。而基因功能研究是生物学研究中非常重要的一部分。基因是控制生命过程和特征表达的重要分子,其功能研究对于了解生命的本质、研究生物发育和进化、阐明疾病发生机制等具有重要的意义。
2、基因功能挖掘方法自上世纪就已经出现,随着生物学技术的发展,基因功能挖掘也发展出了几种常用的挖掘基因功能的方法,例如,常用的突变体筛选、全基因组关联分析等。对于突变体筛选方法而言,由于其是通过对大量生物体进行化学、物理、生物诱变产生的突变,因此突变点随机分布,部分突变可能是无效的或者与研究对象无关,需要花费大量的时间和精力来鉴定和筛选有意义的突变体进而挖掘鉴定获得候选基因。此外,突变体库需要保存和繁殖大量的生物个体进行维持。全基因组关联分析前提的是需要花费大量的财力、精力、时间用于收集足够量的同一物种的不同菌株或动植物自交系品种等材料,然后才能进行基因组测序和重测序,最后通过全基因组关联分析确定候选关键基因。因此,现有的技术方案中,会耗费大量的资源和时间。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种调控细菌形状的候选基因的鉴定方法、装置、设备和介质。
2、一种调控细菌形状的候选基因的鉴定方法,方法包括:
3、获取细菌参考基因组数据,对细菌参考基因组数据进行蛋白质结构域解析;
4、根据解析后得到的各细菌的全部蛋白质结构域,确定特征值数据集;
5、获取各细菌的形状信息;
6、根据各细菌的形状信息以及特征值数据集训练细菌形状预测模型,并根据细菌预测模型确定各蛋白质结构域对细菌形状的影响权重;
7、根据各影响权重,确定调控细菌形状的候选基因。
8、一种调控物种表型的候选基因的鉴定方法,上述的方法包括:
9、获取目标物种的参考基因组数据,对目标物种的参考基因组数据进行蛋白质结构域解析;
10、根据解析后得到的各蛋白质的结构域,确定特征值数据集;
11、获取目标物种的表型信息;
12、根据目标物种的表型信息以及特征值数据集训练表型预测模型,并根据表型预测模型确定各蛋白质结构域对目标物种的表型的影响权重;
13、根据各影响权重,确定调控目标物种的表型的候选基因。
14、一种调控细菌形状的候选基因的鉴定装置,上述的装置包括:
15、第一获取模块,用于获取细菌参考基因组数据,对细菌参考基因组数据进行蛋白质结构域解析;
16、第一确定模块,用于根据解析后得到的各细菌的全部蛋白质结构域,确定特征值数据集;
17、第二获取模块,用于获取各细菌的形状信息;
18、处理模块,用于根据各细菌的形状信息以及特征值数据集训练细菌形状预测模型,并根据细菌预测模型确定各蛋白质结构域对细菌形状的影响权重;
19、第二确定模块,用于根据各影响权重,确定调控细菌形状的候选基因。
20、一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一的方法的步骤。
21、一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一的方法的步骤。
22、上述调控细菌形状的候选基因的确定方法、装置、设备和介质,通过获取细菌参考基因组数据,解析细菌参考基因组数据得到蛋白质结构域,根据蛋白质结构域,确定特征值数据集;获取各细菌的形状信息;根据各细菌的形状信息以及特征值数据集训练细菌形状预测模型,并根据细菌预测模型确定各蛋白质结构域对细菌形状的影响权重;根据各影响权重,确定调控细菌形状的候选基因。本申请通过训练细菌形状预测模型,通过该模型训练过程中所产生的中间数据,即上述的各蛋白质结构域对形状的影响权重,确定调控细菌形状的候选基因,实现了对关键基因的快速初步筛选,后续基于该候选基因进行功能鉴定,可以大大缩短对细菌基因功能鉴定的周期。
1.一种调控细菌形状的候选基因的鉴定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据解析后得到的各细菌的全部蛋白质结构域,确定特征值数据集,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据各所述细菌的形状信息以及所述特征值数据集训练细菌形状预测模型,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述细菌预测模型确定各所述蛋白质结构域对细菌形状的影响权重,包括:
5.根据权利要求1所述的方法,其特征在于,所述根据各所述影响权重,确定调控细菌形状的候选基因,包括:
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
8.一种调控物种表型的候选基因的鉴定方法,其特征在于,所述方法包括:
9.一种调控细菌形状的候选基因的鉴定装置,其特征在于,所述装置包括:
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。