本发明涉及生物大数据分析,尤其涉及基于数据分析的微生物功能因子评价系统及方法。
背景技术:
1、人类胃肠道微生物群落由大量复杂的微生物组成,胃肠道微生物在提高宿主免疫力、食物消化、胃肠道内分泌功能、神经信号调节、药物功能和代谢以及内毒素清除等方面扮演重要角色。
2、随着高通量测序技术、组学技术以及生物大数据分析技术的发展,利用微生物群体dna或rna等标志物,研究胃肠道微生物群落构建与演化、分布特征、执行群体功能的机理已成为胃肠道微生物研究中的重点领域。
3、现有技术在通过高通量测序技术进行微生物功能因子评价时忽略了微生物群落功能特征对于确定微生物功能因子的重要价值,以及微生物功能因子在不同胃肠道环境中的变化趋势对于预测胃肠道环境变化对微生物群落功能特性影响的重要意义,导致微生物群落功能特性预测存在准确率不高的问题。
技术实现思路
1、为了克服现有技术存在的缺陷与不足,本发明提供基于数据分析的微生物功能因子评价系统及方法,通过微生物群落的功能特征确定其功能因子并构建功能因子预测模型,提升了胃肠道环境变化对于微生物群落功能特征预测的可靠性和准确性。
2、为了达到上述目的,本发明采用以下技术方案:
3、第一方面,本发明的实施例提供基于数据分析的微生物功能因子评价方法,包括下述步骤:
4、提取微生物群落dna并通过高通量测序技术获取第一测序数据,对所述第一测序数据进行预处理,获得第二测序数据;
5、基于所述第二测序数据评估微生物群落的功能特征指数;
6、基于所述功能特征指数确定微生物群落的功能因子;
7、构建功能因子预测模型,通过评估所述功能因子在不同胃肠道环境条件下的变化趋势,预测胃肠道环境变化对于微生物群落功能特征的影响。
8、作为优选的技术方案,所述评估微生物群落的功能特征指数的步骤进一步包括:
9、基于所述第二测序数据获得微生物群落中的微生物信息,所述微生物信息包含微生物种类信息和相对丰度信息;
10、基于所述微生物信息计算微生物群落的功能多样性系数和功能冗余系数,所述功能冗余系数的计算公式如下:
11、;
12、式中表示微生物群落中第个物种与第个物种的功能相似性,表示微生物群落中第个物种的相对丰度,表示微生物群落中第个物种的相对丰度,表示微生物群落的物种数量,表示微生物群落的功能冗余系数;
13、基于所述功能多样性系数和所述功能冗余系数计算生物群落的所述功能特征指数,所述功能特征指数的计算公式如下:
14、;
15、式中表示微生物群落的功能多样性系数,表示微生物群落的功能冗余系数,表示第一调节因子,表示微生物群落的功能特征指数。
16、作为优选的技术方案,所述功能多样性系数的计算公式如下:
17、;
18、式中表示微生物群落中第个物种的相对丰度,表示微生物群落的物种数量,表示单态种数,表示双态种数,表示第二调节因子,表示微生物群落的功能多样性系数。
19、作为优选的技术方案,所述确定微生物群落的功能因子的步骤进一步包括:
20、获取所述功能特征指数,基于所述功能特征指数计算微生物群落间的功能特征匹配指数;
21、将所述功能特征匹配指数大于预设功能特征匹配阈值的微生物群落划分为微生物功能群;
22、基于所述微生物功能群进行功能基因注释并计算功能基因相对丰度,将功能基因相对丰度最大的功能基因作为微生物群落的功能因子。
23、作为优选的技术方案,所述功能特征匹配指数的计算公式如下:
24、;
25、式中表示微生物群落的功能特征指数,表示微生物群落的功能特征指数,表示取和中的最大值,表示功能特征匹配指数。
26、作为优选的技术方案,所述构建功能因子预测模型的步骤进一步包括:
27、采集历史数据,所述历史数据包含历史胃肠道环境数据以及对应胃肠道环境条件下所述功能因子的变化趋势数据;
28、对所述历史数据进行数据预处理,并将数据预处理后的历史数据划分为训练集、验证集和测试集;
29、基于lstm神经网络构建功能因子预测模型,将所述训练集输入所述功能因子预测模型进行迭代训练,并通过所述验证集监控迭代训练过程;
30、当所述功能因子预测模型在所述测试集上的均方误差达到预设误差阈值时,完成功能因子预测模型构建。
31、在此需要说明的是,这里的第一调节因子、第二调节因子、预设功能特征匹配阈值和预设误差阈值的取值方式为:采集10000组测序数据和历史胃肠道环境数据,对胃肠道环境变化是否对微生物群落功能特征产生影响进行区分,通过测序数据评估微生物群落的功能特征指数并确定微生物群落的功能因子,将历史胃肠道环境数据代入功能因子预测模型中进行预测,将预测得到的功能因子变化趋势和区分结果同时导入拟合软件中,输出符合区分结果区分准确率的最优第一调节因子、第二调节因子、预设功能特征匹配阈值和预设误差阈值。
32、第二方面,本发明的实施例提供基于数据分析的微生物功能因子评价系统,包括:
33、数据获取模块,用于提取微生物群落dna并通过高通量测序技术获取第一测序数据,对所述第一测序数据进行预处理,获得第二测序数据;
34、功能特征指数评估模块,用于基于所述第二测序数据评估微生物群落的功能特征指数;
35、功能因子确定模块,用于基于所述功能特征指数确定微生物群落的功能因子;
36、预测模型构建模块,用于构建功能因子预测模型,通过评估所述功能因子在不同胃肠道环境条件下的变化趋势,预测胃肠道环境变化对于微生物群落功能特征的影响。
37、第三方面,本发明的实施例提供一种电子设备,包括:处理器和存储器,其中,所述存储器中存储有可供处理器调用的计算机程序,所述处理器通过调用所述存储器中存储的计算机程序,执行基于数据分析的微生物功能因子评价方法。
38、第四方面,本发明的实施例提供一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行基于数据分析的微生物功能因子评价方法。
39、本发明与现有技术相比,具有如下优点和有益效果:
40、本发明首先通过测序数据评估微生物群落的功能特征指数,然后通过微生物群落的功能特征指数确定微生物群落的功能因子,最后构建功能因子预测模型,通过评估所述功能因子在不同胃肠道环境条件下的变化趋势,预测胃肠道环境变化对于微生物群落功能特征的影响,提升了胃肠道环境变化对于微生物群落功能特征预测的可靠性和准确性。
1.基于数据分析的微生物功能因子评价方法,其特征在于,包括下述步骤:
2.根据权利要求1所述的基于数据分析的微生物功能因子评价方法,其特征在于,所述评估微生物群落的功能特征指数,包括:
3.根据权利要求2所述的基于数据分析的微生物功能因子评价方法,其特征在于,所述功能多样性系数的计算公式如下:
4.根据权利要求1所述的基于数据分析的微生物功能因子评价方法,其特征在于,所述确定微生物群落的功能因子,包括:
5.根据权利要求1所述的基于数据分析的微生物功能因子评价方法,其特征在于,所述功能特征匹配指数的计算公式如下:
6.根据权利要求1所述的基于数据分析的微生物功能因子评价方法,其特征在于,所述构建功能因子预测模型,包括:
7.基于数据分析的微生物功能因子评价系统,其基于权利要求1-6中任一项所述的基于数据分析的微生物功能因子评价方法实现,其特征在于,所述系统包括:
8.一种电子设备,包括:处理器和存储器,其中,所述存储器中存储有可供处理器调用的计算机程序;其特征在于,所述处理器通过调用所述存储器中存储的计算机程序,执行如权利要求1-6任一项所述的基于数据分析的微生物功能因子评价方法。
9.一种计算机可读存储介质,其特征在于,储存有指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1-6任一项所述的基于数据分析的微生物功能因子评价方法。