技术特征:
1.一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法,其特征在于,包括以下步骤:s1:自油藏产出水样提取总dna和总rna;s2:对获得的总dna和总rna进行测序,获取油藏样品的宏基因组和宏转录组原始数据;s3:通过对宏基因组和宏转录组结果进行分析,识别具有驱油功能的微生物。2.根据权利要求1所述的一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法,其特征在于,s1中,在提取总dna和总rna之前,在待提取rna的样品中加入抑制剂以抑制厌氧微生物的rna降解。3.根据权利要求1所述的一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法,其特征在于,s2中,还包括:对油藏样品的宏基因组和宏转录组原始数据进行预处理,得到去除接头和低质量片段的目标数据;所述预处理的过程包括:利用fastp软件分别对对油藏样品的宏基因组和宏转录组中各dna或rna链序列双端的原始数据进行滑窗质量剪裁,同时,根据序列首尾两端的引物信息,利用cutadapt软件去除引物,得到质控后的双端序列数据。4.根据权利要求3所述的一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法,其特征在于,s3中,对宏基因组和宏转录组结果进行分析的过程包括:对质控后的双端序列数据进行组装、分箱并评估质量,去除冗余后提取其中高质量的mags数据集;根据构建的参考数据库对高质量的mags组装数据进行注释,识别出具有不同驱油功能的功能基因和mags,并计算对应的测序深度和相对丰度;对高质量的mags数据集做进化关系分析,进而做出驱油微生物的群落结构分析;将宏转录组测序得到的序列短片段质控过滤后与mags数据对比,计算出各个基因的转录水平。5.根据权利要求4所述的一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法,其特征在于,s3中,组装、分箱并评估质量的过程包括:组装:使用拼接程序spades在meta模式下,将质控后的双端序列数据样品短序列拼接成长度不一的contigs,然后根据双端测序的信息将不同contigs连接成有测序缺口的scaffolds;分箱:采用bowtie2软件将质控后的mags短序列数据信息比对到长序列信息上,获得不同长序列的测序覆盖度信息,进一步同时采用maxbin2、metabat2、concoct三种binning手段从mags中分离出优势菌的基因组,并进一步导入das_tool程序中进行评估,最终整合并提高不同方法生成基因组的质量;评估质量:利用drep软件将质控后的mags中相似度较高的基因组去除冗余,通过checkm工具根据基因组中单拷贝标记基因的有无和数量来估算基因组的完整度和污染度。6.根据权利要求4所述的一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法,其特征在于,s3中,对高质量的mags组装数据进行注释的过程包括:使用prodigal程序将拼接后的长序列翻译成编码蛋白序列,并提交到kegg数据库,采用ghostkoala工具进行功能性注释并获得代表不同旁系同源亚基的ko号;
同时采用本地软件kofamkoala根据各个ko旁系同源家族蛋白的隐马可夫模型和推荐的置信标准给各个蛋白序列注释ko号;最后采用eggnog emapper 2工具给蛋白序列注释cog号,再转换成ko号,使得最终每个蛋白质的ko号注释采用以下顺序:1)ghostkoala ko,2)kofamkoala ko,3)eggnog emapper ko。7.根据权利要求4所述的一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法,其特征在于,s3中,所述驱油功能包括烷烃降解、产气、产乳化剂、产表面活性剂、产多糖中的一种或多种。8.根据权利要求7所述的一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法,其特征在于,s3中,识别出具有不同驱油功能的功能基因和mags的过程包括:针对氢气还原酶,首先通过本地的氢气还原酶亚组的hmm模型比对找出潜在的功能基因蛋白;之后将潜在的功能基因蛋白序列提交到hyddb数据库的在线分析软件进一步划分氢气还原酶的亚型;针对基因组中潜在的编码次级代谢产物的功能,通过将基因组序列提交至antismash网站,结合不同的工具找到基因组中潜在编码次级代谢产物的基因组,并预测代谢产物的类型;针对数据库中信息缺少的功能基因,单独构建本地的蛋白序列数据库,通过blastp比对方法找到最相似的蛋白序列并进一步分析,所述数据库中信息缺少的功能基因包括厌氧烃降解初始活化基因assa、ebda、ahya、anca,和细菌微室蛋白簇基因中的一种或多种。9.根据权利要求4所述的一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法,其特征在于,s3中,对高质量的mags数据集做进化关系分析的过程包括:首先将目标序列以及数据库中的相似参比序列下载并合并文件,合并后的序列首先在mafft上排列整齐,并以80%的阈值来选择保守位点,进而使用iq-tree来两两比对序列并生成最大似然进化树。10.根据权利要求4所述的一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法,其特征在于,s3中,将宏转录组测序得到的序列短片段质控过滤后与mags数据对比,计算出各个基因的转录水平的过程包括:采用bowtie2软件将高质量的mags数据集中的cdna短片段比对到宏基因组,并拼接得到的dna长片段上,计算出各个基因的转录水平,以tpm值来表示。
技术总结
本发明涉及一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法,包括以下步骤:S1:自油藏产出水样提取总DNA和总RNA;S2:对获得的总DNA和总RNA进行测序,获取油藏样品的宏基因组和宏转录组原始数据;S3:通过对宏基因组和宏转录组结果进行分析,识别具有驱油功能的微生物。与现有技术相比,本发明不依赖传统的速度较慢的微生物单菌分离鉴定手段,适合处理未知物种较多的样本,且可检测极低丰度物种,检测全面、快速。快速。
技术研发人员:牟伯中 刘一凡 寿利斌
受保护的技术使用者:华东理工大学
技术研发日:2022.09.26
技术公布日:2023/2/3