本发明涉及生物检测技术领域,特别涉及一种基于smrt高通量测序技术的菌群多样性组成谱数据分析方法。
背景技术:
以pacbio公司的rsii和最新的sequel测序系统为代表的第三代测序技术,通过smrt单分子实时测序技术(singlemoleculereal-timesequencing),可以对dna序列实现单分子级别的超长读长测序,因而能够轻易读取微生物的rrna基因/its全长序列,不再受制于短序列的局限性,更全面的揭示物种多样性;其次,通过pacbio所独有的环形一致性测序模式(circular-consensussequence,ccs),可以极大地提高单碱基测序的准确率,远超二代测序的准确率,从而充分保障获得的rrna基因/its全长序列的精确性。基于以上两点,pacbio的smrt测序技术能够大大提高我们在种甚至菌株等精细水平解析菌群多样性和组成谱的能力。
通过开发基于smrt高通量测序技术的菌群多样性组成谱数据分析流程,可以深入获取微生物群落的精细组成信息,从而更精准地鉴定与表型/组间差异相关的关键物种。
技术实现要素:
本发明所要解决的技术问题在于提供一种基于smrt高通量测序技术的菌群多样性组成谱数据分析方法。
本发明所要解决的技术问题可以通过以下技术方案来实现:
一种基于smrt高通量测序技术的菌群多样性组成谱数据分析方法,具体包括如下步骤:
(1)首先对smrt高通量测序的原始下机数据(polymerasereads)根据序列质量进行初步筛查,并进行ccs序列的校正过滤;
(2)通过质量初筛的序列按照引物和barcode信息,识别分配入对应样本,并去除嵌合体序列;
(3)对获得的序列进行otu归并划分,每个otu的代表序列用于分类地位鉴定以及系统发育学分析;
(4)根据otu在不同样本中的丰度分布,评估每个样本的多样性水平,并通过稀疏曲线反映测序深度是否达标;
(5)对各样本(组)在不同分类水平的具体组成进行分析(并检验组间是否具有统计学差异);
(6)通过多种多变量统计学分析工具,进一步衡量不同样本(组)间的菌群结构差异及与差异相关的物种;
(7)根据物种在各样本中的组成分布,构建互作关联网络;
(8)根据16srrna基因测序结果,还可预测各样本的菌群代谢功能。
(9)在以上结果的基础上,使用多种数据可视化和交互式工具,绘制具备论文发表水准的二维/三维图表,全方位、客观地呈现以上分析结果。
由于采用了如上的技术方案,本发明具有如下优点:
1.深入获取微生物群落的精细组成信息;
2.通过全微生物组关联研究,精准鉴定与表型/组间差异相关的关键物种。
具体实施方式
本发明一种基于smrt高通量测序技术的菌群多样性组成谱数据分析方法,具体包括如下步骤:
(1)首先对smrt高通量测序的原始下机数据(polymerasereads)根据序列质量进行初步筛查,并进行ccs序列的校正过滤;
(2)通过质量初筛的序列按照引物和barcode信息,识别分配入对应样本,并去除嵌合体序列;
(3)对获得的序列进行otu归并划分,每个otu的代表序列用于分类地位鉴定以及系统发育学分析;
(4)根据otu在不同样本中的丰度分布,评估每个样本的多样性水平,并通过稀疏曲线反映测序深度是否达标;
(5)对各样本(组)在不同分类水平的具体组成进行分析(并检验组间是否具有统计学差异);
(6)通过多种多变量统计学分析工具,进一步衡量不同样本(组)间的菌群结构差异及与差异相关的物种;
(7)根据物种在各样本中的组成分布,构建互作关联网络;
(8)根据16srrna基因测序结果,还可预测各样本的菌群代谢功能。
(9)在以上结果的基础上,使用多种数据可视化和交互式工具,绘制具备论文发表水准的二维/三维图表,全方位、客观地呈现以上分析结果。