一种基于转录组快速获取无基因组物种目标基因家族的方法

文档序号:35846005发布日期:2023-10-25 17:18阅读:来源:国知局

技术特征:

1.一种快速获取无基因组物种的目标基因家族的方法,其特征在于,包括以下步骤:

2.如权利要求1所述的方法,其特征在于,步骤(1)还包括确定参照物种的目标基因家族的成员类型;所述系列模式物种包括至少十种具有全基因组数据,且都具有目标基因家族的物种;所述参照物种为系列模式物种中的一种。

3.如权利要求2所述的方法,其特征在于,步骤(1)所述通过bioedit软件构建本地数据库,包括通过bioedit软件的blastp程序从系列模式物种的基因组数据中获取目标基因家族的氨基酸序列及相应核苷酸序列,通过bioedit软件的blastx和blastp程序从待测物种的转录组数据中获得目标基因家族的氨基酸序列及相应核苷酸序列。

4.如权利要求3所述的方法,其特征在于,所述使用blastp程序时,需设置参数expectation value为10-3,设置同源性为40%,搜索结果还需去重,使每条氨基酸序列只保留唯一编号。

5.如权利要求4所述的方法,其特征在于,通过bioedit软件构建本地数据库后,还需使用pfam31.0进行蛋白结构域完整度的鉴定,使系列模式物种和待测物种的目标基因家族的蛋白结构域达到100%完整。

6.如权利要求1~5任一项所述的方法,其特征在于,步骤(2)所述mega6软件构建进化树,需先导入系列模式物种和待测物种的氨基酸序列,选择phylogeny中neighbor-joiningtree,参数设置bootstrap为1000。

7.如权利要求6所述的方法,其特征在于,步骤(2)所述mega6软件构建进化树时,如2条氨基酸序列的分支数值为100且属于同一物种,需进行单独氨基酸序列比对;单独氨基酸序列比对过程中,如2条氨基酸序列相似度超99%,则去掉其中1条,如未达到99%则全部保留;剩余氨基酸序列再次导入mega6软件构建进化树。

8.如权利要求7所述的方法,其特征在于,步骤(3)所述的利用meme在线分析软件进行motif分析,以参照物种作为参照对象,通过保守motif来进行鉴定和分类,区分待测物种的目标基因家族内部成员类型。

9.如权利要求8所述的方法,其特征在于,步骤(4)所述的氨基酸序列单独比对,是指针对在进化树上分类距离接近的氨基酸序列,在motif分析时,应该具有一致的保守motif,否则需单独对比氨基酸序列,检查序列的完整性、排除拼接错误,进一步验证家族成员分类的准确性。

10.一种软件的组合用于快速获取无基因组物种的目标基因家族的用途,其特征在于,所述软件组合包括bioedit软件、mega6软件和meme在线分析软件。


技术总结
本发明提供了一种基于转录组快速获取无基因组物种的目标基因家族的方法,通过选取参照物种、系列模式物种,并基于目标转录组数据,组合使用基因搜索比对软件Bioedit、进化树构建软件MEGA6和在线分析软件MEME,构建了一种可视化、不需要专业的生物信息学知识,也无需使用R语言等软件平台、运算代码撰写的,针对无基因组物种,快速、高效、准确、全面地获取目标基因家族的所有序列的方法。本发明采用该方法成功获得杭白菊的PEBP基因家族所有序列,并经一代测序验证,准确率为100%。

技术研发人员:潘铖,钮羽群,夏露霞,何雪怡
受保护的技术使用者:中国计量大学
技术研发日:
技术公布日:2024/1/15
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1