基于CUDA的基因数据处理方法、装置和CUDA构架与流程

文档序号:29404597发布日期:2022-03-26 10:18阅读:来源:国知局

技术特征:
1.一种基于cuda的基因数据处理方法,其特征在于,所述cuda包括主机端和设备端,所述方法应用于所述设备端;所述方法包括:从所述主机端的内存中获取待处理的基因测序数据;将所述待处理的基因测序数据存储于资源池;采用graph方法从所述资源池中获取所述待处理的基因测序数据,并采用多线程并行方式对所述待处理的基因测序数据进行分析,得到相应的分析结果;将所述相应的分析结果发送至所述主机端,以供所述主机端根据所述相应的分析结果得到基因数据分析结果。2.根据权利要求1所述的方法,其特征在于,所述设备端包括多个gpu;所述采用graph方法从所述资源池中获取所述待处理的基因测序数据,并采用多线程并行方式对所述待处理的基因测序数据进行分析,得到相应的分析结果,包括:任一个空闲状态的gpu采用所述graph方法确定各空闲状态的gpu的数据资源分配方案;各所述空闲状态的gpu根据所述数据资源分配方案从所述述待处理的基因测序数据获取相应的基因数据资源,并对所基因数据资源采用多线程并行方式进行分析,得到相应的分析结果;其中所述基因数据资源为所述待处理的基因测序数据中的一部分基因测试数据。3.根据权利要求2所述的方法,其特征在于,所述对所基因数据资源采用多线程并行方式进行分析,包括:对所述基因数据资源采用多线程并行方式依次进行质控分析和变异检测分析。4.根据权利要求3所述的方法,其特征在于,所述对所述基因数据资源采用多线程并行方式进行质控分析,包括:对所述基因数据资源进行切分处理,以得到各短序列;对已有的变异位点数据库进行统计分析,得到变异分布;判断各短序列的碱基质量值,当任一短序列的碱基质量值大于或等于预设值,且任一所述短序列锚定到变异分布的密集区域时,采用可变k-mer对任一所述短序列进行比对匹配;或且任一所述短序列锚定到变异分布的稀疏区域时,采用恒定k-mer对任一所述短序列进行比对匹配;当任一短序列的碱基质量值小于预设值,对任一短序列进行过滤,并对过滤后的短序列进行比对;对比对结果进行排序和去重;判断去重后的比对结果的碱基质量值,当碱基质量值小于预设值时,对所述去重后的比对结果进行碱基质量值校正。5.根据权利要求4所述的方法,其特征在于,所述对所述基因数据资源采用多线程并行方式进行变异检测分析,包括:采用多线程并行方式查找各短序列的活性区域;对各所述活性区域进行重比对和局部组装;对重比对和局部组装后的各活性区域进行相似度计算和注释,以得到变异结果。6.根据权利要求1-5任一项所述的方法,其特征在于,所述将所述待处理的基因测序数
据存储于资源池,包括:采用环形缓存的方式将所述待处理的基因测序数据存储于资源池。7.根据权利要求1-5任一项所述的方法,其特征在于,所述从所述主机端的内存中获取待处理的基因测序数据,包括:获取所述资源池的空闲情况;根据所述资源池的空闲情况所述主机端的内存中获取相应数量的待处理的基因测序数据。8.一种基于cuda的基因数据处理装置,其特征在于,所述cuda包括主机端和设备端,所述装置应用于所述设备端;所述装置包括:数据获取模块,用于从所述主机端的内存中获取待处理的基因测序数据;数据存储模块,用于将所述待处理的基因测序数据存储于资源池;数据分析模块,用于采用graph方法从所述资源池中获取所述待处理的基因测序数据,并采用多线程并行方式对所述待处理的基因测序数据进行分析,得到相应的分析结果;结果发送模块,用于将所述相应的分析结果发送至所述主机端,以供所述主机端根据所述相应的分析结果得到基因数据测试结果。9.一种cuda构架,其特征在于,包括主机端和设备端;所述设备端包括资源池和多个gpu;所述主机端用于在内存空闲时存储待处理的基因测序数据,并在所述设备端的资源池空闲时将所述待处理的基因测试数据发送至所述设备端;空闲状态的所述gpu用于执行如权利要求1-7任一项所述的方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1-7任一项所述的方法。

技术总结
本申请提供了一种基于CUDA的基因数据处理方法、装置、设备和存储介质,其中CUDA包括主机端和设备端,主机端可以将存储于内存中的待处理的基因测序数据发送至设备端,设备端将待处理的基因测序数据存储于资源池,然后设备端采用Graph方法从资源池中获取待处理的基因测序数据,并采用多线程并行方式对待处理的基因测序数据进行分析,得到相应的分析结果,并将相应的分析结果发送至主机端,以供主机端根据相应的分析结果得到基因数据分析结果。该基因数据处理方法采用基于CUDA的Graph技术来对基因数据进行处理分析,可以实现GPU高效比对以及降低了GPU的延时,从而能大大提高基因数据处理的效率。处理的效率。处理的效率。


技术研发人员:杨姣博 张优劲 贺增泉 郑淇文
受保护的技术使用者:深圳华大医学检验实验室
技术研发日:2021.12.23
技术公布日:2022/3/25
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1