一种功能性基因变异位点的优选方法及系统

文档序号:36330463发布日期:2023-12-10 06:01阅读:76来源:国知局
一种功能性基因变异位点的优选方法及系统

本发明涉及基因位点选取领域,特别是涉及一种功能性基因变异位点的优选方法及系统。


背景技术:

1、绝大多数基因变异位点处于非编码区,往往通过调控附近基因的表达水平发挥功能。然而,转录调控存在明显的组织细胞特异性,这给明确有调控作用的“功能位点”带来了挑战。

2、现有的位点功能性优选方法包括表达数量性状基因座(expressionquantitative trait loci,eqtl)和染色质互作(chromatin interaction)等,然而这些方法均基于大块组织(bulk tissue)而非特定的细胞类型,忽略了位点功能所存在的显著细胞类型异质性,从而导致优选效率一直不理想,长期低于40%。

3、单细胞和功能组学技术的发展,极大地丰富了可测绘的生物学层次和尺度,为优选功能位点提供了新的思路。一方面,以单细胞scatac-seq等为代表的功能组学技术,能够描绘全基因组范围的染色质可及性分布,从而推测基因组中存在调控功能的区域,以及不同细胞类型间的调控异质性。另一方面,以单细胞enhancer-gene关联调控为代表的功能组学联合分析技术,能够描绘基因表达模式与变异位点的关联性,从而推测受到可调控基因表达的功能位点。

4、但是,如何有效定位人类基因组中存在功能的位点,提高优选效率,为人类疾病的药物研发提供可靠的新靶点,至关重要。


技术实现思路

1、本发明的目的是提供一种功能性基因变异位点的优选方法及系统,能够提高功能性基因变异位点的优选效率。

2、为实现上述目的,本发明提供了如下方案:

3、一种功能性基因变异位点的优选方法,所述方法包括:

4、获取全基因组范围染色质的可及性分布信息;所述可及性分布信息包括:可及性区域内的碱基序列排列信息和各个碱基的基因组位置信息;

5、采用卷积块对所述可及性分布信息进行转换处理,得到可及性特征值;

6、基于调控图谱确定全基因组范围内的基因组信息;所述调控图谱中的每个坐标与全基因组范围内的每个基因组一一对应;所述基因组信息包括:是否为调控区域、组蛋白修饰值、转录因子结合力差异值和转录活性值;

7、根据所述可及性特征值和所述基因组信息确定初始权重值集;所述初始权重值集为所述可及性特征值和所述基因组信息各自对应的初始权重值的集合;

8、将所述可及性特征值、所述基因组信息和所述初始权重值集输入至位点优选模型,输出优选信息;所述优选信息包括:优选的功能性基因变异位点信息和调控的易感基因信息;优选的功能性基因变异位点信息包括:满足设定阈值条件下的位点变异碱基以及对应的位点坐标;调控的易感基因信息是基于调控图谱,确定优选的功能性基因变异位点所调控的基因;易感基因信息包括:基因通用名称和对应的基因组起止位置;

9、其中,所述位点优选模型包括指标计算模型、验证模型、权重调整模型和输出模型;

10、所述指标计算模型用于按照设定基因组区域长度和设定步长,根据所述可及性特征值、所述基因组信息和所述初始权重值集确定指标值;

11、所述验证模型用于根据金标准的评估指标确定所述指标值的预测能力;所述评估指标包括:准确性,特异性和敏感性;

12、所述权重调整模型用于:

13、根据所述验证模型中的评估指标值判断是否进行权重调整;

14、若所述评估指标值不在所述设定阈值条件范围内,则对所述初始权重值集中的各个初始权重值按照设定顺序进行优化调整,直至所述评估指标值满足设定阈值条件;

15、若所述评估指标值在所述设定阈值条件范围内,则将达到阈值条件的评估指标值对应的功能性基因变异位点信息输送至所述输出模型;

16、所述输出模型用于将所述功能性基因变异位点信息和调控的易感基因信息输出,得到优选信息。

17、可选地,采用卷积块对所述可及性分布信息进行转换处理,得到可及性特征值,具体包括:

18、基于可及性区域内的碱基序列排列信息和各个碱基的基因组位置信息,确定矩阵信息;

19、根据所述矩阵信息和设定染色质可及性值,确定输入矩阵;

20、采用卷积块对所述输入矩阵进行标准化以及最大池化处理,得到可及性特征值。

21、可选地,根据所述可及性特征值和所述基因组信息确定初始权重值集,具体包括:

22、根据所述可及性特征值和所述基因组信息进行融合,得到融合的模态值;

23、基于统计分布,根据融合的模态值,采用正则归一化方法进行归一化计算,得到初始权重值集。

24、一种功能性基因变异位点的优选系统,所述系统用于实现上述所述的功能性基因变异位点的优选方法,所述系统包括:

25、获取模块,用于获取全基因组范围染色质的可及性分布信息;所述可及性分布信息包括:可及性区域内的碱基序列排列信息和各个碱基的基因组位置信息;

26、转换处理模块,用于采用卷积块对所述可及性分布信息进行转换处理,得到可及性特征值;

27、信息确定模块,用于基于调控图谱确定全基因组范围内的基因组信息;所述调控图谱中的每个坐标与全基因组范围内的每个基因组一一对应;所述基因组信息包括:是否为调控区域、组蛋白修饰值、转录因子结合力差异值和转录活性值;

28、初始权重值集确定模块,用于根据所述可及性特征值和所述基因组信息确定初始权重值集;所述初始权重值集为所述可及性特征值和所述基因组信息各自对应的初始权重值的集合;

29、输出模块,用于将所述可及性特征值、所述基因组信息和所述初始权重值集输入至位点优选模型,输出优选信息;所述优选信息包括:优选的功能性基因变异位点信息和调控的易感基因信息;优选的功能性基因变异位点信息包括:满足设定阈值条件下的位点变异碱基以及对应的位点坐标;调控的易感基因信息是基于调控图谱,确定优选的功能性基因变异位点所调控的基因;易感基因信息包括:基因通用名称和对应的基因组起止位置;

30、其中,所述位点优选模型包括指标计算模型、验证模型、权重调整模型和输出模型;

31、所述指标计算模型用于按照设定基因组区域长度和设定步长,根据所述可及性特征值、所述基因组信息和所述初始权重值集确定指标值;

32、所述验证模型用于根据金标准的评估指标确定所述指标值的预测能力;所述评估指标包括:准确性,特异性和敏感性;

33、所述权重调整模型用于:

34、根据所述验证模型中的评估指标值判断是否进行权重调整;

35、若所述评估指标值不在所述设定阈值条件范围内,则对所述初始权重值集中的各个初始权重值按照设定顺序进行优化调整,直至所述评估指标值满足设定阈值条件;

36、若所述评估指标值在所述设定阈值条件范围内,则将达到阈值条件的评估指标值对应的功能性基因变异位点信息输送至所述输出模型;

37、所述输出模型用于将所述功能性基因变异位点信息和调控的易感基因信息输出,得到优选信息。

38、可选地,所述转换处理模块包括:

39、矩阵信息确定子模块,用于基于可及性区域内的碱基序列排列信息和各个碱基的基因组位置信息,确定矩阵信息;

40、输入矩阵确定子模块,用于根据所述矩阵信息和设定染色质可及性值,确定输入矩阵;

41、可及性特征值确定子模块,用于采用卷积块对所述输入矩阵进行标准化以及最大池化处理,得到可及性特征值。

42、可选地,所述初始权重值集确定模块包括:

43、融合子模块,用于根据所述可及性特征值和所述基因组信息进行融合,得到融合的模态值;

44、计算子模块,用于基于统计分布,根据融合的模态值,采用正则归一化方法进行归一化计算,得到初始权重值集。

45、一种电子设备,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行上述所述的功能性基因变异位点的优选方法。

46、一种存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的功能性基因变异位点的优选方法。

47、根据本发明提供的具体实施例,本发明公开了以下技术效果:

48、本发明提供了一种功能性基因变异位点的优选方法及系统,通过获取全基因组范围染色质的可及性分布信息;基于可及性分布信息采用卷积块进行转换处理,得到可及性特征值;基于调控图谱确定全基因组范围内的基因组信息;根据可及性特征值和基因组信息确定初始权重值集;初始权重值集为可及性特征值和基因组信息各自对应的初始权重值的集合;将可及性特征值、基因组信息和初始权重值集输入至位点优选模型,输出优选的功能性基因变异位点信息与其调控的易感基因信息;优选的功能性基因变异位点信息包括:满足设定阈值条件下的位点变异碱基以及对应的位点坐标,以提高功能性基因变异位点的优选效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1