基于深度学习的蛋白质接触图谱用于变体致病性预测的用途的制作方法

文档序号:36997301发布日期:2024-02-09 12:39阅读:来源:国知局

技术特征:

1.一种变体致病性分类器,所述变体致病性分类器包括:

2.根据权利要求1所述的变体致病性分类器,其中所述存储器存储所述蛋白质的逐氨基酸灵长类动物保守谱、所述蛋白质的逐氨基酸哺乳动物保守谱和所述蛋白质的逐氨基酸脊椎动物保守谱,并且

3.根据权利要求1或2所述的变体致病性分类器,其中所述参考氨基酸序列具有l个氨基酸,其中所述替代氨基酸序列具有l个氨基酸。

4.根据权利要求1至3中任一项所述的变体致病性分类器,其中所述参考氨基酸序列被表征为大小为l×c的参考独热编码矩阵,其中c表示二十个氨基酸类别,其中所述替代氨基酸序列被表征为大小为l×c的替代独热编码矩阵。

5.根据权利要求2至4中任一项所述的变体致病性分类器,其中所述逐氨基酸灵长类动物保守谱的大小为l×c,其中所述逐氨基酸哺乳动物保守谱的大小为l×c,并且其中所述逐氨基酸脊椎动物保守谱的大小为l×c。

6.根据权利要求1至5中任一项所述的变体致病性分类器,其中所述第一神经网络是第一卷积神经网络。

7.根据权利要求6所述的变体致病性分类器,其中所述第一卷积神经网络包括(i)一个或多个一维(1d)卷积层,随后是(ii)具有1d卷积的第一组残差块,随后是(iii)具有1d卷积的第二组残差块,随后是(iv)空间维度增强层,随后是(v)具有二维(2d)卷积的第一组残差块,随后是(vi)一个或多个2d卷积层,随后是(vii)一个或多个完全连接的层,以及随后是(viii)致病性指示生成层。

8.根据权利要求6或7所述的变体致病性分类器,其中由所述一个或多个1d卷积层中的第一1d卷积层处理的输入的空间维度为l×1。

9.根据权利要求7或8所述的变体致病性分类器,其中由所述第一1d卷积处理的所述输入的深度维度为d,其中d=c+c+c+c+c。

10.根据权利要求7至9中任一项所述的变体致病性分类器,其中具有1d卷积的所述第一组残差块具有n1个残差块,具有1d卷积的所述第二组残差块具有n2个残差块,并且具有2d卷积的所述第一组残差块具有n3个残差块。

11.根据权利要求7至10中任一项所述的变体致病性分类器,其中具有1d卷积的所述第二组残差块中的最终残差块的输出由空间维度增强层处理以生成空间增强输出。

12.根据权利要求11所述的变体致病性分类器,其中所述空间维度增强层被配置为对所述最终残差块的所述输出应用外积以生成所述空间增强输出。

13.根据权利要求11或12所述的变体致病性分类器,其中所述空间增强输出的空间维度为l×l。

14.根据权利要求11至13中任一项所述的变体致病性分类器,其中将所述空间增强输出与所述蛋白质接触图谱组合以生成中间组合输出。

15.根据权利要求14所述的变体致病性分类器,其中所述中间组合输出由具有2d卷积的所述第一组残差块中的第一残差块处理。

16.根据权利要求1至15中任一项所述的变体致病性分类器,其中由第二神经网络响应于处理(ii)逐氨基酸蛋白质二级结构谱、(iii)逐氨基酸溶剂可及性谱、(iv)逐氨基酸位置特异性评分矩阵和(v)逐氨基酸位置特异性频率矩阵中的至少一者以及(i)所述参考氨基酸序列而生成所述蛋白质接触图谱。

17.根据权利要求1至16中任一项所述的变体致病性分类器,其中所述蛋白质接触图谱的总维度为l×l×k。

18.根据权利要求16或17所述的变体致病性分类器,其中所述第二神经网络是第二卷积神经网络。

19.根据权利要求18所述的变体致病性分类器,其中所述第二卷积神经网络包括(i)一个或多个1d卷积层,随后是(ii)具有1d卷积的一个或多个残差块,随后是(iii)空间维度增强层,随后是(iv)具有2d卷积的一个或多个残差块,以及随后是(v)一个或多个2d卷积层。

20.根据权利要求1至19中任一项所述的变体致病性分类器,其中所述第一神经网络的多个训练实例被用作推理期间变体致病性预测的集合。

21.一种计算机实施的变体致病性分类方法,所述计算机实施的变体致病性分类方法包括:

22.根据权利要求21所述的计算机实施的方法,所述计算机实施的方法还包括存储所述蛋白质的逐氨基酸灵长类动物保守谱、所述蛋白质的逐氨基酸哺乳动物保守谱和所述蛋白质的逐氨基酸脊椎动物保守谱,以及

23.根据权利要求21或22所述的计算机实施的方法,其中所述参考氨基酸序列具有l个氨基酸,其中所述替代氨基酸序列具有l个氨基酸。

24.根据权利要求21至23中任一项所述的计算机实施的方法,其中所述参考氨基酸序列被表征为大小为l×c的参考独热编码矩阵,其中c表示二十个氨基酸类别,其中所述替代氨基酸序列被表征为大小为l×c的替代独热编码矩阵。

25.根据权利要求21至24中任一项所述的计算机实施的方法,其中所述第一神经网络是第一卷积神经网络。

26.根据权利要求25所述的计算机实施的方法,其中所述第一卷积神经网络包括(i)一个或多个一维(1d)卷积层,随后是(ii)具有1d卷积的第一组残差块,随后是(iii)具有1d卷积的第二组残差块,随后是(iv)空间维度增强层,随后是(v)具有二维(2d)卷积的第一组残差块,随后是(vi)一个或多个2d卷积层,随后是(vii)一个或多个完全连接的层,以及随后是(viii)致病性指示生成层。

27.根据权利要求25或26所述的计算机实施的方法,其中由所述一个或多个1d卷积层中的第一1d卷积层处理的输入的空间维度为l×1。

28.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质施加有计算机程序指令以分类变体的致病性,所述指令在处理器上执行时实施一种方法,所述方法包括:

29.根据权利要求28所述的非暂态计算机可读存储介质,实施所述方法还包括存储所述蛋白质的逐氨基酸灵长类动物保守谱、所述蛋白质的逐氨基酸哺乳动物保守谱和所述蛋白质的逐氨基酸脊椎动物保守谱,以及

30.根据权利要求28或29所述的非暂态计算机可读存储介质,其中所述参考氨基酸序列具有l个氨基酸,其中所述替代氨基酸序列具有l个氨基酸。


技术总结
本发明所公开的技术涉及变体致病性分类器。该变体致病性分类器包括存储器和运行时逻辑。该存储器存储(i)蛋白质的参考氨基酸序列,(ii)含有由变体核苷酸引起的变体氨基酸的该蛋白质的替代氨基酸序列和(iii)该蛋白质的蛋白质接触图谱。该运行时逻辑能够访问存储器,并且被配置为提供(i)该参考氨基酸序列、(ii)该替代氨基酸序列和(iii)该蛋白质接触图谱作为第一神经网络的输入,以及使该第一神经网络响应于处理(i)该参考氨基酸序列、(ii)该替代氨基酸序列和(iii)该蛋白质接触图谱而生成该变体氨基酸的致病性指示作为输出。

技术研发人员:C·陈,H·高,L·孙达拉姆,K-H·法尔
受保护的技术使用者:因美纳有限公司
技术研发日:
技术公布日:2024/2/8
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1