本发明涉及生物信息学、计算生物学与人工智能交叉的,尤其是涉及基于矩阵补全的抗病毒药物筛选方法、系统及存储介质。
背景技术:
1、按常规方法研发药物可能需要耗时十多年、耗资数十亿美元,在短时间内开发出一种有效抗病毒药物是极为困难的。考虑到已成熟的药品,其有效性、安全性和毒性都是经过测试的,于是“老药新用”,从已经应用的药品中寻找有效方案是应对突发疫情的一种高效解决方法。
2、抗病毒药物筛选方法已有报道,其中一类是基于结构的虚拟筛选方法,如使用动力学模拟技术,计算潜在药物和靶标间的结合能力,通过分子动力学模拟计算药物的吸收、分布、代谢、排泄和毒性等。此类方法通常存在模拟过程复杂、对使用者经验要求高等不足。国防科技大学天河超算团队提出了基于自由能微扰-绝对结合自由能方法的新冠药物虚拟筛选技术,但这种基于自由能的大规模筛选,对算力要求较高,需要借助超级计算机平台,且耗时以周计算。
技术实现思路
1、本发明提供基于矩阵补全的抗病毒药物筛选方法、系统及存储介质,可以根据病毒-药物关联数据,准确高效地预测抗病毒相关药物。
2、本说明书实施例的第一方面公开了基于矩阵补全的抗病毒药物筛选方法,包括如下步骤:
3、s1.构建病毒-药物关联的邻接矩阵;
4、s2.基于所述病毒-药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;
5、s3.基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;
6、s4.基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;
7、s5.基于所述病毒-药物关联的邻接矩阵、病毒整合相似矩阵和药物整合相似矩阵,使用非负矩阵分解的矩阵补全方法,构造损失函数;
8、s6.求解所述损失函数,得到病毒-药物预测得分矩阵;
9、s7.基于所述病毒-药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果。
10、在本说明书公开的实施例中,在s1中:
11、输入已知的病毒-药物关联对,构建病毒-药物关联的邻接矩阵a;
12、若为已知关联对,则对应位置为1,否则为0;
13、所述邻接矩阵a的行数为病毒数量nv,列数为药物数量nd。
14、在本说明书公开的实施例中,在s2中:
15、若药物d(i)与某个病毒之间存在关联,则对应位置记为1,否则记为0,形成一个1×nv大小的0或1构成的向量,记之为药物d(i)的向量谱ip(d(i)),然后计算药物d(i)和d(j)之间的高斯距离相似性:
16、;
17、上式中,参数γd用于控制核带宽,通过归一化新带宽参数γ’d获得:
18、;
19、以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性,得到1×nd大小的0或1构成的向量,记之为病毒v(i)的向量谱ip(v(i)),计算病毒v(i)和v(j)之间的高斯距离相似性:
20、;
21、参数γv用于控制核带宽,通过归一化新带宽参数γ’v获得:
22、;
23、以上γ’d和γ’v都是常数。
24、在本说明书公开的实施例中,在s3中:
25、基于病毒基因组序列,使用多序列比方法计算病毒基因序列相似矩阵;
26、基于药物的化学结构,得到药物maccs指纹,采用谷本系数(tanimotocoefficient,即jaccard相似度)计算药物化学结构相似矩阵。
27、在本说明书公开的实施例中,在s4中:
28、所述快速核学习方法的半正定规划式为:
29、;
30、式中,第一项为重构损失范数项,表示相似矩阵的整合误差大小;第二项为正则化项,作用是避免过拟合;其中a为病毒-药物关联邻接矩阵,sjv(j=1,2)分别表示病毒高斯距离相似矩阵和病毒基因序列相似矩阵,μv为正则化参数,λv∈r1×2为待求解的系数,通过λv得到病毒整合相似矩阵:
31、;
32、同理,按照上述可获得药物化学结构相似矩阵与药物高斯距离相似矩阵集成参数λd∈r1×2,然后计算药物整合相似矩阵:
33、;
34、其中sjd(j=1,2)分别表示药物高斯距离相似矩阵和药物化学结构相似矩阵。
35、在本说明书公开的实施例中,在s5中:
36、使用非负矩阵分解的矩阵补全方法构造的损失函数如下:
37、;
38、;
39、式中部分是重建损失项,其中a∈rnv×nd是已知的病毒-药物关联的邻接矩阵,nv和nd分别为病毒的数量和药物的数量;矩阵i为全1矩阵,c表示矩阵a待补全部分,w和h为待求解的基矩阵和系数矩阵,部分是f范数项,约束矩阵c防止过拟合;其余部分是流形约束项,(wh)i和(wh)j分别代表wh的第i和j行,(wh)p和(wh)q分别代表wh的第p和q列;sv(i,j)表示病毒整合相似矩阵的第(i,j)个元素,sd(p,q)表示病毒整合相似矩阵的第(p,q)个元素;λc、λv和λd是正则化参数。
40、在本说明书公开的实施例中,在s6中:
41、求解所述构造损失函数时,分别固定其中一个变量,然后求导数令之为0再反解,得矩阵p、q、c、w和h的迭代求解公式,具体如下:
42、p=hht;
43、q=wh;
44、c*=(i−a)⊙c;
45、;
46、;
47、;
48、其中⊙表示两个矩阵的hadamard乘积;,,dd或dv为对角矩阵,其元素为矩阵sd或sv按列求和再对角化;更新以上矩阵直到收敛。
49、本发明实施例的第二方面公开了基于矩阵补全的抗病毒药物筛选系统,包括:
50、邻接矩阵构建模块,用于构建病毒-药物关联的邻接矩阵;
51、高斯距离相似矩阵计算模块,用于基于所述病毒-药物关联的邻接矩阵,计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;
52、病毒基因序列相似矩阵与药物化学结构相似矩阵计算模块,用于基于病毒基因组序列计算病毒基因序列相似矩阵,基于药物化学结构计算药物化学结构相似矩阵;
53、整合相似矩阵计算模块,用于基于所述病毒高斯距离相似矩阵和病毒基因序列相似矩阵,使用快速核学习方法,整合得到病毒整合相似矩阵;基于所述药物高斯距离相似矩阵和药物化学结构相似矩阵,使用快速核学习方法,整合得到药物整合相似矩阵;
54、损失函数构造模块,用于基于所述病毒-药物关联的邻接矩阵、病毒整合相似矩阵和药物整合相似矩阵,使用非负矩阵分解的矩阵补全方法,构造损失函数;
55、损失函数求解模块,用于求解所述损失函数,得到病毒-药物预测得分矩阵;
56、预测模块,用于基于所述病毒-药物预测得分矩阵,筛选出目标病毒所在行的得分,排序后得到最终预测结果。
57、在本说明书公开的实施例中,所述基于矩阵补全的抗病毒药物筛选系统还包括:
58、处理器,分别与所述邻接矩阵构建模块、高斯距离相似矩阵计算模块、病毒基因序列相似矩阵与药物化学结构相似矩阵计算模块、整合相似矩阵计算模块、损失函数构造模块、损失函数求解模块和预测模块连接;
59、存储器,与所述处理器连接,并存储有可在所述处理器上运行的计算机程序;
60、其中,当所述处理器执行所述计算机程序时,所述处理器控制所述邻接矩阵构建模块、高斯距离相似矩阵计算模块、病毒基因序列相似矩阵与药物化学结构相似矩阵计算模块、整合相似矩阵计算模块、损失函数构造模块、损失函数求解模块和预测模块工作,以实现上述中任意一项所述的基于矩阵补全的抗病毒药物筛选方法。
61、本发明实施例的第三方面公开了一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取所述计算机指令时,所述计算机执行上述中任意一项所述的基于矩阵补全的抗病毒药物筛选方法。
62、综上所述,本发明至少具有以下有益效果:
63、本发明构通过构建病毒-药物关联的邻接矩阵,分别计算病毒高斯距离相似矩阵和药物高斯距离相似矩阵;使用病毒基因组序列计算病毒基因序列相似矩阵,使用药物的化学结构信息计算药物化学结构相似矩阵;使用快速核学习法计算病毒整合相似矩阵、药物整合相似矩阵;结合非负矩阵分解、矩阵补全与图正则化方法构建损失函数,迭代求解得到病毒-药物关联预测得分矩阵,筛选、排序得到最终结果。本发明能快速、高效地筛选出病毒有效治疗药物,弥补生物医学实验方法耗时长、成本高的不足,为特定情况下应急解决方案提供了思路。