用于分子结构推理的模型及方法与流程

文档序号:30071027发布日期:2022-05-18 02:04阅读:136来源:国知局
用于分子结构推理的模型及方法与流程

1.本技术实施例大体上涉及基于量子计算的化学领域,更具体地,涉及用于分子结构推理的模型及方法。


背景技术:

2.分子结构推理(例如逆合成分析)是目前有机合成路线设计的常用方法,具体方法可从目标分子的化学结构入手,将目标分子转化成一些稍小的中间分子,再以这些中间分子作为新的目标分子,将其拆分为更小的中间分子,以此类推,直至中间分子是当前可制备的物质,进而逆向得到目标分子的合成路线。由于当前的分子结构推理依赖于技术人员自身的知识和经验,因此在推理过程中往往需要产生较大的时间开销,并且难以确保推理的整体准确性。
3.自20世纪90年代以来,计算机技术、计算化学、分子生物学及生物信息等学科的发展,大大推动了计算机辅助化学药物分子逆合成处理的进步,许多计算机辅助化学药物分子结构的推理的方法不断涌现,比如基于多层神经网络的逆合成设计,不过当前的方法推理速度慢,精确度低,而基于量子循环神经网络的分子结构推理方法确保了推理的整体准确性并减少分析过程中的时间开销,但目前相关研究较少。
4.因此,本技术提出一种用于分子结构推理的模型及方法。


技术实现要素:

5.本技术实施例的目的之一在于提供一种用于分子结构推理的模型及方法,与传统的方法与模型相比,其可减少所使用的参数量,且所用的存储介质,即量子比特数目也大幅减少。
6.本技术的一实施例提供一种用于分子结构推理的模型,其包括:量子编码线路,其经配置通过第一量子门控循环单元qu-gru将待输入分子结构序列转化为第一向量;以及量子解码线路,其经配置通过第二qu-gru将所述第一向量转化为与待输入分子结构序列相应的化合物结构,其中第一qu-gru和第二qu-gru中的每一者包括一或多个量子门控循环线路。
7.根据本技术的实施例,量子门控循环线路包括6个具有不同参数的量子变分线路以进行线性变换操作。
8.根据本技术的一些实施例,量子变分线路包括:第一量子线路,其经构建以将待输入数据编码为量子态;第二量子线路,其具有可训练的参数,且作用于该量子态;以及量子测量层,其对全部或部分量子比特进行测量。
9.根据本技术的一些实施例,将待输入数据编码为量子态包括将待输入数据编码为等权重叠加态。
10.根据本技术的一些实施例,将待输入数据编码为量子态包括生成两个旋转角度。
11.根据本技术的一些实施例,将所述待输入数据编码为量子态还包括对每个量子比
特将经生成的两个旋转角度的旋转操作分别施加在y轴和z轴方向上。
12.根据本技术的一些实施例,第二量子线路包括控制非门和单比特旋转门。
13.本技术的另一实施例提供一种用于化合物合成的模型,其包括上述用于分子结构推理的模型。
14.本技术的另一实施例还提供一种用于分子结构推理的方法,其使用上述用于分子结构推理的模型。
15.与现有技术相比,本技术实施例提供的用于分子结构推理的模型及方法,利用量子计算对经典计算方式作为补充,可有效提高数据处理速度与准确度。
附图说明
16.在下文中将简要地说明为了描述本技术实施例或现有技术所必要的附图以便于描述本技术的实施例。显而易见地,下文描述中的附图仅只是本技术中的部分实施例。对本领域技术人员而言,在不需要创造性劳动的前提下,依然可以根据这些附图中所例示的结构来获得其他实施例的附图。
17.图1为根据本技术一些实施例的用于分子结构推理的模型示意图。
18.图2为根据本技术一些实施例的量子变分线路的示意图。
19.图3为根据本技术另一些实施例的量子变分线路的示意图。
具体实施方式
20.为更好的理解本技术实施例的精神,以下结合本技术的部分优选实施例对其作进一步说明。
21.本技术的实施例将会被详细的描示在下文中。在本技术说明书全文中,将相同或相似的组件以及具有相同或相似的功能的组件通过类似附图标记来表示。在此所描述的有关附图的实施例为说明性质的、图解性质的且用于提供对本技术的基本理解。本技术的实施例不应该被解释为对本技术的限制。
22.为便于描述,“第一”、“第二”等等可在本文中用于区分一个组件或一系列组件的不同操作。“第一”、“第二”等等不意欲描述对应组件或操作。
23.在对本技术技术方案进行介绍之前,首先对本技术中涉及的一些关键术语进行解释说明:
24.1.量子计算:基于量子逻辑的计算方式,存储数据的基本单元是量子比特。
25.2.量子比特:量子计算的基本单元。传统计算机使用0和1作为二进制的基本单元。不同的是量子计算可以同时处理0和1,使得系统可以处于0和1的线性叠加态:|ψ》=α|0》+β|1》,这边α,β代表系统在0和1上的复数概率幅。它们的模平方|α|2,|β|2分别代表处于0和1的概率。
26.3.量子线路:量子通用计算机的一种表示,代表了相应量子算法/程序在量子门模型下的硬件实现。若量子线路中包含可调的控制量子门的参数,则被称为参数化的量子线路。
27.4.密度矩阵:当一个量子系统所处的态矢量|ψ》不确定时,称该系统处于一个混态。设系统有pn的概率处于归一化的可能态|ψn》,n为正整数,引入密度矩阵ρ=∑npn|ψn》《ψn|。密度矩阵ρ是一个厄米算符,满足归一化tr(ρ)=1和半正定性。
28.5.量子门:常使用矩阵表示,操作n个量子比特的门可以用2
n x 2n的酉矩阵表示。一个门输入跟输出的量子比特数量必须要相等。量子门的操作可以用代表量子门的矩阵与代表量子比特状态的向量作相乘来表示。
29.6.旋转门:旋转门是量子门的一种,是一组三个2
×
2的幺正厄米复矩阵(又称酉矩阵)。其中,旋转x门为旋转y门为旋转z门为旋转z门为
30.7.量子经典混合计算:一种内层利用量子线路进行计算得出相应物理量或损失函数,外层用传统的经典优化器调节量子线路变分参数的计算范式,可以最大限度地发挥量子计算的优势,被相信是有潜力证明量子优势的重要方向之一。
31.本技术提出的用于分子结构推理的模型及方法,通过使用量子计算的方式对输入数据进行量子演化操作,有效提高了模型学习能力和运行效率。
32.图1为根据本技术一些实施例的用于分子结构推理的模型示意图。
33.本技术提出的用于分子结构推理的模型包括:量子编码线路101,其经配置通过第一量子门控循环单元(qu-gru)106将待输入分子结构序列转化为第一向量;以及量子解码线路102,其经配置通过第二qu-gru107将第一向量转化为与所述待输入分子结构序列相应的化合物结构,其中第一qu-gru106和第二qu-gru107中的每一者包括一或多个量子门控循环线路,如图1中的量子门控循环线路111~117。
34.量子编码线路和量子解码线路中的qu-gru可用来控制和管理神经网络中单元之间的信息流,基于量子计算通过使用有限的参数去拟合函数或者分布,加快模型的学习速度。
35.根据本技术一些实施例,待输入分子结构可通过以下步骤得到:
36.s1-获取待分析化合物的分子表达信息为分子的简化分子线性输入规范(smiles),即用字符串来表示分子的化学结构;以及
37.s2-将字符串进行分词后,转化为词向量,用vi表示每一个词,即每一个待输入分子结构。
38.如图1所示,在量子编码线路中,用vi,(i=0,1,2)来表示每个分子结构代表的向量,与上一时刻的隐状态h
i-1
按照时间顺序进行输入,每一个时刻输出一个隐状态hi,可以用函数f表达隐藏层的变换:hi=f(vi,h
i-1
)。假设有3个分子结构,最终通过量子编码线路自定义函数q将各时刻的隐状态变换为向量c=q(h0,h1,h2),这个c就相当于从输入的分子结构序列提炼出来的大概信息一样,包含了该分子结构序列的主要特征。
39.如图1所示,量子解码线路的每一时刻的输入为量子编码线路输出的c和量子解码线路前一时刻解码的输出s
j-1
,(j=0,1,2,3),还有前一时刻预测的分子结构的向量e
j-1
,如果是预测第一个分子结构的话,此时输入的分子结构向量为“_go”的向量,标志着解码的开始,可以用函数g表达量子解码线路中的qu-gru变换:sj=g(c,s
j-1
,e
j-1
)。直到解码解出“_
eos”向量,标志着解码的结束。
40.根据本技术的一些实施例,量子门控循环线路包括6个具有不同参数的量子变分线路(相应的作用算符为vqci,i=1~6)以进行线性变换操作。当第一qu-gru和第二qu-gru分别包括多个量子门控循环线路时,第一qu-gru106中的量子门控循环线路可以相同或不同,第二qu-gru107中的量子门控循环线路也可以相同或不同。
41.图2为根据本技术一些实施例的量子变分线路的示意图。
42.根据本技术的一些实施例,如图2所示,量子门控循环线路的量子变分线路可包括:第一量子线路,其经构建以将待输入数据编码为量子态;第二量子线路,其作用于该量子态;以及量子测量层,其对全部或部分量子比特进行测量。其中第二量子线路中的参数可经训练而确定。
43.例如,如图2所示,第一量子线路201的作用可用u(x)算符来表示,它负责把经典输入数据x编码成量子态,不需要被调节,该量子态将通过第二量子线路202进行一系列幺正运算,包含几个控制非门和单比特的旋转门u。控制非门被(循环)施加在每一对相邻量子比特上,或者间隔为一的量子比特上,以此生成纠缠的多比特量子态。u(α,β,γ)旋转角度是变化的,以被优化器迭代优化。可以重复变分阶段若干次,每一次将引入额外的可优化参数,以提高线路的表达能力。例如,使用v(θ)作为第二量子线路202的作用算符,它具有可以被调节的参数θ,起到提取特征和压缩数据的作用,可进一步通过量子测量层203对全部或者部分量子比特进行测量(根据输出特征数量决定),来获得经典信息输出,单次测量会返回经典位串,如00...1,对应于基态|1》。为了估计量子态的所有振幅的模方,需要准备大量相同的相等叠加态,多次重复测量,用测量结果的频率估计概率(振幅的模方)。
44.根据本技术的一些实施例,第二量子线路包括控制非门和单比特旋转门以进行线性变换操作。
45.图3为根据本技术另一些实施例的量子变分线路的示意图。
46.如图3所示,该实施例中的第一量子线路301将哈达玛门作用在每一个量子比特上,使得所有量子比特(一共4个量子比特)处在线性叠加态,以对每一个量子比特进行编码操作,即施加带有参数的旋转门,这里参数是经典输入矢量的每一个分量,以及他们的平方。比如,第一个比特的ry旋转门的参数是arctan(x
1)
=0.5755,rz的参数是arctan(x
12
)=0.3684。在该实施例中的第二量子线路302中,每相邻量子比特施加cnot门,每次令量子比特施加cnot门;每个量子比特施加u旋转矩阵,该矩阵是最一般的单比特门操作,具有三个参数,均为可学习参数。该实施例中的量子测量层303测量每个或部分量子比特,输出的经典结果存储在经典的寄存器(如图3中的经典线路c所示)中。
47.量子门控循环线路所进行的线性变换操作可由如下数学公式来表述:
48.从数学上讲,这是通过将先前的隐藏状态和当前时间步的输入与其各自的可训练的权重相乘并求和(线性回归),最后通过sigmoid函数。这个函数会使得输出落在0和1之间,允许这个门去筛选信息。便得到了重置门r
t
,r
t
=σ(vqc1(x
t
)+vqc2(h
t-1
));接下来要构建新门n
t
。它由两个矢量逐元素相加得到。第一个矢量很简单,是当前输入乘以一个可训练的权重(线性回归)。第二个矢量是由上一个时间步的隐藏状态与一个可训练的权重相乘(线性回归),然后和重置门r
t
逐元素相乘(hadamard product)。此操作将决定先前时间步中的哪些信息与当前输入一起保留。最后,非线性激活函数tanh将应用于最终结果以获得新门nt
,n
t
=tanh(vqc3(x
t
)+r
t
*vqc4(h
t-1
));接下来需要构建更新门,就像重置门一样,该门是使用先前的隐藏状态和当前输入来计算的。将先前的隐藏状态和当前时间步的输入与其各自的可训练的权重相乘并求和(线性回归),最后通过sigmoid函数。我们便得到了更新门z
t
,z
t
=σ(vqc5(x
t
)+vqc6(h
t-1
));然后,更新门将与先前的隐藏状态进行逐元素乘法,以获得下面等式中的u,此处更新门的目的是帮助模型确定需要保留多少先前隐藏态中的信息,u=z
t
*h
t-1
;最后一步,获得新的隐藏状态,也就是输出h
t
=(1-z
t
)*n
t
+z
t
*h
t-1

49.其中h
t
是时间步t的隐藏状态,x
t
是时间步t的输入,h
t-1
是时间步t-1的隐藏状态或者时间步0的初始隐藏状态(零矢量)。
50.根据本技术的一些实施例,将待输入分子数据x编码为量子态可通过一些方法来实现,例如待输入分子数据x为m维的输入矢量x=(x1,...,xm)时,可首先将输入数据x编码为等权重叠加态:
[0051][0052]
其中求和指标i是十进制的数,代表相应的基态的位串。下一步,m维的输入矢量x=(x1,...,xm)的每一个元素将被用来生成两个旋转角度,比如上述实施例中的arctan(x1)和arctan(x
12
)。可以对每个量子比特将经生成的两个旋转角度的旋转操作分别施加在y轴和z轴方向上,即第一个旋转角arctan(x1)是为了关于y轴的旋转准备的,第二个arctan(x
12
)是关于z轴的。通过给每一个量子比特施加这两个旋转操作,相等叠加初始状态被转变成经典输入x对应的量子叠加态。
[0053]
本技术的实施例还提供一种用于化合物合成的模型,其包括上述用于分子结构推理的模型。
[0054]
本技术的一些实施例还提供一种用于分子结构推理的方法,其使用上述用于分子结构推理的模型。
[0055]
本技术的用于分子结构推理的模型及方法使得需要优化的参数量大大减少,用到的存储介质,即量子比特数目也大大减少,从而使得基于量子计算的数据处理的方法更便捷、准确。
[0056]
本技术的技术内容及技术特点已揭示如上,然而熟悉本领域的技术人员仍可能基于本技术的教示及揭示而作种种不背离本技术精神的替换及修饰。因此,本技术的保护范围应不限于实施例所揭示的内容,而应包括各种不背离本技术的替换及修饰,并为本专利申请权利要求书所涵盖。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1