存储介质、搜索方法和搜索设备与流程

文档序号:33452189发布日期:2023-03-15 01:13阅读:26来源:国知局
存储介质、搜索方法和搜索设备与流程

1.本文中讨论的实施方式涉及存储介质、搜索方法和搜索设备。


背景技术:

2.近年来,在药物开发领域中,期待使用副作用少的中等分子(分子量500至3000)进行药物开发,正在开发用于搜索中等分子的稳定结构的搜索方法。
3.作为示例,存在下述搜索方法:将多个氨基酸的相互作用势应用于包含多个氨基酸的中等分子的粗粒化模型,并求解作为组合优化问题的以晶格形状划分的晶格空间中的使成本算术表达式的值最小化的氨基酸的最优排列。根据该搜索方法,可以通过搜索有效地找到粗粒化模型中的最优排列组合。
4.作为相关技术,公开了日本公开特许公报第2019-159683号、日本公开特许公报第2015-007537号以及日本公开特许公报第2021-082165号。


技术实现要素:

5.[技术问题]
[0006]
同时,即使在使用上述搜索方法的情况下,例如,在试图搜索粗粒化模型例如具有大量残基的肽中的氨基酸的最优排列组合时,搜索时间也会由于用于组合优化问题的位数变得巨大而增加。
[0007]
在一方面,目的是通过搜索有效地找到中等分子的粗粒化模型中的最优排列组合。
[0008]
[问题的解决方案]
[0009]
根据实施方式的一方面,一种存储搜索程序的非暂态计算机可读存储介质,搜索程序使至少一个计算机执行处理,所述处理包括:基于第一成本算术表达式的值来搜索作为组合优化问题的答案的、中等分子中所包括的多个氨基酸的第一排列,第一成本算术表达式在多个氨基酸的l型与d型之间不进行区分;通过将第一排列设置为搜索的初始排列,基于第二成本算术表达式的值来搜索作为组合优化问题的答案的多个氨基酸的第二排列,第二成本算术表达式在多个氨基酸的l型与d型之间进行区分;以及输出第二排列。
[0010]
[发明的有益效果]
[0011]
通过搜索可以有效地找到中等分子的粗粒化模型中的最优排列组合。
附图说明
[0012]
图1是示出搜索系统的系统配置的示例的图;
[0013]
图2是示出终端设备的硬件配置的示例的图;
[0014]
图3是示出成本算术表达式信息的示例的图;
[0015]
图4是示出约束项算术表达式信息的示例的图;
[0016]
图5是示出终端设备的功能配置的示例的图;
[0017]
图6是示出伊辛设备的功能配置的示例的图;
[0018]
图7是示出搜索处理的流程的流程图;以及
[0019]
图8a和图8b是示出搜索处理的具体示例的图。
具体实施方式
[0020]
在下文中,将参照附图描述每个实施方式。注意,在本说明书和附图中,具有基本相同的功能配置的部件由相同的附图标记表示,并且将省略冗余描述。
[0021]
[第一实施方式]
[0022]
《搜索系统的系统配置》
[0023]
首先,将描述根据第一实施方式的搜索系统的系统配置。图1是示出搜索系统的系统配置的示例的图。搜索系统100是下述系统:使用使中等分子的分子结构粗粒化的粗粒化模型作为搜索目标,在晶格空间中在预定约束条件下搜索使成本最小化的最优排列组合。
[0024]
如图1所示,搜索系统100包括终端设备110(搜索设备的示例)和伊辛设备120例如量子退火设备。
[0025]
终端设备110中安装有搜索程序,在该程序被执行时,终端设备110充当搜索目标信息获取单元111、第一阶段执行单元112、第二阶段执行单元113、输出单元114和第三阶段执行单元115。
[0026]
搜索目标信息获取单元111获取要对其进行最优排列组合的搜索的中等分子的搜索目标粗粒化模型。在第一实施方式中,通过搜索目标信息获取单元111获取的中等分子的搜索目标粗粒化模型是例如通过将以形成肽的主链粒子的氨基酸的α-碳为中心的骨架部分和侧链粒子中的每一个替换为一个粗粒化粒子并将这些粗粒化粒子排列在简单立方晶格(面心立方(fcc))的空间(晶格空间)中而获得的模型。注意,表示位置的位被分配给晶格空间中的每个点,并且一旦粗粒化粒子的排列固定,则粗粒化粒子之间的距离被唯一地指定。
[0027]
搜索目标信息获取单元111向第一阶段执行单元112通知所获取的中等分子的搜索目标粗粒化模型。
[0028]
作为伊辛设备120求解作为组合优化问题的、在预定约束条件下在晶格空间中的使成本算术表达式的值最小化的氨基酸的最优排列组合所需的信息,第一阶段执行单元112从优化信息存储单元116读取成本算术表达式信息(细节将在稍后描述)和约束项算术表达式信息(细节将在稍后描述)。
[0029]
另外,对于中等分子的搜索目标粗粒化模型,第一阶段执行单元112指示伊辛设备120使用成本算术表达式信息和约束项算术表达式信息、根据预先指定的初始排列来搜索最优排列组合。在指示伊辛设备120时,第一阶段执行单元112向伊辛设备120发送第一搜索信息。此处提及的第一搜索信息包括预先指定的呈初始排列的粗粒化模型、成本算术表达式信息以及约束项算术表达式信息。
[0030]
注意,在第一实施方式中,第一阶段执行单元112对成本算术表达式信息进行变换,使得在搜索最优排列组合时伊辛设备120的计算量(位数)减少,并且然后将经变换的成本算术表达式信息发送至伊辛设备120。例如,在第一阶段执行单元112发送第一搜索信息时包含在第一搜索信息中的成本算术表达式信息是已经经过变换以减少计算量(位数)的
经变换的成本算术表达式信息。
[0031]
第二阶段执行单元113响应于第一阶段执行单元112指示搜索最优排列组合而获取从伊辛设备120发送的第一搜索结果。
[0032]
另外,第二阶段执行单元113从优化信息存储单元116读取成本算术表达式信息和约束项算术表达式信息。此外,对于中等分子的搜索目标粗粒化模型,第二阶段执行单元113指示伊辛设备120使用未经变换的成本算术表达式信息和约束项算术表达式信息搜索另外的最优排列组合。在指示搜索设备120时,第二阶段执行单元113向搜索设备120发送第二搜索信息。此处提及的第二搜索信息包括其初始排列为第一搜索结果的粗粒化模型、未经变换的成本算术表达式信息以及约束项算术表达式信息。
[0033]
输出单元114响应于第二阶段执行单元113指示搜索最优排列组合而获取从伊辛设备120发送的第二搜索结果,并向第三阶段执行单元115通知所获取的第二搜索结果。
[0034]
另外,输出单元114对所获取的第二搜索结果进行评估并确定在最优排列组合中是否存在改进空间。在确定不存在改进空间的情况下,输出单元114输出第二搜索结果作为最优解。
[0035]
另外,输出单元114响应于向第三阶段执行单元115通知第二搜索结果而获取从伊辛设备120发送的第三搜索结果并再次向第三阶段执行单元115通知所获取的第三搜索结果。
[0036]
此外,输出单元114对所获取的第三搜索结果进行评估并确定在最优排列组合中是否存在改进空间。在确定不存在改进空间的情况下,输出单元114输出第三搜索结果作为最优解。
[0037]
第三阶段执行单元115获取由输出单元114通知的第二搜索结果或第三搜索结果。
[0038]
另外,第三阶段执行单元115从优化信息存储单元116读取成本算术表达式信息和约束项算术表达式信息。此外,对于中等分子的搜索目标粗粒化模型,第三阶段执行单元115指示伊辛设备120使用成本算术表达式信息和约束项算术表达式信息搜索另外的最优排列组合。在指示搜索设备120时,第三阶段执行单元115向搜索设备120发送第三搜索信息。此处提及的第三搜索信息包括其初始排列为第二搜索结果(或第三搜索结果)的粗粒化模型、成本算术表达式信息以及约束项算术表达式信息。
[0039]
注意,在第一实施方式中,第三阶段执行单元115改变约束项算术表达式信息中所包含的系数,使得伊辛设备120在搜索最优排列组合时不落入局部解,并且然后将经改变的约束项算术表达式信息发送至伊辛设备120。例如,在第三阶段执行单元115发送第三搜索信息时包括的约束项算术表达式信息是系数已经被改变以便不落入局部解的经改变的约束项算术表达式信息。
[0040]
同时,伊辛设备120中安装有优化程序,在该程序被执行时,伊辛设备120充当组合优化单元121。
[0041]
当从终端设备110接收到第一搜索信息时,组合优化单元121通过求解作为组合优化问题的粗粒化模型中的最优排列组合来计算第一搜索结果,并且将所计算的第一搜索结果发送至终端设备110。如上所述,由于包含在第一搜索信息中的成本算术表达式信息是已经经过变换以减少计算量(位数)的经变换的成本算术表达式信息,因此使得组合优化单元121能够高速地计算第一搜索结果。
[0042]
另外,当从终端设备110接收到第二搜索信息时,组合优化单元121通过求解作为组合优化问题的粗粒化模型中的最优排列组合来计算第二搜索结果,并且将所计算的第二搜索结果发送至终端设备110。如上所述,由于包含在第二搜索信息中的粗粒化模型将第一搜索结果作为初始排列,因此使得组合优化单元121能够高速地计算第二搜索结果。另外,如上所述,由于包含在第二搜索信息中的成本算术表达式信息是未经变换的成本算术表达式信息,因此使得组合优化单元121能够以高精度计算第二搜索结果。
[0043]
另外,当从终端设备110接收到第三搜索信息时,组合优化单元121通过求解作为组合优化问题的粗粒化模型中的最优排列组合来计算第三搜索结果,并且将所计算的第三搜索结果发送至终端设备110。如上所述,由于包含在第三搜索信息中的约束项算术表达式信息是系数已经被改变的经改变的约束项算术表达式信息,因此使得组合优化单元121能够以高精度计算第三搜索结果而不落入局部解。
[0044]
《终端设备的硬件配置》
[0045]
接下来,将描述终端设备110的硬件配置。图2是示出终端设备的硬件配置的示例的图。
[0046]
如图2所示,终端设备110包括处理器201、存储器202、辅助存储设备203、接口(i/f)设备204、通信设备205和驱动设备206。注意,终端设备110的各个硬件经由总线207互连。
[0047]
处理器201包括各种算术设备,例如中央处理单元(cpu)和图形处理单元(gpu)。处理器201将各种程序(例如,搜索程序等)读取到存储器202中并执行所读取的程序。
[0048]
存储器202包括主存储设备,例如只读存储器(rom)或随机存取存储器(ram)。处理器201和存储器202形成所谓的计算机。处理器201执行被读取到存储器202中的各种程序以使计算机实现各种功能。
[0049]
辅助存储设备203存储各种程序以及处理器201执行各种程序时所使用的各种类型的信息。例如,在辅助存储设备203中实现优化信息存储单元116。
[0050]
i/f设备204是将作为外部设备的示例的操作设备210和输出设备220与终端设备110连接的连接设备。
[0051]
通信设备205是用于与作为另一设备的示例的伊辛设备120通信的通信设备。
[0052]
驱动设备206是用于对记录介质230进行设置的设备。此处提及的记录介质230包括以光学方式、电学方式和磁性方式记录信息的介质,如在致密盘只读存储器(cd-rom)、软盘、磁光盘等中。可替选地,记录介质230可以包括以电学方式记录信息的半导体存储器等,如在rom、闪存存储器等中。
[0053]
注意,安装在辅助存储设备203中的各种程序是例如通过在驱动设备206中设置分布式记录介质230并由驱动设备206读取记录在记录介质230中的各种程序来安装的。可替选地,要安装在辅助存储设备203中的各种程序可以通过经由通信设备205从网络下载来安装。
[0054]
注意,此处仅描述了终端设备110的硬件配置,而没有描述伊辛设备120的硬件配置。然而,伊辛设备120的硬件配置可以与例如终端设备110的硬件配置类似。在这种情况下,当处理器执行被读取到存储器中的优化程序时,伊辛设备120充当组合优化单元121。
[0055]
可替选地,伊辛设备120的硬件配置可以是与所谓的量子计算机的硬件配置类似的硬件配置。
[0056]
《成本算术表达式信息的具体示例》
[0057]
接下来,将描述在优化信息存储单元116中存储的成本算术表达式信息的具体示例。图3是示出成本算术表达式信息的示例的图。如图3中的成本算术表达式信息300所示,在通过退火方法求解作为组合优化问题的粗粒化模型中的最优排列组合的公式中,成本(cost)由以下表达式(1)中的哈密顿量来表示。
[0058]
[数学表达式1]
[0059]hcost
=h
pair
+h
ld
ꢀꢀꢀ
(1)
[0060]
以这种方式,成本包括表示粗粒化粒子之间的相互作用能的项以及表示粗粒化粒子的左旋(l)型与右旋(d)型之间的差异的项。
[0061]
另外,如图3中的粗粒化粒子之间的相互作用能信息310所示,表示粗粒化粒子之间的相互作用能的项中的哈密顿量由以下表达式(2)来定义。
[0062]
[数学表达式2]
[0063][0064]
请注意,在上述表达式(2)中指定了:n:粗粒化粒子(氨基酸残基)的总数,qi:表示第i个粗粒化粒子(氨基酸残基)的主链粒子的位数的集合,q
sci
:表示第i个粗粒化粒子(氨基酸残基)的侧链粒子的位数的集合,η(a):表示侧链粒子的在距离由位数a表示的存在潜在数据的晶格点一定距离内的晶格点的位数的集合,ω(a):由位数a表示的粗粒化粒子(氨基酸残基);ω(b):由位数b表示的粗粒化粒子(氨基酸残基);pω
(a)
ω
(b)
:作用于粗粒化粒子(氨基酸残基)ω(a)与粗粒化粒子(氨基酸残基)ω(b)之间的相互作用能;qa:位数a的变量;以及qb:位数b的变量。
[0065]
另外,如图3中的库信息311所示,针对每种类型的粗粒化粒子的每个距离,预先计算作用于粗粒化粒子(氨基酸残基)ω(a)与粗粒化粒子(氨基酸残基)ω(b)之间的相互作用能pω
(a)
ω
(b)
。图3中的库信息311的示例示出了下述状态:预先计算粗粒化粒子ω(a)与粗粒化粒子ω(b)之间的相互作用能pω
(a)
ω
(b)
,并且将距离1至n组织为库。
[0066]
另外,如图3中关于l型与d型之间的区别的信息320所示,表示粗粒化粒子(氨基酸残基)的l型与d型之间的差异的项中的哈密顿量由以下表达式(3)定义。
[0067]
[数学表达式3]
[0068][0069]
注意,在上述表达式(3)中指定了:η(a):表示主链粒子的与由位数a表示的晶格点相邻的晶格点的位,η(b):表示主链粒子的与由位数b表示的晶格点相邻的晶格点的位,β(b):表示侧链粒子的与由位数b表示的晶格点相邻的晶格点的位,s(a,b,c,d):势的值,qc:位数c的变量,以及qd:位数d的变量。
[0070]
《约束项算术表达式信息的具体示例》
[0071]
接下来,将描述存储在优化信息存储单元116中的约束项算术表达式信息的具体
示例。图4是示出约束项算术表达式信息的示例的图。如图4所示,优化信息存储单元116存储四种类型的约束项算术表达式信息。
[0072]
其中,约束项算术表达式信息410是确保每个粗粒化粒子(氨基酸残基)仅存在于晶格空间中的一个位置处的约束条件,并且由以下表达式(4)定义。
[0073]
[数学表达式4]
[0074][0075]
注意,在上述表达式(4)中指定了:n:粗粒化粒子(氨基酸残基)的总数,qi:表示第i个粗粒化粒子(氨基酸残基)的主链粒子的位数的集合,q
sci
:表示第i个粗粒化粒子(氨基酸残基)的侧链粒子的位数的集合,qa:位数a的变量,qb:位数b的变量,以及λ
one
:系数。
[0076]
另外,约束项算术表达式信息420是确保多个粗粒化粒子(氨基酸残基)不存在于同一晶格点处的约束条件,并且由以下表达式(5)定义。
[0077]
[数学表达式5]
[0078][0079]
注意,在以上表达式(5)中指定了:v:晶格空间,θ(ν):表示晶格点ν的所有位数的集合,以及λ
olap
:系数。
[0080]
另外,约束项算术表达式信息430是确保每个粗粒化粒子(氨基酸残基)按照分子序列连接的约束条件,并且由以下表达式(6)定义。
[0081]
[数学表达式6]
[0082][0083]
注意,在以上表达式(6)中指定了:d(a,b):与第a位变量对应的晶格点和与第b位变量对应的晶格点之间的距离,d(a,c):与第a位变量对应的晶格点和与第c位变量对应的晶格点之间的距离,d0:最近的晶格点之间的距离,qc:位数c的变量,qi:位数i的变量,qj:位数j的变量,以及λ
conn
:系数。
[0084]
另外,约束项算术表达式信息440是确保未连接的粗粒化粒子(氨基酸残基)不存在于相邻晶格中的约束条件,并且由以下表达式(7)定义。
[0085]
[数学表达式7]
[0086][0087]
注意,在以上表达式(7)中指定了:η(a):表示由第a位表示的晶格点的相邻晶格点的位数的集合,c:在形成环形形状并且i=n/2成立的情况下为1,并且在其他情况下为2,以
及λ
nadj
:系数。
[0088]
《终端设备的功能配置的细节》
[0089]
接下来,将描述终端设备110的功能配置的细节。图5是示出终端设备的功能配置的示例的图。如参照图1所描述的,终端设备110充当搜索目标信息获取单元111、第一阶段执行单元112、第二阶段执行单元113、输出单元114和第三阶段执行单元115。
[0090]
另外,如图5所示,第一阶段执行单元112还包括执行指令单元511、成本算术表达式信息变换单元512和算术表达式信息获取单元513。
[0091]
另外,第二阶段执行单元113包括搜索结果获取单元521、执行指令单元522和算术表达式信息获取单元523。
[0092]
另外,输出单元114包括搜索结果获取单元531和评估单元532。此外,第三阶段执行单元115包括执行指令单元541、系数更改单元542以及算术表达式信息获取单元543。在下文中,将描述第一阶段执行单元112、第二阶段执行单元113、输出单元114和第三阶段执行单元115各自包括的每个单元的细节。
[0093]
算术表达式信息获取单元513从优化信息存储单元116读取成本算术表达式信息和约束项算术表达式信息,并向成本算术表达式信息变换单元512通知所读取的成本算术表达式信息和约束项算术表达式信息。
[0094]
成本算术表达式信息变换单元512从算术表达式信息获取单元513获取成本算术表达式信息,并对所获取的成本算术表达式信息进行变换,以便减少伊辛设备120在搜索最优排列组合时的计算量(位数)。例如,通过省略成本算术表达式信息300中的表示粗粒化粒子的l型与d型之间的差异的项,成本算术表达式信息变换单元512生成由以下表达式(8)表示的经变换的成本算术表达式信息。
[0095]
[数学表达式8]
[0096]hcost
=h
pair
ꢀꢀꢀ
(8)
[0097]
在上述表达式(8)的情况下,由于与上述表达式(1)中指示的成本算术表达式信息相比,可以减小计算量(位数),因此可以显著缩短高速计算第一搜索结果时的搜索时间。
[0098]
另外,成本算术表达式信息变换单元512向执行指令单元511通知经变换的成本算术表达式信息和约束项算术表达式信息。
[0099]
执行指令单元511从搜索目标信息获取单元111获取预先指定的呈初始排列的粗粒化模型,并且还从成本算术表达式信息变换单元512获取经变换的成本算术表达式信息和约束项算术表达式信息。另外,执行指令单元511将包含预先指定的呈初始排列的粗粒化模型、经变换的成本算术表达式信息以及约束项算术表达式信息的第一搜索信息发送至伊辛设备120,并指示伊辛设备120搜索最优排列组合。
[0100]
搜索结果获取单元521从伊辛设备120获取第一搜索结果,并向执行指令单元522通知所获取的第一搜索结果。
[0101]
算术表达式信息获取单元523从优化信息存储单元116读取成本算术表达式信息和约束项算术表达式信息,并向执行指令单元522通知所读取的成本算术表达式信息和约束项算术表达式信息。
[0102]
执行指令单元522从搜索结果获取单元521获取第一搜索结果,并从算术表达式信息获取单元523获取成本算术表达式信息和约束项算术表达式信息。另外,执行指令单元
522将包含其初始排列是所获取的第一搜索结果的粗粒化模型、未经变换的成本算术表达式信息以及约束项算术表达式信息的第二搜索信息发送至伊辛设备120,并指示伊辛设备120搜索最优排列组合。在第二搜索信息的情况下,以第一搜索结果作为初始排列来进行对最优排列组合的搜索。因此,即使在包括表示粗粒化粒子的l型与d型之间的差异的项(例如,即使对于考虑l型和d型的排列)的情况下,也可以高速地计算高精度的第二搜索结果。
[0103]
搜索结果获取单元531从伊辛设备120获取第二搜索结果或第三搜索结果,并向评估单元532通知所获取的第二搜索结果或第三搜索结果。
[0104]
评估单元532对由搜索结果获取单元531通知的第二搜索结果或第三搜索结果进行评估,并确定在最优排列组合中是否存在改进空间。在确定不存在改进空间的情况下,评估单元532输出紧之前的搜索结果作为最优解。
[0105]
注意,关于紧之前的搜索结果,例如,在作出了第二搜索结果的通知之后作出第三搜索结果的通知并且在第二搜索结果与第三搜索结果之间尚未更新最优排列组合的情况下,输出第二搜索结果作为最优解。另外,例如,在作出了第k(k是任何整数)个第三搜索结果的通知之后作出第k+1个第三搜索结果的通知并且在第k次与第k+1次之间尚未更新最优排列组合的情况下,输出第k个第三搜索结果作为最优解。
[0106]
此外,在确定在最优排列组合中存在改进空间的情况下,评估单元532将由搜索结果获取单元531通知的第二搜索结果或第三搜索结果通知给执行指令单元541。
[0107]
算术表达式信息获取单元543从优化信息存储单元116读取成本算术表达式信息和约束项算术表达式信息,并向系数更改单元542通知所读取的成本算术表达式信息和约束项算术表达式信息。
[0108]
系数更改单元542从算术表达式信息获取单元543获取成本算术表达式信息和约束项算术表达式信息,并改变约束项算术表达式信息中包含的系数。另外,系数更改单元542将经改变的约束项算术表达式信息和成本算术表达式信息通知给执行指令单元541。
[0109]
执行指令单元541从评估单元532获取第二搜索结果或第三搜索结果,并从系数更改单元542获取经改变的约束项算术表达式信息和成本算术表达式信息。另外,执行指令单元541将包含其初始排列是所获取的第二搜索结果或第三搜索结果的粗粒化模型、成本算术表达式信息以及经改变的约束项算术表达式信息的第三搜索信息发送至伊辛设备120,并指示伊辛设备120搜索最优排列组合。在第三搜索信息的情况下,由于使用经改变的约束项算术表达式信息和成本算术表达式信息进行对最优排列组合的搜索,因此可以计算出高精度的搜索结果而不落入局部解。
[0110]
这是因为在人工晶格空间中进行排列时,粗粒化粒子具有与实际分子的位置和形状不同的位置和形状,并且因此,尽管存在局部能量势垒增加以及取决于约束条件的贡献而移动到最优解附近变得困难的情况,但是根据第三搜索信息,移动到最优解附近变得容易,并且可以通过系数更改单元542改变约束项算术表达式信息的系数以及暂时减弱约束条件来提高达到更精确的解的可能性。
[0111]
《伊辛设备的功能配置的细节》
[0112]
接下来,将描述伊辛设备120的功能配置的细节。图6是示出伊辛设备的功能配置的示例的图。如参考图1所描述的,伊辛设备120充当组合优化单元121。另外,如图6所示,组合优化单元121还包括二次无约束二进制优化(qubo)生成单元611、转换单元612和最优解
计算单元613。
[0113]
qubo生成单元611从终端设备110获取第一搜索信息、第二搜索信息和第三搜索信息。另外,qubo生成单元611将包含在第一搜索信息中的经变换的成本算术表达式信息和约束项算术表达式信息转换成二次无约束二进制优化(qubo)。另外,qubo生成单元611将包含在第二搜索信息中的未经变换的成本算术表达式信息和约束项算术表达式信息转换成qubo。此外,qubo生成单元611将包含在第三搜索信息中的成本算术表达式信息和经改变的约束项算术表达式信息转换成qubo。
[0114]
转换单元612将经转换的qubo转换成适于数字退火器的格式。
[0115]
最优解计算单元613通过使用数字退火器对被转换成适于数字退火器的格式的qubo进行求解来搜索最优排列组合。另外,最优解计算单元613将通过基于第一搜索信息的搜索而找到的最优排列组合作为第一搜索结果发送至终端设备110。另外,最优解计算单元613将通过基于第二搜索信息的搜索而找到的最优排列组合作为第二搜索结果发送至终端设备110。此外,最优解计算单元613将通过基于第三搜索信息的搜索而找到的最优排列组合作为第三搜索结果发送至终端设备110。
[0116]
《搜索处理的流程》
[0117]
接下来,将描述由搜索系统100进行的搜索处理的流程。图7是示出搜索处理的流程的流程图。
[0118]
在步骤s701中,终端设备110的搜索目标信息获取单元111获取中等分子的搜索目标粗粒化模型。
[0119]
在步骤s702中,终端设备110的第一阶段执行单元112生成经变换的成本算术表达式信息,其中在所读取的成本算术表达式信息300中省略了表示粗粒化粒子的l型与d型之间的差异的项。
[0120]
在步骤s703中,终端设备110的第一阶段执行单元112指示伊辛设备120针对中等分子的搜索目标粗粒化模型搜索最优排列组合。此时,终端设备110的第一阶段执行单元112指示使用经变换的成本算术表达式信息以及约束项算术表达式信息410至440来搜索最优排列组合。
[0121]
在步骤s704中,伊辛设备120的组合优化单元121计算第一搜索结果,并且终端设备110的第二阶段执行单元113从伊辛设备120的组合优化单元121获取第一搜索结果。
[0122]
在步骤s705中,终端设备110的第二阶段执行单元113指示伊辛设备120针对中等分子的搜索目标粗粒化模型以第一搜索结果作为初始排列来搜索最优排列组合。此时,终端设备110的第二阶段执行单元113指示使用成本算术表达式信息300以及约束项算术表达式信息410至440来搜索最优排列组合。
[0123]
在步骤s706中,伊辛设备120的组合优化单元121计算第二搜索结果,并且终端设备110的输出单元114从伊辛设备120的组合优化单元121获取第二搜索结果。
[0124]
在步骤s707中,终端设备110的第三阶段执行单元115改变所读取的约束项算术表达式信息410至440中的任何一个或多个系数并生成经改变的约束项算术表达式信息。
[0125]
在步骤s708中,终端设备110的第三阶段执行单元115指示伊辛设备120针对中等分子的搜索目标粗粒化模型以由输出单元114获取的最新搜索结果作为初始排列来搜索最优排列组合。此时,终端设备110的第三阶段执行单元115指示使用成本算术表达式信息300
和经改变的约束项算术表达式信息来搜索最优排列组合。
[0126]
在步骤s709中,伊辛设备120的组合优化单元121计算第三搜索结果,并且终端设备110的输出单元114从伊辛设备120的组合优化单元121获取第三搜索结果。
[0127]
在步骤s710中,终端设备110的输出单元114确定在步骤s709中获取的第三搜索结果中是否存在改进空间。当在步骤s710中确定存在改进空间的情况下(在步骤s710中为是的情况下),该处理返回至步骤s707。
[0128]
在这种情况下,终端设备110的第三阶段执行单元115生成第二个经改变的约束项算术表达式信息(步骤s707),并指示以第一个第三搜索结果作为初始排列来搜索最优排列组合(步骤s708)。这使得终端设备110的输出单元114获取第二个第三搜索结果(步骤s709)。
[0129]
之后,在搜索系统100中,重复步骤s707至步骤s710中的处理,直至在步骤s710中终端设备110的输出单元114确定不存在改进空间。
[0130]
另一方面,当在步骤s710中确定不存在改进空间的情况下(在步骤s710中为否的情况下),该处理进行至步骤s711。
[0131]
在步骤s711中,终端设备110的输出单元114输出在确定不存在改进空间紧之前的搜索结果作为最优解。
[0132]
[搜索处理的具体示例]
[0133]
接下来,将描述由搜索系统100进行的搜索处理的具体示例。图8a和图8b是示出搜索处理的具体示例的图,并且示出了以三种类型的肽(肽a(残基的数目=12)、肽b(残基的数目=10)和肽c(残基的数目=15))的粗粒化模型作为搜索目标来进行对最优排列组合的搜索的状态。
[0134]
其中,图8a示出了在不使用经变换的成本算术表达式信息并且不使用经改变的约束项算术表达式信息的情况下进行对最优排列组合的搜索的情况(这意指示出了使用成本算术表达式信息300以及约束项算术表达式信息410至440进行对最优排列组合的搜索的情况)作为比较示例。
[0135]
例如,图8a指示:在使用成本算术表达式信息300以及约束项算术表达式信息410至440的情况下,肽a的位数为“60,671”,并且通过搜索最优排列组合,成本减少了“1282”,并且搜索时间花费了“255”秒。
[0136]
类似地,图8a指示:在使用成本算术表达式信息300以及约束项算术表达式信息410至440的情况下,肽b的位数为“42,918”,并且通过搜索最优排列组合,成本减少了“966”,并且搜索时间花费了“188”秒。
[0137]
类似地,图8a指示:在使用成本算术表达式信息300以及约束项算术表达式信息410至440的情况下,肽c的位数为“167,256”,并且通过搜索最优排列组合,成本减少了“926”,并且搜索时间花费了“855”秒。
[0138]
另一方面,图8b示出了通过执行图7中示出的搜索处理进行对最优排列组合的搜索的情况(这意指使用经变换的成本算术表达式信息和经改变的约束项算术表达式信息)。
[0139]
例如,图8b指示:当在第一阶段中使用经变换的成本算术表达式信息以及约束项算术表达式信息410至440的情况下,肽a的位数得到“8,192”,并且通过搜索最优排列组合,成本减少了“1387”,并且搜索时间花费了“41”秒。
[0140]
类似地,图8b指示:当在第一阶段中使用经变换的成本算术表达式信息以及约束项算术表达式信息410至440的情况下,肽b的位数得到“8,192”,并且通过搜索最优排列组合,成本减少了“960”,并且搜索时间花费了“42”秒。
[0141]
类似地,图8b指示:当在第一阶段中使用经变换的成本算术表达式信息以及约束项算术表达式信息410至440的情况下,肽c的位数得到“14,298”,并且通过搜索最优排列组合,成本减少了“1172”,并且搜索时间花费了“712”秒。
[0142]
另外,图8b指示:当在第二阶段中使用未经变换的成本算术表达式信息300以及约束项算术表达式信息410至440的情况下,肽a的位数得到“60,671”,但是通过以第一搜索结果作为初始排列来搜索最优排列组合,成本减少了“1357”,并且搜索时间得到“0”秒。
[0143]
类似地,图8b指示:当在第二阶段中使用成本算术表达式信息300以及约束项算术表达式信息410至440的情况下,肽b的位数得到“42,918”,但是通过以第一搜索结果作为初始排列来搜索最优排列组合,成本减少了“930”,并且搜索时间得到“0”秒。
[0144]
类似地,图8b指示:当在第二阶段中使用成本算术表达式信息300以及约束项算术表达式信息410至440的情况下,肽c的位数得到“167,256”,但是通过以第一搜索结果作为初始排列来搜索最优排列组合,成本减少了“1112”,并且搜索时间得到“1”秒。
[0145]
另外,图8b指示:当在第三阶段中使用成本算术表达式信息300以及通过将系数乘以“0.6”而获得的经改变的约束项算术表达式信息的情况下,通过以第二搜索结果作为初始排列来搜索最优排列组合,成本减少了“1357”,并且搜索时间得到“0”秒。
[0146]
类似地,图8b指示:当在第三阶段中使用成本算术表达式信息300以及通过将系数乘以“0.6”而获得的经改变的约束项算术表达式信息的情况下,通过以第二搜索结果作为初始排列来搜索最优排列组合,成本减少了“1001”,并且搜索时间得到“0”秒。
[0147]
类似地,图8b指示:当在第三阶段中使用成本算术表达式信息300以及通过将系数乘以“0.8”而获得的经改变的约束项算术表达式信息的情况下,通过以第二搜索结果作为初始排列来搜索最优排列组合,成本减少了“1132”,并且搜索时间得到“1”秒。
[0148]
对比图8a和图8b,可以确认:对于所有肽a至肽c,图8b中的成本减少量较大(参见图8b中“第三阶段”中的“成本”),并且图8b中的搜索时间较短(参见图8b中的“合计时间”)。例如,根据搜索系统100,可以通过搜索有效地(高速地且以高精度)找到中等分子的粗粒化模型中的最优排列组合。
[0149]
从上述描述可以清楚地看到,根据第一实施方式的终端设备110指示在多个阶段中搜索作为组合优化问题的中等分子的粗粒化模型中的排列组合。此时,在第一阶段中,根据第一实施方式的终端设备110指示通过省略氨基酸的l型与d型之间的区别来计算粗粒化模型的成本,以搜索使成本最小化的排列组合。另外,在第二阶段中,根据第一实施方式的终端设备110指示通过以下操作来搜索使成本最小化的排列:在氨基酸的l型与d型之间进行区分的同时,以通过第一阶段中的搜索找到的排列作为初始排列来计算粗粒化模型的成本。此外,根据第一实施方式的终端设备110输出通过第二阶段中的搜索找到的排列,作为粗粒化模型中的最优排列组合。
[0150]
因此,根据第一实施方式,可以通过搜索高速地找到高精度的排列组合。例如,根据第一实施方式,可以通过搜索有效地找到中等分子的粗粒化模型中的最优排列组合。
[0151]
[第二实施方式]
[0152]
在上述第一实施方式中,qubo生成单元611被描述为顺序地转换第一搜索信息和第二搜索信息。然而,qubo生成单元611的转换定时不限于此。例如,可以在最优解计算单元613搜索最优排列组合之前,预先转换包含在第一搜索信息中的经变换的成本算术表达式信息以及包含在第二搜索信息中的未经变换的成本算术表达式信息。
[0153]
另外,在上述第一实施方式中,搜索系统100被描述为包括终端设备110和伊辛设备120。然而,搜索系统100可以由除终端设备110和伊辛设备120以外的设备(这意指三个或更多个设备)形成。可替选地,搜索系统100可以由集成设备(这意指一个设备)形成。在这种情况下,搜索处理(图7)将例如通过一个设备执行搜索程序(搜索程序+优化程序)来实现。
[0154]
另外,在上述第一实施方式中,终端设备110被描述为包括搜索目标信息获取单元111至第三阶段执行单元115,并且伊辛设备120被描述为包括组合优化单元121。然而,终端设备110的一些功能可以在伊辛设备120中实现。类似地,伊辛设备120的一些功能可以在终端设备110中实现。
[0155]
注意,实施方式不限于此处描述的配置,并且可以包括例如上述实施方式中描述的配置等与其他元件的组合。在不脱离实施方式的精神的情况下,可以改变这些点,并且可以根据其应用模式适当地指定这些点。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1