混合算力操控方法、装置、设备和存储介质与流程

文档序号:33040215发布日期:2023-01-24 21:14阅读:50来源:国知局
混合算力操控方法、装置、设备和存储介质与流程

1.本发明涉及量子计算技术领域,尤其涉及一种混合算力操控方法、装置、设备和存储介质。


背景技术:

2.量子计算是基于量子力学原理和量子算法的一种新型计算方式,在某些特定问题上能够表现出远超经典计算机的能力。随着量子计算技术的成熟,未来的计算体系必然是同时包含经典计算机与量子计算机的混合结构。
3.目前,对这种混合计算的软件架构设计思路,都是在现有云服务体系中,将量子计算以一种特殊的服务类型纳入管理。即将不同的算力视为可以调用的服务,量子算力即服务(quantum computing as a service,qcaas)也在很多文献中提及。
4.将不同的算力视为可以调用的服务的思想不仅大幅增加了任务调度的复杂度,也难以为将来其他形式的计算节点进行扩展。此外,所有的计算资源本身都处在被动等待调用的状态,整个系统对于资源的利用效率严重依赖调度算法的优劣,而资源调度本身是一个np问题,这就使得系统中常常存在大量的算力资源浪费。


技术实现要素:

5.本发明提供一种混合算力操控方法、装置、设备和存储介质,用以解决现有技术中不能有效利用算力,强烈依赖调度算法,造成算力资源浪费的缺陷。
6.本发明提供一种混合算力操控方法,应用于算力集群中的任务仓库,所述算力集群包括一个任务仓库和至少一个计算节点,所述至少一个计算节点的计算类型包括量子计算型、标量计算型和张量计算型中的至少一种,且所述至少一个计算节点的计算类型至少包括量子计算型,所述方法包括:
7.响应于计算节点的计算请求,从待计算任务中查询与所述计算节点匹配的匹配任务;
8.在查询到匹配任务的情况下,将所述匹配任务的任务信息返回至所述计算节点,以使所述计算节点基于所述匹配任务的任务信息进行计算;
9.接收所述计算节点发送的计算结果,并基于所述计算结果更新所述匹配任务的任务状态;
10.在未查询到匹配任务的情况下,将未查询到匹配任务的信息返回至所述计算节点,以使所述计算节点在预设时长后重新发送计算请求。
11.根据本发明提供的混合算力操控方法,所述响应于计算节点的计算请求,从待计算任务中查询与所述计算节点匹配的匹配任务,包括:
12.响应于计算节点的计算请求,确定所述计算请求中携带的所述计算节点的计算类型和计算资源;
13.基于所述计算节点的计算类型和计算资源,从待计算任务中查询与所述计算类型
和计算资源匹配的匹配任务。
14.根据本发明提供的混合算力操控方法,所述任务状态包括等待、正在计算、成功或失败。
15.根据本发明提供的混合算力操控方法,还包括:
16.接收并存储用户提交的待计算任务;
17.生成所述待计算任务的任务标识,并将所述任务标识返回至所述用户,以使所述用户基于所述任务标识查询所述待计算任务的任务状态。
18.根据本发明提供的混合算力操控方法,所述将所述任务标识返回至所述用户,以使所述用户基于所述任务标识查询所述待计算任务的任务状态,之后还包括:
19.在所述待计算任务的任务状态为成功或失败的情况下,响应于所述用户的查询请求,将所述待计算任务的计算结果或失败信息返回至所述用户;
20.删除所述待计算任务。
21.根据本发明提供的混合算力操控方法,所述待计算任务的任务信息包括用户信息、优先级、所需计算类型、所需资源能力、输入数据、超时门限和算子描述中的至少一种。
22.本发明还提供一种混合算力操控方法,应用于算力集群中的计算节点,所述算力集群包括一个任务仓库和至少一个计算节点,所述至少一个计算节点的计算类型包括量子计算型、标量计算型和张量计算型中的至少一种,且所述至少一个计算节点的计算类型至少包括量子计算型,所述方法包括:
23.向任务仓库发送计算请求,以使所述任务仓库基于所述计算请求从待计算任务中查询匹配任务;
24.在所述任务仓库查询到匹配任务的情况下,基于所述任务仓库返回的所述匹配任务的任务信息进行计算,得到计算结果,并将所述计算结果发送至所述任务仓库;
25.在所述任务仓库未查询到匹配任务的情况下,接收所述任务仓库返回的未查询到匹配任务的信息,并在预设时长后重新发送计算请求。
26.本发明还提供一种混合算力操控装置,包括:
27.匹配任务查询单元,用于响应于计算节点的计算请求,从待计算任务中查询与所述计算节点匹配的匹配任务;
28.任务信息返回单元,用于在查询到匹配任务的情况下,将所述匹配任务的任务信息返回至所述计算节点,以使所述计算节点基于所述匹配任务的任务信息进行计算;
29.任务状态更新单元,用于接收所述计算节点发送的计算结果,并基于所述计算结果更新所述匹配任务的任务状态;
30.信息返回单元,用于在未查询到匹配任务的情况下,将未查询到匹配任务的信息返回至所述计算节点,以使所述计算节点在预设时长后重新发送计算请求。
31.本发明还提供一种混合算力操控装置,包括:
32.计算请求发送单元,用于向任务仓库发送计算请求,以使所述任务仓库基于所述计算请求从待计算任务中查询匹配任务;
33.任务计算单元,用于在所述任务仓库查询到匹配任务的情况下,基于所述任务仓库返回的所述匹配任务的任务信息进行计算,得到计算结果,并将所述计算结果发送至所述任务仓库;
34.信息接收单元,用于在所述任务仓库未查询到匹配任务的情况下,接收所述任务仓库返回的未查询到匹配任务的信息,并在预设时长后重新发送计算请求。
35.本发明还提供一种电子设备或量子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述混合算力操控方法。
36.本发明还提供一种非暂态计算机可读存储介质,其上存储有电子计算机和/或量子计算机程序,该计算机程序被处理器执行时实现如上述任一种所述混合算力操控方法。
37.本发明还提供一种计算机程序产品,包括电子计算机和/或量子计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述混合算力操控方法。
38.本发明提供的混合算力操控方法、装置、设备和存储介质,计算节点主动向任务仓库发送计算请求,通过计算节点与任务仓库之间的交互进行任务计算,相比于现有技术中计算节点处在被动等待调用的状态,无须依赖调度算法进行资源调度,减少了任务调度复杂度;任务仓库基于计算请求进行任务匹配,能够尽可能充分发挥不同计算节点的计算能力,提高了算力资源利用率。
附图说明
39.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
40.图1是本发明提供的混合算力操控方法的流程示意图之一;
41.图2是本发明提供的混合算力操控方法的流程示意图之二;
42.图3是本发明提供的算力集群组成结构示意图;
43.图4是本发明提供的用户与任务仓库之间交互的序列图;
44.图5是本发明提供的计算节点与任务仓库之间交互的序列图;
45.图6是本发明提供的混合算力操控装置的结构示意图之一;
46.图7是本发明提供的混合算力操控装置的结构示意图之二;
47.图8是本发明提供的设备的结构示意图。
具体实施方式
48.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
49.随着量子计算和张量型计算芯片的发展,未来的计算将是多种类型资源组成的算力集群,而对于这种混合的算力集群,现在几乎所有的技术方案都是将不同的算力视为可以调用的服务,量子算力即服务(quantum computing as a service,qcaas)也在很多文献中提及。然而,这种将计算视为服务的设计简单的继承自网络服务的思想,并不能有效利用算力,且强烈的依赖调度算法。
50.基于此,本发明实施例提供一种混合算力操控方法,不依赖中心调度,尽可能充分发挥不同计算节点的计算能力,并为未来其他类型的计算节点留下扩展的空间。
51.图1是本发明提供的混合算力操控方法的流程示意图,该方法中各步骤的执行主体可以是算力集群中的任务仓库。其中,算力集群包括一个任务仓库和至少一个计算节点,该至少一个计算节点的计算类型包括量子计算型、标量计算型和张量计算型中的至少一种,且该至少一个计算节点的计算类型至少包括量子计算型。如图1所示,混合算力操控方法可以包括如下步骤:
52.步骤110,响应于计算节点的计算请求,从待计算任务中查询与计算节点匹配的匹配任务。
53.具体地,算力集群包括一个任务仓库和至少一个计算节点。其中,任务仓库是算力集群内外部之间交互的单元,用于存储和管理该集群收到的计算任务,一个算力集群有且仅有一个任务仓库。
54.计算节点是实际执行计算任务的单元,每个计算节点都仅和本集群的任务仓库进行交互,一个集群拥有一个或更多计算节点。该一个或更多计算节点的计算类型至少包括量子计算型,即算力集群中至少包括一个量子计算型的计算节点。同时,该一个或更多计算节点的计算类型包括量子计算型、标量计算型和张量计算型中的至少一种,也就是说,该算力集群中计算节点的类型可以是量子计算型一种类型,也可以是量子计算型和标量计算型这两种类型的混合型,也可以是量子计算型和张量计算型这两种类型的混合型,当然还可以是量子计算型、标量计算型和张量计算型这三种类型的混合型,本发明实施例对此不作具体限定。其中,标量计算型或张量计算型可统称为经典计算型。
55.量子计算型节点的计算单元为量子芯片,利用量子叠加与量子纠缠特性,在特定任务上提供远超过经典计算的能力,例如质因数分解、化学分子模拟等特定任务。
56.标量计算型节点的计算单元一般为中央处理器(central processing unit,cpu)或现场可编程逻辑门阵列(field programmable gate array,fpga)中内嵌的arm核,以通用计算为主,尤其适用于包含大量逻辑判断的单线程计算任务,例如数据排序任务等。
57.张量计算型节点的计算单元一般为图形处理器(graphics processing unit,gpu)、tpu或者npu等并行计算设备,适用于需要同时对大量数据进行统一简单计算的任务,例如图像处理、深度学习网络的学习和推理等。
58.在此算力集群架构下,每一个计算节点所包含的计算资源并非处在被动等待调用的状态,而是在其处于空闲状态时,主动向任务仓库发送计算请求,计算请求中可携带该计算节点的计算类型、计算资源数量和参数等信息。
59.任务仓库在收到计算节点发送的计算请求之后,从待计算任务中查询与计算节点匹配的匹配任务,待计算任务可以是由用户提交的等待计算的任务。此处的匹配可以包括计算能力和计算类型匹配,比如计算节点的计算能力与该任务所需资源能力相匹配、计算类型相匹配等。
60.任务仓库中存储了该集群收到的来自各个用户提交的计算任务。优选地,任务仓库在查询之前,可进一步对待计算任务进行筛选,筛选当前状态为等待的任务,进而从任务状态为等待的任务中查询与计算节点匹配的匹配任务。
61.步骤120,在查询到匹配任务的情况下,将匹配任务的任务信息返回至计算节点,
以使计算节点基于匹配任务的任务信息进行计算;
62.步骤130,接收计算节点发送的计算结果,并基于计算结果更新匹配任务的任务状态;
63.步骤140,在未查询到匹配任务的情况下,将未查询到匹配任务的信息返回至计算节点,以使计算节点在预设时长后重新发送计算请求。
64.具体地,任务仓库经过任务匹配查询,可能存在两种结果,即查询到匹配任务或未查询到匹配任务。
65.任务仓库在查询到匹配任务的情况下,将匹配任务的任务信息返回至计算节点。任务信息具体可包括提交该任务的用户信息、任务的优先级、所需计算类型、所需资源能力、输入数据、算子描述、超时门限和其他参数,其中算子描述使用与硬件平台无关的中间代码表示。同时,任务仓库将该匹配任务的状态修改为“正在计算”。
66.计算节点接收到任务信息之后,即可针对该任务进行计算,得到计算结果,并将计算结果返回至任务仓库。计算节点在提交计算结果之后进入空闲状态,将重新发起计算请求。
67.任务仓库基于计算节点返回的计算结果更新匹配任务的任务状态。比如在计算结果指示计算成功的情况下,将匹配任务的任务状态更新为“成功”,并存储计算结果;在计算结果指示计算失败的情况下,将匹配任务的任务状态更新为“失败”,并存储失败信息。
68.任务仓库在未查询到匹配任务的情况下,将未查询到匹配任务的信息返回至计算节点,未查询到匹配任务的信息具体可表现为空数据,或查询失败等。计算节点收到未查询到匹配任务的信息之后,则可在预设时长后重新发送计算请求。此处的预设时长可以是预先设置好的固定时长,比如5分钟,也可以是随机时长,本发明实施例对此不作具体限定。
69.本发明实施例提供的方法,计算节点主动向任务仓库发送计算请求,通过计算节点与任务仓库之间的交互进行任务计算,相比于现有技术中计算节点处在被动等待调用的状态,无须依赖调度算法进行资源调度,减少了任务调度复杂度;任务仓库基于计算请求进行任务匹配,能够尽可能充分发挥不同计算节点的计算能力,提高了算力资源利用率。
70.此外,包括一个任务仓库和至少一个计算节点的算力集群架构,为未来其他类型的计算节点留下扩展的空间。
71.基于上述任一实施例,步骤110具体包括:
72.步骤111,响应于计算节点的计算请求,确定计算请求中携带的计算节点的计算类型和计算资源;
73.步骤112,基于计算节点的计算类型和计算资源,从待计算任务中查询与计算类型和计算资源匹配的匹配任务。
74.具体地,为了得到与发出请求的计算节点相匹配的匹配任务,可首先根据该计算节点发送的计算请求,确定计算请求中携带的该计算节点的计算类型和计算资源。
75.考虑到针对任一计算节点,计算类型具体可包括量子计算型、标量计算型或张量计算型,并且每一类型的计算节点适用的任务类型也不相同,因此在此基础上,可根据该计算节点的计算类型和计算资源,从待计算任务中查询与该计算节点的计算类型和计算资源匹配的匹配任务。由此得到的匹配任务的计算类型和计算资源,与该计算节点的计算类型和计算资源是最为匹配的,从而可以提高计算节点的利用率。
76.基于上述任一实施例,任务状态包括等待、正在计算、成功或失败。
77.具体地,任务状态是指待计算任务中各任务的状态,任务仓库对任务状态进行管理。任务状态可包括等待、正在计算、成功或失败四种。
78.当用户提交任务至任务仓库之后,任务状态可为“等待”;当计算任务处于“正在计算”状态的时间超出超时门限,则可将任务状态修改为“等待”。此时任务已由用户提交到任务仓库,但还未分配到合适的计算节点。
79.当任务仓库查询到匹配任务,并将匹配任务的任务信息返回至计算节点,计算节点启动计算时,任务状态可为“正在计算”,此时任务已经被合适的计算节点领取,但结果还未提交。
80.当任务仓库收到计算节点发送的成功的计算结果时,任务状态可为“成功”,此时任务的计算结果已由计算节点提交,但还未被用户取走。
81.当任务仓库收到计算节点发送的失败的计算结果时,任务状态可为“失败”;当计算任务处于“等待”状态的时间超出超时门限,则可将任务状态修改为“失败”,同时添加失败信息“超时无匹配计算资源”。此时任务已超时或错误信息已由计算节点提交,但还未被用户取走。
82.本发明实施例提供的方法,通过对任务状态的更新,实现了任务仓库对各计算任务的管理和监控。
83.基于上述任一实施例,混合算力操控方法还包括:
84.接收并存储用户提交的待计算任务;
85.生成待计算任务的任务标识,并将任务标识返回至用户,以使用户基于任务标识查询待计算任务的任务状态。
86.具体地,任务仓库作为算力集群内外部之间交互的单元,除了与计算节点进行交互,还与用户进行交互,此处的用户即算力集群使用者。
87.用户访问任务仓库,将需要计算的待计算任务提交到任务仓库,待计算任务的任务信息具体可包括用户信息、优先级、所需计算类型、所需资源能力、输入数据、算子描述、超时门限和其他参数。其中,算子描述使用与硬件平台无关的中间代码表示。
88.任务仓库接收到用户提交的待计算任务之后,可将待计算任务进行存储,待计算任务可以根据任务提交时间展现为队列的形式,还可以根据任务状态进行分类管理,本发明实施例对此不作具体限定。
89.随即,任务仓库生成一个唯一性标识作为该待计算任务的id返回给任务的提交者,即返回给用户。此时任务的状态为“等待”。
90.用户在获得任务id后,可定时或手动向任务仓库查询任务状态具体可包括等待、正在计算、成功或失败,如此用户能够及时了解所提交任务的任务状态。
91.本发明实施例提供的方法,通过任务仓库与算力集群使用者(用户)进行交互,存储和管理用户提交的待计算任务,以使用户及时了解任务状态。
92.基于上述任一实施例,将任务标识返回至用户,以使用户基于任务标识查询待计算任务的任务状态,之后还包括:
93.在待计算任务的任务状态为成功或失败的情况下,响应于用户的查询请求,将待计算任务的计算结果或失败信息返回至用户;
94.删除待计算任务。
95.具体地,用户基于任务标识查询到待计算任务的任务状态。用户在查询到任务状态变为“成功”后,向任务仓库查询任务的计算结果;用户在查询到任务状态变为“失败”后,向任务仓库查询任务的失败信息,例如失败信息可以是计算失败,或超时无匹配计算资源等。
96.随即,在向用户返回任务的计算结果或失败信息之后,任务仓库将该任务信息删除。
97.基于上述任一实施例,待计算任务的任务信息包括用户信息、优先级、所需计算类型、所需资源能力、输入数据、超时门限和算子描述中的至少一种。
98.具体地,待计算任务由用户发起,提交至任务仓库,任务仓库负责存储和管理。用户提交时会携带待计算任务的任务信息,任务信息具体包括用户信息、优先级、所需计算类型、所需资源能力、输入数据和算子描述中的至少一种。
99.基于上述任一实施例,图2是本发明提供的混合算力操控方法的流程示意图之二,该方法的执行主体可以是算力集群中的计算节点,其中算力集群包括一个任务仓库和至少一个量子计算型计算节点,任一计算节点的计算类型包括量子计算型、标量计算型或张量计算型,如图2所示,该混合算力操控方法可以包括如下步骤:
100.步骤210,向任务仓库发送计算请求,以使任务仓库基于计算请求从待计算任务中查询匹配任务;
101.步骤220,在任务仓库查询到匹配任务的情况下,基于任务仓库返回的匹配任务的任务信息进行计算,得到计算结果,并将计算结果发送至任务仓库;
102.步骤230,在任务仓库未查询到匹配任务的情况下,接收任务仓库返回的未查询到匹配任务的信息,并在预设时长后重新发送计算请求。
103.具体地,算力集群包括一个任务仓库和至少一个计算节点。其中,任务仓库是算力集群内外部之间交互的单元,用于存储和管理该集群收到的计算任务,一个算力集群有且仅有一个任务仓库。
104.计算节点是实际执行计算任务的单元,每个计算节点都仅和本集群的任务仓库进行交互,一个集群拥有一个或更多计算节点。该一个或更多计算节点的计算类型至少包括量子计算型,即算力集群中至少包括一个量子计算型的计算节点。同时,该一个或更多计算节点的计算类型包括量子计算型、标量计算型和张量计算型中的至少一种,也就是说,该算力集群中计算节点的类型可以是量子计算型一种类型,也可以是量子计算型和标量计算型这两种类型的混合型,也可以是量子计算型和张量计算型这两种类型的混合型,当然还可以是量子计算型、标量计算型和张量计算型这三种类型的混合型,本发明实施例对此不作具体限定。其中,标量计算型或张量计算型可统称为经典计算型。
105.量子计算型节点的计算单元为量子芯片,利用量子叠加与量子纠缠特性,在特定任务上提供远超过经典计算的能力,例如质因数分解、化学分子模拟等特定任务。
106.标量计算型节点的计算单元一般为中央处理器(central processing unit,cpu)或现场可编程逻辑门阵列(field programmable gate array,fpga)中内嵌的arm核,以通用计算为主,尤其适用于包含大量逻辑判断的单线程计算任务,例如数据排序任务等。
107.张量计算型节点的计算单元一般为图形处理器(graphics processing unit,
gpu)、tpu或者npu等并行计算设备,适用于需要同时对大量数据进行统一简单计算的任务,例如图像处理、深度学习网络的学习和推理等。
108.在此算力集群架构下,每一个计算节点所包含的计算资源并非处在被动等待调用的状态,而是在其处于空闲状态时,主动向任务仓库发送计算请求,计算请求中可携带该计算节点的计算类型、计算资源数量和参数等信息。
109.任务仓库在收到计算节点发送的计算请求之后,从待计算任务中查询与计算节点匹配的匹配任务,待计算任务可以是由用户提交的等待计算的任务。此处的匹配可以包括计算能力和计算类型匹配,比如计算节点的计算能力与该任务所需资源能力相匹配、计算类型相匹配等。
110.任务仓库中存储了该集群收到的来自各个用户提交的计算任务。优选地,任务仓库在查询之前,可进一步对待计算任务进行筛选,筛选当前状态为等待的任务,进而从任务状态为等待的任务中查询与计算节点匹配的匹配任务。
111.任务仓库经过任务匹配查询,可能存在两种结果,即查询到匹配任务或未查询到匹配任务。
112.任务仓库在查询到匹配任务的情况下,将匹配任务的任务信息返回至计算节点。任务信息具体可包括提交该任务的用户信息、任务的优先级、所需计算类型、所需资源能力、输入数据、算子描述、超时门限和其他参数,其中算子描述使用与硬件平台无关的中间代码表示。同时,任务仓库将该匹配任务的状态修改为“正在计算”。
113.计算节点接收到任务信息之后,即可针对该任务进行计算,得到计算结果,并将计算结果发送至任务仓库。计算节点在提交计算结果之后进入空闲状态,将重新发起计算请求。
114.任务仓库在未查询到匹配任务的情况下,将未查询到匹配任务的信息返回至计算节点。计算节点收到未查询到匹配任务的信息之后,则可在预设时长后重新发送计算请求。此处的预设时长可以是预先设置好的固定时长,比如5分钟,也可以是随机时长,本发明实施例对此不作具体限定。
115.本发明实施例提供的方法,计算节点主动向任务仓库发送计算请求,通过计算节点与任务仓库之间的交互进行任务计算,相比于现有技术中计算节点处在被动等待调用的状态,无须依赖调度算法进行资源调度,减少了任务调度复杂度;任务仓库基于计算请求进行任务匹配,能够尽可能充分发挥不同计算节点的计算能力,提高了算力资源利用率。
116.基于上述任一实施例,图3是本发明提供的算力集群组成结构示意图,如图3所示,算力集群包括三个计算节点和一个任务仓库,所述三个计算节点的类型分别为逻辑型、张量型和量子型。任务仓库分别与计算节点和用户进行交互。图4是本发明提供的用户与任务仓库之间交互的序列图;图5是本发明提供的计算节点与任务仓库之间交互的序列图。如图4和图5所示,在此算力集群架构下,提供一种混合算力操控方法,该方法包括:
117.(1)算力集群使用方访问集群的任务仓库,将需要计算的任务提交到任务仓库,计算任务包括用户信息、优先级、所需计算类型、所需资源能力、输入数据、算子描述、超时门限和其他参数,算子描述使用与硬件平台无关的中间代码表示;
118.(2)任务仓库收到算力集群使用方提交的计算任务后,将计算任务存储在相应的队列中,生成一个唯一性标识作为任务的id返回给任务的提交者,此时任务的状态为“等
待”;
119.(3)算力集群使用方在获得任务id后,定时或手动的向任务仓库查询任务状态;
120.(4)计算节点处于空闲状态下,主动访问任务仓库,请求匹配自身能力的计算任务,请求数据中包括自身的类型和计算资源数量、参数等;
121.(5)任务仓库在收到计算节点的请求后,在当前状态为“等待”的任务列表中寻找匹配计算节点能力的计算任务,若寻找无结果则返回空数据,若寻找到匹配的任务,则将该任务信息返回给计算节点,并将任务的状态修改为“正在计算”;
122.(6)计算节点若收到空的请求结果,则在等待一个随机时间后再次发起请求;
123.(7)计算节点若收到任务信息,根据任务信息启动计算,若计算成功,将计算结果提交到任务仓库,若计算失败,则将失败信息提交到任务仓库;
124.(8)任务仓库收到成功的计算结果,存储结果,并将任务状态改为“成功”;
125.(9)任务仓库收到计算失败的信息,存储失败信息,并将任务状态改为“失败”;
126.(10)计算节点在提交成功的结果或失败信息后,进入空闲状态,重新发起任务请求;
127.(11)若计算任务处于“等待”状态的时间超出超时门限,则状态改为“失败”,失败信息为超时无匹配计算资源;
128.(12)若计算任务处于“正在计算”状态的时间超出超时门限,则状态改为“等待”;
129.(13)算力集群使用方在查询到任务状态变为“成功”后,向任务仓库查询任务的计算结果;
130.(14)算力集群使用方在查询到任务状态变为“失败”后,向任务仓库查询任务的失败信息;
131.(15)在向使用者返回任务的计算结果或失败信息后,任务仓库将任务信息删除。
132.本发明实施例提供的方法改变了现有算力集群将计算资源抽象为服务、依赖于特定调度算法分配任务的架构,转而将计算节点设计为主动请求任务。这本质上是将调度式的服务器-客户端模型,改为了需求提出方和需求实现方通过轻量的平台进行交互的模型,也可以说之前的思路是自顶向下计划式的,而本发明所述架构则是开放交互市场化的。
133.下面对本发明提供的混合算力操控装置进行描述,下文描述的混合算力操控装置与上文描述的混合算力操控方法可相互对应参照。
134.基于上述任一实施例,图6是本发明提供的混合算力操控装置的结构示意图之一,如图6所示,混合算力操控装置包括匹配任务查询单元610、任务信息返回单元620、任务状态更新单元630和信息返回单元640,其中:
135.匹配任务查询单元610,用于响应于计算节点的计算请求,从待计算任务中查询与所述计算节点匹配的匹配任务;
136.任务信息返回单元620,用于在查询到匹配任务的情况下,将所述匹配任务的任务信息返回至所述计算节点,以使所述计算节点基于所述匹配任务的任务信息进行计算;
137.任务状态更新单元630,用于接收所述计算节点发送的计算结果,并基于所述计算结果更新所述匹配任务的任务状态;
138.信息返回单元640,用于在未查询到匹配任务的情况下,将未查询到匹配任务的信息返回至所述计算节点,以使所述计算节点在预设时长后重新发送计算请求。
139.本发明实施例提供的混合算力操控装置,计算节点主动向任务仓库发送计算请求,通过计算节点与任务仓库之间的交互进行任务计算,相比于现有技术中计算节点处在被动等待调用的状态,无须依赖调度算法进行资源调度,减少了任务调度复杂度;任务仓库基于计算请求进行任务匹配,能够尽可能充分发挥不同计算节点的计算能力,提高了算力资源利用率。
140.基于上述任一实施例,匹配任务查询单元610进一步用于:
141.响应于计算节点的计算请求,确定所述计算请求中携带的所述计算节点的计算类型和计算资源;
142.基于所述计算节点的计算类型和计算资源,从待计算任务中查询与所述计算类型和计算资源匹配的匹配任务。
143.基于上述任一实施例,所述任务状态包括等待、正在计算、成功或失败。
144.基于上述任一实施例,任务状态更新单元进一步用于:
145.在所述计算结果指示计算成功的情况下,将所述匹配任务的任务状态更新为成功,并存储所述计算结果;
146.在所述计算结果指示计算失败的情况下,将所述匹配任务的任务状态更新为失败,并存储失败信息。
147.基于上述任一实施例,混合算力操控装置还包括任务接收单元,用于:
148.接收并存储用户提交的待计算任务;
149.生成所述待计算任务的任务标识,并将所述任务标识返回至所述用户,以使所述用户基于所述任务标识查询所述待计算任务的任务状态。
150.基于上述任一实施例,混合算力操控装置还包括任务删除单元,用于:
151.在所述待计算任务的任务状态为成功或失败的情况下,响应于所述用户的查询请求,将所述待计算任务的计算结果或失败信息返回至所述用户;
152.删除所述待计算任务。
153.基于上述任一实施例,所述待计算任务的任务信息包括用户信息、优先级、所需计算类型、所需资源能力、输入数据、超时门限和算子描述中的至少一种。
154.基于上述任一实施例,图7是本发明提供的混合算力操控装置的结构示意图之二,如图7所示,混合算力操控装置包括计算请求发送单元710、任务计算单元720和信息接收单元730,其中:
155.计算请求发送单元710,用于向任务仓库发送计算请求,以使所述任务仓库基于所述计算请求从待计算任务中查询匹配任务;
156.任务计算单元720,用于在所述任务仓库查询到匹配任务的情况下,基于所述任务仓库返回的所述匹配任务的任务信息进行计算,得到计算结果,并将所述计算结果发送至所述任务仓库;
157.信息接收单元730,用于在所述任务仓库未查询到匹配任务的情况下,接收所述任务仓库返回的未查询到匹配任务的信息,并在预设时长后重新发送计算请求。
158.本发明实施例提供的混合算力操控装置,计算节点主动向任务仓库发送计算请求,通过计算节点与任务仓库之间的交互进行任务计算,相比于现有技术中计算节点处在被动等待调用的状态,无须依赖调度算法进行资源调度,减少了任务调度复杂度;任务仓库
基于计算请求进行任务匹配,能够尽可能充分发挥不同计算节点的计算能力,提高了算力资源利用率。
159.图8示例了一种电子设备或量子设备的实体结构示意图,如图8所示,该电子设备或量子设备可以包括:处理器(processor)810、通信接口(communications interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行混合算力操控方法,该方法包括:
160.响应于计算节点的计算请求,从待计算任务中查询与所述计算节点匹配的匹配任务;
161.在查询到匹配任务的情况下,将所述匹配任务的任务信息返回至所述计算节点,以使所述计算节点基于所述匹配任务的任务信息进行计算;
162.接收所述计算节点发送的计算结果,并基于所述计算结果更新所述匹配任务的任务状态;
163.在未查询到匹配任务的情况下,将未查询到匹配任务的信息返回至所述计算节点,以使所述计算节点在预设时长后重新发送计算请求。
164.处理器可以调用存储器中的逻辑指令,以执行另一混合算力操控方法,该方法包括:
165.向任务仓库发送计算请求,以使所述任务仓库基于所述计算请求从待计算任务中查询匹配任务;
166.在所述任务仓库查询到匹配任务的情况下,基于所述任务仓库返回的所述匹配任务的任务信息进行计算,得到计算结果,并将所述计算结果发送至所述任务仓库;
167.在所述任务仓库未查询到匹配任务的情况下,接收所述任务仓库返回的未查询到匹配任务的信息,并在预设时长后重新发送计算请求。
168.此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个电子计算机和/或量子计算机的可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子计算机和/或量子计算机程序设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
169.另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,电子计算机和/或量子计算机程序能够执行上述各方法所提供的混合算力操控方法,该方法包括:
170.响应于计算节点的计算请求,从待计算任务中查询与所述计算节点匹配的匹配任务;
171.在查询到匹配任务的情况下,将所述匹配任务的任务信息返回至所述计算节点,以使所述计算节点基于所述匹配任务的任务信息进行计算;
172.接收所述计算节点发送的计算结果,并基于所述计算结果更新所述匹配任务的任务状态;
173.在未查询到匹配任务的情况下,将未查询到匹配任务的信息返回至所述计算节点,以使所述计算节点在预设时长后重新发送计算请求。
174.电子计算机和/或量子计算机程序能够执行上述各方法所提供的另一混合算力操控方法,该方法包括:
175.向任务仓库发送计算请求,以使所述任务仓库基于所述计算请求从待计算任务中查询匹配任务;
176.在所述任务仓库查询到匹配任务的情况下,基于所述任务仓库返回的所述匹配任务的任务信息进行计算,得到计算结果,并将所述计算结果发送至所述任务仓库;
177.在所述任务仓库未查询到匹配任务的情况下,接收所述任务仓库返回的未查询到匹配任务的信息,并在预设时长后重新发送计算请求。
178.又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有电子计算机和/或量子计算机程序,该电子计算机和/或量子计算机程序被处理器执行时实现以执行上述各方法提供的混合算力操控方法,该方法包括:
179.响应于计算节点的计算请求,从待计算任务中查询与所述计算节点匹配的匹配任务;
180.在查询到匹配任务的情况下,将所述匹配任务的任务信息返回至所述计算节点,以使所述计算节点基于所述匹配任务的任务信息进行计算;
181.接收所述计算节点发送的计算结果,并基于所述计算结果更新所述匹配任务的任务状态;
182.在未查询到匹配任务的情况下,将未查询到匹配任务的信息返回至所述计算节点,以使所述计算节点在预设时长后重新发送计算请求。
183.该电子计算机和/或量子计算机程序被处理器执行时实现以执行上述各方法提供的另一混合算力操控方法,该方法包括:
184.向任务仓库发送计算请求,以使所述任务仓库基于所述计算请求从待计算任务中查询匹配任务;
185.在所述任务仓库查询到匹配任务的情况下,基于所述任务仓库返回的所述匹配任务的任务信息进行计算,得到计算结果,并将所述计算结果发送至所述任务仓库;
186.在所述任务仓库未查询到匹配任务的情况下,接收所述任务仓库返回的未查询到匹配任务的信息,并在预设时长后重新发送计算请求。
187.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
188.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该
计算机软件产品可以存储在电子计算机和/或量子计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台电子计算机和/或量子计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
189.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1