本申请涉及计算机,尤其涉及一种任务调度方法、装置、电子设备及存储介质。
背景技术:
1、随着人工智能和深度学习在生活中的广泛应用,数据中心接收到的数据处理任务数量巨大、种类繁多,例如人脸识别任务、图像分类任务、语音识别任务等,不同的数据处理任务对通用处理器的计算资源、图形处理器的计算资源、访存带宽资源、内存资源等的需求不同。在一种相关技术中,使用整机部署的方式来执行数据处理任务(即,执行数据处理任务所需的资源均来自同一台服务器),若该服务器上任一资源不满该数据处理任务的需求,那么该数据处理任务无法部署在该服务器上进行处理,从而严重制约了任务运行效率。
技术实现思路
1、本申请实施例提供一种任务调度方法、装置、电子设备及存储介质,以解决相关技术中存在的问题。
2、第一方面,本申请实施例提供了一种任务调度方法,包括:在确定用于处理待调度任务的服务器集群中不存在服务器满足所述待调度任务的算力需求的情况下,将所述待调度任务拆分为由不同处理器处理的多个子任务;确定所述服务器集群中存在服务器分别满足所述多个子任务的算力需求;将所述子任务调度至满足所述子任务的算力需求的服务器。
3、第二方面,本申请实施例提供了一种任务调度装置,包括:待调度任务拆分单元,配置来在确定用于处理待调度任务的服务器集群中不存在服务器满足所述待调度任务的算力需求的情况下,将所述待调度任务拆分为由不同处理器处理的多个子任务;服务器确定单元,配置来确定所述服务器集群中存在服务器分别满足所述多个子任务的算力需求;子任务调度单元,配置来将所述子任务调度至满足所述子任务的算力需求的服务器。
4、第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现上述任一项所述的方法。
5、第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法。
6、与现有技术相比,本申请具有如下优点:
7、依据本申请实施例,根据待调度任务所需的资源需求和服务器集群能够提供的资源,在一台服务器不能同时满足待调度任务所有的资源需求时,无需等待资源空闲或更换服务器,可以将该数据处理任务拆分为由不同处理器处理的多个子任务,并将这些子任务部署至不同的服务器中,使得不同的服务器中的处理器分别处理这些子任务,提高了服务器集群的资源利用效率和任务调度的效率。
8、上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
1.一种任务调度方法,包括:
2.根据权利要求1所述的方法,所述将所述待调度任务拆分为由不同处理器处理的多个子任务,包括:
3.根据权利要求2所述的方法,所述方法还包括:
4.根据权利要求2所述的方法,其中,所述确定所述服务器集群中存在服务器分别满足所述多个子任务的算力需求,包括:
5.根据权利要求4所述的方法,其中,所述基于所述每台服务器的通用处理器算力,确定存在第一服务器满足所述第一一级子任务的算力需求,包括:
6.根据权利要求1或2所述的方法,其中,所述方法还包括:
7.根据权利要求1或2所述的方法,其中,所述待调度任务的算力需求根据所述待调度任务的延迟需求获得。
8.根据权利要求4所述的方法,其中,所述通用处理器和所述图形处理器的连接方式包括以下连接方式中的任意一项:pcie、rdma、以及以太网。
9.一种任务调度装置,包括:
10.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现权利要求1-8中任一项所述的方法。
11.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述的方法。