本文所描述的实施例总体上涉及数据处理,并且更具体地涉及促进一种用于在推断期间对图形处理器进行协调和增加利用的工具。
背景技术:
1、当前的并行图形数据处理包括被开发用于对图形数据执行特定操作的系统和方法,诸如,例如线性插值法、曲面细分、栅格化、纹理映射、深度测试等。传统上,图形处理器使用固定函数计算单元来处理图形数据,然而近来,图形处理器的多个部分已经可编程,从而使得此类处理器能够支持用于处理顶点和片段数据的更广泛种类的操作。
2、为了进一步提高性能,图形处理器通常实现诸如流水线操作的处理技术,这些处理技术尝试贯穿图形流水线的不同部分并行地处理尽可能多的图形数据。具有单指令多线程(simt)架构的并行图形处理器被设计成使图形流水线中的并行处理量最大化。在simt架构中,多组并行线程尝试尽可能经常地一起同步执行程序指令,以提高处理效率。用于simt架构的软件和硬件的一般性概述可以在以下两者中找到:shane cook的cuda编程(cudaprogramming),第3章,第37到51页(2013年)和/或nicholas wilt的cuda手册(gpu编程的综合指南(a comprehensive guide to gpu programming)),章节2.6.2到3.1.2(2013年6月)。
3、机器学习在解决很多种任务方面已经成功。在训练和使用机器学习算法(例如,神经网络)时产生的计算使其本身自然地用于有效的并行实施。因此,诸如通用图形处理单元(gpgpu)的并行处理器在深度神经网络的实践实施中起到重要作用。具有单指令多线程(simt)架构的并行图形处理器被设计成使图形流水线中的并行处理量最大化。在simt架构中,多组并行线程尝试尽可能经常地一起同步执行程序指令,以提高处理效率。由并行机器学习算法实施提供的效率允许使用大容量网络并且使得那些网络能够在更大数据集上进行训练。
4、常规技术并未提供推断输出与负责提供输入的传感器之间的协调;然而,此类常规技术没有提供推断输出的准确性。此外,在图形处理器上使用推断相当少,而其余图形处理器未被利用。
技术实现思路
1.一种非暂态机器可读存储介质,具有存储于其上的可执行计算机程序指令,所述可执行计算机程序指令当由一个或多个机器执行时,使所述一个或多个机器执行包括以下各项的操作:
2.如权利要求1所述的存储介质,其中,一个或多个上下文对所述多个流处理器的使用被部分地限制以提高所述多个流处理器的利用率。
3.如权利要求2所述的存储介质,进一步包括当由所述一个或多个机器执行时使所述一个或多个机器执行包括以下各项的操作的可执行计算机程序指令:
4.如权利要求2所述的存储介质,其中,所述操作附加地包括部分地基于控制目标和来自调度器的需求来调整对用于所述一个或多个上下文的线程的限制。
5.如权利要求1所述的存储介质,其中,所述多个流处理器包括单指令多线程simt架构。
6.如权利要求5所述的存储介质,其中,所述simt架构包括硬件多线程。
7.如权利要求1所述的存储介质,其中,所述多个流处理器中的每一个耦合到数据高速缓存。
8.如权利要求7所述的存储介质,其中,数据端口耦合到所述数据高速缓存以针对经由所述数据端口的存储器访问对数据进行高速缓存。
9.一种非暂态机器可读存储介质,具有存储于其上的可执行计算机程序指令,所述可执行计算机程序指令当由一个或多个机器执行时,使所述一个或多个机器执行包括以下各项的操作:
10.如权利要求9所述的存储介质,其中,对用于所述一个或多个上下文的线程的所述限制被至少部分地提供以提高所述多个流处理器的利用率。
11.如权利要求10所述的存储介质,其中,所述多个流处理器的利用率由所述系统监测。
12.如权利要求10所述的存储介质,其中,所述操作附加地包括部分地基于控制目标和来自调度器的需求来调整对用于所述一个或多个上下文的线程的所述限制。
13.如权利要求9所述的存储介质,其中,所述多个流处理器包括单指令多线程simt架构。
14.如权利要求13所述的存储介质,其中,所述simt架构包括硬件多线程。
15.如权利要求9所述的存储介质,其中,所述多个流处理器中的每一个耦合到数据高速缓存。
16.如权利要求15所述的存储介质,其中,数据端口耦合到所述数据高速缓存以针对经由所述数据端口的存储器访问对数据进行高速缓存。
17.一种系统,包括:
18.如权利要求17所述的系统,其中,对用于所述多个上下文的线程的所述限制至少部分地由所述系统提供以提高所述多个流处理器的利用率。
19.如权利要求18所述的系统,其中,所述系统进一步用于监测所述多个流处理器的利用率。
20.如权利要求17所述的系统,其中,所述多个流处理器包括单指令多线程simt架构。
21.如权利要求20所述的系统,其中,所述simt架构包括硬件多线程。
22.如权利要求17所述的系统,其中,所述多个流处理器中的每一个耦合到数据高速缓存。
23.如权利要求22所述的系统,其中,数据端口耦合到所述数据高速缓存以针对经由所述数据端口的存储器访问对数据进行高速缓存。