一种在神经网络中调度Kernel的方法和相关产品与流程

文档序号：37467616发布日期：2024-03-28 18:50阅读：14来源：国知局

本公开涉及人工智能领域，更具体地，涉及神经网络中kernel的选择和调度。

背景技术：

1、深度学习框架通常需要支持多种不同的硬件平台，这意味着同一种深度学习算法可能需要在不同的硬件平台上实现。在相同的硬件平台上，为了取得期望的性能，一种算法往往会采用多种不同的实现方案(在本申请中，将实现方案称为kernel)，而不同的kernel一般被设计为应对不同的规模。但是，即使对于相同的规模，不同kernel的性能也表现出较大的不同，特别是在不同的kernel涵盖的规模发生重叠的情况下，如果无法选择性能最好的kernel，将无法充分发挥硬件的性能，并且导致算法性能表现差，进而影响整个网络的性能。

2、因此，如何选择具有较佳性能的规模是需要解决的问题。

技术实现思路

1、本公开的一个目的在于针对神经网络的规模来选择具有较佳性能的kernel，以充分发挥硬件的性能。

2、根据本公开的第一方面，提供一种在神经网络中调度kernel的方法，包括：确定神经网络的当前规模；从多个kernel中选择对所述当前规模具有匹配性能的优选kernel；以及通过计算接口来运行所述优选kernel，从而实现对kernel的调度。

3、根据本公开的第二方面，提供一种在神经网络中调度kernel的系统，包括：控制器，配置用于确定神经网络的当前规模；查询接口，配置用于从多个kernel中选择对所述当前规模具有匹配性能的优选kernel；以及计算接口，配置用于通过该计算接口来运行所述优选kernel，从而实现对kernel的调度。

4、根据本公开的第三方面，提供一种电子设备，包括：一个或多个处理器；以及存储器，所述存储器中存储有计算机可执行指令，当所述计算机可执行指令由所述一个或多个处理器运行时，使得所述电子设备执行如上所述的方法。

5、根据本公开的第四方面，提供一种计算机可读存储介质，包括计算机可执行指令，当所述计算机可执行指令由一个或多个处理器运行时，执行如上所述的方法。

6、通过本公开提供的方法，能够为不同规模的神经网络选择更为适合的kernel，从而显著地提升系统运行的效率。

技术特征：

1.一种在神经网络中调度kernel的方法，包括：

2.根据权利要求1所述的方法，进一步包括：

3.根据权利要求2所述的方法，进一步包括：

4.根据权利要求2或3所述的方法，其中，所述现有规模包括单个现有规模、多个离散的现有规模或连续的现有规模范围。

5.根据权利要求4所述的方法，其中，不同kernel的现有规模发生重叠。

6.根据权利要求2-5中任意一项所述的方法，其中，从多个kernel中选择对所述当前规模具有匹配性能的优选kernel包括：

7.根据权利要求6所述的方法，进一步包括：

8.根据权利要求1所述的方法，其中，通过与所述计算接口不同的查询接口，从多个kernel中选择对所述当前规模具有匹配性能的优选kernel。

9.根据权利要求8所述的方法，其中，从多个kernel中选择对所述当前规模具有匹配性能的优选kernel包括：

10.根据权利要求9所述的方法，其中，所述现有规模包括单个现有规模、多个离散的现有规模或连续的现有规模范围。

11.根据权利要求要求10所述的方法，其中，不同kernel的现有规模发生重叠。

12.根据权利要求8所述的方法，其中，从多个kernel中选择对所述当前规模具有匹配性能的优选kernel包括：

13.根据权利要求1-12中任意一项所述的方法，其中，性能包括下列中的至少一者：

14.一种在神经网络中调度kernel的系统，包括：

15.根据权利要求14所述的系统，其中，所述控制器进一步配置用于：

16.根据权利要求15所述的系统，所述控制器进一步配置用于：

17.根据权利要求15或16所述的系统，其中，所述现有规模包括单个现有规模、多个离散的现有规模或连续的现有规模范围。

18.根据权利要求17所述的系统，其中，不同kernel的现有规模发生重叠。

19.根据权利要求15至18中任意一项所述的系统，其中，所述查询接口配置用于：

20.根据权利要求19所述的系统，其中，所述查询接口配置用于进一步配置用于：

21.根据权利要求14所述的系统，其中，所述查询接口配置用于：

22.根据权利要求21所述的系统，其中，所述现有规模包括单个现有规模、多个离散的现有规模或连续的现有规模范围。

23.根据权利要求22所述的系统，其中，不同kernel的现有规模发生重叠。

24.根据权利要求14所述的系统，其中，所述查询接口配置用于：

25.根据权利要求14-24中任意一项所述的系统，其中，性能包括下列中的至少一者：

26.一种电子设备，包括：

27.一种计算机可读存储介质，包括计算机可执行指令，当所述计算机可执行指令由一个或多个处理器运行时，执行如权利要求1-13中任意一项所述的方法。

技术总结
本公开提供一种在神经网络中调度Kernel的方法和相关产品，其中该方法可以包括在组合处理装置中，该组合处理装置还可以包括通用互联接口和其他处理装置。所述计算装置与其他处理装置进行交互，共同完成用户指定的计算操作。组合处理装置还可以包括存储装置，该存储装置分别与设备和其他处理装置连接，用于存储该设备和其他处理装置的数据。

技术研发人员：请求不公布姓名,请求不公布姓名
受保护的技术使用者：上海寒武纪信息科技有限公司
技术研发日：
技术公布日：2024/3/27

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：请求不公布姓名,请求不公布姓名
技术所有人：上海寒武纪信息科技有限公司
我是此专利的发明人

上一篇：熔炉余热利用装置的制作方法
上一篇：一种便捷光纤维护的快速光纤连接器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。