本公开总体上涉及处理器,并且更具体地,涉及用于在稀疏加速器上执行机器学习模型操作的方法和装置。
背景技术:
1、近年来,对计算密集型处理能力(诸如图像处理能力)的需求已经移动超出了高功率专用桌面型硬件的范围,并且已成为对个人和/或其他移动设备的期望。移动设备通常包括受大小约束、温度管理约束和/或供应功率约束限制的处理能力。
技术实现思路
1.一种用于执行加速操作的装置,所述装置包括:
2.如权利要求1所述的装置,其中,所述稀疏性数据包括稀疏权重向量,并且所述装置进一步包括:
3.如权利要求1所述的装置,其中,所述稀疏性数据包括激活稀疏性数据或权重稀疏性数据中的至少一者,所述一个或多个数据缓冲器包括权重数据缓冲器和激活数据缓冲器,并且所述第三电路系统用于:
4.如权利要求1所述的装置,其中,所述稀疏性数据包括稀疏权重向量,所述加速操作是深度方向卷积操作,并且其中:
5.如权利要求1所述的装置,其中,所述稀疏性数据包括稀疏权重向量,所述加速操作是分组卷积操作,并且其中:
6.如权利要求1所述的装置,其中,所述加速操作是逐元素加法操作,并且其中:
7.如权利要求1所述的装置,其中,所述稀疏性数据包括一个或多个稀疏权重向量,所述加速操作是扩张卷积操作,并且其中:
8.一种非暂态计算机可读介质,所述非暂态计算机可读介质包括指令,所述指令当被执行时使至少一个加速器至少进行:
9.如权利要求8所述的非暂态计算机可读介质,其中,所述稀疏性数据包括稀疏权重向量,并且所述指令当被执行时使所述至少一个加速器:
10.如权利要求8所述的非暂态计算机可读介质,其中,所述稀疏性数据包括激活稀疏性数据或权重稀疏性数据中的至少一者,所述一个或多个数据缓冲器包括权重数据缓冲器和激活数据缓冲器,并且所述指令当被执行时使所述至少一个加速器:
11.如权利要求8所述的非暂态计算机可读介质,其中,所述稀疏性数据包括稀疏权重向量,所述加速操作是深度方向卷积操作,并且所述指令当被执行时使所述至少一个加速器:
12.如权利要求8所述的非暂态计算机可读介质,其中,所述稀疏性数据包括稀疏权重向量,所述加速操作是分组卷积操作,并且所述指令当被执行时使所述至少一个加速器:
13.如权利要求8所述的非暂态计算机可读介质,其中,所述加速操作是逐元素加法操作,并且所述指令当被执行时使所述至少一个加速器:
14.如权利要求8所述的非暂态计算机可读介质,其中,所述稀疏性数据包括一个或多个稀疏权重向量,所述加速操作是扩张卷积,并且所述指令当被执行时使所述至少一个加速器:
15.一种方法,包括:
16.如权利要求15所述的方法,其中,所述稀疏性数据包括稀疏权重向量,并且所述方法进一步包括:
17.如权利要求15所述的方法,其中,所述稀疏性数据包括激活稀疏性数据或权重稀疏性数据中的至少一者,所述一个或多个数据缓冲器包括权重数据缓冲器和激活数据缓冲器,并且所述方法进一步包括:
18.如权利要求15所述的方法,其中,所述稀疏性数据包括稀疏权重向量,所述加速操作是深度方向卷积操作,并且所述方法进一步包括:
19.如权利要求15所述的方法,其中,所述稀疏性数据包括稀疏权重向量,所述加速操作是分组卷积操作,并且所述方法进一步包括:
20.如权利要求15所述的方法,其中,所述加速操作是逐元素加法操作,并且进一步包括:
21.如权利要求15所述的方法,其中,所述稀疏性数据包括一个或多个稀疏权重向量,所述加速操作是扩张卷积,并且所述方法进一步包括: