BFLOAT16分类和操纵指令的制作方法

文档序号:33745404发布日期:2023-04-06 11:22阅读:38来源:国知局
BFLOAT16分类和操纵指令的制作方法


背景技术:

1、近年来,已经证明具有较低精度的乘法和较高精度的累加的融合乘加(fused-multiply-add,fma)单元在机器学习/人工智能应用中是有用的,最显著的是在训练深度神经网络时是有用的,这是由于其极高的计算强度。相较于经典的ieee-754 32比特(fp32)和64比特(fp64)算术,此种精度降低的算术在性质上可以与其缩短的宽度不成比例地加速。


技术实现思路



技术特征:

1.一种设备,包括:

2.如权利要求1所述的设备,其中,用于第一源操作对象的标识的字段用于标识向量寄存器。

3.如权利要求1所述的设备,其中,用于第一源操作对象的标识的字段用于标识存储器位置。

4.如权利要求1-3中任一项所述的设备,其中,所述一个或多个分类检查是以下各项中的一项或多项:静默非数qnan、信令非数snan、正零、负零、正无穷、负无穷、非正规或有限负数。

5.如权利要求1-4中任一项所述的设备,其中,要执行的所述一个或多个分类检查用于由立即数提供。

6.如权利要求1-4中任一项所述的设备,其中,要执行的所述一个或多个分类检查用于由所标识的寄存器提供。

7.如权利要求1-6中任一项所述的设备,其中,所述指令进一步包括用于写入掩码寄存器的一个或多个字段。

8.一种系统,包括:

9.如权利要求8所述的系统,其中,用于第一源操作对象的标识的字段用于标识向量寄存器。

10.如权利要求8所述的系统,其中,用于第一源操作对象的标识的字段用于标识存储器位置。

11.如权利要求8-10中任一项所述的系统,其中,所述一个或多个分类检查是以下各项中的一项或多项:静默非数qnan、信令非数snan、正零、负零、正无穷、负无穷、非正规、或有限负数。

12.如权利要求8-11中任一项所述的系统,其中,要执行的所述一个或多个分类检查用于由立即数提供。

13.如权利要求8-12中任一项所述的系统,其中,所述指令进一步包括用于写入掩码寄存器的一个或多个字段。

14.如权利要求8-13中任一项所述的系统,其中,要执行的所述一个或多个分类检查用于由所标识的寄存器提供。

15.一种非暂态机器可读介质,至少存储特定的单个指令的实例,其中,所述特定的单个指令的所述实例用于由处理器通过执行包括以下步骤的方法来处理:

16.如权利要求15所述的非暂态机器可读介质,其中,用于第一源操作对象的标识的字段用于标识向量寄存器。

17.如权利要求15所述的非暂态机器可读介质,其中,用于第一源操作对象的标识的字段用于标识存储器位置。

18.如权利要求15-17中任一项所述的非暂态机器可读介质,其中,所述一个或多个分类检查是以下各项中的一项或多项:静默非数qnan、信令非数snan、正零、负零、正无穷、负无穷、非正规、或有限负数。

19.如权利要求15-18中任一项所述的非暂态机器可读介质,其中,要执行的所述一个或多个分类检查用于由立即数提供。

20.如权利要求15-18中任一项所述的非暂态机器可读介质,其中,所述指令进一步包括用于写入掩码寄存器的一个或多个字段。

21.如权利要求15-20中任一项所述的非暂态机器可读介质,其中,要执行的所述一个或多个分类检查用于由所标识的寄存器提供。

22.一种方法,包括:

23.如权利要求22所述的方法,其中,用于第一源操作对象的标识的字段用于标识向量寄存器。

24.如权利要求22所述的方法,其中,用于第一源操作对象的标识的字段用于标识存储器位置。

25.如权利要求22-24中任一项所述的方法,其中,所述一个或多个分类检查是以下各项中的一项或多项:静默非数qnan、信令非数snan、正零、负零、正无穷、负无穷、非正规、或有限负数。


技术总结
本申请公开了BFLOAT16分类和操纵指令。描述了用于使用单个指令进行BF16分类或操纵的技术。示例性指令包括用于以下各项的字段:操作码、紧缩数据源操作对象的位置的标识、要执行的一个或多个分类检查的指示、以及紧缩数据目的地操作对象的标识,其中,操作码用于指示出执行电路要进行:针对紧缩数据源操作对象的每个数据元素位置、根据所指示的一个或多个分类检查来执行分类,以及将分类的结果存储在目的地操作对象的对应数据元素位置中。

技术研发人员:M·阿德尔曼,A·海内克,R·凡伦天,Z·斯波伯,A·格雷德斯廷,M·查尼,E·吉奥加纳斯,D·卡拉姆卡,C·休斯,C·安德森
受保护的技术使用者:英特尔公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1