背景技术:
1、近年来,已经证明具有较低精度的乘法和较高精度的累加的融合乘加(fused-multiply-add,fma)单元在机器学习/人工智能应用中是有用的,最显著的是在训练深度神经网络时是有用的,这是由于其极高的计算强度。相较于经典的ieee-754 32比特(fp32)和64比特(fp64)算术,此种精度降低的算术在性质上可以与其缩短的宽度不成比例地加速。
技术实现思路
1.一种设备,包括:
2.如权利要求1所述的设备,其中,用于第一源操作对象的标识的字段用于标识向量寄存器。
3.如权利要求1所述的设备,其中,用于第一源操作对象的标识的字段用于标识存储器位置。
4.如权利要求1-3中任一项所述的设备,其中,所述一个或多个分类检查是以下各项中的一项或多项:静默非数qnan、信令非数snan、正零、负零、正无穷、负无穷、非正规或有限负数。
5.如权利要求1-4中任一项所述的设备,其中,要执行的所述一个或多个分类检查用于由立即数提供。
6.如权利要求1-4中任一项所述的设备,其中,要执行的所述一个或多个分类检查用于由所标识的寄存器提供。
7.如权利要求1-6中任一项所述的设备,其中,所述指令进一步包括用于写入掩码寄存器的一个或多个字段。
8.一种系统,包括:
9.如权利要求8所述的系统,其中,用于第一源操作对象的标识的字段用于标识向量寄存器。
10.如权利要求8所述的系统,其中,用于第一源操作对象的标识的字段用于标识存储器位置。
11.如权利要求8-10中任一项所述的系统,其中,所述一个或多个分类检查是以下各项中的一项或多项:静默非数qnan、信令非数snan、正零、负零、正无穷、负无穷、非正规、或有限负数。
12.如权利要求8-11中任一项所述的系统,其中,要执行的所述一个或多个分类检查用于由立即数提供。
13.如权利要求8-12中任一项所述的系统,其中,所述指令进一步包括用于写入掩码寄存器的一个或多个字段。
14.如权利要求8-13中任一项所述的系统,其中,要执行的所述一个或多个分类检查用于由所标识的寄存器提供。
15.一种非暂态机器可读介质,至少存储特定的单个指令的实例,其中,所述特定的单个指令的所述实例用于由处理器通过执行包括以下步骤的方法来处理:
16.如权利要求15所述的非暂态机器可读介质,其中,用于第一源操作对象的标识的字段用于标识向量寄存器。
17.如权利要求15所述的非暂态机器可读介质,其中,用于第一源操作对象的标识的字段用于标识存储器位置。
18.如权利要求15-17中任一项所述的非暂态机器可读介质,其中,所述一个或多个分类检查是以下各项中的一项或多项:静默非数qnan、信令非数snan、正零、负零、正无穷、负无穷、非正规、或有限负数。
19.如权利要求15-18中任一项所述的非暂态机器可读介质,其中,要执行的所述一个或多个分类检查用于由立即数提供。
20.如权利要求15-18中任一项所述的非暂态机器可读介质,其中,所述指令进一步包括用于写入掩码寄存器的一个或多个字段。
21.如权利要求15-20中任一项所述的非暂态机器可读介质,其中,要执行的所述一个或多个分类检查用于由所标识的寄存器提供。
22.一种方法,包括:
23.如权利要求22所述的方法,其中,用于第一源操作对象的标识的字段用于标识向量寄存器。
24.如权利要求22所述的方法,其中,用于第一源操作对象的标识的字段用于标识存储器位置。
25.如权利要求22-24中任一项所述的方法,其中,所述一个或多个分类检查是以下各项中的一项或多项:静默非数qnan、信令非数snan、正零、负零、正无穷、负无穷、非正规、或有限负数。