本公开属于硬件神经网络,特别涉及一种对硬件神经网络芯片进行能耗精度协同优化的方法。
背景技术:
1、随着人工智能时代的到来,物联网和边缘计算的不断发展使全球数据量迅速增加,对这些数据信息的高速处理以及处理信息带来的能耗问题已成为重大挑战。同时人工智能在边缘设备上的应用越来越受到人们的关注。然而,传统的神经网络在边缘设备上存在严重的能耗问题,限制了其在低能耗环境中的应用。
2、传统的计算机采用冯诺依曼计算架构,其逻辑运算单元和存储单元相互分离,数据在运算单元和存储单元之间传输的过程中消耗了大量的能耗,同时降低了数据处理的运算速度。
3、人工神经网络是仿照生物神经网络处理信息的工作模式抽象出来的一种数学模型,它是由大量节点相互连接而成的复杂网络,其中每个节点称之为神经元,神经元通过非线性函数处理信息。节点之间的连接称之为突触,突触为连接节点的信号增加一个权重,现代人工智能依赖于深度神经网络算法。
4、神经网络的工作能力依赖神经网络的复杂度,功能越强大的神经网络需要越多的神经元和突触数量,这也对计算机的算力提出了要求。目前神经模型朝着拥有更大更深并且拥有更多参数的神经网络结构发展,不断庞大的数据量挑战着计算机的算力。然而,目前神经网络在计算机中的应用,一般由中央处理器(cpu)、图形处理器(gpu)、现场可编程门阵列(fpga)等芯片载体进行计算处理,缺乏专用的硬件架构支持。一方面使用传统的cmos结构需要耗费大量面积,另一方面这种架构计算和存储是空间分离的,所需要的能量相当庞大,不利于高效学习。
5、综上,使用传统芯片实现人工智能在边缘设备上的应用,存在着硬件面积大、耗费能源高的问题;因此,需要提出一种对硬件神经网络芯片进行能耗精度协同优化的方法,在保证精度的同时进一步降低硬件神经网络系统的能耗。
技术实现思路
1、为了解决上述问题,本公开提供了一种对硬件神经网络芯片进行能耗精度协同优化的方法,包括如下步骤:
2、s100:调控硬件神经网络的写输入;
3、s200:基于调控后的输入,使构成硬件神经网络的新型存储器随机翻转;
4、s300:重复上述步骤s100和s200,利用硬件神经网络的容错性使输出结果保持高精度。
5、本方法与现有技术相比,带来的有益效果为:
6、1、本方法使用新型存储器构建基于存内计算架构的硬件神经网络,利用新型存储器的随机翻转特性及神经网络本身固有的容错性,通过调控硬件神经网络芯片的写输入,在保证精度的同时大幅降低芯片功耗。与使用全电压写入模式的通用芯片实现神经网络算法相比,大大节约了硬件开销,减少了能量消耗。
7、2、针对传统的神经网络在边缘设备上的应用存在严重的能耗问题,该方法主动利用了神经网络本身固有的容错性,对神经网络在边缘设备上的应用具有重要意义;同时仅通过调控写输入操作来调控新型随机存储器的随机翻转,操作简便且可应用于不同的神经网络。
8、3、在数字型硬件神经网络中通常使用多个新型非易失性存储器表示一个突触权重,在反向传播过程中对存储器进行写入操作时,写入电流需要大于临界电流以确保存储器完全翻转。本方法利用新型存储器的随机翻转概率可通过电压或电流脉冲调控的特性,以及神经网络的容错性,通过降低脉冲幅值或脉冲宽度,使新型存储器的随机翻转概率低于100%,从而在保证精度的情况下大幅降低了神经网络的计算能耗。
9、4、本方法操作简便,可靠性高,可适用于计算量庞大的复杂神经网络,在硬件神经网络等技术领域具有良好的应用前景。
1.一种对硬件神经网络芯片进行能耗精度协同优化的方法,包括如下步骤:
2.根据权利要求1所述的方法,其中,优选的,步骤s100具体是指调控写入电压或调控写入电流,其中,调控写入电压的方法为降低施加在新型存储器两端的电压脉冲幅值或降低写入电压脉冲宽度;调控写入电流的方法为降低施加在新型存储器两端的电流脉冲幅值或降低写入电流脉冲宽度。
3.根据权利要求2所述的方法,所述电压脉冲宽度处于1ns到100us范围内,电压脉冲幅值处于100mv到10v范围内。
4.根据权利要求1所述的方法,所述硬件神经网络的新型存储器采用自旋转移扭矩磁性随机存储器stt-mram。
5.根据权利要求4所述的方法,所述stt-mram为三明治结构,主要包括自由层、隧穿层和钉扎层;其中,自由层和钉扎层由铁磁材料构成,隧穿层由非磁绝缘材料构成。
6.根据权利要求1所述的方法,所述硬件神经网络使用多个新型存储器拼接表示一个权值,通过调控所述硬件神经网络的写输入,实现对硬件神经网络中权值更新概率的调控。
7.根据权利要求6所述的方法,对所述权值更新概率的调控为对较高有效位施加正常写入电压或写入电流,对较低有效位施加更低的写入电压或写入电流。
8.根据权利要求1所述的方法,所述新型存储器随机翻转是指在写输入激励下发生高阻态和低阻态两种状态之间的翻转。
9.根据权利要求1所述的方法,所述基于新型存储器包括磁性随机存储器、阻变存储器、相变存储器和铁电存储器。
10.根据权利要求1所述的方法,所述基于新型存储器的硬件神经网络包括多层感知器、循环神经网络和卷积神经网络。