本发明属于光学神经网络,具体涉及一种光学神经网络的可变增益电光非线性激活函数的实现方法,适用于非线性激活函数利用查找表改变可变增益放大器的放大倍数和调节偏置电压,实现对光信号的相位调制。
背景技术:
1、光学神经网络(optical neural network,onn)是一种利用光学元件和光信号来模拟人工神经网络的计算方法,运算过程主要包括光学矩阵乘法和非线性激活函数两部分。非线性激活函数是光学神经网络具有强大学习能力的关键因素,它使光学神经网络能够学习输入和输出之间的复杂非线性关系,从而提升分类准确率。然而,如何在大规模集成的光学神经网络中实现非线性激活函数仍然是一个重大挑战。实现片上光学非线性功能的主要难点之一是光子平台中的非线性相对较弱。因此,要实现强非线性激活函数,就需要非常长的波导相互作用长度和高的光信号功率,这将导致光学神经网络的占用面积和功耗增加。此外,在器件制作过程中,由于组件是固定的,所以通常光学神经网络的非线性响应是恒定的,这限制了非线性激活函数的灵活性,使得光学神经网络难以产生不同的响应以适应不同的机器学习任务。而且,光信号经过多层的神经网络衰减后,功率可能会降低到低于激活函数阈值的水平,因此,构建一个可重构的光学非线性激活函数是十分必要的。
2、目前,实现非线性激活函数的光学体系主要分为两类:一类是光-电-光(optical-electrical-optical,o-e-o)体系;另一类是全光体系。o-e-o体系主要包括两种调制方法:电吸收调制器(electro-absorption modulator,eam)调制和电光调制器(electro-optical modulator,eom)调制。电吸收调制器通过调节信号的振幅来实现非线性调制,而电光调制器则需要利用马赫-曾德尔干涉仪(mach-zender interferometer,mzi)或微环谐振器(micro ring resonator,mrr)中的相移来实现非线性调制。由于电光调制器是基于场驱动而非载流子驱动,因此电光调制器的响应速度比电吸收调制器快。此外,电光调制器的插入损耗小,不会对光信号造成额外的吸收,所以其损耗比电吸收调制器低,但电光调制器结构相对复杂,集成度不及电吸收调制器。在电吸收调制器调制体系中,光的非线性调制是通过改变施加在电吸收调制器上的偏压大小来控制电吸收调制器的吸收光强,偏压越大,吸收的光越少。在电光调制器调制体系中,可重构的光学非线性激活函数方法是将光学矩阵乘法单元的输出光信号通过定向耦合器,使其分为功率大小不同的两部分,其中较小的一部分经过光电探测器转化为电流,再通过跨阻放大器(trans impedance amplifier,tia)放大为电压,最后加上偏置电压,形成调制电压。调制电压作用于调制器,对较大的一部分输出光信号进行调制。然而,这种方法的局限性在于,当元器件固定时,激活函数的阈值也是固定的,无法调节,而且一个自由度的函数变换也不能满足多样化的机器学习任务的需求。
技术实现思路
1、本发明的目的在于针对现有技术存在的上述问题,提供一种光学神经网络的可变增益电光非线性激活函数的实现方法。
2、本发明的上述目的通过以下技术手段来实现:
3、光学神经网络的可变增益电光非线性激活函数的实现方法,包括以下步骤:
4、步骤1、获取数据集,对数据集进行预处理得到输入到光学神经网络模型的样本,再将样本划分为训练集和测试集;
5、步骤2、搭建光学神经网络模型,光学神经网络模型包括n个全连接神经网络层和一个dropout层,每个全连接神经网络层包括64×64的mzi阵列和可变增益电光非线性激活函数,可变增益电光非线性激活函数包括定向耦合器、电光调制部分、以及mzi;
6、步骤3、将步骤1中训练集输入到步骤2中搭建好的光学神经网络模型中对光学神经网络模型进行训练,使得光学神经网络模型的损失函数最小;
7、步骤4、通过步骤1中测试集对训练后的光学神经网络模型进行测试,得到训练后的光学神经网络模型对测试集的分类精度。
8、如上所述步骤1中对数据集进行预处理具体包括以下过程:
9、首先对数据集中每张图像进行傅里叶变换,得到每张图像对应的傅里叶变换矩阵,然后将傅里叶变换矩阵中的零频分量移动到矩阵中心,最后提取矩阵中心的8×8区域的64个数据值作为输入到光学神经网络模型的样本。
10、如上所述n个全连接神经网络层的输入输出关系为:
11、当i为1时,第i个全连接神经网络层的输入为样本;当i大于等于2且小于等于n时,第i个全连接神经网络层的输入为第i-1个全连接神经网络层的输出;
12、第i个全连接神经网络层的输入xi-1输入到第i个全连接神经网络层的mzi阵列,第i个全连接神经网络层的mzi阵列基于以下公式得到第i个全连接神经网络层的mzi阵列的输出mi:
13、mi=wi×xi-1+bi
14、式中,wi为第i个全连接神经网络层的mzi阵列的mzi权重矩阵,bi为第i个全连接神经网络层的mzi阵列的偏置。
15、如上所述第i个全连接神经网络层的mzi阵列的输出mi输入到可变增益电光非线性激活函数的耦合系数为α的定向耦合器中,可变增益电光非线性激活函数的定向耦合器将输出mi中光功率为α|mi|2的光信号分离出来,输入到可变增益电光非线性激活函数的电光调制部分,将输出mi中光功率为(1-α)|mi|2的光信号输入到可变增益电光非线性激活函数中的mzi中进行相位调制;
16、电光调制部分包括光电探测器、跨阻放大器、可变增益放大器、以及查找表;
17、电光调制部分基于以下公式得到调制电压vg:
18、vg=αkdgr|mi|2+vb
19、式中,k为可变增益放大器的增益控制系数,d为可变增益放大器的增益控制字,g为跨阻放大器的增益,r为光电探测器响应率,vb为电光调制部分的偏置电压;
20、可变增益放大器的增益控制字d由查找表相应位置的数据给出。
21、如上所述可变增益电光非线性激活函数的mzi包括上臂波导、下臂波导、以及热移相器;
22、电光调制部分输出的调制电压vg加载到可变增益电光非线性激活函数的mzi的热移相器上,热移相器基于以下公式产生相移δφ:
23、
24、式中,vπ是热移相器产生π幅度的相位偏移所需要的电压;
25、热移相器加载在上臂波导中,光功率为(1-α)|mi|2的光信号输入到上臂波导,下臂波导的输入为0;
26、可变增益电光非线性激活函数的mzi基于以下公式对光功率为(1-α)|mi|2的光信号进行相位调制,得到下臂波导的输出f(mi):
27、
28、式中,j为虚数单位;
29、gφ为相位增益参数,基于以下公式计算:
30、
31、φb为偏置电压增益参数,基于以下公式计算:
32、
33、非线性激活函数的阈值pth基于以下公式计算:
34、
35、本发明相对于现有技术,具有以下有益效果:
36、(1)、本发明的可变增益电光非线性激活函数能利用查找表改变可变增益放大器的增益控制字和调节偏置电压,从而实现对光信号的相位调制,与现有的电光非线性激活函数相比,本发明的可变增益电光非线性激活函数具有增益控制字和偏置电压两个自由度,在人工搭建光学神经网络时,可以根据不同的机器学习任务,灵活地选择非线性激活函数;
37、(2)、本发明可以通过改变可变增益放大器的增益控制字来调节非线性激活函数的阈值,阈值体现为调制电压vg的变化,使非线性激活函数能够对低功率的输入光信号也能进行非线性调制。