技术特征:
1.一种基于光学片上超表面的光子衍射神经元,其特征在于,所述基于光学片上超表面的光子衍射神经元包括:介质基板、输入波导、输出波导、优化区域和散射元;其中,介质基板为平板状,采用在设定波长下对光的传输没有损耗的材料;介质基板的一侧为入射端,另一侧为出射端,入射端一侧的形状为圆弧形;输入波导连接至介质基板的输入端,介质基板的出射端连接至输出波导;输入波导包括n个输入通道,输出波导包括m个输出通道;对应每一个输入通道,在介质基板上紧贴靠近输入波导的位置设置多个优化区域,所有的优化区域围绕入射端的圆弧放置;每一个优化区域为矩形;在优化区域内形成各个散射元,散射元采用折射率与介质基板不同的材料,通过反向设计方法得到优化区域内的散射元的位置和形状,从而在介质基板上的优化区域内形成散射元构成光学片上超表面结构,m和n均为≥2的自然数;在计算机中建立单独的神经元的计算机模型,加入符合以光子作为信息载体的训练模型的约束条件,包括需要满足能量守恒定律以及采用复数编码;采用优化器以梯度下降的优化方式对神经元构成的神经网络在计算机上进行训练;当对神经元的各个输入通道输入相干光时,神经网络的参数信息编码在每个输入通道的光的输入复振幅和输出通道的光的目标复振幅中,光的输入和目标复振幅中包含了光的振幅和和相位信息;由于使用光的振幅和相位计算缓慢且不稳定,将光的振幅和相位通过欧拉公式转换为复数的实部和虚部,使每一个神经元的权重矩阵成为一个复数矩阵;在训练过程中,采用损失函数作为预测值和目标值之间误差的度量,损失函数用于在优化器中计算并更新神经网络的每一层权重矩阵的实部和虚部;得到训练之后的神经网络的权重矩阵,每个神经元的权重矩阵的维数为n
×
m,用反向设计方法优化的每一个光学片上超表面结构需要实现输入通道与输出通道之间的全连接,通过权重矩阵得到每一个输出通道的目标复振幅;对每个神经元,1
×
m维的输出复振幅a
output
写为n
×
m维的权重矩阵w与1
×
n维的输入复振幅a
input
进行矩阵向量乘法之后的结果,即a
output
=wa
input
,并从输出通道的目标复振幅a
output
中提取出每个输出通道的目标平均相位和目标输出功率,其中,a
om
为第m输出通道的振幅,第m输出通道的目标平均相位为第m输出通道的目标输出功率t
om
=|a
om
|2,m=1,
…
,m;采用拓扑优化的密度惩罚算法对优化区域内的材料的折射率分布进行计算,将优化区域内的部分介质基板换成散射元,折射率的初始条件为散射元的折射率与介质基板的折射率的均值,简化各向同性材料惩罚指数为固定值;设定目标函数为:率的均值,简化各向同性材料惩罚指数为固定值;设定目标函数为:其中,神经元每个输出通道的平均相位和输出功率是无量纲且归一化的,和t
m
分别表示经算法优化得到的第m输出通道的平均相位和输出功率,和t
om
分别表示从神经网络的训练结果中获得的第m输出通道的目标平均相位和目标输出功率,m为输出通道的个数;在经过n次迭代,当误差小于设定阈值时目标函数已收敛,停止优化,将拓扑优化的结果二值化以匹配材料真实折射率,其中一个值为介质基板的折射率,一个值为散射元的折射率,从而在优化区域中得到散射元的位置和形状;将优化出的各个光子衍射神经元在纵向独立平行排列成阵列,将各个光子衍射神经元的输入波导局部连接至上一层的输出波导,将输出波导局部连接到下一层光子衍射神经元的输入波导,或者非线性层或探测器,得到完整的片上光学神经网络;光信号从输入波导的一个输入通道进入至优化之后的光学片上超表面结构,优化区域
内的散射元散射光信号;优化区域围绕圆弧放置,从而最大限度地减少散射损耗;经输入波导进入光学片上超表面结构的光信号在优化区域内发生设定的衍射,光学片上超表面结构对入射光信号的影响等同于权重矩阵与输入通道的光的输入复振幅进行矩阵向量乘法,继而在输出波导的每一个输出通道收集计算后的目标复振幅。2.如权利要求1所述的基于光学片上超表面的光子衍射神经元,其特征在于,对于光波长在通信波段,所述介质基板采用硅、氮化硅、铌酸铌和有机聚合物中的一种。3.如权利要求1所述的基于光学片上超表面的光子衍射神经元,其特征在于,所述优化区域的宽度与输入波导末端尺寸一致,长度为宽度的0.8~1倍。4.一种如权利要求1所述的基于光学片上超表面的光子衍射神经元的实现方法,其特征在于,所述实现方法包括以下步骤:1)设置光子衍射神经元:提供介质基板,介质基板为平板状,采用在设定波长下对光的传输没有损耗的材料;质基板的一侧为入射端,另一侧为出射端,入射端一侧的形状为圆弧形;输入波导连接至介质基板的输入端,介质基板的出射端连接至输出波导;输入波导包括n个输入通道,输出波导包括m个输出通道;对应每一个输入通道,在介质基板上紧贴靠近输入波导的位置设置多个优化区域,所有的优化区域围绕入射端的圆弧放置;每一个优化区域为矩形;在优化区域内形成各个散射元,散射元采用折射率与介质基板不同的材料,通过反向设计方法得到优化区域内的散射元的位置和形状,从而在介质基板上的优化区域内形成散射元构成光学片上超表面结构,m和n均为≥2的自然数;2)在计算机中建立单独的神经元的计算机模型,加入符合以光子作为信息载体的训练模型的约束条件,包括需要满足能量守恒定律以及采用复数编码;采用优化器以梯度下降的优化方式对神经元构成的神经网络在计算机上进行训练;当对神经元的各个输入通道输入相干光时,神经网络的参数信息编码在每个输入通道的光的输入复振幅和输出通道的光的目标复振幅中,光的输入和目标复振幅中包含了光的振幅和和相位信息;由于使用光的振幅和相位计算缓慢且不稳定,将光的振幅和相位通过欧拉公式转换为复数的实部和虚部,使每一个神经元的权重矩阵成为一个复数矩阵;在训练过程中,采用损失函数作为预测值和目标值之间误差的度量,损失函数用于在优化器中计算并更新神经网络的每一层权重矩阵的实部和虚部;得到训练之后的神经网络的权重矩阵,每个神经元的权重矩阵的维数为n
×
m,用反向设计方法优化的每一个光学片上超表面结构需要实现输入通道与输出通道之间的全连接,通过权重矩阵得到每一个输出通道的目标复振幅;对每个神经元,1
×
m维的输出复振幅a
output
写为n
×
m维的权重矩阵w与1
×
n维的输入复振幅a
input
进行矩阵向量乘法之后的结果,即a
output
=wa
input
,并从输出通道的目标复振幅a
output
中提取出每个输出通道的目标平均相位和目标输出功率,其中,a
om
为第m输出通道的振幅,第m输出通道的目标平均相位为第m输出通道的目标输出功率t
om
=|a
om
|2;3)采用拓扑优化的密度惩罚算法对优化区域内的材料的折射率分布进行计算,将优化区域内的部分介质基板换成散射元,折射率的初始条件为散射元的折射率与介质基板的折射率的均值,简化各向同性材料惩罚指数为固定值;设定目标函数为:其中,神经元每个输出通道的平均相位和输出功率是无量
纲且归一化的,和t
m
分别表示经算法优化得到的第m输出通道的平均相位和输出功率,和t
om
分别表示从神经网络的训练结果中获得的第m输出通道的目标平均相位和目标输出功率,m为输出通道的个数,m=1,
…
,m;在经过n次迭代,当误差小于设定阈值时目标函数已收敛,停止优化,将拓扑优化的结果二值化以匹配材料真实折射率,其中一个值为介质基板的折射率,一个值为散射元的折射率,从而在优化区域中得到散射元的位置和形状;4)将优化出的各个光子衍射神经元在纵向独立平行排列成阵列,将各个光子衍射神经元的输入波导局部连接至上一层的输出波导,将输出波导局部连接到下一层光子衍射神经元的输入波导,或非线性层或探测器,得到完整的片上光学神经网络;5)光信号从输入波导的一个输入通道进入至优化之后的光学片上超表面结构,优化区域内的散射元散射光信号;优化区域围绕圆弧放置,从而最大限度地减少散射损耗;经输入波导进入光学片上超表面结构的光信号在优化区域内发生设定的衍射,光学片上超表面结构对入射光信号的影响等同于权重矩阵与输入通道的光的输入复振幅进行矩阵向量乘法,继而在输出波导的每一个输出通道收集计算后的目标复振幅。5.如权利要求4所述的实现方法,其特征在于,在步骤2)中,以梯度下降的优化方式对神经元构成的神经网络进行训练中,采用优化器的误差反向传播算法,优化器的两个动量超参数设置范围为[0,1),学习率设置范围为0~1。6.如权利要求4所述的实现方法,其特征在于,在步骤3)中,各向同性材料惩罚指数的固定值的取值范围为3~5。7.如权利要求4所述的实现方法,其特征在于,在步骤3)中,迭代次数n为500~1000。8.如权利要求4所述的实现方法,其特征在于,在步骤3)中,损失函数的设定阈值小于0.01。
技术总结
本发明公开了一种基于光学片上超表面的光子衍射神经元及其实现方法。本发明在介质基板上紧贴靠近输入波导的位置设置多个优化区域,在优化区域内形成各个散射元,采用优化器以梯度下降的优化方式对神经元构成的神经网络在计算机上进行训练,采用拓扑优化的密度惩罚算法对优化区域内的材料的折射率分布进行计算,通过反向设计方法得到优化区域内的散射元的位置和形状,从而在介质基板上的优化区域内形成散射元构成光学片上超表面结构;本发明通过将片上波导与光学片上超表面结构相结合,实现了高度集成的多输入多输出新型光子衍射神经元结构,解决了光学神经网络中参数密度低的问题,扩展了光学神经网络的功能,为大规模光学神经网络提供了可能。光学神经网络提供了可能。光学神经网络提供了可能。
技术研发人员:胡小永 龚旗煌 廖琨 戴天翔
受保护的技术使用者:北京大学
技术研发日:2022.05.12
技术公布日:2022/7/29