一种卷积神经网络并行化训练加速方法与流程

文档序号：14555678阅读：来源：国知局

技术特征：

技术总结
本发明提供一种卷积神经网络并行化训练加速方法，提出了mixed‑batch思想，应用于CPU与FPGA组成的整机系统，主要解决在大规模的卷积神经网络结构下，利用FPGA对一个batch的样本并行训练时，存在存储空间不足的问题，可应用于计算机视觉领域的图像识别，目标检测。上述方法包括以下步骤：1、在数据预处理阶段，将原始训练库的样本随机重排。2、在前馈计算阶段，数据以batch形式写入共享内存，基于OpenCL语言实现的卷积神经网络各个层内并行处理，在网络的首个全连接层随机读取前一层batch中的一个样本的数据，并计算该层的输出。3、在更新局部误差阶段，用首个全连接层的局部误差随机更新前一层batch中某个样本的局部误差，其余的各个层并行计算局部误差。

技术研发人员：洪启飞;阮爱武;史傲凯
受保护的技术使用者：电子科技大学
技术研发日：2018.01.16
技术公布日：2018.05.29

完整全部详细技术资料下载

当前第2页1 2