本公开涉及处理技术,尤其涉及执行针对输入的信息的处理的处理方法以及利用它的处理装置。
背景技术:
1、在图像识别处理中例如使用deep learning(深度学习)。deep learning(深度学习)作为使用多层神经网络的机械学习的方法论而已知,多层神经网络例如使用卷积神经网络。卷积神经网络由反复进行局部区域的卷积(convolution)和池化(pooling)的多层神经网络形成。进而,提出了将构成卷积神经网络的全连接层设于卷积层的完全卷积神经网络的构造(例如,参照专利文献1)。
2、[在先技术文献]
3、[专利文献]
4、专利文献1:国际公开第19/159419号
技术实现思路
1、[发明要解决的课题]
2、由于完全卷积神经网络是局部区域的处理的叠加,因此成为处理对象的图像内的要素的位置关系不确定。为了提高神经网络中的图像识别的精度,优选能够确定图像内的要素的位置关系。
3、本公开鉴于以上状况而完成,其目的在于提供一种提高不包含全连接层的神经网络中的图像识别的精度的技术。
4、[用于解决技术课题的技术方案]
5、为了解决上述课题,本公开的一个方案的处理装置包括:第1处理部,其通过对成为处理对象的对象图像执行第1神经网络的处理,而生成尺寸小于对象图像的第1特征图;放大部,其为了使在第1处理部中生成的第1特征图成为与对象图像相同的尺寸而将其放大;组合部,其通过将在放大部中放大后的第1特征图与对象图像组合而生成组合图像;以及第2处理部,其通过对在组合部中生成的组合图像执行第2神经网络的处理,而生成尺寸小于对象图像且大于第1特征图的第2特征图。第1处理部的第1神经网络和第2处理部的第2神经网络不包含全连接层,在学习时,进行仅针对第1处理部的第1神经网络的第1阶段的学习,在学习时,在进行了针对第1神经网络的第1阶段的学习的状态下,进行针对第2处理部的第2神经网络的第2阶段的学习。
6、本公开的另一方案是处理方法。该方法包括:通过对成为处理对象的对象图像执行第1神经网络的处理,而生成尺寸小于对象图像的第1特征图的步骤;为了使生成的第1特征图成为与对象图像相同的尺寸而将其放大的步骤;通过将放大后的第1特征图与对象图像组合而生成组合图像的步骤;以及通过对生成的组合图像执行第2神经网络的处理,而生成尺寸小于对象图像且大于第1特征图的第2特征图的步骤。第1神经网络和第2神经网络不包含全连接层,在学习时,进行仅针对第1神经网络的第1阶段的学习,在学习时,在进行了针对第1神经网络的第1阶段的学习的状态下,进行针对第2神经网络的第2阶段的学习。
7、此外,以上构成要素的任意组合、将本公开的表现在方法、装置、系统、计算机程序或记录了计算机程序的记录介质等之间进行转换的方式,作为本公开的方式也是有效的。
8、[发明效果]
9、根据本公开,能够提高不包含全连接层的神经网络中的图像识别的精度。
1.一种处理装置,包括:
2.如权利要求1所述的处理装置,其特征在于,
3.一种处理方法,包括: