本发明属于机器人技术领域,特别是涉及一种基于图像的地点识别方法。
背景技术:
目前,随着人工智能的发展,移动智能机器人被广泛地应用于工业、军事和服务等领域,且发挥着越来越重要的作用。因此,对智能机器人认知环境的能力提出了越来越高的要求。机器人只有在知道自身位置和工作环境的前提下,才能安全有效地进行自主运动。视觉系统能够为机器人提供最丰富的感知信息,同时也最接近人类感知环境的方式。近年来,基于视觉的机器人自定位问题吸引了大量的研究人员,同时也取得了丰硕的研究成果。对于这类问题,往往称之为地点分类问题。
在文献“cn103810500a一种基于有监督学习概率主题模型的地点图像识别方法”中提出了一种基于有监督学习概率主题模型的地点图像识别方法,目的在于更好地解决地点图像识别中由于不同光照和角度、事物变化和运动导致的不确定问题,以及原有lda模型中随主题数目增加图像的识别率出现过拟合现象进而影响图像的识别率的问题。对于特征提取部分,采用了sift对图像局部特征进行检测并生成“词袋”特征,这种人工提取特征的手段具有一定的局限性,其区分性往往较弱。文献“cn110209859a地点识别及其模型训练的方法和装置以及电子设备”公开了一种地点识别及其模型训练的方法和装置、计算机可读存储介质以及电子设备。方法包括:基于cnn模型的第一部分提取样本图像的局部特征;基于cnn模型的第二部分将局部特征聚合成具有第一维数的特征向量;基于cnn模型的第三部分得到特征向量的压缩表示向量,压缩表示向量具有小于第一维数的第二维数;以及以使得多个图像对应的压缩表示向量之间的距离最小化为目标,调整第一至第三部分的模型参数,直至得到满足预设条件的cnn模型。利用cnn模型可以显著提高提取特征的效率,然而深度神经网络的引入不可避免地导致运算速度慢、耗费资源等问题。相关的工作可见“cn107967457a一种适应视觉特征变化的地点识别与相对定位方法及系统”与“cn102609719a基于改进概率主题模型的地点图像识别方法”。
技术实现要素:
本发明克服现有技术的不足,提出一种基于图像的地点识别方法,其过程如下:
步骤1、采集大量的场景图像,得到一系列图像
步骤2、初始化:令迭代步t=0,根据实际情况人工设定最大迭代步t为大于1的正整数,人工设定拉式乘子λ>0为正实数,隐藏层节点数nh>0为大于3的正整数,设定损失系数c>0为正实数;令t=0步的中间变量vt,dt=0;
步骤3、求解特征提取权重矩阵α:
其中,上标t表示矩阵转制,i为单位阵,
步骤4、对特征空间进行变换:
其中,
步骤5、随机生成输入权重向量与输入偏置:
随机生成隐藏层映射函数的输入权重向量
步骤6、计算隐藏层输出函数:
其中,g(a,b,x)为激活函数,x表示样本;
步骤7、计算隐藏层输出矩阵h:
h=[h(x1),…,h(xn)]t
步骤8、初始化输出权重矩阵βt:
βt=h*y
其中,
步骤9、输出权重矩阵迭代优化:
首先令βt+1=(hth+λi)-1(hty+λ(vt+dt)+βt),然后令
步骤10、将新的场景图像初步提取特征后得到其特征向量x,然后进行特征变换,得到变换后的样本
在上述方法中,其中,所涉及的激活函数g(a,b,x)为:
或者
其中,步骤1和10中初步特征提取方法采用自动编码器、或采用视觉词典。
其中,所述自动编码器包括至少一个卷积层和一个池化层。
发明在仅采用了四层的人工神经网络,相比于深度神经网络具有更小的模型体积、更快的训练速度,同时引入了特征提取层以保证特征提取的性能,提升了分类准确度。
附图说明
图1为本发明方法流程图;
具体实施方式
下面结合实例对本发明作进一步描述,但本发明的保护范围并不限于此。
如图1所示,本发明包括以下步骤:
步骤1、采集大量的场景图像,得到一系列图像
步骤2、初始化:令迭代步t=0,根据实际情况人工设定最大迭代步t为大于1的正整数,人工设定拉式乘子λ>0为正实数,隐藏层节点数nh>0为大于3的正整数,设定损失系数c>0为正实数;令t=0步的中间变量vt,dt=0;
步骤3、求解特征提取权重矩阵α:
其中,上标t表示矩阵转制,i为单位阵,
步骤4、对特征空间进行变换:
其中,
步骤5、随机生成输入权重向量与输入偏置:
随机生成隐藏层映射函数的输入权重向量
步骤6、计算隐藏层输出函数:
其中,g(a,b,x)为激活函数,x表示样本;
步骤7、计算隐藏层输出矩阵h:
h=[h(x1),…,h(xn)]t
步骤8、初始化输出权重矩阵βt:
βt=h*y
其中,
步骤9、输出权重矩阵迭代优化:
首先令βt+1=(hth+λi)-1(hty+λ(vt+dt)+βt),然后令
步骤10、将新的场景图像初步提取特征后得到其特征向量x,然后进行特征变换,得到变换后的样本
在上述方法中,优选地,所涉及的激活函数g(a,b,x)为:
再次优选地,所涉及的激活函数g(a,b,x)为:
进一步,优选地,步骤1和10中初步特征提取方法采用自动编码器。
再进一步,优选地,步骤1和10中初步特征提取方法采用视觉词典。
最后优选地,所述自动编码器包括至少一个卷积层和一个池化层。
具体实施中,可以根据需求确定地点类别,例如,如果目的是对家庭中的地点进行识别,则地点类别可以包括:厨房、卧室、客厅、走廊、阳台等。
提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。