一种基于细粒度特征提取的图像理解方法

文档序号:27977873发布日期:2021-12-15 01:22阅读:来源:国知局

技术特征:
1.一种基于细粒度特征提取的图像理解方法,其特征在于,包括步骤:s10,对输入图像进行特征提取;s20,基于提取特征进行图像子区域定位,对每一个子定位区域提取对应的区域特征;然后基于所述区域特征生成各自的区域描述信息;s30,将所有区域描述信息进行统一的整合生成针对于输入图像内容的长文本描述。2.根据权利要求1所述的一种基于细粒度特征提取的图像理解方法,其特征在于,在所述步骤s10中:利用卷积神经网络对对输入图像进行特征提取,获取输入图像的特征。3.根据权利要求2所述的一种基于细粒度特征提取的图像理解方法,其特征在于,在所述步骤s20中:通过区域建议网络将输入图像的特征进行图像子区域定位。4.根据权利要求3所述的一种基于细粒度特征提取的图像理解方法,其特征在于,在所述步骤s20中:对每个子定位区域通过卷积神经网络进行区域特征提取。5.根据权利要求4所述的一种基于细粒度特征提取的图像理解方法,其特征在于,在所述步骤s20中:对每个子定位区域的区域特征通过循环神经网络生成各自的区域描述信息。6.根据权利要求1

5中任一所述的一种基于细粒度特征提取的图像理解方法,其特征在于,在步骤s30中,将所有区域描述信息进行统一的整合生成针对于输入图像内容的长文本描述,包括步骤:对第i个长文本描述的生成是在第i个区域描述信息的基础上使用其他所有的区域描述去合成的。7.根据权利要求6所述的一种基于细粒度特征提取的图像理解方法,其特征在于,利用卷积神经网络将所有区域描述信息进行统一的整合生成针对于输入图像内容的长文本描述。

技术总结
本发明公开一种基于细粒度特征提取的图像理解方法,包括步骤:对输入图像进行特征提取;基于提取特征进行图像子区域定位,对每一个子定位区域提取对应的区域特征;然后基于所述区域特征生成各自的区域描述信息;将所有区域描述信息进行统一的整合生成针对于输入图像内容的长文本描述。本发明采用细粒度的特征提取方式实现更准确的区域定位从而促进区域内容描述的准确性。同时本发明对所有合成的图像区域内容描述进行统一的整合并生成几句更高准确度的长文本描述,提高图像充分理解技术的实用性。同时本发明也能够使机器更好的理解图像内容并为人类提供更好的服务,这对于促进机器更加智能具有重大作用。机器更加智能具有重大作用。机器更加智能具有重大作用。


技术研发人员:俞文心 张志强 丁劲皓 凌德玉 车璐 龚俊
受保护的技术使用者:西南科技大学
技术研发日:2021.08.23
技术公布日:2021/12/14
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1