本技术涉及计算机,尤其涉及一种目标检测的方法、装置、设备及存储介质。
背景技术:
1、随着人工智能的不断发展,金融机构逐渐将其应用至生产生活中。
2、光学字符识别(ocr,optical character recognition)文本技术是利用光学字符识别,通过采集文本,对文本图像进行明暗分析,对比字符库等操作,从而输出文本,解决了因手动输入大量文本而导致的准确率低、输入慢等问题。然而该技术严重依赖于光线、网络等外部环境,在光线灰暗和网络较差的环境下,往往识别效果差,甚至无法识别。
3、目前,关于如何提高ocr技术的识别文本效率,提升用户体验感,是一个亟待解决的问题。
技术实现思路
1、本技术提供一种目标检测的方法、装置、设备及存储介质,用以解决ocr技术的识别文本效率低,用户体验感差的问题。
2、一方面,本技术提供一种目标检测的方法,包括:
3、获取待检测图片,所述待检测图片中包括目标文本;
4、对所述待检测图片进行特征提取处理,得到目标特征图,所述目标特征图中包括所述待检测图片中的图像特征;
5、通过预设模型对所述目标特征图进行处理,得到目标图片,所述目标图片中包括所述目标文本的指示标志,所述指示标志用于指示所述目标文本。
6、可选地,对所述待检测图片进行特征提取处理,得到目标特征图,包括:
7、通过残差网络对所述待检测图片进行特征提取处理,得到残差特征图,所述残差特征图中包括第一残差特征图、第二残差特征图和第三残差特征图;
8、通过特征金字塔网络对所述残差特征图进行至少一种图像处理,得到所述目标特征图,所述至少一种图像处理包括:特征提取处理、特征融合处理以及卷积映射处理。
9、可选地,通过残差网络对所述待检测图片进行特征提取处理,得到残差特征图,包括:
10、通过所述残差网络的至少一个第一残差层对所述待检测图片进行特征提取处理,得到第一残差特征图;
11、通过所述残差网络的第二残差层对所述第一残差特征图进行处理,得到第二残差特征图;
12、通过所述残差网络的第三残差层对所述第二残差特征图进行处理,得到第三残差特征图。
13、可选地,使用特征金字塔网络对所述残差特征图进行综合处理,得到目标特征图,包括:
14、通过所述特征金字塔网络对所述第一残差特征图、所述第二残差特征图和所述第三残差特征图进行所述至少一种图像处理,得到中间特征图;
15、对所述中间特征图进行激活处理和卷积映射处理,得到第一特征图,以及对所述第三残差特征图进行激活处理和卷积映射处理,得到第二特征图,其中,所述目标特征图包括所述第一特征图和所述第二特征图。
16、可选地,通过所述特征金字塔网络对所述第一残差特征图、所述第二残差特征图和所述第三残差特征图进行所述至少一种图像处理,得到中间特征图,包括:
17、通过所述特征金字塔网络对所述第三残差特征图进行所述至少一种图像处理,得到第三中间特征图;
18、通过所述特征金字塔网络对所述第二残差特征图和所述第三中间特征图进行处理,得到第二中间特征图;
19、通过所述特征金字塔网络对所述第一残差特征图和所述第二中间特征图进行处理,得到第一中间特征图;
20、其中,所述中间特征图包括所述第一中间特征图、所述第二中间特征图和所述第三中间特征图。
21、可选地,对所述中间特征图进行激活处理和卷积映射处理,得到第一特征图,包括:
22、对所述第一中间特征图进行卷积映射处理,得到第一子特征图;
23、对所述第二中间特征图进行卷积映射处理,得到第二子特征图;
24、对所述第三中间特征图进行激活处理和卷积映射处理,得到第三子特征图;
25、其中,所述第一特征图包括所述第一子特征图、所述第二子特征图和所述第三子特征图。
26、可选地,对所述第三残差特征图进行激活处理和卷积映射处理,得到第二特征图,包括:
27、对所述第三残差特征图进行卷积映射处理,得到第四子特征图;
28、对所述第四子特征图进行激活处理和卷积映射处理,得到第五子特征图;
29、其中,所述第二特征图包括所述第四子特征图和所述第五子特征图。
30、另一方面,本技术提供一种目标检测的装置,包括:
31、获取模块,用于获取待检测图片,所述待检测图片中包括目标文本;
32、处理模块,用于对所述待检测图片进行特征提取处理,得到目标特征图,所述目标特征图中包括所述待检测图片中的图像特征;
33、处理模块,还用于通过预设模型对所述目标特征图进行处理,得到目标图片,所述目标图片中包括所述目标文本的指示标志,所述指示标志用于指示所述目标文本。
34、一种可能的实现方式中,处理模块具体用于:
35、通过残差网络对所述待检测图片进行特征提取处理,得到残差特征图,所述残差特征图中包括第一残差特征图、第二残差特征图和第三残差特征图;
36、通过特征金字塔网络对所述残差特征图进行至少一种图像处理,得到所述目标特征图,所述至少一种图像处理包括:特征提取处理、特征融合处理以及卷积映射处理。
37、一种可能的实现方式中,处理模块具体用于:
38、通过所述残差网络的至少一个第一残差层对所述待检测图片进行特征提取处理,得到第一残差特征图;
39、通过所述残差网络的第二残差层对所述第一残差特征图进行处理,得到第二残差特征图;
40、通过所述残差网络的第三残差层对所述第二残差特征图进行处理,得到第三残差特征图。
41、一种可能的实现方式中,处理模块具体用于:
42、通过所述特征金字塔网络对所述第一残差特征图、所述第二残差特征图和所述第三残差特征图进行所述至少一种图像处理,得到中间特征图;
43、对所述中间特征图进行激活处理和卷积映射处理,得到第一特征图,以及对所述第三残差特征图进行激活处理和卷积映射处理,得到第二特征图,其中,所述目标特征图包括所述第一特征图和所述第二特征图。
44、一种可能的实现方式中,处理模块具体用于:
45、通过所述特征金字塔网络对所述第三残差特征图进行所述至少一种图像处理,得到第三中间特征图;
46、通过所述特征金字塔网络对所述第二残差特征图和所述第三中间特征图进行处理,得到第二中间特征图;
47、通过所述特征金字塔网络对所述第一残差特征图和所述第二中间特征图进行处理,得到第一中间特征图;
48、其中,所述中间特征图包括所述第一中间特征图、所述第二中间特征图和所述第三中间特征图。
49、一种可能的实现方式中,处理模块具体用于:
50、对所述第一中间特征图进行卷积映射处理,得到第一子特征图;
51、对所述第二中间特征图进行卷积映射处理,得到第二子特征图;
52、对所述第三中间特征图进行激活处理和卷积映射处理,得到第三子特征图;
53、其中,所述第一特征图包括所述第一子特征图、所述第二子特征图和所述第三子特征图。
54、一种可能的实现方式中,处理模块具体用于:
55、对所述第三残差特征图进行卷积映射处理,得到第四子特征图;
56、对所述第四子特征图进行激活处理和卷积映射处理,得到第五子特征图;
57、其中,所述第二特征图包括所述第四子特征图和所述第五子特征图。
58、本技术的第三方面,提供了一种电子设备,包括:
59、处理器和存储器;
60、存储器存储计算机执行指令;
61、处理器执行存储器存储的计算机执行指令,使得电子设备执行第一方面中任一项的方法。
62、本技术的第四方面,提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面任一项所述的方法
63、本技术的第五方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面任一项所述的方法。
64、本实施例提供了一种目标检测的方法、装置、设备及存储介质,该方法首先获取待检测图片;接着对待检测图片进行特征提取处理,得到目标特征图;最后,通过预设模型对目标特征图进行处理,得到目标图片,目标图片中包括目标文本的指示标志。该方法通过retinanet网络对待检测图片进行特征提取处理,并通过retinanet网络中的预设模型进行进一步的处理,得到带有目标文本指示标志的目标图片,进一步为后续的目标文本识别奠定了基础,提高了目标文本识别的准确率和效率,提升了用户体验感。