本申请涉及计算机技术领域,尤其涉及一种图像识别方法及电子设备。
背景技术:
随着人工智能的广泛应用,光学字符识别ocr(opticalcharacterrecognition)的应用也越来越广泛。例如,应用ocr技术识别店铺招牌文字,从而用来搜索该店铺相关信息等。
在具体应用中,店铺招牌上的文字通常采用非标准字体,例如,为了突出店铺特色,采用与店铺商品相关的特征曲线绘出的文字,达到吸引眼球的目的。
但是这种非标准字体在ocr中识别的准确率较低。
技术实现要素:
有鉴于此,本申请提供一种图像识别方法及电子设备,用以解决现有技术中非标准字体的识别准确率较低的技术问题。
本申请提供了一种图像识别方法,应用于第一设备,所述方法包括:
采集目标图像;
对所述目标图像进行预处理,得到第一处理结果;
将所述第一处理结果及所述第一设备的当前位置信息发送给第二设备,以使得所述第二设备基于所述位置信息和所述第一处理结果,得到第一识别结果,其中,所述第一识别结果为所述目标图像对应的识别结果;
接收所述第二设备发送的所述第一识别结果。
上述方法,优选地,对所述目标图像进行预处理,得到第一处理结果,包括:
对所述目标图像进行文字识别处理,得到第一处理结果。
本申请还提供了另一种图像识别方法,应用于第二设备,所述方法包括:
接收第一设备发送的第一处理结果及所述第一设备的当前位置信息;其中,所述第一处理结果为所述第一设备对采集到的目标图像进行预处理的结果;
根据所述当前位置信息,获得目标文字集合;
利用所述第一处理结果对所述目标文字集合进行匹配,得到第一识别结果,其中,所述第一识别结果为所述目标图像对应的识别结果;
将所述第一识别结果发送给所述第一设备。
上述方法,优选地,利用所述第一处理结果对所述目标文字集合进行匹配,得到第一识别结果,包括:
基于所述第一处理结果,获取至少一个有效文字;
在所述目标文字集合中基于所述有效文字进行匹配处理,以得到第一识别结果。
上述方法,优选地,基于所述第一处理结果,获取至少一个有效文字,包括:
基于所述第一处理结果,利用预设的文字识别模型进行文字识别,以获取至少一个有效文字。
上述方法,优选地,还包括:
基于所述目标图像及所述第一识别结果对所述文字识别模型进行训练优化。
上述方法,优选地,所述根据所述当前位置信息,获得目标文字集合,包括:
基于所述当前位置信息,获得满足预设要求的所有图像文字组合,所述图像文字组合组成目标文字集合,其中,所述预设要求表征所述图像文字组合对应的位置距离所述当前位置在预设范围内。
本申请还提供了另一种图像识别方法,应用于第一设备,所述方法包括:
采集目标图像;
对所述目标图像进行预处理,得到第一处理结果;
根据所述第一设备的当前位置信息,获得目标文字集合;
利用所述第一处理结果对所述目标文字集合进行匹配,得到第一识别结果,其中,所述第一识别结果为所述目标图像对应的识别结果。
本申请还提供了一种电子设备,包括:
图像采集设备,用于采集目标图像;
处理器,用于对所述目标图像进行预处理,得到第一处理结果,将所述第一处理结果及所述电子设备的当前位置信息发送给第二设备,以使得所述第二设备基于所述位置信息和所述第一处理结果,得到第一识别结果,其中,所述第一识别结果为所述目标图像对应的识别结果;接收所述第二设备发送的所述第一识别结果。
本申请还提供了另一种电子设备,包括:
数据传输接口,用于接收第一设备发送的第一处理结果及所述第一设备的当前位置信息;其中,所述第一处理结果为所述第一设备对采集到的目标图像进行预处理的结果;
处理器,用于根据所述当前位置信息,获得目标文字集合;利用所述第一处理结果对所述目标文字集合进行匹配,得到第一识别结果,其中,所述第一识别结果为所述目标图像对应的识别结果;将所述第一识别结果通过所述数据传输接口发送给所述第一设备。
由上述方案可知,本申请提供的一种图像识别方法及电子设备,在采集到目标图像之后,通过对目标图像进行预处理后和当前位置信息发送给第二设备,由第二设备基于第一处理结果和当前位置信息得到第一识别结果后,将第一识别结果发送给第一设备。本申请中利用当前位置信息对目标图像进行预处理后的第一处理结果进行进一步识别,得到目标图像中的第一识别结果,避免目标图像预处理后的识别不理想,准确率低的情况,从而提高目标图像中字符识别的准确率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例一提供的一种图像识别方法的流程图;
图2为本申请实施例的应用示例图;
图3为本申请实施例一的另一流程图;
图4为本申请实施例二提供的一种图像识别方法的流程图;
图5为本申请实施例的另一应用示例图;
图6为本申请实施例二的部分流程图;
图7为本申请实施例的又一应用示例图;
图8为本申请实施例二的另一流程图;
图9为本申请实施例三提供的一种图像识别方法的流程图;
图10为本申请实施例四提供的一种电子设备的结构示意图;
图11为本申请实施例五提供的一种电子设备的结构示意图;
图12~图14分别为本申请实施例的其他应用示例图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参考图1,为本申请实施例一提供的一种图像识别方法的实现流程图,应用于能够进行图像采集及处理的第一设备,该第一设备可以为手机或pad等客户端设备。
在本实施例中,该方法可以包括以下步骤:
步骤101:采集目标图像。
其中,该目标图像是指需要进行字符识别的包含标准字符和/或非标准字符图像的目标图像,如图2中所示,目标图像可以为第一设备对店面牌匾的图像,该图像中包含个性样式的字符“欧米茄钟表”。
具体的,本实施例中可以利用摄像头等图像采集设备实现目标图像的采集。
步骤102:对目标图像进行预处理,得到第一处理结果。
其中,本实施例中可以对目标图像进行去噪及压缩等处理,得到第一处理结果,以便于后续传输中减少传输数据量,提高传输准确率。
步骤103:将第一处理结果及第一设备的当前位置信息发送给第二设备,以使得第二设备基于位置信息和第一处理结果得到第一识别结果。
其中,第一识别结果为目标图像对应的识别结果。
具体的,本实施例中通过第一设备上的定位装置如全球定位系统gps(globalpositioningsystem)或北斗定位系统等获得第一设备的当前位置信息,如位置坐标等,再将第一处理结果与第一设备的当前位置信息一起通过第一设备与第二设备之间的数据连接发送给第二设备。
其中,第一设备与第二设备之间的数据连接可以为无线数据连接,如4g网络、wifi或蓝牙等,也可以为有线数据连接,如通用串行总线usb(universalserialbus)或rj45等连接。
需要说明的是,第二设备在接收到第一设备发送的第一处理结果及第一设备的当前位置信息之后,根据当前位置信息,获得目标文字集合,该目标文字集合是指第一设备周边出现的字符或字符组合所组成的集合,之后,利用第一处理结果对目标文字集合进行匹配,得到第一识别结果,该第一识别结果为目标图像对应的识别结果,之后,将第一识别结果发送给第一设备。
步骤104:接收第二设备发送的第一识别结果。
其中,第一识别结果为目标图像对应的识别结果,由此,在第一识别结果中包含目标图像中识别出来的字符或字符组合,在本实施例中接收到第一识别结果后,将第一识别结果中的字符或字符组合进行后续处理,如展示给用户或者进行数据统计等处理。
由上述方案可知,本申请实施例一提供的一种图像识别方法,在采集到目标图像之后,通过对目标图像进行预处理后和当前位置信息发送给第二设备,由第二设备基于第一处理结果和当前位置信息得到第一识别结果后,将第一识别结果发送给第一设备。本实施例中利用当前位置信息对目标图像进行预处理后的第一处理结果进行进一步识别,得到目标图像中的第一识别结果,避免目标图像预处理后的识别不理想,准确率低的情况,从而提高目标图像中字符识别的准确率。
在一种实现方式中,图1中步骤102可以通过以下方式实现,如图3中所示:
步骤121:对目标图像进行文字识别处理,得到第一处理结果。
其中,本实施例中可以首先对目标图像利用文字识别模型进行文字识别,以获得至少一个有效文字,再对这些有效文字进行压缩处理,由此得到第一处理结果。
需要说明的是,本实施例中的文字识别模型可以为光学字符识别ocr(opticalcharacterrecognition)模型,用以对目标图像进行文字识别,得到目标图像中的字符或字符组合等文字识别结果。
也就是说,本实施例中在第一设备如客户端采集到目标图像之后,对目标图像进行文字识别,得到目标图像中的字符或字符组合等处理结果,再将这些处理结果与第一设备的当前位置信息传递给第二设备,由第二设备利用处理结果中的字符或字符组合对第一设备的当前位置信息所关联的文字进行筛选或匹配,得到最终的识别结果,从而提高文字识别处理结果中字符或字符组合的准确性。
参考图4,为本申请实施例二提供的一种图像识别方法的实现流程图,应用能够进行图像处理的第二设备,该第二设备可以为电脑或服务器等设备。
在本实施例中,该方法可以包括以下步骤:
步骤401:接收第一设备发送的第一处理结果及第一设备的当前位置信息。
其中,第一处理结果为第一设备对采集到的目标图像进行预处理的结果,例如,第一设备可以利用摄像头等图像采集设备采集目标图像,该目标图像是指需要进行字符识别的包含标准字符和/或非标准字符图像的目标图像,如图2中所示。第一设备在采集到目标图像之后,对目标图像进行预处理,得到第一处理结果,例如,第一设备对目标图像进行去噪、压缩及文字识别等处理,得到第一处理结果后,将第一处理结果连同第一设备的当前位置信息一起通过第一设备与第二设备之间的数据连接发送给第二设备,由第二设备对第一处理结果和第一设备的当前位置信息进行接收。
步骤:402:根据当前位置信息,获得目标文字集合。
其中,目标文字集合可以理解为第一设备的当前位置信息所关联的字符或字符组合所组成的集合。在本实施例中预先获取一定范围内各个位置点所关联的文字集合并存储在数据库中,该数据库可以设置在第二设备或者云端,如图5中所示,位置点a和位置点b周边存在“欧米茄钟表”、“路易威登lv”、“和平饭店”、“南京路”和“回音餐厅”等店铺招牌或者路牌,因此,位置点a关联的文字集合中包括:“欧米茄钟表”、“路易威登lv”、“和平饭店”和“南京路”等等,而位置点关联的文字集合中包括:“南京路”和“回音餐厅”等等。在本实施例中,第二设备在接收到第一设备的当前位置信息中,可以在数据库中查找第一设备的当前位置信息所关联的各种字符或字符组合,组成目标文字集合。
步骤403:利用第一处理结果对目标文字集合进行匹配,得到第一识别结果。
其中,第一识别结果为目标图像对应的识别结果。
需要说明的是,第一处理结果中包含对目标图像进行预处理的处理结果,其中可能无法识别出目标图像中的非标准字符,如第一处理结果中包括字符“钟表”,之后第二设备在接收到第一处理结果及第一设备的当前位置信息之后,利用第一处理结果中的字符对第一设备的当前位置信息所关联的目标文字集合中的字符进行筛选或匹配,得到与第一处理结果相对应的字符匹配结果,即为第一识别结果。例如,第二设备用“钟表”对位置点a关联的文字集合:“欧米茄钟表”、“路易威登lv”、“和平饭店”和“南京路”进行匹配,得到第一识别结果“欧米茄钟表”。
步骤404:将第一识别结果发送给第一设备。
其中,第二设备可以通过第一设备与第二设备之间的数据连接将第一设备结果如“欧米茄钟表”发送给第一设备。
由上述方案可知,本申请实施例二提供的一种图像识别方法,在接收到第一设备发送的对目标图像的预处理结果及当前位置信息之后,利用目标图像的预处理结果对当前位置信息所关联的目标文字集合进行进一步的匹配,从而确定目标图像中的文字识别结果。本实施例中在目标图像预处理无法得到理想的文字识别结果时,能够利用目标图像预处理后的处理结果对当前位置信息对应的文字集合进行进一步识别,避免目标图像预处理后的识别不理想,准确率低的情况,从而得到更加准确的目标图像中的文字识别结果,由此提高目标图像中字符识别的准确率。
同时,本实施例中通过将进一步识别的处理由第二设备实现,从而节省第一设备上的处理流程,节约第一设备的处理资源,改善第一设备的使用体验。
在一种实现方式中,图4中步骤403具体可以通过以下步骤实现,如图6中所示:
步骤601:基于第一处理结果,获取至少一个有效文字。
在一种实现方式中,由于目标图像中的字符可能是非标准字符,导致第一设备对目标图像预处理如文字识别后的处理结果中可能存在一些特殊字符,如图7中所示的非标准字符,在第一处理结果中为空格或乱码,为此,第二设备在接收到第一处理结果之后,可以在第一处理结果中剔除乱码或空格等并获取有效字符,如第二设备直接在第一处理结果中的字符中提取有效文字,如图7中的“钟表”。
在另一种实现方式中,第二设备所接收到的第一处理结果为第一设备对目标图像进行去噪和压缩等处理后的处理结果,第二设备首先对第一处理结果解压缩处理,再利用预设的文字识别模型如ocr模型进行文字识别,从而得到至少一个有效字符,如“钟表”。
步骤602:在目标文字集合中基于有效文字进行匹配处理,以得到第一识别结果。
其中,第二设备在获取到第一设备的当前位置信息对应的目标文字集合之后,用从第一处理结果中提取到的有效文字进行匹配,例如,在目标文字集合中查找包含该有效文字的字符串,如“欧米茄钟表”,由此得到第一识别结果,即目标图像的识别结果为“欧米茄钟表”。
进一步的,如果第二设备在目标文字集合中没有找到与第一处理结果匹配的字符或字符组合,那么将第一处理结果作为最终的第一识别结果发送给第一设备。
需要说明的是,第二设备在得到第一识别结果之后,可以建立目标图像如图2与第一识别结果如“欧米茄钟表”之间的识别关系,因此,第二设备可以基于目标图像与第一识别结果对文字识别模型进行训练优化,从而在后续再次进行文字识别时,如果再次采集到目标图像,可以更快更准确的识别出目标图像中的文字,从而提高后续进行文字识别时的准确率及效率。
在一种实现方式中,图4中的步骤402具体可以通过以下方式实现,如图8中所示:
步骤421:基于当前位置信息,获取满足预设要求的所有图像文字组合,图像文字组合组成目标文字集合。
其中,预设要求表征图像文字组合对应的位置距离当前位置在预设范围内,如5米距离内。
例如,第二设备在获得第一设备的当前位置信息之后,获得以当前位置为中心,方圆5米或20米内的位置所对应的图像文字组合。
以图5为例,第二设备获取到第一设备的当前位置点a,以a为圆心,半径为20米内的范围内对应有图像文字组合:“欧米茄钟表”、“路易威登lv”、“和平饭店”和“南京路”,因此,第二设备基于第一设备的当前位置点a,可以获得“欧米茄钟表”、“路易威登lv”、“和平饭店”和“南京路”等等组成目标文字集合。
参考图9,为本申请实施例三提供的一种图像识别方法的流程图,应用于能够进行图像采集及处理的第一设备中,该第一设备可以为手机或pad等客户端设备。
在本实施例中,该方法可以包括以下步骤:
步骤901:采集目标图像。
其中,该目标图像是指需要进行字符识别的包含标准字符和/或非标准字符图像的目标图像,如图2中所示,目标图像可以为第一设备对店面牌匾的图像,该图像中包含个性样式的字符“欧米茄钟表”。
具体的,本实施例中可以利用摄像头等图像采集设备实现目标图像的采集。图像采集设备可以为第一设备上的部件,也可以为第一设备之间有数据连接的终端。
步骤902:对所述目标图像进行预处理,得到第一处理结果。
在一种实现方式中,本实施例中对目标图像进行的预处理操作可以包括:去噪等处理,从而得到第一处理结果,以便于后续传输中减少传输数据量,提高传输准确率。
在另一种实现方式中,本实施例中对目标图像进行的预处理操作可以包括:去噪及文字识别等处理,例如,对目标图像利用文字识别模型如ocr模型进行文字识别,从而得到第一处理结果,该第一处理结果中可能包括识别出的字符或字符组合等。
步骤903:根据所述第一设备的当前位置信息,获得目标文字集合。
其中,目标文字集合可以理解为第一设备的当前位置信息所关联的字符或字符组合所组成的集合。在本实施例中预先获取一定范围内各个位置点所关联的文字集合并存储在数据库中,该数据库可以设置在第一设备或者云端。如图5中所示,位置点a和位置点b周边存在“欧米茄钟表”、“路易威登lv”、“和平饭店”、“南京路”和“回音餐厅”等店铺招牌或者路牌,因此,位置点a关联的文字集合中包括:“欧米茄钟表”、“路易威登lv”、“和平饭店”和“南京路”等等,而位置点关联的文字集合中包括:“南京路”和“回音餐厅”等等。在本实施例中,第一设备可以在数据库中查找第一设备的当前位置信息所关联的各种字符或字符组合,组成目标文字集合。
步骤904:利用所述第一处理结果对所述目标文字集合进行匹配,得到第一识别结果。
其中,所述第一识别结果为所述目标图像对应的识别结果。
需要说明的是,第一处理结果中包含对目标图像进行预处理的处理结果,其中可能无法识别出目标图像中的非标准字符,如第一处理结果中包括字符“钟表”,之后第一设备利用第一处理结果中的字符对第一设备的当前位置信息所关联的目标文字集合中的字符进行筛选或匹配,得到与第一处理结果相对应的字符匹配结果,即为第一识别结果。例如,第一用“钟表”对位置点a关联的文字集合:“欧米茄钟表”、“路易威登lv”、“和平饭店”和“南京路”进行匹配,得到第一识别结果“欧米茄钟表”。
由上述方案可知,本申请实施例三提供的一种图像识别方法,第一设备利用目标图像的预处理结果对当前位置信息所关联的目标文字集合进行进一步的匹配,从而确定目标图像中的文字识别结果。本实施例中在目标图像预处理无法得到理想的文字识别结果时,能够利用目标图像预处理后的处理结果对当前位置信息对应的文字集合进行进一步识别,从而得到更加准确的目标图像中的文字识别结果,避免目标图像预处理后的识别不理想,准确率低的情况,由此提高目标图像中字符识别的准确率。
同时,本实施例中无需除第一设备之外的其他设备的配合,目标图像的预处理及文字匹配操作均由第一设备完成,减少数据传输操作,提高识别效率。
参考图10,为本申请实施例四提供的一种电子设备的结构示意图,该电子设备作为第一设备可以为手机或pad等客户端设备,该第一设备能够进行图像采集及处理,具体的,该第一设备可以包括以下结构:
图像采集设备1001,用于采集目标图像。
其中,图像采集设备1001可以为第一设备上的摄像头等,用以采集需要进行文字识别的目标图像。
需要说明的是,该目标图像是指需要进行字符识别的包含标准字符和/或非标准字符图像的目标图像,如图2中所示,目标图像可以为第一设备对店面牌匾的图像,该图像中包含个性样式的字符“欧米茄钟表”。
处理器1002,用于对所述目标图像进行预处理,得到第一处理结果,将所述第一处理结果及所述电子设备的当前位置信息发送给第二设备,以使得所述第二设备基于所述位置信息和所述第一处理结果,得到第一识别结果,其中,所述第一识别结果为所述目标图像对应的识别结果;接收所述第二设备发送的所述第一识别结果。
其中,本实施例中处理器1002可以对目标图像进行去噪及压缩等处理,得到第一处理结果,以便于后续传输中减少传输数据量,提高传输准确率。
具体的,本实施例中处理器1002可以通过第一设备上的定位装置如全球定位系统gps(globalpositioningsystem)或北斗定位系统等获得第一设备的当前位置信息,如位置坐标等,再将第一处理结果与第一设备的当前位置信息一起通过第一设备与第二设备之间的数据连接发送给第二设备。
其中,第一设备与第二设备之间的数据连接可以为无线数据连接,如4g网络、wifi或蓝牙等,也可以为有线数据连接,如通用串行总线usb或rj45等连接。
需要说明的是,第二设备在接收到第一设备发送的第一处理结果及第一设备的当前位置信息之后,根据当前位置信息,获得目标文字集合,该目标文字集合是指第一设备周边出现的字符或字符组合所组成的集合,之后,利用第一处理结果对目标文字集合进行匹配,得到第一识别结果,该第一识别结果为目标图像对应的识别结果,之后,将第一识别结果发送给第一设备。
其中,第一识别结果为目标图像对应的识别结果,由此,在第一识别结果中包含目标图像中识别出来的字符或字符组合,在本实施例中处理器1002接收到第一识别结果后,将第一识别结果中的字符或字符组合进行后续处理,如展示给用户或者进行数据统计等处理。
由上述方案可知,本申请实施例四提供的一种电子设备,在采集到目标图像之后,通过对目标图像进行预处理后和当前位置信息发送给第二设备,由第二设备基于第一处理结果和当前位置信息得到第一识别结果后,将第一识别结果发送给电子设备。本实施例中利用当前位置信息对目标图像进行预处理后的第一处理结果进行进一步识别,得到目标图像中的第一识别结果,避免目标图像预处理后的识别不理想,准确率低的情况,从而提高目标图像中字符识别的准确率。
在另一种实现方式中,图10中的处理器1002可以通过以下方式获得目标图像的第一识别结果:
首先,处理器1002在获得目标图像之后,对目标图像进行预处理,如去噪及文字识别等,得到第一处理结果,之后,处理器1002根据第一设备的当前位置信息获得目标文字集合,再利用第一处理结果如第一处理结果中的有效文字对目标文字集合进行匹配,从而得到第一识别结果,这一过程中无需第二设备的配合,目标图像的预处理及文字匹配操作均由第一设备完成,减少数据传输操作,提高识别效率。
参考图11,为本申请实施例五提供的一种电子设备的结构示意图,该电子设备作为第二设备可以为电脑或服务器等设备,能够进行图像处理。
在本实施例中,该电子设备可以包括以下结构:
数据传输接口1101,用于接收第一设备发送的第一处理结果及所述第一设备的当前位置信息。
其中,所述第一处理结果为所述第一设备对采集到的目标图像进行预处理的结果。
需要说明的是,数据传输接口1101可以为无线数据传输接口,如4g网络接口、wifi接口或蓝牙接口等,也可以为有线传输接口,如usb或rj45接口等。
例如,第一设备可以利用摄像头等图像采集设备采集目标图像,该目标图像是指需要进行字符识别的包含标准字符和/或非标准字符图像的目标图像,如图2中所示。第一设备在采集到目标图像之后,对目标图像进行预处理,得到第一处理结果,例如,第一设备对目标图像进行去噪、压缩及文字识别等处理,得到第一处理结果后,将第一处理结果连同第一设备的当前位置信息一起发送,第二设备通过数据传输接口1101对第一处理结果和第一设备的当前位置信息进行接收。
处理器1102,用于根据所述当前位置信息,获得目标文字集合;利用所述第一处理结果对所述目标文字集合进行匹配,得到第一识别结果,其中,所述第一识别结果为所述目标图像对应的识别结果;将所述第一识别结果通过所述数据传输接口1101发送给所述第一设备。
其中,目标文字集合可以理解为第一设备的当前位置信息所关联的字符或字符组合所组成的集合。在本实施例中预先获取一定范围内各个位置点所关联的文字集合并存储在数据库中,该数据库可以设置在第二设备(电子设备)或者云端,如图5中所示,位置点a和位置点b周边存在“欧米茄钟表”、“路易威登lv”、“和平饭店”、“南京路”和“回音餐厅”等店铺招牌或者路牌,因此,位置点a关联的文字集合中包括:“欧米茄钟表”、“路易威登lv”、“和平饭店”和“南京路”等等,而位置点关联的文字集合中包括:“南京路”和“回音餐厅”等等。在本实施例中,处理器1102在接收到第一设备的当前位置信息中,可以在数据库中查找第一设备的当前位置信息所关联的各种字符或字符组合,组成目标文字集合。
需要说明的是,第一处理结果中包含对目标图像进行预处理的处理结果,其中可能无法识别出目标图像中的非标准字符,如第一处理结果中包括字符“钟表”,之后处理器1102在数据传输接口1101接收到第一处理结果及第一设备的当前位置信息之后,利用第一处理结果中的字符对第一设备的当前位置信息所关联的目标文字集合中的字符进行筛选或匹配,得到与第一处理结果相对应的字符匹配结果,即为第一识别结果。例如,处理器1102用“钟表”对位置点a关联的文字集合:“欧米茄钟表”、“路易威登lv”、“和平饭店”和“南京路”进行匹配,得到第一识别结果“欧米茄钟表”。
由上述方案可知,本申请实施例五提供的一种电子设备,在接收到第一设备发送的对目标图像的预处理结果及当前位置信息之后,利用目标图像的预处理结果对当前位置信息所关联的目标文字集合进行进一步的匹配,从而确定目标图像中的文字识别结果。本实施例中在目标图像预处理无法得到理想的文字识别结果时,能够利用目标图像预处理后的处理结果对当前位置信息对应的文字集合进行进一步识别,从而得到更加准确的目标图像中的文字识别结果,避免目标图像预处理后的识别不理想,准确率低的情况,由此提高目标图像中字符识别的准确率。
在一种实现方式中,处理器1102在获得目标文字集合时,可以基于第一设备的当前位置信息,获取满足预设要求的所有图像文字组合,而图像文字组合组成目标文字集合。
其中,预设要求表征图像文字组合对应的位置距离当前位置在预设范围内,如5米距离内。
例如,第二设备在获得第一设备的当前位置信息之后,获得以当前位置为中心,方圆5米或20米内的位置所对应的图像文字组合。
以图5为例,第二设备获取到第一设备的当前位置点a,以a为圆心,半径为20米内的范围内对应有图像文字组合:“欧米茄钟表”、“路易威登lv”、“和平饭店”和“南京路”,因此,第二设备基于第一设备的当前位置点a,可以获得“欧米茄钟表”、“路易威登lv”、“和平饭店”和“南京路”等等组成目标文字集合。
而,处理器1102在获得第一识别结果时,可以通过以下方式实现:
首先,处理器1102基于第一处理结果,获取至少一个有效文字。
其中,在一种实现方式中,由于目标图像中的字符可能是非标准字符,导致第一设备对目标图像预处理如文字识别后的处理结果中可能存在一些特殊字符,如图7中所示,为此,数据传输接口1101在接收到第一处理结果之后,处理器1102可以在第一处理结果中获取有效字符,如直接在第一处理结果中的字符中提取有效文字,如图7中的“钟表”。
在另一种实现方式中,数据传输接口1101所接收到的第一处理结果为第一设备对目标图像进行去噪和压缩等处理后的处理结果,处理器1102首先对第一处理结果解压缩处理,再利用预设的文字识别模型如ocr模型进行文字识别,从而得到至少一个有效字符,如“钟表”。
其次,处理器1102在目标文字集合中基于有效文字进行匹配处理,以得到第一识别结果。
其中,数据传输接口1101在获取到第一设备的当前位置信息对应的目标文字集合之后,处理器1102用从第一处理结果中提取到的有效文字进行匹配,例如,在目标文字集合中查找包含该有效文字的字符串,如“欧米茄钟表”,由此得到第一识别结果,即目标图像的识别结果为“欧米茄钟表”。
需要说明的是,处理器1102在得到第一识别结果之后,可以建立目标图像如图2与第一识别结果如“欧米茄钟表”之间的识别关系,因此,处理器1102还可以基于目标图像与第一识别结果对文字识别模型进行训练优化,从而在后续再次进行文字识别时,如果再次采集到目标图像,可以更快更准确的识别出目标图像中的文字,从而提高后续进行文字识别时的准确率及效率。
以下结合图12中所示的流程图对本实施例在具体应用中的示例进行说明:
当用户需要店铺招牌时,进行拍照后(客户端或者独立的图像采集设备进行拍照),将拍得的图片(目标图像)和当前位置信息分别发给客户端和后台服务器,拍得的图片如图13中所示。
之后,客户端中预置的店铺招牌识别算法如ocr文字识别模型收到图片后生成识别结果:“¥;兰;%;洗衣”,将识别结果发送给后台服务器。
后台服务器根据之前收到的客户端的当前位置信息搜索出周围的店铺信息,如图14中的普兰德洗衣、剪艺人生、舞蹈培训等,然后将后续收到的识别结果与搜索到的店铺信息按照一定的策略进行匹配,如去除识别的乱码、空格等,保留真正有效的文字后,再利用有效的文字检查周边店铺信息中是否包含这些有效文字的店铺信息,如果有,则提取到相应的店铺信息,如普兰德洗衣,作为识别结果返回给客户端,并将此结果与图片保存到服务器中,作为训练集,对客户端中的ocr模型进行自动训练优化,从而提升ocr模型的识别精度与效率;如果没有,则直接将之前的识别结果反馈给客户端。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。