一种图形识别的方法、装置及系统与流程

文档序号：13805202阅读：194来源：国知局

本申请涉及计算机领域，特别涉及一种图形识别的方法、装置及系统。

背景技术：

随着计算机视频技术的发展，为了迎合用户的使用需求，物体检测技术在很多网站中都得到了充分利用，逐渐成为了网站服务中的一项重要内容。例如，无人驾驶装置通过物体检测技术识别视频中行人、车辆以及路标；又例如，网站服务器通过物体检测技术从用户输入的图片中识别用户感兴趣的物体；又例如，智能监控装置通过物体检测技术识别视频中行人、进行人脸检测等等。

广义地讲，物体检测是指自动定位图片或视频中指定的单个或者多个类别的物体。物体检测主要包括两个任务，识别图片或视频中所包含物体的类别以及定位物体的坐标位置。

以网站服务器采用的物体检测技术为例。目前，网站服务器通常会对物体进行分类，然后，在每一个类目下再进行物体检测。具体而言，网站服务器会针对每一个类目都预先训练一个分类器和坐标回归器。分类器用于对目标物体进行类目识别，而坐标回归器则用于在相应类目下，对物体在图片中的坐标位置进行识别，最后再基于识别出的坐标位置确定物体形状，再根据该物体形状进行物体检测。

然而，某些应用场景下(如，用户在网站中搜索希望购买的商品的图片)，即使是归属同一类目下的物体，形状上的差异也比较大，如，在“裤子”这一类目下有长裤、短裤等等，又如，在“裙子”这一类目下有连衣裙，长裙、短裙等等。

针对这种类目，目前采用的物体检测方法中，通常使用单一的坐标回归器对归属于同一类目的不同物体进行坐标位置识别。但由于一个坐标回归器所使用的形状特征是通过海量的具有形状特征共性的样本数据训练得到的，因此，一个坐标回归器往往针对某一形状的物体可以进行坐标位置的准确识别。然而，由于归属于同一类目的物体在形状上也会存在较大差异，那么，采用单一坐标回归器进行坐标位置识别，会导致输出的坐标位置和实际的坐标位置之间偏差较大，从而进一步影响图形识别的准确性。

技术实现要素：

本申请实施例提供一种图形识别的方法、装置及系统，用以提高图形识别的准确性。

本申请实施例提供的具体技术方案如下：

一种图形识别系统，包括：

客户端，用于获取待检测图片；

服务器，用于接收客户端传输的待检测图片，采用预设的各个形状样本，分别对所述待检测图片中包含的图形进行定位，获得相应的定位结果以及置信度，其中，一个形状样本对应的定位结果的置信度，表征所述一个形状样本和所述图形的相似度；基于所述置信度，获得相应的图形识别结果。

可选的，获取待检测图片时，所述客户端用于：

获取原始图片，并将所述原始图片作为待检测图片；或者，

获取原始图片，并按照设定方式在所述原始图片中截取指定区域，以及将所述指定区域作为待检测图片。

可选的，采用预设的各个形状样本，分别对所述待检测图片中包含的图形进行定位时，所述服务器用于：

采用预设的形状样本，分别对所述待检测图片中包含的图形进行定位；或者，

对所述待检测图片进行特征提取，根据提取结果确定所述待检测图片归属的类目，再基于对应所述类目预设的各个形状样本，分别对所述待检测图片中包含的图形进行定位。

可选的，采用预设的一个形状样本，对所述待检测图片中包含的图形进行定位，获得相应的定位结果时，所述服务器用于：

采用所述一个形状样本，在所述待检测图片中进行图形匹配；

确定存在匹配成功的图形时，按照所述一个形状样本，在所述图形的周边绘制边框；

确定所述边框的坐标位置，将所述坐标位置作为所述图形的定位结果。

可选的，获得所述定位结果的置信度时，所述服务器用于：

计算所述定位结果与所述图形的相似度，将所述相似度作为所述置信度，或者，对所述相似度进行误差处理，并将处理结果作为所述置信度。

可选的，基于所述置信度，获得相应的图形识别结果时，所述服务器用于：

将置信度最高的定位结果对应的形状样本作为图形识别结果。

可选的，服务器进一步用于：

基于所述图形识别结果，在预设范围内进行物体检测，筛选出与所述图形识别结果类似的物体。

一种图形识别方法，包括：

获取待检测图片；

采用预设的各个形状样本，分别对所述待检测图片中包含的图形进行定位，获得相应的定位结果以及置信度，其中，一个形状样本对应的定位结果的置信度，表征所述一个形状样本和所述图形的相似度；

基于所述置信度，获得相应的图形识别结果。

可选的，所述获取待检测图片，包括：

获取原始图片，并将所述原始图片作为待检测图片；或者，

获取原始图片，并按照设定方式在所述原始图片中截取指定区域，以及将所述指定区域作为待检测图片。

可选的，所述采用预设的各个形状样本，分别对所述待检测图片中包含的图形进行定位，包括：

采用预设的形状样本，分别对所述待检测图片中包含的图形进行定位；或者，

可选的，采用预设的一个形状样本，对所述待检测图片中包含的图形进行定位，获得相应的定位结果，包括：

采用所述一个形状样本，在所述待检测图片中进行图形匹配；

确定存在匹配成功的图形时，按照所述一个形状样本，在所述图形的周边绘制边框；

确定所述边框的坐标位置，将所述坐标位置作为所述图形的定位结果。

可选的，获得所述定位结果的置信度，包括：

计算所述定位结果与所述图形的相似度，将所述相似度作为所述置信度，或者，对所述相似度进行误差处理，并将处理结果作为所述置信度。

可选的，基于所述置信度，获得相应的图形识别结果，包括：

将置信度最高的定位结果对应的形状样本作为图形识别结果。

可选的，进一步包括：

基于所述图形识别结果，在预设范围内进行物体检测，筛选出与所述图形识别结果类似的物体。

一种图形识别方法，包括：

获取待检测图片；

采用预设的各个坐标回归器包含的形状样本，分别对所述待检测图片中包含的图形进行定位，获得相应的定位结果以及置信度，其中，一个坐标回归器包含的形状样本对应的定位结果的置信度，表征所述一个坐标回归器包含的形状样本和所述图形的相似度；

基于所述置信度，获得相应的图形识别结果。

可选的，所述获取待检测图片，包括：

获取原始图片，并将所述原始图片作为待检测图片；或者，

获取原始图片，并按照设定方式在所述原始图片中截取指定区域，以及将所述指定区域作为待检测图片。

可选的，所述采用预设的各个坐标回归器包含的形状样本，分别对所述待检测图片中包含的图形进行定位，包括：

采用预设的全部坐标回归器包含的形状样本，分别对所述待检测图片中包含的图形进行定位；或者，

对所述待检测图片进行特征提取，根据提取结果确定所述待检测图片归属的类目，再基于对应所述类目预设的各个坐标回归器包含的形状样本，分别对所述待检测图片中包含的图形进行定位。

可选的，采用预设的一个坐标回归器包含的形状样本，对所述待检测图片中包含的图形进行定位，获得相应的定位结果，包括：

采用所述一个坐标回归器包含的形状样本，在所述待检测图片中进行图形匹配；

确定存在匹配成功的图形时，按照所述一个坐标回归器包含的形状样本，在所述图形的周边绘制边框；

确定所述边框的坐标位置，将所述坐标位置作为所述图形的定位结果。

可选的，获得所述定位结果的置信度，包括：

计算所述定位结果与所述图形的相似度，将所述相似度作为所述置信度，或者，对所述相似度进行误差处理，并将处理结果作为所述置信度。

可选的，基于所述置信度，获得相应的图形识别结果，包括：

将置信度最高的定位结果对应的坐标回归器包含的形状样本，作为图形识别结果。

可选的，进一步包括：

基于所述图形识别结果，在预设范围内进行物体检测，筛选出与所述图形识别结果类似的物体。

一种图形识别装置，包括：

获取单元，用于获取待检测图片；

定位单元，用于采用预设的各个形状样本，分别对所述待检测图片中包含的图形进行定位，获得相应的定位结果以及置信度，其中，一个形状样本对应的定位结果的置信度，表征所述一个形状样本和所述图形的相似度；

识别单元，用于基于所述置信度，获得相应的图形识别结果。

可选的，获取待检测图片时，所述获取单元用于：

获取原始图片，并将所述原始图片作为待检测图片；或者，

获取原始图片，并按照设定方式在所述原始图片中截取指定区域，以及将所述指定区域作为待检测图片。

可选的，采用预设的各个形状样本，分别对所述待检测图片中包含的图形进行定位时，所述获取单元用于：

采用预设的形状样本，分别对所述待检测图片中包含的图形进行定位；或者，

可选的，采用预设的一个形状样本，对所述待检测图片中包含的图形进行定位，获得相应的定位结果时，所述定位单元用于：

采用所述一个形状样本，在所述待检测图片中进行图形匹配；

确定存在匹配成功的图形时，按照所述一个形状样本，在所述图形的周边绘制边框；

确定所述边框的坐标位置，将所述坐标位置作为所述图形的定位结果。

可选的，获得所述定位结果的置信度时，所述定位单元用于：

计算所述定位结果与所述图形的相似度，将所述相似度作为所述置信度，或者，对所述相似度进行误差处理，并将处理结果作为所述置信度。

可选的，基于所述置信度，获得相应的图形识别结果时，所述识别单元用于：

将置信度最高的定位结果对应的形状样本作为图形识别结果。

可选的，所述识别单元进一步用于：

基于所述图形识别结果，在预设范围内进行物体检测，筛选出与所述图形识别结果类似的物体。

一种图形识别方法，包括：

获取单元，用于获取待检测图片；

定位单元，用于采用预设的各个坐标回归器包含的形状样本，分别对所述待检测图片中包含的图形进行定位，获得相应的定位结果以及置信度，其中，一个坐标回归器包含的形状样本对应的定位结果的置信度，表征所述一个坐标回归器包含的形状样本和所述图形的相似度；

识别单元，用于基于所述置信度，获得相应的图形识别结果。

可选的，获取待检测图片时，所述获取单元用于：

获取原始图片，并将所述原始图片作为待检测图片；或者，

获取原始图片，并按照设定方式在所述原始图片中截取指定区域，以及将所述指定区域作为待检测图片。

可选的，采用预设的各个坐标回归器包含的形状样本，分别对所述待检测图片中包含的图形进行定位时，所述定位单元用于：

采用预设的全部坐标回归器包含的形状样本，分别对所述待检测图片中包含的图形进行定位；或者，

可选的，采用预设的一个坐标回归器包含的形状样本，对所述待检测图片中包含的图形进行定位，获得相应的定位结果时，所述定位单元用于：

采用所述一个坐标回归器包含的形状样本，在所述待检测图片中进行图形匹配；

确定存在匹配成功的图形时，按照所述一个坐标回归器包含的形状样本，在所述图形的周边绘制边框；

确定所述边框的坐标位置，将所述坐标位置作为所述图形的定位结果。

可选的，获得所述定位结果的置信度时，所述定位单元用于：

计算所述定位结果与所述图形的相似度，将所述相似度作为所述置信度，或者，对所述相似度进行误差处理，并将处理结果作为所述置信度。

可选的，基于所述置信度，获得相应的图形识别结果时，所述识别单元用于：

将置信度最高的定位结果对应的坐标回归器包含的形状样本，作为图形识别结果。

可选的，所述识别单元用于：

基于所述图形识别结果，在预设范围内进行物体检测，筛选出与所述图形识别结果类似的物体。

本申请有益效果如下：

综上所述，本申请实施例中，检测装置需要对待检测图片进行图形识别，采用预设的各个形状样本，分别对待检测图片中包含的图形进行定位，获得相应的定位结果以及置信度，最后，再基于置信度最高的定位结果，获得相应的图形识别结果；这样，由于设置了精细化的形状样本，因此，可以有效提高同一类目下不同物体形状的图形的识别精准度。

附图说明

图1为本申请实施例中检测装置运行原理示意图；

图2a为本申请实施例中图形识别系统架构示意图；

图2b为本申请实施例中检测装置进行图形识别流程图；

图3为本申请实施例中定位结果示意图；

图4为本申请实施例中检测装置功能结构示意图。

具体实施方式

为了提高图形识别的准确性，本申请实施例中，针对每一个类目，分别划分出多个子类，其中，一个子类表征在相应类目下的一类物体形状，然后，针对每一个子类设置一个坐标回归器，这样，每一个坐标回归器只针对相应的子类表征的物体形状进行有针对性的图形定位，因此，会大大提升图形识别的准确性。

下面结合附图对本申请优选的实施方式进行详细说明。

参阅图1所示，本实施例中，在检测装置中设置有多个物体分类器，一个物体分类器对应一个类目，例如：上衣、裙子、鞋、包、宠物等等。其中，每个物体分类器是经过海量的样本数据训练得到的，可以通过对图片进行特征提取而确定图片归属的类目。

而在每一个物体分类器下分别设置有若干坐标回归器，一个坐标回归器对应相应类目下的一类物体形状(也可称为一种形状样本)；其中，每个坐标回归器均是基于海量样本数据的聚类训练得到的。

例如，假设物体分类器1表征的类目为“上衣”，而在物体分类器1下分别设置有三种坐标回归器，其中，坐标回归器1表征的物体形状为“短款上衣，长宽比例1：1”，而坐标回归器2表征的物体形状为“普通上衣，长宽比例4：3”；而坐标回归器3表征的物体形状为“长款上衣，长宽比例7：4”。

又例如，假设物体分类器2表征的类目为“包”，而在物体分类器2下分别设置有三种坐标回归器，其中，坐标回归器1表征的物体形状为“圆形包”，坐标回归器2表征的物体形状为“倒梯形包”，坐标回归器3表征的物体形状为“四边形包(可以是正方形，也可以是长方形)”。

当然，上述采用长宽比例描述上衣的形状，以及采用包轮廓的近似图形描述包的形状，均为举例，实际应用中并不局限于此，在此不再赘述。

当然，若样本数据的数量足够多，以及区分度足够精细，则可以通过聚类算法(如，k-means)获得更多的物体形状样本，从而训练出更多有针对性的坐标回归器，在此亦不再赘述。

参阅图2a所示，本发明实施例中，图形识别系统中包括了客户端和服务器，

客户端20，用于获取待检测图片；

服务器21，用于接收客户端传输的待检测图片，采用预设的各个形状样本，分别对待检测图片中包含的图形进行定位，获得相应的定位结果以及置信度，其中，一个形状样本对应的定位结果的置信度，表征该一个形状样本和上述图形的相似度；基于上述置信度，获得相应的图形识别结果。

基于上述系统架构，参阅图2b所示，本申请实施例中，物体检测的详细流程如下：

步骤200：检测装置获取待检测图片。

检测装置(如，服务器)获取待检测图片时，可以接收客户端上传的用户在客户端上输入的待检测图片，也可以直接获取用户在检测装置上输入的待检测图片，后续实施例中，均以后一种情况为例进行说明，其中，在获取待检测图片的过程中检测装置所执行的一系统处理，也同样适用于客户端，后续将不再赘述。

本申请实施例中，用户在检测装置上输入需要搜索的原始图片时，可以采用多种方法。

例如，用户可以对需要搜索的原始图片进行复制，然后粘贴至检测装置屏幕上呈现的检测框中，再点击“搜索”按键，这样，检测装置便可以获取到原始图片。

又例如，用户浏览某个界面看到喜欢的原始图片且希望对其进行搜索时，可以长按原始图片，则检测装置会在屏幕上呈现菜单栏，而用户可以选择其中的“搜索”按键，这样，检测装置也可以获取到原始图片。

进一步地，从检测装置角度而言，在获取到用户输入的原始图片后，如果原始图片的大小未达到预设门限值，则检测装置可以直接将用户选取的原始图片作为待检测图片。而如果原始图片的大小达到了预设门限值，此时说明原始图片很大，不能一次处理完毕，这时，检测装置也可以采用设定方式(如，滑动窗口方式或选择性搜索方式)在用户输入的原始图片中截取指定区域，并将指定区域作为待检测图片。当然，如果当前截取的指定区域中未包含有特定图形，则可以采用上述设定方式在原始图片中继续截取下一块指定区域，这样，可以化整为零，依次检测每一个指定区域中是否有特定的图形。

而本实施例中，仅以当前截取的指定区域中包含特定的图形为例，在此不再赘述。

实际应用中，检测装置可以是用户使用的终端(如，智能手机、平板电脑等等)，也可以是网络侧的服务器，在此不再赘述。

步骤201：检测装置对待检测图片进行特征提取，基于提取结果确定待检测图片归属的类目。

具体的，检测装置会将待检测图片分别输入各个物体分类器，各个物体分类器都设置有相应的特征要素，通过这些特征要素，各个物体分类器可以在初始阶段对待检测图片进行类目划分。

例如，物体分类器1管理的类目是“宠物”，则特征提取要素可以包括“眼睛”、“耳朵”、“胡须”、“爪子”等等，可以是其中的一种，也可以是任意组合。

又例如，物体分类器2管理的类目是“包”，则特征提取要素可以包括“包带”、“包体”、“纯色”、“卡通图案”等等，可以是其中的一种，也可以是任意组合。

又例如，物体分类器3管理的类目是“鞋”，则特征提取要素可以包括“两个单独个体”，“长条状”，“鞋带”等等，可以是其中的一种，也可以是任意组合。

各个物体分类器所使用的特征要素都是经过海量样本数据训练后得到的，样本数据的数量越多，物体分类器的分类结果也越准确。

本申请实施例中，检测装置将待检测图片分别输入每一个物体分类器，各个物体分类器都会对待检测图片进行特征提取，再基于各自的特征要素进行识别，最终确定待检测图片归属的类目。

可选的，本实施例中，假设经过各个物体分类器识别后，确定待检测图片归属的类目为“上衣”，后续实施例中均以此为例，将不再赘述。

步骤202：检测装置基于对应上述类目预设的各个形状样本，分别对待检测图片中包含的图形进行定位。

本申请实施例中，预置了多个物体分类器，而每一个物体分类器下，又进一步划分了多个子类，每一个子类对应一个坐标回归器，一个坐标回归器表征了在相应类目下的一种典型的物体形状，由于是基于海量样本数据训练获得的，因此，又称一个坐标回归器表征的一特征形状为一种形状样本。

另一方面，本申请实施例中，检测装置先使用物体分类器对待检测图片归属的类目进行确定，再使用上述物体分类器下对应的各个坐标回归器对待检测图片中包含的图形进行定位。

而实际应用中，如果物体分类器没有识别出待检测图片归属的类目，则可以直接使用全部的坐标回归器对待检测图片包含的图形进行定位，或者，如果预设的坐标回归器数目较少，那么，为了降低操作复杂度，也可以不进行类目识别，而直接使用全部的坐标回归器对待检测图片包含的图形进行定位，那么，在这几种情况下，可以不执行步骤201。

而本申请实施例中，仅以执行步骤201为例进行说明，在此不再赘述。

步骤203：检测装置获各个形状样本对应的定位结果以及置信度。

本申请实施例中，以任意一个形状样本为例(以下称为形状样本x)，检测装置采用形状样本x对待检测图片进行检测时，即是将待检测图片输入到形状样本x对应的坐标回归器x中，通过坐标回归器x对待检测图片中的图形进行匹配，判断是否存在与形状样本x匹配成功的图形，确定存在匹配成功的图形时，按形状样本x，在上述图形的周边绘制边框(具体如图3所示)，然后，确定上述边框的坐标位置，再将该坐标位置作为上述图形的定位结果。

仍以类目“上衣”为例，假设对应“上衣”设置有三种坐标回归器，其中，坐标回归器1表征的形状样本为“短款上衣，长宽比例1：1”，而坐标回归器2表征的形状样本为“普通上衣，长宽比例4：3”；而坐标回归器3表征的形状样本为“长款上衣，长宽比例7：4”。

那么，检测装置会依次采用“1：1”、“4：3”和“7：4”这三种比例的矩形(也可以是其他更贴合上衣形状的图形，矩形仅为举例)，在待检测图片中搜索是否有符合上述各种比例的图形存在，即判断是否匹配成功。本申请实施例中，可选的，图形与形状样本的重合度达到设定阈值(如，70％)即视为匹配成功。

第一种情况下，如果待检测图片中存在符合某一种比例的图形，则输出图形的坐标位置作为定位结果。

例如，假设检测装置采用“7：4”的矩形在待检测图片中检测到存在一形状相近的图形，则检测装置会在这个图形的周边绘制一个“7：4”的矩形覆盖该图形，并输出这个矩形的左上角坐标和右下角坐标作为定位结果。

又例如，假设检测装置采用“1：1”的矩形在待检测图片中检测到存在一形状相近的图形，则检测装置会在这个图形的周边绘制一个“1：1”的矩形覆盖该图形，并输出这个矩形的中心点坐标和其中一个顶点的坐标作为定位结果。

当然，定位结果还可以采用其他形式记录图形的坐标位置，上述仅为举例。

第二种情况下，如果待检测图片中不存在符合任意一比例的图形，则可以直接提出定位不成功。

进一步地，检测装置在输出定位结果的同时，还要输出定位结果的置信度，所谓的置信度，表示的是定位结果表征的形状样本和待检测图片中的图形的相似程度。

这是因为，实际应用中，由于拍摄角度、拍摄距离等等因素的影响，待检测图片中的图形很少会与预设的形状样本完全相同。但是，细微的差别并不能说明上述图形就是不符合形状样本的。例如，一件短款上衣在待检测图片中呈现的比例是1：0.9，这并不符合针对短款上衣预设的比例“1：1”，但是，并不能说明待检测图片中就不包含短款上衣，因此，为了避免误判，本实施例中，加入了置信度这一概念。

仍以上述“1：0.9”的短款上衣为例，由于检测装置会采用每一种预设的形状样本对待检测图片中的图形进行定位，因此，检测装置会依次采用“1：1”的矩形、“4：3”的矩形、“7：4的矩形”在待检测图片中对短款上衣进行定位，并分别得到定位结果1、定位结果2和定位结果3，接着，检测装置会分别计算“1：0.9”与“1：1”的相似度1＝90％，“1：0.9”和“4：3”的相似度2＝83％，“1：0.9”和“7：4”相似度3＝63％。

最后，检测装置会将每一种形状样本对应的相似度，直接作为相应的定位结果的置信度，或者，也可以对每一种形状样本对应的相似度进行误差处理后(如，乘以预设系数，代入预设公式等等)，将各个处理结果作为相应定位结果的置信度。

置信度的具体计算方式可以视具体应用环境和精确要求而定，在此不再赘述。

步骤204：检测装置基于置信度最高的定位结果，获得相应的图形识别结果。

可选的，检测装置将置信度最高的定位结果所对应的形状样本作为最终的图形识别结果。

例如，在上述举例中，最终的图形识别结果为“短款上衣，长宽比例1：1”。

步骤205：检测装置基于图形识别结果，在设定范围内进行物体检测。

具体的，检测装置可以基于图形识别结果，在预设范围内进行物体检测，筛选出与图形识别结果类似的物体。

例如，检测装置可以基于“短款上衣，长宽比例1：1”在电商数据库中进行物体检测，筛选出符合该描述信息的所有上衣，呈现给用户，以供用户选择。

又例如，检测装置获得的图形识别结果为“儿童书包，圆形”，则可以基于该描述信息在数据库中进行物体检测，筛选出符合该描述信息的所有书包，呈现给用户，以供用户选择。

参阅图2a所示，本申请实施例中，图形识别至少包括：

客户端20，用于获取待检测图片；

服务器21，用于接收客户端传输的待检测图片，采用预设的各个形状样本，分别对所述待检测图片中包含的图形进行定位，获得相应的定位结果以及置信度，其中，一个形状样本对应的定位结果的置信度，表征所述一个形状样本和所述图形的相似度；基于所述置信度，获得相应的图形识别结果。

可选的，获取待检测图片时，客户端20用于：

获取原始图片，并将所述原始图片作为待检测图片；或者，

获取原始图片，并按照设定方式在所述原始图片中截取指定区域，以及将所述指定区域作为待检测图片。

采用预设的各个形状样本，分别对所述待检测图片中包含的图形进行定位时，服务器21用于：

采用预设的形状样本，分别对所述待检测图片中包含的图形进行定位；或者，

可选的，采用预设的一个形状样本，对所述待检测图片中包含的图形进行定位，获得相应的定位结果时，服务器21用于：

采用所述一个形状样本，在所述待检测图片中进行图形匹配；

确定存在匹配成功的图形时，按照所述一个形状样本，在所述图形的周边绘制边框；

确定所述边框的坐标位置，将所述坐标位置作为所述图形的定位结果。

可选的，获得所述定位结果的置信度时，服务器21用于：

计算所述定位结果与所述图形的相似度，将所述相似度作为所述置信度，或者，对所述相似度进行误差处理，并将处理结果作为所述置信度。

可选的，基于所述置信度，获得相应的图形识别结果时，服务器21用于：

将置信度最高的定位结果对应的形状样本作为图形识别结果。

可选的，服务器21进一步用于：

基于所述图形识别结果，在预设范围内进行物体检测，筛选出与所述图形识别结果类似的物体。

参阅图4所示，本申请实施例中，检测装置包括获取单元40、定位单元41和识别单元42，其中，

具体的，上述各个单元的作用在不同场景下具有细微差别：

第一场景下：

获取单元40，用于获取待检测图片；

定位单元41，用于采用预设的各个形状样本，分别对所述待检测图片中包含的图形进行定位，获得相应的定位结果以及置信度，其中，一个形状样本对应的定位结果的置信度，表征所述一个形状样本和所述图形的相似度；

识别单元42，用于基于置信度最高的定位结果，获得相应的图形识别结果。

可选的，获取待检测图片时，获取单元40用于：

获取原始图片，并将所述原始图片作为待检测图片；或者，

获取原始图片，并按照设定方式在所述原始图片中截取指定区域，以及将所述指定区域作为待检测图片。

可选的，采用预设的各个形状样本，分别对所述待检测图片中包含的图形进行定位时，获取单元40用于：

采用预设的形状样本，分别对所述待检测图片中包含的图形进行定位；或者，

可选的，采用预设的一个形状样本，对所述待检测图片中包含的图形进行定位，获得相应的定位结果时，定位单元41用于：

采用所述一个形状样本，在所述待检测图片中进行图形匹配；

确定存在匹配成功的图形时，按照所述一个形状样本，在所述图形的周边绘制边框；

确定所述边框的坐标位置，将所述坐标位置作为所述图形的定位结果。

可选的，获得所述定位结果的置信度时，定位单元41用于：

计算所述定位结果与所述图形的相似度，将所述相似度作为所述置信度，或者，对所述相似度进行误差处理，并将处理结果作为所述置信度。

可选的，基于所述置信度，获得相应的图形识别结果时，识别单元42用于：

将置信度最高的定位结果对应的形状样本作为图形识别结果。

可选的，识别单元42进一步用于：

基于所述图形识别结果，在预设范围内进行物体检测，筛选出与所述图形识别结果类似的物体。

第二种场景下：

获取单元40，用于获取待检测图片；

定位单元41，用于采用预设的各个坐标回归器包含的形状样本，分别对所述待检测图片中包含的图形进行定位，获得相应的定位结果以及置信度，其中，一个坐标回归器包含的形状样本对应的定位结果的置信度，表征所述一个坐标回归器包含的形状样本和所述图形的相似度；

识别单元用于42，基于所述置信度，获得相应的图形识别结果。

可选的，获取待检测图片时，获取单元40用于：

获取原始图片，并将所述原始图片作为待检测图片；或者，

获取原始图片，并按照设定方式在所述原始图片中截取指定区域，以及将所述指定区域作为待检测图片。

可选的，采用预设的各个坐标回归器包含的形状样本，分别对所述待检测图片中包含的图形进行定位时，定位单元41用于：

采用预设的全部坐标回归器包含的形状样本，分别对所述待检测图片中包含的图形进行定位；或者，

可选的，采用预设的一个坐标回归器包含的形状样本，对所述待检测图片中包含的图形进行定位，获得相应的定位结果时，定位单元41用于：

采用所述一个坐标回归器包含的形状样本，在所述待检测图片中进行图形匹配；

确定存在匹配成功的图形时，按照所述一个坐标回归器包含的形状样本，在所述图形的周边绘制边框；

确定所述边框的坐标位置，将所述坐标位置作为所述图形的定位结果。

可选的，获得所述定位结果的置信度时，定位单元41用于：

计算所述定位结果与所述图形的相似度，将所述相似度作为所述置信度，或者，对所述相似度进行误差处理，并将处理结果作为所述置信度。

可选的，基于所述置信度，获得相应的图形识别结果时，识别单元42用于：

将置信度最高的定位结果对应的坐标回归器包含的形状样本，作为图形识别结果。

可选的，识别单元42用于：

基于所述图形识别结果，在预设范围内进行物体检测，筛选出与所述图形识别结果类似的物体。

综上所述，本申请实施例中，针对类目内各个物体形状变化较大的类目，先将此种类目划分为对应不同物体形状的若干子类，再针对每一个子类都单独训练一个坐标回归器，其中，一个坐标回归器表征一种形状样本。

那么，当检测装置需要对待检测图片进行图形识别时，就会将待检测图片输入每一个坐标回归器，即采用预设的各个形状样本，分别对待检测图片中包含的图形进行定位，获得相应的定位结果以及置信度，最后，再基于置信度最高的定位结果，获得相应的图形识别结果；这样，由于设置了精细化的形状样本，因此，每一个坐标回归器的识别精度都得到了保证，那么，便可以有效提高同一类目下不同物体形状的图形的识别精准度，进而在后续进行物体检测时，可以进一步提高检测精度，有效提高了用户体验。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请实施例的精神和范围。这样，倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张迎亚;刘巍;潘攀;华先胜
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：一种基于DR的肺结核智能识别方法及系统与流程
上一篇：一种属性分类器的应用方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。