图像识别方法、装置、图像识别设备及存储介质与流程

文档序号:26643487发布日期:2021-09-15 01:13阅读:116来源:国知局
图像识别方法、装置、图像识别设备及存储介质与流程

1.本技术涉及计算机技术领域,尤其涉及一种图像识别方法、图像识别设备及存储介质。


背景技术:

2.随着互联网技术的发展,越来越关注于图像识别技术,当前的图像识别技术包括人脸识别技术,手势识别技术,物品识别技术等,基于图像识别技术的深入发展,可将该图像识别技术应用到用户各方面的生产生活中,如将人脸识别技术应用于目标对象追踪,物品识别技术应用在无人商店的运营等。当前的图像识别技术大都是面向具体业务需求的,固定的识别方法,如当前的人脸识别技术均采用先进行脸部图像提取,再进行遮挡物检测等,而采用固定的识别方法,存在识别算法灵活性较低的问题,因此,如何提升当前图像识别技术的灵活性,成为了当前的研究热点。


技术实现要素:

3.本发明实施例提供了一种图像识别方法、装置、图像识别设备及存储介质,可提升图像识别的灵活性。
4.一方面,本发明实施例提供了一种图像识别方法,包括:
5.响应于针对待识别图像的识别触发操作,对所述待识别图像所处的识别场景进行检测,其中,不同识别场景对应不同识别配置信息;
6.若所述待识别图像处于目标识别场景中,则获取与所述目标识别场景匹配的目标识别配置信息,所述目标识别配置信息用于指示在所述目标识别场景下对所述待识别图像进行图像识别的识别流程;
7.按照所述目标识别配置信息指示的识别流程,对所述待识别图像进行识别处理,得到所述待识别图像的图像识别结果。
8.再一方面,本发明实施例提供了一种图像识别装置,包括:
9.检测单元,用于响应于针对待识别图像的识别触发操作,对所述待识别图像所处的识别场景进行检测,其中,不同识别场景对应不同识别配置信息;
10.获取单元,用于若所述待识别图像处于目标识别场景中,则获取与所述目标识别场景匹配的目标识别配置信息,所述目标识别配置信息用于指示在所述目标识别场景下对所述待识别图像进行图像识别的识别流程;
11.识别单元,用于按照所述目标识别配置信息指示的识别流程,对所述待识别图像进行识别处理,得到所述待识别图像的图像识别结果。
12.在一个实施例中,所述目标识别配置信息包括至少一个识别状态的状态标识,以及不同状态标识对应的识别状态之间的切换关系,且一个识别状态对应一个识别处理逻辑;
13.所述目标识别配置信息指示的识别流程为:根据所述切换关系确定的各个识别状
态对应的识别处理逻辑的执行顺序。
14.在一个实施例中,所述目标识别配置信息至少包括第一状态标识和第二状态标识,以及从所述第一状态标识指示的第一识别状态切换为所述第二状态标识指示的第二识别状态的第一切换关系;
15.所述识别单元,具体用于:
16.采用所述第一识别状态对应的识别处理逻辑对所述待识别图像进行识别处理,得到第一识别结果;
17.若所述第一识别结果指示所述待识别图像通过所述第一识别状态下的识别处理,则根据所述第一切换关系,从所述第一识别状态切换为第二识别状态,并采用所述第二识别状态对应的识别处理逻辑对所述待识别图像进行识别处理,得到第二识别结果;
18.根据所述第二识别结果确定所述待识别图像的图像识别结果。
19.在一个实施例中,所述目标识别配置信息还包括第三状态标识,以及从第一状态标识指示的第一识别状态切换为所述第三状态标识指示的第三识别状态的第二切换关系,所述装置还包括:切换单元和确定单元。
20.切换单元,用于若所述第一识别结果指示所述待识别图像未通过所述第一识别状态下的识别处理,则根据所述第二切换关系从所述第一识别状态切换为第三识别状态,并采用所述第三识别状态对应的识别处理逻辑对所述待识别图像进行识别处理,得到第三识别结果;
21.确定单元,用于根据所述第三识别结果确定所述待识别图像的图像识别结果,其中,所述第三识别状态为所述第一识别状态,或者所述第一识别状态的前一个识别状态。
22.在一个实施例中,所述目标配置信息包括的每个状态标识是从状态机中预设的状态标识集中选取的;
23.所述状态标识集中的状态标识包括以下一个或多个:人脸检测状态的标识,眼部遮挡状态的标识,嘴部遮挡状态的标识,质量分检测状态的标识,活体检测状态的标识,注意力检测状态的标识。
24.在一个实施例中,所述装置还包括:添加单元。
25.所述确定单元,还用于响应于针对所述待识别图像的识别处理逻辑的增加操作,确定待增加的识别处理逻辑对应的识别状态,并判断所述状态标识集是否包括待增加的识别处理逻辑对应识别状态的状态标识;
26.添加单元,用于若否,则将所述待增加的识别处理逻辑对应识别状态的状态标识添加到所述状态标识集中。
27.在一个实施例中,所述各个识别状态对应的识别处理逻辑是根据各个识别状态对应的状态配置信息确定的,所述状态配置信息包括:各个识别状态涉及的一个或多个识别操作,以及每个识别操作对应的操作参数;
28.所述各个识别状态对应的识别处理逻辑包括:按照所述状态配置信息指示的操作参数控制对应的识别操作的执行。
29.在一个实施例中,所述目标识别配置信息包括状态转移图,所述状态转移图包括多个状态节点,一个状态节点存储一个状态标识,不同状态节点之间的指向关系用于指示对应识别状态之间的切换关系。
30.在一个实施例中,所述目标识别配置信息包括多条状态描述语句,所述多条状态描述语句依次排列,每条状态描述语句用于描述不同状态标识对应的识别状态之间的切换关系。
31.再一方面,本发明实施例提供了一种图像识别设备,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储支持终端执行上述方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如下步骤:
32.响应于针对待识别图像的识别触发操作,对所述待识别图像所处的识别场景进行检测,其中,不同识别场景对应不同识别配置信息;
33.若所述待识别图像处于目标识别场景中,则获取与所述目标识别场景匹配的目标识别配置信息,所述目标识别配置信息用于指示在所述目标识别场景下对所述待识别图像进行图像识别的识别流程;
34.按照所述目标识别配置信息指示的识别流程,对所述待识别图像进行识别处理,得到所述待识别图像的图像识别结果。
35.再一方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序指令,所述程序指令被处理器执行时,用于执行如第一方面所述的图像识别方法。
36.在本发明实施例中,图像识别设备可在检测到针对待识别图像的识别触发操作后,对该待识别图像所处的识别场景进行检测,从而可从不同识别场景对应的不同识别配置信息中,获取与该待识别图像所处的目标识别场景匹配的目标识别配置信息,并可进一步地按照该目标识别配置信息指示的识别流程,对该待识别图像进行识别处理,从而得到针对该待识别图像的图像识别结果,基于识别场景的不同,该图像识别设备可采用不同的识别流程对该待识别图像进行识别处理,相比于采用统一的识别流程对待处理图像进行识别处理的方式,可有效提升对待处理图像进行进行图像识别的灵活性,此外,由于该识别配置信息指示的识别流程是基于识别状态的状态标识之间的切换关系进行描述配置的,使得图像识别设备基于对识别状态之间流转顺序的控制,实现了对待识别图像进行图像识别时的识别顺序的控制。
附图说明
37.为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
38.图1a是本发明实施例提供的一种图像识别系统的示意图;
39.图1b是本发明实施例提供的一种图像识别系统的示意图;
40.图2是本发明实施例提供的一种图像识别方法的示意流程图;
41.图3a是本发明实施例提供的一种识别窗口的示意图;
42.图3b是本发明实施例提供的一种显示图像识别结果的示意图;
43.图4是本发明实施例提供的一种图像识别方法的示意流程图;
44.图5a是本发明实施例提供的一种目标识别配置信息的示意图;
45.图5b是本发明实施例提供的一种目标识别配置信息的示意图;
46.图5c是本发明实施例提供的一种调整状态转移图的示意图;
47.图5d是本发明实施例提供的一种状态配置信息的示意图;
48.图6是本发明实施例提供的一种图像识别设备的的示意图;
49.图7是本发明实施例提供的一种图像识别装置的示意性框图;
50.图8是本发明实施例提供的一种图像识别图像识别设备的示意性框图。
具体实施方式
51.随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统,换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术,人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术,人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
52.本发明实施例提供的方案涉及人工智能的图像识别技术,本发明实施例提出的图像识别方法使得图像识别设备可根据识别场景的差异,获取不同的识别配置信息,从而可按照获取的识别配置信息指示的识别流程进行图像识别,使得该图像识别设备可基于识别场景的不同,或者识别需求的不同,按照不同识别流程的指示进行图像识别,可以理解的是,基于不同识别场景或者识别需求,配置不同的图像识别流程进行图像识别,可有效提升图像识别设备进行图像识别时的灵活性。在一个实施例中,图像识别是指利用计算机对待识别图像进行处理、分析和理解,以识别该待识别图像中所包括的不同模式的目标和对象的技术,是深度学习算法的一种实践应用,其中,图像识别具体可包括人脸识别,物品识别,以及距离检测等,该人脸识别可应用于安全检查、身份核验等领域中,物品识别可应用于智能零售等领域中,距离检测可应用于对象追踪等领域中,其中,本发明实施例主要以该图像识别为人脸识别时进行详细说明,在本发明实施例的图像识别为物品识别或距离检测等时,则可参见本发明实施例,而且,本发明实施例也不对人脸识别的具体算法做限制。在一个实施例中,该图像识别设备可以是终端设备,或者,也可以是服务器设备,在本发明实施例中不做限定,而在本发明实施例中,主要以该图像识别设备为终端设备进行详细说明,在该图像识别设备为服务器设备时,可参见本发明实施例。
53.在一个实施例中,在该图像识别设备为终端设备时,该图像识别方法可应用于如图1a所示的图像识别系统中,该图像识别系统包括图像识别设备10和服务器11,该图像识别设备10用于接收针对待识别图像的识别触发操作,并对该待识别图像所处的识别场景进
行检测,该服务器11用于存储与不同识别场景匹配的识别配置信息,从而使得该图像识别设备10可基于对待识别图像的识别场景的检测,从服务器11中获取与识别得到的目标识别场景匹配的目标识别配置信息,从而按照该目标识别配置信息指示的识别流程对待识别图像进行识别处理。在一个实施例中,在该图像识别设备10基于对待识别图像的识别场景的检测,从服务器11中获取与识别得到的目标识别场景匹配的目标识别配置信息时,该图像识别设备10可将对该待识别图像的识别场景的检测,将检测确定出的目标识别场景的场景标识发送给服务器11,以从服务器11中获取与该目标识别场景的场景标识匹配的目标识别配置信息,或者,该图像识别设备10也可直接将采集得到的待识别图像发送给服务器11,以使得服务器11对待识别图像进行场景识别,从而确定出待识别图像所处的目标识别场景,并将与该目标识别场景匹配的目标识别配置信息发送给该图像识别设备10,使得该图像识别设备10获取到与该目标识别场景匹配的目标识别配置信息。
54.在一个实施例中,与不同识别场景配置的识别配置信息还可直接存储在该图像识别设备10中,使得图像识别设备10在对待识别图像所处的识别场景进行检测后,可直接从本地获取得到与识别确定出的目标识别场景匹配的目标识别配置信息,并按照该目标识别配置信息指示的识别流程对待识别图像进行识别处理。在一个实施例中,在该图像识别设备10为终端设备时,对该待识别图像采用目标识别配置信息指示的识别流程进行处理后,可将得到的图像识别结果在该图像识别设备10中进行直接展示,其中,不同识别场景对应不同识别配置信息。
55.在一个实施例中,在该图像识别设备为服务器设备时,该图像识别方法可应用于如图1b所示的图像识别系统中,该图像识别系统包括图像识别设备10,以及用户终端12,该图像识别设备10中存储了不同识别场景对应的不同识别配置信息,并可在检测到用户终端12发送的针对待识别图像的识别触发操作后,从该用户终端12中进行待识别图像的获取,以对该待识别图像进行场景识别,从而确定出该待识别图像的所处的目标识别场景,进一步地,该图像识别设备10可从本地获取得到与该目标识别场景匹配的目标识别配置信息,并按照该目标识别配置信息所指示的识别流程,对该待识别图像进行识别处理,得到该待识别图像的图像识别结果,在图像识别设备10得到针对该待识别图像的图像识别结果后,则可将针对该待识别图像的图像识别结果发送到用户终端12,以在用户终端12的用户界面中展示该图像识别结果。在一个实施例中,该图像识别设备10通过对待识别图像进行场景识别,从而可使得图像设备10实现基于识别场景的差异对待识别图像进行差异性识别,提升了图像识别设备在进行图像识别过程中的灵活性。
56.请参见图2,是本发明实施例提出的一种图像识别方法的示意流程图,该方法可应用于上述的图像识别设备中,且该图像识别设备为终端设备,如图2所示,该方法可包括:
57.s201,响应于针对待识别图像的识别触发操作,对所述待识别图像所处的识别场景进行检测,其中,不同识别场景对应不同识别配置信息。
58.在一个实施例中,该图像识别设备可在检测到针对待识别图像的检测操作后,从图像识别区域中获取到待识别图像后,确定检测到针对该待识别图像的识别触发操作,其中,针对该待识别图像的检测操作例如可以是登录操作,如会员登录操作,或者,针对该待识别图像的检测操作也可以是支付操作,如刷脸支付操作等等,在该图像识别设备检测到针对该待识别图像的检测操作后,则可从图像识别区域中进行待识别图像的获取,可以理
解,图像识别设备从该图像识别区域中获取的待识别图像为人脸图像,且获取的待识别图像的数量可以为一张或者多张,例如该图像识别设备可仅从该图像识别区域中获取该人脸的正面图像作为该待识别图像,或者,该图像识别设备也可从该图像识别区域中获取不同角度的人脸图像作为该待识别图像,该不同角度的人脸图像例如可以是正面图像,侧面图像,仰角图像以及俯角图像等等。在本发明实施例中,对图像识别设备获取的待识别图像的数量不做限定,该图像识别设备获取的每张待识别图像均适用于本发明实施例。
59.在一个实施例中,图像识别设备在检测到针对待识别图像的检测操作后,可先显示对该待识别图像进行图像识别的识别窗口,该识别窗口例如可以是如图3a中由30标记的窗口,该识别窗口30包括图像识别区域,该图像识别区域则例如可以是如图3a中由301标记的区域,则该图像识别设备则可从该图像识别区域301中获取得到待识别图像,获取得到的待识别图像例如可以是如图3a中由31标记的图像所示。此外,该图像识别设备在对该待识别图像所处的识别场景进行检测时,可基于对该识别窗口30的检测,确定出该待识别图像所处的场景,具体地,该图像识别设备对识别窗口30进行检测,以确定出该待识别图像所处的场景时,可先从该识别窗口30中获取场景关键字,则可基于该场景场景关键字确定出该待识别图像所处的识别场景,举例来说,若该场景关键字例如可以是如图3a所示的“会员登录”,则该图像识别设备确定该待识别图像所处的识别场景为会员登录识别场景,或者,若获取的场景关键字包括“支付”,则该图像识别设备确定该待识别图像所处的识别场景为支付识别场景,又或者,若获取的场景关键字包括“手势”,则该图像识别设备确定该待识别图像所处的识别场景为手势识别场景。
60.在一个实施例中,该图像识别设备还可基于对识别触发操作进行检测,确定出待识别图像所处的识别场景,在具体实现中,若该识别触发操作为会员登录操作,则该图像识别设备可确定针对该待识别图像的识别场景为会员登录场景,其中该图像识别设备可在检测到会员登录按键被触发时,确定该识别触发操作为会员登录操作;或者,若该图像识别设备检测到支付按键被触发时,确定该是被触发操作为支付操作,则可进一步确定针对该待识别图像的识别场景为支付场景。在一个实施例中,开发人员为不同识别场景配置了不同的识别配置信息,且该识别场景和识别配置信息的对应关系为一一对应的关系,以使得该图像识别设备可基于对该待识别图像的场景的识别,确定出用于对该待识别图像所处的识别场景进行识别处理的识别流程,在具体实现中,该图像识别设备可先基于对该待识别图像的识别场景的识别,从不同识别配置信息中获取得到与该待识别图像所处的识别场景匹配的目标识别配置信息,即转而执行步骤s202,从而基于获取得到的目标识别配置信息确定出用于对该待识别图像进行识别处理的识别流程。
61.s202,若所述待识别图像处于目标识别场景中,则获取与所述目标识别场景匹配的目标识别配置信息,所述目标识别配置信息用于指示在所述目标识别场景下对所述待识别图像进行图像识别的识别流程。
62.在一个实施例中,该不同识别场景对应的识别配置信息可直接存储在该图像识别设备中,具体地,该图像识别设备可将该识别配置信息,以及该识别配置信息与不同识别场景之间的对应关系进行关联存储,以使得该图像识别设备可从本地基于识别场景查找到对应的识别配置信息,其中,若该图像识别设备检测到该待识别图像处于目标识别场景,则可获取得到与该目标识别场景匹配的目标识别配置信息。其中,该图像识别设备在关联存储
不同识别配置信息与识别场景时,可将识别场景对应的场景编号与该识别配置信息对应的配置编号进行关联存储,那么可以理解的是,图像识别设备可在确定该待识别图像处于目标识别场景后,确定出该目标识别场景对应的目标场景编号,从而可进一步确定出与该目标场景编号关联的目标配置编号,那么则可从本地获取该目标配置编号对应的识别配置信息,并作为目标识别配置信息。
63.在一个实施例中,为了减轻图像识别设备的数据存储压力,还可只将该识别场景对应的场景编号以及该识别配置信息对应的配置编号关联存储在图像识别设备的本地存储器中,而将识别配置信息存储到与该识别配置设备建立有通信连接的服务器中,那么该图像识别设备在确定该待识别图像处于目标识别场景后,确定出该目标识别场景对应的目标场景编号,从而可进一步确定出与该目标场景编号对应的目标配置编号,并从服务器获取与该目标配置编号对应的识别配置信息作为目标识别配置信息。在一个实施例中,为了进一步减轻图像识别设备的数据存储压力,也可将该场景编号以及配置编号关联存储到服务器,以及将识别配置信息存储到该服务器,那么该图像识别设备在确定出待识别图像处于目标识别场景后并确定出目标识别场景对应的目标场景编号后,将确定出的目标场景编号发送给服务器,使得服务器确定出目标场景编号关联的目标配置编号,并将该目标配置编号指示的目标识别配置信息发送给图像识别设备,从而使得该图像识别设备获取得到该目标识别配置信息。
64.在一个实施例中,目标识别配置信息用于指示在该目标识别场景下对该待识别图像进行图像识别的识别流程,其中,该目标识别配置信息具体包括了至少一个识别状态的状态标识,以及不同状态标识对应的识别状态之间的切换关系,且一个识别状态对应一个识别处理逻辑,那么该目标识别配置信息指示的识别流程为:根据所述切换关系确定的各个识别状态对应的识别处理逻辑的执行顺序。举例来说,若该目标识别配置信息包括的识别状态的状态标识分别为:人脸检测状态的标识,嘴部遮挡检测状态的标识和活体检测状态的标识,且该不同状态标识对应的识别状态之间的切换关系为:人脸检测状态

嘴部遮挡检测状态

活体检测状态,其中,人脸检测状态对应的识别处理逻辑为人脸检测逻辑,嘴部遮挡检测状态对应的识别处理逻辑为嘴部遮挡检测逻辑,活体检测状态对应的识别处理逻辑为活体检测逻辑,那么,该目标识别配置信息所指示的识别流程则为先按照人脸检测逻辑进行人脸检测,再按照嘴部遮挡检测逻辑进行嘴部遮挡检测,最后按照活体检测逻辑进行活体检测。
65.在一个实施例中,为不同识别场景配置的识别配置信息是基于对应识别场景所需的识别精度确定的,可以理解的是,识别精度越高的识别场景所对应的识别配置信息包括的识别状态的状态标识也就越多,即需要执行的识别处理逻辑也就越多,而识别精度较低的识别场景对应的识别配置信息所包括的识别状态的状态标识也就越少,所需执行的识别处理逻辑也就越少。举例来说,若该目标识别场景为会员登录场景,由于该会员登录场景所需的识别精度较低,则与该会员登录场景匹配的目标识别配置信息包括的状态标识也就越少,如可包括人脸检测状态的标识,眼部遮挡检测状态的标识,嘴部遮挡检测状态的标识和活体检测状态的标识即可;而如果该目标识别场景支付场景,由于支付场景所需的识别精度较高,那么与该支付场景匹配的目标识别配置信息包括的状态标识也就越多,该目标识别配置信息包括的状态标识则可以包括人脸检测状态的标识,眼部遮挡检测状态的标识,
嘴部遮挡检测状态的标识,质量分检测状态的标识,活体检测状态的标识,注意力检测状态的标识等。
66.在一个实施例中,该图像识别设备在确定出与目标识别场景匹配的目标识别配置信息后,则可按照该目标识别配置信息指示的,对待识别图像进行图像识别的识别流程,对该待识别图像进行识别处理,即转而执行步骤s203。
67.s203,按照所述目标识别配置信息指示的识别流程,对所述待识别图像进行识别处理,得到所述待识别图像的图像识别结果。
68.在一个实施例中,该图像识别设备按照该识别流程对该待识别图像进行识别处理,即是按照该目标识别配置信息包括的不同状态标识对应的识别状态之间的切换关系,依次采用每个识别状态对应的识别处理逻辑对该待识别图像进行图像识别处理,从而得到该待识别图像的图像识别结果。其中,该图像识别设备在采用每个识别状态对应的识别处理逻辑对该待识别图像进行识别处理时,本发明实施例并不限制执行每个识别状态对应的识别处理逻辑时具体涉及的处理算法,在不同的识别场景中,执行同一识别状态对应的识别处理逻辑所涉及的处理算法可以是相同的,也可以是不同的。在一个实施例中,在按照该切换关系,依次采用每个识别状态对应的识别处理逻辑对该待识别图像进行图像识别处理时,对识别处理逻辑的切换是在采用当前识别状态对应的识别处理逻辑对该待识别图像进行图像识别处理,且得到的图像识别处理结果满足识别切换条件时,切换到该当前识别状态的下一个识别状态所对应的识别处理逻辑的,而如果当前识别状态对应的识别处理逻辑对该待识别图像进行图像识别处理时,得到的处理结果不满足识别切换条件,则将不切换到下一个识别状态对应的识别处理逻辑,而跳转到该当前识别状态的上一个识别状态对应的识别处理逻辑进行执行,或者,保持执行当前识别状态对应的识别处理逻辑。
69.在一个实施例中,若该切换条件为采用对应识别处理逻辑对待识别图像进行图像识别得到的识别结果,指示该待识别图像通过对应识别状态下的图像识别,那么可以理解的是,图像识别设备在按照该目标识别配置信息指示的识别流程,对该待识别图像进行识别处理后,该待识别图像的图像识别结果,即是采用该目标识别配置信息中切换关系指示的最后一个状态标识对应识别状态所对应的识别处理逻辑,对该待识别图像进行图像识别处理得到的识别结果。在一个实施例中,针对该待识别图像的图像识别结果包括:该待识别图像通过目标识别场景下的图像识别,或者,该待识别图像未通过目标识别场景下的图像识别,其中,若该目标识别场景为会员登录场景,则通过目标识别场景下的图像识别是指会员登录成功;或者,若该目标识别场景为支付场景,则通过目标识别场景下的图像识别是指支付成功;或者,若该目标识别场景为检测到目标手势则触发拍照的场景,则通过目标识别场景下的图像识别是指检测到目标手势并触发拍照。
70.在一个实施例中,如果采用该目标识别配置信息指示的识别流程中,采用任一状态标识对应识别状态的识别处理逻辑对该待识别图像进行识别处理后,得到的识别结果为该待识别图像未通过对应识别状态下的图像识别,则可确定该待识别图像的图像识别结果为该待识别图像未通过对应识别状态下的图像识别,使得该图像识别设备可基于该目标识别配置信息指示的识别流程,并根据该识别流程中各状态标识对应识别状态的识别处理逻辑对该待识别图像的识别处理结果,快速确定出该待识别图像的识别结果,基于对不同识别场景下的识别配置信息的灵活设置,可提升识别配置的灵活性。而且,由于每个识别配置
信息的识别流程是清晰的,该识别流程的跳转又是依赖于该待识别图像是否满足该识别状态的,那么可为每个识别状态单独配置不同的跳转开关,并单独管理每个跳转开关,避免多个识别状态对应的跳转开关耦合到一起的问题。
71.在一个实施例中,图像识别设备在得到针对该待识别图像的图像识别结果后,可将该待识别图像的图像识别结果显示在用户界面中,若该图像识别设备为终端设备,则可直接将该图像识别结果显示在该图像识别设备中,或者,若该图像识别设备为服务器设备,该图像识别设备则可将确定出的图像识别结果发送到用户终端中,以在用户界面中显示该待识别图像的图像识别结果。在一个实施例中,若图像识别设备确定该待识别图像所处的目标识别场景为与人脸(或物品)识别相关的场景,则显示该待识别图像的图像识别结果的用户界面可如图3b中由302标记的界面所示,基于显示在用户界面的图像识别结果,用户可快速确定出目标识别场景下对待识别图像的识别是否通过。或者,若图像识别设备确定该待识别图像所处的目标识别场景为与手势相关的场景,则该图像识别设备可根据该待识别图像的图像识别结果确定是否检测到预设手势,并在确定是时触发执行预设操作,该预设手势例如可以是手势比出的ok的操作等,对应触发执行的预设操作可以是拍照操作,或者摄像操作,或者录音操作,或者拨通未接来电的操作等。
72.在本发明实施例中,图像识别设备可在检测到针对待识别图像的识别触发操作后,对该待识别图像所处的识别场景进行检测,从而可从不同识别场景对应的不同识别配置信息中,获取与该待识别图像所处的目标识别场景匹配的目标识别配置信息,并可进一步地按照该目标识别配置信息指示的识别流程,对该待识别图像进行识别处理,从而得到针对该待识别图像的图像识别结果,基于识别场景的不同,该图像识别设备可采用不同的识别流程对该待识别图像进行识别处理,相比于采用统一的识别流程对待处理图像进行识别处理的方式,可有效提升对待处理图像进行进行图像识别的灵活性,此外,由于该识别配置信息指示的识别流程是基于识别状态的状态标识之间的切换关系进行描述配置的,使得图像识别设备基于对识别状态之间流转顺序的控制,实现了对待识别图像进行图像识别时的识别顺序的控制。
73.请参见图4,是本发明实施例提出的一种图像识别方法的示意流程图,该方法可应用于上述的图像识别设备中,且该图像识别设备为终端设备,如图2所示,该方法可包括:
74.s401,响应于针对待识别图像的识别触发操作,对所述待识别图像所处的识别场景进行检测,其中,不同识别场景对应不同识别配置信息。
75.在一个实施例中,步骤s401的具体实施方式可参见上述实施例中步骤s201的具体实施方式,在此不再赘述。
76.s402,若所述待识别图像处于目标识别场景中,则获取与所述目标识别场景匹配的目标识别配置信息,所述目标识别配置信息用于指示在所述目标识别场景下对所述待识别图像进行图像识别的识别流程。
77.在一个实施例,该目标识别配置信息包括的每个状态标识均是从状态机中预设的状态标识集中选取的,该状态机中预设的状态标识集中的状态标识包括以下一个或多个:人脸检测(face_detect)状态的标识,眼部遮挡(eye_mask_detect)状态的标识,嘴部遮挡(mouth_mask_detect)状态的标识,质量分检测(quality_detect)状态的标识,活体检测(live_ness_detect)状态的标识,注意力检测(attention_detect)状态的标识。其中,该状
态机还可包括成功(sucess_state)状态,和/或失败(defeate_state)状态,以使得跳出执行该状态机的识别状态的切换,以得到针对该待识别图像的图像识别结果。该状态机(finite state machine,fsm)可根据控制信号按照预先设定的状态(如识别状态)进行状态转移,在本发明实施例中,用于控制状态机进行状态转移的控制信号即是上述的不同状态标识对应识别状态之间的切换关系,该状态机可在检测到满足该切换关系时,确定检测到用于控制状态标识对应识别状态进行转移的控制信号。在一个实施例中,该状态标识还可包括:手势检测状态的标识,或者物品检测状态的标识,该状态机中状态标识集所包括的状态标识,可基于该图像识别设备的图像识别的主要需求(或主要用户)进行删除,增加或者修改,基于对状态标识的增加,删除或修改,可实现对图像识别设备对应的图像识别功能的增加,删除或修改,提升了图像识别设备进行图像识别时功能的可扩展性和可维护性。
78.在一个实施例中,若该待识别图像的识别处理逻辑的增加操作,确定待增加的识别处理逻辑对应的识别状态,并判断所述状态标识集是否包括待增加的识别处理逻辑对应识别状态的状态标识;若否,则将所述待增加的识别处理逻辑对应识别状态的状态标识添加到所述状态标识集中,并在将述待增加的处理逻辑对应识别状态的状态标识添加到所述状态标识集中后,添加该识别状态对应的识别处理逻辑所执行的具体算法,从而使得该图像识别设备实现了添加识别处理逻辑以及对应的具体算法时,可不将添加的识别处理逻辑所执行的具体算法添加到图像识别主流程中,可以保证该图像识别设备主体的图像识别算法的简便,从而避免了对识别处理逻辑对应执行算法的添加所导致的图像识别设备的主体算法臃肿的问题。
79.在一个实施例中,该目标识别配置信息可以是由多条状态描述语句组成的,图像识别设备可接收通过配置下发的用于描述fsm的内部识别状态,以及各识别状态之间切换关系的状态描述语句,在该图像识别设备获取到该状态描述语句后,可对该状态描述语句进行解析,从而生成运行时fsm实例,在具体实现中,该图像识别设备可调用配置管理模块对该状态描述语句进行解析,生成运行时fsm实例即是指当该图像识别设备运行到每个识别状态后,对应识别处理逻辑所具体执行的算法。在该图像识别设备根据状态描述语句生成运行时fsm实例后,可根据该状态描述语句所包括的识别状态的状态标识,确定该状态机中预设的状态标识集中哪个状态标识对应的识别状态参与到fsm状态切换,以及每个状态标识对应的识别状态的前后依赖顺序(即切换关系),从而使得该图像识别设备可确定进行图像识别时,参与图像识别(如人脸检测,手势检测等)的功能模块和各功能模块执行顺序,其中,一个功能模块用于执行一个识别状态对应的识别处理逻辑。
80.在一个实施例中,该目标识别配置信息包括的多条状态描述语句依次排列,每条状态描述语句用于描述不同状态标识对应识别状态之间的切换关系,其中,若一条状态描述语句包括的状态标识为第一状态标识和第二状态标识,则该条状态描述语句则用于指示由该第一状态标识对应的识别状态,切换到该第二状态标识对应的识别状态的切换关系,可以理解,该第一状态标识则为该条状态描述语句的起始状态标识,该第二状态标识则为该条状态描述语句的终止状态标识,在一个实施例中,每条状态描述语句的起始状态标识(即第一状态标识)和终止状态标识(即第二状态标识)可以是相同的,也可以是不同的。其中,该图像识别设备可根据该目标识别配置信息的多条状态描述语句中,确定出该图像识别设备启动执行该目标识别配置信息指示的识别流程的初始状态标识,其中,该图像识别
设备可将该依次排列的多条状态描述语句的第一条状态描述语句的起始状态标识,作为该图像识别设备执行该目标识别配置信息指示的识别流程的初始状态标识,从而可按照该初始状态标识对应识别状态的识别处理逻辑对该待识别图像进行识别处理。
81.在一个实施例中,由多条状态描述语句构成的目标识别配置信息可如图5a所示,其中包括的一条状态描述语句为{“现态”:“人脸检测”,“动作”:“事件通过”,“次态”:“眼部遮挡检测”},则该条状态描述语句中的第一状态标识为“人脸检测”,第二状态标识为“眼部遮挡检测”,该第一状态标识对应的识别状态与第二状态标识对应的识别状态之间的切换关系为:在确定事件通过时,则从第一状态标识切换到第二状态标识,其中,该图像识别设备可在确定采用每条状态描述语句的起始状态标识(如第一状态标识)对应识别状态的识别处理逻辑对该待识别图像进行识别处理,且该待识别图像通过该识别状态下的识别处理时,确定事件通过。
82.在一个实施例中,该目标识别配置信息还可以是状态转移图,该状态转移图包括多个状态节点,每个节点用于存储一个状态标识,且不同状态节点之间的指向关系用于指示对应识别状态之间的切换关系,该状态转移图可如图5b所示,根据该状态描述语句或者状态转移图可知,该目标识别配置信息包括的识别状态包括:人脸检测状态,眼部遮挡状态,嘴部遮挡状态,质量分检测状态,活体检测状态,以及注意力检测状态,该图像识别设备根据该待识别图像所处的目标识别场景获取到该目标识别配置信息后,则可确定出参与运算的状态机的识别状态,以及用于执行该识别状态对应识别处理逻辑的功能模块。在一个实施例中,为了提升图像识别效率,可通过将目标识别配置信息指示的识别流程调整为多并发的识别流程,从而提升对待识别图像的图像识别效率,在一个实施例中,在调整该识别流程时,可通过修改状态描述语句,或者该状态转移图的指向关系,从而实现对识别流程的调整,而不用对图像识别的主体算法进行修改,就可达到对识别流程的调整的目标,可有效提升对识别流程的调整效率,其中,调整为多并发的状态转移图可如图5c所示。
83.在该图像识别设备确定出与待识别图像所处的目标识别场景匹配的目标识别配置信息后,则可按照该目标识别配置信息指示的识别流程对该待识别图像进行识别处理,以得到该待识别图像的图像识别结果,在具体实现中,若该目标识别配置信息至少包括第一状态标识和第二状态标识,以及从该第一状态标识指示的第一识别状态切换为第二状态标识指示的第二识别状态的第一切换关系,则该图像识别设备在按照该目标识别配置信息指示的识别流程对该待识别图像进行识别处理时,可执行步骤s403~步骤s405。
84.s403,采用第一识别状态对应的识别处理逻辑对所述待识别图像进行识别处理,得到第一识别结果。
85.s404,若所述第一识别结果指示所述待识别图像通过所述第一识别状态下的识别处理,则根据第一切换关系,从所述第一识别状态切换为第二识别状态,并采用所述第二识别状态对应的识别处理逻辑对所述待识别图像进行识别处理,得到第二识别结果。
86.s405,根据所述第二识别结果确定所述待识别图像的图像识别结果。
87.在步骤s403~步骤s405中,图像识别设备在对该待识别图像进行识别处理时,可先采用该第一识别状态对应的识别处理逻辑第该待识别图像进行识别处理,得到第一识别结果,并在该第一识别结果指示该待识别图像通过该第一识别状态下的识别处理,则根据该第一切换关系,从该第一识别状态切换到第二识别状态,并采用该第二识别状态对应的
识别处理逻辑对该待识别图像进行识别处理,得到第二识别结果,从而可根据该第二识别结果确定该待识别图像的图像识别结果。在一个实施例中,若该目标识别配置信息仅包括该第一状态标识和第二状态标识,则该图像识别设备在采用第一状态标识对应第一识别状态的识别处理逻辑对该待识别图像进行识别处理得到的第一识别结果,指示该待识别图像通过该第一识别状态下的识别处理,则该图像识别设备可从第一识别状态切换到第二识别状态,并将采用第二识别状态对应的识别处理逻辑对该待识别图像进行识别处理得到的第二识别结果,作为该待识别图像的图像识别结果。其中,若该第二识别结果指示该待识别图像通过该第二识别状态下的识别处理,则确定该待识别图像的图像识别结果为通过该目标识别场景下的图像识别;或者,若该第二识别结果指示该待识别图像未通过该第二识别状态下的识别处理,则确定该待识别图像的图像识别结果为未通过该目标识别场景下的图像识别。
88.在一个实施例中,图像识别设备根据确定得到的针对待识别图像是否通过目标识别场景下的图像识别结果,可输出结果提示信息,如在确定该待识别图像通过该目标识别场景下的图像识别时,输出识别通过的提示信息,或者,在确定该待识别图像未通过该目标识别场景下的图像识别时,输出识别未通过的提示信息,并在该识别未通过的提示信息中显示未通过识别的原因,该原因例如可以是眼镜存在遮挡或者嘴巴存在遮挡等。在一个实施例中,该图像识别设备还可根据确定得到的图像识别结果,执行相应的操作,如在该图像识别设备确定待识别图像通过该目标识别场景下的图像识别时,则执行拍照,摄像,语音录制等操作,而在该图像识别设备确定待识别图像未通过该目标识别场景下的图像识别时,则停止拍照,摄像或语音录制等。
89.在一个实施例中,若该目标识别配置信息还包括第三状态标识,以及从第一状态标识指示的第一识别状态切换为所述第三状态标识指示的第三识别状态的第二切换关系,那么,如果该第一识别结果指示该待识别图像未通过该第一识别状态下的识别处理,则可根据该第二切换关系从所述第一识别状态切换为第三识别状态,并采用所述第三识别状态对应的识别处理逻辑对所述待识别图像进行识别处理,得到第三识别结果,进一步地,该图像识别设备则可根据所述第三识别结果确定所述待识别图像的图像识别结果,其中,所述第三识别状态为所述第一识别状态,或者所述第一识别状态的前一个识别状态。如图5b所示,若该第一状态标识为眼部遮挡检测状态的标识,那么该第一切换关系是从眼部遮挡检测状态的标识切换到嘴部遮挡检测状态的标识,第二切换关系是从眼部遮挡检测状态的标识切换到人脸检测状态的标识;或者,若该第一状态标识为人脸检测状态的标识,则该第一切换关系是从人脸检测状态的标识切换到眼部遮挡检测状态的标识,第二切换关系是从人脸检测状态的标识切换到人脸检测状态的标识。
90.可以理解的是,在该目标识别配置信息包括的识别状态的状态标识为多个时,图像识别设备在按照该目标识别配置信息包括的不同状态标识对应识别标识之前的切换关系,依次采用各识别状态标识对应识别状态的识别处理逻辑对该待识别图像进行识别处理,在依次采用各识别状态对应识别处理逻辑对该待识别图像进行识别处理过程中,若存在采用一个识别状态对应识别处理逻辑处理该待识别图像,得到的识别结果指示该待识别图像未通过对应识别状态下的识别处理,则确定该待识别图像的图像识别结果为未通过目标识别场景的图像识别,而在依次采用各识别状态对应识别处理逻辑对该待识别图像进行
识别处理过程中,采用最后一个识别状态对应识别处理逻辑处理该待识别图像,得到的识别结果指示该待识别图像通过最后一个识别状态的识别处理,则确定该待识别图像的图像识别结果为通过该目标识别场景的图像识别。
91.在一个实施例中,每个识别状态对应的识别处理逻辑是根据各个识别状态对应的状态配置信息确定的,所述状态配置信息包括:各个识别状态涉及的一个或多个识别操作,以及每个识别操作对应的操作参数,那么所述各个识别状态对应的识别处理逻辑包括:按照所述状态配置信息指示的操作参数控制对应的识别操作的执行,可以理解的是,该状态配置信息用于控制采用对应识别状态的识别处理逻辑对该待识别图像进行识别处理时,所涉及的识别操作,以及识别操作的执行顺序等。在一个实施例中,状态机中预设的状态标识集中的每个状态标识均和一个状态配置信息相对应,在该图像识别设备仅获取该状态标识集中,需要执行fsm状态切换的状态标识对应的状态配置信息,而不执行该状态切换的状态标识则无需获取对应的状态配置信息,可有效提升该图像识别设备的数据获取效率。
92.在一个实施例中,人脸识别状态的状态配置信息,眼部遮挡检测状态的状态配置信息,嘴部遮挡识别状态的配置信息,以及质量检测状态的配置信息可如图5d所示,其中,人脸识别状态的状态配置信息包括该人脸识别状态涉及的识别操作(如脸部选取操作),以及对应的操作参数,基于如图5d所示的人脸检测状态的配置信息,可确定待识别图像中进行脸部选取时,所选取的人脸图像范围的最小值(如100)和最大值(如300),也就是说,因此,在采用该人脸识别状态对应的识别处理逻辑对该待识别图像进行识别处理,在执行脸部选取操作后,则将从该待识别图像中选取出人脸图像范围在100~300之间的脸部图像。此外,眼部遮挡状态的状态配置信息,嘴部遮挡状态的状态配置信息,以及质量检测状态的状态配置信息,均也用于指示执行相应操作后选取出的图像。可以理解的是,该图像识别设备可在获取到各识别状态对应的状态配置信息后,可对该状态配置信息采用解析轻量级的数据交换格式(如javascript object notation,json)数据的方式进行解析,确定出需要执行的识别操作,以及每个识别操作对应的操作参数。此外,通过对状态配置信息中识别操作的调整,或者对应操作参数的调整,则可使得图像识别设备对待识别图像的图像识别流程适应于不同识别需求,并提升了对识别操作和对应操作参数调整的便捷性。
93.在一个实施例中,若该图像识别设备为终端设备,该图像识别设备用于人脸检测时,该图像识别设备的结构图可如图6所示,该图像识别设备中的识别控制器用于判断是否检测到针对该待识别图像的识别触发操作,并在确定检测到该识别触发操作时,对该待识别图像所处的识别场景进行检测,并在检测到该待识别图像处于目标识别场景时,向状态机管理器发送该待识别图像处于目标识别场景的通知消息,该状态机管理器在接收到该通知消息后,则从配置管理中获取与该目标识别场景匹配的目标识别配置信息,若获取的目标识别配置信息如图5a所示,则该状态机调度器在检测到该目标识别配置信息指示的状态标识对应的识别状态的切换关系到达时,依次采用该目标识别配置信息包括的各状态标识对应识别状态的识别处理逻辑对该待识别图像进行图像识别处理,从而确定出该待识别图像的图像识别结果。
94.在本发明实施例中,图像识别设备在检测到针对待识别图像的识别触发操作后,可对该待识别图像所处的识别场景进行检测,从而可获取与待识别图像所处目标识别场景匹配的目标识别配置信息,从而可按照该目标识别配置信息指示的识别流程,对该待识别
图像进行识别处理,基于为不同识别场景所配置的不同的识别配置信息,可满足图像识别设备对不同识别场景下的待识别图像进行区别化的图像识别的需求,并可避免图像识别设备进行图像识别的版本差异所导致的功能不一致的问题,通过识别配置信息对识别流程的配置,可规避采用统一无差别的图像识别流程所导致的识别版本不同,所采用的算法或编码方式不同而表现不同的问题。同时,基于识别配置信息对识别流程的配置,可实现通过调整识别配置信息,而达到调整图像识别流程的目的,使得对图像识别设备中识别流程的调整更加地便捷。
95.基于上述图像识别方法实施例的描述,本发明实施例还提出了一种图像识别装置,该图像识别装置可以是运行于上述图像识别装置中的一个计算机程序(包括程序代码)。该图像识别装置可用于执行如图2和图4所述的图像识别方法,请参见图7,该图像识别装置包括:检测单元701,获取单元702和识别单元703。
96.检测单元701,用于响应于针对待识别图像的识别触发操作,对所述待识别图像所处的识别场景进行检测,其中,不同识别场景对应不同识别配置信息;
97.获取单元702,用于若所述待识别图像处于目标识别场景中,则获取与所述目标识别场景匹配的目标识别配置信息,所述目标识别配置信息用于指示在所述目标识别场景下对所述待识别图像进行图像识别的识别流程;
98.识别单元703,用于按照所述目标识别配置信息指示的识别流程,对所述待识别图像进行识别处理,得到所述待识别图像的图像识别结果。
99.在一个实施例中,所述目标识别配置信息包括至少一个识别状态的状态标识,以及不同状态标识对应的识别状态之间的切换关系,且一个识别状态对应一个识别处理逻辑;
100.所述目标识别配置信息指示的识别流程为:根据所述切换关系确定的各个识别状态对应的识别处理逻辑的执行顺序。
101.在一个实施例中,所述目标识别配置信息至少包括第一状态标识和第二状态标识,以及从所述第一状态标识指示的第一识别状态切换为所述第二状态标识指示的第二识别状态的第一切换关系;
102.所述识别单元703,具体用于:
103.采用所述第一识别状态对应的识别处理逻辑对所述待识别图像进行识别处理,得到第一识别结果;
104.若所述第一识别结果指示所述待识别图像通过所述第一识别状态下的识别处理,则根据所述第一切换关系,从所述第一识别状态切换为第二识别状态,并采用所述第二识别状态对应的识别处理逻辑对所述待识别图像进行识别处理,得到第二识别结果;
105.根据所述第二识别结果确定所述待识别图像的图像识别结果。
106.在一个实施例中,所述目标识别配置信息还包括第三状态标识,以及从第一状态标识指示的第一识别状态切换为所述第三状态标识指示的第三识别状态的第二切换关系,所述装置还包括:切换单元704和确定单元705。
107.切换单元704,用于若所述第一识别结果指示所述待识别图像未通过所述第一识别状态下的识别处理,则根据所述第二切换关系从所述第一识别状态切换为第三识别状态,并采用所述第三识别状态对应的识别处理逻辑对所述待识别图像进行识别处理,得到
第三识别结果;
108.确定单元705,用于根据所述第三识别结果确定所述待识别图像的图像识别结果,其中,所述第三识别状态为所述第一识别状态,或者所述第一识别状态的前一个识别状态。
109.在一个实施例中,所述目标配置信息包括的每个状态标识是从状态机中预设的状态标识集中选取的;
110.所述状态标识集中的状态标识包括以下一个或多个:人脸检测状态的标识,眼部遮挡状态的标识,嘴部遮挡状态的标识,质量分检测状态的标识,活体检测状态的标识,注意力检测状态的标识。
111.在一个实施例中,所述装置还包括:添加单元706。
112.所述确定单元705,还用于响应于针对所述待识别图像的识别处理逻辑的增加操作,确定待增加的识别处理逻辑对应的识别状态,并判断所述状态标识集是否包括待增加的识别处理逻辑对应识别状态的状态标识;
113.添加单元706,用于若否,则将所述待增加的识别处理逻辑对应识别状态的状态标识添加到所述状态标识集中。
114.在一个实施例中,所述各个识别状态对应的识别处理逻辑是根据各个识别状态对应的状态配置信息确定的,所述状态配置信息包括:各个识别状态涉及的一个或多个识别操作,以及每个识别操作对应的操作参数;
115.所述各个识别状态对应的识别处理逻辑包括:按照所述状态配置信息指示的操作参数控制对应的识别操作的执行。
116.在一个实施例中,所述目标识别配置信息包括状态转移图,所述状态转移图包括多个状态节点,一个状态节点存储一个状态标识,不同状态节点之间的指向关系用于指示对应识别状态之间的切换关系。
117.在一个实施例中,所述目标识别配置信息包括多条状态描述语句,所述多条状态描述语句依次排列,每条状态描述语句用于描述不同状态标识对应的识别状态之间的切换关系。
118.在本发明实施例中,检测单元701可在检测到针对待识别图像的识别触发操作后,对该待识别图像所处的识别场景进行检测,从而使得获取单元702可从不同识别场景对应的不同识别配置信息中,获取与该待识别图像所处的目标识别场景匹配的目标识别配置信息,识别单元703则可进一步地按照该目标识别配置信息指示的识别流程,对该待识别图像进行识别处理,从而得到针对该待识别图像的图像识别结果,基于识别场景的不同,可采用不同的识别流程对该待识别图像进行识别处理,相比于采用统一的识别流程对待处理图像进行识别处理的方式,可有效提升对待处理图像进行进行图像识别的灵活性,此外,由于该识别配置信息指示的识别流程是基于识别状态的状态标识之间的切换关系进行描述配置的,使得基于对识别状态之间流转顺序的控制,实现了对待识别图像进行图像识别时的识别顺序的控制。
119.请参见图8,是本发明实施例提供的一种图像识别设备的结构示意性框图,该图像识别设备可以是终端设备,也可以是服务器设备。如图8所示的本实施例中的图像识别设备可包括:一个或多个处理器801;一个或多个输入设备802,一个或多个输出设备803和存储器804。上述处理器801、输入设备802、输出设备803和存储器804通过总线805连接。存储器
804用于存储计算机程序,所述计算机程序包括程序指令,处理器801用于执行所述存储器804存储的程序指令。
120.所述存储器804可以包括易失性存储器(volatile memory),如随机存取存储器(random-access memory,ram);存储器804也可以包括非易失性存储器(non-volatile memory),如快闪存储器(flash memory),固态硬盘(solid-state drive,ssd)等;存储器804还可以包括上述种类的存储器的组合。
121.所述处理器801可以是中央处理器(central processing unit,cpu)。所述处理器801还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,asic),可编程逻辑器件(programmable logic device,pld)等。该pld可以是现场可编程逻辑门阵列(field-programmable gate array,fpga),通用阵列逻辑(generic array logic,gal)等。所述处理器801也可以为上述结构的组合。
122.本发明实施例中,所述存储器804用于存储计算机程序,所述计算机程序包括程序指令,处理器801用于执行存储器804存储的程序指令,用来实现上述如图2和图4中相应方法的步骤。
123.在一个实施例中,所述处理器801被配置调用所述程序指令,用于执行:
124.响应于针对待识别图像的识别触发操作,对所述待识别图像所处的识别场景进行检测,其中,不同识别场景对应不同识别配置信息;
125.若所述待识别图像处于目标识别场景中,则获取与所述目标识别场景匹配的目标识别配置信息,所述目标识别配置信息用于指示在所述目标识别场景下对所述待识别图像进行图像识别的识别流程;
126.按照所述目标识别配置信息指示的识别流程,对所述待识别图像进行识别处理,得到所述待识别图像的图像识别结果。
127.在一个实施例中,所述目标识别配置信息包括至少一个识别状态的状态标识,以及不同状态标识对应的识别状态之间的切换关系,且一个识别状态对应一个识别处理逻辑;
128.所述目标识别配置信息指示的识别流程为:根据所述切换关系确定的各个识别状态对应的识别处理逻辑的执行顺序。
129.在一个实施例中,所述目标识别配置信息至少包括第一状态标识和第二状态标识,以及从所述第一状态标识指示的第一识别状态切换为所述第二状态标识指示的第二识别状态的第一切换关系;所述处理器801被配置调用所述程序指令,用于执行:
130.采用所述第一识别状态对应的识别处理逻辑对所述待识别图像进行识别处理,得到第一识别结果;
131.若所述第一识别结果指示所述待识别图像通过所述第一识别状态下的识别处理,则根据所述第一切换关系,从所述第一识别状态切换为第二识别状态,并采用所述第二识别状态对应的识别处理逻辑对所述待识别图像进行识别处理,得到第二识别结果;
132.根据所述第二识别结果确定所述待识别图像的图像识别结果。
133.在一个实施例中,所述目标识别配置信息还包括第三状态标识,以及从第一状态标识指示的第一识别状态切换为所述第三状态标识指示的第三识别状态的第二切换关系,所述处理器801被配置调用所述程序指令,用于执行:
134.若所述第一识别结果指示所述待识别图像未通过所述第一识别状态下的识别处理,则根据所述第二切换关系从所述第一识别状态切换为第三识别状态,并采用所述第三识别状态对应的识别处理逻辑对所述待识别图像进行识别处理,得到第三识别结果;
135.根据所述第三识别结果确定所述待识别图像的图像识别结果,其中,所述第三识别状态为所述第一识别状态,或者所述第一识别状态的前一个识别状态。
136.在一个实施例中,所述目标配置信息包括的每个状态标识是从状态机中预设的状态标识集中选取的;
137.所述状态标识集中的状态标识包括以下一个或多个:人脸检测状态的标识,眼部遮挡状态的标识,嘴部遮挡状态的标识,质量分检测状态的标识,活体检测状态的标识,注意力检测状态的标识。
138.在一个实施例中,所述处理器801被配置调用所述程序指令,用于执行:
139.响应于针对所述待识别图像的识别处理逻辑的增加操作,确定待增加的识别处理逻辑对应的识别状态,并判断所述状态标识集是否包括待增加的识别处理逻辑对应识别状态的状态标识;
140.若否,则将所述待增加的识别处理逻辑对应识别状态的状态标识添加到所述状态标识集中。
141.在一个实施例中,所述各个识别状态对应的识别处理逻辑是根据各个识别状态对应的状态配置信息确定的,所述状态配置信息包括:各个识别状态涉及的一个或多个识别操作,以及每个识别操作对应的操作参数;
142.所述各个识别状态对应的识别处理逻辑包括:按照所述状态配置信息指示的操作参数控制对应的识别操作的执行。
143.在一个实施例中,所述目标识别配置信息包括状态转移图,所述状态转移图包括多个状态节点,一个状态节点存储一个状态标识,不同状态节点之间的指向关系用于指示对应识别状态之间的切换关系。
144.在一个实施例中,所述目标识别配置信息包括多条状态描述语句,所述多条状态描述语句依次排列,每条状态描述语句用于描述不同状态标识对应的识别状态之间的切换关系。
145.本发明实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述如图2或图4所示的方法实施例。其中,所述的计算机可读存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)或随机存储记忆体(random access memory,ram)等。
146.以上所揭露的仅为本发明的局部实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或局部流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1