目标对象的检索方法、装置、计算机可读介质及电子设备与流程

文档序号:19223319发布日期:2019-11-26 02:19阅读:200来源:国知局
目标对象的检索方法、装置、计算机可读介质及电子设备与流程

本申请涉及计算机及通信技术领域,具体而言,涉及一种目标对象的检索方法、装置、计算机可读介质及电子设备。



背景技术:

在众多物品中找到需要的物品是非常费时费力的工作,比如在图书馆中寻找需要的图书时,由于图书放置太密集且图书量巨大导致难以快速且方便地找到需要的图书,因此如何能够缩短寻找物品的时长,提高物品检索的效率成为亟待解决的技术问题。



技术实现要素:

本申请的实施例提供了一种目标对象的检索方法、装置、计算机可读介质及电子设备,进而至少在一定程度上可以缩短目标对象的检索时长,提高目标对象的检索效率。

本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。

根据本申请实施例的一个方面,提供了一种目标对象的检索方法,包括:获取包含有待检索对象的图片,并获取用户输入的需要检索的目标对象的信息;对所述图片进行分割处理得到多个子图片,其中的各个子图片中包含有至少一个待检索对象;识别所述各个子图片中包含的待检索对象的信息;根据所述目标对象的信息和识别到的所述各个子图片中包含的待检索对象的信息,确定所述图片中是否包含有所述目标对象。

根据本申请实施例的一个方面,提供了一种目标对象的检索装置,包括:获取单元,用于获取包含有待检索对象的图片,并获取用户输入的需要检索的目标对象的信息;分割单元,用于对所述图片进行分割处理得到多个子图片,其中的各个子图片中包含有至少一个待检索对象;识别单元,用于识别所述各个子图片中包含的待检索对象的信息;处理单元,用于根据所述目标对象的信息和识别到的所述各个子图片中包含的待检索对象的信息,确定所述图片中是否包含有所述目标对象。

在本申请的一些实施例中,基于前述方案,所述处理单元配置为:若所述目标对象的信息与识别到的任一待检索对象的信息相匹配,则确定所述图片中包含有所述目标对象。

在本申请的一些实施例中,基于前述方案,所述处理单元还用于:若确定所述图片中包含有所述目标对象,则在所述图片中标记出所述目标对象的位置。

在本申请的一些实施例中,基于前述方案,所述分割单元包括:边缘检测单元,用于对所述图片进行边缘检测处理,以检测所述图片中包含的各个待检索对象之间的边缘线;执行单元,用于基于所述各个待检索对象之间的边缘线对所述图片进行分割处理得到所述多个子图片。

在本申请的一些实施例中,基于前述方案,所述边缘检测单元配置为:对所述图片进行灰度化处理得到灰度图像;计算所述灰度图像中的各个像素点的梯度值及梯度方向;根据所述各个像素点的梯度值确定处于所述边缘线上的像素点,并根据所述各个像素点的梯度方向确定所述边缘线的趋势;根据处于所述边缘线上的像素点和所述边缘线的趋势,确定所述图片中包含的各个待检索对象之间的边缘线。

在本申请的一些实施例中,基于前述方案,所述获取单元配置为:在获取包含有待检索对象的图片之后,将所述图片存储至数据库中,并获取所述图片的存储地址;所述分割单元配置为:基于所述图片的存储地址调取图片分割服务对所述图片进行分割处理得到所述多个子图片。

在本申请的一些实施例中,基于前述方案,所述分割单元配置为:在对所述图片进行分割处理得到所述多个子图片之后,将所述多个子图片存储至所述数据库中,并获取所述多个子图片的存储地址;所述识别单元配置为:基于所述多个子图片的存储地址调取信息识别服务识别所述各个子图片中包含的待检索对象的信息。

在本申请的一些实施例中,基于前述方案,所述识别单元配置为:通过光学字符识别技术识别所述各个子图片中包含的待检索对象的信息。

在本申请的一些实施例中,基于前述方案,所述获取单元配置为:获取用户输入的文本信息,所述文本信息中包含有所述目标对象的信息;或获取用户输入的语音检索指令,识别所述语音检索指令以获取到所述目标对象的信息。

在本申请的一些实施例中,基于前述方案,所述处理单元还用于:若确定所述图片中不包含所述目标对象,则返回检索失败的提示信息。

在本申请的一些实施例中,基于前述方案,所述待检索对象包括图书;所述分割单元配置为:基于每个子图片中包含一本图书的分割策略,将所述图片分割为所述多个子图片。

在本申请的一些实施例中,基于前述方案,所述目标对象的信息包括目标图书的标识信息;所述识别单元配置为:识别所述各个子图片中包含的图书的标识信息;所述处理单元配置为:若所述目标图书的标识信息与识别到的任一图书的标识信息相匹配,则确定所述图片中包含有所述目标图书。

根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的目标对象的检索方法。

根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的目标对象的检索方法。

在本申请的一些实施例所提供的技术方案中,通过对包含有待检索对象的图片进行分割处理得到多个子图片,识别各个子图片中包含的待检索对象的信息,以根据需要检索的目标对象的信息和识别到的各个子图片中包含的待检索对象的信息确定图片中是否包含有目标对象,使得能够通过对包含待检索对象的图片进行分割、识别处理来对目标对象进行检索,进而有利于缩短目标对象的检索时长,提高目标对象的检索效率。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图;

图2示出了根据本申请的一个实施例的目标对象的检索方法的流程图;

图3示出了根据本申请的一个实施例的对图片进行分割处理得到多个子图片的流程图;

图4示出了根据本申请的一个实施例的对图片进行边缘检测处理的流程图;

图5示出了根据本申请的一个实施例的图书检索系统的结构图;

图6示出了根据本申请的一个实施例的图书检索方法的流程图;

图7示出了根据本申请的一个实施例的目标对象的检索装置的框图;

图8示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。

此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。

附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。

人工智能(artificialintelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。

本申请实施例提供的方案涉及人工智能的计算机视觉等技术,具体通过如下实施例进行说明:

图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。

如图1所示,系统架构可以包括终端设备(如图1中所示智能手机101、平板电脑102和便携式计算机103中的一种或多种,当然也可以是台式计算机等等)、网络104和服务器105。网络104用以在终端设备和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线通信链路、无线通信链路等等。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。

在本申请的一个实施例中,终端设备可以采集到包含有待检索对象的图片,比如可以是包含有多本图书的图片,然后将用户输入的需要检索的目标对象的信息和采集到的该图片通过网络104上传至服务器105。服务器105在获取到该图片之后,可以对该图片进行分割处理得到多个子图片,其中的各个子图片中包含有至少一个待检索对象(比如一个子图片可以包含一个待检索对象)。然后,服务器105可以识别各个子图片中包含的待检索对象的信息,以根据目标对象的信息和识别到的各个子图片中包含的待检索对象的信息来确定该图片中是否包含有目标对象。比如,若目标对象的信息与识别到的任一待检索对象的信息相匹配,则确定图片中包含有目标对象。可见,本申请实施例的技术方案使得能够通过对包含待检索对象的图片进行分割、识别处理来对目标对象进行检索,有利于缩短目标对象的检索时长,提高了目标对象的检索效率。

需要说明的是,本申请实施例所提供的目标对象的检索方法一般由服务器105执行,相应地,目标对象的检索装置一般设置于服务器105中。但是,在本申请的其它实施例中,终端设备也可以与服务器具有相似的功能,从而执行本申请实施例所提供的目标对象的检索方案。

以下对本申请实施例的技术方案的实现细节进行详细阐述:

图2示出了根据本申请的一个实施例的目标对象的检索方法的流程图,该目标对象的检索方法可以由具有计算处理功能的设备来执行,比如可以由图1中所示的服务器105来执行。参照图2所示,该目标对象的检索方法至少包括步骤s210至步骤s240,详细介绍如下:

在步骤s210中,获取包含有待检索对象的图片,并获取用户输入的需要检索的目标对象的信息。

在本申请的一个实施例中,包含有待检索对象的图片可以是终端设备采集到的图片,比如用户通过终端设备拍摄包含有待检索对象的图片,然后上传至服务器进行检索处理。可选地,待检索对象可以是书架上的图书、商场中的商品等。

在本申请的一个实施例中,获取用户输入的需要检索的目标对象的信息可以是获取用户输入的文本信息,该文本信息中包含有目标对象的信息,比如包含有需要检索的目标图书的书名等。

在本申请的一个实施例中,还可以获取用户输入的语音检索指令,然后识别该语音检索指令以获取到目标对象的信息。

继续参照图2所示,在步骤s220中,对所述图片进行分割处理得到多个子图片,其中的各个子图片中包含有至少一个待检索对象。

在本申请的一个实施例中,在对图片进行分割处理时可以基于每个子图片中包含一个待检索对象的分割策略,将该图片分割为多个子图片。比如,如果待检索对象是图书,那么可以基于一个子图片中包含一本图书的分割策略对该图片进行分割处理。

在本申请的一个实施例中,如图3所示,对图片进行分割处理得到多个子图片的过程,可以包括如下步骤s310和步骤s320:

在步骤s310中,对图片进行边缘检测处理,以检测所述图片中包含的各个待检索对象之间的边缘线。

在本申请的实施例中,由于图片中包含的各个待检索对象之间存在间隙,因此可以通过对图片进行边缘检测,以检测图片中包含的各个待检索对象之间的边缘线,进而来实现对图片的分割处理。

在本申请的一个实施例中,如图4所示,对图片进行边缘检测处理,以检测图片中包含的各个待检索对象之间的边缘线的过程,可以包括如下步骤:

步骤s410,对图片进行灰度化处理得到灰度图像。

在本申请的一个实施例中,灰度化处理是把含有亮度和色彩的彩色图片处理为灰度图像的过程。可选地,在对图片进行灰度化处理时可以采用分量法、最大值法、平均值法、加权平均法等方式来进行灰度化处理。比如,如果采用分量法进行灰度化处理,那么可以将彩色图像中的三分量(如r分量、g分量、b分量)的亮度作为三个灰度图像的灰度值,然后根据需要选取一种灰度图像;如果采用最大值法进行灰度化处理,那么可以将彩色图像中的三分量亮度的最大值作为灰度图的灰度值;如果采用平均值法进行灰度化处理,那么可以将彩色图像中的三分量亮度求平均得到灰度图中的灰度值;如果采用加权平均法进行灰度化处理,那么可以将彩色图像中的三分量亮度以不同的权值进行加权平均作为灰度图的灰度值。

步骤s420,计算所述灰度图像中的各个像素点的梯度值及梯度方向。

在本申请的一个实施例中,灰度图像可以看成二元函数f(x,y),其中,f(x,y)表示灰度图像中的像素点位置(x,y)处的灰度值,这样灰度图像可以看作一个曲面,进而可以通过求导的方式来计算灰度图像中各个像素点的梯度值和梯度方向。

步骤s430,根据所述各个像素点的梯度值确定处于所述边缘线上的像素点,并根据所述各个像素点的梯度方向确定所述边缘线的趋势。

在本申请的一个实施例中,由于边缘是曲面上变化最剧烈的位置,该位置也是曲面的局部极值点的位置,因此可以通过像素点的梯度值来确定处于边缘线上的像素点。同时,由于像素点的梯度方向提供了边缘线的趋势信息,因此可以基于各个像素点的梯度方向来确定边缘线的趋势。

步骤s440,根据处于所述边缘线上的像素点和所述边缘线的趋势,确定所述图片中包含的各个待检索对象之间的边缘线。

在本申请的一个实施例中,当确定出处于边缘线上的像素点和边缘线的趋势之后,可以基于这些像素点和边缘线的趋势确定待检索对象之间的边缘线,比如可以根据边缘线的趋势将位于边缘线上的像素点连接起来以得到各个待检索对象之间的边缘线。

继续参照图3所示,在步骤s320中,基于所述各个待检索对象之间的边缘线对所述图片进行分割处理得到所述多个子图片。

在本申请的一个实施例中,当确定各个待检索对象之间的边缘线之后,可以按照确定的各条边缘线对图片进行分割处理,以得到多个子图片。

在本申请的一个实施例中,还可以通过图像识别技术来对图片进行分割处理,比如通过图像识别技术识别到图片中包含的各个待检索对象,然后基于识别到的各个待检索对象的轮廓来对图片进行分割处理。

继续参照图2所示,在步骤s230中,识别所述各个子图片中包含的待检索对象的信息。

在本申请的一个实施例中,可以通过光学字符识别(opticalcharacterrecognition,简称ocr)技术识别所述各个子图片中包含的待检索对象的信息。比如可以识别出待检索对象上的字符信息,如图书的书名、作者等信息。

继续参照图2所示,在步骤s240中,根据所述目标对象的信息和识别到的所述各个子图片中包含的待检索对象的信息,确定所述图片中是否包含有所述目标对象。

在本申请的一个实施例中,若目标对象的信息与识别到的任一待检索对象的信息相匹配,则可以确定该图片中包含有目标对象。比如,若待检索对象和目标对象是图书,那么如果目标图书的标识信息与识别到的任一图书的标识信息相匹配,则可以确定图片中包含有该目标图书。可选地,图书的标识信息可以是图书的书名、作者、出版信息等。

在本申请的一个实施例中,若确定图片中包含有目标对象,则在图片中标记出目标对象的位置,进而便于用户基于目标对象在图片中的位置来找到目标对象。

在本申请的一个实施例中,若确定图片中不包含目标对象,则可以返回检索失败的提示信息。

在本申请的一个实施例中,在步骤s210中获取包含有待检索对象的图片之后,可以将获取到的图片存储至数据库中,并获取该图片的存储地址。进而在对图片进行分割处理时,可以基于该图片的存储地址调取图片分割服务对该图片进行分割处理得到多个子图片。

在本申请的一个实施例中,在对图片进行分割处理得到多个子图片之后,可以将这多个子图片存储至数据库中,并获取该多个子图片的存储地址;进而识别各个子图片中包含的待检索对象的信息的过程可以是基于多个子图片的存储地址调取信息识别服务识别各个子图片中包含的待检索对象的信息。

前述实施例的技术方案使得能够通过对包含待检索对象的图片进行分割、识别处理来对目标对象进行检索,进而有利于缩短目标对象的检索时长,提高目标对象的检索效率。

以下结合图5至图6,以检索图书为例对本申请实施例的技术方案进行详细阐述:

如图5所示,根据本申请的一个实施例的图书检索系统,包括:手机终端502、图像分割服务器504和文字识别服务器506。

在本申请的一个实施例中,手机终端502可以借助小程序或者应用程序调用相机功能对图书进行拍照,然后将拍摄得到的照片和用户需要查找的书名通过http请求发送至图像分割服务器504。图像分割服务器504在接收到手机终端502发送的照片和书名之后,可以对图片中的书籍进行分割,输出一系列子图,每一张子图包含有一本图书,然后将分割得到的一系列子图发送给文字识别服务器506。文字识别服务器506在接收到图像分割服务器504发送的分割后的子图之后,可以调用ocr接口循环识别图书名称,如果识别结果与查找目标相同,则停止循环,并将识别到的结果返回到图像分割服务器504,否则继续循环。

在本申请的一个实施例中,在通过ocr技术识别图书名称时,可以识别书脊上印刷的书名,然后将识别到的内容转换为可编辑文本的形式。若在图片中识别到需要查找的图书,则可以在照片中标出书的具体位置。可选地,可以通过调用第三方提供的ocr接口服务来进行文字识别,比如将拍摄得到的图片存储至云服务器中进行缓存,临时保存该图片,然后基于该图片的链接地址来调用ocr接口实现图书名称的识别,并且在识别完成之后可以将缓存的图片清除。

在本申请的一个实施例中,在对图片进行分割时,可以基于边缘检测技术来实现分割。由于不同图像的灰度不同,边界处一般会有明显的边缘,因此利用此特征来分割图像。通常认为边缘是不同区域的分界线,是周围(局部)像素有显著变化的像素的集合,并且有幅值与方向两个属性,简而言之,边缘是局部特征以及周围像素显著变化产生的边缘。常用边缘检测方法有:一阶微分边缘算子、roberts边缘检测算子、sobel边缘检测算子等。以下以一阶微分边缘算子为例说明具体的边缘检测方案:

一阶微分边缘算子也称为梯度边缘算子,它是利用图像在边缘处的阶跃性,即图像梯度在边缘取得极大值的特性进行边缘检测。具体地,可以先对图像进行灰度化处理得到灰度图,灰度是指黑白图像中点的颜色深度,范围一般从0到255,白色为255,黑色为0。灰度图像可以看成二元函数f(x,y),(x,y)是像素点的位置,f(x,y)是该处的灰度值,这样图像就可以当作一个曲面,然后就可以用数学的方法来进行处理。由于边缘是曲面上变化最剧烈的位置,这个位置也是曲面的局部极值点的位置,因此可以通过求导数来确定曲面上的局部极值点位置。其中,求导数的过程即为计算图像的梯度,梯度的模值大小提供了边缘的强度信息,通过梯度的值可以确定局部极值点的位置,由于梯度的方向始终是垂直于边缘方向的,因此可以通过梯度的方向来确定边缘的趋势信息。

在本申请的一个实施例中,可以通过以下公式(1)来计算灰度图像的梯度场▽f(x,y),并通过公式(2)来计算梯度的模值|▽f(x,y)|,通过公式(3)来计算梯度的方向∠▽f(x,y):

在在本申请的一个实施例中,可以基于flask框架来实现本申请实施例的技术方案。flask是一个使用python编写的轻量级web应用框架,相比于其它web框架配置更加简单,对于满足类似于本发明业务较简单的应用比较合适。基于flask框架,主要有如下几个服务接口,centerserver(中心服务)接口是整个应用的入口,负责请求接受和路由转发;picturesaveserver(图像保存服务)接口负责将用户上传的图片保存到云服务器(如图片存储数据库picturestoredb),并将保存的唯一url返回;picturesplitserver(图像分割服务)接口负责将用户上的图片通过图像分割算法分割成若干子图;ocrserver(ocr识别服务)接口负责识别图书书名。此外cneterserver接口还用于判断当前书架书否存在要查找的数目。具体的执行流程可以如图6所示,包括以下步骤:

步骤s601,用户发起查找请求。其中,用户可以通过http请求向中心服务(centerserver)发起查找请求,该查找请求中包含有图片和需要查找的图书的信息。

步骤s602,中心服务接收到查找请求之后,向图片保存服务(picturesaveserver)发起请求,以保存接收到的图片。

步骤s603,图片保存服务将图片保存在图片存储数据库(picturestoredb)中。比如可以存储至图片根目录下的当前用户名命名的文件夹中。

步骤s604,图片存储数据库向图片保存服务返回图片的访问路径。

步骤s605,图片保存服务将图片的访问路径返回至中心服务。

步骤s606,中心服务封装图片保存服务返回的访问路径,向图片分割服务发起图片分割请求。

步骤s607,图片分割服务基于边缘检测分割图片。

步骤s608,图片分割服务将分割得到的图片保存到图片存储数据库(picturestoredb)中。

步骤s609,图片存储数据库向图片分割服务返回分割得到的图片的访问路径。

步骤s610,图片分割服务将分割得到的图片的访问路径返回至中心服务。

步骤s611,中心服务封装图片分割服务返回的访问路径,向文字识别服务发起文字识别请求。

步骤s612,文字识别服务向图片存储数据库发起获取分割得到的图片的请求。

步骤s613,图片存储数据库向文字识别服务返回分割得到的图片。

步骤s614,文字识别服务对分割得到的图片进行ocr识别,得到识别结果。

步骤s615,文字识别服务将识别结果返回给中心服务。

步骤s616,中心服务根据文字识别服务返回的识别结果判断图片中是否包含有需要查找的图书。

步骤s617,中心服务向用户返回识别结果。

需要说明的是,上述实施例中是以检索图书为例对本申请实施例的技术方案进行阐述,在本申请的其它实施例中,还可以将本申请实施例的技术方案应用到其它场景中,比如商场中物品的查找等。

以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的目标对象的检索方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的目标对象的检索方法的实施例。

图7示出了根据本申请的一个实施例的目标对象的检索装置的框图。

参照图7所示,根据本申请的一个实施例的目标对象的检索装置700,包括:获取单元702、分割单元704、识别单元706和处理单元708。

其中,获取单元702用于获取包含有待检索对象的图片,并获取用户输入的需要检索的目标对象的信息;分割单元704用于对所述图片进行分割处理得到多个子图片,其中的各个子图片中包含有至少一个待检索对象;识别单元706用于识别所述各个子图片中包含的待检索对象的信息;处理单元708用于根据所述目标对象的信息和识别到的所述各个子图片中包含的待检索对象的信息,确定所述图片中是否包含有所述目标对象。

在本申请的一些实施例中,基于前述方案,处理单元708配置为:若所述目标对象的信息与识别到的任一待检索对象的信息相匹配,则确定所述图片中包含有所述目标对象。

在本申请的一些实施例中,基于前述方案,处理单元708还用于:若确定所述图片中包含有所述目标对象,则在所述图片中标记出所述目标对象的位置。

在本申请的一些实施例中,基于前述方案,分割单元704包括:边缘检测单元,用于对所述图片进行边缘检测处理,以检测所述图片中包含的各个待检索对象之间的边缘线;执行单元,用于基于所述各个待检索对象之间的边缘线对所述图片进行分割处理得到所述多个子图片。

在本申请的一些实施例中,基于前述方案,所述边缘检测单元配置为:对所述图片进行灰度化处理得到灰度图像;计算所述灰度图像中的各个像素点的梯度值及梯度方向;根据所述各个像素点的梯度值确定处于所述边缘线上的像素点,并根据所述各个像素点的梯度方向确定所述边缘线的趋势;根据处于所述边缘线上的像素点和所述边缘线的趋势,确定所述图片中包含的各个待检索对象之间的边缘线。

在本申请的一些实施例中,基于前述方案,获取单元702配置为:在获取包含有待检索对象的图片之后,将所述图片存储至数据库中,并获取所述图片的存储地址;所述分割单元配置为:基于所述图片的存储地址调取图片分割服务对所述图片进行分割处理得到所述多个子图片。

在本申请的一些实施例中,基于前述方案,分割单元704配置为:在对所述图片进行分割处理得到所述多个子图片之后,将所述多个子图片存储至所述数据库中,并获取所述多个子图片的存储地址;所述识别单元配置为:基于所述多个子图片的存储地址调取信息识别服务识别所述各个子图片中包含的待检索对象的信息。

在本申请的一些实施例中,基于前述方案,识别单元706配置为:通过光学字符识别技术识别所述各个子图片中包含的待检索对象的信息。

在本申请的一些实施例中,基于前述方案,获取单元702配置为:获取用户输入的文本信息,所述文本信息中包含有所述目标对象的信息;或获取用户输入的语音检索指令,识别所述语音检索指令以获取到所述目标对象的信息。

在本申请的一些实施例中,基于前述方案,处理单元708还用于:若确定所述图片中不包含所述目标对象,则返回检索失败的提示信息。

在本申请的一些实施例中,基于前述方案,所述待检索对象包括图书;所述分割单元704配置为:基于每个子图片中包含一本图书的分割策略,将所述图片分割为所述多个子图片。

在本申请的一些实施例中,基于前述方案,所述目标对象的信息包括目标图书的标识信息;识别单元706配置为:识别所述各个子图片中包含的图书的标识信息;处理单元708配置为:若所述目标图书的标识信息与识别到的任一图书的标识信息相匹配,则确定所述图片中包含有所述目标图书。

图8示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

需要说明的是,图8示出的电子设备的计算机系统800仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图8所示,计算机系统800包括中央处理单元(centralprocessingunit,cpu)801,其可以根据存储在只读存储器(read-onlymemory,rom)802中的程序或者从存储部分808加载到随机访问存储器(randomaccessmemory,ram)803中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在ram803中,还存储有系统操作所需的各种程序和数据。cpu801、rom802以及ram803通过总线804彼此相连。输入/输出(input/output,i/o)接口805也连接至总线804。

以下部件连接至i/o接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(cathoderaytube,crt)、液晶显示器(liquidcrystaldisplay,lcd)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如lan(localareanetwork,局域网)卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至i/o接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。

特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(cpu)801执行时,执行本申请的系统中限定的各种功能。

需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(erasableprogrammablereadonlymemory,eprom)、闪存、光纤、便携式紧凑磁盘只读存储器(compactdiscread-onlymemory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。

应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1