条形码区域检测方法、装置、设备及存储介质与流程

文档序号:37585518发布日期:2024-04-18 12:12阅读:11来源:国知局
条形码区域检测方法、装置、设备及存储介质与流程

所属的技术人员能够理解,本技术的各个方面可以实现为系统、方法或程序产品。因此,本技术的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。与上述方法实施例基于同一发明构思,本技术实施例中还提供了一种计算机设备。在一种实施例中,该计算机设备可以是服务器。在该实施例中,计算机设备400的结构如图4所示,可以至少包括存储器401、通讯模块403,以及至少一个处理器402。存储器401,用于存储处理器402执行的计算机程序。存储器401可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。存储器401可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,ram);存储器401也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,hdd)或固态硬盘(solid-state drive,ssd);或者存储器401是能够用于携带或存储具有指令或数据结构形式的期望的计算机程序并能够由计算机存取的任何其他介质,但不限于此。存储器401可以是上述存储器的组合。处理器402,可以包括一个或多个中央处理单元(central processing unit,cpu)或者为数字处理单元等等。处理器402,用于调用存储器401中存储的计算机程序时实现上述条形码区域检测方法。通讯模块403用于与终端设备和其他服务器进行通信。本技术实施例中不限定上述存储器401、通讯模块403和处理器402之间的具体连接介质。本技术实施例在图4中以存储器401和处理器402之间通过总线404连接,总线404在图4中以粗线描述,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线404可以分为地址总线、数据总线、控制总线等。为便于描述,图4中仅用一条粗线描述,但并不描述仅有一根总线或一种类型的总线。存储器401中存储有计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于实现本技术实施例的条形码区域检测方法。处理器402用于执行上述的条形码区域检测方法,如图1a所示。在另一种实施例中,计算机设备也可以是其他计算机设备。在该实施例中,计算机设备500的结构可以如图5所示,包括:通信组件510、存储器520、显示单元530、摄像头540、传感器550、音频电路560、蓝牙模块570、处理器580等部件。通信组件510用于与服务器进行通信。在一些实施例中,可以包括电路无线保真(wireless fidelity,wifi)模块,wifi模块属于短距离无线传输技术,电子设备通过wifi模块可以帮助对象收发信息。存储器520可用于存储软件程序及数据。处理器580通过运行存储在存储器520的软件程序或数据,从而执行终端设备210的各种功能以及数据处理。存储器520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器520存储有使得终端设备210能运行的操作系统。本技术中存储器520可以存储操作系统及各种应用程序,还可以存储执行本技术实施例条形码区域检测方法的计算机程序。显示单元530还可用于显示由对象输入的信息或提供给对象的信息以及终端设备210的各种菜单的图形用户界面(graphical user interface,gui)。具体地,显示单元530可以包括设置在终端设备210正面的显示屏532。其中,显示屏532可以采用液晶显示器、发光二极管等形式来配置。显示单元530可以用于显示本技术实施例中的条形码检测界面等。显示单元530还可用于接收输入的数字或字符信息,产生与终端设备210的对象设置以及功能控制有关的信号输入,具体地,显示单元530可以包括设置在终端设备210正面的触控屏531,可收集对象在其上或附近的触摸操作,例如点击按钮,拖动滚动框等。其中,触控屏531可以覆盖在显示屏532之上,也可以将触控屏531与显示屏532集成而实现终端设备210的输入和输出功能,集成后可以简称触摸显示屏。本技术中显示单元530可以显示应用程序以及对应的操作步骤。摄像头540可用于捕获静态图像,对象可以将摄像头540拍摄的图像通过应用发布。摄像头540可以是一个,也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,ccd)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,cmos)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给处理器580转换成数字图像信号。终端设备还可以包括至少一种传感器550,比如加速度传感器551、距离传感器552、指纹传感器553、温度传感器554。终端设备还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。音频电路560、扬声器561、传声器562可提供对象与终端设备210之间的音频接口。音频电路560可将接收到的音频数据转换后的电信号,传输到扬声器561,由扬声器561转换为声音信号输出。终端设备210还可配置音量按钮,用于调节声音信号的音量。另一方面,传声器562将收集的声音信号转换为电信号,由音频电路560接收后转换为音频数据,再将音频数据输出至通信组件510以发送给比如另一终端设备210,或者将音频数据输出至存储器520以便进一步处理。蓝牙模块570用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如,终端设备可以通过蓝牙模块570与同样具备蓝牙模块的可穿戴电子设备(例如智能手表)建立蓝牙连接,从而进行数据交互。处理器580是终端设备的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器520内的软件程序,以及调用存储在存储器520内的数据,执行终端设备的各种功能和处理数据。在一些实施例中,处理器580可包括一个或多个处理单元;处理器580还可以集成应用处理器和基带处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,基带处理器主要处理无线通信。可以理解的是,上述基带处理器也可以不集成到处理器580中。本技术中处理器580可以运行操作系统、应用程序、用户界面显示及触控响应,以及本技术实施例的条形码区域检测方法。另外,处理器580与显示单元530耦接。在一些可能的实施方式中,本技术提供的条形码区域检测方法的各个方面还可以实现为一种程序产品的形式,其包括计算机程序,当程序产品在计算机设备上运行时,计算机程序用于使计算机设备执行本说明书上述描述的根据本技术各种示例性实施方式的条形码区域检测方法中的步骤,例如,计算机设备可以执行如图1a中所示的步骤。程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体地例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。本技术的实施方式的程序产品可以采用便携式紧凑盘只读存储器(cd-rom)并包括计算机程序,并可以在电子设备上运行。然而,本技术的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被命令执行系统、装置或者器件使用或者与其结合使用。可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行系统、装置或者器件使用或者与其结合使用的程序。可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本技术操作的计算机程序,程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。计算机程序可以完全地在用户计算机设备上执行、部分地在用户计算机设备上执行、作为一个独立的软件包执行、部分在用户计算机设备上部分在远程计算机设备上执行、或者完全在远程计算机设备上执行。在涉及远程计算机设备的情形中,远程计算机设备可以通过任意种类的网络包括局域网(lan)或广域网(wan)连接到用户计算机设备,或者,可以连接到外部计算机设备(例如利用因特网服务提供商来通过因特网连接)。应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本技术的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。此外,尽管在附图中以特定顺序描述了本技术方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用计算机程序的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序命令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序命令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的命令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序命令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的命令产生包括命令装置的制造品,该命令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序命令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的命令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。


背景技术:

1、随着物流行业的飞速发展,行业内对包裹分拣工作的需求十分迫切。检测包裹上的条形码,是包裹分拣工作中的一个重要环节。但是,传统的人工分拣方式,因其耗时耗力的局限性,已无法满足现阶段对包裹分拣工作的需求。

2、近年来,随着计算机视觉技术的不断发展,越来越多的包裹分拣工作可以通过基于计算机视觉的条形码区域检测模型完成,但在应用该方法时容易产生以下问题:

3、首先,在工业场景等对图像分辨率要求较高的场景中,容易采集到高分辨率图像,若条形码区域检测模型直接对高分辨率图像进行检测,由于待检测图像的分辨率较高,模型需要耗费更多处理时间,实时性较差;若将高分辨率图像缩放到模型能够接受的尺寸,图中的条形码区域也进行了相同比例的缩放,导致条形码区域变小,进一步增加了模型的检测难度。

4、其次,受到包裹摆放位置、条形码粘贴位置等因素的影响,导致待检测图像中条形码区域的外围轮廓并非正视状态下的标准矩形,而是一个轮廓不规则的四边形。由于相关技术中的条形码区域检测模型,是基于标准矩形的训练集训练得到的,因此,该模型不能最大程度地拟合出轮廓不规则的条形码区域,检测准确率低。

5、因此,为了解决上述问题,提出了一种新的条形码区域检测方法。


技术实现思路

1、本技术实施例提供了一种条形码区域检测方法、装置、设备及存储介质,以解决如何检测高分辨图像中轮廓不规则条形码区域的问题。

2、第一方面,本技术实施例提供了一种条形码区域检测方法,包括:

3、切割待检测图像,获得多张待检测子图,分别对各待检测子图进行特征提取,得到各自的特征图集,每个特征图集包括:不同图像尺度的多张目标卷积特征图;

4、分别对各目标卷积特征图进行边框检测,获得各自的边框检测集;其中,每个边框检测集包括:一张目标卷积特征图中各单元图像特征各自的边框检测结果集,每个边框检测结果集包括多个边框检测结果,每个边框检测结果包括:轮廓规则的参考框与一个单元图像特征的锚框之间的边框偏移信息,轮廓不规则的边界框与参考框之间的顶点偏移信息,以及用于预测边界框所属类别的类别预估值;

5、分别对各边框检测集进行边框定位,获得所述各目标卷积特征图各自的原始边框定位集,并基于各原始边框定位集,获得所述各待检测子图各自的候选边框定位集;其中,每个候选边框定位集包括:一个像素区域的边框顶点信息与类别预估值;

6、对所述各待检测子图进行拼接与抑制处理,得到含有多个目标边框定位集的待检测图像,并基于获得的多个目标边框定位集,得到所述待检测图像的条形码检测结果。

7、可选的,所述切割待检测图像,获得多张待检测子图,包括:

8、按照自上而下、自左至右的顺序,水平移动切割框,每移动一次,对所述待检测图像执行一次图像切割操作,获得一张待检测子图;

9、以及,按照自上而下、自左至右的顺序,垂直移动所述切割框,每移动一次,对所述待检测图像执行一次图像切割操作,获得一张待检测子图。

10、可选的,所述分别对各待检测子图进行特征提取,得到各自的特征图集,包括:

11、分别对所述各待检测子图,执行以下操作:

12、对一张待检测子图进行特征,分别获得多张不同下采样率的下采样特征图,并分别对各下采样特征图进行图像卷积,得到各自的初始卷积特征图;

13、针对非图像尺度最小的各初始卷积特征图,分别执行以下操作:对一张初始卷积特征图与同一尺度的上采样特征图进行图像融合,得到相应的候选卷积特征图,并对获得的候选卷积特征图进行图像卷积,得到相应的目标卷积特征图;其中,所述上采样特征图是通过对下一级图像尺度的初始卷积特征图或候选卷积特征图进行上采样得到的;

14、针对图像尺度最小的初始卷积特征图进行图像卷积,得到相应的目标卷积特征图,并对所述目标卷积特征图进行二次卷积,得到相应的目标卷积特征图。

15、可选的,所述分别对各目标卷积特征图进行边框检测,获得各自的边框检测集,包括:

16、针对所述各目标卷积特征图,分别执行以下操作:对一张目标卷积特征图中的各单元图像特征进行边框类别检测,获得相应的类别预估值集;以及,对图中所述各单元图像特征进行边框轮廓检测,得到相应的偏移信息集。

17、可选的,所述分别对各边框检测集进行边框定位,获得所述各目标卷积特征图各自的原始边框定位集,包括:

18、每个边框检测集包括多个边框检测结果,针对每个边框检测结果,分别执行以下操作:

19、基于一个单元图像特征相关联的锚框标注信息与相应边框偏移信息,得到所述参考框的参考框中心点坐标与参考框尺寸;

20、基于所述参考框中心点坐标与所述参考框尺寸,得到所述参考框的参考框顶点信息,并基于所述参考框顶点信息与相应顶点偏移信息,得到所述参考框与所述边界框中相应顶点之间的偏移距离;

21、基于所述偏移距离与所述参考框顶点信息,得到所述边界框的边界框顶点信息,并将所述边界框顶点信息与所述一个单元图像特征关联的类别预估值,作为相应的原始定位结果。

22、可选的,对所述各待检测子图进行拼接与抑制处理,得到含有多个目标边框定位集的待检测图像,包括:

23、基于切割前后的图像偏移信息,对所述各待检测子图进行拼接,还原得到含有多个候选边框定位集的待检测图像;

24、对各候选边框定位集进行抑制处理,删除冗余的检测结果,得到含有多个目标边框定位集的待检测图像。

25、第二方面,本技术实施例还提供了一种条形码区域检测装置,包括:

26、图像切割单元,用于切割待检测图像,获得多张待检测子图,分别对各待检测子图进行特征提取,得到各自的特征图集,每个特征图集包括:不同图像尺度的多张目标卷积特征图;

27、边框检测单元,用于分别对各目标卷积特征图进行边框检测,获得各自的边框检测集;其中,每个边框检测集包括:一张目标卷积特征图中各单元图像特征各自的边框检测结果集,每个边框检测结果集包括多个边框检测结果,每个边框检测结果包括:轮廓规则的参考框与一个单元图像特征的锚框之间的边框偏移信息,轮廓不规则的边界框与参考框之间的顶点偏移信息,以及用于预测边界框所属类别的类别预估值;

28、边框定位单元,用于分别对各边框检测集进行边框定位,获得所述各目标卷积特征图各自的原始边框定位集,并基于各原始边框定位集,获得所述各待检测子图各自的候选边框定位集;其中,每个候选边框定位集包括:一个像素区域的边框顶点信息与类别预估值;

29、条形码检测单元,用于对所述各待检测子图进行拼接与抑制处理,得到含有多个目标边框定位集的待检测图像,并获得的多个目标边框定位集,得到所述待检测图像的条形码检测结果。

30、可选的,所述图像切割单元用于:

31、按照自上而下、自左至右的顺序,水平移动切割框,每移动一次,对所述待检测图像执行一次图像切割操作,获得一张待检测子图;

32、以及,按照自上而下、自左至右的顺序,垂直移动所述切割框,每移动一次,对所述待检测图像执行一次图像切割操作,获得一张待检测子图。

33、可选的,所述图像切割单元用于:

34、分别对所述各待检测子图,执行以下操作:

35、对一张待检测子图进行特征提取,分别获得多张不同下采样率的下采样特征图,并分别对各下采样特征图进行图像卷积,得到各自的初始卷积特征图;

36、针对非图像尺度最小的各初始卷积特征图,分别执行以下操作:对一张初始卷积特征图与同一尺度的上采样特征图进行图像融合,得到相应的候选卷积特征图,并对获得的候选卷积特征图进行图像卷积,得到相应的目标卷积特征图;其中,所述上采样特征图是通过对下一级图像尺度的初始卷积特征图或候选卷积特征图进行上采样得到的;

37、针对图像尺度最小的初始卷积特征图进行图像卷积,得到相应的目标卷积特征图,并对所述目标卷积特征图进行二次卷积,得到相应的目标卷积特征图。

38、可选的,所述边框检测单元用于:

39、针对所述各目标卷积特征图,分别执行以下操作:对一张目标卷积特征图中的各单元图像特征进行边框类别检测,获得相应的类别预估值集;以及,对图中所述各单元图像特征进行边框轮廓检测,得到相应的偏移信息集。

40、可选的,所述边框定位单元用于:

41、每个边框检测集包括多个边框检测结果,针对每个边框检测结果,分别执行以下操作:

42、基于一个单元图像特征相关联的锚框标注信息与相应边框偏移信息,得到所述参考框的参考框中心点坐标与参考框尺寸;

43、基于所述参考框中心点坐标与所述参考框尺寸,得到所述参考框的参考框顶点信息,并基于所述参考框顶点信息与相应顶点偏移信息,得到所述参考框与所述边界框中相应顶点之间的偏移距离;

44、基于所述偏移距离与所述参考框顶点信息,得到所述边界框的边界框顶点信息,并将所述边界框顶点信息与所述一个单元图像特征关联的类别预估值,作为相应的原始定位结果。

45、可选的,所述条形码检测单元用于

46、基于切割前后的图像偏移信息,对所述各待检测子图进行拼接,还原得到含有多个候选边框定位集的待检测图像;

47、对各候选边框定位集进行抑制处理,删除冗余的检测结果,得到含有多个目标边框定位集的待检测图像。

48、第三方面,本技术实施例还提供了一种计算机设备,包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行上述任意一种条形码区域检测方法的步骤。

49、第四方面,本技术实施例还提供了一种计算机可读存储介质,其包括程序代码,当程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行上述任意一种条形码区域检测方法的步骤。

50、第五方面,本技术实施例还提供了一种计算机程序产品,包括计算机指令,计算机指令被处理器执行上述任意一种条形码区域检测方法的步骤。

51、本技术有益效果如下:

52、本技术实施例提供了一种条形码区域检测方法、装置、设备及存储介质,该方法包括:切割待检测图像,获得多张待检测子图,分别对各待检测子图进行特征提取,得到各自的特征图集;分别对图像尺度不同的各目标卷积特征图进行边框检测,获得各自的边框检测集,每个边框检测集包括:一张目标卷积特征图中各单元图像特征各自的边框检测结果集,每个边框检测结果集包括多个边框检测结果,每个边框检测结果包括:轮廓规则的参考框与一个单元图像特征的锚框之间的边框偏移信息,轮廓不规则的边界框与参考框之间的顶点偏移信息,以及用于预测边界框所属类别的类别预估值;再基于各边框检测集,获得各待检测子图各自的候选边框定位集,对各待检测子图进行拼接与抑制处理,得到含有多个目标边框定位集的待检测图像,并获得的多个目标边框定位集,得到待检测图像的条形码检测结果。

53、通过改进检测网络的边框轮廓检测分支,新增两个框之间的顶点偏移信息,在检测得到参考框的顶点坐标的基础上,模拟回归边界框的顶点坐标,通过连接映射后的顶点坐标,获得条形码检测框。本技术实施例提供的条形码区域检测方法,适用于工业场景等高分辨率小目标场景下的条形码检测,检测准确率高,更符合实际应用场景下的用户需求。

54、本技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术而了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1