本发明涉及图像识别,具体的,本发明应用于药品信息识别领域,特别是涉及一种产品包装中目标数据识别方法、系统、设备及介质。
背景技术:
1、目前,药盒包装上药品剂量的识别是计算机视觉图像技术在工业场景中的一种应用。
2、在自助售药机的出货过程中,要求将药品剂量(如“3g”、“3g/袋”、“30mg/片”)从复杂的药盒背景中提取并识别出来,进而可以识别出出货药品的正确性;通常情况下,由于药品生产商对于剂量不同的同种药品都采用相同外观的包装,仅仅剂量数字有区别,因此药品剂量的识别难度是较大的。
3、为了提高识别精准度,现有方案中采用基于深度学习的识别方法,该方法主要利用ocr以及自然语言处理算法,自动提取图像特征以及文本特征来识别药品图像,无需复杂的预处理流程;但是,该方法需要依赖大量真实图片数据进行训练,而一般工业场景下,产品包装数据比较缺乏,训练难度较大,进而影响了识别准确率。
技术实现思路
1、本发明的目的在于,提供一种产品包装中目标数据识别方法、系统、设备及介质,进而解决现有技术中存在的上述所有问题或问题之一。
2、为解决上述技术问题,本发明的具体技术方案如下:
3、一方面,本发明提供一种产品包装中目标数据识别方法,包括以下步骤:
4、初步识别步骤:
5、获取药品包装图片;
6、识别所述药品包装图片中的文字内容,得到文本行数据;
7、目标提取步骤:
8、基于目标数据匹配算法识别所述文本行数据中的目标文本行:
9、基于无效数据过滤算法对所述目标文本行进行文本过滤,得到目标信息:
10、结果输出步骤:
11、基于所述目标信息输出识别结果。
12、作为一种改进的方案,所述获取药品包装图片,包括:
13、拍摄药品包装的正面图片,或文字对应面作为所述药品包装图片。
14、作为一种改进的方案,所述识别所述药品包装图片中的文字内容,得到文本行数据,包括:
15、提取所述药品包装图片的若干文本行区域;
16、对若干所述文本行区域分别进行角度校正;
17、对校正后的若干所述文本行区域进行文字识别,得到若干文本行;
18、将若干所述文本行存储为所述文本行数据。
19、作为一种改进的方案,所述基于目标数据匹配算法识别所述文本行数据中的目标文本行,包括:
20、获取目标数据的组成部分;
21、设置关于所述组成部分的取值范围;
22、基于所述取值范围对所述文本行数据进行循环匹配;
23、将存在所述取值范围内的值的文本行数据作为待检查文本行;
24、识别所述待检查文本行中是否存在除所述取值范围内的值以外的所述组成部分,若存在,则设置所述待检查文本行为所述目标文本行。
25、作为一种改进的方案,所述基于无效数据过滤算法对所述目标文本行进行文本过滤,得到目标信息,包括:
26、根据目标数据的组成部分设置过滤项;
27、将所述目标文本行中与所述过滤项对应的数据剔除;
28、将移除所述过滤项的所述目标文本行作为所述目标信息。
29、作为一种改进的方案,所述基于所述目标信息输出识别结果,包括:
30、将所述目标信息进行组合,得到所述识别结果;
31、对所述识别结果进行输出。
32、另一方面,本发明还提供一种产品包装中目标数据识别系统,包括:
33、初步识别模块、目标提取模块和结果输出模块;
34、所述初步识别模块,用于获取药品包装图片;所述初步识别模块识别所述药品包装图片中的文字内容,得到文本行数据;
35、所述目标提取模块,用于基于目标数据匹配算法识别所述文本行数据中的目标文本行:所述目标提取模块基于无效数据过滤算法对所述目标文本行进行文本过滤,得到目标信息:
36、所述结果输出模块,用于基于所述目标信息输出识别结果。
37、作为一种改进的方案,所述目标提取模块,还用于获取目标数据的组成部分;所述目标提取模块设置关于所述组成部分的取值范围;所述目标提取模块基于所述取值范围对所述文本行数据进行循环匹配;所述目标提取模块将存在所述取值范围内的值的文本行数据作为待检查文本行;所述目标提取模块识别所述待检查文本行中是否存在除所述取值范围内的值以外的所述组成部分,若存在,则所述目标提取模块设置所述待检查文本行为所述目标文本行。
38、另一方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述产品包装中目标数据识别方法的步骤。
39、另一方面,本发明还提供一种计算机设备,所述计算机设备包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;其中:
40、所述存储器,用于存放计算机程序;
41、所述处理器,用于通过运行所述存储器上所存放的程序来执行所述产品包装中目标数据识别方法的步骤。
42、本发明技术方案的有益效果是:
43、本发明所述的产品包装中目标数据识别方法,可以实现基于ocr算法以及数据挖掘算法进行目标药品剂量的准确识别,算法根据药品剂量格式进行配置,不需要收集样本数据进行训练,识别速度快,操作便捷,适用性较强,弥补了现有技术的缺陷,具有较高的应用价值。
44、本发明所述的产品包装中目标数据识别系统,可以通过初步识别模块、目标提取模块和结果输出模块的相互配合,进而实现实现基于ocr算法以及数据挖掘算法进行目标药品剂量的准确识别,算法根据药品剂量格式进行配置,不需要收集样本数据进行训练,识别速度快,操作便捷,适用性较强,弥补了现有技术的缺陷,具有较高的应用价值。
45、本发明所述的计算机可读存储介质,可以实现引导初步识别模块、目标提取模块和结果输出模块进行配合,进而实现本发明所述的产品包装中目标数据识别方法,且本发明所述的计算机可读存储介质还有效提高所述产品包装中目标数据识别方法的可操作性。
46、本发明所述的计算机设备,可以实现存储并执行所述计算机可读存储介质,进而实现本发明所述的产品包装中目标数据识别方法。
1.一种产品包装中目标数据识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种产品包装中目标数据识别方法,其特征在于:
3.根据权利要求1所述的一种产品包装中目标数据识别方法,其特征在于:
4.根据权利要求1所述的一种产品包装中目标数据识别方法,其特征在于:
5.根据权利要求1所述的一种产品包装中目标数据识别方法,其特征在于:
6.根据权利要求1所述的一种产品包装中目标数据识别方法,其特征在于:
7.一种产品包装中目标数据识别系统,其特征在于,包括:初步识别模块、目标提取模块和结果输出模块;
8.根据权利要求1所述的一种产品包装中目标数据识别系统,其特征在于:
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1~6中任一项所述产品包装中目标数据识别方法的步骤。
10.一种计算机设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;其中: