1.本技术涉及软件技术领域,尤其涉及一种医疗发票处理方法、装置、设备及存储介质。
背景技术:2.识别医疗发票是保险智能理赔中的关键环节,目前,通常是利用基于深度学习的ocr识别模型对医疗发票进行文本识别,以节省医疗发票的人力识别资源。
3.现有技术中通常采用常规的标注方法标注训练数据,进而训练得到基于深度学习的ocr识别模型,然而,医疗发票往往存在文本交叠、印章遮盖、轻微褶皱等问题,采用常规的标注方法标注训练数据后训练得到的ocr识别模型对这类医疗发票的识别准确度低。
技术实现要素:4.本技术的主要目的在于提供一种医疗发票处理方法、装置、设备及存储介质,旨在解决现有医疗发票识别准确度低的技术问题。
5.为实现上述目的,本技术提供一种医疗发票处理方法,所述医疗发票处理方法包括:
6.获取待处理医疗发票,确定所述待处理医疗发票的单色文本图片;
7.将所述单色文本图片输入至预设识别模型中,基于所述预设识别模型对所述单色文本图片进行识别处理,得到识别结果;
8.其中,所述预设识别模型是基于针对目标场景的预设训练数据,对预设基础识别模型进行迭代训练得到的,所述目标场景包括文字交叠场景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景中的至少一项。
9.可选地,所述将所述单色文本图片输入至预设识别模型中,基于所述预设识别模型对所述单色文本图片进行识别处理,得到识别结果的步骤之前,所述方法包括:
10.生成针对目标场景的预设训练数据,其中,所述目标场景包括文字交叠场景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景中的至少一项;
11.基于所述针对目标场景的预设训练数据,对预设基础识别模型进行迭代训练,得到满足预设训练条件的预设识别模型。
12.可选地,所述预设训练数据包括仿真训练数据,所述生成针对目标场景的预设训练数据的步骤,包括:
13.随机确定单色的第一文本内容;
14.随机确定与所述第一文本内容颜色一致的第二文本内容,将所述第二文本内容与所述第一文本内容随机交叠,得到初始训练图片;
15.对所述初始训练图片进行各场景变换处理,得到针对目标场景的仿真训练数据。
16.可选地,所述对所述初始训练图片进行各场景变换处理,得到针对目标场景的仿真训练数据的步骤,包括:
17.对所述初始训练图片进行旋转变换处理,得到针对旋转场景的第一仿真训练数据;
18.和/或者对所述初始训练图片进行模糊变换处理,得到针对模糊场景的第二仿真训练数据;
19.和/或者对所述初始训练图片进行褶皱变换处理,得到针对褶皱场景的第三仿真训练数据;
20.和/或者对所述初始训练图片进行印章遮盖变换处理,得到针对印章遮盖场景的第四仿真训练数据;
21.和/或者对所述初始训练图片进行文字交叠场景变换处理,得到针对文字交叠场景的第五仿真训练数据。
22.可选地,所述获取待处理医疗发票,确定所述待处理医疗发票的单色文本图片的步骤,包括:
23.获取待处理医疗发票,将所述待处理医疗发票输入至预设图层分离模型中;
24.基于所述预设图层分离模型对所述待处理医疗发票进行图层分离处理,得到单色文本图片;
25.其中,所述预设图层分离模型是基于具有预设单色打底标签的预设图层训练数据,对预设基础检测模型进行迭代训练得到的。
26.可选地,所述预设图层分离模型包括红色背景识别模型或者黑底文本识别模型。
27.可选地,所述将所述单色文本图片输入至预设识别模型中,基于所述预设识别模型对所述单色文本图片进行识别处理,得到识别结果的步骤之前,所述方法包括:
28.确定所述单色文本图片的目标颜色;
29.基于所述目标颜色,从预设识别模型池中选择对应目标识别模型作为所述预设识别模型。
30.本技术还提供一种医疗发票处理装置,所述医疗发票处理装置包括:
31.获取模块,用于获取待处理医疗发票,确定所述待处理医疗发票的单色文本图片;
32.识别模块,用于将所述单色文本图片输入至预设识别模型中,基于所述预设识别模型对所述单色文本图片进行识别处理,得到识别结果;
33.其中,所述预设识别模型是基于针对目标场景的预设训练数据,对预设基础识别模型进行迭代训练得到的,所述目标场景包括文字交叠场景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景中的至少一项。
34.可选地,所述医疗发票处理装置还包括:
35.生成模块,用于生成针对目标场景的预设训练数据,其中,所述目标场景包括文字交叠场景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景中的至少一项;
36.训练模块,用于基于所述针对目标场景的预设训练数据,对预设基础识别模型进行迭代训练,得到满足预设训练条件的预设识别模型。
37.可选地,所述生成模块包括:
38.第一确定单元,用于随机确定单色的第一文本内容;
39.第二确定单元,用于随机确定与所述第一文本内容颜色一致的第二文本内容,将所述第二文本内容与所述第一文本内容随机交叠,得到初始训练图片;
40.场景变换单元,用于对所述初始训练图片进行各场景变换处理,得到针对目标场景的仿真训练数据。
41.可选地,所述场景变换单元包括:
42.第一获取单元,用于对所述初始训练图片进行旋转变换处理,得到针对旋转场景的第一仿真训练数据;
43.第二获取单元,用于和/或者对所述初始训练图片进行模糊变换处理,得到针对模糊场景的第二仿真训练数据;
44.第三获取单元,用于和/或者对所述初始训练图片进行褶皱变换处理,得到针对褶皱场景的第三仿真训练数据;
45.第四获取单元,用于和/或者对所述初始训练图片进行印章遮盖变换处理,得到针对印章遮盖场景的第四仿真训练数据;
46.第五获取单元,用于和/或者对所述初始训练图片进行文字交叠场景变换处理,得到针对文字交叠场景的第五仿真训练数据。
47.可选地,所述获取模块包括:
48.第六获取单元,用于获取待处理医疗发票,将所述待处理医疗发票输入至预设图层分离模型中;
49.图层分离单元,用于基于所述预设图层分离模型对所述待处理医疗发票进行图层分离处理,得到单色文本图片;
50.其中,所述预设图层分离模型是基于具有预设单色打底标签的预设图层训练数据,对预设基础检测模型进行迭代训练得到的。
51.可选地,所述预设图层分离模型包括红色背景识别模型或者黑底文本识别模型。
52.可选地,所述医疗发票处理装置还包括:
53.确定模块,用于确定所述单色文本图片的目标颜色;
54.选择模块,用于基于所述目标颜色,从预设识别模型池中选择对应目标识别模型作为所述预设识别模型。
55.本技术还提供一种医疗发票处理设备,所述医疗发票处理设备为实体节点设备,所述医疗发票处理设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述医疗发票处理方法的程序,所述医疗发票处理方法的程序被处理器执行时可实现如上述所述医疗发票处理方法的步骤。
56.本技术还提供一种存储介质,所述存储介质上存储有实现上述医疗发票处理方法的程序,所述医疗发票处理方法的程序被处理器执行时实现如上述所述医疗发票处理方法的步骤。
57.本技术还提供一种计算机程序产品、包括计算机程序,该计算机程序被处理器执行时实现上述所述医疗发票处理方法的步骤。
58.本技术提供一种医疗发票处理方法、装置、设备及存储介质,与现有技术中医疗发票识别准确度低相比,在本技术中,获取待处理医疗发票,确定所述待处理医疗发票的单色文本图片;将所述单色文本图片输入至预设识别模型中,基于所述预设识别模型对所述单色文本图片进行识别处理,得到识别结果;其中,所述预设识别模型是基于针对目标场景的预设训练数据,对预设基础识别模型进行迭代训练得到的,所述目标场景包括文字交叠场
景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景中的至少一项。在本技术中,首先识别得到单色文本图片,进而准确选择预设识别模型,而由于预设识别模型是基于针对目标场景的预设训练数据训练得到的,目标场景包括文字交叠场景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景中的至少一项,可以理解,预设识别模型可以准确识别出现文字交叠、印章遮盖、旋转等情况下的单色文本图片,进而准确识别医疗发票中的发票信息,提升医疗发票识别准确度。
附图说明
59.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
60.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
61.图1为本技术医疗发票处理方法第一实施例的流程示意图;
62.图2为本技术医疗发票处理方法第二实施例的流程示意图;
63.图3为本技术实施例方案涉及的硬件运行环境的设备结构示意图。
64.本技术目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
65.应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
66.本技术实施例提供一种医疗发票处理方法,在本技术医疗发票处理方法的第一实施例中,参照图1,所述医疗发票处理方法包括:
67.步骤s10,获取待处理医疗发票,确定所述待处理医疗发票的单色文本图片;
68.步骤s20,将所述单色文本图片输入至预设识别模型中,基于所述预设识别模型对所述单色文本图片进行识别处理,得到识别结果;
69.其中,所述预设识别模型是基于针对目标场景的预设训练数据,对预设基础识别模型进行迭代训练得到的,所述目标场景包括文字交叠场景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景中的至少一项。
70.具体步骤如下:
71.步骤s10,获取待处理医疗发票,确定所述待处理医疗发票的单色文本图片;
72.在本实施例中,需要说明的是,医疗发票处理方法可以应用于医疗发票处理系统,该医疗发票处理系统从属于医疗发票处理设备。
73.在本实施例中,针对的应用场景可以是:由于医疗保险的不断发展,医疗保险理赔的情况也越来越多,为了节约资源,现有医疗保险理赔都是线上办理的,即线上智能化识别医疗发票越来越常见,现有线上医疗发票是利用基于深度学习的ocr识别模型进行识别的,现有基于深度学习的ocr识别模型通常采用常规的标注方法标注训练数据,如采用文本标注的方法标注训练数据,进而基于训练数据训练得到基于深度学习的ocr识别模型,然而,医疗发票往往存在文本交叠、印章遮盖、轻微褶皱等常见问题,采用常规的标注方法标注训练数据后训练得到的ocr识别模型对这类医疗发票的识别准确度低,致使保险智能理赔效
率低下。
74.在本实施例中,需要说明的是,由于打印问题,某些医疗发票会将黑色的机底字打印到红色背景底字上,造成文本交叠,进而难以准确识别医疗发票,或者识别效果差。
75.在本实施例中,需要说明的是,某些医疗发票会将印章盖在发票上一些关键文字上,由于印章遮挡,造成ocr识别错误或者丢失重要信息(如总金额,姓名等)。
76.在本实施例中,需要说明的是,由于发票材质为纸张,而且较大,患者容易将发票进行折叠,拍照时会有褶皱导致文字变形、错位等(轻微模糊、褶皱),从而造成ocr识别错误或者丢失重要信息。
77.在本实施例中,先对医疗发票进行检测,得到单色文本图片,然后将所述单色文本图片输入至预设识别模型中,基于所述预设识别模型对所述单色文本图片进行识别处理,得到识别结果,由于预设识别模型对文本交叠、印章遮盖、轻微褶皱等场景进行针对性训练,因而,能够准确识别对应场景下的医疗发票,因而,提升了保险智能理赔效率。
78.在本实施例中,首先获取待处理医疗发票,其中,待处理医疗发票的获取方式可以是:
79.方式一:通过医疗发票处理设备上的摄像头摄取待处理医疗发票;
80.方式二:直接从与医疗发票处理设备通信的医院里直接采集得到待处理医疗发票。
81.在本实施例中,待处理医疗发票可以是:待处理住院医疗发票,待处理门诊医疗发票,待处理手术医疗发票等类型。
82.在本实施例中,获取待处理医疗发票后,确定所述待处理医疗发票的单色文本图片;
83.其中,获取待处理医疗发票,确定所述待处理医疗发票的单色文本图片的方式可以是:
84.方式一:获取待处理医疗发票,将待处理医疗发票输入至图层识别模型中,得到待处理医疗发票的单色文本图片;
85.方式二:获取待处理医疗发票,通过图像检测和抠图处理,得到待处理医疗发票的单色文本图片。
86.在本实施例中,需要说明的是,单色文本图片可以指的是单色单行文本图片,具体地,可以指的是将医疗发票上底板和背景图层分离后得到的文本所构成的图片。
87.例如,单色文本图片是黑色底字图片,该黑色底字将与黑色底字叠加的红色背景当做无关信息;
88.或者单色文本图片是红色背景,该红色背景将与红色背景叠加的黑色底字当做无关信息。
89.在本实施例中,由于颜色具有区分度,因而,将交叠的文字和印章部分等分离,达到图层分离的效果。
90.步骤s20,将所述单色文本图片输入至预设识别模型中,基于所述预设识别模型对所述单色文本图片进行识别处理,得到识别结果;
91.其中,所述预设识别模型是基于针对目标场景的预设训练数据,对预设基础识别模型进行迭代训练得到的,所述目标场景包括文字交叠场景、印章遮盖场景、旋转场景、模
糊场景以及褶皱场景中的至少一项。
92.在本实施例中,在准确得到单色文本图片后,将所述单色文本图片输入至预设识别模型中,基于所述预设识别模型对所述单色文本图片进行识别处理,得到识别结果。
93.在本实施例中,所述预设识别模型是基于针对目标场景的预设训练数据,对预设基础识别模型进行迭代训练得到的,所述目标场景包括文字交叠场景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景中的至少一项,也可以包包括全部的文字交叠场景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景,在本实施例中,由于预设识别模型是已经训练完成的,因而,能够准确得到单色文本图片的识别结果,即准确识别医疗发票。
94.所述将所述单色文本图片输入至预设识别模型中,基于所述预设识别模型对所述单色文本图片进行识别处理,得到识别结果的步骤之前,所述方法包括:
95.步骤s01,确定所述单色文本图片的目标颜色;
96.步骤s02,基于所述目标颜色,从预设识别模型池中选择对应目标识别模型作为所述预设识别模型。
97.在本实施例中,需要说明的是,设置有预设识别模型池,该预设识别模型池中具有各个颜色的单色文本图片对应的识别模型,例如,具有识别出黑色底字的识别模型,具有识别出红色背景的识别模型。
98.在本实施例中,在得到单色文本图片后,确定所述单色文本图片的目标颜色,基于所述目标颜色,从预设识别模型池中选择对应目标识别模型作为所述预设识别模型,如基于黑色,从预设识别模型池中选择黑色底字的识别模型作为所述预设识别模型。
99.参照图2,所述将所述单色文本图片输入至预设识别模型中,基于所述预设识别模型对所述单色文本图片进行识别处理,得到识别结果的步骤之前,所述方法包括:
100.步骤s03,生成针对目标场景的预设训练数据,其中,所述目标场景包括文字交叠场景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景中的至少一项;
101.在本实施例中,针对目标场景的预设训练数据可能存在样本不足的问题,为解决训练数据样本不足的问题,在本实施例中,生成针对目标场景的预设训练数据。
102.其中,所述预设训练数据包括仿真训练数据,所述生成针对目标场景的预设训练数据的步骤,包括:
103.步骤a1,随机确定单色的第一文本内容;
104.在本实施例中,以单色文本图片为黑色文本图片进行具体说明。
105.在本实施例中,预存有ocr词表,随机确定黑色的第一文本内容的方式可以是:基于ocr词表生成随机长度的第一文本内容,在预设空白的图片贴上该第一文本内容,该第一文本内容的字体为黑色。
106.步骤a2,随机确定与所述第一文本内容颜色一致的第二文本内容,将所述第二文本内容与所述第一文本内容随机交叠,得到初始训练图片;
107.具体地,基于ocr词表,随机生成另一随机长度的第二文本内容,该第二文本内容与第一文本内容颜色一致,如都是黑色,该第二文本内容贴在第一文本内容上,第一文本内容与第二文本内容的位置和交叠的程度随机,交叠后得到初始训练图片。
108.步骤a3,对所述初始训练图片进行各场景变换处理,得到针对目标场景的仿真训练数据。
109.对所述初始训练图片进行各场景变换处理,得到针对目标场景的仿真训练数据。
110.具体地,在进行场景变换处理之前,可以对生成的图片进行高斯噪声,透视、亮度等处理,从而便于生成大规模的医疗发票仿真训练数据,解决数据样本不足的问题。
111.所述对所述初始训练图片进行各场景变换处理,得到针对目标场景的仿真训练数据的步骤,包括:
112.步骤b1,对所述初始训练图片进行旋转变换处理,得到针对旋转场景的第一仿真训练数据;
113.步骤b2,和/或者对所述初始训练图片进行模糊变换处理,得到针对模糊场景的第二仿真训练数据;
114.步骤b3,和/或者对所述初始训练图片进行褶皱变换处理,得到针对褶皱场景的第三仿真训练数据;
115.步骤b4,和/或者对所述初始训练图片进行印章遮盖变换处理,得到针对印章遮盖场景的第四仿真训练数据;
116.步骤b5,和/或者对所述初始训练图片进行文字交叠场景变换处理,得到针对文字交叠场景的第五仿真训练数据。
117.在本实施例中,对初始训练图片进行旋转、模糊、褶皱、印章遮盖、文字交叠等场景变换处理,从而生成大规模的医疗发票黑色机打字仿真训练数据,解决数据样本不足的问题。
118.在本实施例中,需要说明的是,预设识别模型若是针对旋转、模糊场景,则对所述初始训练图片进行旋转、模糊变换处理,预设识别模型若是针对模糊、褶皱场景,则对所述初始训练图片进行模糊、褶皱变换处理,也即,对应变换的仿真训练数据和预设识别模型所针对的场景相同。
119.在本实施例中,是以单色文本图片为黑色文本图片进行具体说明的,其中,红色背景图片对应仿真数据生成方法与黑色文本图片对应仿真数据的生成方法基本相同,具体可以为:基于预存的ocr词表,随机确定红色的第三文本内容,随机确定红色的第三文本内容的方式可以是:基于ocr词表生成随机长度的第三文本内容,在预设空白的图片贴上该第三文本内容,该第三文本内容的字体为红色。
120.具体地,基于ocr词表,随机生成另一随机长度的第四文本内容,该第四文本内容与第三文本内容颜色一致,如都是红色,该第四文本内容贴在第三文本内容上,第三文本内容与第四文本内容的位置和交叠的程度随机,交叠后得到初始训练图片。
121.对所述初始训练图片进行各场景变换处理,得到针对目标场景的仿真训练数据。
122.具体地,在进行场景变换处理之前,可以对生成的图片进行高斯噪声,透视、亮度等处理,从而便于生成大规模的医疗发票仿真训练数据,解决数据样本不足的问题。
123.在本实施例中,仿真训练数据可以是初始训练图片经过旋转、模糊、褶皱、印章遮盖、文字交叠等场景变换处理后(对所述初始训练图片进行旋转变换处理,得到针对旋转场景的第一仿真训练数据;和/或者对所述初始训练图片进行模糊变换处理,得到针对模糊场景的第二仿真训练数据;和/或者对所述初始训练图片进行褶皱变换处理,得到针对褶皱场景的第三仿真训练数据;和/或者对所述初始训练图片进行印章遮盖变换处理,得到针对印章遮盖场景的第四仿真训练数据;和/或者对所述初始训练图片进行文字交叠场景变换处
理,得到针对文字交叠场景的第五仿真训练数据)生成的。
124.步骤s04,基于所述针对目标场景的预设训练数据,对预设基础识别模型进行迭代训练,得到满足预设训练条件的预设识别模型。
125.在本实施例中,基于所述针对目标场景的预设训练数据,对预设基础识别模型进行迭代训练,得到满足预设训练条件的预设识别模型。
126.在本实施例中,预设训练条件可以是训练次数达到预设次数,或者是预设损失函数收敛。
127.在本实施例中,迭代训练过程可以是:将预设训练数据输入至预设基础识别模型中,基于预设基础识别模型对预设训练数据进行识别处理,得到始接结果,将识别结果和标签结果进行比对,得到比对结果,基于比对结果不断调整预设基础识别模型的模型参数,直至得到满足预设训练条件的预设识别模型。
128.在本实施例中,整体地,首先获取待处理医疗发票,然后通过图层分离模型进行文本检测,文本检测是指检测出发票上所有的单色文本图片,在文本检测后,进行文本识别,文本识别是指将所有单色文本图片上面的文字内容识别出来,得到对应的文本。
129.针对文本检测,本技术了图层分离的数据处理和训练方法,在图层分离的数据处理过程中,在标注数据时,将黑色底字(黑色机打字)和红色背景底字分开标注和训练,即对于同一批医疗发票数据,可以先只标注黑色机打字,将红色背景底字当做无关信息,使用pixellink或者psenet算法,训练文本检测模型得到黑色机打字(黑色底字)图层分离模型。在本实施例中,在图层分离的数据处理过程中,在标注数据时,可以只标注红色背景底字,将黑色机打字当做无关信息,使用pixellink或者psenet算法,训练文本检测模型得到红色背景(黑色底字)图层分离模型。
130.在本实施例中,确定图层分离模后,还分别训练两个识别模型后,以识别出黑色机打字和红色底字,再将结果合并得到最终的发票识别结果。
131.本技术提供一种医疗发票处理方法、装置、设备及存储介质,与现有技术中医疗发票识别准确度低相比,在本技术中,获取待处理医疗发票,确定所述待处理医疗发票的单色文本图片;将所述单色文本图片输入至预设识别模型中,基于所述预设识别模型对所述单色文本图片进行识别处理,得到识别结果;其中,所述预设识别模型是基于针对目标场景的预设训练数据,对预设基础识别模型进行迭代训练得到的,所述目标场景包括文字交叠场景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景中的至少一项。在本技术中,首先识别得到单色文本图片,进而准确选择预设识别模型,而由于预设识别模型是基于针对目标场景的预设训练数据训练得到的,目标场景包括文字交叠场景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景中的至少一项,可以理解,预设识别模型可以准确识别出现文字交叠、印章遮盖、旋转等情况下的单色文本图片,进而准确识别医疗发票中的发票信息,提升医疗发票识别准确度。
132.进一步地,基于本技术中第一实施例和第二实施例,提供本技术的另一实施例,在该实施例中,所述获取待处理医疗发票,确定所述待处理医疗发票的单色文本图片的步骤,包括:
133.步骤c1,获取待处理医疗发票,将所述待处理医疗发票输入至预设图层分离模型中;
134.在本实施例中,是得到单色文本图片的过程。
135.步骤c2,基于所述预设图层分离模型对所述待处理医疗发票进行图层分离处理,得到单色文本图片;
136.其中,所述预设图层分离模型是基于具有预设单色打底标签的预设图层训练数据,对预设基础检测模型进行迭代训练得到的。
137.在本实施例中,预设图层分离模型是基于具有预设单色打底标签的预设图层训练数据,对预设基础检测模型进行迭代训练得到的,因而,可以准确对待处理医疗发票进行图层分离处理,得到单色文本图片。
138.具体地,所述基于所述预设图层分离模型对所述待处理医疗发票进行图层分离处理,得到单色文本图片的步骤之前,包括:
139.获取具有预设单色打底标签的预设图层训练数据;
140.基于所述预设图层训练数据,对预设基础检测模型进行迭代训练得到所述预设图层分离模型。
141.所述预设图层分离模型包括红色背景识别模型或者黑底文本识别模型。
142.具体地,在本实施例中,若预设图层分离模型为黑底文本识别模型,则获取具有预设黑色打底标签(黑色文本标签)的预设图层训练数据;基于所述预设图层训练数据,对预设基础检测模型进行迭代训练得到所述黑底文本识别模型。若预设图层分离模型为红色背景识别模型,则获取具有预设红色打底标签(红色文本标签)的预设图层训练数据;基于所述预设图层训练数据,对预设基础检测模型进行迭代训练得到所述红色背景识别模型。
143.在本实施例中,通过获取待处理医疗发票,将所述待处理医疗发票输入至预设图层分离模型中;基于所述预设图层分离模型对所述待处理医疗发票进行图层分离处理,得到单色文本图片;其中,所述预设图层分离模型是基于具有预设单色打底标签的预设图层训练数据,对预设基础检测模型进行迭代训练得到的。本实施例中,准确得到预设图层分离模型,进而,为提升医疗发票处理的准确度奠定基础。
144.参照图3,图3是本技术实施例方案涉及的硬件运行环境的设备结构示意图。
145.如图3所示,该医疗发票处理设备可以包括:处理器1001,例如cpu,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non
‑
volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
146.可选地,该医疗发票处理设备还可以包括矩形用户接口、网络接口、摄像头、rf(radio frequency,射频)电路,传感器、音频电路、wifi模块等等。矩形用户接口可以包括显示屏(display)、输入子模块比如键盘(keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如wi
‑
fi接口)。
147.本领域技术人员可以理解,图3中示出的医疗发票处理设备结构并不构成对医疗发票处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
148.如图3所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块以及医疗发票处理程序。操作系统是管理和控制医疗发票处理设备硬件和软件资源的程序,支持医疗发票处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器
1005内部各组件之间的通信,以及与医疗发票处理系统中其它硬件和软件之间通信。
149.在图3所示的医疗发票处理设备中,处理器1001用于执行存储器1005中存储的医疗发票处理程序,实现上述任一项所述的医疗发票处理方法的步骤。
150.本技术医疗发票处理设备具体实施方式与上述医疗发票处理方法各实施例基本相同,在此不再赘述。
151.本技术还提供一种医疗发票处理装置,所述医疗发票处理装置包括:
152.获取模块,用于获取待处理医疗发票,确定所述待处理医疗发票的单色文本图片;
153.识别模块,用于将所述单色文本图片输入至预设识别模型中,基于所述预设识别模型对所述单色文本图片进行识别处理,得到识别结果;
154.其中,所述预设识别模型是基于针对目标场景的预设训练数据,对预设基础识别模型进行迭代训练得到的,所述目标场景包括文字交叠场景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景中的至少一项。
155.可选地,所述医疗发票处理装置还包括:
156.生成模块,用于生成针对目标场景的预设训练数据,其中,所述目标场景包括文字交叠场景、印章遮盖场景、旋转场景、模糊场景以及褶皱场景中的至少一项;
157.训练模块,用于基于所述针对目标场景的预设训练数据,对预设基础识别模型进行迭代训练,得到满足预设训练条件的预设识别模型。
158.可选地,所述生成模块包括:
159.第一确定单元,用于随机确定单色的第一文本内容;
160.第二确定单元,用于随机确定与所述第一文本内容颜色一致的第二文本内容,将所述第二文本内容与所述第一文本内容随机交叠,得到初始训练图片;
161.场景变换单元,用于对所述初始训练图片进行各场景变换处理,得到针对目标场景的仿真训练数据。
162.可选地,所述场景变换单元包括:
163.第一获取单元,用于对所述初始训练图片进行旋转变换处理,得到针对旋转场景的第一仿真训练数据;
164.第二获取单元,用于和/或者对所述初始训练图片进行模糊变换处理,得到针对模糊场景的第二仿真训练数据;
165.第三获取单元,用于和/或者对所述初始训练图片进行褶皱变换处理,得到针对褶皱场景的第三仿真训练数据;
166.第四获取单元,用于和/或者对所述初始训练图片进行印章遮盖变换处理,得到针对印章遮盖场景的第四仿真训练数据;
167.第五获取单元,用于和/或者对所述初始训练图片进行文字交叠场景变换处理,得到针对文字交叠场景的第五仿真训练数据。
168.可选地,所述获取模块包括:
169.第六获取单元,用于获取待处理医疗发票,将所述待处理医疗发票输入至预设图层分离模型中;
170.图层分离单元,用于基于所述预设图层分离模型对所述待处理医疗发票进行图层分离处理,得到单色文本图片;
171.其中,所述预设图层分离模型是基于具有预设单色打底标签的预设图层训练数据,对预设基础检测模型进行迭代训练得到的。
172.可选地,所述预设图层分离模型包括红色背景识别模型或者黑底文本识别模型。
173.可选地,所述医疗发票处理装置还包括:
174.确定模块,用于确定所述单色文本图片的目标颜色;
175.选择模块,用于基于所述目标颜色,从预设识别模型池中选择对应目标识别模型作为所述预设识别模型。
176.本技术医疗发票处理装置的具体实施方式与上述所述医疗发票处理方法各实施例基本相同,在此不再赘述。
177.本技术实施例提供了一种存储介质,且所述存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述所述医疗发票处理方法的步骤。
178.本技术存储介质具体实施方式与上述所述医疗发票处理方法各实施例基本相同,在此不再赘述。
179.本技术还提供一种计算机程序产品、包括计算机程序,该计算机程序被处理器执行时实现上述所述医疗发票处理方法的步骤。
180.本技术计算机程序产品的具体实施方式与上述所述医疗发票处理方法各实施例基本相同,在此不再赘述。
181.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
182.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
183.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
184.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。