1.本公开涉及图像识别技术领域,尤其涉及一种模型错例分析方法、装置、设备及介质。
背景技术:2.目前,图像识别模型处理过程中,模型调优是确保图像识别模型准确度的关键,而查找影响图像识别模型精准度的原因是模型调优的一个重要环节。
3.在相关技术中,在模型训练结果不佳时,不能直观的向非专业人员显示模型训练结果不佳原因,从而使非专业人员无法快速准确的获取影响图像识别模型精准度的原因。
技术实现要素:4.为了解决上述技术问题,本公开提供了一种模型错例分析方法、装置、设备及介质。
5.第一方面,本公开提供了一种模型错例分析方法,包括:
6.响应于接收到对预先训练好的图像识别模型的错例获取操作,从多个验证图像样本对应的验证数据中筛选出错例图像样本对应的验证数据,验证数据包括样本标注数据和样本预估数据,错例图像样本对应的样本标注数据和样本预估数据不同;
7.显示错例展示页面,错例展示页面包括错例图像样本、错例图像样本对应的验证数据和错例图像样本对应的预设错误原因标签;
8.响应于接收到对预先训练好的图像识别模型的错例分析操作,基于错例展示页面所包括的页面内容,生成预先训练好的图像识别模型的错例分析结果;
9.显示预先训练好的图像识别模型的错例分析页面,错例分析页面包括错例分析结果。
10.第二方面,本公开提供了一种模型错例分析装置,包括:
11.数据筛选模块,用于响应于接收到对预先训练好的图像识别模型的错例获取操作,在多个验证图像样本对应的验证数据中筛选出错例图像样本对应的验证数据,验证数据包括样本标注数据和样本预估数据,错例图像样本对应的样本标注数据和样本预估数据不同;
12.第一显示模块,用于显示错例展示页面,错例展示页面包括错例图像样本、错例图像样本对应的验证数据和错例图像样本对应的预设错误原因标签;
13.结果生成模块,用于响应于接收到对预先训练好的图像识别模型的错例分析操作,基于错例展示页面所包括的页面内容,生成预先训练好的图像识别模型的错例分析结果;
14.第二显示模块,用于显示预先训练好的图像识别模型的错例分析页面,错例分析页面包括错例分析结果。
15.第三方面,本公开提供了一种模型错例分析设备,包括:
16.处理器;
17.存储器,用于存储可执行指令;
18.其中,处理器用于从存储器中读取可执行指令,并执行可执行指令以实现第一方面的模型错例分析方法。
19.第四方面,本公开提供了一种计算机可读存储介质,该存储介质存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现第一方面的模型错例分析方法。
20.本公开实施例提供的技术方案与现有技术相比具有如下优点:
21.本公开实施例的模型错例分析方法、装置、设备及介质,可以响应于接收到对预先训练好的图像识别模型的错例获取操作,从而在多个验证图像样本对应的验证数据中筛选出错例图像样本对应的验证数据,即在多个验证图像样本对应的包括样本标注数据和样本预估数据的验证数据中,筛选出样本标注数据和样本预估数据不同的错例图像样本,接着显示包括错例图像样本、错例图像样本对应的验证数据和错例图像样本对应的预设错误原因标签的错例展示页面,进而响应于接收到对预先训练好的图像识别模型的错例分析操作,并基于错例展示页面所包括的页面内容,生成预先训练好的图像识别模型的错例分析结果,最后显示包括错例分析结果的预先训练好的图像识别模型的错例分析页面。因此,能够在多个验证图像样本对应的验证数据中筛选出错例图像样本并在错例展示页面中进行显示,并基于错例图像样本、错例图像样本对应的验证数据和错例图像样本对应的预设错误原因标签,生成预先训练好的图像识别模型的错例分析结果,并显示包括该错例分析结果的错例分析页面,从而直观的向用户显示错例分析结果,进而能使用户可以快速准确的获取影响该图像识别模型精准度的原因。
附图说明
22.结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
23.图1为本公开实施例提供的一种模型错例分析方法的流程示意图;
24.图2为本公开实施例提供的一种错例展示页面的界面示意图;
25.图3为本公开实施例提供的一种错例分析页面的界面示意图;
26.图4为本公开实施例提供的一种验证结果页面的界面示意图;
27.图5为本公开实施例提供的另一种错例展示页面的界面示意图;
28.图6为本公开实施例提供的一种错误原因操作页面的界面示意图;
29.图7为本公开实施例提供的一种模型错例分析装置的结构示意图;
30.图8为本公开实施例提供的一种模型错例分析设备的结构示意图。
具体实施方式
31.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
32.应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
33.本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
34.需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
35.需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
36.本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
37.相关技术中,以光学字符识别(optical character recognition,ocr)模型为例,用户可以根据自己的需求训练ocr模型,而在训练后的ocr模型精准度不高的情况下,需要进行模型调优。
38.但是,在对ocr模型进行调优时,即查找影响ocr模型精准度的原因时,通常需要有专业知识的科学家来查找,使得人力成本较高;或部分技术人员也可以在一定程度上进行查找,但查找效果并不理想,且费时费力。
39.为了解决上述问题,本公开实施例提供了一种模型错例分析方法、装置、设备及介质。下面结合图1至图6对本公开实施例提供的模型错例分析方法进行详细说明。
40.图1示出了本公开实施例提供的一种模型错例分析方法的流程示意图。
41.在本公开实施例中,该模型错例分析方法可以由电子设备执行。其中,电子设备可以包括但不限于诸如笔记本电脑、pda(个人数字助理)、pad(平板电脑)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。
42.如图1所示,该模型错例分析方法可以包括如下步骤。
43.s110、响应于接收到对预先训练好的图像识别模型的错例获取操作,从多个验证图像样本对应的验证数据中筛选出错例图像样本对应的验证数据,验证数据包括样本标注数据和样本预估数据,错例图像样本对应的样本标注数据和样本预估数据不同。
44.在本公开实施例中,用户可以通过电子设备获取预先训练好的图像识别模型,并对该预先训练好的图像识别模型进行错例获取操作,电子设备可以响应于用户的错例获取操作,从多个验证图像样本对应的验证数据中筛选出错例图像样本对应的验证数据。
45.可选地,预先训练好的图像识别模型可以为已进行图像识别训练后的模型。
46.可选地,错例获取操作可以为获取预先训练好的图像识别模型中错例图像样本对应的验证数据的操作。
47.可选地,验证图像样本可以为通过预先训练好的图像识别模型进行验证后的图像样本。
48.可选地,图像样本可以为不同类别的图像。例如,乘车发票图像样本、身份证图像样本等,此处不做限定。
49.可选地,验证图像样本对应的验证数据可以为验证图像样本通过预先训练好的图像识别模型进行验证后得到的数据。
50.可选地,错例图像样本可以为验证图像样本经过预先训练好的图像识别模型验证后错误的图像样本。
51.可选地,错例图像样本对应的验证数据可以为错例图像样本通过预先训练好的图像识别模型进行验证后得到的数据。
52.可选地,验证数据可以包括样本标注数据和样本预估数据。其中,错例图像样本对应的样本标注数据和样本预估数据不同。
53.可选地,样本标注数据可以为用户对验证图像样本标注的数据。
54.可选地,样本预估数据可以为预先训练好的图像识别模型对验证图像样本进行预估得到的数据。
55.具体地,当用户想对图像识别模型进行分析时,可以通过电子设备获取预先训练好的图像识别模型,然后对该预先训练好的图像识别模型进行错例获取操作,电子设备可以响应于该错例获取操作,从多个验证图像样本对应的验证数据中筛选出错例图像样本对应的验证数据,即获取多个验证图像样本对应的验证数据中样本标注数据和样本预估数据不同的验证数据对应的错例图像样本。
56.s120、显示错例展示页面,错例展示页面包括错例图像样本、错例图像样本对应的验证数据和错例图像样本对应的预设错误原因标签。
57.在本公开实施例中,电子设备在筛选出错例图像样本对应的验证数据之后,可以显示包括错例图像样本、错例图像样本对应的验证数据和错例图像样本对应的预设错误原因标签的错例展示页面。
58.可选地,错例展示页面可以为用于展示错例的页面。
59.可选地,预设错误原因标签可以为预先设定的用于标注错例的错误原因的标签。例如,预设错误原因标签可以为样本模糊标签、标注错误标签、文本识别错误等,此处不做限定。
60.具体地,预设错误原因标签可以由电子设备自动分析添加,也可以由用户进行分析添加,具体实施方式在下文进行说明。
61.图2示出了本公开实施例提供的一种错例展示页面的界面示意图。
62.如图2所示,电子设备可以显示错例展示页面201,以图像样本为乘车发票图像样本为例,在错例展示页面201中包括错例乘车发票图像样本对应的验证数据202、错例乘车发票图像样本204和样本模糊标签203。其中验证数据202可以包括标注值和预估值,即样本标注数据和样本预估数据。
63.继续参见图2,用户可以通过错例展示页面201中的“筛选字段”控件205,对乘车发票图像样本中包括的多个字段进行筛选操作,从而在错例展示页面201中显示筛选后的字段数据。
64.s130、响应于接收到对预先训练好的图像识别模型的错例分析操作,基于错例展示页面所包括的页面内容,生成预先训练好的图像识别模型的错例分析结果。
65.在本公开实施例中,电子设备在显示错例展示页面之后,可以接收并响应于用户对预先训练好的图像识别模型的错例分析操作,并基于错例展示页面所包括的页面内容,
生成预先训练好的图像识别模型的错例分析结果。
66.可选地,错例分析操作可以为用户获取预先训练好的图像识别模型的错例分析结果的操作。
67.可选地,错例分析结果可以为电子设备基于错例展示页面所包括的页面内容进行分析得到的结果。
68.可选地,错例展示页面所包括的页面内容可以包括错例图像样本、错例图像样本对应的验证数据和错例图像样本对应的预设错误原因标签。
69.具体地,电子设备在显示错例展示页面之后,当用户对预先训练好的图像识别模型进行错例分析操作时,电子设备可以响应于该错例分析操作,并基于错例展示页面中包括的页面内容,从而分析总结生成预先训练好的图像识别模型的错例分析结果。
70.s140、显示预先训练好的图像识别模型的错例分析页面,错例分析页面包括错例分析结果。
71.在本公开实施例中,电子设备在生成错例分析结果之后,可以在显示包括错例分析结果的预先训练好的图像识别模型的错例分析页面。
72.可选地,错例分析页面可以为用于显示错例分析结果的页面。
73.图3示出了本公开实施例提供的一种错例分析页面的界面示意图。
74.用户可以通过点击如图2所示的错例展示页面201中的“错例分析”控件206,使得电子设备跳转到如图3所示的显示错例分析页面。在该错例分析页面中,可以显示诊断结果、分析结论和优化方案,诊断结果可以包括错误原因、错误原因占比和统计等。
75.具体地,电子设备可以在显示错例分析页面,该错例分析页面可以包括预先训练好的图像识别模型的错例分析结果,错例分析结果可以包括诊断结果、分析结论和优化方案等等,此处不做限定。
76.由此,在本公开实施例中,可以响应于接收到对预先训练好的图像识别模型的错例获取操作,从而在多个验证图像样本对应的验证数据中筛选出错例图像样本对应的验证数据,即在多个验证图像样本对应的包括样本标注数据和样本预估数据的验证数据中,筛选出样本标注数据和样本预估数据不同的错例图像样本,接着显示包括错例图像样本、错例图像样本对应的验证数据和错例图像样本对应的预设错误原因标签的错例展示页面,进而响应于接收到对预先训练好的图像识别模型的错例分析操作,并基于错例展示页面所包括的页面内容,生成预先训练好的图像识别模型的错例分析结果,最后显示包括错例分析结果的预先训练好的图像识别模型的错例分析页面。因此,能够在多个验证图像样本对应的验证数据中筛选出错例图像样本并在错例展示页面中进行显示,并基于错例图像样本、错例图像样本对应的验证数据和错例图像样本对应的预设错误原因标签,生成预先训练好的图像识别模型的错例分析结果,并显示包括该错例分析结果的错例分析页面,从而直观的向用户显示错例分析结果,进而能使用户可以快速准确的获取影响该图像识别模型精准度的原因。
77.在本公开一些实施例中,电子设备在接收到对预先训练好的图像识别模型的错例获取操作之前,还可以获取验证图像样本对应的验证数据。
78.可选地,在s110之前,该模型错例分析方法还可以包括:
79.s1001、获取用户上传的多个图像样本和每个图像样本对应的样本标注数据,每个
图像样本对应的样本标注数据包括各个标注对象对应的标注数据。
80.在本公开实施例中,用户可以通过电子设备上传多个图像样本和每个图像样本对应的样本标注数据,电子设备可以接收该用户上传的多个图像样本和每个图像样本对应的样本标注数据。
81.可选地,样本标注数据可以为对图像样本进行标注后生成的数据。样本标注数据可以包括各个标注对象对应的标注数据。
82.可选地,标注对象可以为图像样本中进行标注的对象。
83.可选地,s1001可以具体包括:响应于接收到的图像上传操作,获取图像上传操作所上传的多个图像样本;响应于接收到的对每个图像样本的标注操作,获取标注操作所标注的图像样本对应的样本标注数据。
84.在本公开实施例中,用户可以通过电子设备进行上传多个图像样本的操作,电子设备可以响应于用户的多个图像样本的上传操作,获取到用户上传的多个图像样本。
85.例如,以乘车发票图像样本为例,用户可以打开电子设备,将多个乘车发票图像样本上传到电子设备,并可以点击对应的“上传”控件,实现图像上传操作。
86.进一步地,电子设备在获取到用户上传的多个图像样本之后,用户可以通过电子设备对上传的多个图像样本进行标注操作,电子设备可以响应于用户对每个图像样本的标注操作,获取该标注操作所标注的图像样本对应的样本标注数据。
87.具体地,用户可以对上传的每个图像样本进行标注操作,且对每个图像样本中包括的各个标注对象进行标注操作,电子设备可以响应于该标注操作,获取每个图像样本对应的样本标注数据。
88.例如,以乘车发票图像样本为例,每个乘车发票图像样本中可以包括多个标注对象,如“发票代码”字段、“乘车时间”字段等,用户可以分别对多个标注对象进行标注操作,电子设备可以获取到每个乘车发票图像样本中多个标注对象对应的样本标注数据,其中,样本标注数据可以包括标注框、字段名和标注值等,此处不做限定。
89.由此,在本公开实施例中,电子设备可以获取到用户对每个图像样本准确的样本标注数据,从而提高后续生成错例分析结果的准确性,进而能使用户可以快速准确的获取影响该图像识别模型精准度的原因。
90.s1002、将多个图像样本划分为训练图像样本和验证图像样本。
91.在本公开实施中,电子设备在获取用户上传的多个图像样本和每个图像样本对应的样本标注数据之后,可以将该多个图像样本划分为训练图像样本和验证图像样本。
92.可选地,训练图像样本可以为用于对待训练的图像识别模型进行模型训练的样本。
93.可选地,验证图像样本可以为用于对预先训练好的图像识别模型进行模型验证的样本。
94.具体地,电子设备可以将用户上传的多个图像样本划分为训练图像样本和验证图像样本。例如,用户上传100个图像样本,电子设备可以划分为70个训练图像样本和30个验证图像样本。电子设备还可以基于一定的比例对多个图像样本进行划分,1/2、2/3等,此处不做限定。
95.s1003、基于训练图像样本对待训练的图像识别模型进行模型训练,得到预先训练
好的图像识别模型。
96.在本公开实施例中,电子设备将多个图像样本划分为训练图像样本和验证图像样本之后,可以基于训练图像样本对待训练的图像识别模型进行模型训练,得到预先训练好的图像识别模型。
97.具体地,电子设备可以将训练图像样本输入到待训练的图像识别模型,使得待训练的图像识别模型基于该训练图像样本进行模型训练,从而获取到训练后的图像识别模型,即预先训练好的图像识别模型。
98.s1004、基于验证图像样本对预先训练好的图像识别模型进行验证,得到预先训练好的图像识别模型对应的验证结果,验证结果包括验证图像样本对应的验证数据。
99.在本公开实施例中,电子设备在得到预先训练好的图像识别模型之后,可以基于验证图像样本对该预先训练好的图像识别模型进行模型验证,从而得到预先训练好的图像识别模型对应的验证结果。
100.可选地,验证结果可以为预先训练好的图像识别模型进行模型验证后得到结果。验证结果可以包括验证图像样本对应的验证数据。
101.具体地,电子设备可以将验证图像样本输入到预先训练好的图像识别模型中,使得预先训练好的图像识别模型可以基于该验证图像样本进行模型验证,从而获得预先训练好的图像识别模型对应的模型验证结果。
102.由此,在本公开实施例中,电子设备得到预先训练好的图像识别模型与对应的验证结果,从而提高后续生成错例分析结果的准确性,进而能使用户可以快速准确的获取影响该图像识别模型精准度的原因。
103.在本公开另一些实施例中,电子设备还可以在获取验证结果之后,显示验证结果页面,下面进行详细说明。
104.在本公开实施例中,电子设备可以获取到预先训练好的图像识别模型对应的验证结果,该验证结果还可以包括图像识别模型对应的模型准确率和图像识别模型对应的各个检测对象对应的对象准确率。
105.其中,图像识别模型对应的模型准确率可以为多个检测对象对应的对象准确率的均值,即对多个检测对象对应的对象准确率进行求平均数,从而得到模型准确率。
106.可选地,在s1004之后,该模型错例分析方法还可以包括:显示验证结果页面,验证结果页面包括模型准确率、各个检测对象对应的对象准确率和错例获取控件;其中,错例获取操作为对错例获取控件的触发操作。
107.在本公开实施例中,电子设备在得到预先训练好的图像识别模型对应的验证结果之后,还可以显示验证结果页面。
108.可选地,验证结果页面可以为用于显示验证结果的页面。其中,验证结果页面可以包括模型准确率、各个检测对象对应的对象准确率和错例获取控件。
109.图4示出了本公开实施例提供的一种验证结果页面的界面示意图。
110.如图4所示,电子设备可以显示验证结果页面,在验证结果页面中可以显示模型信息和模型效果。其中,模型信息可以包括模型训练图像样本数量70、模型训练开始时间xx-xx-xx和模型训练结束时间xx-xx-xx等;模型效果可以包括模型准确率84.85%、验证图像样本30、正确数量20、错误数量10、“错例获取”控件和“错例分析”控件。
111.继续参照图4,验证结果页面还可以按照字段名显示各个字段的准确率,如:发票代码字段对应的字段准确率93.33%和乘车时间字段对应的字段准确率76.66%。
112.具体地,电子设备可以显示包括验证结果的验证结果页面,用户可以基于该验证结果页面,查看图像识别模型对应的模型准确率和各个检测对象对应的对象准确率,还可以对验证结果页面中的错例获取控件进行触发操作,从而使电子设备可以获取到用户的错例获取操作。
113.由此,在本公开实施例中,电子设备可以显示包括验证结果的验证结果页面,向用户直观的显示模型验证后的结果,从而使用户可以快速准确的获取影响该图像识别模型精准度的原因。
114.在本公开又一些实施例中,用户在上传多个图像样本和每个图像样本对应的样本标注数据之前,还需要选择对应的标注模板,下面进行详细说明。
115.可选地,在s1001之前,该模型错例分析方法还可以包括:响应于接收到模板生成操作,显示模板生成页面,模板生成页面包括多个待选择标注对象;响应于对多个待选择标注对象的对象选择操作,根据对象选择操作所选择的各个标注对象,生成标注模板;显示样本上传页面,样本上传页面包括标注模板。
116.在本公开实施例中,在用户上传多个图像样本和每个图像样本对应的样本标注数据之前,还需要选择多个图像样本对应的标注模板。
117.在一些实施例中,用户可以通过电子设备直接选择预设的标注模板,从而基于预设的标注模板对多个图像样本进行标注操作。
118.可选地,预设的标注模板可以为预先设定的用于对图像样本进行标注的模板。
119.在另一些实施例中,用户还可以通过电子设备进行生成特定的标注模板的操作,电子设备可以响应于该模板生成操作,显示对应的模板生成页面。
120.可选地,模板生成操作可以为用户生成标注模板的操作。
121.可选地,待选择标注对象可以为供用户选择的标注对象。
122.具体地,用户可以通过电子设备进行模板生成操作,电子设备可以响应该模板生成操作,显示对应的模板生成页面,该模板生成页面可以包括多个待选择标注对象,用户可以基于多个待选择标注对象进行对象选择操作。
123.进一步地,电子设备在显示包括多个待选择标注对象的模板生成页面之后,用户可以对多个待选择标注对象进行选择操作,电子设备可以响应于该对象选择操作,确定该对象选择操作选择的各个标注对象,并基于对象选择操作选择的各个标注对象生成标注模板。
124.可选地,对象选择操作可以为用户选择标注对象的操作。
125.在本公开一些实施例中,电子设备可以基于用户的对象选择操作,确定各个标注对象,从而生成对应的标注模板。
126.在本公开另一些实施例中,电子设备还可以接收用户对各个标注对象的删除操作、新建操作等,从而生成对应的标注模板。
127.进一步地,电子设备在生成标注模板之后,可以显示包括该标注模板的样本上传页面。
128.可选地,样本上传页面可以为用于使用户上传图像样本的界面。
129.具体地,电子设备在生成标注模板之后,可以显示包括该标注模板的样本上传页面,用户可以基于该样本上传页面中包括的标注模板,对上传的多个图像样本进行标注操作,从而电子设备可以获取用户上传的多个图像样本和每个图像样本对应的样本标注数据。
130.由此,在本公开实施例中,用户可以生成特定的标注模板,从而使获得的样本标注数据更准确,进而提高后续生成错例分析结果的准确性。
131.可选地,在s1003之前,该模型错例分析方法还可以包括:基于标注模型中的各个标注对象,生成待训练的图像识别模型。
132.在本公开实施例中,电子设备在基于训练图像样本对待训练的图像识别模型进行模型训练,得到预先训练好的图像识别模型之前,可以根据生成的标注模板中各个标注对象,生成待训练的图像识别模型。
133.具体地,电子设备可以获取到生成的标注模板中各个标注对象,并根据该各个标注对象生成对应的图像识别模型。
134.在本公开再一些实施例中,电子设备在得到验证结果之后,还需要进行解析操作,下面进行详细说明。
135.可选地,验证结果可以包括具有预设格式的验证数据文件。
136.可选地,验证数据文件可以包括验证图像样本对应的验证数据。
137.可选地,在s1004之后,该模型错例分析方法还可以包括:对验证数据文件进行文件解析,得到验证图像样本对应的验证数据。
138.在本公开实施例中,电子设备在获取到验证结果之后,可以对该验证结果中包括的具有预设格式的验证数据文件进行解析,从而得到验证图像样本对应的验证数据。
139.例如,具有预设格式的验证数据文件可以为纯文本格式的验证数据文件,电子设备可以对该验证数据文件进行解析,即将该验证数据文件中的每一个验证图像样本和验证图像样本对应的验证数据分别提取出来,并一一对应,保存在数据库中。
140.由此,在本公开实施例中,电子设备可以对验证结果中验证数据文件进行解析,从而得到验证图像样本对应的验证数据,进而可以直观的向用户显示验证数据。
141.在本公开再一些实施例中,电子设备在显示错例展示页面之前,还需要获取预设错误原因标签,下面进行详细说明。
142.可选地,在s120之前,该模型错例分析方法还包括:获取错例图像样本对应的预设错误原因标签,预设错误原因标签为基于错例图像样本对应的样本标注数据分析得到的错误原因标签。
143.在本公开实施例中,电子设备在显示错例展示页面之前,还需要获取错例图像样本对应的预设错误原因标签。
144.具体地,电子设备在多个验证图像样本对应的验证数据中筛选出错例图像样本对应的验证数据之后,可以获取错例图像样本对应的样本标注数据,并基于该样本标注数据分析得到的错误原因标签。
145.可选地,图像识别模型可以包括文本识别模型。其中,文本识别模型可以为用于识别文本的模型。
146.可选地,样本标注数据可以包括文本位置标注数据和文本内容标注数据。其中,文
本位置标注数据可以为对文本位置进行标注得到的数据;文本内容标注数据可以为对文本内容进行标注得到的数据。
147.可选地,样本预估数据可以包括文本位置预估数据和文本内容预估数据。其中,文本位置预估数据可以为对文本位置进行预估得到的数据;文本内容预估数据可以为对文本内容进行预估得到的数据。
148.可选地,获取错例图像样本对应的预设错误原因标签,可以具体包括:基于文本位置标注数据,在错例图像样本中提取标注图像内容,以及,基于文本位置预估数据,在错例图像样本中提取预估图像内容;基于样本标注数据、标注图像内容、样本预估数据和预估图像内容,分析错例图像样本对应的预设错误原因标签。
149.在本公开实施例中,电子设备在获取到样本标注数据和样本预估数据之后,可以基于文本位置标注数据,在错例图像样本中提取标注图像内容,以及,可以基于文本位置预估数据,在错例图像样本中提取预估图像内容。
150.具体地,电子设备可以获取用户对错例图像样本进行标注后标注的文本位置的数据,从错例图像样本中提取标注图像内容,以及基于图像识别模型进行预估后得到的文本位置预估数据,在错例图像样本中提取预估图像内容。
151.进一步地,电子设备在提取出标注图像内容和预估图像内容之后,可以基于获取的样本标注数据、标注图像内容、样本预估数据和预估图像内容,分析出错例图像样本对应的预设错误原因标签。
152.例如,以乘车发票图像样本为例,电子设备可以获取到“乘车时间”字段的样本标注数据、标注图像内容、样本预估数据和预估图像内容,如,电子设备获取到的文本位置标注数据和文本位置预估数据相同,但得到的标注图像内容和预估图像内容不相同,电子设备可以得到该乘车发票图像样本的预设错误原因标签为“样本模糊”;又如,电子设备获取到的文本位置标注数据和文本位置预估数据不相同,得到的标注图像内容和预估图像内容也不相同,电子设备可以得到该乘车发票图像样本的预设错误原因标签为“标注错误”。
153.由此,在本公开实施例中,电子设备可以自动的获取错例图像样本对应的预设错误原因标签,从而可以直观的向用户显示该预设错误原因标签。
154.在本公开再一些实施例中,电子设备在显示错例展示页面之后,还可以接收用户对错误原因标签的操作,下面进行详细说明。
155.在一些实施例中,在s120之后,该模型错例分析方法还可以包括:响应于接收到对错例图像样本的错误原因添加操作,确定错误原因添加操作添加的第一错误原因标签;在错例展示页面内显示第一错误原因标签。
156.在本公开实施例中,电子设备在显示错例展示页面之后,用户可以根据该错例展示页面,对错例图像样本进行错误原因添加操作,电子设备可以响应于该错误原因添加操作,确定该错误原因添加操作添加的第一错误原因标签,从而在错例展示页面中显示该第一错误原因标签。
157.图5示出了本公开实施例提供的另一种错例展示页面的界面示意图。
158.如图5所示,在错例展示页面501中,可以显示乘车发票错例图像样本,用户可以通过点击“添加错误原因”控件502来进行错误原因添加操作,电子设备可以响应该错误原因添加操作,确定添加的第一错误原因标签。
159.图6示出了本公开实施例提供的一种错误原因操作页面的界面示意图。
160.如图5所示,用户点击“添加错误原因控件”502之后,电子设备可以响应该点击操作,跳转至如图6所示的错误原因操作页面601,用户可以选择推荐错误原因标签和自定义错误原因标签。例如,用户可以选择推荐错误原因中的“样本模糊”标签,并点击“确定”控件,电子设备可以响应于该错误原因添加操作,确定添加的第一错误原因标签为“样本模糊”标签,从而在如图5所示的错例展示页面501中显示该“样本模糊”标签。
161.继续参见图6,用户还可以在自定义错误原因标签为“马赛克”标签,并点击“确定”控件,同理,电子设备可以响应于该错误原因添加操作,确定添加的第一错误原因标签为“马赛克”标签,从而在如图5所示的错例展示页面501中显示该“马赛克”标签。
162.在另一些实施例中,在s120之后,该模型错例分析方法还可以包括:响应于接收到对错例图像样本的错误原因删除操作,确定错误原因删除操作删除的第二错误原因标签;取消显示第二错误原因标签。
163.在本公开实施例中,电子设备在显示错例展示页面之后,用户可以根据该错例展示页面,对错例图像样本进行错误原因删除操作,电子设备可以响应于该错误原因删除操作,确定该错误原因删除操作删除的第二错误原因标签,从而在错例展示页面中取消显示该第一错误原因标签。
164.继续参见图6,用户可以在错误原因操作页面601中,点击已选择的“样本模糊”标签,从而使该“样本模糊”标签处于未选择状态,并点击“确定”控件,电子设备可以响应于该错误原因删除操作,确定删除的第二错误原因标签为“样本模糊”标签,从而在如图5所示的错例展示页面501中取消显示该“样本模糊”标签。
165.继续参见图6,用户还可以点击添加的“马赛克”标签的“删除”控件,并点击“确定”控件,同理,电子设备可以响应于该错误原因删除操作,确定删除的第二错误原因标签为“马赛克”标签,从而在如图5所示的错例展示页面501中取消显示该“马赛克”标签。
166.继续参见图5,用户还可以点击“配置错误原因”控件503,对推荐错误原因标签进行添加操作和删除操作,电子设备可以响应于该添加操作和删除操作,在图6中多个推荐错误原因标签中添加对应的错误原因标签和删除对应的错误原因标签。
167.进一步地,用户对当前错例图像样本进行错误原因添加操作和错误原因删除操作,还可以通过带点击“下一页”控件504,使电子设备显示下一个错例图像样本。
168.进一步地,用户还可以在“页面跳转”控件505中,输入对应的页数,使电子设备显示对应的错例图像样本。
169.由此,在本公开实施例中,电子设备可以获取用户对错例图像样本的错误原因添加或删除操作,从而直观的向用户显示错例分析结果,进而能使用户可以快速准确的获取影响该图像识别模型精准度的原因。
170.在本公开再一些实施例中,电子设备还可以显示错例图像样本的中间阶段的数据,下面进行详细说明。
171.可选地,验证数据还可以包括图像识别模型对应的各个识别中间阶段的标注数据和预估数据。例如,各个识别中间阶段可以包括模型原始结果阶段、模型自动后处理阶段和人工后处理阶段。
172.可选地,在s120之后,该模型错例分析方法还可以包括:响应于接收到对错例图像
样本的中间阶段排查操作,显示首个识别中间阶段的标注数据和预估数据;响应于接收到对识别中间阶段的切换操作,显示切换操作所选择的识别中间阶段的标注数据和预估数据。
173.在本公开实施例中,电子设备在显示错例展示页面之后,用户还可以对错例图像样本的中间阶段进行排查操作,电子设备可以响应该中间阶段排查操作,显示首个识别中间阶段的标注数据和预估数据。
174.继续参见图5,用户可以点击错例展示页面501中的“开始排查”控件,使得电子设备可以响应该中间阶段排查操作,显示首个识别中间阶段的标注数据和预估数据。
175.具体地,电子设备在接收并响应于用户的中间阶段进行排查操作之后,可以先显示首个识别中间阶段的标注数据和预估数据,例如,显示模型原始结果阶段对应的标注数据和预估数据。
176.进一步地,电子设备在显示首个识别中间阶段的标注数据和预估数据之后,用户可以对识别中间阶段进行切换操作,电子设备可以响应于该切换操作,显示切换操作所选择的识别中间阶段的标注数据和预估数据。
177.具体地,用户可以通过电子设备对识别中间阶段进行切换,例如,可以点击“下一阶段”控件。电子设备可以响应于该切换操作,显示该切换操作选择的识别中间阶段的标注数据和预估数据,例如,电子设备可以显示模型原始结果阶段对应的标注数据和预估数据之后,切换显示模型自动后处理阶段对应的标注数据和预估数据。
178.由此,在本公开实施例中,电子设备可以显示每个错例图像样本的识别中间阶段的标注数据和预估数据,从而更直观准确的向用户显示错例图像样本的训练过程,进而使得用户判断的错误原因更准确。
179.图7示出了本公开实施例提供的一种模型错例分析装置的结构示意图。
180.在本公开实施例中,该模型错例分析装置可以设置于电子设备内。其中,电子设备可以包括但不限于诸如笔记本电脑、pda、pad等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。
181.如图7所示,该模型错例分析装置700可以包括数据筛选模块710、第一显示模块720、结果生成模块730和第二显示模块740。
182.该数据筛选模块710可以用于响应于接收到对预先训练好的图像识别模型的错例获取操作,在多个验证图像样本对应的验证数据中筛选出错例图像样本对应的验证数据,验证数据包括样本标注数据和样本预估数据,错例图像样本对应的样本标注数据和样本预估数据不同。
183.该第一显示模块720可以用于显示错例展示页面,错例展示页面包括错例图像样本、错例图像样本对应的验证数据和错例图像样本对应的预设错误原因标签。
184.该结果生成模块730可以用于响应于接收到对预先训练好的图像识别模型的错例分析操作,基于错例展示页面所包括的页面内容,生成预先训练好的图像识别模型的错例分析结果。
185.该第二显示模块740可以用于显示预先训练好的图像识别模型的错例分析页面,错例分析页面包括错例分析结果。
186.由此,在本公开实施例中,可以响应于接收到对预先训练好的图像识别模型的错
例获取操作,从而在多个验证图像样本对应的验证数据中筛选出错例图像样本对应的验证数据,即在多个验证图像样本对应的包括样本标注数据和样本预估数据的验证数据中,筛选出样本标注数据和样本预估数据不同的错例图像样本,接着显示包括错例图像样本、错例图像样本对应的验证数据和错例图像样本对应的预设错误原因标签的错例展示页面,进而响应于接收到对预先训练好的图像识别模型的错例分析操作,并基于错例展示页面所包括的页面内容,生成预先训练好的图像识别模型的错例分析结果,最后显示包括错例分析结果的预先训练好的图像识别模型的错例分析页面。因此,能够在多个验证图像样本对应的验证数据中筛选出错例图像样本并在错例展示页面中进行显示,并基于错例图像样本、错例图像样本对应的验证数据和错例图像样本对应的预设错误原因标签,生成预先训练好的图像识别模型的错例分析结果,并显示包括该错例分析结果的错例分析页面,从而直观的向用户显示错例分析结果,进而能使用户可以快速准确的获取影响该图像识别模型精准度的原因。
187.在本公开一些实施例中,该模型错例分析装置700还可以包括数据获取模块、数据划分模块、模型训练模块和模型验证模块。
188.该数据获取模块可以用于获取用户上传的多个图像样本和每个图像样本对应的样本标注数据,每个图像样本对应的样本标注数据包括各个标注对象对应的标注数据。
189.该数据划分模块可以用于将多个图像样本划分为训练图像样本和验证图像样本。
190.该模型训练模块可以用于基于训练图像样本对待训练的图像识别模型进行模型训练,得到预先训练好的图像识别模型。
191.该模型验证模块可以用于基于验证图像样本对预先训练好的图像识别模型进行验证,得到预先训练好的图像识别模型对应的验证结果,验证结果包括验证图像样本对应的验证数据。
192.在本公开一些实施例中,该数据获取模块可以包括第一获取单元和第二获取单元。
193.该第一获取单元可以用于响应于接收到图像上传操作,获取图像上传操作所上传的多个图像样本。
194.该第二获取单元可以用于响应于接收到对每个图像样本的标注操作,获取标注操作所标注的图像样本对应的样本标注数据。
195.在本公开一些实施例中,验证结果还可以包括图像识别模型对应的模型准确率和图像识别模型对应的各个检测对象对应的对象准确率,模型准确率可以为多个对象准确率的均值。
196.在本公开一些实施例中,该模型错例分析装置700还可以包括第三显示模块。
197.该第三显示模块可以用于在基于验证图像样本对预先训练好的图像识别模型进行验证,得到预先训练好的图像识别模型对应的验证结果之后,显示验证结果页面,验证结果页面包括模型准确率、各个检测对象对应的对象准确率和错例获取控件。
198.在本公开一些实施例中,错例获取操作可以为对错例获取控件的触发操作。
199.在本公开一些实施例中,该模型错例分析装置700还可以包括第四显示模块、第一生成模块和第五显示模块。
200.该第四显示模块可以用于在获取用户上传的多个图像样本和每个图像样本对应
的样本标注数据之前,响应于接收到模板生成操作,显示模板生成页面,模板生成页面包括多个待选择标注对象。
201.该第一生成模块可以用于响应于对多个待选择标注对象的对象选择操作,根据对象选择操作所选择的各个标注对象,生成标注模板。
202.该第五显示模块可以用于显示样本上传页面,样本上传页面包括标注模板。
203.在本公开一些实施例中,该模型错例分析装置700还可以包括第二生成模块。
204.该第二生成模块可以用于在基于训练图像样本对待训练的图像识别模型进行模型训练,得到预先训练好的图像识别模型之前,基于标注模型中的各个标注对象,生成待训练的图像识别模型。
205.在本公开一些实施例中,验证结果可以包括具有预设格式的验证数据文件,验证数据文件可以包含验证图像样本对应的验证数据。
206.在本公开一些实施例中,该模型错例分析装置700还可以包括文件解析模块。
207.该文件解析模块可以用于在基于验证图像样本对预先训练好的图像识别模型进行验证,得到预先训练好的图像识别模型对应的验证结果之后,对验证数据文件进行文件解析,得到验证图像样本对应的验证数据。
208.在本公开一些实施例中,该模型错例分析装置700还可以包括标签获取模块。
209.该标签获取模块可以用于在显示错例展示页面之前,获取错例图像样本对应的预设错误原因标签,预设错误原因标签为基于错例图像样本对应的样本标注数据分析得到的错误原因标签。
210.在本公开一些实施例中,图像识别模型可以包括文本识别模型,样本标注数据可以包括文本位置标注数据和文本内容标注数据,样本预估数据可以包括文本位置预估数据和文本内容预估数据。
211.在本公开一些实施例中,标签获取模块可以包括内容提取单元和原因分析单元。
212.该内容提取单元可以用于基于文本位置标注数据,在错例图像样本中提取标注图像内容,以及,基于文本位置预估数据,在错例图像样本中提取预估图像内容。
213.该原因分析单元可以用于基于样本标注数据、标注图像内容、样本预估数据和预估图像内容,分析错例图像样本对应的预设错误原因标签。
214.在本公开一些实施例中,该模型错例分析装置700还可以包括第一确定模块和第六显示模块。
215.该第一确定模块可以用于在显示错例展示页面之后,响应于接收到对错例图像样本的错误原因添加操作,确定错误原因添加操作添加的第一错误原因标签。
216.该第六显示模块可以用于在错例展示页面内显示第一错误原因标签。
217.在本公开一些实施例中,该模型错例分析装置700还可以包括第二确定模块和第七显示模块。
218.该第二确定模块可以用于在显示错例展示页面之后,响应于接收到对错例图像样本的错误原因删除操作,确定错误原因删除操作删除的第二错误原因标签。
219.该第七显示模块可以用于取消显示第二错误原因标签。
220.在本公开一些实施例中,验证数据还可以包括图像识别模型对应的各个识别中间阶段的标注数据和预估数据。
attachment,sata)总线、视频电子标准协会局部(video electronics standards association local bus,vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线804可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线,但本技术考虑任何合适的总线或互连。
233.本公开实施例还提供了一种计算机可读存储介质,该存储介质可以存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现本公开实施例所提供的模型错例分析方法。
234.上述的存储介质可以例如包括计算机程序指令的存储器802,上述指令可由模型错例分析设备的处理器801执行以完成本公开实施例所提供的模型错例分析方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是rom、随机存取存储器(random access memory,ram)、光盘只读存储器(compact disc rom,cd-rom)、磁带、软盘和光数据存储设备等。
235.需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
236.以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。