本发明涉及图像处理,具体涉及一种基于图像数据的试题实时批阅方法及系统。
背景技术:
1、传统填空试题批阅需要大量的人力资源和时间,由于人工的不确定性因素,容易在试题批阅过程中发生误判等情况。近年来,随着计算机视觉技术的发展,图像匹配技术得到了广泛的关注与研究,在试题批阅过程中发挥了极大的作用,减少了阅卷人的工作负担,提高了批阅的效率。但是由于考生的书写不规范行为导致了匹配结果不太理想的问题,从而会影响了试题批阅效果的准确率。
2、目前,常见的试题实时批阅的方法为对图像进行纠偏、降噪和缩放处理,然后将处理后的答题卡中的考生答案与标准答案进行匹配。但由于考生在答题时书写的字体有自己的风格,有的连笔较多,有的字体比较潦草,就会导致直接将考生答案与标准答案匹配存在较大误差,进而会出现试题误判的情况。
技术实现思路
1、为了解决将考生答案与标准答案匹配存在较大误差,会出现试题误判的技术问题,本发明的目的在于提供基于图像数据的试题实时批阅方法及系统,所采用的技术方案具体如下:
2、第一方面,本发明一个实施例提供了一种基于图像数据的试题实时批阅方法,该方法包括以下步骤:
3、获取答题卡扫描图中的扫描区域、扫描区域中的字体笔画、角点和连通域;
4、对角点之间的距离进行分析,确定字体笔画的笔画宽度;根据笔画宽度对角点进行筛选,得到连笔角点;根据所述连笔角点和笔画宽度得到扫描区域对应的字体拥挤度;
5、根据连通域内像素点的数量对连通域进行分类,得到字体连通域和连笔连通域;根据字体连通域在不同方向上的转动惯量得到连笔密集度;结合连笔密集度和连笔连通域的数量确定连笔指标;
6、根据字体拥挤度和连笔指标确定特征半径;基于特征半径,对字体笔画和标准答案进行特征匹配,得到批阅结果。
7、优选的,所述对角点之间的距离进行分析,确定字体笔画的笔画宽度,包括:
8、获取两条相交的字体笔画中方向与竖直方向最为相近的字体笔画作为纵向笔画;
9、将相交区域的任意一个角点作为第一目标角点,将相交区域的除第一目标角点外其他角点作为临近角点,连接第一目标角点和临近角点得到第一连线,将与水平向右的方向的夹角最小的第一连线对应的角点作为第一横向角点,计算第一目标角点与第一横向角点的距离作为第一宽度;
10、将除第一横向角点外与第一目标角点距离最近的临近角点,作为纵向角点;连接纵向角点与临近角点得到第二连线,将与水平向右的方向的夹角最小的第二连线对应的角点作为第二横向角点;计算纵向角点与第二横向角点的距离作为第二宽度,将第一宽度和第二宽度的均值作为纵向笔画的笔画宽度。
11、优选的,所述根据笔画宽度对角点进行筛选,得到连笔角点,包括:
12、对于相交的两条字体笔画,将相交的两条字体笔画的笔画宽度的差异作为筛选差值;将筛选差值大于预设第一阈值的相交的两条字体笔画的相交区域,作为字体区域;将字体区域的角点作为连笔角点。
13、优选的,所述根据所述连笔角点和笔画宽度得到扫描区域对应的字体拥挤度,包括:
14、将所有连笔角点对应的字体笔画的笔画宽度的均值,作为宽度均值;将所述宽度均值和连笔角点的数量的乘积作为扫描区域对应的字体拥挤度。
15、优选的,所述根据连通域内像素点的数量对连通域进行分类,得到字体连通域和连笔连通域,包括:
16、将连通域内像素点的数量大于预设第二阈值的连通域作为字体连通域;将连通域内像素点的数量小于或等于预设第二阈值的连通域作为连笔连通域。
17、优选的,所述根据字体连通域在不同方向上的转动惯量得到连笔密集度,包括:
18、当字体连通域在水平方向上的转动惯量小于或等于垂直方向上的转动惯量时,将水平方向上的转动惯量和垂直方向上的转动惯量的比值的绝对值作为字体连通域的连笔密集度;
19、当字体连通域在水平方向上的转动惯量大于垂直方向上的转动惯量时,将垂直方向上的转动惯量和水平方向上的转动惯量的比值的绝对值作为字体连通域的连笔密集度。
20、优选的,所述结合连笔密集度和连笔连通域的数量确定连笔指标,包括:
21、计算所有字体连通域的连笔密集度的均值作为密集度均值;
22、将密集度均值和连笔连通域的数量的乘积进行正相关映射,得到对应的连笔指标。
23、优选的,所述根据字体拥挤度和连笔指标确定特征半径,包括:
24、将字体拥挤度和连笔指标的乘积作为调节半径;
25、将调节半径和预设第三阈值的和值作为真数的自然对数函数值作为初始半径;将初始半径和预设第四阈值的和值作为特征半径。
26、优选的,所述基于特征半径,对字体笔画和标准答案进行特征匹配,得到批阅结果,包括:
27、基于特征半径获取扫描区域中字体笔画的关键点,作为字体关键点;将字体关键点和答案卡上的标准答案的关键点进行匹配,得到匹配对;将匹配对的数量占比作为匹配度,当匹配度大于或等于预设匹配阈值,扫描区域对应的题目正确;当匹配度小于预设匹配阈值,扫描区域对应的题目错误。
28、第二方面,本发明一个实施例提供了一种基于图像数据的试题实时批阅系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于图像数据的试题实时批阅方法。
29、本发明实施例至少具有如下有益效果:
30、该方法在获取答题卡扫描图中的扫描区域中的字体笔画、角点和连通域之后,对角点进行分析,确定字体笔画的笔画宽度,由于连笔笔画的笔画宽度通常较窄,而正常字体笔画的笔画宽度通常差异较小,故先获取字体笔画的笔画宽度,以便于后续对连笔笔画和正常字体笔画的区分;根据笔画宽度对角点进行筛选,得到连笔角点;根据连笔角点和笔画宽度得到扫描区域对应的字体拥挤度,通过对扫描区域中字体进行分析,构建对应的反映考生书写字体的特征指标,该字体拥挤度也即为调节自适应的特征半径的一个特征指标;获取字体连通域和连笔连通域,计算字体连通域的连笔密集度,并结合连笔密集度和连笔连通域的数量确定连笔指标,该连笔指标作为调节自适应的特征半径的另一个特征指标,该连笔指标反映了扫描区域的字体笔画的连笔程度,该连笔指标越大,则对应的连笔的情况出现大的概率越大;根据字体拥挤度和连笔指标确定特征半径,基于特征半径对字体笔画和标准答案进行特征匹配,得到批阅结果,从而避免因为字体过于潦草而降低关键点的检测精度问题,改善了关键点检测的效果,提高了匹配的精度。
1.一种基于图像数据的试题实时批阅方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的基于图像数据的试题实时批阅方法,其特征在于,所述对角点之间的距离进行分析,确定字体笔画的笔画宽度,包括:
3.根据权利要求1所述的基于图像数据的试题实时批阅方法,其特征在于,所述根据笔画宽度对角点进行筛选,得到连笔角点,包括:
4.根据权利要求1所述的基于图像数据的试题实时批阅方法,其特征在于,所述根据所述连笔角点和笔画宽度得到扫描区域对应的字体拥挤度,包括:
5.根据权利要求1所述的基于图像数据的试题实时批阅方法,其特征在于,所述根据连通域内像素点的数量对连通域进行分类,得到字体连通域和连笔连通域,包括:
6.根据权利要求1所述的基于图像数据的试题实时批阅方法,其特征在于,所述根据字体连通域在不同方向上的转动惯量得到连笔密集度,包括:
7.根据权利要求1所述的基于图像数据的试题实时批阅方法,其特征在于,所述结合连笔密集度和连笔连通域的数量确定连笔指标,包括:
8.根据权利要求1所述的基于图像数据的试题实时批阅方法,其特征在于,所述根据字体拥挤度和连笔指标确定特征半径,包括:
9.根据权利要求1所述的基于图像数据的试题实时批阅方法,其特征在于,所述基于特征半径,对字体笔画和标准答案进行特征匹配,得到批阅结果,包括:
10.一种基于图像数据的试题实时批阅系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~9任意一项所述基于图像数据的试题实时批阅方法的步骤。