本发明涉及密封线识别,具体是涉及一种基于密度聚类的试卷密封线定位方法及系统。
背景技术:
1、电子阅卷系统是指在考生答卷之后,通过高速扫描仪将考生答卷扫描到系统中,并进行试卷分割进行阅卷,为保证阅卷的公正,需要识别答题纸上密封线的位置,根据位置自动裁切或遮挡密封线区域,隐去考生信息,方便评卷老师评卷。
2、现有的试卷密封线识别方法为通过试卷标准设定一确定的坐标值,进行密封线区域的裁切或遮挡,但是试卷由于试卷印刷质量的参差不齐,在实际的阅卷过程中,存在着试卷密封线印刷误差,导致密封线区域的裁切或遮挡时易出现泄露考生信息或遮挡考生答案的问题。
技术实现思路
1、为解决上述技术问题,提供一种基于密度聚类的试卷密封线定位方法及系统,本技术方案解决了上述的现有技术在进行密封线区域的裁切或遮挡时易出现泄露考生信息或遮挡考生答案的问题。
2、为达到以上目的,本发明采用的技术方案为:
3、一种基于密度聚类的试卷密封线定位方法,包括:
4、获取扫描仪扫描的试卷图片,记为原始试卷图片;
5、基于基准坐标系,对原始试卷图片进行倾斜校正,得到校正试卷图片;
6、设定一识别间距;
7、在密封线识别区间内,按照识别间距,纵向划分出若干个y向待识别图片;
8、设定一试卷密封线标准图片;
9、对每个y向待识别图片与试卷密封线标准图片进行相似度匹配,获得试卷密封线初步定位图片;
10、在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为x坐标校验区域;
11、针对每个x坐标校验区域逐像素检测密封线点位x坐标值,所有区域内密封线x坐标值组成x坐标集合;
12、针对x坐标集合基于grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除x坐标集合中的离群点,得到有效x坐标集合;
13、对有效x坐标集合中的所有x坐标值求平均值获得密封线x坐标;
14、在校正试卷图片中将密封线x坐标左侧或右侧的区域裁切或遮挡。
15、优选的,所述对每个y向待识别图片与试卷密封线标准图片进行相似度匹配,获得试卷密封线初步定位图片具体包括:
16、基于所有识别出的历史密封线x坐标求平均值,获得密封线初始识别坐标;
17、获取每个y向待识别图片中心线的x坐标;
18、采用密封线相似匹配算法,确定每个y向待识别图片与试卷密封线标准图片之间的图片相似指标;
19、基于图片相似指标、密封线初始识别坐标和y向待识别图片中心线的x坐标,通过综合拟合公式,计算y向待识别图片的密封线综合拟合指标;
20、筛选出密封线综合拟合指标最小的y向待识别图片,作为试卷密封线初步定位图片;
21、其中,所述综合拟合公式具体为:
22、;式中, 为第i个y向待识别图片的密封线综合拟合指标,为第i个y向待识别图片与试卷密封线标准图片之间的图片相似指标,为第i个y向待识别图片中心线的x坐标,为密封线初始识别坐标,为距离修正权重。
23、优选的,所述密封线相似匹配算法具体为:
24、将y向待识别图片和试卷密封线标准图片按照相同的划分逻辑,划分出若干个相似匹配区域;
25、分别计算每个相似匹配区域内,y向待识别图片中的疑似试卷密封线像素点和试卷密封线标准图片中的试卷密封线像素点之间的x坐标差;
26、将所有的x坐标差求取标准差,以该标准差作为y向待识别图片与试卷密封线标准图片之间的图片相似指标。
27、优选的,所述在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为x坐标校验区域具体包括:
28、将试卷密封线初步定位图片反面横向分散切割出多个区域,所述区域数量至少为10个,所述区域的截取高度为20像素。
29、优选的,所述针对x坐标集合基于grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除x坐标集合中的离群点,得到有效x坐标集合具体包括:
30、对于x坐标集合中的每个密封线x坐标值,计算z分数;
31、构建离群点判定公式;
32、判定x坐标集合中的密封线x坐标值的z分数是否满足离群点判定公式,若是,则判定该密封线x坐标值为x坐标集合中的离群点,若否,则判定该密封线x坐标值不是x坐标集合中的离群点;
33、将所有离群点剔除,得到有效x坐标集合;
34、其中,所述离群点判定公式为:
35、;式中,为x坐标集合中的密封线x坐标值的z分数,是显著水平 下的t-分布的值,n是x坐标集合中的密封线x坐标值总数量。
36、优选的,所述z分数的计算公式为:
37、;式中,为x坐标集合中的第j个密封线x坐标值的z分数,为x坐标集合中的第j个密封线x坐标值,为x坐标集合中的所有密封线x坐标值的平均值,s为x坐标集合中的所有密封线x坐标值的标准差。
38、进一步的,提出一种基于密度聚类的试卷密封线定位系统,用于实现如上述的基于密度聚类的试卷密封线定位方法,包括:
39、扫描仪,所述扫描仪用于扫描试卷图片,获得原始试卷图片;
40、倾斜校正模块,所述倾斜校正模块与所述扫描仪电性连接,所述倾斜校正模块用于基于基准坐标系,对原始试卷图片进行倾斜校正,得到校正试卷图片;
41、初定位模块,所述初定位模块与所述倾斜校正模块电性连接,所述初定位模块用于设定一识别间距,在密封线识别区间内,按照识别间距,纵向划分出若干个y向待识别图片,并对每个y向待识别图片与试卷密封线标准图片进行相似度匹配,获得试卷密封线初步定位图片;
42、密封线坐标定位模块,所述密封线坐标定位模块与所述初定位模块电性连接,所述密封线坐标定位模块用于在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为x坐标校验区域,针对每个x坐标校验区域逐像素检测密封线点位x坐标值,所有区域内密封线x坐标值组成x坐标集合,针对x坐标集合基于grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除x坐标集合中的离群点,得到有效x坐标集合,对有效x坐标集合中的所有x坐标值求平均值获得密封线x坐标;
43、裁切模块,所述裁切模块与所述密封线坐标定位模块电性连接,所述裁切模块用于在校正试卷图片中将密封线x坐标左侧或右侧的区域裁切或遮挡。
44、可选的,所述初定位模块包括:
45、第一划分单元,所述第一划分单元用于设定一识别间距,并在密封线识别区间内,按照识别间距,纵向划分出若干个y向待识别图片;
46、历史分析单元,所述历史分析单元用于基于所有识别出的历史密封线x坐标求平均值,获得密封线初始识别坐标;
47、图片定位单元,所述图片定位单元用于获取每个y向待识别图片中心线的x坐标;
48、图片相似匹配单元,所述图片相似匹配单元用于采用密封线相似匹配算法,确定每个y向待识别图片与试卷密封线标准图片之间的图片相似指标;
49、综合拟合单元,所述综合拟合单元用于基于图片相似指标、密封线初始识别坐标和y向待识别图片中心线的x坐标,通过综合拟合公式,计算y向待识别图片的密封线综合拟合指标;
50、筛选单元,所述筛选单元用于筛选出密封线综合拟合指标最小的y向待识别图片,作为试卷密封线初步定位图片。
51、可选的,所述密封线坐标定位模块包括:
52、第二划分单元,所述第二划分单元用于在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为x坐标校验区域;
53、坐标采集单元,所述坐标采集单元用于针对每个x坐标校验区域逐像素检测密封线点位x坐标值,所有区域内密封线x坐标值组成x坐标集合;
54、离群检测单元,所述离群检测单元用于针对x坐标集合基于grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除x坐标集合中的离群点,得到有效x坐标集合;
55、坐标确定单元,所述坐标确定单元用于对有效x坐标集合中的所有x坐标值求平均值获得密封线x坐标。
56、与现有技术相比,本发明的有益效果在于:
57、本发明提出一种基于密度聚类的试卷密封线定位方法,通过图像拟合结合坐标距离进行综合确定试卷中的密封线大致位置,之后基于密度聚类识别算法,剔除出密封线x坐标值中的离群点,得到有效x坐标集合,以所有有效x坐标的平均值作为识别出的密封线x坐标,有效的保证密封线x坐标定位精准度,以该密封线x坐标进行裁切或遮挡密封线x坐标左侧或右侧的区域,可有效的在隐去考生信息的同时不遮挡考生答案,提高阅卷效率。