一种自动生成错题本的方法及系统的制作方法

文档序号:6442198阅读:1243来源:国知局
专利名称:一种自动生成错题本的方法及系统的制作方法
技术领域
本发明涉及图像数据处理技术领域,特别是涉及一种自动生成错题本的方法及系统。
背景技术
“错题本”是指中小学学生在学习过程中,把自己做过的作业、习题、试卷中的错题整理成册,便于找出自己学习中的薄弱环节,使得学习重点突出、学习更加有针对性、进而提高学习效率提高学习成绩。“错题本”是自身错误的系统汇总,当把错误汇总在一起的时候,就会很容易看出其中的规律性。另一方面,“错题本”还能改变学生对错误的态度,对待错题的态度是减少错题的关键;因为错误才能使学生知道自己的不足,而不能因为错题少或错误的原因简单而忽视它。一个错误实际就是一个盲点。如果对待错误的态度不积极, 或者缺乏理想的方式解决错误,错误会在任何可能的时候发生,而且会经常重复发生。可见,“错题本”对于学生而言是很重要的。但是,要想制作“错题本”,则要求学生每次考试、练习后,将错误的题目抄在一个特殊的本上。因为要占用较多的时间,且工作量较大,大部分的学生难以坚持。扫描技术或者照相技术能够将纸质试卷或练习册等转换成电子版的试题图片,这为对试卷的自动化处理提供了前提。但是一些试题是填空题的形式,还有一些试题有多个小题,使得电子版的试题图片中带有学生答案或者老师的阅卷痕迹,不符合制作错题本的要求。因此,需要从电子版试题图片中将学生的答案及老师的阅卷痕迹去掉,只保留题目内容本身。但是,现有技术尚没有相应的解决方案。因此,迫切需要本领域技术人员解决的技术问题在于,如何根据电子版的试题图片,生成不包含手写体字符的试题图片,以便提高制作错题本的效率。

发明内容
本发明提供一种自动生成错题本的方法及系统,能够根据电子版试题图片生成不包含手写体字符的试题图片,进而自动生成错题本。本发明提供了如下方案一种自动生成错题本的方法,包括获取电子版试题图片;所述试题图片中包含文字,所述文字包括印刷体文字及手写体文字;从所述试题图片中提取文字特征;将所述提取的文字特征与预置的文字特征库进行比对,区分出其中的印刷体文字及手写体文字;将所述手写体文字从所述试题图片中擦除,生成不包含手写体文字的试题图片, 以便根据包含手写体文字的试题图片和不包含手写体文字的试题图片,自动生成错题本。其中,所述将所述提取的文字特征与预置的文字特征库进行比对包括
将所述提取的文字特征与预置的印刷体文字特征库进行比对,将符合所述印刷体文字特征库的文字确定为印刷体文字,其余文字确定为手写体文字。其中,所述将所述提取的文字特征与预置的文字特征库进行比对包括将所述提取的文字特征与预置的手写体文字特征库进行比对,将符合所述手写体文字特征库的文字确定为手写体文字,其余文字确定为印刷体文字。其中,所述从所述试题图片中提取文字特征包括从所述试题图片中提取各个文字的笔画构造特征;禾口/ 或,从所述试题图片中提取各个相邻文字所占的区域特征。其中,所述笔画构造特征包括上下边界弯曲度特征及横竖笔画特征。其中,还包括针对指定的所有考生建立公共试卷库,以便在公共试卷库中查看所有试卷的所有试题信息,并对试题按指定条件进行查询。一种自动生成错题本的系统,包括图片获取单元,用于获取电子版试题图片;所述试题图片中包含文字,所述文字包括印刷体文字及手写体文字;特征提取单元,用于从所述试题图片中提取文字特征;文字区分单元,用于将所述提取的文字特征与预置的文字特征库进行比对,区分出其中的印刷体文字及手写体文字;生成单元,用于将所述手写体文字从所述试题图片中擦除,生成不包含手写体文字的试题图片,以便根据包含手写体文字的试题图片和不包含手写体文字的试题图片,自动生成错题本。其中,所述文字区分单元包括第一区分子单元,用于将所述提取的文字特征与预置的印刷体文字特征库进行比对,将符合所述印刷体文字特征库的文字确定为印刷体文字,其余文字确定为手写体文字。其中,所述文字区分单元包括第二区分子单元,用于将所述提取的文字特征与预置的手写体文字特征库进行比对,将符合所述手写体文字特征库的文字确定为手写体文字,其余文字确定为印刷体文字。其中,所述特征提取单元包括第一提取子单元,用于从所述试题图片中提取各个文字的笔画构造特征;和/ 或,第二提取子单元,用于从所述试题图片中提取各个相邻文字所占的区域特征。其中,所述笔画构造特征包括上下边界弯曲度特征及横竖笔画特征。其中,还包括信息共享单元,用于针对指定的所有考生建立公共试卷库,以便在公共试卷库中查看所有试卷的所有试题信息,并对试题按指定条件进行查询。根据本发明提供的具体实施例,本发明公开了以下技术效果
本发明根据试卷中打印体与手写体字符之间文字特征的不同,来区分打印体与手写体,并将手写体字符所在像素点的颜色修改为背景色,这样,图片中就不再包含手写体字符,而只剩下打印体字符,即试题的题目内容。而错题本就是要求只有题目内容,而不包括答题或阅卷痕迹,因此,该方法有利于自动生成错题本。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明实施例提供的方法的流程图;图2是本发明实施例提供的系统的示意图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。参见图1,本发明实施例提供的自动生成错题本的方法包括以下步骤SlOl 获取电子版试题图片;所述试题图片中包含文字,所述文字包括印刷体试题文字及手写体答案文字;其中,可以利用扫描仪对纸质试卷进行扫描得到电子版试题图片,或者,也可以采用数码相机等进行拍照,得到电子版试题图片。为方便描述,下面均以扫描为例进行介绍。由于仅是针对错误的题目生成错题本,而对于一张试卷而言,通常不是每道题都错误,因此,扫描时可以不必扫描整张试卷,而是仅扫描试卷中答错的试题部分即可。关于这种部分扫描的技术,现有技术能够实现,因此这里不再赘述。总之,可以采用多种方法,获取到电子版试题图片。一个试题图片对应一个答错的试题,并且该电子版试题图片中既包含题目内容,又包含有答题痕迹和/或阅卷痕迹。在生成错题本时,通常需要把试卷中的答题痕迹和/或阅卷痕迹去掉,以便学生能够重新作答, 因此,本发明实施例需要解决的问题就在于如何将电子版试题图片中的答题痕迹和/或阅卷痕迹去掉,仅留下题目内容。这样,将处理过的试题图片保存在系统中,学生就可以在系统中查找到整理过的错题,而不用再用手抄的方式来制作错题本。要想将电子版试题图片中的答题痕迹和/或阅卷痕迹去掉,仅留下题目内容,准确地区分出题目内容与答题痕迹和/或阅卷痕迹是比较关键的;即如果能够区分出题目内容与答题痕迹和/或阅卷痕迹,则将答题痕迹和/或阅卷痕迹去掉即可。但是具体实现时, 区分出题目内容与答题痕迹和/或阅卷痕迹是比较复杂的。为解决该问题,本发明实施例中采用了如下方法利用字符的文字特征来区分打印体和手写体。即,实际应用中,试卷中的题目都是打印体,而答题痕迹和/或阅卷痕迹都是手写体,从字体特征上来看,打印体比较工整,而手写体却不可能做到像打印体一样的工整程度。因此,可以通过字符的文字特征来区分打印体及手写体字符。S102 从所述试题图片中提取文字特征;S103:将所述提取的文字特征与预置的文字特征库进行比对,区分出其中的印刷体文字及手写体文字;可以预先设置文字特征库,在获取到电子试题图片中各个文字的文字特征之后, 就可以将获取到的文字特征与文字特征库中的特征进行比对,如果特征相符,则证明属于与特征库中的字体一致的字体。例如,预先设置的可以是打印体特征库,此时,在将一个文字的文字特征与特征库中的特征进行比对时,如果相符,则证明该文字属于一个打印体文字,否则,如果不相符,则属于手写体文字。或者,预先设置的还可以是手写体特征库,此时, 将一个文字的文字特征与该特征库中的特征进行比对时,如果特征相符,则属于首先体文字,否则,如果特征不符,则属于打印体文字。具体实现时,特征库中保存的笔画构造特征可以是上下边界弯曲度特征和/或横竖笔画特征,相应的,在从所述试题图片中提取文字特征时,也可以是提取上下边界弯曲度特征和/或横竖笔画特征。其中,上下边界弯曲度特征是字符边界笔画点到图像边框的距离平方和,反映了单个字符以及整个区城书写的平整度。手写体字符因书写人的习惯.字符大小总会有所差异,每个字符书写的笔画会倾斜,高低位置也不会很整齐,因此上下边界弯曲度特征值较大。而印刷体字符大小统一,笔画端正,因而上下边界弯曲度特征值较小。 另外,关于横竖笔画特征,印刷体字符在打印清楚,用力均勻的悄况下,表现出来的横平竖直特征是很明显的,而手写体字符因书写人的习惯,字符整体会有所倾斜.横竖笔画也不会很规整。因此在图像整体颜色深时,用比较大的阈值进行二值化处理后,印刷体字符图像的横竖笔画特征值要远大于手写体字符图像的横竖笔画特征值。因此,通过这些特征都能够将手写体与印刷体区分开来。需要说明的是,在使用上述上下边界弯曲度特征和/或横竖笔画特征来区分手写体与印刷体文字时,需要分别提取每个文字的上下边界弯曲度特征和/或横竖笔画特征。 在实际应用中,由于打印体的文字通常是在电子版的文件中对文字的大小等进行了设置, 例如,统一设置为4号等,这样,每个文字所占的区域大小基本上是相同的,其中,区域大小可以由每个文字所占的宽度等来确定。在这种情况下,就可以从所述试题图片中提取各个相邻文字所占的区域特征,例如,提取出当前一个文字所占区域的宽度,同时提取与其相邻的上一个或下一个文字所占区域的宽度,如果宽度值基本相同,则将该文字及其相邻的文字判定为印刷体;否则,如果各个相邻的文字所占区域的宽度不同,并且相差很多,则可以将这些相邻的文字判定为手写体。S104:将所述手写体文字从所述试题图片中擦除,生成不包含手写体文字的试题图片,以便根据包含手写体文字的试题图片和不包含手写体文字的试题图片,自动生成错题本。由于已经将手写体与印刷体区分出来,因此,只要将手写体的文字删除,最终就可以生成不包含手写体字符的试题图片,而仅包含打印体字符,即题目的文字内容。这样,对于一个电子版试题图片而言,由于将答题痕迹及阅卷痕迹都去掉了,只保留了题目内容,因此,可以导出为word文档,以便生成错题本。其中,在生成错题本时,可以导出2个word文档,其中一个是包含有题目内容及原来的答题及阅卷痕迹的试题图片,另一个是仅包含有题目内容的试题图片;或者,也可以导出1个,前面是题(涂抹过的),后面是答案(未涂抹的)。无论如何,将word文档打印出来之后,与学生手动抄写题目生成错题本的效果是相同的。但是利用本发明实施例的方法之后,可以大大节省处理时间。在实际应用中,为了更好地发挥错题本的作用,还可能还需要关注每道题的知识点,以便于了解是在哪个或哪些知识点上存在薄弱环节,以便有针对性地进行复习,等等。 因此,为了便于统计每道题的知识点,本发明实施例在针对每道错题生成不包含手写体字符的试题图片的同时,还可以提供添加每到错题的知识点的入口,学生可以通过该入口添加每道错题的知识点,如三角形、圆等等。然后,系统可以保存所述不包含手写体字符的试题图片与所述知识点信息之间的对应关系,以便随时查看。在实际应用中,可能有多道题对应同一知识点的情况,学生可能需要将同一知识点的各道错题筛选出来,或者对各个知识点对应的错题进行归类。此时,本发明实施例还可以提供查询入口,可以通过该入口输入某知识点作为查询条件,例如,输入“三角形”,则可以将之前标注的知识点为“三角形”的错题全部查找出来,然后将不包含手写体字符的试题图片导出到word文档中。优选的,还可以在导入word文档的过程中,对每幅图片进行自动编号。例如,第一个导入的图片编号为“1”,第二个编号为“2”,以此类推。这样,就可以通过打印该word文档,得到一个针对“三角形”知识点的“错题本”。当然,为了方便添加知识点,也为了规范查询条件,在提供添加知识点入口时,可以以列表形式提供候选的知识点信息,然后接收用户选择的知识点信息,将其确定为用户为当前试题添加的知识点信息。例如,可以在界面上提供下拉列表,当点击该下拉列表时, 展示出“三角形”、“圆”等候选知识点,以供用户选择。这样,用户可以直接点击下拉列表中的知识点来完成添加,而不需要通过键盘输入。另一方面,由于选择的是系统提供的知识点,因此命名比较规范,便于进行同一知识点的查询,避免由于知识点名称上的差异而无法查全的情况。例如,如果采用用户输入的方式,同样对于“三角形”这个知识点,则有的可能添加为“三角形”,有的可能添加为“三角”,等等;当以“三角形”为查询条件时,被标注为“三角”的错题就会被漏掉。当然,为了便于查询,同样可以提供选择查询条件的下拉列表,由于是以添加的知识点为查询条件进行查询,因此该列表中的选项与供添加知识点的下拉列表中的选项可以是相同的。需要说明的是,除了为每道错题添加知识点外,还可以添加其他信息,例如,还可以添加错误原因、重要程度等等,同时,这些信息也都可以作为查询条件,按这些信息进行查询。具体的添加及查询方法与按照知识点进行添加或查询的方法类似,这里不再赘述。此外,在本发明实施例中,还可以建立起多用户共享平台,以便用户进行更好地交流。也就是说,针对指定的所有考生建立公共试卷库,以便在公共试卷库中查看所有试卷的所有试题信息,并对试题按指定条件进行查询。具体实现时,考生可以将自己的关于某知识点的试题上传到该系统中,可以在试题详细页面,设置“查看分享试题”,用户点击该按钮即可查看其他会员上传的关于该知识点的所有试题。用户可屏蔽某些用户,屏蔽该用户之后被屏蔽用户所发布的信息将不在本用户中显示。总之,本发明实施例根据试卷中打印体与手写体字符之间文字特征的不同,来区分打印体与手写体,并将手写体字符删除,这样,图片中就不再包含手写体字符,而只剩下打印体字符,即试题的题目内容。而错题本的其中一部分要求就是只有题目内容,而不包括答题或阅卷痕迹,因此,该方法有利于自动生成错题本。需要说明的是,在实际应用中,除了错题本以外,可能还需要把“容易出错题”、“难点题”、“典型题”、“好题”等,一并整理出来,制作“好题本”。显然,本发明实施例的方法也可以应用于制作“好题本”的过程中,用以提高制作“好题本”的效率。与本发明实施例提供的自动生成错题本的方法相对应,本发明实施例还提供了一种自动生成错题本的系统,参见图2,该系统包括以下单元图片获取单元201,用于获取电子版试题图片;所述试题图片中包含文字,所述文字包括印刷体文字及手写体文字;特征提取单元202,用于从所述试题图片中提取文字特征;文字区分单元203,用于将所述提取的文字特征与预置的文字特征库进行比对,区分出其中的印刷体文字及手写体文字;生成单元204,用于将所述手写体文字从所述试题图片中擦除,生成不包含手写体文字的试题图片,以便根据包含手写体文字的试题图片和不包含手写体文字的试题图片, 自动生成错题本。其中,文字区分单元203可以包括第一区分子单元,用于将所述提取的文字特征与预置的印刷体文字特征库进行比对,将符合所述印刷体文字特征库的文字确定为印刷体文字,其余文字确定为手写体文字。或者,文字区分单元203也可以包括第二区分子单元,用于将所述提取的文字特征与预置的手写体文字特征库进行比对,将符合所述手写体文字特征库的文字确定为手写体文字,其余文字确定为印刷体文字。其中,特征提取单元202可以包括第一提取子单元,用于从所述试题图片中提取各个文字的笔画构造特征;禾口/ 或,第二提取子单元,用于从所述试题图片中提取各个相邻文字所占的区域特征。具体实现时,所述笔画构造特征可以包括上下边界弯曲度特征及横竖笔画特征。为了用户更好地交流,该系统还可以包括信息共享单元,用于针对指定的所有考生建立公共试卷库,以便在公共试卷库中查看所有试卷的所有试题信息,并对试题按指定条件进行查询。以上对本发明所提供的一种自动生成错题本的方法及系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式
及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
权利要求
1.一种自动生成错题本的方法,其特征在于,包括获取电子版试题图片;所述试题图片中包含文字,所述文字包括印刷体文字及手写体文字;从所述试题图片中提取文字特征;将所述提取的文字特征与预置的文字特征库进行比对,区分出其中的印刷体文字及手写体文字;将所述手写体文字从所述试题图片中擦除,生成不包含手写体文字的试题图片,以便根据包含手写体文字的试题图片和不包含手写体文字的试题图片,自动生成错题本。
2.根据权利要求1所述的方法,其特征在于,所述将所述提取的文字特征与预置的文字特征库进行比对包括将所述提取的文字特征与预置的印刷体文字特征库进行比对,将符合所述印刷体文字特征库的文字确定为印刷体文字,其余文字确定为手写体文字。
3.根据权利要求1所述的方法,其特征在于,所述将所述提取的文字特征与预置的文字特征库进行比对包括将所述提取的文字特征与预置的手写体文字特征库进行比对,将符合所述手写体文字特征库的文字确定为手写体文字,其余文字确定为印刷体文字。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述从所述试题图片中提取文字特征包括从所述试题图片中提取各个文字的笔画构造特征;和/或,从所述试题图片中提取各个相邻文字所占的区域特征。
5.根据权利要求4所述的方法,其特征在于,所述笔画构造特征包括上下边界弯曲度特征及横竖笔画特征。
6.根据权利要求1所述的方法,其特征在于,还包括针对指定的所有考生建立公共试卷库,以便在公共试卷库中查看所有试卷的所有试题信息,并对试题按指定条件进行查询。
7.一种自动生成错题本的系统,其特征在于,包括图片获取单元,用于获取电子版试题图片;所述试题图片中包含文字,所述文字包括印刷体文字及手写体文字;特征提取单元,用于从所述试题图片中提取文字特征;文字区分单元,用于将所述提取的文字特征与预置的文字特征库进行比对,区分出其中的印刷体文字及手写体文字;生成单元,用于将所述手写体文字从所述试题图片中擦除,生成不包含手写体文字的试题图片,以便根据包含手写体文字的试题图片和不包含手写体文字的试题图片,自动生成错题本。
8.根据权利要求7所述的系统,其特征在于,所述文字区分单元包括第一区分子单元,用于将所述提取的文字特征与预置的印刷体文字特征库进行比对, 将符合所述印刷体文字特征库的文字确定为印刷体文字,其余文字确定为手写体文字。
9.根据权利要求7所述的系统,其特征在于,所述文字区分单元包括第二区分子单元,用于将所述提取的文字特征与预置的手写体文字特征库进行比对, 将符合所述手写体文字特征库的文字确定为手写体文字,其余文字确定为印刷体文字。
10.根据权利要求7至9任一项所述的系统,其特征在于,所述特征提取单元包括 第一提取子单元,用于从所述试题图片中提取各个文字的笔画构造特征;和/或,第二提取子单元,用于从所述试题图片中提取各个相邻文字所占的区域特征。
11.根据权利要求10所述的系统,其特征在于,所述笔画构造特征包括 上下边界弯曲度特征及横竖笔画特征。
12.根据权利要求7所述的系统,其特征在于,还包括信息共享单元,用于针对指定的所有考生建立公共试卷库,以便在公共试卷库中查看所有试卷的所有试题信息,并对试题按指定条件进行查询。
全文摘要
本发明公开了一种自动生成错题本的方法及系统,其中,所述方法包括获取电子版试题图片;所述试题图片中包含文字,所述文字包括印刷体文字及手写体文字;从所述试题图片中提取文字特征;将所述提取的文字特征与预置的文字特征库进行比对,区分出其中的印刷体文字及手写体文字;将所述手写体文字从所述试题图片中擦除,生成不包含手写体文字的试题图片,以便根据包含手写体文字的试题图片和不包含手写体文字的试题图片,自动生成错题本。通过本发明,能够根据电子版试题图片生成不包含手写体字符的试题图片,进而自动生成错题本。
文档编号G06K9/20GK102521516SQ201110428840
公开日2012年6月27日 申请日期2011年12月20日 优先权日2011年12月20日
发明者段民兴 申请人:北京商纳科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1