本发明涉及计算机网络技术领域,具体为一种基于自动去重的试题题库在线更新方法。
背景技术:
随着信息技术的发展,电子出版物越来越多。有试题内容的出版社或者培训机构就会设立试题题库中心。对于大的试题题库中心,里面的试题量巨大,在对试题题库进行更新时,因为试题量太大,几乎不可能通过人工去比对,且由于文字表述方式的差异,很难通过简单的字符对比来筛选,如何确保更新的试题是否重复便不是一项容易的工作。
同时很多试题是由文本、图片、知识点等异构数据构成的,现有的相似试题的判定方法大都仅以试题中的单一条件作为判定条件,并没有利用试全部条件,缺乏较强的解析性,导致相似试题的判定结果准确性低。
技术实现要素:
本发明的目的在于提供一种基于自动去重的试题题库在线更新方法,能自动完成试题的检测对比从而达到试题的自动去重,提高了效率,节约了成本,同时避免了仅以单一条件作为判定条件,提高了相似试题的判定结果的准确性,用以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于自动去重的试题题库在线更新方法,包括如下步骤:
s1、上传待更新的试题,获取试题的试题信息,其中,试题信息包括试题的试题类型,根据试题类型对应的导入格式,将待更新的试题导入至试题题库中;
s2、根据试题题库中导入的待更新的试题文件内容,从试题题库数据库读取与待更新的试题对应的试题信息,生成知识树,将导入待更新的试题与试题题库数据库的标签库的标签进行匹配,并将匹配后的待更新的试题传送至与导入的待更新的试题相关的待审核试题数据库中;
s3、基于试题题库数据库和待审核试题数据库,生成去重测试试题集,其中,去重测试试题集中包括待审核试题数据库中的待更新的试题和试题题库数据库中的至少一个疑重试题;
s4、获取去重测试试题集中包含的异构数据信息,其中,异构数据信息包括:文本、图片和知识点,将异构数据信息传递到预设的语义表征计算模型,计算得到待更新的试题对应的第一语义表征和疑重试题对应的第二语义表征;
s5、分别将第一语义表征和第二语义表征采用预设的相似度计算方法进行计算,得到待更新的试题相对于疑重试题的相似度得分,判断相似度得分是否大于预设的相似度得分阈值,若是,判定待更新的试题与疑重试题相似,删除待更新的试题,若否,判定待更新的试题与疑重试题不相似,将去重测试试题集删除,将待更新的试题加入试题题库中;
s6、在试题题库中的预览界面中展示更新的试题,完成试题题库在线更新。
所述步骤s1在根据试题类型对应的导入格式,将待更新的试题导入至试题题库中之后,还包括:
根据试题类型判断待更新的试题信息是否完整;
若待更新的试题信息完整,则将待更新的试题导入至试题题库中;
若待更新的试题信息不完整,则提示待更新的试题信息缺失。
所述步骤s2在将导入待更新的试题与试题题库数据库的标签库的标签进行匹配,并将匹配后的待更新的试题传送至与导入的待更新的试题相关的待审核试题数据库中包括以下步骤:
从待更新的试题中提取试题特征词,将试题特征词储存至试题特征词集合中;
从标签库的已有标签中提取标签特征词,将标签特征词储存至标签特征词集合中;
将试题特征词集合与标签特征词集合经过k近邻算法模型;
给待更新的试题匹配最相近的标签。
所述从待更新的试题中提取试题特征词包括以下步骤:
对待更新的试题进行预处理,对该试题进行分词;
通过分词后得到多个候选词,其中,候选词包括名词、公式、符号以及图形;
计算各个候选词的权重;
得到待更新的试题的试题特征词。
所述步骤s4中采用ik-analyzer对文本进行智能分词,并统计词频,将完成文本中的分词进行分析,提取主要关键词,将图片转换为base64编码保存。
所述步骤s5分别将第一语义表征和第二语义表征采用预设的相似度计算方法进行计算,得到待更新的试题相对于疑重试题的相似度得分包括如下步骤:
分别依据第一语义表征计算与待更新的试题对应的第一相似向量和第一相似性语义向量和依据第二语义表征计算与疑重试题对应的第二相似向量和第二相似语义向量;
对第一相似向量、第一相似性语义向量、第二相似向量和第二相似性语义向量进行拼接,得到目标向量;
依据目标向量构建目标激活函数;
依据目标激活函数,确定待更新的试题相对于疑重试题的相似度得分。
所述步骤s6在试题题库中的预览界面中展示更新的试题,完成试题题库在线更新之后,还包括:
创建包含有更新的试题的测试试题集,对多个用户进行测试,获取各用户测试更新的试题的测试正确率;
针对更新的试题,基于irt模型,根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的难度参数以及区分度参数;
针对更新的试题,根据该试题的难度参数对该试题的难度参数进行修正,以及根据该试题的区分度参数对该试题的区分度参数进行修正;
根据修正后的结果更新该试题在试题题库中的分类和难度系数。
所述方法还包括:根据设定条件,定时定量更新试题题库。
与现有技术相比,本发明的有益效果是:
本发明上述的方法,在对试题题库进行在线更新时,先将待更新的试题根据与标签库的标签的匹配结果传送至相关的待审核试题数据库中,再将待更新的试题与疑重试题组成去重测试试题集进行相似度计算,能自动完成试题的检测对比从而达到试题的自动去重,提高了效率,节约了成本,同时采用文本、图片和知识点组成的异构数据进行相似试题的判定,避免了仅以单一条件作为判定条件,具备较强的解析性,提高了相似试题的判定结果的准确性。
附图说明
图1为本发明的方法流程示意框图。
具体实施方式
下面将结合本发明实例中的附图,对本发明实例中的技术方案进行清楚、完整地描述。所描述的实例仅仅是本发明的一部分实例,而不是全部的实例。基于本发明中的实例,本领域其他人员在没有做出创造性改变前提下所获得的所有其他实例,都属于本发明保护的范围。
请参阅图1,本发明提供一种技术方案:
一种基于自动去重的试题题库在线更新方法,包括如下步骤:
s1、上传待更新的试题,获取试题的试题信息,其中,试题信息包括试题的试题类型,根据试题类型对应的导入格式,将待更新的试题导入至试题题库中;
s2、根据试题题库中导入的待更新的试题文件内容,从试题题库数据库读取与待更新的试题对应的试题信息,生成知识树,将导入待更新的试题与试题题库数据库的标签库的标签进行匹配,并将匹配后的待更新的试题传送至与导入的待更新的试题相关的待审核试题数据库中;
s3、基于试题题库数据库和待审核试题数据库,生成去重测试试题集,其中,去重测试试题集中包括待审核试题数据库中的待更新的试题和试题题库数据库中的至少一个疑重试题;
s4、获取去重测试试题集中包含的异构数据信息,其中,异构数据信息包括:文本、图片和知识点,将异构数据信息传递到预设的语义表征计算模型,计算得到待更新的试题对应的第一语义表征和疑重试题对应的第二语义表征;
s5、分别将第一语义表征和第二语义表征采用预设的相似度计算方法进行计算,得到待更新的试题相对于疑重试题的相似度得分,判断相似度得分是否大于预设的相似度得分阈值,若是,判定待更新的试题与疑重试题相似,删除待更新的试题,若否,判定待更新的试题与疑重试题不相似,将去重测试试题集删除,将待更新的试题加入试题题库中;
s6、在试题题库中的预览界面中展示更新的试题,完成试题题库在线更新。
所述步骤s1在根据试题类型对应的导入格式,将待更新的试题导入至试题题库中之后,还包括:根据试题类型判断待更新的试题信息是否完整;若待更新的试题信息完整,则将待更新的试题导入至试题题库中;若待更新的试题信息不完整,则提示待更新的试题信息缺失。可避免导入的待更新的试题文件出现错误,保证导入试题题库的试题的准确性和完整性。
所述步骤s2在将导入待更新的试题与试题题库数据库的标签库的标签进行匹配,并将匹配后的待更新的试题传送至与导入的待更新的试题相关的待审核试题数据库中包括以下步骤:从待更新的试题中提取试题特征词,将试题特征词储存至试题特征词集合中;从标签库的已有标签中提取标签特征词,将标签特征词储存至标签特征词集合中;将试题特征词集合与标签特征词集合经过k近邻算法模型;给待更新的试题匹配最相近的标签。提高了分类的正确性,极大的提高了对试题分类的速度。
所述从待更新的试题中提取试题特征词包括以下步骤:对待更新的试题进行预处理,对该试题进行分词;通过分词后得到多个候选词,其中,候选词包括名词、公式、符号以及图形;计算各个候选词的权重;得到待更新的试题的试题特征词。提高试题特征词的代表性,可准确地代表待更新的试题。
所述步骤s4中采用ik-analyzer对文本进行智能分词,并统计词频,将完成文本中的分词进行分析,提取主要关键词,将图片转换为base64编码保存。提高文本处理速率,且方便图片数据的快速传输。
所述步骤s5分别将第一语义表征和第二语义表征采用预设的相似度计算方法进行计算,得到待更新的试题相对于疑重试题的相似度得分包括如下步骤:分别依据第一语义表征计算与待更新的试题对应的第一相似向量和第一相似性语义向量和依据第二语义表征计算与疑重试题对应的第二相似向量和第二相似语义向量;对第一相似向量、第一相似性语义向量、第二相似向量和第二相似性语义向量进行拼接,得到目标向量;依据目标向量构建目标激活函数;依据目标激活函数,确定待更新的试题相对于疑重试题的相似度得分。具备较强的解析性,提高相似试题的判定结果的准确性。
所述步骤s6在试题题库中的预览界面中展示更新的试题,完成试题题库在线更新之后,还包括:创建包含有更新的试题的测试试题集,对多个用户进行测试,获取各用户测试更新的试题的测试正确率;针对更新的试题,基于irt模型,根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的难度参数以及区分度参数;针对更新的试题,根据该试题的难度参数对该试题的难度参数进行修正,以及根据该试题的区分度参数对该试题的区分度参数进行修正;根据修正后的结果更新该试题在试题题库中的分类和难度系数。实现了对试题题库中更新的试题的难度和区分度的有效评估,精确性较高,工作量小,并且基于irt模型,能真实的反映出用户的真实能力水平,实现有效评估。
所述方法还包括:根据设定条件,定时定量更新试题题库。可定时定量对试题题库进行更新,保证试题题库的新颖性和完整性。
工作步骤:
第一步、上传待更新的试题,获取试题的试题信息,其中,试题信息包括试题的试题类型,根据试题类型对应的导入格式,将待更新的试题导入至试题题库中;
第二步、根据试题题库中导入的待更新的试题文件内容,从试题题库数据库读取与待更新的试题对应的试题信息,生成知识树,将导入待更新的试题与试题题库数据库的标签库的标签进行匹配,并将匹配后的待更新的试题传送至与导入的待更新的试题相关的待审核试题数据库中;
第三步、基于试题题库数据库和待审核试题数据库,生成去重测试试题集,其中,去重测试试题集中包括待审核试题数据库中的待更新的试题和试题题库数据库中的至少一个疑重试题;
第四步、获取去重测试试题集中包含的异构数据信息,其中,异构数据信息包括:文本、图片和知识点,将异构数据信息传递到预设的语义表征计算模型,计算得到待更新的试题对应的第一语义表征和疑重试题对应的第二语义表征;
第五步、分别将第一语义表征和第二语义表征采用预设的相似度计算方法进行计算,得到待更新的试题相对于疑重试题的相似度得分,判断相似度得分是否大于预设的相似度得分阈值,若是,判定待更新的试题与疑重试题相似,删除待更新的试题,若否,判定待更新的试题与疑重试题不相似,将去重测试试题集删除,将待更新的试题加入试题题库中;
第六步、在试题题库中的预览界面中展示更新的试题,完成试题题库在线更新。
尽管已经显示和描述了本发明的实例,对于本领域的其他技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。