一种试题分发方法和系统与流程

文档序号:29957372发布日期:2022-05-11 08:18阅读:89来源:国知局
一种试题分发方法和系统与流程

1.本技术涉及计算机技术领域,尤其涉及智能学习应用场景中的试题分发方法和系统。


背景技术:

2.目前录播形式的在线学习过程中,所有学员会在统一安排的内容和进度框架下学习,学习反馈主要通过学员自发询问的方式。因为个人情况差异,花费相同的时间,每个学员的学习效果往往不尽相同。
3.目前的学习形式中,缺乏高效反馈和有效跟踪,也难以满足学员个性化的学习需求。同时,学员难以准确评估内容重要程度和自己薄弱点之间的关系,合理安排学习和复习的节奏。学员本身认知的局限性会导致无法正确地选择合适的学习资源,从而导致学习效率低下。因此,需要开发一种在学习过程中为不同水平的学员计算最佳试题资源,从而帮助学员有效提升学习效率的智能学习系统。


技术实现要素:

4.本技术提出一种试题分发方法和系统,解决现有技术的学习软件在反复学习时输出学习资源效率低、不能适应学员具体情况的问题。
5.一方面,本技术实施例提出一种试题分发方法,包括以下步骤:训练数据集包含多个样本的行为特征数据、试题特征数据和测试成绩;所述行为特征数据,包含对资源的访问行为的统计数据;所述试题特征数据,是用于表示试题标识或评价值的数据;根据当前学员的行为特征数据、待分发试题的特征数据,合并所述训练数据集进行回归拟合计算,得出与当前学员、待分发试题对应的测试成绩预测值;比较当前学员的多个待分发试题的测试成绩预测值,确定测试成绩预测值最大时的待分发试题。
6.优选地,所述进行回归拟合计算的步骤使用gbdt+lr模型。
7.优选地,所述行为特征数据包含以下至少一种:访问资源的时长、次数、频率、资源量。
8.优选地,所述试题特征包含以下至少一种:试题标识、真题占比、成绩统计值、难度、重要性。
9.优选地,所述测试成绩,包含用设定试题集合对所述样本进行测试的成绩值。
10.在本技术第一方面的任意一个实施例中,优选地,还包含以下步骤:比较当前学员的多个待分发试题的测试成绩预测值,按照测试成绩预测值从大到小的顺序对待分发试题进行排序。
11.进一步优选地,还包含以下步骤:所述待分发试题中,排除当前时间与当前学员上次访问时间之间的时长小于设定阈值的待分发试题。
12.第二方面,本技术还提出一种试题分发装置,用于实现本技术任意一项实施例所述方法,包含:第一模块,用于识别资源访问行为,生成行为特征数据;第二模块,用于根据当前学员的行为特征数据、待分发试题的特征数据,合并所述训练数据集进行回归拟合计算,得出与当前学员、待分发试题对应的测试成绩预测值;第三模块,用于按照测试成绩预测值的顺序访问所述资源,取得对应的待分发试题;训练数据库,用于存储所述训练数据集;所述资源包含以下至少一种:知识点数据库、试题数据库、读取所述知识点数据库和/或所述试题数据库的应用程序。
13.本技术实施例采用的上述至少一个技术方案能够达到以下有益效果:本技术的方法和系统以提高测试分数为优化目标,及时结合学员学习反馈特征、艾宾浩斯记忆曲线,对试题个性化分发器进行联合优化,为学员提供合理、高效的个性化学习路径,提高学习效率和考试分数。
附图说明
14.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:图1为本技术方法的实施例流程图;图2为本技术方法的另一实施例流程图;图3为本技术装置的实施例。
具体实施方式
15.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术具体实施例及相应的附图对本技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
16.以下结合附图,详细说明本技术各实施例提供的技术方案。
17.图1为本技术方法的实施例流程图。
18.步骤101、记录多个样本的行为特征数据、试题特征数据和测试成绩,形成训练数据集;所述行为特征数据,包含对资源的访问行为的统计数据;所述试题特征数据,是用于表示试题标识或评价值的数据;优选地,所述行为特征数据包含以下至少一种:访问资源的时长、次数、频率、资源量。所述资源包含以下至少一种:知识点数据库、试题数据库、读取所述知识点数据库和/或所述试题数据库的应用程序。
19.优选地,所述试题特征包含以下至少一种类型:试题标识、真题占比、成绩统计值、难度、重要性。
20.优选地,所述测试成绩,包含用设定试题集合对所述样本进行测试的成绩值。
21.还需要说明的是,本技术中的样本可包含当前学员和/或历史学员。所述样本的相
关数据,还可以是专用于训练的设定样本数据。
22.步骤102、根据当前学员的行为特征数据、待分发试题的特征数据,合并所述训练数据集进行回归拟合计算,得出与当前学员、待分发试题对应的测试成绩预测值;优选地,所述进行回归拟合计算的步骤使用gbdt+lr模型。
23.步骤103、比较当前学员的多个待分发试题的测试成绩预测值,确定测试成绩预测值最大时的待分发试题。
24.在本实施例中,优选地,还包含以下步骤:比较当前学员的多个待分发试题的测试成绩预测值,按照测试成绩预测值从大到小的顺序对待分发试题进行排序。
25.进一步优选地,还包含以下步骤:在所述待分发试题中,排除当前时间与当前学员上次访问时间之间的时长小于设定阈值的待分发试题;或者,相反地,在所述待分发试题中,排除当前时间与当前学员上次方位时间之间的时长大于设定阈值的待分发试题。
26.进一步优选地,在所述待分发试题中,排除当前时间与当前学员上次访问时间之间的时长小于第一设定阈值的待分发试题;并且,在所述待分发试题中,排除当前时间与当前学员上次方位时间之间的时长大于第二设定阈值的待分发试题。其中,第二设定阈值大于第一设定阈值。
27.图2为本技术方法的另一实施例流程图。
28.优选地,在训练数据集中,针对不同的试题特征数据,对学员进行分群。在每个群中,基本保证每个分群中学员的基本背景相同。通过实验组中按比例对不同的学员展示不同的题目构造训练数据,统计学员的测试成绩作为预测数据,使用loss修改后的gbdt+lr模型进行回归拟合。
29.步骤201、对题目进行聚类分析;首先对题目进行聚类,抽取题目类簇相关特征,包含试题特征的类型和试题特征值;所述试题特征的类型,如步骤101所述。
30.步骤202、提取当前学员的行为特征数据;所述行为特征数据,如步骤101所述。
31.步骤203、当前学员学习行为分析;在步骤203中,按照当前进度筛选候选试题列表,结合艾宾浩斯记忆曲线+时间过滤不满足要求试题。
32.步骤203a、根据当前学员的学习进度,确定待分发试题的范围;步骤203b、根据当前学员的访问时间,进一步确定待分发试题的范围。
33.在所述待分发试题中,排除当前时间与当前学员上次访问时间之间的时长小于设定阈值的待分发试题;或者,相反地,在所述待分发试题中,排除当前时间与当前学员上次方位时间之间的时长大于设定阈值的待分发试题。
34.进一步地,或,可选择地,在所述待分发试题中,排除任一试题特征值在设定范围内的试题。
35.例如,按照业务规则对题目进行过滤,一定时间阈值内,不能重复展示题目;再例如,难度低或真题占比低的题目限制最大展示次数;再例如,温故知新时不能展示未展示题目等等。
36.步骤204、对训练数据进行分群,确定用于所述当前学员、所述待分发试题范围的
训练数据集;用于对当前学员进行成绩预测的多个训练数据集,对应的设定样本特征值范围相同。
37.所述训练数据库包含样本特征值,所述样本特征值包含表示样本特征的数据,例如地区、年龄、性别、学历或学力等数据。在一个训练数据集中,对样本特征值进行统计,根据样本特征值对样本进行分类,取得设定样本特征值范围在全部样本中的比例。例如,来自设定地区的样本占全部样本的比例,设定年龄范围内的样本占全部样本的比例。
38.当前学员作为样本之一,也通过样本特征值进行描述。所述当前学员的行为特征数据,也可用于更新训练数据库。
39.对训练数据集进行分群,形成多个训练数据集。在每一个训练数据集中,设定样本特征值范围在每一个训练数据集的全部样本中所占的比例相同。例如,在第一训练数据集中,设定年龄范围内的样本占第一训练数据集中全部样本的比例为20%,在第二训练数据集中,设定年龄范围内的样本占第二训练数据集中全部样本的比例也为20%。
40.所述设定样本特征值范围,包含1个或多个样本特征类型,对每1个样本特征类型,包含1个或多个样本特征值范围。例如,除了年龄特征外,在第一训练数据集中,还包含来自设定地区的样本,占第一训练数据集中全部样本的比例为30%;在第二训练数据集中,还包含来自设定地区的样本,占第二训练数据集中全部样本的比例也为30%。
41.分群的每一个训练数据集,用于预测至少一种设定试题特征值范围对应的待分发试题。也就是说,每一个训练数据集,包含的试题特征数据,包含与所述多个样本对应的1个或多个试题特征类型,对每一个试题特征类型,包含1个或多个试题特征值范围。每一种试题特征类型和所述试题特征值的范围是预设的。
42.步骤205、使用至少一个训练数据集和当前学员的行为数据计算待分发试题的测试成绩预测值,同步骤101~103。
43.在步骤205中,结合学员学习进度、学习行为特征、试题本身特征,预测每道题目对测试分数的提升程度。
44.步骤206、比较当前学员的多个待分发试题的测试成绩预测值,按照测试成绩预测值从大到小的顺序对待分发试题进行排序。
45.例如,提升测试分数的程度从大到小排序,再按照顺序选择候选题目发送给学员。
46.图3为本技术装置的实施例。
47.第二方面,本技术还提出一种试题分发装置,用于实现本技术任意一项实施例所述方法,包含第一模块31、第二模块32、第三模块33、训练数据库34及资源数据库35。
48.第一模块,用于识别资源访问行为,生成行为特征数据。例如,在智能学习软件或互联网在线学习应用系统中,第一模块关联于用户应用程序模块36,通过所述第一模块对作用于用户应用程序的用户操作进行响应,识别资源访问行为,生成行为特征数据。
49.需要说明,任意用户,包括当前学员或历史学员,在学习过程中,通过带有用户操作界面的音/视频播放模块、文本或图形显示模块访问知识点数据库或试题数据库。所述资源包含以下至少一种:知识点数据库、试题数据库、读取所述知识点数据库和/或所述试题数据库的应用程序。所述资源数据库,是存储或运行所述资源的介质,任意用户对资源的访问触发所述第一模块。
50.例如,系统把学习路径的节点细分为阶段测试、章节测试、知识点视频、知识点图文、知识点试题测试五种类型,整体的优化目标为提高章节测试的分数。通过标签系统对知识点视频、知识点资料进行标记,确定表示学习顺序、重要程度、所属知识簇等特征值;对试题进行标记,确定表示重要程度、考频、难度、知识点关联性、知识点覆盖率等特征值。
51.学员在学习过程中,通过所述第一模块对学员的学习行为抽取特定的特征,作为第二模块进行成绩预测的输入。例如,预测待学习的内容为知识点试题测试,进一步地,学员做测试题的行为特征也可作为历史数据进入训练数据集,作为下一次预测的输入。
52.第二模块,用于根据当前学员的行为特征数据、待分发试题的特征数据,合并所述训练数据集进行回归拟合计算,得出与当前学员、待分发试题对应的测试成绩预测值;训练数据库,用于存储训练数据集;所述训练数据集,包含多个样本的行为特征数据、试题特征数据和测试成绩。所述测试成绩,包含用设定试题集合对所述样本进行测试的成绩值。例如,在智能学习软件或互联网在线学习应用系统中,将全部试题分组为阶段测试、章节测试等,每一个测试适用一个试题集合。
53.优选地,所述第二模块,在学员开始学习后,还用于搜集学员相关的基础信息,包含学习目标、学习时间、当前程度以及个人特征等信息。所述第二模块结合学员基础信息、学习行为特征以及艾宾浩斯记忆曲线,在实现学习的用户应用程序的运行过程中,针对当前学员,一方面调取所述资源,及时通过知识点试题测试、章节测试等方式评估的掌握程度,生成样本数据,更新训练数据库;另一方面,针对当前学员对资源数据库中的待分发试题中的候选内容进行预测打分。
54.第三模块,用于按照测试成绩预测值的大小顺序访问所述资源,取得对应的待分发试题;所述第三模块关联于用户应用程序,响应于用户的试题访问请求,构成试题个性化分发器。
55.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
56.因此,本技术还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本技术中任一实施例所述的方法。
57.进一步地,本技术还提出一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本技术任一实施例所述的方法。
58.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
59.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特
定方式工作的计算机可读存储器中,或者,装载到计算机或其他可编程数据处理设备上,实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
60.在一个典型的配置中,计算设备包括一个或多个处理器 (cpu)、输入/输出接口、网络接口和内存。
61.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (ram) 和/或非易失性内存等形式,如只读存储器 (rom) 或闪存(flash ram)。内存是计算机可读介质的示例。
62.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
63.以上所述仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1