组卷模型训练及其组卷方法、装置及计算机存储介质与流程

文档序号:25651477发布日期:2021-06-29 20:37阅读:173来源:国知局
组卷模型训练及其组卷方法、装置及计算机存储介质与流程

1.本发明实施例涉及教育互联网技术领域,尤其涉及一种组卷模型训练及其组卷方法、装置及计算机存储介质。


背景技术:

2.在自适应学习中,面临的一个迫切需求是需要根据实际的教学和学习进度生成对应的试卷以检验学生的学习成果。而组卷的需求又是会经常性地发生变化,因为学习的知识点、难度进度自身是变化的,而所组的试卷也是需要根据新的进度进行针对性的调整。这就为老师和学生带来了非常大的负担和工作量,如果在自适应学习的产品中能够为教师或学生提供一个鲁棒性强且精度高的组卷方案,将能够显著提高教师和学生的学习体验,也能显著提高自适应学习的智能化程度。
3.现有的智能组卷技术所面临的主要问题是组卷算法的精度不高,且鲁棒性较差,且大都是采用遗传算法来进行组卷,而遗传算法面临的一个主要问题就是容易陷入局部最优解。虽然也有很多方案致力于解决遗传算法的局部最优解问题,但大多数方案还是没有能够较好地解决该问题。实际上,神经网络具有极强的表征能力和高准确度等优势,但目前还没有一种组卷方案采用神经网络来生成试卷。主要的原因来自于两个方面,一个是将智能组卷的参数和组卷结果适配到神经网络上的难度较大;另一个是缺乏充足的训练数据,因为现实世界中有效的试卷数量较少,难以保证神经网络能够得到充分地学习。


技术实现要素:

4.有鉴于此,本发明实施例所解决的技术问题之一在于提供一种组卷模型训练及其组卷方法、装置及计算机存储介质,可以提升组卷结果的精度以及鲁棒性。
5.根据本发明实施例的第一方面,提供了一种组卷模型训练方法,所述方法包括:基于预设组卷策略生成多组训练组卷参数;利用遗传算法对各组所述训练组卷参数分别生成多套训练试卷;构建组卷模型,其中,所述组卷模型的输入层包括多个基于所述多组训练组卷参数对应的所述预设组卷策略构建的组卷策略神经元,所述组卷模型的输出层包括多个基于各组所述训练组卷参数分别生成的多套所述训练试卷构建的训练神经元组;以及利用所述多组训练组卷参数以及与各组所述训练组卷参数对应的多套所述训练试卷训练构建的所述组卷模型。
6.根据本发明实施例的第二方面,提供了一种组卷方法,所述方法包括:获取目标组卷参数;根据所述目标组卷参数,利用上述第一方面所述的组卷模型训练方法所训练的所述组卷神经网络模型生成多组目标组卷结果;以及基于预设筛选规则针对多组所述目标组卷结果进行筛选,并获得对应所述目标组卷参数的目标试卷。
7.根据本发明实施例的第三方面,提供了一种内储可读程序的计算机存储介质,所述计算机存储介质中存储有可完成上述第一方面所述的组卷模型训练方法的各所述步骤的指令;或所述计算机存储介质中存储有可完成上述第二方面所述的组卷方法的各所述步
骤的指令。
8.根据本发明实施例的第四方面,提供了一种组卷模型训练装置,所述装置包括:参数生成模块,用于基于预设组卷策略生成多组训练组卷参数;训练数据生成模块,用于利用遗传算法对各组所述训练组卷参数分别生成多套训练试卷;模型生成模块,用于构建组卷模型,其中,所述组卷模型的输入层包括多个基于所述多组训练组卷参数对应的所述预设组卷策略构建的组卷策略神经元,所述组卷模型的输出层包括多个基于各组所述训练组卷参数分别生成的多套所述训练试卷构建的训练神经元组;以及模型训练模块,用于利用所述多组训练组卷参数以及与各组所述训练组卷参数对应的多套所述训练试卷训练构建的所述组卷模型。
9.根据本发明实施例的第五方面,提供了一种组卷装置,所述装置包括:组卷参数获取模块,用于获取目标组卷参数;试卷生成模块,用于根据所述目标组卷参数,利用上述第四方面所述的组卷模型的训练装置所训练的所述组卷模型生成多组目标组卷结果;以及;试卷筛选模块,用于基于预设筛选规则针对多组所述目标组卷结果进行筛选,并获得对应所述目标组卷参数的目标试卷。
10.由以上技术方案可见,本发明实施例的组卷方案通过针对组卷策略生成多组训练组卷参数,并针对每一组训练组卷参数生成大量的训练试卷,为充分利用神经网络强表征、高精度的优势打下了数据基础。再者,基于遗传算法所生成的大量训练试卷,结合经过针对性设计以及适配后的组卷模型,最终构建出了一个鲁棒性强、准确度高的组卷算法方案,可以为新的组卷参数生成准确的组卷结果。
附图说明
11.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
12.图1示出了本发明的第一实施例的组卷模型训练方法的流程图;
13.图2至图7示出了图1的组卷模型训练方法的不同实施例流程图;
14.图8示出了本发明的第三实施例的组卷方法的流程图;
15.图9示出了本发明的第五实施例的组卷模型训练装置的基本架构图;以及
16.图10示出了本发明的第六实施例的组卷装置的基本架构图。
具体实施方式
17.为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获取的所有其他实施例,都应当属于本发明实施例保护的范围。
18.下面结合本发明实施例附图进一步说明本发明实施例具体实现。
19.图1示出了本发明的第一实施例的组卷模型训练方法的流程示意图。如图1所示,本发明的组卷模型训练方法主要包括以下步骤:
20.步骤s1,基于预设组卷策略生成多组训练组卷参数,接着执行步骤s2。
21.本实施例中,训练组卷参数用于生成训练试卷,组卷策略用于使得利用训练组卷参数生成的训练试卷更具针对性且能够一定程度上贴近实际的教学需求。
22.举例而言,由于教师在组卷时更倾向于出教学大纲中重要程度高的知识点的相关试题,因此可通过预设组卷策略,使得利用所生成的训练组卷参数生成训练试卷时,让重要度程高的知识点被选中的概率高于重要程度低的知识点。
23.可选的,本发明的预设组卷策略包括但不限于以下元素中的至少一个:知识点重要程度、试题难度、题型。其中,知识点重要程度用于标识试题对应的知识点在教学大纲中的重要性;试题难度用于标识试题的解题难度;题型用于标识试题的种类,例如选择题、填空题、问答题等。
24.步骤s2,利用遗传算法对各组训练组卷参数分别生成多套训练试卷,即针对每一组训练组卷参数,均利用遗传算法生成多套训练试卷。
25.本实施例中,步骤s2可基于步骤s1所生成的训练组卷参数列表向量pl,采用遗传算法针对训练组卷参数列表向量中的每一个训练组卷参数pl
m
都分别生成n套试卷。其中,本发明实施例对所选用的遗传算法不做具体限定。
26.需要说明的是,本实施例针对每一个训练组卷参数pl
m
均生成n套训练试卷,一方面可避免遗传算法一次的生成结果会陷入到局部最优解中,通过一组组卷参数生成多套试卷,然后从多套试卷中综合筛选并生成最终试卷,将能够很好地解决局部最优解的问题,即提高了最终组卷的精度;另一方面提高了后续组卷模型的鲁棒性,因为当一组组卷参数只生成一套试卷时,会使得神经网络模型的训练不够充分,而通过一组组卷参数生成多套试卷将使组卷模型训练得更为充分,从而提高了组卷模型的鲁棒性。
27.步骤s3,构建组卷模型。于本实施例中,构建组卷模型的步骤可包括有构建组卷模型(也可称为组卷神经网络模型)的输入层、隐层和输出层,其中,
28.组卷模型的输入层包括多个基于多组训练组卷参数对应的预设组卷策略构建的组卷策略神经元,使得所构建的组卷策略神经元与训练组卷参数所对应的预设组卷策略之间形成映射关系,从而提供组卷模型的输入层能够自动将预设组卷策略转化为符合其格式要求的参数值。
29.组卷模型的输出层包括多个基于各组训练组卷参数分别生成的多套训练试卷构建的训练神经元组,使得所构建的各训练神经元组与各套训练试卷形成一一对应,也就是每一个训练神经元组代表一套训练试卷,从而确保组卷模型能够针对一组训练组卷参数所生成的多套训练试卷中的每一套进行学习,且由于是在同一组卷模型(即神经网络)中进行学习,因此能够提高组卷结果的鲁棒性。
30.组卷模型的隐层主要用于基于训练数据的训练结果进行针对性调整。可采用各种现有技术构建组卷模型的隐层,在本发明中不做明确的限制。
31.由上可知,本发明通过针对现有组卷模型(即神经网络)的输入层和输出层进行调整,以使其能够很好地匹配单输入以及多输出的形式(即单组训练组卷参数的输入以及多套训练试卷的输出),能够为后续构建精度高且鲁棒性强的组卷模型打下基础。
32.步骤s4,利用多组训练组卷参数以及与各组训练组卷参数分别对应的多套训练试卷训练构建的组卷模型,也就是将所有训练组卷参数的组卷结果的集合d=(d1,d2,

,d
m
),
输入到步骤s3所生成的组卷模型中,从而提供组卷模型学习各组训练组卷参数以及与各组训练组卷参数分别对应的多套训练试卷之间的内在联系,从而构建一个鲁棒性更强且精度更高的组卷模型。
33.请继续参阅图2,于一可选实施例中,上述步骤s1,即基于预设组卷策略生成多组训练组卷参数还包括以下步骤:
34.步骤s11,基于预设组卷策略生成第一组训练组卷参数,接着执行步骤s12。
35.本实施例中,第一组训练组卷参数可包含有预设组卷策略中一个或者多个元素对应的参数。
36.以下以第一组训练组卷参数包含有预设组卷策略中三个元素对应的参数为例进行进一步的说明。如图3所示,上述步骤s11还进一步包括以下步骤:
37.步骤s111,基于预设组卷策略中的第一元素随机生成第一元素向量列表,并基于第一元素向量列表生成第一单元组卷参数列表,其中,第一元素向量列表包含有第一元素中的多个第一子元素以及对应各第一子元素的不同赋值。
38.可选的,基于预设组卷策略中的第一元素随机生成第一元素向量列表,并基于第一元素向量列表生成第一单元组卷参数列表可包括:基于第一元素随机生成第一元素向量列表,并基于第一单元组卷参数列表中所需的参数个数以及第一元素向量列表生成与第一单元组卷参数列表中所需的参数个数对应的参数列表作为第一单元组卷参数列表。此处,第一单元组卷参数列表中所需的参数个数的确定可以在第一元素向量列表的生成过程之前,也可以在其之后,本发明实施例不做具体限定。
39.举例而言,当第一元素为“知识点重要程度”时,首先可随机生成知识点重要程度向量列表,并表示为a=(a1,a2,

,a
k
,

,a
k
),其中,k为向量列表中的向量个数,即知识点的总个数,k表示第k个知识点,a
k
(即第一子元素)用于指示第k个知识点对应的重要程度,取值范围可为0到1(即第一子元素的参数赋值),取值越大表示越重要。然后,可基于知识点重要程度向量列表a=(a1,a2,

,a
k
,

,a
k
),随机生成知识点列表,即第一单元组卷参数列表,表示为其中,kl1表示第一次随机生成的知识点列表,用于标识第m1个随机生成的知识点;m1为第一次随机生成知识点列表中的知识点个数。通过调整m1的值,可满足在每次组卷时用户所选择的知识点数量会存在差异的组卷需求。
40.上述随机生成知识点列表的具体过程为:首先,随机生成第一次组卷的总的知识点个数m1,取值范围为1到k之间;而后,基于知识点重要程度向量列表a=(a1,a2,

,a
k
,

,a
k
)随机生成m1个不重复的知识点,组成第一次组卷的知识点列表其中,为了避知识点列表中的知识点重要程度赋值较为接近,可采用诸如轮盘赌的任一随机算法随机生成m1个不重复的知识点。
41.步骤s112,基于预设组卷策略中的第二元素随机生成第二元素向量列表,并基于第二元素向量列表生成第二单元组卷参数列表,其中,第二元素向量列表包含有第二元素中的多个第二子元素以及对应各第二子元素的不同赋值。
42.可选的,基于预设组卷策略中的第二元素随机生成第二元素向量列表,并基于第二元素向量列表生成第二单元组卷参数列表可包括:基于第二元素随机生成第二元素向量
列表,并基于第二单元组卷参数列表中所需的参数个数以及第二元素向量列表生成与第二单元组卷参数列表中所需的参数个数对应的参数列表作为第二单元组卷参数列表。此处,第二单元组卷参数列表中各第二子元素的参数赋值之和为1。
43.举例而言,当第二元素为“试题难度”时,可生成试题难度比例向量列表,表示为dl1=(dl
11
,dl
12
,dl
13
,dl
14
,dl
15
),若将试题难度分为5个级别,则可分别使用1、2、3、4、5(即第二子元素)表示不同的难度值,难度值越大表示难度越高。此处,试题难度的级别也可根据实际需求设置为5个级别以上或以下,本发明实施例不做具体限定。
44.具体生成过程可包括:首先,针对难度1,生成一个0到1的小数dl

11
(即第二子元素的参数赋值)。然后,重复难度1的生成过程,依次生成难度2、难度3、难度4和难度5对应的小数:dl

12
,dl

13
,dl

14
,dl

15
,其中,可采用随机算法随机生成难度2、难度3、难度4和难度5对应的小数。接着,针对生成的5个小数dl

11
,dl

12
,dl

13
,dl

14
,dl

15
按照下列公式进行归一化处理,具体表示为:
45.经过上述的归一化处理之后,使得5个归一化的值dl
1k
之和相加能够为1,以保证最终生成的难度比例列表dl1=(dl
11
,dl
12
,dl
13
,dl
14
,dl
15
)与实际组卷需求更为相近。例如,当dl
11
=0.2,dl
12
=0.4,dl
13
=0,dl
14
=0.3,dl
15
=0.1时,表示在最终生成的试卷中,需要让难度为1的试题所占的比例为20%;难度为2的试题所占的比例为40%;难度为3的试题所占的比例为0%;难度为4的试题所占的比例为30%;难度为5的试题所占的比例为10%。
46.步骤s113,基于预设组卷策略中的第三元素随机生成第三元素向量列表,并基于第三元素向量列表生成第三单元组卷参数列表,其中,第三元素向量列表包含有第三元素中的多个第三子元素以及对应各第三子元素的不同赋值。
47.可选的,基于预设组卷策略中的第三元素随机生成第三元素向量列表,并基于第三元素向量列表生成第三单元组卷参数列表可包括:基于第三元素随机生成第三元素向量列表,并基于第三单元组卷参数列表中所需的参数个数以及第三元素向量列表生成与第三单元组卷参数列表中所需的参数个数对应的参数列表作为第三单元组卷参数列表。此处,第三单元组卷参数列表中各第三子元素的参数赋值可在预设的阈值范围的随机生成,或者也可指定各第三子元素的参数赋值。
48.举例而言,当第三元素为“题型”时,则可生成各题型的试题数量向量列表tl1=(tl
11
,tl
12
,tl
13
,tl
14
),其中,tl
11
,tl
12
,tl
13
,tl
14
为第三子元素,并可采用随机算法随机生成各题型的试题数量向量列表。
49.在实际组卷中,可根据组卷需求预先设置试卷中每种题型的试题数量,例如设置选择题、填空题、判断题和问答题的数量。题型的种类可以不限于这四种,由于上述四类题型属于当前试卷中最常见的题型,因此,为了使得组卷结果更能符合教师的实际组卷需求,也为了本发明技术方案描述的清晰性,下面仅以四种题型为例进行介绍。各题型的试题数量向量列表具体生成过程如下:
50.首先,针对第一种题型,可从该题型对应的试题数量范围阈值中,例如从0到40之间,随机确定一个整数tl
11
作为第一种题型的数量要求(即第三子元素的参数赋值)。需要说
明的是,40的阈值上限可以基于实际情况进行针对性调整,例如放大或者缩小,用于表示第一种题型最多能出的试题数量。同样的,0的阈值下限也可以基于实际情况进行调整,例如调整为10,用于表示第一题型的试题数量最少为10题。
51.接着,类似于第一种题型的试题数量生成步骤,依次生成第二种题型、第三种题型、第四种题型对应的试题数量:tl
12
,tl
13
,tl
14

52.然后,基于所生成的tl
11
,tl
12
,tl
13
,tl
14
,获得各题型的试题数量列表tl1=(tl
11
,tl
12
,tl
13
,tl
14
)。
53.步骤s114,将第一单元组卷参数列表、第二单元组卷参数列表、与第三单元组卷参数列表进行整合,生成包含第一元素、第二元素和第三元素的第一组训练组卷参数。
54.可选的,可基于简单拼接方式,将kl1,dl1,和tl1进行拼接,生成第一组训练组卷参数,其表示为:pl1=(kl1,dl1,tl1)。
55.继续参考图2,在执行完步骤s11之后继续执行步骤s12,以重复第一组训练组卷参数的生成过程,获得预设组卷策略的多组训练组卷参数。
56.具体而言,通过重复执行上述步骤s11,生成预设组卷策略的多组训练组卷参数,并基于所生成的多个训练组卷参数,获得训练组卷参数列表向量,可表示为:pl=(pl1,pl2,...,pl
m
)。其中,m值越大,最终利用组卷模型的组卷结果的精度和鲁棒性就越高。因为m值越大,代表所生成的训练试卷的样本数量就越多,涵盖的范围就越广,考虑到的可能性就越多。即参与训练的训练试卷的样本数量就越多、越全,后续组卷模型的训练就越为充分,使得组卷模型的精度和鲁棒性都能得到进一步的提升。
57.如图4所示,于一可选实施例中,上述步骤s2,即利用遗传算法对各组所述训练组卷参数分别生成多套训练试卷还进一步包括以下步骤:
58.步骤s21,针对第一组训练组卷参数生成第一套训练试卷。
59.请配合参阅图5,于一可选实施例中,步骤s21还进一步包括:
60.步骤s211,根据第一组训练组卷参数随机生成初始试卷种群。
61.可选的,可提取第一组训练组卷参数pl1,并针对训练组卷参数pl1生成一初始试卷种群。
62.步骤s212,对生成的初始试卷种群依次执行交叉操作和变异操作,得到更新试卷种群。
63.可选的,可采用交叉操作针对初始试卷种群中进行交叉操作,以更新初始试卷种群,而生成中间试卷种群,接着,采用变异操作针对所生成的中间试卷种群执行变异操作,以针对中间试卷种群进行再次更新,得到更新试卷种群。
64.步骤s213,重复上述的交叉操作与变异操作,而针对更新试卷种群进行迭代更新直至收敛,并从最终的更新试卷种群中选取适应度值最大的个体作为第一组训练组卷参数的第一套训练试卷。
65.本实施例中,在收敛后,可停止遗传算法过程,并从更新试卷种群中选择出适应度值最大的个体,作为第一组训练组卷参数pl1的第一套训练试卷tp
11
。其中,tp
11
为筛选出的试题序号的列表(试题序号是指各试题在试题库中的序号)。
66.举例而言,tp
11
=(1,8,20,40,100,700,1000,2001)时,表示本次组卷选择的试题分别是试题序号为1、8、20、40、100、700、1000、2001的这8道题。
67.可选的,可通过设定最大迭代次数,当达到设定的迭代次数时,则判断收敛;或者,可通过设定适应度变化阈值范围,当前后两次迭代的适应度值变化范围在设定的适应度变化阈值范围之内时,则判断收敛。
68.可选的,可通过判断训练组卷参数与基于训练组卷参数生成的训练试卷所对应的实际组卷参数之间的相似程度,而获得适应度值。
69.可选的,上述适应度值的计算方法例如为:计算一组训练组卷参数与对应该组训练组卷参数的多套训练试卷中的每一套训练试卷对应的实际组卷参数之间的相似程度,相似程度越高则适应度值越大,即代表所生成的训练试卷的精确度越高,越符合实际的组卷需求。
70.请继续参考图4,在执行完步骤s21之后继续执行步骤s22,重复上述第一组训练组卷参数的第一套训练试卷的生成过程,得到第一组训练组卷参数pl1的多套训练试卷,可使用一个二元组来表示第一组训练组卷参数pl1的组卷结果:d1=(pl1,(tp
11
,tp
12
,

,tp
1n
)),其中,tp
1n
为第一组训练组卷参数pl1的第n套训练试卷。
71.步骤s23,重复上述第一组训练组卷参数pl1的多套训练试卷的生成过程,得到每一组训练组卷参数的多套训练试卷,可将其表示为:d
m
=(pl
m
,(tp
m1
,tp
m2
,

,tp
mn
))。
72.而后,即可基于步骤s23,得到pl中所有训练组卷参数的组卷结果的集合,其表示为:d=(d1,d2,

,d
m
)。集合d能够避免遗传算法陷入局部最优解的问题,且能够为后续的组卷模型提供更为充足、更为精确的组卷结果数据,保证了组卷模型的鲁棒性和精确性(请容后详述)。
73.可选的,请配合参考图6,上述步骤s3构建组卷模型的步骤还进一步包括构建组卷模型的输入层的子步骤,即可基于预设组卷策略中的每种元素,构建一组卷策略神经元;根据每种元素中各子元素对应的赋值,设置对应的组卷策略神经元的参数值,其可包括:
74.步骤s311,基于预设组卷策略中的第一元素构建多个第一组卷策略神经元,基于预设组卷策略中的第二元素构建多个第二组卷策略神经元,以及基于预设组卷策略中的第三元素构建多个第三组卷策略神经元。
75.步骤s312,获取第一元素中的各第一子元素对应的各个赋值,据以设定各第一组卷策略神经元的参数值,获取第二元素中的各第二子元素对应的各个赋值,据以设定各第二组卷策略神经元的参数值,以及获取第三元素中的各第三子元素对应的各个赋值,据以设定各第三组卷策略神经元的参数值。
76.如上在步骤s3中所描述的,所构建的组卷策略神经元可与训练组卷参数所对应的预设组卷策略之间形成映射关系,因此,在本实施例中,依照图3实施例所示的预设组卷策略中包括有三个元素(即“知识点重要程度”,“试题难度”,以及“题型”)为例进行进一步的说明,需要说明的是,输入层的组卷策略神经元的构建步骤并不下述为限,其可依照预设组卷策略的实际确定而进行相应调整。
77.于本实施例中,构建组卷模型的输入层的子步骤可包括:
78.构建知识点分布神经元,例如,若总共有k个知识点,则可构建k个知识点分布神经元,其中,每个知识点分布神经元代表一个知识点,而各个知识点对应的知识点分布神经元的取值可依据每一个训练组卷参数中的知识点列表kl
m
中是否包括该知识点来确定。
79.举例而言,当针对第m组训练组卷参数进行训练时,如果kl
m
中含有知识点a1,则知
识点a1所对应的知识点分布神经元的取值为1;如果kl
m
中不含有知识点a1,则知识点a1所对应的知识点分布神经元的取值为0。基于此原则,即可将训练组卷参数中的知识点列表转换成组卷模型的输入层的知识点分布神经元的相应取值。
80.构建试题难度分布神经元。例如,若总共有5个难度,可构建5个难度分布神经元,每个难度分布神经元代表某一个难度。而每个难度分布神经元的取值方法类似于步骤311,可依据每一个训练组卷参数中的dl
m
中各个难度的具体比例,直接将其中的比例赋值给对应难度分布神经元即可。
81.构建题型数量分布神经元。例如,若包括四类题型的话,则针对每类题型可构建一个题型数量分布神经元。而每个题型数量分布神经元的具体取值依据训练组卷参数中的tl
m
来决定。
82.通过上述手段,使得所构建的组卷策略神经元与训练组卷参数所对应的预设组卷策略之间形成了映射关系,从而提供组卷模型的输入层能够自动将预设组卷策略转化为组卷模型可理解的输入(即转化为符合组卷模型的输入层的格式要求的参数值),从而确保后续能够针对输入的训练试卷进行学习。
83.可选的,请配合参考图7,于上述步骤s3构建组卷模型的步骤中,还可包括构建组卷模型的输出层(manypapersnn)的子步骤,具体包括:
84.步骤s331,针对第一套训练试卷生成一个训练神经元组,其中,训练神经元组中包含有多个训练神经元及对应各训练神经元的不同赋值,其中,各训练神经元的赋值对应于训练试卷中各试题在试题库中的试题序号。
85.可选的,可根据预设的试卷试题数量,针对第一套训练试卷构建与试题数量相同的训练神经元,例如构建100个训练神经元,即表示第一套训练试卷中会包括100个试题。
86.可选的,对每个训练神经元的取值方式包括:依据第一套训练试卷tp
*1
中的试题序号(即试题在试题库中的序号)对训练神经元进行赋值。举例而言,当tp
*1
=(1,8,20,40,100,700,1000,2001)时,则第一个神经元取值为1,第二个神经元取值为8,第三个神经元取值为20,以此类推。若训练神经元的数量为100个,由于tp
*1
中只包括了8个试题序号,即仅有8个神经元根据tp
*1
进行了赋值,,可直接将未被赋值的92个神经元的值置为0。
87.步骤s332,重复上述针对第一套训练试卷生成一个训练神经元组的步骤,获得多套训练试卷的多个训练神经元组以及对各个训练神经元组中的各个训练神经元进行赋值。
88.步骤s333,基于预设的拼接规则,拼接各个训练神经元组中的各个训练神经元,拼接后的所有训练神经元即为组卷模型的输出层。其中,拼接规则不限。例如,为快速实现拼接,可将训练神经元的向量进行首尾拼接即可。
89.通过上述技术手段,使得所构建的各训练神经元组与各套训练试卷形成一一对应,使得组卷模型能够充分学习每一套训练试卷,从而提高组卷模型的鲁棒性。
90.可选的,还可以设置神经网络目标函数,用于评估一组训练组卷参数的多套训练卷中各试题的重要性,从而进一步优化组卷模型的组卷结果的精确性。
91.具体而言,若某道试题在n组训练试卷中都出现了,则表明该道试题的重要程度很高,也表面这道试题与训练组卷参数的关联性非常强;反之,如果某道试题在n组训练试卷中出现的次数非常少,则说明这道试题的重要程度相对较低。为了充分考虑不同训练试卷之间的信息流通,以及充分考虑n组训练试卷之间的彼此联系,可通过神经网络目标函数综
合衡量试题重要性。。
92.可选的,神经网络目标函数可表示为:
93.其中,w为网络权重参数,其中,w的初始值可为随机设置,并在组卷模型的训练过程中,利用反向传播算法针对w的参数值进行迭代更新,当组卷模型的训练结束时,w的最后更新值即为最终值。
94.另外,q
ij
表示在第i套训练试卷中的第j道试题;qi
ij
表示试题q
ij
在与一组训练组卷参数对应的多套训练试卷中的出现率,计算方法为n套试卷中试题q
ij
的出现次数除以n。其中,出现率越高,则代表试题q
ij
的重要性越高。
95.此外,index(tp
mi
,q
ij
)为试题q
ij
是否在训练试卷tp
mi
中出现的指示函数,出现为0,没有出现为1。本发明实施例中基于试题重要性所设计的神经网络目标函数能够综合考虑基于一组训练组卷参数的多套训练卷中各试题的重要性,使得在组卷模型在训练过程中,能够优先考虑重要的试题,即生成的训练试卷重点考虑重要试题,进一步提高了组卷结果的精度和鲁棒性。
96.本发明的第二实施例提供一种计算机存储介质,计算机存储介质中存储有用于执行上述第一实施例中组卷模型训练方法的各步骤的指令。
97.请继续参阅8,本发明的第三实施例还提供了一种组卷方法,基于上述组卷模型训练方法构建的组卷模型进行组卷,其具体包括:
98.步骤s81,获取目标组卷参数,利用第一实施例构建的组卷模型根据目标组卷参数生成多组目标组卷结果。
99.步骤s82,基于预设筛选规则针对多组目标组卷结果进行筛选,并获得对应目标组卷参数的目标试卷。
100.本发明一可选实施例中,基于预设筛选规则针对多组目标组卷结果进行筛选的规则可以为:
101.统计多组目标组卷结果中各目标组卷结果重复出现的次数,分析各目标组卷结果的统计次数;以及若存在统计次数最多的一组目标组卷结果,则将一组目标组卷结果作为目标试卷;若存在统计次数相同的至少二组目标组卷结果,则从至少二组目标组卷结果中选取适应度值最大的一组目标试卷结果以作为目标试卷;若至少二组目标组卷结果的适应度值相同,则从至少二组目标组卷结果中随机选择一组目标试卷结果以作为目标试卷。
102.举例而言,可首先统计n组试卷(即多组目标组卷结果)中各组试卷(即目标组卷结果)重复出现的次数,将重复出现次数最多的试卷作为本次组卷的最终输出,因为试卷重复次数多,说明在该组目标组卷参数下,该组试卷出现的概率最大,从统计上来说,组卷模型认为该组试卷的重要性会比较大;如果出现统计次数相同的若干组试卷,则计算各自的适应度值,适应度值越大,表明重要性越高;若适应度值也相同,则从中随机挑一组即可。需说明的是,预设的筛选规则并不以上述为限,亦可根据实际需求而采用其他筛选规则。
103.本发明的第四实施例提供一种计算机存储介质,计算机存储介质中存储有用于上述第三实施例中组卷方法的各步骤的指令。
104.请继续参考图9,本发明的第五实施例提供了一种组卷模型训练装置100,主要包括参数生成模块120,训练数据生成模块130,模型生成模块140,和模型训练模块150,其中,
105.参数生成模块120用于基于预设组卷策略生成多组训练组卷参数。
106.训练数据生成模块130用于利用遗传算法对各组训练组卷参数分别生成多套训练试卷。
107.模型生成模块140用于构建包含输入层、隐层与输出层的组卷模型110,本实施例中,组卷模型110的输入层包括多个基于多组训练组卷参数对应的预设组卷策略构建的组卷策略神经元,组卷模型110的输出层包括多个基于各组训练组卷参数分别生成的多套训练试卷构建的训练神经元组。
108.模型训练模块150用于利用多组训练组卷参数以及与各组训练组卷参数分别对应的多套训练试卷训练所构建的组卷模型。
109.可选的,训练数据生成模块130还用于针对第一组训练组卷参数生成第一套训练试卷;并重复第一套训练试卷的生成过程,得到第一组训练组卷参数的多套训练试卷;再重复针对第一组训练组卷参数的多套训练试卷的生成过程,得到每一组训练组卷参数的多套训练试卷;且其中,针对第一组训练组卷参数生成第一套训练试卷还包括:根据第一组训练组卷参数随机生成初始试卷种群;对初始试卷种群依次执行交叉操作和变异操作,得到更新试卷种群;以及重复交叉操作与变异操作,对更新试卷种群进行迭代更新直至收敛,并从更新试卷种群中选取适应度值最大的个体作为训练组卷参数的第一套训练试卷。
110.可选的,预设组卷策略包括以下元素中的至少一个:知识点重要程度、试题难度、题型。
111.可选的,参数生成模块120还用于生成预设组卷策略的第一组训练组卷参数;以及重复第一组训练组卷参数的生成过程,获得预设组卷策略的多组训练组卷参数;且其中,生成预设组卷策略的第一组训练组卷参数的步骤还包括:基于预设组卷策略中的第一元素随机生成第一元素向量列表,并基于第一元素向量列表生成第一单元组卷参数列表,其中,第一元素向量列表包含有第一元素中的多个第一子元素以及对应各第一子元素的不同赋值,基于预设组卷策略中的第二元素随机生成第二元素向量列表,并基于第二元素向量列表生成第二单元组卷参数列表,其中,第二元素向量列表包含有第二元素中的多个第二子元素以及对应各第二子元素的不同赋值;并整合第一单元组卷参数列表与第二单元组卷参数列表,生成包含第一元素和第二元素的第一组训练组卷参数。
112.可选的,参数生成模块120还用于基于预设组卷策略中的第一元素构建多个第一组卷策略神经元,以及基于预设组卷策略中的第二元素构建多个第二组卷策略神经元,以及获取第一元素中的各第一子元素的各赋值,作为各第一组卷策略神经元的设定值,以及获取第二元素中的各第二子元素的各赋值,作为各第二组卷策略神经元的设定值。
113.可选的,参数生成模块120还用于针对第一套训练试卷生成一个训练神经元组,其中,训练神经元组包含多个训练神经元及对应各训练神经元的不同赋值,各训练神经元的各赋值对应于训练试卷中各试题在试题库中的序号,重复针对第一套训练试卷生成一个训练神经元组的步骤,获得多套训练试卷的多个训练神经元组以及各训练神经元组中的各训练神经元的不同赋值,以及基于预设的拼接规则,拼接各训练神经元组中的各训练神经元,生成组卷模型的输出层。
114.可选的,模型生成模块140还用于设置神经网络目标函数,其中,神经网络目标函数表示为:
115.其中,w为网络权重参数;q
ij
表示在第i套训练试卷中的第j道试题;qi
ij
表示试题q
ij
对应于一组训练组卷参数的多套训练试卷中的出现率;index(tp
mi
,q
ij
)为试题q
ij
是否在训练试卷tp
mi
中出现的指示函数。
116.此外,本实施例的组卷模型训练装置还可用于实现前述组卷模型训练方法中的其他步骤,并具有相应的方法步骤实施例的有益效果,在此不再赘述。
117.请参考图10,本发明的第六实施例还提供一种组卷装置200,其包括组卷参数获取模块210、试卷生成模块220、试卷筛选模块230,其中,
118.组卷参数获取模块210,用于获取目标组卷参数;
119.试卷生成模块220,用于根据目标组卷参数,利用第五实施例中的组卷模型的训练装置所训练的组卷模型生成多组目标组卷结果;以及;
120.试卷筛选模块230,用于基于预设筛选规则针对多组目标组卷结果进行筛选,并获得对应目标组卷参数的目标试卷。
121.可选的,试卷筛选模块230还用于统计多组目标组卷结果中各目标组卷结果重复出现的次数,分析各目标组卷结果的统计次数;以及若存在统计次数最多的一组目标组卷结果,则将一组目标组卷结果作为目标试卷;若存在统计次数相同的至少二组目标组卷结果,则从至少二组目标组卷结果中选取适应度值最大的一组目标试卷结果以作为目标试卷;若至少二组目标组卷结果的适应度值相同,则从至少二组目标组卷结果中随机选择一组目标试卷结果以作为目标试卷。
122.综上所述,本发明所设计的组卷参数生成机制,能够很好地模拟实际用户组卷参数,并且能够一定程度反映出实际组卷业务场景,使得生成的组卷参数更具针对性且能够一定程度上贴近实际的教学需求。
123.另外,本发明能够针对一组组卷参数生成多组组卷结果,再针对多个组卷结果进行综合筛选处理,从而获得最终组卷结果,不仅避免了目前遗传算法的一次生成结果容易导致局部最优解的问题,以提高最终组卷结果的精度;还能提高智能组卷模型的鲁棒性。
124.需要指出,根据实施的需要,可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。
125.上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如cd rom、ram、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如asic或fpga)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,ram、rom、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现
在此描述的组卷模型训练方法及组卷方法。此外,当通用计算机访问用于实现在此示出的组卷模型训练方法及组卷方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的组卷模型训练方法及组卷方法的专用计算机。
126.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。
127.以上实施方式仅用于说明本发明实施例,而并非对本发明实施例的限制,有关技术领域的普通技术人员,在不脱离本发明实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明实施例的范畴,本发明实施例的专利保护范围应由权利要求限定。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1