基于知识点间先序关系的学生认知诊断方法和装置

文档序号:32204182发布日期:2022-11-16 04:07阅读:147来源:国知局
基于知识点间先序关系的学生认知诊断方法和装置

1.本发明涉及计算机技术应用领域,尤其涉及一种基于知识点间先序关系的学生认知诊断方法和装置。


背景技术:

2.现有线上习题系统中大多以题库为基础,以练习题编号和练习题文本为主,生成一体化的习题系统。
3.但是现有方法仅将练习题编号和练习题文本描述作为练习题特征构建的考虑因素,但忽视了知识点之间的先序关系对练习题难度和练习题区分度的影响。
4.针对目前相关技术中由于现有技术对习题系统忽视了知识点之间的先序关系对练习题难度和练习题区分度的影响,导致习题系统无法有效满足用户需求的问题,目前尚未得到有效的解决。


技术实现要素:

5.本发明实施例提供了一种基于知识点间先序关系的学生认知诊断方法和装置,以至少解决相关技术中由于现有技术对习题系统忽视了知识点之间的先序关系对练习题难度和练习题区分度的影响,导致习题系统无法有效满足用户需求的问题。
6.根据本发明实施例的一个方面,提供了一种基于知识点间先序关系的学生认知诊断方法,包括:获取学习知识点的先序关系构建知识点先序关系图谱,并依据知识点先序关系图谱构建知识点间关联关系;依据知识点间关联关系获取练习题特征信息;依据目标对象标识获取对应的目标对象特征信息;依据练习题特征信息和目标对象特征信息预测目标对象的答题成绩。
7.可选的,获取学习知识点的先序关系构建知识点先序关系图谱包括:获取知识点文本内容的上下位关系和知识点关联网页;依据知识点文本内容的上下位关系和知识点关联网页获取学习知识点的先序关系;依据学习知识点的先序关系构建知识点先序关系图谱,其中,知识点先序关系图谱中每一个先序关系对表示学习知识点对应的预先掌握的知识点。
8.进一步地,可选的,依据知识点先序关系图谱构建知识点间关联关系包括:依据知识点先序关系图谱通过图注意力网络模型获取知识点间关联关系;其中,图注意力网络模型包括:两层互相独立的单头图注意力层。
9.可选的,依据知识点先序关系图谱通过图注意力网络模型获取知识点间关联关系包括:获取所有知识点的知识点特征向量;分别将每一个先序关系对中的知识点特征向量与可训练矩阵相乘,得到相乘结果;将相乘结果拼接后,拼接后的相乘结果与可训练矩阵相乘,经由激活函数,得到知识点间关联关系。
10.可选的,练习题特征信息包括:练习题难度特征向量和练习题区分度向量。
11.进一步地,可选的,依据知识点间关联关系获取练习题特征信息包括:依据知识点
先序关系图谱获取练习题难度特征向量;依据预设矩阵查找练习题中待考察的知识点,并依据待考察的知识点获取练习题区分度向量;依据练习题难度特征向量和练习题区分度向量生成练习题特征信息。
12.可选的,依据知识点先序关系图谱获取练习题难度特征向量包括:依据学习知识点的先序关系获取知识点层级,其中,获取知识点层级包括:依据知识点先序关系图谱获取第一数据集和第二数据集;其中,第一数据集为各知识点所需前序知识点集;第二数据集为学习知识点后可学习的知识点集;分别依据第一数据集和第二数据集进行计算,得到各知识点的重要度;依据各知识点的重要度得到知识点层级;依据知识点层级计算练习题难度特征向量,其中,依据知识点层级计算练习题难度特征向量包括:依据知识点层级与可训练矩阵进行计算,经由激活函数得到练习题难度特征向量。
13.可选的,依据待考察的知识点获取练习题区分度向量包括:依据预设矩阵查找练习题中待考察的知识点;将待考察的知识点与预设矩阵进行计算,并通过激活函数得到练习题区分度向量。
14.进一步地,可选的,依据目标对象标识获取对应的目标对象特征信息包括:根据目标对象的目标对象标识获取对应的独热向量;将独热向量乘以可训练矩阵,经激活函数得到目标对象的目标特征信息,其中目标特征信息包括:目标对象的知识点掌握向量。
15.根据本发明实施例的另一个方面,提供了一种基于知识点间先序关系的学生认知诊断装置,包括:第一获取模块,用于获取学习知识点的先序关系构建知识点先序关系图谱,并依据知识点先序关系图谱构建知识点间关联关系;第二获取模块,用于依据知识点间关联关系获取练习题特征信息;第三获取模块,用于依据目标对象标识获取对应的目标对象特征信息;预测模块,用于依据练习题特征信息和目标对象特征信息预测目标对象的答题成绩。
16.本发明实施例中,获取学习知识点的先序关系构建知识点先序关系图谱,并依据知识点先序关系图谱构建知识点间关联关系;依据知识点间关联关系获取练习题特征信息;依据目标对象标识获取对应的目标对象特征信息;依据练习题特征信息和目标对象特征信息预测目标对象的答题成绩。也就是说,本发明实施例能够解决了相关技术中由于现有技术对习题系统忽视了知识点之间的先序关系对练习题难度和练习题区分度的影响,导致习题系统无法有效满足用户需求的问题,从而达到了有效提升习题系统的性能的技术效果。
附图说明
17.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
18.图1为本发明实施例提供的一种基于知识点间先序关系的学生认知诊断方法的流程示意图;
19.图2为本发明实施例提供的一种基于知识点间先序关系的学生认知诊断方法中基于先序关系的练习题特征学习模型图;
20.图3为本发明实施例提供的一种基于知识点间先序关系的学生认知诊断方法中认知诊断结果分析图;
21.图4为本发明实施例提供的一种基于知识点间先序关系的学生认知诊断方法中采用的数据集cbtd和cmtd样例的示意图;
22.图5为本发明实施例提供的一种基于知识点间先序关系的学生认知诊断方法中系统框架示意图;
23.图6为本发明实施例提供的一种基于知识点间先序关系的学生认知诊断装置的示意图。
具体实施方式
24.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
25.需要说明的是,本发明的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于限定特定顺序。
26.根据本发明实施例的一个方面,提供了一种基于知识点间先序关系的学生认知诊断方法,图1为本发明实施例提供的一种基于知识点间先序关系的学生认知诊断方法的流程示意图。如图1所示,本技术实施例提供基于知识点间先序关系的学生认知诊断方法包括:
27.步骤s102,获取学习知识点的先序关系构建知识点先序关系图谱,并依据知识点先序关系图谱构建知识点间关联关系;
28.可选的,步骤s102中获取学习知识点的先序关系构建知识点先序关系图谱包括:获取知识点文本内容的上下位关系和知识点关联网页;依据知识点文本内容的上下位关系和知识点关联网页获取学习知识点的先序关系;依据学习知识点的先序关系构建知识点先序关系图谱,其中,知识点先序关系图谱中每一个先序关系对表示学习知识点对应的预先掌握的知识点。
29.本技术实施例中的知识点关联网页可以为维基百科超链接,其中,维基百科超链接指的是某一知识点的网页可链接指向的下一个知识点。
30.本技术实施例中的上下位关系包括上位词和下位词,概括性较强的单词叫做特定性较强的单词的上位词,特定性较强的单词叫做概括性较强的单词的下位词。例如(三角形,等腰三角形)。
31.其中,知识点先序关系图谱中的每一个先序关系对(i,j)表示学习知识点ki需要先掌握知识点ki,如(整式及其加减,整式的乘法)。
32.进一步地,可选的,依据知识点先序关系图谱构建知识点间关联关系包括:依据知识点先序关系图谱通过图注意力网络模型获取知识点间关联关系;其中,图注意力网络模型包括:两层互相独立的单头图注意力层。
33.可选的,依据知识点先序关系图谱通过图注意力网络模型获取知识点间关联关系包括:获取所有知识点的知识点特征向量;分别将每一个先序关系对中的知识点特征向量与可训练矩阵相乘,得到相乘结果;将相乘结果拼接后,拼接后的相乘结果与可训练矩阵相
乘,经由激活函数,得到知识点间关联关系。
34.具体的,本技术实施例中图注意力网络模型记作gat,graph attention network;在本技术实施例中采用gat模型为知识点先序关系图谱构建知识点间关联关系r(i,j)。其中,gat模型使用两层相互独立的单头图注意力层;知识点关联关系的计算过程是:首先使用embedding获取知识点i特征向量ci,知识点j采用相同步骤可得特征向量cj;分别将特征向量ci和cj与可训练矩阵wc相乘;拼接相乘后的结果并与可训练矩阵wa相乘;经由leakyrelu激活函数输出关联关系。其中,embedding方法是将知识点的one-hot向量与可训练矩阵相乘,乘积作为知识点特征(即,本技术实施例中的获取所有知识点的知识点特征向量;分别将每一个先序关系对中的知识点特征向量与可训练矩阵相乘,得到相乘结果;依据相乘结果与可训练矩阵相乘,经由激活函数,得到知识点间关联关系)。具体过程简化为公式:
35.以计算知识点ki和kj的关联关系r(i,j)为例,其计算公式为:
36.r(i,j)=leakyrelu(wa(wcci||wccj)
37.其中,ci和cj是知识点ki和kj的特征向量。
38.步骤s104,依据知识点间关联关系获取练习题特征信息;
39.可选的,练习题特征信息包括:练习题难度特征向量和练习题区分度向量。
40.进一步地,可选的,步骤s104中依据知识点间关联关系获取练习题特征信息包括:依据知识点先序关系图谱获取练习题难度特征向量;依据预设矩阵查找练习题中待考察的知识点,并依据待考察的知识点获取练习题区分度向量;依据练习题难度特征向量和练习题区分度向量生成练习题特征信息。
41.可选的,依据知识点先序关系图谱获取练习题难度特征向量包括:依据学习知识点的先序关系获取知识点层级,其中,获取知识点层级包括:依据知识点先序关系图谱获取第一数据集和第二数据集;其中,第一数据集为各知识点所需前序知识点集;第二数据集为学习知识点后可学习的知识点集;分别依据第一数据集和第二数据集进行计算,得到各知识点的重要度;依据各知识点的重要度得到知识点层级;依据知识点层级计算练习题难度特征向量,其中,依据知识点层级计算练习题难度特征向量包括:依据知识点层级与可训练矩阵进行计算,经由激活函数得到练习题难度特征向量。
42.具体的,本技术实施例中知识点层级的计算过程为:给定一个知识点d(即,本技术实施例中的),将图谱分为学习该知识点所需前序知识点集(即,本技术实施例中的第一数据集)和学习知识点d后可学习知识点集(即,本技术实施例中的第二数据集);分别计算集合和中每个知识点的对知识点d的重要度s(n,d),计算公式为:
[0043][0044]
其中,p(n,d)表示从n到d的最短有向无环路径;v
p(n,d)
表示路径p(n,d)上的知识点集;j表示以i作为其在p(n,d)上的先序知识点的相邻知识点。根据重要度s(n,d)计算知识点d的层级难度hd,计算公式为:
[0045][0046]
利用知识点层级估计练习题的难度特征。将上述步骤得到的知识点层级向量h相继与可训练矩阵wh和wb相乘(即,本技术实施例中的依据知识点层级与可训练矩阵进行计算),经sigmoid激活函数(即,本技术实施例中的激活函数)得到练习题难度特征向量f
diff
∈(0,1)k。具体公式为:
[0047]fdiff
=sigmoid(wb(wh×
h))
[0048]
可选的,依据待考察的知识点获取练习题区分度向量包括:依据预设矩阵查找练习题中待考察的知识点;将待考察的知识点与预设矩阵进行计算,并通过激活函数得到练习题区分度向量。
[0049]
具体的,根据q矩阵(即,本技术实施例中的预设矩阵)查找练习题被考察的知识点(即,本技术实施例中的待考察的知识点),将练习题被考察的知识点以one-hot向量表示xe。
[0050]
将one-hot向量xe与q矩阵向量相乘;将乘积与知识点层级向量h进行哈达玛积;随后与可训练矩阵ws相乘;经激活函数sigmoid(即,本技术实施例中的激活函数)得到练习题区分度向量f
disc
∈(0,1)k,具体公式为:
[0051][0052]
综上,如图2所示,图2为本发明实施例提供的一种基于知识点间先序关系的学生认知诊断方法中基于先序关系的练习题特征学习模型图。
[0053]
以计算知识点d的层级难度为例,其计算过程为:将图谱分为学习知识点d所需前序知识点集和学习知识点d后可学习知识点集分别计算集合和中每个知识点的对知识点d的重要度s(n,d),在集合中,需要计算{s(a,d),s(b,d),s(c,d)},在集合中,需要计算{s(e,d),s(f,d),s(g,d),s(h,d)},例如s(f,d)=(f,h)
×
r(d,h),该过程的计算公式为:
[0054][0055]
其中,p(n,d)表示从n到d的最短有向无环路径;v
p(n,d)
表示路径p(n,d)上的知识点集;j表示以i作为其在p(n,d)上的先序知识点的相邻知识点。根据重要度s(n,d)计算知识点d的层级难度hd,计算公式为:
[0056][0057]
所有知识点经上述计算得到对应的层级难度向量h。其中,若知识点为初始节点,则对应分子为0,相应的层级难度也为0;若知识点为终点,则对应公式变为:
[0058]
[0059]
因此,相应的层级难度为1。
[0060]
利用知识点层次估计练习题的难度特征。将上述步骤得到的所有知识点层级h相继与可训练矩阵wh和wb相乘,经sigmoid激活函数得到练习题的难度特征f
diff
∈(0,1)k。具体公式为:
[0061]fdiff
=sigmoid(wb(wh×
h))
[0062]
练习题区分度学习。
[0063]
根据q矩阵查找本题被考察的知识点,将其以one-hot向量表示xe。
[0064]
将one-hot向量xe与q矩阵向量相乘;将相乘结果与知识点层级h进行哈达玛积;随后与可训练矩阵ws相乘;经激活函数sigmoid得到练习题的区分度向量f
disc
∈(0,1)k,具体公式为:
[0065][0066]
步骤s106,依据目标对象标识获取对应的目标对象特征信息;
[0067]
可选的,步骤s106中依据目标对象标识获取对应的目标对象特征信息包括:根据目标对象的目标对象标识获取对应的独热向量;将独热向量乘以可训练矩阵,经激活函数得到目标对象的目标特征信息,其中目标特征信息包括:目标对象的知识点掌握向量。
[0068]
具体的,根据学生id(即,本技术实施例中的目标对象的目标对象标识)得到对应的one-hot向量xs。
[0069]
采用embedding方法将one-hot向量乘以可训练矩阵ss(即,本技术实施例中的可训练矩阵),经激活函数sigmoid得到学生的知识点掌握向量θ∈(0,1)k,具体公式为:
[0070]
θ=sigmoid(xs×ss
)
[0071]
步骤s108,依据练习题特征信息和目标对象特征信息预测目标对象的答题成绩。
[0072]
具体的,采用基于多维项目反应理论(multidimensional item response theory,mirt)模型作为学生与练习题间的交互函数。将上述步骤得到的练习题难度向量、练习题区分度向量和学生知识点掌握向量输入模型预测学生作答成绩。多维项目反应理论模型公式为:
[0073][0074]
其中,p是对当前练习日志中学生作答成绩预测。损失函数为交叉熵函数,公式为:
[0075][0076]
其中,yi是练习记录中学生作答对应练习题的真实成绩,yi的值是{0,1}。
[0077]
评价指标与预测结果
[0078]
图3为本发明实施例提供的一种基于知识点间先序关系的学生认知诊断方法中认知诊断结果分析图。如图3所示,针对模型训练过程,采用xavier初始化来初始化参数。其中,每一个采样的参数均来自于n
int
和n
out
分别表示输入和输出的神经元数量。使用adam算法优化模型。每训练完一个epoch,在测试集上进行预测。
[0079]
本技术实施例提供的基于知识点间先序关系的学生认知诊断方法从回归和分类的角度评估表现。针对回归而言,采用均方根误差(rmse)量化预测得分和实际得分间的距离,距离越接近0表示预测效果越好。针对分类而言,将学生成绩预测看作是二分类过程,即学生作答正确的得分为1,作答错误的得分为0。因此,采用roc曲线下的面积(auc)和预测精度(acc)来评价模型。表1为基于先序关系的学生认知诊断方法预测结果。mirt使用练习题编号构建练习题特征,dirt使用练习题文本描述构建练习题特征,本技术实施例提供的基于知识点间先序关系的学生认知诊断方法使用知识点先序关系构建练习题特征。与基线方法相比,本技术实施例提供的基于知识点间先序关系的学生认知诊断方法的表现最好。如图4所示,图4为本发明实施例提供的一种基于知识点间先序关系的学生认知诊断方法中采用的数据集cbtd和cmtd样例的示意图。
[0080]
表1:不同方法对学生成绩预测任务的实验结果。最好的结果用粗体标出
[0081][0082]
综上,如图5所示,图5为本发明实施例提供的一种基于知识点间先序关系的学生认知诊断方法中系统框架示意图,结合本技术实施例中的步骤s102至步骤s108,以学生练习日志数据预处理为例进行说明,数据中共有m个学生,n个练习题,k个知识点。将其分为多个练习日志,每个日志包括:学生id、练习题id、知识点id、跨模态题目内容、作答成绩。其中,跨模态题目内容包含题目的文本描述和图像;作答成绩是{0,1},若学生作答正确则为1,否则为0;知识点id表示当前练习题考察到的知识点,即q矩阵被分解至各个练习题内表示。
[0083]
本发明实施例中,获取学习知识点的先序关系构建知识点先序关系图谱,并依据知识点先序关系图谱构建知识点间关联关系;依据知识点间关联关系获取练习题特征信息;依据目标对象标识获取对应的目标对象特征信息;依据练习题特征信息和目标对象特征信息预测目标对象的答题成绩。也就是说,本发明实施例能够解决了相关技术中由于现有技术对习题系统忽视了知识点之间的先序关系对练习题难度和练习题区分度的影响,导致习题系统无法有效满足用户需求的问题,从而达到了有效提升习题系统的性能的技术效果。
[0084]
根据本发明实施例的另一个方面,提供了一种基于知识点间先序关系的学生认知诊断装置,图6为本发明实施例提供的一种基于知识点间先序关系的学生认知诊断装置的示意图。如图6所示,本技术实施例提供的基于知识点间先序关系的学生认知诊断装置包括:第一获取模块62,用于获取学习知识点的先序关系构建知识点先序关系图谱,并依据知识点先序关系图谱构建知识点间关联关系;第二获取模块64,用于依据知识点间关联关系获取练习题特征信息;第三获取模块66,用于依据目标对象标识获取对应的目标对象特征信息;预测模块68,用于依据练习题特征信息和目标对象特征信息预测目标对象的答题成绩。
[0085]
可选的,获取学习知识点的先序关系构建知识点先序关系图谱包括:获取知识点文本内容的上下位关系和知识点关联网页;依据知识点文本内容的上下位关系和知识点关联网页获取学习知识点的先序关系;依据学习知识点的先序关系构建知识点先序关系图谱,其中,知识点先序关系图谱中每一个先序关系对表示学习知识点对应的预先掌握的知识点。
[0086]
进一步地,可选的,依据知识点先序关系图谱构建知识点间关联关系包括:依据知识点先序关系图谱通过图注意力网络模型获取知识点间关联关系;其中,图注意力网络模型包括:两层互相独立的单头图注意力层。
[0087]
可选的,依据知识点先序关系图谱通过图注意力网络模型获取知识点间关联关系包括:获取所有知识点的知识点特征向量;分别将每一个先序关系对中的知识点特征向量与可训练矩阵相乘,得到相乘结果;将相乘结果拼接后,拼接后的相乘结果与可训练矩阵相乘,经由激活函数,得到知识点间关联关系。
[0088]
可选的,练习题特征信息包括:练习题难度特征向量和练习题区分度向量。
[0089]
进一步地,可选的,依据知识点间关联关系获取练习题特征信息包括:依据知识点先序关系图谱获取练习题难度特征向量;依据预设矩阵查找练习题中待考察的知识点,并依据待考察的知识点获取练习题区分度向量;依据练习题难度特征向量和练习题区分度向量生成练习题特征信息。
[0090]
可选的,依据知识点先序关系图谱获取练习题难度特征向量包括:依据学习知识点的先序关系获取知识点层级,其中,获取知识点层级包括:依据知识点先序关系图谱获取第一数据集和第二数据集;其中,第一数据集为各知识点所需前序知识点集;第二数据集为学习知识点后可学习的知识点集;分别依据第一数据集和第二数据集进行计算,得到各知识点的重要度;依据各知识点的重要度得到知识点层级;依据知识点层级计算练习题难度特征向量,其中,依据知识点层级计算练习题难度特征向量包括:依据知识点层级与可训练矩阵进行计算,经由激活函数得到练习题难度特征向量。
[0091]
可选的,依据待考察的知识点获取练习题区分度向量包括:依据预设矩阵查找练习题中待考察的知识点;将待考察的知识点与预设矩阵进行计算,并通过激活函数得到练习题区分度向量。
[0092]
进一步地,可选的,依据目标对象标识获取对应的目标对象特征信息包括:根据目标对象的目标对象标识获取对应的独热向量;将独热向量乘以可训练矩阵,经激活函数得到目标对象的目标特征信息,其中目标特征信息包括:目标对象的知识点掌握向量。
[0093]
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1