一种基于提示技术的跨领域认知诊断方法

文档序号:40229375发布日期:2024-12-06 16:50阅读:44来源:国知局
一种基于提示技术的跨领域认知诊断方法

本发明属于智慧教育的认知诊断领域,具体来说是一种基于提示技术的跨领域认知诊断方法。


背景技术:

1、在智慧教育领域中,认知诊断起着基础性的作用,它为练习推荐和学习指导提供了基础。在认知诊断中,学生和练习表征对于获得学生的认知状态是必不可少的。因此,核心的挑战在于获得高质量的学生和练习表征。随着深度学习技术的蓬勃发展,人们已经做出了很大的努力来设计学习这些嵌入的复杂模型。例如,神经认知诊断模型(ncdm)设置了学生和练习嵌入的维度,以对应于知识点的数量。在交互过程中,ncdm 利用利用练习与知识点的关联矩阵(q 矩阵)进行对准。基于关系图的认知诊断模型(rcd)构造了一个包含学生、练习和知识概念的多层图形结构,以获得它们的嵌入。然后它结合了诊断和预测模块来捕捉这三个实体之间的相互作用,促进认知诊断。

2、尽管现有研究取得了重大成果,但迄今为止开发的大多数模型都是基于特定领域的。这些模型假设练习和知识点都来自同一个科目,学生来自特定的地区或学校。然而,这些假设限制了模型在实际应用中的普遍性。在现实世界的场景中,当遇到一个新的科目或来自不同学校的一组新学生(称为新领域)时,需要对模型进行再训练以使其适用。然而,如果在这个新领域的数据是稀少的,再训练的过程便会变得具有挑战性。因此,跨领域认知诊断是一个具有挑战性和前景的研究方向,在智能教育领域具有重要的实用价值。

3、然而,目前只有少数研究涉及跨域认知诊断模型。其中一项研究是 techcd,它提出了一种在冷启动场景中使用可转移知识概念图嵌入的跨领域认知诊断方法。另一种方法zerocd 通过利用一批早期参与的学生数据来解决这一挑战。然而,techcd 方法计算成本较高,难以适用于实时或大规模场景,且对高质量知识概念图的依赖较大,数据不完整或不准确时会严重影响算法效果。zerocd 方法中,模拟日志的质量依赖于早期学生行为的可靠性,如果行为数据存在噪音或偏差,可能会误导后续的认知诊断。因此,如何利用源领域学生的历史答题记录,准确评估目标领域学生对知识点的掌握程度及答题预测,仍是值得深入研究的问题。


技术实现思路

1、本发明为了克服现有技术的不足之处,提出了一种基于提示技术的跨领域认知诊断方法,旨在解决现有认知诊断模型在跨领域场景中表现不佳的问题,通过建立源领域和目标领域之间的联系,促进从源领域学习到的学生和练习特征向目标领域的转移,从而能提高跨领域诊断的准确性。

2、本发明为达到上述发明目的,采用如下技术方案:

3、本发明一种基于提示技术的跨领域认知诊断方法的特点在于,是按如下步骤进行:

4、步骤1、构造跨域数据;

5、定义源领域集合和目标领域,其中,表示第个源领域,表示源领域的数量;

6、定义上的学生集合为、习题集合为、知识点集合为;其中,中的任一学生记为,中的第个习题记为,中的第个知识点记为;且每个源领域之间的习题不相同;

7、定义目标领域上的学生集合为、习题集合为、知识点集合为;其中,中的任一学生记为,的第个习题记为,中的第个知识点记为;且源领域集合s与目标领域t之间的习题不相同;

8、利用式(1)得到源领域集合和目标领域之间的重叠学生集合,并将中第个学生记为:

9、    (1)

10、定义源领域上的预训练数据集为三元组集合,其中,中的任意一个三元组表示对的答题结果,若,表示正确回答,,表示其他情况;

11、从中随机抽取一定比例学生所对应的答题数据作为微调数据集;其中,中的任意一个三元组表示对的答题结果,若,表示正确回答,,表示其他情况;

12、将上习题与知识点的关系矩阵记为,其中,令中第行向量表示与上每个知识点的相关关系,其中,1或0分别表示与相关或不相关;表示中的习题数量,表示中的知识点数量;

13、将上习题与知识点的关系矩阵记为,其中,令中第行向量表示与上每个知识点的相关关系,其中,1或0分别表示与相关或不相关;表示中的习题数量,表示中的知识点数量;

14、步骤2、构建带有软提示的源领域认知诊断模型,并对在上的原始嵌入和的原始嵌入进行处理,得到在上对的预测答题结果,从而构建二分类交叉熵损失,用于训练所述源领域认知诊断模型,并得到在任一源领域上的最优个性化提示和中所有习题的最优共享提示最优;

15、步骤3、构建带有软提示的目标领域认知诊断模型,并对和进行处理,得到在上对的预测答题结果,从而构建在上对的二分类交叉熵损失,用于训练目标领域认知诊断模型,以实现学生的练习推荐和知识追踪。

16、本发明所述的基于提示技术的跨领域认知诊断方法的特点也在于,所述步骤2是按如下步骤进行:

17、步骤2.1、通过式(3)分别得到在上的复合表征以及的复合表征:

18、     (3)

19、式(3)中,表示在任一源领域上的个性化提示,表示中所有习题的共享提示,和分别表示通过随机初始化得到的在上的原始嵌入和的原始嵌入;表示向量的水平拼接;

20、步骤2.2、通过式(4)分别得到在上的最终表征以及的最终表征:

21、  (4)

22、式(4)中,表示在源领域上针对个性化提示的线性层,表示在源领域上针对共享提示的线性层;

23、步骤2.3、通过式(5)得到在上对的预测答题结果:

24、(5)

25、式(5)中,表示表示基于学生和习题表征预测答题结果的交互函数;

26、步骤2.4、通过式(6)构建在上对的二分类交叉熵损失:

27、(6)

28、式(6)中,是在上对的真实答题结果;

29、步骤2.5、通过式(7)构建源领域认知诊断模型对所有源领域的目标函数:

30、(7)

31、步骤2.6、基于源领域的所有预训练数据集,利用adam优化器对源领域认知诊断模型进行训练,以更新模型的参数,直至目标函数收敛为止,从而得到训练成后源领域认知诊断模型及在任一源领域上的最优个性化提示和中所有习题的最优共享提示最优。

32、进一步的,所述步骤3是按如下步骤进行:

33、步骤3.1、通过式(8)得到在目标领域上的个性化提示:

34、(8)

35、步骤3.2、通过式(9)得到目标领域中的所有习题对应的共享提示:

36、(9)

37、式(9)中,表示源领域中共享提示的垂直拼接操作,表示一个维度为的行向量;

38、步骤3.3、通过式(10)得到在上的原始嵌入:

39、(10)

40、步骤3.4、通过式(11)分别得到在上的复合表征以及的复合表征:

41、     (11)

42、式(11)中,表示通过随机初始化得到的的原始嵌入;

43、步骤3.5、通过式(12)分别得到在上的最终表征以及的最终表征:

44、  (12)

45、式(12)中,表示在目标领域上针对个性化提示的线性层,表示在目标领域上针对共享提示的线性层;

46、步骤3.6、通过式(13)得到在上对的预测答题结果:

47、(13)

48、步骤3.7、通过式(14)构建在上对的二分类交叉熵损失:

49、(14)

50、步骤3.8、通过式(15)构建源领域认知诊断模型对目标领域的目标函数:

51、(15)

52、步骤3.9、基于目标领域的数据集的微调数据集,基于adam优化器对目标领域认知诊断模型进行训练,以更新模型的参数,直至目标函数收敛,从而得到训练后的目标领域认知诊断模型。

53、本发明一种电子设备,包括存储器以及处理器的特点在于,所述存储器用于存储支持处理器执行所述跨领域认知诊断方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

54、本发明一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序的特点在于,所述计算机程序被处理器运行时执行所述跨领域认知诊断方法的步骤。

55、与现有技术相比,本发明的有益效果在于:

56、1、本发明通过软提示转移技术,有效解决了现有模型在跨领域场景中模型性能下降及表现不佳的问题,从而显著提高了诊断准确性,尤其是在源领域与目标领域差异较大的情况下。

57、2、本发明通过预训练和微调的两阶段模式,使诊断模型能够快速适应新领域,避免了重新训练模型时可能导致的过拟合和灾难性遗忘问题,从而增强了诊断模型在不同领域之间的泛化能力。

58、3、本发明适用于多样化练习内容的跨领域认知诊断任务,无论是不同学科还是不同难度水平的场景,均能有效应对。这种多维度的适应性确保了本发明在各类教育环境和情境中均能发挥作用。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1