试题处理方法及装置、计算机可读存储介质及电子设备与流程

文档序号:29928609发布日期:2022-05-07 12:06阅读:260来源:国知局
试题处理方法及装置、计算机可读存储介质及电子设备与流程

1.本公开涉及自然语言处理技术领域,具体涉及一种试题处理方法及装置、计算机可读存储介质及电子设备。


背景技术:

2.锚点标签作为学习机图谱的核心要素,能够直接影响用户掌握知识的程度。尤其是理科类试题,其锚点标签的重要性更是不言而喻。然而,由于理科类试题的原始试题文本中包含诸多难以被机器理解的公式以及专业术语等内容,因此,现有基于原始试题文本的锚点标签预测方法的精准度较差,极大影响了用户体验。


技术实现要素:

3.有鉴于此,本公开提供一种试题处理方法及装置、计算机可读存储介质及电子设备,以解决相对于理科类试题而言,现有锚点标签预测方法的精准度较差的问题。
4.第一方面,本公开一实施例提供一种试题处理方法,该试题处理方法包括:确定目标理科类试题的原始试题文本;利用锚点预测模型,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的锚点数据,其中,锚点数据为与目标理科类试题的考察内容关联的数据,锚点预测模型是基于m个理科类试题样本各自的解析试题文本和锚点标签数据训练得到的,m为正整数。
5.结合第一方面,在第一方面的某些实现方式中,在利用锚点预测模型,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的锚点数据之前,该方法还包括:基于m个理科类试题样本各自的原始试题文本,生成m个理科类试题样本各自的解析试题文本,其中,原始试题文本包括题干文本;基于m个理科类试题样本各自的解析试题文本和锚点标签数据,训练初始网络模型,得到锚点预测模型。
6.结合第一方面,在第一方面的某些实现方式中,初始网络模型对应有全词遮蔽损失函数。基于m个理科类试题样本各自的解析试题文本和锚点标签数据,训练初始网络模型,得到锚点预测模型,包括:基于m个理科类试题样本各自的解析试题文本和全词遮蔽损失函数,预训练初始网络模型,得到预训练模型,其中,在预训练模型中,全词遮蔽损失函数满足预设收敛条件;基于m个理科类试题样本各自的解析试题文本和锚点标签数据,训练预训练模型,得到锚点预测模型。
7.结合第一方面,在第一方面的某些实现方式中,基于m个理科类试题样本各自的原始试题文本,生成m个理科类试题样本各自的解析试题文本,包括:针对m个理科类试题样本中的每个理科类试题样本,对理科类试题样本的原始试题文本进行正则处理,得到正则化试题文本;对正则化试题文本进行公式解析处理,得到理科类试题样本的解析试题文本。
8.结合第一方面,在第一方面的某些实现方式中,利用锚点预测模型,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的锚点数据,包括:基于目标理科类试题的原始试题文本,确定目标理科类试题对应的n个相关理科类试题,其中,n为正整数;确定n
个相关理科类试题各自的解析试题文本;利用锚点预测模型,基于n个相关理科类试题各自的解析试题文本,预测得到n个相关理科类试题各自对应的锚点数据;基于n个相关理科类试题各自对应的锚点数据,确定目标理科类试题对应的锚点数据。
9.结合第一方面,在第一方面的某些实现方式中,锚点预测模型包括基于题干的锚点预测模型和基于全题的锚点预测模型。利用锚点预测模型,基于n个相关理科类试题各自的解析试题文本,预测得到n个相关理科类试题各自对应的锚点数据,包括:针对n个相关理科类试题中的每个相关理科类试题,基于相关理科类试题的试题来源信息,确定相关理科类试题对应的锚点预测模型,其中,相关理科类试题对应的锚点预测模型为基于题干的锚点预测模型或基于全题的锚点预测模型;将相关理科类试题的解析试题文本输入相关理科类试题对应的锚点预测模型,得到相关理科类试题对应的锚点数据。
10.结合第一方面,在第一方面的某些实现方式中,锚点数据包括锚点标签数据和标签置信度数据。基于n个相关理科类试题各自对应的锚点数据,确定目标理科类试题对应的锚点数据,包括:基于n个相关理科类试题各自对应的锚点预测模型,确定基于全题的锚点预测模型对应的p个相关理科类试题,其中,p小于或等于n;若p为正整数,基于p个相关理科类试题各自对应的标签置信度数据和预设置信度条件,在p个相关理科类试题中挑选q个相关理科类试题,其中,q个相关理科类试题各自对应的标签置信度数据满足预设置信度条件,q小于或等于p;基于q个相关理科类试题各自对应的锚点标签数据,确定目标理科类试题对应的锚点数据。
11.结合第一方面,在第一方面的某些实现方式中,基于q个相关理科类试题各自对应的锚点标签数据,确定目标理科类试题对应的锚点数据,包括:针对q个相关理科类试题,确定标签置信度最高的相关理科类试题的数量;若标签置信度最高的相关理科类试题的数量为一个,则基于标签置信度最高的相关理科类试题对应的锚点标签数据,确定目标理科类试题对应的锚点数据;若标签置信度最高的相关理科类试题的数量为多个,则针对多个标签置信度最高的相关理科类试题各自对应的锚点标签数据,基于出现次数最高的锚点标签数据,确定目标理科类试题对应的锚点数据。
12.结合第一方面,在第一方面的某些实现方式中,在基于n个相关理科类试题各自对应的锚点预测模型,确定基于全题的锚点预测模型对应的p个相关理科类试题之后,该方法还包括:若p为零,则针对n个相关理科类试题各自对应的锚点标签数据,基于出现次数最高的锚点标签数据,确定目标理科类试题对应的锚点数据。
13.结合第一方面,在第一方面的某些实现方式中,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的n个相关理科类试题,包括:获取预设理科类试题题库;基于目标理科类试题的原始试题文本和预设理科类试题题库,确定n个相关理科类试题。
14.结合第一方面,在第一方面的某些实现方式中,确定目标理科类试题的原始试题文本,包括:获取目标理科类试题对应的试题图像;对试题图像进行字符识别操作,得到目标理科类试题的原始试题文本。
15.结合第一方面,在第一方面的某些实现方式中,m个理科类试题样本包括数学试题样本、物理试题样本和化学试题样本中的至少一种;和/或,锚点数据包括锚点标签数据,锚点数据还包括标签置信度数据。
16.结合第一方面,在第一方面的某些实现方式中,原始试题文本还包括知识点名称、
答案文本和答案解析文本中的至少一种文本。
17.第二方面,本公开一实施例提供一种锚点预测装置,该锚点预测装置包括:第一确定模块,用于确定目标理科类试题的原始试题文本;第二确定模块,用于利用锚点预测模型,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的锚点数据,其中,锚点数据为与目标理科类试题的考察内容关联的数据,锚点预测模型是基于m个理科类试题样本各自的解析试题文本和锚点标签数据训练得到的,m为正整数。
18.第三方面,本公开一实施例提供一种电子设备,该电子设备包括:处理器;用于存储处理器可执行指令的存储器,其中,处理器用于执行上述第一方面所提及的方法。
19.第四方面,本公开一实施例提供一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序用于执行上述第一方面所提及的方法。
20.本公开实施例提供的试题处理方法,能够利用锚点预测模型精准地预测目标理科类试题对应的锚点数据,进而能够提升用户的学习效果和体验好感度。也就是说,与现有技术相比,本公开实施例能够适用于理科类试题场景,且预测精准度更高。
附图说明
21.图1所示为本公开一实施例提供的应用场景示意图。
22.图2所示为本公开一实施例提供的模型训练方法的流程示意图。
23.图3所示为本公开一实施例提供的基于训练初始网络模型,得到锚点预测模型的流程示意图。
24.图4a所示为本公开一实施例提供的预训练模型的训练过程示意图。
25.图4b所示为本公开一实施例提供的锚点预测模型的训练过程示意图。
26.图5所示为本公开一实施例提供的生成m个理科类试题样本各自的解析试题文本的流程示意图。
27.图6所示为本公开一实施例提供的试题处理方法的流程示意图。
28.图7所示为本公开一实施例提供的确定目标理科类试题对应的锚点数据的流程示意图。
29.图8所示为本公开一实施例提供的确定n个相关理科类试题各自对应的锚点数据的流程示意图。
30.图9所示为本公开另一实施例提供的确定目标理科类试题对应的锚点数据的流程示意图。
31.图10所示为本公开又一实施例提供的确定目标理科类试题对应的锚点数据的流程示意图。
32.图11所示为本公开一实施例提供的确定n个相关理科类试题的流程示意图。
33.图12所示为本公开一实施例提供的确定目标理科类试题的原始试题文本的流程示意图。
34.图13所示为本公开一实施例提供的模型训练装置的结构示意图。
35.图14所示为本公开一实施例提供的试题处理装置的结构示意图。
36.图15所示为本公开一实施例提供的电子设备的结构示意图。
具体实施方式
37.下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本公开一部分实施例,而不是全部的实施例。
38.试题的锚点标签是知识点标签的进一步细化,与知识点标签相比,其包含了更细腻的考察内容信息。比如,数学试题a为:“小明同学把250元钱存入银行,整存争取,存期为半年,半年后共得本息和252.7元,求银行半年期的年利率是多少?”,对应地,通常情况下,数学试题a对应的知识点标签为:“一元一次方程”,锚点标签为:“一元一次方程,利率问题,涉及银行年利率的计算方式”。由此可见,锚点标签能够表征试题的考察内容信息,如何精准地确定试题的锚点标签,是当前人工智能教育的重点研究问题。
39.目前,现有的主流锚点标签预测方法之一为,采用中文分词工具对原始试题文本进行分词处理,然后利用文本卷积神经网络(text convolutional neural networks,textcnn)模型进行锚点标签预测。然而,上述提及的、基于语义理解的锚点标签预测方法的精准度并不理想。尤其是针对理科类试题,因理科类试题的原始试题文本中包含诸多难以被人工智能机器理解的公式以及专业术语等可用内容,而在分词处理过程中,这些可用内容被大量丢失,进而导致textcnn模型不能预测得到精准度较高的锚点标签。因此,将现有锚点标签预测方法运用到理科类试题的应用场景中时,预测精准度更差,进而极大影响了用户的学习效果。
40.为了解决上述问题,本公开实施例提供一种模型训练方法及装置、试题处理方法及装置,以实现提高理科类试题的锚点标签的预测精准度的目的。
41.下面结合图1对本公开实施例的应用场景进行简单的介绍。
42.图1所示为本公开一实施例提供的应用场景示意图。如图1所示,该应用场景为拍照搜题场景。具体而言,该拍照搜题场景包括服务器110以及与服务器110通信连接的用户终端120。服务器110中可以部署有锚点预测模型,并且,服务器110用于执行本公开实施例提及的试题处理方法。用户终端120可以为用户的终端设备。可以理解,用户既可以为学生用户,亦可以为家长用户或老师用户,本公开实施例不再一一赘述。
43.示例性地,在实际应用过程中,用户利用用户终端120拍摄试题图像,并借助用户终端120将试题图像发送至服务器110。服务器110在接收到试题图像后,先基于试题图像获取试题的原始试题文本,然后基于原始试题文本和锚点预测模型,预测试题对应的锚点数据,并将预测的锚点数据发送至用户终端120。用户终端120在接收到锚点数据后,将锚点数据呈现给用户,以便用户更清楚地了解试题的考察内容信息,从而更好地学习知识。其中,锚点数据为与试题的考察内容关联的数据,比如,锚点数据包括锚点标签数据(即锚点标签)和标签置信度数据(即标签置信度)。
44.示例性地,服务器110中部署的锚点预测模型的训练方法包括:基于m个理科类试题样本各自的原始试题文本,生成m个理科类试题样本各自的解析试题文本,其中,原始试题文本包括题干文本,m为正整数;基于m个理科类试题样本各自的解析试题文本和锚点标签数据,训练初始网络模型,得到锚点预测模型,锚点预测模型用于基于待预测理科类试题的试题文本,预测待预测理科类试题对应的锚点数据。
45.示例性地,上述提及的用户终端120为平板电脑、手机等移动终端。
46.下面结合图2至图5对本公开的模型训练方法进行简单的介绍。
47.图2所示为本公开一实施例提供的模型训练方法的流程示意图。如图2所示,本公开实施例提供的模型训练方法包括如下步骤。
48.步骤s210,基于m个理科类试题样本各自的原始试题文本,生成m个理科类试题样本各自的解析试题文本。
49.示例性地,m个理科类试题样本包括数学试题样本、物理试题样本和化学试题样本中的至少一种,m为正整数。由于理科类学科的诸多公式以及专业术语等内容是通用的,因此,本公开实施例不对理科类试题样本所属的具体学科进行统一限定,只要是理科类即可。为了进一步优化训练得到的锚点预测模型的预测效果,亦可以只采用单一学科的试题样本生成模型的训练数据集,进而训练得到针对性更强的锚点预测模型。比如,只采用数学试题样本生成模型的训练数据集,进而得到更适用于数据试题的锚点预测模型。
50.示例性地,原始试题文本包括题干文本。其中,题干文本又可称为题目文本。除了题干文本之外,原始试题文本还可以包括知识点名称、答案文本和答案解析文本中的至少一种文本。解析试题文本指的是,对原始试题文本进行解析处理后得到的文本。解析处理的目的为,对理科符号和/或理科类专业术语等理科类专属内容进行翻译解析,以便模型能够更充分地学习原始试题文本中包含的内容。其中,解析处理的具体实现方式可根据实际情况确定,本公开实施例对解析处理的具体方式不进行统一限定。
51.步骤s220,基于m个理科类试题样本各自的解析试题文本和锚点标签数据(即,锚点标签),训练初始网络模型,得到锚点预测模型。
52.示例性地,锚点预测模型用于基于待预测理科类试题的解析试题文本,预测待预测理科类试题对应的锚点数据。其中,锚点数据为与待预测理科类试题的考察内容关联的数据。在一些实施例中,初始网络模型和锚点预测模型的模型结构相同,区别在于模型参数。即,基于模型的训练数据集训练初始网络模型,调整初始网络模型的模型参数,进而得到锚点预测模型。
53.示例性地,在实际应用过程中,首先基于m个理科类试题样本各自的原始试题文本,生成m个理科类试题样本各自的解析试题文本,然后基于m个理科类试题样本各自的解析试题文本和锚点标签数据,训练初始网络模型,得到锚点预测模型。
54.本公开实施例提供的模型训练方法,能够训练得到适用于理科类试题场景的锚点预测模型。即,与现有技术相比,本公开实施例训练得到的锚点预测模型更适用于理科类试题场景。基于此,本公开实施例借助训练得到的锚点预测模型,为提高理科类试题的锚点预测精准度、优化用户学习效果提供了前提条件。
55.下面结合图3进一步举例说明模型的具体训练方式。
56.图3所示为本公开一实施例提供的训练初始网络模型,得到锚点预测模型的流程示意图。在图2所示实施例基础上延伸出图3所示实施例,下面着重叙述图3所示实施例与图2所示实施例的不同之处,相同之处不再赘述。
57.如图3所示,在本公开实施例中,初始网络模型对应有全词遮蔽损失函数。此外,基于m个理科类试题样本各自的解析试题文本和锚点标签数据,训练初始网络模型,得到锚点预测模型步骤,包括如下步骤。
58.步骤s310,基于m个理科类试题样本各自的解析试题文本和全词遮蔽损失函数,预训练初始网络模型,得到预训练模型。
59.示例性地,在预训练模型中,全词遮蔽损失函数满足预设收敛条件。也就是说,基于m个理科类试题样本各自的解析试题文本预训练初始网络模型,并以全词遮蔽损失函数为训练的目标函数,调整初始网络模型的模型参数,直至得到全词遮蔽损失函数满足预设收敛条件的预训练模型。
60.步骤s320,基于m个理科类试题样本各自的解析试题文本和m个理科类试题样本各自的锚点标签数据,训练预训练模型,得到锚点预测模型。
61.也就是说,在得到全词遮蔽损失函数满足预设收敛条件的预训练模型后,继续基于m个理科类试题样本各自的解析试题文本和锚点标签数据训练预训练模型,进而得到能够预测锚点数据的锚点预测模型。可以理解,锚点标签数据指的是模型训练过程中用到的样本的锚点标签,可视为调整模型参数的参考数据。
62.由于全词遮蔽损失函数能够充分学习文本的上下文信息,因此,本公开实施例提供的模型训练方法,基于m个理科类试题样本各自的解析试题文本实现了基于特定领域数据集对模型进行调优(即继续预训练)的目的。基于此,本公开实施例能够使训练得到的模型适用于理科类试题场景,进而提升模型针对理科类试题的锚点预测精准度。
63.在一些实施例中,初始网络模型为基于非特定领域数据集训练得到的锚点预测模型。比如,非特定领域数据集并未进行理科类领域和文科类领域等领域区分,是通用的试题数据集。也就是说,初始网络模型为各学科通用的锚点预测模型,而本公开针对通用的锚点预测模型进行了针对理科类领域的调优操作,进而生成了更适用于理科类试题场景的锚点预测模型。如此设置,能够借助通用的锚点预测模型进一步简化模型训练过程,降低训练计算量,节省训练资源和训练成本。
64.下面结合图4a和图4b举例说明预训练模型和锚点预测模型的模型架构和训练过程。
65.图4a所示为本公开一实施例提供的预训练模型的训练过程示意图。如图4a所示,在本公开实施例中,训练得到的预训练模型对应有多层编码器层,并且,预训练模型对应有全词遮蔽损失函数(whole word masking lm lose)。也可以理解为,预训练模型对应的初始网络模型对应有多层编码器层和全词遮蔽损失函数。即,初始网络模型和训练得到的预训练模型之间的差异仅仅为模型参数差异。
66.示例性地,图4a所示的训练过程可对应图3所示实施例中提及的步骤s310。具体地,在本公开实施例中,针对每个理科类试题样本,原始试题文本包括题干文本、知识点名称、答案文本以及答案解析文本,将题干文本、知识点名称、答案文本以及答案解析文本进行拼接处理,便得到拼接文本,继而对拼接文本进行解析处理,便可得到该理科类试题样本的解析试题文本。继而,在得到m个理科类试题样本各自的解析试题文本后,便基于m个理科类试题样本各自的解析试题文本对初始网络模型进行预训练,并以全词遮蔽损失函数为训练的目标函数,调整初始网络模型的模型参数,直至得到全词遮蔽损失函数满足预设收敛条件的预训练模型。
67.示例性地,本公开实施例提供的预训练模型的模型架构为罗伯塔(roberta)模型的模型架构。
68.在基于图4a所示的训练过程训练得到预训练模型后,需要基于图4b所示的训练过程继续训练所得到的预训练模型,进行模型微调,以便最终得到能够预测锚点数据的锚点
预测模型。下面结合图4b举例说明进行模型微调的具体实现方式。
69.图4b所示为本公开一实施例提供的锚点预测模型的训练过程示意图。如图4b所示,在锚点预测模型的训练过程中,涉及到了模型中的分类凭证(classification token,cls token)层、全连接(fully connected,fc)层和归一化(softmax)函数层。可以理解,cls token层、fc层和softmax函数层在初始网络模型、预训练模型和锚点预测模型中均是存在的,只是在训练锚点预测模型的过程中被使用。在实际应用过程中,cls token层得到的向量,通过fc层和softmax函数层实现最终的锚点预测。
70.示例性地,图4b所示的训练过程可对应图3所示实施例中提及的步骤s320。具体地,在锚点预测模型的训练过程中,预训练模型的输入依旧是上述提及的m个理科类试题样本各自对应的解析试题文本,预训练模型的输出则为预测的锚点标签1至n。那么,基于预测的锚点标签1至n(可视为模型预测的锚点标签),以及m个理科类试题样本各自对应的锚点标签数据(可视为正确的锚点标签)之间的差异,便可调整预训练模型的模型参数,进而最终得到能够预测锚点数据的锚点预测模型。
71.下面结合图5举例说明生成m个理科类试题样本各自的解析试题文本的具体实现方式。
72.图5所示为本公开一实施例提供的生成m个理科类试题样本各自的解析试题文本的流程示意图。在图2所示实施例基础上延伸出图5所示实施例,下面着重叙述图5所示实施例与图2所示实施例的不同之处,相同之处不再赘述。
73.如图5所示,在本公开实施例中,基于m个理科类试题样本各自的原始试题文本,生成m个理科类试题样本各自的解析试题文本步骤,包括如下步骤。
74.步骤s510,针对m个理科类试题样本中的每个理科类试题样本,对理科类试题样本的原始试题文本进行正则处理,得到正则化试题文本。
75.示例性地,基于预设正则处理规则对原始试题文本进行正则处理,得到正则化试题文本。正则处理的目的可以为,对原始试题文本进行前置清洗,以便模型能够更好地学习利用原始试题文本中包含的信息。其中,预设正则处理规则的构建方式可以包括:首先收集大量理科类试题样本进行分析,作为正则处理规则的样例,形成针对理科类试题的、包括预设正则处理规则的正则库。
76.步骤s520,对正则化试题文本进行公式解析处理,得到理科类试题样本的解析试题文本。
77.示例性地,对正则化试题文本进行latex公式解析处理(即对正则化试题文本中的latex格式内容进行解析),生成解析试题文本。比如,latex公式解析处理包括,将latex格式的分式符号处理成“\”,将latex格式的乘方符号处理成“^”等等。
78.举例说明,理科类试题样本a为数学试题样本,该数学试题样本的题干(又称题文、题目)为:则x的值是。
79.若对该理科类试题样本a进行分词处理(现有技术方案),则得到的分词结果为:num var_qua num equal num varx值target pm num。若基于上述步骤s510和s520,对该理科类试题样本a进行处理,则得到的解析试题文本为:-5

x

2-1=1则x值。
80.综上,对该理科类试题样本a进行分词处理后,题干中的数字转换为num,题干中的未知数(又称变量)x转换为varx,并且丢失了一些数学符号,由此可见,对理科类试题样本
进行分词处理后再生成用于模型训练的训练数据集,会极大影响模型预测精准度。相比之下,基于本公开图5所示实施例对理科类试题样本a进行处理后得到的解析试题文本,极大保留了原始试题文本所涵盖的内容,进而为提升训练得到的锚点预测模型的预测精准度提供了数据基础。
81.本公开实施例提供的模型训练方法,通过对原始试题文本进行一系列预处理(包括正则处理和/或公式解析处理)的方式,生成了更适用于模型训练的解析试题文本,进而为训练得到预测精准度更高的锚点预测模型提供了数据基础。
82.上文结合图2至图5,详细描述了本公开的模型训练方法的实施例,下面结合图6至图12,详细描述本公开的试题处理方法的实施例。
83.图6所示为本公开一实施例提供的试题处理方法的流程示意图。如图6所示,本公开实施例提供的试题处理方法包括如下步骤。
84.步骤s610,确定目标理科类试题的原始试题文本。
85.示例性地,目标理科类试题指的是,需要进行锚点数据预测的试题。比如,用户拍照输入的试题。
86.步骤s620,利用锚点预测模型,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的锚点数据。
87.示例性地,步骤620中提及的锚点预测模型,指的是能够适用于理科类试题场景的锚点预测模型。进一步地,步骤620中提及的锚点预测模型,基于上述任一实施例提及的模型训练方法训练得到。
88.示例性地,在实际应用过程中,首先确定目标理科类试题的原始试题文本,然后利用锚点预测模型,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的锚点数据。
89.本公开实施例提供的试题处理方法,能够利用锚点预测模型精准地预测目标理科类试题对应的锚点数据,进而提升了用户的学习效果和体验好感度。
90.可以理解,利用锚点预测模型预测目标理科类试题对应的锚点数据的具体实现方式可以有很多种,比如,对目标理科类试题的原始试题文本进行解析,得到相应的解析试题文本,进而将该解析试题文本输入到锚点预测模型,以便锚点预测模型进行预测。此外,为了进一步提高预测精准度,还可以采用图7所示的方式进行预测。
91.图7所示为本公开一实施例提供的确定目标理科类试题对应的锚点数据的流程示意图。在图6所示实施例基础上延伸出图7所示实施例,下面着重叙述图7所示实施例与图6所示实施例的不同之处,相同之处不再赘述。
92.如图7所示,在本公开实施例中,利用锚点预测模型,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的锚点数据步骤,包括如下步骤。
93.步骤s710,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的n个相关理科类试题。
94.示例性地,n为大于1的正整数,比如n=10。比如,基于目标理科类试题的原始试题文本,搜索得到与目标理科类试题相关的50个理科类试题,然后,对该50个理科类试题进行相关性排序,将排名前10(即top 10)的10个理科类试题确定为相关理科类试题。可选地,基于目标理科类试题的原始试题文本,以文本相似算法在预设试题库中搜索得到与目标理科
类试题相关的50个理科类试题。
95.步骤s720,确定n个相关理科类试题各自的解析试题文本。
96.示例性地,对每个相关理科类试题的原始试题文本进行解析,得到该相关理科类试题的解析试题文本。可以理解,相对于锚点预测模型而言,相关理科类试题可视为上述实施例提及的待预测理科类试题。
97.步骤s730,利用锚点预测模型,基于n个相关理科类试题各自的解析试题文本,预测得到n个相关理科类试题各自对应的锚点数据。
98.步骤s740,基于n个相关理科类试题各自对应的锚点数据,确定目标理科类试题对应的锚点数据。
99.示例性地,在n个相关理科类试题各自对应的锚点数据中,挑选与目标理科类试题最贴合的锚点数据作为目标理科类试题对应的锚点数据。
100.也就是说,在本公开实施例中,并非直接利用锚点预测模型对目标理科类试题进行锚点预测,而是利用锚点预测模型分别对n个相关理科类试题进行锚点预测,然后基于n个相关理科类试题各自对应的锚点数据,确定目标理科类试题对应的锚点数据。由此可见,本公开实施例能够全面顾及目标理科类试题可能涉及的知识点信息,进而实现了为目标理科类试题确定精准度更高的锚点数据的目的。
101.可以理解,在锚点预测模型的训练过程中,训练数据集的数据丰富程度不仅能够影响最终训练得到的锚点预测模型的预测效果,而且能够决定锚点预测模型在实际应用过程中的数据输入。
102.具体而言,若在锚点预测模型的训练过程中,生成训练数据集的原始试题文本只包括题干文本,那么,基于图7所示实施例,在锚点预测模型的实际应用过程中,若利用锚点预测模型预测相关理科类试题a对应的锚点数据,则数据输入为相关理科类试题a的题干文本(比如,对题干文本进行解析后输入锚点预测模型)。此种情况训练得到的锚点预测模型可称为基于题干的锚点预测模型。若在锚点预测模型的训练过程中,生成训练数据集的原始试题文本不仅包括题干文本,还包括知识点名称、答案文本和答案解析文本,那么,基于图7所示实施例,在锚点预测模型的实际应用过程中,若利用锚点预测模型预测相关理科类试题a对应的锚点数据,则数据输入为相关理科类试题a的题干文本、知识点名称、答案文本和答案解析文本(比如,对题干文本、知识点名称、答案文本和答案解析文本进行拼接,对拼接后的文本进行解析后输入锚点预测模型)。此种情况训练得到的锚点预测模型可称为基于全题的锚点预测模型。
103.由此,鉴于原始试题文本所包含的数据丰富程度的区别,上述实施例提及的锚点预测模型可以是两种,即基于题干的锚点预测模型和基于全题的锚点预测模型。下面结合图8举例说明两种模型的具体应用方式。
104.图8所示为本公开一实施例提供的确定n个相关理科类试题各自对应的锚点数据的流程示意图。在图7所示实施例基础上延伸出图8所示实施例,下面着重叙述图8所示实施例与图7所示实施例的不同之处,相同之处不再赘述。
105.如图8所示,在本公开实施例中,利用锚点预测模型,基于n个相关理科类试题各自的解析试题文本,预测得到n个相关理科类试题各自对应的锚点数据步骤,包括如下步骤。
106.步骤s810,针对n个相关理科类试题中的每个相关理科类试题,基于相关理科类试
题的试题来源信息,确定相关理科类试题对应的锚点预测模型。
107.相关理科类试题的试题来源信息(又称试题来源标签),能够表征相关理科类试题的原始试题文本的详细程度。比如,试题来源信息为“爱标客拍搜试题”、“快获网试题”等等。
108.示例性地,相关理科类试题对应的锚点预测模型为基于题干的锚点预测模型或基于全题的锚点预测模型。即,相关理科类试题对应的锚点预测模型为上述两种模型之一。
109.步骤s820,将相关理科类试题的解析试题文本输入相关理科类试题对应的锚点预测模型,得到相关理科类试题对应的锚点数据。
110.由于试题来源信息能够表征原始试题文本的详细程度,因此,本公开实施例能够基于试题来源信息选取更适用于试题的锚点预测模型,进而进一步提高锚点预测精准度。
111.如前所述,锚点数据不仅可以包括锚点标签数据,还可以包括锚点标签对应的标签置信度数据。比如,锚点标签为“一元一次方程,利率问题,涉及银行年利率的计算方式”,该锚点标签对应的标签置信度为0.8。下面结合图9举例说明如何采用投票的方式,基于n个相关理科类试题各自对应的锚点数据,确定目标理科类试题对应的锚点数据。
112.图9所示为本公开另一实施例提供的确定目标理科类试题对应的锚点数据的流程示意图。在图7所示实施例基础上延伸出图9所示实施例,下面着重叙述图9所示实施例与图7所示实施例的不同之处,相同之处不再赘述。
113.如图9所示,在本公开实施例中,基于n个相关理科类试题各自对应的锚点数据,确定目标理科类试题对应的锚点数据步骤,包括如下步骤。
114.步骤s910,基于n个相关理科类试题各自对应的锚点预测模型,确定基于全题的锚点预测模型对应的p个相关理科类试题。
115.也就是说,从n个相关理科类试题中,挑选出基于全题的锚点预测模型对应的p个相关理科类试题,其中,p小于或等于n。
116.步骤s920,判断p为正整数还是为零。
117.示例性地,在实际应用过程中,如果p为正整数,则执行步骤s930和s940,如果p为零,则执行步骤s950。
118.步骤s930,基于p个相关理科类试题各自对应的标签置信度数据和预设置信度条件,在p个相关理科类试题中挑选q个相关理科类试题,q小于或等于p。
119.可以理解,预设置信度条件可根据实际情况确定,本公开实施例对此不进行统一限定。比如,预设置信度条件为,预设置信度大于0.5。如果q为零,则可修改所述预设置信度条件,以使q不为零。
120.也就是说,针对步骤s910得到的p个相关理科类试题,基于标签置信度数据进行进一步挑选,从p个相关理科类试题中,挑选出符合预设置信度条件的q个相关理科类试题。
121.步骤s940,基于q个相关理科类试题各自对应的锚点标签数据,确定目标理科类试题对应的锚点数据。
122.经历多层筛选后,质量较差且标签置信度不高的相关理科类试题已经被剔除,进而实现了基于质量较高且标签置信度较高的q个相关理科类试题各自对应的锚点标签数据,确定目标理科类试题对应的锚点数据的目的。
123.步骤s950,针对n个相关理科类试题各自对应的锚点标签数据,基于出现次数最高
的锚点标签数据,确定目标理科类试题对应的锚点数据。
124.示例性地,在实际应用过程中,基于n个相关理科类试题各自对应的锚点预测模型,确定基于全题的锚点预测模型对应的p个相关理科类试题,若p为正整数(即,存在与基于全题的锚点预测模型对应的相关理科类试题),则基于p个相关理科类试题各自对应的标签置信度数据和预设置信度条件,在p个相关理科类试题中挑选q个相关理科类试题,进而基于q个相关理科类试题各自对应的锚点标签数据,确定目标理科类试题对应的锚点数据,若p为零(即,不存在与基于全题的锚点预测模型对应的相关理科类试题),则针对n个相关理科类试题各自对应的锚点标签数据,基于出现次数最高的锚点标签数据,确定目标理科类试题对应的锚点数据。
125.也就是说,若存在与基于全题的锚点预测模型对应的相关理科类试题,则优先基于与基于全题的锚点预测模型对应的相关理科类试题确定目标理科类试题对应的锚点数据,若不存在与基于全题的锚点预测模型对应的相关理科类试题,则不再针对n个相关理科类试题进行筛选,直接基于出现次数最高的锚点标签数据,确定目标理科类试题对应的锚点数据即可(比如,直接将出现次数最高的锚点标签数据确定为目标理科类试题对应的锚点数据)。
126.本公开实施例能够针对不同来源的试题采用不同的模型进行锚点预测,并基于试题来源进行来源优先级、标签置信度的多层筛选,进而得到目标理科类试题对应的锚点数据。也就是说,本公开实施例能够根据相关理科类试题的实际情况,精准、灵活地确定目标理科类试题对应的锚点数据。
127.可以理解,相对于q个相关理科类试题而言,可能存在标签置信度最高的相关理科类试题的数量为一个或多个两种情况,下面结合图10举例说明这两种情况的具体处理方式。
128.图10所示为本公开又一实施例提供的确定目标理科类试题对应的锚点数据的流程示意图。在图9所示实施例基础上延伸出图10所示实施例,下面着重叙述图10所示实施例与图9所示实施例的不同之处,相同之处不再赘述。
129.如图10所示,在本公开实施例中,基于q个相关理科类试题各自对应的锚点标签数据,确定目标理科类试题对应的锚点数据步骤,包括如下步骤。
130.步骤s1010,针对q个相关理科类试题,确定标签置信度最高的相关理科类试题的数量。
131.步骤s1020,判断标签置信度最高的相关理科类试题的数量是一个还是多个。
132.示例性地,在实际应用过程中,如果标签置信度最高的相关理科类试题的数量是一个,则执行步骤s1030,如果标签置信度最高的相关理科类试题的数量是多个,则执行步骤s1040。
133.步骤s1030,基于标签置信度最高的相关理科类试题对应的锚点标签数据,确定目标理科类试题对应的锚点数据。
134.步骤s1040,针对多个标签置信度最高的相关理科类试题各自对应的锚点标签数据,基于出现次数最高的锚点标签数据,确定目标理科类试题对应的锚点数据。
135.举例说明,将出现次数最高的锚点标签数据,直接确定为目标理科类试题对应的锚点数据。可以理解,在目标理科类试题对应的锚点数据中,可以只包含锚点标签数据即
可。
136.示例性地,在实际应用过程中,针对q个相关理科类试题,确定标签置信度最高的相关理科类试题的数量,若标签置信度最高的相关理科类试题的数量是一个(即不存在平票情况),则基于标签置信度最高的相关理科类试题对应的锚点标签数据,确定目标理科类试题对应的锚点数据,若标签置信度最高的相关理科类试题的数量是多个(即存在平票情况),则针对多个标签置信度最高的相关理科类试题各自对应的锚点标签数据,基于出现次数最高的锚点标签数据,确定目标理科类试题对应的锚点数据。由此可见,本公开实施例能够极大提高目标理科类试题对应的锚点数据的精准度。
137.图11所示为本公开一实施例提供的确定n个相关理科类试题的流程示意图。在图7所示实施例基础上延伸出图11所示实施例,下面着重叙述图11所示实施例与图7所示实施例的不同之处,相同之处不再赘述。
138.如图11所示,在本公开实施例中,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的n个相关理科类试题步骤,包括如下步骤。
139.步骤s1110,获取预设理科类试题题库。
140.步骤s1120,基于目标理科类试题的原始试题文本和预设理科类试题题库,确定n个相关理科类试题。
141.也就是说,在本公开实施例中,目标理科类试题对应的n个相关理科类试题是从预设理科类试题题库中筛选的。如此设置,不仅能够保证相关理科类试题的多元化程度,而且能够降低相关理科类试题的获取难度。
142.图12所示为本公开一实施例提供的确定目标理科类试题的原始试题文本的流程示意图。在图6所示实施例基础上延伸出图12所示实施例,下面着重叙述图12所示实施例与图6所示实施例的不同之处,相同之处不再赘述。
143.如图12所示,在本公开实施例中,确定目标理科类试题的原始试题文本步骤,包括如下步骤。
144.步骤s1210,获取目标理科类试题对应的试题图像。
145.比如,目标理科类试题为书本上的试题,用户对准书本上的试题进行拍照,便可得到试题图像。
146.步骤s1220,对试题图像进行字符识别操作,得到目标理科类试题的原始试题文本。
147.示例性地,对试题图像进行光学字符识别(optical character recognition,ocr)操作,从而得到目标理科类试题的原始试题文本。
148.本公开实施例能够简化原始试题文本的获取方式,方便用户操作,进而提升用户体验好感度。
149.上文结合图2至图12,详细描述了本公开的方法实施例,下面结合图13至图15,详细描述本公开的装置实施例。此外,应理解,方法实施例的描述与装置实施例的描述相互对应,因此,未详细描述的部分可以参见前面方法实施例。
150.图13所示为本公开一实施例提供的模型训练装置的结构示意图。如图13所示,本公开实施例提供的模型训练装置包括生成模块1310和训练模块1320。具体地,生成模块1310用于基于m个理科类试题样本各自的原始试题文本,生成m个理科类试题样本各自的解
析试题文本,其中,原始试题文本包括题干文本,m为正整数。训练模块1320用于基于m个理科类试题样本各自的解析试题文本和锚点标签数据,训练初始网络模型,得到锚点预测模型,其中,锚点预测模型用于基于待预测理科类试题的解析试题文本,预测待预测理科类试题对应的锚点数据,锚点数据为与所述待预测理科类试题的考察内容关联的数据。
151.在一些实施例中,初始网络模型对应有全词遮蔽损失函数。此外,训练模块1320还用于,基于m个理科类试题样本各自的解析试题文本和全词遮蔽损失函数,预训练初始网络模型,得到预训练模型,其中,在预训练模型中,全词遮蔽损失函数满足预设收敛条件;基于m个理科类试题样本各自的解析试题文本和m个理科类试题样本各自的锚点标签数据,训练预训练模型,得到锚点预测模型。
152.在一些实施例中,生成模块1310还用于,针对m个理科类试题样本中的每个理科类试题样本,对理科类试题样本的原始试题文本进行正则处理,得到正则化试题文本;对正则化试题文本进行公式解析处理,得到理科类试题样本的解析试题文本。
153.在一些实施例中,原始试题文本还包括知识点名称、答案文本和答案解析文本中的至少一种文本。
154.在一些实施例中,m个理科类试题样本包括数学试题样本、物理试题样本和化学试题样本中的至少一种;和/或,锚点数据包括锚点标签数据,所述锚点数据还包括标签置信度数据。
155.图14所示为本公开一实施例提供的试题处理装置的结构示意图。如图14所示,本公开实施例提供的试题处理装置包括第一确定模块1410和第二确定模块1420。具体地,第一确定模块1410用于确定目标理科类试题的原始试题文本。第二确定模块1420用于利用锚点预测模型,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的锚点数据。
156.在一些实施例中,第二确定模块1420还用于,基于目标理科类试题的原始试题文本,确定目标理科类试题对应的n个相关理科类试题,其中,n为正整数;获取n个相关理科类试题各自的原始试题文本;利用锚点预测模型,基于n个相关理科类试题各自的原始试题文本,预测得到n个相关理科类试题各自对应的锚点数据;基于n个相关理科类试题各自对应的锚点数据,确定目标理科类试题对应的锚点数据。
157.在一些实施例中,锚点预测模型包括基于题干的锚点预测模型和基于全题的锚点预测模型。第二确定模块1420还用于,针对n个相关理科类试题中的每个相关理科类试题,基于相关理科类试题的试题来源信息,确定相关理科类试题对应的锚点预测模型,其中,相关理科类试题对应的锚点预测模型为基于题干的锚点预测模型或基于全题的锚点预测模型;利用相关理科类试题对应的锚点预测模型,基于相关理科类试题的原始试题文本,预测相关理科类试题对应的锚点数据。
158.在一些实施例中,锚点数据包括锚点标签数据和标签置信度数据。第二确定模块1420还用于,基于n个相关理科类试题各自对应的锚点预测模型,确定基于全题的锚点预测模型对应的p个相关理科类试题,其中,p小于或等于n;若p为正整数,基于p个相关理科类试题各自对应的标签置信度数据和预设置信度条件,在p个相关理科类试题中挑选q个相关理科类试题,其中,q个相关理科类试题各自对应的标签置信度数据满足预设置信度条件,q小于或等于p;基于q个相关理科类试题各自对应的锚点标签数据,确定目标理科类试题对应的锚点数据。
159.在一些实施例中,第二确定模块1420还用于,针对q个相关理科类试题,确定标签置信度最高的相关理科类试题的数量;若标签置信度最高的相关理科类试题的数量为一个,则基于标签置信度最高的相关理科类试题对应的锚点标签数据,确定目标理科类试题对应的锚点数据;若标签置信度最高的相关理科类试题的数量为多个,则针对多个标签置信度最高的相关理科类试题各自对应的锚点标签数据,基于出现次数最高的锚点标签数据,确定目标理科类试题对应的锚点数据。
160.在一些实施例中,第二确定模块1420还用于,若p为零,则针对n个相关理科类试题各自对应的锚点标签数据,基于出现次数最高的锚点标签数据,确定目标理科类试题对应的锚点数据。
161.在一些实施例中,第二确定模块1420还用于,获取预设理科类试题题库;基于目标理科类试题的原始试题文本和预设理科类试题题库,确定n个相关理科类试题。
162.在一些实施例中,第一确定模块1410还用于,获取目标理科类试题对应的试题图像;对试题图像进行字符识别操作,得到目标理科类试题的原始试题文本。
163.可以理解,上述提及的模型训练装置中的模块亦可以被放置到试题处理装置中,即,试题处理装置包括生成模块1310和训练模块1320。或者,试题处理装置中的现有模块直接执行模型训练装置中的模块要执行的步骤,比如第二确定模块1420直接执行生成模块1310和训练模块1320要执行的步骤。也就是说,本领域技术人员可根据实际情况自行设置,本公开实施例对此不进行统一限定。
164.图15所示为本公开一实施例提供的电子设备的结构示意图。图15所示的电子设备1500(该电子设备1500具体可以是一种计算机设备)包括存储器1501、处理器1502、通信接口1503以及总线1504。其中,存储器1501、处理器1502、通信接口1503通过总线1504实现彼此之间的通信连接。
165.存储器1501可以是只读存储器(read only memory,rom),静态存储设备,动态存储设备或者随机存取存储器(random access memory,ram)。存储器1501可以存储程序,当存储器1501中存储的程序被处理器1502执行时,处理器1502和通信接口1503用于执行本公开实施例的模型训练方法和/或试题处理方法的各个步骤。
166.处理器1502可以采用通用的中央处理器(central processing unit,cpu),微处理器,应用专用集成电路(application specific integrated circuit,asic),图形处理器(graphics processing unit,gpu)或者一个或多个集成电路,用于执行相关程序,以实现本公开实施例的模型训练装置和/或试题处理装置中的单元所需执行的功能。
167.处理器1502还可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,本公开的模型训练方法和/或试题处理方法的各个步骤可以通过处理器1502中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1502还可以是通用处理器、数字信号处理器(digital signal processing,dsp)、专用集成电路(asic)、现场可编程门阵列(field programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本公开实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本公开实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读
存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1501,处理器1502读取存储器1501中的信息,结合其硬件完成本公开实施例的模型训练装置和/或试题处理装置中包括的单元所需执行的功能,或者执行本公开方法实施例的模型训练方法和/或试题处理方法。
168.通信接口1503使用例如但不限于收发器一类的收发装置,来实现电子设备1500与其他设备或通信网络之间的通信。例如,可以通过通信接口1503获取目标理科类试题的原始试题文本。
169.总线1504可包括在电子设备1500各个部件(例如,存储器1501、处理器1502、通信接口1503)之间传送信息的通路。
170.应理解,模型训练装置中的训练模块1320可以相当于处理器1502。
171.应注意,尽管图15所示的电子设备1500仅仅示出了存储器、处理器、通信接口,但是在具体实现过程中,本领域的技术人员应当理解,电子设备1500还包括实现正常运行所必须的其他器件。同时,根据具体需要,本领域的技术人员应当理解,电子设备1500还可包括实现其他附加功能的硬件器件。此外,本领域的技术人员应当理解,电子设备1500也可仅仅包括实现本公开实施例所必须的器件,而不必包括图15中所示的全部器件。
172.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
173.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
174.在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
175.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
176.另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
177.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。
而前述的存储介质包括:u盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
178.以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1