本公开涉及数据分析,尤其涉及一种模型训练方法、实体标签预测方法、装置、设备及介质。
背景技术:
1、对于非正式文本,其具有随意性和非正式的特点,文本中可能会出现语法不规范、标点符号缺少以及标点符号乱用等现象,相较于正式文本,在对非正式文本进行分析时,断句问题是一个重要挑战。
2、目前的断句技术分为两类,一类是基于预训练模型的命名实体识别技术,一类是基于上下文无关文法(probabilistic context free grammar,pcfg)的无监督学习技术。但是,预训练模型仅能简单识别句子的边界,无法进行合句,并且它是作为一个单独的模型存在,无法与其他类实体识别模型共存,增加了重复工作;pcfg方法为无监督学习算法,通过训练得到节点概率,以此进行句法分析得到最大概率子树,但是其训练结果随训练样本改变,训练过程具有随机性以及不可控的缺点。
技术实现思路
1、为了解决上述技术或者至少部分地解决上述技术问题,本公开提供了一种模型训练方法、实体标签预测方法、装置、设备及介质,通过对初始实体标签预测模型进行训练得到目标实体标签预测模型,使得对文本的实体标签预测结果更准确,且断句结果也更准确,有利于准确识别用户意图。
2、为了实现上述目的,本公开实施例提供的技术方案如下:
3、第一方面,本公开提供了一种实体标签预测模型训练方法,该方法包括:
4、获取训练样本,所述训练样本包括文本数据和预先标注的实体标签,所述实体标签中包含断句符标签和非断句符标签;
5、将所述文本数据输入至初始实体标签预测模型,得到对应的实体标签预测结果,所述实体标签预测结果包括预测的断句符标签和预测的非断句符标签;
6、基于预设损失函数,根据所述实体标签预测结果和所述预先标注的实体标签,对所述初始实体标签预测模型进行训练,得到目标实体标签预测模型。
7、第二方面,本公开提供了一种实体标签预测方法,该方法包括:
8、获取待预测文本;
9、将所述待预测文本输入至目标实体标签预测模型中,得到所述待预测文本对应的目标实体标签预测结果;
10、其中,所述目标实体标签预测模型基于如第一方面所述的方法训练得到。
11、第三方面,本公开提供了一种实体标签预测模型训练装置,该装置包括:
12、样本获取模块,用于获取训练样本,所述训练样本包括文本数据和预先标注的实体标签,所述实体标签中包含断句符标签和非断句符标签;
13、第一确定模块,用于将所述文本数据输入至初始实体标签预测模型,得到对应的实体标签预测结果,所述实体标签预测结果包括预测的断句符标签和预测的非断句符标签;
14、第二确定模块,用于基于预设损失函数,根据所述实体标签预测结果和所述预先标注的实体标签,对所述初始实体标签预测模型进行训练,得到目标实体标签预测模型。
15、第四方面,本公开提供了一种实体标签预测装置,该装置包括:
16、文本获取模块,用于获取待预测文本;
17、第三确定模块,用于将所述待预测文本输入至目标实体标签预测模型中,得到所述待预测文本对应的目标实体标签预测结果;
18、其中,所述目标实体标签预测模型基于如第一方面所述的方法训练得到。
19、第五方面,本公开还提供了一种电子设备,包括:
20、一个或多个处理器;
21、存储装置,用于存储一个或多个程序,
22、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现第一方面中所述的实体标签预测模型训练方法,或者第二方面中所述的实体标签预测方法。
23、第六方面,本公开还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中所述的实体标签预测模型训练方法,或者第二方面中所述的实体标签预测方法。
24、本公开实施例提供的技术方案与现有技术相比具有如下优点:获取训练样本,训练样本包括文本数据和预先标注的实体标签,实体标签中包含断句符标签和非断句符标签;将文本数据输入至初始实体标签预测模型,得到对应的实体标签预测结果,实体标签预测结果包括预测的断句符标签和预测的非断句符标签;基于预设损失函数,根据实体标签预测结果和预先标注的实体标签,对初始实体标签预测模型进行训练,得到目标实体标签预测模型,上述技术方案中,通过对初始实体标签预测模型进行训练得到目标实体标签预测模型,使得对文本的实体标签预测结果更准确,且断句结果也更准确,有利于准确识别用户意图。
1.一种实体标签预测模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述初始实体标签预测模型包括:嵌入层、语义表示层、线性层以及指针网络层;
3.根据权利要求1所述的方法,其特征在于,所述实体标签通过以下方式确定:
4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于预设损失函数,根据所述实体标签预测结果和所述预先标注的实体标签,对所述初始实体标签预测模型进行训练,得到目标实体标签预测模型,包括:
5.一种实体标签预测方法,其特征在于,所述方法包括:
6.根据权利要求5所述的方法,其特征在于,所述将所述待预测文本输入至目标实体标签预测模型中,得到所述待预测文本对应的目标实体标签预测结果之后,所述方法还包括:
7.一种实体标签预测模型训练装置,其特征在于,所述装置包括:
8.一种实体标签预测装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项或者5-6中任一项所述的方法。