1.一种基于主动学习的低资源语言机器翻译方法,其特征在于,包括:
2.根据权利要求1所述的基于主动学习的低资源语言机器翻译方法,其特征在于,所述提取所述初始数据集中每个句子对应的token序列,包括:
3.根据权利要求1所述的基于主动学习的低资源语言机器翻译方法,其特征在于,所述预设doc2vec模型的训练过程,包括:
4.根据权利要求3所述的基于主动学习的低资源语言机器翻译方法,其特征在于,所述对数似然计算公式为:
5.根据权利要求1所述的基于主动学习的低资源语言机器翻译方法,其特征在于,所述利用core-set方法从所述特征向量集中选取核心集,包括:
6.根据权利要求5所述的基于主动学习的低资源语言机器翻译方法,其特征在于,所述令所述初始翻译模型输出所述核心集中每个核心句子的不确定性排名,包括:
7.根据权利要求6所述的基于主动学习的低资源语言机器翻译方法,其特征在于,所述熵值计算公式为:
8.根据权利要求6所述的基于主动学习的低资源语言机器翻译方法,其特征在于,所述根据所述不确定性排名,利用选择函数从所述初始数据集中获取与每个所述核心句子对应的初始数据,包括:
9.根据权利要求8所述的基于主动学习的低资源语言机器翻译方法,其特征在于,所述选择函数的公式为:
10.根据权利要求1所述的基于主动学习的低资源语言机器翻译方法,其特征在于,所述利用所述目标训练数据集对所述初始翻译模型继续进行训练,得到目标翻译模型,包括: