1.一种文档解析系统,其特征在于,所述系统包括:
2.如权利要求1所述的系统,其中,所述多模态融合编码器采用transformer模型,所述多模态融合编码器包括:
3.如权利要求2所述的系统,其中,所述多种预训练任务包括:
4.如权利要求1所述的系统,其中,所述多尺度序列标注任务包括:
5.如权利要求1所述的系统,其中,所述绝对位置偏置包括当前字段所在页码及位置信息,
6.如权利要求5所述的系统,其中,所述多模态融合编码器采用transformer模型,所述多模态融合编码器使用的自注意力机制如下:
7.如权利要求1所述的系统,其中,所述系统还包括:
8.如权利要求7所述的系统,其中,所述新的训练数据中的字段包括新字段和其他字段,其中,
9.如权利要求7所述的系统,其中,所述系统还包括预先构建的数据池,增量学习过程中,从所述新的训练数据中抽取部分数据存储在所述数据池中,并用当前新增的新字段作为标签标记抽取出的所述部分数据;
10.一种文档解析方法,其特征在于,所述方法包括: