基于序列到集合生成的表格生成方法及装置

文档序号:34706251发布日期:2023-07-07 11:45阅读:来源:国知局

技术特征:

1.一种基于序列到集合生成的表格生成方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于序列到集合生成的表格生成方法,其特征在于,所述表头由序列到序列式的生成,所述表行体由序列到集合式的生成,且所述表头生成器与所述表体生成器共享参数。

3.如权利要求1所述的基于序列到集合生成的表格生成方法,其特征在于,所述表体生成器设计有行嵌入和列嵌入,以便通过所述行嵌入和所述列嵌入增加对应行列之间的语义对应关系。

4.如权利要求1所述的基于序列到集合生成的表格生成方法,其特征在于,根据以下公式采用二分图匹配的方式对预生成的表体行首列和训练目标首列进行一对一匹配:

5.一种计算机可读存储介质,其特征在于,其上存储有基于序列到集合生成的表格生成程序,该基于序列到集合生成的表格生成程序被处理器执行时实现如权利要求1-4中任一项所述的基于序列到集合生成的表格生成方法。

6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1-4中任一项所述的基于序列到集合生成的表格生成方法。

7.一种基于序列到集合生成的表格生成装置,其特征在于,包括:

8.如权利要求7所述的基于序列到集合生成的表格生成装置,其特征在于,所述表头由序列到序列式的生成,所述表行体由序列到集合式的生成,且所述表头生成器与所述表体生成器共享参数。

9.如权利要求7所述的基于序列到集合生成的表格生成装置,其特征在于,所述表体生成器设计有行嵌入和列嵌入,以便通过所述行嵌入和所述列嵌入增加对应行列之间的语义对应关系。

10.如权利要求7所述的基于序列到集合生成的表格生成装置,其特征在于,根据以下公式采用二分图匹配的方式对预生成的表体行首列和训练目标首列进行一对一匹配:


技术总结
本申请提出了一种基于序列到集合生成的表格生成方法及装置,该方法包括获取文本,并对文本进行分词处理;将分词处理后的文本输入到文本编码器进行编码,以得到编码后的文本特征向量表示;将文本特征向量表示输入到表头生成器进行解码,以得到表头和表头特征向量表示;将文本特征向量表示和表头特征向量表示输入到表体生成器进行解码,以并行的生成表体行;构建表格生成模型,并根据文本、表头和表体行进行训练,其中,训练过程中对预生成的表体行首列和训练目标首列进行一对一匹配;通过训练好的表格生成模型对预测文本进行预测,以生成对应的完整表格;由此,无需考虑行之间的顺序依赖关系,从而有效提高生成的效率和准确度。

技术研发人员:苏劲松,李彤,王志豪,谢彬彬,邵良颖
受保护的技术使用者:厦门大学
技术研发日:
技术公布日:2024/1/13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1