报关信息处理方法、装置及电子设备与流程

文档序号:26404613发布日期:2021-08-24 16:18阅读:来源:国知局

技术特征:

1.一种报关信息处理方法,其特征在于,包括:

确定待生成的报关单关联的报关材料文件;

对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

2.根据权利要求1所述的方法,其特征在于,

所述提供关于所述目标字段中待输入信息的推荐信息,包括:

确定所述目标字段的待输入信息关联的文本规则;

根据符合所述文本规则的命名实体,确定所述推荐信息。

3.根据权利要求1所述的方法,其特征在于,

所述提供关于所述目标字段中待输入信息的推荐信息,包括:

根据所述命名实体与所述目标字段中已输入的部分信息的相关性,确定所述推荐信息。

4.根据权利要求3所述的方法,其特征在于,

所述目标字段的待输入信息包括中文信息,所述已输入的部分信息包括:所述中文信息中的部分中文字符,或者所述中文信息对应的简拼字母信息。

5.根据权利要求3所述的方法,其特征在于,

所述根据所述命名实体与所述目标字段中已输入的部分信息的相关性,确定所述推荐信息,包括:

根据所述命名实体与所述目标字段中已输入的部分信息的相关性,将所述命名实体包含的全部字符或者部分字符确定为所述推荐信息。

6.根据权利要求1所述的方法,其特征在于,

在对所述报关材料文件的文本信息内容进行识别时,还包括:

确定所述命名实体之间的位置关系信息;

根据所述位置关系信息,确定多个命名实体对,所述命名实体对中的两个命名实体对应同一字段的名称与内容信息;

根据所述同一字段的名称与内容信息之间的对应关系信息,将代表字段内容的命名实体自动匹配到所述报关单中对应的字段中。

7.根据权利要求6所述的方法,其特征在于,

所述提供关于所述目标字段中待输入信息的推荐信息,包括:

根据未能匹配到所述报关单中对应的字段中的命名实体,提供关于所述目标字段中待输入信息的推荐信息。

8.根据权利要求6所述的方法,其特征在于,

如果所述报关材料文件为电子表格类文件,则所述对所述报关材料文件的文本信息内容进行识别,包括:

对所述电子表格类文件中的文本信息内容进行命名实体识别;

根据所识别出的命名实体识别在所述电子表格文件中的位置信息,确定所述命名实体之间的位置关系信息。

9.根据权利要求6所述的方法,其特征在于,

如果所述报关材料文件为不可编辑格式,则所述对所述报关材料文件的文本信息内容进行识别,包括:

对所述报关材料文件进行光学字符识别ocr,确定其中包含的字符以及对应的位置信息;

对ocr识别结果中包含的字符信息进行命名实体识别,确定所述报关材料文件中包含的命名实体;

根据所述ocr识别结果中包含的位置信息,确定所述命名实体之间的位置关系信息。

10.根据权利要求9所述的方法,其特征在于,还包括:

如果所述报关材料文件为可编辑格式,则将所述报关材料文件转换为不可编辑格式,并按照所述不可编辑格式的报关材料文件对应的方式进行识别。

11.根据权利要求1所述的方法,其特征在于,还包括:

确定所述报关材料文件关联的历史记录数据;

如果不存在与所述目标字段匹配的命名实体,则根据所述历史记录数据提供关于所述目标字段中待输入信息的推荐信息。

12.一种报关信息处理方法,其特征在于,包括:

确定待生成的报关单关联的报关材料文件;

对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体对,其中,所述命名实体对中的两个命名实体对应同一字段的名称与内容信息,所述命名实体包括:所述文本信息内容中的连续字符片段;

根据所述同一字段的名称与内容信息之间的对应关系信息,将代表字段内容的命名实体自动匹配到所述报关单中对应的字段中;

在针对所述报关单中未自动匹配成功的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

13.一种生成报关单的方法,其特征在于,包括:

确定待生成的报关单关联的报关材料文件;

对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息;

根据所述目标字段中的已输入信息,生成所述报关单。

14.一种待申报信息处理方法,其特征在于,包括:

确定待生成的待申报信息关联的申报材料文件;

对所述申报材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

在针对所述待申报信息中的目标字段进行信息录入操作的过程中,根据从所述申报材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

15.一种报关信息处理装置,其特征在于,包括:

报关材料文件确定单元,用于确定待生成的报关单关联的报关材料文件;

命名实体识别单元,用于对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

推荐信息提供单元,用于在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

16.一种报关信息处理装置,其特征在于,包括:

报关材料文件确定单元,用于确定待生成的报关单关联的报关材料文件;

命名实体对识别单元,用于对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体对,其中,所述命名实体对中的两个命名实体对应同一字段的名称与内容信息,所述命名实体包括:所述文本信息内容中的连续字符片段;

匹配单元,用于根据所述同一字段的名称与内容信息之间的对应关系信息,将代表字段内容的命名实体自动匹配到所述报关单中对应的字段中;

推荐信息提供单元,用于在针对所述报关单中未自动匹配成功的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

17.一种生成报关单的装置,其特征在于,包括:

报关材料文件确定单元,用于确定待生成的报关单关联的报关材料文件;

命名实体识别单元,用于对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

推荐信息提供单元,用于在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息;

报关单生成单元,用于根据所述目标字段中的已输入信息,生成所述报关单。

18.一种待申报信息处理装置,其特征在于,包括:

申报材料文件确定单元,用于确定待生成的待申报信息关联的申报材料文件;

命名实体识别单元,用于对所述申报材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

推荐信息提供单元,用于在针对所述待申报信息中的目标字段进行信息录入操作的过程中,根据从所述申报材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

19.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至14任一项所述的方法的步骤。

20.一种电子设备,其特征在于,包括:

一个或多个处理器;以及

与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行权利要求1至14任一项所述的方法的步骤。


技术总结
本申请实施例公开了报关信息处理方法、装置及电子设备,所述方法包括:确定待生成的报关单关联的报关材料文件;对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。通过本申请实施例,可以提升报关单生成效率,同时降低由于手动输入过程造成的输入错误等情况的发生概率。

技术研发人员:李清刚;蒋磊;赵方州;郑婷婷;王楚精;周明波
受保护的技术使用者:阿里巴巴新加坡控股有限公司
技术研发日:2021.03.12
技术公布日:2021.08.24
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1