信息抽取模型的训练方法、信息抽取方法以及装置与流程

文档序号：34597995发布日期：2023-06-28 21:52阅读：46来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本公开涉及人工智能，尤其涉及深度学习以及自然语言处理领域。

背景技术：

1、目前，为了实现信息抽取，可以采用全监督的方式训练信息抽取模型，以利用信息抽取模型在文本中进行信息抽取。一般来说，为了提升模型性能，需要获取大量标注数据，以基于大量标注数据将模型训练至收敛。

技术实现思路

1、本公开提供了一种信息抽取模型的训练方法、信息抽取方法以及装置。

2、根据本公开的一方面，提供了一种信息抽取模型的训练方法，包括：

3、基于初始化的目标模型执行n次迭代操作，得到信息抽取模型；其中，n为大于1的整数；

4、其中，n次迭代操作中的第i次迭代操作包括：

5、基于当前的行业数据占比，在第一数据集中提取通用数据和/或至少一个行业的行业数据，得到第二数据集；其中，当前的行业数据占比大于第i-1次迭代操作中的行业数据占比，i为不大于n的正整数；

6、基于第二数据集，对第i-1次更新的目标模型进行训练，得到第i次更新的目标模型；

7、在符合第一预设条件的情况下，将第i次更新的目标模型作为信息抽取模型。

8、根据本公开的另一方面，提供了一种信息抽取方法，包括：

9、利用信息抽取模型，在待处理文本中抽取目标信息；其中，信息抽取模型是基于本公开实施例中任一的模型训练方法训练得到的。

10、根据本公开的另一方面，提供了一种信息抽取模型的训练装置，包括：

11、第一迭代模块，用于基于初始化的目标模型执行n次迭代操作，得到信息抽取模型；其中，n为正整数；

12、其中，第一迭代模块包括：

13、数据确定单元，用于基于当前的行业数据占比，在第一数据集中提取通用数据和/或至少一个行业的行业数据，得到第二数据集；其中，当前的行业数据占比大于第i-1次迭代操作中的行业数据占比，i为不大于n的正整数；

14、第一训练单元，用于基于第二数据集，对第i-1次更新的目标模型进行训练，得到第i次更新的目标模型；

15、第一确认单元，用于在符合第一预设条件的情况下，将第i次更新的目标模型作为信息抽取模型。

16、根据本公开的另一方面，提供了一种信息抽取装置，包括：

17、模型处理模块，用于利用信息抽取模型，在待处理文本中抽取目标信息；其中，信息抽取模型是基于本公开实施例中任一的模型训练装置训练得到的。

18、根据本公开的另一方面，提供了一种电子设备，包括：

19、至少一个处理器；以及

20、与该至少一个处理器通信连接的存储器；其中，

21、该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行本公开实施例中任一的方法。

22、根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。

23、根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。

24、根据本公开实施例的技术方案，可以降低数据标注的人工成本和资源。

25、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种信息抽取模型的训练方法，包括：

2.根据权利要求1所述的方法，其中，所述第i次迭代操作还包括：

3.根据权利要求1或2所述的方法，其中，所述第i次迭代操作还包括：

4.根据权利要求3所述的方法，其中，所述基于所述预测结果，在所述第一数据集中的至少一个行业数据子集中，确定出非相关行业数据子集，包括：

5.一种信息抽取方法，包括：

6.根据权利要求5所述的方法，其中，所述利用信息抽取模型，在待处理文本中抽取目标信息，包括：

7.根据权利要求6所述的方法，其中，所述将待处理文本、抽取类型以及抽取信息结构输入所述信息抽取模型，得到所述待处理文本中的目标信息，包括：

8.根据权利要求7所述的方法，其中，所述将待处理文本、抽取类型以及抽取信息结构输入所述信息抽取模型，得到所述待处理文本中的目标信息，还包括：

9.一种信息抽取模型的训练装置，包括：

10.根据权利要求9所述的装置，其中，所述第一迭代模块还包括：

11.根据权利要求9或10所述的装置，其中，所述第一迭代模块还包括：

12.根据权利要求11所述的装置，其中，所述筛选单元用于：

13.一种信息抽取装置，包括：

14.根据权利要求13所述的装置，其中，所述模型处理模块用于：

15.根据权利要求14所述的装置，其中，所述模型处理模块用于：

16.根据权利要求15所述的装置，其中，所述模型处理模块还用于：

17.一种电子设备，包括：

18.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。

19.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-8中任一项所述的方法。

技术总结
本公开提供了一种信息抽取模型的训练方法、信息抽取方法以及装置，涉及人工智能技术领域，尤其涉及深度学习以及自然语言处理领域。具体实现方案为：基于初始化的目标模型执行N次迭代操作，得到信息抽取模型；其中，N次迭代操作中的第i次迭代操作包括：基于当前的行业数据占比，在第一数据集中提取通用数据和/或至少一个行业的行业数据，得到第二数据集，当前的行业数据占比大于第i‑1次迭代操作中的行业数据占比，i为不大于N的正整数；基于第二数据集，对第i‑1次更新的目标模型进行训练，得到第i次更新的目标模型；在符合第一预设条件的情况下，将第i次更新的目标模型作为信息抽取模型。本公开可以降低数据标注的人工成本和资源。

技术研发人员：刘剑,孙建东,史亚冰,蒋烨
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘剑孙建东史亚冰蒋烨
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。