模型训练方法、装置及计算机存储介质与流程

文档序号：37275348发布日期：2024-03-12 21:08阅读：16来源：国知局

本技术涉及人工智能，尤其涉及一种模型训练方法、装置及计算机存储介质。

背景技术：

1、结构化数据在生产生活中广泛存在。比如，在工业领域，生产过程中的厂况数据与产量质量数据一般以结构化数据的形式保存；在销售环节，产品的特征、天气信息等于销量的关系同样以结构化数据的形式保存，基于结构化数据进行的预测、分类任务在生产生活中是普遍的和急需的。

2、目前，针对结构化数据，可以采用基于深度学习的预测方法，基于深度学习的预测方法是基于数据驱动的预测方法，需要大量的具有标签的数据，根据数据的规律学习出输入和输出的映射关系。具体地，可以通过模型集成的方式，实现结构化数据的预测。其中模型集成指示了多个子网络模型的输出进行加权融合。对于不同任务而言集成方法有所不同，对分类任务而言通常对多个子网络模型输出进行投票融合，对于回归任务而言通常对多个子网络模型输出进行平均融合。

3、但是，模型集成的方法通过对不同子模型输出的结果的加权或平均融合，使得模型集成的方式得到的预测结果可能不能准确的反应实际情况。

4、公开于该背景技术部分的信息仅仅旨在增加对本技术的总体背景的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。

技术实现思路

1、本技术实施例提供了一种模型训练方法、装置及计算机存储介质，通过学习多个基模型之间的关系，对多个基模型各自的预测结果进行融合，确保针对结构化数据的预测结果的准确性。

2、第一方面，本技术实施例提供了一种模型训练方法，该方法包括：确定业务对象；基于第一样本集，确定算法池中的各算法各自对应的评估结果；其中，第一样本集利用业务对象的第一结构化数据构建；评估结果指示了对应的算法分别与多个超参数组合形成的模型的性能；基于算法池中的各算法各自的评估结果，从算法池中选择n个基算法和n个基算法各自对应的超参数组合，构建多个基模型；基于第一样本集和多个基模型，训练预先设置的图网络模型；其中，图网络模型用于基于学习到的多个基模型针对业务对象之间的关系，融合多个基模型各自针对第一样本集中的任一样本的第一预测结果，输出融合第一预测结果后的第二预测结果；基于多个基模型和训练好的图网络模型实现业务对象的预测。

3、本方案中，通过学习多个基模型之间的关系，对多个基模型各自的预测结果进行融合，确保针对结构化数据的预测结果的准确性。

4、然后描述确定评估结果的详细过程，在一种可能的实现方式中，基于第一样本集，确定算法池中的各算法各自对应的评估结果，包括：对于算法池中的任一算法，对第一样本集进行采样，确定针对该算法的训练集；确定针对该算法的多个超参数组合；基于训练集，对多个超参数组合分别和该算法构建的模型进行训练后评估，得到多个超参数组合的评估结果。

5、对于上述确定评估结果的实现方式，为了确保不同算法可以学习到不同数据分布下的知识，可选地，采样为有放回的采样。

6、本方案中，不同算法通过有放回采样得到的训练集的数据分布不同，从而使得不同的算法可以学习到样本集的不同的特征，确保后续针对结构化数据的预测结果的准确性。

7、为了节约存储空间，在一种可能的实现方式中，多个超参数组合的评估结果采用最小堆的方式存储。在采用最小堆的方式存储评估结果时，可选地，基于算法池中的各算法各自的评估结果，从算法池中选择n个基算法和n个基算法各自对应的超参数组合，构建多个基模型，包括：基于算法池中各算法各自的评估结果，选择n个基算法；对于n个基算法中的每个基算法，从该基算法对应的最小堆中选取至少一个超参数组合，基于该基算法，构建至少一个超参数组合各自对应的基模型。

8、本方案中，采用最小堆的方式存储评估结果，可以节约存储空间。

9、进一步地，在实际应用中，需要进行模型更新，则在一种可能的实现方式中，方法还包括：确定第二样本集；其中，第二样本集利用业务对象的第二结构化数据构建；至少基于第二样本集对多个基模型进行更新；基于更新后的多个基模型和第二样本集，更新训练好的图网络模型。

10、本方案中，至少通过第二样本集实现多个基模型的更新，直接采用增量的方式更新图网络模型，实现模型更新，确保后续针对结构化数据的预测结果的准确性。

11、在模型更新过程中，存在多种情况。

12、情况1，业务对象为关于时序的预测任务。则在一种可能的实现方式中，至少基于第二样本集对多个基模型进行更新，包括：在业务对象为关于时序的预测任务时，删除第一样本集中在时间上最早的数据，增加第二样本集中的数据，得到第三样本集；基于第三样本集对多个基模型进行更新。

13、情况1，业务对象并不是关于时序的预测任务。则在一种可能的实现方式中，在业务对象为时序无关的预测任务时，对于多个基模型中每个基模型，确定该基模型是否支持增量更新，在该基模型支持增量更新时，基于第二样本集对该基模型进行增量更新；在该基模型不支持增量更新时，确定第一样本集和第二样本集之间的相似度，在相似度不满足相似条件时，基于第二样本集对该基模型进行训练；在相似度满足相似条件时，基于第一样本集和第二样本集，对该基模型进行训练。

14、另外，考虑到多个基模型在第二样本集的表现可能不同，有的很好，有的很差，为了更快速实现模型更新以及确保模型预测精度，在一种可能的实现方式中，方法还包括：对于多个基模型中的每个基模型，确定该基模型针对第二样本集的预测精度，在基于预测精度确定该基模型需要删除时，从多个基模型中删除该基模型。

15、本方案中，可以删除部分预测精度较低的基模型，不仅可以在一定程序上减少计算量，也可以快速实现模型更新。

16、第二方面，本技术实施例提供了一种模型训练装置，所述模型训练装置包括若干个模块，各个模块用于执行本技术实施例第一方面提供的模型训练方法中的各个步骤，关于模块的划分在此不做限制。该模型训练装置各个模块所执行的具体功能及达到的有益效果请参考本技术第一方面提供的模型训练方法的各个步骤的功能，在此不再赘述。

17、第三方面，本技术实施例提供了一种模型训练装置，包括：至少一个存储器，用于存储程序；至少一个处理器，用于执行存储器存储的程序，当存储器存储的程序被执行时，处理器用于执行第一方面中所提供的方法。

18、第四方面，本技术实施例提供了一种模型训练装置，其特征在于，装置运行计算机程序指令，以执行第一方面中所提供的方法。示例性的，该装置可以为芯片，或处理器。

19、在一个例子中，该装置可以包括处理器，该处理器可以与存储器耦合，读取存储器中的指令并根据该指令执行第一方面中所提供的方法。其中，该存储器可以集成在芯片或处理器中，也可以独立于芯片或处理器之外。

20、第五方面，本技术实施例提供了一种计算机存储介质，计算机存储介质中存储有指令，当指令在计算机上运行时，使得计算机执行第一方面中所提供的方法。

21、第六方面，本技术实施例提供了一种包含指令的计算机程序产品，当指令在计算机上运行时，使得计算机执行第一方面中所提供的方法。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王志宇,常建龙,李城梁,司宏杰,田奇
技术所有人：华为云计算技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。