一种预测模型的训练方法、装置、电子设备及存储介质与流程

文档序号：34759329发布日期：2023-07-13 04:43阅读：27来源：国知局

本申请实施例涉及人工智能，尤其涉及一种预测模型的训练方法、装置、电子设备及存储介质。

背景技术：

1、招投标是一种由组织开展的一种择优成交的方式。当招标方进行招标时，需要收集来自各个企业的投标书，并根据每一个投标书的内容确定合作的企业，但是一些企业为了增加合作概率存在围标串标行为，从而谋取利益，扰乱市场秩序。目前，招标过程中大多采用人工的方式对招标数据进行围标串标的分析，一方面增加工作人员的工作量，另一方面影响了投标工作进度，并且对投标公司的选择上，主观性较高且准确性较低。

2、目前的围标串标算法可以解决上述人工成本高，主观性较高的问题，依据企业的基础信息进行字段值匹配，通过特定的重复规则定义最后的正负结果，但是上述方式只能在业务中进行浅层面的诊断，无法满足更多层级的需求。另外，在现有的辅助预测方法中，一些低级功能可以基于管理经验赋予每个物理信息一个或者若干个关联系数，从而通过预测模型对围标串标进行分析。但是在特定的业务场景下，能够用于机器学习的传统样本非常有限，这样可能无法有效地针对预测模型进行训练，或者导致预测模型的输出结果出现偏差，预测精度较低。

技术实现思路

1、本申请提供一种预测模型的训练方法、装置、电子设备及存储介质，可以有效地为传统的机器学习补充新的业务样本，从而可以使得预测模型的输出结果更加准确，预测精度更高。

2、第一方面，本申请实施例提供了一种预测模型的训练方法，所述方法包括：

3、若通用预测模型不满足预先设定的收敛条件，则在预先构建的业务数据库中提取出至少一个业务样本作为当前业务样本；

4、将各个当前业务样本以及预先定义的各个当前业务样本对应的风险等级系数和训练权重系数输入至通用预测模型中，通过所述通用预测模型在所述至少一个当前业务样本中筛选出至少一个高价值样本；

5、将所述至少一个高价值样本输入至预先训练好的大语言预测模型中，通过所述大语言预测模型输出各个高价值样本中的各个词根所关联的预测词语以及各个预测词语对应的权重值；

6、基于各个词根所关联的预测词语以及各个预测词语对应的权重值，在公开信息库中获取至少一个新的业务样本，并基于所述至少一个新的业务样本对所述通用预测模型进行训练；重复执行上述操作，直到所述通用预测模型满足所述预先设定的收敛条件。

7、第二方面，本申请实施例还提供了一种预测模型的训练装置，所述装置包括：提取模块、筛选模块、关联模块和训练模块；其中，

8、所述提取模块，用于若通用预测模型不满足预先设定的收敛条件，则在预先构建的业务数据库中提取出至少一个业务样本作为当前业务样本；

9、所述筛选模块，用于将各个当前业务样本以及预先定义的各个当前业务样本对应的风险等级系数和训练权重系数输入至通用预测模型中，通过所述通用预测模型在所述至少一个当前业务样本中筛选出至少一个高价值样本；

10、所述关联模块，用于将所述至少一个高价值样本输入至预先训练好的大语言预测模型中，通过所述大语言预测模型输出各个高价值样本中的各个词根所关联的预测词语以及各个预测词语对应的权重值；

11、所述训练模块，用于基于各个词根所关联的预测词语以及各个预测词语对应的权重值，在公开信息库中获取至少一个新的业务样本，并基于所述至少一个新的业务样本对所述通用预测模型进行训练；重复执行上述操作，直到所述通用预测模型满足所述预先设定的收敛条件。

12、第三方面，本申请实施例提供了一种电子设备，包括：

13、一个或多个处理器；

14、存储器，用于存储一个或多个程序，

15、当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本申请任意实施例所述的预测模型的训练方法。

16、第四方面，本申请实施例提供了一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现本申请任意实施例所述的预测模型的训练方法。

17、本申请实施例提出了一种预测模型的训练方法、装置、电子设备及存储介质，先在预先构建的业务数据库中提取出至少一个业务样本作为当前业务样本；然后将各个当前业务样本以及预先定义的各个当前业务样本对应的风险等级系数和训练权重系数输入至通用预测模型中，通过该通用预测模型在该至少一个当前业务样本中筛选出至少一个高价值样本；接着将该至少一个高价值样本输入至预先训练好的大语言预测模型中，通过该大语言预测模型输出各个高价值样本中的各个词根所关联的预测词语以及各个预测词语对应的权重值；再基于各个词根所关联的预测词语以及各个预测词语对应的权重值，在公开信息库中获取至少一个新的业务样本，并基于该至少一个新的业务样本对通用预测模型进行训练。也就是说，在本申请的技术方案中，可以通过大语言预测模型生成至少一个新的业务样本，从而可以基于新的业务样本对通用预测模型进行训练。进一步地，还可以通过通用预测模型在业务样本中筛选出高价值样本，从而可以保证新的业务样本的有效性和准确性。而在现有技术中，通过特定的重复规则定义最后的正负结果，在特定的业务场景下，能够用于机器学习的传统样本非常有限，无法有效地针对预测模型进行训练，或者导致预测模型的输出结果出现偏差，预测精度较低。因此，和现有技术相比，本申请实施例提出的预测模型的训练方法、装置、电子设备及存储介质，可以有效地为传统的机器学习补充新的业务样本，从而可以使得预测模型的输出结果更加准确，预测精度更高；并且，本申请实施例的技术方案实现简单方便、便于普及，适用范围更广。

技术特征：

1.一种预测模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在将各个当前业务样本以及预先定义的各个当前业务样本对应的风险等级系数和训练权重系数输入至通用预测模型中之前，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，根据各个训练样本与各个测试样本之间的距离，在所述n个业务样本中提取出m个业务样本，包括：

4.根据权利要求3所述的方法，其特征在于，在与各个测试样本的距离最小的k个训练样本中提取出m个业务样本，包括：

5.根据权利要求2所述的方法，其特征在于，计算各个训练样本与各个测试样本之间的距离，包括：

6.根据权利要求2所述的方法，其特征在于，在将预先获取的n个业务样本划分为x个测试样本和y个训练样本之前，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，通过所述通用预测模型在所述至少一个当前业务样本中筛选出至少一个高价值样本，包括：

8.根据权利要求1所述的方法，其特征在于，通过所述大语言预测模型输出各个高价值样本中的各个词根所关联的预测词语，包括：

9.根据权利要求8所述的方法，其特征在于，基于各个核心文本生成至少一个关联文本，包括：

10.根据权利要求1所述的方法，其特征在于，基于各个词根所关联的预测词语以及各个预测词语对应的权重值，在公开信息库中获取至少一个新的业务样本，包括：

11.根据权利要求1所述的方法，其特征在于，所述方法还包括：

12.根据权利要求11所述的方法，其特征在于，计算所述待预测的业务样本对应的标准预测结果，包括：

13.根据权利要求11所述的方法，其特征在于，计算所述待预测的业务样本对应的平均预测结果，包括：

14.一种预测模型的训练装置，其特征在于，所述装置包括：提取模块、筛选模块、关联模块和训练模块；其中，

15.一种电子设备，其特征在于，包括：

16.一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至13中任一项所述的预测模型的训练方法。

技术总结
本申请公开了一种预测模型的训练方法、装置、电子设备及存储介质；该方法包括：在业务数据库中提取出业务样本作为当前业务样本；将当前业务样本及其对应的风险等级系数和训练权重系数输入至通用预测模型中，通过通用预测模型筛选出高价值样本；将高价值样本输入至大语言预测模型中，通过大语言预测模型输出高价值样本中的各个词根所关联的预测词语以及各个预测词语对应的权重值；基于各个词根所关联的预测词语以及各个预测词语对应的权重值，在公开信息库中获取新的业务样本，并基于新的业务样本对通用预测模型进行训练。本申请实施例可以有效地为传统的机器学习补充新的业务样本，从而可以使得预测模型的输出结果更加准确，预测精度更高。

技术研发人员：郭树龙,谢栋杰,付永善,杨华,韩拓,栾成龙,张丽
受保护的技术使用者：天津市津能工程管理有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郭树龙谢栋杰付永善杨华韩拓栾成龙张丽
技术所有人：天津市津能工程管理有限公司
我是此专利的发明人

上一篇：具有高尺寸稳定性的聚酰亚胺膜及其制造方法与流程
上一篇：一种掌上游戏机多功能散热背夹的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。