本发明涉及计算机,特别涉及预测模型的构建方法和数据预测方法。
背景技术:
1、制造业需要大量的数据分析任务。例如,在造船业,装配机械的机械运行状态预测(mosp)任务对于安全操作至关重要,而合金熔体的熔体粘度预测(mvp)任务对于船用钢很重要板材生产。这些任务传统上是通过机理模型(mm)来完成的。除此之外,最近,神经网络(nn)越来越多地应用于制造业。面对mm和nn各有优缺点,因此它们也被结合在一起,将mm嵌入深度网络中,称为机理引导的神经网络框架(mnnf)。然而现有的mnnf通常是针对特定任务或mm类型而定制的,需要花费大量的领域专家精力和时间,并且还不能满足很多工业应用中的要求。
技术实现思路
1、本发明的目的在于提供预测模型的构建方法和数据预测方法方法、装置、设备集群、介质和计算机程序产品,解决如何利用多示例互连、实现自适应误差修正和多机理模型集成的技术问题。
2、本发明的第一实施方式公开了一种数据预测模型的构建方法,用于客户端,包括:
3、使用反向传播训练得到所述数据预测模型,其中,
4、所述数据预测模型包括参数识别模块和机理模型;
5、所述参数识别模块基于低级已知数据和/或高级已知数据,确定所述机理模型的可变参数的值;所述机理模型基于确定的所述可变参数的值和低级已知数据,预测得到目标数据;所述高级已知数据由具有相互关系的多个低级已知数据组成。
6、可选地,所述参数识别模块包括特征学习器和参数标识器,所述特征学习器从低级已知数据和/或高级已知数据中学习特征,所述参数标识器基于学习的所述特征确定所述可变参数的值。
7、可选地,所述可变参数包括依赖低级已知数据而变化的低级可变参数,和依赖高级已知数据而变化的高级可变参数。
8、可选地,
9、所述特征学习器包括低级特征学习器和高级特征学习器;所述低级特征学习器从低级已知数据学习低级特征,所述高级特征学习器从高级已知数据学习高级特征;
10、所述参数标识器包括低级参数标识器和高级参数标识器,所述低级参数标识器基于低级特征和高级特征确定低级可变参数的值,所述高级参数标识器基于高级特征确定高级可变参数的值。
11、可选地,所述低级已知数据是依赖时刻的数据点,所述高级数据是时间序列。
12、可选地,所述低级特征学习器从实时的所述数据点学习低级特征,所述高级特征学习器从实时更新的时间序列学习高级特征;
13、所述机理模型基于确定的低级可变参数的值、高级可变参数的值和实时的所述数据点,预测所述目标数据。
14、可选地,所述低级已知数据包括:像素点或图像块、视频帧或视频片段、三维点或三维点簇;
15、当所述低级已知数据是像素点或图像块时,所述高级已知数据是图像;
16、当所述低级已知数据是视频帧或视频片段时,所述高级已知数据是视频;
17、当所述低级已知数据是三维点或三维点簇时,所述高级已知数据是三维点云。
18、可选地,所述数据预测模型还包括对所述目标数据进行误差修正的误差修正模块;
19、所述误差修正模块包括误差估计器,所述误差估计器以所述目标数据为输入,输出误差项向量e;所述误差估计器的架构是:
20、
21、其中,⊙表示逐元素乘法;g(·)是多层感知器,输出与e长度相同的向量;tanh是双曲正切函数;β是误差界限向量;
22、所述误差修正模块将所述误差项向量e添加到所述目标数据得到修正后的目标数据
23、可选地,还包括:删除所述机理模型中内置的误差项。
24、可选地,所述数据预测模型使用标准反向传播进行训练,并且对于带有真实标签y的训练样本,所述数据预测模型的目标函数为:
25、
26、其中,是主要损失,是惩罚项,其中是预定的模板损失函数,λ是超参数。
27、可选地,所述机理模型还包括不依赖于所述低级已知数据和所述高级已知数据的常量参数,所述常量参数被所述数据预测模型学习。
28、可选地,所述数据预测模型包括多个所述机理模型;并且所述数据预测模型还包括注意力聚合器,所述注意力聚合器将多个所述机理模型的预测的目标数据进行聚合。
29、可选地,所述注意力聚合器将多个所述机理模型的预测的目标数据进行加权平均,得到聚合后的目标数据,其中权重向量w是:
30、
31、其中,矩阵的各列分别是所述多个所述机理模型中的一个预测的目标数据,h(·)是多层感知机,softmax函数将权重之和标准化为1。
32、可选地,所述数据预测模型使用标准反向传播进行训练,并且对于带有真实标签y的训练样本,所述数据预测模型的目标函数为:
33、
34、m是所述机理模型的数量,是修正后的聚合后的目标数据,是未修正的聚合后的目标数据,是第i个所述机理模型预测的目标数据,是预定的模板损失函数。
35、本发明的第二实施方式公开了一种数据预测方法,用于客户端,包括使用根据本发明的第一实施方式公开的方法构建的数据预测模型,基于已知数据,预测得到目标数据。
36、本发明的第三实施方式公开了一种数据预测模型的构建装置,包括:
37、训练模块,使用反向传播训练得到所述数据预测模型,其中,
38、所述数据预测模型包括参数识别模块和机理模型;
39、所述参数识别模块基于低级已知数据和/或高级已知数据,确定所述机理模型的可变参数的值;所述机理模型基于确定的所述可变参数的值和低级已知数据,预测得到目标数据;所述高级已知数据由具有相互关系的多个低级已知数据组成。
40、本发明的第四实施方式公开了一种数据预测装置,包括:数据预测模块,使用根据第三实施方式公开的装置构建的数据预测模型,基于已知数据,预测得到目标数据。
41、本发明的第五实施方式公开了一种计算设备集群,包括至少一个计算设备,每个计算设备包括处理器和存储器;所述至少一个计算设备的处理器用于执行所述至少一个计算设备的存储器中存储的指令,以使得所述计算设备集群执行根据本发明的第一实施方式公开的数据预测模型的构建方法,或者根据本发明的第二实施方式公开的数据预测方法。
42、本发明的第六实施方式公开了一种包含指令的计算机程序产品,当所述指令被计算设备集群运行时,使得所述计算设备集群执行根据本发明的第一实施方式公开的数据预测模型的构建方法,或者根据本发明的第二实施方式公开的数据预测方法。
43、本发明的第七实施方式公开了一种计算机可读取存储介质,包括计算机程序指令,当所述计算机程序指令由计算设备集群执行时,所述计算设备集群执行根据本发明的第一实施方式公开的数据预测模型的构建方法,或者根据本发明的第二实施方式公开的数据预测方法。
44、本发明实施方式与现有技术相比,主要区别及其效果在于:
45、在本发明中,数据预测模型包括参数识别模块和机理模型;参数识别模块基于低级已知数据和/或高级已知数据,确定机理模型的可变参数的值;机理模型基于确定的可变参数的值和低级已知数据,预测得到目标数据;高级已知数据由具有相互关系的多个低级已知数据组成。实现了多示例互连的利用、自适应误差修正、和多机理模型集成。