一种基于时间点标签的多维时序数据神经网络建模方法及装置

文档序号:33649372发布日期:2023-03-29 06:48阅读:86来源:国知局
一种基于时间点标签的多维时序数据神经网络建模方法及装置

1.本发明属于计算方法领域,是一种基于时间点标签的多维时序数据神经网络建模方法及装置。


背景技术:

2.建立一种对多维数据时间序列建立神经网络模型的方法,实现对系统单位时间状态变化的驱动机制学习,并利用神经网络模型模拟系统内在机制的时序变化,是人工智能领域对时序分析的一个重要目标。
3.例如,生物发酵过程的时序数据建模与预测是实现高效生物制造的一项重要技术。发酵过程的时序数据是指,在微生物的发酵过程中,在各个时间点采集的具有时间点标签的序列数据,每个时间点包括一组固定的指标,常见的指标包括代谢组数据、发酵工艺数据、转录组数据。发酵过程时序数据建模与预测的目的是通过模拟探索发酵规律,优化发酵过程,以获得更好的经济和社会效益。
4.上述方法在学习模型参数时,通常将一个批次的系统多维度状态变化曲线作为一个学习案例,且要求全部学习案例中的状态指标不能缺失。在实际应用中,很多对系统状态的追踪观察,因样本检测问题,无法做到无缺失指标和无缺失时间点。这样的残缺时序数据无法被学习,造成可学习数据的浪费。一般解决缺失数据的方式是插值,常用的插值方法基本是针对单一维度数据进行分析插值,忽略了多维数据相互之间的关联性;同时,通过独立于模型学习方法的插值方法补全的缺失数据,补全数据的机制与驱动时间序列变化的机制很难相符,造成补全的数据存在系统误差,不能有效支撑时序机制的高精度建模。
5.在多维时序数据建模的应用场景中,时序数据多为高维小样本数据,即数据维数高,样本绝对数量很少或样本数远小于数据维数;同时,所有维度的数据并非独立变化,存在较强的数据维度间的相关性,数据维度远大于决定数据差异的独立因子的个数。直接以数据的维度作为输入的模型复杂度大,容易引发“维数灾难”,即随着维数增高,计算复杂度显著增高。维度的增加也会导致模型训练所需的样本量变大,当实际观察的数据量不足时,容易出现过拟合现象,即模型仅记住了训练数据本身的特征而不是拟合了训练数据间的内在关联,降低模型的泛化能力。为了消除或减轻维数灾难,同时提升学习模型的泛化能力,将提取观察数据的特征,降低观察数据的维度是多维时序数据建模的一项重要任务。
6.目前的降维方法,在多维时序数据的建模过程中,通常作为一种前处理步骤独立完成。方法主要有主成分分析、独立分量分析、滤波分析、因子分析等。作为一种前处理步骤,降维过程和模型学习过程是独立的。降维方法的目标是提取特定统计意义下包含数据主要信息的特征因子,例如决定指标变化或指标独立性的特征因子,而这些特征因子不一定与驱动时间序列变化的机制的关键因子相符,不能很好地支撑在低维特征因子空间内的时序机制的建模。同时,这些作为前处理的降维方法,在应用中需要配合将特征因子转换为观察值的后处理方法。转换的过程可能存在误差放大的问题,即特征因子的微小误差可能
导致预测观察数据的较大误差。
7.综上所述,目前对存在缺失数据的高维小样本的时间序列建模具有以下不足:
8.1)存在时间点数据缺失或指标数据缺失的时序数据无法被学习;
9.2)观察数据的维度大,导致模型复杂度大,容易引发“维数灾难”,即随着维数增高,计算复杂度显著增高;
10.3)通过独立于模型学习方法的插值方法补全的缺失数据,不一定与驱动时间序列变化的机制相符,不能很好地支撑时序机制的建模;
11.4)通过独立于模型学习方法的特征提取方法提取的特征因子,不一定与驱动时间序列变化的机制的关键因子相符,不能很好地支撑在低维特征因子空间内的时序机制的建模;
12.5)将特征因子转换为观察值的后处理方法在转换的过程可能存在误差放大的问题,即特征因子的微小误差可能导致预测观察数据的较大误差。
13.6)大多数的时间序列建模方法不能直接对应时间序列的产生机制,无法提供时间序列的产生机制应该如何优化的线索。
14.为了解决上述问题,我们提出了一种允许存在缺失数据的在特征空间内进行的系统多维度状态变化时间序列数据建模的方法,用标签解码模块将观察值数据转换为特征数据,实现生成机制网络在特征空间内完成对时间序列生成机制的学习建模。标签解码模块和串联生成机制模块通过嵌合,实现了对含有缺失值观察数据的特征提取和时序生成机制学习能在同一框架下完成,通过降维解决了模型复杂度高容易过拟合的问题,同时还解决了插值与特征提取过程与机制学习目标的适配和特征数据到观察数据转换的误差放大问题。
15.上述神经网络方法,可以用于建模一个生物发酵体系的工作机制。发酵体系工作机制的神经网络模型可以针对发酵过程的多组学时间序列(一类可能存在缺失数据的高维小样本数据),根据当前的体系状态,计算一个单位时间之后的体系状态。这一生物发酵体系的时间序列状态变化的驱动机制模型,相比于一般意义上的时间序列状态变化的数值拟合模型,能够更好地反映工程菌的各类调控机制对发酵过程的影响,能更好地指导进行工程菌的基因组改造,获得更好的生产性能。


技术实现要素:

16.本发明公开了一种基于时间点标签的多维时序数据神经网络建模方法及装置,是一种允许存在缺失数据的在特征空间内进行的系统多维度状态变化时间序列数据建模的方法及装置,本发明是采用如下技术方案来实现的:
17.一种基于时间点标签的多维时序数据神经网络建模方法,包括以下步骤:
18.1)将原始观察数据进行规范化整理,得到形式统一的规范观察数据;
19.2)基于规范观察数据组织用于人工神经网络训练的训练例子;
20.3)设计人工神经网络的结构,建立人工神经网络模型;
21.4)利用步骤2)中的训练例子对步骤3)中建立的人工神经网络模型进行训练,得到人工神经网络的参数矩阵;
22.5)利用步骤2)中的训练例子,评估在设计人工神经网络结构的过程中使用的参数
以及在对建立的人工神经网络模型进行训练的过程中使用的参数对所得的人工神经网络模型的精度影响,选取不同的参数组合下最优的人工神经网络模型作为最终的结果模型;
23.6)基于最终结果模型,建立可以实现将观察数据转换为特征数据的编码器模块;
24.7)利用编码器模块构建针对不同时间间隔系统状态变化预测的嵌合预测结构;利用嵌合预测结构,基于测试例子评估模型准确性,并对真实应用场景下的系统状态变化做出预测;
25.步骤3)中设计的神经网络结构具有如下特征:
26.其基本结构为一个嵌合训练结构(f-(g)
n-d)的神经网络;嵌合训练结构依次由标签解码模块(f)、串联生成机制模块((g)n)、特征解码模块(d)三个模块组成;标签解码模块和特征解码模块分别实现标签数据到特征数据和特征数据到观察数据的转换,使串联生成机制模块可在特征空间内学习系统的工作机制;
27.串联生成机制模块中的一个神经网络单元可以对系统从当前状态变换为一个单位时间之后状态的工作机制进行建模,这样的网络单元称为单位时间正向变化生成器(g单元);通过g单元的串联可以实现对系统经过多个单位时间发生的变化建模,由多个g单元的串联组成串联生成机制模块((g)n);
28.步骤7)中嵌合预测结构具有如下特征:
29.嵌合预测结构依次由编码器模块(e)、串联生成机制模块((g)n)、特征解码模块(d)三个模块依次嵌合组成;编码器模块(e)和特征解码模块(d)分别实现观察数据到特征数据和特征数据到观察数据的转换,使串联生成机制模块可在特征空间内学习系统的工作机制。
30.作为进一步地改进,本发明所述的嵌合训练结构按如下方式建立:嵌合训练结构(f-(g)
n-d)依次由标签解码模块(f)、串联生成机制模块((g)n)、特征解码模块(d)三个模块组成,标签解码模块输入层神经元节点数为训练数据全部时间的总维数,输出层神经元节点数为特征数据维数,串联生成机制模块((g)n)由多个g单元串联得到,g单元每一层的神经元节点数均为特征数据维数,特征解码模块输入层神经元节点数为特征数据维数,输出层神经元节点数为观察数据维数。
31.作为进一步地改进,本发明所述的时间间隔个数为n的嵌合训练结构称为f-(g)
n-d:n=0时f-d中不包含g单元,其训练数据为起始时间点数据和终止时间点数据为同一个时间点的训练例子;n=1时f-(g)
1-d中仅包含1个g单元,其训练数据为时间间隔个数为1的训练例子;n>1时,f-(g)
n-d中的串联生成机制模块((g)n)由n个g单元串联得到,其训练数据为时间间隔个数为n的训练例子。
32.作为进一步地改进,本发明所述的步骤4)的训练方式具体为:
33.4.1)计算每个嵌合训练结构的损失值:对于特定的嵌合训练结构f-(g)
n-d,仅使用时间间隔为n的例子计算模型损失,将训练例子起始时间点的标签数据输入到对应时间间隔个数的嵌合训练结构中计算损失值(即时间间隔个数为n的训练例子的起始时间点的标签数据输入到嵌合训练结构(f-(g)
n-d)),训练数据输入嵌合训练结构后,通过前向传播得网络输出数据,由网络输出数据与真实数据计算嵌合训练结构的损失值,即把ti时间点的标签数据输入到嵌合训练结构f-(g)
n-d得到网络输出数据,由网络
输出数据与t
i+n
时间点的观察数据可得损失值loss,公式为可得损失值loss,公式为
34.4.2)在模型损失值的基础上,进行限制损失的反向传播层数的梯度计算:对时间间隔个数为0的嵌合训练结构,其仅包含标签解码模块和特征解码模块,此时训练例子的起始时间点数据和终止时间点数据为同一个时间点,更新特征解码模块和标签解码模块的权值参数,更新后的权值参数与其他嵌合训练结构中的标签解码模块和特征解码模块共享;对时间间隔个数为1的嵌合训练结构,其仅包含1个g单元,该网络使用误差反向传播训练机制,直接得到g单元和特征解码模块的更新梯度;时间间隔个数大于1的嵌合训练结构中的串联生成机制模块由多个g单元串联,采用误差反向传播机制计算梯度,截取最后一个g单元上的梯度作为g单元和特征解码模块的更新梯度;
35.4.3)在限制损失反向传播层数的梯度计算方法的基础上,将多个嵌合训练结构按顺序进行权值更新,并在顺序权值更新的过程中共享网络权值参数,具体实现为:对于不同时间间隔的嵌合训练结构,按照一定的顺序,计算嵌合训练结构的梯度,并使用梯度下降方法进行权值更新,一个嵌合训练结构更新后的权值参数立即共享到其它所有嵌合训练结构;
36.4.4)对k+1个嵌合训练结构f-d、f-(g)
1-d、f-(g)
2-d、f-(g)
3-d

f-(g)
k-d按照4.1)的方式输入对应时间间隔的训练例子,可以得到每个嵌合训练结构的损失值,然后判断是否每个嵌合训练结构的损失值都收敛,如果均己收敛,则进行下一步,否则继续步骤4.1)、4.2)、4.3),直至每个嵌合训练结构的损失值均收敛,得到结果模型。
37.作为进一步地改进,本发明所述的步骤5)具体指从模型超参数的层面对建模过程进行优化,在优化的过程中尝试调整再建模过程中使用的超参数,具体包括:特征维数;网络模块的结构参数(标签解码模块、串联生成机制模块、特征解码模块网络的每层节点数,隐藏层数量);梯度下降方法的学习率;每次训练投入训练数据例子数;循环训练的循环次数;采用上述超参数的不同组合完成建立神经网络结构和神经网络训练的工作,得到新的结果模型;评估每个超参数组合下结果模型对观察数据的拟合精度,选取最优模型。
38.作为进一步地改进,本发明所述的步骤6)具体指基于最终结果模型,建立可以实现观察数据转换为标签数据的编码器模块,基于经步骤5)得到的最优的特征解码器模块(d)的网络结构和网络权值两组参数,建立并训练可以实现观察数据转换为标签数据的编码器模块(e):
39.首先搭建编码器模块(e):为全连接神经网络,编码器模块(e)的输入层的节点数为观察数据维数r、隐藏层的节点数为s、隐藏层层数为f1、输出层的节点数为特征数据维数e;
40.然后训练得到最优的编码器模块(e):将编码器模块(e)和特征解码器模块(d)嵌合得到d-e嵌合训练结构,对d-e嵌合训练结构中特征解码器模块(d)固定设置为权利要求8最优的特征解码器模块(d)的网络权值参数,将m个批次的放线菌发酵数据作为训练数据训练更新d-e嵌合训练结构中编码器模块(e)的网络权值参数,d-e嵌合训练结构的输入数据和输出数据为同一批次相同时间点的四元组织形式数据,利用神经网络训练的随机梯度下降方法多次训练d-e嵌合训练结构直至模型损失值收敛,得到训练最优的编码器模块(e)的
网络权值参数。
41.作为进一步地改进,本发明所述的步骤7)具体指利用编码器模块构建针对不同时间间隔系统状态变化预测的嵌合预测结构,基于得到最优的g单元、特征解码器模块(d)和编码器模块(e),利用g单元、特征解码器模块(d)和编码器模块(e)构建针对不同时间间隔系统状态变化预测的嵌合预测结构(e-(g)
n-d),以实现将ti时间点的观察数据作为输入,预测ti时间点下系统状态在经过n个时间间隔以后的系统状态,将测试数据根据的四元组织形式,对同一批次内任意两个时间点的系统状态变化组织为训练例子,利用训练例子计算嵌合预测结构(e-(g)
n-d)预测不同时间间隔的系统状态改变时的精度。
42.作为进一步地改进,本发明所述的步骤1)具体为:经多个批次的观察得到多个批次的多维时间序列观察数据,每个批次的观察数据包括一组时间点,每个时间点的观察数据包括一组指标,每个指标的观察数据为一个具体的值;将多维时间序列观察数据整理为四元组的组织形式,即批次、时间、指标、值。根据现有数据的总时间点数,设置由时间标签标记的单位矩阵,其中时间标签标记的单位矩阵中第j列代表第j个时间点的标签数据;嵌合训练结构采用全连接结构。
43.作为进一步地改进,本发明所述的步骤2)具体为:选取同一批次内任意两个时间点(两个时间点可以为相同时间点),前一个时间点的训练数据用时间标签标记的单位矩阵中该时间点对应的标签数据表示,后一个时间点的训练数据为被建模系统的状态观察数据,将这两个时间点的数据组织为一个训练例子,得到一组具有不同时间间隔的训练例子,其中每个训练例子包括两个时间点的被建模系统的状态,当两个时间点不为相同时间点时,称较早的时间点的数据为该训练例子的起始时间点数据;称较晚的时间点的数据为该训练例子的结束时间点数据;当两个时间点为相同时间点时,起始时间点和结束时间点为同一个时间点;每个训练例子的起始时间点数据表示为标签数据,结束时间点数据表示为观察数据四元组的组织形式。
44.本发明还公开了一种基于时间点标签的多维时序数据神经网络建模装置,包括:
45.获取单元:用于将原始观察数据进行规范化整理,得到形式统一的规范观察数据;
46.组织单元:用于将基于规范观察数据组织用于人工神经网络训练的训练例子;
47.构建单元:用于设计人工神经网络的结构,建立人工神经网络模型;
48.训练单元:用于利用训练例子对建立的人工神经网络模型进行训练,得到人工神经网络的参数矩阵;
49.优化单元:用于利用训练例子,评估在设计人工神经网络结构的过程中使用的参数以及在对建立的人工神经网络模型进行训练的过程中使用的参数对所得的人工神经网络模型的精度影响,选取不同的参数组合下最优的人工神经网络模型作为最终的结果模型;
50.预测单元:基于最终结果模型,建立可以实现观察数据转换为标签数据的编码器模块;利用编码器模块构建针对不同时间间隔系统状态变化预测的嵌合预测结构,实现对于系统状态的预测;
51.所设计的神经网络结构具有如下特征:
52.其基本结构为一个嵌合训练结构(f-(g)
n-d)的神经网络;嵌合训练结构依次由标签解码模块(f)、串联生成机制模块((g)n)、特征解码模块(d)三个模块组成;标签解码模块
和特征解码模块分别实现标签数据到特征数据和特征数据到观察数据的转换,使串联生成机制模块可在特征空间内学习系统的工作机制;
53.串联生成机制模块中的一个神经网络单元可以对系统从当前状态变换为一个单位时间之后状态的工作机制进行建模,这样的网络单元称为单位时间正向变化生成器(g单元);通过g单元的串联可以实现对系统经过多个单位时间发生的变化建模,由多个g单元的串联组成串联生成机制模块((g)n);
54.嵌合预测结构具有如下特征:
55.嵌合预测结构依次由编码器模块(e)、串联生成机制模块((g)n)、特征解码模块(d)三个模块依次嵌合组成;编码器模块(e)和特征解码模块(d)分别实现观察数据到特征数据和特征数据到观察数据的转换,使串联生成机制模块可在特征空间内学习系统的工作机制。
56.本发明的有益效果如下:
57.1)通过标签解码模块(f)实现对时序数据的标签标记作用,可以实现对存在时间点数据缺失或指标数据缺失的时序数据进行学习,允许使用较少的样本得到较好的训练效果;
58.2)通过在标签解码模块和特征解码模块中嵌合串联的生成机制模型的网络结构,实现在统一的神经网络中完成允许观察缺失的特征提取和系统状态生成机制模型的训练,其训练误差在网络整体水平上计算,完成特征提取功能和生成机制模型功能的网络权重协同训练,可以达成特征提取网络和生成机制模型的适配,提升模型拟合精度;
59.3)通过在串联的生成机制模型的两侧添加标签解码模块和特征解码模块,使在特征空间工作的生成模型可以使用实际观察数据进行训练和预测,同时确保了生成机制模型输出的特征数据可以准确地还原为观察数据,有利于模型的应用。
附图说明
60.图1为嵌合训练结构训练步骤示意图;
61.图2为串联生成机制模块结构示意图;
62.图3为嵌合训练结构的损失限制性反向传播示意图;
63.图4为嵌合预测结构示意图。
具体实施方式
64.本发明设计的嵌合训练结构(f-(g)
n-d)包含三个模块:标签解码模块(f)、串联生成机制模块((g)n)、特征解码模块(d),可用于建模发酵生物体系的整体机制,包括菌体生理、催化反应、相应工艺和营养条件调控的机制。通过对这一机制模型的分析,可以得到机制优化的可能方案,指导对发酵过程的优化,包括对目标产物的产量预测、工程菌的基因组改造与发酵条件设计。本发明公开的方法通过以下步骤对发酵生物体系的整体机制建模。图1为嵌合训练结构训练步骤示意图。
65.1.整理时序数据格式为四元组织形式
66.建模分析的对象是“生物发酵体系”,生物发酵体系包括菌种和发酵环境,因此模型需要能够学习和预测反映菌种状态和发酵环境的指标。菌种状态和发酵环境可以通过多
种组学技术表征,发酵过程是由多个时间点组成的时间序列;因此,这些发酵时序数据可以整理为这样的四元组织形式:批次、时间、指标、值。发酵时序数据分为训练数据和测试数据。训练数据用于建立模型,测试数据用于评估模型的精度。
67.设训练数据和测试数据均为以阿卡波糖为目标产物的放线菌发酵过程中测量得到的时序数据,有(m+u)个批次(例如m=7,u=3),每个批次有(k+1)个时间点(例如k=10,每个时间点分别记为t1,t2,t3…
t
11
)。
68.对(m+u)个批次的放线菌发酵过程中每个批次对应的(k+1)个时间点的样本,通过质谱测定每个样本中的各类化合物的丰度,选定其中与阿卡波糖合成相关的化合物q个(例如q=196),从每个时间点的样本的化合物丰度报告中提取这q个化合物的丰度,作为该时间点生物发酵系统状态的观察值,质谱没有观测到的化合物丰度记为缺失。记在这批样本中,其中第2个批次的t3时间点和第3批次的t2时间点,由于样本测定的实验失败,造成数据缺失。
69.将(m+u)个批次的放线菌发酵数据分为训练数据和测试数据,其中有m个批次为训练数据批次,有u个批次为测试数据批次。因此,所有数据共有(m+u)个批次,每个批次有(k+1)个时间点(t1,t2,t3…
t
k+1
),每个时间点有q维指标数据值,其中第m个批次中第p个时间点的q维数据表示为
70.根据现有时间序列的时间点数,设置时间标签标记的单位矩阵:
71.放线菌发酵训练数据有m个批次,每个批次有(k+1)个时间点,所以数据总共有m(k+1)个时间点,时间标签标记的单位矩阵总为z维的单位矩阵iz,其中z=m(k+1)。时间标签标记的单位矩阵中第j列代表第j个时间点的标签数据其中第m个批次中第p个时间点标签数据表示为p≤k+1,m、p∈n
*

72.2.组织训练数据例子
73.将m个批次的放线菌发酵数据作为训练数据,根据步骤1中的四元组织形式和标签数据形式,对同一批次内任意两个时间点的标签数据和系统状态数据组织为一个例子,ta与tb分别表示例子的起始时间点和终止时间点,实例训练数据被组织为:
74.批次1例子集合d1:
75.批次2例子集合d2:
76.批次3例子集合d3:
77.批次m例子集合dm:
78.其中4≤m≤m-1,m∈n
*
79.批次m例子集合dm:
80.再将各个批次中的例子汇总,按照例子中ta与tb两个时间点间隔大小,被重新组织为:
[0081][0082]
3.为不同时间间隔的训练例子建立g单元的嵌合训练结构
[0083]
图2为串联生成机制模块结构示意图;搭建标签解码模块(f)和特征解码模块(d):两个模块均为全连接神经网络,标签解码模块(f)的输入层的节点数为训练数据的总时间点维数z,其中z=m(k+1)、隐藏层的节点数均为s、隐藏层层数为f1、输出层的节点数为特征数据维数e。特征解码模块(d)的输入层的节点数为特征数据维数e、隐藏层的节点数均为s、隐藏层层数为f1、输出层的节点数为观察数据维数r。用表示在第n个嵌合训练结构f-(g)
n-d中标签解码模块(f)和特征解码模块(d)的网络权值参数(为表示方便,网络权重参数和网络偏置参数统称为网络权值参数)。
[0084]
搭建串联生成机制模块((g)n):g单元的网络由输入层,隐藏层,输出层组成,其中每一层的节点数均为e,隐藏层层数为f2。对不同时间间隔的训练例子,根据其时间间隔个数来将g单元串联起来得到对应的串联生成机制模块:g、(g)2、(g)3…
(g)k,用表示为第n个嵌合训练结构f-(g)
n-d中串联生成机制模块(g)i的第j个g单元的网络权值参数。
[0085]
再由标签解码模块(f)、串联生成机制模块((g)n)、特征解码模块(d)三个模块依次嵌合组成嵌合训练结构(f-(g)
n-d)。
[0086]
各个嵌合训练结构参数具体为:
[0087]
f-d中没有g单元:权值参数有
[0088]
f-(g)
1-d中有1个g单元:权值参数有
[0089]
f-(g)
2-d中有2个g单元:权值参数有
[0090]
f-(g)
3-d中有3个g单元:权值参数有
[0091][0092]
f-(g)
k-d中有k个g单元:权值参数有
[0093]
对各个嵌合训练结构的g单元、ti模块和d模块初始权值参数设置为相同随机值:即:
[0094]
训练开始前时都等于训练开始前时都等于训练开始前时都等于训练开始前时都等于
[0095]
4.计算模型损失值
[0096]
将c组训练例子的起始时间点ta的标签数据,输入到对应时间间隔个数的嵌合训
练结构中计算损失值。即将集合练结构中计算损失值。即将集合中的c个起始时间点ta的标签数据输入f-(g)
n-d中,得到输出数据其中n≤k、n∈n。与tb时间点多维真实数据可计算得损失值lossn,计算公式为
[0097]
5.通过损失限制性反向传播计算梯度,通过顺序循环优化更新网络权值参数
[0098]
图3为嵌合训练结构的损失限制性反向传播示意图;对时间间隔个数为0时的嵌合训练结构,其仅包含标签解码模块和特征解码模块,更新特征解码模块和标签解码模块的权值参数。
[0099]
对时间间隔个数为1的嵌合训练结构,其仅包含1个g单元,该网络使用误差反向传播训练机制,直接得到g单元和特征解码模块的更新梯度。
[0100]
时间间隔个数大于1的嵌合训练结构中的串联生成机制模块由多个g单元串联,采用误差反向传播机制计算梯度,截取最后一个g单元上的梯度作为g单元和特征解码模块的更新梯度。具体计算公式为:
[0101]
对时间间隔个数为0时的嵌合训练结构,f-d只计算标签解码模块和特征解码模块的更新梯度,即
[0102][0103][0104]
对时间间隔个数为1的嵌合训练结构f-(g)
1-d,计算和特征解码模块的更新梯度,即
[0105][0106][0107]
对时间间隔个数为2的嵌合训练结构f-(g)
2-d,计算和特征解码模块的更新梯度,即
[0108][0109][0110]
对时间间隔个数为3的嵌合训练结构f-(g)
3-d,计算和特征解码模块的的更新
梯度,即
[0111][0112][0113]
对时间间隔个数为k的嵌合训练结构f-(g)
k-d,计算和特征解码模块的更新梯度,即
[0114][0115][0116]
上述梯度计算方法每次仅计算嵌合训练结构最后两个结构单元(当时间间隔为0时,仅计算为特征解码模块和标签解码模块的梯度,当时间间隔个数大于1时,仅计算最后一个g单元的梯度和标签解码模块的梯度),所以本发明将这一方法称为损失限制性反向传播。
[0117]
在上述方法计算所得的梯度基础上,对于不同时间间隔的嵌合训练结构,按照时间间隔个数大小顺序,先计算较小时间间隔的嵌合训练结构的梯度,并使用sgd随机梯度下降方法进行权重更新,更新后的权重共享到其它所有嵌合训练结构,本发明将这一训练方法称为顺序循环优化。设置循环训练中循环次数参数为h,其中第t次循环训练流程为:
[0118]
先计算f-d中标签解码模块和特征解码模块的更新梯度,即征解码模块的更新梯度,即其中,α表示sgd梯度下降方法的学习率;表示第t-1次循环训练训练结束时编码器模块和解码器模块更新后的权值参数,表示第t次循环编码器模块和解码器模块更新后的权值参数;将标签解码模块和特征解码模块更新后的梯度权值参数共享到其它嵌合训练结构中即:
[0119]
都等于都等于
[0120]
再计算f-(g)
1-d中单元和特征解码模块的更新权值,即单元和特征解码模块的更新权值,即其中,表示第t-1次循环训练训练结束时g1中单元更新后的权值参数,表示第t次循环g1中单元更新后的权值参数;
[0121]
将单元和特征解码模块更新后的梯度权值参数共享到其它嵌合训练结构中即:
[0122]
都等于
都等于
[0123]
计算f-(g)
2-d中单元和特征解码模块的更新权值,即单元和特征解码模块的更新权值,即再将单元和特征解码模块更新后的梯度权值参数共享到其它所有嵌合训练结构中。
[0124]
按照相同的计算方法以此更新f-(g)
3-d、f-(g)
4-d、e-(g)
5-d

f-(g)
k-d,当本循环训练计算到f-(g)
k-d中单元和特征解码模块更新完权值并共享到其它嵌合训练结构,本次循环训练结束,进入到下一次循环训练计算。
[0125]
6.在全部训练结构损失收敛后得到结果模型
[0126]
在第5步的每次循环训练后,对k+1个嵌合训练结构f-d、f-(g)
1-d、f-(g)
2-d、f-(g)
3-d

f-(g)
k-d按照第4步的方式输入对应时间间隔的全部训练例子,可以得到每个串联训练模块的全数据损失值。具体计算为:
[0127]
计算f-d的损失值,即d的损失值,即
[0128]
计算f-(g)
1-d的损失值,即d的损失值,即
[0129]
计算f-(g)
2-d的损失值,即d的损失值,即
[0130]
计算f-(g)
3-d的损失值,即
[0131][0132]
计算f-(g)
k-d的损失值,即
[0133][0134]
判断loss0,loss1,loss2,loss3,

,lossk是否都收敛,如果是,则进行下一步,否则继续步骤4和步骤5的计算,直至loss0,loss1,loss2,loss3,

,lossk都收敛。记训练过程经历片次循环后嵌合训练结构的整体损失收敛
[0135]
7.调整模型超参数,优化结果模型
[0136]
步骤6完成训练得到结果模型后,调整模型的超参数:特征维数e,网络模块的结构参数(标签解码模块和特征解码模块的隐藏层的节点数s、隐藏层层数f1;串联生成机制模块每层的节点数e,隐藏层层数为f2),sgd随机梯度下降方法的学习率α,单次循环训练投入训练例子数c,循环训练的循环次数h。通过对超参数的组合调整后,重复步骤4-6直至网络
loss差值收敛,终止训练。
[0137]
8.建立并训练得到编码器模块
[0138]
经步骤7的超参数优化后,得到最优的g单元、标签解码模块和特征解码模块。保存g单元、标签解码模块(f)和特征解码器模块(d)的网络结构和网络权值两组参数。
[0139]
基于经步骤7得到的最优的特征解码器模块(d)的网络结构和网络权值两组参数,建立并训练可以实现观察数据转换为标签数据的编码器模块(e):
[0140]
首先搭建编码器模块(e):为全连接神经网络,编码器模块(e)的输入层的节点数为观察数据维数r、隐藏层的节点数为s、隐藏层层数为f1、输出层的节点数为特征数据维数e。
[0141]
训练得到最优的编码器模块(e):将编码器模块(e)和特征解码器模块(d)嵌合得到d-e嵌合训练结构,对d-e嵌合训练结构中特征解码器模块(d)固定设置为经步骤7得到的最优的特征解码器模块(d)的网络权值参数,利用将步骤2得到的m个批次的放线菌发酵数据作为训练数据训练更新d-e嵌合训练结构中编码器模块(e)的网络权值参数,d-e嵌合训练结构的输入数据和输出数据为同一批次相同时间点的四元组织形式数据。利用神经网络训练的随机梯度下降方法多次训练d-e嵌合训练结构直至模型损失值收敛,得到训练最优的编码器模块(e)的网络权值参数。
[0142]
9.构建嵌合预测结构,实现时序数据预测并验证预测精度
[0143]
图4为嵌合预测结构示意图,经步骤7和步骤8得到最优的g单元、标签解码模块(f)、特征解码器模块(d)和编码器模块(e)。利用g单元、特征解码器模块(d)和编码器模块(e)构建针对不同时间间隔系统状态变化预测的嵌合预测结构,嵌合预测结构的搭建类同于嵌合训练结构(f-(g)
n-d),其基本结构为一个嵌合预测结构(e-(g)
n-d)的神经网络;嵌合预测结构依次由编码器模块(e)、串联生成机制模块((g)n)、特征解码器模块(d)三个模块组成;编码器模块和特征解码器模块分别实现观察数据到特征数据和特征数据到观察数据的转换,使串联生成机制模块可在特征空间内学习系统的工作机制;
[0144]
串联生成机制模块中的一个神经网络单元可以对系统从当前状态变换为一个单位时间之后状态的工作机制进行建模,这样的网络单元称为单位时间正向变化生成器(g单元);通过g单元的串联可以实现对系统经过多个单位时间发生的变化建模,由多个g单元的串联组成串联生成机制模块((g)n);
[0145]
嵌合预测结构(e-(g)
n-d)中的各个嵌合训练结构参数设置为步骤7和步骤8得到的g单元、特征解码器模块(d)和编码器模块(e)最优网络结构和网络权值参数。
[0146]
嵌合预测结构(e-(g)
n-d)通过把编码器模块(e)、串联生成机制模块((g)n)、特征解码模块(d)三个模块依次嵌合形成的新神经网络结构可以实现对ti时间点的真实观察数据输入,预测ti时间点下系统状态在经过n个时间间隔以后的系统状态,输出ti时间点下系统状态在经过n个时间间隔以后的真实观察数据的预测值。
[0147]
利用搭建好的嵌合预测结构(e-(g)
n-d)实现时序数据预测:
[0148]
将应用案例中第一步所述的u个批次的放线菌发酵数据作为测试数据,每个批次有k+1个时间点(t1,t2,t3…
t
k+1
),每个时间点有q个指标,将测试数据根据步骤1中的四元组织形式,对同一批次内任意两个时间点的系统状态变化组织为一个例子,ta与tb分别表示例子的起始时间点和终止时间点,实例训练数据被组织为:
[0149]
批次1例子集合
[0150]
批次2例子集合
[0151]
批次3例子集合
[0152]
批次m例子集合
[0153]
其中4≤m≤u-1,m∈n
*
[0154]
批次u例子集合
[0155]
再将各个批次中的例子汇总,按照例子中ta与tb两个时间点间隔大小,被重新组织为:
[0156][0156][0157]
其中,中有共n
l
个例子,l≤k、l∈n
*

[0158]
得到嵌合预测结构(e-(g)
n-d)的时序数据预测值,并且评估精度:
[0159]
计算e-d的预测精度,即
[0160]
计算e-(g)
1-d的预测精度,即d的预测精度,即
[0161]
计算e-(g)
2-d的预测精度,即d的预测精度,即
[0162]
计算e-(g)
3-d的预测精度,即d的预测精度,即
[0163]
计算e-(g)
k-d的预测精度,即d的预测精度,即
[0164]
由此得到生物发酵系统机制模型中由编码器模块(e)、串联生成机制模块((g)n)、特征解码模块(d)三个模块依次嵌合组成嵌合预测结构(e-(g)
n-d)用于预测不同时间间隔的生物发酵体系中系统状态改变时的精度预期。
[0165]
本发明还公开了一种基于时间点标签的多维时序数据神经网络建模装置,包括:
[0166]
获取单元:用于将原始观察数据进行规范化整理,得到形式统一的规范观察数据;
[0167]
组织单元:用于将基于规范观察数据组织用于人工神经网络训练的训练例子;
[0168]
构建单元:用于设计人工神经网络的结构,建立人工神经网络模型;
[0169]
训练单元:用于利用训练例子对建立的人工神经网络模型进行训练,得到人工神经网络的参数矩阵;
[0170]
优化单元:用于利用训练例子,评估在设计人工神经网络结构的过程中使用的参数以及在对建立的人工神经网络模型进行训练的过程中使用的参数对所得的人工神经网络模型的精度影响,选取不同的参数组合下最优的人工神经网络模型作为最终的结果模型;
[0171]
预测单元:基于最终结果模型,建立可以实现观察数据转换为标签数据的编码器模块;利用编码器模块构建针对不同时间间隔系统状态变化预测的嵌合预测结构,实现对于系统状态的预测;
[0172]
所设计的神经网络结构具有如下特征:
[0173]
其基本结构为一个嵌合训练结构(f-(g)
n-d)的神经网络;嵌合训练结构依次由标签解码模块(f)、串联生成机制模块((g)n)、特征解码模块(d)三个模块组成;标签解码模块和特征解码模块分别实现标签数据到特征数据和特征数据到观察数据的转换,使串联生成机制模块可在特征空间内学习系统的工作机制;
[0174]
串联生成机制模块中的一个神经网络单元可以对系统从当前状态变换为一个单位时间之后状态的工作机制进行建模,这样的网络单元称为单位时间正向变化生成器(g单元);通过g单元的串联可以实现对系统经过多个单位时间发生的变化建模,由多个g单元的串联组成串联生成机制模块((g)n);
[0175]
嵌合预测结构具有如下特征:
[0176]
嵌合预测结构依次由编码器模块(e)、串联生成机制模块((g)n)、特征解码模块(d)三个模块依次嵌合组成;编码器模块(e)和特征解码模块(d)分别实现观察数据到特征数据和特征数据到观察数据的转换,使串联生成机制模块可在特征空间内学习系统的工作机制。
[0177]
以上并非是对本专利具体实施方式的限制。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明实质范围的前提下,还可以做出若干变化、改型、添加或替换,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1