基于DA-TCN-LSTM的溶菌酶发酵溶氧预测方法

文档序号:35992209发布日期:2023-11-16 01:49阅读:35来源:国知局
基于DA-TCN-LSTM的溶菌酶发酵溶氧预测方法

本发明属于生物发酵参数预测领域,具体是生物溶菌酶发酵参数预测领域涉及到基于双阶段时间卷积注意力机制的溶菌酶发酵溶氧短期预测方法。


背景技术:

1、溶菌酶作为一种具有杀菌作用的天然抗感染物质,有抗菌、抗病毒、止血、消肿止痛及加快组织恢复功能等作用。现已成功应用于食品工业、医药临床、生物工程、畜禽养殖等行业。随着人们对溶菌酶作用的重视,溶菌酶的发酵培养研究显得尤为重要。溶菌酶发酵涉及菌体的生长代谢,具有高度的时变性与不确定性,且整个发酵过程受到各种参量影响,关键参数难以实时测量。近年来,采用软测量建模与补料预测控制方法已经得到了业内重视。通过对于其发酵参数的建模模拟以及关键参量的实时在线测量,可以使得溶菌酶的产量和质量大幅提升,同时对关键参数的测量也可以大幅减少离线检测带来的时滞性与染菌风险。

2、溶菌酶发酵培养过程中细胞生长情况遵循微生物生长规律,其中溶菌酶溶氧量指的是培养液中氧气的溶解量,是反应发酵状况的重要指标之一。由于微生物发酵过程的多阶段多状态特性,发酵周期、温度、ph、压力以及搅拌速率等参数都会造成溶氧量的变化,进而共同影响菌体的生长速率以及产物品质。对于生物发酵溶氧预测的多阶段多变量的时间序列数据回归任务,利用机理建模对研究对象内部机理进行研究,建立主导变量与辅助变量之间的机理模型,该方法进行建模不仅难度系数大,且建立的机理模型预测精度较低。机器学习方法可以更好地处理时序数据非平稳、非线性等特点,但前期面临复杂的特征提取工作。基于数据驱动建模的人工智能深度学习领域,凭借其自身特有的特征提取、非线性拟合等特性对发酵时序数据建模有着较强的学习能力。循环神经网络(rnn)可以捕捉时间序列数据的非线性关系,但由于相同的权重矩阵被不断的在隐藏层叠加,梯度会随着循环次数的增加呈指数的衰减或爆炸,难以获取数据的长期依赖性,随着处理时间序列数据长度变大网络性能也会变差。长短时记忆网络(lstm)通过引入了门控结构来控制隐藏层信息的传输状态,缓解了rnn的梯度消失问题,但缺乏对输出质量数据的表示,学习与输出质量相关的动态状态对于软传感器应用中的质量预测非常重要。编码器解码器网络(encoder-decoder)则对于处理输入输出序列不等长的问题有着很好的表现,但存在上下文向量信息保存有限的问题。


技术实现思路

1、针对上述现有技术的不足,本发明提出了基于da-tcn-lstm的溶菌酶发酵溶氧预测方法,旨在解决现有技术中的预测准确率不高、对发酵长期信息缺乏有效学习的技术问题。该方法首先通过滑动窗口技术构建溶菌酶发酵的长短时间序列数据集,对长短期发酵数据进行预处理降低样本中的敏感性;构建双阶段tcn特征提取模块,捕捉溶菌酶发酵的长期时间序列数据的特征;引入双阶段的注意力机制的框架,在编码器部分提取短期时间序列数据变量间的空间关系特征,将得到的长短期输入时间序列数据特征融合并进行编码;在解码器部分提取编码模块中的长期时序依赖信息间的时间关系特征,将得到的长短期目标时间序列数据特征与其融合并进行解码,输出下个时刻发酵溶氧量的预测值。

2、为实现上述目的,本发明包括以下步骤:

3、s1、采集和预处理发酵数据;

4、通过发酵罐生产控制系统对溶菌酶发酵过程中的参数进行实时在线监测,记录的发酵多项控制和记录数据,对发酵数据进行预处理,包括提取样本点数据、数据清洗和数据归一化。

5、s2、构建时间序列的数据集;

6、构造长短期时间序列数据集合,将受控质量因子作为输入时间序列,溶氧量作为目标时间序列,并划分为训练集和测试集。

7、s3、构建基于双阶段时间卷积注意力机制(da-tcn-lstm)的深度学习算法模型,所述的da-tcn-lstm的深度学习算法模型基于编码器-解码器机制实现,包括双阶段tcn特征提取模块、空间注意力模块、编码模块、时间注意力模块、解码模块;

8、s3.1、通过双阶段tcn特征提取模块对溶菌酶发酵长期输入时间序列和目标时间序列进行特征提取;

9、s3.2、通过空间注意力模块将溶菌酶发酵短期输入时间序列数据进行空间注意力机制分配;

10、s3.3、对双阶段tcn特征提取模块提取到的溶菌酶发酵长期输入时间序列特征和空间注意力模块加权分配后的短期输入时间序列特征使用编码模块进行编码;

11、s3.4、通过时间注意力模块将编码模块中的长期时序依赖信息进行时间注意力机制分配;

12、s3.5、对时间注意力模块分配后的特征信息、双阶段tcn特征提取模块提取到的溶菌酶发酵长期目标时间序列数据特征以及短期目标时间序列数据使用解码模块进行融合解码,输出预测结果。

13、s4、训练模型,通过训练集数据训练基于双阶段时间卷积注意力机制的深度学习算法模型。

14、s5进行预测,将测试集送入s5步骤中已训练完成的模型中进行测试。

15、作为优选,所述步骤s1进一步包括,通过发酵罐生产控制系统对溶菌酶发酵过程中的参数进行实时在线监测,记录的发酵控制数据包括但不限于温度、ph、搅拌速度、通气量、补料量,发酵状态数据包括但不限于发酵周期、od、溶氧量;

16、对溶菌酶发酵数据进行预处理,包括提取样本点数据、数据清洗和数据归一化:

17、提取数据集样本点,发酵过程中的受控质量因子和状态因子产生的原始数据,由发酵生产控制系统实时采集,每分钟记录一次实时数据作为数据集原始样本点;

18、数据清洗,采用平均值法,对溶菌酶发酵数据集样本点数据中存在的缺失或异常样本点数据通过其前r个时刻相邻时间段样本点的平均值进行补齐,平均值计算公式为:

19、

20、其中表示计算得到的平均值,t代表出现缺失数据或异常数据的时刻,r代表选取的样本数量;

21、数据归一化,采用数据归一化处理对溶菌酶发酵数据集样本点数据进行处理,将其限制在一定范围内,消除数据因子间的量纲影响,数据归一化计算公式为:

22、

23、其中x表示样本点数据,xmin表示样本数据的最小值,xmax表示样本数据的最大值,xscale表示归一化处理之后的数据。

24、作为优选,所述步骤s3进一步包括:

25、s3.1,双阶段tcn特征提取模块主要由时间卷积网络(tcn)构成,网络包括适用于序列的因果卷积、适用于历史数据记忆的膨胀卷积以及残差连接模块;在编码器部分,通过tcn网络对溶菌酶发酵长期输入时间序列数据进行特征提取,将得到的特征记为nx;在解码器部分,通过tcn网络对溶菌酶发酵长期目标时间序列数据进行特征提取,将得到的特征记为ny;

26、s3.2,空间注意力模块引入空间注意力机制,自动地对每一时刻的溶菌酶发酵短期输入时间序列数据分配权重,获取输入序列之间的空间关联;

27、s3.3,将双阶段tcn特征提取模块提取到的溶菌酶发酵长期输入时间序列特征和空间注意力模块加权分配后的短期输入时间序列特征通过编码模块进行融合编码其计算公式为:

28、

29、其中是空间注意力分配后的输出和tcn模块提取的长期输入时间序列特征nx的级联函数,和是待学习和训练的参数;

30、编码模块时间点t的隐藏层状态计算公式如下:

31、

32、其中ht表示编码模块在时刻t的隐藏状态,ht-1表示上一个隐藏状态,fe表示编码器部分使用的非线性的激活函数;

33、s3.4,时间注意力模块引入时间注意力机制捕获编码模块的长期时序依赖信息,基于先前编码模块得到的隐藏状态ht计算时间注意力权重,得到时间注意力分配后输出的上下文向量;

34、s3.5,对时间注意力模块分配后的特征信息、双阶段tcn特征提取模块提取到的溶菌酶发酵长期目标时间序列数据特征以及短期目标时间序列数据使用解码模块进行融合解码,其计算公式为:

35、

36、其中[yt-1;ct-1;ny]是上一个时刻溶菌酶发酵短期目标时间序列的值yt-1和上一个所有隐藏状态加权得到的上下文向量ct-1和tcn模块提取的长期时间序列特征ny的级联函数,和是待学习和训练的参数;

37、解码模块由lstm网络构成,解码模块时间点t的隐藏层状态计算公式如下:

38、

39、其中dt表示解码模块在时刻t的隐藏,dt-1表示上一个隐藏状态,fd表示解码器部分使用的非线性的激活函数;通过解码模块的lstm网络输出通过da-tcn-lstm网络结构构建模拟函数f,函数f通过给定的溶菌酶发酵长短期输入和目标时间序列数据计算的得到当前时刻的输出

40、

41、其中[dt;ct]是解码层的隐藏状态dt和上下文向量ct的级联函数,参数ww、bw、和bv是待学习的参数,最终得到预测结果

42、本发明的有益效果是:

43、本发明通过双阶段时间卷积注意力机制对溶菌酶发酵的短期时间序列数据进行特征提取,通过双阶段时间卷积网络对生物溶菌酶发酵的长期时间序列数据进行特征提取,利用其并行计算和灵活调整感受野的网络特性捕获输入变量和目标变量的长期趋势变化,得到发酵时间序列数据的周期规律特征;利用双阶段注意力机制捕获溶菌酶发酵短期时间序列数据间的空间和时间依赖关系,得到发酵时间序列数据的瞬时突变特征。引入编码器-解码器机制实现对未来时刻发酵溶氧量的预测,在获得发酵长期周期趋势特征的同时,进一步提高了对于发酵短期瞬时突变特征的提取能力,增强了溶菌酶发酵溶氧量短期预测的稳定性和准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1