专利名称::基于模糊支持向量机的赖氨酸发酵过程关键状态变量软测量方法及系统的制作方法
技术领域:
:本发明属于生物技术和信息科学交叉领域,主要涉及对赖氨酸发酵过程中难以用物理传感器在线实时测量的三个关键状态变量一菌丝浓度、总糖浓度、产物浓度进行软测量的方法及系统构造方法。
背景技术:
:生物发酵是一类重要的工业生产过程,提供了与国计民生休戚相关的药品(抗生素、基因工程重级药物、疫苗、维生素等)、各种氨基酸(核酸)及其它产品(酒精饮料、酱油醋、生物保健品等)。其典型特征是内在机理复杂、可重复性差、生产波动大,具有高度的非线性和时变特性;同时发酵过程的很多关键参数(如菌丝浓度、基质浓度和产物浓度等)反映了过程所处状态,对其进行在线测量,是进行补料、供氧等动态控制的重要依据,同时也是进行优化调度的前提和基础。但是在实际生产中,这些参数通常采用离线取样分析获得,取样时间间隔长、数据滞后且精度低,不能满足实时控制和优化的需要。因此,研究如何及时获得发酵过程中关键参数的状态信息,对发酵过程实施优化控制,构建微生物最优生长环境,提高产品产量与质量均具重要意义。支持向量机(SupportVectorMachine,简称为SVM)软测量方法采用了结构风险最小化原则和核函数技术,表现出比神经网络等传统建模方法更好的性能,在发酵过程的软测量建模中得到了广泛的应用。在本发明中,考虑到发酵过程不同时期以及不同区域样本数据对软测量模型所起的作用不一样,将模糊隶属度的概念引入到输入样本中,提出了模糊支持向量机(FuzzySu卯ortVectorMachine,简称为FSVM)软测量建模方法。这种理论的运用提高了支持向量机抵抗噪声的能力,避免了支持向量机对于孤立点或者异常点过分敏感的特性,尤其适合生物发酵过程这种未能完全揭示输入样本特性的情况。
发明内容为了解决赖氨酸发酵过程中非常重要但是难以用物理传感器在线实时测量或实时测量代价非常高的状态量(如菌丝浓度、基质浓度和产物浓度)测量方法之不足,本发明提供一种基于模糊支持向量机的赖氨酸发酵过程关键状态变量软测量方法及系统构造方法,通过常规在线测量仪表提供的输入变量的测量信号,给出当前关健状态变量的预测值,为赖氨酸发酵过程的优化操作和优化运行提供关键工艺指标。本发明系统由硬件平台及测量软件组成,其中硬件平台核心由生物发酵罐、蒸汽发生器、空气压縮机、空气过滤器、供水系统组成,同时配备了测量仪表、计算机系统以及进行软件计算的智能控制器。其硬件的连接是生物发酵罐的输入端通过管道与蒸汽发生器、空气过滤器和供水系统相接,空气压縮机与空气过滤器、供水系统相接,软测量软件运行在智能控制器上,得到的软测量结果可经数据通道传送到监控制计算机上或独立的计算机上。详细结构如图l所示。以生物发酵罐、蒸汽发生器、空气压縮机、空气过滤器、供水系统组成的发酵系统,其测量仪表包括在发酵罐罐体上分别安装一个热电偶t、一个溶氧电极、一个液位探头和一个pH电极,用于在线测量罐内发酵液温度t、氧含量D0、体积v和酸碱度ra;在发酵罐环形法兰上安装一个压敏电阻,用于在线测量罐内压力p;在发酵罐搅拌电机上安装一个转速传感器,用于在线测量电机搅拌速率r;在空气过滤器和发酵罐相连的供气管道上安装一个气体流量传感器,用于在线测量进入发酵罐内空气流量q;在发酵罐尾气排放管上安装一个C02气敏电极,用来在线测量排放出的C02含在补料罐和发酵罐相连的进料管道上安装两个蠕动泵,根据蠕动泵的开关时间估计葡萄糖流加速率P、氨水流加速率ii;该发酵系统同时配置了智能控制器(微型计算机)和用于远程监测与控制的工业控制计算机(IPC)。本发明的软测量软件运行在智能控制器上,该软件通过相关测量仪表获得实时的输入数据,并给出发酵过程关键状态变量的预测结果;所说的软测量软件,是指实现本发明方法的计算机程序。本发明方法包括以下步骤(1)选择辅助变量,(2)建立样本数据库,(3)确定模糊隶属度,(4)建立软测量模型,(5)关键状态变量预测。步骤一辅助变量选择,选取能直接测量且与过程密切相关的外部变量用一致相关度法分析其与关键状态变量的关联度,取关联度rij>0.7的外部变量作为软测量模型的辅助变量,步骤二建立训练数据库,采集相同工艺下若干历史罐批次的辅助变量和关键状态变量数据,构造输入输出向量对的集合,生成静态训练样本数据库;其中输入向量是辅助变量,输出向量即关键状态变量;步骤三确定样本模糊隶属度,将从步骤二得到训练样本映射到高维核空间中,计算每个样本在核空间中的模糊隶属度;步骤四建立软测量模型,用从步骤三得到的模糊隶属度结果对模糊支持向量机进行训练,建立基于模糊支持向理机软测量模型;步骤五关键状态变量预测,利用已训练好的模糊支持向量机软测量模型,根据当前待预测罐批的最新输入向量,获得关健状态变量的预测值。上述步骤一中所述的外部变量是发酵罐温度t、发酵罐压力p、电机搅拌转速r、发酵液体积v、空气流量q、C02释放率ii、葡萄糖流加速率P、氨水流加速率n、溶解氧D0、发酵液酸碱度PH。依据相关性分析和发酵过程经验可设定关联度值>0.7的外部变量为辅助变量。在实践中,不同的发酵菌株所选取到的辅助变量不一定完全相同。本发明利用计算机系统和常规的检测仪表提供的在线过程数据,仅仅通过少量的人工采样,实现了赖氨酸发酵过程的关键状态变量的基于模糊支持向量机的软测量。解决了发酵过程中没有状态变量在线检测仪表难以在线检测的难题;与人工取样化验相比,减少了现场操作人员的工作量,降低了发酵过程中人为操作引入的测量的不确定性,提高了测量的时效性,减少了离线取样带来的数据滞后的问题。由于本发明将模糊隶属度引入到支支持向量机建模中,与传统的支持向量机软测量方法相比本发明中软测量方法中克服了支持向量机对噪声点和异常点过于敏感,模型容噪性能差的问题。另外,本发明全面考虑了影响赖氨酸发酵过程关键状态变量的因素,大量采用现有的常规检测信号来实现关键状态变量的在线预测,应用简单、容易、成本较低,软测量结果也较精确。该方法有助于实于赖氨酸发酵过程的优化控制和优化运行。图1赖氨酸发酵过程的流程、测量仪表及计算机配置图;图2基于模糊支持向量机的赖氨酸发酵过程关键状态变量软测量模型建立流程图;图3关键状态变量预测值与真实值的对比图;图4关键状态变量预测相对误差曲线图。图1中1生物发酵罐,2蒸汽发生器,3空气压縮机,4空气过滤器,5气体流量传感器,6转速传感器,70)2气敏电极,8液位探头,9热电阻,10溶氧电极,llpH电极,12蠕动泵,13蠕动泵,14离心分离器,15智能控制器(单片机),16上位计算机图1中所用标记符号如下发酵罐温度——t、机搅拌转速——r、发酵液体积——v空气流量——q、C02释放率——ii、葡萄糖流加速率——P、氨水流加速率——n、溶解氧D0、发酵液酸碱度——pH。图1中,实线箭头表示物流(发酵液,水、空气和蒸汽)方向,虚线表示信号流。具体实施例方式以下结合赖氨酸发酵过程关键状态变量预测的实施例子和图2所示的实施流程图,对本发明实施例子作出详细描述机械搅拌发酵罐规格为公称容积50L,罐体①300X650cm,装料系数《70%;设计压力能力0.3MPa,可承受0.lMPa的负压,蒸汽发生器电热功率为9KW,产汽量12Kg/h,空气过滤器采用高效空气除菌过滤器,2级过滤效率99.99%。以智能控制器(单片机)实现基础控制回路的自动控制,并根据模型需要滤波、计算得到发酵液体积v、空气流量q、C02释放率i!、溶解氧DO和发酵液酸碱度pH。读取上述的过程数据,在监控计算机中以微软公司的Visual0++软件实现监控人机界面。软测量模型是用C语言编程实现,数据存储DB模块中,在监测系统提供模型数据的修改接口,用于离线分析更改模型参数。软测量软件在智能控制器上运行,有效的保证了模型输出的时效性,方便了系统的过程监控。实验过程中罐内温度控制在050°C±0.5°C,pH值控制在212pH±0.15pH,罐压控制在00.25Mpa,溶解氧控制在0100%±0.5%,空气流量控制在05M3/h,电机搅拌转速控制在0500转/分。1.选择辅助向量(1)发酵过程数据的获得赖氨酸发酵过程以北京棒杆菌(Corynebacteriumpekinense)为菌种(中科院微生物菌种库出售)(该菌种不是对本发明的限定,采用其它菌种的发酵过程同样可应用本方法和系统进行关键状态变量软测量)采用WKT-30L型发酵监控系统进行发酵培养。如图1所示监控系统由生物发酵罐1、蒸汽发生器2、空气压縮机3、空气过滤器4和供水系统组成。赖氨酸发酵过程中通过气体流量传感器5、转速传感器6、C02气敏电极7、液位探头8、热电阻9、溶氧电极10、pH电极11、蠕动泵12和蠕动泵13采集空气流量、电机搅拌转速丄02释放率、发酵液体积、发酵罐温度、溶解氧、发酵液酸碱度、葡萄糖流加速率和氨水流加速率数据。发酵液经离心分离器14分离后离线检测得到菌丝浓度、总糖浓度和产物浓度。(2)—致相关度分析对于得到的外部变量数据(发酵罐温度t、发酵罐压力p、电机搅拌转速r、发酵液体积v、空气流量q、C02释放率ii、葡萄糖流加速率P、氨水流加速率n、溶解氧DO、发酵液酸碱度pH)用一致相关度法分析其与关键状态变量(菌丝浓度X、基质浓度S和产物浓度P)的关联度,取关联度较大的外部变量作为软测量模型的辅助变量。以发酵罐温度t,菌丝浓度X为例,具体算法如下<formula>formulaseeoriginaldocumentpage7</formula>(1)工"w其中Vij(k)为变化率相关系统,为关联度,13为数据变化率对关联度的影响,《,.,.为变量相关系数。对于发酵罐温度t和菌丝浓度X,设有mi个趋势相同的点W,…),n^个趋势无关联的点0^,'<formula>formulaseeoriginaldocumentpage7</formula>,m3个趋势相反的点(《,…,《J,代入上式可得<formula>formulaseeoriginaldocumentpage7</formula>其中Pij,Zij,Nij分别表示正关联度、零关联度和负关联度。当lPijl>lNijl时,发酵罐温度t和菌丝浓度X以正相关为主,它们的变化趋势相似,相关程度由r".,两因素的大小来衡量;当==0时,发酵罐温度t和菌丝浓度无关;当|Pij|《|Nij|时,发酵罐温度t和菌丝浓度相关为主,即它们的变化趋势相反,相关程度由由rij,两因素的大小来衡量。外部变量与菌丝浓度X的关联度计算结果如表1所示表1外部变量的关联度计算值<table>tableseeoriginaldocumentpage8</column></row><table>由上计算结果可知,通过相关性分析和发酵过程经验设定关联度值rij>0.7的条件下,可测外部变量——发酵液体积v、空气流量q、(A释放率、溶解氧DO、发酵液酸碱度pH与赖氨酸发酵过程中的菌体浓度X最为相关,选择上述五个变量作为软测量模型的辅助2.建立训练样本数据库赖氨酸发酵过程按照如下的结构组成样本,并收集相同工艺下若干历史罐批次训练样本数据。样本表达为kk,ykh其中Xk为样本的输入,即选取的辅助向量——发酵液体积v、空气流量q、(A释放率P、溶解氧DO、发酵液酸碱度pH。样本的输出为待预测的主导变量——菌丝浓度X、基质深度S、产物浓度P。训练样本采集记录结构如表2,时间为发酵过程中采样周期,为减少主导变量离线化验误差,根据同一样本主导变量采用三次化验结果进行样本取舍,最后取平均值表2样本数据结构<table>tableseeoriginaldocumentpage8</column></row><table>考虑到样本数据应该具有代表性,并且尽可能覆盖范围较宽,至少应该包括发酵过程正常工作范围,通过手动调控发酵罐压力、发酵罐温度和电机搅拌转速,在生产工艺允许的范围内尽可能改变发酵过程的工作点,每次操作条件改变系统平稳后取样化验。3.确定样本模糊隶属度将从步骤二得到的样本数据映射到高维核空间里,并计算每个样本数据在核空间中的模糊隶属度。考虑到映射后的样本数据在构造超平面时所起的作用是不同的,本发明对它们赋予不同的隶属度,对位于超平面上或位于超平面周围的受到噪声污染很小的样本(离超平面的方差很小)赋予最大的隶属度(如Vi);对由于受到噪声污染而位于超平面附近的样本(离超平面的方差较小)根据一定规则赋予相应大小的隶属度Vi=Pi;对远离超平面的异常样本数据(离超平面的方差较大)赋予相对较小的隶属度Vi=P1<w。具体步骤如下(a)输入训练样本,并将其映射到高维核空间中S={sjsi=(Xi,y》,XiGRn,yiGR,i=1,2,...,1}(b)计算核空间中任意两个样本点的距离矩阵Dis=(disO(sXs》)),i,j=1,2,…,1(3)(c)取定一常数d,计算以任意样本p(S,)为球心,以d为半径的超球所包含的样本',1。个数Num(p(s,》,即满足dis^(s,),p(s》)Sd的样本数目Num(p(s,)),i,j=1,2,(d)求满足dis(p(s,Ks》)《",i,j=L2,…,i的样本数目的最大值MaxNum=Max{Num(p(s,-))},i,j1,2,…,1(e)计算核空间每个样本数据点的模糊隶属度Vi(4)//min<//應,/=1,2,...,/"n0<a<//min(f)输出带模糊隶属度的训练数据样本。S=(SiISi=(Xi,y丄,V》,XiGRn,y丄GR,O《Vi《1,NumO(s,.))(5)1,2,1}在(e)中,a解MaxNum在(b)中,计算核空间中任意两个样本点的距离可以通过核函数K(SiSj)来求dis(p(s,),一》),(s,)l(s;)||=V〈p(s,)i(s》,p(s,)i(s》〉=#(sXs,)〉-2〈^(SXS》〉+〈p(S》,p(S》〉=,,,s,)-2/:(s,,s》+《(s),s》(6)本发明中核函数取径向基核函数,-(Ihlk2)(7)式(6)可以转换为公dis(p(s,),p(Sj))=|—(s,)—p(S;)|=^2(1-化,s》)由公式(8)得到:9(8)|s,.-s)I—co时,dis(p(s,.),p(sy))~>V^";||s,--s」|—0时,disO(s,),P(s;))—0。因此在(c)中,超球半径d的范围为OSdS^,由于实际发酵过程中样本数据一般位于有限的几个稳定工作点附近,超球半径d取0.2,最大模糊隶属度ymax取0.9,最小模糊隶属度ymin取V^。4.建立软测量模型用步骤三得到的模糊隶属度结果对模糊支持向量机进行训练,求出基于模糊支持向理机软测量模型。该软测量模型根据以下过程进行推导模糊化后的输入样本集S={SiISi=(Xi,yi,Vi),XiGRm,yiGR,O《Vi《1,i=1,2,…,lhm为输入向量个数,1为训练样本数,最优化问题的目标函数为12zminJXw,6,)=—|w|+cZ《2s.t.yi=wT4)(Xi)+b+《ii=1,...,1其中,C是处罚常数,Vi代表相应样本数据Xi在高维核空间里的模糊隶属度,Ii是每个样本的误差因子,ViI/代表带有不同权重的误差因子,小(Xi)为映射函数;w,b分别表示最优回归函数的线性系数和偏移量;用拉格朗日方法求解上述优化问题,定义拉格朗日函数如下z丄O,6,《,a)=/(>,6,《)-S《卜V(x,)+"《-x}其中,ai是拉格郞日乘子,对应于ai#0的拉格郞日乘子称为支持向量。上述问题归结为二次规划问题,令台"、〃业-。4士a,。,朋台''3丄《7=0~>少,=w'p(x,)+6+《,/=l,2,..-,/消除w,;式(11)写成下列线性方程组的形式—or-—0—I/2+Vra义其中=K(Xi,Xj),i,j=1,2,...1,a=[&1,a2,,aj1,I=[1,1,,1]V=[y"y2,…,yjT,Vr是对角矩阵,Vr二diag((cv》—\(CV2)-\,(CVl)—0。通过上式确定系数b和a,得到软测量模型为10<formula>formulaseeoriginaldocumentpage11</formula>式中Xi为样本的输入,即选取的输入向量发酵液体积v、空气流量q、C02释放率P、溶解氧D0、发酵液酸碱度pH;y(x)为待预测的主导变量——菌丝浓度X、基质深度S、产物浓度P;ai,b——训练后的模型系数,i=1,2,,1;本发明以采用径向基(RBF)为例建立软测量模型,该核函数形式为化,,e如加2)式中o——核参数;本发明中处罚系数c取IOOO,核参数o取O.28。5.预测关键状态变量软测量模型建立完毕后,采用嵌入式C语言编程实现,并嵌入到智能控制器15里,当待预测罐批的输入向量xw经测量仪表读入智能控制器15后,智能控制器15利用软测量程序计算得到关键状态变量的预测值,并将预测结果经数据通道传送到上位计算机16上显示。本发明即基于模糊支持向量机的关键状态变量软测量模型在赖氨酸发酵过程正常运行期间,能够根据发酵过程的最新输入向量预测关键状态变量。图3给出了关键状态变量(菌丝浓度、总糖浓度、产物浓度)预测值对真实化验值的跟踪效果。图4给出了预测相对误差曲线,从图中可以看出,菌丝浓度X的最大相对误差为4.34%,总糖浓度S的最大相对误差为4.95%,产物浓度x3的最大相对误差为3.29%,且其变化趋势很好地逼近了真实情况。这表明本发明所提的模糊支持向量机建模方法是有效的、可靠的,能提高赖氨酸发酵过程中关键状态变量(菌丝浓度、总糖浓度、产物浓度)的软测量精度,比较满意地达到了预期的目标,解决了关键状态变量在线软测量的精度不高的问题,为实施优化控制打下了坚实的基础。权利要求一种基于模糊支持向量机的赖氨酸发酵过程关键状态变量软测量方法,其特征在于,具体步骤如下步骤一辅助变量选择,选取能直接测量且与过程密切相关的外部变量用一致相关度法分析其与关键状态变量的关联度,取关联度rij≥0.7的外部变量作为软测量模型的辅助变量;步骤二建立训练数据库,采集相同工艺下若干历史罐批次的辅助变量和关键状态变量数据,构造输入输出向量对的集合,生成静态训练样本数据库;其中输入向量是辅助变量,输出向量即关键状态变量;步骤三确定样本模糊隶属度,将从步骤二得到训练样本映射到高维核空间中,计算每个样本在核空间中的模糊隶属度;步骤四建立软测量模型,用从步骤三得到的模糊隶属度结果对模糊支持向量机进行训练,建立基于模糊支持向理机软测量模型;步骤五关键状态变量预测,利用已训练好的模糊支持向量机软测量模型,根据当前待预测罐批的最新输入向量,获得关健状态变量的预测值。2.根据权利要求1所述的基于模糊支持向量机的赖氨酸发酵过程关键状态变量软测量方法,其特征在于,其中所说的输入向量是发酵液体积、空气流量、(A释放率、溶解氧和发酵液酸碱度,输出向量为菌丝浓度、基质深度和产物浓度。3.根据权利要求1所述的基于模糊支持向量机的赖氨酸发酵过程关键状态变量软测量方法,其特征在于,步骤三所述的模糊隶属度的确定按以下步骤进行(a)输入样本数据S={Si|Si=(Xi,y》,XieRn,yieR,i=1,2,…,1}(b)计算核空间中任意两个样本点的距离矩阵Dis:(disO(sXs》)),i,j=i,2,…,1(c)取常数d,计算以任意样本^(s,)为球心,以d为半径的超球所包含的样本个数Num(p(s》)。(d)求满足dis(p(s,)^(s,))Sc/,i,j=i,2,…,l的样本数目的最大值MaxNrnn=Max{NumO(s,.))},i,j=i,2,…,1(e)计算核空间每个样本数据点的模糊隶属度Vi:、//丽^1//min0<a<//'nin其中,Num(一')),pMaxNumPmin是最大、最小隶属度常数。(f)输出带模糊隶属度的训练数据样本。S={Si|Si=(Xi,yi,Vi),XiGRn,yiGR,O《Vi《1,i=1,2,—1}4.根据权利要求1所述的基于模糊支持向量机的赖氨酸发酵过程关键状态变量软测t方法,其特征在于,步骤四所述的软测量模型根据以下过程进行推导设模糊化后的训练样本集S二{Si|Si=(Xi,yi,Vi),XiGRn,yiGRh其中0《Vi《1,i=l,2,…1,l为训练样本数;最优化问题等效为下面式子<formula>formulaseeoriginaldocumentpage3</formula>其中,c是一个惩罚系数,Vi代表相应样本数据Xi在高维核空间里的模糊隶属度,Ii是每个样本的误差因子,ViI/代表带有不同隶属度的误差因子,小(Xi)为映射函数;W,b分别表示最优回归函数的线性系数和偏移量;上面的式子其相应的拉格朗日函数为<formula>formulaseeoriginaldocumentpage3</formula>其中,&是拉格郎日乘子,对应于ai#0的拉格郎日乘子称为支持向量;由Kuhn-Tucker条件可得线性方程组<formula>formulaseeoriginaldocumentpage3</formula>其中<formula>formulaseeoriginaldocumentpage3</formula>由求解上述方程得出模糊支持向量机软测量模型<formula>formulaseeoriginaldocumentpage3</formula>5.—种基于模糊支持向量机的赖氨酸发酵过程关键状态变量软测量系统,其特征在于,该系统包括生物发酵罐、蒸汽发生器、空气压縮机、空气过滤器、供水系统、智能控制器和上位计算机,生物发酵罐的输入端通过管道与蒸汽发生器、空气过滤器和供水系统相接,空气压縮机与空气过滤器、供水系统相接,生物发酵罐上装置的溶氧电极、压差传感器、co2气敏电极、空气流量传感器和PH电极用于采集赖氨酸发酵过程数据并传送给智能控制器,智能控制器用于根据发酵过程数据建立训练数据库、确定样本模糊隶属度、建立软测量模型,并利用已训练好的模糊支持向量机软测量模型依据当前待预测罐批的最新输入向量,获得关健状态变量的预测值,最后将预测结果经数据通道传送到上位计算机显示。全文摘要一种基于模糊支持向量机的赖氨酸发酵过程关键状态变量软测量方法,该方法依赖硬件平台及测量仪表、计算机系统和进行软件计算的智能控制器,该软件通过测量仪表获得实时的过程数据进行软测量。该方法首先通过对赖氨酸发酵过程工艺机理的分析,选取合适的辅助变量并根据历史罐批数据建立训练样本数据库,然后将训练样本映射到高维核空间里,计算出核空间里每个样本点所对应的模糊隶属度;对模糊化后的训练样本采用模糊支持向量机进行训练建立软测量模型;最后根据待预测罐批的最新输入向量,实现关键状态变量的预测。本发明实现了赖氨酸发酵过程关键状态变量在线实时的预测,对实现赖氨酸发酵过程的优化控制和优化运行具有重要意义。文档编号G01N33/00GK101748186SQ20091026404公开日2010年6月23日申请日期2009年12月29日优先权日2009年12月29日发明者孙玉坤,嵇小辅,王博申请人:江苏大学