本发明涉及数据管理,具体涉及一种复合酶生产过程自动管理方法及系统。
背景技术:
1、复合酶生产过程自动管理系统是一种用于监测、控制和优化复合酶生产的关键工具,该系统收集复合酶生产过程中每种关键参数的大量数据,通过这些生产数据了解复合酶生产过程状态,进而自动调整控制复合酶生产过程中参数,以确保生产条件保持在最佳状态;对于收集的大量生产数据,需要进行压缩存储。
2、因为复合酶的生产过程中主要受到ph值与温度的影响,制作过程需要专门控制温度和ph值变化的情况,同时也存在ph值与温度两者出现异常相互影响发生变化的情况。
3、道格拉斯-普克算法(dp算法)是一种有损压缩方法,预先定义的初始阈值决定了数据的损失程度和压缩效率,当通过道格拉斯-普克算法(dp算法)对温度和ph值数据进行压缩时当初始阈值设置的较大时,会导致存在异常波动的数据的压缩损失程度过大,解压后获得的数据与压缩前的数据的差异较大,导致通过解压后的数据无法准确地分析生产过程,失去存储价值,而当初始阈值设置的较小时,则会导致对正常波动的数据起不到的很好压缩效果。
4、因此,需要通过对dp算法进行改进,对异常波动的数据尽量保留,对正常波动的数据尽可能压缩。
技术实现思路
1、本发明提供一种复合酶生产过程自动管理方法及系统,以解决现有的问题。
2、本发明提供了一种复合酶生产过程自动管理方法,该方法包括以下步骤:
3、采集复合酶的生产环境在每个时刻的温度和ph值;
4、根据每个时刻的温度和ph值,以及每个时刻的温度的变化情况和ph值的变化情况,确定每个时刻的监测值,每个时刻的监测值组成一个数据点,所有数据点组成监测值曲线;
5、根据监测值曲线上的极值点,将监测值曲线划分为多个变化间隔段;
6、根据每个变化间隔段的相邻的变化间隔段的每个数据点的监测值的差异,以及每个变化间隔段的相邻的变化间隔段的每个数据点的监测值的变化情况,确定每个变化间隔段的每个数据点的活性关联度;
7、获取每个变化间隔段的每个数据点的对称点;根据每个变化间隔段的每个数据点的局部窗口内每个数据点及其对称点的斜率的差异,以及每个变化间隔段的相邻的变化间隔段的每个数据点的活性关联度的差异,确定每个变化间隔段的每个数据点的活性影响度;
8、在通过dp算法对复合酶的监测值曲线进行压缩的过程中,根据监测值曲线上的每个数据点的活性影响度,对每个数据点到监测值曲线的直线的距离进行调整,根据每个数据点到直线的调整后的距离确定监测值曲线的所有分割点,所述所有分割点为监测值曲线的压缩结果,所述直线为相邻两个的分割点之间的直线。
9、进一步地,所述根据每个时刻的温度和ph值,以及每个时刻的温度的变化情况和ph值的变化情况,确定每个时刻的监测值,包括:
10、,
11、式中,表示第i个时刻的监测值,表示温度曲线上第i个时刻的温度,表示ph值曲线上第i个时刻的ph值,表示温度曲线上第i个时刻的斜率与ph值曲线上第i个时刻的斜率的乘积,表示线性归一化函数。
12、进一步地,所述根据监测值曲线上的极值点,将监测值曲线划分为多个变化间隔段,包括:
13、获取监测值曲线上的极值点,所述极值点包括极大值点与极小值点,将相邻两个极值点之间的曲线段作为变化间隔段。
14、进一步地,所述每个数据点的局部窗口,包括:
15、将每个数据点以及每个数据点相邻的k个数据点组成每个数据点的局部窗口,则每个数据点的局部窗口中包括k+1个数据点,所述每个数据点相邻的k个数据点是指距离每个数据点距离最近的k个数据点。
16、进一步地,所根据每个变化间隔段的相邻的变化间隔段的每个数据点的监测值的差异,以及每个变化间隔段的相邻的变化间隔段的每个数据点的监测值的变化情况,确定每个变化间隔段的每个数据点的活性关联度,包括:
17、对于第p个变化间隔段的第q个数据点,当第p-1个变化间隔段不存在第q个数据点或者第p+1个变化间隔段不存在第q个数据点时,第p个变化间隔段的第q个数据点的活性关联度;
18、当第p-1个变化间隔段存在第q个数据点且第p+1个变化间隔段存在第q个数据点时,根据每个变化间隔段的相邻的变化间隔段的每个数据点的监测值的差异,以及每个变化间隔段的相邻的变化间隔段的每个数据点的监测值的变化情况,确定第p个变化间隔段的第q个数据点的活性关联度。
19、进一步地,所述确定第p个变化间隔段的第q个数据点的活性关联度,包括:
20、,
21、式中,表示第p个变化间隔段的第q个数据点的活性关联度,表示第p个变化间隔段的第q个数据点的监测值,表示第p-1个变化间隔段的第q个数据点的局部窗口内第n个数据点的监测值,表示第p+1个变化间隔段的第q个数据点的局部窗口内第n个数据点的监测值,第p-1个变化间隔段和第p+1个变化间隔段是第p个变化间隔段的相邻的变化间隔段,表示第p-1个变化间隔段的第q个数据点的局部窗口内第n个数据点的斜率,表示第p+1个变化间隔段的第q个数据点的局部窗口内第n个数据点的斜率,表示取最大值函数,表示取最小值函数,表示以自然常数为底的指数函数。
22、进一步地,所述获取每个变化间隔段的每个数据点的对称点,包括:
23、对于第p个变化间隔段的第q个数据点,其对称点为第p个变化间隔段的第个数据点,其中,表示第p个变化间隔段中数据点的数量,q表示第p个变化间隔段的第q个数据点的序号。
24、进一步地,所述根据每个变化间隔段的每个数据点的局部窗口内每个数据点及其对称点的斜率的差异,以及每个变化间隔段的相邻的变化间隔段的每个数据点的活性关联度的差异,确定每个变化间隔段的每个数据点的活性影响度,包括:
25、,
26、式中,表示第p个变化间隔段的第q个数据点的活性影响度,表示第p+k个变化间隔段的第q个数据点的局部窗口内第n+1个数据点的活性关联度,表示第p+k个变化间隔段的第q个数据点的局部窗口内第n个数据点的活性关联度,表示第p+k个变化间隔段的第q个数据点的局部窗口内第n-1个数据点的活性关联度,表示第p+k个变化间隔段的第q个数据点的局部窗口内所有数据点的斜率比值的方差,所述数据点的斜率比值是指该数据点的斜率与该数据点的对称点的斜率的比值。
27、进一步地,所述根据监测值曲线上的每个数据点的活性影响度,对每个数据点到监测值曲线的直线的距离进行调整,包括:
28、,
29、式中,表示每个数据点到直线的调整后的距离,d表示每个数据点到直线的距离,表示每个数据点的活性影响度的线性归一化结果。
30、本发明还提出一种复合酶生产过程自动管理系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现任意一项所述一种复合酶生产过程自动管理方法的步骤。
31、本发明的技术方案的有益效果是:本发明根据每个时刻的温度和ph值确定每个时刻的监测值,根据异常波动的数据的特征,确定每个变化间隔段的每个数据点的活性关联度,进而确定每个变化间隔段的每个数据点的活性影响度,在通过dp算法对复合酶的监测值曲线进行压缩的过程中,根据监测值曲线上的每个数据点的活性影响度,对每个数据点到监测值曲线的直线的距离进行调整,根据每个数据点到直线的调整后的距离确定监测值曲线的所有分割点,使得异常波动的数据点尽量保留,则最终根据分割点获得的监测值曲线的近似曲线上,存在异常波动的数据点的解压的结果与压缩前的数据的差异较小,能够通过解压后的数据准确地分析复合酶的生产过程中的异常情况。