本发明属于信号解码技术领域,尤其涉及一种用于基因调控中及控制基因表达水平的噪声信号解码方法。
背景技术:
目前,最接近的现有技术:细胞经常暴露在复杂的环境中,需要对外部信号做出可靠的响应才能获得更好的生存能力。在细胞信号通路中处理(实际上编码)信号有两种主要机制:1-6:内部信号分子的绝对浓度编码输入信号的放大调制(am),以及其中的频率调制(fm)连续脉冲之间的周期代表刺激信号。虽然已经在信号通路中观察到这两种信号编码机制,但是动态和噪声信号如何最终被解码成遗传信息的问题仍然是高度难以捉摸的。
有实验证据支持am或fm或两者都可以在基因调控中发生。这里列出几个相关的例子。首先,p53(肿瘤转录因子(tf))可以以am或fm方式响应uv辐射1-3。其次,在芽殖酵母酿酒酵母中,tfmsn2的核浓度与氧化应激下的h2o2浓度成正比,这意味着am机制7。第三,响应钙刺激的tfcrz1在进入不同步突发中的细胞核后调节至少一百个靶基因8。刺激水平仅影响突发频率,但不影响突发幅度和持续时间,这表明fm机制。第四,albeck等分析了egf刺激的erk/mapk途径的两个关键方面(细胞增殖信号的关键导管,也是许多癌症中的治疗靶点):信号强度编码的机制和响应曲线将信号输出与增殖相关联,并发现在稳态条件下,erk在离散的异步脉冲中被激活,其频率和持续时间由跨越生理范围的egf的细胞外浓度决定。此外,在细菌和哺乳动物中也发现了突发性fm,例如,在能量消耗应激期间,细菌枯草芽孢杆菌通过激活离散随机脉冲中的某些tf来调节约150个下游基因。活化t细胞中的同种型nfat4显示出相似的行为11。这些表明突发fm是跨不同小区类型的一般调制方案。
已经有理论工作来探索幅度和频率解码的机制以及这两种解码方案的可靠性。例如,tostevin等人6在响应振荡或恒定tf信号的简单模型中研究了基因启动子的动力学,并发现在生物学相关的系统参数方案中,确定性和振荡输入信号可以产生更多恒定蛋白质水平比恒定输入信号。还有其他理论工作来研究am和fm的优缺点。例如,micali等人4分析了另一种单一受体的简单模型,该模型可以在配体结合时连续发出信号,或者在信号分子上产生突发信号。受体结合,并表明fm仅比具有快速信号传导的单一受体更准确,而后者仅比慢基因调节和多受体信号传导更准确。尽管这些工作或其他工作3,5,7,10,14,15很好地揭示了信号如何在信号网络或基因调控中解码的机制,但所使用的模型仅考虑输入信号是确定性的情况。
然而,在生物系统中,由这些信号激活的外部信号和另外的tf通常是动态且有噪声的。事实上,信号通路可以诱导tf激活的不同动态。例如,hao等人5表明,芽殖酵母一般应激响应tfmsn2充当可调信号处理器,可以以依赖于输入的方式跟踪,过滤或整合信号。同时,他们还指出,这种可调信号处理似乎源于磷酸化对核输入和输出的双重调节,并强调msn2的通用信号处理对于产生对不同自然应力的不同动态响应是重要的。最近,hansen和o'shea1应用信息理论来量化酵母tfmsn2在其激活动力学的幅度或频率中可以转导到靶基因的基因表达信息量,并发现尽管msn2传递了信息量。单个靶基因是有限的,可以通过调节启动子顺式元件或通过整合来自多个基因的信息来增加信息转导。
主要由这两个作品激发,引入了一个生物学上合理的随机转录模型,其中转录率或mrna降解率应该由tf信号直接调节。然而,与以前的研究不同,的模型认为这种调节信号(输入)可能不仅是动态和嘈杂的,而且还以不同的方式调节靶基因的表达水平(输出)。除了考虑两种常见的信号之外:幅度信号,即信号幅度可变,但频率固定,频率信号,即信号频率可变,但幅度不变,也考虑有噪声信号的持续时间,其中持续时间定义为从脉冲到有噪信号的下一个脉冲的时间长度(因此它描述了信号噪声频率的波动程度)。
另一个动机是考虑随机聚焦(sf),这是一种重要的生物现象,也是信号扩大的代表机制。在先前关于sf16-20的研究中,波动的信号被认为是幅度调制的信号,sf的基本要求是信号快速波动并且输出信号对输入信号的响应函数是非线性的。例如,如在基本酶促反应方案16中所证明的,sf的基本(经验推导)条件是活性酶波动的幅度与活性酶的平均数量相比非常大,而酶的总数可能非常大。低。此外,唯一的调节方式是输入噪声信号直接作用于衰减速率。此外,注意到在现有参考文献中没有考虑频率调制信号。在本发明中,将讨论幅度调制或频率调制输入信号是否会引起输出的sf的问题。
研究集中于上游信号中的噪声对下游mrna表达水平的影响,主要结果是输入噪声可以诱导输出的sf(即mrna)。更重要的是,揭示动态和噪声信号的解码机制,类似于ref。1,使用输入和输出之间的互信息(mi)来量化信息损失,但使用由mrna的熵产率量化的能量消耗(ec)来量化信号转导(或信息传输)的成本)。通过模型分析,发现了一些在确定性输入情况下未观察到的有趣现象。重要的是,阐明了下游基因如何解码上游动态和噪声信号的动态机制。
综上所述,现有技术存在的问题是:实验证据支持信号传导途径可以诱导转录因子(tf)激活的不同动态,但输入信号如何被这种动态,有噪声的tf编码并且进一步被下游基因解码仍然很不清楚。
技术实现要素:
针对现有技术存在的问题,本发明提供了一种用于基因调控中及控制基因表达水平的噪声信号解码方法。
本发明是这样实现的,一种用于基因调控中及控制基因表达水平的噪声信号解码方法,所述用于基因调控中及控制基因表达水平的噪声信号解码方法包括以下步骤:
步骤一,解码来自其环境的信息,细胞通常使用配体结合的受体来触发相应的化学信号,反过来间歇地激活tf,然后调节靶基因及其表达;
步骤二,引入和分析其中环境波动以随时间和随机变化的转录或降解速率编码的概念模型,发现调节的基因表达水平取决于信号解码方案和细胞外信号的特征。
进一步,所述用于基因调控中及控制基因表达水平的噪声信号解码方法的模型的动态和噪声tf直接调节转录速率或mrna降解速率,假设这两个速率中的每一个的变化代表tf激活或输入信号的动态;假设tf信号以脉动方式发生;或者,假设一个共同的on-off模型产生一个动态的,波动的信号,它作为tf调节下游基因的表达;将动态和噪声tf区分为幅度波动信号或频率波动信号;将tf称为转录信号,如果它调节转录率,相应的模型称为转录调节模型,而tf作为降解信号,如果它调节mrna降解速率,并将相应的模型作为降解调节模型。
进一步包括:基因调控模型可以被视为出生-死亡过程,用dna表示基因,用kb(t)表示时间转录率,单位:μm/sec,用kd(t)表示时间降解率,单位:μm/sec,那么基因模型考虑通过以下两种生化反应来描述;
其中m代表mrna,
建立化学主方程,设p(m,t)表示mrna在时间t具有m个拷贝数的概率,主方程采用该形式;
如果kd(t)是常数,则等式(2)对应于转录调节模型,而如果kb(t)是常数,则对应于降解调节模型;如果kb(t)和kd(t)是确定的,则解析地求解方程(2);如果这两个速率中的一个是动态且有噪声的,采用数值方法。
进一步,所述用于基因调控中及控制基因表达水平的噪声信号解码方法的gillespie算法的修改版本:对于振荡输入信号,噪声主要以两种方式出现:幅度波动和信号脉冲定时波动;
首先,考虑振幅波动的情况。在每种情况下,振荡信号接通幅度kb(t);与ref类似;从对数范数分布中对kb进行采样,有噪信号的平均宽度被设置为常数;然后,考虑频率波动的情况;
幅度的波动被设置为零,根据定义计算开启时间和关闭时间;在计算中,将频率信号的方差保持在相同的值;完全相似,可以给出计算kd(t)的数值算法。
进一步,所述用于基因调控中及控制基因表达水平的噪声信号解码方法进一步包括:
相互信息(mi),mi(x,y),其量化关于可通过观察信号输出(y)获得的信号输入(x)的信息量,在数学上被定义为;
其中p(x,y)是随机变量x和y的联合概率分布,p(x)和p(y)分别是相应的边际分布;由于mi通常以位为单位进行测量,使用2作为对数的基础,等式(3)中定义的mi用于量化信息传输。
进一步,所述用于基因调控中及控制基因表达水平的噪声信号解码方法进一步包括:能量消耗量ec,根据以下公式计算;
k(σ,σ')代表从状态σ到状态σ'的转移概率,p(σ)代表概率;底层系统处于状态;对于给定的kb(t)或kd(t)的时间序列数据集,如果是时间依赖的mrna分布,p(m,t),由改进的gillespie算法给出,则方程(4)将成为
本发明的另一端面在于提供一种应用所述用于基因调控中及控制基因表达水平的噪声信号解码方法的信息数据处理终端。
本发明的优点及积极效果为:本发明表明保持信号噪声的强度不变但延长信号持续时间既可以增强互信息(mi),又可以降低能量成本(ec);如果信号持续时间是固定的,较大的mi需要较大的ec,但如果信号周期固定的,信号在一个较低的分支上有一个最佳时间,这样mi达到最大值;如果时间和持续时间同时固定,增加输入噪声总是可以在转录调节的情况下增强mi,而不是在降解调节的情况下;此外,发现输入噪声可以以与调节相关的方式引起随机聚焦。这些结果不仅揭示了基因调控中噪声信号解码的动态机制,而且揭示了外部噪声在控制基因表达水平中的重要作用。
附图说明
图1是本发明实施提供的用于基因调控中及控制基因表达水平的噪声信号解码方法流程图。
图2是本发明实施提供的具有信号调节的随机转录模型的示意图;
图中:(a)mrna衰减率kd是常数,但转录率kb由输入信号调节,其幅度为波动,但期限是固定的;(b)衰变率是恒定的,但转录率由输入调节信号,其周期波动但幅度不变;(c)转录率是恒定的但是衰减率由输入信号调节,输入信号的幅度波动但周期固定;(d)转录率不变,但衰减率由周期波动的输入信号调节不变幅度。
图3是本发明实施提供的互信息(单位:位)对导通时间和关闭时间(单位:秒)的依赖关系输入噪声信号的三个固定方差用误差条表示:振幅调制的情况信号。指示的“信息”表示输入和输出之间的相互信息,这是根据正文中的等式(3)计算的。(a,b)转录速率由振荡的噪声信号调节衰减率保持不变,而在(a,b)中,衰减率的上限和下限的平均值信号分别设置为0.8和0.1(单位:μm),在(b)中,衰减率设置为0.05(单位:μm/秒)转录信号与(a)中的相同;(c,d)衰减率由振荡的噪声信号调节而转录率保持不变。在第一列中,输出mrna的平均值是固定的在15(单位:μm),而在第二列,平均值不固定,在(c),平均值上和下信号分别设置为0.1和0.025,而在(d)中,衰减信号与in相同(c),转录率设定为0.5(单位:μm/秒)。在所有情况下,信号持续时间固定为3(单位:秒),整个时期的时间长度设置为200(单位:秒),每条曲线代表平均值超过1000变现。
图4是本发明实施提供的能耗(无单位)对三个固定时间的开启时间和关闭时间的依赖性输入噪声信号的方差用误差条表示:振幅调制信号的情况。所有设置和所有考虑的情况与图3中的相同。
图5是本发明实施提供的能量消耗(“能量”)与相互影响之间的关系('信息'),其中所有设置和所有考虑的情况与图3中的相同。显示在那里是“能量”和“信息”之间的正相关。
图6是本发明实施提供的互信息/能耗对四个时间和关闭时间的依赖性噪声条显示噪声输入信号的固定方差:频率调制信号的情况,其中,insets是与箭头所示部分对应的局部图;(a,c)调节转录率的情况,其中振荡的上限和下限信号分别设置为0.8和0.1;(b,d)降低率受到调节的情况,其中上层振荡信号的下限分别设定为0.1和0.025。
图7是本发明实施提供的互信息/能耗对固定时间和关闭时间的依赖性输入信号的持续时间用误差条表示;左列(a)和(c)对应于的情况转录率被调节,而右列(b,d)与降解率的情况相同reglated。
图8是本发明实施提供的有噪声的输入信号可以在输出mrna中引起随机聚焦,其中t代表输出mrna整个信号周期的长度。(a,c)调幅信号调节转录物率和衰减率;(b,d)频率调制信号调节转录率和衰减率。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面结合附图对本发明的应用原理作进一步描述。
如图1所示,本发明实施例提供的用于基因调控中及控制基因表达水平的噪声信号解码方法包括以下步骤:
步骤s101,解码来自其环境的信息,细胞通常使用配体结合的受体来触发相应的化学信号,反过来间歇地激活tf,然后调节靶基因及其表达;
步骤s102,引入和分析其中环境波动以随时间和随机变化的转录或降解速率编码的概念模型,发现调节的基因表达水平取决于信号解码方案和细胞外信号的特征。
本发明提供的模型说明:
正如引言中所指出的,tf信号不仅可以是动态的和嘈杂的,而且还可以以不同的方式调节靶基因的表达。为了方便分析,考虑随机转录的常见模型,其中基因被认为直接转录成mrna。此外,假设动态和噪声tf直接调节转录速率或mrna降解速率,即,假设这两个速率中的每一个的变化代表tf激活或输入信号的动态。此外,假设tf信号以脉动方式发生(事实上,振荡信号在基因调控系统中广泛存在)。或者,假设一个共同的on-off模型产生一个动态的,波动的信号,它作为tf调节下游基因的表达。然而,将动态和噪声tf区分为幅度波动信号或频率波动信号。因此,总共有四种可能性,为方便起见,将tf称为转录信号,如果它调节转录率,相应的模型称为转录调节模型,而tf作为降解信号,如果它调节mrna降解速率,并将相应的模型作为降解调节模型。
根据上述假设,所示的基因调控模型可以被视为出生-死亡过程,但是当前的mrna产生(即转录)或降解速率可能是时间依赖性的。因此,如果用dna表示基因,用kb(t)表示时间转录率(单位:μm/sec),用kd(t)表示时间降解率(单位:μm/sec),那么基因模型就在考虑可以通过以下两种生化反应来描述,
其中m代表mrna,
接下来,建立要研究的化学主方程。设p(m,t)表示mrna在时间t具有m个拷贝数的概率。然后,主方程采用该形式
注意到在信号是动态且有噪声的情况下,p(m,t)应被理解为对输入信号有条件的概率。特别地,如果kd(t)是常数,则等式(2)对应于转录调节模型,而如果kb(t)是常数,则对应于降解调节模型。可以看出,如果kb(t)和kd(t)都是确定的,则可以解析地求解方程(2)(参见以下段落中的内容)。然而,如果这两个速率中的一个是动态且有噪声的,那么分析求解方程(2)似乎非常困难。在这种情况下,将开发一种数值方法,它实际上是着名的gillespie算法的修改版本(也见以下段落或附录a中的内容)。
由于假设输入信号是脉动或振荡,为方便起见,引入信号的所谓“接通状态”,“断开状态”,“接通时间”和“断开时间”。在调节转录速率的情况下,on状态对应于振荡信号的上部分支而off状态对应于下部分支。对于转录调节模型,on时间定义为信号在较高状态下花费的时间,而off时间定义为信号在较低状态下花费的时间。然而,对于降解调节模型,on时间和关闭时间的定义应该与转录调节模型的定义相反,因为对于前者,衰减率越大,平均值越低。的mrna是。注意,on时间和off时间都是嘈杂fm情况下的随机变量,但在am情况下是确定的。通常,这些时间及其手段只能通过数值计算获得。指出,在调节转录速率的情况下,上述定义可以类似于普通on-off模型25的情况。另外,对于am信号,on时间和off时间都是常数,而fm信号的幅度不会在on时间和off时间内波动。总之,所有术语都应该以自然的方式理解。
本发明提供的gillespie算法的修改版本:
标准的gillespie算法26已广泛用于模拟化学系统,其中反应倾向与时间无关。由于在的情况下转录率或降级率当前是动态的并且有噪声,这意味着等式(2)描述的过程是非马尔可夫的,因此该算法不能直接应用而是需要修改。在这里,提出了标准gillespie算法的修改版本来解决方程式(2)。
注意,对于振荡输入信号,噪声主要以两种方式出现:幅度波动和信号脉冲定时波动。首先,考虑振幅波动的情况。在每种情况下,振荡信号接通幅度kb(t)。与ref类似。从对数范数分布中对kb进行采样(指出如果使用不同的分布,例如gamma分布,那么所有的定性结果都是这两个给定的平均值kb(up)和kb(low)分别表示没有噪声的脉动信号的上限和下限,注意,在这种情况下,有噪信号的平均宽度被设置为常数。然后,考虑频率波动的情况。在这种情况下,幅度的波动被设置为零,但是上部和下部的信号的宽度也是从对数范数分布产生的。因此,可以根据它们的定义计算开启时间和关闭时间。在计算中,将频率信号的方差保持在相同的值。完全相似,可以给出计算kd(t)的数值算法。
一旦使用上述数值方案以数字方式确定kb(t)和kd(t),则左计算步骤与标准gillespie算法中的相同。
本发明提供的相互信息和精力充沛的成本:
相互信息(mi),mi(x,y),其量化关于可通过观察信号输出(y)获得的信号输入(x)的信息量,在数学上被定义为
其中p(x,y)是随机变量x和y的联合概率分布,p(x)和p(y)分别是相应的边际分布。由于mi通常以位为单位进行测量,因此使用2作为对数的基础。在本发明中,等式(3)中定义的mi用于量化信息传输。有关详细信息,请参阅附录b.
如果可以精确地控制信号输入并且可以精确地测量信号输出分布,则可以应用上述信息理论。在的例子中,时间依赖和波动的出生或死亡率kb(t)或kd(t)被视为信号输入,而下游mrnam被视为信号输出。在数值计算中,利用上述方案生成转录和降解速率的时间序列数据,并利用上述修改的gillespie算法获得mrna水平的时间序列数据。因此,可以计算输入和输出信号的联合概率分布,以及相应的边际分布。
从热力学的角度来看,信号转导是一种非平衡过程,因为输入信号是例如脉冲或不可逆性,这可能破坏详细的平衡。从信息论的角度来看,熵产率恰好是能量消耗量(ec)。对于详细平衡系统,没有ec,而对于非平衡稳态系统,有ec30。因此,信号传输过程必然会消耗能量。ec可以反映信息解码的成本,但是在信息解码过程中如何消耗能量尚不清楚。
在数学上,ec根据以下公式计算。
这里,k(σ,σ')代表从状态σ到状态σ'的转移概率,p(σ)代表概率
底层系统处于状态。在的例子中,对于给定的kb(t)或kd(t)的时间序列数据集,如果是时间依赖的mrna分布,p(m,t),由改进的gillespie算法给出,则方程(4)将成为
下面结合具体实施例对本发明的应用原理作进一步的描述。
1、方法
1.1模型说明
正如引言中所指出的,tf信号不仅可以是动态的和嘈杂的,而且还可以以不同的方式调节靶基因的表达。为了方便分析,考虑随机转录的常见模型,其中基因被认为直接转录成mrna。此外,假设动态和噪声tf直接调节转录速率或mrna降解速率,即,假设这两个速率中的每一个的变化代表tf激活或输入信号的动态。此外,假设tf信号以脉动方式发生(事实上,振荡信号在基因调控系统中广泛存在)。或者,假设一个共同的on-off模型产生一个动态的,波动的信号,它作为tf调节下游基因的表达。然而,将动态和噪声tf区分为幅度波动信号或频率波动信号。因此,总共有四种可能性,参见图2.为方便起见,将tf称为转录信号,如果它调节转录率,相应的模型称为转录调节模型,而tf作为降解信号,如果它调节mrna降解速率,并将相应的模型作为降解调节模型。
根据上述假设,图2中所示的基因调控模型可以被视为出生-死亡过程,但是当前的mrna产生(即转录)或降解速率可能是时间依赖性的。因此,如果用dna表示基因,用kb(t)表示时间转录率(单位:μm/sec),用kd(t)表示时间降解率(单位:μm/sec),那么基因模型就在考虑可以通过以下两种生化反应来描述,
其中m代表mrna,
接下来,建立要研究的化学主方程。设p(m,t)表示mrna在时间t具有m个拷贝数的概率。然后,主方程采用该形式
注意到在信号是动态且有噪声的情况下,p(m,t)应被理解为对输入信号有条件的概率。特别地,如果kd(t)是常数,则等式(2)对应于转录调节模型,而如果kb(t)是常数,则对应于降解调节模型。可以看出,如果kb(t)和kd(t)都是确定的,则可以解析地求解方程(2)(参见以下段落中的内容)。然而,如果这两个速率中的一个是动态且有噪声的,那么分析求解方程(2)似乎非常困难。在这种情况下,将开发一种数值方法,它实际上是着名的gillespie算法的修改版本(也见以下段落或附录a中的内容)。
由于假设输入信号是脉动或振荡,为方便起见,引入信号的所谓“接通状态”,“断开状态”,“接通时间”和“断开时间”。在调节转录速率的情况下,on状态对应于振荡信号的上部分支而off状态对应于下部分支(参见图2a和b)。对于转录调节模型,on时间定义为信号在较高状态下花费的时间,而off时间定义为信号在较低状态下花费的时间。然而,对于降解调节模型,on时间和关闭时间的定义应该与转录调节模型的定义相反,因为对于前者,衰减率越大,平均值越低。的mrna是。注意,on时间和off时间都是嘈杂fm情况下的随机变量,但在am情况下是确定的。通常,这些时间及其手段只能通过数值计算获得。指出,在调节转录速率的情况下,上述定义可以类似于普通on-off模型25的情况。另外,对于am信号,on时间和off时间都是常数,而fm信号的幅度不会在on时间和off时间内波动。总之,所有术语都应该以自然的方式理解。
1.2gillespie算法的修改版本
标准的gillespie算法26已广泛用于模拟化学系统,其中反应倾向与时间无关。由于在的情况下转录率或降级率当前是动态的并且有噪声,这意味着等式(2)描述的过程是非马尔可夫的,因此该算法不能直接应用而是需要修改。在这里,提出了标准gillespie算法的修改版本来解决方程式(2)。
注意,对于振荡输入信号,噪声主要以两种方式出现:幅度波动和信号脉冲定时波动。首先,考虑振幅波动的情况。在每种情况下,振荡信号接通幅度kb(t)。与ref类似。从对数范数分布中对kb进行采样(指出如果使用不同的分布,例如gamma分布,那么所有的定性结果都是这两个给定的平均值kb(up)和kb(low)分别表示没有噪声的脉动信号的上限和下限,参见图2b和d。注意,在这种情况下,有噪信号的平均宽度被设置为常数。然后,考虑频率波动的情况。在这种情况下,幅度的波动被设置为零,但是上部和下部的信号的宽度也是从对数范数分布产生的。因此,可以根据它们的定义计算开启时间和关闭时间。在计算中,将频率信号的方差保持在相同的值。完全相似,可以给出计算kd(t)的数值算法。
一旦使用上述数值方案以数字方式确定kb(t)和kd(t),则左计算步骤与标准gillespie算法中的相同。有关详细信息,请参阅附录a.
1.3相互信息和精力充沛的成本
早在1948年,shannon发现信息理论可以很好地量化输入信号和输出信号之间的信号转换(或信道)的信息转换。如果信号通路有噪声,则已知信号输入将导致信号输出的分布。这表示信息丢失,因为无法再从观察信号输出中可靠地学习信号输入。相互信息(mi),mi(x,y),其量化关于可通过观察信号输出(y)获得的信号输入(x)的信息量,在数学上被定义为
其中p(x,y)是随机变量x和y的联合概率分布,p(x)和p(y)分别是相应的边际分布。由于mi通常以位为单位进行测量,因此使用2作为对数的基础。在本发明中,等式(3)中定义的mi用于量化信息传输。有关详细信息,请参阅附录b.
如果可以精确地控制信号输入并且可以精确地测量信号输出分布,则可以应用上述信息理论。在的例子中,时间依赖和波动的出生或死亡率kb(t)或kd(t)被视为信号输入,而下游mrnam被视为信号输出。在数值计算中,利用上述方案生成转录和降解速率的时间序列数据,并利用上述修改的gillespie算法获得mrna水平的时间序列数据。因此,可以计算输入和输出信号的联合概率分布,以及相应的边际分布。
从热力学的角度来看,信号转导是一种非平衡过程,因为输入信号是例如脉冲或不可逆性,这可能破坏详细的平衡。从信息论的角度来看,熵产率恰好是能量消耗量(ec)。对于详细平衡系统,没有ec,而对于非平衡稳态系统,有ec30。因此,信号传输过程必然会消耗能量。ec可以反映信息解码的成本,但是在信息解码过程中如何消耗能量尚不清楚。
在数学上,ec根据以下公式计算。
这里,k(σ,σ')代表从状态σ到状态σ'的转移概率,p(σ)代表概率
底层系统处于状态。在的例子中,对于给定的kb(t)或kd(t)的时间序列数据集,如果是时间依赖的mrna分布,p(m,t),由改进的gillespie算法给出,则方程(4)将成为
2、结果
分析分布。根据公式(5),知道要计算ec,关键是得出mrna分布p(m,t)。为此目的,即,为了解析地求解方程(2),假设kb(t)和kd(t)是两个已知的时间相关函数。在这种情况下,如果引入概率生成函数对于
对于等式(6),寻求具有u=(z-1)的特定形式g=φ(u,t)eμ(t)u的解,其中
通过研究恒定速率的生灭过程,选择μ(t)使其满足下面的常微分方程
这种μ(t)的选择是合理的,因为如果两个速率kb和kd是常数,则恒定比μ=kb/kd减小到已知的情况。通过μ(t)的这种特殊选择,等式(7)可以简化为
因此,通过应用特征线方法,可以很容易地得到方程(9)的一般解,表示为
φ(u,t)=h(δ),(10)
其中h是
因为等式(8)是μ中的线性微分方程。
在不失一般性的情况下,假设初始mrna具有m0分子。然后,函数g(z,0)是由…给出
由于g=φ(u,t)eμ(t)u,μ(0)=0,知道
从而确定了函数h.很容易验证函数
是满足初始条件(13)的等式(9)的解。此外,如果mrna的初始数量为零,即m0=0,那么具有时间依赖率kb(t)和kd(t)的等式(6)的解可以表示为:
g(z,t)=eμ(t)(z-1)(15)
因此,根据可能性密度函数和生成函数之间的关系,可以获得时间依赖性的mrna分布,即
这表明时间相关比μ(t)仅是影响mrna的平均值和相应概率分布的形状的因素。此外,如果函数μ(t)是常数,则由等式(16)给出的分布以恒定速率再现出生-死亡过程的已知结果。
如果转录率kb或mrna衰减率kd是随机变量,暗示μ(t)遵循一些分布q(t),那么根据分布特性,知道重新分布r(m,t)应该是q(t)和p(m,t)的卷积,即
在得到分析mrna分布后,接下来进行数值模拟。在的数值结果的演示中,将使用字母“d”来表示输入噪声信号的持续时间,符号“var”表示在动态转录速率被采样的情况下该信号的方差。来自对数范数分布,以及符号′噪声′来表示方差与fm有噪信号的平均值的平方的比率,即表示输入噪声。
增加输入噪声有利于信息传输,但代价是ec:am情况。在本小节中,将重点介绍am信号的情况(图2a,c)。请注意,在这种情况下,输入信号仅在幅度上波动但不在周期长度波动,并且转录(或衰减)速率被调节,而衰减(或转录)速率保持不变。
on和off时间对mi的影响。在这里,绘制等式(3)中的mi对导通时间和关断时间的依赖关系,参见图3。
从该图中,首先观察到在无噪声的情况下输入信号和输出信号之间的导通时间或关断时间的mi函数是向上凸起的。然而,随着输入噪声信号的方差的增加,该凸函数变得更平坦。其次,观察到在转录速率受到调节的情况下,mi随着输入信号的方差的增加而增加固定的关闭时间,参见图3a和b,而在降级的情况下根据图3c和d,速率受到调节,mi的变化趋势基本上与前一种情况相反。具体地,对于固定的适度接通时间,mi的大小随着输入信号的方差的增加而减小。第三,在所有四种情况中,存在最佳导通时间或关断时间,使得mi功能达到最大值,但是随着输入信号的噪声方差增加,该最大值将逐渐变得不明显。第四,最大可能随着增加而漂移在转录速率受到调节的情况下,在输入噪声信号的方差中。最后,接近最大值的误差通常大于其他地方的误差,这意味着前者对接通时间比后者更敏感。
众所周知,互信息的价值越大,信息传递的效果越好。因此,图3所示的结果意味着输入信号(或外部噪声)中的噪声有利于信息传输。这是本发明的主要结果之一。
on和off时间对ec的影响。在这里,检查信息传输过程中的ec特征。为此,绘制了由等式(5)计算的ec对on-time和off-timerespectivley的依赖性,参见图4。
从图4可以看出,在调节转录速率的情况下,ec的变化趋势与mi的变化趋势基本相同(比较图4a和b与图3a和b)。例如,关闭时间的ec功能是向上凸起的,并且存在最佳接通时间或关闭时间,使得该功能达到最大值。然而,在调节降解速率的情况下,图3和4之间的变化趋势存在明显差异(比较图4c和d与图3c和d)。例如,随着输入噪声信号的方差增加,ec对于任意固定的接通时间总是变大,并且off时间的ec函数根本不是凸的,而是在方差足够大之后最终变为单调增加。图3表明输入噪声越大,消耗的能量越大。
总之,比较图4和图3,首先发现在转录率受到调节的情况下,输入输出mi和ec之间存在正相关,参见图5.也就是说,传输的信息越多,消耗的能量越大,这与的直觉相符。从图5可以看出,随着输入信号变化的增加,这种正相关变得更加明显,这意味着较大的输入噪声对信息传输更有利,但这会消耗更多的能量。然后,发现在转录率而不是降解率被调节的情况下,mi或ec可以达到最大值,并且当前出现的前者的最大值作为关闭时间的长度是约为导通时间的两倍。
在这里,给出了图3和图4中所示的数值结果的直观解释。为清楚起见,仅考虑转录率受到调节的情况。根据噪声34的加法规则,知道输出信号(即mrna)中的噪声等于输入信号中的噪声(即外部噪声)加上由mrna的随机生死引起的噪声。(即内部噪音)。简单来说,输入噪声会增加输出噪声。然而,噪声可以被视为一种随机力,并且该力越大,能量消耗得越多。因此,am或fm信号增加ec。此外,输入噪声越强,输出噪声越大,这意味着输出和输入信号的相关性越高。因此,输出和输入信号之间的mi变大的结果并不奇怪。对于其他调节案例,也可以给出类似的直观解释。
此外,对图3和4中所示的数值结果给出生物学解释。在生物学中,包裹核小体的dna是由扩散35控制的随机过程,例如,色度-锡重塑因子与启动子dna的结合。据信包裹在核小体周围的启动子dna非常稳定并且具有比转录时间尺度更长的典型寿命36。请注意,基因在on和off状态下花费的不对称平均时间是基因表达中常见的现象37。在的例子中(图3a和b),已经表明,不对称的on-off基因基序在信号处理中具有优势,因为它可以将更多关于外部信号的信息传递给内部基因表达。因此,推测一个单元将利用这种简单的网络结构来复制其不确定的外部环境。对于这样的猜想,micali等人4给出了一个合理的解释,基于这样一个事实:受体/离子通道只能在未结合(off)时间间隔内检测到细胞外环境的信息(因为细胞外刺激仅影响细胞外刺激)。约束率)。因此,图3a和b所示的结果,即信息传输量可以随着关闭时间延长而增大,在生物学上是合理的。
然而,在衰减率被调节的情况下(图2c),当on时间和关闭时间几乎具有相同值时,mi的最大值出现,这意味着最大mi在此漂移。案件。尽管如此,信息传输的增强呈现出不一致的趋势,其中“不一致”是指在大输入噪声信号的调节下mi的大小并不总是比在小输入噪声信号的调节下更大。对于off时间的中等值,具有小噪声的mi的大小远大于具有大噪声的mi的大小(图3c和d)。在这里,给出了一些(生物学)解释。如果am信号调节降级率,那么较大的噪声应该能够增强信息传输,因为在实际情况下接通时间和关断时间是不对称的(事实上,对于大多数基因,前者明显更大)比后者)。即使关闭时间远大于接通时间,也可以通过增强信息传输来产生更大的噪声。如果它调节转录率,这些表明am信号在增强信息密度方面的优势。相反,外部信号的噪声强度对ec具有不同的影响,例如,噪声越大,消耗的能量越多,与接通时间或关断时间无关。
增加输入噪声有利于信息传输,但代价是ec:fm情况。这里的调查基本上类似于前一小节中的调查,但考虑了fm信号调节。使用相对波动(即'noise',其定义为方差与均值的平方之比)而不是绝对波动('var')。这种变化的原因是“噪声”可以比fm情况下的“方差”更好地描述随机性。通过数值分析,得到的定性结论基本上类似于在am信号情况下获得的定性结论。具体的数值结果如图6所示。
从图6中,首先观察到存在最佳接通时间或关断时间,使得mi功能和ec功能都达到相应的最大值。然后,对于固定的接通时间或关断时间,在高噪声的情况下mi或ec的大小基本上高于低噪声的情况,这意味着增加输入信号中的噪声可以促进信息传输但是以ec为代价。此外,观察到在off时间低于某个值的情况下,mi和ec对输入噪声不敏感,参见图6a和c。在这种情况下,绘制两个局部放大的图表,以帮助理解输入噪声对mi的影响的差异,参考图6a和c的插图。
比较图6和图3,发现基本上,mi随着fm情况下输入信号中噪声的增加而适度变化,这意味着mi对外部噪声信号不敏感。这里“基本上”是指一种情况是例外的,即如果fm信号的噪声足够大,信息的放大效应仍然很明显。从图5中还可以看到,即使噪声强度设置为0.1或0,实线蓝线和红色虚线也对应于几乎相同的信息传输量。更一般地说,如果输入fm信号中的噪声是弱,则信息的放大效应不明显(数据未显示)。更重要的一点是,增加fm信号的噪声强度将增加信息传输量(图6),但曲线之间的交叉将不会出现如图3c和d所示。从图6a中发现,信息传输量几乎在相同的值,但是当导通时间远大于关闭时间时,ec得到略低的值。一旦关闭时间的值超过约120(图6a),噪声的功能作用将变得明显。这符合基因在on状态中具有不对称停留时间的一般共识,并且off状态对于信息传输更好。随着噪声强度的增加,最大mi将在转录调节模型中出现在较小的接通时间,但这种现象不会发生在降解调节模型中。
另一个有趣的结果是,在频率模型中,在调节deacay速率的情况下,与调节转录速率的情况相比,可以传输更多信息。比较图6b和图3c,发现在前一种情况下,在fm信号的情况下,下游基因可以以较低的能量成本从上游信号获得更多信息(图4c和6d),而不是在情况下am信号。相反,当转录速率受外部刺激调节时,幅度调制信号传递的信息多于频率调制信号(图3a和6a),但ec几乎保持在同一水平。因此,认为在与ec的信息传输中,调幅信号对于转录调节模型的频率调制信号会更好,而后者对于降解调节模型将优于前者。从合成生物学的观点来看,这个猜想很重要。
增加信号持续时间可以放大mi并同时降低ec。持续时间是许多边缘的特征。在以前的工作8,10中,忽略了这个因素对信息传输的影响。在这里,研究信号持续时间如何影响ec的信息传输。为清楚起见,分别考虑两种调节情况:转录速率和mrna降解速率由动态和噪声信号调节。此外,在输入噪声信号的固定方差的三种信号持续时间的情况下绘制mi和ec对导通时间/关断时间的依赖性。数值结果如图7所示。
从图7中观察到,在两种调节情况下,mi和ec作为接通时间或断开时间的功能基本上是向上凸起的,除了接通时间的ec功能近似单调增加的一种情况,参见图7。6d。此外,在其他三种情况下,存在最佳接通时间或关断时间,使得mi功能和ec功能中的每一个达到最大值。
此外,对于固定的on-time或off-time,增加信号持续时间将增加mi的数量,参考图7a和b,但是将减小ec的大小,参见图7c和d。指出,如果输入信号的方差进一步增加(例如,如果它达到0.1),那么信号持续时间不会影响mi或ec的大小,表明信号持续时间对mi或ec的影响是独立的信号方差。
图7意味着降低上游信号的波动频率可以增强下游信号的解码能力,但同时降低ec。另一方面,根据定义,知道信号持续时间的增加意味着信号的两个脉冲之间的时间间隔变得更长。因此,通过增加信号持续时间来放大mi并减少ec的事实意味着较长的信号持续时间在放大mi和减少ec方面都优于较短的信号持续时间。raser在研究真核基因表达时也验证了这一事实。
从图7中,还看到,如果mrna输出保持在相同水平,那么转录调制模型可以传递更多信息但比降解调制模型消耗更少的能量,这意味着前者优于后者在相同条件下,按照先前获得的结果。
输入噪声信号可以引起随机聚焦。正如在引言中所指出的,随机聚焦(sf)具有重要的生物学意义。与先前研究的情况16-18不同,这里将展示幅度调制或频率调制的输入信号可以诱导mrna输出的sf。参见图8中所示的数值结果。
从该图中,观察到,即使噪声强度增加到较大值,幅度模块化信号也不能在转录速率调节的情况下诱导sf现象(图8a)。实际上,在这种情况下,基因产物的平均值仅略微降低。相反,在调节降解速率的情况下,随着噪声强度的增加,平均mrna水平显着升高(图8c)。与幅度调制信号相反,频率调制信号总是可以诱导从平均mrna的较低水平向较高水平的转变,而与调节方式无关。此外,就像频率调制信号的情况一样,噪声可以诱导信息传递的增强,噪声也可以在其意图超过一定值后诱导平均mrna水平的明显增加。价值(图8b和d)。除了图7c之外,sf现象仅在信号周期的总长度低于某个阈值的情况下才明显。
sf具有重要的生物学意义。paulsson等人16指出,“生物化学反应的内部调节对细胞生长和存活至关重要。必须控制复制,基因表达和代谢活动的启动以协调细胞周期,监督细胞发育,响应环境变化或校正随机内部波动。所有这些任务都是由分子信号精心策划的,这些分子信号的浓度可能影响调节过程的反应速率。此外,活性物质分子通常以低拷贝数存在,因此生化系统的随机性是不可避免的。大自然呈现了多个有趣的过程实例,这些过程以高精度和规律性进行。这种显着的稳定性经常与建模者在低拷贝数体系中对化学反应固有随机性的经验相悖。此外,噪声和非线性的联合效应可导致“反直觉”行为,例如sf,如在基本酶促反应方案18中所证明的。在快速信号波动的假设下,sf已被证明能够将分级响应转换为阈值机制,从而减弱信号噪声的不利影响。产生sf16,18的基本前提是“输入”物种的波动必须足够快,因此任何依赖于信号分子的速率都具有最小的时间相关性。
与可以显示sf的经典酶促反应方案不同,这里已经表明,无论何种类型的调节,具有频率噪声的ocsillating信号也可以诱导sf。特别是,与模型中基因产物(实际上是mrna)的衰变速率相比,外部信号可以在没有快速波动的速率的情况下诱导sf现象。值得注意的是,噪声强度是放大sf效应的重要因素。总之,的结果扩展了sf的内涵。
3、结果
细胞在复杂环境中存活。为了解码来自其环境的信息,细胞通常使用配体结合的受体来触发相应的化学信号。这反过来间歇地激活tf,然后调节靶基因及其表达。以这种方式,传输信息但伴随着能量消耗。传统观点认为细胞内的信号传导水平直接编码外部刺激,随后核tf浓度逐渐变化。这实际上是am机制。然而,最近的单细胞实验也显示脉动信号和tf突然进入细胞核,非常类似于fm。此外,转录或降解速率的时间依赖性调节可能来自上游信号的变化传播,如调节网络中的波动,或者它可能是基因在on和off状态之间固有切换的结果。没有任何基因调控或外部信号。尽管有这些一般性描述,但是细胞外信号的定量和定性影响如何不完全清楚。这里,通过引入和分析其中环境波动以随时间和随机变化的转录或降解速率编码的概念模型,发现调节的基因表达水平取决于信号解码方案和细胞外信号的特征。具体地,细胞外噪声可以在fm方案中诱导sf,但仅在am方案中,其中提供输入信号以调节mrna的降解速率。另外,如果细胞外噪声强度保持不变,那么扩大信号持续时间可以增加信息传输但降低ec;相反,如果信号持续时间保持不变,则传输的信息越大,消耗的能量越大,这意味着信息传输是以能量为代价的。同时,存在最佳关闭时间,使得信息传输最大,这意味着不对称基因转换的优越性。在相同条件下,如果转录率波动,细胞外噪声可以增加信息传递,但是如果降解速率波动,则该噪声的影响是不同的。的研究结果不仅显示了细胞外噪声的生物学功能,而且还验证了fm方案在遗传信息处理中的优势。
应该指出的是,内在噪声(例如,在的情况下在mrna的生死过程中产生的噪声)与外在噪声(例如,在的情况下输入信号中的噪声)之间的平衡也起着重要作用。调节信息传输量。实现调节电路或生活在富裕环境中的电池会将这种平衡转向固有噪声40。除了这种遗传或环境调整之外,当输入信号动态而非静态地运行时,蜂窝系统可以避免由于外部噪声引起的信息丢失。的调查集中在上游动态和噪声信号对下游mrna表达水平的影响,但它也可以扩展到更复杂的病例,因此可以解释几个并行信号通路的作用,每个信号通路传递大约一点信息,作为增强信息传递的有效阈值装置的异质拷贝,例如,这在生长因子介导的基因表达的信号传导途径中观察到。
尽管已经证明ec和mi之间存在正相关(参见图5),但相关主题仍值得进一步讨论。r.landauer曾经认为,在逻辑上不可逆转的信息擦除是一个耗散过程43。这种逻辑上不可逆转换的直接后果是环境的熵增加了一定量。尽管它对信息理论具有根本重要性,但到目前为止还没有通过实验验证擦除原理,其主要障碍是难以在低耗散状态下进行单粒子实验。利用陷入调制双井电位的单个胶体粒子系统,eric等人,确定平均耗散热量在landauer界限处饱和(必须在删除经典信息时产生)在极限范围内长擦除周期。这一结果证明了信息论与热力学之间的密切联系,突出了不可逆计算的最终物理极限。
众所周知,ec是一个全球概念,因此是对系统行为的综合测量。基因调控中信息解码的复杂性是细胞外信号的幅度,频率和持续时间可能是动态的和不确定的(或有噪声的),并且可能影响ec和信息传输(由mi量化)。从生物学的角度来看,基因调控网络可能遵循一些设计原则来实现最佳进化适应性,这意味着基因表达在局部和全局受到限制。一个限制是信息传输。已经证明外部噪声可以增加信息传递,这意味着细胞外噪声将有利于遗传调控,即受调控的基因可以利用这种噪声来实现其功能。同时,基因转导网络有望最小化ec。已经看到,在细胞外信号的时间尺度变慢并且噪声环境保持相同的情况下,ec可以减少而信息传输可以增加,这表明慢速过程或慢速切换优于其他情况。这些结果与真核细胞的表达调节一致。并且外部噪声可能在fm方案中引起sf,但是这种现象仅在具有劣化调制的am方案中发生,表明前一种方案在相同的蜂窝环境中比后一种方案更有效。因此,当同时考虑“信息标准”和“最小能量标准”以及“效率标准”时,它们之间会存在权衡关系,值得进一步研究。
从广义上讲,时间排序(规律性和周期性)在生命系统中起至少两种作用:从环境中提取能量和信息处理。认为,进一步的工作应该将单细胞实验与集体行为和工程原理的思想结合起来。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。