专利名称:通过删除连接子以及在原核、原始菌和真核基因组中设计和添加合成的连接子来修饰基 ...的制作方法
相关申请的参考
本申请包括2000年7月5日提交的临时申请序列号No.60/393,558的主题。
本申请是2001年5月30日提交的题为“控制原核、原始菌和真核基因组中表达的侧翼DNA序列的算法测定(ALGORITHMIC DETERMINATION OF FLANKINGDNA SEQUENCES THAT CONTROL THE EXPRESSION OF SETS OF GENES INPROKARYOTIC,ARCHEA AND EUKARYOTIC GENOMES)”的美国专利申请序列号09/866,925的后继部分。
本申请还涉及2003年1月10日提交的题为“采用连接子(connectron)、干扰RNAS(IRNAS)和小时序RNAS(STRNAS)在原核、原始菌和真核基因组中基因表达控制的模拟(SIMULATION OF GENE EXPRESSION CONTROL USING连接子S,INTERFERENCE RNAS(IRNAS)AND SMALL TEMPORAL RNAS(STRNAS)INPROKARYOTIC,ARCHEA AND EUKARYOTIC GENOMES)”的美国专利申请序列号10/339,666。
本发明还涉及2003年2月12日提交的题为“控制大肠杆菌k-12 MG1655完整基因组中基因表达的侧翼DNA序列的测定(DETERMINATION OF FLANKING DNASEQUENCES THAT CONTROL THE EXPRESSION OF SETS OF GENES IN THEESCHERICHIA COLIK-12 MG1655 COMPLETE GENOME)”的美国专利申请序列号10/364,516。
本申请还涉及2003年2月12日提交的题为“控制酿酒酵母完整基因组中基因表达的侧翼DNA序列的测定(DNADETERMINATION OF FLANKING DNASEQUENCES THAT CONTROL THE EXPRESSION OF SETS OF GENES IN THESACCHAROMYCES CEREVISIAE COMPLETE GENOME)”的美国专利申请序列号10/364,412。
本申请还涉及2002年11月19日提交的题为“控制盐杆菌属NRC-1完整基因组中基因表达的侧翼DNA序列的测定(DETERMINATION OF FLANKING DNASEQUENCES THAT CONTROL THE EXPRESSION OF SETS OF GENES IN THEHALOBACTERIUM SP.NRC-1 COMPLETE GENOME)”的美国专利申请序列号10/299,056。
本申请还涉及2003年2月19日提交的题为“控制绿脓杆菌PA01完整基因组中基因表达的侧翼DNA序列的测定(DETERMINATION OF FLANKING DNASEQUENCES THAT CONTROL THE EXPRESSION OF SETS OF GENES IN THEPSEUDOMONAS AERUGINOSA PA01,COMPLETE GENOME)”的美国专利申请序列号10/367,832。
本申请还涉及2002年11月5日提交的题为“控制霍乱弧菌完整基因组中基因表达的侧翼DNA序列的测定(DETERMINATION OF FLANKING DNA SEQUENCESTHAT CONTROL THE EXPRESSION OF SETS OF GENES IN THE AEROPYRUMPERNIX K1 COMPLETE GENOME)”的美国专利申请序列号10/287,818。
本申请还涉及2002年11月27日提交的题为“控制敏捷气垫菌K1完整基因组中基因表达的侧翼DNA序列的测定(DETERMINATION OF FLANKING DNASEQUENCES THAT CONTROL THE EXPRESSION OF SETS OF GENES IN THEAEROPYRUM PERNIX K1 COMPLETE GENOME)”的美国专利申请序列号10/305,275。
引言
基因组的连接子结构决定了四组最小长度为15碱基的DNA序列(基因3’UTR中的C1和C2,基因5’-侧上的T1和一组基因3’-侧上的T2)。基因组中的连接子控制基因组的表达。每个天然基因组都有特定的连接子组,它以多种不同途径控制基因组的表达。通过删除现有连接子并加入新的已经过设计以获得特定的新的基因表达模式的连接子可改变基因表达行为。本专利申请描述了删除连接子的方法的发明,以及四类可用于修饰基因组连接子行为的合成和设计的连接子。此外,本申请描述了关于四种方法的发明,这些方法实施具有不同新颖性比例的连接子。
定义
双链DNA-Watson和Crick在1953年展示,DNA天然形成双螺旋。典型的双链序列是
5’-TAGAGGAGTACCAC-3’
3’-ATCTCCTCATGGTG-5’
氢键—氢原子和其它较重原子如氧原子(O)、氮原子(N)、磷原子(P)或硫原子(S)之间的力。
正链—正链通常从左到右表示为5′到3′,如
5’-TAGAGGAGTACCAC-3’
负链—负链通常从右到左表示为5′到3′,如
3’-ATCTCCTCATGGTG-5’
单链RNA-可用聚合酶转录的双链DNA的正链或负链。在RNA中用U代替T。
RNA的正链序列 5’-UAGAGGAGUACCAC-3’
RNA的负链序列 5’-GUGGUACUCCUCUA-3’
反义RNA-任何RNA序列的反义链是互补序列
RNA序列 5’-UAGAGGAGUACCAC-3’
反义RNA序列 3’-AUCUCCUCAUGGUG-5’
三链螺旋-RNA/DNA三链复合体的RNA序列,与DNA的正链相同。
DNA正链5’-TAGAGGAGTACCAC-3’
DNA负链3’-ATCTCCTCATGGTG-5’
RNA链 5’-UAGAGGAGUACCAC-3’
启动子-DNA的任何区域,结合参与聚合酶转录机制的蛋白质。
TATA盒—具有序列TATA的邻近启动子3’末端的区域。
mRNA-作为转录结果的由聚合酶从DNA产生的RNA。
转录起点—聚合酶机制开始将DNA转录成mRNA的启动子的3′末端。
外显子—用于编码蛋白质的mRNA的任何区域。
内含子—不能用来编码蛋白质的位于两个外显子之间的mRNA的任何区域。内含子在最初的RNA转录物上编辑产生以形成成熟的mRNA。
3’UTR-mRNA未翻译的3′末端,在最后一个外显子末端以外。mRNA中的终止密码子使核糖体停止将mRNA翻译成蛋白质。
翻译终点-3’最大概率外显子的3’末端。
翻译区—外显子和内含子的任何集合。
基因—任何编码蛋白质的DNA区域。原核基因中没有内含子,有时在真核基因中也不出现。基因的典型模型是
|<-----启动子------>|
|<-TATA盒->|
|<-翻译起点
|<------------翻译区----------—----->|
翻译终点|
|<-外显子->|<-内含子->|<-外显子->|<-内含子->|<-外显子->|<-3′UTR->|
+链----------------------------------------------------
-链---------------------------------------------------
|<-------------------—基因--------------------->|
正链基因—以正链从5’到3’为特征的任何基因。
负链基因—以负链从5’到3’为特征的任何基因。
C1序列-15或更多碱基的任何正链或负链DNA序列。C2序列必须与C1序列出现在同一染色体上。
C2序列-15或更多碱基的任何正链或负链DNA序列。C1序列必须与C2序列出现在同一染色体上。
C1/C2-40或更多碱基的任何正链或负链DNA序列,其中C1序列邻近C2序列。
T1序列-与T2序列出现在同一染色体上的任何15个或更多碱基的任何正链或负链DNA序列。T1和T2序列必须隔开约1kb-105kb。
T2序列-与T1序列出现在同一染色体上的任何15个或更多碱基的任何正链或负链DNA序列。T2和T1序列必须隔开约1kb-105kb。
最后的外显子缺口或缺口距离—转录终点和C1/C2序列起点之间的碱基数。在原核生物和单细胞真核生物中,该缺口的范围可从0碱基到500碱基。在多细胞真核生物中,该缺口可大至10,000碱基。
聚腺苷化信号—在mRNA的3’UTR末端加入的多个腺苷(A)碱基。
可能的连接子-T1、T2和C1/C2序列的任何组,其中C1序列与T1序列相同,C2序列与T2序列相同。一些基因的启动子使得基因的mRNA得以表达。mRNA被编辑以除去内含子。完整的包括3’UTR的mRNA可在细胞或细胞核附近移动。作为3’UTR一部分的C1/C2 RNA移动到T1和T2 DNA序列。形成了DNA和RNA的三链复合体,这样C1序列和T1序列形成氢键,C2序列和T2序列形成氢键。由于C1序列邻近C2序列,T1序列与T2序列物理接近。这就在DNA中产生了约1kb-105kb的环。组蛋白/DNA复合物形成了六倍对称染色质装配。所述染色质装配的直径约30nm。
真实连接子—在一些基因缺口距离内的任何可能的连接子。
同源连接子-T1序列和T2序列与C1/C2序列在同一染色体上。
异源连接子-T1序列和T2序列与C1/C2序列在不同染色体上。
永久连接子—任何C1/C2序列,它是未被任何T1和T2序列对包围的一些基因的3’UTR。
瞬时连接子(Transient连接子)—任何C1/C2序列,它是被一个或多个T1和T2序列对包围的一些基因的3’UTR。
单触发或自身限制连接子—任何C1/C2序列,它是被T1和T2序列包围的一些基因的3’UTR,其中,C1=T1,C2=T2。
无基因连接子—任何C1/C2序列,它不是一些基因的3’UTR,但被一些T1和T2包围。启动子可在C1/C2序列5’方向上与其结合。
连接子激发的双向性—一条链上的C1/C2短环选择相同或相反链上的T1-T2长环对。C1/C2短环在相反链上有一互补C1’/C2’序列。同样,T1-T2长环对有互补的长环对T1’-T2’。当C1/C2,T1-T2四分体存在时就有互补的C1’C2’,T1’-T2’四分体。C1/C2短环可被转录成相同链上基因的3’UTR。C1/C2短环相反链上的C1’/C2’短环也可被转录成相同链上基因的3’UTR。有四种可能的作用模型
T1T2 基因-C1/C2
+链--------------------------------------------------------
-链--------------------------------------------------------
TIT2
+链--------------------------------------------------------
-链--------------------------------------------------------
C2/C1-基因
+链--------------------------------------------------------
-链--------------------------------------------------------
T2′ T1′C2′/C1′-基因
基因-C1′/C2′
+链--------------------------------------------------------
-链--------------------------------------------------------
T2′ T1′
当然,短环和长环不一定要在同一染色体上。
连接子作用的序位—当C1/C2表达时它通过形成一个连接子形成T1-T2环。C1/C2序列不一定要和T1和T2序列出现在同一染色体上。这就提供了一种在染色体之间产生相互作用的方法。当T1-T2环形成时,所述环区域内曾经在其3’UTR表达C1/C2序列的任何基因现在停止表达C1/C2序列。由这些C1/C2序列形成的连接子将在一段时间后不再存在,这就使各个T1-T2环内的基因开始表达。连接子作用的序位可在抑制和表达之间转换。连接子序位可以是任何深度的。
一对多连接子作用—一个C1/C2序列可在许多不同染色体上的多个不同位置形成连接子。唯一的要求是C1=T1且C2=T2。这就使一个表达事件可能控制不同染色体上许多基因的表达。
多对—连接子作用—来自许多不同染色体上多个不同位置的C1/C2可对特定T1-T2序列对形成一个连接子。唯一的要求是C1=T1且C2=T2。这就使多个不同的表达事件可能控制特定染色体上一组基因的表达。
多对多连接子作用-C1/C2和T1-T2在染色体上的排布可形成基因表达控制关系的复杂网络。
受连接子调节基因组的比例—既然可计算定序的基因组的连接子,便可知道对连接子调节开放的基因组的比例。
突发特性(Emergent Property)—任何基因组内的连接子网络来自于对基因组全部DNA序列的了解。由于C1/C2序列和T1-T2序列可出现在基因组的任何位置,在确定所有连接子之前必须知道整个基因组的序列。
改变—过去50年,由于Watson和Crick发现了DNA的双螺旋特性,科学发现的主要任务就是研究一个基因及其对细胞行为的作用。基因组测序的出现以及关于由整个基因组形成连接子的本发明将使科学家转而关注生物系统并设计和进行实验。连接子间的多对多关系意味着存在多种调节基因组表达的方法。控制途径的多样性产生了系统稳定性,这可使生物系统在长的进化时间内稳定。设计科学试验的想法不得不改变以适应因本专利申请的应用和扩展所导致的理解的变化。
序列元件—一些连接子的C1、C2、T1或T2的双链序列。
天然序列元件—连接子的任何序列元件,它是天然基因组的组成部分。
天然连接子—任何连接子,其中所有四种(即C1、C2、T1和T2序列)序列元件都是天然基因组的组成部分。
合成序列元件—任何被加入基因组某些特定位置的序列元件。碱基的实际序列可在基因组一个或多个位置出现。合成方面是通过设计将一个instance置于基因组的特定位置中。
复制的序列元件—从基因组的一个位置复制到该基因组另一个位置的任何序列元件。
单一序列元件—只有一对instance的任何双链DNA序列元件。这样一对instance可用来构成连接子的C1和T1合成序列元件,或连接子的C2和T2合成序列元件。
提取的序列—从基因组一个位置移至同一基因组另一位置的任何序列元件。被移动的序列元件可以是单一或非单一的。
合成连接子—天然连接子中的一个或多个序列元件被合成序列元件取代的任何连接子。
设计连接子—在天然基因组中不存在的任何连接子。
基于RNA的连接子-C1和C2元件被作为一些基因3’UTR中的RNA产生的任何连接子。
DBP-结合特定DNA双链序列的多结构域锌指DNA结合蛋白。
基于蛋白质的合成连接子-C1和C2元件由DBP产生的合成的任何连接子。
PNA-肽核酸是由Boehringer-Mannheim享有专利并提供的一种分子构建物。A、T、C、G碱基部分与RNA相同,但核糖环被原子的肽样构型代替。
基于PNA的合成连接子-C1和C2元件由肽核酸(PNA)碱基序列产生的合成的任何连接子。
普遍合成的连接子-C1和C2元件由两个连接的双链DNA结合元件产生的合成的任何连接子。
个体连接子状态-C1-C2元件是否与同源T1和T2元件结合的二进制表示。0表示未形成连接子。1表示形成连接子,因此T1和T2间基因的表达被停止。
基因组连接子状态—基因组中所有个体天然和合成的连接子状态的集合。个体连接子状态根据T1元件的位置在各个染色体和质粒上依次排列。
连接子模拟—由于个体连接子状态相互作用而造成的基因组连接子状态的时序过渡。
CD的内容
序列表部分被纳入本文以供参考。此处所附压缩盘中所含的内容创建于6/30/03。
合成的序列有13,770字节。
发明目的简述
所述基于方法的专利申请提供了确定多种基因组中天然连接子的结构的方法。自从我们在锌指DNA结合蛋白(DBP)的设计工作(美国专利6,205,404)后形成了连接子的最初概念,申请人的意图就是使用这些设计的蛋白来修饰基因组的连接子行为。
本发明的一个目的是提供利用连接子行为的基因组模拟以利于优化设计方法,该方法涉及从基因组中删除连接子或在基因组中添加连接子。
本发明的一个目的是提供通过计算机利用连接子行为的基因组模拟以利于优化设计方法,该方法涉及从基因组中删除连接子或在基因组中添加连接子。
本发明的一个目的是提供通过删除或添加连接子来修饰基因组连接子行为的方法。
本发明的一个目的是提供在基因组中产生新的连接子的方法,它通过将一个或多个双链DNA序列元件从基因组一个位置复制到基因组另一个位置,或通过从基因组一个位置提取双链DNA序列元件并将其移至基因组另一个位置,或通过在基因组特定位置中引入一对新的单一双链DNA序列元件。
本发明的一个目的是提供在基因组中产生新的连接子的方法,除使用DBP、PNA或普遍性DNA结合元件的连锁对外,它通过复制、提取或添加单一DNA元件以补充新的连接子的C1和C2元件。
表的描述
表1-删除连接子的10种可能途径。
表2-通过天然元件和合成元件的组合定义的15种可能的合成连接子。
表3-通过天然和合成DNA元件以及合成DBP元件的组合定义的4种可能的合成连接子。
表4-通过天然和合成DNA元件以及合成PNA元件的组合定义的4种可能的合成连接子。
表5-通过天然和合成DNA元件以及一对连锁的双链DNA结合元件的组合定义的4种可能的合成连接子。
表6-在合成的连接子中补充单个合成元件的2种可能的方法。
表7-在合成的连接子中补充一对合成元件的14种可能的方法。
表8-在合成的连接子中补充三个合成元件的41种可能的方法。
表9-在合成的连接子中补充四个合成元件的25种可能的方法。
发明的描述
基因组连接子行为的模拟为理解个体连接子的相互作用提供了有效途径。从100多种我们已经确定其连接子结构的基因组可以清楚看出,特定的C1-C2可产生许多不同的连接子—一对多连接子作用模式。同样,清楚的是,特定的连接子可由许多不同C1-C2信号的表达产生—多对一连接子作用模式。通过进行基因组连接子模拟并查看结果可以更好地了解这些一对多和多对一模式的连接子控制对基因表达的时序相互作用。在确定何时何处从天然基因组中删除连接子或在天然基因组中加入新的连接子时这尤其重要。基因组连接子模拟是相关专利申请的主题。
尽管在C1-C2的不同基因组中有仅产生一个连接子的例子,但更通常特定的C1-C2将产生几个连接子。当特定的C1-C2只产生一个连接子时,只要T1和T2元件仅由此连接子使用,将此连接子删除或用相同或不同的C1或C2元件来添加另一个连接子将不会产生副作用。这是相对罕见的一对一的例子。更多情况下,删除或改变特定的C1或C2含有多种结果和严重的行为副作用。对基因表达基因组连接子控制的修饰将不可避免地包括折衷方法(compromise)、设计决策(design decision),最坏的就是修补(patch-up)。考虑特定的C1-C2产生两个连接子的例子。出于某些原因,我们打算删除其中一个连接子。发现一些其它产生第二个连接子的方法可实现修补。这可通过加入一个或多个合成的连接子元件以产生作为合成连接子的第二个连接子来实现。
如果一项设计决策没有副作用则是最佳的。如果有副作用,通过连接子行为的基因组模拟就能评价设计和实现决策的基因组行为结果。
如表1所示,可用10种不同方法删除一个连接子,其范围包括删除或修饰仅一个序列元件到删除或修饰所有四个序列元件。任何破坏C1对T1的序列识别或C2对T2的序列识别的任何方法将有删除连接子的作用。
天然连接子的四个元件(C1、C2、T1和T2)中任何或所有都可被合成的元件替代以形成合成的连接子。表2给出了15种可能类型的合成连接子。经过设计的连接子可被引入基因组以便(1)控制已经由其它天然连接子控制的一组基因的表达,或(2)控制新选择的一组基因的表达。利用DNA序列,从表2所示的天然和合成元件的15种组合中的任何一种制造了经过设计的连接子。如果连接子的C1和C2元件是由锌指DBP产生的,则表3中的合成和设计的连接子的4种组合是可能的。如果连接子的C1和C2元件由PNA产生,则表4种的合成和设计的连接子的4种组合是可能的。如果连接子的C1和C2元件由DNA结合元件的连锁对产生,则表5中的合成和设计的连接子的4种组合是可能的。所述DNA结合元件G1和G2可以是蛋白质或任何其它识别T1和T2元件DNA序列的分子材料。
经过设计的连接子的合成元件可用许多不同方法获得。在表2中,连接子的1-4个序列元件可被合成序列元件取代。有三种不同的产生合成序列元件的方法。可将基因组中某处的现有序列元件复制到新的位置中。可从基因组一个位置提取现有序列元件并将其置于基因组另一个位置。可产生一对新的在基因组中不存在的序列元件。这种新的单一序列元件的一个例子必须是C1或C2。如果第一个例子是C1,则这种新的单一序列元件的第二个例子必须是C2。同样,如果第一个例子是C2,则这种新的单一序列元件的第二个例子必须是C1。表6显示,当只使用一个合成序列元件时只有两种产生合成连接子的方法。产生新的单一序列元件是不可能的,因为这些序列元件必须成对出现。表7显示有14种实现一对合成序列元件以形成合成连接子的方法。表8显示有41种实现三个合成序列元件以形成合成连接子的方法。表8显示有25种实现四个合成序列元件以形成合成连接子的方法。
实施例
表1-9提供了大量从基因组删除连接子以及在基因组中添加连接子的方法。我们给出了一个从基因组中删除一个连接子的例子和四个不同基因组的连接子的五个例子。很明显,许多其它变化对于精通此领域的技术人员是显见的。
从一个染色体中删除一个瞬时连接子
连接子13是酿酒酵母(S.cerevisiae)基因组中瞬时连接子的一个例子。根据表1,可通过删除或修饰任何一个或所有四个连接子元件将此连接子删除。C1和C2的标识符是36,T1的标识符是39,T2的标识符是111。当将此连接子删除时,下述所有特性都消失了。
连接子13的原型是
C1/C2 T1-T2
总_Id染色体C1_IdC2_Id染色体T1_IdT2_Id 连接子类型
13 1 36 36 1 39 111瞬时
瞬时连接子13的C1/C2来源表示在表1中,如下
类型NumJobno染色体起点终点长度 基因名称
CPT 36 11 12.572 12.788 .217 OS-> ||||||||||||||||||
这种瞬时C1/C2连接子来源的“类型”描述符是“CPT”。字母“P”表示C1/C2连接子来源发生在基因组双链DNA的正链上。字母“N”表示C1/C2连接子来源发生在基因组双链DNA的负链上。字母“T”表示“瞬时”连接子。同样,字母“P”表示永久连接子,这将在后面的实施例中出现。这些实施例中的“起点”、“终点”和“长度”描述符的单位是千碱基(KB)。
瞬时连接子13的T1-T2靶显示在表1中,如下
类型 Num Jobno 染 起点终点长度 基因名称
色
体
TP 39 11 12.572 12.807 .236 *-+++++++++++++++++++*
TN 40 81 12.908 12.964 .057 *-++++++++++++++++++++*
CNT41 11 12.908 12.964 .057 --> |||||||||||||||||||||
CPT42 11 12.908 12.964 .057 --> |||||||||||||||||||||
TP 43 11 12.922 12.964 .043 *-+++++++++++++++++++++*
CNT44 11 12.966 12.986 .021 --> ||||||||||||||||||||||
CPT45 81 12.966 12.986 .021 --> ||||||||||||||||||||||
TP 46 11 12.966 12.986 .021 *-++++++++++++++++++++++*
TN 47 11 13.027 13.159 .133 *-+++++++++++++++++++++++*
CNT48 11 13.028 13.099 .072 OS-> ||||||||||||||||||||||||
TP 49 11 13.028 13.099 .072 *-++++++++++++++++++++++++*
CPT50 11 13.053 13.124 .072 OS-> |||||||||||||||||||||||||
TP 51 11 13.102 13.159 .058 *-+++++++++++++++++++++++++*
CNT52 11 13.105 13.246 .142 --> ||||||||||||||||||||||||||
CPT53 11 13.130 13.246 .117 --> ||||||||||||||||||||||||||
TN 54 11 13.176 13.194 .019 *-++++++++++++++++++++++++++*
TN 55 11 13.196 13.231 .036 *-+++++++++++++++++++++++++++**
TP 56 11 13.211 13.246 .036 *-+++++++++++++++++++++++++++++
CPT57 11 13.253 13.290 .038 --> |||||||||||||||||||||||||||||
TN 58 11 13.253 13.290 .038 *-+++++++++++++++++++++++++++++
TP 59 11 13.255 13.285 .031 *-+++++++++++++++++++++++++++++
CNT60 11 13.255 13.290 .036 --> |||||||||||||||||||||||||||||
CPT61 81 13.295 13.315 .021 --> |||||||||||||||||||||||||||||
TN 62 81 13.295 13.317 .023 *--++++++++++++++++++++++++++++
CNT63 81 13.340 13.379 .040 --> |||||||||||||||||||||||||||||
CPT64 81 13.341 13.380 .040 --> |||||||||||||||||||||||||||||
GG651 1 13.364 13.744 .381 组0004 |||||||||||||||||||||||||||||
CPT 661 1 13.387 13.405 .019 --> |||||||||||||||||||||||||||||
TN678 1 13.387 13.412 .027 *-+++++++++++++++++++++++++++++
TP681 1 13.444 .017 *-+++++++++++++++++++++++++++++
CPT 698 1 13.566 .017 --> |||||||||||||||||||||||||||||
TN708 1 13.574 .018 *-+++++++++++++++++++++++++++++
CPT 718 1 13.585 .016 --> |||||||||||||||||||||||||||||
TN721 1 13.656…… .026 *-+++++++++++++++++++++++++++++
TP731 1 13.656 13.706 .051 *-+++++++++++++++++++++++++++++
TN749 1 13.704 13.726 .023 *-+++++++++++++++++++++++++++++
CPT 751 1 13.709 13.726 .018 --> |||||||||||||||||||||||||||||
TN761 1 13.734 13.750 .017 *-+++++++++++++++++++++++++++++
CPT 771 1 13.734 13.782 .049 --> |||||||||||||||||||||||||||||
TP781 1 13.734 13.782 .049 *-+++++++++++++++++++++++++++++
TN791 1 13.768 13.782 .015 *-+++++++++++++++++++++++++++++
CPT 801 1 13.815 13.858 .044 --> |||||||||||||||||||||||||||||
TN811 1 13.840 13.858 .019 *-+++++++++++++++++++++++++++++
CPT 821 1 14.422 14.460 .039 --> |||||||||||||||||||||||||||||
CPT 831 1 14.941 14.962 .022 --> |||||||||||||||||||||||||||||
CPT 841 1 14.966 14.993 .028 --> |||||||||||||||||||||||||||||
CPT 851 1 14.997 15.018 .022 --> |||||||||||||||||||||||||||||
TP861 1 15.795 15.816 .022 *-+++++++++++++++++++++++++++++
TP871 1 15.996 16.020 .025 *-++*||||||||||||||||||||||||||
TP881 1 16.874 16.898 .025 *-++-++++++++++++++++++++++++++
CNT 891 1 20.136 20.151 .016 --> |||||||||||||||||||||||||||||
CNT 901 1 20.157 20.176 .020 --> |||||||||||||||||||||||||||||
GG911 1 21.526 21.852 .327 组0005 |||||||||||||||||||||||||||||
CPT 921 1 22.257 22.304 .048 --> |||||||||||||||||||||||||||||
CNT 931 1 22.275 22.304 .030 --> |||||||||||||||||||||||||||||
CNT 941 1 22.307 22.322 .016 --> |||||||||||||||||||||||||||||
CPT 951 1 22.307 22.322 .016 --> |||||||||||||||||||||||||||||
CNT 961 1 22.324 22.338 .015 --> |||||||||||||||||||||||||||||
CNT 971 1 22.351 22.367 .017 --> |||||||||||||||||||||||||||||
CPT 988 1 22.351 22.367 .017 --> |||||||||||||||||||||||||||||
CNT 991 1 22.376 22.392 .017 --> |||||||||||||||||||||||||||||
CPT 100 8 1 22.376 22.392 .017 --> |||||||||||||||||||||||||||||
TN101 1 1 23.300 23.324 .025 *-++*||||||||||||||||||||||||||
CPT 102 8 1 23.683 23.716 .034 --> |||||||||||||||||||||||||||||
GG103 1 1 24.001 27.969 3.969 组0006 |||||||||||||||||||||||||||||
TN104 1 1 24.119 24.431 .313 *-++++**|||||||||||||||||||||||
CPT 105 1 1 24.283 24.352 .070 OS-> |||||||||||||||||||||||||||||
TP106 1 1 24.287 24.431 .145 *-++++--+*|||||||||||||||||||||
TN107 1 1 24.433 24.514 .082 *-++++--*-*||||||||||||||||||||
TN108 1 1 24.516 24.603 .088 *-++++-----*|||||||||||||||||||
TN109 8 1 24.605 24.703 .099 *-++++……**|||||||||||||||| |
TN110 1 1 24.743 24.854 .112 *-++++------*||||||||||||||||||
TP111 1 1 24.863 25.001 .039 *-++++---------+*++*+*|||||||||
T1(Id为39)的“类型”描述符是“TP”,表示T1靶在双链基因组DNA的正链上。因为T1和T2靶必须出现在同一链上,所以T2靶(Id为111)的类型描述符也是“TP”。
上面的T1-T2环图的读法是从T1的*到适合的*右边,然后沿着图下来到第一个*,然后向左到T2的*。当水平线(用-表示)与其它垂直线(用|表示)交叉时,这一点的标记就变为+。当T1-T2环不含这组基因时,则垂直标识符(用|或+表示)就变为@,如下所示
染
类型 Num Jobno 色 起点 终点 长度基因名称
体
TNxx1 1 278.386 279.148 .763*---*
XXxx1 1 278.387 278.416 .030* @
XXxx1 1 278.421 278.450 .030* @
TPxx1 1 278.452 278.892 .441*---*
组0004(Id为65)的类型描述符是″GG″。组0006(Id为103)也是这样。
组0004-组0006描述在表2中,如下
基因名称COG_Id染色体方向 起点终点长度
YAL064C-A- 1 负 13.364 13.744 .381
组0005
基因名称COG_Id染色体方向 起点终点长度
YAL064W - 1 正 21.526 21.852 .327
组0006
基因名称COG_Id染色体方向 起点终点长度
FLO9 - 1 负 24.001 27.969 3.969
瞬时连接子13的所有数据都被集中在下表中,它是对连接子的“扼要”描述。
连接子关系-总_Id 类型
13 瞬时
对照序列-方向染色体C1/C2_Id起点终点长度
正 1 36 12.572 12.788 .217
引发基因-名称COG_Id 起点 终点长度
YAL064W-B - 12.047 12.427 .381
靶序列-方向染色体 T1_Id 起点 终点长度
正 1 39 12.572 12.807 .236
T2-Id 起点 终点长度
111 24.863 25.001 .020
受控基因
位置_Id 染色体 组 名称 COG_Id 方向 起点终点长度
1 1 组0004 YAL064C-A -正13.364 13.744 .381
2 1 组0005 YAL064W-正21.526 21.852 .327
3 1 组0006 FL09 -正24.001 27.969 3.969
受控连接子s
位置_Id 染色体 C1/C2-ID 方向 起点 终点 长度
1 141负12.964 12.908.057
2 142正12.908 12.964.057
3 144负12.986 12.966.021
4 145正12.966 12.986.021
5 148负13.099 13.028.072
6 150正13.053 13.124.072
7 152负13.246 13.105.142
8 153正13.130 13.246.117
9 157正13.253 13.290.038
10160负13.290 13.255.036
11161正13.295 13.315.021
12163负13.379 13.340.040
13164正13.341 13.380.040
14166正13.387 13.405.019
15169正13.566 13.582.017
16171正13.585 13.599.016
17175正13.709 13.726.018
18177正13.734 13.782.049
19180正13.815 13.858.044
20182正14.422 14.460.039
21183正14.941 14.962.022
22184正14.966 14.993.028
23185正14.997 15.018.022
24189负20.151 20.136.016
25190负20.176 20.157.020
26192正22.257 22.304.048
27193负22.304 22.275.030
28194负22.322 22.307.016
29195正22.307 22.322.016
30196负22.338 22.324.015
31197负22.367 22.351.017
32198正22.351 22.367.017
33199负22.392 22.376.017
341100 正22.376 22.392.017
351102 正23.683 23.716.034
361105 正24.283 24.352.070
加入表2类型2的合成连接子
通过修饰4626.130kb-4626.166kb之间长度为0.036kb的DNA双链序列,并修饰705.150kb-705.203kb之间长度为0.054kb的DNA双链序列,可将类型2的合成连705.150kb-705.203kb之间长度为0.054kb的DNA双链序列,可将类型2的合成connectron引入大肠杆菌基因组,其中,C1和C2是合成元件,T1是合成元件,T2是天然元件。
connectron 62521是这种合成的瞬时connectron的一个例子。它可被描述为
C1/C2T1-T2
总_Id 染色体 C1_Id C2_Id 染色体 T1_Id T2_Id connectron类型
62521 14651a 4651a 1811a975 瞬时
瞬时connectron62521的C1/C2来源表示在表1中,如下
类型 Num Jobno 染色体 起点 终点 长度 基因名称
CPT4651a 1 1 4626.130 4626.166 .037 ||||||||||||||||||
这种瞬时C1/C2 connectron来源的“类型”描述符是“CPT”。字母“P”表示C1/C2connectron来源发生在基因组双链DNA的正链上。字母“N”表示C1/C2 connectron来源发生在基因组双链DNA的负链上。字母“T”表示“瞬时”connectron。同样,字母“P”表示永久connectron,这将在后面的实施例中出现。这些实施例中的“起点”、“终点”和“长度”描述符的单位是千碱基(KB)。
瞬时connectron62521的T1-T2靶显示在表1中,如下
染
类型 Num Jobno 色 起点 终点 长度基因名称
体
TN 811a 1 1 705.150 705.203 .054*-*
TP 8121 1 705.122 705.141 .020*-+
GG 8131 1 705.316 706.980 1.665 组0150 |
TN 8141 1 707.013 707.028 .016*-+
TP 8151 1 707.014 707.028 .015*-+
CPT8161 1 707.055 707.109 .055 --> |
TN 8171 1 707.055 707.109 .055*-+
TP 8181 1 707.055 707.109 .055*-+
CPT8191 1 707.112 707.162 .051OS-> |
TN 8201 1 707.112 707.162 .051*-+
TP 8211 1 707.112 707.162 .051*-+
GG 8221 1 707.557 710.688 3.131 组0151 |
CNT8231 1 710.633 710.647 .015OS-> |
TN 8241 1 710.633 710.647 .015*-+
CNT8251 1 710.652 710.666 .015 --> |
GG 8261 1 710.828 712.755 1.927 组0152 |
TN 8271 1 712.281 712.296 .016 *-+
GG 8281 1 712.781 714.421 1.641 组0153 |
TN 8291 1 714.481 714.518 .038 *-+
CPT8301 1 714.481 714.519 .039 OS-> |
TP 8311 1 714.482 714.519 .038 *-+
CPT8321 1 714.524 714.540 .017 --> |
TN 8331 1 714.524 714.540 .017 *-+
TP 8341 1 714.524 714.540 .017 *-+
CNT8351 1 714.543 714.593 .051 OS-> |
TN 8361 1 714.543 714.593 .051 *-+
TP 8371 1 714.543 714.593 .051 *-+
CPT8381 1 714.544 714.606 .063 OS-> |
GG 8391 1 714.635 715.928 1.2930154 |
GN 8401 1 715.170 715.532 .363ybfg |
TN 8411 1 716.085 716.103 .019 *-+
TP 8421 1 716.085 716.103 .019 *-+
GG 8431 1 716.169 724.202 8.033 组0155 |
CNT8441 1 720.278 720.296 .019 --> |
GN 8451 1 720.279 724.202 3.924kdpe |
TP 8461 1 721.769 721.783 .015 *-+
TN 8471 1 721.812 721.827 .016 *-+
GG 8481 1 724.211 727.955 3.744 组0156 |
TP 8491 1 726.665 726.679 .015 *-+
GG 8501 1 728.357 733.325 4.968 组0157 |
GP 8511 1 728.806 733.325 4.520rhsc |
CPT8521 1 729.408 729.446 .039 --> |
TP 8531 1 730.270 730.284 .015 *-+
CPT8541 1 730.443 730.457 .015 --> |
CPT8551 1 730.468 730.482 .015 --> |
CPT8561 1 730.484 730.507 .024 --> |
CPT8571 1 731.251 731.290 .040 --> |
TP 8581 1 731.475 731.508 .034 *-+
TP 8591 1 731.512 731.562 .051 *-+
TP 8601 1 731.564 731.693 .130 *-+
TP 8611 1 731.698 731.755 .058 *-+
TP 8621 1 731.757 731.819 .063 *-+
TP 8631 1 731.821 731.903 .083 *-+
TP 8641 1 731.906 732.033 .128 *-+
CPT8651 1 731.994 732.016 .023 --> |
CPT8661 1 732.019 732.034 .016 --> |
TP 8671 1 732.035 732.050 .016 *-+
TP 8681 1 732.052 732.179 .128 *-+
CPT8691 1 732.065 732.179 .115 OS-> |
CPT8701 1 732.198 732.212 .015 --> |
TP 8711 1 732.198 732.212 .015 *-|
CPT8721 1 732.214 732.233 .020 --> |
TP 8731 1732.214 732.233.020 *-+
CPT8741 1732.235 732.283.049 --> |
TP 8751 1732.235 732.283.049 *-+
CPT8761 1732.306 732.326.021 --> |
TP 8771 1732.306 732.326.021 *-+
CPT8781 1732.328 732.452.125 --> |
TP 8791 1732.328 732.482.155 *-+
CPT8801 1732.454 732.482.029 --> |
CPT8811 1732.488 732.519.032 --> |
TN 8821 1733.330 733.344.015 *-+
TP 8831 1733.330 733.344.015 *-+
TP 8841 1733.371 733.513.143 *-+
GG 8851 1733.443 735.4422.000 组0158 |
TP 8861 1733.515 733.564.050 *-+
TP 8871 1733.569 733.626.058 *-+
TP 8881 1733.628 733.645.018 *-+
TP 8891 1733.647 733.696.050 *-+
TP 8901 1733.698 733.774.077 *-+
TP 8911 1733.776 733.904.129 *-+
CPT8921 1733.865 733.887.023 OS-> |
CPT8931 1733.890 733.905.016 --> |
TP 8941 1733.906 734.050.145 *-+
CPT8951 1733.936 734.050.115 --> |
TP 8961 1734.052 734.075.024 *-+
CPT8971 1734.052 734.139.088 --> |
TP 8981 1734.084 734.139.056 *-+
TP 8991 1734.149 734.179.031 *-+
CPT9001 1734.164 734.321.158 --> |
TP 9011 1734.192 734.321.130 *-+
TP 9021 1734.323 734.378.056 *-+
CPT9031 1734.323 734.381.059 --> |
CPT9041 1735.525 735.569.045 --> |
TP 9051 1735.525 735.569.045 *-+
CPT9061 1735.606 735.703.098 --> |
TP 9071 1735.606 735.703.098 *-+
TP 9081 1735.707 735.721.015 *-+
CPT9091 1735.707 735.728.022 --> |
TP 9101 1735.749 735.803.055 *-+
CPT9111 1735.807 735.964.158 OS-> |
TP 9121 1735.814 735.895.082 *-+
TP 9131 1735.905 735.934.030 *-+
TP 9141 1735.938 736.083.146 *-+
CPT9151 1735.986 736.083.098 OS-> |
TP 9161 1736.152 736.173.022 *-+
TP 9171 1736.187 736.217.031 *-+
TP 9181 1736.219 736.265.047 *-+
TP 9191 1736.288 736.334.047 *-+
GG 9201 1736.327 737.184.858 组0159 |
TP 9211 1 736.349 736.469.121*-+
TP 9221 1 736.516 736.628.113*-+
TP 9231 1 736.630 736.645.016*-+
TP 9241 1 736.654 736.792.139*-+
TN 9251 1 736.654 736.809.156*-+
TN 9261 1 736.816 736.832.017*-+
CPT9271 1 737.017 737.032.016 --> |
CPT9281 1 737.035 737.057.023 --> |
TN 9291 1 737.168 737.188.021 *-++
TP 9301 1 737.196 737.290.095*-+
CPT9311 1 737.261 737.275.015 --> |
CPT9321 1 737.278 737.292.015 --> |
TP 9331 1 737.292 737.393.102*-+
GG 9341 1 737.315 738.076.762 组0160 |
TP 9351 1 737.411 737.475.065*-+
TP 9361 1 737.479 737.557.079*-+
TP 9371 1 737.580 737.597.018*-+
TP 9381 1 737.605 737.626.022*-+
TP 9391 1 737.633 737.648.016*-+
TP 9401 1 737.653 737.679.027*-+
TP 9411 1 737.683 737.752.070*-+
TP 9421 1 737.798 737.822.025*-+
TP 9431 1 737.828 737.895.068*-+
TP 9441 1 737.897 737.931.035*-+
CPT9451 1 737.930 737.967.038 --> |
TP 9461 1 737.936 737.967.032*-+
TP 9471 1 737.970 737.988.019*-+
TN 9481 1 737.990 738.015.026*-+
TP 9491 1 737.990 738.015.026*-+
TN 9501 1 738.019 738.051.033*-+
TP 9511 1 738.019 738.051.033 *-++
TP 9521 1 738.053 738.074.022*-+
TN 9531 1 738.058 738.074.017*-+
TN 9541 1 738.107 738.126.020*-+
GG 9551 1 738.224 740.148 1.925 组0161 |
TN 9561 1 740.172 740.213.042*-+
CNT9571 1 740.172 740.290.119OS-> |
CPT9581 1 740.172 740.290.119OS-> |
TP 9591 1 740.173 740.213.041*-+
TP 9601 1 740.216 740.241.026*-+
TN 9611 1 740.216 740.288.073*-+
TP 9621 1 740.244 740.288.045*-+
GG 9631 1 740.298 757.628 17.330 组0162 |
GP 9641 1 742.816 745.122 2.307 ybgj |
CPT9651 1 744.643 744.657.015 --> |
CPT9661 1 744.664 744.678.015 --> |
GP 9671 1 754.400 756.896 2.497 sdhc |
CPT9681 1 755.680 755.714.035 --> |
GP 9691 1 756.912 757.628.717 sdhb |
TN 9701 1 757.626 757.712.087*-+
CPT9711 1 757.628 757.712.085OS-> |
TP 9721 1 757.629 757.712.084*-+
GG 9731 1 757.687 760.730 3.044 组0163 |
CPT9741 1 757.717 757.736.020 --> |
TN 9751 1 757.718 757.753.036*-*
T1(Id为811a)的“类型”描述符是“TN”,表示T1靶在双链基因组DNA的负链上。由于T1和T2靶必须出现在同一链上,所以T2(Id为975)的类型描述符也是“TN”。
上面的T1-T2环图的读法是从T1的*到适合的*右边,然后沿着图下来到第一个*,然后向左到T2的*。当水平线(用-表示)与其它垂直线(用|表示)交叉时,这一点的标记就变为+。当T1-T2环不含这组基因时,则垂直标识符(用|或+表示)就变为@,如下所示
类型 Num Jobno 染起点 终点 长度 基因名称
色
体
TN xx1 1 278.386 279.148 .763*---*
XX xx1 1 278.387 278.416 .030* @
XX xx1 1 278.421 278.450 .030* @
TP xx1 1 278.452 278.892 .442*---*
组0150-组0162描述在表2中,如下组0150基因名称glns COG_Id COG0008b 染色体 1 方向 正 起点 705.316 终点 706.980 长度 1.665组0151基因名称ybfmybfnfurflda COG_Id - b - b COG0735b COG0716b 染色体 1 1 1 1 方向 正 正 负 负 起点 707.557 709.013 709.423 710.158 终点 708.963 709.339 709.869 710.688 长度 1.407 .327 .447 .531组0152基因名称ybfe COG_Id - b 染色体 1 方向 负 起点 710.828 终点 711.190 长度 .363ybffseqa COG0596b COG3057b11负正711.261712.210712.025712.755 .765 .546组0153基因名称pgm COG_Id COG0033b 染色体 1 方向 正 起点 712.781 终点 714.421 长度 1.641组0154
基因名称ybfpybfgybfh COG_Id - b - b - b染色体111方向 正 负 负 起点 714.635 715.170 715.611终点715.129715.532715.928 长度 .495 .363 .318组0155基因名称potekdpe COG_Id COG0531b COG0745b 染色体 1 1 方向 负 负 起点 716.169 720.279 终点 719.683 724.202 长度 3.515 3.924组0156基因名称kdpbkdpa COG_Id COG2216b COG2060b 染色体 1 1 方向 负 负 起点724.211 726.282 终点 726.259 727.955 长度 2.049 1.674组0157基因名称ybfarhsc COG_Id - b - b 染色体 1 1 方向 正 正 起点 728.357 728.806 终点 728.563 733.325 长度 .207 4.520组0158基因名称b0703 COG_Id COG3209b 染色体 1 方向 正 起点 733.443 终点 735.442 长度 2.000组0159基因名称ybfl COG_Id - b 染色体 1 方向 正 起点 736.327 终点 737.184 长度 .858组0160基因名称ybfd COG_Id - b 染色体 1 方向 正 起点 737.315 终点 738.076 长度 .762组0161基因名称ybga COG_Id COG3272b 染色体 1 方向 正 起点 738.224 终点 740.148 长度 1.925组0162基因名称ybghybgiybgjneiabrbybgoybgqybgdgltasdhcsdhb COG_Id COG3104b COG0327b COG2049b COG0266b - b - b - b - b COG0372b COG2009b COG0479b 染色体 11 1 1 1 1 1 1 1 1 1 方向 负 正 正 正 负 负 负 负 负 正 正 起点 740.298 742.050 742.816 745.158 745.946 747.144 748.945 751.452 752.408 754.400 756.912 终点 741.779 742.793 745.122 745.949 747.037 748.930 751.401 752.018 753.691 756.896 757.628 长度 1.482 .744 2.307 .792 1.092 1.787 2.457 .567 1.284 2.497 .717组0163基因名称 COG_Id 染色体 方向 起点 终点 长度
b0725 - b 1正757.687760.7303.044
瞬时连接子62521的所有数据都被集中在下表中,它是对连接子的“扼要”描述。
连接子关系-总_Id 类型 62521 瞬时对照序列-方向 正染色体1 C1/C2_Id 4651a 起点 4626.130终点4626.166 长度 .036引发基因-名称 smsCOG_Id 起点 4623.481 终点 4626.116长度2.636 靶序列-方向 负染色体1 T1_Id 811a 起点 705.150终点705.203 长度 .054 T2-Id 975 起点 757.753终点757.718 长度 .036
受控基因位置_Id染色体组 名称 COG-Id方向起点终点长度123456789101112131415161718192021222324252627282930313233111111111111111111111111111111111组0150组0151组0151组0151组0151组0152组0152组0152组0153组0154组0154组0154组0155组0155组0156组0156组0157组0157组0158组0159组0160组0161组0162组0162组0162组0162组0162组0162组0162组0162组0162组0162组0162 glns ybfm ybfn fur flda ybfe ybff seqa pgm ybfp ybfg ybfh pote kdpe kdpb kdpa ybfa rhsc b0703 ybfl ybfd ybga ybgh ybgi ybgj nei abrb ybgo ybgq ybgd glta sdhc sdhb COG0008 - - COG0735 COG0716 - COG0596 COG3057 COG0033 - - - COG0531 COG0745 COG2216 COG2060 - - COG3209 - - COG3272 COG3104 COG0327 COG2049 COG0266 - - - - COG0372 COG2009 COG0479 正 正 正 负 负 正 负 正 正 正 负 负 正 负 正 负 正 正 正 正 正 正 正 正 正 正 负 负 负 负 负 正 正 705.316 707.557 709.013 709.869 710.688 710.828 712.025 712.210 712.781 714.635 715.532 715.928 716.169 724.202 724.211 727.955 728.357 728.806 733.443 736.327 737.315 738.224 740.298 742.050 742.816 745.158 747.037 748.930 751.401 752.018 753.691 754.400 756.912 706.980 710.688 709.339 709.423 710.158 712.755 711.261 712.755 714.421 715.928 715.170 715.611 724.202 720.279 727.955 726.282 733.325 733.325 735.442 737.184 738.076 740.148 757.628 742.793 745.122 745.949 745.946 747.144 748.945 751.452 752.408 756.896 757.628 1.665 3.131.327.447.531 1.927.765.546 1.641 1.293.363.318 8.033 3.924 3.744 1.674 4.968 4.520 2.000.858.762 1.925 17.330.744 2.307.792 1.092 1.787 2.457.567 1.284 2.497.717
341 组0163b0725 - 正757.687 760.7303.044
受控连接子s位置_Id染色体 C1/C2-Id 方向起点终点 长度123456789101112131415161718192021222324252627282930313233343536373839404142434445464711111111111111111111111111111111111111111111111816819823825830832835838844852854855856857865866869870872874876878880881892893895897900903904906909911915927928931932945957958965966968971974正正负负正正负正负正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正负正正正正正正 707.055 707.112 710.647 710.666 714.481 714.524 714.593 714.544 720.296 729.408 730.443 730.468 730.484 731.251 731.994 732.019 732.065 732.198 732.214 732.235 732.306 732.328 732.454 732.488 733.865 733.890 733.936 734.052 734.164 734.323 735.525 735.606 735.707 735.807 735.986 737.017 737.035 737.261 737.278 737.930 740.290 740.172 744.643 744.664 755.680 757.628 757.717 707.109 707.162 710.633 710.652 714.519 714.540 714.543 714.606 720.278 729.446 730.457 730.482 730.507 731.290 732.016 732.034 732.179 732.212 732.233 732.283 732.326 732.452 732.482 732.519 733.887 733.905 734.050 734.139 734.321 734.381 735.569 735.703 735.728 735.964 736.083 737.032 737.057 737.275 737.292 737.967 740.172 740.290 744.657 744.678 755.714 757.712 757.736 .055 .051 .015 .015 .039 .017 .051 .063 .019 .039 .015 .015 .024 .040 .023 .016 .115 .015 .020 .049 .021 .125 .029 .032 .023 .016 .115 .088 .158 .059 .045 .098 .022 .158 .098 .016 .023 .015 .015 .038 .119 .119 .015 .015 .035 .085 .020
加入表2类型4的合成连接子
通过修饰4626.130kb-4626.166kb之间长度为0.036kb的DNA双链序列可将类型4的合成连接子引入大肠杆菌基因组,其中,C1和C2是合成元件,T1和T2是天然元件。
连接子62520是这种合成的瞬时连接子的一个例子。它可被描述为
C1/C2 T1-T2
总_Id染色体C1_IdC2_Id染色体 T1_Id T2_Id 连接子类型
625201 4651a4651a1809 975瞬时
瞬时连接子62520的C1/C2来源表示在表1中,如下
类型 Num Jobno 染色体起点 终点 长度 基因名称
CPT 4651a 1 1 4626.130 4626.166 .036||||||||||||||||||
这种瞬时C1/C2连接子来源的“类型”描述符是“CPT”。字母“P”表示C1/C2连接子来源发生在基因组双链DNA的正链上。字母“N”表示C1/C2连接子来源发生在基因组双链DNA的负链上。字母“T”表示“瞬时”连接子。同样,字母“P”表示永久连接子,这将在后面的实施例中出现。这些实施例中的“起点”、“终点”和“长度”描述符的单位是千碱基(KB)。
瞬时connectron62520的T1-T2靶显示在表1中,如下
染
类型 Num Jobno 色 起点 终点长度基因名称
体
TN80911698.713 698.766.054*-+++*+++**++*+++++-+++++++++++
GG81011698.797 705.113 6.316组0149||||||||||| ||||| |||||||||||
TN81111705.121 705.141.021*-++*++++++++**++++*+++++*+++++
TP . 81211705.122 705.141.020*-++-+++++++++-++++++++++-+++++
GG81311705.316 706.980 1.665组0150|| ||||||||| |||||||||| |||||
TN81411707.013 707.028.016*-++*+++++++++*++++++++++*++++*
TP81511707.014 707.028.015*-++++++++++++++++++++++++++++-
CPT 81611707.055 707.109.055 --> ||||||||||||||||||||||||||||
TN81711707.055 707.109.055*-+++++++++*+*++++++++*+*+++++*
TP81811707.055 707.109.055*-+++++++++-+-++++++++-+-++++++
CPT 81911707.112 707.162.051OS-> ||||||||| | |||||||| | ||||||
TN82011707.112 707.162.051*-++++*++++*+*+++++*+**+*+*+*++
TP82111707.112 707.162.051*-++++-++++++++++++-+-++++-+-++
GG82211707.557 710.688 3.131组0151|||| |||||||||||| | |||| | ||
CNT 82311710.633 710.647.015OS-> |||| |||||||||||| | |||| | ||
TN82411710.633 710.647.015*-++++-*||||||||||| | |||| | ||
CNT 82511710.652 710.666.015 --> |||| ||||||||||| | |||| | ||
GG82611710.828 712.755 1.927组0152|||| ||||||||||| | |||| | ||
TN82711712.281 712.296.016*-++++--+++++++++++-+-++++-+-++
GG82811712.781 714.421 1.641组0153|||| ||||||||||| | |||| | ||
TN82911714.481 714.518.038*-++++**+++*+++++++*+*++++*+***
CPT 83011714.481 714.519.039 OS->||||||||| |||||||||||||||||
TP83111714.482 714.519.038 *-+++++++++-+++++++++++++++++--
CPT 83211714.524 714.540.017-->||||||||| |||||||||||||||||
TN83311714.524 714.540.017 *-+++++++++*+*+++++++++++++++**
TP83411714.524 714.540.017 *-+++++++++++-+++++++++++++++++
CNT 83511714.543 714.593.051 OS->||||||||||| |||||||||||||||||
TN83611714.543 714.593.051 *-++*+++++++**++++++++*++++++++
TP83711714.543 714.593.051 *-++-+++++++-+++++++++-++++++++
CPT 83811714.544 714.606.063 OS->|| ||||||| ||||||||| ||||||||
GG83911714.635 715.928 1.293 组0154|| ||||||| ||||||||| ||||||||
GN84011715.170 715.532.363 ybfg || ||||||| ||||||||| ||||||||
TN84111716.085 716.103.019 *-++*+++++++*||||||||| ||||||||
TP84211716.085 716.103.019 *-++++++++++++++++++++*++++++++
GG84311716.169 724.202 8.033 组0155|||||||||||||||||||||||||||||
CNT 84411720.278 720.296.019 --> |||||||||||||||||||||||||||||
GN84511720.279 724.202 3.924 kdpe |||||||||||||||||||||||||||||
TP84611721.769 721.783.015 *-+++++++++++++++++++++++++++++
TN8471 1721.812721.827.016*-+++++++++++++++++++++++++++++
GG8481 1724.211727.955 3.744组0156|||||||||||||||||||||||||||||
TP8491 1726.665726.679.015*-+++++++++++++++++++++++++++++
GG8501 1728.357733.325 4.968组0157|||||||||||||||||||||||||||||
GP8511 1728.806733.325 4.520 rhsc |||||||||||||||||||||||||||||
CPT 8521 1729.408729.446.039 --> |||||||||||||||||||||||||||||
TP8531 1730.270730.284.015*-+++++++++++++++++++++++++++++
CPT 8541 1730.443730.457.015 --> |||||||||||||||||||||||||||||
CPT 8551 1730.468730.482.015 --> |||||||||||||||||||||||||||||
CPT 8561 1730.484730.507.024 --> |||||||||||||||||||||||||||||
CPT 8571 1731.251731.290.040 --> |||||||||||||||||||||||||||||
TP8581 1731.475731.508.034*-+++++++++++++++++++++++++++++
TP8591 1731.512731.562.051*-+++++++++++++++++++++++++++++
TP8601 1731.564731.693.130*-+++++++++++++++++++++++++++++
TP8611 1731.698731.755.058*-+++++++++++++++++++++++++++++
TP8621 1731.757731.819.063*-+++++++++++++++++++++++++++++
TP8631 1731.821731.903.083*-+++++++++++++++++++++++++++++
TP8641 1731.906732.033.128*-+++++++++++++++++++++++++++++
CPT 8651 1731.994732.016.023 --> |||||||||||||||||||||||||||||
CPT 8661 1732.019732.034.016 --> |||||||||||||||||||||||||||||
TP8671 1732.035732.050.016*-+++++++++++++++++++++++++++++
TP8681 1732.052732.179.128*-*++++++++++++++++++++++++++++
CPT 8691 1732.065732.179.115OS-> ||||||||||||||||||||||||||||
CPT 8701 1732.198732.212.015 --> ||||||||||||||||||||||||||||
TP8711 1732.198732.212.015*-*||||||||||||||||||||||||||||
CPT 8721 1732.214732.233.020 --> |||||||||||||||||||||||||||||
TP8731 1732.214732.233.020*-+++++++++++++++++++++++++++++
CPT 8741 1732.235732.283.049 --> |||||||||||||||||||||||||||||
TP8751 1732.235732.283.049*-+++++++++++++++++++++++++++++
CPT 8761 1732.306732.326.021 --> |||||||||||||||||||||||||||||
TP8771 1732.306732.326.021*-+++++++++++++++++++++++++++++
CPT 8781 1732.328732.452.125 --> |||||||||||||||||||||||||||||
TP8791 1732.328732.482.155*-+++++++++++++++++++++++++++++
CPT 8801 1732.454732.482.029 --> |||||||||||||||||||||||||||||
CPT 8811 1732.488732.519.032 --> |||||||||||||||||||||||||||||
TN8821 1733.330733.344.015*-+++++++++++++++++++++++++++++
TP8831 1733.330733.344.015*-+++++++++++++++++++++++++++++
TP8841 1733.371733.513.143*-+++++++++++++++++++++++++++++
GG8851 1733.443735.442 2.000组0158|||||||||||||||||||||||||||||
TP8861 1733.515733.564.050*-+++++++++++++++++++++++++++++
TP8871 1733.569733.626.058*-+++++++++++++++++++++++++++++
TP8881 1733.628733.645.018*-+++++++++++++++++++++++++++++
TP8891 1733.647733.696.050*-+++++++++++++++++++++++++++++
TP8901 1733.698733.774.077*-+++++++++++++++++++++++++++++
TP8911 1733.776733.904.129*-+++++++++++++++++++++++++++++
CPT 8921 1733.865733.887.023OS-> |||||||||||||||||||||||||||||
CPT 8931 1733.890733.905.016 --> |||||||||||||||||||||||||||||
TP8941 1733.906734.050.145*-+*+++++++++++++++++++++++++++
CPT 8951 1733.936734.050.115 --> | |||||||||||||||||||||||||||
TP8961 1734.052734.075.024*-+-+++++++++++++++++++++++++++
CPT 8971 1734.052734.139.088 --> | |||||||||||||||||||||||||||
TP8981 1734.084734.139.056*-*-+++++++++++++++++++++++++++
TP8991 1734.149734.179.031*---+++++++++++++++++++++++++++
CPT 9001 1734.164734.321.158 -->|||||||||||||||||||||||||||
TP9011 1734.192734.321.130*---+++++++++++++++++++++++++++
TP9021 1734.323734.378.056*---+++++++++++++++++++++++++++
CPT 9031 1734.323734.381.059 -->|||||||||||||||||||||||||||
CPT 9041 1735.525735.569.045 -->|||||||||||||||||||||||||||
TP9051 1735.525735.569.045*-* |||||||||||||||||||||||||||
CPT 9061 1735.606735.703.098 --> | |||||||||||||||||||||||||||
TP9071 1735.606735.703.098*-+*+++++++++++++++++++++++++++
TP9081 1735.707735.721.015*-+++++++++++++++++++++++++++++
CPT 9091 1735.707735.728.022 --> |||||||||||||||||||||||||||||
TP9101 1735.749735.803.055*-+++++++++++++++++++++++++++++
CPT 9111 1735.807735.964.158OS-> |||||||||||||||||||||||||||||
TP9121 1735.814735.895.082*-+++++++++++++++++++++++++++++
TP9131 1735.905735.934.030*-+++++++++++++++++++++++++++++
TP9141 1735.938736.083.146*-+++++++++++++++++++++++++++++
CPT 9151 1735.986736.083.098OS-> |||||||||||||||||||||||||||||
TP9161 1736.152736.173.022*-+++++++++++++++++++++++++++++
TP9171 1736.187736.217.031*-+++++++++++++++++++++++++++++
TP9181 1736.219736.265.047*-+++++++++++++++++++++++++++++
TP9191 1736.288736.334.047*-+++++++++++++++++++++++++++++
GG9201 1736.327737.184.858组0159|||||||||||||||||||||||||||||
TP9211 1736.349736.469.121*-+++++++++++++++++++++++++++++
TP9221 1736.516736.628.113*-+++++++++++++++++++++++++++++
TP9231 1736.630736.645.016*-+++++++++++++++++++++++++++++
TP9241 1736.654736.792.139*-+++++++++++++++++++++++++++++
TN9251 1736.654736.809.156*-+++++++++++++++++++++++++++++
TN9261 1736.816736.832.017*-+++++++++++++++++++++++++++++
CPT 9271 1737.017737.032.016 --> |||||||||||||||||||||||||||||
CPT 9281 1737.035737.057.023 --> |||||||||||||||||||||||||||||
TN9291 1737.168737.188.021*-+++++++++++++++++++++++++++++
TP9301 1737.196737.290.095*-**+++++++++++++++++++++++++++
CPT 9311 1737.261737.275.015 -->|||||||||||||||||||||||||||
CPT 9321 1737.278737.292.015 -->|||||||||||||||||||||||||||
TP9331 1737.292737.393.102*---+++++++++++++++++++++++++++
GG9341 1737.315738.076.762组0160 |||||||||||||||||||||||||||
TP9351 1737.411737.475.065*---+++++++++++++++++++++++++++
TP9361 1737.479737.557.079*---+++++++++++++++++++++++++++
TP9371 1737.580737.597.018*---+++++++++++++++++++++++++++
TP9381 1737.605737.626.022*---+++++++++++++++++++++++++++
TP9391 1737.633737.648.016*---+++++++++++++++++++++++++++
TP9401 1737.653737.679.027*---+++++++++++++++++++++++++++
TP9411 1737.683737.752.070*---+++++++++++++++++++++++++++
TP9421 1737.798737.822.025*---+++++++++++++++++++++++++++
TP9431 1737.828737.895.068 *---+++++++++++++++++++++++++++
TP9441 1737.897737.931.035 *---+++++++++++++++++++++++++++
CPT 9451 1737.930737.967.038-->|||||||||||||||||||||||||||
TP9461 1737.936737.967.032 *---+++++++++++++++++++++++++++
TP9471 1737.970737.988.019 *---+++++++++++++++++++++++++++
TN9481 1737.990738.015.026 *---+++++++++++++++++++++++++++
TP9491 1737.990738.015.026 *---+++++++++++++++++++++++++++
TN9501 1738.019738.051.033 *---+++++++++++++++++++++++++++
TP9511 1738.019738.051.033 *---+++++++++++++++++++++++++++
TP9521 1738.053738.074.022 *---+++++++++++++++++++++++++++
TN9531 1738.058738.074.017 *---+++++++++++++++++++++++++++
TN9541 1738.107738.126.020 *---+++++++++++++++++++++++++++
GG9551 1738.224740.148 1.925组0161 |||||||||||||||||||||||||||
TN9561 1740.172740.213.042 *-**++++*++++*+++*++++++*++++++
CNT 9571 1740.172740.290.119 OS-> |||||| |||| ||| |||||| ||||||
CPT 9581 1740.172740.290.119 OS-> |||||| |||| ||| |||||| ||||||
TP9591 1740.173740.213.041 *-++++++*++++*+++**+++++*++++++
TP9601 1740.216740.241.026 *-++++++++++++++++-++++++++++++
TN9611 1740.216740.288.073 *-+++*++++++++**++-++++++++++++
TP9621 1740.244740.288.045 *-+++-++++++++--++*+++**+++++++
GG9631 1740.298757.628 17.330组0162 ||| |||||||| |||||| |||||||
GP9641 1742.816745.122 2.307 ybgj||| |||||||| |||||| |||||||
CPT 9651 1744.643744.657.015--> ||| |||||||| |||||| |||||||
CPT 9661 1744.664744.678.015--> ||| |||||||| |||||| |||||||
GP9671 1754.400756.896 2.497 sdhc||| |||||||| |||||| |||||||
CPT 9681 1755.680755.714.035--> ||| |||||||| |||||| |||||||
GP9691 1756.912757.628.717 sdhb||| |||||||| |||||| |||||||
TN9701 1757.626757.712.087 *-*+**+++*++++***+++++**+++*+++
CTT 9711 1757.628757.712.085 OS-> | |||| |||||| |||||||||| |||
TP9721 1757.629757.712.084 *--+-+++*-++++++-+*++++++++-+++
GG9731 1757.687760.730 3.044组0163| ||| |||||| | |||||||| |||
CPT 9741 1757.717757.736.020--> | ||| |||||| | |||||||| |||
TN9751 1757.718757.753.036 *-*+*+++***+++++*+-+*++++++-+++
T1(Id为809)的“类型”描述符是“TN”,表示T1靶在双链基因组DNA的负链上。由于T1和T2靶必须出现在同一链上,所以T2(Id为975)的类型描述符也是“TN”。
上面的T1-T2环图的读法是从T1的*到适合的*右边,然后沿着图下来到第一个*,然后向左到T2的*。当水平线(用-表示)与其它垂直线(用|表示)交叉时,这一点的标记就变为+。当T1-T2环不含这组基因时,则垂直标识符(用|或+表示)就变为@,如下所示
类型 Num Jobno 染起点 终点 长度基因名称
色
体
TNxx1 1278.386 279.148.763*---*
XXxx1 1278.387 278.416.030* @
XXxx1 1278.421 278.450.030* @
TPxx1 1278.452 278.892.441*---*
TNxx1 1278.386 279.148.763*---*
XXxx1 1278.387 278.416.030* @
XXxx1 1278.421 278.450.030* @
TPxx1 1278.452 278.892.441*---*
组0149-组0163描述在表2中,如下组0149基因名称nagdnagcnaganagbnage COG_Id COG0647 COG1940 COG1820 COG0363 COG1264 b b b b b 染色体11111 方向负负负负正 起点 698.797 699.597 700.826 702.034 703.167 终点 699.549 700.817 701.974 702.834 705.113 长度.753 1.221 1.149.801 1.947组0150基因名称glms COG_Id COG0008 b 染色体1 方向正 起点 705.316 终点 706.980 长度 1.665组0151基因名称ybfmybfnfurflda COG_Id - - COG0735 COG0716 b b b b 染色体1111 方向正正负负 起点 707.557 709.013 709.423 710.158 终点 708.963 709.339 709.869 710.688 长度 1.407.327.447.531组0152基因名称ybfe COG_Id - b 染色体1 方向负 起点 710.828 终点 711.190 长度.363ybffseqa COG0596 COG3057 b b11负正 711.261 712.210 712.025 712.755.765.546组0153基因名称pgm COG_Id COG0033 b 染色体1 方向正 起点 712.781 终点 714.421 长度 1.641组0154基因名称ybfpybfgybfh COG_Id - - - b b b 染色体111 方向正负负 起点 714.635 715.170 715.611 终点 715.129 715.532 715.928 长度.495.363.318组0155基因名称potekdpe COG_Id COG0531 COG0745 b b 染色体11 方向负负 起点 716.169 720.279 终点 719.683 724.202 长度 3.515 3.924组0156基因名称kdpbkdpa COG_Id COG2216 COG2060 b b 染色体11 方向负负 起点 724.211 726.282 终点 726.259 727.955 长度 2.049 1.674组0157
基因名称ybfarhsc COG_Id - - b b染色体11方向 正 正起点 728.357 728.806终点 728.563 733.325 长度 .207 4.520组0158基因名称b0703 COG_Id COG3209 b 染色体 1 方向 正 起点 733.443 终点 735.442 长度 2.000组0159基因名称ybfl COG_Id - b 染色体 1 方向 正 起点 736.327 终点 737.184 长度 .858组0160基因名称ybfd COG_Id - b 染色体 1 方向 正 起点 737.315 终点 738.076 长度 .762组0161基因名称ybga COG_Id COG3272 b 染色体 1 方向 正 起点 738.224 终点 740.148 长度 1.925组0162基因名称ybghybgiybgjneiabrbybgoybgqybgdgltasdhcsdhb COG_Id COG3104 COG0327 COG2049 COG0266 - - - - COG0372 COG2009 COG0479 b b b b b b b b b b b 染色体 1 1 1 1 1 1 1 1 1 1 1 方向 负 正 正 正 负 负 负 负 负 正 正 起点 740.298 742.050 742.816 745.158 745.946 747.144 748.945 751.452 752.408 754.400 756.912 终点 741.779 742.793 745.122 745.949 747.037 748.930 751.401 752.018 753.691 756.896 757.628 长度 1.482 .744 2.307 .792 1.092 1.787 2.457 .567 1.284 2.497 .717组0163基因名称b0725 COG_Id - b 染色体 1 方向 正 起点 757.687 终点 760.730 长度 3.044
瞬时连接子62520的所有数据都被集中在下表中,它是对连接子的“扼要”描述。
连接子关系-总_Id 类型
62520 瞬时
对照序列-方向 染色体C1/C2_Id起点 终点 长度
正 1 4651a 4626.130 4626.166.036
引发基因-名称 COG_Id起点终点 长度
sms4623.481 4626.1162.636
靶序列-方向 染色体T1_Id起点终点 长度
负 1 809698.766 698.713 .054
T2-Id起点终点长度
975757.753 757.718 .036
受控基因位置 Id染色体组名称 COG_Id方向 起点终点长度123456789101112131415161718192021222324252627282930313233343536373839111111111111111111111111111111111111111组0149组0149组0149组0149组0149组0150组0151组0151组0151组0151组0152组0152组0152组0153组0154组0154组0154组0155组0155组0156组0156组0157组0157组0158组0159组0160组0161组0162组0162组0162组0162组0162组0162组0162组0162组0162组0162组0162组0163 nagd nagc naga nagb nage glns ybfm ybfn fur flda ybfe ybff seqa pgm ybfp ybfg ybfh pote kdpe kdpb kdpa ybfa rhsc b0703 ybfl ybfd ybga ybgh ybgi ybgj nei abrb ybgo ybgq ybgd glta sdhc sdhb b0725 COG0647 COG1940 COG1820 COG0363 COG1264 COG0008 - - COG0735 COG0716 - COG0596 COG3057 COG0033 - - - COG0531 COG0745 COG2216 COG2060 - - COG3209 - - COG3272 COG3104 COG0327 COG2049 COG0266 - - - - COG0372 COG2009 COG0479 -正负负负正正正正负负正负正正正负负正负正负正正正正正正正正正正负负负负负正正正698.797700.817701.974702.834703.167705.316707.557709.013709.869710.688710.828712.025712.210712.781714.635715.532715.928716.169724.202724.211727.955728.357728.806733.443736.327737.315738.224740.298742.050742.816745.158747.037748.930751.401752.018753.691754.400756.912757.687 705.113 699.597 700.826 702.034 705.113 706.980 710.688 709.339 709.423 710.158 712.755 711.261 712.755 714.421 715.928 715.170 715.611 724.202 720.279 727.955 726.282 733.325 733.325 735.442 737.184 738.076 740.148 757.628 742.793 745.122 745.949 745.946 747.144 748.945 751.452 752.408 756.896 757.628 760.730 6.316 1.221 1.149.801 1.947 1.665 3.131.327.447.531 1.927.765.546 1.641 1.293.363.318 8.033 3.924 3.744 1.674 4.968 4.520 2.000.858.762 1.925 17.330.744 2.307.792 1.092 1.787 2.457.567 1.284 2.497.717 3.044
受控连接子位置_Id染色体 C1/C2-Id 方向 起点 终点长度123111816819823 正 正 负707.055707.112710.647707.109707.162710.633.055.051.015
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 4711111111111111111111111111111111111111111111825830832835838844852854855856857865866869870872874876878880881892893895897900903904906909911915927928931932945957958965966968971974负正正负正负正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正负正正正正正正710.666714.481714.524714.593714.544720.296729.408730.443730.468730.484731.251731.994732.019732.065732.198732.214732.235732.306732.328732.454732.488733.865733.890733.936734.052734.164734.323735.525735.606735.707735.807735.986737.017737.035737.261737.278737.930740.290740.172744.643744.664755.680757.628757.717 710.652 714.519 714.540 714.543 714.606 720.278 729.446 730.457 730.482 730.507 731.290 732.016 732.034 732.179 732.212 732.233 732.283 732.326 732.452 732.482 732.519 733.887 733.905 734.050 734.139 734.321 734.381 735.569 735.703 735.728 735.964 736.083 737.032 737.057 737.275 737.292 737.967 740.172 740.290 744.657 744.678 755.714 757.712 757.736.015.039.017.051.063.019.039.015.015.024.040.023.016.115.015.020.049.021.125.029.032.023.016.115.088.158.059.045.098.022.158.098.016.023.015.015.038.119.119.015.015.035.085.020
在染色体之间加入合成的瞬时连接子—表2类型7
通过修饰染色体2上221.330kb-221.345kb之间长度为0.016kb的DNA双链序列并修饰染色体5上488.140kb-488.297kb之间长度为0.158kb的DNA双链序列可将类型7的合成的虚拟连接子引入酿酒酵母(S.cerevisar)基因组,其中,C1是合成元件,C2是天然元件,T1是天然元件,T2是合成元件。
为创建这个类型7的合成连接子的例子,将天然连接子3558的T2序列(老位置是497.581kb-498.091kb)拷贝入上述新位置。
连接子75273是这种合成的瞬时连接子的一个例子。它可被描述为
C1/C2 T1-T2
总_Id染色体C1_IdC2_Id染色体T1_IdT2_Id 连接子类型
752732 792a 793 5 4749 4824a 瞬时
瞬时连接子75273的C1/C2来源表示在表1中,如下
类型NumJobno染色体 起点 终点 长度基因名称
CPT 792a 22 2221.330 221.345 .016 ->
CPT 79322 2221.346 221.361 .016 ->
这种瞬时C1/C2连接子来源的“类型”描述符是“CPT”。字母“P”表示C1/C2连接子来源发生在基因组双链DNA的正链上。字母“N”表示C1/C2连接子来源发生在基因组双链DNA的负链上。字母“T”表示“瞬时”连接子。同样,字母“P”表示永久连接子,这将在后面的实施例中出现。这些实施例中的“起点”、“终点”和“长度”描述符的单位是千碱基(KB)。出现符号OS->是因为由这种C1/C2形成的另一个连接子碰巧是单触发连接子。
瞬时连接子75273的T1-T2靶显示在表1中,如下
染
类
NumJobno 色起点 终点 长度基因名称
型
体
TN4749595 448.454 448.992.539*-*
TP4750685 448.454 448.992.539*-+
CNT 4751645 448.454 448.992.539 --> |
TP4752635 449.003 449.315.313*-+
TN4753655 449.003 449.315.313*-+
CNT 4754605 449.003 449.315.313OS-> |
CNT 47555 5 449.317 449.482.166OS-> |
TN47565 5 449.317 449.482.166*-+
TP4757645 449.317 449.482.148*-+
GG4758595 449.470 449.574.105 组0615 |
CPT 4759705 449.490 449.563.074 --> |
TN4760705 449.490 449.563.074*-+
TP4761675 449.490 449.558.069*-+
CNT 4762705 449.490 449.563.074 --> |
TN4763595 449.575 449.603.029*-+
TP4764595 449.575 449.603.029*-+
GG4765595 450.558 453.230 2.672 组0616 |
TP4766595 452.176 452.190.015*-+
GG4767595 453.454 454.914 1.461 组0617 |
CNT 4768205 453.909 453.923.015 --> |
CNT 4769205 453.928 453.942.015 --> |
TP4770595 454.644 454.658.015*-+
GG4771595 455.141 457.600 2.460 组0618 |
TN4772665 456.316 456.331.016*-+
GG4773595 457.801 460.218 2.411 组0619 |
TN4774665 460.340 460.355.016*-+
GG4775595 460.521 466.020 5.500 组0620 |
GP4776595 462.580 462.861.282 LSM5 |
TN477759 5463.743463.758.016*-+
TP477859 5463.743463.758.016*-+
CPT 477961 5463.990464.004.015 --> |
CPT 478061 5464.010464.024.015 --> |
TP478159 5465.739465.754.016*-|
GG478259 5466.203468.811 2.609 组0621 |
GP478359 5468.365468.811.447 SPI1 |
TP478469 5469.451469.518.059*-+
CNT 478567 5469.451469.530.080OS-> |
GG478659 5469.452469.525.074 组0622 |
TN478759 5469.452469.532.081*-+
CPT 478867 5469.452469.531.080 --> |
GG478959 5469.681472.419 2.739 组0623 |
TN479020 5471.772471.786.015*-+
TP479120 5471.772471.786.015*-+
GG479259 5472.652482.843 10.192 组0624 |
GP479359 5475.015476.223 1.209 OXA1 |
TP479463 5476.803476.817.015*-+
CPT 479560 5478.412478.426.015 --> |
CPT 479660 5478.436478.450.015 --> |
CNT 479747 5481.782481.812.031 --> |
TN479820 5482.192482.206.015*-+
CNT 479967 5482.676482.690.015 --> |
CNT 480067 5482.701482.715.015 --> |
GG480159 5483.320487.188 3.869 组0625 |
GP480259 5484.783487.188 2.406 SEC34|
CNT 480361 5485.099485.113.015 --> |
CNT 480461 5485.119485.134.016 --> |
TN480564 5487.041487.056.016*-+
GG480659 5487.326487.397.072 组0626 |
CPT 480761 5487.375487.397.023 --> |
CPT 480861 5487.400487.415.016 --> |
CNT 480934 5487.830487.848.019OS-> |
CPT 481062 5487.830487.848.019OS-> |
TP481160 5487.830487.848.019*-+
TN481259 5487.830487.848.019*-+
CNT 481334 5487.850488.016.167OS-> |
CPT 481455487.850488.016.167OS-> |
TP481555487.850488.016.167*-+
TN481664 5487.850488.016.167*-+
CNT 481747 5488.024488.137.114OS-> |
CPT 481847 5488.024488.068.045 --> |
TN481934 5488.024488.067.044*-+
TP482034 5488.024488.067.044*-+
CPT 482169 5488.069488.137.069OS-> |
TN482267 5488.069488.122.054*-+
TP482359 5488.069488.085.017*-+
TP482455488.094488.137.044*-+
TN4824a 55488.140488.297.158*-*
T1(Id为4749)的“类型”描述符是“TN”,表示T1靶在双链基因组DNA的负链上。由于T1和T2靶必须出现在同一链上,所以T2(Id为4824a)的类型描述符也是“TN”。
上面的T1-T2环图的读法是从T1的*到适合的*右边,然后沿着图下来到第一个*,然后向左到T2的*。当水平线(用-表示)与其它垂直线(用|表示)交叉时,这一点的标记就变为+。当T1-T2环不含这组基因时,则垂直标识符(用|或+表示)就变为@,如下所示
类型 Num Jobno 染起点 终点 长度基因名称
色
体
TNxx1 1278.386279.148.763*---*
XXxx1 1278.387278.416.030* @
XXxx1 1278.421278.450.030* @
TPxx1 1278.452278.892.441*---*
组0615(Id为4758)具有类型描述符“GG”。组0626(Id为4806)也一样。
组0615-组0626描述在表2中,如下组0615基因名称YER138W-A COG_Id - 染色体 5 方向 正 起点 449.470 终点 449.574 长度 .105组0616基因名称YER139CYER140W COG_Id - - 染色体 5 5 方向 负 正 起点 450.558 451.560 终点 451.238 453.230 长度 .6811.671组0617基因名称COX15 COG_Id COG1612 0 染色体 5 方向 正 起点 453.454 终点 454.914 长度1.461组0618基因名称MAGIDDI1 COG_Id COG0122 L - 染色体 5 5 方向 负 正 起点 455.141 456.314 终点 456.031 457.600 长度 .8911.287组0619基因名称UBP5 COG_Id - 染色体 5 方向 负 起点 457.801 终点 460.218 长度2.418组0620基因名称FTR1LSM5YER147C COG_Id COG0672 P COG1958 K - 染色体 5 5 方向 负 正 负 起点 460.521 462.580 462.963 终点 461.735 462.861 464.837 长度1.215 .2821.875
SPT15 COG2101 K 5正 465.298 466.020.723组0621基因名称PEA2SPI1 COG_Id - - 染色体 5 方向 负 正 起点 466.203 468.365 终点 467.465 468.811 长度1.263 .447组0622基因名称 COG_Id 染色体 5 方向 正 起点 469.452 终点 469.525 长度 .074组0623基因名称UBP3 COG_Id - 染色体 5 方向 负 起点 469.681 终点 472.419 长度2.739组0624基因名称YER152CPET122OXA1BEM2 COG_Id COG1167 K - COG0706 N - 染色体 5 5 5 5 方向 负 负 正 负 起点 472.652 474.036 475.015 476.340 终点 473.983 474.800 476.223 482.843 长度1.332 .7651.2096.504组0625基因名称YER156CSEC34 COG_Id - - 染色体 5 5 方向 负 正 起点 483.320 484.783 终点 484.336 487.188 长度1.0172.406组0626
基因名称 COG_Id 染色体 方向 起点 终点 长度
5正 487.326487.397 .072
瞬时连接子75273的所有数据都被集中在下表中,它是对连接子的“扼要”描述。
连接子关系-总_Id 类型 75273 瞬时对照序列-方向 正 正引发基因-名称YBL005W-B 靶序列-方向 负染色体22 COG_Id - 染色体 5 C1/C2_Id792a793 起点 221.293 T1_Id 4749 T2-Id 4824a起点221.330221.346 终点 226.561 起点448.992起点488.140 终点 221.345 221.361 长度 5.269 终点 448.454 终点 488.297长度.016.016 长度.539长度.158
受控基因位置_Id染色体组名称 COG-Id 方向起点终点长度15组0615 YER138W-A -正 449.470 449.574.105
2 3 4 5 6 7 8 910111213141516171819202122555555555555555555555组0616组0616组0617组0618组0618组0619组0620组0620组0620组0620组0621组0621组0622组0623组0624组0624组0624组0624组0625组0625组0626 YER139C YER140WCOX15 MAGI DDI1 UBP5 FTR1 LSM5 YER147CSPTI5 PEA2 SPI1 UBP3 YER152C PET122 OXA1 BEM2 YER156CSEC34- - COG1612 COG0122 - - COG0672 COG1958 - COG2101 - -- COG1167 - COG0706 - - - 正 正 正 正 正 正 正 正 负 正 正 正 正 正 正 负 正 负 正 正 正 450.558 451.560 453.454 455.141 456.314 457.801 460.521 462.580 464.837 465.298 466.203 468.365 469.452 469.681 472.652 474.800 475.015 482.843 483.320 484.783 487.326 453.230 453.230 454.914 457.600 457.600 460.218 466.020 462.861 462.963 466.020 468.811 468.811 469.525 472.419 482.843 474.036 476.223 476.340 487.188 487.188 487.3972.6731.6711.4612.4591.2872.4185.499 .2821.875 .7232.608 .447 .0742.739 10.191 .7651.2096.5043.8682.406 .072
受控连接子位置_Id染色体 C1/C2-Id 方向起点终点长度123456789101112131415161718192021222324252627555555555555555555555555555475147544755475947624768476947794780478547884795479647974799480048034804480748084809481048134814481748184821负负负正负负负正正负正正正负负负负负正正负正负正负正正 448.992 449.315 449.482 449.490 449.563 453.923 453.942 463.990 464.010 469.530 469.452 478.412 478.436 481.812 482.690 482.715 485.113 485.134 487.375 487.400 487.848 487.830 488.016 487.850 488.137 488.024 488.069 448.454 449.003 449.317 449.563 449.490 453.909 453.928 464.004 464.024 469.451 469.531 478.426 478.450 481.782 482.676 482.701 485.099 485.119 487.397 487.415 487.830 487.848 487.850 488.016 488.024 488.068 488.137.539.313.166.074.074.015.015.015.015.080.080.015.015.031.015.015.015.016.023.016.019.019.167.167.114.045.069
加入表2类型14的合成连接子
通过修饰734.750kb-734.942kb之间长度为0.193kb的DNA双链序列可将类型14的合成的虚拟连接子引入盐杆菌属(Halobacterium sp)的基因组,其中,C1和C2是天然元件,T1是合成元件,T2是天然元件。
为创建这个类型15的合成连接子的例子,将天然连接子6627的T1序列(老位置是733.018kb-733.210kb)拷贝入上述新位置。
连接子7341是这种合成的瞬时连接子的一个例子。它可被描述为
C1/C2T1-T2
总_Id 染色体 C1_Id C2_Id 染色体 T1_Id T2_Id 连接子类型
2587166126612166276852瞬时
瞬时连接子7341的C1/C2来源表示在表1中,如下
类型 Num Jobno 染色体 起点 终点 长度基因名称
CPT6612 1 1 732.401 732.534 .134 OS-> ||||||||||||||||||
这种瞬时C1/C2连接子来源的“类型”描述符是“CPT”。字母“P”表示C1/C2连接子来源发生在基因组双链DNA的正链上。字母“N”表示C1/C2连接子来源发生在基因组双链DNA的负链上。字母“T”表示“瞬时”连接子。同样,字母“P”表示永久连接子,这将在后面的实施例中出现。这些实施例中的“起点”、“终点”和“长度”描述符的单位是千碱基(KB)。出现符号OS->是因为由这种C1/C2形成的另一个连接子碰巧是单触发连接子。
瞬时连接子7341的T1-T2靶显示在表1中,如下
类型 Num Jobno 染 起点 终点 长度基因名称
色
体
TP6644a 1 1734.750734.942.193 *-*
GG66461 1735.009735.881.873 组0493 |
CNT 66471 1735.364735.378.015 OS-> |
TN66481 1735.364735.378.015 *-+
CNT 66491 1735.389735.403.015 --> |
CNT 66501 1735.753735.767.015 --> |
CNT 66511 1735.775735.789.015 --> |
GG66521 1735.910737.544 1.634 组0494 |
TN66531 1735.969735.984.016 *-+
TN66541 1736.126736.140.015 *-+
CPT 66551 1736.325736.339.015 --> |
TN66561 1736.327736.342.016 *-+
CPT 66571 1736.345736.359.015 --> |
TP66581 1736.903736.917.015 *-+
TN66591 1737.233737.247.015 *-+
TP66601 1737.271737.285.015 *-+
TN66611 1737.331737.346.016 *-+
GG66621 1737.643737.972.330 组0495 |
TN66631 1737.752737.766.015 *-+
CNT 66641 1737.752737.782.031 --> |
TP66651 1737.761737.775.015 *-+
TN66661 1738.049738.063.015 *-+
GG66671 1738.107739.835 1.728 组0496 |
TN66681 1738.122738.136.015 *-+
TP66691 1738.122738.136.015 *-+
TP66701 1738.425738.439.015 *-+
TP66711 1738.503738.517.015 *-+
CNT 66721 1738.517738.562.046 --> |
TN66731 1738.544738.559.016 *-+
TN66741 1738.862738.878.017 *-+
TP66751 1738.862738.878.017 *-+
CNT 66761 1738.975738.989.015 --> |
CNT 66771 1738.992739.007.016 --> |
TN66781 1739.107739.122.016 *-+
GN66791 1739.248739.835.588 cheC1 |
TP66801 1739.435739.449.015 *-+
TN66811 1739.685739.707.023 *-+
TN66821 1739.761739.775.015 *-+
GG66831 1739.838741.844 2.007 组0497 |
TN66841 1739.849739.863.015 *-+
TP66851 1740.345740.360.016 *-+
TN66861 1740.362740.376.015 *-+
TP66871 1740.611740.625.015 *-+
TN66881 1741.100741.116.017 *-+
TP66891 1741.101741.132.032 *-+
TN66901 1741.218741.232.015 *-+
CNT 66911 1741.352741.368.017 --> |
TP66921 1741.354741.376.023 *-+
TN66931 1741.354741.380.027 *-+
CNT 66941 1741.374741.388.015 --> |
TN66951 1741.401741.417.017 *-+
CNT 66961 1741.519741.533.015 --> |
CNT 66971 1741.538741.552.015 --> |
TN66981 1741.538741.552.015 *-+
TN66991 1741.561741.575.015 *-+
GG67001 1741.846743.248 1.403 组0498 |
TN67011 1741.924741.942.019 *-+
TN67021 1742.194742.208.015 *-+
TP67031 1742.618742.632.015 *-+
TN67041 1742.943742.957.015 *-+
GG67051 1743.295743.831.537 组0499 |
TP67061 1743.730743.748.019 *-+
GG67071 1743.896744.489.594 组0500 |
TN67081 1743.916743.930.015 *-+
GG67091 1744.606745.511.906 组0501 |
TN67101 1744.950744.964.015 *-+
TN67111 1745.047745.061.015 *-+
GG67121 1745.648746.763 1.116 组0502 |
CPT 67131 1745.865745.879.015 --> |
TN67141 1745.865745.879.015 *-+
CPT 67151 1745.888745.902.015 --> |
CPT 67161 1746.140746.155.016 --> |
TN67171 1746.153746.175.023 *-+
TP67181 1746.157746.175.019 *-+
CPT 67191 1746.162746.176.015 --> |
TN67201 1746.229746.243.015 *-+
CNT 67211 1746.229746.259.031 --> |
TN67221 1746.271746.285.015 *-+
TP67231 1746.356746.380.025 *-+
TN67241 1746.361746.380.020 *-+
TN67251 1746.386746.400.015 *-+
CPT 67261 1746.453746.467.015 --> |
TN67271 1746.453746.472.020 *-+
TP67281 1746.457746.475.019 *-+
CPT 67291 1746.469746.483.015 --> |
TP67301 1746.528746.545.018 *-+
TN67311 1746.532746.556.025 *-+
GG67321 1746.843748.851 2.008 组0503 |
CNT 67331 1746.905746.919.015 --> |
CNT 67341 1746.927746.941.015 --> |
GN67351 1747.151748.605 1.455 VNG0983C |
TN67361 1747.260747.274.015 *-+
TP67371 1747.475747.489.015 *-+
TN67381 1747.547747.571.025 *-+
TN67391 1747.934747.948.015 *-+
TP67401 1747.936747.950.015 *-+
TN67411 1748.130748.144.015 *-+
TP67421 1749.157749.172.016 *-+
TN67431 1749.375749.389.015 *-+
GG67441 1749.392759.277 9.885 组0504 |
CNT 67451 1759.509759.552.044 --> |
TP67461 1759.509760.014.506 *-+
TN67471 1759.528760.031.504 *-+
GG67481 1759.667762.487 2.820 组0505 |
GP67491 1760.682762.487 1.806 boa4 |
CPT 67501 1760.774760.789.016 --> |
CPT 67511 1760.798760.814.017 --> |
TN67521 1760.875760.889.015 *-+
CPT 67531 1760.878760.892.015 --> |
CPT 67541 1760.897760.912.016 --> |
CPT 67551 1761.496761.510.015 --> |
CPT 67561 1761.516761.533.018 --> |
CPT 67571 1761.542761.557.016 --> |
TN67581 1761.542761.557.016 *-+
CPT 67591 1761.576761.597.022 --> |
CPT 67601 1761.601761.617.017 --> |
TN67611 1761.754761.768.015 *-+
CPT 67621 1761.933761.950.018 --> |
TP67631 1761.933761.950.018 *-+
CPT 67641 1761.953761.968.016 --> |
TN67651 1762.423762.437.015 *-+
GG67661 1762.609764.612 2.004 组0506 |
TN67671 1762.874762.900.027 *-+
TN67681 1762.946762.960.015 *-+
TN67691 1763.108763.122.015 *-+
TN67701 1763.273763.304.032 *-+
CPT 67711 1763.283763.304.022 --> |
TN67721 1763.306763.320.015 *-+
CPT 67731 1763.306763.321.016 --> |
CPT 67741 1763.346763.360.015 --> |
TN67751 1763.351763.365.015 *-+
TP67761 1763.351763.365.015 *-+
CPT 67771 1763.362763.376.015 --> |
TP67781 1763.391763.407.017 *-+
TN67791 1763.843763.857.015 *-+
TP67801 1763.843763.857.015 *-+
CNT 67811 1763.965763.986.022 --> |
CPT 67821 1763.965763.995.031 --> |
CNT 67831 1763.990764.011.022 --> |
CPT 67841 1764.000764.015.016 --> |
CNT 67851 1764.075764.089.015 --> |
CNT 67861 1764.093764.108.016 --> |
CPT 67871 1764.156764.171.016 --> |
CNT 67881 1764.156764.177.022 OS-> |
TN67891 1764.156764.177.022 *-+
CNT 67901 1764.181764.195.015 --> |
TP67911 1764.181764.201.021 *-+
CPT 67921 1764.181764.204.024 --> |
CPT 67931 1764.213764.227.015 --> |
TP67941 1764.309764.328.020 *-+
TN67951 1764.312764.326.015 *-+
TN67961 1764.383764.397.015 *-+
TP67971 1764.530764.545.016 *-+
TN67981 1764.530764.548.019 *-+
GG67991 1764.619765.629 1.011 组0507 |
CPT 68001 1764.791764.808.018 --> |
CNT 68011 1764.794764.813.020 OS-> |
TN68021 1764.794764.832.039 *-+
CPT 68031 1764.810764.826.017 --> |
CNT 68041 1764.818764.832.015 --> |
CPT 68051 1764.831764.853.023 --> |
CPT 68061 1764.856764.870.015 --> |
CNT 68071 1764.984764.998.015 OS-> |
TN68081 1764.984765.014.031 *-+
CNT 68091 1765.000765.014.015 --> |
TN68101 1765.075765.089.015 *-+
CNT 68111 1765.431765.446.016 --> |
CNT 68121 1765.456765.473.018 --> |
CNT 68131 1765.479765.494.016 --> |
TN68141 1765.508765.523.016 *-+
TP68151 1765.573765.587.015 *-+
GG68161 1765.775766.044.270 组0508 |
TN68171 1765.822765.837.016 *-+
TP68181 1766.162766.176.015 *-+
TN68191 1766.432766.447.016 *-+
GG68201 1766.603766.812.210 组0509 |
CNT 68211 1766.635766.653.019 OS-> |
TN68221 1766.635766.653.019 *-+
CNT 68231 1766.655766.675.021 --> |
TN68241 1766.863766.878.016 *-+
GG68251 1766.955768.538 1.584 组0510 |
TN68261 1767.682767.700.019 *-+
TP68271 1767.831767.845.015 *-+
TN68281 1768.028768.048.021 *-+
TP68291 1768.033768.049.017 *-+
TN68301 1768.377768.391.015 *-+
GG68311 1768.965769.882.918 组0511 |
TN68321 1769.502769.516.015 *-+
TN68331 1769.541769.555.015 *-+
TP68341 1769.559769.573.015 *-+
GG68351 1769.965770.189.225 组0512 |
TN68361 1770.120770.134.015 *-+
GG68371 1770.194770.406.213 组0513 |
CPT 68381 1770.226770.240.015 --> |
CPT 68391 1770.251770.265.015 --> |
TP68401 1770.251770.268.018 *-+
CPT 68411 1770.347770.363.017 --> |
CPT 68421 1770.365770.379.015 --> |
GG68431 1770.516771.546 1.030 组0514 |
TN68441 1771.564772.071.508 *-+
CNT 68451 1771.564772.086.523 --> |
TP68461 1771.583772.084.502 *-+
GG68471 1771.722771.925.204 组0515 |
TN68481 1772.963772.977.015 *-+
TP68491 1773.358773.387.030 *-+
GG68501 1773.360773.950.591 组0516 |
CPT 68511 1773.399773.483.085 OS-> |
TP68521 1773.399773.483.085 *-*
T1(Id为6644a)的“类型”描述符是“TP”,表示T1靶在双链基因组DNA的负链上。由于T1和T2靶必须出现在同一链上,所以T2(Id为6852)的类型描述符也是“TP”。
上面的T1-T2环图的读法是从T1的*到适合的*右边,然后沿着图下来到第一个*,然后向左到T2的*。当水平线(用-表示)与其它垂直线(用|表示)交叉时,这一点的标记就变为+。当T1-T2环不含这组基因时,则垂直标识符(用|或+表示)就变为@,如下所示
类型 Num Jobno 染 起点 终点 长度基因名称
色
体
TNxx1 1278.386279.148.763 *---*
XXxx1 1278.387278.416.030 * @
XXxx1 1278.421278.450.030 * @
TPxx1 1278.452278.892.441 *---*
组0493(Id为6646)具有类型描述符“GG”。组0516(Id为6847)也一样。
组0493 基因名称 VNG0964C COG_Id COG2469 S 染色体 1 方向正起点 735.009终点 735.881 长度 .873 组0494 基因名称 VNG0965C cheRCOG_Id COG2469 COG1352 S N 染色体 1 1 方向负负 起点 735.910 736.840 终点 736.773 737.544 长度 .864 .705 组0495 基因名称 cheDCOG_Id COG1871 N 染色体 1 方向负 起点 737.643 终点 737.972 长度 .330 组0496 基因名称 VNG0969H cheC1COG_Id COG1776 COG1776 N N 染色体 1 1 方向负负 起点 738.107 739.248 终点 739.246 739.835 长度 1.140 .588 组0497 基因名称 cheACOG_Id COG0643 N 染色体 1 方向负 起点 739.838 终点 741.84 长度 2.007 组0498 基因名称 cheBCOG_Id COG2201 N 染色体 1 方向负 起点 741.846 终点 743.248 长度 1.403 组0499 基因名称 cheW1COG_Id COG0835 N 染色体 1 方向负 起点 743.295 终点 743.831 长度 .537 组0500 基因名称 VNG0978H COG_Id 染色体1 方向 负 起点 743.896 终点 744.489 长度 .594 组0501 基因名称 VNG0979H COG_Id 染色体1 方向 正起点 744.606 终点 745.511 长度 .906 组0502 基因名称 VNG0981C COG_Id COG0436 E 染色体1 方向 正 起点 745.648 终点 746.763 长度 1.116 组0503 基因名称 VNG0982C VNG0983C tRNA-Lys COG_Id COG1873 COG0618 S R 染色体111 方向 正 负 正 起点 746.843 747.151 748.778 终点 747.133 748.605 748.851 长度 .291 1.455 .074 组0504 基因名称 VNG0985H COG_Id 染色体1 方向 正 起点 749.392 终点 751.398 长度 2.007
VNG0986HVNG0987HVNG0988HVNG0989CVNG0990HVNG0991HVNG0992HVNG0993H COG0582L 1 1 1 1 1 1 1 1 正 正 正 负 正 负 负 正 752.276 753.131 754.149 754.459 756.010 756.675 757.409 758.465 752.803 753.547 754.391 755.481 756.183 757.016 758.119 759.277.528.417.243 1.023.174.342.711.813组0505基因名称VNG0994HVNG0995Hboa4COG_IdCOG3413R 染色体111 方向 负 正 正 起点 759.667 760.365 760.682 终点 759.870 760.553 762.487 长度 .204 .1891.806组0506基因名称acs2COG_Id COG0365 I 染色体1 方向 正 起点 762.609 终点 764.612 长度2.004组0507基因名称yaj02COG_Id COG0667 C 染色体1 方向 负 起点 764.619 终点 765.629 长度1.011组0508基因名称VNG0999HCOG_Id 染色体1 方向 负 起点 765.775 终点 766.044 长度 .270组0509基因名称VNG1000HCOG_Id COG3205 S 染色体1 方向 正 起点 766.603 终点 766.812 长度 .210组0510基因名称guaBCOG_Id COG0516 F 染色体1 方向 负 起点 766.955 终点 768.538 长度1.584组0511基因名称VNG1002HCOG_Id 染色体1 方向 正 起点 768.965 终点 769.882 长度 .918组0512基因名称VNG1003HCOG_Id 染色体1 方向 正 起点 769.965 终点 770.189 长度 .225组0513基因名称VNG1005HCOG_Id 染色体1 方向 负 起点 770.194 终点 770.406 长度 .213组0514基因名称tRNA-TrpVNG1006HCOG_Id 染色体11 方向 正 正 起点 770.516 770.827 终点 770.691 771.546 长度 .176 .720组0515基因名称VNG1007HCOG_Id 染色体1 方向 负 起点 771.722 终点 771.925 长度 .204
组0516基因名称flaAla COG_IdCOG1681 N 染色体 1 方向正 起点 773.360 终点 773.950 长度.591
瞬时连接子7341的所有数据都被集中在下表中,它是对连接子的“扼要”描述。连接子关系-总_Id 类型7341 瞬时对照序列-方向 正引发基因-名称flaB1 靶序列-方向 正染色体1COG_IdCOG1681染色体1 C1/C2_Id 6612 起点 731.799 T1_Id 6644a T2-Id 6852 起点 732.401 终点 732.380 起点 734.750 起点 773.399终点732.534长度0.582终点734.942终点773.483长度.134 长度.193长度.085
受控基因位置_Id染色体组名称 COG-Id方向 起点 终点长度123456789101112131415161718192021222324252627281111111111111111111111111111 组0493 组0494 组0494 组0495 组0496 组0496 组0497 组0498 组0499 组0500 组0501 组0502 组0503 组0503 组0504 组0504 组0504 组0504 组0504 组0504 组0504 组0504 组0504 组0505 组0505 组0505 组0506 组0507 VNG0964C VNG0965C cheR cheD VNG0969H cheC1 cheA cheB cheWL VNG0978H VNG0979H VNG0981C VNG0982C VNG0983C VNG0985H VNG0986H VNG0987H VNG0988H VNG0989C VNG0990H VNG0991H VNG0992H VNG0993H VNG0994H VNG0995H boa4 acs2 yaj02 COG2469 COG2469 COG1352 COG1871 COG1776 COG1776 COG0643 COG2201 COG0835COG0436 COG1873 COG0618 COG0582 COG3413 COG0365 COG0667 正 正 负 正 正 负 正 正 正 正 正 正 正 负 正 正 正 正 负 正 负 负 正 正 正 正 正 正 735.009 735.910 737.544 737.643 738.107 739.835 739.838 741.846 743.295 743.896 744.606 745.648 746.843 748.605 749.392 752.276 753.131 754.149 755.481 756.010 757.016 758.119 758.465 759.667 760.365 760.682 762.609 764.619 735.881 737.544 736.840 737.972 739.835 739.248 741.844 743.248 743.831 744.489 745.511 746.763 748.851 747.151 759.277 752.803 753.547 754.391 754.459 756.183 756.675 757.409 759.277 762.487 760.553 762.487 764.612 765.629.873 1.634.705.330 1.728.588 2.007 1.403.537.594.906 1.116 2.008 1.455 9.885.528.417.243 1.023.174.342.711.813 2.820.189 1.806 2.004 1.011
293031323334353637381111111111组0508组0509组0510组0511组0512组0513组0514组0514组0515组0516 VNG0999H VNG1000H guaB VNG1002H VNG1003H VNG1005H tRNA-Trp VNG1006H VNG1007HflaAla COG3205 COG0516COG1681 正 正 正 正 正 正 正 正 正 正 765.775 766.603 766.955 768.965 769.965 770.194 770.516 770.827 771.722 773.360 766.044 766.812 768.538 769.882 770.189 770.406 771.546 771.546 771.925 773.950.270.210 1.584.918.225.213 1.030.720.204.591
受控连接子位置_Id 染色体 C1/C2-Id 方向起点终点长度1234567891011121314151617181920212223242526272829303132333435363738394011111111111111111111111111111111111111116644664766496650665166556657666466726676667766916694669666976713671567166719672167266729673367346745675067516753675467556756675767596760676267646771677367746777正负负负负正正负负负负负负负负正正正正负正正负负负正正正正正正正正正正正正正正正734.735735.378735.403735.767735.789736.325736.345737.782738.562738.989739.007741.368741.388741.533741.552745.865745.888746.140746.162746.259746.453746.469746.919746.941759.552760.774760.798760.878760.897761.496761.516761.542761.576761.601761.933761.953763.283763.306763.346763.362734.749735.364735.389735.753735.775736.339736.359737.752738.517738.975738.992741.352741.374741.519741.538745.879745.902746.155746.176746.229746.467746.483746.905746.927759.509760.789760.814760.892760.912761.510761.533761.557761.597761.617761.950761.968763.304763.321763.360763.376.015.015.015.015.015.015.015.031 046.015.016.017.015.015.015.015.015.016.015.031.015.015.015.015.044.016.017.015.016.015.018.016.022.017.018.016.022.016.015.015
414243444546474849505152535455565758596061626364656667686970111111111111111111111111111111678167826783678467856786678767886790679267936800680168036804680568066807680968116812681368216823683868396841684268456851负正负正负负正负负正正正负正负正正负负负负负负负正正正正负正763.986763.965764.011764.000764.089764.108764.156764.177764.195764.181764.213764.791764.813764.810764.832764.831764.856764.998765.014765.446765.473765.494766.653766.675770.226770.251770.347770.365772.086773.399 763.965 763.995 763.990 764.015 764.075 764.093 764.171 764.156 764.181 764.204 764.227 764.808 764.794 764.826 764.818 764.853 764.870 764.984 765.000 765.431 765.456 765.479 766.635 766.655 770.240 770.265 770.363 770.379 771.564 773.483.022.031.022.016.015.016.016.022.015.024.015.018.020.017.015.023.015.015.015.016.018.016.019.021.015.015.017.015.523.085
加入表2类型15的合成的虚拟连接子
通过修饰4838.155kb-4838.323kb之间长度为0.169kb的DNA双链序列可将类型15的合成的虚拟连接子引入绿脓杆菌(P.aeruginosa)的基因组,其中,C1和C2是天然元件,T1是天然元件,T2是合成元件。
为创建这个类型14的合成连接子的例子,将天然连接子23295的T2序列(老位置是4848.679kb-4939.847kb)拷贝入上述新位置。
连接子28739是这种合成的瞬时连接子的一个例子。它可被描述为
C1/C2 T1-T2
总_Id染色体 C1_IdC2_Id染色体 T1_IdT2_Id 连接子类型
287391534645346415353153569 瞬时
瞬时连接子28739的C1/C2来源表示在表1中,如下
类型 NumJobno 染色体 起点 终点 长度基因名称
CPT534641 1 4832.718 4832.838 .121-> ||||||||||||||||||
这种瞬时C1/C2连接子来源的“类型”描述符是“CPT”。字母“P”表示C1/C2连接子来源发生在基因组双链DNA的正链上。字母“N”表示C1/C2连接子来源发生在基因组双链DNA的负链上。字母“T”表示“瞬时”连接子。同样,字母“P”表示永久连接子,这将在后面的实施例中出现。这些实施例中的“起点”、“终点”和“长度”描述符的单位是千碱基(KB)。
瞬时连接子28739的T1-T2靶显示在表1中,如下
染
类型 Num Jobno 色 起点 终点 长度基因名称
体
TP535311 14836.528 4836.721.194*-*
CPT 535321 14836.728 4836.746.019OS-> |
TP535331 14836.728 4836.746.019*-+
TN535341 14836.728 4836.779.052*-+
CPT 535351 14836.748 4836.779.032OS-> |
TP535361 14836.748 4836.779.032*-+
CPT 535371 14836.781 4836.821.041OS-> |
TP535381 14836.781 4836.821.041*-+
TN535391 14836.781 4836.918.138*-+
TP535401 14836.840 4836.855.016*-+
CPT 535411 14836.877 4836.918.042OS-> |
TP535421 14836.877 4836.918.042*-+
TP535431 14836.940 4836.957.018*-+
CPT 535441 14836.940 4836.982.043OS-> |
CPT 535451 14836.990 4837.123.134OS-> |
TP535461 14836.990 4837.123.134*-+
TN535471 14836.990 4837.153.164*-+
CPT 535481 14837.126 4837.148.023 --> |
TP535491 14837.129 4837.153.025*-+
TP53549a 1 14838.155 4838.323.169*-*
T1(Id为53531)的“类型”描述符是“TP”,表示T1靶在双链基因组DNA的负链上。由于T1和T2靶必须出现在同一链上,所以T2(Id为53549a)的类型描述符也是“TP”。
上面的T1-T2环图的读法是从T1的*到适合的*右边,然后沿着图下来到第一个*,然后向左到T2的*。当水平线(用-表示)与其它垂直线(用|表示)交叉时,这一点的标记就变为+。当T1-T2环不含这组基因时,则垂直标识符(用|或+表示)就变为@,如下所示
染
类型 Num Jobno 色起点 终点 长度基因名称
体
TNxx1 1278.386279.148.763 *---*
XXxx1 1278.387278.416.030 * @
XXxx1 1278.421278.450.030 * @
TPxx1 1278.452278.892.441 *---*
由于这种合成连接子是虚拟的连接子,故而没有这种连接子控制的基因组。相反,这六种单触发连接子(类型描述符“CPT”的Id为53532、53535、53537、53541、53544和53544)和一种瞬时连接子(类型描述符“CPT”的Id为53548)C1/C2的表达是受这种连接子控制的。
瞬时连接子28739的所有数据都被集中在下表中,它是对连接子的“扼要”描述。 连接子关系-总_Id 类型28739 瞬时对照序列-方向 正引发基因-名称 pctC 靶序列-方向 正 受控基因无染色体1COG_IdCOG0840染色体1 C1/C2_Id 53464 起点 4831.371 T1_Id 53531 T2-Id 53549a 起点 4832.718 终点 4833.269 起点 4836.528 起点 4838.155终点4832.838长度1.899终点4826.721终点4838.323长度.121 长度.194长度.169
受控连接子位置_Id染色体 C1/C2-Id 方向起点终点长度1234567891011111111111115353253535535375354153544535455354853551535525355453557正正正正正正正正正正正 4836.728 4836.748 4836.781 4836.877 4836.940 4836.990 4837.126 4837.419 4837.572 4837.962 4838.217 4836.746 4836.779 4836.821 4836.918 4836.982 4837.123 4837.148 4837.448 4837.622 4837.999 4838.258.019.032.041.042.043.134.023.030.051.038.042
121314151111 53559 53563 53564 53567 正 正 正 正 4838.295 4838.457 4838.478 4838.654 4838.362 4838.476 4838.645 4838.847.068.020.168.194
DBP形成的合成连接子
通过引入识别序列
tccccatgag catagatatg caggtaggcg gcaagt的12-结构域锌指蛋白可在霍乱弧菌(V.cholera)基因组中引入合成的连接子。
连接子7580是这种合成的瞬时连接子的一个例子。
C1/C2 T1-T2
总_Id 染色体C1_IdC2_Id 染色体T1_IdT2_Id 连接子类型
75801 合成的 DBP 1 607 646 瞬时
瞬时连接子7580的T1-T2靶显示在表1中,如下
染
类型Num Jobno 色起点 终点 长度 基因名称
体
TN6071 1952.642952.777.136 *-++++*+++*+++++++*+*++++**++++
TP6081 1952.648952.777.130 *-++++-+++-*+++*+*-++*++++-++++
GG6091 1952.846954.393 1.548 组0127 |||| ||| ||| | || |||| ||||
TN6101 1954.486954.587.102 *-++++*+++*-+++-+-*+*-++*+**+++
TP6111 1954.486954.587.102 *-+++++++++**++*+*++-**+-++-+*+
CNT 6121 1954.497954.589.093 OS-> |||||||||| ||||||| | | || | |
CPT 6131 1954.503954.520.018 --> |||||||||| ||||||| | | || | |
CPT 6141 1954.522954.588.067 --> |||||||||| ||||||| | | || | |
TP6151 1954.601954.658.058 *-++++++++++*+++++++*+*+*++-+-*
TN6161 1954.602954.658.057 *-+++++++++++++++++*+++++*+***-
CNT 6171 1954.616954.658.043 --> ||||||||||||||||| ||||| || |
CPT 6181 1954.624954.639.016 --> ||||||||||||||||| ||||| || |
CPT 6191 1954.641954.658.018 --> ||||||||||||||||| ||||| || |
GG6201 1954.684958.635 3.951 组0128 ||||||||||||||||| ||||| || |
GP6211 1955.956956.342.387 VC0897 ||||||||||||||||| ||||| || |
CPT 6221 1956.873956.887.015 --> ||||||||||||||||| ||||| || |
CPT 6231 1956.896956.910.015 --> ||||||||||||||||| ||||| || |
TN6241 1958.089958.103.015 *-+*||||||||||||||| ||||| || |
GG6251 1958.840972.992 14.152 组0129 | ||||||||||||||| ||||| || |
GP6261 1971.304972.992 1.689 VC0911 | ||||||||||||||| ||||| || |
TP6271 1973.170973.250.081 *-+*||||||||||||||| ||||| || |
GG6281 1973.171973.763.592 组0130 ||||||||||||||||| ||||| || |
CPT 6291 1973.339973.434.096 OS-> ||||||||||||||||| ||||| || |
CPT 6301 1973.508973.603.096 OS-> ||||||||||||||||| ||||| || |
TP6311 1973.693973.773.081 *-+*||||||||||||||| ||||| || |
GG6321 1973.767996.501 22.734 组0131 | ||||||||||||||| ||||| || |
GP63311974.049978.217 4.169 VC0913 | ||||||||||||||| ||||| || |
CPT 63411977.711977.725.015 --> | ||||||||||||||| ||||| || |
CPT 63511977.732977.746.015 --> | ||||||||||||||| ||||| || |
GP63611986.166990.921 4.756 VC0923 | ||||||||||||||| ||||| || |
CPT 63711986.862986.877.016 --> | ||||||||||||||| ||||| || |
CPT 63811986.885986.899.015 --> | ||||||||||||||| ||||| || |
TN63911996.556996.577.022 *-+**|||||||||||||| ||||| || |
TP64011996.556996.577.022 *-++-+++*++++++++++*||||| || |
GG64111996.656 1005.792 9.136 组0132 || ||| |||||||||||||||| || |
GP64211 1002.462 1005.792 3.331 VC0937 || ||| |||||||||||||||| || |
TP64311 1005.810 1005.874.065 *-++*+++*++*+*+++++++++++*++*+*
CNT 64411 1005.810 1005.921.112 OS-> ||||||||| | |||||||||||||||||
CPT 64511 1005.810 1005.926.117 --> ||||||||| | |||||||||||||||||
TN64611 1005.810 1005.926.117 *-++++*++++*+*+++++++++*+++*+++
组0127-组0132描述在表2中,如下组0127 基因名称VC0894COG_Id COG0607 P 染色体1 方向 正 起点 952.846 终点 954.393 长度1.548组0128 基因名称VC0895VC0896VC0897VC0898VC0899COG_IdCOG0583 COG2363 COG0258 COG1611 K S L R 染色体11111 方向 负 正 正 负 负 起点 954.684 955.014 955.956 956.372 957.262 终点 954.860 955.934 956.342 957.223 958.635 长度 .177 .921 .387 .8521.374组0129 基因名称VC0900VC0901VC0902VC0903VC0904VC0905VC0906VC0908VC0909VC0910VC0911 COG_IdCOG2199COG0457COG0780COG1464 COG2011 COG0241 COG1609 COG1263 COG0366 T R R M R E K G G 染色体11111111111 方向 负 负 负 正 正 负 负 正 正 正 正 起点 958.840 960.516 962.792 963.686 964.284 965.193 966.039 967.976 968.601 969.788 971.304 终点 960.414 962.777 963.655 964.282 965.060 966.020 967.740 968.536 969.551 971.224 972.992 长度1.5752.262 .864 .597 .777 .8281.702 .561 .9511.4371.689组0130 基因名称tRNA-Tyr-2tRNA-Tyr-3tRNA-Tyr-4tRNA-Tyr-5COG_Id染色体1111 方向 正 正 正 正 起点 973.171 973.340 973.509 973.679 终点 973.255 973.424 973.593 973.763 长度 .085 .085 .085 .085组0131 基因名称COG_Id 染色体 方向 起点 终点 长度
VC0912VC0913VC0915VC0916VC0917VC0918VC0923VC0928VC0929VC0930 COG0845 COG0394 COG0381 COG0677 COG1045 Q T M M E1111111111 正 正 正 正 正 正 正 正 负 正 973.767 974.049 978.272 978.644 979.457 980.595 986.166 991.117 992.138 993.628 973.862 978.217 978.382 979.144 980.575 986.155 990.921 991.932 993.364 996.501.096 4.169.111.501 1.119 5.561 4.756.816 1.227 2.874组0132 基因名称VC0931VC0932VC0934VC0935VC0936VC0937COG_Id COG3307 COG2148 COG1596 COG3206 M M M N 染色体 1 1 1 1 1 1 方向 负 负 正 正 正 正 起点 996.656 998.148 999.242 1000.710 1001.910 1002.462终点 997.972 998.752 1000.639 1001.906 1002.437 1005.792 长度1.317 .6051.3981.197 .5283.331
瞬时连接子7580的所有数据都被集中在下表中,它是对连接子的“扼要”描述。 连接子关系-总_Id 类型 7580 瞬时对照序列-识别序列tccccatgag catagatatg caggtaggcg gcaagt的合成的DNA结合蛋白靶序列-方向 正染色体1T1_Id607T2-Id646起点952.777起点1005.926终点952.642终点1005.810长度.136长度.117
受控基因位置_Id染色体组名称 COG-Id方向起点终点长度123456789101112131415161111111111111111 组0127 组0128 组0128 组0128 组0128 组0128 组0129 组0129 组0129 组0129 组0129 组0129 组0129 组0129 组0129 组0129 VC0894 VC0895 VC0896 VC0897 VC0898 VC0899 VC0900 VC0901 VC0902 VC0903 VC0904 VC0905 VC0906 VC0908 VC0909 VC0910 COG0607 COG0583 COG2363 COG0258 COG1611 COG2199 COG0457 COG0780 COG1464 COG2011 COG0241 COG1609 COG1263 正 正 正 正 负 负 正 负 负 正 正 负 负 正 正 正952.846954.684955.014955.956957.223958.635958.840962.777963.655963.686964.284966.020967.740967.976968.601969.788954.393958.635955.934956.342956.372957.262972.992960.516962.792964.282965.060965.193966.039968.536969.551971.224 1.548 3.951.921.387.852 1.374 14.152 2.262.864.597.777.828 1.702.561.951 1.437
171819202122232425262728293031323334111111111111111111组0129组0130组0131组0131组0131组0131组0131组0131组0131组0131组0131组0131组0132组0132组0132组0132组0132组0132 VC0911tRNA-Tyr- VC0912 VC0913 VC0915 VC0916 VC0917 VC0918 VC0923 VC0928 VC0929 VC0930 VC0931 VC0932 VC0934 VC0935 VC0936 VC0937 COG0366 COG0845 COG0394 COG0381 COG0677 COG1045COG3307 COG2148 COG1596 COG3206正正正正正正正正正正负正正负正正正正 971.304 973.171 973.767 974.049 978.272 978.644 979.457 980.595 986.166 991.117 993.364 993.628 996.656 998.752 999.2421000.7101001.9101002.462 972.992 973.763 996.501 978.217 978.382 979.144 980.575 986.155 990.921 991.932 992.138 996.501 1005.792 998.148 1000.639 1001.906 1002.437 1005.7921.689 .592 22.7344.169 .111 .5011.1195.5614.756 .8161.2272.8749.136 .6051.3981.197 .5283.331
受控连接子位置_Id染色体C1/C2-Id 方向起点终点长度123456789101112131415161111111111111111612613614617618619622623629630634635637638644645负正正负正正正正正正正正正正负正 954.589 954.503 954.522 954.658 954.624 954.641 956.873 956.896 973.339 973.508 977.711 977.732 986.862 986.885 1005.921 1005.810 954.497 954.520 954.588 954.616 954.639 954.658 956.887 956.910 973.434 973.603 977.725 977.746 986.877 986.899 1005.810 1005.926.093.018.067.043.016.018.015.015.096.096.015.015.016.015.112.117
PNA形成的合成连接子
通过引入识别序列
tccccatgag catagatatg caggtaggcg gcaagt的PNA可在霍乱弧菌(V.cholera)基因组中引入合成的连接子。
连接子7581是这种合成的瞬时连接子的一个例子。
C1/C2 T1-T2
总_Id 染色体C1_IdC2_Id染色体 T1_Id T2_Id 连接子类型
75811 合成的 PNA 1607 646 瞬时
瞬时连接子7581的T1-T2靶显示在表1中,如下
类型 NumJobno 染 起点 终点 长度基因名称
色
体
TN6071 1952.642952.777.136 *-++++*+++*+++++++*+*++++**++++
TP6081 1952.648952.777.130 *-++++-+++-*+++*+*-++*++++-++++
GG6091 1952.846954.393 1.548 组0127 |||| ||| ||| | || |||| ||||
TN6101 1954.486954.587.102 *-++++*+++*-+++-+-*+*-++*+**+++
TP6111 1954.486954.587.102 *-+++++++++**++*+*++-**+-++-+*+
CNT 6121 1954.497954.589.093 OS-> |||||||||| ||||||| | | || | |
CPT 6131 1954.503954.520.018 --> |||||||||| ||||||| | | || | |
CPT 6141 1954.522954.588.067 --> |||||||||| ||||||| | | || | |
TP6151 1954.601954.658.058 *-++++++++++*+++++++*+*+*++-+-*
TN6161 1954.602954.658.057 *-+++++++++++++++++*+++++*+***-
CNT 6171 1954.616954.658.043 --> ||||||||||||||||| ||||| || |
CPT 6181 1954.624954.639.016 --> ||||||||||||||||| ||||| || |
CPT 6191 1954.641954.658.018 --> ||||||||||||||||| ||||| || |
GG6201 1954.684958.635 3.951 组0128 ||||||||||||||||| ||||| || |
GP6211 1955.956956.342.387 VC0897 ||||||||||||||||| ||||| || |
CPT 6221 1956.873956.887.015 --> ||||||||||||||||| ||||| || |
CPT 6231 1956.896956.910.015 --> ||||||||||||||||| ||||| || |
TN6241 1958.089958.103.015 *-+*||||||||||||||| ||||| || |
GG6251 1958.840972.992 14.152 组0129 | ||||||||||||||| ||||| || |
GP6261 1971.304972.992 1.689 VC0911 | ||||||||||||||| ||||| || |
TP6271 1973.170973.250.081 *-+*||||||||||||||| ||||| || |
GG6281 1973.171973.763.592 组0130 ||||||||||||||||| ||||| || |
CPT 6291 1973.339973.434.096 OS-> ||||||||||||||||| ||||| || |
CPT 6301 1973.508973.603.096 OS-> ||||||||||||||||| ||||| || |
TP6311 1973.693973.773.081 *-+*||||||||||||||| ||||| || |
GG6321 1973.767996.501 22.734 组0131 | ||||||||||||||| ||||| || |
GP6331 1974.049978.217 4.169 VC0913 | ||||||||||||||| ||||| || |
CPT 6341 1977.711977.725.015 --> | ||||||||||||||| ||||| || |
CPT 6351 1977.732977.746.015 --> | ||||||||||||||| ||||| || |
GP6361 1986.166990.921 4.756 VC0923 | ||||||||||||||| ||||| || |
CPT 6371 1986.862986.877.016 --> | ||||||||||||||| ||||| || |
CPT 6381 1986.885986.899.015 --> | ||||||||||||||| ||||| || |
TN6391 1996.556996.577.022 *-+**|||||||||||||| ||||| || |
TP6401 1996.556996.577.022 *-++-+++*++++++++++*||||| || |
GG6411 1996.656 1005.792 9.136 组0132 || ||| |||||||||||||||| || |
GP6421 1 1002.462 1005.792 3.331 VC0937 || ||| |||||||||||||||| || |
TP6431 1 1005.810 1005.874.065 *-++*+++*++*+*+++++++++++*++*+*
CNT 6441 1 1005.810 1005.921.112 OS-> ||||||||| | |||||||||||||||||
CPT 6451 1 1005.810 1005.926.117 --> ||||||||| | |||||||||||||||||
TN6461 1 1005.810 1005.926.117 *-++++*++++*+*+++++++++*+++*+++
组0127-组0132描述在表2中,如下组0127 基因名称VC0894COG_Id COG0607 P 染色体 1 方向 正 起点 952.846 终点 954.393 长度 1.548
组0128基因名称VC0895VC0896VC0897VC0898VC0899 COG_Id COG0583 COG2363 COG0258 COG1611 K S L R 染色体 1 1 1 1 1 方向 负 正 正 负 负 起点 954.684 955.014 955.956 956.372 957.262 终点 954.860 955.934 956.342 957.223 958.635 长度 .177 .921 .387 .852 1.374组0129基因名称VC0900VC0901VC0902VC0903VC0904VC0905VC0906VC0908VC0909VC0910VC0911 COG_Id COG2199 COG0457 COG0780 COG1464 COG2011 COG0241 COG1609 COG1263 COG0366 T R R M R E K G G 染色体 1 1 1 11 1 1 1 1 1 1 方向 负 负 负 正 正 负 负 正 正 正 正 起点 958.840 960.516 962.792 963.686 964.284 965.193 966.039 967.976 968.601 969.788 971.304 终点 960.414 962.777 963.655 964.282 965.060 966.020 967.740 968.536 969.551 971.224 972.992 长度 1.575 2.262 .864 .597 .777 .828 1.702 .561 .951 1.437 1.689组0130基因名称tRNA-Tyr-2tRNA-Tyr-3tRNA-Tyr-4tRNA-Tyr-5 COG_Id 染色体 1 1 1 1 方向 正 正 正 正 起点 973.171 973.340 973.509 973.679 终点 973.255 973.424 973.593 973.763 长度 .085 .085 .085 .085组0131基因名称VC0912VC0913VC0915VC0916VC0917VC0918VC0923VC0928VC0929VC0930 COG_Id COG0845 COG0394 COG0381 COG0677 COG1045 Q TMME 染色体 1 1 1 1 1 1 1 1 1 1 方向 正 正 正 正 正 正 正 正 负 正 起点 973.767 974.049 978.272 978.644 979.457 980.595 986.166 991.117 992.138 993.628 终点 973.862 978.217 978.382 979.144 980.575 986.155 990.921 991.932 993.364 996.501 长度 .096 4.169 .111 .501 1.119 5.561 4.756 .816 1.227 2.874组0132基因名称VC0931VC0932VC0934VC0935VC0936VC0937 COG_Id COG3307 COG2148 COG1596 COG3206 M M MN 染色体 1 1 1 1 1 1 方向 负 负 正 正 正 正 起点 996.656 998.148 999.242 1000.710 1001.910 1002.462 终点 997.972 998.752 1000.639 1001.906 1002.437 1005.792 长度 1.317 .605 1.398 1.197 .528 3.331
瞬时连接子7581的所有数据都被集中在下表中,它是对连接子的“扼要”描述。
连接子关系-总_Id 类型 7581 瞬时对照序列-识别序列tccccatgag catagatatg caggtaggcg gcaagt的合成的PNA靶序列-方向 正染色体1 T1_Id 607 T2-Id 646 起点 952.777 起点 1005.926终点952.642终点1005.810长度.136长度.117
受控基因位置_Id染色体组名称 COG_Id方向起点终点长度123456789101112131415161718192021222324252627282930313233341111111111111111111111111111111111组0127组0128组0128组0128组0128组0128组0129组0129组0129组0129组0129组0129组0129组0129组0129组0129组0129组0130组0131组0131组0131组0131组0131组0131组0131组0131组0131组0131组0132组0132组0132组0132组0132组0132 VC0894 VC0895 VC0896 VC0897 VC0898 VC0899 VC0900 VC0901 VC0902 VC0903 VC0904 VC0905 VC0906 VC0908 VC0909 VC0910 VC0911 tRNA-Tyr- VC0912 VC0913 VC0915 VC0916 VC0917 VC0918 VC0923 VC0928 VC0929 VC0930 VC0931 VC0932 VC0934 VC0935 VC0936 VC0937 COG0607 COG0583 COG2363 COG0258 COG1611 COG2199 COG0457 COG0780 COG1464 COG2011 COG0241 COG1609 COG1263 COG0366 COG0845 COG0394 COG0381 COG0677 COG1045COG3307 COG2148 COG1596 COG3206 正 正 正 正 负 负 正 负 负 正 正 负 负 正 正 正 正 正 正 正 正 正 正 正 正 正 负 正 正 负 正 正 正 正 952.846 954.684 955.014 955.956 957.223 958.635 958.840 962.777 963.655 963.686 964.284 966.020 967.740 967.976 968.601 969.788 971.304 973.171 973.767 974.049 978.272 978.644 979.457 980.595 986.166 991.117 993.364 993.628 996.656 998.752 999.242 1000.710 1001.910 1002.462 954.393 958.635 955.934 956.342 956.372 957.262 972.992 960.516 962.792 964.282 965.060 965.193 966.039 968.536 969.551 971.224 972.992 973.763 996.501 978.217 978.382 979.144 980.575 986.155 990.921 991.932 992.138 996.501 1005.792 998.148 1000.639 1001.906 1002.437 1005.792 1.548 3.951.921.387.852 1.374 14.152 2.262.864.597.777.828 1.702.561.951 1.437 1.689.592 22.734 4.169.111.501 1.119 5.561 4.756.816 1.227 2.874 9.136.605 1.398 1.197.528 3.331
受控连接子
位置_Id染色体C1/C2-Id方向起点终点长度
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 161111111111111111612613614617618619622623629630634635637638644645负正正负正正正正正正正正正正负正 954.589 954.503 954.522 954.658 954.624 954.641 956.873 956.896 973.339 973.508 977.711 977.732 986.862 986.885 1005.921 1005.810 954.497 954.520 954.588 954.616 954.639 954.658 956.887 956.910 973.434 973.603 977.725 977.746 986.877 986.899 1005.810 1005.926.093.018.067.043.016.018.015.015.096.096.015.015.016.015.112.117
由一对连锁的DNA结合靶标形成的合成连接子
通过引入识别序列
G1 cccgacacaacctgc和
G2 cccggggttcccgag的一对连锁的DNA结合靶标在敏捷气垫菌(A.pernix)基因组中引入合成的连接子。
连接子917是这种合成的瞬时连接子的一个例子。
C1/C2 T1-T2
总_Id染色体C1_IdC2_Id染色体T1_IdT2_Id连接子类型
917 1 G1 G2 1 218 295 瞬时
瞬时connectron917的T1-T2靶显示在表1中,如下
染
类型 Num Jobno 色起点 终点 长度基因名称
体
TN218 1 1284.008284.071.064 *-+*+-++*|||| ||| |
TP219 1 1284.008284.071.064 *-+++*|| |||| ||| |
CPT 220 1 1284.009284.071.063 --> |||||| |||| ||| |
CNT 221 1 1284.073284.144.072 --> |||||| |||| ||| |
CPT 222 1 1284.073284.145.073 --> |||||| |||| ||| |
TP223 1 1284.073284.160.088 *-++++++*++++*||| |
TN224 1 1284.073284.251.179 *-+++++++++++++++**+*
CNT 225 1 1284.158284.251.094 --> |||||||||||||||||||
CPT 226 1 1284.158284.251.094 --> |||||||||||||||||||
TP227 1 1284.162284.251.090 *-+++++++++++++++++++**
CPT 228 1 1284.253284.280.028 --> |||||||||||||||||||||
TN229 1 1284.253284.305.053 *-+++++++++++++++++++++*
TP230 1 1284.253284.316.064 *-++++++++++++++++++++++**
CPT 231 1 1284.283284.305.023 --> ||||||||||||||||||||||||
GG232 1 1284.391287.510 3.120 组0053 ||||||||||||||||||||||||
TN233 1 1286.094286.108.015 *-++++++++++++++++++++++++*
GG234 1 1287.521291.639 4.118 组0054 |||||||||||||||||||||||||
TP235 1 1288.611288.625.015 *-+++++*|||||||||||||||||||
GG236 1 1291.643295.139 3.496 组0055 ||||| |||||||||||||||||||
TP237 1 1295.230295.259.030 *-+++++*|||||||||||||||||||
GG238 1 1295.231295.529.298 组0056 |||||||||||||||||||||||||
GP239 1 1295.342295.518.177 APES013|||||||||||||||||||||||||
CPT 240 1 1295.415295.444.030 --> |||||||||||||||||||||||||
TP241 1 1295.417295.444.028 *-+++++++++*+++++++++++++++*
GG242 1 1295.572296.676 1.104 组0057 ||||||||| ||||||||||||||||
TN243 1 1296.080296.095.016 *-+++++++++*||||||||||||||||
TN244 1 1296.913296.927.015 *-++++++++++++++++++++++++++*
GG245 1 1297.071298.857 1.786 组0058 |||||||||||||||||||||||||||
TP246 1 1298.617298.631.015 *-+++++++++++++++++++++++++++*
GG247 1 1298.856305.941 7.085 组0059 ||||||||||||||||||||||||||||
CNT 248 1 1300.742300.757.016 --> ||||||||||||||||||||||||||||
CNT 249 1 1300.767300.781.015 --> ||||||||||||||||||||||||||||
GN250 1 1301.243303.153 1.911 APE0428||||||||||||||||||||||||||||
TN251 1 1301.733301.748.016 *-++++++++++++*+++++++++++++++*
GP252 1 1305.005305.611.607 APE0434|||||||||||| ||||||||||||||||
CPT 253 1 1305.334305.348.015 --> |||||||||||| ||||||||||||||||
CPT 254 1 1305.358305.372.015 --> |||||||||||| ||||||||||||||||
CNT 255 1 1305.552305.566.015 --> |||||||||||| ||||||||||||||||
TN256 1 1305.562305.576.015 *-++++++++++++*||||||||||||||||
CNT 257 1 1305.568305.582.015 --> |||||||||||||||||||||||||||||
GG258 1 1306.121308.859 2.738 组0060 |||||||||||||||||||||||||||||
TP259 1 1307.532307.547.016 *-+++++++++++++++++++++++++++++
TN260 1 1307.814307.828.015 *-+++++++++++++++++++++++++++++
TN261 1 1308.559308.573.015 *-+++++++++++++++++++++++++++++
GG262 1 1308.989312.190 3.201 组0061 |||||||||||||||||||||||||||||
TN263 1 1311.735311.750.016 *-+++++++++++++++++++++++++++++
GG2641 1312.215313.258 1.043 组0062 |||||||||||||||||||||||||||||
TP2651 1312.894312.909.016 *-+++++++++++++++++++++++++++++
GG2661 1313.378315.728 2.350 组0063 |||||||||||||||||||||||||||||
TN2671 1314.051314.065.015 *-+++++++++++++++++++++++++++++
TN2681 1314.826314.840.015 *-+++++++++++++++++++++++++++++
TN2691 1315.511315.525.015 *-+++++++++++++++++++++++++++++
TP2701 1315.747315.761.015 *-+++++++++++++++++++++++++++++
GG2711 1315.792318.996 3.204 组0064 |||||||||||||||||||||||||||||
GP2721 1317.638318.996 1.359 APE0457|||||||||||||||||||||||||||||
CNT 2731 1317.668317.682.015 --> |||||||||||||||||||||||||||||
TP2741 1317.689317.703.015 *-+++++++++++++++++++++++++++++
CNT 2751 1317.690317.704.015 --> |||||||||||||||||||||||||||||
GG2761 1318.432318.914.483 组0065 |||||||||||||||||||||||||||||
CPT 2771 1319.097319.127.031 --> |||||||||||||||||||||||||||||
TN2781 1319.122319.137.016 *-+++++++++++++++++++++++++++++
GG2791 1319.335319.673.339 组0066 |||||||||||||||||||||||||||||
TN2801 1319.515319.529.015 *-+++++++++++++++++++++++++++++
TP2811 1319.572319.586.015 *-+++++++++++++++++++++++++++++
GG2821 1319.733324.526 4.793 组0067 |||||||||||||||||||||||||||||
CNT 2831 1320.484320.513.030 --> |||||||||||||||||||||||||||||
GN2841 1320.700322.241 1.542 APE0462|||||||||||||||||||||||||||||
TN2851 1323.674323.688.015 *-++++++++*||||||||||||||||||||
GG2861 1324.030324.335.306 组0068 |||||||||||||||||||||||||||||
TN2871 1324.137324.151.015 *-++++++++-++++++++++++++++++++
GG2891 1324.606325.575.969 组0069 |||||||||||||||||||||||||||||
GP2891 1325.141325.575.435 APE0469|||||||||||||||||||||||||||||
CNT 2901 1325.950325.979.030 --> |||||||||||||||||||||||||||||
CPT 2911 1325.950325.979.030 --> |||||||||||||||||||||||||||||
TN2921 1325.959325.975.017 *-++++++++-+*++++++++++++++++++
GG2931 1325.980326.717.738 组0070 |||||||||||||||||||||||||||||
CNT 2941 1326.716326.878.163 OS-> |||||||||||||||||||||||||||||
TN2951 1326.716326.878.163 *-+*+++++*-+-++++*|||||||||||||
T1(Id为218)的“类型”描述符是“TN”,表示T1靶在双链基因组DNA的负链上。由于T1和T2靶必须出现在同一链上,所以T2(Id为295)的类型描述符也是“TN”。
组0053-组0070描述在表2中,如下 组0053 基因名称 APE0413 COG_Id COG0553 K 染色体 1 方向 负 起点 284.391 终点 287.510 长度3.120 组0054 基因名称 APE0414 APE0415 COG_Id COG1483 R 染色体 1 1 方向 负 负 起点 287.521 288.073 终点 288.066 291.639 长度 .5463.567 组0055 基因名称 APE0416 APE0417 APE0418 COG_Id COG1743 L 染色体 1 1 1 方向 负 正 正 起点 291.643 292.319 294.690 终点 294.666 292.636 295.139 长度3.024 .318 .450
组0056基因名称tRNA-ThrAPES013tRNA-Met COG_Id 染色体111 方向 正 正 正 起点 295.231 295.342 295.405 终点 295.325 295.518 295.529 长度 .095 .177 .125组0057基因名称APES014APE0419 COG_Id 染色体11 方向 负 负 起点 295.572 295.891 终点 295.754 296.676 长度 .183 .786组0058基因名称APE0420APE0422APE0423 COG_IdCOG0084L 染色体111 方向 正 负 负 起点 297.071 297.448 298.099 终点 298.113 297.993 298.857 长度 1.043 .546 .759组0059基因名称APE0424APE0425APE0426APE0427APE0428APE0429APE0430APE0431APE0432APE0434APE0436 COG_IdCOG2246 COG1573 COG1750 COG1093S L R J 染色体11111111111 方向 正 负 正 正 负 正 负 正 负 正 负 起点 298.856 298.973 299.481 300.649 301.243 303.244 303.403 303.833 304.284 305.005 305.192 终点 299.269 299.332 300.602 301.296 303.153 303.786 303.720 304.911 304.688 305.611 305.941 长度 .414 .360 1.122 .648 1.911 .543 .318 1.079 .405 .607 .750组0060基因名称APES015APES016APE0437APE0439 COG_Id COG2051 COG1631 J J 染色体1111 方向 负 负 负 正 起点 306.121 306.359 306.674 307.209 终点 306.342 306.550 308.859 307.841 长度 .222 .192 2.186 .633组0061基因名称APES017APE0442APES018APE0443APE0444APE0445 COG_Id COG1594 COG1761 COG3286 COG1096 K K S J 染色体111111 方向 负 负 负 负 负 负 起点 308.989 309.201 309.642 309.915 310.227 310.912 终点 309.186 309.515 309.842 310.223 310.832 312.190 长度 .198 .315 .201 .309 .606 1.279组0062基因名称APE0447APE0448 COG_Id COG1736 J 染色体11 方向 负 正 起点 312.215 312.650 终点 313.237 313.258 长度 1.023 .609组0063
基因名称APE0449APE0450APE0451 COG_Id COG0197 COG0303 J H 染色体 1 1 1 方向负正负起点 313.378 313.995 314.028终点 313.902 315.728 314.714 长度 .525 1.734 .687组0064基因名称APES019APE0452APE0453APE0454APE0456APE0457 COG_IdCOG1489 COG0160G E 染色体111111 方向 负 负 正 负 负 正 起点 315.792 316.237 316.247 316.820 317.632 317.638 终点 315.986 316.791 317.576 317.542 318.099 318.996 长度 .195 .555 1.330 .723 .468 1.359组0065基因名称APE0458 COG_Id 染色体1 方向 负 起点 318.432 终点 318.914 长度 .483组0066基因名称APE0459 COG_Id 染色体1 方向 负 起点 319.335 终点 319.673 长度 .339组0067基因名称APE0460APE0461APE0462APE0463APE0464APE0465 COG_Id COG1591 COG1855 COG0301 L R H 染色体111111 方向 正 正 负 正 正 负 起点 319.733 320.272 320.700 321.610 322.317 323.288 终点 320.038 320.703 322.241 322.074 323.228 324.526 长度 .306 .432 1.542 .465 .912 1.239组0068基因名称APE0466 COG_Id 染色体1 方向 正 起点 324.030 终点 324.335 长度 .306组0069基因名称APE0468APE0469 COG_Id COG1318 K 染色体11 方向 正 正 起点 324.606 325.141 终点 325.049 325.575 长度 .444 .435组0070基因名称APE0470 COG_Id COG1277 R 染色体1 方向 负 起点 325.980 终点 326.717 长度 .738
瞬时连接子7581的所有数据都被集中在下表中,它是对连接子的“扼要”描述。
连接子关系-总_Id 类型
7581 瞬时
对照序列-识别序列G1=cccgacacaacctgc和G2=cccggggttcccgag的一对合成的连锁DNA结合靶标
靶序列-方向染色体T1_Id起点终点长度
负1218 284.071284.008.064
T2-Id起点 终点 长度
295 326.878326.716.163
受控基因位置_Id染色体组名称 COG-Id 方向起点终点长度123456789101112131415161718192021222324252627282930313233343536373839404142434445461111111111111111111111111111111111111111111111组0053组0054组0054组0055组0055组0055组0056组0056组0057组0057组0058组0058组0058组0059组0059组0059组0059组0059组0059组0059组0059组0059组0059组0059组0060组0060组0060组0060组0061组0061组0061组0061组0061组0061组0062组0062组0063组0063组0063组0064组0064组0064组0064组0064组0064组0065 APE0413 APE0414 APE0415 APE0416 APE0417 APE0418 tRNA-Thr APES013 APES014 APE0419 APE0420 APE0422 APE0423 APE0424 APE0425 APE0426 APE0427 APE0428 APE0429 APE0430 APE0431 APE0432 APE0434 APE0436 APES015 APES016 APE0437 APE0439 APES017 APE0442 APES018 APE0443 APE0444 APE0445 APE0447 APE0448 APE0449 APE0450 APE0451 APES019 APE0452 APE0453 APE0454 APE0456 APE0457 APE0458 COG0553 COG1483 COG1743 COG0084 COG2246 COG1573 COG1750 COG1093 COG2051 COG1631COG1594 COG1761 COG3286 COG1096 COG1736 COG0197 COG0303 COG1489 COG0160 正 正 负 正 正 正 正 正 正 负 正 负 负 正 负 正 正 负 正 负 正 负 正 负 正 负 负 正 正 负 负 负 负 负 正 正 正 正 负 正 负 正 负 负 正 正 284.391 287.521 291.639 291.643 292.319 294.690 295.231 295.342 295.572 296.676 297.071 297.993 298.857 298.856 299.332 299.481 300.649 303.153 303.244 303.720 303.833 304.688 305.005 305.941 306.121 306.550 308.859 307.209 308.989 309.515 309.842 310.223 310.832 312.190 312.215 312.650 313.378 313.995 314.714 315.792 316.791 316.247 317.542 318.099 317.638 318.432 287.510 291.639 288.073 295.139 292.636 295.139 295.529 295.518 296.676 295.891 298.857 297.448 298.099 305.941 298.973 300.602 301.296 301.243 303.786 303.403 304.911 304.284 305.611 305.192 308.859 306.359 306.674 307.841 312.190 309.201 309.642 309.915 310.227 310.912 313.258 313.258 315.728 315.728 314.028 318.996 316.237 317.576 316.820 317.632 318.996 318.914 3.120 4.118 3.567 3.496.318.450.298.177 1.104.786 1.786.546.759 7.085.360 1.122.648 1.911.543.318 1.079.405.607.750 2.738.192 2.186.633 3.201.315.201.309.606 1.279 1.043.609 2.350 1.734.687 3.204.555 1.330.723.468 1.359.483
474849505152535455565711111111111组0066组0067组0067组0067组0067组0067组0067组0068组0069组0069组0070APE0459APE0460APE0461APE0462APE0463APE0464APE0465APE0466APE0468APE0469APE0470 COG1591 COG1855 COG0301 COG1318 COG1277 正 正 正 负 正 正 负 正 正 正 正 319.335 319.733 320.272 322.241 321.610 322.317 324.526 324.030 324.606 325.141 325.980 319.673 324.526 320.703 320.700 322.074 323.228 323.288 324.335 325.575 325.575 326.717 .3394.793 .4321.542 .465 .9121.239 .306 .969 .435 .738
受控连接子位置_Id 染色体 C1/C2-Id 方向起点终点长度123456789101112131415161718192021 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1220221222225226228231240248249253254255257273275277283290291294正负正负正正正正负负正正负负负负正负负正负 284.009 284.144 284.073 284.251 284.158 284.253 284.283 295.415 300.757 300.781 305.334 305.358 305.566 305.582 317.682 317.704 319.097 320.513 325.979 325.950 326.878 284.071 284.073 284.145 284.158 284.251 284.280 284.305 295.444 300.742 300.767 305.348 305.372 305.552 305.568 317.668 317.690 319.127 320.484 325.950 325.979 326.716.063.072.073.094.094.028.023.030.016.015.015.015.015.015.015.015.031.030.030.030.163
表格
表1
类型C1C2T1T2
1 D
2 D
3 D
4 D
5 D D
6 D D
7 D D
8 D D D
9 D D D
10 D D D D
其中,D是被删除或修饰的连接子元件。
表2
类型C1C2T1T2
1 S S S S
2 S S S N
3 S S N S
4 S S N N
5 S N S S
6 S N S N
7 S N N S
8 S N N N
9 N S S S
10 N S S N
11 N S N S
12 N S N N
13 N N S S
14 N N S N
15 N N N S
其中,N是天然DNA序列,S是合成的DNA序列。
表3
类型C1C2T1T2
1 D D S S
2 D D S N
3 D D N S
4 D D N N
其中,N是天然DNA序列,S是合成的DNA序列,D是合成的DBP。
表4
类型C1C2T1T2
1 P P S S
2 P P S N
3 P P N S
4 P P N N
其中,N是天然DNA序列,S是合成的DNA序列,P是合成的PNA。
表5
类型C1C2T1T2
1 G1G2S S
2 G1G2S N
3 G1G2N S
4 G1G2N N
其中,N是天然DNA序列,S是合成的DNA序列,G1和G2是一对连锁的DNA结合蛋白。
表6
类型元件-1-形式
1 C
2 E
其中,C是复制的序列元件,E是提取的序列元件。
表7
元件-1元件-2
类型类型形式类型形式
1 C1 C C2 C
2 C1 C C2 E
3 C1 E C2 E
4 C1 C T1 C
5 C1 C T1 E
6 C1 U T1 U
7 C1 E T2 E
8 C2 C T2 C
9 C2 C T2 E
10 C2 U T2 U
11 C2 E T2 E
12 T1 C T2 C
13 T1 C T2 E
14 T1 E T2 E
其中,C是复制的序列元件,U是单一序列元件,E是提取的序列元件。
表8
元件-1 元件-2 元件-2
类型类型形式类型形式类型形式
1 C1 C C2 C T1 C
2 C1 C C2 C T1 E
3 C1 C C2 E T1 C
4 C1 C C2 E T1 E
5 C1 U C2 C T1 U
6 C1 U C2 U T1 E
7 C1 U C2 E T1 U
8 C1 E C2 C T1 C
9 C1 E C2 C T1 E
10 C1 E C2 E T1 C
11 C1 E C2 E T1 E
12 C1 C C2 C T2 C
13 C1 C C2 C T2 E
14 C1 C C2 U T2 U
15 C1 C C2 E T2 C
16 C1 C C2 E T2 E
17 C1 E C2 C T2 C
18 C1 E C2 C T2 E
19 C1 E C2 U T2 U
20 C1 E C2 E T2 C
21 C1 E C2 E T2 E
22 C1 C T1 C T2 C
23 C1 C T1 C T2 E
24 C1 C T1 E T2 C
25 C1 C T1 E T2 E
26 C1 U T1 U T2 C
27 C1 U T1 U T2 E
28 C1 C
29 C1 E T1 C T2 E
30 C1 E T1 E T2 C
31 C1 E T1 E T2 E
32 C2 C T1 C T2 C
33 C2 C T1 C T2 E
34 C2 C T1 E T2 C
35 C2 C T1 E T2 E
36 C2 U T1 C T2 U
37 C2 U T1 E T2 U
38 C2 E T1 C T2 C
39 C2 E T1 C T2 E
40 C2 E T1 E T2 C
41 C2 E T1 E T2 E
其中,C是复制的序列元件,U是单一序列元件,E是提取的序列元件。
表9
C1 C2 T1 T2
类型形式形式形式形式
1 C C C C
2 C C C E
3 C C E C
4 C C E E
5 C U C U
6 C U E U
7 C E C C
8 C E C E
9 C E E C
10 C E E E
11 U C U C
12 U C U E
13 U U U U
14 U E U C
15 U E U E
16 E C C C
17 E C C E
18 E C E C
19 E C E E
20 E U C U
21 E U E U
22 E E C C
23 E E C E
24 E E E C
25 E E E E
其中,C是复制的序列元件,U是单一序列元件,E是。
权利要求
1.模拟基因组的连接子行为以修饰基因组行为的方法,其特征在于,所述方法包括选择性删除和/或加入连接子。
2.模拟基因组的连接子行为以通过计算机修饰基因组行为的方法,其特征在于,所述方法包括选择性删除和/或加入连接子。
3.一种具有包含DNA元件C1、C2、T1和T2的连接子的基因组,其特征在于,至少一个所述DNA元件按照下表被删除
类型 C1C2T1T2
1D
2 D
3D
4 D
5D D
6D D
7D D
8D D D
9D D D
10 D D D D
其中,D是被删除或修饰的连接子元件。
4.一种具有包含DNA元件C1、C2、T1和T2的连接子的基因组,其特征在于,至少一个所述DNA元件被合成的DNA元件替代。
5.一种具有包含DNA元件C1、C2、T1和T2的连接子的基因组,其特征在于,至少一个所述DNA元件被下表所述的合成DNA元件替代
类型 C1 C2 T1 T2
1SSSS
2SSSN
3SSNS
4SSNN
5 SNSS
6 SNSN
7 SNNS
8 SNNN
9 NSSS
10NSSN
11NSNS
12NSNN
13NNSS
14NNSN
15NNNS
其中,N是天然DNA序列,S是合成的DNA序列。
6.一种具有包含天然DNA元件T1和T2的连接子的基因组,其特征在于,所述DNA元件中都没有、有一个或两个具有下表所述的DNA元件,且C1和C2序列是按照下表所述由合成DBP的结合产生的
类型 C1 C2 T1 T2
1DDSS
2DDSN
3DDNS
4DDNN
其中,N是天然DNA序列,S是合成的DNA序列,D是合成的DBP。
7.一种具有包含天然DNA元件T1和T2的连接子的基因组,其特征在于,所述DNA元件中都没有、有一个或两个被下表所述的合成DNA元件替代,且C1和C2序列是按照下表所述由合成PNA的结合产生的
类型 C1 C2 T1 T2
1PPSS
2PPSN
3PPNS
4PPNN
其中,N是天然DNA序列,S是合成的DNA序列,P是合成的PNA。
8.一种具有包含天然DNA元件T1和T2的连接子的基因组,其特征在于,所述DNA元件中都没有、有一个或两个被下表所述的合成DNA元件替代,且C1和C2序列是按照下表所述由DNA结合元件G1和G2的连锁对的结合产生的
类型 C1C2 T1 T2
1G1G2SS
2G1G2SN
3G1G2NS
4G1G2NN
其中,N是天然DNA序列,S是合成的DNA序列,G1和G2是一对连锁的双链DNA结合元件。
9.一种具有包含天然DNA元件C1、C2、T1和T2的连接子的基因组,其特征在于,至少一个所述DNA元件被下表所述的合成DNA元件替代
类型 元件-1-形式
1C
2E
其中,C是复制的序列元件,E是提取的序列元件。
10.一种具有包含天然DNA元件C1、C2、T1和T2的连接子的基因组,其特征在于,所述DNA元件中的两个被下表所述的合成DNA元件替代
元件-1 元件-2
类型类型 形式 类型 形式
1C1CC2C
2C1CC2E
3C1EC2E
4C1CT1C
5C1CT1E
6C1UT1U
7C1ET2E
8 C2CT2C
9 C2CT2E
10C2UT2U
11C2ET2E
12T1CT2C
13T1CT2E
14T1ET2E
其中,C是复制的序列元件,U是单一序列元件,E是提取的序列元件。
11.一种具有包含天然DNA元件C1、C2、T1和T2的连接子的基因组,其特征在于,所述DNA元件中的三个被下表所述的合成DNA元件替代
元件-1 元件-2 元件-2
类型类型 形式类型 形式类型 形式
1C1C C2C T1C
2C1C C2C T1E
3C1C C2E T1C
4C1C C2E T1E
5C1U C2C T1U
6C1U C2U T1E
7C1U C2E T1U
8C1E C2C T1C
9C1E C2C T1E
10 C1E C2E T1C
11 C1E C2E T1E
12 C1C C2C T2C
13 C1C C2C T2E
14 C1C C2U T2U
15 C1C C2E T2C
16 C1C C2E T2E
17 C1E C2C T2C
18 C1E C2C T2E
19 C1 E C2 U T2 U
20 C1 E C2 E T2 C
21 C1 E C2 E T2 E
22 C1 C T1 C T2 C
23 C1 C T1 C T2 E
24 C1 C T1 E T2 C
25 C1 E
26 C1 U T1 U T2 C
27 C1 U T1 U T2 E
28 C1 E T1 C T2 C
29 C1 E T1 C T2 E
30 C1 E T1 E T2 C
31 C1 E T1 E T2 E
32 C2 C T1 C T2 C
33 C2 C T1 C T2 E
34 C2 C T1 E T2 C
35 C2 C T1 E T2 E
36 C2 U T1 C T2 U
37 C2 U T1 E T2 U
38 C2 E T1 C T2 C
39 C2 E T1 C T2 E
40 C2 E T1 E T2 C
41 C2 E T1 E T2 E
其中,C是复制的序列元件,U是单一序列元件,E是提取的序列元件。
12.一种具有包含天然DNA元件C1、C2、T1和T2的连接子的基因组,其特征在于,所述DNA元件中的四个被下表所述的合成DNA元件替代
C1 C2 T1 T2
类型 形式形式形式形式
1 C C C C
2 C C C E
3C C E C
4C C E E
5C U C U
6C U E U
7C E C C
8C E C E
9C E E C
10 C E E E
11 U C U C
12 U C U E
13 U U U U
14 U E U C
15 U E U E
16 E C C C
17 E C C E
18 E C E C
19 E C E E
20 E U C U
21 E U E U
22 E E C C
23 E E C E
24 E E E C
25 E
其中,C是复制的序列元件,U是单一序列元件,E是提取的序列元件。
全文摘要
基因组的连接子结构决定了四组最小长度为15碱基的DNA序列(基因3’UTR中的C1和C2,一组基因5’-侧上的T1和3’-侧上的T2)。基因组的连接子状态提供了信息使得有可能确定从何处以及如何从天然基因组中删除连接子或在天然基因组中加入连接子以修饰基因组基因表达行为。
文档编号C12N15/11GK1678739SQ03821029
公开日2005年10月5日 申请日期2003年7月2日 优先权日2002年7月5日
发明者理查德杰费尔德曼 申请人:理查德杰费尔德曼