修饰的末端脱氧核苷酸转移酶(TdT)的制作方法

文档序号:26824764发布日期:2021-09-29 04:40阅读:1195来源:国知局
修饰的末端脱氧核苷酸转移酶(TdT)的制作方法
修饰的末端脱氧核苷酸转移酶(tdt)
发明领域
1.本发明涉及特定末端脱氧核苷酸转移酶(tdt)或任何物种的polμ、polβ、polλ和polθ的同源氨基酸序列或任何物种的x家族聚合酶的同源氨基酸序列在核酸合成的方法中的用途,涉及合成核酸的方法,以及涉及包含所述酶的试剂盒在核酸合成的方法中的用途。本发明还涉及末端脱氧核苷酸转移酶或同源酶和3
’‑
封闭的核苷三磷酸在非模板依赖性核酸合成的方法中的用途。
2.发明背景
3.核酸合成对现代生物技术至关重要。科学界人工合成dna、rna和蛋白的能力使生物技术领域的快速发展成为可能。
4.人工dna合成允许生物技术和制药公司开发一系列肽治疗剂,诸如治疗糖尿病的胰岛素。人工dna合成允许研究人员表征细胞蛋白,以开发新的小分子疗法用于治疗我们的老龄化群体今天面临的疾病,诸如心脏病和癌症。人工dna合成甚至为创造生命铺平了道路,正如venter研究所在2010年在他们将人工合成的基因组放置于细菌细胞中时展示的那样。
5.然而,目前的dna合成技术并不能满足生物技术产业的需求。尽管是成熟的技术,合成长度大于200个核苷酸的dna链在实践上是不可能的,并且大多数dna合成公司仅提供多达120个核苷酸。相比之下,平均蛋白编码基因是2000

3000个连续核苷酸的数量级(order),一条染色体的长度是至少一百万个连续核苷酸,并且平均的真核生物基因组的数量是数十亿个核苷酸。为了制备长度为数千个碱基对的核酸链,如今所有主要的基因合成公司都依赖于“合成并拼接(synthesise and stitch)”技术的变化形式,其中重叠的40

60

mer片段通过酶促拷贝和延伸合成并拼接在一起。目前的方法通常允许多达3kb的长度用于常规生产。
6.不能够一次合成超过120

200个核苷酸的dna的原因是由于目前产生dna的方法,该方法使用合成化学(即亚磷酰胺技术)一次偶联一个核苷酸来制备dna。即使每个核苷酸偶联步骤的效率是99%有效的,以可接受的产量合成长于200个核苷酸的dna在数学上是不可能的。venter研究所花费4年和2000万美元合成相对较小的细菌基因组说明了这一费力的过程。
7.已知的dna测序方法使用模板依赖性dna聚合酶将3
’‑
可逆终止核苷酸添加至增长的双链底物。在“合成测序(sequencing

by

synthesis)”方法中,每一个添加的核苷酸都包含染料,允许使用者鉴定模板链的确切序列。尽管是在双链dna上,这项技术能够产生介于500

1000bp之间长的链。然而,因为需要现有的核酸链作为模板,这种技术不适于从头核酸合成。
8.已经进行了各种尝试来使用末端脱氧核苷酸转移酶进行从头单链dna合成。与受控的从头单链dna合成相反,不受控制的从头单链dna合成利用了tdt在单链dna上的脱氧核苷5
’‑
三磷酸(dntp)3
’‑
加尾性质,以产生,例如,用于下一代测序文库制备的均聚衔接子序列。在受控的延伸中,需要采用可逆脱氧核苷5
’‑
三磷酸终止技术,以防止在增长的dna链的
3
’‑
末端不受控制地添加dntp。通过tdt开发受控的单链dna合成方法对于基因组装或杂交微阵列的原位dna合成将是非常宝贵的,因为它消除了对无水环境的需求并且允许使用与有机溶剂不相容的各种聚合物。
9.然而,尚未显示出tdt有效添加包含3
’‑
o

可逆终止部分的核苷三磷酸以构建从头合成循环所必需的新生单链dna链。3
’‑
o

可逆终止部分会阻止末端转移酶如tdt催化增长的dna链的3
’‑
末端与进入的核苷三磷酸的5
’‑
三磷酸之间的核苷酸转移酶反应。
10.因此,对于鉴定容易掺入3
’‑
o

可逆终止核苷酸的经修饰的末端脱氧核苷酸转移酶存在需求。所述经修饰的末端脱氧核苷酸转移酶可以用于以对生物技术和单链dna合成方法有用的方式掺入3
’‑
o

可逆终止核苷酸,以便提供改进的能够克服与目前可用方法相关的问题的核酸合成方法。
11.附图简述
12.图1.通过末端脱氧核苷酸转移酶(tdt)seq id no 1

173掺入3
’‑
o

ch2‑
n3核苷5
’‑
三磷酸。掺入速率由每分钟每纳克tdt掺入单链dna分子3'

末端的可逆终止核苷5
’‑
三磷酸的量(pmol)来定义。野生型牛tdt活性由y轴=0附近的虚线表示。测定的动态范围在每分钟每纳克tdt的2.0pmol掺入处饱和。
13.图2.使用由欧洲分子生物学实验室(the european molecular biology laboratory,embl)多序列比对站点提供的clustal omega多序列比对程序进行的对所选择的野生型末端脱氧核苷酸转移酶的种间同源物的序列比对。
14.图3.上面的插图:在单核苷酸掺入测定中,将经碱基修饰的底物a*、c*、g*和t*提供至工程化变体。a*描述3
’‑
氨基氧基6

叠氮基2
’‑
脱氧腺苷5
’‑
三磷酸;c*描述3
’‑
氨基氧基4

叠氮基5

甲基2
’‑
脱氧胞苷5
’‑
三磷酸;g*描述3
’‑
氨基氧基2

叠氮基2
’‑
脱氧鸟苷5
’‑
三磷酸;t*描述了3
’‑
氨基氧基5

(

羟基
‑1‑
丁炔基)2
’‑
脱氧尿苷5
’‑
三磷酸。将具有简并末端的dna起始子池固定至固体支持物,并且暴露于核苷酸添加混合物(nam)溶液,该溶液包含(1)tdt变体,(2)中性ph缓冲剂,(3)单价盐,(4)氯化钴,和(5)3
’‑
onh2‑
dxtp,其中x是产生a*、c*、g*或t*的经修饰的核碱基。孵育温度是37℃,并且反应时间是2.5分钟。然后将固体支持物用处于中性ph的高盐溶液洗涤,随后用处于中性ph的低盐溶液洗涤。将起始子池转化为测序文库,并且在illumina nextseq500上通过下一代测序(ngs)以pe30读段进行分析。将bcl文件用illumina的bcl2fastq转换软件转换为fastq文件,并且在r中进行分析。针对所有可能的起始子背景(initiator contexts),计算每个经修饰的碱基的添加的掺入效率([包含n+1个产物的读段]/{[包含n个起始子的读段]+[包含n+1个产物的读段])。跨越所有背景的平均掺入效率示于图3(上面的插图)中。野生型牛和野生型斑点雀鳝(spotted gar)tdt对经碱基修饰的可逆终止核苷酸a*、c*、g*和t*的单核苷酸掺入由虚线表示。由于在测定中,野生型牛或野生型斑点雀鳝tdt不能将这些经碱基修饰的可逆终止核苷酸掺入,虚线出现在y=0处。相对于野生型牛和野生型斑点雀鳝tdt,所有呈现的tdt变体中的突变都导致了tdt修饰碱基掺入的改进。
[0015]
下面的图:使用3
’‑
onh2核苷5
’‑
三磷酸与末端脱氧核苷酸转移酶(tdt)seq id no 1&344

727的进行的8

nt核酸序列的固体支持物合成。dna序列5
’‑
atcgatcg
‑3’
通过将固体支持物结合的dna起始子重复暴露于核苷酸添加混合物(nam)溶液来合成,该溶液包含(1)tdt,(2)中性ph缓冲剂,(3)单价盐,(4)氯化钴,和(5)3
’‑
onh2‑
dntp,其中n选自腺嘌呤、胸
腺嘧啶、胞嘧啶或鸟嘌呤。一个循环由以下组成:(a)将具有指定的a、t、c或g可逆终止核苷酸的nam溶液在固体支持物上于37℃孵育5分钟;(b)然后将固体支持物用处于中性ph的高盐溶液洗涤;(c)然后将固体支持物暴露于酸性亚硝酸钠水性溶液中;并且(d)然后将固体支持物用与(b)相同的处于中性ph的高盐溶液洗涤。然后将(a)

(d)再重复7次,以合成期望的8

nt序列。合成的dna通过在变性聚丙烯酰胺凝胶上运行反应来分析,并且通过共价附接至dna起始子的荧光团来定量。全长分数(fraction full length)(8

nt物类)通过取8

nt条带的荧光强度并除以总泳道强度来确定。野生型牛和野生型斑点雀鳝tdt活性因为与全长分数有关,所以由虚线表示。相对于野生型牛和野生型斑点雀鳝tdt,所有包含在tdt变体中的突变导致了tdt的改进。
[0016]
图4.基于与dna起始子和可逆终止dntp结合的优选的工程化nuclera tdt变体的共晶体结构的斑点雀鳝tdt同源性结构。具有brct结构域截短的工程化tdt变体在大肠杆菌(escherichia coli)中表达,并且通过固定金属亲和层析随后通过尺寸排阻层析进行纯化。然后将以上提及的tdt(60μm)与dna寡核苷酸(5
’‑
ttttt[ddc]
‑3’
;120μm)、氯化钴(1mm)在不存在(上方)或存在(下方)datp

onh2(1mm)的情况下在以下储库溶液中通过坐滴蒸汽扩散(sitting drop vapor diffusion)进行共结晶:分别地,bis

tris hcl(100mm)、nacl(27mm)、22%w/v peg 3350或者bis

tris hcl(10mm)和27.5%w/v peg mme 500。板样晶体出现并经1周生长至400
×
50
×
5μm3的最大尺寸并且分别衍射至2.6埃和2.5埃,其中空间群为p212121且晶胞尺寸分别为以及以及数据使用diamond light source处的自动软件管线进行加索引(indexed)、整合和缩放。用斑点雀鳝(lepisosteus oculatus)(斑点雀鳝(spotted gar))的同源性模型进行的分子替代,随后的散布有刚体人工模型构建(manual model building interspersed with rigid

body)、模拟退火、能量最小化和单独各向同性d因子的循环,产生了完整的结构模型(分别地,r
free
=27.8%和28.6%)。钴离子通过它们的反常散射来鉴定。具有brct结构域截短的斑点雀鳝tdt野生型序列(>95%序列同一性)被建模到这两种结构上。
[0017]
图5.如图4中描示的被建模到工程化tdt变体的晶体结构上的斑点雀鳝tdt同源性结构与menhnqi基序的表面表示,该menhnqi基序包含enhnq基序,以黑色突出显示。tdt包含核苷酸转移酶活性位点的两个入口,其中dna起始子和可逆终止dntp可以进入并结合。通过对活性位点的建模和目视检查确定,menhnqi和enhnq基序控制进入核苷酸转移酶活性位点,并且本专利中显示的突变展示出,使该基序突变导致可逆终止核苷酸的tdt掺入活性增加。
[0018]
图6.如图4中描示的被模拟到工程化tdt变体的晶体结构上的斑点雀鳝tdt同源性结构与segpclafmra基序的表面表示(右侧为左侧视图的180度旋转),该segpclafmra基序包含fmra基序,以黑色突出显示。tdt包含核苷酸转移酶活性位点的两个入口,其中dna起始子和可逆终止dntp可以进入并结合。通过对活性位点的建模和目视检查确定,segplclafmra和fmra基序(1)通过空间效应和静电相互作用控制可逆终止核苷酸进入核苷酸转移酶活性位点,和(2)直接针对关键的tgsr基序进行包装,tgsr基序直接接触可逆终止核苷酸。具体地,与tgsr基序相比,segplclafmra和fmra基序直接接触并调节r438的定位,
r438直接接触可逆终止核苷酸。本专利中显示的突变展示出,使这些基序突变导致可逆终止核苷酸的tdt掺入活性增加。
[0019]
图7.如图4中描示的被建模到工程化tdt变体的晶体结构上的斑点雀鳝tdt同源性结构与hftkmqk基序的表面表示,该hftkmqk基序包含mqk基序,以黑色突出显示。tdt包含核苷酸转移酶活性位点的两个入口,其中dna起始子和可逆终止dntp可以进入并结合。通过对活性位点的建模和目视检查确定,hftkmqk和mqk基序与核酸起始子结合并且有助于定位起始子的3
’‑
末端,以对进入的核苷酸进行亲核攻击。本专利中显示的突变展示出,使该基序突变导致可逆终止核苷酸的tdt掺入活性增加。
[0020]
图8.如图4中描示的被建模到工程化tdt变体的晶体结构上的斑点雀鳝tdt同源性结构与saavck基序的表面表示,以黑色突出显示。tdt包含核苷酸转移酶活性位点的两个入口,其中dna起始子和可逆终止dntp可以进入并结合。通过对活性位点的建模和目视检查确定,saavck基序控制可逆终止核苷酸进入核苷酸转移酶活性位点。本专利中显示的突变展示出,使该基序突变导致可逆终止核苷酸的tdt掺入活性增加。
[0021]
图9.如图4中描示的被建模到工程化tdt变体的晶体结构上的斑点雀鳝tdt同源性结构与gkec基序的表面(左侧)和卡通/球形(右侧)表示,该gkec基序包含kec基序,以黑色突出显示。tdt包含核苷酸转移酶活性位点的两个入口,其中dna起始子和可逆终止dntp可以进入并结合。通过对活性位点的建模和目视检查确定,gkec和kec基序控制可逆终止核苷酸进入和直接结合核苷酸转移酶活性位点。本专利中显示的突变展示出,使该基序突变导致可逆终止核苷酸的tdt掺入活性增加。
[0022]
图10.如图4中描示的被建模到工程化tdt变体的晶体结构上的斑点雀鳝tdt同源性结构与dhfqk基序的表面表示,该dhfqk基序包含dhfq基序,以黑色突出显示。tdt包含核苷酸转移酶活性位点的两个入口,其中dna起始子和可逆终止dntp可以进入并结合。通过对活性位点的建模和目视检查确定,dhfqk和dhfq基序通过空间撞击(sterically impinging)核酸起始子来控制核酸起始子进入核苷酸转移酶活性位点。本专利中显示的突变展示出,使该基序突变导致可逆终止核苷酸的tdt掺入活性增加。
[0023]
图11.如图4中描示的与dna起始子和datp

onh2结合的工程化tdt变体晶体结构与farherkmlldnha基序的卡通表示,以黑色球形突出显示。tdt包含核苷酸转移酶活性位点的两个入口,其中dna起始子和可逆终止dntp可以进入并结合。通过对活性位点的建模和目视检查确定,farherkmlldnha基序通过空间撞击核苷酸和起始子来控制核苷酸转移酶活性位点中的核苷酸和核酸起始子结合。另外地,基序farherkmlldnha被突变为farherkmlldrha。asn到arg的突变导致arg残基直接结合两个催化钴离子中的一个,这是活性所必需的。本专利中显示的突变展示出,该基序内的突变残基调节与co
2+
、可逆终止核苷酸和/或核酸起始子接触的关键氨基酸的定位,从而导致可逆终止核苷酸的tdt掺入活性增加。
[0024]
图12.如图4中描示的与dna起始子和datp

onh2结合的工程化tdt变体晶体结构与farherkmlldnhalydktkk基序的卡通表示,以黑色球体突出显示。tdt包含核苷酸转移酶活性位点的两个入口,其中dna起始子和可逆终止dntp可以进入并结合。通过对活性位点的建模和目视检查确定,farherkmlldnhalydktkk基序通过空间撞击核苷酸和起始子来控制核苷酸转移酶活性位点中的核苷酸和核酸起始子结合。另外地,基序farherkmlldnhalydktkk被突变为farherkmlldrhalydktkk。asn到arg的突变导致arg残基直接结合两个催化钴离子
中的一个,这是活性所必需的。本专利中显示的突变展示出,该基序内的突变残基调节与co
2+
、可逆终止核苷酸和/或核酸起始子接触的关键氨基酸的定位,从而导致可逆终止核苷酸的tdt掺入活性增加。
[0025]
图13.如图4中描示的与dna起始子和datp

onh2结合的工程化tdt变体晶体结构与dyidp基序的卡通表示,该dyidp基序包含yidp基序,以黑色球形突出显示。tdt包含核苷酸转移酶活性位点的两个入口,其中dna起始子和可逆终止dntp可以进入并结合。通过对活性位点的建模和目视检查确定,dyidp和yidp基序通过调节a494在活性位点内的定位来控制核苷酸转移酶活性位点中的核苷酸结合。这个最接近c

末端的(most c

terminal)残基(ala494)在空间上撞击进入的核苷酸。使yidp基序突变调节了最接近c

末端的ala残基的定位,导致可逆终止核苷酸的tdt掺入活性增加。
[0026]
图14.如图4中描示的与dna起始子和datp

onh2结合的工程化tdt变体晶体结构与yydiv基序的卡通表示,以黑色球形突出显示。tdt包含核苷酸转移酶活性位点的两个入口,其中dna起始子和可逆终止dntp可以进入并结合。通过对活性位点的建模和目视检查确定,yydiv基序通过空间撞击核酸起始子中的倒数第三(iii)、倒数第二(ii)和最终(i)的3
’‑
核苷酸来控制核酸起始子的定位。特别地,这种基序撞击嘧啶(左侧,如结晶的,以球形表示示出的i&ii),但特别是嘌呤(右侧,被建模到如嘌呤的结构中的ii)。使yydiv基序突变调节核酸起始子定位和进入到核苷酸转移酶活性位点中,导致可逆终止核苷酸的tdt掺入活性增加。
[0027]
图15.如图4中描示的与dna起始子和datp

onh2结合的工程化tdt变体晶体结构与appvdnf基序的卡通表示,该appvdnf基序包含appvdn基序,基序以黑色球形突出显示。在该结构中,appvdnf基序显示为通过ala至met突变为mppvdnf。通过建模,确定appvdnf基序和appvdn基序通过直接针对以下基序进行包装来控制以下基序的定位:yydiv(右上)和farherkmlldnhalydktkk(左下)基序(两者均以浅灰色球形示出)。另外地,通过建模确定,appvdnf和appvdn基序通过确定以下基序的环构象来控制以下基序的定位:对核苷酸转移酶机制而言关键的tgsr基序(左上)和天冬氨酸催化三联体(右下),tgsr基序(左上)和天冬氨酸催化三联体(右下)两者均以浅灰色球形示出。appvdnf基序和appvdn基序中的突变直接影响以上提及的关键蛋白基序如何调节它们与可逆终止核苷酸和核酸起始子的接触。在本专利中已经示出了appvdnf和appvdn基序中的突变导致可逆终止核苷酸的tdt掺入活性增加。
[0028]
发明概述
[0029]
本文描述了修饰的末端脱氧核苷酸转移酶(tdt)或任何物种的polμ、polβ、polλ和polθ的同源氨基酸序列或任何物种的x家族聚合酶的同源氨基酸序列。末端转移酶在自然界中普遍存在,并且存在于许多物种中。许多已知的tdt序列已经被报道在ncbi数据库http://www.ncbi.nlm.nih.gov/中。
[0030]
gi编号
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
物种http://www.ncbi.nlm.nih.gov/
[0031]
gi|768
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
家牛(bos taurus)
[0032]
gi|460163
ꢀꢀꢀꢀꢀꢀꢀ
原鸡(gallus gallus)
[0033]
gi|494987
ꢀꢀꢀꢀꢀꢀꢀ
非洲爪蟾(xenopus laevis)
[0034]
gi|1354475
ꢀꢀꢀꢀꢀꢀ
虹鳟(oncorhynchus mykiss)
[0035]
gi|2149634
ꢀꢀꢀꢀꢀꢀ
短尾负鼠(monodelphis domestica)
[0036]
gi|12802441
ꢀꢀꢀꢀꢀ
小家鼠(mus musculus)
[0037]
gi|28852989
ꢀꢀꢀꢀꢀ
墨西哥钝口螈(ambystoma mexicanum)
[0038]
gi|38603668
ꢀꢀꢀꢀꢀ
红鳍东方鲀(takifugu rubripes)
[0039]
gi|40037389
ꢀꢀꢀꢀꢀ
晶吻鳐(raja eglanteria)
[0040]
gi|40218593
ꢀꢀꢀꢀꢀ
铰口鲨(ginglymostoma cirratum)
[0041]
gi|46369889
ꢀꢀꢀꢀꢀ
斑马鱼(danio rerio)
[0042]
gi|73998101
ꢀꢀꢀꢀꢀ
家犬(canis lupus familiaris)
[0043]
gi|139001476
ꢀꢀꢀꢀ
环尾狐猴(lemur catta)
[0044]
gi|139001490
ꢀꢀꢀꢀ
倭狐猴(microcebus murinus)
[0045]
gi|139001511
ꢀꢀꢀꢀ
小耳大婴猴(otolemur garnettii)
[0046]
gi|148708614
ꢀꢀꢀꢀ
小家鼠
[0047]
gi|149040157
ꢀꢀꢀꢀ
褐家鼠(rattus norvegicus)
[0048]
gi|149704611
ꢀꢀꢀꢀ
家马(equus caballus)
[0049]
gi|164451472
ꢀꢀꢀꢀ
家牛
[0050]
gi|169642654
ꢀꢀꢀꢀ
热带爪蟾(xenopus(silurana)tropicalis)
[0051]
gi|291394899
ꢀꢀꢀꢀ
欧洲兔(oryctolagus cuniculus)
[0052]
gi|291404551
ꢀꢀꢀꢀ
欧洲兔
[0053]
gi|301763246
ꢀꢀꢀꢀ
大熊猫(ailuropoda melanoleuca)
[0054]
gi|311271684
ꢀꢀꢀꢀ
野猪(sus scrofa)
[0055]
gi|327280070
ꢀꢀꢀꢀ
安乐蜥(anolis carolinensis)
[0056]
gi|334313404
ꢀꢀꢀꢀ
短尾负鼠
[0057]
gi|344274915
ꢀꢀꢀꢀ
非洲象(loxodonta africana)
[0058]
gi|345330196
ꢀꢀꢀꢀ
鸭嘴兽(ornithorhynchus anatinus)
[0059]
gi|348588114
ꢀꢀꢀꢀ
豚鼠(cavia porcellus)
[0060]
gi|351697151
ꢀꢀꢀꢀ
裸鼹鼠(heterocephalus glaber)
[0061]
gi|355562663
ꢀꢀꢀꢀ
猕猴(macaca mulatta)
[0062]
gi|395501816
ꢀꢀꢀꢀ
袋獾(sarcophilus harrisii)
[0063]
gi|395508711
ꢀꢀꢀꢀ
袋獾
[0064]
gi|395850042
ꢀꢀꢀꢀ
小耳大婴猴
[0065]
gi|397467153
ꢀꢀꢀꢀ
倭黑猩猩(pan paniscus)
[0066]
gi|403278452
ꢀꢀꢀꢀ
saimiri boliviensis boliviensis
[0067]
gi|410903980
ꢀꢀꢀꢀ
红鳍东方鲀
[0068]
gi|410975770
ꢀꢀꢀꢀ
家猫(felis catus)
[0069]
gi|432092624
ꢀꢀꢀꢀ
大卫鼠耳蝠(myotis davidii)
[0070]
gi|432113117
ꢀꢀꢀꢀ
大卫鼠耳蝠
[0071]
gi|444708211
ꢀꢀꢀꢀ
树鼩(tupaia chinensis)
[0072]
gi|460417122
ꢀꢀꢀꢀ
欧非肋突螈(pleurodeles waltl)
[0073]
gi|466001476
ꢀꢀꢀꢀ
虎鲸(orcinus orca)
[0074]
gi|471358897
ꢀꢀꢀꢀ
佛罗里达海牛(trichechus manatus latirostris)
[0075]
gi|478507321
ꢀꢀꢀꢀ
白犀牛(ceratotherium simum simum)
[0076]
gi|478528402
ꢀꢀꢀꢀ
白犀牛
[0077]
gi|488530524
ꢀꢀꢀꢀ
九带犰狳(dasypus novemcinctus)
[0078]
gi|499037612
ꢀꢀꢀꢀ
斑马拟丽鱼(maylandia zebra)
[0079]
gi|504135178
ꢀꢀꢀꢀ
北美鼠兔(ochotona princeps)
[0080]
gi|505844004
ꢀꢀꢀꢀ
普通鼩鼱(sorex araneus)
[0081]
gi|505845913
ꢀꢀꢀꢀ
普通鼩鼱
[0082]
gi|507537868
ꢀꢀꢀꢀ
非洲跳鼠(jaculus jaculus)
[0083]
gi|507572662
ꢀꢀꢀꢀ
非洲跳鼠
[0084]
gi|507622751
ꢀꢀꢀꢀ
智利八齿鼠(octodon degus)
[0085]
gi|507640406
ꢀꢀꢀꢀ
小马岛猬(echinops telfairi)
[0086]
gi|507669049
ꢀꢀꢀꢀ
小马岛猬
[0087]
gi|507930719
ꢀꢀꢀꢀ
星鼻鼹(condylura cristata)
[0088]
gi|507940587
ꢀꢀꢀꢀ
星鼻鼹
[0089]
gi|511850623
ꢀꢀꢀꢀ
蒙眼貂(mustela putorius furo)
[0090]
gi|512856623
ꢀꢀꢀꢀ
热带爪蟾
[0091]
gi|512952456
ꢀꢀꢀꢀ
裸鼹鼠
[0092]
gi|524918754
ꢀꢀꢀꢀ
金色仓鼠(mesocricetus auratus)
[0093]
gi|527251632
ꢀꢀꢀꢀ
虎皮鹦鹉(melopsittacus undulatus)
[0094]
gi|528493137
ꢀꢀꢀꢀ
斑马鱼
[0095]
gi|528493139
ꢀꢀꢀꢀ
斑马鱼
[0096]
gi|529438486
ꢀꢀꢀꢀ
游隼(falco peregrinus)
[0097]
gi|530565557
ꢀꢀꢀꢀ
西部锦龟(chrysemys picta bellii)
[0098]
gi|532017142
ꢀꢀꢀꢀ
草原田鼠(microtus ochrogaster)
[0099]
gi|532099471
ꢀꢀꢀꢀ
十三线地松鼠(ictidomys tridecemlineatus)
[0100]
gi|533166077
ꢀꢀꢀꢀ
绒毛丝鼠(chinchilla lanigera)
[0101]
gi|533189443
ꢀꢀꢀꢀ
绒毛丝鼠
[0102]
gi|537205041
ꢀꢀꢀꢀ
中国地鼠(cricetulus griseus)
[0103]
gi|537263119
ꢀꢀꢀꢀ
中国地鼠
[0104]
gi|543247043
ꢀꢀꢀꢀ
中地雀(geospiza fortis)
[0105]
gi|543351492
ꢀꢀꢀꢀ
褐背拟地鸦(pseudopodoces humilis)
[0106]
gi|543731985
ꢀꢀꢀꢀ
原鸽(columba livia)
[0107]
gi|544420267
ꢀꢀꢀꢀ
食蟹猴(macaca fascicularis)
[0108]
gi|545193630
ꢀꢀꢀꢀ
家马
[0109]
gi|548384565
ꢀꢀꢀꢀ
pundamilia nyererei
[0110]
gi|551487466
ꢀꢀꢀꢀ
花斑剑尾鱼(xiphophorus maculatus)
[0111]
gi|551523268
ꢀꢀꢀꢀ
花斑剑尾鱼
[0112]
gi|554582962
ꢀꢀꢀꢀ
布氏鼠耳蝠(myotis brandtii)
[0113]
gi|554588252
ꢀꢀꢀꢀ
布氏鼠耳蝠
[0114]
gi|556778822
ꢀꢀꢀꢀ
藏羚羊(pantholops hodgsonii)
[0115]
gi|556990133
ꢀꢀꢀꢀ
矛尾鱼(latimeria chalumnae)
[0116]
gi|557297894
ꢀꢀꢀꢀ
扬子鳄(alligator sinensis)
[0117]
gi|558116760
ꢀꢀꢀꢀ
中华鳖(pelodiscus sinensis)
[0118]
gi|558207237
ꢀꢀꢀꢀ
小棕蝠(myotis lucifugus)
[0119]
gi|560895997
ꢀꢀꢀꢀ
野骆驼(camelus ferus)
[0120]
gi|560897502
ꢀꢀꢀꢀ
野骆驼
[0121]
gi|562857949
ꢀꢀꢀꢀ
树鼩
[0122]
gi|562876575
ꢀꢀꢀꢀ
树鼩
[0123]
gi|564229057
ꢀꢀꢀꢀ
密西西比河鳄(alligator mississippiensis)
[0124]
gi|564236372
ꢀꢀꢀꢀ
密西西比河鳄
[0125]
gi|564384286
ꢀꢀꢀꢀ
褐家鼠。
[0127]
所描述的各种末端转移酶的序列显示了高度保守序列的一些区域,以及不同物种之间高度不同的一些区域。用于对来自选择的物种的序列进行的序列比对示于图2中。
[0128]
本发明人已经修饰了来自斑点雀鳝的末端转移酶(斑点雀鳝)(以sed id 1示出)。然而,对应的修饰可以被引入来自任何其他物种的类似末端转移酶序列,包括以上在各种ncbi条目中列出的序列,包括图2中示出的那些或其截短形式。
[0129]
斑点雀鳝(lepisosteus oculatus)的氨基酸序列在下文示出(seq id 1)
[0130][0131]
该序列的工程化变体先前在公布wo2016/128731中被鉴定为seq id no 8。本文描述了对该公布序列的进一步工程化改进。本文公开的经修饰的序列不同于现有技术中公开的seq id no 8。wo2016/128731的seq id no 2是“错误注释(mis

annotated)”的野生型雀鳝序列。
[0132]
公布wo2016/128731中的seq id no 8在下文示出,其中鉴定了工程化突变:
[0133]
[0134]
本发明人已经鉴定了氨基酸序列中具有改进的性质的各种氨基酸修饰。某些区域改进了酶的溶解度和处理。某些其他区域改进了掺入具有修饰的核苷酸的能力;这些修饰包括糖的3
’‑
位置处的修饰和对碱基的修饰。
[0135]
本文描述了修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)在与野生型序列seq id no 1或其截短形式或者其他物种中的末端脱氧核苷酸转移酶(tdt)的同源氨基酸序列或任何物种的polμ、polβ、polλ和polθ的同源氨基酸序列或任何物种的x家族聚合酶的同源氨基酸序列相比时,包含氨基酸修饰,其中氨基酸在以下氨基酸中的一个或更多个处被修饰:
[0136]
v32、a33、i34、f35、a53、v68、v71、e97、i101、m108、g109、a110、q115、v116、s125、t137、q143、m152、e153、n154、h155、n156、q157、i158、i165、n169、n173、s175、e176、g177、p178、c179、l180、a181、f182、m183、r184、a185、l188、h194、a195、i196、s197、s198、s199、k200、e203、g204、d210、q211、t212、k213、a214、i216、e217、d218、l220、y222、v228、d230、q238、t239、l242、l251、k260、g261、f262、h263、s264、l265、e267、q269、a270、d271、n272、a273、h275、f276、t277、k278、m279、q280、k281、s291、a292、a293、v294、c295、k296、e298、a299、q300、a301、q304、i305、t309、v310、r311、l312、i313、a314、i318、v319、t320、g328、k329、e330、c331、l338、t341、p342、e343、m344、g345、k346、w349、l350、l351、n352、r353、l354、i355、n356、r357、l358、q359、n360、q361、g362、i363、l364、l365、y366、y367、d368、i369、v370、k376、t377、c381、k383、d388、h389、f390、q391、k392、f394、i397、k398、k400、k401、e402、l403、a404、a405、g406、r407、d411、a421、p422、p423、v424、d425、n426、f427、a430、r438、f447、a448、r449、h450、e451、r452、k453、m454、l455、l456、d457、n458、h459、a460、l461、y462、d463、k464、t465、k466、k467、t474、d477、d485、y486、i487、d488、p489。
[0137]
改进溶解度的修饰包括下文序列中突出显示示出的氨基酸区域wllnrlinrlqnqgillyydiv内的修饰。
[0138][0139]
改进经修饰的核苷酸的掺入的修饰可以在下文示出的选择的区域中的一个或更多个处。区域根据突变数据(图1和图3)、序列比对(图2)和从与dna和3
’‑
修饰的dntp共结晶的斑点雀鳝tdt获得的结构数据(图4

14)来选择。第二个修饰可以选自下文序列中突出显示示出的氨基酸区域vaif、mga、menhnqi、segpclafmra、haisss、dqtka、kgfhs、qadna、hftkmqk、saavck、eaqa、tvrli、gkec、tpemgk、yydiv、dhfqk、laag、appvdnf、farherkmlldnhalydktkk和dyidp中的一个或更多个。
[0140][0141]
改进经修饰的核苷酸的掺入的特定修饰可以在下文示出的选择的区域中的一个或更多个处。第二个修饰可以选自下文序列中突出显示示出的氨基酸区域vaif、mga、enhnq、fmra、hai、tka、fhs、qadna、mqk、saavck、eaqa、tvr、kec、tpemgk、dhfq、laag、appvdn、farherkmlldnha和yidp中的一个或更多个。
[0142][0143]
本文描述了一种修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)在与野生型序列seq id no 1或其他物种中的末端脱氧核苷酸转移酶(tdt)的同源氨基酸序列相比时,包含至少一个氨基酸修饰,其中所述修饰选自seq id no 1的序列的氨基酸区域wllnrlinrlqnqgillyydiv、vaif、mga、menhnqi、segpclafmra、haisss、dqtka、kgfhs、qadna、hftkmqk、saavck、eaqa、tvrli、gkec、tpemgk、dhfqk、laag、appvdnf、farherkmlldnhalydktkk和dyidp中的一个或更多个或者其他物种中的同源区域。
[0144]
对特定序列的提及包括其截短形式。本文包括了修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)在与野生型序列seq id no 1或其截短形式或者其他物种中的末端脱氧核苷酸转移酶(tdt)的同源氨基酸序列相比时,包含至少一个氨基酸修饰,其中所述修饰选自seq id no 1的序列的氨基酸区域wllnrlinrlqnqgillyydiv、vaif、mga、menhnqi、segpclafmra、haisss、dqtka、kgfhs、qadna、hftkmqk、saavck、eaqa、tvrli、gkec、tpemgk、dhfqk、laag、appvdnf、farherkmlldnhalydktkk和dyidp中的一个或更多个或者其他物种的同源区域。
[0145]
截短的蛋白可以包括至少下文示出的区域
[0146][0147]
本文描述了修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)包含至少以下序列:
[0148][0149]
或其他物种中的同源区域,其中该序列在序列的以下氨基酸区域中的一个或更多个中具有一个或更多个氨基酸修饰:wllnrlinrlqnqgillyydi、menhnqi、segpclafmra、haisss、dqtka、kgfhs、qadna、hftkmqk、saavck、eaqa、tvrli、gkec、tpemgk、dhfqk、laag、appvdnf、farherkmlldnhalydktkk和dyidp。
[0150][0151]
本文公开了一种修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)在与野生型序列相比时包含至少一个氨基酸修饰,其中所述修饰选自seq id no 1的序列的氨基酸区域wllnrlinrlqnqgillyydi、vaif、mga、menhnqi、segpclafmra、haisss、dqtka、kgfhs、qadna、hftkmqk、saavck、eaqa、tvrli、gkec、tpemgk、dhfqk、laag、appvdnf、farherkmlldnhalydktkk和dyidp中的一个或更多个或者其他物种中的同源区域。
[0152]
本文公开了一种修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)在与野生型序列相比时包含至少一个氨基酸修饰,其中所述修饰选自seq id no 1的序列的氨基酸区域wllnrlinrlqnqgillyydi、vaif、mga、enhnq、fmra、hai、tka、fhs、qadna、mqk、saavck、eaqa、tvr、kec、tpemgk、dhfq、laag、appvdn、farherkmlldnha和yidp中的一个或更多个或者其他物种中的同源区域。
[0153]
本文描述了一种修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)在与野生型序列seq id no 1或其他物种中的末端脱氧核苷酸转移酶(tdt)的同源氨基酸序列相比时,包含至少一个氨基酸修饰,其中所述修饰选自seq id no 1的序列的氨基酸区域wllnrlinrlqnqgillyydi、vaif、mga、enhnq、fmra、hai、tka、fhs、qadna、mqk、saavck、eaqa、tvr、kec、tpemgk、dhfq、laag、appvdn、farherkmlldnha和yidp中的一个
或更多个或者其他物种中的同源区域。
[0154]
同源是指两种或更多种蛋白(包括来自同一生物体物种中的超家族的蛋白以及来自不同物种的同源蛋白)之间具有共同进化起源的蛋白序列。这样的蛋白(及其编码核酸)具有序列同源性,如通过它们的序列相似性(无论是在同一性百分比方面,还是通过特定残基或基序和保守位置的存在)反映的。可以使用各种蛋白(及其编码核酸)序列比对工具确定序列同源性。例如,由欧洲分子生物学实验室(embl)提供的clustal omega多序列比对程序可以用于确定序列同源性或同源区域。
[0155]
如本文描述的改进的序列可以包含两个修饰,即
[0156]
a.第一个修饰在seq id no 1的序列的氨基酸区域wllnrlinrlqnqgillyydiv内或其他物种中的同源区域内;并且
[0157]
b.第二个修饰选自seq id no 1的序列的氨基酸区域vaif、mga、menhnqi、segpclafmra、haisss、dqtka、kgfhs、qadna、hftkmqk、saavck、eaqa、tvrli、gkec、tpemgk、dhfqk、laag、appvdnf、farherkmlldnhalydktkk和dyidp中的一个或更多个或者其他物种中的同源区域。
[0158]
序列可以是截短的。
[0159]
如本文描述的改进的序列可以包含两个修饰,即
[0160]
a.第一个修饰在seq id no 1的序列的氨基酸区域wllnrlinrlqnqgillyydi内或其他物种中的同源区域内;并且
[0161]
b.第二个修饰选自seq id no 1的序列的氨基酸区域vaif、mga、enhnq、fmra、hai、tka、fhs、qadna、mqk、saavck、eaqa、tvr、kec、tpemgk、dhfq、laag、appvdn、farherkmlldnha和yidp中的一个或更多个或者其他物种中的同源区域。
[0162]
作为与其他物种的比较,家牛(牛)tdt的序列在下文示出:
[0163][0164]
序列中的同源区域在下文突出显示。
[0165]
改进溶解度的修饰包括下文序列中突出显示示出的氨基酸区域qllpkvinlwekkglllyydlv内的修饰。
[0166][0167]
改进经修饰的核苷酸的掺入的修饰可以在下文示出的选择的区域中的一个或更多个处。第二个修饰可以选自下文序列中突出显示示出的氨基酸区域lvlf、mga、lnnynhi、nevsyvtfmra、ftiism、dkvkc、mgfrs、msdkt、kftkmqk、vscvtr、eaea、avwafl、gkki、spgsae、yydlv、dhfqk、mcpyenr、yatherkmmldnhalydktkr和dyiep中的一个或更多个。
[0168][0169]
改进经修饰的核苷酸的掺入的修饰可以在下文示出的选择的区域中的一个或更多个处。第二个修饰可以选自下文序列中突出显示示出的氨基酸区域lvlf、mga、nnynh、fmra、fti、vkc、frs、msdkt、mqk、eaea、avw、kki、spgsae、dhfq、mcpyen、yatherkmmldnha和yiep中的一个或更多个。
[0170][0171][0172]
作为与其他物种的比较,小家鼠(小鼠)tdt的序列在下文示出:
[0173][0174]
改进溶解度的修饰包括下文序列中突出显示示出的氨基酸区域qllhkvtdfwkqqglllycdil内的修饰。
[0175][0176]
改进经修饰的核苷酸的掺入的修饰可以在下文示出的选择的区域中的一个或更多个处。第二个修饰可以选自下文序列中突出显示示出的氨基酸区域lvlf、mga、lnnynql、negsclafmra、fpitsm、dkvks、mgfrt、qsdks、rftqmqk、vscvnr、eaea、avvtfl、gkmt、speate、dhfqk、sgq、mcpydrr、yatherkmmldnhalydrt、r和dyiep中的一个或更多个。
[0177][0178]
改进经修饰的核苷酸的掺入的修饰可以在下文示出的选择的区域中的一个或更多个处。第二个修饰可以选自下文序列中突出显示示出的氨基酸区域lvlf、mga、lnnynq、negsclafmra、fpi、vks、frt、skiqsdks、mqk、vscvnr、eaea、avv、kmt、speate、dhfqk、mcpydr、yatherkmmldnha和yiep中的一个或更多个。
[0179][0180]
改进经修饰的核苷酸的掺入的修饰可以在下文示出的选择的区域中的一个或更多个处。第二个修饰可以选自下文序列中突出显示示出的氨基酸区域lvlf、mga、nnynq、fmra、fpi、vks、frt、qsdks、mqk、vscvnr、eaea、avv、kmt、speate、dhfq、mcpydr、yatherkmmldnha和yiep中的一个或更多个。
[0181][0182]
因此,通过比对序列的过程,立即明显的是来自其他物种的末端转移酶序列中的哪些区域对应于本文关于seq id no 1中示出的斑点雀鳝序列描述的序列。
[0183]
序列同源性扩展至x家族聚合酶的所有经修饰的成员或野生型成员,诸如dna polμ(也称为dna聚合酶μ或polm)、dna polβ(也称为dna聚合酶β或polb)和dna polλ(也称为dna聚合酶λ或poll)。本领域熟知,其中tdt是成员的所有x家族成员聚合酶要么具有末端转移酶活性,要么可以被工程化以获得类似于末端脱氧核苷酸转移酶的末端转移酶活性(biochim biophys acta.2010 may;1804(5):1136

1150)。例如,当以下人类tdt环1氨基酸序列
[0184]
...estfeklrlpsrkvdaldhf...
[0185]
被工程化为替代以下人类polμ氨基酸残基
[0186]
...hsccesptrlaqqshmoaf...时,
[0187]
包含人类tdt环1的嵌合人类polμ获得了稳健的末端转移酶活性(nucleic acids res.2006sep;34(16):4572

4582)。
[0188]
此外,在美国专利申请第2019/0078065号中一般地展示了,x家族聚合酶在被工程化为包含tdt环1嵌合体时可以获得稳健的末端转移酶活性。另外地,还展示了tdt可以通过环1基序中的特定突变转化为模板依赖性聚合酶(nucleic acids research,jun 2009,37(14):4642

4656)。如本领域已表明的,x家族聚合酶可以被一般地修饰为显示出模板依赖性或非模板依赖性核苷酸转移酶活性。因此,在本专利中展示的所有基序、区域和突变可以被一般地扩展至修饰的x家族聚合酶,以使得修饰的x家族聚合酶通常能够掺入3
’‑
修饰的
核苷酸、可逆终止核苷酸和经修饰的核苷酸,以实现核酸合成的方法。
[0189]
作为与其他x家族聚合酶的比较,人类polμ序列在下文示出:
[0190][0191]
改进溶解度的修饰包括下文序列中突出显示示出的氨基酸区域gllprvmcrlqdqglilyhqhq内的修饰。
[0192][0193]
改进经修饰的核苷酸的掺入的修饰可以在下文示出的选择的区域中的一个或更多个处。第二个修饰可以选自下文序列中突出显示示出的氨基酸区域vaiy、lga、lthhntg、segrlltfcraa、spvttl、ehssr、eglrt、reqp、kltqqqka、stpvlr、dvda、avgqa、gklq、hpkegq、yhqhq、dafer、vapvsq、fsrkekglwlnshglfdpeqk和eylpp中的一个或更多个。
[0194][0195]
因此,通过比对序列的过程,立即明显的是来自任何物种的所有x家族聚合酶的序列中的哪些区域对应于本文关于seq id no 1中示出的斑点雀鳝序列描述的序列。
[0196]
此外,展示了a家族聚合酶dna polθ(也称为dna聚合酶θ或polq)显示出稳健的末端转移酶能力(elife.2016;5:e13740)。dna polθ也展示出可用于核酸合成的方法(英国专利申请第2553274号)。在美国专利申请第2019/0078065号中,展示了dna polθ和x家族聚合酶的嵌合体可以被工程化以获得稳健的末端转移酶活性,并且变得有能力用于核酸合成的方法。因此,在本专利中展示的所有基序、区域和突变可以被一般地扩展至修饰的a家族聚合酶,特别是dna polθ,以使得修饰的a家族聚合酶通常能够掺入3
’‑
修饰的核苷酸、可逆终
止核苷酸和修饰的核苷酸,以实现核酸合成的方法。
[0197]
发明详述
[0198]
本文描述了修饰的末端脱氧核苷酸转移酶(tdt)。末端转移酶在自然界中普遍存在,并且存在于许多物种中。许多已知的tdt序列已经被报道在ncbi数据库中。本文描述的序列从斑点雀鳝的序列进行修饰,但是对应的变化可以引入来自其他物种的同源序列中。polμ、polβ、polλ和polθ的同源氨基酸序列或x家族聚合酶的同源氨基酸序列也具有末端转移酶活性。对末端转移酶的提及也包括polμ、polβ、polλ和polθ的同源氨基酸序列或x家族聚合酶的同源氨基酸序列,其中这样的序列具有末端转移酶活性。
[0199]
本文公开了一种修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)在与野生型序列相比时包含至少一个氨基酸修饰,其中所述修饰选自seq id no 1的序列的氨基酸区域wllnrlinrlqnqgillyydiv、vaif、mga、menhnqi、segpclafmra、haisss、dqtka、kgfhs、qadna、hftkmqk、saavck、eaqa、tvrli、gkec、tpemgk、dhfqk、laag、appvdnf、farherkmlldnhalydktkk和dyidp中的一个或更多个或者其他物种中的同源区域。
[0200]
本文描述了修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)包含至少序列id 729:
[0201][0202]
或其他物种中的等同同源区域,其中该序列在序列的以下氨基酸区域中的一个或更多个中具有一个或更多个氨基酸修饰:wllnrlinrlqnqgillyydiv、menhnqi、segpclafmra、haisss、dqtka、kgfhs、qadna、hftkmqk、saavck、eaqa、tvrli、gkec、tpemgk、dhfqk、laag、appvdnf、farherkmlldnhalydktkk和dyidp。以上355个氨基酸的序列可以在不影响酶的功能的情况下被附接至其他氨基酸。例如,可以存在另外的单纯地作为蛋白酶裂解位点掺入的n末端序列,例如序列menlyfqg。
[0203]
公开了一种修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)在与野生型序列seq id no 1或其他物种中的末端脱氧核苷酸转移酶(tdt)的同源氨基酸序列相比时,包含至少一个氨基酸修饰,其中所述修饰选自seq id no 1的序列的氨基酸区域wllnrlinrlqnqgillyydi、vaif、mga、enhnq、fmra、hai、tka、fhs、qadna、mqk、saavck、eaqa、tvr、kec、tpemgk、dhfq、laag、appvdn、farherkmlldnha和yidp中的一个或更多个或者其他物种中的同源区域。
[0204]
还公开了一种修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)在与野生型序列seq id no 1或其他物种中的末端脱氧核苷酸转移酶(tdt)的同源氨基酸序列相比时,包含至少两个氨基酸修饰,其中;
[0205]
a.第一个修饰在seq id no 1的序列的氨基酸区域wllnrlinrlqnqgillyydiv内或其他物种中的同源区域内;并且
[0206]
b.第二个修饰选自seq id no 1的序列的氨基酸区域vaif、mga、enhnq、fmra、hai、
tka、fhs、qadna、mqk、saavck、eaqa、tvr、kec、tpemgk、dhfq、laag、appvdn、farherkmlldnha和yidp中的一个或更多个或者其他物种中的同源区域。
[0207]
当与家牛(牛)tdt的序列seq id no 2比较时;
[0208]
a.第一个修饰在seq id no 2的序列的氨基酸区域qllpkvinlwekkglllyydlv内或其他物种中的同源区域内;并且
[0209]
b.第二个修饰选自seq id no 2的序列的氨基酸区域lvlf、mga、nnynh、fmra、fti、vkc、frs、msdkt、mqk、eaea、avw、kki、spgsae、mcp、yatherkmmldnha和yiep中的一个或更多个或者其他物种中的同源区域。
[0210]
当与小家鼠(小鼠)tdt的序列seq id no 3比较时;
[0211]
a.第一个修饰在seq id no 3的序列的氨基酸区域qllhkvtdfwkqqglllycdil内或其他物种中的同源区域内;并且
[0212]
b.第二个修饰选自seq id no 3的序列的氨基酸区域lvlf、mga、nnynq、fmra、fpi、vks、frt、qsdks、mqk、vscvnr、eaea、avv、kmt、speate、dhfq、mcpydr、yatherkmmldnha和yiep中的一个或更多个或者其他物种中的同源区域。
[0213]
修饰可以选自不同于野生型序列的任何氨基酸。氨基酸可以是天然存在的氨基酸。修饰的氨基酸可以选自ala、arg、asn、asp、cys、gln、glu、gly、his、ile、leu、lys、met、phe、pro、ser、thr、trp、val和sec。
[0214]
为了简洁的目的,还描述了与seq id no 1有关的修饰,但是修饰适用于来自其他物种的序列,例如以上列出的具有ncbi数据库中的序列的那些序列。序列修饰也适用于seq id no 1的截短形式。
[0215]
序列还可以在除了描述的那些区域以外的位置处被修饰。本发明的实施方案可以包括例如在定义的位置以外具有对氨基酸的修饰的序列,条件是这些序列保留末端转移酶活性。本发明的实施方案可以包括例如在定义的位置以外具有氨基酸截短的序列,条件是这些序列保留末端转移酶活性。例如,序列可以如申请wo2018215803中描述地是brct截短的,其中氨基酸被从n

末端去除,同时保留或改进活性。因此,对要求保护的区域以外的氨基酸位置的改变、添加、插入或缺失或截短都在本发明的范围内,条件是如所定义的要求保护的区域如要求保护的那样被修饰。本文描述的序列是指tdt酶,其长度通常是至少300个氨基酸。本文描述的所有序列都可以被视为具有至少300个氨基酸。权利要求不包括不作为末端转移酶发挥功能的肽片段或序列。
[0216]
区域wllnrlinrlqnqgillyydiv或来自其他物种的对应区域内的修饰有助于改进酶的溶解度。氨基酸区域wllnrlinrlqnqgillyydiv内的修饰可以在加下划线的氨基酸中的一个或更多个处。
[0217]
特定的变化可以选自w

q、n

p、r

k、l

v、r

l、l

w、q

e、n

k、q

k或i

l。
[0218]
序列wllnrlinrlqnqgillyydiv可以被改变为qllpkvinlwekkglllyydlv。
[0219]
与野生型序列相比,第二个修饰改进了在3’位置处具有修饰的核苷酸的掺入。第二个修饰可以选自seq id no 1的序列的氨基酸区域vaif、mga、enhnq、fmra、hai、tka、fhs、qadna、mqk、saavck、eaqa、tvr、kec、tpemgk、dhfq、laag、appvdn、farherkmlldnha和yidp中的一个或更多个或者其他物种中的同源区域。第二个修饰可以选自seq id no 1的序列的氨基酸区域vaif、edn、mga、enhnq、fmra、hai、tka、fhs、qadna、mqk、saavck、eaqa、tvr、kec、
tpemgk、dhfq、laag、appvdn、farherkmlldnha和yidp中的两个或更多个或者下文序列中突出显示示出的在其他物种中的同源区域。
[0220][0221]
鉴定的位置从位置v32、m108、f182、t212、d271、m279、e298、a421、l456、y486处开始。本文公开的修饰包含定义的位置处的至少一个修饰。
[0222]
在下文的序列中,修饰的区域是这样编号的
[0223][0224]
wllnrlinrlqnqgillyydiv,349至370
[0225]
vaif,32至35
[0226]
mga,108至110
[0227]
menhnqi,152至158
[0228]
segpclafmra,175至185
[0229]
haisss,194至199
[0230]
dqtka,210至214
[0231]
kgfhs,260至264
[0232]
qadna,269至273
[0233]
hftkmqk,275至281
[0234]
saavck,291至296
[0235]
eaqa,298至301
[0236]
tvrli,309至313
[0237]
gkec,328至331
[0238]
tpemgk,341至346
[0239]
dhfqk,388至392
[0240]
laag,403至406
[0241]
appvdnf,421至427
[0242]
farherkmlldnhalydktkk,447至467
[0243]
dyidp,485至489
[0244]
修饰的氨基酸可以在区域fmra中。修饰的氨基酸可以在区域qadna中。修饰的氨基酸可以在区域eaqa中。修饰的氨基酸可以在区域app中。修饰的氨基酸可以在区域ldnha中。修饰的氨基酸可以在区域yidp中。区域farherkmlldnha有利于去除修饰中的底物偏倚(substrate biases)。farherkmlldnha区域看起来在物种间高度保守。
[0245]
选自氨基酸区域fmra、qadna、eaqa、app、farherkmlldnha和yidp中的一个或更多个的修饰可以在一个或更多个加下划线的氨基酸处。
[0246]
可以通过某些指定的氨基酸处的修饰来定义序列,而不是通过指定的结构域中的修饰来描述本发明。本文描述了修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)在与野生型序列seq id no 1或其截短形式或者其他物种中的末端脱氧核苷酸转移酶(tdt)的同源氨基酸序列相比时,包含氨基酸修饰,其中氨基酸在以下氨基酸中的一个或更多个处被修饰:a53、v68、v71、e97、i101、g109、q115、v116、s125、t137、q143、m152、n154、h155、q157、i158、i165、n169、s175、g177、c179、l180、a181、m183、a195、s197、s198、s199、k200、d210、q211、t212、k213、a214、e217、t239、k260、f262、s264、q269、d271、n272、a273、h275、t277、k281、s291、k296、q300、t309、r311、l312、i313、g328、e330、c331、t341、p342、e343、m344、g345、k346、n352、r353、l354、i355、n356、l358、n360、q361、g362、i363、y366、y367、d368、v370、h389、k392、l403、a405、g406、d411、a421、p422、v424、n426、f427、r438、f447、r452、k453、l455、y462、k464、t465、k467、d485、i487和/或d488。
[0247]
本文描述了修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)在与野生型序列seq id no 1或其他物种中的末端脱氧核苷酸转移酶(tdt)的同源氨基酸序列相比时,包含氨基酸修饰,其中氨基酸在以下氨基酸中的一个或更多个处被修饰:
[0248]
v32、a33、i34、f35、a53、v68、v71、e97、i101、m108、g109、a110、q115、v116、s125、t137、q143、m152、e153、n154、h155、n156、q157、i158、i165、n169、n173、s175、e176、g177、p178、c179、l180、a181、f182、m183、r184、a185、l188、h194、a195、i196、s197、s198、s199、k200、e203、g204、d210、q211、t212、k213、a214、i216、e217、d218、l220、y222、v228、d230、q238、t239、l242、l251、k260、g261、f262、h263、s264、l265、e267、q269、a270、d271、n272、a273、h275、f276、t277、k278、m279、q280、k281、s291、a292、a293、v294、c295、k296、e298、a299、q300、a301、q304、i305、t309、v310、r311、l312、i313、a314、i318、v319、t320、g328、k329、e330、c331、l338、t341、p342、e343、m344、g345、k346、w349、l350、l351、n352、r353、l354、i355、n356、r357、l358、q359、n360、q361、g362、i363、l364、l365、y366、y367、d368、i369、v370、k376、t377、c381、k383、d388、h389、f390、q391、k392、f394、i397、k398、k400、k401、e402、l403、a404、a405、g406、r407、d411、a421、p422、p423、v424、d425、n426、f427、a430、r438、f447、a448、r449、h450、e451、r452、k453、m454、l455、l456、d457、n458、h459、a460、l461、y462、d463、k464、t465、k466、k467、t474、d477、d485、y486、i487、d488、p489。
[0249]
具体的氨基酸变化可以包括以下中的任何一个:a53g、v68i、v71i、e97a、i101v、g109e、g109r、q115e、v116i、v116s、s125r、t137a、q143p、m152l、m152t、n154h、h155c、h155n、h155r、q157k、q157r、i158v、i158l、i158m、i165v、n169r、n173r、s175n、g177s、
g177v、g177d、c179a、c179s、l180v、a181e、m183r、l188v、a195t、a195p、s197i、s197l、s198r、s198c、s199l、k200r、e203q、g204d、d210e、q211r、t212s、k213s、a214r、a214c、a214g、i216m、e217q、d218e、l220i、l220f、l220y、y222c、v228a、d230e、q238k、t239s、l242q、l251p、k260m、f262l、l265f、s264t、e267d、q269k、d271n、d271e、n272k、a273s、a273t、h275q、t277s、k281r、s291n、s291t、k296r、q300d、q304r、q304c、q304h、i305v、t309a、r311w、r311h、l312g、l312k、l312a、i313m、a314t、i318l、v319l、t320a、g328a、e330n、e330s、c331i、l338i、t341s、p342a、e343g、e343q、m344a、m344q、m344k、g345r、k346r、n352q、k353r、k353d、v354i、v354l、i355v、i355m、n356r、n356d、w358l、n360k、q361k、g362e、i363l、y366f、y367c、d368h、d368e、v370i、k376i、t377s、t377l、t377a、c381s、k383r、h389n、h389a、k392q、f394w、i397l、k398r、k400e、k400n、k401a、k401q、e402q、l403q、l403r、a405d、g406r、r407c、d411n、a421l、a421m、a421v、p422a、p422c、v424y、v424i、v424a、n426r、n426c、f427y、a430t、r438k、f447w、r452k、l455i、k453r、y462f、k464r、t465r、k467r、t474s、d477e、d485e、i487v和/或d488p。
[0250]
氨基酸变化包括以下中的任何两个或更多个:a53g、v68i、v71i、e97a、i101v、g109e、g109r、q115e、v116i、v116s、s125r、t137a、q143p、m152l、m152t、n154h、h155c、h155n、h155r、q157k、q157r、i158v、i158l、i158m、i165v、n169r、n173r、s175n、g177s、g177v、g177d、c179a、c179s、l180v、a181e、m183r、l188v、a195t、a195p、s197i、s197l、s198r、s198c、s199l、k200r、e203q、g204d、d210e、q211r、t212s、k213s、a214r、a214c、a214g、i216m、e217q、d218e、l220i、l220f、l220y、y222c、v228a、d230e、q238k、t239s、l242q、l251p、k260m、f262l、l265f、s264t、e267d、q269k、d271n、d271e、n272k、a273s、a273t、h275q、t277s、k281r、s291n、s291t、k296r、q300d、q304r、q304c、q304h、i305v、t309a、r311w、r311h、l312g、l312k、l312a、i313m、a314t、i318l、v319l、t320a、g328a、e330n、e330s、c331i、l338i、t341s、p342a、e343g、e343q、m344a、m344q、m344k、g345r、k346r、n352q、k353r、k353d、v354i、v354l、i355v、i355m、n356r、n356d、w358l、n360k、q361k、g362e、i363l、y366f、y367c、d368h、d368e、v370i、k376i、t377s、t377l、t377a、c381s、k383r、h389n、h389a、k392q、f394w、i397l、k398r、k400e、k400n、k401a、k401q、e402q、l403q、l403r、a405d、g406r、r407c、d411n、a421l、a421m、a421v、p422a、p422c、v424y、v424i、v424a、n426r、n426c、f427y、a430t、r438k、f447w、r452k、l455i、k453r、y462f、k464r、t465r、k467r、t474s、d477e、d485e、i487v和/或d488p。
[0251]
qadna至kadka、qadka、kadna、qadns、kadnt或qadnt的修饰有利于将3
’‑
o

修饰的核苷三磷酸掺入核酸的3
’‑
末端,并且去除在掺入修饰的核苷三磷酸期间的底物偏倚。appvdn至mcpvdn、mppvdn、acpvdr、vppvdn、lppvdr、acpydn、lcpvdn或mapvdn的修饰有利于将3
’‑
o

修饰的核苷三磷酸掺入核酸的3
’‑
末端,并且去除在掺入修饰的核苷三磷酸期间的底物偏倚。farherkmlldrha至warherkmildnha、farherkmildnha、warherkmlldnha、farherkmlldrha或farhekkmlldnha的修饰也有利于将3
’‑
o

修饰的核苷三磷酸掺入核酸的3
’‑
末端,并且去除在掺入修饰的核苷三磷酸期间的底物偏倚。
[0252]
修饰可以选自以下序列frra、qadka、eada、mpp、farherkmlldrha和yipp中的一个或更多个。包括了一种修饰的末端脱氧核苷酸转移酶(tdt),其中第二个修饰选自以下序列frra、qadka、eada、mpp、farherkmlldrha和yipp中的两个或更多个。包括了一种修饰的末端
脱氧核苷酸转移酶(tdt),其中第二个修饰包含以下序列frra、qadka、eada、mpp、farherkmlldrha和yipp中的每一个。
[0253]
本文示出的晶体结构显示了以下结构域,所述结构域可以优选作为待修饰的结构域:
[0254]
图5.menhnqi基序(152至158),所述menhnqi基序(152至158)包含enhnq基序
[0255]
图6.segpclafmra(175至185),所述segpclafmra(175至185)包含fmra基序,以黑色突出显示。
[0256]
图7.hftkmqk基序(275至281),所述hftkmqk基序(275至281)包含mqk基序,以黑色突出显示。
[0257]
图8.saavck基序(291至296),以黑色突出显示。
[0258]
图9.gkec基序(328至331),所述gkec基序(328至331)包含kec基序,以黑色突出显示。
[0259]
图10.dhfqk基序(388至392),所述dhfqk基序(388至392)包含dhfq基序,以黑色突出显示。
[0260]
图11.farherkmlldnha基序(447至460),以黑色球形突出显示。另外地,基序farherkmlldnha被突变为farherkmlldrha。
[0261]
图12.farherkmlldnhalydktkk基序(447至467),以黑色球形突出显示。另外地,基序farherkmlldnhalydktkk被突变为farherkmlldrhalydktkk。
[0262]
图13.dyidp基序(485至489),所述dyidp基序(485至489)包含yidp基序,以黑色球形突出显示。
[0263]
图14.yydiv基序(366至370),以黑色球形突出显示。
[0264]
图15.appvdnf,所述appvdnf包含appvdn基序(421至427),基序以黑色球形突出显示。在该结构中,显示appvdnf基序通过ala至met突变为mppvdnf。
[0265]
为了有助于表达序列的纯化,可以进一步修饰氨基酸。例如,氨基酸序列可以在末端包含一个或更多个另外的组氨酸残基。包括了一种修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)包含seq id no 4至seq id no 173中的任一个或其截短形式。序列4

173是来源于斑点雀鳝的全长序列。包括了一种修饰的末端脱氧核苷酸转移酶(tdt),所述修饰的末端脱氧核苷酸转移酶(tdt)包含seq id no 174至seq id no 343中的任一个。序列174至343是作为斑点雀鳝/牛嵌合体的n

截短序列。序列344至727是截短形式的斑点雀鳝序列。另外地,对于这些序列,存在单纯地作为蛋白酶裂解位点(menlyfqg...)掺入的n

末端序列。
[0266]
还公开了一种核酸合成的方法,所述方法包括以下步骤:
[0267]
(a)提供起始子寡核苷酸;
[0268]
(b)将3
’‑
封闭的核苷三磷酸在存在如本文定义的末端脱氧核苷酸转移酶(tdt)的情况下添加至所述起始子寡核苷酸中;
[0269]
(c)将所有试剂从起始子寡核苷酸去除;
[0270]
(d)使封闭基团在存在裂解剂的情况下裂解;并且
[0271]
(e)去除裂解剂。
[0272]
该方法可以通过重复步骤(b)至(e)来添加多于1个核苷酸。
[0273]
本文对“核苷三磷酸”的提及是指包含与三个磷酸基团结合的核苷(即附接至脱氧核糖或核糖的糖分子上的碱基)的分子。包含脱氧核糖的核苷三磷酸的实例是:脱氧腺苷三磷酸(datp)、脱氧鸟苷三磷酸(dgtp)、脱氧胞苷三磷酸(dctp)或脱氧胸苷三磷酸(dttp)。包含核糖的核苷三磷酸的实例是:腺苷三磷酸(atp)、鸟苷三磷酸(gtp)、胞苷三磷酸(ctp)或尿苷三磷酸(utp)。其他类型的核苷(诸如天然存在的修饰核苷和人工核苷)可以与三个磷酸结合形成核苷三磷酸。
[0274]
因此,本文对“3
’‑
封闭的核苷三磷酸”的提及是指在3’末端上具有阻止核苷酸进一步添加的另外的基团的核苷三磷酸,即通过用保护基团替代3
’‑
oh基团的核苷三磷酸(例如,datp、dgtp、dctp或dttp)。
[0275]
应当理解,本文对“3
’‑
封闭”、“3
’‑
封闭基团”或“3
’‑
保护基团”的提及是指附接至核苷三磷酸的3’末端的阻止进一步的核苷酸添加的基团。本发明的方法使用可逆的3
’‑
封闭基团,该3
’‑
封闭基团可以通过裂解去除以允许添加另外的核苷酸。相比之下,不可逆的3
’‑
封闭基团是指其中3
’‑
oh基团既不能暴露也不能通过裂解而暴露的dntp。
[0276]3’‑
封闭的核苷5
’‑
三磷酸可以被任何化学基团封闭,这些化学基团可以被去掩蔽(unmasked)以显露出3
’‑
oh。3
’‑
封闭的核苷三磷酸可以被以下封闭:3
’‑
o

叠氮甲基、3
’‑
氨基氧基、3
’‑
o

(n

肟)(3
’‑
o

n=cr1r2,其中r1和r2各自是c1

c3烷基基团,例如ch3,使得肟可以是o

n=c(ch3)2(n

丙酮肟))、3
’‑
o

烯丙基基团、3
’‑
o

氰乙基、3
’‑
o

乙酰基、3
’‑
o

硝酸酯、3
’‑
磷酸酯、3
’‑
o

乙酰基乙酰丙酸酯、3
’‑
o

叔丁基二甲基硅烷、3
’‑
o

三甲基(甲硅烷基)乙氧基甲基、3
’‑
o

邻硝基苄基和3'

o

对硝基苄基。
[0277]3’‑
封闭的核苷5
’‑
三磷酸也可以被任何可以直接用于化学连接(诸如铜催化的或不含铜的叠氮化物

炔烃点击反应和四嗪

烯烃点击反应)的化学基团封闭。3
’‑
封闭的核苷三磷酸可以包括包含叠氮化物、炔烃、烯烃和四嗪的化学部分。
[0278]
本文对“裂解剂”的提及是指能够将3
’‑
封闭基团从3
’‑
封闭的核苷三磷酸裂解的物质。在一种实施方案中,裂解剂是化学裂解剂。在替代实施方案中,裂解剂是酶促裂解剂。裂解可以在单一步骤中完成,或者可以是多步骤过程,例如将肟(诸如例如3
’‑
o

(n

肟),3
’‑
o

n=c(ch3)2)转化为氨基氧基(o

nh2),随后将氨基氧基裂解为oh。
[0279]
本领域技术人员将理解,裂解剂的选择取决于所使用的3
’‑
核苷酸封闭基团的类型。例如,三(2

羧乙基)膦(tcep)或三(羟丙基)膦(thpp)可以用于裂解3
’‑
o

叠氮甲基基团,钯络合物可以用于裂解3
’‑
o

烯丙基基团,或亚硝酸钠可以用于裂解3
’‑
氨基氧基基团。因此,在一种实施方案中,裂解剂选自:三(2

羧乙基)膦(tcep)、钯络合物或亚硝酸钠。
[0280]
在一种实施方案中,在存在包含变性剂诸如尿素、氯化胍、甲酰胺或甜菜碱的裂解溶液的情况下,添加裂解剂。添加变性剂具有能够破坏dna中任何不期望的二级结构的优点。在另外的实施方案中,裂解溶液包含一种或更多种缓冲剂。本领域技术人员将理解,缓冲剂的选择取决于所期望的确切裂解化学和裂解剂。
[0281]
本文对“起始子寡核苷酸”或“起始子序列”的提及是指具有可以附接3
’‑
封闭的核苷三磷酸的游离3
’‑
末端的短寡核苷酸。在一种实施方案中,起始子序列是dna起始子序列。在替代实施方案中,起始子序列是rna起始子序列。
[0282]
本文对“dna起始子序列”的提及是指3
’‑
封闭的核苷三磷酸可以附接(即,dna会从dna起始子序列的末端合成)的一小段dna序列。
[0283]
在一种实施方案中,起始子序列长度在5个与50个核苷酸之间,诸如长度在5个与30个核苷酸之间(即在10个与30个核苷酸之间),特别是长度在5个与20个核苷酸之间(即长度在大约20个核苷酸),更特别是长度在5个至15个核苷酸,例如长度在10个至15个核苷酸,特别是长度在12个核苷酸。
[0284]
在一种实施方案中,起始子序列是单链的。在替代实施方案中,起始子序列是双链的。本领域技术人员应当理解,3
’‑
突出端(即,游离3
’‑
末端)允许有效的添加。
[0285]
在一种实施方案中,起始子序列被固定在固体支持物上。这允许tdt和裂解剂在不洗去合成的核酸的情况下被去除(分别在步骤(c)和(e)中)。起始子序列可以附接至在水性条件下稳定的固体支持物上,使得方法可以经由流动装置容易地进行。
[0286]
在一种实施方案中,起始子序列经由可逆的相互作用部分固定在固体支持物上,所述相互作用部分诸如可化学裂解接头、抗体/免疫原性表位、生物素/生物素结合蛋白(诸如抗生物素蛋白或链霉抗生物素蛋白)或谷胱甘肽

gst标签。因此,在另外的实施方案中,方法另外地包括通过去除起始子序列中的可逆的相互作用部分,诸如通过与蛋白酶k孵育,来提取所得核酸。
[0287]
在一种实施方案中,起始子序列包含酶可识别的碱基或碱基序列。被酶诸如糖基化酶识别的碱基,可以被去除以产生可以被化学或酶促手段裂解的无碱基位点。碱基序列可以被限制性酶识别和裂解。
[0288]
在另外的实施方案中,起始子序列通过可化学裂解接头固定在固体支持物上,所述可化学裂解接头诸如二硫化物、烯丙基或叠氮化物掩蔽的半缩胺醚接头(azide

masked hemiaminal ether linker)。因此,在一种实施方案中,方法另外地包括通过添加以下来裂解化学接头从而提取所得核酸:用于二硫化物接头的三(2

羧乙基)膦(tcep)或二硫苏糖醇(dtt);用于烯丙基接头的钯络合物;或者用于叠氮化物掩蔽的半缩胺醚接头的tcep。
[0289]
在一种实施方案中,将所得核酸提取并且使用结合至固体支持物上的核酸作为模板通过聚合酶链式反应进行扩增。因此,起始子序列可以包含可以被合成的适当的正向引物序列和适当的反向引物。
[0290]
在一种实施方案中,本发明的末端脱氧核苷酸转移酶(tdt)在存在延伸溶液的情况下添加,该延伸溶液包含一种或更多种缓冲剂(例如tris或二甲次砷酸盐)、一种或更多种盐(例如,na
+
、k
+
、mg
2+
、mn
2+
、cu
2+
、zn
2+
、co
2+
等,全都具有适当的反离子,诸如ci)和无机焦磷酸酶(例如,酿酒酵母(saccharomyces cerevisiae)同源物)。应当理解,缓冲剂和盐的选择取决于最佳的酶活性和稳定性。无机焦磷酸酶的使用有助于降低由tdt水解核苷三磷酸引起的焦磷酸的积累。因此,无机焦磷酸酶的使用具有降低(1)和(2)的速率的优点:(1)逆向反应和(2)tdt链歧化。
[0291]
在一种实施方案中,步骤(b)在5与10之间ph范围进行。因此,应当理解,可以使用具有ph 5

10的缓冲范围的任何缓冲剂,例如二甲次砷酸盐、tris、hepes或tricine,特别是二甲次砷酸盐或tris。
[0292]
在一种实施方案中,步骤(d)在低于99℃,诸如低于95℃、90℃、85℃、80℃、75℃、70℃、65℃、60℃、55℃、50℃、45℃、40℃、35℃或30℃的温度进行。应当理解,最佳温度取决于所使用的裂解剂。所使用的温度有助于裂解并破坏核苷酸添加期间形成的任何二级结构。
[0293]
在一种实施方案中,步骤(c)和(e)通过施加洗涤溶液来进行。在一种实施方案中,洗涤溶液包含与本文描述的延伸溶液中所使用的相同的缓冲剂和盐。这样具有以下的优点:允许洗涤溶液在步骤(c)之后被收集并且在重复方法步骤时作为步骤(b)中的延伸溶液再循环。
[0294]
还公开了一种试剂盒,所述试剂盒包含与起始子序列和一种或更多种3
’‑
封闭的核苷三磷酸组合的如本文定义的末端脱氧核苷酸转移酶(tdt)。
[0295]
本发明包括用于表达修饰的末端转移酶的核酸序列。本发明包括表达修饰的末端转移酶的经密码子优化的cdna序列。包括每种蛋白变体(seq id no 4

727)的经密码子优化的cdna序列。
[0296]
核酸序列可以是下文的序列(id 728):
[0297][0298]
本发明包括产生修饰的末端转移酶的细胞系。
实施例
[0299]
tdt变体的表达
[0300]
简言之,将包含编码末端转移酶的基因的质粒转化到bl21大肠杆菌(e.coli)感受态细胞中。起始luria肉汤(lb)培养物在37℃生长过夜,并且接种到lb表达培养物中。表达培养物生长至在600nm处0.6的光密度,并且通过将iptg添加至1mm来诱导。培养物在25℃诱导并生长过夜。第二天早上,将培养物在去垢剂裂解缓冲液中裂解,并且通过固定金属亲和层析(imac)纯化至均匀。
[0301]
测定通过tdt变体进行的可逆终止子的掺入
[0302]
将173种末端转移酶表达、纯化,并且与野生型牛tdt(seq id no 2)进行了比较。然后将纯化的工程化tdt用于以下测定中:将荧光标记的15

nt ssdna引物与1
×
tdt缓冲液
(thermo fisher scientific)、酵母无机焦磷酸酶(sigma

aldrich,0.1mu/μl)、3
’‑
叠氮甲基dttp或3
’‑
氨基氧基datp和工程化tdt(24μg/μl)在37℃孵育10min。然后使用甲酰胺(fisher scientific)使反应猝灭,并且将样品直接装载到变性聚丙烯酰胺凝胶电泳上并通过变性聚丙烯酰胺凝胶电泳进行分析。对凝胶进行成像,并且将所得凝胶条带用typhoon扫描仪(ge)定量。
[0303]
来自173种tdt酶(seq id no 1

173)的结果示于图1中。
[0304]
测定通过tdt变体进行的经碱基修饰的可逆终止子的掺入
[0305][0306]
a*描述3
’‑
氨基氧基6

叠氮基2
’‑
脱氧腺苷5
’‑
三磷酸;c*描述3
’‑
氨基氧基4

叠氮基5

甲基2
’‑
脱氧胞苷5
’‑
三磷酸;g*描述3
’‑
氨基氧基2

叠氮基2
’‑
脱氧鸟苷5
’‑
三磷酸;t*描述了3
’‑
氨基氧基5

(

羟基
‑1‑
丁炔基)2
’‑
脱氧尿苷5
’‑
三磷酸。
[0307]
将192种末端脱氧核苷酸转移酶(tdt)变体如上文描述地进行表达和纯化。表达的变体具有seq id no:345、seq id no:347、seq id no:352、seq id no:357、seq id no:359、seq id no:360、seq id no:361、seq id no:362、seq id no:364、seq id no:365、seq id no:366、seq id no:367、seq id no:368、seq id no:370、seq id no:371、seq id no:372、seq id no:375、seq id no:376、seq id no:377、seq id no:378、seq id no:380、seq id no:382、seq id no:383、seq id no:384、seq id no:385、seq id no:387、seq id no:388、seq id no:392、seq id no:393、seq id no:394、seq id no:395、seq id no:397、seq id no:398、seq id no:399、seq id no:401、seq id no:405、seq id no:406、seq id no:410、seq id no:411、seq id no:416、seq id no:418、seq id no:422、seq id no:426、seq id no:427、seq id no:430、seq id no:433、seq id no:436、seq id no:439、seq id no:440、seq id no:442、seq id no:444、seq id no:445、seq id no:446、seq id no:447、seq id no:450、seq id no:453、seq id no:454、seq id no:455、seq id no:457、seq id no:460、seq id no:461、seq id no:462、seq id no:463、seq id no:464、seq id no:467、seq id no:472、seq id no:473、seq id no:475、seq id no:476、seq id no:477、seq id no:
478、seq id no:479、seq id no:480、seq id no:485、seq id no:486、seq id no:487、seq id no:489、seq id no:492、seq id no:494、seq id no:495、seq id no:497、seq id no:499、seq id no:500、seq id no:503、seq id no:505、seq id no:506、seq id no:507、seq id no:509、seq id no:510、seq id no:514、seq id no:516、seq id no:517、seq id no:519、seq id no:524、seq id no:525、seq id no:526、seq id no:527、seq id no:528、seq id no:529、seq id no:531、seq id no:532、seq id no:533、seq id no:535、seq id no:543、seq id no:544、seq id no:546、seq id no:550、seq id no:553、seq id no:555、seq id no:557、seq id no:559、seq id no:560、seq id no:561、seq id no:562、seq id no:564、seq id no:565、seq id no:567、seq id no:568、seq id no:570、seq id no:572、seq id no:573、seq id no:575、seq id no:580、seq id no:582、seq id no:584、seq id no:589、seq id no:593、seq id no:595、seq id no:598、seq id no:599、seq id no:600、seq id no:601、seq id no:604、seq id no:605、seq id no:606、seq id no:609、seq id no:611、seq id no:612、seq id no:614、seq id no:618、seq id no:619、seq id no:620、seq id no:623、seq id no:629、seq id no:637、seq id no:638、seq id no:639、seq id no:641、seq id no:643、seq id no:644、seq id no:646、seq id no:648、seq id no:649、seq id no:651、seq id no:652、seq id no:654、seq id no:657、seq id no:658、seq id no:660、seq id no:661、seq id no:662、seq id no:664、seq id no:665、seq id no:666、seq id no:667、seq id no:670、seq id no:673、seq id no:678、seq id no:679、seq id no:681、seq id no:684、seq id no:685、seq id no:687、seq id no:690、seq id no:692、seq id no:698、seq id no:699、seq id no:700、seq id no:703、seq id no:706、seq id no:707、seq id no:708、seq id no:711、seq id no:712、seq id no:715、seq id no:716、seq id no:717、seq id no:718、seq id no:720、seq id no:721、seq id no:722、seq id no:725。
[0308]
在单核苷酸掺入测定中,经碱基修饰的可逆终止子a*、c*、g*和t*作为底物提供至工程化变体。具有简并末端(

nnn,其中n=a、c、g、t)的dna起始子池被固定至固体支持物,并且暴露于核苷酸添加混合物(nam)溶液,该溶液包含(1)tdt变体,(2)中性ph缓冲剂,(3)单价盐,(4)氯化钴,和(5)3
’‑
onh2‑
dxtp,其中x是产生a*、c*、g*或t*的经修饰的核碱基。孵育温度是37℃,并且反应时间为2.5分钟。然后固体支持物用处于中性ph的高盐溶液洗涤,随后在处于中性ph的低盐溶液洗涤。将起始子池转化为测序文库,并且在illumina nextseq500上通过下一代测序(ngs)以成对末端30个循环的读段(pe30读段)进行分析。将bcl文件用illumina的bcl2fastq转换软件转换为fastq文件,并且在r中进行分析。针对所有可能的起始子背景,计算每个经修饰的碱基的添加的掺入效率([包含n+1个产物的读段]/{[包含n个起始子的读段]+[包含n+1个产物的读段])。跨越所有背景的平均掺入效率示于图3(上面的插图)中。野生型牛和野生型斑点雀鳝tdt活性由于与经碱基修饰的可逆终止核苷酸a*、c*、g*和t*的单核苷酸掺入有关,所以由虚线表示。由于在我们的测定中,野生型牛或野生型斑点雀鳝tdt不能将这些经碱基修饰的可逆终止核苷酸掺入,虚线出现在y=0处。相对于野生型牛和野生型斑点雀鳝tdt,所有呈现的tdt变体中的突变都导致了tdt修饰碱基掺入的改进。
[0309]
测定tdt变体的多循环能力
[0310]
使用3
’‑
onh2核苷5
’‑
三磷酸与末端脱氧核苷酸转移酶(tdt)seq id no 1&344

727进行的8

nt核酸序列的固体支持物合成。tdt变体如上文描述地进行表达和纯化。dna序列5
’‑
atcgatcg
‑3’
通过将固体支持物结合的dna起始子重复暴露于核苷酸添加混合物(nam)溶液来合成,该溶液包含(1)tdt,(2)中性ph缓冲剂,(3)单价盐,(4)氯化钴,和(5)3
’‑
onh2‑
dntp,其中n选自腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤。一个循环由以下组成:(a)将具有指定的a、t、c或g可逆终止核苷酸的nam溶液在固体支持物上于37℃孵育5分钟;(b)然后将固体支持物用处于中性ph的高盐溶液洗涤;(c)然后将固体支持物暴露于酸性亚硝酸钠水性溶液;并且(d)然后将固体支持物用与(b)相同的处于中性ph的高盐溶液洗涤。然后将(a)

(d)再重复7次,以合成期望的8

nt序列。合成的dna通过在变性聚丙烯酰胺凝胶上运行反应来分析,并且凭借共价附接至dna起始子的荧光团来定量。全长分数(8

nt物类)通过取8

nt条带的荧光强度并除以总泳道强度来确定。野生型牛和野生型斑点雀鳝tdt活性在其与全长分数相关时由在y=0处的虚线表示,表明它们不能够合成任何8

nt产物。相对于野生型牛和野生型斑点雀鳝tdt,所有包含在tdt变体中的突变导致了tdt的改进。结果示于图3(下面的插图)中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1