本发明属于基因工程技术领域,涉及一种高效dna编辑的方法,具体为基于t7核酸内切酶i联合dna结合结构域对靶标dna进行序列修改的方法。
背景技术:
dna编辑技术指能够让人类对目标dna进行序列修改,实现对特定dna片段的敲除、加入等。
在过去几年中,以zfn(zinc-fingernucleases)和talen(transcriptionactivator-likeeffectornucleases)为代表的序列特异性核酸酶技术以其能够高效率地进行定点基因组编辑,在基础研究、基因治疗和遗传改良等方面展示出了巨大的潜力。而crispr/cas9技术自问世以来,就有着其它基因编辑技术无可比拟的优势,技术不断改进后,更被认为能够在活细胞中最有效、最便捷地“编辑”任何基因。
crispr/cas9系统也存在着一些不足。首先,cas9蛋白对于目标序列的切割不仅仅依靠crrna序列的匹配,在目标序列附近必须存在一些小的前间区序列邻近基序(pam),如果目标序列周围不存在pam或者无法严格配对,则cas9蛋白不能对任意序列进行切割。最后,和zfn及talen技术一样,crispr/cas9也面临着如何控制双链断裂之后的非同源末端连接修复可能随机产生细胞毒性的问题。
本发明开发的一种高效dna编辑的方法。该技术基于t7核酸内切酶i联合dna结合结构域对dna/dna杂交体系中的错配碱基进行切割的方法。本技术引入dna结合结构域使t7核酸内切酶i可以更快,更准确地找到dna/dna杂交链中的错配碱基位点并进行切割。
技术实现要素:
解决的技术问题:本发明针对现有dna编辑的技术存在的缺陷,旨在提供一种高效的dna编辑的方法,本方法具有高效、简单、经济、准确的优点。
技术方案:一种高效的dna编辑的方法,通过对特征dna巧妙设计,使它带有dna结合结构域结合的结构(如5’未端磷酸化修饰和自身形成发夹结构或者通过另一条短的磷酸化的寡核苷酸与该反义寡核苷酸形成双链结构),在具有特征dna结合结构域与t7核酸内切酶i的融合蛋白以及相应的特征dna的作用下切割错配位点dna。
本发明所述特征dna,为提高其在细胞内的稳定性,可对其中部分核苷酸进行硫代磷酸修饰。而且对切割位点进行硫代磷酸修饰还起到抑制t7核酸内切酶i对特征dna切割,从而靶标dna被切割后可以特征dna为模板补上错配碱基,起到对靶标dna进行高效修改。
本发明所述的具有特征dna结合结构域与t7核酸内切酶i的融合蛋白,可以通过原核表达(如大肠杆菌)并纯化得到:
所表达的蛋白质序列见seqidno.1所示,为了使该蛋白能够顺利进入细胞内,在n未端加入穿膜肽序列(rrrrrrrrrr);为使蛋白能够进入细胞核中起作用,在融合蛋白中间加入核定位信号(pkkkrkv)为不影响dna结合结构域与t7核酸内切酶i各自功能,在各功能区之间加入一段柔性肽(ggggsggggsggggs和ggggsggggsggggs);同时为了纯化方便,在c未端加入组蛋白纯化标签(hhhhhh)。为了更高效得到有活性蛋白,运用软件对翻译该蛋白的密码子进行全面优化使它更适合于大肠杆菌中表达,并构建到原核表达载体上进行大肠杆菌表达并纯化。
本发明所述的具有特征dna结合结构域与t7核酸内切酶i融合蛋白,也可以构建真核表达载体,通过病毒或质粒直接转染细胞表达:
所表达的蛋白质序列见seqidno.2所示,与seqidno.1相比,该蛋白去除n未端加入穿膜肽序列和组蛋白纯化标签序列。为了更高效得到有活性蛋白,运用软件对翻译该蛋白的密码子进行全面优化使其适合于真核细胞中表达,并构建到真核表达载体或病毒载体上进行细胞内表达。
本发明方法按照常规的分子生物学方法进行。
本发明方法运用于体内或体外对dna进行序列修改等。
有益效果:本发明的方法由于在t7核酸内切酶i的基础上加入dna结合结构域,大大提高t7核酸内切酶i识别并切割dna/dna杂交体系中的错配碱基能力,与dna编辑方法相比,提高效率而且使用起来更简单,适用于基因功能研究等应用;该方法按照流行的分子生物学方法进行,所需要的试剂和仪器均为常用,无需特殊购买。
具体实施方式
下面结合实施例对本发明做进一步的说明,以下所述,仅是对本发明的较佳实施例而已,并非对本发明做其他形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更为同等变化的等效实施例。凡是未脱离本发明方案内容,依据本发明的技术实质对以下实施例所做的任何简单修改或等同变化,均落在本发明的保护范围内。
实施例1
一种高效的dna编辑的方法,将293t细胞含有co-gfap质粒的co-gfap基因敲除。具体通过以下方法:
1)根据seqidno.1序列,于原核表达并纯化得到融合蛋白;
2)在上述纯化蛋白加入表1寡核苷酸。然后把混合物加入培养细胞中。
3)再次培养72小时,即可敲除co-gfap基因。
表1寡核苷酸序列
sequencelisting
<110>李燕强
<120>一种高效dna编辑的方法
<130>20170118
<160>11
<170>patentinversion3.3
<210>1
<211>331
<212>prt
<213>人工序列
<400>1
metargargargargargargargargargargglyglytrparglys
151015
argthrgluasnaspglytrpglulystrpglyglytyrmetalaala
202530
lysvalglnlysleuglugluglnpheargthraspalaalaasngln
354045
lysaspglythralaseralailepheserglyvalalailetyrval
505560
asnglytyrthraspproseralaglugluleuargasnleumetmet
65707580
leuhisglyglyglntyrhisvaltyrtyrserargserlysthrthr
859095
hisileilealathrasnleuproasnalalysilelysgluleulys
100105110
glyglulysvalileargproglutrpilevalgluserilelysala
115120125
glyargleuleuserseralaprotyrglnleuglyglyglyglyser
130135140
glyglyglyglyserglyglyglyglyserprolyslyslysarglys
145150155160
valglyglyglyglyserglyglyglyglyserglyglyglyglyser
165170175
metalaglytyrglyalalysglyilearglysvalglyalaphearg
180185190
serglyleugluasplysvalserlysglnleugluserlysglyile
195200205
lyspheglutyrgluglutrplysvalprotyrvalileproalaser
210215220
asnhisthrtyrthrproasppheleuleuproasnglyilepheval
225230235240
gluthrlysglyleutrpgluseraspasparglyslyshisleuleu
245250255
ilearggluglnhisprogluleuaspileargilevalpheserser
260265270
serargthrlysleutyrlysglyserprothrsertyrglygluphe
275280285
cysglulyshisglyilelysphealaasplysleuileproalaglu
290295300
trpilelysgluprolyslysgluvalpropheaspargleulysarg
305310315320
lysglyglylyslyshishishishishishis
325330
<210>2
<211>315
<212>prt
<213>人工序列
<400>2
metglyglytrparglysargthrgluasnaspglytrpglulystrp
151015
glyglytyrmetalaalalysvalglnlysleuglugluglnphearg
202530
thraspalaalaasnglnlysaspglythralaseralailepheser
354045
glyvalalailetyrvalasnglytyrthraspproseralagluglu
505560
leuargasnleumetmetleuhisglyglyglntyrhisvaltyrtyr
65707580
serargserlysthrthrhisileilealathrasnleuproasnala
859095
lysilelysgluleulysglyglulysvalileargproglutrpile
100105110
valgluserilelysalaglyargleuleuserseralaprotyrgln
115120125
leuglyglyglyglyserglyglyglyglyserglyglyglyglyser
130135140
prolyslyslysarglysvalglyglyglyglyserglyglyglygly
145150155160
serglyglyglyglysermetalaglytyrglyalalysglyilearg
165170175
lysvalglyalapheargserglyleugluasplysvalserlysgln
180185190
leugluserlysglyilelyspheglutyrgluglutrplysvalpro
195200205
tyrvalileproalaserasnhisthrtyrthrproasppheleuleu
210215220
proasnglyilephevalgluthrlysglyleutrpgluseraspasp
225230235240
arglyslyshisleuleuilearggluglnhisprogluleuaspile
245250255
argilevalpheserserserargthrlysleutyrlysglyserpro
260265270
thrsertyrglygluphecysglulyshisglyilelysphealaasp
275280285
lysleuileproalaglutrpilelysgluprolyslysgluvalpro
290295300
pheaspargleulysarglysglyglylyslys
305310315
<210>3
<211>10
<212>prt
<213>人工序列
<400>3
argargargargargargargargargarg
1510
<210>4
<211>7
<212>prt
<213>人工序列
<400>4
prolyslyslysarglysval
15
<210>5
<211>15
<212>prt
<213>人工序列
<400>5
glyglyglyglyserglyglyglyglyserglyglyglyglyser
151015
<210>6
<211>15
<212>prt
<213>人工序列
<400>6
glyglyglyglyserglyglyglyglyserglyglyglyglyser
151015
<210>7
<211>6
<212>prt
<213>人工序列
<400>7
hishishishishishis
15
<210>8
<211>54
<212>dna
<213>人工序列
<400>8
actccaccctcatgggtggagttaatcaataattaagcagggcctcatgaccaa54
<210>9
<211>54
<212>dna
<213>人工序列
<400>9
actccaccctcatgggtggagttaatcaataattgcctttggtgatcttcatct54
<210>10
<211>54
<212>dna
<213>人工序列
<400>10
actccaccctcatgggtggagttaatcaataatttgagccacgagatgggctac54
<210>11
<211>54
<212>dna
<213>人工序列
<400>11
actccaccctcatgggtggagttaatcaataatttaggtgccgatgtggtagaa54