本发明涉及百子莲组织蛋白酶B(ApCathB)及其编码基因和探针,具体涉及一种百子莲组织蛋白酶B(ApCathB)及其编码基因和探针及应用。
背景技术:
组织蛋白酶B是一类裂解肽键的半胱氨酸蛋白水解酶,其催化作用由Cys和His实现,属于木瓜蛋白酶家族。在pH3.0~7.0都具有活性,碱性条件下会不可逆失活。其水解位点为-Arg-Arg-/-Xaa,且能够在羧基端按顺序水解二肽,因此也叫做羧基二肽酶(carboxy-dipeptidase)。
组织蛋白酶B具有广谱的蛋白水解活性,对多种动物蛋白(血红蛋白、血清蛋白、卵黄磷蛋白、明胶等)和植物蛋白(大豆、玉米、棉籽蛋白等)都有水解活性。组织蛋白酶B在溶酶体降解蛋白质途径中发挥着必不可少的作用,当胞外蛋白质、血浆蛋白、激素和被吞噬的细菌等进入细胞即被溶酶体内蛋白水解酶水解,进行细胞内消化,从而使蛋白质的合成与降解保持精确的平衡。同时,组织蛋白酶B还参与到植物对外源细菌的抵御、植物衰老以及细胞凋亡等途径。其中组织蛋白酶B能直接或间接激活Caspase(天冬氨酸特异性半胱氨酸蛋白酶)而触发细胞凋亡,从而加速组织自溶。
随着人们对组织蛋白酶B的研究逐步深入,有关该酶的性质及基因和蛋白水平在各种生理、病理状态的研究,使其在诊断和治疗肿瘤、农业病虫害防治、食品肉质的嫩化增香及细胞株的分离等方面均显示了其潜在的应用前景。组织蛋白酶B的编码基因已从多种植物中克隆出来,包括:拟南芥、水稻、玉米、大豆等。但对于观赏植物,尤其是球根花卉中,组织蛋白酶B的克隆、表达模式及蛋白序列尚不清楚。目前,未有任何与百子莲组织蛋白酶B蛋白及其编码基因序列相关的文献报道。
技术实现要素:
针对现有技术中的缺陷,本发明的目的在于填补百子莲组织蛋白酶B(ApCathB)基因的克隆、表达模式分析以及百子莲ApCathB蛋白的空白,提供了一种百子莲ApCathB蛋白,本发明还提供了一种编码上述蛋白质的核酸序列以及检测所述核酸序列的探针;本发明公开了百子莲ApCathB基因转化拟南芥后的生理效应及表达模式,从而为今后利用基因工程技术对ApCathB基因表达的时空特性进行调控提供理论依据,具有很大的应用价值。
本发明的目的是通过以下技术方案实现的:
第一方面,本发明提供一种百子莲组织蛋白酶B,包括如下(a)或(b)的蛋白质:
(a)由如SEQ ID NO.4所示的氨基酸序列组成的蛋白质;
(b)SEQ ID NO.4所示的氨基酸序列经过取代、缺失或者添加一个或几个氨基酸且具有百子莲ApCathB蛋白活性的由(a)衍生的蛋白质。
优选地,所述蛋白质为SEQ ID NO.4所示氨基酸序列经过1~50个氨基酸的缺失、插入和/或取代,或者在C末端和/或N末端添加1~20个以内氨基酸而得到的序列。
优选地,所述蛋白质为SEQ ID NO.4所示氨基酸序列中1~10个氨基酸被性质相似或相近的氨基酸所替换而形成的序列。
第二方面,本发明提供了一种编码百子莲组织蛋白酶B的核酸序列。
优选地,所述核酸序列具体为:
(a)碱基序列如SEQ ID NO.3第1~1071位所示;
或(b)与SEQ ID NO.3第1~1071位所示的核酸有至少70%的同源性的序列;
或(c)能与SEQ ID NO.3第1~1071位所示的核酸进行杂交的序列。
优选地,所述核酸序列具体为SEQ ID NO.3第1~1071位所示的核酸序列中1~90个核苷酸的缺失、插入和/或取代,或者在5′和/或3′端添加60个以内核苷酸形成的序列。
第三方面,本发明提供了一种用于检测编码所述百子莲组织蛋白酶B的核酸序列的探针,所述探针为包含有所述核酸序列8~100个连续核苷酸的核酸分子。该探针可用于检测样品中是否存在编码百子莲组织蛋白酶B(ApCathB)相关的核酸分子。
第四方面,本发明提供了一种百子莲组织蛋白酶B蛋白编码基因的应用,所述基因的碱基序列如SEQ ID NO.3第1~1071位所示,所述的应用是:采用基因工程的手段将所述基因用于防治农业病虫害、食品肉质的嫩化增香及细胞株分离中。
在本发明中,术语“百子莲组织蛋白酶B(ApCathB)蛋白编码序列”指编码具有百子莲ApCathB蛋白活性的多肽的核苷酸序列,如SEQ ID NO.3所示的第1~1071位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.3所示的第1~1071位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.3所示的第1~1071位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.4所示的序列。该术语还包括与SEQ ID NO.3所示的核苷酸序列的同源性至少70%的核苷酸序列。
该术语还包括能编码天然百子莲组织蛋白酶B(ApCathB)蛋白的相同功能、SEQ ID NO.3所示序列的变异形式。这些变异形式包括(但并不限于):通常为1~90个核苷酸的缺失、插入和/或取代,以及在5′和/或3′端添加为60个以内核苷酸。
在本发明中,术语“百子莲组织蛋白酶B(ApCathB)”指具有百子莲ApCathB蛋白活性的SEQ ID NO.4所示序列的多肽。该术语还包括具有与天然百子莲ApCathB蛋白相同功能的、SEQ ID NO.4序列的变异形式。这些变异形式包括(但并不限于):通常为1~50个氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或为20个以内氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括百子莲ApCathB蛋白的活性片段和活性衍生物。
本发明的百子莲组织蛋白酶B(ApCathB)的变异形式包括:同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严谨条件下能与百子莲ApCathB相关DNA杂交的DNA所编码的蛋白、以及利用百子莲ApCathB蛋白的抗血清获得的多肽或蛋白。
在本发明中,“百子莲ApCathB保守性变异多肽”指与SEQ ID NO.4所示的氨基酸序列相比,有至多10个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
表1
发明还包括百子莲ApCathB蛋白或多肽的类似物。这些类似物与百子莲ApCathB相关多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述列举的代表性的多肽。
修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,可用实时荧光定量PCR的方法分析百子莲ApCathB基因在拟南芥中的生理效应及表达模式,即分析百子莲ApCathB基因编码的蛋白功能。
本发明检测样品中是否存在百子莲ApCathB相关核苷酸序列的检测方法,包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。该样品是PCR扩增后的产物,其中PCR扩增引物对应于百子莲ApCathB相关核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15~50个核苷酸。
此外,根据本发明的百子莲ApCathB核苷酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选百子莲ApCathB相关同源基因或同源蛋白。
为了得到与百子莲ApCathB相关基因的点阵,可以用DNA探针筛选百子莲cDNA文库,这些探针是在低严谨条件下,用32P对百子莲ApCathB相关的全部或部分做放射活性标记而得的。适合于筛选的cDNA文库是来自百子莲的文库。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外,许多这样的cDNA文库也可以购买到,例如购自Clontech,Stratagene,Palo Alto,Cal.。这种筛选方法可以识别与百子莲ApCathB相关的基因家族的核苷酸序列。
本发明的百子莲ApCathB相关核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
当获得了有关序列后,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可通过化学合成将突变引入本发明蛋白序列中。
除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,(1969)固相多肽合成,WH Freeman Co.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 85:2149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用Applied Biosystems的431A型肽合成仪(Foster City,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。
利用本发明的百子莲组织蛋白酶B(ApCathB),通过各种常规筛选方法,可筛选出与百子莲组织蛋白酶B(ApCathB)蛋白相关发生相互作用的物质,或抑制剂与拮抗剂等。
百子莲观赏价值极高,应用广泛,在园林规划中具有很高的应用前景。因此,研究其对不同环境的适应性、对病虫害的抗性特征是促进其推广应用的先决条件。
与现有技术相比,本发明具有如下的有益效果:
1)本发明首次克隆百子莲植物体内组织蛋白酶B(ApCathB)的编码序列,并将其转化到模式植物拟南芥中,采用荧光实时定量PCR的方法分析ApCathB基因在拟南芥中的生理效应和表达模式,为今后利用基因工程技术调控ApCathB基因的时空表达,从而为百子莲在园林景观中的推广应用提供了理论依据。
2)本发明获得的百子莲植物体内组织蛋白酶B在极限胁迫环境下,能够加速细胞的死亡,显著降低细胞增殖速率。利于该特性,可将其应用于诊断和治疗肿瘤、农业病虫害防治、食品肉质的嫩化增香及细胞株的分离等方面。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的百子莲ApCathB基因与油棕Cathepsin B-like基因mRNA的核苷酸序列的同源比较(GAP)结果;
图2为本发明的百子莲ApCathB蛋白与油棕Cathepsin B-like蛋白的氨基酸序列的同源比较(FASTA)结果,其中,相同的氨基酸在两个序列之间用氨基酸单字符标出;
图3为野生型与ApCathB转基因拟南芥在H2O2胁迫下生长状况表型观察;
图4为野生型与ApCathB转基因拟南芥在H2O2胁迫下生长的单颗苗重结果;
图5为重组大肠杆菌Transetta:PET-30a-ApCathB在胁迫培养基中的生长状况;
图6为野生型与ApCathB转基因拟南芥ApCathB基因表达定量分析。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1、百子莲ApCathB基因的克隆
1.植物材料的获得
取百子莲成年苗叶片组织,用于提取RNA;
2.RNA的抽提
用“RNA prep pure植物总RNA提取试剂盒”抽提总RNA(Trizol:Invitrogen),用甲醛变性胶电泳鉴定RNA的完整性,然后在分光光度计(Thermo Scientific NANODROP 1000 Spectrophotometer)上测定RNA的纯度及浓度;
3.基因的全长克隆
根据百子莲转录组测序(RNA-seq)的蛋白功能注释结果,获得百子莲ApCathB基因核心片段。采用RACE方法(SMARTerTM RACE cDNA Amplification Kit:Clonetech)进行cDNA全长克隆,分三个阶段进行:
(1)PCR获得基因中间片段
将提取的RNA进行反转录(Prime ScriptⅡ1st Strand cDNA Synthesis Kit:宝生物工程(大连)有限公司),以第一链cDNA为模板,利用引物ApCathB F(SEQ ID NO.1)和ApCathB R(SEQ ID NO.2)进行PCR,扩增得到1403bp片段,回收并连接到pMD19-TSimple vector载体上,用RV-M和M13-47作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI377测序仪(Perkin-Elmer,USA)上进行测序,测序结果通过在NCBI网站进行BLAST(http://blast.ncbi.nlm.nih.gov/)比对已有的数据库(GenBank),知其核酸序列及编码蛋白与已知的油棕、海枣的Cathepsin B基因的同源性很高,初步认为它是一个ApCathB基因;
(2)3′RACE
二轮巢式PCR完成3′末端序列的扩增。
第一轮:UPM+3’-GSP1(5′-GCTAACCTCACCTCGCTTGCCATCTA-3′)(SEQ ID NO.5)
第二轮:NUP+3’-GSP2(5′-GTTGTTACCGACGAGTGCGACCCATA-3′)(SEQ ID NO.6)
UPM和NUP为试剂盒提供。3′RACE得到百子莲ApCathB的3′末端序列(724bp),回收,连接到pMD19-T Simple vector载体上,用RV-M和M13-47作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI377测序仪(Perkin-Elmer,USA)上进行测序,测序结果通过在NCBI网站进行BLAST(http://blast.ncbi.nlm.nih.gov/)比对已有的数据库(GenBank),知其核酸序列及编码蛋白与已知的海枣、油棕的Cathepsin B基因的同源性很高;
(3)5′RACE
以5′RACE ready cDNA为模板,通过二轮巢式PCR完成5′末端序列的扩增。
第一轮:UPM+5’-GSP1(5′-CACCGTCCTCGCTAGTTCCCCAACC-3′)(SEQ ID NO.7)
第二轮:NUP+5’-GSP2(5′-GAAATATGGGTCGCACTCGTCGGTAA-3′)(SEQ ID NO.8)
UPM和NUP为试剂盒提供。5′RACE得到百子莲ApCathB基因的5′末端序列(686bp),回收连接后用同上面一样的方法进行测序,将通过上述3种方法获得的序列的测序结果进行拼接,将拼接序列提交BLAST分析,结果证明从百子莲中新得到的ApCathB基因的确为一个组织蛋白酶B基因,将测序结果结合NCBI的ORF Finding(http://www.ncbi.nlm.nih.gov/gorf)预测,发现了百子莲ApCathB基因的起始密码子与终止密码子,根据获得的序列,分别从起始密码子和终止密码子处设计特异性引物ORF-F(5′-ATGATGATGATGAAGAAGGGGATCATGTAT-3′)(SEQ ID NO.13),ORF-R(5′-CTATATCCATGCGAGCGAAGCACC-3′)(SEQ ID NO.14),以百子莲cDNA为模板进行PCR,扩增得到1071bp百子莲ApCathB蛋白的全长编码序列(SEQ ID NO.3)。
实施例2、百子莲ApCathB基因的序列信息与同源性分析
本发明新的百子莲ApCathB基因全长开放读码框序列为1071bp,详细序列见SEQ ID NO.3所示序列。根据开放读码框序列推导出百子莲ApCathB蛋白的氨基酸序列,共356个氨基酸残基,分子量为39.51kDa,等电点(pI)为5.64,详细序列见SEQ ID NO.4所示序列;
将百子莲ApCathB的开放读码框序列及其编码蛋白的氨基酸序列用BLAST程序在Non-redundant GenBank+EMBL+DDBJ+PDB和Non-redundant GenBank CDS translations+PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与油棕Cathepsin B-like基因(登录号:XM_010909454.1)在核苷酸水平上具有81%的相同性,如图1所示(Query:百子莲ApCathB的编码序列;Sbjct:油棕Cathepsin B-like的mRNA序列);在氨基酸水平上,它与油棕Cathepsin B-like蛋白(登录号:XP_010907756.1)也有81%的一致性和90%的相似性,如图2所示(Query:百子莲ApCathB蛋白的氨基酸序列;Sbjct:油棕Cathepsin B-like蛋白的氨基酸序列)。由此可见,百子莲ApCathB基因与其它已知物种的Cathepsin B基因无论从核酸还是蛋白水平上都存在较高的同源性。
实施例3、百子莲ApCathB基因转化模式植物拟南芥
1.含目的基因(ApCathB)的表达载体的构建
根据百子莲ApCathB基因全长编码序列(SEQ ID NO.3),设计扩增在完整编码阅读框的引物,并在上下游引物上分别引入限制性内切酶位点(这可视选用的载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将ApCathB基因的编码区序列连接至中间载体(如pMD19-T)中进行测序,再将测序正确的ApCathB基因的编码区序列进一步克隆到表达载体中(如pHB),在鉴定好阅读框正确的前提下将其转入根癌农杆菌中(如GV3101),并对转化后的农杆菌进行PCR鉴定,以保证含有ApCathB基因的植物表达载体成功转化入根癌农杆菌中。
2.根癌农杆菌介导转化拟南芥
(1)预摇农杆菌:挑阳性单克隆至25ml含50mg/L Kan、50mg/L庆大霉素、25mg/L Rif的YEP液体培养基中,28℃,200rpm摇菌24h;
(2)扩培农杆菌:将预摇的农杆菌菌液以1:100扩培至含400mL Kan抗性YEP培养基中,28℃,200rpm,培养13-16h,培养至吸光度OD600达到1.5-2.0之间收菌,收菌条件是23℃,5000rpm,8min;
(3)转化植株:(需要在转化前一天或是转化当天剪去植株上所有的角果和盛开以及露白的小花)配制500mL含5%蔗糖的1/2MS溶液,用少量MS溶液将收集的农杆菌沉淀悬起,摇匀,向剩余的蔗糖溶液中加入0.04%(v/v)的Silwet L-77与10μL 6-BA(母液为1mg/mL),搅匀,在转化前将二者混匀,将植株茎部及花序浸泡在菌液中30s,取出沥干菌液,放入一次性塑料袋中,密封保湿。将所有植株转化完毕后,罩上黑盒子,避光培养24h。之后取出植株,将植株直立放置,浇水培养,保证植株水分充足。
3.转基因阳性株系的筛选
转化后的植株待角果全部成熟后收种子,在垫有滤纸的干燥培养皿中室温放置一周,使种子全部干燥,之后用50目的不锈钢筛过滤种子,除去角果,收集转基因T1代种子并播种于穴盘中,用0.05%(v/v)草铵膦进行幼苗抗性筛选,获得T2代转基因植株,持续筛选直至获得T3代纯合体转基因植株。
4.转基因拟南芥植株ApCathB基因表达差异
剪切拟南芥野生型与ApCathB转基因拟南芥植株的叶片0.2g,提取RNA、制备cDNA并进行实时定量PCR分析。Real-time PCR中ApCathB基因定量分析的特异性引物为qApCathB-F(5′-TTTGATGCTAGAACAGCTTGG-3′)(SEQ ID NO.9),引物qApCathB-R(5′-GGCCATTATAGGATATCCCC-3′)(SEQ ID NO.10),内参基因为拟南芥UBQ5基因,引物为UBQ5-F(5′-GACGCTTCATCTCGTCC-3′(SEQ ID NO.11)),UBQ5-R(5′-CCACAGGTTGCGTTAG-3′)(SEQ ID NO.12)。采用法作相对定量分析,结果表明转基因拟南芥中ApCathB的表达量较高,是内参基因UBQ5的2.6倍,是野生型植物的1894倍(图6)。表明ApCathB没有在野生型植株中表达。
实施例4、百子莲ApCathB基因转拟南芥的功能验证
以不同浓度的H2O2处理模拟氧化胁迫,野生型与ApCathB转基因拟南芥植株在H2O2胁迫下的表型具有显著性差异(图3);图3中,①表示野生型拟南芥,②和③表示ApCathB转基因拟南芥。ApCathB转基因幼苗相比野生型幼苗对H2O2诱导的氧化胁迫更敏感,显著抑制了幼苗的生长,ApCathB转基因幼苗在H2O2胁迫下的单颗苗重仅为野生型的50%左右(图4)。且随着H2O2浓度的增加,幼苗的生长量也逐渐减少,趋于死亡。以上结果表明ApCathB能够使幼苗对非生物胁迫更为敏感,加速细胞死亡。
实施例5、重组大肠杆菌Transetta:PET-30a-ApCathB的抗胁迫功能验证
1.含目的基因(ApCathB)的原核表达载体的构建
按照实施例3的方法将百子莲ApCathB基因全长编码序列(SEQ ID NO.3)连接至原核表达载体pET-30a中,转入大肠杆菌(DN5α)中大量扩增,提取质粒。
2.重组蛋白的表达
将构建好的载体pET-30a-ApCathB转入大肠杆菌Transetta菌株中,进行重组蛋白表达。首先,挑阳性单克隆至5ml含50mg/L卡那霉素和15mg/L氯霉素的LB液体培养基中,37℃,200rpm过夜摇菌;其次,将预摇的Transetta菌液以1:100扩培至含50mL卡那霉素和15mg/L氯霉素抗性LB培养基中,37℃,200rpm,培养约3h使菌液OD600的值为0.6~0.8;再次,向培养好的菌液中加入终浓度为0.8mM的IPTG进行蛋白表达诱导,表在25℃诱导2~8h均有表达。
3.重组蛋白抗逆性鉴定
分别将含有pET-30a和pET-30a-ApCathB载体的大肠杆菌Transetta的单菌落接种于5mL含50mg/L卡那霉素和15mg/L氯霉素的LB液体培养基,37℃,200rpm过夜摇菌。次日按照1:100的比例接种到分别含有NaCl(200、400、600、800mM)、KCl(200、400、600、800mM)、PEG6000(2.5、5.0、10.、15%)和不同pH(3.0、5.0、7.0、9.0、11.0)中培养,同时加入0.8mM IPTG进行诱导表达,12h后测定OD600值。结果如图5所示,该结果表明,重组蛋白pET-30a-ApCathB在不同胁迫条件下的抗性都低于pET-30a空载,说明ApCathB蛋白能够抑制大肠杆菌增殖速率,不利于对胁迫环境的抵御。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
SEQUENCE LISTING
<110> 上海交通大学
<120> 百子莲组织蛋白酶B及其编码基因和探针及应用
<130> DAG28252
<160> 14
<170> PatentIn version 3.3
<210> 1
<211> 20
<212> DNA
<213> Artificial
<220>
<223> artificial sequence
<400> 1
catgggattc ttccctgcct 20
<210> 2
<211> 20
<212> DNA
<213> Artificial
<220>
<223> artificial sequence
<400> 2
tgttgcgacg caaattcatg 20
<210> 3
<211> 1071
<212> DNA
<213> Artificial
<220>
<223> Artificial sequence
<400> 3
atgatgatga tgaagaaggg gatcatgtat gcgcttccgc ttccgctgct gctgctgctg 60
gttttaactg cggagatcca attcttgcag gtggttgcag taaagccgat ccctcaagcc 120
aagcaagatg ccaagattct tcaggattct attgtagaga aggttaattc caatccaaat 180
gcaggatgga gagcctccat aaactcccgt ttctccaatt atacacgagg gcaattccaa 240
tatattcttg gagtaaagca gttgcttcaa actgccttgg aaggttttcc tgtaaaaact 300
tatcctaaat tattaaagct tcccaaacag tttgatgcta gaacagcttg gcctcaatgc 360
agcactattg ggaaaatact tgatcaggga cattgtggat cttgttgggc atttggtgca 420
gtagaatcgc tgtcagatcg attctgtatc aattttggca tgaacatatc tttatctgtt 480
aatgacctct tgtcgtgctg tggttttatg tgtggggatg gttgtgacgg gggatatcct 540
ataatggcct ggcgctactt tgtacaaaat ggtgttgtta ccgacgagtg cgacccatat 600
ttcgatgccg agggatgtgc tcatccaggc tgtgaacctc tatatccaac accacaatgt 660
gaaaagaagt gcaaagccaa taatcttgtt tggatggaaa caaagcactt cagtgtcgat 720
gcttacagag tgagctccga tccacatgat attatgcaag aggtctatac gcatggccca 780
gtggaagtcg ccttcacagt ttatgaggat tttgctcact ataaatcagg gatctacaag 840
catgttacag gtggtgtaat gggtggccat gctgtgaaat taattggttg gggaactagc 900
gaggacggtg aagattattg gcttcttgca aatcagtgga acagaggttg gggcgatgat 960
ggttacttca agattgtgag gggaagcaat gaatgcggta ttgaagagga tgtggttgca 1020
ggattgcctt ctaccaagaa tttagcaggt gcttcgctcg catggatata g 1071
<210> 4
<211> 356
<212> PRT
<213> Artificial
<220>
<223> artificial sequence
<400> 4
Met Met Met Met Lys Lys Gly Ile Met Tyr Ala Leu Pro Leu Pro Leu
1 5 10 15
Leu Leu Leu Leu Val Leu Thr Ala Glu Ile Gln Phe Leu Gln Val Val
20 25 30
Ala Val Lys Pro Ile Pro Gln Ala Lys Gln Asp Ala Lys Ile Leu Gln
35 40 45
Asp Ser Ile Val Glu Lys Val Asn Ser Asn Pro Asn Ala Gly Trp Arg
50 55 60
Ala Ser Ile Asn Ser Arg Phe Ser Asn Tyr Thr Arg Gly Gln Phe Gln
65 70 75 80
Tyr Ile Leu Gly Val Lys Gln Leu Leu Gln Thr Ala Leu Glu Gly Phe
85 90 95
Pro Val Lys Thr Tyr Pro Lys Leu Leu Lys Leu Pro Lys Gln Phe Asp
100 105 110
Ala Arg Thr Ala Trp Pro Gln Cys Ser Thr Ile Gly Lys Ile Leu Asp
115 120 125
Gln Gly His Cys Gly Ser Cys Trp Ala Phe Gly Ala Val Glu Ser Leu
130 135 140
Ser Asp Arg Phe Cys Ile Asn Phe Gly Met Asn Ile Ser Leu Ser Val
145 150 155 160
Asn Asp Leu Leu Ser Cys Cys Gly Phe Met Cys Gly Asp Gly Cys Asp
165 170 175
Gly Gly Tyr Pro Ile Met Ala Trp Arg Tyr Phe Val Gln Asn Gly Val
180 185 190
Val Thr Asp Glu Cys Asp Pro Tyr Phe Asp Ala Glu Gly Cys Ala His
195 200 205
Pro Gly Cys Glu Pro Leu Tyr Pro Thr Pro Gln Cys Glu Lys Lys Cys
210 215 220
Lys Ala Asn Asn Leu Val Trp Met Glu Thr Lys His Phe Ser Val Asp
225 230 235 240
Ala Tyr Arg Val Ser Ser Asp Pro His Asp Ile Met Gln Glu Val Tyr
245 250 255
Thr His Gly Pro Val Glu Val Ala Phe Thr Val Tyr Glu Asp Phe Ala
260 265 270
His Tyr Lys Ser Gly Ile Tyr Lys His Val Thr Gly Gly Val Met Gly
275 280 285
Gly His Ala Val Lys Leu Ile Gly Trp Gly Thr Ser Glu Asp Gly Glu
290 295 300
Asp Tyr Trp Leu Leu Ala Asn Gln Trp Asn Arg Gly Trp Gly Asp Asp
305 310 315 320
Gly Tyr Phe Lys Ile Val Arg Gly Ser Asn Glu Cys Gly Ile Glu Glu
325 330 335
Asp Val Val Ala Gly Leu Pro Ser Thr Lys Asn Leu Ala Gly Ala Ser
340 345 350
Leu Ala Trp Ile
355
<210> 5
<211> 26
<212> DNA
<213> Artificial
<220>
<223> Artificial Sequence
<400> 5
gctaacctca cctcgcttgc catcta 26
<210> 6
<211> 26
<212> DNA
<213> Artificial
<220>
<223> Artificial Sequence
<400> 6
gttgttaccg acgagtgcga cccata 26
<210> 7
<211> 25
<212> DNA
<213> Artificial
<220>
<223> Artificial Sequence
<400> 7
caccgtcctc gctagttccc caacc 25
<210> 8
<211> 26
<212> DNA
<213> Artificial
<220>
<223> Artificial Sequence
<400> 8
gaaatatggg tcgcactcgt cggtaa 26
<210> 9
<211> 21
<212> DNA
<213> Artificial
<220>
<223> Artificial Sequence
<400> 9
tttgatgcta gaacagcttg g 21
<210> 10
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Artificial Sequence
<400> 10
ggccattata ggatatcccc 20
<210> 11
<211> 17
<212> DNA
<213> Artificial
<220>
<223> Artificial Sequence
<400> 11
gacgcttcat ctcgtcc 17
<210> 12
<211> 16
<212> DNA
<213> Artificial
<220>
<223> Artificial sequence
<400> 12
ccacaggttg cgttag 16
<210> 13
<211> 30
<212> DNA
<213> Artificial
<220>
<223> Artificial Sequence
<400> 13
atgatgatga tgaagaaggg gatcatgtat 30
<210> 14
<211> 24
<212> DNA
<213> Artificial
<220>
<223> Artificial sequence
<400> 14
ctatatccat gcgagcgaag cacc 24