专利名称:Hcv基因型分型和表型分型的制作方法
技术领域:
本发明涉及HCV基因型分型(genotyping)和表型分型(phenotyping)分析。例 如,本发明包括用于扩增HCV的NS3蛋白酶结构域的组合物和引物。
背景技术:
丙型肝炎(HCV)是黄病毒科的带包膜的正链RNA病毒。单链的HCVRNA基因组是 正极性的且包含一个长度为大约9600个核苷酸的开放读码框,其编码大约3010个氨基酸 的多聚蛋白。在受感染的细胞中,多聚蛋白在多个位点被宿主和病毒蛋白酶切割,从而产生 病毒的结构和非结构(NS)蛋白。结构蛋白(C、El、E2/NS1)组成核衣壳蛋白和一个或两个与膜结合的糖蛋白。非 结构蛋白(NS2、NS3、NS4A、NS4B、NS5A和NS5B)是催化并调节HCV RNA基因组复制的酶或 辅助因子。NS3既是蛋白水解切割酶又是解旋酶(为了复制而促进病毒基因组的解螺旋)。 NS5b是病毒复制所需的RNA依赖性的RNA聚合酶。HCV影响世界上大约3%的人口(170,000,000人)并且已经被世界卫生组织宣布 为全球性健康传染病。约50%至80%的感染了 HCV的人发展为具有病毒抗性的慢性肝炎。 具有慢性肝炎的个体发展为肝硬化和肝细胞癌的风险日益增加。HCV引起的末期肝病大约 占到肝移植的30%至40%。目前全球的HCV治疗标准是聚乙二醇化的a-干扰素与利巴韦林(一种广谱抗病 毒试剂)联用。但是,该方案持续很久且不良好耐受。而且,只有大约一半的感染基因型 1HCV的个体对治疗具有持久反应。业界对于有效且安全替代干扰素或者可以用于含有干扰素的方案的治疗剂有很 大的需要。几种HCV抗病毒治疗处于临床试验中。例如,这些治疗剂包括病毒蛋白酶抑制 剂和聚合酶抑制剂。已经开发了 HCV蛋白酶NS3的抑制剂,其同时为高活性和选择性的。 为此原因,这些化合物具有成为下一代抗HCV治疗的前景(参见,例如,W0 00/09543、TO 00/09558和W000/59929,每篇皆通过引用全文并入本文)。尽管在用于感染HCV的患者的新的治疗选择的开发上取得了进步,但是药物抗性 仍是主要问题。由于缺少RNA依赖性的RNA聚合酶的修复活性,HCV表现出高度遗传多样 性。由于HCV聚合酶的保真率差,所以在接受特异性HCV抗病毒治疗剂(例如,蛋白酶抑制 剂和聚合酶抑制剂)治疗的患者中可能产生药物抗性HCV突变,这与已经在接受HIV抗病 毒治疗剂治疗的患者中观察到的情况相似。除了对特异性靶向HCV的抗病毒治疗产生抗性 之外,病毒能够对非特异性抗病毒治疗剂(例如干扰素)产生抗性。对蛋白酶抑制剂的药物抗性受到特别关注。体外研究已经表明HCV蛋白酶中的突 变能够产生对蛋白酶抑制剂的抗性。这个发现与HIV蛋白酶中的发现是类似的。例如,在
5HIV中,已经发现HIV蛋白酶中的特异性突变导致对HIV蛋白酶抑制剂的表型敏感性降低。本发明提供了可用于确定HCV基因型和HCV表型的引物、试剂盒和方法。例如,本 发明的方法可用于预测患者对HCV治疗剂的反应和用于确定HCV药物抗性(例如蛋白酶药 物抗性)。本发明的方法还可用于临床前的药物开发以按活性筛选有前景的蛋白酶抑制剂。发明概述本发明部分基于对鉴定丙型肝炎病毒(HCV)亚型有用的引物的发现和用于HCV基 因型分型和表型分型的方法的发现。因此,本发明提供了引物、包含引物的试剂盒、用于扩 增HCV(例如基因型1的HCV)的特定区域的方法、用于确定HCV的基因型和表型(例如基 因型la或lb等)的方法。本发明还包括用于确定存在药物抗性HCV的方法。本发明提供了引物的群体。引物的群体可以包含第一或第二轮引物。在一 个实施方式中,每个引物包含编码 Met/Lys-Glu/Gly-Thr/I le-Lys-I le/Val/Leu-I le/ Ala-Thr/Gln-Trp/Lys的核酸序列。在另一个实施方式中,每个引物的互补物包含编码 Ser-Thr-Tyr-Gly/Cys-Lys-Phe-Leu-Ala-Asp-Gly 的核酸序列。在另一个实施方式中,每个引物包含编码Ala-Pro/Hi s_11 e-Thr-Ala-Tyr-Ser/ Ala-Gln/Arg-Gln-Thr的核酸序列。在另一个实施方式中,每个引物的互补物包含编码 Gly-Ser-Gly/Arg-Lys-Ser/Thr-Thr/Asn-Lys/Arg-Val-Pro-Ala/Val-Ala/Asp 的核酸序 列。在另一个实施方式中,提供了包含本发明引物的试剂盒。本发明提供了扩增编码HCV NS3蛋白酶结构域的核酸的方法。本发明的方法包括, 例如,扩增编码NS3/4A结构域或其部分、NS3结构域或其部分(例如,NS3蛋白酶和NS3解 旋酶两者,或NS3蛋白酶和一部分的NS3解旋酶)、NS2/NS3结构域或其部分或NS2/NS3/4A 结构域或其部分的核酸。本发明包括使用第一和/或第二轮引物扩增HCV蛋白酶结构域。在本发明的 一个实施方式中,第二轮引物(即第二组)嵌套于使用第一组引物所扩增的核酸区域 内。例如,本发明包括使用第一轮引物扩增编码蛋白酶结构域的HCV核酸,所述第一轮 引物包含编码 Met/Lys-Glu/Gly-Thr/Ile-Lys-Ile/Val/Leu-Ile/Ala-Thr/Gln-Trp/ Lys 和 Ser-Thr-Tyr-Gly/Cys-Lys-Phe-Leu-Ala-Asp-Gly 的核酸序列。第二轮引物可以 包含编码 Ala-Pro/His-Ile-Thr-Ala-Tyr-Ser/Ala-Gln/Arg-Gln-Thr 和 Gly-Ser-Gly/ Arg-Lys-Ser/Thr-Thr/Asn-Lys/Arg-Val-Pro-Ala/Val-Ala/Asp 的核酸序列。本发明包括使用本发明的引物扩增核酸样品的方法,所述核酸样品来自于被HCV 感染或怀疑被HCV感染的患者的样品。在本发明的一个方面,使用基因型非特异性简并引 物扩增HCV蛋白酶结构域。在本发明的另一个方面,使用基因型特异性非简并引物扩增HCV 蛋白酶结构域。在本发明的另一个方面,使用锁(locked)核酸(LNA)引物扩增HCV蛋白酶 结构域。使用本发明的引物仅仅基于编码NS3蛋白酶结构域的核酸序列中的变异而对HCV 进行基因型分型是可能的。本发明包括使用本发明的引物通过本领域已知的基于核酸的方 法(例如,PCR扩增、测序和杂交方法)对HCV进行基因型分型。在本发明的一个实施方式中,通过扩增NS3蛋白酶结构域和/或对NS3蛋白酶结 构域进行测序而确定HCV基因型。例如,本发明包括扩增HCV的蛋白酶结构域内的核酸片段
6并基于片段序列确定HCV的基因型的方法。在本发明的一个方面,通过使用基因型非特异 性简并引物扩增HCV蛋白酶结构域并对所扩增的核酸产物进行测序而确定HCV的基因型。 在本发明的另一个方面,通过使用基因型特异性非简并引物扩增HCV蛋白酶结构域并对所 扩增的核酸产物进行测序而确定HCV的基因型。例如,使用本发明的方法,可以通过将靶序 列与已知基因型(例如Ia和/或lb HCV)的序列相比较而确定HCV的基因型。本发明还提供了确定例如在携带基因型1的HCV的患者中存在药物抗性HCV的方 法。在一个实施方式中,通过扩增编码NS3蛋白酶结构域的核酸片段并确定该片段内存在 与药物抗性相关的突变而确定药物抗性HCV的存在。突变的存在是药物抗性HCV的指征。 在一个实施方式中,扩增的核酸编码位置D168的突变,例如D168A和D168V。核酸可以编 码另外的产生药物抗性的突变,包括但不限于,NS3的位置A156(例如A156T和A156S)和 F43(例如F43S)的突变。在一个实例中,实施例2中描述的引物U3420和D4038可用于鉴 别这些与药物抗性相关的突变。
本发明还提供了确定HCV表型(例如蛋白酶活性)的方法。该方法包括将HCV的 NS3蛋白酶结构域克隆进入筛选载体,所述筛选载体包含编码一个或多个与HCV膜结合的 蛋白和可分泌性报道分子(例如可分泌性荧光素酶报道分子)的多核苷酸。在一个实施方 式中,筛选载体包括载体中所允许的最大数目的与HCV膜结合的蛋白(例如4A、4B和5A, 例如,使非特异性背景噪声信号最小化或减少非特异性背景噪声信号)和可分泌性荧光素 酶报道分子。在另一个实施方式中,筛选载体包含HCV赂3解旋酶、44、48、5々、58(例如,58 的前6个氨基酸)和可分泌性荧光素酶报道分子。在另一个实施方式中,筛选载体包括HCV NS3解旋酶、4A、4B(例如,4B的前6个氨基酸)和可分泌性荧光素酶报道分子。在另一个实 施方式中,筛选载体包括HCV NS3解旋酶、4A、4B、5A(例如,5A的前6个氨基酸)和可分泌 性荧光素酶报道分子。筛选载体表达编码NS3蛋白酶结构域、一个或多个另外的HVC NS结构域(例如NS3 解旋酶、4A、4B、5A)和可分泌性报道分子的多核苷酸,其中NS3蛋白酶结构域、一个或多个HCV NS结构域和可分泌性报道分子可操作地连接。如果NS3蛋白酶结构域是功能性的(即,能够 切割多聚蛋白),则报道分子(例如荧光素酶)被切割并被分泌。在存在合适的底物(例如 荧光素酶底物)时,可以在细胞外检测到来自分泌的报道分子的信号。如果NS3蛋白酶结构 域不是功能性的,则分泌性报道分子不被切割从而不被分泌(即,不能在细胞外产生信号)。在本发明的一个实施方式中,分离HCV并按照对HCV抗病毒治疗剂(例如蛋白酶 抑制剂)的敏感性来筛选HCV。这个方法包括将分离的HCV的NS3蛋白酶结构域克隆进入 本文描述的筛选载体(例如包含编码HCV NS3解旋酶、4々、48、5々、58(例如,58的前6个氨 基酸)和分泌性荧光素酶报道分子的多核苷酸的筛选载体)。将转染的细胞与候选治疗剂 (例如蛋白酶抑制剂)接触。如果HCV对治疗剂敏感,则NS3蛋白酶不切割分泌性荧光素报 道分子并且分泌性荧光素报道分子不被分泌。例如,这样的方法可用于按照抗病毒活性进 行化合物的临床前筛选,确定患者是否对特定的抗病毒治疗有反应,以及确定患者是否对 特定的抗病毒治疗有抗性。
图1显示了一个流程图,其描绘了确定从患者中获得的HCV的抗性的方法的示例性步骤。
图2显示了示例性报道系统。图3显示了以来自96孔Mini-Pr印的DNA进行的表型分型分析的结果。图4显示了 96孔板上的表型分型分析的信号差异。图5显示了使用表型分型系统获得的同一个NS3序列的EC50差异。图6显示了一个流程图,其描绘了基于细胞的报道分子分析的自动化程序的示例 性步骤。图7显示了使用本发明的示例性引物进行的HCV NS3蛋白酶结构域的基因型分型 和表型分型。图8显示了基因型1分离体中上游引物U3276的氨基酸保守性。图9显示了基因型1分离体中下游引物D4221的氨基酸保守性。图10显示了基因型1分离体中上游引物U3420的氨基酸保守性。图11显示了基因型1分离体中下游引物D4038的氨基酸保守性。图12显示了使用基因型la/b非特异性简并引物进行的基因型分型分析的结果。图13显示了患者NS3克隆的表型分型结果。图14显示了 la/b特异性非简并引物的序列。图15显示了以la/b特异性非简并引物获得的结果。图16显示了本发明的表型分型分析的可重复性。图17显示了以临床样品进行的准种(quasi-species)分析。图18显示了群体表型分型和克隆表型分型之间的比较。图19显示,表型分型分析报告了针对体外抗性研究中鉴别的变体的效力。图20显示了在混合群体分析中使用表型分型分析来鉴定体外鉴别的替代。发明详述一般描述本发明包括HCV引物,所述引物能够退火至编码一个或多个NS3结构域的HCV核 酸。本发明还包括扩增编码一个或多个NS3结构域的核酸的方法,基因型分型的方法(例 如HCV的基因亚型分型),检测药物抗性突变的方法和HCV表型分型的方法。本发明的组合 物和方法部分基于以下发现可以仅仅通过利用编码一个或多个NS3结构域的病毒核酸内 的遗传变异(即,无需知道NS3蛋白酶部分之外的变异)来确定HCV的基因型、HCV对于抗 病毒治疗的敏感性和HCV对于抗病毒治疗剂(即药物)的抗性。除非另有指明,否则本文使用的所有技术和科学术语具有本发明所属领域普通技 术人员通常理解的相同的意思。虽然与本文描述的相类似或等同的任何方法和材料均可用 于实践或测试本发明,但是描述了优选的方法和材料。定义如本文所用的术语"EC5tl”或半数最大效应浓度是指诱导介于基线和最大值中点 处的反应的药物浓度。EC5tl代表在体内获得最大效应的50%所需的药物血浆浓度。术语 "IC5tl”或半数最大抑制浓度代表在体外抑制50%所需的药物或抑制剂的浓度。如本文所用的术语“基因”是指任何与生物功能相关的DNA片段。因此,基因包括 但不限于,编码序列和/或它们的表达所需的调节性序列。基因还可以包括非表达DNA片段,例如,所述DNA片段形成针对其它蛋白的识别序列。可以从多种来源获得基因,包括从 目标来源克隆或从已知的或预测的序列信息合成,基因可以包括这样的序列,其被设计用 于具有想要的参数。如本文所用的术语“基因型分型”或“基因型分析”是指确定生物、生物的一部分、 基因或基因的一部分的遗传序列。这样的分析可以在病毒(例如HCV)中进行,以确定个体 对特定的治疗顺利反应的可能性。还可以进行这样的分析以确定是否存在与药物抗性相关 的突变。如本文所用的术语“HCV盒”是指来自患者的HCV NS3核酸序列(即临床HCV分离 体)。HCV盒可以任选地包含编码另外的NS结构域的核酸。例如,HCV盒可以包含NS3蛋 白酶结构域、全部或部分的NS3解旋酶结构域和/或全部或部分的NS4A。 如本文所用的术语“分离的”是指从临床样品(例如血液、血清)中分离的病毒核 酸或目标蛋白和/或其它病毒成分(例如其它蛋白或核酸)。如本文所用的“分离的”核酸 序列是指基本上不含其它核酸序列的核酸序列,例如,至少约20%纯、优选至少约40%纯、 更优选约60%纯、甚至更优选约80%纯、最优选约90%纯、甚至最优选约95%纯。可以通 过例如琼脂糖凝胶电泳确定分离的核酸的纯度。可以通过遗传工程中使用的标准克隆程序 来获得分离的核酸序列,以将核酸序列从其天然位置转移至不同的位点(在那里其将被复 制)。克隆程序可以包括切除并分离想要的核酸片段(其包含编码多肽的核酸序列),将片 段插入载体分子,并将重组载体导入宿主细胞,在宿主细胞中核酸序列的多个拷贝或克隆 将被复制。如本文所用的术语“核酸”、“多核苷酸”、“寡核苷酸”和“引物”是指单链或双链形 式的脱氧核糖核苷酸或核糖核苷酸及其聚合物。因此,当包含在多核苷酸中时,最常见的天 然产生的编码核苷酸缩写如下腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧 啶⑶。另外,字母R和Y分别代表嘌呤(A或G)和嘧啶(C或T)。字母K代表G或T ;字母 S代表G或C ;字母V代表A、G或C。此外,核苷酸后的上标“M”指示该核苷酸被修饰,例如 AM,GMXM和TM分别指示修饰的腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶。修饰的核苷酸的例子 包括但不限于锁核酸(LNA)。除非另有指明,否则单链核酸序列以一系列的5’至3’方向的 单字母缩写表示。除非另有指明,否则特定的核酸序列暗含也包括其保守型修饰的变体(例如简并 密码子替代)和互补序列,以及明确指明的序列。特别地,可以通过产生这样的序列而获得 简并密码子替代所述序列中一个或多个选定的(或所有的)密码子的第三个位置被混合 碱基和 / 或脱氧肌苷残基替代(Batzer 等人(1991)Nucleic Acid Res. 19 5081 ;Ohtsuka 等人(1985) J. Biol. Chem. 260 :2605_2608 ;Cassol 等人(1992) ;Rossolini 等人(1994) Mol. Cell. Probes 8 :91_98)。术语核酸与基因、cDNA和基因编码的mRNA可以互换使用。与待扩增的核酸上的区域相比,上游引物一般与距离核酸分子5’末端较近的区域 结合。另一方面,与待扩增的核酸上的区域相比,下游引物一般与距离核酸分子3’末端较 近的区域结合。如本文所使用,当DNA片段被置于与另一个DNA片段有功能上的关联时,该DNA片 段被称作“可操作地连接”。例如,如果信号序列DNA作为前蛋白(pr印rotein)来表达(前 蛋白参与融合蛋白的分泌),则信号序列DNA与编码本发明的融合蛋白的DNA可操作地连接;如果启动子或增强子刺激序列的转录,则该启动子或增强子与编码序列可操作地连接。 一般地,可操作地连接的DNA序列是连续的并且处在读码相内。类似地,当多肽序列被置于 与另一个多肽序列有功能上的关联时,该多肽序列为“可操作地连接”。因此,在一些实施方 式中,与另一个肽序列可操作地连接的蛋白酶序列这样连接如果该蛋白酶序列是有功能 的,则其能够使连接的肽序列中所结合的至少一个肽键发生蛋白水解。如本文所用的“表型分型”或“表型分析”是指确定HCV病毒的表型特征(例如, 对于抗病毒试剂的敏感性和/或抗病毒治疗剂的抗性)的方法。可以进行这样的分析以确 定HCV样品中是否存在与药物抗性相关的某些突变。如本文所用的术语“多肽”是指由肽键连接的氨基酸残基的单链组成的化合物。本 文使用常规的氨基酸残基的三字符或单字符代码,其中,丙氨酸是ala或A ;精氨酸是arg 或R ;天冬酰胺是asn或N ;天冬氨酸是asp或D ;半胱氨酸是cys或C ;谷氨酸是glu或E ; 谷氨酰胺是gin或Q ;甘氨酸是gly或G ;组氨酸是his或H ;异亮氨酸是ile或I ;亮氨酸 是Ieu或L ;赖氨酸是Iys或K ;蛋氨酸是met或M ;苯丙氨酸是phe或F ;脯氨酸是pro或 P ;丝氨酸是ser或S ;苏氨酸是thr或T ;色氨酸是trp或W ;酪氨酸是tyr或Y ;以及缬氨 酸是val或V。除非另有指明,否则当多肽序列以一系列单字符和/或三字符缩写表示时,与通 常的做法相一致,以N至C的方向表示序列。缩写后的数字表明该氨基酸距离N末端的位 置(例如Met-I代表位置1的蛋氨酸)。
如本文所用的术语“重组”是指以基因或DNA的新的组合进行了转化的细胞、组织 或生物。如本文所用的术语“个体”可以是人、哺乳动物或动物。接受治疗的个体是需要治 疗或潜在地需要治疗的患者。“个体”和“患者”可以互换使用。在本文中提及引物时,术语“基本上互补”是指引物的互补性足够与核苷酸序列在 指定的退火条件下选择性地杂交,从而退火的引物能够被聚合酶延伸以形成该核苷酸序列 的互补性拷贝。如本文所用的术语“转化”是指将核酸(即核苷酸聚合物)转移进入细胞。如本 文所用的术语“遗传转化”是指将DNA(特别是重组DNA)转移并导入细胞。本文所用的“转 化”包括转染。如本文所用的术语“转化子”是指进行了转化或转染的细胞、组织或生物。如本文所用的术语“载体”广泛地指任何编码外源核酸的质粒、噬粒或病毒。该术 语也被理解为包括促进核酸转移进入病毒粒子或细胞的非质粒、非噬粒和非病毒化合物, 例如,如,多聚赖氨酸化合物等。载体可以是适合作为输送媒介用于将核酸或其突变体输送 至细胞的的病毒载体,或者载体可以是适合用于同样目的的非病毒载体。用于将DNA输送 至细胞和组织的病毒和非病毒载体的例子在本领域是熟知的,在例如Ma等人(1997,Proc. Natl. Acad. Sci. U. S. Α. 94 12744-12746)中有描述。病毒载体的例子包括但不限于,重组 细胞巨化病毒、重组牛痘病毒、重组腺病毒、重组逆转录病毒、重组腺相关病毒、重组禽痘病 毒等(Cranage等人,1986,EMBO J. 5 =3057-3063 ; 1994年8月18曰公布的国际专利申请WO 94/17810 ; 1994年10月27日公布的国际专利申请WO 94/23744)。非病毒载体的例子包括 但不限于脂质体、DNA的多胺衍生物等。
如本文所用的术语“野生型”是指天然产生的多核苷酸或多肽序列。HCV 引物本发明提供了包含至少1、2、3、4或5个引物的引物群体。在一个实施方式中,一 个或多个引物能够退火(即杂交)至HCV基因组的区域。在一个实施方式中,一个或多个 引物能够退火至编码HCV蛋白酶的核酸。在另一个实施方式中,一个或多个引物能够退火 至编码NS3蛋白酶结构域的核酸。在另一个实施方式中,一个或多个引物能够退火至编码 NS3/4A结构域或其部分的核酸。 在本发明的另一个实施方式中,本文公开的一个或多个引物能够在核酸扩增所需 的条件下扩增HCV基因组的区域。在一个例子中,一个或多个引物能够扩增编码HCV蛋白 酶的核酸。在一个例子中,一个或多个引物能够扩增编码NS3蛋白酶结构域或其部分的核 酸。在另一个例子中,一个或多个引物能够扩增编码NS3/4A结构域或其部分的核酸。引物可以是基因型特异性或简并引物。此外,引物可以是上游引物或下游引物并 且可以在扩增的第一轮、第二轮或任何后续轮次中使用。引物可以与任何已知的扩增方法 一起使用,包括但不限于,聚合酶链反应(“?0 ”)、实时聚合酶链反应(“肌寸0 ”)、连接酶 链反应(“LCR”)、自身连续(self-sustained)序列复制(“3SR”)(也称为基于核酸序列 的扩增(“NASBA”))、Q-B-复制酶扩增、滚环扩增(“RCA”)、转录介导的扩增(“TMA”)、连 接子辅助的DNA扩增(“LADA”)、多位点置换扩增(“MDA”)、侵染及链置换扩增(“SDA”)。在一个实施方式中,群体中的每个引物包含编码具有氨基酸序列Met/Lys-Glu/ Gly-Thr/IIe-Lys-Ile/Val/Leu-Ile/Ala-Thr/Gln-Trp/Lys (SEQ ID NO 1)的多肽的核酸 序列。SEQ ID NO :1的引物可以是上游或下游引物且可以用于扩增的第一轮或后续轮 次。在一些实施方式中,SEQ ID NO :1的引物是上游引物。在其它实施方式中,引物用于扩 增的第一轮。SEQ ID NO 1 的氨基酸序列中 Met-l、Glu-2、Thr-3、Ile-6、Thr_7 和 Trp_8 的百分 率介于约 95%至约 99. 9%,相应地 Lys-1、Gly_2、Ile_3、Ala_6、Gln-7 和 Lys-8 的百分率 介于约 5%至约 0. 1%。在一些实施方式中,Met-l、Glu-2、Thr-3、Ile-6、Thr-7 或 Trp-8 的 百分率是约 95%,96%,97%,98%,99%,99. 1%,99. 2%,99. 3%,99. 4%,99. 5%,99. 6%, 99. 7%,99. 8%或 99. 9%。Lys_l、Gly_2、Ile-3、Ala-6、Gln_7 和 Lys_8 的百分率相应地改 变,从而每个氨基酸位置上的两个百分率之和是100%。SEQ ID NO 1的氨基酸序列中Ile_5、Val_5和Leu_5的百分率分别介于约67% 至约72%、约14%至约18%和约12%至约17%。在一些实施方式中,Ile_5的百分率是约 67%,68%,69%,69. 1%,69. 2%,69. 3%,69. 4%,69. 5%、70%、71 %或 72%;Val_5 的百分 率是约 14%、15%、15· 9%、16%、16· 1%、16· 2%、16· 3%、17%或 18% ;Leu-5 的百分率是 约 12%、13%、14%、14. 4%、14. 5%、14. 6%、14. 7%、14. 8%、15%、16%或 17%,其中每个 氨基酸的百分率之和是100%。在示例性的实施方式中,引物的群体包含编码氨基酸序列群的核酸序列,所述氨 基酸序列群具有以下的每种氨基酸分布Met (99. 5 % )/Lys(0. 5 % )-Glu(99. 5 % )/Gly(0. 5 % )-Thr (96. 5 % )/ Ile(3. 5 % )-Lys (100 % )-lie (69. 3 % )/Val(16. 1 % )/Leu(14. 6 % )-lie (99. 5 % )/Ala(0. 5% ) -Thr (99. 5% ) /Gln (0. 5% ) -Trp (99. 5% ) /Lys (0. 5% ) 在另一个示例性的实施方式中,每个引物包含与核酸序列 ATGGAGACYAAGVTYATYACSTGGG(SEQ ID NO 2)具有 80 %,85 %,90 %,95 %,96 %,97 98%、99%或100%同源性的核酸序列,其中任意核苷酸可以被修饰。修饰的核苷酸的 例子包括但不限于锁核酸(LNA)。虽然本发明的引物可以包含任意数目的修饰的碱基, 例如具有LNA的引物,但是在一些实施方式中,引物包含约4个或约8个LNA。一般 地,A和T的修饰比G和C的修饰更常见。在一些实施方式中,每个引物包含核酸序列 ATGGAGACYAMAMGVTYAMTYAMCSTGGG 或 AMTGMGMAGACYAMAMGVTYAMTYAMCMSTGGG。在另一个实施方式中,群体中每个引物的互补物包含编码具有氨基酸序列 Ser-Thr-Tyr-Gly/ Cys-Lys-Phe-Leu-Ala-Asp-Gly(SEQ ID NO 3)的多肽的核酸序列。SEQ ID NO :3的引物可以是上游或下游引物且可以用于扩增的第一轮或后续轮 次。在一些实施方式中,SEQ ID NO :3的引物是下游引物。在其它实施方式中,引物用于扩 增的第一轮。SEQ ID NO :3的氨基酸序列中Gly-4的百分率介于约95%至约99%,相应地 Cys-4的百分率介于约5%至约1%。在一些实施方式中,Gly-4的百分率是约95%、96%、 97%、98%或99%。相应地,Cys-4的百分率是约5%、4%、3%、2%或1%。在示例性的实施方式中,群体中引物的互补物包含编码氨基酸序列群的核酸序 列,所述氨基酸序列群具有以下的每种氨基酸分布Ser (100%) -Thr (100%) -Tyr (100%) -Gly (97. 0 % ) /Cys (3. 0%) -Lys (100%) -P he(100% )-Leu (100% )-Ala(100% )-Asp (100% )-Gly(100% )。在另一个示例性的实施方式中,每个引物包含与核酸序列CCGTCGGCAAGRAACTTGCC RTAGGTGGA(SEQ ID NO 4)具有 80%、85%、90%、95%、96%、97%、98%、99%或 100% 同源 性的核酸序列,其中任意核苷酸可以被修饰。修饰的核苷酸的例子包括但不限于LNA。在一 些实施方式中,每个引物包含核酸序列CCGTCGGCAAGRAMACTTMGCCRTMAGGTMGGA 或CCGTMCGGCAAMGRAMACTMTMGCCRTMAMGGTMGGA。在另一个实施方式中,群体中的每个引物包含编码具有氨基酸序列Ala-Pro/ His-Ile-Thr-Ala-Tyr-Ser/Ala-Gln/Arg-Gln-Thr(SEQ ID NO 5)的多肽的核酸序列。SEQ ID NO :5的引物可以是上游或下游引物且可以用于扩增的第一轮或后续轮 次。在一些实施方式中,SEQ ID NO :5的引物是上游引物。在其它实施方式中,引物用于扩 增的第二轮。SEQ ID NO 5的氨基酸序列中Pro_2和Gln_8的百分率介于约95%至约99. 9%, 相应地His-2和Arg-8的百分率介于约5%至约0. 1%。在一些实施方式中,Pro_2或Gln_8 的百分率是约 95 %、96 %、97 %、98 %、99 %、99. 1 %、99. 2 %、99. 3 %、99. 4 %、99. 5 %、 99. 6%、99. 7%、99. 8%或99. 9%。His_2和Arg_8的百分率相应地改变,从而每个氨基酸 位置的两个百分率之和是100%。SEQ ID NO 5的氨基酸序列中Ser_7和Ala_7的百分率分别介于约64%至约68% 和约32%至约36%。在一些实施方式中,Ser-7的百分率是约64%、65%、66%、67%或 68 % ;Ala-7的百分率是约32 %、33 %、34 %、35 %、或36 %,其中每个氨基酸的百分率之和 是 100%。
在示例性的实施方式中,引物的群体包含编码氨基酸序列群的核酸序列,所述氨 基酸序列群具有以下的每种氨基酸分布Ala (100 % ) -Pro (99. 5%)/His(0. 5% )-lie (100% ) -Thr (100%) -Ala (100 % ) -T yr(100% )-Ser(66% )/Ala(34% )-Gln(99% )/Arg(l% )-Gln(100% )-Thr(100% )。在另一个示例性的实施方式中,每个引物包含与核酸序列GCGCCYATYACGGCCTAYKC CCARCARAC(SEQ ID NO 6)具有 80%、85%、90%、95%、96%、97%、98%、99%或 100% 同源 性的核酸序列,其中任意核苷酸可以被修饰。修饰的核苷酸的例子包括但不限于LNA。在一 些实施方式中,每个引物包含核酸序列GCGCCYAMTMYACGGCMCTMAMYKCCCMARCMAMRAC 或GCGCCYAMTMYACGGCCTAMYKCCCARCAMRAC。
在另一个示例性的实施方式中,每个引物包含与核酸序列AGGGCATTTAAATAGCCACC ATGGCGCCYATYACGGCCTAYKCCCARCARAC(SEQ ID NO 7)或AAAAAGGCGCGCCACCATGGCGCCYATYACGGCCTAYKCCCARCARAC(SEQ ID NO 8)具有 80%、85%、90%、95%、96%、97%、98%、99%或100%同源性的核酸序列,其中核酸序列 SEQ ID NO :7或8的任意核苷酸可以被修饰。示例性的弓I物还包括那些包含核酸序列AGGGCATTTAAATAGCCACCATGGCGCCYAMTMYACGGCCTAMYKCCCARCAMRAC 或AGGGCATTTAAATAGCCACCATGGCGCCYAMTMYACGGCMCTMAMYKCCCMA RCMAMRAC 的引物。在另一个实施方式中,群体中每个引物的互补物包含编码具有氨基酸序列 Gly-Ser-Gly/Arg-Lys-Ser/Thr-Thr/Asn-Lys/Arg-Val-Pro-Ala/Val-Ala/Asp(SEQ ID NO 9)的多肽的核酸序列。SEQ ID NO :9的引物可以是上游或下游引物且可以用于扩增的 第一轮或后续轮次。在一些实施方式中,SEQ ID NO :9的引物是下游引物。在其它实施方 式中,引物用于扩增的第二轮。SEQ ID NO 9 的氨基酸序列中 Gly_3、Ser_5、Thr_6、Ala-IO 和 Ala-Il 的百分率 介于约95%至约99. 9%,相应地Arg-3、Thr_5、Asn_6、Val-IO和Asp-Il的百分率介于约 5%至约0. 1%ο在一些实施方式中,Gly-3、Ser_5、Thr_6、Ala-10或Ala-11的百分率是 约 95%,96%,97%,98%,99%,99. 1 %,99. 2%,99. 3%,99. 4%,99. 5%,99. 6%,99. 7%, 99. 8%或99. 9%。Arg-3、Thr-5、Asn-6、Val-IO和Asp-Il的百分率相应地改变,从而每个 氨基酸位置上的两个百分率之和是100%。SEQ ID NO 9的氨基酸序列中Lys_7和Arg_7的百分率分别介于约90%至约95% 和约10%至约5%。在一些实施方式中,Lys-7的百分率是约90%、91 %、92%、93%、94% 或95% ;相应地,Arg-7的百分率是约10%、9%、8%、7%、6%或5%。在示例性的实施方式中,群体中引物的互补物包含编码氨基酸序列群的核酸序 列,所述氨基酸序列群具有以下的每种氨基酸分布Gly (100 % ) -Ser (100 % ) -Gly (99. 5%)/Arg(0. 5% )-Lys (100% )-Ser (99. 5%)/ Thr (0. 5%) -Thr (99 % ) /Asn (1%) -Lys (93 % ) /Arg (7 % ) -Val (100%) -Pro (100%) -Ala (9 9% )/Val(l% )-Ala(99% )/Asp(l% )。在另一个示例性的实施方式中,每个引物包含与核酸序列GCAGCCGGCACYTTRGTGCTYTTRCCGCTRCC(SEQ ID NO 10)具有 80%、85%、90%、95%、96%、97%、98%、99%或 100% 同源性的核酸序列,其中任意核苷酸可以被修饰。修饰的核苷酸的例子包括但不限于LNA。 在一些实施方式中,每个引物包含核酸序列GCAGCCGGCAMCYTTMRGTMGCTMYTMTMRCMCGCTMRCC 或GCAGCCGGCACYTTMRGTGCTMYTTMRCCGCTMRCC。在另一个示例性的实施方式中,每个 引物包含与核酸序列AAAAAGCGGCCGCAGCCGGCACYTTRGTGCTYTTRCCGCTRCC(SEQID NO 11)或 CTTGGTTAATTAATGCAGCCGGCACYTTRGTGCTYTTRCCGCTRCC (SEQ ID NO 12)具有 80 %、 85%,90%,95%,96%,97%,98%,99%^ 100%同源性的核酸序列,其中核酸序列SEQ ID NO 11或12的任意核苷酸可以被修饰。示例性的引物还包括那些包含核酸序列AAAAAGCGGCCGCAGCCGGCACYTTMRGTGCTMYTTMRCCGCTMRCC 或AAAAAGCGGCCGCAGCCGGCAMCYTTMRGTMGCTMYTMTMRCMCGCTMRCC 的引物。在另一个示例性实施方式中提供了非简并引物或对某些基因型或基因亚型特异 性的引物。示例性的HCV基因型Ia的引物包括ATGGAGACCAAGCTCATCACGTGGG (例如上游引物),ACCCGCCGTCGGCAAGGAACTTGCCGTA (例如,下游引物),AGGGCATTTAAATAGCCACCATGGCGCCCATCACGGCGTACGCCCAGCAGAC (例如,上游引物),AAAAAGCGGCCGCAGCCGGGACCTTGGTGCTCTTACCGCTGCC (例如,下游引物)。示例性的 HCV基因型Ib的引物包括ATGGAGACCAAGATCATCACCTGGG (例如,上游引物),CCGTCGGCAAGGAACTTGCCATAGGTGGA (例如,下游引物),AGGGCATTTAAATAGCCACCATGGCGCCCATCACGGCCTACTCCCAACAGAC (例如,上游引物),AAAAAGCGGCCGCAGCCGGCACCTTAGTGCTCTTGCCGCTGCC (例如,下游引物)。试剂盒本发明包括包含一个或多个本发明的引物或其互补物的试剂盒。试剂盒可以包含 本发明引物的任意组合。在一个实施方式中,试剂盒包含一个或多个编码SEQ ID N0:1和 /或SEQ ID NO :3的多肽序列的引物或其互补物。在另一个实施方式中,试剂盒包含一个 或多个编码SEQ ID NO :5和/或SEQ IDNO 9的多肽序列的引物或其互补物。在另一个实 施方式中,试剂盒包含一个或多个SEQ ID N0:2和/或SEQ ID NO :4的引物或其互补物。 在另一个实施方式中,试剂盒包含一个或多个SEQ ID N0:6、7和/或8的引物或其互补物。 在另一个实施方式中,试剂盒包含一个或多个SEQ ID NO :10、11和/或12的引物或其互补 物。在另一个实施方式中,试剂盒包含一个或多个SEQID N0:6、7和/或8的引物或其互补 物以及一个或多个SEQ ID N0:10、ll和/或12的引物或其互补物。在另一个实施方式中,试剂盒还包含说明书,用于扩增HCV的区域、确定HCV的基 因型或表型、或确定药物抗性HCV的存在。例如,试剂盒可以包含确定HCV对治疗剂敏感性 的说明书。这样的试剂盒可用于按照抗病毒效应筛选候选治疗剂。在另一个实施方式中,试剂盒还包含一个或多个用于扩增HCV核酸的酶或试剂。 例如,在一个实施方式中,试剂盒包含一个或多个引物和聚合酶(例如,嗜热聚合酶如Taq聚合酶或嗜温聚合酶)。在另一个实施方式中,试剂盒包含dNTP。试剂盒可以任选地包含 扩增缓冲剂。本发明的试剂盒可以包含置于带标签的容器或带多个标签的容器中的一个或多 个引物。在本发明的另一个实施方式中,试剂盒包含用于克隆HCV核酸的载体。例如,本发 明包括包含具有CMV启动子的载体的试剂盒。本发明还包括包含编码报道分子部分(例如 荧光素酶部分)的载体的试剂盒。在本发明的一个实施方式中,试剂盒包括荧光素酶的底 物例如荧光素。在本发明的另一个实施方式中,试剂盒包含用于克隆HCV核酸的载体和一 个或多个引物。HCV的扩增本发明包括扩增HCV核酸的方法。本发明的方法可用于扩增DNA或RNA。分子可以 是双链的或 单链的形式,优选为双链。当用作起始材料的核酸是双链时,优选为使两条链形 成单链或部分单链的形式。已知的将链分开的方法包括但不限于,加热、碱、甲酰胺、尿素和 乙二醛(glycoxal)处理,酶法(例如解旋酶作用)和结合蛋白。例如,可以通过在80°C至 105°C范围内的温度加热而将链分开。用于实现这种处理的一般性方法由Jos印hSambrook, 等人,Molecular Cloning,A Laboratory Manual,Cold Spring HarborLaboratory Press, Cold Spring Harbor, N. Y. (2001)提供。在一个实施方式中,方法包括使用本发明的引物扩增来自HCV样品的核酸。HCV样 品可以是,例如,来自于被HCV感染或怀疑被HCV感染的患者的临床样本。例如,可以通过 静脉穿刺或活组织检查(例如血液和肝脏样品)获得含有HCV的临床样本。可以直接从样 本扩增病毒核酸(即,在扩增前没有分离和/或纯化步骤)或者可以分离病毒核酸并在扩 增前通过本领域已知的方法将其纯化。本发明的方法可以用于扩增HCV的蛋白酶区域。例如,本发明包括扩增HCV的NS3 蛋白酶结构域的方法。本发明的一个或多个引物,例如SEQID N0:l-12的那些,可用于扩增 HCV的区域。引物可以含有一个或多个修饰的核苷酸。在示例性的实施方式中,使用SEQ ID NO :1和SEQ ID NO :3的引物,或SEQ ID NO :5和SEQ ID NO :9的引物,或其组合。在另一 个示例性实施方式中,SEQ ID NO 2和SEQ ID NO 4的引物或SEQ ID NO :6、7或8和SEQ ID NO =IOUl或12的引物或其组合用于扩增病毒核酸。本发明包括使用全长的NS3/4A引物扩增编码NS3的核酸的方法。在一个实施方 式中,引物是对被HCV感染或怀疑被HCV感染的患者特异性的全长NS3/4A引物。在另一个 实施方式中,引物退火至编码NS3/4A或其部分、NS3 (NS3蛋白酶和NS3解旋酶)或其部分、 NS2/NS3或其部分或NS2/NS3/NS4A或其部分的核酸。在另一个实施方式中,引物编码HCV 蛋白酶结构域。一个或多个引物可以是对特定HCV序列特异性的,例如基因型特异性的。在本发 明的一个实施方式中,一个或多个引物是简并引物。不同的引物可以同时或依次用于扩增想要的HCV区域。在本发明的一个实施方式 中使用两组或多组引物。在此实施方式中,第二组引物可用于扩增第一组引物的扩增产物 内的区域(SP,至少一组引物为巢式的)。可以使用本发明的引物通过本领域已知的方法(例如聚合酶链反应(PCR))扩增核酸。在PCR中,在存在聚合酶和dNTP时,在允许引物的后续延伸和变性的条件下,本发明 的引物组退火至单链HCV核酸模板。参见例如美国专利4,683,202和5,766,889,每篇通过 引用全文并入本文。如技术人员所能认识到的,可以使用本发明的引物根据本领域已知的 方法使用各种扩增方法来扩增编码NS3蛋白酶结构域的核酸,包括非聚合酶链反应方法和 不依赖于使用嗜热聚合酶的方法(例如嗜温聚合酶例如phi29)。可以使用任何目前已知或 以后发现的扩增方法(包括但不限于本文描述的那些)来进行扩增。HCV基因型分型的方法本发明还提供了确定HCV的基因型的方法。特别地,本发明允许不对完整的HCV基 因组进行测序而确定HCV的基因型。相反地,本发明允许仅仅基于HCV蛋白酶(例如NS3、 NS3/4A或NS3和一部分的NS4A)的序列而确定HCV的基因型。在一个实施方式中,方法包括如上所述扩增编码蛋白酶结构域的核酸(例如,使 用基因型特异性引物或简并引物)并基于所述编码蛋白酶的核酸片段的序列而确定HCV的 基因型。在一个实施方式中,片段位于HCV的NS3蛋白酶结构域之内。 本发明还提供了通过非扩增方式(例如,通过测序或杂交技术)确定HCV基因型 的方法。在一个实施方式中,通过确定NS3基因型特异性引物或引物组是否能够与HCV核 酸杂交而确定HCV的基因型。本发明的基因型分型方法可用于确定HCV分离体是否对HCV抗病毒治疗剂敏感。 例如,本发明的基因型分型方法可用于确定HCV分离体NS3序列是否与对于抗病毒治疗剂 的抗性相关。不希望被特别的理论所束缚,本发明的发明人发现,NS3蛋白酶结构域中的单 个氨基酸替代能够赋予对抗病毒治疗剂的抗性,而解旋酶结构域和NS4A中的氨基酸替代 似乎不影响抗性,例如对蛋白酶抑制剂的抗性。在本发明的另一个实施方式中,可以确定HCV分离体的临床基因型和亚型。HCV有 11种主要的临床基因型,其进一步被特征性地分为亚型(称为a、b、c等)。已经表明一些 临床基因型相对于其它基因型来说更容易被目前的治疗方法所治疗。例如,与基因型2和 3相比,基因型1对单独的干扰素的反应较弱。因此,通过确定HCV的基因型或亚型(例如 HCV基因型1,包括HCV基因型Ia和lb),本发明的方法可用于帮助医生为感染HCV的患者 选择最合适的治疗剂(即最有效并安全的)。为了对来自患者的HCV进行基因型分型,必须从该患者获得含有病毒的临床样 本。在一个实施方式中,通过活组织检查(例如肝活组织检查)获得样本。在另一个实施 方式中,样本是血液。从临床样本中分离病毒RNA并用作扩增的模板。在一个实施方式中,使用能够退 火至编码蛋白酶(例如NS3或NS3/4A)的病毒核酸的基因型特异性引物来扩增核酸模板。 在另一个实施方式中,使用能够扩增编码蛋白酶(例如NS3或NS3/4A)的病毒核酸的简并 引物来扩增核酸模板。本发明包括使用编码SEQ ID NO :1和SEQ ID NO :3的氨基酸的引物 (或其互补物)和/或编码SEQ ID NO 5和SEQ ID NO 9的氨基酸的引物(或其互补物) 进行基因型分型的方法。本发明还包括使用一个或多个对应于SEQ ID N0:2、4、6、7、8、10、 11或12的引物或其互补物进行基因型分型的方法。在本发明的一个实施方式中,使用多个 引物组扩增NS3核酸以产生用于基因型分析的多个扩增子。然后使用本领域已知的方法(例如Sanger测序)对扩增的蛋白酶核酸进行测序。在一些实施方式中,扩增的蛋白酶核酸作为群体进行测序(例如,以确定从个体分离的HCV 群体的NS3蛋白酶的序列)。在其它实施方式中,扩增的蛋白酶核酸单个地进行测序(例 如,确定从个体分离的单个HCV的NS3蛋白酶的序列)。在一个实施方式中,在测序前通过 本领域已知的方法(包括但不限于,鸟枪法测序)将扩增的蛋白酶核酸进行克隆。在其它 实施方式中,扩增的蛋白酶核酸不首先进行克隆而直接测序。在一个实施方式中,可以通过将经测序的蛋白酶核酸的序列与一个或多个已知基 因型的蛋白酶序列进行比对、并鉴别与经测序的蛋白酶核酸同源的已知基因型的蛋白酶序 列,而确定经测序的蛋白酶核酸的基因型。可以使用计算机软件(例如Blast)和本领域已 知的计算机可读介质中的数据库进行分析。在另一个实施方式中,可以通过将经测序的蛋白酶核酸的主要核苷酸(或由经测 序的核苷酸编码的氨基酸)与已知基因型的对照进行比较而确定经测序的蛋白酶核酸的 基因型。在优选的实施方式中,从血清样品中分离病毒RNA。使用简并引物(其被设计为扩 增不论何种基因型的NS3蛋白酶)扩增样品。然后对经扩增的核酸进行测序。如技术人员能够认识到的,本发明的范围包括以上所描述的基因型分型方法的变 体。例如,可以不首先从病毒样品中分离RNA而直接扩增HCV。同样,引物可以变化,只要引 物能够退火至编码蛋白酶区域的病毒核酸。例如,扩增的区域可以另外包含编码 除了 NS3 之外的周围的蛋白结构域(例如p7、NS2、NS4A和/或NS4B)的核酸。此外,可以在测序前 将扩增的核酸进行克隆。HCV表型分型的方法本发明还提供了确定HCV表型的方法。在一个实施方式中,目标表型是蛋白酶功 能(例如,NS3蛋白酶活性的水平)。在另一个实施方式中,目标表型是HCV对于抗病毒治 疗剂的敏感性。例如,本发明包括确定HCV对蛋白酶抑制剂的敏感性的方法。在本发明的 另一个实施方式中,目标表型是对于抗病毒治疗剂的抗性。为了对来自患者的HCV进行表型分型,按照上文所述从个体获得HCV的临床样 品。例如,可以从患者的血清获得HCV。将HCV的蛋白酶结构域进行扩增,从而扩增子(即 HCV盒)可以被克隆进入筛选载体。在转染宿主细胞前可以通过本领域已知的方法(例如 maxi-prep)将含有患者HCV盒的筛选载体进行纯化。本发明的表型分型方法需要患者的HCV盒。如上文所讨论,从患者获得HCV核酸 并将其扩增。可以通过本申请中公开的方法扩增编码NS3蛋白酶结构域的核酸。例如,可 以使用基因型特异性引物扩增HCV核酸。在另一个实施方式中,使用简并引物扩增HCV核 酸。本发明包括使用编码SEQID NO :1和SEQ ID NO 3的氨基酸的引物(或其互补物)和 /或编码SEQ IDNO 5和SEQ ID NO 9的氨基酸的引物(或其互补物)进行表型分型的方 法。本发明还包括使用一个或多个对应于SEQ ID NO :2、4、6、7、8、10、11或12的引物或其 互补物进行表型分型的方法。本发明的表型分型报告系统依赖于包含编码报道分子部分(例如可分泌性报道 分子部分)的核酸的筛选载体。在一个实施方式中,筛选载体包含编码一个或多个与HCV 膜结合的蛋白和可分泌性报道分子的多核苷酸。在另一个实施方式中,筛选载体包括载体 中所允许的最大数目的与HCV膜结合的蛋白(例如4A、4B和5A,例如,使非特异性背景噪声信号最小化或减少非特异性背景噪声信号)和可分泌性报道分子。在另一个实施方式中, 筛选载体包括HCV NS3解旋酶、4A、4B、5A、5B (例如,5B的前6个氨基酸)和可分泌性报道 分子。在另一个实施方式中,筛选载体包括HCV NS3解旋酶、4A、4B(例如,4B的前6个氨基 酸)和可分泌性报道分子。在另一个实施方式中,筛选载体包括HCV NS3解旋酶、4A、4B、 5A(例如,5A的前6个氨基酸)和可分泌性报道分子。在一个实施方式中,筛选载体包括编码HCV赂3解旋酶、44、48、5々、58(例如,58的 前6个氨基酸)和分泌性报道分子的多核苷酸。在该实施方式中,将NS3结构域盒克隆进 入筛选载体。例如,NS3结构域盒可以包含编码NS3蛋白酶结构域或NS3蛋白酶结构域和 一部分的解旋酶结构域的核酸。在本发明的一个实施方式中,所述盒包含编码NS3蛋白酶 结构域和一部分的解旋酶结构域(例如,解旋酶结构域的约4个氨基酸、约5个氨基酸、约 6个氨基酸、约7个氨基酸、约8个氨基酸、约9个氨基酸或约10个或更多个氨基酸)的核 酸。
在一个实施方式中,筛选载体包含编码HCV NS4B、5A、5B(例如,5B的前6个氨基 酸)和分泌性报道分子的多核苷酸。在该实施方式中,将NS3/4A结构域盒克隆进入筛选载 体。在本发明的另一个实施方式中,所述盒包含编码NS3结构域(即NS3蛋白酶和解旋酶 结构域)和一部分的NS4A结构域(例如,NS4A结构域的约4个氨基酸、约5个氨基酸、约 6个氨基酸、约7个氨基酸、约8个氨基酸、约9个氨基酸或约10个或更多个氨基酸)的核 酸。如上文所讨论,将HCV盒克隆进入包含编码报道分子(例如可分泌性报道分子) 的多核苷酸的筛选载体。编码NS3蛋白酶结构域或全长蛋白酶(例如NS3Pro或NS3/4A)的 HCV盒、编码NS部分(例如NS4B和5B)的载体核酸,和编码分泌性报道分子的载体核酸可 操作地连接,从而对来自分泌的报道分子的信号的检测指示想要的功能结构域的存在。在 本发明的一个实施方式中,载体受CMV启动子的控制。本发明的筛选载体可以在多种细胞系中瞬时转染。在一个实施方式中,筛选载体 在294细胞系(例如293-FS细胞)中转染。重要的是要注意系统不限于Huh_7细胞或“治 愈的(cured)”复制子细胞。在图2中显示了可用于表型分型分析的示例性HCV报告系统。 如图2所示,NS3活性与报道分子活性(例如分泌的荧光素酶活性)相关联。图2的系统 提供了简单且一致的DNA转染并避免了与转染RNA相关的问题。本发明的报告系统通过分泌能够检测NS3盒是否编码功能性蛋白酶的报道分子 部分而工作。特别地,多肽内的功能性蛋白酶结构域从翻译的多肽中切割报道分子。如果 蛋白酶结构域不是功能性的,则报道分子部分不被切割。因此,检测分泌的信号指示功能性 蛋白酶结构域的存在,而不存在分泌的信号则指示不存在功能性蛋白酶结构域。在一些实 施方式中,弱信号是低效率蛋白酶的指征。能够分泌的报道分子可以是本领域已知的任何报道分子部分。在一个实施方式 中,能够分泌的报道分子是自己能够分泌或者与分泌信号肽可操作地连接之后能够分泌的 可检测的部分。在另一个实施方式中,能够分泌的报道分子是可分泌性荧光素酶。为了让荧 光素酶提供可检测的信号,必须存在荧光素酶的底物。在本发明的一个实施方式中,将含有 本发明载体的宿主细胞与荧光素酶的底物接触。在一个实施方式中,向细胞中加入报道分 子底物(例如荧光素)并读取产生的信号。在一个实施方式中,信号是荧光信号。在一个实施方式中,通过本领域已知的方法(例如使用光度计)读取信号。如本领域技术人员所理 解,系统中还可以使用另外的可分泌性报道分子部分,只要报道分子部分原来(otherwise) 不存在于用于进行分析的细胞中。其它的合适的报道分子部分包括但不限于SEAP。在一个实施方式中,本发明的表型分析可用于确定HCV分离体是否对于抗病毒治 疗(例如蛋白酶抑制剂治疗剂)敏感。在该实施方式中,将包含筛选载体的宿主细胞与药 物接触。药物可以进行系列稀释。如果药物阻止或减少报道分子的分泌,则药物对于抑制 病毒蛋白酶是有效的。为了确定药物是否阻止或减少报道分子的分泌,可以加入报道分子 底物(例如,如果报道分子是荧光素酶的话,可以加入荧光素酶底物)。然后可以测定信号 强度。在另一个实施方式中,本发明的表型分型分析可用于确定HCV群体(例如从个体 中分离的HCV群体)是否对于抗病毒治疗(例如蛋白酶抑制剂治疗剂)敏感。在该实施方 式中,将包含筛选载体的宿主细胞(其中单个筛选载体可以包含编码来自HCV群体的不同 NS3蛋白酶结构域的核酸)与药物接触。药物可以进行系列稀释,可以加入报道分子底物, 可以测定报道分子活性,如上文和本文其它地方所述。在另一个实施方式中,通过将以筛选载体(其含有患者的HCV盒)瞬时转染的宿 主细胞与目标药 物接触而确定对目标药物的药物抗性。在一个实施方式中,目标药物是蛋 白酶抑制剂。例如,目标药物可以是ITMN-191。在本发明的一个实施方式中,目标药物进 行系列稀释(例如系列稀释的ITMN-191)。报道分子的分泌指征药物的抗性。在一个实施 方式中,可分泌性荧光素酶是报道分子,加入荧光素酶底物。加入可分泌性荧光素酶底物之 后,读取信号(例如荧光)。基于是否存在信号以及信号的强度,可以进行分析以确定药物 抗性。在一个实施方式中,可以通过将报道分子信号针对药物浓度作图而确定EC50值。表 型分型分析中EC50值的任何升高都是患者HCV中药物抗性的指征。本发明的表型分型方法可以以高通量形式进行。分泌的报道分子容易被测定并且 表型分型系统可针对机器进行修正。在一个实施方式中,自动操作允许每天进行大约96、 144、192、240或288个样品的12点EC50测定。核酸本发明还提供了编码HCV NS多聚蛋白的NS3蛋白酶结构域的分离的核酸分子。例 如,本发明包括编码NS3蛋白酶结构域和任选的NS2结构域、NS3解旋酶结构域、NS4A结构 域、NS4B结构域和/或NS5A结构域或任何这样的结构域的一部分的分离的核酸分子。在 一个实施方式中,分离的核酸分子编码NS2的一部分,从约170位氨基酸开始。在另一个实 施方式中,核酸分子编码NS多聚蛋白的NS3蛋白酶结构域和至少一部分的NS3解旋酶结构 域。例如,本发明包括编码NS3蛋白酶结构域和NS3解旋酶结构域的至少约4个氨基酸、约 5个氨基酸、约6个氨基酸、约7个氨基酸、约8个氨基酸、约9个氨基酸或约10个或更多个 氨基酸的分离的核酸分子。在本发明的一个实施方式中,分离的核酸分子编码NS3蛋白酶 结构域、NS3解旋酶结构域和NS4A结构域。例如,本发明包括编码NS3蛋白酶结构域、NS3 解旋酶结构域和NS4A结构域的至少约4个氨基酸、约5个氨基酸、约6个氨基酸、约7个氨 基酸、约8个氨基酸、约9个氨基酸或约10个或更多个氨基酸的分离的核酸分子。在一个实施方式中,通过使用本发明的引物获得编码NS3蛋白酶结构域的分离的 核酸分子。例如,可以通过使用NS3基因型特异性引物获得分离的核酸分子。在另一个实施方式中,使用简并引物获得分离的核酸分子,所述简并引物被设计为扩增不论何种基因 型的NS3区域。本发明包括使用编码SEQ ID NO :1和SEQ ID NO :3的氨基酸序列的引物 (或其互补物)和/或编码SEQ ID NO 5和SEQ ID NO 9的氨基酸序列的引物(或其互补 物)获得的分离的核酸分子。本发明还包括使用一个或多个对应于SEQ ID N0:2、4、6、7、 8、10、11或12引物或其互补物获得的分离的核酸分子。本发明的分离的核酸分子可以是单链或双链的,例如双链的DNA。本发明包括含有 修饰的核苷酸的核酸分子。例如,可以通过将一个或多个核苷酸替代、添加或删除引入相应 的HCV NS3核苷酸序列中而产生本发明的核酸分子,从而一个或多个氨基酸替代、添加或删 除被引入所编码的蛋白中。在另一个实施方式中,本发明的分离的核酸分子长度为至少约10个氨基酸、约12 个氨基酸、约15个氨基酸、约18个氨基酸、约20个氨基酸或约25个氨基酸并且在严谨条 件下与包含至少一个NS3核苷酸序列的核酸分子杂交。还提供了用于复制核酸分子以及用于表达多肽的宿主细胞和载体。可以使用任何 载体或宿主细胞(例如,原核的或真核的)。本领域中已知有很多载体和宿主细胞可用于此 目的。为了想要的应用而选择合适的配套是本领域的常规技能。在一个实施方式中 ,载体 是pcDNA3,宿主细胞是293-FS细胞。使用基于探针的方法分离编码NS3蛋白酶结构域的核酸序列的技术是常规技术 并且对于本领域技术人员是熟知的。例如,可以使用由Mullis等人(美国专利4. 683,195) 和Mullis (美国专利4. 683,202)公开的聚合酶链反应(PCR)方法(通过引用并入本文)。 用于分离这样的核酸序列的探针可以基于已公开的核酸或蛋白序列。可以将分离的NS3核酸(或多肽)的序列与对照的NS3序列比较以确定核酸分 离自何种HCV基因型。如本领域所知,两个多核苷酸或多肽之间的相似性是通过将一个 多核苷酸或多肽的核苷酸或氨基酸序列及其保守性核苷酸或氨基酸替代与第二个多核 苷酸或多肽的序列相比较而确定的。本领域还已知“同一性”是指两个多肽或两个多核 苷酸序列之间的序列相关性程度(由这样的两串序列之间匹配同一性确定)。同一性和 相 1以性均可容易地计算(Computational Molecular Biology, Lesk, A.M.,ed.,Oxford UniversityPress, New York,1988 ;Biocomputing :Informatics and Genome Projects, Smith,D.W. ,ed. ,Academic Press,New York, 1993 ;Computer Analysis of SequenceData, Part I,Griffin,A. M.,禾口Griffin,H. G. ,eds. ,Humana Press,New Jersey, 1994 ;Sequence Analysis in Molecular Biology, von Heinje, G. , Academic Press,1987 ;禾口 Sequence Analysis Primer, Gribskov, M. and Devereux, J. , eds. , MStockton Press, New York, 1991)。存在一些测定两个多核苷酸或多肽序列之间同一性和相似性的方法,术语“同一 性”和“相似性”对本领域技术人员是熟知的(Sequence Analysis inMolecular Biology, von Heinje, G. , Academic Press,1987 ;Sequence AnalysisPrimer, Gribskov, M. and Devereux, J. , eds. , M Stockton Press, New York, 1991 ;以及 Carillo, H.,禾口 Lipman, D., SIAM J. Applied Math.,48 :1073 (1988))。通常使用的确定两个序列之间同一性或相似性 W^fe^SiM^KTJP^i Guide to Huge Computers, Martin J. Bishop, ed. , Academic Press, San Diego,1994 禾口 Carillo, H. , and Lipman, D. , SIAM J. Applied Math. 48 1073(1988)中公开的那些。优选的确定同一性的方法设计为给出所测的两个序列之间的最大匹配。用于确定 同一性和相似性的方法由计算机程序编码。确定两个序列之间同一性和相似性的计算机 程序方法包括但不限于GCG程序包(Devereux等人,Nucl. Acid Res. 12(1) :387(1984))、 BLASTP, BLASTN、FASTA (Atschul 等人,J. Mol. Biol. 215 403 (1990)) 以上所称的相似性 或同一性程度按照两个序列之间的同一性程度确定,通常指示第一个序列从第二个序列的 衍生。可以通过本领域已知的计算机程序方法(例如GCG程序包(Needleman andffunsch, J. Mol. Biol. 48 =443-453(1970))中提供的GAP)确定两个核酸序列之间的同一性程度。为 了本发明确定两个核酸序列之间同一性程度的目的,可以按照如下设置使用GAP =GAP创建 罚分(creation penalty)为 5· O ;GAP 延伸罚分(extension penalty)为 0. 3。本发明还包括使用表型筛选载体中克隆的HCV盒产生本发明的经翻译的多肽的 方法。一般来讲,产生重组形式的蛋白通常包括以下步骤。首先获得编码NS3蛋白酶结构域和任选的NS3解旋酶和/或NS4A结构域的核酸分 子。然后将核酸分子置于与合适的控制序列以及编码部分或全部NS多聚蛋白(例如NS4B、 NS5A)和报道分子的核酸可操作地连接,从而形成含有蛋白开放读码框的表达单元。 表达单 元用于转化(即转染)合适的宿主,在允许产生重组多肽的条件下培养经转化的宿主。产 生多肽以后,如果多肽的蛋白酶部分是功能性的,则报道分子从多肽上被切割下来并从细 胞中分泌。上述每个步骤均可以以不同的方式实现。例如,使用合适的复制子和控制序列 (如上所述)实现可在多种宿主中操作的表达载体的构建。控制序列、表达载体和转化方法 取决于用于表达基因的宿主细胞的类型,这在上文中已详细讨论或者是本领域技术人员已 知的。合适的限制性位点可以(如果正常情况下不存在的话)添加到编码序列的末端,从 而提供可切割的基因以插入这些载体中。技术人员能够容易地调整本领域已知的任何宿主 /表达系统以与本发明的核酸分子一起使用,从而产生想要的重组多肽。可以使用多种表达系统,包括酵母、细菌、动物、植物、真核和原核系统。在一些实 施方式中,哺乳动物细胞培养系统是优选的。载体用于本发明的表达单元通常包含以下由5’至3’方向可操作地连接的元件哺乳 动物细胞中可操作的转录启动子(例如CMV启动子)、来自患者的HCV盒(即编码NS3/4A 的核酸或编码NS3蛋白酶结构域的核酸)、编码至少一个其它NS结构域(例如NS3解旋酶 /4A/4B/5A(当使用包含NS3蛋白酶的盒时)或NS4B/5A(当使用包含NS3/4A的盒时),任 选地与编码5B (例如5B的前6个氨基酸)的DNA序列连接)的DNA序列、以及编码报道分 子(例如荧光素酶)的DNA序列。如上文所讨论,HCV盒与报道分子(与编码HCV NS多聚 蛋白部分的核酸融合或位于其内)的任何其它排列均可用于本发明的载体。合适的启动子 的选择由所选的宿主细胞确定,对于本领域技术人员是明显的,将在下文更具体地讨论。用于实现本发明的哺乳动物表达载体包括能够指导融合蛋白转录的启动子。优选 的启动子包括病毒启动子和细胞启动子。病毒启动子包括CMV启动子、来自腺病毒2的主 要晚期启动子(Kaufman and Sharp, Mol. Cell. Biol. 2 :1304_13199,1982)和 SV40 启动子 (Subramani等人,Mol. Cell. Biol. 1 :854_864,1981)。细胞启动子包括小鼠金属硫蛋白1启动子(Palmiter 等人,Science 222 :809_814,1983)和小鼠 Vk (参见美国专利 6,291,212) 启动子(Grant等人,Nuc. Acids Res. 15 :5496,1987)。特别优选的启动子是小鼠Vh (参见 美国专利6,291,212)启动子(Loh等人,同上)。转化例如,可以通过磷酸钙介导的转染(Wigler等人,Cell 14 =725,1978 ;Corsaro and Pearson,Somatic Cell Genetics 7 603,1981 ;Graham and Van derEb,Virology 52 456,1973)将本发明的表型筛选载体和HCV盒引入培养的哺乳动物细胞。还可以使用其它 用于将克隆的DNA序列引入哺乳动物细胞中的技术,例如电穿孔(Neumann等人,EMBO J. 1 841-845,1982)或脂质转染法。为了鉴别整合了克隆的DNA的细胞,可以将选择性标记与目标基因或cDNA—起 引入细胞中。用于培养的哺乳动物细胞的选择性标记包括赋予药物抗性的基因,例如新 霉素、潮霉素和甲氨蝶呤。选择性标记可以是可扩增的选择性标记。可扩增的选择性标记 包括DHFR基因(参见美国专利6,291,212)。选择性标记参见Thilly (Mammalian Cell Technology, ButterworthPub 1 ishers, Stoneham, Mass)的综述,选择性标记的选择是本领 域普通技术人员的常规技术。
宿主细胞本发明还包括经转化(即转染)的细胞,优选为哺乳动物细胞,以表达本发明的重 组多肽(即NS3/4A/4B/5A/报道分子)。除了经转化的宿主细胞本身以外,本发明还包括处 于营养培养基中的那些细胞的培养物,优选为单克隆(即均质克隆)培养物,或源自单克隆 培养物的培养物。如果报道分子肽被分泌,则培养基包含报道分子肽,含有细胞或不含细胞 (如果细胞被过滤或离心掉)。用于实施本发明的宿主细胞包括能够被外源DNA转化或转染并在培养物中生长的 真核细胞(在一些情况下为原核细胞),例如培养的哺乳动物、昆虫、真菌、植物和细菌细胞。含有本发明的DNA构建体的宿主细胞生长于合适的生长培养基。如本文所用的术 语“合适的生长培养基”是指含有细胞生长所需的营养物的培养基。细胞生长所需的营养 物可以包括碳源、氮源、必需氨基酸、维生素、矿物质和生长因子。通常,生长培养基将通过 例如药物选择或必需营养物的缺陷(由DNA构建体上的选择性标记或与DNA构建体共转染 的选择性标记所补充)来选择含有DNA构建体的细胞。培养的哺乳动物细胞通常生长于商售的含血清的或无血清的培养基。选择适合于 所用的特定细胞系的培养基是本领域普通技术人员的常规操作。使转染的哺乳动物细胞生 长一段时间(通常1-2天)以开始表达目标DNA序列。然后应用药物选择以选择稳定表达 选择性标记的细胞生长。对于以可扩增的选择性标记转染的细胞,可以逐步增加药物浓度 以选择拷贝数增加的克隆序列(从而增加了表达水平)。虽然本发明已经通过提及以上例子进行了详细描述,但是应该理解,可以不脱离 本发明的精神而做出各种改变。因此,本发明仅由以下权利要求限定。本申请中提到的所 有引证专利、专利申请和出版物均通过引用全文并入本文。
实施例以下实施例是为了解释本发明,而非以任何方式、形态或形式限制本发明,不论明示或暗示。虽然它们是通常可以使用的那些,但是也可以替代性地使用本领域技术人员已 知的其它程序、方法或技术。实施例1 :HCV NS3结构域简并引物的设计设计优选地能够退火至HCV基因型Ia和Ib两者的引物以扩增HCVNS3区域。为 了设计引物,收集发表的HCV基因型1(主要是Ia和lb)的序列并进行比对以鉴别具有高 度同源性的区域。计算同源区域内每个核酸的出现频率。可以分配一个截止频率百分数以 保持所设计的引物的简并性在可接受的范围内。设计简并引物时的另一个考虑因素是尝试 保持3’最末端的5个核酸无简并性。实施例2 扩增HCV NS3结构域从临床样品分离病毒RNA并使用第一轮和第二轮简并引物扩增HCVNS3结构域。扩 增的HCV区域显示于图7。图7显示了其中鉴别出了合理的同源性的区域。如图中所示, “U”代表上游引物,“D”代表下游引物,数字对应于同源区域的5’末端的Con-I位置。第 二轮引物,U3420和D4038,携带将盒克隆进入表型分型载体的限制性位点。U3420还具有 蛋白翻译的起始密码子和kozac序列。图8-11分别显示了基 因型1分离体中引物U3276、 D422UU3420和D4038中的氨基酸保守性。实施例3 =以临床样品讲行的HCV基因型测试从多个来源(包括医院、临床实验室和商业实体)获得临床分离体。患者NS3克隆的表型分型结果显示于图13。将显示于图12的三个扩增的临床样 品克隆进入表型分型载体并通过表型分型分析进行鉴定。图14显示了基因型la/b特异性非简并引物的序列。图15显示了使用基因型Ia/ b特异性非简并引物通过PCR扩增得到的产物。将PCR产物进行纯化并对群体进行测序。 测序结果显示它们是HCV Ia或Ib序列。实施例4 :HCV表型分型分析图3显示了以来自96孔Mini-Pr印的DNA进行的表型分型分析。图4显示了高通量自动化系统中96孔板上的信号差异。图5显示了使用同一个表型分型载体的一天之内和各天之间的EC5tl差异。图19显示了已经在体外HCV复制子抗性研究中鉴别的NS3变体的表型分型EC5(1。 每个变体的单个EC5tl值和不同变体的EC50等级排列与复制子瞬时转染数据有良好的相关 性。实施例5 自动化的HCV表型分型分析基于细胞的表型分型分析可调整为高通量系统(HTS)。例如,使用该分析,可以在 40个患者中在5个时间点筛选至少96个序列,即在10个月的时间内可以鉴定19,200个靶 标。图6显示了一个流程图,其描绘了基于细胞的报道分子分析的自动化程序的示例 性步骤。实施例1中描述的从96孔mini-pr印获得的DNA可用于本检验。可以将DNA转 染进入细胞,然后以NS3/4A蛋白酶活性抑制剂(例如系列稀释的ITMN-191)处理该细胞。 加入报道分子分泌的荧光素酶的底物并测定分泌的荧光素酶的活性。分泌的荧光素酶的活 性是蛋白酶活性的指征,蛋白酶活性进而又是HCV表型的指征。虽然已经通过提及上述优选实施方式描述了本发明,但是应该理解,可以不脱离本发明的精神而作出各种改变和修饰, 这对本领域技术人员是显而易见的。因此,本发明仅 由以下权利要求限定。
权利要求
第一轮上游引物的群体,其中每个引物包含编码Met/Lys-Glu/Gly-Thr/Ile-Lys-Ile/Val/Leu-Ile/Ala-Thr/Gln-Trp/Lys的核酸序列。
2.根据权利要求1所述的引物的群体,其中每个引物编码氨基酸序列并且其中所述的 氨基酸序列的群体具有以下的每种氨基酸的分布Met (99. 5 % )/Lys (0.5 % )-Glu (99. 5 % )/Gly(0. 5 % )-Thr (96. 5 % )/ Ile(3. 5 % )-Lys (100 % )-lie (69. 3 % )/Val(16. 1 % )/Leu(14. 6 % )-lie (99. 5 % )/ Ala(0. 5% ) -Thr (99. 5% ) /Gln (0. 5% ) -Trp (99. 5% ) /Lys (0. 5% )
3.根据权利要求1所述的引物的群体,其中每个引物包含核酸序列 ATGGAGACYAAGVTYATYACSTGGG,其中 Y 是 C 或 T,V 是 A 或 G 或 C,S 是 G 或 C。
4.根据权利要求1所述的引物的群体,其中每个引物包含核酸序列 ATGGAGACYAMAMGVTYAMTYAMCSTGGG,其中 Y 是 C 或 T,V 是 A 或 G 或 C,S 是 G 或 C,并且其中 AM是修饰的腺苷。
5.根据权利要求1所述的引物的群体,其中每个引物包含核酸序列AMTGMGMAGACYAMAM GVTYAMTYAMCMSTGGG,其中Y是C或T,V是A或G或C,S是G或C,并且其中AM是修饰的腺 苷,GM是修饰的鸟苷。
6.根据权利要求1所述的引物的群体,其中该群体包含至少1个引物。
7.第一轮下游引物的群体,其中每个引物的互补物包含编码Ser-Thr-Tyr-Gly/ Cys-Lys-Phe-Leu-Ala-Asp-Gly 的核酸序列。
8.根据权利要求7所述的引物的群体,其中每个引物的互补物编码氨基酸序列并且其 中所述的氨基酸序列的群体具有以下的每种氨基酸的分布Ser (100 % ) -Thr (100 % ) -Tyr ( 100% )-Gly (97. 0% )/Cys (3. 0%) -Lys (100%)-Phe (100%)-Leu(100%) -Ala(100% )-Asp ( 100% )-Gly(100% )。
9.根据权利要求7所述的引物的群体,其中每个引物包含核酸序列 CCGTCGGCAAGRAACTTGCCRTAGGTGGA,其中 R 是 A 或 G。
10.根据权利要求7所述的引物的群体,其中每个引物包含核酸序列CCGTCGGCAAGRAMA CTTMGCCRTMAGGTMGGA,其中R是A或G,并且其中AM是修饰的腺苷,TM是修饰的胸苷。
11.根据权利要求7所述的引物的群体,其中每个引物包含核酸序列CCGTMCGGCAAMGRA MACTMTMGCCRTMAMGGTMGGA,其中R是A或G,并且其中AM是修饰的腺苷,TM是修饰的胸苷。
12.根据权利要求7所述的引物的群体,其中群体包含至少1个引物。
13.第二轮上游引物的群体,其中每个引物包含编码Ala-Pro/ His-Ile-Thr-Ala-Tyr-Ser/Ala-Gln/Arg-Gln-Thr 的核酸序列。
14.根据权利要求13所述的引物的群体,其中每个引物编码氨基酸序列并且其中所述 的氨基酸序列的群体具有以下的每种氨基酸的分布Ala (100 % ) -Pro (99. 5%)/His(0. 5% )-lie (100% ) -Thr (100%) -Ala (100 % ) -Tyr (1 00% )-Ser (66% )/Ala(34% )-Gln(99% )/Arg(l% )-Gln(100% )-Thr (100% )。
15.根据权利要求13所述的引物的群体,其中每个引物包含核酸序列 GCGCCYATYACGGCCTAYKCCCARCARAC,其中 Y 是 C 或 T,K 是 G 或 T,R 是 A 或 G。
16.根据权利要求13所述的引物的群体,其中每个引物包含核酸序列GCGCCYAMTMYACG GCMCTMAMYKCCCMARCMAMRAC,其中Y是C或T,K是G或T,R是A或G,并且其中AM是修饰的腺苷,CM是修饰的胞苷,TM是修饰的胸苷。
17.根据权利要求13所述的引物的群体,其中每个引物包含核酸序列GCGCCYAMTMYAC GGCCTAMYKCCCARCAMRAC,其中Y是C或T,K是G或T,R是A或G,并且其中AM是修饰的腺 苷,TM是修饰的胸苷。
18.根据权利要求13所述的引物的群体,其中每个引物包含核酸序列AGGGCATTTAAATA GCCACCATGGCGCCYATYACGGCCTAYKCCCARCARAC,其中 Y 是或 1\1(是6或11,1 是4或6。
19.根据权利要求13所述的引物的群体,其中每个引物包含核酸序列AAAAAGGCGCGCCA CCATGGCGCCYATYACGGCCTAYKCCCARCARAC,其中 Y 是 C 或 T,K 是 G 或 T,R 是 A 或 G。
20.根据权利要求13所述的引物的群体,其中该群体包含至少1个引物。
21.第二轮下游引物的群体,其中每个引物的互补物包含编码Gly-Ser-Gly/ Arg-Lys-Ser/Thr-Thr/Asn-Lys/Arg-Val-Pro-Ala/Val-Ala/Asp 的核酸序列。
22.根据权利要求21所述的引物的群体,其中每个引物的互补物编码氨 基酸序列并且其中所述的氨基酸序列的群体具有以下的每种氨基酸的分布 GlydOO % )-Ser (100 % )-Gly (99. 5 % ) /Arg (0. 5 % )-Lys (100 % )-Ser (99. 5 % )/ Thr (0. 5%) -Thr (99 % ) /Asn (1%) -Lys (93 % ) /Arg (7 % ) -Val (100%) -Pro (100%) -Ala (9 9% )/Val(l% )-Ala(99% )/Asp(l% )。
23.根据权利要求21所述的引物的群体,其中每个引物包含核酸序列GCAGCCGGCACYTT RGTGCTYTTRCCGCTRCC,其中 Y 是 C 或 T,R 是 A 或 G。
24.根据权利要求21所述的引物的群体,其中每个引物包含核酸序列GCAGCCGGCAMCYT TMRGTMGCTMYTMTMRCMCGCTMRCC,其中Y是C或T,R是A或G,并且其中AM是修饰的腺苷,TM 是修饰的胸苷,CM是修饰的胞苷。
25.根据权利要求21所述的引物的群体,其中每个引物包含核酸序列GCAGCCGGCACYTT MRGTGCTMYTTMRCCGCTMRCC,其中Y是C或T,R是A或G,并且其中TM是修饰的胸苷。
26.根据权利要求21所述的引物的群体,其中每个引物包含核酸序列AAAAAGCGGCCGCA GCCGGCACYTTRGTGCTYTTRCCGCTRCC,其中 Y 是 C 或 T,R 是 A 或 G。
27.根据权利要求21所述的引物的群体,其中每个引物包含核酸序列CTTGGTTAATTAAT GCAGCCGGCACYTTRGTGCTYTTRCCGCTRCC,其中 Y 是 C 或 T,R 是 A 或 G。
28.根据权利要求21所述的引物的群体,其中该群体包含至少1个引物。
29.一种包含如权利要求1和权利要求7所述的引物的试剂盒。
30.一种包含如权利要求13和权利要求21所述的引物的试剂盒。
31.一种扩增来自HCV感染或怀疑被HCV感染的患者的样品的HCVNS3蛋白酶结构域的方法,包括使用如权利要求1和权利要求7或权利要求13和权利 要求21所述的引物或其组合从所述样品中扩增核酸样品。
32.一种确定HCV病毒基因型的方法,包括扩增HCV病毒蛋白酶结构域内的片段并基于 所述片段的基因型确定HCV病毒的基因型。
33.根据权利要求32所述的方法,其中通过使用如权利要求1和权利要求7或权利要 求13和权利要求21所述的引物或其组合来扩增所述片段。
34.一种确定药物抗性HCV病毒的存在的方法,包括扩增来自HCV样品的HCV蛋白酶结 构域内的片段,确定该片段内与药物抗性相关的突变的存在,其中所 述突变的存在是药物抗性HCV的存在的指征。
35.根据权利要求34所述的方法,其中使用如权利要求1和权利要求7或权利要求13 和权利要求21所述的引物或其组合进行扩增。
36.一种确定HCV病毒表型的方法,包括将HCV病毒的NS3蛋白酶结构域克隆进入筛选 载体,所述筛选载体包含编码HCV NS3解旋酶、4A、4B、5A和分泌性荧光素酶报道分子的多 核苷酸,其中编码NS3蛋白酶结构域的多核苷酸、NS3解旋酶、4A、4B、5A和分泌性荧光素酶 报道分子可操作地连接,从而分泌性荧光素酶报道分子的分泌指示功能性NS3蛋白酶结构 域的存在。
37.根据权利要求36所述的方法,其中多核苷酸编码HCVNS3解旋酶、4A、4B、5A、5B的 前6个氨基酸和分泌性荧光素酶报道分子。
38.一种筛选载体,其包含编码可操作地连接的HCV NS3解旋酶、4A、4B、5A和分泌性荧 光素酶报道分子的多核苷酸,从而分泌性荧光素酶报道分子的分泌指示筛选载体中插入了 功能性的NS3蛋白酶结构域。
39.根据权利要求38所述的筛选载体,其中多核苷酸编码HCVNS3解旋酶、4A、4B、5A、 5B的前6个氨基酸和分泌性荧光素酶报道分子。
40.包含上游引物和下游引物的引物组,其中所述上游引物包含选自 ATGGAGACCAAGATCATCACCTGGG 和 ATGGAGACCAAGCTCATCACGTGGG 的序列,所述下游引物包含 选自 CCGTCGGCAAGGAACTTGCCATAGGTGGA 和 ACCCGCCGTCGGCAAGGAACTTGCCGTA 的序列。
41.包含上游引物和下游引物的引物组,其中所述上游引物包含选自AGGGCATTTAAATA GCCACCATGGCGCCCATCACGGCCTACTCCCAACAGAC 和 AGGGCATTTAAATAGCCACCATGGCGCCCATCACGG CGTACGCCCAGCAGAC 的序列,所述下游引物包含选自 AAAAAGCGGCCGCAGCCGGCACCTTAGTGCTCT TGCCGCTGCC 和 AAAAAGCGGCCGCAGCCGGGACCTTGGTGCTCTTACCGCTGCC 的序列。
42.—种包含选自以下的序列的引物ATGGAGACCAAGATCATCACCTGGG, ATGGAGACCAAGCTCATCACGTGGG, CCGTCGGCAAGGAACTTGCCATAGGTGGA, ACCCGCCGTCGGCAAGGAACTTGCCGTA, AGGGCATTTAAATAGCCACCATGGCGCCCATCACGGCCTACTCCCAAC AGAC,AGGGCATTTAAATAGCCACCATGGCGCCCATCACGGCGTACGCCCAGCAGAC,AAAAAGCGGCCGCAGCCGG CACCTTAGTGCTCTTGCCGCTGCC 和 AAAAAGCGGCCGCAGCCGGGACCTTGGTGCTCTTACCGCTGCC。
全文摘要
本发明包括HCV基因型分型和表型分型的方法。在一个实施方式中,本发明的方法可用于确定HCV分离体是否对于抗病毒药物有抗性。本发明还包括用于扩增HCV NS3区域的引物和试剂盒。
文档编号C12Q1/70GK101842498SQ200880114609
公开日2010年9月22日 申请日期2008年10月30日 优先权日2007年10月30日
发明者S·塞维特, S·林, 洪劲, 秦晓丽 申请人:英特芒尼公司