细胞培养表型的差异表达谱分析及其用途的制作方法

文档序号:5831119阅读:617来源:国知局

专利名称::细胞培养表型的差异表达谱分析及其用途的制作方法
技术领域
:本发明涉及通过差异表达谦分析来鉴定参与赋予特定细胞表型的基因和蛋白质的方法,以及所述基因和蛋白质在优化细胞系培养条件和转基因表达中的用途。
背景技术
:当今生物学研究的基础在于最佳培养与维持细胞系的能力。细胞系不只提供了用于生物系统和疾病研究的体外模型,而且还被用于生产有机试剂。特别重要的是4吏用遗传工程化原核或真核细胞系来产生大量的重組蛋白质。重组蛋白质可以用在生物学研究中,或者作为治疗性化合物用于治疗特定的不适或疾病。生产重组蛋白质用于生物制药学应用一般需要大量的细胞和/或影响细胞生长和/或表达的特定细胞培养条件。在某些情况下,重組蛋白质生产得益于向细胞培养基中引入化学诱导剂(如丁酸钠或戊酸)。鉴定响应培养条件(或特定试剂)增加转基因表达的基因和有关的遗传通路可能阐明潜在的能被操纵用于增加重组蛋白质生产和/或影响细胞生长的把标。对于重组蛋白质生产的研究一直主要是致力于研究基因调控、细胞反应、细胞代谢及响应未折叠蛋白质而激活的通路。目前还没有可行的方法,能允许同时监测转基因表达和鉴定参与转基因表达的遗传通路。例如,目前可行的用于检测转基因表达的方法包括仅测定已知蛋白质的存在和量(如Western(蛋白质)印迹分析、酶联免疫吸附试验和荧光激活的细胞分选)、或是已知信使RNA(mRNA)转录物的存在和量(如Northern(RNA)印迹分析和反转录-聚合酶链式反应)的那些。这些及类似的方法不只局限于能够一次检测的已知蛋白质和/或mRNA转录物的数目,而且它们还需要研究人员在实验前知道或"猜测,,什么基因参与转基因表达(因此使用适当的抗体或寡核苷酸探针)。印迹分析和类似方法另一固有的局限是同样大小的蛋白质或mRNA不能被区分开来。考虑到在单个基因组内包含的大量的基因,即便使用上述方法鉴定参与遗传通路的少数基因也是昂贵而费时的事情。此外,要求研究人员对于涉及哪些基因有些想法,就不能够用于鉴定以前未发现的或未知的参与转基因表达调控的基因和有关通路。因此,在细胞系工程领域中需要更系统的方法来鉴定(直接或间接)参与特定细胞培养表型[如增加的和有效的转基因表达I的基因和蛋白质(包括以前未发现的基因和蛋白质)和有关遗传通路。发现这些基因和/或有关通路将提供能被操纵用来改善重组蛋白质产率和质量、影响细胞生长的新靼标。
发明内容本发明通过^f吏用核酸微阵列和蛋白质组学分析方法提供工业相关细胞系表型的差异表达i普分析而解决了这些问题。特别是,本发明提供了通过表达镨分析而系统地鉴定最大化蛋白质表达和分泌的基因和蛋白质及有关通路的方法。本发明还提供了用于操纵鉴定的基因和蛋白质来工程化改进细万包系的方法。7因此,一方面,本发明提供了用于鉴定调控或指示细胞系的细胞培养表型的蛋白质的方法。所述方法包括生成得自测试细胞系的样品的蛋白质表达谱;将所述蛋白质表达谱与得自对照细胞系的对照谦比较;和基于比较[其中测试细胞系具有和对照细胞系不同的细胞培养表型l鉴定一个或多个差异表达的蛋白质,且所述一个或多个差异表达的蛋白质能够调控或指示细胞培养表型。在优选的实施方案中,细胞系是中国仓鼠卵巢(CHO)细胞系。在另一实施方案中,通过荧光二维差异凝胶电泳生成蛋白质表达i昝。在一些实施方案中,细胞培养表型是细胞生长速率、细胞生产力(例如最大细胞生产力或持续高细胞生产力)、峰值细胞密度、持续细胞活力、氨生产或消耗速率、或乳酸生产或消耗速率。在一个实施方案中,细胞培养表型是最大细胞生产力。在另一实施方案中,细胞培养表型是持续细胞活力。而在另一实施方案中,细胞培养表型是峰值细胞密度。又在另一实施方案中,细胞培养表型是细胞生长速率。本发明提供了通过调节即上调或下调依照上述方法鉴定的一个或多个蛋白质改进细胞系的方法。在此所用的"上调"包括提供编码目的蛋白质或保留其活性的变体(例如,其哺乳动物同源物,例如灵长动物或啮齿动物同源物)的外源核酸(例如过表达构建体),或提供间接增强蛋白质或基因活性或表达水平的因子或分子。在此使用的"下调"包括敲除编码目的蛋白质的基因、提供RNA干扰构建体、或提供间接抑制蛋白质或基因活性或表达水平的抑制剂或其他因子。在一个特定的实施方案中,本发明提供了通过RNA千扰下调依据上述方法鉴定的一个或多个蛋白质来改进细胞系的方法。特别地,本发明提供了改进细胞系的细胞生产力的方法,包括调节即上调或下调依据上述方法鉴定的一个或多个蛋白质。在一个实施方案中,本发明提供了改进细胞系的细胞生产力的方法,包括调节即上调或下调选自表2、3、9、10、11和12的一个或多个基因或蛋白质。在一个实施方案中,本发明提供了改进细胞系的细胞生长速率的方法,包括调节即上调或下调依据上述方法鉴定的一个或多个蛋白质。特别地,本发明提供了改进细胞系的细胞生长速率的方法,包括调节即上调或下调选自表4、5、6、13、14、27和28的一个或多个基因和蛋白质。在另一实施方案中,本发明提供了用于增加细胞系的峰值细胞密度的方法,包括依据上述方法调节(即上调或下调)一个或多个鉴定的蛋白质。特别地,本发明提供了用于增加细胞系的峰值细胞密度的方法,包括调节(即上调或下调)一个或多个选自表8、15、16和17的基因或蛋白质。在另一实施方案中,本发明提供了增加细胞系的持续细胞活力的方法,包括调节即上调或下调依据上述方法鉴定的一个或多个蛋白质。特别地,本发明提供了增加细胞系的持续细胞活力的方法,包括调节即上调或下调选自表7、18和19的一个或多个基因或蛋白质。在另一实施方案中,本发明提供了调控细胞系的乳酸生产或消耗的方法,包括调节即上调或下调依据上述方法鉴定的一个或多个蛋白质。特别地,本发明提供了调控细胞系的乳酸生产或消耗的方法,包括调节即上调或下调选自表7、18和19的一个或多个基因或蛋白质。而在另一实施方案中,本发明提供了通过调节即上调或下调依据上述方法鉴定的一个或多个基因或蛋白质来改进细胞系的方法。特别地,本发明提供了通过调节即上调或下调选自表20、24、25和26的一个或多个基因或蛋白质来改进细胞系的方法。另一方面,本发明提供了通过调节即上调或下调至少两种基因或蛋白质来改进细胞系的方法,其中第一基因或蛋白质影响第一细胞培养表型,而第二基因或蛋白质影响不同的第二细胞培养表型,其中细胞培养表型选自细胞生长速率、细胞生产力、峰值细胞密度、持续细胞活力、氨生产或消耗速率、或乳酸生产或消耗速率。在一个实施方案中,所述方法还包括上调或下调影响不同于第一和笫二细胞培养表型的第三细胞培养表型的第三种基因或蛋白质。又另一个方面,本发明提供了评估细胞系的细胞培养表型的方法。所述方法包括检测细胞培养物样品中依照上述任一方法鉴定的蛋白质的表达9水平,并将所述表达水平与参照水平相比较,其中比较指示细胞培养表型。可选的,本发明提供了评估细胞系的细胞培养表型的方法。所述方法包括检测细胞培养物样品中指示细胞培养表型的一个或多个标记,其中所述标记从由选自图7-138的肽、或选自表1-20和表24-30的基因或蛋白质组成的组中选择。另一方面,本发明提供了具有改进的细胞培养表型的工程细胞系,其包含工程细胞群,各工程细胞包含上调或下调依照上述不同方法所鉴定的一个或多个蛋白质的工程构建体。特别地,本发明提供了具有改进的细胞生产力的工程细胞系,其包含工程细胞群,各工程细胞包含上调或下调选自表2、3和9-12的一个或多个基因或蛋白质的工程构建体。在一些实施方案中,工程构建体是过表达构建体。在其他实施方案中,工程构建体是干扰RNA构建体。在其他实施方案中,本发明提供了具有改进的细胞生长速率的工程细胞系,其包括工程细胞群,各工程细胞包括上调或下调选自表4、5、6、13、14、27和28的一个或多个基因或蛋白质的工程构建体。在一些实施方案中,工程构建体是过表达构建体。在其他实施方案中,工程构建体是干扰RNA构建体。在其他实施方案中,本发明提供了具有改进的峰值细胞密度的工程细胞系,其包含工程细胞群,各工程细胞包括上调或下调选自表8、15、16和17的一个或多个基因或蛋白质的工程构建体。在一些实施方案中,工程构建体是过表达构建体。在其他实施方案中,工程构建体是干扰RNA构建体。在其他实施方案中,本发明提供了具有改进的持续细胞活力的工程细胞系,其包含工程细胞群,各工程细胞包含上调或下调选自表18和26的一个或多个基因或蛋白质的工程构建体。在一些实施方案中,工程构建体是过表达构建体。在其他实施方案中,工程构建体是干扰RNA构建体。在其他实施方案中,本发明提供了具有调控的乳酸生产或消耗的工程细胞系,其包含工程细胞群,各工程细胞包含上调或下调选自表29和3010的一个或多个基因或蛋白质的工程构建体。在一些实施方案中,工程构建体是过表达构建体。在其他实施方案中,工程构建体是干扰RNA构建体。在一些实施方案中,本发明提供了改进的工程细胞系,其包含工程细胞群,各工程细胞包含上调或下调选自表20、24、25和26的一个或多个基因或蛋白质的工程构建体。在一些实施方案中,工程构建体是过表达构建体。在其他实施方案中,工程构建体是千扰RNA构建体。而在另一方面,本发明提供了使用如上所述工程细胞系表达目的蛋白质的方法。所述方法包括向根据上述任一实施方案的工程细胞系中引入编码目的蛋白质的核酸和收获目的蛋白质的步骤。又在另一方面,本发明还提供了分离的基因或蛋白质、或是以前未发现基因或蛋白质的、和/或参与调控或指示目的细胞培养表型的多核苷酸或多肽。特别地,本发明提供了分离的或重组的核酸,其包含选自表9、13和15的序列、其互补物、其亚序列。本发明还提供了分离的或重组的蛋白质,其包含选自表2和3的序列或其片段。本发明还提供了包含本发明核酸分子或蛋白质的遗传工程表达载体、宿主细胞和转基因动物。此外本发明提供了本发明的核酸分子或本发明蛋白质编码核酸的抑制性多核苷酸,如反义和RNA干扰(RNAi)分子。本发明的其他特征、目的和优势在下面的发明详述中显而易见。但是应当理解,虽然发明详述指出了本发明的实施方案,但其仅作为举例说明给出,而不作为限制。基于发明详述,在本发明范围内的多种改变和修改对于本领域技术人员而言是显而易见的。附图的简短说明图l是鉴定本发明基因和蛋白质的例示性方法的流程图。图2图解了CHO细胞系和细胞表型的例示性矩阵。图3描述了测试细胞系和对照细胞系之间关于"高细胞生长速率"表型的例示性性表型比较。图4图解了蛋白质表达谱分析方法。图5及图6描述了例示性凝胶上的Cy3和Cy5染色模式,并给出了所选择蛋白质的相对丰度的图示。图5显示了在cy5标记的测试细胞提取物中显示有5倍上调的蛋白质。图6显示了在cy5标记的测试细胞提取物中显示有4倍下调的蛋白质。图7-138图解了差异表达的个体蛋白质的序列数据和分析。图139和140图示了无监督的皮尔森(Pearson)聚类分析。图141描述了用成对差异进行数据分析的例示性方法。图142描述了不依赖于成对差异进行数据分析的例示性方法。图143-146描述了所鉴定的基因在3C7细胞系中的例示性评估。图147和148图解了评估过表达所鉴定的基因对于细胞生长和生产力的影响的24孔形式。图149-151图解了过表达所鉴定的基因对于细胞生长和生产力的例示性结果。发明详述本发明提供了鉴定影响目的细胞培养表型的基因和蛋白质的系统方法。本发明的方法基于工业相关细胞培养表型的差异表达谱分析,整合使用DNA^f效阵列和蛋白质组学分析。特别地,所述方法包括生成测试细胞系样品的基因或蛋白质表达i普;将基因或蛋白质表达语与细胞培养表型不同于测试细胞系的对照细胞系的对照镨相比较;基于所述比较来鉴定一个或多个差异表达的基因或蛋白质。此处使用的测试细胞系和对照细胞系可以是具不同遗传背景的不同细胞系,或是在不同细胞培养条件下生长的相同细胞系。一个或多个差异表达的基因或蛋白质是调控或指示目的细胞培养表型的候选基因或蛋白质。所鉴定的基因或蛋白质可以经进一步确认和证实。还可以操纵所鉴定的基因或蛋白质以改进目的细胞培养表型。因此,本发明为细胞工程领域理性设计改进细胞系和细胞培养条件方面的重大进展。本发明的种种方面在下面的分节中有进一步的详述。分节的使用无意限制本发明。各分节可以应用到本发明的任何方面。在本申请中,除非另有声明,"或"表示"和/或"。勿^屑型本发明设想对不同生物、包括但不限于细菌、植物、真菌和动物(后者包括但不限于昆虫和哺乳动物)的细胞系进行差异表达镨分析和优化。例如,本发明可以应用于大肠杆菌OE^^WcW"co/0、草地夜蛾(S/wfe/7tem,Mg^7^Y/")、烟草属物种(A^'cW""fl5/;.)、玉蜀黍(Zefl附fl")、浮萍属物种(丄簡""夢)、酵母属物种(5"flc由ra附戸"/;.)、毕赤酵母属物种(户/c/^Vi5p.)、裂殖酵母属物种(5^/^zM"cc/i"/w^cesw.)、哺乳动物细胞、包括但不限于COS细胞、CHO细胞、293细胞、A431细胞、3T3细胞、CV-1细胞、HeLa细胞、L细胞、BHK21细胞、HL-60细胞、U937细胞、HEK细胞、PerC6细胞、Jurkat细胞、正常二倍体细胞、来自原代组织(primarytissue)体外培养和原代移植物(primaryexplant)的细胞林。所述生物和细胞系名录仅意在提供非限制性的例子。特别地,本发明考虑对工业相关细胞系例如CHO细胞进行差异表达谱分析。CHO细胞是用于治疗性蛋白质生产例如单克隆抗体生产、受体生产及Fc融合蛋白生产的主要宿主,因为CHO细胞确保折叠、加工和糖基化的保真度。CHO细胞也适合于深层、无血清培养并具有很好的安全记录。本发明使人们能够理解影响期望细胞培养表型或特性[例如允许高生产力的分批补料过程的细胞表型的通路、基因和蛋白质。这样的期望细胞表型包括但不限于高细胞生长速率、高峰值细胞密度、持续的高细胞活力、高最大细胞生产力、持续高细胞生产力、低氨产量和低乳酸产量。期望的表型或特性可以是具有特定基因组背景的已建细胞系的固有特性。还可以通过在不同条件如温度、细胞密度、使用试剂如丁酸钠的情况下培养细胞,使其处于不同动力学生长期(例如停滞期、对数生长期、稳定期或死亡期)和/或使其变为血清非依赖性等来赋予细胞期望的表型或特性。在诱导这些13表型的期间和/或在获得这些表型之后,可以从细胞制备靼核酸或蛋白质样品库并用寡核苷酸阵列分析,以确定和鉴定哪些基因响应于特定刺激物(如温度、丁酸钠)显示出改变的表达,并因此有可能参与赋予期望的表型或特性。游/s裙鑀岸为了进行基因表达镨分析,从来自细胞系的样品中制备靶核酸库。任何生物样品可以用做靶核酸的来源。靼核酸库可以是总RNA,或由之衍生的任何核酸,包括通过反转录mRNA制备的每条cDNA单链、或是自双链cDNA中间体转录的RNA。分离靼核酸以通过寡核苷酸阵列或其他探针进行分析的方法,例如酚-氯仿抽提、乙醇沉淀、磁珠分离或硅胶亲和纯化,为本领域技术人员所熟知。举例来说,不同的方法可用于分离或富集RNA。这些方法包括但不限于RNeasy试剂盒(由凯杰公司(Qiagen)提供)、MasterPure试剂盒(由EpicentreTechnologies公司提供)、charge-switch才支术(见例^口美国公布专利申请号2003/0054395和2003/0130499)及TRIZOL(由GibcoBRL公司提供)。由昂飞公司(Affymetrix)提供的RNA分离方法也可用于本发明,见例如《基因芯片表达分析技术指南》(GeneChipEXPRESSIONANALYSISTECHNICALMANUAL)(701021rev.3,昂飞公司(Affymetrix,Inc.),2002)。优选耙核酸库(即由之衍生的mRNA或核酸)应反映基因编码区的转录。在一个例子中,通过除去rRNA富集mRNA。可用不同的方法来消除或降低样品中的rRNA量。例如,可通过酶消化去除rRNA。依照后面的方法,rRNA首先使用反转录酶和特异引物扩增来产生cDNA。使rRNA与cDNA退火。然后用RNA酶H处理样品,其能特异消化RNA:DNA杂合体中的RNA。可以扩增把核酸,之后与寡核香酸阵列或其他探针孵育。合适的扩增方法包括但不限于反转录-聚合酶链式反应、连接酶链式反应、自主序列复制和体外转录,为本领域所熟知。要注意的是应选择寡核苷酸探针与靼核酸互补。因此,如果提供反义革巴核酸库(当通过体外转录扩增革巴核酸时通常如此),寡核苷酸探针应对应于有义互补链的亚序列。反之,如果乾核酸库是有义的,寡核苷酸阵列应与之互补(即反义)。最后,如果耙核酸是双链,寡核苷酸探针可以是有义或反义。本发明包括检测耙核酸和互补寡核苷酸探针之间的杂交强度。为实现之,粑核酸可以直接或间接与合适可检测标记相连。直接标记是直接附着于或掺入靶核酸的可检测标记。间接标记是在杂交后附着于多核苦酸,通常通过附着于在杂交前已附着于靼核酸的结合部分实现。此类直接和间接标记为本领域所熟知。在本发明的优选实施方案中,靶核酸使用生物素-链霉亲和素-PE偶联系统来检测,其中生物素掺入靶核酸,并通过链霉亲和素-PE与生物素的结合来检测杂交。耙核酸可以在与寡核苷酸阵列孵育之前、期间或之后标记。优选在孵育前标记耙核酸。可以通过在反应中使用已经标记的核苷酸(如生物素偶联的dUTP或dCTP)在扩增步骤掺入标记。可选的是,标记可以直接加入到原始核酸样品(例如mRNA、cDNA)中,或在扩增完成后加入到扩增产物中。将标记附着至核酸的方法对于本领域技术人员是熟知的,包括但不限于缺口翻译、末端标记以及将耙核酸连至核酸接头,借助接头将其与标记连在一起。可选地,专门设计用于分离和制备靶核酸进行微阵列分析的几种试剂盒是可商购的,包括但不限于GeneChipIVT标记试剂盒(加州圣克拉拉市昂飞公司(Affymetrix,SantaClara,Calif.))和BioarrayTMHighYieldTMRNA转录标记试剂盒,配有荧光素-UTP用于核酸P车列(纽约州法明岱尔市因助生命科学公司(EnzoLifeSciences,Inc.,Farmingdale,N.Y.))。在用可检测基团标记之前多核苷酸可以被片段化。用于片段化的例示性方法包括但不限于热或离子介导的水解。15适用于本发明的探针包括寡核苷酸阵列或能够检测细胞(或细胞系)、包括已知的细胞或来自未测序生物的细胞中多种基因(包括以前未发现的基因)的表达、鉴定可能参与诱导特定细胞表型(如增加的及有效的转基因表达)的基因(包括以前未发现基因)和有关通路的其他探针。本发明使用的寡核苷酸探针可以是核苷酸多聚体或类似物和其修饰形式,从而与乾核酸库的杂交以序列特异性的方式在寡核苷酸阵列杂交条件下发生。在此使用的术语"寡核苷酸阵列杂交条件"意指通常用于寡核苷酸阵列杂交的温度和离子条件。在许多实例中,这些条件包括于45。C杂交16小时,接着在室温洗涤至少三次,每次10分钟。杂交緩沖液包含100mMMES、lM[Na+、20mMEDTA和0.01%Tween20。杂交緩冲液的pH范围可以是6.5到6.7。洗涤緩沖液是6xSSPET,其中包含0.9MNaCl、60mMNaH2P04、6mMEDTA和0.005%TritonX-IOO。在更严谨的寡核苷酸阵列杂交条件下,洗涤緩冲液可以含IOOmMMES、0.1M[Na+]和0.01%Tween20。参见《基因芯片表达分析技术指南》(GENECHIPEXPRESSIONANALYSISTECHNICALMANUAL)(701021rev.3,昂飞公司(Affymetrix,Inc.)2002),在此以其整体引入作为参考。正如本领域技术人员所知,寡核苷酸探针可以是任何长度。优选适用于本发明的寡核苷酸长度为20到70个核苷酸。最优选地,合适的寡核苷酸探针长度为25个核苷酸。在一个实施方案中,本发明的核酸探针具有相对高的序列复杂度。在许多实例中,探针不含长段的相同核苷酸。此外,可以设计探针,从而其3,端没有高比例的G或C残基。在另一实施方案中,探针没有3,末端T残基。取决于欲实施的测定或检测的类型,探针序列中可以纳入或者排除预测会形成发夹或链内结构如"引物二聚体"的序列。在许多实施方案中,本发明所采用的^#针不含任何的不明确碱基。制备寡核苷酸探针,使之特异于模板序列(例如与之互补,即能够与之杂交)。模板序列的任何部分能够用来制备探针。每个模板序列可以制备多重揮:4十,如5、10、15、20、25、30个或更多。这些多重探针可能互相重叠,可能不重叠。不同探针间的重叠在某些测定中可能是期望的。在许多实施方案中,模板序列的探针和其他模板序列或其互补物序列同一性低。例如,模板序列的每个探针和其他模板序列或其互补物的序列同一性可以不超过70%、60%、50%或更低。这降低了不期望的交叉杂交风险。可以4吏用本领域已知的方法确定序列同一性。这些方法包括但不限于BLASTN、FASTA和FASTDB。也可使用遗传计算组(GeneticsComputerGroup,GCG)程序,它是包括BLASTN和FASTA的批程序。模板序列的优选序列包括但不限于共有序列、转基因序列和对照序列(即用于控制或标准化实验、样品、严谨度需求及乾核酸制品间差异的序列)。此外,任何共有序列、转基因和对照序列的亚序列君可以用做模板序列。在一个实施方案中,仅利用共有序列、转基因和对照序列的某些区域(即叠片区域(tilingregion))作为本发明所用寡核苷酸探针的模板序列。本领域技术人员将会意识到可用于实施本发明的方法(如体外转录方法)通常导致偏向于乾核酸3,端。因此,在本发明一个实施方案中,共有序列或转基因序列中最接近于共有序列3'端的区域最常用作寡核苷酸探针的模板。一般而言,如果能够鉴定出多聚腺苷酸(poly-A)信号,紧靠共有序列或转基因序列末端之前的1400个核苷酸被指定为叠片区域。可选地,如果不能鉴定出poly-A信号,仅共有序列或转基因序列最后的600个核苷酸被指定为叠片区域。然而,应注意的是本发明不限于只使用这些共有序列、转基因和对照序列内的叠片区域作为寡核苷酸探针的模板。事实上,叠片区域可能出现在共有序列、转基因或对照序列内的任何处。例如,对照序列的叠片区域可能包含来自对照序列的5,和3,端的区域。实际上,完整共有序列、转基因或对照序列可以被用作寡核苷酸探针的模板。适用于本发明的寡核苷酸阵列可以包括和如上所述鉴定的多种共有序列(即多序列簇的共有序列及例示性序列的共有序列)精确配对的探针。适用于本发明的寡核苷酸阵列还可以包括与共有和转基因序列都精确配对的探针。对于本领域技术人员显而易见的是,当细胞系经遗传改造以表达由转基因序列编码的重组蛋白质、分析目的是证实转基因表达及确定此表达水平时,在转基因序列中纳入寡核苷酸探针是有用的。在那些转基因以双顺反子mRNA连接至下游ORF如二氩叶酸还原酶(DHFR)的情况下,转基因表达水平也可以根据下游序列的表达水平来确定。在本发明另一实施方案中,寡核苷酸阵列还包含标准化实验、样品、严谨度需求和靶核酸制品间固有差异的对照探针。这些类型对照揮:针中每一类的例示性组成参见美国专利号6,040,138和美国公开号20060010513中,两者的教导在此以其整体引入作为参考。本领域技术人员熟知的是,从同一样品独立加工的两个革S核酸库能够与两个单独但相同的寡核苷酸阵列杂交而有不同的结果。这些阵列间的不同结果归因于几个因素,如标记靼核酸库的强度和孵育条件。为了控制这些差异,可以在阵列中标准化添加对照探针。标准化对照探针是与掺和在粑核酸库中的已知核酸序列精确互补的寡核苷酸。任何寡核苷酸序列可以用作标准化对照探针。例如,标准化对照探针可以从得自不同于待分析细胞系来源生物的冲莫板创建。在一个实施方案中,针对哺乳动物序列的寡核苷酸阵列包含针对下列基因的标准化寡核苷酸探针来自生物大肠杆菌的Wo"、WoC和6"D、来自生物噬菌体PI的cm、以及来自生物枯草芽孢杆菌(5"7/附s"M7Zs)的J"/;,或他们的亚序列。从标准化对照探针获得的信号强度接着用于标准化来自阵列中所有其他探针的信号强度。此外,当已知核酸序列对于每一转录物而言以已知的不同浓度掺和在靶核酸库中时,可以生成将信号强度与转录物浓度相关联的标准曲线,并且可以定量阵列上呈现的所有转录物的表达水平(见例如Hill等(2001)GenomeBiol.2(12):research0055.1-0055.13)。因为细胞间天然不同的代谢状态,具体靶核酸的表达随着样品的不同而存有差异。此外,某个库中的輩巴核酸与另一个库相比可能更倾向于降解。因此,在本发明另一实施方案中,寡核苷酸阵列还包含与反映细胞代谢状态的组成型表达基因或其亚序列精确互补的寡核苷酸探针。这些类型的基因的非限制性例子是P-肌动蛋白、转铁蛋白受体和甘油醛-3-磷酸脱氢酶(GAPDH)。18在本发明的一个实施方案中,靶核酸库通过使用在美国公开号20060010513中所述的方法将分离自样品的总RNA转换成双链cDNA、并将产生的cDNA转录成互补RNA(cRNA)来获得,所述方法的教导在此以其整体引入作为参考。RNA转换方法始于RNA转录物的3,端,并且如果所述过程无法进行完全(例如,如果RNA是缺口的,等),则3,端信息的量相对于5,端信息将更大,导致3'偏向。此外,RNA降解可能始于5,端(JacobsAnderson等(1998)EMBOJ.17:1497-506)。这些方法的使用暗示着寡核苷酸阵列中优选应纳入衡量操作质量和样品降解量的对照探针。此类对照探针的例子有与组成型表达基因如上述p-肌动蛋白、转铁蛋白受体和GAPDH的3,和5,端精确互补的寡核苷酸。从而所产生的组成型表达基因的3,对5,表达比率指示了操作的质量和样品的降解量,即大于3的3,对5,比率指示着不完全的操作或是高RNA降解(Auer等(2003)Nat-Genet.35:292-93)。因此,在本发明的优选实施方案中,寡核苷酸阵列包括与组成型表达基因3,和5'端互补的对照探针。乾核酸库的质量不只反映于操作和靼核酸的降解,而且反映在草巴核酸的来源。污染的序列如基因组DNA可能干扰熟知的定量方法。因此,在本发明的优选实施方案中,阵列还包含精确互补于细菌基因、核糖体RNA和/或基因组基因间区域的寡核苷酸探针,以提供控制样品制备物质量的手段。这些探针控制靶核酸库被细菌DNA、非mRNA物质和基因组DNA污染的可能性。在美国公开号20060010513中公布了这类例示性对照序列,其教导在此以其整体引入作为参考。在本发明的优选实施方案中,寡核苷酸阵列还包含对于各完美匹配探针而言的对照错配寡核苷酸探针。错配探针控制杂交特异性。优选地,错配对照探针除了一个或多个取代的碱基之外,与其相应的完美匹配探针完全相同。更优选的是,取代发生在探针的中心位置。例如,当完美匹配探针长度是25个核苷酸时,相应的错配探针将具有相同的长度和序列,除了发生在13位处的单碱基取代(例如将腺噤呤取代为胸腺嘧啶、胸腺嘧咬取代为腺嘌呤、鸟嘌呤取代为胞嘧啶或胞嘧咬取代为鸟嘌呤)。错配寡核苷酸探针中一个或多个错配碱基的存在不允许在适当条件下与互补的完美匹配探针结合的靶核酸与相应的错配对照探针结合。因此,错配的寡核苷酸探针指示孵育条件是否为最佳,即所用的严谨度是否确保乾核酸只与阵列中存在的精确互补探针结合。对每一模板来说,可以使用多种策略选择一套精确互补于共有、转基因和/或对照序列的亚序列(或其叠片区域)的完美匹配探针。本领域:汰术人员知道每个模板可以提供大量的潜在探针。正如公知的那样,表观(apparent)探针有时不适于包括到阵列中。这可能因为在基因组其他区域存在相似的亚序列,导致针对这些亚序列的探针交叉杂交,给出假信号。某些表观#^十可能不适于包括在阵列内的另一个原因在于它们可能形成阻碍有效杂交的二级结构。最后,靶核酸与(或对)包含大量探针的阵列的杂交要求每个探针在相同孵育条件下与其特异性靶核酸序列杂交。寡核苷酸阵列可能包含针对共有、转基因或对照序列的一个完美匹配探针,或可能包含针对共有、转基因或对照序列的探针集合(即多于一个完美匹配探针)。例如,寡核苷酸阵列可能包含针对共有、转基因或对照序列的l、5、10、25、50、100或多于100个不同的完美匹配探针。在本发明的优选实施方案中,阵列包含至少11-150个精确互补于每个共有和转基因序列的亚序列的不同完美匹配寡核苷酸。在甚至更优选实施方案中,只纳入每个模板的最佳探针集合。可以使用多种计算机程序评价杂交用探针的适合度。为此目的的合适的程序包括^旦不限于LaserGene(DNAStar)、Oligo(国家生物科学公司,NationalBiosciences,Inc.)、MacVector(Kodak/IBI)和由GCG提供的标准程序。本领域已知的任何方法或软件程序可用于制备本发明模板序列的探针。例如,通过使用由加州森尼韦尔市(Simnyvale,Calif.)TdeChem国际公司提供的软件包ArrayDesigner可以生成寡核苷酸纟笨针。用于选择最佳探针集合的另一例示性运算法参见美国专利号6,040,138,其教导在此引入作为参考。最佳化探针集合的其他合适的手段将产生相当的寡核苷酸阵列,为本领域熟知,并且可以在例如Lockhart等(1996)Nat.Biotechnol.14:1675-80和Mei等(2003)Proc.Natl.Acad.Sci.USA100:11237-42中找到。可以用多种方法合成本发明的寡核苷酸纟笨针。这些方法的例子包括但不限于使用自动化或高通量DNA合成仪,例如由密理博公司(Millipore)、基因仪器公司(GeneMachines)和生物自动化公司(BioAutomation)提供的那些。在许多实施方案中,合成的探针基本上不含杂质。在其他许多实施方案中,探针基本上不含可能会妨碍期望探针功能的其他污染物。可以用许多方法纯化或浓缩探针,例如反相层析、乙醇沉淀、凝胶过滤、电泳或其任意组合。在美国公开号20060010513中公开了更为详细的制备适用于本发明的寡核苷酸阵列的信息和例示性阵列,其公开内容在此引入作为参考。如美国^Hf号20060010513中所述,适于本发明的CHO芯片^f效阵列包括122个阵列质量控制序列(非CHO)、732个公开的仓鼠序列、2835个文库来源的CHO序列和22个产物/过程特异性序列。其他合适的阵列描述于美国专利号6,040,138,其公开内容引入作为参考。乾核^与萍W^^以承成染爻潘孵育反应可以以绝对或差异杂交形式进行。在绝对的杂交形式中,来自一个样品的多核苷酸与寡核苷酸阵列中的探针杂交。在形成杂交复合物之后检测到的信号与样品中的多核苷酸水平相关。在差异杂交形式中,来自两个样品的多核苷酸用不同的标记部分标记。将这些差异标记的多核苷酸的混合物加入到寡核苷酸阵列中。然后在两个不同标记的发射可独立检测的条件下检查寡核苷酸阵列。在一个实施方案中,使用Cy3和Cy5(新泽西州皮斯卡^荅韦市安发玛西亚生物技术>^司(AmershamPharmaciaBiotech,Piscataway,N.J.))作为差异杂交形式的标记基团。在本发明中,孵育条件应是便于靶核酸只与具有高度互补性的寡核苷酸探针杂交。在优选的实施方案中,这是通过使靶核酸库和寡核苷酸阵列在保证杂交的低严谨性条件下孵育、然后以持续升高的严谨度进行洗涤直至达到期望杂交特异性水平而实现。在其他实施方案中,靶核酸在严谨的或熟知的寡核苷酸阵列杂交条件下与本发明的阵列孵育。在许多实例中,这些寡核苷酸阵列杂交条件包括45。C孵育16小时,然后在室温洗涤至少三次,每次10分钟。杂交緩沖液包含100mMMES、lM[Na+、20mMEDTA和0.01。/。Tween20。杂交緩冲液的pH范围可以是6.5到6.7。洗涤緩冲液是6xSSPET,其包含0.9MNaCl、60mMNaH2P04、6mMEDTA和0.005%TritonX-IOO。在更严谨的寡核苷酸阵列杂交条件下,洗涤緩冲液可以包含100mMMES、0.1M[Na+和0.01%Tween20。参见《基因芯片表达分析技术指南》(GENECHIPEXPRESSIONANALYSISTECHNICALMANUAL)(701021rev.3,昂飞公司(Affymetrix,Inc.)2002),在此以其整体引入作为参考。^并差西《这浮为^f用来检测靶核酸与寡核苷酸探针杂交镨的方法在本领域广为人知。特别是,检测和记录各独立耙核酸-寡核苷酸探针杂合体荧光的手段已经充分建立,并且在本领域广为人知,描述于例如美国专利号5,631,734、美国公开号20060010513,在此以其整体引入作为参考。例如,可以通过计算才几控制共聚焦显微镜来自动检测整个阵列的杂交语。此外,作为另一非限制性例子,显微镜可以配备光传感器,连接于数据获取系统,来自动记录各独立杂合体产生的荧光信号。本领域技术人员将会理解,杂交谦的评估依赖于阵列的组成,即纳入了哪些寡核苷酸纟笨针进行分析。例如,当阵列只包括共有序列的寡核普酸探针、或只包括共有序列和转基因序列的寡核苷酸探针时(即阵列不包括用于标准化实验、样品、严谨度需求和靶核酸制品间差异的对照探针),通过测量阵列上每个位置的绝对信号强度来评估杂交镨。可选地,阵列的平均值、截尾平均值(即去除2-5%具有最低和最高信号强度的探针集合之后的所有探针的平均信号强度)或中值信号强度可以对预设的目标值按比例计算来生成比例因子,随后可以应用到阵列上每个探针集合来生成每个基因的标准化表达值(见例如昂飞公司(Affymetrix)(2000)ExpressionAnalysisTechnicalManual,A5-14页)。反之,在阵列还包含对照寡核苷酸探针的情况下,通过对对照寡核苷酸探针所占据的每个位置的绝对信号强度进行数学转换,来标准化测试寡核苷酸探针所占据的每个位置的绝对信号强度,来评估所产生的杂交镨。一般的标准化策略为本领域所熟知,并且包括在例如美国专利号6,040,138与Hill等(2001)GenomeBiol,2(12):research0055.1-0055.13中。从寡核苷酸阵列收集到的信号可以用商购软件来分析,例如由昂飞公司(Affymetrix)或安捷伦科技有P艮公司(AgilentTechnologies)提供的那些。在杂交实验中可以包括(例如用于扫描灵敏度、挥:针标记和cDNA或cRNA定量的)对照。阵列杂交信号在进行进一步分析前可以按比例计算或标准化。例如,考虑到在类似测试条件下使用一个以上阵列时杂交强度间有差异,可以对每个探针的杂交信号进行标准化。与互补探针杂交的独立靶核酸的信号也可以利用来自每个阵列上包含的内部标准化对照的强度来进行标准化。此外,可以使用在不同样品间具有相对一致表达水平的基因来标准化其他基因的表达水平。为了鉴定赋予或与期望表型或特性关联的基因,对来自测试细胞系样品的基因表达错和来自目的细胞培养表型与测试细胞系不同的的对照细胞系的对照"i普相比较,并鉴定差异表达的基因。例如,用于鉴定细胞生产力涉及的基因和相关通路的方法可以包括如下1)培养具有特定细胞生长力的第一细胞系的笫一样品,以及培养具有不同细胞生长力的第二细胞系的第二样品;2)分离、加工来自第一样品的总RNA,并与第一寡核苷酸阵列杂交;3)分离、加工来自第二样品的总RNA,并与第二寡核苷酸阵列杂交;和4)比较产生的杂交谱,以鉴定在第一和第二样品间差异表达的序列。可以使用类似方法来鉴定其他表型涉及的基因。一般来讲,每个细胞系至少通过三份生物重复样品来展示。本领域已知的程序,例如GeneExpress2000(GeneLogic,Gaithersburg,Md,)可用于分析革巴序列的有无,并确定其在一群样品(例如细胞系或条件或时间点)中与另一群样品相比较而言的相对表达水平。在所有重复样品中存在的探针集合可考虑做进一步分析。一般地,如果p值小于或等于0.05,倍数变化值为1.2倍、1.5倍或更大可认为具有统计学显著意义。鉴定与一个或多个特定细胞表型(如细胞生长速率、峰值细胞密度、持续高细胞活力、最大细胞生产力、持续高细胞生产力、氨生产或消耗、乳酸生产或消耗等)相关的差异表达基因可以导致发现调控或指示细胞表型的(包括那些以前未发现的)基因和通路。对随后鉴定的基因进行测序,并针对不同的数据库对所述序列进行blast,来确定它们是否为已知基因或未知基因。如果基因已知,可以基于本领域已有的知识进行通路分析。已知和未知基因均通过本领域已知的多种方法进一步确认或证实。例如,可以操纵(如上调或下调)所鉴定的基因来诱导或抑制细胞的特定表型。阐明此过程的协调决策树示于图1。更详细的鉴定和验证步骤进一步描述于实施例,使用本发明方法鉴定的例示性差异表达基因示于表9-16。^7ff4^^4这谬》浙本发明还提供了通过蛋白质表达谱分析鉴定差异表达蛋白质的方法。蛋白质表达镨可以通过允许分辨和检测来自细胞系样品的蛋白质的任何方法来生成。通常优选具有较高分辨力的方法,因为增加分辨率可允许分析更多的独立蛋白质,增加镨图的说服力和有效性。可以在蛋白质分辨和检测之前预处理样品以去除样品中的富余蛋白质,例如免疫清除,因为富余蛋白质的存在可能掩盖其他蛋白质表达上更细微的变化,尤其是低丰度蛋白质。样品还可以进行一个或多个操作来降低样品复杂度。例如,可以用层析法来对样品进行分级;各级分将具有降低的复杂度,利于分析级分中的蛋白质。用于同时分辨和检测几种蛋白质的三种有用方法包括基于阵列的方法、基于质谱的方法和基于二维凝胶电泳的方法。蛋白质阵列通常包括大量数目的不同蛋白质捕获试剂,例如抗体或抗体可变区,分别固定在固相支持物的不同位置。此类阵列可获自例如西格玛奥德里奇公司(Sigma-Aldrich),作为其PanoramaTM$列阵列的一部分。阵列与蛋白质样品接触,而捕获试剂选择性地捕获特异蛋白质靼标。通过检测标记来检测捕获的蛋白质。例如,在接触阵列前可以标记蛋白质;在阵列的特定位置上检测到标记指示着检测到相应的蛋白质。如果阵列没有饱和,检测到的标记量可以与样品中的蛋白质浓度或量相关。还可以像在夹心免疫测定形式中那样,通过随后接触第二捕获试剂(其本身可经标记或以其他方式检测)来检测捕获的蛋白质。基于质谱的方法包括,例如,基质辅助激光解吸/电离(MALDI)、液相色镨/质镨/质谱(LC-MS/MS)和表面增强激光解吸/电离(SELDI)技术。例如,可以利用电喷射电离和MALDI生成蛋白质镨。例如,如美国专利号6,225,047所述,SELDI在质谦芯片上引入滞留表面。蛋白质样品中的蛋白质亚群滞留在表面上,P争低了混合物的复杂度。后面的时间飞行质谱生成滞留蛋白质的"指紋"。在包括二维凝胶电泳的方法中,在SDS-PAGE期间,样品中的蛋白质一般通过等电点在第一维中分开,而在第二维中通过分子量分开。依靠两维的分辨,成百成千的蛋白质可以同时进行分辨和分析。通过应用染色如银染或通过蛋白质上的标记如Cy2、Cy3或Cy5染料来检测蛋白质。为鉴定蛋白,可以切掉凝胶上的斑点,并进行胶内胰蛋白酶消化。胰蛋白酶消化产物可以通过质谱如MALDI分析。针对序列数据库搜索产生的肽质谱、肽质量指紋或PMF。将PMF与通过搜索程序在硅片(insilico)上生成的所有理论胰蛋白酶肽段的质量相比较。可以使用诸如Prospector、Sequest和MasCot(MatrixScience,Ltd.,London,UK)等程序用于数据库搜索。例如MasCot产生基于统计的Mowse分值,其指示任何配对是有显著意义的还是无显著意义的。质镨/质谱可以用来增加得到数据库配对的可能性。可以使用肽的CID-MS/MS(碰撞诱导解离的串联质谱)来给出包含关于氨基酸序列信息的碎片离子的频谱。向肽质量指紋中加入此信息允许Moscot增大配对的统计学显著性。在某些情况下还有可能通过只提交未加工的单个肽的MS/MS镨来鉴定蛋白质。蛋白质表达镨比较方面的近期进展包括使用两个或多个蛋白质样品的混合物,分别用不同的、光谱可分辨的、电荷与质量匹配的染料如Cy3和cy5来标记。此进展称为荧光二维差异凝胶电泳(DIGE),优势在于测试和对照蛋白质样品在同一凝胶上跑样,利于匹配两个样品间的蛋白质,避免了在不同凝胶上涉及的不同电泳条件的复杂性。凝胶成像独立进行,并且产生的图像可以直接叠加,无需进一步修饰。可以使用第三个光谱可分辨的染料如Cy2来标记蛋白质样品库,作为实验中不同凝胶跑样之间的内部对照。因此,所有可检测的蛋白质可纳入作为内部标准,有利于不同凝胶之间的比较。工程/A勿^系以攻迷勿^4型如上所述,本发明提供了在具有至少一个不同细胞表型的不同细胞系或细胞样品中差异表达的基因的多核苷酸序列(或亚序列)或蛋白质的多肽序列(或亚序列)。这些序列统称为差异序列。差异序列可用作为靶标来实现细胞表型,特别是表现为增加的和有效的重组转基因生产、增加的细胞生长速率、高峰值细胞密度、持续高细胞活力、高最大细胞生产力、持续高细胞生产力、低氨产量和低乳酸产量等特点的细胞表型。更特别的是,本发明提供了相关表格中述及的每个纯化和/或分离的多核苷酸或多肽序列,其表明是用于调控CHO细胞表型的合适靶标,即第一个CHO细胞系和第二个CHO细胞系相比差异表达之,在此命名为"差异CHO序列"。特别地,在此使用的差异CHO序列包括具有和/或基本上由从表格中述及的基因序列中选择的序列组成的序列、其片段或互补物。在此使用的差异CHO序列还包括选自表中述及的蛋白质序列的多肽序列或其片段。在此使用的差异CHO序列还包括编码选自表中述及的蛋白质序列的多肽序列的多核苷酸序列、其片段或互补物。技术人员应认识到本发明的差异CHO序列可以包括(如下面所讨论的)新CHO序列、具有不参与或以前不参与转基因表达功能的已知基因序列、以及以前无已知功能但可能现在知道作为调控CHO细胞表型的靶标起作用的已知序列。26本发明考虑可以用于改变(即调控(如增强、减弱或修4牟))与细胞或生物体内差异CHO序列对应的基因或蛋白质的表达和/或活性的方法和组合物。本发明包含的细胞或生物体内差异CHO序列的表达改变可以通过下调或上调相应基因或蛋白质来实现。例如,差异CHO序列可以通过使用不同的抑制性多核苷酸如反义多核苷酸、结合和/或切割转录自本发明基因的mRNA的核酶、靶向基因调控区域的三链形成寡核苷酸及导致粑mRNA序列特异性降解的短干扰RNA而下调(例如Galderisi等(1999)^Cell.Physiol.181:251-57;Sioud(2001)Curr.Mol.Med.1:575-88;Knauert和Glazer(2001)Hum.Mol.Genet.10:2243-51;Bass(2001)Nature411:428-29)。适合本发明的抑制性反义或核酶多核苷酸可以互补于本发明基因完整编码链或只互补于其一部分。可选地,抑制性多核苷酸可以互补于本发明基因编码链的非编码区。可以使用本领域广为人知的方法用化学合成和/或酶法连接反应来构建本发明的抑制性多核苷酸。化学合成多核苷酸的核苷连接可经〗务饰来增强其抗核酸酶介导的降解的能力,以及增强其序列特异性。此类连接修饰包括但不限于硫代磷酸酯、曱基膦酸酯、磷酰胺、硼代磷酸酯、吗啉和肽核酸(PNA)连接(Galderisi等,同前;Heasman(2002)Dev.Biol.243:209-14;Mickelfield(2001)Curr.Med.Chem.8:1157-70)。可选地,反义分子可以利用以反义(即相反)方向亚克隆了本发明多核苷酸的表达载体进行生物学生产。而在另一实施方案中,适用于本发明的反义多核苷酸分子是a-异头多核苷酸分子。a-异头多核苷酸分子和互补RNA形成特异性双链杂合体,其中与通常的p-单位相反,链走向彼此平行。依照本领域已知的技术,反义多核苷酸分子还包括2,-o-甲基核糖核苷酸或嵌合RNA-DNA类似物。适于本发明的抑制性三链形成寡核苷酸(TFO)以高特异性和亲和性结合在双链体DNA的大沟内(Knauert和Glazer,同前)。可以通过靼向互补于基因调控区(即启动子和/或增强子序列)的TFO形成防止基因转录的三链螺旋结构来抑制本发明的基因表达。在本发明一个实施方案中,抑制性多核苷酸是短干扰RNA(siRNA)分子。这些siRNA分子是导致靶mRNA序列特异性降解的短(优选19-25个核苷酸;最优选19或21核苷酸)双链RNA分子。此降解称为RNA干扰(RNAi)(例如Bass(2001)Nature411:428-29)。最初在低等生物中发现的RNAi已经被有效应用于哺乳动物细胞,并且最近已经显示以耙向FasmRNA的siRNA分子处理能预防小鼠的重型肝炎(Song等(2003)Nat.Med.9:347-51)。此外,最近有报道鞘内递送siRNA能够阻断两种大鼠模型(激动剂诱导的疼痛模型和神经性疼痛模型)的疼痛反应(Dom等(2004)NucleicAcidsRes.32(5):e49)。可以通过一起退火两个互补的单链RNA分子(其中之一与粑mRNA的一部分互补)(Fire等,美国专利号6,506,559)、或通过使用单个发夹RNA分子自身折回生成必需的双链部分(Yu等,(2002)Proc.Natl.Acad.Sci.USA99:6047-52),来生成适用于本发明的siRNA分子。siRNA分子可以经化学合成(Elbashir等,(2001)Nature411:494-98),或通过使用单链DNA模^反体外转录来生产(Yu等,同前)。可选地,siRNA分子可以或瞬时(Yu等,同前;Sui等(2002)Proc.Natl.Acad.Sci.USA99:5515-20)或稳定地(Paddison等(2002)Proc.Natl.Acad.Sci.USA99:1443-48)使用包含有义和反义siRNA序列的表达载体来生物法生产。最近,已显示使用表达发夹RNA(其进一步被加工成siRNA)的腺病毒载体以有效和序列特异性方式降低原代人类细胞中靶mRNA的水平(Arts等(2003)GenomeRes.13:2325-32)。可以基于本领域熟知的标准设计靶向本发明差异CHO序列的siRNA分子(例如Elbashir等(2001)EMBOJ.20:6877-88)。例如,靼mRNA的靶区段应起始于AA(优选)、TA、GA或CA;siRNA分子的GC比应为45-55%;siRNA分子不应包含连续的三个同样的核苷酸;siRNA分子不应包含七个连续的混合G/C;而且靶区段应位于靶mRNA的ORF区域,并且应在起始ATG之后的至少75bp、在终止密码子之前至少75bp处。本领域普通技术人员使用上述标准或其他已知标准能够设计靶向本发明多核苷酸的siRNA分子。还可以通过插入外源多核苷酸序列破坏对应于本发明差异CHO序列的内源基因,来创建细胞或生物(即敲除细胞或生物),以实现细胞或生物体内本发明基因或蛋白质的下调。可破坏内源基因的编码区,从而产生了非功能性蛋白质。可选地,可破坏内源基因的上游调控区或替换为不同的调控元件,导致仍为功能性蛋白质的表达改变。用来生成敲除细胞的方法包括同源重组,并在本领域广为人知(例如Wolfer等(2002)TrendsNeurosci.25:336-40)。还可以通过上调相应于本发明CHO差异序列的基因或蛋白质来改变CHO差异序列的表达或活性。上调包括提供编码目的蛋白质或基因或保留其活性的变体的外源核酸(如过表达构建体),或提供间接增强蛋白质活性的因子或分子。变体通常和目的蛋白质或基因享有共同的结构特点,并应保留允许改进细胞表型的活性。变体可以对应于来自其他物种的同源物(如啮齿动物同源物;灵长动物同源物如人同源物;另一哺乳动物同源物;或保留足以传达期望细胞表型效应的序列保守性的较为远源的同源物)。在某些情况下,变体可以保留与CHO序列或与已知同源物至少70%、至少80%、至少卯%、或至少95%的序列同一性。在某些实施方案中,变体是在严谨条件下与CHO核酸序列杂交或与已知同源物核酸序列杂交的核酸分子。例如,相应于本发明差异CHO序列的分离的多核苷酸可以有效连接于一表达控制序列如pMT2和pED表达载体,用于重组生产本发明差异表达的基因或蛋白质。表达重组蛋白质的一般方法在本领域广为人知。本发明差异表达基因或蛋白质的表达或活性还可以通过可以直接或间接调节本发明基因或蛋白质活性的外源物质、小分子、药物化合物或其他因子来改变。因此,可以利用这些物质、小分子、药物化合物或其他因子来调控CHO细胞的表型,例如重组转基因增加的表达、增强的细胞生长速率、高峰值细胞密度、持续高细胞活力、高最大细胞生产力、持续高细胞生产力、低氨产量和低乳酸产量等。29上述改变基因或蛋白质表达的方法的任意组合均落在本发明范围之内。影响不同细胞表型的基因或蛋白质的任意组合可以基于在此描述的方法进行调整,并且落在本发明的范围之内。,奇差萄成f如上所述,本发明提供了差异序列,包括新发现的由CHO细胞表达的序列。相应地,本发明提供了新的、分离的和/或纯化的至少是以前未发现基因的一部分的多核苷酸。新发现的由CHO细胞表达的基因的例示性新多核苷酸序列(或亚序列)示于表9、13和15。本发明还提供了分离的和/或纯化的至少是以前未发现蛋白质的一部分的多肽。新发现的由CHO细胞表达的蛋白质的例示性新多肽序列(或亚序列)示于表2和4。本发明还提供了编码如表2和4中所示多肽序列的新多核苷酸。这样,本发明提供了选自表9、13和15的各纯化的和/或分离的多核苷酸序列,为从前未发现的基因(即未被测序和/或未显示由CHO细胞表达的基因)或为其一部分,经证实由CHO细胞表达。可选地,本发明提供了选自表2和4的各纯化的和/或分离的多肽序列,为从前未发现蛋白质(即未被测序和/或未显示由CHO细胞表达的蛋白质)或为其一部分,经证实由CHO细胞表达。本发明还提供了分离的和/或纯化的编码来自表2和4的各多肽序列的多核苷酸序列。这些序列在此统称为"新CHO序列"。本发明优选的多核苷酸序列包括DNA序列,包括基因组和cDNA序列和化学合成DNA序列,RNA序列,或其他修饰的核酸序列。本发明优选的多肽序列包括氨基酸序列或修饰的氨基酸序列。本发明的一部分提供了上述各新CHO序列的抑制性多核苷酸。本发明的多核苷酸还包括这样的多核苷酸,其在严谨条件下与新CHO序列或其互补物杂交,和/或编码基本上保留由本发明新CHO序列所编码多肽的生物活性的多肽。本发明的多核苷酸还包括包含至少21个连续核苷酸的新CHO序列的连续部分。本发明的多核苷酸还包括编码由上述多核苷酸编码的任何氨基酸序列的多核苷酸,或其连续部分,并且其与上述多核苷酸的不同只在于众所周知的遗传密码简并性。本发明的分离多核苷酸可用作杂交探针(例如,作为如上所述的寡核苷酸阵列)和引物来鉴定和分离其序列与编码所公开多核苷酸的序列相同或相似的核酸。用于鉴定和分离核酸的杂交方法包括聚合酶链式反应(PCR)、Southern杂交和Northern杂交,为本领域技术人员所熟知。杂交反应可以在不同严谨度条件下进行。杂交反应的严谨度包括任何两个核酸分子彼此杂交的难度。优选各杂交多核苷酸与其相应多核苷酸在降低的严谨度条件下杂交,更优选严谨的条件,而最优选高严谨度条件。在下表l中显示了严谨度条件的实例例如,高严谨度条件是那些至少和条件A-F—样严谨的;例如,严谨条件是至少和条件G-L—样严谨的;而降低严谨度条件是例如至少和条件M-R—样严谨的。表1.严谨度条件<table>tableseeoriginaldocumentpage32</column></row><table>、杂合体长度是杂交多核苷酸的杂交区域的预期长度。当多核苷酸与未知序列的乾多核苷酸杂交时,假定杂合体长度是杂交的多核香酸的长度。当已知序列的多核苷酸杂交时,杂合体长度可以通过比对多核苷酸序列并鉴定区域或最佳序列互补性区域来确定。H:在杂交和洗涤緩冲液中,SSPE(lxSSPE是0.15MNaCl、10mMNaH2P04和1.25mMEDTA,pH7.4)可以替代SSC(1xSSC是0.15MNaCI和15mM柠檬酸钠)。TB*-TR*:预期长度小于50个碱基对的杂合体的杂交温度应比杂合体的溶解温度(TJ低S-1(TC,其中Tm依照下列方程式确定。对于长度小于18个碱基对的杂合体,Tm('C)=2(A+T碱基数)+4(G+C碱基数).对于长度为18到49个碱基对的杂合体,Tm('C)=81.5+16.6(log1()Na+])+0.41(%G+C)-(600/N),其中N是杂合体中的碱基数目,而[Na+]是杂交緩冲液中钠离子的摩尔浓度(lxSSC的[Na+=0.165M)。通常和如上文所声明的那样,本发明分离的多核苷酸还可以用作杂交探针和引物来鉴定和分离与所公开的多核苷酸同源的DNA。这些同源物是分离自与那些所公开的多核苷酸不同物种的多核苷酸,或是在同一物种分离的,但和所公开的多核苷酸有明显的序列相似性。优选多核普酸同源物和所公开的多核苷酸有至少60%序列同一性(更优选至少75%同一性;最优选至少90%同一性)。优选地,公开的多核苷酸同源物分离自哺乳动物物种。本发明的分离多核苷酸还可以用作杂交探针和?j物来鉴定表达本发明多核苷酸的细胞和组织及它们表达的条件。本发明还考虑重组表达由新CHO序列编码的蛋白质或多肽。许多细胞类型可以担任合适的宿主细胞,用于重组表达由本发明新CHO序列编码的多肽。哺乳动物宿主细胞包括^f旦不限于,例如COS细胞、CHO细胞、293细胞、A431细胞、3T3细胞、CV-1细胞、HeLa细胞、L细胞、BHK21细胞、HL-60细胞、U937细胞、HEK细胞、PerC6细胞、Jurkat细胞、正常二倍体细胞、来自原代组织体外培养和原代移植物的细胞系。可选地,可以在低等真核生物例如酵母或在原核生物中重组生产由本发明的新CHO序列编码的多肽。潜在的合适的酵母菌林包括酿酒酵母(5Wc/e"w附j^esccev/5iW)、粟酒裂殖酵母(jSc/t"Atfw附yces"附6e)、克鲁维酵母属(isr/foww/^c^)菌林及假丝酵母属(am^^)菌林。潜在的合适的细菌菌林包括大肠杆菌、枯草芽孢杆菌和鼠伤寒沙门氏菌(4^/附0^/&0;/^Z附wWm附)。如果多肽在酵母或细菌中制备,为了得到功能性,可能有必要通过例如合适位点的磷酸化或糖基化来修饰它们。此类共价连接可用众所周知的化学或酶法来实现。还可以通过将分离的本发明的新CHO序列有效连接于一个或多个昆虫表达载体(如杆状病毒载体)中的适当控制序列,并使用昆虫细胞表达系统来重组生产由本发明多核苷酸编码的多肽。用于杆状病毒/Sf9表达系统的材料和方法可以试剂盒形式商购(例如MaxBac⑧试剂盒,加州卡尔斯班英^Z/^司(Invitrogen,Carlsbad,Calif.))。在合适宿主细胞中重组表达之后,接着可以用公知的纯化方法如凝胶过滤和离子交换层析,从培养基或细胞提取物中纯化由本发明多核苷酸编码的多肽。纯化还可以包括用已知结合本发明多核苷酸所编码的多肽的试剂进行亲和层析。这些纯化方法还可用于纯化来自天然来源的多肽。可选地,由本发明的新CHO序列编码的多肽也可以重组表达为利于纯化的形式。例如,多肽可以表达为与蛋白质如麦芽糖结合蛋白(MBP)、谷胱甘肽-S-转移酶(GST)或硫氧还蛋白(TRX)融合的形式。用于表达和纯化此类融合蛋白的试剂盒可分别从麻州比佛利纽英伦生物技术有限公司(NewEnglandBioLabs,Beverly,Mass.)、新泽西州皮斯卡塔韦市发玛西亚^^司(Pharmacia,Piscataway,N.J.)和力口州卡尔-Jf班英-睃/〉司(Invitrogen,Carlsbad,Calif.)商购。由本发明多核苷酸编码的多肽还可以用小表位标记,而后用针对表位的特异性抗体鉴定或纯化。优选的表位是FLAG表位,从康涅狄格州纽黑文伊斯曼柯达公司(EastmanKodak,NewHaven,Conn.)商购。由本发明的新CHO序列编码的多肽还可以用已知传统化学合成来生产。用于化学合成由本发明的新CHO序列编码的多肽的方法对于本领域技术人员是众所周知的。此类化学合成多肽可以拥有与天然的、纯化的多肽共同的生物学性质,因此可以用作天然多肽的生物活性或免疫替代物。应理解上述实施方案和下面的实施例以举例说明方式给出,不是限制。根据本说明书,在本发明范围内的不同改变和变动对于本领域技术人员是显而易见的。实施例实施例1.细胞培养在两种基本条件下以两种基本方式在无血清悬浮培养物中培养细胞。一种方式是小量、摇瓶培养,其中细胞在通气组织培养瓶中,以小于100ml的体积,在C02孵箱中的有轨摇床上旋转培养。第二种方式是在台式生物反应器中,以2L或更少的工作体积,控制pH、营养、溶氧和温度。两种基本培养条件是37。C的普通传代条件,或补料分批培养条件。在基本补料分批培养中,细胞培养更长一段时期,并且转换到低一些的温度以延长细胞活力和扩展培养物的生产期。实施例2.CHO细胞培养物分类基于如下有益于高产分批补料细胞培养过程的每一种表型的来分类CHO细胞系高细胞生长速率、高峰值细胞密度、持续高细胞活力、高最大细胞生产力、持续高细胞生产力、低氨产量和低乳酸产量。生成细胞样品矩阵,其中各表型类别由取自摇瓶和台式细胞反应器培养物的合适34CHO细胞样品增殖,并且包括375个独立样品(包括生物学上一式三份或一式四份的重复)和29个表达单克隆抗体、细胞因子、凝血因子及Fc:受体融合分子的不同rCHO细胞系。图2描述了细胞样品矩阵的例示性部分,其中缩写词Qp表示细胞生产力。图3描述了测试细胞系和对照细胞系之间有关"高细胞生长速率"表型的例示性表型比较。实施例3.差异表达蛋白质检测才法收集细胞并在7M尿素、2M硫脲、4%CHAPS、30mMTris、5mM醋酸4美pH8.5中进行标准裂解。使用pH4-7的18cm固定的pH梯度等点聚焦梯度胶条、以二维凝胶电泳分析150ng小份裂解物,来确定样品质量。胶条以每块胶条340nl緩沖液再水化过夜。于胶条的阴极端上样,进行1小时500V、1小时1000V和4小时8000V电泳,储存于-80"C,直至在12.5%丙烯酰胺凝胶上进行第二维电泳。以每块凝胶1.5W进行第二维电泳30分钟,然后用Dalt6对6块大型胶进行总共100W5小时电泳。银染观察蛋白质来证实裂解物中的蛋白质的质量。接着用荧光染料标记小部分最初裂解物,以备荧光二维差异凝胶电泳(DIGE),图4显示了其概览。细胞培养物的每次比较用一式两份凝胶进行四次,每个实验共8块DIGE凝胶,每块凝胶使用50jig各Cy2-、Cy3-和Cy5-标记的细胞裂解物。汇集实验中使用的所有细胞裂解物,并用Cy2标记用做内部标准。对照细胞裂解物以Cy3标记,而测试细胞裂解物以Cy5标记。在冰上于黑暗中进行标记30分钟,接着在水上于黑暗中使用10mM赖氨酸淬火反应10分钟。然后汇集Cy2-、Cy3-和Cy5-标记的裂解物并在水上于黑暗中与2x样品緩沖液混合15分钟。将样品施加到固定的pH梯度等点聚焦胶条。胶条过夜再水化大约20小时。于条带的阴极端上样,并进行300V/3hr/G、600V/3hr/S&H、1000V/3hr/G、8000V/3hr/G、8000V/4hr/S&H和500V/12hr/S&H电泳。35在SDS-PAGE前1小时,对胶条进行8000V电泳1小时。胶条在SDS緩冲液+1%DTT中平衡15分钟,在SDS緩冲液+2.5。/。碘乙酰胺中平衡15分钟。将胶条施加到聚丙烯酰胺凝胶上,并用琼脂糖覆盖。在Dalt12上用U块大型胶在l(TC以1.5W/胶大约18小时进行穿过凝胶的电泳。以可变模式成像仪在Typhoon9400扫描仪上扫描凝胶;切割并输入到DeCyderTM软件。使用生物方差分析(BVA)鉴定差异调控的蛋白质。这些蛋白质与上样了400jtg蛋白质并以钌染色的预制胶相匹配。从预制胶上,用EttanSpotPicker挑选出通过DIGE鉴定为差异调控的蛋白质。使用EttanDigestor以过夜胰蛋白酶孵育来消化个体蛋白质。用质谦分析得到的肽。使用MALDI来分析肽质量指紋,尤其是胶上的高丰度样品。对于丰度低些的样品,使用MDLCLTQ机器进行LC-MS/MS。来自二维凝胶斑点的胰蛋白酶消化样品重悬于含0.1。/。TFA的20pLLC-MS级水中,并通过一维LC-MS使用以高通量配置与FinniganLTQTM(热电公司,ThermoElectron)直接连接的EttanMDLC系统(通用电气医疗集团,GEHealthcare)来分析。浓缩样品,在RPC捕获柱(ZorbaxTM300SBC18,0.3mmx5mm,安捷伦科技有限公司(AgilentTechnologies))上脱盐,并在RPC纳米柱(Zorbax300SBC18,0.075mmxlOOmm,安捷伦科技有限公司(AgilentTechnologies))使用0-65%乙腈(Riedel-deHaSn公司LC-MS级)的线性乙腈梯度进行为时60分钟的肽分离,直接经由10纳升电喷雾(nanoESI)发射器(PresearchFS360-20-10-CE-20)进入LTQ。LTQ离子阱质镨仪用于MS/MS。使用300-2000的m/z范围约0.15s的扫描时间(一帧樣吏扫描的最大离子注射时间10ms),继以MS/MS分析从每帧扫描得到的3个最大丰度峰,接着在下面60秒将其排除,然后继以MS/MS分析下面的三个丰度峰,依次在60秒将其排除,依此类推。离子分裂采用35%的"碰撞能量,,设置,并使用动态排除来区别开以前分析的离子(数据依赖性分析)。用于纳升液相色镨(nanoLC)分离的所有緩冲液包含0.1。/。蚁酸(Fluka公司)作为离子对试剂。以镨图方式记录全程扫描质谱,并以质心模式记录串联质谱。通过使用SEQUESTTM搜索SWISSPROT数据库、用串联质谱中的信息来鉴定肽。作为统计截断值所使用的Xcorr值对带单电荷的肽是>1.5,对带双电荷的肽是>2.0,而对带三电荷的肽是>2.5。處义叙應i,力辨^尹记将过表达PACE(弗林前原蛋白)、具有高最大细胞生产力的细胞系的四份培养物的蛋白质表达镨与对照细胞系的四份培养物的蛋白质表达镨相比较。所有8个凝胶实验(包括总共24张图像)中大约有2000个蛋白质匹配。为在DeCyder分析中视为差异表达的蛋白质,蛋白质必须已经在所有24张图像中被鉴定;已被证明至少1.5倍上调或下调;并且已被证明T检验分值小于0.05。188种蛋白质被鉴定为差异调控,多数具有高度显著意义的T检-验分值,包括几种低丰度蛋白质。图5显示了例示性凝胶上的Cy3和Cy5染色模式。图中显示了在Cy5标记的测试细胞提取物中显示5倍上调的蛋白质,还给出了Cy5标记的测试细胞提取物中蛋白质相对丰度的图示。图6显示了在Cy5标记的测试细胞提取物中显示4倍下调的蛋白质,并且给出了类似于前图5中的那些图示。表2和3中列出了鉴定为在高最大细胞生产力细胞系中差异表达的几个斑点。对表中列出的每个斑点,MALDI序列分析鉴定了一个或两个相应的氨基酸序列。对于每个斑点号,表中提供了测试和对照样品间蛋白质水平的倍数差异,标记为"平均比率";在测试样品中水平降低的蛋白质以负号显示。表中还提供了表达差异可能是随机发生结果的p值和相应于任何所鉴定氨基酸序列的蛋白质名称及登录号。在MALDI序列分析中,胰蛋白酶片段的分子量和已知序列的胰蛋白酶片段的预测分子量相比较。在某些情况下,在本申请中包括的此序列分析和其他肽序列分析中,检测的分子量指示检测到肽修饰形式,例如其中半胱氨酸以碘乙酰胺修饰,或其中甲硫氨酸被部分氧化。应理解这不必然反映就细胞或细胞环境中蛋白质而言的肽的原始状态。因此,在序列表中提供的肽序列反映了肽的未修饰形式,并且在某些实施方案中,欲工程化改造以具有期望细胞表型的细胞将被工程化改造来调控表达包含一个或多个所述肽的氨基酸序列的基因。在表中,"%覆盖率"意指实验中检测的相应胰蛋白酶片段占数据库序列总长的百分数。pl和MR表示蛋白质斑点的表观等电点和表观分子量。对于一些蛋白质,表中还提供了推定的蛋白质功能。表2:鉴定为非仓鼠蛋白质的新同源物的高MaxQpProt蛋白质<table>tableseeoriginaldocumentpage39</column></row><table><table>tableseeoriginaldocumentpage40</column></row><table><table>tableseeoriginaldocumentpage41</column></row><table><table>tableseeoriginaldocumentpage42</column></row><table>图7-59提供了鉴定的蛋白质的序列数据。对于来自DIGE的特定蛋白质斑点,每张图提供了在胰蛋白酶消化产物中检测到的分子量语;相应的蛋白质数据库匹配或匹配群,包括与预测胰蛋白酶肽萃殳相匹配的蛋白质数据库录入肽的个数、登录号、名称和来自数据库录入的蛋白质的物种、覆盖率百分数、等电点和质量;对于与预测肽的预测质量相匹配的每个分子量而言,提供了测量的质量、预期的(比较的)质量、两者间的差异和相应的肽序列;以及来自数据库录入的蛋白质的全长序列。^叙應卫长遽,W标记具有高细胞生长速率的PADUKX378的蛋白质表达谱与PADUKX153.8的蛋白质表达镨相比较。表4和5列出了在高最大细胞生产力细胞系中鉴定为差异表达的几个斑点。对于表中列出的每个斑点,MALDI序列分析鉴定了和相应来自中国仓鼠或来自其他物种的氨基酸序列的匹配。对于每个斑点号,表中提供了测试和对照样品间蛋白质水平的倍数差异(标作"平均比率,,);在测试样品中水平降低的那些蛋白质以负号表示。表中还提供了p值(统计学显著意义)、及蛋白质名称、登录号、和对应于任何鉴定的氨基酸序列的物种。43表4:鉴定为非仓鼠蛋白质新同源物的高细胞生长率蛋白质<table>tableseeoriginaldocumentpage44</column></row><table><table>tableseeoriginaldocumentpage45</column></row><table><table>tableseeoriginaldocumentpage46</column></row><table><table>tableseeoriginaldocumentpage47</column></row><table><table>tableseeoriginaldocumentpage48</column></row><table><table>tableseeoriginaldocumentpage49</column></row><table><table>tableseeoriginaldocumentpage50</column></row><table><table>tableseeoriginaldocumentpage51</column></row><table>图60-112提供了鉴定的蛋白质的序列数据。对于得自DIGE的特定蛋白质斑点,每张图提供了在胰蛋白酶消化产物中检测到的分子量谱;相应的蛋白质数据库匹配或匹配群,包括与预测胰蛋白酶肽段相匹配的蛋白质数据库录入肽的个数、登录号、名称和来自数据库录入的蛋白质的物种、覆盖率百分数、等电点和质量;对于与预测肽的预测质量相匹配的每个分子量而言,提供了测量的质量、预期的(比较的)质量、两者间的差异和相应的肽序列;以及来自数据库录入的蛋白质的全长序列。实施例4.在具有持续高细胞活力或高峰值细胞密度的细胞中差异表达的蛋白质表7列出了利用如实施例3所述的方法鉴定为在具有持续高细胞活力的细胞中差异表达的几个斑点。图113到127提供了鉴定的蛋白质的序列数据。表8列出了用类似方法在具有高峰值细胞密度的细胞中鉴定为差异表达的几个斑点;图128到138显示了相应的序列数据。对于每个斑点号,表中提供了测试和对照样品间蛋白水平的倍数差异(标作"平均比率");在测试样品中水平降低的蛋白质以负号注明。表中还提供了表达差异可能是随机发生结果的p值和对应于任何所鉴定氨基酸序列的蛋白质名称及登录号。通过质谱分析了得到的肽。使用MALDI(特别是对凝胶上高丰度样品)来分析肽质量指紋。对较低丰度样品,使用利用MDLCLTQ仪器的LC-MS/MS。在MALDI序列分析中,胰蛋白酶片段的分子量和已知序列的胰蛋白酶片段的预测分子量相比较。在表中,"%覆盖率"意指其在实验中被检测到的相应胰蛋白酶片段占数据库序列全长的百分数。pl和Mr表示蛋白质斑点的表观等电点和表观分子量。表7.在具有持续细胞活力的细胞中的差异表达蛋白质<table>tableseeoriginaldocumentpage53</column></row><table><table>tableseeoriginaldocumentpage54</column></row><table>表8.HCD3蛋白列表所有测试样品相对于所有对照样品(3、5、7天),(过滤-1.2倍上/下调,t-检验〈0.01,双向AnovaO.Ol,Decyder统计学分析)<table>tableseeoriginaldocumentpage55</column></row><table><table>tableseeoriginaldocumentpage56</column></row><table>实施例5.mRNA表达镨分析获得来自测试和对照CHO细胞系的RNA样品,并在含有如美国专利申请公开US2006/0010513中所述的CHOmRNA序列(其完整内容在此引入作为参考)的探针的微芯片进行上分析。使用标记的已知浓度的对照序列的片段化cRNA,杂交混合物用片段化cRNA标准分析来生成标准曲线,使得数据标准化并能评价芯片的灵敏度和饱和度。使用p-肌动蛋白和GAPDH的3V5,比、信号强度和一致性及呈现的百分数对扫描的数据进行质量控制。通常,用软件工具Affy5.0和Genesis2.0、或dChiP(见Li等(2001)Proc.Natl.Acad.Sci.USA98:31-36和Li等(2001)GenomeBiol.2:0032.1-0032.11)和Genespring来进行数据标准化。在进一步考察基因之前,需要P值小于或等于0.05并且测试和对照系间的最小倍数变化为1.2。图139和140描述了无监督的Pearson聚类分析。在图141中描述了数据分析的例示性方法。比较了对于高细胞生长速率而言的成对测试和对照细胞系,并且鉴定了符合1.2倍变化需求的mRNA表达^t式。其中65个基因鉴定为在四个不同成对测试和对照细胞系的每对中均为差异表达。65个中的29个是在测试细胞系中或持续上调或持续下调;优先对这些进行进一步分析。图142描述了不依赖于成对差异的数据分析的例示性方法。鉴定了590个基因,其在高细胞生长率的测试CHO细胞系群中平均表达水平比对照CHO细胞系群的平均表达高至少1.2倍。当需要表达有1.5倍差异、并且附加地使用更严谨的统计学分析时,78个基因通过了标准;更优先对这些进行进一步分析。实施例6.在具有高最大细胞生产力的细胞中差异表达的基因表9和10中提供了鉴定为具有高最大细胞生产力的细胞中差异表达的核酸概要。对于每个核酸,提供了合格者名录、符号和名录,还有在具有高最大细胞生产力的细胞中核酸是上调还是下调。对于在Unigene数据库中具有人或小鼠同源物的核酸,表中提供了UnigeneID号和比较相关的统计,包括e值、CHO序列和Unigene数据库录入间的序列同一性百分数、及覆盖率百分数("%QC,,)。内质网(ER)或高尔基复合体相关蛋白质的编码核酸可能对细胞生产力特别是分泌蛋白质的生产有作用。表11总结了在过表达PACE细胞中差异表达至少为1.2倍并编码ER相关蛋白质的核酸。表12总结了在过表达PACE细胞中差异表达为1.2倍并编码高尔基体相关蛋白质的核酸。<table>tableseeoriginaldocumentpage59</column></row><table><formula>formulaseeoriginaldocumentpage60</formula>人Unigene小鼠Unigene倍数变变化方向合格者名录符号名称IDe值%ID0/oQCIDe值%ID%QC化WAN008D眼at环氣化物水解酶1,微粒体的(Ephxl)(SEQIDNO:1^03)EPHX1Hs.896499E-8587.98760.392Mm.90751E-II391.22362.5491.319上调WA翻8盯7at细胞色素P450,家族51,亚家族多(SEQIDNO:T504)肽I(CYP51AI)Hs.41707786.87998.051Mm.460441E-15288.51598.4411.297上调WAN008ELHat(SEQIDNO:1505)RPN1核糖体结合蛋白IHs.518244090—51999.643Mm.188544092.335100.0001.295上调WAN0088K7xat热休克70kDa蛋白5(葡萄糖调节蛋(SEQIDNO:r5一HSPA5白,78kDa)00.000O扁Min.3301600.000009跳OOO6.9233—401上调LOO176at(SEQIlJNO:1500)HMGCR3-羟基-3-甲基戊二酰辅酶A还原酶Hs.118997E-5487.98157.939Mm.3166523E-8294.47255.4322.551上调L00H8at(SEQn5"NO:1507)腹GCR3_羟基_3_甲基戊二酰辅酶A还原酶Hs.U8993E-4790.06242.819Mm.3166521E-5793.03842.0212.033上调LOO169at(SEQnJNO:i508)HMGCR3-羟基-3-曱基戊二酰辅酶A还原酶Hs.I18992E-1989.53533.992Mm.3166527E-2794.87230.8302.020上调LOO180at(SEQn5"NO:1509)HMGCR3_羟基_3_甲基戊二酰辅酶A还原酶Hs.U柳5E-3586.31068.016Mm.3166521E-49卯.24466.397l細上调L00181at(SEQh5"nO:1510)画GCR3—羟基_3_曱基戊二酰辅酶A还原酶Hs.118991e-3789.78132.697Mm.3166523e-5293.61733.6521.976上调L00171at(SEQn5"NO:1511)HMGCR3_幾基_3_甲基戊二酰辅酶A还原酶Hs.U8995E-3691.52533,Mm.3166525E-4193.22033細1-934上调L00170xat(SEQ115"l70:1512)HMGCR3-羟基-3-甲基戊二酰辅酶A还原酶Hs.脂97E-27訓9170.968Mm.3166526E-5494.81587—0971.718上调LOO173at(SEQIJ5"N0:1513)HMGCR3-羟基—3—甲基戊二酰辅酶A还原酶Hs.ll柳2E-3385.88230.466Mm.3166528E-7889.91944.444L621上调LOO182at(SEQn3"NO:m4)画GCR3一雍基-3-甲基戊二酰辅酶A还原酶Hs.118993E-6594.01248.688Mm.3166522E-6594.47947.5221.546上调AF380341at(SEQIDN"5:1515)CANX钙联结蛋白Hs.5679681E-10193.35967.016Mm.2488271E-11495.00068.0633.165上调WAN013I86xat(SEQ〖DNO:l细CANX钙联结蛋白Hs.567968IE-Ill86.05397J87Mm.2488271E-16992.072100.0001.508上调WAN008ES3at(SEQIDNO:T5")CANX钙联结蛋白Hs.56796S5E-1888—42122.565Mm.2488271E-11492.56286.2231.376上调WA画犯HWat(SEQ〖DNO:1^8)OPRS1阿片样受体,olHs.5220871E-14187.77695.777Mm.290251E-16389.34997.313上调XI5652at(SEQIDNO:1519)NSFN-乙基马来酰亚胺敏感因子Hs.431279089.89999.331Mm.260117094.649i[00.0001.346上调WA翻88XHat高半胱氨酸诱导的,内质网压力诱导的,(SEQIDNO:1520)HERPUD1泛素样结构域成员1Hs-1463937E-7987.41768.481Mm,51IE-I5091.46392.9711.247上调200780022890.4转溢也被56/126到<table>tableseeoriginaldocumentpage62</column></row><table><table>tableseeoriginaldocumentpage63</column></row><table>实施例7.在具有高细胞生长率的细胞中差异表达的基因表13和14提供了鉴定为在具有高细胞生长率的细胞中差异表达的核酸的总结。对每个核酸,提供了合格者名录、符号和名称,还有在具有高最大细胞生产力的细胞中核酸是上调还是下调。对于在Unigene数据库中有人或小鼠同源物的核酸,表中提供了UnigeneID号和比较相关的统计,包括e值、CHO序列和Unigene数据库录入间的序列同一性百分数、及覆盖率百分数("%QC")。<table>tableseeoriginaldocumentpage65</column></row><table><table>tableseeoriginaldocumentpage66</column></row><table>实施例8,在具有高峰值细胞密度的细胞中差异表达的基因表15、16和17中提供了鉴定为在具有高峰值细胞密度的细胞中差异表达的核酸的总结。对每个核酸,提供了合格者名录、符号和名称,还有在具有较高最大细胞生产力的细胞中核酸是上调还是下调。对于在Unigene数据库中有人或小鼠同源性的核酸,表提供了UnigeneID号和比4交相关的统计,包括e值、CHO序列和Unigene数据库录入间的序列同一性百分数、及覆盖率百分数("%QC")。<formula>formulaseeoriginaldocumentpage68</formula><table>tableseeoriginaldocumentpage69</column></row><table><table>tableseeoriginaldocumentpage70</column></row><table>小鼠Unigeie变化方向(测合格者名录符号名称人UnigeneIDe值%ID%QCIDe值%ID%QC试相对于对照)WA画3I2Kat5争膜蛋白带EGF样和二卵泡抑(SEQ〖DNO:1650)TMEFF1素样结枸域1Hs.336224犯-9391.0781100MnU309827E-8689.963100下调WA丽3I2Lat溶解栽体家族7(阳离子氨基(SEQIDNO:1651)SLC7A5酸转运蛋白,y+系统),成员5Hs.5137979.00E-071002.2523Mm.27943I.00E-07923.7538上调WA丽3I2Tat色原体同源物5(HP1a聚合酶,(SEQIDNO:1652)CBX5果蝇)Hs.3492831E-14291.863572.023Mm.2620591E-16894.75172.023上调WAN013I3Pat(SEQIDN071653)C細LG《丐调节配体Hs.529846IE-14786.702199.296麵A1E-17288.61298.944上调WAN013I61at(SEQIDNO:1654)Nppb利尿钠肽前体B类Hs.219140Mm.27405E-3088.28123.146下调WA丽3I6Cat溶解载体家族16(单羧酸转运(SEQIDNO:1655)SLC16A1蛋白),成员1Hs.752312E-2684.47212.697Mm駕61E-11087.2430.284上调WAN013I6Exat(SE(J〖DNO:1656)GSTP1谷胱甘肽-S-转移酶氨基甲酰磷酸合成酶2,天门Hs.5238361E-12981.990585.889#N/A087.57788.467下调WAN013I6Jsat冬氨酸转氨甲酰酶,及二氢乳(SEQIDNO:lS57)CAD清酸酶Hs.37701009U55299.461Mm.305535093.50299.461上调WAN013I6PxatATP结合盒,亚家族B(SEQIDNO:1^58)ABCB1(MDR/TAP),成员1Hs.4,33087.710428.592Mm.146649089.77133.646下调W扁13I8B一at醛酮还原酶家;j美1,成员A4(SEQIDNO:1659)Akrla4(乙醛还原酶)Hs.474584091.537199.314Mm.30085091.7199.314下调WA薩3I8Vat(SEQIDNO:1660)核仁素Hs.79110IE-HI卯.058567.059Mm.1543781E-13793.27567.059上调WAN013I8Xat热休克60kDa蛋白1(伴侣蛋(SEQIDNO:,)HSPD1白)Hs.1136840卯.30899.775Mm.1777093.38899.775上调WAN013I9Fat(SEQIDNO:1662)HSPA9B热休克蛋白9AHs.1842333E-2992.23318.693Mm.2094192E-7244.828上调WAN01319Gat溶解载体家族3(二碱性和中(SEQIDNO:1663)SLC3A2性氨基酸运输激活子),成员2Hs.5027691E-10584.854438細Mm.4114088.59658.98上调WAN013I9Zat(SEQIDNO:1664)GNAS鸟噪呤核苷结合蛋白,a刺激Hs.125898Mm.125770094.40341.104下调<table>tableseeoriginaldocumentpage72</column></row><table>1.5倍上调<table>tableseeoriginaldocumentpage73</column></row><table><table>tableseeoriginaldocumentpage74</column></row><table><table>tableseeoriginaldocumentpage75</column></row><table><table>tableseeoriginaldocumentpage76</column></row><table><table>tableseeoriginaldocumentpage77</column></row><table>实施例9.具有持续高细胞活力的细胞中差异表达的基因Bcl-xL是细胞死亡的强大抑制因子。过表达Bcl-xL的细胞显示了持续高细胞活力。表18和19总结了在过表达Bcl-xL的细胞中差异表达为至少1.2倍的核酸。在多个时间点取样样品进行比较。表18总结了在第5天差异表达至少1.2倍的核酸。表19总结了在笫5天之后的阶段差异表达至少1.2倍的核酸。<table>tableseeoriginaldocumentpage79</column></row><table><table>tableseeoriginaldocumentpage80</column></row><table><table>tableseeoriginaldocumentpage81</column></row><table><table>tableseeoriginaldocumentpage82</column></row><table><table>tableseeoriginaldocumentpage83</column></row><table><table>tableseeoriginaldocumentpage84</column></row><table><table>tableseeoriginaldocumentpage85</column></row><table><table>tableseeoriginaldocumentpage86</column></row><table><table>tableseeoriginaldocumentpage87</column></row><table><table>tableseeoriginaldocumentpage88</column></row><table><table>tableseeoriginaldocumentpage89</column></row><table><table>tableseeoriginaldocumentpage90</column></row><table><table>tableseeoriginaldocumentpage91</column></row><table>实施例10.平台分析根据平台方法分类分析了当培养于分批补料培养物时具有期望代谢表型的四种细胞系。就是说,在分批补料培养晚期细胞系维持高活力并消耗乳酸和氨。对于在分批补料培养物中生长的每种细胞系收集多个时间点样品。用ANOVA分析研究各细胞系各时间点的样品来监测在培养期间的基因表达的变化。比较来自各细胞系的基因列表,并鉴定出那些在所有4种细胞系中共有的基因。表20列出了例示性的核酸序列。<table>tableseeoriginaldocumentpage93</column></row><table><table>tableseeoriginaldocumentpage94</column></row><table><table>tableseeoriginaldocumentpage95</column></row><table><table>tableseeoriginaldocumentpage96</column></row><table>实施例11.乾标-验证s说A^t通过使用本领域已知的方法过表达抑制相关基因表达的核酸验证了差异表达的基因及蛋白质影响细胞表型的能力。下面描述了基于干扰RNA构建体的例示性方法。通常,测序作为siRNA介导的基因敲低候选物的靶标并证实序列。优选(尽管不必要)利用全长cDNA序列信息以便于siRNA设计。作为基因敲低候选物的靶序列与公共或专利数据库可得的基因序列相比较(例如BLAST搜索)。在靶基因内与其他已知序列重叠(例如同源的16-17个连续碱基对)的序列一般不适于做特异性siRNA介导的基因敲低的靶标。例如,可以使用在安全网络连接上的在线设计工具例如在Ambion网站師D:〃www.ambion.com/techlib/misc/siRNAfmder.html)上可用的工具来设计siRNA。可选地,还可以自Ambion(其应用Cenix算法来设计有效的siRNA)索取定制的siRNA。标准的siRNA通常是5nmol、退火并在板中具有标准纯度的形式。当收到合成的siRNA时,依照制造商提供的指导来制备siRNA并储存在适宜的温度(-20。C)。使用标准方法来进行siRNA转染。通常待转染的细胞在转染前一天预传代来保证细胞处于对数生长期。通常,使用siRNA分批补料测定。转染的例示性材料、条件和方法如下转染(第0天)每个离心管(50ml)100fiLRl2uLTransit-TKO转染试剂(Minis)10jiL10fiMsiRNA2mLle5细胞/mL,于AS1培养基中97转染之后37C:72hrs31。C:96hrs加入AQ3,在笫3天(D3)在第1天(Dl)、第3天(D3)、第7天(D7)取样W^老浮脊袭对于各实验,使用1mL总体积的100,000个细胞(如3C7细胞)和50nMsiRNA。为制备用于3份反应的混合物,混合150jiLRl和70jiLMinisTKO试剂并在室温醉育10分钟。加入15fiL10siRNA并在室温孵育混合物10分钟。向3个孔中分别转入57.3jiL混合物。加入942.7fiLR5CD1(含100,000个细胞)板在37。C摇床上孵育72小时。庠心f^/7A^脊染对于各实验,使用imL总体积的100,000个细胞(如3C7细胞)。对每份转染,混合100nLRl和2nLMirusTKO试剂,并在室温孵育10分钟。加入10pL10jiMsiRNA并在室温孵育混合物15分钟,偶尔混合。向各离心管中转入1.9mL培养物。向各离心管内加入siRNA混合物(112HL)。先在37。C孵育培养物,在第3天改变温度到31°C。快速振荡(约250RPM)离心管培养物。在第l、3和7天取样。在第7天终止培养。每一块板上都包括生长和生产力对照。例示性的生产力对照是DHFR(双顺反子mRNA选择性标记)。以DHFRsiRNA处理可重复地降低了CM-FcIGEN(抗体生产对照)中的抗体量。例示性的生长对照是CHOI(驱动蛋白)(见Matuliene等(2002)Mol.Cell.Biol.13:1832-45)(通过,以CHOI处理观察到大约20-30%的生长抑制)。还纳入了其他标准对照,例如无siRNA处理(只有转染试剂)和非寻靶siRNA处理(非特异性siRNA)。然后对板进行细胞计数(例如,在96孔细胞计数器中)以评估生长,和例如在自动化96孔滴度测定中来评估生产力。由此验证了经单独98或组合调节足以改变有益细胞表型的基因,并且能够在哺乳动物细胞系单独或组合地设计此类变化,以改变其特性。表21显示了用于验证目的的模式细胞系及它们的特征。图143-146总结了以离心管形式评价的3C7细胞系中的一些靶基因。评价的靶基因包括DM9(WAN013I8K),如上文所述鉴定为在具有升高的生长率的细胞中上升;EIF4B,如上文所述鉴定为在具有升高的生长率的细胞中上升;HSP27(HSPB1),如上文所述鉴定为在具有升高生长率的细胞中上升;MCP1(CCL2),如上文所述鉴定为在具有高细胞密度的细胞中降低;NAAT1(SLC1A4),如上文所述鉴定为具有升高的生长率的细胞中降低;MMD1(芊果酸脱氢酶),如上文所述鉴定为在具有高最大细胞生产力的细胞中降低;MATF-4(ATF-4),如上文所述鉴定为在具有高细胞密度的细胞中上升;及SCoA连接酶(suclg2),如上文所述鉴定为在具有高细胞密度的细胞中上升。如图143所示,对于鉴定为在具有升高生长率细胞中上升的基因,抑制所述基因导致了相对于对照的生长抑制。如图144所示,细胞生产力一般不会受到对等的影响。表21.细胞系和其特征<table>tableseeoriginaldocumentpage99</column></row><table>通过使用本领域已知的方法过表达编码相关基因表达的核酸确证了差异表达基因和蛋白质影响细胞表型的能力。下面描述了例示性的方法。例如,通过瞬时转染将过表达特定靶标的核酸引入到CHO细胞中,接着监测过表达对于细胞生长和生产力的影响。图147和148说明了24孔方式的例示性方案。一般使用生长和生产力对照进行过表达测定。例如,在此实验中所使用的的阳性生长/活力对照包括Ha-Ras和Bcl-xL。使用的阴性生长对照包括p27。其他适合的生长和生产力对照为本领域公知,且能用于过表达测定。还纳入了额外的标准对照如无核酸对照(只有转染试剂)。如表22所示,克隆耙基因和对照基因到pExpressl载体内并引入不同的模式细胞系中。表22.用于分析的细胞系及其特征克隆特征1.18中间水平5C10中间水平DE-6中间水平DD画ll中间水平1.14HCGR,持续高活力、非持续高Qp、非低NH4、非高细胞密度2.8高最大Qp、持续高Qp3B12高最大Qp、持续高Qp、高细胞密度、低乳酸DA-4非HCGR、非高细胞密度5B5非持续高Qp、非低乳酸2B6非高细胞密度、非高最大Qp使用24孔方式以区分不同基因瞬时转染对不同细胞系的表型效应。对细胞生长和生产力进行了测定。图149-151图解了例示性结果。发现结果通常具有代表性并可重复。在表23中总结了例示性的过表达结果。表23.过表达分析的总结<table>tableseeoriginaldocumentpage101</column></row><table>NA=未测或结果待定(***)强烈地增加或减少(**)增加或减少_(*)适度增加或减少实施例13.基于证实的靶基因来工程化细胞系以改进细胞表型使用经证实的靶基因来影响细胞表型,特别是以增加和有效生产重组转基因、增加细胞生长率、高峰值细胞密度、持续高细胞活力、高最大细胞生产力、持续高细胞生产力、低氨产量和低乳酸产量等为特征的表型。上文例如表2-20和表24-30公开了例示性的靶基因。<table>tableseeoriginaldocumentpage102</column></row><table>WAN0OSD6R_at(SEQIDNO:1604)TMED4跨膜emp24含蛋白转运结构域4Hs.5隨5IE"II9173.7Mm.254495IE-1409286.6下调转运蛋白;未知功能WAN008DMI_at(SEQIDNO:1610)ACSL5跌基辅酶A合成酶长链家族成员5Hs.U6388596.6卿A09099—6上调脂生物合成;脂肪酸降解WAN008DWJat(SEQIDNO:USP1类似于泛素特异性蛋白酶1Hs.3508609397Mm.37,09496-5上调去泛素化酶WA,8e5l一at溶解栽体家族i(中性氨基酸转运蛋(sb:qmNo:l619)slc1a5白),成员5Hs.5154948E-428445.6Mm.10561e-11588s3.3上调氨基酸转运蛋白WAN008E9N—at(SEQIDMO:〖620)KLHL7Kelch样7(杲绳)Hs.3纖lIE-1508999.4Mm.27376809389.1下调未知功能WAN008EBP—at(SEQIDNO:r621)Sqstml隔离体i應蛋白fO^^/"e/rf-/flfc(^病,Hs-529靴09397.8Mm.4082809397.8下调泛素相关蛋白质股卿犯仍a.(7w歸'flnStra"他/sS"c/ww&《/"祭合症,WAN008ELE—at/VM>及命&家^关弒症J9E-458734.8M肌糾州57.2T调(SEQIDNO:〖626)PSATI磷酸丝氨酸氨基转移酶1Hs.4942617E-279316.2Mm.2899365E-708858.2上调丝氨酸生物合成WAN008EM4—atARHGAP1(SEQIDNO:1627)8RhoGTP酶激活蛋白IS化1098597-9Mm.3564961E-14788100下调未知功能WAN008EOB_at(SEQIDNO:1629)NOLI核仁蛋白1,120kDaHs.5343348E-489042.5Mm.29203IE-I208792.2上调细胞周期进行WAN008ERI_at(SEQIDNO:632)FNBP3形成素结合蛋白3Hs.2987354E-819798.9Mm.2574742E-9499100下调mRNA前体加工WANOO犯RP一at(SEQEDNO:r634)皮屑蛋白样IHs.374191IE-458792.8Mm.326柳1E-688994下调细胞增殖的负调控()WAN00犯UO一at(SEQIDNO:1635)LPL脂蛋白酯酶Hs.圆782E-828874.1Mm.15141E-U39274J下调甘油醋代谢在新测试中同源物,但在WAN008F1P—x_at多数情况下+/-,并且这(SEQIDNO:1^37)NA1U65A-A01,A下调些没有任何同源性WAN013HW0—x—at显示为线粒体的多顺反(SEQIDNO:l^fO)NA包括WAN008CO310600D-F02的聚簇#N/A#N/A上调mRNA!!!WAN013HXS丄at(SEQIDNO:l&O)E〖F4A2真核翻译起始因子4A,同工酶2Hs478553IE-15596100Mm.2600841E-I55%100下调翻译起始WAN013IlU一x—at(SEQrDNO「lf48)NA包括WAN008BLL11233C-H10的聚簇#N/A2E-05927.71WA1E-05927.71上调WAN01312T_at色原体同源物5(HPIalpha同源物,(SEQIDNO:1652)CBX5果蝇JHs.3492S31E-1429272Mm262059iE-1689572上调染色质结合WAN013I6J—s—at氨基甲酰4l酸合成酶2,天门冬氨酸转(SEQIDNO:1^57)CAD氨甲酰酶,及二氢乳清酸酶Hs.37701009199.5Mm.30553509499.5上调嘧啶生物合成WAN013I8X—at(SEQIDNO:l66i)HSPD1热休克60kDa蛋白1(伴侣蛋白)Hs.1136840卯99.8Mm.177709399.8上调分子伴侣WAN013I9Z—at(SEQIDNO:1664)GNAS乌嗜呤核苷结合蛋白alpha刺激性Hs.125898Mm.12577009441.1下调细胞生长WANOI3I9F_at(SEQIDNO:1662)HSPA犯热休克蛋白9AHs掘2333E-299218.7Mm.2094192E-729144-8上调细月包增殖小鼠合格者名录符号名称人UnigeneIDe值%QCUnigeneIDe值%1D%QCFC功能gi|34853001Uaplll推测的类似于UDP-N-乙酰葡糖胺焦磷酸酶卜样1Mm.33797-2.22<formula>formulaseeoriginaldocumentpage104</formula><table>tableseeoriginaldocumentpage105</column></row><table><formula>formulaseeoriginaldocumentpage106</formula><table>tableseeoriginaldocumentpage107</column></row><table><table>tableseeoriginaldocumentpage108</column></row><table><table>tableseeoriginaldocumentpage109</column></row><table><table>tableseeoriginaldocumentpage110</column></row><table><table>tableseeoriginaldocumentpage111</column></row><table><table>tableseeoriginaldocumentpage112</column></row><table><table>tableseeoriginaldocumentpage113</column></row><table><table>tableseeoriginaldocumentpage114</column></row><table><table>tableseeoriginaldocumentpage115</column></row><table><table>tableseeoriginaldocumentpage116</column></row><table><table>tableseeoriginaldocumentpage117</column></row><table><table>tableseeoriginaldocumentpage118</column></row><table><table>tableseeoriginaldocumentpage119</column></row><table>此页无内容表26.高度优先考虑基因列表3<table>tableseeoriginaldocumentpage121</column></row><table><table>tableseeoriginaldocumentpage122</column></row><table><table>tableseeoriginaldocumentpage123</column></row><table><table>tableseeoriginaldocumentpage124</column></row><table><table>tableseeoriginaldocumentpage125</column></row><table><table>tableseeoriginaldocumentpage126</column></row><table><table>tableseeoriginaldocumentpage127</column></row><table>表29.LLP2+4测试特异性1.2倍上调<table>tableseeoriginaldocumentpage128</column></row><table><table>tableseeoriginaldocumentpage129</column></row><table><table>tableseeoriginaldocumentpage130</column></row><table>使用标准细胞工程方法修饰靶基因来实现期望的细胞表型。如上文所讨论的那样,通过干扰RNA、传统基因敲除或过表达方法修饰靶基因来获得期望的CHO细胞表型。通常,使用敲除方法或用过表达构建体稳定转染的方法来改造修饰的CHO细胞系。其他适当的方法在概述部分有所讨论,并为本领域所公知。本发明前述内容提供了举例说明和描述,但并非旨在穷举或将本发明精确局限为所公开的内容。可以按照上述教导进行修改和变动,或可以通过实施本发明而实现。因而,应指出本发明的范围由权利要求书及其等同方案限定。引入作为参考在本申请中引述的所有序列登录号、出版物和专利文献为了所有的目的以其整体引入作为参考,就如同每一单独出版物或专利文献的内容分别在此引入一样。13权利要求1.用于鉴定调控或指示细胞系细胞培养表型的蛋白质的方法,所述方法包括生成来自测试细胞系样品的蛋白质表达谱;将蛋白质表达谱和来自对照细胞系的对照谱相比较;和基于比较鉴定一个或多个差异表达的蛋白质,其中测试细胞系的细胞培养表型与对照细胞系不同,并且一个或多个差异表达的蛋白质能够调控或指示细胞培养表型。2.权利要求l的方法,其中细胞系是中国仓鼠卵巢(CHO)细胞系。3.权利要求l的方法,其中细胞培养表型是细胞生长速率、细胞生产力、峰值细胞密度、持续细胞活力、氨生产或消耗速率或乳酸生产或消耗速率。4.权利要求3的方法,其中细胞培养表型是最大细胞生产力。5.权利要求3的方法,其中细胞培养表型是持续细胞活力。6.权利要求3的方法,其中细胞培养表型是峰值细胞密度。7.权利要求3的方法,其中细胞培养表型是细胞生长速率。8.权利要求l的方法,其中通过荧光二维差异凝胶电泳生成蛋白质表达谦。9.用于改进细胞系的方法,所述方法包括上调依照权利要求l的方法所鉴定的一个或多个蛋白质。10.用于改进细胞系的方法,所述方法包括通过过表达来上调依照权利要求1的方法所鉴定的一个或多个蛋白质。11.用于改进细胞系的方法,所述方法包括下调依照权利要求1的方法所鉴定的一个或多个蛋白质。12.权利要求11的方法,其中所述方法包括通过RNA干扰来下调依照权利要求1的方法所鉴定的一个或多个蛋白质。13.用于改进细胞系的细胞生产力的方法,所述方法包括上调依照权利要求1的方法所鉴定的一个或多个蛋白质。14.用于改进细胞系的细胞生产力的方法,所述方法包括下调依照权利要求1的方法所鉴定的一个或多个蛋白质。15.用于改进细胞系的细胞生产力的方法,所述方法包括调节选自表2、3、9、10、11和12的一个或多个基因或蛋白质。16.用于改进细胞系的细胞生产力的方法,所述方法包括调节依照权利要求4的方法所鉴定的一个或多个蛋白质。17.用于改进细胞系的细胞生长速率的方法,所述方法包括调节选自表4、5、6、13、14、27和28的一个或多个基因或蛋白质。18.用于改进细胞系的细胞生长速率的方法,所述方法包括调节依照权利要求7的方法所鉴定的一个或多个蛋白质。19.用于增加细胞系的峰值细胞密度的方法,所述方法包括调节选自表8、15、16和17的一个或多个基因或蛋白质。20.用于增加细胞系的峰值细胞密度的方法,所述方法包括调节依照权利要求6的方法所鉴定的一个或多个蛋白质。21.用于增加细胞系的持续细胞活力的方法,所述方法包括调节选自表7、18和19的一个或多个基因或蛋白质。22.用于增加细胞系的持续细胞活力的方法,所述方法包括调节依照权利要求5的方法所鉴定的一个或多个基因或蛋白质。23.用于改进细胞系的方法,所述方法包括调节选自表20、24、25和26的一个或多个基因。24.用于调节细胞系中乳酸生产或消耗速率的方法,所述方法包括调节选自表29和30的一个或多个基因。25.用于改进细胞系的方法,所述方法包括上调或下调至少两种基因或蛋白质,其中第一基因或蛋白质影响第一细胞培养表型,而第二个基因或蛋白质影响不同的第二细胞培养表型,其中细胞培养表型选自细胞生长速率、细胞生产力、峰值细胞密度、持续细胞活力、氨生产或消耗速率、或乳酸生产或消耗速率。26.权利要求M的方法,还包括上调或下调影响不同于第一和第二细胞培养表型的第三细胞培养表型的第三基因或蛋白质。27.评估细胞系的细胞培养表型的方法,所述方法包括检测细胞培养物样品中依照权利要求i所鉴定蛋白质的表达水平;和将表达水平和参照水平相比较,其中比较指示细胞培养表型。28.评估细胞系的细胞培养表型的方法,所述方法包括检测细胞培养物样品中指示细胞培养表型的一个或多个标记,其中所述标记从由选自图7到138的肽、选自表2到8的蛋白质、及选自表9到20和24到30的基因的基因表达产物组成的组中选择。29.具有改进的细胞培养表型的工程细胞系,其包含工程细胞群,各工程细胞包含上调或下调依照权利要求1所鉴定的一个或多个蛋白质的工程构建体。30.具有改进的细胞生产力的工程细胞系,包含工程细胞群,各工程细胞包含上调或下调选自表2、3、9、10、11和12的一个或多个基因或蛋白质的工程构建体。31.权利要求30的工程细胞系,其中工程构建体是过表达构建体。32.权利要求30的工程细胞系,其中工程构建体是干扰RNA构建体。33.具有改进的细胞生长速率的工程细胞系,包含工程细胞群,各工程细胞包含上调或下调选自表4、5、6、13、14、27和28的一个或多个基因或蛋白质的工程构建体。34.权利要求33的工程细胞系,其中工程构建体是过表达构建体。35.权利要求33的工程细胞系,其中工程构建体是干扰RNA构建体。36.具有改进的峰值细胞密度的工程细胞系,包含工程细胞群,各工程细胞包含上调或下调选自表8、15、16和17的一个或多个基因或蛋白质的工程构建体。37.权利要求36的工程细胞系,其中工程构建体是过表达构建体。38.权利要求36的工程细胞系,其中工程构建体是干扰RNA构建体。39.具有改进的持续细胞活力的工程细胞系,包含工程细胞群,各工程细胞包含上调或下调选自表7、18和19的一个或多个基因或蛋白质的工程构建体。40.杈利要求39的工程细胞系,其中工程构建体是过表达构建体。41.权利要求39的工程细胞系,其中工程构建体是干扰RNA构建体。42.具有调节的乳酸生产或消耗的工程细胞系,所述工程细胞系包含工程细胞群,各工程细胞包含上调或下调选自表29和30的一个或多个基因的工程构建体。43.权利要求42的工程细胞系,其中工程构建体是过表达构建体。44.权利要求42的工程细胞系,其中工程构建体是干扰RNA构建体。45.改进的细胞系,其包含工程细胞群,各工程细胞包含上调或下调选自表20、24、25和26的一个或多个基因或蛋白质的工程构建体。46.权利要求45的工程细胞系,其中工程构建体是过表达构建体。47.权利要求45的工程细胞系,其中工程构建体是干扰RNA构建体。48.用于表达目的蛋白质的方法,所述方法包括步骤向权利要求29的工程细胞系中引入编码目的蛋白质的核酸;和收获目的蛋白质。49.分离或重组的核酸,其包含选自表9、13和15的CHO序列。50.分离或重組的蛋白质,其包含选自表2和4的CHO序列。全文摘要本发明提供了通过表达谱分析来系统鉴定最大化蛋白质表达和分泌的基因和蛋白质及相关通路的方法。本发明还提供了操纵所鉴定的基因和蛋白质来工程化改进的细胞系的方法。文档编号G01N33/50GK101479601SQ200780022890公开日2009年7月8日申请日期2007年4月21日优先权日2006年4月21日发明者D·L·迪尼诺,K·M·麦卡锡,K·安德森,K·科佩钦斯基,M·S·西纳科雷,M·伦纳德,M·克莱因斯,M·迈维勒,N·巴龙,P·加梅尔,P·杜兰,P·米莱蒂,T·沙勒布瓦申请人:惠氏公司;都柏林城市大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1