CN107075549B - 重组蛋白的高效选择性 - Google Patents

重组蛋白的高效选择性 Download PDF

Info

Publication number
CN107075549B
CN107075549B CN201580044100.7A CN201580044100A CN107075549B CN 107075549 B CN107075549 B CN 107075549B CN 201580044100 A CN201580044100 A CN 201580044100A CN 107075549 B CN107075549 B CN 107075549B
Authority
CN
China
Prior art keywords
leu
gene
phe
ile
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580044100.7A
Other languages
English (en)
Other versions
CN107075549A (zh
Inventor
D·德什潘德
D·布拉科夫
陈刚
J·凡德尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Priority to CN202110402963.4A priority Critical patent/CN113293139A/zh
Publication of CN107075549A publication Critical patent/CN107075549A/zh
Application granted granted Critical
Publication of CN107075549B publication Critical patent/CN107075549B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/005Glycopeptides, glycoproteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/30Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/02Cells for production
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供一种新的表达***,所述表达***包含促进糖蛋白的所需翻译后修饰的哺乳动物选择性标记。具体地讲,本发明包括通过采用以哺乳动物来源的GPT基因为基础的选择标记***在哺乳动物细胞中实现最佳重组蛋白表达的方法和组合物。本发明包括在哺乳动物细胞中促进重组蛋白的选择性以及增加表达拷贝和蛋白产率的方法,和使用GPT表达***的方法。

Description

重组蛋白的高效选择性
背景技术
序列表
本申请以引用方式并入以计算机可读形式提交的序列表,该序列表于2015年8月3日创建为文件8700WO_ST25.txt(75,769字节)。
技术领域
本发明提供重组蛋白在哺乳动物细胞中以一致和高效的方式表达。具体地讲,本发明包括通过采用哺乳动物选择标记在哺乳动物细胞中实现改善的蛋白表达的方法和组合物。本发明包括在哺乳动物细胞中促进重组蛋白的选择性以及增加表达拷贝数和蛋白产率的方法,和使用此类表达***的方法。
相关领域说明
细胞表达***的开发是提供用于研究和治疗用途的可靠且高效的给定蛋白来源的重要目标。由于例如哺乳动物表达***对重组蛋白进行适当的翻译后修饰的能力,哺乳动物细胞中的重组蛋白表达就制备治疗性蛋白而言通常是优选的。
有多种载体可用于在哺乳动物宿主中表达,它们各自含有使得能够在细胞培养期间容易地分离表达重组蛋白的细胞的选择标记。在此类***中利用选择性标记基因(SMG),原因是它们为表达所关注蛋白的细胞赋予选择性优势,然而,SMG必须就其表型中性、高效性和多能性等原因进行优化。
尽管有许多宿寄SMG的载体和表达***可用,但在哺乳动物***中实现的重组蛋白的表达无论在数量还是质量还是这两者上通常都无法令人满意。分子的生物“指纹”(例如翻译后修饰,比如糖基化)在开发重组蛋白治疗剂中在限定分子的实用性和功效方面尤为重要(Cumming,D.A.,1990,Glycobiology,1(2):115-130)。对表达的所关注蛋白的生物性质不会有负面影响的SMG是特别有利的。
大多数SMG为细菌来源的,且由于日渐担忧细菌抗生素抗性基因对环境细菌的横向转移风险,就用于哺乳动物***而言带来其他缺点(Breyer,D.等人,2014,CriticalReviews in Plant Sciences 33:286-330)。取消使用细菌抗生素抗性基因可能对于消费者认可和减轻此类感知风险具有积极作用。
基因工程化的自体细胞在临床上快速取得成功(参见例如Kershaw,M.H.等人,2013,Nature Reviews:Cancer 13:525-541)。对用于人类自体细胞产物中的基因修饰的载体的选择和设计是至关重要的,特别是因为将非人类组分不希望地引入人类自体细胞可能对患者的安全具有严重后果(Eaker等人2013,Stem cells Trans.Med.2:871–883;最先在2013年10月7日在线发表于SCTMEXPRESS)。仅具有哺乳动物来源而非细菌来源的组分的载体***就用于过继性免疫治疗的患者特异性T细胞而言将是有利的。
因此,期望引入哺乳动物选择性基因,特别是在用于产生所关注的哺乳动物蛋白的表达***中为转化的细胞提供表型或代谢优势的那些基因。此外,可靠地表达足够高水平的治疗性蛋白并对该治疗性蛋白进行适当且一致的翻译后修饰的细胞系是高度期望的。因此,在本领域中需要改善的哺乳动物表达***。
发明内容
使用哺乳动物衣霉素(Tn)抗性基因作为哺乳动物表达***中的选择性标记可增加转染子的效率和拷贝数。已观察到,可操作地连接到所关注基因的Tn抗性基因的使用对哺乳动物细胞群产生选择性压力,从而增加转染子(即所关注基因)的随机整合。应当理解,选择性标记***可促进所需转染子的选择,然而本发明的方法赋予所关注基因的效率和随机整合出人意料的增加,以及赋予所需蛋白可靠的生物质量。因此本发明的组合物和方法使得可以实现对所表达蛋白的质量上良好的翻译后修饰的有利选择。
在一个方面,本发明提供包括哺乳动物衣霉素(Tn)抗性基因的分离的细胞,所述基因编码与SEQ ID NO:3氨基酸序列具有至少93%同一性的蛋白,所述基因可操作地连接到所关注基因(GOI)和至少一个调控元件。
在另一个方面,本发明提供制备重组的所关注蛋白(POI)的方法,其中该方法包括:提供编码核酸分子的哺乳动物宿主细胞,所述核酸分子包含(i)哺乳动物衣霉素(Tn)抗性基因和(ii)编码该POI的基因;在第一浓度的Tn存在下培养该细胞;分离表达Tn抗性基因的至少一个拷贝的细胞群;在增加浓度的Tn存在下培养该细胞群,其中增加Tn的浓度增加POI的产生;以及从细胞培养中分离该POI。
在又一个方面,本发明提供使N-聚糖蛋白底物糖基化的方法,其中该方法包括:提供编码核酸分子的哺乳动物宿主细胞,所述核酸分子包含可操作地连接到编码需要糖基化的蛋白底物的基因的哺乳动物衣霉素(Tn)抗性基因;在第一浓度的Tn存在下培养该细胞;分离表达Tn抗性基因的至少一个拷贝的细胞群;在增加浓度的Tn存在下培养该细胞群,其中增加Tn的浓度增加POI的产生;以及从细胞培养中分离该蛋白底物。
在所述方法的一些实施方案中,该Tn抗性基因可操作地连接到编码POI的基因,且该编码POI的基因可操作地连接到至少一个调控元件。
在一些实施方案中,该Tn抗性基因外源性添加到细胞。在其他实施方案中,该Tn抗性基因编码与SEQ ID NO:3的氨基酸序列具有至少93%同一性的蛋白。在其他实施方案中,该Tn抗性基因编码与SEQ ID NO:3的氨基酸序列具有至少94%同一性的蛋白。在一些实施方案中,该Tn抗性基因编码与SEQ ID NO:4的氨基酸序列具有至少93%同一性的蛋白。在另外其他实施方案中,该Tn抗性基因编码与SEQ ID NO:4的氨基酸序列具有至少94%同一性的蛋白。
在一些实施方案中,该哺乳动物Tn抗性基因包括中国仓鼠(Cricetulus griseus)Tn抗性基因。在其他实施方案中,该哺乳动物Tn抗性基因包括人类Tn抗性基因。
Tn抗性基因还可包括选自以下的核酸序列:SEQ ID NO:2、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17。
在前述发明的某些实施方案中,该哺乳动物Tn抗性基因包括与SEQ ID NO:2的核酸序列具有至少92%同一性的核酸序列。在一些实施方案中,该哺乳动物Tn抗性基因包括与SEQ ID NO:12的核酸序列具有至少92%同一性的核酸序列。
在本发明的分离的细胞中提供可操作地连接到Tn抗性基因的至少一个调控元件,其中该调控元件包括但不限于启动子、核糖体结合位点和增强子。在又一个实施方案中,该GOI可操作地连接到启动子。在另一个实施方案中,该GOI可操作地连接到核糖体结合位点,诸如IRES。
在一些实施方案中,本发明的分离的细胞和方法还包括第二所关注基因(GOI),而该GOI编码所关注蛋白(POI)。在一个实施方案中,该所关注基因(GOI)为外源性添加的GOI。在另一个实施方案中,该外源性添加的GOI为人类基因。在又一个实施方案中,该调控元件为外源性添加的调控元件。
在其他实施方案中,该第一和/或第二GOI编码包括但不限于抗体重链、抗体轻链、抗原结合片段和/或Fc融合蛋白的POI。
在另一个实施方案中,该第一GOI和第二GOI独立地选自编码抗体轻链或其抗原特异性片段、抗体重链或其抗原特异性片段、Fc融合蛋白或其片段以及受体或其配体特异性片段的基因。在一个实施方案中,重组酶识别位点存在于第一GOI与第二GOI之间。在其他实施方案中,本发明还提供在第一GOI的5’的重组酶识别位点和相对于第二GOI在3’的重组酶识别位点。
在又一个实施方案中,该GOI编码选自抗体轻链或其抗原结合片段、抗体重链或其抗原结合片段、Fc融合蛋白或其片段、配体以及受体或其配体结合片段的糖蛋白。
本发明的分离的、非天然存在的细胞可衍生自真核细胞。在一个实施方案中,该细胞为哺乳动物细胞。在一些实施方案中,该分离的细胞为离体人类细胞。在其他实施方案中,该细胞选自:CHO(例如CHO K1、DXB-11 CHO、Veggie-CHO)、COS(例如COS-7)、淋巴细胞、干细胞、视网膜细胞、Vero、CV1、肾(例如HEK293、293 EBNA、MSR 293、MDCK、HaK、BHK21)、HeLa、HepG2、WI38、MRC 5、Colo25、HB 8065、HL-60、Jurkat、Daudi、A431(表皮的)、CV-1、U937、3T3、L细胞、C127细胞、SP2/0、NS-0、MMT细胞、肿瘤细胞以及衍生自前述细胞的细胞系。在某些实施方案中,本发明的分离的细胞为CHO-K1细胞、淋巴细胞、视网膜细胞或干细胞。
在一个实施方案中,第一浓度的Tn为1μg/mL。在另一个实施方案中,增加浓度的Tn包括第二和第三浓度的Tn。
在一些实施方案中,第二浓度大于第一浓度的Tn,而第三浓度大于第二浓度的Tn。在某些实施方案中,第二浓度的Tn为2.5μg/ml,而第三浓度为5μg/mL。
在另外其他实施方案中,增加浓度的Tn包括第二浓度的Tn,其中该第二浓度的Tn为2.5μg/ml或5μg/mL。
除非另有说明或上下文中显而易见,否则本发明的任何方面和实施方案可与本发明的任何其他方面或实施方案结合使用。
通过审阅接下来的详细说明,其他目标和优点将变得显而易见。
附图说明
图1说明用于将编码所关注基因(例如eGFP)的核酸序列引入细胞基因组中的克隆载体结构中的可操作表达盒的示意图。SV40启动子:猴病毒40启动子;GPT:GlcNAc-1-P转移酶(例如CHO-GPT,SEQ ID NO:2;或hGPT,SEQ ID NO:12);IRES:内部核糖体进入位点;eGFP:增强的绿色荧光蛋白;SV40polyA:猴病毒40polyA。
图2A至2C代表哺乳动物GPT氨基酸序列,即人类(GPT_HUMAN;UniProtKB登录号Q9H3H5;SEQ ID NO:4)、恒河猴(Rhesus macaque)(GPT_MACMU;UniProtKB登录号F6TXM3;SEQ ID NO:5)、黑猩猩(GPT_PANTR;UniProtKB登录号H2R346;SEQ ID NO:6)、狗(GPT_CANFA;UniProtKB登录号E2RQ47;SEQ ID NO:7)、豚鼠(GPT_CAVPO;UniProtKB登录号E2RQ47;SEQ ID NO:8)、大鼠(GPT_RAT;UniProtKB登录号Q6P4Z8;SEQ ID NO:9)和小鼠(GPT_MOUSE;UniProtKB登录号P42867;SEQ ID NO:10)相较于中国仓鼠(GPT_CRIGR;UniProtKB登录号P24140;SEQ ID NO:3)GPT氨基酸序列的比对。
图3A和3B举例说明可如何使用本发明的方法和组合物实现蛋白优化。图3A描绘从用1μg/mL衣霉素(Tn)培养的第一细胞池中选择阳性细胞转染子的方法。随后,以增加浓度的衣霉素(例如2.5μg/mL或5μg/mL)培养第二细胞,以增强蛋白表达。图3B描绘从用1μg/mL衣霉素(Tn)培养的第一细胞池中选择阳性细胞转染子的方法,然后连续地增加后续细胞培养中的Tn浓度以便优化蛋白表达。
图4A至4B经修饰的CHO细胞包括侧翼为lox位点的YFP基因。侧翼为lox位点的选择标记(抗生素抗性基因和eGFP)合并在YFP位点并经由靶向整合用Cre重组酶置换YFP。随机整合体既表达YFP也表达eGFP。图4A:用Cre重组酶载体和包括eGFP的hpt表达载体转染细胞;但培养中无潮霉素。图4B:用Cre重组酶载体和包括eGFP的hpt表达载体转染细胞;存在400μg/mL潮霉素。
图5A至5F显示代表衣霉素选择性的各种参数的FACS散点图。经修饰的CHO细胞包括侧翼为lox位点的YFP基因。侧翼为lox位点的选择标记(抗生素抗性基因和eGFP)合并在YFP位点并经由靶向整合用Cre重组酶置换YFP。随机整合体既表达YFP也表达eGFP。图5A:用Cre重组酶载体和包括eGFP的CHO-GPT表达载体转染细胞;但培养中无衣霉素。图5B:用Cre重组酶载体和包括eGFP的CHO-GPT表达载体转染细胞;存在1μg/mL衣霉素。图5C:用Cre重组酶载体和包括eGFP的CHO-GPT表达载体转染细胞;存在2.5μg/mL衣霉素。图5D:用Cre重组酶载体和包括eGFP的人类GPT表达载体转染细胞;但培养中无衣霉素。图5E:用Cre重组酶载体和包括eGFP的人类GPT表达载体转染细胞;存在1μg/mL Tn。图5F:用Cre重组酶载体和包括eGFP的人类GPT表达载体转染细胞;存在2.5μg/mL Tn。
图6A和6B显示GPT表达细胞池与非GPT表达池在其增强可操作地连接的GOI(诸如eGFP)的表达的相对能力方面的比较。图6A如下说明通过PCR就细胞池所测得的CHO-GPT的基因拷贝相对数:无Tn选择的Pool-49细胞(未添加外源性GPT);具有5μg Tn选择的Pool-49细胞(无外源性GPT);Pool-1细胞天然表达较高量的GPT(数据未显示),并在无Tn选择的情况下进行测试;无Tn选择的Pool-78细胞(无外源性GPT);表达外源性添加的hpt的CHO细胞和400μg/mL潮霉素选择;在1μg/mL Tn选择条件下表达外源性GPT的CHO细胞;从1μg/mL Tn选择池选择的表达外源性GPT的CHO细胞进一步在1μg/mL Tn中培养;从1μg/mL Tn选择池选择的表达外源性GPT的CHO细胞进一步在2.5μg/mL Tn中培养;从1μg/mL Tn选择池选择的表达外源性GPT的CHO细胞进一步在5μg/mL Tn中培养。图6B说明通过qPCR就相同的细胞池(如图6A)所测得的所关注基因eGPT的基因拷贝相对数目。
图7A至7D如下说明由细胞培养所产生的Fc融合蛋白1FcFP1)的糖型特征,图7A:使用标准方案的不表达GPT的CHO细胞(批次B10002M410),相较于图7B:表达CHO-GPT且无Tn选择的CHO细胞(批次110728)。图7C:表达CHO-GPT的且以1μg/mL Tn选择的CHO细胞(批次110728-01),相较于图7D:表达CHO-GPT的且以5μg/mL Tn选择的CHO细胞(批次110728-02)。各色谱图如下指出含有唾液酸化残基的级分:0SA=0个唾液酸残基;1SA=1个唾液酸残基;2SA=2个唾液酸残基;3SA=3个唾液酸残基;4SA=4个唾液酸残基。
图8说明从(A)批次B10002M410、(B)批次110728、(C)批次110728-01和(D)批次110728-02取样的Fc融合蛋白1(FcFP1)的叠加糖基化谱。从GPT批次中产生的各蛋白的糖基化谱(glycoprofile)与参比标准蛋白相容,且一致地产生主要的糖型种类。显然的是,相较于参比标准蛋白,在GPT批次中并未产生新的和独特的糖型种类。
具体实施方式
在描述本发明的方法前,应当理解,本发明不限于所述的特定方法和实验条件,因为此类方法和条件可以变化。还应当理解,本文所用的术语仅用于描述特定实施方案的目的,而无意进行限制,因为本发明的范围将仅由所附权利要求书限制。
如在该说明书和所附权利要求书中所用,除非上下文明确地相反指出,否则单数形式“一个”、“一种”和“该/所述”包括复数含义。因此,例如提及“一种方法”包括本文所述类型的和/或在阅读本公开后对本领域的技术人员将变得显而易见的一种或多种方法和/或一个或多个步骤。
除非另有定义或另有规定,否则本文所用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常理解的相同意义。
尽管与本文中描述的那些方法和材料类似或等同的任何方法和材料均可用于本发明的实践或检验,但现在描述特定的方法和材料。本文提及的所有出版物均以引用方式整体并入本文。
本领域中熟知的多种基因可向培养中的哺乳动物细胞赋予选择性表型。一般来讲,选择性标记基因表达蛋白,通常是在细胞培养中赋予对各种抗生素的抗性的酶。在某些选择条件下,可使表达荧光蛋白标记的细胞显现,并因此为可选择的。本领域的实例包括β-内酰胺酶(bla;β-内酰胺抗生素抗性基因或ampR;氨苄青霉素抗性基因)、bls(灭瘟素抗性乙酰转移酶基因)、潮霉素磷酸转移酶(hpt;潮霉素抗性基因)等。
本文所述的方法依赖于使用衣霉素以及能让细胞耐衣霉素而得以在细胞培养中生长的酶(标记)。衣霉素(Tn)为抗生素的混合物,其作为细菌和真核生物N-乙酰葡糖胺转移酶的抑制剂,从而防止N-乙酰葡糖胺脂质中间体的形成以及新合成的糖蛋白的糖基化。(King,I.A.和Tabiowo,A.,1981,Effect of tunicamycin on epidermal glycoproteinand glycosaminoglycan synthesis in vitro.Biochem.J.,198(2):331-338)。Tn具有细胞毒性,因为其特异性抑制UDP-N-乙酰葡糖胺:磷酸多萜醇N-乙酰葡糖胺-1-P转移酶(GPT),一种催化多萜醇连接的寡糖类的生物合成起始步骤的酶。在衣霉素的存在下,在内质网(ER)中制备的天冬酰胺连接的糖蛋白不被N-连接的聚糖糖基化,并因此在ER内可能无法正确折叠且因而可被分解(Koizumi等人1999,Plant Physiol.121(2):353–362)。因此,Tn是在细菌和真核细胞中导致细胞凋亡的值得注意的未折叠蛋白反应(UPR)的诱导物。
二磷酸尿苷GPT(也称为GlcNAc-1-P转移酶)的基因被鉴定为在某些细胞条件下过表达,以便于赋予对Tn的抗性(Criscuolo和Krag,1982,J Biol Chem,263(36):19796-19803;Koizumi等人,1999,Plant Physiology,第121卷,第353–361页)。编码GPT的基因(也描述为GenBank登录号M36899(SEQ ID NO:2))从耐Tn的中国仓鼠卵巢细胞系中分离出且编码408个氨基酸的蛋白(SEQ ID NO:3)(Scocca和Krag,1990,J Biol Chem 265(33):20621-20626;Lehrman,M.等人,1988,J Biol Chem 263(36):19796-803)。仓鼠GPT在酵母细胞(粟酒裂殖酵母(S.pombe))中过表达且在这些细胞中赋予Tn抗性;还提供方便的纯化GPT酶的来源(Scocca JR等人1995,Glycobiology,5(1):129-36)。在杂交瘤细胞(表达IgG的B细胞,相比静止期B细胞)中分析了GPT的转录水平,尽管观察到产IgG的细胞并未表现出升高水平的GPT转录或活性,但在从静止期过渡到活化的B细胞中看到了GPT的少量增加。结论是,GPT水平可与B细胞中对LPS(抗原)刺激的增殖反应的早期产生相对应(Crick,D.C.等人1994,JBiol Chem269(14):10559-65)。
此外,之前并不清楚,在有或无Tn存在下改变GPT的表达,在细胞表达***中是否对蛋白产物的糖基化有影响并因而影响产物质量。应当理解,最佳和一致的糖基化在制备治疗性糖蛋白中至关重要的蛋白属性。
本发明提供在哺乳动物细胞***中利用哺乳动物Tn抗性基因GPT作为可调节的选择标记来制备重组蛋白的改进方法,而可操作地连接到GPT的所关注基因增加的拷贝数与GPT表达盒增加的随机整合到细胞中相关。
本领域已认识到,制备治疗性蛋白特别是糖蛋白依赖于模拟此类蛋白的天然糖基化的哺乳动物型表达***。(有关综述,参见Bork,K.等人,2009,J Pharm Sci.98(10):3499-3508)。例如,某些糖蛋白的末端单糖(诸如N‐连接的复合聚糖)通常被唾液酸占据。唾液酸化可影响糖蛋白的药代动力学性质,诸如吸收度、血清半衰期和清除率或糖蛋白的其他物理化学或免疫原性性质。过表达的重组糖蛋白通常具有不完整或不一致的糖基化。可靠的方法对于在哺乳动物细胞系中产生的治疗性糖蛋白的工艺一致性和质量至关重要。
本发明还提供用于使重组蛋白糖基化的改进方法,即在哺乳动物细胞***中制备糖蛋白的方法,以便提供一致质量产率的所需的蛋白。
定义
DNA区当在功能上彼此相关时为可操作地连接的。例如,如果启动子能够参与序列的转录,则该启动子可操作地连接到编码序列;如果核糖体结合位点经定位成以便可以翻译,则该核糖体结合位点可操作地连接到编码序列。一般来讲,可操作地连接包括但不必须为邻近。就序列诸如分泌性前导序列而言,邻近且适当放置在阅读框中为典型的特征。增强生成的序列(诸如启动子)当与GOI功能上相关,例如其存在造成GOI的表达增加时,则可操作地连接到所关注基因(GOI)。
因此,短语“可操作地连接的”(诸如在DNA表达载体构建体的上下文中)控制序列(例如启动子或操纵子或标记)适当地位于相对于编码序列的某一位置,使得该控制序列指导或允许由该编码序列编码的所关注多肽/蛋白的产生。例如,当选择标记为细胞在某些培养条件下存活所必需的时,该所关注基因可操作地连接到该选择标记基因,因为在没有可操作的选择标记蛋白的存在下,表达将不会发生。
如本文所用的“启动子”是指足以指导其可操作地连接到的DNA序列转录的DNA序列,即其连接方式使得当适当的信号存在时,允许所关注基因和/或选择标记基因转录。基因的表达可置于本领域已知的任何启动子或增强子元件的控制下。
在本发明的上下文中的“表达载体”可以是任何适合的载体,包括染色体、非染色体和合成的核酸载体(包括一组适合的表达控制元件的核酸序列)。此类载体的实例包括SV40的衍生物、细菌质粒、嗜菌体DNA、杆状病毒、酵母质粒、衍生自质粒和嗜菌体DNA组合的载体、以及病毒核酸(RNA或DNA)载体。在一个实施方案中,编码Fc融合蛋白或多肽的核酸分子包括在裸DNA或RNA载体(包括例如线性表达元件(如描述于例如Sykes和Johnston,1997,Nat Biotech12,355-59中))、紧凑的核酸载体(如描述于例如US6,077,835和/或WO00/70087中)或质粒载体诸如pBR322、pUC 19/18或pUC 118/119中。此类核酸载体及其用法是本领域熟知的(参见例如US5,589,466和US5,973,972)。
如本文所用的“操纵子”是指这样的DNA序列,其引入基因中或基因附近的方式使得该基因可通过将阻遏蛋白与该操纵子结合而调控,并因此防止或允许GOI(即编码所关注多肽或蛋白的核苷酸)的转录。
核糖体结合位包括“内部核糖体进入位”(IRES)或可包括5’帽。许多IRES序列是本领域熟知的。IRES代表翻译控制序列,其中IRES位点通常位于所关注基因的5’,并使得以帽非依赖性方式翻译RNA。经转录的IRES可直接结合核糖体亚单位,以使得mRNA起始密码子的位置在核糖体中适当地取向以进行翻译。IRES序列通常位于mRNA的5’UTR中(起始密码子的正上游)。IRES在功能上取代对各种与真核生物翻译机制相互作用的蛋白因子的需求。
术语“增强的”或“改善的”当用于描述蛋白表达时包括由本发明的表达***或方法产生的蛋白(即基因产物)的量和/或质量一致性的增加。因此,这包括相比通常通过随机整合到基因组中所观察到的结果,例如相较于使用另一种选择性标记构建体的整合体池,在表达上增加至少约1.5倍至增加至少约3倍。因此,将所关注蛋白所观察到的表达增加倍数与在不存在包括GPT基因的本发明表达盒或细胞的情况下,或在存在包括不同选择性标记的表达盒或细胞的情况下,在基本上相同条件下测得的相同基因的表达水平进行比较。表达增加还可通过所产生的随机整合事件的数量来测量。增加的重组效率包括基因座重组能力的增强(例如,采用重组酶识别位点)。增强是指相比随机重组而言的可测量效率,随机重组通常为0.1%。在某些条件下,增强的重组效率是随机的大约10倍,或约1%。除非规定,否则受权利要求书保护的发明不限于特定的重组效率。表达增强也可通过所产生的基因拷贝数来测量,如通过定量聚合酶链式反应(qPCR)或其他熟知的技术来测量。
增强或改善的产物还指更一致的质量,例如通过本发明的GPT表达***所观察到的翻译后修饰。一致的质量包括例如在重复的生产线后具有所需的糖基化谱。一致性就质量而言是指均匀性和标准化程度,而重复的生产批次基本上无变化。在本文中教导了计算用以度量一致性的Z数。用于度量一致性的其他统计指标是本领域已知的。
短语“选择压力”是施加给活的生物体(例如细胞)或***(例如表达***)的力或刺激,其改变该活的生物体或***在给定环境中的行为和存活(例如存活能力)。
短语“基因扩增”表示基因序列的相同拷贝的数目的增加。某些细胞过程的特征在于产生一种或多种特定基因的多个拷贝,其扩增该基因赋予细胞的表型,例如抗生素抗性。
当关于表达盒采用短语“外源性添加的基因”或“外源性添加的GOI”时,该短语是指不存在于自然界中发现的细胞基因组内的任何基因,或整合至该基因组中(该基因组内的不同的基因座中)的另外的基因拷贝。例如,CHO基因组内的“外源性添加的基因”(例如选择性标记基因)可为并非在自然界中在特定CHO基因座内发现的仓鼠基因(即,来自仓鼠基因组中的另一基因座的仓鼠基因)、来自任何其他物种的基因(例如人类基因)、嵌合基因(例如人/小鼠),或者可以为并非在自然界中在CHO基因组内发现的仓鼠基因(即与来自仓鼠基因组中的另一基因座的基因具有低于99.9%同一性的仓鼠基因),或并非在自然界中发现存在于CHO天然基因组内的任何其他基因。
随机整合事件不同于靶向整合事件,而将基因***细胞的基因组在随机整合事件中并非位点特异性的。靶向整合的实例是同源重组。随机(非同源)整合表示所产生的整合体的位置(基因座)并非已知的或指定的。随机整合被认为通过非同源末端接合(NHEJ)发生,然而并不限于该方法。
选择效率表示表达选择性标记且适当时表达在选择性标记控制下的所关注蛋白的存活细胞的群体百分比。
百分比同一性当描述Tn抗性蛋白时意在包括沿着邻接的同源区展示出所述同一性的同源序列,但在相比较的序列中不具有同源性的间隙、缺失或***的存在不纳入百分比同一性的计算中。在该上下文中在解释“百分比同一性”的使用时,将涉及下列氨基酸序列比较:
Figure BDA0001227061250000111
如本文所用,上述“GPT_CRIG”序列(对于中国仓鼠GPT)与小鼠同源物(“GPT_小鼠”)之间的“百分比同一性”测定不应包括仓鼠氨基酸10和11的比较,因为在比对中该仓鼠同源物并不具有同源的序列来进行比较(即小鼠GPT在该点具有***,或该仓鼠同源物具有间隙或缺失,视具体情况而定)。因此,在上述比较中,百分比同一性比较将从5’端的“MWA”延伸至3’端的“ESQ”。在该事件中,小鼠同源物的差异仅在于:其在仓鼠GPT位置51具有“R”。因为该比较在一段60个碱基对中的58个邻接的碱基上进行,其中仅有一个氨基酸差异(其并非间隙、缺失或***),所以两个序列(小鼠和仓鼠)之间从仓鼠GPT位置1至仓鼠GPT位置58有超过98%的同一性(因为“百分比同一性”并不包括间隙、缺失和***的罚分)。虽然上述实例以氨基酸序列为基础,但是应当理解,核酸序列百分比同一性将以相同的方式来计算。
术语“细胞”包括适合表达重组核酸序列的任何细胞。细胞包括原核生物和真核生物(单细胞或多细胞)的细胞、细菌细胞(例如,大肠杆菌(E.coli)、芽孢杆菌属菌种(Bacillus spp.)、链霉菌属菌种(Streptomyces spp.)等的菌株)、分枝杆菌细胞、真菌细胞、酵母细胞(例如,酿酒酵母(S.cerevisiae)、粟酒裂殖酵母(S.pombe)、巴斯德毕赤酵母(P.partoris)、甲醇毕赤酵母(P.methanolica)等)、植物细胞、昆虫细胞(例如,SF-9、SF-21、杆状病毒感染的昆虫细胞、粉纹夜蛾(Trichoplusia ni)等)、非人动物细胞、哺乳动物细胞、人细胞或细胞融合物例如杂交瘤或四源杂交瘤。在某些实施方案中,细胞为人、猴、猿、仓鼠、大鼠或小鼠细胞。在其他实施方案中,细胞为真核细胞并且选自以下细胞:CHO(例如CHO K1、DXB-11 CHO、Veggie-CHO)、COS(例如COS-7)、视网膜细胞、Vero、CV1、肾(例如HEK293、293 EBNA、MSR 293、MDCK、HaK、BHK21)、HeLa、HepG2、WI38、MRC 5、Colo25、HB 8065、HL-60、Jurkat、Daudi、A431(表皮的)、CV-1、U937、3T3、L细胞、C127细胞、SP2/0、NS-0、MMT细胞、肿瘤细胞和来源于前述细胞的细胞系。在一些实施方案中,细胞包含一个或多个病毒基因,例如表达病毒基因的视网膜细胞(例如PER.
Figure BDA0001227061250000112
细胞)。
短语“累积细胞密度”或“ICD”表示在一段时间内作为整体考虑的培养基中的细胞密度,以每毫升的细胞-天数来表示。在一些实施方案中,ICD以培养中约第12天的细胞来测量。
“糖基化”或短语“使蛋白糖基化”包括形成糖蛋白,而寡糖附连到蛋白的天冬酰胺(Asn)残基(即N-连接的)或丝氨酸(Ser)/苏氨酸(Thr)残基(即O-连接的)的侧链。聚糖可以为单糖残基的均聚物或杂聚物,其可以为直链的或支链的。N-连接的糖基化已知主要在内质网中开始,而O-连接的糖基化显示出在ER或高尔基体中开始。
“N-聚糖蛋白”或“N-聚糖蛋白底物”包括含有或可接受N-连接的寡糖的蛋白。N-聚糖可由N-乙酰基半乳糖胺(GalNAc)、甘露糖(Man)、果糖(Fuc)、半乳糖(Gal)、神经氨酸(NANA)和其他单糖组成,然而N-聚糖通常具有共同的核心五糖结构,其包括:三个甘露糖和两个N-乙酰葡糖胺(GlcNAc)糖。带有连续氨基酸序列(即序列段(sequon))Asn-X-Ser或Asn-X-Thr的蛋白(其中X为除脯氨酸之外的任何氨基酸)可提供N-聚糖的附连位点。
一般说明
本发明至少部分地基于以下发现:在某些条件下可在细胞中产生重组蛋白,其中编码该蛋白的基因可操作地连接到Tn抗性基因GPT,且将产蛋白的细胞的选择设定为在细胞基因组中增加随机整合事件并因此增加所关注基因的拷贝数以及最终增加蛋白产量。
本发明还至少部分地基于以下发现:产蛋白的细胞可经优化以表达具有一致和可靠的翻译后修饰的蛋白。GPT表达盒还可以如在表达构建体中诸如经由表达载体使用本领域已知的各种基因编辑技术而整合到细胞基因组中。包括GPT的表达载体可通过随机或靶向重组,诸如同源重组或由识别特定重组位点的重组酶所介导的重组(例如,Cre-lox介导的重组)整合到基因组中。
可通过在整合位点在染色体DNA中引入断裂来促进真核细胞中的同源重组。模型***已证明,如果在染色体靶序列中引入双链断裂,那么在基因靶向期间同源重组的频率会增加。这可通过将某些核酸酶靶向特定整合位点而实现。在靶基因座识别DNA序列的DNA结合蛋白是本领域已知的。基因靶向载体也用于促进同源重组。在不存在用于同源指导修复(homology directed repair)的基因靶向载体的情况下,细胞常常会通过非同源末端接合(NHEJ)(其可能在裂解位点处导致多个核苷酸的缺失或***)来闭合该双链断裂。基因靶向载体构建和核酸酶选择在本发明所属领域的技术人员的技术范围内。
在一些实例中,具有模块化结构并含有单独锌指域的锌指核酸酶(ZFN)在靶向序列中识别特定的3-核苷酸序列(例如靶向整合的位点)。一些实施方案可利用具有靶向多个靶序列的单独锌指域的组合的ZFN。
转录活化因子样(TAL)效应子核酸酶(TALEN)也可用于位点特异性基因组编辑。TAL效应子蛋白DNA结合域通常与限制性核酸酶诸如FokI的非特异性裂解域组合使用。在一些实施方案中,将包含TAL效应子蛋白DNA结合域和限制性核酸酶裂解域的融合蛋白用于识别和裂解本发明基因座内的靶序列处的DNA(Boch J等人,2009Science 326:1509-1512)。
RNA引导的核酸内切酶(RGEN)是从细菌适应性免疫机制开发的可编程的基因组工程化工具。在该***(成簇规律间隔短回文重复序列(CRISPR)/CRISPR相关性(Cas)免疫反应)中,蛋白Cas9当与两个RNA(其中一个引导靶选择)复合时形成序列特异性核酸内切酶。RGEN由组分(Cas9和tracrRNA)以及靶特异性CRISPR RNA(crRNA)组成。DNA靶裂解的效率以及裂解位点的位置均基于前间区序列邻近基序(PAM)的位置而变化,该基序是针对靶识别的额外要求(Chen,H.等人,J.Biol.Chem.2014年3月14作为手稿M113.539726在线发表)。
另外其他同源重组方法可供技术人员使用,诸如具有精确DNA结合特异性的BuD衍生的核酸酶(BuDN)(Stella,S.等人Acta Cryst.2014,D70,2042-2052)。精确的基因组修饰方法基于与基因组内的独特靶序列相容可获得的工具来选择,以使得避免细胞表型被破坏。
本发明提供细胞和方法以供稳定地将核酸序列(所关注基因)整合到哺乳动物细胞中,其中该核酸序列能够通过与GPT序列整合来增强表达。本发明还提供组合物和方法以供与表达构建体(例如表达载体)相关地使用GPT,以及将外源性GPT添加到所关注的哺乳动物细胞中。本发明提供细胞和方法以供用于一致但稳健地制备糖蛋白特别是治疗性糖蛋白的方法。
GPT选择标记盒的构建
本文提供包括可操作的GPT表达盒的表达载体。该表达盒包括必需的调控元件以允许和驱动哺乳动物GPT和所需基因产物的转录和翻译。
还可开发本文所述的基因和调控序列的各种组合。还可开发的本文所述的适当序列的其他组合的实例包括含有本文所公开的GPT基因的多个拷贝的序列,或通过将所公开的GPT与其他核苷酸序列组合以实现最佳调控元件组合而衍生的序列。此类组合可连续地连接或排列以提供向所关注基因和调控元件取向的最佳的GPT间距。
编码GPT的基因的同源序列已知存在于来自其他哺乳动物物种的细胞中(比如人类;参见图2)以及衍生自其他哺乳动物组织类型的细胞系中,且可通过本领域熟知的技术来分离。示例性哺乳动物GPT氨基酸序列的列表提供于图2中。可对SEQ ID NO:2和11-17所示的核苷酸序列进行核苷酸序列的改变,诸如密码子优化,以便允许SEQ ID NO:3-10所示的对应GPT蛋白的最佳表达。此外,可通过改变编码GPT的核苷酸序列,来改变SEQ ID NO:3-10所示的氨基酸序列。此类技术包括但不限于本领域熟知的定点或随机诱变技术。
然后可将所得的GPT变体就本文所述的GPT活性进行测试,例如对衣霉素的抗性进行测试。通过常规实验,将氨基酸序列与具有GPT活性的SEQ ID NO:3至少约93%相同、或至少约95%相同、或至少约96%相同、或至少约97%相同、或至少约98%相同的GPT蛋白分离出,且预期其表现出与SEQ ID NO:3相同的Tn抗性、选择性效率和翻译后益处。因此,GPT的哺乳动物同源物和GPT变体也可由本发明的实施方案涵盖。图2A至2C显示各种哺乳动物GPT氨基酸序列(即SEQ ID NO:3-10)的比对。哺乳动物GPT序列(核酸和氨基酸)在仓鼠、人类、小鼠和大鼠基因组之中为保守的。表1鉴别示例性哺乳动物GPT蛋白及其同源性程度。
表1A:GPT同源物的氨基酸同一性
Figure BDA0001227061250000141
表1B:代表性GPT同源物的核酸同一性
动物 SEQ ID NO %仓鼠同一性
仓鼠 2 -
小鼠 11 92
人类 12 92
大鼠 13 94
猕猴 14 92
黑猩猩 15 92
可使用本文所提供的GPT/衣霉素法来产生表达增加水平的所关注蛋白的细胞群。取决于蛋白被细胞加工的效率如何,表达的绝对水平将随特定蛋白而变化。
因此,本发明还包括选自SEQ ID NO:2和11-17的表达GPT的核苷酸序列。本发明还涵盖表达GPT的核苷酸序列,该序列与选自SEQ ID NO:2和11-17的核苷酸序列至少92%相同、至少93%相同、至少94%相同、至少95%相同、至少96%相同、至少98%相同或至少99%相同。
本发明包括含有SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:12的载体。包括哺乳动物GPT基因和任选的调控元件的载体包括供瞬时或稳定转染的载体。
在一个实施方案中,GPT基因用于增强GOI的表达,如图1所示。图1显示与IRES序列和GPT选择性标记可操作地连接的GOI。GPT盒还包括启动子序列,例如SV40启动子,和多聚腺苷酸化(poly(A))序列,例如SV40poly(A)。
表达增强盒(包括GPT和上游启动子)最佳地整合在细胞基因组中。使用本发明的方法,GOI在以增加浓度的Tn为基础的培养条件下在GPT表达盒内表达(图3A或图3B)。FACS读出结果(诸如图5B、5C、5E和5F中所示)举例说明稳定转染的细胞群中的表达分布,特别是使用哺乳动物Tn抗性选择标记CHO-GPT和hGPT在选择效率上的急剧增加。哺乳动物GPT表达还增强了所关注基因产物的表达,例如荧光蛋白eGFP的产生。相较于使用GPT在以一种浓度的Tn为基础的培养条件下在表达***中表达的GOI,增加浓度的Tn的连续培养导致约2倍的增强表达,诸如图6B中所举例说明。
本发明包括包含这样的GPT基因的哺乳动物细胞,其中该GPT基因为外源性的且通过本发明的方法整合到细胞基因组中。包括这样的GPT基因的细胞具有至少一个外源性添加的所关注基因(GOI),该基因在GPT基因的上游或下游。
在多种实施方案中,可通过将GOI置于哺乳动物选择性标记GPT的控制下来增强GOI的表达。在其他实施方案中,可通过将GOI置于哺乳动物选择性标记GPT的控制下并提供包括大于0.5μg/mL Tn浓度的细胞培养条件,来增强GOI的随机整合事件。在一些实施方案中,细胞培养条件包括大于1μg/mL的Tn浓度。调控元件可以可操作地连接到GOI,其中GOI的表达—在GOI和GPT的选定距离下(在5’或3’方向)-保留增强GOI表达的能力,例如,超过通常由于随机整合事件所观察到的表达。在多种实施方案中,增强为至少约1.5倍至约2倍或更多。相较于随机整合或随机表达,表达的增强为约1.5倍或约2倍或更多。
在另一个实施方案中,使用本发明的方法和组合物可得到一致地糖基化的蛋白。如表4中所示,经Tn处理的GPT/GOI重组蛋白批次使得重复批次具有同等的糖基化谱。因此,增强的蛋白表达诸如一致的糖基化谱可直接通过计算如本文所教导的Z数来比较。Z数方程式将色谱图上代表唾液酸(SA)部分的相对波峰数以及各波峰的相对形状和强度列入考虑。Z数以各波峰所占据的面积为基础并且可用作复合糖蛋白的一致性指标(参见例如图7A-7D、图8和实施例3,如本文所述)。
蛋白表达优化还可就各GOI而实现,包括例如表达盒取向或密码子优化。蛋白优化还可通过在细胞培养法中改变递增的Tn浓度来实现。
重组表达载体可包括编码蛋白的合成的或cDNA衍生的DNA片段,其可操作地连接到衍生自哺乳动物、病毒或昆虫基因的适合的转录和/或翻译调控元件。此类调控元件包括转录启动子、增强子、编码适合的mRNA核糖体结合位点的序列以及控制转录和翻译终止的序列,如本文详细描述。哺乳动物表达载体还可包括非转录元件,诸如复制起点、其他5'或3'侧翼非转录序列,以及5'或3'非翻译序列诸如剪接供体和受***点。还可并入帮助识别转染子的另外的选择性标记基因(诸如荧光标记)。
在另一个实施方案中,载体包括编码所关注蛋白的核酸分子(或所关注基因),其包括含有所述核酸分子(基因)的表达载体,其中该核酸分子(基因)可操作地连接到表达控制序列。
提供包括所关注基因(GOI)的载体,其中该GOI可操作地连接到适合在哺乳动物宿主细胞中表达的表达控制序列。
可用于本发明的有用的启动子包括但不限于SV40早期启动子区、包含在劳氏肉瘤病毒的3'长末端重复序列中的启动子、金属硫蛋白基因的调控序列、小鼠或人类巨细胞病毒IE启动子(Gossen等人,(1995)Proc.Nat.Acad.Sci.USA89:5547-5551)、花椰菜花叶病毒35S RNA启动子以及光合成酶核酮糖二磷酸羧化酶的启动子、来自酵母或其他真菌的启动子元件诸如Gal 4启动子、ADC(醇脱氢酶)启动子、PGK(磷酸甘油激酶)启动子、碱性磷酸酶启动子以及下列动物转录控制区,其表现出组织特异性并已用于转基因动物:弹性蛋白酶I、胰岛素、免疫球蛋白、小鼠乳腺肿瘤病毒、白蛋白、甲胎蛋白、α1-抗胰蛋白酶、β-球蛋白和肌球蛋白轻链-2。
本发明的核酸分子还可以可操作地连接到有效的poly(A)终止序列(例如SV40poly(A))、用于大肠杆菌中质粒产物的复制起点和/或方便的克隆位点(例如多接头)。核酸还可包括与组成型启动子相反的可调节的诱导型启动子(可诱导的、可抑制的、发育性调节的),诸如CMV IE(技术人员将认识到,此类术语实际上为某些条件下的基因表达程度的描述语)。
本发明提供制备所关注蛋白的方法,而提供包括所关注基因(GOI)的表达载体。此类表达载体可用于重组制备任何所关注蛋白。可用于转染脊椎动物细胞的表达载体中的转录和翻译控制序列可通过病毒来源而提供。例如,常用的启动子和增强子衍生自病毒,诸如多瘤病毒、腺病毒2、猴病毒40(SV40)和人类巨细胞病毒(CMV)。病毒基因组启动子、控制和/或信号序列可用于驱动表达,所提供的此类控制序列与所选择的宿主细胞相容。取决于在其中表达重组蛋白的细胞类型,还可使用非病毒细胞启动子(例如,β-球蛋白和EF-1α启动子)。
衍生自SV40病毒基因组的DNA序列例如SV40起点、早期和晚期启动子、增强子、剪接和多聚腺苷化位点可用于提供对异源DNA序列的表达有用的其他基因元件。早期和晚期启动子是特别有用的,因为二者可容易地从SV40病毒作为还含有SV40病毒复制起点的片段得到(Fiers等人,Nature 273:113,1978)。也可使用较小或较大的SV40片段。通常,包括从位于SV40复制起点中的Hind III位点向BglI位点延伸的大约250bp序列。
用于表达多个转录物的双顺反子表达载体先前已有描述(Kim S.K.和Wold B.J.,Cell 42:129,1985;Kaufman等人1991,同上)并可与GPT表达***组合使用。其他类型的表达载体也将是有用的,例如描述于美国专利第4,634,665号(Axel等人)和美国专利第4,656,134号(Ringold等人)中的那些。
整合位点(例如重组酶识别位点)可置于编码POI的基因序列的5’或3’。适合的整合位点的一个实例为lox p位点。适合的整合位点的另一个实例为两个重组酶识别位点,例如选自lox p位点、lox和lox 5511位点。
基因扩增盒及其表达载体
先前已描述或本领域已知的有用调控元件也可包括在用于转染哺乳动物细胞的核酸中。图1举例说明GPT载体中的可操作盒,其还包括启动子序列、IRES序列、所关注基因和poly(A)序列。
在本发明的上下文中的表达载体可以是任何适合的载体,包括染色体、非染色体和合成的核酸载体(包括一组适合的表达控制元件的核酸序列)。此类载体的实例包括SV40的衍生物、细菌质粒、嗜菌体DNA、杆状病毒、酵母质粒、衍生自质粒和嗜菌体DNA组合的载体、以及病毒核酸(RNA或DNA)载体。在一个实施方案中,编码抗体的核酸分子包含在裸DNA或RNA载体中,包括例如线性表达元件(如描述于例如Sykes和Johnston,Nat Biotech 12,355-59(1997)中)、紧凑的核酸载体(如描述于例如US 6,077,835和/或WO 00/70087中)或质粒载体诸如pBR322、pUC 19/18或pUC 118/119。此类核酸载体及其用法为本领域熟知的(参见例如US 5,589,466和US 5,973,972)。
或者,表达载体可为适合在酵母***中表达的载体。可使用任何适合在酵母***中表达的载体。适合的载体包括例如包含组成型或诱导型启动子的载体,诸如酵母α因子、醇氧化酶和PGH(综述见于:F.Ausubel等人编Current Protocols in Molecular Biology,Greene Publishing and Wiley InterScience New York(1987)以及Grant等人,Methodsin Enzymol 153,516-544(1987))。
在某些实施方案中,载体包括编码所关注蛋白的核酸分子(或所关注基因),其包括含有所述核酸分子(基因)的表达载体,其中该核酸分子(基因)可操作地连接到适合在宿主细胞中表达的表达控制序列。
表达控制序列经工程化以控制和驱动所关注基因的转录,及后续在各种细胞***中的蛋白表达。质粒将可表达的所关注基因与包括所需调控元件比如启动子、增强子、选择性标记、操纵子等的表达控制序列(即表达盒)组合。在本发明的表达载体中,GPT和所关注蛋白诸如编码抗体的核酸分子可包括以下部分或与它们相关:任何适合的启动子、增强子、操纵子、阻遏蛋白、poly(A)终止序列和其他表达促进元件。
所关注基因(例如编码抗体的核苷酸序列)的表达可置于本领域已知的任何启动子或增强子元件的控制下。此类元件的实例包括强表达启动子(例如,人类CMV IE启动子/增强子或CMV主要IE(CMV-MIE)启动子,以及RSV、SV40晚期启动子、SL3-3、MMTV、泛素(Ubi)、泛素C(UbC)和HIV LTR启动子)。
在一些实施方案中,该载体包括选自以下的启动子:SV40、CMV、CMV-IE、CMV-MIE、RSV、SL3-3、MMTV、Ubi、UbC和HIV LTR。
本发明的核酸分子还可以可操作地连接到有效的poly(A)终止序列、用于大肠杆菌中质粒产物的复制起点、作为选择性标记的抗生素抗性基因、和/或方便的克隆位点(例如多接头)。核酸还可包括与组成型启动子相反的可调节的诱导型启动子(可诱导的、可抑制的、发育性调节的),诸如CMV IE(技术人员将认识到,此类术语实际上为某些条件下的基因表达程度的描述语)。
选择性标记是本领域熟知的元件。在某些情况下,除了GPT之外,还可以使用另外的选择性标记,其中此类标记使细胞可见。可使用正选择或负选择。
在一些实施方案中,该载体包括一种或多种编码绿色荧光蛋白(GFP)、增强的绿色荧光蛋白(eGFP)、氰基荧光蛋白(CFP)、增强的氰基荧光蛋白(eCFP)、黄色荧光蛋白(YFP)或增强的黄色荧光蛋白(eYFP)的选择性标记基因。
就本发明的目的而言,真核细胞中的基因表达可使用强启动子紧密调节,该启动子通过操纵子来控制,而该操纵子继而由调节性融合蛋白(RFP)来调节。RFP基本上由转录阻断域和调节其活性的配体结合域组成。此类表达***的实例描述于US20090162901A1中,其全文以引用方式并入本文。
许多真核细胞和嗜菌体中的操纵子已研究透彻(Neidhardt编Escherichia coliand Salmonella;Cellular and Molecular Biology第2版第2卷ASM Press,WashingtonD.C.1996)。这些包括但不限于大肠杆菌的LexA基因的操纵子区,其与LexA肽结合,以及乳糖和色氨酸操纵子,其与由大肠杆菌的LacI和trpR基因编码的阻遏蛋白结合。这些还包括来自λPR和噬菌体P22ant/mnt基因的嗜菌体操纵子,其与由λcI和P22arc编码的阻遏蛋白结合。在一些实施方案中,当阻遏蛋白的转录阻断域为限制酶诸如NotI时,操纵子为该酶的识别序列。本领域的技术人员将认识到,操纵子必须位于启动子附近或位于启动子的3',以使得其能够通过该启动子控制转录。例如,美国专利第5,972,650号(以引用方式并入本文)规定了tetO序列在TATA盒的特定距离内。在具体实施方案中,该操纵子优选地置于启动子的正下游。在其他实施方案中,该操纵子置于启动子的10个碱基对内。
在某些实施方案中,该操纵子选自:tet操纵子(tetO)、NotI识别序列、LexA操纵子、乳糖操纵子、色氨酸操纵子和Arc操纵子(AO)。在一些实施方案中,阻遏蛋白选自TetR、LexA、LacI、TrpR、Arc、λC1和GAL4。在其他实施方案中,该转录阻断域衍生自真核阻遏蛋白,例如衍生自GAL4的阻遏域。
在示例性细胞表达***中,细胞经工程化以表达四环素阻遏蛋白(TetR)且所关注蛋白置于启动子的转录控制下,而该启动子的活性受TetR调控。两个一前一后的TetR操纵子(tetO)置于载体中的CMV-MIE启动子/增强子的正下游。由这样的载体中的CMV-MIE启动子所指导的编码所关注蛋白的基因的转录在不存在四环素或在某些其他适合的诱导物(例如强力霉素)的情况下可被TetR阻断。在诱导物的存在下,TetR蛋白能结合tetO,因而使所关注蛋白的转录然后使翻译(表达)发生(参见例如美国专利第7,435,553号,其全文以引用方式并入本文)。
另一种示例细胞表达***包括调节性融合蛋白,诸如TetR-ERLBDT2融合蛋白,其中该融合蛋白的转录阻断域为TetR而配体结合域为具有T2突变的***受体配体结合域(ERLBD)(ERLBDT2;Feil等人(1997)Biochem.Biophys.Res.Commun.237:752-757)。当tetO序列置于强CMV-MIE启动子的下游和附近时,来自CMV-MIE/tetO启动子的所关注核苷酸序列的转录在他莫昔芬的存在下被阻断,并通过移除他莫昔芬解除阻断。在另一个实例中,使用融合蛋白Arc2-ERLBDT2(由通过15个氨基酸的接头所连接的两个Arc蛋白所组成的单链二聚体和ERLBDT2(同上)所组成的融合蛋白)涉以及Arc操纵子(AO),更具体地讲,CMV-MIE启动子/增强子正下游的两个一前一后的arc操纵子。细胞系可由Arc2-ERLBDT2调节,其中表达所关注蛋白的细胞由CMV-MIE/ArcO2启动子驱动并可通过移除他莫昔芬来诱导。(参见例如US20090162901A1,其以引用方式并入本文)。
在一些实施方案中,本发明的载体包括CMV-MIE/TetO或CMV-MIE/AO2杂交启动子。
本发明的载体还可将Cre-lox工具用于重组技术,以便有利于所关注基因的复制。Cre-lox策略需要至少两个组成部分:1)Cre重组酶,一种催化两个loxP位点之间的重组的酶;以及2)loxP位点(例如,由8-bp核心序列(重组在其中进行)和两个侧翼13-bp反向重复序列所组成的特异性34-碱基对bp序列)或突变lox位点。(参见例如Araki等人PNAS 92:160-4(1995);Nagy,A.等人Genesis26:99-109(2000);Araki等人Nuc Acids Res 30(19):e103(2002)和US20100291626A1,其全部以引用方式并入本文)。在另一种重组策略中,酵母衍生的FLP重组酶可与共有序列FRT一起使用(另见例如Dymecki,S.PNAS93(12):6191-6196(1996))。
在另一个方面,基因(即编码本发明重组多肽的核苷酸序列)***表达盒的GPT基因的上游或下游,且任选可操作地连接到启动子,其中该启动子连接的基因的5’侧翼为第一重组酶识别位点而3’侧翼为第二重组酶识别位点。此类重组酶识别位点允许表达***的宿主细胞中Cre介导的重组。在一些情况下,第二启动子连接的基因在第一基因的下游(3’)且3’侧翼为第二重组酶识别位点。在另外其他情况下,第二启动子连接的基因的5’侧翼为第二重组酶识别位点,而3’侧翼为第三重组酶识别位点。在一些实施方案中,重组酶识别位点选自loxP位点、lox511位点、lox2272位点和FRT位点。在其他实施方案中,重组酶识别位点为不同的。在又一个实施方案中,宿主细胞包括能表达Cre重组酶的基因。
在一个实施方案中,载体包括编码本发明的抗体轻链或抗体重链的第一基因,以及编码本发明的抗体轻链或抗体重链的第二基因。
在一些实施方案中,载体还包括X-盒结合蛋白1(mXBP1)基因,其能够通过内质网(ER)中的蛋白折叠所涉及到的基因表达的控制进一步增强蛋白产生/蛋白分泌。(参见例如Ron D和Walter P.Nat Rev Mol Cell Biol.8:519–529(2007))。
任何细胞均适于表达本发明的重组核酸序列。用于本发明的细胞包括哺乳动物细胞,诸如非人类动物细胞、人类细胞或细胞融合物,比如杂交瘤或四源杂交瘤。在某些实施方案中,细胞为人、猴、仓鼠、大鼠或小鼠细胞。在其他实施方案中,细胞为真核细胞并且选自以下细胞:CHO(例如CHO K1、DXB-11CHO、Veggie-CHO)、COS(例如COS-7)、视网膜细胞、Vero、CV1、肾(例如HEK293、293 EBNA、MSR 293、MDCK、HaK、BHK21)、HeLa、HepG2、WI38、MRC5、Colo25、HB 8065、HL-60、Jurkat、Daudi、A431(表皮的)、CV-1、U937、3T3、L细胞、C127细胞、SP2/0、NS-0、MMT细胞、肿瘤细胞和来源于前述细胞的细胞系。在一些实施方案中,细胞包含一个或多个病毒基因,例如表达病毒基因的视网膜细胞(例如PER.
Figure BDA0001227061250000211
细胞)。
在又一个方面,本发明涉及重组的哺乳动物宿主细胞,诸如转染瘤,其产生免疫球蛋白,诸如抗体或双特异性分子。此类宿主细胞的实例包括工程化的哺乳动物细胞,诸如CHO或HEK细胞。例如,在一个实施方案中,本发明提供包括稳定整合到细胞基因组中的核酸的细胞,该核酸包括编码抗体表达的序列,而该抗体包括本发明的重组多肽。在另一个实施方案中,本发明提供包括非整合(即附加型)核酸(诸如质粒、粘粒、噬粒或线性表达元件)的细胞,该核酸包括编码抗体表达的序列,而该抗体包括本发明的重组多肽。在其他实施方案中,本发明提供通过用包括本发明表达载体的质粒来稳定转染宿主细胞而产生的细胞系。
因此,在一个方面,本发明提供包含以下部分的细胞:(a)编码外源性添加的哺乳动物GPT基因的重组多核苷酸以及(b)编码多亚基蛋白的多核苷酸。在一些实施方案中,外源性添加的GPT基因与SEQ ID NO:2的核酸序列90%相同,其非限制性实例提供于SEQ IDNO:11-17中,且多亚基蛋白为抗体。在其他实施方案中,细胞还含有外源性添加的GPT基因和调控元件。在一个实施方案中,细胞为哺乳动物细胞,诸如用于制备生物药品的CHO细胞。
在另一个方面,本发明提供衍生自在之前方面所述的细胞的细胞系。所谓“衍生自”是指由各个细胞无性繁殖的并具有某些选定品质(诸如以给定效价产生活性蛋白的能力,或增殖至特定密度的能力)的细胞群。在一些实施方案中,衍生自具有编码哺乳动物GPT基因的重组多核苷酸和编码多亚基蛋白的多核苷酸的细胞的细胞系能够以至少3克每升(g/L)培养基、至少5g/L或至少8g/L的效价产生多亚基蛋白。在一些实施方案中,该细胞系可达到比由基本上相同但无编码GPT的重组多核苷酸的细胞所衍生的细胞系所能达到的累积细胞密度(ICD)大至少30%、大至少50%、大至少60%或大至少90%的累积细胞密度。
提供了扩增GOI的方法。举例说明的方法将增加浓度的衣霉素施用于真核GPT表达***,从而扩增可操作地连接到外源性添加的哺乳动物GPT基因的GOI的基因拷贝。
所关注蛋白
编码所关注基因的核酸序列可方便地整合到包括Tn抗性标记基因和IRES,且任选侧翼有重组酶识别位点的细胞中。可使用任何适合在哺乳动物细胞中表达的所关注蛋白,然而糖蛋白将尤其受益于本发明的方法。例如,所关注蛋白可为抗体或其抗原结合片段、双特异性抗体或其片段、嵌合抗体或其片段、ScFv或其片段、Fc标签蛋白(例如Trap蛋白)或其片段、生长因子或其片段、细胞因子或其片段、细胞表面受体的胞外域或其片段。
具有天冬酰胺连接的(N-连接的)聚糖的糖蛋白普遍存在于真核细胞中。这些聚糖的生物合成及其向多肽的转化在内质网(ER)中发生。N-聚糖结构在ER和高尔基复合体中通过许多糖苷酶和糖基转移酶进一步修饰。使用本发明进行的蛋白制备针对天然N-聚糖结构的一致性,以消除免疫原性表位(“糖表位”(glycotope))。
使用本发明的方法,重组蛋白批次表现出有利的特性。重复的蛋白生产批次的HPLC(以荧光检测)证明了糖蛋白具有统一的表达和糖基化模式,如本文图7-8中举例说明。提供了使N-聚糖蛋白底物糖基化的方法,其中提供编码核酸分子的哺乳动物宿主细胞,该核酸分子包含可操作地连接到编码需要糖基化的蛋白底物的基因的哺乳动物衣霉素(Tn)抗性基因;将该细胞在第一浓度的Tn存在下培养;将表达Tn抗性基因的至少一个拷贝的细胞群分离;将该细胞群在增加浓度的Tn存在下培养;以及从细胞培养中分离N-聚糖蛋白底物。蛋白底物的N-聚糖含量可就单糖、寡糖的存在通过本领域已知的任何方法来评估。
聚糖连接的蛋白的详细结构分析可与蛋白的功能特征相关联。这种对蛋白糖基化进行表征的分析通常涉以及以下几个步骤:i)酶或化学释放所连接的聚糖;ii)经由芳族或脂族胺的还原性胺化或全甲基化使释放的聚糖衍生化;iii)分析聚糖。许多分析糖化模式的变化是技术人员已知的。糖蛋白可带有以特定数量占据各个位点的数种形式的糖型,并因此而言,其复杂性可能使其难以在某些生产方法中重现。糖型的类型和数量的一致性是可测量的且代表治疗性蛋白生产的期望结果。
宿主细胞和转染
用于本发明方法中的哺乳动物宿主细胞为真核宿主细胞,通常为哺乳动物细胞,包括例如CHO细胞和小鼠细胞。在一个实施方案中,本发明提供包括编码衍生自中国仓鼠(Cricetulus griseus)的Tn抗性标记蛋白的核酸序列(如SEQ ID NO:3所示)或其同源物或变体的细胞。在一些实施方案中,该细胞包括Tn抗性标记基因的多基因拷贝。在其他实施方案中,本发明提供编码衍生自人类(SEQ ID NO:4)、猕猴(SEQ ID NO:5)、黑猩猩(SEQ IDNO:6)、狗(SEQ ID NO:7)、豚鼠(SEQ ID NO:8)、大鼠(SEQ ID NO:9)或小鼠(SEQ ID NO:10)的Tn抗性标记蛋白的核酸序列。
本发明包括用本发明的表达载体转染的哺乳动物宿主细胞。经转染的宿主细胞包括经表达载体转染的细胞,而该表达载体包括编码所关注蛋白或多肽的序列。所表达的蛋白将通常取决于所选的核酸序列而分泌到培养基中,但可能保持在细胞中或沉积在细胞膜中。各种哺乳动物细胞培养***均可用于表达重组蛋白。适合的哺乳动物宿主细胞系的实例包括Gluzman(1981)Cell 23:175所述的猴肾脏细胞的COS-7细胞系,以及能够表达适当载体的其他细胞系,包括例如CV-1/EBNA(ATCC CRL 10478)、L细胞、C127、3T3、CHO、HeLa和BHK细胞系。针对特定选择或扩增流程而开发的其他细胞系也可与本文所提供的方法和组合物一起使用。在本发明的一个实施方案中,该细胞为称为K1的CHO细胞系(即CHO K1细胞)。为了实现重组蛋白高产量的目标,宿主细胞系应在适当的情况下预先适应生物反应器培养基。
本领域已知数种转染方法,它们在Kaufman(1988)Meth.Enzymology185:537中进行了综述。所选的转染方案将取决于宿主细胞类型和GOI性质,且可基于常规实验来选择。任何这样的方案的基本要求是首先将编码所关注蛋白的DNA引入适合的宿主细胞中,然后以相对稳定、可表达的方式鉴定和分离已包含异源DNA的宿主细胞。
可用于将异源DNA引入哺乳动物细胞的某些试剂包括LipofectinTM试剂和LipofectamineTM试剂(Gibco BRL,Gaithersburg,Md.)。这两种试剂均为用于形成脂质-核酸复合物(或脂质体)的市售试剂,当应用于培养的细胞时,有利于核酸摄入细胞中。
所选的转染方案和选择用于其中的元件将取决于所用的宿主细胞的类型。本领域的技术人员知道许多不同的方案和宿主细胞,并且可基于所用的细胞培养***的要求来选择用于表达所需蛋白的适当***。在另一个方面,本发明涉及编码多肽的表达载体,其包括但不限于抗体、双特异性抗体、嵌合抗体、ScFv、抗原结合蛋白或Fc融合蛋白。此类表达载体可用于使用本发明的方法和组合物进行的重组多肽制备。
本发明的其他特征在以下对示例性实施方案的描述过程中将变得显而易见,这些实施方案用于说明本发明而无意限制本发明。
实施例
提供以下实施例是为了向本领域的普通技术人员描述如何构造和使用本发明的方法和组合物,而非旨在限制发明人所认为的其发明的范围。已努力确保有关所用的数字(例如量、温度等)的准确性,但应考虑某些实验误差和偏差。除非另有指出,否则份数为重量份,分子量为平均分子量,温度为摄氏度,而压力为大气压或接近大气压。
实施例1表达GPT的转染细胞的选择效率。
将经修饰的CHO K1细胞用含有CHO-GPT(SEQ ID NO:2)、人类GPT(SEQ ID NO:12)的质粒载体或含有潮霉素磷酸转移酶(Hpt,潮霉素抗性基因)的质粒载体转染;例如,将选择性标记基因(CHO-GPT或hpt)在其相应载体中经由IRES序列在转录上连接到下游eGFP基因。例如,各质粒被构建成在5’至3’方向上包含下列基因序列:Lox位点、SV40晚期启动子、CHO-GPT(或Hpt)、IRES、增强的绿色荧光蛋白(eGFP)和第二Lox位点。将纯化的重组质粒与表达Cre重组酶的质粒共同转染进从5'至3'在转录活性基因座处含有以下位点的经修饰的CHO宿主细胞:lox位点、YFP和第二lox位点。因此,宿主CHO细胞可通过流式细胞术作为绿色阳性或黄色阴性细胞分离。当表达eGFP(转录上受GPT或hpt基因调控)的重组质粒与表达Cre重组酶的质粒共同转染时,由Cre重组酶介导的重组在含有lox位点的染色体基因座处导致GPT/eGFP盒的位点特异性整合,并且发生YFP基因的取代(即绿色阳性细胞)。若eGFP随机整合,则将产生绿色阳性和黄色阳性两种细胞。
将细胞群用0、1μg/ml、2.5μg/ml或5μg/ml衣霉素(Tn)或400μg潮霉素(Hyg)温育,如表2所概述。通过荧光激活细胞分选(FACS)分析来测量观察到的重组群体(ORP)。对细胞进行分选以定量各细胞群,并针对仅表达GFP而不表达YFP的细胞计算选择效率(图4或5)。
比较耐Tn或Hyg的细胞池之间的选择效率(表达GFP的存活细胞的群体百分比)(表2)。
表2:选择效率
Figure BDA0001227061250000241
Figure BDA0001227061250000251
据观察,衣霉素选择与潮霉素选择同样高效。CHO-GPT和人类GPT在1μg/ml或2.5μg/ml衣霉素存在下在整合体的选择方面均是高效的。
实施例2基因产物的扩增。
通过将增加浓度的衣霉素施用于GPT表达***来进行增量选择。用含有如上CHO-GPT基因(SEQ ID NO:2)的质粒载体转染CHO K1细胞。该质粒以5’至3’方向含有第一Lox位点、SV40晚期启动子、CHO-GPT基因、IRES、eGFP和第二Lox位点。CRE-lox位点指导所关注基因整合到基因组中,从而产生每个细胞具有至少一个GPT***的稳定的转染细胞池。(如上所见,由于随机整合,可产生更多的整合体)。最初在1μg/ml衣霉素(Tn)存在下培养CHO细胞。然后从稳定的池(称为细胞池2)中选择转染子,随后在1μg/ml、2.5μg/ml或5μg/ml Tn存在下扩增。进行数轮选择以鉴别能增强eGFP表达(多个拷贝)的细胞群。在2.5μg/ml或5μg/ml Tn存在下,随机整合事件大大增加。
使用标准qPCR法测量基因产物CHO GPT、eGFP或mGapdh(归一化对照)的拷贝数。来自进一步用2.5μg/ml Tn温育的1μg/ml Tn抗性池的细胞中的eGFP拷贝数为来自进一步用1μg/ml Tn温育的1μg/ml Tn抗性池的eGFP拷贝数的至少2倍。当经1μg/ml Tn处理的池进一步用5μg/ml Tn温育时,基因拷贝数进一步增加。eGFP基因拷贝数的增加与增加的CHO-GPT基因拷贝相关联。(参见图6A和6B)。
为了确定基因拷贝数的增加是否会转变成增加的蛋白表达,针对经多轮Tn选择(即1、2.5或5μg Tn)处理过的表达GPT和eGFP的相同细胞池,通过FACS测量了平均荧光强度(MFI)(参见例如图6B中的实例7、8和9)。这些细胞池的eGFP表达的比较在表3中示出。
就eGFP生成而言,接受第二轮5μg Tn选择的表达GPT的细胞池,相较于1μg Tn处理,产量恰好为2.5倍,相较于2.5μg Tn处理,产量为1.5倍(表3)。
表3:eGFP蛋白产生
GPT 1μg池+第二Tn(μg)处理 MFI
1μg 1098
2.5μg 1867
5μg 2854
不受任一理论的束缚,Tn浓度的递增以受控的方式放大了对细胞的选择压力,从而提高产量。
如下所述,还将Tn抗性表达载体用于另外的实验,以检测Tn选择对糖基化模式的作用。
实施例3示例性二聚蛋白的表达和糖基化谱。
用含有GPT的表达载体转染表达“Trap”蛋白(Fc融合蛋白1,下文称为FcFP1)的CHO细胞。该质粒以5’至3’方向具有Lox位点、SV40晚期启动子、Tn抗性基因(CHO-GPT)、IRESeGFP、SV40polyA和第二Lox位点。使用1μg/mL Tn或5μg/mL Tn进行GPT选择性标记的选择。通过悬浮培养于无血清的生产培养基中来扩增所选的细胞池。通过FACS分析,由eGFP的表达确认了GPT转染。将从所选的池收集的团块送去进行GPT表达的拷贝数分析,并建立12天的生产率分析,以测定用不同浓度的衣霉素选择的池中的FcFP1表达水平。
对FcFP1就其复合糖基化模式进行选择,其具有丰富的糖基化位点。为了测定糖基化谱,将表达FcF1蛋白的细胞在标准方案(无Tn)或Tn处理条件(如表4所示)下进行细胞培养而扩增,然后分离并纯化蛋白。
表4:FcFP1蛋白产生
蛋白 批号 处理
FcFP1 Trap 110728
FcFP1 Trap 110728-1 1μg/ml Tn
FcFP1 Trap 110728-2 5μg/ml Tn
使用基于熟知的HPLC方法的色谱法和荧光邻氨基苯甲酸(AA)标签(Anumula和Dhume,Glycobiology,8(7):685-694,1998),就各批次糖蛋白进行详细的聚糖分析,以确定Tn对糖基化谱是否有负面影响。还将生产批次与代表治疗上可接受的蛋白批次的参照标准进行了比较。代表性聚糖分析如图7A-7D所示。各批次(相较于参照批次)一致地产生相同的波峰数目、相对形状和相对强度。各色谱图的重叠(图8)表明并无独特或异常的波峰露出。
通过熟知的HPLC方法针对参照标准批次就FcFP1蛋白进行了寡糖性质分析。就FcFP1 trap蛋白批次测量了唾液酸化的量,并计算了各批次(3个重复)的Z数。Z数代表各批次之间变异的量度。Z数考虑相对波峰数以及各波峰的相对形状和强度。例如,图7A-7D中各0SA、1SA、2SA、3SA和4SA波峰的面积如表5经定量。
表5:寡糖定量分析
Figure BDA0001227061250000271
OS=寡糖;0SA=0个唾液酸残基;1SA=1个唾液酸残基;2SA=2个唾液酸残基;3SA=3个唾液酸残基;4SA=4个唾液酸残基
Figure BDA0001227061250000272
相较于参照批次,各批所计算的Z数在可接受范围内,因此应当理解,各蛋白批次达到与治疗分子相同的物质。因为Tn的存在已知对于N-连接的糖蛋白的糖基化具有负面作用,因此,鉴于由Tn产生的增加的选择压力条件,蛋白产生和产率是可靠和一致的这种情况出人意料。
在不背离本发明的精神或实质的情况下,本发明可以体现为其他具体实施方案。
序列表
<110> Regeneron Pharmaceuticals, Inc.
Deshpande, Dipali
Burakov, Darya
Chen, Gang
Fandl, James P.
<120> 重组蛋白的高效选择性
<130> 8700WO
<150> US 62/039,416
<151> 2014-08-19
<160> 17
<170> PatentIn 3.5版
<210> 1
<211> 6964
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 1
aagcttatac tcgagctcta gattgggaac ccgggtctct cgaattcgag atctagttta 60
aacacgcggc cgctaatcag ccataccaca tttgtagagg ttttacttgc tttaaaaaac 120
ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt tgttaacttg 180
tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa 240
gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat 300
gtctaccggt ataacttcgt ataatgtata ctatacgaag ttagccggta gggcccctct 360
cttcatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 420
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 480
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 540
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 600
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 660
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 720
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 780
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 840
gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 900
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 960
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 1020
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 1080
ggtcatgggc gcgcctcata ctcctgcagg catgagatta tcaaaaagga tcttcaccta 1140
gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 1200
gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 1260
ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 1320
atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc 1380
agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 1440
ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 1500
tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat 1560
ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 1620
caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 1680
gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 1740
atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 1800
accgagttgc tcttgcccgg cgtcaatacg ggataatact gcgccacata gcagaacttt 1860
aaaagtgctc atcattggaa aacgtttttc ggggcgaaaa ctctcaagga tcttaccgct 1920
gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 1980
tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 2040
aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 2100
ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 2160
aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtcaggt acacaacttc 2220
gtatagcata cattatacga agttatggta ccaagcctag gcctccaaaa aagcctcctc 2280
actacttctg gaatagctca gaggcagagg cggcctcggc ctctgcataa ataaaaaaaa 2340
ttagtcagcc atggggcgga gaatgggcgg aactgggcgg agttaggggc gggatgggcg 2400
gagttagggg cgggactatg gttgctgact aattgagatg catgctttgc atacttctgc 2460
ctgctgggga gcctggggac tttccacacc tggttgctga ctaattgaga tgcatgcttt 2520
gcatacttct gcctgctggg gagcctgggg actttccaca ccggatccac catgtgggcc 2580
ttcccggagt tgccgctgcc gctgctggtg aatttgttcg gctcgctgct gggatttgtg 2640
gctactgtga ccctcatccc tgccttccgt agccacttta tcgccgcgcg cctctgtggc 2700
caggacctca acaagctcag ccggcagcag atcccagaat cccagggagt gatctgcggt 2760
gctgttttcc ttatcatcct cttctgcttc atccctttcc ccttcctgaa ctgctttgtg 2820
gaggagcagt gtaaggcatt cccccaccat gaatttgtgg ccctgatagg tgccctcctt 2880
gccatctgct gcatgatctt cctgggcttc gctgatgatg tactcaatct gcgctggcgc 2940
cataagctgc tgctgcccac agctgcctct ctacctctcc tcatggttta cttcactaac 3000
tttggcaata caaccattgt ggtacccaag cccttccgct ggattcttgg cctgcatttg 3060
gacttgggaa tcctatacta tgtctacatg ggactgcttg cggtgttctg taccaatgcc 3120
atcaacatcc tagcaggaat taatggccta gaggctggtc agtcactagt catctctgct 3180
tctatcattg tcttcaacct ggtagagctg gaaggtgatt atcgggatga tcatgtcttt 3240
tccctctact tcatgatacc attttttttt accaccttgg gattgctata ccataactgg 3300
tacccatcac aggtgtttgt gggagatacc ttctgttatt ttgctggcat gacctttgcc 3360
gtggtgggaa tcttgggaca cttcagcaag accatgctac tcttctttat tccacaagtg 3420
ttcaatttcc tctactcgct gcctcagctc cttcacgcca tcccctgccc tcgacaccgc 3480
atacccagac tcaatccgaa gacgggcaaa ctggagatga gctattccaa gttcaagacc 3540
aagaacctct ctttcttggg cacctttatt ttaaaggtag cagagcgcct ccagctagtg 3600
acagttcacc gaggcgagag tgaggatggt gccttcactg aatgtaacaa catgaccctc 3660
atcaacttgc tactcaaaat ctttgggccc atacatgaga gaaacctcac actgctcctg 3720
ctgcttttgc agatcctgag cagcgctgtc accttctcca ttcgatacca gcttgtccga 3780
ctcttctatg atgtctgaac gcgtcccccc tctccctccc ccccccctaa cgttactggc 3840
cgaagccgct tggaataagg ccggtgtgcg tttgtctata tgttattttc caccatattg 3900
ccgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac gagcattcct 3960
aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca 4020
gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg caggcagcgg 4080
aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata agatacacct 4140
gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa 4200
tggctctcct caagcgtatt caacaagggg ctgaaggatg cccagaaggt accccattgt 4260
atgggatctg atctggggcc tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa 4320
aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgattgctcg 4380
aatcaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 4440
gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc 4500
cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 4560
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 4620
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 4680
catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga 4740
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 4800
ggggcacaag ctggagtaca actacaacag ccacaacgtc tacatcatgg ccgacaagca 4860
gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca 4920
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 4980
caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca 5040
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 5100
caagtaatcg gccgctaatc agccatacca catttgtaga ggttttactt gctttaaaaa 5160
acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact 5220
tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 5280
aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 5340
atgtcggcgc gttgacattg attattgact agttattaat agtaatcaat tacggggtca 5400
ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct 5460
ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta 5520
acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac 5580
ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 5640
aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag 5700
tacatctacg tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat 5760
gggcgtggat agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat 5820
gggagtttgt tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc 5880
ccattgacgc aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctctc 5940
cctatcagtg atagagatct ccctatcagt gatagagatc gtcgacgttt agtgaaccgt 6000
cagatcgcct ggagacgcca tccacgctgt tttgacctcc atagaagaca ccgggaccga 6060
tccagcctcc gcggccggga acggtgcatt ggaacgcgga ttccccgtgc caagagtgac 6120
gtaagtaccg cctatagagt ctataggccc acccccttgg cttcttatgc atgctatact 6180
gtttttggct tggggtctat acacccccgc ttcctcatgt tataggtgat ggtatagctt 6240
agcctatagg tgtgggttat tgaccattat tgaccactcc cctattggtg acgatacttt 6300
ccattactaa tccataacat ggctctttgc cacaactctc tttattggct atatgccaat 6360
acactgtcct tcagagactg acacggactc tgtattttta caggatgggg tctcatttat 6420
tatttacaaa ttcacatata caacaccacc gtccccagtg cccgcagttt ttattaaaca 6480
taacgtggga tctccacgcg aatctcgggt acgtgttccg gacatgggct cttctccggt 6540
agcggcggag cttctacatc cgagccctgc tcccatgcct ccagcgactc atggtcgctc 6600
ggcagctcct tgctcctaac agtggaggcc agacttaggc acagcacgat gcccaccacc 6660
accagtgtgc cgcacaaggc cgtggcggta gggtatgtgt ctgaaaatga gctcggggag 6720
cgggcttgca ccgctgacgc atttggaaga cttaaggcag cggcagaaga agatgcaggc 6780
agctgagttg ttgtgttctg ataagagtca gaggtaactc ccgttgcggt gctgttaacg 6840
gtggagggca gtgtagtctg agcagtactc gttgctgccg cgcgcgccac cagacataat 6900
agctgacaga ctaacagact gttcctttcc atgggtcttt tctgcagtca ccgtccttga 6960
cacg 6964
<210> 2
<211> 1231
<212> DNA
<213> 中国仓鼠
<400> 2
caccatgtgg gccttcccgg agttgccgct gccgctgctg gtgaatttgt tcggctcgct 60
gctgggattt gtggctactg tgaccctcat ccctgccttc cgtagccact ttatcgccgc 120
gcgcctctgt ggccaggacc tcaacaagct cagccggcag cagatcccag aatcccaggg 180
agtgatctgc ggtgctgttt tccttatcat cctcttctgc ttcatccctt tccccttcct 240
gaactgcttt gtggaggagc agtgtaaggc attcccccac catgaatttg tggccctgat 300
aggtgccctc cttgccatct gctgcatgat cttcctgggc ttcgctgatg atgtactcaa 360
tctgcgctgg cgccataagc tgctgctgcc cacagctgcc tctctacctc tcctcatggt 420
ttacttcact aactttggca atacaaccat tgtggtaccc aagcccttcc gctggattct 480
tggcctgcat ttggacttgg gaatcctata ctatgtctac atgggactgc ttgcggtgtt 540
ctgtaccaat gccatcaaca tcctagcagg aattaatggc ctagaggctg gtcagtcact 600
agtcatctct gcttctatca ttgtcttcaa cctggtagag ctggaaggtg attatcggga 660
tgatcatgtc ttttccctct acttcatgat accatttttt tttaccacct tgggattgct 720
ataccataac tggtacccat cacaggtgtt tgtgggagat accttctgtt attttgctgg 780
catgaccttt gccgtggtgg gaatcttggg acacttcagc aagaccatgc tactcttctt 840
tattccacaa gtgttcaatt tcctctactc gctgcctcag ctccttcacg ccatcccctg 900
ccctcgacac cgcataccca gactcaatcc gaagacgggc aaactggaga tgagctattc 960
caagttcaag accaagaacc tctctttctt gggcaccttt attttaaagg tagcagagcg 1020
cctccagcta gtgacagttc accgaggcga gagtgaggat ggtgccttca ctgaatgtaa 1080
caacatgacc ctcatcaact tgctactcaa aatctttggg cccatacatg agagaaacct 1140
cacactgctc ctgctgcttt tgcagatcct gagcagcgct gtcaccttct ccattcgata 1200
ccagcttgtc cgactcttct atgatgtctg a 1231
<210> 3
<211> 408
<212> PRT
<213> 中国仓鼠
<400> 3
Met Trp Ala Phe Pro Glu Leu Pro Leu Pro Leu Leu Val Asn Leu Phe
1 5 10 15
Gly Ser Leu Leu Gly Phe Val Ala Thr Val Thr Leu Ile Pro Ala Phe
20 25 30
Arg Ser His Phe Ile Ala Ala Arg Leu Cys Gly Gln Asp Leu Asn Lys
35 40 45
Leu Ser Arg Gln Gln Ile Pro Glu Ser Gln Gly Val Ile Cys Gly Ala
50 55 60
Val Phe Leu Ile Ile Leu Phe Cys Phe Ile Pro Phe Pro Phe Leu Asn
65 70 75 80
Cys Phe Val Glu Glu Gln Cys Lys Ala Phe Pro His His Glu Phe Val
85 90 95
Ala Leu Ile Gly Ala Leu Leu Ala Ile Cys Cys Met Ile Phe Leu Gly
100 105 110
Phe Ala Asp Asp Val Leu Asn Leu Arg Trp Arg His Lys Leu Leu Leu
115 120 125
Pro Thr Ala Ala Ser Leu Pro Leu Leu Met Val Tyr Phe Thr Asn Phe
130 135 140
Gly Asn Thr Thr Ile Val Val Pro Lys Pro Phe Arg Trp Ile Leu Gly
145 150 155 160
Leu His Leu Asp Leu Gly Ile Leu Tyr Tyr Val Tyr Met Gly Leu Leu
165 170 175
Ala Val Phe Cys Thr Asn Ala Ile Asn Ile Leu Ala Gly Ile Asn Gly
180 185 190
Leu Glu Ala Gly Gln Ser Leu Val Ile Ser Ala Ser Ile Ile Val Phe
195 200 205
Asn Leu Val Glu Leu Glu Gly Asp Tyr Arg Asp Asp His Val Phe Ser
210 215 220
Leu Tyr Phe Met Ile Pro Phe Phe Phe Thr Thr Leu Gly Leu Leu Tyr
225 230 235 240
His Asn Trp Tyr Pro Ser Gln Val Phe Val Gly Asp Thr Phe Cys Tyr
245 250 255
Phe Ala Gly Met Thr Phe Ala Val Val Gly Ile Leu Gly His Phe Ser
260 265 270
Lys Thr Met Leu Leu Phe Phe Ile Pro Gln Val Phe Asn Phe Leu Tyr
275 280 285
Ser Leu Pro Gln Leu Leu His Ala Ile Pro Cys Pro Arg His Arg Ile
290 295 300
Pro Arg Leu Asn Pro Lys Thr Gly Lys Leu Glu Met Ser Tyr Ser Lys
305 310 315 320
Phe Lys Thr Lys Asn Leu Ser Phe Leu Gly Thr Phe Ile Leu Lys Val
325 330 335
Ala Glu Arg Leu Gln Leu Val Thr Val His Arg Gly Glu Ser Glu Asp
340 345 350
Gly Ala Phe Thr Glu Cys Asn Asn Met Thr Leu Ile Asn Leu Leu Leu
355 360 365
Lys Ile Phe Gly Pro Ile His Glu Arg Asn Leu Thr Leu Leu Leu Leu
370 375 380
Leu Leu Gln Ile Leu Ser Ser Ala Val Thr Phe Ser Ile Arg Tyr Gln
385 390 395 400
Leu Val Arg Leu Phe Tyr Asp Val
405
<210> 4
<211> 408
<212> PRT
<213> 智人
<400> 4
Met Trp Ala Phe Ser Glu Leu Pro Met Pro Leu Leu Ile Asn Leu Ile
1 5 10 15
Val Ser Leu Leu Gly Phe Val Ala Thr Val Thr Leu Ile Pro Ala Phe
20 25 30
Arg Gly His Phe Ile Ala Ala Arg Leu Cys Gly Gln Asp Leu Asn Lys
35 40 45
Thr Ser Arg Gln Gln Ile Pro Glu Ser Gln Gly Val Ile Ser Gly Ala
50 55 60
Val Phe Leu Ile Ile Leu Phe Cys Phe Ile Pro Phe Pro Phe Leu Asn
65 70 75 80
Cys Phe Val Lys Glu Gln Cys Lys Ala Phe Pro His His Glu Phe Val
85 90 95
Ala Leu Ile Gly Ala Leu Leu Ala Ile Cys Cys Met Ile Phe Leu Gly
100 105 110
Phe Ala Asp Asp Val Leu Asn Leu Arg Trp Arg His Lys Leu Leu Leu
115 120 125
Pro Thr Ala Ala Ser Leu Pro Leu Leu Met Val Tyr Phe Thr Asn Phe
130 135 140
Gly Asn Thr Thr Ile Val Val Pro Lys Pro Phe Arg Pro Ile Leu Gly
145 150 155 160
Leu His Leu Asp Leu Gly Ile Leu Tyr Tyr Val Tyr Met Gly Leu Leu
165 170 175
Ala Val Phe Cys Thr Asn Ala Ile Asn Ile Leu Ala Gly Ile Asn Gly
180 185 190
Leu Glu Ala Gly Gln Ser Leu Val Ile Ser Ala Ser Ile Ile Val Phe
195 200 205
Asn Leu Val Glu Leu Glu Gly Asp Cys Arg Asp Asp His Val Phe Ser
210 215 220
Leu Tyr Phe Met Ile Pro Phe Phe Phe Thr Thr Leu Gly Leu Leu Tyr
225 230 235 240
His Asn Trp Tyr Pro Ser Arg Val Phe Val Gly Asp Thr Phe Cys Tyr
245 250 255
Phe Ala Gly Met Thr Phe Ala Val Val Gly Ile Leu Gly His Phe Ser
260 265 270
Lys Thr Met Leu Leu Phe Phe Met Pro Gln Val Phe Asn Phe Leu Tyr
275 280 285
Ser Leu Pro Gln Leu Leu His Ile Ile Pro Cys Pro Arg His Arg Ile
290 295 300
Pro Arg Leu Asn Ile Lys Thr Gly Lys Leu Glu Met Ser Tyr Ser Lys
305 310 315 320
Phe Lys Thr Lys Ser Leu Ser Phe Leu Gly Thr Phe Ile Leu Lys Val
325 330 335
Ala Glu Ser Leu Gln Leu Val Thr Val His Gln Ser Glu Thr Glu Asp
340 345 350
Gly Glu Phe Thr Glu Cys Asn Asn Met Thr Leu Ile Asn Leu Leu Leu
355 360 365
Lys Val Leu Gly Pro Ile His Glu Arg Asn Leu Thr Leu Leu Leu Leu
370 375 380
Leu Leu Gln Ile Leu Gly Ser Ala Ile Thr Phe Ser Ile Arg Tyr Gln
385 390 395 400
Leu Val Arg Leu Phe Tyr Asp Val
405
<210> 5
<211> 408
<212> PRT
<213> 猕猴
<400> 5
Met Trp Ala Phe Ser Glu Leu Pro Met Pro Leu Leu Val Asn Leu Ile
1 5 10 15
Val Ser Leu Leu Gly Phe Val Ala Thr Val Thr Leu Ile Pro Ala Phe
20 25 30
Arg Gly His Phe Ile Ala Ala Arg Leu Cys Gly Gln Asp Leu Asn Lys
35 40 45
Thr Ser Arg Gln Gln Ile Pro Glu Ser Gln Gly Val Ile Ser Gly Ala
50 55 60
Val Phe Leu Ile Ile Leu Phe Cys Phe Ile Pro Phe Pro Phe Leu Asn
65 70 75 80
Cys Phe Val Lys Glu Gln Cys Lys Ala Phe Pro His His Glu Phe Val
85 90 95
Ala Leu Ile Gly Ala Leu Leu Ala Ile Cys Cys Met Ile Phe Leu Gly
100 105 110
Phe Ala Asp Asp Val Leu Asn Leu Arg Trp Arg His Lys Leu Leu Leu
115 120 125
Pro Thr Ala Ala Ser Leu Pro Leu Leu Met Val Tyr Phe Thr Asn Phe
130 135 140
Gly Asn Thr Thr Ile Val Val Pro Lys Pro Phe Arg Pro Ile Leu Gly
145 150 155 160
Leu His Leu Asp Leu Gly Ile Leu Tyr Tyr Val Tyr Met Gly Leu Leu
165 170 175
Ala Val Phe Cys Thr Asn Ala Ile Asn Ile Leu Ala Gly Ile Asn Gly
180 185 190
Leu Glu Ala Gly Gln Ser Leu Val Ile Ser Ala Ser Ile Ile Val Phe
195 200 205
Asn Leu Val Glu Leu Glu Gly Asp Cys Arg Asp Asp His Val Phe Ser
210 215 220
Leu Tyr Phe Met Ile Pro Phe Phe Phe Thr Thr Leu Gly Leu Leu Tyr
225 230 235 240
His Asn Trp Tyr Pro Ser Arg Val Phe Val Gly Asp Thr Phe Cys Tyr
245 250 255
Phe Ala Gly Met Thr Phe Ala Val Val Gly Ile Leu Gly His Phe Ser
260 265 270
Lys Thr Met Leu Leu Phe Phe Met Pro Gln Val Phe Asn Phe Leu Tyr
275 280 285
Ser Leu Pro Gln Leu Leu His Ile Ile Pro Cys Pro Arg His Arg Ile
290 295 300
Pro Arg Leu Asn Ile Lys Thr Gly Lys Leu Glu Met Ser Tyr Ser Lys
305 310 315 320
Phe Lys Thr Lys Ser Leu Ser Phe Leu Gly Thr Phe Ile Leu Lys Val
325 330 335
Ala Glu Ser Leu Arg Leu Val Thr Ile His Gln Ser Asp Thr Glu Asp
340 345 350
Gly Glu Phe Thr Glu Cys Asn Asn Met Thr Leu Ile Asn Leu Leu Leu
355 360 365
Lys Ile Phe Gly Pro Ile His Glu Arg Asn Leu Thr Leu Leu Leu Leu
370 375 380
Leu Leu Gln Ile Leu Gly Ser Ala Phe Thr Phe Ser Ile Arg Tyr Gln
385 390 395 400
Leu Val Arg Leu Phe Tyr Asp Val
405
<210> 6
<211> 408
<212> PRT
<213> 黑猩猩
<400> 6
Met Trp Ala Phe Ser Glu Leu Pro Met Pro Leu Leu Ile Asn Leu Ile
1 5 10 15
Val Ser Leu Leu Gly Phe Val Ala Thr Val Thr Leu Ile Pro Ala Phe
20 25 30
Arg Gly His Phe Ile Ala Ala Arg Leu Cys Gly Gln Asp Leu Asn Lys
35 40 45
Thr Ser Arg Gln Gln Ile Pro Glu Ser Gln Gly Val Ile Ser Gly Ala
50 55 60
Val Phe Leu Ile Ile Leu Phe Cys Phe Ile Pro Phe Pro Phe Leu Asn
65 70 75 80
Cys Phe Val Lys Glu Gln Cys Lys Ala Phe Pro His His Glu Phe Val
85 90 95
Ala Leu Ile Gly Ala Leu Leu Ala Ile Cys Cys Met Ile Phe Leu Gly
100 105 110
Phe Ala Asp Asp Val Leu Asn Leu Arg Trp Arg His Lys Leu Leu Leu
115 120 125
Pro Thr Ala Ala Ser Leu Pro Leu Leu Met Val Tyr Phe Thr Asn Phe
130 135 140
Gly Asn Thr Thr Ile Val Val Pro Lys Pro Phe Arg Pro Ile Leu Gly
145 150 155 160
Leu His Leu Asp Leu Gly Ile Leu Tyr Tyr Val Tyr Met Gly Leu Leu
165 170 175
Ala Val Phe Cys Thr Asn Ala Ile Asn Ile Leu Ala Gly Ile Asn Gly
180 185 190
Leu Glu Ala Gly Gln Ser Leu Val Ile Ser Ala Ser Ile Ile Val Phe
195 200 205
Asn Leu Val Glu Leu Glu Gly Asp Cys Arg Asp Asp His Val Phe Ser
210 215 220
Leu Tyr Phe Met Ile Pro Phe Phe Phe Thr Thr Leu Gly Leu Leu Tyr
225 230 235 240
His Asn Trp Tyr Pro Ser Arg Val Phe Val Gly Asp Thr Phe Cys Tyr
245 250 255
Phe Ala Gly Met Thr Phe Ala Val Val Gly Ile Leu Gly His Phe Ser
260 265 270
Lys Thr Met Leu Leu Phe Phe Met Pro Gln Val Phe Asn Phe Leu Tyr
275 280 285
Ser Leu Pro Gln Leu Leu His Ile Ile Pro Cys Pro Arg His Arg Ile
290 295 300
Pro Arg Leu Asn Ile Lys Thr Gly Lys Leu Glu Met Ser Tyr Ser Lys
305 310 315 320
Phe Lys Thr Lys Ser Leu Ser Phe Leu Gly Thr Phe Ile Leu Lys Val
325 330 335
Ala Glu Ser Leu Gln Leu Val Thr Val His Gln Ser Glu Thr Glu Asp
340 345 350
Gly Glu Phe Thr Glu Cys Asn Asn Met Thr Leu Ile Asn Leu Leu Leu
355 360 365
Lys Ile Leu Gly Pro Ile His Glu Arg Asn Leu Thr Leu Leu Leu Leu
370 375 380
Leu Leu Gln Ile Leu Gly Ser Ala Ile Thr Phe Ser Ile Arg Tyr Gln
385 390 395 400
Leu Val Arg Leu Phe Tyr Asp Val
405
<210> 7
<211> 408
<212> PRT
<213> 家犬
<400> 7
Met Trp Ala Phe Pro Glu Leu Pro Met Pro Leu Leu Val Asn Leu Val
1 5 10 15
Gly Ser Leu Leu Gly Phe Val Ala Thr Val Thr Leu Ile Pro Ala Phe
20 25 30
Arg Gly His Phe Ile Ala Ala His Leu Cys Gly Gln Asp Leu Asn Lys
35 40 45
Thr Gly Arg Gln Gln Ile Pro Glu Ser Gln Gly Val Ile Ser Gly Ala
50 55 60
Val Phe Leu Ile Ile Leu Phe Cys Phe Ile Pro Phe Pro Phe Leu Asn
65 70 75 80
Cys Phe Met Glu Glu Gln Cys Lys Ala Phe Pro His His Glu Phe Val
85 90 95
Ala Leu Ile Gly Ala Leu Leu Ala Ile Cys Cys Met Ile Phe Leu Gly
100 105 110
Phe Ala Asp Asp Val Leu Asn Leu Arg Trp Arg His Lys Leu Leu Leu
115 120 125
Pro Thr Ala Ala Ser Leu Pro Leu Leu Met Val Tyr Phe Thr Asn Phe
130 135 140
Gly Asn Thr Thr Ile Val Val Pro Lys Pro Phe Arg Pro Ile Leu Gly
145 150 155 160
Leu His Leu Asp Leu Gly Ile Leu Tyr Tyr Val Tyr Met Gly Leu Leu
165 170 175
Ala Val Phe Cys Thr Asn Ala Ile Asn Ile Leu Ala Gly Ile Asn Gly
180 185 190
Leu Glu Ala Gly Gln Ser Leu Val Ile Ser Ala Ser Ile Ile Val Phe
195 200 205
Asn Leu Val Glu Leu Glu Gly Asp Tyr Arg Asp Asp His Val Phe Ser
210 215 220
Leu Tyr Phe Met Ile Pro Phe Phe Phe Thr Thr Leu Gly Leu Leu Tyr
225 230 235 240
His Asn Trp Tyr Pro Ser Gln Val Phe Val Gly Asp Thr Phe Cys Tyr
245 250 255
Phe Ala Gly Met Thr Phe Ala Val Val Gly Ile Leu Gly His Phe Ser
260 265 270
Lys Thr Met Leu Leu Phe Phe Met Pro Gln Val Phe Asn Phe Leu Tyr
275 280 285
Ser Leu Pro Gln Leu Leu His Ile Ile Pro Cys Pro Arg His Arg Ile
290 295 300
Pro Arg Leu Asn Thr Lys Thr Gly Lys Leu Glu Met Ser Tyr Ser Lys
305 310 315 320
Phe Lys Thr Lys Ser Leu Ser Phe Leu Gly Asn Phe Ile Leu Lys Val
325 330 335
Ala Ala Ser Leu Gln Leu Val Thr Val His Gln Ser Glu Asn Glu Asp
340 345 350
Gly Ala Phe Thr Glu Cys Asn Asn Met Thr Leu Leu Asn Leu Leu Leu
355 360 365
Lys Val Leu Gly Pro Met His Glu Arg Asn Leu Thr Leu Leu Leu Leu
370 375 380
Leu Leu Gln Ile Leu Gly Ser Ala Val Thr Phe Ser Ile Arg Tyr Gln
385 390 395 400
Leu Val Arg Leu Phe Tyr Asp Val
405
<210> 8
<211> 408
<212> PRT
<213> 豚鼠
<400> 8
Met Trp Ala Phe Ser Glu Val Pro Ile Pro Leu Leu Val Asn Leu Ile
1 5 10 15
Gly Ser Leu Leu Gly Phe Val Ala Thr Leu Thr Leu Ile Pro Ala Phe
20 25 30
Arg Gly His Phe Ile Ala Ala Arg Leu Cys Gly Gln Asp Leu Asn Lys
35 40 45
Thr Asn Arg Gln Gln Ile Pro Glu Ser Gln Gly Val Ile Ser Gly Ala
50 55 60
Val Phe Leu Ile Ile Leu Phe Cys Phe Ile Pro Phe Pro Phe Leu Asn
65 70 75 80
Cys Phe Val Lys Glu Gln Cys Lys Ala Phe Pro His His Glu Phe Val
85 90 95
Ala Leu Ile Gly Ala Leu Leu Ala Ile Cys Cys Met Ile Phe Leu Gly
100 105 110
Phe Ala Asp Asp Val Leu Asn Leu Arg Trp Arg His Lys Leu Leu Leu
115 120 125
Pro Thr Ala Ala Ser Leu Pro Leu Leu Met Val Tyr Phe Thr Asn Phe
130 135 140
Gly Asn Thr Thr Ile Val Val Pro Lys Pro Phe Arg Pro Val Leu Gly
145 150 155 160
Leu His Leu Asp Leu Gly Ile Leu Tyr Tyr Val Tyr Met Gly Leu Leu
165 170 175
Ala Val Phe Cys Thr Asn Ala Ile Asn Ile Leu Ala Gly Ile Asn Gly
180 185 190
Leu Glu Ala Gly Gln Ser Leu Val Ile Ser Ala Ser Ile Ile Val Phe
195 200 205
Asn Leu Val Glu Leu Gln Gly Asp Tyr Arg Asp Asp His Val Phe Ser
210 215 220
Leu Tyr Phe Met Ile Pro Phe Phe Phe Thr Thr Leu Gly Leu Leu Tyr
225 230 235 240
His Asn Trp Tyr Pro Ser Gln Val Phe Val Gly Asp Thr Phe Cys Tyr
245 250 255
Phe Ala Gly Met Thr Phe Ala Val Val Gly Ile Leu Gly His Phe Ser
260 265 270
Lys Thr Met Leu Leu Phe Phe Met Pro Gln Val Phe Asn Phe Leu Tyr
275 280 285
Ser Leu Pro Gln Leu Leu His Ile Ile Pro Cys Pro Arg His Arg Ile
290 295 300
Pro Arg Leu Asn Thr Lys Thr Gly Lys Leu Glu Met Ser Tyr Ser Lys
305 310 315 320
Phe Lys Thr Asn Ser Leu Ser Phe Leu Gly Thr Phe Ile Leu Lys Val
325 330 335
Ala Glu Arg Leu Gln Leu Val Thr Val His Arg Ser Glu Gly Glu Asp
340 345 350
Gly Ala Phe Thr Glu Cys Asn Asn Met Thr Leu Ile Asn Leu Leu Leu
355 360 365
Lys Ile Phe Gly Pro Ile His Glu Arg Asn Leu Thr Leu Leu Leu Leu
370 375 380
Leu Leu Gln Ile Val Gly Ser Ala Val Thr Phe Ser Ile Arg Tyr Gln
385 390 395 400
Leu Val Arg Leu Phe Tyr Asp Val
405
<210> 9
<211> 410
<212> PRT
<213> 褐家鼠
<400> 9
Met Trp Ala Phe Pro Glu Leu Pro Leu Pro Leu Pro Leu Leu Val Asn
1 5 10 15
Leu Ile Gly Ser Leu Leu Gly Phe Val Ala Thr Val Thr Leu Ile Pro
20 25 30
Ala Phe Arg Ser His Phe Ile Ala Ala Arg Leu Cys Gly Gln Asp Leu
35 40 45
Asn Lys Leu Ser Arg Gln Gln Ile Pro Glu Ser Gln Gly Val Ile Ser
50 55 60
Gly Ala Val Phe Leu Ile Ile Leu Phe Cys Phe Ile Pro Phe Pro Phe
65 70 75 80
Leu Asn Cys Phe Val Glu Glu Gln Cys Lys Ala Phe Pro His His Glu
85 90 95
Phe Val Ala Leu Ile Gly Ala Leu Leu Ala Ile Cys Cys Met Ile Phe
100 105 110
Leu Gly Phe Ala Asp Asp Val Leu Asn Leu Arg Trp Arg His Lys Leu
115 120 125
Leu Leu Pro Thr Ala Ala Ser Leu Pro Leu Leu Met Val Tyr Phe Thr
130 135 140
Asn Phe Gly Asn Thr Thr Ile Val Val Pro Lys Pro Phe Arg Trp Ile
145 150 155 160
Leu Gly Leu His Leu Asp Leu Gly Ile Leu Tyr Tyr Val Tyr Met Gly
165 170 175
Leu Leu Ala Val Phe Cys Thr Asn Ala Ile Asn Ile Leu Ala Gly Ile
180 185 190
Asn Gly Leu Glu Ala Gly Gln Ser Leu Val Ile Ser Ala Ser Ile Ile
195 200 205
Val Phe Asn Leu Val Glu Leu Glu Gly Asp Tyr Arg Asp Asp His Val
210 215 220
Phe Ser Leu Tyr Phe Met Met Pro Phe Phe Phe Thr Thr Leu Gly Leu
225 230 235 240
Leu Tyr His Asn Trp Tyr Pro Ser Gln Val Phe Val Gly Asp Thr Phe
245 250 255
Cys Tyr Phe Ala Gly Met Thr Phe Ala Val Val Gly Ile Leu Gly His
260 265 270
Phe Ser Lys Thr Met Leu Leu Phe Phe Met Pro Gln Val Phe Asn Phe
275 280 285
Leu Tyr Ser Leu Pro Gln Leu Phe Gln Ile Ile Pro Cys Pro Arg His
290 295 300
Arg Met Pro Arg Leu Asn Thr Lys Thr Gly Lys Leu Glu Met Ser Tyr
305 310 315 320
Ser Lys Phe Lys Thr Lys Ser Leu Ser Phe Leu Gly Thr Phe Ile Leu
325 330 335
Lys Val Ala Glu Ser Leu Arg Leu Val Thr Val His Arg Gly Glu Ser
340 345 350
Glu Asp Gly Ala Phe Thr Glu Cys Asn Asn Met Thr Leu Ile Asn Leu
355 360 365
Leu Leu Lys Val Phe Gly Pro Thr His Glu Arg Asn Leu Thr Leu Phe
370 375 380
Leu Leu Leu Leu Gln Val Leu Ser Ser Ala Val Thr Phe Ser Ile Arg
385 390 395 400
Tyr Gln Leu Val Arg Leu Phe Tyr Asp Val
405 410
<210> 10
<211> 410
<212> PRT
<213> 小家鼠
<400> 10
Met Trp Ala Phe Pro Glu Leu Pro Leu Pro Leu Pro Leu Leu Val Asn
1 5 10 15
Leu Ile Gly Ser Leu Leu Gly Phe Val Ala Thr Val Thr Leu Ile Pro
20 25 30
Ala Phe Arg Ser His Phe Ile Ala Ala Arg Leu Cys Gly Gln Asp Leu
35 40 45
Asn Lys Leu Ser Gln Gln Gln Ile Pro Glu Ser Gln Gly Val Ile Ser
50 55 60
Gly Ala Val Phe Leu Ile Ile Leu Phe Cys Phe Ile Pro Phe Pro Phe
65 70 75 80
Leu Asn Cys Phe Val Glu Glu Gln Cys Lys Ala Phe Pro His His Glu
85 90 95
Phe Val Ala Leu Ile Gly Ala Leu Leu Ala Ile Cys Cys Met Ile Phe
100 105 110
Leu Gly Phe Ala Asp Asp Val Leu Asn Leu Arg Trp Arg His Lys Leu
115 120 125
Leu Leu Pro Thr Ala Ala Ser Leu Pro Leu Leu Met Val Tyr Phe Thr
130 135 140
Asn Phe Gly Asn Thr Thr Ile Val Val Pro Lys Pro Phe Arg Trp Ile
145 150 155 160
Leu Gly Leu His Leu Asp Leu Gly Ile Leu Tyr Tyr Val Tyr Met Gly
165 170 175
Leu Leu Ala Val Phe Cys Thr Asn Ala Ile Asn Ile Leu Ala Gly Ile
180 185 190
Asn Gly Leu Glu Ala Gly Gln Ser Leu Val Ile Ser Ala Ser Ile Ile
195 200 205
Val Phe Asn Leu Val Glu Leu Glu Gly Asp Tyr Arg Asp Asp His Ile
210 215 220
Phe Ser Leu Tyr Phe Met Ile Pro Phe Phe Phe Thr Thr Leu Gly Leu
225 230 235 240
Leu Tyr His Asn Trp Tyr Pro Ser Arg Val Phe Val Gly Asp Thr Phe
245 250 255
Cys Tyr Phe Ala Gly Met Thr Phe Ala Val Val Gly Ile Leu Gly His
260 265 270
Phe Ser Lys Thr Met Leu Leu Phe Phe Met Pro Gln Val Phe Asn Phe
275 280 285
Leu Tyr Ser Leu Pro Gln Leu Phe His Ile Ile Pro Cys Pro Arg His
290 295 300
Arg Met Pro Arg Leu Asn Ala Lys Thr Gly Lys Leu Glu Met Ser Tyr
305 310 315 320
Ser Lys Phe Lys Thr Lys Asn Leu Ser Phe Leu Gly Thr Phe Ile Leu
325 330 335
Lys Val Ala Glu Asn Leu Arg Leu Val Thr Val His Gln Gly Glu Ser
340 345 350
Glu Asp Gly Ala Phe Thr Glu Cys Asn Asn Met Thr Leu Ile Asn Leu
355 360 365
Leu Leu Lys Val Phe Gly Pro Ile His Glu Arg Asn Leu Thr Leu Leu
370 375 380
Leu Leu Leu Leu Gln Val Leu Ser Ser Ala Ala Thr Phe Ser Ile Arg
385 390 395 400
Tyr Gln Leu Val Arg Leu Phe Tyr Asp Val
405 410
<210> 11
<211> 1920
<212> DNA
<213> 小家鼠
<400> 11
gttgcttcct aagagcttct tgctggtcag gagggagggt caggtcctag cgtcctagct 60
gggttttgtt cccgctggcg ccggaatcct ctgcgggttg ggagccgcac tgccggctgc 120
cgaggccacg ggattgttcc tggcttacca gttagctgag taggcggcgg ggcggcggcc 180
accggagggt caccatgtgg gccttcccgg agttgcccct gccgctgccg ctgctggtga 240
atttgatcgg ctcgctgttg ggattcgtgg ctacagtcac cctcatccct gccttccgta 300
gccactttat cgccgcgcgc ctctgtggcc aggacctcaa caagctcagc cagcagcaga 360
tcccagagtc ccagggagtg atcagcggtg ctgttttcct tatcatcctc ttctgcttca 420
tccctttccc cttcctgaac tgcttcgtgg aggagcagtg taaggcattc ccccaccatg 480
aatttgtggc cctaataggt gccctccttg ccatctgctg catgatcttc ctggggtttg 540
ctgatgatgt cctcaatctc cgctggcgcc acaagctgct gctgcccaca gctgcctcac 600
tacctctcct catggtctac ttcacaaact ttggcaatac aaccatcgtg gtgcccaagc 660
ccttccgctg gattctgggc ctgcatttgg acttggggat cctgtactac gtctacatgg 720
ggctgcttgc agtgttctgt accaatgcca tcaacatcct ggcgggcatt aatggcctag 780
aggccggtca gtcactagtc atctctgctt ctatcattgt cttcaacctg gtggaactgg 840
aaggtgatta tcgagatgat catatctttt ccctttactt catgatacca tttttcttta 900
ccaccttggg actgctttac cacaactggt acccgtcccg cgtgtttgtg ggagacacct 960
tctgttactt tgcgggcatg acttttgccg tggtggggat cttgggacac ttcagcaaga 1020
ccatgctgct cttctttatg ccacaagtat tcaatttcct ctactcactg cctcagctct 1080
tccatatcat cccctgccct cgacaccgga tgcccagact caacgcaaag acaggcaaac 1140
tggaaatgag ctattccaag ttcaagacca agaacctctc tttcctgggc acctttattt 1200
taaaggtagc agagaacctc cggttagtga cagttcacca aggtgagagt gaggacggtg 1260
ccttcactga gtgtaacaac atgaccctca tcaacttgct acttaaagtc tttgggccta 1320
tacatgagag aaacctcacc ctgctcctgc tgctcctgca ggtcctaagc agcgccgcca 1380
ccttctccat tcgttaccaa ctcgtccgac tcttctatga tgtctgagct ccctgacagc 1440
tgccctttac ctcacagtct ccattggacc tcagccagga ccagcctctg tctggtccga 1500
gatgaccctc tggtccaggc ctcgctgaca cttttgttct cagcttctgc catctgtgac 1560
tactgatatc ctggatggac accttgctgg acttgaagtc cgctagttgg actttgccta 1620
gggctttcat cttgccttgc cctccctttc tgtcccatct gcagcctcac caggtgggct 1680
tgtagcctct attatgcaaa tattcgtagc tcagctttca gagcgctaac tctaaaggaa 1740
ttcacctgag ccttgagaga gaacctgggc tagggctaga gttagggcta catactccaa 1800
ggtgacctca catttgacta tcaaatgaag tgttgtgatt gggaagcgta gaggcagggc 1860
catgtgctca gaacggtgac aataaaggac tgccttttac ttgttaaaaa aaaaaaaaaa 1920
<210> 12
<211> 2150
<212> DNA
<213> 智人
<400> 12
aagtatccgt tcttggctgc ctttctttaa ttgcgtttcc agtactctct cggtgattct 60
actcttgaac ataggatgaa atttggaatc acacttctct tccacttcca tccccaccct 120
ctaatgccca tattaaaaat ggcggccgcc gccttccgca gtaatggttg ttcagcgaac 180
aagatccggg cggaaacagt agataggcgg gtgcagcggg gcagaacata ggttgcctta 240
gagaggttcc ccggtgtccc gacggcggct caagtcagag ttgctgggtt ttgctcagat 300
tggtgtggga agagcctgcc tgtggggagc ggccactcca tactgctgag gcctcaggac 360
tgctgctcag cttgcccgtt acctgaagag gcggcggagc cgggcccctg accggtcacc 420
atgtgggcct tctcggaatt gcccatgccg ctgctgatca atttgatcgt ctcgctgctg 480
ggatttgtgg ccacagtcac cctcatcccg gccttccggg gccacttcat tgctgcgcgc 540
ctctgtggtc aggacctcaa caaaaccagc cgacagcaga tcccagaatc ccagggagtg 600
atcagcggtg ctgttttcct tatcatcctc ttctgcttca tccctttccc cttcctgaac 660
tgctttgtga aggagcagtg taaggcattc ccccaccatg aatttgtggc cctgataggt 720
gccctccttg ccatctgctg catgatcttc ctgggctttg cggatgatgt actgaatctg 780
cgctggcgcc ataagctgct gctacctaca gctgcctcac tacctctcct catggtctat 840
ttcaccaact ttggcaacac gaccattgtg gtgcccaagc ccttccgccc gatacttggc 900
ctgcatctgg acttgggaat cctgtactat gtctacatgg ggctgctggc agtgttctgt 960
accaatgcca tcaatatcct agcaggaatt aacggcctag aggctggcca gtcactagtc 1020
atttctgctt ccatcattgt cttcaacctg gtagagttgg aaggtgattg tcgggatgat 1080
catgtctttt ccctctactt catgataccc ttttttttca ccactttggg attgctctac 1140
cacaactggt acccatcacg ggtgtttgtg ggagatacct tctgttactt tgctggcatg 1200
acctttgccg tggtgggcat cttgggacac ttcagcaaga ccatgctact attcttcatg 1260
ccccaggtgt tcaacttcct ctactcactg cctcagctcc tgcatatcat cccctgccct 1320
cgccaccgca tacccagact caatatcaag acaggcaaac tggagatgag ctattccaag 1380
ttcaagacca agagcctctc tttcttgggc acctttattt taaaggtggc agagagcctc 1440
cagctggtga cagtacacca gagtgagact gaagatggtg aattcactga atgtaacaac 1500
atgaccctca tcaacttgct acttaaagtc cttgggccca tacatgagag aaacctcaca 1560
ttgctcctgc tgctgctgca gatcctgggc agtgccatca ccttctccat tcgatatcag 1620
ctcgttcgac tcttctatga tgtctgagtc ccttgatcat tgtcctttac ctcacagtct 1680
ctaggattcc tgactcaggc tgacctctct ctctggtccc agactgcctc cttgcccagg 1740
cctctctcac tcttcatact cctccagatt ttgttctcag cattttcctt tctctgtgat 1800
cattggcatc ctgggcgttt cttgccctct gctgactact gattggattt tacctatggc 1860
tttctgcaac ttgctactct ctccctctcc atcccatctt tgcagcctca tagggtggga 1920
tacagcagct ttttttgcag ttatccacac tcacatttca gagtcctgac tctcaaggaa 1980
ccactggttt ttgggataga acttgggcca gggctaggaa cacaggctcc acggtgacat 2040
gtcatttgat tgtaaattaa gtgttctgat tagtaagaac taagcagggg gccacatgct 2100
ctcaatggag acaataaagt gttgtctttt tcttattgtt taaaaaaaaa 2150
<210> 13
<211> 1840
<212> DNA
<213> 褐家鼠
<400> 13
gggggctggc gccggaatcc tctgagtgta gggagctgca ctgctggctg ccgaggcctc 60
tggtttgttc ctggcttacc aagttagctg agtaggcggc ggagcggcgg cccccggagg 120
gtcactatgt gggccttccc ggagttacct ctgccgctgc cgctgttggt gaatttgatc 180
ggatcgctgt tgggatttgt ggctaccgtc accctcatcc ctgccttccg tagccacttt 240
atcgccgcgc gtctctgtgg ccaggacctc aacaagctca gccggcagca gatcccagag 300
tcccagggag tgatcagcgg tgctgttttc cttatcatcc tcttctgctt catccctttc 360
cctttcctga actgctttgt ggaggagcag tgtaaggcat tcccccacca tgaatttgtg 420
gccctgatag gtgccctcct tgctatctgc tgcatgatct tcctgggttt tgctgatgac 480
gtactcaatc tgcgatggcg tcataagctg ctgctcccca cagctgcctc actacctctc 540
ctcatggtct acttcactaa ctttggcaat acaaccattg tggtgccgaa gcccttccgc 600
tggattcttg gcctgcattt ggatttgggc atcctgtact atgtctacat gggactgctt 660
gcagtgttct gtaccaatgc catcaacatc ctagcgggaa ttaatggcct agaggctggt 720
caatcactag tcatctctgc ttctattatt gtcttcaacc tggtggagct ggaaggtgat 780
tatcgggacg atcatgtctt ttccctctac ttcatgatgc catttttttt taccaccttg 840
ggattgctgt accataactg gtacccgtct caggtgtttg tgggagacac cttctgttat 900
tttgctggca tgacctttgc cgtggtggga atcttgggac acttcagcaa gaccatgctg 960
ctcttcttta tgccacaagt attcaatttc ctctactcac tgcctcagct ctttcagatc 1020
atcccctgcc ctcgacaccg tatgcccaga ctcaatacga agacaggcaa actggagatg 1080
agctattcca agttcaagac caagagcctc tctttcttgg gcacgtttat tttaaaggta 1140
gcagagagcc tccggctggt gacagttcac cgaggggaga gtgaggatgg tgccttcact 1200
gagtgtaaca acatgaccct catcaacttg ctacttaaag tctttgggcc tacacatgag 1260
agaaacctca cactgttcct gctgctcctg caggttctga gcagcgctgt caccttctcc 1320
attcgttacc agctcgtccg actcttctat gatgtctgag ctccctgacg actgcccttt 1380
accacacagt ctccattgga cctcagccag gacccacctc tgtccgctcc gaccgccttc 1440
tggtccaggc tcagcttctg ccgtcatctg tgactactga catcctggat ggactcctta 1500
gtggacttga cgtccactag ttggacttgc ctatgctttc ttgagtttgc tactccctcc 1560
ctttctgcag cctcaccagg tgggcctgta gcatctttta tgcaaatatt catggctcaa 1620
ctttcagaac cctaactcta aaggaatccc ctgggccttg agagagaacc tgggctaggg 1680
ctagagttag ggcaacatac tccaaggtaa cctcacatct gactatcaaa ttaagtgttc 1740
tgattaggaa gagcagaggc agggccatgt gctcagaatg gtgacaataa aggattgcct 1800
tttacttgcc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1840
<210> 14
<211> 5424
<212> DNA
<213> 猕猴
<400> 14
tattaaaaat ggcggctgcc gccctccgca gtaatagttg ttcagcgaat aaaatccggg 60
cggaaacagt aggtaggctg gttcagtggg ggcagaacct aggttgcctt agagaggttc 120
ttcgaggtcc cgagggcggc tcaagtcaga gttgttggat tctgctcaga ttggtgtggg 180
aagagcctgc ctgtggggag cggccactcc atactgctga ggcctcagga ctgctgctca 240
gcttgccagt tacctgaaga ggcggcggag ccgggcccct gaccggtcac catgtgggcc 300
ttctcggaat tgcccatgcc gctgctggtc aatttgatcg tctcgctgct gggatttgtg 360
gccacagtca ccctcatccc agccttccgg ggccacttca ttgctgcgcg cctctgtggt 420
caggacctca acaaaaccag ccgacaacag atgtgagcag cggcacacgg ttccgggcag 480
ggggcaaggg ctaaggaagg agtggctagg gcaggggcgg ggaccggggt gtttgaccac 540
acgtgaaaac tcagaactaa cccaggcagc ctggaactcg gagaggtgat gagcagaact 600
tattcgcatt ggggaaagga tgggtaggga accttgggta tatcagggac tctagcagtg 660
gtgctttcct ccctccgccc ccctcaccac ttcccaaaat aaaaaaccag gaatgagaag 720
accgctttgg gttattgtaa cacctgcact agtgagtgac cacaccccct ttcctctttc 780
ccctcgcccc cttgctgctg ggccacagcc cagaatccca gggagtgatc agcggtgctg 840
ttttccttat catcctcttc tgcttcatcc ctttcccctt cctgaactgc tttgtgaagg 900
agcagtgtaa ggcattcccc caccatgaag taagtgggtt cgtgggggtt gttgcctgtg 960
gctgggacct gggaggtacc tgagagaatt ggtgttattt gggcttgtgg ggaggggcta 1020
agaaatgata agaaaagaca agaattctta aaaggtgaaa tgggagcagg cttgagtcat 1080
ggacctgccc tagcctcccc cagtttgtgg ccctgatagg tgccctcctt gccatctgct 1140
gcatgatctt cctgggcttt gcggatgatg tactgaatct gcgctggcgc cataagctgc 1200
tgctacccac agctgcctca ctacctctcc tcatggtcta tttcaccaac tttggcaaca 1260
cgaccattgt ggtgccgaag cccttccgcc cgattcttgg cctgcatctg gacttgggta 1320
ggtagtcctg ccactgctac tcctatggca cctacttcag ggcacccttc ctggtgcttc 1380
acattctcct tcaagtgttc cttttctgtc tctgtgtctt cccagatcct ttctggtagc 1440
ccttcatcct atcctctgtc ctcaccactt ttctaaatcc tcctccccta ggtggcacta 1500
cttttcctac catctctccc ttcaggaatc ctgtactatg tctacatggg gctgctggca 1560
gtgttctgta ccaatgccat caatatccta gcaggaatta atggcctaga ggctggccag 1620
tcactagtaa tttctgcttc catcattgtc ttcaacctgg tagagttgga aggtaggtgg 1680
gattgggggt ggggagagag aagtctgaat gttaaaggtg tggcctgata tatgactttg 1740
ggaaattcag ggaaaaaaag caatatgcgt agtaattata gaagataagg gaggctactt 1800
actttgcaaa taatgcagat ttattgaaag tgagaaagaa aaatagcagc cgtgtcattt 1860
atagctggat tggcactaac agctaggcca tgatcttctc ccattgaata taaacaattt 1920
cacagaacct caacgttaca cagggtcatt ctgtgaccat gatggaggaa gaccaaaact 1980
cgacccctcc ctctataatc ctgtttgagc acagataaaa ccacaaaaac actgagcaac 2040
ccacaaaatg gccaagatcc tctctctctg ttaacgtgag ccatgagcga ctgctgcggc 2100
tttccaataa caactcagtt cctaccacct tttattttgt tttttgagac agggtctccc 2160
tctgtcaccc aggctggaga gcagtggcac gatcttagct cactgcatcc tctgactcaa 2220
acgatcctcc tgccccagac tcccaggtag ctggggctac aggcatgcgc caccacacct 2280
ggcaaatttt tgtatttttt gtagagacag ggtttcacca cgttgcctag gctggtcttg 2340
aactcctggg ccgaagtgat ttgtcagcct tggcctccca aagtgctggg attacactct 2400
tgagccactg tggccagcca gttcctacca cttcttagat aaacattaaa atgcttgatc 2460
agagaattat tgttgttttc ttttcttttt cttttttttt tttttttgag acggagtttc 2520
actcttgccc aggctggagt gcaatggtgc gatctcggct cactgcaacc tccacctccc 2580
aggttcaggc gattctcctg cctcagcctc cctagtagct gggattacag gcatgtgcca 2640
tcacgcccag ctagttttgt atttttagta gagatgggat ttctccatgt tggtcaagct 2700
ggtctcaaac tccagacctc aggtgatccg cccacctcgg cctcccaaag tgctgggatt 2760
acaggtgtga gccaccgcac ccggccatga attacacctg ctttctaaca gcacccaatc 2820
cagagcaaaa ctcttacttt cttttaccct ctcccaaaat acccaaaact gcaagcccct 2880
cctaacactc tcttactgag acattccgtg gttcccaatg gtgtgtggtt tctgaagtct 2940
ccctttttac aacaagtcat taaacctagc ttcgaactat agatgtgttt ctagtggtct 3000
ttggctgatg gacatcaaca aatgtttatt aaagctaagt actttttaaa catgatcgta 3060
tttaaatctt gtaatggttt tatgtggcac atgttataat cagccctgtt ttacagatga 3120
gtaaacagat ttagagaagt taaatgtgtc atgatcaaga tcaaggtcac aaagctaaga 3180
agtaaagttg gtgtccaaac tgacatcaga atgggctaaa ccaaatttaa gacagtaact 3240
agtttggaag gctgcatgaa agaggtggaa tattgggaat tgccttgggt gacataaaag 3300
gggtattgag ttcttgaaag tgacttgggt gaggtggatg atacagctgt aaacagaact 3360
tagacaaaaa taggaccatg gtatgcagaa gaagtgggta ttaattttcc cttctttctt 3420
ccttgcttcc aaaggtgatt gtcgggatga tcatgtcttt tccctctact tcatgatacc 3480
cttttttttc accactttgg gattgctgta ccacaactgg taagtaggcc tatggataag 3540
gggaaaaggg gaaaactacc cgaacacatg gcaaagatgg cccttatcat aacccacctt 3600
gtggtggaga ggttaaacct gtgcatacct ccatggaatt ttctgtgtct tcagttggtc 3660
gtattctgaa atttctccct acccaacagt atttggggat gagtgcgtgg aggtcccagg 3720
aatagatgaa ttcagggcct tggatcctgc agagttgctg cacaactgga gtctcctcta 3780
agtcagaact agggtcaggg ctagtacagt gcccataggg tgtgatgtga gagaaaggat 3840
tggtaatgcc tcttgccact ggctcggatc ctctccccca cacaggtacc catcacgggt 3900
gtttgtggga gacaccttct gttactttgc tggcatgacc tttgccgtgg tgggcatctt 3960
gggacacttc agcaagacca tgctactatt cttcatgccc caggtgttca acttcctcta 4020
ctcactgcct cagctcctgc atatcatccc ctgccctcgc caccgcatac ccaggtagcc 4080
gctttggggc ttgaaatgga catcatagcc ttttcacttg ggatatctaa tgccagcctt 4140
tacattgctg tgcaaaggga gtgggcccaa agaagggcta tttccatgtg agtaaccctt 4200
tataacttcc aaagcacatt tatttgcatc atctgatact cacagtggtt ctgataacag 4260
caagcagcag agccagaaat agatctcagg ttgactccac attcaatgct cttcctattg 4320
attagccaca gggaggaggg ttcaaatagt ggcccagtca catgaagctg tcttcccccc 4380
gcagactcaa tatcaagaca ggcaaactgg agatgagcta ttccaagttc aagaccaaga 4440
gcctctcttt cttgggcacc tttattttaa aggtaacagg gtaacaagga ggtaaggccc 4500
taggctgcca tcctgacctt gaggaatggg gaacctaggc ctacatcaga tccaagggga 4560
acttggaagc attaaataga tccacattcc taaagcatag gtattagctg aggttctctt 4620
cacctctggt ccctccaggt ggcagagagc ctccggctgg tgacaataca ccaaagtgat 4680
actgaggatg gtgaattcac tgaatgtaac aacatgaccc tcatcaactt gctacttaaa 4740
atctttgggc ccatacatga gagaaacctc acattgctcc tgctgctgct gcaggtgagg 4800
atggggattg ggtttatacc tccttgtctc cctttctccg tgattcttat tccagtccat 4860
ttctccttgc agatcctggg cagtgccttc accttctcca ttcgatatca gctcgttcga 4920
ctcttctatg atgtctgagt cccttgatca ttgtccttta cctcacagtc tctaggattc 4980
ctgactcagg ctgacctctc tctggtccca gactgcctcc ttgcccaggc ctctctcact 5040
cttcatactc ttccagattt tgttctcagc attttctttt ccctgtgatc actggcatcc 5100
tgggcgtttc ttgcccccta ctgtctactg attggatttt acttatgact ttctgcaact 5160
tgctactctc cctctccatc ctgtctttgc agcctcacag ggtgggatac agaagttttt 5220
tttttgcagt tatccacagt cacatttcag agtcctgact ctcaaggaac tactggtttt 5280
tgggatagaa cttgggccag ggctagggac acaggctcca cagtgacctg ttatttgatt 5340
gtaaattaag tgttctgatt agtaagaagt aagcaggggg ccacatgctc tcaatggaga 5400
caataaagtg ttgtctattt ctta 5424
<210> 15
<211> 5894
<212> DNA
<213> 黑猩猩
<220>
<221> misc_feature
<222> (3408)..(3408)
<223> n为a、c、g或t
<400> 15
aaaccgtagc tgcgtttccg ggaactgagt tgtgtttacc ttggcttccg actatgttgg 60
caacaggttt cctgcaagaa actggcgcgt ctccacaccc tcgtccctcc tccccacccc 120
ctgcctttca atagccatct tcctggagcc ggaggcatcc cagattaagg gagaggtacg 180
ggccctttaa gcttgaccta tggaggcgga cggagctaaa actgacgtgg aaccggaatg 240
tgagcggtgt cagacacgtg gtacaaggag gcattcatct tggaaccggg caattggcat 300
ttccgctctg ggtagtacat ctttaacata atgttaggga agtatccgtt cttggctgcc 360
tttctttaat tgcgtttcca gtactctctc ggtgattcta ctcttgaaca taggatgaaa 420
tttggaatca cacttctctt gcacttccat ccccaccctc taatgcccat attaaaaatg 480
gcggccgccg ccttccgcag taatggttgt tcagcgaaca agatccgggc ggaaacagta 540
gataggcggg tgcagcgggg cagaacatag gttgccttag agaggttctc cggtgtctcg 600
agggcggctc aagttagagt tgttgggttt tgctcagatt ggtgtgggaa gagcctgcct 660
gtggggagcg gccactccat actgctgagg cctcaggact gctgctcagc ttgcccgtta 720
cctgaagagg cggcggagcc gggcccctga ccggtcacca tgtgggcctt ctcggaattg 780
cccatgccgc tgctgatcaa tttgatcgtc tcgctgctgg gatttgtggc cacagtcacc 840
ctcatcccgg ccttccgggg ccacttcatt gctgcgcgcc tctgtggtca ggacctcaac 900
aaaaccagcc gacagcagat gtgagcagcg gcacacgggt ctgggcaggg ggcaagggct 960
aaggaaggag tggctagggc aggggcgggg accggggtgc ttgaccacac gtgaagactc 1020
agaactaacc caggcagcct ggaactcgga gaggtgatga gcagaactta ctcgcattgg 1080
ggaaaggatg ggtagggacc cttgggtata tctgggactc tggcagtggt gctttcctcc 1140
ctccgccccc ctcaccactt accagaataa aaaaccggga atgagaagac cactttgggt 1200
tattgtaaca cctgcactag tgagtgacca cgcccccttt gctcttcccc ctcgccccct 1260
tgctgctggg ccacagccca gaatcccagg gagtgatcag cggtgctgtt ttccttatca 1320
tcctcttctg cttcatccct ttccccttcc tgaactgctt tgtgaaggag cagtgtaagg 1380
cattccccca ccatgaagta agtgggttcg tgggggtgat tgcctgtggc tgggacctgg 1440
gaggtacctg agagaattgg ggttatttgg gcttgtgggg aggggctaag aaattatcag 1500
aaaagacagg aattcttaaa aggtggaatg ggagcaggct tgagtcatgg acctgcccga 1560
gcccccccca gtttgtggcc ctgataggtg ccctccttgc catctgctgc atgatcttcc 1620
tgggctttgc ggatgatgta ctgaatctgc gctggcgcca taaactgctg ctacctacag 1680
ctgcctcact acctctcctc atggtctatt tcaccaactt tggcaacacg accattgtgg 1740
tgcccaagcc cttccgcccg atacttggcc tgcatctgga cttgggtagg tagtcctacc 1800
actgctgccc ctatggcacc tacttcaggg aacccttcct ggtgctccac attctcctcc 1860
aagtgttcct tttctgtctc tgtgtcttcc cagatccttt ctggtagccc ttcatcctat 1920
cgtccgtcct caccactttt ctaaaaattc ttaaatcctc ctcccctagg tggcactact 1980
tcttttccta ccatttctcc ccgcaggaat cctgtactat gtctacatgg ggctgctggc 2040
agtgttctgt accaatgcca tcaatatcct agcaggaatt aacggcctag aggctggcca 2100
gtcactagtc atttctgctt ccatcattgt cttcaacctg gtagagttgg aaggtaggtg 2160
ggattggggg tggggagaga gaagtctgag cattaaaggt gtggcctgat atatgacttt 2220
gggaaattca gggaaaaaaa gcaatatgtg tagtaattat agaagataag ggaagctact 2280
tactttgcaa ataacaatgc agatttatta aaagtgagaa agaaaaatag cagccctgtc 2340
atttatagct ggattggcac taatagctag gccatgatct tctcccattg aatataaaca 2400
gtttcacaga accccaacgt tacacagggt cattctgtga ccatgatgga gcaagactaa 2460
aactagaccc ctccctctgt aatcatgttt gagcacaggc aaaaccacaa gaacactgag 2520
caacccacaa aatggccaag atcccctctc tcggctaaca tgagcgactg ctgctgctct 2580
ccaataacaa ctcagttcct accacttctt tttttttttt ttgagacagg gtctccctct 2640
gtcatgcagg ctggagagca gtggcgcaat cttagctcac tgcatcctct gactcaaacg 2700
atcctcctgc cccagcctcc caagtagctg gggctacagg catgtgccac cacacctggc 2760
aaatttttgt attttttgta gagacagggt ttcaccatgt tccctaggct ggtcttgaac 2820
tcctggactc aagtgatctg ccaggcctcc caaagtgctg ggattcactc ttgagccact 2880
gtgcccagcc agttcctacc atttcttaaa taaacattaa aatgcttgat catagaatta 2940
ctcttgcttt cttttctttt cttttctttt ttttttgaga cggagttttg ttcttgccca 3000
ggccggagta caatggtgcg atctcggctc accgcaacct ccgcctccca ggttcaagcg 3060
attctcctgc ctcagcctcc ctagtagctg ggattacagg cacgtgccac cacgcccagc 3120
taattttgta tttctagtag agacggggtt tctccatgtt ggtcaggctg gtctcgaact 3180
cctgacctca ggtgatctgc ctgcttcagc ctcccaaagt gctgggatta caggcgtgag 3240
tcaccgcacc cggccatgaa ttactcctgc tttctaacag cacccagtcc agagcaaaac 3300
tactttcttt caccctctcc caaaataccc aaaacaaacg ctactacaag cccctcctaa 3360
caccctctta ctgagacatt ccgtggttcc caatggtgtg tggtttcnga agtctccctt 3420
tttacaacaa gtcattaaac ctagctttga gctatagatg tgtttctgat ggtcttggct 3480
gatgaacatc aacaagtgtt tattaaagct aagtactttt taaacactat cttatttaaa 3540
tcttgtaatg gttttatgtg gcagatgtta taatcagccc tgttttacag atgagaaaac 3600
aggcttagag aagtcaaatg tgtcatgatc aagatgaagg tcacaaagct aagaagtaaa 3660
gttggtatcc aaacttacat cagaatgggc taaaccaaat ttaagatagt aactagtttg 3720
gaaggctgca cgaaagaggt ggaatattgg gaattgcctt gggtgacata aaaggagtat 3780
tgagttctta aaagtgactt gggtgaggtg gatgataaca gctgtaaaca gaacttagac 3840
aaaaatagga ccaaggtttg cagaggaagt gggtattaac ttttccttct ttcttccttg 3900
cttccaaagg tgattgtcgg gatgatcatg tcttttccct ctacttcatg ataccctttt 3960
ttttcaccac tttgggattg ctctaccaca actggtaagt aggcctgtgg ataaggggac 4020
aactacctga acacatggca aagatggccc ttatcataac ccaccttgtg gtggtgaagc 4080
taaacctgcg catacctcta tggagttttc tgcgtcttca gttggtagta ttctgaaatt 4140
tctctctacc cagtagtagt tagggatgag tgcgtggagg ccccaggaat agttgaattc 4200
agggccttgg atcctgcaga gttgctgcac aactggagtc tcctctgagt cagaactagg 4260
gtcagggcta gtccagtgcc catagggtgt gatgtgagag aagggattgg taatgcctct 4320
tgccactggc tcggatcctc ttcccccaca caggtaccca tcacgggtgt ttgtgggaga 4380
taccttctgt tactttgctg gcatgacctt tgccgtggtg ggcatcttgg gacacttcag 4440
caagaccatg ctactattct tcatgcccca ggtgttcaac ttcctctact cactgcctca 4500
gctcctgcat atcatcccct gccctcgcca ccgcataccc aggtagccgc tttggggctt 4560
gaaatggaca tcatagcctt ttcacttggg atatctaatg ccagcctata catttgctgt 4620
gcaaagggag tgggcccaaa gaagggctat ttccatgtga gtagcccttt ataacttaca 4680
aagcacattt atttgcataa tctgctacag tggttctgat aacagtaagc agcagagcca 4740
gaaatagatc tcaggttgac tccacattca atgctcttcc tattagccac agggaggagg 4800
gttcaaatag tggcccagtc acatgaagct atcttccccc cgcagactca atatcaagac 4860
aggcaaactg gagatgagct attccaagtt caagaccaag agcctctctt tcttgggcac 4920
ctttatttta aaggtaacag ggtaacaagg aggtaaggcc ctaggctgcc atcctgacct 4980
tgaggaatgg ggaacctagt cctacatcag atccaagggg aacttgaaag cattaaatag 5040
atccacattc ctaaagcata ggtattagct gaggttctct tcacctctgg tccctccagg 5100
tggcagagag cctccagctg gtgacagtac accagagtga gactgaagat ggtgaattca 5160
ctgaatgtaa caacatgacc ctcatcaact tgctacttaa aatccttggg cccatacatg 5220
agagaaacct cacattgctc ctgctgctgc tgcaggtgag gatgggaatc gagtttatac 5280
ctccgtgtct ccctttctgc gtgattctta ctccagtcca tttctccttg cagatcctgg 5340
gcagtgccat caccttctcc attcgatatc agctcgttcg actcttctat gatgtctgag 5400
tcccttgatc attgtccttt acctcacagt ctctaggatt cctgactcag gctgacctct 5460
ctctctggtc ccagactgcc tccttgccca ggcctctctc actcttcata ctcctccaga 5520
ttttgttctc agcattttcc tttctctgtg atcattggca tcctgggcgt ttcttgccct 5580
ctactgacta ctgattggat tttacctatg gctttctgcg acttgctact ctctccctct 5640
ccatcccatc tttgcagcct catagggtgg gatacagcag ctttttttgc agttatccac 5700
actcacattt cagagtcctg actctcaagg aaccactggt ttttgggata gaacttgggc 5760
cagggctagg aacacaggct ccacggtgac atgtcatttg attgtaaatt aagtgttctg 5820
attagtaaga actaagcagg gggccacatg ctctcaatgg agacaataaa gtgttgtctt 5880
tttcttattg ttta 5894
<210> 16
<211> 4557
<212> DNA
<213> 家犬
<400> 16
gtgaggaggc aagtgcggcg ggggacagcc gagggtgcgc gctggaggct cgcgggagtc 60
ctgggggcgc ctcaattcag agttgggttt tgctcaggcc gctgtgggag gatccagcct 120
gtgccgagcg gctgctcctc cccgcggggg gctccgggct accgcccagc tcgcccatta 180
gccgaggcgg cggcagagcg gggcccctgg ctggtcatca tgtgggcctt cccggagttg 240
ccgatgccgc tgctggtgaa tttggtcggc tcgctgctgg gatttgtggc cacggtcacc 300
ctcatccccg ccttccgtgg ccacttcatc gccgcgcacc tctgtggcca ggacctcaac 360
aaaaccggcc ggcagcagat gtgagcggtg gcacccgggt ccggggaggg ggccggcagg 420
gcaagggcgg gacctggggt gcctgacccc gcggacacgc agcgctaacc ccgcagacag 480
ctgcgggctc tgggagacga agggcagcgc tggccaactc tgggaaggga tgttgcagta 540
caggggaccc tcgggtgtat cagggactcc agcgctggtg cccttccacc ccccttcccc 600
gtagatcgct gtaatgcttg ctctagtgag tgaccacgcc ccctctcctc tcccccgccc 660
cctccctttg ctgctgggcc acagcccaga gtcccaggga gtgatcagcg gtgctgtttt 720
ccttatcatc ctcttctgct tcatcccttt ccccttcctg aactgtttta tggaggagca 780
gtgtaaagcc ttcccccatc acgaagtaag tgggtgagtt gggggcggtt gcttggggct 840
ggggcctggg agctacctgg gagagttgtg gttattaggg tttgggtgga ggggctgagg 900
aaggagcgaa gagacgggtg tttttgcaag atgatgtggg cataggcttg agcggtgacc 960
tgcccgagcc tcccccagtt cgtggccctg ataggtgcgc tccttgccat ctgctgcatg 1020
attttcctgg gctttgcgga cgatgtactg aatctgcgct ggcgccacaa gctgctgctg 1080
cctacagctg cctcgctacc tcttcttatg gtctatttca ccaactttgg caacacgacc 1140
attgtggtgc ccaagccttt ccggccgatt cttggcctgc atctggactt gggtgagtag 1200
ccctgtgact gacgtccctg tggcccttac tttggggcac ccttaccctg ggagataatc 1260
tagcagagca tcattcctgg tgctccagat cctcttccaa gtgtccccat cttgttcctg 1320
tgtcttctca gatccgttct gttggtcctt cgtccaatcc tctgtcctca ccacttttct 1380
cagaagaata ttcttaagtc ctcatttcta tggatggcac acttcttact ctcttcttcc 1440
cccagggatc ctgtattatg tttacatggg gctgctggca gtgttctgta ccaatgccat 1500
caatatccta gcaggaatta atggcctaga ggcaggccag tcgctagtta tttctgcttc 1560
catcatcgtc ttcaatctgg tggagctgga aggtaggtga gagtgggagt ctgagtatta 1620
aggaaactgc ctgatacctg gctttgggga attcaggaaa aaataaaagc aatatattaa 1680
gattaaatgt aaagaaaaac agctctgtca ttgacagctg aattggcact aataggtagg 1740
ccatggtctt ctgctgaaca taaacaattt cacagaactt cacaatcaga cgaggtcact 1800
ctatgtccat gatagagtaa agcaaaccca gattcctcca taaacatgtc tgagtatagc 1860
cagaactgca ttttgtgcat cccacaaaaa tgactaggat ctccctcttc tggctaaggt 1920
gagcaattgc ttccttctga taacttggtt ctacttagag aaaactaaga tgctcataga 1980
attacttcca ctgacagcac ccagtcttgg gcaaaacttt gcctccttcc tttctccccc 2040
aaattactca aaacaatcct ataacacatc ttcctaatac ttccctactg aggcatcccc 2100
tggttaccta tggtgcgtgg tctacagtgt ctctcttgtt acacgtcagt aaacccagct 2160
ttgactgcag gtgtgtttct ggtggtcttt ggctgatgga tatcagtgct tattaaaaca 2220
aaatactctt aaagcattta aactttgtaa tgtggcaagt gttctcatga accatatttt 2280
acagttgagg aaacagaggg cgagagaatt taagtgtgtc atgatcaagg tcacacagtt 2340
agaaagtaaa gctagtattc aaacctgggc tgaatgatct aaaccaaatt gaagacagca 2400
acttgtatta ggaagggttc atgaatgagg tggaatatta ggaattgcct gagtgacaca 2460
aaagaagtag tgagttctgg aatgggactt ggaagaggtg gaaagtacag ctggggacag 2520
aacttgagac agaaatagga cccagttatg cagggggaag taccttatca actcatcctt 2580
ctttcttttt cttcttcccc tgcttccaaa ggtgattatc gggatgatca cgtcttttcc 2640
ctctacttta tgataccctt ttttttcacc accttgggat tgctctacca taactggtaa 2700
gtgggccatg tgaacatgta gcaagtatgg tcctgttggt cctgacccaa ctcctgttgg 2760
agaggctaag cctgcgcaca cctgtattga gtgttttctg gatgcctagt tggtaatatt 2820
cttcaattac tctctaccca gttgcagtta gagacaagtg ctgtggagcc cccaagaaga 2880
gatgaattca gggctttggg ttctggaggc ttgttggaag atctggagtt tcctccgggc 2940
caggactaga gtcagggcta gtccagggtt cagggcgtgt aatatgagag aaaagactga 3000
tagtgcctcc tgccactggc tcagatcctc tcccccacac aggtacccat cacaggtgtt 3060
tgtgggagat accttctgtt actttgctgg catgaccttt gccgtggtgg gcatcttggg 3120
acacttcagc aagaccatgc tactcttctt catgccccag gtgttcaact tcctctactc 3180
actgcctcag ctcctgcata tcataccctg ccctcgccac cgcattccca ggtagccact 3240
ttggggctta aaagggacat cttagctttt tcacttggga tgcataaagc cagccttctg 3300
catctgctgt gtaaggggaa tgggcccaaa ggagggctct ttccgtgcaa ttagccctta 3360
taaatgacag agcacattca cccacataat ctgatcagct ctgatcacac agtggtaagc 3420
agagccggaa acagatcttc aggttgtctg attccacttt cggtactctt cctattaatt 3480
gaccgcagtg tggagagttc ttggagtagt ggcccagtca cataaagctc tcttccccct 3540
gcagactcaa taccaagaca ggcaaactgg agatgagcta ttccaagttc aagaccaaga 3600
gcctctcttt cttgggcaac tttattctaa aggtaacagg gtaacgaggt aaggctctag 3660
gccaccatcc ggaattcagg gcctggggac cctcggcttg catcagatcc aaggggagcc 3720
tggaagcatg aagcagatcc cccattgctg aagcagagtt gaagttctct ccacctctgg 3780
cccctccagg tagcagcgag cctgcagcta gtgacagtgc accagagtga gaatgaggat 3840
ggtgccttca cggagtgtaa caacatgacg ctcctcaact tgctccttaa ggttctcggg 3900
cccatgcatg agagaaacct gactctgctc ctgctgctgc tccaggtgtg gtcagggaag 3960
ggctttgctg gctctggtct ccctttctcc atggctctga ctctggtgtg tttctttctc 4020
ctcacagatc cttggcagtg ctgtcacctt ctccatccgg taccagcttg tccggctctt 4080
ctacgatgtc tgagtccccc aatccttgcc cttcactgca tagtctgcag ggttcctgac 4140
tcaggcctgc ctctttctgg gccaggcacg cttccgggcc caggcctctc tcacctctta 4200
cttttctcca gattttgtac ttagcgattc cgttccgctg tgatcgacat cctgggcctg 4260
tcttgccctg tactgactgt tgattggact ttgcctgtgg ctttcttcaa cttgctgctc 4320
tccctctcta tcccatccct gcggcctccc aaagtgggat actgtgcttt ttatgcagtt 4380
atccaccact cggactctcg aggaatatgt tgggcctggg gatagaaccc tggctgggga 4440
gagggacaca ggctcgaaga tcacttgatt atttgaccat aaattaagta ttctgattcg 4500
taagagcaga ttggggggcc aggtgctccc agtggtgaca ataaagtgtt gtctttt 4557
<210> 17
<211> 5374
<212> DNA
<213> 中国仓鼠
<400> 17
caaggcagag cctaggttgc tttataaaac ctcttgggga agcccgaggg cggttcaaat 60
taagagttgt tgggttttgc cccgcctcgc atgtgaggag cggacactgc tcacggctga 120
gacctcgggg ctgcttccca ccagttagct gagaaggctg cggagctgga acctctggcc 180
actcgccatg tgggccttct ctgaggtacc gattccgctg ctggtgaatt tgatcggctc 240
gctgctggga tttgtggcca cgctcaccct catcccggcc tttcgtggcc actttatcgc 300
tgcgcgcctc tgtggccagg acctcaacaa aaccaaccgg cagcagatgt gagcagtggc 360
acacgggtgt cccgggcagg ggccaggggt gggcaaggca caggcgagct ctgaggtgct 420
taaatgtgcg tacgaaccaa atctaactgg agttgtccgg gaccctggga ctcgatggcc 480
agaagtggtt agcactgggg aatgctaagg aaggggaccc ttgagtgaga acatccagcg 540
gcgcctgcct ccccccgccc cccactgccc tcccgctcca ctgctccccc gcctcactcc 600
tgggaagatc ttttgggtca catggttttt gcactaacca cgcccatttc ttcttccttc 660
tccaccccct tgctgcgggg ccacagccca gaatcccagg gagtgatcag cggtgccgtt 720
ttccttatca tcctgttctg cttcatcccc ttccccttct tgaactgctt tgtgaaggag 780
cagtgtaagg ctttccccca ccatgaagta agtgggttcg tgggggcggt tgcctggggc 840
ctgggaggtt cccgagagag ttggggttgt gtggatttga ggaggaggga ctgaggacct 900
agtggaaaag acagaaattt ttgaaagctt gaatggcagt aggcttgagt catgacctgc 960
ccgagcctcc cccagtttgt ggccctcata ggtgcccttc ttgccatctg ctgcatgatt 1020
ttcttgggct tcgcggacga tgtcctgaat ctacgctggc gccataagct gctgctgccc 1080
acagctgcat cactacctct tcttatggtc tattttacca actttggcaa cacaaccatt 1140
gtggtaccca agcccttccg cccagttctt ggcttgcatc tggatttggg tgagtatccc 1200
tgctgctaca gcccctgtgg cacttatttc aagtcaccct ccccccaaag gtgcccagca 1260
gagcaccctt cttgatgttc cacactcccc tgtttttgtt ccgtccctgt gaatgctcag 1320
gttctctctt gtgccctgtc attgtgtgtt ctgttttcag aataccgtta gatcctttcc 1380
tagctgtcac tgctttttat actatgtctt gcagggatcc tgtactatgt ctacatgggg 1440
ctcctggcag tgttctgtac caatgccatc aatatcctag caggaattaa cggcctagag 1500
gccggccagt cattggtcat ctctgcttcc atcattgtct tcaacctggt ggagctgcaa 1560
ggttggtggg aagagagaga tctcagtgtt cagagaattg cctgatatat agctttgaga 1620
aaaggggggc ttatagaaga tagggaaagc tatttacttt gcaaataaca atgaagagtt 1680
acttgagtag gaggaagaaa aatagcagtc tgtcatttat agctggattg gcatgagtag 1740
ctagaccatg actgtttcct attggacata aatagtttca tagaacccca gcatgagaga 1800
ggggcgccct gaccgtggtg aaacaagaca gaaaccagac ttctcccact gtaatcatgt 1860
ctgaacaccg acaaaagcac aggaacaaag tcagcccaaa catcccttct tgtctaatgt 1920
gagagggtat agcttctttg cagtaacaac tcagttcctg ctacttctta agttgttcag 1980
tcagaaaatt acttctgctt tctgacatca ggcagtccag agcacaactt ttccttgcag 2040
cctccccaga accacttaaa gtgaatccta ttgtaagtcc cttctaacaa cctttagagt 2100
acctgcccag catgaggcct tgggtacagt ccccagtatc tctgtttgca tgcatgtaca 2160
catacccaca tgcacacact gaacttactt attgaaggta agcaatattt atttgcattt 2220
tttgtgtgtg tgacaaaatt tcactatgta attcagaata gccttgaatt cactatgtag 2280
cctaggccgt cctcgaactt acagtgataa tcctgcctca gcttcctaag tgctaagatt 2340
caaggtatgc actaccaggc cagctaagaa agcaattttt aaactaggta tggtggcaca 2400
catcactaat tctaacactc tgggagactt gggcaggaag atcatgagtt tgagctcagc 2460
ctgggcactt ggtaagtctc tgtttctaga aataaaacat ggagtggtga tacacacctg 2520
taatcccagc attcatgagg ctggggcagg aggatcacca caaggtcaag acctgcctgg 2580
gttacataag caagttcaag gccagcgtga actacgtagt gagaccctgc ctcaaacaaa 2640
caaataaata aataaacatg atcctgagtt tggttcccag tactcccccc aataaatgaa 2700
atgaaatgaa agagctgggg aggcagctta gtgctaaggt ccaggacccc atgtgaaggc 2760
agctgcgtgt atgtgttatc agccctgttt catacactag ataataaaac tggttttcaa 2820
acttaagtca gcatgtctgg acaaagtgaa gactttaact tgtttttgac ggtttcatga 2880
cagtagtgag ctattgggaa ctgcctgggt accatcaaag gaataatgag gggctgggga 2940
tttagctcag cggcataagc gcctgccttg caagcaggca gtcatgagtt tgatccccgg 3000
taccgataaa aaggaaaaag acaaaaaaaa aaggaataat gagtttttga aggtggctcg 3060
ggtgagggga ggtggcaaca gagacaggga tgcgacagac aaaatgaaga gcaggggaca 3120
taggggagat gggtgttcac ttttccttct ttgtcctttg tttcccaagg tgattaccgg 3180
gatgatcatg tcttttccct ctacttcatg ataccgtttt ttttcaccac cttgggattg 3240
ctgtatcata actggtaagg aggctgtggc tcagggaaaa ggaaaacaac taactggtca 3300
ttggacaaag atggtcctga tcttaaccca gctcctgaaa gacaggctga acttgcgcat 3360
acttttgctc agtgttttct gggtattcag ttggtggatt gcctcccccc gccccgtttt 3420
ttttttgaga cacctgtggc ctctcgagtg ctaggccagt gctttactac tgagtcttgc 3480
cctctagtat tctcaggttt gttcttttct cagcagttgg agacaagtgc tatggagccc 3540
caggaataat tatggggact tgcgttctgc agacttgcta gaccctcctg tccgaactag 3600
gatcagggga gcatgtgtgg tggctcacac ctgtaatccc agcactcagg agactgaggc 3660
aggaggatta ccatgagatc gagggcaccc tcagctcaca tagtgacttt gaggccagcc 3720
tggactacat agcgagactc ttgtctccaa aagaaaaaaa aagaaagaat aaaagaacag 3780
gggtctgagt tcgtccagta cctagcctgt gtgatgtgag agaaaagact gtgatgcctc 3840
ttggcactgg cttggatcct ttcccccaca caggtaccca tctcaggtgt ttgtgggaga 3900
caccttctgt tactttgctg gcatgacctt tgccgtggta ggcatcttgg gacacttcag 3960
caagaccatg ctgctcttct tcatgccaca ggtgttcaac ttcctctact cgctgcctca 4020
gctcctgcat atcatcccct gtcctcgcca ccgtataccc aggtagctgt ttgggggctg 4080
gaaagccttt ctactgggat gtctaacacc aggctctaca tttgctgtgc aaagaatgtg 4140
ggcccatagg aaggctaact tttttcatgt aggtggccct ttaagtttac acagcacgtt 4200
tacttccata atctcattta atactcacag tagttctgat catagagtag taagcagcag 4260
agccagaaat agatctcact ccatgatcag tgtttttctt agtcattaac ggaagaaagt 4320
tttttgagta gtgacccagt cacacgaagc tgtctttccc ctacagactc aataccaaga 4380
caggcaaact ggagatgagc tattccaagt tcaagaccaa cagcctttct ttcttgggca 4440
cctttatttt aaaggtaaca aggtaacgag gaggtaaggc cccaggccac catcctgaac 4500
ttgggacatg ggggacccag gcctacatta gatctagagg gagcttggaa gcattaagca 4560
gagccctgtt cctgacatac aggtattggc tgaagttttt ctgtctgtct ctggtctctc 4620
taggtagcag agagactcca gctagtgaca gtgcaccgga gtgagggtga ggacggggcc 4680
ttcactgagt gtaacaacat gaccctcatc aacttgctgc ttaaaatctt tgggcccata 4740
catgagagga acctcacatt gctcttgctg ctgctacagg tgagcctggg gtgagtttgt 4800
gcctcctcat gtccttttct ctatggttct tattctagtc catttctcct tgcagatcgt 4860
gggcagtgct gtcaccttct ccattcgata ccagcttgtc cgactcttct atgacgtttg 4920
agttcctgaa gattgccctc tgccacactg tctccagggg tcctgctcag gccagccagt 4980
ctggttctgt gggcctctcc caatcttcag tctccttcag atttattccc agcatttttc 5040
ataacctatg attatcaaca tcctgagcca tttttgccct ccagcaacta ctaactggac 5100
tttgcctatg gcctccttca acttgccact ctccctaccc atcacagcca gaggcttgat 5160
gtagcagctt ttatgcagat atccacaact cagctttcag agtcctcact ctcaaagaac 5220
atgctgggcc ttgagataga acctgagcta gggctaggga cactggtgca agggtgattt 5280
gatatttgat tataaattaa gtgttctgat tagtaagaca gaaggggagc ctggtgctcc 5340
caacggtgac aataaagtgt tacctttttc ttgt 5374

Claims (32)

1.一种分离的哺乳动物宿主细胞,所述宿主细胞包含外源性引入的核酸,所述核酸包含哺乳动物衣霉素(Tn)抗性基因、第一所关注基因GOI和至少一个调控元件,
其中所述Tn抗性基因可操作地连接到所述第一所关注基因GOI和所述至少一个调控元件,
其中所述第一所关注基因GOI编码抗体轻链或其抗原结合片段、抗体重链或其抗原结合片段、或Fc融合蛋白或其片段,并且
其中所述哺乳动物Tn抗性基因编码由SEQ ID NO:3或SEQ ID NO:4的氨基酸序列组成的蛋白。
2.根据权利要求1所述的分离的哺乳动物宿主细胞,其中所述Tn抗性基因包含选自以下的核酸序列:SEQ ID NO:2或SEQ ID NO:12。
3.根据权利要求1所述的分离的哺乳动物宿主细胞,其中所述至少一个调控元件选自启动子、核糖体结合位点或增强子。
4.根据权利要求1所述的分离的哺乳动物宿主细胞,其中所述第一所关注基因GOI可操作地连接到启动子。
5.根据权利要求1所述的分离的哺乳动物宿主细胞,其还包含外源性添加的第二所关注基因GOI。
6.根据权利要求5所述的分离的哺乳动物宿主细胞,其中所述第二所关注基因GOI编码糖蛋白。
7.根据权利要求6所述的分离的哺乳动物宿主细胞,其中所述糖蛋白选自抗体轻链或其抗原结合片段、抗体重链或其抗原结合片段、Fc融合蛋白或其片段、配体以及受体或其配体结合片段。
8.根据权利要求1所述的分离的哺乳动物宿主细胞,其中所述细胞选自CHO-K1、COS-7、HEK293、肿瘤细胞、淋巴细胞或视网膜细胞。
9.根据权利要求8所述的分离的哺乳动物宿主细胞,其中所述细胞为CHO-K1细胞。
10.一种包含核酸的载体,其中所述核酸包含哺乳动物衣霉素(Tn)抗性基因、第一所关注基因GOI和至少一个调控元件,
其中所述Tn抗性基因可操作地连接到所述第一所关注基因GOI和所述至少一个调控元件,
其中所述第一所关注基因GOI编码抗体轻链或其抗原结合片段、抗体重链或其抗原结合片段、或Fc融合蛋白或其片段,
其中所述哺乳动物Tn抗性基因编码由SEQ ID NO:3或SEQ ID NO:4的氨基酸序列组成的蛋白。
11.根据权利要求10所述的载体,其中所述Tn抗性基因包含选自以下的核酸序列:SEQID NO:2或SEQ ID NO:12。
12.根据权利要求10所述的载体,其中所述至少一个调控元件选自启动子、核糖体结合位点或增强子。
13.根据权利要求10所述的载体,其中所述第一所关注基因GOI可操作地连接到启动子。
14.根据权利要求10所述的载体,其还包含第二所关注基因GOI。
15.根据权利要求14所述的载体,其中所述第二所关注基因GOI编码糖蛋白。
16.根据权利要求15所述的载体,其中所述糖蛋白选自抗体轻链或其抗原结合片段、抗体重链或其抗原结合片段、Fc融合蛋白或其片段、配体以及受体或其配体结合片段。
17.一种方法,其包括:
(a)提供哺乳动物宿主细胞群,
(b)将根据权利要求10-16中任一项所述的载体通过转染引入步骤(a)的细胞群中,
(c)在Tn存在下培养步骤(b)的细胞群,从而获得包含所述载体的所述核酸的细胞转染子。
18.根据权利要求17所述的方法,其中所述Tn的浓度为至少1μg/mL。
19.根据权利要求17所述的方法,其中所述Tn的浓度为1μg/mL、2.5μg/ml或5μg/mL。
20.根据权利要求17所述的方法,其中所述细胞转染子通过在连续增加浓度的Tn存在下培养步骤(b)的细胞群来获得。
21.根据权利要求20所述的方法,其中所述培养包括在1μg/mL的第一Tn浓度下培养,随后在2.5μg/ml或5μg/mL的第二Tn浓度下培养。
22.根据权利要求17所述的方法,所述方法还包括从培养的细胞分离从所述第一所关注基因GOI表达的第一所关注蛋白POI。
23.根据权利要求20所述的方法,所述方法还包括从培养的细胞分离从所述第一所关注基因GOI表达的第一所关注蛋白POI。
24.根据权利要求17所述的方法,其中所述哺乳动物宿主细胞选自CHO-K1、COS-7、HEK293、肿瘤细胞、淋巴细胞或视网膜细胞。
25.根据权利要求17所述的方法,其中所述哺乳动物宿主细胞为CHO-K1。
26.一种制备重组的所关注蛋白POI的方法,其中所述方法包括:
a.提供根据权利要求1-9中任一项所述的哺乳动物宿主细胞;和
b.在Tn存在下培养所述细胞,以从所述所关注基因GOI表达所关注蛋白POI。
27.根据权利要求26所述的方法,其中所述Tn的浓度为至少1μg/mL。
28.根据权利要求26所述的方法,其中所述Tn的浓度为1μg/mL、2.5μg/ml或5μg/mL。
29.根据权利要求26所述的方法,其中所述培养包括在连续增加浓度的Tn存在下培养。
30.根据权利要求29所述的方法,其中所述培养包括在1μg/mL的第一Tn浓度下培养,随后在2.5μg/ml或5μg/mL的第二Tn浓度下培养。
31.根据权利要求26所述的方法,其中所述哺乳动物宿主细胞选自CHO-K1、COS-7、HEK293、肿瘤细胞、淋巴细胞或视网膜细胞。
32.根据权利要求26所述的方法,其中所述哺乳动物宿主细胞为CHO-K1。
CN201580044100.7A 2014-08-19 2015-08-19 重组蛋白的高效选择性 Active CN107075549B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110402963.4A CN113293139A (zh) 2014-08-19 2015-08-19 重组蛋白的高效选择性

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462039416P 2014-08-19 2014-08-19
US62/039,416 2014-08-19
PCT/US2015/045793 WO2016028838A1 (en) 2014-08-19 2015-08-19 Efficient selectivity of recombinant proteins

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202110402963.4A Division CN113293139A (zh) 2014-08-19 2015-08-19 重组蛋白的高效选择性

Publications (2)

Publication Number Publication Date
CN107075549A CN107075549A (zh) 2017-08-18
CN107075549B true CN107075549B (zh) 2021-04-20

Family

ID=55347784

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580044100.7A Active CN107075549B (zh) 2014-08-19 2015-08-19 重组蛋白的高效选择性
CN202110402963.4A Pending CN113293139A (zh) 2014-08-19 2015-08-19 重组蛋白的高效选择性

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202110402963.4A Pending CN113293139A (zh) 2014-08-19 2015-08-19 重组蛋白的高效选择性

Country Status (27)

Country Link
US (4) US9732357B2 (zh)
EP (2) EP3901274A1 (zh)
JP (3) JP7115851B2 (zh)
KR (2) KR102406976B1 (zh)
CN (2) CN107075549B (zh)
AR (1) AR102333A1 (zh)
AU (3) AU2015305565B9 (zh)
BR (1) BR112017003074A2 (zh)
CA (1) CA2957036A1 (zh)
CY (1) CY1124079T1 (zh)
DK (1) DK3183359T3 (zh)
EA (1) EA035340B1 (zh)
ES (1) ES2849728T3 (zh)
HR (1) HRP20210301T1 (zh)
HU (1) HUE054069T2 (zh)
IL (3) IL287020B (zh)
LT (1) LT3183359T (zh)
MA (1) MA40371B1 (zh)
MX (2) MX2017002203A (zh)
MY (1) MY191745A (zh)
PL (1) PL3183359T3 (zh)
PT (1) PT3183359T (zh)
RS (1) RS61371B1 (zh)
SG (2) SG10201707859RA (zh)
SI (1) SI3183359T1 (zh)
TW (3) TWI777374B (zh)
WO (1) WO2016028838A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AR102333A1 (es) 2014-08-19 2017-02-22 Regeneron Pharma Selectividad eficiente de proteínas recombinadas
EP3749754A4 (en) * 2018-02-08 2021-10-20 Applied Stemcell, Inc. PROCEDURE FOR SCREENING VARIANTS OF A TARGET
WO2021079909A1 (ja) 2019-10-23 2021-04-29 キヤノン株式会社 セラミックス物品の製造方法およびセラミックス物品

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4634665A (en) 1980-02-25 1987-01-06 The Trustees Of Columbia University In The City Of New York Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
US4656134A (en) 1982-01-11 1987-04-07 Board Of Trustees Of Leland Stanford Jr. University Gene amplification in eukaryotic cells
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
US6077835A (en) 1994-03-23 2000-06-20 Case Western Reserve University Delivery of compacted nucleic acid to cells
KR970029803A (ko) 1995-11-03 1997-06-26 김광호 반도체 메모리장치의 프리차지 회로
US5972650A (en) 1997-06-26 1999-10-26 Brigham And Women's Hospital Tetracycline repressor regulated mammalian cell transcription and viral replication switch
US6281005B1 (en) 1999-05-14 2001-08-28 Copernicus Therapeutics, Inc. Automated nucleic acid compaction device
US6919183B2 (en) 2001-01-16 2005-07-19 Regeneron Pharmaceuticals, Inc. Isolating cells expressing secreted proteins
ATE496134T1 (de) 2002-03-29 2011-02-15 Xoma Technology Ltd Multigene vectoren und methoden für eine erhöhte expression von rekombinanten polypeptiden
US8673589B2 (en) 2002-05-29 2014-03-18 Regeneron Pharmaceuticals, Inc. Inducible eukaryotic expression system
US7384744B2 (en) * 2002-11-29 2008-06-10 Boehringer Ingelheim Pharma Gmbh & Co., Kg Expression vector, methods for the production of heterologous gene products and for the selection of recombinant cells producing high levels of such products
JP2005027599A (ja) * 2003-07-09 2005-02-03 Nara Institute Of Science & Technology 植物由来遺伝子を用いた遺伝子導入植物の選抜法
EP1586585A1 (de) * 2004-04-14 2005-10-19 F. Hoffmann-La Roche Ag Expressionssystem zur Herstellung von IL-15/Fc-Fusionsproteinen und ihre Verwendung
CA2671365C (en) 2006-12-07 2020-07-21 Dow Agrosciences Llc Use of dsm-2 gene as a selectable marker for selecting herbicidal resistant plants
PL2150617T3 (pl) 2007-06-04 2015-04-30 Regeneron Pharma Wzmocniona ekspresja i regiony stabilności
KR100927803B1 (ko) * 2007-11-23 2009-11-23 한국생명공학연구원 식물 형질전환체를 선별하기 위한 마커로서 gpt 유전자
ME03057B (me) * 2007-12-07 2019-01-20 Zymogenetics Inc Molekuli humanizovanih antitela specifični za il-31
WO2009131681A2 (en) * 2008-04-22 2009-10-29 Rutgers, The State University Hcv e2 construct compositions and methods
WO2010077297A1 (en) * 2008-12-09 2010-07-08 Halozyme, Inc. Extended soluble ph20 polypeptides and uses thereof
EP2674495A1 (en) 2012-06-14 2013-12-18 Sanofi CHO expression system
AR102333A1 (es) 2014-08-19 2017-02-22 Regeneron Pharma Selectividad eficiente de proteínas recombinadas

Also Published As

Publication number Publication date
HUE054069T2 (hu) 2021-08-30
SG10201707859RA (en) 2017-10-30
SG11201701121UA (en) 2017-03-30
US9732357B2 (en) 2017-08-15
TWI719945B (zh) 2021-03-01
ES2849728T3 (es) 2021-08-20
EP3183359B1 (en) 2020-12-16
TW201615833A (zh) 2016-05-01
IL295361A (en) 2022-10-01
EP3901274A1 (en) 2021-10-27
LT3183359T (lt) 2021-02-25
TWI777374B (zh) 2022-09-11
EA201790241A1 (ru) 2017-06-30
JP7260510B2 (ja) 2023-04-18
US20210340564A1 (en) 2021-11-04
IL295361B1 (en) 2023-04-01
AU2020205336B2 (en) 2022-11-10
AU2023200752B2 (en) 2024-02-29
US11085053B2 (en) 2021-08-10
CA2957036A1 (en) 2016-02-25
TW202246506A (zh) 2022-12-01
JP7115851B2 (ja) 2022-08-09
TWI832364B (zh) 2024-02-11
AU2020205336A1 (en) 2020-08-06
AU2015305565B2 (en) 2020-04-30
EP3183359A4 (en) 2018-04-04
AR102333A1 (es) 2017-02-22
JP2017525368A (ja) 2017-09-07
AU2015305565B9 (en) 2020-05-21
MY191745A (en) 2022-07-13
JP2020174681A (ja) 2020-10-29
SI3183359T1 (sl) 2021-03-31
BR112017003074A2 (pt) 2018-03-06
IL287020B (en) 2022-09-01
MX2017002203A (es) 2017-05-22
AU2023200752A1 (en) 2023-03-09
HRP20210301T1 (hr) 2021-04-02
US20160053280A1 (en) 2016-02-25
WO2016028838A1 (en) 2016-02-25
US10457959B2 (en) 2019-10-29
DK3183359T3 (da) 2021-02-01
AU2015305565A1 (en) 2017-03-09
MA40371B1 (fr) 2021-03-31
RS61371B1 (sr) 2021-02-26
TW202124716A (zh) 2021-07-01
US20200063159A1 (en) 2020-02-27
KR102406976B1 (ko) 2022-06-10
KR20220080215A (ko) 2022-06-14
PT3183359T (pt) 2021-02-03
CN113293139A (zh) 2021-08-24
IL250531B (en) 2021-10-31
IL295361B2 (en) 2023-08-01
US20170335341A1 (en) 2017-11-23
KR102556383B1 (ko) 2023-07-17
KR20170055481A (ko) 2017-05-19
MX2021009154A (es) 2021-09-10
EP3183359A1 (en) 2017-06-28
IL250531A0 (en) 2017-03-30
CY1124079T1 (el) 2022-05-27
CN107075549A (zh) 2017-08-18
EA035340B1 (ru) 2020-05-29
PL3183359T3 (pl) 2021-08-02
IL287020A (en) 2021-12-01
MA40371A (fr) 2017-06-28
JP2023076667A (ja) 2023-06-01

Similar Documents

Publication Publication Date Title
AU2020205336B2 (en) Efficient selectivity of recombinant proteins
AU2019203955C1 (en) Multipartite signaling proteins and uses thereof
AU2015263150B2 (en) Lentiviral vectors
CA2195303C (en) Method for selecting high-expressing host cells
KR20210056329A (ko) 신규 cas12b 효소 및 시스템
DK2753355T3 (en) ONCOLYTIC HERP SIMPLEX VIRUSES AND THERAPEUTIC APPLICATIONS THEREOF
US20030119104A1 (en) Chromosome-based platforms
KR102516697B1 (ko) 조작된 캐스케이드 구성성분 및 캐스케이드 복합체
KR20210144861A (ko) 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위
JP2000308497A (ja) 安定化配列を有するベクターおよび真核宿主細胞
KR20220098384A (ko) 폼페병 및 리소좀 장애를 치료하기 위한 간-특이적 프로모터를 포함하는 치료적 아데노-관련 바이러스
US20240207318A1 (en) Chimeric costimulatory receptors, chemokine receptors, and the use of same in cellular immunotherapies
CN107207603A (zh) 趋化因子‑免疫球蛋白融合多肽,其组合物、制备方法以及用途
KR20220078607A (ko) 융합 단백질들을 이용한 tcr 재프로그래밍을 위한 조성물 및 방법들
CN110437334B (zh) 全人源抗金黄色葡萄球菌α-溶血素重组抗体
CN113039272A (zh) 转录调节元件及其在增强异源蛋白表达中的应用
CN114195867B (zh) 一种rsv融合前f蛋白、表达质粒、细胞株和rsv疫苗组合物
KR20220140620A (ko) 강화된 발현 시스템 및 그 사용방법
RU2814721C2 (ru) Транспозиция конструкций нуклеиновой кислоты в эукариотические геномы с транспозазой из amyelois
RU2817770C2 (ru) Интеграция конструкций нуклеиновой кислоты в эукариотические клетки с транспозазой из oryzias
CA2522166C (en) Lambda integrase mutein for use in recombination
CN101068835A (zh) 可溶性ZcytoR21、抗ZcytoR21抗体和结合伴侣以及在炎症中的使用方法
WO2024042332A1 (en) Retroviral vectors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant