CN108064279A - 噬菌体λ整合酶的突变体 - Google Patents

噬菌体λ整合酶的突变体 Download PDF

Info

Publication number
CN108064279A
CN108064279A CN201580054345.8A CN201580054345A CN108064279A CN 108064279 A CN108064279 A CN 108064279A CN 201580054345 A CN201580054345 A CN 201580054345A CN 108064279 A CN108064279 A CN 108064279A
Authority
CN
China
Prior art keywords
nucleic acid
sequence
lambda integrase
seq
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580054345.8A
Other languages
English (en)
Other versions
CN108064279B (zh
Inventor
F·葛达西
箫嘉玮
P·德罗格
H·玛坎加
S·H·维贾雅钱德拉
S·彼得
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agency for Science Technology and Research Singapore
Original Assignee
Agency for Science Technology and Research Singapore
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency for Science Technology and Research Singapore filed Critical Agency for Science Technology and Research Singapore
Publication of CN108064279A publication Critical patent/CN108064279A/zh
Application granted granted Critical
Publication of CN108064279B publication Critical patent/CN108064279B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10311Siphoviridae
    • C12N2795/10322New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及包含在如SEQ ID NO:1所示的λ整合酶的第43、319和336位的至少一个氨基酸突变的λ整合酶。本发明进一步涉及包含编码突变型λ整合酶的核苷酸序列的核酸分子和含有这些核酸分子的宿主细胞。本发明还涉及在所述突变型λ整合酶和序列特异性重组试剂盒存在下将目标核酸重组到靶核酸中的方法。

Description

噬菌体λ整合酶的突变体
技术领域
本发明涉及噬菌体λ整合酶的突变体和包含编码此类突变体的核苷酸序列的核酸分子。
背景技术
噬菌体整合酶是介导两个DNA识别序列(噬菌体附着位点attP和细菌附着位点attB)之间的单向位点特异性重组的酶。基于它们的催化模式,可将整合酶分为两个主要家族,即酪氨酸重组酶和丝氨酸重组酶。
酪氨酸家族整合酶如λ整合酶利用催化酪氨酸来介导链切割,倾向于识别更长的attP序列,并且需要由噬菌体或宿主细菌编码的其它蛋白质。
来自丝氨酸家族的噬菌体整合酶更大,使用催化丝氨酸用于链切割,识别更短的attP序列,并且不需要宿主辅因子。噬菌体整合酶介导相对较短,但长度在基因组规模上足以是特异性的两个不同序列之间的有效位点特异性重组。
这些性质使得噬菌体整合酶对于活的真核细胞(尤其是具有大基因组的那些,如哺乳动物和大多数植物)的遗传操作变得越来越重要,对于这些真核细胞进行精确操纵基因组的工具很少。
对于λ整合酶在催化位点特异性DNA重组方面的用途已经过广泛研究。例如,两种突变型λ整合酶(Int-h(E174K)和其衍生物Int-h/218)(E174K/E218K))已经被描述,并且显示在人细胞中至少与相应的分子内重组反应一样有效地催化分子间重组反应。虽然已显示臂位点序列的存在在体内通过Int-h/218增加核心位点的重组,但考虑到在人类基因组中不存在attB位点,重组反应在非同源位点中以基本上随机的方式发生。
这使得难以以受控的可再现的方式改造细胞系。
因此,仍然需要提供在催化位点特异性重组反应方面具有更大效率和特异性的突变体整合酶。
发明内容
在一个方面,提供了包含选自由I43F、E319G和D336V组成的组的至少一个氨基酸突变的λ整合酶。
在另一方面,提供了包含在如SEQ ID NO:1所示的λ整合酶的第336、319和43位中的至少一个位置处的氨基酸突变的λ整合酶。
在另一方面,提供了一种核酸分子。所述核酸分子包含编码如本文所述的突变体的核苷酸序列。
在又一方面,提供了一种宿主细胞。所述宿主细胞包含如本文所述的核酸分子。
在再一方面,提供了将目标核酸重组到靶核酸中的方法。所述方法包括在如本文所述的突变体存在下使包含目标核酸的靶向核酸与靶核酸接触。
在又一方面,提供了序列特异性重组试剂盒。所述试剂盒包含可***有目标核酸的靶向核酸和如本文所述的突变体。
定义
本文所用的以下词语和术语应当具有所指示的含义:
术语“突变体”是指因突变或重组DNA程序而产生的蛋白质。
术语“Int”或“整合酶”是指λ噬菌体整合酶蛋白质。
如本文所用的“核酸”是指呈任何可能的构型如线性化单链的、双链的或其组合的任何核酸。核酸可包括但不限于DNA分子(例如,cDNA或基因组DNA)、RNA分子(例如,mRNA)、使用核苷酸类似物或使用核酸化学生成的DNA或RNA的类似物、cDNA合成的DNA、DNA和RNA的共聚物、寡核苷酸和PNA(蛋白质核酸)。DNA或RNA可是基因组来源或合成来源的并且可以是单链的或双链的。相应的核酸可另外含有非天然核苷酸类似物和/或连接到亲和标签或标记。
如本文所用的核苷酸包括核苷单磷酸、核苷二磷酸和核苷三磷酸。核苷酸还包括经修饰的核苷酸,如但不限于硫代磷酸酯核苷酸和脱氮嘌呤核苷酸以及其它核苷酸类似物。
“attB/attP反应”或“B/P反应”是由Int介导的attB识别位点和attP识别位点之间的重组反应。
“attH/attPH反应”或“H/PH反应”是由Int介导的attH识别位点和attPH识别位点之间的重组反应。
“att位点”是DNA分子上用于整合酶或整合酶复合物的附着位点。如本文所用的“att位点”通常可与下文更详细描述的“识别位点”互换使用。通常,“att位点”用于指代特定类型的识别位点,如attB、attP、attL或attR位点。
“染色体整合的”或“整合的”是指通过与宿主DNA形成的共价键将外源基因或核苷酸序列整合到宿主基因组中。
“缺失反应”和“切除反应”可互换使用,并且是指在相同DNA分子上且相对于彼此同向定向的两个识别位点之间的重组反应。该反应导致位于两个识别位点之间的核苷酸序列的去除。
“同向定向”是指两个或更多个识别位点的定向,使得识别位点的15个碱基对的核心区域沿相同的5'到3'方向定向。如本文所用的“同向重复”是指相对于彼此同向定向的两个或更多个识别位点。
“供体”、“供体分子”、“供体序列”和“供体DNA”可互换使用,是指已被选择为使用定点重组与靶DNA序列进行重组的核苷酸序列。供体核苷酸序列可以是任何核苷酸序列,如例如基因、表达盒、启动子、分子标志物、可选标志物、可见标志物、这些中任一个的一部分等。供体DNA序列包含至少一个重组酶识别位点。
如本文所用的“内源的”意指“相同来源的”,即来源于宿主细胞。
如本文所用的“表达盒”包含能够引导或驱使另一核苷酸序列在适当的宿主细胞中表达的核苷酸序列。表达盒通常包含可操作地连接到核苷酸序列如目标核苷酸序列的启动子,该核苷酸序列例如可操作地连接到终止信号。表达盒通常还包含核苷酸序列的恰当翻译所需的序列。目标核苷酸序列通常编码目标蛋白质,但也可编码目标功能性RNA,例如反义RNA或非翻译RNA,其在有义或反义方向上抑制特定基因(例如,反义RNA)的表达。包含核苷酸序列的表达盒可以是嵌合的,意味着其组分中的至少一种相对于其其它组分中的至少一种是异源的。表达盒可包含已经以重组形式获得并且可用于异源表达的内源DNA。然而,通常,表达盒相对于宿主是异源的;也就是说,表达盒的特定DNA序列不天然存在于宿主细胞中,并且必须通过转化事件被引入宿主细胞或宿主细胞的先祖细胞中。表达盒中核苷酸序列的表达可处于任何适合的启动子的控制下,如例如组成型启动子或仅当宿主细胞暴露于某些特定外部刺激时才起始转录的诱导型启动子。在多细胞生物体的情况下,启动子还可对特定组织或器官或发育阶段是特异性的。
“外源”基因或DNA是指通常在宿主生物体中未被发现但可通过基因转移引入的基因或核苷酸序列。未整合到宿主细胞基因组中的外源基因和DNA被称为“染色体外”。
术语“基因”广泛用于包含与生物功能相关的核苷酸序列的任何区段。因此,基因可包含具有或不具有其表达所需的调控序列的编码序列。此外,基因可包含外显子和内含子序列,或可仅包含外显子序列。基因还可包含例如形成用于其它蛋白质的识别序列的非表达DNA区段。如本文所用的“基因的部分”或“不完整的基因”意指基因的非功能性的一部分,因为其不含有功能所需的所有序列。该部分可以是基因的5'部分(即,不存在该基因的3'端的序列),或该部分可以是基因的3'部分(即,不存在该基因的5'端的序列)。5'部分和3'部分本身可以是非功能性的,但是当5'部分和3'部分可操作地连接时,基因是“功能性的”或“完整的”。
“目标基因”、“目标序列”、“目标核酸”和“目标DNA”可互换使用,并且包括在被转移到细胞时赋予该细胞期望特征的任何核苷酸序列,所述期望特征例如病毒抗性、昆虫抗性、抗生素胁迫抗性、疾病抗性、对其它害虫的抗性、除草剂耐受性、改善的营养价值、改善的在工业过程中的性能或改变的繁殖能力。目标序列还可以是转移到细胞系或哺乳动物或植物中用于产生有商业价值的酶或代谢物的序列。在本上下文中,如本文所用的“靶核酸”是指含有至少一个识别位点的核苷酸序列。靶核苷酸序列可以是基因、表达盒、启动子、分子标志物、上述中任一个的一部分等。靶核酸可被稳定转化到宿主细胞中以产生包含整合到基因组中染色***置的靶序列的被转化细胞系。因此,在一些实施方案中,靶核酸可包括基因组DNA。基因组DNA可包含在细胞中。在其它实施方案中,靶核酸可包括选自由attH序列(SEQ ID NO:7)和attH4X序列(SEQ ID NO:31)组成的组的序列。
“基因组”是指生物体的完整遗传物质。
如本文所用的“异源的”意指“具有不同的天然来源”,即代表非天然状态。例如,如果宿主细胞用来源于另一生物体、特别是另一物种的基因转化,则该基因相对于该宿主细胞和该宿主细胞的携带该基因的后代都是异源的。类似地,“异源的”是指来源于天然或原始细胞类型并***相同的天然或原始细胞类型中,但以非天然状态(例如,不同的拷贝数、处于不同的调控元件的控制下等)存在的核苷酸序列。
“鉴别”重组产物意指检测到重组产物并将其与靶序列和供体序列两者区分开。存在许多用于鉴别重组产物的手段。例如,可使用可选标记物基因,由此位点特异性整合导致可选标记物仅在重组产物中与启动子可操作地连接。或者,可使用可见标志物基因,由此标志物基因表达的获得或缺失鉴别重组产物。或者,可使用阴性可选标记物基因,由此标志物基因的表达的缺失或缺少鉴别重组产物。另外,可使用具有靶序列和/或供体序列的特征的分子标志物,使得分子标志物模式对于重组产物是独特的。
如本文所用的“整合酶”是指噬菌体λ来源的整合酶,包括野生型整合酶和多种突变或修饰的整合酶中的任一种。如本文所用的“整合酶复合物”是指包含整合酶和整合宿主因子(IHF)的复合物。如本文所用的“整合酶复合物”还可指包含整合酶、整合宿主因子和噬菌体λ来源的切除酶(Xis)的复合物。此外,如本文所用的“Int”是指“整合酶”和“整合酶复合物”两者。
“整合酶介导的重组产物”是在整合酶或整合酶复合物存在下靶序列和供体序列之间形成的重组产物。整合酶介导的重组导致靶上至少一个重组酶识别位点和供体上至少一个重组酶识别位点之间的链交换,由此形成重组产物。与上文所定义的用法一致,“Int介导的重组”或“Int介导的重组产物”意指由整合酶或整合酶复合物介导的重组或重组产物。
“分子内重组”是指单个核酸分子上的识别位点之间的重组。不同分子上的识别位点之间的重组被称为“分子间重组”。
“染色体内重组”是指单个染色体上的识别位点之间的重组。不同染色体上的识别位点之间的重组被称为“染色体间重组”。
“反向反应”是指相对于彼此处于反向定向的两个att位点之间的分子内重组反应。例如,反向反应可通过处于反向定向的attB位点和attP位点或处于反向定向的attL位点和attR位点之间的分子内反应来实现。
“反向定向”是指两个识别位点的定向,使得识别位点的15个碱基对的核心区域沿5'到3'相反的方向定向。
“可操作地连接”或“操性地连接”是指物理或功能相互作用的两个或更多个核苷酸序列之间的关系。例如,如果启动子或调控核苷酸序列和编码RNA或蛋白质的核苷酸序列位于使得调控核苷酸序列将影响编码或结构核苷酸的表达水平的位置,则这两个序列被认为可操作地连接。如果基因的5'部分和基因的3'部分位于形成功能基因的位置,则这两个部分操作性地或可操作地连接。
“识别位点”或“重组位点”是指可被重组酶蛋白质识别的核苷酸序列。识别位点是通过重组酶和任何相关的辅助蛋白质进行结合、切割和链交换的核苷酸序列。整合酶或整合酶复合物识别包括attB、attL、attR、attP和/或此类位点的适合突变的识别位点。attB位点可以是大约25-30bp,并且包含两个7bp核心序列和一个7bp重叠(或间隔物)区,而attP位点可以是大约240bp,并且包含整合酶和一种或多种辅助蛋白质的结合位点。attB位点和attP位点可通过Int重组在一起,或者,attL位点和attR位点可通过Int重组在一起。
“重组酶”是指能够进行DNA的位点特异性重组的酶。重组酶具有内切核酸酶和连接酶活性。重组酶可作为单一蛋白质或作为蛋白质复合物的一部分起作用。如本文所用的整合酶和整合酶复合物是重组酶。
通常,如果重组酶介导的重组发生在同一分子上的两个重组酶识别位点之间,则重组反应导致两侧是两个识别位点的序列的缺失或反向。如果重组酶介导的重组发生在不同分子上的两个重组酶识别位点之间(例如,在靶序列上的重组酶识别位点和供体序列上的重组酶识别位点之间),则重组反应导致来自一个分子的序列***另一个分子中(例如,供体序列***靶分子中)。当能够重组的特定识别位点存在于靶和供体两者上(例如,靶上的attB位点和供体上的attP位点,或靶上的attL位点和供体上的attR位点)时,重组产物代表两个位点之间的核苷酸序列交换,产生两个新位点。这些新位点中的每一个都含有来自供体分子和靶分子两者的原始识别位点的一部分。例如,当重组发生在靶上的attB位点和供体上的attP位点之间时,在重组产物中产生attL位点和attR位点。另外,新形成的attL位点和attR位点在一侧侧接有从供体分子获得的序列,并且在另一侧侧接有从靶分子获得的序列。
“调控元件”包含参与赋予宿主细胞表达另一核苷酸序列(例如目的序列)的核苷酸序列。调控元件可包括可操作地连接到目标核苷酸序列和终止信号的启动子。调控元件通常还涵盖用于目标核苷酸序列的恰当翻译的序列。
“可选标志物”或“可选标志物基因”是指其在细胞中的表达赋予该细胞在特定条件下的选择优势的核苷酸序列。用可选标志物基因转化的细胞所具有的选择性优势可以是例如与未转化的细胞的能力相比在阴性选择剂如抗生素或除草剂存在下改善的生长能力。或者,相对于未转化的细胞,转化的细胞所具有的选择性优势可以是增强的利用特定化合物作为营养素、生长因子或能量源的能力。
或者,转化的细胞所具有的选择性优势可以是先前所具有的性状或特征的损失,实现所谓的“阴性选择”。在这最后一种情况下,使宿主细胞暴露于仅对未缺失表达存在于亲本细胞中的特定性状或特征(例如阴性可选标志物基因)的能力的细胞有毒的化合物或与该化合物接触,该亲本细胞通常是转基因亲本细胞。
如本文所用的“定点重组”是指各自包含至少一个识别位点的两个核苷酸序列之间的重组。
“位点特异性”意指在特定核苷酸序列,可位于宿主细胞的基因组中的特定位置。核苷酸序列可对于宿主细胞是内源性的,位于宿主基因组中其天然位置或位于基因组中的某另一位置,或者它可以是先前已通过多种已知方法中的任一种***宿主细胞的基因组中的异源核苷酸序列。
“稳定转化的”是指含有已稳定整合到宿主细胞基因组中的目标核苷酸序列的宿主细胞。
“靶”、“靶分子”、“靶序列”和“靶DNA”可互换使用,是指含有至少一个重组酶识别位点的核苷酸序列。靶核苷酸序列可以是基因、表达盒、启动子、分子标志物、这些中任一个的一部分等。靶序列可被稳定转化到细胞中以产生包含整合到基因组中的染色***置的靶序列的“靶系”。
“靶整合事件”或“靶事件”是指在整合酶或整合酶复合物存在下靶序列和供体序列之间形成的重组产物。特别地,它是指当靶序列稳定转化到细胞中时因Int介导的重组而使供体序列整合到靶序列中。
“可见标志物基因”是指其在转化细胞中的表达可能不赋予该细胞优势但可被检测或使其可见的基因或核苷酸序列。可见标志物的示例包括但不限于β-葡糖醛酸糖苷酶(GUS)、荧光素酶(LUC)和荧光蛋白质(如例如绿色荧光蛋白质(GFP)或青色荧光蛋白质(CFP))。
词语“基本上”并不排除“完全”,例如“基本上不含”Y的组合物可完全不含Y。在需要的情况下,可从本发明的定义中省略词语“基本上”。
除非另有说明,否则术语“包含”、“包括”和其语法变体意在表示“开放”或“包含性”用语,使得它们包括列举的要素,而且还允许包括额外的、未提及的要素。
如本文所用的术语“约”在制剂的组分的浓度的背景下,通常意指所述值的+/-5%,更通常所述值的+/-4%,更通常所述值的+/-3%,更通常所述值的+/-2%,甚至更通常所述值的+/-1%,且甚至更通常所述值的+/-0.5%。
在本公开通篇内,某些实施方案可以范围形式被公开。应当理解,呈范围形式的描述仅仅是为了方便和简洁且不应当被解释为对所公开范围的范畴的不可改变的限制。因此,对一个范围的描述应当被认为已经具体地公开了所述范围内的所有可能的子范围以及单个数值。例如,对一个范围(例如1到6)的描述应当被认为已经公开了子范围(例如1到3、1到4、1到5、2到4、2到6、3到6等)以及所述范围内的单个数字(例如,1、2、3、4、5和6)。不管所述范围的宽度如何,这都是适用的。不管所述范围的宽度如何,这都是适用的。
某些实施方案也可在本文中被宽泛地和一般地描述。落入该一般公开的每个较窄的类和亚属的组合也构成本公开的一部分。这包括带有将任何主题从一般性中去除的附带条件或负面限制来一般性地描述实施方案,而不管被去除的内容是否在本文中明确述及。
任选实施方案的公开
现在将公开包含第43、319和336位的至少一个氨基酸突变的λ整合酶的示例性的非限制性实施方案。
在本上下文中,存在于本文所述的λ整合酶中的突变可包含任何突变,如λ整合酶的天然氨基酸序列的取代、缺失和***,只要所得多肽折叠成三维稳定结构并显示期望的(增强的)重组活性即可。本文所述的λ整合酶可包含保守突变和/或非保守突变。可能的突变的示例是保守修饰的变异,其中改变是用化学上类似的氨基酸取代氨基酸。除了上述之外,λ整合酶还可包含在如上文所述的区域以外的突变,如保守突变。此类保守取代是本领域技术人员已知的,并且可包括以下之间的取代:1)丙氨酸、丝氨酸、苏氨酸;2)天冬氨酸和谷氨酸;3)天冬酰胺和谷氨酰胺;4)精氨酸和赖氨酸;5)异亮氨酸、亮氨酸、甲硫氨酸、缬氨酸;和6)苯丙氨酸、酪氨酸、色氨酸。
如本文所用的“氨基酸残基”是指任何氨基酸,并且可呈D形式或L形式,或可通过酰胺键掺入多肽中的氨基酸模拟物。
因此,带正电荷的氨基酸残基可例如是在生理条件下带正电荷的天然存在的氨基酸残基,如精氨酸或赖氨酸,或非天然模拟物,如α-氨基被烷基化以产生具有永久正电荷的(季)铵盐的赖氨酸残基。
在一个实施方案中,λ整合酶包含在如SEQ ID NO:1所示的λ整合酶的第43、319和336位的至少一个氨基酸取代。
在另一实施方案中,如本文所述的λ整合酶包含在如SEQ ID NO:1所示的λ整合酶的第43、319和336位的氨基酸取代。
在另一实施方案中,在序列位置43处的氨基酸残基异亮氨酸被芳族氨基酸替代。芳族氨基酸可选自由苯丙氨酸、酪氨酸和色氨酸组成的组。在一个实施方案中,芳族氨基酸是苯丙氨酸。
在另一实施方案中,在序列位置319处的氨基酸残基谷氨酸被甘氨酸替代。
在另一实施方案中,在序列位置336处的氨基酸残基天冬氨酸可被疏水性氨基酸替代。疏水性氨基酸可以是脂族氨基酸。脂族氨基酸可选自由异亮氨酸、亮氨酸和缬氨酸组成的组。在一个实施方案中,脂族氨基酸是缬氨酸。
在又一实施方案中,如本文所述的λ整合酶可包含氨基酸取代I43F、E319G和D336V。
在替代实施方案中,如本文所述的λ整合酶可包含在如SEQ ID NO:1所示的λ整合酶的第336位的氨基酸取代。在序列位置336处的氨基酸残基天冬氨酸可被疏水性氨基酸替代。疏水性氨基酸可以是脂族氨基酸。脂族氨基酸可选自由异亮氨酸、亮氨酸和缬氨酸组成的组。在一个实施方案中,脂族氨基酸是缬氨酸。
如本文所述的λ整合酶中的突变通常在针对重组酶特异性和效率方面是重要的。
如本文所述的λ整合酶可通过本领域技术人员已知的各种选择***产生。例如,先前已经描述了依赖于通过报道基因活化或底物连接的蛋白质进化(SLiPE)来鉴别功能性突变体的细菌选择***。这些选择***是用于改造重组酶中改变的位点特异性的许多不同方法之一。例如,也已经描述了酵母中的遗传选择***,其产生展示改变的DNA结合亲和力的HIV-1整合酶变体。作为另一示例,体外区室化(IVC)可用作用于产生和鉴别变体(例如本文所述的本发明的突变体)的选择***。
噬菌体λ整合酶是大的酪氨酸重组酶家族的原型成员。通常,噬菌体λ整合酶包含高级四聚体结构内协作以形成引起重组的动态复合物的3个不同结构域。这3个结构域是N末端DNA结合结构域(氨基酸残基1-64);核心DNA结合结构域(氨基酸残基65-175)和C末端催化结构域(氨基酸残基176-356)。噬菌体λ整合酶是噬菌体生命周期的中心,促进其基因组分别受控整合到宿主细菌染色体中以及从宿主细菌染色体中受控切除。在其天然功能中,噬菌体λ整合酶能够在不存在高能辅因子的情况下催化一对靶序列(被称为att位点)之间的位点特异性重组。靶序列(噬菌体基因组中的attP、细菌基因组中的attB)包含由7bp“重叠”区间隔开的一对7bp反向核心结合位点。如本文所用的“重叠区”或“重叠序列”定义重组序列的序列,其中发生DNA链交换(包括链切割和重新连接),并且涉及野生型att位点中的共有DNA序列5'-TTTATAC-3'或具有功能性核苷酸取代的所述序列。噬菌体λ整合酶DNA核心结合结构域主要识别7bp attP x attB核心DNA序列基序。在长得多的attP位点中,核心序列两侧是辅助DNA弯曲因子(如整合宿主因子(IHF)、反向刺激因子(FIS)和切除酶(Xis))的结合位点。除了这些辅助位点外,噬菌体λ整合酶的N-末端结构域的若干“臂”结合位点也在attP核心位点的两侧。噬菌体λ整合酶的N-结构域与“臂”结合位点的结合变构调节偶联的核心结合和催化结构域以增加对核心位点的亲和力,这最终使得能够进行DNA链切割和attB x attP的生产性重组。因此,这些“臂”区对于通过噬菌体λ整合酶的C末端催化结构域活化有效的DNA切割是必需的,因此有助于调控重组定向性。
通常,当重组酶介导的重组发生在两个识别位点之间时,重组反应可发生在两个不同分子上或在同一分子内(例如,在靶序列上的识别位点和供体序列上的识别位点之间)。在本上下文中,如本文所述的λ整合酶可催化分子间或分子内重组反应、或分子间和分子内重组反应两者。
如本文所用的“位点特异性重组”或“序列特异性重组”是指各自包含至少一个识别位点或至少一个非同源位点的两个核苷酸序列之间的重组。“位点特异性”意指在特定核苷酸序列,例如可在宿主细胞的基因组中的特定位置中。核苷酸序列可对于宿主细胞是内源性的,位于宿主基因组中的天然位置或位于基因组中的某另一位置,或者它可以是先前已通过多种已知方法中的任一种***宿主细胞的基因组中的异源核苷酸序列。
如本文所述的“识别位点”或“同源位点”是指可被重组酶蛋白质识别的核苷酸序列。识别位点是通过重组酶蛋白质和任何相关的辅助蛋白质进行结合、切割和链交换的核苷酸序列。λ整合酶识别包括attB、attP、attL、attR和/或此类位点的适合突变的同源位点。attB位点和attP位点可通过λ整合酶重组在一起,或者,attL位点和attR位点可通过λ整合酶重组。在本上下文中,本文所述的λ整合酶(Int突变体)可促进例如attB位点和attP位点之间的重组。有利地,与亲本Int-h/218整合酶相比,本文所述的λ整合酶能够以更高的效率重组到非同源位点(如attH位点)中。
在另一实施方案中,提供了包含编码如本文所述的λ整合酶的核苷酸序列的核酸分子。
应当了解,由于遗传密码的简并性允许其它密码子对某些密码子的取代,所述其它密码子指定了相同的氨基酸且因此产生相同的蛋白质,因此本发明并不限于特定核酸分子,而是包括包含编码本文所述的λ整合酶的核苷酸序列的所有核酸分子。在一个实施方案中,核酸分子可操作地连接到调控序列以允许所述核酸分子的表达。
应当了解,基因序列表达所需的调控区域的精确性质可因生物体的不同而不同,但通常应包含启动子区域,在原核生物中,所述启动子区域仅含有启动子,或含有引导RNA转录起始的启动子以及在转录成RNA时将发出合成起始信号的DNA序列两者。此类区域将通常包含位于待表达的核苷酸序列的5'和3'端且参与转录和翻译起始的非编码区域,如TATA盒、封端序列和CAAT序列。这些区域可例如还含有增强子序列或翻译的信号和前导序列,所述翻译的信号和前导序列用于将所产生的多肽靶向用于产生本发明的重组λ整合酶的宿主细胞的特定区室。在一个实施方案中,调控序列包括启动子序列。
在一些实施方案中,本发明的核酸包含在细胞中有功能的转录起始区和在细胞中有功能的转录终止区。在细菌表达的情况下,可使用的适合的启动子序列是例如lac启动子、tet启动子或T7启动子。适于在真核***中表达的启动子的示例是SV40启动子。
在其它实施方案中,核酸分子包含在载体中,特别是包含在表达载体中。除上述调控序列和编码λ整合酶的核酸序列之外,此类表达载体在5'和/或3'方向上还可包含编码限制性切割位点的序列,所述限制性切割位点邻接编码所述λ整合酶的核酸序列。该载体还允许引入编码待表达的蛋白质的另一核酸序列。所述表达载体还含有来源于与待用于表达的宿主相容的物种的复制位点和控制序列。所述表达载体可基于本领域技术人员所熟知的质粒,如pBR322、puC16、pBluescript(RTM)等。
在一个实施方案中,还提供了含有核酸分子的宿主细胞。含有核酸分子的载体可被转化到能够表达所述基因的宿主细胞中。可根据标准技术实施转化。在本上下文中,可在适于表达编码λ整合酶的核苷酸序列的条件下培养被转化的宿主细胞。可在无血清的条件下且任选地在不含动物来源的任何蛋白质/肽的培养基中建立、调适和完全培育宿主细胞。市售培养基如RPMI-1640(Sigma)、达尔伯克改良伊格尔培养基(DMEM;Sigma)、最低必需培养基(MEM;Sigma)、CHO-S-SFMII(Invitrogen)、无血清的CHO培养基(Sigma)和无蛋白质的CHO培养基(Sigma)是示例性的适当的营养溶液。任何培养基可根据需要补充多种化合物,所述化合物的示例是激素和/或其它生物因子(如胰岛素、转铁蛋白、表皮生长因子、***)、盐(如氯化钠、钙盐、镁盐、磷酸盐)、缓冲液(如HEPES)、核苷(如腺苷、胸苷)、谷氨酰胺、葡萄糖或其它等同的能源、抗生素、痕量元素。还可包含本领域内已知的适当浓度的任何其它必需的补充物。
在再一实施方案中,提供了将目标核酸重组到靶核酸中的方法。所述方法包括在如本文所述的λ整合酶存在下使包含目标核酸的靶向核酸与靶核酸接触。
在一些实施方案中,将目标核酸重组到靶核酸中的方法是序列特异性重组。序列特异性重组可在一种或多种辅因子的存在下进行。辅因子可选自由整合宿主因子(IHF)、反向刺激因子(FIS)和切除酶(Xis)组成的组。
如本文所用的“靶向核酸”是指含有至少一个识别位点的核苷酸序列。靶向核酸可在本发明的突变体存在下接触靶核酸,以将目标核酸重组到靶核酸中。靶向核苷酸序列可以是基因、表达盒、启动子、分子标志物、上述中任一个的一部分等。在一些实施方案中,靶向核酸可以是载体。在其它实施方案中,靶向核酸包括选自由attPH序列(SEQ ID NO:8)和attP4X序列(SEQ ID NO:9)组成的组的序列。如本文所用的术语“目的核酸”是指编码目标产物的任何长度的多核苷酸序列。所选序列可以是全长或截短的基因、融合或标记的基因,并且可以是cDNA、基因组DNA或DNA片段。它还可以是天然序列,即天然存在的形式,或者可根据需要被突变或以其它方式被修饰。这些修饰可包括优化在所选细胞或宿主细胞中的密码子使用的密码子优化、人源化或标记。所选序列可编码分泌的多肽、胞质多肽、核多肽、膜结合多肽或细胞表面多肽。“目标产物”可包括但不限于蛋白质、多肽、其片段、肽、反义RNA,所有这些均可在所选宿主细胞中产生。
在一个实施方案中,基因组DNA包含在细胞中。本文所述的方法可在所有真核细胞中进行。细胞和细胞系可存在于例如细胞培养物中,并且包括但不限于真核细胞,如酵母细胞、植物细胞、昆虫细胞或哺乳动物细胞。例如,所述细胞可以是***、胚胎干细胞、造血干细胞或任何类型的分化细胞。在某些实施方案中,本发明的方法可在哺乳动物细胞中进行。哺乳动物细胞系可包括但不限于人、猿、鼠、小鼠、大鼠、猴、兔、啮齿动物、仓鼠、山羊、牛、绵羊或猪的细胞系。示例性的细胞系可包括但不限于中国仓鼠卵巢(CHO)细胞、鼠骨髓瘤细胞(如NS0和Sp2/0细胞)、COS细胞、Hela细胞和人胚肾(HEK-293)细胞。
靶核酸可包括DNA。DNA可以是基因组DNA。
在一个实施方案中,靶核酸包括选自由attH序列(SEQ ID NO:7)和attH4X序列(SEQ ID NO:31)组成的组的序列。靶向核酸可以是载体。在一个实施方案中,靶向核酸包括选自由attH序列(SEQ ID NO:7)和attH4X序列(SEQ ID NO:31)组成的组的序列。
在另一实施方案中,序列特异性重组可在一种或多种辅因子的存在下进行。辅因子可以选自由XIS、FIS和IHF组成的组。
在另一实施方案中,提供了序列特异性重组试剂盒,其包含可***有目标核酸的靶向核酸和如本文所述的λ整合酶或核酸。
如本文所述的试剂盒可包含用于将目标核酸***靶向核酸中的至少一种试剂。所述试剂可以是限制性酶或连接酶。在另一实施方案中,靶向核酸可包括选自由attH序列(SEQ ID NO:7)和attH4X序列(SEQ ID NO:31)组成的组的序列。
在一个实施方案中,如本文所述的试剂盒可进一步包含用于将目标核酸与给定的靶核酸重组的缓冲液和/或说明书。
在一个实施方案中,如本文所述的试剂盒可进一步包含至少一种用于确定成功的序列特异性重组事件的试剂。在一个实施方案中,试剂组分是引物对。引物对可与试剂盒组合供应或者与试剂盒分开供应。
附图简单说明
附图说明了所公开的实施方案并且用于解释所公开的实施方案的原理。然而,应当理解,附图被设计为只用于说明的目的,而不是作为本发明范围的限定。
图1显示了核心细菌attB以及人attH和attH4X序列的序列比对。以灰色突出显示的7个碱基对(bp)表示重叠序列,其在两个重组配偶体(即attB和attP、attH和attPH、attH4X和attP4X)中必须是相同的。attH位点与细菌attB位点的不同之处在于7bp重叠序列中的一个位置和右臂核心结合序列中的三个位置处。非同源attH4X位点在人基因组中作为人Line1(长散在核元件/反转录转座子残余物/非编码物)的一部分发生大约940次。attH4X序列的前三个核苷酸是简并的。
图2显示了使用DNA小环和λ整合酶技术进行快速大肠杆菌染色体整合的方法。第一步骤是产生包含处于适合启动子(例如T7)控制下的λ整合酶的小环,以及包含待稳定整合的基因、抗生素抗性的可选标志物(例如内酰胺酶基因盒)和attP序列的小环。第二步骤是通过电穿孔或热休克将这两个小环转化到大肠杆菌中,然后在可选培养基(例如氨苄青霉素平板)上平铺并培养。第三步骤是通过PCR、测序和DNA印迹确认整合到attB位点中。
图3A显示了在用图2中所述的适当的小环转化后,由整合酶变体C3介导的外源DNA(内酰胺酶基因盒)向大肠杆菌染色体DNA的attB位点中的体内重组,如通过从在100ug/mL(1X)和70ug/mL(0.7X)氨苄青霉素平板上生长的集落的PCR扩增所确定的。使用位于内源性attB位点(大肠杆菌attBF(SEQ ID NO:16)和大肠杆菌attBR(SEQ ID NO:17))两侧的PCR引物来验证染色体整合。在不存在整合的情况下,预期的PCR产物是约200bp(如对于集落1、5、6所见)。内酰胺酶基因盒的整合产生约1650bp的PCR产物(集落2-4、7-10)。
图3B比较了通过亲本Int-h/218或C3整合酶介导的向大肠杆菌的attB中的整合。当使用亲本Int-h/218时,仅观察到2个集落(两者,即100%,具有正确***的内酰胺酶盒)。在C3的情况下,观察到27个集落。测试了这些中的10个,并且9个(90%)显示正确***的内酰胺酶盒。因此,在27个集落中,我们可预测约90%(约24个集落)含有正确***的内酰胺酶盒。这对应于约12倍(24除以2)的改善。
图3C显示了使用含有内酰胺酶盒的C3产生的整合型大肠杆菌集落的核苷酸序列。盒两侧的细菌染色体DNA以小写显示。将通过attB和attP的重组产生的attL位点和attR位点加下划线并以粗体显示。内酰胺酶开放阅读框以粗体显示。
图4A显示了亲本Int-h/218和使用用于同源(attB/attP)和非同源(attH/attPH和attH4x/attP4x)位点的体外转录/翻译***表达的所示λ整合酶突变体的改善的分子内重组活性。相对于有attB/P底物的亲本Int-h/218效率(设定为1)来表示重组。本发明的突变型λ整合酶蛋白质(C2和C3)在进行各自的重组反应方面更有效。C2表示具有D336V突变的λ整合酶突变体。I43F C2表示具有另外的I43F突变的C2λ整合酶突变体。C3表示具有I43F、E319G、D336V突变的λ整合酶突变体。N=2,条形指示平均值+/-SD。
图4B显示了亲本Int-h/218和C3整合酶对所示底物的分子内重组活性。利用与含有attB/attP位点、attH/attPH位点或attH4x/attP4x位点的10ng质粒底物孵育的5μg纯化的重组整合酶进行分子内重组。反应体积为25μL,并且在重组缓冲液(100mM Tris pH7.5、500mM NaCl、25mM DTT、10mM EDTA、5mg/mL牛血清白蛋白)中于37℃进行1.5小时。将反应物以1/10稀释,然后取2μL用于重组效率的实时PCR定量。利用SsoAdvancedTM UniversalGreen Supermix进行实时PCR定量,最终体积为20μL,引物pLIR-F1(SEQ ID NO:27)和pLIR-R1(SEQ ID NO:28)各250nM。重组整合酶蛋白质的活性以相对于Int-h/218对attB/attP质粒底物的活性(设定为1的值)表示。误差条指示2次独立实验的平均值+/-SD。
图5A显示了在具有attB位点和attP位点的HT1080细胞系中,具有或不具有附加型质粒底物的C末端核定位序列(C2-N)的突变型整合酶C2的分子内重组效率。Y轴表示eGFP阳性细胞百分比(指示attB/attP位点之间的重组),并且活性以相对于如通过EGFP载体转染所确定的转染效率(100%)表示。突变体C2比Int-h/218更有效地重组attB x attP。
图5B显示了在具有attH位点和attPH位点的HT1080细胞系中,具有或不具有附加型质粒底物的C末端核定位序列(C2-N)的突变型整合酶C2的分子内重组效率。Y轴表示eGFP阳性细胞百分比(指示attH/PH位点之间的重组),并且活性以相对于如通过EGFP载体转染所确定的转染效率(100%)表示。突变体C2比Int-h/218更有效地重组attH和attPH。
图5C显示了在具有attB位点和attP位点的HT1080细胞系中,附加型质粒底物的突变型整合酶的分子内重组效率。Y轴表示eGFP阳性细胞百分比(指示attB/attP位点之间的重组),并且活性以相对于如通过EGFP载体转染所确定的转染效率(100%)表示。突变体C3比Int-h/218或密码子优化的Int-h/218(opt Int)更有效地重组attB x attP。
图5D显示了在具有attH位点和attPH位点的HT1080细胞系中,附加型质粒底物的突变型整合酶C3的分子内重组效率。Y轴表示eGFP阳性细胞百分比(指示attH/PH位点之间的重组),并且活性以相对于如通过EGFP载体转染所确定的转染效率(100%)表示。突变体C3比Int-h/218或密码子优化的Int-h/218(opt Int)更有效地重组attH和attPH。
图6A显示了在HT1080克隆中的L1基因座处筛选attH4x和attP4x重组事件的PCR结果。检测HT1080克隆3、HT1080克隆19和HT1080克隆21的预期大小(约1200bp;对于通过attH4x和attP4x之间的重组产生的attL位点)的PCR扩增。W,无DNA模板对照;HT,阴性对照(来自亲本HT1080细胞的基因组DNA);Ina,来自通过pPGKssPuro-attP4x和pCMVssKZ-Inactivie Int(表达具有失活突变的整合酶的质粒,其中在序列位置342处的氨基酸残基酪氨酸被氨基酸丙氨酸替代)的共转染获得的嘌呤霉素抗性集落的基因组DNA;+,阳性对照(来自在L1元件中具有attH4x X attP4x整合事件的HT1080克隆的基因组DNA);M,100bpDNA梯状条带(DNA ladder);1到33,来自通过pPGKssPuro-attP4x和pCMVssKZ-IntC3-CNLS的共转染获得的嘌呤霉素抗性HT1080集落的基因组DNA。
图6B显示了通过HT1080克隆3和19中的attH4x和attP4x之间的重组产生的attL位点的核苷酸序列。在attL序列两侧的人基因组DNA序列以小写表示。HOP'序列以斜体、粗体和下划线表示。attL序列以下划线和粗体表示。PGK启动子序列(pPGKssPuro-attP4x靶向载体的一部分并驱使嘌呤霉素抗性基因的表达)以大写表示。指定每个克隆中靶向attH4x序列的基因组基因座。
实施例
将通过参考特定实施例来进一步更详细地描述本发明的非限制性实施例(包括最佳模式)和比较实施例,这不应被解释为以任何方式限制本发明的范围。
材料
SEQ ID NO:1
Int-h/218
MGRRRSHERRDLPPNLYIRNNGYYCYRDPRTGKEFGLGRDRRIAITEAIQANIELFSGHKHKPLTARINSDNSVTLHSWLDRYEKILASRGIKQKTLINYMSKIKAIRRGLPDAPLEDITTKEIAAMLNGYIDEGKAASAKLIRSTLSDAFREAIAEGHITTNHVAATRAAKSKVRRSRLTADEYLKIYQAAESSPCWLRLAMELAVVTGQRVGDLCKMKWSDIVDGYLYVEQSKTGVKIAIPTALHIDALGISMKETLDKCKEILGGETIIASTRREPLSSGTVSRYFMRARKASGLSFEGDPPTFHELRSLSARLYEKQISDKFAQHLLGHKSDTMASQYRDDRGREWDKIEIK
SEQ ID NO:2
C2整合酶突变体:
MGRRRSHERRDLPPNLYIRNNGYYCYRDPRTGKEFGLGRDRRIAITEAIQANIELFSGHKHKPLTARINSDNSVTLHSWLDRYEKILASRGIKQKTLINYMSKIKAIRRGLPDAPLEDITTKEIAAMLNGYIDEGKAASAKLIRSTLSDAFREAIAEGHITTNHVAATRAAKSKVRRSRLTADEYLKIYQAAESSPCWLRLAMELAVVTGQRVGDLCKMKWSDIVDGYLYVEQSKTGVKIAIPTALHIDALGISMKETLDKCKEILGGETIIASTRREPLSSGTVSRYFMRARKASGLSFEGDPPTFHELRSLSARLYEKQISDKFAQHLLGHKSVTMASQYRDDRGREWDKIEIK
SEQ ID NO:3
C3整合酶突变体:
MGRRRSHERRDLPPNLYIRNNGYYCYRDPRTGKEFGLGRDRRFAITEAIQANIELFSGHKHKPLTARINSDNSVTLHSWLDRYEKILASRGIKQKTLINYMSKIKAIRRGLPDAPLEDITTKEIAAMLNGYIDEGKAASAKLIRSTLSDAFREAIAEGHITTNHVAATRAAKSKVRRSRLTADEYLKIYQAAESSPCWLRLAMELAVVTGQRVGDLCKMKWSDIVDGYLYVEQSKTGVKIAIPTALHIDALGISMKETLDKCKEILGGETIIASTRREPLSSGTVSRYFMRARKASGLSFEGDPPTFHELRSLSARLYGKQISDKFAQHLLGHKSVTMASQYRDDRGREWDKIEIK
SEQ ID NO:4
λ整合酶:
ATGGGAAGAAGGCGAAGTCATGAGCGCCGGGATTTACCCCCTAACCTTTATATAAGAAACAATGGATATTACTGCTACAGGGACCCAAGGACGGGTAAAGAGTTTGGATTAGGCAGAGACAGGCGAATCGCAATCACTGAAGCTATACAGGCCAACATTGAGTTATTTTCAGGACACAAACACAAGCCTCTGACAGCGAGAATCAACAGTGATAATTCCGTTACGTTACATTCATGGCTTGATCGCTACGAAAAAATCCTGGCCAGCAGAGGAATCAAGCAGAAGACACTCATAAATTACATGAGCAAAATTAAAGCAATAAGGAGGGGTCTGCCTGATGCTCCACTTGAAGACATCACCACAAAAGAAATTGCGGCAATGCTCAATGGATACATAGACGAGGGCAAGGCGGCGTCAGCCAAGTTAATCAGATCAACACTGAGCGATGCATTCCGAGAGGCAATAGCTGAAGGCCATATAACAACAAACCATGTCGCTGCCACTCGCGCAGCAAAATCAAAGGTAAGGAGATCAAGACTTACGGCTGACGAATACCTGAAAATTTATCAAGCAGCAGAATCATCACCATGTTGGCTCAGACTTGCAATGGAACTGGCTGTTGTTACCGGGCAACGAGTTGGTGATTTATGCAAAATGAAGTGGTCTGATATCGTAGATGGATATCTTTATGTCGAGCAAAGCAAAACAGGCGTAAAAATTGCCATCCCAACAGCATTGCATATTGATGCTCTCGGAATATCAATGAAGGAAACACTTGATAAATGCAAAGAGATTCTTGGCGGAGAAACCATAATTGCATCTACTCGTCGCGAACCGCTTTCATCCGGCACAGTATCAAGGTATTTTATGCGCGCACGAAAAGCATCAGGTCTTTCCTTCGAAGGGGATCCGCCTACCTTTCACGAGTTGCGCAGTTTGTCTGCAAGACTCTATGAGAAGCAGATAAGCGATAAGTTTGCTCAACATCTTCTCGGGCATAAGTCGGACACCATGGCATCACAGTATCGTGATGACAGAGGCAGGGAGTGGGACAAAATTGAAATCAAATAA
SEQ ID NO:5
attB:CTGCTTTTTT ATACTAACTT G
SEQ ID NO:6
attP:CAGCTTTTTT ATACTAAGTT G
SEQ ID NO:7
attH:CTGCTTTCTT ATACCAAGTG G
SEQ ID NO:8
attPH:CAGCTTTCTT ATACCAAGTT G
SEQ ID NO:9
attP4X:CAGCTTTATT TCATTAAGTT G
SEQ ID NO:10
petF2:CATCGGTGATGTCGGCGAT
SEQ ID NO:11
petR:CGGATATAGTTCCTCCTTTCAGCA
SEQ ID NO:12
attP-F:cacagaattcCGT CTG TTA CAG GTC ACT AAT ACC ATC T
SEQ ID NO:13
attPSOE-R:ACA TTT CCC CGA AAA GTG CCA CCT GAA CAT CAC CGG GAA ATC AAATAA TGA T
SEQ ID NO:14
TEM1prom-F:TTC AGG TGG CAC TTT TCG GGG AAA TGT
SEQ ID NO:15
TEM1prom-R:TGT GGA ATT CCT ACA CTA GAA GGA CAG TAT TTG GTA TCT GC
SEQ ID NO:16
大肠杆菌AttB-F:CTG AAA ATG TGT TCA CAG GTT GCT
SEQ ID NO:17
大肠杆菌attB-R:GCA ATG CCA TCT GGT ATC ACT
SEQ ID NO:18
C2基因序列
ATGGGAAGAAGGCGAAGTCATGAGCGCCGGGATTTACCCCCTAACCTTTATATAAGAAACAATGGATATTACTGCTACAGGGACCCAAGGACGGGTAAAGAGTTTGGATTAGGCAGAGACAGGCGAATCGCAATCACTGAAGCTATACAGGCCAACATTGAGTTATTTTCAGGACACAAACACAAGCCTCTGACAGCGAGAATCAACAGTGATAATTCCGTTACGTTACATTCATGGCTTGATCGCTACGAAAAAATCCTGGCCAGCAGAGGAATCAAGCAGAAGACACTCATAAATTACATGAGCAAAATTAAAGCAATAAGGAGGGGTCTGCCTGATGCTCCACTTGAAGACATCACCACAAAAGAAATTGCGGCAATGCTCAATGGATACATAGACGAGGGCAAGGCGGCGTCAGCCAAGTTAATCAGATCAACGCTGAGCGATGCATTCCGAGAGGCAATAGCTGAAGGCCATATAACAACAAACCATGTCGCTGCCACTCGCGCAGCAAAGTCAAAGGTAAGGAGATCAAGACTTACGGCTGACGAATACCTGAAAATTTATCAAGCAGCAGAATCATCACCATGTTGGCTCAGACTTGCAATGGAACTGGCTGTTGTTACCGGGCAACGAGTTGGTGACTTGTGCAAAATGAAGTGGTCTGATATCGTAGATGGATATCTTTATGTCGAGCAAAGCAAAACAGGCGTAAAAATTGCCATCCCAACAGCATTGCATATTGATGCTCTCGGAATATCAATGAAGGAAACACTTGATAAATGCAAAGAGATTCTTGGCGGAGAAACCATAATTGCATCTACTCGTCGCGAACCGCTTTCATCCGGCACAGTATCAAGGTATTTTATGCGCGCACGAAAAGCATCAGGTCTTTCCTTCGAAGGGGATCCGCCTACCTTTCACGAGTTGCGCAGTTTGTCTGCAAGACTCTATGAGAAGCAGATAAGCGATAAGTTTGCTCAACATCTTCTCGGGCATAAGTCGGTCACCATGGCATCACAGTATCGTGATGACAGAGGCAGGGAGTGGGACAAAATTGAAATCAAATAA
SEQ ID NO:19
C3基因序列
ATGGGAAGAAGGCGAAGTCATGAGCGCCGGGATTTACCCCCTAACCTTTATATAAGAAACAATGGATATTACTGCTACAGGGACCCAAGGACGGGTAAAGAGTTTGGATTAGGCAGAGACAGGCGATTCGCAATCACTGAAGCTATACAGGCCAACATTGAGTTATTTTCAGGACACAAACACAAGCCTCTGACAGCGAGAATCAACAGTGATAATTCCGTTACGTTACATTCATGGCTTGATCGCTACGAAAAAATCCTGGCCAGCAGAGGAATCAAGCAGAAGACACTCATAAATTACATGAGCAAAATTAAAGCAATAAGGAGGGGTCTGCCTGATGCTCCACTTGAAGACATCACCACAAAAGAAATTGCGGCAATGCTCAATGGATACATAGACGAGGGCAAGGCGGCGTCAGCCAAGTTAATCAGATCAACGCTGAGCGATGCATTCCGAGAGGCAATAGCTGAAGGCCATATAACAACAAACCATGTCGCTGCCACTCGCGCGGCAAAGTCAAAGGTAAGGAGATCAAGACTTACGGCTGACGAATACCTGAAAATTTATCAAGCAGCAGAATCATCACCATGTTGGCTCAGACTTGCAATGGAACTGGCTGTTGTTACCGGGCAACGAGTTGGTGACTTGTGCAAAATGAAGTGGTCTGATATCGTAGATGGATATCTTTATGTCGAGCAAAGCAAAACAGGCGTAAAAATTGCCATCCCAACAGCATTGCATATTGATGCTCTCGGAATATCAATGAAGGAAACACTTGATAAATGCAAAGAGATTCTTGGCGGAGAAACCATAATTGCATCTACTCGTCGCGAACCGCTCTCATCCGGCACAGTATCAAGGTATTTTATGCGCGCACGAAAAGCATCAGGTCTTTCCTTCGAAGGGGATCCGCCTACCTTTCACGAGTTGCGCAGTTTGTCTGCAAGACTCTATGGGAAGCAGATAAGCGATAAGTTTGCTCAACATCTTCTCGGGCATAAGTCGGTCACCATGGCATCACAGTATCGTGATGACAGAGGCAGGGAGTGGGACAAAATTGAAATCAAATAA
SEQ ID NO:20
C3小环:
CATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCTAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATGGGAAGAAGGCGAAGTCATGAGCGCCGGGATTTACCCCCTAACCTTTATATAAGAAACAATGGATATTACTGCTACAGGGACCCAAGGACGGGTAAAGAGTTTGGATTAGGCAGAGACAGGCGATTCGCAATCACTGAAGCTATACAGGCCAACATTGAGTTATTTTCAGGACACAAACACAAGCCTCTGACAGCGAGAATCAACAGTGATAATTCCGTTACGTTACATTCATGGCTTGATCGCTACGAAAAAATCCTGGCCAGCAGAGGAATCAAGCAGAAGACACTCATAAATTACATGAGCAAAATTAAAGCAATAAGGAGGGGTCTGCCTGATGCTCCACTTGAAGACATCACCACAAAAGAAATTGCGGCAATGCTCAATGGATACATAGACGAGGGCAAGGCGGCGTCAGCCAAGTTAATCAGATCAACGCTGAGCGATGCATTCCGAGAGGCAATAGCTGAAGGCCATATAACAACAAACCATGTCGCTGCCACTCGCGCGGCAAAGTCAAAGGTAAGGAGATCAAGACTTACGGCTGACGAATACCTGAAAATTTATCAAGCAGCAGAATCATCACCATGTTGGCTCAGACTTGCAATGGAACTGGCTGTTGTTACCGGGCAACGAGTTGGTGACTTGTGCAAAATGAAGTGGTCTGATATCGTAGATGGATATCTTTATGTCGAGCAAAGCAAAACAGGCGTAAAAATTGCCATCCCAACAGCATTGCATATTGATGCTCTCGGAATATCAATGAAGGAAACACTTGATAAATGCAAAGAGATTCTTGGCGGAGAAACCATAATTGCATCTACTCGTCGCGAACCGCTCTCATCCGGCACAGTATCAAGGTATTTTATGCGCGCACGAAAAGCATCAGGTCTTTCCTTCGAAGGGGATCCGCCTACCTTTCACGAGTTGCGCAGTTTGTCTGCAAGACTCTATGGGAAGCAGATAAGCGATAAGTTTGCTCAACATCTTCTCGGGCATAAGTCGGTCACCATGGCATCACAGTATCGTGATGACAGAGGCAGGGAGTGGGACAAAATTGAAATCAAACATCATCACCATCACCACTAATGAGAATTCgagctccgtcgacaagcttgcggccgcactcgagcaccaccaccaccaccactgagatccggctgctaacaaagcccgaaaggaagctgagttggctgctgccaccgctgagcaataactagcataaccccttggggcctctaaacgggtcttgaggggttttttgctgaaaggaggaactatatccg
SEQ ID NO:21
attP-TEM1:
cacagaattcCGtctgttacaggtcactaataccatctaagtagttgattcatagtgactgcatatattgtgttttacagtattatgtagtctgttttttatgcaaaatctaatttaatatattgatatttatatcattttacgtttctcgttcagcttttttatactaagttggcattataaaaaagcattgcttatcaatttgttgcaacgaacaggtcactatcagtcaaaataaaatcattatttgATTTCCCGGTGATGttcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttagg
SEQ ID NO:22
HOP’:ATGCTTTATTTCATTAAGTTG
SEQ ID NO:23
attL:
GCATTATAAAAAAGCATTGCTTATCAATTTGTTGCAACGAACAGGTCACTATCAGTCAAAATACAATCATTATTTGATTTCAATTTTGTCCCACTCCCTCCCG
SEQ ID NO:24
PGK启动子:
AATTCTACCGGGTAGGGGAGGCGCTTTTCCCAAGGCAGTCTGGAGCATGCGCTTTAGCAGCCCCGCTGGGCACTTGGCGCTACACAAGTGGCCTCTGGCCTCGCACACATTCCACATCCACCGGTAGGCGCCAACCGGCTCCGTTCTTTGGTGGCCCCTTCGCGCCACCTTCTACTCCTCCCCTAGTCAGGAAGTTCCCCCCCGCCCCGCAGCTCGCGTCGTGCAGGACGTGACAAATGGAAGTAGCACGTCTCACTAGTCTCGTGCAGATGGACAGCACCGCTGAGCAATGGAAGCGGGTAGGCCTTTGGGGCAGCGGCCAATAGCAGCT
SEQ ID NO:25
HOP’attH4X_F1:GAGTGTTTTCCAACTTGGTTCCATT
SEQ ID NO:26
PuroRev24:CACCGTGGGCTTGTACTCGGTC
SEQ ID NO:27
pLIR-F1:CTGCATCGATTCAGCTAGCTG
SEQ ID NO:28
pLIR-R1:CTGATAGTGACCTGTTCGTTGC
SEQ ID NO:29
pPGKssPuro-attP4x(靶向载体):
gaattcctctgttacaggtcactaataccatctaagtagttgattcatagtgactgcatatgttgtgttttacagtattatgtagtctgttttttatgcaaaatctaatttaatatattgatatttatatcattttacgtttctcgttcagctttatttcattaagttggcattataaaaaagcattgcttatcaatttgttgcaacgaacaggtcactatcagtcaaaataaaatcattatttgatttcaattttgtcccactccctcccgaattctaccgggtaggggaggcgcttttcccaaggcagtctggagcatgcgctttagcagccccgctggcacttggcgctacacaagtggcctctggcctcgcacacattccacatccaccggtagcgccaaccggctccgttctttggtggccccttcgcgccacttctactcctcccctagtcaggaagtttcccccccgccccgcagctcgcgtcgtgcaggacgtgacaaatggaagtagcacgtctcactagtctcgtgcagatggacagcaccgctgagcaatggaagcgggtaggcctttggggcagcggccaatagcagctttgctccttcgctttctgggctcagaggctgggaaggggtgggtccgggggcgggctcaggggcgggctcaggggcggggcgggcgcccgaaggtcctccggaggcccggcattctgcacgcttcaaaagcgcacgtctgccgcgctgttctcctcttcctcatctccgggcctttcgaccaattcgctgtctgcgagggccagctgttggggtgagtactccctctcaaaagcgggcatgacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgcggtgatgcctttgagggtggccgcgtccatctggtcagaaaagacaatctttttgttgtcaagcttgaggtgtggcaggcttgagatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaactgcagatgaccgagtacaagcccacggtgcgcctcgccacccgcgacgacgtcccccgggccgtacgcaccctcgccgccgcgttcgccgactaccccgccacgcgccacaccgtcgacccggaccgccacatcgagcgggtcaccgagctgcaagaactcttcctcacgcgcgtcgggctcgacatcggcaaggtgtgggtcgcggacgacggcgccgcggtggcggtctggaccacgccggagagcgtcgaagcgggggcggtgttcgccgagatcggcccgcgcatggccgagttgagcggttcccggctggccgcgcagcaacagatggaaggcctcctggcgccgcaccggcccaaggagcccgcgtggttcctggccaccgtcggcgtctcgcccgaccaccagggcaagggtctgggcagcgccgtcgtgctccccggagtggaggcggccgagcgcgccggggtgcccgccttcctggagacctccgcgccccgcaacctccccttctacgagcggctcggcttcaccgtcaccgccgacgtcgaggtgcccgaaggaccgcgcacctggtgcatgacccgcaagcccggtgcctgatctagagctcgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgagatccactagttctagcctcgaggctagagcggccgccaccgcggtggagctccaattcgccctatagtgagtcgtattacgcgcgctcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatgggacgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccggctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggcacctcgaccccaaaaaacttgattagggtgatggttcacgtagtgggccatcgccctgatagacggtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaacaacactcaaccctatctcggtctattcttttgatttataagggattttgccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgcttacaatttaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagcgcgcaattaaccctcactaaagggaacaaaagctgggtaccgggccccccctcgaggtcgacggtatcgataagcttgatatc
SEQ ID NO:30
pCMVssKZ-IntC3-CNLS(整合酶表达质粒):
gaattcctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgccatgcattagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagcaattcgctgtctgcgagggccagctgttggggtgagtactccctctcaaaagcgggcatgacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgcggtgatgcctttgagggtggccgcgtccatctggtcagaaaagacaatctttttgttgtcaagcttgaggtgtggcaggcttgagatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaactgcagctcgaggtccaccatgggaagaaggcgaagtcatgagcgccgggatttaccccctaacctttatataagaaacaatggatattactgctacagggacccaaggacgggtaaagagtttggattaggcagagacaggcgattcgcaatcactgaagctatacaggccaacattgagttattttcaggacacaaacacaagcctctgacagcgagaatcaacagtgataattccgttacgttacattcatggcttgatcgctacgaaaaaatcctggccagcagaggaatcaagcagaagacactcataaattacatgagcaaaattaaagcaataaggaggggtctgcctgatgctccacttgaagacatcaccacaaaagaaattgcggcaatgctcaatggatacatagacgagggcaaggcggcgtcagccaagttaatcagatcaacgctgagcgatgcattccgagaggcaatagctgaaggccatataacaacaaaccatgtcgctgccactcgcgcggcaaagtcaaaggtaaggagatcaagacttacggctgacgaatacctgaaaatttatcaagcagcagaatcatcaccatgttggctcagacttgcaatggaactggctgttgttaccgggcaacgagttggtgacttgtgcaaaatgaagtggtctgatatcgtagatggatatctttatgtcgagcaaagcaaaacaggcgtaaaaattgccatcccaacagcattgcatattgatgctctcggaatatcaatgaaggaaacacttgataaatgcaaagagattcttggcggagaaaccataattgcatctactcgtcgcgaaccgctctcatccggcacagtatcaaggtattttatgcgcgcacgaaaagcatcaggtctttccttcgaaggggatccgcctacctttcacgagttgcgcagtttgtctgcaagactctatgggaagcagataagcgataagtttgctcaacatcttctcgggcataagtcggtcaccatggcatcacagtatcgtgatgacagaggcagggagtgggacaaaattgaaatcaaatccggaggcggccctaagaagaagagaaaggtatgataatctagagctcgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgagatccactagttctagcctcgaggctagagcggccgccaccgcggtggagctccaattcgccctatagtgagtcgtattacgcgcgctcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatgggacgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccggctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggcacctcgaccccaaaaaacttgattagggtgatggttcacgtagtgggccatcgccctgatagacggtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaacaacactcaaccctatctcggtctattcttttgatttataagggattttgccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgcttacaatttaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagcgcgcaattaaccctcactaaagggaacaaaagctgggtaccgggccccccctcgaggtcgacggtatcgataagcttgatatc
SEQ ID NO:31
attH4X:acgctttatttcattaagttg
实施例1:快速大肠杆菌染色体整合
本实施例遵循图2中所描绘的方法。用petF2(SEQ ID NO:10)和petR(SEQ ID NO:11)扩增C3INT-HIS-PET22b(+),随后将PCR产物分子内连接以产生C3INT-HIS小环。用attP-F(SEQ ID NO:12)和attPSOE-R(SEQ ID NO:13)扩增attP-PET22b(+),同时用TEM1prom-F(SEQ ID NO:14)和TEM1promR(SEQ ID NO:15)扩增PET22b(+),其分别产生编码attP和氨苄青霉素抗性基因的PCR产物。利用使用attP-F(SEQ ID NO:12)和TEM1prom-R(SEQ ID NO:15)的这两个PCR产物进行剪接重叠延伸PCR(SOE-PCR)。随后将PCR产物分子内连接以产生attP-TEM1小环。将100ng的C3INT-HIS小环和100ng attP-TEM1小环组合并电穿孔到25μL电感受态TG1细胞。使细胞恢复1小时,然后平铺在不同浓度的氨苄青霉素LB琼脂板(0.01mg/mL、0.02mg/mL、0.05mg/mL、0.07mg/mL和0.1mg/mL)上。在37℃孵育12-14h,以允许C3整合酶的表达和氨苄青霉素抗性盒通过C3整合酶进行的染色体整合。用大肠杆菌AttB-F(SEQ IDNO:16)和大肠杆菌AttB-R(SEQ ID NO:17)、TEM1prom-F(SEQ ID NO:14)和大肠杆菌AttB-F(SEQ ID NO:16)或TEM1prom-F(SEQ ID NO:14)和大肠杆菌AttB-R(SEQ ID NO:17)进行集落PCR,以验证氨苄青霉素抗性盒的染色体整合的存在。还用相同的引物对PCR产物进行测序以确认结果。测序表明染色体attB位点中的正确整合事件(图3C)。
实施例2:亲本和整合酶变体C2和C3的重组活性
本实施例证实亲本Int-h/218和所选突变体(C2、C3和其指示的变体)的重组活性。图4A描绘了来自使用通过体外转录/翻译产生的整合酶的体外分子内重组反应的结果。使用引物IntRBS-F和INTstop-R扩增编码相应的整合酶(Int-h/218、C2、C3或其变体)的质粒,并用引物Univeral和INTstop-R再扩增PCR产物,得到具有体外转录-翻译(IVT)所需的T7启动子和核糖体结合位点的整合酶扩增子。使用体外蛋白质合成试剂盒在30℃以9μL的总体积表达20ng的每个整合酶扩增子1小时。然后通过将含有attB/attP位点、attPH/attH位点或attH4x/attP4x位点(图1)的10ng质粒底物添加到10μL的总体积来进行分子内重组。混合物在37℃孵育2小时。随后反应物以1/10稀释,然后取1μL用于重组效率的实时PCR定量。利用SsoAdvancedTMUniversalGreen Supermix进行实时PCR定量,最终体积为20μL,各引物pLIR-F1(SEQ ID NO:27)和pLIR-R1(SEQ ID NO:28)为250nM。重组整合酶蛋白质的活性以相对于WT Int-h/218对attB/attP质粒底物的活性(设定为1的值)表示。误差条指示两次独立实验的标准偏差。
结果显示,与亲本Int-h/218相比,C2和C3整合酶的重组效率显著增加。图4中的数据显示了存在于C3中的E319G突变对分子内重组效率的强烈作用。从C3中去除该突变产生I43F C2,其显示对所测试的所有底物的活性降低约2/3。I43F突变对分子内重组的作用不是显而易见的,因为将其添加到C2中或从C3中去除不会导致重组效率的任何显著变化。然而,其可影响其它参数,如体内分子间重组和/或蛋白质稳定性。
图4B描绘了来自使用在大肠杆菌中重组产生的整合酶的体外分子内重组反应的结果。将表达整合酶Int-h/218和C3的质粒转化到大肠杆菌BL21(DE3)pLysS(Invitrogen)感受态细胞中。使细菌细胞在37℃在LB培养基中生长,并在30℃用0.5mM IPTG在约0.6的OD600nm下诱导6小时。然后通过离心收获细胞,将其再悬浮于50mM Tris pH 8.0、1M NaCl、20mM咪唑中并通过声波处理溶解。通过高速离心使细胞溶解产物澄清,然后将上清液施加到在50mM Tris-HCl pH 8.0、1M NaCl、20mM咪唑、0.5mM EDTA和2mM DTT的结合缓冲液中预平衡的1mL HisTrapTM FF柱(GE Healthcare)。用结合缓冲液洗涤柱,并用50mM Tris-HClpH 8.0、1M NaCl、500mM咪唑、0.5mM EDTA和2mM DTT将整合酶蛋白质从柱上洗脱下来。通过SDS-PAGE凝胶分析收集的级分,并且在-80℃储存之前,使用Amicon-Ultra(10kDa MWCO)在50mM Tris pH 8.0、1M NaCl、0.5mM EDTA和2mM DTT中透析并浓缩适当的级分。
利用与含有attB/attP位点、attPH/attH位点或attH4x/attP4x位点的10ng质粒底物孵育的5μg纯化的重组整合酶蛋白质进行分子内重组。反应体积为25μL,并且在重组缓冲液(100mM Tris pH7.5、500mM NaCl、25mM DTT、10mM EDTA、5mg/mL牛血清白蛋白)中于37℃进行1.5小时。反应物以1/10稀释,然后取2μL用于重组效率的实时PCR定量。利用SsoAdvancedTM UniversalGreen Supermix进行实时PCR定量,最终体积为20μL,各引物pLIR-F1(SEQ ID NO:27)和pLIR-R1(SEQ ID NO:28)为250nM。重组整合酶蛋白质的活性以相对于Int-h/218(WT)对attB/attP质粒底物的活性(设定为1的值)表示。误差条指示2次独立实验的平均值+/-SD。数据再次显示,与Int-h/218亲本相比,在针对C3整合酶测试的所有底物上重组增强。
在这些实验中观察到的C2和C3的改善的重组活性(图4A和图4B)与在基于细胞的测定中观察到的那些(图5)相关。
实施例3:用于HT1080细胞中的内源性attH4x靶向的细胞培养条件、转染程序和嘌呤霉素抗性重组体的选择
对于HT1080细胞系中的内源性靶向,在转染前一天,将3x106个细胞接种于每个10cm细胞培养皿的达尔伯克改良伊格尔培养基[DMEM(Life technologies),补充有10%FBS、1%L-谷氨酰胺以及各100单位/mL的青霉素和链霉素]中,于转染时获得70-90%汇合。使用Lipofectamine 2000试剂(Life technologies)进行转染。通过将在75μlOpti-MEM培养基中稀释的5ng靶向载体(pPGKssPuro-attP4x(SEQ ID NO:29))和100ng整合酶表达质粒(pCMVssKZ-IntC3-CNLS(SEQ ID NO:30))与在75μl Opti-MEM培养基(Life technologies)中稀释的2.5μl Lipofectamine 2000试剂混合并在室温孵育20分钟来制备质粒DNA-脂质复合物。将转染混合物添加到细胞(在不含抗生素的DMEM下)上,并使转染进行4-6小时,然后通过用新鲜培养基替代而去除复合物。在转染后48小时,使细胞在含有3μg嘌呤霉素/ml的生长培养基中生长,以选择嘌呤霉素抗性集落。在3周选择后,挑取嘌呤霉素抗性集落并扩增。使用DNeasy Blood&Tissue Kit(Qiagen)提取基因组DNA。
实施例4:用于附加型分子内重组测定的细胞培养条件、转染程序和FACS分析
对于HT1080细胞系中的附加型分子内重组测定,在转染前一天,将3x105个细胞接种于6个孔板的每孔中的达尔伯克改良伊格尔培养基[DMEM(Life technologies),补充有10%FBS、1%L-谷氨酰胺以及各100单位/mL的青霉素和链霉素]中,于转染时获得70-90%汇合。使用Lipofectamine 2000试剂进行转染。对于每孔的每次转染,通过将在100μlOpti-MEM培养基中稀释的1.5μg pLIR和1.5μgλ整合酶表达质粒与在100μl Opti-MEM培养基中稀释的6μl Lipofectamine 2000试剂混合并在室温孵育20分钟来制备质粒DNA-脂质复合物。将转染混合物逐滴添加到细胞(在不含抗生素的DMEM下)上,并使转染进行4-6小时,然后通过用新鲜DMEM培养基替代而去除复合物。在转染后48-72小时,将细胞胰蛋白酶化并用DMEM收获在Eppendorf管中,通过离心(以1000x相对离心力持续5分钟)使其沉淀并再悬浮于1ml新鲜DMEM中。在BD FACSCaliburTM机(Becton-Dickinson)上通过FACS对GFP阳性细胞进行定量。
实施例5:鉴别成功的序列特异性重组事件
每次PCR反应使用GoTaq Flexi DNA聚合酶(Promega),利用引物HOP'attH4X_F1(SEQ ID NO:25)和PuroRev24(SEQ ID NO:26)和作为模板的200ng基因组DNA,以50μl体积进行PCR。该PCR使用以下热循环参数:95℃持续5分钟的初始步骤,95℃持续1分钟、57℃持续30秒和72℃持续1分钟的35个循环,以及72℃持续5分钟的最后步骤。通过在0.8%琼脂糖凝胶中在Tris-硼酸-EDTA缓冲液中的电泳来分析PCR样品。
图6A描绘了在HT1080克隆中的L1基因座处筛选attH4x和attP4x重组事件的PCR结果。检测HT1080克隆3、19和21的预期大小(约1200bp;对于通过attH4x和attP4x之间的重组产生的attL位点)的PCR扩增。图6B显示了通过HT1080克隆3和19中的attH4x和attP4x之间的重组产生的attL位点的核苷酸序列。
应用
通过使用本发明的整合酶变体以及attH/attPH和attH4X/attP4X底物的改善的体外重组表明本文所述的整合酶变体可以是用于生物技术应用如基于重组的克隆应用的有用的试剂工具。
将显而易见的是,在不脱离本发明的精神和范围的情况下,本领域技术人员在阅读上述公开内容后,本发明的各种其它修改和改进将是显而易见的并且意在所有此类修改和改进都在所附权利要求的范围内。
序列表
<110> 新加坡科技研究局
南洋理工大学
<120> 噬菌体λ整合酶的突变体
<130> 9869SG2408
<160> 31
<170> PatentIn version 3.5
<210> 1
<211> 356
<212> PRT
<213> 噬菌体λ(整合酶-h/218)
<400> 1
Met Gly Arg Arg Arg Ser His Glu Arg Arg Asp Leu Pro Pro Asn Leu
1 5 10 15
Tyr Ile Arg Asn Asn Gly Tyr Tyr Cys Tyr Arg Asp Pro Arg Thr Gly
20 25 30
Lys Glu Phe Gly Leu Gly Arg Asp Arg Arg Ile Ala Ile Thr Glu Ala
35 40 45
Ile Gln Ala Asn Ile Glu Leu Phe Ser Gly His Lys His Lys Pro Leu
50 55 60
Thr Ala Arg Ile Asn Ser Asp Asn Ser Val Thr Leu His Ser Trp Leu
65 70 75 80
Asp Arg Tyr Glu Lys Ile Leu Ala Ser Arg Gly Ile Lys Gln Lys Thr
85 90 95
Leu Ile Asn Tyr Met Ser Lys Ile Lys Ala Ile Arg Arg Gly Leu Pro
100 105 110
Asp Ala Pro Leu Glu Asp Ile Thr Thr Lys Glu Ile Ala Ala Met Leu
115 120 125
Asn Gly Tyr Ile Asp Glu Gly Lys Ala Ala Ser Ala Lys Leu Ile Arg
130 135 140
Ser Thr Leu Ser Asp Ala Phe Arg Glu Ala Ile Ala Glu Gly His Ile
145 150 155 160
Thr Thr Asn His Val Ala Ala Thr Arg Ala Ala Lys Ser Lys Val Arg
165 170 175
Arg Ser Arg Leu Thr Ala Asp Glu Tyr Leu Lys Ile Tyr Gln Ala Ala
180 185 190
Glu Ser Ser Pro Cys Trp Leu Arg Leu Ala Met Glu Leu Ala Val Val
195 200 205
Thr Gly Gln Arg Val Gly Asp Leu Cys Lys Met Lys Trp Ser Asp Ile
210 215 220
Val Asp Gly Tyr Leu Tyr Val Glu Gln Ser Lys Thr Gly Val Lys Ile
225 230 235 240
Ala Ile Pro Thr Ala Leu His Ile Asp Ala Leu Gly Ile Ser Met Lys
245 250 255
Glu Thr Leu Asp Lys Cys Lys Glu Ile Leu Gly Gly Glu Thr Ile Ile
260 265 270
Ala Ser Thr Arg Arg Glu Pro Leu Ser Ser Gly Thr Val Ser Arg Tyr
275 280 285
Phe Met Arg Ala Arg Lys Ala Ser Gly Leu Ser Phe Glu Gly Asp Pro
290 295 300
Pro Thr Phe His Glu Leu Arg Ser Leu Ser Ala Arg Leu Tyr Glu Lys
305 310 315 320
Gln Ile Ser Asp Lys Phe Ala Gln His Leu Leu Gly His Lys Ser Asp
325 330 335
Thr Met Ala Ser Gln Tyr Arg Asp Asp Arg Gly Arg Glu Trp Asp Lys
340 345 350
Ile Glu Ile Lys
355
<210> 2
<211> 356
<212> PRT
<213> 人工的
<220>
<223> C2λ整合酶突变体
<400> 2
Met Gly Arg Arg Arg Ser His Glu Arg Arg Asp Leu Pro Pro Asn Leu
1 5 10 15
Tyr Ile Arg Asn Asn Gly Tyr Tyr Cys Tyr Arg Asp Pro Arg Thr Gly
20 25 30
Lys Glu Phe Gly Leu Gly Arg Asp Arg Arg Ile Ala Ile Thr Glu Ala
35 40 45
Ile Gln Ala Asn Ile Glu Leu Phe Ser Gly His Lys His Lys Pro Leu
50 55 60
Thr Ala Arg Ile Asn Ser Asp Asn Ser Val Thr Leu His Ser Trp Leu
65 70 75 80
Asp Arg Tyr Glu Lys Ile Leu Ala Ser Arg Gly Ile Lys Gln Lys Thr
85 90 95
Leu Ile Asn Tyr Met Ser Lys Ile Lys Ala Ile Arg Arg Gly Leu Pro
100 105 110
Asp Ala Pro Leu Glu Asp Ile Thr Thr Lys Glu Ile Ala Ala Met Leu
115 120 125
Asn Gly Tyr Ile Asp Glu Gly Lys Ala Ala Ser Ala Lys Leu Ile Arg
130 135 140
Ser Thr Leu Ser Asp Ala Phe Arg Glu Ala Ile Ala Glu Gly His Ile
145 150 155 160
Thr Thr Asn His Val Ala Ala Thr Arg Ala Ala Lys Ser Lys Val Arg
165 170 175
Arg Ser Arg Leu Thr Ala Asp Glu Tyr Leu Lys Ile Tyr Gln Ala Ala
180 185 190
Glu Ser Ser Pro Cys Trp Leu Arg Leu Ala Met Glu Leu Ala Val Val
195 200 205
Thr Gly Gln Arg Val Gly Asp Leu Cys Lys Met Lys Trp Ser Asp Ile
210 215 220
Val Asp Gly Tyr Leu Tyr Val Glu Gln Ser Lys Thr Gly Val Lys Ile
225 230 235 240
Ala Ile Pro Thr Ala Leu His Ile Asp Ala Leu Gly Ile Ser Met Lys
245 250 255
Glu Thr Leu Asp Lys Cys Lys Glu Ile Leu Gly Gly Glu Thr Ile Ile
260 265 270
Ala Ser Thr Arg Arg Glu Pro Leu Ser Ser Gly Thr Val Ser Arg Tyr
275 280 285
Phe Met Arg Ala Arg Lys Ala Ser Gly Leu Ser Phe Glu Gly Asp Pro
290 295 300
Pro Thr Phe His Glu Leu Arg Ser Leu Ser Ala Arg Leu Tyr Glu Lys
305 310 315 320
Gln Ile Ser Asp Lys Phe Ala Gln His Leu Leu Gly His Lys Ser Val
325 330 335
Thr Met Ala Ser Gln Tyr Arg Asp Asp Arg Gly Arg Glu Trp Asp Lys
340 345 350
Ile Glu Ile Lys
355
<210> 3
<211> 356
<212> PRT
<213> 人工的
<220>
<223> C3λ整合酶突变体
<400> 3
Met Gly Arg Arg Arg Ser His Glu Arg Arg Asp Leu Pro Pro Asn Leu
1 5 10 15
Tyr Ile Arg Asn Asn Gly Tyr Tyr Cys Tyr Arg Asp Pro Arg Thr Gly
20 25 30
Lys Glu Phe Gly Leu Gly Arg Asp Arg Arg Phe Ala Ile Thr Glu Ala
35 40 45
Ile Gln Ala Asn Ile Glu Leu Phe Ser Gly His Lys His Lys Pro Leu
50 55 60
Thr Ala Arg Ile Asn Ser Asp Asn Ser Val Thr Leu His Ser Trp Leu
65 70 75 80
Asp Arg Tyr Glu Lys Ile Leu Ala Ser Arg Gly Ile Lys Gln Lys Thr
85 90 95
Leu Ile Asn Tyr Met Ser Lys Ile Lys Ala Ile Arg Arg Gly Leu Pro
100 105 110
Asp Ala Pro Leu Glu Asp Ile Thr Thr Lys Glu Ile Ala Ala Met Leu
115 120 125
Asn Gly Tyr Ile Asp Glu Gly Lys Ala Ala Ser Ala Lys Leu Ile Arg
130 135 140
Ser Thr Leu Ser Asp Ala Phe Arg Glu Ala Ile Ala Glu Gly His Ile
145 150 155 160
Thr Thr Asn His Val Ala Ala Thr Arg Ala Ala Lys Ser Lys Val Arg
165 170 175
Arg Ser Arg Leu Thr Ala Asp Glu Tyr Leu Lys Ile Tyr Gln Ala Ala
180 185 190
Glu Ser Ser Pro Cys Trp Leu Arg Leu Ala Met Glu Leu Ala Val Val
195 200 205
Thr Gly Gln Arg Val Gly Asp Leu Cys Lys Met Lys Trp Ser Asp Ile
210 215 220
Val Asp Gly Tyr Leu Tyr Val Glu Gln Ser Lys Thr Gly Val Lys Ile
225 230 235 240
Ala Ile Pro Thr Ala Leu His Ile Asp Ala Leu Gly Ile Ser Met Lys
245 250 255
Glu Thr Leu Asp Lys Cys Lys Glu Ile Leu Gly Gly Glu Thr Ile Ile
260 265 270
Ala Ser Thr Arg Arg Glu Pro Leu Ser Ser Gly Thr Val Ser Arg Tyr
275 280 285
Phe Met Arg Ala Arg Lys Ala Ser Gly Leu Ser Phe Glu Gly Asp Pro
290 295 300
Pro Thr Phe His Glu Leu Arg Ser Leu Ser Ala Arg Leu Tyr Gly Lys
305 310 315 320
Gln Ile Ser Asp Lys Phe Ala Gln His Leu Leu Gly His Lys Ser Val
325 330 335
Thr Met Ala Ser Gln Tyr Arg Asp Asp Arg Gly Arg Glu Trp Asp Lys
340 345 350
Ile Glu Ile Lys
355
<210> 4
<211> 1071
<212> DNA
<213> 噬菌体λ整合酶
<400> 4
atgggaagaa ggcgaagtca tgagcgccgg gatttacccc ctaaccttta tataagaaac 60
aatggatatt actgctacag ggacccaagg acgggtaaag agtttggatt aggcagagac 120
aggcgaatcg caatcactga agctatacag gccaacattg agttattttc aggacacaaa 180
cacaagcctc tgacagcgag aatcaacagt gataattccg ttacgttaca ttcatggctt 240
gatcgctacg aaaaaatcct ggccagcaga ggaatcaagc agaagacact cataaattac 300
atgagcaaaa ttaaagcaat aaggaggggt ctgcctgatg ctccacttga agacatcacc 360
acaaaagaaa ttgcggcaat gctcaatgga tacatagacg agggcaaggc ggcgtcagcc 420
aagttaatca gatcaacact gagcgatgca ttccgagagg caatagctga aggccatata 480
acaacaaacc atgtcgctgc cactcgcgca gcaaaatcaa aggtaaggag atcaagactt 540
acggctgacg aatacctgaa aatttatcaa gcagcagaat catcaccatg ttggctcaga 600
cttgcaatgg aactggctgt tgttaccggg caacgagttg gtgatttatg caaaatgaag 660
tggtctgata tcgtagatgg atatctttat gtcgagcaaa gcaaaacagg cgtaaaaatt 720
gccatcccaa cagcattgca tattgatgct ctcggaatat caatgaagga aacacttgat 780
aaatgcaaag agattcttgg cggagaaacc ataattgcat ctactcgtcg cgaaccgctt 840
tcatccggca cagtatcaag gtattttatg cgcgcacgaa aagcatcagg tctttccttc 900
gaaggggatc cgcctacctt tcacgagttg cgcagtttgt ctgcaagact ctatgagaag 960
cagataagcg ataagtttgc tcaacatctt ctcgggcata agtcggacac catggcatca 1020
cagtatcgtg atgacagagg cagggagtgg gacaaaattg aaatcaaata a 1071
<210> 5
<211> 21
<212> DNA
<213> attB
<400> 5
ctgctttttt atactaactt g 21
<210> 6
<211> 21
<212> DNA
<213> attP
<400> 6
cagctttttt atactaagtt g 21
<210> 7
<211> 21
<212> DNA
<213> attH
<400> 7
ctgctttctt ataccaagtg g 21
<210> 8
<211> 21
<212> DNA
<213> attPH
<400> 8
cagctttctt ataccaagtt g 21
<210> 9
<211> 21
<212> DNA
<213> attP4X
<400> 9
cagctttatt tcattaagtt g 21
<210> 10
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> petF2引物
<400> 10
catcggtgat gtcggcgat 19
<210> 11
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> petR引物
<400> 11
cggatatagt tcctcctttc agca 24
<210> 12
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> attP-F引物
<400> 12
cacagaattc cgtctgttac aggtcactaa taccatct 38
<210> 13
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> attPSOE-R引物
<400> 13
acatttcccc gaaaagtgcc acctgaacat caccgggaaa tcaaataatg at 52
<210> 14
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> TEM1prom-F引物
<400> 14
ttcaggtggc acttttcggg gaaatgt 27
<210> 15
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> TEM1prom-R引物
<400> 15
tgtggaattc ctacactaga aggacagtat ttggtatctg c 41
<210> 16
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌AttB-F引物
<400> 16
ctgaaaatgt gttcacaggt tgct 24
<210> 17
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌AttB-R引物
<400> 17
gcaatgccat ctggtatcac t 21
<210> 18
<211> 1071
<212> DNA
<213> 人工序列
<220>
<223> C2突变基因
<400> 18
atgggaagaa ggcgaagtca tgagcgccgg gatttacccc ctaaccttta tataagaaac 60
aatggatatt actgctacag ggacccaagg acgggtaaag agtttggatt aggcagagac 120
aggcgaatcg caatcactga agctatacag gccaacattg agttattttc aggacacaaa 180
cacaagcctc tgacagcgag aatcaacagt gataattccg ttacgttaca ttcatggctt 240
gatcgctacg aaaaaatcct ggccagcaga ggaatcaagc agaagacact cataaattac 300
atgagcaaaa ttaaagcaat aaggaggggt ctgcctgatg ctccacttga agacatcacc 360
acaaaagaaa ttgcggcaat gctcaatgga tacatagacg agggcaaggc ggcgtcagcc 420
aagttaatca gatcaacgct gagcgatgca ttccgagagg caatagctga aggccatata 480
acaacaaacc atgtcgctgc cactcgcgca gcaaagtcaa aggtaaggag atcaagactt 540
acggctgacg aatacctgaa aatttatcaa gcagcagaat catcaccatg ttggctcaga 600
cttgcaatgg aactggctgt tgttaccggg caacgagttg gtgacttgtg caaaatgaag 660
tggtctgata tcgtagatgg atatctttat gtcgagcaaa gcaaaacagg cgtaaaaatt 720
gccatcccaa cagcattgca tattgatgct ctcggaatat caatgaagga aacacttgat 780
aaatgcaaag agattcttgg cggagaaacc ataattgcat ctactcgtcg cgaaccgctt 840
tcatccggca cagtatcaag gtattttatg cgcgcacgaa aagcatcagg tctttccttc 900
gaaggggatc cgcctacctt tcacgagttg cgcagtttgt ctgcaagact ctatgagaag 960
cagataagcg ataagtttgc tcaacatctt ctcgggcata agtcggtcac catggcatca 1020
cagtatcgtg atgacagagg cagggagtgg gacaaaattg aaatcaaata a 1071
<210> 19
<211> 1071
<212> DNA
<213> 人工序列
<220>
<223> C3突变基因
<400> 19
atgggaagaa ggcgaagtca tgagcgccgg gatttacccc ctaaccttta tataagaaac 60
aatggatatt actgctacag ggacccaagg acgggtaaag agtttggatt aggcagagac 120
aggcgattcg caatcactga agctatacag gccaacattg agttattttc aggacacaaa 180
cacaagcctc tgacagcgag aatcaacagt gataattccg ttacgttaca ttcatggctt 240
gatcgctacg aaaaaatcct ggccagcaga ggaatcaagc agaagacact cataaattac 300
atgagcaaaa ttaaagcaat aaggaggggt ctgcctgatg ctccacttga agacatcacc 360
acaaaagaaa ttgcggcaat gctcaatgga tacatagacg agggcaaggc ggcgtcagcc 420
aagttaatca gatcaacgct gagcgatgca ttccgagagg caatagctga aggccatata 480
acaacaaacc atgtcgctgc cactcgcgcg gcaaagtcaa aggtaaggag atcaagactt 540
acggctgacg aatacctgaa aatttatcaa gcagcagaat catcaccatg ttggctcaga 600
cttgcaatgg aactggctgt tgttaccggg caacgagttg gtgacttgtg caaaatgaag 660
tggtctgata tcgtagatgg atatctttat gtcgagcaaa gcaaaacagg cgtaaaaatt 720
gccatcccaa cagcattgca tattgatgct ctcggaatat caatgaagga aacacttgat 780
aaatgcaaag agattcttgg cggagaaacc ataattgcat ctactcgtcg cgaaccgctc 840
tcatccggca cagtatcaag gtattttatg cgcgcacgaa aagcatcagg tctttccttc 900
gaaggggatc cgcctacctt tcacgagttg cgcagtttgt ctgcaagact ctatgggaag 960
cagataagcg ataagtttgc tcaacatctt ctcgggcata agtcggtcac catggcatca 1020
cagtatcgtg atgacagagg cagggagtgg gacaaaattg aaatcaaata a 1071
<210> 20
<211> 1481
<212> DNA
<213> 人工序列
<220>
<223> C3突变小环DNA
<400> 20
catcggtgat gtcggcgata taggcgccag caaccgcacc tgtggcgccg gtgatgccgg 60
ccacgatgcg tccggcgtag aggatcgaga tctcgatccc gcgaaattaa tacgactcac 120
tataggggaa ttgtgagcgg ataacaattc ccctctagaa ataattttgt ttaactttaa 180
gaaggagata tacatatggg aagaaggcga agtcatgagc gccgggattt accccctaac 240
ctttatataa gaaacaatgg atattactgc tacagggacc caaggacggg taaagagttt 300
ggattaggca gagacaggcg attcgcaatc actgaagcta tacaggccaa cattgagtta 360
ttttcaggac acaaacacaa gcctctgaca gcgagaatca acagtgataa ttccgttacg 420
ttacattcat ggcttgatcg ctacgaaaaa atcctggcca gcagaggaat caagcagaag 480
acactcataa attacatgag caaaattaaa gcaataagga ggggtctgcc tgatgctcca 540
cttgaagaca tcaccacaaa agaaattgcg gcaatgctca atggatacat agacgagggc 600
aaggcggcgt cagccaagtt aatcagatca acgctgagcg atgcattccg agaggcaata 660
gctgaaggcc atataacaac aaaccatgtc gctgccactc gcgcggcaaa gtcaaaggta 720
aggagatcaa gacttacggc tgacgaatac ctgaaaattt atcaagcagc agaatcatca 780
ccatgttggc tcagacttgc aatggaactg gctgttgtta ccgggcaacg agttggtgac 840
ttgtgcaaaa tgaagtggtc tgatatcgta gatggatatc tttatgtcga gcaaagcaaa 900
acaggcgtaa aaattgccat cccaacagca ttgcatattg atgctctcgg aatatcaatg 960
aaggaaacac ttgataaatg caaagagatt cttggcggag aaaccataat tgcatctact 1020
cgtcgcgaac cgctctcatc cggcacagta tcaaggtatt ttatgcgcgc acgaaaagca 1080
tcaggtcttt ccttcgaagg ggatccgcct acctttcacg agttgcgcag tttgtctgca 1140
agactctatg ggaagcagat aagcgataag tttgctcaac atcttctcgg gcataagtcg 1200
gtcaccatgg catcacagta tcgtgatgac agaggcaggg agtgggacaa aattgaaatc 1260
aaacatcatc accatcacca ctaatgagaa ttcgagctcc gtcgacaagc ttgcggccgc 1320
actcgagcac caccaccacc accactgaga tccggctgct aacaaagccc gaaaggaagc 1380
tgagttggct gctgccaccg ctgagcaata actagcataa ccccttgggg cctctaaacg 1440
ggtcttgagg ggttttttgc tgaaaggagg aactatatcc g 1481
<210> 21
<211> 1599
<212> DNA
<213> 人工序列
<220>
<223> attP-TEM1小环
<400> 21
cacagaattc cgtctgttac aggtcactaa taccatctaa gtagttgatt catagtgact 60
gcatatattg tgttttacag tattatgtag tctgtttttt atgcaaaatc taatttaata 120
tattgatatt tatatcattt tacgtttctc gttcagcttt tttatactaa gttggcatta 180
taaaaaagca ttgcttatca atttgttgca acgaacaggt cactatcagt caaaataaaa 240
tcattatttg atttcccggt gatgttcagg tggcactttt cggggaaatg tgcgcggaac 300
ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc 360
ctgataaatg cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt 420
cgcccttatt cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct 480
ggtgaaagta aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga 540
tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag 600
cacttttaaa gttctgctat gtggcgcggt attatcccgt attgacgccg ggcaagagca 660
actcggtcgc cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga 720
aaagcatctt acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag 780
tgataacact gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc 840
ttttttgcac aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa 900
tgaagccata ccaaacgacg agcgtgacac cacgatgcct gcagcaatgg caacaacgtt 960
gcgcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg 1020
gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 1080
tattgctgat aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg 1140
gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat 1200
ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 1260
gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa 1320
aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 1380
ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 1440
ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 1500
tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 1560
gataccaaat actgtccttc tagtgtagcc gtagttagg 1599
<210> 22
<211> 21
<212> DNA
<213> HOP'
<400> 22
atgctttatt tcattaagtt g 21
<210> 23
<211> 103
<212> DNA
<213> attL
<400> 23
gcattataaa aaagcattgc ttatcaattt gttgcaacga acaggtcact atcagtcaaa 60
atacaatcat tatttgattt caattttgtc ccactccctc ccg 103
<210> 24
<211> 331
<212> DNA
<213> 人工序列
<220>
<223> PGK启动子
<400> 24
aattctaccg ggtaggggag gcgcttttcc caaggcagtc tggagcatgc gctttagcag 60
ccccgctggg cacttggcgc tacacaagtg gcctctggcc tcgcacacat tccacatcca 120
ccggtaggcg ccaaccggct ccgttctttg gtggcccctt cgcgccacct tctactcctc 180
ccctagtcag gaagttcccc cccgccccgc agctcgcgtc gtgcaggacg tgacaaatgg 240
aagtagcacg tctcactagt ctcgtgcaga tggacagcac cgctgagcaa tggaagcggg 300
taggcctttg gggcagcggc caatagcagc t 331
<210> 25
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> HOP'attH4X_F1引物
<400> 25
gagtgttttc caacttggtt ccatt 25
<210> 26
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> PuroRev24引物
<400> 26
caccgtgggc ttgtactcgg tc 22
<210> 27
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> pLIR-F1引物
<400> 27
ctgcatcgat tcagctagct g 21
<210> 28
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> pLIR-R1引物
<400> 28
ctgatagtga cctgttcgtt gc 22
<210> 29
<211> 4906
<212> DNA
<213> 人工序列
<220>
<223> pPGKssPuro-attP4X (靶向载体)
<400> 29
gaattcctct gttacaggtc actaatacca tctaagtagt tgattcatag tgactgcata 60
tgttgtgttt tacagtatta tgtagtctgt tttttatgca aaatctaatt taatatattg 120
atatttatat cattttacgt ttctcgttca gctttatttc attaagttgg cattataaaa 180
aagcattgct tatcaatttg ttgcaacgaa caggtcacta tcagtcaaaa taaaatcatt 240
atttgatttc aattttgtcc cactccctcc cgaattctac cgggtagggg aggcgctttt 300
cccaaggcag tctggagcat gcgctttagc agccccgctg gcacttggcg ctacacaagt 360
ggcctctggc ctcgcacaca ttccacatcc accggtagcg ccaaccggct ccgttctttg 420
gtggcccctt cgcgccactt ctactcctcc cctagtcagg aagtttcccc cccgccccgc 480
agctcgcgtc gtgcaggacg tgacaaatgg aagtagcacg tctcactagt ctcgtgcaga 540
tggacagcac cgctgagcaa tggaagcggg taggcctttg gggcagcggc caatagcagc 600
tttgctcctt cgctttctgg gctcagaggc tgggaagggg tgggtccggg ggcgggctca 660
ggggcgggct caggggcggg gcgggcgccc gaaggtcctc cggaggcccg gcattctgca 720
cgcttcaaaa gcgcacgtct gccgcgctgt tctcctcttc ctcatctccg ggcctttcga 780
ccaattcgct gtctgcgagg gccagctgtt ggggtgagta ctccctctca aaagcgggca 840
tgacttctgc gctaagattg tcagtttcca aaaacgagga ggatttgata ttcacctggc 900
ccgcggtgat gcctttgagg gtggccgcgt ccatctggtc agaaaagaca atctttttgt 960
tgtcaagctt gaggtgtggc aggcttgaga tctggccata cacttgagtg acaatgacat 1020
ccactttgcc tttctctcca caggtgtcca ctcccaggtc caactgcaga tgaccgagta 1080
caagcccacg gtgcgcctcg ccacccgcga cgacgtcccc cgggccgtac gcaccctcgc 1140
cgccgcgttc gccgactacc ccgccacgcg ccacaccgtc gacccggacc gccacatcga 1200
gcgggtcacc gagctgcaag aactcttcct cacgcgcgtc gggctcgaca tcggcaaggt 1260
gtgggtcgcg gacgacggcg ccgcggtggc ggtctggacc acgccggaga gcgtcgaagc 1320
gggggcggtg ttcgccgaga tcggcccgcg catggccgag ttgagcggtt cccggctggc 1380
cgcgcagcaa cagatggaag gcctcctggc gccgcaccgg cccaaggagc ccgcgtggtt 1440
cctggccacc gtcggcgtct cgcccgacca ccagggcaag ggtctgggca gcgccgtcgt 1500
gctccccgga gtggaggcgg ccgagcgcgc cggggtgccc gccttcctgg agacctccgc 1560
gccccgcaac ctccccttct acgagcggct cggcttcacc gtcaccgccg acgtcgaggt 1620
gcccgaagga ccgcgcacct ggtgcatgac ccgcaagccc ggtgcctgat ctagagctcg 1680
ctgatcagcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt 1740
gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat 1800
tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag 1860
caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc 1920
ttctgaggcg gaaagaacca gctggggctc gagatccact agttctagcc tcgaggctag 1980
agcggccgcc accgcggtgg agctccaatt cgccctatag tgagtcgtat tacgcgcgct 2040
cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc caacttaatc 2100
gccttgcagc acatccccct ttcgccagct ggcgtaatag cgaagaggcc cgcaccgatc 2160
gcccttccca acagttgcgc agcctgaatg gcgaatggga cgcgccctgt agcggcgcat 2220
taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag 2280
cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc 2340
aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc 2400
ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga tagacggttt 2460
ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa 2520
caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg ccgatttcgg 2580
cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat 2640
taacgcttac aatttaggtg gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt 2700
atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct 2760
tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg cccttattcc 2820
cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa 2880
agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg 2940
taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt 3000
tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg 3060
catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac 3120
ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc 3180
ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt ttttgcacaa 3240
catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc 3300
aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt 3360
aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga 3420
taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa 3480
atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc cagatggtaa 3540
gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg atgaacgaaa 3600
tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccaagt 3660
ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa ggatctaggt 3720
gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt cgttccactg 3780
agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt 3840
aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca 3900
agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac 3960
tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac 4020
atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct 4080
taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg 4140
gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga gatacctaca 4200
gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt 4260
aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa acgcctggta 4320
tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc 4380
gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc 4440
cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt ctgtggataa 4500
ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag 4560
cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg 4620
ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag cgggcagtga 4680
gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat 4740
gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca caggaaacag 4800
ctatgaccat gattacgcca agcgcgcaat taaccctcac taaagggaac aaaagctggg 4860
taccgggccc cccctcgagg tcgacggtat cgataagctt gatatc 4906
<210> 30
<211> 5308
<212> DNA
<213> 人工序列
<220>
<223> pCMVssKZ-IntC3-CNLS (整合酶表达质粒)
<400> 30
gaattcctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg 60
ccatgcatta gttattaata gtaatcaatt acggggtcat tagttcatag cccatatatg 120
gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc caacgacccc 180
cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg gactttccat 240
tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca tcaagtgtat 300
catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc ctggcattat 360
gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt attagtcatc 420
gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata gcggtttgac 480
tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt ttggcaccaa 540
aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca aatgggcggt 600
aggcgtgtac ggtgggaggt ctatataagc agagctggtt tagtgaaccg tcagatccgc 660
tagcaattcg ctgtctgcga gggccagctg ttggggtgag tactccctct caaaagcggg 720
catgacttct gcgctaagat tgtcagtttc caaaaacgag gaggatttga tattcacctg 780
gcccgcggtg atgcctttga gggtggccgc gtccatctgg tcagaaaaga caatcttttt 840
gttgtcaagc ttgaggtgtg gcaggcttga gatctggcca tacacttgag tgacaatgac 900
atccactttg cctttctctc cacaggtgtc cactcccagg tccaactgca gctcgaggtc 960
caccatggga agaaggcgaa gtcatgagcg ccgggattta ccccctaacc tttatataag 1020
aaacaatgga tattactgct acagggaccc aaggacgggt aaagagtttg gattaggcag 1080
agacaggcga ttcgcaatca ctgaagctat acaggccaac attgagttat tttcaggaca 1140
caaacacaag cctctgacag cgagaatcaa cagtgataat tccgttacgt tacattcatg 1200
gcttgatcgc tacgaaaaaa tcctggccag cagaggaatc aagcagaaga cactcataaa 1260
ttacatgagc aaaattaaag caataaggag gggtctgcct gatgctccac ttgaagacat 1320
caccacaaaa gaaattgcgg caatgctcaa tggatacata gacgagggca aggcggcgtc 1380
agccaagtta atcagatcaa cgctgagcga tgcattccga gaggcaatag ctgaaggcca 1440
tataacaaca aaccatgtcg ctgccactcg cgcggcaaag tcaaaggtaa ggagatcaag 1500
acttacggct gacgaatacc tgaaaattta tcaagcagca gaatcatcac catgttggct 1560
cagacttgca atggaactgg ctgttgttac cgggcaacga gttggtgact tgtgcaaaat 1620
gaagtggtct gatatcgtag atggatatct ttatgtcgag caaagcaaaa caggcgtaaa 1680
aattgccatc ccaacagcat tgcatattga tgctctcgga atatcaatga aggaaacact 1740
tgataaatgc aaagagattc ttggcggaga aaccataatt gcatctactc gtcgcgaacc 1800
gctctcatcc ggcacagtat caaggtattt tatgcgcgca cgaaaagcat caggtctttc 1860
cttcgaaggg gatccgccta cctttcacga gttgcgcagt ttgtctgcaa gactctatgg 1920
gaagcagata agcgataagt ttgctcaaca tcttctcggg cataagtcgg tcaccatggc 1980
atcacagtat cgtgatgaca gaggcaggga gtgggacaaa attgaaatca aatccggagg 2040
cggccctaag aagaagagaa aggtatgata atctagagct cgctgatcag cctcgactgt 2100
gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 2160
aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 2220
taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 2280
agacaatagc aggcatgctg gggatgcggt gggctctatg gcttctgagg cggaaagaac 2340
cagctggggc tcgagatcca ctagttctag cctcgaggct agagcggccg ccaccgcggt 2400
ggagctccaa ttcgccctat agtgagtcgt attacgcgcg ctcactggcc gtcgttttac 2460
aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc 2520
ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc 2580
gcagcctgaa tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 2640
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 2700
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 2760
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 2820
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 2880
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 2940
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 3000
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttagg 3060
tggcactttt cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc 3120
aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag 3180
gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg 3240
ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt 3300
gggtgcacga gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt 3360
tcgccccgaa gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt 3420
attatcccgt attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa 3480
tgacttggtt gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag 3540
agaattatgc agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac 3600
aacgatcgga ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac 3660
tcgccttgat cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac 3720
cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac 3780
tctagcttcc cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact 3840
tctgcgctcg gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg 3900
tgggtctcgc ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt 3960
tatctacacg acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat 4020
aggtgcctca ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta 4080
gattgattta aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa 4140
tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga 4200
aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac 4260
aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt 4320
tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc tagtgtagcc 4380
gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat 4440
cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag 4500
acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc 4560
cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag 4620
cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac 4680
aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg 4740
gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct 4800
atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc 4860
tcacatgttc tttcctgcgt tatcccctga ttctgtggat aaccgtatta ccgcctttga 4920
gtgagctgat accgctcgcc gcagccgaac gaccgagcgc agcgagtcag tgagcgagga 4980
agcggaagag cgcccaatac gcaaaccgcc tctccccgcg cgttggccga ttcattaatg 5040
cagctggcac gacaggtttc ccgactggaa agcgggcagt gagcgcaacg caattaatgt 5100
gagttagctc actcattagg caccccaggc tttacacttt atgcttccgg ctcgtatgtt 5160
gtgtggaatt gtgagcggat aacaatttca cacaggaaac agctatgacc atgattacgc 5220
caagcgcgca attaaccctc actaaaggga acaaaagctg ggtaccgggc cccccctcga 5280
ggtcgacggt atcgataagc ttgatatc 5308
<210> 31
<211> 21
<212> DNA
<213> attH4X
<400> 31
acgctttatt tcattaagtt g 21

Claims (37)

1.一种λ整合酶,其包含在如SEQ ID NO:1所示的λ整合酶的第336、319和43位中的至少一个位置处的氨基酸突变。
2.根据权利要求1所述的λ整合酶,其中所述λ整合酶包含在如SEQ ID NO:1所示的λ整合酶的第43、319和336位处的氨基酸突变。
3.根据权利要求1或2所述的λ整合酶,其中在序列位置43处的氨基酸残基异亮氨酸被芳族氨基酸替代。
4.根据权利要求3所述的λ整合酶,其中所述芳族氨基酸选自由苯丙氨酸、酪氨酸和色氨酸组成的组。
5.根据权利要求1到4中任一项所述的λ整合酶,其中在序列位置319处的氨基酸残基谷氨酸被甘氨酸替代。
6.根据权利要求1到5中任一项所述的λ整合酶,其中在序列位置336处的氨基酸残基天冬氨酸被疏水性氨基酸替代。
7.根据权利要求6所述的λ整合酶,其中所述疏水性氨基酸是脂族氨基酸。
8.根据权利要求7所述的λ整合酶,其中所述脂族氨基酸选自由异亮氨酸、亮氨酸和缬氨酸组成的组。
9.根据权利要求1到8中任一项所述的λ整合酶,其中所述λ整合酶包含如SEQ ID NO:3所示的λ整合酶中的氨基酸突变I43F、E319G和D336V。
10.根据权利要求1所述的λ整合酶,其中所述λ整合酶包含如SEQ ID NO:1所示的λ整合酶的第336位的氨基酸突变。
11.根据权利要求10所述的λ整合酶,其中在序列位置336处的氨基酸残基天冬氨酸被疏水性氨基酸替代。
12.根据权利要求11所述的λ整合酶,其中所述疏水性氨基酸是脂族氨基酸。
13.根据权利要求12所述的λ整合酶,其中所述脂族氨基酸选自由异亮氨酸、亮氨酸和缬氨酸组成的组。
14.根据权利要求10至13中任一项所述的λ整合酶,其中所述λ整合酶包含如SEQ IDNO:2所示的λ整合酶中的氨基酸突变D336V。
15.根据权利要求10到14中任一项所述的λ整合酶,其中在序列位置319处的氨基酸残基谷氨酸被甘氨酸替代。
16.根据权利要求15所述的λ整合酶,其中所述λ整合酶包含如SEQ ID NO:3所示的λ整合酶中的氨基酸突变E319G和D336V。
17.一种核酸分子,其包含编码根据权利要求1到16中任一项所述的λ整合酶的核苷酸序列。
18.根据权利要求15所述的核酸分子,其中所述核酸分子可操作地连接到调控序列以允许所述核酸分子的表达。
19.根据权利要求16所述的核酸分子,其中所述调控序列包括启动子序列。
20.根据权利要求17到19中任一项所述的核酸分子,其中所述核酸分子位于载体中。
21.一种宿主细胞,其含有根据权利要求17到20中任一项所述的核酸分子。
22.一种使目标核酸重组到靶核酸中的方法,所述方法包括在如权利要求1到16中任一项所定义的λ整合酶存在下,使包含所述目标核酸的靶向核酸与所述靶核酸接触。
23.根据权利要求22所述的方法,其中所述靶核酸包括DNA。
24.根据权利要求22所述的方法,其中所述靶核酸包括基因组DNA。
25.根据权利要求22到24中任一项所述的方法,其中所述靶核酸包括选自由attH序列(SEQ ID NO:7)和attH4X序列(SEQ ID NO:31)组成的组的序列。
26.根据权利要求22到25中任一项所述的方法,其中所述靶向核酸是载体。
27.根据权利要求26所述的方法,其中所述靶向核酸包括选自由attPH序列(SEQ IDNO:8)和attP4X序列(SEQ ID NO:9)组成的组的序列。
28.根据权利要求22到27中任一项所述的方法,其中在一种或多种辅因子存在下进行序列特异性重组。
29.根据权利要求28所述的方法,其中所述辅因子选自由XIS、FIS和IHF组成的组。
30.根据权利要求24到29中任一项所述的方法,其中在细胞中包含所述基因组DNA。
31.一种序列特异性重组试剂盒,其包含:
a.可***有目标核酸的靶向核酸,和
b.根据权利要求1到16中任一项所述的λ整合酶或如权利要求17到20中任一项所述的核酸。
32.根据权利要求31所述的试剂盒,其进一步包含至少一种用于使所述目标核酸***所述靶向核酸中的试剂。
33.根据权利要求31或32所述的试剂盒,其中所述靶向核酸包括选自由attPH序列(SEQID NO:8)和attP4X序列(SEQ ID NO:9)组成的组的序列。
34.根据权利要求31或32所述的试剂盒,其中所述靶向核酸包括选自由attH序列(SEQID NO:7)和attH4X序列(SEQ ID NO:31)组成的组的序列。
35.根据权利要求31到34中任一项所述的试剂盒,其进一步包含用于使所述目标核酸与给定的靶核酸重组的缓冲液和/或说明书。
36.根据权利要求31到35中任一项所述的试剂盒,其进一步包含至少一种用于确定成功的序列特异性重组事件的试剂。
37.根据权利要求36所述的试剂盒,其中所述试剂是引物对。
CN201580054345.8A 2014-08-08 2015-08-11 噬菌体λ整合酶的突变体 Active CN108064279B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1414130.3A GB201414130D0 (en) 2014-08-08 2014-08-08 Mutants of the bacteriophage lambda integrase
GB1414130.3 2014-08-08
PCT/SG2015/050255 WO2016022075A1 (en) 2014-08-08 2015-08-11 Mutants of the bacteriophage lambda integrase

Publications (2)

Publication Number Publication Date
CN108064279A true CN108064279A (zh) 2018-05-22
CN108064279B CN108064279B (zh) 2022-03-11

Family

ID=51629549

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580054345.8A Active CN108064279B (zh) 2014-08-08 2015-08-11 噬菌体λ整合酶的突变体

Country Status (7)

Country Link
US (2) US10344301B2 (zh)
EP (1) EP3177717A4 (zh)
JP (1) JP6616822B2 (zh)
CN (1) CN108064279B (zh)
GB (1) GB201414130D0 (zh)
SG (2) SG11201700955SA (zh)
WO (1) WO2016022075A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201414130D0 (en) * 2014-08-08 2014-09-24 Agency Science Tech & Res Mutants of the bacteriophage lambda integrase
GB201603577D0 (en) * 2016-03-01 2016-04-13 Oxford Genetics Ltd Promoter
US11078493B2 (en) 2016-06-21 2021-08-03 Nanyang Technological University Site-specific DNA recombination
CN110914414A (zh) 2017-06-14 2020-03-24 德累斯顿工业大学 利用设计dna重组酶遗传改变基因组的方法与手段
CN114450309A (zh) * 2019-07-29 2022-05-06 印第安纳大学理事会 治疗弗里德里希共济失调的材料和方法
IL293359A (en) 2019-11-25 2022-07-01 Larimar Therapeutics Inc Methods for quantifying parataxin activity
BR112022021823A2 (pt) 2020-04-30 2023-01-17 Larimar Therapeutics Inc Métodos para tratar doenças associadas à mielina e doenças associadas à mitocôndria
CN117178056A (zh) * 2021-03-12 2023-12-05 南洋理工大学 用于生产无缝dna载体的方法
WO2023234866A1 (en) * 2022-05-31 2023-12-07 Nanyang Technological University Method for production of a eukaryotic host cell or cell line for lambda-integrase-mediated recombination

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002097059A2 (en) * 2001-05-30 2002-12-05 Chromos Molecular Systems, Inc. Chromosome-based platforms
US20130017578A1 (en) * 2009-11-06 2013-01-17 Farid John Ghadessy Muteins of the bacteriophage lambda integrases

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2522166C (en) 2001-05-30 2011-05-03 Chromos Molecular Systems, Inc. Lambda integrase mutein for use in recombination
EP2647692A3 (en) * 2008-11-11 2014-01-22 The Procter and Gamble Company Compositions and methods comprising serine protease variants
GB201414130D0 (en) * 2014-08-08 2014-09-24 Agency Science Tech & Res Mutants of the bacteriophage lambda integrase

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002097059A2 (en) * 2001-05-30 2002-12-05 Chromos Molecular Systems, Inc. Chromosome-based platforms
US20130017578A1 (en) * 2009-11-06 2013-01-17 Farid John Ghadessy Muteins of the bacteriophage lambda integrases

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
EZRA YAGI ET AL.,: "Identifying Determinants of Recombination Specificity: Construction and Characterization of Chimeric Bacteriophage Integrases", 《JOURNAL OF MOLECULAR BIOLOGY》 *
YVONNE TAY ET AL.,: "Selection of bacteriophage λ integrases with altered recombination specificity by in vitro compartmentalization", 《NUCLEIC ACIDS RESEARCH》 *

Also Published As

Publication number Publication date
US20170327847A1 (en) 2017-11-16
EP3177717A1 (en) 2017-06-14
JP2017525355A (ja) 2017-09-07
SG10202005089XA (en) 2020-07-29
GB201414130D0 (en) 2014-09-24
US10344301B2 (en) 2019-07-09
US11414681B2 (en) 2022-08-16
US20200063165A1 (en) 2020-02-27
JP6616822B2 (ja) 2019-12-04
CN108064279B (zh) 2022-03-11
EP3177717A4 (en) 2017-12-27
WO2016022075A1 (en) 2016-02-11
SG11201700955SA (en) 2017-03-30

Similar Documents

Publication Publication Date Title
CN108064279A (zh) 噬菌体λ整合酶的突变体
KR102451510B1 (ko) Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법
CN104498493B (zh) CRISPR/Cas9特异性敲除乙型肝炎病毒的方法以及用于特异性靶向HBV DNA的gRNA
KR20200015701A (ko) 레트 증후군에서의 MeCP2의 안전한 발현을 위한 자가-조절 AAV 벡터
AU2021200863A1 (en) Genetically-modified cells comprising a modified human t cell receptor alpha constant region gene
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
CN113831407A (zh) 用于使用多个引导rna来破坏免疫耐受性的方法
US20030022179A1 (en) Methods and reagents for molecular cloning
DK2768848T3 (en) METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS
KR102628872B1 (ko) 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법
CN109153990A (zh) 用于基因编辑的组合物和方法
CN111926030B (zh) 一种基于CRISPR-Cas12a***的噬菌体基因组编辑载体及其应用
KR20210151916A (ko) 뒤시엔느 근육 이영양증의 치료를 위한 aav 벡터-매개된 큰 돌연변이 핫스팟의 결실
Koh et al. Advanced multigene expression system for Nannochloropsis salina using 2A self-cleaving peptides
KR102409420B1 (ko) 형질전환 생물체 선별용 마커 조성물, 형질전환 생물체 및 형질전환 방법
CN114525304B (zh) 一种基因编辑的方法
CN111849978A (zh) 一种基于Type I-F CRISPR/Cas的染色质成像方法和染色质成像***
CN110241098B (zh) 酿脓链球菌的CRISPR核酸酶SpCas9的截短型高特异性变异体及其应用
CN116083398B (zh) 分离的Cas13蛋白及其应用
CN110016481A (zh) 一种pX335-xCas9n载体及其构建方法和应用
RU2761660C1 (ru) Штамм клеток Escherichia coli BL21(DE3)/pET32v11-Flpo, продуцирующих сайт-специфическую рекомбиназу Flpe
CN106947775A (zh) 一种在体实时长时间连续记录基因转录活性的方法和装置
CN112877353B (zh) 一种表达载体及其制备方法和应用
CN114958758B (zh) 一种乳腺癌模型猪的构建方法及应用
RU2781083C2 (ru) Варианты, композиции и методы применения хоминг-эндонуклеазы pd-1

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant