CN110121559A - 通过模板化组装反应进行蛋白质的定向折叠组装或二聚化的方法 - Google Patents

通过模板化组装反应进行蛋白质的定向折叠组装或二聚化的方法 Download PDF

Info

Publication number
CN110121559A
CN110121559A CN201780080921.5A CN201780080921A CN110121559A CN 110121559 A CN110121559 A CN 110121559A CN 201780080921 A CN201780080921 A CN 201780080921A CN 110121559 A CN110121559 A CN 110121559A
Authority
CN
China
Prior art keywords
monoploid
ligand
ligand complex
protein
fusion protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780080921.5A
Other languages
English (en)
Inventor
伊恩·邓恩
马修·劳勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tribiotica LLC
Original Assignee
Tribiotica LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tribiotica LLC filed Critical Tribiotica LLC
Publication of CN110121559A publication Critical patent/CN110121559A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/713Double-stranded nucleic acids or oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D401/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom
    • C07D401/02Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing two hetero rings
    • C07D401/12Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing two hetero rings linked by a chain containing hetero atoms as chain links
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D401/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom
    • C07D401/14Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing three or more hetero rings
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3513Protein; Peptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Hematology (AREA)
  • Immunology (AREA)
  • Urology & Nephrology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • General Chemical & Material Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Cell Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Peptides Or Proteins (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本公开提供了核酸分子、包含所述核酸分子的组合物和试剂盒,以及用于产生模板化组装产物的方法。

Description

通过模板化组装反应进行蛋白质的定向折叠组装或二聚化的 方法
技术领域
本公开部分涉及核酸分子、包含所述核酸分子的组合物和试剂盒,以及用于产生模板化组装产物的方法。
背景技术
药物开发的目标是向致病细胞,如病毒感染的细胞、赘生性细胞、产生自身免疫应答的细胞以及其他失调或功能障碍细胞递送有效的生物治疗干预。能够对抗致病细胞的有效生物治疗干预的实例包括毒素、促凋亡剂以及重新导向免疫细胞以消除致病细胞的免疫治疗方法。遗憾的是,由于对相邻正常细胞或患者的整体健康有高风险的毒性,这些药剂的开发非常困难。
已经出现的允许向致病细胞递送有效干预同时减轻对正常细胞的毒性的方法是通过将治疗剂导向对致病细胞具有特异性的分子标志物来实现所述治疗剂的靶向。靶向治疗剂已经在有限的病例中显示出非凡的临床结果,但由于缺乏靶向疗法的可接近标志物,目前在其可应用性上受到限制。发现许多致病细胞类型的蛋白质标志物是极其困难的,且常常是不可能的。
近年来,已经开发了靶向对致病细胞具有特异性的核酸靶标的疗法。现有的核酸靶向疗法(如siRNA)能够下调潜在危险基因的表达,但不递送有效的细胞毒性或细胞抑制性干预,因此在消除危险细胞本身方面不是特别有效。
因此,需要对抗现有生物治疗干预的不良功效和/或严重副作用。如本文所述,可以使用核酸分子模板通过折叠或二聚化组装蛋白质,这可以用于对抗致病或其他不期望的细胞或细胞产物。此类模板化组装过程可以用于靶向目标细胞类型以进行破坏。成对的携带特别定制且相互反应的配体的修饰寡核苷酸可以按照如本文所阐述的模板化组装来组装具有预定功能的蛋白质。
发明内容
本公开提供了单倍体-配体复合物(haplomer-ligand complex),其包含:单倍体,其中单体包含与靶核酸分子基本上互补的多核苷酸;以及与单倍体的5’或3’末端连接的配体,其中配体包含配体配偶体结合位点。
本公开还提供了包含本文所述的第一单倍体-配体复合物和本文所述的第二单倍体-配体复合物的组合物或试剂盒,其中:第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5’末端连接;并且第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的3’末端连接。
本公开还提供了瓶形单倍体-配体复合物,其包含:瓶形单倍体,其中瓶形单倍体包含多核苷酸,其中多核苷酸包括:a)第一茎部,其包括约10至约20个核苷酸碱基;b)反靶环部分,其包括约16至约40个核苷酸碱基且具有与第一茎部连接的第一末端,其中反靶环部分与靶核酸分子基本上互补;c)第二茎部,其包括约10至约20个核苷酸碱基,与反靶环部分的第二末端连接,其中第一茎部与第二茎部基本上互补;以及d)配体,其与第一茎部或第二茎部的末端连接,其中配体包含配体配偶体结合位点;其中反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm
本公开还提供了组合物或试剂盒,其包含:本文所述的瓶形单倍体-配体复合物;以及第二单倍体-配体复合物,其包含:包括约6至约20个核苷酸碱基的核苷酸部分,其与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补;以及与第二单倍体-配体复合物的核苷酸部分的5’或3’末端连接的配体,其中配体包含配体配偶体结合位点;其中第二单倍体-配体复合物:与瓶形单倍体-配体复合物的配体连接的第一或第二茎部的Tm小于或等于瓶形单倍体-配体复合物的第一茎部:第二茎部的Tm
本公开还提供了具有下式的化合物:
其中m为3至6。
本公开还提供了具有下式的化合物:
其中m为3至6。
本公开还提供了具有下式的化合物:
其中n为1至6。
本公开还提供了具有下式的化合物:
其中x为1至6。
本公开还提供了具有下式的化合物:
其中x为1至6。
本公开还提供了具有下式的化合物:
在本文也称为单价FKBP配体-2(MFL2)。
本公开还提供了融合蛋白,其包含与配体结合结构域融合的目标蛋白质的片段,其中:配体结合结构域是用于小分子配体的配体结合结构域;或配体结合结构域是相互作用的蛋白质结构域。
本公开还提供了包含本文所述的第一融合蛋白和本文所述的第二融合蛋白的组合物或试剂盒,其中第一融合蛋白的目标蛋白质和第二融合蛋白的目标蛋白质可以二聚化或折叠在一起。
本公开还提供了组合物或试剂盒,其包含:本文所述的第一单倍体-配体复合物;本文所述的第二单倍体-配体复合物;本文所述的第一融合蛋白;以及本文所述的第二融合蛋白;其中第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5’末端连接;其中第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的3’末端连接;其中第一单倍体-配体复合物的多核苷酸与靶核酸分子基本上互补;其中第二单倍体-配体复合物的多核苷酸在与第一单倍体-配体复合物的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补;其中第一单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;并且其中第一融合蛋白的目标蛋白质的片段和第二融合蛋白的目标蛋白质的片段可以二聚化或折叠在一起。
本公开还提供了组合物或试剂盒,其包含:本文所述的第一单倍体-配体复合物;本文所述的第二单倍体-配体复合物;本文所述的第一融合蛋白;以及本文所述的第二融合蛋白;其中第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5’末端连接;其中第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的3’末端连接;其中第一单倍体-配体复合物的多核苷酸与靶核酸分子基本上互补;其中第二单倍体-配体复合物的多核苷酸在与第一单倍体-配体复合物的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补;其中第一单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;并且其中第一融合蛋白的目标蛋白质的片段和第二融合蛋白的目标蛋白质的片段可以二聚化或折叠在一起。
本公开还提供了组合物或试剂盒,其包含:本文所述的第一瓶形单倍体-配体复合物;本文所述的第二单倍体-配体复合物,其中第二单倍体-配体复合物包含与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;本文所述的第一融合蛋白;以及本文所述的第二融合蛋白;其中第一瓶形单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;并且其中第一融合蛋白的目标蛋白质的片段和第二融合蛋白的目标蛋白质的片段可以二聚化或折叠在一起。
本公开还提供了组合物或试剂盒,其包含:本文所述的第一瓶形单倍体-配体复合物;本文所述的第二单倍体-配体复合物,其中第二单倍体-配体复合物包含与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;本文所述的第一融合蛋白;以及本文所述的第二融合蛋白;其中第一瓶形单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;并且其中第一融合蛋白的目标蛋白质的片段和第二融合蛋白的目标蛋白质的片段可以二聚化或折叠在一起。
本公开还提供了用于蛋白质的定向组装的方法,其包括:使靶核酸分子与本文所述的第一单倍体-配体复合物接触;使靶核酸与本文所述的第二单倍体-配体复合物接触;使第一单倍体-配体复合物与本文所述的第一融合蛋白接触;以及使第二单倍体-配体复合物与本文所述的第二融合蛋白接触;其中第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5’末端连接;其中第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的3’末端连接;其中第一单倍体-配体复合物的多核苷酸与靶核酸分子基本上互补;其中第二单倍体-配体复合物的多核苷酸在与第一单倍体-配体复合物的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补;其中第一单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;并且其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
本公开还提供了用于蛋白质的定向组装的方法,其包括:使靶核酸分子与本文所述的第一单倍体-配体复合物接触;使靶核酸与本文所述的第二单倍体-配体复合物接触;使第一单倍体-配体复合物与本文所述的第一融合蛋白接触;以及使第二单倍体-配体复合物与本文所述的第二融合蛋白接触;其中第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5’末端连接;其中第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的3’末端连接;其中第一单倍体-配体复合物的多核苷酸与靶核酸分子基本上互补;其中第二单倍体-配体复合物的多核苷酸在与第一单倍体-配体复合物的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补;其中第一单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;并且其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
本公开还提供了用于蛋白质的定向组装的方法,其包括:使靶核酸分子与通过本文所述的第一单倍体-配体复合物与本文所述的第一融合蛋白的相互作用形成的复合物接触,其中第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5'末端连接,并且其中第一单倍体-配体复合物的配体与第一融合蛋白的配体结合结构域相互作用;以及使靶核酸分子与通过本文所述的第二单倍体-配体复合物与本文所述的第二融合蛋白的相互作用形成的复合物接触,其中第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的5’末端连接,并且其中第二单倍体-配体复合物的配体与第二融合蛋白的配体结合结构域相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
本公开还提供了用于蛋白质的定向组装的方法,其包括:使靶核酸分子与通过本文所述的第一单倍体-配体复合物与本文所述的第一融合蛋白的相互作用形成的复合物接触,其中第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5'末端连接,并且其中第一单倍体-配体复合物的配体与第一融合蛋白的配体结合结构域相互作用;以及使靶核酸分子与通过本文所述的第二单倍体-配体复合物与本文所述的第二融合蛋白的相互作用形成的复合物接触,其中第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的5’末端连接,并且其中第二单倍体-配体复合物的配体与第二融合蛋白的配体结合结构域相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
本公开还提供了用于蛋白质的定向组装的方法,其包括:使靶核酸分子与本文所述的瓶形单倍体-配体复合物接触;使靶核酸与本文所述的第二单倍体-配体复合物接触,其中第二单倍体-配体复合物包含与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;使瓶形单倍体-配体复合物与本文所述的第一融合蛋白接触,其中瓶形单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;以及使第二单倍体-配体复合物与本文所述的第二融合蛋白接触,其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
本公开还提供了用于蛋白质的定向组装的方法,其包括:使靶核酸分子与本文所述的瓶形单倍体-配体复合物接触;使靶核酸与本文所述的第二单倍体-配体复合物接触,其中第二单倍体-配体复合物包含与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;使瓶形单倍体-配体复合物与本文所述的第一融合蛋白接触,其中瓶形单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;以及使第二单倍体-配体复合物与本文所述的第二融合蛋白接触,其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
本公开还提供了用于蛋白质的定向组装的方法,其包括:使靶核酸分子与本文所述的瓶形单倍体-配体复合物接触;使靶核酸分子与本文所述的第二单倍体-配体复合物接触,其中第二单倍体-配体复合物包含与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;使瓶形单倍体-配体复合物与本文所述的第一融合蛋白接触,其中瓶形单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;以及使第二单倍体-配体复合物与本文所述的第二融合蛋白接触,其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
本公开还提供了用于蛋白质的定向组装的方法,其包括:使靶核酸分子与本文所述的瓶形单倍体-配体复合物接触;使靶核酸分子与本文所述的第二单倍体-配体复合物接触,其中第二单倍体-配体复合物包含与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;使瓶形单倍体-配体复合物与本文所述的第一融合蛋白接触,其中瓶形单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;以及使第二单倍体-配体复合物与本文所述的第二融合蛋白接触,其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
通过二聚化或折叠由与修饰寡核苷酸(单倍体)缔合的蛋白质片段实现的功能活性蛋白质的模板化组装可分成两阶段过程。第一阶段包括单倍体与其互补对应物的结合。配体介导的第二阶段实现具有适当的配体结合结构域的蛋白融合体的同二聚化或异二聚化。模板介导的二聚化或折叠适用于激活靶致病细胞中的特定蛋白质,以用于诊断或治疗目的。
附图说明
图1示出通过接近增强的反应性实现的配体导向的模板组装(LD-TAPER)代表性原理的概述。
图2示出FK506、FKBP与钙调磷酸酶之间的代表性三元复合物形成;以及雷帕霉素和mTOR/FRB与钙调磷酸酶之间的代表性三元复合物形成。
图3示出LD-TAPER的代表性范畴和范围。
图4示出由衍生自FK506或雷帕霉素的化合物介导的表达为具有FKBP或FRB结构域的融合体的目标蛋白质的代表性“强制二聚化”。
图5示出代表性LD-TAPER:通过小分子介质实现的蛋白质二聚化。
图6示出突变型FKBP结合化合物的代表性的修饰单价型式FKM-NHS。
图7示出突变型FKBP结合化合物的代表性的修饰单价型式FKM-磺基-NHS。
图8示出突变型FKBP结合化合物的代表性的修饰单价型式FKM-PEG3-NHS。
图9示出通过LD-TAPER实现的代表性的小分子介导的蛋白质二聚化。
图10示出通过LD-TAPER实现的另一代表性的小分子介导的蛋白质二聚化。
图11示出通过LD-TAPER实现的另一代表性的小分子介导的蛋白质二聚化。
图12示出通过LD-TAPER实现的另一代表性的小分子介导的蛋白质二聚化。
图13示出用于使用小分子配体、通过LD-TAPER实现的小分子介导的蛋白质二聚化的锁定TAPER寡核苷酸的代表性结构。
图14示出代表性LD-TAPER:通过小的相互作用的蛋白质结构域实现的蛋白质二聚化。
图15示出平行亮氨酸拉链的代表性极性考量。
图16示出代表性LD-TAPER:通过小分子配体/配体结合结构域相互作用实现的***蛋白折叠。
图17示出代表性LD-TAPER:通过小蛋白质结构域相互作用实现的***蛋白折叠,以及极性效应。
图18示出用于LD-TAPER的代表性异组分***。
图19示出用于LD-TAPER的代表性异组分***:具有亮氨酸拉链的特定实施方案。
图20示出代表性LD-TAPER配体稳定化,这通过将点击基团附连到单倍体配体上以进行模板化原位连接来实现。
图21示出代表性点击修饰的单价配体,其具有用于突变型FKBP和寡核苷酸衍生化的甲基四嗪(MTZ)侧链。
图22示出代表性点击修饰的单价配体,其具有用于突变型FKBP和寡核苷酸衍生化的反式环辛烯(TCO)侧链。
图23示出作为具有麦芽糖结合蛋白(MBP)的融合蛋白的c-Jun片段的代表性测试表达,以及在融合体的肠激酶切割后产生游离c-Jun产物的展示。
图24示出用于使用反平行拉链构型,通过LD-TAPER实现的***蛋白折叠的代表性锁定TAPER c-Jun寡核苷酸。
图25示出利用c-Jun:c-Fos相互作用,通过LD-TAPER实现的代表性的锁定TAPER***蛋白折叠。
图26示出用于通过LD-TAPER实现的***蛋白折叠的代表性的锁定TAPER化合物FKM-寡核苷酸。
图27示出利用FKM-FKBP结合,通过LD-TAPER实现的代表性的锁定TAPER***蛋白折叠。
图28示出在16%Tricine凝胶上测试的具有和不具有相应的C22S和C61S突变的所表达的Gaussia***蛋白FKBP和FRB融合蛋白;示出用IPTG诱导后的表达样品,其中“直接裂解物”是指获取且在凝胶上样之前在标准的Laemmli SDS缓冲液中裂解的全细胞样品,并且“IMAC纯化蛋白”是指用咪唑从六组氨酸亲和磁珠上洗脱之后的样品;泳道:1和7,N末端Gaussia区段-FKBP(F36V);2和8,FKBP(F36V)-C末端Gaussia区段;3和9,FRB-C末端Gaussia区段;4和10,N末端Gaussia区段-FKBP(F36V/C22S);5和11,FKBP(F36V/C22S)-C末端Gaussia区段;6和12,FRB(C61S)-C末端Gaussia区段。
图29(小图1、2、3和4)示出与FKBP-F36V结构域融合、具有或不具有另外的C22S突变,或与FRB结构域融合、具有或不具有另外的C61S突变的***蛋白Gaussia片段的二聚化响应;数据示出在具有和不具有二聚化因子的情况下蛋白质的发光响应,所有均在测试开始起4小时时;1:Gaussia N末端-FKBP-F36V融合体(A)、FKBP-F36V-C末端Gaussia融合体(B)、组合(A)+(B),以及具有0.15μM AP20187(AP)的(A)+(B);2:Gaussia N末端-FKBP-F36V-C22S融合体(C)、FKBP-F36V-C22S-C末端Gaussia融合体(D)、组合(C)+(D),以及具有0.15μM AP20187(AP)的(C)+(D);3:Gaussia N末端-FKBP-F36V融合体(A)、FRB-C末端Gaussia融合体(V)、(A)+(V),以及具有0.15μM雷帕霉素(RAP)的(A)+(V);4:Gaussia N末端-FKBP-F36V-C22S融合体(C0、FRB-C61S-C末端Gaussia融合体(W)、(C)+(W),以及具有0.15μM雷帕霉素(RAP)的(C)+(W)。
图30示出通过5’-或3’-硫醇修饰的寡核苷酸与单价FKBP-F36V配体MFL2之间的反应形成缀合物;修饰寡核苷酸上的每个硫醇基团通过6C间隔子与最近的碱基分开;将33pmol的未修饰的硫醇-寡核苷酸或相应的MFL2缀合物在15%变性8M尿素凝胶上测试,并用SYBR-Gold染色。
图31示出利用具有FKBP-F36V-C22S的Gaussia荧光素酶***蛋白融合体的LD-TAPER展示,其通过处于架构1的MFL2-寡核苷酸缀合物介导;发光读数在Y轴上示出;给出时间依赖性阳性信号的互补LD-TAPER单倍体的制备物在图例中用方框框出。
图32示出用于使用架构2进行LD-TAPER展示的过程。
图33(小图1和2)示出利用具有FKBP-F36V或FKBP-F36V-C22S的Gaussia荧光素酶***蛋白融合体进行的LD-TAPER展示,其经由固相捕获通过处于架构2的MFL2-寡核苷酸缀合物介导;小图1,FKBP-F36V Gaussia融合体,其中(A)=N末端Gaussia片段-FKBP-F36V融合体,并且(B)=FKBP-F36V-C末端Gaussia融合体;407MFL2和409MFL2=相应地与化合物MFL2缀合的寡核苷酸407和409;407u和409u=相应的未缀合的硫醇-寡核苷酸;小图2,FKBP-F36V-C22S Gaussia融合体,其中(A)=N末端Gaussia片段-FKBP-F36V-C22S融合体,并且(B)=FKBP-F36V-C22S-C末端Gaussia融合体;407MFL2、409MFL2、407u和409u与小图1中一样;在与脱硫生物素化模板杂交之后(参见图32),将模板和模板结合的单倍体在链霉抗生物素蛋白磁珠上分离,用游离的D-生物素洗脱,并且在温育30分钟后评估Gaussia荧光素酶活性(发光单位在Y轴上)。
图34示出利用具有FKBP-F36V-C22S的Gaussia荧光素酶***蛋白融合体进行的LD-TAPER展示,其通过处于架构2的MFL2-寡核苷酸缀合物介导,其中模板或对照处于溶液相。
具体实施方式
现在将描述某些示例性实施方案以便在总体上理解本文所公开的组合物和方法的结构原理、功能、制造和用途。这些实施方案的一个或多个实例在附图中示出。本领域技术人员应当理解本文中具体描述并在附图中示出的组合物和方法均为非限制的示例性实施方案,并且本公开的范围仅由权利要求书限定。结合一个示例性实施方案来示出或描述的特征可以与其他实施方案的特征进行组合。此类修改和变型旨在被包括在本公开的范围内。
除非内容另外明确指出,如本文所用,单数形式“一个”、“一种”和“所述”包括多个指代物。本公开使用的术语遵循本领域普通技术人员通常接受的标准定义。在可能需要任何进一步解释的情况下,下文进一步阐明了一些术语。
如本文所用,短语“反靶环部分”是指有利于与靶核酸分子的序列特异性结合的单倍体的部分。
如本文所用,术语“碱基”是指含有嘌呤或嘧啶基团的分子或人工类似物,其通过Watson-Crick或Hoogsteen键合相互作用与另一相应碱基形成结合对。碱基还含有有利于聚合物如寡聚物中的多个碱基共价连接在一起的基团。非限制性实例包括核苷酸、核苷、肽核酸残基或吗啉代残基。
如本文所用,术语“结合(bind、binds、binding和bound)”是指彼此靠近的两个分子之间的稳定相互作用。所述术语包括物理相互作用,如化学键(直接连接或通过中间结构连接),以及非物理相互作用和吸引力,如静电吸引、氢键和范德华力/分散力。
如本文所用,短语“生物缀合化学”是指在温和条件下将常见官能团连接在一起,有利于多部分化合物的模块化构建的化学合成策略和试剂。
如本文所用,短语“化学接头”是指将一个单倍体与另一个单倍体或一个部分与不同化合物上的另一个部分结合的分子。接头可由支链或非支链的共价键合的分子链构成。
如本文所用,短语“剂量单位形式”是指适合作为待治疗受试者的单一剂量的物理上离散的单位。
如本文所用,术语“单倍体(haplomer)”是指与配体连接的核酸分子,其以序列特异性方式结合靶核酸分子模板并在核酸模板化组装期间参与蛋白质形成。本文还包括“衍生物”或“类似物”,如其盐、水合物、溶剂化物,或已经进行化学修饰并保持相同的生物活性或生物活性缺乏、和/或用作单倍体或以与单倍体一致的方式起作用的能力的其他分子。
如本文所用,短语“非无痕生物正交化学(non-traceless bio-orthogonalchemistry)”是指涉及选择性反应性部分的反应,其中选择性反应性部分的部分或全部结构保留在产物结构中。
如本文所用,短语“核酸模板化组装”是指蛋白质在靶核酸分子上二聚化或折叠,使得可以通过在与靶核酸分子结合时接近的正在组装的单倍体促进蛋白质形成。
如本文所用,术语“低聚物”和“oligo”是指由多个单元组成的分子,其中一些或所有单元是能够形成Watson-Crick或Hoogsteen碱基配对相互作用的碱基,从而允许与双链体或多链体结构中的核酸分子的序列特异性结合。非限制性实例包括但不限于寡核苷酸、肽核酸低聚物和吗啉代低聚物。
如本文所用,短语“致病细胞”可以指能够导致或促进患病或异常状况的细胞,如感染病毒的细胞、肿瘤细胞以及感染微生物的细胞,或产生诱导或介导疾病的分子的细胞,所述疾病包括但不限于过敏症、过敏反应、炎症和自身免疫。
如本文所用,短语“药学上可接受的”是指材料不是生物学上或其他方面不可接受的,可以掺入组合物中并施用于患者而不引起不可接受的生物学效应或以不可接受的方式与组合物的其他组分相互作用。
如本文所用,短语“药学上可接受的盐”意指由可接受施用于患者如哺乳动物的碱或酸制备的盐(例如,对于给定的剂量方案具有可接受的哺乳动物安全性的盐)。
如本文所用,术语“盐”可以包括衍生自药学上可接受的无机酸和碱的盐以及衍生自药学上可接受的有机酸和碱的盐以及其衍生物和变体。
如本文所用,术语“样品”是指在可能发生核酸模板化组装时可向其中施用单倍体的任何体系。样品的实例包括但不限于固定或保藏细胞、整个生物体、组织、肿瘤、裂解物或体外测定***。
如本文所用,短语“一组相应的反应物”或“相应的单倍体”是指聚集在单个靶核酸分子上以参与模板化组装反应的单倍体。
如本文所用,术语“超抗原”是指结合广泛亚类的表达特定可变(V)区的T细胞的抗原。
如本文所用,短语“靶区室”是指含有一种或多种靶核酸分子,或与非靶区室不同量的靶核酸分子的细胞、病毒、组织、肿瘤、裂解物、其他生物结构、空间区域或样品。
如本文所用,短语“靶核酸序列”和“靶核酸分子”可互换使用并且是指旨在充当核酸模板化组装的模板的单元或核酸的序列。
如本文所用,短语“模板化组装产物”是指通过与单倍体缔合的特定蛋白质的两个片段的二聚化或折叠形成的蛋白质。
如本文所用,短语“无痕生物正交化学”是指涉及单倍体配体的反应,其中通过从由此产生的配体结构中消除部分或全部生物正交部分而形成天然存在的键,如酰胺。
对指定的目标细胞具有特异性的核酸分子(无论这些是由病理性肿瘤细胞、异常免疫细胞还是任何其他细胞类型代表)可以用作通过分子相互作用的接近性诱导的增强实现新结构(例如,效应子结构)的生成的模板(参见,例如,PCT公布WO 2014/197547)。此类模板化产物可以被设计以便以各种方式触发细胞死亡,或调节细胞活性。细胞类型特异性核酸可以来源于特异性转录的mRNA,或通过可以用于使非核酸靶标适应于提供限定的模板序列的核酸适体产生。
在用于上述诊断或治疗目的的模板化组装的初始过程中,借助反应性基团与预定序列的寡核苷酸的连接而使所述反应性基团在空间上接近,所述预定序列的寡核苷酸自身在靶核酸分子模板上接近共杂交。携带相互反应的基团的模板导向的修饰寡核苷酸被称为“单倍体”。反应性基团的这种强制接近大大增强了产物形成,并且因此细胞类型特异性转录物可以指导目标细胞中期望分子的产生。如本文所述,通过将特异性配体附连至每个单倍体寡核苷酸而不是直接相互作用的官能团,可以将TAPER的一般原理改变为两级过程。因此,在TAPER的原始配置(本文称为“常规TAPER”)中,该过程可以表示为在单个反应工序内发生,其中模板可以在功能上视为特定催化剂:
其中H1和H2分别代表携带反应性基团A和B的单倍体。在与特定模板杂交时,形成A与B之间的接近性驱动的反应中间体[A:B],从而迅速导致产物[P]的形成。
在TAPER的配体导向的替代物(即LD-TAPER)中,期望过程以两个不同的层级发生:
其中H1和H2代表单倍体,L1代表任何形式的配体,并且D指示蛋白质结合结构域或能够以特定方式与配体结合的任何其他分子。此处,两个分子的D与两个配体分子的初始结合(表现为处于通过单倍体模板结合实现的空间接近)示出为D-D二聚体形成之前的过渡状态,其可以是或可以不是热力学可逆的。在LD-TAPER的第二阶段,仍然需要模板来强制实现配体L1-L1空间接近。对于LD-TAPER的所有变体实施方案都是这样,接近增强的共价相互作用被设计成发生在两个修饰的L1分子、或修饰的L1与L2分子之间,使得它们变得共价连接并因此稳定为一对的情况除外。当然倘若它们与同源结合结构域的相互作用不受配体-配体共价连接的影响(作为此实施方案的必要前提条件),那么LD-TAPER过程的后续阶段二变成非模板依赖性的。两阶段LD-TAPER过程的普适性质在图1示意性地示出。参考图1,具有特异性附连配体(L1和L2)的单倍体与靶核酸分子模板结合,使得配体彼此在空间上接近。通过配体与相应的配体结合结构域之间的相互作用,将与目标配体的结合结构域(R1和R2)融合的蛋白质或多肽(P1和P2)导向模板化的单倍***点。P1和P2区段被强制在空间上接近,从而促进二聚化或蛋白质折叠。
尽管LD-TAPER是两阶段过程,但原则上单倍体/模板杂交不必需包括第一步骤(如图1所描绘)。在一些实施方案中,可能希望最初预先形成具有其指定的同源配体结合结构域的每个单倍体(携带附连的配体),以形成单倍体-融合蛋白复合物。随后,进行杂交步骤,从而导致与配体结合结构域融合的蛋白质片段自身的期望的分子接近。使用以上术语,这可表示为:
其中取代基如先前所述。
LD-TAPER的各种实施方案是可能的,其中H1和H2附连有不同的配体(L1和L2),或其中配体可以通过两个单独的结合结构域(D1和D2)结合。如果D1和D2是***蛋白多肽,那么第二级事件可以包括D1与D2之间的成熟蛋白折叠。
生物进化已经提供了可以用于生物技术目标的重要且非常有用的天然小分子配体实例。在这方面,可以注意到一些天然小分子对实验和应用免疫学均有重大影响。天然产物免疫抑制剂环孢菌素A和FK506(分别来自真菌和细菌来源)通过阻断T细胞活化而彻底变革了器官移植。这些化合物分别结合不同的细胞蛋白,即亲环素和FK506结合蛋白(FKBP),但它们共享呈蛋白磷酸酶钙调磷酸酶(其为多种信号传导途径的钙响应调节剂)形式的共同靶标。亲环素-环孢菌素A和FK506-FKBP复合物继而与钙调磷酸酶形成三元复合物,并通过NFAT家族的转录因子抑制其在T细胞活化中的作用。雷帕霉素,另一天然免疫调节分子,与FK506分子结合相同的FKBP,但与具有不同信号通路作用的不相关蛋白FRAP/mTOR形成三元复合物。以下各项之间的相互作用:a)FK506、钙调磷酸酶和FKBP,以及b)雷帕霉素、FKBP和mTOR-FRB在图2中示出。
FK506/FKBP相互作用已在许多领域得到利用,FKBP结合结构域的小尺寸(约100个氨基酸残基)对其有进一步的帮助。为了增强这种相互作用的潜在治疗实用性并使与内源性FKBP蛋白的结合最小化,已经衍生出FKBP的突变型衍生物,其优先结合改变的FK506类似物。因此,F36V FKBP突变体比野生型分子本身更强烈得多地结合特定的FK506衍生物。
尽管小分子配体是在LD-TAPER中使用的一种配体类型,但它们不是可以使用的唯一配体类型。存在适用于此背景的相对小的相互作用的蛋白质结构域(例如,蛋白质的片段),实例是亮氨酸拉链。相互作用的蛋白质结构域的合适实例是c-jun和c-fos拉链结构域,其通常为少于50个氨基酸残基的多肽,包括螺旋起始和螺旋终止区段。虽然c-jun可以形成同二聚体,但c-fos不能;并且c-fos:c-jun异二聚体比c-jun:c-jun同二聚体显著更稳定。出于产生LD-TAPER单倍体的目的将此类拉链序列附连至寡核苷酸提供每个单倍体,其中拉链充当配体,以与具有作为配体结合结构域的互补拉链的期望多肽的融合蛋白结合。
无论用于LD-TAPER的配体是小化学实体还是相互作用的蛋白质结构域,或存在互补结合元件的任何其他结构,两阶段LD-TAPER过程都可应用于相同配偶体蛋白片段(同二聚化)或不同配偶体蛋白片段(异二聚化)的强制二聚化。LD-TAPER的这多个方面汇总于图3中。
LD-TAPER过程及其组分通常可以通过以下一般表示来描述。在非限制性实例中,使用小分子配体的LD-TAPER的实施方案可利用用于FK506的FKBP结合结构域。已知FK506的二价类似物可以驱动FKBP结合结构域或它们的突变型衍生物的二聚化。反过来,如果此类FKBP结构域与其他蛋白质融合,那么后者本身经历强制二聚化事件(参见图4),这在一些情况下可针对有效的生物活性激活目标蛋白质。
出于小分子LD-TAPER的目的,使用单价结构域结合化合物,其化学附连至包含所得单倍体的一部分的短寡核苷酸链的5’或3’末端。当此类单倍体与互补的靶核酸分子模板杂交时,附连的单价化合物在空间上接近(参见图5)。识别并结合单价化合物(即配体)的蛋白质配体结合结构域同样在空间定位上紧密靠在一起,如同与结合结构域本身融合的任何其他蛋白质结构域一样(参见图5)。目标蛋白质的融合结构域的这种强制二聚化导致功能性激活,具有可测量的生物学后果。
在LD-TAPER通过小分子配体介导的情况下,配体身份可对应于其他低分子量限定化合物、或天然或人工肽、肽模拟物、或具有限定的结合配偶体的任何其他分子。小分子LD-TAPER可被设计成具有许多不同的模板:单倍体架构。在包括最简单布置的一些实施方案中,单倍体彼此互补,使得所得双链体强制实现配体相互作用的蛋白质融合体的期望的空间接近。这种构型在本文称为架构1(参见图9)。当单倍体彼此不互补,但与靶核酸分子模板上的空间相邻位点杂交时,实现了架构2(参见图5和图10)。当存在合适的构型时,不连续的杂交位点仍然可以是LD-TAPER靶标。因此,当LD-TAPER单倍体与茎环结构的外边界杂交时,实现了空间接近,从而产生架构3(参见图11)。相反,如果单倍体与适当位点相对于彼此退火,那么茎环的内部区域可以被潜在地靶向,从而产生架构4(参见图12)。
在一些实施方案中,被称为“锁定TAPER”的TAPER的变型容易地适用于LD-TAPER。对于锁定LD-TAPER,第一瓶形单倍体和第二单倍体与预定配体缀合,其方式类似于以上实施方案中的其他LD-TAPER架构。根据锁定TAPER过程的性质,第二单倍体-多肽缀合物的杂交位点是不可接近的,除了在特定靶标的存在下,其中与第一瓶形单倍体的反靶环部分发生杂交。随后,使第二单倍体-多肽缀合物的杂交位点可接近,并且继而实现接近促进的配体介导的二聚化(参见图13)。
在锁定TAPER***内,当携带多肽缀合物的两个寡核苷酸处于杂交介导的空间接近时(参见图13),组装件的结构对应于架构1(参见图9),因为两个衍生的寡核苷酸彼此互补,而不是如在架构2-4中那样与靶核酸分子模板互补。然而,由于锁定TAPER第一瓶形单倍体的反靶环部分必须与靶核酸分子模板杂交以便暴露第二单倍体的识别位点,因此反靶环部分与靶核酸分子本身的结合可以通过不同的架构发生。因此,尽管图9中的锁定TAPER寡核苷酸的靶标杂交对应于架构2(参见图5),但通过架构3和4(分别参见图6和7)实现的靶标杂交同样是可能的。因此,锁定TAPER具有独特特征,由此TAPER组装始终与架构1一致,但靶标杂交可以采用可变架构。换句话说,对于常规的TAPER,靶标杂交和组装指导的杂交是重合的,但对于锁定TAPER,它们是不同且可分开的。
在一些实施方案中,LD-TAPER的配体不是常规意义上的小分子,而是小的相互作用的蛋白质结构域。这些可包括但不限于相互作用的亮氨酸拉链基序,其本身可包括但不限于平行拉链,如c-jun:c-fos;mad:max;以及c-myc:max,或反平行拉链,如来自嗜热栖热菌(Thermus thermophilus)丝氨酰-tRNA合成酶的拉链。
在一些实施方案中,当使用小的相互作用的蛋白质结构域作为配体时,使用良好表征的c-jun:c-fos拉链对,如图14所示。由与目标靶核酸分子模板互补的寡核苷酸区段构成的单倍体可与c-jun结构域缀合,然后与模板杂交。随后,添加与c-fos结构域融合的目标蛋白质片段,从而导致目标蛋白质片段的复合物形成和强制二聚化。在与用以上反应式2.1和2.2概括的两阶段策略相对应的图14的描述中,可通过c-jun同二聚体的形成进一步稳定初始双链体。然而,由于c-jun:c-fos异二聚体显著更稳定,fos-融合蛋白的引入导致优先形成期望的异二聚体复合物(c-fos自身不可形成同二聚体)。在此实施方案的替代型式中,将携带c-jun缀合标签的单倍体与目标fos-融合蛋白预组装,然后添加到含有目标模板的靶***中。这种替代布置对应于用以上反应式3.1和3.2概括的两阶段策略。
在使用小的相互作用的蛋白质结构域作为配体的实施方案中,应考虑到小结构域标签的缀合极性。这可以用使用fos-jun异二聚化的特定实施方案举例说明,其中亮氨酸拉链相互作用以平行取向发生。如果单倍体具有附连的c-Jun标签,使得它们的c-Jun螺旋在杂交后处于平行取向(参见图15),那么随后与c-fos融合蛋白的复合物形成将以平行有义(parallel sense)定向融合体;相反的情况可能不利于目标蛋白质区段之间的二聚化(参见图15)。然而,对于LD-TAPER的某些其他应用(最值得注意的是,对于***蛋白片段的组装,如下),反平行取向可以是有益的。因此,如果存在通过其N或C末端将5’或3’寡核苷酸末端与小蛋白标签缀合的策略是有利的。
在使用小的相互作用的蛋白质结构域作为配体的实施方案中,c-jun和c-fos具有显著的优点。在两种情况下,它们的α-螺旋拉链完全由相对短的多肽限定,所述多肽不具有内部半胱氨酸残基。这些序列可以通过大肠杆菌内的表达***容易地产生,并且足够短以使完全合成是可行的。这对于c-Jun区段是有用的,因为它使硫醇介导的与寡核苷酸的缀合成为一种简易的方法。对于c-jun标签,本文用于制备N末端缀合物的序列是47聚体,其中示出N末端半胱氨酸,并且粗体序列表示螺旋边界: 对于c-jun标签,本文用于制备C末端缀合物的序列是49聚体,其中示出C末端半胱氨酸,并且粗体序列表示螺旋边界: 待制备为具有目标蛋白质片段的融合体的fos拉链的序列为41聚体,其中粗体序列表示螺旋边界: 可以在c-Fos序列与目标蛋白质片段之间***另外的延伸的丝氨酸-甘氨酸接头。
在一些实施方案中,使用c-Jun的突变体,其不可形成同二聚体,但仍可与c-Fos异二聚化。具有N末端半胱氨酸残基的此类修饰序列包括但不限于: 其中粗体残基表示从野生型的变化,并且加有双下划线的序列表示螺旋边界。具有C末端半胱氨酸残基的此类修饰序列包括但不限于:SGASLERIARLEEKVKSFKAQN SENASTANMLREOVAOLKOKGAPSGGC(SEQ ID NO:5),其中粗体残基表示从野生型的变化,并且加有双下划线的序列表示螺旋边界。
在使用小分子配体或小的相互作用的结构域配体的LD-TAPER的一些实施方案中,所述应用可针对***蛋白片段的组装。在其他LD-TAPER实施方案中,与配体结合结构域融合的蛋白质片段自我折叠成良好有序且稳定的结构,但对于应用于***蛋白组装的LD-TAPER不是这样的情况。在后者中,附连于配体结合结构域的蛋白质序列仅在它们以正确的取向在空间上紧密接近放置时才获得它们的成熟折叠。
在利用小分子配体的用于***蛋白重折叠的LD-TAPER的一些实施方案中,***蛋白多肽单独表达为具有FKBP FK506结合结构域的融合体。N末端***蛋白片段被表达为具有C末端FKBP区段,而C末端***蛋白片段被表达为具有N末端FKBP区段(参见图16)。在FKBP结构域与携带单价FKBP结合体的模板化单倍体缀合物结合时(参见图6-8),引发了成熟多肽的接近致能折叠(参见图16,针对模板架构2示出)。因为结合每个单倍体配体的FKBP结构域处于相同(平行)取向,所以***蛋白片段被置于在空间上接近的FKBP对的相对侧(参见图16)。然而,如果FKBP结构域和***蛋白多肽被足够长的丝氨酸-甘氨酸接头分开,那么仍然可能发生***蛋白重折叠。
类似的原理适用于利用小的相互作用的蛋白质结构域作为配体的用于***蛋白重折叠的LD-TAPER的实施方案。在使用c-Jun:c-Fos相互作用的一些实施方案中,N末端***蛋白片段表达为具有c-Fos的C末端融合体,而C末端***蛋白片段表达为具有c-Fos的N末端(参见图17)。在这些实施方案中,可以容易地实现用c-Jun标记的单倍体的反平行布置,这有利于将蛋白质片段并置于c-Jun对的同一侧。然而,对于由小分子配体介导的***蛋白LD-TAPER(参见图16),如果采用足够长的丝氨酸-甘氨酸接头,那么仍然可以使用平行的c-Jun标签(参见图17)。虽然LD-TAPER的***蛋白实施方案的描绘使用单倍体-模板架构2(参见图10),但架构3和4(参见图11和12)同样适用。在此背景中架构1(参见图9)对应于锁定TAPER(参见图13),也与LD-TAPER的***蛋白实施方案非常相容。
在以上实施方案中(如图5和图9-17所示),两种单倍体均携带共同的配体标签,并且目标蛋白质或多肽片段用共同的配体结合结构域标记。这种布置非常适于具有同二聚化特征的***,但由于其作为两阶段过程的性质而不是异二聚化的理想选择。如果要利用单倍体H-A和H-B将蛋白质异二聚体A-B组装在模板上,其中第一阶段是单倍体-模板结合(如在以上反应式2.1和2.2中),并且使用单配体/结合结构域***,那么蛋白质区段A和B可以以三种可能的方式分配,其中只有一种是正确的A-B:
反应式4.1、4.2(为简单起见,仅示出A和B的最终缔合状态)。
由于LD-TAPER的***蛋白应用涉及两种单独的结合结构域-多肽缀合物(参见图16和17),异二聚化特征也适用于这种情况。虽然不排除用于异组分的单配体/结合结构域***的使用(如对于以上A和B),但如果使用反应式4.1和4.2的两阶段程序,那么可能导致非常显著的活性损失。然而,在一些实施方案中,通过在暴露于核酸分子模板之前制备单倍体/配体结合结构域融合体复合物,可以克服此特征。单倍体-融合蛋白复合物的预组装允许控制哪些配体结合结构域-融合蛋白与特定的单倍体形成配偶体。通过此类方式,限定的单倍体序列以与反应式3.1和3.2类似的方式携带目标特异性配体结合结构域复合物:
反应式5.1、5.2(为简单起见,仅示出A和B的最终缔合状态)。
在LD-TAPER的一些实施方案中,能够充分有效地使用异组分***,而不需要预组装单倍体和蛋白质融合结构域仍然可以是有利的。这可以通过使用两种不同的配体来实现,每种配体具有不同且特异性的配偶体配体结合结构域。这种布置可以用与以上相同的符号表示(其中LA和LB代表具有不同结合特异性的两种不同配体,并且A和B代表相应的配体结合实体):
反应式6.1、6.2(为简单起见,仅示出A和B的最终缔合状态)
在异组分LD-TAPER的一些实施方案中,使用亮氨酸拉链相互作用的特异性。这些包括但不限于c-Jun:c-Fos和c-Myc:Max异二聚体形成(参见图19)。因此,单倍体可以被制备成具有c-Jun和c-Myc拉链的末端缀合物,并且可以将目标蛋白质结构域(或***蛋白多肽片段)表达为具有c-Fos和Max的融合体。模板化的jun/myc单倍体指导两个目标结构域的强制接近(参见图19),以用于随后发生的二聚化(预折叠的单体结构域)或折叠(***蛋白多肽片段)。
在LD-TAPER的一些实施方案中,在发生期望的单倍体模板化之后,使作为连接对的小分子单价配体稳定化可能是有益的。尽管在许多情况下,通过小分子LD-TAPER实现的多肽折叠的强制二聚化是不可逆的或缓慢逆转的,但模板介导的单价配体至二价的转化使得随后的二聚化成为非模板依赖性的,就像对于分离形式的常规二价化学二聚化因子一样。通过用与生物正交点击基团对应的侧链装配单价配体化合物来实现单倍体小分子配体的交联,如图20中示意性示出的。在原位模板化点击反应之后,初始单价配体实际上转化为稳定的二价物类,以用于随后与适当的配体结合结构域的相互作用(参见图20)。
LD-TAPER的一些实施方案涉及执行重要生物学功能的预折叠蛋白质的同二聚化或异二聚化。此类蛋白质可以是天然的或人工构建体。这些包括但不限于iCasp9融合蛋白(具有与突变型FKBP序列融合的修饰半胱天冬酶9序列的人工构建体、促凋亡蛋白、或二聚转录因子。在各种实施方案中,由LD-TAPER介导的强制二聚化的作用可通过凋亡测定、报告基因的激活或特定荧光的产生来计量。
LD-TAPER过程及其组分通常可以通过以下更具体的实施方案来描述。
本公开提供了单倍体-配体复合物,其包含:a)单倍体,其中单倍体包含与靶核酸分子基本上互补的多核苷酸;以及b)与单倍体的5’或3’末端连接的配体,其中配体包含配体配偶体结合位点。在一些实施方案中,单倍体的多核苷酸包括约6至约20个核苷酸碱基。在一些实施方案中,单倍体的多核苷酸包括约8至约15个核苷酸碱基。
在一些实施方案中,一对单倍体-配体复合物串联作用。在一些实施方案中,第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5’末端连接,并且第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的3’末端连接。
在一些实施方案中,第一单倍体-配体复合物的多核苷酸与第二单倍体-配体复合物的多核苷酸基本上互补。在一些实施方案中,第一单倍体-配体复合物的多核苷酸与靶核酸分子基本上互补,并且第二单倍体-配体复合物的多核苷酸在与第一单倍体-配体复合物的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补。
在本文所述的任何实施方案中,单倍体-配体复合物在空间上接近(当与靶核酸分子结合时),使得配体以及因此它们各自的配体结合结构域可以恰当地相互作用,以诱导它们各自的目标蛋白质的片段的折叠或二聚化。因此,对于任何单倍体-配体对,在与靶核酸分子结合的第一单倍体-配体复合物与第二单倍体-配体复合物之间的间隙N为0(即,单倍体-配体复合物紧密并置)的情况下可以发生反应性,并且逐渐增大的间隙(N>0)将使反应性逐渐减小。因此,在一些实施方案中,第一单倍体-配体复合物和第二单倍体-配体复合物与靶核酸分子的结合之间存在0个核苷酸。在一些实施方案中,第一单倍体-配体复合物和第二单倍体-配体复合物与靶核酸分子的结合之间存在少于6个核苷酸。在一些实施方案中,第一单倍体-配体复合物和第二单倍体-配体复合物与靶核酸分子的结合之间存在少于5个核苷酸。在一些实施方案中,第一单倍体-配体复合物和第二单倍体-配体复合物与靶核酸分子的结合之间存在少于4个核苷酸。在一些实施方案中,第一单倍体-配体复合物和第二单倍体-配体复合物与靶核酸分子的结合之间存在少于3个核苷酸。在一些实施方案中,第一单倍体-配体复合物和第二单倍体-配体复合物与靶核酸分子的结合之间存在少于2个核苷酸。
在一些实施方案中,两种配体均为小分子配体或两种配体均为相互作用的蛋白质结构域。在一些实施方案中,第一单倍体-配体复合物的配体还包含生物正交部分,并且第二单倍体-配体复合物的配体还包含生物正交部分,其中第一单倍体-配体复合物的生物正交部分与第二单倍体-配体复合物的生物正交部分可反应。
本公开还提供了瓶形单倍体-配体复合物,其包含:a)瓶形单倍体,其中瓶形单倍体包含多核苷酸,其中多核苷酸包括:i)第一茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基且具有与第一茎部连接的第一末端,其中反靶环部分与靶核酸分子基本上互补;以及iii)第二茎部,其包括约10至约20个核苷酸碱基,与反靶环部分的第二末端连接,其中第一茎部与第二茎部基本上互补;以及b)配体,其与第一茎部或第二茎部的末端连接,其中配体包含配体配偶体结合位点;其中反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm
在一些实施方案中,第一茎部包括约10至约20个核苷酸碱基。在一些实施方案中,第一茎部包括约12至约18个核苷酸碱基。
在一些实施方案中,反靶环部分包括约16至约40个核苷酸碱基。在一些实施方案中,反靶环部分包括约18至约35个核苷酸碱基。反靶环部分具有与第一茎部连接的第一末端。反靶环部分与靶核酸分子基本上互补。在一些实施方案中,配体与第二茎部连接。
在一些实施方案中,反靶环部分还可包含内部铰链区,其中铰链区包括与靶核酸分子不互补的一个或多个核苷酸。在一些实施方案中,铰链区包括约1个核苷酸至约6个核苷酸、约1个核苷酸至约5个核苷酸、约1个核苷酸至约4个核苷酸、约1个核苷酸至约3个核苷酸或1或2个核苷酸。
在一些实施方案中,第二茎部包括约10至约20个核苷酸碱基。在一些实施方案中,第二茎部包括约12至约18个核苷酸碱基。第二茎部与反靶环部分的第二末端连接。第一茎部与第二茎部基本上互补。在一些实施方案中,配体与第二茎部连接。
在一些实施方案中,瓶形单倍体包括核苷酸序列5’-ACTCGAGACGTCTCCTTGTCTTTGCTTTTCTTCAGGACACAGTGGCGAGACGTCTCGAGT-3’(SEQ ID NO:6)或5’-ACTCGAGACGTCTCCTTCCTGCCCCTCCTCCTGCTCCGAGACGTCTCGAGT-3’(SEQ ID NO:7)。
对于本文所述的瓶形单倍体的多核苷酸,特定多核苷酸或其部分的长度的重要性小于通过多核苷酸或其部分与另一核酸分子或其部分的相互作用形成的双链体的Tm。例如,通过反靶环部分与靶核酸分子的相互作用形成的双链体(例如,反靶环部分:靶核酸分子)的Tm大于由第一茎部与第二茎部的相互作用形成的双链体(例如,第一茎部:第二茎部)的Tm。在一些实施方案中,从反靶环部分:靶核酸分子的Tm中减去第一茎部:第二茎部的Tm为约10℃至约40℃。在一些实施方案中,从反靶环部分:靶核酸分子的Tm中减去第一茎部:第二茎部的Tm为约10℃至约20℃。在一些实施方案中,第一茎部:第二茎部的Tm为约40℃至约50℃。在一些实施方案中,反靶环部分:靶核酸分子的Tm为约60℃至约80℃。
另外,将以上Tm信息翻译成本文所述的核酸分子的特定长度还可以取决于每种核酸分子的GC含量。例如,合适的HPV模型靶核酸分子的长度为30个碱基(Tm为70℃),而EBV模型靶核酸分子的长度仅为21个碱基(Tm为69℃),这是由于其更大的%GC。
在一些实施方案中,瓶形单倍体-配体复合物与第二单倍体-配体复合物串联作用。在一些实施方案中,瓶形单倍体-配体复合物是本文所述的任何瓶形单倍体-配体复合物,并且第二单倍体-配体复合物是本文所述的任何单倍体-配体复合物。在一些实施方案中,第二单倍体-配体复合物包含:a)包括约6至约20个核苷酸碱基的核苷酸部分,其与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补;以及b)与第二单倍体-配体复合物的核苷酸部分的5’或3’末端连接的配体,其中配体包含配体配偶体结合位点;其中第二单倍体-配体复合物:与瓶形单倍体-配体复合物的配体连接的第一或第二茎部的Tm小于或等于瓶形单倍体-配体复合物的第一茎部:第二茎部的Tm
在一些实施方案中,通过第二单倍体-配体复合物与第一茎部或第二茎部的相互作用形成的双链体的Tm,无论哪个茎部与配体连接(例如,第二单倍体-配体复合物:与配体连接的第一或第二茎部),小于或等于第一茎部:第二茎部的Tm。在一些实施方案中,从第一茎部:第二茎部的Tm中减去由第二单倍体-配体复合物和与配体连接的第一或第二茎部形成的双链体的Tm为约0℃至约20℃。在一些实施方案中,从第一茎部:第二茎部的Tm中减去由第二单倍体-配体复合物和与配体连接的第一或第二茎部形成的双链体的Tm为约5℃至约10℃。在一些实施方案中,由第二单倍体-配体复合物和与配体连接的第一或第二茎部形成的双链体的Tm为约30℃至约40℃。
这种结构布置经过设计使得在不存在靶核酸分子模板的情况下,锁定的第一单倍体瓶不与其互补的第二单倍体显著杂交,并且因此,在此类条件下不促进模板导向的产物组装。另一方面,当存在特定的靶核酸分子模板时,通过在瓶形单倍体的反靶环区域与靶核酸分子自身之间形成更稳定的杂交体来“解锁”瓶形单倍体-配体复合物。一旦发生这种情况,与配体连接的瓶形单倍体的第一茎部自由地与可用的第二单倍体-配体复合物杂交,从而导致两者上的配体之间接近。
在本文所述的任何单倍体多核苷酸或其任何部分中,核苷酸碱基选自由以下各项组成的组:DNA核苷酸、RNA核苷酸、硫代磷酸酯修饰的核苷酸、2-O-烷基化的RNA核苷酸、卤代核苷酸、锁核酸核苷酸(LNA)、肽核酸(PNA)、吗啉代核酸类似物(吗啉代化合物(morpholinos))、假尿苷核苷酸、黄嘌呤核苷酸、次黄嘌呤核苷酸、2-脱氧肌苷核苷酸、具有L-核糖的DNA类似物(L-DNA)、Xeno核酸(XNA)类似物,或能够形成碱基对的其他核酸类似物,或具有改变的主链的人工核酸类似物,或其任何组合或混合物。
对于本文所述的任何单倍体多核苷酸,与另一核酸分子的互补性可为100%。在一些实施方案中,一种特定的核酸分子可以与另一核酸分子基本上互补。如本文所用,短语“基本上互补”是指1至10个错配碱基位置、1至9个错配碱基位置、1至8个错配碱基位置、1至7个错配碱基位置、1至6个错配碱基位置、1至5个错配碱基位置、1至4个错配碱基位置、1至3个错配碱基位置,以及1或2个错配碱基位置。在一些实施方案中,希望避免通过错配碱基位置将反靶环部分:靶核酸分子的Tm降低超过10%。瓶形单倍体茎是相对于第二单倍体设计的,并且其结构被有意地布置成比第二单倍体双链体的形成更稳定一些。
在一些实施方案中,不与配体连接的瓶形单倍体-配体复合物的部分可具有突出且不形成茎结构的一部分的另外的核苷酸碱基。在一些实施方案中,不与配体连接的第二单倍体-配体复合物的末端可具有突出且不与瓶形单倍体-配体复合物的茎部形成该结构的互补部分的另外的核苷酸碱基。另外,在一些实施方案中,与配体连接的茎的部分也可以具有不与第一茎部碱基配对的核苷酸碱基。具有非杂交“臂”的茎的这种延伸将两个配体置于更大的空间距离,因此倾向于降低它们的相互反应性。因此,对于少数核苷酸碱基(少于10或少于5个),仍可能发生强制反应性,但随着非碱基配对片段长度的增加,强制反应性将趋于减小。
在一些实施方案中,添加的核苷酸碱基可具有无限长度,只要它们不:1)与锁定TAPER寡核苷酸的任何其他区域具有显著同源性,且因此倾向于交叉杂交和干扰;或2)非特异性地干扰***的任何其他特征。例如,长的附连序列可能降低在治疗背景中使用的锁定TAPER寡核苷酸的转化效率。此外,附连序列应被设计成避免与其他细胞转录物的伪杂交。20-30个核苷酸碱基的附连的非同源序列是合适的。附连的核酸序列可包含本领域常用的引物序列。此类实例可包括但不限于M13、T3、T7、SP6、VF2、VR、其修饰型式、其互补序列以及其反向序列。此外,还包括定制引物序列。可以使用此类引物序列,例如,空间引发的化学连接寡核苷酸(CLOSE)可能应用于锁定TAPER策略(参见PCT公布WO 2016/89958;其通过引用整体并入本文)。
在一些实施方案中,两种配体均为小分子配体或两种配体均为相互作用的蛋白质结构域。在一些实施方案中,瓶形单倍体-配体复合物的相互作用的蛋白质结构域的N末端与瓶形单倍体-配体复合物的多核苷酸的5’末端连接,并且第二单倍体-配体复合物的相互作用的蛋白质结构域的N末端与第二单倍体-配体复合物的多核苷酸的3’末端连接。在一些实施方案中,瓶形单倍体-配体复合物的相互作用的蛋白质结构域的C末端与瓶形单倍体-配体复合物的多核苷酸的5’末端连接,并且第二单倍体-配体复合物的相互作用的蛋白质结构域的C末端与第二单倍体-配体复合物的多核苷酸的3’末端连接。
在一些实施方案中,瓶形单倍体-配体复合物的相互作用的蛋白质结构域的C末端与瓶形单倍体-配体复合物的多核苷酸的5’末端连接,并且第二单倍体-配体复合物的相互作用的蛋白质结构域的N末端与第二单倍体-配体复合物的多核苷酸的3’末端连接;或瓶形单倍体-配体复合物的相互作用的蛋白质结构域的N末端与瓶形单倍体-配体复合物的多核苷酸的5’末端连接,并且第二单倍体-配体复合物的相互作用的蛋白质结构域的C末端与第二单倍体-配体复合物的多核苷酸的3’末端连接。
本文所述的任何瓶形单倍体或其任何部分还可包括在第一茎部与反靶环部分之间、反靶环部分与第二茎部之间、第二茎部与配体之间、第一茎部与配体之间或第二单倍体与其配体之间中的任何一者或多者的接头。在一些实施方案中,接头选自由以下各项组成的组:烷基、烯基、酰胺、酯、硫酯、酮、醚、硫醚、二硫化物、乙二醇、环烷基、苄基、杂环基、马来酰亚胺基、腙、聚氨酯、唑类、亚胺、卤代烷基以及氨基甲酸酯,或其任何组合。
在一些实施方案中,第二单倍体-配体复合物包含核苷酸序列5’-AGCTCTCGAGT-3’(SEQ ID NO:8)或5’-GACGTCTCGAGT-3’(SEQ ID NO:9)。
在本文所述的任何实施方案中,配体是小分子配体或相互作用的蛋白质结构域。
在一些实施方案中,配体是小分子配体。在一些实施方案中,小分子配体小于约2500道尔顿。在一些实施方案中,小分子配体是小分子、具有少于约20个氨基酸残基的肽、天然或人工修饰的肽、肽模拟物、聚糖、有机酶辅因子或人工衍生的小分子配体。在一些实施方案中,小分子配体衍生自被设计成靶向FKBP的化合物。在一些实施方案中,小分子配体是FKM单价配体。
在一些实施方案中,小分子配体衍生自被设计成靶向FKBP的突变型式的化合物(Clackson等人,Proc.Natl.Acad.Sci.USA,1998,95,103437-10432)。一种这样的修饰是FKM-NHS,其包含具有附连酰胺的经过修饰的单价突变型FKBP结合部分、3-碳间隔子以及羧酸基团,用N-羟基琥珀酰亚胺(NHS)酯化(参见图6),可以例如用于偶联氨基标记的寡核苷酸。FKM-NHS的间隔子部分可包括但不限于4、5或6个碳原子的长度。FKM-NHS还可被修饰以增强溶解度。
在一些实施方案中,小分子配体是FKM-磺基-NHS(参见图7),其可用于例如偶联氨基标记的寡核苷酸,并且具有用于溶解度增强的另外的磺基。NHS部分携带磺基。FKM-磺基-NHS的间隔子部分可包括但不限于4、5或6个碳原子的长度。
在一些实施方案中,小分子配体包含FKM-NHS的另一溶解度增强修饰,其中间隔臂转化为聚乙二醇(PEG)的短区段以提供FKM-PEG3-NHS(参见图8),其可用于例如偶联氨基标记的寡核苷酸,并且具有用于溶解度增强的PEG间隔子。FKM-PEG3-NHS的间隔臂可包含但不限于1、2、4、5或6个单体乙二醇拷贝。FKM-NHS及其所有衍生物可以在5’或3’末端容易且直接地偶联氨基标记的寡核苷酸。另外,可以改变将反应性基团附连至PEG链的位点。因此,如果PEG链中的碳原子被编号,那么反应性基团可位于这些位点中的任一个处。
在一些实施方案中,FKM单价配体为FKM-NHS、FKM-磺基-NHS、FKM-PEG3-NHS或单价FKBP配体-2(MFL2),其中:FKM-NHS为
其中m为3至6;FKM-磺基-NHS为
其中m为3至6;FKM-PEG3-NHS为
其中n为1至6;
并且MFL2为
在一些实施方案中,配体是相互作用的蛋白质结构域。在一些实施方案中,相互作用的蛋白质结构域包括少于100个氨基酸残基。在一些实施方案中,相互作用的蛋白质结构域是亮氨酸拉链结构域。在一些实施方案中,相互作用的蛋白质结构域是c-jun结构域、c-fos结构域、c-myc结构域、c-max结构域、NZ结构域或CZ结构域。
在一些实施方案中,NZ结构域包含氨基酸序列ALKKELQANKKELAQLKWELQALKKELAQ(SEQ ID NO:10),并且CZ结构域包含氨基酸序列EQLEKKLQALEKKLAQLEWKNQALEKKLAQ(SEQID NO:11)。
在一些实施方案中,c-jun结构域的N末端与单倍体的多核苷酸的5’或3’末端连接。在一些实施方案中,c-jun结构域包含氨基酸序列CSGGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAP(SEQ ID NO:1)、CSGGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:4)或CSGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:12)。在一些实施方案中,c-jun结构域的C末端与单倍体的多核苷酸的5’或3’末端连接。在一些实施方案中,c-jun结构域包含氨基酸序列SGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAPSGGC(SEQ ID NO:2)或SGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAPSGGC(SEQID NO:5)。
在一些实施方案中,c-Fos结构域包含氨基酸序列ASRELTDTLQAETDQLEDEKSALQTEIANLLKEKEKLEGAP(SEQ ID NO:3)或SGASRELTDTLQAETDQLEDEKSALQTEIANLLKEKEKLEGAP(SEQID NO:13)。
在两个单倍体-配体复合物串联作用,或瓶形单倍体-配体复合物与第二单倍体-配体复合物串联作用的一些实施方案中,两种配体均为小分子配体或两种配体均为相互作用的蛋白质结构域。在一些实施方案中,两种相互作用的蛋白质结构域均为亮氨酸拉链结构域。
在一些实施方案中,第一单倍体-配体复合物的相互作用的蛋白质结构域的N末端与第一单倍体-配体复合物的多核苷酸的5’末端连接,并且第二单倍体-配体复合物的相互作用的蛋白质结构域的N末端与第二单倍体-配体复合物的多核苷酸的3’末端连接。在一些实施方案中,第一单倍体-配体复合物的相互作用的蛋白质结构域的C末端与第一单倍体-配体复合物的多核苷酸的5’末端连接,并且第二单倍体-配体复合物的相互作用的蛋白质结构域的C末端与第二单倍体-配体复合物的多核苷酸的3’末端连接。
在一些实施方案中,第一单倍体-配体复合物的相互作用的蛋白质结构域的C末端与第一单倍体-配体复合物的多核苷酸的5’末端连接,并且第二单倍体-配体复合物的相互作用的蛋白质结构域的N末端与第二单倍体-配体复合物的多核苷酸的3’末端连接;或第一单倍体-配体复合物的相互作用的蛋白质结构域的N末端与第一单倍体-配体复合物的多核苷酸的5’末端连接,并且第二单倍体-配体复合物的相互作用的蛋白质结构域的C末端与第二单倍体-配体复合物的多核苷酸的3’末端连接。
在一些实施方案中,c-jun结构域的C末端与第一单倍体-配体复合物和第二单倍体-配体复合物中的一个或两者的多核苷酸的5’或3’末端连接。
在一些实施方案中,与第一单倍体-配体复合物的多核苷酸连接的配体是c-jun结构域或c-myc结构域,并且与第二单倍体-配体复合物的多核苷酸连接的配体是c-jun结构域或c-myc结构域。在一些实施方案中,与第一单倍体-配体复合物或第二单倍体-配体复合物的多核苷酸连接的配体是c-jun结构域,并且与第一单倍体-配体复合物和第二单倍体-配体复合物中的另一个的多核苷酸连接的配体是c-myc结构域。在一些实施方案中,与第一单倍体-配体复合物的多核苷酸连接的配体是c-jun结构域,并且与第二单倍体-配体复合物的多核苷酸连接的配体是c-jun结构域。
在一些实施方案中,与瓶形单倍体-配体复合物的多核苷酸连接的配体是c-jun结构域,并且与第二单倍体-配体复合物的多核苷酸连接的配体是c-jun结构域。在一些实施方案中,与瓶形单倍体-配体复合物和第二单倍体-配体复合物中的一个的多核苷酸连接的配体是c-jun结构域,并且与瓶形单倍体-配体复合物和第二单倍体-配体复合物中的另一个的多核苷酸连接的配体是c-myc结构域。
在一些实施方案中,瓶形单倍体-配体复合物的多核苷酸包含5’-ACTCGAGACGTCTCCTTGTCTTTGCTTTTCTTCAGGACACAGTGGCGAGACGTCTCGAGT-3’(SEQ ID NO:6)的核苷酸序列,并且第二单倍体-配体复合物的多核苷酸包含5’-AGCTCTCGA GT-3’(SEQ ID NO:8)的核苷酸序列;或瓶形单倍体-配体复合物的多核苷酸包含5’-ACTCGAGACGTCTCCTTCCTGCCCCTCCTCCTGCTCCGAGACGTCTCGAGT-3’(SEQ ID NO:7)的核苷酸序列,并且第二单倍体-配体复合物的多核苷酸包含核苷酸序列5’-GACGTCTCGAGT-3’(SEQ ID NO:9)。
在本文所述的实施方案中用作模板的靶核酸分子可以包含能够与单倍体的多核苷酸或瓶形单倍体的反靶环部分杂交的任何期望的核酸序列。具有可接近序列的任何单链核酸分子都是潜在可靶向的。这些包括但不限于细胞RNA、mRNA、基因组或细胞器DNA、附着型或质粒DNA、病毒DNA或RNA、miRNA、rRNA、snRNA、tRNA、短和长非编码RNA,以及出于模板化目的使用的任何人工序列,或任何其他生物或人工核酸序列。人工序列包括但不限于适体和大分子-核酸缀合物。还包括适体模板,其中这些模板被设计成将非核酸细胞产物转化为任何形式的TAPER(包括锁定TAPER)的可靶向序列。在一些实施方案中,靶核酸分子杂交位点保持尽可能短,同时:1)保持在复杂转录组或其他复杂靶标内的特异性;并且2)保持本文所述的锁定TAPER设计准则。
含有核酸分子的任何细胞、病毒、组织、空间区域、裂解物或样品的其他子组分可以提供靶核酸分子。含有靶核酸分子的靶区室可以包括但不限于致病细胞、癌细胞、病毒、感染病毒或其他病原体的宿主细胞,或免疫***中有助于自身免疫性的细胞,如适应性或先天性免疫***、移植排斥或过敏反应的细胞。在一些实施方案中,靶核酸分子可存在于病毒或感染病毒的细胞中,但在健康细胞中不存在。病毒的实例包括但不限于DNA病毒、RNA病毒或逆转录病毒。在一些实施方案中,靶核酸分子可存在于肿瘤或癌细胞中,但在健康细胞中不存在。癌症的实例包括但不限于由致癌病毒,如人***瘤病毒、爱泼斯坦-巴尔病毒(Epstein-Barr virus)、乙型肝炎病毒、丙型肝炎病毒、人T淋巴细胞病毒、默克尔细胞多瘤病毒(Merkel cell polyoma virus)以及卡波西肉瘤(Kaposi's sarcoma)相关疱疹病毒引起的癌症。在一些实施方案中,靶核酸分子可存在于感染剂或微生物,或受感染剂或微生物感染的细胞中,但在健康细胞中不存在。感染剂或微生物的实例包括但不限于病毒、细菌、真菌、原生生物、朊病毒或真核寄生物。
靶核酸分子也可以是基因,如致癌基因、突变基因、致癌病毒基因、病毒核酸序列、微生物核酸序列、差异表达基因及其核酸基因产物的片段、部分或局部。
癌症特异性靶核酸的实例包括但不限于突变型致癌基因,如突变型ras、HRAS、KRAS、NRAS、BRAF、EGFR、FLT1、FLT4、KDR、PDGFRA、PDGFRB、ABL1、PDGFB、MYC、CCND1、CDK2、CDK4或SRC基因;突变型肿瘤抑制基因,如TP53、TP63、TP73、MDM1、MDM2、ATM、RB1、RBL1、RBL2、PTEN、APC、DCC、WT1、IRF1、CDK2AP1、CDKN1A、CDKN1B、CDKN2A、TRIM3、BRCA1或BRCA2基因;以及在癌细胞中表达的基因,其中该基因可能未经突变或遗传改变,但在施用时在样品的健康细胞中不表达,如癌胚抗原。
在一些实施方案中,与非靶区室相比,靶核酸分子可以不同的量或浓度存在于靶区室中。实例包括但不限于在癌细胞中以不同于健康细胞的水平表达的基因,如myc、端粒酶、HER2或细胞周期蛋白依赖性激酶。在一些实施方案中,靶核酸分子可以是在靶区室中相对于非靶区室至少1.5X倍差异表达的基因。这些的一些实例包括但不限于与介导I型过敏反应相关的基因,对其而言靶RNA分子含有免疫球蛋白ε重链序列;在T细胞亚类中表达的基因,如特异性T细胞受体(TCR),其在特定主要组织相容性(MHC)蛋白如胰岛素原来源的肽和含有源自致糖尿病CD8+T细胞的α或β可变区序列的克隆特异性mRNA的背景下识别自身抗原;以及其产生可通过加剧炎症反应而具有不良结果的细胞因子,包括但不限于TNF-α、TNF-β、IL-1、IL-2、IL-4、IL-6、IL-8、IL-10、IL-12、IL-15、IL-17、IL-18、IL-21、IL-22、IL-27、IL-31、IFN-γ、OSM和LIF。
在一些实施方案中,靶核酸分子存在于靶区室和可接受的非靶区室亚组中,但不存在于不同或有差别的非靶区室亚组中。实例包括但不限于在癌细胞中表达且限于健康细胞类别的基因,如癌-睾丸抗原、存活素、***特异性抗原、癌胚抗原(CEA)、甲胎蛋白以及其他癌胚蛋白。此外,面对严重的疾病,许多组织和器官对其他健康生活来说并不是必不可少的。例如,黑素细胞抗原如Melan-A/MART-1和gp100在许多恶性黑素瘤以及正常黑素细胞上表达,并且靶向这些抗原的疗法可以破坏肿瘤和正常黑素细胞两者,从而导致白癜风,但主要肿瘤减少。同样,当这些组织的肿瘤出现时,生殖器官可经手术切除,如睾丸、卵巢和子宫,以及相关器官如乳腺和***可被靶向,并且这些器官内正常组织的破坏可以是可耐受的治疗结果。此外,产生激素,如甲状腺素和胰岛素的一些细胞可以用相关蛋白质代替,从而允许潜在靶向在这些起源的肿瘤的存在下可能存在的正常细胞。
靶核酸分子还可包括先前未鉴定的新序列。在一些实施方案中,可以通过序列分析,如下一代测序、全转录组(RNA-seq)或全基因组测序、微阵列谱分析、基因表达的连续分析(SAGE)来评估一个或多个样品,以确定样品的基因组成。靶核酸分子可以鉴定为存在于靶区室中,但不存在于非靶区室中,或与非靶区室相比在靶区室中以不同的量或浓度存在的那些。然后通过这些方法鉴定的序列可用作靶核酸分子。
在一些实施方案中,当配体是小分子配体时,小分子配体还可包含生物正交部分。在两个单倍体-配体复合物串联作用的一些实施方案中,第一单倍体-配体复合物的配体还包含生物正交部分,并且第二单倍体-配体复合物的配体还包含生物正交部分,其中第一单倍体-配体复合物的生物正交部分与第二单倍体-配体复合物的生物正交部分可反应。在瓶形单倍体-配体复合物与第二单倍体-配体复合物串联作用的一些实施方案中,瓶形单倍体-配体复合物的配体还包含生物正交部分,并且第二单倍体-配体复合物的配体还包含生物正交部分,其中瓶形单倍体-配体复合物的生物正交部分与第二单倍体-配体复合物的生物正交部分可反应。
生物正交部分包括那些可以进行叠氮化物与炔之间的“点击”反应、叠氮化物与膦之间的无痕或非无痕施陶丁格(Staudinger)反应以及硫酯与硫醇之间的天然化学连接反应的基团。另外,生物正交部分可以是叠氮化物、环辛炔、硝酮、降冰片烯、氧杂降冰片二烯、膦、二烷基膦、三烷基膦、膦硫醇、膦酚、环辛烯、氧化腈、硫酯、四嗪、异腈、四唑、四环烷及其衍生物中的任一种。选择一组相应单倍体的成员的生物正交部分,以使它们将相互反应。
多种生物正交部分可与本文公开的方法和组合物一起使用,一些非限制性实例包括:
叠氮化物-炔“点击化学”
点击化学具有高度选择性,因为在典型条件下,叠氮化物和炔都不与常见生物分子反应。R-N3形式的叠氮化物和R-C≡CH形式的末端炔或R-C≡C-R形式的内部炔易于相互反应以产生呈1,2,3-***形式的Huisgen环加成产物。
基于叠氮化物的单倍体具有子结构:R-N3,其中R为化学接头、核酸识别部分(例如与核酸分子的另一部分互补的寡核苷酸的部分)或配体。叠氮化物和叠氮化物衍生物可易于由可商购获得的试剂制备。
叠氮化物也可在配体合成期间引入配体中。在一些实施方案中,在配体的合成期间使用标准肽合成方法,通过掺入可商购获得的叠氮化物衍生化的标准氨基酸或氨基酸类似物,将叠氮基引入到肽配体中。可用叠氮化物置换α-氨基使氨基酸衍生化,获得以下形式的结构:
其中R为标准氨基酸或非标准氨基酸类似物的侧链。
可商购获得的产品可以引入叠氮化物官能性作为氨基酸侧链,产生以下形式的结构:
其中A为标准氨基酸或非标准氨基酸类似物的侧链中的任何原子及其取代基。
通过重氮转移法将肽配体上的胺基转化为叠氮化物进行合成后,也可将叠氮化物引入肽配体中。生物缀合化学也可用于将可商购获得的衍生化叠氮化物连接至含有合适的反应性基团的化学接头、核酸识别部分或配体。
标准炔可以通过类似于叠氮化物掺入的方法掺入到单倍体中。炔官能化的核苷酸类似物是可商购获得的,从而允许在核酸识别部分合成时直接掺入炔基。类似地,可通过标准肽合成法将炔衍生化的氨基酸类似物掺入配体中。另外,与生物缀合化学法相容的不同官能化炔可用于促进通过合适的官能团或侧基向其他部分掺入炔。
叠氮化物激活的炔“点击化学”
标准叠氮化物-炔化学反应通常需要催化剂,如铜(I)。由于催化浓度下的铜(I)对许多生物***有毒,所以标准叠氮化物-炔化学反应在活细胞中的使用有限。基于活化炔的无铜点击化学体系避开了有毒催化剂。
活化炔常常呈环辛炔形式,其中掺入到环辛基中向炔中引入了环应变。
杂原子或取代基可引入环辛基环中的各个位置,这可改变炔的反应性或在化合物中提供其他替代性化学特性。环上的各个位置也可用作连接环辛炔与核酸模板化组装部分或接头的附接点。环或其取代基上的这些位置可任选地用辅助基团进一步衍生化。
多种环辛炔是可商购获得的,包括适合与标准生物缀合化学方案一起使用的几种衍生化型式。可商购获得的环辛炔衍生化的核苷酸可有助于促进在核酸识别部分合成期间方便地掺入配体。
基于环辛炔-叠氮化物的生物正交化学可产生以下通式结构的模板化组装产物:
另一实例:
叠氮化物-膦施陶丁格化学
基于叠氮化物与膦或亚磷酸盐之间的快速反应的损失N2的施陶丁格还原也代表生物正交反应。施陶丁格连接,其中在施陶丁格反应中在反应物之间形成共价连接,适合用于核酸模板化组装中。非无痕和无痕形式的施陶丁格连接都允许在这些反应中形成的产物的化学结构上有多种选择。
非无痕施陶丁格连接
标准施陶丁格连接是叠氮化物与苯基取代的膦如三苯基膦之间的非无痕反应,其中膦上的亲电子阱取代基如甲酯与反应的氮杂-内鎓盐中间体重排,以产生通过氧化膦连接的连接产物。由单倍体A和B形成的施陶丁格连接产物的实例可具有以下结构:
携带亲电子阱的苯基取代的膦也可容易地合成。衍生化型式是可商购获得的并且适于掺入到单倍体中:
无痕施陶丁格连接
在一些实施方案中,能够进行无痕施陶丁格连接的膦可用作配体的生物正交部分。在无痕反应中,膦在氮杂-内鎓盐中间体的重排期间用作离去基团,从而产生通常呈天然酰胺键形式的连接。能够进行无痕施陶丁格连接的化合物通常呈硫酯衍生化膦或酯衍生化膦的形式:
用于无痕施陶丁格连接的示例性酯衍生化膦为:
用于无痕施陶丁格连接的示例性硫酯衍生化膦为:
化学接头或辅助基团可任选地作为取代基附连于以上结构中的R基团,为核酸识别部分提供附接点或向反应物引入附加官能性。
无痕膦酚施陶丁格连接
与非无痕施陶丁格苯基膦化合物相比,无痕膦酚上亲电子阱酯的取向相对于苯基是反向的。这使得无痕施陶丁格连接能够在与叠氮化物的反应中发生,从而在不含氧化膦的产物中产生天然酰胺键。
如果合适的亲水性基团如叔胺附连至苯基膦,那么无痕施陶丁格连接可在无有机共溶剂的水性介质中进行。Weisbrod和Marx描述了水溶性膦酚的制备,其可通过温和的Steglich酯化,使用碳二亚胺如二环己基碳二亚胺(DCC)或N,N'-二异丙基碳二亚胺(DIC)和酯活化剂如1-羟基苯并***(HOBT)来负载含有羧酸(如肽的C末端)的期望配体。这种方法有利于以下形式的单倍体的合成:
(Synlett,2010,5,787-789)。
基于水溶性膦酚的无痕单倍体结构。
无痕膦甲硫醇施陶丁格连接
膦甲硫醇代表用于介导无痕施陶丁格连接反应的膦酚的替代物。一般而言,膦甲硫醇与膦酚相比在介导无痕施陶丁格连接反应中具有有利的反应动力学。美国专利申请公布2010/0048866和Tam等人,J.Am.Chem.Soc.,2007,129,11421-30描述了以下形式的水溶性膦甲硫醇的制备:
这些化合物可负载肽或呈活化酯形式的其他有效负载,以形成适于用作无痕生物正交反应性基团的硫酯:
基于水溶性膦甲硫醇无痕施陶丁格生物正交化学的单倍体结构。
天然化学连接
天然化学连接是基于硫酯与带有硫醇和胺的化合物之间的反应的生物正交法。典型的天然化学连接在携带C末端硫酯的肽与携带N末端半胱氨酸的另一个肽之间,如下所示:
天然化学连接可用于介导无痕反应,产生含有内部半胱氨酸残基,或如果利用非标准氨基酸,则含有其他含硫醇的残基的肽或肽模拟物。
N末端半胱氨酸可通过标准氨基酸合成方法掺入。末端硫酯可通过本领域已知的几种方法产生,包括使用如二环己基碳二亚胺(DCC)的试剂将活化酯与硫醇缩合,或通过使用“安全捕捉(Safety-Catch)”载体树脂在肽合成期间引入。
其他选择性反应性部分
只要在复杂的生物环境中以高度选择性的方式有效介导反应,任何合适的生物正交反应化学均可用于合成单倍体-配体复合物。最近开发的可能合适的替代性生物正交化学的非限制性实例是四嗪与各种烯烃如降冰片烯和反式环辛烯之间的反应,其有效地介导水性介质中的生物正交反应。
化学接头或辅助基团可任选地作为取代基附连于以上结构,为核酸识别部分或配体提供附接点,或向反应物引入附加官能性。
涉及实施例和附图中描述的配体的构型可以反向。换句话说,配体可与瓶形单倍体-配体复合物的3’末端连接,只要第二单倍体-配体复合物因此使其配体与其5’末端连接即可。以下提供的实施例包括具有5’-连接配体的瓶形单倍体-配体复合物和具有3’-连接配体的第二单倍体-配体复合物。同样,在此***中,生物正交部分可轮换。例如,代替使用具有5’-己炔基的瓶形单倍体-配体复合物和具有3’-叠氮化物的第二单倍体-配体复合物,瓶形单倍体-配体复合物可携带叠氮化物,并且第二单倍体-配体复合物携带己炔基。
在一些实施方案中,生物正交部分选自叠氮化物、炔、环辛炔、硝酮、降冰片烯、氧杂降冰片二烯、膦、二烷基膦、三烷基膦、膦硫醇、膦酚、环辛烯、氧化腈、硫酯、四嗪、异腈、四唑或四环烷或其任何衍生物。在一些实施方案中,第一单倍体的生物正交部分是己炔基并且第二单倍体的生物正交部分是叠氮化物。在一些实施方案中,第一单倍体的生物正交部分是叠氮化物并且第二单倍体的生物正交部分是己炔基。
例如,一些实施方案使用具有点击基团侧链的FKM-NHS系列化合物的修饰(图6-8)。在一些实施方案中,FKM-PEG3-NHS在PEG链的C2位置处被甲基四嗪基团(FKM-PEG3-MTZ-NHS)(参见图21)或反式环辛烯基团(FKM-PEG3-TCO-NHS)修饰(参见图22)。当这些化合物通过标准NHS化学附连至氨基标记的寡核苷酸以形成点击修饰的配体单倍体时(参见图20),它们可以在将它们模板化放置成在空间上紧密接近后以生物正交方式相互反应。FKM-PEG3-MTZ-NHS为:
其中x为1至6;并且FKM-PEG3-TCO-NHS为
其中x为1至6。
在一些实施方案中,第一单倍体-配体复合物或第二单倍体-配体复合物中的一个的配体是为FKM-PEG3-MTZ-NHS的FKM单价配体,并且第一单倍体-配体复合物或第二单倍体-配体复合物中的另一个的配体是为FKM-PEG3-TCO-NHS的FKM单价配体。在一些实施方案中,瓶形单倍体-配体复合物和第二单倍体-配体复合物中的一个的配体是为FKM-PEG3-MTZ-NHS的FKM单价配体,并且瓶形单倍体-配体复合物和第二单倍体-配体复合物中的另一个的配体是为FKM-PEG3-TCO-NHS的FKM单价配体。
本公开还提供了一种具有下式的化合物:
其中m为3至6。
本公开还提供了一种具有下式的化合物:
其中m为3至6。
本公开还提供了一种具有下式的化合物:
其中n为1至6。
本公开还提供了一种具有下式的化合物:
其中x为1至6。
本公开还提供了一种具有下式的化合物:
其中x为1至6。
本公开还提供了一种具有下式的化合物
其为MFL2。
本公开还提供了融合蛋白,其包含与配体结合结构域融合的目标蛋白质的片段,其中配体结合结构域是用于小分子配体的配体结合结构域,或配体结合结构域是相互作用的蛋白质结构域。
在一些实施方案中,配体结合结构域是用于小分子配体的配体结合结构域。在一些实施方案中,配体结合结构域是FKBP结构域或FRB结构域。在一些实施方案中,FKBP结构域是突变型FKBP结构域。在一些实施方案中,突变型FKBP结构域是F36V FKBP突变型结构域,其包含氨基酸序列GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE(SEQ ID NO:14)或MGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFD VELLKLE(SEQ ID NO:15)。
在一些实施方案中,配体结合结构域是相互作用的蛋白质结构域。在一些实施方案中,相互作用的蛋白质结构域包括少于100个氨基酸残基。在一些实施方案中,相互作用的蛋白质结构域是亮氨酸拉链结构域。在一些实施方案中,相互作用的蛋白质结构域是c-jun结构域、c-fos结构域、c-myc结构域、c-max结构域、NZ结构域或CZ结构域。
在一些实施方案中,相互作用的蛋白质结构域与目标蛋白质的N末端融合。在一些实施方案中,相互作用的蛋白质结构域与目标蛋白质的C末端融合。
在一些实施方案中,NZ结构域包含氨基酸序列ALKKELQANKKELAQLKWELQALKKELAQ(SEQ ID NO:10),并且CZ结构域包含氨基酸序列EQLEKKLQALEKKLAQLEWKNQALEKKLAQ(SEQID NO:11)。
在一些实施方案中,c-jun结构域包含氨基酸序列CSGGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAP(SEQ ID NO:1)、CSGGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:4)或ASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:16)。
在一些实施方案中,c-jun结构域包含氨基酸序列SGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAPSGGC(SEQ ID NO:2)或SGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAPSGGC(SEQ ID NO:5)。
在一些实施方案中,c-Fos结构域包含氨基酸序列ASRELTDTLQAETDQLEDEKSALQTEIANLLKEKEKLEGAP(SEQ ID NO:3)或SGASRELTDTLQAETDQLEDEKSALQTEIANLLKEKEKLEGAP(SEQID NO:13)。
在一些实施方案中,融合蛋白包含目标蛋白质与配体结合结构域之间的接头。在一些实施方案中,接头为Ser/Gly接头、聚天冬酰胺接头,或包含氨基酸序列AGSSAAGSGS(SEQ ID NO:17)的接头。在一些实施方案中,聚天冬酰胺接头包括约8至约16个天冬酰胺残基。在一些实施方案中,Ser/Gly接头包含GGSGGGSGGGS GGGSGGG(SEQ ID NO:18)、GGSGGGSGGGSGGGSGGGSGGG(SEQ ID NO:19)、GGSGGGSGGGSGGGSGGGSGGGSGGG(SEQ ID NO:20)、SGGGGSGGGGSGGGG(SEQ ID NO:21)、SGGGGSGGGGSGGGGSGGGG(SEQ ID NO:22)、SGGGGSGGGGSGGGGSGG GGSGGGG(SEQ ID NO:23)、SGGGS(SEQ ID NO:24)、SGSG(SEQ ID NO:25)、SGGGGS(SEQ ID NO:26)或SGSGG(SEQ ID NO:27)。
其片段通过其与相应配体结合结构域的相应融合聚集在一起的目标蛋白质可以是能够折叠在一起或二聚化的任何期望蛋白质。
在一些实施方案中,目标蛋白质可通过作用于靶区室内(例如,细胞内)、靶区室表面(例如,细胞表面)、靶区室附近(例如,当效应子结构从细胞中主动输出、从细胞中泄漏或在细胞死亡时释放时)而触发活性,或扩散或被携带到样品的远处区域以触发响应。在一些实施方案中,通过在模板化组装产品中掺入靶向基团,可以使目标蛋白质靶向其活性位点。靶向基团的实例包括但不限于内质网转运信号、高尔基体转运信号、核转运信号、线粒体转运信号、遍在蛋白化基序、其他蛋白体靶向基序,或糖基磷脂酰肌醇锚定基序。靶向基团可通过在合成期间掺入单倍体部分、化学接头或辅助基团中而引入,或可在连接反应期间生成。
在一些实施方案中,目标蛋白质可以存在于靶标室的表面。在一些实施方案中,目标蛋白质可以作为与主要组织相容性复合物分子结合的配体存在于细胞表面。
在一些实施方案中,目标蛋白质可以是内源性肽及其类似物,或作为如抗体的试剂的靶标的完全合成结构。因为靶核酸分子的可用性可以限制目标活性蛋白质的产生,可能希望目标蛋白质在以低水平存在时发挥活性。
在一些实施方案中,可以通过与细胞毒性、杀微生物或杀病毒效应子结构的直接相互作用诱导靶细胞的杀伤或生长抑制。可以产生本领域已知的多种毒性分子。在一些实施方案中,目标蛋白质是毒性肽。毒性肽的实例包括但不限于蜜蜂蜂毒素、芋螺毒素、凯萨林菌素(cathelicidin)、防御素、protegrin和NK溶素。
在一些实施方案中,靶细胞的杀伤或生长抑制可以通过目标促凋亡蛋白诱导。例如,目标蛋白质包括促凋亡肽,包括但不限于朊病毒蛋白片段106-126(PrP 106-126)、与半胱天冬酶级联相关的Bax衍生的最小前肽(包括Bax 106-134),以及促凋亡肽(KLAKLAKKLAKLAK;SEQ ID NO:28)。
在一些实施方案中,目标蛋白质可以是血栓形成性的,因为它诱导蛋白质的凝血级联的各种组分的活化,或蛋白质的活化,或血小板的活化和/或聚集,或可导致生物活性过程的内皮损伤,在所述生物活性过程中,含有致病细胞的区域可以被选择性地形成血栓以限制对肿瘤或其他致病细胞的血液供应。这些类型的目标蛋白质还可以诱导凝血,或防止凝血,或防止被靶向的致病细胞中和周围的血小板活化和聚集。
在一些实施方案中,目标蛋白质可以通过激活与免疫***相关的分子、途径或细胞来介导靶细胞或病毒的杀伤或生长抑制。目标蛋白质可以激发先天免疫***、适应性免疫***和/或两者。
在一些实施方案中,目标蛋白质可以通过刺激先天免疫***介导细胞或病毒的杀伤或生长抑制。在一些实施方案中,目标蛋白质包括病原体相关分子模式(PAMP)、损伤相关分子模式(DAMP)及其合成类似物。
在一些实施方案中,先天免疫***可以被激活补体***的目标蛋白质激发。补体激活效应子结构的非限制性实例可以是补体蛋白C3的C3a片段。
在一些实施方案中,目标蛋白质可以是Toll样受体(TLR)的天然或合成配体。此类目标蛋白质的实例包括已知为TLR激动剂的热休克蛋白(hsp)的肽片段。
在一些实施方案中,无痕生物正交化学可用于产生NOD2受体的胞壁酰二肽激动剂以激活炎症反应。
在一些实施方案中,目标蛋白质可以通过激活适应性免疫***的分子或细胞来介导细胞或病毒的杀伤或生长抑制。对于适应性免疫***独特的是,分子或细胞可以被工程化以识别各种各样的结构,从而除去目标蛋白质必须具有内在活性或与内源性蛋白质结合的约束。
在一些实施方案中,目标蛋白质可以是抗体或抗体片段(包括但不限于Fab、Fv和scFv)的配体。无痕生物正交方法可用于产生由现有抗体结合的肽或其他表位,或可以开发抗体以识别所产生的目标蛋白质。
在一些实施方案中,目标蛋白质是以下各项的片段:细胞毒性蛋白、杀微生物蛋白、杀病毒蛋白、促凋亡蛋白、血栓形成蛋白、补体激活蛋白、Toll样受体蛋白、NOD2受体激动剂蛋白,或抗体或其片段,其中第一片段和第二片段二聚化或折叠在一起。
在一些实施方案中,细胞毒性蛋白是蜜蜂蜂毒素、芋螺毒素、凯萨林菌素、防御素、protegrin或NK溶素。在一些实施方案中,促凋亡蛋白是朊病毒蛋白、与半胱天冬酶级联相关的Bax衍生的最小前肽,或促凋亡肽(KLAKLAKKLAKLAK)(SEQ ID NO:28)。在一些实施方案中,先天免疫***刺激蛋白是病原体相关分子模式(PAMP)或损伤相关分子模式(DAMP)。在一些实施方案中,补体激活蛋白是补体蛋白C3的C3a片段。在一些实施方案中,Toll样受体(TLR)蛋白是热休克蛋白(hsp)。在一些实施方案中,NOD2受体激动剂蛋白是胞壁酰二肽激动剂。在一些实施方案中,抗体片段是Fab、Fv或scFv。
在一些实施方案中,目标蛋白质是以下各项的片段:超折叠GFP(sfGFP)、海肾(Renilla)荧光素酶、鼠二氢叶酸还原酶(DHFR)、酿酒酵母(S.cerevisiae)遍在蛋白、β-内酰胺酶,或单纯疱疹病毒1型胸苷激酶,其中目标蛋白质的一个片段与目标蛋白质的另一个片段二聚化或折叠在一起。
在一些实施方案中,超折叠GFP(sfGFP)的片段包含MRKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFARYPDHMKQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQ(SEQ ID NO:29)或KNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSVLSKDPNEKRDHMVLLEFVTAAGITHGMDELYK(SEQ ID NO:30),其中一个片段与另一个片段二聚化或折叠在一起。
在一些实施方案中,海肾荧光素酶的片段包含MASKVYDPEQRKRMITGPQWWARCKQMNVLDSFINYYDSEKHAENAVIFLHGNAASSYLWRHVVPHIEPVARCIIPDLIGMGKSGKSGNGSYRLLDHYKYLTAWFELLNLPKKIIFVGHDWGACLAFHYSYEHQDKIKAIVHAESVVDVIESWDEWPDIEEDIALIKSEEGEKMVLENNFFVETMLPSKIMRKLEPEEFAAYLEPFKEKGEVRRPTLSWPREIPLVKGG(SEQ ID NO:31)或KPDVVQIVRNYNAYLRASDDLPKMFIESDPGFFSNAIVEGAKKFPNTEFVKVKGLHFSQ EDAPDEMGKYIKSFVERVLKNEQ(SEQID NO:32),其中一个片段与另一个片段二聚化或折叠在一起。
在一些实施方案中,鼠二氢叶酸还原酶(DHFR)的片段包含其氨基酸1-105或106-186,其中一个片段与另一个片段二聚化或折叠在一起。
在一些实施方案中,酿酒酵母遍在蛋白的片段包含其氨基酸1-34(MQIFVKTLTGKTITLEVESSDTIDNVKSKIQDKE;SEQ ID NO:33)或35-76(GIPPDQQ RLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG;SEQ ID NO:34),其中一个片段与另一个片段二聚化或折叠在一起。
在一些实施方案中,β-内酰胺酶的片段包含其氨基酸25-197或198-286,其中一个片段与另一个片段二聚化或折叠在一起。
在一些实施方案中,单纯疱疹病毒1型胸苷激酶的片段包含其氨基酸1-265或266-376,其中一个片段与另一个片段二聚化或折叠在一起。
在一些实施方案中,可能不存在关于目标蛋白质可在何处分开以用于一般***蛋白质分析(包括LD-TAPER)的预先存在的信息。在此类情况下,蛋白质的三维晶体结构的检查可远离与蛋白质的功能直接相关的区域在表面环和转角内提供许多候选靶标。由预测靶位点处的切割产生的片段可通过单独表达为具有合适的相互作用的亮氨酸拉链的融合蛋白进行筛选,其中如果***蛋白靶向成功,那么在融合蛋白混合时恢复蛋白质活性。用于根据经验标记合适的切割位点的更快速的测定是可获得的,包括溶解度测定(参见Chen等人,Protein Science,2009,18,399-409)或优选的环状排列测定(circular permutationassay)(参见Massoud等人,Nature Medicine,2010,16,921-926)。即使在没有结构信息的情况下,这些测定也是适用的,但是可以通过适用的结构知识来指导和提高效率。对于环状排列测定,首先生成目标编码序列的串联框内连续二聚体,其中丝氨酸-甘氨酸接头(如SGGGGSGGGGSGGGG;SEQ ID NO:21)位于两个拷贝之间。然后通过使用合适的引物扩增由二聚体生成用于表达的环状排列的编码序列区(coding sequence block)。
在一些实施方案中,第一融合蛋白的目标蛋白质的片段和第二融合蛋白的目标蛋白质的片段可以二聚化或折叠在一起。在一些实施方案中,第一融合蛋白包含与用于小分子配体的配体结合结构域融合的目标蛋白质的片段,并且第二融合蛋白包含与用于小分子配体的配体结合结构域融合的目标蛋白质的片段。在一些实施方案中,第一融合蛋白包含与相互作用的蛋白质结构域融合的目标蛋白质的片段,并且第二融合蛋白包含与相互作用的蛋白质结构域融合的目标蛋白质的片段。
在一些实施方案中,第一融合蛋白的相互作用的蛋白质结构域与目标蛋白质的片段的N末端融合,并且第二融合蛋白的相互作用的蛋白质结构域与目标蛋白质的片段的N末端融合;或第一融合蛋白的相互作用的蛋白质结构域与目标蛋白质的片段的C末端融合,并且第二融合蛋白的相互作用的蛋白质结构域与目标蛋白质的片段的C末端融合;或第一融合蛋白和第二融合蛋白中的一个的相互作用的蛋白质结构域与目标蛋白质的片段的N末端融合,并且第一融合蛋白和第二融合蛋白中的另一个的相互作用的蛋白质结构域与目标蛋白质的片段的C末端融合。
在一些实施方案中,第一融合蛋白和第二融合蛋白均包含在目标蛋白质与配体结合结构域之间的接头。在一些实施方案中,如本文所述,每个接头独立地为Ser/Gly接头、聚天冬酰胺接头,或包含氨基酸序列AGSSAAGSGS(SEQ ID NO:17)的接头。
本公开还提供了包含以下各项中的任何一个或多个的组合物或试剂盒:单倍体-配体复合物、瓶形单倍体-配体复合物,以及本文所述的融合蛋白。
在一些实施方案中,组合物或试剂盒包含:本文所述的第一单倍体-配体复合物,其包含小分子配体;本文所述的第二单倍体-配体复合物,其包含小分子配体;第一融合蛋白,其包含与用于小分子配体的配体结合结构域融合的目标蛋白质的片段;以及第二融合蛋白,其包含与用于小分子配体的配体结合结构域融合的目标蛋白质的片段;其中:i)第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5’末端连接;ii)第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的3’末端连接;iii)第一单倍体-配体复合物的多核苷酸与靶核酸分子基本上互补;iv)第二单倍体-配体复合物的多核苷酸在与第一单倍体-配体复合物的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补;v)第一单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;vi)第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;并且vii)第一融合蛋白的目标蛋白质的片段和第二融合蛋白的目标蛋白质的片段可以二聚化或折叠在一起。
在一些实施方案中,组合物或试剂盒包含:第一单倍体-配体复合物,其包含作为相互作用的蛋白质结构域的配体;第二单倍体-配体复合物,其包含作为相互作用的蛋白质结构域的配体;第一融合蛋白,其包含与相互作用的蛋白质结构域融合的目标蛋白质的片段;以及第二融合蛋白,其包含与相互作用的蛋白质结构域融合的目标蛋白质的片段;其中:i)第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5’末端连接;ii)第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的3’末端连接;iii)第一单倍体-配体复合物的多核苷酸与靶核酸分子基本上互补;iv)第二单倍体-配体复合物的多核苷酸在与第一单倍体-配体复合物的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补;v)第一单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;vi)第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;并且vii)第一融合蛋白的目标蛋白质的片段和第二融合蛋白的目标蛋白质的片段可以二聚化或折叠在一起。
在一些实施方案中,组合物或试剂盒包含:如本文所述的第一瓶形单倍体-配体复合物,其包含小分子配体;本文所述的第二单倍体-配体复合物,其包含小分子配体,其中第二单倍体-配体复合物包含与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;第一融合蛋白,其包含与用于小分子配体的配体结合结构域融合的目标蛋白质的片段;以及第二融合蛋白,其包含与用于小分子配体的配体结合结构域融合的目标蛋白质的片段;其中:i)第一瓶形单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;ii)第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;并且iii)第一融合蛋白的目标蛋白质的片段和第二融合蛋白的目标蛋白质的片段可以二聚化或折叠在一起。
在一些实施方案中,组合物或试剂盒包含:本文所述的第一瓶形单倍体-配体复合物,其包含作为相互作用的蛋白质结构域的配体;第二单倍体-配体复合物,其包含作为相互作用的蛋白质结构域的配体,其中第二单倍体-配体复合物包含与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;第一融合蛋白,其包含与相互作用的蛋白质结构域融合的目标蛋白质的片段;以及第二融合蛋白,其包含与相互作用的蛋白质结构域融合的目标蛋白质的片段;其中:i)第一瓶形单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;ii)第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;并且iii)第一融合蛋白的目标蛋白质的片段和第二融合蛋白的目标蛋白质的片段可以二聚化或折叠在一起。
本公开还提供了使用本文所述的任何单倍体-配体复合物与本文所述的融合蛋白组合以产生二聚化或折叠蛋白质的方法。
在一些实施方案中,所述方法包括:a)使靶核酸分子与包含小分子配体的第一单倍体-配体复合物接触;b)使靶核酸与包含小分子配体的第二单倍体-配体复合物接触;c)使第一单倍体-配体复合物与包含用于小分子配体的配体结合结构域的第一融合蛋白接触;以及d)使第二单倍体-配体复合物与包含用于小分子配体的配体结合结构域的第二融合蛋白接触;其中:i)第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5’末端连接;ii)第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的3’末端连接;iii)第一单倍体-配体复合物的多核苷酸与靶核酸分子基本上互补;iv)第二单倍体-配体复合物的多核苷酸在与第一单倍体-配体复合物的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补;v)第一单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;并且vi)第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
在一些实施方案中,所述方法包括:a)使靶核酸分子与包含作为相互作用的蛋白质结构域的配体的第一单倍体-配体复合物接触;b)使靶核酸与包含作为相互作用的蛋白质结构域的配体的第二单倍体-配体复合物接触;c)使第一单倍体-配体复合物与包含与相互作用的蛋白质结构域融合的目标蛋白质的片段的第一融合蛋白接触;以及d)使第二单倍体-配体复合物与包含与相互作用的蛋白质结构域融合的目标蛋白质的片段的第二融合蛋白接触;其中:i)第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5’末端连接;ii)第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的3’末端连接;iii)第一单倍体-配体复合物的多核苷酸与靶核酸分子基本上互补;iv)第二单倍体-配体复合物的多核苷酸在与第一单倍体-配体复合物的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补;v)第一单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;并且vi)第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
在一些实施方案中,第一单倍体-配体复合物的多核苷酸与第二单倍体-配体复合物的多核苷酸互补。在一些实施方案中,第一单倍体-配体复合物的多核苷酸与靶核酸分子结合,在空间上接近第二单倍体-配体复合物的多核苷酸与靶核酸分子的结合。在一些实施方案中,第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5’末端连接,并且第一单倍体-配体复合物的多核苷酸与核酸靶标5’相邻于茎环结构的部分互补;并且第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的3’末端连接,并且第二单倍体-配体复合物的多核苷酸与核酸靶标3’相邻于茎环结构的部分互补。在一些实施方案中,第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的3’末端连接,并且第一单倍体-配体复合物的多核苷酸与核酸靶标的茎环结构的环结构的5’部分互补,其中环结构的5’部分与茎环结构的茎区域相邻;并且第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的5’末端连接,并且第二单倍体-配体复合物的多核苷酸与核酸靶标的茎环结构的环结构的3’部分互补,其中环结构的3’部分与茎环结构的茎区域相邻。
在一些实施方案中,所述方法包括:a)使靶核酸分子与通过包含小分子配体的第一单倍体-配体复合物与包含用于小分子配体的配体结合结构域的第一融合蛋白的相互作用形成的复合物接触,其中第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5'末端连接,并且其中第一单倍体-配体复合物的配体与第一融合蛋白的配体结合结构域相互作用;以及b)使靶核酸分子与通过包含小分子配体的第二单倍体-配体复合物与包含用于小分子配体的配体结合结构域的第二融合蛋白的相互作用形成的复合物接触,其中第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的5’末端连接,并且其中第二单倍体-配体复合物的配体与第二融合蛋白的配体结合结构域相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
在一些实施方案中,所述方法包括:a)使靶核酸分子与通过包含作为相互作用的蛋白质结构域的配体的第一单倍体-配体复合物与包含与相互作用的蛋白质结构域融合的目标蛋白质的片段的第一融合蛋白的相互作用形成的复合物接触,其中第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5'末端连接,并且其中第一单倍体-配体复合物的配体与第一融合蛋白的配体结合结构域相互作用;以及b)使靶核酸分子与通过包含作为相互作用的蛋白质结构域的配体的第二单倍体-配体复合物与包含与相互作用的蛋白质结构域融合的目标蛋白质的片段的第二融合蛋白的相互作用形成的复合物接触,其中第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的5’末端连接,并且其中第二单倍体-配体复合物的配体与第二融合蛋白的配体结合结构域相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
在一些实施方案中,第一单倍体-配体复合物的多核苷酸与第二单倍体-配体复合物的多核苷酸互补。在一些实施方案中,第一单倍体-配体复合物的多核苷酸与靶核酸分子结合,在空间上接近第二单倍体-配体复合物的多核苷酸与靶核酸分子的结合。在一些实施方案中,第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的5’末端连接,并且第一单倍体-配体复合物的多核苷酸与核酸靶标5’相邻于茎环结构的部分互补;并且第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的3’末端连接,并且第二单倍体-配体复合物的多核苷酸与核酸靶标3’相邻于茎环结构的部分互补。在一些实施方案中,第一单倍体-配体复合物的配体与第一单倍体-配体复合物的多核苷酸的3’末端连接,并且第一单倍体-配体复合物的多核苷酸与核酸靶标的茎环结构的环结构的5’部分互补,其中环结构的5’部分与茎环结构的茎区域相邻;并且第二单倍体-配体复合物的配体与第二单倍体-配体复合物的多核苷酸的5’末端连接,并且第二单倍体-配体复合物的多核苷酸与核酸靶标的茎环结构的环结构的3’部分互补,其中环结构的3’部分与茎环结构的茎区域相邻。
在一些实施方案中,所述方法包括:a)使靶核酸分子与本文所述的包含小分子配体的瓶形单倍体-配体复合物接触;b)使靶核酸与包含小分子配体的第二单倍体-配体复合物接触,其中第二单倍体-配体复合物包含与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;c)使瓶形单倍体-配体复合物与包含用于小分子配体的配体结合结构域的第一融合蛋白接触,其中瓶形单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;以及d)使第二单倍体-配体复合物与包含用于小分子配体的配体结合结构域的第二融合蛋白接触,其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
在一些实施方案中,所述方法包括:a)使靶核酸分子与包含作为相互作用的蛋白质结构域的配体的瓶形单倍体-配体复合物接触;b)使靶核酸与包含作为相互作用的蛋白质结构域的配体的第二单倍体-配体复合物接触,其中第二单倍体-配体复合物包含与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;c)使瓶形单倍体-配体复合物与包含与相互作用的蛋白质结构域融合的目标蛋白质的片段的第一融合蛋白接触,其中瓶形单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;以及d)使第二单倍体-配体复合物与包含与相互作用的蛋白质结构域融合的目标蛋白质的片段的第二融合蛋白接触,其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
在一些实施方案中,所述方法包括:a)使靶核酸分子与包含小分子配体的瓶形单倍体-配体复合物接触;b)使靶核酸分子与包含小分子配体的第二单倍体-配体复合物接触,其中第二单倍体-配体复合物包含与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;c)使瓶形单倍体-配体复合物与包含用于小分子配体的配体结合结构域的第一融合蛋白接触,其中瓶形单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;以及d)使第二单倍体-配体复合物与包含用于小分子配体的配体结合结构域的第二融合蛋白接触,其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
在一些实施方案中,所述方法包括:a)使靶核酸分子与包含作为相互作用的蛋白质结构域的配体的瓶形单倍体-配体复合物接触;b)使靶核酸分子与包含作为相互作用的蛋白质结构域的配体的第二单倍体-配体复合物接触,其中第二单倍体-配体复合物包含与和瓶形单倍体-配体复合物的配体连接的瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;c)使瓶形单倍体-配体复合物与包含与相互作用的蛋白质结构域融合的目标蛋白质的片段的第一融合蛋白接触,其中瓶形单倍体-配体复合物的配体和第一融合蛋白的配体结合结构域可以相互作用;以及d)使第二单倍体-配体复合物与包含与相互作用的蛋白质结构域融合的目标蛋白质的片段的第二融合蛋白接触,其中第二单倍体-配体复合物的配体和第二融合蛋白的配体结合结构域可以相互作用;从而导致第一融合蛋白的目标蛋白质的片段与第二融合蛋白的目标蛋白质的片段折叠或二聚化。
本公开还提供了使用本文所述的任何单倍体-配体复合物、瓶形单倍体-配体复合物以及融合蛋白来调节细胞或细胞靶分子的方法。相应单倍体-配体复合物连同其相应融合蛋白的组对哺乳动物或人的施用可根据试图治疗的疾病、病症或病状的性质而变化。在一些实施方案中,可以将单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白分配到合适的容器或腔室内的样品中。在一些实施方案中,可将样品分配到已经含有单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白的容器中。在一些实施方案中,单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白可以在体外或原位使用。在一些实施方案中,人将需要这样的治疗。
在一些实施方案中,可以施用单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白以用于体内模板化组装。为了有利于这样的治疗,所制备的单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白可在任选地掺入合适递送剂的任何合适的缓冲液或制剂中施用,并且与哺乳动物或人或其样品(对于离体方法)接触。单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白的浓缩形式可以与其对应的单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白分开处理,因为产物生成反应可在不存在高浓度的靶核酸分子模板的情况下发生。表1提供了由各种单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白组成的自主(gymnotic)(无递送剂)单倍体的最大可接受浓度的准则。如果在高于这些阈值的浓度下接触单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白,则可能发生非模板化的背景反应。
表1:单倍体的接触最大浓度,高于所述浓度可能发生非模板化的反应水平
生物正交反应化学 最大浓度
叠氮化物-炔 <50μM
叠氮化物-膦 <50μM
天然化学连接 <1mM
其他单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白的阈值浓度可使用所公开的模板化组装诊断评估测定根据经验确定。
在一些实施方案中,可以通过施用一组相应的单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白,使得首先施用一种单倍体-配体复合物,然后在观察到时间延迟之后施用相应的单倍体-配体复合物来降低非模板化反应的可能性。此时间延迟可在1分钟至数天的范围内,这取决于体系中单倍体-配体复合物的持久性。
某些递送剂,如转染试剂,如阳离子脂质、聚乙烯亚胺、基于葡聚糖的转染物或本领域已知的其他转染试剂,可引起单倍体-配体复合物的缩合。在这些情况下,单倍体-配体复合物可与相应的反应性单倍体-配体复合物分开制备并分开施用于样品,单倍体-配体复合物也可自主施用、溶解在适当的缓冲液中而不添加任何另外的递送剂。
单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白也可在与合适的递送剂一起配制后施用。合适的递送剂可增强单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白的稳定性、生物利用率、生物分布、细胞渗透性或其他期望的药理学特性或这些特性的组合。本领域已知的递送剂包括但不限于聚阳离子转染试剂、聚乙烯亚胺及其衍生物、DEAE-葡聚糖、其他转染试剂、盐、离子、缓冲剂、增溶剂、各种病毒载体、脂质体、靶向脂质体、纳米颗粒、载体聚合物、内体破坏剂、渗透剂、脂质、类固醇、表面活性剂、分散剂、稳定剂或其任何组合。
也可通过辅助基团与单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白的共价附接增强单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白向靶区室的递送。可增强递送的辅助基团可包括已知增强化合物的稳定性和生物分布的化合物,如聚乙二醇(PEG);以及增强单倍体的细胞渗透性的化合物,包括但不限于本领域已知的胆固醇衍生物、本领域已知的内体破坏剂,以及细胞穿透肽,如聚阳离子如聚精氨酸或聚赖氨酸、衍生自HIV tat蛋白的肽、运输蛋白和衍生自触角蛋白(穿透素)的肽。
还可包括施用效应蛋白产物触发的试剂,如抗体或其他效应蛋白产物检测分子,或效应蛋白产物检测细胞。施用可以是模板化组装程序的一部分。它可在施用单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白之前、期间或之后施用,并且可通过对于该试剂适当的任何方法施用。在一些实施方案中,效应蛋白产物触发的试剂在施用单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白之前施用,以便于在它们一旦形成并可用于试剂结合时即通过效应蛋白触发活性。
在一些实施方案中,可并行施用多组相应的单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白。这些反应物组可结合单个靶核酸上的多个杂交位点,或结合不同的靶核酸,或其组合。不同的单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白组可产生相同的蛋白质结构,因此通过促进其产生增加由所述蛋白质结构产生的活性的水平,或不同的单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白组可产生不同的蛋白质结构,因此在样品中产生多价活性,或其组合。当多组单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白并行施用时,来自不同的单倍体-配体复合物组的具有相同的生物正交反应性基团的配体(或不相互反应的基团,如果不同的生物正交化学用于不同的单倍体-配体复合物组的话)可一起施用,甚至以高浓度,因为它们将不相互反应。例如,如果叠氮化物-炔生物正交反应体系用于每组相应的单倍体-配体复合物,那么可配制和一起施用所有含叠氮化物的单倍体-配体复合物,并且所有含炔的单倍体-配体配合物可在充分稀释样品中的叠氮化物之后配制和一起施用。
通过本文所述的方法产生效应蛋白可产生活性,如诱导免疫应答、程序性细胞死亡、细胞凋亡、坏死、裂解、生长抑制、病毒感染的抑制、病毒复制的抑制、癌基因表达的抑制、基因表达的修饰、微生物感染的抑制和微生物复制的抑制,以及这些生物活性的组合。
在一些实施方案中,所施用的组合物可包括靶向两种或更多种靶核酸分子的两组或更多组相应的单倍体-配体复合物、瓶形单倍体-配体复合物以及融合蛋白。两种或更多种靶核酸分子可存在于相同基因转录物内,或可选地存在于不同且分开的转录物上。识别相同细胞转录物内的不同核酸靶分子的两组或更多组相应的单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白可独立地产生相同或不同的蛋白质。
靶核酸分子的丰度也可限制由模板化组装产生的活性蛋白的量。在一些实施方案中,每个靶区室平均存在至少5个拷贝的靶核酸分子。施用的组合物的剂量和浓度可以考虑靶核酸分子的可用性。
在一些实施方案中,公开了将单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白或包含一组或多组所述单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白的组合物递送至致病细胞的方法。所述方法可包括向致病细胞施用治疗有效量的一组或多组相应的单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白组合物。在一些实施方案中,所述方法还可包括在施用单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白组合物之前检测靶核酸分子的存在或不存在。
药物组合物可通过以下途径中的一个施用:口服、局部、全身(例如透皮、鼻内或通过栓剂)、或肠胃外(例如肌内、皮下或静脉内注射)。组合物可采取片剂、丸剂、胶囊、半固体、粉剂、缓释制剂、溶液、混悬液、酏剂、气溶胶或任何其他适当组合物的形式;并且包含与至少一种药学上可接受的赋形剂组合的至少一种化合物。合适的赋形剂是本领域普通技术人员所熟知的,并且所述赋形剂和配制组合物的方法可在标准参考文献中找到,如Remington:The Science and Practice of Pharmacy,A.Gennaro编,第20版,Lippincott,Williams&Wilkins,Philadelphia,Pa。合适的液体载体,尤其是用于可注射溶液的液体载体,包括水、盐水溶液、葡萄糖水溶液和二醇类。
适用于注射的药物组合物可包括无菌水溶液(为水溶性时)或分散体以及用于即时制备无菌可注射溶液或分散体的无菌粉末。在所有情况下,组合物必须是无菌的并且应具有易于注射的流动性。组合物在制造和储存条件下应是稳定的并且应在防止微生物(如细菌和真菌)的污染作用的条件下保存。载体可为溶剂或分散介质,其含有,例如,水、乙醇、多元醇(例如,甘油、丙二醇和液体聚乙二醇等)、其合适的混合物以及植物油。适当流动性可例如通过使用如卵磷脂的包衣、通过在分散状况下维持所需颗粒大小且通过使用表面活性剂来维持。可通过各种抗细菌剂和抗真菌剂来实现对微生物作用的预防。在许多情况下,可在组合物中包括等渗剂,例如,糖、多元醇如甘露糖醇、山梨醇、氯化钠。通过在组合物中包含延迟吸收的试剂(例如单硬脂酸铝和明胶)可引起注射组合物的吸收延长。
无菌可注射溶液可通过将合适量的包含单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白的组合物与上文列举的成分中的一种或组合一起掺入适当的溶剂中来制备。一般而言,通过将组合物掺入含有基础分散介质和来自以上所列举的那些的所需的其他成分的无菌媒介物中来制备分散体。
当包含单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白的组合物被适当地保护时,如上所述,组合物可配制用于口服施用,例如,与惰性稀释剂或可同化的可食用载体一起。组合物和其他成分也可包封在硬壳或软壳明胶胶囊中,压制成片剂,或直接掺入受试者的饮食中。对于口服治疗性施用,组合物可掺入赋形剂并且以可摄取片剂、经颊片剂、锭剂、胶囊、酏剂、混悬液、糖浆、干胶片等形式使用。当然,组合物和制剂的百分比可以变化。此类治疗有用的组合物中的单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白的量是使得将获得合适的剂量。
以易于施用和实现剂量均匀性的剂量单位形式配制组合物可以是有利的。每个剂量单位形式含有经计算用以产生所述量的活性效应产物的预定量的单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白以及药物载体。新剂量单位形式的规格取决于靶向模板化组装组合物的独特特征,以及待实现的特定治疗效果。剂量参考成分的常用剂量和施用方式来确定。
单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白组合物可包含药学上可接受的载体,使得载体可掺入组合物中并施用于患者而不引起不可接受的生物效应或以不可接受的方式与组合物的其他组分相互作用。此类药学上可接受的载体通常满足毒理学和制造测试的所需标准,并且包括由美国食品和药物管理局(U.S.Food and DrugAdministration)鉴定为合适的非活性成分的那些材料。
单倍体-配体复合物、瓶形单倍体-配体复合物和融合蛋白也可以制备为药学上可接受的盐。此类盐可以是例如由可接受施用于如哺乳动物的患者的碱或酸制备的盐(例如,对于给定的剂量方案具有可接受的哺乳动物安全性的盐)。然而,应理解,本文所涵盖的盐不需要是药学上可接受的盐,如不旨在用于施用于患者的单倍体的盐。药学上可接受的盐可衍生自药学上可接受的无机或有机碱和药学上可接受的无机或有机酸。此外,当单倍体同时含有碱性部分(如胺)和酸性部分(如羧酸)时,可形成两性离子并且包括在如本文所用的术语“盐”之内。由药学上可接受的无机碱衍生的盐可包括:铵盐、钙盐、铜盐、三价铁盐、亚铁盐、锂盐、镁盐、锰盐、二价锰盐、钾盐、钠盐、以及锌盐等。由药学上可接受的有机碱衍生的盐可包括以下各项的盐:伯胺、仲胺和叔胺、包括取代胺、环胺、天然存在的胺等,如精氨酸、甜菜碱、咖啡因、胆碱、N,N-二苄基乙二胺、二乙胺、2-二乙氨基乙醇、2-二甲氨基乙醇、乙醇胺、乙二胺、N-乙基吗啉、N-乙基哌啶、葡糖胺、葡萄糖胺、组氨酸、哈胺(hydrabamine)、异丙基胺、赖氨酸、甲基葡糖胺、吗啉、哌嗪、哌啶、聚胺树脂、普鲁卡因、嘌呤类、可可碱、三乙胺、三甲胺、三丙胺、氨丁三醇等。由药学上可接受的无机酸衍生的盐可包括以下各项的盐:硼酸、碳酸、氢卤酸(氢溴酸、盐酸、氢氟酸或氢碘酸)、硝酸、磷酸、氨基磺酸和硫酸。由药学上可接受的有机酸衍生的盐可包括以下各项的盐:脂族羟基酸(例如,柠檬酸、葡糖酸、乙醇酸、乳酸、乳糖酸、苹果酸和酒石酸)、脂族一元羧酸(例如,乙酸、丁酸、甲酸、丙酸和三氟乙酸)、氨基酸(例如,天冬氨酸和谷氨酸)、芳族羧酸(例如,苯甲酸、对氯苯甲酸、二苯基乙酸、龙胆酸、马尿酸和三苯基乙酸)、芳族羟基酸(例如,邻羟基苯甲酸、对羟基苯甲酸、1-羟基萘-2-羧酸和3-羟基萘-2-羧酸)、抗坏血酸、二羧酸(例如,富马酸、马来酸、草酸和琥珀酸)、葡糖醛酸、扁桃酸、粘酸、烟酸、乳清酸、双羟萘酸、泛酸、磺酸(例如,苯磺酸、樟脑磺酸、乙二磺酸(edisylic acid)、乙烷磺酸、羟乙磺酸、甲烷磺酸、萘磺酸、萘-1,5-二磺酸、萘-2,6-二磺酸以及对甲苯磺酸)、羟萘甲酸等。
通过本文所述的方法产生的效应蛋白(通过二聚化或折叠)是驱动期望作用的触发物。期望蛋白活性的一些实例可包括但不限于诱导免疫应答、程序性细胞死亡、细胞凋亡、非特异性或程序性坏死、裂解、生长抑制、病毒感染的抑制、病毒复制的抑制、癌基因表达的抑制、基因表达的修饰、微生物感染的抑制和微生物复制的抑制,以及这些生物活性的组合。在一些实施方案中,所产生的蛋白质可以充当抗体的配体以在致病细胞的位点处诱导免疫应答,或将抗体导向的疗法(如携带治疗有效负载的抗体)定位至致病细胞的位点。在一些实施方案中,所产生的蛋白质可以调节靶基因的表达。在一些实施方案中,所产生的蛋白质可以调控酶活性、基因/蛋白质表达、分子信号传导和分子相互作用。
在涉及二聚化结构域FKBP或FRB的使用的一些实施方案中,当表达为具有目标蛋白质片段的融合蛋白时,结构域以特定方式改变以改善其性能。具体地,观察到FKBP和FRB均具有单个半胱氨酸残基。许多目标蛋白质片段,包括但不限于Gaussia荧光素酶以及免疫球蛋白的重链和轻链,自身具有多个半胱氨酸,在一些情况下,所述半胱氨酸在结构上对于二硫键和折叠的形成是重要的。由于FKBP和FRB中仅存在单个半胱氨酸,因此不认为二硫键对于二聚化结构域自身的折叠是必需的。因此,认为FKBP和FRB半胱氨酸可能通过形成结构上不正确的内部交叉二硫键而潜在地干扰期望融合蛋白的折叠成熟。反过来,用替代氨基酸残基对FKBP和FRB半胱氨酸进行保守替换可能是有益的,前提是所述变化与这些结构域的稳定性和配体结合活性是相容的。因此,在一些实施方案中,除F36V突变之外,FKBP的突变体还含有半胱氨酸至丝氨酸突变(C22S)。在某些其他实施方案中,还可使用半胱氨酸至丙氨酸突变(C22A)或半胱氨酸至缬氨酸突变(C22V)。以类似的方式,在一些实施方案中,FRB的突变体与半胱氨酸至丝氨酸突变(C61S)一起使用,或在某些其他实施方案中,与半胱氨酸至丙氨酸突变(C61A)或半胱氨酸至缬氨酸突变(C61V)一起使用。
在所有情况下,通过编码序列的两个重叠区的扩增以标准方式实现诱变,其中引物中的一个指定期望的编码序列变化。随后的一轮PCR实现了序列区的精确融合,通过测序确认。
提出了以下代表性实施方案:
实施方案1.一种单倍体-配体复合物,其包含:单倍体,其中所述单倍体包含与靶核酸分子基本上互补的多核苷酸;以及与所述单倍体的5’或3’末端连接的配体,其中所述配体包含配体配偶体结合位点。
实施方案2.根据实施方案1所述的单倍体-配体复合物,其中所述多核苷酸包括DNA核苷酸、RNA核苷酸、硫代磷酸酯修饰的核苷酸、2-O-烷基化的RNA核苷酸、卤代核苷酸、锁核酸核苷酸(LNA)、肽核酸(PNA)、吗啉代核酸类似物(吗啉代化合物)、假尿苷核苷酸、黄嘌呤核苷酸、次黄嘌呤核苷酸、2-脱氧肌苷核苷酸、具有L-核糖的DNA类似物(L-DNA)、Xeno核酸(XNA)类似物,或能够形成碱基对的其他核酸类似物,或具有改变的主链的人工核酸类似物,或其任何组合。
实施方案3.根据实施方案1或实施方案2所述的单倍体-配体复合物,其中所述配体是小分子配体或相互作用的蛋白质结构域。
实施方案4.根据实施方案3所述的单倍体-配体复合物,其中所述小分子配体小于约2500道尔顿。
实施方案5.根据实施方案4所述的单倍体-配体复合物,其中所述小分子配体是小分子、具有少于约20个氨基酸残基的肽、天然或人工修饰的肽、肽模拟物、聚糖、有机酶辅因子或人工衍生的小分子配体。
实施方案6.根据实施方案3所述的单倍体-配体复合物,其中所述小分子配体是FKM单价配体。
实施方案7.根据实施方案6所述的单倍体-配体复合物,其中所述FKM单价配体是FKM-NHS、FKM-磺基-NHS、FKM-PEG3-NHS或MFL2,其中:
FKM-NHS为其中m为3至6;FKM-磺基-NHS为
其中m为3至6;FKM-PEG3-NHS为
其中n为1至6;并且MFL2为
实施方案8.根据实施方案1至7中任一项所述的单倍体-配体复合物,其中所述配体还包含生物正交部分。
实施方案9.根据实施方案8所述的单倍体-配体复合物,其中所述生物正交部分为叠氮化物、炔、环辛炔、硝酮、降冰片烯、氧杂降冰片二烯、膦、二烷基膦、三烷基膦、膦硫醇、膦酚、环辛烯、氧化腈、硫酯、四嗪、异腈、四唑或四环烷或其任何衍生物。
实施方案10.根据实施方案8所述的单倍体-配体复合物,其中所述配体是选自FKM-PEG3-MTZ-NHS和FKM-PEG3-TCO-NHS的FKM单价配体,其中:FKM-PEG3-MTZ-NHS为
其中x为1至6;并且FKM-PEG3-TCO-NHS为
其中x为1至6。
实施方案11.根据实施方案3所述的单倍体-配体复合物,其中所述相互作用的蛋白质结构域包含少于100个氨基酸残基。
实施方案12.根据实施方案11所述的单倍体-配体复合物,其中所述相互作用的蛋白质结构域是亮氨酸拉链结构域。
实施方案13.根据实施方案12所述的单倍体-配体复合物,其中所述相互作用的蛋白质结构域为c-jun结构域、c-fos结构域、c-myc结构域、c-max结构域、NZ结构域或CZ结构域。
实施方案14.根据实施方案13所述的单倍体-配体复合物,其中所述NZ结构域包含氨基酸序列ALKKELQANKKELAQLKWELQALKKELAQ(SEQ ID NO:10),并且所述CZ结构域包含氨基酸序列EQLEKKLQALEKK LAQLEWKNQALEKKLAQ(SEQ ID NO:11)。
实施方案15.根据实施方案12所述的单倍体-配体复合物,其中所述c-jun结构域的N末端与所述单倍体的所述多核苷酸的5’或3’末端连接。
实施方案16.根据实施方案15所述的单倍体-配体复合物,其中所述c-jun结构域包含氨基酸序列CSGGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAP(SEQ ID NO:1)、CSGGASLERLARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:4)或CSGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:12)。
实施方案17.根据实施方案12所述的单倍体-配体复合物,其中所述c-jun结构域的C末端与所述单倍体的所述多核苷酸的5’或3’末端连接。
实施方案18.根据实施方案17所述的单倍体-配体复合物,其中所述c-jun结构域包含氨基酸序列SGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAPSGGC(SEQ ID NO:2)或SGASLER1ARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAPSGGC(SEQ ID NO:5)。
实施方案19.一种组合物或试剂盒,其包含根据实施方案1所述的第一单倍体-配体复合物和根据实施方案1所述的第二单倍体-配体复合物,其中:所述第一单倍体-配体复合物的所述配体与所述第一单倍体-配体复合物的所述多核苷酸的5’末端连接;并且所述第二单倍体-配体复合物的所述配体与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接。
实施方案20.根据实施方案19所述的组合物或试剂盒,其中所述第一单倍体-配体复合物的所述多核苷酸与所述第二单倍体-配体复合物的所述多核苷酸基本上互补。
实施方案21.根据实施方案19所述的组合物或试剂盒,其中所述第一单倍体-配体复合物的所述多核苷酸与靶核酸分子基本上互补,并且所述第二单倍体-配体复合物的所述多核苷酸在空间上接近所述第一单倍体-配体复合物的所述多核苷酸的位点处与所述靶核酸分子基本上互补。
实施方案22.根据实施方案19至21中任一项所述的组合物或试剂盒,其中所述第一单倍体-配体复合物和所述第二单倍体-配体复合物的所述多核苷酸包括DNA核苷酸、RNA核苷酸、硫代磷酸酯修饰的核苷酸、2-O-烷基化的RNA核苷酸、卤代核苷酸、锁核酸核苷酸(LNA)、肽核酸(PNA)、吗啉代核酸类似物(吗啉代化合物)、假尿苷核苷酸、黄嘌呤核苷酸、次黄嘌呤核苷酸、2-脱氧肌苷核苷酸、具有L-核糖的DNA类似物(L-DNA)、Xeno核酸(XNA)类似物,或能够形成碱基对的其他核酸类似物,或具有改变的主链的人工核酸类似物,或其任何组合。
实施方案23.根据实施方案19至22中任一项所述的组合物或试剂盒,其中两种配体都是小分子配体或两种配体都是相互作用的蛋白质结构域。
实施方案24.根据实施方案23所述的组合物或试剂盒,其中两种小分子配体均小于约2500道尔顿。
实施方案25.根据实施方案24所述的组合物或试剂盒,其中两种小分子配体均为小分子、具有少于约20个氨基酸残基的肽、天然或人工修饰的肽、肽模拟物、聚糖、有机酶辅因子或人工衍生的小分子配体。
实施方案26.根据实施方案23所述的组合物或试剂盒,其中两种小分子配体均为FKM单价配体。
实施方案27.根据实施方案26所述的组合物或试剂盒,其中每个FKM单价配体独立地为FKM-NHS、FKM-磺基-NHS、FKM-PEG3-NHS或MFL2,其中:FKM-NHS为
其中m为3至6;FKM-磺基-NHS为
其中m为3至6;FKM-PEG3-NHS为
其中n为1至6;并且MFL2为
实施方案28.根据实施方案19至27中任一项所述的组合物或试剂盒,其中:所述第一单倍体-配体复合物的所述配体还包含生物正交部分;并且所述第二单倍体-配体复合物的所述配体还包含生物正交部分;其中所述第一单倍体-配体复合物的所述生物正交部分与所述第二单倍体-配体复合物的所述生物正交部分可反应。
实施方案29.根据实施方案28所述的组合物或试剂盒,其中所述可反应的生物正交部分选自叠氮化物、炔、环辛炔、硝酮、降冰片烯、氧杂降冰片二烯、膦、二烷基膦、三烷基膦、膦硫醇、膦酚、环辛烯、氧化腈、硫酯、四嗪、异腈、四唑或四环烷或其任何衍生物。
实施方案30.根据实施方案28所述的组合物或试剂盒,其中所述第一单倍体-配体复合物或第二单倍体-配体复合物中的一个的所述配体是为FKM-PEG3-MTZ-NHS的FKM单价配体并且所述第一单倍体-配体复合物或第二单倍体-配体复合物中的另一个的所述配体是为FKM-PEG3-TCO-NHS的FKM单价配体,其中:FKM-PEG3-MTZ-NHS为其中x为1至6;并且FKM-PEG3-TCO-NHS为
其中x为1至6。
实施方案31.根据实施方案23所述的组合物或试剂盒,其中两个相互作用的蛋白质结构域各自包含少于100个氨基酸残基。
实施方案32.根据实施方案31所述的组合物或试剂盒,其中两个相互作用的蛋白质结构域是亮氨酸拉链结构域。
实施方案33.根据实施方案32所述的组合物或试剂盒,其中每个相互作用的蛋白质结构域独立地为c-jun结构域、c-fos结构域、c-myc结构域、c-max结构域、NZ结构域或CZ结构域。
实施方案34.根据实施方案33所述的组合物或试剂盒,其中所述第一单倍体-配体复合物的所述相互作用的蛋白质结构域的N末端与所述第一单倍体-配体复合物的所述多核苷酸的5’末端连接,并且所述第二单倍体-配体复合物的所述相互作用的蛋白质结构域的N末端与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接。
实施方案35.根据实施方案33所述的组合物或试剂盒,其中所述第一单倍体-配体复合物的所述相互作用的蛋白质结构域的C末端与所述第一单倍体-配体复合物的所述多核苷酸的5’末端连接,并且所述第二单倍体-配体复合物的所述相互作用的蛋白质结构域的C末端与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接。
实施方案36.根据实施方案33所述的组合物或试剂盒,其中:所述第一单倍体-配体复合物的所述相互作用的蛋白质结构域的C末端与所述第一单倍体-配体复合物的所述多核苷酸的5’末端连接,并且所述第二单倍体-配体复合物的所述相互作用的蛋白质结构域的N末端与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接;或所述第一单倍体-配体复合物的所述相互作用的蛋白质结构域的N末端与所述第一单倍体-配体复合物的所述多核苷酸的5’末端连接,并且所述第二单倍体-配体复合物的所述相互作用的蛋白质结构域的C末端与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接。
实施方案37.根据实施方案33至36中任一项所述的组合物或试剂盒,其中所述NZ结构域包含氨基酸序列ALKKELQANKKELAQLKWELQALKKE LAQ(SEQ ID NO:10),并且所述CZ结构域包含氨基酸序列EQLEKKLQALEKKLAQLEWKNQALEKKLAQ(SEQ ID NO:11)。
实施方案38.根据实施方案33至36中任一项所述的组合物或试剂盒,其中与所述第一单倍体-配体复合物的所述多核苷酸连接的所述配体是c-jun结构域,并且与所述第二单倍体-配体复合物的所述多核苷酸连接的所述配体是c-jun结构域。
实施方案39.根据实施方案33至36中任一项所述的组合物或试剂盒,其中所述c-jun结构域包含氨基酸序列CSGGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAP(SEQ IDNO:1)、CSGGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:4)或ASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:16)。
实施方案40.根据实施方案35或实施方案36所述的组合物或试剂盒,其中所述c-jun结构域的C末端与所述第一单倍体-配体复合物和所述第二单倍体-配体复合物中的一个或两者的所述多核苷酸的5’或3’末端连接。
实施方案41.根据实施方案40所述的组合物或试剂盒,其中所述c-jun结构域包含氨基酸序列SGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAPSGGC(SEQ ID NO:2)或GASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAPSGGC(SEQ ID NO:5)。
实施方案42.根据实施方案33至36中任一项所述的组合物或试剂盒,其中与所述第一单倍体-配体复合物的所述多核苷酸连接的所述配体是c-jun结构域或c-myc结构域,并且与所述第二单倍体-配体复合物的所述多核苷酸连接的所述配体是c-jun结构域或c-myc结构域。
实施方案43.根据实施方案42所述的组合物或试剂盒,其中与所述第一单倍体-配体复合物或所述第二单倍体-配体复合物的所述多核苷酸连接的所述配体是c-jun结构域,并且与所述第一单倍体-配体复合物和所述第二单倍体-配体复合物中的另一个的所述多核苷酸连接的所述配体是c-myc结构域。
实施方案44.一种瓶形单倍体-配体复合物,其包含:a)瓶形单倍体,其中所述瓶形单倍体包含多核苷酸,其中所述多核苷酸包括:i)第一茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基且具有与所述第一茎部连接的第一末端,其中所述反靶环部分与靶核酸分子基本上互补;以及iii)第二茎部,其包括与所述反靶环部分的第二末端连接的约10至约20个核苷酸碱基,其中所述第一茎部与所述第二茎部基本上互补;以及b)与所述第一茎部或所述第二茎部的末端连接的配体,其中所述配体包含配体配偶体结合位点;其中反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm
实施方案45.根据实施方案44所述的瓶形单倍体-配体复合物,其中从所述反靶环部分:靶核酸分子的Tm中减去所述第一茎部:第二茎部的Tm为约10℃至约40℃。
实施方案46.根据实施方案44或实施方案45所述的瓶形单倍体-配体复合物,其中所述第一茎部:第二茎部的Tm为约40℃至约50℃。
实施方案47.根据实施方案44至46中任一项所述的瓶形单倍体-配体复合物,其中所述反靶环部分:靶核酸分子的Tm为约60℃至约80℃。
实施方案48.根据实施方案44至47中任一项所述的瓶形单倍体-配体复合物,其中从所述反靶环部分:靶核酸分子的Tm中减去所述第一茎部:第二茎部的Tm为约10℃至约20℃。
实施方案49.根据实施方案44至48中任一项所述的瓶形单倍体-配体复合物,其中所述第一茎部包括约12至约18个核苷酸碱基。
实施方案50.根据实施方案44至49中任一项所述的瓶形单倍体-配体复合物,其中所述反靶环部分包括约18至约35个核苷酸碱基。
实施方案51.根据实施方案44至50中任一项所述的瓶形单倍体-配体复合物,其中所述第二茎部包括约12至约18个核苷酸碱基。
实施方案52.根据实施方案44至51中任一项所述的瓶形单倍体-配体复合物,其中所述第一茎部、所述反靶环部分以及所述第二茎部中的任何一个或多个的核苷酸碱基选自由以下各项组成的组:DNA核苷酸、RNA核苷酸、硫代磷酸酯修饰的核苷酸、2-O-烷基化的RNA核苷酸、卤代核苷酸、锁核酸核苷酸(LNA)、肽核酸(PNA)、吗啉代核酸类似物(吗啉代化合物)、假尿苷核苷酸、黄嘌呤核苷酸、次黄嘌呤核苷酸、2-脱氧肌苷核苷酸、具有L-核糖的DNA类似物(L-DNA)、Xeno核酸(XNA)类似物,或能够形成碱基对的其他核酸类似物,或具有改变的主链的人工核酸类似物,或其任何组合。
实施方案53.根据实施方案44至52中任一项所述的瓶形单倍体-配体复合物,还包含在所述第一茎部与所述反靶环部分之间、所述反靶环部分与所述第二茎部之间以及所述第二茎部与所述反应性效应子部分之间中的任何一者或多者的接头。
实施方案54.根据实施方案53所述的瓶形单倍体-配体复合物,其中所述接头选自由以下各项组成的组:烷基、烯基、酰胺、酯、硫酯、酮、醚、硫醚、二硫化物、乙二醇、环烷基、苄基、杂环基、马来酰亚胺基、腙、聚氨酯、唑类、亚胺、卤代烷基,以及氨基甲酸酯,或其任何组合。
实施方案55.根据实施方案44至54中任一项所述的瓶形单倍体-配体复合物,其中所述反靶环部分还包含内部铰链区,其中所述铰链区包括与所述靶核酸分子不互补的一个或多个核苷酸。
实施方案56.根据实施方案55所述的瓶形单倍体-配体复合物,其中所述铰链区包括约1个核苷酸至约6个核苷酸。
实施方案57.根据实施方案44至56中任一项所述的瓶形单倍体-配体复合物,其包含核苷酸序列5’-ACTCGAGACGTCTCCTTGTCTTTGCTTTTCTTCAGGACACAGTGGCGAGACGTCTCGAGT-3’(SEQ ID NO:6)或5’-ACTCGAGACGTCTCCTTCCTGCCCCTCCTCCTGCTCCGAGACGTCTCGAGT-3’(SEQ ID NO:7)。
实施方案58.根据实施方案44至57中任一项所述的瓶形单倍体-配体复合物,其中所述配体是小分子配体或相互作用的蛋白质结构域。
实施方案59.根据实施方案58所述的瓶形单倍体-配体复合物,其中所述小分子配体小于约2500道尔顿。
实施方案60.根据实施方案59所述的瓶形单倍体-配体复合物,其中所述小分子配体是小分子、具有少于约20个氨基酸残基的肽、天然或人工修饰的肽、肽模拟物、聚糖、有机酶辅因子、或人工衍生的小分子配体。
实施方案61.根据实施方案58所述的瓶形单倍体-配体复合物,其中所述小分子配体是FKM单价配体。
实施方案62.根据实施方案61所述的瓶形单倍体-配体复合物,其中所述FKM单价配体是FKM-NHS、FKM-磺基-NHS、FKM-PEG3-NHS、MFL2,其中:
FKM-NHS为其中m为3至6;FKM-磺基-NHS为
其中m为3至6;FKM-PEG3-NHS为
其中n为1至6;并且MFL2i为
实施方案63.根据实施方案44至62中任一项所述的瓶形单倍体-配体复合物,其中所述配体还包含生物正交部分。
实施方案64.根据实施方案63所述的瓶形单倍体-配体复合物,其中所述生物正交部分为叠氮化物、炔、环辛炔、硝酮、降冰片烯、氧杂降冰片二烯、膦、二烷基膦、三烷基膦、膦硫醇、膦酚、环辛烯、氧化腈、硫酯、四嗪、异腈、四唑或四环烷或其任何衍生物。
实施方案65.根据实施方案63所述的瓶形单倍体-配体复合物,其中所述配体是选自FKM-PEG3-MTZ-NHS和FKM-PEG3-TCO-NHS的FKM单价配体,其中:FKM-PEG3-MTZ-NHS为
其中x为1至6;
并且FKM-PEG3-TCO-NHS为
其中x为1至6。
实施方案66.根据实施方案58所述的瓶形单倍体-配体复合物,其中所述相互作用的蛋白质结构域包含少于100个氨基酸残基。
实施方案67.根据实施方案66所述的瓶形单倍体-配体复合物,其中所述相互作用的蛋白质结构域是亮氨酸拉链结构域。
实施方案68.根据实施方案67所述的瓶形单倍体-配体复合物,其中所述相互作用的蛋白质结构域为c-jun结构域、c-fos结构域、c-myc结构域、c-max结构域、NZ结构域或CZ结构域。
实施方案69.根据实施方案68所述的瓶形单倍体-配体复合物,其中所述NZ结构域包含氨基酸序列ALKKELQANKKELAQLKWELQALKKELAQ(SEQ ID NO:10),并且所述CZ结构域包含氨基酸序列EQLEKKLQALEKKLAQLEWKNQALEKKLAQ(SEQ ID NO:11)。
实施方案70.根据实施方案67所述的瓶形单倍体-配体复合物,其中所述c-jun结构域的N末端与所述瓶形单倍体的所述多核苷酸的5’或3’末端连接。
实施方案71.根据实施方案70所述的瓶形单倍体-配体复合物,其中所述c-jun结构域包含氨基酸序列CSGGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAP(SEQ ID NO:1)、CSGGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:4)或CSGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:12)。
实施方案72.根据实施方案67所述的瓶形单倍体-配体复合物,其中所述c-jun结构域的C末端与所述瓶形单倍体的所述多核苷酸的5’或3’末端连接。
实施方案73.根据实施方案72所述的瓶形单倍体-配体复合物,其中所述c-jun结构域包含氨基酸序列SGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAPSGGC(SEQ IDNO:2)或SGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAPSGGC(SEQ ID NO:5)。
实施方案74.一种组合物或试剂盒,其包含:根据实施方案44至73中任一项所述的瓶形单倍体-配体复合物;以及第二单倍体-配体复合物,其包含:包括约6至约20个核苷酸碱基的核苷酸部分,其与和所述瓶形单倍体-配体复合物的所述配体连接的所述瓶形单倍体-配体复合物的所述茎部基本上互补;以及与所述第二单倍体-配体复合物的所述核苷酸部分的5’或3’末端连接的配体,其中所述配体包含配体配偶体结合位点;其中第二单倍体-配体复合物:与所述瓶形单倍体-配体复合物的所述配体连接的第一或第二茎部的Tm小于或等于所述瓶形单倍体-配体复合物的第一茎部:第二茎部的Tm
实施方案75.根据实施方案74所述的组合物或试剂盒,其中从所述瓶形单倍体-配体复合物的所述第一茎部:第二茎部的Tm中减去由所述第二单倍体-配体复合物和与所述配体连接的所述瓶形单倍体-配体复合物的所述第一或第二茎部形成的所述双链体的Tm为约0℃至约20℃。
实施方案76.根据实施方案74或实施方案75所述的组合物或试剂盒,其中由所述第二单倍体-配体复合物和与所述配体连接的所述瓶形单倍体-配体复合物的所述第一或第二茎部形成的所述双链体的Tm为约30℃至约40℃。
实施方案77.根据实施方案74至76中任一项所述的组合物或试剂盒,其中从所述瓶形单倍体-配体复合物的所述第一茎部:第二茎部的Tm中减去由所述第二单倍体-配体复合物和与所述配体连接的所述瓶形单倍体-配体复合物的所述第一或第二茎部形成的所述双链体的Tm为约5℃至约10℃。
实施方案78.根据实施方案74至77中任一项所述的组合物或试剂盒,其中所述第二单倍体-配体复合物的所述多核苷酸包括约8至约15个核苷酸碱基。
实施方案79.根据实施方案74至78中任一项所述的组合物或试剂盒,其中所述瓶形单倍体-配体复合物和所述第二单倍体-配体复合物的所述多核苷酸包括DNA核苷酸、RNA核苷酸、硫代磷酸酯修饰的核苷酸、2-O-烷基化的RNA核苷酸、卤代核苷酸、锁核酸核苷酸(LNA)、肽核酸(PNA)、吗啉代核酸类似物(吗啉代化合物)、假尿苷核苷酸、黄嘌呤核苷酸、次黄嘌呤核苷酸、2-脱氧肌苷核苷酸、具有L-核糖的DNA类似物(L-DNA)、Xeno核酸(XNA)类似物,或能够形成碱基对的其他核酸类似物,或具有改变的主链的人工核酸类似物,或其任何组合。
实施方案80.根据实施方案74至79中任一项所述的组合物或试剂盒,其中两种配体都是小分子配体或两种配体都是相互作用的蛋白质结构域。
实施方案81.根据实施方案80所述的组合物或试剂盒,其中两种小分子配体均小于约2500道尔顿。
实施方案82.根据实施方案81所述的组合物或试剂盒,其中两种小分子配体均为小分子、具有少于约20个氨基酸残基的肽、天然或人工修饰的肽、肽模拟物、聚糖、有机酶辅因子或人工衍生的小分子配体。
实施方案83.根据实施方案80所述的组合物或试剂盒,其中两种小分子配体均为FKM单价配体。
实施方案84.根据实施方案83所述的组合物或试剂盒,其中每个FKM单价配体独立地为FKM-NHS、FKM-磺基-NHS、FKM-PEG3-NHS或MFL2,其中:FKM-NHS为
其中m为3至6;FKM-磺基-NHS为其中m为3至6;FKM-PEG3-NHS为
其中n为1至6;
并且MFL2为
实施方案85.根据实施方案74至84中任一项所述的组合物或试剂盒,其中:所述瓶形单倍体-配体复合物的所述配体还包含生物正交部分;并且所述第二单倍体-配体复合物的所述配体还包含生物正交部分;其中所述瓶形单倍体-配体复合物的所述生物正交部分与所述第二单倍体-配体复合物的所述生物正交部分可反应。
实施方案86.根据实施方案85所述的组合物或试剂盒,其中所述可反应的生物正交部分选自叠氮化物、炔、环辛炔、硝酮、降冰片烯、氧杂降冰片二烯、膦、二烷基膦、三烷基膦、膦硫醇、膦酚、环辛烯、氧化腈、硫酯、四嗪、异腈、四唑或四环烷或其任何衍生物。
实施方案87.根据实施方案85所述的组合物或试剂盒,其中所述瓶形单倍体-配体复合物和所述第二单倍体-配体复合物中的一个的所述配体是为FKM-PEG3-MTZ-NHS的FKM单价配体,并且所述瓶形单倍体-配体复合物和所述第二单倍体-配体复合物中的另一个的所述配体是为FKM-PEG3-TCO-NHS的FKM单价配体,其中:FKM-PEG3-MTZ-NHS为
其中x为1至6;
并且FKM-PEG3-TCO-NHS为
其中x为1至6。
实施方案88.根据实施方案80所述的组合物或试剂盒,其中两个相互作用的蛋白质结构域各自包含少于100个氨基酸残基。
实施方案89.根据实施方案88所述的组合物或试剂盒,其中两个相互作用的蛋白质结构域是亮氨酸拉链结构域。
实施方案90.根据实施方案89所述的组合物或试剂盒,其中每个相互作用的蛋白质结构域独立地为c-jun结构域、c-fos结构域、c-myc结构域、c-max结构域、NZ结构域或CZ结构域。
实施方案91.根据实施方案90所述的组合物或试剂盒,其中所述瓶形单倍体-配体复合物的所述相互作用的蛋白质结构域的N末端与所述瓶形单倍体-配体复合物的所述多核苷酸的5’末端连接,并且所述第二单倍体-配体复合物的所述相互作用的蛋白质结构域的N末端与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接。
实施方案92.根据实施方案90所述的组合物或试剂盒,其中所述瓶形单倍体-配体复合物的所述相互作用的蛋白质结构域的C末端与所述瓶形单倍体-配体复合物的所述多核苷酸的5’末端连接,并且所述第二单倍体-配体复合物的所述相互作用的蛋白质结构域的C末端与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接。
实施方案93.根据实施方案90所述的组合物或试剂盒,其中:所述瓶形单倍体-配体复合物的所述相互作用的蛋白质结构域的C末端与所述瓶形单倍体-配体复合物的所述多核苷酸的5’末端连接,并且所述第二单倍体-配体复合物的所述相互作用的蛋白质结构域的N末端与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接;或所述瓶形单倍体-配体复合物的所述相互作用的蛋白质结构域的N末端与所述瓶形单倍体-配体复合物的所述多核苷酸的5’末端连接,并且所述第二单倍体-配体复合物的所述相互作用的蛋白质结构域的C末端与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接。
实施方案94.根据实施方案90至93中任一项所述的组合物或试剂盒,其中所述NZ结构域包含氨基酸序列ALKKELQANKKELAQLKWELQALKKELAQ(SEQ ID NO:10),并且所述CZ结构域包含氨基酸序列EQLEKKLQALEKKLAQLEWKNQALEKKLAQ(SEQ ID NO:11)。
实施方案95.根据实施方案90至93中任一项所述的组合物或试剂盒,其中与所述瓶形单倍体-配体复合物的所述多核苷酸连接的所述配体是c-jun结构域,并且与所述第二单倍体-配体复合物的所述多核苷酸连接的所述配体是c-jun结构域。
实施方案96.根据实施方案90至93中任一项所述的组合物或试剂盒,其中所述c-jun结构域包含氨基酸序列CSGGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAP(SEQ IDNO:1)、CSGGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:4)或ASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:12)。
实施方案97.根据实施方案92或实施方案93所述的组合物或试剂盒,其中所述c-jun结构域的C末端与所述瓶形单倍体-配体复合物和所述第二单倍体-配体复合物中的一个或两者的所述多核苷酸的5’或3’末端连接。
实施方案98.根据实施方案97所述的组合物或试剂盒,其中所述c-jun结构域包含氨基酸序列SGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAPSGGC(SEQ ID NO:2)或SGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAPSGGC(SEQ ID NO:5)。
实施方案99.根据实施方案90至93中任一项所述的组合物或试剂盒,其中与所述瓶形单倍体-配体复合物的所述多核苷酸连接的所述配体是c-jun结构域或c-myc结构域,并且与所述第二单倍体-配体复合物的所述多核苷酸连接的所述配体是c-jun结构域或c-myc结构域。
实施方案100.根据实施方案99所述的组合物或试剂盒,其中与所述瓶形单倍体-配体复合物和所述第二单倍体-配体复合物中的一个的所述多核苷酸连接的所述配体是c-jun结构域,并且与所述瓶形单倍体-配体复合物和所述第二单倍体-配体复合物中的另一个的所述多核苷酸连接的所述配体是c-myc结构域。
实施方案101.根据实施方案74至100中任一项所述的试剂盒,其中:所述瓶形单倍体-配体复合物的所述多核苷酸包含5’-ACTCGAGACGTCTCCTTGTCTTTGCTTTTCTTCAGGACACAGTGGCGAGACGTCTCGAGT-3’(SEQ ID NO:6)的核苷酸序列,并且所述第二单倍体-配体复合物的所述多核苷酸包含5’-AGCTCTCGAGT-3’(SEQ ID NO:8)的核苷酸序列;或所述瓶形单倍体-配体复合物的所述多核苷酸包含5’-ACTCGAGACGTCTCCTTCCTGCCCCTCCTCCTGCTCCGAGACGTCTCGAGT-3’(SEQ ID NO:7)的核苷酸序列,并且所述第二单倍体-配体复合物的所述多核苷酸包含核苷酸序列5’-GACGTCTCGAGT-3’(SEQ ID NO:9)。
实施方案102.一种化合物,其具有下式:
其中m为3至6。
实施方案103.一种化合物,其具有下式:
其中m为3至6。
实施方案104.一种化合物,其具有下式:
其中n为1至6。
实施方案105.一种化合物,其具有下式:
其中x为1至6。
实施方案106.一种化合物,其具有下式:
其中x为1至6。
实施方案106B.一种化合物,其具有下式:
实施方案107.一种融合蛋白,其包含与配体结合结构域融合的目标蛋白质的片段,其中:所述配体结合结构域是用于小分子配体的配体结合结构域;或所述配体结合结构域为相互作用的蛋白质结构域。
实施方案108.根据实施方案107所述的融合蛋白,其中所述配体结合结构域是用于小分子配体的配体结合结构域。
实施方案109.根据实施方案108所述的融合蛋白,其中所述配体结合结构域是FKBP结构域或FRB结构域。
实施方案110.根据实施方案109所述的融合蛋白,其中所述FKBP结构域是突变型FKBP结构域。
实施方案110B.根据实施方案108所述的融合蛋白,其中所述FKBP结构域包含C22S、C22A或C22V取代,或其中所述FRB结构域包含C61S、C61A或C61V取代。
实施方案111.根据实施方案110所述的融合蛋白,其中所述突变型FKBP结构域是F36V FKBP突变型结构域,其包含氨基酸序列GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE(SEQ IDNO:14)或MGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE(SEQ ID NO:15)。
实施方案112.根据实施方案107所述的融合蛋白,其中所述配体结合结构域是相互作用的蛋白质结构域。
实施方案113.根据实施方案112所述的融合蛋白,其中所述相互作用的蛋白质结构域包括少于100个氨基酸残基。
实施方案114.根据实施方案112所述的融合蛋白,其中所述相互作用的蛋白质结构域是亮氨酸拉链结构域。
实施方案115.根据实施方案114所述的融合蛋白,其中所述相互作用的蛋白质结构域为c-jun结构域、c-fos结构域、c-myc结构域、c-max结构域、NZ结构域或CZ结构域。
实施方案116.根据实施方案115所述的融合蛋白,其中所述相互作用的蛋白质结构域与所述目标蛋白质的N末端融合。
实施方案117.根据实施方案115所述的融合蛋白,其中所述相互作用的蛋白质结构域与所述目标蛋白质的C末端融合。
实施方案118.根据实施方案115至117中任一项所述的融合蛋白,其中所述NZ结构域包含氨基酸序列ALKKELQANKKELAQLKWELQALKKELAQ(SEQ ID NO:10),并且所述CZ结构域包含氨基酸序列EQLEKKLQALEKKLAQLEWKNQALEKKLAQ(SEQ ID NO:11)。
实施方案119.根据实施方案115至117中任一项所述的融合蛋白,其中所述c-jun结构域包含氨基酸序列CSGGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAP(SEQ IDNO:1)、CSGGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:4)或ASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:12)。
实施方案120.根据实施方案115至117中任一项所述的融合蛋白,其中所述c-jun结构域包含氨基酸序列SGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAPSGGC(SEQ IDNO:2)、SGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAPSGGC(SEQ ID NO:5)。
实施方案121.根据实施方案115至117中任一项所述的融合蛋白,其中所述c-Fos结构域包含氨基酸序列ASRELTDTLQAETDQLEDEKSALQTEIANLLKEKEKLEGAP(SEQ ID NO:3)或SGASRELTDTLQAETDQLEDEKSALQTEIANLLKEKEKLEGAP(SEQ ID NO:13)。
实施方案122.根据实施方案107至121中任一项所述的融合蛋白,其中所述融合蛋白包含所述目标蛋白质与所述配体结合结构域之间的接头。
实施方案123.根据实施方案122所述的融合蛋白,其中所述接头是Ser/Gly接头、聚天冬酰胺接头,或包含氨基酸序列AGSSAAGSGS(SEQ ID NO:17)的接头。
实施方案124.根据实施方案123所述的融合蛋白,其中所述聚天冬酰胺接头包括约8至约16个天冬酰胺残基。
实施方案125.根据实施方案123所述的融合蛋白,其中所述Ser/Gly接头包含GGSGGGSGGGSGGGSGGG(SEQ ID NO:18)、GGSGGGSGGGSGGGSGGGSGGG(SEQ ID NO:19)、GGSGGGSGGGSGGGSGGGSGGGSGGG(SEQ ID NO:20)、SGGGGSGGGGSGGGG(SEQ ID NO:21)、SGGGGSGGGGSGGGGSGGGG(SEQ ID NO:22)、SGGGGSGGGGSGGGGSGGGGSGGGG(SEQ ID NO:23)、SGGGS(SEQ ID NO:24)、SGSG(SEQ ID NO:25)、SGGGGS(SEQ ID NO:26)或SGSGG(SEQ ID NO:27)。
实施方案126.根据实施方案107至125中任一项所述的融合蛋白,其中所述目标蛋白质是以下各项的片段:细胞毒性蛋白、杀微生物蛋白、杀病毒蛋白、促凋亡蛋白、血栓形成蛋白、补体激活蛋白、Toll样受体蛋白、NOD2受体激动剂蛋白或抗体或其片段。
实施方案127.根据实施方案126所述的融合蛋白,其中:所述细胞毒性蛋白是蜜蜂蜂毒素、芋螺毒素、凯萨林菌素、防御素、protegrin或NK溶素;所述促凋亡蛋白是朊病毒蛋白、与半胱天冬酶级联相关的Bax衍生的最小前肽,或促凋亡肽(KLAKLAK)2(SEQ ID NO:28);所述先天免疫***刺激蛋白是病原体相关分子模式(PAMP)或损伤相关分子模式(DAMP);所述补体激活蛋白是补体蛋白C3的C3a片段;所述Toll样受体(TLR)蛋白是热休克蛋白(hsp);所述NOD2受体激动剂蛋白是胞壁酰二肽激动剂;并且所述抗体片段是Fab、Fv或scFv。
实施方案128.根据实施方案107至125中任一项所述的融合蛋白,其中所述目标蛋白质是以下各项的片段:超折叠GFP(sfGFP)、海肾荧光素酶、鼠二氢叶酸还原酶(DHFR)、酿酒酵母遍在蛋白、β-内酰胺酶或单纯疱疹病毒1型胸苷激酶。
实施方案129.根据实施方案128所述的融合蛋白,其中:超折叠GFP(sfGFP)的所述片段包含MRKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFARYPDHMKQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQ(SEQ ID NO:29)或KNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSVLSKDPNEKRDHMVLLEFVTAAGITHGMDELYK(SEQ ID NO:30);海肾荧光素酶的所述片段包含MASKVYDPEQRKRMITGPQWWARCKQMNVLDSFINYYDSEKHAENAVIFLHGNAASSYLWRHVVPHIEPVARCIIPDLIGMGKSGKSGNGSYRLLDHYKYLTAWFELLNLPKKIIFVGHDWGACLAFHYSYEHQDKIKAIVHAESVVDVIESWDEWPDIEEDIALIKSEEGEKMVLENNFFVETMLPSKIMRKLEPEEFAAYLEPFKEKGEVRRPTLSWPREIPLVKGG(SEQ ID NO:31)或KPDVVQIVRNYNAYLRASDDLPKMFIESDPGFFSNAIVEGAKKFPNTEFVKVKGLHFSQEDAPDEMGKYIKSFVERVLKNEQ(SEQ ID NO:32);鼠二氢叶酸还原酶(DHFR)的所述片段包含其氨基酸1-105或106-186;酿酒酵母遍在蛋白的所述片段包含其氨基酸1-34(MQIFVKTLTGKTITLEVESSDTIDNVKSKIQDKE;SEQ ID NO:33)或35-76(GIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG;SEQ ID NO:34);β-内酰胺酶的所述片段包含其氨基酸25-197或198-286;并且单纯疱疹病毒1型胸苷激酶的所述片段包含其氨基酸1-265或266-376。
实施方案130.一种组合物或试剂盒,其包含根据实施方案107所述的第一融合蛋白和根据实施方案107所述的第二融合蛋白,其中所述第一融合蛋白的所述目标蛋白质和所述第二融合蛋白的所述目标蛋白质可以二聚化或折叠在一起。
实施方案131.根据实施方案130所述的组合物或试剂盒,其中:所述第一融合蛋白包含与用于小分子配体的配体结合结构域融合的目标蛋白质;所述第二融合蛋白包含与用于小分子配体的配体结合结构域融合的目标蛋白质。
实施方案132.根据实施方案131所述的组合物或试剂盒,其中所述第一融合蛋白和所述第二融合蛋白的所述配体结合结构域是FKBP结构域或FRB结构域。
实施方案133.根据实施方案132所述的组合物或试剂盒,其中所述FKBP结构域是突变型FKBP结构域。
实施方案133B.根据实施方案132所述的融合蛋白,其中所述FKBP结构域包含C22S、C22A或C22V取代,或其中所述FRB结构域包含C61S、C61A或C61V取代。
实施方案134.根据实施方案133所述的组合物或试剂盒,其中所述突变型FKBP结构域是F36V FKBP突变型结构域,其包含氨基酸序列GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE(SEQ ID NO:14)或MGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE(SEQ ID NO:15)。
实施方案135.根据实施方案130所述的组合物或试剂盒,其中:所述第一融合蛋白包含与相互作用的蛋白质结构域融合的目标蛋白质;所述第二融合蛋白包含与相互作用的蛋白质结构域融合的目标蛋白质。
实施方案136.根据实施方案135所述的组合物或试剂盒,其中两种融合蛋白的所述相互作用的蛋白质结构域包括少于100个氨基酸残基。
实施方案137.根据实施方案135所述的组合物或试剂盒,其中两种融合蛋白的相互作用的蛋白质结构域是亮氨酸拉链结构域。
实施方案138.根据实施方案114所述的组合物或试剂盒,其中所述第一融合蛋白和所述第二融合蛋白的相互作用的蛋白质结构域独立地为NZ结构域、CZ结构域、c-jun结构域、c-fos结构域、c-myc结构域或c-max结构域。
实施方案139.根据实施方案135至138中任一项所述的组合物或试剂盒,其中:所述第一融合蛋白的所述相互作用的蛋白质结构域与所述目标蛋白质的N末端融合,并且所述第二融合蛋白的所述相互作用的蛋白质结构域与所述目标蛋白质的N末端融合;所述第一融合蛋白的所述相互作用的蛋白质结构域与所述目标蛋白质的C末端融合,并且所述第二融合蛋白的所述相互作用的蛋白质结构域与所述目标蛋白质的C末端融合;或所述第一融合蛋白和所述第二融合蛋白中的一个的所述相互作用的蛋白质结构域与所述目标蛋白质的N末端融合,并且所述第一融合蛋白和所述第二融合蛋白中的另一个的所述相互作用的蛋白质结构域与所述目标蛋白质的C末端融合。
实施方案140.根据实施方案135至139中任一项所述的组合物或试剂盒,其中所述NZ结构域包含氨基酸序列ALKKELQANKKELAQLKWELQALKKELAQ(SEQ ID NO:10),并且所述CZ结构域包含氨基酸序列EQLEKKLQALEKKLAQLEWKNQALEKKLAQ(SEQ ID NO:11)。
实施方案141.根据实施方案135至139中任一项所述的组合物或试剂盒,其中所述c-jun结构域包含氨基酸序列CSGGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAP(SEQID NO:1)、CSGGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:4)或ASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAP(SEQ ID NO:16)。
实施方案142.根据实施方案135至139中任一项所述的组合物或试剂盒,其中所述c-jun结构域包含氨基酸序列SGASLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKGAPSGGC(SEQ ID NO:2)或SGASLERIARLEEKVKSFKAQNSENASTANMLREQVAQLKQKGAPSGGC(SEQ ID NO:5)。
实施方案143.根据实施方案135至139中任一项所述的组合物或试剂盒,其中所述c-Fos结构域包含氨基酸序列ASRELTDTLQAETDQLEDEKSALQTEIANLLKEKEKLEGAP(SEQ ID NO:3)或SGASRELTDTLQAETDQLEDEKSALQTEIANLLKEKEKLEGAP(SEQ ID NO:13)。
实施方案144.根据实施方案130至143中任一项所述的组合物或试剂盒,其中所述第一融合蛋白和所述第二融合蛋白均包含所述目标蛋白质与所述配体结合结构域之间的接头。
实施方案145.根据实施方案144所述的组合物或试剂盒,其中每个接头独立地为Ser/Gly接头、聚天冬酰胺接头,或包含氨基酸序列AGSSAAGSGS(SEQ ID NO:17)的接头)。
实施方案146.根据实施方案145所述的组合物或试剂盒,其中每个聚天冬酰胺接头独立地包括约8至约16个天冬酰胺残基。
实施方案147.根据实施方案145所述的组合物或试剂盒,其中每个Ser/Gly接头独立地包含GGSGGGSGGGSGGGSGGG(SEQ ID NO:18)、GGSGGGSGGGSGGGSGGGSGGG(SEQ ID NO:19)、GGSGGGSGGGSGGGSGGGSGGGSGGG(SEQ ID NO:20)、SGGGGSGGGGSGGGG(SEQ ID NO:21)、SGGGGSGGGGSGGGGSGGGG(SEQ ID NO:22)、SGGGGSGGGGSGGGGSGGGGSGGGG(SEQ ID NO:23)、SGGGS(SEQ ID NO:24)、SGSG(SEQ ID NO:25)、SGGGGS(SEQ ID NO:26)或SGSGG(SEQ ID NO:27)。
实施方案148.根据实施方案130至147中任一项所述的组合物或试剂盒,其中:所述第一融合蛋白的所述目标蛋白质是细胞毒性蛋白的第一片段,并且所述第二融合蛋白的所述目标蛋白质是细胞毒性蛋白的第二片段,其中所述细胞毒性蛋白的所述第一片段和所述细胞毒性蛋白的所述第二片段二聚化或折叠在一起;所述第一融合蛋白的所述目标蛋白质是杀微生物蛋白的第一片段,并且所述第二融合蛋白的所述目标蛋白质是杀微生物蛋白的第二片段,其中所述杀微生物蛋白的所述第一片段和所述杀微生物蛋白的所述第二片段二聚化或折叠在一起;所述第一融合蛋白的所述目标蛋白质是杀病毒蛋白的第一片段,并且所述第二融合蛋白的所述目标蛋白质是杀病毒蛋白的第二片段,其中所述杀病毒蛋白的所述第一片段和所述杀病毒蛋白的所述第二片段二聚化或折叠在一起;所述第一融合蛋白的所述目标蛋白质是促凋亡蛋白的第一片段,并且所述第二融合蛋白的所述目标蛋白质是促凋亡蛋白的第二片段,其中所述促凋亡蛋白的所述第一片段和所述促凋亡蛋白的所述第二片段二聚化或折叠在一起;所述第一融合蛋白的所述目标蛋白质是血栓形成蛋白的第一片段,并且所述第二融合蛋白的所述目标蛋白质是血栓形成蛋白的第二片段,其中所述血栓形成蛋白的所述第一片段和所述血栓形成蛋白的所述第二片段二聚化或折叠在一起;所述第一融合蛋白的所述目标蛋白质是补体激活蛋白的第一片段,并且所述第二融合蛋白的所述目标蛋白质是补体激活蛋白的第二片段,其中所述补体激活蛋白的所述第一片段和所述补体激活蛋白的所述第二片段二聚化或折叠在一起;所述第一融合蛋白的所述目标蛋白质是Toll样受体蛋白的第一片段,并且所述第二融合蛋白的所述目标蛋白质是Toll样受体蛋白的第二片段,其中所述Toll样受体蛋白的所述第一片段和所述Toll样受体蛋白的所述第二片段二聚化或折叠在一起;所述第一融合蛋白的所述目标蛋白质是NOD2受体激动剂蛋白的第一片段,并且所述第二融合蛋白的所述目标蛋白质是NOD2受体激动剂蛋白的第二片段,其中所述NO D2受体激动剂蛋白的所述第一片段和所述NOD2受体激动剂蛋白的所述第二片段二聚化或折叠在一起;或所述第一融合蛋白的所述目标蛋白质是抗体或其片段的第一片段,并且所述第二融合蛋白的所述目标蛋白质是抗体或其片段的第二片段,其中所述抗体或其片段的所述第一片段和所述抗体或其片段的所述第二片段二聚化或折叠在一起。
实施方案149.根据实施方案148所述的组合物或试剂盒,其中:所述细胞毒性蛋白是蜜蜂蜂毒素、芋螺毒素、凯萨林菌素、防御素、protegrin或NK溶素;所述促凋亡蛋白是朊病毒蛋白、与半胱天冬酶级联相关的Bax衍生的最小前肽,或促凋亡肽(KLAKLAKh)2(SEQ IDNO:28);所述先天免疫***刺激蛋白是病原体相关分子模式(PAMP)或损伤相关分子模式(DAMP);所述补体激活蛋白是补体蛋白C3的C3a片段;所述Toll样受体(TLR)蛋白是热休克蛋白(hsp);所述NOD2受体激动剂蛋白是胞壁酰二肽激动剂;并且所述抗体片段是Fab、Fv或scFv。
实施方案150.根据实施方案130至147中任一项所述的组合物或试剂盒,其中:所述第一融合蛋白的所述目标蛋白质是超折叠GFP(sfGFP)的第一片段,并且所述第二融合蛋白的所述目标蛋白质是sfGFP的第二片段,其中所述sfGFP的所述第一片段和所述sfGFP的所述第二片段二聚化或折叠在一起;所述第一融合蛋白的所述目标蛋白质是海肾荧光素酶的第一片段,并且所述第二融合蛋白的所述目标蛋白质是海肾荧光素酶的第二片段,其中所述海肾荧光素酶的所述第一片段和所述海肾荧光素酶的第二片段二聚化或折叠在一起;所述第一融合蛋白的所述目标蛋白质是鼠二氢叶酸还原酶(DHFR)的第一片段,并且所述第二融合蛋白的所述目标蛋白质是DHFR的第二片段,其中所述DHFR的所述第一片段和所述DHFR的所述第二片段二聚化或折叠在一起;所述第一融合蛋白的所述目标蛋白质是酿酒酵母遍在蛋白的第一片段,并且所述第二融合蛋白的所述目标蛋白质是酿酒酵母遍在蛋白的第二片段,其中所述酿酒酵母遍在蛋白的所述第一片段和所述酿酒酵母遍在蛋白的所述第二片段二聚化或折叠在一起;所述第一融合蛋白的所述目标蛋白质是β-内酰胺酶的第一片段,并且所述第二融合蛋白的所述目标蛋白质是β-内酰胺酶的第二片段,其中所述β-内酰胺酶的所述第一片段和所述β-内酰胺酶的所述第二片段二聚化或折叠在一起;或所述第一融合蛋白的所述目标蛋白质是单纯疱疹病毒1型胸苷激酶的第一片段,并且所述第二融合蛋白的所述目标蛋白质是单纯疱疹病毒1型胸苷激酶的第二片段,其中所述单纯疱疹病毒1型胸苷激酶的所述第一片段和所述单纯疱疹病毒1型胸苷激酶的所述第二片段二聚化或折叠在一起。
实施方案151.根据实施方案150所述的组合物或试剂盒,其中:sfGFP的所述第一片段或所述第二片段包含氨基酸序列MRKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFARYPDHMKQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQ(SEQ ID NO:29),并且sfGFP的所述第一片段或所述第二片段中的另一个包含氨基酸序列KNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSVLSKDPNEKRDHMVLLEFVTAAGITHGMDELYK(SEQ ID NO:30);海肾荧光素酶的所述第一片段或所述第二片段包含氨基酸序列MASKVYDPEQRKRMITGPQWWARCKQMNVLDSFINYYDSEKHAENAVIFLHGNAASSYLWRHVVPHIEPVARCIIPDLIGMGKSGKSGNGSYRLLDHYKYLTAWFELLNLPKKIIFVGHDWGACLAFHYSYEHQDKIKAIVHAESVVDVIESWDEWPDIEEDIALIKSEEGEKMVLENNFFVETMLPSKIMRKLEPEEFAAYLEPFKEKGEVRRPTLSWPREIPLVKGG(SEQ ID NO:31),并且海肾荧光素酶的所述第一片段或所述第二片段中的另一个包含氨基酸序列KPDVVQIVRNYNAYLRASDDLPKMFIESDPGFFSNAIVEGAKKFPNTEFVKVKGLHFSQEDAPDEMGKYIKSFVERVLKNEQ(SEQ ID NO:32);DHFR的所述第一片段或所述第二片段包含其氨基酸1-105,并且DHFR的所述第一片段或所述第二片段中的另一个包含其氨基酸106-186;酿酒酵母遍在蛋白的所述第一片段或所述第二片段包含氨基酸序列MQIFVKTLTGKTITLEVESSDTIDNVKSKIQDKE(SEQ ID NO:33),并且酿酒酵母遍在蛋白的所述第一片段或所述第二片段中的另一个包含氨基酸序列GIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG(SEQ ID NO:34);β-内酰胺酶的所述第一片段或所述第二片段包含其氨基酸25-197,并且β-内酰胺酶的所述第一片段或所述第二片段中的另一个包含其氨基酸198-286;并且单纯疱疹病毒1型胸苷激酶的所述第一片段或所述第二片段包含其氨基酸1-265,并且单纯疱疹病毒1型胸苷激酶的所述第一片段或所述第二片段中的另一个包含其氨基酸266-376。
实施方案152.一种组合物或试剂盒,其包含:根据实施方案1、2或3至10中任一项所述的第一单倍体-配体复合物;根据实施方案1、2或3至10中任一项所述的第二单倍体-配体复合物;根据实施方案107至111或122至129中任一项所述的第一融合蛋白;以及根据实施方案107至111或122至129中任一项所述的第二融合蛋白;其中所述第一单倍体-配体复合物的所述配体与所述第一单倍体-配体复合物的所述多核苷酸的5’末端连接;其中所述第二单倍体-配体复合物的所述配体与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接;其中所述第一单倍体-配体复合物的所述多核苷酸与靶核酸分子基本上互补;其中所述第二单倍体-配体复合物的所述多核苷酸在与所述第一单倍体-配体复合物的所述多核苷酸在空间上接近的位点处与所述靶核酸分子基本上互补;其中所述第一单倍体-配体复合物的所述配体和所述第一融合蛋白的所述配体结合结构域可以相互作用;其中所述第二单倍体-配体复合物的所述配体和所述第二融合蛋白的所述配体结合结构域可以相互作用;并且其中所述第一融合蛋白的所述目标蛋白质的所述片段和所述第二融合蛋白的所述目标蛋白质的所述片段可以二聚化或折叠在一起。
实施方案153.一种组合物或试剂盒,其包含:根据实施方案1、2或11至18中任一项所述的第一单倍体-配体复合物;根据实施方案1、2或11至18中任一项所述的第二单倍体-配体复合物;根据实施方案107或112至129中任一项所述的第一融合蛋白;以及根据实施方案107或112至129中任一项所述的第二融合蛋白;其中所述第一单倍体-配体复合物的所述配体与所述第一单倍体-配体复合物的所述多核苷酸的5’末端连接;其中所述第二单倍体-配体复合物的所述配体与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接;其中所述第一单倍体-配体复合物的所述多核苷酸与靶核酸分子基本上互补;其中所述第二单倍体-配体复合物的所述多核苷酸在与所述第一单倍体-配体复合物的所述多核苷酸在空间上接近的位点处与所述靶核酸分子基本上互补;其中所述第一单倍体-配体复合物的所述配体和所述第一融合蛋白的所述配体结合结构域可以相互作用;其中所述第二单倍体-配体复合物的所述配体和所述第二融合蛋白的所述配体结合结构域可以相互作用;并且其中所述第一融合蛋白的所述目标蛋白质的所述片段和所述第二融合蛋白的所述目标蛋白质的所述片段可以二聚化或折叠在一起。
实施方案154.一种组合物或试剂盒,其包含:根据实施方案44至65中任一项所述的第一瓶形单倍体-配体复合物;根据实施方案1、2或3至10中任一项所述的第二单倍体-配体复合物,其中所述第二单倍体-配体复合物包含与和所述瓶形单倍体-配体复合物的所述配体连接的所述瓶形单倍体-配体复合物的所述茎部基本上互补的核苷酸部分;根据实施方案107至111或122至129中任一项所述的第一融合蛋白;以及根据实施方案107至111或122至129中任一项所述的第二融合蛋白;其中所述第一瓶形单倍体-配体复合物的所述配体和所述第一融合蛋白的所述配体结合结构域可以相互作用;其中所述第二单倍体-配体复合物的所述配体和所述第二融合蛋白的所述配体结合结构域可以相互作用;并且其中所述第一融合蛋白的所述目标蛋白质的所述片段和所述第二融合蛋白的所述目标蛋白质的所述片段可以二聚化或折叠在一起。
实施方案155.一种组合物或试剂盒,其包含:根据实施方案44至57或66至73中任一项所述的第一瓶形单倍体-配体复合物;根据实施方案1、2或11至18中任一项所述的第二单倍体-配体复合物,其中所述第二单倍体-配体复合物包含与和所述瓶形单倍体-配体复合物的所述配体连接的所述瓶形单倍体-配体复合物的所述茎部基本上互补的核苷酸部分;根据实施方案107或112至129中任一项所述的第一融合蛋白;以及根据实施方案107或112至129中任一项所述的第二融合蛋白;其中所述第一瓶形单倍体-配体复合物的所述配体和所述第一融合蛋白的所述配体结合结构域可以相互作用;其中所述第二单倍体-配体复合物的所述配体和所述第二融合蛋白的所述配体结合结构域可以相互作用;并且其中所述第一融合蛋白的所述目标蛋白质的所述片段和所述第二融合蛋白的所述目标蛋白质的所述片段可以二聚化或折叠在一起。
实施方案156.一种用于蛋白质的定向组装的方法,其包括:使靶核酸分子与根据实施方案1、2或3至10中任一项所述的第一单倍体-配体复合物接触;使所述靶核酸与根据实施方案1、2或3至10中任一项所述的第二单倍体-配体复合物接触;使所述第一单倍体-配体复合物与根据实施方案107至111或122至129中任一项所述的第一融合蛋白接触;以及使所述第二单倍体-配体复合物与根据实施方案107至111或122至129中任一项所述的第二融合蛋白接触;其中所述第一单倍体-配体复合物的所述配体与所述第一单倍体-配体复合物的所述多核苷酸的5’末端连接;其中所述第二单倍体-配体复合物的所述配体与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接;其中所述第一单倍体-配体复合物的所述多核苷酸与靶核酸分子基本上互补;其中所述第二单倍体-配体复合物的所述多核苷酸在与所述第一单倍体-配体复合物的所述多核苷酸在空间上接近的位点处与所述靶核酸分子基本上互补;其中所述第一单倍体-配体复合物的所述配体和所述第一融合蛋白的所述配体结合结构域可以相互作用;并且其中所述第二单倍体-配体复合物的所述配体和所述第二融合蛋白的所述配体结合结构域可以相互作用;从而导致所述第一融合蛋白的所述目标蛋白质的所述片段与所述第二融合蛋白的所述目标蛋白质的所述片段折叠或二聚化。
实施方案157.一种用于蛋白质的定向组装的方法,其包括:使靶核酸分子与根据实施方案1、2或11至18中任一项所述的第一单倍体-配体复合物接触;使所述靶核酸与根据实施方案1、2或11至18中任一项所述的第二单倍体-配体复合物接触;使所述第一单倍体-配体复合物与根据实施方案107或112至129中任一项所述的第一融合蛋白接触;以及使所述第二单倍体-配体复合物与根据实施方案107或112至129中任一项所述的第二融合蛋白接触;其中所述第一单倍体-配体复合物的所述配体与所述第一单倍体-配体复合物的所述多核苷酸的5’末端连接;其中所述第二单倍体-配体复合物的所述配体与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接;其中所述第一单倍体-配体复合物的所述多核苷酸与靶核酸分子基本上互补;其中所述第二单倍体-配体复合物的所述多核苷酸在与所述第一单倍体-配体复合物的所述多核苷酸在空间上接近的位点处与所述靶核酸分子基本上互补;其中所述第一单倍体-配体复合物的所述配体和所述第一融合蛋白的所述配体结合结构域可以相互作用;并且其中所述第二单倍体-配体复合物的所述配体和所述第二融合蛋白的所述配体结合结构域可以相互作用;从而导致所述第一融合蛋白的所述目标蛋白质的所述片段与所述第二融合蛋白的所述目标蛋白质的所述片段折叠或二聚化。
实施方案158.根据实施方案156或实施方案157所述的方法,其中所述第一单倍体-配体复合物的所述多核苷酸与所述第二单倍体-配体复合物的所述多核苷酸互补。
实施方案159.根据实施方案156或实施方案157所述的方法,其中所述第一单倍体-配体复合物的多核苷酸与所述靶核酸分子结合,在空间上接近所述第二单倍体-配体复合物的多核苷酸与所述靶核酸分子的结合。
实施方案160.根据实施方案156或实施方案157所述的方法,其中:所述第一单倍体-配体复合物的所述配体与所述第一单倍体-配体复合物的所述多核苷酸的5’末端连接,并且所述第一单倍体-配体复合物的所述多核苷酸与所述核酸靶标5’相邻于茎环结构的部分互补;并且所述第二单倍体-配体复合物的所述配体与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接,并且所述第二单倍体-配体复合物的所述多核苷酸与所述核酸靶标3’相邻于所述茎环结构的部分互补。
实施方案161.根据实施方案156或实施方案157所述的方法,其中:所述第一单倍体-配体复合物的所述配体与所述第一单倍体-配体复合物的所述多核苷酸的3’末端连接,并且所述第一单倍体-配体复合物的所述多核苷酸与所述核酸靶标的茎环结构的环结构的5’部分互补,其中所述环结构的所述5’部分与所述茎环结构的所述茎区域相邻;并且所述第二单倍体-配体复合物的所述配体与所述第二单倍体-配体复合物的所述多核苷酸的5’末端连接,并且所述第二单倍体-配体复合物的所述多核苷酸与所述核酸靶标的所述茎环结构的所述环结构的3’部分互补,其中所述环结构的所述3’部分与所述茎环结构的所述茎区域相邻。
实施方案162.一种用于蛋白质的定向组装的方法,其包括:使靶核酸分子与通过根据实施方案1、2或3至10中任一项所述的第一单倍体-配体复合物与根据实施方案107至111或122至129中任一项所述的第一融合蛋白的相互作用形成的复合物接触,其中所述第一单倍体-配体复合物的所述配体与所述第一单倍体-配体复合物的所述多核苷酸的5'末端连接,并且其中所述第一单倍体-配体复合物的所述配体与所述第一融合蛋白的所述配体结合结构域相互作用;以及使所述靶核酸分子与通过根据实施方案1、2或3至10中任一项所述的第二单倍体-配体复合物与根据实施方案107至111或122至129中任一项所述的第二融合蛋白的相互作用形成的复合物接触,其中所述第二单倍体-配体复合物的所述配体与所述第二单倍体-配体复合物的所述多核苷酸的5’末端连接,并且其中所述第二单倍体-配体复合物的所述配体与所述第二融合蛋白的所述配体结合结构域相互作用;从而导致所述第一融合蛋白的所述目标蛋白质的所述片段与所述第二融合蛋白的所述目标蛋白质的所述片段折叠或二聚化。
实施方案163.一种用于蛋白质的定向组装的方法,其包括:使靶核酸分子与通过根据实施方案1、2或11至18中任一项所述的第一单倍体-配体复合物与根据实施方案107或112至129中任一项所述的第一融合蛋白的相互作用形成的复合物接触,其中所述第一单倍体-配体复合物的所述配体与所述第一单倍体-配体复合物的所述多核苷酸的5'末端连接,并且其中所述第一单倍体-配体复合物的所述配体与所述第一融合蛋白的所述配体结合结构域相互作用;以及使所述靶核酸分子与通过根据实施方案1、2或11至18中任一项所述的第二单倍体-配体复合物与根据实施方案107或112至129中任一项所述的第二融合蛋白的相互作用形成的复合物接触,其中所述第二单倍体-配体复合物的所述配体与所述第二单倍体-配体复合物的所述多核苷酸的5’末端连接,并且其中所述第二单倍体-配体复合物的所述配体与所述第二融合蛋白的所述配体结合结构域相互作用;从而导致所述第一融合蛋白的所述目标蛋白质的所述片段与所述第二融合蛋白的所述目标蛋白质的所述片段折叠或二聚化。
实施方案164.根据实施方案162或实施方案163所述的方法,其中所述第一单倍体-配体复合物的所述多核苷酸与所述第二单倍体-配体复合物的所述多核苷酸互补。
实施方案165.根据实施方案162或实施方案163所述的方法,其中所述第一单倍体-配体复合物的多核苷酸与所述靶核酸分子结合,在空间上接近所述第二单倍体-配体复合物的多核苷酸与所述靶核酸分子的结合。
实施方案166.根据实施方案162或实施方案163所述的方法,其中:所述第一单倍体-配体复合物的所述配体与所述第一单倍体-配体复合物的所述多核苷酸的5’末端连接,并且所述第一单倍体-配体复合物的所述多核苷酸与所述核酸靶标5’相邻于茎环结构的部分互补;并且所述第二单倍体-配体复合物的所述配体与所述第二单倍体-配体复合物的所述多核苷酸的3’末端连接,并且所述第二单倍体-配体复合物的所述多核苷酸与所述核酸靶标3’相邻于所述茎环结构的部分互补。
实施方案167.根据实施方案162或实施方案163所述的方法,其中:所述第一单倍体-配体复合物的所述配体与所述第一单倍体-配体复合物的所述多核苷酸的3’末端连接,并且所述第一单倍体-配体复合物的所述多核苷酸与所述核酸靶标的茎环结构的环结构的5’部分互补,其中所述环结构的所述5’部分与所述茎环结构的所述茎区域相邻;并且所述第二单倍体-配体复合物的所述配体与所述第二单倍体-配体复合物的所述多核苷酸的5’末端连接,并且所述第二单倍体-配体复合物的所述多核苷酸与所述核酸靶标的所述茎环结构的所述环结构的3’部分互补,其中所述环结构的所述3’部分与所述茎环结构的所述茎区域相邻。
实施方案168.一种用于蛋白质的定向组装的方法,其包括:使靶核酸分子与根据实施方案44至57或58至65中任一项所述的瓶形单倍体-配体复合物接触;使所述靶核酸与根据实施方案1、2或3至10中任一项所述的第二单倍体-配体复合物接触,其中所述第二单倍体-配体复合物包含与和所述瓶形单倍体-配体复合物的所述配体连接的所述瓶形单倍体-配体复合物的所述茎部基本上互补的核苷酸部分;使所述瓶形单倍体-配体复合物与根据实施方案107至111或122至129中任一项所述的第一融合蛋白接触,其中所述瓶形单倍体-配体复合物的所述配体和所述第一融合蛋白的所述配体结合结构域可以相互作用;以及使所述第二单倍体-配体复合物与根据实施方案107至111或122至129中任一项所述的第二融合蛋白接触,其中所述第二单倍体-配体复合物的所述配体和所述第二融合蛋白的所述配体结合结构域可以相互作用;从而导致所述第一融合蛋白的所述目标蛋白质的所述片段与所述第二融合蛋白的所述目标蛋白质的所述片段折叠或二聚化。
实施方案169.一种用于蛋白质的定向组装的方法,其包括:使靶核酸分子与根据实施方案44至57或66至73中任一项所述的瓶形单倍体-配体复合物接触;使所述靶核酸与根据实施方案1、2或11至18中任一项所述的第二单倍体-配体复合物接触,其中所述第二单倍体-配体复合物包含与和所述瓶形单倍体-配体复合物的所述配体连接的所述瓶形单倍体-配体复合物的所述茎部基本上互补的核苷酸部分;使所述瓶形单倍体-配体复合物与根据实施方案107或112至129中任一项所述的第一融合蛋白接触,其中所述瓶形单倍体-配体复合物的所述配体和所述第一融合蛋白的所述配体结合结构域可以相互作用;以及使所述第二单倍体-配体复合物与根据实施方案107或112至129中任一项所述的第二融合蛋白接触,其中所述第二单倍体-配体复合物的所述配体和所述第二融合蛋白的所述配体结合结构域可以相互作用;从而导致所述第一融合蛋白的所述目标蛋白质的所述片段与所述第二融合蛋白的所述目标蛋白质的所述片段折叠或二聚化。
实施方案170.一种用于蛋白质的定向组装的方法,其包括:使靶核酸分子与根据实施方案44至65中任一项所述的瓶形单倍体-配体复合物接触;使所述靶核酸分子与根据实施方案1、2或3至10中任一项所述的第二单倍体-配体复合物接触,其中所述第二单倍体-配体复合物包含与和所述瓶形单倍体-配体复合物的所述配体连接的所述瓶形单倍体-配体复合物的所述茎部基本上互补的核苷酸部分;使所述瓶形单倍体-配体复合物与根据实施方案107至111或122至129中任一项所述的第一融合蛋白接触,其中所述瓶形单倍体-配体复合物的所述配体和所述第一融合蛋白的所述配体结合结构域可以相互作用;以及使所述第二单倍体-配体复合物与根据实施方案107至111或122至129中任一项所述的第二融合蛋白接触,其中所述第二单倍体-配体复合物的所述配体和所述第二融合蛋白的所述配体结合结构域可以相互作用;从而导致所述第一融合蛋白的所述目标蛋白质的所述片段与所述第二融合蛋白的所述目标蛋白质的所述片段折叠或二聚化。
实施方案171.一种用于蛋白质的定向组装的方法,其包括:使靶核酸分子与根据实施方案44至57或66至73中任一项所述的瓶形单倍体-配体复合物接触;使所述靶核酸分子与根据实施方案1、2或11至18中任一项所述的第二单倍体-配体复合物接触,其中所述第二单倍体-配体复合物包含与和所述瓶形单倍体-配体复合物的所述配体连接的所述瓶形单倍体-配体复合物的所述茎部基本上互补的核苷酸部分;使所述瓶形单倍体-配体复合物与根据实施方案107或112至129中任一项所述的第一融合蛋白接触,其中所述瓶形单倍体-配体复合物的所述配体和所述第一融合蛋白的所述配体结合结构域可以相互作用;以及使所述第二单倍体-配体复合物与根据实施方案107或112至129中任一项所述的第二融合蛋白接触,其中所述第二单倍体-配体复合物的所述配体和所述第二融合蛋白的所述配体结合结构域可以相互作用;从而导致所述第一融合蛋白的所述目标蛋白质的所述片段与所述第二融合蛋白的所述目标蛋白质的所述片段折叠或二聚化。
为了可以更有效地理解本文公开的主题,下文提供了实施例。应理解,这些实施例仅出于说明性目的且不应解释为以任何方式限制要求保护的主题。
实施例
实施例1.通过麦芽糖结合蛋白***表达c-Jun亮氨酸拉链结构域,并与特定寡核苷酸缀合形成LD-TAPER单倍体
将用于与寡核苷酸缀合形成小蛋白质相互作用结构域LD-TAPER单倍体的c-Jun片段在麦芽糖结合蛋白(MBP)***中表达为融合蛋白,然后利用肠激酶从MBP融合蛋白中释放。
每个c-Jun区段(携带N末端半胱氨酸或C末端半胱氨酸,如上所述)的编码序列装配有肠激酶识别信号(DDDDK的密码子;SEQ ID NO:35),使得在表达后,C末端MBP片段可以从麦芽糖结合载体蛋白上切割下来。将组装的序列克隆到pMALc5x(New England Biolabs)的XmnI位点与SbfI位点之间,并通过测序确认候选克隆的结构。将经过验证的克隆转化到菌株NEB-express(New England Biolabs)中,并在37℃、短期生长条件下在液体培养基(50ml)中增殖1.5小时,然后再用300μM IPTG诱导2小时。取出样品(“直接裂解物”;200μl),在1.5ml管中于1000x g下沉淀,用200μl的1X PBS洗涤一次,并且重悬于50μl的PBS中。将50ml生长物的其余部分沉淀(在Sorvall台式离心机中10分钟/3000rpm),并且在2.0mlEppendorf管中重悬于还含有1%蛋白酶抑制剂混合物(Sigma P3840)的1.5ml的冰冷麦芽糖结合蛋白***柱缓冲液(MC缓冲液:20mM Tris(pH 7.4)、200mM NaCl、1mM EDTA和1mMDTT)中。然后对细胞悬浮液进行超声处理(6x 5秒脉冲,5-设定值,Branson 450 Sonifier,在每轮超声处理之间冷却),以14000rpm离心5分钟(台式微量离心机),并将上清液转移到新管中。
表达为具有麦芽糖结合蛋白的融合体的多肽在直链淀粉磁珠(A-MB;New EnglandBiolabs)上进行亲和纯化。将合适的A-MB样品(通常相当于每1ml上清液250μl原始浆液)用1ml冷MC缓冲液洗涤两次(使用磁力分离以下拉A-MB),并重悬于原始体积中。将来自诱导的质粒培养物的超声处理的上清液与A-MB在4℃下混合1小时,将管频繁倒置以将珠子重悬。然后磁力除去上清液,并且用0.5ml冷MC缓冲液洗涤珠子四次,然后重悬于150μl的相同缓冲液/250μl原始珠子中。
用终浓度10mM的麦芽糖洗脱结合的蛋白质。通过向含有麦芽糖的MC缓冲液中添加2mM氯化钙同时进行洗脱和肠激酶处理。在洗脱/消化3小时后,将上清液磁力分离,用75μl的MC缓冲液处理沉淀,并将可溶相与第一上清液合并。然后对该产物的一部分进行琼脂糖亲和处理以除去肠激酶(EMD-Millipore),并保留非结合流经物。样品最初在TGX any-kD凝胶(BioRad)上分析,并用SYPRO-Ruby(ThermoFisher)染色。作为可溶性蛋白的两种c-JunMBP融合体的表达以非常高的水平发生(参见图23中的泳道1和2),显著超过所使用的A-MB的量的最大可保留量(参见,泳道1和2,相对于泳道3和4,图23)。在C末端半胱氨酸c-Jun片段的情况下,共洗脱的融合蛋白的肠激酶切割完全(参见,泳道6,图23),并且对于N末端半胱氨酸融合体,为大约80%(参见,泳道5,图23)。肠激酶除去后产物的回收率为大约75%(参见,泳道7和8,相对于泳道5和6,图23)。在两种情况下,肠激酶切割产生预期的MBP切割条带,但在所使用的条件下,小的c-Jun条带不可见。随后,将切割产物的样品在16%Tris-Tricine凝胶(ThermoFisher)上跑样并用Flamingo染色剂(BioRad)染色,在此之后N末端和C末端半胱氨酸c-Jun片段的预期的5.0kD和5.2kD条带(分别地)可以被可视化(参见泳道9-12,图23)。
由于两种c-Jun片段均缺乏内部半胱氨酸,因此它们很容易通过双官能马来酰亚胺试剂与硫醇标记的寡核苷酸缀合。使用双马来酰亚胺接头的缀合过程分两个阶段进行。最初,将携带5’或3’末端二硫化物修饰的寡核苷酸用100倍摩尔过量的TCEP在25℃下处理至少4小时,然后脱盐到10mM Tris(pH 7.4)中以除去TCEP和低分子量产物。然后将所得的-SH寡核苷酸用摩尔过量(500倍)的1,8-双(马来酰亚胺基)二乙二醇(BMP2,Sigma)在磷酸钠缓冲液pH 7.1中、25℃下处理4小时。然后将制备物再次脱盐以除去过量的BMP2。将修饰寡核苷酸的样品在8M尿素凝胶上跑样,与原始-SS-寡核苷酸和相应的衍生的-SH寡核苷酸进行比较,以检查该过程的成功。
第二阶段使用BMP2衍生化的寡核苷酸与具有N末端和C末端半胱氨酸残基的c-Jun片段交联。在处理之前,将裂解片段-MBP制备物用10倍摩尔过量的TCEP处理以确保半胱氨酸-SH基团被还原,然后用100mM氯化钠脱盐到磷酸盐缓冲液(pH 7.1)中。
将片段在相同的缓冲液中与大摩尔过量的BMP2衍生化的寡核苷酸一起温育以驱动反应,在25℃下进行4小时。然后通过用巯基磁珠(Bioclone)进行处理来除去过量的寡核苷酸(携带未反应的马来酰亚胺基团)。然后用PBSM透析多肽缀合物,并在-20℃下储存于50%甘油中。
实施例2:c-Jun单倍体与c-Fos多肽融合体在***蛋白LD-TAPER中的使用(预示性)
在c-Jun拉链片段用于实施LD-TAPER(通过构建具有5’和3’c-Jun标签的单倍体;参见实施例1)的情况下,在单倍体与靶模板杂交后,第二阶段使用具有互补的c-Fos拉链的融合蛋白。因此,对于利用小的相互作用的蛋白质结构域的***蛋白技术在LD-TAPER上的应用,将合适的蛋白质片段表达为N末端或C末端c-Fos融合体。使用超折叠GFP(sfGFP)和海肾荧光素酶片段。
锁定TAPER(参见图13)与c-Jun标签而不是小分子配体一起使用(参见图24)。第一瓶形单倍体的5’末端通过硫醇-马来酰亚胺化学与具有N末端半胱氨酸的c-Jun片段缀合,并且第二单倍体的3’末端与具有C末端半胱氨酸的c-Jun片段缀合(序列如上)。利用这种布置,在特定模板的存在下,在初始的第一瓶形单倍体反靶环部分“解锁”之后,拉链以反平行取向对齐(参见图24)。
Fos-融合蛋白序列如下(c-Fos序列以粗体示出,包括螺旋边界信号;加有双下划线的区段指示丝氨酸-甘氨酸接头):N末端sfGFP/C末端Fos: N末端Fos/C末端sfGFP: N末端海肾/C末端Fos: N末端Fos/C末端海肾:
出于表达目的,针对大肠杆菌K12优化所有蛋白质密码子。所有蛋白质表达为麦芽糖结合蛋白(MBP)融合体(参见实施例1),并通过用肠激酶处理从MBP载体中释放。
在初始实验方法“A”中,为了实施实验过程,将c-Jun第一瓶形单倍体与特定的靶模板(与其反靶环部分互补)一起温育,从而允许该第一瓶形单倍体的“解锁”,以及用于第二单倍体的杂交位点的暴露。在与第二单倍体形成双链体后,添加sfGFP和海肾N末端和C末端片段(如上)的c-Fos融合体的制备物。这允许进行LD-TAPER过程的第二阶段,其中c-Fos:c-Jun拉链配对,从而将多肽***蛋白对并置以用于成熟折叠(参见图25)。单倍体c-Jun标签的反平行取向(参见图24)有利于多肽的定位和取向(参见图25)。
sfGFP信号是最大发射与荧光素相同的荧光,并且通过具有荧光读取设施(Tecan)的分光光度计监测。使用腔肠素底物并且使用纯化的海肾荧光素酶(RayBiotech)作为阳性对照,通过用于该酶的商业试剂盒(Promega)评估海肾荧光素酶的酶促活性。通过标准光度计(Berthold)量化发光。
在剂量-反应实验设计中,将等摩尔量的sfGFP N末端和C末端Fos融合体与如上所述的在特定靶模板存在下“解锁”的第一阶段单倍体混合。N末端和C末端Fos融合体与单倍体的比率在1:1至10:1的范围内。用海肾N末端和C末端Fos融合体建立类似实验。在25℃下温育16小时后,在适当时对sfGFP和海肾荧光素酶的报告信号进行测定。
由于用于***蛋白折叠的同源配体LD-TAPER具有效率限制,如果单倍体/模板杂交作为第一步骤执行(如利用反应式4.1、4.2所示),除了实验方法“A”之外,根据反应式5.1和5.2,还进行第二(“B”)方案。此处,携带c-Jun标签的锁定TAPER第一瓶形单倍体(参见图24)如前文所述与模板杂交,但随后用N末端sfGFP或海肾C末端Fos融合体进行处理。在单独的反应中,用C末端sfGFP或海肾N末端融合体处理第二单倍体。在25℃下2小时后,将各个预组装的c-Jun单倍体/模板/c-Fos-多肽以等摩尔量混合。在25℃下温育16小时后,在适当时对sfGFP和海肾荧光素酶的报告信号进行测定。
对于两个实验设计“A”和“B”,在完成所有LD-TAPER组分的两阶段组装之后,还进行可比较时程实验。在方案“A”中,这对应于两种Jun-单倍体的初始杂交;然后添加***蛋白Fos-多肽;对于方案“B”,这对应于Jun-单倍体与特定***蛋白Fos-多肽的单独预组装,然后将两种单倍体复合物配混。对于每种布置,在一系列时间点采集可测定样品:15、30、45和60分钟;以及1、2、4、6、8和16小时。
模板介导的LD-TAPER组装的特异性可通过使用对应于与第二单倍体相同的序列但缺乏任何附连标签的阻断寡核苷酸来证实。摩尔过量的这种寡核苷酸有效地抑制组装反应,而组装过程不受相同长度但具有杂混序列的过量寡核苷酸的影响。
实施例3:具有突变型FKBP结合单价化合物的寡核苷酸缀合物在用于***蛋白LD-TAPER的LD-TAPER中的使用(预示性)
此实施例描述了用突变型FKBP结合单价化合物衍生化氨基标记的寡核苷酸,以及它们在用于小分子配体导向的***蛋白折叠的LD-TAPER中的应用。将化合物如FKM-NHS(参见图6)在DMSO中溶解至10mM,并且在具有待用作单倍体的寡核苷酸的磷酸钠缓冲液(pH7.4)中以100倍摩尔过量温育,其中寡核苷酸的5’或3'末端用可商购获得的氨基接头修饰。在25℃下2小时后,通过脱盐柱除去过量的未反应化合物,然后将所得的FKM-单倍体储存在(10/1.0)TE缓冲液中。通过测试相对于未处理的亲本寡核苷酸,在15%8M尿素凝胶上的产物迁移率来确认寡核苷酸:FKM加合物形成的成功。
携带作为小分子配体的FKM的单倍体接着适用于***蛋白研究。在此实施例中,使用锁定TAPER,如图13所示。多肽***蛋白靶标呈现为具有FKBP-1A的F36V突变体的融合蛋白。对于利用小分子配体的***蛋白技术在LD-TAPER上的应用,将合适的蛋白质片段表达为N末端或C末端突变型FKBP(F36V)融合体。使用超折叠GFP(sfGFP)和海肾荧光素酶片段。对于单倍体构建,锁定TAPER(参见图13)与用作小分子配体的FKM(参见图26)一起使用,其中如上所述进行其与单倍体寡核苷酸的缀合。
突变型FKBP(mFKBP)-融合蛋白序列如下(FKBP序列以粗体示出,用小写字母表示的F36V突变除外;加有双下划线的区段指示丝氨酸-甘氨酸接头):N末端sfGFP/C末端mFKBP: N末端mFKBP/C末端sfGFP: N末端海肾/C末端mFKBP: N末端mFKBP/C末端海肾:
出于表达目的,针对大肠杆菌K12优化所有蛋白质密码子。所有蛋白质表达为麦芽糖结合蛋白(MBP)融合体(参见实施例1),并通过用肠激酶处理从MBP载体中释放。
在初始实验方法“A”中,为了实施实验过程,将FKM-第一瓶形单倍体与特定的靶模板(与其环区域互补)一起温育,从而允许该第一单倍体的“解锁”,以及用于第二单倍体的杂交位点的暴露。在与第二FKM-单倍体形成双链体后(参见图26),添加sfGFP和海肾N末端和C末端片段(如上)的mFKBP融合体的制备物。这允许进行LD-TAPER过程的第二阶段,其中FKM-mFKBP结合,从而将多肽***蛋白对并置以用于成熟折叠(参见图27)。
sfGFP信号是最大发射与荧光素相同的荧光,并且通过具有荧光读取设施(Tecan)的分光光度计监测。使用腔肠素底物并且使用纯化的海肾荧光素酶(RayBiotech)作为阳性对照,通过用于该酶的商业试剂盒(Promega)评估海肾荧光素酶的酶促活性。通过标准光度计(Berthold)量化发光。
在剂量-反应实验设计中,将等摩尔量的sfGFP N末端和C末端mFKBP-融合体与如上所述的在特定靶模板存在下“解锁”的第一阶段FKM-单倍体混合。N末端和C末端mFKBP融合体与FKM-单倍体的比率在1:1至10:1的范围内。用海肾N末端和C末端mFKBP融合体建立类似实验。在25℃下温育16小时后,在适当时对sfGFP和海肾荧光素酶的报告信号进行测定。
由于用于***蛋白折叠的同源配体LD-TAPER具有效率限制,如果单倍体/模板杂交作为第一步骤执行(如利用反应式4.1、4.2所示),除了实验方法“A”之外,根据反应式5.1和5.2,还进行第二(“B”)方案。此处,携带其FKM标签的锁定TAPER第一瓶形单倍体(参见图26)如前文所述与模板杂交,但随后用N末端sfGFP或海肾C末端mFKBP融合体进行处理。在单独的反应中,用C末端sfGFP或海肾N末端mFKBP融合体处理第二FKM-单倍体。在25℃下2小时后,将各个预组装的FKM-单倍体/模板/mFKBP-多肽以等摩尔量混合。在25℃下温育16小时后,在适当时对sfGFP和海肾荧光素酶的报告信号进行测定。在温育时间期间,实现成熟的蛋白质折叠。应注意,长的丝氨酸-甘氨酸接头用于适应与其同源FKM单价配体结合的mFKBP结构域的取向(参见图27)。
对于两个实验设计“A”和“B”,在完成所有LD-TAPER组分的两阶段组装之后,还进行可比较时程实验。在方案“A”中,这对应于两种FKM-单倍体的初始杂交;然后添加***蛋白mFKBP-多肽;对于方案“B”,这对应于FKM-单倍体与特定***蛋白mFKBP-多肽的单独预组装,然后将两种单倍体复合物配混。对于每种布置,在一系列时间点采集可测定样品:15、30、45和60分钟;以及1、2、4、6、8和16小时。
模板介导的LD-TAPER组装的特异性可通过使用对应于与第二单倍体相同的序列但缺乏任何附连标签的阻断寡核苷酸来证实。摩尔过量的这种寡核苷酸有效地抑制组装反应,而组装过程不受相同长度但具有杂混序列的过量寡核苷酸的影响。
实施例4:使用FKBP和FRB二聚化结构域的半胱氨酸突变体时由Gaussia荧光素酶***蛋白测定测得的响应改善
此实施例描述了FKBP和FRB二聚化结构域的半胱氨酸突变体(分别为C22S和C61S)在利用Gaussia荧光素酶的***蛋白测定中的应用。在此情况下,使用同二聚化剂AP20187(Clontech Labs)将N末端Gaussia***蛋白片段-FKBP和FKBP-C末端Gaussia***蛋白片段融合体二聚化,且因此大大加快了Gaussia***蛋白组装。以同样的方式,使用异二聚化剂雷帕霉素(Sigma)将N末端Gaussia***蛋白片段-FKBP和FRB-C末端Gaussia***蛋白片段融合体二聚化,伴随着Gaussia组装速率增加。对于FKBP结构域,如上所述,在另外的F36V突变的背景下引入C22S半胱氨酸突变。
以标准方式在大肠杆菌中表达具有和不具有半胱氨酸突变的蛋白质片段,使得它们的纯化可以通过六组氨酸亲和标签,在固相固定化的金属亲和色谱(IMAC)珠(IMAC-Dynabeads,Thermofisher Scientific)上实现。以此方式纯化的蛋白质在16%Tricine凝胶上可视化(图28)。
N末端Gaussia***蛋白片段-FKBP单F36V突变体融合蛋白的序列是: 其中连字符划分(按顺序)N末端Gaussi a区段、丝氨酸-甘氨酸接头区段、C末端FKBP F36V突变体,以及六组氨酸标签,其中突变型缬氨酸残基(F36V)以粗体示出。
N末端Gaussia***蛋白片段-FKBP C22S/F36V双突变体融合蛋白的序列类似地是: 其中突变型缬氨酸(F36V)残基以粗体示出,并且突变型丝氨酸(C22S)残基加有下划线。
FKBP-C末端Gaussia***蛋白片段单FKBP F36V突变体融合蛋白的序列是: 其中连字符划分(按顺序)六组氨酸标签、短的丝氨酸甘氨酸接头、N末端FKBP区段、较长的丝氨酸-甘氨酸接头区段,以及C末端Gaussia序列,其中突变型FKBP缬氨酸残基(F36V)以粗体示出。
FKBP-C末端Gaussia***蛋白片段双FKBP C22S/F36V突变体融合蛋白的序列类似地是: 其中FKBP突变型缬氨酸(F36V)残基以粗体示出,并且突变型丝氨酸(C22S)残基加有下划线。
野生型FRB-C末端Gaussia***蛋白片段突变型C61S突变体融合蛋白的序列是:MHHHHHH-GGSG-EMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGRDLMEAQEWCRKYMKSGNVKDLTQAWDLYYHVFRRISKQ-GSGGGGSSGG-GEAIVDIPEIPGFKDLEPMEQFIAQVDLCVDCTTGCLKGLANVQCSDLLKKWLPQRCATFASKIQGQVDKIKGAGGD(SEQ ID NO:51),其中连字符划分(按顺序)六组氨酸标签、短的丝氨酸甘氨酸接头、N末端FRB区段、较长的丝氨酸-甘氨酸接头区段,以及C末端Gaussia序列。
C61S突变型FRB-C末端Gaussia***蛋白片段融合蛋白的序列类似地是:MHHHHHH-GGSG-EMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGRDLMEAQEWSRKYMKSGNVKDLTQAWDLYYHVFRRISKQ-GSGGGGSSGG-GEAIVDIPEIPGFKDLEPMEQFIAQVDLCVDCTTGCLKGLANVQCSDLLKKWLPQRCATFASKIQGQVDKIKGAGGD(SEQ ID NO:52),其中突变型丝氨酸(C61S)残基加有下划线。
在表达并用咪唑从IMAC磁珠上洗脱之后,对蛋白质进行测定(Bradford试剂)并在16%Tricine凝胶(Thermofisher)上可视化。
测定设置为20μl体积,其中蛋白质片段(单个或成对混合物)的终浓度为0.3μM,适当地具有或不具有AP20187或雷帕霉素(最终均为0.15μM)。在合适的时间点,取2μl样品并且在具有5mM溴化钠的50μl PBS中在具有腔肠素(最终2.5μM)的管中在Berthold光度计中测定发光。代表性数据在图29中示出。N末端Gaussia区段-FKBP-F36V融合体和FKBP-F36V-C末端Gaussia区段融合体的共同温育制备物在同二聚化因子AP20187的存在下显示出增强的反应(图29,小图1),而使用具有FKBP-F36V-C22S双突变的相应融合体观察到更大的等效反应(图29,小图2)。N末端Gaussia区段-FKBP-F36V融合体和野生型FRB-C末端Gaussia区段融合体的共同温育制备物在异二聚化因子雷帕霉素的情况下显示出显著增强(图29,小图3),这在与FRB C61S突变组合的FKBP-F36V-C22S双突变的背景下得到进一步促进(图29,小图4)。结果证实了二聚化因子在此背景下的功效,以及FKBP和FRB半胱氨酸-丝氨酸突变的功能。
实施例5:用MFL2单价FKBP配体形成寡核苷酸缀合物的展示
此实施例描述了特异性地利用MFL2(FKBP的F36V突变形式的单价配体)衍生化硫醇标记的寡核苷酸。将MFL2以100mM的浓度溶解于DMSO中。为了准备缀合,将5nmol在其5’或3’末端用二硫化物部分修饰的寡核苷酸(IDT Corp.)在50μl PBS中用1mM三羧乙基膦(TCEP)处理12-16小时,以还原二硫化物并且产生游离的硫醇基团。在此之后,将经过还原的寡核苷酸在Micro-Biospin P6柱(Bio-Rad)上脱盐到10mM Tris pH 7.4中,然后立即用于缀合。缀合反应以100μl体积,在50mM磷酸盐缓冲液pH 7.0/100mM NaCl中,利用4nmol经过还原的硫醇-寡核苷酸、2mM TCEP和400nmol MFL2(全部具有50%DMSO的终浓度)进行。使用100倍摩尔过量的MFL2驱动MFL2马来酰亚胺基部分与相关寡核苷酸上的硫醇基团之间的反应至完全;指定的DMSO水平对于保持疏水性MFL2分子在期望浓度下的溶解度是必要的。使反应在室温下进行12-16小时,然后通过用PBS平衡的Micro-Biospin P6柱,通过两轮连续的缓冲液交换从制备物中除去游离的MFL2。在变性的15%尿素凝胶上将缀合物制备物与相应的未修饰的硫醇-寡核苷酸进行比较。显然,在所用条件下,缀合反应基本上进行完全(图30)。
在此实施例中产生的缀合物是:#407-MFL2(3’缀合)GTCCAGATGTCTTTGC-MFL2(SEQID NO:44);#408-MFL2(3’缀合)GCTGTGTCCTGAAGAAA-MFL2(SEQ ID NO:45);#409-MFL2(5’缀合)MFL2-TTTCTTCAGGACACAGC(SEQ ID NO:46)。
实施例6:具有突变型FKBP结合单价化合物的寡核苷酸缀合物在用于***蛋白LD-TAPER的LD-TAPER中的使用
在此实施例中,利用架构1展示LD-TAPER,并且使用两种方法利用架构2展示LD-TAPER。
架构1
在此情况下,使携带5’(#409)或3’(#408)硫醇修饰的互补寡核苷酸与化合物MFL2反应(实施例5),并通过两轮通过预先PBS平衡的Micro-Biospin P6柱(Bio-Rad)而脱盐/缓冲液交换到PBS中。然后将所得的缀合物在室温下与经过纯化的与FKBP-F36V-C22S双突变结构域融合的Gaussia***蛋白区段一起温育1小时(图28),其中相应的未缀合oligo用作对照。N末端Gaussia-FKBP-F36V-C22S融合体(本实施例中的代码(C))因此与缀合物#408-MFL2(实施例5)或单独的对照#408一起温育,同时FKBP-F36V-C22S-C末端Gaussia融合体(本实施例中的代码(D))与缀合物#409-MFL2(实施例5)或单独的对照#409一起温育。各个制备物(最终15μl PBS)含有60pmol蛋白质片段和30pmol的缀合物或单独的寡核苷酸。FKBP结构域蛋白融合体和MFL2缀合物的相互作用产物构成特定类别的LD-TAPER单倍体。在此之后,将这些预温育物的5μl样品以分离形式或作为适当混合物使用,将体积调节至最终20μl。在合适的时间点,接着取2μl样品并且在具有5mM溴化钠的50μl PBS中在具有腔肠素(最终2.5μM)的管中在Berthold光度计中测定发光。三个时间点的数据在图31中示出。在互补的LD-TAPER单倍体(C)-#408MFL2和(D)-#409MFL2一起共同温育的情况下观察到随时间推移显著增加的发光,但是在与单独的未缀合oligo等效共同温育或呈分离形式的任何单倍体的情况下没有观察到这种效应(图31)。
架构2-固相捕获
在此策略中,使用携带5’脱硫生物素修饰的模板链。Gaussia-FKBP LD-TAPER单倍体(Gaussia荧光素酶-FKBP片段与MFL2修饰的寡核苷酸之间的复合物)可以相互空间接近地杂交到此模板上,从而实现Gaussia蛋白折叠组装和完全活性产生。此过程在图32中描绘,并且对应于架构2(图10)。对照未修饰寡核苷酸也可以与相同的模板杂交,但不能以相同方式在空间上迫使Gaussia片段并置。此程序的优点是来自自发的Gaussia自组装的背景发光显著降低。在杂交步骤之后,使模板和所有共杂交的分子与链霉抗生物素蛋白磁珠结合,并洗去所有其他溶液组分。在此之后,用游离D-生物素实现从磁珠洗脱,其通过其高得多的结合亲和力置换链霉抗生物素蛋白缔合的脱硫生物素标记的模板复合物。然后对各洗脱制备物进行Gaussia荧光素酶测定。具体地,在体积为18μl的PBS中,将120pmol的纯化Gaussia蛋白-FKBP融合体片段在室温下与60pmol寡核苷酸-MFL2复合物(图30)或相应的未修饰的硫醇-寡核苷酸一起温育1小时。在此之后,将7.5μl这些预温育反应物单独或组合地添加到25μl PBS的最终反应物中。在此实施例中,使用以下缩写:
N末端Gaussia片段-FKBP-F36V(代码=(A))
FKBP-F36V-C末端Gaussia片段(代码=(B))
N末端Gaussia片段-FKBP-F36V-C22S(代码=(C))
FKBP-F36V-C22S-C末端Gaussia片段(代码=(D))
鉴于以上代码和实施例5的寡核苷酸描述,LD-单倍体制备物是:
(A)-#407-MFL2
(B)-#409-MFL2
(C)-#407-MFL2
(D)-#409-MFL2
对照制备物使用与相应的未缀合寡核苷酸一起温育的相同的Gaussia-FKBP融合体片段。
将适当的蛋白质片段/缀合物/对照寡核苷酸制备物在室温下在25pmol的携带5’脱硫生物素部分的模板寡核苷酸(#230)的存在下温育30分钟:脱硫生物素-AGCTGTGTCCTGAAGAAAGCAAAGACATCTGGACA(SEQ ID NO:53)。
在此之后,向每个管中添加25μl(100μg)亲水性链霉抗生物素蛋白磁珠(NewEngland Biolabs,在1ml PBS中预洗涤两次并重悬于原始体积的PBS中),并在室温下再温育1小时。然后将珠子与上清液磁力分离,并用0.5ml PBS洗涤x1。将每个管中的磁珠沉淀重悬于50μl PBS中,并且添加游离的D-生物素至10mM,以用于30分钟/室温温育。然后通过磁力分离获取上清液,并且如实施例6一样测定各自2μl样品的Gaussia荧光素酶活性。结果在图33中示出,其中对于FKBP的F36V和F36V-C22S形式,仅在组合的N末端和C末端Gaussiaoligo-MFL2缀合物复合物(LD-TAPER单倍体)的情况下获得显著提高的发光读数。当用相应的未修饰寡核苷酸替换MFL2修饰的寡核苷酸时,未观察到此类反应(图33)。因此,该数据与在架构2模板化***中通过LD-TAPER介导的Gaussia片段的模板化组装一致。
架构2-溶液相
还研究了在溶液中通过架构2模板化***介导的LD-TAPER的实用性。对于与FKBP-F36V-C22S双突变结构域融合的Gaussia片段,以与以上架构2-固相捕获实施例相同的方式设置预温育。
在此情况下,在初始预温育之后,将LD-TAPER单倍体或用未修饰的硫醇寡核苷酸替换MFL2寡核苷酸缀合物的对照的组合与特定模板或具有与模板相同的长度和碱基组成的杂混寡核苷酸简单地混合。除了没有5’-脱硫生物素修饰之外,特定模板与以上模板寡核苷酸#230相同。杂混的对照oligo是:GACTAGACGGCCAGGGAGACGAATACATATTCAAT(SEQ ID NO:54)
然后以与实施例6相同的方式,以一定的时间间隔测定这些制备物的样品(2μl)的Gaussia荧光素酶活性。起始后2小时的结果(图34)显示,对于特定模板,观察到比杂混对照显著增加的发光信号(~2.5倍增加),再次与通过LD-TAPER单倍体实现的模板介导的Gaussia荧光素酶组装一致。因此,除了不存在脱硫生物素部分之外,模板化过程的性质与图32所示的性质一致。
除了本文所述的那些之外,由前文的描述,所述主题的各种修改对于本领域技术人员将是显而易见的。这些修改也旨在属于随附权利要求书的范围内。本申请中引用的每个参考文献(包括但不限于期刊文章、美国和非美国专利、专利申请公布、国际专利申请公布、基因库登录号等)均以引用的方式整体并入本文。
序列表
<110> TriBiotica LLC (特里比奥迪卡有限责任公司)
Dunn, Ian (伊恩·邓恩)
Lawler, Matthew (马修·劳勒)
<120> 通过模板化组装反应进行蛋白质的定向折叠组装或二聚化的方法
<130> 189156.00602
<150> 62424642
<151> 2016-11-21
<160> 54
<170> PatentIn 3.5版
<210> 1
<211> 47
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> N末端缀合物
<400> 1
Cys Ser Gly Gly Ala Ser Leu Glu Arg Ile Ala Arg Leu Glu Glu Lys
1 5 10 15
Val Lys Thr Leu Lys Ala Gln Asn Ser Glu Leu Ala Ser Thr Ala Asn
20 25 30
Met Leu Arg Glu Gln Val Ala Gln Leu Lys Gln Lys Gly Ala Pro
35 40 45
<210> 2
<211> 49
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> C末端缀合物
<400> 2
Ser Gly Ala Ser Leu Glu Arg Ile Ala Arg Leu Glu Glu Lys Val Lys
1 5 10 15
Thr Leu Lys Ala Gln Asn Ser Glu Leu Ala Ser Thr Ala Asn Met Leu
20 25 30
Arg Glu Gln Val Ala Gln Leu Lys Gln Lys Gly Ala Pro Ser Gly Gly
35 40 45
Cys
<210> 3
<211> 41
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> fos拉链
<400> 3
Ala Ser Arg Glu Leu Thr Asp Thr Leu Gln Ala Glu Thr Asp Gln Leu
1 5 10 15
Glu Asp Glu Lys Ser Ala Leu Gln Thr Glu Ile Ala Asn Leu Leu Lys
20 25 30
Glu Lys Glu Lys Leu Glu Gly Ala Pro
35 40
<210> 4
<211> 47
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> c-Jun的突变体
<400> 4
Cys Ser Gly Gly Ala Ser Leu Glu Arg Ile Ala Arg Leu Glu Glu Lys
1 5 10 15
Val Lys Ser Phe Lys Ala Gln Asn Ser Glu Asn Ala Ser Thr Ala Asn
20 25 30
Met Leu Arg Glu Gln Val Ala Gln Leu Lys Gln Lys Gly Ala Pro
35 40 45
<210> 5
<211> 49
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 具有C末端半胱氨酸残基的修饰序列
<400> 5
Ser Gly Ala Ser Leu Glu Arg Ile Ala Arg Leu Glu Glu Lys Val Lys
1 5 10 15
Ser Phe Lys Ala Gln Asn Ser Glu Asn Ala Ser Thr Ala Asn Met Leu
20 25 30
Arg Glu Gln Val Ala Gln Leu Lys Gln Lys Gly Ala Pro Ser Gly Gly
35 40 45
Cys
<210> 6
<211> 60
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> 瓶形单倍体
<400> 6
actcgagacg tctccttgtc tttgcttttc ttcaggacac agtggcgaga cgtctcgagt 60
<210> 7
<211> 51
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> 瓶形单倍体
<400> 7
actcgagacg tctccttcct gcccctcctc ctgctccgag acgtctcgag t 51
<210> 8
<211> 11
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> 第二单倍体-配体
<400> 8
agctctcgag t 11
<210> 9
<211> 12
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> 第二单倍体-配体
<400> 9
gacgtctcga gt 12
<210> 10
<211> 29
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> NZ结构域
<400> 10
Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu Leu Ala Gln Leu
1 5 10 15
Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala Gln
20 25
<210> 11
<211> 30
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> CZ结构域
<400> 11
Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys Leu Ala Gln
1 5 10 15
Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys Leu Ala Gln
20 25 30
<210> 12
<211> 46
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> c-jun结构域
<400> 12
Cys Ser Gly Ala Ser Leu Glu Arg Ile Ala Arg Leu Glu Glu Lys Val
1 5 10 15
Lys Ser Phe Lys Ala Gln Asn Ser Glu Asn Ala Ser Thr Ala Asn Met
20 25 30
Leu Arg Glu Gln Val Ala Gln Leu Lys Gln Lys Gly Ala Pro
35 40 45
<210> 13
<211> 43
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> c-Fos结构域
<400> 13
Ser Gly Ala Ser Arg Glu Leu Thr Asp Thr Leu Gln Ala Glu Thr Asp
1 5 10 15
Gln Leu Glu Asp Glu Lys Ser Ala Leu Gln Thr Glu Ile Ala Asn Leu
20 25 30
Leu Lys Glu Lys Glu Lys Leu Glu Gly Ala Pro
35 40
<210> 14
<211> 107
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> F36V FKBP突变型结构域
<400> 14
Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro
1 5 10 15
Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp
20 25 30
Gly Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe
35 40 45
Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala
50 55 60
Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr
65 70 75 80
Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr
85 90 95
Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu
100 105
<210> 15
<211> 108
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> F36V FKBP突变型结构域
<400> 15
Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe
1 5 10 15
Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu
20 25 30
Asp Gly Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys
35 40 45
Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val
50 55 60
Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp
65 70 75 80
Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala
85 90 95
Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu
100 105
<210> 16
<211> 43
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> c-jun结构域
<400> 16
Ala Ser Leu Glu Arg Ile Ala Arg Leu Glu Glu Lys Val Lys Ser Phe
1 5 10 15
Lys Ala Gln Asn Ser Glu Asn Ala Ser Thr Ala Asn Met Leu Arg Glu
20 25 30
Gln Val Ala Gln Leu Lys Gln Lys Gly Ala Pro
35 40
<210> 17
<211> 10
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 接头
<400> 17
Ala Gly Ser Ser Ala Ala Gly Ser Gly Ser
1 5 10
<210> 18
<211> 18
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 接头
<400> 18
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly
<210> 19
<211> 22
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 接头
<400> 19
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Ser Gly Gly Gly
20
<210> 20
<211> 26
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 接头
<400> 20
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly
20 25
<210> 21
<211> 15
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 接头
<400> 21
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
<210> 22
<211> 20
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 接头
<400> 22
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
Gly Gly Gly Gly
20
<210> 23
<211> 25
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 接头
<400> 23
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
Gly Gly Gly Gly Ser Gly Gly Gly Gly
20 25
<210> 24
<211> 5
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 接头
<400> 24
Ser Gly Gly Gly Ser
1 5
<210> 25
<211> 4
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 接头
<400> 25
Ser Gly Ser Gly
1
<210> 26
<211> 6
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 接头
<400> 26
Ser Gly Gly Gly Gly Ser
1 5
<210> 27
<211> 5
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 接头
<400> 27
Ser Gly Ser Gly Gly
1 5
<210> 28
<211> 14
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 促凋亡肽
<400> 28
Lys Leu Ala Lys Leu Ala Lys Lys Leu Ala Lys Leu Ala Lys
1 5 10
<210> 29
<211> 157
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 超折叠GFP (sfGFP)的片段
<400> 29
Met Arg Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1 5 10 15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu
20 25 30
Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile Cys
35 40 45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu
50 55 60
Thr Tyr Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln
65 70 75 80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
85 90 95
Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val
100 105 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile
115 120 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
130 135 140
Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln
145 150 155
<210> 30
<211> 81
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 超折叠GFP (sfGFP)的片段
<400> 30
Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp
1 5 10 15
Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly
20 25 30
Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser
35 40 45
Val Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu
50 55 60
Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr
65 70 75 80
Lys
<210> 31
<211> 229
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 海肾荧光素酶
<400> 31
Met Ala Ser Lys Val Tyr Asp Pro Glu Gln Arg Lys Arg Met Ile Thr
1 5 10 15
Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln Met Asn Val Leu Asp Ser
20 25 30
Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val Ile
35 40 45
Phe Leu His Gly Asn Ala Ala Ser Ser Tyr Leu Trp Arg His Val Val
50 55 60
Pro His Ile Glu Pro Val Ala Arg Cys Ile Ile Pro Asp Leu Ile Gly
65 70 75 80
Met Gly Lys Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp
85 90 95
His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys
100 105 110
Lys Ile Ile Phe Val Gly His Asp Trp Gly Ala Cys Leu Ala Phe His
115 120 125
Tyr Ser Tyr Glu His Gln Asp Lys Ile Lys Ala Ile Val His Ala Glu
130 135 140
Ser Val Val Asp Val Ile Glu Ser Trp Asp Glu Trp Pro Asp Ile Glu
145 150 155 160
Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu Gly Glu Lys Met Val Leu
165 170 175
Glu Asn Asn Phe Phe Val Glu Thr Met Leu Pro Ser Lys Ile Met Arg
180 185 190
Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu
195 200 205
Lys Gly Glu Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu Ile Pro
210 215 220
Leu Val Lys Gly Gly
225
<210> 32
<211> 82
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 海肾荧光素酶
<400> 32
Lys Pro Asp Val Val Gln Ile Val Arg Asn Tyr Asn Ala Tyr Leu Arg
1 5 10 15
Ala Ser Asp Asp Leu Pro Lys Met Phe Ile Glu Ser Asp Pro Gly Phe
20 25 30
Phe Ser Asn Ala Ile Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu
35 40 45
Phe Val Lys Val Lys Gly Leu His Phe Ser Gln Glu Asp Ala Pro Asp
50 55 60
Glu Met Gly Lys Tyr Ile Lys Ser Phe Val Glu Arg Val Leu Lys Asn
65 70 75 80
Glu Gln
<210> 33
<211> 34
<212> PRT
<213> 酿酒酵母(S. cerevisiae)
<400> 33
Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu
1 5 10 15
Val Glu Ser Ser Asp Thr Ile Asp Asn Val Lys Ser Lys Ile Gln Asp
20 25 30
Lys Glu
<210> 34
<211> 42
<212> PRT
<213> 酿酒酵母(S. cerevisiae)
<400> 34
Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys Gln Leu
1 5 10 15
Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu Ser Thr
20 25 30
Leu His Leu Val Leu Arg Leu Arg Gly Gly
35 40
<210> 35
<211> 5
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 肠激酶识别信号
<400> 35
Asp Asp Asp Asp Lys
1 5
<210> 36
<211> 216
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> N末端sfGFP/C末端Fos
<400> 36
Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1 5 10 15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu
20 25 30
Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile Cys
35 40 45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu
50 55 60
Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Arg
65 70 75 80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
85 90 95
Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Val Val
100 105 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Thr
115 120 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
130 135 140
Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Gly Gly Ser
145 150 155 160
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ala
165 170 175
Ser Arg Glu Leu Thr Asp Thr Leu Gln Ala Glu Thr Asp Gln Leu Glu
180 185 190
Asp Glu Lys Ser Ala Leu Gln Thr Glu Ile Ala Asn Leu Leu Lys Glu
195 200 205
Lys Glu Lys Leu Glu Gly Ala Pro
210 215
<210> 37
<211> 142
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> N末端Fos/C末端sfGFP
<400> 37
Ser Gly Ala Ser Arg Glu Leu Thr Asp Thr Leu Gln Ala Glu Thr Asp
1 5 10 15
Gln Leu Glu Asp Glu Lys Ser Ala Leu Gln Thr Glu Ile Ala Asn Leu
20 25 30
Leu Lys Glu Lys Glu Lys Leu Glu Gly Ala Pro Gly Gly Ser Gly Gly
35 40 45
Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Lys Asn Gly
50 55 60
Ile Lys Ala Asn Phe Thr Val Arg His Asn Val Glu Asp Gly Ser Val
65 70 75 80
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
85 90 95
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Thr Val Leu Ser
100 105 110
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu His Glu Tyr Val
115 120 125
Asn Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
130 135 140
<210> 38
<211> 288
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> N末端海肾/C末端Fos
<400> 38
Met Ala Ser Lys Val Tyr Asp Pro Glu Gln Arg Lys Arg Met Ile Thr
1 5 10 15
Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln Met Asn Val Leu Asp Ser
20 25 30
Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val Ile
35 40 45
Phe Leu His Gly Asn Ala Ala Ser Ser Tyr Leu Trp Arg His Val Val
50 55 60
Pro His Ile Glu Pro Val Ala Arg Cys Ile Ile Pro Asp Leu Ile Gly
65 70 75 80
Met Gly Lys Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp
85 90 95
His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys
100 105 110
Lys Ile Ile Phe Val Gly His Asp Trp Gly Ala Cys Leu Ala Phe His
115 120 125
Tyr Ser Tyr Glu His Gln Asp Lys Ile Lys Ala Ile Val His Ala Glu
130 135 140
Ser Val Val Asp Val Ile Glu Ser Trp Asp Glu Trp Pro Asp Ile Glu
145 150 155 160
Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu Gly Glu Lys Met Val Leu
165 170 175
Glu Asn Asn Phe Phe Val Glu Thr Met Leu Pro Ser Lys Ile Met Arg
180 185 190
Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu
195 200 205
Lys Gly Glu Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu Ile Pro
210 215 220
Leu Val Lys Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
225 230 235 240
Gly Gly Gly Ser Gly Gly Gly Ala Ser Arg Glu Leu Thr Asp Thr Leu
245 250 255
Gln Ala Glu Thr Asp Gln Leu Glu Asp Glu Lys Ser Ala Leu Gln Thr
260 265 270
Glu Ile Ala Asn Leu Leu Lys Glu Lys Glu Lys Leu Glu Gly Ala Pro
275 280 285
<210> 39
<211> 143
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> N末端Fos/C末端海肾
<400> 39
Ser Gly Ala Ser Arg Glu Leu Thr Asp Thr Leu Gln Ala Glu Thr Asp
1 5 10 15
Gln Leu Glu Asp Glu Lys Ser Ala Leu Gln Thr Glu Ile Ala Asn Leu
20 25 30
Leu Lys Glu Lys Glu Lys Leu Glu Gly Ala Pro Gly Gly Ser Gly Gly
35 40 45
Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Lys Pro Asp
50 55 60
Val Val Gln Ile Val Arg Asn Tyr Asn Ala Tyr Leu Arg Ala Ser Asp
65 70 75 80
Asp Leu Pro Lys Met Phe Ile Glu Ser Asp Pro Gly Phe Phe Ser Asn
85 90 95
Ala Ile Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu Phe Val Lys
100 105 110
Val Lys Gly Leu His Phe Ser Gln Glu Asp Ala Pro Asp Glu Met Gly
115 120 125
Lys Tyr Ile Lys Ser Phe Val Glu Arg Val Leu Lys Asn Glu Gln
130 135 140
<210> 40
<211> 282
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> N末端sfGFP/C末端mFKBP
<400> 40
Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1 5 10 15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu
20 25 30
Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile Cys
35 40 45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu
50 55 60
Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Arg
65 70 75 80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
85 90 95
Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Val Val
100 105 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Thr
115 120 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
130 135 140
Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Gly Gly Ser
145 150 155 160
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Gly
165 170 175
Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro Lys
180 185 190
Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp Gly
195 200 205
Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe Met
210 215 220
Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala Gln
225 230 235 240
Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr Ala
245 250 255
Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr Leu
260 265 270
Val Phe Asp Val Glu Leu Leu Lys Leu Glu
275 280
<210> 41
<211> 207
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> N末端mFKBP/C末端sfGFP
<400> 41
Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe
1 5 10 15
Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu
20 25 30
Asp Gly Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys
35 40 45
Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val
50 55 60
Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp
65 70 75 80
Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala
85 90 95
Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu Gly Gly Ser Gly
100 105 110
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Lys Asn
115 120 125
Gly Ile Lys Ala Asn Phe Thr Val Arg His Asn Val Glu Asp Gly Ser
130 135 140
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
145 150 155 160
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Thr Val Leu
165 170 175
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu His Glu Tyr
180 185 190
Val Asn Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
195 200 205
<210> 42
<211> 354
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> N末端海肾/C末端mFKBP
<400> 42
Met Ala Ser Lys Val Tyr Asp Pro Glu Gln Arg Lys Arg Met Ile Thr
1 5 10 15
Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln Met Asn Val Leu Asp Ser
20 25 30
Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val Ile
35 40 45
Phe Leu His Gly Asn Ala Ala Ser Ser Tyr Leu Trp Arg His Val Val
50 55 60
Pro His Ile Glu Pro Val Ala Arg Cys Ile Ile Pro Asp Leu Ile Gly
65 70 75 80
Met Gly Lys Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp
85 90 95
His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys
100 105 110
Lys Ile Ile Phe Val Gly His Asp Trp Gly Ala Cys Leu Ala Phe His
115 120 125
Tyr Ser Tyr Glu His Gln Asp Lys Ile Lys Ala Ile Val His Ala Glu
130 135 140
Ser Val Val Asp Val Ile Glu Ser Trp Asp Glu Trp Pro Asp Ile Glu
145 150 155 160
Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu Gly Glu Lys Met Val Leu
165 170 175
Glu Asn Asn Phe Phe Val Glu Thr Met Leu Pro Ser Lys Ile Met Arg
180 185 190
Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu
195 200 205
Lys Gly Glu Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu Ile Pro
210 215 220
Leu Val Lys Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
225 230 235 240
Gly Gly Gly Ser Gly Gly Gly Gly Val Gln Val Glu Thr Ile Ser Pro
245 250 255
Gly Asp Gly Arg Thr Phe Pro Lys Arg Gly Gln Thr Cys Val Val His
260 265 270
Tyr Thr Gly Met Leu Glu Asp Gly Lys Lys Val Asp Ser Ser Arg Asp
275 280 285
Arg Asn Lys Pro Phe Lys Phe Met Leu Gly Lys Gln Glu Val Ile Arg
290 295 300
Gly Trp Glu Glu Gly Val Ala Gln Met Ser Val Gly Gln Arg Ala Lys
305 310 315 320
Leu Thr Ile Ser Pro Asp Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly
325 330 335
Ile Ile Pro Pro His Ala Thr Leu Val Phe Asp Val Glu Leu Leu Lys
340 345 350
Leu Glu
<210> 43
<211> 208
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> N末端mFKBP/C末端海肾
<400> 43
Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe
1 5 10 15
Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu
20 25 30
Asp Gly Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys
35 40 45
Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val
50 55 60
Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp
65 70 75 80
Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala
85 90 95
Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu Gly Gly Ser Gly
100 105 110
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Lys Pro
115 120 125
Asp Val Val Gln Ile Val Arg Asn Tyr Asn Ala Tyr Leu Arg Ala Ser
130 135 140
Asp Asp Leu Pro Lys Met Phe Ile Glu Ser Asp Pro Gly Phe Phe Ser
145 150 155 160
Asn Ala Ile Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu Phe Val
165 170 175
Lys Val Lys Gly Leu His Phe Ser Gln Glu Asp Ala Pro Asp Glu Met
180 185 190
Gly Lys Tyr Ile Lys Ser Phe Val Glu Arg Val Leu Lys Asn Glu Gln
195 200 205
<210> 44
<211> 16
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> 缀合物
<400> 44
gtccagatgt ctttgc 16
<210> 45
<211> 17
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> 缀合物
<400> 45
gctgtgtcct gaagaaa 17
<210> 46
<211> 17
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> 缀合物
<400> 46
tttcttcagg acacagc 17
<210> 47
<211> 221
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> N末端Gaussia***蛋白片段-FKBP单F36V突变体融合蛋白
<400> 47
Met Lys Pro Thr Glu Asn Asn Glu Asp Phe Asn Ile Val Ala Val Ala
1 5 10 15
Ser Asn Phe Ala Thr Thr Asp Leu Asp Ala Asp Arg Gly Lys Leu Pro
20 25 30
Gly Lys Lys Leu Pro Leu Glu Val Leu Lys Glu Met Glu Ala Asn Ala
35 40 45
Arg Lys Ala Gly Cys Thr Arg Gly Cys Leu Ile Cys Leu Ser His Ile
50 55 60
Lys Cys Thr Pro Lys Met Lys Lys Phe Ile Pro Gly Arg Cys His Thr
65 70 75 80
Tyr Glu Gly Asp Lys Glu Ser Ala Gln Gly Gly Ile Gly Gly Ser Gly
85 90 95
Gly Gly Gly Ser Ser Gly Gly Gly Gly Val Gln Val Glu Thr Ile Ser
100 105 110
Pro Gly Asp Gly Arg Thr Phe Pro Lys Arg Gly Gln Thr Cys Val Val
115 120 125
His Tyr Thr Gly Met Leu Glu Asp Gly Lys Lys Val Asp Ser Ser Arg
130 135 140
Asp Arg Asn Lys Pro Phe Lys Phe Met Leu Gly Lys Gln Glu Val Ile
145 150 155 160
Arg Gly Trp Glu Glu Gly Val Ala Gln Met Ser Val Gly Gln Arg Ala
165 170 175
Lys Leu Thr Ile Ser Pro Asp Tyr Ala Tyr Gly Ala Thr Gly His Pro
180 185 190
Gly Ile Ile Pro Pro His Ala Thr Leu Val Phe Asp Val Glu Leu Leu
195 200 205
Lys Leu Glu Gly Gly Ser Gly His His His His His His
210 215 220
<210> 48
<211> 221
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> N末端Gaussia***蛋白片段-FKBP C22S / F36V双突变体融合蛋白
<400> 48
Met Lys Pro Thr Glu Asn Asn Glu Asp Phe Asn Ile Val Ala Val Ala
1 5 10 15
Ser Asn Phe Ala Thr Thr Asp Leu Asp Ala Asp Arg Gly Lys Leu Pro
20 25 30
Gly Lys Lys Leu Pro Leu Glu Val Leu Lys Glu Met Glu Ala Asn Ala
35 40 45
Arg Lys Ala Gly Cys Thr Arg Gly Cys Leu Ile Cys Leu Ser His Ile
50 55 60
Lys Cys Thr Pro Lys Met Lys Lys Phe Ile Pro Gly Arg Cys His Thr
65 70 75 80
Tyr Glu Gly Asp Lys Glu Ser Ala Gln Gly Gly Ile Gly Gly Ser Gly
85 90 95
Gly Gly Gly Ser Ser Gly Gly Gly Gly Val Gln Val Glu Thr Ile Ser
100 105 110
Pro Gly Asp Gly Arg Thr Phe Pro Lys Arg Gly Gln Thr Ser Val Val
115 120 125
His Tyr Thr Gly Met Leu Glu Asp Gly Lys Lys Val Asp Ser Ser Arg
130 135 140
Asp Arg Asn Lys Pro Phe Lys Phe Met Leu Gly Lys Gln Glu Val Ile
145 150 155 160
Arg Gly Trp Glu Glu Gly Val Ala Gln Met Ser Val Gly Gln Arg Ala
165 170 175
Lys Leu Thr Ile Ser Pro Asp Tyr Ala Tyr Gly Ala Thr Gly His Pro
180 185 190
Gly Ile Ile Pro Pro His Ala Thr Leu Val Phe Asp Val Glu Leu Leu
195 200 205
Lys Leu Glu Gly Gly Ser Gly His His His His His His
210 215 220
<210> 49
<211> 205
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> FKBP-C末端Gaussia***蛋白片段单FKBP F36V突变体融合蛋白
<400> 49
Met His His His His His His Gly Gly Ser Gly Gly Val Gln Val Glu
1 5 10 15
Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro Lys Arg Gly Gln Thr
20 25 30
Cys Val Val His Tyr Thr Gly Met Leu Glu Asp Gly Lys Lys Val Asp
35 40 45
Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe Met Leu Gly Lys Gln
50 55 60
Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala Gln Met Ser Val Gly
65 70 75 80
Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr Ala Tyr Gly Ala Thr
85 90 95
Gly His Pro Gly Ile Ile Pro Pro His Ala Thr Leu Val Phe Asp Val
100 105 110
Glu Leu Leu Lys Leu Glu Gly Ser Gly Gly Gly Gly Ser Ser Gly Gly
115 120 125
Gly Glu Ala Ile Val Asp Ile Pro Glu Ile Pro Gly Phe Lys Asp Leu
130 135 140
Glu Pro Met Glu Gln Phe Ile Ala Gln Val Asp Leu Cys Val Asp Cys
145 150 155 160
Thr Thr Gly Cys Leu Lys Gly Leu Ala Asn Val Gln Cys Ser Asp Leu
165 170 175
Leu Lys Lys Trp Leu Pro Gln Arg Cys Ala Thr Phe Ala Ser Lys Ile
180 185 190
Gln Gly Gln Val Asp Lys Ile Lys Gly Ala Gly Gly Asp
195 200 205
<210> 50
<211> 205
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> FKBP-C末端Gaussia***蛋白片段双FKBP C22S / F36V突变体融合蛋白的序列
<400> 50
Met His His His His His His Gly Gly Ser Gly Gly Val Gln Val Glu
1 5 10 15
Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro Lys Arg Gly Gln Thr
20 25 30
Ser Val Val His Tyr Thr Gly Met Leu Glu Asp Gly Lys Lys Val Asp
35 40 45
Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe Met Leu Gly Lys Gln
50 55 60
Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala Gln Met Ser Val Gly
65 70 75 80
Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr Ala Tyr Gly Ala Thr
85 90 95
Gly His Pro Gly Ile Ile Pro Pro His Ala Thr Leu Val Phe Asp Val
100 105 110
Glu Leu Leu Lys Leu Glu Gly Ser Gly Gly Gly Gly Ser Ser Gly Gly
115 120 125
Gly Glu Ala Ile Val Asp Ile Pro Glu Ile Pro Gly Phe Lys Asp Leu
130 135 140
Glu Pro Met Glu Gln Phe Ile Ala Gln Val Asp Leu Cys Val Asp Cys
145 150 155 160
Thr Thr Gly Cys Leu Lys Gly Leu Ala Asn Val Gln Cys Ser Asp Leu
165 170 175
Leu Lys Lys Trp Leu Pro Gln Arg Cys Ala Thr Phe Ala Ser Lys Ile
180 185 190
Gln Gly Gln Val Asp Lys Ile Lys Gly Ala Gly Gly Asp
195 200 205
<210> 51
<211> 188
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> 野生型FRB-C末端Gaussia***蛋白片段突变型C61S突变体融合蛋白的序列
<400> 51
Met His His His His His His Gly Gly Ser Gly Glu Met Trp His Glu
1 5 10 15
Gly Leu Glu Glu Ala Ser Arg Leu Tyr Phe Gly Glu Arg Asn Val Lys
20 25 30
Gly Met Phe Glu Val Leu Glu Pro Leu His Ala Met Met Glu Arg Gly
35 40 45
Pro Gln Thr Leu Lys Glu Thr Ser Phe Asn Gln Ala Tyr Gly Arg Asp
50 55 60
Leu Met Glu Ala Gln Glu Trp Cys Arg Lys Tyr Met Lys Ser Gly Asn
65 70 75 80
Val Lys Asp Leu Thr Gln Ala Trp Asp Leu Tyr Tyr His Val Phe Arg
85 90 95
Arg Ile Ser Lys Gln Gly Ser Gly Gly Gly Gly Ser Ser Gly Gly Gly
100 105 110
Glu Ala Ile Val Asp Ile Pro Glu Ile Pro Gly Phe Lys Asp Leu Glu
115 120 125
Pro Met Glu Gln Phe Ile Ala Gln Val Asp Leu Cys Val Asp Cys Thr
130 135 140
Thr Gly Cys Leu Lys Gly Leu Ala Asn Val Gln Cys Ser Asp Leu Leu
145 150 155 160
Lys Lys Trp Leu Pro Gln Arg Cys Ala Thr Phe Ala Ser Lys Ile Gln
165 170 175
Gly Gln Val Asp Lys Ile Lys Gly Ala Gly Gly Asp
180 185
<210> 52
<211> 188
<212> PRT
<213> 人工序列(artificial sequence)
<220>
<223> C61S突变型FRB-C末端Gaussia***蛋白片段融合蛋白的序列
<400> 52
Met His His His His His His Gly Gly Ser Gly Glu Met Trp His Glu
1 5 10 15
Gly Leu Glu Glu Ala Ser Arg Leu Tyr Phe Gly Glu Arg Asn Val Lys
20 25 30
Gly Met Phe Glu Val Leu Glu Pro Leu His Ala Met Met Glu Arg Gly
35 40 45
Pro Gln Thr Leu Lys Glu Thr Ser Phe Asn Gln Ala Tyr Gly Arg Asp
50 55 60
Leu Met Glu Ala Gln Glu Trp Ser Arg Lys Tyr Met Lys Ser Gly Asn
65 70 75 80
Val Lys Asp Leu Thr Gln Ala Trp Asp Leu Tyr Tyr His Val Phe Arg
85 90 95
Arg Ile Ser Lys Gln Gly Ser Gly Gly Gly Gly Ser Ser Gly Gly Gly
100 105 110
Glu Ala Ile Val Asp Ile Pro Glu Ile Pro Gly Phe Lys Asp Leu Glu
115 120 125
Pro Met Glu Gln Phe Ile Ala Gln Val Asp Leu Cys Val Asp Cys Thr
130 135 140
Thr Gly Cys Leu Lys Gly Leu Ala Asn Val Gln Cys Ser Asp Leu Leu
145 150 155 160
Lys Lys Trp Leu Pro Gln Arg Cys Ala Thr Phe Ala Ser Lys Ile Gln
165 170 175
Gly Gln Val Asp Lys Ile Lys Gly Ala Gly Gly Asp
180 185
<210> 53
<211> 35
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> 对照寡核苷酸
<400> 53
agctgtgtcc tgaagaaagc aaagacatct ggaca 35
<210> 54
<211> 35
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> 杂混的对照寡核苷酸
<400> 54
gactagacgg ccagggagac gaatacatat tcaat 35

Claims (15)

1.一种单倍体-配体复合物,其包含:
单倍体,其中所述单倍体包含与靶核酸分子基本上互补的多核苷酸;以及
与所述单倍体的5’或3’末端连接的配体,其中所述配体包含配体配偶体结合位点。
2.一种组合物或试剂盒,其包含根据权利要求1所述的第一单倍体-配体复合物和根据权利要求1所述的第二单倍体-配体复合物,其中:
所述第一单倍体-配体复合物的配体与所述第一单倍体-配体复合物的多核苷酸的5’末端连接;并且
所述第二单倍体-配体复合物的配体与所述第二单倍体-配体复合物的多核苷酸的3’末端连接。
3.一种瓶形单倍体-配体复合物,其包含:
a)瓶形单倍体,其中所述瓶形单倍体包含多核苷酸,其中所述多核苷酸包括:
i)第一茎部,其包括约10至约20个核苷酸碱基;
ii)反靶环部分,其包括约16至约40个核苷酸碱基且具有与所述第一茎部连接的第一末端,其中所述反靶环部分与靶核酸分子基本上互补;以及
iii)第二茎部,其包括与所述反靶环部分的第二末端连接的约10至约20个核苷酸碱基,其中所述第一茎部与所述第二茎部基本上互补;以及
b)与所述第一茎部或所述第二茎部的末端连接的配体,其中所述配体包含配体配偶体结合位点;
其中反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm
4.一种组合物或试剂盒,其包含:
根据权利要求3所述的瓶形单倍体-配体复合物;以及
第二单倍体-配体复合物,其包括:
包括约6至约20个核苷酸碱基的核苷酸部分,其与和所述瓶形单倍体-配体复合物的配体连接的所述瓶形单倍体-配体复合物的茎部基本上互补;以及
与所述第二单倍体-配体复合物的核苷酸部分的5’或3’末端连接的配体,其中所述配体包含配体配偶体结合位点;
其中第二单倍体-配体复合物:与所述瓶形单倍体-配体复合物的配体连接的第一或第二茎部的Tm小于或等于所述瓶形单倍体-配体复合物的第一茎部:第二茎部的Tm
5.一种化合物,其具有下式:
其中m为3至6;具有下式:
其中m为3至6;具有下式:
其中n为1至6;具有下式:
其中x为1至6;具有下式:
其中x为1至6;或具有下式:
6.一种融合蛋白,其包含与配体结合结构域融合的目标蛋白质的片段,其中所述配体结合结构域是FKBP结构域或FRB结构域。
7.一种组合物或试剂盒,其包含根据权利要求6所述的第一融合蛋白和根据权利要求6所述的第二融合蛋白,其中所述第一融合蛋白的目标蛋白质和所述第二融合蛋白的目标蛋白质可二聚化或折叠在一起。
8.一种用于蛋白质的定向组装的方法,其包括:
使靶核酸分子与根据权利要求1所述的第一单倍体-配体复合物接触;
使所述靶核酸与根据权利要求1所述的第二单倍体-配体复合物接触;
使所述第一单倍体-配体复合物与根据权利要求6所述的第一融合蛋白接触;以及
使所述第二单倍体-配体复合物与根据权利要求6所述的第二融合蛋白接触;
其中所述第一单倍体-配体复合物的配体与所述第一单倍体-配体复合物的多核苷酸的5’末端连接;
其中所述第二单倍体-配体复合物的配体与所述第二单倍体-配体复合物的多核苷酸的3’末端连接;
其中所述第一单倍体-配体复合物的多核苷酸与靶核酸分子基本上互补;
其中所述第二单倍体-配体复合物的多核苷酸在与所述第一单倍体-配体复合物的多核苷酸在空间上接近的位点处与所述靶核酸分子基本上互补;
其中所述第一单倍体-配体复合物的配体和所述第一融合蛋白的配体结合结构域可相互作用;并且
其中所述第二单倍体-配体复合物的配体和所述第二融合蛋白的配体结合结构域可相互作用;
从而导致所述第一融合蛋白的目标蛋白质的片段与所述第二融合蛋白的目标蛋白质的片段折叠或二聚化。
9.一种用于蛋白质的定向组装的方法,其包括:
使靶核酸分子与根据权利要求1所述的第一单倍体-配体复合物接触;
使所述靶核酸与根据权利要求1所述的第二单倍体-配体复合物接触;
使所述第一单倍体-配体复合物与根据权利要求6所述的第一融合蛋白接触;以及
使所述第二单倍体-配体复合物与根据权利要求6所述的第二融合蛋白接触;
其中所述第一单倍体-配体复合物的配体与所述第一单倍体-配体复合物的多核苷酸的5’末端连接;
其中所述第二单倍体-配体复合物的配体与所述第二单倍体-配体复合物的多核苷酸的3’末端连接;
其中所述第一单倍体-配体复合物的多核苷酸与靶核酸分子基本上互补;
其中所述第二单倍体-配体复合物的多核苷酸在与所述第一单倍体-配体复合物的多核苷酸在空间上接近的位点处与所述靶核酸分子基本上互补;
其中所述第一单倍体-配体复合物的配体和所述第一融合蛋白的配体结合结构域可相互作用;并且
其中所述第二单倍体-配体复合物的配体和所述第二融合蛋白的配体结合结构域可相互作用;
从而导致所述第一融合蛋白的目标蛋白质的片段与所述第二融合蛋白的目标蛋白质的片段折叠或二聚化。
10.一种用于蛋白质的定向组装的方法,其包括:
使靶核酸分子与通过根据权利要求1所述的第一单倍体-配体复合物与根据权利要求6所述的第一融合蛋白的相互作用形成的复合物接触,其中所述第一单倍体-配体复合物的配体与所述第一单倍体-配体复合物的多核苷酸的5’末端连接,并且其中所述第一单倍体-配体复合物的配体与所述第一融合蛋白的配体结合结构域相互作用;以及
使所述靶核酸分子与通过根据权利要求1所述的第二单倍体-配体复合物与根据权利要求6所述的第二融合蛋白的相互作用形成的复合物接触,其中所述第二单倍体-配体复合物的配体与所述第二单倍体-配体复合物的多核苷酸的5’末端连接,并且其中所述第二单倍体-配体复合物的配体与所述第二融合蛋白的配体结合结构域相互作用;
从而导致所述第一融合蛋白的目标蛋白质的片段与所述第二融合蛋白的目标蛋白质的片段折叠或二聚化。
11.一种用于蛋白质的定向组装的方法,其包括:
使靶核酸分子与通过根据权利要求1所述的第一单倍体-配体复合物与根据权利要求6所述的第一融合蛋白的相互作用形成的复合物接触,其中所述第一单倍体-配体复合物的配体与所述第一单倍体-配体复合物的多核苷酸的5’末端连接,并且其中所述第一单倍体-配体复合物的配体与所述第一融合蛋白的配体结合结构域相互作用;以及
使所述靶核酸分子与通过根据权利要求1所述的第二单倍体-配体复合物与根据权利要求6所述的第二融合蛋白的相互作用形成的复合物接触,其中所述第二单倍体-配体复合物的配体与所述第二单倍体-配体复合物的多核苷酸的5’末端连接,并且其中所述第二单倍体-配体复合物的配体与所述第二融合蛋白的配体结合结构域相互作用;
从而导致所述第一融合蛋白的目标蛋白质的片段与所述第二融合蛋白的目标蛋白质的片段折叠或二聚化。
12.一种用于蛋白质的定向组装的方法,其包括:
使靶核酸分子与根据权利要求3所述的瓶形单倍体-配体复合物接触;
使所述靶核酸与根据权利要求1所述的第二单倍体-配体复合物接触,其中所述第二单倍体-配体复合物包含与和所述瓶形单倍体-配体复合物的配体连接的所述瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;
使所述瓶形单倍体-配体复合物与根据权利要求6所述的第一融合蛋白接触,其中所述瓶形单倍体-配体复合物的配体和所述第一融合蛋白的配体结合结构域可相互作用;以及
使所述第二单倍体-配体复合物与根据权利要求6所述的第二融合蛋白接触,其中所述第二单倍体-配体复合物的配体和所述第二融合蛋白的配体结合结构域可相互作用;
从而导致所述第一融合蛋白的目标蛋白质的片段与所述第二融合蛋白的目标蛋白质的片段折叠或二聚化。
13.一种用于蛋白质的定向组装的方法,其包括:
使靶核酸分子与根据权利要求3所述的瓶形单倍体-配体复合物接触;
使所述靶核酸与根据权利要求1所述的第二单倍体-配体复合物接触,其中所述第二单倍体-配体复合物包含与和所述瓶形单倍体-配体复合物的配体连接的所述瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;
使所述瓶形单倍体-配体复合物与根据权利要求6所述的第一融合蛋白接触,其中所述瓶形单倍体-配体复合物的配体和所述第一融合蛋白的配体结合结构域可相互作用;以及
使所述第二单倍体-配体复合物与根据权利要求6所述的第二融合蛋白接触,其中所述第二单倍体-配体复合物的配体和所述第二融合蛋白的配体结合结构域可相互作用;
从而导致所述第一融合蛋白的目标蛋白质的片段与所述第二融合蛋白的目标蛋白质的片段折叠或二聚化。
14.一种用于蛋白质的定向组装的方法,其包括:
使靶核酸分子与根据权利要求3所述的瓶形单倍体-配体复合物接触;
使所述靶核酸分子与根据权利要求1所述的第二单倍体-配体复合物接触,其中所述第二单倍体-配体复合物包含与和所述瓶形单倍体-配体复合物的配体连接的所述瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;
使所述瓶形单倍体-配体复合物与根据权利要求6所述的第一融合蛋白接触,其中所述瓶形单倍体-配体复合物的配体和所述第一融合蛋白的配体结合结构域可相互作用;以及
使所述第二单倍体-配体复合物与根据权利要求6所述的第二融合蛋白接触,其中所述第二单倍体-配体复合物的配体和所述第二融合蛋白的配体结合结构域可相互作用;
从而导致所述第一融合蛋白的目标蛋白质的片段与所述第二融合蛋白的目标蛋白质的片段折叠或二聚化。
15.一种用于蛋白质的定向组装的方法,其包括:
使靶核酸分子与根据权利要求3所述的瓶形单倍体-配体复合物接触;
使所述靶核酸分子与根据权利要求1所述的第二单倍体-配体复合物接触,其中所述第二单倍体-配体复合物包含与和所述瓶形单倍体-配体复合物的配体连接的所述瓶形单倍体-配体复合物的茎部基本上互补的核苷酸部分;
使所述瓶形单倍体-配体复合物与根据权利要求6所述的第一融合蛋白接触,其中所述瓶形单倍体-配体复合物的配体和所述第一融合蛋白的配体结合结构域可相互作用;以及
使所述第二单倍体-配体复合物与根据权利要求6所述的第二融合蛋白接触,其中所述第二单倍体-配体复合物的配体和所述第二融合蛋白的配体结合结构域可相互作用;
从而导致所述第一融合蛋白的目标蛋白质的片段与所述第二融合蛋白的目标蛋白质的片段折叠或二聚化。
CN201780080921.5A 2016-11-21 2017-11-17 通过模板化组装反应进行蛋白质的定向折叠组装或二聚化的方法 Pending CN110121559A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662424642P 2016-11-21 2016-11-21
US62/424,642 2016-11-21
PCT/US2017/062267 WO2018094195A1 (en) 2016-11-21 2017-11-17 Methods for directed folding assembly or dimerization of proteins by templated assembly reactions

Publications (1)

Publication Number Publication Date
CN110121559A true CN110121559A (zh) 2019-08-13

Family

ID=62146710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780080921.5A Pending CN110121559A (zh) 2016-11-21 2017-11-17 通过模板化组装反应进行蛋白质的定向折叠组装或二聚化的方法

Country Status (5)

Country Link
US (2) US11253536B2 (zh)
EP (1) EP3541940A4 (zh)
JP (1) JP2019535281A (zh)
CN (1) CN110121559A (zh)
WO (1) WO2018094195A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022099058A1 (en) * 2020-11-09 2022-05-12 The General Hospital Corporation Methods of determining surface glycan density

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090044286A1 (en) * 2006-05-23 2009-02-12 Gambhir Sanjiv S Estrogen receptor intramolecular folding systems, estrogen receptor intramolecular folding sensors, methods of use thereof, methods of detecting ER ligands, and methods of detecting ER agonists and antagonists
WO2014197547A1 (en) * 2013-06-04 2014-12-11 Tribiotica Llc Methods and compositions for templated assembly of nucleic acid specific heterocompounds
US20150203841A1 (en) * 2004-11-22 2015-07-23 Peter Birk Rasmussen Template directed split and mix synthesis of small molecule libraries
US20170335314A1 (en) * 2016-05-23 2017-11-23 Tribiotica Llc Methods For Using Nucleic Acid Aptamers For Directed Templated Assembly
CN110191953A (zh) * 2016-11-21 2019-08-30 特里比奥迪卡有限责任公司 通过接近增强的反应性实现***蛋白模板组装的方法

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993020096A1 (en) 1991-05-08 1993-10-14 Stratagene Oligonucleotide libraries useful for producing primers
CA2105364A1 (en) * 1993-09-01 1995-03-02 Eric T. Kool Stem-loop oligonucleotides containing parallel and antiparallel binding domains
US5925517A (en) 1993-11-12 1999-07-20 The Public Health Research Institute Of The City Of New York, Inc. Detectably labeled dual conformation oligonucleotide probes, assays and kits
US5783683A (en) 1995-01-10 1998-07-21 Genta Inc. Antisense oligonucleotides which reduce expression of the FGFRI gene
ATE465149T1 (de) * 1996-02-28 2010-05-15 Ariad Pharma Inc Synthetische rapamycinderivate als multimerisierende wirkstoffe für chimere proteine mit von immunophilin abgeleiteten domänen
US20020172965A1 (en) 1996-12-13 2002-11-21 Arcaris, Inc. Methods for measuring relative amounts of nucleic acids in a complex mixture and retrieval of specific sequences therefrom
EP1208219A1 (en) 1999-04-08 2002-05-29 Pavel Sergeev Synthesis of biologically active compounds in cells
US7256259B2 (en) 2000-05-12 2007-08-14 Wisconsin Alumni Research Foundation Methods for ligation of molecules to surfaces
US7297494B2 (en) 2001-06-25 2007-11-20 Georgia Tech Research Corporation Activatable probes and methods for in vivo gene detection
WO2004011486A2 (fr) 2002-07-26 2004-02-05 Pierre Fabre Medicament Procede de solubilisation de peptides hydrophobes et leur utilisation pour generer une response de type ctl antitumorale ou anti-infectieuse
CN106337046B (zh) 2002-10-30 2021-03-23 纽韦卢森公司 合成双功能复合物的方法
US20060292438A1 (en) 2002-12-23 2006-12-28 Applera Corporation; Applied Biosystems Group Heteroconfigurational Polynucleotides and Methods of Use
WO2004088279A2 (en) 2003-03-28 2004-10-14 Iowa State University Research Foundation, Inc. Allosteric probes and methods
CN100381460C (zh) 2004-11-30 2008-04-16 北京市肿瘤防治研究所 Her-2模拟抗原表位及含有该表位的肽
US20060147963A1 (en) 2004-12-30 2006-07-06 Affymetrix, Inc. Detection of polynucleotides on nucleic acid arrays using azido-modified triphosphate nucleotide analogs
US20060223777A1 (en) 2005-03-29 2006-10-05 Dharmacon, Inc. Highly functional short hairpin RNA
US7795009B2 (en) 2005-06-15 2010-09-14 Saint Louis University Three-component biosensors for detecting macromolecules and other analytes
WO2007050811A2 (en) 2005-10-27 2007-05-03 The President And Fellows Of Harvard College Methods and compositions for labeling nucleic acids
DK1991273T4 (da) 2006-02-10 2022-02-07 Life Technologies Corp Mærkning og påvisning af post-translationelt modificerede proteiner
US8114636B2 (en) 2006-02-10 2012-02-14 Life Technologies Corporation Labeling and detection of nucleic acids
EP2992875A1 (en) 2006-04-20 2016-03-09 Silence Therapeutics GmbH Lipoplex formulations for specific delivery to vascular endothelium
JP2009535323A (ja) 2006-04-28 2009-10-01 サントル ナショナル ドゥ ラ ルシェルシュ シアンティフィク オリゴヌクレオチド誘導体を合成する方法
US7674924B2 (en) 2006-05-22 2010-03-09 Third Wave Technologies, Inc. Compositions, probes, and conjugates and uses thereof
WO2008019123A2 (en) 2006-08-04 2008-02-14 Georgia State University Research Foundation, Inc. Enzyme sensors, methods for preparing and using such sensors, and methods of detecting protease activity
JP5667043B2 (ja) 2008-04-15 2015-02-12 アメリカ合衆国GOVERNMENT OF THE UNITED STATES OF AMERICA, as represented by THE SECRETARY, DEPARTMENT OF HEALTHAND HUMAN SERVICES 阻害性オリゴヌクレオチドを送達するための組成物および方法
US8410247B2 (en) 2008-08-22 2013-04-02 Wisconsin Alumni Research Foundation Water-soluble phosphinothiol reagents
FI20095302A0 (fi) 2009-03-24 2009-03-24 Arctic Partners Oy Ab Luminesenssimääritysmenetelmä
CN101538613B (zh) 2009-04-28 2012-06-20 谭蔚泓 与疾病相关的分子探针及其制备方法
GB201001088D0 (en) 2010-01-23 2010-03-10 Trillion Genomics Ltd Detection
US20130323729A1 (en) 2010-10-29 2013-12-05 Olink Ab Proximity Ligation Technology for Western Blot Applications
WO2013012434A1 (en) 2011-07-15 2013-01-24 University Of Miami Bioluminescent stem-loop probes, compositions containing the same and methods utilizing the same
JP5952423B2 (ja) * 2011-12-15 2016-07-13 バイオニア コーポレーションBioneer Corporation 新規オリゴヌクレオチド接合体およびその用途
WO2014145047A1 (en) 2013-03-15 2014-09-18 Prognosys Biosciences, Inc. Methods for detecting peptide/mhc/tcr binding
US9983203B2 (en) 2014-02-13 2018-05-29 Ge Healthcare Bio-Sciences Ab Method for protein analysis
WO2015175747A1 (en) 2014-05-14 2015-11-19 Evorx Technologies, Inc. Barcoded peptides
EP3227476B1 (en) 2014-12-02 2021-02-24 Tribiotica Llc Methods and kits for theranostic applications
WO2016134232A1 (en) 2015-02-19 2016-08-25 Massachusetts Institute Of Technology Theranostic nanoprobes for overcoming cancer multidrug resistance and methods
CA2996313A1 (en) 2015-09-18 2017-03-23 Agrivida, Inc. Engineered phytases and methods of using the same

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150203841A1 (en) * 2004-11-22 2015-07-23 Peter Birk Rasmussen Template directed split and mix synthesis of small molecule libraries
US20090044286A1 (en) * 2006-05-23 2009-02-12 Gambhir Sanjiv S Estrogen receptor intramolecular folding systems, estrogen receptor intramolecular folding sensors, methods of use thereof, methods of detecting ER ligands, and methods of detecting ER agonists and antagonists
WO2014197547A1 (en) * 2013-06-04 2014-12-11 Tribiotica Llc Methods and compositions for templated assembly of nucleic acid specific heterocompounds
CN105358691A (zh) * 2013-06-04 2016-02-24 特里比奥迪卡有限责任公司 用于核酸特异性杂化合物的模板化装配的方法和组合物
US20170335314A1 (en) * 2016-05-23 2017-11-23 Tribiotica Llc Methods For Using Nucleic Acid Aptamers For Directed Templated Assembly
CN110191953A (zh) * 2016-11-21 2019-08-30 特里比奥迪卡有限责任公司 通过接近增强的反应性实现***蛋白模板组装的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
AARON GAJADHAR等: ""A proximity ligation assay using transiently transfected,epitope-tagged proteins:application for in situ detection of dimerized receptor tyrosine kinases"", 《BIOTECHNIQUES》 *
SUSAN ZIMNIK等: ""Mutually exclusive STAT1 modifications identified by Ubc9/substrate dimerization-dependent SUMOylation"", 《NUCLEIC ACIDS RES》 *
周孟华等: ""G蛋白偶联受体的二聚化及其意义"", 《现代医药卫生》 *

Also Published As

Publication number Publication date
EP3541940A1 (en) 2019-09-25
JP2019535281A (ja) 2019-12-12
WO2018094195A1 (en) 2018-05-24
US20220387471A1 (en) 2022-12-08
EP3541940A4 (en) 2020-10-14
US11253536B2 (en) 2022-02-22
US20190314397A1 (en) 2019-10-17

Similar Documents

Publication Publication Date Title
ES2402878T3 (es) Aislamiento de moduladores biológicos a partir de colecciones de fragmentos génicos biodiversos
AU2014229994B2 (en) Modification of polypeptides
JP4697982B2 (ja) モジュラートランスフェクション系
CN109563537B (zh) 使用核酸适体用于导向的模板化组装的方法
JPH08506487A (ja) 全合成親和性試薬
Navaratna et al. Directed evolution using stabilized bacterial peptide display
CA2950117C (en) Methods and compositions for templated assembly of nucleic acid specific heterocompounds
JP2021500851A (ja) モジュラー結合タンパク質
Almeida et al. Encapsulin nanocages: Protein encapsulation and iron sequestration
Deng et al. Synthesis and characterization of heterodimers and fluorescent nisin species by incorporation of methionine analogues and subsequent click chemistry
CN110191953A (zh) 通过接近增强的反应性实现***蛋白模板组装的方法
JP2002503453A (ja) 細胞毒性ヘテロメリックタンパク質組合せライブラリー
CN110121559A (zh) 通过模板化组装反应进行蛋白质的定向折叠组装或二聚化的方法
Subramanian et al. Enzyme-Directed Functionalization of Designed, Two-Dimensional Protein Lattices
Mukai et al. Creation of novel Protein Transduction Domain (PTD) mutants by a phage display-based high-throughput screening system
Macyszyn et al. Conjugates of aminoglycosides with stapled peptides as a way to target antibiotic-resistant bacteria
CN117203224A (zh) 包括封装在其中的客体货物的人工蛋白笼
Ghosh Artificial Genetically Encoded Peptides and Proteins as Next-Generation Therapeutics: Selection of ligands for Mycobacterium tuberculosis UDP-Galactopyranose Mutase as Potential Inhibitors.
Subramanian Design and Functionalization of Artificial Protein Assemblies via Biologically Inspired Interactions
JP2024507901A (ja) その中にカプセル化されたゲストカーゴを含む人工タンパク質ケージ
Billerbeck Small Functional Peptides and Their Application in Superfunctionalizing Proteins
Ormonde Engineering protein folding and interactions: Towards potential novel therapeutic interventions
WO2022099055A1 (en) Template assembly by proximity-enhanced reactivity via metabolic labeling
Sawyer Modular Design and Selection of Phosphospecific Tetratricopeptide Repeat Affinity Proteins
Barreto A genetic screen to isolate “lariat” peptide inhibitors of protein function

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190813