CN110621322A - 用异双功能性化合物进行的可调节的内源性蛋白质降解 - Google Patents

用异双功能性化合物进行的可调节的内源性蛋白质降解 Download PDF

Info

Publication number
CN110621322A
CN110621322A CN201880024547.1A CN201880024547A CN110621322A CN 110621322 A CN110621322 A CN 110621322A CN 201880024547 A CN201880024547 A CN 201880024547A CN 110621322 A CN110621322 A CN 110621322A
Authority
CN
China
Prior art keywords
acid sequence
amino acid
protein
dtag
heterobifunctional compound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880024547.1A
Other languages
English (en)
Inventor
D·巴克利
G·温特
A·J·菲利普斯
T·P·赫弗南
J·布拉德纳
J·罗伯茨
B·纳贝特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dana Farber Cancer Institute Inc
Original Assignee
Dana Farber Cancer Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dana Farber Cancer Institute Inc filed Critical Dana Farber Cancer Institute Inc
Publication of CN110621322A publication Critical patent/CN110621322A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/37Digestive system
    • A61K35/407Liver; Hepatocytes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0025Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0083Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the administration regime
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/04Antineoplastic agents specific for metastasis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/104Aminoacyltransferases (2.3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/95Fusion polypeptide containing a motif/fusion for degradation (ubiquitin fusions, PEST sequence)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y502/00Cis-trans-isomerases (5.2)
    • C12Y502/01Cis-trans-Isomerases (5.2.1)
    • C12Y502/01008Peptidylprolyl isomerase (5.2.1.8), i.e. cyclophilin

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Medicinal Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Epidemiology (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nutrition Science (AREA)
  • Virology (AREA)
  • Physiology (AREA)
  • Cell Biology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Oncology (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了一种以避免与CRISPR内源性蛋白质敲除或敲入策略和提供单核苷酸校正或改变的策略相关的问题的方式调节体内基因表达的方法。本发明包含将编码异双功能性化合物靶向蛋白(dTAG)的核苷酸与编码感兴趣的内源性表达蛋白的基因的核苷酸序列框内***基因组中,该基因在表达时产生内源性蛋白质‑dTAG杂合蛋白。这允许使用异双功能性化合物的该dTAG和该融合的内源性蛋白质的靶向蛋白降解。

Description

用异双功能性化合物进行的可调节的内源性蛋白质降解
相关申请案
本申请主张2017年2月8日提交的临时美国专利申请案第 62/456,654号和2017年2月9日提交的临时美国专利申请案第 62/457,127号的权益。这些申请案的全部内容通过引用并入本文以 进行所有目的。
引用方式而并入
名称为“16010-025WO1_sequencelisting_ST25.txt”的文本文件 的内容是在2018年1月26日创建,大小为287千字节,通过引用 方式整体并入本文。
技术领域
本发明描述了使用靶向蛋白降解调节内源性表达蛋白质的方法、 化合物和组合物。
背景技术
已经开发了许多工具来操纵基因表达以询问感兴趣的基因或蛋白 质的功能。例如,诸如RNA干扰和反义脱氧寡核苷酸的技术通常用 于破坏RNA和DNA水平的蛋白质表达。同源重组或功能丧失突变 可以使用锌指核酸酶、转录激活因子样效应核酸酶(TALEN)或聚集 调节间隙短回文重复(CRISPR)-Cas9进行位点特异性双股断裂 (Cheng,J.K.andAlper,H.S.,“The genome editing toolbox:a spectrum of approaches for targetedmodification”Curr.Opin. Biotechnol.,30C,(2014):87-94;和Graham et al.,GenBiol, (2015):16:260)。CRISPR-Cas9***已用于通过将特定突变并入感兴 趣的基因来调节内源性基因表达(参见,例如,Lo et al.,Genetics, 2013;195(2):331-348;Yu et al.,Biology Open,2014;3:271-280; Park et al.,PLOS One,2013;9(4):e95101;Lackner etal.,Nature Communications,2015;17(6):1-7;美国专利第8,771,945和 9,228,208号;WO2014/204729;以及美国专利申请案 2014/0273235)。
例如,CRISPR-Cas9***用于在携带人肝细胞的嵌合肝脏-人源 化小鼠中突变人类PCSK9基因(Wang,X.,et al."CRISPR-Cas9 Targeting of PCSK9 in HumanHepatocytes In Vivo." Arteriosclerosis,Thrombosis,and Vascular Biology,(2016))。 PCSK9成功突变,并且已提出CRISPR-Cas9***可用作体内治疗人 类疾病的方法。然而,永久性基因组修饰的长期影响尚不清楚,并且 存在关于基因组编辑的不完全精确性,及病毒传递的CRISPR-Cas9 的连续活性以及成人可能存在的生物补偿机制对直接校正的影响 (Kormann et al.,“Expression of therapeutic proteins after deliveryof chemically modified mRNA in mice”Nat.Biotechnol.,29, (2011):154-157;Cho etal.,“Analysis of off-target effects of CRISPR/Cas-derived RNA-guidedendonucleases and nickases.” Genome Res.,24,(2014):132-141)。此外,在表达的蛋白质(即使不 完美)对细胞功能必不可少的情况下,CRISPR敲除策略可能是不合 需要的。
已经努力使用诱导型降解***在体外调节基因表达。例如,植物 中的植物生长素诱导降解(AID)***已经能够控制酵母和培养的脊椎 动物细胞中的蛋白质消耗。该***依赖于植物特异性F盒蛋白TIR1 的表达,其调节响应于植物激素生长素的植物生长和形态发生的多个 方面。TIR1是Skp1-Cullin-F-box E3泛素连接酶复合物的底物识别 组分,其仅在生长素存在下识别底物,并靶向它们以被蛋白酶体降解。 该***已经***作并显示出能够在秀丽隐杆线虫(Caenorhabditis elegans)以及人HCT116细胞中产生条件性生长素依赖性蛋白质消耗 (参见,例如,Zhang et al.,Development,2015;142:4374-4384 andNatsume et al.,Cell Reports,2016;15:210-218)。然而,由于生长素 的毒性,这种方法作为体内调节***是不切实际的。
可逆控制基因表达的另一种方法是使用配体依赖性去稳定结构域 和Shield-1配体,其允许以剂量依赖性方式对标记的感兴趣的蛋白 质进行可逆的稳定化和去稳定化(参见,例如,Rakhit et al., Chemistry&Biology,2014;21:1238-1252)。将去稳定结构域与感 兴趣的基因融合导致表达融合蛋白,其被蛋白酶体降解。Shield-1特 异性结合去稳定化结构域并使蛋白质降解失活。然而,由于需要在细 胞质中存在Sield-1以避免降解,该***作为体内调节策略也不可行。 这种方法需要持续给药Shield-1以维持蛋白质稳定性。
因此,仍然存在对改进的***的未满足的需求,该改进的***允 许在体内可逆地控制内源性基因表达,同时在患有诸如蛋白病的病症 的受试者中提供改善的治疗方式。
因此,本发明的一个目的是提供方法、化合物和组合物,以避 免与CRISPR内源性蛋白质敲除或敲入策略相关的问题的方式调节 体内基因表达。
发明内容
本发明提供了一种以避免与CRISPR内源性蛋白质敲除或敲入策 略和提供单一核苷酸校正或改变的策略相关的问题的方式调节体内基 因表达的方法。本发明包括将编码异双功能性化合物靶向蛋白(dTAG) 的核苷酸与编码感兴趣的内源性表达蛋白的基因的核苷酸序列同框插 入基因组中,该基因在表达时产生内源性蛋白质-dTAG杂合蛋白。 这允许以受控的可调节方式使用异双功能性化合物来靶向蛋白降解 dTAG和融合的内源性蛋白质。
如本文所考虑的异双功能性化合物是在体内通过泛素连接酶结合 部分与泛素连接酶结合并且还通过其dTAG靶向配体与dTAG结合 的化合物,如下文更详细地定义。异双功能性化合物能够经由募集 E3泛素连接酶和随后的泛素化来诱导蛋白酶体介导的融合内源性蛋 白质的降解。这些类似药物的分子提供了对蛋白质水平的可逆、剂量 反应、可调节、暂时控制的可能性。
与将不可逆变化并入感兴趣的基因中的CRISPR-Cas9基因组编 辑相比,使用异双功能性化合物以dTAG靶向内源性表达的蛋白质 允许可逆地控制感兴趣的内源性表达的蛋白质。因此,异双功能性化 合物可用作蛋白质表达的变阻器(rheostat),提供在滴定异双功能性 化合物时开启和关闭内源性蛋白质表达的能力。此外,通过基因组和 稳定地将编码dTAG的核酸序列整合到内源性蛋白质的基因的5'或 3'中,可以避免与CRISPR-Cas9相关的副作用,例如与永久编辑基 因相关的负面下游后果。
本发明提供了通过将基因组工程与小分子活化/降解调节相结合 来控制介导疾病的内源性蛋白质降解的机制。本文所述的方法和组合 物特别适用于靶向与疾病相关的内源性蛋白质,这是由于蛋白质可能 参与的获得功能,毒性积累,过表达或下游酶促过程。该技术的应用 包括但不限于1)蛋白质的靶向降解,其中病理学是获得功能的突变 的结果,2)蛋白质的靶向降解,其中病理学是扩增或增加的表达的功 能,3)作为单基因疾病表现的蛋白质的靶向降解,4)蛋白质的靶向 降解,其中遗传易感性表现出较长时间并且通常在替代的生物学补偿 机制不再足够之后,例如但不限于高胆固醇血症和蛋白质病。
因此,在一个具体例中,提供了一种方法,其至少包括以下步骤:
(i)用编码dTAG的核酸序列转化受试者(通常是人类)的相关细 胞,其中该核酸序列与内源性蛋白质的核酸序列在框架内基 因组整合,该内源性蛋白质充当疾病介质,其中编码dTAG 的核酸***基因组序列中,在表达时产生内源性蛋白质- dTAG杂合体或融合蛋白;和
(ii)根据需要向受试者给药异双功能性化合物,该异双功能性化 合物以使dTAG(和因此内源性蛋白质-dTAG杂合蛋白)接近 泛素连接酶的方式结合a)***的dTAG和b)泛素连接酶,使 内源性蛋白质-dTAG杂合蛋白泛素化,然后被蛋白酶体降解。
在一个具体例中,受试者的细胞在体内转化。在一个具体例中, 将受试者的细胞离体转化并给药回受试者。在一个具体例中,受试者 的细胞是肝细胞。
在一个具体例中,提供了一种方法,包括以下步骤:
根据需要向受试者给药异双功能性化合物,其中该受试者具有一 个或多个已用编码dTAG的核酸序列转化的细胞,其中该核酸序列 用作为疾病介质的内源性蛋白质的核酸序列定向,在基因组中以5'或 3'内框内整合,其中编码dTAG的核酸***基因组序列,在蛋白质表 达时产生内源性蛋白质-dTAG杂合体或融合蛋白质;并且其中异双功 能性化合物以使dTAG(和因此内源性蛋白质-dTAG杂合蛋白)接近泛 素连接酶的方式结合a)***的dTAG和b)泛素连接酶,使得内源性 蛋白质-dTAG杂合蛋白被泛素化,然后被蛋白酶体降解。
如本文所考虑的,编码感兴趣的内源性蛋白质-dTAG杂合体的 合成基因通过将编码dTAG的核酸以5'或3'靶向框内***编码感兴 趣的蛋白质的核酸而在体内衍生。这导致框内基因融合,其在用能够 结合dTAG的异双功能性化合物处理时对蛋白酶体介导的降解敏感。 在一个主要具体例中,dTAG基本上不干扰内源性表达的蛋白质的功 能。在一个具体例中,dTAG是非内源肽,其允许异双功能性化合物 的选择性并且在给药异双功能性化合物时使靶外效应最小化。在一个 具体例中,dTAG是衍生自内源性蛋白质的氨基酸序列,其已例如通 过“凸块(bump)”策略修饰(参见,例如,参见Clackson et al., “Redesigning anFKBP–ligand interface to generate chemical dimerizers with novelspecificity”,PNAS 95(1998):10437–10442, 其通过引用方式并入本文),以使异双功能性化合物仅与dTAG的经 修饰氨基酸序列结合或优先结合,而不与相应的内源性表达蛋白结合。
本文还考虑了通过将编码dTAG的核酸序列以5'或3'靶向框内插 入编码感兴趣的蛋白质的基因组序列来体外等位基因特异性调节内源 性蛋白质的方法,其中,编码dTAG的核酸***基因组序列中,在 表达时产生内源性蛋白质-dTAG杂合体或融合蛋白,其中内源性蛋 白质-dTAG能够被异双功能性化合物降解,该异双功能性化合物以 使dTAG(和因此内源性蛋白质-dTAG杂合蛋白)接近泛素连接酶的方 式结合a)***的dTAG和b)泛素连接酶,使得内源性蛋白质-dTAG 杂合蛋白泛素化,然后被蛋白酶体降解。通过使用本文所述的方法将 编码dTAG的核酸框内***编码感兴趣的内源性蛋白质的基因,所 得蛋白质的表达可以通过引入能够结合dTAG的异双功能性化合物 来严格控制,从而得到内源性蛋白质的降解。重要的是,通过使用异 双功能性化合物,可以可逆地控制内源性蛋白质的表达,从而允许检 查蛋白质表达对细胞的影响。
因此,通过以这种方式调节内源性蛋白质的表达,可以在多种蛋 白质和细胞类型以及各种生理条件下检测调节蛋白质表达的下游效应。 因为可以滴定细胞内的异双功能性化合物浓度,可以精细调节细胞内 的蛋白质-dTAG杂合蛋白浓度,允许细胞内蛋白质丰度的条件改变 和根据需要改变细胞内表型的能力。在一个具体例中,本文提供评估 细胞中蛋白质表达衰减的方法,包括将编码dTAG的核酸序列*** 到编码感兴趣的蛋白质的基因组序列的5'或3'框架中,其中将编码 dTAG的核酸***到基因组序列中造成在表达时产生内源性蛋白质- dTAG杂合体或融合蛋白,其中内源性蛋白质-dTAG能够被异双功 能性化合物降解,该异双功能性化合物以使dTAG(和因此内源性蛋 白质-dTAG杂合蛋白)接近泛素连接酶的方式结合a)***的dTAG和 b)泛素连接酶,使得内源性蛋白质-dTAG杂合蛋白泛素化,然后被 蛋白酶体降解。在一个具体例中,向细胞给药异双功能性化合物,使 得细胞中蛋白质-dTAG杂合蛋白的浓度部分地降解。在一个具体例 中,向细胞给药异双功能性化合物,使得细胞中内源性蛋白质-dTAG 杂合蛋白的浓度完全地降解。
在一个具体例中,本文提供了鉴定与疾病或病症相关的蛋白质靶 标的方法,包括将编码dTAG的核酸序列***编码感兴趣的蛋白质 的基因组序列的5'或3'框架中,其中将编码dTAG的核酸***基因 组序列中,在表达时产生内源性蛋白质-dTAG杂合体或融合蛋白, 其中内源性蛋白质-dTAG能够被异双功能性化合物降解,该异双功 能性化合物以使dTAG(以及因此内源性蛋白质-dTAG杂合蛋白)接近 泛素连接酶的方式结合a)***的dTAG和b)泛素连接酶,使得内源 性蛋白质-dTAG杂合蛋白被泛素化,然后被蛋白酶体降解,接着测 量蛋白质降解对细胞病症或疾病状态的影响。通过使用本文所述的方 法将编码dTAG的核酸框内***编码感兴趣的内源性蛋白质的基因, 可以检查各种蛋白质的下调,并且可以鉴定用于治疗与特定疾病状态 相关的病症的潜在靶标。此外,目前的方法可用于验证与疾病状态相 关的潜在蛋白质。
在一个特别具体例中,用于本发明的dTAG包括衍生自内源性 蛋白质激酶的氨基酸序列。在一个具体例中,内源性蛋白质激酶氨基 酸序列包括使激酶失活的突变。在一个具体例中,蛋白激酶中的突变 发生在保守的激酶催化性三联体氨基酸序列内。在一个具体例中,保 守的激酶催化性三联体氨基酸序列是TVS。在一个具体例中,保守 的激酶催化性三联体氨基酸序列是HRD。在一个具体例中,保守的 激酶催化性三联体氨基酸序列是DFG。在一个具体例中,保守的激 酶催化性三联体氨基酸序列是TRD。参见Kornev et al.,“Surface comparison of active and inactive protein kinases identifies aconserved activation mechanism,”PNAS 2006;103(47):17783–17788, 其通过引用方式并入本文。在一个具体例中,至少一种催化性三联体 氨基酸取代丙氨酸。在一个具体例中,至少一种催化性三联体氨基酸 取代甘氨酸。在一个具体例中,异双功能性化合物含有能够选择性结 合突变蛋白激酶序列的等位基因特异性配体。在一个具体例中,突变 激酶是如Roskoski et al.,“Classification of small molecule protein kinase inhibitorsbased upon the structures of their drug-enzyme complexes,”PharmacologicalResearch http://dx.doi.org/10.1016/j.phrs.2015.10.021所述,其通过引用方式 并入本文和/或Roskoski et al.,“A historical overview of protein kinases and theirtargeted small molecule inhibitors,”Pharmaceutical Research(2015),http://dx.doi.org/10.1016/j.phrs.2015.07.10,其通 过引用方式并入本文。在一个具体例中,dTAG衍生自作为类似物敏 感性激酶的激酶。在一个具体例中,突变激酶是如Zhang etal., “Structure-guided inhibitor design expands the scope of analog-sensitive kinase technology,”ACS Chem Biol.2013:8(9);1931-1938 所述,其通过引用方式并入本文。在替代具体例中,用于本发明的 dTAG包括但不限于衍生自选自EGFR、BCR-ABL、ALK、JAK2、 BRAF、LRRK2、PDGFRα和RET的蛋白质的氨基酸序列。在一个 具体例中,蛋白质含有一个或多个突变。在一个具体例中,一种或多 种突变使蛋白质失活。
在替代的具体例中,用于本发明的dTAG包括但不限于衍生自 选自Src、Src、Pkd1、Kit、Jak2、Abl、Mek1、HIV整合酶和HIV 逆转录酶的蛋白质的氨基酸序列。
在特别的具体例中,用于本发明的dTAG包括但不限于衍生自 内源性表达的蛋白质的氨基酸序列,该自内源性表达的蛋白质是例如 FK506结合蛋白-12(FKBP12)、含溴结构域的蛋白质4(BRD4)、 CREB结合蛋白质(CREBBP)、或转录激活因子BRG1(SMARCA4)。 在其他具体例中,用于本发明的dTAG可包括,例如,激素受体, 例如***受体蛋白、雄激素受体蛋白、类视黄醇x受体(RXR)蛋白 或二氢叶酸还原酶(DHFR),包括细菌DHFR。在其他具体例中, dTAG可包括,例如,衍生自细菌脱卤素酶的氨基酸序列。在其他具 体例中,dTAG可包括衍生自7,8-二氢-8-氧鸟嘌呤三磷酸酶、AFAD、 花生四烯酸5-脂氧合酶活化蛋白、载脂蛋白、ASH1L、ATAD2、含 杆状病毒IAP重复序列的蛋白2、BAZ1A、BAZ1B、BAZ2A、 BAZ2B、Bcl-2、Bcl-xL、BRD1、BRD2、BRD3、BRD4、BRD5、 BRD6、BRD7、BRD8、BRD9、BRD10、BRDT、BRPF1、BRPF3、BRWD3、CD209、CECR2、CREBBP、E3连接酶XIAP、EP300、 FALZ、来自脂肪细胞的脂肪酸结合蛋白4(FABP4)、GCN5L2、GTP 酶k-RAS、HDAC6、造血***素D合成酶、KIAA1240、乳谷胱 甘肽裂解酶、LOC93349、Mcl-1、MLL、PA2GA、PB1、PCAF、 肽基-脯氨酰顺反异构酶NIMA相互作用1、PHIP、聚ADP-核糖聚 合酶14、聚ADP-核糖聚合酶15、PRKCBP1、***素、***素 E合酶、视网膜视杆细胞敏感cGMP 3','5-环磷酸二酯酶亚基δ、 S100-A7、SMARCA2、SMARCA4、SP100、SP110、SP140、Src、 Sumo-结合酶UBC9、超氧化物歧化酶、TAF1、TAF1 L、端锚聚合 酶1、端锚聚合酶2、TIF1a、TRIM28、TRIM33、TRIM66、WDR9、 ZMYND11或MLL4的氨基酸序列。在更进一步的具体例中,dTAG 可包括,例如,衍生自MDM2的氨基酸序列。
在一个特别具体例中,dTAG衍生自BRD2、BRD3、BRD4或 BRDT。在某些具体例中,dTAG是修饰的或突变的BRD2、BRD3、 BRD4或BRDT蛋白。在某些具体例中,BRD2的一个或多个突变包 括氨基酸位置97处的色氨酸(W)的突变,氨基酸位置103处的缬氨 酸(V)的突变,氨基酸位置110处的亮氨酸(L)的突变,氨基酸位置 370处的W的突变,氨基酸位置376处的V的突变,或氨基酸位置 381处的L的突变。
在某些具体例中,BRD3的一个或多个突变包括在氨基酸位置 57处的W的突变,在氨基酸位置63处的V的突变,在氨基酸位置 70处的L的突变,在氨基酸位置332处的W的突变,氨基酸位置 338处的V的突变,或氨基酸位置345处的L的突变。在某些具体 例中,BRD4的一个或多个突变包括氨基酸位置81处的W的突变, 氨基酸位置87处的V的突变,氨基酸位置94处的L的突变,氨基 酸位置374处的W的突变,氨基酸位置380处的V的突变或氨基酸 位置387处的L的突变。在某些具体例中,BRDT的一个或多个突 变包括在氨基酸位置50处的W的突变,在氨基酸位置56处的V的 突变,在氨基酸位置63处的L的突变,氨基酸位置293处W的突 变,氨基酸位置299处V的突变,或氨基酸位置306处的L突变。
在特别的具体例中,dTAG衍生自胞质信号传导蛋白FKBP12。 在某些具体例中,dTAG是修饰的或突变的胞质信号传导蛋白 FKBP12。在某些具体例中,修饰的或突变的胞质信号传导蛋白 FKBP12含有一个或多个突变,其产生FKBP12配体的扩增的结合口 袋(pocket)。在某些具体例中,该一个或多个突变包括在氨基酸位置 36处的苯丙氨酸(F)突变为缬氨酸(V)(F36V)(在本文中可互换地称为 FKBP*或FKBP12*)。
在一个具体例中,dTAG衍生自SEQ.ID.NO.1至44的任一个的 氨基酸序列或其片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.: 1的氨基酸序列或其片段。在特别具体例中,dTAG衍生自SEQ.ID. NO.:2的氨基酸序列或其片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.:3的氨基酸序列或其片段。在特别具体例中,dTAG衍 生自SEQ.ID.NO.:4的氨基酸序列或其片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.:5的氨基酸序列或其片段。在特别具体 例中,dTAG衍生自SEQ.ID.NO.:6的氨基酸序列或其片段。在特 别具体例中,dTAG衍生自SEQ.ID.NO.:7的氨基酸序列或其片段。 在特别具体例中,dTAG衍生自SEQ.ID.NO.:8的氨基酸序列或其 片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.:9的氨基酸序 列或其片段。在一个特别具体例中,其片段是指异双功能性化合物需 要结合的最小氨基酸序列。在特别具体例中,dTAG衍生自SEQ. ID.NO.:10的氨基酸序列或其片段。在特别具体例中,dTAG衍生自 SEQ.ID.NO.:11的氨基酸序列或其片段。在特别具体例中,dTAG 衍生自SEQ.ID.NO.:12的氨基酸序列或其片段。在特别具体例中, dTAG衍生自SEQ.ID.NO.:13的氨基酸序列或其片段。在特别具体 例中,dTAG衍生自SEQ.ID.NO.:14的氨基酸序列或其片段。在特 别具体例中,dTAG衍生自SEQ.ID.NO.:15的氨基酸序列或其片段。 在特别具体例中,dTAG衍生自SEQ.ID.NO.:16的氨基酸序列或其 片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.:17的氨基酸序 列或其片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.:18的氨基酸序列或其片段。在特别具体例中,dTAG衍生自SEQ.ID. NO.:19的氨基酸序列或其片段。在特别具体例中,dTAG衍生自 SEQ.ID.NO.:20的氨基酸序列或其片段。在特别具体例中,dTAG 衍生自SEQ.ID.NO.:21的氨基酸序列或其片段。在特别具体例中, dTAG衍生自SEQ.ID.NO.:22的氨基酸序列或其片段。在特别具体 例中,dTAG衍生自SEQ.ID.NO.:23的氨基酸序列或其片段。在特 别具体例中,dTAG衍生自SEQ.ID.NO.:24的氨基酸序列或其片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.:25的氨基酸序列或其 片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.:26的氨基酸序 列或其片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.27的氨基 酸序列或其片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.28的 氨基酸序列或其片段。在特别具体例中,dTAG衍生自SEQ.ID. NO.:29的氨基酸序列或其片段。在特别具体例中,dTAG衍生自 SEQ.ID.NO.:30的氨基酸序列或其片段。在特别具体例中,dTAG 衍生自SEQ.ID.NO.:31的氨基酸序列或其片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.:32的氨基酸序列或其片段。在特别具体 例中,dTAG衍生自SEQ.ID.NO.:33的氨基酸序列或其片段。在特 别具体例中,dTAG衍生自SEQ.ID.NO.:34的氨基酸序列或其片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.:35的氨基酸序列或其 片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.:36的氨基酸序 列或其片段。在特别具体例中,dTAG衍生自SEQ.ID.NO.:37的氨 基酸序列或其片段。在特别具体例中,dTAG衍生自SEQ.ID. NO.:38的氨基酸序列或其片段。在特别具体例中,dTAG衍生自 SEQ.ID.NO.:39的氨基酸序列或其片段。在特别具体例中,dTAG 衍生自SEQ.ID.NO.:40的氨基酸序列或其片段。在特别具体例中, dTAG衍生自SEQ.ID.NO.:41的氨基酸序列或其片段。在特别具体 例中,dTAG衍生自SEQ.ID.NO.:42的氨基酸序列或其片段。在特 别具体例中,dTAG衍生自SEQ.ID.NO.:43的氨基酸序列或其片段。 在特别具体例中,dTAG衍生自SEQ.ID.NO.:44的氨基酸序列或其 片段。在特别具体例中,其片段是指需要结合异双功能性化合物的最 小胺基酸序列。在特别具体例中,dTAG衍生自SEQ.ID.NO.:62的 氨基酸序列或其片段。在特别具体例中,dTAG衍生自SEQ.ID. NO.:63的氨基酸序列或其片段。在特别具体例中,其片段是指需要 结合异双功能性化合物的最小胺基酸序列。
在一个特定具体例中,dTAG衍生自SEQ.ID.NO.:1的氨基酸序 列或其片段,和dTAG能够被选自dFKBP-1至dFKBP-5中任一种的 异双功能性化合物结合。dTAG衍生自SEQ.ID.NO.:2的氨基酸序 列或其片段,和dTAG能够被选自dFKBP-6至dFKBP-10中任一种的异双功能性化合物结合。dTAG衍生自SEQ.ID.NO.:3的氨基酸 序列或其片段,和dTAG能够被选自dBET-1至dBET-18中任一种 的异双功能性化合物结合。dTAG衍生自SEQ.ID.NO.:3的氨基酸 序列或其片段,和dTAG能够被选自dBromo-1至dBromo-34中任 一种的异双功能性化合物结合。dTAG衍生自SEQ.ID.NO.:9的氨 基酸序列或其片段,和dTAG能够被选自dHalo-1至dHalo-2中任一 种的异双功能性化合物结合。
在一个具体例中,dTAG衍生自本文所述的任何氨基酸序列或其 片段,并且dTAG能够被包含能够结合本文所述dTAG的dTAG靶 向配体的相应异双功能性化合物结合。在一个具体例中,dTAG是能 够被图29,图30,图31,图32和图33中描述的异双功能性化合物 结合的氨基酸序列,或本文所述的任何其他异双功能性化合物。在一 个具体例中,dTAG是能够被包含表T中描述的dTAG靶向配体的异 双功能性化合物结合的氨基酸序列。在一个特别具体例中,dTAG衍 生自SEQ.ID.NO.:1的氨基酸序列或其片段,和dTAG能够被选自 dFKBP-1至dFKBP-5中的任一种的异双功能性化合物结合。在一个 特别具体例中,dTAG衍生自SEQ.ID.NO.:1的氨基酸序列或其片段, 和dTAG能够被选自dFKBP-6至dFKBP-13中的任一种的异双功能 性化合物结合。在一个特别具体例中,dTAG衍生自SEQ.ID.NO.:3 的氨基酸序列或其片段,和dTAG能够被选自任何dBET1至 dBET18的异双功能性化合物结合。在一个特别具体例中,dTAG衍 生自SEQ.ID.NO.:3的氨基酸序列或其片段,和dTAG能够被选自dBromo1至dBromo34中的任何一种的异双功能性化合物结合。在 一个特别具体例中,dTAG衍生自SEQ.ID.NO.:9的氨基酸序列或 其片段,和dTAG能够被选自dHalo1至dHalo2中的任何一种的异 双功能性化合物结合。在一个特别具体例中,dTAG衍生自 CREBBP,和异双功能性化合物含有选自表T的CREBBP dTAG靶 向配体。在一个特别具体例中,dTAG衍生自SMARCA4、PB1或 SMARCA2,和异双功能性化合物含有选自表T的 SMARCA4/PB1/SMARCA2dTAG靶向配体。在特别具体例中, dTAG衍生自TRIM24或BRPF1,和异双功能性化合物含有选自表 T的TRIM24/BRPF1 dTAG靶向配体。在一个特别具体例中,dTAG 衍生自糖皮质激素受体,和异双功能性化合物含有选自表T的糖皮 质激素dTAG靶向配体。在特别具体例中,dTAG来自***或雄激 素受体,和异双功能性化合物含有***/雄激素受体dTAG靶向配 体选自表T。在一个特别具体例中,dTAG衍生自DOT1L,和异双 功能性化合物含有选自表T的DOT1L dTAG靶向配体。在一个特定 具体例中,dTAG衍生自Ras,和异双功能性化合物含有选自表T的Ras dTAG靶向配体。在一个特别具体例中,dTAG衍生自RasG12C, 和异双功能性化合物含有选自表T的RasG12C dTAG靶向配体。在 特别具体例中,dTAG衍生自HER3,和异双功能性化合物含有选自 表T的HER3 dTAG靶向配体。在一个特别具体例中,dTAG衍生自 Bcl-2或Bcl-XL,和异双功能性化合物含有选自表T的Bcl-2/Bcl- XL dTAG靶向配体。在一个特别具体例中,dTAG衍生自HDAC, 和异双功能性化合物含有选自表T的HDAC dTAG靶向配体。在特 别具体例中,dTAG衍生自PPAR,和异双功能性化合物含有选自表 T的PPAR dTAG靶向配体。在一个特别具体例中,dTAG衍生自 DHFR,和异双功能性化合物含有选自表T的DHFRdTAG靶向配体。
在一个方面,本发明的合成基因包括与遗传疾病有关的感兴趣的 基因。作为非限制性实例,突变基因(例如,编码α-1抗胰蛋白酶 (A1AT))可以在细胞中为dTAG靶向而框内***以产生合成基因,其 编码能够由靶向内源性A1AT-dTAG杂合蛋白的dTAG的异双功能性化合物降解的杂合蛋白。通过产生A1AT-dTAG杂合体,突变的 A1AT的功能可以通过给药异双功能性化合物来调节或调整,允许细 胞维持A1AT内源性蛋白质的一些功能,同时减少A1AT过表达的 影响。可靶向的蛋白质的其他非限制性实例包括β-连环蛋白 (CTNNB1),载脂蛋白B(APOB),血管生成素样蛋白3(ANGPTL3), 前蛋白转化酶枯草杆菌蛋白酶/kexin 9型(PCSK9),载脂蛋白 C3(APOC3),低密度脂蛋白受体(LDLR),C-反应蛋白(CRP),载脂 蛋白a(Apo(a)),因子VII,因子XI,抗凝血酶III(SERPINC1),磷 脂酰肌醇聚糖A类(PIG-A),C5,α-1抗胰蛋白酶(SERPINA1),铁 调素调节(TMPRSS6),(δ-氨基乙酰丙酸合成酶1(ALAS-1),酰基 CaA:二酰基甘油酰基转移酶(DGAT),miR-122,miR-21,miR- 155,miR-34a,前激肽释放酶(KLKB1),***生长因子(CCN2), 细胞间粘附分子1(ICAM-1),胰高血糖素受体(GCGR),糖皮质激素 受体(GCCR),蛋白酪氨酸磷酸酶(PTP-1B),c-Raf激酶(RAF1),成 纤维细胞生长因子受体4(FGFR4),血管粘附分子-1(VCAM-1),极 晚期抗原-4(VLA-4),运甲状腺素蛋白(TTR),存活运动神经元2 (SMN2),生长激素受体(GHR),肌张力障碍肌强直蛋白激酶(DMPK),细胞核酸结合蛋白(CNBP或ZNF9),凝聚素(CLU),真核 转译起始因子4E(eIF-4e),MDM2,MDM4,热休克蛋白27(HSP 27),信号转导和转录激活因子3蛋白(STAT3),血管内皮生长因子 (VEGF),驱动蛋白纺锤体蛋白(KIF11),乙型肝炎基因组,雄激素受 体(AR),Atonal同源物1(ATOH1),血管内皮生长因子受体1(FLT1), 视网膜中毒1(RS1),视网膜色素上皮特异性65kDa蛋白(RPE65), Rab护送蛋白1(CHM)和钠通道,电压门控,类型X,α亚基(PN3或SCN10A)。遗传性疾病包括但不限于纯合子家族性高胆固醇血症, AGS1至AGS7,PRAAS/CANDLE,SAVI,ISG15 def,SPENCDI, 噬血细胞性淋巴组织细胞增生症,NLRC4-MAS,CAMPS,DADA2, PLAID,I型酪氨酸血症,BSEP缺乏症,MRD3基因缺陷,糖原贮 积病IV,I,Crigler-Najjar综合征,鸟氨酸转氨甲酰酶缺乏症,原发 性高草酸尿症,Wilson病,囊性纤维化,FIC1缺乏症,瓜氨酸血症, 胱氨酸病,丙酸学术,ADA-SCID,X性联SCID,脂蛋白脂酶缺乏,Leber的先天性黑朦和肾上腺脑白质营养不良。
本文还考虑使用能够结合本发明的内源性蛋白质-dTAG杂合体 的dTAG,并通过泛素化诱导降解的异双功能性化合物。通过向受试 者给药针对dTAG的异双功能性化合物,可以在患有靶蛋白表达的 疾病或病症的受试者中调节内源性蛋白质-dTAG杂合体。用于本发明的异双功能性化合物是小分子拮抗剂,其能够通过内源性蛋白质- dTAG杂合体的降解来抑制内源性蛋白质的生物学功能。它们经由化 学缀合提供迅速的配体依赖性靶蛋白降解,例如,衍生化的邻苯二甲 酰亚胺,其劫持小脑蛋白E3泛素连接酶复合物的功能。使用该方法, 本发明的内源性蛋白质-dTAG杂合体可以以高特异性和高效率快速 降解。
可用于本发明的异双功能性化合物包括那些包含小分子E3连接 酶配体的化合物,其通过不同长度和/或功能的连接子与dTAG靶向 配体共价连接,如下文更详细描述的。异双功能性化合物能够结合 dTAG并募集E3连接酶,例如,通过与含有连接酶或VonHippel- Lindau肿瘤抑制因子(VHL)的小脑蛋白(CRBN)结合至内源dTAG杂 合体以进行泛素化和随后的蛋白酶体降解。
此外,通过经由本申请的双功能性分子的蛋白质降解的化学策略 与基因治疗的有效性相结合,可以通过打开和关闭泛素化,以及内源 性蛋白质-dTAG杂交体的蛋白酶体降解而快速、精确、时间的方式 调节内源性表达的蛋白质的活性,从而调节副作用。
可用于本发明的异双功能性化合物的实例在下面进一步举例说明。
在一个方面,基因组核酸序列编码合成基因,其包含,具有编码 dTAG的核酸的5'或3'框内***的感兴趣的内源性基因,当表达时, 其产生内源性蛋白质-dTAG杂合蛋白,其中dTAG能够被异双功能 性化合物结合。携带这种遗传修饰的细胞和动物,尤其是非人动物, 是本发明的一部分。
在一个特别具体例中,基因组核酸序列编码合成基因,其包含具 有编码dTAG的核酸的5'-或3'-框内***的感兴趣的内源性基因,其 中dTAG衍生自SEQ.ID.NO.:1的氨基酸序列或其片段,和dTAG 能够被选自dFKBP-1至dFKBP-5中的任一种的异双功能性化合物结合。在一个特别具体例中,基因组核酸序列编码合成基因,其包含具 有编码dTAG的核酸的5'-或3'-框内***的感兴趣的内源性基因,其 中dTAG衍生自SEQ.ID.NO.:2的氨基酸序列或其片段,和dTAG 能够被选自dFKBP-6至dFKBP-13中的任一种的异双功能性化合物 结合。在一个特别具体例中,基因组核酸序列编码合成基因,其包含 具有编码dTAG的核酸的5'-或3'-框内***的感兴趣的内源性基因, 其中dTAG衍生自SEQ.ID.NO.:3的氨基酸序列或其片段,和 dTAG能够被选自任何dBET1至dBET18的异双功能性化合物结合。 在一个特别具体例中,基因组核酸序列编码合成基因,其包含具有编 码dTAG的核酸的5'-或3'-框内***内源性目的基因,其中dTAG衍 生自SEQ.ID.NO.:3的氨基酸序列或其片段,和dTAG能够被选自dBromo1至dBromo34中的任何一种的异双功能性化合物结合。在 一个特别具体例中,基因组核酸序列编码合成基因,其包含具有编码 dTAG的核酸的5'-或3'-框内***的感兴趣的内源性基因,其中 dTAG衍生自SEQ ID NO.:9的氨基酸序列或其片段,和dTAG能够 被选自dHalo1和dHalo2的异双功能性化合物结合。
在一个方面,提供了由合成基因编码的氨基酸,该合成基因包含 具有编码dTAG的核酸的5'-或3'-框内***的感兴趣的内源性基因, 其中该氨基酸是内源性蛋白-dTAG杂合蛋白,其中dTAG能够被异双 功能性化合物结合。
在一个方面,本文提供了转化细胞,其包含编码合成基因的基因 组核酸序列,该合成基因包含具有编码dTAG的核酸的5'或3'框内 ***的感兴趣的内源性基因,当表达时,其产生内源性蛋白质-dTAG 杂合蛋白,其中dTAG能够被异双功能性化合物结合。
在一个方面,本文提供了表达合成基因的细胞,该合成基因包含 具有编码dTAG的核酸的5'-或3'-框内***的感兴趣的内源性基因, 当表达时,其产生内源性蛋白质-dTAG杂合蛋白,其中dTAG能够被 异双功能性化合物结合。
在一个具体方面,提供了通过基因组***编码dTAG的核酸序列 来调节内源性蛋白质活性的方法,该核酸序列在表达时产生内源性蛋 白质-dTAG杂合蛋白质,其中dTAG能够是通过异双功能性化合物结 合,并向受试者给药能够结合dTAG并降解内源性蛋白质-dTAG杂合 体的异双功能性化合物。
在一个特定方面,提供了鉴定与疾病状态相关的内源性蛋白质 的方法,其中通过基因组***编码dTAG的核酸序列来调节内源性蛋 白质的活性,该核酸序列在表达时产生内源性蛋白质-dTAG杂合蛋白, 其中dTAG能够被异双功能性化合物结合,并给药能够结合dTAG并 降解内源性蛋白质-dTAG杂合体的异双功能性化合物,其中蛋白质的 降解导致疾病状态的改变。
在一个具体例中,本文提供了包含编码SEQ.ID.NO.:52的核 酸和编码dTAG的核酸的转化细胞。在一个具体例中,本文提供了包 含编码SEQ.ID.NO.:52的核酸和编码衍生自选自SEQ.ID.NO.:1 至44的氨基酸序列或其片段的dTAG的核酸的转化细胞。
在一个具体例中,本文提供了编码SEQ.ID.NO.:52的第一核 酸ID和编码dTAG的第二核酸。在一个具体例中,本文提供了编码 SEQ.ID.NO.:52的第一核酸和编码衍生自选自SEQ.ID.NO.:1至 44的氨基酸序列或其片段的dTAG的第二核酸。
本发明的其他方面包括编码本发明的合成基因的多核苷酸序列、 质粒和载体,以及表达本发明的合成基因的宿主细胞。
在另一个具体例中,用于本发明的dTAG是衍生自EGFR的氨 基酸序列。在某些具体例中,dTAG是修饰的或突变的EGFR蛋白或 其片段。在某些具体例中,EGFR的一个或多个突变包括在氨基酸位 置858处用亮氨酸(L)取代亮氨酸(L),在外显子19中删除氨基酸序 列LREA,在外显子19中***氨基酸VAIKEL,在氨基酸位置719 处用丙氨酸(A),半胱氨酸(C)或丝氨酸(S)取代甘氨酸(G),在氨基酸 位置861处用丙氨酸(A),半胱氨酸(C)、丝氨酸(S)取代亮氨酸(L), 在氨基酸位置765处用丙氨酸(A)取代缬氨酸(V),在氨基酸位置783 处用丙氨酸(A)取代苏氨酸(T),在氨基酸位置784处用脯氨酸(P)取 代丝氨酸(S),在氨基酸位置790M处用甲硫氨酸(M)取代苏氨酸(T), 在氨基酸位置854处用丙氨酸(A)取代苏氨酸(T),在氨基酸位置761 处用酪氨酸(Y)取代天冬氨酸(D),在氨基酸位置747处用丝氨酸(S) 取代亮氨酸(L),在氨基酸位置797处用丝氨酸(S)或甘氨酸(G)取代 半胱氨酸(C)。在一个具体例中,dTAG是衍生自SEQ.ID.NO.:53 的氨基酸序列或其片段。在一个具体例中,dTAG是衍生自SEQ.ID. NO.:54的氨基酸序列或其片段。在一个具体例中,SEQ.ID.NO.:54 在位置163处具有亮氨酸。在一个具体例中,dTAG是衍生自SEQ. ID.NO.:55的氨基酸序列或其片段。在一个具体例中,SEQ.ID. NO.:55在位置163处具有亮氨酸。在一个具体例中,SEQ ID NO.:55在位置95处具有苏氨酸。在一个具体例中,SEQ.ID. NO.:55在位置163处具有亮氨酸。在一个具体例中,SEQ.ID. NO.:55在位置95处具有苏氨酸。在一个具体例中,dTAG是衍生自SEQ.ID.NO.:56的氨基酸序列或其片段。在一个具体例中,SEQ. ID.NO.:56在位置163处具有亮氨酸。在一个具体例中,SEQ.ID. NO.:56在位置95处具有苏氨酸。在一个具体例中,SEQ.ID. NO.:56在位置163处具有亮氨酸和在位置95处具有苏氨酸。
在另一个具体例中,用于本发明的dTAG是衍生自BCR-ABL的 氨基酸序列。在某些具体例中,dTAG是修饰的或突变的BCR-ABL 蛋白或其片段。在某些具体例中,BCR-ABL的一个或多个突变包括 在氨基酸位置315处用异亮氨酸(I)取代酪氨酸(T)。在一个具体例中,dTAG是衍生自SEQ.ID.NO.:57的氨基酸序列或其片段。在一个具 体例中,dTAG是衍生自SEQ.ID.NO.:58的氨基酸序列或其片段。
在另一个具体例中,用于本发明的dTAG是衍生自ALK的氨基 酸序列。在某些具体例中,dTAG是修饰的或突变的ALK蛋白或其 片段。在某些具体例中,ALK的一个或多个突变包括在氨基酸位置 1196处用甲硫氨酸取代亮氨酸(L)。在一个具体例中,dTAG是衍生 自SEQ.ID.NO.:59的氨基酸序列或其片段。
在另一个具体例中,用于本发明的dTAG是衍生自JAK2的氨基 酸序列。在某些具体例中,dTAG是修饰的或突变的JAK2蛋白或其 片段。在某些具体例中,JAK2的一个或多个突变包括在氨基酸位置 617处用缬氨酸(F)取代缬氨酸(V)。在一个具体例中,dTAG是衍生 自SEQ.ID.NO.:60的氨基酸序列或其片段。
在另一个具体例中,用于本发明的dTAG是衍生自BRAF的氨 基酸序列。在某些具体例中,dTAG是修饰的或突变的BRAF蛋白或 其片段。在某些具体例中,BRAF的一个或多个突变包括在氨基酸位 置600处用谷氨酸(E)取代缬氨酸(V)。在一个具体例中,dTAG是衍 生自SEQ.ID.NO.:61的氨基酸序列或其片段。
在替代具体例中,用于本发明的dTAG包括但不限于衍生自选 自EGFR、BCR-ABL、ALK、JAK2和BRAF的蛋白质的氨基酸序列。在 一个具体例中,蛋白质含有一个或多个突变。在一个具体例中,一种 或多种突变使蛋白质失活。
在另一个具体例中,用于本发明的dTAG是衍生自Src的氨基酸 序列。在某些具体例中,dTAG是修饰的或突变的Src蛋白或其片段。 在某些具体例中,Src的一个或多个突变或修饰包括在氨基酸位置 341处用甘氨酸(G)或丙氨酸(A)取代苏氨酸(T)。在一个具体例中, dTAG是衍生自SEQ.ID.NO.:62的氨基酸序列或其片段。在一个具 体例中,dTAG是衍生自SEQ.ID.NO.:63的氨基酸序列或其片段。
在另一个具体例中,用于本发明的dTAG是衍生自LKKR2的氨 基酸序列。在某些具体例中,dTAG是修饰的或突变的LKKR2蛋白 或其片段。在某些具体例中,LKKR2的一个或多个突变包括在氨基 酸1441处用半胱氨酸(C)取代精氨酸(R),在氨基酸2019处取代甘氨 酸(G)和丝氨酸(S),在氨基酸2020处用苏氨酸(T)取代异亮氨酸(I)。
在另一个具体例中,用于本发明的dTAG是衍生自PDGFRα的 氨基酸序列。在某些具体例中,dTAG是修饰的或突变的PDGFRα 蛋白或其片段。在某些具体例中,PDGFRα的一个或多个突变包括 在氨基酸674处用异亮氨酸(I)取代苏氨酸(T)。
在另一个具体例中,用于本发明的dTAG是衍生自RET的氨基 酸序列。在某些具体例中,dTAG是修饰的或突变的RET蛋白或其 片段。在某些具体例中,RET的一个或多个突变包括在氨基酸691 处用丝氨酸(S)取代甘氨酸(G)。在某些具体例中,RET的一个或多个 突变包括在氨基酸749处用苏氨酸(T)取代精氨酸(R)。在某些具体例 中,RET的一个或多个突变包括在氨基酸762处用谷氨酰胺(Q)取代 谷氨酰胺(Q)。在某些具体例中,RET的一个或多个突变包括在氨基 酸791处用苯丙氨酸(F)取代酪氨酸(Y)。在某些具体例中,RET的一 个或多个突变包括在氨基酸804处用缬氨酸(M)取代缬氨酸(V)。在 某些具体例中,RET的一个或多个突变包括在氨基酸918处用苏氨 酸(T)取代甲硫氨酸(M)。
在替代具体例中,用于本发明的dTAG包括但不限于衍生自选 自Kit,Jak3,Abl,Mek1,HIV逆转录酶和HIV整合酶的蛋白质的 氨基酸序列。
在另一个具体例中,用于本发明的dTAG是衍生自LKKR2的氨 基酸序列。在某些具体例中,dTAG是修饰的或突变的LKKR2蛋白 或其片段。在某些具体例中,LKKR2的一个或多个突变包括在氨基 酸1441处用半胱氨酸(C)取代精氨酸(R),在氨基酸2019处用丝氨酸(S)取代甘氨酸(G),和在氨基酸2020处用苏氨酸(T)取代异亮氨酸(I)。
在一个具体例中,dTAG具有衍生自LRRK2蛋白(UniProtKB- Q5S007(LRKK2_HUMAN)的氨基酸序列,其通过引用方式并入本文) 或其变体。在一个具体例中,dTAG衍生自Q5S007的氨基酸1328 至1511。在一个具体例中,dTAG衍生自Q5S007的氨基酸1328至 1511,其中氨基酸1441是半胱氨酸。在一个具体例中,dTAG衍生 自Q5S007的氨基酸1328至1511,和异双功能性化合物中的dTAG 靶向配体选自表T-U1中的配体。在一个具体例中,dTAG衍生自Q5S007的氨基酸1328至1511(其中氨基酸1441是半胱氨酸),和异 双功能性化合物中的dTAG靶向配体选自表T-U1中的配体。在一个 具体例中,dTAG衍生自Q5S007的氨基酸1879至2138。在一个具 体例中,dTAG衍生自Q5S007的氨基酸1879至2138,其中氨基酸 2019是丝氨酸。在一个具体例中,dTAG衍生自Q5S007的氨基酸 1879至2138,其中氨基酸2020是苏氨酸。在一个具体例中,dTAG 衍生自Q5S007的氨基酸1879至2138,和异双功能性化合物中的dTAG靶向配体选自表T-U2或U3中的配体。在一个具体例中, dTAG衍生自Q5S007的氨基酸1879至2138,其中氨基酸2019是 丝氨酸,和异双功能性化合物中的dTAG靶向配体选自表T-U2中的 配体。在一个具体例中,dTAG衍生自Q5S007的氨基酸1879至 2138,其中氨基酸2020是苏氨酸,和异双功能性化合物中的dTAG 靶向配体选自表T-U3中的配体。
在另一个具体例中,用于本发明的dTAG是衍生自PDGFRα的 氨基酸序列。在某些具体例中,dTAG是修饰的或突变的PDGFRα 蛋白或其片段。在某些具体例中,PDGFRα的一个或多个突变包括 在氨基酸6741处用异亮氨酸(I)取代苏氨酸(T)。
在一个具体例中,dTAG具有衍生自PDGFRα蛋白(UniProtKB- P09619(PDGFR_HUMAN)的氨基酸序列,其通过引用方式并入本文) 或其变体。在一个具体例中,dTAG衍生自P09619的氨基酸600至 692。在一个具体例中,dTAG衍生自P09619的氨基酸600至692, 其中氨基酸660是丙氨酸。在一个具体例中,dTAG衍生自P09619 的氨基酸600至692,和异双功能性化合物中的dTAG靶向配体选自 表T-V1中的配体。在一个具体例中,dTAG衍生自P09619的氨基 酸600至692,其中氨基酸660是丙氨酸,异双功能性化合物中的 dTAG靶向配体选自表T-V1中的配体。
在另一个具体例中,用于本发明的dTAG是衍生自RET的氨基 酸序列。在某些具体例中,dTAG是修饰的或突变的RET蛋白或其 片段。在某些具体例中,RET的一个或多个突变包括在氨基酸691 处用丝氨酸(S)取代甘氨酸(G)。在某些具体例中,RET的一个或多个 突变包括在氨基酸691处用苏氨酸(T)取代精氨酸(R)。在某些具体例 中,RET的一个或多个突变包括氨基酸691处用谷氨酰胺(E)取代谷 氨酰胺(Q)。在某些具体例中,RET的一个或多个突变包括在氨基酸 691处用苯丙氨酸(F)取代酪氨酸(Y)。在某些具体例中,RET的一个 或多个突变包括在氨基酸691处用缬氨酸(M)取代缬氨酸(M)。在某 些具体例中,RET的一个或多个突变包括在氨基酸691处用苏氨酸 (T)取代甲硫氨酸(M)。
在一个具体例中,dTAG具有衍生自PDGFRα蛋白(UniProtKB- P07949(RET_HUMAN)的氨基酸序列,其通过引用方式并入本文)或 其变体。在一个具体例中,dTAG衍生自P07949的氨基酸724至 1016。在一个具体例中,dTAG衍生自P07949的氨基酸724至1016, 其中氨基酸940是异亮氨酸。在一个具体例中,dTAG衍生自 P07949的氨基酸724至1016,和异双功能性化合物中的dTAG靶向 配体选自表T-W1中的配体。在一个具体例中,dTAG衍生自 P07949的氨基酸724至1016(其中氨基酸940是异亮氨酸),和异双 功能性化合物中的dTAG靶向配体选自表T-W1中的配体。在一个 具体例中,dTAG衍生自P07949的氨基酸724至1016,和异双功能 性化合物中的dTAG靶向配体选自表T-W2中的配体。在一个具体 例中,dTAG衍生自P07949的氨基酸724至1016,和异双功能性化 合物中的dTAG靶向配体选自表T-W3中的配体。在一个具体例中, dTAG衍生自P07949的氨基酸724至1016,和异双功能性化合物中 的dTAG靶向配体选自表T-W4中的配体。在一个具体例中,dTAG 衍生自P07949的氨基酸724至1016,和异双功能性化合物中的 dTAG靶向配体选自表T-W5中的配体。在一个具体例中,dTAG衍 生自P07949的氨基酸724至1016,和异双功能性化合物中的dTAG 靶向配体选自表T-W6中的配体。
在一个特别具体例中,dTAG衍生自SEQ.ID.NO.:53的氨基酸 序列或其片段,和dTAG能够被包含选自表T-P1的EGFR dTAG靶 向配体的异双功能性化合物结合。在特别具体例中,dTAG是衍生自 SEQ ID NO.:54的氨基酸序列或其片段,和dTAG能够被包含选自 表T-P2的EGFR dTAG靶向配体的异双功能性化合物结合。在特别 具体例中,dTAG是衍生自SEQID NO.:55的氨基酸序列或其片段, 和dTAG能够被包含选自表T-P3的EGFR dTAG靶向配体的异双功 能性化合物结合。在特别具体例中,dTAG是衍生自SEQ ID NO.: 56的氨基酸序列或其片段,和dTAG能够被包含选自表T-P的 EGFR dTAG靶向配体的异双功能性化合物结合。在特别具体例中, dTAG是衍生自SEQ ID NO.:57的氨基酸序列或其片段,和dTAG 能够被包含选自表T-Q1的BCR-ABL dTAG靶向配体的异双功能性 化合物结合。在特别具体例中,dTAG是衍生自SEQ ID NO.:58的 氨基酸序列或其片段,和dTAG能够被包含选自表T-Q1的BCR-ABL dTAG靶向配体的异双功能性化合物结合。在特别具体例中, dTAG是衍生自SEQ IDNO.:59的氨基酸序列或其片段,和dTAG 能够被包含选自表T-R1的ALK dTAG靶向配体的异双功能性化合 物结合。在特别具体例中,dTAG是衍生自SEQ ID NO.:60的氨基 酸序列或其片段,dTAG能够被包含选自表T-S1的JAK2 dTAG靶 向配体的异双功能性化合物结合。在特别具体例中,dTAG是衍生自 SEQ ID NO.:61的氨基酸序列或其片段,和dTAG能够被包含选自 表T-T1的BRAF dTAG靶向配体的异双功能性化合物结合。
在一个具体例中,dTAG是衍生自LRRK2氨基酸1328至 1511(UnitPro-Q5S007),和异双功能性化合物中的dTAG靶向配体 是选自表T-U1中的配体。在一个具体例中,dTAG是衍生自 LRRK2氨基酸1328至1511(UniProt-Q5S007),其中氨基酸1441是 半胱氨酸,和异双功能性化合物中的dTAG靶向配体是选自表T-U1 中的配体。在一个具体例中,dTAG是衍生自LRRK2氨基酸1879 至2138(UniProt-Q5S007)。在一个具体例中,dTAG是衍生自 LRRK2氨基酸1879至2138(UniProt-Q5S007),其中氨基酸2019是 丝氨酸。在一个具体例中,dTAG是衍生自氨基酸1879至 2138(UniProt-Q5S007),其中氨基酸2020是苏氨酸。在一个具体例 中,dTAG是衍生自LRRK2氨基酸1879至2138(UniProt-Q5S007), 异双功能性化合物中的dTAG靶向配体选自表T-U2或U3中的配体。 在一个具体例中,dTAG是衍生自LRRK2氨基酸1879至2138(UniProt-Q5S007),其中氨基酸2019是丝氨酸,和异双功能性 化合物中的dTAG靶向配体选自表T-U2中的配体。在一个具体例中, dTAG是衍生自LRRK2氨基酸1879至2138(UniProt-Q5S007),其 中氨基酸2020是苏氨酸,和异双功能性化合物中的dTAG靶向配体选自表T-U3中的配体。在一个具体例中,dTAG是衍生自PDGFR 氨基酸600至692(UniProt-P09619),和异双功能性化合物中的 dTAG靶向配体选自表T-V1中的配体。在一个具体例中,dTAG是 衍生自PDGFR氨基酸600至692(UniProt-P09619),其中氨基酸 674是异亮氨酸,和异双功能性化合物中的dTAG靶向配体选自表 T-V1中的配体。在一个具体例中,dTAG是衍生自RET氨基酸724 至1016(UniProtKB-P07949),和异双功能性化合物中的dTAG靶向 配体选自表T-W1-W6中的配体。在一个具体例中,dTAG是衍生自 RET氨基酸724至1016(UniProtKB-P07949),其中氨基酸691是丝 氨酸,和异双功能性化合物中的dTAG靶向配体选自表T-W1中的 配体。在一个具体例中,dTAG是衍生自RET氨基酸724至 1016(UniProtKB-P07949),其中氨基酸749是苏氨酸,和异双功能 性化合物中的dTAG靶向配体选自表T-W2中的配体。在一个具体 例中,dTAG是衍生自RET氨基酸724至1016(UniProtKB-P07949), 其中氨基酸762是谷氨酰胺,和异双功能性化合物中的dTAG靶向 配体选自表T-W3中的配体。在一个具体例中,dTAG是衍生自RET 氨基酸724至1016(UniProtKB-P07949),其中氨基酸791是苯丙氨酸,和异双功能性化合物中的dTAG靶向配体选自表T-W4中的配 体。在一个具体例中,dTAG衍生自RET氨基酸724至 1016(UniProtKB-P07949),其中氨基酸804是甲硫氨酸,和异双功能性化合物中的dTAG靶向配体选自表T-W5中的配体。在一个具 体例中,dTAG衍生自RET氨基酸724至1016(UniProtKB-P07949), 其中氨基酸918是苏氨酸,异双功能性化合物中的dTAG靶向配体 选自表T-W6中的配体。在一个具体例中,dTAG是衍生自JAK2, 和异双功能性化合物中的dTAG靶向配体选自表T-JJJ1中的配体。 在一个具体例中,dTAG是衍生自Abl,和异双功能性化合物中的 dTAG靶向配体选自表T-KKK1中的配体。在一个具体例中,dTAG 衍生自MEK1,和异双功能性化合物中的dTAG靶向配体选自表T- LLL1中的配体。在一个具体例中,dTAG是衍生自KIT,和异双功 能性化合物中的dTAG靶向配体选自表T-MMM1中的配体。在一个 具体例中,dTAG是衍生自HIV逆转录酶,和异双功能性化合物中 的dTAG靶向配体选自表T-NNN1中的配体。在一个具体例中, dTAG是衍生自HIV整合酶,和异双功能性化合物中的dTAG靶向 配体选自表T-OOO1中的配体。
在特别具体例中,dTAG是衍生自选自EGFR,ErbB2,ErbB4, VEGFR1,VEGFR2,VEGFR3,Kit,BCR-Abl,Src,Lyn,Hck, RET,c-Met,TrkB,Flt3,Axl,Tie2,ALK,IGF-1R,InsR,ROS1,MST1R,B-Raf,Lck,Yes,Fyn,HER2-乳腺癌,PNET, RCC,RA ML,SEGA,BTK,FGFR1/2/3/4,DDR1,PDGFRα, PDGFRβ,CDK4,CDK6,Fms,Itk,T315I,Eph2A,JAK1, JAK2,JAK3 CDK8,CSF-1R,FKBP12/mTOR,MEK1,MEK2, Brk,EphR,A-Raf,B-Raf,C-Raf的蛋白质和异双功能性化合物含 有选自表Z的dTAG靶向配体。
能够结合上述氨基酸序列或其片段的异双功能性化合物可以使用 表T中描述的dTAG靶向配体产生。在一个具体例中,编码衍生自 上述氨基酸序列或其片段的dTAG的核酸序列基因组***编码感兴 趣的内源性蛋白质的基因中,该基因在表达时产生内源性蛋白质- dTAG杂合蛋白,并通过向受试者给药包含表T中所述dTAG靶向 配体的异双功能性化合物而降解。在一个具体例中,编码衍生自上述 氨基酸序列或其片段的dTAG的核酸序列基因组***编码感兴趣的 内源性蛋白质的基因中,该基因在表达时产生内源性蛋白质-dTAG杂合蛋白,并通过向受试者给药其相应的异双功能性化合物而降解, 该异双功能性化合物能够结合dTAG,例如图29,图30,图31,图 32和图33中描述的异双功能性化合物,或本文所述的任何其他异双 功能性化合物。
附图说明
图1是表示用于选择性降解dTAG融合蛋白的“凸块孔”方法的示 意图。例如,dTAG融合体可以是FK506-和雷帕霉素结合蛋白FKBP12的一种形式,其经由氨基酸突变(F36V)形成“孔”的腔。然后 该突变体FKBP12(“凸起的”FKBP,又名FKBP*或FKBP12 *(SEQ.ID.NO.:2))可被具有FKBP12结合结构域中的合成“凸块”的异 双功能性化合物选择性靶向,即连接子,和小脑电蛋白结合结构域。 该异双功能性化合物不靶向天然FKBP12,因此提供对天然存在于人 类细胞中的标签的野生型变体的选择性。
图2是表示编码dTAG的核酸序列基因组整合入编码PCSK9的 内源性基因的基因组基因座的的示意图。在同源重组后,产生的*** 产生表达产物,其包含与前蛋白转化酶枯草杆菌蛋白酶/kexin 9型 (PCSK9)蛋白质框内的N-端dTAG,从而提供前蛋白转化酶枯草杆菌蛋白酶/kexin 9型(PCSK9)-dTAG杂合体。能够被靶向dTAG序 列的异双功能性化合物降解。
图3是表示编码dTAG的核酸序列基因组整合入编码β-连环蛋 白(CTNNB1)的内源性基因的基因组基因座的的示意图。在同源重组 后,产生的***产生包含与β-连环蛋白(CTNNB1)蛋白质框架的N- 端dTAG的表达产物,从而提供能够被靶向dTAG序列的异双功能性化合物降解的β-连环蛋白(CTNNB1)-dTAG杂合体。
图4是用本发明所述异双功能性化合物处理的细胞的免疫印迹。 用指定浓度的dFKBP7处理表达HA标记的FKBP12WT或FKBP* 的293FT细胞(CRBN-WT或CRBN-/-)4小时。FKBP*而非 FKBPWT的CRBN依赖性降解证实了dFKBP7对突变体FKBP*的 选择性活性。
图5A和图5B是测量一组dFKBP异双功能性化合物在表达与 Nluc融合的FKBP*的细胞中的活性的图。FKBP*的降解测量为用 指定浓度的dFKBP处理4小时后,野生型(图7A)或CRBN-/-(图 7B)293FT细胞中来自相同的多顺反子转录物的的NANOluc和萤火 虫荧光素酶之间的信号比(Nluc/Fluc)。信号比的降低表明FKBP *(Nluc)降解。
图6是用本发明所述异双功能性化合物处理的细胞的免疫印迹。 将表达FKBP12WT或FKBP*的同基因293FT细胞(CRBN-WT或 CRBN-/-)用100nM dFKBP7或dFKBP13处理4小时。FKBP*而 非FKBP12WT或内源FKBP12的CRBN依赖性降解证实了dFKBP7 和dFKBP13对突变体FKBP*的选择性。
图7是用本发明所述异双功能性化合物处理的细胞的免疫印迹。 用指定剂量的dFKBP13处理表达HA标记的FKBP*的同基因 293FT细胞(CRBN-WT或CRBN-/-)4小时(实施例6)。这些数据证 实了dFKBP13对HA标记的FKBP*的剂量和CRBN依赖性降解。
图8是用本发明所述异双功能性化合物处理的细胞的免疫印迹。 将表达HA标记的FKBP*的293FT细胞(CRBN-WT)用100nM dFKBP13处理指定的时间。收获细胞,并对蛋白质裂解物进行免疫 印迹以测量由dFKBP13诱导的HA标记的FKBP*降解的动力学。
图9是用本发明所述异双功能性化合物处理的细胞的免疫印迹。 表达FKBP*的293FT细胞(CRBN-WT)用1uM卡非佐米 (Carfilzomib)(蛋白酶体抑制剂),0.5uM MLN4924(接合作用 (neddylation)抑制剂)和10uM来那度胺(Lenalidomide)(CRBN结合 配体)预处理2小时,然后用dFKBP13处理4小时(实施例8)。蛋白 酶体抑制剂卡非佐米挽救了dFKBP13对HA标记的FKBP*的降解, 建立了蛋白酶体功能的要求。用NAE1抑制剂MLN4924的预处理挽救了HA标记的FKBP*,建立了对CRL活性的依赖性,正如所预期 基于cullin的泛素连接酶需要接合作用以用于进行性E3连接酶活性。 用过量的来那度胺预处理消除了dFKBP13依赖性FKBP*降解,证 实了CRBN参与降解的要求。
图10A和图10B是用本发明所述异双功能性化合物处理的细胞 的免疫印迹。MV4的免疫印迹;11种表达蛋白质的白血病细胞与具 有HA标签的突变体FKBP*融合。用指定浓度的FKBP*选择性异双 功能性化合物,dFKBP7或dFKBP13处理细胞16小时,并通过西方 免疫印迹分析测量融合蛋白的丰度。
图11是表达在N末端或C末端与FKBP*融合的KRASG12V等 位基因的NIH3T3细胞的免疫印迹。用500nM dFKBP7处理细胞指 定的时间。收获细胞并进行免疫印迹以测量FKBP*-KRASG12V和 KRAS信号传导的下游替代物(例如pMEK和pAKT)的降解。数据暗 示,在施用dFKBP7时,N-端FKBP*融合体是活性的并且降解。
图12是表达FKBP*的NIH3T3细胞的免疫印迹,该FKBP*融 合至用1uM所示dFKBP异双功能性化合物处理24小时的 KRASG12V的N-末端。收获细胞并进行免疫印迹以测量FKBP*- KRASG12V和KRAS信号传导的下游替代物(例如pMEK和pAKT) 的降解。数据暗示,dFKBP9、dFKBP12和dFKBP13诱导FKBP*- KRASG12V的有效降解和下游信号传导的抑制。
图13是表达与FKBP*的NIH3T3细胞的免疫印迹,该FKBP* 融合至用指定浓度的dFKBP13处理24小时的KRASG12V的N-端。 收获细胞并进行免疫印迹以测量FKBP*-KRASG12V和KRAS信号 传导的下游替代物(例如pMEK和pAKT)的降解。数据暗示, dFKBP13诱导FKBP*-KRASG12V的有效降解并且有效地抑制下游 信号传导,IC 50>100nM。
图14是表达FKBP*的NIH3T3细胞的免疫印迹,该FKBP*融 合至用1uM dFKBP13处理指定时间的KRASG12V的N-末端。收获 细胞并进行免疫印迹以测量FKBP*-KRASG12V和KRAS信号传导 的下游替代物(例如pMEK和pAKT)的降解。这些数据暗示 dFKBP13早在治疗后1小时就诱导FKBP*-KRASG12V的有效降解 和下游信号传导的抑制。
图15是在用dFKBP13处理4小时之前用1uM卡非佐米(蛋白 酶体抑制剂),0.5uMMLN4924(接合作用(neddylation)抑制剂)和 10μM来那度胺(CRBN结合配体)预处理表达dTAG-KRASG12V的 NIH3T3细胞2小时的免疫印迹。
图16是表达KRAS等位基因的NIH3T3细胞的免疫印迹,该 KRAS等位基因是用1uMdFKBP13处理24小时的WT或突变形式 的氨基酸甘氨酸12(G12C、G12D和G12V)。
图17是用1uM dFKBP13处理24小时的表达WT或突变KRAS 等位基因(G13D、Q61L和Q61R)的NIH3T3细胞的免疫印迹。
图18A、图18B、图18C和图18D是对照NIH3T3细胞或表达 FKBP*的NIH3T3的相差图像的图,该FKBP*与用DMSO或 dFKBP13处理24小时的KRASG12V的N-末端融合。相差图像突出了在FKBP*-KRASG12V的dFKBP13依赖性降解时诱导的形态变化。
图19A、图19B、图19C和图19D是增殖图,其测量dFKBP13 对表达FKBP*-KRASG12V的NIH3T3的NIH3T3对照细胞的生长 的影响。如果dFKBP持续72小时,则用指定浓度处理细胞,并使 用ATPlite测定法测量细胞计数。ATPlite 1step发光测定法基于由 ATP与添加的荧光素酶和D-荧光素的反应引起的光的产生来测量细 胞中的细胞增殖和细胞毒性。信号的减少表明细胞数量减少。
图20是说明用dFKBP7和dFKBP13处理48小时的表达dTAG- KRASG12V的NIH3T3细胞以诱导靶向dTAG-KRASG12V降解的 柱状图。固定的细胞用碘化丙锭染色,并进行细胞周期分析。
图21A、图21B、图21C、图21D、图21E、图21F、图21G、 图21H和图21I提供了用于本发明的降解决定区域部分的实例,其 中R是连接子的连接点,X是如本文所定义的。
图22提供了用于本发明的降解决定区域部分的其他实例,其中 R是连接子的连接点,X如本文所定义。
图23提供了用于本发明的降解决定区域部分的其他实例,其中 R是连接子的连接点,X如本文所定义。
图24提供了用于本发明的连接子部分的实例。
图25提供了用于本发明的连接子部分的其他实例。
图26提供了用于本发明的杂脂族连接子部分的实例。
图27提供了用于本发明的芳族连接子部分的实例。
图28A、图28B、图28C、图28D、图28E、图28F和图28G 提供用于本发明的dTAG靶向配体,其中R是连接子连接的点。
图29A、图29B、图29C、图29D、图29E、图29F、图29G 和图29H提供了用于本发明的特定异双功能性化合物。
图30A,图30B、图30C、图30D、图30E、图30F、图30G、 图30H、图30I、图30J、图30K、图30L、图30M、图30N、图 30O和图30P提供用于本发明的特定异双功能性化合物,其中上述 结构中的X是选自F、Cl、Br和I的卤素。
图31A、图31B、图31C、图31D、图31E、图31F、图31G、 图31H、图31I和图图31J提供了用于本发明的特定异双功能性化合 物。
图32A、图32B、图32C、图32D、图32E、图32F、图32G、 图32H、图32I、图32J、图32K、图32L、图32M、图32N、图 32O、图32P、图32Q、图32R、图32S、图32T、图32U、图32V、 图32W、图32X、图32Y、图32Z、图32AA、图32BB、图32CC、 图32DD和图32EE提供用于本发明的特定异双功能性化合物,其中 RAR1和RAR2如本文所述。
图33A、图33B、图33C、图33D、图33E、图33F、图33G、 图33H、图33I、图33J、图33K、图33L、图33M、图33N、图 33O、图33P、图33Q、图33R、图33S、图33T、图33U、图33V、 图33W提供用于本发明的另外的异双功能性化合物。
具体实施方式
除非另有说明,本文揭露的组合物以及制备和使用在分子生物学, 生物化学,染色质结构和分析,计算化学,细胞培养,重组DNA和 相关领域中的的实施落入本领域的常规技术。这些技术在文献中有充 分的解释。例如,参见Sambrook et al.MOLECULAR CLONING:A LABORATORY MANUAL,Second edition,Cold Spring Harbor Laboratory Press,1989and Third edition,2001;Ausubel et al., CURRENT PROTOCOLS IN MOLECULARBIOLOGY,John Wiley &Sons,New York,1987 and periodic updates;the seriesMETHODS IN ENZYMOLOGY,Academic Press,San Diego; Wolffe,CHROMATIN STRUCTUREAND FUNCTION,Third edition,Academic Press,San Diego,1998;METHODS INENZYMOLOGY,Vol.304,“Chromatin”(P.M.Wassarman and A. P.Wolffe,eds.),AcademicPress,San Diego,1999;以及 METHODS IN MOLECULAR BIOLOGY,Vol.119,“ChromatinProtocols”(P.B.Becker,ed.)Humana Press,Totowa,1999。
本文中,我们描述了一种利用基因和蛋白质破坏的方法,以提供 促进蛋白质降解的高选择性和可逆方法。该方法对于精确的、暂时的、 小分子控制的靶标验证以及对感兴趣的蛋白质降解的细胞和体内作用 的探索具有价值。
在该方法中,感兴趣的靶基因的区域被引导RNA和Cas9靶向, 以***(敲入)同源重组(HR)靶向载体中存在的dTAG的表达盒。HR 靶向载体在表达盒的5'和3'末端含有与感兴趣的靶向基因周围的基因 组DNA同源的同源臂。通过将dTAG与感兴趣的靶基因融合在一起, 表达后的所得融合蛋白在用生物惰性小分子异双功能性化合物处理后 将对蛋白酶体介导的降解敏感。
哺乳动物细胞中的基因组编辑为治疗和纠正人类疾病提供了很大 的潜力。通过使用短的单引导RNA(sgRNA),可以将Cas9内切核酸 酶导向目标基因组位置,从而诱导DNA双股断裂。这些断裂通过非 同源末端连接修复,其可以用于产生使基因失活的***或缺失(*** 缺失)。体内基因组编辑可以通过腺病毒相关病毒(AAV)、慢病毒、 颗粒、流体动力学注射-或电穿孔介导的方法或其组合用 CRISPR/Cas9递送来完成(参见,例如,Kumar etal.,Hum.Gene Ther.12,(2001):1893-1905;Wu et al.,Mol.Ther.18,(2010):80-86; Ranet al.,Nature 520,(2015):186-191;Swiech et al.,Nat. Biotechnol.33,(2015):102-105;Zuris et al.,Nat.Biotechnol.33, (2015):73-80;Kauffman et al.,Nano.Lett.15,(2015):7300-7306; Ding et al.,Circ.Res.115,(2014):488-492;Maresch et al.,Nat. Commun.7,(2016):10770;Khorsandi et al.,Cancer GeneTher.15, (2008):225-230;Yin et al.,Nat.Rev.Genet.15,(2014):541-555; Yin etal.,Nat.Biotechnol.34,(2016):328-333;以及Xue et al., Nature 514,(2014):380-384,其通过引用方式并入本文),并且体细 胞基因组编辑已应用于小鼠器官,例如肺,肝,脑和胰腺(参见,例 如,Xue et al.,Nature 514,(2014):380-384;Sanchez-Rivera etal., Nature 516,(2014):428-431;Platt et al.,Cell 159,(2014):440-455; Yin etal.,Nat.Biotechnol.32,(2014):551-553;Zuckermann et al., Nat.Commun.6,(2015):7391;Chiou et al.,Genes Dev.29, (2015):1576-1585;以及Mazur et al.,Nat.Med.21,(2015):1163- 1171,其通过引用方式并入本文)。然而,永久基因组修饰的长期影 响尚不清楚,并且存在关于基因组编辑的不完全精确性以及成人可能 存在的生物补偿机制的对直接校正的影响的问题(参见,例如,Fu et al.,Nat.Biotechnol.31(9),(2013):822-826,and Cho et al.,Genome Res.24,(2014):132-141,通过引用并入本文)。
本文中,我们描述了广泛治疗用途的策略,其基于体内基因组工 程以产生从内源性基因座产生的并且易于以配体依赖性、可逆性和剂 量响应性方式降解的敲入融合蛋白。融合蛋白含有dTAG,其被双价 或多价异双功能性化合物靶向。异双功能性化合物具有结合dTAG 并募集E3连接酶的能力,例如,含有小脑蛋白的CRL4A E3泛素连 接酶复合物。该募集诱导融合蛋白的泛素化(在dTAG结构域或在同 源蛋白上)并随后经由UPP降解。通过这种方法,可以以高特异性和 高特异性的将感兴趣的蛋白质靶向快速泛素介导的降解,而不需要发 现感兴趣的蛋白质的从头配体(de novo ligand)。鉴于小分子和基因 组工程的组合使用,用于体内使用。
可以使用多种dTAG,包括但不限于溴结构域,例如,BRD4的 第一个溴结构域;激素受体,例如,ER、AR、RXR;FKBP12; DHFR,尤其是细菌DHFR和其他常用的蛋白质融合标签,可以通过 可以转化为异双功能性化合物的配体结合。在某些情况下,使用 dTAG将有一个优势,该dTAG利用概念上与开发的“凸块孔”策略相 关的选择性靶向蛋白激酶的ATP结合位点的“凸块孔”策略。在这种 情况下,dTAG融合物是FK506-和雷帕霉素结合蛋白FKBP12的一种形式,其经由氨基酸突变(F36V)形成“孔”的腔。然后该突变体 FKBP12(“凸起的”FKBP,又名FKBP*(SEQ.ID.NO.:2)被FKBP12 结合结构域中具有合成“凸块”、连接子和小脑蛋白靶向结构域(例如 IMID衍生物)的异双功能性化合物(或类似分子)靶向。该分子不靶向 天然FKBP12,因此提供异双功能性化合物对天然存在于人类细胞中 的标签的野生型变体的选择性。代表示例性“凸块孔”策略的图示是如 图1所示。
本文描述的发明提供了通过将基因组工程与小分子活化/降解调 节相结合来控制与疾病相关的内源性蛋白质降解的机制。该技术的应 用包括但不限于1)蛋白质的靶向降解,其中病理学是功能获得突变 的函数,2)蛋白质的靶向降解,其中病理学是扩增或增加的表达的函 数,3)作为单基因疾病表现的蛋白质的靶向降解,4)蛋白质的靶向 降解,其中遗传易感性表现出更长的时间并且通常在替代的生物补偿 机制之后不再充分,例如高胆固醇血症,蛋白质病。
定义
术语“核酸”,“多核苷酸”和“寡核苷酸”可互换使用,是指线性或 环状构象的脱氧核糖核苷酸或核糖核苷酸聚合物,并且是单股或双股 形式。出于本揭露的目的,这些术语不应被解释为关于聚合物长度的 限制。该术语可包括天然核苷酸的已知类似物,以及在碱基,糖和/ 或磷酸酯部分(例如硫代磷酸酯骨架)中被修饰的核苷酸。通常,特定 核苷酸的类似物具有相同的碱基配对特异性;即,A的类似物将与T 碱基配对。
术语“多肽”,“肽”和“蛋白质”可互换使用,指氨基酸残基的聚合 物。该术语也适用于氨基酸聚合物,其中一个或多个氨基酸是相应天 然存在的氨基酸的化学类似物或修饰衍生物。
“结合”是指大分子(例如,蛋白质和核酸之间)或大分子和小分子 (例如蛋白质和药物之间)之间的序列特异性非共价相互作用。并非结 合相互作用的所有组分都需要序列特异性(例如,与DNA骨架中的 磷酸残基接触),只要整个相互作用是序列特异性的。
“重组”是指在两个多核苷酸之间交换遗传信息的过程。出于本揭 露的目的,“同源重组”(HR)是指这种交换的特化形式,其发生在例 如经由同源定向修复机制修复细胞中的双股断裂期间。该过程需要核 苷酸序列同源性,使用“供体”分子模板修复“靶”分子(即经历双股断 裂的分子),并导致遗传信息从供体转移到靶标。
如本文所述的一种或多种靶向核酸酶在预定位点处在靶序列(例 如,细胞染色质)中产生双股断裂,和与断裂区域中的核苷酸序列具 有同源性的编码dTAG的“供体”多核苷酸可以被引入细胞。已显示 双股断裂的存在促进供体序列的整合。供体序列可以是物理整合的, 导致将供体中的全部或部分核苷酸序列引入细胞染色质中。因此,可 以改变细胞染色质中的第一序列并将其转化为供体多核苷酸中存在的 序列。
在用于细胞染色质中感兴趣区域中的序列的靶向重组和/或置换 和/或改变的某些方法中,通过与编码dTAG的外源“供体”核苷酸序 列的同源重组来改变染色体序列。如果存在与断裂区域同源的序列, 则通过细胞染色质中存在双股断裂来刺激这种同源重组。
在本文所述的任何方法中,外源核苷酸序列(“供体序列”或“转基 因”)可含有与目标区域中的基因组序列同源但不相同的序列,从而刺 激同源重组以在感兴趣的区域中***非相同序列,即编码dTAG的 核酸序列。因此,供体序列中与感兴趣区域中的序列同源的部分表现 出与被替换的基因组序列的约80至99%(或其间的任何整数)的序列 同一性。在其他具体例中,例如,如果仅有1个核苷酸在超过100 个连续碱基对的供体和基因组序列之间不同,供体和基因组序列之间 的同源性高于99%。供体序列的非同源部分含有不存在于目标区域 中的核酸序列,例如编码dTAG的序列,从而将新序列引入感兴趣 的区域。在这些情况下,非同源序列通常侧接其与目标区域中的序列 同源或相同50至1,000个碱基对(或其间的任何整数值)或任何数目 的大于1,000的碱基对的序列。在其他具体例中,供体序列与第一序 列不同源,并通过非同源重组机制***基因组中。
“切割”是指DNA分子的共价骨架的断裂。切割可以通过多种方 法引发,包括但不限于磷酸二酯键的酶促或化学水解。单股切割和双 股切割都是可能的,并且由于两个不同的单股切割事件可以发生双股 切割。DNA切割可导致钝端或交错末端的产生。在某些具体例中, 融合多肽用于靶向双股DNA切割。
“染色质”是包含细胞基因组的核蛋白结构。细胞染色质包括核酸, 主要是DNA和蛋白质,包括组蛋白和非组蛋白染色体蛋白。大多数 真核细胞染色质以核小体的形式存在,其中核小体核心包含与包含两 个组蛋白H2A,H2B,H3和H4各自的八聚体相关的约150个碱基 对的DNA;和在核小体核心之间延伸的连接子DNA(可变长度取决于 生物体)。组蛋白H1的分子通常与接头DNA相关。出于本公开的 目的,术语“染色质”意在包括所有类型的细胞核蛋白,包括原核和真 核细胞。细胞染色质包括染色体和附加型染色质。
“外源”分子是通常不存在于细胞中的分子,例如某些dTAG,但 可以通过一种或多种遗传,生物化学或其他方法引入细胞中。外源分 子可包含例如合成的内源性蛋白质-dTAG杂合体。
“内源”蛋白质是在特定环境条件下在特定发育阶段通常存在于特 定细胞中的蛋白质。例如,内源性蛋白质,例如,可以是转录因子或 酶或任何其他类型的天然表达的蛋白质。
“融合”或“杂合”蛋白质是其中两个或多个多肽优选共价连接的蛋 白质。例如,融合蛋白的实例包括内源性蛋白质和dTAG之间的融 合。
出于本揭露的目的,“基因”包括编码基因产物的DNA区域,以 及调节基因产物产生的所有DNA区域,无论这些调节序列是否与编 码相邻和/或转录序列。因此,基因包括但不必限于启动子序列,终 止子,转译调控序列如核糖体结合位点和内部核糖体进入位点,增强 子,沉默子,绝缘子,边界元件,复制起点,基质附着位点和基因座 控制区域。
“基因表达”是指基因中包含的信息转化为基因产物。基因产物可 以是基因的直接转录产物(例如,mRNA,tRNA,rRNA,反义RNA, 核酶,结构RNA或任何其他类型的RNA)或通过mRNA转译产生的 蛋白质。基因产物还包括通过诸如加帽,多腺苷酸化,甲基化和编辑 的方法修饰的RNA,以及通过例如甲基化,乙酰化,磷酸化,泛素 化,ADP-核糖基化,豆蔻酸化和糖基化修饰的蛋白质。
蛋白质表达的“调节”是指蛋白质活性的变化。表达的调节可包括 但不限于降低的蛋白质活性或增加的蛋白质活性。例如,如本文所考 虑的,将内源性蛋白质-dTAG杂交体暴露于异双功能性化合物,导 致内源性蛋白质-dTAG杂交体的降解,可调节内源性蛋白质的活性。 因此,蛋白质失活可以是部分或完全的。
“载体”能够将基因序列转移至靶细胞。通常,“载体构建体”, “表达载体”和“基因转移载体”是指能够引导感兴趣的基因表达并且可 以将基因序列转移至靶细胞的任何核酸构建体。因此,该术语包括克 隆和表达载体,以及整合载体。
术语“受试者”和“患者”可互换使用,并且指哺乳动物,例如人类 患者和非人灵长类动物,以及实验动物,例如兔,狗,猫,大鼠,小 鼠,兔和其他动物。因此,本文所用的术语“受试者”或“患者”是指患 有病症的任何患者或受试者(例如哺乳动物)。
A.异双功能复合靶向蛋白(dTAG)
本发明提供了制备敲入融合蛋白的方法,该融合蛋白由内源性基 因座产生并且易于以配体依赖性、可逆性和剂量响应性方式降解。具 体地,将编码dTAG的核酸与感兴趣的靶基因框内***,其中在表 达时,所得融合蛋白含有被双价或多价异双功能性化合物靶向的 dTAG。异双功能性化合物具有结合靶蛋白并募集E3连接酶的能力, 例如,含有小脑蛋白的CRL4A E3泛素连接酶复合物。该募集诱导 融合蛋白(在dTAG或同源蛋白上)的泛素化和随后经由泛素蛋白酶体 途径(UPP)的降解。通过这种方法,可以以高特异性的将感兴趣的蛋 白质靶向快速泛素介导的降解,而不需要发现POI的从头配体。
合成基因的异双功能性化合物靶向蛋白是异双功能性化合物可以 结合的任何氨基酸序列,当与异双功能性化合物接触时,导致表达的 内源性蛋白质-dTAG杂合蛋白质的泛素化和降解。优选地,dTAG 不应干扰内源性表达的蛋白质的功能。在一个具体例中,dTAG是非 内源肽,导致异双功能性化合物选择性并允许在给药异双功能性化合 物时避免脱靶效应。在一个具体例中,dTAG是衍生自内源性蛋白质 或其片段的氨基酸序列,其已被修饰使得异双功能性化合物仅结合修 饰的氨基酸序列而不结合内源性表达的蛋白质。在一个具体例中, dTAG是内源性表达的蛋白质或内源性表达的蛋白质的片段。可以通 过配体结合用于异双功能性化合物的任何氨基酸序列结构域可以用作 本文考虑的dTAG。在某些具体例中,优选能够被特定异双功能性化 合物结合的最小氨基酸序列用作dTAG。
在特定具体例中,用于本发明的dTAG包括,但不限于,衍生 自内源性表达的蛋白质的氨基酸序列,例如FK506结合蛋白- 12(FKBP12),含溴结构域的蛋白质4(BRD4),CREB结合蛋白(CREBBP)和转录激活因子BRG1(SMARCA4)或其变体。如本文所 设想的,“变体”意指包含一个或几个至多个氨基酸的取代,删除或添 加的任何变体,条件是变体实质上保留与原始序列相同的功能,在这 种情况下提供异双功能性化合物的配体。在其他具体例中,用于本发 明的dTAG可包括,例如,激素受体,例如,***受体蛋白,雄 激素受体蛋白,类视黄醇x受体(RXR)蛋白和二氢叶酸还原酶 (DHFR)(包括细菌DHFR,细菌脱氢酶和变体)。
dTAG的一些具体例可以是,但不限于,彼等衍生自Hsp90抑制 剂,激酶抑制剂,MDM2抑制剂,靶向人类含BET溴结构域蛋白的 化合物,靶向胞质信号传导蛋白FKBP12的化合物,HDAC抑制剂, 人类赖氨酸甲基转移酶抑制剂,血管生成抑制剂者,免疫抑制化合物和靶向芳烃受体(AHR)的化合物。
在某些具体例中,dTAG衍生自激酶,含有BET溴结构域的蛋 白质,胞质信号传导蛋白质(例如,FKBP12),核蛋白,组蛋白脱乙 酰酶,赖氨酸甲基转移酶,调节血管生成的蛋白质,调节免疫应答的 蛋白质,芳香烃受体(AHR),***受体,雄激素受体,糖皮质激素 受体或转录因子(例如,SMARCA4,SMARCA2,TRIM24)。
在某些具体例中,dTAG衍生自激酶,例如但不限于酪氨酸激酶 (例如,AATK,ABL,ABL2,ALK,AXL,BLK,BMX,BTK, CSF1R,CSK,DDR1,DDR2,EGFR,EPHA1,EPHA2,EPHA3, EPHA4,EPHA5,EPHA6,EPHA7,EPHA8,EPHA10,EPHB1, EPHB2,EPHB3,EPHB4,EPHB6,ERBB2,ERBB3,ERBB4, FER,FES,FGFR1,FGFR2,FGFR3,FGFR4,FGR,FLT1, FLT3,FLT4,FRK,FYN,GSG2,HCK,IGF1R,ILK,INSR, INSRR,IRAK4,ITK,JAK1,JAK2,JAK3,KDR,KIT,KSR1, LCK,LMTK2,LMTK3,LTK,LYN,MATK,MERTK,MET, MLTK,MST1R,MUSK,NPR1,NTRK1,NTRK2,NTRK3, PDGFRA,PDGFRB,PLK4,PTK2,PTK2B,PTK6,PTK7, RET,ROR1,ROR2,ROS1,RYK,SGK493,SRC,SRMS,STYK1,SYK,TEC,TEK,TEX14,TIE1,TNK1,TNK2, TNNI3K,TXK,TYK2,TYRO3,YES1或ZAP70),丝氨酸/苏氨 酸激酶(例如,酪蛋白激酶2,蛋白激酶A,蛋白激酶B,蛋白激酶C, Raf激酶,CaM激酶,AKT1,AKT2,AKT3,ALK1,ALK2, ALK3,ALK4,Aurora A,Aurora B,Aurora C,CHK1,CHK2, CLK1,CLK2,CLK3,DAPK1,DAPK2,DAPK3,DMPK, ERK1,ERK2,ERK5,GCK,GSK3,HIPK,KHS1,LKB1, LOK,MAPKAPK2,MAPKAPK,MNK1,MSSK1,MST1, MST2,MST4,NDR,NEK2,NEK3,NEK6,NEK7,NEK9, NEK11,PAK1,PAK2,PAK3,PAK4,PAK5,PAK6,PIM1, PIM2,PLK1,RIP2,RIP5,RSK1,RSK2,SGK2,SGK3,SIK1, STK33,TAO1,TAO2,TGF-β,TLK2,TSSK1,TSSK2,ULK1 或ULK2),细胞周期蛋白依赖性激酶(例如,Cdk1-Cdk11)和富含亮 氨酸的重复激酶(例如,LRRK2)。
在某些具体例中,dTAG衍生自含有BET溴结构域的蛋白质, 例如但不限于ASH1L,ATAD2,BAZ1A,BAZ1B,BAZ2A, BAZ2B,BRD1,BRD2,BRD3,BRD4,BRD5,BRD6,BRD7, BRD8,BRD9,BRD10,BRDT,BRPF1,BRPF3,BRWD3, CECR2,CREBBP,EP300,FALZ,GCN5L2,KIAA1240,LOC93349,MLL,PB1,PCAF,PHIP,PRKCBP1,SMARCA2, SMARCA4,SP100,SP110,SP140,TAF1,TAF1L,TIF1a, TRIM28,TRIM33,TRIM66,WDR9,ZMYND11和MLL4。在某 些具体例中,含有BET溴结构域的蛋白质是BRD4。
在某些具体例中,dTAG是衍生自,但不限于,7,8-二氢-8-氧鸟 嘌呤三磷酸酶,AFAD,花生四烯酸5-脂氧合酶活化蛋白,载脂蛋白, 含杆状病毒IAP重复的蛋白2,Bcl-2,Bcl-xL,E3连接酶XIAP, 来自脂肪细胞的脂肪酸结合蛋白4(FABP4),GTP酶k-RAS, HDAC6,造血***素D合成酶,乳谷胱甘肽裂解酶,Mcl-1, PA2GA,肽基-脯氨酰基顺反异构酶NIMA-相互作用1,聚-ADP-核 糖聚合酶14,聚-ADP-核糖聚合酶15,鞘脂激活蛋白原,***素 E合成酶,视网膜视杆细胞视紫红质敏感性cGMP 3','5-环磷酸二酯 酶亚基δ,S100-A7,Src,Sumo-共轭酶UBC9,超氧化物歧化酶, 端销聚合酶(tankyrase)1或端销聚合酶2。
在某些具体例中,dTAG是衍生自核蛋白,包括但不限于BRD2, BRD3,BRD4,触角足同源域蛋白,BRCA1,BRCA2,CCAAT增 强的结合蛋白,组蛋白,Polycomb-组蛋白,高迁移率组蛋白质,端 粒结合蛋白,FANCA,FANCD2,FANCE,FANCF,肝细胞核因 子,Mad2,NF-κB,核受体辅激活因子,CREB结合蛋白,p55, p107,p130,Rb蛋白,p53,c-fos,c-jun,c-mdm2,c-myc和c- rel。
在特别具体例中,dTAG具有衍生自BRD2的氨基酸序列 ((Universal ProteinResource Knowledge Base(UniProtKB)- P25440(BRD2_HUMAN),其通过引用并入本文),BRD3(UniProtKB-Q15059(BRD3_HUMAN),其通过引用并入本文), BRD4(UniProtKB-O60885(BRD4_HUMAN),其通过引用方式并入 本文),或BRDT(UniProtKB-Q58F21(BRDT_HUMAN),其通过引 用方式并入本文)(参见Baud et al.,”A bump-and-hole approach to engineercontrolled selectivity of BET bromodomains chemical probesm”Science 346(6209)(2014):638-641;和Baud et al., “Triazolo-benzodiazepineAnalogues:Expanding theScope of the Bump-and-Hole Approach for Selective Bromo and Extra-Terminal(BET)Bromodomain Inhibition,JMC 59(2016):1492-1500,其均是 通过引用方式并入本文)。在某些具体例中,dTAG是修饰的或突变 的BRD2、BRD3、BRD4或BRDT蛋白(参见,Baud etal.,“A bump-and-hole approach to engineer controlled selectivity of BETbromodomains chemical probes”,Science 346(6209)(2014):638-641; and Baud etal.,“New Synthetic Routes to Triazolo-benzodiazepine Analogues:Expanding theScope of the Bump-and-Hole Approach for Selective Bromo and Extra-Terminal(BET)Bromodomain Inhibition”,JMC 59(2016):1492-1500,其通过引用方式并入本文)。在某些具体例中,BRD2的一个或多个突变包括氨基酸位置97处色 氨酸(W)的突变。氨基酸位置103处的缬氨酸(V)的突变,氨基酸位 置110处亮氨酸(L)的突变,氨基酸位置370处W的突变,氨基酸位 置376处V的突变,或氨基酸位置381处L的突变。在某些具体例 中,BRD3的一个或多个突变包括氨基酸位置57处W的突变,氨基 酸位置63处V的突变,氨基酸位置70处的L突变,氨基酸位置 332处W的突变,氨基酸位置338处V的突变,或氨基酸位置345 处L的突变。在某些具体例中,BRD4的一个或多个突变包括氨基酸 位置81处W的突变,氨基酸位置87处的V突变,氨基酸位置94 处的L突变,氨基酸位置37处W的突变,氨基酸位置380处V的突变,或在某些具体例中,BRDT的一个或多个突变包括氨基酸位置 50处W的突变,氨基酸位置56处V的突变,氨基酸位置63处L的 突变,氨基酸位置293处W的突变,在氨基酸位置299处V的突变, 或在氨基酸位置306处L的突变。
在某些具体例中,dTAG是衍生自激酶抑制剂,含有BET溴结 构域的蛋白质抑制剂,细胞溶质信号传导蛋白FKBP12配体,HDAC 抑制剂,赖氨酸甲基转移酶抑制剂,血管生成抑制剂,免疫抑制化合 物和芳烃受体(AHR)抑制剂。
在特别具体例中,dTAG是衍生自胞质信号传导蛋白FKBP12。 在某些具体例中,dTAG是修饰的或突变的胞质信号传导蛋白 FKBP12。在某些具体例中,修饰的或突变的胞质信号传导蛋白 FKBP12含有一个或多个突变,其产生FKBP12配体的扩增的结合口 袋。在某些具体例中,一个或多个突变包括氨基酸位置36处有苯丙 氨酸(F)变为缬氨酸(V)(F36V)的突变(不包括甲硫氨酸起始密码子的 计数)(称为FKBP12*或FKBP*,在本文可互换使用)(参见Clackson et al.,“Redesigning a FKBP-ligand interface to generatedchemical dimerizers with novel specificity,”PNAS 95(1998):10437-10442,其 通过引用方式并入本文)。
在特别具体例中,dTAG具有衍生自FKBP12蛋白(UniProtKB- P62942(FKB1A_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自氨基酸序列:(SEQ.ID. NO.:1)GVQVETISPGDGRTFPKRGQTCVVHYTG MLEDGKKFDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIP PHATLVFDVELLKLE。
在一个具体例中,dTAG是衍生自FKBP12的氨基酸序列,其氨 基酸位置36处有苯丙氨酸(F)变为(不包括甲硫氨酸起始密码子的计 数)缬氨酸(V)(F36V)的突变(称为FKBP*)具有氨基酸序列:(SEQ. ID.NO.:2)GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKF MLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE。
在一个具体例中,dTAG具有衍生自BRD4蛋白(UniProtKB- O60885(BRD4_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG衍生自氨基酸序列:(SEQ.ID. NO.:3)
MSAESGPGTRLRNLPVMGDGLETSQMSTTQAQAQPQPANAAST NPPPPETSNPNKPKRQTNQLQYLLRVVLKTLWKHQFAWPFQQP VDAVKLNLPDYYKIIKTPMDMGTIKKRLENNYYWNAQECIQDF NTMFTNCYIYNKPGDDIVLMAEALEKLFLQKINELPTEETEIMIV QAKGRGRGRKETGTAKPGVSTVPNTTQASTPPQTQTPQPNPPPV QATPHPFPAVTPDLIVQTPVMTVVPPQPLQTPPPVPPQPQPPPAPA PQPVQSHPPIIAATPQPVKTKKGVKRKADTTTPTTIDPIHEPPSLPP EPKTTKLGQRRESSRPVKPPKKDVPDSQQHPAPEKSSKVSEQLK CCSGILKEMFAKKHAAYAWPFYKPVDVEALGLHDYCDIIKHPM DMSTIKSKLEAREYRDAQEFGADVRLMFSNCYKYNPPDHEVVA MARKLQDVFEMRFAKMPDEPEEPVVAVSSPAVPPPTKVVAPPSS SDSSSDSSSDSDSSTDDSEEERAQRLAELQEQLKAVHEQLAALSQ PQQNKPKKKEKDKKEKKKEKHKRKEEVEENKKSKAKEPPPKKT KKNNSSNSNVSKKEPAPMKSKPPPTYESEEEDKCKPMSYEEKRQ LSLDINKLPGEKLGRVVHIIQSREPSLKNSNPDEIEIDFETLKPSTL RELERYVTSCLRKKRKPQAEKVDVIAGSSKMKGFSSSESESSSES SSSDSEDSETEMAPKSKKKGHPGREQKKHHHHHHQQMQQAPAP VPQQPPPPPQQPPPPPPPQQQQQPPPPPPPPSMPQQAAPAMKSSPP PFIATQVPVLEPQLPGSVFDPIGHFTQPILHLPQPELPPHLPQPPEH STPPHLNQHAVVSPPALHNALPQQPSRPSNRAAALPPKPARPPAV SPALTQTPLLPQPPMAQPPQVLLEDEEPPAPPLTSMQMQLYLQQL QKVQPPTPLLPSVKVQSQPPPPLPPPPHPSVQQQLQQQPPPPPPPQ PQPPPQQQHQPPPRPVHLQPMQFSTHIQQPPPPQGQQPPHPPPGQ QPPPPQPAKPQQVIQHHHSPRHHKSDPYSTGHLREAPSPLMIHSP QMSQFQSLTHQSPPQQNVQPKKQELRAASVVQPQPLVVVKEEKI HSPIIRSEPFSPSLRPEPPKHPESIKAPVHLPQRPEMKPVDVGRPVI RPPEQNAPPPGAPDKDKQKQEPKTPVAPKKDLKIKN MGSWASLVQKHPTTPSSTAKSSSDSFEQFRRAAREKEEREKALK AQAEHAEKEKERLRQERMRSREDEDALEQARRAHEEARRRQEQ QQQQRQEQQQQQQQQAAAVAAAATPQAQSSQPQS MLDQQRELARKREQERRRREAMAATIDMNFQSDLLSIFEENLF。
在一个具体例中,dTAG是衍生自SEQ.ID.NO.:3的氨基酸75 至147。
在一个具体例中,dTAG具有衍生自ASH1L蛋白(UniProtKB- Q9NR48(ASH1L_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q9NR48的氨基酸 2463至2533。
在一个具体例中,dTAG具有衍生自ATAD2蛋白(UniProtKB- Q6PL18(ATAD2_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q6PL18的氨基酸 1001至1071。
在一个具体例中,dTAG具有衍生自BAZ1A蛋白(UniProtKB- Q9NRL2(BAZ1A_HUMAN),其通过引用并入本文)的氨基酸序列或 其变体。在一个具体例中,dTAG是衍生自Q9NRL2的氨基酸1446 至1516。
在一个具体例中,dTAG是具有衍生自BAZ1B蛋白(UniProtKB- Q9UIG0(BAZ1B_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q9UIG0的氨基酸 1356至1426。
在一个具体例中,dTAG具有衍生自BAZ2A蛋白(UniProtKB- Q9UIF9(BAZ2A_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q9UIF9的氨基酸 1810至1880。
在一个具体例中,dTAG具有衍生自BAZ2B蛋白(UniProtKB- Q9UIF8(BAZ2B_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q9UIF8的氨基酸 2077至2147。
在一个具体例中,dTAG具有衍生自BRD1蛋白(UniProtKB- O95696(BRD1_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自O95696的氨基酸579 至649。
在一个具体例中,dTAG具有衍生自BRD2蛋白(UniProtKB- P25440(BRD2_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自氨基酸序列:(SEQ. ID.NO.:13)
MLQNVTPHNKLPGEGNAGLLGLGPEAAAPGKRIRKPSLLYEGFE SPTMASVPALQLTPANPPPPEVSNPKKPGRVTNQLQYLHKVVMK ALWKHQFAWPFRQPVDAVKLGLPDYHKIIKQPMDMGTIKRRLE NNYYWAASECMQDFNTMFTNCYIYNKPTDDIVLMAQTLEKIFL QKVASMPQEEQELVVTIPKNSHKKGAKLAALQGSVTSAHQVPAVSSVSHTALYTPPPEIPTTVLNIPHPSVISSPLLKSLHSAGPPLLAV TAAPPAQPLAKKKGVKRKADTTTPTPTAILAPGSPASPPGSLEPK AARLPPMRRESGRPIKPPRKDLPDSQQQHQSSKKGKLSEQLKHC NGILKELLSKKHAAYAWPFYKPVDASALGLHDYHDIIKHPMDLS TVKRKMENRDYRDAQEFAADVRLMFSNCYKYNPPDHDVVAMA RKLQDVFEFRYAKMPDEPLEPGPLPVSTAMPPGLAKSSSESSSEE SSSESSSEEEEEEDEEDEEEEESESSDSEEERAHRLAELQEQLRAV HEQLAALSQGPISKPKRKREKKEKKKKRKAEKHRGRAGADEDD KGPRAPRPPQPKKSKKASGSGGGSAALGPSGFGPSGGSGTKLPK KATKTAPPALPTGYDSEEEEESRPMSYDEKRQLSLDINKLPGEKL GRVVHIIQAREPSLRDSNPEEIEIDFETLKPSTLRELERYVLSCLRK KPRKPYTIKKPVGKTKEELALEKKRELEKRLQDVSGQLNSTKKP PKKANEKTESSSAQQVAVSRLSASSSSSDSSSSSSSSSSSDTSDSD SG。
在一个具体例中,dTAG是衍生自SEQ.ID.NO.:13的氨基酸91 至163或364至436。
在一个具体例中,dTAG具有衍生自BRD3蛋白(UniProtKB- Q15059(BRD3_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自氨基酸序列:(SEQ. ID.NO.:14)
MSTATTVAPAGIPATPGPVNPPPPEVSNPSKPGRKTNQLQYMQN VVVKTLWKHQFAWPFYQPVDAIKLNLPDYHKIIKNPMDMGTIK KRLENNYYWSASECMQDFNTMFTNCYIYNKPTDDIVLMAQALE KIFLQKVAQMPQEEVELLPPAPKGKGRKPAAGAQSAGTQQVAA VSSVSPATPFQSVPPTVSQTPVIAATPVPTITANVTSVPVPPAAAP PPPATPIVPVVPPTPPVVKKKGVKRKADTTTPTTSAITASRSESPP PLSDPKQAKVVARRESGGRPIKPPKKDLEDGEVPQHAGKKGKLS EHLRYCDSILREMLSKKHAAYAWPFYKPVDAEALELHDYHDIIK HPMDLSTVKRKMDGREYPDAQGFAADVRLMFSNCYKYNPPDH EVVAMARKLQDVFEMRFAKMPDEPVEAPALPAPAAPMVSKGA ESSRSSEESSSDSGSSDSEEERATRLAELQEQLKAVHEQLAALSQ APVNKPKKKKEKKEKEKKKKDKEKEKEKHKVKAEEEKKAKVA PPAKQAQQKKAPAKKANSTTTAGRQLKKGGKQASASYDSEEEE EGLPMSYDEKRQLSLDINRLPGEKLGRVVHIIQSREPSLRDSNPD EIEIDFETLKPTTLRELERYVKSCLQKKQRKPFSASGKKQAAKSK EELAQEKKKELEKRLQDVSGQLSSSKKPARKEKPGSAPSGGPSR LSSSSSSESGSSSSSGSSSDSSDSE。
在一个具体例中,dTAG是衍生自SEQ.ID.NO.:14的氨基酸 51至123或326至398。
在一个具体例中,dTAG具有衍生自BRD7蛋白(UniProtKB- Q9NPI1(BRD7_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG衍生自Q9NP11的氨基酸148 至218。
在一个具体例中,dTAG具有衍生自BRD8蛋白(UniProtKB- Q9H0E9(BRD8_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自Q9H0E9的氨基酸724 至794或1120至1190。
在一个具体例中,dTAG具有衍生自BRD9蛋白(UniProtKB- Q9H8M2(BRD9_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q9H8M2的氨基酸 153至223。
在一个具体例中,dTAG具有衍生自BRDT蛋白(UniProtKB- Q58F21(BRDT_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自氨基酸序列:(SEQ. ID.NO.:15)
MSLPSRQTAIIVNPPPPEYINTKKNGRLTNQLQYLQKVVLKDLW KHSFSWPFQRPVDAVKLQLPDYYTIIKNPMDLNTIKKRLENKYY AKASECIEDFNTMFSNCYLYNKPGDDIVLMAQALEKLFMQKLSQ MPQEEQVVGVKERIKKGTQQNIAVSSAKEKSSPSATEKVFKQQE IPSVFPKTSISPLNVVQGASVNSSSQTAAQVTKGVKRKADTTTPA TSAVKASSEFSPTFTEKSVALPPIKENMPKNVLPDSQQQYNVVKT VKVTEQLRHCSEILKEMLAKKHFSYAWPFYNPVDVNALGLHNY YDVVKNPMDLGTIKEKMDNQEYKDAYKFAADVRLMFMNCYK YNPPDHEVVTMARMLQDVFETHFSKIPIEPVESMPLCYIKTDITE TTGRENTNEASSEGNSSDDSEDERVKRLAKLQEQLKAVHQQLQVLSQVPFRKLNKKKEKSKKEKKKEKVNNSNENPRKMCEQMRLK EKSKRNQPKKRKQQFIGLKSEDEDNAKPMNYDEKRQLSLNINKL PGDKLGRVVHIIQSREPSLSNSNPDEIEIDFETLKASTLRELEKYVS ACLRKRPLKPPAKKIMMSKEELHSQKKQELEKRLLDVNNQLNSR KRQTKSDKTQPSKAVENVSRLSESSSSSSSSSESESSSSDLSSSDSSDSESEMFPKFTEVKPNDSPSKENVKKMKNECIPPEGRTGVTQIGY CVQDTTSANTTLVHQTTPSHVMPPNHHQLAFNYQELEHLQTVK NISPLQILPPSGDSEQLSNGITVMHPSGDSDTTMLESECQAPVQK DIKIKNADSWKSLGKPVKPSGVMKSSDELFNQFRKAAIEKEVKA RTQELIRKHLEQNTKELKASQENQRDLGNGLTVESFSNKIQNKC SGEEQKEHQQSSEAQDKSKLWLLKDRDLARQKEQERRRREAMV GTIDMTLQSDIMTMFENNFD。
在一个具体例中,dTAG衍生自SEQ.ID.NO.:15的氨基酸44 至116或287至359。
在一个具体例中,dTAG具有衍生自BRPF1蛋白(UniProtKB- P55201(BRPF1_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自P55201的氨基酸645 至715。
在一个具体例中,dTAG具有衍生自BRPF3蛋白(UniProtKB- Q9ULD4(BRPF3_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q9ULD4的氨基酸 606至676。
在一个具体例中,dTAG具有衍生自BRWD3蛋白(UniProtKB- Q6RI45(BRWD3_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q6RI45的氨基酸 1158至1228或1317至1412。
在一个具体例中,dTAG具有衍生自CECR2蛋白(UniProtKB- Q9BXF3(CECR2_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q9BXF3的氨基酸 451至521。
在一个具体例中,dTAG具有衍生自CREBBP蛋白(UniProtKB- Q92793(CBP_HUMAN),其通过引用方式并入本文)的氨基酸序列或 其变体。在一个具体例中,dTAG是衍生自Q92793的氨基酸1103 至1175。
在一个具体例中,dTAG具有衍生自EP300蛋白(UniProtKB- Q09472(EP300_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自Q09472的氨基酸1067 至1139。
在一个具体例中,dTAG具有衍生自FALZ蛋白(UniProtKB- Q12830(BPTF_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自Q12830的氨基酸2944 至3014。
在一个具体例中,dTAG具有衍生自GCN5L2蛋白(UniProtKB- Q92830(KAT2A_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q92830的氨基酸 745至815。
在一个具体例中,dTAG具有衍生自KIAA1240蛋白 (UniProtKB-Q9ULI0(ATD2B_HUMAN),其通过引用方式并入本文) 的氨基酸序列或其变体。在一个具体例中,dTAG是衍生自Q9ULI0 的氨基酸975至1045。
在一个具体例中,dTAG具有衍生自LOC93349蛋白 (UniProtKB-Q13342(SP140_HUMAN),其通过引用方式并入本文) 的氨基酸序列或其变体。在一个具体例中,dTAG是衍生自Q13342 的氨基酸796至829。
在一个具体例中,dTAG具有衍生自MLL蛋白(UniProtKB- Q03164(KMT2A_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q03164的氨基酸 1703至1748。
在一个具体例中,dTAG具有衍生自PB1蛋白(UniProtKB- Q86U86(PB1_HUMAN),其通过引用方式并入本文)的氨基酸序列或 其变体。在一个具体例中,dTAG是衍生自Q86U86的氨基酸63至 134、200至270、400至470、538至608、676至746或792至 862。
在一个具体例中,dTAG具有衍生自PCAF蛋白(UniProtKB- Q92831(KAT2B_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q92831的氨基酸 740至810。
在一个具体例中,dTAG具有衍生自PHIP蛋白(UniProtKB- Q8WWQ0(PHIP_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q8WWQ0的氨基酸 1176至1246或1333至1403。
在一个具体例中,dTAG具有衍生自PRKCBP1蛋白 (UniProtKB-Q9ULU4(PKCB1_HUMAN),其通过引用方式并入本文) 或其变体。在一个具体例中,dTAG是衍生自Q9ULU4的氨基酸165 至235的氨基酸序列。
在一个具体例中,dTAG具有衍生自SMARCA2蛋白 (UniProtKB-P51531(SMCA2_HUMAN),其通过引用方式并入本文) 的氨基酸序列或其变体。在一个具体例中,dTAG是衍生自P51531 的氨基酸1419至1489。
在一个具体例中,dTAG具有衍生自SMARCA4蛋白 (UniProtKB-P51532(SMCA4_HUMAN),其通过引用方式并入本文) 的氨基酸序列或其变体。在一个具体例中,dTAG是衍生自P51532 的氨基酸1477至1547。
在一个具体例中,dTAG具有衍生自SP100蛋白(UniProtKB- P23497(SP100_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自P23497的氨基酸761 至876。
在一个具体例中,dTAG具有衍生自SP110蛋白(UniProtKB- Q9HB58(SP110_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自Q9HB58的氨基酸581 至676。
在一个具体例中,dTAG具有衍生自SP140蛋白(UniProtKB- Q13342(SP140_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自Q13342的氨基酸796 至829。
在一个具体例中,dTAG具有衍生自TAF1蛋白(UniProtKB- P21675(TAF1_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG至衍生自P21675的氨基酸1397 至1467或1520至1590。
在一个具体例中,dTAG具有衍生自TAF1L蛋白(UniProtKB- Q8IZX4(TAF1L_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q8IZX4的氨基酸 1416至1486或1539至1609。
在一个具体例中,dTAG具有衍生自TIF1A蛋白(UniProtKB- O15164(TIF1A_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自O15164的氨基酸932 至987。
在一个具体例中,dTAG具有衍生自TRIM28蛋白(UniProtKB- Q13263(TIF1B_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自Q13263的氨基酸697 至801。
在一个具体例中,dTAG具有衍生自TRIM33蛋白(UniProtKB- Q9UPN9(TRI33_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自Q9UPN9的氨基酸 974至1046。
在一个具体例中,dTAG具有衍生自TRIM66蛋白(UniProtKB- O15016(TRI66_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG是衍生自O15016的氨基酸1056 至1128。
在一个具体例中,dTAG具有衍生自WDR9蛋白(UniProtKB- Q9NSI6(BRWD1_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG衍生自Q9NSI6的氨基酸 1177至1247或1330至1400。
在一个具体例中,dTAG具有衍生自ZMYND11蛋白 (UniProtKB-Q15326(ZMY11_HUMAN),其通过引用方式并入本文) 的氨基酸序列或其变体。在一个具体例中,dTAG是衍生自Q15326 的氨基酸168至238。
在一个具体例中,dTAG具有衍生自MLL4蛋白(UniProtKB- Q9UMN6(KMT2B_HUMAN),其通过引用方式并入本文)的氨基酸 序列或其变体。在一个具体例中,dTAG是衍生自Q9UMN6的氨基 酸1395至1509。
在一个具体例中,dTAG具有衍生自***受体的(UniProtKB- P03372-1,其通过引用方式并入本文)人类氨基酸序列或其变体。在 一个具体例中,dTAG是衍生自氨基酸序列:(SEQ.ID.NO.:4)
MTMTLHTKASGMALLHQIQGNELEPLNRPQLKIPLERPLGEVYL DSSKPAVYNYPEGAAYEFNAAAAANAQVYGQTGLPYGPGSEAA AFGSNGLGGFPPLNSVSPSPLMLLHPPPQLSPFLQPHGQQVPYYL ENEPSGYTVREAGPPAFYRPNSDNRRQGGRERLASTNDKGSMA MESAKETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQGHND YMCPATNQCTIDKNRRKSCQACRLRKCYEVGMMKGGIRKDRR GGRMLKHKRQRDDGEGRGEVGSAGDMRAANLWPSPLMIKRSK KNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLT NLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIG LVWRSMEHPGKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSS RFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRV LDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGM EHLYSMKCKNVVPLYDLLLEMLDAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEG FPATV。
在一个具体例中,dTAG具有衍生自***受体配体结合结构 域的氨基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸 序列:(SEQ.ID.NO.:5)
SLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNL ADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLV WRSMEHPGKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRF RMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLD KITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEH LYSMKCKNVVPLYDLLLE MLDAHRL。
在一个具体例中,dTAG具有衍生自雄激素受体(UniProtKB- P10275(ANDR_HUMAN),其通过引用方式并入本文)的氨基酸序列, 或其变体。在一个具体例中,dTAG是衍生自氨基酸序列:(SEQ. ID.NO.:6)
MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEA ASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQQQETSPRQ QQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERG CVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLS SCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTS SKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLR GDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAE YSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGAL DEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSA WAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTA EEGQLYGPCGGGGGGGGGGGGGGGGGGGG
GGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVP YPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPP QKTCLICGDEASGCHYGALTCGSCKVFFKRAAEGKQKYLCASR NDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQE EGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCA GHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHV DDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNE YRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSII PVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTK LLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ。
在一个具体例中,dTAG具有衍生自雄激素受体配体结合结构域 的氨基酸序列,或其变体。在一个具体例中,dTAG是衍生自氨基 酸序列:(SEQ.ID.NO.:10)
DNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDD QMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYR MHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPV DGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLL DSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSG KVKPIYFHT。
在一个具体例中,dTAG具有衍生自视黄酸受体(UniProtKB- P19793)(RXRA_HUMAN),其通过引用方式并入本文)的氨基酸序列 或其变体。在一个具体例中,dTAG衍生自氨基酸序列:(SEQ.ID. NO.:7)
MDTKHFLPLDFSTQVNSSLTSPTGRGSMAAPSLHPSLGPGIGSPG QLHSPISTLSSPING MGPPFSVISSPMGPHSMSVPTTPTLGFSTGSPQLSSPMNPVSSSED IKPPLGLNGVLKVPAHPSGNMASFTKHICAICGDRSSGKHYGVY SCEGCKGFFKRTVRKDLTYTCRDNKDCLIDKRQRNRCQYCRYQ KCLAMGMKREAVQEERQRGKDRNENEVESTSSANEDMPVERIL EAELAVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLV EWAKRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILL ATGLHVHRNSAHSAGVGAIFDRVLTELVSKMRDMQMDKTELGC LRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPEQPG RFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLME MLEAPHQMT。
在一个具体例中,dTAG具有衍生自视黄酸受体配体结合结构 域的氨基酸序列,或其变体。在一个具体例中,dTAG是衍生自氨基 酸序列:(SEQ.ID.NO.:11)
SANEDMPVERILEAELAVEPKTETYVEANMGLNPSSPNDPVTNIC QAADKQLFTLVEWAKRIPHFSELPLDDQVILLRAGWNELLIASFS HRSIAVKDGILLATGLHVHRNSAHSAGVGAIFDRVLTELVSKMR DMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEA YCKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPID TFLME MLEAPHQM。
在一个具体例中,dTAG具有衍生自DHFR,大肠杆菌, UniProtKB-Q79DQ2(Q79DQ2_ECOLX)的氨基酸序列(其通过引用并 入本文),或其变体。在一个具体例中,dTAG是衍生自氨基酸序列: (SEQ.ID.NO.:8)
MNSESVRIYLVAAMGANRVIGNGPNIPWKIPGEQKIFRRLTEGK VVVMGRKTFESIGKPLPNRHTLVISRQANYRATGCVVVSTLSHAI ALASELGNELYVAGGAEIYTLALPHAHGVFLSEVHQTFEGDAFF PMLNETEFELVSTETIQAVIPYTHSVYARRNG。
在一个具体例中,dTAG具有衍生自视黄酸受体配体结合结构 域的氨基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基 酸序列:(SEQ.ID.NO.:9)
MAEIGTGFPFDPHYVEVLGERMHYVDVGPRDGTPVLFLHGNPTS SYVWRNIIPHVAPTHRCIAPDLIGMGKSDKPDLGYFFDDHVRFM DAFIEALGLEEVVLVIHDWGSALGFHWAKRNPERVKGIAFMEFI RPIPTWDEWPEFARETFQAFRTTDVGRKLIIDQNVFIEGTLPMGV VRPLTEVEMDHYREPFLNPVDREPLWRFPNELPIAGEPANIVALV EEYMDWLHQSPVPKLLFWGTPGVLIPPAEAARLAKSLPNCKAV DIGPGLNLLQEDNPDLIGSEIARWLSTLEISG。
在一个具体例中,dTAG具有衍生自MDM2的N-末端的氨基 酸序列,或其变体。在一个具体例中,dTAG是衍生自氨基酸序列: (SEQ.ID.NO.:12)
MCNTNMSVPTDGAVTTSQIPASEQETLVRPKPLLLKLLKSVGAQ KDTYTMKEVLFYLGQYIMTKRLYDEKQQHIVYCSNDLLGDLFG VPSFSVKEHRKIYTMIYRNLVVV。
在一个具体例中,dTAG具有衍生自凋亡调节因子Bcl-xL蛋白, UniProtKB-Q07817(B2CL1_HUMAN)(其通过引用方式并入本文)的 氨基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸序 列:(SEQ.ID.NO.:16)
MSQSNRELVVDFLSYKLSQKGYSWSQFSDVEENRTEAPEGTESE METPSAINGNPSWHLADSPAVNGATGHSSSLDAREVIPMAAVKQ ALREAGDEFELRYRRAFSDLTSQLHITPGTAYQSFEQVVNELFRD GVNWGRIVAFFSFGGALCVESVDKEMQVLVSRIAAWMATYLND HLEPWIQENGGWDTFVELYGNNAAAESRKGQERFNRWFLTGMT VAGVVLLGSLFSRK。
在一个具体例中,dTAG具有衍生自CD209抗原(UniProtKB- Q9NNX6(CD209_HUMAN,其通过引用并入本文)的氨基酸序列或 其变体。在一个具体例中,dTAG是衍生自氨基酸序列:(SEQ.ID. NO.:17)
MSDSKEPRLQQLGLLEEEQLRGLGFRQTRGYKSLAGCLGHGPLV LQLLSFTLLAGLLVQVSKVPSSISQEQSRQDAIYQNLTQLKAAVG ELSEKSKLQEIYQELTQLKAAVGELPEKSKLQEIYQELTRLKAAV GELPEKSKLQEIYQELTWLKAAVGELPEKSKMQEIYQELTRLKA AVGELPEKSKQQEIYQELTRLKAAVGELPEKSKQQEIYQELTRLK AAVGELPEKSKQQEIYQELTQLKAAVERLCHPCPWEWTFFQGN CYFMSNSQRNWHDSITACKEVGAQLVVIKSAEEQNFLQLQSSRS NRFTWMGLSDLNQEGTWQWVDGSPLLPSFKQYWNRGEPNNVG EEDCAEFSGNGWNDDKCNLAKFWICKKSAASCSRDEEQFLSPAP ATPNPPPA。
在一个具体例中,dTAG具有衍生自E3连接酶 XIAP(UniProtKB-P98170(XIAP_HUMAN),其通过引用并入本文) 的氨基酸序列的或其变体。在一个具体例中,dTAG是衍生自氨基 酸序列:(SEQ.ID.NO.:18)
MTFNSFEGSKTCVPADINKEEEFVEEFNRLKTFANFPSGSPVSAS TLARAGFLYTGEGDTVRCFSCHAAVDRWQYGDSAVGRHRKVSP NCRFINGFYLENSATQSTNSGIQNGQYKVENYLGSRDHFALDRP SETHADYLLRTGQVVDISDTIYPRNPAMYSEEARLKSFQNWPDY AHLTPRELASAGLYYTGIGDQVQCFCCGGKLKNWEPCDRAWSE HRRHFPNCFFVLGRNLNIRSESDAVSSDRNFPNSTNLPRNPSMAD YEARIFTFGTWIYSVNKEQLARAGFYALGEGDKVKCFHCGGGLT DWKPSEDPWEQHAKWYPGCKYLLEQKGQEYINNIHLTHSLEECLVRTTEKTPSLTRRIDDTIFQNPMVQEAIR
MGFSFKDIKKIMEEKIQISGSNYKSLEVLVADLVNAQKDSMQDE SSQTSLQKEISTEEQLRRLQEEKLCKICMDRNIAIVFVPCGHLVTC KQCAEAVDKCPMCYTVITFKQKIFMS。
在一个具体例中,dTAG具有衍生自含杆状病毒IAP重复序列的 蛋白质2(UniProtKB-Q13490(BIRC2_HUMAN),其通过引用方式并 入本文)的氨基酸序列或其变体。在一个具体例中,dTAG是衍生自 氨基酸序列:(SEQ.ID.NO.:19)
MHKTASQRLFPGPSYQNIKSIMEDSTILSDWTNSNKQKMKYDFS CELYRMSTYSTFPAGVPVSERSLARAGFYYTGVNDKVKCFCCGL MLDNWKLGDSPIQKHKQLYPSCSFIQNLVSASLGSTSKNTSPMR NSFAHSLSPTLEHSSLFSGSYSSLSPNPLNSRAVEDISSSRTNPYSY AMSTEEARFLTYHMWPLTFLSPSELARAGFYYIGPGDRVACFAC GGKLSNWEPKDDAMSEHRRHFPNCPFLENSLETLRFSISNLSMQ THAARMRTFMYWPSSVPVQPEQLASAGFYYVGRNDDVKCFCC DGGLRCWESGDDPWVEHAKWFPRCEFLIRMKGQEFVDEIQGRY PHLLEQLLSTSDTTGEENADPPIIHFGPGESSSEDAVMMNTPVVK SALEMGFNRDLVKQTVQSKILTTGENYKTVNDIVSALLNAEDEK REEEKEKQAEEMASDDLSLIRKNRMALFQQLTCVLPILDNLLKA NVINKQEHDIIKQKTQIPLQARELIDTILVKGNAAANIFKNCLKEI DSTLYKNLFVDKNMKYIPTEDVSGLSLEEQLRRLQEERTCKVCM DKEVSVVFIPCGHLVVCQECAPSLRKCPICRGIIKGTVRTFLS。
在一个具体例中,dTAG具有衍生自造血***素D合酶 (UniProtKB-O60760(HPGDS_HUMAN),其通过引用方式并入本文) 的氨基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸 序列:(SEQ.ID.NO.:20)
MPNYKLTYFNMRGRAEIIRYIFAYLDIQYEDHRIEQADWPEIKST LPFGKIPILEVDGLTLHQSLAIARYLTKNTDLAGNTEMEQCHVDA IVDTLDDFMSCFPWAEKKQDVKEQMFNELLTYNAPHLMQDLDT YLGGREWLIGNSVTWADFYWEICSTTLLVFKPDLLDNHPRLVTL RKKVQAIPAVANWIKRRPQTKL。
在一个具体例中,dTAG具有衍生自GTP酶k-RAS (UniProtKB-P01116(RASK_HUMAN),其通过引用方式并入本文)的 氨基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸序列: (SEQ.ID.NO.:21)
MTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQV VIDGETCLLDILDTAGQEEYSAMRDQYMRTGEGFLCVFAINNTK SFEDIHHYREQIKRVKDSEDVPMVLVGNKCDLPSRTVDTKQAQD LARSYGIPFIETSAKTRQRVEDAFYTLVREIRQYRLKKISKEEKTP GCVKIKKCIIM。
在一个具体例中,dTAG具有衍生自聚-ADP-核糖聚合酶 15(UniProtKB-Q460N3(PAR15_HUMAN),其通过引用方式并入本 文)的氨基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基 酸序列:(SEQ.ID.NO.:22)
MAAPGPLPAAALSPGAPTPRELMHGVAGVTSRAGRDREAGSVL PAGNRGARKASRRSSSRSMSRDNKFSKKDCLSIRNVVASIQTKE GLNLKLISGDVLYIWADVIVNSVPMNLQLGGGPLSRAFLQKAGP MLQKELDDRRRETEEKVGNIFMTSGCNLDCKAVLHAVAPYWN NGAETSWQIMANIIKKCLTTVEVLSFSSITFPMIGTGSLQFPKAVF AKLILSEVFEYSSSTRPITSPLQEVHFLVYTNDDEGCQAFLDEFTN WSRINPNKARIPMAGDTQGVVGTVSKPCFTAYEMKIGAITFQVA TGDIATEQVDVIVNSTARTFNRKSGVSRAILEGAGQAVESECAVL AAQPHRDFIITPGGCLKCKIIIHVPGGKDVRKTVTSVLEECEQRK YTSVSLPAIGTGNAGKNPITVADNIIDAIVDFSSQHSTPSLKTVKV VIFQPELLNIFYDSMKKRDLSASLNFQSTFSMTTCNLPEHWTDM NHQLFCMVQLEPGQSEYNTIKDKFTRTCSSYAIEKIERIQNAFLW QSYQVKKRQMDIKNDHKNNERLLFHGTDADSVPYVNQHGFNRS CAGKNAVSYGKGTYFAVDASYSAKDTYSKPDSNGRKHMYVVR VLTGVFTKGRAGLVTPPPKNPHNPTDLFDSVTNNTRSPKLFVVFF DNQAYPEYLITFTA。
在一个具体例中,dTAG具有衍生自聚-ADP-核糖聚合酶 14(UniProtKB-Q460N5(PAR14_HUMAN),其通过引用方式并入本 文)的氨基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基 酸序列:(SEQ.ID.NO.:23)
MAVPGSFPLLVEGSWGPDPPKNLNTKLQMYFQSPKRSGGGECE VRQDPRSPSRFLVFFYPEDVRQKVLERKNHELVWQGKGTFKLTV QLPATPDEIDHVFEEELLTKESKTKEDVKEPDVSEELDTKLPLDG GLDKMEDIPEECENISSLVAFENLKANVTDIMLILLVENISGLSND DFQVEIIRDFDVAVVTFQKHIDTIRFVDDCTKHHSIKQLQLSPRLL EVTNTIRVENLPPGADDYSLKLFFENPYNGGGRVANVEYFPEESS ALIEFFDRKVLDTIMATKLDFNKMPLSVFPYYASLGTALYGKEK PLIKLPAPFEESLDLPLWKFLQKKNHLIEEINDEMRRCHCELTWS QLSGKVTIRPAATLVNEGRPRIKTWQADTSTTLSSIRSKYKVNPI KVDPTMWDTIKNDVKDDRILIEFDTLKEMVILAGKSEDVQSIEV QVRELIESTTQKIKREEQSLKEKMIISPGRYFLLCHSSLLDHLLTE CPEIEICYDRVTQHLCLKGPSADVYKAKCEIQEKVYTMAQKNIQ VSPEIFQFLQQVNWKEFSKCLFIAQKILALYELEGTTVLLTSCSSE ALLEAEKQMLSALNYKRIEVENKEVLHGKKWKGLTHNLLKKQN SSPNTVIINELTSETTAEVIITGCVKEVNETYKLLFNFVEQNMKIE RLVEVKPSLVIDYLKTEKKLFWPKIKKVNVQVSFNPENKQKGIL LTGSKTEVLKAVDIVKQVWDSVCVKSVHTDKPGAKQFFQDKAR FYQSEIKRLFGCYIELQENEVMKEGGSPAGQKCFSRTVLAPGVV LIVQQGDLARLPVDVVVNASNEDLKHYGGLAAALSKAAGPELQ ADCDQIVKREGRLLPGNATISKAGKLPYHHVIHAVGPRWSGYEA PRCVYLLRRAVQLSLCLAEKYKYRSIAIPAISSGVFGFPLGRCVET IVSAIKENFQFKKDGHCLKEIYLVDVSEKTVEAFAEAVKTVFKAT LPDTAAPPGLPPAAAGPGKTSWEKGSLVSPGGLQ
MLLVKEGVQNAKTDVVVNSVPLDLVLSRGPLSKSLLEKAGPEL QEELDTVGQGVAVS
MGTVLKTSSWNLDCRYVLHVVAPEWRNGSTSSLKIMEDIIRECM EITESLSLKSIAFPAIGTGNLGFPKNIFAELIISEVFKFSSKNQLKTL QEVHFLLHPSDHENIQAFSDEFARRANGNLVSDKIPKAKDTQGF YGTVSSPDSGVYEMKIGSIIFQVASGDITKEEADVIVNSTSNSFNL KAGVSKAILECAGQNVERECSQQAQQRKNDYIITGGGFLRCKNII HVIGGNDVKSSVSSVLQECEKKNYSSICLPAIGTGNAKQHPDKV AEAIIDAIEDFVQKGSAQSVKKVKVVIFLPQVLDVFYANMKKRE GTQLSSQQSVMSKLASFLGFSKQSPQKKNHLVLEKKTESATFRV CGENVTCVEYAISWLQDLIEKEQCPYTSEDECIKDFDEKEYQELN ELQKKLNINISLDHKRPLIKVLGISRDVMQARDEIEAMIKRVRLA KEQESRADCISEFIEWQYNDNNTSHCFNKMTNLKLEDARREKKK TVDVKINHRHYTVNLNTYTATDTKGHSLSVQRLTKSKVDIPAH WSDMKQQNFCVVELLPSDPEYNTVASKFNQTCSHFRIEKIERIQN PDLWNSYQAKKKTMDAKNGQTMNEKQLFHGTDAGSVPHVNRN GFNRSYAGKNAVAYGKGTYFAVNANYSANDTYSRPDANGRKH VYYVRVLTGIYTHGNHSLIVPPSKNPQNPTDLYDTVTDNVHHPS LFVAFYDYQAYPEYLITFRK。
在一个具体例中,dTAG具有衍生自超氧化物歧化酶 (UniProtKB-P00441(SODC_HUMAN),其通过引用方式并入本文)的 氨基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸序列: (SEQ.ID.NO.:24)
MATKAVCVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTEGLH GFHVHEFGDNTAGCTSAGPHFNPLSRKHGGPKDEERHVGDLGN VTADKDGVADVSIEDSVISLSGDHCIIGRTLVVHEKADDLGKGGNEESTKTGNAGSRLACGVIGIAQ。
在一个具体例中,dTAG具有衍生自视黄醛视紫红质敏感性 cGMP 3',5'-环磷酸二酯酶亚基δ(UniProtKB- O43924(PDE6D_HUMAN),其通过引用方式并入本文)的氨基酸序 列或其变体。在一个具体例中,dTAG是衍生自氨基酸序列:(SEQ. ID.NO.:25)
MSAKDERAREILRGFKLNWMNLRDAETGKILWQGTEDLSVPGV EHEARVPKKILKCKAVSRELNFSSTEQMEKFRLEQKVYFKGQCL EEWFFEFGFVIPNSTNTWQSLIEAAPESQMMPASVLTGNVIIETKFFDDDLLVSTSRVRLFYV。
在一个具体例中,dTAG具有衍生自诱导的髓样白血病细胞分 化蛋白Mcl-1(UniProtKB-Q07820(MCL1_HUMAN),其通过引用并 入本文)的氨基酸序列的或其变体。在一个具体例中,dTAG是衍生 自氨基酸序列:(SEQ.ID.NO.:26)
MFGLKRNAVIGLNLYCGGAGLGAGSGGATRPGGRLLATEKEAS ARREIGGGEAGAVIGGSAGASPPSTLTPDSRRVARPPPIGAEVPD VTATPARLLFFAPTRRAAPLEEMEAPAADAIMSPEEELDGYEPEP LGKRPAVLPLLELVGESGNNTSTDGSLPSTPPPAEEEEDELYRQS LEIISRYLREQATGAKDTKPMGRSGATSRKALETLRRVGDGVQR NHETAFQGMLRKLDIKNEDDVKSLSRVMIHVFSDGVTNWGRIV TLISFGAFVAKHLKTINQESCIEPLAESITDVLVRTKRDWLVKQR GWDGFVEFFHVEDLEGGIRNVLLAFAGVAGVGAGLAYLIR。
在一个实施方案中,dTAG具有衍生自凋亡调节因子Bcl- 2(UniProtKB-Q07820(BCL2_HUMAN),其通过引用并入本文)的氨 基酸序列或其变体。在一个实施方案中,dTAG衍生自氨基酸序列: (SEQ.ID.NO.:27)
MAHAGRTGYDNREIVMKYIHYKLSQRGYEWDAGDVGAAPPGA APAPGIFSSQPGHTPHPAASRDPVARTSPLQTPAAPGAAAGPALS PVPPVVHLTLRQAGDDFSRRYRRDFAEMSSQLHLTPFTARGRFA TVVEELFRDGVNWGRIVAFFEFGGVMCVESVNREMSPLVDNIAL WMTEYLNRHLHTWIQDNGGWDAFVELYGPSMRPLFDFSWLSLKTLLSLALVGACITLGAYLGHK。
在一个实施方案中,dTAG具有衍生自肽基-脯氨酰基顺反异构 酶NIMA相互作用1(UniProtKB-Q13526(PIN1_HUMAN),其通过 引用并入本文)的氨基酸序列,或其变体。在一个实施方案中, dTAG是衍生自氨基酸序列:(SEQ.ID.NO.:28)
MADEEKLPPGWEKRMSRSSGRVYYFNHITNASQWERPSGNSSS GGKNGQGEPARVRCSHLLVKHSQSRRPSSWRQEKITRTKEEALE LINGYIQKIKSGEEDFESLASQFSDCSSAKARGDLGAFSRGQMQKPFEDASFALRTGEMSGPVFTDSGIHIILRTE。
在一个实施方案中,dTAG具有衍生自端锚聚合酶 1(UniProtKB-O95271(TNKS1_HUMAN),其通过引用并入本文)的 氨基酸序列或其变体。在一个实施方案中,dTAG是衍生自氨基酸序 列:(SEQ.ID.NO.:29)
MAASRRSQHHHHHHQQQLQPAPGASAPPPPPPPPLSPGLAPGTTP ASPTASGLAPFASPRHGLALPEGDGSRDPPDRPRSPDPVDGTSCC STTSTICTVAAAPVVPAVSTSSAAGVAPNPAGSGSNNSPSSSSSPT SSSSSSPSSPGSSLAESPEAAGVSSTAPLGPGAAGPGTGVPAVSGA LRELLEACRNGDVSRVKRLVDAANVNAKDMAGRKSSPLHFAAG FGRKDVVEHLLQ
MGANVHARDDGGLIPLHNACSFGHAEVVSLLLCQGADPNARDN WNYTPLHEAAIKGKIDVCIVLLQHGADPNIRNTDGKSALDLADP SAKAVLTGEYKKDELLEAARSGNEEKLMALLTPLNVNCHASDG RKSTPLHLAAGYNRVRIVQLLLQHGADVHAKDKGGLVPLHNAC SYGHYEVTELLLKHGACVNAMDLWQFTPLHEAASKNRVEVCSLLLSHGADPTLVNCHGKSAVDMAPTPELRERLTYEFKGHSLLQAA READLAKVKKTLALEIINFKQPQSHETALHCAVASLHPKRKQVT ELLLRKGANVNEKNKDFMTPLHVAAERAHNDVMEVLHKHGAK MNALDTLGQTALHRAALAGHLQTCRLLLSYGSDPSIISLQGFTA AQMGNEAVQQILSESTPIRTSDVDYRLLEASKAGDLETVKQLCS SQNVNCRDLEGRHSTPLHFAAGYNRVSVVEYLLHHGADVHAKD KGGLVPLHNACSYGHYEVAELLVRHGASVNVADLWKFTPLHEA AAKGKYEICKLLLKHGADPTKKNRDGNTPLDLVKEGDTDIQDLL RGDAALLDAAKKGCLARVQKLCTPENINCRDTQGRNSTPLHLA AGYNNLEVAEYLLEHGADVNAQDKGGLIPLHNAASYGHVDIAA LLIKYNTCVNATDKWAFTPLHEAAQKGRTQLCALLLAHGADPT MKNQEGQTPLDLATADDIRALLIDAMPPEALPTCFKPQATVVSASLISPASTPSCLSAASSIDNLTGPLAELAVGGASNAGDGAAGTER KEGEVAGLDMNISQFLKSLGLEHLRDIFETEQITLDVLADMGHEE LKEIGINAYGHRHKLIKGVERLLGGQQGTNPYLTFHCVNQGTILL DLAPEDKEYQSVEEEMQSTIREHRDGGNAGGIFNRYNVIRIQKV VNKKLRERFCHRQKEVSEENHNHHNERMLFHGSPFINAIIHKGFDERHAYIGGMFGAGIYFAENSSKSNQYVYGIGGGTGCPTHKDRS CYICHRQMLFCRVTLGKSFLQFSTMKMAHAPPGHHSVIGRPSVN GLAYAEYVIYRGEQAYPEYLITYQIMKPEAPSQTATAAEQKT。
在一个实施方案中,dTAG具有衍生自端锚聚合酶 2(UniProtKB-O9H2K2(TNKS2_HUMAN),其通过引用并入本文)的 氨基酸序列或其变体。在一个实施方案中,dTAG是衍生自氨基酸 序列:(SEQ.ID.NO.:30)
MSGRRCAGGGAACASAAAEAVEPAARELFEACRNGDVERVKRL VTPEKVNSRDTAGRKSTPLHFAAGFGRKDVVEYLLQNGANVQA RDDGGLIPLHNACSFGHAEVVNLLLRHGADPNARDNWNYTPLH EAAIKGKIDVCIVLLQHGAEPTIRNTDGRTALDLADPSAKAVLTG EYKKDELLESARSGNEEKMMALLTPLNVNCHASDGRKSTPLHLAAGYNRVKIVQLLLQHGADVHAKDKGDLVPLHNACSYGHYEV TELLVKHGACVNAMDLWQFTPLHEAASKNRVEVCSLLLSYGAD PTLLNCHNKSAIDLAPTPQLKERLAYEFKGHSLLQAAREADVTRI KKHLSLEMVNFKHPQTHETALHCAAASPYPKRKQICELLLRKGA NINEKTKEFLTPLHVASEKAHNDVVEVVVKHEAKVNALDNLGQ TSLHRAAYCGHLQTCRLLLSYGCDPNIISLQGFTALQMGNENVQ QLLQEGISLGNSEADRQLLEAAKAGDVETVKKLCTVQSVNCRDI EGRQSTPLHFAAGYNRVSVVEYLLQHGADVHAKDKGGLVPLHN ACSYGHYEVAELLVKHGAVVNVADLWKFTPLHEAAAKGKYEIC KLLLQHGADPTKKNRDGNTPLDLVKDGDTDIQDLLRGDAALLD AAKKGCLARVKKLSSPDNVNCRDTQGRHSTPLHLAAGYNNLEV AEYLLQHGADVNAQDKGGLIPLHNAASYGHVDVAALLIKYNACVNATDKWAFTPLHEAAQKGRTQLCALLLAHGADPTLKNQEGQT PLDLVSADDVSALLTAAMPPSALPSCYKPQVLNGVRSPGATADA LSSGPSSPSSLSAASSLDNLSGSFSELSSVVSSSGTEGASSLEKKEV PGVDFSITQFVRNLGLEHLMDIFEREQITLDVLVEMGHKELKEIGI NAYGHRHKLIKGVERLISGQQGLNPYLTLNTSGSGTILIDLSPDDKEFQSVEEEMQSTVREHRDGGHAGGIFNRYNILKIQKVCNKKLW ERYTHRRKEVSEENHNHANERMLFHGSPFVNAIIHKGFDERHAY IGGMFGAGIYFAENSSKSNQYVYGIGGGTGCPVHKDRSCYICHR QLLFCRVTLGKSFLQFSAMKMAHSPPGHHSVTGRPSVNGLALAE YVIYRGEQAYPEYLITYQIMRPEGMVDG。
在一个实施方案中,dTAG具有衍生自7,8-二氢-8-氧鸟嘌呤三磷 酸酶(UniProtKB-P36639(8ODP_HUMAN),其通过引用并入本文)的 氨基酸序列的或其变体。在一个实施方案中,dTAG是衍生自氨基 酸序列:(SEQ.ID.NO.:31)
MYWSNQITRRLGERVQGFMSGISPQQMGEPEGSWSGKNPGTMG ASRLYTLVLVLQPQRVLLGMKKRGFGAGRWNGFGGKVQEGETI EDGARRELQEESGLTVDALHKVGQIVFEFVGEPELMDVHVFCTD SIQGTPVESDEMRPCWFQLDQIPFKDMWPDDSYWFPLLLQKKKF HGYFKFQGQDTILDYTLREVDTV。
在一个实施方案中,dTAG具有衍生自原癌基因酪氨酸蛋白激酶 Src(UniProtKB-P12931(SRC_HUMAN),其通过引用并入本文)的氨 基酸序列的或其变体。在一个实施方案中,dTAG是衍生自氨基酸 序列:(SEQ.ID.NO.:32)
MGSNKSKPKDASQRRRSLEPAENVHGAGGGAFPASQTPSKPASA DGHRGPSAAFAPAAAEPKLFGGFNSSDTVTSPQRAGPLAGGVTT FVALYDYESRTETDLSFKKGERLQIVNNTEGDWWLAHSLSTGQT GYIPSNYVAPSDSIQAEEWYFGKITRRESERLLLNAENPRGTFLV RESETTKGAYCLSVSDFDNAKGLNVKHYKIRKLDSGGFYITSRT QFNSLQQLVAYYSKHADGLCHRLTTVCPTSKPQTQGLAKDAWE IPRESLRLEVKLGQGCFGEVWMGTWNGTTRVAIKTLKPGTMSPE AFLQEAQVMKKLRHEKLVQLYAVVSEEPIYIVTEYMSKGSLLDF LKGETGKYLRLPQLVDMAAQIASGMAYVERMNYVHRDLRAAN ILVGENLVCKVADFGLARLIEDNEYTARQGAKFPIKWTAPEAALYGRFTIKSDVWSFGILLTELTTKGRVPYPGMVNREVLDQVERGY RMPCPPECPESLHDLMCQCWRKEPEERPTFEYLQAFLEDYFTSTE PQYQPGENL。
在一个具体例中,dTAG包括在氨基酸位置341处用甘氨酸(G) 或丙氨酸(A)取代苏氨酸(T)。在一个具体例中,dTAG是衍生自SEQ ID NO.:62的氨基酸序列或其片段。
LRLEVKLGQGCFGEVWMGTWNGTTRVAIKTLKPGTMSPEAFLQ EAQVMKKLRHEKLVQLYAVVSEEPIYIVTEYGSKGSLLDFLKGE TGKYLRLPQLVDMAAQIASGMAYVERMNYVHRDLRAANILVG ENLVCKVADFGLARLIEDNEYTARQGAKFPIKWTAPEAALYGRF TIKSDVWSFGILLTELTTKGRVPYPGMVNREVLDQVERGYRMPCPPECPESLHDLMCQCWRKEPEERPTFEYLQAFLEDYF。
在一个具体例中,dTAG是衍生自SEQ.ID.NO.:63的氨基酸序 列或其片段。
LRLEVKLGQGCFGEVWMGTWNGTTRVAIKTLKPGTMSPEAFLQ EAQVMKKLRHEKLVQLYAVVSEEPIYIVTEYASKGSLLDFLKGE TGKYLRLPQLVDMAAQIASGMAYVERMNYVHRDLRAANILVG ENLVCKVADFGLARLIEDNEYTARQGAKFPIKWTAPEAALYGRF TIKSDVWSFGILLTELTTKGRVPYPGMVNREVLDQVERGYRMPCPPECPESLHDLMCQCWRKEPEERPTFEYLQAFLEDYF。
在一个具体例中,dTAG具有衍生自***素E合酶 (UniProtKB-O14684(PTGES_HUMAN),其通过引用并入本文)的氨 基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸序列: (SEQ.ID.NO.:33)
MPAHSLVMSSPALPAFLLCSTLLVIKMYVVAIITGQVRLRKKAFA NPEDALRHGGPQYCRSDPDVERCLRAHRNDMETIYPFLFLGFVY SFLGPNPFVAWMHFLVFLVGRVAHTVAYLGKLRAPIRSVTYTLAQLPCASMALQILWEAARHL。
在一个具体例中,dTAG具有衍生自花生四烯酸5-脂氧合酶活化 蛋白(UniProtKB-P20292(AL5AP_HUMAN),其通过引用并入本文) 的氨基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸 序列:(SEQ.ID.NO.:34)
MDQETVGNVVLLAIVTLISVVQNGFFAHKVEHESRTQNGRSFQR TGTLAFERVYTANQNCVDAYPTFLAVLWSAGLLCSQVPAAFAG LMYLFVRQKYFVGYLGERTQSTPGYIFGKRIILFLFLMSVAGIFNYYLIFFFGSDFENYIKTISTTISPLLLIP。
在一个具体例中,dTAG具有衍生自脂肪细胞的脂肪酸结合蛋白 (UniProtKB-P15090(FABP4_HUMAN),其通过引用并入本文)的氨 基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸序列: (SEQ.ID.NO.:35)
MCDAFVGTWKLVSSENFDDYMKEVGVGFATRKVAGMAKPNMI ISVNGDVITIKSESTFKNTEISFILGQEFDEVTADDRKVKSTITLDG GVLVHVQKWDGKSTTIKRKREDDKLVVECVMKGVTSTRVYER A。
在一个具体例中,dTAG具有衍生自PH相互作用蛋白 (UniProtKB-Q8WWQ0(PHIP_HUMAN),其通过引用并入本文)的氨 基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸序列: (SEQ.ID.NO.:36)
MSCERKGLSELRSELYFLIARFLEDGPCQQAAQVLIREVAEKELL PRRTDWTGKEHPRTYQNLVKYYRHLAPDHLLQICHRLGPLLEQE IPQSVPGVQTLLGAGRQSLLRTNKSCKHVVWKGSALAALHCGR PPESPVNYGSPPSIADTLFSRKLNGKYRLERLVPTAVYQHMKMH KRILGHLSSVYCVTFDRTGRRIFTGSDDCLVKIWATDDGRLLATL RGHAAEISDMAVNYENTMIAAGSCDKMIRVWCLRTCAPLAVLQ GHSASITSLQFSPLCSGSKRYLSSTGADGTICFWLWDAGTLKINP RPAKFTERPRPGVQMICSSFSAGGMFLATGSTDHIIRVYFFGSGQ PEKISELEFHTDKVDSIQFSNTSNRFVSGSRDGTARIWQFKRREW KSILLDMATRPAGQNLQGIEDKITKMKVTMVAWDRHDNTVITA VNNMTLKVWNSYTGQLIHVLMGHEDEVFVLEPHPFDPRVLFSA GHDGNVIVWDLARGVKIRSYFNMIEGQGHGAVFDCKCSPDGQH FACTDSHGHLLIFGFGSSSKYDKIADQMFFHSDYRPLIRDANNFV LDEQTQQAPHLMPPPFLVDVDGNPHPSRYQRLVPGRENCREEQL IPQMGVTSSGLNQVLSQQANQEISPLDSMIQRLQQEQDLRRSGEAVISNTSRLSRGSISSTSEVHSPPNVGLRRSGQIEGVRQMHSNAPRS EIATERDLVAWSRRVVVPELSAGVASRQEEWRTAKGEEEIKTYR SEEKRKHLTVPKENKIPTVSKNHAHEHFLDLGESKKQQTNQHNY RTRSALEETPRPSEEIENGSSSSDEGEVVAVSGGTSEEEERAWHS DGSSSDYSSDYSDWTADAGINLQPPKKVPKNKTKKAESSSDEEEESEKQKQKQIKKEKKKVNEEKDGPISPKKKKPKERKQKRLAVGE LTENGLTLEEWLPSTWITDTIPRRCPFVPQMGDEVYYFRQGHEA YVEMARKNKIYSINPKKQPWHKMELREQELMKIVGIKYEVGLPT LCCLKLAFLDPDTGKLTGGSFTMKYHDMPDVIDFLVLRQQFDD AKYRRWNIGDRFRSVIDDAWWFGTIESQEPLQLEYPDSLFQCYN VCWDNGDTEKMSPWDMELIPNNAVFPEELGTSVPLTDGECRSLI YKPLDGEWGTNPRDEECERIVAGINQLMTLDIASAFVAPVDLQA YPMYCTVVAYPTDLSTIKQRLENRFYRRVSSLMWEVRYIEHNTR TFNEPGSPIVKSAKFVTDLLLHFIKDQTCYNIIPLYNSMKKKVLSD SEDEEKDADVPGTSTRKRKDHQPRRRLRNRAQSYDIQAWKKQC EELLNLIFQCEDSEPFRQPVDLLEYPDYRDIIDTPMDFATVRETLE AGNYESPMELCKDVRLIFSNSKAYTPSKRSRIYSMSLRLSAFFEE HISSVLSDYKSALRFHKRNTITKRRKKRNRSSSVSSSAASSPERK KRILKPQLKSESSTSAFSTPTRSIPPRHNAAQINGKTESSSVVRTRS NRVVVDPVVTEQPSTSSAAKTFITKANASAIPGKTILENSVKHSK ALNTLSSPGQSSFSHGTRNNSAKENMEKEKPVKRKMKSSVLPKA STLSKSSAVIEQGDCKNNALVPGTIQVNGHGGQPSKLVKRGPGR KPKVEVNTNSGEIIHKKRGRKPKKLQYAKPEDLEQNNVHPIRDE VLPSSTCNFLSETNNVKEDLLQKKNRGGRKPKRKMKTQKLDAD LLVPASVKVLRRSNRKKIDDPIDEEEEFEELKGSEPHMRTRNQGR RTAFYNEDDSEEEQRQLLFEDTSLTFGTSSRGRVRKLTEKAKAN LIGW。
在一个具体例中,dTAG具有衍生自SUMO-缀合酶UBC9 (UniProtKB-P63279(UBC9_HUMAN),其通过引用并入本文)的氨基 酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸序列: (SEQ.ID.NO.:37)
MSGIALSRLAQERKAWRKDHPFGFVAVPTKNPDGTMNLMNWE CAIPGKKGTPWEGGLFKLRMLFKDDYPSSPPKCKFEPPLFHPNV YPSGTVCLSILEEDKDWRPAITIKQILLGIQELLNEPNIQDPAQAEAYTIYCQNRVEYEKRVRAQAKKFAPS。
在一个具体例中,dTAG具有衍生自蛋白质S100-A7 (UniProtKB-P31151(S10A7_HUMAN),其通过引用并入本文)的氨 基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸序列: (SEQ.ID.NO.:38)
MSNTQAERSIIGMIDMFHKYTRRDDKIEKPSLLTMMKENFPNFLS ACDKKGTNYLADVFEKKDKNEDKKIDFSEFLSLLGDIATDYHKQ SHGAAPCSGGSQ。
在一个具体例中,dTAG具有衍生自磷脂酶A2(膜结合的 UniProtKB-P14555(PA2GA_HUMAN),其通过引用并入本文)的氨 基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸序列: (SEQ.ID.NO.:39)
MKTLLLLAVIMIFGLLQAHGNLVNFHRMIKLTTGKEAALSYGFY GCHCGVGGRGSPKDATDRCCVTHDCCYKRLEKRGCGTKFLSYK FSNSGSRITCAKQDSCRSQLCECDKAAATCFARNKTTYNKKYQYYSNKHCRGSTPRC。
在一个具体例中,dTAG具有衍生自组蛋白脱乙酰酶6 (UniProtKB-Q9UBN7(HDAC6_HUMAN),其通过引用并入本文)的 氨基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸序 列:(SEQ.ID.NO.:40)
MTSTGQDSTTTRQRRSRQNPQSPPQDSSVTSKRNIKKGAVPRSIP NLAEVKKKGKMKKLGQAMEEDLIVGLQGMDLNLEAEALAGTG LVLDEQLNEFHCLWDDSFPEGPERLHAIKEQLIQEGLLDRCVSFQ ARFAEKEELMLVHSLEYIDLMETTQYMNEGELRVLADTYDSVY LHPNSYSCACLASGSVLRLVDAVLGAEIRNGMAIIRPPGHHAQH SLMDGYCMFNHVAVAARYAQQKHRIRRVLIVDWDVHHGQGTQ FTFDQDPSVLYFSIHRYEQGRFWPHLKASNWSTTGFGQGQGYTI NVPWNQVGMRDADYIAAFLHVLLPVALEFQPQLVLVAAGFDALQGDPKGEMAATPAGFAQLTHLL
MGLAGGKLILSLEGGYNLRALAEGVSASLHTLLGDPCP MLESPGAPCRSAQASVSCALEALEPFWEVLVRSTETVERDNMEE DNVEESEEEGPWEPPVLPILTWPVLQSRTGLVYDQNMMNHCNL WDSHHPEVPQRILRIMCRLEELGLAGRCLTLTPRPATEAELLTCH SAEYVGHLRATEKMKTRELHRESSNFDSIYICPSTFACAQLATGAACRLVEAVLSGEVLNGAAVVRPPGHHAEQDAACGFCFFNSVAV AARHAQTISGHALRILIVDWDVHHGNGTQHMFEDDPSVLYVSL HRYDHGTFFPMGDEGASSQIGRAAGTGFTVNVAWNGPRMGDA DYLAAWHRLVLPIAYEFNPELVLVSAGFDAARGDPLGGCQVSPE GYAHLTHLLMGLASGRIILILEGGYNLTSISESMAACTRSLLGDPP PLLTLPRPPLSGALASITETIQVHRRYWRSLRVMKVEDREGPSSS KLVTKKAPQPAKPRLAERMTTREKKVLEAG
MGKVTSASFGEESTPGQTNSETAVVALTQDQPSEAATGGATLAQ TISEAAIGGAMLGQTTSEEAVGGATPDQTTSEETVGGAILDQTTS EDAVGGATLGQTTSEEAVGGATLAQTTSEAAMEGATLDQTTSE EAPGGTELIQTPLASSTDHQTPPTSPVQGTTPQISPSTLIGSLRTLE LGSESQGASESQAPGEENLLGEAAGGQDMADSMLMQGSRGLTD QAIFYAVTPLPWCPHLVAVCPIPAAGLDVTQPCGDCGTIQENWV CLSCYQVYCGRYINGHMLQHHGNSGHPLVLSYIDLSAWCYYCQ AYVHHQALLDVKNIAHQNKFGEDMPHPH。
在一个具体例中,dTAG具有衍生自前蛋白原(UniProtKB- P07602(SAP_HUMAN),其通过引用并入本文)的氨基酸序列或其变 体。在一个具体例中,dTAG是衍生自氨基酸序列:(SEQ.ID.NO.: 41)
MYALFLLASLLGAALAGPVLGLKECTRGSAVWCQNVKTASDCG AVKHCLQTVWNKPTVKSLPCDICKDVVTAAGDMLKDNATEEEI LVYLEKTCDWLPKPNMSASCKEIVDSYLPVILDIIKGEMSRPGEV CSALNLCESLQKHLAELNHQKQLESNKIPELDMTEVVAPFMANI PLLLYPQDGPRSKPQPKDNGDVCQDCIQMVTDIQTAVRTNSTFV QALVEHVKEECDRLGPGMADICKNYISQYSEIAIQMMMHMQPK EICALVGFCDEVKEMPMQTLVPAKVASKNVIPALELVEPIKKHE VPAKSDVYCEVCEFLVKEVTKLIDNNKTEKEILDAFDKMCSKLP KSLSEECQEVVDTYGSSILSILLEEVSPELVCSMLHLCSGTRLPAL TVHVTQPKDGGFCEVCKKLVGYLDRNLEKNSTKQEILAALEKGCSFLPDPYQKQCDQFVAEYEPVLIEILVEVMDPSFVCLKIGACPS AHKPLLGTEKCIWGPSYWCQNTETAAQCNAVEHCKRHVWN。
在一个具体例中,dTAG具有衍生自载脂蛋白a(UniProtKB- P08519(APOA_HUMAN),其通过引用并入本文)的氨基酸序列或其 变体。在一个具体例中,dTAG是衍生自氨基酸序列:(SEQ.ID. NO.:42)
MEHKEVVLLLLLFLKSAAPEQSHVVQDCYHGDGQSYRGTYSTT VTGRTCQAWSSMTPHQHNRTTENYPNAGLIMNYCRNPDAVAAP YCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQ APTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHS HSRTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQAPTEQRPGVQECYHGN GQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYYPNAGLIMNY CRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVT PVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTC QAWSSMTPHSHSRTPEYYPNAGLIMNYCRNPDAVAAPYCYTRD PGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQAPTEQR PGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPE YYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDA EGTAVAPPTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRG TYSTTVTGRTCQAWSSMTPHSHSRTPEYYPNAGLIMNYCRNPDA VAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLE APSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRW EYCNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQAPTEQRPGVQEC YHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYYPNAG LIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVA PPTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVT GRTCQAWSSMTPHSHSRTPEYYPNAGLIMNYCRNPDAVAAPYC YTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQAP TEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHS RTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQ CSDAEGTAVAPPTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQ SYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYYPNAGLIMNYCR NPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPV PSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQA WSSMTPHSHSRTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPG VRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQAPTEQRPG VQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYY PNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEG TAVAPPTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTY STTVTGRTCQAWSSMTPHSHSRTPEYYPNAGLIMNYCRNPDAV AAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAP SEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMT PHSHSRTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEY CNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQAPTEQRPGVQECY HGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYYPNAGLI MNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAP PTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVT GRTCQAWSSMTPHSHSRTPEYYPNAGLIMNYCRNPDAVAAPYC YTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQAP TEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHS RTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQ CSDAEGTAVAPPTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQ SYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYYPNAGLIMNYCR NPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPV PSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQA WSSMTPHSHSRTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPG VRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQAPTEQRPG VQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYY PNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEG TAVAPPTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTY STTVTGRTCQAWSSMTPHSHSRTPEYYPNAGLIMNYCRNPDAV AAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMT PHSHSRTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEY CNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQAPTEQRPGVQECY HGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYYPNAGLI MNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAP PTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVT GRTCQAWSSMTPHSHSRTPEYYPNAGLIMNYCRNPDAVAAPYC YTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQAP TEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHS RTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQ CSDAEGTAVAPPTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQ SYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPV PSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQA WSSMTPHSHSRTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPG VRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQAPTEQRPG VQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYY PNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEG TAVAPPTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTY STTVTGRTCQAWSSMTPHSHSRTPEYYPNAGLIMNYCRNPDPVA APYCYTRDPSVRWEYCNLTQCSDAEGTAVAPPTITPIPSLEAPSE QAPTEQRPGVQECYHGNGQSYQGTYFITVTGRTCQAWSSMTPH SHSRTPAYYPNAGLIKNYCRNPDPVAAPWCYTTDPSVRWEYCN LTRCSDAEWTAFVPPNVILAPSLEAFFEQALTEETPGVQDCYYH YGQSYRGTYSTTVTGRTCQAWSSMTPHQHSRTPENYPNAGLTR NYCRNPDAEIRPWCYTMDPSVRWEYCNLTQCLVTESSVLATLT VVPDPSTEASSEEAPTEQSPGVQDCYHGDGQSYRGSFSTTVTGR TCQSWSSMTPHWHQRTTEYYPNGGLTRNYCRNPDAEISPWCYT MDPNVRWEYCNLTQCPVTESSVLATSTAVSEQAPTEQSPTVQDC YHGDGQSYRGSFSTTVTGRTCQSWSSMTPHWHQRTTEYYPNGG LTRNYCRNPDAEIRPWCYTMDPSVRWEYCNLTQCPVMESTLLT TPTVVPVPSTELPSEEAPTENSTGVQDCYRGDGQSYRGTLSTTIT GRTCQSWSSMTPHWHRRIPLYYPNAGLTRNYCRNPDAEIRPWC YTMDPSVRWEYCNLTRCPVTESSVLTTPTVAPVPSTEAPSEQAPP EKSPVVQDCYHGDGRSYRGISSTTVTGRTCQSWSSMIPHWHQRT PENYPNAGLTENYCRNPDSGKQPWCYTTDPCVRWEYCNLTQCS ETESGVLETPTVVPVPSMEAHSEAAPTEQTPVVRQCYHGNGQSY RGTFSTTVTGRTCQSWSSMTPHRHQRTPENYPNDGLTMNYCRN PDADTGPWCFTMDPSIRWEYCNLTRCSDTEGTVVAPPTVIQVPS LGPPSEQDCMFGNGKGYRGKKATTVTGTPCQEWAAQEPHRHST FIPGTNKWAGLEKNYCRNPDGDINGPWCYTMNPRKLFDYCDIPLCASSSFDCGKPQVEPKKCPGSIVGGCVAHPHSWPWQVSLRTRFG KHFCGGTLISPEWVLTAAHCLKKSSRPSSYKVILGAHQEVNLESH VQEIEVSRLFLEPTQADIALLKLSRPAVITDKVMPACLPSPDYMV TARTECYITGWGETQGTFGTGLLKEAQLLVIENEVCNHYKYICA EHLARGTDSCQGDSGGPLVCFEKDKYILQGVTSWGLGCARPNKPGVYARVSRFVTWIEGMMRNN。
在一个具体例中,dTAG具有衍生自乳谷胱甘肽裂解酶 (UniProtKB-Q04760(LGUL_HUMAN),其通过引用并入本文)的氨 基酸序列或其变体。在一个具体例中,dTAG是衍生自氨基酸序列: (SEQ.ID.NO.:43)
MAEPQPPSGGLTDEAALSCCSDADPSTKDFLLQQTMLRVKDPKK SLDFYTRVLGMTLIQKCDFPIMKFSLYFLAYEDKNDIPKEKDEKI AWALSRKATLELTHNWGTEDDETQSYHNGNSDPRGFGHIGIAVP DVYSACKRFEELGVKFVKKPDDGKMKGLAFIQDPDGYWIEILNP NKMATLM。
在一个具体例中,dTAG具有衍生自蛋白质afadin(UniProtKB- P55196(AFAD_HUMAN),其通过引用并入本文)的氨基酸序列或其 变体。在一个具体例中,dTAG是衍生自氨基酸序列:(SEQ.ID. NO.:44)
MSAGGRDEERRKLADIIHHWNANRLDLFEISQPTEDLEFHGVMR FYFQDKAAGNFATKCIRVSSTATTQDVIETLAEKFRPDMRMLSSP KYSLYEVHVSGERRLDIDEKPLVVQLNWNKDDREGRFVLKNEN DAIPPKKAQSNGPEKQEKEGVIQNFKRTLSKKEKKEKKKREKEA LRQASDKDDRPFQGEDVENSRLAAEVYKDMPETSFTRTISNPEV VMKRRRQQKLEKRMQEFRSSDGRPDSGGTLRIYADSLKPNIPYK TILLSTTDPADFAVAEALEKYGLEKENPKDYCIARV MLPPGAQHSDEKGAKEIILDDDECPLQIFREWPSDKGILVFQLKR RPPDHIPKKTKKHLEGKTPKGKERADGSGYGSTLPPEKLPYLVEL SPGRRNHFAYYNYHTYEDGSDSRDKPKLYRLQLSVTEVGTEKL DDNSIQLFGPGIQPHHCDLTNMDGVVTVTPRSMDAETYVEGQRI SETTMLQSGMKVQFGASHVFKFVDPSQDHALAKRSVDGGLMV KGPRHKPGIVQETTFDLGGDIHSGTALPTSKSTTRLDSDRVSSAS STAERGMVKPMIRVEQQPDYRRQESRTQDASGPELILPASIEFRE SSEDSFLSAIINYTNSSTVHFKLSPTYVLYMACRYVLSNQYRPDIS PTERTHKVIAVVNKMVSMMEGVIQKQKNIAGALAFWMANASEL LNFIKQDRDLSRITLDAQDVLAHLVQMAFKYLVHCLQSELNNY MPAFLDDPEENSLQRPKIDDVLHTLTGAMSLLRRCRVNAALTIQ LFSQLFHFINMWLFNRLVTDPDSGLCSHYWGAIIRQQLGHIEAW AEKQGLELAADCHLSRIVQATTLLTMDKYAPDDIPNINSTCFKLN SLQLQALLQNYHCAPDEPFIPTDLIENVVTVAENTADELARSDGR EVQLEEDPDLQLPFLLPEDGYSCDVVRNIPNGLQEFLDPLCQRGF CRLIPHTRSPGTWTIYFEGADYESHLLRENTELAQPLRKEPEIITV TLKKQNGMGLSIVAAKGAGQDKLGIYVKSVVKGGAADVDGRL AAGDQLLSVDGRSLVGLSQERAAELMTRTSSVVTLEVAKQGAIY HGLATLLNQPSPMMQRISDRRGSGKPRPKSEGFELYNNSTQNGS PESPQLPWAEYSEPKKLPGDDRLMKNRADHRSSPNVANQPPSPG GKSAYASGTTAKITSVSTGNLCTEEQTPPPRPEAYPIPTQTYTREY FTFPASKSQDRMAPPQNQWPNYEEKPHMHTDSNHSSIAIQRVTR SQEELREDKAYQLERHRIEAAMDRKSDSDMWINQSSSLDSSTSS QEHLNHSSKSVTPASTLTKSGPGRWKTPAAIPATPVAVSQPIRTD LPPPPPPPPVHYAGDFDGMSMDLPLPPPPSANQIGLPSAQVAAAE RRKREEHQRWYEKEKARLEEERERKRREQERKLGQMRTQSLNP APFSPLTAQQMKPEKPSTLQRPQETVIRELQPQQQPRTIERRDLQ YITVSKEELSSGDSLSPDPWKRDAKEKLEKQQQMHIVDMLSKEI QELQSKPDRSAEESDRLRKLMLEWQFQKRLQESKQKDEDDEEE EDDDVDTMLIMQRLEAERRARLQDEERRRQQQLEEMRKREAED RARQEEERRRQEEERTKRDAEEKRRQEEGYYSRLEAERRRQHDE AARRLLEPEAPGLCRPPLPRDYEPPSPSPAPGAPPPPPQRNASYLK TQVLSPDSLFTAKFVAYNEEEEEEDCSLAGPNSYPGSTGAAVGA HDACRDAKEKRSKSQDADSPGSSGAPENLTFKERQRLFSQGQDV SNKVKASRKLTELENELNTK。
在一个具体例中,dTAG具有衍生自表皮生长因子受体(EGFR, UniProtKB P00533(EGFR_HUMAN),其通过引用并入本文)的氨基 酸序列或其变体。在一个具体例中,dTAG是衍生自,包括或是氨基 酸序列:(SEQ.ID.NO.:53):(L858R)
GEAPNQALLRILKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKI PVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGICLTST VQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYL EDRRLVHRDLAARNVLVKTPQHVKITDFGRAKLLGAEEKEYHA EGGKVPIKWMALESILHRIYTHQSDVWSYGVTVWELMTFGSKP YDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPK FRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEE DMDDVVDADEYLIPQQG。
在一个具体例中,dTAG是衍生自,包括或是氨基酸序列: (SEQ.ID.NO.:54):(T790M)
GEAPNQALLRILKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKI PVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGICLTST VQLIMQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYL EDRRLVHRDLAARNVLVKTPQHVKITDFGRAKLLGAEEKEYHA EGGKVPIKWMALESILHRIYTHQSDVWSYGVTVWELMTFGSKP YDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPK FRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEE DMDDVVDADEYLIPQQG。在一个具体例中,SEQ ID NO.:54在位 置163处具有亮氨酸。
在一个具体例中,dTAG是衍生自,包括或是氨基酸序列: (SEQ.ID.NO.:55):(C797S)
GEAPNQALLRILKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKI PVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGICLTST VQLIMQLMPFGSLLDYVREHKDNIGSQYLLNWCVQIAKGMNYL EDRRLVHRDLAARNVLVKTPQHVKITDFGRAKLLGAEEKEYHA EGGKVPIKWMALESILHRIYTHQSDVWSYGVTVWELMTFGSKP YDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPK FRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEE DMDDVVDADEYLIPQQG。在一个具体例中,SEQ ID.NO.:55在 位置163处具有亮氨酸。在一个具体例中,SEQ.ID.NO.:55在95 位具有苏氨酸。在一个具体例中,SEQ.ID.NO.:55在位置163处具 有亮氨酸而在位置95处具有苏氨酸。
在一个具体例中,dTAG是衍生自,包括或是氨基酸序列: (SEQ.ID.NO.:56):(C790G)
GEAPNQALLRILKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKI PVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGICLTST VQLIMQLMPFGCGLDYVREHKDNIGSQYLLNWCVQIAKGMNYL EDRRLVHRDLAARNVLVKTPQHVKITDFGRAKLLGAEEKEYHA EGGKVPIKWMALESILHRIYTHQSDVWSYGVTVWELMTFGSKP YDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPK FRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEE DMDDVVDADEYLIPQQG。在一个具体例中,SEQ.ID.NO.:56在 位置163处具有亮氨酸。在一个具体例中,SEQ.ID.NO.:56在位 95处具有苏氨酸。在一个具体例中,SEQ.ID.NO.:56在位置163 处具有亮氨酸而在位置95处具有苏氨酸。
在一个具体例中,dTAG具有衍生自表皮生长因子受体(BCR- ABL或其变体)的氨基酸序列或其变体。在一个具体例中,dTAG是 衍生自,包括或是氨基酸序列:(SEQ.ID.NO.:57):(T315I)
SPNYDKWEMERTDITMKHKLGGGQYGEVYEGVWKKYSLT VAVKTLKEDTMEVEEFLKEAAVMKEIKHPNLVQLLGVCTREPPF YIIIEFMTYGNLLDYLRECNRQEVNAVVLLYMATQISSAMEYLE KKNFIHRDLAARNCLVGENHLVKVADFGLSRLMTGDTYTAHAG AKFPIKWTAPESLAYNKFSIKSDVWAFGVLLWEIATYGMSPYPGIDLSQVYELLEKDYRMERPEGCPEKVYELMRACWQWNPSDRPSF AEIHQAFETMFQES。在一个具体例中,SEQ.ID.NO.:57在位置 87处具有苏氨酸。
在一个具体例中,dTAG具有衍生自BCR-ABL(BCR-ABL)的氨 基酸序列或其变体。在一个具体例中,dTAG是衍生自,包括或是 氨基酸序列:(SEQ.ID.NO.:58):
SPNYDKWEMERTDITMKHKLGGGQYGEVYEGVWKKYSLTVAV KTLKEDTMEVEEFLKEAAVMKEIKHPNLVQLLGVCTREPPFYIIT EFMTYGNLLDYLRECNRQEVNAVVLLYMATQISSAMEYLEKKN FIHRDLAARNCLVGENHLVKVADFGLSRLMTGDTYTAHAGAKF PIKWTAPESLAYNKFSIKSDVWAFGVLLWEIATYGMSPYPGIDLS QVYELLEKDYRMERPEGCPEKVYELMRACWQWNPSDRPSFAEI HQAFETMFQES。
在一个具体例中,dTAG具有衍生自ALK(ALK,UniProtKB Q9UM73(ALK_HUMAN),其通过引用并入本文)的氨基酸序列或其 变体。在一个具体例中,dTAG是衍生自,包括或是氨基酸序列: (SEQ.ID.NO.:59)(L1196M):
ELQSPEYKLSKLRTSTIMTDYNPNYCFAGKTSSISDLKEVPR KNITLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCS EQDELDFLMEALIISKFNHQNIVRCIGVSLQSLPRFIMLELMAGG DLKSFLRETRPRPSQPSSLAMLDLLHVARDIACGCQYLEENHFIH RDIAARNCLLTCPGPGRVAKIGDFGMARDIYRAGYYRKGGCAM LPVKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKS NQEVLEFVTSGGRMDPPKNCPGPVYRIMTQCWQHQPEDRPNFAI ILERIEYCTQDPDVINTALPIEYGPLVEEEEK。在一个具体例中,SEQ.ID.NO.:59在位置136处具有亮氨酸。
在一个具体例中,dTAG具有衍生自JAK2(JAK2,UniProtKB O60674(JAK2_HUMAN),其通过引用并入本文)的氨基酸序列或其 变体。在一个具体例中,dTAG是衍生自,包括或是氨基酸序列: (SEQ.ID.NO.:60)(V617F):
VFHKIRNEDLIFNESLGQGTFTKIFKGVRREVGDYGQLHETE VLLKVLDKAHRNYSESFFEAASMMSKLSHKHLVLNYGVCFCGD ENILVQEFVKFGSLDTYLKKNKNCINILWKLEVAKQLAWAMHF LEENTLIHGNVCAKNILLIREEDRKTGNPPFIKLSDPGISITVLPKD ILQERIPWVPPECIENPKNLNLATDKWSFGTTLWEICSGGDKPLS ALDSQRKLQFYEDRHQLPAPKAAELANLINNCMDYEPDHRPSFR AIIRDLNSLFTPD。在一个具体例中,SEQ.ID.NO.:60在位置82 处具有缬氨酸。
在一个具体例中,dTAG具有衍生自BRAF(BRAF,UniProtKB P15056(BRAF_HUMAN),其通过引用并入本文)的氨基酸序列或其 变体。在一个具体例中,dTAG是衍生自,包括或是氨基酸序列: (SEQ.ID.NO.:61)(V600E):
DWEIPDGQITVGQRIGSGSFGTVYKGKWHGDVAVKMLNVT APTPQQLQAFKNEVGVLRKTRHVNILLFMGYSTAPQLAIVTQWC EGSSLYHHLHASETKFEMKKLIDIARQTARGMDYLHAKSIIHRDL KSNNIFLHEDNTVKIGDFGLATEKSRWSGSHQFEQLSGSILWMA PEVIRMQDSNPYSFQSDVYAFGIVLYELMTGQLPYSNINNRDQII EMVGRGSLSPDLSKVRSNCPKRMKRLMAECLKKKRDERPSFPRI LAEIEELARE。在一个具体例中,SEQ.ID.NO.:61在位置152处 具有缬氨酸。在一个具体例中,SEQ.ID.NO.:61在位置153处具有酪氨酸。在一个具体例中,SEQ.ID.NO.:61在位置152处具有缬 氨酸。在一个具体例中,SEQ.ID.NO.:61在位置153处具有赖氨 酸。在一个具体例中,SEQ.ID.NO.:61在位置152处具有缬氨酸, 在位置153处具有赖氨酸。
在一个具体例中,dTAG具有衍生自LRRK2蛋白(UniProtKB- Q5S007(LRRK2_HUMAN),其通过引用并入本文)的氨基酸序列或 其变体。在一个具体例中,dTAG是衍生自LRRK2氨基酸1328至 1511。在一个具体例中,dTAG是衍生自LRRK2氨基酸1328至 1511,其中氨基酸1441是半胱氨酸。
在一个具体例中,dTAG具有衍生自PDGFRα蛋白(UniProtKB- P09619(PDGFR_HUMAN),其通过引用并入本文)的氨基酸序列或其 变体。在一个具体例中,dTAG是衍生自P09619的氨基酸600至 692。在一个具体例中,dTAG是衍生自P09619的氨基酸600至692, 其中氨基酸674是异亮氨酸。
在一个具体例中,dTAG具有衍生自RET蛋白(UniProtKB- P07949(RET_HUMAN),其通过引用并入本文)的氨基酸序列或其变 体。在一个具体例中,dTAG衍生自P07949的氨基酸724至1016。 在一个具体例中,dTAG衍生自P07949的氨基酸724至1016,其中 氨基酸691是丝氨酸。在一个具体例中,dTAG衍生自P07949的氨 基酸724至1016,其中氨基酸749是苏氨酸。在一个具体例中, dTAG衍生自P07949的氨基酸724至1016,其中氨基酸762是谷氨 酰胺。在一个具体例中,dTAG衍生自P07949的氨基酸724至1016, 其中氨基酸791是苯丙氨酸。在一个具体例中,dTAG衍生自 P07949的氨基酸724至1016,其中氨基酸804是甲硫氨酸。在一个 具体例中,dTAG衍生自P07949的氨基酸724至1016,其中氨基酸 918是苏氨酸。
在一个具体例中,dTAG具有衍生自JAK3蛋白(UniProtKB- P52333(JAK3_HUMAN),其通过引用并入本文)的氨基酸序列或其 变体。
在一个具体例中,dTAG具有衍生自ABL蛋白(UniProtKB- P00519(ABL_HUMAN),其通过引用并入本文)的氨基酸序列或其变 体。
在一个具体例中,dTAG具有衍生自MEK1蛋白(UniProtKB- Q02750(MP2K1_HUMAN),其通过引用并入本文)的氨基酸序列或 其变体。
在一个具体例中,dTAG具有衍生自KIT蛋白(UniProtKB- P10721(KIT_HUMAN),其通过引用并入本文)的氨基酸序列或其变 体。
在一个具体例中,dTAG具有衍生自KIT蛋白(UniProtKB- P10721(KIT_HUMAN),其通过引用并入本文)的氨基酸序列或其变 体。
在一个具体例中,dTAG具有衍生自HIV逆转录酶蛋白 (UniProtKB-P04585(POL_HV1H2),其通过引用并入本文)的氨基酸 序列或其变体。
在一个具体例中,dTAG具有衍生自HIV整合酶蛋白 (UniProtKB-Q76353(Q76353_9HIV1),其通过引用并入本文)的氨基 酸序列或其变体。
B.感兴趣的蛋白质
如本文所考虑的,dTAG策略可用于在体内产生稳定表达的内源 性蛋白质-dTAG杂合体,或者根据情况可以离体或体外,其是通过 将dTAG核酸序列以5'-或3'-框内基因组***编码感兴趣的蛋白质的 核酸序列。在框内***dTAG核酸序列后,细胞表达内源性蛋白质- dTAG杂合体,允许通过给药能够结合dTAG并因此降解内源性蛋白 质-dTAG杂合体的异双功能性化合物,来调节内源性蛋白质-dTAG 杂合体的活性。在一个具体例中,内源性蛋白质-dTAG杂合体的活 性降低。
在某些具体例中,编码dTAG的核酸可以在框架内基因组*** 与编码参与疾病的蛋白质的基因。涉及可以靶向dTAG***的病症 的特定基因的非限制性实例包括作为非限制性实例,α-1抗胰蛋白酶 (A1AT),载脂蛋白B(APOB),血管生成素样蛋白3(ANGPTL3),前蛋白,转化酶枯草杆菌蛋白酶/kexin 9型(PCSK9),载脂蛋白 C3(APOC3),catenin(CTNNB1),低密度脂蛋白受体(LDLR),C反 应蛋白(CRP),载脂蛋白a(Apo(a)),因子VII,因子XI,抗凝血酶 III(SERPINC1),磷脂酰肌醇聚糖A类(PIG-A),C5,α-1抗胰蛋白 酶(SERPINA1),铁调素调节(TMPRSS6),(δ-氨基乙酰丙酸合成酶 1(ALAS-1),酰基CaA:二酰基甘油酰基转移酶(DGAT),miR-122, miR-21,miR-155,miR-34a,前激肽释放酶(KLKB1),***生 长因子(CCN2),细胞间粘附分子1(ICAM-1),胰高血糖素受体(GCGR),糖皮质激素受体(GCCR),蛋白酪氨酸磷酸酶(PTP-1B), c-Raf激酶(RAF1),成纤维细胞生长因子受体4(FGFR4),血管黏附 分子-1(VCAM-1),极晚期抗原-4(VLA-4),运甲状腺素蛋白(TTR), 存活运动神经元2(SMN2),生长激素受体(GHR),肌张力障碍肌强 直蛋白激酶(DMPK),细胞核酸结合蛋白(CNBP或ZNF9),凝聚素 (CLU),真核转译起始因子4E(eIF-4e),MDM2,MDM4,热休克蛋 白27(HSP 27),信号转导和转录激活因子3蛋白(STAT3)),血管内 皮生长因子(VEGF),驱动蛋白纺锤体蛋白(KIF11),乙型肝炎基因组, 雄激素受体(AR),无调性同源物1(ATOH1),血管内皮生长因子受 体1(FLT1),视网膜裂损1(RS1),视网膜色素上皮特异性65kDa蛋 白(RPE65),Rab护送蛋白1(CHM)和钠通道、电压门控、X型α亚 基(PN3或SCN10A)。可以通过dTAG***靶向的其他感兴趣的蛋白 质包括与功能获得突变相关的蛋白质,例如,致癌蛋白质。
在特别具体例中,用于靶向的感兴趣的蛋白质是apoB-100, ANGPTL3,PCSK9,APOC3,CRP,ApoA,因子XI,因子VII, 抗凝血酶III,磷脂酰肌醇聚糖A类(PIG-A),补体的C5组分,α-1- 抗胰蛋白酶(A1AT),TMPRSS6,ALAS-1,DGAT-2,KLB1, CCN2,ICAM,胰高血糖素受体,糖皮质激素受体,PTP-1B, FGFR4,VCAM-1,VLA-4,GCCR,TTR,SMN1,GHR,DMPK 或NAV1.8。
在一个具体例中,dTAG是5'或3'框内基因组整合到编码到与蛋 白病相关的内源性蛋白质的基因中。在一个具体例中,dTAG是5'或 3'框内基因组整合到编码与选自框内基因组***(5'或3')的病症相关 的内源性蛋白质的基因中。该编码内源性蛋白质的基因与下列相关: 阿尔茨海默病(淀粉样β肽(Aβ);Tau蛋白),脑β-淀粉样血管病(淀粉 样蛋白β肽(Aβ)),青光眼视网膜神经节细胞变性(淀粉样蛋白β肽 (Aβ)),朊病毒疾病(朊蛋白),帕金森病和其他突触核蛋白病(α-突触 核蛋白),Tau蛋白病(微管相关蛋白tau(Tau蛋白)),额颞叶变性 (FTLD)(Ubi+、Tau-)(TDP-43),FTLD-FUS(融合于肉瘤(FUS)蛋 白),肌萎缩侧索硬化症(ALS)(超氧化物歧化酶、TDP-43、FUS), 亨廷顿氏病和其他三联体重复疾病(蛋白质与串联谷氨酰胺扩增),家 族性英国痴呆症(ABri),家族性丹麦痴呆症(Adan),H伴有淀粉样 变性的遗传性脑出血(冰岛)(HCHWA-I)(胱抑素C), CADASIL(Notch3),亚历山大病(胶质纤维酸性蛋白(GFAP)), Seipin蛋白病变(Seipin蛋白),家族性淀粉样变性神经病,老年性系 统性淀粉样变性(运甲状腺素蛋白),Serpino蛋白病变(Serpin蛋白), AL(轻链)淀粉样变性(原发性***性淀粉样变性)(单克隆免疫球蛋白 轻链),AH(重链)淀粉样变性(免疫球蛋白重链),AA(继发性)淀粉样 变性(淀粉样蛋白A蛋白),II型糖尿病(胰岛淀粉样蛋白多肽(IAPP; amylin)),主动脉内侧淀粉样变性(Medin(乳黏素)),ApoAI淀粉样变 性(载脂蛋白AI),ApoAII淀粉样变性(载脂蛋白AII),ApoAIV淀粉 样变性(载脂蛋白AIV),芬兰型家族性淀粉样变性(FAF)(凝溶胶蛋 白),溶菌酶淀粉样变性(溶菌酶),纤维蛋白原淀粉样变性(纤维蛋白 原),透析淀粉样变性(β-2微球蛋白),包涵体肌炎/肌病(淀粉样蛋白 β肽(Aβ)),白内障(结晶蛋白),视网膜色素变性与视紫红质突变(视 紫红质),甲状腺髓样癌(降钙素),心房性淀粉样变性(心房利钠因子), 垂体泌乳素瘤(催乳素),遗传性晶格角膜营养不良(角膜透明质酸), 皮肤苔癣淀粉样变性(角蛋白),马洛里体(角蛋白中间丝蛋白),角膜 乳铁蛋白淀粉样变性(乳铁蛋白),肺泡蛋白沉积症(表面活性蛋白 C(SP-C)),牙源性(Pindborg)肿瘤淀粉样蛋白(牙源性成釉细胞相关蛋 白),***淀粉样蛋白(精胶蛋白I),囊性纤维化(囊性纤维化跨膜 传导调节因子(CFTR)蛋白),镰状细胞病(血红蛋白)和重症病肌病 (CIM)(肌球蛋白泛素化的超蛋白水解状态)。
如本文所考虑的,通过将编码dTAG的核酸基因组框内***特 定感兴趣的蛋白质,可以通过给药对dTAG特异的异双功能性化合 物来实现对感兴趣的蛋白质的调节,该dTAG与蛋白质-dTAG杂交 体结合,导致它的降解。由于以这种方式调节特定感兴趣的蛋白质的能力,这种策略可用于治疗其中细胞内某些阈值水平以上的蛋白质表 达导致患病状态的病症。该技术的其他应用包括但不限于1.)蛋白质 的靶向降解,其中病理学是功能获得突变的函数,2)蛋白质的靶向降 解,其中病理学是扩增或增加的表达的函数,3)作为单基因疾病表 现的蛋白质的靶向降解,4)蛋白质的靶向降解,其中遗传易感性表现 出更长的时间并且通常在替代的生物补偿机制之后不再充分,例如但 不限于高胆固醇血症和蛋白质病。
通过内源性蛋白质-dTAG杂合体的受控降解,蛋白质表达或活 性动力学的有利变化可导致在有此需要的受试者中预防和/或治疗病 症。
能够通过目前预期的方法治疗的示例性疾病和病症描述于例如题 为“Methodsand Compositions for Prevention of treatment of a Disease”的美国申请案第20150329875号中,其通过引用并入本文。
在某些具体例中,靶蛋白参与脂质代谢。例如,高胆固醇血症是 一种特征在于血液中胆固醇水平非常高的病症,已知会增加冠状动脉 疾病的风险。家族性高胆固醇血症,高脂血症和家族性乳糜微粒血症 是通过异常基因导致观察到的症状学的家族的遗传病症。编码LDL 受体(LDLR),载脂蛋白B(APOB),血管生成素样蛋白3(ANGPTL3) 和前蛋白转化酶枯草杆菌蛋白酶/kexin 9型(PCSK9)的基因的突变参 与这些疾病。LDLR用于从血浆中去除LDL以便内化到细胞中。 LDLR是一种跨膜蛋白,定位于网格蛋白包被的凹坑,在那里它与ApoB-100(APOB的较长基因产物)和富含apoE的脂蛋白形成复合物。 在该复合物的内吞作用后,它移动到内体,其中脂蛋白从复合物中释 放出来,最终被溶酶体降解。然后可以将LDLR再循环回细胞表面。
apoB-100缺陷的患者,称为“家族性缺陷型载脂蛋白B”(FDB), APOB中经常携带R3500Q突变,这使得LDL与LDLR结合的能力 降低,血浆清除率降低,从而提高血浆脂肪酸水平(Innerarity)et al., (1987)PNAS USA 84:6919)。FDB通常被认为是常染色体显性病症, 并且发生在大约1:700的欧洲血统人群中(Ginsburg and Willard (2012)Genomicand Personalized Medicine,volume 1and 2.Dational Press,London,page 507)。因此,在有apoB-100突变异型合子的 FDB患者中,通过在肝细胞的等位基因中框内***dTAG并给药异 双功能性化合物,从而产生apo-100缺陷型蛋白质-dTAG杂合体的 基因产物,特异性降解缺陷型apoB-100等位基因可导致疾病的纠正。
类似地,导致ANGPTL3水平升高的血管生成素样蛋白 3(ANGPTL3)过表达突变可引起受试者的高脂血症。ANGPTL3还可 作为脂蛋白脂酶(LPL)和内皮脂肪酶(EL)的双重抑制剂,并增加啮齿 动物的血浆甘油三酯和高密度脂蛋白胆固醇。ANGPTL3主要在肝脏 中表达并分泌,通常用于增加甘油三酯,LDL胆固醇和HDL胆固醇 的血浆水平,其中它直接作用于肝脏以调节肝细胞脂蛋白的分泌和清 除(Musunuru et al,(2010)N Engl J Med 363:23p.2220)。因此,本 发明的方法可用于通过使用本文所述的dTAG***策略靶向降解蛋 白质来治疗与ANGPTL3过表达相关的高脂血症。
PCSK9是另一种编码蛋白质的基因,该蛋白质在胆固醇体内平 衡中起主要调节作用。PCSK9与LDLR的表皮生长因子样重复 A(EGF-A)结构域结合,并诱导LDLR降解。已描述PCSK9(例如 S127R,P216L,D374Y和N157K)的常染色体显性,功能性突变的 毒性增加,并且与高脂血症和家族性高胆固醇血症(FH)相关,这是 由于LDLR降低的速率增加导致相应的增加。血浆LDL胆固醇 (Abifadel et al.(2003)Nat Gen 34(2):154)。此外,已发现功能丧失 的PCSK9突变(例如Y142X,C679X和R46L)导致肝脏LDLR水平 升高,血浆LDL胆固醇含量显着下降,导致发病率降低88%冠心病 (Cohen et al.,(2003)New Eng J Med 354(12):1264)。因此,本发明 的方法和组合物可用于通过使用本文所述的dTAG***策略靶向降 解PCSK9蛋白来治疗或预防高脂血症和/或FH。
家族性乳糜微粒血症综合征(FCS)的特征在于极高水平的血浆甘 油三酯,并导致许多健康问题,例如腹痛,肝脏和脾脏肿大以及复发 性急性胰腺炎。此外,有甘油三酯水平高的受试者没有FCS,但由 于甘油三酯升高,有类似的健康问题。由APOC3基因编码的载脂蛋 白C3或apo-CIII是极低脂蛋白(VLDL),LDL,HDL和乳糜微粒的 组分,并且通常通过抑制脂蛋白脂肪酶和肝脂酶来抑制脂解作用。 Apo-CIII抑制富含甘油三酯的颗粒的肝摄取,并且可以在患有高脂 血症的患者中升高(Bobik,(2008)Circulation 118:702)并且是独立的 心血管疾病风险因子。敲除小鼠中的APOC3基因导致动物与正常相 比具有降低的血浆甘油三酯水平(Maeda et al.,(1994)J Biol Chem 269(38):23610)。因此,本发明的方法和组合物可用于通过使用本文 所述的dTAG***策略靶向降解APOC3蛋白来预防或治疗患有脂质 代谢紊乱(例如,家族性高胆固醇血症,高脂血症和家族性乳糜微粒 血症)的受试者。
在其他具体例中,靶蛋白参与血管疾病,例如心血管疾病和冠状 动脉疾病。与上面讨论的脂质代谢紊乱类似,冠状动脉疾病也可以由 特定基因引起。例如,C-反应蛋白(CRP)是肝脏中产生的与炎性疾病 相关的蛋白质。它是一种急性期蛋白,与死亡或垂死细胞表面表达的 磷酸胆碱结合,其作用是激活补体***以帮助清除细胞。在慢性炎性 疾病中,CRP水平升高可能通过促进和放大整体慢性炎症状态而加 剧疾病症状。此外,已经在大鼠模型中显示CRP增加心肌和脑梗塞 面积,当转译成人类患者时,可预测心脏病发作后更负面的预后。当 将CRP抑制剂引入这些大鼠模型时,梗塞面积和心脏功能障碍降低 (Pepyset al.(2005)Nature 440(27):1217)。因此,抑制CRP可能对 炎性疾病和冠状动脉疾病都有益。本发明的方法和组合物可用于通过 使用本文所述的dTAG***策略靶向降解CRP蛋白来引起CRP表达 的调节。
血浆脂蛋白(Lp(a))是包含载脂蛋白(a)(apo(a))的低密度脂蛋白颗 粒,并且也是包括动脉粥样硬化在内的心血管疾病的独立危险因素。 Apo(a)通过apoB-100与LDL表面接触,通过二硫键连接,据报道, 与Apo(a)水平升高相关的遗传多态性与心肌梗死的过度发生率相关 (Chasman et al.,(2009)Atherosclerosis 203(2):371)。血浆中Lp(a) 浓度在个体之间的浓度变化很大,其中这些浓度差异似乎是遗传决定 的。apo(a)基因包含许多纤溶酶原kringle 4样重复,并且这些 kringle重复的数量与Lp(a)的血浆浓度成反比。设计用于对载脂蛋白 (a)产生免疫应答并引起抗体介导的Lp(a)清除的DNA疫苗方法证明 Lp(a)在小鼠中的动脉粥样硬化活性降低(Kyutoku et al.,(2013))Sci Rep 3doi:10.1038/srep1600)。因此,通过使用本文所述的dTAG插 入策略靶向降解ApoA蛋白,本发明的方法和组合物可用于降低 ApoA蛋白的表达,导致Lp(a)的血浆浓度降低。
凝血障碍,通常被称为血栓形成倾向,可能在血管疾病中产生分 枝。调节哺乳动物凝血的生化事件的复杂网络包括5种蛋白酶(因子 II,VII,IX和X以及蛋白C),其与5种辅因子(组织因子,因子V, 因子VIII,血栓调节蛋白和表面膜蛋白)相互作用以产生纤维蛋白, 是凝块的主要成分。强有力的内源促凝血剂和血栓抗性力之间存在微 妙的平衡,以确保血液的流动性,并且如果发生损伤则保持这些因子 准备好诱导血液凝块。因子XI和因子VII的高血浆活性与高凝和血 栓性疾病(冠状动脉梗塞,中风,深静脉血栓形成,肺栓塞)和患者预 后差有关。已经证明,具有严重因子XI缺乏的人被保护免于缺血性 脑损伤和中风(Saloman et al.(2008)Blood 111:4113)。同时,已经 显示高水平的FXI与患者中更高的卒中事件发生率相关(Yang et al. (2006)Am J Clin Path 126:411)。类似地,高因子VII水平也与冠状 动脉疾病相关,尽管这通过诸如如何测量因子VII以及分析哪种形式 的蛋白质等其他考虑因素而变得复杂(Chan et al.(2008)Circulation 118:2286)。因此,本发明的方法和组合物可用于通过使用本文所述 的dTAG***策略靶向降解因子XI和/或因子VII,而选择性降解与 疾病相关的凝血因子(例如,因子VII和因子XI)来预防或治疗患有血栓形成疾病的受试者。。
如上所述,凝血级联的平衡是至关重要的。因此,除了凝血因子 的重要性之外,这些因子的抑制剂也是关键的。患有血友病的患者缺 乏凝血级联的一种或多种组分,因此具有降低的凝血能力。在该级联 的最后步骤之一中,凝血酶作用于纤维蛋白原以产生作为凝块的主要 成分的纤维蛋白。级联导致活性凝血酶的产生允许这种情况发生。为 了保持***平衡,抗凝血酶(也称为抗凝血酶III,由SERPINC1基因 编码)作用于凝血酶以抑制其作用。在许多血友病患者中,因子缺乏 不是绝对的,并且存在一定程度的凝血。因此,基于抗凝血酶降解的 方法可以允许凝血级联可能与哪个因子缺乏有关而在上游因子受限时, 产生足够的凝固。已经使用源自血友病A患者的血液证明了这一点 (参见Di Micco et al.(2000)Eur J Pharmacol.March 10;391(1-2):1- 9.)。本发明的方法和组合物可用于通过使用本文所述的dTAG*** 策略靶向降解抗凝血酶III蛋白来治疗血友病患者,例如血友病A和 血友病B。
靶蛋白质也可能参与血液病症(血液病症)。补体***是多种血液 学条件下的关键参与者。阵发性睡眠性血红蛋白尿(PNH)是由PIG-A 基因缺陷引起的溶血性疾病(参见Brodsky(2008)Blood Rev 22(2):65)。PIG-A基因产物磷脂酰肌醇聚糖A类是合成GPI锚定蛋 白的第一步所必需的。在X染色体上发现PIG-A,并且PIG-A中的 突变导致红细胞对补体导致的溶血敏感。值得注意的是,这些突变细 胞缺乏GPI锚定蛋白CD55和CD59。CD59直接与补体相关的膜攻 击复合物(或MAC)相互作用,通过阻断C9的聚集来防止裂解孔的形 成,C9是孔组装的关键步骤。CD55的功能是加速C3转化酶的破 坏,因此在没有CD55的情况下,存在更多的C3转化酶,导致更多 的MAC形成。因此,缺乏这两种蛋白质导致突变红细胞的裂解增加。 对于PNH患者,由于血栓形成增加引起的并发症是最大的问题 (Brodsky(2008)Blood Rev 22(2):65)。40%的PNH患者持续血栓形 成,可导致中风和急性心血管疾病。因此,本发明的方法和组合物可 用于通过使用本文所述的dTAG***策略靶向降解磷脂酰肌醇聚糖 A类(PIG A)来治疗和/或预防受试者中的PHN。
补体的C5成分的抑制已被批准用于治疗PNH和非典型溶血性 ***综合征(aHUS),证实C5是重要的治疗靶标。当由于补体*** 的失调(先天免疫的一部分)导致细胞被替代途径破坏时,发生与 aHUS相关的红细胞的溶血。通常,破坏性C3bBb复合物在入侵细胞(例如细菌)的表面上形成,以加速其作为补体***中替代途径的一 部分的破坏。C3bBb复合物可以结合另一个C3b以形成C3bBbC3b 复合物,然后该复合物充当C5转化酶。C5转化酶将C5切割成C5a 和C5b,并且C5b募集C6、C7、C8和C9以形成MAC。一组补体 调节蛋白(例如CD35、CD46、CD55和CD59)位于身体本身细胞上, 以抑制这些蛋白质的活性,从而保护它们。然而,当这些调节蛋白质 存在不平衡时,C3bBb复合物可能不适当地形成(de Jorge etal. (2011)J Am Soc Nephrol 22:137)。除了过早破坏红细胞外,这种综 合征还可能由于肾小球滤过装置的破坏和堵塞而导致肾脏疾病。当与 具有补体调节蛋白突变的小鼠杂交时,显示C5阴性小鼠受到保护, 该数据已被用于验证C5作为aHUS(de Jorge,同上)中的靶标以及与 补体失调相关的其他疾病的想法。C5b特异性单克隆抗体依库珠单 抗(eculizamab)已成功用于治疗aHUS(Gruppo and Rother,(2009)N Engl J Med 360;5 p544)和其他补体介导的疾病(例如阵发性睡眠性 血红蛋白尿症(PNH)(Hillmen et al.,(2013)Br.J Haem 162:62))。因 此,本发明的方法和组合物可用于调节C5的表达,从而通过使用本 文所述的dTAG***策略通过靶向降解C5来预防或治疗与补体失调 相关的疾病。
α-1-抗胰蛋白酶(A1AT)缺乏在欧洲血统的1500至3000人中发 生约1例,但在亚洲血统的个体中很少见。α-1-抗胰蛋白酶蛋白是由 SERPINA1基因编码的蛋白酶抑制剂,用于保护细胞免受炎性细胞 释放的蛋白酶的活性,包括中性粒细胞弹性蛋白酶,胰蛋白酶和蛋白 酶-3(PR-3)。缺陷是由杂合子中的突变SERPINA1基因引起的常染 色体共显性或隐性疾病,其中突变等位基因的表达减少或具有差的抑 制活性的突变体A1AT蛋白的表达导致长期缺乏对中性粒细胞弹性 蛋白酶的抑制,导致组织损伤。最常见的SERPINA1突变包含Glu342Lys取代(也称为Z等位基因),其导致蛋白质在患者肝细胞的 内质网中形成有序聚合物。这些内含物最终导致肝硬化,其只能通过 肝移植治疗(Yusa et al.,(2011)Nature478 p.391)。肝细胞内的聚合 导致血浆A1AT水平的严重降低,导致这种炎性疾病的风险增加。 此外,A1AT缺乏与肺病有关,包括慢性阻塞性肺病(COPD),肺气 肿和慢性支气管炎(Tuder et al.(2010)Proc Am Thorac Soc 7(6): p.381)并且可能具有更广泛的抑制其他疾病的进展,包括1型和2型 糖尿病,急性心肌梗死,类风湿性关节炎,炎症性肠病,囊性纤维化, 移植排斥,移植物抗宿主病和多发性硬化症(Lewis(2012)Mol Med 18(1)p.957)。人口研究表明,为避免这些疾病,最低ATA1血浆阈 值约为0.5mg/mL(正常血浆水平在非炎症状态下约为0.9至1.75 mg/ml),及对于严重缺乏血浆A1AT肺气肿患者来说,目前的治疗方法主要通过使用支气管扩张剂等来减轻症状,虽然每周输注 A1AT也可作为选择。与A1AT相关的严重肺病最终也通 过移植治疗。用于治疗A1AT缺陷的临床试验涉及多种方法,包括 递送浓缩的A1AT蛋白,通过IM注射使用包含A1AT基因的AAV 构建体,以及在HIV中使用A1AT,仅列举一些。因此,本发明的 组合物和方法可用于通过使用本文所述的dTAG***策略靶向降解 α-1-抗胰蛋白酶蛋白来治疗或预防与A1AT缺乏相关的疾病,从而消 除可导致肝硬化的肝脏聚集体。
另一种感兴趣的肝脏靶标包括参与体内铁含量调节的任何蛋白质。 铁对血红蛋白的产生至关重要,但过量会导致活性氧的产生。在依赖 于输血的患者(例如某些血友病,血红蛋白病)中,继发性铁过载是常 见的。铁调节激素铁调素及其受体和铁通道铁转运蛋白通过促进其细 胞摄取来控制铁的膳食吸收,储存和组织分布。铁调素的调节在转录 水平进行,并且对血浆中的铁浓度敏感,其中铁调素表达增加导致血 浆铁浓度降低。通过涉及称为血幼素的受体的一系列受体-配体相互 作用,铁调素基因被SMAD转录因子上调。铁相关的铁调素下调依 次受称为TMPRSS6的蛋白酶的调节,该蛋白酶切割血幼素并阻止铁调素的上调(Ganz(2011)Blood 117:4425)。通过使用靶向TMRSS6 mRNA的抑制性RNA下调TMPSS6表达已显示导致小鼠模型中铁过 载的减少(Schmidt et al.,(2013)Blood 121:1200)。因此,本发明的 方法和组合物可用于通过使用本文所述的dTAG***策略靶向TMPRSS6以降解。
与体内铁利用途径相关的其他条件是卟啉症。这些疾病是由血红 素合成中涉及的酶的许多缺陷引起的。急性间歇性卟啉症(AIP)是一 种常染色体显性疾病,是第二常见的卟啉症,其发病率约为10万人 中的5至10人。AIP是由羟甲基硅烷合成酶(HMBS合酶(HMBS), 也称为胆色素原-脱氨酶)缺乏引起的,其中HMBS基因的突变非常 异质,包括错义和点突变(Solis et al.(1999)Mol Med 5:664)。可 能威胁生命的AIP攻击可具有胃肠道,神经精神,心血管和神经系 统表现。攻击有几个诱因,可能持续数天,并且经常需要住院治疗, 并且可能由几种看似无关的因素引起,包括某些药物,感染,热量限 制,吸烟,酒精和与***有关的荷尔蒙波动(Yasuda et al.(2010 年))Mol Ther 18(1):17)。HMB合酶是血红素合成途径的一部分, 其中甘氨酸和琥珀酰-CoA通过δ-氨基乙酰丙酸合成酶1(ALAS-1)连 接以制备氨基乙酰丙酸,然后氨基乙酰丙酸脱水酶(ALAD)作用以产 生磷酸化纤维蛋白原。磷酸基肽原通过HMB合酶转化为羟甲基硅烷。 该途径从那里继续,最终产生血红素(Ajioka et al.(2006)Biochim Biophys Acta 1762:723)。无论触发因素如何,所有攻击都会导致酶 δ-氨基乙酰丙酸合成酶1(ALAS-1)升高。这种酶是肝脏血红素合成途 径中的第一种酶,当被诱导时,HMB合成酶的缺乏变为限速并且氨 基乙酰丙酸和磷酸化纤维蛋白原前体积累(Yasuda,同上)。AIP患者 的肝移植可以阻止发作,表明靶向肝脏可能对治疗有益。此外,在 AIP的小鼠模型中,小鼠只有30%的正常HMB合成酶水平,编码 HMB合成酶的转基因HMBS的***导致给予小鼠***时氨基乙 酰丙酸和磷酸化蛋白原积累减少(Yasuda,同上)。设计用于抑制 ALAS-1的双股RNA也已显示在小鼠AIP模型中减少体内ALAS-1 表达并减少响应***治疗的磷酸胆碱原积累(参见美国专利公开 案第20130281511号)。因此,本发明的方法和组合物可用于通过使 用本文所述的dTAG***策略靶向降解ALAS-1来预防和治疗AIP。
非酒精性脂肪性肝病(NAFLD)是世界范围内最常见的肝脏疾病, 在西方人群中患病率为15%至30%,并且是由肝脏内甘油三酯积聚 引起的。然而,超重人群的患病率增加到58%,肥胖人群的患病率 增加到98%。非酒精性脂肪性肝炎(NASH)是其中已发生肝损伤的 NAFLD的更高级形式,并且可导致肝衰竭,门静脉高压症,肝癌和 肝硬化(Schwengerand Allard(2014)World J Gastronen 20(7):1712)。 证据似乎表明,在NALFD中观察到的肝脏甘油三酯积累与肝脏胰岛 素抵抗密切相关,通常作为2型糖尿病和代谢综合征的一部分(Choi et al.(2017,J Biol Chem 282(31):22678)。酰基-CaA:二酰基甘油 酰基转移酶(DGAT)通过促进具有长链的酰基Co A的sn-1,2二酰基 甘油(DAG)的连接来催化甘油三酯合成的最后一步。有两种主要的同 种型DGAT,即DGAT-1和DGAT-2。DGAT-1主要在小肠中表达, 而DGAT-2主要表现为肝脏表达(其表达为胰岛素反应)。使用反义寡 核苷酸在饮食诱导的NALFD大鼠中敲除DGAT-1或DGAT-2的表 达显着改善DGAT-2敲低后的肝脂肪变,性但不改善DGAT-1敲除 (Choi,同上)。因此,本发明的材料和方法可用于改变DGAT-2的表 达以治疗NASH和NALFD,以及通过使用本文所述的dTAG***策 略靶向降解DGAT-2来降低肝胰岛素抗性。
进一步的血管靶标包括那些涉及遗传性血管性水肿(HAE)者。 HAE是一种常染色体显性遗传疾病,每50,000人中影响1人,这是 C1抑制剂水平降低的结果。患者在身体任何部位出现肿胀反复发作, 其中肿瘤位于口咽部,喉部或腹部,发病率和死亡风险最高(参见, Tse andZuraw,(2013)Clev Clin J of Med 80(5):297)。由于过量产 生缓激肽,该疾病由血浆外渗到组织中而发生。该机制似乎涉及通过 激活因子XII切割前激肽释放酶(也称为PKK),释放活性血浆激肽释 放酶(其激活更多因子XII)。然后血浆激肽释放酶切割激肽原,释放 缓激肽。然后缓激肽与内皮细胞上的B2缓激肽受体结合,增加内皮 细胞的通透性。通常,C1抑制剂(由SERPING1编码)通过抑制血浆 激肽释放酶和因子XII的活化来控制缓激肽的产生。HAE有三种类 型,即以存在的C1抑制剂的数量和类型区别的I型和II型和与因子 XII中的Thr309Lys突变相关的III型(Prieto et al.(2009)Allergy 64(2):284)。I型HAE具有低水平的C1抑制剂,其似乎是由于少量 C1抑制蛋白的表达和破坏而导致的。1型占HAE患者的约85%。II 型患者具有正常水平的C1抑制剂,但C1抑制蛋白由于突变而无效(Tse andZuraw,同上)。已经表征了SERPING1中超过250个导致I 型HAE的突变,包括小的和大的***和缺失以及重复(Rijavec et al.,(2013)PLoS One 8(2):e56712)。由于HAE遗传基础的这种高度 可变性,本发明的方法和组合物可用于通过在HAE的表现中靶向下 游参与者来预防或治疗HAE。例如,靶向前激肽释放酶(KLKB1, 在肝细胞中表达)以实现前激肽释放酶(缩写为PKK)表达的减少可导 致缓激肽产生减少,而不考虑引起HAE的上游突变类型,从而导致 血浆外渗减少。因此,本发明的方法和组合物可用于引起KLKB1表 达的降低,以通过使用本文所述的dTAG***策略靶向降解KLKB1 来预防或治疗HAE。
靶标也可能与纤维化疾病有关。各种器官中的纤维化疾病是器官 功能障碍的主要原因,并且可以作为对另一种潜在疾病的反应或作为 患病个体中纤维化倾向的结果而发生。纤维化的标志是细胞外基质化 合物如胶原蛋白和相关糖蛋白的不适当沉积。TGF-β在纤维化过程 中起主要作用,诱导成纤维细胞合成细胞外基质(ECM)蛋白,并且它 还抑制具有ECM分解活性的蛋白质的表达(Leask(2011)J Cell Commun Signal 5:125)。有一类ECM调节蛋白称为CNN蛋白(所谓 的前三个成员,即CYR61(富含半胱氨酸的61/CCN1)、CTGF(结缔 组织生长因子/CCN2)和NOV(肾母细胞瘤)过度表达/CCN3)。这些蛋 白质调节多种细胞功能,包括细胞粘附,迁移,细胞凋亡,存活和基 因表达。TGF-β强烈上调CCN2表达,其作为TGF-β的辅助因子协 同作用且似乎是参与周细胞活化,这似乎是纤维化中必不可少的过程 (Leask同上)。CCN2在纤维化组织中过度表达,包括肺组织,也见 于***性硬化症(硬皮病)患者的血浆中。又,通过使用反义寡核苷酸 (ASO)进行的CCN2表达减少了化学诱导的肝纤维化,输尿管梗阻引 起的肾纤维化,皮肤伤口的纤维化瘢痕和肾间质纤维瘤部分肾切除术 后的脓肿(Jun and Lau(2013)Nat Rev Drug Discov.10(12):945-963)。 除了其促纤维化作用外,CCN2在癌症中可能是重要的,特别是在转 移中。它可能通过诱导血管生成促进肿瘤生长,乳腺癌细胞中高水平 的CCN2是骨转移潜能的标志(Jun和Lau,同上)。通过使用CCN2 调节化合物(例如,单克隆抗体或抑制性RNA)在各种纤维化,癌症, 心血管疾病和视网膜病变模型中敲低CCN2表达的实验模型已经显 示出许多这些疾病的临床进展的影响(Jun和Lau同上)。因此,本发 明的方法和组合物可用于通过使用本文所述的dTAG***策略,通 过靶向降解CCN2来降低CCN2的表达来预防或治疗纤维化,癌症, 血管疾病和视网膜病。
在其他具体例中,靶标参与自身免疫疾病。自身免疫性疾病作为 一类是常见的,仅在美国就有超过2300万人受到影响。有几种不同 的类型,具有许多不同程度的严重程度和预后。通常,它们的特征在 于产生针对各种自身抗原的自身抗体,导致针对自身的免疫应答。肠 的自身免疫疾病可导致诸如溃疡性结肠炎和炎性/肠易激病(例如,克 罗恩病)的病症。细胞表面糖蛋白细胞间粘附分子1(ICAM-1)在内皮 细胞上表达并在炎症状态下上调,在移位到组织期间用作白细胞的结 合蛋白。已发现特异性ICAM-1等位基因与克罗恩病(例如K469E等 位基因,外显子6)或溃疡性结肠炎(例如G241R,外显子4)相关,并 且可优先参与这些疾病中发现的慢性炎症诱导(Braun et al.,(2001) Clin Immunol.101(3):357-60)。在血管和糖尿病疾病的小鼠模型中敲 除ICAM已证明该治疗方法的有用性(参见Bourdillon et al.,(2000) Ather Throm Vasc Bio 20:2630和Okada et al.,(2003)Diabetes 52:2586)。因此,本发明的方法和组合物可以通过使用本文所述的 dTAG***策略靶向降解ICAM而用于炎性疾病中ICAM表达的一 般降低。
另一种最近被认为是自身免疫疾病的常见疾病是糖尿病。胰高血 糖素是胰岛α细胞释放的一种肽激素,在调节肝脏葡萄糖生成中起 着关键作用,具有深远的高血糖作用。此外,胰高血糖素激活糖异生 所需的多种酶,尤其是用于将丙酮酸转化为磷酸烯醇丙酮酸的酶***, 这是糖异生中的限速步骤。基于以下观察,已经提出高葡萄糖血症是 糖尿病发病机理中的致病因素:1)从动物到人类研究的糖尿病高血糖 症一直伴有相对或绝对的高葡萄糖血症;2)输注生长抑素抑制内源胰 高血糖素释放,从而降低由四氧嘧啶或二氮嗪诱导的糖尿病患者的血 糖水平;3)慢性胰高血糖素输注导致人类的肝胰岛素抗性(参见Liang et al.(2004)Diabetes 53(2):410)。胰高血糖素受体(由GCGR基因编 码)主要在肝脏中表达,与对照相比,用靶向胰高血糖素受体的反义 RNA治疗糖尿病(db/db)小鼠导致血清葡萄糖水平,甘油三酯和脂 肪酸显着降低(Liang等人,同上)。类似地,糖皮质激素(GC)增加肝 脏糖异生,并在肝葡萄糖输出的调节中起重要作用。在db/db小鼠中, 通过使用靶向反义RNA降低糖皮质激素受体(GCCR)表达导致进食 和禁食葡萄糖水平降低约40%,血浆甘油三酯降低约50%(参见, Watts et al.(2005)Diabetes 54(6):1846)。因此,本发明的方法和组 合物可用于通过使用本文所述的dTAG***策略,通过靶向降解降 低胰高血糖素受体和/或糖皮质激素受体的表达来靶向胰高血糖素受 体和/或糖皮质激素受体而预防或治疗糖尿病。
2型胰岛素抵抗糖尿病的另一个潜在目标是蛋白酪氨酸磷酸酶 1B(PTP-1B)。胰岛素抗性定义为细胞在葡萄糖摄取和组织利用方面 对胰岛素起反应的能力降低。调节胰岛素信号传导的最重要的磷酸酶 之一是PTP-1B,其通过直接去磷酸化来抑制胰岛素受体和胰岛素受 体底物1。作为PTP-1B-/-(在两个等位基因处突变)的小鼠对胰岛 素过敏并且对高脂肪饮食的体重增加具有抗性(参见Fernandez-Ruiz et al.,(2014)PLoS One 9(2):e90344)。因此,该靶标可用于糖尿病 治疗和肥胖症。由于高度保守的活性位点袋,开发对该酶特异的抑制 性小分子是有问题的,但是已经显示针对PTP-1B的反义寡核苷酸将 肝脏和脂肪组织中的PTP-1B mRNA表达降低约50%并且在高血糖、 胰岛素抗性ob/ob和db/db小鼠中产生葡萄糖降低的效果(其为在非 人灵长类动物中重复的实验)(参见Swarbrick etal.,(2009)Endocrin 150:1670)。因此,本发明的方法和组合物可用于通过使用本文所述的dTAG***策略靶向降解PTP-1B来靶向PTP-1B,导致胰岛素敏 感性增加。
发展为糖尿病胰岛素抵抗糖尿病的高风险因素是肥胖。全世界估 计有超过10亿人超重(体重指数(BMI)≥25kg/m2,其中超过3亿人 被认为是肥胖(BMI≧30kg/m2),这意味着肥胖是今天对公共卫生 的最大威胁其中之一(Lagerros (2013)TherAdv Gastroenterol 6(1):77)。肥胖与合并症如胰岛素抵抗II型糖尿病,血 脂异常,高血压和心血管疾病密切相关。肥胖症通常始于饮食和运动 的改变,但通常随着热量消耗的减少,观察到身体能量消耗的平行且 混杂的减少(Yu et al.,(2013)PLoS One 8(7):e66923)。成纤维细胞生 长因子受体4(FGFR4)已被证明在小鼠肥胖模型中具有抗肥胖作用。 FGFR4主要在肝脏中表达,它及其配体FGF19(在人体内)调节胆汁 酸代谢。GFFR4/FGF19调节胆固醇的表达7α-羟化酶及其活性。此 外,FGFR4和FGF19似乎参与脂质,碳水化合物或能量代谢。通过 禁食降低肝脏FGFR4表达,并通过胰岛素增加肝脏FGFR4表达。 与野生型小鼠相比,FGFR4缺失小鼠还响应于不同的营养条件而显 示脂质谱的变化。用FGF 19治疗肥胖小鼠增加代谢率和改善肥胖、 肝脂肪变性、胰岛素敏感性和血浆脂质水平,并且还抑制肝脏脂肪酸 合成和糖异生,同时增加糖原合成。肥胖小鼠中FGFR4的反义减少 还导致体重和肥胖减少、胰岛素敏感性和肝脏脂肪变性的改善以及血 浆FGF15(小鼠等效的FGF19)水平,而没有任何明显的毒性(Yu等人, 同上)。因此,本发明的方法和组合物可用于通过使用本文所述的 dTAG***策略,通过靶向降解降低FGFR4的表达来治疗肥胖症。
多发性硬化症(MS)是中枢神经***的慢性,致残性自身免疫疾 病,其特征在于炎症、脱髓鞘和轴突破坏。与复发性MS相关的突发 (发生在85至95%的患者中)被认为与活化的淋巴细胞进入大脑有关。 目前可用的治疗仅能够使复发率抑制约30%。炎症反应诱导血管粘 附分子-1(VCAM-1)在血管内皮上的表达,并且淋巴细胞与VCAM-1 的粘附是允许活化的细胞通过进入脑的必需步骤。淋巴细胞对 VCAM-1的粘附是通过非常晚期的抗原-4(VLA-4,也称为α4β1整合 素)与活化淋巴细胞表面的结合来介导的(Wolf et al.(2013)PLosOne 8(3):e58438)。这种相互作用的破坏一直是抗VLA-4特异性抗体和 小分子拮抗剂的治疗用途背后的思想(Wolf等人,同上)。因此,本 发明的材料和方法可用于通过使用本文所述的dTAG***策略的靶 向降解来靶向VCAM-1或VLA-4表达。
另一种感兴趣的疾病是库欣病/综合征(CS)。在该疾病中,由于 肾上腺的表达增加,患者的血清糖皮质激素水平升高。CS是一种罕 见的疾病,发病率在每年1.8至2.4名患者/百万之间。内源性CS的 最常见原因是产生ACTH的垂体腺瘤,在约70%的CS患者中可见。产生皮质醇的肾上腺腺瘤和产生异位ACTH的肿瘤较少见,各占约 10至15%。垂体源性CS患者的一线治疗是经蝶窦垂体手术(TSS)和 产生皮质醇的肾上腺腺瘤的单侧肾上腺切除术。单侧肾上腺切除术在 几乎所有产生皮质醇的肾上腺腺瘤患者中都是有效的,并且永久性肾 上腺皮质功能不全是罕见的。相反,垂体功能减退症在TSS后是常 见的,范围在13%和81%之间(参见,Ragnarsson and Johannsson(2013)Eur J Endocrin 169:139)。然而,在一些患者中, 手术切除不成功,因此指示了药物治疗。一种方法是通过靶向糖皮质 激素受体(GCCR)来抑制高皮质醇血症的活性,例如,使用米非司酮 (Mifepristone)(也称为RU486),其为一种GCCR拮抗剂(参见 Johanssen and Allolio(2007)Eur J Endocrin 157:561)。然而,RU 486还有其他一些活动(最值得注意的是,在怀孕患者中诱导堕胎)。 因此,本发明的方法和组合物可用于通过使用本文所述的dTAG插 入策略,通过靶向降解降低表达来靶向GCCR。
转甲状腺素蛋白淀粉样变性(TTRA)是几种怀疑与错误折叠和聚 集的蛋白质(淀粉样蛋白)相关的退行性疾病之一。运甲状腺素蛋白 (TTR)是在肝脏中产生的四聚体,分泌到血流中,以用于运输全视网 膜结合蛋白。然而,在构象变化时,它变成淀粉样蛋白。部分展开暴 露出延伸构象中的疏水残基片段,其最终在交叉β片层淀粉样蛋白结 构之前,有效率地错误组装成基本上非结构化的球形聚集体(参见, Johnson et al.(2012)J Mol Biol421(2-3):183)。TTRA可发生在散 发性和常染色体显性遗传形式的患者中,包括家族性淀粉样多发性神 经病(FAP)和家族性淀粉样心肌病(FAC)。这些遗传形式通常较早发 作并且涉及TTR基因中描述的超过100个点突变。通常,突变所具 有的蛋白质越不稳定,就越有可能具有一定量的淀粉样蛋白病理学。 形成的淀粉样蛋白导致FAC中的心脏组织或FAP中的外周和中枢神 经组织的选择性破坏。治疗这些疾病的一些新的治疗策略,例如抑制 性RNA策略,主要是试图减少TTR的量以降低蛋白质的聚集潜力 (Johnson等人,同上)。因此,通常通过使用本文所述的dTAG*** 策略的靶向降解,本发明的方法和组合物可用于靶向TTR以努力减 少TTR蛋白的病理形式的量和/或降低TTR浓度。
还可以使用本发明的方法来治疗肌肉疾病。脊髓性肌萎缩症是由 SMN1基因突变引起的常染色体隐性遗传疾病,其编码“运动神经元 存活”(SMN)蛋白,特征在于一般的肌肉萎缩和运动障碍。SMN蛋白 参与剪接体机器的组分的组装,并且SMN1基因中的若干缺陷与导 致成熟mRNA的外显子7被特异性排除的剪接缺陷相关。这些缺陷 在脊髓运动神经元中尤为普遍,并且可引起脊髓性肌肉萎缩。SMN1 缺陷的严重性可以通过称为SMN2的SMN1的旁路来修改。SMN2 基因序列与外显子7和8中的少数单核苷酸多态性以及内含子序列中 的几个单核苷酸多态性不同于SMN1。因此,通常通过使用本文所述 的dTAG***策略的靶向降解,本发明的方法和组合物可用于靶向 SMN1以努力减少SMN1蛋白的病理形式的量和/或降低SMN1浓度。
生长激素(GH)分泌的失调可导致肢端肥大症,这是一种不成比 例的骨骼,组织和器官生长的疾病,在40岁左右首次变得明显 (Roberts and Katznelson(2006)USEndocrine Disease:71)。它的发 病率约为每百万例有5例,诊断需要确定GH分泌失调和IGF1水平 升高。口服葡萄糖负荷后2小时内不能抑制GH分泌通常用于肢端肥 大症的诊断。GH分泌的正常调节由脑下垂体进行。下丘脑GH释放 激素(GHRH)、生长素释放肽和生长抑素通过垂体前叶生长激素细胞 调节GH产生。编码GH受体或GHR的基因被广泛表达,当GH分 子与GHR二聚体相互作用时,信号经由JAK2依赖性和独立的细胞 内信号转导途径进行(参见,Melmed(2009)J Clin Invest 119(11):3189)。循环GH刺激***-1(IGF-1)的肝分泌。 当良性垂体肿瘤导致GH分泌增加并因此导致IGF-1分泌增加时,发 生肢端肥大症。与肢端肥大症相关的一个GHR突变在外显子3中具 有框内缺失,其导致蛋白质中22个氨基酸的缺失。这种被称为d3- GHR的突变受体导致GH反应性增强。目前的疗法集中在通常通过 手术切除垂体肿瘤的GH和IGF-1水平的正常化。由于GH诱导 IGF-1的分泌,靶向GHR是本发明方法和组合物的有吸引力的靶标。 因此,本发明的方法和组合物可用于通过使用本文所述的dTAG插 入策略通过靶向降解降低表达来靶向GHR。
与肌肉萎缩相关的另一种疾病是肌强直性营养不良,其是一种慢 性疾病,特征在于肌肉萎缩、白内障、心脏传导缺陷、内分泌变化、 多器官损伤和肌强直(自主收缩后长时间的肌肉收缩)。强直性肌营养 不良的发生率约为每10万人中有13人,有两种形式的疾病,即1型 肌强直性营养不良(也称为Steinert病、MMD1或DM1,并且是最常 见)和2型肌强直性营养不良(MMD2或DM2)。两者都是由两个基因 的3'非编码区(1型的DMPK基因(编码肌营养不良肌肉蛋白激酶)中 的CTG中和2型的ZNF9基因(编码细胞核酸-结合蛋白)中的CCTG) 和DM1的异常扩增引起的遗传性常染色体显性疾病是成人中最常见 的肌营养不良形式。这些突变导致RNA内含物或病灶中突变转录物 的毒性核内积累(参见Caillet-Boudin et al.,(2014)Front.Mol. Neurosci doi:10.3389)。1型患者的CTG拷贝数大于50且具有不同 的表型,范围从无症状到严重。已经使用反义RNA技术在体外引起 突变体DMPK转录物的特异性破坏,其对DM1成肌细胞的增殖速 率没有影响但恢复了它们的分化(Furling et al.(2003)Gene Therapy 10:795)。因此,本发明的方法和组合物可用于通过使用本文所述的dTAG***策略的靶向降解来靶向营养不良肌组织蛋白激酶或细胞核 酸结合蛋白。
慢性疼痛是一个主要的健康问题,在他们的生命中的某个时间影 响着8000万美国人,其具有显着的相关发病率和对个体生活质量的 影响。慢性疼痛可由多种炎症和神经损伤事件引起,包括癌症,传染 病,自身免疫相关综合征和手术。电压门控钠通道(VGSC)是调节神 经元兴奋性的基础,这些通道的过度表达可以产生异常的自发放电模 式,从而支持慢性疼痛。在神经***中至少有九种不同的VGSC亚 型,并且每种亚型在功能上可以分类为对河豚毒素敏感或对河豚毒素 具有抗性。包括Nav1.3、Nav1.7、Nav1.8和Nav1.9在内的神经元 钠通道亚型与伤害性信息的处理有关。VGSC Nav1.8是一种抗河豚 毒素的钠通道,其分布仅限于初级传入神经元,大多数含Nav1.8的 传入神经传递伤害信号到脊髓的疼痛处理区域。炎症或神经损伤后 Nav1.8(由PN3编码)的表达、运输和再分布的变化被认为是传入神 经敏感和疼痛产生的主要原因(参见Schuelert and McDougall(2012) ArthritisRes Ther 14:R5)。骨关节炎的啮齿动物模型已经证明,在 脊髓中具有突触连接的外周神经上Nav1.8通道的抑制是伤害性感觉 处理的有希望的治疗,并且可以有助于实现更明显和更持久的镇痛。 因此,本发明的方法和组合物可用于通过使用本文所述的dTAG插 入策略,通过靶向降解降低NAV1.8的局部表达来治疗慢性疼痛。
还可以如本文所述靶向癌症。癌症是一个通用术语,用于描述由 于缺乏细胞生长调节而联合起来的许多特定疾病。由于有许多形式, 涉及无数不同的细胞类型,还有许多与癌症有关的特定基因靶标。例 如,由CLU基因编码的簇蛋白(也称为载脂蛋白J)是在蛋白水解切割 成初级多肽CLU基因产物的两条链后组装的异二聚体蛋白。近年来, 已发现有两种形式的凝聚素,分泌和高度糖基化形式(sCLU)和核形 式(nCLU),其中nCLU首先被合成为在细胞质中发现的前核形式 (pnCLU)。两个CLU表单之间的差异与CLU消息的可选拼接和消息 转换期间的起始ATG的选择有关。sCLU的转译利用全长CLU mRNA中的第一个AUG,而pnCLU的转译是从剪接依赖性去除转 录的前导区段和外显子1的全长mRNA后的第二个框内AUG开始 的。sCLU形式似乎促进细胞存活,而nCLU形式与细胞凋亡相关。 已经在许多肿瘤类型中发现了sCLU形式的蛋白质的过表达,包括前 列腺癌,皮肤癌,胰腺癌,乳腺癌,肺癌和结肠癌,以及食道鳞状细 胞癌和神经母细胞瘤。此外,一些癌症类型向高级别和转移性形式的 进展导致sCLU水平升高(Shannan et al.(2006)Cell Death Dif 13:12)。在乳腺癌和***癌的I期研究中已经使用特异性反义寡核 苷酸(ASO)与标准治疗组合引起沉默sCLU表达,仅在接受ASO和 标准治疗剂(Shannon,同上)的患者中观察到凋亡增加。因此,本发 明的方法和组合物可用于使用本文所述的dTAG***策略通过靶向 降解来治疗标记有sCLU表达增加的癌症。
另一种似乎具有致癌作用的蛋白质是真核转译起始因子4E(eIF- 4E)。eIF3-4E与真核mRNA的M7GpppN帽(其中N是任何核苷酸) 结合,并且是形成eIF-4F复合物的限速成员。eIF-4E通常与eIF-4F 复合物中的eIF-4G复合,并且在正常生理条件下,eIF-4E的可用性受到称为4E-BP(用于从eIF-4G隔离eIF-4E)的抑制蛋白家族的结合 的负调节。由于eIF-4E通常以低水平表达,mRNA竞争待转译的可 用eIF-4E。具有短的非结构化5'UTR的mRNA被认为对转译更具竞 争性,因为它们较少依赖于eIF-4F复合物中发现的解旋活性。然后 高度结构的mRNA更依赖于eIF-4E的转译结合,因此当eIF3-4E过 表达时,这些mRNA更容易转译。生长促进基因产物如细胞周期蛋 白D1,VEGF,c-myc,FGF2,乙酰肝素酶,ODC和MMP9具有这些复杂的5'UTR(Mamane et al.(2004)Oncogene 23:3172,Fischer (2009)Cell Cycle 8(16):2535)。另外,eIF-4E可以在核孔复合物的 修饰中起作用并导致这些相同mRNA转运到细胞质中的增加 (Culjikovic-Kraljacic et al.,(2012)Cell Reports 2 p.207)。eIF-4E与 致癌细胞转化有关,并且在几种癌症类型中过表达,包括急性髓性白 血病,结肠癌,乳腺癌,膀胱癌,肺癌,***癌,胃肠道癌,头颈 癌,霍奇金淋巴瘤和神经母细胞瘤,并且水平升高与疾病等级越来越 高。已经通过几种不同的方法尝试靶向eIF-4E,包括过表达4E-BP 和由其衍生的肽,开发用于预防eIF-4E:eIFG相互作用的小分子抑制 剂:,以及eIF-4E特异性的反义寡核苷酸(ASO)(Jia et al.(2012)Med Res Rev 00,No.00:1-29)。ASO给药已证实体外肿瘤细胞中eIF- 4E表达的敲低,以及体内小鼠模型中的异种移植肿瘤中的表达。在 这些小鼠模型中,eIF-4E的表达水平降低了80%而没有任何总蛋白 质转译的降低并且没有任何明显的毒性,同时增加对化学治疗剂的化 学敏感性,增加癌细胞凋亡和抑制肿瘤生长(Jia,同上)。因此,本发 明的方法和组合物可用于治疗或预防各种癌症。可以使用本文所述的 dTAG***策略,通过降解来调节eIF-4F的表达。
经由受体VEGFR起作用的血管内皮受体(VEGF)在正常发育中 起作用,并且还在癌症中的病理性血管发生中发挥作用。在人类中, 存在五种不同的VEGF家族成员:VEGF-A(也称为VEGF);胎盘生 长因子(PIGF)、VEGF-B、VEGF-C和VEGF-D。VEGF-A还具有三 种常见亚型:VEGF-121、VEGF-165和VEGF-189。各种VEGF在 血管生成中具有不同的作用,VEGF-A主要参与正常血管生成以及肿 瘤生长和转移,而VEGF-C和VEGF-D参与正常***生成和恶性***转移。此外,VEGF-A亚型在激素反应性肿瘤中也可具有特异 性生长促进活性。基于该知识,许多抗体和小分子激酶抑制剂直接抑 制VEGF-VEGFR相互作用或通过相互作用激活信号转导途径。然而, 这些治疗剂通常具有显着且潜在麻烦的副作用特征,使得正在进行积 极研究以开发具有增加的特异性的抑制剂(Shibuya,(2014)Biomol Ther 11(1):1-9)。因此,本发明的方法和组合物可用于通过使用本文 所述的dTAG***策略通过降解靶向特定VEGF蛋白来预防或治疗 受试者中的癌症。
另一种在几种癌症中起作用的蛋白质是由KIF11基因编码的驱 动蛋白纺锤体蛋白(KSP)。目前使用的最成功的抗癌疗法靶向微管, 其中这些试剂已用于治疗乳腺癌,肺癌,卵巢癌,膀胱癌和头颈癌。 微管是有丝***纺锤体的一部分,因此靶向它们成功地抑制快速*** 的癌细胞,但微管也是细胞骨架的一部分,因此用这些试剂治疗也与 严重的副作用有关。驱动蛋白,特别是驱动蛋白纺锤体蛋白,是一种 与纺锤体纤维结合的运动蛋白,用于在细胞***的染色体分离过程中 迫使纺锤体纤维分开。因此,使用KSP特异性抗有丝***剂靶向KSP将仅靶向***细胞,并且可能具有较少的副作用。消耗KSP的 药剂选择性地导致有丝***中的细胞周期停滞,其在长时间后导致细 胞凋亡。KSP在***组织中也很丰富,并且在乳腺,结肠,肺,卵 巢和子宫的肿瘤中高度表达(Sarli andGiannis,(2008)ClinCancer Res 14:7583)。此外,正在进行临床试验,使用在肝脏受累的癌症患 者中同时靶向KSP和VEGF的RNA干扰(Tabernero et al., (2013)Cancer Discovery 3:406)。因此,本发明的方法和组合物可用 于通过使用本文所述的dTAG***策略靶向降解驱动蛋白纺锤体蛋白(KSP)来治疗或预防癌症。
热休克蛋白27(HSP 27,也称为热休克蛋白β-1或HSPB1)是另 一种与癌症有关的蛋白质。由HSPB1基因编码的HSP 27是一种热 休克蛋白,其最初的特征在于响应于热休克作为小伴侣蛋白,其促进 受损蛋白质的适当重折叠。然而,正在进行的调查显示它还参与对细 胞应激条件的反应,如氧化应激和化学应激,似乎具有抗细胞凋亡活 性,并且能够在热休克和其他应激条件下调节肌动蛋白细胞骨架动力 学(Vidyasagar)et al.(2012)Fibrogen Tis Rep 5(7))。此外,抑制 HSP 27可能在癌症的长期休眠中发挥作用,因为研究表明HSP 27 在血管生成的乳腺癌细胞中上调,并且体内HSP 27的抑制导致长期 肿瘤休眠(Straume et al.(2012)Proc Natl Acad Sci USA 109(22):8699-8704)。肿瘤细胞中热休克蛋白的表达增加与p53功能 的丧失和原癌基因如c-myc的上调有关。HSP 27的抗细胞凋亡活性 可保护肿瘤细胞,并且已被证明与乳腺癌和白血病中的化疗耐药性有 关(Vidysagar,同上)。因此,HSP 27可以是癌症治疗的合适靶标, 其中蛋白质的抑制剂可以与已知的化学疗法组合使用以增强其活性。 与单独的药剂相比,当与传统的化学治疗剂组合时,HSP 27抑制剂 槲皮素已经显示出显着降低体内肿瘤体积。此外,目前在肺癌,卵巢癌,乳腺癌和胰腺癌(Vidyasagar,同上)的临床研究中评估HSP 27 抑制性ASO。因此,本发明的方法和组合物可用于通过使用本文所 述的dTAG***策略,通过HSP 27的靶向降解抑制HSP 27表达来 治疗癌症。
几种激酶一直是抗癌治疗研究的目标,因为它们通常是细胞生长 的关键调节剂。然而,在信号传导途径的下游,突变激酶的作用常见 于由STAT3基因编码的转录3蛋白或STAT3的信号转导和激活因 子的上调。此外,似乎乙型肝炎和丙型肝炎都会激活Stat3,两者都 与肝癌的发展有关。因此,HepB和HepC病毒可能破坏Stat3信号 传导途径并促进肝细胞转化(Li et al.,(2006)Clin Cancer Res 12(23):7140)。
RAS蛋白是一类在细胞分化,增殖和存活中起作用的蛋白质。 RAS蛋白家族的各种成员已经涉及癌症,因为已经发现异常RAS信 号传导在大约30%的所有癌症中发挥作用。KRAS蛋白(也称为V- Ki-ras2 Kirsten大鼠肉瘤病毒致癌基因同源物)是在正常组织信号传 导中发挥基本功能的GTP酶。KRAS是一个有吸引力的癌症靶标, 因为KRAS基因中的频繁点突变使得蛋白质具有组成型活性。因此, KRAS可以是癌症治疗的合适靶标,其中靶向KRAS蛋白功能的小 分子可用于治疗优势,包括与已知化学疗法组合以增强其活性。在一个具体例中,本发明的方法和组合物可用于通过使用本文所述的 dTAG***策略,通过靶向降解KRAS调节KRAS表达来治疗癌症。
所有各种Stat蛋白都是转录因子,主要介导细胞因子和生长因 子受体的信号传导。例如,IL6和IL11与它们各自的受体亚基结合 并触发gp130的同源二聚化,该gp130是触发Stat3激活的跨膜受体。 在经由生长因子受体的磷酸化活化后,STAT3蛋白质二聚化并穿过 细胞核并以序列特异性方式与DNA结合,上调许多参与细胞增殖的 基因。各种类型的肿瘤细胞通常具有导致STAT3过表达的激酶突变, 因此不考虑每种特异性突变激酶下,STAT3表达的降低可能对多种 来源的癌症有益(Jarnicki et al.(2010)Cell Div 5:14)。Stat3通过几 种机制导致恶性肿瘤。它通过上调促存活/抗凋亡Bcl2蛋白抑制细胞 凋亡,并主要通过刺激细胞周期蛋白B1,cdc2,c-myc,VEGF, H1F1α和细胞周期蛋白D1的表达以及通过抑制细胞周期抑制剂p21 来促进增殖。Stat3还通过诱导细胞外基质降解金属蛋白酶(包括MMP-2和MMP-9)促进肿瘤转移。在正常生理状态中,Stat3功能被 转录抑制剂Socs3抑制,其通常由Stat3诱导以维持细胞中的生长平 衡。然而,在恶性细胞中,Stat3过表达可以克服Socs3抑制。因此, 本发明的方法和组合物可用于通过使用本文所述的dTAG***策略 靶向降解Stat3来抑制Stat3功能并预防或治疗癌症。
***癌(PCa)是一种雄激素依赖性疾病,在美国仍然是导致死 亡的主要原因之一,并且是男性癌症死亡的主要原因。虽然已经进行 了多项研究,表明多达42%的***癌病例具有遗传联系(Mazaris and Tsiotras(2013)Nephro Urol Mon 5(3):792-800),但已观察到几 种类型的遗传模式(例如X连锁,常染色体显性遗传,常染色体隐性 遗传)表明没有一个单一的基因或基因突变导致PCa的遗传。该癌症 依赖于雄激素受体对生长和进展的活性(Mahmoud et al,(2013)PLoS One 8(10):e78479)。通常,PCa可以是一种进展缓慢的疾病,可以 使用相当保守的方法治疗,但在约25至30%的病例中,癌症可能是 导致患者死亡的侵袭性癌症。在转移性疾病的情况下,70至80%的 患者最初对雄激素剥夺疗法起反应,但在后期阶段,肿瘤变得激素难 治并且更具侵袭性,导致预后恶化(Mazaris和Tsiotras,同上)。激 素难治性PCa不依赖于循环雄激素,而是通过AR扩增,生长因子 失调和AR共扩辅助因素。另外,AR配体结合结构域中的突变可导 致AR对极低循环雄激素水平过敏或对扩展的一组配体如***,孕 激素,肾上腺素类固醇和抗雄激素敏感。尽管癌症依赖于AR的活性, 但在AR配体结合结构域中经历这些类型突变的肿瘤细胞可能不再对 抗雄激素疗法敏感。通常,AR存在于细胞质中并且被热休克蛋白结 合,以防止其活化。在暴露于雄激素时,受体能够二聚化并进入细胞 核以促进几种生长相关基因的表达。因此,本发明的方法和组合物可 用于通过使用本文所述的dTAG***策略靶向雄激素受体的降解以 在所有阶段治疗PCa。
C.dTAG的基因组框内***
如上所述,本发明的方法基于将dTAG基因组框内***表达感 兴趣的内源性蛋白质的基因。如本文所考虑的,表达经5'-或3'框内 ***编码dTAG的核酸序列所得的核酸序列时,产生内源性蛋白质- dTAG杂合蛋白,其在给药特定的异双功能性化合物后可被靶标降解。
编码dTAG的核酸序列的框内***可以通过任何已知和有效的 基因组编辑方法进行或实现。在一个方面,本发明利用CRISPR- Cas9***产生敲入的内源性蛋白质-dTAG融合蛋白,其由内源性基 因座产生并且易于以配体依赖性、可逆性和剂量响应性方式降解。在某些具体例中,使用CRISPR-Cas9***以***存在于同源重组 (HR)“供体”序列中的dTAG的表达盒,其中在CRISPR-Cas内核化 后的同源重组过程中,dTAG核酸序列用作***感兴趣的蛋白质的基 因组基因座的“供体”序列。HR靶向载体在表达盒的5'和3'末端含有 与靶向感兴趣的基因周围的基因组DNA同源的同源臂。通过将编码 dTAG的核酸序列与感兴趣的靶基因融合,所得融合蛋白含有被异双 功能性化合物靶向的dTAG。
本发明提供了***感兴趣的靶基因框内的外源dTAG序列(也称 为“供体序列”或“供体”或“转基因”),并且所得融合蛋白含有被异双 功能性化合物靶向的dTAG。显而易见的将是,供体序列不需要与放 置它的基因组序列相同。供体序列可含有侧接两个同源区域的非同源 序列,以允许在感兴趣的位置处有效率的HR。另外,供体序列可包 含含有与细胞染色质中的感兴趣区域不同源的序列的载体分子。供体 分子可含有几个与细胞染色质同源的不连续区域。例如,对于通常不 存在于感兴趣区域中的序列的靶向***,例如,本发明的dTAG,所 述序列可以存在于供体核酸分子中,并且侧接与感兴趣的区域的序列 同源的区域。或者,可以通过非同源末端连接(NHEJ)机制将供体分 子整合到切割的靶基因座中。参见例如U.S.2007/0207221和 U.S.2007/0326645,其通过引用方式并入本文。
用于***的供体dTAG编码序列可以是DNA或RNA,单股和/ 或双股,并且可以以线性或环状形式引入细胞中。参见例如 U.S.2010/0047805、U.S.2007/0281361和2011/0207221,其通过引 用方式并入本文。供体序列可以以圆形或线性形式引入细胞中。如果以线性形式引入,可以通过本领域技术人员已知的方法保护供体序列 的末端(例如,免于核酸外切降解)。例如,将一个或多个双脱氧核苷 酸残基添加到线性分子的3'端和/或将自身互补的寡核苷酸连接到一 端或两端。参见,例如,Chang et al.,Proc.Natl.Acad.Sci.84, (1987):4959-4963和Nehls et al.,Science,272,(1996):886-889。用 于保护外源多核苷酸免于降解的其他方法包括但不限于添加末端氨基 和使用修饰的核苷酸间键,例如硫代磷酸酯,氨基磷酸酯和O-甲基 核糖或脱氧核糖残基。
编码dTAG的供体多核苷酸可作为载体分子的一部分引入细胞 中,该载体分子具有额外的序列,例如CRISPR-Cas序列,复制起点, 启动子和编码抗生素抗性的基因。此外,供体多核苷酸可以作为裸核 酸引入,作为与诸如脂质体或泊洛沙姆之类的试剂复合的核酸,或者 可以通过病毒(例如,腺病毒,AAV,疱疹病毒,逆转录病毒,慢病 毒和整合酶缺陷型慢病毒(IDLV))递送。
本发明利用了充分表征的***策略,例如CRISPR-Cas9***。 通常,“CRISPR***”统称为涉及表达或引导CRISPR相关(“Cas”)基 因活性的转录物和其他元件,包括编码Cas基因的序列,tracr(反式 激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA),tracr配对序列(涵盖在内源CRISPR***的背景下的“直接重复”和tracrRNA 加工的部分直接重复),引导序列(也称为在内源CRISPR***的的背 景下的“间隔区”),和/或来自CRISPR基因座的其他序列和转录物。 (参见,例如,Ruan,J.et al.“Highly efficient CRISPR/Cas9-mediated transgene knockin at the H11 locus in pigs.”Sci.Rep.5, (2015):14253;and Park A,Won ST,Pentecost M,Bartkowski W,and Lee B“CRISPR/Cas9 AllowsEfficient and Complete Knock-In of a Destabilization Domain-Tagged EssentialProtein in a Human Cell Line,Allowing Rapid Knockdown of Protein Function.”PLoS ONE 9(4),(2014):e95101,both incorporated herein by reference,均通过 引用方式并入本文)。
Cas核酸酶是一种众所周知的分子。例如,Cas-9核酸酶基因编 码的蛋白质序列可以在SwissProt数据库中找到,登录号为Q99ZW2 -(SEQ.ID.NO.:52):
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIK KNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNE MAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYP TIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDN SDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLE NLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSK DTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEIT KAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKN GYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRK QRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRI PYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFI ERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMR KPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEI SGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLF EDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGI RDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVS GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPEN IVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVEN TQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSF LKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNA KLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQI LDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREI NNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRK MIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETN GETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESI LPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGK SKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLP KYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYE KLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLD KVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDR KRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD。
在一些具体例中,CRISPR/Cas核酸酶或CRISPR/Cas核酸酶系 统包括具有核酸酶功能(例如,两个核酸酶结构域)的序列特异性结 合DNA的非编码RNA分子(引导)RNA和Cas蛋白(例如Cas9)。还包 括编码dTAG的供体核苷酸,用于框内***感兴趣的蛋白质的基因组基因座。
在一些具体例中,CRISPR***的一种或多种元件衍生自I型, II型或III型CRISPR***。在一些具体例中,CRISPR***的一种 或多种元件衍生自包含内源CRISPR***的特定生物,例如化脓性链 球菌。
在一些具体例中,将Cas核酸酶和gRNA(包括对靶序列和固定的 tracrRNA特异的crRNA的融合物)和编码dTAG的供体序列引入细胞 中。通常,gRNA的5'末端的靶位点使用互补碱基配对将Cas核酸酶 靶向靶位点,例如基因。在一些具体例中,基于其位于原型间隔区相 邻基序(PAM)序列的5'的位置选择靶位点,例如通常为NGG或NAG。 在这方面,通过修饰引导RNA的前20个核苷酸以对应于靶DNA序列, 将gRNA靶向所需序列。
在一些具体例中,CRISPR***在靶位点诱导DSB,然后将编码 dTAG的供体序列同源重组到感兴趣的蛋白质的基因组基因座中,如 本文所讨论的。在其他具体例中,认为“切口酶”(nickases)的Cas9 变体用于在靶位点切割单股。在一些方面,使用成对的切口酶,例如, 以提高特异性,各自由靶向序列的一对不同gRNA引导,使得在同时 引入切口时,引入5'突出端。
通常,CRISPR***的特征在于促进靶序列位点处CRISPR复合物 形成的元件。通常,在形成CRISPR复合物的背景下,“靶序列”通常 是引导序列被设计为具有互补性的序列,其中靶序列和引导序列之间 的杂交促进CRISPR复合物的形成,并且其中发生***编码dTAG的 供体序列。如果存在足够的互补性以引起杂交并促进CRISPR复合物 的形成,则不一定需要完全互补。
通常,在内源CRISPR***的背景下,CRISPR复合物(包含与 靶序列杂交并与一种或多种Cas蛋白复合的引导序列)的形成导致一 条或两条股在靶序列中或附近(例如,来自的2个,3个,4个,5个, 6个,7个,8个,9个,10个,20个,50个或更多个碱基对内)的 切割。不希望受理论束缚,tracr序列可包含野生型tracr序列(例 如,约或大于约20、26、32、45、48、54、63、67、85或更多个核 苷酸的野生型tracr序列)的全部或部分或由其组成也可以形成CRISPR复合物的一部分,例如通过沿着至少一部分tracr序列杂交 到可操作地连接到引导序列的tracr配对序列的全部或部分。在一 些具体例中,tracr序列与tracr配对序列具有足够的互补性以杂交 并参与CRISPR复合物的形成。
与靶序列一样,在一些具体例中,不一定需要完全互补。在一些 具体例中,当最佳比对时,tracr序列沿着tracr配对序列的长度具有 至少50%,60%,70%,80%,90%,95%或99%的序列互补性。 在一些具体例中,将驱动CRISPR***的一种或多种元件的表达的一种或多种载体引入细胞中,使得CRISPR***的元件的表达引导 在一个或多个靶位点形成CRISPR复合物。例如,Cas酶,与tracr 配对序列连接的引导序列和tracr序列可各自与分开的载体上的分离 的调节元件可操作地连接。或者,可以将由相同或不同调节元件表达的两种或更多种元件组合在单一载体中,其中一种或多种另外的载体 提供不包含在第一载体中的CRISPR***的任何组分。在一些具体 例中,组合在单一载体中的CRISPR***元件可以以任何合适的方 向排列,例如相对于第二组件的(“上游”)的5'位或相对于第二组件的 (“下游”)的3'位。一个元件的编码序列可以位于第二元件的编码序列 的相同或相反的股上,并且以相同或相反的方向取向。在一些具体例 中,单个启动子驱动编码CRISPR酶的转录物和一个或多个引导序 列,tracr配对序列(任选地与引导序列可操作地连接)和嵌入一个或多 个内含子序列内的tracr序列(例如,每个在不同的内含子中,两个或 更多个在至少一个内含子中,或全部在单个内含子中)的表达。在一 些具体例中,CRISPR酶,引导序列,tracr配对序列和tracr序列与 相同的启动子可操作地连接并表达。
在一些具体例中,载体包含与编码CRISPR RNA引导的内切核 酸酶的酶编码序列可操作地连接的调节元件。在一些具体例中,载体 包含与编码CRISPR酶的酶编码序列可操作地连接的调节元件,例 如Cas蛋白。Cas蛋白的非限制性实例包括Cas1,Cas1B,Cas2,Cas3,Cas4,Cas5,Cas6,Cas7,Cas8,Cas9(也称为CsnI和 Csx12),Cas10,Csyl,Csy2,Csy3,CseI,Cse2,Cscl,Csc2,Csa5,Csn2,Csm2,Csm3,Csm4,Csm5,Csm6,Cmr1,Cmr3, Cmr4,Cmr5,Cmr6,Csbl,Csb2,Csb3,Csx17,Csx14,Csx10, Csx16,CsaX,Csx3,Csxl,Csx15,Csfl,Csf2,Csf3,Csf4, Cpf1,其同源物或其修饰形式(参见WO2015/2003334,其通过引 用方式并入本文)。这些酶是已知的;例如,化脓性链球菌Cas9蛋白 的氨基酸序列可以在登录号Q99ZW2的SwissProt数据库中找到(其 通过引用并入本文)。
Cas蛋白通常包含至少一个RNA识别或结合结构域。此类结构 域可与引导RNA(gRNA,下文更详细描述)相互作用。Cas蛋白还可 以包含核酸酶结构域,例如核酸内切酶结构域(例如,DNase或 RNase结构域),DNA结合结构域,解旋酶结构域,蛋白质-蛋白质 相互作用结构域,二聚化结构域和其他结构域。核酸酶结构域具有核 酸切割的催化活性。切割包括核酸分子的共价键的断裂。切割可以产 生平末端或交错末端,并且它可以是单股或双股的。
Cas蛋白的实例包括Cas1,Cas1B,Cas2,Cas3,Cas4,Cas5, Cas5e(CasD),Cas6,Cas6e,Cas6f,Cas7,Cas8al,Cas8a2, Cas8b,Cas8c,Cas9(CsnI或Csx12),Cas10,Cas10d,CasF, CasG,CasH,Csyl,Csy2,Csy3,CseI(CasA),Cse2(CasB), Cse3(CasE),Cse4(CasC),Cscl,Csc2,Csa5,Csn2,Csm2, Csm3,Csm4,Csm5,Csm6,Cmr1,Cmr3,Cmr4,Cmr5,Cmr6, Csbl,Csb2,Csb3,Csx17,Csx14,Csx10,Csx16,Csx14,Csx3, Csx1,Csx15,Csf1,Csf2,Csf3,Csf4和Cul966,及其同源物或 修饰形式(参见WO2015/232334,其通过引用并入本文)。
任何诱导切口或双股断裂成所需识别位点的Cas蛋白可用于本文 揭露的方法和组合物中。
通常,引导序列是与靶多核苷酸序列具有足够互补性的任何多核 苷酸序列,以与靶序列杂交并且将CRISPR复合物与靶序列直接序 列特异性结合。在一些具体例中,当使用合适的比对算法最佳比对时, 引导序列与其相应的靶序列之间的互补程度为约50%,60%,75%, 80%,85%,90%,95%,97.5%,99%或更多。
可以使用用于对准序列的任何合适的算法来确定最佳对准,其非 限制性示例包括Smith-Waterman算法,Needleman-Wunsch算法, 基于Burrows-Wheeler变换的算法(例如Burrows Wheeler Aligner), Clustal W,Clustal X,BLAT,Novoalign(NovocraftTechnologies, ELAND(Illumina,San Diego,Calif.),SOAP(可在 soap.genomics.org.cn获得)和Maq(可在maq.sourceforge.net获得)。 在一些具体例中,引导序列的长度为约或大于约5、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、 29、30、35、40、45、50、57或更多的核苷酸,在一些具体例中, 引导序列的长度小于约75、50、45、40、35、30、25、20、15、12 或更少的核苷酸。可以通过任何合适的测定来评估引导序列引导 CRISPR复合物与靶序列的序列特异性结合的能力。例如,CRISPR ***的组分足以形成CRISPR复合物,包括待测序的引导序列,可 以提供给具有相应靶序列的细胞,例如通过用编码CRISPR序列组 分的载体转染,然后评估靶序列内优先切割,例如通过本文所述的 Surveyor测定法。类似地,可以通过提供靶序列,CRISPR复合物的 组分(包括待测序的引导序列和不同于测试引导序列的对照引导序列), 并比较在测试和对照引导序列反应之间的靶序列处的结合或切割速率, 以评估在试管中靶多核苷酸序列的切割。
可以选择引导序列以靶向任何靶序列。在一些具体例中,靶序列 是细胞基因组内的序列,特别是通过工程化内源性蛋白质-dTAG杂 交体靶向受控降解的目的蛋白。示例性靶序列包括靶基因组中独特的 靶序列,其提供dTAG供体核酸以框内取向***。在一些具体例中, 选择引导序列以降低引导序列内的二级结构的程度。二级结构可以通 过任何合适的多核苷酸折叠算法确定。
通常,tracr配对序列包括与tracr序列具有足够互补性的任何序 列,以促进以下一者或多者:(1)在含有相应tracr序列的细胞中切除 侧接tracr配对序列的引导序列;(2)在靶序列上形成CRISPR复合物, 其中CRISPR复合物包含与tracr序列杂交的tracr配对序列。通常, 互补程度参考tracr配对序列和tracr序列,沿着两个序列中较短的序 列的长度的最佳比对。
如本文所考虑的,CRISPR-Cas***用于将编码dTAG的核酸序 列与编码感兴趣的蛋白质的基因组序列框内***真核生物,例如人细 胞中。在一些具体例中,该方法包括使CRISPR复合物结合感兴趣 的靶蛋白的基因组序列以实现基因组序列的切割,其中CRISPR复 合物包含复合在所述靶多核苷酸内与靶内序列杂交的引导序列的 CRISPR酶,其中所述引导序列与tracr配对序列连接,该tracr配对 序列又与tracr序列杂交。
在一些方面,该方法包括通过引入编码dTAG的核酸来修饰多 核苷酸在真核细胞中的表达。
在一些方面,将CRISPR-Cas***的多肽和供体序列给药或引入 细胞。核酸通常以表达载体的形式给药,例如病毒表达载体。在一些 方面,表达载体是逆转录病毒表达载体,腺病毒表达载体,DNA质 粒表达载体或AAV表达载体。在一些方面,编码CRISPR-Cas*** 的一种或多种多核苷酸和递送至细胞的供体序列。在一些方面,递送 是通过递送多于一种载体。
将核酸序列递送至如本文所述的细胞的方法描述于,例如,美国 专利第8,586,526;6,453,242;6,503,717;6,534,261;6,599,692; 6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219;和 7,163,824号,所有这些专利的公开内容通过引用方式整体并入本文。
还可以使用含有编码一种或多种本文所述组合物的序列的载体递 送如本文所述的各种多核苷酸。可以使用任何载体***,包括但不限 于质粒载体,逆转录病毒载体,慢病毒载体,腺病毒载体,痘病毒载 体;疱疹病毒载体和腺相关病毒载体等也参见美国专利第6,534,261; 6,607,882;6,824,978;6,933,113;6,979,539;7,013,219;和7,163,824 号,其通过引用方式整体并入本文。
非病毒递送核酸的方法包括脂质转染,核转染,显微注射,生物 射弹,病毒体,脂质体,免疫脂质体,聚阳离子或脂质:核酸缀合物, 裸DNA,人工病毒粒子和DNA的药剂增强摄取。脂转染(描述于例 如美国专利第5,049,386、4,946,787;以及4,897,355)脂质转染试剂是 市售的(例如TransfectamTM和LipofectinTM)。适用于多核苷酸的有 效受体-识别脂质转染的阳离子和中性脂质包括那些Feigner,WO 1991/17424和WO 1991/16024所具者。递送可以是细胞(例如体外 或离体给药)或靶组织(例如体内给药)。
在一些具体例中,递送是通过使用基于RNA或DNA病毒的系 统来递送核酸。一些方面的病毒载体可以向患者(体内)直接给药,或 者它们可以用于体外或离体处理细胞,然后向患者给予给药。在一些 具体例中,基于病毒的***包括用于基因转移的逆转录病毒,慢病毒, 腺病毒,腺相关和单纯疱疹病毒载体。逆转录病毒的趋向性可以通过 掺入外来包膜蛋白来改变,从而扩展靶细胞的潜在靶标群。慢病毒载 体是能够转导或感染非***细胞并且通常产生高病毒滴度的逆转录病 毒载体。逆转录病毒基因转移***的选择取决于靶组织。逆转录病毒 载体由顺式作用长末端重复序列组成,具有高达6至10kb外源序列 的包装能力。最小顺式作用LTR足以用于载体的复制和包装,然后 将其用于将治疗基因整合到靶细胞中以提供永久性转基因表达。广泛 使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV),长臂猿白血 病病毒(GaLV),猿猴免疫缺陷病毒(SIV),人类免疫缺陷病毒(HIV) 及其组合的载体(参见,例如,Buchscher et al.,J.Virol.66, (1992):2731-2739;Johannetal.,J.Virol.66,(1992):1635-1640; Sommerfelt et al.,J.Virol.176,(1990):58-69;Wilson et al.,J.Virol. 63,(1989):2374-2378;Miller et al.,J.Virol.65,(1991):2220-2224; 和PCT/US94/05700)。
在优选瞬时表达的应用中,可以使用基于腺病毒的***。基于腺 病毒的载体在许多细胞类型中具有非常高的转导效率,并且不需要细 胞***。使用这样的载体,已经获得了高滴度和高水平的表达。该载 体可以在相对简单的***中大量生产。腺相关病毒(“AAV”)载体也用 于用靶核酸转导细胞,例如,在核酸和肽的体外生产中,以及用于体 内和离体基因治疗程序(参见,例如,West et al.,Virology 160, (1987):38-47;美国专利第4,797,368号;WO 1993/24641;Kotin, Human Gene Therapy 5,(1994):793-801;Muzyczka,J.Clin.Invest. 94,(1994):1351。重组AAV载体的构建描述于许多出版物中,包括 美国专利第5,173,414号;Tratschin et al.,Mol.Cell.Biol.5, (1985):3251-3260;Tratschin,et al.,Mol.Cell.Biol.4, (1984):2072-2081;Hermonat&Muzyczka,PNAS 81,(1984):6466- 6470;以及Samulski et al.,J.Virol.63,(1989):3822-3828。
目前临床试验中至少有六种病毒载体方法可用于基因转移,其利 用涉及通过***辅助细胞系的基因互补缺陷载体以产生转导剂的方法。
pLASN和MFG-S是已用于临床试验的逆转录病毒载体的实例 (Dunbar et al.,Blood 85,(1995):3048-305;Kohn et al.,Nat.Med.1, (1995):1017-1023;Malech etal.,PNAS 94(22),(1997):12133-12138)。 PA317/pLASN是基因治疗试验中使用的第一种治疗载体。(Blaese et al.,Science 270,(1995):475-480)。已经观察到MFG-S包装载体的转 导效率为50%或更高。(Ellem et al.,Immunol Immunother.44(1), (1997):10-20;and Dranoff et al.,Hum.Gene Ther.1,(1997):111- 112)。
适用于导入本文所述多核苷酸的载体还包括非整合型慢病毒载体 (IDLV)。参见,例如,Naldini et al.Proc.Natl.Acad.Sci.93, (1996):11382-11388;Dull etal.J.Virol.72,(1998):8463-8471; Zuffery et al.J.Virol.72,(1998):9873-9880;Follenzi et al. Nature Genetics 25,(2000):217-222;以及U.S.2009/0117617。
重组腺相关病毒载体(rAAV)也可用于递送本文所述的组合物。 所有载体均衍生自仅保留侧接转基因表达盒的AAV反向末端重复的 质粒。有效率的基因转移和稳定的转基因传递是该载体***的关键特 征。(Wagner et al.,Lancet 351,(1998):9117 1702-3,and Kearns et al.,Gene Ther.9,(1996):748-55)。其他AAV血清型,包括AAV1, AAV3,AAV4,AAV5,AAV6,AAV8,AAV9和AAVrh10,假型 AAV如AAV2/8,AAV2/5和AAV2/6及其所有变体,也可根据本 发明使用。
复制缺陷型重组腺病毒载体(Ad)可以高滴度产生,并且容易感染 许多不同的细胞类型。大多数腺病毒载体经过工程改造,使转基因取 代Ad E1a,E1b和/或E3基因;随后,复制缺陷型载体在人类293细 胞中繁殖,该细胞以反式提供缺失的基因功能。Ad载体可以在体内 转导多种类型的组织,包括非***的分化细胞,例如那些在肝,肾和 肌肉中发现者。常规Ad载体具有大的承载能力。在临床试验中使用Ad载体的实例涉及用于肌内注射的抗肿瘤免疫的多核苷酸疗法 (Sterman et al.,Hum.Gene Ther.7,(1998):1083-1089)。在临床试 验中使用腺病毒载体进行基因转移的其他实例包括Rosenecker et al.,Infection 24(1),(1996):5-10;Sterman et al.,Hum.Gene Ther.9(7), (1998):1083-1089;Welsh et al.,Hum.Gene Ther.2,(1995):205-218; Alvarez et al.,Hum.GeneTher.5,(1997):597-613;Topf et al.,Gene Ther.5,(1998):507-513;Sterman et al.,Hum.Gene Ther.7, (1998):1083-1089。
包装细胞用于形成能够感染宿主细胞的病毒颗粒。这些细胞包括 包装腺病毒的293个细胞,其包装逆转录病毒和ψ2细胞或PA317细 胞。用于基因治疗的病毒载体通常由将核酸载体包装入病毒颗粒的生 产细胞系产生。载体通常含有包装和随后整合到宿主中所需的最小病 毒序列(如果适用),其他病毒序列被编码待表达蛋白质的表达盒取代。 缺失的病毒功能由包装细胞系反式提供。例如,用于基因治疗的 AAV载体通常仅具有来自AAV基因组的反向末端重复(ITR)序列, 其是包装和整合到宿主基因组中所需的。病毒DNA包装在细胞系中, 该细胞系含有编码其他AAV基因的辅助质粒,即rep和cap,但缺 少ITR序列。细胞系也被作为辅助细胞的腺病毒感染。辅助病毒促 进AAV载体的复制和来自辅助质粒的AAV基因的表达。由于缺乏 ITR序列,辅助质粒未以显着量包装。腺病毒的污染可以通过例如腺 病毒比AAV更敏感的热处理来减少。
可以以特定组织类型的高度特异性递送载体。因此,通过在病毒 外表面上用病毒外壳蛋白表达作为融合蛋白的配体,可以修饰病毒载 体以对给定的细胞类型具有特异性。选择配体以对已知存在于感兴趣 的细胞类型上的受体具有亲和力。例如,Han et al.,Proc.Natl. Acad.Sci.92,(1995):9747-9751报道了莫洛尼(Moloney)鼠白血病 病毒可被修饰以表达与gp70融合的人类调蛋白,并且重组病毒感染 某些表达人类表皮生长因子受体的人类乳腺癌细胞。该原理可以扩展 到其他病毒-靶细胞对,其中靶细胞表达受体,和病毒表达包含细胞- 表面受体的配体的融合蛋白。例如,可以工程化丝状噬菌体以展示对 几乎任何选择的细胞受体具有特异性结合亲和力的抗体片段(例如,FAB或Fv)。尽管以上描述主要适用于病毒载体,但相同的原理可应 用于非病毒载体。可以将这些载体工程化为含有特异性摄取序列,其 有利于特定靶细胞的摄取。
载体可通过给予个体受试者体内递送,通常通过全身给药(例如, 静脉内,腹膜内,肌肉内,鞘内,气管内,皮下或颅内输注)或局部 给药,如下所述。或者,可以将载体离体递送至细胞,例如从个体患 者移出的细胞(例如,淋巴细胞,骨髓抽吸物,组织活检)或通用供体 造血干细胞,然后通常在选择已并入载体的细胞后,将细胞重新植入 患者体内。
含有核酸酶和/或供体构建体的载体(例如,逆转录病毒,腺病毒, 脂质体等)也可以直接给予生物体以在体内转导细胞。或者,可以给 药裸DNA。通过通常用于引入分子与血液或组织细胞最终接触的任 何途径给药,包括但不限于注射,输注,局部给药和电穿孔。给药此 类核酸的合适方法是本领域技术人员可获得的并且是公知的,并且尽 管可以使用多于一种途径来给药特定组合物,但是特定途径通常可以 提供比另一条途径更直接且更有效的反应。
在一些具体例中,由于将编码多肽的多核苷酸引入细胞中, CRISPR-Cas***的多肽在细胞中原位合成。在一些方面,CRISP- Cas***的多肽可以在细胞外产生,然后引入其中。如本文所述,用 于将CRISPR-Cas多核苷酸构建体引入动物细胞的方法是已知的,并 且作为非限制性实例包括其中多核苷酸构建体整合到细胞基因组中的 稳定转化方法,其中多核苷酸构建体未整合到细胞基因组中的瞬时转 化方法和病毒介导的方法。优选地,CRISPR-Cas多核苷酸被瞬时表 达并且不整合到细胞的基因组中。在一些具体例中,可以通过例如重 组病毒载体(例如逆转录病毒,腺病毒),脂质体等将CRISPR-Cas多 核苷酸引入细胞中。例如,在一些方面,瞬时转化方法包括显微注射, 电穿孔或粒子轰击。在一些具体例中,鉴于在细胞中表达,CRISPR- Cas多核苷酸可包含在载体中,更特别是质粒或病毒中。
在一些具体例中,非CRISPR-CAS病毒和非基于病毒的基因转 移方法可用于将编码dTAG的核酸在哺乳动物细胞或靶组织中的感 兴趣的蛋白质的基因组基因座中框内***。这些方法可用于将编码ZFP,ZFN,TALE和/或TALEN***组分的核酸给予培养中的细胞,或用于宿主生物,包括用于感兴趣的蛋白质的框内***基因组基因座 的编码dTAG的供体序列。
非病毒载体递送***包括DNA质粒,RNA(例如本文所述载体 的转录物),裸核酸和与递送载体复合的核酸,例如脂质体。病毒载 体递送***包括DNA和RNA病毒,其在递送至细胞后具有附加型 或整合的基因组。关于基因治疗程序的综述,参见Anderson, Science256,(1992):808-813;Nabel&Feigner,TIBTECH 11, (1993):211-217;Mitani&Caskey,TIBTECH 11,(1993):162-166; Dillon.TIBTECH 11,(1993):167-173;Miller,Nature357, (1992):455-460;Van Brunt,Biotechnology 6(10),(1988):1149-1154; Vigne,Restorative Neurology and Neuroscience 8,(1995):35-36; Kremer&Perricaudet,British Medical Bulletin 51(1),(1995):31-44; 以及Yu et al.,Gene Therapy 1,(1994):13-26。
脂质:核酸复合物的制备,包括靶向脂质体,例如免疫脂质复合 物,是本领域技术人员熟知的(参见,例如,Crystal,Science 270, (1995):404-410;Blaese et al.,CancerGene Ther.2,(1995):291-297; Behr et al.,Bioconjugate Chem.5,(1994):382-389;Remy et al., Bioconjugate Chem.5,(1994):647-654;Gao et al.,Gene Therapy 2,(1995):710-722;Ahmad et al.,Cancer Res.52,(1992):4817-4820; 以及美国专利第4,186,183,4,217,344,4,235,871,4,261,975, 4,485,054,4,501,728,4,774,085,4,837,028和4,946,787号)。
另外的递送方法包括使用将待递送的核酸包装到EnGeneIC递送 载体(EDV)中。使用双特异性抗体将这些EDV特异性递送至靶组织, 其中抗体的一个臂对靶组织具有特异性,另一个臂对EDV具有特异 性。抗体将EDV带到靶细胞表面,然后通过胞吞作用将EDV带入细胞。一旦进入细胞,就释放内容物(参见,MacDiarmid et al Nature Biotechnology 27(7),(2009):643)。
D.异双功能性化合物
本申请包括异双功能性化合物的用途,该异双功能性化合物具有 (i)与泛素连接酶结合的部分和(ii)与dTAG结合的靶向部分,该 dTAG已经与意欲用于泛素化和蛋白酶体降解的内源性蛋白融合。在 一个具体例中,异双功能性化合物与突变的dTAG结合以对相应的 内源性蛋白质具有选择性(即,dTAG靶向配体结合dTAG,但不显 着结合天然存在的(并且在一些具体例中,将不显着结合宿主表达的 突变或变异蛋白))。
采用泛素蛋白酶体途径(UPP)选择性靶向和降解蛋白质的策略已 被用于蛋白质功能的转译后控制。异双功能性化合物是由靶蛋白结合 配体和E3泛素连接酶配体组成。异双功能性化合物能够经由募集到 E3泛素连接酶和随后的泛素化来诱导蛋白酶体介导的所选蛋白质的 降解。这些类似药物的分子提供了对蛋白质水平的可逆,剂量反应, 可调节,时间控制的可能性。在Deshales等人于2000年9月提交 的名称为“Proteolysis TargetingChimeric Pharmaceutical”的美国专 利第7,041,298号中提供了这种化合物的早期描述,并于2006年5 月授予专利。Sakamoto等人(PNAS 98(15)(2001):8554-8559),名 称为“PROTACS:Chimeric Molecules that Target Proteins to the Skp1-Cullin F BoxComplex for Ubiquitination and Degradation,”本 发明描述了一种异双功能性化合物,其由与能够结合F-盒蛋白β- TRCP的肽连接的MAP-AP-2的小分子结合物组成,其揭示内容也 在美国专利7,041,298中提供。Sakamoto等人的出版物(Molecular and CellularProteomics 2(2003):1350-1358),名称为“Development of PROTACS to Target Cancer-promoting Proteins for Ubiquitination and Degradation,”描述了一种类似的异双功能性化合物(PROTAC2), 它不是降解MAP-AP-2而是降解***和雄激素受体。Schneekloth等人的出版物(JACS 126(2004):3748-3754),名称为“Chemical Genetic Control ofProtein Levels:Selective in vivo Targeted Degradation”,描述了靶向FK506结合蛋白(FKBP12)的类似异双功 能性化合物(PROTAC3),并显示PROTAC2和PROTAC3用绿色荧 光蛋白(GFP)成像击中每一个的目标。Schneekloth等人的出版物 (ChemBioChem 6(2005)40-46),名称为“Chemical Approaches to Controlling Intracellular ProteinDegradation”使用该技术描述了当时 领域的状态。Schneekloth等人的出版物(BMCL 18(22)(2008): 5904-5908),名称为“Targeted Intracellular Protein DegradationInduced by a Small Molecule:En Route to Chemical Proteomics”, 描述了由PEG连接的两个小分子组成的异双功能性化合物通过同时 结合雄激素受体和泛素E3连接酶降解雄激素受体。Crews等人的 WO2013/170147,名称为“Compounds Useful for PromotingProtein Degradation and Methods Using Same”,描述了包含与连接子共价结 合的蛋白质降解部分的化合物,其中化合物的ClogP等于或高于1.5。 Buckley等人对上述出版物的综述(Angew.Chem.Int.Ed. 53(2014):2312-2330),名称为“Small-Molecule Control ofIntracellular Protein Levels through Modulation of the Ubiquitin ProteosomeSystem”。转让给Arvinas Inc.的WO 2015/160845,名 称为“Imide Based Modulators ofProteolysis and Associated methods of Use法”,描述了使用降解决定区域技术和沙利度胺来利用脑脊髓 作为E3连接酶蛋白。J.Lu等人的下述出版物(Chemistry and Biol. 22(6)(2015):755-763),名称为“Hijkacking the E3 Ubiquitin Ligase Cereblon toefficiently Target BDR4”,类似地描述了用于降解 BDR4的基于沙利度胺的化合物。描述该技术的其他出版物包括 Bondeson等人(Nature Chemical Biology 11(2015):611-617), Gustafson等人(Angew.Chem.Int.Ed.54(2015):9659-9662), Buckley等人(ACSChem.Bio.10(2015):1831-1837),转让给Arvinas Inc.的US 2016/0058872,名称为“ImadeBased/modulators of Proteolysis and Associated Methods of Use”,转让给ArvinasInc.的 US 2016/0045607,名称为“Estrogen-related Receptor Alpha Based ProTACCompounds and Associated Methods of Use”,转让给耶鲁 大学,葛兰素史克和Cambridge Enterprise Limited University of Cambridge的US 2014/0356322,名称为“Compounds and Methods for the Enhanced Degradation of Targeted Proteins&Other Polypeptides by an E3 Ubiquitin Ligase”,Lai等人(Angew.Chem. Int.Ed.55(2016):807-810),Toure等人(Angew.Chem.Int.Ed. 55(2016):1966-1973)和转让给达纳-法柏癌症学院有限公司的US 2016/0176916,名称为“Methods to Induce TargetedProtein Degradation through Bifunctional Molecules”。
靶向蛋白质降解技术的其他描述包括Itoh等人(JACS 132(16) (2010):5820-5826),名称为“Protein Hockdown Using Methyl Bestatin-Ligand Hybrid Molecules:Design and Synthesis of Inducers ofUbiquitination-Mediated Degradation ofCellular Retinoic Acid- Binding Proteins”,其描述了与利用E3泛素连接酶降解视黄酸结合 蛋白的肽连接的小分子,Winter等人(Science 348(2015):1376-1381), 名称为“Phthalimide Conjugation as a Strategy for in vivo Target ProteinDegradation”,描述了基于沙利度胺的靶向蛋白质降解技术。
可用于本发明的异双功能性化合物可以是能够结合dTAG以诱 导降解的任何异双功能性化合物。异双功能性化合物通常是本领域已 知的,例如参见美国专利7,041,298;Sakamoto等人(PNAS,2001, 98(15):8554-8559);Sakamoto等人(Molecular and CellularProteomics 2(2003)1350-1358);Schneekloth等人(JACS 126 (2004):3748-3754);Schneekloth等人(ChemBioChem 6(2005):40- 46);Schneekloth等人(BMCL 18(22)(2008):5904-5908);WO 2013/170147;Buckley等人(Angew.Chem.Int.Ed.53 (2014):2312-2330);WO 2015/160845;Lu等人(Chemistry and Biol.22(6)(2015):755-763);Bondeson等人(Nature Chemical Biology 11(2015):611-617);Gustafson等人(Angew.Chem.Int.Ed. 54(2015):9659-9662);Buckley等人(ACS Chem.Bio.10 (2015):1831-1837);转让给Arvinas Inc.的U.S.2016/0058872,名 称为“Imide BasedModulators of Proteolysis and Associated Methods of Use”,转让给Arvinas Inc.的U.S.2016/0045607,名称 为”Estrogen-related Receptor Alpha Based PROTACCompounds and Associated Methods of Use”,转让给Yale University,GlaxoSmithKline,and Cambridge Enterprise Limited University of Cambridge的U.S.2014/0356322assigned to,名称为“Compounds and Methods for the EnhancedDegradation of Targeted Proteins& Other Polypeptides by an E3 UbiquitinLigase”,转让给达纳-法柏癌 症学院有限公司的U.S.2016/0176916,名称为”Methods toInduce Targeted Protein Degradation Through Bifunctional Molecules”,Lai 等人(Angew.Chem.Int.Ed.55(2016):807-810);Toure等人 (Angew.Chem.Int.Ed.55(2016):1966-1973);Itoh等人(JACS 132(16)(2010):5820-5826);以及Winter等人(Science 348(2015):1376-1381),其中的每一个都通过引用并入本文。
通常,适用于本申请的异双功能性化合物具有以下通式结构:
降解决定区域-连接子-dTAG靶向配体
其中连接子与降解决定区域和dTAG靶向配体共价结合,降解 决定区域是能够结合泛素连接酶如E3泛素连接酶(例如,小脑蛋白) 的化合物,并且dTAG靶向配体能够结合内源性蛋白质-dTAG杂合 蛋白上的dTAG。
在某些具体例中,本申请使用式I或式II的化合物:
其中:
连接子是一个与dTAG靶向配体和Y共价结合的基团;和
dTAG靶向配体能够与dTAG靶标结合或被dTAG靶标结合,从 而允许加标签发生。
在某些具体例中,本申请提供式(I)化合物,或其对映异构体, 非对映异构体,立体异构体或药学上可接受的盐,
其中:
连接子(L)是与dTAG靶向配体和Y共价结合的基团;和
dTAG靶向配体能够与dTAG靶向蛋白结合(binding to)或结合 (binds to);
其中X1,X2,Y,R1,R2,R2’,R3,R3’,R4,R5,m和n每 一个如本文所定义。
在某些具体例中,本申请提供式(II)的化合物,或其对映异构体, 非对映异构体,立体异构体或药学上可接受的盐,
其中:
连接子是一个与dTAG靶向配体和Y共价结合的基团;和
dTAG靶向配体能够与靶蛋白结合(binding to)或结合(binds to);
其中X1,X2,Y,R1,R2,R2’,R3,R3’,R4,R5,m和n每 一个如本文所定义。
在某些具体例中,本发明使用式III,式IV,式V,式VI,式 VII,式VIII和式IX的化合物:
其中:
连接子(L)是与dTAG靶向配体和Z2共价结合的基团;
dTAG靶向配体能够结合靶dTAG或被靶dTAG结合;
Z2为键,烷基,-O,-C(O)NR2,-NR6C(O),-NH或-NR6
R6是H,烷基,-C(O)烷基或-C(O)H;
X3独立地选自O,S和CH2
W2独立地选自CH2,CHR,C=O,SO2,NH和N-烷基;
Y2独立地选自NH,N-烷基,N-芳基,N-杂芳基,N-环烷基, N-杂环基,O和S;
G和G’独立地选自H,任选被R’取代的烷基,OH,CH2-杂环 基,和任选被R’取代的芐基;
Q1,Q2,Q3和Q4独立地选自CH,N,CR’和N-氧化物。
A2独立地选自烷基,环烷基,Cl和F;
R7选自:—CONR′R″,—OR′,—NR′R″,—SR′, —SO2R′,—SO2NR′R″,—CR′R″—,—CR′NR′R″—, -芳基,-杂芳基,-烷基,-环烷基,-杂环基,—P(O)(OR′)R″,— P(O)R′R″,—OP(O)(OR′)R″,—OP(O)R′R″,—Cl,—F, —Br,—I,—CF3,—CN,—NR′SO2NR′R″,—NR′CONR′ R″,—CONR′COR″,—NR′C(═N—CN)NR′R″,—C(═ N—CN)NR′R″,—NR′C(═N—CN)R″,—NR′C(═C— NO2)NR′R″,—SO2NR′COR″,—NO2,—CO2R′,—C(C═ N—OR′)R″,—CR′═CR′R″,—CCR′,—S(C═O)(C═N— R′)R″,—SF5以及—OCF3
R’和R“独立地选自键,H,烷基,环烷基,芳基,杂芳基,杂 环基。
用于本发明的dTAG靶向配体的非限制性实例包括:
以及
在一些具体例中,dTAG靶向配体靶向突变的内源性靶标或非 内源性靶标。
降解决定区域
降解决定区域是将dTAG通过连接子和dTAG靶向配体连接到 泛素连接酶以进行蛋白酶体降解的化合物部分。在某些具体例中,降 解决定区域能结合(binding to)或结合(binds to)泛素连接酶的化合物。 在进一步的具体例中,降解决定区域是结合E3泛素连接酶的化合物。 在进一步的具体例中,降解决定区域是结合小脑蛋白的化合物。在 进一步的具体例中,降解决定区域是沙利度胺或其衍生物或类似物。
在某些具体例中,降解决定区域是式D,式D0或式D’的部分:
或其对映异构体,非对映异构体或立体异构体,其中:
Y是键(CH2)1-6,(CH2)0-6-O,(CH2)0-6-C(O)NR2’,(CH2)0-6- NR2’C(O),(CH2)0-6-NH,或(CH2)0-6-NR2
X是C(O)or C(R3)2
X1-X2是C(R3)=N或C(R3)2-C(R3)2
每个R1独立地是卤素,OH,C1-C6烷基或C1-C6烷氧基;
R2是C1-C6烷基C(O)-C1-C6烷基或C(O)-C3-C6环烷基;
R2’是H或C1-C6烷基;
每个R3独立地为H或C1-C3烷基;
每个R3’独立地为C1-C3烷基;
每个R4独立地为H或C1-C3烷基;;或两个R4与它们所连接的 碳原子一起形成C(O),C3-C6碳环,或包含1或2个选自N和O的 杂原子的4-、5-或6-元杂环;
R5为H,氘,C1-C3烷基,F或Cl;
m为0、1、2或3;和
n为0、1或2;
其中该化合物与另一部分(例如化合物或连接子)经由共价键 合。
在某些具体例中,降解决定区域是式D的部分,其中
在某些具体例中,降解决定区域是式D的部分,其中
在某些具体例中,降解决定区域是式D的部分,其中X是C(O)。
在某些具体例中,降解决定区域是式D的部分,其中X是 C(R3)2;以及每个R3是H。在某些具体例中,X是C(R3)2;R3中的 一个是H,另一个是选自甲基,乙基和丙基的C1-C3烷基。在某些 具体例中,X是C(R3)2;每个R3独立地选自甲基,乙基和丙基。
在某些具体例中,降解决定区域是式D的部分,其中X1-X2是 C(R3)=N。在某些具体例中,X1-X2是CH=N。在某些具体例中, X1-X2是C(R3)=N;R3是选自甲基,乙基和丙基的C1-C3烷基。在 某些具体例中,X1-X2是C(CH3)=N。
在某些具体例中,降解决定区域是式D的部分,其中X1-X2是 C(R3)2-C(R3)2;及每个R3是H。在某些具体例中,X1-X2是C(R3)2- C(R3)2;及R3中的一个是H,另外三个R3独立地是选自甲基,乙基 和丙基的C1-C3烷基。在某些具体例中,及X1-X2是C(R3)2-C(R3)2; R3中的两个是H,另外两个R3独立地是选自甲基,乙基和丙基的 C1-C3烷基。在某些具体例中,X1-X2是C(R3)2-C(R3)2;R3中的三 个是H,剩余的R3是选自甲基,乙基和丙基的C1-C3烷基。
在某些具体例中,降解决定区域是式D的部分,其中Y是键。
在某些具体例中,降解决定区域是式D的部分,其中Y是 (CH2)1,(CH2)2,(CH2)3,(CH2)4,(CH2)5或(CH2)6。在某些具体例 中,Y是(CH2)1,(CH2)2或(CH2)3。在某些具体例中,Y是(CH2)1或 (CH2)2
在某些具体例中,降解决定区域是式D的部分,其中Y是O, CH2-O,(CH2)2-O,(CH2)3-O,(CH2)4-O,(CH2)5-O或(CH2)6-O。 在某些具体例中,Y是O,CH2-O,(CH2)2-O或(CH2)3-O。在某些 具体例中,Y是O或CH2-O。在某些具体例中,Y是O。
在某些具体例中,降解决定区域是式D的部分,其中Y是 C(O)NR2’,CH2-C(O)NR2’,(CH2)2-C(O)NR2’,(CH2)3-C(O)NR2’, (CH2)4-C(O)NR2’,(CH2)5-C(O)NR2’或(CH2)6-C(O)NR2’。在某些具 体例中,Y是C(O)NR2’,CH2-C(O)NR2’,(CH2)2-C(O)NR2’或 (CH2)3-C(O)NR2’。在某些具体例中,Y是C(O)NR2’或CH2- C(O)NR2’。在某些具体例中,Y是C(O)NR2’。
在某些具体例中,降解决定区域是式D的部分,其中Y是 NR2’C(O),CH2-NR2’C(O),(CH2)2-NR2’C(O),(CH2)3-NR2’C(O), (CH2)4-NR2’C(O),(CH2)5-NR2’C(O)或(CH2)6-NR2’C(O)。在某些具 体例中,Y是NR2’C(O),CH2-NR2’C(O),(CH2)2-NR2’C(O)或 (CH2)3-NR2’C(O)。在某些具体例中,Y是NR2’C(O)或CH2- NR2’C(O)。在某些具体例中,Y是NR2’C(O)。
在某些具体例中,降解决定区域是式D的部分,其中R2’是H。 在某些具体例中,降解决定区域是式D的部分,其中R2’选自甲基, 乙基,丙基,丁基,异丁基,叔丁基,戊基,异戊基和己基。在某些 具体例中,R2’是选自甲基,乙基和丙基的C1-C3烷基。
在某些具体例中,降解决定区域是式D的部分,其中Y is Y是 NH,CH2-NH,(CH2)2-NH,(CH2)3-NH,(CH2)4-NH,(CH2)5-NH 或(CH2)6-NH。在某些具体例中,Y是NH,CH2-NH,(CH2)2-NH, (CH2)3-NH。在某些具体例中,Y是NH或CH2-NH。在某些具体例 中,Y是NH。
在某些具体例中,降解决定区域是式D的部分,其中Y是NR2, CH2-NR2,(CH2)2-NR2,(CH2)3-NR2,(CH2)4-NR2,(CH2)5-NR2或 (CH2)6-NR2。在某些具体例中,Y是NR2、CH2-NR2、(CH2)2-NR2或(CH2)3-NR2。在某些具体例中,Y is NR2 or CH2-NR2.在某些具 体例中,Y是NR2
在某些具体例中,降解决定区域是式D的部分,其中R2选自甲 基,乙基,丙基,丁基,异丁基,叔丁基,戊基,异戊基和己基。 在某些具体例中,R2选自甲基,乙基和丙基的C1-C3烷基。
在某些具体例中,降解决定区域是式D的部分,其中R2选自 C(O)–甲基,C(O)–乙基,C(O)–丙基,C(O)–丁基,C(O)–异丁基, C(O)–叔丁基,C(O)–戊基,C(O)–异戊基和C(O)–己基。在某些具 体例中,R2是选自C(O)–甲基,C(O)–乙基和C(O)–丙基的C(O)– C1-C3烷基。
在某些具体例中,降解决定区域是式D的部分,其中R2C(O)– 环甲基,C(O)–环乙基,C(O)–环丙基,C(O)–环丁基,C(O)–环戊基, 和C(O)–环己基。在某些具体例中,R2是C(O)–环己基。
在某些具体例中,降解决定区域是式D的部分,其中R3是H。
在某些具体例中,降解决定区域是式D的部分,其中R3选自甲 基,乙基和丙基的C1-C3烷基。在某些具体例中,R3是甲基。
在某些具体例中,降解决定区域是式D的部分,其中n是0。
在某些具体例中,降解决定区域是式D的部分,其中n是1。
在某些具体例中,降解决定区域是式D的部分,其中n是2。
在某些具体例中,降解决定区域是式D的部分,其中每个R3’独 立地为选自甲基,乙基和丙基的C1-C3烷基。
在某些具体例中,降解决定区域是式D的部分,其中m是0。
在某些具体例中,降解决定区域是式D的部分,其中m是1。
在某些具体例中,降解决定区域是式D的部分,其中m是2。
在某些具体例中,降解决定区域是式D的部分,其中m是3。
在某些具体例中,降解决定区域是式D的部分,其中每个R1独 立地选自卤素(例如,F,Cl,Br和I),OH,C1-C6烷基(例如甲基, 乙基,丙基,丁基,异丁基,叔丁基,戊基,异戊基和己基)和C1- C6烷氧基(例如,甲氧基,乙氧基,丙氧基,丁氧基,异丁氧基,叔 丁氧基和戊氧基)。在进一步的具体例中,降解决定区域是式D的部 分,其中每个R1独立地选自F,Cl,OH,甲基,乙基,丙基,丁基, 异丁基,叔丁基,甲氧基和乙氧基。
在某些具体例中,降解决定区域是式D的部分,其中每个R4是 H。
在某些具体例中,降解决定区域是式D的部分,其中每个R4是 H,而其他的R4是选自甲基,乙基和丙基的C1-C3烷基。
在某些具体例中,降解决定区域是式D的部分,其中每个R4独 立地是选自甲基,乙基和丙基的C1-C3烷基。
在某些具体例中,降解决定区域是式D的部分,其中两个R4与 它们所连接的碳原子一起形成C(O)。
在某些具体例中,降解决定区域是式D的部分,其中两个R4与 它们所连接的碳原子一起形成环丙基,环丁基,环戊基或环己基。
在某些具体例中,降解决定区域是式D的部分,其中两个R4与 它们所连接的碳原子一起形成选自氧杂环丁烷,氮杂环丁烷,四氢呋 喃,吡咯烷,哌啶,哌嗪和吗啉的4-,5-或6-元杂环。在某些具体 例中,两个R4与它们所连接的碳原子一起形成氧杂环丁烷。
在某些具体例中,降解决定区域是式D的部分,其中R5是H, 氘或C1-C3烷基。在进一步的具体例中,R5是(S)或(R)构型。在进 一步的具体例中,R5是(S)构型。在某些具体例中,降解决定区域是 式D的部分,其中该化合物包含(S)-R5和(R)-R5的外消旋混合物。
在某些具体例中,降解决定区域是式D的部分,其中R5是H。
在某些具体例中,降解决定区域是式D的部分,其中R5是氘。
在某些具体例中,降解决定区域是式D的部分,其中R5是选自 甲基,乙基和丙基的C1-C3烷基。在某些具体例中,R5是甲基。
在某些具体例中,降解决定区域是式D的部分,其中R5是F或 Cl。在进一步的具体例中,R5是(S)或(R)构型。在进一步的具体例中, R5是(R)构型。在某些具体例中,降解决定区域是式D的部分,其中 该化合物包含(S)-R5和(R)-R5的外消旋混合物。在某些具体例中,R5是F。
在某些具体例中,降解决定区域选自图21中的结构,其中X是 H,氘,C1-C3烷基或卤素;和R是连接子的连接点。
在某些具体例中,降解决定区域选自图22中的结构。
在某些具体例中,降解决定区域选自图23中的结构。
连接子
连接子将dTAG靶向配体与降解决定区域连接起来的键或化学 基团。在某些具体例中,连接子是碳链。在某些具体例中,碳链任 选地包括一个,两个,三个或更多个选自N,O和S的杂原子。在某 些具体例中,碳链仅包含饱和链碳原子。在某些具体例中,碳链任 选地包含两个或更多个不饱和链碳原子(例如,C=C或C≡C)。在 某些具体例中,碳链中的一个或多个链碳原子任选地被一个或多个取 代基取代(例如,氧代,C1-C6烷基,C2-C6烯基,C2-C6炔基,C1-C3烷氧基,OH,卤素,NH2,NH(C1-C3烷基),N(C1-C3烷基)2,CN, C3-C8环烷基,杂环基,苯基和杂芳基)。
在某些具体例中,连接子包括至少5个链原子(例如,C,O,N 和S)。在某些具体例中,连接子包含少于20个链原子(例如,C,O, N和S)。在某些具体例中,连接子包含5、6、7、8、9、10、11、 12、13、14、15、16、17、18或19个链原子(例如,C,O,N和S)。 在某些具体例中,连接子包含5、7、9、11、13、15、17或19个链 原子(例如,C,O,N和S)。在某些具体例中,连接子包含5、7、9 或11个链原子(例如,C,O,N和S)。在某些具体例中,连接子包 含6、8、10、12、14、16或18个链原子(例如,C,O,N和S)。 在某些具体例中,连接子包含6、8、10或12个链原子(例如,C,O, N和S)。
在某些具体例中,连接子是任选被非庞大取代基(例如,氧代, C1-C6烷基,C2-C6烯基,C2-C6炔基,C1-C3烷氧基,OH,卤素, NH2,NH(C1-C3烷基),N(C1-C3烷基)2和CN)取代的碳链。在某些 具体例中,非庞大的取代位于靠近降解决定区域的链碳原子上(即, 碳原子与降解决定区域结合的碳原子至少分别为连接子中的3、4或 5个链原子))。
在某些具体例中,连接子属于公式L0:
或其对映异构体,非对映异构体或立体异构体
P1是选自0至12的整数;
P2是选自0至12的整数;
P3是选自1至6的整数;
每个W独立地为不存在,CH2,O,S,NH或NR5
Z为不存在,CH2,O,NH或NR5
每个R5独立地是C1-C3烷基;和
Q为不存在或-CH2C(O)NH-,
其中连接子以邻接Q的方式与降解决定区域共价键合,并以 邻接Z的方式与dTAG靶向配体共价键合,及其中连接子中的 链原子的总数小于20。
在某些具体例中,连接子-dTAG靶向配体(TL)具有式L1或L2 的结构:
或其对映异构体,非对映异构体或立体异构体,其中:
P1是选自0至12的整数;
P2是选自0至12的整数;
P3是选自1至6的整数;
每个W为独立地不存在,CH2,O,S,NH或NR5
Z为不存在,CH2,O,NH或NR5
每个R5独立地是C1-C3烷基;和
TL是dTAG靶向配体,
其中连接子以与降解决定区域共价键合。
在某些具体例中,p1是选自0至10的整数。
在某些具体例中,p1是选自2至10的整数。
在某些具体例中,p1选自1、2、3、4、5和6。
在某些具体例中,p1选自1、3和5。
在某些具体例中,p1选自1、2和3。
在某些具体例中,p1是3。
在某些具体例中,p2是选自0至10的整数。
在某些具体例中,p2选自0、1、2、3、4、5和6。
在某些具体例中,p2是选自0和1的整数。
在某些具体例中,p3是选自1至5的整数。
在某些具体例中,p3选自2、3、4和5。
在某些具体例中,p3选自1、2和3。
在某些具体例中,p3选自2和3。
在某些具体例中,至少一个W是CH2
在某些具体例中,至少有一个W是O。
在某些具体例中,至少有一个W是S。
在某些具体例中,至少有一个W是NH。
在某些具体例中,至少有一个W是NR5;和R5是选自甲基, 乙基和丙基的C1-C3烷基。
在某些具体例中,W是O。
在某些具体例中,Z不存在。
在某些具体例中,Z是CH2
在某些具体例中,Z是O。
在某些具体例中,Z是NH。
在某些具体例中,Z是NR5;和R5是选自甲基,乙基和丙基的 C1-C3烷基。
在某些具体例中,Z是与连接子键合的dTAG靶向配体的一部 分,即Z是由dTAG靶向配体的官能团与连接子反应形成的。
在某些具体例中,W是CH2,Z是CH2
在某些具体例中,W是O,Z是CH2
在某些具体例中,W是CH2,Z是O。
在某些具体例中,W是O,Z是O。
在某些具体例中,连接子-dTAG靶向配体具有从表L中选择的 结构:
表L
其中Z,TL和p1每一个如上所述。
本文描述的任何一种降解决定区域可以与本文描述的任何一连 接子共价结合。
在某些具体例中,本申请包括具有如下结构的降解决定区域-连 接子(DL):
其中每个变量如上式D0和式L0中所述,并且dTAG靶向配体以 邻接Z的方式与DL共价键合。
在某些具体例中,本申请包括具有以下结构的降解决定区域-连 接子(DL):
其中每个变量如上式D和式L0中所述,并且dTAG靶向配体以邻接Z的方式与DL共价键合到DL。
本申请的一些具体例包含具有以下结构的双功能性化合物:
或其对映异构体,非对映异构体或立体异构体,其中每个变量如上式 D和式L0中所述,并且dTAG靶向配体在下文中描述。
本申请的其他具体例涉及具有以下结构的双功能性化合物:
或其对映异构体,非对映异构体或立体异构体,其中每个变量如上式 D和式L0中所述,并且dTAG靶向配体在下文中描述。
本申请的某些具体例涉及具有以下结构之一的双功能性化合物:
在某些具体例中,连接子可以是聚乙二醇基,其大小范围为约 1至约12个乙二醇单元,1至约10个乙二醇单元,约2个约6个乙 二醇单元,约2至5个乙二醇单元,约2至4个乙二醇单元。
在某些具体例中,连接子是基于SAR(结构-活性关系)和dTAG 靶向配体的X射线晶体学设计和优化的,以用于连接器的连接位置。
在某些具体例中,最佳连接子长度和组成因目标而异,并且可 以基于与其目标结合的原始dTAG靶向配体的X射线结构来估计。 还可以修饰连接子长度和组成以调节代谢稳定性和药代动力学(PK) 和药效学(PD)参数。
在dTAG靶向配体结合多个靶标的情况下,可以通过改变连接 子长度来实现选择性,其中配体在不同的结合口袋中结合其一些靶标, 例如比其它更深或更浅的结合口袋。
在另外的具体例中,用于本发明的异双功能性化合物包括化学 连接子(L)。在某些具体例中,连接子基团L是包含一个或多个共价 连接的A结构单元(例如,-A1…Aq-)的基团,其中A1是与降解决 定区域中,dTAG靶向配体或其组合的至少一个偶合的基团。在某些具体例中,A1将降解决定区域,dTAG靶向配体或其组合直接连接 到另一个降解决定区域,靶向配体或其组合。在其他具体例中,A1 通过Aq将降解决定区域,dTAG靶向配体或其组合间接连接另一个 降解决定区域,dTAG靶向配体或其组合。
在某些具体例中,A1至Aq每一个独立地为键,CRL1RL2,O, S,SO,SO2,NRL3,SO2NRL3,SONRL3,CONRL3,NRL3CONRL4, NRL3SO2NRL4,CO,CRL1=CRL2,C≡C,SiRL1RL2,P(O)RL1, P(O)ORL1,NRL3C(=NCN)NRL4,NRL3C(=NCN),NRL3C(= CNO2)NRL4,任选经0至6个RL1和/或RL2基团取代的C3-11环烷基, 任选经0至6个RL1和/或RL2基团取代的C3-11杂环基,任选经0至 6个RL1和/或RL2基团取代的芳基,任选经0至6个RL1和/或RL2基 团取代的杂芳基,其中RL1或RL2每一个独立地可以与其他A基团连 接以形成环烷基和/或杂环基部分,其可以进一步经0至4个RL5基 团取代;其中,
RL1、RL2、RL3、RL4以及RL5每一个独立地为H、卤素、C1-8烷基,OC1-8烷基,SC1-8烷基,NHC1-8烷基,N(C1-8烷基)2, C3-11环烷基,芳基,杂芳基,C3-11杂环基,OC1-8环烷基, SC1-8环烷基,NHC1-8环烷基,N(C1-8环烷基)2,N(C1-8环烷 基)(C1-8烷基),OH,NH2,SH,SO2C1-8烷基,P(O)(OC1-8烷 基)(C1-8烷基),P(O)(OC1-8烷基)2,CC—C1-8烷基,CCH, CH═CH(C1-8烷基),C(C1-8烷基)=CH(C1-8烷基),C(C1-8烷 基)=C(C1-8烷基)2,Si(OH)3,Si(C1-8烷基)3,Si(OH)(C1-8烷基)2,COC1-8烷基,CO2H,卤素,CN,CF3,CHF2,CH2F, NO2,SF5,SO2NHC1-8烷基,SO2N(C1-8烷基)2,SONHC1-8烷基,SON(C1-8烷基)2,CONHC1-8烷基,CON(C1-8烷基)2, N(C1-8烷基)CONH(C1-8烷基),N(C1-8烷基)CON(C1-8烷基)2, NHCONH(C1-8烷基),NHCON(C1-8烷基)2,NHCONH2, N(C1-8烷基)SO2NH(C1-8烷基),N(C1-8烷基)SO2N(C1-8烷基)2, NH SO2NH(C1-8烷基),NH SO2N(C1-8烷基)2,NHSO2NH2
在某些具体例中,q是大于或等于0的整数。在某些具体例中, q是大于或等于1的整数。
在某些具体例中,例如,其中q大于2,Aq是与降解决定区域 连接的基团,A1和Aq经由A的结构单元连接(A的结构单元数:q- 2)。
在某些具体例中,例如,其中q是2,Aq是与A1和降解决定区 域部分连接的基团。
例如,在q为1的情况下,连接子基团L的结构是-A1-,并且A1是 与降解决定区域部分和dTAG靶向配体部分连接的基团。
在另外的具体例中,q是1至100、1至90、1至80、1至70、 1至60、1至50、1至40、1至30、1至20或1至10的整数。
在某些具体例中,连接子(L)选自图45中的结构。
在其他具体例中,连接子(L)选自图46中的结构,其中
表示
在另外的具体例中,连接子是任选取代的(聚)乙二醇,其具有1 至约100个乙二醇单元,约1至约50个乙二醇单元,1至约25个乙 二醇单元,约1至10个乙二醇单元,1至约8个乙二醇单元和1和6 个乙二醇单元,2至4个乙二醇单元,或任选取代的烷基,其中散布 有任选取代的O,N,S,P或Si原子。在某些实施例中,连接子被 芳基,苯基,芐基,烷基,亚烷基或杂环基取代。在某些实施例中, 连接子可以是不对称的或对称的。
在本文所述化合物的任何具体例中,连接子可以是如本文所述 的任何合适的部分。在一个具体例中,连接基是经取代或未经取代的 聚乙二醇基,其大小范围为约1至约12个乙二醇单元,1至约10个 乙二醇单元,约2个约6个乙二醇单元,约2至5个乙二醇单元,约2至4个乙二醇单元。
虽然降解决定区域组和dTAG靶向配体基团可通过任何适合且 对连接子化学稳定的基团共价连接到连接子基团,但连接子独立共价 键合到降解决定区域基团和dTAG靶向配体基团组优选通过酰胺, 酯,硫酯,酮基,氨基甲酸酯(carbamate)(氨基甲酸酯(urethane)), 碳或醚,其中每个基团可以***降解决定区域基团和dTAG靶向配 体基团的任何位置,以提供降解决定区域基团对泛素连接酶和靶标 dTAG上的dTAG靶向配体基团。(应注意,在降解决定区域基团靶 向泛素连接酶的某些方面,用于降解的靶蛋白可以是泛素连接酶本 身)。连接子可以与降解决定区域和/或dTAG靶向配体基团上的任选 取代的烷基,亚烷基,烯基或炔基,芳基或杂环基连接。
在某些具体例中,“L”可以是具有4至24个直链原子的直链, 直链中的碳原子可以被氧,氮,酰胺,氟化碳等取代,例如图26所 示结构。
在某些实施例中,“L”可以是非直链,并且可以是脂族或芳族 或杂芳族环状部分,“L”的一些实例包括,但不限于,图27的结构, 其中X和Y独立地选自键,CRL1RL2,O,S,SO,SO2,NRL3, SO2NRL3,SONRL3,CONRL3,NRL3CONRL4,NRL3SO2NRL4,CO, CRL1=CRL2,C≡C,SiRL1RL2,P(O)RL1,P(O)ORL1,NRL3C(= NCN)NRL4,NRL3C(=NCN),NRL3C(=CNO2)NRL4,任选被经0至6个RL1和/或RL2基团取代的C3至11环烷基,任选被经0至6个 RL1取代的C3-11杂环基和/或RL2基团,任选被经0至6个RL1和/或 RL2基团取代的芳基,任选被经0至6个RL1和/或RL2基团取代的杂 芳基,其中RL1或RL2每一个独立地可以与其他A基团连接形成环烷 基和/或杂环基部分,其可进一步经0至4个RL5基团取代。
dTAG靶向配体
dTAG靶向配体(TL)能够与dTAG结合或被dTAG靶标结合, 其允许发生泛素标记;
如本文所设想的,本发明的基因组包括位于细胞质中的异双功 能性化合物靶向蛋白(dTAG)。基因组的异双功能性化合物靶向蛋白 是异双功能性化合物可以结合的任何氨基酸序列,当与异双功能性化 合物接触时导致dTAG杂合蛋白的降解。优选地,dTAG不应干扰 CAR的功能。在一个具体例中,dTAG是非内源肽,导致异双功能 性化合物选择性并允许在给药异双功能性化合物时避免脱靶效应。在 一个具体例中,dTAG是衍生自内源性蛋白质的氨基酸序列,其已被 修饰以使异双功能性化合物仅结合修饰的氨基酸序列,而不结合内源 性表达的蛋白质。在一个具体例中,dTAG是内源性表达的蛋白质。 可以通过配体结合用于异双功能性化合物的任何氨基酸序列结构域可 以用作本文设想的dTAG。
在特定的具体例中,用于本发明的dTAG,包括但不限于衍生 自内源性表达的蛋白质的氨基酸序列,例如FK506结合蛋白- 12(FKBP12),含溴结构域的蛋白质4(BRD4),CREB结合蛋白 (CREBBP)和转录激活因子BRG1(SMARCA4)或其变体。如本文所 设想的,“变体”意指任何变体,例如取代,删除或添加一个或几个至 多个氨基酸,条件是该变体基本上保留与原始序列相同的功能,其在 这种情况下提供异双功能性化合物配体结合。在其他具体例中,本发 明中吾等的dTAG可包含例如激素受体,例如***受体蛋白,雄 激素受体蛋白,类视黄醇x受体(RXR)蛋白和二氢叶酸还原酶 (DHFR),包括细菌DHFR,细菌脱氢酶和变体。
在一个具体例中,dTAG是本文鉴定的任何蛋白质的一部分。 例如,dTAG可以是BRD4的BD1结构域或BRD4的BD2结构域。 在一个具体例中,本文鉴定的靶向亲本dTAG的靶向配体替代地用 于靶向部分。在一个具体例中,表T中的BRD4靶向配体可用于靶 向BD1dTAG。在另一个具体例中,表T中的BRD4靶向配体可用 于靶向BD2 dTAG。
本申请的一些具体例包括靶向dTAG的TL,包括但不限于衍 生自Hsp90抑制剂,激酶抑制剂,MDM2抑制剂,靶向含人类BET 溴结构域的蛋白质的化合物,靶向胞质信号传导蛋白FKBP12的化 合物,HDAC抑制剂,人类赖氨酸甲基转移酶抑制剂,血管生成抑 制剂,免疫抑制化合物和靶向芳烃受体(AHR)的化合物。
在某些具体例中,dTAG靶向配体是能够结合(binding to)或结 合(binds to)衍生自激酶的dTAG的化合物,含有BET溴结构域的蛋 白质,细胞溶质信号蛋白(例如,FKBP12),核蛋白质,组蛋白去乙 酰化酶,赖氨酸甲基转移酶,调节血管生成的蛋白质,调节免疫应答 的蛋白质,芳香烃受体(AHR),***受体,雄激素受体,糖皮质激 素受体或转录因子(例如,SMARCA4,SMARCA2,TRIM24)。
在某些具体例中,dTAG是衍生自dTAG靶向配体能够结合 (binding)或结合(bindsto)的激酶,包括但不限于酪氨酸激酶(例如, AATK,ABL,ABL2,ALK,AXL,BLK)。,BMX,BTK,CSF1R,CSK,DDR1,DDR2,EGFR,EPHA1,EPHA2,EPHA3, EPHA4,EPHA5,EPHA6,EPHA7,EPHA8,EPHA10,EPHB1, EPHB2,EPHB3,EPHB4,EPHB6,ERBB2,ERBB3,ERBB4, FER,FES,FGFR1,FGFR2,FGFR3,FGFR4,FGR,FLT1, FLT3,FLT4,FRK,FYN,GSG2,HCK,IGF1R,ILK,INSR, INSRR,IRAK4,ITK,JAK1,JAK2,JAK3,KDR,KIT,KSR1, LCK,LMTK2,LMTK3,LTK,LYN,MATK,MERTK,MET,MLTK,MST1R,MUSK,NPR1,NTRK1,NTRK2,NTRK3, PDGFRA,PDGFRB,PLK4,PTK2,PTK2B,PTK6,PTK7, RET,ROR1,ROR2,ROS1,RYK,SGK493,SRC,SRMS, STYK1,SYK,TEC,TEK,TEX14,TIE1,TNK1,TNK2,TNNI3K,TXK,TYK2,TYRO3,YES1或ZAP70),丝氨酸/苏氨 酸激酶(如酪蛋白激酶2,蛋白激酶A,蛋白激酶B,蛋白激酶C, Raf激酶,CaM激酶,AKT1,AKT2,AKT3,ALK1,ALK2,ALK3,ALK4,Aurora A,Aurora B,Aurora C,CHK1,CHK2, CLK1,CLK2,CLK3,DAPK1,DAPK2,DAPK3,DMPK, ERK1,ERK2,ERK5,GCK,GSK3,HIPK,KHS1,LKB1, LOK,MAPKAPK2,MAPKAPK,MNK1,MSSK1,MST1, MST2,MST4,NDR,NEK2,NEK3,NEK6,NEK7,NEK9, NEK11,PAK1,PAK2,PAK3,PAK4,PAK5,PAK6,PIM1, PIM2,PLK1,RIP2,RIP5,RSK1,RSK2,SGK2,SGK3,SIK1,STK33,TAO1,TAO2,TGF-β,TLK2,TSSK1,TSSK2,ULK1 或ULK2),细胞周期蛋白依赖性激酶(例如Cdk1至-Cdk11)和富含亮 氨酸的重复激酶(例如LRRK2)。
在某些实施例中,dTAG是衍生自含有dTAG靶向配体能够结 合(binding)或结合(binds)的溴结构域的BET蛋白,包括但不限于 ASH1L,ATAD2,BAZ1A,BAZ1B,BAZ2A,BAZ2B,BRD1, BRD2,BRD3,BRD4,BRD5,BRD6,BRD7,BRD8,BRD9, BRD10,BRDT,BRPF1,BRPF3,BRWD3,CECR2,CREBBP, EP300,FALZ,GCN5L2,KIAA1240,LOC93349,MLL,PB1, PCAF,PHIP,PRKCBP1,SMARCA2,SMARCA4,SP100, SP110,SP140,TAF1,TAF1L,TIF1a,TRIM28,TRIM33, TRIM66,WDR9,ZMYND11和MLL4。在某些具体例中,含有 BET溴结构域的蛋白质是BRD4。
在某些具体例中,dTAG是衍生自dTAG靶向配体能够结合 (binding)或结合(binds)的核蛋白,包括但不限于BRD2,BRD3, BRD4,触角足同源域蛋白,BRCA1,BRCA2,增强CCAAT的结 合蛋白,组蛋白,多梳(Polymcomb)基团蛋白,高迁移率蛋白,端粒 结合蛋白,FANCA,FANCD2,FANCE,FANCF,肝细胞核因子, Mad2,NF-κB,核受体辅激活因子,CREB结合蛋白,p55,p107, p130,Rb蛋白,p53,c-fos,c-jun,c-mdm2,c-myc和c-rel。
在某些具体例中,dTAG靶向配体选自激酶抑制剂,含有BET 溴结构域的蛋白质抑制剂,细胞溶质信号蛋白FKBP12配体,HDAC 抑制剂,赖氨酸甲基转移酶抑制剂,血管生成抑制剂,免疫抑制化合 物,以及芳烃受体(AHR)抑制剂。
在某些具体例中,dTAG靶向配体是SERM(选择性***受体 调节剂)或SERD(选择性***受体降解剂)。SERM和SERD的非 限制性实例在转让给Astra Zeneca的WO2014/191726,转让给 Olema Pharmaceuticals的WO2013/090921、WO2014/203129、 WO2014/313232和US2013/0178445以及转让给Seragon Pharmaceuticals的美国专利第9,078,871、8,853,423和8,703,810号, 以及US 2015/0005286、WO 2014/205136和WO 2014/205138中提 供。
另外的dTAG靶向配体包括,例如,与内源性蛋白质结合的任 何部分(与靶标dTAG结合)。说明性dTAG靶向配体包括小分子 dTAG靶向配体:Hsp90抑制剂,激酶抑制剂,HDM2和MDM2抑 制剂,靶向含有人类BET溴结构域的蛋白质的化合物,HDAC抑制 剂,人赖氨酸甲基转移酶抑制剂,血管生成抑制剂,核激素受体化合 物,免疫抑制化合物和靶向芳烃受体(AHR)的化合物等等。此类小分 子靶标dTAG结合部分还包括这些组合物的药学上可接受的盐,对 映异构体,溶剂化物和多晶型物,以及可靶向目标dTAG的其他小 分子。
在一些具体例中,dTAG靶向配体是Ubc9 SUMO E2连接酶 5F6D靶向配体,包括但不限于彼等描述于“Insights Into the Allosteric Inhibition of the SUMO E2 EnzymeUbc9.”by Hewitt, W.M.,et.al.(2016)Angew.Chem.Int.Ed.Engl.55:5703-5707者。
在另一个具体例中,dTAG靶向配体是Tank1靶向配体,包括 但不限于彼等描述于“Structure of human tankyrase 1in complex with small-molecule inhibitors PJ34and XAV939.”Kirby,C.A., Cheung,A.,Fazal,A.,Shultz,M.D.,Stams,T,(2012)ActaCrystallogr.,Sect.F 68:115-118;和“Structure-Efficiency Relationship of[1,2,4]Triazol-3-ylamines as Novel Nicotinamide Isosteres that Inhibit Tankyrases.”Shultz,M.D.,et al.(2013) J.Med.Chem.56:7049-7059者。
在另一个具体例中,dTAG靶向配体是pp60 Src靶向配体的 SH2结构域,包括但不限于彼等描述于“Requirements for Specific Binding of Low Affinity InhibitorFragments to the SH2 Domain of pp60Src Are Identical to Those for HighAffinity Binding of Full Length Inhibitors”Gudrun Lange,et al.,J.Med.Chem.2003,46, 5184-5195者。
在另一个具体例中,dTAG靶向配体是Sec7结构域靶向配体, 包括但不限于彼等描述于“The Lysosomal Protein Saposin B Binds Chloroquine.”Huta,B.P.,et al.,(2016)Chemmedchem 11:277者。
在另一个具体例中,dTAG靶向配体是鞘脂-B靶向配体,包括 但不限于彼等描述于“The structure of cytomegalovirus immune modulator UL141 highlightsstructural Ig-fold versatility for receptor binding”I.Nemcovicova andD.M.Zajonc Acta Cryst.(2014).D70, 851-862者。
在另一个具体例中,dTAG靶向配体是蛋白S100-A7 2OWS靶 向配体,包括但不限于彼等描述于“2WOS STRUCTURE OF HUMAN S100A7 IN COMPLEX WITH 2,6ANS”DOI:10.2210/pdb2wos/pdb;and“Identification and Characterization of Binding Siteson S100A7,a Participant in Cancer and Inflammation Pathways.”Leon,R.,Murray,et al.,(2009)Biochemistry 48:10591- 10600者。
在另一个具体例中,dTAG靶向配体是磷脂酶A2靶向配体, 包括但不限于彼等描述于“Structure-based design of the first potent and selective inhibitor ofhuman non-pancreatic secretory phospholipase A2“Schevitz,R.W.,et al.,Nat.Struct.Biol.1995,2, 458-465者。
在另一个具体例中,dTAG靶向配体是PHIP靶向配体,包括 但不限于彼等描述于“APoised Fragment Library Enables Rapid Synthetic Expansion Yielding the FirstReported Inhibitors of PHIP(2),an Atypical Bromodomain”Krojer,T.;etal.Chem.Sci. 2016,7,2322–2330者。
在另一个具体例中,dTAG靶向配体是PDZ靶向配体,包括但 不限于彼等描述于“Discovery of Low-Molecular-Weight Ligands for the AF6 PDZ Domain”MangeshJoshi,et al.Angew.Chem.Int.Ed. 2006,45,3790-3795者。
在另一个具体例中,dTAG靶向配体是PARP15靶向配体,包 括但不限于彼等描述于“Structural Basis for Lack of ADP- ribosyltransferase Activity in Poly(ADP-ribose)Polymerase-13/Zinc Finger Antiviral Protein.”Karlberg,T.,et al.,(2015)J.Biol.Chem. 290:7336-7344者。
在另一个具体例中,dTAG靶向配体是PARP14靶向配体,包 括但不限于彼等描述于“Discovery of Ligands for ADP- Ribosyltransferases via Docking-Based VirtualScreening.“Andersson,C.D.,et al.,(2012)J.Med.Chem.55:7706- 7718.;“Family-widechemical profiling and structural analysis of PARP and tankyrase inhibitors.”Wahlberg,E.,et al.(2012) Nat.Biotechnol.30:283-288.;“Discovery of Ligands forADP- Ribosyltransferases via Docking-Based Virtual Screening. “Andersson,C.D.,et al.(2012)J.Med.Chem.55:7706-7718者。
在另一个具体例中,dTAG靶向配体是MTH1靶向配体,包括 但不限于彼等描述于“MTH1 inhibition eradicates cancer by preventing sanitation of the dNTP pool”Helge Gad,et.al.Nature, 2014,508,215-221者。
在另一个具体例中,dTAG靶向配体是mPGES-1靶向配体,包 括但不限于彼等描述于“Crystal Structures of mPGES-1 Inhibitor Complexes Form a Basis for theRational Design of Potent Analgesic and Anti-Inflammatory Therapeutics.”Luz,J.G.,et al.,(2015) J.Med.Chem.58:4727-4737者。
在另一个具体例中,dTAG靶向配体是FLAP-5-脂氧酶激活蛋 白靶向配体,包括但不限于彼等描述于“Crystal structure of inhibitor-bound human 5-lipoxygenase-activating protein.”Ferguson, A.D.,McKeever,B.M.,Xu,S.,Wisniewski,D.,Miller,D.K.,Yamin, T.T.,Spencer,R.H.,Chu,L.,Ujjainwalla,F.,Cunningham,B.R., Evans,J.F.,Becker,J.W.(2007)Science 317:510-512者。
在另一个具体例中,dTAG靶向配体是FA结合蛋白靶向配体, 包括但不限于彼等描述于“A Real-World Perspective on Molecular Design.”Kuhn,B.;etal.J.Med.Chem.2016,59,4087–4102者。
在另一个具体例中,dTAG靶向配体是BCL2靶向配体,包括 但不限于彼等描述于“ABT-199,a potent and selective BCL-2 inhibitor,achieves antitumor activitywhile sparing platelets.”Souers, A.J.,et al.(2013)NAT.MED.(N.Y.)19:202-208者。
在另一个具体例中,dTAG靶向配体是EGFR靶向配体。在一 个具体例中,dTAG靶向配体选自厄洛替尼(erlotinib)(Tarceva),吉 非替尼(gefitinib)(Iressa),阿法替尼(Afatinib)(Gilotrif),罗西替尼 (rociletinib)(CO-1686),奥西米替尼(osimertinib)(Tagrisso),奥莫替 尼(olmutinib)(Olita),纳曲替尼(naquotinib)(ASP8273),纳扎替尼(nazartinib)(EGF816),PF-06747775(Pfizer),依扣替尼 (icotinib)(BPI-2009),奈拉替尼(neratinib)(HKI-272;PB272);阿替 替尼(avitinib)(AC0010),EAI045,塔罗索替尼(tarloxotinib)(TH- 4000;PR-610),PF-06459988(Pfizer),替沙替尼 (tesevatinib)(XL647;EXEL-7647;KD-019),产司替尼(transtinib), WZ-3146,WZ8040,CNX-2006,和达克替尼(dacomitinib)(PF- 00299804;Pfizer)。可以在任何不干扰配体与EGFR结合的位置将连接子置于这些靶向配体上。连接子结合位置的非限制性实例在下表 T中提供。在一个具体例中,EGFR靶向配体结合EGFR的L858R 突变体。在另一个具体例中,EGFR靶向配体结合EGFR的T790M 突变体。在另一个具体例中,EGFR靶向配体结合EGFR的C797G 或C797S突变体。在一个具体例中,EGFR靶向配体选自厄洛替尼, 吉非替尼,阿法替尼,奈拉替尼和达克替尼,并结合EGFR的 L858R突变体。在另一个具体例中,EGFR靶向配体选自奥西米替尼, 罗西替尼,奥莫替尼,纳曲替尼,纳扎替尼,PF-06747775,依扣替 尼,奈拉替尼,阿替替尼,塔罗索替尼,PF-0645998,替沙替尼, 产司替尼,WZ-3146,WZ8040和CNX-2006。并结合EGFR的T790M突变体。在另一个具体例中,EGFR靶向配体是EAI045并且 结合EGFR的C797G或C797S突变体。
任何能与dTAG靶向配体基团结合并作用于泛素连接酶或被泛 素连接酶降解的蛋白质是本发明的靶蛋白质。通常,用作dTAG的 内源靶蛋白可包含例如结构蛋白,受体,酶,细胞表面蛋白,与细胞 整合功能相关的蛋白质,包括参与下述活性的蛋白质:催化活性,芳香酶活性,运动活性,解旋酶活性,代谢过程(合成代谢和分解代 谢),抗氧化活性,蛋白质水解,生物合成,具有激酶活性的蛋白质, 氧化还原酶活性,转移酶活性,水解酶活性,裂解酶活性,异构酶活 性,连接酶活性,酶调节剂活性,信号转导活性,结构分子活性,结 合活性(蛋白质,脂质碳水化合物),受体活性,细胞运动性,膜融合, 细胞通讯,生物过程调节,发育,细胞分化,对刺激的反应,行为蛋 白,细胞粘附蛋白,参与细胞的蛋白质死亡,参与运输的蛋白质(包 括蛋白质转运蛋白),核转运,离子转运蛋白活性,通道转运蛋白活 性,载体活性,通透酶活性,分泌活性,电子转运蛋白活性,发病机 制,分子伴侣调节活性,核酸结合活性,转录调节活性,细胞外组织 和生物发生活性,转译调节活性。
更具体地,许多用于人治疗的药物靶标表示dTAG靶标,蛋白 质靶标或dTAG靶向配体可以结合并并入根据本发明的化合物中。 这些包括可用于在多种多基因疾病中恢复功能的蛋白质,包括例如 B7.1和B7,TINFR1m,TNFR2,NADPH氧化酶,BclIBax和凋亡 途径中的其他配对,C5a受体,H MG-CoA还原酶,PDE V磷酸二 酯酶类型,PDE IV磷酸二酯酶4型,PDEI,PDEII,PDEIII,角鲨 烯环化酶抑制剂,CXCR1,CXCR2,一氧化氮(NO)合成酶,环加氧 酶1,环加氧酶2,5HT受体,多巴胺受体,G蛋白,即Gq,组胺受 体,5-脂氧合酶,类胰蛋白酶丝氨酸蛋白酶,胸苷酸合成酶,嘌呤核 苷磷酸化酶,GAPDH锥虫,糖原磷酸化酶,碳酸酐酶,趋化因子受 体,JAW STAT,RXR及类似物,HIV 1蛋白酶,HIV 1整合酶,流 感,神经氨酸酶,乙型肝炎逆转录酶,钠通道,多重耐药性(MDR), 蛋白质P-糖蛋白(和MRP),酪氨酸激酶,CD23,CD124,酪氨酸激 酶p56 lck,CD4,CD5,IL-2受体,IL-1受体,TNF-αR,ICAM1, Cat+通道,VCAM,VLA-4整合素,选择素,CD40/CD40L,新型 激酶和受体,肌苷一磷酸脱氢酶,p38 MAP激酶, RaslRaflMEWERK途径,白细胞介素-1转换酶,半胱天冬酶,HCV, NS3蛋白酶,HCV NS3RNA解旋酶,甘氨酰胺核糖核苷酸甲酰转移 酶,鼻病毒3C蛋白酶,单纯疱疹病毒-1(HSV-I),蛋白酶,鉅细胞 病毒(CMV)蛋白酶,聚(ADP-核糖)聚合酶,细胞周期蛋白依赖性激 酶,血管内皮生长因子,催产素受体,微粒体转运蛋白抑制剂,胆汁 酸转运抑制剂,5α还原酶抑制剂,血管紧张素11,甘氨酸受体,去 甲肾上腺素再摄取受体,内皮素受体,神经肽Y和受体,***受 体,雄激素受体,腺苷受体,腺苷激酶和AMP脱氨酶,嘌呤能受体 (P2Y1,P2Y2,P2Y4,P2Y6,P2X1-7),法呢基转移酶,香叶基香 叶基转移酶,NGF的TrkA受体,β-淀粉样蛋白,酪氨酸激酶Flk- IIKDR,玻连蛋白受体,整合素受体,Her-21neu,端粒酶抑制,细 胞溶质磷脂酶A2和EGF受体酪氨酸激酶。可用作dTAG的其他蛋 白质靶标包括例如蜕皮激素20-单加氧酶,GABA门控氯离子通道的 离子通道,乙酰胆碱酯酶,电压敏感性钠通道蛋白质,钙释放通道和 氯离子通道。用作dTAG的其他靶蛋白包括乙酰辅酶A羧化酶,腺 苷酸琥珀酸合成酶,原卟啉原氧化酶和烯醇丙酮酰莽草酸磷酸合酶。
在一个具体例中,通过筛选配体库来选择dTAG和dTAG靶向 配体对。这种筛选在Duong-Ly等人的“Kinase Inhibitor Reveals Unexpected Opportunities to InhibitDisease-Associated Mutant Kinases”;Cell Reports 14,772-781 2016年2月2日中举例说明。
卤代烷烃脱卤素酵素是根据本发明的特定化合物的另一个靶标, 其可以用作dTAG。本发明的含有氯代烷烃肽结合部分(C1-C12通 常约为C2-C10烷基卤素基团)的化合物可用于抑制和/或降解用于融 合蛋白或相关诊断蛋白的卤代烷脱卤素酶,如2011年12月6日提 交的PCT/US2012/063401,2012年6月14日公布为 WO2012/078559,其内容通过引用方式于此并入本文。
dTAG靶向配体的非限制性实例显示在下表T中,并且表示能 够靶向可用作dTAG的蛋白质或氨基酸序列的dTAG靶向配体。
表T:
A.BRD dTAG靶向配体:
如本文所用的BRD dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点;以及
R’:是甲基或乙基。
B.CREBBP dTAG靶向配体:
本文使用的CREBBP dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点;
A是N或CH;以及
m是0、1、2、3、4、5、6、7或8。
C.SMARCA4、PB1和/或SMARCA2 dTAG靶向配体:
本文使用的SMARCA4,PB1和/或SMARCA2 dTAG靶向配体,包 括但不限于:
以及
其中:
R是连接子连接的位点;以及
A是N或CH;以及
m是0、1、2、3、4、5、6、7或8。
D.TRIM24和/或BRPF1 dTAG靶向配体:
本文使用的TRIM24和/或BRPF1 dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点;以及
m是0、1、2、3、4、5、6、7或8。
E.糖皮质激素受体dTAG靶向配体:
本文使用的糖皮质激素dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
F.***和/或雄激素受体dTAG靶向配体:
本文使用的***和/或雄激素dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
G.DOT1L dTAG靶向配体:
本文使用的DOT1L dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点;
A是N或CH;以及
m是0、1、2、3、4,、5、6、7或8。
H.Ras dTAG靶向配体:
如本文所用的Ras dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
I.RasG12C dTAG靶向配体:
本文使用的RasG12C dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
J.Her3 dTAG靶向配体:
本文使用的Her3 dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点;
R’是
K.Bcl-2or Bcl-XL dTAG靶向配体:
本文使用的Bcl-2或Bcl-XL dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
L.HDAC dTAG靶向配体:
如本文所用的HDAC dTAG靶向配体,包括但不限于:
其中:
R是连接子连接的位点。
M.PPAR-γdTAG靶向配体:
本文使用的PPAR-γdTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
N.RXR dTAG靶向配体:
本文使用的RXR dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
O.DHFR dTAG靶向配体:
本文使用的DHFR dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
P.EGFR dTAG靶向配体:
本文使用的EGFR dTAG靶向配体,包括但不限于:
1.靶向L858R突变EGFR的靶向配体,包括厄洛替尼,吉非替尼, 阿法替尼,奈拉替尼和达克替尼。
其中:
R是连接子连接的位点。
2.靶向T790M突变体EGFR的配体靶向,包括奥西米替尼,罗西替 尼,奥莫替尼,纳曲替尼,纳扎替尼,PF-06747775,依扣替尼,奈 拉替尼,阿替替尼,塔罗索替尼,PF-0645998,替沙替尼,产司替 尼,WZ-3146,WZ8040和CNX-2006:
其中:
R是连接子连接的位点。
3.靶向C797S突变体EGFR的靶向配体,包括EAI045:
其中:
R是连接子连接的位点。
Q.BCR-ABL dTAG靶向配体:
本文使用的BCR-ABL dTAG靶向配体,包括但不限于:
1.靶向T315I突变体BCR-ABL(PDB#3CS9)的靶向配体,包括尼洛 替尼(Nilotinib)和达沙替尼(Dasatinib):
其中:
R是连接子连接的位点。
2.靶向BCR-ABL的靶向配体,包括尼洛替尼,达沙替尼,普纳替 尼(Ponatinib)和波舒替尼(Bosutinib):
其中:
R是连接子连接的位点。
R.ALK dTAG靶向配体:
本文使用的ALK dTAG靶向配体,包括但不限于:
1.靶向L1196M突变ALK(PDB#4MKC)的靶向配体,包括色瑞替 尼(Ceritinib):
其中:
R是连接子连接的位点。
S.JAK2 dTAG靶向配体:
本文使用的JAK2 dTAG靶向配体,包括但不限于:
1.靶向针对V617F突变体JAK2的配体,包括鲁索利替尼 (Ruxolitinib):
其中:
R是连接子连接的位点。
T.BRAF dTAG靶向配体:
本文使用的BRAF dTAG靶向配体,包括但不限于:
1.靶向V600E突变体BRAF(PBD#3OG7)的靶向配体,包括威罗菲 尼(Vemurafenib):
其中:
R是连接子连接的位点。
2.针对靶向BRAF的配体,包括达拉菲尼(Dabrafenib):
其中:
R是连接子连接的位点。
U.LRRK2 dTAG靶向配体 本文使用的LRRK2 dTAG靶向配体,包括但不限于:
1.靶向R1441C突变体LRRK2的靶向配体,包括:
其中:
R是连接子连接的位点。
2.靶向G2019S突变体LRRK2的配体靶向,包括:
其中::
R是连接子连接的位点。
3.靶向I2020T突变体LRRK2的靶向配体,包括:
其中:
R是连接子连接的位点。
V.PDGFRαdTAG靶向配体:
本文使用的PDGFRαdTAG靶向配体,包括但不限于:
1.靶向T674I突变PDGFRα的靶向配体,包括AG-1478, CHEMBL94431,Dovitinib,厄洛替尼,吉非替尼,伊马替尼 (imatinib),Janex 1,帕唑帕尼(Pazopanib),PD153035,索拉菲尼 (Sorafenib),舒尼替尼(Sunitinib),WHI-P180:
其中:
R是连接子连接的位点。
W.RET dTAG靶向配体:
本文使用的RET dTAG靶向配体,包括但不限于:
1.靶向G691S突变体RET的靶向配体,包括陶扎色替(tozasertib)
其中:
R是连接子连接的位点。
2.靶向R749T突变体RET的靶向配体,包括陶扎色替
其中:
R是连接子连接的位点。
3.靶向E762Q突变体RET的靶向配体,包括陶扎色替
其中:
R是连接子连接的位点。
4.靶向Y791F突变体RET的靶向配体,包括陶扎色替
其中:
R是连接子连接的位点。
5.靶向V804M突变体RET的靶向配体,包括陶扎色替
其中:
R是连接子连接的位点。
6.靶向M918T突变体RET的靶向配体,包括陶扎色替
其中:
R是连接子连接的位点。
X.热休克蛋白90(HSP90)dTAG靶向配体:
本文使用的热休克蛋白90(HSP90)dTAG靶向配体,包括但不限于:
1.在Vallee et al.,“Tricyclic Series of Heat Shock Protein 90(HSP90)Inhibitors Part I:Discovery of Tricyclic Imidazo[4,5-C] Pyridinesas PotentInhibitors of the HSP90 Molcular Chaperone (2011)J.Med.Chem.54:7206中鉴定的HSP90抑制剂,包含(N-[4- (3H-咪唑并[4,5-C]吡啶-2-基)-9H-芴-9-基]-琥珀酰胺):
,其中连接子基团L或-(L-降解决定区域)基团经由例如末端酰胺基 团连接而衍生化;
2.HSP90抑制剂p54(修饰的)(8-[(2,4-二甲基苯基)硫烷基]-3]戊-4-炔 -1-基-3H-嘌呤-6-胺):
其中连接子基团L或-(L-降解决定区域)基团经由例如末端乙炔基连 接而衍生化;
3.在Brough et al.,“4,5-Diarylisoxazole HSP90 Chaperone Inhibitors:Potential Therapeutic Agents for the treatment of Cancer,”J.Med. CHEM.Vol:51,page:196(2008)中鉴定的HSP90抑制剂(经修饰), 包括具有下示结构的化合物2GJ(5-[2,4-二羟基-5-(1-甲基乙基)苯基]- 正乙基-4-[4-(吗啉-4-基甲基)苯基]异恶唑-3-甲酰胺):
其中连接子基团L或-(L-降解决定区域)基团经由例如(在胺上或在胺 上的烷基上的)酰胺基团连接而衍生化;
4.在Wright et al.,“Structure-Activity Relationships in Purine-BasedInhibitor Binding to HSP90 Isoforms,”Chem Biol.2004 June;11(6): 775-85中鉴定的HSP90抑制剂(经修饰),包括具有下示结构的 HSP90抑制剂PU3:
其中连接子基团L或-(L-降解决定区域)经由例如丁基连接而衍生化; 和
5.HSP90抑制剂格尔德霉素(geldanamycin)((4E,6Z,8S,9S,10E, 12S,13R,14S,16R)-13-羟基-8,14,19-三甲氧基-4,10,12,16-四甲 基-3,20,22-三氧代-2-氮杂双环[16.3.1](衍生化)或其任何衍生物(如 17-烷基氨基-17-去甲氧基格尔德霉素(“17-AAG”)或17-(2-二甲基氨 基乙基)氨基-17)-去甲氧基格尔纳霉素(“17-DMAG”))(衍生化,其中连接子基团L或-(L-降解决定区域)基团经由例如酰胺基连接)。
Y.激酶和磷酸酶dTAG靶向配体:
本文使用的激酶和磷酸酶dTAG靶向配体,包括但不限于:
1.厄洛替尼衍生物酪氨酸激酶抑制剂:
其中R是经由例如醚基连接的连接子基团L或-(L-降解决定区域)基 团;
2.激酶抑制剂舒尼替尼(衍生化):
其中R是连接子基团L或-(L-降解决定区域)基团连接例如吡咯部分 而衍生化;
3.激酶抑制剂索拉非尼(衍生化):
其中R是连接子基团L或-(L-降解决定区域)基团连接例如酰胺部分 而衍生化;
4.激酶抑制剂达沙替尼(desatinib)(衍生化):
其中R是连接子基团L或-(L-降解决定区域)连接例如嘧啶而衍生化;
5.激酶抑制剂拉帕替尼(lapatinib)(衍生化):
其中连接子基团L或-(L-降解决定区域)基团经由例如磺酰基甲基的 末端甲基连接而衍生化;
6.激酶抑制剂U09-CX-5279(衍生化):
其中L或-(L-降解决定区域)基团经由例如胺(苯胺),羧酸或胺α与环 丙基或环丙基连接而衍生化;
7.在Millan et al.,Design and Synthesis of Inhaled P38 Inhibitors forthe treatment of Chronic Obstructive Pulmonary Disease,J.MED. CHEM.Vol:54,page:7797(2011)中鉴定的激酶抑制剂,包括具有 下示结构的激酶抑制剂Y1W和Y1X(衍生化):
YIX(1-乙基-3-(2-{[3-(1-甲基乙基)[1,2,4]***并[4,3-a]吡啶-6-基]硫 烷基}苄基)脲,其中连接子基团L或-(L-降解决定区域)基团经由例 如异丙基连接而衍生化;
1-(3-叔丁基-1-苯基-1H-吡唑-5-基)-3-(2-{[3-(1-甲基乙基)-[1,2,4]三 唑并[4,3-a]吡啶-6-基]硫烷基}苄基)脲,其中连接子基团L或-(L-降 解决定区域)基团例如优选经由异丙基或叔丁基连接而衍生化;
8.在Schenkel et al.,Discovery of Potent and Highly SelectiveThienopyridine Janus Kinase 2Inhibitors J.Med.Chem.,2011, 54(24),pp 8440-8450中鉴定的激酶抑制剂,包括具有下示结构的化 合物6TP和0TP(衍生化):
4-氨基-2-[4-(叔丁基氨磺酰基)苯基]-N-甲基噻吩并[3,2-c]吡啶-7-甲 酰胺噻吩并吡啶19,其中连接子基团L或-(L-降解决定区域)基团经 由例如与酰胺部分结合的末端甲基连接而衍生化:
4-氨基-N-甲基-2-[4-(吗啉-4-基)苯基]噻吩并[3,2-c]吡啶-7-甲酰胺噻 吩并吡啶8,其中连接子基团L或-(L-降解决定区域)基团经由例如与 酰胺部分结合的末端甲基连接而衍生化;
9.在Van Eis et al.“2,6-Naphthyridines as potent and selectiveihibitors of the novel protein kinase C isozymes,”Biorg.Med.Chem. Lett.2011Dec.15;21(24):7367-72中鉴定的激酶抑制剂,包括具有 下示结构的激酶抑制剂07U:
2-甲基N~1~-[3-(吡啶-4-基)-2,6-萘啶-1-基]丙烷-1,2-二胺,其中连接 子基团L或-(L-降解决定区域)基团例如经由仲胺或末端氨基连接而 衍生化;
10.Lountos et al.,“Structural Characterization of Inhibitor Complexeswith Checkpoint Kinase 2(Chk2),Drug Target for Cancer Therapy,”J.STRUCT.BIOL.Vol:176,pag:292(2011)中鉴定的激 酶抑制剂,包括具有下示结构的激酶抑制剂YCF:
,其中连接子基团L或-(L-降解决定区域)基团经由例如末端羟基中 的任一个连接而衍生化;
11.Lountos et al.,“Structural Characterization of Inhibitor Complexeswith Checkpoint Kinase 2(Chk2),a Drug Target for Cancer Therapy,”J.STRUCT.BIOL.Vol:176,pag:292(2011)中鉴 定的激酶抑制剂,包括具有下示结构的激酶抑制剂XK9和NXP(衍 生化):
N-{4-[(1E)-N-(N-羟基甲脒基)乙烷肼基]苯基}-7-硝基-1H-吲哚-2-甲 酰胺
N-{4-[(1E)-N-脒基乙基重氮基]苯基}-1H-吲哚-3-甲酰胺,其中连接 子基团L或-(L-降解决定区域)基团例如经由末端羟基(XK9)或腙基 (NXP)连接而衍生化;
12.激酶抑制剂阿法替尼(衍生化)(N-[4-[(3-氯-4-氟苯基)氨基]-7- [[(3S)-四氢-3-呋喃基]氧基]-6-喹唑啉基]-4(二甲基氨基)-2-丁烯酰 胺)(其中连接子基团L或-(L-降解决定区域)基团例如经由脂族胺基连 接而衍生化);
13.激酶抑制剂福坦替尼(fostamatinib)(衍生化)([6-({5-氟-2-[(3,4,5- 三甲氧基苯基)氨基]嘧啶-4-基}氨基)-2,2-二甲基-3-氧代-2,3-二氢- 4H-吡啶并[3,2-b]-1,4-恶嗪-4-基]甲基磷酸二钠六水合物)(其中连接 子基团L或-(L-降解决定区域)基团例如经由甲氧基连接而衍生化);
14.激酶抑制剂吉非替尼(衍生化)(N-(3-氯-4-氟-苯基)-7-甲氧基-6-(3- 吗啉-4-基丙氧基)喹唑啉-4-胺):
,其中连接子基团L或-(L-降解决定区域)基团经由例如甲氧基或醚 基连接而衍生化;
15.激酶抑制剂仑伐替尼(lenvatinib)(衍生化)(4-[3-氯-4-(环丙基氨基 甲酰基氨基)苯氧基]-7-甲氧基-喹啉-6-甲酰胺)(其中连接子基团L或 -(L-降解决定区域))例如经由环丙基连接而衍生化);
16.激酶抑制剂凡德他尼(vandetanib)(衍生的)(N-(4-溴-2-氟苯基)-6- 甲氧基-7-[(1-甲基哌啶-4-基)甲氧基]喹唑啉-4-胺)(其中连接子基团L 或-(L-降解决定区域)基团例如经由甲氧基或羟基连接而衍生化);
17.激酶抑制剂威罗菲尼(衍生化)(丙烷-1-磺酸{3-[5-(4-氯苯基)-1H- 吡咯并[2,3-b]吡啶-3-羰基]-2,4-二氟-苯基}-酰胺),其中连接子基团 L或-(L-降解决定区域)基团例如经由磺酰基连接而衍生化;
18.激酶抑制剂Gleevec(衍生化)
,其中R作为连接子基团L或-(L-降解决定区域)基团例如经由酰胺 基或经由苯胺基团连接而衍生化;
19.激酶抑制剂帕唑帕尼(衍生化)(VEGFR3抑制剂):
,其中R是连接子基团L或-(L-降解决定区域)基团例如连接到苯基 部分或经由苯胺基团而衍生化;
20.激酶抑制剂AT-9283(衍生化的)Aurora激酶抑制剂
其中R是例如连接到苯基部分的连接子基团L或-(L-降解决定区域) 基团);
21.激酶抑制剂TAE684(衍生的)ALK抑制剂
其中R是例如连接到苯基部分的连接子基团L或-(L-降解决定区域) 基团);
22.激酶抑制剂尼罗他尼(nilotanib)(衍生的)Abl抑制剂:
,其中R是连接子基团L或-(L-降解决定区域)基团例如连接苯基部 分或苯胺基团而衍生化;
23.激酶抑制剂NVP-BSK805(衍生的)JAK2抑制剂
,其中R是连接子基团L或-(L-降解决定区域)基团例如连接苯基部 分或二唑基而衍生化;
24.激酶抑制剂克唑替尼衍生的Alk抑制剂
,其中R是连接子基团L或-(L-降解决定区域)基团例如连接苯基部 分或二唑基衍生化;
25.激酶抑制剂JNJ FMS(衍生化)抑制剂
衍生化,其中R是-(L-降解决定区域)例如连接到苯基部分的连接子 基团L或-(L-降解决定区域)基团;
26.激酶抑制剂福瑞替尼(foretinib)(衍生化)Met抑制剂
衍生化,其中R是-(L-降解决定区域)例如连接苯基部分或喹啉部分 上的羟基或醚基团的连接子基团L或-(L-降解决定区域)基团;
27.变构蛋白酪氨酸磷酸酶抑制剂PTP1B(衍生化):
,其中连接子基团L或-(L-降解决定区域)基团连接例如所示R处而 衍生化;
28.SHP-2酪氨酸磷酸酶结构域的抑制剂(衍生化):
,其中例如在R处连接连接子基团L或-(L-降解决定区域)基团而衍 生化;
29.BRAF(BRAFV600E)/MEK的抑制剂(衍生化的):
其中,例如在R处连接连接子基团L或-(L-降解决定区域)基团而衍 生化;
30.酪氨酸激酶ABL的抑制剂(衍生化的)
其中,例如在R处连接连接子基团L或-(L-降解决定区域)基团而衍 生化;
31.激酶抑制剂OSI-027(衍生的)mTORC1/2抑制剂
其中,例如在R处连接连接子基团L或-(L-降解决定区域)基团而衍 生化;
32.激酶抑制剂OSI-930(衍生化的)c-Kit/KDR抑制剂
其中,例如在R处连接连接子基团L或-(L-降解决定区域)基团而衍 生化;和
33.激酶抑制剂OSI-906(衍生的)IGF1R/IR抑制剂
其中,例如在R处连接连接子基团L或-(L-降解决定区域)基团而衍 生化。
其中,在I至XVII章中描述的任何具体例中,“R”表示连接哌嗪部 分上的连接子基团L或-(L-降解决定区域)基团的位点。
Z.HDM2和/或MDM2 dTAG靶向配体:
本文使用的HDM2和/或MDM2 dTAG靶向配体,包括但不限 于:
1.Vassilev,et al.,In vivo activation of the p53 pathway by small-molecule antagonists of MDM2,SCIENCE vol:303,pag:844-848 (2004),andSchneekloth,et al.,Targeted intracellular protein degradation induced by asmall molecule:En route to chemical proteomics,Bioorg.Med.Chem.Lett.18(2008)5904-5908中鉴定的 HDM2/MDM2抑制剂,包含(或另外)如下所述的化合物nutlin-3,nutlin-2和nutlin-1(衍生化),以及其所有衍生物和类似物:
(其中,在连接子基团L或-(L-降解决定区域)基团连接例如甲氧基或 羟基而衍生化);
(其中,在连接子基团L或-(L-降解决定区域)基团连接例如在甲氧基 或羟基衍生化);
(其中,在连接子基团L或-(L-降解决定区域)基团例如经由甲氧基或 作为羟基连接而衍生化);和
2.反式-4-碘-4'-硼烷基-查耳酮
(衍生化,其中连接子基团L或连接子基团L或-(L-降解决定区域)基 团例如通过羟基连接。
AA.人类含BET溴结构域的蛋白质dTAG靶向配体:
在某些具体例中,“dTAG靶向配体”可以是与溴-和额外终端域 (BET)蛋白BRD2,BRD3和BRD4结合的配体。靶向人类含BET溴 结构域的蛋白质的化合物包括但不限于与如下所述靶标相关的化合物, 其中“R”或“连接子”表示连接子基团L或-(L-降解决定区域)基团连接 的位点,例如:
1.JQ1,Filippakopoulos et al.Selective inhibition of BETbromodomains.Nature(2010):
2.I-BET,Nicodeme et al.Suppression of Inflammation by a SyntheticHistone Mimic.Nature(2010).Chung et al.Discovery and Characterization ofSmall Molecule Inhibitors of the BET Family Bromodomains.J.Med Chem.(2011):
3.描述于Hewings et al.3,5-Dimethylisoxazoles Act as Acetyl-lysineBromodomain Ligands.J.Med.Chem.(2011)54 6761-6770的化合 物。
4.I-BET151,Dawson et al.Inhibition of BET Recruitment to Chromatin asan Effective Treatment for MLL-fusion Leukemia. Nature(2011):
5.咔唑型(US 2015/0256700)
6.吡咯并吡啶类型(US 2015/0148342)
7.四氢喹啉类型(WO 2015/074064)
8.***吡嗪类型(WO 2015/067770)
9.吡啶酮类(WO 2015/022332)
10.喹唑啉酮类(WO 2015/015318)
11.二氢吡啶嗪酮类(WO 2015/011084)
(其中,在每种情况下,R或L或连接子指定用以例如连接连接子基 团L或-(L-降解决定区域)基团的连接位点)。
BB.HDAC dTAG靶向配体:
如本文所用的HDAC dTAG靶向配体包括但不限于:
1.Finnin,M.S.et al.Structures of Histone Deacetylase Homologue Boundto the TSA and SAHA Inhibitors.Nature 40,188-193(1999)。
(其中,“R”表示连接位点以例如连接连接子基团L或-(L-降解决定区 域)基团而衍生化);和
2.由PCT WO0222577的式(I)定义的化合物(“脱酰酶抑制剂”)(其中, 连接子基团L或-(L-降解决定区域)基团例如经由羟基连接而衍生化);
CC.人类赖氨酸甲基转移酶dTAG靶向配体:
本文使用的人类赖氨酸甲基转移酶dTAG靶向配体包括但不限 于:
1.Chang et al.Structural Basis for G9a-Like protein LysineMethyltransferase Inhibition by BIX-1294.Nat.Struct.Biol.(2009) 16(3)312。
(其中,“R”指定用于连接例如连接子基团L或-(L-降解决定区域)基 团的位点而衍生化);
2.Liu,F.et al Discovery of a 2,4-Diamino-7- aminoalkoxyquinazoline asa Potent and Selective Inhibitor of Histone Methyltransferase G9a.J.Med.Chem.(2009)52(24)7950。
(其中,“R”指定用于连接例如连接子基团L或-(L-降解决定区域)基 团的潜在位点而衍生化);
3.阿扎胞苷(衍生化)(4-氨基-1-(3-D-呋喃核糖基-1,3,5-三嗪-2(1H)- 酮)(其中连接子基团L或-(L-降解决定区域)例如经由羟基或氨基连接 基团而衍生化);和
4.地西他滨(衍生化)(4-氨基-1-(2-脱氧-b-D-赤型-戊呋喃糖基)-1,3,5- 三嗪-2(1H)-酮)(其中连接子基团L或-(L-降解决定区域)基团例如经 由羟基或氨基连接而衍生化)。
DD.通过功能组织的dTAG靶向配体
血管生成抑制剂:
血管生成抑制剂,包括但不限于:
1.Sakamoto,et al.,Development of Protacs to target cancer- promotingproteins for ubiquitination and degradation,Mol Cell Proteomics 2003December;2(12):1350-8中描述的GA-1(衍生化)及 其衍生物和类似物,其具有如结构和与接合物的结合;
2.Rodriguez-Gonzalez,et al.,Targeting steroid hormone receptors forubiquitination and degradation in breast and prostate cancer, Oncogene(2008)27,7201-7211中描述的***(衍生化),其可以与 连接子基团L或-(L-降解决定区域)基团结合;
3.Sakamoto,et al.,Development of Protacs to target cancer- promotingproteins for ubiquitination and degradation,Mol Cell Proteomics 2003December;2(12):1350-中描述的***、睾酮(衍生 化的)和相关衍生物,包括但不限于DHT及其衍生物和类似物;和
4.Sakamoto,et al.,Protacs:chimeric molecules that target proteins tothe Skp1-Cullin-F box complex for ubiquitination and degradation Proc NatlAcad Sci USA.2001 Jul.17;98(15):8554-9和美国专利第 7,208,157号中描述的卵巢素、烟曲霉素(fumagillin)(衍生化)及其衍 生物和类似物,其具有结构和与连接子基团L或-(L-降解决定区域) 基团的结合。
免疫抑制化合物:
免疫抑制化合物,包括但不限于:
1.Schneekloth,et al.,Chemical Genetic Control of Protein Levels:Selective in Vivo Targeted Degradation,J.AM.CHEM.SOC.2004, 126,3748-3754中描述的AP21998(衍生化),其具有结构和与连接子 基团L或-(L-降解决定区域)基团的结合,如Schneekloth等人,化学 遗传控制蛋白质水平:选择性体内通常所述。有针对性的退化,J。 AM。CHEM。SOC。2004,126,3748-3754;
2.糖皮质激素(例如,氢化可的松(hydrocortisone),强的松 (prednisone),***龙(prednisolone)和甲基***龙 (methylprednisolone))(其中连接子基团L或-(L-降解决定区域)基团 结合例如任何羟基而衍生化)和倍氯米松(二丙酸倍氯米松)(衍生自链 接基团)基团或-(L-降解决定区域)与例如丙酸酯结合;
3.甲氨蝶呤(其中连接子基团或-(L-降解决定区域)基团可以结合例如 末端羟基中的任一个而衍生化);
4.环孢菌素(衍生化,其中连接子基团或-(L-降解决定区域)基团可结 合例如丁基的任一个而衍生化);
5.他克莫司(tacrolimus)(FK-506)和雷帕霉素(衍生化,其中连接子基 团L或-(L-降解决定区域)基团可结合例如在甲氧基的任一个);和
6.放线菌素(actinomycin)(衍生化,其中连接子基团L或-(L-降解决定 区域)基团可结合例如异丙基的任一个)。
EE.芳基烃受体(AHR)dTAG靶向配体:
本文使用的AHR dTAG靶向配体,包括但不限于:
1.Lee,et al.,Targeted Degradation of the Aryl Hydrocarbon Receptor bythe PROTAC Approach:A Useful Chemical Genetic Tool,Chem Bio Chem Volume 8,Issue 17,pages 2058-2062,Nov.23, 2007)中一般说明的芹菜素(以与连接子基团L或-(L-降解决定区域) 基团结合的方式衍生化;和
2.Boitano,et al.,Aryl Hydrocarbon Receptor Antagonists Promote theExpansion of Human Hematopoietic Stem Cells,Science 10 Sep. 2010:Vol.329no.5997 pp.1345-1348中描述的SR1和LGC006(使 得连接子基团L或-(L-降解决定区域)结合而衍生化)。
FF.RAF dTAG靶向配体:
本文使用的RAF dTAG靶向配体,包括但不限于:
(其中,例如,“R”指定连接子基团L或-(L-降解决定区域)基团连接 的位点而衍生化)。
GG.FKBP dTAG靶向配体:
本文使用的FKBP dTAG靶向配体,包括但不限于:
(其中,“R”指定连接子基团L或-(L-降解决定区域)基团连接的位点 而衍生化)。
HH.雄激素受体(AR)dTAG靶向配体:
本文使用的AR dTAG靶向配体,包括但不限于:
1.RU59063雄激素受体的配体(衍生化)
2.
(其中,“R”指定连接子基团L或-(L-降解决定区域)基团连接的位点 而衍生化)。
2.雄激素受体的SARM配体(衍生化)
(衍生化,其中“R”表示连接子基团L或-(L-降解决定区域)基团连接 的位点)。
3.雄激素受体配体DHT(衍生化)
(其中,“R”指定连接子基团L或-(L-降解决定区域)基团连接的位点 而衍生化)。
4.MDV3100配体(衍生化)
5.ARN-509配体(衍生化)
6.六氢苯并异恶唑
7.四甲基环丁烷
II.***受体(ER)dTAG靶向配体:
如本文所用的ER dTAG靶向配体,包括但不限于:
1.***受体配体
2.
(其中,“R”指定连接子基团L或-(L-降解决定区域)基团连接的位点 而衍生化)。
JJ.甲状腺激素受体(TR)dTAG靶向配体:
本文使用的TR dTAG靶向配体,包括但不限于:
1.甲状腺激素受体配体(衍生化)
2.
(其中,“R”指定连接子基团L或-(L-降解决定区域)基团连接的位点, MOMO表示甲氧基甲氧基而衍生化)。
KK.HIV蛋白酶dTAG靶向配体:
本文使用的HIV蛋白酶dTAG靶向配体,包括但不限于:
1.HIV蛋白酶抑制剂(衍生化)
2.
(其中,“R”指定连接子基团L或-(L-降解决定区域)基团连接的位点 而衍生化)。参见J.Med.Chem.2010,53,521-538。
2.HIV蛋白酶抑制剂
(其中,“R”指定连接子基团L或-(L-降解决定区域)基团连接的潜在 位点而衍生化)。参见J.Med.Chem.2010,53,521-538。
LL.HIV整合酶dTAG靶向配体:
本文使用的HIV整合酶dTAG靶向配体,包括但不限于:
1.HIV整合酶抑制剂(衍生化)
(其中,“R”指定连接子基团L或-(L-降解决定区域)基团连接的位点 而衍生化)。参见J.Med.Chem.2010,53,6466。
2.HIV整合酶抑制剂(衍生化)
3.HIV整合酶抑制剂(衍生化)
(其中,“R”指定连接子基团L或-(L-降解决定区域)基团连接的位点 而衍生化)。参见J.Med.Chem.2010,53,6466。
MM.HCV蛋白酶dTAG靶向配体:
本文使用的HCV蛋白酶dTAG靶向配体,包括但不限于:
1.HCV蛋白酶抑制剂(衍生化)
(其中,“R”指定连接子基团L或-(L-降解决定区域)基团连接的位点 而衍生化)。
NN.酰基-蛋白硫酯酶-1和-2(APT1和APT2)dTAG靶向配体: 本文使用的酰基-蛋白质硫酯酶-1和-2(APT1和APT2)dTAG靶向配 体,包括但不限于:
1.APT1和APT2的抑制剂(衍生化)
(其中“R”指定连接子基团L或-(L-降解决定区域)基团连接的位点而 衍生化)。参见,Angew.Chem.Int.Ed.2011,50,9838-9842,其中 L是如本文另外描述的连接基团,并且该降解决定区域基团如本文中 另外描述的,使得连接子将降解决定区域基团结合dTAG靶向配体 基团,如本文中另外描述的。
OO.BCL2 dTAG靶向配体:
本文使用的BCL2 dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
PP.BCL-XL dTAG靶向配体:
本文使用的BCL-XL dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
QQ.FA结合蛋白dTAG靶向配体:
本文使用的FA dTAG靶向配体,包括但不限于:以及
其中:
R是连接子连接的位点。
RR.FLAP-5-脂氧合酶激活蛋白dTAG靶向配体:
如本文所用的FLAP-5-脂氧合酶活化蛋白dTAG靶向配体,包括但 不限于:
其中:
R是连接子连接的位点。
SS.HDAC6 Zn指结构域dTAG靶向配体:
本文使用的HDAC6 Zn指结构域dTAG靶向配体,包括但不限于:
其中:
R是连接子连接的位点。
TT.三环结构域V 4BVV dTAG靶向配体:
本文使用的三环结构域V 4BVV dTAG靶向配体,包括但不限于:
其中:
R是连接子连接的位点。
UU.乳酰谷胱甘肽裂解酶dTAG靶向配体:
如本文所用的乳酰谷胱甘肽裂解酶dTAG靶向配体,包括但不限于:
其中:
R是连接子连接的位点。
VV.mPGES-1 dTAG靶向配体:
本文使用的mPGES-1 dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
WW.MTH1 dTAG靶向配体:
本文使用的MTH1 dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
XX.PARP14 dTAG靶向配体:
本文使用的PARP14 dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
YY.PARP15 dTAG靶向配体:
本文使用的PARP15 dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
ZZ.PDZ域dTAG靶向配体:
本文使用的PDZ结构域dTAG靶向配体,包括但不限于:
以及
其中:
R和R’是连接子连接的位点。
AAA.PHIP dTAG靶向配体:
本文使用的PHIP dTAG靶向配体,包括但不限于:
其中:
R是连接子连接的位点。
BBB.磷脂酶A2结构域dTAG靶向配体:
本文使用的磷脂酶A2结构域dTAG靶向配体,包括但不限于:以及
其中:
R是连接子连接的位点。
CCC.蛋白质S100-A7 2WOS dTAG靶向配体:
本文使用的蛋白质S100-A7 2WOS dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
DDD.鞘脂激活蛋白-B dTAG靶向配体:
本文使用的鞘脂激活蛋白-B dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
EEE.Sec7 dTAG靶向配体:
本文使用的Sec7 dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
FFF.pp60 Src dTAG靶向配体的SH2结构域:
本文使用的pp60 Src dTAG靶向配体的SH2结构域,包括但不限于:
以及
其中:
R是连接子连接的位点。
GGG.Tank1 dTAG瞄准配体:
本文使用的Tank1 dTAG靶向配体,包括但不限于:
以及
其中:
R是连接子连接的位点。
HHH.Ubc9 SUMO E2连接酶SF6D dTAG靶向配体:
本文使用的Ubc9 SUMO E2连接酶SF6D dTAG靶向配体,包括但 不限于:
以及
其中:
R是连接子连接的位点。
III.Src(c-Src)dTAG靶向配体:
本文使用的Src dTAG靶向配体,包括但不限于:
1.Src靶向配体,包括AP23464:
其中:
R是连接子连接的位点。
2.Src-AS1和/或Src AS2靶向配体包括:
3.
其中:
R是连接子连接的位点。
JJJ.JAK3 dTAG靶向配体:
本文使用的JAK3 dTAG靶向配体,包括但不限于:
1.针对以JAK3为目标的配体,包括托法替尼(Tofacitinib):
其中:
R是连接子连接的位点。
KKK.Abl dTAG针对配体:
本文使用的Abl dTAG靶向配体,包括但不限于:
1.针对以Abl为目标的配体,包括托法替尼和普纳替尼:
2
其中:
R是连接子连接的位点。
LLL.MEK1 dTAG靶向配体:
本文使用的MEK1 dTAG靶向配体,包括但不限于:
1.针对以MEK1为目标的配体,包括PD318088,曲美替尼 (Trametinib)和G-573:
其中:
R是连接子连接的位点。
MMM.KIT dTAG靶向配体:
本文使用的KIT dTAG dTAG靶向配体,包括但不限于:
1.针对以KIT为目标的配体,包括瑞格非尼(Regorafenib):
2.
其中:
R是连接子连接的位点。
NNN.HIV逆转录酶dTAG靶向配体:
本文使用的HIV逆转录酶dTAG靶向配体,包括但不限于:
1.靶向HIV逆转录酶的靶向配体,包括依法韦仑,替诺福韦,恩曲 他滨(Emtricitabine),利托那韦,拉替拉韦(Raltegravir)和瑞塔滋 (Atazanavir):
其中:
R是连接子连接的位点。
OOO.HIV蛋白酶Dtag靶向配体:
本文使用的HIV蛋白酶dTAG靶向配体,包括但不限于:
1.HIV蛋白酶的靶向配体,包括利托那韦,拉替拉韦和瑞塔滋:
其中:
R是连接子连接的位点。
在一个具体例中,表T的任何上述dTAG靶向配体用于靶向本 文所述任何dTAG。
许多dTag靶向配体能够结合多于一种dTAG,例如,阿法替尼 结合EGFR,ErbB2和ErbB4蛋白。这允许许多蛋白质的双重攻击, 如表Z中所示。在一个具体例中,dTAG靶向配体选自表Z中的 “dTAG靶向配体”柱,dTAG选自相应的“dTAG”行。
表Z.dTAG靶向配体和相应的dTAG
在某些具体例中,本申请包括含有表1中所示的dTAG靶向配 体的化合物。
表1.dTAG靶向配体1-6
在某些具体例中,dTAG靶向配体是式TL-I的化合物:
或其药学上可接受的盐,其中:
A1是S或C=C;
A2是NRa5或O;
nn1为0、1或2;
每个Ra1独立地为C1-C3烷基,(CH2)0-3-CN,(CH2)0-3-卤素, (CH2)0-3-OH,(CH2)0-3-C1-C3烷氧基,C(O)NRa5L,OL,NRa5L或 L;
Ra2为H,C1-C6烷基,(CH2)0-3-杂环基,(CH2)0-3-苯基或L, 其中该杂环基包含一个饱和的5-或6-元环和1至2个选自N,O和S 的杂原子,并且任选地经C1-C3烷基,L或C(O)L取代,并且其中苯 基任选地经C1-C3烷基,CN,卤素,OH,C1-C3或L烷氧基取代;
nn2为0、1、2或3;
每个Ra3独立地为C1-C3烷基,(CH2)0-3-CN,(CH2)0-3-卤素,L 或C(O)NRa5L;
Ra4是C1-C3烷基;
Ra5是H或C1-C3烷基;和
L是一个连接子,
条件是式TL-I的化合物仅经一个L取代。
在某些实施例中,
在某些实施例中,
在某些具体例中,A1是S。
在某些具体例中,A1是C=C。
在某些具体例中,A2是NRa5。在进一步的具体例中,Ra5是H。 在其他具体例中,Ra5是C1-C3烷基(例如甲基,乙基,丙基或异丙 基)。在进一步的具体例中,Ra5是甲基。
在某些具体例中,A2是O。
在某些具体例中,nn1为0。
在某些具体例中,nn1是1。
在某些具体例中,nn1是2。
在某些具体例中,至少一个Ra1是C1-C3烷基(例如甲基,乙基, 丙基或异丙基)。在进一步的具体例中,至少一个Ra1是甲基。在进 一步的具体例中,两个Ra1是甲基。
在某些具体例中,至少一个Ra1是CN,(CH2)-CN,(CH2)2-CN 或(CH2)3-CN。在进一步的具体例中,至少一个Ra1是(CH2)-CN。
在某些具体例中,至少一个Ra1是卤素(例如F,Cl或Br), (CH2)-卤素,(CH2)2-卤素或(CH2)3-卤素。在进一步的具体例中,至 少一个Ra1是Cl,(CH2)-Cl,(CH2)2-Cl或(CH2)3-Cl。
在某些具体例中,至少一个Ra1是OH,(CH2)-OH,(CH2)2- OH或(CH2)3-OH。
在某些具体例中,至少一个Ra1是C1-C3烷氧基(例如,甲氧基, 乙氧基或丙氧基),(CH2)-C1-C3烷氧基,(CH2)2-C1-C3烷氧基或 (CH2)3-C1-C3烷氧基。在某些具体例中,至少一个Ra1是甲氧基。
在某些具体例中,一个Ra1是C(O)NRa5L。在进一步的具体例 中,Ra5是H。在其他具体例中,Ra5是C1-C3烷基(例如甲基,乙基, 丙基或异丙基)。
在某些具体例中,一个Ra1是OL。
在某些具体例中,一个Ra1是NRa5L。在进一步的具体例中, Ra5是H。在其他具体例中,Ra5是C1-C3烷基(例如甲基,乙基,丙 基或异丙基)。在其他具体例中,Ra5是甲基。
在某些具体例中,一个Ra1是L。
在某些具体例中,Ra2是H。
在某些具体例中,Ra2是直链C1-C6或支链C3-C6烷基(例如甲基, 乙基,丙基,异丙基,丁基,异丁基,叔丁基,戊基或己基)。在进 一步的具体例中,Ra2是甲基,乙基或叔丁基。
在某些具体例中,Ra2是杂环基,(CH2)-杂环基,(CH2)2-杂环 基或(CH2)3-杂环基。在进一步的具体例中,Ra2是(CH2)3-杂环基。 在进一步的具体例中,杂环基是选自吡咯烷基,吡唑烷基,咪唑烷基, 恶唑烷基,异恶唑烷基,噻唑烷基,异噻唑烷基,哌啶基,哌嗪基,六氢嘧啶基,吗啉基和硫代吗啉基。在进一步的具体例中,杂环基是 哌嗪基。
在某些具体例中,杂环基经C1-C3烷基(例如甲基,乙基,丙基 或异丙基)取代。
在某些具体例中,杂环基经C(O)L取代。
在某些具体例中,杂环基经L取代。
在某些具体例中,Ra2是苯基,(CH2)-苯基,(CH2)2-苯基或 (CH2)3-苯基。在进一步的具体例中,Ra2是苯基。
在某些具体例中,苯基经C1-C3烷基(例如甲基,乙基,丙基或 异丙基)取代。在某些具体例中,苯基经CN取代。在某些具体例中, 苯基经卤素(例如F,Cl或Br)取代。在某些具体例中,苯基经OH取 代。在某些具体例中,苯基经C1-C3烷氧基(例如甲氧基,乙氧基或 丙氧基)取代。
在某些具体例中,苯基经L取代。
在某些具体例中,Ra2是L。
在某些具体例中,nn2为0。
在某些具体例中,nn2是1。
在某些具体例中,nn2是2。在某些实施例中,nn2是3。
在某些具体例中,至少一个Ra3是C1-C3烷基(例如甲基,乙基, 丙基或异丙基)。在进一步的具体例中,至少一个Ra 3是甲基。
在某些具体例中,至少一个Ra3是CN,(CH2)-CN,(CH2)2-CN 或(CH2)3-CN。在进一步的具体例中,至少一个Ra3是CN。
在某些具体例中,至少一个Ra3是卤素(例如F,Cl或Br), (CH2)-卤素,(CH2)2-卤素或(CH2)3-卤素。在进一步的具体例中,至 少一个Ra3是Cl,(CH2)-Cl,(CH2)2-Cl或(CH2)3-Cl。在进一步的具 体例中,至少一个Ra3是Cl。
在某些具体例中,一个Ra3是L。
在某些具体例中,一个Ra3是C(O)NRa5L。在进一步的具体例 中,Ra5是H。在其他具体例中,Ra5是C1-C3烷基(例如甲基,乙基, 丙基或异丙基)。
在某些具体例中,Ra4是C1-C3烷基(例如甲基,乙基,丙基或 异丙基)。在进一步的具体例中,Ra4是甲基。
在某些具体例中,Ra5是H。
在某些具体例中,Ra5是C1-C3烷基(例如甲基,乙基,丙基或 异丙基)。在进一步的具体例中,Ra5是甲基。
在某些具体例中,和A1是S。
在某些具体例中,和A1是C=C。
在某些实施例中,和A1是C=C。
在某些具体例中,A2是NH,并且Ra2是(CH2)0-3-杂环基。在 进一步的具体例中,Ra2是(CH2)3-杂环基。在进一步的具体例中, 杂环基是哌嗪基。在进一步的具体例中,杂环基被C1-C3烷基,L或 C(O)L取代。
在某些具体例中,A2是NH,并且Ra2是(CH2)0-3-苯基。在进 一步的具体例中,Ra2是苯基。在进一步的具体例中,苯基被OH或 L取代。
在某些具体例中,A2是NH,Ra2是L。
在某些具体例中,A2是NH,并且Ra2是H或C1-C6烷基。在 进一步的具体例中,Ra2是C1-C4烷基。
在某些具体例中,A2是O,并且Ra2是H或C1-C6烷基。在进 一步的具体例中,Ra2是C1-C4烷基。
在某些具体例中,dTAG靶向配体是式TL-I1的化合物:
或其药学上可接受的盐,其中A2,Ra1,Ra2,Ra3,Ra4,Ra5,nn1 和nn2每一个如上式TL-1中所定义。
A2,Ra1,Ra2,Ra3,Ra4,Ra5,nn1和nn2中的每一个可以选 自上述式TL-1中所述的部分。A2,Ra1,Ra2,Ra3,Ra4,Ra5,nn1和nn2的一个定义的每个部分可以与A2,Ra1,Ra2,Ra3,Ra4,Ra5, nn1和nn25中的其他部分者定义的任何部分合并,如上式TL-1中所 述。
在某些具体例中,dTAG靶向配体是式TL-I1a至TL-I1d的化合物:
或其药学上可接受的盐,其中:
每个Ra6独立地为C1-C3烷基,(CH2)0-3-CN,(CH2)0-3-卤素, (CH2)0-3-OH或(CH2)0-3-C1-C3烷氧基;
Ra7是(CH2)0-3-杂环基,(CH2)0-3-苯基或L,其中杂环基包含 一个饱和的5-或6-元环和1至2个选自N,O和S的杂原子,并且 经L或C(O)L取代,并且其中该苯基经L取代;
Ra8为H,C1-C6烷基,(CH2)0-3-杂环基或(CH2)0-3-苯基,其中 该杂环基包含一个饱和的5-或6-元环和1至2个选自N,O和S的 杂原子,并且任选经C1-C3烷基取代,并且其中该苯基任选经C1-C3烷基,CN,卤素,OH或C1-C3烷氧基取代;
Ra10为C1-C3烷基,(CH2)0-3-CN或(CH2)0-3-卤素;和
A2,Ra4,Ra5,nn1和L每一个如上式TL-1中所定义。
在某些具体例中,nn1是0。
在某些具体例中,nn1是1。
在某些具体例中,nn1是2。
在某些具体例中,至少一个Ra6是C1-C3烷基(例如甲基,乙基, 丙基或异丙基)。在进一步的具体例中,至少一个Ra6是甲基。在进 一步的具体例中,两个Ra6是甲基。
在某些具体例中,至少一个Ra6是CN,(CH2)-CN,(CH2)2-CN 或(CH2)3-CN。在进一步的具体例中,至少一个Ra6是(CH2)-CN。
在某些具体例中,至少一个Ra6是卤素(例如F,Cl或Br), (CH2)-卤素,(CH2)2-卤素或(CH2)3-卤素。在进一步的具体例中,至 少一个Ra6是Cl,(CH2)-Cl,(CH2)2-Cl或(CH2)3-Cl。
在某些具体例中,至少一个Ra6是OH,(CH2)-OH,(CH2)2- OH或(CH2)3-OH。
在某些具体例中,至少一个Ra6是C1-C3烷氧基(例如,甲氧基, 乙氧基或丙氧基),(CH2)-C1-C3烷氧基,(CH2)2-C1-C3烷氧基或 (CH2)3-C1-C3烷氧基。在某些具体例中,至少一个Ra6是甲氧基。
在某些具体例中,Ra7是杂环基,(CH2)-杂环基,(CH2)2-杂环 基或(CH2)3-杂环基。在进一步的具体例中,Ra7是(CH2)3-杂环基。 在进一步的具体例中,杂环基是选自吡咯烷基,吡唑烷基,咪唑烷基, 恶唑烷基,异恶唑烷基,噻唑烷基,异噻唑烷基,哌啶基,哌嗪基,六氢嘧啶基,吗啉基和硫代吗啉基。在进一步的具体例中,杂环基是 哌嗪基。
在某些具体例中,杂环基经C(O)L取代。
在某些具体例中,杂环基经L取代。
在某些具体例中,Ra7是苯基,(CH2)-苯基,(CH2)2-苯基或 (CH2)3-苯基。在进一步的具体例中,Ra7是苯基。
在某些具体例中,Ra7是L。
在某些具体例中,Ra8是H。
在某些具体例中,Ra8是直链C1-C6或支链C3-C6烷基(例如甲 基,乙基,丙基,异丙基,丁基,异丁基,叔丁基,戊基或己基)。 在进一步的具体例中,Ra8是甲基,乙基或叔丁基。
在某些具体例中,Ra8是杂环基,(CH2)-杂环基,(CH2)2-杂环 基或(CH2)3-杂环基。在进一步的具体例中,Ra8是(CH2)3-杂环基。 在进一步的具体例中,杂环基是选自吡咯烷基,吡唑烷基,咪唑烷基, 恶唑烷基,异恶唑烷基,噻唑烷基,异噻唑烷基,哌啶基,哌嗪基,六氢嘧啶基,吗啉基和硫代吗啉基。在进一步的具体例中,杂环基是 哌嗪基。
在某些具体例中,杂环基经C1-C3烷基(例如甲基,乙基,丙基 或异丙基)取代。
在某些具体例中,Ra8是苯基,(CH2)-苯基,(CH2)2-苯基或 (CH2)3-苯基。在进一步的具体例中,Ra8是苯基。
在某些具体例中,苯基经C1-C3烷基(例如甲基,乙基,丙基或 异丙基)取代。在某些具体例中,苯基经CN取代。在某些具体例中, 苯基经卤素(例如F,Cl或Br)取代。在某些具体例中,苯基经OH取 代。在某些具体例中,苯基经C1-C3烷氧基(例如甲氧基,乙氧基或 丙氧基)取代。
在某些具体例中,Ra10是C1-C3烷基(例如甲基,乙基,丙基或 异丙基)。
在某些具体例中,Ra10是CN,(CH2)-CN,(CH2)2-CN或 (CH2)3-CN。
在某些具体例中,Ra10是卤素(例如,F,Cl或Br),(CH2)-卤 素,(CH2)2-卤素或(CH2)3-卤素。在进一步的具体例中,Ra10是Cl, (CH2)-Cl,(CH2)2-Cl或(CH2)3-Cl。在进一步的具体例中,Ra10是Cl。
A2,Ra4,Ra5和nn1中的每一个可以选自上述式TL-1中所述 的部分。A2,Ra4,Ra5,Ra6,Ra7,Ra8,Ra10和nn1中的一个定义 的每个部分可以与为A2,Ra4,Ra5,Ra6,Ra7,Ra8,Ra10和nn1中 的其他者定义的任何部分组合,如上所述和式TL-1中所述。
在某些具体例中,dTAG靶向配体是式TL-I2的化合物:
或其药学上可接受的盐,其中A2,Ra1,Ra2,Ra3,Ra4,Ra5,nn1 和nn2每一个如上式TL-1中所定义。
A2,Ra1,Ra2,Ra3,Ra4,Ra5,nn1和nn2中的每一个可以选 自上述式TL-1中所述的部分。A2,Ra1,Ra2,Ra3,Ra4,Ra5,nn1 和nn2中的一个的定义的每个部分可以与为A2,Ra1,Ra2,Ra3, Ra4,Ra5,nn1和nn2中的其他部分定义的任何部分组合,如上式 TL-1中所述。
在某些具体例中,dTAG靶向配体是式TL-I2a至TL-I2c的化 合物:
或其药学上可接受的盐,其中A2,Ra4,Ra5,nn1和L每一个如上 式TL-1中所定义,并且Ra6,Ra7,Ra8和Ra10每一个如上式TL- I1a至TL-I1d中所定义。
A2,Ra4,Ra5和nn1中的每一个可以选自上述式TL-1中所述 的部分,并且Ra6,Ra7,Ra8和Ra10中的每一个可以选自上述式 TL-I1a至TL-I1d中所述的部分。A2,Ra4,Ra5,Ra6,Ra7,Ra8和 Ra10和nn1中的一个定义的每个部分可以与为A2,Ra4,Ra5,Ra6, Ra7,Ra8和Ra10和nn1中的其他部分定义的任何部分组合,如上式 TL-1和TL-I1a至TL-I1d中所述。
在某些具体例中,dTAG靶向配体是式TL-I3的化合物:
或其药学上可接受的盐。
A2,Ra1,Ra2,Ra3,Ra4,Ra5,nn1和nn2每一个如上式TL- 1中所定义。A2,Ra1,Ra2,Ra3,Ra4,Ra5,nn1和nn2中的每一 个可以选自上述式TL-1中所述的部分。A2,Ra1,Ra2,Ra3,Ra4,Ra5,nn1和nn2中的一个定义的每个部分可以与A2,Ra1,Ra2, Ra3,Ra4,Ra5,nn1和nn2中的其他部分定义的任何部分合并,如 上式TL-1中所述。
在某些具体例中,dTAG靶向配体是式TL-I3a至TL-I3c的化 合物:
或其药学上可接受的盐,其中:
Ra9是C(O)NRa5L,OL,NRa5L或L;
A2,Ra4,Ra5,nn1和L每一个如上式TL-1中所定义;和
Ra6,Ra7,Ra8和Ra10每一个如上式TL-I1a-TL-I1d中所定义。
在某些具体例中,Ra9是C(O)NRa5L。在进一步的具体例中, Ra5是H。在其他具体例中,Ra5是C1-C3烷基(例如甲基,乙基,丙 基或异丙基)。
在某些具体例中,Ra9是OL。
在某些具体例中,Ra9是NRa5L。在进一步的具体例中,Ra5是 H。在其他具体例中,Ra5是C1-C3烷基(例如甲基,乙基,丙基或异 丙基)。在其他具体例中,Ra5是甲基。
在某些具体例中,Ra9是L。
A2,Ra4,Ra5和nn1中的每一个可以选自上述式TL-1中所述 的部分,并且Ra6,Ra7,Ra8和Ra10中的每一个可以选自上述式 TL-I1a至TL-I1d中所述的部分。A2,Ra4,Ra5,Ra6,Ra7,Ra8, Ra9,Ra10和nn1中的一个定义的每个部分可以与为A2,Ra4,Ra5, Ra6,Ra7,Ra8,Ra9,Ra10和nn1的其他者定义的任何部分合并, 如上所述和式TL-I和TL-I1a至TL-I1d中所述。
在某些具体例中,dTAG靶向配体是式TL-VI的化合物:
或其药学上可接受的盐,其中:
Rf1是C(O)NRf2L,OL,NRf2L或L;
Rf2独立地为H或C1-C3烷基;和
L是连接子。
在某些具体例中,Rf1是C(O)NRf2L。在进一步的具体例中, Rf2是H。在其他具体例中,Rf2是C1-C3烷基(例如甲基,乙基,丙 基或异丙基)。
在某些具体例中,Rf1是OL。
在某些具体例中,Rf1是NRe4L。在进一步的具体例中,Rf2是 H。在其他具体例中,Rf2是C1-C3烷基(例如甲基,乙基,丙基或异 丙基)。在其他具体例中,Rf2是甲基。
在某些具体例中,Rf1是L。
在某些具体例中,dTAG靶向配体是式TL-VII的化合物:
或其药学上可接受的盐,其中:
T7为CH2或CH2CH2
Rg1为C(O)Rg5或(CH2)1-3Rg6
nn10是0、1、2或3;
nn11为0、1、2或3;
每个Rg2独立地是C1-C3烷基,C1-C3烷氧基,CN或卤素;
Rg3为C(O)NRg4L,OL,NRg4L,L,O-(CH2)1-3-C(O)NRg4L, 或NHC(O)-(CH2)1-3-C(O)NRg4L;
Rg4为H或C1-C3烷基;
Rg5是C1-C6烷基;
Rg6是任选经C1-C3烷基,C1-C3烷氧基,CN或卤素取代的苯 基;和
L是连接子。
在某些具体例中,T7是CH2
在某些具体例中,T7是CH2CH2
在某些具体例中,Rg1是C(O)Rg5
在某些具体例中,Rg1是(CH2)-Rg6,(CH2)2-Rg6或(CH2)3- Rg6
在某些具体例中,Rg5是直链C1-C6或支链C3-C6烷基(例如甲 基,乙基,丙基,异丙基,丁基,异丁基,叔丁基,戊基或己基)。
在某些具体例中,Rg6是未取代的苯基。
在某些具体例中,Rg6是被一个,两个,三个或更多个取代基 取代的苯基,所述取代基独立地选自C1-C3烷基(例如甲基,乙基, 丙基或异丙基),C1-C3烷氧基(例如,甲氧基,乙氧基或丙氧基), CN和卤素(例如F,Cl或Br)。
在某些具体例中,nn10是0。
在某些具体例中,nn10是1。
在某些具体例中,nn10是2。
在某些具体例中,nn10是3。
在某些具体例中,nn11是0。
在某些具体例中,nn11是1。
在某些具体例中,nn11是2。
在某些具体例中,nn11是3。
在某些具体例中,至少一个Rg2是C1-C3烷基(例如甲基,乙基, 丙基或异丙基)。在进一步的具体例中,至少一个Rg2是甲基。
在某些具体例中,至少一个Rg2是C1-C3烷氧基(例如甲氧基, 乙氧基或丙氧基)。在进一步的具体例中,至少一个Rg2是甲氧基。
在某些具体例中,至少一个Rg2是CN。
在某些具体例中,至少一个Rg2是卤素(例如,F,Cl或Br)。
在某些具体例中,Rg3是C(O)NRg4L。在进一步的具体例中, Rg4是H,在其他具体例中,Rg4是C1-C3烷基(例如甲基,乙基,丙 基或异丙基)。
在某些具体例中,Rg3是OL。
在某些具体例中,Rg3是NRg4L。在进一步的具体例中,Rg4是H。在其他具体例中,Rg4是C1-C3烷基(例如甲基,乙基,丙基或 异丙基)。在其他具体例中,Rg4是甲基。
在某些具体例中,Rg3是L。
在某些具体例中,Rg3是O-(CH2)-C(O)NRg4L,O-(CH2)2- C(O)NRg4L或O-(CH2)3-C(O)NRg4L。在进一步的具体例中,Rg3是 O-(CH2)-C(O)NRg4L。在进一步的具体例中,Rg4是H。在其他具体 例中,Rg4是C1-C3烷基(例如甲基,乙基,丙基或异丙基)。
在某些具体例中,Rg3是NHC(O)-(CH2)-C(O)NRg4L, NHC(O)-(CH2)2-C(O)NRg4L,或NHC(O)-(CH2)3-C(O)NRg4L。在进 一步的具体例中,Rg3是NHC(O)-(CH2)-C(O)NRg4L,NHC(O)-(CH2)2-C(O)NRg4L。在进一步的具体例中,Rg3是NHC(O)-(CH2)2- C(O)NRg4L。在进一步的具体例中,Rg4是H。在其他具体例中, Rg4是C1-C3烷基(例如甲基,乙基,丙基或异丙基)。
在某些实施方式中,dTAG靶向配体是选自图28所示的结构, 其中R是连接连接子的位点。
在某些具体例中,dTAG靶向配体或靶标是基于存在(已知的 dTAG结合部分)和能够开发具有可容纳连接子的功能性位置的有效 和选择性配体的能力来选择的。一些具体例涉及具有较低选择性的 dTAG靶向配体,其可以受益于与蛋白质组学结合的降解作为化合物 选择性或靶标ID的量度。
本申请的一些具体例涉及CAR的30%至100%的降解或损失。 某些具体例涉及CAR的50至100%的损失。其他具体例涉及CAR 的75至95%的损失。
用于本发明的异双功能性化合物的非限制性实例包括那些图29、 30、31和32所示者。
图29提供了用于本发明的具体异双功能性化合物。
图30提供了用于本发明的具体异双功能性化合物,其中上述结 构中的X是选自F,Cl,Br和I的卤素。
图31提供了用于本发明的具体异双功能性化合物。
图32提供了用于本发明的具体异双功能性化合物,
其中:RAR1是选自: 以及
RAR2是选自: 以及
用于本发明的其他化合物包括图33的结构。
一些前述异双功能性化合物包括一个或多个不对称中心,因此 可以以各种异构形式存在,例如立体异构体和/或非对映异构体。因 此,化合物和其药物组合物可以是单独对映异构体,非对映异构体或 几何异构体的形式,或可以是立体异构体混合物的形式。在某些具体 例中,本申请的化合物是对映体纯的化合物。在某些其他具体例中, 提供了立体异构体或非对映异构体的混合物。
此外,除非另有说明,否则如本文所述的某些异双功能性化合 物可具有一个或多个双键,其可以Z或E异构体存在。本申请还包 括作为实质上不含其它异构体的单独异构体的化合物,或者作为各种 异构体的混合物,例如立体异构体的外消旋混合物。除了上述化合物 本身之外,本申请还包括这些异双功能性化合物的药学上可接受的衍 生物和包含一种或多种本申请化合物和一种或多种药学上可接受的赋 形剂或添加剂的组合物。
本申请的异双功能性化合物可以通过在不同条件下结晶化合物 来制备,并且可以作为构成本申请一部分的化合物的多晶型物之一或 其组合存在。例如,可以使用不同溶剂或不同溶剂混合物进行重结晶 来鉴定和/或制备不同的多晶型物;通过在不同温度下进行结晶;或 者通过使用各种冷却模式,从结晶期间的非常快速到非常慢的冷却。 多晶型物也可以通过加热或熔化化合物然后逐渐或快速冷却来获得。 多晶型物的存在可以通过固体探针NMR光谱法,IR光谱法,差示 扫描量热法,粉末X射线衍射图和/或其他技术来确定。因此,本申 请包括异双功能性化合物,其衍生物,其互变异构形式,其立体异构 体,其多晶型物,其药学上可接受的盐,其药学上可接受的溶剂化物 和含有该化合物的药学上可接受的组合物。
异双功能性化合物的一般合成
本文所述的异双功能性化合物可通过本领域技术人员已知的方 法制备。在一个非限制性实例中,所揭露的异双功能性化合物可通 过以下方案制备。
反应图1
反应图2
如反应图1所示,用于本发明的异双功能性化合物可通过化学 结合降解决定区域和连接子,随后加入dTAG靶向配体来制备。类 似地,在反应图2中,通过首先化学组合dTAG靶向配体和连接子, 然后加入降解决定区域,以制备用于本发明的异双功能性化合物。
如上和如下反应图中所示,本领域技术人员可以通过各种方法和化学 反应容易地合成用于本发明的异双功能性化合物。
反应图3
反应图3:在步骤1中,亲核的降解决定区域置换连接子上的 离去基团以制备降解决定区域连接子片段。在步骤2中,通过本领 域已知的方法除去保护基团以释放连接子上的亲核位点。在步骤3 中,亲核的降解决定区域连接子片段置换dTAG靶向配体上的离去 基团,以形成用于本发明的化合物。在另一个具体例中,步骤1和/ 或步骤2通过偶联反应而不是亲核攻击完成。
反应图4
反应图4:在步骤1中,亲核dTAG靶向配体置换连接子上的 离去基团以制备dTAG靶向配体连接子片段。在步骤2中,通过本 领域已知的方法除去保护基团以释放连接子上的亲核位点。在步骤 3中,亲核dTAG靶向配体连接子片段取代降解决定区域上的离去基 团以形成用于本发明的化合物。在另一个具体例中,步骤1和/或步 骤2通过偶联反应而不是亲核攻击完成。
反应图5
反应图6
反应图5和反应图6:在步骤1中,亲核的降解决定区域置换连接 子上的离去基团以制备降解决定区域连接子片段。在步骤2中,通 过本领域已知的方法除去保护基团以释放连接子上的亲核位点。在 步骤3中,亲核的降解决定区域连接子片段置换dTAG靶向配体上 的离去基团以形成式I或式II的化合物。在另一个具体例中,步骤 1和/或步骤2通过偶联反应而不是亲核攻击完成。
a)使(2-氨基乙基)氨基甲酸叔丁酯或其类似物(例如,n=1至20)(1) 或其类似物(例如,n=1至20)与氯乙酰氯在合适的条件下反应以产 生(2-(2-氯乙酰氨基)乙基)氨基甲酸叔丁酯或其类似物(例如,n=1 至20)(2);
b)在合适的条件下使(2-(2-氯乙酰氨基)乙基)氨基甲酸叔丁酯或其类 似物(2)与3-羟基邻苯二甲酸二甲酯反应,以提供3-(2-((2-((叔丁氧 基羰基)氨基))乙基)氨基)-2-氧代乙氧基)邻苯二甲酸酯或其类似物(3);
c)使3-(2-((2-((叔丁氧基羰基)氨基)乙基)氨基)-2-氧代乙氧基)邻苯二 甲酸二甲酯或其类似物(3)与强碱反应,然后与3-氨基哌啶-2,6反应- 二酮盐酸盐反应,以生成(2-(2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异 吲哚啉-4-基)氧基)乙酰氨基)乙基)氨基甲酸叔丁酯或其类似物(4);
d)使化合物(4)脱保护,以提供二氨基乙酰基-O-沙利度胺三氟乙酸盐 或其类似物(5);
e)使化合物(5)与dTAG靶向配体的酸衍生物(化合物(6))在合适的条 件下反应,以得到双功能性化合物(7)。
在某些具体例中,上述方法在溶液相中进行。在某些其他具体 例中,上述方法在固相上进行。在某些具体例中,合成方法适用于高 通量技术或通常用于组合化学的技术。
异双功能性化合物的代表性合成
除非另有说明,否则起始材料可以商业获得,或者由熟悉本领 域的任何人通过实验室合成容易地获得。以下一般性描述的是合成通 常描述的化合物和本文亚类和种类的方法和一般指导。
合成例1':IMiD衍生物和降解决定区域的合成
通用程序I:IMiD冷凝
2-(2,6-二氧代哌啶-3-基)-4-羟基异吲哚啉-1,3-二酮(D-1)
在20mL玻璃小瓶中,将3-羟基邻苯二甲酸酐(500mg,3.05 mmol,1当量),乙酸钾(927mg,9.44mmol,3.1当量)和3-氨基 哌啶-2,6-二酮盐酸盐(552mg,3.35mmol,1.1当量)于乙酸(10.2 mL,0.3M)的混合物加热至90℃过夜。将黑色反应混合物冷却至室 温并用水稀释至20mL,随后在冰上冷却30分钟。将得到的浆液转 移到50mL Falcon管中,将其以3500rpm离心5分钟。弃去上清液, 将黑色固体转移至含有甲醇的250mL RBF中并真空浓缩。通过快速 柱色谱法(CH2Cl2:MeOH(9:1))在硅胶上纯化残余物,得到标题化 合物,为白色固体(619mg,74%)。1H NMR(400MHz,DMSO-d6) δ11.07(s,1H),7.65(dd,J=8.4,6.8Hz,1H),7.31(d,J=6.8Hz, 1H),7.24(d,J=8.4Hz,1H),5.06(dd,J=12.8,5.4Hz,1H),2.94– 2.82(m,1H),2.64–2.43(m,2H),2.08–1.97(m,1H);计算 C13H11N2O5[M+H]+ 275.07的MS(ESI),实测为275.26。
2-(2,6-二氧代哌啶-3-基)-4-硝基异吲哚啉-1,3-二酮(D-10)
按照通用方法I使用3-硝基邻苯二甲酸酐(300mg,1.55mmol, 1当量),乙酸钾(473mg,4.82mmol,3.1当量)和3-氨基哌啶-2,6- 二酮盐酸盐(281mg,1.71mmol)通过快速柱色谱(CH2Cl2:MeOH(9: 1))在硅胶上纯化,得到标题化合物,为浅黄色固体(280mg,59%)。1H NMR(500MHz,DMSO-d6)δ11.17(s,1H),8.35(d,J=8.1Hz, 1H),8.24(d,J=7.5Hz,1H),8.14–8.10(m,1H),5.20(dd,J=12.9, 5.5Hz,1H),2.93–2.84(m,1H),2.64–2.45(m,2H),2.11–2.04 (m,1H);计算C13H10N3O6[M+H]+ 304.06的MS(ESI),实测为 304.19。
2-(2,6-二氧代哌啶-3-基)-5-硝基异吲哚啉-1,3-二酮(D-2)
按照通用方法I,使用4-硝基邻苯二甲酸酐(300mg,1.55 mmol),乙酸钾(473mg,4.82mmol)和3-氨基哌啶-2,6-二酮盐酸盐 (281mg,1.71mmol),通过快速柱色谱法(CH2Cl2:MeOH(30:1)) 在硅胶上纯化后,得到标题化合物,为白色固体(409mg,87%)。 1H NMR(500MHz,DMSO-d6)δ11.18(s,1H),8.68(dd,J=8.1,1.9 Hz,1H),8.56(d,J=1.9Hz,1H),8.19(d,J=8.1Hz,1H),5.24(dd, J=12.9,5.4Hz,1H),2.90(ddd,J=17.2,13.9,5.5Hz,1H),2.69– 2.48(m,2H),2.14–2.05(m,1H);计算C13H10N3O6[M+H]+ 304.06 的MS(ESI),实测为304.19。
2-(2,6-二氧代哌啶-3-基)异吲哚啉-1,3-二酮(D-6)
按照通用方法I,使用邻苯二甲酸酐(155mg,1.05mmol),乙 酸钾(318mg,3.24mmol)和3-氨基哌啶-2,6-二酮盐酸盐(189mg, 1.15mmol),通过快速柱色谱法(CH2Cl2:MeOH(15:1))在硅胶上 纯化后,得到标题化合物,为白色固体(235mg,87%)。1HNMR (500MHz,DMSO-d6)δ11.13(s,1H),8.00–7.76(m,4H),5.16(dd, J=12.8,5.4Hz,1H),2.89(ddd,J=16.8,13.7,5.4Hz,1H),2.65– 2.42(m,2H),2.12–1.99(m,1H);计算计算C13H11N2O4[M+H]+ 259.07的MS(ESI),实测为259.23。
2-(2,5-二氧代吡咯烷-3-基)异吲哚啉-1,3-二酮(D-7)
按照通用方法I,使用邻苯二甲酸酐(90mg,0.608mmol),乙 酸钾(185mg,1.88mmol)和3-氨基吡咯烷-2,5-二酮盐酸盐(101mg, 0.668mmol),通过快速柱色谱法(CH2Cl2:MeOH(14:1))在硅胶上 纯化后,得到标题化合物,为白色固体(95mg,64%)。计算C12H9N2O4[M+H]+ 245.06的MS(ESI),实测为45.26。
2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-5-羧酸(D-13)
按照通用方法I,使用1,2,4-苯三甲酸酐(200mg,1.04mmol), 乙酸钾(317mg,3.23mmol)和3-氨基哌啶-2,6-二酮盐酸盐(188mg, 1.15mmol)。通过快速柱色谱法(CH2Cl2:MeOH(9:1))在硅胶上纯 化后,得到标题化合物,为白色固体(178mg,57%)。计算 C14H11N2O6[M+H]+ 303.06的MS(ESI),实测为303.24。
2-(2,6-二氧代哌啶-3-基)-4-氟异二氢吲哚-1,3-二酮(D-14)
按照通用方法I,使用3-氟邻苯二甲酸酐(200mg,1.20mmol), 乙酸钾(366mg,3.73mmol)和3-氨基哌啶-2,6-二酮盐酸盐(218mg, 1.32mmol),通过快速柱色谱法(CH2Cl2:MeOH(50:1))在硅胶 上纯化后,得到标题化合物,为白色固体(288mg,86%)。1HNMR (500MHz,DMSO-d6)δ11.15(s,1H),7.96(ddd,J=8.3,7.3,4.5Hz, 1H),7.82–7.71(m,2H),5.17(dd,J=13.0,5.4Hz,1H),2.90(ddd, J=17.1,13.9,5.4Hz,1H),2.65–2.47(m,2H),2.10–2.04(m,1H), 计算C13H10FN2O4[M+H]+ 277.06的MS(ESI),实测为277.25。
2-(2,6-二氧代哌啶-3-基)-4-甲基异吲哚啉-1,3-二酮(D-19)
按照通用方法I,使用3-甲基邻苯二甲酸酐(150mg,0.925 mmol),乙酸钾(281mg,2.87mmol)和3-氨基哌啶-2,6-二酮盐酸盐 (167mg,1.02mmol),通过快速柱色谱法(CH2Cl2:MeOH(15:1)) 在硅胶上纯化后,得到标题化合物,为白色固体(168mg,67%)。计 算C14H13N2O4[M+H]+ 273.09的MS(ESI),实测为273.24。
2-(2,6-二氧代哌啶-3-基)-5-氟异二氢吲哚-1,3-二酮(D-24)
按照通用方法I,使用4-氟邻苯二甲酸酐(200mg,1.20mmol), 乙酸钾(366mg,3.73mmol)和3-氨基哌啶-2,6-二酮盐酸盐(218mg, 1.32mmol),通过快速柱色谱法(CH2Cl2:MeOH(15:1))在硅胶上纯 化后,得到标题化合物,为白色固体(254mg,76%)。计算C13H10FN2O4[M+H]+ 277.06的MS(ESI),实测为277.24。
2-(2,6-二氧代哌啶-4-基)异吲哚啉-1,3-二酮(D-43)
按照通用方法I,使用邻苯二甲酸酐(60mg,0.311mmol),乙 酸钾(95mg,0.963mmol)和4-氨基哌啶-2,6-二酮盐酸盐(56mg, 0.342mmol),通过快速柱色谱法(CH2Cl2:MeOH(9:1))在硅胶 上纯化后,得到标题化合物,为白色固体(40mg,43%)。计算C13H11N2O4[M+H]+ 259.07的MS(ESI),实测为259.18。
通用程序II:还原芳族硝基
4-氨基-2-(2,6-二氧代哌啶-3-基)异吲哚啉-1,3-二酮(D-4)
将2-(2,6-二氧代哌啶-3-基)-4-硝基异吲哚啉-1,3-二酮(173mg, 0.854mmol),Pd(OAc)2(12.8mg,0.0854mmol,10mol%)氟化钾 (66mg,1.71mmol,2当量)于THF:水(8:1)(5.7mL,0.1M)的溶 液在室温搅拌。缓慢加入三乙基硅烷(365μL,3.41mmol,4当量), 将得到的黑色溶液在室温搅拌1小时。将反应混合物通过硅藻土垫过 滤,用乙酸乙酯过量洗涤。将滤液真空浓缩,并将残余物通过快速柱 色谱法(CH2Cl2:MeOH(7:1))在硅胶上纯化,得到标题化合物,为 黄色粉末(72mg,46%)。1H NMR(500MHz,DMSO-d6)δ11.08(s, 1H),7.47(dd,J=8.5,7.0Hz,1H),7.06–6.95(m,1H),6.59–6.44 (m,1H),5.04(dd,J=12.7,5.4Hz,1H),2.93–2.82(m,1H),2.64– 2.45(m,2H),2.05–1.98(m,1H);计算C13H11N3O4[M+H]+ 274.08 的MS(ESI),实测为274.23。
2-(2,6-二氧代哌啶-3-基)-5-硝基异吲哚-1,3-二酮(D-8)
按照通用方法II,使用2-(2,6-二氧代哌啶-3-基)-5-硝基异吲哚 啉-1,3-二酮(100mg,0.330mmol),Pd(OAc)2(7.4mg,0.033mmol) 氟化钾(38mg,0.660mmol)和三乙基硅烷(211μL,1.32mmol,通 过快速柱色谱法(CH2Cl2:MeOH(9:1)))在硅胶上纯化,得到标 题化合物,为黄色固体(33mg,37%)。1H NMR(500MHz,DMSO- d6)δ11.05(s,1H),7.52(d,J=8.2Hz,1H),6.94(d,J=2.0Hz,1H), 6.83(dd,J=8.2,2.0Hz,1H),6.55(s,2H),5.01(dd,J=12.8,5.4 Hz,1H),2.86(ddd,J=16.9,13.9,5.5Hz,1H),2.68–2.43(m,2H), 2.03–1.93(m,1H);计算C13H12N3O4[M+H]+ 274.08的MS(ESI), 实测为274.59。
4-氨基-2-(1-苄基-2,6-二氧代哌啶-3-基)异吲哚啉-1,3-二酮(D-12)
按照通用方法II,使用2-(1-苄基-2,6-二氧代哌啶-3-基)-4-硝基 异吲哚啉-1,3-二酮(48mg,0.122mmol),Pd(OAc)2(2.7mg,0.0122 mmol),氟化钾(14mg,0.244mmol)和三乙基硅烷(78μL,0.488 mmol,通过快速柱色谱法(0至100%己烷于EtOAc)在硅胶上纯化后,得到标题化合物,为黄色固体(7mg,16%)。计算C20H18N3O4 [M+H]+ 364.13的MS(ESI),实测为364.34。
3-(5-氨基-2-甲基-4-氧代喹唑啉-3(4H)-基)哌啶-2,6-二酮(D-17)
按照通用方法II,使用3-(2-甲基-5-硝基-4-氧代喹唑啉-3(4H)- 基)哌啶-2,6-二酮(21mg,0.0664mmol),Pd(OAc)2(1.5mg,0.0066 mmol),氟化钾(7.7mg,0.133mmol)和三乙基硅烷(42μL,0.266 mmol),通过制备型HPLC纯化,得到标题化合物,为白色固体(7 mg,37%)。计算C14H15N4O3[M+H]+ 287.11的MS(ESI),实测为 287.30。
3-(7-氨基-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮(D-41)
按照通用方法II,使用3-(7-硝基-1-氧代异吲哚啉-2-基)哌啶- 2,6-二酮(11mg,0.038mmol),Pd(OAc)2(0.9mg,0.0038mmol), 氟化钾(4.4mg,0.076mmol)和三乙基硅烷(24μL,0.152mmol,通 过快速柱色谱法(0至10%MeOH的CH2Cl2溶液)在硅胶上纯化后, 得到标题化合物,为黄色固体(2mg,21%)。计算C13H14N3O3 [M+H]+ 260.10的MS(ESI),实测为260.52。
通用程序III:苯胺的酰化
N-(2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-5-基)乙酰胺(D-5)
在4mL玻璃小瓶中,将5-氨基-2-(2,6-二氧代哌啶-3-基)异吲 哚啉-1,3-二酮(30mg,0.110mmol,1当量)和乙酰氯(26μL,0.220 mmol,2当量)于THF(1.8mL,0.1M)溶液的混合物加热至回流过夜。 过滤反应混合物,滤饼用Et2O洗涤,得到标题化合物,为白色固体(27mg,47%),无需进一步纯化即可使用。1H NMR(500MHz, DMSO-d6)δ11.11(s,1H),10.63(s,1H),8.24(d,J=1.5Hz,1H), 7.91–7.83(m,2H),5.11(dd,J=12.8,5.4Hz,1H),2.88(ddd,J= 17.0,13.8,5.4Hz,1H),2.63–2.46(m,2H),2.13(s,3H),2.09– 2.00(m,1H);计算C15H14N3O5[M+H]+ 316.09的MS(ESI),实测 为316.23。
N-(2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)乙酰胺(D-3)
按照通用方法III,使用4-氨基-2-(2,6-二氧代哌啶-3-基)异吲哚 啉-1,3-二酮(50mg,0.183mmol)和乙酰氯(26μL,0.366mmol),得 到标题化合物,为白色固体(10mg,17%)。1H NMR(500MHz, DMSO-d6)δ11.14(s,1H),9.73(s,1H),8.44(d,J=8.4Hz,1H), 7.83(dd,J=8.4,7.3Hz,1H),7.62(d,J=7.2Hz,1H),5.14(dd,J= 12.9,5.4Hz,1H),2.90(ddd,J=17.1,13.9,5.4Hz,1H),2.66–2.45 (m,2H),2.19(s,3H),2.14–2.00(m,1H);计算C15H14N3O5 [M+H]+ 316.09的MS(ESI),实测为316.27。
2-氯-N-(2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-5-基)乙酰胺 (D-32)
按照通用方法III,使用5-氨基-2-(2,6-二氧代哌啶-3-基)异吲哚 啉-1,3-二酮(10mg,0.0366mmol)和氯乙酰氯(6μL,0.0732mmol), 得到标题化合物,为白色固体(7.1mg,55%)。计算C15H13ClN3O5 [M+H]+ 350.05的MS(ESI),实测为350.23。
2-氯-N-(2-(2,6-二氧代哌啶-3-基)-1-氧代异吲哚-4-基)乙酰胺(D-34)
按照通用方法III,使用3-(4-氨基-1-氧代异吲哚啉-2-基)哌啶- 2,6-二酮(20mg,0.0771mmol)和氯乙酰氯(12μL,0.154mmol),得 到标题化合物,为白色固体(14.9mg,56%)。1H NMR(500MHz, DMSO-d6)δ11.02(s,1H),10.20(s,1H),7.81(dd,J=7.7,1.3Hz, 1H),7.65–7.47(m,2H),5.16(dd,J=13.3,5.1Hz,1H),4.45–4.34 (m,2H),4.33(s,2H),3.00–2.85(m,1H),2.68–2.56(m,1H),2.41 –2.28(m,1H),2.09–1.97(m,1H);计算C15H15ClN3O4[M+H]+ 336.07的MS(ESI),实测为336.31。
N-(2-(2,6-二氧代哌啶-3-基)-1-氧代异吲哚-4-基)丙烯酰胺(D-35)
按照通用方法III,使用3-(4-氨基-1-氧代异吲哚啉-2-基)哌啶- 2,6-二酮(20mg,0.0771mmol)和丙烯酰氯(13μL,0.154mmol),得 到标题化合物,为白色固体(18毫克,76%)。1H NMR(500MHz, DMSO-d6)δ15.77(s,1H),14.81(s,1H),12.65(dd,J=7.4,1.6Hz, 1H),12.37–12.18(m,2H),11.28(dd,J=17.0,10.2Hz,1H),11.06 (dd,J=17.0,1.9Hz,1H),10.57(dd,J=10.2,1.9Hz,1H),9.91(dd, J=13.3,5.1Hz,1H),9.24–9.05(m,2H),7.67(ddd,J=17.2,13.7, 5.5Hz,1H),7.36(dt,J=17.3,3.8Hz,1H),7.20–7.03(m,1H), 6.83–6.72(m,1H);计算C16H16N3O4[M+H]+ 314.11的MS(ESI), 实测为314.24。
N-(2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-5-基)丙烯酰胺(D- 36)
按照通用方法III,使用5-氨基-2-(2,6-二氧代哌啶-3-基)异吲哚 啉-1,3-二酮(10mg,0.0366mmol)和丙烯酰氯(6μL,0.0732mmol), 得到标题化合物,为白色固体(8.8mg,73%)。1H NMR(500MHz, DMSO-d6)δ11.12(s,1H),10.83(s,1H),8.33(d,J=1.8Hz,1H),7.99(dd,J=8.2,1.9Hz,1H),7.90(d,J=8.2Hz,1H),6.48(dd,J= 17.0,10.1Hz,1H),6.36(dd,J=17.0,1.9Hz,1H),5.88(dd,J= 10.0,1.9Hz,1H),5.13(dd,J=12.8,5.5Hz,1H),2.95–2.84(m, 1H),2.67–2.46(m,2H),2.09–2.01(m,1H);计算C16H14N3O5 [M+H]+ 328.09的MS(ESI),实测为328.23。
N-(2-(2,6-二氧代哌啶-3-基)-1-氧代异吲哚-4-基)乙酰胺(D-37)
按照通用方法III,使用3-(4-氨基-1-氧代异吲哚啉-2-基)哌啶- 2,6-二酮(20mg,0.0771mmol)和乙酰氯(11μL,0.154mmol),得到 标题化合物。白色固体(17毫克,71%)。MS(ESI)计算C15H16N3O4 [M+H]+ 302.11,实测为301.99.
N-(2-(2,6-二氧代哌啶-3-基)-1-氧代异吲哚-4-基)环丙烷甲酰胺(D-38)
按照通用方法III,使用3-(4-氨基-1-氧代异吲哚啉-2-基)哌啶- 2,6-二酮(20mg,0.0771mmol)和环丙烷甲酰氯(11μL,0.154 mmol),得到标题化合物,为白色固体(19毫克,75%)。1H NMR (500MHz,DMSO-d6)δ11.01(s,1H),10.06(s,1H),7.84(dd,J= 7.2,1.9Hz,1H),7.66–7.38(m,2H),5.14(dd,J=13.3,5.1Hz,1H), 4.52–4.30(m,2H),2.92(ddd,J=17.3,13.6,5.4Hz,1H),2.64– 2.54(m,1H),2.45–2.27(m,1H),2.08–1.95(m,1H),1.93–1.83 (m,1H),0.90–0.75(m,4H);计算C17H18N3O4[M+H]+ 328.13的 MS(ESI),实测为328.00。
通用程序IV:喹唑啉酮缩合
3-(2-甲基-4-氧代喹唑啉-3(4H)-基)哌啶-2,6-二酮(D-9)
在20mL玻璃小瓶中,将邻氨基苯甲酸(100mg,0.729 mmol,1当量),乙酸(42μL,0.729mmol,1当量)和 P(OPh)3(479μL,1.82mmol,2.5当量)于吡啶(1.0uL,0.7M)加热至 90℃。4小时后,将反应混合物冷却至室温,加入3-氨基哌啶-2,6- 二酮盐酸盐(144mg,0.875mmol,1.2当量)。将反应混合物再加热 至90℃,保持1.5小时,然后在室温搅拌过夜。将反应混合物溶于 EtOAc(15mL)和水(15mL)中。用盐水(2×25mL)洗涤有机层,用 Na2SO4干燥并真空浓缩。通过快速柱色谱法(0-5%MeOH的CH2Cl2溶液)在硅胶上纯化残余物,得到标题化合物,为白色固体(79mg, 40%)。1H NMR(500MHz,DMSO-d6)δ11.03(s,1H),8.03(dd,J=7.9,1.5Hz,1H),7.82(ddd,J=8.5,7.1,1.6Hz,1H),7.62(dd,J= 8.3,1.1Hz,1H),7.50(ddd,J=8.1,7.1,1.1Hz,1H),5.27(dd,J= 11.5,5.7Hz,1H),2.92–2.78(m,1H),2.73–2.56(m,5H),2.26–2.06(m,1H);计算C14H14N3O3[M+H]+ 272.10的MS(ESI),实测 为272.33。
3-(2-甲基-4-氧代喹唑啉-3(4H)-基)吡咯烷-2,5-二酮(D-11)
按照通用方法IV,使用邻氨基苯甲酸(200mg,1.46mmol), 乙酸(84μL,1.46mmol),P(OPh)3(959μL,3.65mmol)和3-氨基吡 咯烷-2,5-二酮盐酸盐(263mg,1.75mmol),通过快速柱色谱法 (CH2Cl2:MeOH(15:1))在硅胶上纯化,得到标题化合物,为白色 固体(25mg,7%)。计算C13H12N3O3[M+H]+ 258.09的MS(ESI), 实测为258.22。
3-(5-氟-2-甲基-4-氧代喹唑啉-3(4H)-基)哌啶-2,6-二酮(D-66)
按照通用方法IV,使用6-氟邻氨基苯甲酸(100mg,0.645 mmol),乙酸(37μL,0.644mmol),P(OPh)3(424μL,1.61mmol)和 3-氨基哌啶-2,6-二酮盐酸盐(127mg,0.774mmol),通过快速柱色谱 法(0至10%MeOH于CH2Cl2)在硅胶上纯化,得到标题化合物,为 白色固体(70mg,38%)。1H NMR(500MHz,DMSO-d6)δ11.03(s, 1H),7.84–7.76(m,1H),7.44(dd,J=8.2,1.0Hz,1H),7.25(ddd,J =11.1,8.2,1.0Hz,1H),5.24(dd,J=11.3,5.7Hz,1H),2.90–2.75 (m,1H),2.62(s,3H),2.61–2.56(m,2H),2.20–2.12(m,1H);计 算C14H13FN3O3[M+H]+ 290.09的MS(ESI),实测为290.27。
3-(2-甲基-5-硝基-4-氧代喹唑啉-3(4H)-基)哌啶-2,6-二酮(D-67)
按照通用方法IV,使用6-硝基邻氨基苯甲酸(100mg,0.549 mmol),乙酸(31μL,0.549mmol),P(OPh)3(361μL,1.37mmol)和 3-氨基哌啶-2,6-二酮盐酸盐(108mg,0.659mmol),通过快速柱色谱 法(0至10%MeOH于CH2Cl2)在硅胶上纯化,得到标题化合物,为 白色固体(29mg,17%)。计算C14H13N4O5[M+H]+ 317.09的MS (ESI),实测为317.58。
通用程序V:酰胺偶联
N-苄基-2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-5-甲酰胺(D-15)
在4mL玻璃小瓶中,将2-(2,6-二氧代哌啶-3-基)-1,3-二氧代 异吲哚啉-5-羧酸(10mg,0.033mmol,1当量),HATU(13mg, 0.033mmol,1当量),DIPEA(17μL,0.099mmol,3当量)和苄胺 (4μL,0.036mmol,1.1当量)于DMF(331μL,0.1M)的溶液在室温 搅拌过夜。将反应混合物用MeOH稀释至4mL,过滤,然后通过 制备型HPLC纯化,得到标题化合物,为白色固体(6mg,46%)。计 算C21H18N3O5[M+H]+ 392.12的MS(ESI),实测为392.33。
通用程序VI:亲核芳香族取代
4-(苄基氨基)-2-(2,6-二氧代哌啶-3-基)异吲哚啉-1,3-二酮(D-16)
在4mL玻璃小瓶中,将2-(2,6-二氧代哌啶-3-基)-4-氟异吲哚 啉-1,3-二酮(10mg,0.036mmol,1当量),苄胺(4.4μL,0.040 mmol,1.1当量)和DIPEA(13μL,0.072mmol,2当量)在 NMP(362μL,0.1M)中加热至90℃过夜。将反应混合物冷却至室温 并溶于EtOAc(15mL)中。将有机层用NaHCO3(水性)(15mL),水 (15mL)和盐水(3×15mL)洗涤,随后经Na2SO4干燥并真空浓缩。通 过快速柱色谱法(0至100%EtOAc于己烷)在硅胶上纯化残余物,得 到标题化合物,为黄色薄膜(5mg,38%)。1H NMR(500MHz,氯仿 -d)δ8.10(s,1H),7.44(dd,J=8.5,7.1Hz,1H),7.40–7.25(m,5H), 7.12(d,J=7.1Hz,1H),6.84(d,J=8.5Hz,1H),6.71(t,J=5.9Hz, 1H),4.93(dd,J=12.3,5.3Hz,1H),4.51(d,J=5.9Hz,2H),2.93–2.66(m,3H),2.21–2.07(m,1H);计算C20H18N3O4[M+H]+ 364.13 的MS(ESI),实测为364.31。
2-(2,6-二氧代哌啶-3-基)-4-(异丙基氨基)异吲哚啉-1,3-二酮(D-18)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-4-氟异吲哚啉 -1,3-二酮(30mg,0.109mmol),异丙胺(10μL,0.119mmol)和 DIPEA(21μL,0.119mmol),通过快速柱色谱法在硅胶上纯化(),得 到标题化合物,为黄色薄膜(11mg,32%)(0至100%EtOAc于己烷)。 计算C16H18N3O4[M+H]+ 316.13的MS(ESI),实测为316.65。
4-(二乙氨基)-2-(2,6-二氧代哌啶-3-基)异吲哚啉-1,3-二酮(D-21)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-4-氟异吲哚啉 -1,3-二酮(30mg,0.109mmol),二乙胺(11μL,0.130mmol)和 DIPEA(32μL),通过快速柱色谱法(0-100%EtOAc于己烷)在硅胶上 纯化,得到标题化合物,为黄色薄膜(28mg,97%)。计算C17H20N3O4[M+H]+ 330.14的MS(ESI),实测为330.62。
5-(苄基氨基)-2-(2,6-二氧代哌啶-3-基)异吲哚啉-1,3-二酮(D-25)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-5-氟异吲哚啉 -1,3-二酮(30mg,0.109mmol),苄胺(13μL,0.119mmol)和 DIPEA(38μL,0.217mmol),通过快速柱色谱法(0至100%EtOAc 于己烷)在硅胶上纯化,得到标题化合物,为黄色薄膜(6mg,15%)。 计算C20H18N3O4[M+H]+ 364.13的MS(ESI),实测为364.34。
2-(2,6-二氧代哌啶-3-基)-5-(异丙基氨基)异吲哚啉-1,3-二酮(D-26)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-5-氟异二氢吲 哚-1,3-二酮(30mg,0.109mmol),异丙胺(11μL,0.130mmol)和 DIPEA(38μL,0.127mmol),通过快速柱色谱法(0至100%EtOAc 于己烷)在硅胶上纯化,得到标题化合物,为黄色薄膜(6mg,17%)。1H NMR(500MHz,氯仿-d)δ8.00(s,1H),7.53(d,J=8.3Hz,1H), 6.87(d,J=2.1Hz,1H),6.64(dd,J=8.3,2.2Hz,1H),4.86(dd,J= 12.3,5.4Hz,1H),4.30(d,J=7.8Hz,1H),2.86–2.58(m,3H),2.12 –2.01(m,1H),1.26–1.15(m,6H);计算C16H18N3O4[M+H]+ 316.13的MS(ESI),实测为316.30。
5-(二乙氨基)-2-(2,6-二氧代哌啶-3-基)异吲哚啉-1,3-二酮(D-27)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-5-氟异吲哚啉 -1,3-二酮(30mg,0.109mmol),二乙胺(14μL,0.130mmol)和 DIPEA(38μLμL,0.127mmol),通过快速柱色谱法(0至100% EtOAc于己烷)在纯化硅胶上,得到标题化合物,为黄色薄膜(6mg,31%)。1H NMR(500MHz,氯仿-d)δ8.08(s,1H),7.57(d,J=8.6 Hz,1H),6.98(d,J=2.4Hz,1H),6.72(dd,J=8.7,2.4Hz,1H),4.90 –4.80(m,1H),3.40(q,J=7.1Hz,4H),2.89–2.61(m,3H),2.11– 2.01(m,1H),1.16(t,J=7.1Hz,6H);计算C17H20N3O4[M+H]+ 330.14的MS(ESI),实测为330.69。
2-(2,6-二氧代哌啶-3-基)-5-((呋喃-2-基甲基)氨基)异吲哚啉-1,3-二酮 (D-28)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-5-氟异吲哚啉 -1,3-二酮(50mg,0.181mmol),糠胺(18μL,0.199mmol)和 DIPEA(63μL,0.362mmol),通过快速柱色谱法(0至5%MeOH于 CH2Cl2)在硅胶上纯化,得到标题化合物,为黄色薄膜(8mg,13%)。 计算C18H16N3O4[M+H]+ 354.11的MS(ESI),实测为354.25。
(2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氨基)乙基)氨 基甲酸叔丁酯(D-29)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-4-氟异二氢吲 哚-1,3-二酮(50mg,0.181mmol),1-Boc-乙二胺(32mg,0.199 mmol)和DIPEA(63μL,0.362mmol),通过快速柱色谱法(0至10% MeOH于CH2Cl2)在硅胶上纯化后,得到标题化合物,为黄色薄膜(31mg,41%)。1H NMR(500MHz,CDCl3)δ8.08(bs,1H),7.50 (dd,J=8.5,7.1Hz,1H),7.12(d,J=7.1Hz,1H),6.98(d,J=8.5 Hz,1H),6.39(t,J=6.1Hz,1H),4.96–4.87(m,1H),4.83(bs,1H), 3.50–3.41(m,2H),3.41–3.35(m,2H),2.92–2.66(m,3H),2.16– 2.09(m,1H),1.45(s,9H);计算C20H25N4O6[M+H]+ 417.18的MS (ESI),实测为417.58。
(2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-5-基)氨基)乙基) 氨基甲酸叔丁酯(D-30)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-5-氟异二氢吲 哚-1,3-二酮(50mg,0.181mmol),1-Boc-乙二胺(32mg,0.199 mmol)和DIPEA(63μL,0.362mmol),通过快速柱色谱法(0至10% MeOH于CH2Cl2)在硅胶上纯化,得到标题化合物,得到标题化合物, 为黄色薄膜(22mg,29%)。计算C20H25N4O6[M+H]+ 417.18的MS (ESI),实测为417.32。
2-(2,6-二氧代哌啶-3-基)-4-((呋喃-2-基甲基)氨基)异吲哚啉-1,3-二酮 (D-31)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-4-氟异吲哚啉 -1,3-二酮(19.5mg,0.0706mmol),糠胺(7μL,0.078mmol)和 DIPEA(25μL,0.141mmol),通过快速柱色谱法(0至2.5%MeOH 于CH2Cl2)在硅胶上纯化,得到标题化合物,为黄色薄膜(19mg, 76%)。计算C18H16N3O4[M+H]+ 354.11的MS(ESI),实测为 354.27.
3-(5-(苄基氨基)-2-甲基-4-氧代喹唑啉-3(4H)-基)哌啶-2,6-二酮(D-39)
除了将反应混合物加热至170℃而不是90℃之外,按照通用方 法VI,使用3-(5-氟-2-甲基-4-氧代喹唑啉-3(4H)-基)哌啶-2,6-二酮 (30mg,0.104mmol),苄胺(13μL,0.114mmol)和DIPEA(36μL, 0.207mmol),通过快速柱色谱(0至10%MeOH于CH2Cl2)在硅胶上纯化,得到标题化合物,为白色固体(15mg,38%)。1H NMR(500 MHz,氯仿-d)δ8.73(t,J=5.7Hz,1H),8.39(s,1H),7.41(t,J=8.1 Hz,1H),7.39–7.19(m,5H),6.77(d,J=7.7Hz,1H),6.41(d,J= 8.3Hz,1H),4.67(dd,J=11.5,5.9Hz,1H),4.43(d,J=5.7Hz,2H), 3.03–2.79(m,2H),2.72–2.61(m,1H),2.60(s,3H),2.15–2.07 (m,1H);计算C21H21N4O3[M+H]+377.16的MS(ESI),实测为 377.02。
3-(5-(异丙基氨基)-2-甲基-4-氧代喹唑啉-3(4H)-基)哌啶-2,6-二酮(D- 40)
除了将反应混合物加热至170℃而不是90℃之外,按照通用方 法VI,使用3-(5-氟-2-甲基-4-氧代喹唑啉-3(4H)-基)哌啶-2,6-酮(30 mg,0.104mmol),异丙胺(10μL,0.114mmol)和DIPEA(36μL, 0.207mmol),通过快速柱色谱法在硅胶上(0至10%MeOH于CH2Cl2)纯化,,得到标题化合物,为白色固体(5mg,15%)。1H NMR(500MHz,氯仿-d)δ8.31(s,1H),8.21(d,J=7.2Hz,1H), 7.50–7.37(m,1H),6.70(dd,J=7.9,0.9Hz,1H),6.47(d,J=8.4 Hz,1H),4.65(dd,J=11.4,5.9Hz,1H),3.69–3.56(m,1H),3.03– 2.80(m,3H),2.58(s,3H),2.14–2.03(m,1H),1.27(d,J=2.7Hz, 3H),1.26(d,J=2.7Hz,3H);计算C17H21N4O3[M+H]+ 329.16的 MS(ESI),实测为329.97。
2-(2,6-二氧代哌啶-3-基)-4-((2-羟乙基)氨基)异吲哚啉-1,3-二酮(D- 68)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-4-氟异吲哚啉 -1,3-二酮(30mg,0.109mmol),氨基乙醇(7μL,0.119mmol)和 DIPEA(38μL,0.217mmol),通过快速柱色谱法(0至5%MeOH于 CH2Cl2)在硅胶上纯化,得到标题化合物,为黄色薄膜(6mg,18%)。 1HNMR(500MHz,氯仿-d)δ8.26(s,1H),7.50(dd,J=8.5,7.1Hz, 1H),7.12(d,J=7.0Hz,1H),6.95(d,J=8.5Hz,1H),6.50(t,J= 5.9Hz,1H),4.97–4.85(m,1H),3.94–3.79(m,2H),3.47(q,J=5.5Hz,2H),3.03–2.68(m,3H),2.19–2.04(m,1H);计算 C15H16N3O5[M+H]+ 318.11的MS(ESI),实测为318.22。
4-(环丙基氨基)-2-(2,6-二氧代哌啶-3-基)异吲哚啉-1,3-二酮(D47)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-4-氟异二氢吲 哚-1,3-二酮(20mg,0.0724mmol),环丙胺(6μL,0.080mmol)和 DIPEA(25μL,0.141mmol),通过快速柱色谱法(0至5%MeOH于 CH2Cl2)在硅胶上纯化,得到标题化合物,为黄色薄膜(16mg,70%)。 1HNMR(500MHz,氯仿-d)δ8.05(s,1H),7.53(dd,J=8.5,7.1Hz, 1H),7.33–7.21(m,1H),7.15(dd,J=7.1,0.7Hz,1H),6.44(bs, 1H),4.95–4.85(m,1H),2.98–2.66(m,3H),2.62–2.50(m,1H), 2.19–2.06(m,1H),0.92–0.78(m,2H),0.67–0.56(m,2H);计算 C16H16N3O4[M+H]+314.11的MS(ESI),实测为314.54。
4-((2-(1H-吲哚-3-基)乙基)氨基)-2-(2,6-二氧代哌啶-3-基)异吲哚啉- 1,3-二酮(D-48)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-4-氟异吲哚啉 -1,3-二酮(20mg,0.0724mmol),色胺(13mg,0.080mmol)和 DIPEA(25μL,0.144mmol)通过硅胶快速柱色谱法(0至10%MeOH 于CH2Cl2)纯化,得到标题化合物,为黄色薄膜(10mg,33%)。1H NMR(500MHz,氯仿-d)δ8.14(s,1H),8.11(s,1H),7.65–7.55(m, 1H),7.45(dd,J=8.6,7.1Hz,1H),7.37(dt,J=8.2,0.9Hz,1H), 7.21(ddd,J=8.2,7.0,1.2Hz,1H),7.16–7.04(m,3H),6.88(d,J= 8.5Hz,1H),6.34(t,J=5.6Hz,1H),4.89(dd,J=12.4,5.4Hz,1H), 3.59(td,J=6.8,5.5Hz,2H),3.19–3.03(m,2H),2.93–2.64(m, 3H),2.14–2.04(m,1H);计算C23H21N4O4[M+H]+ 417.16的MS (ESI),实测为417.26。
2-(2,6-二氧代哌啶-3-基)-4-((4-羟基苯乙基)氨基)异吲哚啉-1,3-二酮 (D-49)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-4-氟异吲哚啉 -1,3-二酮(20mg,0.0724mmol),酪胺(11mg,0.080mmol)和 DIPEA(25μL,0.144mmol),通过快速柱色谱法(0至5%MeOH于 CH2Cl2)在硅胶上纯化,得到标题化合物,为黄色薄膜(15mg,54%)。 1HNMR(500MHz,氯仿-d)δ8.20(s,1H),7.51(dd,J=8.5,7.1Hz, 1H),7.17–7.08(m,2H),6.90(d,J=8.5Hz,1H),6.85–6.72(m, 2H),4.95–4.90(m,1H),3.52–3.46(m,2H),2.97–2.87(m,2H), 2.86–2.72(m,2H),2.21–2.09(m,1H);计算C21H20N3O5[M+H]+ 394.14的MS(ESI),实测为394.25。
4-((2-(1H-咪唑-2-基)乙基)氨基)-2-(2,6-二氧代哌啶-3-基)异吲哚啉- 1,3-二酮(D-50)
按照通用方法VI,使用2-(2,6-二氧代哌啶-3-基)-4-氟异吲哚啉 -1,3-二酮(20mg,0.0724mmol),组胺(15mg,0.080mmol)和 DIPEA(25μL,0.144mmol),通过快速柱色谱法(0至10%MeOH于 CH2Cl2)在硅胶上纯化,得到标题化合物,为黄色薄膜(5mg,19%)。 1HNMR(500MHz,氯仿-d)δ8.19(s,1H),7.61(d,J=1.2Hz,1H), 7.47(dd,J=8.5,7.1Hz,1H),7.07(d,J=6.9Hz,1H),6.96–6.83 (m,2H),6.39(t,J=5.7Hz,1H),4.97–4.79(m,1H),3.59(q,J= 6.5Hz,2H),2.95(t,J=6.6Hz,2H),2.92–2.62(m,2H),2.16– 2.04(m,1H);;计算C18H18N5O4[M+H]+ 368.14的MS(ESI),实测 为368.47。
通用方法VII:伯胺的酰化
N-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)甲基)环丙烷甲 酰胺(D-22)
在4mL玻璃小瓶中,将4-(氨基甲基)-2-(2,6-二氧代哌啶-3-基) 异吲哚啉-1,3-二酮(25mg,0.087mmol,1当量)和DIPEA(30μL, 0.174mmol,2当量)于MeCN(250μL,0.35M)冷却至0℃。缓慢加 入环丙烷甲酰氯环丙烷假酰氯(8.7μL,0.096mmol),并将反应混合 物在室温搅拌过夜。过滤单离产物,得到标题化合物,为白色固体 (4.8mg,15%),无需进一步纯化即可使用。计算C18H18N3O5 [M+H]+ 356.12的MS(ESI),实测为356.32。
N-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)甲基)乙酰胺 (D-23)
按照通用方法VII,使用4-(氨基甲基)-2-(2,6-二氧代哌啶-3-基) 异吲哚啉-1,3-二酮(25mg,0.087mmol),DIPEA(30μL,0.174 mmol)和乙酰基氯化物(7μL,0.096mmol),得到标题化合物,为白 色固体(4.5mg,16%)。1H NMR(500MHz,DMSO-d6)δ11.13(s, 1H),8.47(t,J=6.0Hz,1H),7.88–7.76(m,2H),7.70(dt,J=7.3, 1.1Hz,1H),5.15(dd,J=12.7,5.4Hz,1H),4.69(d,J=6.0Hz,2H), 2.90(ddd,J=16.8,13.8,5.4Hz,1H),2.64–2.44(m,2H),2.15– 2.01(m,1H),1.92(s,3H);计算C16H16N3O5[M+H]+ 330.11的MS (ESI),实测为330.05。
2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氨基)乙-1-铵- 2,2,2-三氟乙酸盐(D-33)
在搅拌的(2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基) 氨基)乙基)氨基甲酸叔丁酯(205mg,0.492mmol,1当量)于二氯甲 烷(2.25mL)溶液中加入三氟乙酸(0.250mL)。将反应混合物在室温 搅拌4小时,然后真空除去挥发物。得到标题化合物,为黄色固体 (226mg,>95%),其不经进一步纯化即可使用。1H NMR(500 MHz,MeOD)δ7.64(d,J=1.4Hz,1H),7.27–7.05(m,2H),5.10 (dd,J=12.5,5.5Hz,1H),3.70(t,J=6.0Hz,2H),3.50–3.42(m, 2H),3.22(t,J=6.0Hz,1H),2.93–2.85(m,1H),2.80–2.69(m, 2H),2.17–2.10(m,1H);计算C15H17N4O4[M+H]+ 317.12的MS (ESI),实测为317.53。
通用方法VIII:苯酚烷基化
2-(2,6-二氧代哌啶-3-基)-4-((4-(吗啉代甲基)苄基)氧)异吲哚啉-1,3- 二酮(D-45)
在4mL玻璃小瓶中,将2-(2,6-二氧代哌啶-3-基)-4-羟基异吲 哚啉-1,3-二酮(30mg,0.109mmol,1当量)和K2CO3(15mg, 0.109mmol,1当量)于DMF(365μL,0.3M)在室温搅拌。加入4- (4-(溴甲基)苄基)吗啉(30mg,0.109mmol,1当量)于DMF(200μL), 将反应混合物在室温搅拌4天。将反应混合物溶于水(15mL)和 EtOAc(15mL)中,用盐水(3×15mL)洗涤有机层,用Na2SO4干燥并 真空浓缩。通过快速柱色谱法(0至10%MeOH于CH2Cl2)在硅胶上纯化残余物,得到标题化合物,为白色固体(20mg,40%)。1H NMR(500MHz,DMSO-d6)δ11.10(s,1H),7.82(dd,J=8.5,7.2Hz, 1H),7.60(d,J=8.5Hz,1H),7.50–7.42(m,3H),7.35(d,J=8.1 Hz,2H),5.35(s,2H),5.09(dd,J=12.8,5.5Hz,1H),3.64–3.51(m, 4H),3.46(s,2H),2.88(ddd,J=17.0,14.1,5.4Hz,1H),2.63–2.47 (m,2H),2.38–2.31(m,4H),2.07–1.99(m,1H);计算C25H26N3O6 [M+H]+ 464.18的MS(ESI),实测为464.00。
4-(苄氧基)-2-(2,6-二氧代哌啶-3-基)异吲哚啉-1,3-二酮(D-46)
按照通用方法VIII,使用2-(2,6-二氧代哌啶-3-基)-4-羟基异吲 哚啉-1,3-二酮(30mg,0.109mmol),K2CO3(15mg,0.109mmol)和 苄基溴(8μL,0.109mmol),通过快速柱色谱法(0至10%MeOH于 CH2Cl2溶液)在硅胶上纯化后,得到标题化合物,为白色固体(8mg,20%)。1H NMR(500MHz,DMSO-d6)δ11.10(s,1H),7.83(dd,J= 8.5,7.3Hz,1H),7.60(d,J=8.5Hz,1H),7.53–7.50(m,2H),7.47 (d,J=7.2Hz,1H),7.45–7.39(m,2H),7.38–7.32(m,1H),5.38(s, 2H),5.09(dd,J=12.8,5.5Hz,1H),2.88(ddd,J=16.9,13.8,5.5 Hz,1H),2.64–2.46(m,2H),2.07–1.99(m,1H);计算C20H17N2O5 [M+H]+ 365.11的MS(ESI),实测为365.21。
2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氨基)乙基4-甲 基苯磺酸盐(D-44)
在4mL玻璃小瓶中,将2-(2,6-二氧代哌啶-3-基)-4-((2-羟乙基) 氨基)异吲哚啉-1,3-二酮(7mg,0.0221mmol,1当量)和Et3N(3μL, 0.033mmol,1.5当量)于CH2Cl2(200μL)在室温搅拌。加入甲苯磺 酰氯(6mg,0.026mmol,1.2当量)的CH2Cl2(100μL),并将反应混 合物在室温搅拌过夜。将反应混合物真空浓缩,并将残余物通过快速 柱色谱法(0至10%MeOH于CH2Cl2)在硅胶上纯化,得到标题化合 物,为白色固体(4mg,40%)。1H NMR(500MHz,DMSO-d6)δ 11.13(s,1H),7.64–7.59(m,2H),7.46(dd,J=8.6,7.1Hz,1H), 7.33–7.27(m,2H),7.04–6.93(m,2H),6.58(t,J=6.4Hz,1H), 5.09(dd,J=12.7,5.4Hz,1H),4.15(t,J=5.1Hz,2H),3.65–3.52 (m,2H),2.97–2.83(m,1H),2.67–2.46(m,2H),2.27(s,3H),2.12 –2.02(m,1H);计算C22H22N3O7S[M+H]+ 472.12的MS(ESI),实 测为472.39。
(R)-4-羟基-2-(3-甲基-2,6-二氧代哌啶-3-基)异吲哚啉-1,3-二酮(D-52)
将羟基异苯并呋喃-1,3-二酮(147.08mg,0.896mmol,1当量) 加入(R)-3-氨基-3-甲基哌啶-2,6-二酮盐酸(127.32mg,0.896mmol, 1当量)中。然后将吡啶(3.584mL,0.25M)加入混合物中,并将其在 110℃搅拌17小时。将混合物用甲醇稀释,并在减压下浓缩。通过柱色谱(ISCO,24g二氧化硅柱,0至10%MeOH/DCM,25分钟梯 度)纯化粗物质,得到白色油状物(110.9mg,42.63%收率)。1H NMR(400MHz,DMSO-d6)δ10.95(s,1H),7.61(dd,J=8.4,7.2Hz, 1H),7.27–7.14(m,2H),2.73–2.63(m,1H),2.57–2.51(m,1H), 2.04–1.97(m,1H),1.86(s,3H)。
LCMS 289(M+H)。
(S)-4-羟基-2-(3-甲基-2,6-二氧代哌啶-3-基)异吲哚啉-1,3-二酮(D-53)
将4-羟基异苯并呋喃-1,3-二酮(148.99mg,0.907mmol,1当 量)加入(S)-3-氨基-3-甲基哌啶-2,6-二酮盐酸(128.97mg,0.907 mmol,1当量)。然后将吡啶(3.628mL,0.25M)加入混合物中,并 将其在110℃搅拌17小时。将混合物用甲醇稀释,并在减压下浓缩。 通过柱色谱(ISCO,24g二氧化硅柱,0至10%MeOH/DCM,25分 钟梯度)纯化粗物质,得到白色油状物(150mg,57.4%收率)。1H NMR(400MHz,DMSO-d6)δ10.95(s,1H),7.62(dd,J=8.4,7.2Hz,1H),7.27–7.16(m,2H),2.75–2.62(m,1H),2.55(dd,J=14.0,4.3 Hz,1H),2.05–1.96(m,1H),1.86(s,3H).LCMS 289(M+H)。
(S)-2-((2-(3-甲基-2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)氧 基)乙酸(D-55)
向TFA(0.63mL,0.1M)加入(S)-2-((2-(3-甲基-2,6-二氧代哌啶- 3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙酸叔丁酯(25.4mg,0.063 mmol,1当量),并将混合物在50℃搅拌1小时。然后将混合物用 甲醇稀释并在减压下浓缩,得到白色粉末(20.5mg,93.9%收率),其不经进一步纯化而继续使用。1H NMR(500MHz,甲醇-d4)δ7.81 –7.75(m,1H),7.50(d,J=7.3Hz,1H),7.45(d,J=8.6Hz,2H), 7.43–7.37(m,3H),5.09(dd,J=12.8,5.5Hz,1H),4.76(s,2H), 4.63(dd,J=9.1,5.2Hz,1H),3.66–3.55(m,30H),3.51–3.41(m, 5H),2.90–2.83(m,1H),2.79–2.71(m,2H),2.69(s,3H),2.43(s, 3H),2.14(ddt,J=10.5,5.5,3.2Hz,1H),1.69(s,3H).LCMS 347 (M+H)。
(R)-2-((2-(3-甲基-2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基) 氧基)乙酸(D-54)
向TFA(1.78mL,0.1M)加入(R)-2-((2-(3-甲基-2,6-二氧代哌 啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙酸叔丁基酯(71.3mg,0.178 mmol,1当量),并将混合物在50℃搅拌1小时。然后将混合物用甲 醇稀释并在减压下浓缩,得到白色粉末(47.2mg,76.63%收率),其 不经进一步纯化而继续使用。1H NMR(400MHz,甲醇-d4)δ7.72 (ddd,J=8.5,7.3,5.0Hz,1H),7.46–7.42(m,1H),7.30(dd,J=8.6, 4.5Hz,1H),4.94(d,J=5.3Hz,2H),2.81–2.56(m,2H),2.24– 2.07(m,1H),2.00(s,2H),0.90(t,J=6.5Hz,2H).LCMS 347 (M+H)。
4,7-二氯-2-(2,6-二氧代哌啶-3-基)异吲哚啉-1,3-二酮(D-51)
将4,7-二氯异苯并呋喃-1,3-二酮(434.6mg,2.002mmol,1当 量)加入3-氨基哌啶-2,6-二酮盐酸(362.6mg,2.203mmol,1.1当量)。 然后将乙酸钾(609.07mg,6.206mmol,3.1当量)和乙酸(6.67mL, 0.3M)加入混合物中,并将其在90℃搅拌18小时。将混合物冷却至 室温,用去离子水稀释并离心5分钟。将沉淀物用甲醇稀释,并在 减压下浓缩。通过柱色谱(ISCO,12g二氧化硅柱,0至10%MeOH/DCM,25分钟梯度)纯化粗物质,得到白色粉末(160.4mg, 24.5%收率)。1H NMR(500MHz,DMSO-d6)δ11.15(s,1H),7.91 (s,2H),5.17(dd,J=12.9,5.4Hz,1H),2.88(ddd,J=17.2,13.9,5.4 Hz,1H),2.68–2.54(m,1H),2.05(ddd,J=10.5,5.4,2.7Hz,1H). LCMS 328(M+H)。
合成例1:dBET1的合成
(1)JQ-酸的合成
在室温,将JQ1(1.0g,2.19mmol,1当量)溶解在甲酸(11mL, 0.2M)中并搅拌75小时。减压下浓缩混合物,得到黄色固体(0.99g, 定量收率),其不经纯化而使用。1H NMR(400MHz,甲醇-d4)δ7.50 –7.36(m,4H),4.59(t,J=7.1Hz,1H),3.51(d,J=7.1Hz,2H),2.70(s,3H),2.45(s,3H),1.71(s,3H).LCMS 401.33(M+H)。
根据先前公布的方法合成N-(4-氨基丁基)-2-((2-(2,6-二氧代哌 啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯(Fischer et al.,Nature 512(2014):49)。
(2)dBET1的合成
在室温,将JQ-酸(11.3mg,0.0281mmol,1当量)和N-(4-氨 基丁基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基) 乙酰胺三氟乙酸酯(14.5mg,0.0281mmol,1当量)溶解在 DMF(0.28mL,0.1M)中。然后加入DIPEA(14.7微升,0.0843mmol,3当量)和HATU(10.7mg,0.0281mmol,1当量),将混合 物搅拌19小时。然后将混合物通过制备型HPLC纯化,得到 dBET1,为黄色固体(15.90mg,0.0202mmol,72%)。1H NMR(400MHz,甲醇-d4)δ7.77(dd,J=8.3,7.5Hz,1H),7.49(d,J=7.3 Hz,1H),7.47–7.37(m,5H),5.07(dd,J=12.5,5.4Hz,1H),4.74(s, 2H),4.69(dd,J=8.7,5.5Hz,1H),3.43–3.32(m,3H),3.29–3.25 (m,2H),2.87–2.62(m,7H),2.43(s,3H),2.13–2.04(m,1H),1.72 –1.58(m,7H)。13C NMR(100MHz,cd3od)δ174.41,172.33, 171.27,171.25,169.87,168.22,167.76,166.73,166.70,156.26, 138.40,138.23,137.44,134.83,133.92,133.40,132.30,132.28, 131.97,131.50,129.87,121.85,119.31,118.00,69.53,54.90,50.54,40.09,39.83,38.40,32.12,27.74,27.65,23.61,14.42,12.97,11.57. LCMS 785.44(M+H)。
合成例2:dBET4的合成
在室温,将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3- 基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(0.438 mL)的溶液加入(R)-JQ-酸(以与JQ-酸类似的方法从(R)-JQ1制 备)(14.63mg,0.0365mmol,1当量)0.0438mmol 1.2当量)。加入DIPEA(19.1微升,0.1095mmol,3当量)和HATU(15.3mg, 0.0402mmol,1.1当量),将混合物搅拌24小时,然后用MeOH稀 释,并减压下浓缩。通过制备型HPLC纯化粗物质,得到黄色固体(20.64mg,0.0263mmol,72%)。1H NMR(400MHz,甲醇-d4)δ 7.79(dd,J=8.4,7.4Hz,1H),7.51(d,J=7.3Hz,1H),7.47–7.39 (m,5H),5.11–5.06(m,1H),4.75(s,2H),4.68(dd,J=8.8,5.5Hz, 1H),3.47–3.31(m,5H),2.83–2.65(m,7H),2.44(s,3H),2.13– 2.06(m,1H),1.68(s,3H),1.67–1.60(m,4H).13C NMR(100MHz, cd3od)δ174.43,172.40,171.29,169.92,168.24,167.82,166.71, 156.31,153.14,138.38,138.24,137.54,134.88,133.86,133.44, 132.29,132.00,131.49,129.88,122.46,121.90,119.38,118.02, 69.59,54.96,50.55,40.09,39.84,38.45,32.14,27.75,27.65,23.62, 14.41,12.96,11.56.MS 785.48(M+H)。
合成例3:dBET3的合成
在室温,将0.1M N-(2-氨基乙基)-2-((2-(2,6-二氧代哌啶-3- 基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(0.475 mL,0.0475mmol,1.2当量)的溶液加入Q-酸(15.86mg,0.0396 mmol,1当量)。然后加入DIPEA(20.7微升,0.1188mmol,3当量) 和HATU(16.5mg,0.0435mmol,1.1当量),将混合物搅拌24小时, 然后通过制备型HPLC纯化,得到黄色固体(22.14mg,0.0292 mmol,74%)。1H NMR(400MHz,甲醇-d4)δ7.82–7.75(m,1H),7.52–7.32(m,6H),5.04(dd,J=11.6,5.5Hz,1H),4.76(d,J=3.2 Hz,2H),4.66(d,J=6.6Hz,1H),3.58–3.35(m,6H),2.78–2.58 (m,6H),2.48–2.41(m,3H),2.11–2.02(m,1H),1.70(d,J=11.8 Hz,3H)。13C NMR(100MHz,cd3od)δ174.38,171.26,171.19, 170.26,168.86,168.21,167.76,166.72,156.27,153.14,138.44, 138.36,138.19,134.87,133.71,132.31,131.57,131.51,129.90, 129.86,121.81,119.36,117.95,69.48,54.83,50.52,40.09,39.76, 38.30,32.09,23.63,14.40,11.61.LCMS 757.41(M+H)。
合成例4:dBET5的合成
在室温,将0.1M N-(6-氨基己基)-2-((2-(2,6-二氧代哌啶-3- 基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯在DMF中的溶 液(0.247mL,0.0247mmol,1当量)加入JQ-酸(9.9mg,0.0247 mmol,1当量)中。然后加入DIPEA(12.9微升,0.0741mmol,3当 量)和HATU(9.4mg,0.0247mmol,1当量)。将混合物搅拌21小 时,然后用MeOH稀释并减压下浓缩。通过制备型HPLC纯化粗物 质,得到黄色固体(13.56mg,0.0167mmol,67%)。1H NMR(400MHz,甲醇-d4)δ7.82–7.78(m,1H),7.53(dd,J=7.3,2.0Hz,1H), 7.49–7.37(m,5H),5.10(dt,J=12.4,5.3Hz,1H),4.76(s,2H), 4.70(dd,J=8.7,5.5Hz,1H),3.42–3.33(m,2H),3.25(dt,J=12.3, 6.0Hz,3H),2.87–2.67(m,7H),2.48–2.42(m,3H),2.14–2.09(m, 1H),1.69(d,J=4.8Hz,3H),1.58(s,4H),1.42(d,J=5.2Hz,4H)。 13C NMR(100MHz,cd3od)δ174.51,171.31,171.26,169.82,168.27, 168.26,167.75,156.26,150.46,138.20,134.92,133.92,133.47, 132.34,132.01,131.52,129.88,121.69,119.34,117.95,111.42, 69.39,54.97,50.56,40.39,40.00,38.40,32.15,30.46,30.16,27.58, 27.48,23.64,14.41,12.96,11.55.LCMS 813.38。
合成例5:dBET6的合成
在室温,将0.1M N-(8-氨基辛基)-2-((2-(2,6-二氧代哌啶-3- 基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(0.191 mL,0.0191mmol,1当量)的溶液下,将)加入JQ-酸(7.66mg, 0.0191mmol,1当量)中。加入DIPEA(10微升,0.0574mmol,3当 量)和HATU(7.3mg,0.0191mmol,1当量),将混合物搅拌22小时, 用MeOH稀释,并减压下浓缩。通过制备型HPLC纯化粗物质,得 到奶油色固体。(8.53mg,0.0101mmol,53%)。1H NMR(400 MHz,甲醇-d4)δ7.80(dd,J=8.4,7.4Hz,1H),7.53(d,J=7.4Hz, 1H),7.49–7.36(m,5H),5.10(dt,J=12.3,5.3Hz,1H),4.75(s,2H), 4.69(dd,J=8.8,5.3Hz,1H),3.42(dd,J=15.0,8.9Hz,1H),3.30– 3.18(m,4H),2.90–2.64(m,7H),2.45(s,3H),2.13(dtt,J=10.8, 5.2,2.6Hz,1H),1.71(d,J=4.4Hz,3H),1.56(d,J=6.2Hz,4H), 1.33(d,J=17.1Hz,8H)。13CNMR(100MHz,cd3od)δ174.50, 172.38,171.30,169.81,168.28,167.74,166.64,156.25,138.38, 138.20,137.55,134.92,133.88,133.42,132.27,132.02,131.50, 129.85,121.66,119.30,117.95,69.37,55.01,50.58,40.51,40.12, 38.44,32.18,30.46,30.33,30.27,30.21,27.91,27.81,23.63,14.42, 12.96,11.55.LCMS 841.64(M+H)。
合成例6:dBET9的合成
在室温,将0.1M N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙 基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰 胺三氟乙酸酯于DMF(0.321mL,0.0321mmol,1当量)的溶液,加 入JQ-酸(12.87mg,0.0321mmol,1当量)。加入DIPEA(16.8微升, 0.0963mmol,3当量)和HATU(12.2mg,0.0321mmol,1当量), 将混合物搅拌24小时,用MeOH稀释,并减压下浓缩。通过制备 型HPLC纯化粗物质,得到黄色油状物。(16.11mg,0.0176mmol, 55%)。
1H NMR(400MHz,甲醇-d4)δ7.79(dd,J=8.4,7.4Hz,1H),7.52(d, J=7.2Hz,1H),7.49–7.36(m,5H),5.10(dd,J=12.5,5.5Hz,1H), 4.78–4.67(m,3H),3.64–3.52(m,11H),3.48–3.32(m,6H),2.94 –2.64(m,7H),2.52–2.43(m,3H),2.18–2.08(m,1H),1.81(p,J=6.3Hz,4H),1.73–1.67(m,3H).LCMS 918.45(M+H)。
合成例7:dBET17的合成
在室温,将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3- 基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF的溶液 (0.281mL,0.0281mmol,1当量)加入(S)-2-(4-(4-氰基苯基)-2,3,9- 三甲基-6H-噻吩并[3,2-f][1,2,4]***并[4,3-a][1,4]二氮杂环庚三烯- 6-基)乙酸(11mg,0.0281mmol,1当量)。加入DIPEA(14.7微升,0.0843mmol,3当量)和HATU(10.7mg,0.0281mmol,1当量), 将混合物搅拌24小时,用EtOAc稀释,用饱和碳酸氢钠,水和盐水 洗涤。将有机层用硫酸钠干燥,过滤并浓缩。通过柱色谱(ISCO, 4g硅胶柱0至10%MeOH/DCM)纯化,得到白色固体(14.12mg, 0.0182mmol,65%)。
1H NMR(400MHz,甲醇-d4)δ7.82–7.72(m,3H),7.61(dd,J=8.5, 2.0Hz,2H),7.51(d,J=7.9Hz,1H),7.44–7.40(m,1H),5.11– 5.05(m,1H),4.76(s,2H),4.66(dd,J=9.0,5.1Hz,1H),3.48–3.32 (m,4H),3.30–3.23(m,1H),2.87–2.61(m,7H),2.43(s,3H),2.10(dt,J=10.7,5.2Hz,1H),1.70–1.59(m,7H).13C NMR(100MHz, cd3od)δ174.42,172.65,171.27,169.92,168.25,167.80,165.88, 156.31,143.55,138.24,134.88,133.92,133.50,133.39,131.72, 131.46,130.55,121.93,119.39,119.21,118.02,115.17,69.59,55.50, 50.55,40.10,39.83,38.86,32.11,27.78,27.67,23.62,14.41,12.91,11.64.LCMS 776.39(M+H)。
合成例8:dBET15的合成
将N-(6-氨基己基)-2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚 啉-5-甲酰胺三氟乙酸盐(13.29mg,0.258mmol,1当量)和JQ-酸 (10.3mg,0.0258mmol,1当量)溶于DMF(0.26mL)中。加入 DIPEA(13.5微升,0.0775mmol,3当量),然后加入HATU(9.8mg,0.0258mmol,1当量),并将混合物在室温搅拌。24小时后,将该物 质用DCM稀释,并通过柱色谱(ISCO,0至15%MeOH/DCM)纯化, 然后通过制备型HPLC纯化,得到浅黄色固体(11.44mg,0.0146 mmol,57%)。
1H NMR(400MHz,甲醇-d4)δ8.29–8.23(m,2H),7.93(dd,J=8.1, 4.2Hz,1H),7.50–7.34(m,4H),5.17–5.11(m,1H),4.75–4.69(m, 1H),3.53–3.32(m,6H),3.25(dd,J=13.8,6.7Hz,1H),2.90–2.67 (m,6H),2.49–2.38(m,3H),2.18–2.10(m,1H),1.64(d,J=22.4 Hz,6H),1.47(s,4H).13C NMR(100MHz,cd3od)δ174.48,171.17, 168.05,168.03,167.99,167.70,166.63,141.81,138.40,137.47, 135.09,134.77,134.74,133.96,133.94,133.38,132.24,132.05, 131.44,129.85,124.57,123.12,123.09,54.98,50.78,40.88,40.08, 38.37,32.13,30.40,30.23,27.34,27.26,23.58,14.40,12.96,11.54. LCMS783.43(M+H).
合成例9:dBET2的合成
(1)(R)-4-((8-环戊基-7-乙基-5-甲基-6-氧代-5,6,7,8-四氢蝶啶-2-基)氨基)-3-甲氧基苯甲酸乙酯的合成
将(R)-2-氯-8-环戊基-7-乙基-5-甲基-7,8-二氢蝶啶-6(5H)-酮 (44.2mg,0.15mmol,1当量),4-氨基-3-甲氧基苯甲酸乙酯(35.1 mg,0.18mmol,1.2当量),Pd2dba3(6.9mg,0.0075mmol, 5mol%),XPhos(10.7mg,0.0225mmol,15mol%)和碳酸钾(82.9 mg,0.60mmol,4当量)溶于tBuOH(1.5mL,0.1M)中,并加热至 100℃。21小时后,将混合物冷却至室温,通过硅藻土过滤,用 DCM洗涤并减压下浓缩。通过柱色谱(ISCO,4g硅胶柱,0至100%EtOAc/己烷,经18分钟梯度)纯化,得到黄色油状物(52.3mg, 0.115mmol,77%)。1H NMR(400MHz,氯仿-d)δ8.57(d,J=8.5 Hz,1H),7.69(td,J=6.2,2.9Hz,2H),7.54(d,J=1.8Hz,1H),4.52 (t,J=7.9Hz,1H),4.37(q,J=7.1Hz,2H),4.23(dd,J=7.9,3.7Hz, 1H),3.97(s,3H),3.33(s,3H),2.20–2.12(m,1H),2.03–1.97(m, 1H),1.86(ddd,J=13.9,7.6,3.6Hz,4H),1.78–1.65(m,4H),1.40 (t,J=7.1Hz,3H),0.88(t,J=7.5Hz,3H).LCMS454.32(M+H)。
(2)(R)-4-((8-环戊基-7-乙基-5-甲基-6-氧代-5,6,7,8-四氢蝶啶-2-基)氨基)-3-甲氧基苯甲酸的合成
将(R)-4-((8-环戊基-7-乙基-5-甲基-6-氧代-5,6,7,8-四氢蝶啶-2- 基)氨基)-3-甲氧基苯甲酸乙酯(73.8mg,0.163mmol,1当量)和 LiOH(11.7mg,0.489mmol,3当量)溶于MeOH(0.82mL)、 THF(1.63mL)和水(0.82mL)中。20小时后,再加入0.82mL水, 将混合物再搅拌24小时,然后通过制备型HPLC纯化,得到奶油色 固体(53mg,0.125mmol,76%)。1H NMR(400MHz,甲醇-d4)δ 7.97(d,J=8.4Hz,1H),7.67(dd,J=8.3,1.6Hz,1H),7.64–7.59 (m,2H),4.38(dd,J=7.0,3.2Hz,1H),4.36–4.29(m,1H),3.94(s, 3H),3.30(s,3H),2.13–1.98(m,2H),1.95–1.87(m,2H),1.87– 1.76(m,2H),1.73–1.57(m,4H),0.86(t,J=7.5Hz,3H).13C NMR (100MHz,cd3od)δ168.67,163.72,153.59,150.74,150.60,130.95, 127.88,125.97,123.14,121.68,116.75,112.35,61.76,61.66,56.31, 29.40,29.00,28.68,28.21,23.57,23.41,8.69.LCMS 426.45(M+H)。
(3)dBET2的合成
在室温,将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3- 基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(0.183 mL,0.0183mmol,1.2当量)的溶液加入(R)-4-((8-环戊基-7-乙基-5- 甲基-6-氧代-5,6,7,8-四氢蝶啶-2-基)氨基)3-甲氧基苯甲酸(6.48mg, 0.0152mmol,1当量)。加入DIPEA(7.9微升,0.0456mmol,3当 量)和HATU(6.4mg,0.0168mmol,1.1当量),将混合物搅拌23小 时,然后通过制备型HPLC纯化,得到黄色固体(9.44mg,0.0102 mmol,67%)。1H NMR(400MHz,甲醇-d4)δ7.84–7.77(m,2H), 7.58(d,J=1.8Hz,2H),7.53–7.46(m,2H),7.42(d,J=8.4Hz, 1H),5.11–5.05(m,1H),4.76(s,2H),4.48(dd,J=6.5,3.1Hz,1H), 4.33–4.24(m,1H),3.95(s,3H),3.49–3.35(m,4H),2.97(d,J= 10.5Hz,3H),2.89–2.65(m,5H),2.17–1.99(m,4H),1.89(dd,J= 14.5,7.3Hz,2H),1.69–1.54(m,6H),1.36(dt,J=7.6,3.9Hz,1H), 0.85(t,J=7.5Hz,3H)。13C NMR(100MHz,cd3od)δ176.52, 174.48,173.05,171.34,169.99,168.91,168.25,167.80,164.58,156.34,154.48,153.10,150.63,138.22,134.89,133.96,129.53, 123.93,121.87,120.78,119.36,117.99,111.54,69.55,63.29,63.10, 56.68,50.55,40.71,39.86,32.15,29.43,29.26,28.73,28.63,27.81, 27.77,24.25,23.63,8.47.LCMS 810.58(M+H)。
合成例10:dBET7的合成
在室温,将0.1M N-(6-氨基己基)-2-((2-(2,6-二氧代哌啶-3- 基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(0.186 mL,将0.0186mmol 1当量)的溶液加入(R)-4-((8-环戊基-7-乙基-5- 甲基-6-氧代-5,6,7,8-四氢蝶啶-2-基)氨基)-3-甲氧基苯甲酸(7.9mg, 0.0186mmol,1当量)。加入DIPEA(9.7微升,0.0557mmol,3当 量)和HATU(7.1mg,0.0186mmol,1当量),将混合物搅拌19小时, 然后通过制备型HPLC纯化,得到所需的三氟乙酸盐,为黄色固体 (13.62mg,0.0143mmol,77%)。
1H NMR(400MHz,甲醇-d4)δ7.80(t,J=8.3Hz,2H),7.61–7.57 (m,2H),7.55–7.49(m,2H),7.42(d,J=8.4Hz,1H),5.13(dd,J= 12.6,5.5Hz,1H),4.75(s,2H),4.48(dd,J=6.5,3.2Hz,1H),4.33–4.24(m,1H),3.97(s,3H),3.40(t,J=7.1Hz,2H),3.34(d,J=6.7Hz,2H),3.30(s,3H),2.98(d,J=8.5Hz,1H),2.89–2.82(m,1H), 2.79–2.63(m,3H),2.17–2.00(m,4H),1.91(dt,J=14.4,7.1Hz, 3H),1.61(dt,J=13.4,6.6Hz,7H),1.47–1.41(m,3H),0.86(t,J= 7.5Hz,3H).13C NMR(100MHz,cd3od)δ174.54,171.37,169.84, 168.84,168.27,167.74,164.59,156.26,154.47,153.18,150.69, 138.19,134.91,134.05,129.47,124.78,124.01,121.65,120.77, 119.29,117.92,117.86,111.55,69.34,63.31,63.13,56.67,50.53, 40.97,39.96,32.16,30.42,30.19,29.42,29.26,28.72,28.62,27.65, 27.46,24.26,23.65,8.47.LCMS 838.60(M+H).
合成例11:dBET8的合成
在室温,将0.1M N-(8-氨基辛基)-2-((2-(2,6-二氧代哌啶-3- 基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(0.186 mL,0.0186mmo,1当量)的溶液加入(R)-4-((8-环戊基-7-乙基-5-甲 基-6-氧代-5,6,7,8-四氢蝶啶-2-基)氨基)-3-甲氧基苯甲酸(7.9mg, 0.0186mmol,1当量)。加入DIPEA(9.7微升,0.0557mmol,3当 量)和HATU(7.1mg,0.0186mmol,1当量),将混合物搅拌16小时, 然后通过制备型HPLC纯化,得到所需的三氟乙酸酯,作为米白色 固体(7.15mg,0.007296mmol,39%)。
1H NMR(400MHz,甲醇-d4)δ7.83–7.77(m,2H),7.61–7.56(m, 2H),7.55–7.50(m,2H),7.42(d,J=8.5Hz,1H),5.13(dd,J=12.6, 5.5Hz,1H),4.75(s,2H),4.49(dd,J=6.6,3.3Hz,1H),4.33–4.24 (m,1H),3.97(s,3H),3.39(t,J=7.1Hz,2H),3.34–3.32(m,2H),3.30(s,3H),3.01–2.83(m,2H),2.82–2.65(m,3H),2.17–2.01 (m,4H),1.91(dt,J=14.2,7.4Hz,1H),1.68–1.54(m,7H),1.37(s, 7H),0.86(t,J=7.5Hz,3H)。13C NMR(100MHz,cd3od)δ174.52, 171.35,169.81,168.85,168.28,167.74,164.58,156.27,154.47,153.89,150.64,138.19,134.93,134.18,129.52,129.41,124.91, 123.83,121.67,120.76,119.31,117.95,117.89,111.57,69.37,63.37, 63.17,56.67,50.58,41.12,40.12,32.19,30.43,30.28,30.22,30.19, 29.40,29.25,28.71,28.62,27.94,27.75,24.29,23.65,8.46.LCMS 866.56(M+H)。
合成例12:dBET10的合成
在室温,将0.1M N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙 基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-甲基-1-氧基) 乙酰胺三氟乙酸酯于DMF(0.172mL,0.0172mmol,1当量)的溶液 加入(R)-4-((8-环戊基-7-乙基-5-甲基-6-氧代-5,6,7,8-四氢蝶啶-2-基) 氨基)-3-甲氧基苯甲酸(7.3mg,0.0172mmol,1当量)。加入 DIPEA(9.0微升,0.0515mmol,3当量)和HATU(6.5mg,0.0172 mmol,1当量),将混合物搅拌23小时,然后通过制备型HPLC纯 化,得到所需的三氟乙酸盐,作为关闭白油(10.7mg,0.0101mmol,59%)。
1H NMR(400MHz,甲醇-d4)δ7.78(d,J=8.3Hz,1H),7.75(dd,J= 8.4,7.4Hz,1H),7.56–7.51(m,2H),7.49–7.44(m,2H),7.36(d,J =8.4Hz,1H),5.08(dd,J=12.4,5.4Hz,1H),4.69(s,2H),4.44(dd, J=6.7,3.2Hz,1H),4.30–4.21(m,1H),3.92(s,3H),3.59–3.42(m,12H),3.35(t,J=6.7Hz,2H),3.25(s,3H),2.95–2.64(m,5H), 2.13–1.95(m,4H),1.91–1.71(m,7H),1.65–1.48(m,4H),0.81(t, J=7.5Hz,3H)。13C NMR(100MHz,cd3od)δ174.50,171.35, 169.83,168.77,168.25,167.68,164.57,156.26,154.47,153.05, 150.59,138.19,134.92,133.89,129.53,124.57,123.98,121.72, 120.75,119.26,117.95,117.86,111.54,71.51,71.46,71.28,71.20, 70.18,69.65,69.41,63.27,63.07,56.71,50.57,38.84,37.59,32.17, 30.41,30.32,29.46,29.26,28.73,28.64,24.27,23.65,8.49.LCMS 942.62(M+H)。
合成例13:dBET16的合成
在室温,将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3-基)- 1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(0.402mL, 0.0402mmol,1当量)的溶液加入(R)-4-((4-环戊基-1,3-二甲基-2-氧 代-1,2,3,4-四氢吡啶并[2,3-b]吡嗪-6-基)氨基)-3-甲氧基苯甲酸(16.55 mg,0.0402mmol,1当量)。加入DIPEA(21微升,0.1206mmol, 3当量)和HATU(15.3mg,0.0402mmol,1当量),将混合物搅拌 21小时,然后通过制备型HPLC纯化,然后进行柱色谱(ISCO,12g) NH2-硅胶柱,0至15%MeOH/DCM,20分钟梯度),得到HPLC, 以得到棕色固体(10.63mg,0.0134mmol,33%)。
1H NMR(400MHz,甲醇-d4)δ8.22(d,J=8.4Hz,1H),7.78(dd,J= 8.4,7.4Hz,1H),7.73–7.68(m,1H),7.49(d,J=7.4Hz,2H),7.46 –7.39(m,2H),6.98(d,J=8.8Hz,1H),5.97–5.87(m,1H),5.06 (dd,J=12.6,5.4Hz,1H),4.76(s,2H),3.98(s,3H),3.61(s,2H),3.44–3.36(m,4H),2.92(s,1H),2.78(dd,J=14.3,5.2Hz,1H), 2.68(ddd,J=17.7,8.2,4.5Hz,2H),2.36–2.26(m,2H),2.10– 1.90(m,5H),1.76–1.62(m,6H),1.31(d,J=16.0Hz,4H).LCMS 795.38(M+H)。
合成例14:dBET11的合成
(1)4-((5,11-二甲基-6-氧代-6,11-二氢-5H-苯并[e]嘧啶并[5,4- b][1,4]二氮杂环庚三烯-2-基)氨基)-3-甲氧基苯甲酸乙酯的合成
将2-氯-5,11-二甲基-5H-苯并[e]嘧啶并[5,4-b][1,4]二氮杂环庚 三烯-6(11H)-酮(82.4mg,0.30mmol,1当量),4-氨基-3-甲氧基苯 甲酸乙酯(70.3mg,0.36mmol,1.2当量)Pd2dba3(13.7mg,0.015 mmol,5mol%),XPhos(21.5mg,0.045mmol,15mol%)和碳酸钾 (166mg,1.2mmol,4当量)溶于tBuOH(3.0mL)中并加热至100℃。 17小时后,将混合物冷却至室温并通过硅藻土过滤。通过柱色谱(ISCO,12g硅胶柱,0至100%EtOAc/己烷,19分钟梯度)纯化混合 物,得到灰白色固体(64.3mg,0.148mmol,49%)。
1H NMR(400MHz,50%cd3od/cdcl3)δ8.51(d,J=8.5Hz,1H), 8.17(s,1H),7.73(ddd,J=18.7,8.1,1.7Hz,2H),7.52(d,J=1.8 Hz,1H),7.46–7.41(m,1H),7.15–7.10(m,2H),4.34(q,J=7.1 Hz,4H),3.95(s,3H),3.47(s,3H),3.43(s,3H),1.38(t,J=7.1Hz,3H).13C NMR(100MHz,50%cd3od/cdcl3)δ169.28,167.39,164.29, 155.64,151.75,149.73,147.45,146.22,133.88,133.18,132.37, 126.44,124.29,123.70,123.36,122.26,120.58,118.05,116.83, 110.82,61.34,56.20,38.62,36.25,14.51.LCMS 434.33(M+H).
(2)4-((5,11-二甲基-6-氧代-6,11-二氢-5H-苯并[e]嘧啶并[5,4- b][1,4]二氮杂环庚三烯-2-基)氨基)-3-甲氧基苯甲酸的合成
将4-((5,11-二甲基-6-氧代-6,11-二氢-5H-苯并[e]嘧啶并[5,4- b][1,4]二氮杂环庚三烯-2-基)氨基)-3-甲氧基苯甲酸乙酯(108.9mg, 0.251mmol,1当量)和LiOH(18mg)溶解在THF(2.5mL)和水(1.25 mL)中。24小时后,加入MeOH(0.63mL)以改善溶解度)并再搅拌 24小时,然后用MeOH稀释,并通过制备型HPLC纯化,得到浅黄 色固体(41.31mg)。
1H NMR(400MHz,甲醇-d4)δ8.51(d,J=8.5Hz,1H),8.22(s,1H), 7.73(ddd,J=11.8,8.1,1.7Hz,2H),7.57(d,J=1.8Hz,1H),7.49– 7.44(m,1H),7.19–7.11(m,2H),3.97(s,3H),3.48(s,3H),3.45(s, 3H)。LCMS 406.32(M+H)。
(3)dBET11的合成
在室温,将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3-基)- 1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(0.190mL, 0.0190mmol,1当量)的溶液加入4-((5,11-二甲基-6-氧代-6,11-二 氢-5H-苯并[e]嘧啶并[5,4-b][1,4]二氮杂环庚三烯-2-基)氨基)-3-甲氧 基苯甲酸(7.71mg,0.0190mmol,1当量)。加入DIPEA(9.9微升,0.0571mmol,3当量)和HATU(7.2mg,0.0190mmol,1当量),将 混合物搅拌22小时,然后通过制备型HPLC纯化,得到HPLC,得 到所需的三氟乙酸盐,为奶油色固体(6.72mg,0.00744mmol, 39%)。
1H NMR(400MHz,甲醇-d4)δ8.46(d,J=8.3Hz,1H),8.21(s,1H), 7.79–7.73(m,2H),7.52(d,J=7.1Hz,1H),7.50–7.43(m,3H), 7.33(d,J=8.2Hz,1H),7.15(dd,J=7.7,5.9Hz,2H),4.98(dd,J= 12.0,5.5Hz,1H),4.69(s,2H),3.97(s,3H),3.49(s,3H),3.46–3.34 (m,7H),2.81–2.67(m,3H),2.13–2.08(m,1H),1.69(dt,J=6.6, 3.5Hz,4H).13C NMR(100MHz,cd3od)δ173.40,170.10,169.68, 169.00,168.85,167.60,167.15,164.77,156.01,155.42,151.83, 150.03,148.21,137.82,134.12,133.48,132.58,132.52,128.11, 126.72,124.54,122.33,121.06,120.63,118.77,118.38,117.94, 117.62,109.67,68.90,56.33,49.96,40.16,39.48,38.72,36.34, 31.82,27.24,23.16.LCMS790.48(M+H)。
合成例15:dBET12的合成
在室温,将0.1M N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙 基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉)4-甲基-1-氧基) 乙酰胺三氟乙酸酯于DMF(0.186mL,0.0186mmol,1当量)的溶液 加入4-((5,11-二甲基-6-氧代-6,11-二氢-5H-苯并[e]嘧啶并[5,4- b][1,4]二氮杂环庚三烯-2-基)氨基)-3-甲氧基苯甲酸(7.53mg,0.0186mmol,1当量)。加入DIPEA(9.7微升,0.0557mmol,3当量)和 HATU(7.1mg,0.0186mmol,1当量),将混合物搅拌22小时,然 后通过制备型HPLC纯化,得到HPLC,得到所需的三氟乙酸盐,为 奶油色固体(7.50mg,0.00724mmol,39%)。
1H NMR(400MHz,甲醇-d4)δ8.46(d,J=8.9Hz,1H),8.21(s,1H), 7.73(dd,J=15.2,7.8Hz,2H),7.50–7.42(m,3H),7.28(d,J=8.5 Hz,1H),7.15(t,J=7.7Hz,2H),5.01(dd,J=11.8,5.8Hz,1H), 4.68(s,2H),3.97(s,3H),3.67–3.58(m,7H),3.58–3.43(m,10H), 3.39(t,J=6.8Hz,2H),3.35(s,2H),2.97(s,1H),2.84–2.70(m, 3H),2.16–2.07(m,1H),1.93–1.76(m,4H).LCMS 922.57(M+H).
合成例16:dBET13的合成
将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代 异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(0.501mL,0.0501 mmol 1当量)的溶液加入2-((2-(4-(3,5-二甲基异恶唑-4-基)苯基)咪唑 并[1,2-a]吡嗪-3-基)氨基)乙酸(如在McKeown etal.,J.Med.Chem, 2014,57,9019中所合成的)(18.22mg,0.0501mmol,1当量)在室 温合成。加入DIPEA(26.3微升,0.150mmol,3当量)和 HATU(19.0mg,0.0501mmol,1当量),将混合物搅拌21小时,然 后通过制备型HPLC纯化,得到HPLC,得到所需的三氟乙酸盐,为 深黄色油状物(29.66mg,0.0344mmol,69%)。1H NMR(400MHz, 甲醇-d4)δ9.09(s,1H),8.65(d,J=5.2Hz,1H),8.14–8.06(m,2H), 7.94–7.88(m,1H),7.80–7.74(m,1H),7.59–7.47(m,3H),7.40 (dd,J=8.4,4.7Hz,1H),5.11–5.06(m,1H),4.72(d,J=9.8Hz, 2H),3.90(s,2H),3.25–3.22(m,1H),3.12(t,J=6.4Hz,1H),2.96 (s,2H),2.89–2.79(m,1H),2.76–2.62(m,2H),2.48–2.42(m, 3H),2.29(s,3H),2.10(ddq,J=10.2,5.3,2.7Hz,1H),1.49–1.45 (m,2H),1.37(dd,J=6.7,3.6Hz,2H).13C NMR(100MHz,cd3od) δ174.45,171.98,171.35,169.88,168.17,167.85,167.40,159.88, 156.28,141.82,138.26,135.85,134.82,133.09,132.06,130.75, 129.67,122.07,121.94,119.30,118.98,118.06,117.24,69.56,50.56, 40.05,39.73,32.13,27.53,23.62,18.71,17.28,11.64,10.85.LCMS 748.49(M+H)。
合成例17:dBET14的合成
在室温,将0.1M N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙 基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)氧基)乙酰 胺三氟乙酸盐于DMF(0.510mL,0.0510mmol,1当量)溶液加入2 -((2-(4-(3,5-二甲基异恶唑-4-基)苯基)咪唑并[1,2-α]吡嗪-3-基)氨基) 乙酸(如McKeown et al.,J.Med.Chem,2014,57,9019中合成)(18.52mg,0.0510mmol,1当量)。加入DIPEA(26.6微升, 0.153mmol,3当量)和HATU(19.4mg,0.0510mmol,1当量),将 混合物搅拌22小时,然后通过制备型HPLC纯化,得到HPLC,得 到所需的三氟乙酸盐,为深黄色油状物(32.63mg,0.0328mmol, 64%)。
1H NMR(400MHz,甲醇-d4)δ9.09(s,1H),8.66(d,J=5.4Hz,1H), 8.17–8.08(m,2H),7.92(d,J=5.6Hz,1H),7.77(dd,J=8.4,7.4 Hz,1H),7.60–7.47(m,3H),7.39(d,J=8.4Hz,1H),5.09(dd,J= 12.4,5.5Hz,1H),4.71(s,2H),3.91(s,2H),3.62–3.46(m,10H),3.38(dt,J=16.0,6.4Hz,3H),3.18(t,J=6.8Hz,2H),2.97(s,1H), 2.89–2.81(m,1H),2.78–2.66(m,2H),2.47(s,3H),2.31(s,3H), 2.16–2.08(m,1H),1.79(dt,J=12.8,6.5Hz,2H),1.64(t,J=6.3 Hz,2H).13C NMR(100MHz,cd3od)δ174.48,171.88,171.34, 169.80,168.22,167.69,167.42,159.87,156.24,141.87,138.21, 135.89,134.88,133.13,132.04,130.76,129.67,122.08,121.69, 119.20,117.94,117.23,71.44,71.22,71.10,69.92,69.62,69.38, 50.57,49.64,38.11,37.55,32.16,30.30,30.20,23.63,11.67,10.88. LCMS 880.46(M+H)。
合成例18:dBET18的合成
(1)(S)-4-(3-(2-(4-(4-氯苯基)-2,3,9-三甲基-6H-噻吩并[3,2-f][1,2,4]***并[4,3-α][1,4]二氮杂环庚三烯-6-基)乙酰氨基)丙基)哌嗪-1-羧酸叔 丁酯的合成
在室温,将JQ-酸(176.6mg,0.441mmol,1当量)溶于 DMF(4.4mL)。加入HATU(176mg,0.463mmol,1.05当量),然 后加入DIPEA(0.23mL),1.32mmol,3当量)。10分钟后,加入4- (3-氨基丙基)哌嗪-1-羧酸叔丁酯(118mg,0.485mmol,1.1当量)的 DMF(0.44mL)溶液。24小时后,将混合物用半饱和碳酸氢钠稀释, 用DCM萃取两次,用EtOAc萃取一次。将合并的有机层用硫酸钠 干燥,过滤并浓缩。通过柱色谱法纯化(ISCO,24g硅胶柱,0-15%MeOH/DCM,23分钟梯度),得到黄色油状物(325.5mg,定量收率)。 1H NMR(400MHz,氯仿-d)δ7.67(t,J=5.3Hz,1H),7.41–7.28 (m,4H),4.58(dd,J=7.5,5.9Hz,1H),3.52–3.23(m,8H),2.63(s, 9H),2.37(s,3H),1.80–1.69(m,2H),1.64(s,3H),1.42(s,9H).13C NMR(100MHz,cdcl3)δ171.41,164.35,155.62,154.45,150.20, 136.92,136.64,132.19,131.14,130.98,130.42,129.98,128.80, 80.24,56.11,54.32,52.70,38.96,37.85,28.42,25.17,14.43,13.16, 11.82.LCMS 626.36(M+H)。
(2)(S)-2-(4-(4-氯苯基)-2,3,9-三甲基-6H-噻吩并[3,2-f][1,2,4]***并 [4,3-a][1,4]二氮杂环庚三烯-6-基)-N-(3-(哌嗪-1-基)丙基)乙酰胺的 合成
将(S)-4-(3-(2-(4-(4-氯苯基)-2,3,9-三甲基-6H-噻吩并[3,2-f] [1,2,4]***并[4,3-a][1,4]二氮杂环庚三烯-6-基)乙酰氨基)丙基)哌嗪- 1-羧酸叔丁酯(325.5mg)溶于DCM(5mL)和MeOH(0.5mL)。加入 4M HCl的二恶烷溶液(1mL),将混合物搅拌16小时,然后在氮气 流下浓缩,得到黄色固体(231.8mg),其无需进一步纯化即可使用。
1H NMR(400MHz,甲醇-d4)δ7.64–7.53(m,4H),5.05(t,J=7.1 Hz,1H),3.81–3.66(m,6H),3.62–3.33(m,9H),3.30(p,J=1.6 Hz,1H),2.94(s,3H),2.51(s,3H),2.09(dq,J=11.8,6.1Hz,2H), 1.72(s,3H).13C NMR(100MHz,cd3od)δ171.78,169.38,155.83, 154.03,152.14,140.55,136.33,134.58,134.53,133.33,132.73, 130.89,130.38,56.07,53.54,41.96,37.22,36.23,25.11,14.48, 13.14,11.68.LCMS 526.29(M+H)。
(3)(S)-(6-(4-(3-(2-(4-(4-氯苯基)-2,3,9-三甲基-6H-噻吩并[3,2-f] [1,2,4]***并[4,3-α][1,4]二氮杂环庚三烯-6-基)乙酰氨基)丙基)哌嗪- 1-基)-6-氧代己基)氨基甲酸叔丁酯的合成
将(S)-2-(4-(4-氯苯基)-2,3,9-三甲基-6H-噻吩并[3,2-f]的[1,2,4] ***并[4,3-a][1,4]二氮杂环庚三烯-6-基)-N-(3-(哌嗪-1-基)丙基)乙酰 胺(62.1mg)和6-((叔丁氧基羰基)氨基)己酸(24.0mg,0.1037mmol, 1当量)溶解于DMF(1mL)。加入DIPEA(72.2微升,0.4147mmol, 4当量),然后加入HATU(39.4mg,0.1037mmol,1当量),将混合 物搅拌25小时。将混合物用半饱和碳酸氢钠稀释,并用DCM萃取 三次。将合并的有机层用硫酸钠干燥,过滤并浓缩。通过柱色谱 (ISCO,4g硅胶柱,0至15%MeOH/DCM,15分钟梯度)纯化,得 到黄色油状物(71.75mg,0.0970mmol,94%)。
1H NMR(400MHz,氯仿-d)δ7.61(s,1H),7.43–7.28(m,4H),4.63 (s,1H),4.61–4.56(m,1H),3.82–3.21(m,10H),3.11–3.01(m, 2H),2.61(d,J=24.3Hz,9H),2.38(s,3H),2.28(t,J=7.4Hz,2H), 1.73(dq,J=13.8,7.4Hz,2H),1.63–1.55(m,2H),1.53–1.24(m,14H).13C NMR(100MHz,cdcl3)δ171.63,171.11,164.34,156.17, 155.66,150.21,136.96,136.72,132.25,131.14,131.01,130.47, 130.00,128.85,79.11,56.42,54.46,53.06,52.82,45.04,41.02, 40.47,39.29,38.33,33.00,29.90,28.54,26.60,25.29,24.86,14.47, 13.20,11.86.LCMS 739.37(M+H)。
(4)(S)-N-(3-(4-(6-氨基己酰基)哌嗪-1-基)丙基)-2-(4-(4-氯苯基)- 2,3,9-三甲基-6H-噻吩并[3,2-f][1,2,4]***并[4,3-α][1,4]二氮杂环庚 三烯-6-基)乙酰胺的合成
将(S)-(6-(4-(3-(2-(4-(4-氯苯基)-2,3,9-三甲基-6H-噻吩并[3,2- f][1,2,4]***并[4,3-a][1,4]二氮杂环庚三烯-6-基)乙酰氨基)丙基)哌嗪 -1-基)-6-氧代己基)氨基甲酸叔丁酯(71.75mg,0.0970mmol,1当量) 溶于DCM(2mL)和MeOH(0.2mL)中。加入4M HCl于二恶烷(0.49 mL)的溶液,将混合物搅拌2小时,然后在氮气流下浓缩,然后真空, 得到黄色泡沫(59.8mg,0.0840mmol,87%)。
1H NMR(400MHz,甲醇-d4)δ7.68–7.53(m,4H),5.04(d,J=6.6 Hz,1H),4.66(d,J=13.6Hz,1H),4.23(d,J=13.6Hz,1H),3.63– 3.34(m,7H),3.29–3.00(m,5H),2.95(d,J=6.0Hz,5H),2.51(d, J=9.2Hz,5H),2.08(s,2H),1.77–1.62(m,7H),1.45(dt,J=15.3,8.6Hz,2H).13C NMR(100MHz,cd3od)δ173.77,171.84,169.35, 155.85,153.99,140.56,136.40,134.58,133.35,132.70,130.39, 55.83,53.57,52.92,52.70,43.57,40.55,39.67,37.33,36.25,33.17, 28.26,26.94,25.33,25.26,14.49,13.15,11.65.LCMS639.35(M+H)。
(5)dBET18的合成
将(S)-N-(3-(4-(6-氨基己酰基)哌嗪-1-基)丙基)-2-(4-(4-氯苯基)- 2,3,9-三甲基-6H-噻吩并[3,2-f][1,2,4]***并[4,3-a][1,4]二氮杂环庚 三烯-6-基)乙酰胺二盐酸盐(20.0mg,0.0281mmol,1当量)和2-((2- (2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)氧基)乙酸(9.32mg, 0.0281mmol,1当量)溶于DMF(0.281mL)。加入DIPEA(19.6微升,0.1124mmol,4当量),然后加入HATU(10.7mg,0.0281 mmol,1当量)。24小时后,将混合物用MeOH稀释,并通过制备 型HPLC纯化,得到所需的三氟乙酸盐。
1H NMR(400MHz,甲醇-d4)δ7.83–7.79(m,1H),7.54(d,J=7.1 Hz,1H),7.45(q,J=8.8Hz,5H),5.12(dd,J=12.5,5.4Hz,1H), 4.76(s,2H),4.68(t,J=7.3Hz,1H),3.59–3.32(m,8H),3.28– 3.18(m,4H),2.87(ddd,J=19.0,14.7,5.3Hz,2H),2.80–2.65(m, 6H),2.44(d,J=6.8Hz,5H),2.33–2.25(m,1H),2.14(dd,J=9.8, 4.9Hz,1H),2.06–1.89(m,3H),1.70(s,3H),1.61(dq,J=14.4,7.3, 6.9Hz,4H),1.45–1.37(m,2H).13C NMR(100MHz,cd3od)δ 174.52,173.97,173.69,171.44,169.88,168.26,167.83,166.72, 156.36,138.28,137.84,134.89,133.52,132.12,131.83,131.38, 129.89,121.87,119.32,118.01,69.52,55.64,55.03,52.79,50.58, 43.69,39.77,38.57,36.89,33.47,32.16,29.93,27.34,25.76,25.45, 23.63,14.39,12.94,11.66.LCMS 953.43(M+H)。
合成例19:dBET19的合成
在室温,将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3-基)- 1,3-二氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(235微升, 0.0235mmol,1当量)的溶液加入(S)-2-(4-(4-氯苯基)-2-(氰基甲基)- 3,9-二甲基-6H-噻吩并[3,2-f][1,2,4]***并[4,3-a][1,4]二氮杂环庚三 烯-6-基)乙酸(10mg,0.0235mmol,1当量)。加入DIPEA(12.3微升,0.0704mmol,3当量)和HATU(8.9mg,0.0235mmol,1当量), 将混合物搅拌18.5小时。然后将混合物用EtOAc稀释并用饱和碳酸 氢钠、水和盐水洗涤。将有机层用硫酸钠干燥,过滤并减压下浓缩。 通过柱色谱(ISCO,4g硅胶柱,0至10%MeOH/DCM,25分钟梯度) 纯化,得到所需产物,为白色固体(12.96mg,0.0160mmol,68%)。 1H NMR(400MHz,氯仿-d)δ7.80(dd,J=8.4,7.4Hz,1H),7.55– 7.37(m,6H),5.14–5.06(m,1H),4.77(d,J=1.5Hz,2H),4.64(dd, J=8.0,5.6Hz,1H),3.45–3.32(m,5H),3.29–3.21(m,2H),2.83– 2.66(m,6H),2.58(s,3H),2.14–2.06(m,1H),1.71–1.57(m,4H). LCMS 810.30,M+H)。
合成例20:dBET20的合成
在室温,将3-((2-((4-(4-(4-氨基丁酰基)哌嗪-1-基)苯基)氨基)- 5-甲基嘧啶-4-基)氨基)-N-(叔丁基)苯磺酰胺三氟乙酸酯(7.41mg, 0.0107mmol,1当量)和2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲 哚啉-4-基)氧基)乙酸(3.6mg,0.0107mmol,1当量)溶于DMF(214 微升,0.05M)。加入DIPEA(5.6微升,0.0321mmol,3当量)和 HATU(4.1mg,0.0107mmol,1当量)。22.5小时后,将混合物用 MeOH稀释,并通过制备型HPLC纯化,得到所需产物,为棕色残 余物(6.27mg,0.00701mmol,65%)。1H NMR(500MHz,甲醇-d4) δ8.06(s,1H),7.84–7.75(m,3H),7.65(s,1H),7.55(t,J=7.8Hz, 2H),7.45(d,J=8.4Hz,1H),7.25–7.20(m,2H),6.99(d,J=8.8 Hz,2H),5.11(dd,J=12.5,5.4Hz,1H),4.78(s,2H),3.79–3.66(m, 4H),3.40(t,J=6.6Hz,2H),3.24–3.13(m,4H),2.82–2.68(m, 3H),2.52(t,J=7.4Hz,2H),2.24–2.19(m,3H),2.12(dd,J=10.2, 5.1Hz,1H),1.92(dd,J=13.4,6.4Hz,2H),1.18(s,9H).LCMS 895.63(M+H)。
合成例21:dBET21的合成
在室温,将0.1M 4-((10-氨基癸基)氧基)-2-(2,6-二氧代哌啶-3- 基)异吲哚啉-1,3-二酮三氟乙酸盐于DMF(232微升,0.0232mmol, 1当量)的溶液加入JQ-酸(9.3mg,0.0232mmol,1当量)。加入 DIPEA(12.1微升,0.0696mmol,3当量)和HATU(8.8mg,0.0232mmol,1当量),并将混合物搅拌18小时。然后将混合物用EtOAc 稀释,并用饱和碳酸氢钠、水和盐水洗涤。将有机层用硫酸钠干燥, 过滤并减压下浓缩。通过制备型HPLC纯化,然后通过柱色谱 (ISCO,4g硅胶柱,0至10%MeOH/DCM,25分钟梯度)纯化,得 到所需产物,为灰白色残余物(1.84mg,0.00235mmol,10%)。1H NMR(500MHz,甲醇-d4)δ7.77–7.73(m,1H),7.50–7.33(m,6H), 5.09(dd,J=12.5,5.5Hz,1H),4.62(s,1H),4.21(t,J=6.4Hz,2H), 3.36(s,2H),2.87–2.67(m,6H),2.44(s,3H),1.88–1.82(m,2H), 1.70(s,3H),1.58(s,4H),1.29(s,8H).LCMS 784.51(M+H)。
合成例22:dBET22的合成
在室温,将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3-基)- 1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(247微升, 0.0247mmol,1当量)的溶液加入(S)-4-(4-氯苯基)-6-(2-甲氧基-2-氧 代乙基)-3,9-二甲基-6H-噻吩并[3,2-f][1,2,4]***并[4,3-a][1,4]二氮 杂环庚三烯-2-羧酸(10.98mg,0.0247mmol,1当量)。加入 DIPEA(12.9微升,0.0740mmol,3当量)和HATU(9.4mg,0.0247 mmol,1当量)。然后将混合物搅拌21小时,然后用EtOAc稀释并 用饱和碳酸氢钠、水和盐水洗涤。将有机层用硫酸钠干燥,过滤并减 压下浓缩。通过柱色谱法纯化(ISCO,4g硅胶柱,0至10% MeOH/DCM,25分钟梯度),得到所需产物,为白色固体(9.79mg, 0.0118mmol,48%)。1H NMR(400MHz,甲醇-d4)δ7.80(dd,J= 8.4,7.4Hz,1H),7.51(dd,J=7.1,1.5Hz,1H),7.48–7.34(m,5H), 5.11(ddd,J=12.4,5.4,3.5Hz,1H),4.76(s,2H),4.69(td,J=7.2, 1.4Hz,1H),3.76(s,3H),3.55(d,J=7.2Hz,2H),3.48–3.33(m, 4H),2.93–2.82(m,1H),2.78–2.64(m,5H),2.14–2.07(m,1H),1.96(d,J=0.9Hz,3H),1.66(s,4H).LCMS 829.39(M+H)。
合成例23:dBET23的合成
在室温,将0.1M N-(8-氨基辛基)-2-((2-(2,6-二氧代哌啶-3-基)- 1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(220微升, 0.0220mmol,1当量)的溶液加入(S)-4-(4-氯苯基)-6-(2-甲氧基-2-氧 代乙基)-3,9-二甲基-6H-噻吩并[3,2-f])[1,2,4]***并[4,3-a][1,4]二氮 杂环庚三烯-2-羧酸(9.87mg,0.0220mmol,1当量)。加入 DIPEA(11.5微升,0.0660mmol,3当量)和HATU(8.4mg,0.0220 mmol,1当量)。然后将混合物搅拌21小时,然后用EtOAc稀释, 并用饱和碳酸氢钠、水和盐水洗涤。将有机层用硫酸钠干燥,过滤并 减压下浓缩。通过柱色谱(ISCO,4g硅胶柱,0至10%MeOH/DCM, 25分钟梯度)纯化,得到所需产物,为白色固体(8.84mg,0.00998 mmol,45%)。1H NMR(400MHz,甲醇-d4)δ7.81(dd,J=8.4,7.4 Hz,1H),7.53(d,J=7.3Hz,1H),7.50–7.39(m,5H),5.12(dd,J= 12.6,5.4Hz,1H),4.75(s,2H),4.68(t,J=7.2Hz,1H),3.76(s,3H), 3.54(d,J=7.2Hz,2H),3.39–3.32(m,3H),3.29(s,1H),2.90– 2.83(m,1H),2.79–2.68(m,5H),2.14(dd,J=8.9,3.7Hz,1H),1.99(s,3H),1.65–1.53(m,4H),1.36(d,J=6.5Hz,8H).LCMS 885.47(M+H)。
合成例24:dBET24的合成
步骤1:(2-(2-(2-(2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉- 4-基)氧基)乙酰氨基)乙氧基)乙氧基)乙基)氨基甲酸叔丁酯的合成
将2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙 酸(200mg,0.602mmol,1当量)溶于DMF(6.0mL,0.1M)。依次 加入HATU(228.9mg,0.602mmol,1当量),DIPEA(0.315mL, 1.81mmol,3当量)和N-Boc-2,2'-(亚乙二氧基)二乙胺(0.143mL,0.602mmol,1当量)。6小时后,加入另外的HATU(114mg,0.30 mmol,0.5当量)以确保反应完全。再过24小时后,将混合物用 EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤两次。将合并的有 机层用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱(ISCO,12g硅 胶柱,0至15%MeOH/DCM,15分钟梯度)纯化,得到所需产物, 为黄色油状物(0.25g,0.44mmol,74%)。1HNMR(400MHz,甲醇 -d4)δ7.82–7.75(m,1H),7.51(d,J=7.4Hz,1H),7.41(d,J=8.5 Hz,1H),5.13(dd,J=12.4,5.5Hz,1H),4.76(s,2H),3.66–3.58(m, 6H),3.53–3.45(m,4H),3.19(t,J=5.6Hz,2H),2.95–2.83(m, 1H),2.80–2.67(m,2H),2.19–2.12(m,1H),1.41(s,9H).LCMS 563.34(M+H)。
步骤2:N-(2-(2-(2-氨基乙氧基)乙氧基)乙基)-2-((2-(2,6-二氧代哌啶 -3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯的合成
将(2-(2-(2-(2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4- 基)氧基)乙酰氨基)乙氧基)乙氧基)乙基)氨基甲酸叔丁酯(0.25g,0.44 mmol,1当量)溶于TFA(4.5mL),并加热至50℃。3小时后,将混 合物冷却至室温,用MeOH稀释,并减压下浓缩。通过制备型 HPLC纯化,得到所需产物,为褐色固体(0.197g,0.342mmol, 77%)。1H NMR(400MHz,甲醇-d4)δ7.81(ddd,J=8.4,7.4,1.1 Hz,1H),7.55–7.50(m,1H),7.43(d,J=8.5Hz,1H),5.13(dd,J= 12.7,5.5Hz,1H),4.78(s,2H),3.74–3.66(m,6H),3.64(t,J=5.4Hz,2H),3.52(t,J=5.3Hz,2H),3.14–3.08(m,2H),2.89(ddd,J= 17.5,13.9,5.2Hz,1H),2.80–2.66(m,2H),2.16(dtd,J=13.0,5.7, 2.7Hz,1H).LCMS 463.36(M+H)。
步骤2:dBET24的合成
将0.1M N-(2-(2-(2-氨基乙氧基)乙氧基)乙基)-2-((2-(2,6-二氧 代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)乙酰胺三氟乙酸酯于DMF(0.324mL,0.0324mmol,1当量)的溶液加入JQ-酸(13.0mg, 0.324mmol,1当量)。然后加入DIPEA(16.9微升,0.0972mmol, 3当量)和HATU(12.3mg,0.0324mmol,1当量),并将混合物在室 温搅拌18小时。然后将混合物用EtOAc稀释,并用饱和碳酸氢钠、 水和盐水洗涤。然后将有机层用硫酸钠干燥,过滤并减压下浓缩。 通过柱色谱法(ISCO,4g硅胶柱,0至10%MeOH/DCM,25分钟 梯度)纯化,得到所需产物,为灰白色固体(20.0mg,0.0236mmol, 73%)。1H NMR(400MHz,甲醇-d4)δ7.77–7.72(m,1H),7.49(d, J=7.4Hz,1H),7.45–7.35(m,5H),5.09(ddd,J=12.3,5.4,3.7Hz, 1H),4.76(s,2H),4.60(dd,J=8.9,5.3Hz,1H),3.68–3.62(m,6H), 3.59(t,J=5.6Hz,2H),3.54–3.48(m,2H),3.47–3.35(m,4H), 2.84(ddd,J=19.4,9.9,4.6Hz,1H),2.77–2.69(m,2H),2.68(d,J =1.8Hz,3H),2.43(s,3H),2.12(dt,J=9.8,5.3Hz,1H),1.68(s, 3H).LCMS845.39(M+H)。
合成例25:dBET25的合成
在室温,将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3-基)- 1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(183微升, 0.0183mmol,1当量)的溶液加入(S)-4-(4-氯苯基)-6-(2-甲氧基-2-氧 代乙基)-2,9-二甲基-6H-噻吩并[3,2-f])[1,2,4]***并[4,3-a][1,4]二氮 杂环庚三烯-3-羧酸(8.16mg,0.0183mmol,1当量)。加入DIPEA(9.6微升,0.0550mmol,3当量)和HATU(7.0mg,0.0183mmol,1当量)。然后将混合物搅拌23小时,然后用EtOAc稀释,并用饱 和碳酸氢钠、水和盐水洗涤。将有机层用硫酸钠干燥,过滤并减压下 浓缩。通过柱色谱(ISCO,4g硅胶柱,0至10%MeOH/DCM,25分 钟梯度)纯化,得到所需产物,为黄色固体(4.39mg,0.00529mmol, 29%)。1H NMR(400MHz,甲醇-d4)δ7.82(dd,J=8.4,7.4Hz,1H), 7.55(d,J=7.3Hz,1H),7.45(d,J=8.2Hz,1H),7.43–7.31(m, 4H),5.16–5.10(m,1H),4.77(d,J=1.5Hz,2H),4.56(s,1H),3.74 (d,J=1.8Hz,3H),3.66–3.60(m,1H),3.50(dd,J=16.5,7.3Hz, 1H),3.37–3.32(m,1H),3.28(s,3H),2.85(t,J=7.2Hz,2H),2.75 (d,J=7.8Hz,1H),2.71(d,J=0.9Hz,3H),2.59(d,J=1.0Hz,3H), 2.18–2.10(m,1H),1.36–1.24(m,4H).LCMS 829.38(M+H)。
合成例26:dBET26的合成
在室温,将0.1M N-(8-氨基辛基)-2-((2-(2,6-二氧代哌啶-3-基)- 1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(186微升, 0.0186mmol,1当量)的溶液加入(S)-4-(4-氯苯基)-6-(2-甲氧基-2-氧 代乙基)-2,9-二甲基-6H-噻吩并[3,2-f])[1,2,4]***并[4,3-a][1,4]二氮 杂环庚三烯-3-羧酸(8.26mg,0.0186mmol,1当量)。加入 DIPEA(9.7微升,0.0557mmol,3当量)和HATU(7.1mg,0.0186 mmol,1当量)。然后将混合物搅拌23小时,然后用EtOAc稀释, 并用饱和碳酸氢钠、水和盐水洗涤。将有机层用硫酸钠干燥,过滤并 减压下浓缩。通过柱色谱法(ISCO,4g硅胶柱,0至10%MeOH/DCM,25分钟梯度)纯化,得到所需产物,为奶油色固体 (6.34mg,0.00716mmol,38%)。1H NMR(400MHz,甲醇-d4)δ 7.83–7.78(m,1H),7.53(dd,J=7.3,2.2Hz,1H),7.45–7.38(m, 3H),7.32(dd,J=8.5,1.3Hz,2H),5.16–5.08(m,1H),4.76(s,2H), 4.56(s,1H),3.75(s,3H),3.66(dd,J=15.9,8.7Hz,1H),3.50(dd,J =16.9,6.9Hz,1H),3.32(d,J=2.8Hz,4H),2.84–2.74(m,3H), 2.70(d,J=1.1Hz,3H),2.66–2.54(m,3H),2.14(d,J=5.3Hz, 1H),1.62–1.22(m,12H).LCMS 885.48(M+H)。
合成例27:dBET27的合成
将0.1M 4-(2-(2-氨基乙氧基)乙氧基)-2-(2,6-二氧代哌啶-3-基) 异吲哚啉-1,3-二酮三氟乙酸酯于DMF(257微升,0.0257mmol,1 当量)的溶液加入JQ-酸(10.3mg,0.0257mmol,1当量)。然后加入 DIPEA(13.4微升,0.0771mmol,3当量)和HATU(9.8mg,0.0257 mmol,1当量),并将混合物在室温搅拌18小时。然后将混合物用 EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤。然后将有机层用 硫酸钠干燥,过滤并减压下浓缩。通过柱色谱法(ISCO,4g硅胶柱, 0至10%MeOH/DCM,25分钟梯度)纯化,得到所需产物,为白色 固体(14.53mg,0.0195mmol,76%)。1H NMR(400MHz,甲醇-d4) δ7.75(ddd,J=8.5,7.3,1.3Hz,1H),7.47–7.30(m,6H),5.00(ddd, J=25.4,12.2,5.2Hz,1H),4.61(td,J=9.4,5.0Hz,1H),4.36(q,J =4.8Hz,2H),3.96–3.89(m,2H),3.74(q,J=5.6Hz,2H),3.53–3.41(m,3H),3.30–3.24(m,1H),2.78–2.53(m,6H),2.41(d,J= 3.9Hz,3H),2.09–1.98(m,1H),1.67(d,J=5.0Hz,3H)。
合成例28:dBET28的合成
将0.1M 4-(4-氨基丁氧基)-2-(2,6-二氧代哌啶-3-基)异吲哚啉- 1,3-二酮三氟乙酸酯于DMF(202微升,0.0202mmol,1当量)的溶 液加入JQ中-酸(8.1mg,0.0202mmol,1当量)。然后加入 DIPEA(10.6微升,0.0606mmol,3当量)和HATU(7.7mg,0.0202 mmol,1当量),并将混合物在室温搅拌18.5小时。然后将混合物 用EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤。然后将有机层 用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱法(ISCO,4g硅胶柱,0至10%MeOH/DCM,25分钟梯度)纯化,得到所需产物,为 奶油色固体(10.46mg,0.0144mmol,71%)。1H NMR(400MHz, 甲醇-d4)δ7.76(t,J=7.5Hz,1H),7.43(td,J=6.5,2.5Hz,4H), 7.34(t,J=8.8Hz,2H),5.08–4.98(m,1H),4.64(td,J=9.1,5.0Hz, 1H),4.26(t,J=5.3Hz,2H),3.57–3.32(m,4H),2.84–2.59(m, 6H),2.45–2.37(m,3H),2.08–2.01(m,1H),2.00–1.91(m,2H), 1.82(dq,J=13.8,6.9Hz,2H),1.68(d,J=11.7Hz,3H).LCMS728.38(M+H)。
合成例29:dBET29的合成
将0.1M 4-((6-氨基己基)氧基)-2-(2,6-二氧代哌啶-3-基)异吲哚 啉-1,3-二酮于DMF(205微升,0.0205mmol,1当量)中的溶液加入 JQ-酸(8.2mg,0.0205mmol,1当量)。然后加入DIPEA(10.7微升, 0.0614mmol,3当量)和HATU(7.8mg,0.0205mmol,1当量),并 将混合物在室温搅拌19小时。然后将混合物用EtOAc稀释并用饱和 碳酸氢钠,水和盐水洗涤。然后将有机层用硫酸钠干燥,过滤并减压 下浓缩。通过柱色谱(ISCO,4g硅胶柱,0至10%MeOH/DCM,25 分钟梯度)纯化,得到所需产物,为白色固体(8.04mg,0.0106mmol, 52%)。1HNMR(400MHz,甲醇-d4)δ7.75–7.71(m,1H),7.51– 7.34(m,6H),5.07(ddd,J=12.1,5.4,2.4Hz,1H),4.62(dd,J=9.0, 5.2Hz,1H),4.22(t,J=6.4Hz,2H),3.44–3.32(m,2H),3.29–3.21(m,2H),2.88–2.65(m,6H),2.43(s,3H),2.13–2.06(m,1H), 1.86(dt,J=13.9,6.7Hz,2H),1.68(s,3H),1.59(dq,J=14.2,7.0 Hz,4H),1.54–1.45(m,2H).LCMS 756.40(M+H).
合成例30:dBET30的合成
在室温,将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3- 基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(163微 升,0.0163mmol,1当量)的溶液加入(S)-4-(4-氯苯基)-3,9-二甲基- 6-(2-((3-(4-甲基哌嗪-1-基)丙基)氨基))-2-氧代乙基)-6H-噻吩并[3,2- f][1,2,4]***并[4,3-a][1,4]二氮杂环庚三烯-2-羧酸(9.31mg,0.0163 mmol,1eq)。加入DIPEA(8.5微升,0.0490mmol,3当量)和 HATU(6.2mg,0.0163mmol,1当量)。然后将混合物搅拌23.5小 时,然后通过制备型HPLC纯化,得到所需产物,为黄色油状物 (11.48mg,0.0107mmol,66%)。1H NMR(400MHz,甲醇-d4)δ 7.82–7.78(m,1H),7.54–7.35(m,6H),5.09(td,J=12.7,5.4Hz, 1H),4.77–4.70(m,3H),3.56–3.31(m,12H),3.23(dd,J=8.0,6.0 Hz,3H),3.05(d,J=3.2Hz,2H),2.93–2.81(m,5H),2.78–2.63 (m,5H),2.15–2.05(m,2H),1.96–1.86(m,4H),1.68(s,4H). LCMS 954.55(M+H)。
合成例31:dBET31的合成
在室温,将0.1M N-(8-氨基辛基)-2-((2-(2,6-二氧代哌啶-3-基)- 1,3-二氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(153微升, 0.0153mmol,1当量)的溶液加入(S)-4-(4-氯苯基)-3,9-二甲基-6-(2- ((3-(4-甲基哌嗪-1-基)丙基)氨基))-2-氧代乙基)-6H-噻吩并[3,2- f][1,2,4]***并[4,3-a][1,4]二氮杂环庚三烯-2-羧酸(8.7mg,0.0153 mmol,1当量)。加入DIPEA(7.9微升,0.0458mmol,3当量)和 HATU(5.8mg,0.0153mmol,1当量)。然后将混合物搅拌25小时, 然后通过制备型HPLC纯化,得到所需产物,为棕色油(不像大便棕 色,而是有点像砖色)(9.52mg,0.00847mmol,55%)。1H NMR(400MHz,甲醇-d4)δ7.81(dd,J=8.4,7.4Hz,1H),7.59–7.40(m, 6H),5.12(dd,J=12.5,5.4Hz,1H),4.75(s,2H),4.71(t,J=7.4Hz, 1H),3.53–3.34(m,8H),3.29–3.11(m,6H),3.03–2.61(m,13H), 2.15(s,1H),2.01–1.84(m,5H),1.59(s,4H),1.37(s,8H).LCMS1010.62(M+H)。
合成例32:dBET32的合成
在室温,将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3-基)- 1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(180微升, 0.0180mmol,1当量)的溶液)加入4-(4-(4-((4-((3-(N-(叔丁基)氨磺 酰基)苯基)氨基)-5-甲基嘧啶-2-基)氨基)苯基)哌嗪-1-基)-4-氧代丁酸 (10.7mg,0.0180mmol,1当量)。加入DIPEA(9.4微升,0.0539 mmol,3当量)和HATU(6.8mg,0.0180mmol,1当量),并将混合 物搅拌19小时。然后将混合物用甲醇稀释,并通过制备型HPLC纯 化,得到所需产物,为棕色油状物(4.40mg,0.00449mmol,25%)。 1H NMR(500MHz,甲醇-d4)δ8.08(d,J=13.6Hz,1H),7.84–7.76 (m,3H),7.63(s,1H),7.57–7.51(m,2H),7.41(d,J=8.4Hz,1H), 7.22(td,J=6.7,2.2Hz,2H),7.03–6.97(m,2H),5.14(dd,J=12.5, 5.5Hz,1H),4.76(d,J=16.8Hz,2H),3.72(dt,J=10.0,5.2Hz,4H),3.34–3.33(m,1H),3.23–3.12(m,5H),2.97(dd,J=8.8,4.0 Hz,3H),2.80–2.69(m,4H),2.64(dd,J=7.6,5.5Hz,1H),2.50(t, J=6.8Hz,1H),2.22(dd,J=2.4,0.9Hz,3H),2.17–2.11(m,1H), 1.67–1.52(m,4H),1.18(d,J=0.8Hz,9H).LCMS 980.64(M+H)。
合成例33:dBET33的合成
在室温,将0.1M N-(8-氨基辛基)-2-((2-(2,6-二氧代哌啶-3-基)- 1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(188微升,0.0188mmol,1当量)的溶液加入4-(4-(4-((4-((3-(N-(叔丁基)氨磺酰 基)苯基)氨基)-5-甲基嘧啶-2-基)氨基)苯基)哌嗪-1-基)-4-氧代丁酸 (10.8mg,0.0188mmol,1当量)。加入DIPEA(9.8微升,0.0564 mmol,3当量)和HATU(7.1mg,0.0188mmol,1当量),将混合物 搅拌23小时。然后将混合物用甲醇稀释,并通过制备型HPLC纯化, 得到所需产物,为棕色残余物(7.41mg,0.00715mmol,38%)。1HNMR(500MHz,甲醇-d4)δ8.06(s,1H),7.80(ddd,J=10.5,7.6,3.2 Hz,3H),7.65(d,J=4.5Hz,1H),7.57–7.51(m,2H),7.41(dd,J= 8.4,2.9Hz,1H),7.25(td,J=6.7,2.9Hz,2H),7.02(t,J=8.0Hz, 2H),5.16–5.09(m,1H),4.75(d,J=9.5Hz,2H),3.76(dq,J=16.0,5.3Hz,4H),3.29–3.12(m,7H),3.00–2.67(m,7H),2.51(t,J= 6.8Hz,1H),2.22(d,J=3.1Hz,3H),2.13(dtd,J=10.4,5.7,3.1Hz, 1H),1.59–1.52(m,2H),1.51–1.43(m,2H),1.32(t,J=16.6Hz, 8H),1.18(d,J=1.3Hz,9H).LCMS 1036.69(M+H)。
合成例34:dBET34的合成
在室温,将0.1M N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙 基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二恶吲哚啉-4-基)氧基)乙酰胺三 氟乙酸酯于DMF(173微升,0.0173mmol,1当量)的溶液加入4-(4- (4-((4-((3-(N-(叔丁基)氨磺酰基)苯基)氨基)-5-甲基嘧啶-2-基)氨基) 苯基)哌嗪-1-基)-4-氧代丁酸(10.3mg,0.0173mmol,1当量)。加入DIPEA(9.0微升,0.0519mmol,3当量)和HATU(6.6mg,0.0173 mmol,1当量),并将混合物搅拌25小时。然后将混合物用甲醇稀 释,并通过制备型HPLC纯化,得到所需产物,为棕色残余物(7.99 mg,0.00718mmol,42%)。1H NMR(500MHz,甲醇-d4)δ8.06(s, 1H),7.83–7.76(m,3H),7.65(s,1H),7.58–7.50(m,2H),7.43(dd, J=17.7,8.4Hz,1H),7.27–7.21(m,2H),7.02(t,J=8.0Hz,2H), 5.13(dt,J=12.7,5.2Hz,1H),4.76(d,J=12.4Hz,2H),3.73(q,J=6.3Hz,4H),3.63–3.49(m,10H),3.41(q,J=6.6Hz,2H),3.27– 3.15(m,5H),3.01–2.81(m,4H),2.79–2.63(m,5H),2.50(t,J= 6.8Hz,1H),2.22(d,J=2.3Hz,3H),2.17–2.11(m,1H),1.88– 1.70(m,4H),1.18(d,J=1.2Hz,9H).LCMS 1112.74(M+H)。
合成例35:dBET35的合成
将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3-基)-1-氧代 异吲哚-4-基)氨基)乙酰胺三氟乙酸酯于DMF(185微升,0.0185 mmol,1当量)的溶液加入JQ-酸(7.4mg,0.0185mmol,1当量)。 然后加入DIPEA(9.6微升,0.0554mmol,3当量)和HATU(7.0mg,0.0185mmol,1当量),并将混合物在室温搅拌17小时。然后将混 合物用EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤。然后将有 机层用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱(ISCO,4g硅 胶柱,0至15%MeOH/DCM,25分钟梯度)纯化,得到所需产物, 为白色固体(2.71mg,0.00351mmol,19%)。1H NMR(500MHz, 甲醇-d4)δ7.48–7.37(m,4H),7.34(t,J=7.8Hz,1H),7.14(dd,J= 7.4,2.4Hz,1H),6.67(d,J=8.1Hz,1H),5.14(td,J=13.5,5.2Hz, 1H),4.66–4.60(m,1H),4.59(d,J=8.3Hz,2H),4.43–4.31(m, 2H),3.88(s,2H),3.25(dd,J=14.8,7.1Hz,4H),2.94–2.72(m, 3H),2.68(d,J=4.9Hz,3H),2.49–2.40(m,4H),2.21–2.12(m, 1H),1.68(s,3H),1.53(s,4H).LCMS 770.51(M+H)。
合成例36:dBET36的合成
将0.1M N-(4-氨基丁基)-2-(2-(2,6-二氧代哌啶-3-基)-1,3-氧代 异吲哚啉-4-基)乙酰胺三氟乙酸酯于DMF(222微升,0.0222mmol, 1当量)的溶液加入JQ-酸(8.9mg,0.0222mmol,1当量)。然后加 入DIPEA(11.6微升,0.0666mmol,3当量)和HATU(8.4mg,0.0222mmol,1当量),并将混合物在室温搅拌17.5小时。然后将 混合物用EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤。然后将 有机层用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱(ISCO,4g 硅胶柱,0至15%MeOH/DCM,25分钟梯度)纯化,得到所需产物, 为白色固体(12.42mg,0.0156mmol,70%)。1H NMR(500MHz, 甲醇-d4)δ7.80–7.74(m,2H),7.68(d,J=6.8Hz,1H),7.42(q,J= 8.7Hz,4H),5.11(dt,J=12.3,4.6Hz,1H),4.63(dd,J=8.8,5.5Hz, 1H),4.10–4.00(m,2H),3.39(ddd,J=14.9,8.8,2.5Hz,1H),3.30 –3.21(m,5H),2.88–2.76(m,1H),2.74–2.65(m,5H),2.44(s, 3H),2.15–2.08(m,1H),1.69(s,3H),1.63–1.55(m,4H).LCMS 769.49(M+H)。
合成例37:dBET37的合成
将0.1M 6-氨基-N-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉 -4-基)甲基)己酰胺三氟乙酸酯于DMF(195微升,0.0195mmol,1 当量)的溶液加入JQ-酸(7.8mg,0.0195mmol,1当量)中。然后加 入DIPEA(10.2微升,0.0584mmol,3当量)和HATU(7.4mg,0.0195mmol,1当量),并将混合物在室温搅拌18小时。然后将混 合物用EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤。然后将有 机层用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱(ISCO,4g硅 胶柱,0至15%MeOH/DCM,25分钟梯度)纯化,得到所需产物, 为白色固体(11.83mg,0.0151mmol,77%)。1H NMR(500MHz, 甲醇-d4)δ7.78–7.74(m,2H),7.71(dd,J=5.3,3.5Hz,1H),7.42 (q,J=8.5Hz,4H),5.13(dd,J=12.6,5.5Hz,1H),4.82(s,2H), 4.63(dd,J=8.8,5.5Hz,1H),3.40(ddd,J=15.0,8.8,1.6Hz,1H), 3.30–3.21(m,3H),2.86(ddd,J=18.4,14.6,4.8Hz,1H),2.74(ddd, J=13.8,10.1,2.8Hz,2H),2.69(s,3H),2.44(s,3H),2.30(t,J=7.4 Hz,2H),2.13(dtd,J=12.9,4.9,2.3Hz,1H),1.74–1.64(m,5H),1.59(p,J=7.0Hz,2H),1.46–1.38(m,2H).LCMS 783.47(M+H)。
合成例38:dBET38的合成
步骤1:(3-(3-(2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基) 氧基)乙酰氨基)丙氧基)丙基叔丁基酯的合成)氨基甲酸酯
将(3-(3-氨基丙氧基)丙基)氨基甲酸叔丁酯(134.5mg,0.579 mmol,1当量)溶于DMF(5.79mL,0.05M)中,然后加入2-((2- (2,6-二氧代哌啶)-3-基)-1,3-二氧代异吲哚啉-4-基)氧基)乙酸(192.38 mg,0.579mmol,1当量)。加入DIPEA(0.28mL,1.74mmol,3 当量)和HATU(153.61mg,0.579mmol,1当量),并将混合物在室 温搅拌18小时。然后将混合物用EtOAc稀释并用饱和碳酸氢钠, 水和盐水洗涤。用硫酸钠干燥有机层,过滤并浓缩,得到黄色油状物 (157.1mg)。通过柱色谱(ISCO,12g二氧化硅柱,0至15% MeOH/DCM,25分钟梯度)纯化粗物质,得到黄色油状物(121.3mg, 0.222mmol,38.27%)。1H NMR(400MHz,甲醇-d4)δ7.78(dd,J =8.4,7.4Hz,1H),7.50(d,J=7.3Hz,1H),7.41(d,J=8.5Hz,1H), 5.13(dd,J=12.4,5.5Hz,1H),4.75(s,2H),3.53–3.37(m,6H), 3.14–3.07(m,2H),2.94–2.88(m,1H),2.79–2.68(m,2H),2.16 (ddd,J=12.8,6.6,2.7Hz,1H),1.81(p,J=6.4Hz,2H),1.73–1.65(m,2H),1.40(s,9H).LCMS 547.6(M+H).
步骤2:N-(3-(3-氨基丙氧基)丙基)-2-((2-(2,6-二氧代哌啶-3-基)- 1,3-二氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸盐的合成
将TFA(2.22ml,0.1M)加入(3-(3-(2-((2-(2,6-二氧代哌啶-3- 基)-1,3-氧代异吲哚啉-4-基)氧基乙酰氨基)丙氧基)丙基)氨基甲酸叔 丁酯(121.3mg,0.222mmol,1当量),将混合物在50℃搅拌2小时。 然后将混合物溶解在MeOH中并在减压下浓缩,得到棕色油状物 (114.1mg),其不经进一步纯化而继续使用。1H NMR(400MHz,甲 醇-d4)δ7.81–7.74(m,1H),7.50(d,J=7.3Hz,1H),7.41(d,J= 8.5Hz,1H),5.12(dd,J=12.7,5.5Hz,1H),4.76(s,2H),3.57–3.52 (m,2H),3.48(t,J=5.9Hz,2H),3.40(t,J=6.6Hz,2H),3.06(t,J= 6.5Hz,2H),2.87(ddd,J=14.1,10.1,7.0Hz,1H),2.79–2.65(m, 2H),2.15(dtd,J=12.8,5.5,2.6Hz,1H),1.92(dt,J=11.7,5.9Hz, 2H),1.81(p,J=6.3Hz,2H).LCMS 447.2(M+H)。
步骤3:合成dBET38
在室温,将0.1M N-(3-(3-氨基丙氧基)丙基)-2-((2-(2,6-二氧代 哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于 DMF(0.215mL,0.0215mmol,1当量)的溶液加入JQ-酸(8.6mg, 0.0215mmol,1当量)。加入DIPEA(11.2微升,0.0644mmol,3当量)和HATU(8.2mg,0.0215mmol,1当量)。19小时后,将混合物 用EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤。将合并的有机 层用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱(ISCO,4g硅胶 柱,0至15%MeOH/DCM,25分钟梯度)纯化,得到所需产物,为 奶油色固体(10.6mg,0.0127mmol,59%)。1H NMR(500MHz, 甲醇-d4)δ7.79–7.74(m,1H),7.50(d,J=8.1Hz,1H),7.46–7.36 (m,5H),5.11(ddd,J=12.4,5.5,1.7Hz,1H),4.73(s,2H),4.62(ddd, J=8.7,5.4,1.4Hz,1H),3.50(q,J=6.3Hz,4H),3.43(t,J=6.5Hz, 2H),3.41–3.32(m,3H),3.29–3.24(m,1H),2.85(ddd,J=18.3, 14.6,4.2Hz,1H),2.77–2.65(m,5H),2.43(s,3H),2.17–2.09(m, 1H),1.80(h,J=6.4Hz,4H),1.68(s,3H).LCMS 829.32(M+H)。
合成例39:dBET39的合成
在室温,将0.1M 4-((10-氨基癸基)氧基)-2-(2,6-二氧代哌啶-3- 基)异吲哚啉-1,3-二酮三氟乙酸酯于DMF(0.212mL,0.0212mmol, 1当量)的溶液加入JQ-酸(8.5mg,0.0212mmol,1当量)。加入 DIPEA(11.1微升,0.0636mmol,3当量)和HATU(8.1mg,0.0212mmol,1当量)。19小时后,将混合物用EtOAc稀释,并用饱和碳 酸氢钠、水和盐水洗涤。将合并的有机层用硫酸钠干燥,过滤并减压 下浓缩。通过柱色谱(ISCO,4g硅胶柱,0至15%MeOH/DCM,25 分钟梯度)和制备型HPLC纯化,得到所需产物(0.39mg,0.00048 mmol,2.3%)。1H NMR(500MHz,甲醇-d4)δ7.77–7.73(m,1H), 7.56–7.31(m,6H),5.11–5.06(m,1H),4.62(dd,J=9.2,5.0Hz, 1H),4.58(s,2H),4.21(t,J=6.3Hz,2H),3.42–3.38(m,1H),3.24 –3.20(m,1H),2.90–2.68(m,6H),2.45(d,J=6.7Hz,3H),2.11(s, 1H),1.83(dd,J=14.7,6.6Hz,2H),1.70(s,3H),1.61–1.49(m, 4H),1.32(d,J=23.2Hz,10H).LCMS 812.60(M+H)。
合成例40:dBET40的合成
在室温,将0.1M 4-(2-(2-(2-氨基乙氧基)乙氧基)乙氧基)-2- (2,6-二氧代哌啶-3-基)异吲哚啉-1,3-二酮三氟乙酸酯于DMF溶液 (0.242mL,0.0242mmol,1当量)加入JQ-酸(9.7mg,0.0242mmol,1当量)。加入DIPEA(12.6微升,0.0726mmol,3当量)和 HATU(9.2mg,0.0242mmol,1当量)。22小时后,将混合物用 EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤。将合并的有机层 用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱(ISCO,4g硅胶柱, 0至10%MeOH/DCM,25分钟梯度)和制备型HPLC纯化,得到所 需产物,为棕色油状物(4.74mg,0.00601mmol,25%)。1H NMR (500MHz,甲醇-d4)δ7.77–7.67(m,1H),7.52–7.36(m,5H),5.09 –5.03(m,1H),4.64(d,J=4.8Hz,1H),4.40–4.32(m,2H),3.97– 3.88(m,2H),3.81–3.74(m,2H),3.69–3.60(m,5H),3.55–3.38 (m,4H),2.89–2.54(m,6H),2.45(d,J=5.9Hz,3H),2.11(s,1H), 1.70(d,J=8.6Hz,3H).LCMS 788.42(M+H)。
合成例41:dBET41的合成
步骤1:(4-((2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基) 氧基)乙酰氨基)甲基)苄基)氨基甲酸叔丁酯的合成
将(4-(氨基甲基)苄基)氨基甲酸叔丁酯(183.14mg,0.755mmol, 1当量)溶于DMF(15.1mL,0.05M)中并加入2-((2-(2,6-二氧代哌啶 -3-酮)(α)-3,3-二氧代异吲哚啉-4-基)氧基)乙酸(250.90mg,0.755 mmol,1当量)。加入DIPEA(0.374mL,2.265mmol,3当量)和HATU(296.67mg,0.755mmol,1当量),并将混合物在室温搅拌 20小时。然后将混合物用EtOAc稀释并用饱和碳酸氢钠,水和盐水 洗涤。将有机层用硫酸钠干燥,过滤并浓缩,得到浅棕色油状物。 通过柱色谱(ISCO,12g二氧化硅柱,0至15%MeOH/DCM,25分 钟梯度)纯化粗物质,得到浅棕色油状物(373.1mg,0.678mmol, 89.8%)。1H NMR(500MHz,DMSO-d6)δ11.10(s,2H),8.48(t,J= 5.8Hz,1H),7.80(dd,J=8.4,7.3Hz,1H),7.49(d,J=7.2Hz,1H), 7.40(d,J=8.6Hz,1H),7.26–7.08(m,4H),5.11(dd,J=12.9,5.4 Hz,1H),4.86(s,2H),4.33(d,J=3.9Hz,2H),4.09(d,J=5.3Hz, 2H),2.65–2.51(m,3H),2.07–1.99(m,1H),1.38(s,9H).LCMS 551.5(M+H)。
步骤2:N-(4-(氨基甲基)苄基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧 代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸盐的合成
将TFA(6.77mL,0.1M)加入(4-((2-((2-(2,6-二氧代哌啶-3- 基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰氨基)甲基)苄基)氨基甲酸叔丁 酯(373.1mg,0.677mmol,1当量)酯中。,将混合物在50℃搅拌 1.5小时。然后将混合物溶解在MeOH中并在减压下浓缩,得到棕色 油状物(270.29mg),其不经进一步纯化而继续使用。1H NMR(500 MHz,DMSO-d6)δ11.11(s,1H),8.55(t,J=6.2Hz,1H),8.07(s, 3H),7.81(dd,J=8.5,7.3Hz,1H),7.51(d,J=7.2Hz,1H),7.40(dd, J=14.9,8.3Hz,3H),7.31(d,J=8.2Hz,2H),5.11(dd,J=12.9,5.4Hz,1H),4.87(s,2H),4.37(d,J=6.1Hz,2H),4.01(q,J=5.8 Hz,2H),2.66–2.51(m,3H),2.07–1.99(m,1H).LCMS 451.3 (M+H)。
步骤3:合成dBET41
在室温,将0.1M N-(4-(氨基甲基)苄基)-2-((2-(2,6-二氧代哌啶 -3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸盐于DMF中 (0.237mL,0.0237mmol,1当量)的溶液加入JQ-酸(9.5mg, 0.0237mmol,1当量)中。23小时后,将混合物用EtOAc稀释并用 饱和碳酸氢钠,水和盐水洗涤。将有机层用硫酸钠干燥,过滤并减 压下浓缩。通过柱色谱法(ISCO,4g硅胶柱,0至10%MeOH/DCM, 25分钟梯度)纯化,得到所需产物,为奶油色固体(11.8mg,0.0142 mmol,60%)。1H NMR(500MHz,甲醇-d4)δ7.80–7.75(m,1H), 7.51(dd,J=7.3,1.5Hz,1H),7.41(d,J=8.4Hz,1H),7.36(d,J=2.2Hz,4H),7.34–7.28(m,4H),5.10–5.00(m,1H),4.82(s,2H), 4.67–4.64(m,1H),4.61–4.42(m,4H),4.34(dd,J=14.9,12.8Hz, 1H),3.49(ddd,J=14.8,9.5,5.2Hz,1H),2.83–2.75(m,1H),2.73 –2.61(m,5H),2.44–2.39(m,3H),2.06(ddq,J=9.8,4.7,2.6Hz, 1H),1.66(d,J=4.2Hz,3H).LCMS832.92(M+H)。
合成例42:dBET42的合成
将0.1M 5-氨基-N-(2-(2,6-二氧代哌啶-3-基)-1-氧代异吲哚啉-4- 基)戊酰胺三氟乙酸酯于DMF(222微升,0.0222mmol,1当量)的溶 液加入JQ-酸(8.9mg,0.0222mmol,1当量)。然后加入 DIPEA(11.6微升,0.0666mmol,3当量)和HATU(8.4mg,0.0222 mmol,1当量),并将混合物在室温搅拌24小时。然后将混合物用 EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤。然后将有机层用 硫酸钠干燥,过滤并减压下浓缩。通过柱色谱(ISCO,4g硅胶柱,0 至10%MeOH/DCM,25分钟梯度)纯化,得到所需产物,为白色固 体(12.23mg,0.0165mmol,74%)。1H NMR(500MHz,甲醇-d4)δ 7.76–7.71(m,1H),7.66–7.62(m,1H),7.51(td,J=7.8,2.5Hz, 1H),7.45–7.35(m,4H),5.11(ddd,J=13.2,11.3,5.2Hz,1H),4.63 (ddd,J=8.8,5.7,3.2Hz,1H),4.47(s,2H),3.45–3.32(m,3H), 3.30–3.27(m,1H),2.90–2.80(m,1H),2.73–2.63(m,4H),2.49(t, J=7.4Hz,2H),2.46–2.38(m,4H),2.11(ddtd,J=12.8,10.5,5.3, 2.3Hz,1H),1.84–1.75(m,2H),1.66(dd,J=16.2,7.6Hz,5H). LCMS 741.46(M+H)。
合成例43:dBET43的合成
将0.1M 7-氨基-N-(2-(2,6-二氧代哌啶-3-基)-1-氧代异吲哚-4-基) 庚酰胺三氟乙酸酯于DMF(227微升,0.0227mmol,1当量)的溶液 加入JQ-酸(9.1mg,0.0227mmol,1当量)。然后加入DIPEA(11.9 微升,0.0681mmol,3当量)和HATU(8.6mg,0.0227mmol,1当 量),并将混合物在室温搅拌25.5小时。然后将混合物用EtOAc稀 释,并用饱和碳酸氢钠、水和盐水洗涤。然后将有机层用硫酸钠干燥, 过滤并减压下浓缩。通过柱色谱法(ISCO,4g硅胶柱,0至10% MeOH/DCM,25分钟梯度)纯化,得到所需产物,为灰白色固体 (12.58mg,0.0164mmol,72%)。1H NMR(500MHz,甲醇-d4)δ 7.71(d,J=7.9Hz,1H),7.64(d,J=7.4Hz,1H),7.51(t,J=7.8Hz, 1H),7.46–7.38(m,4H),5.14(ddd,J=13.3,5.2,2.2Hz,1H),4.62(ddd,J=8.6,5.6,2.1Hz,1H),4.49–4.45(m,2H),3.39(ddd,J= 14.9,8.7,1.3Hz,1H),3.30–3.24(m,3H),2.93–2.83(m,1H),2.79 –2.65(m,4H),2.50–2.40(m,6H),2.16(ddq,J=9.9,5.2,2.6Hz, 1H),1.78–1.70(m,2H),1.68(d,J=2.1Hz,3H),1.63–1.57(m, 2H),1.50–1.42(m,4H).LCMS 769.55(M+H)。
合成例44:dBET44的合成
将0.1M 8-氨基-N-(2-(2,6-二氧代哌啶-3-基)-1-氧代异吲哚啉-4- 基)辛酰胺三氟乙酸酯于DMF(217微升,0.0217mmol,1当量)的溶 液加入JQ-酸(8.7mg,0.0217mmol,1当量)。然后加入 DIPEA(11.3微升,0.0651mmol,3当量)和HATU(8.3mg,0.0217 mmol,1当量),并将混合物在室温搅拌20.5小时。然后将混合物 用EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤。然后将有机层 用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱(ISCO,4g硅胶柱, 0-10%MeOH/DCM,25分钟梯度)纯化,得到所需产物,为奶油色 固体(14.28mg,0.0182mmol,84%)。1H NMR(500MHz,甲醇-d4) δ7.72–7.68(m,1H),7.64(d,J=7.5Hz,1H),7.51(t,J=7.7Hz, 1H),7.46–7.39(m,4H),5.14(dt,J=13.3,5.0Hz,1H),4.62(dd,J =8.8,5.4Hz,1H),4.48–4.44(m,2H),3.40(ddd,J=14.9,8.8,0.9 Hz,1H),3.26(dt,J=13.2,6.9Hz,3H),2.88(ddd,J=18.7,13.5, 5.4Hz,1H),2.75(dddd,J=17.6,7.1,4.5,2.4Hz,1H),2.68(d,J= 2.2Hz,3H),2.49–2.39(m,6H),2.17(ddt,J=9.8,5.3,2.3Hz,1H),1.76–1.70(m,2H),1.70–1.67(m,3H),1.61–1.54(m,2H),1.42 (s,6H).LCMS 783.53(M+H)。
合成例45:dBET45的合成
在室温,将0.1M N-(8-氨基辛基)-2-((2-(2,6-二氧代哌啶-3-基)- 1,3-二氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(268微升, 0.0268mmol,1当量)的溶液加入(R)-4-((4-环戊基-1,3-二甲基-2-氧 代-1,2,3,4-四氢吡啶并[2,3-b]吡嗪-)6-基)氨基)-3-甲氧基苯甲酸(11.0 mg,0.0268mmol,1当量)。然后加入DIPEA(14.0微升,0.0804mmol,3当量)和HATU(10.2mg,0.0268mmol,1当量),将混合 物搅拌18.5小时。然后将混合物用甲醇稀释,并通过制备型HPLC 纯化,得到所需产物,为深棕色固体(10.44mg,0.0108mmol, 40%)。1H NMR(500MHz,甲醇-d4)δ8.38(d,J=8.4Hz,1H), 7.80–7.75(m,1H),7.55–7.48(m,1H),7.48–7.35(m,3H),7.27 (d,J=8.3Hz,1H),6.45(d,J=8.2Hz,1H),5.12(dd,J=12.5,5.5 Hz,1H),4.72(d,J=5.1Hz,2H),4.53(s,1H),4.28(d,J=6.8Hz, 1H),3.98(d,J=4.1Hz,3H),3.48–3.33(m,4H),2.90–2.82(m, 1H),2.80–2.69(m,2H),2.18–2.01(m,4H),1.88–1.52(m,10H), 1.34(d,J=42.9Hz,10H),1.17(d,J=6.8Hz,3H).LCMS851.67 (M+H)。
合成例46:dBET46的合成
在室温,将0.1M N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙 基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二异吲哚啉-4-基)氧基)乙酰胺三 氟乙酸酯于DMF(256微升,0.0256mmol,1当量)的溶液加入至 (R)-4-((4-环戊基-1,3-二甲基-2-氧代-1,2,3,4-四氢吡啶并[2,3-b]吡嗪- 6-基)氨基)-3-甲氧基苯甲酸(10.5mg,0.0256mmol,1当量)。然后 加入DIPEA(13.4微升,0.0767mmol,3当量)和HATU(9.7mg, 0.0256mmol,1当量),将混合物搅拌20小时。然后将混合物用甲 醇稀释,并通过制备型HPLC纯化,得到所需产物,为深棕色固体 (13.69mg,0.0132mmol,51%)。1H NMR(500MHz,甲醇-d4)δ 8.28–8.24(m,1H),7.74–7.71(m,1H),7.49(dd,J=7.3,3.7Hz, 1H),7.39–7.34(m,2H),7.28–7.25(m,1H),7.14–7.10(m,1H), 6.34(d,J=8.3Hz,1H),5.01–4.97(m,1H),4.62(s,2H),4.25(q,J =6.7Hz,1H),3.95(d,J=5.4Hz,3H),3.60(ddd,J=9.0,6.1,1.6 Hz,8H),3.53–3.46(m,6H),3.40–3.37(m,2H),2.78(td,J=11.1, 6.6Hz,3H),2.16–2.00(m,4H),1.84(ddt,J=33.5,13.0,6.4Hz,7H),1.75–1.60(m,6H),1.17(d,J=6.8Hz,3H).LCMS 927.74 (M+H)。
合成例47:dBET50的合成
在室温,将0.1M N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙 基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)氧基)乙酰 胺三氟乙酸酯于DMF(200微升,0.0200mmol,1当量)的溶液加入 (S)-4-(4-氯苯基)-6-(2-甲氧基-2-氧代乙基)-3,9-二甲基-6H-噻吩并 [3,2-f][1,2,4]***并[4,3-a][1,4]二氮杂环庚三烯-2-羧酸(8.9mg,0.020mmol,1当量)。加入DIPEA(10.5微升,0.060mmol,3当 量)和HATU(7.6mg,0.020mmol,1当量)。然后将混合物搅拌17 小时,然后用EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤。将 有机层用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱法纯化(ISCO, 4g硅胶柱,0至10%MeOH/DCM,25分钟梯度),得到所需产物, 为奶油色固体(9.31mg,0.00968mmol,48%)。1HNMR(500 MHz,甲醇-d4)δ7.82–7.78(m,1H),7.52(dd,J=7.1,1.6Hz,1H), 7.49–7.40(m,5H),5.10(ddd,J=12.8,5.5,2.9Hz,1H),4.74(s, 2H),4.67(t,J=7.1Hz,1H),3.76(s,3H),3.62–3.50(m,14H),3.49 –3.43(m,2H),3.40(q,J=6.5Hz,2H),2.87(ddd,J=17.6,14.0, 5.3Hz,1H),2.79–2.67(m,5H),2.12(ddq,J=10.3,5.4,2.9Hz, 1H),2.00(s,3H),1.86(q,J=6.3Hz,2H),1.80(p,J=6.4Hz,2H)。 LCMS 961.67(M+H)。
合成例48:dBET51的合成
在室温,将0.1M N-(2-(2-(2-氨基乙氧基)乙氧基)乙基)-2-((2- (2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸 酯于DMF(200微升,0.0200mmol,1当量)的溶液加入(S)-4-(4-氯 苯基)-6-(2-甲氧基-2-氧代乙基)-3,9-二甲基-6H-噻吩并[3,2-f][1,2,4] ***并[4,3-a][1,4]二氮杂环庚三烯-2-羧酸(8.9mg,0.020mmol,1 当量)。加入DIPEA(10.5微升,0.060mmol,3当量)和HATU(7.6 mg,0.020mmol,1当量)。然后将混合物搅拌17小时,然后用 EtOAc稀释并用饱和碳酸氢钠、水和盐水洗涤。将有机层用硫酸钠 干燥,过滤并减压下浓缩。通过柱色谱(ISCO,4g硅胶柱,0至10% MeOH/DCM,25分钟梯度)纯化,得到所需产物,为灰白色固体 (8.38mg,0.00942mmol,47%)。1HNMR(500MHz,甲醇-d4)δ 7.80(dd,J=8.4,7.4Hz,1H),7.52(dd,J=7.2,1.3Hz,1H),7.48–7.38(m,5H),5.08(ddd,J=12.7,5.5,1.6Hz,1H),4.74(d,J=2.7 Hz,2H),4.66(t,J=7.1Hz,1H),3.75(d,J=3.0Hz,3H),3.65(t,J =4.1Hz,6H),3.59(t,J=5.3Hz,2H),3.57–3.49(m,4H),3.49– 3.40(m,2H),2.93–2.84(m,1H),2.78–2.64(m,5H),2.15–2.09 (m,1H),2.00(d,J=0.9Hz,3H).LCMS 889.58(M+H)。
合成例49:dBET52的合成
在室温,将0.1M N-(2-(2-(2-(2-氨基乙氧基)乙氧基)乙氧基)乙 基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)氧基)乙酰 胺三氟乙酸酯于DMF(200微升,0.020mmol,1当量)的溶液加入 JQ-酸(8.0mg,0.020mmol,1当量)。加入DIPEA(10.5微升, 0.060mmol,3当量)和HATU(7.6mg,0.020mmol,1当量)。17.5 小时后,将混合物用EtOAc稀释并用饱和碳酸氢钠、水和盐水洗涤。 将合并的有机层用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱法纯 化(ISCO,4g硅胶柱,0至10%MeOH/DCM,25分钟梯度),得到 所需产物,为无色残余物(9.12mg,0.01025mmol,51%)。1H NMR(500MHz,甲醇-d4)δ7.77(t,J=7.9Hz,1H),7.50(dd,J= 7.3,1.5Hz,1H),7.47–7.36(m,5H),5.09(ddd,J=13.0,7.6,5.5 Hz,1H),4.76(s,2H),4.62(dd,J=9.1,5.1Hz,1H),3.62(ddt,J= 17.3,11.2,6.5Hz,12H),3.52–3.41(m,5H),3.28(d,J=5.1Hz, 1H),2.90–2.81(m,1H),2.79–2.66(m,5H),2.44(s,3H),2.16– 2.09(m,1H),1.69(s,3H).LCMS 889.38(M+H)。
合成例50:dBET53的合成
在室温,将0.1M N-(14-氨基-3,6,9,12-四氧杂十四烷基)-2-((2- (2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸 酯的溶液于DMF(200微升,0.020mmol,1当量)加入JQ-酸(8.0mg, 0.020mmol,1当量)。加入DIPEA(10.5微升,0.060mmol,3当量) 和HATU(7.6mg,0.020mmol,1当量)。17.5小时后,再加入 HATU(7.6mg)和DIPEA(10.5微升),将混合物再搅拌5小时。将混 合物用EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤。将合并的 有机层用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱(ISCO,4g硅胶柱,0至10%MeOH/DCM,25分钟梯度)纯化,得到所需产物 (3.66mg)。1H NMR(500MHz,甲醇-d4)δ7.79(dd,J=8.4,7.4Hz, 1H),7.51(d,J=7.3Hz,1H),7.45(d,J=7.7Hz,2H),7.43–7.36 (m,3H),5.08(ddd,J=12.7,5.5,2.2Hz,1H),4.78–4.74(m,2H), 4.62(dd,J=9.1,5.1Hz,1H),3.70–3.51(m,16H),3.50–3.41(m, 5H),3.27(dd,J=5.1,2.3Hz,1H),2.87(ddt,J=18.2,9.5,4.9Hz, 1H),2.78–2.66(m,5H),2.44(s,3H),2.16–2.09(m,1H),1.69(s, 3H).LCMS 933.43(M+H)。
合成例51:dBET54的合成
在室温,将0.1M N-(17-氨基-3,6,9,12,15-五氧杂十七烷基)-2- ((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰胺三氟 乙酸酯于DMF(200微升,0.020mmol,1当量)的溶液加入JQ-酸 (8.0mg,0.020mmol,1当量)。加入DIPEA(10.5微升,0.060 mmol,3当量)和HATU(7.6mg,0.020mmol,1当量)。16小时后, 将混合物用EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤。将合 并的有机层用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱(ISCO, 4g硅胶柱,0至10%MeOH/DCM,25分钟梯度)纯化,得到所需产 物(6.27mg,0.00641mmol,32%)。1H NMR(500MHz,甲醇-d4) δ7.81–7.76(m,1H),7.51(d,J=7.1Hz,1H),7.47–7.38(m,5H), 5.09(dd,J=12.6,5.5Hz,1H),4.77(s,2H),4.62(dd,J=8.8,5.0 Hz,1H),3.67–3.55(m,20H),3.46(ddd,J=20.1,10.2,4.7Hz,5H), 3.28(d,J=5.1Hz,1H),2.91–2.83(m,1H),2.78–2.68(m,5H), 2.44(s,3H),2.16–2.10(m,1H),1.72–1.66(m,3H).LCMS 977.50 (M+H)。
合成例52:dBET55的合成
在室温,将0.1M N-(29-氨基-3,6,9,12,15,18,21,24,27-壬氧基二 十九烷基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基) 乙酰胺三氟乙酸酯于DMF(200微升,0.020mmol,1当量)的溶液中 的加入JQ-酸(8.0mg,0.020mmol,1当量)。加入DIPEA(10.5微 升,0.060mmol,3当量)和HATU(7.6mg,0.020mmol,1当量)。 18小时后,将混合物用EtOAc稀释,并用饱和碳酸氢钠、水和盐水 洗涤。将合并的有机层用硫酸钠干燥,过滤并减压下浓缩。通过柱色 谱(ISCO,4g硅胶柱,0至10%MeOH/DCM,25分钟梯度)纯化, 得到所需产物(10.55mg,0.00914mmol,46%)。1H NMR(500 MHz,甲醇-d4)δ7.82(dd,J=8.4,7.4Hz,1H),7.55(d,J=7.0Hz, 1H),7.49–7.41(m,5H),5.13(dd,J=12.6,5.5Hz,1H),4.80(s, 2H),4.65(dd,J=9.1,5.1Hz,1H),3.68–3.58(m,36H),3.53–3.44 (m,5H),2.94–2.86(m,1H),2.81–2.70(m,5H),2.46(s,3H),2.19 –2.13(m,1H),1.74–1.69(m,3H).LCMS1153.59(M+H)。
合成例53:dBET56的合成
在室温,将0.1M N-(35-氨基-3,6,9,12,15,18,21,24,27,30,33-十 一碳五烯三十烷基)-2-((2-(2,6-二氧代哌啶)-3-甲基)-1,3-氧代异吲哚 啉-4-基)氧基)乙酰胺三氟乙酸酯于DMF(200微升,0.020mmol,1 当量)的溶液加入JQ-酸(8.0mg,0.020mmol,1当量)。加入 DIPEA(10.5微升,0.060mmol,3当量)和HATU(7.6mg,0.020 mmol,1当量)。20小时后,将混合物用EtOAc稀释,并用饱和碳 酸氢钠,水和盐水洗涤。将合并的有机层用硫酸钠干燥,过滤并减压 下浓缩。通过柱色谱法(ISCO,4g硅胶柱,0至10%MeOH/DCM, 25分钟梯度)纯化,得到所需产物,为油状残余物(9.03mg,0.00727 mmol,36%)。1H NMR(500MHz,甲醇-d4)δ7.81(dd,J=8.4,7.4 Hz,1H),7.53(d,J=7.1Hz,1H),7.50–7.40(m,5H),5.11(dd,J=12.6,5.5Hz,1H),4.78(s,2H),4.68(dd,J=8.6,5.0Hz,1H),3.69– 3.56(m,44H),3.52–3.43(m,5H),3.34(dd,J=7.9,3.5Hz,1H), 2.88(ddd,J=18.0,14.0,5.2Hz,1H),2.79–2.68(m,5H),2.46(s, 3H),2.17–2.12(m,1H),1.71(s,3H).LCMS 1241.60(M+H)。
合成例54:dBET57的合成
步骤1:2-(2,6-二氧代哌啶-3-基)-4-氟异二氢吲哚-1,3-二酮的合成
向4-氟异苯并呋喃-1,3-二酮(200mg,1.20mmol,1当量)于 AcOH(4.0mL,0.3M)的溶液加入2,6-二氧代哌啶-3-胺盐酸盐(218 mg,1.32mmol,1.1当量)和乙酸钾(366mg,3.73mmol,3.1当 量)。将反应混合物加热至90℃过夜,然后将其用水稀释至20mL并 在冰上冷却30分钟。过滤所得浆液,并通过快速柱色谱法(2% MeOH的CH2Cl2溶液,Rf=0.3)在硅胶上纯化黑色固体,得到标题 化合物,为白色固体(288mg,86%)。1H NMR(500MHz,DMSO- d6)δ11.15(s,1H),7.96(ddd,J=8.3,7.3,4.5Hz,1H),7.82–7.71 (m,2H),5.17(dd,J=13.0,5.4Hz,1H),2.90(ddd,J=17.1,13.9, 5.4Hz,1H),2.65–2.47(m,2H),2.10–2.04(m,1H),计算 C13H10FN2O4[M+H]+ 277.06的MS(ESI),实测为277.25。
步骤2:(2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氨基) 乙基)氨基甲酸叔丁酯的合成
向搅拌的2-(2,6-二氧代哌啶-3-基)-4-氟异二氢吲哚-1,3-二酮 (174mg,0.630mmol,1当量)于DMF(6.3mL,0.1M)的溶液中加 入DIPEA(220μL,1.26mmol,2当量)和1-Boc-乙二胺(110μL, 0.693mmol,1.1当量)。将反应混合物加热至90℃过夜,然后将其 冷却至室温并溶于EtOAc(30mL)和水(30mL)中。用盐水(3×20mL) 洗涤有机层,用Na2SO4干燥并真空浓缩。通过快速柱色谱法(0→10% MeOH的CH2Cl2溶液)在硅胶上纯化残余物,得到标题化合物, 为黄色固体(205mg,79%)。1H NMR(500MHz,CDCl3)δ8.08(bs, 1H),7.50(dd,J=8.5,7.1Hz,1H),7.12(d,J=7.1Hz,1H),6.98(d, J=8.5Hz,1H),6.39(t,J=6.1Hz,1H),4.96–4.87(m,1H),4.83 (bs,1H),3.50–3.41(m,2H),3.41–3.35(m,2H),2.92–2.66(m,3H),2.16–2.09(m,1H),1.45(s,9H);计算C20H25N4O6[M+H]+ 417.18的MS(ESI),实测为417.58。
步骤3:合成2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基) 氨基)乙-1-铵2,2,2-三氟乙酸盐
向搅拌的(2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基) 氨基)乙基)氨基甲酸叔丁酯(205mg,0.492mmol,1当量)于二氯甲 烷(2.25mL)的溶液加入三氟乙酸(0.250mL)。将反应混合物在室温 搅拌4小时,然后真空除去挥发物。得到标题化合物,为黄色固体 (226mg,>95%),其不经进一步纯化即可使用。1H NMR(500 MHz,MeOD)δ7.64(d,J=1.4Hz,1H),7.27–7.05(m,2H),5.10 (dd,J=12.5,5.5Hz,1H),3.70(t,J=6.0Hz,2H),3.50–3.42(m, 2H),3.22(t,J=6.0Hz,1H),2.93–2.85(m,1H),2.80–2.69(m, 2H),2.17–2.10(m,1H);计算C15H17N4O4[M+H]+ 317.12的MS (ESI),实测为317.53。
步骤2:dBET57的合成
在室温,将JQ-酸(8.0mg,0.0200mmol,1当量)和2-((2- (2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氨基)乙-1-铵2,2,2-三 氟乙酸盐(8.6mg,0.0200mmol,1当量)溶解在DMF(0.200mL, 0.1M)中。然后加入DIPEA(17.4μL,0.100mmol,5当量)和 HATU(7.59mg,0.0200mmol,1当量),将混合物在室温搅拌过夜。 将反应混合物溶于EtOAc(15mL)中,并用饱和NaHCO3(水性)(15 mL)、水(15mL)和盐水(3x15mL)洗涤。将有机层用Na2SO4干燥并 真空浓缩。通过快速柱色谱法(0→10%MeOH的CH2Cl2溶液,Rf= 0.3(10%MeOH的CH2Cl2溶液))在硅胶上纯化残余物,得到标题化 合物,为亮黄色固体(11.2mg,80%)。1H NMR(400MHz,CDCl3) δ8.49(bs,0.6H),8.39(bs,0.4H),7.51–7.43(m,1H),7.38(d,J= 7.8Hz,2H),7.29(dd,J=8.8,1.7Hz,2H),7.07(dd,J=7.1,4.9Hz, 1H),6.97(dd,J=8.6,4.9Hz,1H),6.48(t,J=5.9Hz,1H),6.40(t, J=5.8Hz,0.6H),4.91–4.82(m,0.4H),4.65–4.60(m,1H),3.62– 3.38(m,6H),2.87–2.64(m,3H),2.63(s,3H),2.40(s,6H),2.12– 2.04(m,1H),1.67(s,3H),rotamers;计算C34H32ClN8O5S[M+H]+ 700.19的MS(ESI),实测为700.34。
合成例55:dGR1的合成
合成例56:dGR2的合成:
合成例57:dGR3的合成:
合成例58:dFKBP-1的合成
(1)SLF-琥珀酸酯的合成
将SLF(25mg,2.5mL的10mg/mL MeOAc溶液,0.0477 mmol,1当量)与DMF(0.48mL,0.1M)和琥珀酸酐(7.2mg,0.0715 mmol,1.5当量)合并,并在室温搅拌24小时。观察到低转化率,将 混合物置于N2气流下以除去MeOAc。加入另外的0.48mL DMF, 以及另外的7.2mg琥珀酸酐和DMAP(5.8mg,0.0477mmol,1当 量)。然后将混合物再搅拌24小时,然后通过制备型HPLC纯化, 得到SLF-琥珀酸酯,为黄色油状物(24.06mg,0.0385mmol,81%)。 1H NMR(400MHz,甲醇-d4)δ7.62(d,J=10.7Hz,1H),7.44(d,J =8.0Hz,1H),7.26(td,J=7.9,2.7Hz,1H),7.07–6.97(m,1H), 6.80(dd,J=8.1,2.1Hz,1H),6.74–6.66(m,2H),5.73(dd,J=8.1, 5.5Hz,1H),5.23(d,J=4.8Hz,1H),3.83(s,3H),3.81(s,3H),3.39 –3.29(m,4H),3.21(td,J=13.2,3.0Hz,1H),2.68–2.50(m,5H), 2.37–2.19(m,2H),2.12–2.02(m,1H),1.79–1.61(m,4H),1.49–1.30(m,2H),1.27–1.05(m,6H),0.82(dt,J=41.2,7.5Hz,3H)。LCMS 624.72(M+H)。
(2)dFKBP-1的合成
将N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲 哚啉-4-基)氧基)乙酰胺三氟乙酸酯(9.9mg,0.0192mmol,1当量)加 入SLF琥珀酸盐(11.98mg,0.0192mmol,1当量)于0.192mL DMF(0.1M)中的溶液。加入DIPEA(10.0微升,0.0575mmol,3当量), 然后加入HATU(7.3mg,0.0192mmol,1当量)。将混合物搅拌17小 时,然后用MeOH稀释,并通过制备型HPLC纯化,得到dFKBP- 1(7.7mg,0.00763mmol,40%),为黄色固体。
1H NMR(400MHz,甲醇-d4)δ7.81(s,1H),7.77–7.70(m,1H), 7.55–7.49(m,2H),7.26(dd,J=8.0,5.3Hz,2H),7.05–6.99(m, 1H),6.77(d,J=8.8Hz,1H),6.66(d,J=6.8Hz,2H),5.77–5.72 (m,1H),5.24(d,J=4.8Hz,1H),4.99(dd,J=12.3,5.7Hz,1H),4.68–4.59(m,2H),3.82(s,3H),3.81(s,3H),3.32(dt,J=3.3,1.6 Hz,4H),3.26–3.14(m,3H),2.79(dd,J=18.9,10.2Hz,3H),2.64 –2.48(m,5H),2.34(d,J=14.4Hz,1H),2.22(d,J=9.2Hz,1H), 2.14–2.02(m,2H),1.78–1.49(m,9H),1.43–1.30(m,2H),1.20– 1.04(m,6H),0.90–0.76(m,3H)。13C NMR(100MHz,cd3od)δ 208.51,173.27,172.64,171.63,169.93,169.51,168.04,167.69, 167.09,166.71,154.92,149.05,147.48,140.76,138.89,137.48, 133.91,133.67,129.36,122.19,120.61,120.54,119.82,118.41,118.12,117.79,112.12,111.76,68.54,56.10,55.98,51.67,46.94, 44.57,39.32,39.01,38.23,32.64,31.55,31.43,26.68,26.64,25.08, 23.52,23.21,22.85,21.27,8.76.LCMS1009.66(M+H)。
合成例59:dFKBP-2的合成
(1)(1-氯-2-氧代-7,10,13-三氧杂-3-氮杂十六烷-16-基)氨基甲酸叔丁 酯的合成
将(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙基)氨基甲酸叔丁酯 (1.0g,3.12mmol,1当量)溶于THF(31mL,0.1M)。加入 DIPEA(0.543mL,3.12mmol,1当量),将溶液冷却至0℃。加入氯 乙酰氯(0.273mL,3.43mmol,1.1当量),将混合物缓慢温热至室温。 24小时后,将混合物用EtOAc稀释,用饱和碳酸氢钠、水和盐水洗涤。 将有机层用硫酸钠干燥,过滤并浓缩,得到黄色油状物(1.416g),其 不经进一步纯化而继续使用。
1H NMR(400MHz,氯仿-d)δ7.24(s,1H),5.00(s,1H),3.98–3.89 (m,2H),3.54(dddt,J=17.0,11.2,5.9,2.2Hz,10H),3.47–3.40(m, 2H),3.37–3.31(m,2H),3.17–3.07(m,2H),1.79–1.70(m,2H), 1.67(p,J=6.1Hz,2H),1.35(s,9H).13C NMR(100MHz,cdcl3)δ165.83,155.97,78.75,70.49,70.47,70.38,70.30,70.14,69.48, 42.61,38.62,38.44,29.62,28.59,28.40.LCMS 397.37(M+H)。
(2)3-((2,2-二甲基-4,20-二氧代-3,9,12,15-四氧杂-5,19-二氮杂二十二 烷-21-基)氧基)邻苯二甲酸二甲酯的合成
将(1-氯-2-氧代-7,10,13-三氧杂-3-氮杂十六烷-16-基)氨基甲酸 叔丁酯(1.41g,3.12mmol,1当量)溶于MeCN(32mL,0.1M)中。加 入3-羟基邻苯二甲酸二甲酯(0.721g,3.43mmol,1.1当量)和碳酸铯(2.80g,8.58mmol,2.75当量)。将烧瓶配备回流冷凝器,并加热至 80℃保持19小时。将混合物冷却至室温并用水稀释,用氯仿萃取一 次,用EtOAc萃取两次。将合并的有机层用硫酸钠干燥,过滤并减压 下浓缩。通过柱色谱(ISCO,24g二氧化硅柱,0至15%MeOH/DCM, 22分钟梯度)纯化粗物质,得到黄色油状物(1.5892g,2.78mmol, 89%,两步骤)。
1H NMR(400MHz,氯仿-d)δ7.52(d,J=7.8Hz,1H),7.35(t,J= 8.1Hz,1H),7.04(d,J=8.3Hz,1H),7.00(t,J=5.3Hz,1H),5.06 (s,1H),4.46(s,2H),3.83(s,3H),3.78(s,3H),3.47(ddd,J=14.9, 5.5,2.8Hz,8H),3.39(dt,J=9.4,6.0Hz,4H),3.29(q,J=6.5Hz,2H),3.09(d,J=6.0Hz,2H),1.70(p,J=6.5Hz,2H),1.63(p,J= 6.3Hz,2H),1.31(s,9H).13C NMR(100MHz,cdcl3)δ167.68, 167.36,165.45,155.93,154.41,130.87,129.60,125.01,123.20, 117.06,78.60,70.40,70.17,70.06,69.39,68.67,68.25,52.77,52.57,38.38,36.58,29.55,29.20,28.34.LCMS 571.47(M+H)。
(3)N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙基)-2-((2-(2,6-二氧代 哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯的合成 将3-((2,2-二甲基-4,20-二氧代-3,9,12,15-四氧杂-5,19-二氮杂二 十二烷-21-基)氧基)邻苯二甲酸二甲酯(1.589g,2.78mmol,1当量) 溶于EtOH(14mL,0.2M)。加入3M NaOH水溶液(2.8mL,8.34mmol,3当量),将混合物加热至80℃,保持22小时。然后将混合物 冷却至室温,用50mL DCM和20mL 0.5M HCl稀释。分离各层,有 机层用25mL水洗涤。合并水层,用50mL氯仿萃取三次。将合并的 有机层用硫酸钠干燥,过滤并浓缩,得到1.53g物质,其不经进一步 纯化而继续使用。LCMS 553.44。
将所得物质(1.53g)和3-氨基哌啶-2,6-二酮盐酸盐(0.480g,2.92 mmol,1当量)溶于吡啶(11.7mL,0.25M)中,并加热至110℃保持17 小时。将混合物冷却至室温,并减压下浓缩,得到粗制的(1-((2-(2,6- 二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基)-2-氧代-7,10,13-三氧 杂-3-氮杂十六烷-16-基)氨基甲酸叔丁酯,为黑色污泥(3.1491g),其不经进一步纯化而继续使用。LCMS 635.47。
将粗制的(1-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4- 基)氧基)-2-氧代-7,10,13-三氧杂-3-氮杂十六烷-16-基)氨基甲酸叔丁 酯(3.15g)溶于TFA(20mL),并加热至50℃保持2.5小时。将混合物冷 却至室温,用MeOH稀释并减压下浓缩。通过制备型HPLC纯化该物 质,得到N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯 (1.2438g,1.9598mmol,71%,3步骤),为深红色油状物。
1H NMR(400MHz,甲醇-d4)δ7.77(dd,J=8.3,7.5Hz,1H),7.49 (d,J=7.3Hz,1H),7.40(d,J=8.5Hz,1H),5.12(dd,J=12.8,5.5 Hz,1H),4.75(s,2H),3.68–3.51(m,12H),3.40(t,J=6.8Hz,2H), 3.10(t,J=6.4Hz,2H),2.94–2.68(m,3H),2.16(dtd,J=12.6,5.4, 2.5Hz,1H),1.92(p,J=6.1Hz,2H),1.86–1.77(m,2H).13C NMR (100MHz,cd3od)δ173.17,169.97,168.48,166.87,166.30,154.82, 136.89,133.41,120.29,117.67,116.58,69.96,69.68,69.60,68.87, 68.12,67.92,49.19,38.62,36.14,30.80,28.92,26.63,22.22.LCMS 536.41(M+H).
(4)dFKBP-2的合成
将N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙基)-2-((2-(2,6-二 氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)乙酰胺三氟乙酸酯(12.5 mg,0.0193mmol,1当量)加入SLF-琥珀酸盐(12.08mg,0.0193 mmol,1当量)于0.193mL的DMF(0.1M)溶液。加入DIPEA(10.1微升, 0.0580mmol,3当量)和HATU(7.3mg,0.0193mmol,1当量),将 混合物搅拌19小时。然后将混合物用MeOH稀释,并通过制备型 HPLC纯化,得到dFKBP-2(9.34mg,0.00818mmol,42%),为黄 色油状物。
1H NMR(400MHz,50%MeOD/氯仿-d)δ7.76–7.70(m,1H),7.58 –7.45(m,3H),7.26(t,J=8.2Hz,2H),7.05–6.98(m,1H),6.77(d, J=7.9Hz,1H),6.71–6.63(m,2H),5.73(dd,J=8.1,5.6Hz,1H), 5.23(d,J=5.4Hz,1H),5.03–4.95(m,1H),4.64(s,2H),3.82(s, 3H),3.80(s,3H),3.62–3.52(m,8H),3.47(t,J=6.1Hz,2H),3.44 –3.33(m,3H),3.27–3.14(m,3H),2.84–2.70(m,3H),2.64–2.47 (m,6H),2.34(d,J=14.1Hz,1H),2.24(dd,J=14.3,9.3Hz,2H), 2.13–2.00(m,2H),1.83(p,J=6.3Hz,2H),1.67(dtd,J=38.4, 16.8,14.8,7.0Hz,7H),1.51–1.26(m,3H),1.22–1.05(m,6H), 0.80(dt,J=39.8,7.5Hz,3H).13C NMR(100MHz,cdcl3)δ208.64, 173.39,173.01,171.76,170.11,169.62,168.24,167.92,167.36, 166.69,155.02,149.23,147.66,140.94,139.18,137.57,134.09, 133.91,129.49,122.32,120.75,120.52,119.93,118.42,117.75, 112.33,111.98,70.77,70.51,70.40,69.45,69.04,68.48,56.20, 56.10,51.88,47.09,44.78,38.40,37.48,36.91,32.80,32.71,31.70, 31.59,31.55,29.53,29.30,26.77,25.22,23.63,23.33,22.98,21.43. LCMS 1141.71(M+H).
合成例60:dFKBP-3的合成
将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧 代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯溶液(0.233mL,0.0233 mmol,1当量)加到2-(3((R)-3-(3,4-二甲氧基苯基)-1-(((S)-1-(3,3-二 甲基-2-氧代戊酰基)吡咯烷-2-羰基)氧基)丙基)苯氧基)乙酸(13.3mg, 0.0233mmol,1当量)。加入DIPEA(12.2微升,0.0700mmol,3当量),然后加入HATU(8.9mg,0.0233mmol,1当量)。将混合物搅 拌23小时,然后用MeOH稀释,并通过制备型HPLC纯化,得到白 色固体(10.72mg,0.0112mmol,48%)。
1H NMR(400MHz,甲醇-d4)δ7.79–7.74(m,1H),7.52(d,J=7.4 Hz,1H),7.33(d,J=8.4Hz,1H),7.26(t,J=8.1Hz,1H),6.97– 6.90(m,2H),6.89–6.84(m,1H),6.79(dd,J=8.2,1.9Hz,1H), 6.73–6.64(m,2H),5.73–5.65(m,1H),5.07–4.99(m,1H),4.67 (s,2H),4.57–4.51(m,1H),4.48(dd,J=5.7,2.5Hz,2H),3.82(d,J =1.9Hz,3H),3.80(s,3H),3.66–3.39(m,3H),2.88–2.48(m,6H), 2.42–1.87(m,9H),1.73–1.51(m,6H),1.19–0.92(m,6H),0.75 (dt,J=56.7,7.5Hz,3H).LCMS 954.52(M+H)。
实施例61:dFKBP-4的合成
将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧 代异吲哚基-4-基)氧基)乙酰胺三氟乙酸酯(0.182mL,0.0182mmol, 1当量)溶液加入2-(3-((R)-3-(3,4-二甲氧基)苯基)-1-(((S)-1-(3,3-二甲 基-2-氧代戊酰基)哌啶中)2-羰基)氧基)丙基)苯氧基)乙酸(10.6mg, 0.0182mmol,1当量)。加入DIPEA(9.5微升,0.0545mmol,3当量),然后加入HATU(6.9mg,0.0182mmol,1当量)。将混合物搅 拌26小时,然后用MeOH稀释,并加入通过制备型HPLC纯化,得 到白色固体(9.74mg,0.01006mmol,55%)。
1H NMR(400MHz,甲醇-d4)δ7.75(dd,J=8.3,7.4Hz,1H),7.53(d, J=2.3Hz,1H),7.33–7.25(m,2H),7.00–6.84(m,3H),6.79(dd,J =8.1,2.5Hz,1H),6.72–6.65(m,2H),5.75–5.70(m,1H),5.23(d, J=4.9Hz,1H),5.05–4.96(m,1H),4.66(s,2H),4.46(s,2H),3.82 (s,3H),3.81(s,3H),3.39–3.32(m,4H),3.20–3.12(m,1H),2.82 –2.69(m,3H),2.62–2.49(m,2H),2.37–2.00(m,5H),1.78–1.30 (m,11H),1.24–1.08(m,6H),0.81(dt,J=32.9,7.5Hz,3H).LCMS 968.55(M+H)。
合成例62:dFKBP-5的合成
将0.1M N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧 代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯(0.205mL,0.0205mmol, 1当量)溶液加入2-(3-((R)-3-(3,4-二甲氧基苯基)-1-(((S)-1-(2-苯基 乙酰基)哌啶-2-羰基)氧)丙基)苯氧基)乙酸(11.8mg,0.0205mmol, 1当量)。加入DIPEA(10.7微升,0.0615mmol,3当量),然后加入 HATU(7.8mg,0.0205mmol,1当量)。将混合物搅拌29小时,然 后用MeOH稀释,并通过制备型HPLC纯化,得到白色固体(10.62 mg,0.01106mmol,54%)。
1H NMR(400MHz,甲醇-d4)δ7.77–7.72(m,1H),7.52(s,1H), 7.31–7.11(m,7H),6.92–6.77(m,4H),6.68–6.62(m,2H),5.70– 5.64(m,1H),5.38(d,J=3.8Hz,1H),4.99(d,J=4.6Hz,1H),4.65 (s,2H),4.45–4.39(m,2H),3.80(dd,J=6.7,2.4Hz,8H),3.13–3.03(m,1H),2.83–2.68(m,3H),2.63–2.45(m,3H),2.34–1.93 (m,6H),1.71–1.52(m,7H),1.34–1.20(m,3H).LCMS 960.54 (M+H)。
合成例63:dFKBP-6的合成
将N-(4-氨基丁基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异 吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯(11.9mg,0.0231mmol,1当 量)加入2-(3-((R)-3-(3,4-二甲氧基苯基)-1-(((S)-1-((S)-2-(3,4,5-三 甲氧基苯基)丁酰基)哌啶-2-羰基)氧基)丙基)苯氧基)乙酸(16.0mg, 0.0231mmol,1当量)于0.231mL DMF(0.1M)中的溶液。加入 DIPEA(12.1微升,0.0692mmol,3当量)和HATU(8.8mg,0.0231 mmol,1当量),将混合物搅拌21小时。将混合物用EtOAc稀释, 并用饱和碳酸氢钠,水和盐水洗涤。将有机层用硫酸钠干燥,过滤并 减压下浓缩。通过柱色谱法纯化粗物质。
通过选择起始材料,上述合成图也可用于在本文的dFKBP结构 中提供类似的邻位或对位键合构型,如下所示。任何这些位置异构体 均可用于本发明中以降解FKBP。例如:
将产生
类似的用途:
将产生
合成例64:dFKBP-7的合成
将N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙基)-2-((2-(2,6- 二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯 (12.3mg,0.0189mmol,1当量)加入2-(3-((R)-3-(3,4-二甲氧基苯 基)-1-(((S)-1-((S)-2-(3,4,5-三甲氧基苯基)丁酰基)哌啶-2-羰基)氧基) 丙基)苯氧基)乙酸(13.1mg,0.0189mmol,1当量)于0.189mLDMF(0.1M)中的溶液。加入DIPEA(9.9微升,0.0566mmol,3当 量)和HATU(7.2mg,0.0189mmol,1当量),将混合物搅拌17小时。 将混合物用EtOAc稀释,并用饱和碳酸氢钠、水和盐水洗涤。将有 机层用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱法纯化粗物质。
合成例65:dFKBP-8的合成
将N-(6-氨基己基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲 哚啉-4-基)氧基)乙酰胺三氟乙酸酯(12.7mg,0.0233mmol,1.3当量) 加入2-(3-((R)-3-(3,4-二甲氧基苯基)-1-(((S)-1-((S)-2-(3,4,5-三甲氧 基苯基)丁酰基)哌啶-2-羰基)氧基)丙基)苯氧基)乙酸(12.4mg, 0.0179mmol,1当量)于0.233mL DMF(0.1M)的溶液。加入 DIPEA(9.3微升,0.0537mmol,3当量)和HATU(6.8mg,0.0179 mmol,1当量),将混合物搅拌22小时。将混合物用EtOAc稀释, 并用饱和碳酸氢钠、水和盐水洗涤。将有机层用硫酸钠干燥,过滤并 减压下浓缩。通过柱色谱法纯化粗物质。
合成例66:dFKBP-9的合成
将N-(8-氨基辛基)-2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异 吲哚基-4-基)氧基)乙酰胺三氟乙酸酯(10.4mg,0.0181mmol,1当 量)加入2-(3-((R)-3-(3,4-二甲氧基苯基)-1–(((S)-1-((S)-2-(3,4,5-三甲 氧基苯基)丁酰基)哌啶-2-羰基)氧基)丙基)苯氧基)乙酸(12.5mg, 0.0181mmol,1当量)于0.181mL DMF(0.1M)的溶液。加入 DIPEA(9.5微升,0.0543mmol,3当量)和HATU(6.9mg,0.0181 mmol,1当量)。混合物用EtOAc稀释,并用饱和碳酸氢钠,水和盐 水洗涤。将有机层用硫酸钠干燥,过滤并减压下浓缩。通过柱色谱法纯化粗物质。
合成例67:dFKBP的合成
X2
在室温,将FKBP*-酸(14.0mg,0.0202mmol,1当量)和2-((2- (2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氨基)乙-1-铵2,2,2-三 氟乙酸盐(8.7mg,0.0202mmol,1当量)溶于DMF(0.202mL, 0.1M)中。然后加入DIPEA(17.6μL,0.101mmol,5当量)和 HATU(7.6mg,0.0200mmol,1当量),将混合物在室温搅拌过夜。 将反应混合物溶于EtOAc(15mL)中,并用饱和NaHCO水溶液、 NaHCO3(水性)(15mL),水(15mL)和盐水(3x15mL)洗涤。将有机层 用Na2SO4干燥并真空浓缩。通过柱色谱法纯化粗物质。
合成例68:二乙基乙酰基-O-沙利度胺三氟乙酸酯的合成
(1)(2-(2-氯乙酰氨基)乙基)氨基甲酸叔丁酯的合成
在0℃,将(2-氨基乙基)氨基甲酸叔丁酯(0.40mL,2.5mmol, 1当量)溶于THF(25mL,0.1M)和DIPEA(0.44mL,2.5mmol,1 当量)中。加入氯乙酰氯(0.21mL,2.75mmol,1.1当量),将混合 物温热至室温。22小时后,将混合物用EtOAc稀释并用饱和碳酸氢 钠、水和盐水洗涤。用硫酸钠干燥有机层,过滤并减压下浓缩,得到 白色固体(0.66g,定量收率),其不经进一步纯化即可用于下一步骤。 1H NMR(400MHz,氯仿-d)δ7.16(s,1H),4.83(s,1H),4.04(s,2H), 3.42(q,J=5.4Hz,2H),3.32(q,J=5.6Hz,2H),1.45(s,9H). LCMS 237.30(M+H)。
(2)3-(2-((2-((叔丁氧基羰基)氨基)乙基)氨基)-2-氧代乙氧基)邻苯二甲 酸二甲酯的合成
将(2-(2-氯乙酰氨基)乙基)氨基甲酸叔丁酯(0.66g,1当量)溶于 MeCN(17mL,0.15M)中。然后加入3-羟基邻苯二甲酸二甲酯 (0.578g,2.75mmol,1.1当量)和碳酸铯(2.24g,6.88mmol,2.75 当量)。将烧瓶配备回流冷凝器,并加热至80℃保持32小时。然后将混合物冷却至室温,用EtOAc稀释并用水洗涤三次。将有机层用 硫酸钠干燥,过滤并减压下浓缩。通过柱色谱(ISCO,4g二氧化硅 柱,0至15%MeOH/DCM,历经15分钟梯度)纯化,得到黄色固体 (0.394g,0.960mmol,38%,2步骤)。1H NMR(400MHz,氯仿-d) δ7.65–7.56(m,1H),7.50–7.41(m,1H),7.27(s,1H),7.11(dd,J =8.4,4.1Hz,2H),5.17(s,1H),4.57(d,J=6.3Hz,2H),3.94(s, 2H),3.88(s,2H),3.40(p,J=5.8Hz,4H),3.32–3.19(m,4H),1.39(d,J=5.7Hz,13H).13C NMR(100MHz,cdcl3)δ168.37,168.23, 165.73,156.13,154.71,131.24,130.09,124.85,123.49,117.24, 79.42,68.48,53.22,52.83,40.43,39.54,28.44.LCMS 411.45(M+H)。
(3)二乙基乙酰基-O-沙利度胺三氟乙酸酯的合成
将3-(2-((2-((叔丁氧基羰基)氨基)乙基)氨基)-2-氧代乙氧基)邻 苯二甲酸二甲酯(0.39g,0.970mmol,1当量)溶于EtOH(9.7mL, 0.1M)中。加入3M NaOH水溶液(0.97mL,2.91mmol,3当量), 将混合物加热3小时至80℃。将混合物冷却至室温,用50mL DCM、 5mL1M HCl和20mL水稀释。分离各层,有机层用20mL水洗涤。 然后将合并的水层用50mL氯仿萃取3次。将合并的有机层用硫酸 钠干燥,过滤并减压下浓缩,得到黄色固体(0.226g),其不经进一步 纯化而继续使用。LCMS 383.36。
将得到的黄色固体(0.226g)和3-氨基哌啶-2,6-二酮盐酸盐 (0.102g,0.6197mmol,1当量)溶于吡啶(6.2mL,0.1M)中,并加热 16小时至110℃。将混合物冷却至室温并减压下浓缩,得到(2-(2- ((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰氨基)乙 基)氨基甲酸叔丁酯,为难溶性黑色焦油(0.663g),其不经纯化而继 续进行(因溶解性差)。LCMS 475.42(M+H)。
将粗制的(2-(2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉- 4-基)氧基)乙酰氨基)乙基)氨基甲酸叔丁酯溶于TFA(10mL),并加 热3.5小时至50℃,然后减压下浓缩。通过制备型HPLC纯化,得 到红色油状物(176.7mg,0.362mmol,3步骤,收率37%)。1HNMR(400MHz,甲醇-d4)δ7.85–7.76(m,1H),7.57–7.50(m,1H), 7.48–7.41(m,1H),5.13(dd,J=12.6,5.5Hz,1H),4.81(s,2H), 3.62(td,J=5.6,1.8Hz,2H),3.14(t,J=5.8Hz,2H),2.97(s,1H), 2.80–2.66(m,2H),2.15(dddd,J=10.1,8.0,5.8,2.8Hz,1H).13C NMR(100MHz,cd3od)δ173.09,170.00,169.99,166.78,166.62, 154.93,136.88,133.46,120.71,117.93,116.77,68.29,49.17,39.37, 38.60,30.73,22.19.LCMS 375.30(游离碱的M+H)。
合成例69:二氨基丁基-乙酰基-O-沙利度胺三氟乙酸盐的合成
根据Fischer et al.Nature,2014,512,49–53中的方法制备二氨基丁 基-乙酰基-O-沙利度胺三氟乙酸酯。
合成例70:二氨基己基-乙酰基-O-沙利度胺三氟乙酸酯的合成
(1)(6-(2-氯乙酰氨基)己基)氨基甲酸叔丁酯的合成
将(6-氨基己基)氨基甲酸叔丁酯(0.224mL,1.0mmol,1当量) 溶于THF(10mL,0.1M)。加入DIPEA(0.17mL,1.0mmol,1当 量),将混合物冷却至0℃。加入氯乙酰氯(88微升,1.1mmol,1.1 当量),将混合物温热至室温并搅拌18小时。然后将混合物用 EtOAc稀释并用饱和碳酸氢钠,水和盐水洗涤。将有机层用硫酸钠 干燥,过滤并减压下浓缩,得到白色固体(0.2691g,0.919mmol, 92%)。1H NMR(400MHz,氯仿-d)δ6.60(s,1H),4.51(s,1H),4.05(s,2H),3.30(q,J=6.9Hz,2H),3.11(d,J=6.7Hz,2H),1.57– 1.46(m,4H),1.44(s,9H),1.38–1.32(m,4H).LCMS 293.39 (M+H)。
(2)3-(2-((6-((叔丁氧基羰基)氨基)己基)氨基)-2-氧代乙氧基)邻苯二甲 酸二甲酯的合成
将(6-(2-氯乙酰氨基)己基)氨基甲酸叔丁酯(0.2691g,0.919 mmol,1当量)溶于MeCN(9.2mL,0.1M)。加入3-羟基邻苯二甲酸 二甲酯(0.212g,1.01mmol,1.1当量)和碳酸铯(0.823g,2.53mmol, 2.75当量)。将烧瓶配备回流冷凝器并加热至80℃保持14小时。将 混合物冷却至室温并用EtOAc稀释,用水洗涤三次并用EtOAc反萃 取一次。将合并的有机层用硫酸钠干燥,过滤并减压下浓缩。通过 柱色谱(ISCO,12g二氧化硅柱,至15%MeOH/DCM,15分钟梯 度)纯化粗物质,得到黄色油状物(0.304g,0.651mmol,71%)。1H NMR(400MHz,氯仿-d)δ7.66–7.58(m,1H),7.44(td,J=8.2,1.6 Hz,1H),7.15–7.08(m,1H),6.96(s,1H),4.56(s,2H),3.92(t,J= 1.6Hz,3H),3.88(t,J=1.6Hz,3H),3.27(q,J=6.9Hz,2H),3.10–3.00(m,2H),1.41(s,13H),1.33–1.22(m,4H).13C NMR(100MHz, cdcl3)δ167.97,167.37,165.58,155.95,154.37,130.97,129.74, 124.94,123.26,116.81,78.96,68.04,52.89,52.87,52.69,52.67, 40.41,38.96,29.88,29.13,28.39,26.33,26.30.LCMS 467.49。
(3)二氨基己基-乙酰基-O-沙利度胺三氟乙酸酯的合成
将3-(2-((6-((叔丁氧基羰基)氨基)己基)氨基)-2-氧代乙氧基)邻 苯二甲酸二甲酯(0.304g,0.651mmol,1当量)溶于EtOH(6.5mL, 0.1M)。加入3M NaOH水溶液(0.65mL,1.953mmol,3当量),将 混合物加热18小时至80℃。将混合物冷却至室温并用50mL DCM 和10mL 0.5M HCl稀释。分离各层,有机层用20mL水洗涤。然 后将合并的水层用氯仿萃取3次。将合并的有机层用硫酸钠干燥,过 滤并减压下浓缩,得到黄色泡沫(0.290g),其不经进一步纯化而继续 使用LCMS 439.47。
将得到的黄色固体(0.290g)和3-氨基哌啶-2,6-二酮盐酸盐 (0.113g,0.69mmol,1当量)溶于吡啶(6.9mL,0.1M),并加热17 小时至110℃。将混合物冷却至室温并减压下浓缩,得到(6-(2-((2- (2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰氨基)己基 氨基甲酸叔丁酯,为黑色固体(0.4216g),其未经纯化而继续进行(因 溶解性差)。LCMS 531.41(M+H)。
将粗制的(6-(2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4- 基)氧基)乙酰氨基)己基)氨基甲酸叔丁酯(0.4216g)溶于TFA(10mL) 中,并加热2小时至50℃。减压下浓缩混合物,然后减压下浓缩。 通过制备型HPLC纯化,得到棕色固体(379.2mg)。1H NMR(400 MHz,甲醇-d4)δ7.79(dd,J=8.4,7.4Hz,1H),7.52(d,J=7.2Hz, 1H),7.42(d,J=8.4Hz,1H),5.13(dd,J=12.6,5.5Hz,1H),4.75(s, 2H),3.32(t,J=7.6Hz,2H),2.96–2.89(m,2H),2.89–2.65(m, 3H),2.16(ddt,J=10.4,5.4,2.9Hz,1H),1.63(dp,J=20.6,7.1Hz,4H),1.51–1.34(m,4H).13C NMR(100MHz,cd3od)δ174.57, 171.42,169.90,168.24,167.79,156.23,138.23,134.87,121.69, 119.22,117.98,69.36,50.53,40.64,39.91,32.14,30.01,28.44, 27.23,26.96,23.63.LCMS 431.37(M+H)。
合成例71:二氨基辛基-乙酰基-O-沙利度胺三氟乙酸酯的合成
(1)(8-(2-氯乙酰氨基)辛基)氨基甲酸叔丁酯的合成
将辛烷-1,8-二胺(1.65g,11.45mmol,5当量)溶于氯仿(50mL)。 在室温缓慢加入二碳酸二叔丁酯(0.54g,2.291mmol,1当量)于氯仿 (10mL)溶液,搅拌16小时,然后减压下浓缩。将固体物质重新悬浮 在DCM、MeOH、EtOAc和0.5N NH3(MeOH)的混合物中,通过硅 藻土过滤并减压下浓缩。通过柱色谱(ISCO,12g NH2-二氧化硅柱, 0至15%MeOH/DCM,15分钟梯度)纯化,得到所需产物和原料的 混合物(1.75g),其不经进一步纯化而继续使用。
将该混合物溶于THF(72mL)和DIPEA(1.25mL,7.16mmol) 中,并冷却至0℃。加入氯乙酰氯(0.63mL,7.88mmol),将混合物 温热至室温。16小时后,将混合物用EtOAc稀释,并用饱和碳酸氢 钠、水和盐水洗涤。通过柱色谱(ISCO,在二氧化硅上干燥负载,24 g柱,0至100%EtOAc/己烷,经21分钟梯度)纯化得到的混合物, 得到白色固体(0.56g,1.745mmol,76%,2步骤)。1H NMR(400 MHz,氯仿-d)δ6.55(s,1H),4.48(s,1H),4.05(s,2H),3.30(q,J= 6.9Hz,2H),3.10(d,J=6.2Hz,2H),1.44(s,12H),1.31(s,9H).13C NMR(100MHz,cdcl3)δ165.86,156.14,77.36,42.86,40.73,40.00, 30.18,29.44,29.26,28.59,26.86,26.82.LCMS 321.34(M+H)。
(2)3-(2-((8-((叔丁氧基羰基)氨基)辛基)氨基)-2-氧代乙氧基)邻苯二 甲酸二甲酯的合成
将(8-(2-氯乙酰氨基)辛基)氨基甲酸叔丁酯(0.468g,1.46mmol, 1当量)溶于MeCN(15mL,0.1M)。加入3-羟基邻苯二甲酸二甲酯 (0.337g,1.60mmol,1.1当量)和碳酸铯(1.308g,4.02mmol,2.75 当量)。将烧瓶配备回流冷凝器,并加热18小时至80℃。将混合物冷却至室温并用水稀释,用氯仿萃取一次,用EtOAc萃取两次。将 合并的有机层用硫酸钠干燥,过滤并减压下浓缩。
通过柱色谱(ISCO,24g二氧化硅柱,0至15%MeOH/DCM, 20分钟梯度)纯化粗物质,得到黄色油状物(0.434g,0.878mmol, 60%)。1H NMR(400MHz,氯仿-d)δ7.57(dd,J=7.9,0.8Hz,1H), 7.40(t,J=8.1Hz,1H),7.07(dd,J=8.4,0.7Hz,1H),6.89(t,J= 5.3Hz,1H),4.63(s,1H),4.52(s,2H),3.88(s,3H),3.83(s,3H), 3.22(q,J=6.9Hz,2H),3.01(q,J=6.4Hz,2H),1.36(s,12H),1.20 (s,9H).13C NMR(100MHz,cdcl3)δ167.89,167.29,165.54,155.97, 154.38,130.95,129.69,124.96,123.23,116.86,78.82,68.05,52.83, 52.82,52.66,52.64,40.54,39.06,29.97,29.19,29.10,29.06,28.40, 26.66,26.61.LCMS495.42(M+H).
(3)二氨基辛基-乙酰基-O-沙利度胺三氟乙酸酯的合成
将3-(2-((8-((叔丁氧基羰基)氨基)辛基)氨基)-2-氧代乙氧基)邻 苯二甲酸二甲酯(0.434g,0.878mmol,1当量)溶于EtOH(8.8mL, 0.1M)。加入3M NaOH水溶液(0.88mL,2.63mmol,3当量),将 混合物加热24小时至80℃。将混合物冷却至室温并用50mL DCM 和10mL 0.5M HCl稀释。分离各层,将有机层用20mL水洗涤。然 后将合并的水层用氯仿萃取3次。将合并的有机层用硫酸钠干燥,过 滤并减压下浓缩,得到黄色固体(0.329g),其不经进一步纯化而继续 使用。LCMS 467.41。
将得到的黄色固体(0.329g)和3-氨基哌啶-2,6-二酮盐酸盐 (0.121g,0.734mmol,1当量)溶于吡啶(7.3mL,0.1M),并加热 20小时至110℃。将混合物冷却至室温并减压下浓缩,得到(8-(2- ((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙酰氨基)辛 基)氨基甲酸叔丁酯,为黑色焦油状物(0.293g),其未经纯化而继续 使用(因溶解性差)。LCMS 559.45(M+H)。
将粗制的(8-(2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4- 基)氧基)乙酰氨基)辛基)氨基甲酸叔丁酯(0.293g)溶于TFA(10mL), 并加热4小时至50℃。减压下浓缩混合物,然后减压下浓缩。通过 制备型HPLC纯化,得到棕色残余物(114.69mg,23%,3步骤)。 1H NMR(400MHz,甲醇-d4)δ7.84–7.78(m,1H),7.54(d,J=7.3 Hz,1H),7.43(d,J=8.5Hz,1H),5.13(dd,J=12.5,5.5Hz,1H), 4.76(s,2H),3.32(d,J=4.1Hz,1H),3.30(d,J=3.3Hz,1H),2.94 –2.84(m,3H),2.80–2.70(m,2H),2.19–2.12(m,1H),1.67–1.55 (m,4H),1.40–1.34(m,8H).13C NMR(100MHz,cd3od)δ174.57, 171.37,169.85,168.26,167.78,156.26,138.22,134.91,121.70, 119.28,117.97,69.37,50.57,40.76,40.08,32.17,30.19,30.05, 30.01,28.52,27.68,27.33,23.63.LCMS 459.41(M+H)。
合成例72:N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙基)-2-((2- (2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)氧基)乙酰胺三氟 乙酸酯的合成
(1)(1-氯-2-氧代-7,10,13-三氧杂-3-氮杂十六烷-16-基)氨基甲酸叔丁 酯的合成
将(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙基)氨基甲酸叔丁酯 (1.0g,3.12mmol,1当量)溶于THF(31mL,0.1M)。加入 DIPEA(0.543mL,3.12mmol,1当量),将溶液冷却至0℃。加入 氯乙酰氯(0.273mL,3.43mmol,1.1当量),将混合物缓慢温热至室 温。24小时后,将混合物用EtOAc稀释,用饱和碳酸氢钠、水和盐 水洗涤。将有机层用硫酸钠干燥,过滤并浓缩,得到黄色油状物 (1.416g),其不经进一步纯化而继续使用。1H NMR(400MHz,氯仿 -d)δ7.24(s,1H),5.00(s,1H),3.98–3.89(m,2H),3.54(dddt,J= 17.0,11.2,5.9,2.2Hz,10H),3.47–3.40(m,2H),3.37–3.31(m, 2H),3.17–3.07(m,2H),1.79–1.70(m,2H),1.67(p,J=6.1Hz, 2H),1.35(s,9H).13C NMR(100MHz,cdcl3)δ165.83,155.97, 78.75,70.49,70.47,70.38,70.30,70.14,69.48,42.61,38.62,38.44, 29.62,28.59,28.40.LCMS397.37(M+H)。
(2)3-((2,2-二甲基-4,20-二氧代-3,9,12,15-四氧杂-5,19-二氮杂二十二 烷-21-基)氧基)邻苯二甲酸二甲酯的合成
将(1-氯-2-氧代-7,10,13-三氧杂-3-氮杂十六烷-16-基)氨基甲酸 叔丁酯(1.41g,3.12mmol,1当量)溶于MeCN(32mL,0.1M)。加 入3-羟基邻苯二甲酸二甲酯(0.721g,3.43mmol,1.1当量)和碳酸铯 (2.80g,8.58mmol,2.75当量)。将烧瓶配备回流冷凝器,并加热 19小时至80℃。将混合物冷却至室温并用水稀释,用氯仿萃取一次, 用EtOAc萃取两次。将合并的有机层用硫酸钠干燥,过滤并减压下 浓缩。通过柱色谱(ISCO,24g二氧化硅柱,0至15%MeOH/DCM, 22分钟梯度)纯化粗物质,得到黄色油状物(1.5892g,2.78mmol, 89%,两步骤)。1H NMR(400MHz,氯仿-d)δ7.52(d,J=7.8Hz, 1H),7.35(t,J=8.1Hz,1H),7.04(d,J=8.3Hz,1H),7.00(t,J= 5.3Hz,1H),5.06(s,1H),4.46(s,2H),3.83(s,3H),3.78(s,3H), 3.47(ddd,J=14.9,5.5,2.8Hz,8H),3.39(dt,J=9.4,6.0Hz,4H), 3.29(q,J=6.5Hz,2H),3.09(d,J=6.0Hz,2H),1.70(p,J=6.5Hz, 2H),1.63(p,J=6.3Hz,2H),1.31(s,9H).13C NMR(100MHz, cdcl3)δ167.68,167.36,165.45,155.93,154.41,130.87,129.60, 125.01,123.20,117.06,78.60,70.40,70.17,70.06,69.39,68.67, 68.25,52.77,52.57,38.38,36.58,29.55,29.20,28.34.LCMS 571.47 (M+H)。
(3)N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙基)-2-((2-(2,6-二氧代 哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸盐的合成
将3-((2,2-二甲基-4,20-二氧代-3,9,12,15-四氧杂-5,19-二氮杂二 十二烷-3-21-基)氧基)邻苯二甲酸二甲酯(1.589g,2.78mmol,1当 量)溶于EtOH(14mL,0.2M)。加入3MNaOH水溶液(2.8mL,8.34 mmol,3当量),将混合物加热22小时至80℃。然后将混合物冷却至室温,用50mL DCM和20mL 0.5M HCl稀释。分离各层,将有 机层用25mL水洗涤。合并水层,用50mL氯仿萃取三次。将合并 的有机溶剂用硫酸钠干燥,过滤并浓缩,得到1.53g物质,其不经 进一步纯化而继续使用。LCMS 553.44。
将所得物质(1.53g)和3-氨基哌啶-2,6-二酮盐酸盐(0.480g, 2.92mmol,1当量)溶于吡啶(11.7mL,0.25M),并加热17小时至 110℃。将混合物冷却至室温并减压下浓缩,得到粗制的(1-((2-(2,6- 二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基)-2-氧代-7,10,13-三氧 杂-3-氮杂十六烷-16-基)氨基甲酸叔丁酯,为黑色污泥(3.1491g),其 不经进一步纯化而继续使用。LCMS 635.47。
将粗制的(1-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基) 氧基)-2-氧代-7,10,13-三氧杂-3氮杂十六烷-16-基)氨基甲酸叔丁酯 (3.15g)溶于TFA(20mL)中,并加热2.5小时至50℃。将混合物冷却 至室温,用MeOH稀释并减压下浓缩。通过制备型HPLC纯化该物 质,得到N-(3-(2-(2-(3-氨基丙氧基)乙氧基)乙氧基)丙基)-2-((2-(2,6- 二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)氧基)乙酰胺三氟乙酸酯 (1.2438g,1.9598mmol,71%,3步骤),为深红色油状物。1H NMR(400MHz,甲醇-d4)δ7.77(dd,J=8.3,7.5Hz,1H),7.49(d,J =7.3Hz,1H),7.40(d,J=8.5Hz,1H),5.12(dd,J=12.8,5.5Hz,1H),4.75(s,2H),3.68–3.51(m,12H),3.40(t,J=6.8Hz,2H),3.10 (t,J=6.4Hz,2H),2.94–2.68(m,3H),2.16(dtd,J=12.6,5.4,2.5 Hz,1H),1.92(p,J=6.1Hz,2H),1.86–1.77(m,2H).13C NMR (100MHz,cd3od)δ173.17,169.97,168.48,166.87,166.30,154.82,136.89,133.41,120.29,117.67,116.58,69.96,69.68,69.60,68.87, 68.12,67.92,49.19,38.62,36.14,30.80,28.92,26.63,22.22.LCMS 536.41(M+H)。
合成例73:N-(6-氨基己基)-2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲 哚啉-5-甲酰胺的合成
(1)2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-5-羧酸的合成
将1,3-二氧代-1,3-二氢异苯并呋喃-5-羧酸(0.192g,1mmol,1 当量)和3-氨基哌啶-2,6-二酮盐酸盐(0.165g,1mmol,1当量)溶于 DMF(2.5mL)和乙酸(5mL),并加热24小时至80℃。然后将混合物 减压下浓缩并用EtOH稀释,从中缓慢形成沉淀物。将沉淀物用 EtOH洗涤两次,得到白色固体(84.8mg,0.28mmol,28%)。1H NMR(400MHz,DMSO-d6)δ13.74(s,1H),11.12(s,1H),8.39(dd, J=7.8,1.4Hz,1H),8.26(s,1H),8.04(d,J=7.8Hz,1H),5.18(dd, J=12.8,5.4Hz,1H),2.93–2.88(m,1H),2.84(d,J=4.7Hz,0H), 2.66–2.50(m,2H),2.12–1.99(m,1H).LCMS 303.19(M+H).
(2)(6-(2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-5-甲酰胺基)己 基)氨基甲酸叔丁酯的合成
将2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-5-羧酸(22.7 mg,0.0751mmol,1当量)和HATU(31.4mg,0.0826mmol,1.1 当量)溶于DMF(0.75mL)。5分钟后,加入DIPA(39.2微升,0.225 mmol,3当量)。再过5分钟后,加入(6-氨基己基)氨基甲酸叔丁酯(19.5mg,0.0901mmol,1.2当量)于DMF(0.75mL)的溶液。将混 合物搅拌20小时,然后用EtOAc稀释。将有机层用盐水洗涤三次, 经硫酸钠干燥并减压下浓缩。通过柱色谱(ISCO,4g柱,0至10% MeOH/DCM,25分钟梯度)纯化,得到黄色油状物(17.18mg, 0.03432mmol,46%)。1H NMR(400MHz,氯仿-d)δ8.29(d,J= 6.2Hz,2H),8.16(s,1H),7.94(d,J=8.4Hz,1H),6.91(s,1H),5.00 (dd,J=12.4,5.3Hz,1H),4.58(s,1H),3.47(q,J=6.7Hz,2H),3.14(q,J=8.5,7.3Hz,2H),2.97–2.69(m,3H),2.17(ddd,J=10.4, 4.8,2.6Hz,1H),1.65(p,J=6.9Hz,2H),1.53–1.32(m,15H).13C NMR(100MHz,cdcl3)δ174.69,170.77,167.86,166.67,165.27, 156.49,141.06,133.95,133.71,132.13,124.21,122.27,77.36,49.71,39.75,31.54,30.27,29.22,28.57,25.70,25.37,22.73.LCMS 501.28 (M+H)。
(3)N-(6-氨基己基)-2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-5- 甲酰胺的合成
将(6-(2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-5-甲酰胺基) 己基)氨基甲酸叔丁酯(17.18mg,0.343mmol,1当量)溶于TFA(1 mL),并加热2小时至50℃。减压下浓缩混合物,得到黄色油状物 (13.29mg),其纯度被认为足够,无需进一步纯化。1H NMR(400MHz,甲醇-d4)δ8.27(dd,J=9.3,1.3Hz,2H),7.99(d,J=7.6Hz, 1H),5.18(dd,J=12.5,5.4Hz,1H),3.48–3.40(m,2H),2.96–2.84 (m,3H),2.76(ddd,J=17.7,8.1,3.7Hz,2H),2.20–2.12(m,1H), 1.75–1.63(m,4H),1.53–1.43(m,4H).LCMS 401.31(M+H)。
合成例74:2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基) 氧基)乙酸的合成
(1)2-(2,6-二氧代哌啶-3-基)-4-羟基异吲哚啉-1,3-二酮的合成
将4-羟基异苯并呋喃-1,3-二酮(0.773g,4.71mmol,1当量)和 3-氨基哌啶-2,6-二酮盐酸盐(0.775g,4.71mmol,1当量)溶于吡啶 (19mL)中,并加热16小时至110℃。将混合物减压下浓缩,并通 过柱色谱(ISCO,12g硅胶柱,0至10%MeOH/DCM,25分钟梯度) 纯化,得到灰白色固体(1.14g,4.16mmol,88%)。1H NMR(400 MHz,DMSO-d6)δ11.19(s,1H),11.07(s,1H),7.65(dd,J=8.3,7.3 Hz,1H),7.31(d,J=7.2Hz,1H),7.24(d,J=8.4Hz,1H),5.07(dd, J=12.8,5.4Hz,1H),2.88(ddd,J=17.7,14.2,5.4Hz,1H),2.63– 2.50(m,2H),2.11–1.95(m,1H).LCMS 275.11(M+H)。
(2)2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4-基)氧基)乙酸叔 丁酯的合成
将2-(2,6-二氧代哌啶-3-基)-4-羟基异吲哚啉-1,3-二酮(218.8mg, 0.798mmol,1当量)溶于DMF(8mL)。加入碳酸钾(165.9mg, 1.20mmol,1.5当量),然后加入溴乙酸叔丁酯(118微升,0.798 mmol,1当量),将混合物在室温搅拌3小时。将混合物用EtOAc稀 释,用水洗涤一次,和用盐水洗涤两次。通过柱色谱(ISCO,12g硅 胶柱,0至100%EtOAc/己烷,17分钟梯度)纯化,得到白色固体(0.26g,0.669mmol,84%)。1H NMR(400MHz,氯仿-d)δ8.74(s,1H),7.61(dd,J=8.4,7.3Hz,1H),7.46–7.41(m,1H),7.06(d,J= 8.3Hz,1H),4.98–4.92(m,1H),4.74(s,2H),2.83–2.69(m,3H), 2.12–2.04(m,1H),1.43(s,9H).13C NMR(100MHz,cdcl3)δ 171.58,168.37,166.96,166.87,165.49,155.45,136.27,133.89, 119.78,117.55,116.83,83.05,66.52,49.20,31.37,28.03,22.55. LCMS 411.23(M+Na)。
(3)2-((2-(2,6-二氧代哌啶-3-基)-1,3-二氧代异吲哚啉-4-基)氧基)乙酸 的合成
在室温,将2-((2-(2,6-二氧代哌啶-3-基)-1,3-氧代异吲哚啉-4- 基)氧基)乙酸叔丁酯(47.5mg,0.122mmol,1当量)溶于TFA(1.3 mL)。3小时后,将混合物用DCM稀释,并在减压下浓缩,得到白 色固体(42.27mg),其纯度被认为足够,无需进一步纯化。1H NMR(400MHz,甲醇-d4)δ7.76(dd,J=8.5,7.3Hz,1H),7.50(d,J=7.3 Hz,1H),7.34(d,J=8.5Hz,1H),5.11(dd,J=12.5,5.5Hz,1H), 4.96(s,2H),2.87(ddd,J=17.8,14.2,5.0Hz,1H),2.80–2.65(m, 2H),2.18–2.09(m,1H).LCMS 333.15(M+H).
异双功能化合物药物组合物
在本申请的另一个方面,提供了药物组合物,其包含本文所述 的异双功能性化合物中的任一者(或前药、药学上可接受的盐或其它 药学上可接受的衍生物),并任选地包含药学上可接受的载体。根据 本申请,药学上可接受的衍生物包括但不限于药学上可接受的盐、酯、 这些酯的盐、或本申请化合物的前药或其它加合物或衍生物,其在向 有需要的患者给药时,能够直接或间接地提供如本文中另外描述的异 双功能性化合物、或其代谢物或残余物。
如本文所用,术语“药学上可接受的盐”是指彼等在合理的医学 判断范围内适合用于与人类和低等动物的组织接触而没有过度毒性, 刺激,过敏反应等,并与合理的利益/风险比相称的盐。胺、羧酸和 其他类型化合物的药学上可接受的盐是本领域熟知的。例如,S.M.Berge等人在J Pharmaceutical Sciences 66(1977):1-19中详细描 述了药学上可接受的盐,其通过引入方式并入本文。盐可以在本申请 的异双功能性化合物的最终单离和纯化过程中原位制备,或者通过使 游离碱或游离酸官能团与合适的试剂反应而单独制备,如下文所述。 例如,游离碱官能团可以与合适的酸反应。此外,当本申请的异双功 能性化合物带有酸性部分时,其合适的药学上可接受的盐可以包括金 属盐,例如碱金属盐,例如碱金属盐,如钠盐或钾盐;和碱土金属盐, 例如钙或镁盐。药学上可接受的无毒酸加成盐的实例是与无机酸,如 盐酸,氢溴酸,磷酸,硫酸和过氯酸或与有机酸如乙酸,草酸,马来 酸,酒石酸,柠檬酸,琥珀酸或丙二酸形成的氨基的盐,或通过使用 本领域中使用的其他方法如离子交换形成的氨基的盐。其他药学上可 接受的盐包括己二酸盐,藻酸盐,抗坏血酸盐,天冬氨酸盐,苯磺酸 盐,苯甲酸盐,硫酸氢盐,硼酸盐,丁酸盐,樟脑酸盐,樟脑磺酸盐, 柠檬酸盐,丙酸环戊烷,二葡糖酸盐,十二烷基硫酸盐,乙磺酸盐, 甲酸盐,富马酸盐,葡庚糖酸盐,甘油磷酸盐,葡萄糖酸盐,半硫酸 盐,庚酸盐,己酸盐,氢碘酸盐,2-羟基-乙磺酸盐,乳糖酸盐,乳 酸盐,月桂酸盐,月桂基硫酸盐,苹果酸盐,马来酸盐,丙二酸盐, 甲磺酸盐,2-萘磺酸盐,烟酸盐,硝酸盐,油酸盐,草酸盐,棕榈酸 盐,双羟萘酸盐,果胶酸盐,过硫酸盐,3-苯基丙酸盐,磷酸盐,苦 味酸盐,新戊酸盐,丙酸盐,硬脂酸盐,琥珀酸盐,硫酸盐,酒石酸盐,硫氰酸盐,对甲苯磺酸盐,十一酸盐,戊酸盐等。代表性的碱金 属或碱土金属盐包括钠,锂,钾,钙,镁等。适当时,其它药学上可 接受的盐包括使用抗衡离子如卤根,氢氧根,羧酸根,硫酸根,磷酸 根,硝酸根,低级烷基磺酸根和芳基磺酸根形成的无毒铵,季铵和胺 阳离子。
另外,如本文所用,术语“药学上可接受的酯”是指在体内水解 的酯,包括在人体中容易分解以留下母体异双功能性化合物或其盐的 酯。合适的酯基包括,例如,彼等衍生自药学上可接受的脂族羧酸, 特别是链烷酸,链烯酸,环烷酸和链烷二酸者,其中每个烷基或链烯 基部分有利地具有不超过6个碳原子。特定酯的实例包括甲酸酯,乙 酸酯,丙酸酯,丁酸酯,丙烯酸酯和乙基丁二酸酯。
此外,如本文所用的术语“药学上可接受的前药”是指彼等本申 请的异双功能性化合物的前药,其在合理的医学判断范围内,适合用 于与人类和低等动物的过度毒性,刺激,过敏反应等的问题接触,与 合理的益处/风险比相称,并且对其所欲用途有效,以及在可能的情 况下,本申请化合物的两性离子形式仍对其所欲用途有效。术语“前 药”是指在体内快速转化以产生上式的母体化合物的化合物,例如通 过在血液中水解。T.HiguchiandV.Stella,Pro-drugs as Novel Delivery Systems,Vol.14 of the A.C.S.SymposiumSeries,以及 Edward B.Rocheed.,Bioreversible Carriers in Drug Design, AmericanPharmaceutical Association and Pergamon Press,(1987) 中提供透彻的讨论,两者都通过引用方式并入本文。
如上所述,本申请的药物异双功能性化合物组合物另外包含药 学上可接受的载体,如本文所用,其包括适合于所需的特定剂型的任 何和所有溶剂,稀释剂或其他液体载剂,分散或悬浮助剂,表面活性 剂,等渗剂,增稠剂或乳化剂,防腐剂,固体粘合剂,润滑剂等, Remington's Pharmaceutical Sciences,Sixteenth Edition,E.W. Martin(MackPublishing Co.,Easton,Pa.,(1980))揭露了用于配制药 物组合物的各种载体和用于其制备的已知技术。除非任何常规载体介 质与本申请的化合物不相容,例如通过产生任何不希望的生物效应或 以有害的方式与药物组合物的任何其他组分相互作用,否则其用途被认为是在本申请的范畴。可用作药学上可接受的载体的材料的一些实 例包括但不限于糖,如乳糖,葡萄糖和蔗糖;淀粉,如玉米淀粉和马 铃薯淀粉;纤维素及其衍生物,如羧甲基纤维素钠,乙基纤维素和醋 酸纤维素;粉末黄蓍草;麦芽;明胶;滑石;辅料,如可可脂和栓剂蜡;油脂,如花生油,棉籽油;红花油,芝麻油;橄榄油;玉米油 和豆油;乙二醇;如丙二醇;酯类,如油酸乙酯和月桂酸乙酯;琼 脂;缓冲剂,如氢氧化镁和氢氧化铝;海藻酸;无热原水;渗盐水, 如林格氏液;乙醇和磷酸盐缓冲溶液,以及其他无毒相容润滑剂,如 十二烷基硫酸钠和硬脂酸镁,以及着色剂,脱模剂,涂层剂,甜味剂, 调味剂和芳香剂,防腐剂和抗氧化剂也可以根据配方设计师的判断, 而存在于组合物中。
用于口服给药的液体剂型包括但不限于药学上可接受的乳液, 微乳液,溶液,悬浮液,糖浆和酏剂。除活性化合物外,液体剂型可 含有本领域常用的惰性稀释剂,例如水或其它溶剂,增溶剂和乳化剂, 如乙醇,异丙醇,碳酸乙酯,乙酸乙酯,苄醇,苯甲酸苄酯,丙二醇, 1,3-丁二醇,二甲基甲酰胺,油(特别是棉籽油,花生油,玉米油, 胚芽油,橄榄油,蓖麻油和芝麻油),甘油,四氢糠醇,聚乙二醇和 脱水山梨糖醇的脂肪酸酯及其混合物。除惰性稀释剂外,口服组合物 还可包括佐剂,如润湿剂,乳化剂和悬浮剂,甜味剂,调味剂和芳香剂。
可以使用合适的分散剂或湿润剂和悬浮剂根据已知技术配制可 注射制剂,例如无菌可注射水性或油性悬浮液。无菌可注射制剂还可 以是在无毒的肠胃外可接受的稀释剂或溶剂中的无菌可注射溶液、悬 浮液或乳液,例如在1,3-丁二醇中的溶液。可以使用的可接受的载体 和溶剂是水、林格氏溶液、U.S.P和等渗氯化钠溶液。另外,无菌的 固定油通常用作溶剂或悬浮介质。为此目的,可以使用任何温和的固 定油,包括合成的甘油单酯或甘油二酯。此外,脂肪酸如油酸用于制 备注射剂。
可注射制剂可以灭菌,例如,通过细菌截留过滤器过滤,或通 过并入无菌固体组合物形式的灭菌剂,其可以在使用前溶解或分散在 无菌水或其它无菌可注射介质中。
为了延长药物的作用,通常需要减缓皮下或肌内注射的药物吸 收。这可以通过使用液体悬浮液或水溶性差的结晶或无定形材料来实 现。然后,药物的吸收速率取决于其溶解速率,而溶解速率又取决于 晶体大小和晶形。或者,通过将药物溶解或悬浮在油性载体中来实现 胃肠外给药的药物形式的延迟吸收。通过在可生物降解的聚合物如聚 丙交酯-聚乙交酯中形成药物的微囊基质来制备可注射的储库形式 (depot)。取决于药物与聚合物的比率和所用特定聚合物的性质,可 以控制药物释放速率。其他可生物降解的聚合物的实例包括聚(原酸 酯)和聚(酸酐)。还通过将药物包埋在与身体组织相容的脂质体或微 乳液中来制备储库型可注射制剂。
用于直肠或***给药的组合物优选是栓剂,其可以通过将本申 请的化合物与合适的无刺激性赋形剂或载体如可可脂、聚乙二醇或栓 剂蜡混合而制备,该载体在环境温度是固体,但在体温是液体,因此 在直肠或***腔内融化并释放出活性化合物。
用于口服给药的固体剂型包括囊剂,片剂,丸剂,粉剂和粒剂。 在这种固体剂型中,活性化合物与至少一种惰性、药学上可接受的赋 形剂或载体如柠檬酸钠或磷酸二钙和/或a)填充剂或增量剂,如淀粉, 乳糖,蔗糖,葡萄糖,甘露醇和硅酸,b)粘合剂,如羧甲基纤维素, 藻酸盐,明胶,聚乙烯吡咯烷酮,蔗糖和***胶,c)保湿剂,如甘 油,d)崩解剂,如琼脂,碳酸钙,马铃薯或木薯淀粉,海藻酸,某些 硅酸盐和碳酸钠,e)溶液延迟剂,如石蜡,f)吸收促进剂,如季铵化 合物,g)润湿剂,如鲸蜡醇和单硬脂酸甘油酯,h)吸收剂,如高岭土 和膨润土,和i)润滑剂,如滑石,硬脂酸钙,硬脂酸镁,固体聚乙二 醇,十二烷基硫酸钠及其混合物。在囊剂,片剂和丸剂的情况下,剂 型还可包含缓冲剂。
类似类型的固体组合物也可用作软和硬填充的明胶囊剂中的填 充剂,其使用诸如乳糖或奶糖以及高分子量聚乙二醇等赋形剂。片剂, 糖衣丸,胶囊,丸剂和粒剂的固体剂型可以用包衣和外壳制备,例如 肠溶包衣和药物配制领域熟知的其它包衣。它们可以任选地含有遮光 剂,并且还可以是仅在肠道的某一部分或优选地以延迟的方式在肠道 的某一部分释放活性成分的组合物。
可以使用的包埋组合物的实例包括聚合物质和蜡。类似类型的 固体组合物也可用作软和硬填充的明胶囊剂中的填充剂,其使用诸如 乳糖或奶糖以及高分子量聚乙二醇等赋形剂。
活性异双功能性化合物也可以是具有一种或多种上述赋形剂的 微胶囊形式。片剂,糖衣丸,胶囊,丸剂和粒剂的固体剂型可以用包 衣和外壳制备,例如肠溶包衣,释放控制包衣和药物配制领域熟知的 其它包衣。在这种固体剂型中,活性异双功能性化合物可以与至少一 种惰性稀释剂如蔗糖,乳糖和淀粉掺合。正常情况下,这些剂型还可 包含除惰性稀释剂以外的其它物质,例如压片(tableting)润滑剂和其 它压片助剂如硬脂酸镁和微晶纤维素。在胶囊,片剂和丸剂的情况下, 剂型还可包含缓冲剂。它们可以任选地含有遮光剂,并且还可以是仅 在肠道的某一部分或任选地以延迟的方式在肠道的某一部分释放活性 成分的组合物。可以使用的包埋组合物的实例包括聚合物质和蜡。
本申请包括本发明化合物的药学上可接受的局部制剂。如本文 所用,术语“药学上可接受的局部制剂”是指通过将制剂施用于表皮而 皮内施用本申请化合物的药学上可接受的任何制剂。在本申请的某些 具体例中,局部制剂包含载体***。药学上有效的载体包括但不限于 溶剂(例如,醇,多元醇,水),乳膏,洗剂,软膏,油,膏药,脂质 体,粉末,乳液,微乳液和缓冲溶液(例如,低渗或缓冲盐水)或本领 域已知的用于局部施用药物的任何其他载体。本领域标准的参考文献 提供了更完整的本领域已知的载体列表,例如,Remington's Pharmaceutical Sciences,第16版(1980)和第17版(1985),其均由 MackPublishing Company,Easton出版,其公开内容通过引用方式 整体并入本文。在某些其他具体例中,本申请的局部制剂可包含赋形 剂。本领域已知的任何药学上可接受的赋形剂可用于制备本发明的药 学上可接受的局部制剂。可包括在本申请的局部制剂中的赋形剂的实 例,包括但不限于,防腐剂,抗氧化剂,保湿剂,润肤剂,缓冲剂, 增溶剂,其他渗透剂,皮肤保护剂,表面活性剂和推进剂,和/或或 与本发明化合物组合使用的其他治疗剂。合适的防腐剂包括,但不限 于,醇,季胺,有机酸,对羟基苯甲酸酯和酚。合适的抗氧化剂包括, 但不限于,抗坏血酸及其酯,亚硫酸氢钠,丁基化羟基甲苯,丁基化 羟基苯甲醚,生育酚和螯合剂如EDTA和柠檬酸。合适的保湿剂包 括,但不限于,甘油,山梨糖醇,聚乙二醇,尿素和丙二醇。适用于 本申请的缓冲剂包括,但不限于,柠檬酸,盐酸和乳酸缓冲剂。合适 的增溶剂包括,但不限于,季铵氯化物,环糊精,苯甲酸苄酯,卵磷 脂和聚山梨醇酯。可用于本申请的局部制剂的合适的皮肤保护剂包括, 但不限于,维生素E油,尿囊素,聚二甲基硅氧烷,甘油,凡士林 和氧化锌。
在某些具体例中,本申请的药学上可接受的局部制剂包含至少 一种本申请的化合物和渗透增强剂。局部制剂的选择将取决于几个因 素,包括待治疗的病症,本发明化合物和存在的其它赋形剂的物理化 学特性,本发明化合物和存在的其它赋形剂在制剂中的稳定性,可用 的制造设备和成本限制。如本文所用,术语“渗透增强剂”是指能够将 药理活性化合物通过角质层并进入表皮或真皮,优选几乎没有或没有 全身吸收的剂。已经评估了广泛多种化合物在提高药物通过皮肤的渗 透速率方面的有效性。参见,例如,MaibachH.I.and Smith H.E. (eds.),Percutaneous Penetration Enhancers,CRC Press,Inc.,Boca Raton,Fla.(1995),其调查各种皮肤渗透促进剂的使用和测试,以及 Buyuktimkinet al.,Chemical Means of Transdermal Drug Permeation Enhancement inTransdermal and Topical Drug Delivery Systems,Gosh T,K.,Pfister W.R.,Yum S.I.(eds.),Interpharm Press Inc.,Buffalo Grove,III(1997)。在某些示例性具体例中,与本申请 一起使用的渗透剂包括但不限于甘油三酯(例如大豆油),芦荟组合物 (例如芦荟凝胶),乙醇,异丙醇,辛基苯基聚乙二醇,油酸,聚乙二 醇400,丙二醇,N-癸基甲基亚砜,脂肪酸酯(例如肉豆蔻酸异丙酯, 月桂酸甲酯,单油酸甘油酯和单油酸丙二醇酯)和N-甲基吡咯烷酮。
在某些具体例中,组合物可以是软膏,糊剂,乳膏,洗剂,凝 胶,粉剂,溶液,喷雾剂,吸入剂或贴剂的形式。在某些示例性具体 例中,根据本申请的组合物的制剂是乳膏,其可以进一步含有饱和或 不饱和脂肪酸,例如硬脂酸,棕榈酸,油酸,棕榈油酸,十六烷基或油基醇,以及特别优选是硬脂酸。本申请的乳膏还可含有非离子表面 活性剂,例如聚氧-40-硬脂酸酯。在某些具体例中,活性成分在无菌 条件下与药学上可接受的载体和任何所需的防腐剂或缓冲剂掺合。眼 科制剂,滴耳剂和滴眼剂也设想为包括在本申请的范畴内。另外,本 申请设想使用透皮贴剂,其具有提供化合物控制递送至身体的附加优 点。通过将化合物溶解或分配在适当的介质中来制备这种剂型。如上 述,渗透增强剂也可用于增加化合物在皮肤上的通量。可以通过提供 速率控制膜或通过将化合物分散在聚合物基质或凝胶中来控制速率。
还将理解,本申请的某些异双功能性化合物可以以游离形式存 在,以用于治疗,或在适当情况下,作为其药学上可接受的衍生物存 在。根据本申请,药学上可接受的衍生物包括,但不限于,本申请化 合物的药学上可接受的盐,酯,这些酯的盐,或化合物的前药或其它 加合物或衍生物,其在向患者给药时需要能够直接或间接地提供本文 另外描述的化合物或其代谢物或残余物。
在一个具体例中,将异双功能性化合物作为上述药物组合物中 的任一种,向有需要的宿主给药,以通过对合成内源性蛋白-dTAG杂 合蛋白的作用来停止感兴趣的蛋白的表达。或者,将异双功能性化 合物作为上述药物组合物中的任一种,施用于需要其的宿主,以通过 对合成内源性蛋白-dTAG杂合蛋白的作用而开始表达感兴趣的蛋白。
实施例
进一步提供了内源性蛋白质-dTAG杂合蛋白的示例性工程化的 实例,该内源性蛋白质-DTAG杂合蛋白具有能够被异双功能性化合 物结合或与其结合的dTAG,当暴露于异双功能性化合物时,该异双 功能性化合物被泛素蛋白酶体途径(UPP)降解。这些实施例仅是示例 性的而不是限制性的,而是用作通过靶向内源性蛋白质-dTAG杂合蛋 白的异双功能性化合物特异性降解靶标的来调节感兴趣的蛋白质的表 达的方法的说明。
实施例1:原蛋白转化酶枯草杆菌蛋白酶/KEXIN 9型(PCSK9)- dTAG
为了进一步描述通过使用本文考虑的dTAG靶向感兴趣的内源 性蛋白质以进行降解,示例了靶向示例性感兴趣的蛋白质PCSK9的 基因产物,用于***编码dTAG的核酸。
原蛋白转化酶枯草杆菌蛋白酶/KEXIN 9型(PCSK9)是一种控制 胆固醇体内平衡的酶。PCSK9调节肝脏中低密度脂蛋白(LDL)受体的 表达。LDLR与血液中的游离LDL胆固醇结合并内化,有效降低胆固 醇水平。当PCSK9失调时,该酶结合并降解LDLR,从而增加游离血 液胆固醇,导致高胆固醇血症。PCSK9的抑制或降解会恢复LDLC表 达并有效降低肝脏中的游离血胆固醇。由于游离LDL水平升高与心脏 病风险增加有关,因此减少PCKS9表达或活性的努力对社区非常重 要。
为了工程化内源性蛋白质-dTAG杂合蛋白,克隆了同源供体构 建体,其包括左同源区(内含子1的一部分),dTAG核酸序列(衍生自 dTAG FKBP*-SEQ.ID.NO.:2)与PCSK9的外显子1和右侧同源区 域(内含子2的一部分)框内克隆。将dTAG肽与2X甘氨酸连接子一起 框内克隆。为了启动同源重组,设计CRISPR sg RNA以靶向外显子 1中的编码序列PCSK9。CAS9表达诱导双股断裂,其通过使用供体 构建体作为模板的同源重组修复来修复。最终结果是具有dTAG核酸 的基因座与PCSK9的外显子1框内克隆。
如所得到的,包括框内dTAG核酸***物的所得核酸序列产生 如下基因组核酸序列,其中小写字母表示PCSK9基因组序列的内含 子序列,大写、下划线序列表示sg RNA靶标(GAGGGAGATTTGACACACACAGG)(SEQ.ID.NO.:45),ATG表示 PCSK9蛋白或PCSK9-dTAG杂合体的转录起始位点,大写字母表示 PCSK9蛋白的外显子编码序列,而大写、斜体字母表示框内***衍 生自具有2X甘氨酸接头(GGGGGG)(SEQ.ID.NO.:46)的dTAG核酸的 FKBP*。的。图2中提供了表示示例性HR策略的图式。
靶向PCSK9基因组基因座(SEQ.ID.NO.:47)
产生的PCSK9-dTAG杂合体(SEQ.ID.NO.:48)
实施例2:β-连环蛋白(CTNNB1)-dTAG
为了进一步描述通过使用本文考虑的dTAG靶向感兴趣的内源 性蛋白质进行降解,说明了用于dTAG***的示例性感兴趣的蛋白质 β-连环蛋白(CTNNB1)的靶向。
β-连环蛋白是由CTNNB1基因编码。β-连环蛋白调节细胞-细胞 粘附和作为WNT信号传导途径的下游效应子的基因转录。在正常条 件下,β-连环蛋白功能和表达经由βTrCPE3连接酶通过磷酸化和泛素 介导的破坏介导。通常,β-连环蛋白在与抑制性复合物结合时受到调 节,该复制性复合物包括轴蛋白、GSK3+和APC。在WNT刺激后, 轴蛋白被隔离到卷曲的受体,因此从破坏复合物释放出β-连环蛋白。 然后蛋白质易位至细胞核以结合TCF/LEF以激活转录程序。释放Wnt 配体后,游离的β-连环蛋白被GSK3β磷酸化,并通过TrCRPE3连接 酶的结合和泛素化而降解。
Wnt/β-连环蛋白途径经常在人类癌症中发生突变,在近25%的 肝细胞癌中观察到β-连环蛋白突变。在βTrCP结合位点内发现了复发 性突变,赋予致癌转录调节因子稳定性。虽然是一个真正的肿瘤学目 标,历史小分子程序已经失败,因为β-连环蛋白是一种相对扁平的蛋 白质,几乎没有已知的配体以高亲和力结合。这些数据暗示β-连环蛋 白作为靶向条件降解的示例性基因。
为了工程化内源性蛋白质-dTAG杂合蛋白,克隆了同源供体构 建体,其包含左同源区(内含子1的一部分),框内克隆CTNNB1的短 外显子1的dTAG核酸序列(衍生自dTAGFKBP*-SEQ.ID.NO.:2), 内含子2,外显子2和右侧同源区(内含子3的一部分)。将dTAG核酸序 列与2X甘氨酸连接子一起框内克隆。
为了启动同源重组,设计CRISPR sgRNA以靶向外显子2中的编 码序列β-连环蛋白。CAS9表达诱导双股断裂,其通过使用供体构建 体作为模板的同源重组修复来修复。最终结果是具有与CTNNB1的外 显子1框内克隆的dTAG核酸序列的基因座。
如所引出的,包含框内dTAG核酸***物的所得核酸序列产生 如下基因组核酸序列,其中小写字母表示CTNNB1基因组序列的内含 子序列,大写、下划线序列表示sgRNA靶标(TACCACAGCTCCTTCTCTGAGTGG)(SEQ.ID.NO.:49),ATG表 示CTNNB1蛋白(β-连环蛋白)或β-连环蛋白(CTNBB1)-dTAG杂合体 的转录起始位点,大写字母表示β-连环蛋白的外显子编码序列,以及 大写、斜体字母表示框内***衍生自具有2X甘氨酸连接子 (GGGGGG)(SEQ.ID.NO.:46)的dTAG核酸的FKBP*的。图3中提供 了表示示例性HR策略的图式。
CTNNB1基因组基因座(SEQ.ID.NO.:50)
产生的CTNNB1-dTAG杂合体(SEQ.ID.NO.:51)
在任何以下实施例中,可以使用dFKBP13-o和dFKBP 13-p或 dFKBP7-o和dFKBP7-p。
实施例3:
图4显示了用dFKBP7确认FKBP*融合蛋白的选择性降解的 实例。
dTAG基于FKBP*特异性配体对内源野生型FKBP的选择性预 测。在表达野生型FKBP12或FKBP*的293T细胞中,dFKBP7仅 在表达FKBP*的细胞中诱导靶向降解。进行用本发明中描述的异双 功能性分子处理的细胞的免疫印迹。将表达加HA标签的 FKBP12WT或FKBP*的293FT细胞(CRBN-WT或CRBN-/-)用指 定浓度的dFKBP7处理4小时。FKBP*而非FKBPWT的CRBN依 赖性降解证实了dFKBP7对突变体FKBP*的选择性活性。
实施例4:
图5A至B说明了一组dFKBP异双功能性化合物的剖面 (profiling),以测量差异降解活性的实例。
为了鉴定有效和选择性的dFKPB异双功能性化合物,通过荧光 素酶的替代水平测量靶向FKBP*降解的高通量测量。在这里, FKBP*外源表达为具有两种类型的荧光素酶的多顺反子转录物:纳 米荧光素酶(NLuc)和萤火虫荧光素酶(FLuc),其允许FKBP*蛋白质 水平的细胞标准化定量。FKBP*的降解测量为用指定浓度的 dFKBP处理4小时的野生型(图4A)或CRBN-/-(图4B)293FT细胞 的信号比(Nluc/Fluc)。信号比的降低表明FKBP*(Nluc)降解,并且 观察到以小脑蛋白依赖性方式有效降解FKBP*的分子(例如 dFKBP7)。
实施例5:
图6说明了用dFKBP7和dFKBP13(其为本发明中所述的异双 功能性化合物)对FKBP*融合蛋白的选择性降解的实例。
在表达野生型FKBP12或FKBP*的293T细胞中,用dFKBP7 和dFKBP13处理仅在表达FKBP*的细胞中诱导靶向降解。将同基 因293FT细胞(CRBN-WT或CRBN-/-)工程化以表达FKBP12WT或 FKBP*。用100nM dFKBP7或dFKBP13处理细胞4小时,然后制 备裂解物以用于西方免疫印迹分析。FKBP*而非FKBP12WT或内 源性FKBP12的CRBN依赖性降解证实了dFKBP7和dFKBP13对突 变体FKBP*的选择性。
实施例6:
图7说明了具有双功能性化合物dFKBP13的加HA标签的 FKBP12*的剂量依赖性降解的实例。
为了定义dFKB13异双功能性化合物的最佳浓度以诱导FKBP* 的降解,在用增加浓度的dFKBP13处理时测量降解。将同基因 293FT细胞(CRBN-WT或CRBN-/-)工程化以表达加HA标签的FKBP*。用指定剂量的dFKBP13处理细胞4小时,然后制备裂解物 以用于西方免疫印迹分析。这些数据证实了dFKBP13对加HA标签 的FKBP*的剂量和CRBN依赖性降解。
实施例7:
图8说明了加HA标签的FKBP*的dFKBP13依赖性降解的动 力学控制。
为了评估靶向降解FKBP*的动力学控制,通过增加持续时间 给药dFKBP13。将293FT细胞(CRBN-WT)工程化以表达加HA标 签的FKBP*。以指定的时间,用100nM dFKBP13处理细胞。收获 细胞,并对蛋白质裂解物进行免疫印迹以测量由dFKBP13诱发的加 HA标签的FKBP*降解的动力学。
实施例8:
图9说明了通过双功能性化合物dFKBP13确认FKBP*的 CRBN依赖性降解和蛋白酶体依赖性降解的实例。
将293FT细胞(CRBN-WT)工程化以表达FKBP*。在用 dFKBP13处理4小时之前,用1uM卡非佐米(蛋白酶体抑制剂), 0.5uM MLN4924(接合作用抑制剂)和10uM来那度胺(CRBN结合配 体)预处理细胞2小时。制备裂解物并进行西方免疫印迹分析。蛋白 酶体抑制剂卡非佐米挽救了dFKBP13对加HA标签的FKBP*的降 解,建立了蛋白酶体功能的要求。用NAE1抑制剂MLN4924预处理 挽救了加HA标签的FKBP*,建立了对CRL活性的依赖性,正如 所预期,基于cullin的泛素连接酶需要接合作用以进行性E3连接酶 活性。用过量的来那度胺预处理消除了dFKBP13依赖性FKBP*降 解,证实了CRBN参与降解的要求。
实施例9:
图10A至B证实了当与dTAG融合时目标蛋白的靶向降解。
为了测试dTAG技术在几种蛋白质类型中的一般效用,指定的 蛋白质与MV4中的dTAG融合;表达了11种白血病细胞。用指定 的dFKBP双功能性分子(dFKBP7和dFKBP13)处理时,通过蛋白质 印迹测量观察到靶向蛋白降解。用指定浓度的FKBP*选择性异双功 能性化合物处理细胞16小时,并观察到纳摩尔浓度的降解。
实施例10:
图11说明了证实N-端dTAG-KRAS降解的实例。
在N-端dTAG-KRAS中,dFKBP7处理导致有效降解以及p- AKT信号的下游降低,暗示过表达的内源性dTAG杂合体蛋白的生 物学相关性。用500nM dFKBP7处理细胞指定的时间。收获细胞并 进行免疫印迹以测量FKBP*-KRAS和KRAS信号传导的下游替代 物(例如,pMEK和pAKT)的降解。dTAG KRAS的过表达导致相关 下游信号传导途径的激活,如通过蛋白质印迹测量观察到p-AKT信 号的增加。
实施例11:
图12说明了dFKBP异双功能性化合物诱导dTAG-KRAS降解 的剖面。
为了鉴定表现最佳的dFKBP分子,在一系列dFKBP分子上分 析了dTAG-KRAS降解。表达dTAG-KRASG12V的NIH3T3细胞的 蛋白质印迹用1μM指定的dFKBP异双功能性化合物处理24小时。 收获细胞,并进行免疫印迹以测量FKBP*-KRAS和KRAS信号传 导的下游替代物(例如pMEK和pAKT)的降解。数据表明dFKBP9, dFKBP12和dFKBP13诱导FKBP*-KRAS的有效降解和下游信号 传导的抑制。
实施例12:
图13显示了用dFKBP13证实dTAG-KRAS的靶向降解的实例。
dFKBP13异双功能性分子在纳摩尔浓度下有效降解dTAG- KRAS。对以指定浓度的dFKBP13处理24小时的与KRAS的N-端 融合的表达FKBP*的NIH3T3细胞进行蛋白质印迹。收获细胞,并 进行免疫印迹以测量FKBP*-KRAS和KRAS信号传导的下游替代 物(例如,pMEK和pAKT)的降解。数据暗示dFKBP13诱发FKBP* -KRAS的有效降解并且有效地抑制下游信号传导,IC50>100nM。
实施例13:
图14显示了用dFKBP13靶向降解dTAG-KRAS的动力学控制 的实例。
为了评估dTAG-KRAS靶向降解的动力学控制,通过增加持续 时间给药dFKBP13。对用1μMdFKBP13处理指定时间的与KRAS 的N-端融合的表达FKBP*的NIH3T3细胞进行蛋白质印迹。收获细 胞,并进行免疫印迹以测量FKBP*-KRAS和KRAS信号传导的下 游替代物(例如,pMEK和pAKT)的降解。数据暗示dFKBP13早在 治疗后1小时就诱发FKBP*-KRAS的有效降解和下游信号传导的 抑制。
实施例14:
图15说明了证实异双功能性化合物dFKBP13对dTAG- KRASG12V的CRBN依赖性和蛋白酶体依赖性的降解。
NIH3T3细胞(CRBN-WT)被工程化以表达dTAG-KRASG12V。 在用dFKBP13处理4小时之前,将细胞用1uM卡非佐米(蛋白酶体 抑制剂),0.5uM MLN4924(氰基化抑制剂)和10uM来那度胺(CRBN 结合配体)预处理2小时。制备裂解物并进行蛋白质免疫印迹分析。 蛋白酶体抑制剂(卡非佐米)挽救了dFKBP13对dTAG-KRASG12V 的降解,确立了蛋白酶体功能的要求。用NAE1抑制剂MLN4924进 行的预处理挽救了dTAG-KRASG12V表达,建立了对CRL活性的 依赖性,如预期基于cullin的泛素连接酶需要接合作用以进行E3连 接酶的活性。用过量来那度胺进行的预处理废除了依赖于dFKBP13 的dTAG-KRASG12V降解,从而证实了CRBN参与降解的必要性。
实施例15:
图16显示了一个实例,该实例证实了用dFKBP13靶向降解致 癌的dTAG-KRAS等位基因。
dFKBP13异双功能性化合物有效降解dTAG-KRAS突变等位基 因。NIH3T3细胞经过工程化,可以表达WT或突变形式的氨基酸 甘氨酸12(G12C、G12D和G12V)的KRAS等位基因。用1uM的 dFKBP13处理表达融合KRAS等位基因的N-端的dTAG的NIH3T3 细胞的蛋白质印迹。收获细胞并免疫印迹以测量dTAG-KRAS的降 解和KRAS信号传导的下游替代物(例如pMEK和pAKT)。数据暗 示,dFKBP13诱导WT和突变KRAS等位基因的有效降解,并有效 抑制下游信号传导。
实施例16:
图17显示了一个实例,该实例证实了用dFKBP13靶向降解致 癌的dTAG-KRAS等位基因。
dFKBP13异双功能性化合物有效降解dTAG-KRAS突变等位基 因。NIH3T3细胞经过工程化,可以表达WT或突变KRAS等位基 因(G13D、Q61L和Q61R)。用1uM的dFKBP13处理表达融合 KRAS等位基因的N-端的dTAG的NIH3T3细胞的蛋白质印迹。收 获细胞并免疫印迹以测量dTAG-KRAS的降解和KRAS信号传导的 下游替代物(例如pMEK和pAKT)。数据暗示,dFKBP13诱导WT 和突变KRAS等位基因的有效降解,并有效抑制下游信号传导。
实施例17:
图18A至D说明了进行的实验,以确认在dTAG-KRAS降解 时诱发的表型变化。
如相差对比成像显示,在过表达dTAG-KRAS时在NIH3T3细 胞中观察到形态学变化。用dFKBP13处理24小时时,细胞在形态 上恢复到野生型(DMSO对照)状态。
实施例18:
图19A至D说明了dTAG-KRAS降解对NIH3T3细胞活力的 表型后果。
ATPlite 1步发光测定法基于由ATP与添加的荧光素酶和D-荧 光素的反应引起的光的产生来测量细胞中的细胞增殖和细胞毒性。信 号的减少表明细胞数量减少。为了评估dFKBP13对表达dTAG- KRAS的NIH3T3细胞中增殖的影响,通过ATP水平的替代测量来 评估生存力。用指定浓度的dFKBP处理细胞72小时,并使用 ATPlite测定法测量细胞活力。
实施例19:
图20显示了dTAG-KRAS降解对NIH3T3细胞的细胞周期谱 的表型结果。
NIH3T3细胞经过工程化以表达dTAG-KRASG12V。将表达 dTAG-KRASG12V的NIH3T3细胞用dFKBP7和dFKBP13处理48 小时,以诱导靶向性dTAG-KRASG12V降解。固定的细胞用碘化丙 啶染色并进行细胞周期分析。dFKBP7和dFKBP13的治疗导致S期 进入减少,这与内源性KRASG12V在驱动S期进入中的生物学作用 一致。这些数据与观察到的对dTAG-KRASG12V降解对细胞生存力 的影响一致。
实施例20:将CRISPR-CAS9和同源供体载体递送至肝脏
可以使用病毒和非病毒方法(如腺相关病毒或慢病毒)或基于脂 质的制剂来完成靶向基因治疗。例如,单个双顺反子载体***用于递 送靶向PCKS9或CTNNB1的sgRNA,其中CAS9从相邻启动子表 达。CRISPR载体和供体同源质粒都封装在聚(β-氨基酯)(PBAE)阳 离子聚合物中,与常规肝细胞相比,它们提供了靶向癌细胞的额外特 异性。PBAE纳米颗粒也是可生物降解的,或通过水解降解的,从 而在内化后在肿瘤细胞的细胞质中释放质粒DNA。PBAE封装的质 粒DNA将通过肝内动脉给药局部递送,并通过静脉内注射全身递送。 成功重组时,在给药异双功能性化合物后,会进行局部核心活检以确 认PCKS9基因产物或CTNNB1基因产物的降解。
已经参考本发明的具体例描述了本说明书。然而,本领域的普 通技术人员将理解,在不脱离如所附权利要求书所阐述的本发明的范 畴的情况下,可以进行各种修改和改变。因此,本说明书应被认为是 说明性的而不是限制性的,并且所有这样的修改旨在被包括在本发明 的范畴内。
序列表
<110> 达纳-法柏癌症研究所有限公司
<120> 用异双功能性化合物进行的可调节的内源性蛋白质降解
<130> 16010-025WO1
<150> 62/456,654
<151> 2017-02-08
<150> 62/457,127
<151> 2017-02-09
<160> 63
<170> PatentIn version 3.5
<210> 1
<211> 107
<212> PRT
<213> 智人
<400> 1
Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro
1 5 10 15
Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp
20 25 30
Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe
35 40 45
Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala
50 55 60
Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr
65 70 75 80
Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr
85 90 95
Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu
100 105
<210> 2
<211> 107
<212> PRT
<213> 人工序列
<220>
<223> 衍生自FKBP12的在氨基酸35位的苯丙氨酸(F)突变成缬氨酸(V)(F36V)的氨基酸序列
<400> 2
Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro
1 5 10 15
Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp
20 25 30
Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe
35 40 45
Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala
50 55 60
Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr
65 70 75 80
Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr
85 90 95
Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu
100 105
<210> 3
<211> 1362
<212> PRT
<213> 智人
<400> 3
Met Ser Ala Glu Ser Gly Pro Gly Thr Arg Leu Arg Asn Leu Pro Val
1 5 10 15
Met Gly Asp Gly Leu Glu Thr Ser Gln Met Ser Thr Thr Gln Ala Gln
20 25 30
Ala Gln Pro Gln Pro Ala Asn Ala Ala Ser Thr Asn Pro Pro Pro Pro
35 40 45
Glu Thr Ser Asn Pro Asn Lys Pro Lys Arg Gln Thr Asn Gln Leu Gln
50 55 60
Tyr Leu Leu Arg Val Val Leu Lys Thr Leu Trp Lys His Gln Phe Ala
65 70 75 80
Trp Pro Phe Gln Gln Pro Val Asp Ala Val Lys Leu Asn Leu Pro Asp
85 90 95
Tyr Tyr Lys Ile Ile Lys Thr Pro Met Asp Met Gly Thr Ile Lys Lys
100 105 110
Arg Leu Glu Asn Asn Tyr Tyr Trp Asn Ala Gln Glu Cys Ile Gln Asp
115 120 125
Phe Asn Thr Met Phe Thr Asn Cys Tyr Ile Tyr Asn Lys Pro Gly Asp
130 135 140
Asp Ile Val Leu Met Ala Glu Ala Leu Glu Lys Leu Phe Leu Gln Lys
145 150 155 160
Ile Asn Glu Leu Pro Thr Glu Glu Thr Glu Ile Met Ile Val Gln Ala
165 170 175
Lys Gly Arg Gly Arg Gly Arg Lys Glu Thr Gly Thr Ala Lys Pro Gly
180 185 190
Val Ser Thr Val Pro Asn Thr Thr Gln Ala Ser Thr Pro Pro Gln Thr
195 200 205
Gln Thr Pro Gln Pro Asn Pro Pro Pro Val Gln Ala Thr Pro His Pro
210 215 220
Phe Pro Ala Val Thr Pro Asp Leu Ile Val Gln Thr Pro Val Met Thr
225 230 235 240
Val Val Pro Pro Gln Pro Leu Gln Thr Pro Pro Pro Val Pro Pro Gln
245 250 255
Pro Gln Pro Pro Pro Ala Pro Ala Pro Gln Pro Val Gln Ser His Pro
260 265 270
Pro Ile Ile Ala Ala Thr Pro Gln Pro Val Lys Thr Lys Lys Gly Val
275 280 285
Lys Arg Lys Ala Asp Thr Thr Thr Pro Thr Thr Ile Asp Pro Ile His
290 295 300
Glu Pro Pro Ser Leu Pro Pro Glu Pro Lys Thr Thr Lys Leu Gly Gln
305 310 315 320
Arg Arg Glu Ser Ser Arg Pro Val Lys Pro Pro Lys Lys Asp Val Pro
325 330 335
Asp Ser Gln Gln His Pro Ala Pro Glu Lys Ser Ser Lys Val Ser Glu
340 345 350
Gln Leu Lys Cys Cys Ser Gly Ile Leu Lys Glu Met Phe Ala Lys Lys
355 360 365
His Ala Ala Tyr Ala Trp Pro Phe Tyr Lys Pro Val Asp Val Glu Ala
370 375 380
Leu Gly Leu His Asp Tyr Cys Asp Ile Ile Lys His Pro Met Asp Met
385 390 395 400
Ser Thr Ile Lys Ser Lys Leu Glu Ala Arg Glu Tyr Arg Asp Ala Gln
405 410 415
Glu Phe Gly Ala Asp Val Arg Leu Met Phe Ser Asn Cys Tyr Lys Tyr
420 425 430
Asn Pro Pro Asp His Glu Val Val Ala Met Ala Arg Lys Leu Gln Asp
435 440 445
Val Phe Glu Met Arg Phe Ala Lys Met Pro Asp Glu Pro Glu Glu Pro
450 455 460
Val Val Ala Val Ser Ser Pro Ala Val Pro Pro Pro Thr Lys Val Val
465 470 475 480
Ala Pro Pro Ser Ser Ser Asp Ser Ser Ser Asp Ser Ser Ser Asp Ser
485 490 495
Asp Ser Ser Thr Asp Asp Ser Glu Glu Glu Arg Ala Gln Arg Leu Ala
500 505 510
Glu Leu Gln Glu Gln Leu Lys Ala Val His Glu Gln Leu Ala Ala Leu
515 520 525
Ser Gln Pro Gln Gln Asn Lys Pro Lys Lys Lys Glu Lys Asp Lys Lys
530 535 540
Glu Lys Lys Lys Glu Lys His Lys Arg Lys Glu Glu Val Glu Glu Asn
545 550 555 560
Lys Lys Ser Lys Ala Lys Glu Pro Pro Pro Lys Lys Thr Lys Lys Asn
565 570 575
Asn Ser Ser Asn Ser Asn Val Ser Lys Lys Glu Pro Ala Pro Met Lys
580 585 590
Ser Lys Pro Pro Pro Thr Tyr Glu Ser Glu Glu Glu Asp Lys Cys Lys
595 600 605
Pro Met Ser Tyr Glu Glu Lys Arg Gln Leu Ser Leu Asp Ile Asn Lys
610 615 620
Leu Pro Gly Glu Lys Leu Gly Arg Val Val His Ile Ile Gln Ser Arg
625 630 635 640
Glu Pro Ser Leu Lys Asn Ser Asn Pro Asp Glu Ile Glu Ile Asp Phe
645 650 655
Glu Thr Leu Lys Pro Ser Thr Leu Arg Glu Leu Glu Arg Tyr Val Thr
660 665 670
Ser Cys Leu Arg Lys Lys Arg Lys Pro Gln Ala Glu Lys Val Asp Val
675 680 685
Ile Ala Gly Ser Ser Lys Met Lys Gly Phe Ser Ser Ser Glu Ser Glu
690 695 700
Ser Ser Ser Glu Ser Ser Ser Ser Asp Ser Glu Asp Ser Glu Thr Glu
705 710 715 720
Met Ala Pro Lys Ser Lys Lys Lys Gly His Pro Gly Arg Glu Gln Lys
725 730 735
Lys His His His His His His Gln Gln Met Gln Gln Ala Pro Ala Pro
740 745 750
Val Pro Gln Gln Pro Pro Pro Pro Pro Gln Gln Pro Pro Pro Pro Pro
755 760 765
Pro Pro Gln Gln Gln Gln Gln Pro Pro Pro Pro Pro Pro Pro Pro Ser
770 775 780
Met Pro Gln Gln Ala Ala Pro Ala Met Lys Ser Ser Pro Pro Pro Phe
785 790 795 800
Ile Ala Thr Gln Val Pro Val Leu Glu Pro Gln Leu Pro Gly Ser Val
805 810 815
Phe Asp Pro Ile Gly His Phe Thr Gln Pro Ile Leu His Leu Pro Gln
820 825 830
Pro Glu Leu Pro Pro His Leu Pro Gln Pro Pro Glu His Ser Thr Pro
835 840 845
Pro His Leu Asn Gln His Ala Val Val Ser Pro Pro Ala Leu His Asn
850 855 860
Ala Leu Pro Gln Gln Pro Ser Arg Pro Ser Asn Arg Ala Ala Ala Leu
865 870 875 880
Pro Pro Lys Pro Ala Arg Pro Pro Ala Val Ser Pro Ala Leu Thr Gln
885 890 895
Thr Pro Leu Leu Pro Gln Pro Pro Met Ala Gln Pro Pro Gln Val Leu
900 905 910
Leu Glu Asp Glu Glu Pro Pro Ala Pro Pro Leu Thr Ser Met Gln Met
915 920 925
Gln Leu Tyr Leu Gln Gln Leu Gln Lys Val Gln Pro Pro Thr Pro Leu
930 935 940
Leu Pro Ser Val Lys Val Gln Ser Gln Pro Pro Pro Pro Leu Pro Pro
945 950 955 960
Pro Pro His Pro Ser Val Gln Gln Gln Leu Gln Gln Gln Pro Pro Pro
965 970 975
Pro Pro Pro Pro Gln Pro Gln Pro Pro Pro Gln Gln Gln His Gln Pro
980 985 990
Pro Pro Arg Pro Val His Leu Gln Pro Met Gln Phe Ser Thr His Ile
995 1000 1005
Gln Gln Pro Pro Pro Pro Gln Gly Gln Gln Pro Pro His Pro Pro
1010 1015 1020
Pro Gly Gln Gln Pro Pro Pro Pro Gln Pro Ala Lys Pro Gln Gln
1025 1030 1035
Val Ile Gln His His His Ser Pro Arg His His Lys Ser Asp Pro
1040 1045 1050
Tyr Ser Thr Gly His Leu Arg Glu Ala Pro Ser Pro Leu Met Ile
1055 1060 1065
His Ser Pro Gln Met Ser Gln Phe Gln Ser Leu Thr His Gln Ser
1070 1075 1080
Pro Pro Gln Gln Asn Val Gln Pro Lys Lys Gln Glu Leu Arg Ala
1085 1090 1095
Ala Ser Val Val Gln Pro Gln Pro Leu Val Val Val Lys Glu Glu
1100 1105 1110
Lys Ile His Ser Pro Ile Ile Arg Ser Glu Pro Phe Ser Pro Ser
1115 1120 1125
Leu Arg Pro Glu Pro Pro Lys His Pro Glu Ser Ile Lys Ala Pro
1130 1135 1140
Val His Leu Pro Gln Arg Pro Glu Met Lys Pro Val Asp Val Gly
1145 1150 1155
Arg Pro Val Ile Arg Pro Pro Glu Gln Asn Ala Pro Pro Pro Gly
1160 1165 1170
Ala Pro Asp Lys Asp Lys Gln Lys Gln Glu Pro Lys Thr Pro Val
1175 1180 1185
Ala Pro Lys Lys Asp Leu Lys Ile Lys Asn Met Gly Ser Trp Ala
1190 1195 1200
Ser Leu Val Gln Lys His Pro Thr Thr Pro Ser Ser Thr Ala Lys
1205 1210 1215
Ser Ser Ser Asp Ser Phe Glu Gln Phe Arg Arg Ala Ala Arg Glu
1220 1225 1230
Lys Glu Glu Arg Glu Lys Ala Leu Lys Ala Gln Ala Glu His Ala
1235 1240 1245
Glu Lys Glu Lys Glu Arg Leu Arg Gln Glu Arg Met Arg Ser Arg
1250 1255 1260
Glu Asp Glu Asp Ala Leu Glu Gln Ala Arg Arg Ala His Glu Glu
1265 1270 1275
Ala Arg Arg Arg Gln Glu Gln Gln Gln Gln Gln Arg Gln Glu Gln
1280 1285 1290
Gln Gln Gln Gln Gln Gln Gln Ala Ala Ala Val Ala Ala Ala Ala
1295 1300 1305
Thr Pro Gln Ala Gln Ser Ser Gln Pro Gln Ser Met Leu Asp Gln
1310 1315 1320
Gln Arg Glu Leu Ala Arg Lys Arg Glu Gln Glu Arg Arg Arg Arg
1325 1330 1335
Glu Ala Met Ala Ala Thr Ile Asp Met Asn Phe Gln Ser Asp Leu
1340 1345 1350
Leu Ser Ile Phe Glu Glu Asn Leu Phe
1355 1360
<210> 4
<211> 595
<212> PRT
<213> 智人
<400> 4
Met Thr Met Thr Leu His Thr Lys Ala Ser Gly Met Ala Leu Leu His
1 5 10 15
Gln Ile Gln Gly Asn Glu Leu Glu Pro Leu Asn Arg Pro Gln Leu Lys
20 25 30
Ile Pro Leu Glu Arg Pro Leu Gly Glu Val Tyr Leu Asp Ser Ser Lys
35 40 45
Pro Ala Val Tyr Asn Tyr Pro Glu Gly Ala Ala Tyr Glu Phe Asn Ala
50 55 60
Ala Ala Ala Ala Asn Ala Gln Val Tyr Gly Gln Thr Gly Leu Pro Tyr
65 70 75 80
Gly Pro Gly Ser Glu Ala Ala Ala Phe Gly Ser Asn Gly Leu Gly Gly
85 90 95
Phe Pro Pro Leu Asn Ser Val Ser Pro Ser Pro Leu Met Leu Leu His
100 105 110
Pro Pro Pro Gln Leu Ser Pro Phe Leu Gln Pro His Gly Gln Gln Val
115 120 125
Pro Tyr Tyr Leu Glu Asn Glu Pro Ser Gly Tyr Thr Val Arg Glu Ala
130 135 140
Gly Pro Pro Ala Phe Tyr Arg Pro Asn Ser Asp Asn Arg Arg Gln Gly
145 150 155 160
Gly Arg Glu Arg Leu Ala Ser Thr Asn Asp Lys Gly Ser Met Ala Met
165 170 175
Glu Ser Ala Lys Glu Thr Arg Tyr Cys Ala Val Cys Asn Asp Tyr Ala
180 185 190
Ser Gly Tyr His Tyr Gly Val Trp Ser Cys Glu Gly Cys Lys Ala Phe
195 200 205
Phe Lys Arg Ser Ile Gln Gly His Asn Asp Tyr Met Cys Pro Ala Thr
210 215 220
Asn Gln Cys Thr Ile Asp Lys Asn Arg Arg Lys Ser Cys Gln Ala Cys
225 230 235 240
Arg Leu Arg Lys Cys Tyr Glu Val Gly Met Met Lys Gly Gly Ile Arg
245 250 255
Lys Asp Arg Arg Gly Gly Arg Met Leu Lys His Lys Arg Gln Arg Asp
260 265 270
Asp Gly Glu Gly Arg Gly Glu Val Gly Ser Ala Gly Asp Met Arg Ala
275 280 285
Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn
290 295 300
Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu
305 310 315 320
Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro
325 330 335
Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg
340 345 350
Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val
355 360 365
Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu
370 375 380
Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro Gly
385 390 395 400
Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys
405 410 415
Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser
420 425 430
Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu
435 440 445
Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser
450 455 460
Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu Asp
465 470 475 480
Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr
485 490 495
Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser
500 505 510
His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met
515 520 525
Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Met Leu
530 535 540
Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val
545 550 555 560
Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser
565 570 575
His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro
580 585 590
Ala Thr Val
595
<210> 5
<211> 245
<212> PRT
<213> 人工序列
<220>
<223> ***受体配体结合域
<400> 5
Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu
1 5 10 15
Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro
20 25 30
Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg
35 40 45
Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val
50 55 60
Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu
65 70 75 80
Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro Gly
85 90 95
Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys
100 105 110
Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser
115 120 125
Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu
130 135 140
Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser
145 150 155 160
Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu Asp
165 170 175
Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr
180 185 190
Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser
195 200 205
His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met
210 215 220
Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Met Leu
225 230 235 240
Asp Ala His Arg Leu
245
<210> 6
<211> 920
<212> PRT
<213> 智人
<400> 6
Met Glu Val Gln Leu Gly Leu Gly Arg Val Tyr Pro Arg Pro Pro Ser
1 5 10 15
Lys Thr Tyr Arg Gly Ala Phe Gln Asn Leu Phe Gln Ser Val Arg Glu
20 25 30
Val Ile Gln Asn Pro Gly Pro Arg His Pro Glu Ala Ala Ser Ala Ala
35 40 45
Pro Pro Gly Ala Ser Leu Leu Leu Leu Gln Gln Gln Gln Gln Gln Gln
50 55 60
Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
65 70 75 80
Glu Thr Ser Pro Arg Gln Gln Gln Gln Gln Gln Gly Glu Asp Gly Ser
85 90 95
Pro Gln Ala His Arg Arg Gly Pro Thr Gly Tyr Leu Val Leu Asp Glu
100 105 110
Glu Gln Gln Pro Ser Gln Pro Gln Ser Ala Leu Glu Cys His Pro Glu
115 120 125
Arg Gly Cys Val Pro Glu Pro Gly Ala Ala Val Ala Ala Ser Lys Gly
130 135 140
Leu Pro Gln Gln Leu Pro Ala Pro Pro Asp Glu Asp Asp Ser Ala Ala
145 150 155 160
Pro Ser Thr Leu Ser Leu Leu Gly Pro Thr Phe Pro Gly Leu Ser Ser
165 170 175
Cys Ser Ala Asp Leu Lys Asp Ile Leu Ser Glu Ala Ser Thr Met Gln
180 185 190
Leu Leu Gln Gln Gln Gln Gln Glu Ala Val Ser Glu Gly Ser Ser Ser
195 200 205
Gly Arg Ala Arg Glu Ala Ser Gly Ala Pro Thr Ser Ser Lys Asp Asn
210 215 220
Tyr Leu Gly Gly Thr Ser Thr Ile Ser Asp Asn Ala Lys Glu Leu Cys
225 230 235 240
Lys Ala Val Ser Val Ser Met Gly Leu Gly Val Glu Ala Leu Glu His
245 250 255
Leu Ser Pro Gly Glu Gln Leu Arg Gly Asp Cys Met Tyr Ala Pro Leu
260 265 270
Leu Gly Val Pro Pro Ala Val Arg Pro Thr Pro Cys Ala Pro Leu Ala
275 280 285
Glu Cys Lys Gly Ser Leu Leu Asp Asp Ser Ala Gly Lys Ser Thr Glu
290 295 300
Asp Thr Ala Glu Tyr Ser Pro Phe Lys Gly Gly Tyr Thr Lys Gly Leu
305 310 315 320
Glu Gly Glu Ser Leu Gly Cys Ser Gly Ser Ala Ala Ala Gly Ser Ser
325 330 335
Gly Thr Leu Glu Leu Pro Ser Thr Leu Ser Leu Tyr Lys Ser Gly Ala
340 345 350
Leu Asp Glu Ala Ala Ala Tyr Gln Ser Arg Asp Tyr Tyr Asn Phe Pro
355 360 365
Leu Ala Leu Ala Gly Pro Pro Pro Pro Pro Pro Pro Pro His Pro His
370 375 380
Ala Arg Ile Lys Leu Glu Asn Pro Leu Asp Tyr Gly Ser Ala Trp Ala
385 390 395 400
Ala Ala Ala Ala Gln Cys Arg Tyr Gly Asp Leu Ala Ser Leu His Gly
405 410 415
Ala Gly Ala Ala Gly Pro Gly Ser Gly Ser Pro Ser Ala Ala Ala Ser
420 425 430
Ser Ser Trp His Thr Leu Phe Thr Ala Glu Glu Gly Gln Leu Tyr Gly
435 440 445
Pro Cys Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly
450 455 460
Gly Gly Gly Gly Gly Gly Gly Gly Gly Glu Ala Gly Ala Val Ala Pro
465 470 475 480
Tyr Gly Tyr Thr Arg Pro Pro Gln Gly Leu Ala Gly Gln Glu Ser Asp
485 490 495
Phe Thr Ala Pro Asp Val Trp Tyr Pro Gly Gly Met Val Ser Arg Val
500 505 510
Pro Tyr Pro Ser Pro Thr Cys Val Lys Ser Glu Met Gly Pro Trp Met
515 520 525
Asp Ser Tyr Ser Gly Pro Tyr Gly Asp Met Arg Leu Glu Thr Ala Arg
530 535 540
Asp His Val Leu Pro Ile Asp Tyr Tyr Phe Pro Pro Gln Lys Thr Cys
545 550 555 560
Leu Ile Cys Gly Asp Glu Ala Ser Gly Cys His Tyr Gly Ala Leu Thr
565 570 575
Cys Gly Ser Cys Lys Val Phe Phe Lys Arg Ala Ala Glu Gly Lys Gln
580 585 590
Lys Tyr Leu Cys Ala Ser Arg Asn Asp Cys Thr Ile Asp Lys Phe Arg
595 600 605
Arg Lys Asn Cys Pro Ser Cys Arg Leu Arg Lys Cys Tyr Glu Ala Gly
610 615 620
Met Thr Leu Gly Ala Arg Lys Leu Lys Lys Leu Gly Asn Leu Lys Leu
625 630 635 640
Gln Glu Glu Gly Glu Ala Ser Ser Thr Thr Ser Pro Thr Glu Glu Thr
645 650 655
Thr Gln Lys Leu Thr Val Ser His Ile Glu Gly Tyr Glu Cys Gln Pro
660 665 670
Ile Phe Leu Asn Val Leu Glu Ala Ile Glu Pro Gly Val Val Cys Ala
675 680 685
Gly His Asp Asn Asn Gln Pro Asp Ser Phe Ala Ala Leu Leu Ser Ser
690 695 700
Leu Asn Glu Leu Gly Glu Arg Gln Leu Val His Val Val Lys Trp Ala
705 710 715 720
Lys Ala Leu Pro Gly Phe Arg Asn Leu His Val Asp Asp Gln Met Ala
725 730 735
Val Ile Gln Tyr Ser Trp Met Gly Leu Met Val Phe Ala Met Gly Trp
740 745 750
Arg Ser Phe Thr Asn Val Asn Ser Arg Met Leu Tyr Phe Ala Pro Asp
755 760 765
Leu Val Phe Asn Glu Tyr Arg Met His Lys Ser Arg Met Tyr Ser Gln
770 775 780
Cys Val Arg Met Arg His Leu Ser Gln Glu Phe Gly Trp Leu Gln Ile
785 790 795 800
Thr Pro Gln Glu Phe Leu Cys Met Lys Ala Leu Leu Leu Phe Ser Ile
805 810 815
Ile Pro Val Asp Gly Leu Lys Asn Gln Lys Phe Phe Asp Glu Leu Arg
820 825 830
Met Asn Tyr Ile Lys Glu Leu Asp Arg Ile Ile Ala Cys Lys Arg Lys
835 840 845
Asn Pro Thr Ser Cys Ser Arg Arg Phe Tyr Gln Leu Thr Lys Leu Leu
850 855 860
Asp Ser Val Gln Pro Ile Ala Arg Glu Leu His Gln Phe Thr Phe Asp
865 870 875 880
Leu Leu Ile Lys Ser His Met Val Ser Val Asp Phe Pro Glu Met Met
885 890 895
Ala Glu Ile Ile Ser Val Gln Val Pro Lys Ile Leu Ser Gly Lys Val
900 905 910
Lys Pro Ile Tyr Phe His Thr Gln
915 920
<210> 7
<211> 462
<212> PRT
<213> 智人
<400> 7
Met Asp Thr Lys His Phe Leu Pro Leu Asp Phe Ser Thr Gln Val Asn
1 5 10 15
Ser Ser Leu Thr Ser Pro Thr Gly Arg Gly Ser Met Ala Ala Pro Ser
20 25 30
Leu His Pro Ser Leu Gly Pro Gly Ile Gly Ser Pro Gly Gln Leu His
35 40 45
Ser Pro Ile Ser Thr Leu Ser Ser Pro Ile Asn Gly Met Gly Pro Pro
50 55 60
Phe Ser Val Ile Ser Ser Pro Met Gly Pro His Ser Met Ser Val Pro
65 70 75 80
Thr Thr Pro Thr Leu Gly Phe Ser Thr Gly Ser Pro Gln Leu Ser Ser
85 90 95
Pro Met Asn Pro Val Ser Ser Ser Glu Asp Ile Lys Pro Pro Leu Gly
100 105 110
Leu Asn Gly Val Leu Lys Val Pro Ala His Pro Ser Gly Asn Met Ala
115 120 125
Ser Phe Thr Lys His Ile Cys Ala Ile Cys Gly Asp Arg Ser Ser Gly
130 135 140
Lys His Tyr Gly Val Tyr Ser Cys Glu Gly Cys Lys Gly Phe Phe Lys
145 150 155 160
Arg Thr Val Arg Lys Asp Leu Thr Tyr Thr Cys Arg Asp Asn Lys Asp
165 170 175
Cys Leu Ile Asp Lys Arg Gln Arg Asn Arg Cys Gln Tyr Cys Arg Tyr
180 185 190
Gln Lys Cys Leu Ala Met Gly Met Lys Arg Glu Ala Val Gln Glu Glu
195 200 205
Arg Gln Arg Gly Lys Asp Arg Asn Glu Asn Glu Val Glu Ser Thr Ser
210 215 220
Ser Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu
225 230 235 240
Ala Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu
245 250 255
Asn Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala
260 265 270
Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His
275 280 285
Phe Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly
290 295 300
Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val
305 310 315 320
Lys Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser
325 330 335
Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu
340 345 350
Leu Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly
355 360 365
Cys Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser
370 375 380
Asn Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu
385 390 395 400
Glu Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala
405 410 415
Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys
420 425 430
Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp
435 440 445
Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met Thr
450 455 460
<210> 8
<211> 165
<212> PRT
<213> 大肠杆菌
<400> 8
Met Asn Ser Glu Ser Val Arg Ile Tyr Leu Val Ala Ala Met Gly Ala
1 5 10 15
Asn Arg Val Ile Gly Asn Gly Pro Asn Ile Pro Trp Lys Ile Pro Gly
20 25 30
Glu Gln Lys Ile Phe Arg Arg Leu Thr Glu Gly Lys Val Val Val Met
35 40 45
Gly Arg Lys Thr Phe Glu Ser Ile Gly Lys Pro Leu Pro Asn Arg His
50 55 60
Thr Leu Val Ile Ser Arg Gln Ala Asn Tyr Arg Ala Thr Gly Cys Val
65 70 75 80
Val Val Ser Thr Leu Ser His Ala Ile Ala Leu Ala Ser Glu Leu Gly
85 90 95
Asn Glu Leu Tyr Val Ala Gly Gly Ala Glu Ile Tyr Thr Leu Ala Leu
100 105 110
Pro His Ala His Gly Val Phe Leu Ser Glu Val His Gln Thr Phe Glu
115 120 125
Gly Asp Ala Phe Phe Pro Met Leu Asn Glu Thr Glu Phe Glu Leu Val
130 135 140
Ser Thr Glu Thr Ile Gln Ala Val Ile Pro Tyr Thr His Ser Val Tyr
145 150 155 160
Ala Arg Arg Asn Gly
165
<210> 9
<211> 297
<212> PRT
<213> 人工序列
<220>
<223> 细菌脱卤素酶
<400> 9
Met Ala Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu
1 5 10 15
Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly
20 25 30
Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Val Trp
35 40 45
Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro
50 55 60
Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe
65 70 75 80
Phe Asp Asp His Val Arg Phe Met Asp Ala Phe Ile Glu Ala Leu Gly
85 90 95
Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly
100 105 110
Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Phe
115 120 125
Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe
130 135 140
Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Lys
145 150 155 160
Leu Ile Ile Asp Gln Asn Val Phe Ile Glu Gly Thr Leu Pro Met Gly
165 170 175
Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro
180 185 190
Phe Leu Asn Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu
195 200 205
Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu
210 215 220
Tyr Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp
225 230 235 240
Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala
245 250 255
Lys Ser Leu Pro Asn Cys Lys Ala Val Asp Ile Gly Pro Gly Leu Asn
260 265 270
Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg
275 280 285
Trp Leu Ser Thr Leu Glu Ile Ser Gly
290 295
<210> 10
<211> 229
<212> PRT
<213> 人工序列
<220>
<223> 雄激素受体配体结合域
<400> 10
Asp Asn Asn Gln Pro Asp Ser Phe Ala Ala Leu Leu Ser Ser Leu Asn
1 5 10 15
Glu Leu Gly Glu Arg Gln Leu Val His Val Val Lys Trp Ala Lys Ala
20 25 30
Leu Pro Gly Phe Arg Asn Leu His Val Asp Asp Gln Met Ala Val Ile
35 40 45
Gln Tyr Ser Trp Met Gly Leu Met Val Phe Ala Met Gly Trp Arg Ser
50 55 60
Phe Thr Asn Val Asn Ser Arg Met Leu Tyr Phe Ala Pro Asp Leu Val
65 70 75 80
Phe Asn Glu Tyr Arg Met His Lys Ser Arg Met Tyr Ser Gln Cys Val
85 90 95
Arg Met Arg His Leu Ser Gln Glu Phe Gly Trp Leu Gln Ile Thr Pro
100 105 110
Gln Glu Phe Leu Cys Met Lys Ala Leu Leu Leu Phe Ser Ile Ile Pro
115 120 125
Val Asp Gly Leu Lys Asn Gln Lys Phe Phe Asp Glu Leu Arg Met Asn
130 135 140
Tyr Ile Lys Glu Leu Asp Arg Ile Ile Ala Cys Lys Arg Lys Asn Pro
145 150 155 160
Thr Ser Cys Ser Arg Arg Phe Tyr Gln Leu Thr Lys Leu Leu Asp Ser
165 170 175
Val Gln Pro Ile Ala Arg Glu Leu His Gln Phe Thr Phe Asp Leu Leu
180 185 190
Ile Lys Ser His Met Val Ser Val Asp Phe Pro Glu Met Met Ala Glu
195 200 205
Ile Ile Ser Val Gln Val Pro Lys Ile Leu Ser Gly Lys Val Lys Pro
210 215 220
Ile Tyr Phe His Thr
225
<210> 11
<211> 238
<212> PRT
<213> 人工序列
<220>
<223> 视黄酸受体配体结合域
<400> 11
Ser Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu
1 5 10 15
Ala Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu
20 25 30
Asn Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala
35 40 45
Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His
50 55 60
Phe Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly
65 70 75 80
Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val
85 90 95
Lys Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser
100 105 110
Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu
115 120 125
Leu Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly
130 135 140
Cys Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser
145 150 155 160
Asn Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu
165 170 175
Glu Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala
180 185 190
Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys
195 200 205
Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp
210 215 220
Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met Thr
225 230 235
<210> 12
<211> 110
<212> PRT
<213> 人工序列
<220>
<223> MDM2的N-端
<400> 12
Met Cys Asn Thr Asn Met Ser Val Pro Thr Asp Gly Ala Val Thr Thr
1 5 10 15
Ser Gln Ile Pro Ala Ser Glu Gln Glu Thr Leu Val Arg Pro Lys Pro
20 25 30
Leu Leu Leu Lys Leu Leu Lys Ser Val Gly Ala Gln Lys Asp Thr Tyr
35 40 45
Thr Met Lys Glu Val Leu Phe Tyr Leu Gly Gln Tyr Ile Met Thr Lys
50 55 60
Arg Leu Tyr Asp Glu Lys Gln Gln His Ile Val Tyr Cys Ser Asn Asp
65 70 75 80
Leu Leu Gly Asp Leu Phe Gly Val Pro Ser Phe Ser Val Lys Glu His
85 90 95
Arg Lys Ile Tyr Thr Met Ile Tyr Arg Asn Leu Val Val Val
100 105 110
<210> 13
<211> 801
<212> PRT
<213> 智人
<400> 13
Met Leu Gln Asn Val Thr Pro His Asn Lys Leu Pro Gly Glu Gly Asn
1 5 10 15
Ala Gly Leu Leu Gly Leu Gly Pro Glu Ala Ala Ala Pro Gly Lys Arg
20 25 30
Ile Arg Lys Pro Ser Leu Leu Tyr Glu Gly Phe Glu Ser Pro Thr Met
35 40 45
Ala Ser Val Pro Ala Leu Gln Leu Thr Pro Ala Asn Pro Pro Pro Pro
50 55 60
Glu Val Ser Asn Pro Lys Lys Pro Gly Arg Val Thr Asn Gln Leu Gln
65 70 75 80
Tyr Leu His Lys Val Val Met Lys Ala Leu Trp Lys His Gln Phe Ala
85 90 95
Trp Pro Phe Arg Gln Pro Val Asp Ala Val Lys Leu Gly Leu Pro Asp
100 105 110
Tyr His Lys Ile Ile Lys Gln Pro Met Asp Met Gly Thr Ile Lys Arg
115 120 125
Arg Leu Glu Asn Asn Tyr Tyr Trp Ala Ala Ser Glu Cys Met Gln Asp
130 135 140
Phe Asn Thr Met Phe Thr Asn Cys Tyr Ile Tyr Asn Lys Pro Thr Asp
145 150 155 160
Asp Ile Val Leu Met Ala Gln Thr Leu Glu Lys Ile Phe Leu Gln Lys
165 170 175
Val Ala Ser Met Pro Gln Glu Glu Gln Glu Leu Val Val Thr Ile Pro
180 185 190
Lys Asn Ser His Lys Lys Gly Ala Lys Leu Ala Ala Leu Gln Gly Ser
195 200 205
Val Thr Ser Ala His Gln Val Pro Ala Val Ser Ser Val Ser His Thr
210 215 220
Ala Leu Tyr Thr Pro Pro Pro Glu Ile Pro Thr Thr Val Leu Asn Ile
225 230 235 240
Pro His Pro Ser Val Ile Ser Ser Pro Leu Leu Lys Ser Leu His Ser
245 250 255
Ala Gly Pro Pro Leu Leu Ala Val Thr Ala Ala Pro Pro Ala Gln Pro
260 265 270
Leu Ala Lys Lys Lys Gly Val Lys Arg Lys Ala Asp Thr Thr Thr Pro
275 280 285
Thr Pro Thr Ala Ile Leu Ala Pro Gly Ser Pro Ala Ser Pro Pro Gly
290 295 300
Ser Leu Glu Pro Lys Ala Ala Arg Leu Pro Pro Met Arg Arg Glu Ser
305 310 315 320
Gly Arg Pro Ile Lys Pro Pro Arg Lys Asp Leu Pro Asp Ser Gln Gln
325 330 335
Gln His Gln Ser Ser Lys Lys Gly Lys Leu Ser Glu Gln Leu Lys His
340 345 350
Cys Asn Gly Ile Leu Lys Glu Leu Leu Ser Lys Lys His Ala Ala Tyr
355 360 365
Ala Trp Pro Phe Tyr Lys Pro Val Asp Ala Ser Ala Leu Gly Leu His
370 375 380
Asp Tyr His Asp Ile Ile Lys His Pro Met Asp Leu Ser Thr Val Lys
385 390 395 400
Arg Lys Met Glu Asn Arg Asp Tyr Arg Asp Ala Gln Glu Phe Ala Ala
405 410 415
Asp Val Arg Leu Met Phe Ser Asn Cys Tyr Lys Tyr Asn Pro Pro Asp
420 425 430
His Asp Val Val Ala Met Ala Arg Lys Leu Gln Asp Val Phe Glu Phe
435 440 445
Arg Tyr Ala Lys Met Pro Asp Glu Pro Leu Glu Pro Gly Pro Leu Pro
450 455 460
Val Ser Thr Ala Met Pro Pro Gly Leu Ala Lys Ser Ser Ser Glu Ser
465 470 475 480
Ser Ser Glu Glu Ser Ser Ser Glu Ser Ser Ser Glu Glu Glu Glu Glu
485 490 495
Glu Asp Glu Glu Asp Glu Glu Glu Glu Glu Ser Glu Ser Ser Asp Ser
500 505 510
Glu Glu Glu Arg Ala His Arg Leu Ala Glu Leu Gln Glu Gln Leu Arg
515 520 525
Ala Val His Glu Gln Leu Ala Ala Leu Ser Gln Gly Pro Ile Ser Lys
530 535 540
Pro Lys Arg Lys Arg Glu Lys Lys Glu Lys Lys Lys Lys Arg Lys Ala
545 550 555 560
Glu Lys His Arg Gly Arg Ala Gly Ala Asp Glu Asp Asp Lys Gly Pro
565 570 575
Arg Ala Pro Arg Pro Pro Gln Pro Lys Lys Ser Lys Lys Ala Ser Gly
580 585 590
Ser Gly Gly Gly Ser Ala Ala Leu Gly Pro Ser Gly Phe Gly Pro Ser
595 600 605
Gly Gly Ser Gly Thr Lys Leu Pro Lys Lys Ala Thr Lys Thr Ala Pro
610 615 620
Pro Ala Leu Pro Thr Gly Tyr Asp Ser Glu Glu Glu Glu Glu Ser Arg
625 630 635 640
Pro Met Ser Tyr Asp Glu Lys Arg Gln Leu Ser Leu Asp Ile Asn Lys
645 650 655
Leu Pro Gly Glu Lys Leu Gly Arg Val Val His Ile Ile Gln Ala Arg
660 665 670
Glu Pro Ser Leu Arg Asp Ser Asn Pro Glu Glu Ile Glu Ile Asp Phe
675 680 685
Glu Thr Leu Lys Pro Ser Thr Leu Arg Glu Leu Glu Arg Tyr Val Leu
690 695 700
Ser Cys Leu Arg Lys Lys Pro Arg Lys Pro Tyr Thr Ile Lys Lys Pro
705 710 715 720
Val Gly Lys Thr Lys Glu Glu Leu Ala Leu Glu Lys Lys Arg Glu Leu
725 730 735
Glu Lys Arg Leu Gln Asp Val Ser Gly Gln Leu Asn Ser Thr Lys Lys
740 745 750
Pro Pro Lys Lys Ala Asn Glu Lys Thr Glu Ser Ser Ser Ala Gln Gln
755 760 765
Val Ala Val Ser Arg Leu Ser Ala Ser Ser Ser Ser Ser Asp Ser Ser
770 775 780
Ser Ser Ser Ser Ser Ser Ser Ser Ser Asp Thr Ser Asp Ser Asp Ser
785 790 795 800
Gly
<210> 14
<211> 726
<212> PRT
<213> 智人
<400> 14
Met Ser Thr Ala Thr Thr Val Ala Pro Ala Gly Ile Pro Ala Thr Pro
1 5 10 15
Gly Pro Val Asn Pro Pro Pro Pro Glu Val Ser Asn Pro Ser Lys Pro
20 25 30
Gly Arg Lys Thr Asn Gln Leu Gln Tyr Met Gln Asn Val Val Val Lys
35 40 45
Thr Leu Trp Lys His Gln Phe Ala Trp Pro Phe Tyr Gln Pro Val Asp
50 55 60
Ala Ile Lys Leu Asn Leu Pro Asp Tyr His Lys Ile Ile Lys Asn Pro
65 70 75 80
Met Asp Met Gly Thr Ile Lys Lys Arg Leu Glu Asn Asn Tyr Tyr Trp
85 90 95
Ser Ala Ser Glu Cys Met Gln Asp Phe Asn Thr Met Phe Thr Asn Cys
100 105 110
Tyr Ile Tyr Asn Lys Pro Thr Asp Asp Ile Val Leu Met Ala Gln Ala
115 120 125
Leu Glu Lys Ile Phe Leu Gln Lys Val Ala Gln Met Pro Gln Glu Glu
130 135 140
Val Glu Leu Leu Pro Pro Ala Pro Lys Gly Lys Gly Arg Lys Pro Ala
145 150 155 160
Ala Gly Ala Gln Ser Ala Gly Thr Gln Gln Val Ala Ala Val Ser Ser
165 170 175
Val Ser Pro Ala Thr Pro Phe Gln Ser Val Pro Pro Thr Val Ser Gln
180 185 190
Thr Pro Val Ile Ala Ala Thr Pro Val Pro Thr Ile Thr Ala Asn Val
195 200 205
Thr Ser Val Pro Val Pro Pro Ala Ala Ala Pro Pro Pro Pro Ala Thr
210 215 220
Pro Ile Val Pro Val Val Pro Pro Thr Pro Pro Val Val Lys Lys Lys
225 230 235 240
Gly Val Lys Arg Lys Ala Asp Thr Thr Thr Pro Thr Thr Ser Ala Ile
245 250 255
Thr Ala Ser Arg Ser Glu Ser Pro Pro Pro Leu Ser Asp Pro Lys Gln
260 265 270
Ala Lys Val Val Ala Arg Arg Glu Ser Gly Gly Arg Pro Ile Lys Pro
275 280 285
Pro Lys Lys Asp Leu Glu Asp Gly Glu Val Pro Gln His Ala Gly Lys
290 295 300
Lys Gly Lys Leu Ser Glu His Leu Arg Tyr Cys Asp Ser Ile Leu Arg
305 310 315 320
Glu Met Leu Ser Lys Lys His Ala Ala Tyr Ala Trp Pro Phe Tyr Lys
325 330 335
Pro Val Asp Ala Glu Ala Leu Glu Leu His Asp Tyr His Asp Ile Ile
340 345 350
Lys His Pro Met Asp Leu Ser Thr Val Lys Arg Lys Met Asp Gly Arg
355 360 365
Glu Tyr Pro Asp Ala Gln Gly Phe Ala Ala Asp Val Arg Leu Met Phe
370 375 380
Ser Asn Cys Tyr Lys Tyr Asn Pro Pro Asp His Glu Val Val Ala Met
385 390 395 400
Ala Arg Lys Leu Gln Asp Val Phe Glu Met Arg Phe Ala Lys Met Pro
405 410 415
Asp Glu Pro Val Glu Ala Pro Ala Leu Pro Ala Pro Ala Ala Pro Met
420 425 430
Val Ser Lys Gly Ala Glu Ser Ser Arg Ser Ser Glu Glu Ser Ser Ser
435 440 445
Asp Ser Gly Ser Ser Asp Ser Glu Glu Glu Arg Ala Thr Arg Leu Ala
450 455 460
Glu Leu Gln Glu Gln Leu Lys Ala Val His Glu Gln Leu Ala Ala Leu
465 470 475 480
Ser Gln Ala Pro Val Asn Lys Pro Lys Lys Lys Lys Glu Lys Lys Glu
485 490 495
Lys Glu Lys Lys Lys Lys Asp Lys Glu Lys Glu Lys Glu Lys His Lys
500 505 510
Val Lys Ala Glu Glu Glu Lys Lys Ala Lys Val Ala Pro Pro Ala Lys
515 520 525
Gln Ala Gln Gln Lys Lys Ala Pro Ala Lys Lys Ala Asn Ser Thr Thr
530 535 540
Thr Ala Gly Arg Gln Leu Lys Lys Gly Gly Lys Gln Ala Ser Ala Ser
545 550 555 560
Tyr Asp Ser Glu Glu Glu Glu Glu Gly Leu Pro Met Ser Tyr Asp Glu
565 570 575
Lys Arg Gln Leu Ser Leu Asp Ile Asn Arg Leu Pro Gly Glu Lys Leu
580 585 590
Gly Arg Val Val His Ile Ile Gln Ser Arg Glu Pro Ser Leu Arg Asp
595 600 605
Ser Asn Pro Asp Glu Ile Glu Ile Asp Phe Glu Thr Leu Lys Pro Thr
610 615 620
Thr Leu Arg Glu Leu Glu Arg Tyr Val Lys Ser Cys Leu Gln Lys Lys
625 630 635 640
Gln Arg Lys Pro Phe Ser Ala Ser Gly Lys Lys Gln Ala Ala Lys Ser
645 650 655
Lys Glu Glu Leu Ala Gln Glu Lys Lys Lys Glu Leu Glu Lys Arg Leu
660 665 670
Gln Asp Val Ser Gly Gln Leu Ser Ser Ser Lys Lys Pro Ala Arg Lys
675 680 685
Glu Lys Pro Gly Ser Ala Pro Ser Gly Gly Pro Ser Arg Leu Ser Ser
690 695 700
Ser Ser Ser Ser Glu Ser Gly Ser Ser Ser Ser Ser Gly Ser Ser Ser
705 710 715 720
Asp Ser Ser Asp Ser Glu
725
<210> 15
<211> 947
<212> PRT
<213> 智人
<400> 15
Met Ser Leu Pro Ser Arg Gln Thr Ala Ile Ile Val Asn Pro Pro Pro
1 5 10 15
Pro Glu Tyr Ile Asn Thr Lys Lys Asn Gly Arg Leu Thr Asn Gln Leu
20 25 30
Gln Tyr Leu Gln Lys Val Val Leu Lys Asp Leu Trp Lys His Ser Phe
35 40 45
Ser Trp Pro Phe Gln Arg Pro Val Asp Ala Val Lys Leu Gln Leu Pro
50 55 60
Asp Tyr Tyr Thr Ile Ile Lys Asn Pro Met Asp Leu Asn Thr Ile Lys
65 70 75 80
Lys Arg Leu Glu Asn Lys Tyr Tyr Ala Lys Ala Ser Glu Cys Ile Glu
85 90 95
Asp Phe Asn Thr Met Phe Ser Asn Cys Tyr Leu Tyr Asn Lys Pro Gly
100 105 110
Asp Asp Ile Val Leu Met Ala Gln Ala Leu Glu Lys Leu Phe Met Gln
115 120 125
Lys Leu Ser Gln Met Pro Gln Glu Glu Gln Val Val Gly Val Lys Glu
130 135 140
Arg Ile Lys Lys Gly Thr Gln Gln Asn Ile Ala Val Ser Ser Ala Lys
145 150 155 160
Glu Lys Ser Ser Pro Ser Ala Thr Glu Lys Val Phe Lys Gln Gln Glu
165 170 175
Ile Pro Ser Val Phe Pro Lys Thr Ser Ile Ser Pro Leu Asn Val Val
180 185 190
Gln Gly Ala Ser Val Asn Ser Ser Ser Gln Thr Ala Ala Gln Val Thr
195 200 205
Lys Gly Val Lys Arg Lys Ala Asp Thr Thr Thr Pro Ala Thr Ser Ala
210 215 220
Val Lys Ala Ser Ser Glu Phe Ser Pro Thr Phe Thr Glu Lys Ser Val
225 230 235 240
Ala Leu Pro Pro Ile Lys Glu Asn Met Pro Lys Asn Val Leu Pro Asp
245 250 255
Ser Gln Gln Gln Tyr Asn Val Val Lys Thr Val Lys Val Thr Glu Gln
260 265 270
Leu Arg His Cys Ser Glu Ile Leu Lys Glu Met Leu Ala Lys Lys His
275 280 285
Phe Ser Tyr Ala Trp Pro Phe Tyr Asn Pro Val Asp Val Asn Ala Leu
290 295 300
Gly Leu His Asn Tyr Tyr Asp Val Val Lys Asn Pro Met Asp Leu Gly
305 310 315 320
Thr Ile Lys Glu Lys Met Asp Asn Gln Glu Tyr Lys Asp Ala Tyr Lys
325 330 335
Phe Ala Ala Asp Val Arg Leu Met Phe Met Asn Cys Tyr Lys Tyr Asn
340 345 350
Pro Pro Asp His Glu Val Val Thr Met Ala Arg Met Leu Gln Asp Val
355 360 365
Phe Glu Thr His Phe Ser Lys Ile Pro Ile Glu Pro Val Glu Ser Met
370 375 380
Pro Leu Cys Tyr Ile Lys Thr Asp Ile Thr Glu Thr Thr Gly Arg Glu
385 390 395 400
Asn Thr Asn Glu Ala Ser Ser Glu Gly Asn Ser Ser Asp Asp Ser Glu
405 410 415
Asp Glu Arg Val Lys Arg Leu Ala Lys Leu Gln Glu Gln Leu Lys Ala
420 425 430
Val His Gln Gln Leu Gln Val Leu Ser Gln Val Pro Phe Arg Lys Leu
435 440 445
Asn Lys Lys Lys Glu Lys Ser Lys Lys Glu Lys Lys Lys Glu Lys Val
450 455 460
Asn Asn Ser Asn Glu Asn Pro Arg Lys Met Cys Glu Gln Met Arg Leu
465 470 475 480
Lys Glu Lys Ser Lys Arg Asn Gln Pro Lys Lys Arg Lys Gln Gln Phe
485 490 495
Ile Gly Leu Lys Ser Glu Asp Glu Asp Asn Ala Lys Pro Met Asn Tyr
500 505 510
Asp Glu Lys Arg Gln Leu Ser Leu Asn Ile Asn Lys Leu Pro Gly Asp
515 520 525
Lys Leu Gly Arg Val Val His Ile Ile Gln Ser Arg Glu Pro Ser Leu
530 535 540
Ser Asn Ser Asn Pro Asp Glu Ile Glu Ile Asp Phe Glu Thr Leu Lys
545 550 555 560
Ala Ser Thr Leu Arg Glu Leu Glu Lys Tyr Val Ser Ala Cys Leu Arg
565 570 575
Lys Arg Pro Leu Lys Pro Pro Ala Lys Lys Ile Met Met Ser Lys Glu
580 585 590
Glu Leu His Ser Gln Lys Lys Gln Glu Leu Glu Lys Arg Leu Leu Asp
595 600 605
Val Asn Asn Gln Leu Asn Ser Arg Lys Arg Gln Thr Lys Ser Asp Lys
610 615 620
Thr Gln Pro Ser Lys Ala Val Glu Asn Val Ser Arg Leu Ser Glu Ser
625 630 635 640
Ser Ser Ser Ser Ser Ser Ser Ser Glu Ser Glu Ser Ser Ser Ser Asp
645 650 655
Leu Ser Ser Ser Asp Ser Ser Asp Ser Glu Ser Glu Met Phe Pro Lys
660 665 670
Phe Thr Glu Val Lys Pro Asn Asp Ser Pro Ser Lys Glu Asn Val Lys
675 680 685
Lys Met Lys Asn Glu Cys Ile Pro Pro Glu Gly Arg Thr Gly Val Thr
690 695 700
Gln Ile Gly Tyr Cys Val Gln Asp Thr Thr Ser Ala Asn Thr Thr Leu
705 710 715 720
Val His Gln Thr Thr Pro Ser His Val Met Pro Pro Asn His His Gln
725 730 735
Leu Ala Phe Asn Tyr Gln Glu Leu Glu His Leu Gln Thr Val Lys Asn
740 745 750
Ile Ser Pro Leu Gln Ile Leu Pro Pro Ser Gly Asp Ser Glu Gln Leu
755 760 765
Ser Asn Gly Ile Thr Val Met His Pro Ser Gly Asp Ser Asp Thr Thr
770 775 780
Met Leu Glu Ser Glu Cys Gln Ala Pro Val Gln Lys Asp Ile Lys Ile
785 790 795 800
Lys Asn Ala Asp Ser Trp Lys Ser Leu Gly Lys Pro Val Lys Pro Ser
805 810 815
Gly Val Met Lys Ser Ser Asp Glu Leu Phe Asn Gln Phe Arg Lys Ala
820 825 830
Ala Ile Glu Lys Glu Val Lys Ala Arg Thr Gln Glu Leu Ile Arg Lys
835 840 845
His Leu Glu Gln Asn Thr Lys Glu Leu Lys Ala Ser Gln Glu Asn Gln
850 855 860
Arg Asp Leu Gly Asn Gly Leu Thr Val Glu Ser Phe Ser Asn Lys Ile
865 870 875 880
Gln Asn Lys Cys Ser Gly Glu Glu Gln Lys Glu His Gln Gln Ser Ser
885 890 895
Glu Ala Gln Asp Lys Ser Lys Leu Trp Leu Leu Lys Asp Arg Asp Leu
900 905 910
Ala Arg Gln Lys Glu Gln Glu Arg Arg Arg Arg Glu Ala Met Val Gly
915 920 925
Thr Ile Asp Met Thr Leu Gln Ser Asp Ile Met Thr Met Phe Glu Asn
930 935 940
Asn Phe Asp
945
<210> 16
<211> 233
<212> PRT
<213> 智人
<400> 16
Met Ser Gln Ser Asn Arg Glu Leu Val Val Asp Phe Leu Ser Tyr Lys
1 5 10 15
Leu Ser Gln Lys Gly Tyr Ser Trp Ser Gln Phe Ser Asp Val Glu Glu
20 25 30
Asn Arg Thr Glu Ala Pro Glu Gly Thr Glu Ser Glu Met Glu Thr Pro
35 40 45
Ser Ala Ile Asn Gly Asn Pro Ser Trp His Leu Ala Asp Ser Pro Ala
50 55 60
Val Asn Gly Ala Thr Gly His Ser Ser Ser Leu Asp Ala Arg Glu Val
65 70 75 80
Ile Pro Met Ala Ala Val Lys Gln Ala Leu Arg Glu Ala Gly Asp Glu
85 90 95
Phe Glu Leu Arg Tyr Arg Arg Ala Phe Ser Asp Leu Thr Ser Gln Leu
100 105 110
His Ile Thr Pro Gly Thr Ala Tyr Gln Ser Phe Glu Gln Val Val Asn
115 120 125
Glu Leu Phe Arg Asp Gly Val Asn Trp Gly Arg Ile Val Ala Phe Phe
130 135 140
Ser Phe Gly Gly Ala Leu Cys Val Glu Ser Val Asp Lys Glu Met Gln
145 150 155 160
Val Leu Val Ser Arg Ile Ala Ala Trp Met Ala Thr Tyr Leu Asn Asp
165 170 175
His Leu Glu Pro Trp Ile Gln Glu Asn Gly Gly Trp Asp Thr Phe Val
180 185 190
Glu Leu Tyr Gly Asn Asn Ala Ala Ala Glu Ser Arg Lys Gly Gln Glu
195 200 205
Arg Phe Asn Arg Trp Phe Leu Thr Gly Met Thr Val Ala Gly Val Val
210 215 220
Leu Leu Gly Ser Leu Phe Ser Arg Lys
225 230
<210> 17
<211> 404
<212> PRT
<213> 智人
<400> 17
Met Ser Asp Ser Lys Glu Pro Arg Leu Gln Gln Leu Gly Leu Leu Glu
1 5 10 15
Glu Glu Gln Leu Arg Gly Leu Gly Phe Arg Gln Thr Arg Gly Tyr Lys
20 25 30
Ser Leu Ala Gly Cys Leu Gly His Gly Pro Leu Val Leu Gln Leu Leu
35 40 45
Ser Phe Thr Leu Leu Ala Gly Leu Leu Val Gln Val Ser Lys Val Pro
50 55 60
Ser Ser Ile Ser Gln Glu Gln Ser Arg Gln Asp Ala Ile Tyr Gln Asn
65 70 75 80
Leu Thr Gln Leu Lys Ala Ala Val Gly Glu Leu Ser Glu Lys Ser Lys
85 90 95
Leu Gln Glu Ile Tyr Gln Glu Leu Thr Gln Leu Lys Ala Ala Val Gly
100 105 110
Glu Leu Pro Glu Lys Ser Lys Leu Gln Glu Ile Tyr Gln Glu Leu Thr
115 120 125
Arg Leu Lys Ala Ala Val Gly Glu Leu Pro Glu Lys Ser Lys Leu Gln
130 135 140
Glu Ile Tyr Gln Glu Leu Thr Trp Leu Lys Ala Ala Val Gly Glu Leu
145 150 155 160
Pro Glu Lys Ser Lys Met Gln Glu Ile Tyr Gln Glu Leu Thr Arg Leu
165 170 175
Lys Ala Ala Val Gly Glu Leu Pro Glu Lys Ser Lys Gln Gln Glu Ile
180 185 190
Tyr Gln Glu Leu Thr Arg Leu Lys Ala Ala Val Gly Glu Leu Pro Glu
195 200 205
Lys Ser Lys Gln Gln Glu Ile Tyr Gln Glu Leu Thr Arg Leu Lys Ala
210 215 220
Ala Val Gly Glu Leu Pro Glu Lys Ser Lys Gln Gln Glu Ile Tyr Gln
225 230 235 240
Glu Leu Thr Gln Leu Lys Ala Ala Val Glu Arg Leu Cys His Pro Cys
245 250 255
Pro Trp Glu Trp Thr Phe Phe Gln Gly Asn Cys Tyr Phe Met Ser Asn
260 265 270
Ser Gln Arg Asn Trp His Asp Ser Ile Thr Ala Cys Lys Glu Val Gly
275 280 285
Ala Gln Leu Val Val Ile Lys Ser Ala Glu Glu Gln Asn Phe Leu Gln
290 295 300
Leu Gln Ser Ser Arg Ser Asn Arg Phe Thr Trp Met Gly Leu Ser Asp
305 310 315 320
Leu Asn Gln Glu Gly Thr Trp Gln Trp Val Asp Gly Ser Pro Leu Leu
325 330 335
Pro Ser Phe Lys Gln Tyr Trp Asn Arg Gly Glu Pro Asn Asn Val Gly
340 345 350
Glu Glu Asp Cys Ala Glu Phe Ser Gly Asn Gly Trp Asn Asp Asp Lys
355 360 365
Cys Asn Leu Ala Lys Phe Trp Ile Cys Lys Lys Ser Ala Ala Ser Cys
370 375 380
Ser Arg Asp Glu Glu Gln Phe Leu Ser Pro Ala Pro Ala Thr Pro Asn
385 390 395 400
Pro Pro Pro Ala
<210> 18
<211> 497
<212> PRT
<213> 智人
<400> 18
Met Thr Phe Asn Ser Phe Glu Gly Ser Lys Thr Cys Val Pro Ala Asp
1 5 10 15
Ile Asn Lys Glu Glu Glu Phe Val Glu Glu Phe Asn Arg Leu Lys Thr
20 25 30
Phe Ala Asn Phe Pro Ser Gly Ser Pro Val Ser Ala Ser Thr Leu Ala
35 40 45
Arg Ala Gly Phe Leu Tyr Thr Gly Glu Gly Asp Thr Val Arg Cys Phe
50 55 60
Ser Cys His Ala Ala Val Asp Arg Trp Gln Tyr Gly Asp Ser Ala Val
65 70 75 80
Gly Arg His Arg Lys Val Ser Pro Asn Cys Arg Phe Ile Asn Gly Phe
85 90 95
Tyr Leu Glu Asn Ser Ala Thr Gln Ser Thr Asn Ser Gly Ile Gln Asn
100 105 110
Gly Gln Tyr Lys Val Glu Asn Tyr Leu Gly Ser Arg Asp His Phe Ala
115 120 125
Leu Asp Arg Pro Ser Glu Thr His Ala Asp Tyr Leu Leu Arg Thr Gly
130 135 140
Gln Val Val Asp Ile Ser Asp Thr Ile Tyr Pro Arg Asn Pro Ala Met
145 150 155 160
Tyr Ser Glu Glu Ala Arg Leu Lys Ser Phe Gln Asn Trp Pro Asp Tyr
165 170 175
Ala His Leu Thr Pro Arg Glu Leu Ala Ser Ala Gly Leu Tyr Tyr Thr
180 185 190
Gly Ile Gly Asp Gln Val Gln Cys Phe Cys Cys Gly Gly Lys Leu Lys
195 200 205
Asn Trp Glu Pro Cys Asp Arg Ala Trp Ser Glu His Arg Arg His Phe
210 215 220
Pro Asn Cys Phe Phe Val Leu Gly Arg Asn Leu Asn Ile Arg Ser Glu
225 230 235 240
Ser Asp Ala Val Ser Ser Asp Arg Asn Phe Pro Asn Ser Thr Asn Leu
245 250 255
Pro Arg Asn Pro Ser Met Ala Asp Tyr Glu Ala Arg Ile Phe Thr Phe
260 265 270
Gly Thr Trp Ile Tyr Ser Val Asn Lys Glu Gln Leu Ala Arg Ala Gly
275 280 285
Phe Tyr Ala Leu Gly Glu Gly Asp Lys Val Lys Cys Phe His Cys Gly
290 295 300
Gly Gly Leu Thr Asp Trp Lys Pro Ser Glu Asp Pro Trp Glu Gln His
305 310 315 320
Ala Lys Trp Tyr Pro Gly Cys Lys Tyr Leu Leu Glu Gln Lys Gly Gln
325 330 335
Glu Tyr Ile Asn Asn Ile His Leu Thr His Ser Leu Glu Glu Cys Leu
340 345 350
Val Arg Thr Thr Glu Lys Thr Pro Ser Leu Thr Arg Arg Ile Asp Asp
355 360 365
Thr Ile Phe Gln Asn Pro Met Val Gln Glu Ala Ile Arg Met Gly Phe
370 375 380
Ser Phe Lys Asp Ile Lys Lys Ile Met Glu Glu Lys Ile Gln Ile Ser
385 390 395 400
Gly Ser Asn Tyr Lys Ser Leu Glu Val Leu Val Ala Asp Leu Val Asn
405 410 415
Ala Gln Lys Asp Ser Met Gln Asp Glu Ser Ser Gln Thr Ser Leu Gln
420 425 430
Lys Glu Ile Ser Thr Glu Glu Gln Leu Arg Arg Leu Gln Glu Glu Lys
435 440 445
Leu Cys Lys Ile Cys Met Asp Arg Asn Ile Ala Ile Val Phe Val Pro
450 455 460
Cys Gly His Leu Val Thr Cys Lys Gln Cys Ala Glu Ala Val Asp Lys
465 470 475 480
Cys Pro Met Cys Tyr Thr Val Ile Thr Phe Lys Gln Lys Ile Phe Met
485 490 495
Ser
<210> 19
<211> 618
<212> PRT
<213> 智人
<400> 19
Met His Lys Thr Ala Ser Gln Arg Leu Phe Pro Gly Pro Ser Tyr Gln
1 5 10 15
Asn Ile Lys Ser Ile Met Glu Asp Ser Thr Ile Leu Ser Asp Trp Thr
20 25 30
Asn Ser Asn Lys Gln Lys Met Lys Tyr Asp Phe Ser Cys Glu Leu Tyr
35 40 45
Arg Met Ser Thr Tyr Ser Thr Phe Pro Ala Gly Val Pro Val Ser Glu
50 55 60
Arg Ser Leu Ala Arg Ala Gly Phe Tyr Tyr Thr Gly Val Asn Asp Lys
65 70 75 80
Val Lys Cys Phe Cys Cys Gly Leu Met Leu Asp Asn Trp Lys Leu Gly
85 90 95
Asp Ser Pro Ile Gln Lys His Lys Gln Leu Tyr Pro Ser Cys Ser Phe
100 105 110
Ile Gln Asn Leu Val Ser Ala Ser Leu Gly Ser Thr Ser Lys Asn Thr
115 120 125
Ser Pro Met Arg Asn Ser Phe Ala His Ser Leu Ser Pro Thr Leu Glu
130 135 140
His Ser Ser Leu Phe Ser Gly Ser Tyr Ser Ser Leu Ser Pro Asn Pro
145 150 155 160
Leu Asn Ser Arg Ala Val Glu Asp Ile Ser Ser Ser Arg Thr Asn Pro
165 170 175
Tyr Ser Tyr Ala Met Ser Thr Glu Glu Ala Arg Phe Leu Thr Tyr His
180 185 190
Met Trp Pro Leu Thr Phe Leu Ser Pro Ser Glu Leu Ala Arg Ala Gly
195 200 205
Phe Tyr Tyr Ile Gly Pro Gly Asp Arg Val Ala Cys Phe Ala Cys Gly
210 215 220
Gly Lys Leu Ser Asn Trp Glu Pro Lys Asp Asp Ala Met Ser Glu His
225 230 235 240
Arg Arg His Phe Pro Asn Cys Pro Phe Leu Glu Asn Ser Leu Glu Thr
245 250 255
Leu Arg Phe Ser Ile Ser Asn Leu Ser Met Gln Thr His Ala Ala Arg
260 265 270
Met Arg Thr Phe Met Tyr Trp Pro Ser Ser Val Pro Val Gln Pro Glu
275 280 285
Gln Leu Ala Ser Ala Gly Phe Tyr Tyr Val Gly Arg Asn Asp Asp Val
290 295 300
Lys Cys Phe Cys Cys Asp Gly Gly Leu Arg Cys Trp Glu Ser Gly Asp
305 310 315 320
Asp Pro Trp Val Glu His Ala Lys Trp Phe Pro Arg Cys Glu Phe Leu
325 330 335
Ile Arg Met Lys Gly Gln Glu Phe Val Asp Glu Ile Gln Gly Arg Tyr
340 345 350
Pro His Leu Leu Glu Gln Leu Leu Ser Thr Ser Asp Thr Thr Gly Glu
355 360 365
Glu Asn Ala Asp Pro Pro Ile Ile His Phe Gly Pro Gly Glu Ser Ser
370 375 380
Ser Glu Asp Ala Val Met Met Asn Thr Pro Val Val Lys Ser Ala Leu
385 390 395 400
Glu Met Gly Phe Asn Arg Asp Leu Val Lys Gln Thr Val Gln Ser Lys
405 410 415
Ile Leu Thr Thr Gly Glu Asn Tyr Lys Thr Val Asn Asp Ile Val Ser
420 425 430
Ala Leu Leu Asn Ala Glu Asp Glu Lys Arg Glu Glu Glu Lys Glu Lys
435 440 445
Gln Ala Glu Glu Met Ala Ser Asp Asp Leu Ser Leu Ile Arg Lys Asn
450 455 460
Arg Met Ala Leu Phe Gln Gln Leu Thr Cys Val Leu Pro Ile Leu Asp
465 470 475 480
Asn Leu Leu Lys Ala Asn Val Ile Asn Lys Gln Glu His Asp Ile Ile
485 490 495
Lys Gln Lys Thr Gln Ile Pro Leu Gln Ala Arg Glu Leu Ile Asp Thr
500 505 510
Ile Leu Val Lys Gly Asn Ala Ala Ala Asn Ile Phe Lys Asn Cys Leu
515 520 525
Lys Glu Ile Asp Ser Thr Leu Tyr Lys Asn Leu Phe Val Asp Lys Asn
530 535 540
Met Lys Tyr Ile Pro Thr Glu Asp Val Ser Gly Leu Ser Leu Glu Glu
545 550 555 560
Gln Leu Arg Arg Leu Gln Glu Glu Arg Thr Cys Lys Val Cys Met Asp
565 570 575
Lys Glu Val Ser Val Val Phe Ile Pro Cys Gly His Leu Val Val Cys
580 585 590
Gln Glu Cys Ala Pro Ser Leu Arg Lys Cys Pro Ile Cys Arg Gly Ile
595 600 605
Ile Lys Gly Thr Val Arg Thr Phe Leu Ser
610 615
<210> 20
<211> 199
<212> PRT
<213> 智人
<400> 20
Met Pro Asn Tyr Lys Leu Thr Tyr Phe Asn Met Arg Gly Arg Ala Glu
1 5 10 15
Ile Ile Arg Tyr Ile Phe Ala Tyr Leu Asp Ile Gln Tyr Glu Asp His
20 25 30
Arg Ile Glu Gln Ala Asp Trp Pro Glu Ile Lys Ser Thr Leu Pro Phe
35 40 45
Gly Lys Ile Pro Ile Leu Glu Val Asp Gly Leu Thr Leu His Gln Ser
50 55 60
Leu Ala Ile Ala Arg Tyr Leu Thr Lys Asn Thr Asp Leu Ala Gly Asn
65 70 75 80
Thr Glu Met Glu Gln Cys His Val Asp Ala Ile Val Asp Thr Leu Asp
85 90 95
Asp Phe Met Ser Cys Phe Pro Trp Ala Glu Lys Lys Gln Asp Val Lys
100 105 110
Glu Gln Met Phe Asn Glu Leu Leu Thr Tyr Asn Ala Pro His Leu Met
115 120 125
Gln Asp Leu Asp Thr Tyr Leu Gly Gly Arg Glu Trp Leu Ile Gly Asn
130 135 140
Ser Val Thr Trp Ala Asp Phe Tyr Trp Glu Ile Cys Ser Thr Thr Leu
145 150 155 160
Leu Val Phe Lys Pro Asp Leu Leu Asp Asn His Pro Arg Leu Val Thr
165 170 175
Leu Arg Lys Lys Val Gln Ala Ile Pro Ala Val Ala Asn Trp Ile Lys
180 185 190
Arg Arg Pro Gln Thr Lys Leu
195
<210> 21
<211> 189
<212> PRT
<213> 智人
<400> 21
Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Gly Gly Val Gly Lys
1 5 10 15
Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr
20 25 30
Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly
35 40 45
Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr
50 55 60
Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys
65 70 75 80
Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr
85 90 95
Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val
100 105 110
Leu Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys
115 120 125
Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr
130 135 140
Ser Ala Lys Thr Arg Gln Arg Val Glu Asp Ala Phe Tyr Thr Leu Val
145 150 155 160
Arg Glu Ile Arg Gln Tyr Arg Leu Lys Lys Ile Ser Lys Glu Glu Lys
165 170 175
Thr Pro Gly Cys Val Lys Ile Lys Lys Cys Ile Ile Met
180 185
<210> 22
<211> 678
<212> PRT
<213> 智人
<400> 22
Met Ala Ala Pro Gly Pro Leu Pro Ala Ala Ala Leu Ser Pro Gly Ala
1 5 10 15
Pro Thr Pro Arg Glu Leu Met His Gly Val Ala Gly Val Thr Ser Arg
20 25 30
Ala Gly Arg Asp Arg Glu Ala Gly Ser Val Leu Pro Ala Gly Asn Arg
35 40 45
Gly Ala Arg Lys Ala Ser Arg Arg Ser Ser Ser Arg Ser Met Ser Arg
50 55 60
Asp Asn Lys Phe Ser Lys Lys Asp Cys Leu Ser Ile Arg Asn Val Val
65 70 75 80
Ala Ser Ile Gln Thr Lys Glu Gly Leu Asn Leu Lys Leu Ile Ser Gly
85 90 95
Asp Val Leu Tyr Ile Trp Ala Asp Val Ile Val Asn Ser Val Pro Met
100 105 110
Asn Leu Gln Leu Gly Gly Gly Pro Leu Ser Arg Ala Phe Leu Gln Lys
115 120 125
Ala Gly Pro Met Leu Gln Lys Glu Leu Asp Asp Arg Arg Arg Glu Thr
130 135 140
Glu Glu Lys Val Gly Asn Ile Phe Met Thr Ser Gly Cys Asn Leu Asp
145 150 155 160
Cys Lys Ala Val Leu His Ala Val Ala Pro Tyr Trp Asn Asn Gly Ala
165 170 175
Glu Thr Ser Trp Gln Ile Met Ala Asn Ile Ile Lys Lys Cys Leu Thr
180 185 190
Thr Val Glu Val Leu Ser Phe Ser Ser Ile Thr Phe Pro Met Ile Gly
195 200 205
Thr Gly Ser Leu Gln Phe Pro Lys Ala Val Phe Ala Lys Leu Ile Leu
210 215 220
Ser Glu Val Phe Glu Tyr Ser Ser Ser Thr Arg Pro Ile Thr Ser Pro
225 230 235 240
Leu Gln Glu Val His Phe Leu Val Tyr Thr Asn Asp Asp Glu Gly Cys
245 250 255
Gln Ala Phe Leu Asp Glu Phe Thr Asn Trp Ser Arg Ile Asn Pro Asn
260 265 270
Lys Ala Arg Ile Pro Met Ala Gly Asp Thr Gln Gly Val Val Gly Thr
275 280 285
Val Ser Lys Pro Cys Phe Thr Ala Tyr Glu Met Lys Ile Gly Ala Ile
290 295 300
Thr Phe Gln Val Ala Thr Gly Asp Ile Ala Thr Glu Gln Val Asp Val
305 310 315 320
Ile Val Asn Ser Thr Ala Arg Thr Phe Asn Arg Lys Ser Gly Val Ser
325 330 335
Arg Ala Ile Leu Glu Gly Ala Gly Gln Ala Val Glu Ser Glu Cys Ala
340 345 350
Val Leu Ala Ala Gln Pro His Arg Asp Phe Ile Ile Thr Pro Gly Gly
355 360 365
Cys Leu Lys Cys Lys Ile Ile Ile His Val Pro Gly Gly Lys Asp Val
370 375 380
Arg Lys Thr Val Thr Ser Val Leu Glu Glu Cys Glu Gln Arg Lys Tyr
385 390 395 400
Thr Ser Val Ser Leu Pro Ala Ile Gly Thr Gly Asn Ala Gly Lys Asn
405 410 415
Pro Ile Thr Val Ala Asp Asn Ile Ile Asp Ala Ile Val Asp Phe Ser
420 425 430
Ser Gln His Ser Thr Pro Ser Leu Lys Thr Val Lys Val Val Ile Phe
435 440 445
Gln Pro Glu Leu Leu Asn Ile Phe Tyr Asp Ser Met Lys Lys Arg Asp
450 455 460
Leu Ser Ala Ser Leu Asn Phe Gln Ser Thr Phe Ser Met Thr Thr Cys
465 470 475 480
Asn Leu Pro Glu His Trp Thr Asp Met Asn His Gln Leu Phe Cys Met
485 490 495
Val Gln Leu Glu Pro Gly Gln Ser Glu Tyr Asn Thr Ile Lys Asp Lys
500 505 510
Phe Thr Arg Thr Cys Ser Ser Tyr Ala Ile Glu Lys Ile Glu Arg Ile
515 520 525
Gln Asn Ala Phe Leu Trp Gln Ser Tyr Gln Val Lys Lys Arg Gln Met
530 535 540
Asp Ile Lys Asn Asp His Lys Asn Asn Glu Arg Leu Leu Phe His Gly
545 550 555 560
Thr Asp Ala Asp Ser Val Pro Tyr Val Asn Gln His Gly Phe Asn Arg
565 570 575
Ser Cys Ala Gly Lys Asn Ala Val Ser Tyr Gly Lys Gly Thr Tyr Phe
580 585 590
Ala Val Asp Ala Ser Tyr Ser Ala Lys Asp Thr Tyr Ser Lys Pro Asp
595 600 605
Ser Asn Gly Arg Lys His Met Tyr Val Val Arg Val Leu Thr Gly Val
610 615 620
Phe Thr Lys Gly Arg Ala Gly Leu Val Thr Pro Pro Pro Lys Asn Pro
625 630 635 640
His Asn Pro Thr Asp Leu Phe Asp Ser Val Thr Asn Asn Thr Arg Ser
645 650 655
Pro Lys Leu Phe Val Val Phe Phe Asp Asn Gln Ala Tyr Pro Glu Tyr
660 665 670
Leu Ile Thr Phe Thr Ala
675
<210> 23
<211> 1801
<212> PRT
<213> 智人
<400> 23
Met Ala Val Pro Gly Ser Phe Pro Leu Leu Val Glu Gly Ser Trp Gly
1 5 10 15
Pro Asp Pro Pro Lys Asn Leu Asn Thr Lys Leu Gln Met Tyr Phe Gln
20 25 30
Ser Pro Lys Arg Ser Gly Gly Gly Glu Cys Glu Val Arg Gln Asp Pro
35 40 45
Arg Ser Pro Ser Arg Phe Leu Val Phe Phe Tyr Pro Glu Asp Val Arg
50 55 60
Gln Lys Val Leu Glu Arg Lys Asn His Glu Leu Val Trp Gln Gly Lys
65 70 75 80
Gly Thr Phe Lys Leu Thr Val Gln Leu Pro Ala Thr Pro Asp Glu Ile
85 90 95
Asp His Val Phe Glu Glu Glu Leu Leu Thr Lys Glu Ser Lys Thr Lys
100 105 110
Glu Asp Val Lys Glu Pro Asp Val Ser Glu Glu Leu Asp Thr Lys Leu
115 120 125
Pro Leu Asp Gly Gly Leu Asp Lys Met Glu Asp Ile Pro Glu Glu Cys
130 135 140
Glu Asn Ile Ser Ser Leu Val Ala Phe Glu Asn Leu Lys Ala Asn Val
145 150 155 160
Thr Asp Ile Met Leu Ile Leu Leu Val Glu Asn Ile Ser Gly Leu Ser
165 170 175
Asn Asp Asp Phe Gln Val Glu Ile Ile Arg Asp Phe Asp Val Ala Val
180 185 190
Val Thr Phe Gln Lys His Ile Asp Thr Ile Arg Phe Val Asp Asp Cys
195 200 205
Thr Lys His His Ser Ile Lys Gln Leu Gln Leu Ser Pro Arg Leu Leu
210 215 220
Glu Val Thr Asn Thr Ile Arg Val Glu Asn Leu Pro Pro Gly Ala Asp
225 230 235 240
Asp Tyr Ser Leu Lys Leu Phe Phe Glu Asn Pro Tyr Asn Gly Gly Gly
245 250 255
Arg Val Ala Asn Val Glu Tyr Phe Pro Glu Glu Ser Ser Ala Leu Ile
260 265 270
Glu Phe Phe Asp Arg Lys Val Leu Asp Thr Ile Met Ala Thr Lys Leu
275 280 285
Asp Phe Asn Lys Met Pro Leu Ser Val Phe Pro Tyr Tyr Ala Ser Leu
290 295 300
Gly Thr Ala Leu Tyr Gly Lys Glu Lys Pro Leu Ile Lys Leu Pro Ala
305 310 315 320
Pro Phe Glu Glu Ser Leu Asp Leu Pro Leu Trp Lys Phe Leu Gln Lys
325 330 335
Lys Asn His Leu Ile Glu Glu Ile Asn Asp Glu Met Arg Arg Cys His
340 345 350
Cys Glu Leu Thr Trp Ser Gln Leu Ser Gly Lys Val Thr Ile Arg Pro
355 360 365
Ala Ala Thr Leu Val Asn Glu Gly Arg Pro Arg Ile Lys Thr Trp Gln
370 375 380
Ala Asp Thr Ser Thr Thr Leu Ser Ser Ile Arg Ser Lys Tyr Lys Val
385 390 395 400
Asn Pro Ile Lys Val Asp Pro Thr Met Trp Asp Thr Ile Lys Asn Asp
405 410 415
Val Lys Asp Asp Arg Ile Leu Ile Glu Phe Asp Thr Leu Lys Glu Met
420 425 430
Val Ile Leu Ala Gly Lys Ser Glu Asp Val Gln Ser Ile Glu Val Gln
435 440 445
Val Arg Glu Leu Ile Glu Ser Thr Thr Gln Lys Ile Lys Arg Glu Glu
450 455 460
Gln Ser Leu Lys Glu Lys Met Ile Ile Ser Pro Gly Arg Tyr Phe Leu
465 470 475 480
Leu Cys His Ser Ser Leu Leu Asp His Leu Leu Thr Glu Cys Pro Glu
485 490 495
Ile Glu Ile Cys Tyr Asp Arg Val Thr Gln His Leu Cys Leu Lys Gly
500 505 510
Pro Ser Ala Asp Val Tyr Lys Ala Lys Cys Glu Ile Gln Glu Lys Val
515 520 525
Tyr Thr Met Ala Gln Lys Asn Ile Gln Val Ser Pro Glu Ile Phe Gln
530 535 540
Phe Leu Gln Gln Val Asn Trp Lys Glu Phe Ser Lys Cys Leu Phe Ile
545 550 555 560
Ala Gln Lys Ile Leu Ala Leu Tyr Glu Leu Glu Gly Thr Thr Val Leu
565 570 575
Leu Thr Ser Cys Ser Ser Glu Ala Leu Leu Glu Ala Glu Lys Gln Met
580 585 590
Leu Ser Ala Leu Asn Tyr Lys Arg Ile Glu Val Glu Asn Lys Glu Val
595 600 605
Leu His Gly Lys Lys Trp Lys Gly Leu Thr His Asn Leu Leu Lys Lys
610 615 620
Gln Asn Ser Ser Pro Asn Thr Val Ile Ile Asn Glu Leu Thr Ser Glu
625 630 635 640
Thr Thr Ala Glu Val Ile Ile Thr Gly Cys Val Lys Glu Val Asn Glu
645 650 655
Thr Tyr Lys Leu Leu Phe Asn Phe Val Glu Gln Asn Met Lys Ile Glu
660 665 670
Arg Leu Val Glu Val Lys Pro Ser Leu Val Ile Asp Tyr Leu Lys Thr
675 680 685
Glu Lys Lys Leu Phe Trp Pro Lys Ile Lys Lys Val Asn Val Gln Val
690 695 700
Ser Phe Asn Pro Glu Asn Lys Gln Lys Gly Ile Leu Leu Thr Gly Ser
705 710 715 720
Lys Thr Glu Val Leu Lys Ala Val Asp Ile Val Lys Gln Val Trp Asp
725 730 735
Ser Val Cys Val Lys Ser Val His Thr Asp Lys Pro Gly Ala Lys Gln
740 745 750
Phe Phe Gln Asp Lys Ala Arg Phe Tyr Gln Ser Glu Ile Lys Arg Leu
755 760 765
Phe Gly Cys Tyr Ile Glu Leu Gln Glu Asn Glu Val Met Lys Glu Gly
770 775 780
Gly Ser Pro Ala Gly Gln Lys Cys Phe Ser Arg Thr Val Leu Ala Pro
785 790 795 800
Gly Val Val Leu Ile Val Gln Gln Gly Asp Leu Ala Arg Leu Pro Val
805 810 815
Asp Val Val Val Asn Ala Ser Asn Glu Asp Leu Lys His Tyr Gly Gly
820 825 830
Leu Ala Ala Ala Leu Ser Lys Ala Ala Gly Pro Glu Leu Gln Ala Asp
835 840 845
Cys Asp Gln Ile Val Lys Arg Glu Gly Arg Leu Leu Pro Gly Asn Ala
850 855 860
Thr Ile Ser Lys Ala Gly Lys Leu Pro Tyr His His Val Ile His Ala
865 870 875 880
Val Gly Pro Arg Trp Ser Gly Tyr Glu Ala Pro Arg Cys Val Tyr Leu
885 890 895
Leu Arg Arg Ala Val Gln Leu Ser Leu Cys Leu Ala Glu Lys Tyr Lys
900 905 910
Tyr Arg Ser Ile Ala Ile Pro Ala Ile Ser Ser Gly Val Phe Gly Phe
915 920 925
Pro Leu Gly Arg Cys Val Glu Thr Ile Val Ser Ala Ile Lys Glu Asn
930 935 940
Phe Gln Phe Lys Lys Asp Gly His Cys Leu Lys Glu Ile Tyr Leu Val
945 950 955 960
Asp Val Ser Glu Lys Thr Val Glu Ala Phe Ala Glu Ala Val Lys Thr
965 970 975
Val Phe Lys Ala Thr Leu Pro Asp Thr Ala Ala Pro Pro Gly Leu Pro
980 985 990
Pro Ala Ala Ala Gly Pro Gly Lys Thr Ser Trp Glu Lys Gly Ser Leu
995 1000 1005
Val Ser Pro Gly Gly Leu Gln Met Leu Leu Val Lys Glu Gly Val
1010 1015 1020
Gln Asn Ala Lys Thr Asp Val Val Val Asn Ser Val Pro Leu Asp
1025 1030 1035
Leu Val Leu Ser Arg Gly Pro Leu Ser Lys Ser Leu Leu Glu Lys
1040 1045 1050
Ala Gly Pro Glu Leu Gln Glu Glu Leu Asp Thr Val Gly Gln Gly
1055 1060 1065
Val Ala Val Ser Met Gly Thr Val Leu Lys Thr Ser Ser Trp Asn
1070 1075 1080
Leu Asp Cys Arg Tyr Val Leu His Val Val Ala Pro Glu Trp Arg
1085 1090 1095
Asn Gly Ser Thr Ser Ser Leu Lys Ile Met Glu Asp Ile Ile Arg
1100 1105 1110
Glu Cys Met Glu Ile Thr Glu Ser Leu Ser Leu Lys Ser Ile Ala
1115 1120 1125
Phe Pro Ala Ile Gly Thr Gly Asn Leu Gly Phe Pro Lys Asn Ile
1130 1135 1140
Phe Ala Glu Leu Ile Ile Ser Glu Val Phe Lys Phe Ser Ser Lys
1145 1150 1155
Asn Gln Leu Lys Thr Leu Gln Glu Val His Phe Leu Leu His Pro
1160 1165 1170
Ser Asp His Glu Asn Ile Gln Ala Phe Ser Asp Glu Phe Ala Arg
1175 1180 1185
Arg Ala Asn Gly Asn Leu Val Ser Asp Lys Ile Pro Lys Ala Lys
1190 1195 1200
Asp Thr Gln Gly Phe Tyr Gly Thr Val Ser Ser Pro Asp Ser Gly
1205 1210 1215
Val Tyr Glu Met Lys Ile Gly Ser Ile Ile Phe Gln Val Ala Ser
1220 1225 1230
Gly Asp Ile Thr Lys Glu Glu Ala Asp Val Ile Val Asn Ser Thr
1235 1240 1245
Ser Asn Ser Phe Asn Leu Lys Ala Gly Val Ser Lys Ala Ile Leu
1250 1255 1260
Glu Cys Ala Gly Gln Asn Val Glu Arg Glu Cys Ser Gln Gln Ala
1265 1270 1275
Gln Gln Arg Lys Asn Asp Tyr Ile Ile Thr Gly Gly Gly Phe Leu
1280 1285 1290
Arg Cys Lys Asn Ile Ile His Val Ile Gly Gly Asn Asp Val Lys
1295 1300 1305
Ser Ser Val Ser Ser Val Leu Gln Glu Cys Glu Lys Lys Asn Tyr
1310 1315 1320
Ser Ser Ile Cys Leu Pro Ala Ile Gly Thr Gly Asn Ala Lys Gln
1325 1330 1335
His Pro Asp Lys Val Ala Glu Ala Ile Ile Asp Ala Ile Glu Asp
1340 1345 1350
Phe Val Gln Lys Gly Ser Ala Gln Ser Val Lys Lys Val Lys Val
1355 1360 1365
Val Ile Phe Leu Pro Gln Val Leu Asp Val Phe Tyr Ala Asn Met
1370 1375 1380
Lys Lys Arg Glu Gly Thr Gln Leu Ser Ser Gln Gln Ser Val Met
1385 1390 1395
Ser Lys Leu Ala Ser Phe Leu Gly Phe Ser Lys Gln Ser Pro Gln
1400 1405 1410
Lys Lys Asn His Leu Val Leu Glu Lys Lys Thr Glu Ser Ala Thr
1415 1420 1425
Phe Arg Val Cys Gly Glu Asn Val Thr Cys Val Glu Tyr Ala Ile
1430 1435 1440
Ser Trp Leu Gln Asp Leu Ile Glu Lys Glu Gln Cys Pro Tyr Thr
1445 1450 1455
Ser Glu Asp Glu Cys Ile Lys Asp Phe Asp Glu Lys Glu Tyr Gln
1460 1465 1470
Glu Leu Asn Glu Leu Gln Lys Lys Leu Asn Ile Asn Ile Ser Leu
1475 1480 1485
Asp His Lys Arg Pro Leu Ile Lys Val Leu Gly Ile Ser Arg Asp
1490 1495 1500
Val Met Gln Ala Arg Asp Glu Ile Glu Ala Met Ile Lys Arg Val
1505 1510 1515
Arg Leu Ala Lys Glu Gln Glu Ser Arg Ala Asp Cys Ile Ser Glu
1520 1525 1530
Phe Ile Glu Trp Gln Tyr Asn Asp Asn Asn Thr Ser His Cys Phe
1535 1540 1545
Asn Lys Met Thr Asn Leu Lys Leu Glu Asp Ala Arg Arg Glu Lys
1550 1555 1560
Lys Lys Thr Val Asp Val Lys Ile Asn His Arg His Tyr Thr Val
1565 1570 1575
Asn Leu Asn Thr Tyr Thr Ala Thr Asp Thr Lys Gly His Ser Leu
1580 1585 1590
Ser Val Gln Arg Leu Thr Lys Ser Lys Val Asp Ile Pro Ala His
1595 1600 1605
Trp Ser Asp Met Lys Gln Gln Asn Phe Cys Val Val Glu Leu Leu
1610 1615 1620
Pro Ser Asp Pro Glu Tyr Asn Thr Val Ala Ser Lys Phe Asn Gln
1625 1630 1635
Thr Cys Ser His Phe Arg Ile Glu Lys Ile Glu Arg Ile Gln Asn
1640 1645 1650
Pro Asp Leu Trp Asn Ser Tyr Gln Ala Lys Lys Lys Thr Met Asp
1655 1660 1665
Ala Lys Asn Gly Gln Thr Met Asn Glu Lys Gln Leu Phe His Gly
1670 1675 1680
Thr Asp Ala Gly Ser Val Pro His Val Asn Arg Asn Gly Phe Asn
1685 1690 1695
Arg Ser Tyr Ala Gly Lys Asn Ala Val Ala Tyr Gly Lys Gly Thr
1700 1705 1710
Tyr Phe Ala Val Asn Ala Asn Tyr Ser Ala Asn Asp Thr Tyr Ser
1715 1720 1725
Arg Pro Asp Ala Asn Gly Arg Lys His Val Tyr Tyr Val Arg Val
1730 1735 1740
Leu Thr Gly Ile Tyr Thr His Gly Asn His Ser Leu Ile Val Pro
1745 1750 1755
Pro Ser Lys Asn Pro Gln Asn Pro Thr Asp Leu Tyr Asp Thr Val
1760 1765 1770
Thr Asp Asn Val His His Pro Ser Leu Phe Val Ala Phe Tyr Asp
1775 1780 1785
Tyr Gln Ala Tyr Pro Glu Tyr Leu Ile Thr Phe Arg Lys
1790 1795 1800
<210> 24
<211> 154
<212> PRT
<213> 智人
<400> 24
Met Ala Thr Lys Ala Val Cys Val Leu Lys Gly Asp Gly Pro Val Gln
1 5 10 15
Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val
20 25 30
Trp Gly Ser Ile Lys Gly Leu Thr Glu Gly Leu His Gly Phe His Val
35 40 45
His Glu Phe Gly Asp Asn Thr Ala Gly Cys Thr Ser Ala Gly Pro His
50 55 60
Phe Asn Pro Leu Ser Arg Lys His Gly Gly Pro Lys Asp Glu Glu Arg
65 70 75 80
His Val Gly Asp Leu Gly Asn Val Thr Ala Asp Lys Asp Gly Val Ala
85 90 95
Asp Val Ser Ile Glu Asp Ser Val Ile Ser Leu Ser Gly Asp His Cys
100 105 110
Ile Ile Gly Arg Thr Leu Val Val His Glu Lys Ala Asp Asp Leu Gly
115 120 125
Lys Gly Gly Asn Glu Glu Ser Thr Lys Thr Gly Asn Ala Gly Ser Arg
130 135 140
Leu Ala Cys Gly Val Ile Gly Ile Ala Gln
145 150
<210> 25
<211> 150
<212> PRT
<213> 智人
<400> 25
Met Ser Ala Lys Asp Glu Arg Ala Arg Glu Ile Leu Arg Gly Phe Lys
1 5 10 15
Leu Asn Trp Met Asn Leu Arg Asp Ala Glu Thr Gly Lys Ile Leu Trp
20 25 30
Gln Gly Thr Glu Asp Leu Ser Val Pro Gly Val Glu His Glu Ala Arg
35 40 45
Val Pro Lys Lys Ile Leu Lys Cys Lys Ala Val Ser Arg Glu Leu Asn
50 55 60
Phe Ser Ser Thr Glu Gln Met Glu Lys Phe Arg Leu Glu Gln Lys Val
65 70 75 80
Tyr Phe Lys Gly Gln Cys Leu Glu Glu Trp Phe Phe Glu Phe Gly Phe
85 90 95
Val Ile Pro Asn Ser Thr Asn Thr Trp Gln Ser Leu Ile Glu Ala Ala
100 105 110
Pro Glu Ser Gln Met Met Pro Ala Ser Val Leu Thr Gly Asn Val Ile
115 120 125
Ile Glu Thr Lys Phe Phe Asp Asp Asp Leu Leu Val Ser Thr Ser Arg
130 135 140
Val Arg Leu Phe Tyr Val
145 150
<210> 26
<211> 350
<212> PRT
<213> 智人
<400> 26
Met Phe Gly Leu Lys Arg Asn Ala Val Ile Gly Leu Asn Leu Tyr Cys
1 5 10 15
Gly Gly Ala Gly Leu Gly Ala Gly Ser Gly Gly Ala Thr Arg Pro Gly
20 25 30
Gly Arg Leu Leu Ala Thr Glu Lys Glu Ala Ser Ala Arg Arg Glu Ile
35 40 45
Gly Gly Gly Glu Ala Gly Ala Val Ile Gly Gly Ser Ala Gly Ala Ser
50 55 60
Pro Pro Ser Thr Leu Thr Pro Asp Ser Arg Arg Val Ala Arg Pro Pro
65 70 75 80
Pro Ile Gly Ala Glu Val Pro Asp Val Thr Ala Thr Pro Ala Arg Leu
85 90 95
Leu Phe Phe Ala Pro Thr Arg Arg Ala Ala Pro Leu Glu Glu Met Glu
100 105 110
Ala Pro Ala Ala Asp Ala Ile Met Ser Pro Glu Glu Glu Leu Asp Gly
115 120 125
Tyr Glu Pro Glu Pro Leu Gly Lys Arg Pro Ala Val Leu Pro Leu Leu
130 135 140
Glu Leu Val Gly Glu Ser Gly Asn Asn Thr Ser Thr Asp Gly Ser Leu
145 150 155 160
Pro Ser Thr Pro Pro Pro Ala Glu Glu Glu Glu Asp Glu Leu Tyr Arg
165 170 175
Gln Ser Leu Glu Ile Ile Ser Arg Tyr Leu Arg Glu Gln Ala Thr Gly
180 185 190
Ala Lys Asp Thr Lys Pro Met Gly Arg Ser Gly Ala Thr Ser Arg Lys
195 200 205
Ala Leu Glu Thr Leu Arg Arg Val Gly Asp Gly Val Gln Arg Asn His
210 215 220
Glu Thr Ala Phe Gln Gly Met Leu Arg Lys Leu Asp Ile Lys Asn Glu
225 230 235 240
Asp Asp Val Lys Ser Leu Ser Arg Val Met Ile His Val Phe Ser Asp
245 250 255
Gly Val Thr Asn Trp Gly Arg Ile Val Thr Leu Ile Ser Phe Gly Ala
260 265 270
Phe Val Ala Lys His Leu Lys Thr Ile Asn Gln Glu Ser Cys Ile Glu
275 280 285
Pro Leu Ala Glu Ser Ile Thr Asp Val Leu Val Arg Thr Lys Arg Asp
290 295 300
Trp Leu Val Lys Gln Arg Gly Trp Asp Gly Phe Val Glu Phe Phe His
305 310 315 320
Val Glu Asp Leu Glu Gly Gly Ile Arg Asn Val Leu Leu Ala Phe Ala
325 330 335
Gly Val Ala Gly Val Gly Ala Gly Leu Ala Tyr Leu Ile Arg
340 345 350
<210> 27
<211> 239
<212> PRT
<213> 智人
<400> 27
Met Ala His Ala Gly Arg Thr Gly Tyr Asp Asn Arg Glu Ile Val Met
1 5 10 15
Lys Tyr Ile His Tyr Lys Leu Ser Gln Arg Gly Tyr Glu Trp Asp Ala
20 25 30
Gly Asp Val Gly Ala Ala Pro Pro Gly Ala Ala Pro Ala Pro Gly Ile
35 40 45
Phe Ser Ser Gln Pro Gly His Thr Pro His Pro Ala Ala Ser Arg Asp
50 55 60
Pro Val Ala Arg Thr Ser Pro Leu Gln Thr Pro Ala Ala Pro Gly Ala
65 70 75 80
Ala Ala Gly Pro Ala Leu Ser Pro Val Pro Pro Val Val His Leu Thr
85 90 95
Leu Arg Gln Ala Gly Asp Asp Phe Ser Arg Arg Tyr Arg Arg Asp Phe
100 105 110
Ala Glu Met Ser Ser Gln Leu His Leu Thr Pro Phe Thr Ala Arg Gly
115 120 125
Arg Phe Ala Thr Val Val Glu Glu Leu Phe Arg Asp Gly Val Asn Trp
130 135 140
Gly Arg Ile Val Ala Phe Phe Glu Phe Gly Gly Val Met Cys Val Glu
145 150 155 160
Ser Val Asn Arg Glu Met Ser Pro Leu Val Asp Asn Ile Ala Leu Trp
165 170 175
Met Thr Glu Tyr Leu Asn Arg His Leu His Thr Trp Ile Gln Asp Asn
180 185 190
Gly Gly Trp Asp Ala Phe Val Glu Leu Tyr Gly Pro Ser Met Arg Pro
195 200 205
Leu Phe Asp Phe Ser Trp Leu Ser Leu Lys Thr Leu Leu Ser Leu Ala
210 215 220
Leu Val Gly Ala Cys Ile Thr Leu Gly Ala Tyr Leu Gly His Lys
225 230 235
<210> 28
<211> 163
<212> PRT
<213> 智人
<400> 28
Met Ala Asp Glu Glu Lys Leu Pro Pro Gly Trp Glu Lys Arg Met Ser
1 5 10 15
Arg Ser Ser Gly Arg Val Tyr Tyr Phe Asn His Ile Thr Asn Ala Ser
20 25 30
Gln Trp Glu Arg Pro Ser Gly Asn Ser Ser Ser Gly Gly Lys Asn Gly
35 40 45
Gln Gly Glu Pro Ala Arg Val Arg Cys Ser His Leu Leu Val Lys His
50 55 60
Ser Gln Ser Arg Arg Pro Ser Ser Trp Arg Gln Glu Lys Ile Thr Arg
65 70 75 80
Thr Lys Glu Glu Ala Leu Glu Leu Ile Asn Gly Tyr Ile Gln Lys Ile
85 90 95
Lys Ser Gly Glu Glu Asp Phe Glu Ser Leu Ala Ser Gln Phe Ser Asp
100 105 110
Cys Ser Ser Ala Lys Ala Arg Gly Asp Leu Gly Ala Phe Ser Arg Gly
115 120 125
Gln Met Gln Lys Pro Phe Glu Asp Ala Ser Phe Ala Leu Arg Thr Gly
130 135 140
Glu Met Ser Gly Pro Val Phe Thr Asp Ser Gly Ile His Ile Ile Leu
145 150 155 160
Arg Thr Glu
<210> 29
<211> 1327
<212> PRT
<213> 智人
<400> 29
Met Ala Ala Ser Arg Arg Ser Gln His His His His His His Gln Gln
1 5 10 15
Gln Leu Gln Pro Ala Pro Gly Ala Ser Ala Pro Pro Pro Pro Pro Pro
20 25 30
Pro Pro Leu Ser Pro Gly Leu Ala Pro Gly Thr Thr Pro Ala Ser Pro
35 40 45
Thr Ala Ser Gly Leu Ala Pro Phe Ala Ser Pro Arg His Gly Leu Ala
50 55 60
Leu Pro Glu Gly Asp Gly Ser Arg Asp Pro Pro Asp Arg Pro Arg Ser
65 70 75 80
Pro Asp Pro Val Asp Gly Thr Ser Cys Cys Ser Thr Thr Ser Thr Ile
85 90 95
Cys Thr Val Ala Ala Ala Pro Val Val Pro Ala Val Ser Thr Ser Ser
100 105 110
Ala Ala Gly Val Ala Pro Asn Pro Ala Gly Ser Gly Ser Asn Asn Ser
115 120 125
Pro Ser Ser Ser Ser Ser Pro Thr Ser Ser Ser Ser Ser Ser Pro Ser
130 135 140
Ser Pro Gly Ser Ser Leu Ala Glu Ser Pro Glu Ala Ala Gly Val Ser
145 150 155 160
Ser Thr Ala Pro Leu Gly Pro Gly Ala Ala Gly Pro Gly Thr Gly Val
165 170 175
Pro Ala Val Ser Gly Ala Leu Arg Glu Leu Leu Glu Ala Cys Arg Asn
180 185 190
Gly Asp Val Ser Arg Val Lys Arg Leu Val Asp Ala Ala Asn Val Asn
195 200 205
Ala Lys Asp Met Ala Gly Arg Lys Ser Ser Pro Leu His Phe Ala Ala
210 215 220
Gly Phe Gly Arg Lys Asp Val Val Glu His Leu Leu Gln Met Gly Ala
225 230 235 240
Asn Val His Ala Arg Asp Asp Gly Gly Leu Ile Pro Leu His Asn Ala
245 250 255
Cys Ser Phe Gly His Ala Glu Val Val Ser Leu Leu Leu Cys Gln Gly
260 265 270
Ala Asp Pro Asn Ala Arg Asp Asn Trp Asn Tyr Thr Pro Leu His Glu
275 280 285
Ala Ala Ile Lys Gly Lys Ile Asp Val Cys Ile Val Leu Leu Gln His
290 295 300
Gly Ala Asp Pro Asn Ile Arg Asn Thr Asp Gly Lys Ser Ala Leu Asp
305 310 315 320
Leu Ala Asp Pro Ser Ala Lys Ala Val Leu Thr Gly Glu Tyr Lys Lys
325 330 335
Asp Glu Leu Leu Glu Ala Ala Arg Ser Gly Asn Glu Glu Lys Leu Met
340 345 350
Ala Leu Leu Thr Pro Leu Asn Val Asn Cys His Ala Ser Asp Gly Arg
355 360 365
Lys Ser Thr Pro Leu His Leu Ala Ala Gly Tyr Asn Arg Val Arg Ile
370 375 380
Val Gln Leu Leu Leu Gln His Gly Ala Asp Val His Ala Lys Asp Lys
385 390 395 400
Gly Gly Leu Val Pro Leu His Asn Ala Cys Ser Tyr Gly His Tyr Glu
405 410 415
Val Thr Glu Leu Leu Leu Lys His Gly Ala Cys Val Asn Ala Met Asp
420 425 430
Leu Trp Gln Phe Thr Pro Leu His Glu Ala Ala Ser Lys Asn Arg Val
435 440 445
Glu Val Cys Ser Leu Leu Leu Ser His Gly Ala Asp Pro Thr Leu Val
450 455 460
Asn Cys His Gly Lys Ser Ala Val Asp Met Ala Pro Thr Pro Glu Leu
465 470 475 480
Arg Glu Arg Leu Thr Tyr Glu Phe Lys Gly His Ser Leu Leu Gln Ala
485 490 495
Ala Arg Glu Ala Asp Leu Ala Lys Val Lys Lys Thr Leu Ala Leu Glu
500 505 510
Ile Ile Asn Phe Lys Gln Pro Gln Ser His Glu Thr Ala Leu His Cys
515 520 525
Ala Val Ala Ser Leu His Pro Lys Arg Lys Gln Val Thr Glu Leu Leu
530 535 540
Leu Arg Lys Gly Ala Asn Val Asn Glu Lys Asn Lys Asp Phe Met Thr
545 550 555 560
Pro Leu His Val Ala Ala Glu Arg Ala His Asn Asp Val Met Glu Val
565 570 575
Leu His Lys His Gly Ala Lys Met Asn Ala Leu Asp Thr Leu Gly Gln
580 585 590
Thr Ala Leu His Arg Ala Ala Leu Ala Gly His Leu Gln Thr Cys Arg
595 600 605
Leu Leu Leu Ser Tyr Gly Ser Asp Pro Ser Ile Ile Ser Leu Gln Gly
610 615 620
Phe Thr Ala Ala Gln Met Gly Asn Glu Ala Val Gln Gln Ile Leu Ser
625 630 635 640
Glu Ser Thr Pro Ile Arg Thr Ser Asp Val Asp Tyr Arg Leu Leu Glu
645 650 655
Ala Ser Lys Ala Gly Asp Leu Glu Thr Val Lys Gln Leu Cys Ser Ser
660 665 670
Gln Asn Val Asn Cys Arg Asp Leu Glu Gly Arg His Ser Thr Pro Leu
675 680 685
His Phe Ala Ala Gly Tyr Asn Arg Val Ser Val Val Glu Tyr Leu Leu
690 695 700
His His Gly Ala Asp Val His Ala Lys Asp Lys Gly Gly Leu Val Pro
705 710 715 720
Leu His Asn Ala Cys Ser Tyr Gly His Tyr Glu Val Ala Glu Leu Leu
725 730 735
Val Arg His Gly Ala Ser Val Asn Val Ala Asp Leu Trp Lys Phe Thr
740 745 750
Pro Leu His Glu Ala Ala Ala Lys Gly Lys Tyr Glu Ile Cys Lys Leu
755 760 765
Leu Leu Lys His Gly Ala Asp Pro Thr Lys Lys Asn Arg Asp Gly Asn
770 775 780
Thr Pro Leu Asp Leu Val Lys Glu Gly Asp Thr Asp Ile Gln Asp Leu
785 790 795 800
Leu Arg Gly Asp Ala Ala Leu Leu Asp Ala Ala Lys Lys Gly Cys Leu
805 810 815
Ala Arg Val Gln Lys Leu Cys Thr Pro Glu Asn Ile Asn Cys Arg Asp
820 825 830
Thr Gln Gly Arg Asn Ser Thr Pro Leu His Leu Ala Ala Gly Tyr Asn
835 840 845
Asn Leu Glu Val Ala Glu Tyr Leu Leu Glu His Gly Ala Asp Val Asn
850 855 860
Ala Gln Asp Lys Gly Gly Leu Ile Pro Leu His Asn Ala Ala Ser Tyr
865 870 875 880
Gly His Val Asp Ile Ala Ala Leu Leu Ile Lys Tyr Asn Thr Cys Val
885 890 895
Asn Ala Thr Asp Lys Trp Ala Phe Thr Pro Leu His Glu Ala Ala Gln
900 905 910
Lys Gly Arg Thr Gln Leu Cys Ala Leu Leu Leu Ala His Gly Ala Asp
915 920 925
Pro Thr Met Lys Asn Gln Glu Gly Gln Thr Pro Leu Asp Leu Ala Thr
930 935 940
Ala Asp Asp Ile Arg Ala Leu Leu Ile Asp Ala Met Pro Pro Glu Ala
945 950 955 960
Leu Pro Thr Cys Phe Lys Pro Gln Ala Thr Val Val Ser Ala Ser Leu
965 970 975
Ile Ser Pro Ala Ser Thr Pro Ser Cys Leu Ser Ala Ala Ser Ser Ile
980 985 990
Asp Asn Leu Thr Gly Pro Leu Ala Glu Leu Ala Val Gly Gly Ala Ser
995 1000 1005
Asn Ala Gly Asp Gly Ala Ala Gly Thr Glu Arg Lys Glu Gly Glu
1010 1015 1020
Val Ala Gly Leu Asp Met Asn Ile Ser Gln Phe Leu Lys Ser Leu
1025 1030 1035
Gly Leu Glu His Leu Arg Asp Ile Phe Glu Thr Glu Gln Ile Thr
1040 1045 1050
Leu Asp Val Leu Ala Asp Met Gly His Glu Glu Leu Lys Glu Ile
1055 1060 1065
Gly Ile Asn Ala Tyr Gly His Arg His Lys Leu Ile Lys Gly Val
1070 1075 1080
Glu Arg Leu Leu Gly Gly Gln Gln Gly Thr Asn Pro Tyr Leu Thr
1085 1090 1095
Phe His Cys Val Asn Gln Gly Thr Ile Leu Leu Asp Leu Ala Pro
1100 1105 1110
Glu Asp Lys Glu Tyr Gln Ser Val Glu Glu Glu Met Gln Ser Thr
1115 1120 1125
Ile Arg Glu His Arg Asp Gly Gly Asn Ala Gly Gly Ile Phe Asn
1130 1135 1140
Arg Tyr Asn Val Ile Arg Ile Gln Lys Val Val Asn Lys Lys Leu
1145 1150 1155
Arg Glu Arg Phe Cys His Arg Gln Lys Glu Val Ser Glu Glu Asn
1160 1165 1170
His Asn His His Asn Glu Arg Met Leu Phe His Gly Ser Pro Phe
1175 1180 1185
Ile Asn Ala Ile Ile His Lys Gly Phe Asp Glu Arg His Ala Tyr
1190 1195 1200
Ile Gly Gly Met Phe Gly Ala Gly Ile Tyr Phe Ala Glu Asn Ser
1205 1210 1215
Ser Lys Ser Asn Gln Tyr Val Tyr Gly Ile Gly Gly Gly Thr Gly
1220 1225 1230
Cys Pro Thr His Lys Asp Arg Ser Cys Tyr Ile Cys His Arg Gln
1235 1240 1245
Met Leu Phe Cys Arg Val Thr Leu Gly Lys Ser Phe Leu Gln Phe
1250 1255 1260
Ser Thr Met Lys Met Ala His Ala Pro Pro Gly His His Ser Val
1265 1270 1275
Ile Gly Arg Pro Ser Val Asn Gly Leu Ala Tyr Ala Glu Tyr Val
1280 1285 1290
Ile Tyr Arg Gly Glu Gln Ala Tyr Pro Glu Tyr Leu Ile Thr Tyr
1295 1300 1305
Gln Ile Met Lys Pro Glu Ala Pro Ser Gln Thr Ala Thr Ala Ala
1310 1315 1320
Glu Gln Lys Thr
1325
<210> 30
<211> 1166
<212> PRT
<213> 智人
<400> 30
Met Ser Gly Arg Arg Cys Ala Gly Gly Gly Ala Ala Cys Ala Ser Ala
1 5 10 15
Ala Ala Glu Ala Val Glu Pro Ala Ala Arg Glu Leu Phe Glu Ala Cys
20 25 30
Arg Asn Gly Asp Val Glu Arg Val Lys Arg Leu Val Thr Pro Glu Lys
35 40 45
Val Asn Ser Arg Asp Thr Ala Gly Arg Lys Ser Thr Pro Leu His Phe
50 55 60
Ala Ala Gly Phe Gly Arg Lys Asp Val Val Glu Tyr Leu Leu Gln Asn
65 70 75 80
Gly Ala Asn Val Gln Ala Arg Asp Asp Gly Gly Leu Ile Pro Leu His
85 90 95
Asn Ala Cys Ser Phe Gly His Ala Glu Val Val Asn Leu Leu Leu Arg
100 105 110
His Gly Ala Asp Pro Asn Ala Arg Asp Asn Trp Asn Tyr Thr Pro Leu
115 120 125
His Glu Ala Ala Ile Lys Gly Lys Ile Asp Val Cys Ile Val Leu Leu
130 135 140
Gln His Gly Ala Glu Pro Thr Ile Arg Asn Thr Asp Gly Arg Thr Ala
145 150 155 160
Leu Asp Leu Ala Asp Pro Ser Ala Lys Ala Val Leu Thr Gly Glu Tyr
165 170 175
Lys Lys Asp Glu Leu Leu Glu Ser Ala Arg Ser Gly Asn Glu Glu Lys
180 185 190
Met Met Ala Leu Leu Thr Pro Leu Asn Val Asn Cys His Ala Ser Asp
195 200 205
Gly Arg Lys Ser Thr Pro Leu His Leu Ala Ala Gly Tyr Asn Arg Val
210 215 220
Lys Ile Val Gln Leu Leu Leu Gln His Gly Ala Asp Val His Ala Lys
225 230 235 240
Asp Lys Gly Asp Leu Val Pro Leu His Asn Ala Cys Ser Tyr Gly His
245 250 255
Tyr Glu Val Thr Glu Leu Leu Val Lys His Gly Ala Cys Val Asn Ala
260 265 270
Met Asp Leu Trp Gln Phe Thr Pro Leu His Glu Ala Ala Ser Lys Asn
275 280 285
Arg Val Glu Val Cys Ser Leu Leu Leu Ser Tyr Gly Ala Asp Pro Thr
290 295 300
Leu Leu Asn Cys His Asn Lys Ser Ala Ile Asp Leu Ala Pro Thr Pro
305 310 315 320
Gln Leu Lys Glu Arg Leu Ala Tyr Glu Phe Lys Gly His Ser Leu Leu
325 330 335
Gln Ala Ala Arg Glu Ala Asp Val Thr Arg Ile Lys Lys His Leu Ser
340 345 350
Leu Glu Met Val Asn Phe Lys His Pro Gln Thr His Glu Thr Ala Leu
355 360 365
His Cys Ala Ala Ala Ser Pro Tyr Pro Lys Arg Lys Gln Ile Cys Glu
370 375 380
Leu Leu Leu Arg Lys Gly Ala Asn Ile Asn Glu Lys Thr Lys Glu Phe
385 390 395 400
Leu Thr Pro Leu His Val Ala Ser Glu Lys Ala His Asn Asp Val Val
405 410 415
Glu Val Val Val Lys His Glu Ala Lys Val Asn Ala Leu Asp Asn Leu
420 425 430
Gly Gln Thr Ser Leu His Arg Ala Ala Tyr Cys Gly His Leu Gln Thr
435 440 445
Cys Arg Leu Leu Leu Ser Tyr Gly Cys Asp Pro Asn Ile Ile Ser Leu
450 455 460
Gln Gly Phe Thr Ala Leu Gln Met Gly Asn Glu Asn Val Gln Gln Leu
465 470 475 480
Leu Gln Glu Gly Ile Ser Leu Gly Asn Ser Glu Ala Asp Arg Gln Leu
485 490 495
Leu Glu Ala Ala Lys Ala Gly Asp Val Glu Thr Val Lys Lys Leu Cys
500 505 510
Thr Val Gln Ser Val Asn Cys Arg Asp Ile Glu Gly Arg Gln Ser Thr
515 520 525
Pro Leu His Phe Ala Ala Gly Tyr Asn Arg Val Ser Val Val Glu Tyr
530 535 540
Leu Leu Gln His Gly Ala Asp Val His Ala Lys Asp Lys Gly Gly Leu
545 550 555 560
Val Pro Leu His Asn Ala Cys Ser Tyr Gly His Tyr Glu Val Ala Glu
565 570 575
Leu Leu Val Lys His Gly Ala Val Val Asn Val Ala Asp Leu Trp Lys
580 585 590
Phe Thr Pro Leu His Glu Ala Ala Ala Lys Gly Lys Tyr Glu Ile Cys
595 600 605
Lys Leu Leu Leu Gln His Gly Ala Asp Pro Thr Lys Lys Asn Arg Asp
610 615 620
Gly Asn Thr Pro Leu Asp Leu Val Lys Asp Gly Asp Thr Asp Ile Gln
625 630 635 640
Asp Leu Leu Arg Gly Asp Ala Ala Leu Leu Asp Ala Ala Lys Lys Gly
645 650 655
Cys Leu Ala Arg Val Lys Lys Leu Ser Ser Pro Asp Asn Val Asn Cys
660 665 670
Arg Asp Thr Gln Gly Arg His Ser Thr Pro Leu His Leu Ala Ala Gly
675 680 685
Tyr Asn Asn Leu Glu Val Ala Glu Tyr Leu Leu Gln His Gly Ala Asp
690 695 700
Val Asn Ala Gln Asp Lys Gly Gly Leu Ile Pro Leu His Asn Ala Ala
705 710 715 720
Ser Tyr Gly His Val Asp Val Ala Ala Leu Leu Ile Lys Tyr Asn Ala
725 730 735
Cys Val Asn Ala Thr Asp Lys Trp Ala Phe Thr Pro Leu His Glu Ala
740 745 750
Ala Gln Lys Gly Arg Thr Gln Leu Cys Ala Leu Leu Leu Ala His Gly
755 760 765
Ala Asp Pro Thr Leu Lys Asn Gln Glu Gly Gln Thr Pro Leu Asp Leu
770 775 780
Val Ser Ala Asp Asp Val Ser Ala Leu Leu Thr Ala Ala Met Pro Pro
785 790 795 800
Ser Ala Leu Pro Ser Cys Tyr Lys Pro Gln Val Leu Asn Gly Val Arg
805 810 815
Ser Pro Gly Ala Thr Ala Asp Ala Leu Ser Ser Gly Pro Ser Ser Pro
820 825 830
Ser Ser Leu Ser Ala Ala Ser Ser Leu Asp Asn Leu Ser Gly Ser Phe
835 840 845
Ser Glu Leu Ser Ser Val Val Ser Ser Ser Gly Thr Glu Gly Ala Ser
850 855 860
Ser Leu Glu Lys Lys Glu Val Pro Gly Val Asp Phe Ser Ile Thr Gln
865 870 875 880
Phe Val Arg Asn Leu Gly Leu Glu His Leu Met Asp Ile Phe Glu Arg
885 890 895
Glu Gln Ile Thr Leu Asp Val Leu Val Glu Met Gly His Lys Glu Leu
900 905 910
Lys Glu Ile Gly Ile Asn Ala Tyr Gly His Arg His Lys Leu Ile Lys
915 920 925
Gly Val Glu Arg Leu Ile Ser Gly Gln Gln Gly Leu Asn Pro Tyr Leu
930 935 940
Thr Leu Asn Thr Ser Gly Ser Gly Thr Ile Leu Ile Asp Leu Ser Pro
945 950 955 960
Asp Asp Lys Glu Phe Gln Ser Val Glu Glu Glu Met Gln Ser Thr Val
965 970 975
Arg Glu His Arg Asp Gly Gly His Ala Gly Gly Ile Phe Asn Arg Tyr
980 985 990
Asn Ile Leu Lys Ile Gln Lys Val Cys Asn Lys Lys Leu Trp Glu Arg
995 1000 1005
Tyr Thr His Arg Arg Lys Glu Val Ser Glu Glu Asn His Asn His
1010 1015 1020
Ala Asn Glu Arg Met Leu Phe His Gly Ser Pro Phe Val Asn Ala
1025 1030 1035
Ile Ile His Lys Gly Phe Asp Glu Arg His Ala Tyr Ile Gly Gly
1040 1045 1050
Met Phe Gly Ala Gly Ile Tyr Phe Ala Glu Asn Ser Ser Lys Ser
1055 1060 1065
Asn Gln Tyr Val Tyr Gly Ile Gly Gly Gly Thr Gly Cys Pro Val
1070 1075 1080
His Lys Asp Arg Ser Cys Tyr Ile Cys His Arg Gln Leu Leu Phe
1085 1090 1095
Cys Arg Val Thr Leu Gly Lys Ser Phe Leu Gln Phe Ser Ala Met
1100 1105 1110
Lys Met Ala His Ser Pro Pro Gly His His Ser Val Thr Gly Arg
1115 1120 1125
Pro Ser Val Asn Gly Leu Ala Leu Ala Glu Tyr Val Ile Tyr Arg
1130 1135 1140
Gly Glu Gln Ala Tyr Pro Glu Tyr Leu Ile Thr Tyr Gln Ile Met
1145 1150 1155
Arg Pro Glu Gly Met Val Asp Gly
1160 1165
<210> 31
<211> 197
<212> PRT
<213> 智人
<400> 31
Met Tyr Trp Ser Asn Gln Ile Thr Arg Arg Leu Gly Glu Arg Val Gln
1 5 10 15
Gly Phe Met Ser Gly Ile Ser Pro Gln Gln Met Gly Glu Pro Glu Gly
20 25 30
Ser Trp Ser Gly Lys Asn Pro Gly Thr Met Gly Ala Ser Arg Leu Tyr
35 40 45
Thr Leu Val Leu Val Leu Gln Pro Gln Arg Val Leu Leu Gly Met Lys
50 55 60
Lys Arg Gly Phe Gly Ala Gly Arg Trp Asn Gly Phe Gly Gly Lys Val
65 70 75 80
Gln Glu Gly Glu Thr Ile Glu Asp Gly Ala Arg Arg Glu Leu Gln Glu
85 90 95
Glu Ser Gly Leu Thr Val Asp Ala Leu His Lys Val Gly Gln Ile Val
100 105 110
Phe Glu Phe Val Gly Glu Pro Glu Leu Met Asp Val His Val Phe Cys
115 120 125
Thr Asp Ser Ile Gln Gly Thr Pro Val Glu Ser Asp Glu Met Arg Pro
130 135 140
Cys Trp Phe Gln Leu Asp Gln Ile Pro Phe Lys Asp Met Trp Pro Asp
145 150 155 160
Asp Ser Tyr Trp Phe Pro Leu Leu Leu Gln Lys Lys Lys Phe His Gly
165 170 175
Tyr Phe Lys Phe Gln Gly Gln Asp Thr Ile Leu Asp Tyr Thr Leu Arg
180 185 190
Glu Val Asp Thr Val
195
<210> 32
<211> 536
<212> PRT
<213> 智人
<400> 32
Met Gly Ser Asn Lys Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg
1 5 10 15
Ser Leu Glu Pro Ala Glu Asn Val His Gly Ala Gly Gly Gly Ala Phe
20 25 30
Pro Ala Ser Gln Thr Pro Ser Lys Pro Ala Ser Ala Asp Gly His Arg
35 40 45
Gly Pro Ser Ala Ala Phe Ala Pro Ala Ala Ala Glu Pro Lys Leu Phe
50 55 60
Gly Gly Phe Asn Ser Ser Asp Thr Val Thr Ser Pro Gln Arg Ala Gly
65 70 75 80
Pro Leu Ala Gly Gly Val Thr Thr Phe Val Ala Leu Tyr Asp Tyr Glu
85 90 95
Ser Arg Thr Glu Thr Asp Leu Ser Phe Lys Lys Gly Glu Arg Leu Gln
100 105 110
Ile Val Asn Asn Thr Glu Gly Asp Trp Trp Leu Ala His Ser Leu Ser
115 120 125
Thr Gly Gln Thr Gly Tyr Ile Pro Ser Asn Tyr Val Ala Pro Ser Asp
130 135 140
Ser Ile Gln Ala Glu Glu Trp Tyr Phe Gly Lys Ile Thr Arg Arg Glu
145 150 155 160
Ser Glu Arg Leu Leu Leu Asn Ala Glu Asn Pro Arg Gly Thr Phe Leu
165 170 175
Val Arg Glu Ser Glu Thr Thr Lys Gly Ala Tyr Cys Leu Ser Val Ser
180 185 190
Asp Phe Asp Asn Ala Lys Gly Leu Asn Val Lys His Tyr Lys Ile Arg
195 200 205
Lys Leu Asp Ser Gly Gly Phe Tyr Ile Thr Ser Arg Thr Gln Phe Asn
210 215 220
Ser Leu Gln Gln Leu Val Ala Tyr Tyr Ser Lys His Ala Asp Gly Leu
225 230 235 240
Cys His Arg Leu Thr Thr Val Cys Pro Thr Ser Lys Pro Gln Thr Gln
245 250 255
Gly Leu Ala Lys Asp Ala Trp Glu Ile Pro Arg Glu Ser Leu Arg Leu
260 265 270
Glu Val Lys Leu Gly Gln Gly Cys Phe Gly Glu Val Trp Met Gly Thr
275 280 285
Trp Asn Gly Thr Thr Arg Val Ala Ile Lys Thr Leu Lys Pro Gly Thr
290 295 300
Met Ser Pro Glu Ala Phe Leu Gln Glu Ala Gln Val Met Lys Lys Leu
305 310 315 320
Arg His Glu Lys Leu Val Gln Leu Tyr Ala Val Val Ser Glu Glu Pro
325 330 335
Ile Tyr Ile Val Thr Glu Tyr Met Ser Lys Gly Ser Leu Leu Asp Phe
340 345 350
Leu Lys Gly Glu Thr Gly Lys Tyr Leu Arg Leu Pro Gln Leu Val Asp
355 360 365
Met Ala Ala Gln Ile Ala Ser Gly Met Ala Tyr Val Glu Arg Met Asn
370 375 380
Tyr Val His Arg Asp Leu Arg Ala Ala Asn Ile Leu Val Gly Glu Asn
385 390 395 400
Leu Val Cys Lys Val Ala Asp Phe Gly Leu Ala Arg Leu Ile Glu Asp
405 410 415
Asn Glu Tyr Thr Ala Arg Gln Gly Ala Lys Phe Pro Ile Lys Trp Thr
420 425 430
Ala Pro Glu Ala Ala Leu Tyr Gly Arg Phe Thr Ile Lys Ser Asp Val
435 440 445
Trp Ser Phe Gly Ile Leu Leu Thr Glu Leu Thr Thr Lys Gly Arg Val
450 455 460
Pro Tyr Pro Gly Met Val Asn Arg Glu Val Leu Asp Gln Val Glu Arg
465 470 475 480
Gly Tyr Arg Met Pro Cys Pro Pro Glu Cys Pro Glu Ser Leu His Asp
485 490 495
Leu Met Cys Gln Cys Trp Arg Lys Glu Pro Glu Glu Arg Pro Thr Phe
500 505 510
Glu Tyr Leu Gln Ala Phe Leu Glu Asp Tyr Phe Thr Ser Thr Glu Pro
515 520 525
Gln Tyr Gln Pro Gly Glu Asn Leu
530 535
<210> 33
<211> 152
<212> PRT
<213> 智人
<400> 33
Met Pro Ala His Ser Leu Val Met Ser Ser Pro Ala Leu Pro Ala Phe
1 5 10 15
Leu Leu Cys Ser Thr Leu Leu Val Ile Lys Met Tyr Val Val Ala Ile
20 25 30
Ile Thr Gly Gln Val Arg Leu Arg Lys Lys Ala Phe Ala Asn Pro Glu
35 40 45
Asp Ala Leu Arg His Gly Gly Pro Gln Tyr Cys Arg Ser Asp Pro Asp
50 55 60
Val Glu Arg Cys Leu Arg Ala His Arg Asn Asp Met Glu Thr Ile Tyr
65 70 75 80
Pro Phe Leu Phe Leu Gly Phe Val Tyr Ser Phe Leu Gly Pro Asn Pro
85 90 95
Phe Val Ala Trp Met His Phe Leu Val Phe Leu Val Gly Arg Val Ala
100 105 110
His Thr Val Ala Tyr Leu Gly Lys Leu Arg Ala Pro Ile Arg Ser Val
115 120 125
Thr Tyr Thr Leu Ala Gln Leu Pro Cys Ala Ser Met Ala Leu Gln Ile
130 135 140
Leu Trp Glu Ala Ala Arg His Leu
145 150
<210> 34
<211> 161
<212> PRT
<213> 智人
<400> 34
Met Asp Gln Glu Thr Val Gly Asn Val Val Leu Leu Ala Ile Val Thr
1 5 10 15
Leu Ile Ser Val Val Gln Asn Gly Phe Phe Ala His Lys Val Glu His
20 25 30
Glu Ser Arg Thr Gln Asn Gly Arg Ser Phe Gln Arg Thr Gly Thr Leu
35 40 45
Ala Phe Glu Arg Val Tyr Thr Ala Asn Gln Asn Cys Val Asp Ala Tyr
50 55 60
Pro Thr Phe Leu Ala Val Leu Trp Ser Ala Gly Leu Leu Cys Ser Gln
65 70 75 80
Val Pro Ala Ala Phe Ala Gly Leu Met Tyr Leu Phe Val Arg Gln Lys
85 90 95
Tyr Phe Val Gly Tyr Leu Gly Glu Arg Thr Gln Ser Thr Pro Gly Tyr
100 105 110
Ile Phe Gly Lys Arg Ile Ile Leu Phe Leu Phe Leu Met Ser Val Ala
115 120 125
Gly Ile Phe Asn Tyr Tyr Leu Ile Phe Phe Phe Gly Ser Asp Phe Glu
130 135 140
Asn Tyr Ile Lys Thr Ile Ser Thr Thr Ile Ser Pro Leu Leu Leu Ile
145 150 155 160
Pro
<210> 35
<211> 132
<212> PRT
<213> 智人
<400> 35
Met Cys Asp Ala Phe Val Gly Thr Trp Lys Leu Val Ser Ser Glu Asn
1 5 10 15
Phe Asp Asp Tyr Met Lys Glu Val Gly Val Gly Phe Ala Thr Arg Lys
20 25 30
Val Ala Gly Met Ala Lys Pro Asn Met Ile Ile Ser Val Asn Gly Asp
35 40 45
Val Ile Thr Ile Lys Ser Glu Ser Thr Phe Lys Asn Thr Glu Ile Ser
50 55 60
Phe Ile Leu Gly Gln Glu Phe Asp Glu Val Thr Ala Asp Asp Arg Lys
65 70 75 80
Val Lys Ser Thr Ile Thr Leu Asp Gly Gly Val Leu Val His Val Gln
85 90 95
Lys Trp Asp Gly Lys Ser Thr Thr Ile Lys Arg Lys Arg Glu Asp Asp
100 105 110
Lys Leu Val Val Glu Cys Val Met Lys Gly Val Thr Ser Thr Arg Val
115 120 125
Tyr Glu Arg Ala
130
<210> 36
<211> 1821
<212> PRT
<213> 智人
<400> 36
Met Ser Cys Glu Arg Lys Gly Leu Ser Glu Leu Arg Ser Glu Leu Tyr
1 5 10 15
Phe Leu Ile Ala Arg Phe Leu Glu Asp Gly Pro Cys Gln Gln Ala Ala
20 25 30
Gln Val Leu Ile Arg Glu Val Ala Glu Lys Glu Leu Leu Pro Arg Arg
35 40 45
Thr Asp Trp Thr Gly Lys Glu His Pro Arg Thr Tyr Gln Asn Leu Val
50 55 60
Lys Tyr Tyr Arg His Leu Ala Pro Asp His Leu Leu Gln Ile Cys His
65 70 75 80
Arg Leu Gly Pro Leu Leu Glu Gln Glu Ile Pro Gln Ser Val Pro Gly
85 90 95
Val Gln Thr Leu Leu Gly Ala Gly Arg Gln Ser Leu Leu Arg Thr Asn
100 105 110
Lys Ser Cys Lys His Val Val Trp Lys Gly Ser Ala Leu Ala Ala Leu
115 120 125
His Cys Gly Arg Pro Pro Glu Ser Pro Val Asn Tyr Gly Ser Pro Pro
130 135 140
Ser Ile Ala Asp Thr Leu Phe Ser Arg Lys Leu Asn Gly Lys Tyr Arg
145 150 155 160
Leu Glu Arg Leu Val Pro Thr Ala Val Tyr Gln His Met Lys Met His
165 170 175
Lys Arg Ile Leu Gly His Leu Ser Ser Val Tyr Cys Val Thr Phe Asp
180 185 190
Arg Thr Gly Arg Arg Ile Phe Thr Gly Ser Asp Asp Cys Leu Val Lys
195 200 205
Ile Trp Ala Thr Asp Asp Gly Arg Leu Leu Ala Thr Leu Arg Gly His
210 215 220
Ala Ala Glu Ile Ser Asp Met Ala Val Asn Tyr Glu Asn Thr Met Ile
225 230 235 240
Ala Ala Gly Ser Cys Asp Lys Met Ile Arg Val Trp Cys Leu Arg Thr
245 250 255
Cys Ala Pro Leu Ala Val Leu Gln Gly His Ser Ala Ser Ile Thr Ser
260 265 270
Leu Gln Phe Ser Pro Leu Cys Ser Gly Ser Lys Arg Tyr Leu Ser Ser
275 280 285
Thr Gly Ala Asp Gly Thr Ile Cys Phe Trp Leu Trp Asp Ala Gly Thr
290 295 300
Leu Lys Ile Asn Pro Arg Pro Ala Lys Phe Thr Glu Arg Pro Arg Pro
305 310 315 320
Gly Val Gln Met Ile Cys Ser Ser Phe Ser Ala Gly Gly Met Phe Leu
325 330 335
Ala Thr Gly Ser Thr Asp His Ile Ile Arg Val Tyr Phe Phe Gly Ser
340 345 350
Gly Gln Pro Glu Lys Ile Ser Glu Leu Glu Phe His Thr Asp Lys Val
355 360 365
Asp Ser Ile Gln Phe Ser Asn Thr Ser Asn Arg Phe Val Ser Gly Ser
370 375 380
Arg Asp Gly Thr Ala Arg Ile Trp Gln Phe Lys Arg Arg Glu Trp Lys
385 390 395 400
Ser Ile Leu Leu Asp Met Ala Thr Arg Pro Ala Gly Gln Asn Leu Gln
405 410 415
Gly Ile Glu Asp Lys Ile Thr Lys Met Lys Val Thr Met Val Ala Trp
420 425 430
Asp Arg His Asp Asn Thr Val Ile Thr Ala Val Asn Asn Met Thr Leu
435 440 445
Lys Val Trp Asn Ser Tyr Thr Gly Gln Leu Ile His Val Leu Met Gly
450 455 460
His Glu Asp Glu Val Phe Val Leu Glu Pro His Pro Phe Asp Pro Arg
465 470 475 480
Val Leu Phe Ser Ala Gly His Asp Gly Asn Val Ile Val Trp Asp Leu
485 490 495
Ala Arg Gly Val Lys Ile Arg Ser Tyr Phe Asn Met Ile Glu Gly Gln
500 505 510
Gly His Gly Ala Val Phe Asp Cys Lys Cys Ser Pro Asp Gly Gln His
515 520 525
Phe Ala Cys Thr Asp Ser His Gly His Leu Leu Ile Phe Gly Phe Gly
530 535 540
Ser Ser Ser Lys Tyr Asp Lys Ile Ala Asp Gln Met Phe Phe His Ser
545 550 555 560
Asp Tyr Arg Pro Leu Ile Arg Asp Ala Asn Asn Phe Val Leu Asp Glu
565 570 575
Gln Thr Gln Gln Ala Pro His Leu Met Pro Pro Pro Phe Leu Val Asp
580 585 590
Val Asp Gly Asn Pro His Pro Ser Arg Tyr Gln Arg Leu Val Pro Gly
595 600 605
Arg Glu Asn Cys Arg Glu Glu Gln Leu Ile Pro Gln Met Gly Val Thr
610 615 620
Ser Ser Gly Leu Asn Gln Val Leu Ser Gln Gln Ala Asn Gln Glu Ile
625 630 635 640
Ser Pro Leu Asp Ser Met Ile Gln Arg Leu Gln Gln Glu Gln Asp Leu
645 650 655
Arg Arg Ser Gly Glu Ala Val Ile Ser Asn Thr Ser Arg Leu Ser Arg
660 665 670
Gly Ser Ile Ser Ser Thr Ser Glu Val His Ser Pro Pro Asn Val Gly
675 680 685
Leu Arg Arg Ser Gly Gln Ile Glu Gly Val Arg Gln Met His Ser Asn
690 695 700
Ala Pro Arg Ser Glu Ile Ala Thr Glu Arg Asp Leu Val Ala Trp Ser
705 710 715 720
Arg Arg Val Val Val Pro Glu Leu Ser Ala Gly Val Ala Ser Arg Gln
725 730 735
Glu Glu Trp Arg Thr Ala Lys Gly Glu Glu Glu Ile Lys Thr Tyr Arg
740 745 750
Ser Glu Glu Lys Arg Lys His Leu Thr Val Pro Lys Glu Asn Lys Ile
755 760 765
Pro Thr Val Ser Lys Asn His Ala His Glu His Phe Leu Asp Leu Gly
770 775 780
Glu Ser Lys Lys Gln Gln Thr Asn Gln His Asn Tyr Arg Thr Arg Ser
785 790 795 800
Ala Leu Glu Glu Thr Pro Arg Pro Ser Glu Glu Ile Glu Asn Gly Ser
805 810 815
Ser Ser Ser Asp Glu Gly Glu Val Val Ala Val Ser Gly Gly Thr Ser
820 825 830
Glu Glu Glu Glu Arg Ala Trp His Ser Asp Gly Ser Ser Ser Asp Tyr
835 840 845
Ser Ser Asp Tyr Ser Asp Trp Thr Ala Asp Ala Gly Ile Asn Leu Gln
850 855 860
Pro Pro Lys Lys Val Pro Lys Asn Lys Thr Lys Lys Ala Glu Ser Ser
865 870 875 880
Ser Asp Glu Glu Glu Glu Ser Glu Lys Gln Lys Gln Lys Gln Ile Lys
885 890 895
Lys Glu Lys Lys Lys Val Asn Glu Glu Lys Asp Gly Pro Ile Ser Pro
900 905 910
Lys Lys Lys Lys Pro Lys Glu Arg Lys Gln Lys Arg Leu Ala Val Gly
915 920 925
Glu Leu Thr Glu Asn Gly Leu Thr Leu Glu Glu Trp Leu Pro Ser Thr
930 935 940
Trp Ile Thr Asp Thr Ile Pro Arg Arg Cys Pro Phe Val Pro Gln Met
945 950 955 960
Gly Asp Glu Val Tyr Tyr Phe Arg Gln Gly His Glu Ala Tyr Val Glu
965 970 975
Met Ala Arg Lys Asn Lys Ile Tyr Ser Ile Asn Pro Lys Lys Gln Pro
980 985 990
Trp His Lys Met Glu Leu Arg Glu Gln Glu Leu Met Lys Ile Val Gly
995 1000 1005
Ile Lys Tyr Glu Val Gly Leu Pro Thr Leu Cys Cys Leu Lys Leu
1010 1015 1020
Ala Phe Leu Asp Pro Asp Thr Gly Lys Leu Thr Gly Gly Ser Phe
1025 1030 1035
Thr Met Lys Tyr His Asp Met Pro Asp Val Ile Asp Phe Leu Val
1040 1045 1050
Leu Arg Gln Gln Phe Asp Asp Ala Lys Tyr Arg Arg Trp Asn Ile
1055 1060 1065
Gly Asp Arg Phe Arg Ser Val Ile Asp Asp Ala Trp Trp Phe Gly
1070 1075 1080
Thr Ile Glu Ser Gln Glu Pro Leu Gln Leu Glu Tyr Pro Asp Ser
1085 1090 1095
Leu Phe Gln Cys Tyr Asn Val Cys Trp Asp Asn Gly Asp Thr Glu
1100 1105 1110
Lys Met Ser Pro Trp Asp Met Glu Leu Ile Pro Asn Asn Ala Val
1115 1120 1125
Phe Pro Glu Glu Leu Gly Thr Ser Val Pro Leu Thr Asp Gly Glu
1130 1135 1140
Cys Arg Ser Leu Ile Tyr Lys Pro Leu Asp Gly Glu Trp Gly Thr
1145 1150 1155
Asn Pro Arg Asp Glu Glu Cys Glu Arg Ile Val Ala Gly Ile Asn
1160 1165 1170
Gln Leu Met Thr Leu Asp Ile Ala Ser Ala Phe Val Ala Pro Val
1175 1180 1185
Asp Leu Gln Ala Tyr Pro Met Tyr Cys Thr Val Val Ala Tyr Pro
1190 1195 1200
Thr Asp Leu Ser Thr Ile Lys Gln Arg Leu Glu Asn Arg Phe Tyr
1205 1210 1215
Arg Arg Val Ser Ser Leu Met Trp Glu Val Arg Tyr Ile Glu His
1220 1225 1230
Asn Thr Arg Thr Phe Asn Glu Pro Gly Ser Pro Ile Val Lys Ser
1235 1240 1245
Ala Lys Phe Val Thr Asp Leu Leu Leu His Phe Ile Lys Asp Gln
1250 1255 1260
Thr Cys Tyr Asn Ile Ile Pro Leu Tyr Asn Ser Met Lys Lys Lys
1265 1270 1275
Val Leu Ser Asp Ser Glu Asp Glu Glu Lys Asp Ala Asp Val Pro
1280 1285 1290
Gly Thr Ser Thr Arg Lys Arg Lys Asp His Gln Pro Arg Arg Arg
1295 1300 1305
Leu Arg Asn Arg Ala Gln Ser Tyr Asp Ile Gln Ala Trp Lys Lys
1310 1315 1320
Gln Cys Glu Glu Leu Leu Asn Leu Ile Phe Gln Cys Glu Asp Ser
1325 1330 1335
Glu Pro Phe Arg Gln Pro Val Asp Leu Leu Glu Tyr Pro Asp Tyr
1340 1345 1350
Arg Asp Ile Ile Asp Thr Pro Met Asp Phe Ala Thr Val Arg Glu
1355 1360 1365
Thr Leu Glu Ala Gly Asn Tyr Glu Ser Pro Met Glu Leu Cys Lys
1370 1375 1380
Asp Val Arg Leu Ile Phe Ser Asn Ser Lys Ala Tyr Thr Pro Ser
1385 1390 1395
Lys Arg Ser Arg Ile Tyr Ser Met Ser Leu Arg Leu Ser Ala Phe
1400 1405 1410
Phe Glu Glu His Ile Ser Ser Val Leu Ser Asp Tyr Lys Ser Ala
1415 1420 1425
Leu Arg Phe His Lys Arg Asn Thr Ile Thr Lys Arg Arg Lys Lys
1430 1435 1440
Arg Asn Arg Ser Ser Ser Val Ser Ser Ser Ala Ala Ser Ser Pro
1445 1450 1455
Glu Arg Lys Lys Arg Ile Leu Lys Pro Gln Leu Lys Ser Glu Ser
1460 1465 1470
Ser Thr Ser Ala Phe Ser Thr Pro Thr Arg Ser Ile Pro Pro Arg
1475 1480 1485
His Asn Ala Ala Gln Ile Asn Gly Lys Thr Glu Ser Ser Ser Val
1490 1495 1500
Val Arg Thr Arg Ser Asn Arg Val Val Val Asp Pro Val Val Thr
1505 1510 1515
Glu Gln Pro Ser Thr Ser Ser Ala Ala Lys Thr Phe Ile Thr Lys
1520 1525 1530
Ala Asn Ala Ser Ala Ile Pro Gly Lys Thr Ile Leu Glu Asn Ser
1535 1540 1545
Val Lys His Ser Lys Ala Leu Asn Thr Leu Ser Ser Pro Gly Gln
1550 1555 1560
Ser Ser Phe Ser His Gly Thr Arg Asn Asn Ser Ala Lys Glu Asn
1565 1570 1575
Met Glu Lys Glu Lys Pro Val Lys Arg Lys Met Lys Ser Ser Val
1580 1585 1590
Leu Pro Lys Ala Ser Thr Leu Ser Lys Ser Ser Ala Val Ile Glu
1595 1600 1605
Gln Gly Asp Cys Lys Asn Asn Ala Leu Val Pro Gly Thr Ile Gln
1610 1615 1620
Val Asn Gly His Gly Gly Gln Pro Ser Lys Leu Val Lys Arg Gly
1625 1630 1635
Pro Gly Arg Lys Pro Lys Val Glu Val Asn Thr Asn Ser Gly Glu
1640 1645 1650
Ile Ile His Lys Lys Arg Gly Arg Lys Pro Lys Lys Leu Gln Tyr
1655 1660 1665
Ala Lys Pro Glu Asp Leu Glu Gln Asn Asn Val His Pro Ile Arg
1670 1675 1680
Asp Glu Val Leu Pro Ser Ser Thr Cys Asn Phe Leu Ser Glu Thr
1685 1690 1695
Asn Asn Val Lys Glu Asp Leu Leu Gln Lys Lys Asn Arg Gly Gly
1700 1705 1710
Arg Lys Pro Lys Arg Lys Met Lys Thr Gln Lys Leu Asp Ala Asp
1715 1720 1725
Leu Leu Val Pro Ala Ser Val Lys Val Leu Arg Arg Ser Asn Arg
1730 1735 1740
Lys Lys Ile Asp Asp Pro Ile Asp Glu Glu Glu Glu Phe Glu Glu
1745 1750 1755
Leu Lys Gly Ser Glu Pro His Met Arg Thr Arg Asn Gln Gly Arg
1760 1765 1770
Arg Thr Ala Phe Tyr Asn Glu Asp Asp Ser Glu Glu Glu Gln Arg
1775 1780 1785
Gln Leu Leu Phe Glu Asp Thr Ser Leu Thr Phe Gly Thr Ser Ser
1790 1795 1800
Arg Gly Arg Val Arg Lys Leu Thr Glu Lys Ala Lys Ala Asn Leu
1805 1810 1815
Ile Gly Trp
1820
<210> 37
<211> 158
<212> PRT
<213> 智人
<400> 37
Met Ser Gly Ile Ala Leu Ser Arg Leu Ala Gln Glu Arg Lys Ala Trp
1 5 10 15
Arg Lys Asp His Pro Phe Gly Phe Val Ala Val Pro Thr Lys Asn Pro
20 25 30
Asp Gly Thr Met Asn Leu Met Asn Trp Glu Cys Ala Ile Pro Gly Lys
35 40 45
Lys Gly Thr Pro Trp Glu Gly Gly Leu Phe Lys Leu Arg Met Leu Phe
50 55 60
Lys Asp Asp Tyr Pro Ser Ser Pro Pro Lys Cys Lys Phe Glu Pro Pro
65 70 75 80
Leu Phe His Pro Asn Val Tyr Pro Ser Gly Thr Val Cys Leu Ser Ile
85 90 95
Leu Glu Glu Asp Lys Asp Trp Arg Pro Ala Ile Thr Ile Lys Gln Ile
100 105 110
Leu Leu Gly Ile Gln Glu Leu Leu Asn Glu Pro Asn Ile Gln Asp Pro
115 120 125
Ala Gln Ala Glu Ala Tyr Thr Ile Tyr Cys Gln Asn Arg Val Glu Tyr
130 135 140
Glu Lys Arg Val Arg Ala Gln Ala Lys Lys Phe Ala Pro Ser
145 150 155
<210> 38
<211> 101
<212> PRT
<213> 智人
<400> 38
Met Ser Asn Thr Gln Ala Glu Arg Ser Ile Ile Gly Met Ile Asp Met
1 5 10 15
Phe His Lys Tyr Thr Arg Arg Asp Asp Lys Ile Glu Lys Pro Ser Leu
20 25 30
Leu Thr Met Met Lys Glu Asn Phe Pro Asn Phe Leu Ser Ala Cys Asp
35 40 45
Lys Lys Gly Thr Asn Tyr Leu Ala Asp Val Phe Glu Lys Lys Asp Lys
50 55 60
Asn Glu Asp Lys Lys Ile Asp Phe Ser Glu Phe Leu Ser Leu Leu Gly
65 70 75 80
Asp Ile Ala Thr Asp Tyr His Lys Gln Ser His Gly Ala Ala Pro Cys
85 90 95
Ser Gly Gly Ser Gln
100
<210> 39
<211> 144
<212> PRT
<213> 智人
<400> 39
Met Lys Thr Leu Leu Leu Leu Ala Val Ile Met Ile Phe Gly Leu Leu
1 5 10 15
Gln Ala His Gly Asn Leu Val Asn Phe His Arg Met Ile Lys Leu Thr
20 25 30
Thr Gly Lys Glu Ala Ala Leu Ser Tyr Gly Phe Tyr Gly Cys His Cys
35 40 45
Gly Val Gly Gly Arg Gly Ser Pro Lys Asp Ala Thr Asp Arg Cys Cys
50 55 60
Val Thr His Asp Cys Cys Tyr Lys Arg Leu Glu Lys Arg Gly Cys Gly
65 70 75 80
Thr Lys Phe Leu Ser Tyr Lys Phe Ser Asn Ser Gly Ser Arg Ile Thr
85 90 95
Cys Ala Lys Gln Asp Ser Cys Arg Ser Gln Leu Cys Glu Cys Asp Lys
100 105 110
Ala Ala Ala Thr Cys Phe Ala Arg Asn Lys Thr Thr Tyr Asn Lys Lys
115 120 125
Tyr Gln Tyr Tyr Ser Asn Lys His Cys Arg Gly Ser Thr Pro Arg Cys
130 135 140
<210> 40
<211> 1215
<212> PRT
<213> 智人
<400> 40
Met Thr Ser Thr Gly Gln Asp Ser Thr Thr Thr Arg Gln Arg Arg Ser
1 5 10 15
Arg Gln Asn Pro Gln Ser Pro Pro Gln Asp Ser Ser Val Thr Ser Lys
20 25 30
Arg Asn Ile Lys Lys Gly Ala Val Pro Arg Ser Ile Pro Asn Leu Ala
35 40 45
Glu Val Lys Lys Lys Gly Lys Met Lys Lys Leu Gly Gln Ala Met Glu
50 55 60
Glu Asp Leu Ile Val Gly Leu Gln Gly Met Asp Leu Asn Leu Glu Ala
65 70 75 80
Glu Ala Leu Ala Gly Thr Gly Leu Val Leu Asp Glu Gln Leu Asn Glu
85 90 95
Phe His Cys Leu Trp Asp Asp Ser Phe Pro Glu Gly Pro Glu Arg Leu
100 105 110
His Ala Ile Lys Glu Gln Leu Ile Gln Glu Gly Leu Leu Asp Arg Cys
115 120 125
Val Ser Phe Gln Ala Arg Phe Ala Glu Lys Glu Glu Leu Met Leu Val
130 135 140
His Ser Leu Glu Tyr Ile Asp Leu Met Glu Thr Thr Gln Tyr Met Asn
145 150 155 160
Glu Gly Glu Leu Arg Val Leu Ala Asp Thr Tyr Asp Ser Val Tyr Leu
165 170 175
His Pro Asn Ser Tyr Ser Cys Ala Cys Leu Ala Ser Gly Ser Val Leu
180 185 190
Arg Leu Val Asp Ala Val Leu Gly Ala Glu Ile Arg Asn Gly Met Ala
195 200 205
Ile Ile Arg Pro Pro Gly His His Ala Gln His Ser Leu Met Asp Gly
210 215 220
Tyr Cys Met Phe Asn His Val Ala Val Ala Ala Arg Tyr Ala Gln Gln
225 230 235 240
Lys His Arg Ile Arg Arg Val Leu Ile Val Asp Trp Asp Val His His
245 250 255
Gly Gln Gly Thr Gln Phe Thr Phe Asp Gln Asp Pro Ser Val Leu Tyr
260 265 270
Phe Ser Ile His Arg Tyr Glu Gln Gly Arg Phe Trp Pro His Leu Lys
275 280 285
Ala Ser Asn Trp Ser Thr Thr Gly Phe Gly Gln Gly Gln Gly Tyr Thr
290 295 300
Ile Asn Val Pro Trp Asn Gln Val Gly Met Arg Asp Ala Asp Tyr Ile
305 310 315 320
Ala Ala Phe Leu His Val Leu Leu Pro Val Ala Leu Glu Phe Gln Pro
325 330 335
Gln Leu Val Leu Val Ala Ala Gly Phe Asp Ala Leu Gln Gly Asp Pro
340 345 350
Lys Gly Glu Met Ala Ala Thr Pro Ala Gly Phe Ala Gln Leu Thr His
355 360 365
Leu Leu Met Gly Leu Ala Gly Gly Lys Leu Ile Leu Ser Leu Glu Gly
370 375 380
Gly Tyr Asn Leu Arg Ala Leu Ala Glu Gly Val Ser Ala Ser Leu His
385 390 395 400
Thr Leu Leu Gly Asp Pro Cys Pro Met Leu Glu Ser Pro Gly Ala Pro
405 410 415
Cys Arg Ser Ala Gln Ala Ser Val Ser Cys Ala Leu Glu Ala Leu Glu
420 425 430
Pro Phe Trp Glu Val Leu Val Arg Ser Thr Glu Thr Val Glu Arg Asp
435 440 445
Asn Met Glu Glu Asp Asn Val Glu Glu Ser Glu Glu Glu Gly Pro Trp
450 455 460
Glu Pro Pro Val Leu Pro Ile Leu Thr Trp Pro Val Leu Gln Ser Arg
465 470 475 480
Thr Gly Leu Val Tyr Asp Gln Asn Met Met Asn His Cys Asn Leu Trp
485 490 495
Asp Ser His His Pro Glu Val Pro Gln Arg Ile Leu Arg Ile Met Cys
500 505 510
Arg Leu Glu Glu Leu Gly Leu Ala Gly Arg Cys Leu Thr Leu Thr Pro
515 520 525
Arg Pro Ala Thr Glu Ala Glu Leu Leu Thr Cys His Ser Ala Glu Tyr
530 535 540
Val Gly His Leu Arg Ala Thr Glu Lys Met Lys Thr Arg Glu Leu His
545 550 555 560
Arg Glu Ser Ser Asn Phe Asp Ser Ile Tyr Ile Cys Pro Ser Thr Phe
565 570 575
Ala Cys Ala Gln Leu Ala Thr Gly Ala Ala Cys Arg Leu Val Glu Ala
580 585 590
Val Leu Ser Gly Glu Val Leu Asn Gly Ala Ala Val Val Arg Pro Pro
595 600 605
Gly His His Ala Glu Gln Asp Ala Ala Cys Gly Phe Cys Phe Phe Asn
610 615 620
Ser Val Ala Val Ala Ala Arg His Ala Gln Thr Ile Ser Gly His Ala
625 630 635 640
Leu Arg Ile Leu Ile Val Asp Trp Asp Val His His Gly Asn Gly Thr
645 650 655
Gln His Met Phe Glu Asp Asp Pro Ser Val Leu Tyr Val Ser Leu His
660 665 670
Arg Tyr Asp His Gly Thr Phe Phe Pro Met Gly Asp Glu Gly Ala Ser
675 680 685
Ser Gln Ile Gly Arg Ala Ala Gly Thr Gly Phe Thr Val Asn Val Ala
690 695 700
Trp Asn Gly Pro Arg Met Gly Asp Ala Asp Tyr Leu Ala Ala Trp His
705 710 715 720
Arg Leu Val Leu Pro Ile Ala Tyr Glu Phe Asn Pro Glu Leu Val Leu
725 730 735
Val Ser Ala Gly Phe Asp Ala Ala Arg Gly Asp Pro Leu Gly Gly Cys
740 745 750
Gln Val Ser Pro Glu Gly Tyr Ala His Leu Thr His Leu Leu Met Gly
755 760 765
Leu Ala Ser Gly Arg Ile Ile Leu Ile Leu Glu Gly Gly Tyr Asn Leu
770 775 780
Thr Ser Ile Ser Glu Ser Met Ala Ala Cys Thr Arg Ser Leu Leu Gly
785 790 795 800
Asp Pro Pro Pro Leu Leu Thr Leu Pro Arg Pro Pro Leu Ser Gly Ala
805 810 815
Leu Ala Ser Ile Thr Glu Thr Ile Gln Val His Arg Arg Tyr Trp Arg
820 825 830
Ser Leu Arg Val Met Lys Val Glu Asp Arg Glu Gly Pro Ser Ser Ser
835 840 845
Lys Leu Val Thr Lys Lys Ala Pro Gln Pro Ala Lys Pro Arg Leu Ala
850 855 860
Glu Arg Met Thr Thr Arg Glu Lys Lys Val Leu Glu Ala Gly Met Gly
865 870 875 880
Lys Val Thr Ser Ala Ser Phe Gly Glu Glu Ser Thr Pro Gly Gln Thr
885 890 895
Asn Ser Glu Thr Ala Val Val Ala Leu Thr Gln Asp Gln Pro Ser Glu
900 905 910
Ala Ala Thr Gly Gly Ala Thr Leu Ala Gln Thr Ile Ser Glu Ala Ala
915 920 925
Ile Gly Gly Ala Met Leu Gly Gln Thr Thr Ser Glu Glu Ala Val Gly
930 935 940
Gly Ala Thr Pro Asp Gln Thr Thr Ser Glu Glu Thr Val Gly Gly Ala
945 950 955 960
Ile Leu Asp Gln Thr Thr Ser Glu Asp Ala Val Gly Gly Ala Thr Leu
965 970 975
Gly Gln Thr Thr Ser Glu Glu Ala Val Gly Gly Ala Thr Leu Ala Gln
980 985 990
Thr Thr Ser Glu Ala Ala Met Glu Gly Ala Thr Leu Asp Gln Thr Thr
995 1000 1005
Ser Glu Glu Ala Pro Gly Gly Thr Glu Leu Ile Gln Thr Pro Leu
1010 1015 1020
Ala Ser Ser Thr Asp His Gln Thr Pro Pro Thr Ser Pro Val Gln
1025 1030 1035
Gly Thr Thr Pro Gln Ile Ser Pro Ser Thr Leu Ile Gly Ser Leu
1040 1045 1050
Arg Thr Leu Glu Leu Gly Ser Glu Ser Gln Gly Ala Ser Glu Ser
1055 1060 1065
Gln Ala Pro Gly Glu Glu Asn Leu Leu Gly Glu Ala Ala Gly Gly
1070 1075 1080
Gln Asp Met Ala Asp Ser Met Leu Met Gln Gly Ser Arg Gly Leu
1085 1090 1095
Thr Asp Gln Ala Ile Phe Tyr Ala Val Thr Pro Leu Pro Trp Cys
1100 1105 1110
Pro His Leu Val Ala Val Cys Pro Ile Pro Ala Ala Gly Leu Asp
1115 1120 1125
Val Thr Gln Pro Cys Gly Asp Cys Gly Thr Ile Gln Glu Asn Trp
1130 1135 1140
Val Cys Leu Ser Cys Tyr Gln Val Tyr Cys Gly Arg Tyr Ile Asn
1145 1150 1155
Gly His Met Leu Gln His His Gly Asn Ser Gly His Pro Leu Val
1160 1165 1170
Leu Ser Tyr Ile Asp Leu Ser Ala Trp Cys Tyr Tyr Cys Gln Ala
1175 1180 1185
Tyr Val His His Gln Ala Leu Leu Asp Val Lys Asn Ile Ala His
1190 1195 1200
Gln Asn Lys Phe Gly Glu Asp Met Pro His Pro His
1205 1210 1215
<210> 41
<211> 524
<212> PRT
<213> 智人
<400> 41
Met Tyr Ala Leu Phe Leu Leu Ala Ser Leu Leu Gly Ala Ala Leu Ala
1 5 10 15
Gly Pro Val Leu Gly Leu Lys Glu Cys Thr Arg Gly Ser Ala Val Trp
20 25 30
Cys Gln Asn Val Lys Thr Ala Ser Asp Cys Gly Ala Val Lys His Cys
35 40 45
Leu Gln Thr Val Trp Asn Lys Pro Thr Val Lys Ser Leu Pro Cys Asp
50 55 60
Ile Cys Lys Asp Val Val Thr Ala Ala Gly Asp Met Leu Lys Asp Asn
65 70 75 80
Ala Thr Glu Glu Glu Ile Leu Val Tyr Leu Glu Lys Thr Cys Asp Trp
85 90 95
Leu Pro Lys Pro Asn Met Ser Ala Ser Cys Lys Glu Ile Val Asp Ser
100 105 110
Tyr Leu Pro Val Ile Leu Asp Ile Ile Lys Gly Glu Met Ser Arg Pro
115 120 125
Gly Glu Val Cys Ser Ala Leu Asn Leu Cys Glu Ser Leu Gln Lys His
130 135 140
Leu Ala Glu Leu Asn His Gln Lys Gln Leu Glu Ser Asn Lys Ile Pro
145 150 155 160
Glu Leu Asp Met Thr Glu Val Val Ala Pro Phe Met Ala Asn Ile Pro
165 170 175
Leu Leu Leu Tyr Pro Gln Asp Gly Pro Arg Ser Lys Pro Gln Pro Lys
180 185 190
Asp Asn Gly Asp Val Cys Gln Asp Cys Ile Gln Met Val Thr Asp Ile
195 200 205
Gln Thr Ala Val Arg Thr Asn Ser Thr Phe Val Gln Ala Leu Val Glu
210 215 220
His Val Lys Glu Glu Cys Asp Arg Leu Gly Pro Gly Met Ala Asp Ile
225 230 235 240
Cys Lys Asn Tyr Ile Ser Gln Tyr Ser Glu Ile Ala Ile Gln Met Met
245 250 255
Met His Met Gln Pro Lys Glu Ile Cys Ala Leu Val Gly Phe Cys Asp
260 265 270
Glu Val Lys Glu Met Pro Met Gln Thr Leu Val Pro Ala Lys Val Ala
275 280 285
Ser Lys Asn Val Ile Pro Ala Leu Glu Leu Val Glu Pro Ile Lys Lys
290 295 300
His Glu Val Pro Ala Lys Ser Asp Val Tyr Cys Glu Val Cys Glu Phe
305 310 315 320
Leu Val Lys Glu Val Thr Lys Leu Ile Asp Asn Asn Lys Thr Glu Lys
325 330 335
Glu Ile Leu Asp Ala Phe Asp Lys Met Cys Ser Lys Leu Pro Lys Ser
340 345 350
Leu Ser Glu Glu Cys Gln Glu Val Val Asp Thr Tyr Gly Ser Ser Ile
355 360 365
Leu Ser Ile Leu Leu Glu Glu Val Ser Pro Glu Leu Val Cys Ser Met
370 375 380
Leu His Leu Cys Ser Gly Thr Arg Leu Pro Ala Leu Thr Val His Val
385 390 395 400
Thr Gln Pro Lys Asp Gly Gly Phe Cys Glu Val Cys Lys Lys Leu Val
405 410 415
Gly Tyr Leu Asp Arg Asn Leu Glu Lys Asn Ser Thr Lys Gln Glu Ile
420 425 430
Leu Ala Ala Leu Glu Lys Gly Cys Ser Phe Leu Pro Asp Pro Tyr Gln
435 440 445
Lys Gln Cys Asp Gln Phe Val Ala Glu Tyr Glu Pro Val Leu Ile Glu
450 455 460
Ile Leu Val Glu Val Met Asp Pro Ser Phe Val Cys Leu Lys Ile Gly
465 470 475 480
Ala Cys Pro Ser Ala His Lys Pro Leu Leu Gly Thr Glu Lys Cys Ile
485 490 495
Trp Gly Pro Ser Tyr Trp Cys Gln Asn Thr Glu Thr Ala Ala Gln Cys
500 505 510
Asn Ala Val Glu His Cys Lys Arg His Val Trp Asn
515 520
<210> 42
<211> 4548
<212> PRT
<213> 智人
<400> 42
Met Glu His Lys Glu Val Val Leu Leu Leu Leu Leu Phe Leu Lys Ser
1 5 10 15
Ala Ala Pro Glu Gln Ser His Val Val Gln Asp Cys Tyr His Gly Asp
20 25 30
Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr Thr Val Thr Gly Arg Thr
35 40 45
Cys Gln Ala Trp Ser Ser Met Thr Pro His Gln His Asn Arg Thr Thr
50 55 60
Glu Asn Tyr Pro Asn Ala Gly Leu Ile Met Asn Tyr Cys Arg Asn Pro
65 70 75 80
Asp Ala Val Ala Ala Pro Tyr Cys Tyr Thr Arg Asp Pro Gly Val Arg
85 90 95
Trp Glu Tyr Cys Asn Leu Thr Gln Cys Ser Asp Ala Glu Gly Thr Ala
100 105 110
Val Ala Pro Pro Thr Val Thr Pro Val Pro Ser Leu Glu Ala Pro Ser
115 120 125
Glu Gln Ala Pro Thr Glu Gln Arg Pro Gly Val Gln Glu Cys Tyr His
130 135 140
Gly Asn Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr Thr Val Thr Gly
145 150 155 160
Arg Thr Cys Gln Ala Trp Ser Ser Met Thr Pro His Ser His Ser Arg
165 170 175
Thr Pro Glu Tyr Tyr Pro Asn Ala Gly Leu Ile Met Asn Tyr Cys Arg
180 185 190
Asn Pro Asp Ala Val Ala Ala Pro Tyr Cys Tyr Thr Arg Asp Pro Gly
195 200 205
Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln Cys Ser Asp Ala Glu Gly
210 215 220
Thr Ala Val Ala Pro Pro Thr Val Thr Pro Val Pro Ser Leu Glu Ala
225 230 235 240
Pro Ser Glu Gln Ala Pro Thr Glu Gln Arg Pro Gly Val Gln Glu Cys
245 250 255
Tyr His Gly Asn Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr Thr Val
260 265 270
Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser Met Thr Pro His Ser His
275 280 285
Ser Arg Thr Pro Glu Tyr Tyr Pro Asn Ala Gly Leu Ile Met Asn Tyr
290 295 300
Cys Arg Asn Pro Asp Ala Val Ala Ala Pro Tyr Cys Tyr Thr Arg Asp
305 310 315 320
Pro Gly Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln Cys Ser Asp Ala
325 330 335
Glu Gly Thr Ala Val Ala Pro Pro Thr Val Thr Pro Val Pro Ser Leu
340 345 350
Glu Ala Pro Ser Glu Gln Ala Pro Thr Glu Gln Arg Pro Gly Val Gln
355 360 365
Glu Cys Tyr His Gly Asn Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr
370 375 380
Thr Val Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser Met Thr Pro His
385 390 395 400
Ser His Ser Arg Thr Pro Glu Tyr Tyr Pro Asn Ala Gly Leu Ile Met
405 410 415
Asn Tyr Cys Arg Asn Pro Asp Ala Val Ala Ala Pro Tyr Cys Tyr Thr
420 425 430
Arg Asp Pro Gly Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln Cys Ser
435 440 445
Asp Ala Glu Gly Thr Ala Val Ala Pro Pro Thr Val Thr Pro Val Pro
450 455 460
Ser Leu Glu Ala Pro Ser Glu Gln Ala Pro Thr Glu Gln Arg Pro Gly
465 470 475 480
Val Gln Glu Cys Tyr His Gly Asn Gly Gln Ser Tyr Arg Gly Thr Tyr
485 490 495
Ser Thr Thr Val Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser Met Thr
500 505 510
Pro His Ser His Ser Arg Thr Pro Glu Tyr Tyr Pro Asn Ala Gly Leu
515 520 525
Ile Met Asn Tyr Cys Arg Asn Pro Asp Ala Val Ala Ala Pro Tyr Cys
530 535 540
Tyr Thr Arg Asp Pro Gly Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln
545 550 555 560
Cys Ser Asp Ala Glu Gly Thr Ala Val Ala Pro Pro Thr Val Thr Pro
565 570 575
Val Pro Ser Leu Glu Ala Pro Ser Glu Gln Ala Pro Thr Glu Gln Arg
580 585 590
Pro Gly Val Gln Glu Cys Tyr His Gly Asn Gly Gln Ser Tyr Arg Gly
595 600 605
Thr Tyr Ser Thr Thr Val Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser
610 615 620
Met Thr Pro His Ser His Ser Arg Thr Pro Glu Tyr Tyr Pro Asn Ala
625 630 635 640
Gly Leu Ile Met Asn Tyr Cys Arg Asn Pro Asp Ala Val Ala Ala Pro
645 650 655
Tyr Cys Tyr Thr Arg Asp Pro Gly Val Arg Trp Glu Tyr Cys Asn Leu
660 665 670
Thr Gln Cys Ser Asp Ala Glu Gly Thr Ala Val Ala Pro Pro Thr Val
675 680 685
Thr Pro Val Pro Ser Leu Glu Ala Pro Ser Glu Gln Ala Pro Thr Glu
690 695 700
Gln Arg Pro Gly Val Gln Glu Cys Tyr His Gly Asn Gly Gln Ser Tyr
705 710 715 720
Arg Gly Thr Tyr Ser Thr Thr Val Thr Gly Arg Thr Cys Gln Ala Trp
725 730 735
Ser Ser Met Thr Pro His Ser His Ser Arg Thr Pro Glu Tyr Tyr Pro
740 745 750
Asn Ala Gly Leu Ile Met Asn Tyr Cys Arg Asn Pro Asp Ala Val Ala
755 760 765
Ala Pro Tyr Cys Tyr Thr Arg Asp Pro Gly Val Arg Trp Glu Tyr Cys
770 775 780
Asn Leu Thr Gln Cys Ser Asp Ala Glu Gly Thr Ala Val Ala Pro Pro
785 790 795 800
Thr Val Thr Pro Val Pro Ser Leu Glu Ala Pro Ser Glu Gln Ala Pro
805 810 815
Thr Glu Gln Arg Pro Gly Val Gln Glu Cys Tyr His Gly Asn Gly Gln
820 825 830
Ser Tyr Arg Gly Thr Tyr Ser Thr Thr Val Thr Gly Arg Thr Cys Gln
835 840 845
Ala Trp Ser Ser Met Thr Pro His Ser His Ser Arg Thr Pro Glu Tyr
850 855 860
Tyr Pro Asn Ala Gly Leu Ile Met Asn Tyr Cys Arg Asn Pro Asp Ala
865 870 875 880
Val Ala Ala Pro Tyr Cys Tyr Thr Arg Asp Pro Gly Val Arg Trp Glu
885 890 895
Tyr Cys Asn Leu Thr Gln Cys Ser Asp Ala Glu Gly Thr Ala Val Ala
900 905 910
Pro Pro Thr Val Thr Pro Val Pro Ser Leu Glu Ala Pro Ser Glu Gln
915 920 925
Ala Pro Thr Glu Gln Arg Pro Gly Val Gln Glu Cys Tyr His Gly Asn
930 935 940
Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr Thr Val Thr Gly Arg Thr
945 950 955 960
Cys Gln Ala Trp Ser Ser Met Thr Pro His Ser His Ser Arg Thr Pro
965 970 975
Glu Tyr Tyr Pro Asn Ala Gly Leu Ile Met Asn Tyr Cys Arg Asn Pro
980 985 990
Asp Ala Val Ala Ala Pro Tyr Cys Tyr Thr Arg Asp Pro Gly Val Arg
995 1000 1005
Trp Glu Tyr Cys Asn Leu Thr Gln Cys Ser Asp Ala Glu Gly Thr
1010 1015 1020
Ala Val Ala Pro Pro Thr Val Thr Pro Val Pro Ser Leu Glu Ala
1025 1030 1035
Pro Ser Glu Gln Ala Pro Thr Glu Gln Arg Pro Gly Val Gln Glu
1040 1045 1050
Cys Tyr His Gly Asn Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr
1055 1060 1065
Thr Val Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser Met Thr Pro
1070 1075 1080
His Ser His Ser Arg Thr Pro Glu Tyr Tyr Pro Asn Ala Gly Leu
1085 1090 1095
Ile Met Asn Tyr Cys Arg Asn Pro Asp Ala Val Ala Ala Pro Tyr
1100 1105 1110
Cys Tyr Thr Arg Asp Pro Gly Val Arg Trp Glu Tyr Cys Asn Leu
1115 1120 1125
Thr Gln Cys Ser Asp Ala Glu Gly Thr Ala Val Ala Pro Pro Thr
1130 1135 1140
Val Thr Pro Val Pro Ser Leu Glu Ala Pro Ser Glu Gln Ala Pro
1145 1150 1155
Thr Glu Gln Arg Pro Gly Val Gln Glu Cys Tyr His Gly Asn Gly
1160 1165 1170
Gln Ser Tyr Arg Gly Thr Tyr Ser Thr Thr Val Thr Gly Arg Thr
1175 1180 1185
Cys Gln Ala Trp Ser Ser Met Thr Pro His Ser His Ser Arg Thr
1190 1195 1200
Pro Glu Tyr Tyr Pro Asn Ala Gly Leu Ile Met Asn Tyr Cys Arg
1205 1210 1215
Asn Pro Asp Ala Val Ala Ala Pro Tyr Cys Tyr Thr Arg Asp Pro
1220 1225 1230
Gly Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln Cys Ser Asp Ala
1235 1240 1245
Glu Gly Thr Ala Val Ala Pro Pro Thr Val Thr Pro Val Pro Ser
1250 1255 1260
Leu Glu Ala Pro Ser Glu Gln Ala Pro Thr Glu Gln Arg Pro Gly
1265 1270 1275
Val Gln Glu Cys Tyr His Gly Asn Gly Gln Ser Tyr Arg Gly Thr
1280 1285 1290
Tyr Ser Thr Thr Val Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser
1295 1300 1305
Met Thr Pro His Ser His Ser Arg Thr Pro Glu Tyr Tyr Pro Asn
1310 1315 1320
Ala Gly Leu Ile Met Asn Tyr Cys Arg Asn Pro Asp Ala Val Ala
1325 1330 1335
Ala Pro Tyr Cys Tyr Thr Arg Asp Pro Gly Val Arg Trp Glu Tyr
1340 1345 1350
Cys Asn Leu Thr Gln Cys Ser Asp Ala Glu Gly Thr Ala Val Ala
1355 1360 1365
Pro Pro Thr Val Thr Pro Val Pro Ser Leu Glu Ala Pro Ser Glu
1370 1375 1380
Gln Ala Pro Thr Glu Gln Arg Pro Gly Val Gln Glu Cys Tyr His
1385 1390 1395
Gly Asn Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr Thr Val Thr
1400 1405 1410
Gly Arg Thr Cys Gln Ala Trp Ser Ser Met Thr Pro His Ser His
1415 1420 1425
Ser Arg Thr Pro Glu Tyr Tyr Pro Asn Ala Gly Leu Ile Met Asn
1430 1435 1440
Tyr Cys Arg Asn Pro Asp Ala Val Ala Ala Pro Tyr Cys Tyr Thr
1445 1450 1455
Arg Asp Pro Gly Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln Cys
1460 1465 1470
Ser Asp Ala Glu Gly Thr Ala Val Ala Pro Pro Thr Val Thr Pro
1475 1480 1485
Val Pro Ser Leu Glu Ala Pro Ser Glu Gln Ala Pro Thr Glu Gln
1490 1495 1500
Arg Pro Gly Val Gln Glu Cys Tyr His Gly Asn Gly Gln Ser Tyr
1505 1510 1515
Arg Gly Thr Tyr Ser Thr Thr Val Thr Gly Arg Thr Cys Gln Ala
1520 1525 1530
Trp Ser Ser Met Thr Pro His Ser His Ser Arg Thr Pro Glu Tyr
1535 1540 1545
Tyr Pro Asn Ala Gly Leu Ile Met Asn Tyr Cys Arg Asn Pro Asp
1550 1555 1560
Ala Val Ala Ala Pro Tyr Cys Tyr Thr Arg Asp Pro Gly Val Arg
1565 1570 1575
Trp Glu Tyr Cys Asn Leu Thr Gln Cys Ser Asp Ala Glu Gly Thr
1580 1585 1590
Ala Val Ala Pro Pro Thr Val Thr Pro Val Pro Ser Leu Glu Ala
1595 1600 1605
Pro Ser Glu Gln Ala Pro Thr Glu Gln Arg Pro Gly Val Gln Glu
1610 1615 1620
Cys Tyr His Gly Asn Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr
1625 1630 1635
Thr Val Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser Met Thr Pro
1640 1645 1650
His Ser His Ser Arg Thr Pro Glu Tyr Tyr Pro Asn Ala Gly Leu
1655 1660 1665
Ile Met Asn Tyr Cys Arg Asn Pro Asp Ala Val Ala Ala Pro Tyr
1670 1675 1680
Cys Tyr Thr Arg Asp Pro Gly Val Arg Trp Glu Tyr Cys Asn Leu
1685 1690 1695
Thr Gln Cys Ser Asp Ala Glu Gly Thr Ala Val Ala Pro Pro Thr
1700 1705 1710
Val Thr Pro Val Pro Ser Leu Glu Ala Pro Ser Glu Gln Ala Pro
1715 1720 1725
Thr Glu Gln Arg Pro Gly Val Gln Glu Cys Tyr His Gly Asn Gly
1730 1735 1740
Gln Ser Tyr Arg Gly Thr Tyr Ser Thr Thr Val Thr Gly Arg Thr
1745 1750 1755
Cys Gln Ala Trp Ser Ser Met Thr Pro His Ser His Ser Arg Thr
1760 1765 1770
Pro Glu Tyr Tyr Pro Asn Ala Gly Leu Ile Met Asn Tyr Cys Arg
1775 1780 1785
Asn Pro Asp Ala Val Ala Ala Pro Tyr Cys Tyr Thr Arg Asp Pro
1790 1795 1800
Gly Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln Cys Ser Asp Ala
1805 1810 1815
Glu Gly Thr Ala Val Ala Pro Pro Thr Val Thr Pro Val Pro Ser
1820 1825 1830
Leu Glu Ala Pro Ser Glu Gln Ala Pro Thr Glu Gln Arg Pro Gly
1835 1840 1845
Val Gln Glu Cys Tyr His Gly Asn Gly Gln Ser Tyr Arg Gly Thr
1850 1855 1860
Tyr Ser Thr Thr Val Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser
1865 1870 1875
Met Thr Pro His Ser His Ser Arg Thr Pro Glu Tyr Tyr Pro Asn
1880 1885 1890
Ala Gly Leu Ile Met Asn Tyr Cys Arg Asn Pro Asp Ala Val Ala
1895 1900 1905
Ala Pro Tyr Cys Tyr Thr Arg Asp Pro Gly Val Arg Trp Glu Tyr
1910 1915 1920
Cys Asn Leu Thr Gln Cys Ser Asp Ala Glu Gly Thr Ala Val Ala
1925 1930 1935
Pro Pro Thr Val Thr Pro Val Pro Ser Leu Glu Ala Pro Ser Glu
1940 1945 1950
Gln Ala Pro Thr Glu Gln Arg Pro Gly Val Gln Glu Cys Tyr His
1955 1960 1965
Gly Asn Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr Thr Val Thr
1970 1975 1980
Gly Arg Thr Cys Gln Ala Trp Ser Ser Met Thr Pro His Ser His
1985 1990 1995
Ser Arg Thr Pro Glu Tyr Tyr Pro Asn Ala Gly Leu Ile Met Asn
2000 2005 2010
Tyr Cys Arg Asn Pro Asp Ala Val Ala Ala Pro Tyr Cys Tyr Thr
2015 2020 2025
Arg Asp Pro Gly Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln Cys
2030 2035 2040
Ser Asp Ala Glu Gly Thr Ala Val Ala Pro Pro Thr Val Thr Pro
2045 2050 2055
Val Pro Ser Leu Glu Ala Pro Ser Glu Gln Ala Pro Thr Glu Gln
2060 2065 2070
Arg Pro Gly Val Gln Glu Cys Tyr His Gly Asn Gly Gln Ser Tyr
2075 2080 2085
Arg Gly Thr Tyr Ser Thr Thr Val Thr Gly Arg Thr Cys Gln Ala
2090 2095 2100
Trp Ser Ser Met Thr Pro His Ser His Ser Arg Thr Pro Glu Tyr
2105 2110 2115
Tyr Pro Asn Ala Gly Leu Ile Met Asn Tyr Cys Arg Asn Pro Asp
2120 2125 2130
Ala Val Ala Ala Pro Tyr Cys Tyr Thr Arg Asp Pro Gly Val Arg
2135 2140 2145
Trp Glu Tyr Cys Asn Leu Thr Gln Cys Ser Asp Ala Glu Gly Thr
2150 2155 2160
Ala Val Ala Pro Pro Thr Val Thr Pro Val Pro Ser Leu Glu Ala
2165 2170 2175
Pro Ser Glu Gln Ala Pro Thr Glu Gln Arg Pro Gly Val Gln Glu
2180 2185 2190
Cys Tyr His Gly Asn Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr
2195 2200 2205
Thr Val Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser Met Thr Pro
2210 2215 2220
His Ser His Ser Arg Thr Pro Glu Tyr Tyr Pro Asn Ala Gly Leu
2225 2230 2235
Ile Met Asn Tyr Cys Arg Asn Pro Asp Ala Val Ala Ala Pro Tyr
2240 2245 2250
Cys Tyr Thr Arg Asp Pro Gly Val Arg Trp Glu Tyr Cys Asn Leu
2255 2260 2265
Thr Gln Cys Ser Asp Ala Glu Gly Thr Ala Val Ala Pro Pro Thr
2270 2275 2280
Val Thr Pro Val Pro Ser Leu Glu Ala Pro Ser Glu Gln Ala Pro
2285 2290 2295
Thr Glu Gln Arg Pro Gly Val Gln Glu Cys Tyr His Gly Asn Gly
2300 2305 2310
Gln Ser Tyr Arg Gly Thr Tyr Ser Thr Thr Val Thr Gly Arg Thr
2315 2320 2325
Cys Gln Ala Trp Ser Ser Met Thr Pro His Ser His Ser Arg Thr
2330 2335 2340
Pro Glu Tyr Tyr Pro Asn Ala Gly Leu Ile Met Asn Tyr Cys Arg
2345 2350 2355
Asn Pro Asp Ala Val Ala Ala Pro Tyr Cys Tyr Thr Arg Asp Pro
2360 2365 2370
Gly Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln Cys Ser Asp Ala
2375 2380 2385
Glu Gly Thr Ala Val Ala Pro Pro Thr Val Thr Pro Val Pro Ser
2390 2395 2400
Leu Glu Ala Pro Ser Glu Gln Ala Pro Thr Glu Gln Arg Pro Gly
2405 2410 2415
Val Gln Glu Cys Tyr His Gly Asn Gly Gln Ser Tyr Arg Gly Thr
2420 2425 2430
Tyr Ser Thr Thr Val Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser
2435 2440 2445
Met Thr Pro His Ser His Ser Arg Thr Pro Glu Tyr Tyr Pro Asn
2450 2455 2460
Ala Gly Leu Ile Met Asn Tyr Cys Arg Asn Pro Asp Ala Val Ala
2465 2470 2475
Ala Pro Tyr Cys Tyr Thr Arg Asp Pro Gly Val Arg Trp Glu Tyr
2480 2485 2490
Cys Asn Leu Thr Gln Cys Ser Asp Ala Glu Gly Thr Ala Val Ala
2495 2500 2505
Pro Pro Thr Val Thr Pro Val Pro Ser Leu Glu Ala Pro Ser Glu
2510 2515 2520
Gln Ala Pro Thr Glu Gln Arg Pro Gly Val Gln Glu Cys Tyr His
2525 2530 2535
Gly Asn Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr Thr Val Thr
2540 2545 2550
Gly Arg Thr Cys Gln Ala Trp Ser Ser Met Thr Pro His Ser His
2555 2560 2565
Ser Arg Thr Pro Glu Tyr Tyr Pro Asn Ala Gly Leu Ile Met Asn
2570 2575 2580
Tyr Cys Arg Asn Pro Asp Ala Val Ala Ala Pro Tyr Cys Tyr Thr
2585 2590 2595
Arg Asp Pro Gly Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln Cys
2600 2605 2610
Ser Asp Ala Glu Gly Thr Ala Val Ala Pro Pro Thr Val Thr Pro
2615 2620 2625
Val Pro Ser Leu Glu Ala Pro Ser Glu Gln Ala Pro Thr Glu Gln
2630 2635 2640
Arg Pro Gly Val Gln Glu Cys Tyr His Gly Asn Gly Gln Ser Tyr
2645 2650 2655
Arg Gly Thr Tyr Ser Thr Thr Val Thr Gly Arg Thr Cys Gln Ala
2660 2665 2670
Trp Ser Ser Met Thr Pro His Ser His Ser Arg Thr Pro Glu Tyr
2675 2680 2685
Tyr Pro Asn Ala Gly Leu Ile Met Asn Tyr Cys Arg Asn Pro Asp
2690 2695 2700
Ala Val Ala Ala Pro Tyr Cys Tyr Thr Arg Asp Pro Gly Val Arg
2705 2710 2715
Trp Glu Tyr Cys Asn Leu Thr Gln Cys Ser Asp Ala Glu Gly Thr
2720 2725 2730
Ala Val Ala Pro Pro Thr Val Thr Pro Val Pro Ser Leu Glu Ala
2735 2740 2745
Pro Ser Glu Gln Ala Pro Thr Glu Gln Arg Pro Gly Val Gln Glu
2750 2755 2760
Cys Tyr His Gly Asn Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr
2765 2770 2775
Thr Val Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser Met Thr Pro
2780 2785 2790
His Ser His Ser Arg Thr Pro Glu Tyr Tyr Pro Asn Ala Gly Leu
2795 2800 2805
Ile Met Asn Tyr Cys Arg Asn Pro Asp Ala Val Ala Ala Pro Tyr
2810 2815 2820
Cys Tyr Thr Arg Asp Pro Gly Val Arg Trp Glu Tyr Cys Asn Leu
2825 2830 2835
Thr Gln Cys Ser Asp Ala Glu Gly Thr Ala Val Ala Pro Pro Thr
2840 2845 2850
Val Thr Pro Val Pro Ser Leu Glu Ala Pro Ser Glu Gln Ala Pro
2855 2860 2865
Thr Glu Gln Arg Pro Gly Val Gln Glu Cys Tyr His Gly Asn Gly
2870 2875 2880
Gln Ser Tyr Arg Gly Thr Tyr Ser Thr Thr Val Thr Gly Arg Thr
2885 2890 2895
Cys Gln Ala Trp Ser Ser Met Thr Pro His Ser His Ser Arg Thr
2900 2905 2910
Pro Glu Tyr Tyr Pro Asn Ala Gly Leu Ile Met Asn Tyr Cys Arg
2915 2920 2925
Asn Pro Asp Ala Val Ala Ala Pro Tyr Cys Tyr Thr Arg Asp Pro
2930 2935 2940
Gly Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln Cys Ser Asp Ala
2945 2950 2955
Glu Gly Thr Ala Val Ala Pro Pro Thr Val Thr Pro Val Pro Ser
2960 2965 2970
Leu Glu Ala Pro Ser Glu Gln Ala Pro Thr Glu Gln Arg Pro Gly
2975 2980 2985
Val Gln Glu Cys Tyr His Gly Asn Gly Gln Ser Tyr Arg Gly Thr
2990 2995 3000
Tyr Ser Thr Thr Val Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser
3005 3010 3015
Met Thr Pro His Ser His Ser Arg Thr Pro Glu Tyr Tyr Pro Asn
3020 3025 3030
Ala Gly Leu Ile Met Asn Tyr Cys Arg Asn Pro Asp Ala Val Ala
3035 3040 3045
Ala Pro Tyr Cys Tyr Thr Arg Asp Pro Gly Val Arg Trp Glu Tyr
3050 3055 3060
Cys Asn Leu Thr Gln Cys Ser Asp Ala Glu Gly Thr Ala Val Ala
3065 3070 3075
Pro Pro Thr Val Thr Pro Val Pro Ser Leu Glu Ala Pro Ser Glu
3080 3085 3090
Gln Ala Pro Thr Glu Gln Arg Pro Gly Val Gln Glu Cys Tyr His
3095 3100 3105
Gly Asn Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr Thr Val Thr
3110 3115 3120
Gly Arg Thr Cys Gln Ala Trp Ser Ser Met Thr Pro His Ser His
3125 3130 3135
Ser Arg Thr Pro Glu Tyr Tyr Pro Asn Ala Gly Leu Ile Met Asn
3140 3145 3150
Tyr Cys Arg Asn Pro Asp Ala Val Ala Ala Pro Tyr Cys Tyr Thr
3155 3160 3165
Arg Asp Pro Gly Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln Cys
3170 3175 3180
Ser Asp Ala Glu Gly Thr Ala Val Ala Pro Pro Thr Val Thr Pro
3185 3190 3195
Val Pro Ser Leu Glu Ala Pro Ser Glu Gln Ala Pro Thr Glu Gln
3200 3205 3210
Arg Pro Gly Val Gln Glu Cys Tyr His Gly Asn Gly Gln Ser Tyr
3215 3220 3225
Arg Gly Thr Tyr Ser Thr Thr Val Thr Gly Arg Thr Cys Gln Ala
3230 3235 3240
Trp Ser Ser Met Thr Pro His Ser His Ser Arg Thr Pro Glu Tyr
3245 3250 3255
Tyr Pro Asn Ala Gly Leu Ile Met Asn Tyr Cys Arg Asn Pro Asp
3260 3265 3270
Ala Val Ala Ala Pro Tyr Cys Tyr Thr Arg Asp Pro Gly Val Arg
3275 3280 3285
Trp Glu Tyr Cys Asn Leu Thr Gln Cys Ser Asp Ala Glu Gly Thr
3290 3295 3300
Ala Val Ala Pro Pro Thr Val Thr Pro Val Pro Ser Leu Glu Ala
3305 3310 3315
Pro Ser Glu Gln Ala Pro Thr Glu Gln Arg Pro Gly Val Gln Glu
3320 3325 3330
Cys Tyr His Gly Asn Gly Gln Ser Tyr Arg Gly Thr Tyr Ser Thr
3335 3340 3345
Thr Val Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser Met Thr Pro
3350 3355 3360
His Ser His Ser Arg Thr Pro Glu Tyr Tyr Pro Asn Ala Gly Leu
3365 3370 3375
Ile Met Asn Tyr Cys Arg Asn Pro Asp Pro Val Ala Ala Pro Tyr
3380 3385 3390
Cys Tyr Thr Arg Asp Pro Ser Val Arg Trp Glu Tyr Cys Asn Leu
3395 3400 3405
Thr Gln Cys Ser Asp Ala Glu Gly Thr Ala Val Ala Pro Pro Thr
3410 3415 3420
Ile Thr Pro Ile Pro Ser Leu Glu Ala Pro Ser Glu Gln Ala Pro
3425 3430 3435
Thr Glu Gln Arg Pro Gly Val Gln Glu Cys Tyr His Gly Asn Gly
3440 3445 3450
Gln Ser Tyr Gln Gly Thr Tyr Phe Ile Thr Val Thr Gly Arg Thr
3455 3460 3465
Cys Gln Ala Trp Ser Ser Met Thr Pro His Ser His Ser Arg Thr
3470 3475 3480
Pro Ala Tyr Tyr Pro Asn Ala Gly Leu Ile Lys Asn Tyr Cys Arg
3485 3490 3495
Asn Pro Asp Pro Val Ala Ala Pro Trp Cys Tyr Thr Thr Asp Pro
3500 3505 3510
Ser Val Arg Trp Glu Tyr Cys Asn Leu Thr Arg Cys Ser Asp Ala
3515 3520 3525
Glu Trp Thr Ala Phe Val Pro Pro Asn Val Ile Leu Ala Pro Ser
3530 3535 3540
Leu Glu Ala Phe Phe Glu Gln Ala Leu Thr Glu Glu Thr Pro Gly
3545 3550 3555
Val Gln Asp Cys Tyr Tyr His Tyr Gly Gln Ser Tyr Arg Gly Thr
3560 3565 3570
Tyr Ser Thr Thr Val Thr Gly Arg Thr Cys Gln Ala Trp Ser Ser
3575 3580 3585
Met Thr Pro His Gln His Ser Arg Thr Pro Glu Asn Tyr Pro Asn
3590 3595 3600
Ala Gly Leu Thr Arg Asn Tyr Cys Arg Asn Pro Asp Ala Glu Ile
3605 3610 3615
Arg Pro Trp Cys Tyr Thr Met Asp Pro Ser Val Arg Trp Glu Tyr
3620 3625 3630
Cys Asn Leu Thr Gln Cys Leu Val Thr Glu Ser Ser Val Leu Ala
3635 3640 3645
Thr Leu Thr Val Val Pro Asp Pro Ser Thr Glu Ala Ser Ser Glu
3650 3655 3660
Glu Ala Pro Thr Glu Gln Ser Pro Gly Val Gln Asp Cys Tyr His
3665 3670 3675
Gly Asp Gly Gln Ser Tyr Arg Gly Ser Phe Ser Thr Thr Val Thr
3680 3685 3690
Gly Arg Thr Cys Gln Ser Trp Ser Ser Met Thr Pro His Trp His
3695 3700 3705
Gln Arg Thr Thr Glu Tyr Tyr Pro Asn Gly Gly Leu Thr Arg Asn
3710 3715 3720
Tyr Cys Arg Asn Pro Asp Ala Glu Ile Ser Pro Trp Cys Tyr Thr
3725 3730 3735
Met Asp Pro Asn Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln Cys
3740 3745 3750
Pro Val Thr Glu Ser Ser Val Leu Ala Thr Ser Thr Ala Val Ser
3755 3760 3765
Glu Gln Ala Pro Thr Glu Gln Ser Pro Thr Val Gln Asp Cys Tyr
3770 3775 3780
His Gly Asp Gly Gln Ser Tyr Arg Gly Ser Phe Ser Thr Thr Val
3785 3790 3795
Thr Gly Arg Thr Cys Gln Ser Trp Ser Ser Met Thr Pro His Trp
3800 3805 3810
His Gln Arg Thr Thr Glu Tyr Tyr Pro Asn Gly Gly Leu Thr Arg
3815 3820 3825
Asn Tyr Cys Arg Asn Pro Asp Ala Glu Ile Arg Pro Trp Cys Tyr
3830 3835 3840
Thr Met Asp Pro Ser Val Arg Trp Glu Tyr Cys Asn Leu Thr Gln
3845 3850 3855
Cys Pro Val Met Glu Ser Thr Leu Leu Thr Thr Pro Thr Val Val
3860 3865 3870
Pro Val Pro Ser Thr Glu Leu Pro Ser Glu Glu Ala Pro Thr Glu
3875 3880 3885
Asn Ser Thr Gly Val Gln Asp Cys Tyr Arg Gly Asp Gly Gln Ser
3890 3895 3900
Tyr Arg Gly Thr Leu Ser Thr Thr Ile Thr Gly Arg Thr Cys Gln
3905 3910 3915
Ser Trp Ser Ser Met Thr Pro His Trp His Arg Arg Ile Pro Leu
3920 3925 3930
Tyr Tyr Pro Asn Ala Gly Leu Thr Arg Asn Tyr Cys Arg Asn Pro
3935 3940 3945
Asp Ala Glu Ile Arg Pro Trp Cys Tyr Thr Met Asp Pro Ser Val
3950 3955 3960
Arg Trp Glu Tyr Cys Asn Leu Thr Arg Cys Pro Val Thr Glu Ser
3965 3970 3975
Ser Val Leu Thr Thr Pro Thr Val Ala Pro Val Pro Ser Thr Glu
3980 3985 3990
Ala Pro Ser Glu Gln Ala Pro Pro Glu Lys Ser Pro Val Val Gln
3995 4000 4005
Asp Cys Tyr His Gly Asp Gly Arg Ser Tyr Arg Gly Ile Ser Ser
4010 4015 4020
Thr Thr Val Thr Gly Arg Thr Cys Gln Ser Trp Ser Ser Met Ile
4025 4030 4035
Pro His Trp His Gln Arg Thr Pro Glu Asn Tyr Pro Asn Ala Gly
4040 4045 4050
Leu Thr Glu Asn Tyr Cys Arg Asn Pro Asp Ser Gly Lys Gln Pro
4055 4060 4065
Trp Cys Tyr Thr Thr Asp Pro Cys Val Arg Trp Glu Tyr Cys Asn
4070 4075 4080
Leu Thr Gln Cys Ser Glu Thr Glu Ser Gly Val Leu Glu Thr Pro
4085 4090 4095
Thr Val Val Pro Val Pro Ser Met Glu Ala His Ser Glu Ala Ala
4100 4105 4110
Pro Thr Glu Gln Thr Pro Val Val Arg Gln Cys Tyr His Gly Asn
4115 4120 4125
Gly Gln Ser Tyr Arg Gly Thr Phe Ser Thr Thr Val Thr Gly Arg
4130 4135 4140
Thr Cys Gln Ser Trp Ser Ser Met Thr Pro His Arg His Gln Arg
4145 4150 4155
Thr Pro Glu Asn Tyr Pro Asn Asp Gly Leu Thr Met Asn Tyr Cys
4160 4165 4170
Arg Asn Pro Asp Ala Asp Thr Gly Pro Trp Cys Phe Thr Met Asp
4175 4180 4185
Pro Ser Ile Arg Trp Glu Tyr Cys Asn Leu Thr Arg Cys Ser Asp
4190 4195 4200
Thr Glu Gly Thr Val Val Ala Pro Pro Thr Val Ile Gln Val Pro
4205 4210 4215
Ser Leu Gly Pro Pro Ser Glu Gln Asp Cys Met Phe Gly Asn Gly
4220 4225 4230
Lys Gly Tyr Arg Gly Lys Lys Ala Thr Thr Val Thr Gly Thr Pro
4235 4240 4245
Cys Gln Glu Trp Ala Ala Gln Glu Pro His Arg His Ser Thr Phe
4250 4255 4260
Ile Pro Gly Thr Asn Lys Trp Ala Gly Leu Glu Lys Asn Tyr Cys
4265 4270 4275
Arg Asn Pro Asp Gly Asp Ile Asn Gly Pro Trp Cys Tyr Thr Met
4280 4285 4290
Asn Pro Arg Lys Leu Phe Asp Tyr Cys Asp Ile Pro Leu Cys Ala
4295 4300 4305
Ser Ser Ser Phe Asp Cys Gly Lys Pro Gln Val Glu Pro Lys Lys
4310 4315 4320
Cys Pro Gly Ser Ile Val Gly Gly Cys Val Ala His Pro His Ser
4325 4330 4335
Trp Pro Trp Gln Val Ser Leu Arg Thr Arg Phe Gly Lys His Phe
4340 4345 4350
Cys Gly Gly Thr Leu Ile Ser Pro Glu Trp Val Leu Thr Ala Ala
4355 4360 4365
His Cys Leu Lys Lys Ser Ser Arg Pro Ser Ser Tyr Lys Val Ile
4370 4375 4380
Leu Gly Ala His Gln Glu Val Asn Leu Glu Ser His Val Gln Glu
4385 4390 4395
Ile Glu Val Ser Arg Leu Phe Leu Glu Pro Thr Gln Ala Asp Ile
4400 4405 4410
Ala Leu Leu Lys Leu Ser Arg Pro Ala Val Ile Thr Asp Lys Val
4415 4420 4425
Met Pro Ala Cys Leu Pro Ser Pro Asp Tyr Met Val Thr Ala Arg
4430 4435 4440
Thr Glu Cys Tyr Ile Thr Gly Trp Gly Glu Thr Gln Gly Thr Phe
4445 4450 4455
Gly Thr Gly Leu Leu Lys Glu Ala Gln Leu Leu Val Ile Glu Asn
4460 4465 4470
Glu Val Cys Asn His Tyr Lys Tyr Ile Cys Ala Glu His Leu Ala
4475 4480 4485
Arg Gly Thr Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val
4490 4495 4500
Cys Phe Glu Lys Asp Lys Tyr Ile Leu Gln Gly Val Thr Ser Trp
4505 4510 4515
Gly Leu Gly Cys Ala Arg Pro Asn Lys Pro Gly Val Tyr Ala Arg
4520 4525 4530
Val Ser Arg Phe Val Thr Trp Ile Glu Gly Met Met Arg Asn Asn
4535 4540 4545
<210> 43
<211> 184
<212> PRT
<213> 智人
<400> 43
Met Ala Glu Pro Gln Pro Pro Ser Gly Gly Leu Thr Asp Glu Ala Ala
1 5 10 15
Leu Ser Cys Cys Ser Asp Ala Asp Pro Ser Thr Lys Asp Phe Leu Leu
20 25 30
Gln Gln Thr Met Leu Arg Val Lys Asp Pro Lys Lys Ser Leu Asp Phe
35 40 45
Tyr Thr Arg Val Leu Gly Met Thr Leu Ile Gln Lys Cys Asp Phe Pro
50 55 60
Ile Met Lys Phe Ser Leu Tyr Phe Leu Ala Tyr Glu Asp Lys Asn Asp
65 70 75 80
Ile Pro Lys Glu Lys Asp Glu Lys Ile Ala Trp Ala Leu Ser Arg Lys
85 90 95
Ala Thr Leu Glu Leu Thr His Asn Trp Gly Thr Glu Asp Asp Glu Thr
100 105 110
Gln Ser Tyr His Asn Gly Asn Ser Asp Pro Arg Gly Phe Gly His Ile
115 120 125
Gly Ile Ala Val Pro Asp Val Tyr Ser Ala Cys Lys Arg Phe Glu Glu
130 135 140
Leu Gly Val Lys Phe Val Lys Lys Pro Asp Asp Gly Lys Met Lys Gly
145 150 155 160
Leu Ala Phe Ile Gln Asp Pro Asp Gly Tyr Trp Ile Glu Ile Leu Asn
165 170 175
Pro Asn Lys Met Ala Thr Leu Met
180
<210> 44
<211> 1824
<212> PRT
<213> 智人
<400> 44
Met Ser Ala Gly Gly Arg Asp Glu Glu Arg Arg Lys Leu Ala Asp Ile
1 5 10 15
Ile His His Trp Asn Ala Asn Arg Leu Asp Leu Phe Glu Ile Ser Gln
20 25 30
Pro Thr Glu Asp Leu Glu Phe His Gly Val Met Arg Phe Tyr Phe Gln
35 40 45
Asp Lys Ala Ala Gly Asn Phe Ala Thr Lys Cys Ile Arg Val Ser Ser
50 55 60
Thr Ala Thr Thr Gln Asp Val Ile Glu Thr Leu Ala Glu Lys Phe Arg
65 70 75 80
Pro Asp Met Arg Met Leu Ser Ser Pro Lys Tyr Ser Leu Tyr Glu Val
85 90 95
His Val Ser Gly Glu Arg Arg Leu Asp Ile Asp Glu Lys Pro Leu Val
100 105 110
Val Gln Leu Asn Trp Asn Lys Asp Asp Arg Glu Gly Arg Phe Val Leu
115 120 125
Lys Asn Glu Asn Asp Ala Ile Pro Pro Lys Lys Ala Gln Ser Asn Gly
130 135 140
Pro Glu Lys Gln Glu Lys Glu Gly Val Ile Gln Asn Phe Lys Arg Thr
145 150 155 160
Leu Ser Lys Lys Glu Lys Lys Glu Lys Lys Lys Arg Glu Lys Glu Ala
165 170 175
Leu Arg Gln Ala Ser Asp Lys Asp Asp Arg Pro Phe Gln Gly Glu Asp
180 185 190
Val Glu Asn Ser Arg Leu Ala Ala Glu Val Tyr Lys Asp Met Pro Glu
195 200 205
Thr Ser Phe Thr Arg Thr Ile Ser Asn Pro Glu Val Val Met Lys Arg
210 215 220
Arg Arg Gln Gln Lys Leu Glu Lys Arg Met Gln Glu Phe Arg Ser Ser
225 230 235 240
Asp Gly Arg Pro Asp Ser Gly Gly Thr Leu Arg Ile Tyr Ala Asp Ser
245 250 255
Leu Lys Pro Asn Ile Pro Tyr Lys Thr Ile Leu Leu Ser Thr Thr Asp
260 265 270
Pro Ala Asp Phe Ala Val Ala Glu Ala Leu Glu Lys Tyr Gly Leu Glu
275 280 285
Lys Glu Asn Pro Lys Asp Tyr Cys Ile Ala Arg Val Met Leu Pro Pro
290 295 300
Gly Ala Gln His Ser Asp Glu Lys Gly Ala Lys Glu Ile Ile Leu Asp
305 310 315 320
Asp Asp Glu Cys Pro Leu Gln Ile Phe Arg Glu Trp Pro Ser Asp Lys
325 330 335
Gly Ile Leu Val Phe Gln Leu Lys Arg Arg Pro Pro Asp His Ile Pro
340 345 350
Lys Lys Thr Lys Lys His Leu Glu Gly Lys Thr Pro Lys Gly Lys Glu
355 360 365
Arg Ala Asp Gly Ser Gly Tyr Gly Ser Thr Leu Pro Pro Glu Lys Leu
370 375 380
Pro Tyr Leu Val Glu Leu Ser Pro Gly Arg Arg Asn His Phe Ala Tyr
385 390 395 400
Tyr Asn Tyr His Thr Tyr Glu Asp Gly Ser Asp Ser Arg Asp Lys Pro
405 410 415
Lys Leu Tyr Arg Leu Gln Leu Ser Val Thr Glu Val Gly Thr Glu Lys
420 425 430
Leu Asp Asp Asn Ser Ile Gln Leu Phe Gly Pro Gly Ile Gln Pro His
435 440 445
His Cys Asp Leu Thr Asn Met Asp Gly Val Val Thr Val Thr Pro Arg
450 455 460
Ser Met Asp Ala Glu Thr Tyr Val Glu Gly Gln Arg Ile Ser Glu Thr
465 470 475 480
Thr Met Leu Gln Ser Gly Met Lys Val Gln Phe Gly Ala Ser His Val
485 490 495
Phe Lys Phe Val Asp Pro Ser Gln Asp His Ala Leu Ala Lys Arg Ser
500 505 510
Val Asp Gly Gly Leu Met Val Lys Gly Pro Arg His Lys Pro Gly Ile
515 520 525
Val Gln Glu Thr Thr Phe Asp Leu Gly Gly Asp Ile His Ser Gly Thr
530 535 540
Ala Leu Pro Thr Ser Lys Ser Thr Thr Arg Leu Asp Ser Asp Arg Val
545 550 555 560
Ser Ser Ala Ser Ser Thr Ala Glu Arg Gly Met Val Lys Pro Met Ile
565 570 575
Arg Val Glu Gln Gln Pro Asp Tyr Arg Arg Gln Glu Ser Arg Thr Gln
580 585 590
Asp Ala Ser Gly Pro Glu Leu Ile Leu Pro Ala Ser Ile Glu Phe Arg
595 600 605
Glu Ser Ser Glu Asp Ser Phe Leu Ser Ala Ile Ile Asn Tyr Thr Asn
610 615 620
Ser Ser Thr Val His Phe Lys Leu Ser Pro Thr Tyr Val Leu Tyr Met
625 630 635 640
Ala Cys Arg Tyr Val Leu Ser Asn Gln Tyr Arg Pro Asp Ile Ser Pro
645 650 655
Thr Glu Arg Thr His Lys Val Ile Ala Val Val Asn Lys Met Val Ser
660 665 670
Met Met Glu Gly Val Ile Gln Lys Gln Lys Asn Ile Ala Gly Ala Leu
675 680 685
Ala Phe Trp Met Ala Asn Ala Ser Glu Leu Leu Asn Phe Ile Lys Gln
690 695 700
Asp Arg Asp Leu Ser Arg Ile Thr Leu Asp Ala Gln Asp Val Leu Ala
705 710 715 720
His Leu Val Gln Met Ala Phe Lys Tyr Leu Val His Cys Leu Gln Ser
725 730 735
Glu Leu Asn Asn Tyr Met Pro Ala Phe Leu Asp Asp Pro Glu Glu Asn
740 745 750
Ser Leu Gln Arg Pro Lys Ile Asp Asp Val Leu His Thr Leu Thr Gly
755 760 765
Ala Met Ser Leu Leu Arg Arg Cys Arg Val Asn Ala Ala Leu Thr Ile
770 775 780
Gln Leu Phe Ser Gln Leu Phe His Phe Ile Asn Met Trp Leu Phe Asn
785 790 795 800
Arg Leu Val Thr Asp Pro Asp Ser Gly Leu Cys Ser His Tyr Trp Gly
805 810 815
Ala Ile Ile Arg Gln Gln Leu Gly His Ile Glu Ala Trp Ala Glu Lys
820 825 830
Gln Gly Leu Glu Leu Ala Ala Asp Cys His Leu Ser Arg Ile Val Gln
835 840 845
Ala Thr Thr Leu Leu Thr Met Asp Lys Tyr Ala Pro Asp Asp Ile Pro
850 855 860
Asn Ile Asn Ser Thr Cys Phe Lys Leu Asn Ser Leu Gln Leu Gln Ala
865 870 875 880
Leu Leu Gln Asn Tyr His Cys Ala Pro Asp Glu Pro Phe Ile Pro Thr
885 890 895
Asp Leu Ile Glu Asn Val Val Thr Val Ala Glu Asn Thr Ala Asp Glu
900 905 910
Leu Ala Arg Ser Asp Gly Arg Glu Val Gln Leu Glu Glu Asp Pro Asp
915 920 925
Leu Gln Leu Pro Phe Leu Leu Pro Glu Asp Gly Tyr Ser Cys Asp Val
930 935 940
Val Arg Asn Ile Pro Asn Gly Leu Gln Glu Phe Leu Asp Pro Leu Cys
945 950 955 960
Gln Arg Gly Phe Cys Arg Leu Ile Pro His Thr Arg Ser Pro Gly Thr
965 970 975
Trp Thr Ile Tyr Phe Glu Gly Ala Asp Tyr Glu Ser His Leu Leu Arg
980 985 990
Glu Asn Thr Glu Leu Ala Gln Pro Leu Arg Lys Glu Pro Glu Ile Ile
995 1000 1005
Thr Val Thr Leu Lys Lys Gln Asn Gly Met Gly Leu Ser Ile Val
1010 1015 1020
Ala Ala Lys Gly Ala Gly Gln Asp Lys Leu Gly Ile Tyr Val Lys
1025 1030 1035
Ser Val Val Lys Gly Gly Ala Ala Asp Val Asp Gly Arg Leu Ala
1040 1045 1050
Ala Gly Asp Gln Leu Leu Ser Val Asp Gly Arg Ser Leu Val Gly
1055 1060 1065
Leu Ser Gln Glu Arg Ala Ala Glu Leu Met Thr Arg Thr Ser Ser
1070 1075 1080
Val Val Thr Leu Glu Val Ala Lys Gln Gly Ala Ile Tyr His Gly
1085 1090 1095
Leu Ala Thr Leu Leu Asn Gln Pro Ser Pro Met Met Gln Arg Ile
1100 1105 1110
Ser Asp Arg Arg Gly Ser Gly Lys Pro Arg Pro Lys Ser Glu Gly
1115 1120 1125
Phe Glu Leu Tyr Asn Asn Ser Thr Gln Asn Gly Ser Pro Glu Ser
1130 1135 1140
Pro Gln Leu Pro Trp Ala Glu Tyr Ser Glu Pro Lys Lys Leu Pro
1145 1150 1155
Gly Asp Asp Arg Leu Met Lys Asn Arg Ala Asp His Arg Ser Ser
1160 1165 1170
Pro Asn Val Ala Asn Gln Pro Pro Ser Pro Gly Gly Lys Ser Ala
1175 1180 1185
Tyr Ala Ser Gly Thr Thr Ala Lys Ile Thr Ser Val Ser Thr Gly
1190 1195 1200
Asn Leu Cys Thr Glu Glu Gln Thr Pro Pro Pro Arg Pro Glu Ala
1205 1210 1215
Tyr Pro Ile Pro Thr Gln Thr Tyr Thr Arg Glu Tyr Phe Thr Phe
1220 1225 1230
Pro Ala Ser Lys Ser Gln Asp Arg Met Ala Pro Pro Gln Asn Gln
1235 1240 1245
Trp Pro Asn Tyr Glu Glu Lys Pro His Met His Thr Asp Ser Asn
1250 1255 1260
His Ser Ser Ile Ala Ile Gln Arg Val Thr Arg Ser Gln Glu Glu
1265 1270 1275
Leu Arg Glu Asp Lys Ala Tyr Gln Leu Glu Arg His Arg Ile Glu
1280 1285 1290
Ala Ala Met Asp Arg Lys Ser Asp Ser Asp Met Trp Ile Asn Gln
1295 1300 1305
Ser Ser Ser Leu Asp Ser Ser Thr Ser Ser Gln Glu His Leu Asn
1310 1315 1320
His Ser Ser Lys Ser Val Thr Pro Ala Ser Thr Leu Thr Lys Ser
1325 1330 1335
Gly Pro Gly Arg Trp Lys Thr Pro Ala Ala Ile Pro Ala Thr Pro
1340 1345 1350
Val Ala Val Ser Gln Pro Ile Arg Thr Asp Leu Pro Pro Pro Pro
1355 1360 1365
Pro Pro Pro Pro Val His Tyr Ala Gly Asp Phe Asp Gly Met Ser
1370 1375 1380
Met Asp Leu Pro Leu Pro Pro Pro Pro Ser Ala Asn Gln Ile Gly
1385 1390 1395
Leu Pro Ser Ala Gln Val Ala Ala Ala Glu Arg Arg Lys Arg Glu
1400 1405 1410
Glu His Gln Arg Trp Tyr Glu Lys Glu Lys Ala Arg Leu Glu Glu
1415 1420 1425
Glu Arg Glu Arg Lys Arg Arg Glu Gln Glu Arg Lys Leu Gly Gln
1430 1435 1440
Met Arg Thr Gln Ser Leu Asn Pro Ala Pro Phe Ser Pro Leu Thr
1445 1450 1455
Ala Gln Gln Met Lys Pro Glu Lys Pro Ser Thr Leu Gln Arg Pro
1460 1465 1470
Gln Glu Thr Val Ile Arg Glu Leu Gln Pro Gln Gln Gln Pro Arg
1475 1480 1485
Thr Ile Glu Arg Arg Asp Leu Gln Tyr Ile Thr Val Ser Lys Glu
1490 1495 1500
Glu Leu Ser Ser Gly Asp Ser Leu Ser Pro Asp Pro Trp Lys Arg
1505 1510 1515
Asp Ala Lys Glu Lys Leu Glu Lys Gln Gln Gln Met His Ile Val
1520 1525 1530
Asp Met Leu Ser Lys Glu Ile Gln Glu Leu Gln Ser Lys Pro Asp
1535 1540 1545
Arg Ser Ala Glu Glu Ser Asp Arg Leu Arg Lys Leu Met Leu Glu
1550 1555 1560
Trp Gln Phe Gln Lys Arg Leu Gln Glu Ser Lys Gln Lys Asp Glu
1565 1570 1575
Asp Asp Glu Glu Glu Glu Asp Asp Asp Val Asp Thr Met Leu Ile
1580 1585 1590
Met Gln Arg Leu Glu Ala Glu Arg Arg Ala Arg Leu Gln Asp Glu
1595 1600 1605
Glu Arg Arg Arg Gln Gln Gln Leu Glu Glu Met Arg Lys Arg Glu
1610 1615 1620
Ala Glu Asp Arg Ala Arg Gln Glu Glu Glu Arg Arg Arg Gln Glu
1625 1630 1635
Glu Glu Arg Thr Lys Arg Asp Ala Glu Glu Lys Arg Arg Gln Glu
1640 1645 1650
Glu Gly Tyr Tyr Ser Arg Leu Glu Ala Glu Arg Arg Arg Gln His
1655 1660 1665
Asp Glu Ala Ala Arg Arg Leu Leu Glu Pro Glu Ala Pro Gly Leu
1670 1675 1680
Cys Arg Pro Pro Leu Pro Arg Asp Tyr Glu Pro Pro Ser Pro Ser
1685 1690 1695
Pro Ala Pro Gly Ala Pro Pro Pro Pro Pro Gln Arg Asn Ala Ser
1700 1705 1710
Tyr Leu Lys Thr Gln Val Leu Ser Pro Asp Ser Leu Phe Thr Ala
1715 1720 1725
Lys Phe Val Ala Tyr Asn Glu Glu Glu Glu Glu Glu Asp Cys Ser
1730 1735 1740
Leu Ala Gly Pro Asn Ser Tyr Pro Gly Ser Thr Gly Ala Ala Val
1745 1750 1755
Gly Ala His Asp Ala Cys Arg Asp Ala Lys Glu Lys Arg Ser Lys
1760 1765 1770
Ser Gln Asp Ala Asp Ser Pro Gly Ser Ser Gly Ala Pro Glu Asn
1775 1780 1785
Leu Thr Phe Lys Glu Arg Gln Arg Leu Phe Ser Gln Gly Gln Asp
1790 1795 1800
Val Ser Asn Lys Val Lys Ala Ser Arg Lys Leu Thr Glu Leu Glu
1805 1810 1815
Asn Glu Leu Asn Thr Lys
1820
<210> 45
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> PCSK9 sgRNA target
<400> 45
gagggagatt tgacacacac agg 23
<210> 46
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 2X glycine linker
<400> 46
Gly Gly Gly Gly Gly Gly
1 5
<210> 47
<211> 3564
<212> DNA
<213> 人工序列
<220>
<223> targeted PCSK9 genomic locus
<400> 47
gtgtggggct gcctccccga gcttccatct gccgctgggg ccacacccca ggcccaggga 60
tgggacccca cagtggtcac atcatcttgc agcagaaccc aggtacagct cctggagcag 120
atggtggtcc caagcacggg tgggaccaga aaggactctc acctgggcta actcagctgc 180
agcctcagtt ccctcctcac acacgacgag gaacatggac tggaagcctg cccagcaggc 240
cttctgctcg atgtgcgttg tgtggcttac gtccagggag ggaagcagcc tctgtgctgt 300
cttctagata agcctgtatt ccccgggctg tctgccaatg tatccagttg tcccgtcagc 360
ctggaagctc tgagggaaaa ccttgggctg cttcctgagc acctgtatcc cctgcagcca 420
gcccggggcc tctgctagga gcagactgag catggcttat gggcctggca ccatctggcc 480
tctgcccacc ttgctggcct tgtcttgtgt ctgccccttc gacattccat agcccagctc 540
aatatctagt ggttcctcta gggtggcgag cactgtttgg tctccagatg tcttcaggtc 600
ggagctcaca gcgctctcag ccaccccttc ccagtgtagc accgggcaca tggtagatgc 660
ctattgatga gtgaaagctc ctaacacact cagagagcaa ggactccgcc tcatcccaca 720
gcctgggagg agaggcagac tgccaaggac ctgctcagca tgctacagaa gaaaccaaag 780
tgcccacggg actgatcagt ggagcttcct gccgagactg gaggccttag ggcagggtag 840
acagtgtgtg tgcaggctgg ggactcacag ttcggactgt gcccagacct actagcatag 900
tgggtgggtg ggaggatgcg ggactggggg ccgaccttgc ctgaaattca tgtgggatct 960
cagagcagcc actgaattgc tctgtagggg gctaaatagt ggcccccaca gatacacaca 1020
cccagacaga gcctgtgagc cagaccttat ttggagaaaa ggtctttgta gatgtaatta 1080
agcatctcaa gatggcatca tctggattat gcggtgggct gtaagtcctg tgatgtgtct 1140
ttatgagaga aaggcagagg gagatttgac acacacagga ggggccacgt ggagacagag 1200
gtggagattg gagaaatgtg gccacaagcc agggaacacc agcagccacc agaagccgga 1260
agacgtgagg cagggttctt cccagagcct tcgctgctga gtctgggaat ttgtgaccga 1320
agccataaga agtgggtaca cgccctgagc ctcccacact tgctcacctg tcctgagatg 1380
agaatctcta ctctgcagca tatttggagg atcactgcgg gggccacaga ggtgctgttc 1440
agatggcact tcagaagact caggagaccc tggggcagga gcagtttgac tgacagccca 1500
gagggctgcc ctctgattcc acctgaggcc ctgcttttcc tggctgcagg ggttccaggg 1560
ccaggccatt tccgctggcg caggactctg ctagcagcaa cctgcctgaa gtcttccttt 1620
ggcctggctg agagtttctg agacctgcgc tggagcggag gtgcttcctt ccttgcttcc 1680
tttcttcctc tctcccttct ccatccagca ggctggacct gcctggcatc tgtgagctct 1740
ccctactttc tcctataccc taacctttgt cctgcatggg cgactccccc agtgagtctc 1800
ttgcagcttt taccccagtg cctgcttctt ggagaatcca aactgatcca gttagggatg 1860
ataaagtgta gggtaggcgc tcggtgactg ttttctctga ggttgtgact cgtgtgaggc 1920
agaagcagtc cccgtgagcc ctcctggtat cttgtggagt ggagaacgct tggacctgga 1980
gccaggaggc ccagacatac atcctgtccg agctgcagct tcctgtctct aaaatgagcc 2040
ggccagcgca ggtggccaga catcactgtt attctccttt gagtctttaa atcttgttgt 2100
ctttcttgca gactcggtga gctgtgaaag gctataatag gggctttatt ttacactttg 2160
atactatttt ttgaacattc atattattgt tagatattga tattcatatg aaggagcagg 2220
atgacttggg tccttcttgg cagtagcatt gccagctgat ggccttggac agttacctgc 2280
cctctctagg cctccctttc cttgtctatg aaatacatta tagaatagga tgtagtgtgt 2340
gaggattttt tggaggttaa acgagtgaat atatttaagg cgctttcacc agtgcctggg 2400
atgtgctctg tagtttctgt gtgttaacta taaggttgac tttatgctca ttccctcctc 2460
tcccacaaat gtcgccttgg aaagacggag gcagcctggt ggaggtgtat ctcctagaca 2520
ccagcataca gagtgaccac cgggaaatcg agggcagggt catggtcacc gacttcgaga 2580
atgtgcccga ggaggacggg acccgcttcc acagacaggt aagcacggcc gtctgatggg 2640
agggctgcct ctgcccatat ccccatcctg gaggtgggtg gggactgcca ccccagagcg 2700
ttgcagctgt actcctgggt tgcacccccc ccagctgtca ctgtcccctc cctgccatca 2760
gttgtgggaa gggcgttcat ccatccagcc acctgctgat ttgttatagg gtggaggggg 2820
ggtctttctc atgtggtcct tgtgttcgtc gagcaggcca gcaagtgtga cagtcatggc 2880
acccacctgg caggggtggt cagcggccgg gatgccggcg tggccaaggg tgccagcatg 2940
cgcagcctgc gcgtgctcaa ctgccaaggg aagggcacgg ttagcggcac cctcataggt 3000
aagtgatggc cccagacgct ggtctctctc catctggacc tggcctggga ggtggcttgg 3060
gctgggccca gggagagcta atgtctccta accaagaatg ctgtggcagc ctctgccgca 3120
gagccagaga accagagtgc caaggctggc agggttccca gtggccacga gtgcagatga 3180
agaaacccag gccccaagag ggtcatgcag gtagcccagg gagttcagcc ttgaccctgg 3240
gtcaatgacc tttccacagt tccacactgc tcccctttta aaatccggtg atgtctttat 3300
gtcttttgtt atgttatctt caatgtggag ggactcgagg tgatctaagc aaactttttc 3360
tatcttctgc ttgcatacct ctgagaccag gggactcact cacttgcatg actgggccct 3420
gcaggtcaca ctggccaggc agatgtggtg gaggaactgg cagaggactt tttctagact 3480
gtgactacat ttagtccacc cagcggcccc cctatgaagt ccagttgaga actaggactc 3540
tgggggccgg tggacagaga agag 3564
<210> 48
<211> 3888
<212> DNA
<213> 人工序列
<220>
<223> PCSK9-dTAG杂合体
<400> 48
gtgtggggct gcctccccga gcttccatct gccgctgggg ccacacccca ggcccaggga 60
tgggacccca cagtggtcac atcatcttgc agcagaaccc aggtacagct cctggagcag 120
atggtggtcc caagcacggg tgggaccaga aaggactctc acctgggcta actcagctgc 180
agcctcagtt ccctcctcac acacgacgag gaacatggac tggaagcctg cccagcaggc 240
cttctgctcg atgtgcgttg tgtggcttac gtccagggag ggaagcagcc tctgtgctgt 300
cttctagata agcctgtatt ccccgggctg tctgccaatg tatccagttg tcccgtcagc 360
ctggaagctc tgagggaaaa ccttgggctg cttcctgagc acctgtatcc cctgcagcca 420
gcccggggcc tctgctagga gcagactgag catggcttat gggcctggca ccatctggcc 480
tctgcccacc ttgctggcct tgtcttgtgt ctgccccttc gacattccat agcccagctc 540
aatatctagt ggttcctcta gggtggcgag cactgtttgg tctccagatg tcttcaggtc 600
ggagctcaca gcgctctcag ccaccccttc ccagtgtagc accgggcaca tggtagatgc 660
ctattgatga gtgaaagctc ctaacacact cagagagcaa ggactccgcc tcatcccaca 720
gcctgggagg agaggcagac tgccaaggac ctgctcagca tgctacagaa gaaaccaaag 780
tgcccacggg actgatcagt ggagcttcct gccgagactg gaggccttag ggcagggtag 840
acagtgtgtg tgcaggctgg ggactcacag ttcggactgt gcccagacct actagcatag 900
tgggtgggtg ggaggatgcg ggactggggg ccgaccttgc ctgaaattca tgtgggatct 960
cagagcagcc actgaattgc tctgtagggg gctaaatagt ggcccccaca gatacacaca 1020
cccagacaga gcctgtgagc cagaccttat ttggagaaaa ggtctttgta gatgtaatta 1080
agcatctcaa gatggcatca tctggattat gcggtgggct gtaagtcctg tgatgtgtct 1140
ttatgggagt gcaggtggaa accatctccc caggagacgg gcgcaccttc cccaagcgcg 1200
gccagacctg cgtggtgcac tacaccggga tgcttgaaga tggaaagaaa gttgattcct 1260
cccgggacag aaacaagccc tttaagttta tgctaggcaa gcaggaggtg atccgaggct 1320
gggaagaagg ggttgcccag atgagtgtgg gtcagagagc caaactgact atatctccag 1380
attatgccta tggtgccact gggcacccag gcatcatccc accacatgcc actctcgtct 1440
tcgatgtgga gcttctaaaa ctggggggga gagaaaggca gagggagatt tgacacacac 1500
aggaggggcc acgtggagac agaggtggag attggagaaa tgtggccaca agccagggaa 1560
caccagcagc caccagaagc cggaagacgt gaggcagggt tcttcccaga gccttcgctg 1620
ctgagtctgg gaatttgtga ccgaagccat aagaagtggg tacacgccct gagcctccca 1680
cacttgctca cctgtcctga gatgagaatc tctactctgc agcatatttg gaggatcact 1740
gcgggggcca cagaggtgct gttcagatgg cacttcagaa gactcaggag accctggggc 1800
aggagcagtt tgactgacag cccagagggc tgccctctga ttccacctga ggccctgctt 1860
ttcctggctg caggggttcc agggccaggc catttccgct ggcgcaggac tctgctagca 1920
gcaacctgcc tgaagtcttc ctttggcctg gctgagagtt tctgagacct gcgctggagc 1980
ggaggtgctt ccttccttgc ttcctttctt cctctctccc ttctccatcc agcaggctgg 2040
acctgcctgg catctgtgag ctctccctac tttctcctat accctaacct ttgtcctgca 2100
tgggcgactc ccccagtgag tctcttgcag cttttacccc agtgcctgct tcttggagaa 2160
tccaaactga tccagttagg gatgataaag tgtagggtag gcgctcggtg actgttttct 2220
ctgaggttgt gactcgtgtg aggcagaagc agtccccgtg agccctcctg gtatcttgtg 2280
gagtggagaa cgcttggacc tggagccagg aggcccagac atacatcctg tccgagctgc 2340
agcttcctgt ctctaaaatg agccggccag cgcaggtggc cagacatcac tgttattctc 2400
ctttgagtct ttaaatcttg ttgtctttct tgcagactcg gtgagctgtg aaaggctata 2460
ataggggctt tattttacac tttgatacta ttttttgaac attcatatta ttgttagata 2520
ttgatattca tatgaaggag caggatgact tgggtccttc ttggcagtag cattgccagc 2580
tgatggcctt ggacagttac ctgccctctc taggcctccc tttccttgtc tatgaaatac 2640
attatagaat aggatgtagt gtgtgaggat tttttggagg ttaaacgagt gaatatattt 2700
aaggcgcttt caccagtgcc tgggatgtgc tctgtagttt ctgtgtgtta actataaggt 2760
tgactttatg ctcattccct cctctcccac aaatgtcgcc ttggaaagac ggaggcagcc 2820
tggtggaggt gtatctccta gacaccagca tacagagtga ccaccgggaa atcgagggca 2880
gggtcatggt caccgacttc gagaatgtgc ccgaggagga cgggacccgc ttccacagac 2940
aggtaagcac ggccgtctga tgggagggct gcctctgccc atatccccat cctggaggtg 3000
ggtggggact gccaccccag agcgttgcag ctgtactcct gggttgcacc ccccccagct 3060
gtcactgtcc cctccctgcc atcagttgtg ggaagggcgt tcatccatcc agccacctgc 3120
tgatttgtta tagggtggag ggggggtctt tctcatgtgg tccttgtgtt cgtcgagcag 3180
gccagcaagt gtgacagtca tggcacccac ctggcagggg tggtcagcgg ccgggatgcc 3240
ggcgtggcca agggtgccag catgcgcagc ctgcgcgtgc tcaactgcca agggaagggc 3300
acggttagcg gcaccctcat aggtaagtga tggccccaga cgctggtctc tctccatctg 3360
gacctggcct gggaggtggc ttgggctggg cccagggaga gctaatgtct cctaaccaag 3420
aatgctgtgg cagcctctgc cgcagagcca gagaaccaga gtgccaaggc tggcagggtt 3480
cccagtggcc acgagtgcag atgaagaaac ccaggcccca agagggtcat gcaggtagcc 3540
cagggagttc agccttgacc ctgggtcaat gacctttcca cagttccaca ctgctcccct 3600
tttaaaatcc ggtgatgtct ttatgtcttt tgttatgtta tcttcaatgt ggagggactc 3660
gaggtgatct aagcaaactt tttctatctt ctgcttgcat acctctgaga ccaggggact 3720
cactcacttg catgactggg ccctgcaggt cacactggcc aggcagatgt ggtggaggaa 3780
ctggcagagg actttttcta gactgtgact acatttagtc cacccagcgg cccccctatg 3840
aagtccagtt gagaactagg actctggggg ccggtggaca gagaagag 3888
<210> 49
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> CTNNB1 sgRNA靶标
<400> 49
taccacagct ccttctctga gtgg 24
<210> 50
<211> 1650
<212> DNA
<213> 人工序列
<220>
<223> CTNNB1基因组基因座
<400> 50
aaataatttt tgatggcact atatcagaaa acaacttgtt aaagaaaatg tggagttttt 60
aaaatcccac tgtacctctg ttatccaaag gggatctgtg aatttttctg tgaaaggtta 120
aaaaaggaga gacctttagg aattcagaga gcagctgatt tttgaatagt gttttcccct 180
ccctggcttt tattattaca actctgtgct ttttcatcac catcctgaat atctataatt 240
aatatttata ctattaataa aaagacattt ttggtaagga ggagttttca ctgaagttca 300
gcagtgatgg agctgtggtt gaggtgtctg gaggagacca tgaggtctgc gtttcactaa 360
cctggtaaaa gaggatatgg gttttttttg tgggtgtaat agtgacattt aacaggtatc 420
ccagtgactt aggagtatta atcaagctaa atttaaatcc taatgacttt tgattaactt 480
tttttagggt atttgaagta taccatacaa ctgttttgaa aatccagcgt ggacaatggc 540
tactcaaggt ttgtgtcatt aaatctttag ttactgaatt ggggctctgc ttcgttgcca 600
ttaagccagt ctggctgaga tccccctgct ttcctctctc cctgcttact tgtcaggcta 660
ccttttgctc cattttctgc tcactcctcc taatggcttg gtgaaatagc aaacaagcca 720
ccagcaggaa tctagtctgg atgactgctt ctggagcctg gatgcagtac cattcttcca 780
ctgattcagt gagtaactgt taggtggttc cctaagggat taggtatttc atcactgagc 840
taaccctggc tatcattctg cttttcttgg ctgtctttca gatttgactt tatttctaaa 900
aatatttcaa tgggtcatat cacagattct ttttttttaa attaaagtaa catttccaat 960
ctactaatgc taatactgtt tcgtatttat agctgatttg atggagttgg acatggccat 1020
ggaaccagac agaaaagcgg ctgttagtca ctggcagcaa cagtcttacc tggactctgg 1080
aatccattct ggtgccacta ccacagctcc ttctctgagt ggtaaaggca atcctgagga 1140
agaggatgtg gatacctccc aagtcctgta tgagtgggaa cagggatttt ctcagtcctt 1200
cactcaagaa caagtagctg gtaagagtat tatttttcat tgccttactg aaagtcagaa 1260
tgcagttttg agaactaaaa agttagtgta taatagttta aataaaatgt tgtggtgaag 1320
aaaagagagt aatagcaatg tcacttttac catttaggat agcaaatact taggtaaatg 1380
ctgaactgtg gatagtgagt gttgaattaa ccttttccag atattgatgg acagtatgca 1440
atgactcgag ctcagagggt acgagctgct atgttccctg agacattaga tgagggcatg 1500
cagatcccat ctacacagtt tgatgctgct catcccacta atgtccagcg tttggctgaa 1560
ccatcacaga tgctgaaaca tgcagttgta aacttgatta actatcaaga tgatgcagaa 1620
cttgccacac gtgcaatccc tgaactgaca 1650
<210> 51
<211> 1977
<212> DNA
<213> 人工序列
<220>
<223> CTNNB1-dTAG杂合体
<400> 51
aaataatttt tgatggcact atatcagaaa acaacttgtt aaagaaaatg tggagttttt 60
aaaatcccac tgtacctctg ttatccaaag gggatctgtg aatttttctg tgaaaggtta 120
aaaaaggaga gacctttagg aattcagaga gcagctgatt tttgaatagt gttttcccct 180
ccctggcttt tattattaca actctgtgct ttttcatcac catcctgaat atctataatt 240
aatatttata ctattaataa aaagacattt ttggtaagga ggagttttca ctgaagttca 300
gcagtgatgg agctgtggtt gaggtgtctg gaggagacca tgaggtctgc gtttcactaa 360
cctggtaaaa gaggatatgg gttttttttg tgggtgtaat agtgacattt aacaggtatc 420
ccagtgactt aggagtatta atcaagctaa atttaaatcc taatgacttt tgattaactt 480
tttttagggt atttgaagta taccatacaa ctgttttgaa aatccagcgt ggacaatggg 540
agtgcaggtg gaaaccatct ccccaggaga cgggcgcacc ttccccaagc gcggccagac 600
ctgcgtggtg cactacaccg ggatgcttga agatggaaag aaagttgatt cctcccggga 660
cagaaacaag ccctttaagt ttatgctagg caagcaggag gtgatccgag gctgggaaga 720
aggggttgcc cagatgagtg tgggtcagag agccaaactg actatatctc cagattatgc 780
ctatggtgcc actgggcacc caggcatcat cccaccacat gccactctcg tcttcgatgt 840
ggagcttcta aaactggggg ggatggctac tcaaggtttg tgtcattaaa tctttagtta 900
ctgaattggg gctctgcttc gttgccatta agccagtctg gctgagatcc ccctgctttc 960
ctctctccct gcttacttgt caggctacct tttgctccat tttctgctca ctcctcctaa 1020
tggcttggtg aaatagcaaa caagccacca gcaggaatct agtctggatg actgcttctg 1080
gagcctggat gcagtaccat tcttccactg attcagtgag taactgttag gtggttccct 1140
aagggattag gtatttcatc actgagctaa ccctggctat cattctgctt ttcttggctg 1200
tctttcagat ttgactttat ttctaaaaat atttcaatgg gtcatatcac agattctttt 1260
tttttaaatt aaagtaacat ttcaatctac taatgctaat actgtttcgt atttatagcc 1320
tgatttgatg gagttggaca tggccatgga accagacaga aaagcggctg ttagtcactg 1380
gcagcaacag tcttacctgg actctggaat ccattctggt gccactacca cagctccttc 1440
tctgagtggt aaaggcaatc ctgaggaaga ggatgtggat acctcccaag tcctgtatga 1500
gtgggaacag ggattttctc agtccttcac tcaagaacaa gtagctggta agagtattat 1560
ttttcattgc cttactgaaa gtcagaatgc agttttgaga actaaaaagt tagtgtataa 1620
tagtttaaat aaaatgttgt ggtgaagaaa agagagtaat agcaatgtca cttttaccat 1680
ttaggatagc aaatacttag gtaaatgctg aactgtggat agtgagtgtt gaattaacct 1740
tttccagata ttgatggaca gtatgcaatg actcgagctc agagggtacg agctgctatg 1800
ttccctgaga cattagatga gggcatgcag atcccatcta cacagtttga tgctgctcat 1860
cccactaatg tccagcgttt ggctgaacca tcacagatgc tgaaacatgc agttgtaaac 1920
ttgattaact atcaagatga tgcagaactt gccacacgtg caatccctga actgaca 1977
<210> 52
<211> 1368
<212> PRT
<213> 人工序列
<220>
<223> Cas-9核酸酶
<400> 52
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 53
<211> 327
<212> PRT
<213> 智人
<400> 53
Gly Glu Ala Pro Asn Gln Ala Leu Leu Arg Ile Leu Lys Glu Thr Glu
1 5 10 15
Phe Lys Lys Ile Lys Val Leu Gly Ser Gly Ala Phe Gly Thr Val Tyr
20 25 30
Lys Gly Leu Trp Ile Pro Glu Gly Glu Lys Val Lys Ile Pro Val Ala
35 40 45
Ile Lys Glu Leu Arg Glu Ala Thr Ser Pro Lys Ala Asn Lys Glu Ile
50 55 60
Leu Asp Glu Ala Tyr Val Met Ala Ser Val Asp Asn Pro His Val Cys
65 70 75 80
Arg Leu Leu Gly Ile Cys Leu Thr Ser Thr Val Gln Leu Ile Thr Gln
85 90 95
Leu Met Pro Phe Gly Cys Leu Leu Asp Tyr Val Arg Glu His Lys Asp
100 105 110
Asn Ile Gly Ser Gln Tyr Leu Leu Asn Trp Cys Val Gln Ile Ala Lys
115 120 125
Gly Met Asn Tyr Leu Glu Asp Arg Arg Leu Val His Arg Asp Leu Ala
130 135 140
Ala Arg Asn Val Leu Val Lys Thr Pro Gln His Val Lys Ile Thr Asp
145 150 155 160
Phe Gly Arg Ala Lys Leu Leu Gly Ala Glu Glu Lys Glu Tyr His Ala
165 170 175
Glu Gly Gly Lys Val Pro Ile Lys Trp Met Ala Leu Glu Ser Ile Leu
180 185 190
His Arg Ile Tyr Thr His Gln Ser Asp Val Trp Ser Tyr Gly Val Thr
195 200 205
Val Trp Glu Leu Met Thr Phe Gly Ser Lys Pro Tyr Asp Gly Ile Pro
210 215 220
Ala Ser Glu Ile Ser Ser Ile Leu Glu Lys Gly Glu Arg Leu Pro Gln
225 230 235 240
Pro Pro Ile Cys Thr Ile Asp Val Tyr Met Ile Met Val Lys Cys Trp
245 250 255
Met Ile Asp Ala Asp Ser Arg Pro Lys Phe Arg Glu Leu Ile Ile Glu
260 265 270
Phe Ser Lys Met Ala Arg Asp Pro Gln Arg Tyr Leu Val Ile Gln Gly
275 280 285
Asp Glu Arg Met His Leu Pro Ser Pro Thr Asp Ser Asn Phe Tyr Arg
290 295 300
Ala Leu Met Asp Glu Glu Asp Met Asp Asp Val Val Asp Ala Asp Glu
305 310 315 320
Tyr Leu Ile Pro Gln Gln Gly
325
<210> 54
<211> 327
<212> PRT
<213> 人工序列
<220>
<223> 表皮生长因子受体 T790M dTAG
<400> 54
Gly Glu Ala Pro Asn Gln Ala Leu Leu Arg Ile Leu Lys Glu Thr Glu
1 5 10 15
Phe Lys Lys Ile Lys Val Leu Gly Ser Gly Ala Phe Gly Thr Val Tyr
20 25 30
Lys Gly Leu Trp Ile Pro Glu Gly Glu Lys Val Lys Ile Pro Val Ala
35 40 45
Ile Lys Glu Leu Arg Glu Ala Thr Ser Pro Lys Ala Asn Lys Glu Ile
50 55 60
Leu Asp Glu Ala Tyr Val Met Ala Ser Val Asp Asn Pro His Val Cys
65 70 75 80
Arg Leu Leu Gly Ile Cys Leu Thr Ser Thr Val Gln Leu Ile Met Gln
85 90 95
Leu Met Pro Phe Gly Cys Leu Leu Asp Tyr Val Arg Glu His Lys Asp
100 105 110
Asn Ile Gly Ser Gln Tyr Leu Leu Asn Trp Cys Val Gln Ile Ala Lys
115 120 125
Gly Met Asn Tyr Leu Glu Asp Arg Arg Leu Val His Arg Asp Leu Ala
130 135 140
Ala Arg Asn Val Leu Val Lys Thr Pro Gln His Val Lys Ile Thr Asp
145 150 155 160
Phe Gly Arg Ala Lys Leu Leu Gly Ala Glu Glu Lys Glu Tyr His Ala
165 170 175
Glu Gly Gly Lys Val Pro Ile Lys Trp Met Ala Leu Glu Ser Ile Leu
180 185 190
His Arg Ile Tyr Thr His Gln Ser Asp Val Trp Ser Tyr Gly Val Thr
195 200 205
Val Trp Glu Leu Met Thr Phe Gly Ser Lys Pro Tyr Asp Gly Ile Pro
210 215 220
Ala Ser Glu Ile Ser Ser Ile Leu Glu Lys Gly Glu Arg Leu Pro Gln
225 230 235 240
Pro Pro Ile Cys Thr Ile Asp Val Tyr Met Ile Met Val Lys Cys Trp
245 250 255
Met Ile Asp Ala Asp Ser Arg Pro Lys Phe Arg Glu Leu Ile Ile Glu
260 265 270
Phe Ser Lys Met Ala Arg Asp Pro Gln Arg Tyr Leu Val Ile Gln Gly
275 280 285
Asp Glu Arg Met His Leu Pro Ser Pro Thr Asp Ser Asn Phe Tyr Arg
290 295 300
Ala Leu Met Asp Glu Glu Asp Met Asp Asp Val Val Asp Ala Asp Glu
305 310 315 320
Tyr Leu Ile Pro Gln Gln Gly
325
<210> 55
<211> 327
<212> PRT
<213> 人工序列
<220>
<223> C797S dTAG
<400> 55
Gly Glu Ala Pro Asn Gln Ala Leu Leu Arg Ile Leu Lys Glu Thr Glu
1 5 10 15
Phe Lys Lys Ile Lys Val Leu Gly Ser Gly Ala Phe Gly Thr Val Tyr
20 25 30
Lys Gly Leu Trp Ile Pro Glu Gly Glu Lys Val Lys Ile Pro Val Ala
35 40 45
Ile Lys Glu Leu Arg Glu Ala Thr Ser Pro Lys Ala Asn Lys Glu Ile
50 55 60
Leu Asp Glu Ala Tyr Val Met Ala Ser Val Asp Asn Pro His Val Cys
65 70 75 80
Arg Leu Leu Gly Ile Cys Leu Thr Ser Thr Val Gln Leu Ile Met Gln
85 90 95
Leu Met Pro Phe Gly Ser Leu Leu Asp Tyr Val Arg Glu His Lys Asp
100 105 110
Asn Ile Gly Ser Gln Tyr Leu Leu Asn Trp Cys Val Gln Ile Ala Lys
115 120 125
Gly Met Asn Tyr Leu Glu Asp Arg Arg Leu Val His Arg Asp Leu Ala
130 135 140
Ala Arg Asn Val Leu Val Lys Thr Pro Gln His Val Lys Ile Thr Asp
145 150 155 160
Phe Gly Arg Ala Lys Leu Leu Gly Ala Glu Glu Lys Glu Tyr His Ala
165 170 175
Glu Gly Gly Lys Val Pro Ile Lys Trp Met Ala Leu Glu Ser Ile Leu
180 185 190
His Arg Ile Tyr Thr His Gln Ser Asp Val Trp Ser Tyr Gly Val Thr
195 200 205
Val Trp Glu Leu Met Thr Phe Gly Ser Lys Pro Tyr Asp Gly Ile Pro
210 215 220
Ala Ser Glu Ile Ser Ser Ile Leu Glu Lys Gly Glu Arg Leu Pro Gln
225 230 235 240
Pro Pro Ile Cys Thr Ile Asp Val Tyr Met Ile Met Val Lys Cys Trp
245 250 255
Met Ile Asp Ala Asp Ser Arg Pro Lys Phe Arg Glu Leu Ile Ile Glu
260 265 270
Phe Ser Lys Met Ala Arg Asp Pro Gln Arg Tyr Leu Val Ile Gln Gly
275 280 285
Asp Glu Arg Met His Leu Pro Ser Pro Thr Asp Ser Asn Phe Tyr Arg
290 295 300
Ala Leu Met Asp Glu Glu Asp Met Asp Asp Val Val Asp Ala Asp Glu
305 310 315 320
Tyr Leu Ile Pro Gln Gln Gly
325
<210> 56
<211> 327
<212> PRT
<213> 人工序列
<220>
<223> C790G dTAG
<400> 56
Gly Glu Ala Pro Asn Gln Ala Leu Leu Arg Ile Leu Lys Glu Thr Glu
1 5 10 15
Phe Lys Lys Ile Lys Val Leu Gly Ser Gly Ala Phe Gly Thr Val Tyr
20 25 30
Lys Gly Leu Trp Ile Pro Glu Gly Glu Lys Val Lys Ile Pro Val Ala
35 40 45
Ile Lys Glu Leu Arg Glu Ala Thr Ser Pro Lys Ala Asn Lys Glu Ile
50 55 60
Leu Asp Glu Ala Tyr Val Met Ala Ser Val Asp Asn Pro His Val Cys
65 70 75 80
Arg Leu Leu Gly Ile Cys Leu Thr Ser Thr Val Gln Leu Ile Met Gln
85 90 95
Leu Met Pro Phe Gly Cys Gly Leu Asp Tyr Val Arg Glu His Lys Asp
100 105 110
Asn Ile Gly Ser Gln Tyr Leu Leu Asn Trp Cys Val Gln Ile Ala Lys
115 120 125
Gly Met Asn Tyr Leu Glu Asp Arg Arg Leu Val His Arg Asp Leu Ala
130 135 140
Ala Arg Asn Val Leu Val Lys Thr Pro Gln His Val Lys Ile Thr Asp
145 150 155 160
Phe Gly Arg Ala Lys Leu Leu Gly Ala Glu Glu Lys Glu Tyr His Ala
165 170 175
Glu Gly Gly Lys Val Pro Ile Lys Trp Met Ala Leu Glu Ser Ile Leu
180 185 190
His Arg Ile Tyr Thr His Gln Ser Asp Val Trp Ser Tyr Gly Val Thr
195 200 205
Val Trp Glu Leu Met Thr Phe Gly Ser Lys Pro Tyr Asp Gly Ile Pro
210 215 220
Ala Ser Glu Ile Ser Ser Ile Leu Glu Lys Gly Glu Arg Leu Pro Gln
225 230 235 240
Pro Pro Ile Cys Thr Ile Asp Val Tyr Met Ile Met Val Lys Cys Trp
245 250 255
Met Ile Asp Ala Asp Ser Arg Pro Lys Phe Arg Glu Leu Ile Ile Glu
260 265 270
Phe Ser Lys Met Ala Arg Asp Pro Gln Arg Tyr Leu Val Ile Gln Gly
275 280 285
Asp Glu Arg Met His Leu Pro Ser Pro Thr Asp Ser Asn Phe Tyr Arg
290 295 300
Ala Leu Met Asp Glu Glu Asp Met Asp Asp Val Val Asp Ala Asp Glu
305 310 315 320
Tyr Leu Ile Pro Gln Gln Gly
325
<210> 57
<211> 272
<212> PRT
<213> 人工序列
<220>
<223> 表皮生长因子受体(BCR-ABL)
<400> 57
Ser Pro Asn Tyr Asp Lys Trp Glu Met Glu Arg Thr Asp Ile Thr Met
1 5 10 15
Lys His Lys Leu Gly Gly Gly Gln Tyr Gly Glu Val Tyr Glu Gly Val
20 25 30
Trp Lys Lys Tyr Ser Leu Thr Val Ala Val Lys Thr Leu Lys Glu Asp
35 40 45
Thr Met Glu Val Glu Glu Phe Leu Lys Glu Ala Ala Val Met Lys Glu
50 55 60
Ile Lys His Pro Asn Leu Val Gln Leu Leu Gly Val Cys Thr Arg Glu
65 70 75 80
Pro Pro Phe Tyr Ile Ile Ile Glu Phe Met Thr Tyr Gly Asn Leu Leu
85 90 95
Asp Tyr Leu Arg Glu Cys Asn Arg Gln Glu Val Asn Ala Val Val Leu
100 105 110
Leu Tyr Met Ala Thr Gln Ile Ser Ser Ala Met Glu Tyr Leu Glu Lys
115 120 125
Lys Asn Phe Ile His Arg Asp Leu Ala Ala Arg Asn Cys Leu Val Gly
130 135 140
Glu Asn His Leu Val Lys Val Ala Asp Phe Gly Leu Ser Arg Leu Met
145 150 155 160
Thr Gly Asp Thr Tyr Thr Ala His Ala Gly Ala Lys Phe Pro Ile Lys
165 170 175
Trp Thr Ala Pro Glu Ser Leu Ala Tyr Asn Lys Phe Ser Ile Lys Ser
180 185 190
Asp Val Trp Ala Phe Gly Val Leu Leu Trp Glu Ile Ala Thr Tyr Gly
195 200 205
Met Ser Pro Tyr Pro Gly Ile Asp Leu Ser Gln Val Tyr Glu Leu Leu
210 215 220
Glu Lys Asp Tyr Arg Met Glu Arg Pro Glu Gly Cys Pro Glu Lys Val
225 230 235 240
Tyr Glu Leu Met Arg Ala Cys Trp Gln Trp Asn Pro Ser Asp Arg Pro
245 250 255
Ser Phe Ala Glu Ile His Gln Ala Phe Glu Thr Met Phe Gln Glu Ser
260 265 270
<210> 58
<211> 272
<212> PRT
<213> 人工序列
<220>
<223> BCR-ABL
<400> 58
Ser Pro Asn Tyr Asp Lys Trp Glu Met Glu Arg Thr Asp Ile Thr Met
1 5 10 15
Lys His Lys Leu Gly Gly Gly Gln Tyr Gly Glu Val Tyr Glu Gly Val
20 25 30
Trp Lys Lys Tyr Ser Leu Thr Val Ala Val Lys Thr Leu Lys Glu Asp
35 40 45
Thr Met Glu Val Glu Glu Phe Leu Lys Glu Ala Ala Val Met Lys Glu
50 55 60
Ile Lys His Pro Asn Leu Val Gln Leu Leu Gly Val Cys Thr Arg Glu
65 70 75 80
Pro Pro Phe Tyr Ile Ile Thr Glu Phe Met Thr Tyr Gly Asn Leu Leu
85 90 95
Asp Tyr Leu Arg Glu Cys Asn Arg Gln Glu Val Asn Ala Val Val Leu
100 105 110
Leu Tyr Met Ala Thr Gln Ile Ser Ser Ala Met Glu Tyr Leu Glu Lys
115 120 125
Lys Asn Phe Ile His Arg Asp Leu Ala Ala Arg Asn Cys Leu Val Gly
130 135 140
Glu Asn His Leu Val Lys Val Ala Asp Phe Gly Leu Ser Arg Leu Met
145 150 155 160
Thr Gly Asp Thr Tyr Thr Ala His Ala Gly Ala Lys Phe Pro Ile Lys
165 170 175
Trp Thr Ala Pro Glu Ser Leu Ala Tyr Asn Lys Phe Ser Ile Lys Ser
180 185 190
Asp Val Trp Ala Phe Gly Val Leu Leu Trp Glu Ile Ala Thr Tyr Gly
195 200 205
Met Ser Pro Tyr Pro Gly Ile Asp Leu Ser Gln Val Tyr Glu Leu Leu
210 215 220
Glu Lys Asp Tyr Arg Met Glu Arg Pro Glu Gly Cys Pro Glu Lys Val
225 230 235 240
Tyr Glu Leu Met Arg Ala Cys Trp Gln Trp Asn Pro Ser Asp Arg Pro
245 250 255
Ser Phe Ala Glu Ile His Gln Ala Phe Glu Thr Met Phe Gln Glu Ser
260 265 270
<210> 59
<211> 339
<212> PRT
<213> 智人
<400> 59
Glu Leu Gln Ser Pro Glu Tyr Lys Leu Ser Lys Leu Arg Thr Ser Thr
1 5 10 15
Ile Met Thr Asp Tyr Asn Pro Asn Tyr Cys Phe Ala Gly Lys Thr Ser
20 25 30
Ser Ile Ser Asp Leu Lys Glu Val Pro Arg Lys Asn Ile Thr Leu Ile
35 40 45
Arg Gly Leu Gly His Gly Ala Phe Gly Glu Val Tyr Glu Gly Gln Val
50 55 60
Ser Gly Met Pro Asn Asp Pro Ser Pro Leu Gln Val Ala Val Lys Thr
65 70 75 80
Leu Pro Glu Val Cys Ser Glu Gln Asp Glu Leu Asp Phe Leu Met Glu
85 90 95
Ala Leu Ile Ile Ser Lys Phe Asn His Gln Asn Ile Val Arg Cys Ile
100 105 110
Gly Val Ser Leu Gln Ser Leu Pro Arg Phe Ile Met Leu Glu Leu Met
115 120 125
Ala Gly Gly Asp Leu Lys Ser Phe Leu Arg Glu Thr Arg Pro Arg Pro
130 135 140
Ser Gln Pro Ser Ser Leu Ala Met Leu Asp Leu Leu His Val Ala Arg
145 150 155 160
Asp Ile Ala Cys Gly Cys Gln Tyr Leu Glu Glu Asn His Phe Ile His
165 170 175
Arg Asp Ile Ala Ala Arg Asn Cys Leu Leu Thr Cys Pro Gly Pro Gly
180 185 190
Arg Val Ala Lys Ile Gly Asp Phe Gly Met Ala Arg Asp Ile Tyr Arg
195 200 205
Ala Gly Tyr Tyr Arg Lys Gly Gly Cys Ala Met Leu Pro Val Lys Trp
210 215 220
Met Pro Pro Glu Ala Phe Met Glu Gly Ile Phe Thr Ser Lys Thr Asp
225 230 235 240
Thr Trp Ser Phe Gly Val Leu Leu Trp Glu Ile Phe Ser Leu Gly Tyr
245 250 255
Met Pro Tyr Pro Ser Lys Ser Asn Gln Glu Val Leu Glu Phe Val Thr
260 265 270
Ser Gly Gly Arg Met Asp Pro Pro Lys Asn Cys Pro Gly Pro Val Tyr
275 280 285
Arg Ile Met Thr Gln Cys Trp Gln His Gln Pro Glu Asp Arg Pro Asn
290 295 300
Phe Ala Ile Ile Leu Glu Arg Ile Glu Tyr Cys Thr Gln Asp Pro Asp
305 310 315 320
Val Ile Asn Thr Ala Leu Pro Ile Glu Tyr Gly Pro Leu Val Glu Glu
325 330 335
Glu Glu Lys
<210> 60
<211> 277
<212> PRT
<213> 智人
<400> 60
Val Phe His Lys Ile Arg Asn Glu Asp Leu Ile Phe Asn Glu Ser Leu
1 5 10 15
Gly Gln Gly Thr Phe Thr Lys Ile Phe Lys Gly Val Arg Arg Glu Val
20 25 30
Gly Asp Tyr Gly Gln Leu His Glu Thr Glu Val Leu Leu Lys Val Leu
35 40 45
Asp Lys Ala His Arg Asn Tyr Ser Glu Ser Phe Phe Glu Ala Ala Ser
50 55 60
Met Met Ser Lys Leu Ser His Lys His Leu Val Leu Asn Tyr Gly Val
65 70 75 80
Cys Phe Cys Gly Asp Glu Asn Ile Leu Val Gln Glu Phe Val Lys Phe
85 90 95
Gly Ser Leu Asp Thr Tyr Leu Lys Lys Asn Lys Asn Cys Ile Asn Ile
100 105 110
Leu Trp Lys Leu Glu Val Ala Lys Gln Leu Ala Trp Ala Met His Phe
115 120 125
Leu Glu Glu Asn Thr Leu Ile His Gly Asn Val Cys Ala Lys Asn Ile
130 135 140
Leu Leu Ile Arg Glu Glu Asp Arg Lys Thr Gly Asn Pro Pro Phe Ile
145 150 155 160
Lys Leu Ser Asp Pro Gly Ile Ser Ile Thr Val Leu Pro Lys Asp Ile
165 170 175
Leu Gln Glu Arg Ile Pro Trp Val Pro Pro Glu Cys Ile Glu Asn Pro
180 185 190
Lys Asn Leu Asn Leu Ala Thr Asp Lys Trp Ser Phe Gly Thr Thr Leu
195 200 205
Trp Glu Ile Cys Ser Gly Gly Asp Lys Pro Leu Ser Ala Leu Asp Ser
210 215 220
Gln Arg Lys Leu Gln Phe Tyr Glu Asp Arg His Gln Leu Pro Ala Pro
225 230 235 240
Lys Ala Ala Glu Leu Ala Asn Leu Ile Asn Asn Cys Met Asp Tyr Glu
245 250 255
Pro Asp His Arg Pro Ser Phe Arg Ala Ile Ile Arg Asp Leu Asn Ser
260 265 270
Leu Phe Thr Pro Asp
275
<210> 61
<211> 272
<212> PRT
<213> 智人
<400> 61
Asp Trp Glu Ile Pro Asp Gly Gln Ile Thr Val Gly Gln Arg Ile Gly
1 5 10 15
Ser Gly Ser Phe Gly Thr Val Tyr Lys Gly Lys Trp His Gly Asp Val
20 25 30
Ala Val Lys Met Leu Asn Val Thr Ala Pro Thr Pro Gln Gln Leu Gln
35 40 45
Ala Phe Lys Asn Glu Val Gly Val Leu Arg Lys Thr Arg His Val Asn
50 55 60
Ile Leu Leu Phe Met Gly Tyr Ser Thr Ala Pro Gln Leu Ala Ile Val
65 70 75 80
Thr Gln Trp Cys Glu Gly Ser Ser Leu Tyr His His Leu His Ala Ser
85 90 95
Glu Thr Lys Phe Glu Met Lys Lys Leu Ile Asp Ile Ala Arg Gln Thr
100 105 110
Ala Arg Gly Met Asp Tyr Leu His Ala Lys Ser Ile Ile His Arg Asp
115 120 125
Leu Lys Ser Asn Asn Ile Phe Leu His Glu Asp Asn Thr Val Lys Ile
130 135 140
Gly Asp Phe Gly Leu Ala Thr Glu Lys Ser Arg Trp Ser Gly Ser His
145 150 155 160
Gln Phe Glu Gln Leu Ser Gly Ser Ile Leu Trp Met Ala Pro Glu Val
165 170 175
Ile Arg Met Gln Asp Ser Asn Pro Tyr Ser Phe Gln Ser Asp Val Tyr
180 185 190
Ala Phe Gly Ile Val Leu Tyr Glu Leu Met Thr Gly Gln Leu Pro Tyr
195 200 205
Ser Asn Ile Asn Asn Arg Asp Gln Ile Ile Glu Met Val Gly Arg Gly
210 215 220
Ser Leu Ser Pro Asp Leu Ser Lys Val Arg Ser Asn Cys Pro Lys Arg
225 230 235 240
Met Lys Arg Leu Met Ala Glu Cys Leu Lys Lys Lys Arg Asp Glu Arg
245 250 255
Pro Ser Phe Pro Arg Ile Leu Ala Glu Ile Glu Glu Leu Ala Arg Glu
260 265 270
<210> 62
<211> 254
<212> PRT
<213> 人工序列
<220>
<223> dTAG序列
<400> 62
Leu Arg Leu Glu Val Lys Leu Gly Gln Gly Cys Phe Gly Glu Val Trp
1 5 10 15
Met Gly Thr Trp Asn Gly Thr Thr Arg Val Ala Ile Lys Thr Leu Lys
20 25 30
Pro Gly Thr Met Ser Pro Glu Ala Phe Leu Gln Glu Ala Gln Val Met
35 40 45
Lys Lys Leu Arg His Glu Lys Leu Val Gln Leu Tyr Ala Val Val Ser
50 55 60
Glu Glu Pro Ile Tyr Ile Val Thr Glu Tyr Gly Ser Lys Gly Ser Leu
65 70 75 80
Leu Asp Phe Leu Lys Gly Glu Thr Gly Lys Tyr Leu Arg Leu Pro Gln
85 90 95
Leu Val Asp Met Ala Ala Gln Ile Ala Ser Gly Met Ala Tyr Val Glu
100 105 110
Arg Met Asn Tyr Val His Arg Asp Leu Arg Ala Ala Asn Ile Leu Val
115 120 125
Gly Glu Asn Leu Val Cys Lys Val Ala Asp Phe Gly Leu Ala Arg Leu
130 135 140
Ile Glu Asp Asn Glu Tyr Thr Ala Arg Gln Gly Ala Lys Phe Pro Ile
145 150 155 160
Lys Trp Thr Ala Pro Glu Ala Ala Leu Tyr Gly Arg Phe Thr Ile Lys
165 170 175
Ser Asp Val Trp Ser Phe Gly Ile Leu Leu Thr Glu Leu Thr Thr Lys
180 185 190
Gly Arg Val Pro Tyr Pro Gly Met Val Asn Arg Glu Val Leu Asp Gln
195 200 205
Val Glu Arg Gly Tyr Arg Met Pro Cys Pro Pro Glu Cys Pro Glu Ser
210 215 220
Leu His Asp Leu Met Cys Gln Cys Trp Arg Lys Glu Pro Glu Glu Arg
225 230 235 240
Pro Thr Phe Glu Tyr Leu Gln Ala Phe Leu Glu Asp Tyr Phe
245 250
<210> 63
<211> 254
<212> PRT
<213> 人工序列
<220>
<223> dTAG序列
<400> 63
Leu Arg Leu Glu Val Lys Leu Gly Gln Gly Cys Phe Gly Glu Val Trp
1 5 10 15
Met Gly Thr Trp Asn Gly Thr Thr Arg Val Ala Ile Lys Thr Leu Lys
20 25 30
Pro Gly Thr Met Ser Pro Glu Ala Phe Leu Gln Glu Ala Gln Val Met
35 40 45
Lys Lys Leu Arg His Glu Lys Leu Val Gln Leu Tyr Ala Val Val Ser
50 55 60
Glu Glu Pro Ile Tyr Ile Val Thr Glu Tyr Ala Ser Lys Gly Ser Leu
65 70 75 80
Leu Asp Phe Leu Lys Gly Glu Thr Gly Lys Tyr Leu Arg Leu Pro Gln
85 90 95
Leu Val Asp Met Ala Ala Gln Ile Ala Ser Gly Met Ala Tyr Val Glu
100 105 110
Arg Met Asn Tyr Val His Arg Asp Leu Arg Ala Ala Asn Ile Leu Val
115 120 125
Gly Glu Asn Leu Val Cys Lys Val Ala Asp Phe Gly Leu Ala Arg Leu
130 135 140
Ile Glu Asp Asn Glu Tyr Thr Ala Arg Gln Gly Ala Lys Phe Pro Ile
145 150 155 160
Lys Trp Thr Ala Pro Glu Ala Ala Leu Tyr Gly Arg Phe Thr Ile Lys
165 170 175
Ser Asp Val Trp Ser Phe Gly Ile Leu Leu Thr Glu Leu Thr Thr Lys
180 185 190
Gly Arg Val Pro Tyr Pro Gly Met Val Asn Arg Glu Val Leu Asp Gln
195 200 205
Val Glu Arg Gly Tyr Arg Met Pro Cys Pro Pro Glu Cys Pro Glu Ser
210 215 220
Leu His Asp Leu Met Cys Gln Cys Trp Arg Lys Glu Pro Glu Glu Arg
225 230 235 240
Pro Thr Phe Glu Tyr Leu Gln Ala Phe Leu Glu Asp Tyr Phe
245 250

Claims (90)

1.一种转化细胞,包括:
基因组整合的核酸序列,其编码能够被异双功能性化合物结合的异双功能性化合物靶向蛋白;
其中该dTAG包括衍生自EGFR、BCR-ABL、ALK、JAK2、BRAF、Src、LRRK2、PDGFRα或RET的氨基酸序列;
其中该编码dTAG的核酸序列与编码内源性蛋白质的基因的核酸序列以5'或3'方向基因组框内整合;
其中该编码内源性蛋白质的基因的表达产生内源性蛋白质-dTAG杂合蛋白;
其中该异双功能性化合物能够a)通过该dTAG结合该内源性蛋白质-dTAG杂合蛋白和b)以使该内源性蛋白质-dTAG杂合蛋白接近泛素连接酶的方式结合该泛素连接酶;
其中该内源性蛋白质-dTAG杂合蛋白经泛素化,然后被蛋白酶体降解。
2.如权利要求1所述的转化细胞,其中该细胞是人类细胞。
3.如权利要求2所述的转化细胞,其中该人类细胞是肝细胞。
4.如权利要求1至3中任一者所述的转化细胞,其中该异双功能性化合物靶向蛋白包括来自非内源性蛋白质的氨基酸序列。
5.如权利要求1至4中任一者所述的转化细胞,其中该异双功能性化合物靶向蛋白包含选自SEQ.ID.NO.:53至63的氨基酸序列。
6.如权利要求1至4中任一项所述的转化细胞,其中该异双功能性化合物靶向蛋白是衍生自EGFR的氨基酸序列。
7.如权利要求6所述的转化细胞,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:53的氨基酸序列。
8.如权利要求6所述的转化细胞,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:54的氨基酸序列。
9.如权利要求6所述的转化细胞,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:55的氨基酸序列。
10.如权利要求6所述的转化细胞,其中异双功能性化合物靶向蛋白是SEQ.ID.NO.:56的氨基酸序列。
11.如权利要求1至4中任一者所述的的转化细胞,其中该异双功能性化合物靶向蛋白是衍生自BCR-ABL的氨基酸序列。
12.如权利要求11所述的转化细胞,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:57的氨基酸序列。
13.如权利要求11所述的转化细胞,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:58的氨基酸序列。
14.如权利要求1至4中任一者所述的转化细胞,其中该异双功能性化合物靶向蛋白是衍生自ALK的氨基酸序列。
15.如权利要求14所述的转化细胞,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:59的氨基酸序列。
16.如权利要求1至4中任一者所述的转化细胞,其中该异双功能性化合物靶向蛋白是衍生自JAK2的氨基酸序列。
17.如权利要求16所述的转化细胞,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:60的氨基酸序列。
18.如权利要求1至4中任一者所述的转化细胞,其中该异双功能性化合物靶向蛋白是衍生自BRAF的氨基酸序列。
19.如权利要求18所述的转化细胞,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:61的氨基酸序列。
20.如权利要求1至4中任一者所述的转化细胞,其中该异双功能性化合物靶向蛋白是衍生自Src的氨基酸序列。
21.如权利要求20所述的转化细胞,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:62的氨基酸序列。
22.如权利要求20所述的转化细胞,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:63的氨基酸序列。
23.如权利要求1至4中任一者所述的转化细胞,其中该异双功能性化合物靶向蛋白是衍生自LKKR2的氨基酸序列。
24.如权利要求1至4中任一者所述的转化细胞,其中该异双功能性化合物靶向蛋白是衍生自PDGFRα的氨基酸序列。
25.如权利要求1至4中任一者所述的转化细胞,其中该异双功能性化合物靶向蛋白是衍生自RET的氨基酸序列。
26.如权利要求1至25中任一者所述的转化细胞,其中该编码异双功能性化合物靶向蛋白的核酸序列框内***编码与疾病相关的内源性蛋白质的基因,该疾病是功能获得性突变的结果、扩增或增加的表达、单基因疾病、蛋白病或其组合。
27.如权利要求1至26中任一者所述的转化细胞,还包括编码CRISPR RNA引导的内切核酸酶的核酸序列。
28.如权利要求27所述的转化细胞,其中该CRISPR RNA引导的内切核酸酶选自Cas1、Cas IB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cpf1。
29.如权利要求28所述的转化细胞,其中该核酸编码包含SEQ.ID.NO.:52的氨基酸序列的Cas9内切核酸酶。
30.如权利要求1至29中任一者所述的转化细胞,其中该异双功能性化合物靶向蛋白基本上不干扰内源性表达蛋白质的功能。
31.一种调节受试者中基因表达的方法,包括:
向该受试者给药有效量的异双功能性化合物;
其中该受试者具有一个或多个转化细胞,该转化细胞已经用编码异双功能性化合物靶向蛋白(dTAG)的核酸序列转化;
其中该dTAG包括衍生自EGFR、BCR-ABL、ALK、JAK2、BRAF、Src、LRRK2、PDGFRα或RET的氨基酸序列;
其中该编码dTAG的核酸序列与与疾病相关的内源性蛋白质的核酸序列以5'或3'方向基因组框内整合;
其中该编码dTAG的核酸序列***基因组序列中,造成在表达时产生内源性蛋白质-dTAG杂合蛋白;
其中该异双功能性化合物能够a)通过该dTAG结合该内源性蛋白质-dTAG杂合蛋白和b)以使该内源性蛋白质-dTAG杂合蛋白接近泛素连接酶的方式结合该泛素连接酶,其中该内源性蛋白质-dTAG杂合蛋白经泛素化,然后被蛋白酶体降解。
32.如权利要求31所述的方法,其中该细胞是人类细胞。
33.如权利要求32所述的方法,其中该人类细胞是肝细胞。
34.如权利要求31至33中任一项所述的方法,其中该异双功能性化合物靶向蛋白包括来自非内源性蛋白质的氨基酸序列。
35.如权利要求31至34中任一者所述的方法,其中该异双功能性化合物靶向蛋白包括选自SEQ.ID.NO.:53至63的氨基酸序列。
36.如权利要求31至34中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自EGFR的氨基酸序列。
37.如权利要求36所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:53的氨基酸序列。
38.如如权利要求36所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:54的氨基酸序列。
39.如权利要求36所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:55的氨基酸序列。
40.如权利要求36所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:56的氨基酸序列。
41.如权利要求31-34中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自BCR-ABL的氨基酸序列。
42.如权利要求41所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:57的氨基酸序列。
43.如权利要求41所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:58的氨基酸序列。
44.如权利要求31至34中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自ALK的氨基酸序列。
45.如权利要求44所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:59的氨基酸序列。
46.如权利要求31至34中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自JAK2的氨基酸序列。
47.如权利要求46所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:60的氨基酸序列。
48.如权利要求31至34中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自BRAF的氨基酸序列。
49.如权利要求48所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:61的氨基酸序列。
50.如权利要求31至34中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自Src的氨基酸序列。
51.如权利要求50所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:62的氨基酸序列。
52.如权利要求50所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:63的氨基酸序列。
53.如权利要求31至34中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自LKKR2的氨基酸序列。
54.如权利要求31至34中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自PDGFRα的氨基酸序列。
55.如权利要求31至34中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自RET的氨基酸序列。
56.如权利要求31至55中任一者所述的方法,其中该编码异双功能性化合物靶向蛋白的核酸序列框内***编码与疾病相关的内源性蛋白质的基因,该疾病是功能获得性突变的结果、扩增或增加的表达、单基因疾病、蛋白病或其组合。
57.如权利要求31至56中任一者所述的方法,还包含编码CRISPR RNA引导的内切核酸酶的核酸序列。
58.如权利要求57所述的方法,其中该CRISPR RNA引导的内切核酸酶选自Cas1、CasIB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cpf1。
59.如如利要求58所述的方法,其中该核酸编码包含SEQ.ID.NO.:52的氨基酸序列的Cas9内切核酸酶。
60.如权利要求31至59中任一者所述的方法,其中该异双功能性化合物靶向蛋白基本上不干扰内源性表达蛋白质的功能。
61.一种减少受试者中基因过表达的方法,包括:
向该受试者给药有效量的异双功能性化合物;
其中该受试者具有一个或多个转化细胞,该转化细胞已经用编码异双功能性化合物靶向蛋白(dTAG)的核酸序列转化;
其中该dTAG包括衍生自EGFR、BCR-ABL、ALK、JAK2、BRAF、Src、LRRK2、PDGFRα或RET的氨基酸序列;
其中该编码dTAG的核酸序列与因蛋白质的过表达而与疾病相关的内源性蛋白质的核酸序列以5'或3'方向基因组框内整合;
其中该编码dTAG的核酸序列***基因组序列中,造成在表达时产生内源性蛋白质-dTAG杂合蛋白;
其中该异双功能性化合物能够a)通过该dTAG结合该内源性蛋白质-dTAG杂合蛋白和b)以使该内源性蛋白质-dTAG杂合蛋白接近泛素连接酶的方式结合该泛素连接酶,其中该内源性蛋白质-dTAG杂合蛋白经泛素化,然后被蛋白酶体降解。
62.如权利要求61所述的方法,其中该细胞是人类细胞。
63.如权利要求62所述的方法,其中该人类细胞是肝细胞。
64.如权利要求61至63中任一者所述的方法,其中该异双功能性化合物靶向蛋白包括来自非内源性蛋白质的氨基酸序列。
65.如权利要求61至64中任一者所述的方法,其中该异双功能性化合物靶向蛋白包括选自SEQ.ID.NO.:53至63的氨基酸序列。
66.如权利要求61至64中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自EGFR的氨基酸序列。
67.如权利要求66所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:53的氨基酸序列。
68.如权利要求66所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:54的氨基酸序列。
69.如权利要求66所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:55的氨基酸序列。
70.如权利要求66所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:56的氨基酸序列。
71.如权利要求61至64中任一项的方法,其中该异双功能性化合物靶向蛋白是衍生自BCR-ABL的氨基酸序列。
72.如权利要求71所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:57的氨基酸序列。
73.如权利要求71所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:58的氨基酸序列。
74.如权利要求61至64中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自ALK的氨基酸序列。
75.如权利要求74所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:59的氨基酸序列。
76.如权利要求61至64中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自JAK2的氨基酸序列。
77.如权利要求76所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:60的氨基酸序列。
78.如权利要求61至64中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自BRAF的氨基酸序列。
79.如权利要求78所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:61的氨基酸序列。
80.如权利要求61至64中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自Src的氨基酸序列。
81.如权利要求80所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:62的氨基酸序列。
82.如权利要求80所述的方法,其中该异双功能性化合物靶向蛋白是SEQ.ID.NO.:63的氨基酸序列。
83.如权利要求61至64中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自LKKR2的氨基酸序列。
84.如权利要求61至64中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自PDGFRα的氨基酸序列。
85.如权利要求61至64中任一者所述的方法,其中该异双功能性化合物靶向蛋白是衍生自RET的氨基酸序列。
86.如权利要求61至85中任一者所述的方法,其中该编码异双功能性化合物靶向蛋白的核酸序列框内***编码与疾病相关的内源性蛋白质的基因,该疾病是功能获得性突变的结果、扩增或增加的表达、单基因疾病、蛋白病或其组合。
87.如权利要求31至56中任一者所述的方法,还包含编码CRISPR RNA引导的内切核酸酶的核酸序列。
88.如权利要求87所述的方法,其中CRISPR RNA引导的内切核酸酶选自Cas1、Cas IB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cpf1。
89.如权利要求88所述的方法,其中该核酸编码包含SEQ.ID.NO.:52的氨基酸序列的Cas9内切核酸酶。
90.如权利要求61至89中任一者所述的方法,其中该异双功能性化合物靶向蛋白实质上不干扰内源性表达的蛋白质的功能。
CN201880024547.1A 2017-02-08 2018-02-08 用异双功能性化合物进行的可调节的内源性蛋白质降解 Pending CN110621322A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762456654P 2017-02-08 2017-02-08
US62/456,654 2017-02-08
US201762457127P 2017-02-09 2017-02-09
US62/457,127 2017-02-09
PCT/US2018/017468 WO2018148443A1 (en) 2017-02-08 2018-02-08 Tunable endogenous protein degradation with heterobifunctional compounds

Publications (1)

Publication Number Publication Date
CN110621322A true CN110621322A (zh) 2019-12-27

Family

ID=63107040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880024547.1A Pending CN110621322A (zh) 2017-02-08 2018-02-08 用异双功能性化合物进行的可调节的内源性蛋白质降解

Country Status (7)

Country Link
US (1) US20190374657A1 (zh)
EP (1) EP3579847A4 (zh)
JP (1) JP7273713B2 (zh)
CN (1) CN110621322A (zh)
AU (1) AU2018219292A1 (zh)
CA (1) CA3053008A1 (zh)
WO (1) WO2018148443A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111549000A (zh) * 2020-06-18 2020-08-18 中国医学科学院整形外科医院 一种过表达Hpgds的重组脂肪干细胞、制备方法及其应用
CN111606969A (zh) * 2020-05-13 2020-09-01 四川大学 一种parp1蛋白降解剂及其在抗肿瘤中的应用
CN112266404A (zh) * 2020-10-28 2021-01-26 北京大学深圳研究生院 选择性修饰靶标蛋白的基团转移方法及其应用
CN112662676A (zh) * 2020-12-30 2021-04-16 南方科技大学 一种dna编码靶向水解蛋白的多肽或者蛋白的方法
CN113735828A (zh) * 2021-09-07 2021-12-03 南方医科大学 一种靶向降解egfr的化合物及其制备方法和应用
CN114748479A (zh) * 2021-01-08 2022-07-15 轩竹生物科技股份有限公司 一种预防和/或治疗癌症的药物组合物
CN115605267A (zh) * 2020-03-21 2023-01-13 阿维纳斯企业公司(Us) 突变体lrrk2蛋白水解的选择性调节剂和相关使用方法
CN115697990A (zh) * 2020-03-21 2023-02-03 阿维纳斯企业公司 基于吲唑的化合物和相关使用方法
CN116082308A (zh) * 2023-01-03 2023-05-09 合肥综合性国家科学中心大健康研究院 一种降解剂及其制备方法和应用

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010045659A1 (en) 2008-10-17 2010-04-22 American Gene Technologies International Inc. Safe lentiviral vectors for targeted delivery of multiple therapeutic molecules
WO2017007994A1 (en) 2015-07-08 2017-01-12 American Gene Technologies International Inc. Hiv pre-immunization and immunotherapy
CN111569090A (zh) 2016-01-15 2020-08-25 美国基因技术国际有限公司 用于活化γ-δ T细胞的方法和组合物
US10137144B2 (en) 2016-01-15 2018-11-27 American Gene Technologies International Inc. Methods and compositions for the activation of gamma-delta T-cells
JP7153332B2 (ja) 2016-02-08 2022-10-14 アメリカン ジーン テクノロジーズ インターナショナル インコーポレイテッド Hivワクチン接種および免疫療法
JP7017247B2 (ja) 2016-03-09 2022-02-08 アメリカン ジーン テクノロジーズ インターナショナル インコーポレイテッド がんを処置するための組み合わせベクターおよび方法
WO2017213697A1 (en) 2016-06-08 2017-12-14 American Gene Technologies International Inc. Non-integrating viral delivery system and methods related thereto
JP6971492B2 (ja) 2016-07-08 2021-11-24 アメリカン ジーン テクノロジーズ インターナショナル インコーポレイテッド Hiv予備免疫化および免疫療法
JP7176756B2 (ja) 2016-07-21 2022-11-22 アメリカン ジーン テクノロジーズ インターナショナル インコーポレイテッド パーキンソン病を処置するためのウイルスベクター
EP3607072A4 (en) 2017-04-03 2021-01-06 American Gene Technologies International Inc. COMPOSITIONS AND METHODS OF TREATMENT OF PHENYLCETONURISM
US11999802B2 (en) 2017-10-18 2024-06-04 Novartis Ag Compositions and methods for selective protein degradation
JPWO2020027225A1 (ja) 2018-07-31 2021-11-11 ファイメクス株式会社 複素環化合物
WO2020077278A1 (en) 2018-10-12 2020-04-16 The Scripps Research Institute Compounds and methods for dcaf-mediated protein degradation
US20210361774A1 (en) * 2018-10-16 2021-11-25 Dana-Farber Cancer Institute, Inc. Degraders of wild-type and mutant forms of lrrk2
US11352646B2 (en) 2018-11-05 2022-06-07 American Gene Technologies International Inc. Vector system for expressing regulatory RNA
EP3883580A4 (en) * 2018-11-21 2023-01-04 Foghorn Therapeutics Inc. METHODS OF TREATMENT OF CANCER
AU2020205952A1 (en) * 2019-01-07 2021-06-17 Dana-Farber Cancer Institute, Inc Small molecule degraders of FKBP12 via recruitment of Von Hippel-Lindau E3 ubiquitin ligase (VHL) E3 ubiquitin ligase, and uses in dTAG systems
WO2020150702A1 (en) * 2019-01-18 2020-07-23 University Of Southern California Methods and compositions to improve the safety and efficacy of cellular therapies
AU2020356484A1 (en) * 2019-09-27 2022-03-17 Dana-Farber Cancer Institute, Inc. ERK5 degraders as therapeutics in cancer and inflammatory diseases
US20230201172A1 (en) * 2020-05-27 2023-06-29 Ariel Precision Medicine, Inc. Methods of treating cftr related diseases and disorders
WO2022152821A1 (en) 2021-01-13 2022-07-21 Monte Rosa Therapeutics Ag Isoindolinone compounds
WO2022159687A1 (en) * 2021-01-22 2022-07-28 Dana-Farber Cancer Institute, Inc. Phenotypic assay to identify protein degraders
WO2022187650A1 (en) * 2021-03-04 2022-09-09 The Scripps Research Institute Heterobifunctional compositions for targeted protein degradation and methods for their use
WO2023283130A1 (en) 2021-07-04 2023-01-12 Newave Pharmaceutical Inc. Isoquinoline derivatives as mutant egfr modulators and uses thereof

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040072319A1 (en) * 2000-05-04 2004-04-15 Piers Nash Molecules that modulate ubiquintin-dependent proteolysis and methods for identifying same
US20160235730A1 (en) * 2014-12-23 2016-08-18 Dana-Farber Cancer Institute, Inc. Methods to induce targeted protein degradation through bifunctional molecules
WO2017007612A1 (en) * 2015-07-07 2017-01-12 Dana-Farber Cancer Institute, Inc. Methods to induce targeted protein degradation through bifunctional molecules
CN108350062A (zh) * 2015-08-06 2018-07-31 达纳-法伯癌症研究所股份有限公司 靶向蛋白降解以减弱过继性t细胞疗法相关的不良炎症反应

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103502275A (zh) * 2010-12-07 2014-01-08 耶鲁大学 融合蛋白的小分子疏水性标记和引起的其降解
EP3608317A1 (en) * 2012-01-12 2020-02-12 Yale University Compounds & methods for the enhanced degradation of targeted proteins & other polypeptides by an e3 ubiquitin ligase
EP3256470B1 (en) * 2014-12-23 2023-07-26 Dana-Farber Cancer Institute, Inc. Methods to induce targeted protein degradation through bifunctional molecules
EP3302572B8 (en) * 2015-06-04 2021-03-24 Arvinas Operations, Inc. Imide-based modulators of proteolysis and associated methods of use
EP4159856A1 (en) * 2015-06-18 2023-04-05 The Broad Institute, Inc. Novel crispr enzymes and systems
CA3021358A1 (en) * 2016-04-22 2017-10-26 Dana-Farber Cancer Institute, Inc. Bifunctional molecules for degradation of egfr and methods of use

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040072319A1 (en) * 2000-05-04 2004-04-15 Piers Nash Molecules that modulate ubiquintin-dependent proteolysis and methods for identifying same
US20160235730A1 (en) * 2014-12-23 2016-08-18 Dana-Farber Cancer Institute, Inc. Methods to induce targeted protein degradation through bifunctional molecules
WO2017007612A1 (en) * 2015-07-07 2017-01-12 Dana-Farber Cancer Institute, Inc. Methods to induce targeted protein degradation through bifunctional molecules
CN108350062A (zh) * 2015-08-06 2018-07-31 达纳-法伯癌症研究所股份有限公司 靶向蛋白降解以减弱过继性t细胞疗法相关的不良炎症反应

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115605267A (zh) * 2020-03-21 2023-01-13 阿维纳斯企业公司(Us) 突变体lrrk2蛋白水解的选择性调节剂和相关使用方法
CN115697990A (zh) * 2020-03-21 2023-02-03 阿维纳斯企业公司 基于吲唑的化合物和相关使用方法
CN111606969A (zh) * 2020-05-13 2020-09-01 四川大学 一种parp1蛋白降解剂及其在抗肿瘤中的应用
CN111549000A (zh) * 2020-06-18 2020-08-18 中国医学科学院整形外科医院 一种过表达Hpgds的重组脂肪干细胞、制备方法及其应用
CN112266404A (zh) * 2020-10-28 2021-01-26 北京大学深圳研究生院 选择性修饰靶标蛋白的基团转移方法及其应用
CN112662676A (zh) * 2020-12-30 2021-04-16 南方科技大学 一种dna编码靶向水解蛋白的多肽或者蛋白的方法
CN112662676B (zh) * 2020-12-30 2023-12-29 南方科技大学 一种dna编码靶向水解蛋白的多肽或者蛋白的方法
CN114748479A (zh) * 2021-01-08 2022-07-15 轩竹生物科技股份有限公司 一种预防和/或治疗癌症的药物组合物
CN114748479B (zh) * 2021-01-08 2023-10-20 轩竹生物科技股份有限公司 一种预防和/或治疗癌症的药物组合物
CN113735828A (zh) * 2021-09-07 2021-12-03 南方医科大学 一种靶向降解egfr的化合物及其制备方法和应用
CN116082308A (zh) * 2023-01-03 2023-05-09 合肥综合性国家科学中心大健康研究院 一种降解剂及其制备方法和应用
CN116082308B (zh) * 2023-01-03 2023-12-22 合肥综合性国家科学中心大健康研究院 一种降解剂及其制备方法和应用

Also Published As

Publication number Publication date
JP2020513789A (ja) 2020-05-21
JP7273713B2 (ja) 2023-05-15
WO2018148443A1 (en) 2018-08-16
US20190374657A1 (en) 2019-12-12
EP3579847A4 (en) 2020-12-09
AU2018219292A1 (en) 2019-09-12
EP3579847A1 (en) 2019-12-18
CA3053008A1 (en) 2018-08-16

Similar Documents

Publication Publication Date Title
CN110621322A (zh) 用异双功能性化合物进行的可调节的内源性蛋白质降解
US20220135967A1 (en) Tunable endogenous protein degradation
US9574211B2 (en) Methods and compositions for prevention or treatment of a disease
JP2021502078A (ja) ACE−tRNAによる遺伝子再割り当てを介して終止コドンをレスキューする方法
Strobel et al. A small-molecule-responsive riboswitch enables conditional induction of viral vector-mediated gene expression in mice
CN113164495A (zh) E3连接酶的共价靶向
CN115209953A (zh) 减轻缺血再灌注损伤的合成物和方法
TWI825057B (zh) 標的基因改變用組成物
WO2020132039A2 (en) Peptide tags for ligand induced degradation of fusion proteins
AU2021296165A1 (en) Protein tag to induce ligand dependent degradation of protein/protein-fusions
US20150197729A1 (en) Compositions and Methods for Regulating Cytochrome c-Mediated Apoptosis by tRNA
Yan et al. Inflammation causes insulin resistance via interferon regulatory factor 3 (IRF3)-mediated reduction in FAHFA levels
US20200188431A1 (en) Glutamine dehydrogenase inhibitors for use in muscle regeneration
Romanelli CRISPR/Cas9 Inducible Gene Knockout in Brown Adipose Tissue
JP2024504632A (ja) 非アルコール性脂肪肝疾患および関連する疾患または障害を処置または改善するための化合物、組成物および方法
WO2023122716A1 (en) Next generation transpososomes
WO2024121363A1 (en) Variants of sirtuin 6 for the treatment of non-alcoholic fatty liver disease
CN117355334A (zh) 靶向PAX6信号通路以减少β淀粉样蛋白斑块和神经原纤维缠结的形成的组合物和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination