CN116669774A - 用于治疗法布里病的组合物和方法 - Google Patents

用于治疗法布里病的组合物和方法 Download PDF

Info

Publication number
CN116669774A
CN116669774A CN202180081451.0A CN202180081451A CN116669774A CN 116669774 A CN116669774 A CN 116669774A CN 202180081451 A CN202180081451 A CN 202180081451A CN 116669774 A CN116669774 A CN 116669774A
Authority
CN
China
Prior art keywords
hgla
gla
sequence
seq
mice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180081451.0A
Other languages
English (en)
Inventor
J·奥尔多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Pennsylvania Penn
Original Assignee
University of Pennsylvania Penn
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Pennsylvania Penn filed Critical University of Pennsylvania Penn
Priority claimed from PCT/US2021/054145 external-priority patent/WO2022076803A1/en
Publication of CN116669774A publication Critical patent/CN116669774A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本文提供了编码功能性人α‑半乳糖苷酶A(hGLA)的多核苷酸序列和含有这些编码序列的表达盒。还提供了载体,如具有载体基因组的重组腺相关病毒(rAAV)载体,所述载体基因组包括与一个或多个调节序列可操作地连接的hGLA编码序列。此外,提供了含有这些表达盒和rAAV的组合物,以及使用这些组合物治疗法布里病的方法。

Description

用于治疗法布里病的组合物和方法
背景技术
法布里病(Fabry disease)是一种X连锁溶酶体病症,是由负责酰基鞘鞍醇三己糖(GL-3或Gb3)分解的酶α-半乳糖苷酶A(GLA)的基因突变引起的。GLA的缺乏导致GL-3和相关的鞘糖脂在全身血管、神经、组织和器官的血浆和细胞溶酶体中积累。这种病症是一种全身性疾病,表现为进行性肾衰竭、心脏病、脑血管疾病、小纤维周围神经病和皮肤病变等异常。导致α-半乳糖苷酶A活性缺失的GLA基因突变导致典型的、严重形式的法布里病。降低但小消除酶活性的突变通常会导致通常仅影响心脏或肾脏的更温和的迟发型法布里病。
目前,法布里病的标准治疗包括酶替代疗法和治疗和预防疾病的其它症状的药物。在发生肾衰竭的严重病例中可能需要肾移植。
本领域需要用于安全有效治疗法布里病患者的组合物和方法。
发明内容
在一个方面,本文提供了包含其中包装有载体基因组的AAVhu68衣壳的重组AAV(rAAV),其中载体基因组包含功能性人α-半乳糖苷酶A(hGLA)的编码序列和指导hGLA在靶细胞中表达的调节序列,其中编码序列包含SEQ ID NO:4的核苷酸94至1287,或与其至少85%相同的序列,并且其中hGLA在位置233和/或位置359处具有半胱氨酸残基。在某些实施例中,hGLA至少包含SEQ ID NO:2的氨基酸32至429,或与其至少95%相同的序列。在某些实施例中,hGLA包含SEQ ID NO:7的氨基酸32至429。在某些实施例中,其中hGLA包含天然信号肽。在其它实施例中,hGLA包含异源信号肽。在某些实施例中,hGLA包含SEQ ID NO:17的全长(氨基酸1至429),或与其至少95%相同的序列。在某些实施例中,载体基因组包含组织特异性启动子。在某些实施例中,调节序列包含CB7启动子、内含子和polyA。在某些实施例中,调节序列包含土拨鼠肝炎病毒转录后调节元件(WPRE)。在某些实施例中,载体基因组包含一个或多个miRNA靶序列。
在一个方面,本文提供了包含编码功能性人α-半乳糖苷酶A(hGLA)的核酸序列和指导hGLA在含有表达盒的靶细胞中表达的一个或多个调节序列的表达盒,其中核酸序列包含SEQ ID NO:4的核苷酸94至1287,或与其至少85%相同的序列,并且其中hGLA在位置233和/或位置359处具有半胱氨酸残基。在某些实施例中,hGLA包含SEQ ID NO:7的氨基酸32至429。在某些实施例中,hGLA包含天然信号肽。在其它实施例中,hGLA包含异源信号肽。在某些实施例中,hGLA包含SEQ ID NO:7的全长(氨基酸1至429),或与其至少95%相同的序列。在某些实施例中,根据权利要求12至16中任一项所述的表达盒,其中表达盒包含组织特异性启动子。在某些实施例中,调节序列包含CB7启动子、内含子和polyA。在某些实施例中,调节序列包含土拨鼠肝炎病毒转录后调节元件(WPRE)。在某些实施例中,表达盒包含一个或多个miRNA靶序列。
在一个方面,本文提供了包含表达盒和一个或多个调节序列的质粒,该表达盒包含编码功能性人α-半乳糖苷酶A(hGLA)的核酸序列,该调节序列指导hGLA在含有表达盒的靶细胞中表达,其中核酸序列包含SEQ ID NO:4的核苷酸94至1287,或与其至少85%相同的序列,并且其中hGLA在位置233和/或位置359处具有半胱氨酸残基。在某些实施例中,表达盒的侧翼为AAV 5′ITR和AAV 3′ITR。在进一步的实施例中,提供了含有表达盒或质粒的宿主细胞。
在又一方面,提供了包含rAAV或包含编码功能性人α-半乳糖苷酶A(hGLA)的核酸序列的表达盒的药物组合物。
在另一方面,提供了治疗诊断为GLA缺乏症(法布里病)的人类受试者的方法,其包含向受试者施用药物组合物,该药物组合物包含rAAV或具有编码功能性人α-半乳糖苷酶A(hGLA)的序列的表达盒。在另一方面,提供了用于治疗GLA缺乏症(法布里病)的rAAV、表达盒和药物组合物。
根据下文对本发明的详细描述,本发明的其它方面和优点将变得显而易见。
附图说明
图1示出了CB7.CI.hGLAco(D233C_1359C).WPRE.rBG载体基因组(SEQ ID NO:6)的图谱。
图2示出了CB7.CI.hGLAnat.WPRE.rBG载体基因组(SEQ ID NO:10)的图谱。
图3示出了TBG.PI.hGLAnat.WPRE.bGH载体基因组(SEQ ID NO:8)的图谱。
图4示出了CB7.CI.hGLAco.WPRE.rBG载体基因组(SEQ ID NO:14)的图谱。
图5示出了TBG.PI.hGLAco.WPRE.bGH载体基因组(SEQ ID NO:12)的图谱。
图6示出了CB7.CI.hGLAco(M51C_G360C).WPRE.rBG载体基因组(SEQ ID NO:18)的图谱。
图7示出了TBG.PI.hGLAco(M51C_G360C).WPRE.bGII载体基因组(SEQ ID NO:16)的图谱。
图8A和8B示出了hGLAnat(SEQ ID NO:1)、hGLAco(SEQ ID NO:3)、hGLAco(M51C_G360C)(SEQ ID NO:5)、hGLA(D233C_I359C)(SEQ ID NO:4)的核苷酸序列比对。
图9示出了hGLAnat(SEQ ID NO:2)、hGLAco(SEQ ID NO:13)、hGLAco(M51C_G360C)(SEQ ID NO:17)、hGLA(D233C_I359C)(SEQ ID NO:7)的氨基酸序列比对。
图10A和图10B示出了未处理的雄性和雌性对照、Gla KO、WT/TgG3S和Gla KO/TgG3S小鼠的体重。年龄匹配的对照(WT雄性和Gla HET雌性)、Gla KO、WT/TgG3S和Gla KO/TgG3S小鼠保持未处理以评估这些模型的自然史。记录雄性(图10A)和雌性(图10B)小鼠在6周龄、12周龄、18周龄、25周龄、30周龄和35周龄的体重。给出了平均体重。误差条代表标准偏差。缩写:Gla,α-半乳糖苷酶A;TgG3S,人Gb3合酶-转基因的。
图11A和图11B示出了未处理的雄性和雌性对照、Gla KO、WT/TgG3S和Gla KO/TgG3S小鼠的热板应答潜伏期。年龄匹配的对照(WT雄性和Gla HET雌性)、GlaKO、WT/TgG3S和Gla KO/TgG3S小鼠保持未处理以评估这些模型的自然史。在第6周、第12周、第18周、第25周、第30周和第35周时使用热板测定将每个小鼠模型中对热刺激的敏感性记录为应答潜伏期(秒)。数据表示为雄性(图11A)和雌性(图11B)小鼠在各个时间点的平均记录。误差条代表平均值的标准误差。
图12A和图12B示出了未处理的雄性和雌性对照、Gla KO、WT/TgG3S和Gla KO/TgG3S小鼠的血尿素氮(BUN)浓度。年龄匹配的对照(WT雄性和Gla HET雌性)、Gla KO、WT/TgG3S和Gla KO/TgG3S小鼠保持未处理以评估这些模型的自然史。在第6周、第12周、第18周、第25周、第30周和第35周时记录血尿素氮浓度(mg/dL)。数据表示为雄性(图12A)和雌性(图12B)小鼠在各个时间点的平均记录。误差条代表平均值的标准误差。
图13A和图13B示出了雄性和雌性对照、Gla KO、TgG3S和Gla KO/TgG3S小鼠测量的尿渗透压。年龄匹配的对照(WT雄性和Gla HET雌性)、Gla KO、WT/TgG3S和Gla KO/TgG3S小鼠保持未处理以评估这些模型的自然史。在第25周、第30周和第35周时测量尿渗透压(mOsm/kg)。数据表示为雄性(图13A)和雌性(图13B)小鼠在各个时间点的平均记录。误差条代表平均值的标准误差。
图14A和图14B示出了GL-3在雄性Gla KO、WT/TgG3S和Gla KO/TgG3S的肾脏中的储存。年龄匹配的对照(WT雄性和Gla HET雌性)、Gla KO、WT/TgG3S、Gla KO/TgG3S小鼠保持未处理以评估这些模型的自然史。尸检时采集肾脏和心脏,并用识别GL-3的抗体(深色沉淀)和核复染剂染色。(图14A)示出了来自雄性小鼠的代表性IHC图像。肾脏图像中的箭头表示肾小球中的储存材料。虚线圆圈区域示出了仅在一些Gla KO/TgG3S小鼠中看到的间质单核炎症(肾炎)的病灶。心脏图像中的箭头表示紧邻具有GL-3储存的心肌细胞的心肌细胞坏死和矿化。图14B是示出了使用免疫组织化学数据定量整个肾脏中GL-3储存(面积百分比)的柱状图。示出了雄性Gla KO、WT/TgG3S和Gla KO/TgG3S小鼠的结果。**p<0.01,基于将各组与WT/TgG3S对照进行比较的克鲁斯卡尔-沃利斯检验(Kruskal-Wallis test)。
图15A和图15B示出了GL-3在雄性Gla KO、WT/TgG3S和Gla KO/TgG3S的背根神经节(DRG)中的储存。年龄匹配的对照(WT雄性和Gla HET雌性)、Gla KO、WT/TgG3S、Gla KO/TgG3S小鼠保持未处理以评估这些模型的自然史。尸检时采集DRG,并用识别GL-3的抗体和核复染剂染色。(图15A)示出了来自雄性小鼠的代表性图像。图15B是示出了使用免疫组织化学数据定量DRG中GL-3储存(面积百分比)的柱状图。示出了雄性Gla KO、WT/TgG3S和GlaKO/TgG3S小鼠的结果。**p<0.01,基于将各组与WT/TgG3S对照进行比较的克鲁斯卡尔-沃利斯检验。
图16A至图16D示出了在Gla KO、TgG3S和Gla KO/TgG3S小鼠中通过LC-MS/MS对血浆中的lyso-Gb3和组织中的GL-3的定量。年龄匹配的对照(WT雄性和Gla HET雌性)、GlaKO、WT/TgG3S、Gla KO/TgG3S小鼠保持未处理以评估这些模型的自然史。尸检时采集肾脏、心脏和脑组织以及血浆。LC-MS/MS用于定量肾脏(图16A)、心脏(图16B)和脑组织(图16C)中的GL3或血浆中的lyso-Gb3(图16D)。对于每个图,雄性和雌性被分别绘制成图表,雌性的数据在底部。*p<0.05,**p<0.01克鲁斯卡尔-沃利斯检验。
图17示山了在施用对照(PBS)或三种AAVhu68.hGLA载体之一后,在第7天在Gla/小鼠的血清中测量的转基因产物表达(GLA酶活性)。以1x1011GC(5.0x1012GC/kg)或5x1011GC(2.5x1013GC/kg)的剂量向2至3月龄的雄性和雌性小鼠IV施用PBS(对照)或AAVhu68.hGLAnat、AAVhu68.hGLAco或AAVhu68.hGLAco(M51C_G360C)。在第1周收集血液用于血清分离,并分析GLA活性。左图示出了所有动物的汇总数据,右图和下图示出了按性别划分的结果。
图18示出了施用对照(PBS)或三种AAVhu68.hGLA载体之一后,在Gla-/-小鼠中测量的AAV基因组DNA的生物分布。以1x1011GC(5.0x1012GC/kg)或5x1011GC(2.5x1013GC/kg)的剂量向2至3月龄的雄性和雌性小鼠IV施用PBS(对照)或AAVhu68.hGLAnat、AAVhu68.hGLAco或AAVhu68.hGLAco(M51C_G360C)。尸检时收集肝脏样品,并分析载体分布。结果以相对于细胞基因组DNA量的转基因特异性序列的GC表示。
图19示出了施用三种AAVhu68.CB7.hGLA载体之一后28天,Gla KO小鼠心脏中的转基因产物表达(GLA酶活性)水平。以1x1011GC(5.0x1012GC/kg)或5x1011GC(2.5x1013GC/kg)的剂量向2至3月龄的雄性和雌性小鼠IV施用PBS(对照)或AAVhu68.hGLAnat(hGLA)、AAVhu68.hGLAco或AAVhu68.hGLAco(M51C_G360C)。尸检时收集心脏样品,并分析GLA活性水平。左图示出了所有动物的汇总数据,中图和右图示出了按性别划分的结果。
图20示出了施用三种AAVhu68.CB7.hGLA载体之一后28天,Gla KO小鼠肝脏中的转基因产物表达(GLA酶活性)。以1x1011GC(5.0x1012GC/kg)或5x1011GC(2.5x1013GC/kg)的剂量向2至3月龄的雄性和雌性小鼠IV施用PBS(对照)或AAVhu68.hGLAnat(hGLA)、AAVhu68.hGLAco或AAVhu68.hGLAco(M51C_G360C)。尸检时收集肝脏样品,并分析GLA活性水平。左图示出了所有动物的汇总数据,中图和右图示出了按性别划分的结果。
图21示出了施用三种AAVhu68.CB7.hGLA载体之一后28天,Gla KO小鼠肾脏中的转基因产物表达(GLA酶活性)。以1x1011GC(5.0x1012GC/kg)或5x1011GC(2.5x1013GC/kg)的剂量向2至3月龄的雄性和雌性小鼠IV施用PBS(对照)或AAVhu68.hGLAnat(hGLA)、AAVhu68.hGLAco或AAVhu68.hGLAco(M51C_G360C)。尸检时收集肾脏样品,并分析GLA活性水平。左图示出了所有动物的汇总数据,中图和右图示出了按性别划分的结果。
图22示出了施用三种AAVhu68.CB7.hGLA载体之一后28天,Gla KO小鼠脑中的转基因产物表达(GLA酶活性)。以1x1011GC(5.0x1012GC/kg)或5x1011GC(2.5x1013GC/kg)的剂量向2至3月龄的雄性和雌性小鼠IV施用PBS(对照)或AAVhu68.hGLAnat(hGLA)、AAVhu68.hGLAco或AAVhu68.hGLAco(M51C_G360C)。尸检时收集脑样品,并分析GLA活性水平。左图示出了所有动物的汇总数据,中图和右图示出了按性别划分的结果。
图23示出了施用三种AAVhu68.CB7.hGLA载体之一后28天,Gla KO小鼠小肠中的转基因产物表达(GLA酶活性)。以1x1011GC(5.0x1012GC/kg)或5x1011GC(2.5x1013GC/kg)的剂量向2至3月龄的雄性和雌性小鼠IV施用PBS(对照)或AAVhu68.hGLAna(hGLA)、AAVhu68.hGLAco或AAVhu68.hGLAco(M51C_G360C)。尸检时收集小肠样品,并分析GLA活性水平。上图示出了所有动物的汇总数据,中图和下图示出了按性别划分的结果。
图24示出了施用三种AAVhu68.CB7.hGLA载体之一后,在Gla KO小鼠血浆中的lyso-Gb3储存(三己糖酰基鞘脂醇)和心脏和肾脏组织中的GL-3储存。以1x1011GC(5.0x1012GC/kg)或5x1011GC(2.5x1013GC/kg)的剂量向2至3月龄的雄性和雌性小鼠IV施用PBS(对照)或AAVhu68.hGLAnat(hGLA)、AAVhu68.hGLAco或AAVhu68.hGLAco(M51C_G360C)。收集血浆并通过LC-MS/MS(上图)测量储存材料lyso-Gb3的量。尸检时收集肾脏和心脏样品,并分析GL-3储存水平(分别为中图和下图)。上图示出了所有动物的汇总数据,中图和下图示出了按性别划分的结果。
图25示出了施用AAV载体或媒介物后Gla KO小鼠血清中的转基因产物表达(GLA酶活性)。以2.5x1012GC/kg(低剂量LD)、5.0x1012GC/kg(中剂量;MD),或2.5x1013GC/kg(高剂量;HD,仅针对AAVhu68.hGLAco(D233C_I359C))的剂量向成年(3.5至4.5月龄)雄性和雌性Gla KO或WT小鼠IV施用AAVhu68.hGLAco(WTco)、AAVhu68.hGLAco(M51C_G360C)(AT#1)或AAVhu68.hGLAco(D233C_I359C)(AT#2)。另外的Gla KO或WT小鼠IV施用媒介物(PBS)作为对照。施用后7天收集血清样品,并分析转基因产物表达(GLA酶活性)。提供了所有动物的汇总数据以及按性别划分的数据。媒介物处理的WT和Gla KO小鼠的结果是历史数据并包括在内以供参考。来自WT和Gla KO小鼠样品的历史GLA酶活性值均低于可定量的限度,因此没有绘制数据点。HD,高剂量;LD,低剂量;MD,中剂量。
图26示出了施用AAV载体或媒介物后Gla KO小鼠血浆中的转基因产物表达(GLA酶活性)。以2.5x1012GC/kg(低剂量;LD)、5.0x1012GC/kg(中剂量;MD),或2.5x1013GC/kg(高剂量;HD,仅针对AAVhu68.hGLAco(D233C_I359C))的剂量向成年(3.5至4.5月龄)雄性和雌性Gla KO或WT小鼠IV施用AAVhu68.hGLAco(WTco)、AAVhu68.hGLAco(M51C_G360C)(AT#1)或AAVhu68.hGLAco(D233C_I359C)(AT#2)。另外的Gla KO或WT小鼠IV施用媒介物(PBS)作为对照。在注射后28天收集血浆样品并分析转基因产物表达(GLA酶活性)。上图示出了所有动物的汇总数据,中图和下图示出了按性别划分的结果。
图27示出了施用AAV载体或媒介物后Gla KO小鼠心脏中的转基因产物表达(GLA酶活性)。以2.5x1012GC/kg(低剂量;LD)、5.0x1012GC/kg(中剂量;MD),或2.5x1013GC/kg(高剂量;HD,仅针对AAVhu68.hGLAco(D233C_I359C))的剂量向成年(3.5至4.5月龄)雄性和雌性Gla KO或WT小鼠IV施用AAVhu68.hGLAco(WTco)、AAVhu68.hGLAco(M51C_G360C)(AT#1)或AAVhu68.hGLAco(D233C_I359C)(AT#2)。另外的Gla KO或WT小鼠IV施用媒介物(PBS)作为对照。尸检时收集心脏样品,并分析转基因产物表达(GLA酶活性)。上图示出了所有动物的汇总数据,中图和下图示出了按性别划分的结果。媒介物处理的WT和Gla KO小鼠的结果是历史数据并包括在内以供参考。来自WT和Gla KO小鼠样品的历史GLA酶活性值均低于可定量的限度,因此没有绘制数据点。
图28示出了施用AAV载体或媒介物后Gla KO小鼠肝脏中的转基因产物表达(GLA酶活性)。以2.5x1012GC/kg(低剂量;LD)、5.0x1012GC/kg(中剂量;MD),或2.5x1013GC/kg(高剂量;HD,仅针对AAVhu68.hGLAco(D233C_I359C))的剂量向成年(3.5至4.5月龄)雄性和雌性Gla KO或WT小鼠IV施用AAVhu68.hGLAco(WTco)、AAVhu68.hGLAco(M51C_G360C)(AT#1)或AAVhu68.hGLAco(D233C_I359C)(AT#2)。另外的Gla KO或WT小鼠IV施用媒介物(PBS)作为对照。尸检时收集肝脏样品,并分析转基因产物表达(GLA酶活性)。上图示出了所有动物的汇总数据,中图和下图示出了按性别划分的结果。媒介物处理的WT和Gla KO小鼠的结果是历史数据并包括在内以供参考。来自WT和Gla KO小鼠样品的历史GLA酶活性值均低于可定量的限度,因此没有绘制数据点。
图29示出了施用AAV载体或媒介物后Gla KO小鼠肾脏中的转基因产物表达(GLA酶活性)。以2.5x1012GC/kg(低剂量;LD)、5.0x1012GC/kg(中剂量;MD),或2.5x1013GC/kg(高剂量;HD,仅针对AAVhu68.hGLAco(D233C_1359C))的剂量向成年(3.5至4.5月龄)雄性和雌性Gla KO或WT小鼠IV施用AAVhu68.hGLAco(WTco)、AAVhu68.hGLAco(M51C_G360C)(AT#1)或AAVhu68.hGLAco(D233C_I359C)(AT#2)。另外的Gla KO或WT小鼠IV施用媒介物(PBS)作为对照。尸检时收集肾脏样品,并分析转基因产物表达(GLA酶活性)。上图示山了所有动物的汇总数据,中图和下图示出了按性别划分的结果。媒介物处理的WT和Gla KO小鼠的结果是历史数据并包括在内以供参考。来自WT和Gla KO小鼠样品的历史GLA酶活性值均低于可定量的限度,因此没有绘制数据点。
图30示出了在施用AAV载体或媒介物后收集自Gla KO小鼠的血浆中的lyso-Gb3(三己糖酰基鞘脂醇)储存。以2.5x1012GC/kg(低剂量;LD)、5.0x1012GC/kg(中剂量;MD),或2.5x1013GC/kg(高剂量;HD,仅针对AAVhu68.hGLAco(D233C_I359C))的剂量向成年(3.5至4.5月龄)雄性和雌性Gla KO或WT小鼠IV施用AAVhu68.hGLAco(WTco)、AAVhu68.hGLAco(M51C_G360C)(AT#1)或AAVhu68.hGLAco(D233C_I359C)(AT#2)。另外的Gla KO或WT小鼠IV施用媒介物(PBS)作为对照。在施用后28天进行尸检时收集血浆样品,并分析lyso-Gb3储存水平。上图示出了所有动物的汇总数据,中图和下图示出了按性别划分的结果。媒介物处理的WT和Gla KO小鼠的结果是历史数据并包括在内以供参考。
图31A和图31B示出了在施用AAV载体或媒介物后GL-3(酰基鞘鞍醇三己糖)在GlaKO小鼠肾脏中的储存。以2.5x1012GC/kg(低剂量;LD)、5.0x1012GC/kg(中剂量;MD),或2.5x1013GC/kg(高剂量;HD,仅针对AAVhu68.hGLAco(D233C_1359C))的剂量向成年(3.5至4.5月龄)雄性和雌性Gla KO或WT小鼠IV施用AAVhu68.hGLAco、AAVhu68.hGLAco(M51C_G360C)(eng#1)或AAVhu68.hGLAco(D233C_1359C)(eng#2)。另外的Gla KO或WT小鼠IV施用媒介物(PBS)作为对照。(图31A)尸检时采集肾脏,并用识别GL-3(酰基鞘鞍醇三己糖,箭头)的抗体染色。示出并标记来自雄性的代表性图像。图31B是提供了GL-3+IHC信号定量的柱状图,示出了具有GL-3+沉积物的小管的百分比。*p<0.05,**p<0.01,***p<0.001,****p<0.0001,基于克鲁斯卡尔-沃利斯检验,随后是比较各组与媒介物处理的Gla KO小鼠的事后邓恩多重比较检验。
图32A和图32B示出了在施用AAV载体或媒介物后GL-3(酰基鞘鞍醇三己糖)在GlaKO的DRG中的储存。以2.5x1012GC/kg(低剂量;LD)、5.0x1012GC/kg(中剂量;MD),或2.5x1013GC/kg(高剂量;HD,仅针对AAVhu68.hGLAco(D233C_I359Cco))的剂量向成年(3.5至4.5月龄)雄性和雌性Gla KO或WT小鼠IV施用AAVhu68.hGLAco、AAVhu68.hGLAco(M51C_G360C)(eng#1)或AAVhu68.hGLAco(D233C_I359C)(eng#2)。另外的Gla KO或WT小鼠IV施用媒介物(PBS)作为对照。(图32A)尸检时与脊髓一起采集DRG,并用识别GL-3(酰基鞘鞍醇三己糖,深色沉淀物)的抗体染色。示出并标记来自雄性的代表性图像。图32B是示出了以百分比GL-3+面积表示的量化GL-3+IHC信号的柱状图。*p<0.05,**p<0.01,***p<0.001,****p<0.0001,基于克鲁斯卡尔-沃利斯检验,随后比较各组与媒介物处理的Gla KO小鼠的事后邓恩多重比较检验。
图33示出了来自施用AAVhu68.hGLAco(hGLAco)、AAVhu68.hGLAco(M51C_G360C)(hGLAeng#1)或AAVhu68.hGLAco(D233C_I359C)(hGLAeng#2)的AAV处理动物的血浆中体内分泌的GLA的蛋白质印迹分析。
图34A和图34B示出了在用AAVhu68.hGLAco(D233C_I359C)处理的Gla KO雄性小鼠(图34A)和雌性小鼠(图34B)中通过免疫组织化学染色的hGLA的心脏转导和表达。用低剂量-LD(2.5x1012GC/kg)、中剂量-MD(5x101212GC/kg)或高剂量-HD(2.5x1013GC/kg)的AAVhu68.hGLAco、AAVhu68.hGLAco(M51C_G360C)或AAVhu68.hGLAco(D233C_I359C)IV注射3.5至4.5月龄GLA KO法布里病小鼠。注射后4周将小鼠安乐死并收集组织。心脏用锌-***固定并用石蜡包埋。hGLA的抗体用于染色转基因表达。示出了注射AAVhu68.CB7.hGLAco(D233C_I359C)的动物的代表性图片。hGLA的暗免疫染色显示,在来自心室和心房的心肌细胞中强烈且剂量依赖性的转基因表达。
图35示出了IV施用LD(2.5x1012GC/kg)、MD(5x1012GC/kg)或HD(2.5x1013GC/kg)的AAVhu68.hGLAco(hGLAco)、AAVhu68.hGLAco(M51C_G360C)(hGLAeng#1)或AAVhu68.hGLAco(D233C_I359C)(hGLA eng#2)后Gla KO小鼠血浆中的抗GLA滴度。
图36A和图36B示出了单次IV剂量的AAVhu68.hGLAco(D233C_I359C)(hGLAeng#2)后成年NHP中的AST和ALT浓度。成年NHP(N=4)接受单次IV施用AAVhu68.hGLAco(D233C_I359C)(hGLA eng#2),剂量为2.5x1013GC/kg。在基线、第0天、第3天、第7天、第14天、第28天和第60天收集血液,并分析AST(图36A)和ALT(图36B)浓度。虚线表示参考值。缩写:ALT,丙氨酸转氨酶;AST,天冬氨酸转氨酶;GC,基因组拷贝;GGT,γ-谷氨酰转移酶。
图37A至图37C示出了在单次IV剂量的AAVhu68.hGLAco(D233C_I359C)(hGLAeng#2)后成年NHP中的总胆红素(TBil)水平、血小板计数和白细胞(WBC)计数。成年NHP(N=4)接受单次IV施用AAVhu68.hGLAco(D233C_I359C)(hGLAeng#2),剂量为2.5x1013GC/kg。在基线、第0天、第3天、第7天、第14天、第28天和第60天收集血液,并分析TBil水平(图37A)、血小板计数(图37B)和WBC计数(图37C)。虚线表示参考值。
图38A至图38C示出了单次Iv剂量的AAVhu68.hGLAco(D233C_I359C)(hGLAeng#2)后成年NHP中的PT(凝血酶原时间)、APTT(活化部分凝血活酶时间)和D-二聚体水平。成年NHP(N=4)接受单次IV施用AAVhu68.hGLAco(D233C_I359C)(hGLAeng#2),剂量为2.5x1013GC/kg。在基线、第0天、第3天、第7天、第14天、第28天和第60天收集血液,并分析PT(图38A)、APTT(图38B)和D-二聚体水平(图38C)。
图39示出了单次IV剂量的AAVhu68.hGLAco(D233C_I359C)(hGLA eng#2)后成年NHP中的中和抗体和非中和结合抗体。缩写:Babs=非中和结合抗体;F=雌性;ID=标识;M=雄性;Nab=中和抗体;NHP=非人灵长类动物。a——值是相对发光单位(RLU)与病毒对照孔(无测试样品)相比减少50%时的血清倒数稀释度。b——值是产生比阴性对照血清高3倍的平均OD450值的最高血清稀释度的倒数。c——IgG和IgM是BAbs。
图40示出了在单次静脉内施用AAVhu68.hGLAco(D233C_I359C)(hGLA eng#2)后成年NHP的血浆中的转基因产物表达(GLA酶活性)。成年NHP(n=4)接受单次IV剂量的AAVhu68.hGLAco(D233C_I359C)(hGLAeng#2),剂量为2.5x1013GC/kg。在第7天、第14天、第28天和第60天收集血浆。测量转基因产物表达(GLA酶活性)。虚线表示基线滴度。
图41示出了在单次静脉内施用AAVhu68.hGLAco(D233C_I359C)(hGLA eng#2)后成年NHP血浆中针对转基因产物的抗体(抗GLA抗体)。成年NHP(n=4)接受单次IV剂量的AAVhu68.hGLAco(D233C_I359C)(hGLA eng#2),剂量为2.5x1013GC/kg。在第7天、第14天、第28天和第60天收集血浆。测量了抗转基因产物的抗体(抗GLA抗体)。虚线表示基线酶活性。
图42A和图42B示出了在单次静脉内施用AAVhu68.hGLAco(D233C_I359C)(hGLAeng#2)后成年NHP在心脏、肝脏和肾脏中的转基因产物表达(GLA酶活性)。成年NHP(n=4)接受单次IV剂量的AAVhu68.hGLAco(D233C_I359C)(hGLA eng#2),剂量为2.5x1013GC/kg。在第60天,对动物进行尸检并收集心脏、肝脏和肾脏以测量转基因产物表达(GLA酶活性)(图42A)。来自相同物种(食蟹猴)的未处理的野生型NHP的心脏组织由BioIVT提供作为基线GLA酶活性的比较物(虚线)。基于测量值计算GLA酶活性的倍数增加(图42B)。
图43示出了在施用AAVhu68.hGLAco(D233C-I359C)(hGLA eng#2)后来自NHP的肾脏、DRG和心脏组织中转基因的ISH和GLA表达的IHC的代表性图像。
图44示出了在施用AAVhu68.hGLAco(D233C-I359C)(hGLA eng#2)后来自NHP的心脏组织中转基因表达(RNAscope探针)和GLA表达的ISH的代表性图像。
图45示山了在施用AAVhu68.hGLAco(D233C-I359C)(hGLA eng#2)后来自NHP的DRG中转基因表达(RNAscope探针)和GLA表达的ISH的代表性图像。
具体实施方式
本文提供了可用于治疗法布里病和/或减轻法布里病症状的组合物。
不希望受理论束缚,包括定期输注重组人α-Gal A(rhα-Gal A),称为酶替代疗法(ERT),目前是具有非可适应突变的法布里病患者的主要治疗选择,而具有可适应突变的患者可受益于ERT和小分子伴侣。然而,rhα-Gal A具有低的物理稳定性、短的循环半衰期和不同疾病相关组织的可变摄取,这可能限制ERT以及依赖交叉校正的基因治疗的疗效。本文提供的组合物递送稳定的hGLA,其对于基因治疗是有效的,并且在被吸收到靶组织中之前为酶在循环中保持活性提供更大的窗口。
在某些实施例中,本文所述的组合物和方法包括核酸序列、表达盒、载体、重组病毒和用于表达功能性hGLA的其它组合物和方法。在某些实施例中,本文所述的组合物和方法包括核酸序列、表达盒、载体、重组病毒、宿主细胞、用于产生包含编码功能性hGLA或hGLA多肽的核酸序列的组合物的其它组合物和方法。在又一实施例中,本文所述的组合物和方法包括核酸序列、表达盒、载体、重组病毒、用于将编码功能性hGLA的核酸序列递送至受试者以治疗法布里病的其它组合物和方法。在一个实施例中,本文所述的组合物和方法可用于在受试者的外周(例如,血液、肝脏、肾脏)和/或外周神经***中提供治疗水平的hGLA。在某些实施例中,本文所述的基于腺相关病毒(AAV)载体的方法提供了新的治疗选择,其通过在有需要的受试者中提供hGLA的表达来帮助恢复hGLA的所需功能和缓解与hGLA缺乏症(法布里病)相关的症状。
如本文所用,术语“治疗水平”意指酶活性为健康对照的至少约5%、约10%、约20%、约25%、约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%、约100%、大于100%、约2倍、约3倍或约5倍。用于测量hGLA酶活性的合适测定法是本领域技术人员已知的。在一些实施例中,hGLA的这种治疗水平可能导致法布里病相关症状的缓解;法布里病相关的疾病生物标志物的改善(例如,血清、尿液和/或其它生物样品中Gb3水平的降低);促进法布里病的其它治疗(例如,酶替代或伴侣疗法);预防神经认知衰退;逆转某些法布里病相关症状和/或预防法布里病相关症状的进展;或其任何组合。
如本文所用,“健康对照”是指受试者或来自其的生物样品,其中受试者不患有法布里病或hGLA缺乏症。健康对照可以来自一个受试者。在另一实施例中,健康对照是来自多个受试者的合并样品。
如本文所用,术语“生物样品”是指任何细胞、生物流体或组织。适用于本发明的样品可以包括但不限于全血、白细胞、成纤维细胞、血清、尿液、血浆、唾液、骨髓、脑脊液、羊水和皮肤细胞。此类样品可以进一步用盐水、缓冲液或生理上可接受的稀释剂稀释。替代地,通过常规方法浓缩这些样品。
关于本文的描述,旨在本文描述的每种载体和其它组合物在另一实施例中是有用的。另外,在另一实施例中,本文描述的可用于所述方法的每种组合物本身也是本发明的实施例。
除非在本说明书中另有定义,否则本文使用的技术和科学术语具有与本发明所属领域的普通技术人员通过参考公开文本通常理解的相同含义,这些公开文本为本领域技术人员提供了对本申请中使用的许多术语的一般指导。
如本文所用,“疾病”、“病症”和“病状”是指受试者体内的法布里病和/或hGLA缺乏症。
如本文所用,术语“法布里病相关症状”或“症状”是指在法布里病患者以及法布里病动物模型中发现的症状。这些症状包括但不限于血管角质瘤、肢端感觉异常、少汗症/无汗症、角膜、晶状体混浊、心脏问题、疼痛和肾功能下降。此外,法布里病的常见心脏相关体征和症状包括左心室肥大、瓣膜病(尤其是二尖瓣脱垂和/或反流)、早发性冠状动脉疾病、心绞痛、心肌梗塞、传导异常、心律失常、充血性心力衰竭。法布里病被称为其它名称,包括α-半乳糖苷酶A缺乏症、安德森-法布里病和弥漫性体血管角质瘤。
本文所用的“患者”或“受试者”是指用于临床研究的男性或女性人类、狗和动物模型。在某些实施例中,这些方法和组合物的受试者是被诊断患有法布里病的人类。在进一步的实施例中,这些方法和组合物的人类受试者是产前、新生儿、婴儿、幼儿、学龄前儿童、学龄儿童、青少年、青年或成人。
“包含”是包括其它组分或方法步骤的术语。当使用“包含”时,应当理解,相关实施例包括使用“由......组成”术语和“基本上由......组成”术语的描述,“由......组成”术语排除了其它组分或方法步骤,“基本上由......组成”术语排除了实质上改变实施例或发明的性质的任何组分或方法步骤。应当理解,虽然本说明书中的各种实施例使用“包含”语言来呈现,但是在各种情况下,还使用“由......组成”或“基本上由......组成”语言来描述相关实施例。
在描述实施例中对“一个实施例”、“另一实施例”或“某一实施例”的引用并不暗示所引用的实施例与另一实施例(例如,在所引用的实施例之前描述的实施例)相互排斥,除非另有明确规定。
应注意,术语“一(a)”或“一种(an)”是指一个或多个,例如,“表达盒”应理解为表示一个或多个表达盒。因此,术语“一”(或“一个”)、“一个或多个”和“至少一个”在本文中可互换使用。
如本文所用,除非另有说明,否则术语“约”是指与所给出的参考相比±10%的可变性。
1.人α-半乳糖苷酶A(hGLA)
如本文所用,术语“人α-半乳糖苷酶A”和“hGLA”可互换使用,指人α-半乳糖苷酶A酶。α-半乳糖苷酶A的替代名称包括半乳糖苷酶α(agalsidase alfa)、α-D-半乳糖苷酶A、α-D-半乳糖苷半乳糖水解酶、α-半乳糖苷酶、α-半乳糖苷酶A、神经酰胺已三糖苷酶、GALA、半乳糖苷酶、α和蜜二糖酶。应当理解,希腊字母“alpha”和符号“α”在整个说明书中可以互换使用。包括天然(野生型)hGLA蛋白,特别是由本文提供的核酸序列表达的变体hGLA蛋白或其功能片段,当在组合物中递送或通过本文提供的方法递送时,其恢复期望的功能,缓解症状,改善与法布里病相关生物标志物(例如血清α-GAL)相关的症状,和/或促进对法布里病的其它治疗。
“人α-半乳糖苷酶A”或“hGLA”可以是例如全长蛋白质(包括信号肽和成熟蛋白)、成熟蛋白、本文所述的变体蛋白或功能片段。如本文所用,术语“功能性hGLA”是指具有全长天然(野生型)蛋白质(如SEQ ID NO:2和UniProtKB入藏号:P06280-1所示)的氨基酸序列的酶、其变体(包括本文所述的具有特定氨基酸取代的那些)、具有保守氨基酸取代的其突变体、其片段、具有保守氨基酸取代的变体和突变体的全长或仟何组合的片段,其提供至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约90%的天然(野生型)hGLA生物活性水平,或大约与其相同,或大于其100%。
人α-半乳糖苷酶A-(SEQ ID NO:2)信号肽(氨基酸1至31)
天然人GLA编码序列(SEQ ID NO:1)(参见NCBI参考序列:NM_000169.)信号肽(核 苷酸1至93)
参照SEQ ID NO:2的全长天然hGLA的编号,在氨基酸位置1至31存在信号肽,成熟蛋白包括氨基酸32至429。如本文所用,“信号肽”是指存在于新合成的蛋白质的N-末端的短肽(通常约16至35个氨基酸)。信号肽,以及在一些情况下编码这种肽的核酸序列,也可以称为信号序列、靶向信号、定位信号、定位序列、转运肽、前导序列或前导肽。如本文所述,hGLA可以包括天然信号肽(即SEQ ID NO:2的氨基酸1至31)或替代地异源信号肽。在某些实施例中,hGLA是成熟蛋白(缺少信号肽序列)。
在某些实施例中,hGLA包括异源信号肽。在某些实施例中,这种异源信号肽优选地是人源的,并且可以包括例如IL-2信号肽。在某些实施例中可用的特定异源信号肽包括来自胰凝乳蛋白酶原B2的氨基酸1至20、人α-1-抗胰蛋白酶的信号肽、来自艾杜糖醛酸-2-硫酸酯酶的氨基酸1至25和来自蛋白酶CI抑制剂的氨基酸1至23。参见,例如,WO2018046774。其它信号/前导肽可以天然存在于免疫球蛋白(例如,IgG)、细胞因子(例如,IL-2、IL12、IL18等)、胰岛素、白蛋白、β-葡萄糖醛酸酶、碱性蛋白酶或纤连蛋白分泌信号肽等中。还参见,例如,
signalpeptide.de/index.php?m=listspdb_mammalia。这种嵌合hGLA可以在整个31个氨基酸的天然信号肽的位置具有异源前导序列。任选地,hGLA酶的N-末端截短可能仅缺少信号肽的一部分(例如,缺失约2至约25个氨基酸,或其间的值)、整个信号肽,或比信号肽长的片段(例如,基于SEQ ID NO:2的编号,多达70个氨基酸。任选地,这种酶可以含有长度为约5、10、15或20个氨基酸的C-末端截短。
在某些实施例中,可以选择具有与SEQ ID NO:2的全长(氨基酸1至429)至少95%相同、至少97%相同或至少99%相同的序列的hGLA。在某些实施例中,提供了与SEQ ID NO:2的成熟蛋白(氨基酸32至429)至少95%、至少97%或至少99%相同的序列。在某些实施例中,与全长(氨基酸1至429)或成熟蛋白(氨基酸32至429)的hGLA具有至少95%至至少99%同一性的序列的特征在于当在适当的动物模型中测试时,具有与参照(即天然)hGLA相比改善的生物效应和更好的安全特性。在某些实施例中,hGLA酶在hGLA氨基酸序列的指定位置含有修饰。例如,在某些实施例中,相对于SEQ ID NO:2中的编号,hGLA在位置51和/或位置360处具有半胱氨酸取代。在某些实施例中,相对于SEQ ID NO:2中的编号,hGLA在位置233和/或位置359处具有半胱氨酸取代。此类hGLA多肽的实例提供于SEQ ID NO:7和17。
如本文所用,“保守性氨基酸置换”或“保守性氨基酸取代”是指将氨基酸改变、置换或取代成具有类似生化特性(例如电荷、疏水性和大小)的不同氨基酸,这是本领域技术人员已知的。还参见,例如FRENCH等人《什么是保守性取代?(What is a conservativesubstitution?)》《分子进化杂志(Journal of Molecular Evolution)》,1983年3月,第19卷,第2期,第171至175页和YAMPOLSKY等人《蛋白质中氨基酸的可交换性(TheExchangeability of Amino Acids in Proteins)》,《遗传学(Genetics.)》2005年8月;170(4):1459-1472,其各自通过全文引用的方式并入本文。
在一个方面,本文提供了编码功能性hGLA蛋白的核酸序列,以及例如包含其的表达盒和载体。在一个实施例中,核酸序列是SEQ ID NO:1中再现的野生型编码序列。在进一步的实施例中,核酸序列与SEQ ID NO:1的野生型hGLA序列至少约60%、至少约65%、至少约70%、至少约75%或至少约80%相同,并编码功能性hGLA。
如本文所用,“核酸”是指核苷酸的聚合形式,包括RNA、mRNA、cDNA、基因组DNA、肽核酸(PNA)和上述的合成形式和混合聚合物。核苷酸是指核糖核苷酸、脱氧核苷酸或任一类型核苷酸的修饰形式(例如,肽核酸寡聚物)。该术语还包括单链和双链形式的DNA。本领域技术人员将理解,本文描述了这些核酸分子的功能性变体。功能性变体是可以使用标准遗传密码直接翻译以提供与从亲本核酸分子翻译的氨基酸序列相同的氨基酸序列的核酸序列。
在某些实施例中,编码功能性hGLA的核酸分子和本文所述的其它构建体可用于生成表达盒和载体基因组,并且可以被工程化以在酵母细胞、昆虫细胞或哺乳动物细胞(如人类细胞)中表达。方法是已知的并且先前已经描述(例如WO 96/09378)。如果与野生型序列相比,至少一个非优选密码子被更优选的密码子替代,则认为该序列是工程化的。在本文中,非优选密码子是在生物体中使用的频率低于编码相同氨基酸的另一密码子的密码子,并且更优选的密码子是在生物体中使用的频率高于非优选密码子的密码子。特定生物体的密码子使用频率可以在密码子频率表中找到,如在www.kazusa.jp/codon中。优选地多于一个非优选密码子,优选地大多数或所有非优选密码子被更优选的密码子替代。优选地,生物体中最常用的密码子用于工程化序列中。优选密码子的置换通常导致更高的表达。本领域技术人员还将理解,由于遗传密码的简并性,许多不同的核酸分子可以编码相同的多肽。还应当理解,技术人员可以使用常规技术进行不影响由核酸分子编码的氨基酸序列的核苷酸取代,以反映其中表达多肽的任何特定宿主生物体的密码子使用。因此,除非另有说明,“编码氨基酸序列的核酸序列”包括彼此为简并形式并编码相同氨基酸序列的所有核苷酸序列。核酸序列可以使用常规分子生物学技术克隆,或通过DNA合成从头生成,其可以由在DNA合成和/或分子克隆领域具有业务的服务公司(例如GeneArt、金斯瑞公司(GenScript)、生命科技公司(Life Technologies)、欧陆集团(Eurofins))使用常规程序进行。
在某些实施例中,本文所述的核酸、表达盒、载体基因组包括作为工程化序列的hGLA编码序列。在某些实施例中,工程化序列可用于改善受试者中的生产、转录、表达或安全性。在某些实施例中,工程化序列可用于增加所得治疗组合物或治疗的疗效。在进一步的实施例中,工程化序列可用于增加所表达的功能性hGLA蛋白的疗效,并且还可以允许递送功能性hGLA的治疗试剂的较低剂量。在某些实施例中,工程化hGLA编码序列的特征在于与野生型hGLA编码序列相比提高的翻译速率。
“工程化”是指将编码本文所述的功能性hGLA酶的核酸序列组装并置于任何合适的遗传元件中,例如裸DNA、噬菌体、转座子、粘粒、附加体等,其将其上携带的hGLA序列转移至宿主细胞,例如用于生成非病毒递送***(例如,基于RNA的***、裸DNA等),或用于在包装宿主细胞中生成病毒载体,和/或用于递送至受试者体内的宿主细胞。在某些实施例中,遗传元件是载体。在一个实施例中,遗传元件是质粒。用于制备这种工程化构建体的方法是核酸操作领域技术人员已知的,并且包括基因工程、重组工程和合成技术。参见,例如,Green和Sambrook,《分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)》,冷泉港出版社(Cold Spring Harbor Press),纽约冷泉港(2012)。
在核酸序列的上下文中,术语“同一性百分比(%)”、“序列同一性”、“序列同一性百分比”或“同一性百分比”是指当进行对应比对时两个序列中相同的残基。序列同一性比较的长度可以超过构建体的全长、基因编码序列的全长,或至少约500至1000个核苷酸的片段。然而,也可能需要较小片段之间的同一性,例如至少约九个核苷酸,通常至少约20至24个核苷酸、至少约28至32个核苷酸、至少约36个或更多个核苷酸。
可以容易地确定蛋白质、多肽、约100个氨基酸、约300个氨基酸或其肽片段或相应的核酸序列编码序列全长上的氨基酸序列的同一性百分比。合适的氨基酸片段的长度可以是至少约8个氨基酸,并且可以高达约50个氨基酸。通常,当提及两个不同序列之间的“同一性”、“同源性”或“相似性”时,“同一性”、“同源性”或“相似性”是参照“比对的”序列确定的。“比对”序列或“比对”是指多个核酸序列或蛋白质(氨基酸)序列,与参考序列相比,通常含有缺失或额外碱基或氨基酸的校正。
同一性可以通过制备序列的比对并通过使用本领域已知或商业上可获得的各种算法和/或计算机程序(例如,BLAST,ExPASy;Clustal Omega;FASTA;使用例如尼德勒曼-翁施算法、史密斯-沃特曼算法)确定。使用各种公开的或商业上可获得的多序列比对程序中的任一种进行比对。序列比对程序可用于氨基酸序列,例如“Clustal Omega”、“ClustalX”、“MAP”、“PIMA”、“MSA”、“BLOCKMAKER”、“MEME”和“Match-Box”程序。通常,在默认设置下使用这些程序中的任何一个,但是本领域技术人员可以根据需要改变这些设置。替代地,本领域技术人员可以利用另一种算法或计算机程序,其至少提供由所引用的算法和程序提供的同一性或比对水平。参见,例如,J.D.Thomson等人,《核酸研究(Nucl.Acids.Res.)》,《多序列比对的综合比较(A comprehensive comparison of multiple sequencealignments)》,27(13):2682-2690(1999)。
在某些实施例中,hGLA编码序列与SEQ ID NO:1的野生型hGLA序列的同一性小于80%,并且编码SEQ ID NO:2、7或17的氨基酸序列。在另一实施例中,hGLA编码序列包含与SEQ ID NO:1的核苷酸(nt)94至1287小于80%相同的序列,并且编码SEQ ID NO:2、7或17的氨基酸32至429。
在某些实施例中,hGLA编码序列与野生型hGLA编码序列(SEQ ID NO:1)共有小于约99%、小于约98%、小于约97%、小于约96%、小于约95%、小于约94%、小于约93%、小于约92%、小于约91%、小于约90%、小于约89%、小于约88%、小于约87%、小于约86%、小于约85%、小于约84%、小于约83%、小于约82%、小于约81%、小于约80%、小于约79%、小于约78%、小于约77%、小于约76%、小于约75%、小于约74%、小于约73%、小于约72%、小于约71%、小于约70%、小于约69%、小于约68%、小于约67%、小于约66%、小于约65%、小于约64%、小于约63%、小于约62%、小于约61%或同一性。在其它实施例中,hGLA编码序列与野生型hGLA编码序列(SEQ ID NO:1)共有约99%、约98%、约97%、约96%、约95%、约94%、约93%、约92%、约91%、约90%、约89%、约88%、约87%、约86%、约85%、约84%、约83%、约82%、约81%、约80%、约79%、约78%、约77%、约76%、约75%、约74%、约73%、约72%、约71%、约70%、约69%、约68%、约67%、约66%、约64%、约63%、约62%、约61%或更少的同一性。在另一实施例中,hGLA编码序列与SEQ ID NO:3至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%相同,并且该序列编码功能性hGLA。同一性可以是相对于编码全长hGLA的序列(例如,SEQ ID NO:1或3的nt 1至nt 1287)或相对于编码成熟hGLA的序列(例如,SEQ ID NO:1或3的nt 94至nt 1287)。在某些实施例中,hGLA编码序列包括SEQ ID NO:3的nt 1至1287,或与其至少85%、90%、95%或99%相同的编码全长hGLA的序列。在某些实施例中,hGLA编码序列包括SEQ ID NO:3的nt 94至1287,或与其至少85%、90%、95%或99%相同的编码功能性hGLA的序列。
在某些实施例中,提供了在位置233和/或位置359处具有氨基取代的hGLA,其中参考SEQ ID NO:2的全长天然hGLA的编号。在某些实施例中,hGLA在位置233和/或位置359处具有半胱氨酸残基。在某些实施例中,hGLA包含SEQ ID NO:7的氨基酸序列,或与其至少95%相同的在位置233和位置359处具有半胱氨酸残基的序列。在其它实施例中,hGLA包含SEQ ID NO:7的氨基酸32至429,或与其至少95%相同的在位置233和位置359处具有半胱氨酸残基的序列。在某些实施例中,提供了编码SEQ ID NO:7的序列的工程化编码序列,或与其至少95%相同的在位置233和位置359处具有半胱氨酸残基的序列,其中该编码序列与野生型hGLA编码序列(SEQ ID NO:1)共有小于约99%、小于约98%、小于约97%、小于约96%、小于约95%、小于约94%、小于约93%、小于约92%、小于约91%、小于约90%、小于约89%、小于约88%、小于约87%、小于约86%、小于约85%、小于约84%、小于约83%、小于约82%、小于约81%、小于约80%、小于约79%、小于约78%、小于约77%、小于约76%、小于约75%、小于约74%、小于约73%、小于约72%、小于约71%、小于约70%、小于约69%、小于约68%、小于约67%、小于约66%、小于约65%、小于约64%、小于约63%、小于约62%、小于约61%或同一性。在其它实施例中,提供了编码SEQ ID NO:7的氨基酸32至429的工程化编码序列,或与其至少95%相同的在位置233和位置359处具有半胱氨酸残基的序列,其中该编码序列与成熟hGLA的野生型编码序列(SEQ ID NO:1的nt 94至nt1287)共有小于约99%、小于约98%、小于约97%、小于约96%、小于约95%、小于约94%、小于约93%、小于约92%、小于约91%、小于约90%、小于约89%、小于约88%、小于约87%、小于约86%、小于约85%、小于约84%、小于约83%、小于约82%、小于约81%、小于约80%、小于约79%、小于约78%、小于约77%、小于约76%、小于约75%、小于约74%、小于约73%、小于约72%、小于约71%、小于约70%、小于约69%、小于约68%、小于约67%、小于约66%、小于约65%、小于约64%、小于约63%、小于约62%、小于约61%或同一性。在某些实施例中,提供了hGLA编码序列,其包含SEQ ID NO:4的nt 94至nt 1287,或与其至少85%、90%、95%或99%相同的序列,其中编码的功能性hGLA在位置233和位置359处具有半胱氨酸残基。在某些实施例中,hGLA编码序列包含SEQ ID NO:4的nt 94至1287。在另一实施例中,提供了hGLA编码序列,其包含SEQ IDNO:4,或与其至少85%、90%、95%或99%相同的序列,其中编码的功能性hGLA在位置233和位置359处具有半胱氨酸残基。在某些实施例中,hGLA编码序列包含SEQ ID NO:4。
在某些实施例中,提供了在位置51和/或位置360处具有氨基取代的hGLA,其中参考SEQ ID NO:2)的全长天然hGLA的编号。在某些实施例中,hGLA在位置51和/或位置360处具有半胱氨酸残基。在某些实施例中,hGLA包含SEQ ID NO:17的氨基酸序列,或与其至少95%相同的在位置51和位置360处具有半胱氨酸残基的序列。在其它实施例中,hGLA包含SEQ ID NO:17的氨基酸32至429,或与其至少95%相同的在位置51和位置360处具有半胱氨酸残基的序列。在某些实施例中,提供了编码SEQ ID NO:17的序列的工程化编码序列,或与其至少95%相同的在位置51和位置360处具有半胱氨酸残基的序列,其中该序列与野生型hGLA编码序列(SEQ ID NO:1)共有小于约99%、小于约98%、小于约97%、小于约96%、小于约95%、小于约94%、小于约93%、小于约92%、小于约91%、小于约90%、小于约89%、小于约88%、小于约87%、小于约86%、小于约85%、小于约84%、小于约83%、小于约82%、小于约81%、小于约80%、小于约79%、小于约78%、小于约77%、小于约76%、小于约75%、小于约74%、小于约73%、小于约72%、小于约71%、小于约70%、小于约69%、小于约68%、小于约67%、小于约66%、小于约65%、小于约64%、小于约63%、小于约62%、小于约61%或同一性。在其它实施例中,提供了编码SEQ ID NO:17的氨基酸32至429的工程化编码序列,或与其至少95%相同的在位置51和位置360处具有半胱氨酸残基的序列,其中该序列与成熟hGLA的野生型编码序列(SEQ ID NO:1的94至nt 1287)共有小于约99%、小于约98%、小于约97%、小于约96%、小于约95%、小于约94%、小于约93%、小于约92%、小于约91%、小于约90%、小于约89%、小于约88%、小于约87%、小于约86%、小于约85%、小于约84%、小于约83%、小于约82%、小于约81%、小于约80%、小于约79%、小于约78%、小于约77%、小于约76%、小于约75%、小于约74%、小于约73%、小于约72%、小于约71%、小于约70%、小于约69%、小于约68%、小于约67%、小于约66%、小于约65%、小于约64%、小于约63%、小于约62%、小于约61%或同一性。在某些实施例中,提供了hGLA编码序列,其包含SEQ ID NO:5的nt 94至nt 1287,或与其至少85%、90%、95%或99%相同的序列,其中编码的功能性hGLA在位置51和位置360处具有半胱氨酸残基。在某些实施例中,hGLA编码序列包含SEQ IDNO:5的nt 94至nt 1287。在另一实施例中,提供了hGLA编码序列,其包含SEQ ID NO:5,或与其至少85%、90%、95%或99%相同的序列,其中编码的功能性hGLA在位置51和位置360处具有半胱氨酸残基。在某些实施例中,hGLA编码序列包含SEQ ID NO:5。
/>
如本文所用,“所需功能”是指hGLA酶活性为健康对照的至少约20%、约25%、约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或约100%。
如本文所用,短语“缓解症状”和“改善症状”及其语法变体是指逆转法布里病相关症状、减缓或预防法布里病相关症状的进展。在某些实施例中,缓解或改善是指在施用所述组合物或使用所述方法后,患者的症状总数与施用或使用前相比减少了约5%、约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约95%。在另一实施例中,缓解或改善是指在施用所述组合物或使用所述方法后,症状的严重程度或进展与施用或使用前相比降低了约5%、约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约95%。
其它hGLA变体也是合适的。另参见2019年10月10日提交的国际专利申请号PCT/US2019/05567,其全部内容通过引用并入本文。
应当理解,本文所述的功能性hGLA或hGLA编码序列中的组合物旨在应用于说明书中所述的其它组合物、方案、方面、实施例和方法。
2.表达盒
在某些实施例中,本文提供了具有编码功能性hGLA的工程化核酸序列和指导其表达的调节序列的表达盒。在其它实施例中,表达盒具有编码功能性hGLA的本文所述工程化核酸序列和指导其表达的调节序列。
如本文所用,术语“表达”或“基因表达”是指将来自基因的信息用于合成功能性基因产物的过程。基因产物可以是蛋白质、肽或核酸聚合物(如RNA、DNA或PNA)。
如本文所用,“表达盒”是指包含功能性hGLA的编码序列(包括其变体和片段)和启动子的核酸聚合物。在其它实施例中,表达盒除启动子外还包括一个或多个调节序列。在某些实施例中,表达载体是载体基因组。在某些实施例中,表达盒或载体基因组被包装到载体中。在某些实施例中,提供了包括本文所述的表达盒的质粒。
如本文所用,术语“调节序列”或“表达控制序列”是指核酸序列,如起始序列、增强子序列和启动子序列,其诱导、抑制或控制与其可操作地连接的编码蛋白质的核酸序列的转录。
如本文所用,术语“可操作地连接”是指与编码hGLA的核酸序列相邻的表达控制序列和/或以反式或以一定距离起作用以控制其转录和表达的表达控制序列。
术语“异源”当用于指质粒、表达盒或载体中的蛋白质或核酸时,表示该蛋白质或核酸与另一序列或亚序列一起存在,该蛋白质或核酸与该另一序列或亚序列在自然界中彼此不存在相同的关系。
在某些实施例中,所提供的表达盒包括为鸡β-肌动蛋白启动子的启动子。已经单独或与各种增强子元件(例如,CB7是具有巨细胞病毒增强子元件的鸡β-肌动蛋白启动子、CAG启动子,其包括启动子、鸡β肌动蛋白的第一外显子和第一内含子,以及兔β-珠蛋白基因的剪接受体)、CBh启动子组合描述了多种鸡β-肌动蛋白启动子[SJ Gray等人,《人类基因治疗(Hu Gene Ther)》,2011年9月;22(9):1143-1153]。在其它实施例中,合适的启动子可以包括但不限于延长因子1α(EF1α)启动子(参见,例如,Kim DW等人,《使用人类延长因子1α启动子作为通用和有效的表达***(Use of the human elongation factor 1 alphapromoter as a versatile and efficient expression system)》《基因(Gene)》1990年7月16日;91(2):217-23)、突触蛋白1启动子(参见,例如,Kügler S等人,《人突触蛋白1基因启动子在成年大鼠脑中根据转导区域赋予腺病毒载体高度神经元特异性的长期转基因表达(Human synapsin 1 gene promoter confers highly neuron-specific long-termtransgene expression from an adenoviral vector in the adult rat braindepending on the transduced area)》《基因疗法(Gene Ther.)》2003年2月;10(4):337-47)、神经元特异性烯醇化酶(NSE)启动子(参见,例如,Kim J等人,《富含胆固醇的脂筏参与白细胞介素-6诱导的LNCaP***癌细胞神经内分泌分化(Involvement of cholesterol-rich lipid rafts in interleukin-6-induced neuroendocrine differentiation ofLNCaP prostate cancer cells)》《内分泌学(Endocrinology)》2004年2月;145(2):613-9.电子版2003年10月16日),或CB6启动子(参见,例如,《携带人存活运动神经元基因的血清9型腺相关病毒载体的大规模生产(Large-Scale Production of Adeno-Associated ViralVector Serotype-9Carrying the Human Survival Motor Neuron Gene)》,《分子生物技术(Mol Biotechnol.)》2016年1月;58(1):30-6.doi:10.1007/s12033-015-9899-5)。
组织特异性启动子的实例对于肝脏和其它组织是熟知的(白蛋白,Miyatakc等人,(1997)《病毒学杂志(J.Virol.)》,71:5124-32;乙型肝炎病毒核心启动子,Sandig等人,(1996)《基因疗法》,3:1002-9;甲胎蛋白(AFP),Arbuthnot等人,(1996)《人类基因治疗》7:1503-14),骨骨钙蛋白(Stein等人,(1997)《分子生物学报告(Mol.Biol.Rep.)》,24:185-96);骨唾液蛋白(Chen等人,(1996)《骨矿物质研究杂志(J.Bone Miner.Res.)》,11:654-64)、淋巴细胞(CD2,Hansal等人,(1998)《免疫学杂志(J.Immunol.)》,161:1063-8;免疫球蛋白重链;T细胞受体链)、神经元(如神经元特异性烯醇化酶(NSE))启动子(Andersen等人,(1993)《细胞分子神经生物杂志(Cell.Mol.Neurobiol.)》,13:503-15)、神经丝轻链基因(Piccioli等人,(1991)《美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)》,88:5611-5)和神经元特异性vgf基因(Piccioli等人,(1995)《神经元(Neuron)》,15:373-84)等。在某些实施例中,启动子是人甲状腺素结合球蛋白(TBG)启动子。替代地,可以选择可调节的启动子。参见,例如,WO 2011/126808B2,其通过引用并入本文。
在某些实施例中,表达盒包括一种或多种表达增强子。在某些实施例中,表达盒含有两个或更多个表达增强子。这些增强子可以是相同或不同的。例如,增强子可以包括αmic/bik增强子或CMV增强子。这种增强子可以以彼此相邻的两个拷贝存在。替代地,增强子的双拷贝可以被一个或多个序列分开。在更进一步的实施例中,表达盒进一步含有内含子,例如鸡β-肌动蛋白内含子、人β-球蛋白内含子、SV40内含子和/或商业上可获得的内含子。其它合适的内含子包括本领域已知的那些,例如,如WO 2011/126808中所述的那些。
所提供的表达盒可以包括一种或多种表达增强子,如来自土拨鼠肝炎病毒(WPRE)、人肝炎病毒(HPRE)、地松鼠肝炎病毒(GPRE)或北极地松鼠肝炎病毒(AGSPRE)的转录后调节元件;或合成的转录后调节元件。这些表达增强元件当置于3′UTR中时是特别有利的并且可以显著增加mRNA稳定性和/或蛋白质产量。在某些实施例中,所提供的表达盒包括调节序列,其为土拨鼠肝炎病毒转录后调节元件(WPRE)或其变体。合适的WPRE序列提供在本文所述的载体基因组中,并且是本领域已知的(例如,如美国专利第6,136,597号、第6,287,814号和第7,419,829号中所述的那些,这些专利通过引用并入本文)。在某些实施例中,WPRE是一种已经被突变以消除土拨鼠乙型肝炎病毒X(WHX)蛋白的表达的变体,包括例如WHX基因的起始密码子中的突变(参见,Zanta-Boussif等人,《基因疗法》2009年5月;16(5):605-19,其通过引用并入本文)。在某些实施例中,WPRE包含SEQ ID NO:27中提供的核苷酸序列。在其它实施例中,增强子选自非病毒来源。
此外,所提供的表达盒包括合适的聚腺苷酸化信号。在某些实施例中,polyA序列是兔β-珠蛋白polyA。参见,例如WO 2014/151341。在另一实施例中,polyA序列是牛生长激素polyA。替代地,包括另一种polyA,例如人生长激素(hGH)聚腺苷酸化序列、S450 polyA或合成的polyA。
在某些实施例中,表达盒可以在非翻译区中包括一个或多个miRNA(也称为miR或微RNA)靶序列。设计miRNA靶序列以被存在于其中转基因表达是不期望的和/或转基因表达水平降低是期望的细胞中的miRNA特异性识别。在某些实施例中,表达盒包括特异性减少背根神经节中hGLA表达的miRNA靶序列。在某些实施例中,miRNA靶序列位于表达盒的3′UTR、5′UTR和/或3′和5′UTR两者中。在某些实施例中,表达盒包含背根神经节(DRG)特异性miRNA靶序列的至少两个串联重复序列,其中至少两个串联重复序列包含可以相同或不同的至少第一miRNA靶序列和至少第二miRNA靶序列。在某些实施例中,至少两个DRG特异性miRNA串联重复序列中的第一个的起点在距hGLA编码序列的3′端20个核苷酸内。在某些实施例中,至少两个DRG特异性miRNA串联重复序列中的第一个的起点距离hGLA编码序列的3′端至少100个核苷酸。在某些实施例中,miRNA串联重复序列包含200至1200个核苷酸的长度。在某些实施例中,相对于缺少miR靶序列的表达盒,包括miR靶不会改变治疗性转基因在一个或多个靶组织中的表达或疗效。
在某些实施例中,表达盒含有至少一种miRNA靶序列,其为miR-183靶序列。在某些实施例中,表达盒含有miR-183靶序列,其包括AGTGAATTCTACCAGTGCCATA(SEQ ID NO:31),其中与miR-183种子序列互补的序列用下划线标出。在某些实施例中,表达盒含有多于一个拷贝(例如两个或三个拷贝)的与miR-183种子序列100%互补的序列。在某些实施例中,miR-183靶序列长度为约7个核苷酸至约28个核苷酸并且包括至少一个与miR-183种子序列至少100%互补的区域。在某些实施例中,miR-183靶序列含有与SEQ ID NO:31具有部分互补性的序列,因此,当与SEQ ID NO:31比对时,存在一个或多个错配。在某些实施例中,miR-183靶序列包含当与SEQ ID NO:31比对时具有至少1、2、3、4、5、6、7、8、9或10个错配的序列,其中错配可以是非邻接的。在某些实施例中,miR-183靶序列包括100%互补性的区域,其也包含miR-183靶序列长度的至少30%。在某些实施例中,100%互补性的区域包括与miR-183种子序列具有100%互补性的序列。在某些实施例中,miR-183靶序列的剩余部分与miR-183具有至少约80%至约99%的互补性。在某些实施例中,表达盒包括miR-183靶序列,其包含截短的SEQ ID NO:31,即,在SEQ ID NO:31的5′端或3′端中的任一端或两端缺失至少1、2、3、4、5、6、7、8、9或10个核苷酸的序列。在某些实施例中,表达盒包含转基因和一个miR-183靶序列。在其它实施例中,表达盒包含至少两个、三个或四个miR-183靶序列。在某些实施例中,在表达盒中包括至少两个、三个或四个miR-183靶序列导致靶组织(如心脏)中转基因表达水平增加。
在某些实施例中,表达盒含有至少一种miRNA靶序列,其为miR-182靶序列。在某些实施例中,表达盒含有miR-182靶序列,其包括AGTGTGAGTTCTACCATTGCCAAA(SEQ ID NO:32)。在某些实施例中,表达盒含有多于一个拷贝(例如两个或三个拷贝)的与miR-182种了序列100%互补的序列。在某些实施例中,miR-182靶序列长度为约7个核苷酸至约28个核苷酸并且包括至少一个与miR-182种子序列至少100%互补的区域。在某些实施例中,miR-182靶序列含有与SEQ ID NO:32具有部分互补性的序列,因此,当与SEQ ID NO:32比对时,存在一个或多个错配。在某些实施例中,miR-183靶序列包含当与SEQ ID NO:32比对时具有至少1、2、3、4、5、6、7、8、9或10个错配的序列,其中错配可以是非邻接的。在某些实施例中,miR-182靶序列包括100%互补性的区域,其也包含miR-182靶序列长度的至少30%。在某些实施例中,100%互补性的区域包括与miR-182种子序列具有100%互补性的序列。在某些实施例中,miR-182靶序列的剩余部分与miR-182具有至少约80%至约99%的互补性。在某些实施例中,表达盒包括miR-182靶序列,其包含截短的SEQ ID NO:32,即,在SEQ ID NO:32的5′端或3′端中的任一端或两端缺失至少1、2、3、4、5、6、7、8、9或10个核苷酸的序列。在某些实施例中,表达盒包含转基因和一个miR-182靶序列。在其它实施例中,表达盒包含至少两个、三个或四个miR-182靶序列。
术语“串联重复序列”在本文中用于指两个或更多个连续miRNA靶序列的存在。这些miRNA靶序列可以是连续的,即,直接位于彼此之后,使得一个的3′端直接位于下一个的5′端的上游,没有***序列,反之亦然。在另一实施例中,两个或更多个miRNA靶序列被短间隔区序列分开。
如本文所用,“间隔区”是位于两个或更多个连续miRNA靶序列之间的任何选定的核酸序列,例如长度为1、2、3、4、5、6、7、8、9或10个核苷酸。在某些实施例中,间隔区长度为1至8个核苷酸、长度为2至7个核苷酸、长度为3至6个核苷酸、长度为四个核苷酸、4至9个核苷酸、3至7个核苷酸或更长的值。合适地,间隔区是非编码序列。在某些实施例中,间隔区可以是四(4)个核苷酸。在某些实施例中,间隔区是GGAT。在某些实施例中,间隔区是六(6)个核苷酸。在某些实施例中,间隔区是CACGTG或GCATGC。
在某些实施例中,串联重复序列含有两个、三个、四个或更多个相同的miRNA靶序列。在某些实施例中,串联重复序列含有至少两种不同的miRNA靶序列、至少三种不同的miRNA靶序列或至少四种不同的miRNA靶序列等。在某些实施例中,串联重复序列可以含有两个或三个相同的miRNA靶序列和不同的第四个miRNA靶序列。
在某些实施例中,在表达盒中可以存在至少两组不同的串联重复序列。例如,3′UTR可以含有紧接转基因下游的串联重复序列、UTR序列,以及两个或更多个靠近UTR的3′端的串联重复序列。在另一实例中,5′UTR可以含有一个、两个或更多个miRNA靶序列。在另一实例中,3′UTR可以含有串联重复序列且5′UTR可以含有至少一个miRNA靶序列。
在某些实施例中,表达盒含有两个、三个、四个或更多个串联重复序列,其起始于转基因的终止密码子的约0至20个核苷酸内。在其它实施例中,表达盒含有距离转基因终止密码子至少100至约4000个核菅酸的miRNA串联重复序列。
还参见2019年12月20日提交的国际专利申请号PCT/US19/67872和2021年5月12日提交的国际专利申请号PCT/US21/32003,其全部内容通过引用并入本文。
应当理解,表达盒中的组合物旨在应用于说明书中描述的其它组合物、方案、方面、实施例和方法。
3.载体
在一个方面,本文提供了包含编码功能性hGLA的核酸序列的载体。在某些实施例中,载体包含如本文所述的用于递送hGLA编码序列的表达盒。
本文所用的“载体”是包含核酸序列的生物或化学部分,这些核酸序列可以被引入合适的靶细胞中用于所述核酸序列的复制或表达。载体的实例包括但不限于重组病毒、质粒、脂质体、多聚体、多聚物、树状聚体、细胞穿透肽(CPP)缀合物、磁性颗粒或纳米颗粒。在某些实施例中,载体是其中可以***编码功能性hGLA的工程化核酸的核酸分子,然后可以将其引入合适的靶细胞中。这些载体优选地具有一个或多个复制起点,以及一个或多个重组DNA可***的位点。载体通常具有一些手段,通过这些手段可以将具有载体的细胞从没有载体的细胞中选择出来,例如,它们编码抗药性基因。常见的载体包括质粒、病毒基因组和“人工染色体”。本领域技术人员可以获得生成、生产、表征或定量载体的常规方法
在某些实施例中,载体是非病毒质粒,其包含本文所述的表达盒(例如,“裸DNA”、“裸质粒DNA”、RNA和mRNA,其可以与各种组合物和纳米颗粒偶联,包括例如胶束、脂质体、阳离子脂质-核酸组合物、聚糖组合物和其它聚合物、基于脂质和/或胆固醇的核酸缀合物)和如本文所述的其它构建体。参见,例如,X.Su等人,《分子药剂学(Mol.Pharmaceutics)》,2011,8(3),第774至787页;网络出版:2011年3月21日;WO2013/182683、WO 2010/053572和WO 2012/170930,所有这些通过引用并入本文。
在某些实施例中,本文所述的载体是“复制缺陷型病毒”或“病毒载体”,其是指合成或人工病毒颗粒,其中含有编码hGLA的核酸序列的表达盒包装在病毒衣壳或包膜中,其中也包装在病毒衣壳或包膜内的任何病毒基因组序列是复制缺陷型的;即,它们不能生成子代病毒体,但保留感染靶细胞的能力。在一个实施例中,病毒载体的基因组不包括编码复制所需的酶的基因(基因组可以被工程化为“无细胞的”——仅含有编码hGLA的核酸序列,其侧翼为扩增和包装人工基因组所需的信号),但这些基因可以在生产期间提供。因此,它被认为可以安全地用于基因治疗,因为子代病毒体的复制和感染只有在复制所需的病毒酶存在时才会发生。
如本文所用,重组病毒载体是腺相关病毒(AAV)、腺病毒、博卡病毒、杂合AAV/博卡病毒、单纯疱疹病毒或慢病毒。
在某些实施例中,提供了具有包括hGLA编码序列的核酸的宿主细胞。在某些实施例中,宿主细胞含有具有如本文所述的hGLA编码序列的质粒。
如本文所用,术语“宿主细胞”可以指其中产生载体(例如,重组AAV)的包装细胞系。宿主细胞可以是含有外源或异源DNA的原核或真核细胞(例如,人、昆虫或酵母),外源或异源DNA已通过任何方式引入细胞中,例如电穿孔、磷酸钙沉淀、显微注射、转化、病毒感染、转染、脂质体递送、膜融合技术、高速DNA包被颗粒、病毒感染和原生质体融合。宿主细胞的实例可以包括但不限于分离的细胞、细胞培养物、大肠杆菌(Escherichia coli)细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、非哺乳动物细胞、昆虫细胞、HEK-293细胞、肝细胞、肾细胞、中枢神经***细胞、神经元、神经胶质细胞或干细胞。
在某些实施例中,宿主细胞含有用于产生hGLA的表达盒,使得在体外以足够的量产生蛋白质用于分离或纯化。在某些实施例中,宿主细胞含有编码hGLA(包括例如其功能片段)的表达盒。如本文提供的,hGLA多肽可以包括在作为治疗剂(即,酶替代疗法)施用于受试者的药物组合物中。
如本文所用,术语“靶细胞”是指其中期望表达功能性hGLA的任何细胞。在某些实施例中,术语“靶细胞”旨在指正在接受法布里病治疗的受试者的细胞。靶细胞的实例可以包括但不限于肝细胞、肾细胞、平滑肌细胞和神经元。在某些实施例中,将载体离体递送至靶细胞。在某些实施例中,在体内将载体递送至靶细胞。
应当理解,本文所述载体中的组合物旨在应用于说明书中描述的其它组合物、方案、方面、实施例和方法。
4.重组腺相关病毒(rAAV)
在某些实施例中,本文提供了包含AAV衣壳和包装在其中的载体基因组的rAAV。载体基因组包含AAV 5′反向末端重复序列(ITR)、编码本文所述的功能性hGLA的核酸序列、指导hGLA在靶细胞中表达的调节序列和AAV 3′ITR。在某些实施例中,载体基因组包含如本文提供的表达盒,其侧翼为AAV 5′ITR和AAV 3′ITR。这种rAAV适用于治疗法布里病。
如本文所用,“rAAV.hGLA”是指具有包括hGLA编码序列的载体基因组的rAAV。“rAAVhu68.hGLA”是指具有AAVhu68衣壳和包括hGLA编码序列的载体基因组的rAAV。
如本文所用,“载体基因组”是指包装在载体内的核酸序列。在一个实施例中,载体基因组是指包装在rAAV衣壳内形成rAAV载体的核酸序列。这种核酸序列含有AAV反向末端重复序列(ITR)。在某些实施例中,ITR来自不同于提供衣壳的AAV。在一个优选的实施例中,来自AAV2的ITR序列或其缺失版本(ΔITR)可用于方便和加速监管批准。然而,可以选择来自其它AAV来源的ITR。当ITR的来源来自AAV2而AAV衣壳来自另一AAV来源时,所得载体可以称为假型载体。通常,AAV载体基因组包含AAV 5′ITR、调节序列、hGLA编码序列和AAV 3′ITR。然而,这些元件的其它构造也是合适的。已经描述了5′ITR的缩短版本,称为AITR,其中缺失了D序列和末端解析位点(trs)。在某些实施例中,载体基因组包括130个碱基对的缩短的AAV2 ITR,其中缺失了外部A元件。在使用内部A元件作为模板的载体DNA扩增过程中,缩短的ITR回复到145个碱基对的野生型长度。在其它实施例中,使用全长AAV 5′和3′ITR。在某些实施例中,载体基因组包括一个或多个miRNA靶序列。
在某些实施例中,提供了具有载体基因组的rAAV,该载体基因组包括AAV 5′ITR、启动子、hGLA编码序列、poly A序列和AAV 3′ITR。在某些实施例中,提供了具有载体基因组的rAAV,该载体基因组包括AAV 5′ITR、启动子、内含子、hGLA编码序列、poly A序列和AAV3′ITR。在某些实施例中,提供了具有载体基因组的rAAV,该载体基因组包括AAV 5′ITR、启动子、hGLA编码序列、WPRE、poly A序列和AAV 3′ITR。在某些实施例中,提供了具有载体基因组的rAAV,该载体基因组包括AAV 5′ITR、启动子、内含子、hGLA编码序列、WPRE、poly A序列和AAV 3′ITR。在某些实施例中,载体基因组具有米自非病毒来源的增强子代替WPRE元件。
在某些实施例中,提供了具有载体基因组的rAAV,该载体基因组包括AAV 5′ITR、鸡β-肌动蛋白内含子、hGLA编码序列、WPRE、poly A序列和AAV 3′ITR。在某些实施例中,提供了具有载体基因组的rAAV,该载体基因组包括AAV 5′ITR、CB7启动子、鸡β-肌动蛋白内含子、hGLA编码序列、WPRE、兔β珠蛋白poly A序列和AAV 3′ITR。在某些实施例中,提供了具有载体基因组的rAAV,该载体基因组包括AAV 5′ITR、TBG启动子、鸡β-肌动蛋白内含子、hGLA编码序列、WPRE、牛生长激素poly A序列和AAV 3′ITR。在某些实施例中,提供了具有载体基因组的rAAV,该载体基因组包括AAV 5′ITR、TBG启动子、SV40内含了、hGLA编码序列、WPRE、牛生长激素poly A序列和AAV3′ITR。在某些实施例中,载体基因组具有来自非病毒来源的增强子代替WPRE元件。
在某些实施例中,提供了具有载体基因组的rAAV,该载体基因组包括AAV 5′ITR、启动子、鸡β-肌动蛋白内含子、hGLA编码序列、poly A序列和AAV 3′ITR。在某些实施例中,提供了具有载体基因组的rAAV,该载体基因组包括AAV 5′ITR、CB7启动子、鸡β-肌动蛋白内含子、hGLA编码序列、兔珠蛋白poly A序列和AAV 3′ITR。在某些实施例中,提供了具有载体基因组的rAAV,该载体基因组包括AAV 5′ITR、TBG启动子、鸡β-肌动蛋白内含子、hGLA编码序列、牛生长激素poly A序列和AAV 3′ITR。在某些实施例中,提供了具有载体基因组的rAAV,该载体基因组包括AAV 5′ITR、TBG启动子、SV40内含子、hGLA编码序列、牛生长激素polyA序列和AAV 3′ITR。
在一个实施例中,提供了rAAV,其具有SEQ ID NO:6、8、10、12、14、16或18中所示的载体基因组,或与其至少85%相同的序列。
如本文所用,可互换使用的术语“rAAV”和“人工AAV”是指但不限于包含衣壳蛋白和包装在其中的载体基因组的AAV,其中载体基因组包含与AAV异源的核酸。在一个实施例中,衣壳蛋白是非大然存在的衣壳。这种人工衣壳可以通过任何合适的技术生成,使用选择的AAV序列(例如,vp1衣壳蛋白的片段)与异源序列组合,这些异源序列可以从不同的选择的AAV、相同AAV的非连续部分、从非AAV病毒来源,或从非病毒来源获得。人工AAV可以是但不限于假型AAV、嵌合AAV衣壳、重组AAV衣壳或“人源化”AAV衣壳。假型载体在本发明中是有用的,其中一种AAV的衣壳被异源衣壳蛋白替代。在一个实施例中,AAV2/5和AAV2/8是示例性假型载体。所选择的遗传元件可以通过任何合适的方法递送,包括转染、电穿孔、脂质体递送、膜融合技术、高速DNA包被颗粒、病毒感染和原生质体融合。用于制备这种构建体的方法是核酸操作领域技术人员已知的,并且包括基因工程、重组工程和合成技术。参见,例如,Green和Sambrook,《分子克隆:实验室手册》,冷泉港出版社,纽约冷泉港(2012)。
本文所用的术语“AAV”是指天然存在的腺相关病毒、本领域技术人员可获得的和/或根据本文所述的组合物和方法获得的腺相关病毒,以及人工AAV。腺相关病毒(AAV)病毒载体是具有AAV蛋白衣壳的抗AAV DNase颗粒,其中包装有侧翼为AAV反向末端重复序列(ITR)的表达盒,用于递送至靶细胞。AAV衣壳由60个衣壳(cap)蛋白亚基VP1、VP2和VP3组成,它们以二十面体对称排列,比例约为1∶1∶10至1∶1∶20,这取决于所选择的AAV。可以选择各种AAV作为如上鉴定的AAV病毒载体的衣壳来源。参见,例如,美国公开专利申请号2007-0036760-A1;美国公开专利申请号2009-0197338-A1;EP 1310571。还参见,WO 2003/042397(AAV7和其它猿AAV)、美国专利7790449和美国专利7282199(AAV8)、WO 2005/033321和US7,906,111(AAV9),和WO 2006/110689,和WO 2003/042397(rh.10)。这些文献还描述了可被选择用于生成AAV的其它AAV,并通过引用并入本文。在从人或非人灵长类动物(NHP)中分离或工程化并充分表征的AAV中,人AAV2是作为基因转移载体开发的第一AAV;它已广泛用于不同靶组织和动物模型中的高效基因转移实验。除非另有说明,本文所述的AAV衣壳、ITR和其它选择的AAV组分可以容易地选自任何AAV,包括但不限于通常鉴定为AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV8bp、AAV7M8和AAVAnc80、AAVhu68的AAV,以及任何已知或提及的AAV或尚未发现的AAV的变体或其变体或混合物。AAV9衣壳包括具有衣壳蛋白的rAAV,该衣壳蛋白包含与AAS9926499%相同的氨基酸序列。另参见,US7906111和WO 2005/033321。具有AVVhu68衣壳的rAAV描述于例如WO 2018/160582中,其通过引用并入本文。在某些实施例中,衣壳蛋白由rAAV载体名称中术语“AAV”后的数字或数字和字母的组合指定。另参见2019年2月27日提交的PCT/US19/19804和PCT/US19/19861,各自题为《新型腺相关病毒(AAV)载体、具有减少的衣壳脱酰胺作用的AAV载体及其用途(NovelAdeno-AssociatedVirus(AAV)Vectors,AAV Vectors Having Reduced Capsid Deamidation And UsesTherefor)》,其通过引用整体并入本文。
如本文所用,关于AAV,术语“变体”是指衍生自已知AAV序列的任何AAV序列,包括具有保守氨基酸置换的那些,和与氨基酸或核酸序列共有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或更大序列同一性的那些。在另一实施例中,AAV衣壳包括变体,其可以包括来自任何所述或已知AAV衣壳序列的至多约10%的变异。即,AAV衣壳与本文提供的和/或本领域已知的AAV衣壳共有约90%同一性至约99.9%同一性、约95%至约99%同一性或约97%至约98%同一性。在一个实施例中,AAV衣壳与AAV衣壳共有至少95%的同一性。当测定AAV衣壳的同一性百分比时,可以对任何可变蛋白(例如,vp1、vp2或vp3)进行比较。本文所用的“AAV9变体”包括在例如WO2016/049230、US 8,927,514、US 2015/0344911和US 8,734,809中描述的那些。
在某些实施例中,AAV衣壳选自天然和工程化的进化枝F腺相关病毒。在某些实施例中,本文提供的rAAV包含AAVhu68衣壳。AAVhu68在进化枝F.AAVhu68(SEQ ID NO:21)之内,与另一进化枝F病毒AAV9不同之处在于vp1的位置67和位置157处的两个编码氨基酸。相反,其它进化枝FAAV(AAV9、hu31、hu32)在位置67处具有Ala,在位置157处具有Ala。然而,在其它实施例中,AAV衣壳选自不同的进化枝,例如进化枝A、B、C、D或E,或选自任何这些进化枝之外的AAV来源。
rAAVhu68包括AAVhu68衣壳和载体基因组。在一个实施例中,包含rAAVhu68的组合物包含vp1的异源群体、vp2的异源群体和vp3蛋白的异源群体的组合。如本文所用,当用于指vp衣壳蛋白时,术语“异源的”或其任何语法上的变体是指由不同的元件组成的群体,例如具有不同的修饰氨基酸序列的vp1、vp2或vp3单体(蛋白质)。SEQ ID NO:21提供了AAVhu68 vp1蛋白的编码氨基酸序列。AAVhu68衣壳含有vp1蛋白、vp2蛋白和vp3蛋白内的亚群,其具有来自SEQ ID NO:21中预测的氨基酸残基的修饰。这些亚群至少包括某些脱酰胺的天冬酰胺(N或Asn)残基。例如,某些亚群在SEQ ID NO:21中的天冬酰胺-甘氨酸对中包含至少一个、两个、三个或四个高度脱酰胺的天冬酰胺(N)位置并且任选地进一步包含其它脱酰胺的氨基酸,其中脱酰胺导致氨基酸改变和其它任选的修饰。本文描述了这些和其它修饰的各种组合。
如本文所用,除非另有说明,否则vp蛋白的“亚群”是指具有至少一种共同定义的特征并且由至少一个组成员至少于参考组的所有成员组成的一组vp蛋白。
例如,除非另有说明,vp1蛋白的“亚群”是组装的AAV衣壳中的至少一(1)个vp1蛋白和少于所有的vp1蛋白。除非另有说明,vp3蛋白的“亚群”可以是组装的AAV衣壳中的一(1)个vp3蛋白至少于所有vp3蛋白。例如,vp1蛋白可以是vp蛋白的亚群;vp2蛋白可以是单独的vp蛋白亚群,而vp3是组装的AAV衣壳中的另一vp蛋白亚群。在另一实例中,vp1、vp2和vp3蛋白可以含有具有不同修饰的亚群,例如至少一个、两个、三个或四个高度脱酰胺的天冬酰胺,例如在天冬酰胺-甘氨酸对处。
除非另有说明,否则高度脱酰胺是指与参考氨基酸位置处的预测氨基酸序列相比,在参考氨基酸位置处至少45%脱酰胺、至少50%脱酰胺、至少60%脱酰胺、至少65%脱酰胺、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%、至多约100%脱酰胺(例如,基于总的vp1蛋白,SEQ ID NO:21的氨基酸57处的天冬酰胺的至少80%可以脱酰胺,或基于总的vp1、vp2和vp3蛋白,SEQ ID NO:21的氨基酸409处的天冬酰胺的20%可以脱酰胺)。这种百分比可以使用2D-凝胶、质谱技术或其它合适的技术来确定。
如本文提供的,SEQ ID NO:21的每个脱酰胺N可以独立地是天冬氨酸(Asp)、异天冬氨酸(isoAsp)、天冬氨酸,和/或Asp和isoAsp的互变共混物,或其组合。可以存在任何合适比率的α-和异天冬氨酸。例如,在某些实施例中,该比率可以是10∶1至1∶10天冬氨酸:异天冬氨酸,约50∶50天冬氨酸:异天冬氨酸,或约1:3天冬氨酸:异天冬氨酸,或另一选定比率。在某些实施例中,SEQ ID NO:21中的一个或多个谷氨酰胺(Q)脱酰胺为谷氨酸(Glu),即α-谷氨酸、γ-谷氨酸(Glu),或α-和β-谷氨酸的共混物,其可以通过常见的谷氨酰胺中间体相互转化。可以存在任何合适比率的α-和γ-谷氨酸。例如,在某些实施例中,该比率可以是从10∶1至1∶10的α∶γ,约50∶50的α∶γ,或约1∶3的α∶γ,或另一选定比率。
因此,rAAVhu68包括rAAVhu68衣壳内具有脱酰胺氨基酸的vp1、vp2和/或vp3蛋白的亚群,至少包括至少一个含有至少一种高度脱酰胺天冬酰胺的亚群。另外,其它修饰可以包括异构化,特别是在选定的天冬氨酸(D或Asp)残基位置。在其它实施例中,修饰可以包括在Asp位置的酰胺化。
在某些实施例中,AAVhu68衣壳含有vp1、vp2和vp3亚群,其具有至少4至至少约25个脱酰胺氨基酸残基位置,与SEQ ID NO:21的编码氨基酸序列相比,其中至少1至10%是脱酰胺的。这些中的大部分可以是N残基。然而,Q残基也可以是脱酰胺的。
在某些实施例中,AAVhu68衣壳的特征还在于以下的一个或多个。AAVhu68衣壳蛋白,其包含:通过从编码SEQ ID NO:21的1至736的预测氨基酸序列的核酸序列表达产生的AAVhu68 vp1蛋白,由SEQ ID NO:20产生的vp1蛋白,或由与SEQ ID NO:20至少70%相同的核酸序列产生的编码SEQ ID NO:23的1至736的预测氨基酸序列的vp1蛋白;通过从编码SEQID NO:21的至少约氨基酸138至736的预测氨基酸序列的核酸序列表达产生的AAVhu68 vp2蛋白,由包含SEQ ID NO:20的至少核苷酸412至2211的序列产生的vp2蛋白,或由与SEQ IDNO:20的至少核苷酸412至2211至少70%相同的核酸序列产生的编码SEQ ID NO:21的至少约氨基酸138至736的预测氨基酸序列的vp2蛋白,和/或通过从编码SEQ ID NO:21的至少约氨基酸203至736的预测氨基酸序列的核酸序列表达产生的AAVhu68 vp3蛋白,由包含SEQID NO:20的至少核苷酸607至2211的序列产生的vp3蛋白,或由与SEQ ID NO:20的至少核苷酸607至2211至少70%相同的核酸序列产生的编码SEQ ID NO:21的至少约氨基酸203至736的预测氨基酸序列的vp3蛋白。
另外或替代地,提供了一种AAV衣壳,其包含任选地在位置157处包含缬氨酸的vp1蛋白的异源群体、任选地在位置157处包含缬氨酸的vp2蛋白的异源群体,和vp3蛋白的异源群体,其中基于SEQ ID NO:21的vp1衣壳的编号,至少vp1和vp2蛋白的亚群在位置157处包含缬氨酸并且任选地进一步在位置67处包含谷氨酸。另外或替代地,提供了一种AAVhu68衣壳,其包含:vp1蛋白的异源群体,其是编码SEQ ID NO:21的氨基酸序列的核酸序列的产物;vp2蛋白的异源群体,其是编码SEQ ID NO:21的至少约氨基酸138至736的氨基酸序列的核酸序列的产物;以及vp3蛋白的异源群体,其是编码SEQ ID NO:21的至少氨基酸203至736的核酸序列的产物,其中:vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群。
AAVhu68 vp1、vp2和vp3蛋白通常表达为由编码SEQ ID NO:21的全长vp1氨基酸序列(氨基酸1至736)的相同核酸序列编码的替代剪接变体。任选地,单独使用vp1编码序列来表达vp1、vp2和vp3蛋白。替代地,该序列可以与编码SEQ ID NO:21的AAVhu68 vp3氨基酸序列(约aa 203至736)而不含vp1独特区(约aa 1至约aa 137)和/或vp2独特区(约aa 1至约aa202)的核酸序列或与其互补的链、相应的mRNA(SEQ ID NO:20的约nt 607至约nt 2211)或与SEQ ID NO:20至少70%至至少99%(例如,至少85%、至少90%、至少95%、至少97%、至少98%或至少99%)相同的编码SEQ ID NO:21的aa 203至736的序列中的一个或多个共表达。另外或替代地,vp1编码和/或vp2编码序列可以与编码SEQ ID NO:21的AAVhu68 vp2氨基酸序列(约aa 138至736)而不含vp1独特区(约aa 1至约137)的核酸序列或与其互补的链、相应的mRNA(SEQ ID NO:20的nt 412至2211)或与SEQ ID NO:20至少70%至至少99%(例如,至少85%、至少90%、至少95%、至少97%、至少98%或至少99%)相同的编码SEQ IDNO:21的约aa 138至736的序列共表达。
如本文所述,rAAVhu68具有在表达来自编码SEQ ID NO:21的vp1氨基酸序列的AAVhu68核酸的衣壳的生产***中产生的rAAVhu68衣壳,以及任选的其它核酸序列,例如编码不含vp1和/或vp2独特区的vp3蛋白的核酸序列。使用单一核酸序列vp1产生的rAAVhu68产生vp1蛋白、vp2蛋白和vp3蛋白的异源群体。更具体地,rAAVhu68衣壳含有vp1蛋白、vp2蛋白和vp3蛋白内的亚群,其具有来自SEQ ID NO:21中预测的氨基酸残基的修饰。这些亚群至少包括脱酰胺的天冬酰胺(N或Asn)残基。例如,天冬酰胺-甘氨酸对中的天冬酰胺是高度脱酰胺的。
在一个实施例中,AAVhu68 vp1核酸序列具有SEQ ID NO:20的序列,或与其互补的链,例如相应的mRNA。在某些实施例中,vp2和/或vp3蛋白可以另外或替代地从与vp1不同的核酸序列表达,例如,以改变所选表达***中vp蛋白的比率。在某些实施例中,还提供了编码SEQ ID NO:21的AAVhu68 vp3氨基酸序列(约aa 203至736)而不含vp1独特区(约aa 1至约aa 137)和/或vp2独特区(约aa 1至约aa 202)的核酸序列或与其互补的链、相应的mRNA(SEQ ID NO:20的约nt 607至约nt 2211)。在某些实施例中,还提供了编码SEQ ID NO:21的AAVhu68 vp2氨基酸序列(约aa 138至736)而不含vp1独特区(约aa 1至约137)的核酸序列或与其互补的链、相应的mRNA(SEQ ID NO:20的nt 412至2211)。
然而,可以选择编码SEQ ID NO:21的氨基酸序列的其它核酸序列用于产生rAAVhu68衣壳。在某些实施例中,核酸序列具有SEQ ID NO:20的核酸序列,或与SEQ ID NO:20至少70%至99%相同、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%相同的编码SEQ ID NO:21的序列。在某些实施例中,核酸序列具有SEQ ID NO:20的核酸序列,或与SEQ ID NO:20的约nt 412至约nt 2211至少70%至99%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%相同的编码SEQ ID NO:21的vp2衣壳蛋白(约aa 138至736)的序列。在某些实施例中,核酸序列具有SEQ ID NO:20的约nt607至约nt 2211的核酸序列,或与SEQ ID NO:20的约nt 607至约nt 2211至少70%至99%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%相同的编码SEQID NO:21的vp3衣壳蛋白(约aa 203至736)的序列。
设计编码该rAAVhu68衣壳的核酸序列,包括DNA(基因组或cDNA)或RNA(例如,mRNA)在本领域技术范围内。在某些实施例中,编码AAVhu68 vp1衣壳蛋白的核酸序列提供于SEQ ID NO:20。在其它实施例中,可以选择与SEQ ID NO:20具有70%至99.9%同一性的核酸序列来表达AAVhu68衣壳蛋白。在某些其它实施例中,核酸序列与SEQ ID NO:20至少约75%相同、至少80%相同、至少85%、至少90%、至少95%、至少97%相同或至少99%至99.9%相同。这种核酸序列可以是密码子优化的,可以通过各种方法设计。用于在可通过各种方法设计的选定***(即,细胞类型)中表达。这种优化可以使用在线可用的方法(绷如,GeneArt)、公开的方法或提供密码子优化服务的公司(例如,DNA2.0(加利福尼亚州门洛帕克))来进行。例如,在美国国际专利公开号WO 2015/012924中描述了一种密码子优化方法,其通过引用整体并入本文。另参见,例如,美国专利公开号2014/0032186和美国专利公开号2006/0136184。合适地,修饰用于产物的开放阅读框(ORF)的整体长度。然而,在一些实施例中,仅改变ORF的片段。通过使用这些方法之一,可以将频率应用于任何给定的多肽序列并产生编码多肽的密码子优化的编码区的核酸片段。许多选项可用于进行密码子的实际改变或用于合成如本文所述设计的密码子优化的编码区。这种修饰或合成可以使用本领域普通技术人员熟知的标准和常规分子生物学操作来进行。在一种方法中,通过标准方法合成一系列长度各为80至90个核苷酸且跨越所需序列长度的互补寡核苷酸对。合成这些寡核苷酸对,使得在退火时,它们形成含有粘性末端的80至90个碱基对的双链片段,例如,合成该对中的每个寡核苷酸以延伸3、4、5、6、7、8、9、10或更多个碱基超过与该对中的其它寡核苷酸互补的区域。每对寡核苷酸的单链端被设计成与另一对寡核苷酸的单链端退火。允许寡聚核苷酸对退火,然后允许这些双链片段中大约五至六个通过粘性单链末端退火在一起,然后将它们连接在一起并克隆到标准细菌克隆载体中,例如可以从加利福尼亚州卡尔斯巴德的英杰公司(Invitrogen Corporation)获得的载体。然后通过标准方法对构建体进行测序。制备由连接在一起的80至90个碱基对的5至6个片段,即约500个碱基对的片段组成的这些构建体中的几种,使得整个所需序列在一系列质粒构建体中表示。然后用合适的限制酶切割这些质粒的***片段并连接在一起形成最终的构建体。然后将最终的构建体克隆到标准细菌克隆载体中,并测序。其它方法对本领域技术人员来说是显而易见的。另外,基因合成在商业上很容易获得。
在某些实施例中,rAAVhu68 vp1、vp2和vp3蛋白中N-G对中的天冬酰胺(N)是高度脱酰胺的。在rAAVhu68衣壳蛋白的情况下,4个残基(N57、N329、N452、N512)在不同批次中通常显示脱酰胺水平>70%,并且在大多数情况下>90%。其它天冬酰胺残基(N94、N253、N270、N304、N409、N477和Q599)在不同批次中也显示高达约20%的脱酰胺水平。脱酰胺化水平最初使用胰蛋白酶消化鉴定并用胰凝乳蛋白酶消化验证。
在某些实施例中,rAAVhu68衣壳含有AAV vp1、vp2和/或vp3衣壳蛋白的亚群,其在rAAVhu68衣壳蛋白中具有至少四个高度脱酰胺的天冬酰胺(N)位置。在某些实施例中,约20%至50%的N-N对(不包括N-N-N三联体)显示脱酰胺作用。在某些实施例中,第一个N是脱酰胺的。在某些实施例中,第二个N是脱酰胺的。在某些实施例中,脱酰胺作用在约15%至约25%的脱酰胺作用。在SEQ ID NO:21的位置259处的Q处的脱酰胺作用是AAVhu68蛋白的AAVhu68 vp1、vp2和vp3衣壳蛋白的约8%至约42%。
在某些实施例中,rAAVhu68衣壳的特征还在于D297中vp1、vp2和vp3蛋白的酰胺化。在某些实施例中,基于SEQ ID NO:21的编号,AAVhu68衣壳中vp1、vp2和/或vp3蛋白的位置297处的D的约70%至约75%被酰胺化。在某些实施例中,衣壳的vp1、vp2和/或vp3中的至少一个Asp被异构化为D-Asp。基于SEQ ID NO:21的编号,此类异构体通常以残基位置97、107、384中的一个或多个处的Asp的小于约1%的量存在。
在某些实施例中,rAAVhu68具有AAVhu68衣壳,其具有vp1、vp2和vp3蛋白,这些蛋白具有在下表中列出的位置包含一个、两个、三个、四个或更多个脱酰胺残基的组合的亚群。rAAV中的脱酰胺作用可以使用2D凝胶电泳和/或质谱和/或蛋白质建模技术来测定。在线色谱可以用Acclaim PepMap柱和Thermo UltiMate 3000RSLC***(默飞世尔科技公司(Thermo Fisher Scientific))进行,该***与具有NanoFlex源(赛默飞世尔科技公司)的QExactive HF耦合。使用Q Exactive HF的数据依赖性top-20方法获得MS数据,从测量扫描(200至2000m/z)中动态选择最丰富的尚未测序的前体离子。通过更高能量的碰撞解离碎裂进行测序,用预测自动增益控制确定1e5离子的目标值,用4m/z的窗口进行前体的分离。在m/z 200下以120,000的分辨率获得测量扫描。HCD谱的分辨率可以在m/z200处设置为30,000,最大离子注入时间为50ms,归一化碰撞能量为30。S透镜的RF水平设置为50,以给出由来自消化物的肽占据的m/z区域的最佳透射。可以从碎片化选择中排除具有单个、未指定或六个及更高电荷状态的前体离子。BioPharma Finder 1.0软件(赛默飞世尔科技公司)可用于分析获得的数据。对于肽图谱,使用单条目蛋白质FASTA数据库进行检索,其中氨基甲酰甲基化设置为固定修饰;并且氧化、脱酰胺和磷酸化设置为可变修饰,10-ppm的质量准确度,高蛋白酶特异性,并且MS/MS谱的置信水平为0.8。合适的蛋白酶的实例可以包括例如胰蛋白酶或胰凝乳蛋白酶。脱酰胺肽的质谱鉴定相对简单,因为脱酰胺增加了完整分子的质量+0.984Da(-OH和-NH2基团之间的质量差)。特定肽的脱酰胺百分比通过脱酰胺肽的质量面积除以脱酰胺肽和天然肽的面积之和来确定。考虑到可能的脱酰胺位点的数目,在不同位点脱酰胺的等压物类可以在单个峰中共迁移。因此,源自具有多个潜在脱酰胺位点的肽的碎片离子可用于定位或区分多个脱酰胺位点。在这些情况下,观察到的同位素模式内的相对强度可用于特异性地确定不同脱酰胺肽异构体的相对丰度。这种方法假定所有异构物类的碎裂效率是相同的,并且独立于脱酰胺位点。本领域技术人员将理解,可以使用这些示例性方法的多种变型。例如,合适的质谱仪可以包括例如四极飞行时间质谱仪(QTOF),如Waters Xevo或Agilent 6530,或orbitrap仪器,如Orbitrap Fusion或Orbitrap Velos(赛默飞世尔(Thermo Fisher))。合适的液相色谱***包括例如来自沃特世(Waters)的Acquity UPLC***或安捷伦***(1100或1200系列)。合适的数据分析软件可以包括例如MassLynx(沃特世)、Pinpoint和Pepfinder(赛默飞世尔科技公司)、Mascot(Matrix科学公司(Matrix Science))、Peaks DB(生物信息学解决方案公司(BioinformaticsSolutions))。还可以描述其它技术,例如在X.Jin等人,《人类基因治疗方法(Hu GeneTherapy Methods)》,第28卷,第5期,第255至267页,于2017年6月16日在线发表。
/>
在某些实施例中,AAVhu68衣壳的特征在于具有衣壳蛋白,其中基于SEQ ID NO:21的氨基酸序列编号,至少45%的N残基在位置N57、N329、N452和/或N512中的至少一个被脱酰胺。在某些实施例中,在这些N-G位置(即,N57、N329、N452和/或N512,基于SEQ ID NO:21的氨基酸序列编号)的一个或多个处的N残基的至少约60%、至少约70%、至少约80%或至少90%被脱酰胺。在这些和其它实施例中,AAVhu68衣壳的特征还在于具有这样的蛋白质群体,其中约1%至约20%的N残基在以下的一个或多个位置具有脱酰胺作用:N94、N253、N270、N304、N409、N477和/或Q599,基于SEQ ID NO:21的氨基酸序列编号。在某些实施例中,AAVhu68包含vp1、vp2和/或vp3蛋白的至少一个亚群,其在基于SEQ ID NO:21的氨基酸序列编号的位置N35、N57、N66、N94、N113、N252、N253、Q259、N270、N303、N304、N305、N319、N328、N329、N336、N409、N410、N452、N477、N515、N598、Q599、N628、N651、N663、N709、N735中的一个或多个位置处脱酰胺,或其组合。在某些实施例中,衣壳蛋白可以具有一个或多个酰胺化的氨基酸。
还观察到其它修饰,其中大多数不导致一个氨基酸转化为不同的氨基酸残基。任选地,衣壳的vp1、vp2和vp3中的至少一个Lys被乙酰化。任选地,衣壳的vp1、vp2和/或vp3中的至少一个Asp被异构化为D-Asp。任选地,衣壳的vp1、vp2和/或vp3中的至少一个S(Ser,丝氨酸)被磷酸化。任选地,衣壳的vp1、vp2和/或vp3中的至少一个T(Thr,苏氨酸)被磷酸化。任选地,衣壳的vp1、vp2和/或vp3中的至少一个W(trp,色氨酸)被氧化。任选地,衣壳的vp1、vp2和/或vp3中的至少一个M(Met,甲硫氨酸)被氧化。在某些实施例中,衣壳蛋白具有一个或多个磷酸化。例如,某些vp1衣壳蛋白可以在位置149被磷酸化。
在某些实施例中,rAAVhu68衣壳包含vp1蛋白的异源群体,vp1蛋白是编码SEQ IDNO:21的氨基酸序列的核酸序列的产物,其中vp1蛋白包含在位置67处的谷氨酸(Glu)和/或在位置157处的缬氨酸(Val);任选地在位置157处包含缬氨酸(Val)的vp2蛋白的异源群体;以及vp3蛋白的异源群体。AAVhu68衣壳含有至少一个亚群,其中基于SEQ ID NO:21的氨基酸序列的残基编号,位于vp1蛋白的位置57处的天冬酰胺-甘氨酸对中的至少65%的天冬酰胺(N)和位于vp1、v2和vp3蛋白的位置329、452和/或512处的天冬酰胺-甘氨酸对中的至少70%的天冬酰胺(N)被脱酰胺,其中脱酰胺作用导致氨基酸改变。如本文更详细讨论的,脱酰胺天冬酰胺可以脱酰胺为天冬氨酸、异天冬氨酸、相互转化的天冬氨酸/异天冬氨酸对或其组合。在某些实施例中,rAAVhu68的特征还在于以下一个或多个:(a)vp2蛋白中的每一种独立地是至少编码SEQ ID NO:21的vp2蛋白的核酸序列的产物;(b)vp3蛋白中的每一种独立地是至少编码SEQ ID NO:21的vp3蛋白的核酸序列的产物;(c)编码vp1蛋白的核酸序列是SEQ ID NO:21,或与SEQ ID NO:20至少70%至至少99%(例如,至少85%、至少90%、至少95%、至少97%、至少98%或至少99%)相同的编码SEQ ID NO:21的氨基酸序列的序列。任选地,该序列单独用于表达vp1、vp2和vp3蛋白。替代地,该序列可以与编码SEQ ID NO:21的AAVhu68 vp3氨基酸序列(约aa 203至736)而不含vp1独特区(约aa 1至约aa 137)和/或vp2独特区(约aa 1至约aa 202)的核酸序列或与其互补的链、相应的mRNA(SEQ ID NO:20的约nt 607至约nt 2211)或与SEQ ID NO:20至少70%至至少99%(例如,至少85%、至少90%、至少95%、至少97%、至少98%或至少99%)相同的编码SEQ ID NO:21的aa 203至736的序列中的一个或多个共表达。另外或替代地,vp1编码和/或vp2编码序列可以与编码SEQ IDNO:21的AAVhu68 vp2氨基酸序列(约aa 138至736)而不含vp1独特区(约aa 1至约137)的核酸序列或与其互补的链、相应的mRNA(SEQ ID NO:20的nt 412至2211)或与SEQ ID NO:20至少70%至至少99%(例如,至少85%、至少90%、至少95%、至少97%、至少98%或至少99%)相同的编码SEQ lD NO:21的约aa 138至736的序列共表达。
另外或替代地,rAAVhu68衣壳包含vp1、vp2和/或vp3蛋白的至少一个亚群,其在基SEQ ID NO:21的编号的位置N57、N66、N94、N113、N252、N253、Q259、N270、N303、N304、N305、N319、N328、N329、N336、N409、N410、N452、N477、N512、N515、N598、Q599、N628、N651、N663、N709中的一个或多个位置处脱酰胺,或其组合;(e)rAAVhu68衣壳包含vp1、vp2和/或vp3蛋白的亚群,其包含基于SEQ ID NO:21的编号在位置N66、N94、N113、N252、N253、Q259、N270、N303、N304、N305、N319、N328、N336、N409、N410、N477、N515、N598、Q599、N628、N651、N663、N709中的一个或多个位置处的1%至20%脱酰胺,或其组合;(f)rAAVhu68衣壳包含vp1亚群,其中基于SEQ ID NO:21的编号,在vpl蛋白的位置57处的65%至100%的N被脱酰胺;(g)rAAVhu68衣壳包含vp1蛋白的亚群,其中vp1蛋白的位置57处的N的75%至100%被脱酰胺;(h)rAAVhu68衣壳包含vp1蛋白、vp2蛋白和/或vp3蛋白的亚群,其中基于SEQ ID NO:21的编号,在位置329处的N的80%至100%被脱酰胺;(i)rAAVhu68衣壳包含vp1蛋白、vp2蛋白和/或vp3蛋白的亚群,其中基于SEQ ID NO:21的编号,在位置452处的N的80%至100%被脱酰胺;(j)rAAVhu68衣壳包含vp1蛋白、vp2蛋白和/或vp3蛋白的亚群,其中基于SEQ ID NO:21的编号,在位置512处的N的80%至100%被脱酰胺;(k)rAAV包含约60种总衣壳蛋白,比例为约1vp1蛋白:约1至1.5vp2蛋白:3至10vp3蛋白;(1)rAAV包含约60种总衣壳蛋白,比例为约lvp1蛋白:约1vp2蛋白:3至9vp3蛋白。
在某些实施例中,修饰AAVhu68以改变天冬酰胺-甘氨酸对中的甘氨酸,以减少脱酰胺作用。在其它实施例中,天冬酰胺被改变为不同的氨基酸,例如以较慢的速率脱酰胺的谷氨酰胺;或缺少酰胺基的氨基酸(例如,谷氨酰胺和天冬酰胺含有酰胺基);和/或缺少胺基的氨基酸(例如,赖氨酸、精氨酸和组氨酸含有酰胺基)。如本文所用,缺少酰胺或胺侧基的氨基酸是指例如甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸、胱氨酸、苯内氨酸、酪氨酸或色氨酸和/或脯氨酸。如所述的修饰可以是在编码的AAVhu68氨基酸序列中发现的一个、两个或三个天冬酰胺-甘氨酸对。在某些实施例中,不对所有四种天冬酰胺-甘氨酸对进行此类修饰。因此,提供了一种用于减少具有较低脱酰胺率的rAAVhu68和/或工程化rAAVhu68变体的脱酰胺作用的方法。另外,可以将一个或多个其它酰胺氨基酸改变为非酰胺氨基酸以减少rAAVhu68的脱酰胺作用。
这些氨基酸修饰可以通过常规基因工程技术进行。例如,可以生成含有修饰的AAVhu68 vp密码子的核酸序列,其中编码SEQ ID NO:21(天冬酰胺-甘氨酸对)中位置58、330、453和/或513处甘氨酸的一至三个密码子被修饰以编码除甘氨酸以外的氨基酸。在某些实施例中,含有修饰的天冬酰胺密码子的核酸序列可以在位于SEQ ID NO:21中位置57、329、452和/或512处的天冬酰胺-甘氨酸对中的一至三个处被工程化,使得修饰的密码子编码除天冬酰胺以外的氨基酸。每个修饰的密码子可以编码不同的氨基酸。替代地,一个或多个改变的密码子可以编码相同的氨基酸。在某些实施例中,这些修饰的AAVhu68核酸序列可用于生成突变体rAAVhu68,其衣壳的脱酰胺作用低于天然hu68衣壳。这种突变体rAAVhu68可以具有降低的免疫原性和/或增加的储存稳定性,特别是以悬浮液形式储存。如本文所用,“密码子”是指编码氨基酸的序列中的三个核苷酸。
如本文所用,“编码的氨基酸序列”是指基于被翻译为氨基酸的参考核酸序列的已知DNA密码子的翻译而预测的氨基酸。下表说明了DNA密码子和20种常见氨基酸,示出了单字母代码(SLC)和三字母代码(3LC)。
如本文所用,术语“进化枝”当涉及AAV组时是指基于AAV vp1氨基酸序列的比对,使用邻接算法通过至少75%(至少1000个复制品)的自举值和不超过0.05的泊松校正距离测量值确定的一组彼此***发育相关的AAV。在文献中已经描述了邻接算法。参见,例如,M.Nei和S.Kumar,《分子进化与***发育(Molecular Evolution and Phylogenetics)》(牛津大学山版社(Oxford UniversityPress),纽约(2000)。可以使用计算机程序来实现这种算法。例如,MEGAv2.1程序实施改进的Nei-Gojobori方法。使用这些技术和计算机程序,以及AAVvp1衣壳蛋白的序列,本领域技术人员可以容易地确定所选择的AAV是否包含在本文鉴定的一个进化枝中,在另一个进化枝中,或在这些进化枝之外。参见,例如,G Gao等人,《病毒学杂志(J Virol)》,2004年6月;78(10:6381-6388,其鉴定进化枝A、B、C、D、E和F,基因库入藏号AY530553至AY530629。另参见,WO 2005/033321。
已经描述了生成衣壳及其编码序列的方法,以及生产rAAV病毒载体的方法。参,见,例如,Gao等人,《美国国家科学院院刊》100(10),6081-6086(2003)和US 2013/0045186A1。
ITR或其它AAV组分可以使用本领域技术人员可获得的技术从AAV容易地分离或工程化。这种AAV可以是分离的、工程化的或从学术,商业或公共来源(例如,美国菌种保藏中心,弗吉尼亚州马纳萨斯(American Type Culture Collection,Manassas,VA))获得。替代地,AAV序列可以通过合成或其它合适的方法通过参考已公开的序列而被工程化,这些公开的序列如文献中或数据库(例如,基因库(GenBank)、PubMed等)中可获得的。AAV病毒可以通过常规分子生物学技术工程化,使得可以优化这些颗粒用于核酸序列的细胞特异性递送,用于最小化免疫原性,用于调整稳定性和颗粒寿命,用于有效降解,用于精确递送至细胞核等。
在某些实施例中,rAAV是自互补的AAV。“自互补的AAV”是指其中重组AAV核酸序列携带的编码区已被设计形成分子内双链DNA模板的构建体。在感染时,scAAV的两个互补半部分将结合形成一个双链DNA(dsDNA)单元,准备立即复制和转录,而不是等待细胞介导的第二条链的合成。参见,例如,D M McCarty等人,《自互补重组腺相关病毒(scAAV)载体促进独立于DNA合成的有效转导(Self-complementary recombinant adeno-associated virus(scAAV)vectors promote efficient transduction independently of DNAsynthesis)》,《基因治疗》(2001年8月),第8卷,第16期,第1248至1254页。自互补的AAV描述于例如美国专利第6,596,535号;第7,125,717号;和第7,456,683号,其各自以全文引用的方式并入本文。
在某些实施例中,rAAV是抗核酸酶的。这种核酸酶可以是单一核酸酶或核酸酶的混合物,并且可以是核酸内切酶或核酸外切酶。抗核酸酶的rAAV表明AAV衣壳已完全组装并保护这些包装的基因组序列在核酸酶孵育步骤期间免于降解(消化),核酸酶孵育步骤被设计用于除去可能存在于生产过程中的污染核酸。在许多情况下,本文所述的rAAV是DNase抗性的。
本文所述的重组腺相关病毒(AAV)可以使用已知的技术生成。参见,例如,WO2003/042397;WO 2005/033321、WO 2006/110689;US 7588772 B2。这种方法涉及培养含有编码AAV衣壳的核酸序列的宿主细胞;功能性rep基因;如本文所述的表达盒,其侧翼为AAV反向末端重复序列(ITR);和足够的辅助功能以允许表达盒包装到AAV衣壳蛋白中。本文还提供了含有编码AAV衣壳的核酸序列的宿主细胞;功能性rep基因;所述载体基因组;和足够的辅助功能以允许将载体基因组包装到AAV衣壳蛋白中。在一个实施例中,宿主细胞是HEK293细胞。这些方法在WO2017160360 A2中有更详细的描述,其通过引用并入本文。
可以使用本领域技术人员可获得的产生rAAV的其它方法。合适的方法可以包括但不限于杆状病毒表达***或通过酵母的生产。参见,例如,Robert M.Kotin,《大规模重组腺相关病毒生产(Large-scale recombinant adeno-associated virus production)》《人类分子遗传学(Hum Mol Genet.)》2011年4月15日;20(R1):R2-R6。于2011年4月29日在线发表。doi:10.1093/hmg/ddr141;Aucoin MG等人,《利用三重感染在昆虫细胞中生产腺相关病毒载体:杆状病毒浓度比的优化(Production of adeno-associated viral vectors ininsect cells using triple infection:optimization of baculovirus concentrationratios)》《生物技术与生物工程(Biotechnol Bioeng.)》2006年12月20日;95(6):1081-92;SAMI S.THAKUR,《在酵母中生产重组腺相关病毒载体(Production of RecombinantAdeno-associated viral vectors in yeast)》提交给佛罗里达大学研究生院的论文,2012;Kondratov O等人《在人与昆虫细胞中制备的重组腺相关病毒载体的直接头对头评估(Direct Head-to-Head Evaluation of Recombinant Adeno-associated Viral VectorsManufactured in Human versus Insect Cells)》,《分子疗法》2017年8月10日。pii:S1525-0016(17)30362-3。doi:10.1016/j.ymthe.2017.08.003.[印刷出版前的电子版];Mietzsch M等人,OneBac 2.0:《用于生产AAV1、AAV2和AAV8载体的Sf9细胞系,具有最小的外源DNA包被(Sf9Cell Lines for Production of AAV1,AAV2,and AAV8 Vectors withMinimal Encapsidation of Foreign DNA)》《人类基因治疗方法(Hum GeneTherMethods)》2017年2月;28(1):15-22.doi:10.1089/hgtb.2016.164;Li L等人《新型重组腺相关病毒复制型基因组的产生和表征:用于基因转移的真核DNA来源(Production andcharacterization ofnovel recombinant adeno-associated virus replicative-formgenomes:a eukaryotic source of DNA for gene transfer)》《美国科学公共图书馆(PLoS One.)》2013年8月1日;8(8):e69879.doi:10.1371/journal.pone.0069879.2013印本;Galibert等人,《昆虫细胞中腺相关病毒载体大规模生产对治疗神经肌肉疾病的最新进展(Latest developments in the large-scale production of adeno-associatedvirus vectors in insect cells toward the treatment of neuromusculardiseases)》《无脊椎动物病理学杂志(J Invertebr Pathol.)》2011年7月;107补编:S80-93。doi:10.1016/j.jip.2011.05.008;和Kotin RM,《大规模重组腺相关病毒生产(Large-scale recombinant adeno-associated virus production)》《人类分子遗传学(Hum MolGenet.)》2011年4月15日;20(R1):R2-6.doi:10.1093/hmg/ddr141。电子版2011年4月29日。
本领域已知多种AAV纯化方法。参见例如题为《AAV9的可规模化纯化方法(Scalable Purification Method for AAV9)》的WO 2017/160360,其通过引用并入本文,并描述了通常用于进化枝F衣壳的方法。使用两步亲和色谱法纯化,接着阴离子交换树脂色谱法纯化载体药物产物并除去空衣壳。粗细胞采集物可以经历以下步骤,如载体采集物的浓缩、载体采集物的渗滤、载体采集物的微流化、载体采集物的核酸酶消化、微流化中间体的过滤、通过色谱法的粗纯化、通过超速离心的粗纯化、通过切向流过滤的缓冲液交换,和/或配制和过滤以制备批量载体。在阴离子交换树脂层析之后进行亲和层析纯化用于纯化载体药物产物和除去空衣壳。在一个实例中,对于亲和层析步骤,渗滤产物可应用于有效捕获AAV2/9血清型的Capture SelectTM Poros-AAV2/9亲和树脂(生命科技公司(LifeTechnologies))。在这些离子条件下,显著百分比的残留细胞DNA和蛋白质流经色谱柱,而AAV颗粒被有效捕获。另参见,WO2021/158915;WO2019/241535;和WO 2021/165537。
本领域技术人员可获得表征或定量rAAV的常规方法。为了计算空的和满的颗粒含量,将选定样品(例如,在本文的实例中,碘克沙醇梯度纯化的制剂,其中GC的数量=颗粒的数量)的VP3谱带体积相对于附着的GC颗粒作图。所得线性方程(y=mx+c)用于计算供试品峰的谱带体积中的颗粒数。然后将每20μL负载的颗粒数(pt)乘以50,得到颗粒(pt)/mL。Pt/mL除以GC/mL得到颗粒与基因组拷贝的比率(pt/GC)。Pt/mL-GC/mL得到空pt/mL。空pt/mL除以pt/mL,x100得到空颗粒的百分比。通常,用包装的基因组测定空衣壳和AAV载体颗粒的方法是本领域已知的。参见,例如,Grimm等人,《基因治疗》(1999)6:1322-1330;Sommer等人,《分子疗法(Molec.Ther.)》(2003)7:122-128。为了测试变性的衣壳,该方法包括将处理的AAV原种进行SDS-聚丙烯酰胺凝胶电泳,其由能够分离三种衣壳蛋白的任何凝胶组成,例如,在缓冲液中含有3至8%Tris-乙酸酯的梯度凝胶,然后运行凝胶直到样品材料被分离,并将凝胶印迹到尼龙或硝化纤维膜上,优选地尼龙。然后将抗AAV衣壳抗体用作与变性衣壳蛋白结合的第一抗体,优选地抗AAV衣壳单克隆抗体,最优选地B1抗AAV-2单克隆抗体(Wobus等人,《病毒学杂志》(2000)74:9281-9293)。然后使用第二抗体,其与第一抗体结合并含有用于检测与第一抗体结合的手段,更优选地含有与其共价结合的检测分子的抗IgG抗体,最优选地与辣根过氧化物酶共价连接的羊抗小鼠IgG抗体。用于检测结合的方法用于半定量测定第一抗体和第二抗体之间的结合,优选地能够检测放射性同位素发射、电磁辐射或比色变化的检测方法,最优选地化学发光检测试剂盒。例如,对于SDS-PAGE,可以从柱级分中取出样品并在含有还原剂(例如,DTT)的SDS-PAGE上样缓冲液中加热,并且将衣壳蛋白在预制梯度聚丙烯酰胺凝胶(例如,Novex)上解析。可以使用SilverXpress(英杰公司(Invitrogen),加利福尼亚州)根据制造商的说明书或其它合适的染色方法(即SYPRO红宝石或考马斯染色)进行银染色。在一个实施例中,可以通过定量实时PCR(Q-PCR)测量柱级分中AAV载体基因组(vg)的浓度。将样品稀释并用DNase I(或另一种合适的核酸酶)消化以除去外源DNA。在核酸酶失活后,使用引物和对引物之间的DNA序列特异性的TaqManTM荧光探针进一步稀释和扩增样品。在Applied Biosystems Prism 7700序列检测***上测量每个样品达到规定荧光水平所需的循环数(阈值循环,Ct)。使用含有与AAV载体中所含序列相同的序列的质粒DNA在Q-PCR反应中生成标准曲线。从样品获得的循环阈值(Ct)值用于通过将其标准化为质粒标准曲线的Ct值来确定载体基因组滴度。也可以使用基于数字PCR的终点分析。如本文所用,术语基因组拷贝(GC)和载体基因组(vg)在剂量或剂量(例如,GC/kg和vg/kg)的上下文中是可互换的。
在一个方面,使用优化的q-PCR方法,其利用广谱丝氨酸蛋白酶,例如蛋白酶K(如可购自凯杰公司(Qiagen))。更具体地,优化的qPCR基因组滴度测定类似于标准测定,除了在DNase I消化后,将样品用蛋白酶K缓冲液稀释并用蛋白酶K处理,然后热灭活。合适地,用蛋白酶K缓冲液以等于样品大小的量稀释样品。蛋白酶K缓冲液可以浓缩至2倍或更高。通常,蛋白酶K处理为约0.2mg/mL,但可以在0.1mg/mL至约1mg/mL之间变化。处理步骤通常在约55℃下进行约15分钟,但可以在较低温度(例如,约37℃至约50℃)下进行较长时段(例如,约20分钟至约30分钟),或在较高温度(例如,高达约60℃)下进行较短时段(例如,约5至10分钟)。类似地,热灭活通常在约95℃下持续约15分钟,但可以降低温度(例如,约70至约90℃)并延长时间(例如,约20分钟至约30分钟)。然后将样品稀释(例如,1000倍)并如标准测定中所述进行TaqMan分析。
另外或替代地,可以使用液滴数字PCR(ddPCR)。例如,已经描述了通过ddPCR测定单链和自互补AAV载体基因组滴度的方法。参见,例如,M.Lock等人,《人类基因治疗方法》,《人类基因治疗方法》2014年4月;25(2):115-25.doi:10.1089/hgtb.2013.131.电子版2014年2月14日。
用于测定衣壳蛋白的vp1、vp2和vp3之间的比率的方法也是可用的。参见,例如,Vamseedhar Rayaprolu等人,《腺相关病毒衣壳稳定性和动力学的比较分析(ComparativeAnalysis of Adeno-Associated Virus Capsid Stability and Dynamics)》,《病毒学杂志》2013年12月;87(24):13150-13160;Buller RM,Rose JA.1978.《KB细胞中腺病毒相关病毒诱导多肽的特征(Characterization of adenovirus-associated virus-inducedpolypeptides in KB cells)》《病毒学杂志》25:331-338;和Rose JA,Maizel JV,InmanJK,Shatkin AJ.1971.《腺病毒相关病毒的结构蛋白(Structural proteins ofadenovirus-associated viruses)》《病毒学杂志》8:766-770.
如本文所用,术语“治疗(treatment)”或“治疗(treating)”是指用于缓解法布里病的一种或多种症状、恢复hGLA的所需功能或改善疾病的生物标志物的目的的组合物和/或方法。在一些实施例中,术语“治疗(treatment)”或“治疗(treating)”被定义为涵盖出于本文指示的目的向受试者施用一种或多种本文所述的组合物。因此,“治疗”可以包括在给定受试者中减少法布里病的发作或进展、预防疾病、降低疾病症状的严重性、延缓其进展、消除疾病症状、延缓疾病的进展或增加治疗疗效中的一种或多种。
应当理解,本文所述rAAV中的组合物旨在应用于说明书中描述的其它组合物、方案、方面、实施例和方法。
5.药物组合物或制剂
在某些实施例中,本文提供了一种药物组合物,其在制剂缓冲液中包含本文所述的载体,如rAAV。在某些实施例中,药物组合物适于与功能性hGLA蛋白(ERT)(例如Fabrazyme)或伴侣疗法(例如Galafold(米加司他(migalastat))、爱美医疗公司(AmicusTherapeutics))共同施用。在一个实施例中,提供了一种药物组合物,其在制剂缓冲液中包含本文所述的rAAV。在某些实施例中,rAAV以约1x109基因组拷贝(GC)/mL至约1x1014GC/mL配制。在另一实施例中,rAAV以约3x109GC/mL至约3x1013GC/mL配制。在又一实施例中,rAAV以约1x109GC/mL至约1x1013GC/mL配制。在一个实施例中,rAAV以至少约1x1011GC/mL配制。
在某些实施例中,药物组合物包含在非病毒或病毒载体***中包含hGLA编码序列的表达盒。这可以包括例如裸DNA、裸RNA、无机颗粒、脂质或脂质样颗粒、基于壳聚糖的制剂和本领域已知的和例如由Ramamoorth和Narvekar描述的其它制剂,如上所述)。这种非病毒载体***可以包括例如质粒或非病毒遗传元件,或基于蛋白质的载体。
在某些实施例中,药物组合物包含非复制型病毒载体。合适的病毒载体可以包括任何合适的递送载体,例如重组腺病毒、重组慢病毒、重组博卡病毒、重组腺相关病毒(AAV)或另一种重组细小病毒。在某些实施例中,病毒载体是用于将hGLA递送至有需要的患者的重组AAV。
如本文所用,rAAV“原种”是指rAAV群体。尽管它们的衣壳蛋白由于脱酰胺作用而具有异质性,但是预计原种中的rAAV共有相同的载体基因组。原种可以包括具有衣壳的rAAV,这些衣壳具有例如所选AAV衣壳蛋白和所选生产***的异质脱酰胺模式特征。原种可以由单个生产***生产或由生产***的多个运行汇集。可以选择各种生产***,包括但不限于本文所述的那些。
在一个实施例中,药物组合物包含载体和制剂缓冲液,载体包括包含hGLA编码序列的表达盒,制剂缓冲液适于通过脑室内(ICV)、鞘内(IT)、脑池内或静脉内(IV)注射递送。在一个实施例中,包含hGLA编码序列的表达盒包装在重组AAV中。
在一个实施例中,药物组合物包含功能性hGLA多肽或其功能性片段,用于作为酶替代疗法(ERT)递送至受试者。这种药物组合物通常静脉内施用,然而在一些情况下皮内、肌内或口服施用也是可能的。该组合物可用于预防性治疗患有法布里病或处于法布里病危险中的个体。对于治疗应用,将药物组合物以足以降低累积的代谢物的浓度和/或预防或阻止代谢物的进一步累积的量施用于患有确定疾病的患者。对于处于溶酶体酶缺乏症风险中的个体,以足以预防或抑制代谢物累积的量预防性地施用药物组合物。包含本文所述的hGLA蛋白的药物组合物以治疗有效量施用。通常,治疗有效量可以根据受试者的医学病状的严重程度以及受试者的年龄、总体状况和性别而变化。剂量可以由医师确定并且可以根据需要进行调整以适合所观察到的治疗效果。在一个方面,本文提供了配制成含有单位剂量的hGLA蛋白或其功能片段的用于ERT的药物组合物。
在某些实施例中,制剂进一步包含溶解在水性悬浮液中的表面活性剂、防腐剂、赋形剂和/或缓冲液。在一个实施例中,缓冲液是PBS。在另一实施例中,缓冲液是人工脑脊液(aCSF),例如艾略特制剂缓冲液(Eliott′s formulation buffer);或哈佛仪器灌注流体(Harvard apparatus perfusion fluid)(具有最终离子浓度(以mM计)的人工CSF:Na 150;K 3.0;Ca 1.4;Mg 0.8;P 1.0;C1155)。各种合适的溶液是已知的,包括那些包括以下一种或多种的溶液:缓冲盐水、表面活性剂和调节至相当于约100mM氯化钠(NaCl)至约250mM氯化钠的离子强度的生理上相容的盐或盐的混合物,或调节至相当于离子浓度的生理上相容的盐。
合适地,将制剂调节至生理上可接受的pH,例如在pH 6至8,或pH 6.5至7.5,pH7.0至7.7,或pH 7.2至7.8的范围内。由于脑脊液的pH为约7.28至约7.32,对于鞘内递送,在此范围内的pH可能是期望的;而对于静脉内递送,pH为6.8至约7.2可能是期望的。然而,在最宽范围和这些子范围内的其它pH可以选择用于其它递送途径。
合适的表面活性剂或表面活性剂的组合可以选自无毒的非离子表面活性剂。在一个实施例中,选择终止于伯羟基的双官能嵌段共聚物表面活性剂,例如F68[BASF],也称为泊洛沙姆(Poloxamer)188,其具有中性pH,具有8400的平均分子量。可以选择其它表面活性剂和其它泊洛沙姆,即由侧翼为两个聚氧乙烯(聚(环氧乙烷))的亲水链的聚氧丙烯(聚(环氧丙烷))的中心疏水链、SOLUTOL HS 15(聚乙二醇-15羟基硬脂酸酯)、LABRASOL(聚氧辛酸甘油酯)、聚氧10油基醚、TWEEN(聚氧乙烯山梨醇脂肪酸酯)、乙醇和聚乙二醇组成的非离子三嵌段共聚物。在一个实施例中,制剂含有泊洛沙姆。这些共聚物通常用字母“P”(对于泊洛沙姆)后跟三个数字命名:前两个数字×100得到聚氧丙烯核的近似分子量,最后一个数字×10得到聚氧乙烯含量的百分比。在一个实施例中,选择泊洛沙姆188。表面活性剂可以以悬浮液的至多约0.0005%至约0.001%的量存在。
在一个实例中,制剂可以含有例如缓冲盐水溶液,该缓冲盐水溶液在水中包含氯化钠、碳酸氢钠、右旋糖、硫酸镁(例如,硫酸镁·7H2O)、氯化钾、氯化钙(例如,氯化钙·2H2O)、磷酸氢二钠及其混合物中的一种或多种。合适地,对于鞘内递送,渗透压在与脑脊液相容的范围内(例如,约275至约290);参见例如,emedicine.medscape.com/article/2093316-overview。任选地,对于鞘内递送,市售稀释剂可用作悬浮剂,或与另一悬浮剂和其它任选赋形剂组合使用。参见,例如,Elliotts溶液[Lukare医疗公司]。
在某些实施例中,制剂可以含有一种或多种渗透增强剂。合适的渗透增强剂的实例可以包括例如甘露醇、甘胆酸钠、牛磺胆酸钠、脱氧胆酸钠、水杨酸钠、辛酸钠、癸酸钠、十二烷基硫酸钠、聚氧乙烯-9-月桂基醚或EDTA。
在一个实施例中,提供了冷冻形式的冷冻组合物,其含有本文所述的在缓冲溶液中的rAAV。任选地,一种或多种表面活性剂(例如,普朗尼克(Pluronic)F68)、稳定剂或防腐剂存在于该组合物中。合适地,为了使用,将组合物解冻并用合适的稀释剂(例如,无菌盐水或缓冲盐水)滴定至所需剂量。
在某些实施例中,本文提供了一种药物组合物,其包含本文所述的载体(如rAAV)和药学上可接受的载体。如本文所用,“载体”包括任何和所有溶剂、分散介质、媒介物、包衣、稀释剂、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂、缓冲液、载体溶液、悬浮液、胶体等。此类介质和药剂用于药物活性物质的用途是本领域熟知的。辅助活性成分也可以掺入组合物中。递送媒介物(如脂质体、纳米胶囊、微粒、微球、脂质颗粒、囊泡等)可用于将本发明的组合物引入合适的宿主细胞。特别地,rAAV载体可以配制成包封在脂质颗粒、脂质体、囊泡、纳米球或纳米颗粒等中的递送形式。在一个实施例中,治疗有效量的所述载体包括在药物组合物中。载体的选择不是对本发明的限制。其它常规的药学上可接受的载体,如防腐剂或化学稳定剂。合适的示例性防腐剂包括氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香草醛、甘油、苯酚和对氯苯酚。合适的化学稳定剂包括明胶和白蛋白。
短语“药学上可接受的”是指当施用于宿主时不产生过敏或类似不良反应的分子实体和组合物。
如本文所用,术语“剂量”或“量”可以指在治疗过程中递送至受试者的总剂量或量,或在单一单位(或多个单位或分开的剂量)施用中递送的剂量或量。
而且,复制缺陷型病毒组合物可以配制成含有复制缺陷型病毒的剂量单位,复制缺陷型病毒的量在约1.0x109GC至约1.0x1016Gc的范围内(以治疗平均体重为70kg的受试者),包括该范围内的所有整数或分数,对于人类患者优选地1.0x1012GC至1.0x1014GC。在一个实施例中,将组合物配制成每剂量含有至少1x109、2x109、3x109、4x109、5x109、6x109、7x109、8x109或9x109GC,包括该范围内的所有整数或分数量。在另一实施例中,将组合物配制成每剂量含有至少1x1010、2x1010、3x1010、4x1010、5x1010、6x1010、7x1010、8x1010或9x1010GC,包括该范围内的所有整数或分数量。在另一实施例中,将组合物配制成每剂量含有至少1x1011、2x1011、3x1011、4x1011、5x1011、6x1011、7x1011、8x1011或9x1011GC,包括该范围内的所有整数或分数量。在另一实施例中,将组合物配制成每剂量含有至少1x1012、2x1012、3x1012、4x1012、5x1012、6x1012、7x1012、8x1012或9x1012GC,包括该范围内的所有整数或分数量。在另一实施例中,将组合物配制成每剂量含有至少1x1013、2x1013、3x1013、4x1013、5x1013、6x1013、7x1013、8x1013或9x1013GC,包括该范围内的所有整数或分数量。在另一实施例中,将组合物配制成每剂量含有至少1x1014、2x1014、3x1014、4x1014、5x1014、6x1014、7x1014、8x1014或9x1014GC,包括该范围内的所有整数或分数量。在另一实施例中,将组合物配制成每剂量含有至少1x1015、2x1015、3x1015、4x1015、5x1015、6x1015、7x1015、8x1015或9x1015GC,包括该范围内的所有整数或分数量。在一个实施例中,对于人类应用,剂量可以为每剂量1x1010至约1x1012GC,包括该范围内的所有整数或分数量。
在某些实施例中,提供了一种药物组合物,其在制剂缓冲液中包含本文所述的rAAV。在一个实施例中,rAAV以约1x109基因组拷贝(GC)/mL至约1x1014GC/mL配制。在另一实施例中,rAAV以约3x109GC/mL至约3x1013GC/mL配制。在又一实施例中,rAAV以约1x109GC/mL至约1x1013GC/mL配制。在一个实施例中,rAAV以至少约1x1011GC/mL配制。在一个实施例中,包含本文所述的rAAV的药物组合物可以以约1x109GC/克脑质量至约1x1014GC/克脑质量的剂量施用。
在某些实施例中,组合物可以配制在合适的水性悬浮介质(例如,缓冲盐水)中用于通过任何合适的途径递送。本文提供的组合物可用于全身递送高剂量的病毒载体。对于rAAV,高剂量可以是至少1x1013GC或至少1x1014GC。然而,为了提高安全性,本文提供的miRNA序列可以包含在以其它较低剂量递送的表达盒和/或载体基因组中。
本文所述的水性悬浮液或药物组合物被设计用于通过任何合适的途径或不同途径的组合递送至有需要的受试者。在一个实施例中,药物组合物被配制用于通过脑室内(ICV)、鞘内(IT)或脑池内注射递送。在一个实施例中,本文所述的组合物被设计用于通过静脉内(IV)注射递送至有需要的受试者。替代地,可以选择其它施用途径(例如,口服、吸入、鼻内、气管内、动脉内、眼内、肌内和其它肠胃外途径)。在某些实施例中,组合物基本上同时通过两种不同的途径递送。
如本文所用,术语“鞘内递送”或“鞘内施用”是指药物经由注射到椎管中,更具体地注射到蛛网膜下腔中使得其到达脑脊液(CSF)的施用途径。鞘内递送可以包括腰椎穿刺、心室内、枕下/脑池内和/或C1-2穿刺。例如,可以通过腰椎穿刺引入材料以扩散到整个蛛网膜下腔。在另一实例中,注射可以进入小脑延髓池。脑池内递送可以增加载体扩散和/或减少由施用引起的毒性和炎症。参见,例如,Christian Hinderer等人,《AAV9递送至小脑延髓池后在食蟹猴中枢神经***的广泛基因转移(Widespread gene transfer in thecentral nervous system of cynomolgus macaques following delivery of AAV9 intothe cisterna magna)》,《分子治疗方法与临床开发(Mol Ther Methods Clin Dev.)》2014;1:14051.于2014年12月10日在线发表。doi:10.1038/mtm.2014.51.
如本文所用,术语“脑池内递送”或“脑池内施用”是指将药物直接施用于脑室的脑脊液中或小脑延髓池内的施用途径,更具体地通过枕下穿刺或通过直接注射到小脑延髓池中或通过永久定位的管。
应当理解,本文所述药物组合物中的组合物旨在应用于说明书中描述的其它组合物、方案、方面、实施例和方法。
6.治疗方法
本文提供了用于法布里病的方法,其包含递送治疗有效量的包括本文提供的hGLA编码序列的核酸序列或表达盒。具体地,该方法包括通过向有需要的患者递送治疗有效量的rAAV.hGLA或包括本文所述的hGLA多肽的组合物来预防、治疗和/或缓解法布里病的症状。在某些实施例中,将包含本文所述的表达盒的组合物施用于有需要的受试者。在某些实施例中,表达盒通过rAAV递送。
如本文所用,“治疗有效量”是指递送足以缓解或治疗法布里病的一种或多种症状的量的hGLA的组合物的量。“治疗”可以包括预防法布里病症状的恶化和可能逆转其一种或多种症状。人类患者的“治疗有效量”可以基于动物模型来预测。参见,C.Hinderer等人,《分子疗法》(2014);2212,2018-2027;A.Bradbury等人,《人类基因疗法临床发展(Human GeneTherapy Clinical Development)》2015年3月,26(1):27-37,其通过引用并入本文。
在某些实施例中,治疗包括预防、治疗和/或缓解法布里病的一种或多种症状,包括例如肾病、心肌病、疼痛、疲劳、中风、听力损失、胃肠病症。
在某些实施例中,治疗包括将本文所述的表达盒、核酸、载体(例如rAAV)或多肽递送至微脉管***、肾细胞、心脏/心脏细胞、外周神经和中枢神经***的细胞中的一种或多种。在某些实施例中,治疗导致心肌细胞、足细胞、血管内皮细胞和背根神经节中的一种或多种中的α-GalA底物减少。在某些实施例中,治疗导致肾脏中α-GalA底物减少。在某些实施例中,治疗导致肾小管中α-GalA底物减少。
在某些实施例中,治疗包括通过基于rAAV的基因疗法替换或补充患者的缺陷型α-半乳糖苷酶A。如本文所述的rAAV载体所表达的,在CSF、血清、神经元或其它组织或流体中检测到的正常水平的至少约2%的表达水平可以提供治疗效果。然而,可以实现更高的表达水平。这种表达水平可以是正常功能性人GLA水平的2%至约100%。在某些实施例中,可以在血清或另一种生物流体或组织中检测到高于正常的表达水平。
如本文所用,术语“NAb滴度”是产生多少中和抗体(例如,抗AAV Nab)的量度,该中和抗体中和其靶向表位(例如,AAV)的生理效应。抗AAV NAb滴度可以如Calcedo,R.等人,《腺相关病毒中和抗体的全球流行病学(Worldwide Epidemiology of NeutralizingAntibodies to Adeno-Associated Viruses)》《传染病杂志(Journal of InfectiousDiseases)》,2009。199(3):第381至390页中所述进行测量,其通过引用并入本文。
在某些实施例中,本文提供的组合物可用于将所需功能的hGLA产物递送至患者,同时抑制背根神经节神经元中的基因和/或基因产物的表达。在某些实施例中,该方法包括向患者递送包含表达盒的组合物,该表达盒包含hGLA编码序列和miRNA靶序列。在某些实施例中,该方法包含递送包括miR-183靶序列的表达盒或载体基因组以抑制DRG中的转基因表达水平。在某些实施例中,该方法包含递送用于抑制DRG中转基因表达的表达盒,其中该表达盒包括至少两个miR183靶序列、至少三个miR183靶序列、至少四个miR183靶序列、至少五个miR183靶序列、至少六个miR183靶序列、至少七个miR183靶序列或至少八个miR183靶序列。在某些实施例中,该方法包含递送用于抑制DRG中转基因表达的表达盒,其中该表达盒包括至少两个miR182靶序列、至少三个miR182靶序列、至少四个miR182靶序列、至少五个miR182靶序列、至少六个miR182靶序列、至少七个miR182靶序列或至少八个miR182靶序列。在某些实施例中,该表达盒包括一个或多个miR182靶序列和一个或多个miR183靶序列。
所提供的组合物的合适递送体积及其浓度可以由本领域技术人员确定。例如,可以选择约1μL至150mL的体积,对于成人选择更高的体积。通常,对于新生婴儿,合适的体积为约0.5mL至约10mL,对于年龄较大的婴儿,可以选择约0.5mL至约15mL。对于幼儿,可选择约0.5mL至约20mL的体积。对于儿童,可以选择高达约30mL的体积。对于***前和青少年,可以选择高达约50mL的体积。在其它实施例中,患者可以接受选定体积为约5mL至约15mL,或约7.5mL至约10mL的鞘内施用。可以确定其它合适的体积和剂量。调节剂量以平衡治疗益处与任何副作用,并且这种剂量可以根据使用重组载体的治疗应用而变化。
在某些实施例中,包含本文所述的rAAV的组合物可以以约1x109GC/克脑质量至约1x1014GC/克脑质量的剂量施用。在某些实施例中,rAAV以约1x109GC/kg体重至约1x1013GC/kg体重的剂量全身共同施用。
在某些实施例中,表达盒在载体基因组中的递送量为约1x109GC/克脑质量至约1x1013基因组拷贝(GC)/克(g)脑质量,包括该范围和端点内的所有整数或分数量。在另一实施例中,剂量为1x1010GC/克脑质量至约1x1013GC/克脑质量。在具体的实施例中,施用于患者的载体的剂量为至少约1.0x109GC/g、约1.5x109GC/g、约2.0x109GC/g、约2.5x109GC/g、约3.0x109GC/g、约3.5x109GC/g、约4.0x109GC/g、约4.5x109GC/g、约5.0x109GC/g、约5.5x109GC/g、约6.0x109GC/g、约6.5x109GC/g、约7.0x109GC/g、约7.5x109GC/g、约8.0x109GC/g、约8.5x109GC/g、约9.0x109GC/g、约9.5x109GC/g、约1.0x1010GC/g、约1.5x1010GC/g、约2.0x1010GC/g、约2.5x1010GC/g、约3.0x1010GC/g、约3.5x1010GC/g、约4.0x1010GC/g、约4.5x1010GC/g、约5.0x1010GC/g、约5.5x1010GC/g、约6.0x1010GC/g、约6.5x1010GC/g、约7.0x1010GC/g、约7.5x1010GC/g、约8.0x1010GC/g、约8.5x1010GC/g、约9.0x1010GC/g、约9.5x1010GC/g、约1.0x1011GC/g、约1.5x1011GC/g、约2.0x1011GC/g、约2.5x1011GC/g、约3.0x1011GC/g、约3.5x1011GC/g、约4.0x1011GC/g、约4.5x1011GC/g、约5.0x1011GC/g、约5.5x1011GC/g、约6.0x1011GC/g、约6.5x1011GC/g、约7.0x1011GC/g、约7.5x1011GC/g、约8.0x1011GC/g、约8.5x1011GC/g、约9.0x1011GC/g、约9.5x1011GC/g、约1.0x1012GC/g、约1.5x1012GC/g、约2.0x1012GC/g、约2.5x1012GC/g、约3.0x1012GC/g、约3.5x1012GC/g、约4.0x1012GC/g、约4.5x1012GC/g、约5.0x1012GC/g、约5.5x1012GC/g、约6.0x1012GC/g、约6.5x1012GC/g、约7.0x1012GC/g、约7.5x1012GC/g、约8.0x1012GC/g、约8.5x1012GC/g、约9.0x1012GC/g、约9.5x1012GC/g、约1.0x1013GC/g、约1.5x1013GC/g、约2.0x1013GC/g、约2.5x1013GC/g、约3.0x1013GC/g、约3.5x1013GC/g、约4.0x1013GC/g、约4.5x1013GC/g、约5.0x1013GC/g、约5.5x1013GC/g、约6.0x1013GC/g、约6.5x1013GC/g、约7.0x1013GC/g、约7.5x1013GC/g、约8.0x1013GC/g、约8.5x1013GC/g、约9.0x1013GC/g、约9.5x1013GC/g或约1.0x1014GC/g脑质量。
在某些实施例中,本文提供的组合物与免疫抑制剂联合施用。目前,用于这种联合治疗的免疫抑制剂包括但不限于糖皮质激素、类固醇、抗代谢物、T细胞抑制剂、大环内酯类(例如,雷帕霉素(rapamycin)或雷帕霉素类似物(rapalog))和细胞抑制剂,包括烷化剂、抗代谢物、细胞毒性抗生素、抗体或对免疫亲和素具有活性的药剂。免疫抑制剂可以包括氮芥(nitrogenmustard)、亚硝基脲、铂化合物、甲氨蝶呤(methotrexate)、硫唑嘌呤(azathioprine)、巯嘌呤(mercaptopurine)、氟尿嘧啶(fluorouracil)、放线菌素D(dactinomycin)、蒽环霉素(anthracycline)、丝裂霉素(mitomycin)C、博来霉素(bleomycin)、光神霉素(mithramycin)、IL-2受体-(CD25-)或CD3-定向抗体、抗IL-2抗体、环孢霉素(ciclosporin)、他克莫司(tacrolimus)、西罗莫司(sirolimus)、IFN-β、IFN-γ、阿片样药物(opioid)或TNF-α(肿瘤坏死因子-α)结合剂。在某些实施例中,免疫抑制治疗可以在基因疗法施用前0、1、2、7或更多天开始。这种疗法可以包括在同一天联合施用两种或更多种药物(例如,***(prednisone)、霉酚酸酯(MMF)和/或西罗莫司(即,雷帕霉素))。这些药物中的一种或多种可以在基因疗法施用后以相同剂量或调整剂量继续施用。
在某些实施例中,本文提供的rAAV与如酶替代疗法、伴侣疗法、底物减少疗法(例如,赛诺菲-健赞(Sanofi-Genzyme)和宜道赛(Idorsia))的疗法(联合治疗)联合施用,和/或与减少输注相关反应的机会的抗组胺药或其它药物联合施用。在某些实施例中,联合治疗是功能性hGLA蛋白(例如赛诺菲-健赞;/>Shire;/>基于植物的ERT)或hGLA的稳定形式,如本文提供的或如2019年10月10日提交的PCT/US2019/05567(其通过引用并入本文)中所述的。施用可以是口服或通过静脉内输注给门诊病人,并且可以包括适于每日、每隔一日、每周、每两周(例如,0.2mg/kg体重),每月或每两月施用的剂量。在某些实施例中,联合治疗是伴侣疗法(例如Galafold(米加司他,以胶囊形式口服递送),爱美医疗公司)。联合治疗的适当治疗有效剂量由治疗临床医师选择,并且包括约1μg/kg至约500mg/kg、约10mg/kg至约100mg/kg、约20mg/kg至约100mg/kg和大约20mg/kg至大约50mg/kg。在一些实施例中,合适的治疗剂量选自例如0.5、0.75、1、5、10、15、20、30、40、50、60、70、100、150、200、250、300、400或500mg/kg。
在某些实施例中,根据本文所述的方法治疗新生婴儿(3月龄或更小)。在某些实施例中,根据本文所述的方法治疗3月龄至9月龄的婴儿。在某些实施例中,根据本文所述的方法治疗9月龄至36月龄的儿童。在某些实施例中,根据本文所述的方法治疗3岁至12岁的儿童。在某些实施例中,根据本文所述的方法治疗12岁至18岁的儿童。在某些实施例中,根据本文所述的方法治疗18岁或以上的成人。
在一个实施例中,患有法布里病的患者是年龄至少约3个月至小于12个月的男性或女性。在另一实施例中,患有法布里病的患者是男性或女性,年龄为至少约6岁至高达18岁。在其它实施例中,受试者可以是年长或年幼的,并且可以是男性或女性。
应当理解,本文所述方法中的组合物旨在应用于说明书中描述的其它组合物、方案、方面、实施例和方法。
7.试剂盒
在某些实施例中,提供了一种试剂盒,其包括悬浮在制剂(任选冷冻的)中的浓缩载体、任选的稀释缓冲液,以及静脉内、鞘内、脑室内或脑池内施用所需的装置和组件。在一个实施例中,试剂盒提供足够的缓冲液以允许注射。这种缓冲液可以允许浓缩载体以约1∶1到1∶5的比例稀释,或者更高。这种试剂盒可以包括额外的非基于载体的活性组分,其中使用联合疗法和/或抗组胺药、免疫调节剂等。在其它实施例中,包括较高或较低量的缓冲液或无菌水以允许治疗临床医师进行剂量滴定和其它调整。在其它实施例中,装置的一个或多个组件包括在试剂盒中。合适的稀释缓冲液是可用的,如盐水、磷酸盐缓冲盐水(PBS)或甘油/PBS。
应当理解,本文所述试剂盒中的组合物旨在应用于说明书中描述的其它组合物、方案、方面、实施例和方法。
8.装置
在一个方面,本文提供的载体可以通过例如WO 2017/136500中所述的方法和/或装置鞘内施用,该专利通过引用整体并入本文。替代地,可以选择其它装置和方法。总之,该方法包含以下步骤:将脊椎穿刺针推进到患者的小脑延髓池内,将一段柔性管连接到脊椎穿刺针的近端毂,以及将阀的输出端口连接到柔性管的近端,并且在所述推进和连接步骤之后以及在允许管用患者的脑脊液进行自灌注之后,将含有一定量等渗溶液的第一容器连接到阀的冲洗入口,然后将含有一定量药物组合物的第二容器连接到阀的载体入口。在将第一容器和第二容器连接到阀之后,打开在阀的载体入口和出口之间的流体流动路径,并且通过脊椎穿刺针将药物组合物注射到患者体内,并且在注射药物组合物之后,打开通过阀的冲洗入口和出口的流体流动路径,并且将等渗溶液注射到脊椎穿刺针中,以将药物组合物冲洗到患者体内。该方法和该装置可以各自任选地用于鞘内递送本文提供的组合物。替代地,其它方法和装置可用于这种鞘内递送。
应当理解,本文所述装置中的组合物旨在应用于说明书中描述的其它组合物、方案、方面、实施例和方法。
实例
现在参考以下实例描述本发明。提供这些实例仅用于说明的目的,本发明决不应解释为限于这些实例,而是应解释为包括由于本文提供的教导而变得明显的任何和所有变化。
实例1:用于治疗法布里病的rAAVhu68.hGLA
将编码hGLA的工程化序列克隆到含有CB7启动子(巨细胞病毒立即早期增强子和鸡β-肌动蛋白启动子的杂交体)、鸡β-肌动蛋白内含子(CI)、WPRE和兔β珠蛋白(rBG)聚腺苷酸化序列的表达构建体中。表达构建体的侧翼为AAV2反向末端重复序列,AAVhu68反式质粒用于衣壳化。
rAAVhu68.hGLA是通过用编码侧翼为AAVITR的转基因盒的AAV顺式质粒、编码AAV2rep和AAVhu68 cap基因的AAV反式质粒(pAAV2/hu68.KanR)和辅助腺病毒质粒(pAdΔF6.KanR)三重质粒转染HEK293细胞而产生的。
A.AAV顺式质粒
载体基因组(SEQ ID NO:6)的图谱如图1所示。载体基因组含有以下序列元件:
反向末端重复序列(ITR):ITR是衍生自AAV2(130bp,基因库:NC_001401)的相同的反向互补序列,其侧接载体基因组的所有组分。当AAV和腺病毒辅助功能以反式提供时,ITR作为载体DNA复制的起点和载体基因组的包装信号。因此,ITR序列代表载体基因组复制和包装所需的唯一顺式序列。
CB7启动子:该启动子由CMV IE增强子和鸡β-肌动蛋白启动子之间的杂交体组成。
人巨细胞病毒立即早期(CMVIE)增强子:这种从人源CMV(基因库:K03104.1)获得的增强子序列增加了下游转基因的表达。
鸡β-肌动蛋白(CB)启动子:选择这种普遍存在的启动子(基因库:X00182.1)来驱动任何细胞类型中的转基因表达。
鸡β-肌动蛋白内含子:杂合内含子由鸡β-肌动蛋白剪接供体(973bp,基因库:X00182.1)和兔β-珠蛋白剪接受体元件组成。内含子被转录,但通过剪接从成熟mRNA中去除,将其任一侧的序列集合在一起。已经表明表达盒中内含子的存在促进mRNA从细胞核转运到细胞质,从而增强用于翻译的mRNA的稳定水平的积累。这是旨在提高基因表达水平的基因载体中的共同特征。
编码序列:工程化cDNA(SEQ ID NO:4),其编码hGLA(SEQ ID NO:7),在位置233和359处具有半胱氨酸残基(D233C.I359C)(431个氨基酸)。
土拨鼠肝炎病毒转录后调节元件(WPRE):将来自土拨鼠肝炎病毒(WHV)的顺式作用RNA元件***polyA信号上游的编码序列的3′非翻译区。WPRE是一种源于嗜肝DNA病毒的序列,并且先前已被用作病毒基因载体中的顺式作用调节模块以实现足够水平的转基因产物表达并在制造期间提高病毒滴度。认为WPRE通过改善转录终止和增强3′端转录加工来增加转基因产物表达,从而增加聚腺苷酸化转录物的量和polyA尾的大小,并导致更多可用于翻译的转基因mRNA。包含在顺式质粒中的WPRE是在土拨鼠肝炎病毒X蛋白(WHX)蛋白开放阅读框(ORF)的推定启动子区中含有五个点突变,以及在WHX蛋白ORF的起始密码子中含有额外的点突变(突变为TTG的ATG)的突变版本。基于用含有WPRE mut6-GFP融合构建体(Zanta-Boussif等人,2009)的慢病毒转导的各种人细胞系的灵敏流式细胞术分析,认为该突变WPRE(称为mut6)足以消除截短的WHX蛋白的表达。
WPRE是一种源于嗜肝DNA病毒的序列,并且先前已用作病毒基因载体中的顺式作用调节模块以实现足够水平的转基因产物表达并在制造期间提高病毒滴度。
兔β-珠蛋白聚腺苷酸化信号(rBG PolyA):rBG PolyA信号(127bp,基因库:V00882.1)促进顺式转基因mRNA的有效聚腺苷酸化。该元件用作转录终止的信号,在新生转录物的3′端发生特异性切割事件,并添加长聚腺苷酸尾。
B.反式质粒:pAAV2/1.KanR(p0068)
AAV2/hu68反式质粒是pAAV2/hu68.KanR(p0068)。pAAV2/hu68.KanR质粒长度为8030bp,并编码AAV载体基因组复制和包装所需的四种野生型AAV2复制酶(Rep)蛋白。pAAV2/hu68.KanR质粒还编码三种WTAAVhu68病毒体蛋白衣壳(Cap)蛋白,其组装成AAV血清型hu68的病毒体外壳以容纳AAV载体基因组。
C.腺病毒辅助质粒:pAdDeltaF6(KanR)
腺病毒辅助质粒pAdDeltaF6(KanR)大小为15,770bp。该质粒含有对AAV复制重要的腺病毒基因组区域;即,E2A、E4和VA RNA(腺病毒E1功能由HEK293细胞提供)。然而,质粒不含有其它腺病毒复制或结构基因。质粒不含对复制关键的顺式元件,如腺病毒ITR;因此,预期不会生成感染性腺病毒。质粒来源于Ad5的E1、E3缺失的分子克隆(pBHG10,一种基于pBR322的质粒)。将缺失引入Ad5以消除不必要的腺病毒基因的表达并将腺病毒DNA的量从32kb减少至12kb。最后,用卡那霉素(kanamycin)抗性基因替换氨苄青霉素(ampicillin)抗性基因以产生pAdeltaF6(KanR)。保留在该质粒中的E2、E4和VAI腺病毒基因以及存在于HEK293细胞中的E1对于AAV载体生产是必需的。
实例2:方法
转基因产物表达-细胞分布
为了表征IV施用AAVhu69.hGLA载体后转导和转基因产物表达的分布并将其与观察到的疾病表型的组织学改善相关联,评估了mRNA和蛋白质定位。选择肾、DRG和心脏组织进行评估,因为它们是用于治疗法布里病的疾病相关靶组织。在小鼠和NHP中通过原位杂交(ISH)评估人GLA mRNA。在小鼠和NHP中通过免疫组织化学(IHC)或免疫荧光(1F)评估人GLA蛋白。选择小鼠和NHP中的取样时间点以捕获转基因产物表达的预期稳定平台期间的表达。
转基因产物表达-功能活性
为了评估通过ISH和IHC观察到的转基因产物在小鼠和NHP中是否有功能,进行了GLA酶活性测定。选择肾、心脏、肝和DRG组织是因为它们是用于治疗法布里病的疾病相关靶组织(肾、心脏)和/或在IV基因治疗后易于转导的组织(肝、心脏、DRG)。转基因产物的表达在小鼠的DRG中由于它们的小尺寸而未被评估,而所有其它组织在小鼠和NHP中被评估。选择小鼠和NHP中的取样时间点以捕获稳定的平台期转基因表达。GLA活性测定不能区分人GLA转基因产物和内源小鼠或NHPGLA,因此在基线时在未处理的动物中可以预期一些背景活性。
热感觉功能
进行热板测定是因为其测量小鼠中的热感觉缺陷,据信其类似于法布里病患者中描述的继发于DRG神经元溶酶体贮积和功能障碍的触觉、疼痛和热感缺陷。潜伏期应答的降低表明法布里病表型的改善。
肾功能
对BUN、尿渗透压和尿量进行了评估,因为它们是肾功能的生物标志物。BUN水平的降低表明法布里病表型的改善。尿渗透压的增加将表明由于增加的肾功能而增加的浓缩尿的能力,这代表法布里病表型的改善。尿量的减少表明法布里病表型的改善。
溶酶体贮积(组织上的GL-3免疫组织化学)
GLA酶缺乏导致酶的毒性底物GL-3的积累。因此,对DRG和肾进行GL-3的IHC,因为它们是在经典(Gla KO)和加重(Gla KO/TgG3S)法布里病小鼠模型中可再现地显示显著储存的器官,并且是法布里病患者中病理学的靶器官(分别引起神经性疼痛和致命性肾衰竭)。对心脏进行GL-3 IHC,因为加重的(Gla KO/TgG3S)法布里病小鼠也在该器官中表现出储存。减少的GL-3储存表明法布里病表型的改善。GL-3 IHC切片也用苏木精和曙红(H&E)染色以更好地可视化组织形态并检测潜在的不良治疗相关发现。
溶酶体贮积(通过LC-MS/MS定量GL-3和Lvso-Gb3)
通过液相色谱-串联质谱(LC-MS/MS)对组织中GL-3的储存进行定量,对血浆或血清中的lyso-Gb3进行定量。由于GL-3是GLA酶的主要底物,并且有直接证据表明底物累积的严重程度与法布里病的严重程度之间存在关系,因此对靶器官中的储存进行定量。GL-3储存的减少表明法布里病表型的改善。
实例3:法布里病的加重(Gla KO/TgG3S)和经典(Gla KO)小鼠模型的自然史研究
进行自然史研究以表征法布里病加重的小鼠模型(Gla KO/TgG3S)的疾病进展并定义疗效研究的最佳药理学终点和治疗窗。
在出生时,本研究入组了41只小鼠,包括不带有TgG3S等位基因的Gla WT雄性或Gla+/-杂合子雌性(对照;5只雄性和6只雌性)、不带有TgG3S等位基因的Gla KO(Gla-/-;5只雄性和5只雌性)、带有TgG3S的一个等位基因的Gla WT雄性或Gla+/-杂合子雌性(TgG3S+;5只雄性和5只雌性)和带有TgG3S的一个等位基因的Gla KO(Gla KO/TgG3S;5只雄性和5只雌性)。定期评估体重、热板性能、血清BUN水平和尿渗透压。在36周龄时进行尸检,这接近于该模型的公布的人道终点。在尸检时收集大脑、脊髓、DRG、心脏、肾脏、肝脏、皮肤、小肠和大肠用于组织学和GL-3储存的评估(GL-3IHC和通过LC-MS/MS定量)。
研究设计:加重法布里Gla-/-/TgG3S+小鼠模型中的自然史研究
a收集组织用于评估组织病理学。
缩写:BUN,血尿氮;Gla,α-半乳糖苷酶A;TgG3S,人Gb3合酶-转基因的。
除了两只Gla KO/TgG3S小鼠在33周和35周时由于疾病相关的体重减轻而被安乐死之外,所有小鼠都存活至预定的第36周尸检。
对照、GlaKO和TgG3S小鼠在整个研究的每个时间点增加体重(图10A和图10B)。相反,GlaKO/TgG3S小鼠的体重在18周时达到峰值(雄性为24.4g,雌性为21.5g),此后小鼠开始体重减轻直至尸检。
在整个研究中,雄性和雌性TgG3S小鼠表现出与性别匹配的对照动物相似的热板潜伏期,表明正常的感觉应答。从25周龄到研究结束,与性别匹配的对照相比,雄性和雌性GlaKO小鼠表现出稍长的干均热板潜伏期,表明感觉应答稍有降低。相反,从25周龄到研究结束,雄性GlaKO/TgG3S小鼠表现出比对照或GlaKO小鼠(雄性或雌性)显著更长的平均潜伏期应答,表明雄性GlaKO/TgG3S小鼠比雄性和雌性GlaKO小鼠具有更严重的感觉缺陷。雌性GlaKO/TgG3S小鼠也表现出比对照小鼠稍长的热板潜伏期应答,但潜伏期与雌性GlaKO小鼠相似,表明两种雌性法布里病小鼠模型的感觉缺陷相似(图11A和图11B)。
在整个研究中,雄性和雌性TgG3S和Gla KO小鼠表现出与其性别匹配的对照相似的血清BUN水平,这表明肾功能正常。相反,与性别匹配的对照相比,25周龄的雄性和雌性Gla KO/TgG3S小鼠均表现出升高的BUN水平。在研究过程中,雄性和雌性的BUN水平普遍升高,表明肾功能下降。在整个研究中,雄性和雌性Gla KO/TgG3S小鼠的BUN水平大致相似(图12A和图12B)。
在研究中观察到尿渗透压的动物体内变异性。然而,从25周龄直到研究结束,雄性和雌性Gla KO/TgG3S小鼠通常表现出比性别匹配的对照和Gla KO小鼠更低的平均尿渗透压,表明由于肾功能降低而不能浓缩尿(图13A和图13B)。
当通过IHC评估时,与Gla KO或WT/TgG3S小鼠相比,在雄性Gla KO/TgG3S小鼠中观察到更显著的GL-3在肾中的储存以及肾炎和肾小管坏死的继发性损伤(图14A)。与Gla KO小鼠相比,Gla KO/TgG3S小鼠中GL-3储存和继发性病理学的程度更大。在Gla KO/TgG3S小鼠的肾脏中,在肾小管和肾小球细胞中均观察到储存材料,而GL-3储存仅在Gla KO小鼠的肾小管中观察到。除了在肾小管和肾小球中有更多的储存之外,一些Gla KO/TgG3S小鼠在肾脏中呈现继发性炎性和退行性病变(肾小管变性、坏死和继发性间质单核肾炎),这在任何Gla KO小鼠中均未见到。心脏在Gla KO小鼠中没有表现出任何GL-3储存或继发性损伤,在一些Gla KO/TgG3S动物中,在心肌细胞中表现出一些GL-3储存材料以及心肌细胞坏死和矿化。
GL-3 IHC的定量证实,与Gla KO或WT/TgG3S小鼠相比,雄性Gla KO/TgG3S小鼠在整个肾脏中具有显著更高水平的GL-3储存,其中WT/TgG3S小鼠在3种小鼠模型中具有最低水平的GL-3储存(图14B)。
当通过IHC评估时,雄性Gla KO/TgG3S小鼠在DRG感觉神经元中表现出显著的GL-3储存(图15A)。虽然雄性Gla KO小鼠也在DRG感觉神经元中表现出GL-3储存,但在雄性WT/TgGS3小鼠中观察到非常少的DRG GL-3储存。IHC染色的定量显示,与Gla KO或WT/TgG3S模型相比,Gla KO/TgG3S小鼠中DRG GL-3储存显著增加,WT/TgG3S小鼠表现出最低水平的DRGGL-3储存(图15B)。
通过LC-MS/MS对底物(血浆中的lyso-Gb3,组织中的GL-3)的定量证实,与Gla KO小鼠相比,这些底物在加重小鼠(Gla KO/TgG3S)的肾脏、心脏、大脑和血浆中有更多的储存(图16A至图16D)。在雄性野生型小鼠的肾中,GL-3储存非常低,使得TgG3S小鼠中GL-3储存的轻微增加得以区分。GL-3在雄性Gla KO小鼠中的储存大于在TgG3S小鼠中的储存,并且与在Gla KO小鼠中观察到的水平相比,加重的Gla KO/TgG3S小鼠表现出显著增加的GL-3储存。GL-3在雌性小鼠肾组织中的储存表明GL-3储存从具有最低水平的野生型小鼠增加的明显趋势,接着是TgG3S和Gla KO小鼠,其中Gla KO/TgG3S小鼠具有最高的储存水平。
在雄性动物的心脏组织中,在野生型和TgG3S小鼠中存在最低的GL-3储存。虽然GLA KO雄性小鼠在心脏组织中具有略微更多的GL-3储存,但加重的Gla KO/TgG3S小鼠具有显著增加的底物储存水平。在雌性小鼠中,在野生型小鼠的心脏组织中存在最低的GL-3储存,在TgG3S和Gla KO小鼠中具有略微增加的水平,并且在Gla KO/TgG3S小鼠中观察到显著增加的GL-3储存。
在雄性和雌性小鼠的脑组织中,野生型、Gla KO和TgG3S小鼠的GL-3储存水平较低。在两种性别中,与所研究的其它三种模型相比,Gla KO/TgG3S小鼠在大脑中具有显著增加的GL-3储存。
在血浆中,lyso-Gb3储存水平在野生型和TgG3S小鼠中都是最低的。在雄性Gla KO和Gla KO/TgG3S小鼠中,这些水平增加到相似的程度。在雌性小鼠中,与野生型和TgG3S模型相比,Gla KO小鼠中的lyso-Gb3储存水平增加;然而,Gla KO和Gla KO/TgG3S小鼠之间的lyso-Gb3储存水平显著增加。
累积地,这项自然史研究证实过度表达人Gb3合酶的恶化的法布里病小鼠模型(Gla KO/TgG3S小鼠)在约18至25周龄(4.5至6月龄)开始出现疾病相关的异常。此外,GlaKO/TgG3S小鼠通常比非加重法布里病小鼠(Gla KO)表现出更严重的表型。具体地,与性别匹配的Gla KO小鼠相比,Gla KO/TgG3S小鼠表现出更严重的体重减轻(消瘦[雄性和雌性])和感觉缺陷(热板潜伏期增加[仅雄性])。Gla KO/TgG3S小鼠还表现出进行性肾损伤(血清BUN水平增加,尿渗透压降低[雄性和雌性]),这在Gla KO小鼠中并不明显,此外还表现出GL-3在肾脏、心脏、DRG、大脑和血浆中有更大的累积。加重的法布里病小鼠模型(Gla KO/TgG3S)还证实了在肾脏(单核变性间质性肾炎)和心脏(心肌细胞坏死和矿化)中从未观察到的一些继发性变性、坏死和矿化损伤,并且可能解释了更显著的表型。有趣的是,在肾小球中也观察到了储存材料,包括足细胞,类似于法布里病患者并且不同于Gla KO小鼠。足细胞(构成肾小球中的过滤屏障的细胞)中的储存是法布里病的病理生理学的关键,并且可能解释了小鼠加重模型和患者中增加的蛋白尿和降低的尿渗透压。
GLA KO/TgG3S小鼠发展为进行性共济失调伴严重震颤和走动缺陷,促使其在35至40周龄左右实施安乐死,这与表现出正常寿命的Gla KO小鼠不同。这似乎可归因于CNS中显著的GL-3储存,包括在组织学上观察到浦肯野细胞(Purkinje cell)变性和丧失的小脑中。然而,浦肯野细胞变性和共济失调不是人类法布里病的特征。在加重的小鼠模型中,通过由普遍存在的启动子驱动的GL-3合酶的过表达实现Gla底物GL-3的人工过载。GL-3在CNS中的积累与在双突变体Gla KO/TgG3S中不存在GLA的情况下Gb3S的神经元过表达是连续的。因此,小鼠共济失调直接归因于CNS中广泛且显著的Gb3储存材料,且其可以通过将恢复GLA水平的基因治疗来减轻。由于这个原因,在加重的小鼠模型中对共济失调和存活的监测是小鼠的相关生物标志物,即使其不是翻译的生物标志物。
总之,本研究的结果支持使用加重的法布里病Gla KO/TgG3S小鼠模型作为具有以下疗效终点的疗效研究的测试***:血浆中的lyso-Gb3储存、组织(肾脏、心脏、DRG、大脑)中的GL-3储存、组织病理学(肾脏、心脏、DRG、大脑)、热感觉功能(热板)、肾功能(BUN、尿渗透压),共济失调和存活率。
实例4:用于递送hGLA以进行基因治疗的rAAV载体的评估
本研究的目的是确定用于基因治疗的最佳人α-半乳糖苷酶A(hGLA)氨基酸序列。测试了编码hGLA变体的构建体。为了公平比较,载体包括相同的衣壳和启动子,并且WPRE增强子也存在于所有表达盒中。
对两至三月龄的法布里病小鼠(Gla KO)以下列剂量之一静脉内(IV)注射各种AAVhu68.hGLA载体:1x1011GC(5x1012GC/kg-中剂量)或5x1011GC(2.5x1013GC/kg-高剂量)。PBS处理的法布里病Gla KO和WT小鼠作为对照。在注射后(pi)1周和3周收集血液用于血清分离,并在pi 4周(尸检时间点)收集血液用于血浆分离。在pi 4周收集大脑、具有背根神经节(DRG)的脊髓、心脏、肾脏、肝脏、皮肤、小肠和大肠,其中一半处理用于组织学,另一半冷冻用于生物化学分析(通过定量质谱和GLA酶活性测量进行储存定量)。比较载体的主要疗效终点是靶器官中储存材料的定量。在Gla KO小鼠中,可以通过免疫组织化学(IHC)在锌-***石蜡包埋的组织切片上对储存材料酰基鞘鞍醇三己糖(GL-3)进行染色。肾小管上皮细胞中可见褐色沉积物,随着年龄的增长,储存逐渐恶化。储存还可以在H&E染色的DRG神经元中显现为放大的透明染色神经元(它们的透明颜色是由于细胞质中的糖脂储存材料)。法布里病的其它靶器官(如心脏、肠或脑脉管***)在传统Gla KO小鼠模型中显示出低的和不一致的储存染色。收集并处理这些器官,但不允许对载体进行疗效评估。
Gla KO小鼠是广泛用于法布里病的模型(Ohshima T,Murray GJ,Swaim WD,Longenecker G,Quirk JM,Cardarelli CO,Sugimoto Y,Pastan I,Gottesman MM,BradyRO,Kulkarni AB:《α-半乳糖苷酶A缺陷型小鼠:法布里病模型(α-Galactosidase Adeficient mice:A model ofFabry disease)》《美国国家科学院院刊(Proc Natl AcadSci)》94:2540-2544,1997)。半合子雄性表现出异常的肾脏和肝脏形态,两者均具有酰基鞘鞍醇三己糖的累积。它们还表现出轻度心肌病和异常的心血管生理学。小尺寸、可再现的表型和有效的育种允许快速研究,其对于载体的临床前体内筛选是最佳的。
比铰以下载体:
AAVhu68.CB7.hGLAnat.WPRE.rBG
AAVhu68.CB7.hGLAco.WPRE.rBG
AAVhu68.CB7.hGLAco(M51C_G360C).rBG
IV途径的选择是由于容易进行、可再现性和稳健的肝和心脏转导,允许提取转基因GLA用于分析。它也是预期的临床施用途径。选择所选的剂量范围1x1011GC至5x1011GC(相当于大约5x1012GC/kg至2.5x1013GC/kg)以在最高剂量下实现肌肉、心脏和肝脏转导。预期最低剂量是次优的,因此可以更好地区分不同载体之间的疗效。
每组包括最少6只小鼠(雄性和雌性)以能够进行药理学读数的统计分析。
药理学读数包括生物化学测定(包括但不必限于GLA酶活性、酶总量的测定、与甘露糖-6-磷酸受体的结合、GL-3储存)和组织学终点(GL-3染色)。测定hGLA的抗体。
表.组名称
结果
在注射后1周获得的血清样品中测量的GLA活性水平显示总体上,GLA活性水干是剂量依赖性的,其中在2.5x1013GC/kg剂量下在所有三种载体观察到更高的水平(图17)。与野生型和GLAKO对照相比,所有三种载体产生更高水平的GLA活性。在较高剂量组(2.5x1013GC/kg)中,与注射AAVhu68.hGLAco(M51C_G360C)的小鼠相比,施用AAVhu68.hGLAnat和AAVhu68.hGLAco的小鼠表现出更高水平的GLA活性。雄性小鼠比雌性小鼠表现出更高的酶活性,如预期的,这是由于与雌性小鼠相比,来自雄性的肝细胞中更有效的AAV转导和基因表达,这是非人灵长类和人中没有遇到的鼠特异性现象。在施用两种剂量AAVhu68.hGLAco(M51C_G360C)和低剂量(5.0x1012GC/kg)AAVhu68.hGLAnat和AAVhu68.hGLAco的雄性小鼠中,GLA活性相似。然而,在注射高剂量(2.5x1013GC/kg)AAVhu68.hGLAnat和AAVhu68.hGLAco的雄性中,GLA活性水平高得多。虽然雌性小鼠中的GLA活性水平低得多,但在雌性小鼠中也观察到雄性小鼠中观察到的三种载体中GLA活性水平的相同趋势。
在血清中测量的大部分酶活性来自在肝细胞中表达和分泌的蛋白质。为了研究用表达工程化候选物AAVhu68.hGLAco(M51C_G360C)的载体观察到的血清中更低酶活性的原因,我们在尸检时收集的肝样品中进行了载体基因组生物分布分析。对于所有三种载体,施用较高剂量(2.5x1013GC/kg)的小鼠表现出比用相应较低剂量的每种载体注射的小鼠更高的转导速率,并且3种不同载体在给定剂量水平下产生相似水平的载体基因组这表明编码工程化候选物的载体的酶活性降低可归因于转基因的表达降低(图18)。
还在IV注射5.0x1012或2.5x1013GC/kg剂量的载体后第28天分析疾病相关器官中的组织酶活性水平。下图示出了心脏(图19)、肝脏(图20)、肾脏(图21)、大脑(图22)和小肠(图23)的酶活性结果。在施用高剂量(2.5x1013GC/kg)AAVhu68.hGLAnat和AAVhu68.hGLAco的小鼠中,心脏组织中测量的总GLA活性水平最高。在施用低剂量(5.0x1012GC/kg)的AAVhu68.hGLAnat和AAVhu68.hGLAco以及两种剂量的AAVhu68.hGLAco(M51C_G360C)的小鼠中观察到低得多的GLA活性水平。在雄性和雌性小鼠中均观察到相似的活性水平。
在肝脏中,总体GLA活性在施用高剂量(2.5x1013GC/kg)的所有三种AAVhu68.hGLA的小鼠中更高,并且在用AAVhu68.hGLAnat和AAVhu68.hGLAco处理的小鼠中最高。通常,与雌性小鼠相比,雄性小鼠的GLA活性略高。
虽然在肾组织中测量的总体GLA活性存在较小的剂量依赖性变化,但在施用高剂量(2.5x1013GC/kg)的所有三种AAVhu68.hGLA的小鼠中活性水平仍倾向于较高。在雄性和雌性小鼠之间观察到的GLA活性水平没有显著差异;然而,在雌性小鼠中测量的GLA活性水平有更多的可变性。
在野生型小鼠的脑组织中观察到显著水干的GLA活性。同样,GLA活性水干在施用高剂量(2.5x1013GC/kg)的所有三种AAVhu68.hGLA的小鼠中更高,并且在用高剂量(2.5x1013GC/kg)的AAVhu68.hGLAnat和AAVhu68.hGLAco处理的小鼠中最高。在雄性和雌性小鼠中均观察到相似的活性水平。
用两种剂量的AAVhu68.hGLAco(M51C_G360C)和低剂量(5.0x1012GC/kg)的AAVhu68.hGLAnat和AAVhu68.hGLAco处理的小鼠的小肠中的GLA活性水平较低,并且在量级上相似。在小鼠高剂量(2.5x1013GC/kg)的AAVhu68.hGLAnat和AAVhu68.hGLAco中观察到最高水平的GLA活性。在雄性和雌性小鼠之间没有观察到显著的变化。
总之,与上述血清结果一致,GLA酶活性的组织水平是剂量依赖性的,在编码未修饰的天然蛋白质(工程化序列或未工程化序列)的两个候选物之间是相当的,并且在编码工程化蛋白质hGLAco(M51C_G360C)的候选物中显著较低。在肝脏以外的器官中未观察到性别影响。
为了进一步评估这三种载体的药理学,我们在AAV施用后28天通过LC-MS/MS测量了来自GLA KO小鼠的血浆中的储存材料lyso-Gb3和组织中的GL-3的量,并将这些水平与在PBS处理的GLA KO和野生型对照小鼠中测量的那些水平进行了比较。Lyso-Gb3和GL-3储存减少与酶活性水平一致;编码GLA的两种载体(AAVhu68.hGLAnat和AAVhu68.hGLAco)导致血浆、肾和心脏样品中高剂量(2.5x1013GC/kg)的完全储存消除(图24)。然而,编码hGLAco(M51C_G360C)的载体仅部分降低了血浆中的lyso-Gb3储存水平以及肾和心脏组织中的GL-3储存水平。
实例5:用于递送hGLA以进行基因治疗的rAAV载体的评估
本研究的目的是评估多达三种不同剂量(2.5x1012GC/kg,5x1012GC/kg,2.5x1013GC/kg)的三种载体,以确定IV施用后在Gla KO小鼠中的疗效。所有评估的载体具有相同的衣壳、启动子和polyA信号,但包括不同版本的人GLA转基因。所评估的三种转基因是hGALco(与实例4中相同)、hGLAco(M51C_G360C)(与实例4中相同)和hGLA-D233C-1359Cco。hGLAco(M51C_G360C)转基因编码具有两个点突变的工程化GLA蛋白,点突变引入二硫键以使酶稳定在其活性二聚体形式。hGLAco(D233C_I359C)转基因编码具有两个点突变的工程化GLA蛋白的第二版本,点突变引入二硫键以使酶稳定在其活性二聚体形式。
成年小鼠(3.5至4.5月龄)接受单次IV施用3种候选载体(AAVhu68.hGLAco、AAVhu68.hGLAco(M51C_G360C)或AAVhu68.hGLAco(D233C_I359C)中的1种,低剂量为2.5x1012GC/kg,中剂量为5.0x1012GC/kg,或高剂量为2.5x1013GC/kg(仅AAVhu68.hGLAco(D233C_I359C))。媒介物(PBS)处理的WT和Gla KO小鼠作为对照。
每天监测动物的活力。在第7天收集血清以评估转基因产物表达(GLA酶活性)。在第28天,进行尸检,收集具有DRG的心脏、肾、肝和脊髓,并处理用于组织学、GL-3定量和GLA酶活性的评估。还收集血浆用于lyso-Gb3定量和评估GLA酶活性。
静脉内施用对所有评估的载体都具有良好的耐受性。所有动物均存活至预定的尸检时间点。
在雄性和雌性Gla KO鼠的汇总数据中,在施用高剂量(2.5x1013GC/kg)AAVhu68.hGLAco(D233C_I359C)的Gla KO小鼠中,血清转基因产物表达(GLA酶活性)最高。GLA酶活性水平在其余处理组中的Gla KO小鼠中相似,尽管在施用AAVhu68.hGLAco或AAVhu68.hGLAco(D233C_I359C)的Gla KO小鼠中存在轻微的剂量依赖性应答。雄性Gla KO小鼠表现出比雌性更高的GLA酶活性。在施用高剂量(2.5x1013GC/kg)AAVhu68.hGLAco(D233C_I359C)的雄性Gla KO小鼠中GLA酶活性最高,并且在施用AAVhu68.hGLAco或AAVhu68.hGLAco(D233C_I359C)的雄性Gla KO小鼠中存在一定剂量依赖性的GLA酶活性。雌性Gla KO小鼠中的GLA酶活性非常低,在施用高剂量(2.5x1013GC/kg)AAVhu68.hGLAco(D233C_I359C)的小鼠中观察到最高水平(图25)。
在施用后28天收集的血浆中测量的转基因产物表达(GLA酶活性)的汇总数据揭示了所研究的所有3种AAV载体的明显剂量依赖性效应,其中在施用中剂量(5.0x1012GC/kg)AAVhu68.hGLAco和高剂量(2.5x1013GC/kg)AAVhu68.hGLAco(D233C_I359C)的Gla KO小鼠中观察到最高水平的GLA酶活性。GLA酶活性在雄性Gla KO小鼠中比在雌性Gla KO小鼠中高得多。在雄性Gla KO小鼠中观察到AAVhu68.hGLA对所有供试品的GLA活性的剂量依赖性作用,其中中剂量(5.0x1012GC/kg)的AAVhu68.hGLAco和高剂量(2.5x1013GC/kg)的AAVhu68.hGLAco(D233C_I359C)产生最高的酶活性。在雌性Gla KO小鼠中GLA活性水平普遍较低,高剂量(2.5x1013GC/kg)的AAVhu68.hGLAco(D233C_I359C)提供最高水平的活性(图26)。
图27、图28和图29分别示出了心脏、肝脏和肾组织中的GLA酶活性。
心脏组织中GLA酶活性的汇总数据显示所研究的所有3种AAV载体都具有明显的剂量依赖性效应,其中在施用中剂量(5.0x1012GC/kg)AAVhu68.hGLAco和高剂量(2.5x1013GC/kg)AAVhu68.hGLAco(D233C_I359C)的Gla KO小鼠中观察到最高水平的GLA酶活性。在雄性和雌性Gla KO小鼠中观察到相似水平的GLA酶活性。
肝脏样品中GLA酶活性的综合数据揭示了施用两剂量AAVhu68.hGLAco和高剂量(2.5x1013GC/kg)AAVhu68.hGLAco(D233C_I359C)的Gla KO小鼠中的酶活性水平最高。这些观察结果反映在雄性Gla KO小鼠的结果中。雌性Gla KO小鼠具有比雄性Gla KO小鼠显著更低水平的GLA酶活性,并且在三种AAV载体和剂量之间表现出较小的活性差异。
对于雄性和雌性Gla KO小鼠,在肾脏样品中测量的GLA酶活性显示对于所研究的所有3种AAVhu68.hGLA载体的明显的剂量依赖性效应,在施用中剂量(5.0x1012GC/kg)的AAVhu68.hGLAco和AAVhu68.hGLAco(M51C_G360C)和高剂量(2.5x1013GC/kg)的AAVhu68.hGLAco(D233C_I359C)的小鼠中具有最高水平的活性。当通过性别分析GLA酶活性时,这些趋势得到了反映,这也揭示了雄性和雌性Gla KO小鼠中相似的GLA酶活性水平。
评估来自经处理的Gla KO小鼠的血浆以评估载体在减少lyso-Gb3储存方面的疗效(图30)。数据显示用中剂量(5.0x1012GC/kg)AAVhu68.hGLAco和中剂量和高剂量(分别为5.0x1012GC/kg和2.5x1013GC/kg)AAVhu68.hGLAco(D233C_I359C)处理Gla KO小鼠完全清除了血浆中的lyso-Gb3储存。这些结果在雄性和雌性Gla KO小鼠中都是一致的。
来自肾组织样品的免疫组织化学数据揭示,虽然在施用所有三种载体的最高剂量下观察到GL-3储存的一些减少,但在用高剂量(2.5x1013GC/kg)AAVhu68.hGLAco(D233C_I359C)处理的Gla KO小鼠中观察到GL-3储存的最明显减少(图31A)。与先前的结果一致,肾脏IHC染色的GL-3储存的定量揭示与媒介物处理的Gla KO对照相比,用所有3个剂量的AAVhu68.hGLAco(D233C_I359C)处理的Gla KO小鼠在肾小管中具有显著更少的GL-3储存。用AAVhu68.hGLAco或其它工程化变体AAVhu68.hGLAco(M51C_G360C)处理的小鼠均没有显著的储存减少。观察到GL-3储存的这种减少是剂量依赖性的,在施用最高剂量(2.5x1013GC/kg)的AAVhu68.hGLAco(D233C_I359C)的Gla KO小鼠中具有最大效果(图31B)。
来自DRG纵向切片的免疫组织化学数据显示,与用媒介物、AAVhu68.hGLAco或AAVhu68.hGLAco(M51C_G360C)处理的Gla KO小鼠相比,用AAVhu68.hGLAco(D233C_I359C)处理的Gla KO小鼠具有最少的GL-3储存(图32A)。对这些IHC数据的定量显示,与媒介物处理的Gla KO小鼠相比,在用所有三个剂量的AAVhu68.hGLAco(D233C_1359C)处理的Gla KO小鼠中DRG神经元GL-3储存显著减少。观察到这种应答是剂量依赖性的,在施用最高剂量(2.5x1013GC/kg)的AAVhu68.hGLAco(D233C_I359C)的小鼠中具有最大效果。同样,其它候选物AAVhu68.hGLAco和其它工程化变体AAVhu68.hGLAco(M51C_G360C)不导致DRG中显著的GL-3储存减少(图32B)。
累积地,AAVhu68.hGLAco(D233C_I359C)施用至Gla KO小鼠导致显著的转基因产物表达(GLA酶活性),与所评估的其它载体相比具有最高的血浆和组织体内疗效。与媒介物处理的Gla KO小鼠相比,AAVhu68.hGLAco(D233C_I359C)处理的Gla KO小鼠表现出肾脏和DRG GL-3储存的显著剂量依赖性减少,而在相同剂量水平下施用非工程化AAVhu68.hGLAco载体不显著减少GL-3储存。
实例6:非人灵长类动物中AAVhu68.hGLAco(D233C_I359C)的评估
本研究旨在评估向食蟹猴静脉内施用AAVhu68.hGLAco(D233C_I359C)的初步药理学和安全性。
成年NHP(N=4)接受单次IV剂量的AAVhu68.hGLAco(D233C_I359C),剂量为2.5x1013GC/kg。活体评估包括每日进行的临床观察、体重、血液临床病理学(CBC、凝血面板、血清化学[包括心脏生物标志物肌钙蛋白I])和心脏功能评估(EKG和超声心动图)。在载体施用后的第60±3天,对所有动物进行尸检。尸检时,收集组织进行组织病理学检查。收集靶组织用于载体生物分布分析和转基因产物表达定位(人GLA ISH[mRNA]和人GLAIHC[蛋白质])的综合组织学评估。还收集PBMC、脾细胞和肝淋巴细胞以测量对衣壳和转基因产物(IFN-γELIspot)的T细胞应答。研究设计如下表所示。
aBL在给药前长达21天。
b血清化学分析包括肌钙蛋白I(心脏生物标志物)。
c收集样品并储存以备将来分析。
d收集组织用于组织病理学、载体生物分布分析和转基因产物表达(人GLA ISH染色[mRNA]和人GLA IHC染色[蛋白质])的组织学评估。收集肝和脾淋巴细胞用于测量对衣壳或转基因产物的T细胞应答(IFN-γ ELISpot)。
缩写:ADA,抗药物抗体;BL,基线;ELISpot,酶联免疫斑点技术;GLA,α-半乳糖苷酶;IFN-γ,干扰素γ;IHC,免疫组织化学;IN,鼻内;ISH,原位杂交;mRNA,信使核糖核酸;MS,质谱;Nab,中和抗体;PBMC,外周血单核细胞
基线样品收集:
在给药供试品或对照品(基线)之前长达21天以及在下表中所示的时间点从所有动物收集基线血液样品,包括全血计数(CBC)、凝血、心脏生物标志物、血清化学和PBMC/ELISPOT。在样品收集之前,从每只动物获得生命体征(即,温度、心率、呼吸)。
a)衣壳中和抗体(血清):在基线和第60天(尸检)时收集用于检测AAVhu68 Nab存在的血液(至多2mL)。通过红顶试管(有或没有血清分离器)收集血液,使其凝结,并离心。
b)心脏生物标志物(血清):在基线、第3天、第7天、第14天、第28天和第60天(尸检)收集用于检测心脏毒性标志物(肌钙蛋白I)存在的血液(至多2mL)。通过红顶试管(有或没有血清分离器)收集血液,使其凝结,并离心。分离出血清。
c)转基因表达、抗体、补体因子或细胞因子(血浆):在第0天、第3天、第7天、第14天、第28天和第60天(尸检)收集用于检测hGLA、抗hGLAAb和/或补体活化或细胞因子(在毒性的情况下)存在的血液(至少3mL)。将血液收集在标记的淡紫色盖子(EDTAK2)中并在收集后30分钟内在约+4℃离心机中以约2700RPM(1300±100x g)离心15分钟。
d)PBMC/ELISPOT:将血液(5至10mL)收集到肝素钠(绿顶试管)中并分离PBMC。在基线和尸检时收集样品。评估对衣壳和/或转基因的T细胞应答。
e)血液学(细胞计数和分类):收集血液(至多2mL)以获得具有差异和血小板计数的全血计数。在研究设计中指定的特定时间点分析以下参数:
红细胞计数
血红蛋白
血细胞比容
平均红细胞体积(MCV)
平均红细胞血红蛋白(MCH)
平均红细胞血红蛋白浓度(MCHC)
血小板计数
白细胞计数
白细胞分类
红细胞形态(病理学家审查)
网织红细胞计数
f)临床化学:将用于临床化学研究的血液(至多2.0mL)收集在标记的红顶(血清)试管中,使其凝结至多15分钟,并离心。分离血清并置于标记的微量离心管中。在研究设计中指定的特定时间点分析以下参数:
碱性磷酸酶
溶血标志物:胆红素(直接,间接)
肌酐
γ-谷氨酰转肽酶
葡萄糖
血清丙氨酸转氨酶
血清天冬氨酸转氨酶
白蛋白
白蛋白/球蛋白比(计算值)
血尿素氮
g)凝血:将用于凝血面板的血液(2.0mL)收集在标记的蓝顶(柠檬酸盐)试管中。在研究设计中指定的特定时间点分析以下参数:
PTT
PT
纤维蛋白原
D-二聚体
纤维蛋白降解产物
心脏监测
研究涉及载体给药前的基线超声心动图和研究终止时的额外回声。评估的最小参数包括舒张/收缩容积、每搏输出量、心输出量、缩短分数、隔膜厚度、射血时间。还评估了心尖两腔或四腔、右胞骨旁长轴四腔视图、右胸骨旁短轴视图的射血分数,当与心率组合时,得出左心室射血分数、舒张末期容积、收缩末期容积、每搏输出量和心输出量。
结果:
基于临床观察,静脉内施用是良好耐受的,并且所有动物存活至预定的尸检时间点。在基线、第14天、第28天和第60天时,所有动物的肌钙蛋白I水平(可指示心肌细胞损伤)均低于0.200μg/L至180μg/L的可报告范围,ECG和心电描记术上未发现异常。
在血液临床病理学上,发现包括在第3天所有动物中AST和ALT水平的短暂升高,并且在第7天至第14天在没有干预的情况下得到消退(图36A和图36B)。
在整个研究中,所有动物的总胆红素(TBil)水平、血小板计数和白细胞(WBC)计数保持在正常限度内(图37A、图37B和图37C)。
在整个研究中从动物收集的凝血数据揭示在第3天几只动物中凝血酶原时间(PT)、活化的APTT和D-二聚体水平的短暂升高(图38A,图38B和图38C)。这些短暂升高在没有干预的情况下得到消退。
对于所评估的任何肽库,通过IFN-γELISpot在来自施用单一IV剂量的AAVhu68.hGLAco(D233C_1359C)的动物的来自脾、心脏***或肝的PBMC或淋巴细胞中未观察到针对人GLA转基因产物或AAVhu68衣壳的T细胞应答。
尸检时收集的组织的组织病理学检查揭示在一些器官中存在一些轻微(1级)炎性细胞浸润,其发生率和严重程度与历史对照和关于背景发现的已发表文献中的典型背景发现相似。DRG和TRG神经元变性和脊髓背轴突病不存在或极少。
表:单次静脉内施用AAVhu68.hGLAco(D233C_I359C)(2.5x1013GC/kg)后60天从成年NHP收集的组织的半定量组织病理学评分评估
a数字表示发现的半定量分级。0=在正常限度内,1=最小严重度。通过将观察到的1级结果的数量相加并除以对该组织评估的总切片,确定脊髓和DRG小于1级(计算在括号中提供)。
抗AAVhu68衣壳的中和抗体和非中和结合抗体(BAb)(即,免疫球蛋白G[IgG]和免疫球蛋白M[IgM])在基线时在任何NHP中均未达到可检测水平,这与本研究的NAb阴性动物的筛选一致(图39)。正如所预期的,到第60天,所有动物都具有可检测水平的抗AAVhu68衣壳的NAb和IgG BAb,而抗AAVhu68衣壳的IgM BAb保持低于可检测限度。
在血浆中,IV施用AAVhu68.hGLAco(D233C_I359C)导致显著水平的转基因产物表达(GLA酶活性)。平均GLA酶活性从施用后第0天至第14天增加大约50倍(图40)。GLA酶活性水平在第14天达到峰值,然后在第60天下降。在评估的最后时间点(第60天),GLA酶活性比在第0天观察到的基线水平高大约2倍。在第14天之后转基因产物表达的这种下降是意料之中的。类似于先前对AAV递送人转基因产物的NHP研究,转基因产物表达的下降与对外来人转基因产物(抗人GLA抗体)的体液免疫应答相关(图41)。
AAVhu68.hGLAco(D233C_I359C)的静脉内施用也导致治疗后60天心脏、肝脏和肾脏中显著水平的转基因产物表达(GLA酶活性)(图42A)。在心脏和肾脏中观察到GLA酶活性的最大倍数增加(图42B)。在2.5x1013GC/kg下,NHP中GLA酶活性的平均增加倍数在心脏、肝脏和肾脏中分别为4.4(437%)、0.5(51%)和3.3(325%)。这些与在2.5x1012GC/kg和5.0x1012GC/kg的剂量下在KO小鼠中观察到的增加具有相似的量值(图27至图29),这表明了强大的GL-3清除率(图31A和图31B、图32A、图32B)。图43至图45示出了心脏、肾脏和DRG中的转基因表达(ISH)和转基因产物(IHC)。
累积地,该研究证实了以2.5x1013GC/kg的剂量施用AAVhu68.hGLAco(D233C_I359C)在NHP中是良好耐受的,并且导致用于治疗法布里病(肾脏、心脏、DRG)的靶组织中转基因产物表达(GLA酶活性)的显著增加。
实例7:评估食蟹猴静脉内施用AAVhu68.hGLAco(D233C_1359C)的高剂量药理学研究
成年NHP(N=3)接受单次IV剂量的AAVhu68.hGLAco(D233C_I359C),剂量为5.0x1013GC/kg。活体评估包括每日进行的临床观察、体重、血液临床病理学(CBC、凝血面板、血清化学[包括心脏生物标志物肌钙蛋白I])和心脏功能评估(ECG和超声心动图)。在载体施用后的第60±3天,对所有动物进行尸检。尸检时,收集组织用于组织病理学检查。收集靶组织用于载体生物分布分析和转基因产物表达定位(人GLA ISH[mRNA]和人GLAIHC[蛋白质])的综合组织学评估。还收集PBMC、脾细胞和肝淋巴细胞以测量对衣壳和转基因产物(IFN-γELIspot)的T细胞应答。
缩写:ADA=抗药物抗体;BL=基线;ELISpot=酶联免疫斑点技术;GLA=α-半乳糖苷酶A;IFN-γ=干扰素γ;IHC=免疫组织化学;IN=鼻内;ISH=原位杂交;mRNA=信使核糖核酸;MS=质谱;Nab=中和抗体;PBMC=外周血单核细胞。
aBL在给药前长达21天。
b血清化学分析包括肌钙蛋白I(心脏生物标志物)。
c收集样品并储存以备将来分析。
d收集组织用于组织病理学、载体生物分布分析和转基因产物表达(人GLA ISH染色[mRNA]和人GLA IHC染色[蛋白质])的组织学评估。收集肝和脾淋巴细胞用于测量对衣壳或转基因产物的T细胞应答(IFN-γELISpot)。
实例8:在向法布里病小鼠IV施用AAVhu68.hGLAco(D233C_I359C)后的疗效以测定MED
本药理学研究旨在确定AAVhu68.hGLAco(D233C_I359C)IV施用在加重法布里病小鼠模型(Gla KO/TgG3S)中的MED并评估药理学和组织病理学(疗效和安全性)。本研究包括N=144只动物和两个尸检时间点。评估载体的四个剂量水平。基于小鼠和NHP中的试验疗效数据选择剂量水平。
如在下表中总结的,以待测定的四个剂量水平之一(5.0x1012GC/kg、1.0x1013GC/kg、2.5x1013GC/kg或5.0x1013GC/kg)或媒介物(PBS)向成年(2至3月龄)雄性加重法布里病小鼠(Gla KO/TgG3S)施用AAVhu68.hGLAco(D233C_I359C)。正常雄性WT和WT/TgG3S雄性已被施用媒介物作为对照。雌性加重的Gla KO/TgG3S小鼠也已经接受最高剂量(5.0x1013GC/kg)的AAVhu68.hGLAco(D233C_1359C)或媒介物。每组入组16只动物。一半动物(每组8只)将在研究第120天处死,另一半(每组8只)将在至少80%的媒介物处理的Gla KO/TgG3S小鼠已经达到人道终点(定义为引起行走障碍和/或体重下降≥20%的峰值体重的严重震颤和共济失调)时进行尸检。
缩与:F=雌性;Gla=α-半乳糖苷酶A(基因);IV=静脉内;KO=敲除;M=雄性;N/A=不适用;ROA=施用途径;TBD=待确定;WT=野生型。
活体评估包括每天进行的活力检查以监测存活率、体重测量、临床观察、热感觉功能评估(热板潜伏期)、血清尿素氮(BUN)水平、尿渗透压、尿量和血清转基因表达(GLA酶活性)的评估。在人道终点和较早的时间点(第120天)进行尸检。尸检时,收集一份完整的组织清单用于组织病理学评估。收集另外的组织(DRG、心脏、肾脏)以评估GL-3储存(GL-3IHC)。还收集靶组织用于转基因表达测定(GLA酶活性)和通过LC-MS/MS定量GL-3(大脑、心脏、肾脏、肝脏、大肠)。收集血液用于CBC/分类和血清临床化学分析,包括BUN水平。还收集血浆以评估转基因产物表达(GLA酶活性)和lyso-Gb3储存。
进行活体体重评估和热板试验的人员对每只小鼠的处理条件和基因型不知情。
基于存活益处、体重、热感觉功能(使用热板测定法评估)、肾功能(通过BUN水平、尿量和尿渗透压评估)、靶组织中GL-3溶酶体贮积的校正和疾病相关靶器官中的转基因产物表达(GAL活性水平)的分析来确定MED。
实例9:AAVhu68.hGLAco(D233C_I359C)对成年非人灵长类动物静脉内施用的毒理学研究
进行一项为期180天的GLP合规毒理学研究以评估AAVhu68.hGLAco(D233C_I359C)在低剂量(1.0x1013GC/kg)、中剂量(2.5x1013GC/kg)或高剂量(5.0x1013GC/kg)下单次IV施用于食蟹猴NHP后的安全性、耐受性、转基因产物表达、生物分布和***情况。另外的NHP被施用媒介物(PBS)作为对照。
选择NHP(食蟹猴)用于计划的毒理学研究。选择该模型是因为我们对AAV载体在NHP中的应用有丰富的经验,并且NHP的毒理学和免疫应答接近地代表了人的毒理学和免疫应答。选择成年NHP(2至8岁)代表计划临床试验的患者群体。研究中将包括雄性和雌性。
选择IV途径是因为全身施用在疾病相关靶组织(DRG、肾脏和心脏)和非疾病相关(肝脏)靶组织中提供最佳转导和转基因产物表达。
表——NHP毒理学研究组
在整个研究过程中,以频繁的时间间隔对生命体征、体重、血液临床病理学(CBC与差值、临床化学、凝血面板)和CSF(细胞学和化学)进行笼侧临床观察和评估。监测全血细胞计数(CBC)、肝脏参数和补体活化,因为急性肝毒性、血小板减少症和补体活化是全身性AAV施用后的已知毒性。
肌钙蛋白I测试作为临床病理学小组的一部分,与基线和治疗后每30天进行的超声心动图评估一起包括在内,以监测心脏毒性的迹象,因为AAVhu68在IV施用后表现出对心脏组织的高度嗜性。
在基线、第14天、第28天和此后每30天进行神经病学检查。在基线、第28天、第60天和第180天进行双侧正中神经的感觉神经传导研究(NCS)以监测DRG感觉神经元变性的迹象。基于NHP中感觉神经元变性的已知动力学选择这些时间点,这些动力学在载体施用后14至21天出现,并且到第30天在正中神经NCS上可检测。对于神经病学检查,评估分为五个部分,评估精神状态、姿势和步态、本体感受、颅神经和脊柱反射。每次评估的测试都按相同的顺序进行。神经病学检查评估员对处理组无正式设盲;然而,评估员在评估时通常不知道处理组。在适用的情况下,对每个评估类别给出数值评分并记录(止常:1;异常:2;下降:3;增加:4;无:5;N/A:不适用)。对于感觉NCS,使用Nicolet***(Natus神经学公司)和/>分析软件测量感觉神经动作电位振幅和传导速度。进行NCS分析的评估员对处理组正式设盲。
在血清中测量转基因产物的表达(GLA酶活性)。在转基因表达的预期开始、峰值和平台期间以频繁的间隔收集样品。同样在相应时间点使用酶联免疫吸附测定(ELISA)在血清中评估抗转基因产物抗体(即,抗药物抗体[ADA]),以评估对可能全身性发生的外来人类转基因产物的潜在抗体应答。
在基线测量针对AAVhu68衣壳的中和抗体应答以评估对载体转导(生物分布)的影响,然后每月评估NAb应答的动力学。收集外周血单核细胞以使用IFN-γELISpot测定评估对衣壳和/或转基因产物的T细胞应答。选择PBMC收集的时间点,因为T细胞和B细胞免疫应答通常在30天内发生在NHP中。在尸检时,还收集来自脾和肝的组织驻留淋巴细胞,用于评估对衣壳和/或转基因产物的T细胞应答。
收集血清和CSF以评估载体分布,收集尿液和粪便以评估载体***(脱落)。在频繁的时间点收集这些样品并通过定量聚合酶链式反应(qPCR)进行定量以能够评估处理后载体分布和***的动力学。还收集CSF和血清样品并存档,以备将来分析,以防任何发现需要分析。
在第180天尸检时,收集一份完整的组织清单用于组织病理学和载体生物分布分析。还收集组织以评估转基因产物表达。选择所有组织以包括法布里病的可能靶组织(肾脏、心脏、DRG、肠)和/或高度灌注的外周器官(如肝脏和肾脏)。此外,从肝脏、脾脏和骨髓中采集淋巴细胞,以评估尸检时这些器官中对衣壳和/或转基因产物有反应性的T细胞的存在。
(独立文本的序列表)
以下信息是为数字标识符<223>下含独立文本的序列提供的。
/>
/>
/>
/>
/>
/>
/>
本说明书中引用的所有专利和非专利出版物通过引用整体并入本文。国际专利申请号PCT/US2019/05567,申请日为2019年10月10日,美国临时专利申请第63/089,850号,申请日为2020年10月9日,美国临时专利申请第63/146,286号,申请日为2021年2月5日,美国临时专利申请第63/186,092号,申请日为2021年5月8日,其全部内容通过引用并入本文。本文提交的名为“19-8855PCT_ST25.txt”的序列表和其中的序列和文本通过引用并入本文。尽管已经参照具体实施例描述了本发明,但是应当理解,在不脱离本发明的精神的情况下可以进行修改。这些修改旨在落入所附权利要求的范围内。
序列表
<110> 宾夕法尼亚大学董事会(The Trustees of the University ofPennsylvania)
<120> 用于治疗法布里病的组合物和方法
<130> UPN-19-8855.PCT
<150> US 63/089,850
<151> 2020-10-09
<150> US 63/146,286
<151> 2021-02-05
<150> US 63/186,092
<151> 2021-05-08
<160> 32
<170> PatentIn版本3.5
<210> 1
<211> 1287
<212> DNA
<213> 智人
<220>
<221> CDS
<222> (1)..(1287)
<400> 1
atg cag ctg agg aac cca gaa cta cat ctg ggc tgc gcg ctt gcg ctt 48
Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys Ala Leu Ala Leu
1 5 10 15
cgc ttc ctg gcc ctc gtt tcc tgg gac atc cct ggg gct aga gca ctg 96
Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu
20 25 30
gac aat gga ttg gca agg acg cct acc atg ggc tgg ctg cac tgg gag 144
Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp Glu
35 40 45
cgc ttc atg tgc aac ctt gac tgc cag gaa gag cca gat tcc tgc atc 192
Arg Phe Met Cys Asn Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile
50 55 60
agt gag aag ctc ttc atg gag atg gca gag ctc atg gtc tca gaa ggc 240
Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu Gly
65 70 75 80
tgg aag gat gca ggt tat gag tac ctc tgc att gat gac tgt tgg atg 288
Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met
85 90 95
gct ccc caa aga gat tca gaa ggc aga ctt cag gca gac cct cag cgc 336
Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg
100 105 110
ttt cct cat ggg att cgc cag cta gct aat tat gtt cac agc aaa gga 384
Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys Gly
115 120 125
ctg aag cta ggg att tat gca gat gtt gga aat aaa acc tgc gca ggc 432
Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala Gly
130 135 140
ttc cct ggg agt ttt gga tac tac gac att gat gcc cag acc ttt gct 480
Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala
145 150 155 160
gac tgg gga gta gat ctg cta aaa ttt gat ggt tgt tac tgt gac agt 528
Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser
165 170 175
ttg gaa aat ttg gca gat ggt tat aag cac atg tcc ttg gcc ctg aat 576
Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu Asn
180 185 190
agg act ggc aga agc att gtg tac tcc tgt gag tgg cct ctt tat atg 624
Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp Pro Leu Tyr Met
195 200 205
tgg ccc ttt caa aag ccc aat tat aca gaa atc cga cag tac tgc aat 672
Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn
210 215 220
cac tgg cga aat ttt gct gac att gat gat tcc tgg aaa agt ata aag 720
His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp Lys Ser Ile Lys
225 230 235 240
agt atc ttg gac tgg aca tct ttt aac cag gag aga att gtt gat gtt 768
Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp Val
245 250 255
gct gga cca ggg ggt tgg aat gac cca gat atg tta gtg att ggc aac 816
Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly Asn
260 265 270
ttt ggc ctc agc tgg aat cag caa gta act cag atg gcc ctc tgg gct 864
Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp Ala
275 280 285
atc atg gct gct cct tta ttc atg tct aat gac ctc cga cac atc agc 912
Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile Ser
290 295 300
cct caa gcc aaa gct ctc ctt cag gat aag gac gta att gcc atc aat 960
Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile Asn
305 310 315 320
cag gac ccc ttg ggc aag caa ggg tac cag ctt aga cag gga gac aac 1008
Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn
325 330 335
ttt gaa gtg tgg gaa cga cct ctc tca ggc tta gcc tgg gct gta gct 1056
Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val Ala
340 345 350
atg ata aac cgg cag gag att ggt gga cct cgc tct tat acc atc gca 1104
Met Ile Asn Arg Gln Glu Ile Gly Gly Pro Arg Ser Tyr Thr Ile Ala
355 360 365
gtt gct tcc ctg ggt aaa gga gtg gcc tgt aat cct gcc tgc ttc atc 1152
Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe Ile
370 375 380
aca cag ctc ctc cct gtg aaa agg aag cta ggg ttc tat gaa tgg act 1200
Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr
385 390 395 400
tca agg tta aga agt cac ata aat ccc aca ggc act gtt ttg ctt cag 1248
Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu Gln
405 410 415
cta gaa aat aca atg cag atg tca tta aaa gac tta ctt 1287
Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu
420 425
<210> 2
<211> 429
<212> PRT
<213> 智人
<400> 2
Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys Ala Leu Ala Leu
1 5 10 15
Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu
20 25 30
Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp Glu
35 40 45
Arg Phe Met Cys Asn Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile
50 55 60
Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu Gly
65 70 75 80
Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met
85 90 95
Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg
100 105 110
Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys Gly
115 120 125
Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala Gly
130 135 140
Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala
145 150 155 160
Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser
165 170 175
Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu Asn
180 185 190
Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp Pro Leu Tyr Met
195 200 205
Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn
210 215 220
His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp Lys Ser Ile Lys
225 230 235 240
Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp Val
245 250 255
Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly Asn
260 265 270
Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp Ala
275 280 285
Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile Ser
290 295 300
Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile Asn
305 310 315 320
Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn
325 330 335
Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val Ala
340 345 350
Met Ile Asn Arg Gln Glu Ile Gly Gly Pro Arg Ser Tyr Thr Ile Ala
355 360 365
Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe Ile
370 375 380
Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr
385 390 395 400
Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu Gln
405 410 415
Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu
420 425
<210> 3
<211> 1287
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 3
atgcagctga gaaatcccga gctgcacctg ggctgtgccc tggctctgag atttctggcc 60
ctggtgtctt gggacatccc tggcgctaga gccctggata acggcctggc cagaacacct 120
acaatgggct ggctgcactg ggagagattc atgtgcaacc tggactgcca agaggaaccc 180
gacagctgca tcagcgagaa gctgttcatg gaaatggccg agctgatggt gtccgaaggc 240
tggaaggacg ccggctacga gtacctgtgc atcgacgact gttggatggc ccctcagaga 300
gactctgagg gcagactgca ggccgatcct cagagatttc cccacggcat tagacagctg 360
gccaactacg tgcacagcaa gggcctgaag ctgggcatct acgccgacgt gggcaacaag 420
acctgtgccg gctttcctgg cagcttcggc tactacgata tcgacgccca gaccttcgcc 480
gattggggag tcgatctgct gaagttcgac ggctgctact gcgacagcct ggaaaatctg 540
gccgacggct acaagcacat gtcactggcc ctgaatcgga ccggccgcag catcgtgtac 600
tcttgcgagt ggcccctgta tatgtggccc ttccagaagc ctaactacac cgagatcaga 660
cagtactgca accactggcg gaacttcgcc gacatcgacg atagctggaa gtccatcaag 720
agcatcctgg actggaccag cttcaatcaa gagcggatcg tggacgtggc aggacctggc 780
ggatggaacg atcctgacat gctggtcatc ggcaacttcg gcctgagctg gaaccagcaa 840
gtgacccaga tggccctgtg ggccattatg gccgctcctc tgttcatgag caacgacctg 900
agacacatca gccctcaggc caaggctctg ctgcaggaca aggatgtgat cgctatcaac 960
caggatcctc tgggcaagca gggctaccag ctgagacagg gcgacaattt cgaagtgtgg 1020
gaaagacccc tgagcggact ggcttgggcc gtcgccatga tcaacagaca agagatcggc 1080
ggaccccggt cctacacaat tgccgtggct tctctcggca aaggcgtggc ctgtaatccc 1140
gcctgcttta tcacacagct gctgcccgtg aagagaaagc tgggctttta cgagtggacc 1200
agcagactgc ggagccacat caatcctacc ggcacagtgc tgctgcagct ggaaaacaca 1260
atgcagatga gcctgaagga cctgctg 1287
<210> 4
<211> 1287
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 4
atgcaactga gaaatcctga actgcacctg ggctgcgccc tggctctgag atttctggct 60
ctggtgtcct gggacatccc tggcgctaga gccctggata acggcctggc cagaacacct 120
acaatgggct ggctgcactg ggagagattc atgtgcaacc tggactgcca agaggaaccc 180
gacagctgca tcagcgagaa gctgttcatg gaaatggccg agctgatggt gtccgaaggc 240
tggaaggacg ccggctacga gtacctgtgc atcgacgact gttggatggc ccctcagaga 300
gactctgagg gcagactgca ggccgatcct cagagatttc cccacggcat tagacagctg 360
gccaactacg tgcacagcaa gggcctgaag ctgggcatct acgccgacgt gggcaacaag 420
acctgtgccg gctttcctgg cagcttcggc tactacgata tcgacgccca gaccttcgcc 480
gattggggag tcgatctgct gaagttcgac ggctgctact gcgacagcct ggaaaatctg 540
gccgacggct acaagcacat gtctctggcc ctgaatcgga ccggcagatc catcgtgtac 600
agctgcgagt ggcccctgta catgtggccc ttccagaagc ctaactacac cgagatcaga 660
cagtactgca accactggcg gaacttcgcc gacatctgcg atagctggaa gtccatcaag 720
agcatcctgg actggaccag cttcaatcaa gagcggatcg tggacgtggc aggacctggc 780
ggatggaacg atcctgacat gctggtcatc ggcaacttcg gcctgagctg gaaccagcaa 840
gtgacccaga tggccctgtg ggccattatg gccgctcctc tgttcatgag caacgacctg 900
agacacatca gccctcaggc caaggctctg ctgcaggaca aggatgtgat cgctatcaac 960
caggatcctc tgggcaagca gggctaccag ctgagacagg gcgacaattt cgaagtgtgg 1020
gaaagacccc tgagcggact ggcttgggcc gtcgccatga tcaaccggca agagtgcggc 1080
ggccccagat cctacacaat cgccgtggcc agtctcggca aaggcgtggc atgtaatccc 1140
gcctgcttca tcacacagct gctgcccgtg aagagaaagc tgggctttta cgagtggacc 1200
agcagactgc ggagccacat caatcctacc ggcacagtgc tgctgcagct ggaaaacacc 1260
atgcagatga gcctgaagga cctgctg 1287
<210> 5
<211> 1287
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 5
atgcaactga gaaatcctga actgcacctg ggctgcgccc tggctctgag atttctggct 60
ctggtgtcct gggacatccc tggcgctaga gccctggata acggcctggc cagaacacct 120
acaatgggct ggctgcactg ggagagattc tgctgcaacc tggactgcca agaggaaccc 180
gacagctgca tcagcgagaa gctgttcatg gaaatggccg agctgatggt gtccgaaggc 240
tggaaggacg ccggctacga gtacctgtgc atcgacgact gttggatggc ccctcagaga 300
gactctgagg gcagactgca ggccgatcct cagagatttc cccacggcat tagacagctg 360
gccaactacg tgcacagcaa gggcctgaag ctgggcatct acgccgacgt gggcaacaag 420
acctgtgccg gctttcctgg cagcttcggc tactacgata tcgacgccca gaccttcgcc 480
gattggggag tcgatctgct gaagttcgac ggctgctact gcgacagcct ggaaaatctg 540
gccgacggct acaagcacat gtctctggcc ctgaatcgga ccggcagatc catcgtgtac 600
agctgcgagt ggcccctgta catgtggccc ttccagaagc ctaactacac cgagatcaga 660
cagtactgca accactggcg gaacttcgcc gacatcgacg atagctggaa gtccatcaag 720
agcatcctgg actggaccag cttcaatcaa gagcggatcg tggacgtggc aggacctggc 780
ggatggaacg atcctgacat gctggtcatc ggcaacttcg gcctgagctg gaaccagcaa 840
gtgacccaga tggccctgtg ggccattatg gccgctcctc tgttcatgag caacgacctg 900
agacacatca gccctcaggc caaggctctg ctgcaggaca aggatgtgat cgctatcaac 960
caggatcctc tgggcaagca gggctaccag ctgagacagg gcgacaattt cgaagtgtgg 1020
gaaagacccc tgagcggact ggcttgggcc gtcgccatga tcaaccggca agagatttgc 1080
ggccccagat cctacacaat cgccgtggcc agtctcggca aaggcgtggc atgtaatccc 1140
gcctgcttca tcacacagct gctgcccgtg aagagaaagc tgggctttta cgagtggacc 1200
agcagactgc ggagccacat caatcctacc ggcacagtgc tgctgcagct ggaaaacacc 1260
atgcagatga gcctgaagga cctgctg 1287
<210> 6
<211> 4297
<212> DNA
<213> 人工序列
<220>
<223> CB7.CI.hGLAco(D233C/I359C).WPRE.rBG
<220>
<221> repeat_region
<222> (1)..(130)
<223> 5' ITR
<220>
<221> misc_feature
<222> (198)..(579)
<223> CMV立即早期增强子
<220>
<221> promoter
<222> (582)..(863)
<223> CB启动子
<220>
<221> Intron
<222> (956)..(1928)
<223> 鸡β-肌动蛋白内含子
<220>
<221> CDS
<222> (1948)..(3240)
<223> hGLAco.D233C.I359C
<220>
<221> misc_feature
<222> (2353)..(2372)
<223> P18
<220>
<221> misc_feature
<222> (2644)..(2646)
<223> D233C
<220>
<221> misc_feature
<222> (3022)..(3024)
<223> I359C
<220>
<221> misc_feature
<222> (3253)..(3841)
<223> WPRE
<220>
<221> misc_feature
<222> (3609)..(3628)
<223> P19
<220>
<221> polyA_signal
<222> (3953)..(4079)
<223> 兔珠蛋白poly A
<220>
<221> repeat_region
<222> (4168)..(4297)
<223> 3' ITR
<400> 6
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag ggtaatgggg 180
atcctctaga actatagcta gtcgacattg attattgact agttattaat agtaatcaat 240
tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa 300
tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt 360
tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta 420
aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt 480
caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc 540
tacttggcag tacatctacg tattagtcat cgctattacc atggtcgagg tgagccccac 600
gttctgcttc actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat 660
tttttaatta ttttgtgcag cgatgggggc gggggggggg ggggggcgcg cgccaggcgg 720
ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca 780
gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa 840
aaagcgaagc gcgcggcggg cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc 900
cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 960
cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 1020
ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1080
gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc 1140
gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1200
gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1260
caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt 1320
cgggctgcaa ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg 1380
tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca 1440
ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg 1500
cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt 1560
atggtaatcg tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa 1620
atctgggagg cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg 1680
caggaaggaa atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc 1740
tctccagcct cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc 1800
ggggttcggc ttctggcgtg tgaccggcgg ctctagagcc tctgctaacc atgttcatgc 1860
cttcttcttt ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt 1920
tggcaaagaa ttcgcggccg cgccacc atg caa ctg aga aat cct gaa ctg cac 1974
Met Gln Leu Arg Asn Pro Glu Leu His
1 5
ctg ggc tgc gcc ctg gct ctg aga ttt ctg gct ctg gtg tcc tgg gac 2022
Leu Gly Cys Ala Leu Ala Leu Arg Phe Leu Ala Leu Val Ser Trp Asp
10 15 20 25
atc cct ggc gct aga gcc ctg gat aac ggc ctg gcc aga aca cct aca 2070
Ile Pro Gly Ala Arg Ala Leu Asp Asn Gly Leu Ala Arg Thr Pro Thr
30 35 40
atg ggc tgg ctg cac tgg gag aga ttc atg tgc aac ctg gac tgc caa 2118
Met Gly Trp Leu His Trp Glu Arg Phe Met Cys Asn Leu Asp Cys Gln
45 50 55
gag gaa ccc gac agc tgc atc agc gag aag ctg ttc atg gaa atg gcc 2166
Glu Glu Pro Asp Ser Cys Ile Ser Glu Lys Leu Phe Met Glu Met Ala
60 65 70
gag ctg atg gtg tcc gaa ggc tgg aag gac gcc ggc tac gag tac ctg 2214
Glu Leu Met Val Ser Glu Gly Trp Lys Asp Ala Gly Tyr Glu Tyr Leu
75 80 85
tgc atc gac gac tgt tgg atg gcc cct cag aga gac tct gag ggc aga 2262
Cys Ile Asp Asp Cys Trp Met Ala Pro Gln Arg Asp Ser Glu Gly Arg
90 95 100 105
ctg cag gcc gat cct cag aga ttt ccc cac ggc att aga cag ctg gcc 2310
Leu Gln Ala Asp Pro Gln Arg Phe Pro His Gly Ile Arg Gln Leu Ala
110 115 120
aac tac gtg cac agc aag ggc ctg aag ctg ggc atc tac gcc gac gtg 2358
Asn Tyr Val His Ser Lys Gly Leu Lys Leu Gly Ile Tyr Ala Asp Val
125 130 135
ggc aac aag acc tgt gcc ggc ttt cct ggc agc ttc ggc tac tac gat 2406
Gly Asn Lys Thr Cys Ala Gly Phe Pro Gly Ser Phe Gly Tyr Tyr Asp
140 145 150
atc gac gcc cag acc ttc gcc gat tgg gga gtc gat ctg ctg aag ttc 2454
Ile Asp Ala Gln Thr Phe Ala Asp Trp Gly Val Asp Leu Leu Lys Phe
155 160 165
gac ggc tgc tac tgc gac agc ctg gaa aat ctg gcc gac ggc tac aag 2502
Asp Gly Cys Tyr Cys Asp Ser Leu Glu Asn Leu Ala Asp Gly Tyr Lys
170 175 180 185
cac atg tct ctg gcc ctg aat cgg acc ggc aga tcc atc gtg tac agc 2550
His Met Ser Leu Ala Leu Asn Arg Thr Gly Arg Ser Ile Val Tyr Ser
190 195 200
tgc gag tgg ccc ctg tac atg tgg ccc ttc cag aag cct aac tac acc 2598
Cys Glu Trp Pro Leu Tyr Met Trp Pro Phe Gln Lys Pro Asn Tyr Thr
205 210 215
gag atc aga cag tac tgc aac cac tgg cgg aac ttc gcc gac atc tgc 2646
Glu Ile Arg Gln Tyr Cys Asn His Trp Arg Asn Phe Ala Asp Ile Cys
220 225 230
gat agc tgg aag tcc atc aag agc atc ctg gac tgg acc agc ttc aat 2694
Asp Ser Trp Lys Ser Ile Lys Ser Ile Leu Asp Trp Thr Ser Phe Asn
235 240 245
caa gag cgg atc gtg gac gtg gca gga cct ggc gga tgg aac gat cct 2742
Gln Glu Arg Ile Val Asp Val Ala Gly Pro Gly Gly Trp Asn Asp Pro
250 255 260 265
gac atg ctg gtc atc ggc aac ttc ggc ctg agc tgg aac cag caa gtg 2790
Asp Met Leu Val Ile Gly Asn Phe Gly Leu Ser Trp Asn Gln Gln Val
270 275 280
acc cag atg gcc ctg tgg gcc att atg gcc gct cct ctg ttc atg agc 2838
Thr Gln Met Ala Leu Trp Ala Ile Met Ala Ala Pro Leu Phe Met Ser
285 290 295
aac gac ctg aga cac atc agc cct cag gcc aag gct ctg ctg cag gac 2886
Asn Asp Leu Arg His Ile Ser Pro Gln Ala Lys Ala Leu Leu Gln Asp
300 305 310
aag gat gtg atc gct atc aac cag gat cct ctg ggc aag cag ggc tac 2934
Lys Asp Val Ile Ala Ile Asn Gln Asp Pro Leu Gly Lys Gln Gly Tyr
315 320 325
cag ctg aga cag ggc gac aat ttc gaa gtg tgg gaa aga ccc ctg agc 2982
Gln Leu Arg Gln Gly Asp Asn Phe Glu Val Trp Glu Arg Pro Leu Ser
330 335 340 345
gga ctg gct tgg gcc gtc gcc atg atc aac cgg caa gag tgc ggc ggc 3030
Gly Leu Ala Trp Ala Val Ala Met Ile Asn Arg Gln Glu Cys Gly Gly
350 355 360
ccc aga tcc tac aca atc gcc gtg gcc agt ctc ggc aaa ggc gtg gca 3078
Pro Arg Ser Tyr Thr Ile Ala Val Ala Ser Leu Gly Lys Gly Val Ala
365 370 375
tgt aat ccc gcc tgc ttc atc aca cag ctg ctg ccc gtg aag aga aag 3126
Cys Asn Pro Ala Cys Phe Ile Thr Gln Leu Leu Pro Val Lys Arg Lys
380 385 390
ctg ggc ttt tac gag tgg acc agc aga ctg cgg agc cac atc aat cct 3174
Leu Gly Phe Tyr Glu Trp Thr Ser Arg Leu Arg Ser His Ile Asn Pro
395 400 405
acc ggc aca gtg ctg ctg cag ctg gaa aac acc atg cag atg agc ctg 3222
Thr Gly Thr Val Leu Leu Gln Leu Glu Asn Thr Met Gln Met Ser Leu
410 415 420 425
aag gac ctg ctg tga tag aagcttatcg ataatcaacc tctggattac 3270
Lys Asp Leu Leu
aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga 3330
tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc 3390
tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa 3450
cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg cattgccacc 3510
acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac ggcggaactc 3570
atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc 3630
gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt tgccacctgg 3690
attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc ggaccttcct 3750
tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg 3810
agtcggatct ccctttgggc cgcctccccg catcgatacc gtctcgaatc aagcggccgc 3870
aagcatgctg agctccagat ctggtacctc tagagtcgac ccgggcggcc tcgaggacgg 3930
ggtgaactac gcctgaggat ccgatctttt tccctctgcc aaaaattatg gggacatcat 3990
gaagcccctt gagcatctga cttctggcta ataaaggaaa tttattttca ttgcaatagt 4050
gtgttggaat tttttgtgtc tctcactcgg aagcaattcg ttgatctgaa tttcgaccac 4110
ccataatacc cattaccctg gtagataagt agcatggcgg gttaatcatt aactacaagg 4170
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 4230
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 4290
cgcgcag 4297
<210> 7
<211> 429
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 7
Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys Ala Leu Ala Leu
1 5 10 15
Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu
20 25 30
Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp Glu
35 40 45
Arg Phe Met Cys Asn Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile
50 55 60
Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu Gly
65 70 75 80
Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met
85 90 95
Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg
100 105 110
Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys Gly
115 120 125
Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala Gly
130 135 140
Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala
145 150 155 160
Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser
165 170 175
Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu Asn
180 185 190
Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp Pro Leu Tyr Met
195 200 205
Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn
210 215 220
His Trp Arg Asn Phe Ala Asp Ile Cys Asp Ser Trp Lys Ser Ile Lys
225 230 235 240
Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp Val
245 250 255
Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly Asn
260 265 270
Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp Ala
275 280 285
Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile Ser
290 295 300
Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile Asn
305 310 315 320
Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn
325 330 335
Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val Ala
340 345 350
Met Ile Asn Arg Gln Glu Cys Gly Gly Pro Arg Ser Tyr Thr Ile Ala
355 360 365
Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe Ile
370 375 380
Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr
385 390 395 400
Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu Gln
405 410 415
Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu
420 425
<210> 8
<211> 3390
<212> DNA
<213> 人工序列
<220>
<223> TBG.PI.hGLAnat.WPRE.bGH
<220>
<221> repeat_region
<222> (1)..(168)
<223> 5' ITR
<220>
<221> enhancer
<222> (211)..(310)
<223> α mic/bik
<220>
<221> enhancer
<222> (317)..(416)
<223> α mic/bik
<220>
<221> misc_feature
<222> (431)..(907)
<223> TBG启动子
<220>
<221> Intron
<222> (939)..(1071)
<223> SV40 misc内含子
<220>
<221> CDS
<222> (1100)..(2392)
<223> hGLA天然
<220>
<221> misc_feature
<222> (2411)..(2952)
<223> WPRE
<220>
<221> polyA_signal
<222> (2959)..(3173)
<223> BGH pA
<220>
<221> repeat_region
<222> (3223)..(3390)
<223> 3' ITR
<400> 8
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcgccc ttaagctagc aggttaattt ttaaaaagca gtcaaaagtc 240
caagtggccc ttggcagcat ttactctctc tgtttgctct ggttaataat ctcaggagca 300
caaacattcc agatccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 360
cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattccagat 420
ccggcgcgcc agggctggaa gctacctttg acatcatttc ctctgcgaat gcatgtataa 480
tttctacaga acctattaga aaggatcacc cagcctctgc ttttgtacaa ctttccctta 540
aaaaactgcc aattccactg ctgtttggcc caatagtgag aactttttcc tgctgcctct 600
tggtgctttt gcctatggcc cctattctgc ctgctgaaga cactcttgcc agcatggact 660
taaacccctc cagctctgac aatcctcttt ctcttttgtt ttacatgaag ggtctggcag 720
ccaaagcaat cactcaaagt tcaaacctta tcattttttg ctttgttcct cttggccttg 780
gttttgtaca tcagctttga aaataccatc ccagggttaa tgctggggtt aatttataac 840
taagagtgct ctagttttgc aatacaggac atgctataaa aatggaaaga tgttgctttc 900
tgagagactg cagaagttgg tcgtgaggca ctgggcaggt aagtatcaag gttacaagac 960
aggtttaagg agaccaatag aaactgggct tgtcgagaca gagaagactc ttgcgtttct 1020
gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca ggtgtccagg 1080
cggccgcgaa ttcgccacc atg cag ctg agg aac cca gaa cta cat ctg ggc 1132
Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly
1 5 10
tgc gcg ctt gcg ctt cgc ttc ctg gcc ctc gtt tcc tgg gac atc cct 1180
Cys Ala Leu Ala Leu Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro
15 20 25
ggg gct aga gca ctg gac aat gga ttg gca agg acg cct acc atg ggc 1228
Gly Ala Arg Ala Leu Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly
30 35 40
tgg ctg cac tgg gag cgc ttc atg tgc aac ctt gac tgc cag gaa gag 1276
Trp Leu His Trp Glu Arg Phe Met Cys Asn Leu Asp Cys Gln Glu Glu
45 50 55
cca gat tcc tgc atc agt gag aag ctc ttc atg gag atg gca gag ctc 1324
Pro Asp Ser Cys Ile Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu
60 65 70 75
atg gtc tca gaa ggc tgg aag gat gca ggt tat gag tac ctc tgc att 1372
Met Val Ser Glu Gly Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile
80 85 90
gat gac tgt tgg atg gct ccc caa aga gat tca gaa ggc aga ctt cag 1420
Asp Asp Cys Trp Met Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln
95 100 105
gca gac cct cag cgc ttt cct cat ggg att cgc cag cta gct aat tat 1468
Ala Asp Pro Gln Arg Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr
110 115 120
gtt cac agc aaa gga ctg aag cta ggg att tat gca gat gtt gga aat 1516
Val His Ser Lys Gly Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn
125 130 135
aaa acc tgc gca ggc ttc cct ggg agt ttt gga tac tac gac att gat 1564
Lys Thr Cys Ala Gly Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp
140 145 150 155
gcc cag acc ttt gct gac tgg gga gta gat ctg cta aaa ttt gat ggt 1612
Ala Gln Thr Phe Ala Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly
160 165 170
tgt tac tgt gac agt ttg gaa aat ttg gca gat ggt tat aag cac atg 1660
Cys Tyr Cys Asp Ser Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met
175 180 185
tcc ttg gcc ctg aat agg act ggc aga agc att gtg tac tcc tgt gag 1708
Ser Leu Ala Leu Asn Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu
190 195 200
tgg cct ctt tat atg tgg ccc ttt caa aag ccc aat tat aca gaa atc 1756
Trp Pro Leu Tyr Met Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile
205 210 215
cga cag tac tgc aat cac tgg cga aat ttt gct gac att gat gat tcc 1804
Arg Gln Tyr Cys Asn His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser
220 225 230 235
tgg aaa agt ata aag agt atc ttg gac tgg aca tct ttt aac cag gag 1852
Trp Lys Ser Ile Lys Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu
240 245 250
aga att gtt gat gtt gct gga cca ggg ggt tgg aat gac cca gat atg 1900
Arg Ile Val Asp Val Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met
255 260 265
tta gtg att ggc aac ttt ggc ctc agc tgg aat cag caa gta act cag 1948
Leu Val Ile Gly Asn Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln
270 275 280
atg gcc ctc tgg gct atc atg gct gct cct tta ttc atg tct aat gac 1996
Met Ala Leu Trp Ala Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp
285 290 295
ctc cga cac atc agc cct caa gcc aaa gct ctc ctt cag gat aag gac 2044
Leu Arg His Ile Ser Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp
300 305 310 315
gta att gcc atc aat cag gac ccc ttg ggc aag caa ggg tac cag ctt 2092
Val Ile Ala Ile Asn Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu
320 325 330
aga cag gga gac aac ttt gaa gtg tgg gaa cga cct ctc tca ggc tta 2140
Arg Gln Gly Asp Asn Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu
335 340 345
gcc tgg gct gta gct atg ata aac cgg cag gag att ggt gga cct cgc 2188
Ala Trp Ala Val Ala Met Ile Asn Arg Gln Glu Ile Gly Gly Pro Arg
350 355 360
tct tat acc atc gca gtt gct tcc ctg ggt aaa gga gtg gcc tgt aat 2236
Ser Tyr Thr Ile Ala Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn
365 370 375
cct gcc tgc ttc atc aca cag ctc ctc cct gtg aaa agg aag cta ggg 2284
Pro Ala Cys Phe Ile Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly
380 385 390 395
ttc tat gaa tgg act tca agg tta aga agt cac ata aat ccc aca ggc 2332
Phe Tyr Glu Trp Thr Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly
400 405 410
act gtt ttg ctt cag cta gaa aat aca atg cag atg tca tta aaa gac 2380
Thr Val Leu Leu Gln Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp
415 420 425
tta ctt taa tga tgtacaaagc ttggatccaa tcaacctctg gattacaaaa 2432
Leu Leu
tttgtgaaag attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg 2492
ctgctttaat gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct 2552
tgtataaatc ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg 2612
gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct 2672
gtcagctcct ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg 2732
ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg 2792
tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc 2852
tgcgcgggac gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc 2912
gcggcctgct gccggctctg cggcctcttc cgcgtcttcg agatctgcct cgactgtgcc 2972
ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg 3032
tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag 3092
gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga 3152
caatagcagg catgctgggg actcgagtta agggcgaatt cccgataagg atcttcctag 3212
agcatggcta cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag 3272
tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 3332
aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 3390
<210> 9
<211> 429
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 9
Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys Ala Leu Ala Leu
1 5 10 15
Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu
20 25 30
Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp Glu
35 40 45
Arg Phe Met Cys Asn Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile
50 55 60
Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu Gly
65 70 75 80
Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met
85 90 95
Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg
100 105 110
Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys Gly
115 120 125
Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala Gly
130 135 140
Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala
145 150 155 160
Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser
165 170 175
Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu Asn
180 185 190
Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp Pro Leu Tyr Met
195 200 205
Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn
210 215 220
His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp Lys Ser Ile Lys
225 230 235 240
Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp Val
245 250 255
Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly Asn
260 265 270
Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp Ala
275 280 285
Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile Ser
290 295 300
Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile Asn
305 310 315 320
Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn
325 330 335
Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val Ala
340 345 350
Met Ile Asn Arg Gln Glu Ile Gly Gly Pro Arg Ser Tyr Thr Ile Ala
355 360 365
Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe Ile
370 375 380
Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr
385 390 395 400
Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu Gln
405 410 415
Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu
420 425
<210> 10
<211> 4294
<212> DNA
<213> 人工序列
<220>
<223> CB7.CI.hGLAnat.WPRE.RBG
<220>
<221> repeat_region
<222> (1)..(130)
<223> 5' ITR
<220>
<221> misc_feature
<222> (198)..(579)
<223> CMV IE启动子
<220>
<221> promoter
<222> (582)..(863)
<223> CB启动子
<220>
<221> TATA_signal
<222> (836)..(839)
<223> TATA
<220>
<221> Intron
<222> (956)..(1928)
<223> 鸡β-肌动蛋白内含子
<220>
<221> CDS
<222> (1950)..(3242)
<223> hGLA天然
<220>
<221> misc_feature
<222> (3317)..(3905)
<223> WPRE
<220>
<221> polyA_signal
<222> (3950)..(4076)
<223> 兔珠蛋白poly A
<220>
<221> repeat_region
<222> (4165)..(4294)
<223> 3' ITR
<400> 10
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag ggtaatgggg 180
atcctctaga actatagcta gtcgacattg attattgact agttattaat agtaatcaat 240
tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa 300
tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt 360
tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta 420
aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt 480
caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc 540
tacttggcag tacatctacg tattagtcat cgctattacc atggtcgagg tgagccccac 600
gttctgcttc actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat 660
tttttaatta ttttgtgcag cgatgggggc gggggggggg ggggggcgcg cgccaggcgg 720
ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca 780
gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa 840
aaagcgaagc gcgcggcggg cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc 900
cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 960
cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 1020
ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1080
gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc 1140
gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1200
gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1260
caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt 1320
cgggctgcaa ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg 1380
tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca 1440
ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg 1500
cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt 1560
atggtaatcg tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa 1620
atctgggagg cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg 1680
caggaaggaa atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc 1740
tctccagcct cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc 1800
ggggttcggc ttctggcgtg tgaccggcgg ctctagagcc tctgctaacc atgttcatgc 1860
cttcttcttt ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt 1920
tggcaaagaa tagcttcgaa ttcgccacc atg cag ctg agg aac cca gaa cta 1973
Met Gln Leu Arg Asn Pro Glu Leu
1 5
cat ctg ggc tgc gcg ctt gcg ctt cgc ttc ctg gcc ctc gtt tcc tgg 2021
His Leu Gly Cys Ala Leu Ala Leu Arg Phe Leu Ala Leu Val Ser Trp
10 15 20
gac atc cct ggg gct aga gca ctg gac aat gga ttg gca agg acg cct 2069
Asp Ile Pro Gly Ala Arg Ala Leu Asp Asn Gly Leu Ala Arg Thr Pro
25 30 35 40
acc atg ggc tgg ctg cac tgg gag cgc ttc atg tgc aac ctt gac tgc 2117
Thr Met Gly Trp Leu His Trp Glu Arg Phe Met Cys Asn Leu Asp Cys
45 50 55
cag gaa gag cca gat tcc tgc atc agt gag aag ctc ttc atg gag atg 2165
Gln Glu Glu Pro Asp Ser Cys Ile Ser Glu Lys Leu Phe Met Glu Met
60 65 70
gca gag ctc atg gtc tca gaa ggc tgg aag gat gca ggt tat gag tac 2213
Ala Glu Leu Met Val Ser Glu Gly Trp Lys Asp Ala Gly Tyr Glu Tyr
75 80 85
ctc tgc att gat gac tgt tgg atg gct ccc caa aga gat tca gaa ggc 2261
Leu Cys Ile Asp Asp Cys Trp Met Ala Pro Gln Arg Asp Ser Glu Gly
90 95 100
aga ctt cag gca gac cct cag cgc ttt cct cat ggg att cgc cag cta 2309
Arg Leu Gln Ala Asp Pro Gln Arg Phe Pro His Gly Ile Arg Gln Leu
105 110 115 120
gct aat tat gtt cac agc aaa gga ctg aag cta ggg att tat gca gat 2357
Ala Asn Tyr Val His Ser Lys Gly Leu Lys Leu Gly Ile Tyr Ala Asp
125 130 135
gtt gga aat aaa acc tgc gca ggc ttc cct ggg agt ttt gga tac tac 2405
Val Gly Asn Lys Thr Cys Ala Gly Phe Pro Gly Ser Phe Gly Tyr Tyr
140 145 150
gac att gat gcc cag acc ttt gct gac tgg gga gta gat ctg cta aaa 2453
Asp Ile Asp Ala Gln Thr Phe Ala Asp Trp Gly Val Asp Leu Leu Lys
155 160 165
ttt gat ggt tgt tac tgt gac agt ttg gaa aat ttg gca gat ggt tat 2501
Phe Asp Gly Cys Tyr Cys Asp Ser Leu Glu Asn Leu Ala Asp Gly Tyr
170 175 180
aag cac atg tcc ttg gcc ctg aat agg act ggc aga agc att gtg tac 2549
Lys His Met Ser Leu Ala Leu Asn Arg Thr Gly Arg Ser Ile Val Tyr
185 190 195 200
tcc tgt gag tgg cct ctt tat atg tgg ccc ttt caa aag ccc aat tat 2597
Ser Cys Glu Trp Pro Leu Tyr Met Trp Pro Phe Gln Lys Pro Asn Tyr
205 210 215
aca gaa atc cga cag tac tgc aat cac tgg cga aat ttt gct gac att 2645
Thr Glu Ile Arg Gln Tyr Cys Asn His Trp Arg Asn Phe Ala Asp Ile
220 225 230
gat gat tcc tgg aaa agt ata aag agt atc ttg gac tgg aca tct ttt 2693
Asp Asp Ser Trp Lys Ser Ile Lys Ser Ile Leu Asp Trp Thr Ser Phe
235 240 245
aac cag gag aga att gtt gat gtt gct gga cca ggg ggt tgg aat gac 2741
Asn Gln Glu Arg Ile Val Asp Val Ala Gly Pro Gly Gly Trp Asn Asp
250 255 260
cca gat atg tta gtg att ggc aac ttt ggc ctc agc tgg aat cag caa 2789
Pro Asp Met Leu Val Ile Gly Asn Phe Gly Leu Ser Trp Asn Gln Gln
265 270 275 280
gta act cag atg gcc ctc tgg gct atc atg gct gct cct tta ttc atg 2837
Val Thr Gln Met Ala Leu Trp Ala Ile Met Ala Ala Pro Leu Phe Met
285 290 295
tct aat gac ctc cga cac atc agc cct caa gcc aaa gct ctc ctt cag 2885
Ser Asn Asp Leu Arg His Ile Ser Pro Gln Ala Lys Ala Leu Leu Gln
300 305 310
gat aag gac gta att gcc atc aat cag gac ccc ttg ggc aag caa ggg 2933
Asp Lys Asp Val Ile Ala Ile Asn Gln Asp Pro Leu Gly Lys Gln Gly
315 320 325
tac cag ctt aga cag gga gac aac ttt gaa gtg tgg gaa cga cct ctc 2981
Tyr Gln Leu Arg Gln Gly Asp Asn Phe Glu Val Trp Glu Arg Pro Leu
330 335 340
tca ggc tta gcc tgg gct gta gct atg ata aac cgg cag gag att ggt 3029
Ser Gly Leu Ala Trp Ala Val Ala Met Ile Asn Arg Gln Glu Ile Gly
345 350 355 360
gga cct cgc tct tat acc atc gca gtt gct tcc ctg ggt aaa gga gtg 3077
Gly Pro Arg Ser Tyr Thr Ile Ala Val Ala Ser Leu Gly Lys Gly Val
365 370 375
gcc tgt aat cct gcc tgc ttc atc aca cag ctc ctc cct gtg aaa agg 3125
Ala Cys Asn Pro Ala Cys Phe Ile Thr Gln Leu Leu Pro Val Lys Arg
380 385 390
aag cta ggg ttc tat gaa tgg act tca agg tta aga agt cac ata aat 3173
Lys Leu Gly Phe Tyr Glu Trp Thr Ser Arg Leu Arg Ser His Ile Asn
395 400 405
ccc aca ggc act gtt ttg ctt cag cta gaa aat aca atg cag atg tca 3221
Pro Thr Gly Thr Val Leu Leu Gln Leu Glu Asn Thr Met Gln Met Ser
410 415 420
tta aaa gac tta ctt taa tga tgtacaagta aagatctgcg gccgcgtggt 3272
Leu Lys Asp Leu Leu
425
acctctagag tcgacccggg cggcctcgaa tcaagcttat cgataatcaa cctctggatt 3332
acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg 3392
gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct 3452
cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc gttgtcaggc 3512
aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg ggcattgcca 3572
ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc acggcggaac 3632
tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt 3692
ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt gttgccacct 3752
ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca gcggaccttc 3812
cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga 3872
cgagtcggat ctccctttgg gccgcctccc cgcatcgata ccgtctcgag gacggggtga 3932
actacgcctg aggatccgat ctttttccct ctgccaaaaa ttatggggac atcatgaagc 3992
cccttgagca tctgacttct ggctaataaa ggaaatttat tttcattgca atagtgtgtt 4052
ggaatttttt gtgtctctca ctcggaagca attcgttgat ctgaatttcg accacccata 4112
atacccatta ccctggtaga taagtagcat ggcgggttaa tcattaacta caaggaaccc 4172
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 4232
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 4292
ag 4294
<210> 11
<211> 429
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 11
Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys Ala Leu Ala Leu
1 5 10 15
Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu
20 25 30
Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp Glu
35 40 45
Arg Phe Met Cys Asn Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile
50 55 60
Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu Gly
65 70 75 80
Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met
85 90 95
Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg
100 105 110
Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys Gly
115 120 125
Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala Gly
130 135 140
Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala
145 150 155 160
Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser
165 170 175
Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu Asn
180 185 190
Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp Pro Leu Tyr Met
195 200 205
Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn
210 215 220
His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp Lys Ser Ile Lys
225 230 235 240
Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp Val
245 250 255
Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly Asn
260 265 270
Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp Ala
275 280 285
Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile Ser
290 295 300
Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile Asn
305 310 315 320
Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn
325 330 335
Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val Ala
340 345 350
Met Ile Asn Arg Gln Glu Ile Gly Gly Pro Arg Ser Tyr Thr Ile Ala
355 360 365
Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe Ile
370 375 380
Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr
385 390 395 400
Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu Gln
405 410 415
Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu
420 425
<210> 12
<211> 3390
<212> DNA
<213> 人工序列
<220>
<223> TBG.PI.hGLAco.WPRE.bGH
<220>
<221> repeat_region
<222> (1)..(168)
<223> 5' ITR
<220>
<221> enhancer
<222> (211)..(310)
<220>
<221> enhancer
<222> (317)..(416)
<220>
<221> Intron
<222> (939)..(1071)
<223> SV40 misc内含子
<220>
<221> CDS
<222> (1100)..(2392)
<223> hGLAco
<220>
<221> misc_feature
<222> (2411)..(2952)
<223> WPRE
<220>
<221> polyA_signal
<222> (2959)..(3173)
<223> BGH pA
<220>
<221> repeat_region
<222> (3223)..(3390)
<223> 3' ITR
<400> 12
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcgccc ttaagctagc aggttaattt ttaaaaagca gtcaaaagtc 240
caagtggccc ttggcagcat ttactctctc tgtttgctct ggttaataat ctcaggagca 300
caaacattcc agatccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 360
cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattccagat 420
ccggcgcgcc agggctggaa gctacctttg acatcatttc ctctgcgaat gcatgtataa 480
tttctacaga acctattaga aaggatcacc cagcctctgc ttttgtacaa ctttccctta 540
aaaaactgcc aattccactg ctgtttggcc caatagtgag aactttttcc tgctgcctct 600
tggtgctttt gcctatggcc cctattctgc ctgctgaaga cactcttgcc agcatggact 660
taaacccctc cagctctgac aatcctcttt ctcttttgtt ttacatgaag ggtctggcag 720
ccaaagcaat cactcaaagt tcaaacctta tcattttttg ctttgttcct cttggccttg 780
gttttgtaca tcagctttga aaataccatc ccagggttaa tgctggggtt aatttataac 840
taagagtgct ctagttttgc aatacaggac atgctataaa aatggaaaga tgttgctttc 900
tgagagactg cagaagttgg tcgtgaggca ctgggcaggt aagtatcaag gttacaagac 960
aggtttaagg agaccaatag aaactgggct tgtcgagaca gagaagactc ttgcgtttct 1020
gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca ggtgtccagg 1080
cggccgcgaa ttcgccacc atg cag ctg aga aat ccc gag ctg cac ctg ggc 1132
Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly
1 5 10
tgt gcc ctg gct ctg aga ttt ctg gcc ctg gtg tct tgg gac atc cct 1180
Cys Ala Leu Ala Leu Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro
15 20 25
ggc gct aga gcc ctg gat aac ggc ctg gcc aga aca cct aca atg ggc 1228
Gly Ala Arg Ala Leu Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly
30 35 40
tgg ctg cac tgg gag aga ttc atg tgc aac ctg gac tgc caa gag gaa 1276
Trp Leu His Trp Glu Arg Phe Met Cys Asn Leu Asp Cys Gln Glu Glu
45 50 55
ccc gac agc tgc atc agc gag aag ctg ttc atg gaa atg gcc gag ctg 1324
Pro Asp Ser Cys Ile Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu
60 65 70 75
atg gtg tcc gaa ggc tgg aag gac gcc ggc tac gag tac ctg tgc atc 1372
Met Val Ser Glu Gly Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile
80 85 90
gac gac tgt tgg atg gcc cct cag aga gac tct gag ggc aga ctg cag 1420
Asp Asp Cys Trp Met Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln
95 100 105
gcc gat cct cag aga ttt ccc cac ggc att aga cag ctg gcc aac tac 1468
Ala Asp Pro Gln Arg Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr
110 115 120
gtg cac agc aag ggc ctg aag ctg ggc atc tac gcc gac gtg ggc aac 1516
Val His Ser Lys Gly Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn
125 130 135
aag acc tgt gcc ggc ttt cct ggc agc ttc ggc tac tac gat atc gac 1564
Lys Thr Cys Ala Gly Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp
140 145 150 155
gcc cag acc ttc gcc gat tgg gga gtc gat ctg ctg aag ttc gac ggc 1612
Ala Gln Thr Phe Ala Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly
160 165 170
tgc tac tgc gac agc ctg gaa aat ctg gcc gac ggc tac aag cac atg 1660
Cys Tyr Cys Asp Ser Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met
175 180 185
tca ctg gcc ctg aat cgg acc ggc cgc agc atc gtg tac tct tgc gag 1708
Ser Leu Ala Leu Asn Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu
190 195 200
tgg ccc ctg tat atg tgg ccc ttc cag aag cct aac tac acc gag atc 1756
Trp Pro Leu Tyr Met Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile
205 210 215
aga cag tac tgc aac cac tgg cgg aac ttc gcc gac atc gac gat agc 1804
Arg Gln Tyr Cys Asn His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser
220 225 230 235
tgg aag tcc atc aag agc atc ctg gac tgg acc agc ttc aat caa gag 1852
Trp Lys Ser Ile Lys Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu
240 245 250
cgg atc gtg gac gtg gca gga cct ggc gga tgg aac gat cct gac atg 1900
Arg Ile Val Asp Val Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met
255 260 265
ctg gtc atc ggc aac ttc ggc ctg agc tgg aac cag caa gtg acc cag 1948
Leu Val Ile Gly Asn Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln
270 275 280
atg gcc ctg tgg gcc att atg gcc gct cct ctg ttc atg agc aac gac 1996
Met Ala Leu Trp Ala Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp
285 290 295
ctg aga cac atc agc cct cag gcc aag gct ctg ctg cag gac aag gat 2044
Leu Arg His Ile Ser Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp
300 305 310 315
gtg atc gct atc aac cag gat cct ctg ggc aag cag ggc tac cag ctg 2092
Val Ile Ala Ile Asn Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu
320 325 330
aga cag ggc gac aat ttc gaa gtg tgg gaa aga ccc ctg agc gga ctg 2140
Arg Gln Gly Asp Asn Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu
335 340 345
gct tgg gcc gtc gcc atg atc aac aga caa gag atc ggc gga ccc cgg 2188
Ala Trp Ala Val Ala Met Ile Asn Arg Gln Glu Ile Gly Gly Pro Arg
350 355 360
tcc tac aca att gcc gtg gct tct ctc ggc aaa ggc gtg gcc tgt aat 2236
Ser Tyr Thr Ile Ala Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn
365 370 375
ccc gcc tgc ttt atc aca cag ctg ctg ccc gtg aag aga aag ctg ggc 2284
Pro Ala Cys Phe Ile Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly
380 385 390 395
ttt tac gag tgg acc agc aga ctg cgg agc cac atc aat cct acc ggc 2332
Phe Tyr Glu Trp Thr Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly
400 405 410
aca gtg ctg ctg cag ctg gaa aac aca atg cag atg agc ctg aag gac 2380
Thr Val Leu Leu Gln Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp
415 420 425
ctg ctg tga tga tgtacaaagc ttggatccaa tcaacctctg gattacaaaa 2432
Leu Leu
tttgtgaaag attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg 2492
ctgctttaat gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct 2552
tgtataaatc ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg 2612
gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct 2672
gtcagctcct ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg 2732
ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg 2792
tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc 2852
tgcgcgggac gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc 2912
gcggcctgct gccggctctg cggcctcttc cgcgtcttcg agatctgcct cgactgtgcc 2972
ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg 3032
tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag 3092
gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga 3152
caatagcagg catgctgggg actcgagtta agggcgaatt cccgataagg atcttcctag 3212
agcatggcta cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag 3272
tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 3332
aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 3390
<210> 13
<211> 429
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 13
Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys Ala Leu Ala Leu
1 5 10 15
Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu
20 25 30
Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp Glu
35 40 45
Arg Phe Met Cys Asn Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile
50 55 60
Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu Gly
65 70 75 80
Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met
85 90 95
Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg
100 105 110
Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys Gly
115 120 125
Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala Gly
130 135 140
Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala
145 150 155 160
Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser
165 170 175
Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu Asn
180 185 190
Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp Pro Leu Tyr Met
195 200 205
Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn
210 215 220
His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp Lys Ser Ile Lys
225 230 235 240
Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp Val
245 250 255
Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly Asn
260 265 270
Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp Ala
275 280 285
Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile Ser
290 295 300
Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile Asn
305 310 315 320
Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn
325 330 335
Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val Ala
340 345 350
Met Ile Asn Arg Gln Glu Ile Gly Gly Pro Arg Ser Tyr Thr Ile Ala
355 360 365
Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe Ile
370 375 380
Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr
385 390 395 400
Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu Gln
405 410 415
Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu
420 425
<210> 14
<211> 4294
<212> DNA
<213> 人工序列
<220>
<223> CB7.CI.hGLAco.WPRE.RBG
<220>
<221> repeat_region
<222> (1)..(130)
<223> 5' ITR
<220>
<221> repeat_region
<222> (198)..(579)
<223> CMV IE启动子
<220>
<221> promoter
<222> (582)..(863)
<223> CB启动子
<220>
<221> TATA_signal
<222> (582)..(863)
<223> TATA
<220>
<221> Intron
<222> (956)..(1928)
<223> 鸡β-肌动蛋白内含子
<220>
<221> CDS
<222> (1950)..(3242)
<223> hGLAco
<220>
<221> misc_feature
<222> (3317)..(3905)
<223> WPRE
<220>
<221> polyA_signal
<222> (3950)..(4076)
<223> 兔珠蛋白poly A
<220>
<221> repeat_region
<222> (4165)..(4294)
<223> 3' ITR
<400> 14
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag ggtaatgggg 180
atcctctaga actatagcta gtcgacattg attattgact agttattaat agtaatcaat 240
tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa 300
tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt 360
tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta 420
aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt 480
caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc 540
tacttggcag tacatctacg tattagtcat cgctattacc atggtcgagg tgagccccac 600
gttctgcttc actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat 660
tttttaatta ttttgtgcag cgatgggggc gggggggggg ggggggcgcg cgccaggcgg 720
ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca 780
gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa 840
aaagcgaagc gcgcggcggg cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc 900
cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 960
cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 1020
ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1080
gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc 1140
gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1200
gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1260
caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt 1320
cgggctgcaa ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg 1380
tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca 1440
ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg 1500
cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt 1560
atggtaatcg tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa 1620
atctgggagg cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg 1680
caggaaggaa atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc 1740
tctccagcct cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc 1800
ggggttcggc ttctggcgtg tgaccggcgg ctctagagcc tctgctaacc atgttcatgc 1860
cttcttcttt ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt 1920
tggcaaagaa tagcttcgaa ttcgccacc atg cag ctg aga aat ccc gag ctg 1973
Met Gln Leu Arg Asn Pro Glu Leu
1 5
cac ctg ggc tgt gcc ctg gct ctg aga ttt ctg gcc ctg gtg tct tgg 2021
His Leu Gly Cys Ala Leu Ala Leu Arg Phe Leu Ala Leu Val Ser Trp
10 15 20
gac atc cct ggc gct aga gcc ctg gat aac ggc ctg gcc aga aca cct 2069
Asp Ile Pro Gly Ala Arg Ala Leu Asp Asn Gly Leu Ala Arg Thr Pro
25 30 35 40
aca atg ggc tgg ctg cac tgg gag aga ttc atg tgc aac ctg gac tgc 2117
Thr Met Gly Trp Leu His Trp Glu Arg Phe Met Cys Asn Leu Asp Cys
45 50 55
caa gag gaa ccc gac agc tgc atc agc gag aag ctg ttc atg gaa atg 2165
Gln Glu Glu Pro Asp Ser Cys Ile Ser Glu Lys Leu Phe Met Glu Met
60 65 70
gcc gag ctg atg gtg tcc gaa ggc tgg aag gac gcc ggc tac gag tac 2213
Ala Glu Leu Met Val Ser Glu Gly Trp Lys Asp Ala Gly Tyr Glu Tyr
75 80 85
ctg tgc atc gac gac tgt tgg atg gcc cct cag aga gac tct gag ggc 2261
Leu Cys Ile Asp Asp Cys Trp Met Ala Pro Gln Arg Asp Ser Glu Gly
90 95 100
aga ctg cag gcc gat cct cag aga ttt ccc cac ggc att aga cag ctg 2309
Arg Leu Gln Ala Asp Pro Gln Arg Phe Pro His Gly Ile Arg Gln Leu
105 110 115 120
gcc aac tac gtg cac agc aag ggc ctg aag ctg ggc atc tac gcc gac 2357
Ala Asn Tyr Val His Ser Lys Gly Leu Lys Leu Gly Ile Tyr Ala Asp
125 130 135
gtg ggc aac aag acc tgt gcc ggc ttt cct ggc agc ttc ggc tac tac 2405
Val Gly Asn Lys Thr Cys Ala Gly Phe Pro Gly Ser Phe Gly Tyr Tyr
140 145 150
gat atc gac gcc cag acc ttc gcc gat tgg gga gtc gat ctg ctg aag 2453
Asp Ile Asp Ala Gln Thr Phe Ala Asp Trp Gly Val Asp Leu Leu Lys
155 160 165
ttc gac ggc tgc tac tgc gac agc ctg gaa aat ctg gcc gac ggc tac 2501
Phe Asp Gly Cys Tyr Cys Asp Ser Leu Glu Asn Leu Ala Asp Gly Tyr
170 175 180
aag cac atg tca ctg gcc ctg aat cgg acc ggc cgc agc atc gtg tac 2549
Lys His Met Ser Leu Ala Leu Asn Arg Thr Gly Arg Ser Ile Val Tyr
185 190 195 200
tct tgc gag tgg ccc ctg tat atg tgg ccc ttc cag aag cct aac tac 2597
Ser Cys Glu Trp Pro Leu Tyr Met Trp Pro Phe Gln Lys Pro Asn Tyr
205 210 215
acc gag atc aga cag tac tgc aac cac tgg cgg aac ttc gcc gac atc 2645
Thr Glu Ile Arg Gln Tyr Cys Asn His Trp Arg Asn Phe Ala Asp Ile
220 225 230
gac gat agc tgg aag tcc atc aag agc atc ctg gac tgg acc agc ttc 2693
Asp Asp Ser Trp Lys Ser Ile Lys Ser Ile Leu Asp Trp Thr Ser Phe
235 240 245
aat caa gag cgg atc gtg gac gtg gca gga cct ggc gga tgg aac gat 2741
Asn Gln Glu Arg Ile Val Asp Val Ala Gly Pro Gly Gly Trp Asn Asp
250 255 260
cct gac atg ctg gtc atc ggc aac ttc ggc ctg agc tgg aac cag caa 2789
Pro Asp Met Leu Val Ile Gly Asn Phe Gly Leu Ser Trp Asn Gln Gln
265 270 275 280
gtg acc cag atg gcc ctg tgg gcc att atg gcc gct cct ctg ttc atg 2837
Val Thr Gln Met Ala Leu Trp Ala Ile Met Ala Ala Pro Leu Phe Met
285 290 295
agc aac gac ctg aga cac atc agc cct cag gcc aag gct ctg ctg cag 2885
Ser Asn Asp Leu Arg His Ile Ser Pro Gln Ala Lys Ala Leu Leu Gln
300 305 310
gac aag gat gtg atc gct atc aac cag gat cct ctg ggc aag cag ggc 2933
Asp Lys Asp Val Ile Ala Ile Asn Gln Asp Pro Leu Gly Lys Gln Gly
315 320 325
tac cag ctg aga cag ggc gac aat ttc gaa gtg tgg gaa aga ccc ctg 2981
Tyr Gln Leu Arg Gln Gly Asp Asn Phe Glu Val Trp Glu Arg Pro Leu
330 335 340
agc gga ctg gct tgg gcc gtc gcc atg atc aac aga caa gag atc ggc 3029
Ser Gly Leu Ala Trp Ala Val Ala Met Ile Asn Arg Gln Glu Ile Gly
345 350 355 360
gga ccc cgg tcc tac aca att gcc gtg gct tct ctc ggc aaa ggc gtg 3077
Gly Pro Arg Ser Tyr Thr Ile Ala Val Ala Ser Leu Gly Lys Gly Val
365 370 375
gcc tgt aat ccc gcc tgc ttt atc aca cag ctg ctg ccc gtg aag aga 3125
Ala Cys Asn Pro Ala Cys Phe Ile Thr Gln Leu Leu Pro Val Lys Arg
380 385 390
aag ctg ggc ttt tac gag tgg acc agc aga ctg cgg agc cac atc aat 3173
Lys Leu Gly Phe Tyr Glu Trp Thr Ser Arg Leu Arg Ser His Ile Asn
395 400 405
cct acc ggc aca gtg ctg ctg cag ctg gaa aac aca atg cag atg agc 3221
Pro Thr Gly Thr Val Leu Leu Gln Leu Glu Asn Thr Met Gln Met Ser
410 415 420
ctg aag gac ctg ctg tga tga tgtacaagta aagatctgcg gccgcgtggt 3272
Leu Lys Asp Leu Leu
425
acctctagag tcgacccggg cggcctcgaa tcaagcttat cgataatcaa cctctggatt 3332
acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg 3392
gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct 3452
cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc gttgtcaggc 3512
aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg ggcattgcca 3572
ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc acggcggaac 3632
tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt 3692
ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt gttgccacct 3752
ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca gcggaccttc 3812
cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga 3872
cgagtcggat ctccctttgg gccgcctccc cgcatcgata ccgtctcgag gacggggtga 3932
actacgcctg aggatccgat ctttttccct ctgccaaaaa ttatggggac atcatgaagc 3992
cccttgagca tctgacttct ggctaataaa ggaaatttat tttcattgca atagtgtgtt 4052
ggaatttttt gtgtctctca ctcggaagca attcgttgat ctgaatttcg accacccata 4112
atacccatta ccctggtaga taagtagcat ggcgggttaa tcattaacta caaggaaccc 4172
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 4232
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 4292
ag 4294
<210> 15
<211> 429
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 15
Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys Ala Leu Ala Leu
1 5 10 15
Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu
20 25 30
Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp Glu
35 40 45
Arg Phe Met Cys Asn Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile
50 55 60
Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu Gly
65 70 75 80
Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met
85 90 95
Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg
100 105 110
Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys Gly
115 120 125
Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala Gly
130 135 140
Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala
145 150 155 160
Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser
165 170 175
Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu Asn
180 185 190
Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp Pro Leu Tyr Met
195 200 205
Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn
210 215 220
His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp Lys Ser Ile Lys
225 230 235 240
Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp Val
245 250 255
Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly Asn
260 265 270
Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp Ala
275 280 285
Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile Ser
290 295 300
Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile Asn
305 310 315 320
Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn
325 330 335
Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val Ala
340 345 350
Met Ile Asn Arg Gln Glu Ile Gly Gly Pro Arg Ser Tyr Thr Ile Ala
355 360 365
Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe Ile
370 375 380
Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr
385 390 395 400
Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu Gln
405 410 415
Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu
420 425
<210> 16
<211> 3378
<212> DNA
<213> 人工序列
<220>
<223> TBG.PI.hGLAco(M51C_G360C).WPRE.bGH
<220>
<221> repeat_region
<222> (1)..(168)
<223> 5' ITR
<220>
<221> enhancer
<222> (211)..(310)
<223> α mic/bik
<220>
<221> enhancer
<222> (317)..(416)
<223> α mic/bik
<220>
<221> misc_feature
<222> (431)..(907)
<223> TBG启动子
<220>
<221> Intron
<222> (939)..(1071)
<223> SV40 misc内含子
<220>
<221> CDS
<222> (1094)..(2386)
<223> hGLAco.M51C.G360C
<220>
<221> misc_feature
<222> (2399)..(2940)
<223> WPRE
<220>
<221> polyA_signal
<222> (2947)..(3161)
<223> BGH pA
<220>
<221> repeat_region
<222> (3211)..(3378)
<223> 3' ITR
<400> 16
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcgccc ttaagctagc aggttaattt ttaaaaagca gtcaaaagtc 240
caagtggccc ttggcagcat ttactctctc tgtttgctct ggttaataat ctcaggagca 300
caaacattcc agatccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 360
cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattccagat 420
ccggcgcgcc agggctggaa gctacctttg acatcatttc ctctgcgaat gcatgtataa 480
tttctacaga acctattaga aaggatcacc cagcctctgc ttttgtacaa ctttccctta 540
aaaaactgcc aattccactg ctgtttggcc caatagtgag aactttttcc tgctgcctct 600
tggtgctttt gcctatggcc cctattctgc ctgctgaaga cactcttgcc agcatggact 660
taaacccctc cagctctgac aatcctcttt ctcttttgtt ttacatgaag ggtctggcag 720
ccaaagcaat cactcaaagt tcaaacctta tcattttttg ctttgttcct cttggccttg 780
gttttgtaca tcagctttga aaataccatc ccagggttaa tgctggggtt aatttataac 840
taagagtgct ctagttttgc aatacaggac atgctataaa aatggaaaga tgttgctttc 900
tgagagactg cagaagttgg tcgtgaggca ctgggcaggt aagtatcaag gttacaagac 960
aggtttaagg agaccaatag aaactgggct tgtcgagaca gagaagactc ttgcgtttct 1020
gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca ggtgtccagg 1080
cggccgcgcc acc atg caa ctg aga aat cct gaa ctg cac ctg ggc tgc 1129
Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys
1 5 10
gcc ctg gct ctg aga ttt ctg gct ctg gtg tcc tgg gac atc cct ggc 1177
Ala Leu Ala Leu Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly
15 20 25
gct aga gcc ctg gat aac ggc ctg gcc aga aca cct aca atg ggc tgg 1225
Ala Arg Ala Leu Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp
30 35 40
ctg cac tgg gag aga ttc tgc tgc aac ctg gac tgc caa gag gaa ccc 1273
Leu His Trp Glu Arg Phe Cys Cys Asn Leu Asp Cys Gln Glu Glu Pro
45 50 55 60
gac agc tgc atc agc gag aag ctg ttc atg gaa atg gcc gag ctg atg 1321
Asp Ser Cys Ile Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met
65 70 75
gtg tcc gaa ggc tgg aag gac gcc ggc tac gag tac ctg tgc atc gac 1369
Val Ser Glu Gly Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp
80 85 90
gac tgt tgg atg gcc cct cag aga gac tct gag ggc aga ctg cag gcc 1417
Asp Cys Trp Met Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala
95 100 105
gat cct cag aga ttt ccc cac ggc att aga cag ctg gcc aac tac gtg 1465
Asp Pro Gln Arg Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val
110 115 120
cac agc aag ggc ctg aag ctg ggc atc tac gcc gac gtg ggc aac aag 1513
His Ser Lys Gly Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys
125 130 135 140
acc tgt gcc ggc ttt cct ggc agc ttc ggc tac tac gat atc gac gcc 1561
Thr Cys Ala Gly Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala
145 150 155
cag acc ttc gcc gat tgg gga gtc gat ctg ctg aag ttc gac ggc tgc 1609
Gln Thr Phe Ala Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys
160 165 170
tac tgc gac agc ctg gaa aat ctg gcc gac ggc tac aag cac atg tct 1657
Tyr Cys Asp Ser Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser
175 180 185
ctg gcc ctg aat cgg acc ggc aga tcc atc gtg tac agc tgc gag tgg 1705
Leu Ala Leu Asn Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp
190 195 200
ccc ctg tac atg tgg ccc ttc cag aag cct aac tac acc gag atc aga 1753
Pro Leu Tyr Met Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg
205 210 215 220
cag tac tgc aac cac tgg cgg aac ttc gcc gac atc gac gat agc tgg 1801
Gln Tyr Cys Asn His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp
225 230 235
aag tcc atc aag agc atc ctg gac tgg acc agc ttc aat caa gag cgg 1849
Lys Ser Ile Lys Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg
240 245 250
atc gtg gac gtg gca gga cct ggc gga tgg aac gat cct gac atg ctg 1897
Ile Val Asp Val Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu
255 260 265
gtc atc ggc aac ttc ggc ctg agc tgg aac cag caa gtg acc cag atg 1945
Val Ile Gly Asn Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met
270 275 280
gcc ctg tgg gcc att atg gcc gct cct ctg ttc atg agc aac gac ctg 1993
Ala Leu Trp Ala Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu
285 290 295 300
aga cac atc agc cct cag gcc aag gct ctg ctg cag gac aag gat gtg 2041
Arg His Ile Ser Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val
305 310 315
atc gct atc aac cag gat cct ctg ggc aag cag ggc tac cag ctg aga 2089
Ile Ala Ile Asn Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg
320 325 330
cag ggc gac aat ttc gaa gtg tgg gaa aga ccc ctg agc gga ctg gct 2137
Gln Gly Asp Asn Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala
335 340 345
tgg gcc gtc gcc atg atc aac cgg caa gag att tgc ggc ccc aga tcc 2185
Trp Ala Val Ala Met Ile Asn Arg Gln Glu Ile Cys Gly Pro Arg Ser
350 355 360
tac aca atc gcc gtg gcc agt ctc ggc aaa ggc gtg gca tgt aat ccc 2233
Tyr Thr Ile Ala Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro
365 370 375 380
gcc tgc ttc atc aca cag ctg ctg ccc gtg aag aga aag ctg ggc ttt 2281
Ala Cys Phe Ile Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe
385 390 395
tac gag tgg acc agc aga ctg cgg agc cac atc aat cct acc ggc aca 2329
Tyr Glu Trp Thr Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr
400 405 410
gtg ctg ctg cag ctg gaa aac acc atg cag atg agc ctg aag gac ctg 2377
Val Leu Leu Gln Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu
415 420 425
ctg tga tag aagcttggat ccaatcaacc tctggattac aaaatttgtg 2426
Leu
aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt 2486
taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata 2546
aatcctggtt gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg 2606
tgtgcactgt gtttgctgac gcaaccccca ctggttgggg cattgccacc acctgtcagc 2666
tcctttccgg gactttcgct ttccccctcc ctattgccac ggcggaactc atcgccgcct 2726
gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggtgttgt 2786
cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt tgccacctgg attctgcgcg 2846
ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc ggaccttcct tcccgcggcc 2906
tgctgccggc tctgcggcct cttccgcgtc ttcgagatct gcctcgactg tgccttctag 2966
ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac 3026
tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca 3086
ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag 3146
caggcatgct ggggactcga gttaagggcg aattcccgat aaggatcttc ctagagcatg 3206
gctacgtaga taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg 3266
agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 3326
cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc ag 3378
<210> 17
<211> 429
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 17
Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys Ala Leu Ala Leu
1 5 10 15
Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu
20 25 30
Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp Glu
35 40 45
Arg Phe Cys Cys Asn Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile
50 55 60
Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu Gly
65 70 75 80
Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met
85 90 95
Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg
100 105 110
Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys Gly
115 120 125
Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala Gly
130 135 140
Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala
145 150 155 160
Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser
165 170 175
Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu Asn
180 185 190
Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp Pro Leu Tyr Met
195 200 205
Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn
210 215 220
His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp Lys Ser Ile Lys
225 230 235 240
Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp Val
245 250 255
Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly Asn
260 265 270
Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp Ala
275 280 285
Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile Ser
290 295 300
Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile Asn
305 310 315 320
Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn
325 330 335
Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val Ala
340 345 350
Met Ile Asn Arg Gln Glu Ile Cys Gly Pro Arg Ser Tyr Thr Ile Ala
355 360 365
Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe Ile
370 375 380
Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr
385 390 395 400
Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu Gln
405 410 415
Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu
420 425
<210> 18
<211> 4240
<212> DNA
<213> 人工序列
<220>
<223> CB7.CI.hGLAco(M51C_G360C).WPRE.RBG
<220>
<221> repeat_region
<222> (1)..(130)
<223> 5' ITR
<220>
<221> misc_feature
<222> (198)..(579)
<223> CMV IE启动子
<220>
<221> promoter
<222> (582)..(863)
<223> CB启动子
<220>
<221> TATA_signal
<222> (836)..(839)
<223> TATA
<220>
<221> Intron
<222> (956)..(1928)
<223> 鸡β-肌动蛋白内含子
<220>
<221> CDS
<222> (1958)..(3250)
<223> hGLAco.M51C.G360C
<220>
<221> misc_feature
<222> (2363)..(2382)
<223> P18
<220>
<221> misc_feature
<222> (3263)..(3851)
<223> WPRE
<220>
<221> misc_feature
<222> (3619)..(3638)
<223> P19
<220>
<221> polyA_signal
<222> (3896)..(4022)
<223> 兔珠蛋白poly A
<220>
<221> repeat_region
<222> (4111)..(4240)
<223> 3' ITR
<400> 18
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag ggtaatgggg 180
atcctctaga actatagcta gtcgacattg attattgact agttattaat agtaatcaat 240
tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa 300
tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt 360
tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta 420
aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt 480
caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc 540
tacttggcag tacatctacg tattagtcat cgctattacc atggtcgagg tgagccccac 600
gttctgcttc actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat 660
tttttaatta ttttgtgcag cgatgggggc gggggggggg ggggggcgcg cgccaggcgg 720
ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca 780
gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa 840
aaagcgaagc gcgcggcggg cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc 900
cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 960
cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 1020
ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1080
gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc 1140
gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1200
gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1260
caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt 1320
cgggctgcaa ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg 1380
tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca 1440
ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg 1500
cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt 1560
atggtaatcg tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa 1620
atctgggagg cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg 1680
caggaaggaa atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc 1740
tctccagcct cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc 1800
ggggttcggc ttctggcgtg tgaccggcgg ctctagagcc tctgctaacc atgttcatgc 1860
cttcttcttt ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt 1920
tggcaaagaa tagcttcgaa ttcgcggccg cgccacc atg caa ctg aga aat cct 1975
Met Gln Leu Arg Asn Pro
1 5
gaa ctg cac ctg ggc tgc gcc ctg gct ctg aga ttt ctg gct ctg gtg 2023
Glu Leu His Leu Gly Cys Ala Leu Ala Leu Arg Phe Leu Ala Leu Val
10 15 20
tcc tgg gac atc cct ggc gct aga gcc ctg gat aac ggc ctg gcc aga 2071
Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu Asp Asn Gly Leu Ala Arg
25 30 35
aca cct aca atg ggc tgg ctg cac tgg gag aga ttc tgc tgc aac ctg 2119
Thr Pro Thr Met Gly Trp Leu His Trp Glu Arg Phe Cys Cys Asn Leu
40 45 50
gac tgc caa gag gaa ccc gac agc tgc atc agc gag aag ctg ttc atg 2167
Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile Ser Glu Lys Leu Phe Met
55 60 65 70
gaa atg gcc gag ctg atg gtg tcc gaa ggc tgg aag gac gcc ggc tac 2215
Glu Met Ala Glu Leu Met Val Ser Glu Gly Trp Lys Asp Ala Gly Tyr
75 80 85
gag tac ctg tgc atc gac gac tgt tgg atg gcc cct cag aga gac tct 2263
Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met Ala Pro Gln Arg Asp Ser
90 95 100
gag ggc aga ctg cag gcc gat cct cag aga ttt ccc cac ggc att aga 2311
Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg Phe Pro His Gly Ile Arg
105 110 115
cag ctg gcc aac tac gtg cac agc aag ggc ctg aag ctg ggc atc tac 2359
Gln Leu Ala Asn Tyr Val His Ser Lys Gly Leu Lys Leu Gly Ile Tyr
120 125 130
gcc gac gtg ggc aac aag acc tgt gcc ggc ttt cct ggc agc ttc ggc 2407
Ala Asp Val Gly Asn Lys Thr Cys Ala Gly Phe Pro Gly Ser Phe Gly
135 140 145 150
tac tac gat atc gac gcc cag acc ttc gcc gat tgg gga gtc gat ctg 2455
Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala Asp Trp Gly Val Asp Leu
155 160 165
ctg aag ttc gac ggc tgc tac tgc gac agc ctg gaa aat ctg gcc gac 2503
Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser Leu Glu Asn Leu Ala Asp
170 175 180
ggc tac aag cac atg tct ctg gcc ctg aat cgg acc ggc aga tcc atc 2551
Gly Tyr Lys His Met Ser Leu Ala Leu Asn Arg Thr Gly Arg Ser Ile
185 190 195
gtg tac agc tgc gag tgg ccc ctg tac atg tgg ccc ttc cag aag cct 2599
Val Tyr Ser Cys Glu Trp Pro Leu Tyr Met Trp Pro Phe Gln Lys Pro
200 205 210
aac tac acc gag atc aga cag tac tgc aac cac tgg cgg aac ttc gcc 2647
Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn His Trp Arg Asn Phe Ala
215 220 225 230
gac atc gac gat agc tgg aag tcc atc aag agc atc ctg gac tgg acc 2695
Asp Ile Asp Asp Ser Trp Lys Ser Ile Lys Ser Ile Leu Asp Trp Thr
235 240 245
agc ttc aat caa gag cgg atc gtg gac gtg gca gga cct ggc gga tgg 2743
Ser Phe Asn Gln Glu Arg Ile Val Asp Val Ala Gly Pro Gly Gly Trp
250 255 260
aac gat cct gac atg ctg gtc atc ggc aac ttc ggc ctg agc tgg aac 2791
Asn Asp Pro Asp Met Leu Val Ile Gly Asn Phe Gly Leu Ser Trp Asn
265 270 275
cag caa gtg acc cag atg gcc ctg tgg gcc att atg gcc gct cct ctg 2839
Gln Gln Val Thr Gln Met Ala Leu Trp Ala Ile Met Ala Ala Pro Leu
280 285 290
ttc atg agc aac gac ctg aga cac atc agc cct cag gcc aag gct ctg 2887
Phe Met Ser Asn Asp Leu Arg His Ile Ser Pro Gln Ala Lys Ala Leu
295 300 305 310
ctg cag gac aag gat gtg atc gct atc aac cag gat cct ctg ggc aag 2935
Leu Gln Asp Lys Asp Val Ile Ala Ile Asn Gln Asp Pro Leu Gly Lys
315 320 325
cag ggc tac cag ctg aga cag ggc gac aat ttc gaa gtg tgg gaa aga 2983
Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn Phe Glu Val Trp Glu Arg
330 335 340
ccc ctg agc gga ctg gct tgg gcc gtc gcc atg atc aac cgg caa gag 3031
Pro Leu Ser Gly Leu Ala Trp Ala Val Ala Met Ile Asn Arg Gln Glu
345 350 355
att tgc ggc ccc aga tcc tac aca atc gcc gtg gcc agt ctc ggc aaa 3079
Ile Cys Gly Pro Arg Ser Tyr Thr Ile Ala Val Ala Ser Leu Gly Lys
360 365 370
ggc gtg gca tgt aat ccc gcc tgc ttc atc aca cag ctg ctg ccc gtg 3127
Gly Val Ala Cys Asn Pro Ala Cys Phe Ile Thr Gln Leu Leu Pro Val
375 380 385 390
aag aga aag ctg ggc ttt tac gag tgg acc agc aga ctg cgg agc cac 3175
Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr Ser Arg Leu Arg Ser His
395 400 405
atc aat cct acc ggc aca gtg ctg ctg cag ctg gaa aac acc atg cag 3223
Ile Asn Pro Thr Gly Thr Val Leu Leu Gln Leu Glu Asn Thr Met Gln
410 415 420
atg agc ctg aag gac ctg ctg tga tag aagcttatcg ataatcaacc 3270
Met Ser Leu Lys Asp Leu Leu
425
tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac 3330
gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt 3390
cattttctcc tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt 3450
tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg 3510
cattgccacc acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac 3570
ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac 3630
tgacaattcc gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt 3690
tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc 3750
ggaccttcct tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg 3810
ccctcagacg agtcggatct ccctttgggc cgcctccccg catcgatacc gtctcgagga 3870
cggggtgaac tacgcctgag gatccgatct ttttccctct gccaaaaatt atggggacat 3930
catgaagccc cttgagcatc tgacttctgg ctaataaagg aaatttattt tcattgcaat 3990
agtgtgttgg aattttttgt gtctctcact cggaagcaat tcgttgatct gaatttcgac 4050
cacccataat acccattacc ctggtagata agtagcatgg cgggttaatc attaactaca 4110
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 4170
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 4230
gagcgcgcag 4240
<210> 19
<211> 429
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 19
Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys Ala Leu Ala Leu
1 5 10 15
Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu
20 25 30
Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp Glu
35 40 45
Arg Phe Cys Cys Asn Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile
50 55 60
Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu Gly
65 70 75 80
Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met
85 90 95
Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg
100 105 110
Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys Gly
115 120 125
Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala Gly
130 135 140
Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala
145 150 155 160
Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser
165 170 175
Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu Asn
180 185 190
Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp Pro Leu Tyr Met
195 200 205
Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn
210 215 220
His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp Lys Ser Ile Lys
225 230 235 240
Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp Val
245 250 255
Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly Asn
260 265 270
Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp Ala
275 280 285
Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile Ser
290 295 300
Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile Asn
305 310 315 320
Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn
325 330 335
Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val Ala
340 345 350
Met Ile Asn Arg Gln Glu Ile Cys Gly Pro Arg Ser Tyr Thr Ile Ala
355 360 365
Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe Ile
370 375 380
Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr
385 390 395 400
Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu Gln
405 410 415
Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu
420 425
<210> 20
<211> 2211
<212> DNA
<213> 腺相关病毒人68
<220>
<221> CDS
<222> (1)..(2211)
<400> 20
atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc agt 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gaa ggc att cgc gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc 96
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
aag gca aat caa caa cat caa gac aac gct cgg ggt ctt gtg ctt ccg 144
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
ggt tac aaa tac ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg 192
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gaa gca gac gcg gcg gcc ctc gag cac gac aag gcc tac gac 240
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctc aag gcc gga gac aac ccg tac ctc aag tac aac cac gcc 288
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
gac gcc gag ttc cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctc ggg cga gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
ctt ggt ctg gtt gag gaa gcg gct aag acg gct cct gga aag aag agg 432
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
cct gta gag cag tct cct cag gaa ccg gac tcc tcc gtg ggt att ggc 480
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Val Gly Ile Gly
145 150 155 160
aaa tcg ggt gca cag ccc gct aaa aag aga ctc aat ttc ggt cag act 528
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
ggc gac aca gag tca gtc ccc gac cct caa cca atc gga gaa cct ccc 576
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
gca gcc ccc tca ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc 624
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
gca cca gtg gca gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc 672
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
tcg gga aat tgg cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc 720
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aat cac ctc 768
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
tac aag caa atc tcc aac agc aca tct gga gga tct tca aat gac aac 816
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
gcc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac aga 864
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
ttc cac tgc cac ttc tca cca cgt gac tgg caa aga ctc atc aac aac 912
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
aac tgg gga ttc cgg cct aag cga ctc aac ttc aag ctc ttc aac att 960
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
cag gtc aaa gag gtt acg gac aac aat gga gtc aag acc atc gct aat 1008
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
aac ctt acc agc acg gtc cag gtc ttc acg gac tca gac tat cag ctc 1056
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
ccg tac gtg ctc ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca 1104
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
gcg gac gtt ttc atg att cct cag tac ggg tat cta acg ctt aat gat 1152
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
gga agc caa gcc gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc 1200
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
ccg tcg caa atg cta aga acg ggt aac aac ttc cag ttc agc tac gag 1248
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
ttt gag aac gta cct ttc cat agc agc tat gct cac agc caa agc ctg 1296
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
gac cga ctc atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 1344
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc agt 1392
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac ata cct 1440
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
gga ccc agc tac cga caa caa cgt gtc tca acc act gtg act caa aac 1488
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
aac aac agc gaa ttt gct tgg cct gga gct tct tct tgg gct ctc aat 1536
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
gga cgt aat agc ttg atg aat cct gga cct gct atg gcc agc cac aaa 1584
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
gaa gga gag gac cgt ttc ttt cct ttg tct gga tct tta att ttt ggc 1632
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
aaa caa gga act gga aga gac aac gtg gat gcg gac aaa gtc atg ata 1680
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
acc aac gaa gaa gaa att aaa act acc aac cca gta gca acg gag tcc 1728
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
tat gga caa gtg gcc aca aac cac cag agt gcc caa gca cag gcg cag 1776
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
acc ggc tgg gtt caa aac caa gga ata ctt ccg ggt atg gtt tgg cag 1824
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
gac aga gat gtg tac ctg caa gga ccc att tgg gcc aaa att cct cac 1872
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
acg gac ggc aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg 1920
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
aag cac ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg 1968
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
gat cct cca acg gct ttc aac aag gac aag ctg aac tct ttc atc acc 2016
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
cag tat tct act ggc caa gtc agc gtg gag att gag tgg gag ctg cag 2064
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc aac 2112
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
tat tac aag tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gtt 2160
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
tat tct gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 2208
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
taa 2211
<210> 21
<211> 736
<212> PRT
<213> 腺相关病毒人68
<400> 21
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Val Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 22
<211> 2208
<212> DNA
<213> 腺相关病毒9
<220>
<221> CDS
<222> (1)..(2208)
<223> AAV9 VP1衣壳
<400> 22
atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctt agt 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gaa gga att cgc gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc 96
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
aag gca aat caa caa cat caa gac aac gct cga ggt ctt gtg ctt ccg 144
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
ggt tac aaa tac ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg 192
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gca gca gac gcg gcg gcc ctc gag cac gac aag gcc tac gac 240
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctc aag gcc gga gac aac ccg tac ctc aag tac aac cac gcc 288
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
gac gcc gag ttc cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctc ggg cga gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
ctt ggt ctg gtt gag gaa gcg gct aag acg gct cct gga aag aag agg 432
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
cct gta gag cag tct cct cag gaa ccg gac tcc tcc gcg ggt att ggc 480
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
aaa tcg ggt gca cag ccc gct aaa aag aga ctc aat ttc ggt cag act 528
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
ggc gac aca gag tca gtc cca gac cct caa cca atc gga gaa cct ccc 576
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
gca gcc ccc tca ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc 624
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
gca cca gtg gca gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc 672
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
tcg gga aat tgg cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc 720
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aat cac ctc 768
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
tac aag caa atc tcc aac agc aca tct gga gga tct tca aat gac aac 816
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
gcc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac aga 864
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctc atc aac aac 912
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
aac tgg gga ttc cgg cct aag cga ctc aac ttc aag ctc ttc aac att 960
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
cag gtc aaa gag gtt acg gac aac aat gga gtc aag acc atc gcc aat 1008
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
aac ctt acc agc acg gtc cag gtc ttc acg gac tca gac tat cag ctc 1056
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
ccg tac gtg ctc ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca 1104
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
gcg gac gtt ttc atg att cct cag tac ggg tat ctg acg ctt aat gat 1152
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
gga agc cag gcc gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc 1200
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
ccg tcg caa atg cta aga acg ggt aac aac ttc cag ttc agc tac gag 1248
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
ttt gag aac gta cct ttc cat agc agc tac gct cac agc caa agc ctg 1296
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
gac cga cta atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 1344
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc agt 1392
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac ata cct 1440
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
gga ccc agc tac cga caa caa cgt gtc tca acc act gtg act caa aac 1488
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
aac aac agc gaa ttt gct tgg cct gga gct tct tct tgg gct ctc aat 1536
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
gga cgt aat agc ttg atg aat cct gga cct gct atg gcc agc cac aaa 1584
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
gaa gga gag gac cgt ttc ttt cct ttg tct gga tct tta att ttt ggc 1632
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
aaa caa gga act gga aga gac aac gtg gat gcg gac aaa gtc atg ata 1680
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
acc aac gaa gaa gaa att aaa act act aac ccg gta gca acg gag tcc 1728
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
tat gga caa gtg gcc aca aac cac cag agt gcc caa gca cag gcg cag 1776
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
acc ggc tgg gtt caa aac caa gga ata ctt ccg ggt atg gtt tgg cag 1824
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
gac aga gat gtg tac ctg caa gga ccc att tgg gcc aaa att cct cac 1872
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
acg gac ggc aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg 1920
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
aag cac ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg 1968
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
gat cct cca acg gcc ttc aac aag gac aag ctg aac tct ttc atc acc 2016
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
cag tat tct act ggc caa gtc agc gtg gag atc gag tgg gag ctg cag 2064
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc aac 2112
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
tat tac aag tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gta 2160
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
tat agt gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 2208
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 23
<211> 736
<212> PRT
<213> 腺相关病毒9
<400> 23
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 24
<211> 130
<212> DNA
<213> 腺相关病毒2
<400> 24
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 25
<211> 130
<212> DNA
<213> 腺相关病毒2
<400> 25
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag 130
<210> 26
<211> 973
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 26
gtgagcgggc gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg 60
cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc 120
ggggggagcg gctcgggggg tgcgtgcgtg tgtgtgtgcg tggggagcgc cgcgtgcggc 180
tccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc 240
agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag 300
gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg 360
tcggtcgggc tgcaaccccc cctgcacccc cctccccgag ttgctgagca cggcccggct 420
tcgggtgcgg ggctccgtac ggggcgtggc gcggggctcg ccgtgccggg cggggggtgg 480
cggcaggtgg gggtgccggg cggggcgggg ccgcctcggg ccggggaggg ctcgggggag 540
gggcgcggcg gcccccggag cgccggcggc tgtcgaggcg cggcgagccg cagccattgc 600
cttttatggt aatcgtgcga gagggcgcag ggacttcctt tgtcccaaat ctgtgcggag 660
ccgaaatctg ggaggcgccg ccgcaccccc tctagcgggc gcggggcgaa gcggtgcggc 720
gccggcagga aggaaatggg cggggagggc cttcgtgcgt cgccgcgccg ccgtcccctt 780
ctccctctcc agcctcgggg ctgtccgcgg ggggacggct gccttcgggg gggacggggc 840
agggcggggt tcggcttctg gcgtgtgacc ggcggctcta gagcctctgc taaccatgtt 900
catgccttct tctttttcct acagctcctg ggcaacgtgc tggttattgt gctgtctcat 960
cattttggca aag 973
<210> 27
<211> 589
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 27
aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60
ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120
atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180
tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240
ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300
attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360
ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 420
gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480
aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540
cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589
<210> 28
<211> 127
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 28
gatctttttc cctctgccaa aaattatggg gacatcatga agccccttga gcatctgact 60
tctggctaat aaaggaaatt tattttcatt gcaatagtgt gttggaattt tttgtgtctc 120
tcactcg 127
<210> 29
<211> 282
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 29
tggtcgaggt gagccccacg ttctgcttca ctctccccat ctcccccccc tccccacccc 60
caattttgta tttatttatt ttttaattat tttgtgcagc gatgggggcg gggggggggg 120
gggggcgcgc gccaggcggg gcggggcggg gcgaggggcg gggcggggcg aggcggagag 180
gtgcggcggc agccaatcag agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc 240
ggcggcggcg gccctataaa aagcgaagcg cgcggcgggc gg 282
<210> 30
<211> 382
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 30
ctagtcgaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 60
atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 120
cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 180
tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 240
tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 300
ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 360
acgtattagt catcgctatt ac 382
<210> 31
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> miR靶序列
<400> 31
agtgaattct accagtgcca ta 22
<210> 32
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> miR靶序列
<400> 32
agtgtgagtt ctaccattgc caaa 24

Claims (31)

1.一种重组AAV(rAAV),其包含其中包装有载体基因组的AAVhu68衣壳,其中所述载体基因组包含功能性人α-半乳糖苷酶A(hGLA)的编码序列和指导所述hGLA在靶细胞中表达的调节序列,
其中所述编码序列包含SEQ ID NO:4的核苷酸94至1287,或与其至少85%相同的序列,并且其中所述hGLA在基于SEQ ID NO:2的氨基酸残基编号的位置233和/或位置359处具有半胱氨酸残基。
2.根据权利要求1所述的rAAV,其中所述hGLA包含SEQ ID NO:2的至少氨基酸32至429,或与其至少95%相同的序列。
3.根据权利要求1或2所述的rAAV,其中所述hGLA包含SEQ ID NO:7的氨基酸32至429。
4.根据权利要求1至3中任一项所述的rAAV,其中所述hGLA包含天然信号肽。
5.根据权利要求1至3中任一项所述的rAAV,其中所述hGLA包含异源信号肽。
6.根据权利要求1至4中任一项所述的rAAV,其中所述hGLA包含SEQ ID NO:17的全长(氨基酸1至429),或与其至少95%相同的序列。
7.根据权利要求1至6中任一项所述的rAAV,其中所述载体基因组包含组织特异性启动子。
8.根据权利要求1至6中任一项所述的rAAV,其中所述调节序列包含CB7启动子、内含子和polyA。
9.根据权利要求1至8中任一项所述的rAAV,其中所述调节序列包含土拨鼠肝炎病毒转录后调节元件(WPRE)。
10.根据权利要求9所述的rAAV,其中所述WPRE包含SEQ ID NO:27。
11.根据权利要求1至9中任一项所述的rAAV,其中所述载体基因组包含一个或多个miRNA靶序列。
12.根据权利要求1所述的rAAV,其中所述载体基因组包含与SEQ ID NO:6至少85%相同的序列。
13.一种表达盒,其包含编码功能性人α-半乳糖苷酶A(hGLA)的核酸序列和指导所述hGLA在含有所述表达盒的靶细胞中表达的一个或多个调节序列,
其中所述核酸序列包含SEQ ID NO:4的核苷酸94至1287,或与其至少85%相同的序列,并且其中所述hGLA在基于SEQ ID NO:2或SEQ ID NO:7的氨基酸残基编号的位置233和/或位置359处具有半胱氨酸残基。
14.根据权利要求12所述的表达盒,其中所述hGLA包含SEQ ID NO:7的氨基酸32至429。
15.根据权利要求12或13所述的表达盒,其中所述hGLA包含天然信号肽。
16.根据权利要求12至14中任一项所述的表达盒,其中所述hGLA包含异源信号肽。
17.根据权利要求12至15中任一项所述的表达盒,其中所述hGLA包含SEQ ID NO:7的全长(氨基酸1至429),或与其至少95%相同的序列。
18.根据权利要求12至16中任一项所述的表达盒,其中所述表达盒包含组织特异性启动子。
19.根据权利要求12至16中任一项所述的表达盒,其中所述调节序列包含CB7启动子、内含子和polyA。
20.根据权利要求12至18中任一项所述的表达盒,其中所述调节序列包含土拨鼠肝炎病毒转录后调节元件(WPRE)。
21.根据权利要求19所述的rAAV,其中所述WPRE包含SEQ ID NO:27。
22.根据权利要求12至20中任一项所述的表达盒,其进一步包含一个或多个miRNA靶序列。
23.根据权利要求12至21中任一项所述的表达盒,其中所述表达盒由非病毒载体或病毒载体携带。
24.根据权利要求22所述的表达盒,其中非病毒载体选自裸DNA、裸RNA、质粒、无机颗粒、脂质颗粒、基于聚合物的载体或基于壳聚糖的制剂。
25.根据权利要求24所述的表达盒,其中病毒载体是重组细小病毒、重组慢病毒、重组逆转录病毒、重组腺病毒。
26.一种包含根据权利要求12至24中任一项所述的表达盒的质粒,任选地其中所述表达盒的侧翼为AAV 5′ITR和AAV 3′ITR。
27.一种宿主细胞,其包含根据权利要求12至24中任一项所述的表达盒或根据权利要求25所述的质粒。
28.一种药物组合物,其包含根据权利要求1至11中任一项所述的rAAV或根据权利要求12至24中任一项所述的表达盒,和药学上可接受的载体。
29.一种治疗诊断为GLA缺乏症(法布里病)的人类受试者的方法,所述方法包含向所述受试者施用根据权利要求1至11中任一项所述的rAAV、根据权利要求12至24中任一项所述的表达盒或根据权利要求27所述的药物组合物。
30.根据权利要求1至11中任一项所述的rAAV、根据权利要求12至24中任一项所述的表达盒或根据权利要求27所述的药物组合物,其用于治疗GLA缺乏症(法布里病)。
31.根据权利要求1至11中任一项所述的rAAV、根据权利要求12至24中任一项所述的表达盒或根据权利要求27所述的药物组合物,其用于制造用于治疗GLA缺乏症(法布里病)的药物。
CN202180081451.0A 2020-10-09 2021-10-08 用于治疗法布里病的组合物和方法 Pending CN116669774A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US63/089850 2020-10-09
US63/146286 2021-02-05
US202163186092P 2021-05-08 2021-05-08
US63/186092 2021-05-08
PCT/US2021/054145 WO2022076803A1 (en) 2020-10-09 2021-10-08 Compositions and methods for treatment of fabry disease

Publications (1)

Publication Number Publication Date
CN116669774A true CN116669774A (zh) 2023-08-29

Family

ID=87717570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180081451.0A Pending CN116669774A (zh) 2020-10-09 2021-10-08 用于治疗法布里病的组合物和方法

Country Status (1)

Country Link
CN (1) CN116669774A (zh)

Similar Documents

Publication Publication Date Title
JP7229161B2 (ja) フェニルケトン尿症を処置するための遺伝子療法
JP2022528416A (ja) 組換えアデノ随伴ウイルス及びその使用
KR20230118075A (ko) 파브리병 치료를 위한 조성물 및 방법
JP2019513794A (ja) 血友病a治療に対する遺伝子療法
KR20200104864A (ko) 뮤코다당류증 iiib형에 대한 유전자 요법
KR20200104307A (ko) 뮤코다당류증 iiia형에 대한 유전자 요법
CN115803064A (zh) 用于drg特异性降低转基因表达的组合物
KR20220008280A (ko) 폼페병의 치료에 유용한 조성물
KR20210071017A (ko) Gm1 강글리오시드증 치료에 유용한 조성물
CN113508130A (zh) 用于治疗达农病的基因治疗载体
CN113710281A (zh) 用于治疗grn相关成人发作性神经退行性病变的重组腺相关病毒
KR20220105158A (ko) 이식유전자 발현의 drg-특이적 감소를 위한 조성물
CN115029360A (zh) 用于治疗粘多糖贮积症iiia型的转基因表达盒
US20220370638A1 (en) Compositions and methods for treatment of maple syrup urine disease
KR20220145838A (ko) Gm1 강글리오사이드증을 치료하는 데 유용한 조성물
KR20210132095A (ko) 크라베병의 치료에 유용한 조성물
CN116669774A (zh) 用于治疗法布里病的组合物和方法
CA3177954A1 (en) Compositions useful for treatment of pompe disease
CN115772520B (zh) 用于治疗庞贝氏病的基因治疗构建体、药物组合物和方法
WO2023102517A1 (en) Compositions and methods for treatment of fabry disease
JP2024517843A (ja) ステレオシリン二重ベクター系を使用して感音性難聴を治療するための組成物及び方法
CN116670159A (zh) 组合物及其用于治疗安格尔曼综合征的用途
CA3205351A1 (en) Compositions and methods for treatment of niemann pick type a disease
CN117836420A (zh) 重组tert编码病毒基因组和运载体
CN115820740A (zh) 用于治疗ⅱ型粘多糖贮积症的重组腺相关病毒载体及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination