CN116670159A - 组合物及其用于治疗安格尔曼综合征的用途 - Google Patents

组合物及其用于治疗安格尔曼综合征的用途 Download PDF

Info

Publication number
CN116670159A
CN116670159A CN202180085876.9A CN202180085876A CN116670159A CN 116670159 A CN116670159 A CN 116670159A CN 202180085876 A CN202180085876 A CN 202180085876A CN 116670159 A CN116670159 A CN 116670159A
Authority
CN
China
Prior art keywords
leu
glu
lys
asn
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180085876.9A
Other languages
English (en)
Inventor
J·珀西瓦尔
R·施密德
J·M·威尔逊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Pennsylvania Penn
Original Assignee
University of Pennsylvania Penn
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Pennsylvania Penn filed Critical University of Pennsylvania Penn
Priority claimed from PCT/US2021/061346 external-priority patent/WO2022119890A1/en
Publication of CN116670159A publication Critical patent/CN116670159A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明提供了一种具有包含UBE3A编码序列的载体基因组的rAAV。本发明还提供了一种用于在具有神经元中的缺陷型UBE3A表达的患者中治疗安格尔曼综合征(AS)的一种或多种症状的方法,其中所述方法包括递送具有编码UBE3A的核酸序列的rAAV。

Description

组合物及其用于治疗安格尔曼综合征的用途
背景技术
安格尔曼综合征(AS)是一种罕见遗传病,其在全世界内影响500,000人。AS的主要症状包括智力残疾、运动功能障碍、共济失调、语言缺失、严重癫痫和独特的行为特征。大多数患有AS的个体表现出母系遗传的UBE3A等位基因的功能丧失,该等位基因编码HECT E3泛素连接酶,该连接酶将泛素连接到靶向它们的底物以进行降解。65-70%的AS病例是由涉及母体染色体15q11-q13从头缺失的I类突变引起的[Angelman H.,Puppet’children.关于三个案例的报告(A report on three cases),Dev Med Child Neurol,1965,7:681–88;Mertz Lg等人.,丹麦中的安格尔曼综合征的出生发生率、遗传发现和诊断年龄(Angelmansyndrome in Denmark.Birth incidence,genetic findings,and age at diagnosis),AmJ Med Genet A,2013,161A(9):2197-2203,电子版2013年8月2日;Clayton-Smith J.,和Laan L.,安格尔曼综合征:临床和遗传类型概述(Angelman syndrome:a review of theclinical and genetic types),J Med Genet,2003,40(2):87-95,电子版2003年2月1日;Khatri N和Man H,自闭症和安格尔曼综合征蛋白Ube3A/E6AP:基因,E3连接酶泛素化和神经生物学功能(The Autism and Angelman Syndrome Protein Ube3A/E6AP:The Gene,E3Ligase Ubiquination Targets and Neurobiological Functions),Front MolNeurosci,2009,12(109):1-12,电子版2019年4月30日]。
已在小鼠中描述了三种UBE3A同种型,其中同种型2和3已被确定为小鼠中的主要UBE3A剪接变体。(Valluy,J.等人.,神经元发展期间替代性Ube3a转录物的编码独立性功能(A coding-independent function of an alternative Ube3a transcript duringneuronal development),Nat Neurosci,2015,18(5):666-673,电子版2015年4月13日;Trezza Ra等人.,核UBE3a的丢失引起小鼠电生理学和行为缺陷并与安格尔曼综合征相关(Loss of nuclear UBE3a causes electrophysiological and behavioral deficits inmice and is associated with Angelman syndrome),Nat Neurosci,2019,22(8):1235-1247,电子版2019年6月24日;Zampeta Fi等人.,由非同源同种型促进的人与小鼠之间的保护型UBE3a亚细胞分布(Conserved UBE3a subcellular distribution between humanand mice is facilitated by non-homologous isoforms),Hum Mol Genet,2020,29(18):3032-3043,电子版2020年9月2日)。hUBE3A同种型1的丢失发生在患有“轻度”安格尔曼综合征的个体中(Sadhwani,A等人.,神经发育异常先进的两种安格尔曼族携带表达最高的UBE3a同种型起始密码子变体(Two Angelman families with unusually advancedneurodevelopment carry a start codon variant in the most highly expressedUBE3a isoform),Am J Med Genet A,2018,176(7):1641-1647,电子版2018年5月7日),其仍然表达核hUBE3A同种型3和细胞质hUBE3A同种型2。
目前,还没有治愈AS的方法。目前的治疗是姑息性的,侧重于管理医疗和发育问题,包括癫痫。缺乏治疗选择强调了对AS新疗法的关键未满足需求。
发明内容
本文提供了一种基于UBE3A同种型1的新型腺相关病毒(AAV)基因替代疗法,该疗法有用且耐受性良好。如在安格尔曼动物模型中评估的那样,组合物和方法可以减轻与安格尔曼综合征(AS)相关的运动和行为缺陷。在一个实施例中,组合物包括可用于治疗AS的重组腺相关病毒(rAAV)原种,rAAV包含AAV衣壳和包装在其中的载体基因组,所述载体基因组包含:(A)AAV 5'反向末端重复序列(ITR);(b)包括SEQ ID NO:9的UBE3A核酸序列或与其编码UBE3A同种型1蛋白的序列95%相同的序列(SEQ ID NO:2),其中核酸可操作地连接到调控人细胞中UBE3A蛋白的表达的调控元件;(c)直接表达(b)的UBE3A的调控元件;以及(d)AAV 3'ITR。在某些实施例中,调控元件包括神经元特异性启动子。在某些实施例中,神经元特异性启动子是突触蛋白启动子。在某些实施例中,突触蛋白启动子是具有SEQ ID NO:12的核酸序列的缩短的启动子。在某些实施例中,调控元件包括组成型启动子。在某些实施例中,调控元件进一步一种或多种增强子和一种或多种内含子。在某些实施例中,调控序列进一步包括针对miR182(SEQ ID NO:20)和/或miR183(SEQ ID NO:11)的一个或多个靶序列,所述靶序列可操作地连接到UBE3A核酸序列。在某些实施例中,调控序列进一步包括针对选自miR182和/或miR183的miR的一个或多个靶序列,所述靶序列位于UBE3A核酸序列的下游。在某些实施例中,调控序进一步包括针对miR183的四个靶序列,所述靶序列位于UBE3A核酸序列的下游。在一些实施例中,调控序列包括四个拷贝的SEQ ID NO:11。在某些实施例中,AAV衣壳是AAVhu68衣壳。在某些实施例中,AAV衣壳是由SEQ ID NO:14或SEQ ID NO:16的核酸序列的表达产生的AAVhu68衣壳。在某些实施例中,AAV衣壳是AAVrh91衣壳。在某些实施例中,AAV衣壳是由SEQ ID NO:17或SEQ ID NO:19的核酸序列表达的AAVrh91衣壳。在某些实施例中,组合物是进一步包括生理学上相容的载体、缓冲液、佐剂和/或稀释剂的水性悬浮液。
在某些实施例中,本文所述的组合物可用于治疗患有安格尔曼综合征的患者。在某些实施例中,本文提供的组合物可用于治疗安格尔曼综合征的一种或多种症状,任选地其中症状选自以下一者或多者:发育迟缓、智力残疾、严重语言障碍、共济失调和/或癫痫。在某些实施例中,提供了一种用于通过递送本文提供的表达盒来治疗在具有神经元中的缺陷型UBE3A表达的患者中的安格尔曼综合征(AS)的一种或多种症状的方法。在某些实施例中,表达盒治疗选自以下一者或多者的症状:发育迟缓、智力残疾、严重语言障碍、共济失调和/或癫痫。在某些实施例中,组合物被提供用于鞘内递送给患者。在某些实施例中,患者被注射至少1x1010至1x1013GC/kg的携带工程化UBE3A编码序列的rAAV。
在某些实施例中,该方法提供安格尔曼病症状的改善,包括发育迟缓、智力残疾、严重语言障碍、共济失调和/或癫痫中的一种或多种。
这些方法和组合物的其他方面和优点在以下具体实施方式中进一步描述。
附图说明
图1A至图1C提供了没有用于调节背根神经节表达和毒性的miR序列的表达盒和载体基因组的示意图。图1A提供了载体基因组的示意图,其中5'AAV反向末端重复序列(ITR)和3'AAV ITR位于hUBE3A-同种型1表达盒的侧翼。表达盒含有在修饰的突触蛋白启动子控制下的工程化hUBE3A-同种型1编码序列(编码852个氨基酸;SEQ ID NO:2)。hUBE3A编码序列包括Ube3A连接酶的氨基末端锌指(AZUL)、HECT结构域和RCC1样结构域2(HERC2)、E6蛋白结合结构域(E6BD)以及与E6-AP羧基末端同源的区域(HECT)以及SV40 polyA。图1B提供了载体基因组的示意图,其中AAV ITR位于hUBE3A-同种型2表达盒的侧翼。编码的同种型2蛋白的长度为875个氨基酸(SEQ ID NO:6)。图1C提供了载体基因组的示意图,其中AAV ITR位于hUBE3A-同种型3表达盒的侧翼。编码的同种型3蛋白的长度为872个氨基酸(SEQ ID NO:21)。
图2A和图2B示出了在非人灵长类动物(NHP)中具有4个拷贝的miR183(4xmiR183)靶序列(浅色圆圈)或不具有4xmiR183序列(深色序列)的rAAVhu68.UBE3A-同种型1的载体生物分布和mRNA表达的评估结果。图2A示出了如小脑、尾状核、海马、额叶皮层、枕叶皮层、髓质、顶叶皮层、颞叶皮层、丘脑、DRG颈椎、DRG胸椎、DRG腰椎、脊髓颈椎、脊髓胸椎、脊髓腰椎中的基因组拷贝(GC)/二倍体基因组中测量的NHP中的UBE3A同种型1载体生物分布。图2B示出了在用rAAVhu68.UBE3A-同种型1治疗后UBE3A同种型1的mRNA表达,其中在NHP的脊髓和DRG中具有4个拷贝的miR183(4xmiR183)靶序列(浅色圆圈)或不具有4xmiR183序列(深色序列)。图2C示出了如小脑、尾状核、海马、额叶皮层、枕叶皮层、髓质、顶叶皮层、颞叶皮层、丘脑、DRG颈椎、DRG胸椎、DRG腰椎、脊髓颈椎、脊髓胸椎、脊髓腰椎、大脑(阴性对照)中的UBE3A同种型1。
图3A和图3B显示AAVhu68-UBE3A-同种型1±4xmiR183载体不会在(3-4岁)恒河猴中引起显著的背根神经节(DRG)毒性。hUBE3A-1(第1组)或hUbe3a-1-4xmiR183(第2组)载体在以3x1013GC/动物的剂量施用在小脑延髓池(ICM)后35天,不会在恒河猴中引起显著的AAV诱导的背根神经节毒性。仅在第1组动物192285的脊髓和周围神经中观察到DRG相关毒性。两组动物中的DRG不显著(图3A),只有零星的最小单核细胞浸润(图3B,圆圈),并且没有神经元变性的证据(3/3动物,第1组;3/3动物,第2组)。
图4A和图4B显示rAAVhu68.突触蛋白-UBE3A同种型1对(3-4岁)恒河猴周围神经的影响。最小局灶性轴突病(focal axonopathy)对后肢神经的影响(箭头)。图4A显示周围神经中的动物AAVhu68.突触蛋白-UBE3A同种型1。图4B显示动物192275和192297表现出192285在前肢右正中神经中表现出的轻度多灶性轴突病(箭头)和单核细胞浸润(椭圆形)。
图5显示经治疗的UBE3Am-/p+新生小鼠中UBE3A蛋白阳性神经元的量化。治疗包括通过脑室内(ICV)以1x1011 GC/动物的剂量施用AAV-PHP.B-hSyn-UBE3A-同种型1。在皮层、海马、丘脑、下丘脑和中脑中,42%-68%为神经元表达的UBE3A蛋白(归一化为相应WT组织中的UBE3A阳性神经元)。
图6显示经治疗的UBE3Am-/p+新生小鼠中UBE3A蛋白阳性神经元的量化。治疗包括通过脑室内(ICV)以1x1010 GC/动物的剂量施用AAV-PHP.B-hSyn-UBE3A-同种型1。在皮层、海马、丘脑、下丘脑和中脑中,20%-50%为神经元表达的UBE3A蛋白(归一化为相应WT组织中的UBE3A阳性神经元)。
图7A至图7I显示来自三种经处理的非人灵长类动物(NHP-1、NHP-2、NHP-3;在35天研究中)的工程化人UBE3A同种型1(hUBE3A-1)转录物在背根神经节(颈、胸和背节段)中的定位的荧光图像。治疗包括通过小脑延髓池(ICM)途径以3x1013 GC/动物的剂量施用AAV-PHP.B-hSyn-UBE3A-同种型1。所关注的区域的图像是在不同的放大倍数下拍摄的,并且图像以20x的放大倍数呈现。图7A显示来自NHP-1的背根神经节颈段中工程化hUBE3A-1转录物定位的荧光图像。图7B显示来自NHP-2的背根神经节颈段中工程化hUBE3A-1转录物定位的荧光图像。图7C显示来自NHP-3的背根神经节颈段中工程化hUBE3A-1转录物定位的荧光图像。图7D显示来自NHP-1的背根神经节胸段中工程化hUBE3A-1转录物定位的荧光图像。图7E显示来自NHP-2的背根神经节胸段中工程化hUBE3A-1转录物定位的荧光图像。图7F显示来自NHP-3的背根神经节胸段中工程化hUBE3A-1转录物定位的荧光图像。图7G显示来自NHP-1的背根神经节腰段中工程化hUBE3A-1转录物定位的荧光图像。图7H显示来自NHP-2的背根神经节腰段中工程化hUBE3A-1转录物定位的荧光图像。图7I显示来自NHP-3的背根神经节腰段中工程化hUBE3A-1转录物定位的荧光图像。
图8显示在用AAV-PHP.B-hSyn-hUBE3A-iso1 ICV注射后,UBE3Am-/p+和野生型小鼠的大脑中工程化UBE3A同种型1的表达。
图9A和图9B显示在新生野生型或AS(UBE3Am-/p+)小鼠以每只动物1x1011基因组拷贝(GC)的剂量脑室内(ICV)注射AAV-PHP.B-突触蛋白-UBE3A-同种型1或同种型2载体之后,在8-10周龄时进行的运动能力协调行为测试的结果。图9A显示在用AAV-PHP.B-突触蛋白-UBE3A-同种型1治疗后WT和AS小鼠的运动协调能力。图9B显示在用AAV-PHP.B-突触蛋白-UBE3A-同种型2治疗后WT和AS小鼠的运动协调能力。
图10A至10D显示在新生野生型或AS(UBE3Am-/p+)小鼠以每只动物1x1011基因组拷贝(GC)的剂量脑室内(ICV)注射AAV-PHP.B-突触蛋白-UBE3A-同种型1或同种型2载体之后,在8-10周龄时进行的筑巢能力行为测试的结果。图10A显示在用AAV-PHP.B-突触蛋白-UBE3A-同种型1治疗后WT和AS小鼠的筑巢评分。图10B显示在用AAV-PHP.B-突触蛋白-UBE3A-同种型1治疗后WT和AS小鼠的未使用筑巢百分比。图10C显示在用AAV-PHP.B-突触蛋白-UBE3A-同种型2治疗后WT和AS小鼠的筑巢评分。图10D显示在用AAV-PHP.B-突触蛋白-UBE3A-同种型2治疗后WT和AS小鼠的未使用筑巢百分比。
图11A至图11D显示在新生野生型或AS(UBE3Am-/p+)小鼠以每只动物1x1011基因组拷贝(GC)的剂量脑室内(ICV)注射AAV-PHP.B-突出蛋白-UBE3A-同种型1载体之后,在8-10周龄时进行的猫步(步幅长度和步态改善)行为测试的结果。图11A显示在用AAV-PHP.B-突触蛋白-UBE3A-同种型1治疗后WT和AS小鼠右后肢(RH)的步幅长度。图11B显示在用AAV-PHP.B-突触蛋白-UBE3A-同种型1治疗后WT和AS小鼠左后肢(LH)的步幅长度。图11C显示在用AAV-PHP.B-突触蛋白-UBE3A-同种型1治疗后WT和AS小鼠右后肢(RH)的步幅长度。图11D显示在用AAV-PHP.B-synapsin-UBE3A-同种型1治疗后WT和AS小鼠左后肢(LH)的步幅长度。
图12A至图2C显示在通过小脑延髓池(ICM)途径用AAV-hu68-hSyn-UBE3A-同种型1以3x1013 GC/动物的剂量治疗后35天之后NHP中背根神经节(drg)的毒性研究结果(绘制为病理分级评分0-5)。图12A显示NHP的DRG的颈段的评分病理分级。图12B显示NHP的DRG的胸段的评分病理分级。图12C显示NHP的DRG的腰段的评分病理分级。
图13A至图13C显示在通过小脑延髓池(ICM)途径用AAV-hu68-hSyn-UBE3A-同种型1以3x1013 GC/动物的剂量治疗后35天之后NHP中脊髓的毒性研究结果(绘制为病理分级评分0-5)。图13A显示NHP的颈段的评分病理分级。图13B显示NHP的脊髓胸段的评分病理分级。图13C显示NHP的脊髓腰段的评分病理分级。
图14显示在通过小脑延髓池(ICM)途径用AAV-hu68-hSyn-UBE3A-同种型1以3x1013GC/动物的剂量治疗后35天之后NHP中周围神经的毒性研究结果(绘制为轴突病变病理分级评分0-5)。
图15A至图15C显示在通过小脑延髓池(ICM)途径用AAV-hu68-hSyn-UBE3A-同种型1以3x1013 GC/动物的剂量治疗后14天和35天之后周围神经传导研究的结果。图15A显示以m/sec测量的左正中神经的速度。图15B显示用AAV-hu68-hSyn-UBE3A-同种型1治疗后14天和35天之后周围神经传导研究的结果,以mV为单位测量峰峰值(PP)振幅。图15C显示用AAV-hu68-hSyn-UBE3A-同种型1治疗后14天和35天之后周围神经传导研究的结果,以mV为单位测量负峰值(NP)振幅。
图16A和图16B显示经治疗的UBE3Am-/p+新生小鼠中UBE3A同种型1或同种型2蛋白阳性神经元的量化,绘制为皮层、海马、丘脑、下丘脑和中脑中的阳性神经元百分比,相对于WT组织中的UBE3A阳性神经元归一化。治疗包括通过脑室内(ICV)以1x1011GC/动物的剂量施用AAV-PHP.B-hSyn-UBE3A-同种型1或同种型2。图16A显示治疗后小鼠的皮层、海马、丘脑、下丘脑和中脑中UBE3A同种型1阳性神经元的百分比。图16B显示治疗后小鼠的皮层、海马、丘脑、下丘脑和中脑中UBE3A同种型2阳性神经元的百分比。
具体实施方式
本文提供的表达盒含有工程化的UBE3A-同种型1编码序列,该编码序列在被递送时(例如,通过rAAV介导的基因替代疗法)以治疗安格尔曼综合征症状的水平表达UB3A同种型1。在某些实施例中,表达盒中的调控元件包括多达八个,例如四到八个miR183序列以调控背根神经节(DRG)表达和/或毒性。在某些实施例中,选择这些DRG去靶序列以在高水平表达时和/或在旨在全身递送时使用。在其他实施例中,当使用鞘内递送时包括这些序列。
在一个实施例中,表达盒包括工程化的UBE3A编码(核酸序列),该编码可操作地连接到调控UBE3A蛋白在靶人细胞中的表达的调控元件。在某些实施例中,UBE3A编码序列编码UBE3A同种型1蛋白,其在SEQ ID NO:2中再现。hUBE3A同种型1蛋白包括多个结构域,包括Ube3A连接酶的氨基末端锌指(AZUL)、HECT结构域和RCC1样结构域2(HERC2)、E6蛋白结合结构域(E6BD)以及与E6-AP羧基末端同源的区域(HECT)。合适地,工程化UBE3A同种型1编码序列是SEQ ID NO:9的核酸序列或与其至少95%相同的编码UBE3A同种型1蛋白的序列(SEQID NO:2)。在某些实施例中,序列与SEQ ID NO:9的全长100%相同。在其他实施例中,序列与SEQ ID NO:9至少95%相同、至少97%相同、至少98%相同、至少99%相同、至少99.5%相同。在某些实施例中,UBE3A同种型1编码序列在5'或3'端被截短,导致UBE3A同种型1蛋白的羧基或N-末端被截短。
在某些实施例中,UBE3A编码序列编码UBE3A同种型2蛋白,其在SEQ ID NO:6中再现。hUBE3A同种型2蛋白包括多个结构域,包括Ube3A连接酶的氨基末端锌指(AZUL)、HECT结构域和RCC1样结构域2(HERC2)、E6蛋白结合结构域(E6BD)以及与E6-AP羧基末端同源的区域(HECT)。合适地,工程化UBE3A同种型2编码序列是SEQ ID NO:10的核酸序列或与其至少95%相同的编码UBE3A同种型2蛋白(SEQ ID NO:6)的序列。在某些实施例中,序列与SEQ IDNO:10的全长100%相同。在其他实施例中,序列与SEQ ID NO:10至少95%相同、至少97%相同、至少98%相同、至少99%相同、至少99.5%相同。在某些实施例中,UBE3A同种型2编码序列在5'或3'端被截短,导致UBE3A同种型2蛋白的羧基或N-末端被截短。在某些实施例中,UBE3a编码序列编码UBE3A同种型3蛋白,其在SEQ ID NO:21(UNIPROT ID No:Q05086-3)中再现。
在某些实施例中,表达盒包括UBE3A编码序列,其中任选地UBE3A编码序列编码包括信号肽和功能性UBE3A蛋白的融合蛋白。在某些实施例中,表达盒包括UBE3A编码序列,其中任选地UBE3A编码序列编码融合蛋白,该融合蛋白包括与功能性UBE3A蛋白融合的摄取肽。在某些实施例中,表达盒UBE3A编码序列,其中任选地UBE3A编码序列编码融合蛋白,该融合蛋白包括与信号肽和/或摄取肽融合的UBE3A蛋白。在一些实施例中,表达盒包括UBE3A编码序列,其中任选地信号肽和/或摄取肽位于UBE3A编码序列的5'或3'以提供在UBE3A蛋白的N-末端包括信号肽和/或摄取肽的融合蛋白、在UBE3A蛋白的C-末端包括信号肽和/或摄取肽的融合蛋白、或在UBE3A蛋白的N-末端包括信号肽的融合蛋白、或在UBE3A蛋白的C-末端具有信号肽或摄取肽的融合蛋白或其组合。在某些实施例中,信号肽是结合免疫球蛋白(BiP)信号肽。在某些实施例中,信号肽是Gaussia信号肽。还参见美国专利第US 9,279,007 B2号((对应国际专利申请号WO2012/071422;结合免疫球蛋白(BiP)信号肽)、US 10,874,750B2(对应国际专利申请第WO2019/213180A1号;结合免疫球蛋白(BiP)信号肽和Gaussia信号肽),其通过引用整体并入本文。在某些实施例中,任选地UBE3A是包括增强表达、分泌和细胞摄取的肽的融合蛋白。在某些实施例中,任选地UBE3A是包括肽的融合蛋白,该肽是胱抑素肽序列。还参见US 9,567,369,其通过引用整体并入本文。在某些实施例中,任选地UBE3A是包括肽的融合蛋白,该肽衍生自HIV TATk肽(例如,TATk28、TATk11)。还参见WO2015/128746A2(US 10,907,138B2)、WO2018/005617A2(US 2021/0268072)、WO2019/108924A2、WO2020/250081A1和WO2021/087282A1,其通过引用整体并入本文。在某些实施例中,肽是IGF2肽。还参见WO2021/072372,其通过引用整体并入本文。在某些实施例中,任选地UBE3A是包括肽的融合蛋白,该肽包括选自穿膜蛋白、R6W3、HIV TAT、HIV TATk和pVEC的细胞摄取序列。在某些实施例中,任选地UBE3A是包括肽的融合蛋白,该肽包括选自胰岛素、GDNF和IgK的分泌序列。还参见WO 2019/006107,其通过引用整体并入本文。
在某些实施例中,选择UBE3A同种型1表达盒作为单独的基因替代疗法进行递送。在某些实施例中,选择UBE3A同种型1表达盒作为基因替代疗法在涉及一种或多种其他活性成分的方案中递送(例如,短期或长期酶替代疗法和/或底物耗竭疗法)。
在一个实施例中,组合物包括包含用于UBE3A同种型1的表达盒的载体。本文描述了合适的载体和载体基因组。
在其他实施例中,提供了重组细小病毒载体(例如,重组腺相关病毒)的原种。rAAV包括AAV衣壳和包装在其中的载体基因组,所述载体基因组包括:(a)AAV 5'反向末端重复序列(ITR);(b)包含SEQ ID NO:9的UBE3A核酸序列或与其95%相同的编码UBE3A同种型1蛋白(SEQ ID NO:2)的序列,其中核酸可操作地连接到调控人细胞中UBE3A蛋白的表达的调控元件;(c)直接表达(b)的UBE3A的调控元件;以及(d)AAV 3'ITR。理想的AAV衣壳包括AAVhu68和AAVrh91,它们靶向中枢神经***(CNS)中的所需细胞。
在某些实施例中,rAAV包括AAV衣壳和包装在其中的载体基因组,其中所述载体基因组包括:(a)AAV 5'反向末端重复序列(ITR);(b)任选地肽(例如,信号肽或摄取肽);(c)包含SEQ ID NO:9的UBE3A核酸序列或与其95%相同的编码UBE3A同种型1蛋白(SEQ ID NO:2)的序列,其中核酸序列可操作地连接到调控人细胞中UBE3A蛋白的表达的调控元件;(d)任选地肽(调控肽和/或摄取肽);(e)直接表达(b)的UBE3A的调控元件;以及(f)AAV 3'ITR。在某些实施例中,信号肽是BiP信号肽。还参见US 9,279,007 B2(对应国际专利申请第WO2012/071422号)和US 10,874,750B2(对应国际专利申请第WO2019/213180A1号),其通过引用整体并入本文。在某些实施例中,调控肽是IGF肽。还参见WO2021/072372,其通过引用整体并入本文。在某些实施例中,信号肽是包括选自胰岛素、GDNF和IgK的分泌序列的分泌信号肽。在某些实施例中,摄取肽包括选自穿膜蛋白、R6W3、HIV TAT、HIV TATk和pVEC的细胞摄取序列。还参见WO 2019/006107,其通过引用整体并入本文。
在某些实施例中,UBE3A任选地是包括信号肽和/或摄取肽的融合蛋白,如本文所述。在某些实施例中,信号肽和/或摄取肽位于氨基(N)-末端或羧基(C)-末端。在某些实施例中,信号肽位于氨基(N)-末端。在某些实施例中,摄取肽位于N-末端或C-末端。
本文所使用的rAAV的“原种”是指rAAV群体。尽管由于脱酰胺作用,其衣壳蛋白具有异质性,但是rAAV在原种中被预期与5共享相同的载体基因组。原种可以包括具有衣壳的rAAV,该衣壳具有例如所选AAV衣壳蛋白和所选生产***的异质脱酰胺模式特征。原种可以由单一生产***生产或由生产***的多次运行汇集。可以选择各种生产***,包括但不限于本文所描述的那些。
除非本说明书中另有定义,否则本文所使用的技术术语和科学术语具有与本发明所属领域的普通技术人员和参照公开文本所通常理解的相同含义,这为本领域的技术人员提供了本申请中使用的许多术语的通用指南。
如本文所使用的,“疾病”、“病症”和“病状”可互换地用于指示受试者的异常状态。在一个实施例中,该疾病是安格尔曼综合征(AS)。
如本文所用,“患者”或“受试者”可互换地指雄性或雌性哺乳动物,包括人、兽医或农场动物、家畜或宠物以及通常用于研究的动物。在一个实施例中,这些方法和组合物的受试者是人患者。在一个实施例中,这些方法和组合物的受试者是男性或女性人。
如贯穿本说明书和权利要求书所使用的,术语“包含”、“含有”、“包括”及其变体包括其他组件、元素、整数、步骤等。相反地,术语“由……组成(consisting)”及其变体不包括其他组件、元件、整数、步骤等。
应当注意,术语“一个/一种(a/an)”是指一个或多个/一种或多种,例如,“一个神经元”应被理解为表示一个或多个神经元。如此,术语“一个”(或“一种”)、“一个或多个/一种或多种”和“至少一个/种”在本文中可互换地使用。
如本文所用,除非另有说明,否则术语“约”意指相对于给定参考的正或负10%的变化性。
在某些情况下,术语“E+#”用于指代指数。例如,5E10是5x1010。这些术语可以互换地使用。
可使用常规分子生物学技术克隆本文所述的核酸序列,或通过DNA合成从头产生。本文所述的UBE3A基因的核酸编码方面被组装并置于任何合适的遗传元件中,该遗传元件例如裸DNA、噬菌体、转座子、粘粒、附加体等,该遗传元件将其中携带序列转移到宿主细胞,例如用于产生非病毒递送***(例如,基于RNA的***、裸DNA等)或用于在包装宿主细胞中产生病毒载体和/或用于递送到受试者的宿主细胞。在一个实施例中,遗传元件是载体。在一个实施例中,所述遗传元件是质粒。用于制备此类经工程化的构建体的方法对核酸操纵技术人员而言是已知的并且包含基因工程、重组工程以及合成技术。参见例如,Green和Sambrook,《分子克隆:实验室手册(Molecular Cloning:ALaboratory Manual)》,纽约市冷泉港的冷泉港实验室出版社(Cold Spring Harbor Press,Cold Spring Harbor,NY)(2012)。
表达盒
如本文所使用的,“表达盒”是指包括生物学上有用的核酸序列(例如,编码蛋白质、酶或其它有用的基因产物的基因cDNA、mRNA等)和与其可操作连接的调控序列的核酸分子,所述调控序列引导或调节核酸序列和其基因产物的转录、翻译和/或表达。如本文所使用的,“可操作地连接的”序列包含与核酸序列邻接或不邻接的调控序列和以反式或顺式核酸序列作用的调控序列两者。此类调控序列通常包含例如启动子、增强子、内含子、Kozak序列、聚腺苷酸化序列和TATA信号中的一者或多者。表达盒可以含有基因序列上游(5'处)的调控序列,例如启动子、增强子、内含子等中的一者或多者以及增强子,或基因序列下游(3'处)的调控序列中的一者或多者,例如包括聚腺苷酸化位点的3'非翻译区(3'UTR),以及其它元件。在某些实施例中,调控序列与基因产物的核酸序列可操作地连接,其中调控序列通过***的核酸序列,即5'非翻译区(5'UTR)与基因产物的核酸序列分离。在某些实施例中,表达盒包括一种或多种基因产物的核酸序列。在一些实施例中,表达盒可以是单顺反子表达盒或双顺反子表达盒。在其它实施例中,术语“转基因”是指来自***到靶细胞中的外源的一个或多个DNA序列。通常,可以用于产生病毒载体的此类表达盒含有本文所描述的基因产物的编码序列,所述编码序列侧接病毒基因组的包装信号和其它表达控制序列,如本文描述的序列。在某些实施例中,载体基因组可以含有两个或更多个表达盒。
在一些实施例中,包括编码序列的核酸分子是UBE3A编码序列,并且进一步包括启动子,还可以包括用于其的其他调控序列。在某些实施例中,用于产生病毒载体(例如,病毒颗粒)的表达盒含有本文所述的UBE3A的编码序列,该编码序列侧接病毒基因组的包装信号和其它表达控制序列,如本文描述的序列。在一些实施例中,病毒载体是AAV病毒载体,其中包装信号是5'AAV反向末端重复序列(ITR)和3'AAV ITR。任选地,表达盒(和载体基因组)可以在UTR包括一个或多个背根神经节(drg)-miRNA靶序列,例如以减少drg毒性和/或轴突病变。参见例如,于2019年12月20日提交的PCT/US2019/67872,并且现已公布为WO 2020/132455、于2020年5月12日提交的美国临时专利申请第63/023593号以及于2020年6月12日提交的美国临时专利申请第63/038488号,所有文献的标题均为“用于Drg特异性减少转基因表达的组合物(Compositions for Drg-Specific Reduction of TransgeneExpression)”,所述文献以其整体并入本文。
如本文所使用的,术语“可操作地连接”或“操作性地关联”是指与所关注的基因邻接的表达控制序列或调控元件以及以反式或在远处起作用以控制所关注的基因的表达控制序列两者。
如本文所述的,调控元件包括但不限于:启动子;增强子;转录因子;转录终止子;有效的RNA加工信号,如剪接和聚腺苷酸化信号(polyA);稳定胞质mRNA的序列,例如土拨鼠肝炎病毒(WHP)转录后调控元件(WPRE);增强翻译效率的序列(即,Kozak共有序列)。
在一个实施例中,表达盒包括调控元件,其指导编码用于递送UBE3A的基因替代***的一个或多个元件的序列的表达。在一个实施例中,调控元件包括一个或多个启动子。在某些实施例中,表达盒包括组成型或可调节启动子。在某些实施例中,启动子是组织特异性的(例如,神经元特异性的)启动子。在某些实施例中,合适的启动子可以包括但不限于延伸因子1α(EF1α)启动子(参见,例如,Kim Dw等人,人延伸因子1α启动子作为多功能和有效表达***的用途(Use of the human elongation factor 1alpha promoter as aversatile and efficient expression system.)《基因(Gene.)》1990年7月16日;91(2):217-23)、突触蛋白1启动子(参见,例如,Kügler S等人,人突触蛋白1启动子根据转导区域在成年大鼠大脑中通过腺病毒载体提供高度神经元特异性的长期转基因表达(Humansynapsin 1gene promoter confers highly neuron-specific long-term transgeneexpression from an adenoviral vector in the adult rat brain depending on thetransduced area.)基因疗法》2003年2月;10(4):337-47)、缩短的突触蛋白启动子,诸如本文实施例中所提供的(参见,例如,用于编码序列的SEQ ID NO:12)、神经元特异性烯醇化酶(NSE)启动子(参见,例如,Kim J等人,***癌细胞的白细胞介素-6诱导的神经内分泌分化中的富含胆固醇的脂筏的参与(Involvement of cholesterol-rich lipid rafts ininterleukin-6-induced neuroendocrine differentiation of LNCaP prostate cancercells.)Endocrinology.2004年2月;145(2):613-9.电子版2003年10月16日)或CB6启动子(参见,例如,携带运动神经元存活基因的腺相关病毒载体血清型-9的大规模生产(Large-Scale Production of Adeno-Associated Viral Vector Serotype-9Carrying theHuman Survival Motor Neuron Gene,Mol Biotechnol.)2016年1月;58(1):30-6.doi:10.1007/s12033-015-9899-5)。其他合适的启动子包括CAG启动子,其包含(C)巨细胞病毒(CMV)早期增强子元件,(A)启动子,鸡β-肌动蛋白基因的第一外显子和第一内含子,以及(G)兔β-珠蛋白基因的剪接受体。参见,例如,Alexopoulou、Annika N.等人.BMC细胞生物学9.1(2008):2。尽管不太理想,可以在本文所述的载体中使用其他启动子,如病毒启动子、组成型启动子、诱导型启动子、可调控启动子(参见例如WO 2011/126808和WO 2013/04943)或对生理学线索有应答的启动子。在某些实施例中,表达盒包括U6启动子。在另一个实施例中,调控元件包括增强子。在进一步的实施例中,增强子选自以下中的一种或多种:APB增强子、ABPS增强子、αmic/bik增强子、TTR增强子、en34增强子、ApoE增强子、CMV增强子或RSV增强子。在又一个实施例中,调控元件包括内含子。在进一步的实施例中,内含子选自CBA、人β珠蛋白、IVS2、SV40、bGH、α-球蛋白、β-球蛋白、胶原蛋白、卵清蛋白或p53。在一个实施例中,调控元件包括polyA。在进一步的实施例中,polyA是合成的polyA或来自牛生长激素(bGH)、人生长激素(hGH)、如本文实施例中提供的SV40(参见,例如,用于编码序列的SEQ ID NO:13)、兔β-珠蛋白(RGB)或修饰的RGB(mRGB)。在另一个实施例中,调控元件可以包括WPRE序列。在又一个实施例中,调控元件包括Kozak序列。
在某些实施例中,表达盒包括SEQ ID NO:22的核酸序列或与其至少约90%相同的序列,其编码包括SEQ ID NO:2的氨基酸序列的UBE3A。在某些实施例中,表达盒包括SEQ IDNO:23的核酸序列或与其至少约90%相同的序列,其编码包括SEQ ID NO:4的氨基酸序列的UBE3A。在某些实施例中,表达盒包括SEQ ID NO:24的核酸序列或与其至少约90%相同的序列,其编码包括SEQ ID NO:6的氨基酸序列的UBE3A。在某些实施例中,表达盒包括SEQ IDNO:25的核酸序列或与其至少约90%相同的序列,其编码包括SEQ ID NO:8的氨基酸序列的UBE3A。
术语“表达”在本文中以其最广泛的含义使用,并且包括RNA、蛋白质或RNA和蛋白质两者的产生。关于RNA,术语“表达”或“翻译”尤其涉及肽或蛋白质的产生。表达可以是暂时的或可以是稳定的。
表达盒可以通过任何合适的递送***递送。合适的非病毒递送***是本领域已知的(参见,例如,Ramamoorth和Narvekar.J Clin Diagn Res.2015年1月;9(1):GE01-GE06,其通过引用并入本文)并且可以由本领域技术人员容易地选择并且可以包括例如裸DNA、裸RNA、树状聚合物、PLGA、聚甲基丙烯酸酯、无机颗粒,脂质颗粒(例如,脂质纳米颗粒或LNP)或基于壳聚糖的调配物。
在一个实施例中,载体是非病毒质粒,该非病毒质粒包括其描述的表达盒,例如,“裸DNA”、“裸质粒DNA”、RNA和mRNA;与各种组合物和纳米颗粒偶联,包含例如胶束、脂质体、阳离子脂质-核酸组合物、多聚糖组合物和其他聚合物、基于脂质和/或胆固醇的核酸缀合物以及如本文所描述的其他构建体。参见,例如,X.Su等人,《分子制药学(Mol.Pharmaceutics)》,2011,8(3),第774-787页;网络出版物:2011年3月21日;WO2013/182683、WO 2010/053572和WO 2012/170930,所有所述文献都通过引用并入本文。
本文提供包括编码基因替代***的一个或多个元件的核酸序列的组合物及其用于替代功能性UBE3A的使用方法。
任选地,表达盒可以在非翻译区中包括miRNA靶序列。miRNA靶序列被设计为被存在于细胞中的miRNA特异性地识别,在这些细胞中不期望有转基因表达和/或期望降低转基因表达的水平。在某些实施例中,miRNA靶序列位于3'UTR、5'UTR和/或3'和5'UTR两者中。在一些实施例中,miRNA靶序列可操作地连接到表达盒中的调控序列。在某些实施例中,表达盒包括DRG特异性miRNA靶序列的至少两个串联重复序列,其中所述至少两个串联重复序列包括可以相同或不同的至少一个第一miRNA靶序列和至少一个第二miRNA靶序列。在某些实施例中,串联miRNA靶序列是连续的或由1到10个核酸的间隔子隔开,其中所述间隔子不是miRNA靶序列。
在某些实施例中,载体基因组或表达盒含有作为miR-183(或miRNA183)靶序列的至少一个miRNA靶序列。在某些实施例中,载体基因组或表达盒含有miR-183靶序列,其包括AGTGAATTCTACCAGTGCCATA(SEQ ID NO:11),其中与miR-183种子序列互补的序列带有下划线。在某些实施例中,载体基因组或表达盒含有与miR-183种子序列100%互补的序列的多于一个拷贝(例如,两个或三个拷贝)。在某些实施例中,miR-183靶序列的长度为约7个核苷酸到约28个核苷酸并且包括与miR-183种子序列至少100%互补的至少一个区。在某些实施例中,miR-183靶序列含有与SEQ ID NO:11部分互补的序列,且因此当与SEQ ID NO:11比对时,存在一个或多个错配。在某些实施例中,当与SEQ ID NO:11比对时,miR-183靶序列包含具有至少1、2、3、4、5、6、7、8、9或10个错配的序列,其中错配可以是不连续的。在某些实施例中,miR-183靶序列包括具有100%互补性的区,该区还包含miR-183靶序列的长度的至少30%。在某些实施例中,具有100%互补性的区域包括与miR-183种子序列具有100%互补性的序列。在某些实施例中,miR-183靶序列的其余部分与miR-183具有至少约80%至约99%的互补性。在某些实施例中,表达盒或载体基因组包括miR-183靶序列,该靶序列包含截短的SEQ ID NO:11,即在SEQ ID NO:11的5'端或3'端中的任一端或两端处缺乏至少1、2、3、4、5、6、7、8、9或10个核苷酸的序列。在某些实施例中,表达盒或载体基因组包含转基因和一个miR-183靶序列。在又其他实施例中,表达盒或载体基因组包含至少两个、三个或四个miR-183靶序列。
在某些实施例中,载体基因组或表达盒含有作为miR-182靶序列的至少一个miRNA靶序列。在某些实施例中,载体基因组或表达盒含有miR-182靶序列,其包括AGTGTGAGTTCTACCATTGCCAAA (SEQ ID NO:20)。在某些实施例中,载体基因组或表达盒含有与miR-182种子序列100%互补的序列的多于一个拷贝(例如,两个或三个拷贝)。在某些实施例中,miR-182靶序列的长度为约7个核苷酸到约28个核苷酸并且包括与miR-182种子序列至少100%互补的至少一个区。在某些实施例中,miR-182靶序列含有与SEQ ID NO:20部分互补的序列,且因此当与SEQ ID NO:20比对时,存在一个或多个错配。在某些实施例中,当与SEQ ID NO:20比对时,miR-183靶序列包含具有至少1、2、3、4、5、6、7、8、9或10个错配的序列,其中错配可以是不连续的。在某些实施例中,miR-182靶序列包括具有100%互补性的区,该区还包含miR-182靶序列的长度的至少30%。在某些实施例中,具有100%互补性的区域包括与miR-182种子序列具有100%互补性的序列。在某些实施例中,miR-182靶序列的其余部分与miR-182具有至少约80%至约99%的互补性。在某些实施例中,表达盒或载体基因组包括miR-182靶序列,该靶序列包含截短的SEQ ID NO:20,即在SEQ ID NO:20的5'端或3'端中的任一端或两端处缺乏至少1、2、3、4、5、6、7、8、9或10个核苷酸的序列。在某些实施例中,表达盒或载体基因组包含转基因和一个miR-182靶序列。在又其他实施例中,表达盒或载体基因组包含至少两个、三个或四个miR-182靶序列。
本文所使用的术语“串联重复序列”是指存在两个或更多个连续miRNA靶序列。这些miRNA靶序列可以是连续的,即一个接一个地直接定位,使得一个靶序列的3'端直接位于下一个靶序列的5'端的上游,没有中间序列,或者反之亦然。在另一个实施例中,miRNA靶序列中的两个或更多个miRNA靶序列由短间隔序列隔开。如本文所用,“间隔子”是任何所选核酸序列,例如,长度为1个、2个、3个、4个、5个、6个、7个、8个、9个或10个核苷酸的定位在两个或更多个连续miRNA靶序列之间的核酸序列。在某些实施例中,间隔子的长度为1个到8个核苷酸、长度为2个到7个核苷酸、长度为3个到6个核苷酸、长度为四个核苷酸、4个到9个核苷酸、3个到7个核苷酸或更大的值。合适地,间隔子是非编码序列。在某些实施例中,间隔子可以具有四(4)个核苷酸。在某些实施例中,间隔子是GGAT。在某些实施例中,间隔子是六(6)个核苷酸。在某些实施例中,间隔子是CACGTG或GCATGC。
在某些实施例中,串联重复序列含有相同miRNA靶序列中的两个、三个、四个或更多个。在某些实施例中,串联重复含有至少两个不同的miRNA靶序列、至少三个不同的miRNA靶序列或至少四个不同的miRNA靶序列等。在某些实施例中,串联重复可以含有两个或三个相同的miRNA靶序列与第四个miRNA靶序列不同。在某些实施例中,表达盒中可存在至少两组不同的串联重复序列。例如,3'UTR可含有紧接在转基因下游的串联重复序列、UTR序列和两个或更多个更接近UTR的3'端的串联重复序列。在另一实例中,5'UTR可含有一个、两个或更多个miRNA靶序列。在另一实例中,3'可含有串联重复序列,并且5'UTR可含有至少一个miRNA靶序列。在某些实施例中,表达盒含有两个、三个、四个或更多个串联重复序列,所述串联重复序列在转基因的终止密码子的约0个至20个核苷酸内开始。在其它实施例中,表达盒含有距转基因的终止密码子至少100个至约4000个核苷酸的miRNA串联重复序列。
参见2019年12月20日提交的PCT/US19/67872,并且现已公布为WO 2020/132455,其以引用的方式并入本文中并且要求2018年12月21日申请的美国临时专利申请第62/783,956号的优先权,所述临时申请以引用的方式并入本文。还参见2020年5月12日提交的美国专利申请第63/023,593号、2020年6月12日提交的美国专利申请第63/038,488号、2020年6月24日提交的美国专利申请第63/043,562号、2020年9月16日提交的专利申请第63/079,299号和2021年2月22日提交的美国临时专利申请第63/152,042号,和国际专利申请第PCT/US21/32003号,所有这些都通过引用并入本文。
任选地,表达盒可以包括编码UBE3A蛋白的UBE3A编码序列,UBE3A蛋白是包括信号肽和/或摄取肽的融合蛋白,如本文所述。在某些实施例中,信号肽和/或摄取肽位于UBE3A编码序列的5'或3'。
包括工程化的hUBE3A-同种型1编码序列的载体基因组在本文中提供,例如,在SEQID NO:1(hSyn.hUbe3a-1.GSco.4XmiRNA183.SV40(具有miR183靶序列))和SEQ ID NO:3(hSyn.hUbe3a-1.GSco.SV40,无miR))中。
包括工程化的hUBE3A-同种型2编码序列的载体基因组在本文中举例说明,例如,在SEQ ID NO:5(hSyn.hUbe3a-2.GSco.4XmiRNA183.SV40(具有miR183靶序列))和SEQ IDNO:7(hSyn.hUbe3a-2.GSco.SV40,无miR))中。
应当理解,本文所描述的表达盒中的组合物旨在应用于本说明书中描述的组合物和方法。
载体
在某些实施例中,编码UBE3A的表达盒通过载体或病毒载体递送给神经元,其中许多是本领域已知和可用的。在一个实施例中,提供了包括如本文所述的UBE3A基因的载体。在一个实施例中,提供了包括如本文所述的表达盒的载体。在一个实施例中,载体是非病毒载体。在进一步的实施例中,非病毒载体是质粒。在另一个实施例中,载体是病毒载体。病毒载体包括任何适用于基因治疗的病毒,包括但不限于:博卡病毒、腺病毒、腺相关病毒(AAV)、疱疹病毒、慢病毒、逆转录病毒或细小病毒。然而,为了便于理解,本文将腺相关病毒称为示例性病毒载体。因此,在一个实施例中,提供了一种腺相关病毒载体,其包括可操作地连接到其调控元件的表达盒的一个或多个元件的核酸序列。
如本文所使用的,“载体”是包括核酸序列的生物或化学部分,该生物或化学部分可以被引入到合适的靶细胞中以复制或表达核酸序列。载体的实例包括但不限于重组病毒、质粒、脂质体、聚合物体、复合物、树状聚合物、细胞穿透肽(CPP)缀合物、磁性颗粒或纳米颗粒。在一个实施例中,载体是具有编码功能性基因产物的外源性或异源性或工程化核酸的核酸分子,然后可以将核酸分子引入到适当的靶细胞中。此类载体优选地具有一个或多个复制起点以及重组DNA可以***到的一个或多个位点。载体通常具有装置,通过所述装置,可以从没有载体的细胞中选择具有载体的细胞,例如,所述载体编码耐药基因。常见的载体包括质粒、病毒基因组和“人工染色体”。载体的产生、生产、表征或定量的常规方法对于本领域技术人员是可用的。
如本文所用,重组病毒载体是靶向所需细胞的任何合适的病毒载体。因此,本文所述的重组病毒载体优选靶向一种或多种受安格尔曼综合征影响的细胞和组织,包括中枢神经***(例如,脑)的细胞。这些实例提供了说明性重组腺相关病毒(rAAV)。然而,其他合适的病毒载体可包括例如重组腺病毒、重组细小病毒如重组博卡病毒、杂交AAV/博卡病毒、重组单纯疱疹病毒、重组逆转录病毒或重组慢病毒。在优选的实施例中,这些重组病毒是复制缺陷型的。
“复制缺陷型病毒”或“病毒载体”是指其中含有所关注的基因的表达盒包装在病毒衣壳或包膜中的合成或人工病毒颗粒,其中也包装在病毒衣壳或包膜内的任何病毒基因组序列均是复制缺陷型的;即,其不能产生子代病毒粒子,但保留了感染靶细胞的能力。在一个实施例中,病毒载体的基因组不包含对复制所需的酶进行编码的基因(基因组可以被工程化成“无肠的(gutless)”-仅含有所关注的基因,其侧接扩增和包装人工基因组所需的信号),但是这些基因可以在产生期间供应。因此,这被认为可以安全地用于基因疗法,因为除非存在复制所需的病毒酶,否则不会发生通过子代病毒粒子进行的复制和感染。此类复制缺陷型病毒可以是腺相关病毒(AAV)、腺病毒、慢病毒(整合或非整合)或另外合适的病毒来源。
“质粒”或“质粒载体”在本文中通常由在载体名称之前和/或之后的小写字母p指定。可根据本发明使用的质粒、其他克隆和表达载体、其特性及其构建/操作方法对于本领域技术人员而言是显而易见的。在一个实施例中,如本文所述的载体基因组的元件或如本文所述的表达盒被工程化为合适的遗传元件(载体),用于产生病毒载体和/或递送给宿主细胞,例如裸DNA、噬菌体、转座子、粘粒、附加体等,转移其上携带的序列。所选载体可以通过任何合适的方法,包含转染、电穿孔、脂质体递送、膜融合技术、高速DNA包被的团粒、病毒感染和原生质体融合递送。用于制备此类构建体的方法对核酸操纵技术人员而言是已知的并且包含基因工程、重组工程以及合成技术。参见,例如,Sambrook等人,《分子克隆实验指南(Molecular Cloning:ALaboratory Manual)》,Cold Spring Harbor Press,ColdSpring Harbor,NY。
本文可互换使用的术语“转基因”或“所关注的基因”是指在本说明书所述的表达盒、rAAV基因组、重组质粒或生产质粒、载体或宿主细胞中的启动子和/或其他调控元件控制下的外源或工程化的编码蛋白质的核酸序列。
用于描述核酸序列或蛋白质的术语“异源的”是指该核酸或蛋白质来源于与其表达的宿主细胞或受试者不同的生物体或同一生物体的不同物种。术语“异源的”当用于指质粒、表达盒或载体中的蛋白质或核酸时,指示该蛋白质或核酸与另一序列或亚序列一起存在,该另一序列或亚序列与所讨论的蛋白质或核酸在自然界中彼此没有相同的关系。
如本文所用,术语“宿主细胞”可以指其中载体(例如,重组AAV)由生产质粒产生的包装细胞系。在替代方案中,术语“宿主细胞”可以指其中需要本文所述的基因产物表达的任何靶细胞。因此,“宿主细胞”是指原核或真核细胞(例如,人细胞或昆虫细胞),该原核或真核细胞含有通过任何方式(例如,电穿孔、磷酸钙沉淀、显微注射、转化、病毒感染、转染、脂质体递送、膜融合技术、高速DNA包被的团粒、病毒感染和原生质体融合)引入到细胞中的外源性或异源性DNA。在本文中的某些实施例中,术语“宿主细胞”是指用于体外评估本文所述的组合物的各种哺乳动物物种的细胞的培养物。在本文的其他实施例中,术语“宿主细胞”是指用于产生和包装病毒载体或重组病毒的细胞。在进一步的实施例中,术语“宿主细胞”是神经元,例如,CNS的神经元。
如本文所用,术语“靶细胞”是指其中期望异源核酸序列或蛋白质的表达的任何靶细胞。在某些实施例中,靶细胞是CNS的神经元,特别是具有突变或缺陷型母体UBE3A等位基因的神经元或缺乏UBE3A表达的神经元。
如本文所使用的,“载体基因组”是指包装在形成病毒颗粒的细小病毒(例如,rAAV)衣壳内部的核酸序列。此类核酸序列含有AAV反向末端重复序列(ITR)。在本文的实例中,载体基因组至少含有5'至3'、AAV 5'ITR、编码序列和AAV 3'ITR。可以选择来自AAV2(与所述衣壳来源不同的AAV)或除非全长ITR之外的ITR。在某些实施例中,ITR来自与在产生或反式补充AAV期间提供rep功能的AAV来源相同的AAV。进一步地,可以使用其它ITR,例如,自互补(scAAV)ITR。进一步地,载体基因组含有引导基因产物表达的调控序列。本文更详细地讨论了载体基因组的合适组分。在一个实例中,“载体基因组”至少含有从5'至3'的载体特异性序列、编码UBE3A的核酸序列,所述核酸序列与调控控制序列(指导其在靶细胞中表达)可操作地连接,其中载体特异性序列可以是特异性地将载体基因组包装到病毒载体衣壳或包膜蛋白中的末端重复序列。例如,AAV反向末端重复序列用于包装到AAV和某些其它细小病毒衣壳中。当期望包装到慢病毒载体中时,可以利用慢病毒长末端重复序列。类似地,可以选择其他末端重复序列(例如,逆转录病毒长末端重复序列)等。
本文提供的编码UBE3A同种型1的载体基因组包括,例如,SEQ ID NO:1(AAV2-5'ITR-hSyn.hUbe3a-1.GSco.4XmiRNA183.SV40–AAV2-3'ITR)、SEQ ID NO:3(AAV2–5'ITR-hSyn.hUbe3a-1.GSco.SV40-AAV2–3'ITR)。
如本文所使用的,术语“AAV”是指天然存在的腺相关病毒、本领域技术人员可获得的和/或根据本文所描述的组合物和方法可获得的腺相关病毒以及人工AAV。腺相关病毒(AAV)病毒载体是具有AAV蛋白衣壳的AAV核酸酶(例如,DNase)抗性颗粒,其中包装了侧翼为AAV反向末端重复序列(ITR)的表达盒,用于递送至靶细胞。抗核酸酶重组AAV(rAAV)指示AAV衣壳已经完全组装并保护这些包装的载体基因组序列在被设计成去除产生过程中可能存在的污染性核酸的核酸酶温育步骤期间免于降解(消化)。在许多情况下,本文所描述的rAAV是DNase抗性的。
在下文的实例中,进化枝F腺相关病毒是AAVhu68。参见WO 2018/160582,其通过引用整体并入本文。在其他实施例中,另一个AAV衣壳选自不同的进化枝,例如进化枝A、B、C、D或E,或选自任何这些进化枝之外的AAV来源。例如,另一种合适的衣壳是AAVrh91。参见2020年11月5日公布的WO 2020/223231、2020年8月14日提交的美国专利申请第63/065,616号和2020年11月4日提交的美国专利申请第63/109,734号、国际专利申请第PCT/US21/55436号,其通过引用并入本文。在某些实施例中,可以选择具有减少的衣壳脱酰胺作用的AAV衣壳。参见,例如,PCT/US19/19804和PCT/US18/19861,两者均于2019年2月27日提交并通过引用整体并入本文。还参见2020年4月29日提交的PCT/US20/030266,现已公布为WO2020/223231,以及2021年8月13日提交的国际申请第PCT/US21/45945号,其通过引用并入本文。
在其他实施例中,AAV衣壳的来源可以是数十种天然存在和可获得的腺相关病毒中的任何一种,以及工程化或人工AAV。AAV衣壳由60个衣壳(cap)蛋白亚基、VP1、VP2和VP3组成,它们以二十面体对称排列,比例大约为1:1:10至1:1:20,这取决于所选的AAV。可以选择各种AAV作为上述AAV病毒载体衣壳的来源。参见,例如,美国公开专利申请第2007-0036760-A1号;美国公开专利申请第2009-0197338-A1号;EP 1310571。还参见WO 2003/042397(AAV7和其它猿猴类AAV)、美国专利7790449和美国专利7282199(AAV8)、WO 2005/033321和US 7,906,111(AAV9)以及WO 2006/110689和WO 2003/042397(AAVrh10)。这些文档还描述了可以选择用于产生AAV的其它AAV,并且通过引用并入。在从人类或非人灵长类(NHP)分离或工程化并且充分表征的AAV中,人类AAV2是作为基因转移载体开发的第一AAV;它已广泛用于不同靶组织和动物模型中的有效基因转移实验。除非另外规定,否则本文所述的AAV衣壳、ITR和其他所选AAV组分可以容易地选自任何AAV,包括但不限于通常确定为AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV8bp、AAV7M8和AAVAnc80的AAV。参见,例如,WO 2005/033321,其通过引用并入本文。在一个实施例中,AAV衣壳是AAV9衣壳或其变体。在某些实施例中,衣壳蛋白由rAAV载体名称中术语“AAV”后的数字或数字和字母的组合指定。还参见PCT/US19/19804和PCT/US19/19861,各自的标题为“具有减少的衣壳脱酰胺作用的新型腺相关病毒(AAV)——AAV载体及其用途(Novel Adeno-Associated Virus(AAV)Vectors,AAV Vectors Having Reduced Capsid Deamidation And UsesTherefor)”,并且于2019年2月27日提交,其全部内容通过引用整体并入本文。
ITR或其它AAV组分可以使用本领域技术人员可用的技术从AAV中容易地分离出来或进行工程化。此类AAV可以从学术、商业或公共来源分离、工程化或获得(例如,维吉尼亚州马纳萨斯的美国典型培养物保藏中心(American Type Culture Collection,Manassas,VA))。可替代地,AAV序列可以通过合成或其他适合的方式通过参考公开的序列(如在文献中或在如GenBank、PubMed等数据库中可获得的公开的序列)进行工程化。AAV病毒可以通过常规的分子生物学技术进行工程化,从而可以优化这些颗粒以用于核酸序列的细胞特异性递送、用于最小化免疫原性、用于调节稳定性和颗粒寿命、用于高效降解、用于准确递送至细胞核等。
如本文所用,可互换使用的术语“rAAV”和“重组AAV载体”意指但不限于包括衣壳蛋白和包装在其中的载体基因组的AAV,其中载体基因组包括与AAV异源的核酸。rAAV包括“假型rAAV”,其中病毒载体含有载体基因组,该基因组含有一个AAV(例如,AAV2)的反向末端重复序列,该AAV被包装到不同AAV衣壳蛋白的衣壳中。在一个实施例中,衣壳蛋白是非天然存在的衣壳。此类人工衣壳可以通过任何合适的技术使用所选AAV序列(例如,vp1衣壳蛋白的片段)与异源序列的组合产生,所述异源序列可以从不同的所选AAV、同一AAV的非连续部分、从非AAV病毒来源或从非病毒来源获得。所选基因元件可以通过任何合适的方法,包含转染、电穿孔、脂质体递送、膜融合技术、高速DNA包被的团粒、病毒感染和原生质体融合递送。用于制备此类构建体的方法对核酸操纵技术人员而言是已知的并且包含基因工程、重组工程以及合成技术。参见例如,Green和Sambrook,《分子克隆:实验室手册(MolecularCloning:ALaboratory Manual)》,纽约市冷泉港的冷泉港实验室出版社(Cold SpringHarbor Press,Cold Spring Harbor,NY)(2012)。
如本文所使用的,当用于指vp衣壳蛋白时,术语“异质”或其任何语法变型是指由不相同的元件组成的群体,例如具有带有不同的经修饰的氨基酸序列的vp1、vp2或vp3单体(蛋白质)。SEQ ID NO:15提供了AAVhu68 vp1蛋白的经编码的氨基酸序列。与vp1、vp2和vp3蛋白(可替代地被称为同种型)结合使用的术语“异质”是指衣壳内的vp1、vp2和vp3蛋白的氨基酸序列中的差异。AAV衣壳含有具有来自预测的氨基酸残基的修饰的vp1蛋白内、vp2蛋白内和vp3蛋白内的亚群。这些亚群体至少包含某些脱酰胺化的天冬酰胺(N或Asn)残基。例如,某些亚群包含天冬酰胺-甘氨酸对中的至少一个、两个、三个或四个高度脱酰胺的天冬酰胺(N)位置,并且任选地进一步包含其它脱酰胺的氨基酸,其中脱酰胺引起氨基酸变化和其它任选的修饰。
如本文所使用的,除非另有说明,否则vp蛋白的“亚群体”是指一组vp蛋白,该一组vp蛋白具有至少一个限定的共同特性,并且由至少一个组成员到少于参考组的所有成员组成。例如,除非另有说明,否则vp1蛋白的“亚群体”是至少一种(1)vp1蛋白,并且少于组装的AAV衣壳中的所有vp1蛋白。除非另有说明,否则vp3蛋白的“亚群体”可以是少于组装的AAV衣壳中的所有vp3蛋白的一种(1)vp3蛋白。例如,vp1蛋白可以是vp蛋白的亚群体;vp2蛋白可以是vp蛋白的单独的亚群体,并且vp3是组装的AAV衣壳中的vp蛋白的又另外的亚群体。在另一个实例中,vp1、vp2和vp3蛋白可以含有具有不同修饰的亚群体,例如,至少一种、两种、三种或四种高度脱酰胺化的天冬酰胺,例如在天冬酰胺-甘氨酸对处。
在一个方面,本文提供包括AAV衣壳和表达盒的AAV载体,其中表达盒包括编码UBE3A基因的一个或多个元件的核酸序列和指导宿主细胞中UBE3A基因元件表达的调控元件。AAV载体还包括AAV ITR序列。
ITR是在载体生产期间负责基因组复制和包装的基因元件,并且是产生rAAV所需的唯一病毒顺式元件。在一个实施例中,ITR来自与供应衣壳的AAV不同的AAV。在优选的实施例中,来自AAV2的ITR序列或其缺失版本(ΔITR)可以为了方便而使用和加速调控批准。然而,可以选择来自其它AAV来源的ITR。在ITR的来源来自AAV2并且AAV衣壳来自另一个AAV来源的情况下,所得载体可以被称为假型的。通常,AAV载体基因组包括AAV 5'ITR,编码基因产物的核酸序列和任何调控序列以及AAV 3'ITR。然而,这些元件的其它构型可以是合适的。在一个实施例中,提供了自互补AAV。已经描述了被称为ΔITR的5'ITR的缩短版本,其中缺失了D序列和末端解析位点(trs)。在某些实施例中,载体基因组包含130个碱基对的缩短的AAV2 ITR,其中外部“a”元件被删除。在使用内部A元件作为模板的载体DNA扩增期间,缩短的ITR回复到145个碱基对的野生型长度。在其它实施例中,使用了全长AAV 5'和3'ITR。
在一个实施例中,选择调控序列使得总rAAV载体基因组的大小为约2.0至约5.5千碱基。在一个实施例中,选择调控序列使得总rAAV载体基因组的大小为约2.9至约5.5千碱基。在一个实施例中,选择调控序列使得总rAAV载体基因组的大小为约2.9kb。在一个实施例中,理想的是rAAV载体基因组接近天然AAV基因组的大小。因此,在一个实施例中,选择调控序列使得总rAAV载体基因组的大小为约4.7kb。在另一个实施例中,总rAAV载体基因组的大小小于约5.2kb。载体基因组的大小可以基于包括启动子、增强子、内含子、poly A等的调控序列的大小进行操作。参见Wu等人,Mol Ther,2010年1月,18(1):80-6,其通过引用并入本文。
在某些实施例中,本文提供了用作用于治疗患有安格尔曼综合征(AS)的受试者的CNS导向疗法的rAAV,其中rAAV包括AAV衣壳和包装在其中的载体基因组,所述载体基因组包括:(a)AAV 5'反向末端重复序列(ITR);(b)编码可操作地连接到指导其在宿主细胞中表达的调控元件的UBE3A的序列;(c)指导表达的调控元件;以及(d)AAV 3'ITR。在某些实施例中,本文提供了用作用于治疗患有安格尔曼综合征(AS)的受试者的CNS导向疗法的rAAV,其中rAAV包括AAV衣壳和包装在其中的载体基因组,所述载体基因组包括:(a)AAV 5'反向末端重复序列(ITR);(b)编码可操作地连接到指导其在宿主细胞中表达的调控元件的UBE3A的序列;(c)任选地一种或多种肽(例如,信号肽和/或摄取肽);(d)指导表达的调控元件;以及(e)AAV 3'ITR。在一个实施例中,rAAV对CNS细胞具有趋向性(例如,带有AAVhu68衣壳或AAVrh91衣壳的rAAV),和/或含有神经元特异性表达控制元件(例如,突触蛋白启动子)。在一个方面,提供了一种构建体,它是可用于产生病毒载体的载体(例如,质粒)。在一个实施例中,AAV 5'ITR是AAV2 ITR,AAV 3'ITR是AAV2 ITR。在一个实施例中,rAAV包括如本文所述的AAV衣壳。在一个实施例中,rAAV包括AAVhu68衣壳。在其他实施例中,rAAV包括AAVrh91衣壳。SEQ ID NO:18提供了AAVrh91 vp1蛋白的经编码的氨基酸序列。
可以使用已知的技术产生本文所描述的重组腺相关病毒(AAV)。参见,例如,WO2003/042397;WO 2005/033321;WO 2006/110689;US 7588772 B2。此类方法涉及培养宿主细胞,该宿主细胞含有编码AAV衣壳的核酸序列;功能性rep基因;如本文所描述的侧接AAV反向末端重复序列(ITR)的表达盒;以及足够的辅助功能以允许将表达盒包装到AAV衣壳蛋白中。本文还提供了宿主细胞,该宿主细胞含有编码AAV衣壳的核酸序列;功能性rep基因;如所描述的载体基因组;以及足够的辅助功能以允许将载体基因组包装到AAV衣壳蛋白中。在一个实施例中,宿主细胞是HEK 293细胞。在WO2017160360A2中更详细地描述了这些方法,其通过引用并入本文。
可以利用本领域技术人员可用的其他产生rAAV的方法。合适的方法可以包含但不限于杆状病毒表达***或通过酵母生产。参见,例如,Robert M.Kotin,大规模重组腺相关病毒生产(Large-scale recombinant adeno-associated virus production).《人类分子遗传学》2011年4月15日;20(R1):R2-R6。于2011年4月29日在线公开.doi:10.1093/hmg/ddr141;Aucoin MG等人,使用三重感染在昆虫细胞中产生腺相关病毒载体:杆状病毒浓度比率的优化(Production of adeno-associated viral vectors in insect cells usingtriple infection:optimization of baculovirus concentration ratios.)《生物技术与生物工程(Biotechnol Bioeng.)》2006年12月20日;95(6):1081-92;SAMI S.THAKUR,在酵母中产生重组腺相关病毒载体(Production of Recombinant Adeno-associated viralvectors in yeast.)提交给佛罗里达大学研究生院的论文,2012;Kondratov O等人.在人类对昆虫细胞中制造的重组腺相关病毒载体的直接头对头评估(Direct Head-to-HeadEvaluation of Recombinant Adeno-associated Viral Vectors Manufactured inHuman versus Insect Cells),《分子疗法》2017年8月10日.pii:S1525-0016(17)30362-3.doi:10.1016/J.ymthe.2017.08.003.[电子版先于印刷版];Mietzsch M等人,OneBac2.0:用于产生使外源DNA的衣壳化最小化的AAV1、AAV2和AAV8载体的Sf9细胞系(OneBac2.0:Sf9 Cell Lines for Production of AAV1,AAV2,and AAV8 Vectors withMinimal Encapsidation of Foreign DNA.)《人类基因疗法方法(Hum Gene TherMethods.)》2017年2月;28(1):15-22.doi:10.1089/hgtb.2016.164.;李L等人。新型重组腺相关病毒复制型基因组的生产和表征:用于基因转移的真核DNA来源(Production andcharacterization of novel recombinant adeno-associated virus replicative-formgenomes:a eukaryotic source of DNA for gene transfer.)《公共科学图书馆·综合》2013年8月1日;8(8):e69879.doi:10.1371/Journal.pone.0069879.于2013年印刷;Galibert L等人,在昆虫细胞中大规模生产腺相关病毒载体以趋向治疗神经肌肉疾病的最新进展(Latest developments in the large-scale production of adeno-associatedvirus vectors in insect cells toward the treatment of neuromusculardiseases.)《无脊椎病理学杂志(J Invertebr Pathol.)》2011年7月;107增刊:S80-93.doi:10.1016/j.jip.2011.05.008;以及Kotin RM,大规模重组腺相关病毒生产(Large-scale recombinant adeno-associated virus production.)《人类分子遗传学》2011年4月15日;20(R1):R2-6.doi:10.1093/Hmg/ddr141.电子版2011年4月29日。
在高盐浓度下进行两步亲和色谱法纯化,随后使用阴离子交换树脂色谱法来纯化载体药物产物并去除空衣壳。在标题为“用于AAV9的可分级纯化方法(ScalablePurification Method for AAV9)”的WO 2017/160360和标题为“用于AAV1的可分级纯化方法(Scalable Purification Method for AAV1)”的WO 2017/100674中更详细地描述了这些方法,其通过引用并入本文。简而言之,用于从基因组缺陷型AAV中间体中分离具有包装的基因组序列的rAAV颗粒的方法涉及使包括重组AAV9或AAV病毒颗粒和AAV衣壳蛋白中间体的悬浮液经受高效液相色谱法,其中AAV9病毒颗粒和AAV中间体与在rAAV9的约10.2和AAV1的约9.8的pH下平衡的强阴离子交换树脂结合,并经受盐梯度,同时监测洗脱液在约260和约280下的紫外线吸光度。在此方法中,当A260/A280的比率达到拐点时,从洗脱的级分中收集AAV完整衣壳。在一个实例中,对于亲和色谱法步骤,可以将经过渗滤的产物应用于有效捕获所选AAV血清型的AAV特异性树脂上。在这些离子条件下,显著百分比的残留的细胞DNA和蛋白质流过柱,而AAV颗粒则被有效地捕获。
用于表征或定量rAAV的常规方法对于本领域技术人员是可用的。为了计算空颗粒和完整颗粒的含量,将所选样品(例如,在本文的实例中经过碘克沙醇(iodixanol)梯度纯化的制剂,其中GC#=颗粒#)的VP3带体积相对于加载的GC颗粒进行作图。所得线性等式(y=mx+c)用于计算测试制品峰的带状体积中的颗粒的数量。然后将加载的每20μL颗粒数量(pt)乘以50,以得到颗粒(pt)/mL。将Pt/mL除以GC/mL得到颗粒与基因组拷贝的比率(pt/GC)。Pt/mL-GC/mL得到空pt/mL。空pt/mL除以pt/mL并且x100得到空颗粒的百分比。通常,用于测定具有包装的基因组的空衣壳和AAV载体颗粒的方法是本领域已知的。参见例如,Grimm等人,《基因疗法》(1999)6:1322-1330;Sommer等人,《分子疗法(Molec.Ther.)(2003)7:122-128。为了测试变性的衣壳,所述方法包含使经处理的AAV原种经受SDS-聚丙烯酰胺凝胶电泳(由能够分离三种衣壳蛋白的任何凝胶组成,例如在缓冲液中含有3-8%三乙酸盐的梯度凝胶),然后运行凝胶直到分离出样品材料,并且将凝胶印迹到尼龙或硝酸纤维素膜(优选地尼龙)上。然后,将抗AAV衣壳抗体用作与变性的衣壳蛋白结合的初级抗体,优选地抗AAV衣壳单克隆抗体,最优选地B1抗AAV-2单克隆抗体(Wobus等人,《病毒学杂志》(2000)74:9281-9293)。然后使用次级抗体,所述次级抗体与初级抗体结合并且含有一种用于检测与初级抗体的结合的装置,更优选地是含有与其共价结合的检测分子的抗IgG抗体,最优选地是与辣根过氧化物酶共价连接的绵羊抗小鼠IgG抗体。一种用于检测结合的方法用于半定量地确定初级抗体与次级抗体之间的结合,优选地是能够检测放射性同位素发射、电磁辐射或比色变化的检测方法,最优选地是化学发光检测试剂盒。例如,对于SDS-PAGE,可以从柱级分中提取样品并在含有还原剂(例如,DTT)的SDS-PAGE上样缓冲液中加热,并且在预制的梯度聚丙烯酰胺凝胶(例如,Novex)上解析衣壳蛋白。可以根据制造商的说明使用SilverXpress(加利福尼亚州英杰公司(Invitrogen,CA))或其它合适的染色方法(即,SYPRO红宝石色或考马斯染色)进行银染色。在一个实施例中,可以通过定量实时PCR(Q-PCR)测量柱级分中的AAV载体基因组(vg)的浓度。将样品稀释并用DNase I(或另一种合适的核酸酶)消化以去除外源性DNA。在核酸酶失活后,使用引物和对引物之间的DNA序列具有特异性的TaqManTM荧光探针进一步稀释和扩增样品。在Applied Biosystems Prism 7700序列检测***上测量每种样品达到所定义的荧光水平所需的周期的数量(阈值周期,Ct)。含有与AAV载体中所含序列相同的序列的质粒DNA用于在Q-PCR反应中产生标准曲线。从样品获得的周期阈值(Ct)的值用于通过相对于质粒标准曲线的Ct值对其进行归一化来确定载体基因组效价。也可以使用基于数字PCR的端点测定。
在一个方面,使用了经过优化的q-PCR方法,所述方法利用了广谱丝氨酸蛋白酶,例如蛋白酶K(如从凯杰公司(Qiagen)可商购获得)。更具体地,经过优化的qPCR基因组效价测定与标准测定类似,不同之处在于在DNase I消化之后,将样品用蛋白酶K缓冲液稀释并用蛋白酶K处理,然后进行热失活。合适地,以等于样品大小的量用蛋白酶K缓冲液稀释样品。蛋白酶K缓冲液可以浓缩2倍或更多倍。通常,蛋白酶K处理为约0.2mg/mL,但是可以在0.1mg/mL至约1mg/mL之间变化。处理步骤通常在约55℃下进行持续约15分钟,但是可以在较低温度(例如,约37℃到约50℃)下进行持续较长的时间段(例如,约20分钟至约30分钟),或者在较高的温度(例如,最高约60℃)下进行持续较短的时间段(例如,约5至10分钟)。类似地,热失活通常在约95℃下持续约15分钟,但是温度可以降低(例如,约70℃至约90℃)并且时间延长(例如,约20分钟至约30分钟)。然后将样品稀释(例如,1000倍),并如标准测定中所描述的进行TaqMan分析。
另外地或可替代地,可以使用液滴数字PCR(ddPCR)。例如,已经描述了用于通过ddPCR确定单链和自互补AAV载体基因组效价的方法。参见例如,M.Lock等人,《人类基因疗法方法(Hum Gene Ther Methods.)》2014年4月;25(2):115-25.doi:10.1089/hgtb.2013.131.电子版2014年2月14日。
用于确定衣壳蛋白的vp1、vp2与vp3之间的比率的方法也是可用的。参见例如,Vamseedhar Rayaprolu等人,腺相关病毒衣壳稳定性和动力学的比较分析(ComparativeAnalysis of Adeno-Associated Virus Capsid Stability and Dynamics),《病毒学杂志》2013年12月;87(24):13150-13160;Buller RM、Rose JA.1978.KB细胞中腺病毒相关病毒诱导多肽的表征(Characterization of adenovirus-associated virus-inducedpolypeptides in KB cells.)《病毒学杂志》25:331-338;以及Rose JA、Maizel JV、InmanJK、Shatkin AJ.1971.腺病毒相关病毒的结构蛋白(Structural proteins ofadenovirus-associated viruses.)《病毒学杂志》8:766-770。
应当理解,本文所述的载体中的组合物旨在应用于跨本说明书描述的其他组合物和方法。
组合物
提供了适用于施用以治疗有此需要的受试者的AS的水性悬浮液,所述悬浮液包括水性悬浮液和载体,该载体包括编码UBE3A基因的工程化核酸序列,该UBE3A基因可操作地连接到如本文所述的其调控元件。在一个实施例中,治疗有效量的所述载体包括在悬浮液中。
核酸
在某些实施例中,药物组合物包括表达盒,该表达盒包括编码UBE3A同种型1的核酸序列和非病毒递送***。这可以包括例如裸DNA、裸RNA、无机颗粒、脂质或脂质样颗粒、基于壳聚糖的制剂和本领域已知的并且例如由Ramamoorth和Narvekar描述的其他调配物,如上文所引用)。在其他实施例中,药物组合物是包括表达盒的悬浮液,该表达盒包括病毒载体***中的UBE3A基因。在某些实施例中,药物组合物包括非复制型病毒载体。合适的病毒载体可以包括任何合适的递送载体,诸如,例如重组腺病毒、重组慢病毒、重组博卡病毒、重组腺相关病毒(AAV)或另一种重组细小病毒。在某些实施例中,病毒载体是用于向有此需要的患者递送UBE3A同种型1的重组AAV。在某些实施例中,病毒载体是用于向有此需要的患者递送UBE3a同种型3的重组AAV。
在一个实施例中,组合物包含适合于递送到受试者的最终调配物,所述组合物是例如缓冲到生理上相容的pH和盐浓度的水性液体悬浮液。任选地,调配物中存在一种或多种表面活性剂。在另一个实施例中,可以将组合物作为稀释以向受试者施用的浓缩物运输。在其它实施例中,可以在施用时将组合物冻干并重构。
在一个实施例中,悬浮液进一步包括溶解于水性悬浮液中的表面活性剂、防腐剂、赋形剂和/或缓冲液。在一个实施例中,缓冲液是PBS。各种合适的溶液是已知的,包括那些包括以下一种或多种的溶液:缓冲盐水、表面活性剂和离子强度被调节至相当于约100mM氯化钠(NaCl)至约250mM氯化钠的生理学上相容的盐或盐的混合物,或调整到等效离子浓度的生理学上相容的盐。合适的表面活性剂或表面活性剂的组合可以选自泊洛沙姆,即非离子型三嵌段共聚物,所述非离子型三嵌段共聚物由侧接聚氧乙烯(聚(环氧乙烷))的两个亲水链的聚氧丙烯(聚(环氧丙烷))的中心疏水链、SOLUTOL HS 15(聚乙二醇-15羟基硬脂酸酯)、LABRASOL(聚氧辛酸甘油酯)、聚氧10油醚、TWEEN(聚氧乙烯山梨聚糖脂肪酸酯)、乙醇和聚乙二醇构成。在一个实施例中,调配物含有泊洛沙姆。pH可以在6.5至8.5、或7至8.5、或7.5至8的范围内。由于脑脊液的pH为约7.28至约7.32,对于鞘内递送,可能期望在此范围内的pH;而对于静脉内递送,可能期望的pH为6.8至约7.2。然而,可以选择最宽范围和这些子范围内的其它pH用于其它递送途径。
另外地提供了一种药物组合物,该药物组合物包括药学上可接受的载体和包括编码可操作地连接到如本文所述的其调控元件的UBE3A的一种或多种组分的核酸序列的载体。如本文所使用的,“载体”包含任何和所有溶剂、分散介质、媒剂、涂层、稀释剂、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂、缓冲液、载体溶液、悬浮液、胶质物等。将此类培养基和药剂用于药物活性物质在本领域中是众所周知的。还可以将补充性活性成分并入到组合物中。短语“药学上可接受的”是指当向宿主施用时不会产生过敏或类似不良反应的分子实体和组合物。如脂质体、纳米胶囊、微颗粒、微球、脂质颗粒、囊泡等递送媒剂可以用于将本发明的组合物引入到合适的宿主细胞中。具体地,rAAV载体递送的UBE3A转基因可以被调配成用于递送或包封在脂质颗粒、脂质体、囊泡、纳米球或纳米颗粒等中。在一个实施例中,治疗有效量的所述载体包含在药物组合物中。鉴于载体所针对的适应症,本领域技术人员可以容易地选择合适的载体。例如,一种合适的载体包括盐水,其可以用多种缓冲溶液(例如,磷酸盐缓冲盐水)配制。其它示例性载体包含无菌盐水、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油和水。载体的选择不是对本发明的限制。其它常规的药学上可接受的载体,如防腐剂或化学稳定剂。合适的示例性防腐剂包含氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸甲酯、乙基香草醛、甘油、苯酚和对氯苯酚。合适的化学稳定剂包含明胶和白蛋白。
短语“药学上可接受的”是指当向宿主施用时不会产生过敏或类似不良反应的分子实体和组合物。
如本文所使用的,术语“剂量”或“量”可以指在治疗过程中向受试者递送的总剂量或量或以单一单位(或多单位或分剂量)施用递送的剂量或量。
本文所描述的水性悬浮液或药物组合物被设计成用于通过任何合适的途径或不同途径的组合递送到有需要的受试者。在一个实施例中,药物组合物包括在适用于通过脑室内(ICV)、鞘内(IT)、脑池内或静脉内(IV)施用途径递送的调配物缓冲液中的本文所述的表达盒或载体。可替代地,可以选择其它施用途径(例如,口服、吸入、鼻内、气管内、动脉内、眼内、肌内和其他肠胃外途径)。
如本文所使用的,术语“鞘内递送”或“鞘内施用”是指通过注射到椎管中,更具体地注射到蛛网膜下腔中使得其到达脑脊液(CSF)的药物施用途径。鞘内递送可以包含腰椎穿刺、心室内、脑室内(icv)、枕骨下/脑池内和/或C1-2穿刺。例如,可以通过腰椎穿刺引入材料以在整个蛛网膜下腔扩散。在另一个实例中,可以向小脑延髓池(脑池内;ICM)中注射。脑池内递送可以增加载体扩散和/或减少施用引起的毒性和炎症。参见例如,ChristianHinderer等人,在将AAV9递送到小脑延髓池中之后食蟹猴的中枢神经***中的广泛基因转移(Widespread gene transfer in the central nervous system of cynomolgusmacaques following delivery of AAV9 into the cisterna magna).《分子疗法方法临床发展(Mol Ther Methods Clin Dev.)》2014;1:14051.于2014年12月10日在线公开.doi:10.1038/mtm.2014.51。如本文所使用的,术语“脑池内递送”或“脑池内施用”是指药物直接进入到脑室或小脑延髓池(cisterna magna cerebellomedularis)的脑脊液中,更具体地是通过枕骨下穿刺或通过直接注射到小脑延髓池(cisterna magna)中或通过永久定位的管的施用途径。
在一个方面,本文提供了一种药物组合物,所述药物组合物包括含如本文所描述的载体的调配物缓冲液。在某些实施例中,可以以剂量单位调配复制缺陷型病毒组合物,以使含有的复制缺陷型病毒的量在约1.0x109GC至约1.0x1016GC的范围内(以治疗平均体重为70kg的受试者),包含范围内的所有整数或分数量,并且对于人类患者而言,优选地为1.0x1012GC至1.0x1014GC。在一个实施例中,将组合物调配成每剂量含有至少1x109、2x109、3x109、4x109、5x109、6x109、7x109、8x109或9x109 GC,包含范围内的所有整数或分数量。在另一个实施例中,将组合物调配成每剂量含有至少1x1010、2x1010、3x1010、4x1010、5x1010、6x1010、7x1010、8x1010或9x1010 GC,包含范围内的所有整数或分数量。在另一个实施例中,将组合物调配成每剂量含有至少1x1011、2x1011、3x1011、4x1011、5x1011、6x1011、7x1011、8x1011或9x1011 GC,包含范围内的所有整数或分数量。在另一个实施例中,将组合物调配成每剂量含有至少1x1012、2x1012、3x1012、4x1012、5x1012、6x1012、7x1012、8x1012或9x1012 GC,包含范围内的所有整数或分数量。在另一个实施例中,将组合物调配成每剂量含有至少1x1013、2x1013、3x1013、4x1013、5x1013、6x1013、7x1013、8x1013或9x1013 GC,包含范围内的所有整数或分数量。在另一个实施例中,将组合物调配成每剂量含有至少1x1014、2x1014、3x1014、4x1014、5x1014、6x1014、7x1014、8x1014或9x1014 GC,包含范围内的所有整数或分数量。在另一个实施例中,将组合物调配成每剂量含有至少1x1015、2x1015、3x1015、4x1015、5x1015、6x1015、7x1015、8x1015或9x1015 GC,包含范围内的所有整数或分数量。在一个实施例中,对于人类应用,剂量的范围可以为每剂量1x1010至约1x1012 GC,包含所述范围内的所有整数或分数量。
在一个实施例中,提供了一种药物组合物,所述药物组合物包括含如本文所描述的rAAV的调配物缓冲液。在一个实施例中,以约1x109基因组拷贝(GC)/mL至约1x1014GC/mL调配rAAV。在进一步的实施例中,以约3x109GC/mL至约3x1013GC/mL调配rAAV。在又一个实施例中,以约1x109GC/mL至约1x1013GC/mL调配rAAV。在一个实施例中,以至少约1x1011GC/mL调配rAAV。
可以由本领域的技术人员确定用于递送这些剂量和浓度的合适的体积。例如,可以选择约1μL到150mL的体积,其中对于成人而言,选择更大的体积。通常,对于新生婴儿,合适的体积为约0.5mL到约10mL,对于年龄较大的婴儿,可以选择约0.5mL到约15mL。对于幼儿,可以选择约0.5mL到约20mL的体积。对于儿童,可以选择至多约30mL的体积。对于***前的少年和青少年,可以选择最大约50mL的体积。在仍其它实施例中,患者可以接受鞘内施用的体积选择为约5mL到约15mL或约7.5mL到约10mL。可以确定其它合适的体积和剂量。将调整剂量以平衡治疗益处与任何副作用,并且此类剂量可以根据采用重组载体的治疗应用而变化。
在AAV病毒载体的情况下,基因组拷贝(“GC”)的定量可以用作水性悬浮液或药物组合物中所含剂量的量度。本领域已知的任何方法可以用于确定本发明的复制缺陷型病毒组合物的基因组拷贝(GC)数。一种进行AAV GC数滴定的方法如下:纯化的AAV载体样品首先用DNase处理以从生产过程中消除未被衣壳化的AAV基因组DNA或污染的质粒DNA。然后对DNase抗性颗粒进行热治疗以从衣壳释放基因组。然后使用靶向病毒基因组特定区域的引物/探针组(通常为poly A信号)通过实时PCR或定量PCR定量释放的基因组。可以以剂量单位调配复制缺陷型病毒组合物,以使含有的复制缺陷型病毒的量在约1.0x109GC至约1.0x1015GC的范围内,并且对于人类患者而言,优选地为1.0x1012GC至1.0x1014GC。优选地,复制缺陷型病毒在调配物中的浓度为约1.0x109GC、约5.0x109GC、约1.0x1010GC、约5.0x1010GC、约1.0x1011GC、约5.0x1011GC、约1.0x1012GC、约5.0x1012GC、约1.0x1013GC、约5.0x1013GC、约1.0x1014GC、约5.0x1014GC或约1.0x1015GC。用于执行AAV GC数滴定的替代或附加方法是通过oqPCR或数字微滴PCR(ddPCR),如例如M.Lock等人,Hum Gene TherMethods.2014年4月;25(2):115-25.doi:10.1089/hgtb.2013.131.电子版2014年2月14日,其通过引用并入本文。
应当理解,本文所描述的药物组合物中的组合物旨在应用于跨本说明书描述的其它组合物、方案、方面、实施例和方法。
方法
在某些实施例中,表达盒、核酸或病毒或非病毒载体用于制备药物。在某些实施例中,提供了其在有此需要的受试者中治疗安格尔曼综合征的用途。
如本文所用,术语“治疗(treatment)”或“治疗(treating)”被定义为涵盖为了改善UBE3A缺陷或安格尔曼综合征(AS)的一种或多种症状的目的向受试者施用一种或多种本文所述的化合物或组合物。因此,“治疗”可以包括以下中的一种或多种:减轻AS的发作或进展、预防疾病、减轻疾病症状的严重程度、延缓其进展、消除疾病症状、延迟疾病的进展或增加给定受试者的疗法效果。
所述疗法提供UBE3A同种型1表达以实现所需结果,即治疗安格尔曼综合征(AS)或其一种或多种症状。此类症状可能包括但不限于以下一种或多种:智力残疾、语言障碍、共济失调、癫痫、癫痫疾患、小头畸形、精神运动迟缓和肌肉肌张力减退伴反射亢进(参见例如,Buiting K等人,安格尔曼综合征——罕见的神经遗传病(Angelman syndrome–insightinto a rare neurogenetic disorder),Nat Rev Neurol,2016,12(10):584-593,电子版2016年9月12日,其通过引用并入本文)。如本文所述,期望的结果可包括减少或消除神经物理并发症,包括发育迟缓、智力残疾、严重语言障碍以及运动和平衡问题。
将本文提供的“治疗有效量”的组合物递送给受试者以实现期望的结果或达到治疗目标。在一个实施例中,治疗AS的治疗目标是将神经元或神经元群体中的UBE3A同种型1表达恢复到患者正常范围内的功能水平或非AS水平。在另一个实施例中,治疗AS的治疗目标是将UBE3A同种型1表达增加到至少约99%、约95%、约90%、约85%、约80%、约75%、约70%、约65%、约60%、约55%、约50%、约45%、约40%、约45%、约40%、约35%、约30%、约25%、约20%,约15%、约10%、约5%、约2%、约1%的正常或非AS水平,或与治疗前UBE3A表达水平相比。通过将UBE3A同种型1功能递送给低于100%活性水平而获救的患者可以任选地接受进一步治疗。在另一个实施例中,治疗AS的治疗目标是增加UBE3A同种型1在一定百分比的靶神经元中的表达,包括所选群体中约60%、约55%、约50%、约45%、约40%、约45%、约40%、约35%、约30%、约25%、约20%、约15%、约10%、约5%、约2%或约1%的神经元。
在某些实施例中,本文提供了一种治疗AS的方法,该方法通过向有此需要的受试者施用提供UBE3A同种型1的表达盒、载体或rAAV,导致功能性UBE3A同种型1在神经元中的表达。在某些实施例中,该方法包括递送表达UBE3A同种型1的核酸序列(SEQ ID NO:2的氨基酸序列)。
在某些实施例中,本文提供了一种酶替代方法,该方法通过向有此需要的受试者施用提供UBE3a同种型1的表达盒、载体或rAAV,导致功能性UBE3a同种型1在神经元中表达。在某些实施例中,该方法包括递送表达UBE3a同种型1的核酸序列(SEQ ID NO:2的氨基酸序列)。在某些实施例中,本文提供了一种酶替代方法,该方法通过向有此需要的受试者施用提供UBE3a同种型3的表达盒、载体或rAAV,导致功能性UBE3a同种型3在神经元中表达。在某些实施例中,该方法包括递送表达UBE3a同种型3的核酸序列(SEQ ID NO:21的氨基酸序列)
本文所述的基因疗法,无论是病毒疗法还是非病毒疗法,都可以与其他疗法(二次疗法)组合使用,即针对受试者(患者)的诊断和病症的护理标准。如本文所用,术语“二次疗法”是指可与本文所述的基因疗法组合用于治疗AS的疗法。在一些实施例中,本文所述的基因疗法与一种或多种用于治疗AS的二次疗法组合施用,诸如施用抗惊厥药或饮食限制(例如,生酮和低血糖)。二次疗法可以是有助于预防、阻止或改善这些AS症状的任何疗法。可以在施用以上描述的组合物之前、同时或之后施用所述二次疗法。可以允许受试者在基因治疗之前和同时继续他们的标准护理治疗,由他们的护理医生决定。在替代方案中,医生可能更喜欢在施用基因疗法治疗之前停止护理标准疗法,并且任选地,在施用基因疗法之后恢复护理标准疗法作为联合疗法。在另一个实施例中,本文所述的基因疗法可以与基因型分析或基因筛选相组合,这在本领域中是常规的并且可以包括使用PCR来鉴定UBE3A基因的核酸序列中的一个或多个突变。如上所述,在生命早期(例如1-3个月)表现出AS症状的受试者以及在生命后期诊断为AS的受试者是本文所述的组合物和方法的预期接受者。
“施用”或“施用途径”是指在有或没有药物载体或赋形剂的情况下向受试者递送本文所述的组合物。如果期望,可以组合施用途径。在一些实施例中,周期性地重复施用。顺序施用可能意味着从数天、数周、数月或数年的间隔开始的多次施用的时间间隔。在一个实施例中,将本文所述的组合物向有需要的受试者施用一次或多次。在一个实施例中,施用间隔数天、数周、数月或数年。在一个实施例中,允许一次、两次、三次或更多次重新施用。此类重新施用可以使用相同类型的载体或不同的载体。在进一步的实施例中,本文所述的载体可单独使用,或与患者诊断和病症的护理标准组合使用。本文所描述的核酸分子和/或载体可以以单一组合物或多种组合物的方式递送。任选地,可以递送两种或更多种不同的AAV,或多种病毒[参见例如WO 2011/126808和WO 2013/049493]。
在一个实施例中,本文所述的用于基因治疗的表达盒、载体或其他组合物作为每位患者的单一剂量递送。在一个实施例中,向受试者递送治疗有效量的本文所描述的组合物。如本文所用,“治疗有效量”是指表达盒或载体或其组合的量。
在一个实施例中,表达盒在载体基因组中以每克脑质量约1x109GC至每克(g)脑质量约1x1013基因组拷贝(GC)的量递送,包括所有整数或范围和端点内的分数量。在另一个实施例中,剂量为每克脑质量1x1010GC至每克脑质量约1x1013GC。在特定实施例中,向患者施用的载体的剂量为至少约1.0x109GC/g、约1.5x109GC/g、约2.0x109GC/g、约2.5x109GC/g、约3.0x109GC/g、约3.5x109GC/g、约4.0x109GC/g、约4.5x109GC/g、约5.0x109GC/g、约5.5x109GC/g、约6.0x109GC/g、约6.5x109GC/g、约7.0x109GC/g、约7.5x109GC/g、约8.0x109GC/g、约8.5x109GC/g、约9.0x109GC/g、约9.5x109GC/g、约1.0x1010GC/g、约1.5x1010GC/g、约2.0x1010GC/g、约2.5x1010GC/g、约3.0x1010GC/g、约3.5x1010GC/g、约4.0x1010GC/g、约4.5x1010GC/g、约5.0x1010GC/g、约5.5x1010GC/g、约6.0x1010GC/g、约6.5x1010GC/g、约7.0x1010GC/g、约7.5x1010GC/g、约8.0x1010GC/g、约8.5x1010GC/g、约9.0x1010GC/g、约9.5x1010GC/g、约1.0x1011GC/g、约1.5x1011GC/g、约2.0x1011GC/g、约2.5x1011GC/g、约3.0x1011GC/g、约3.5x1011GC/g、约4.0x1011GC/g、约4.5x1011GC/g、约5.0x1011GC/g、约5.5x1011GC/g、约6.0x1011GC/g、约6.5x1011GC/g、约7.0x1011GC/g、约7.5x1011GC/g、约8.0x1011GC/g、约8.5x1011GC/g、约9.0x1011GC/g、约9.5x1011GC/g、约1.0x1012GC/g、约1.5x1012GC/g、约2.0x1012GC/g、约2.5x1012GC/g、约3.0x1012GC/g、约3.5x1012GC/g、约4.0x1012GC/g、约4.5x1012GC/g、约5.0x1012GC/g、约5.5x1012GC/g、约6.0x1012GC/g、约6.5x1012GC/g、约7.0x1012GC/g、约7.5x1012GC/g、约8.0x1012GC/g、约8.5x1012GC/g、约9.0x1012GC/g、约9.5x1012GC/g、约1.0x1013GC/g、约1.5x1013GC/g、约2.0x1013GC/g、约2.5x1013GC/g、约3.0x1013GC/g、约3.5x1013GC/g、约4.0x1013GC/g、约4.5x1013GC/g、约5.0x1013GC/g、约5.5x1013GC/g、约6.0x1013GC/g、约6.5x1013GC/g、约7.0x1013GC/g、约7.5x1013GC/g、约8.0x1013GC/g、约8.5x1013GC/g、约9.0x1013GC/g、约9.5x1013GC/g、或约1.0x1014GC/g脑质量。
在某些实施例中,方案可涉及额外治疗,其包括包含基因编辑***的组合物。参见,例如,2020年4月28日提交的美国专利申请第63/016,712号和2020年11月25日提交的标题为“用于治疗安格尔曼综合征的组合物及其用途(Compositions and uses forTreatment of Angelman Syndrome)”的美国专利申请第63/118,299号。这种治疗可以在用本文所述的基因替代疗法治疗之前进行,并且可以利用具有与用于初始治疗的衣壳不同的衣壳的载体。本领域技术人员可以选择AAV衣壳的其他组合。
在某些实施例中,治疗方案可涉及UBE3A同种型1与UBE3A同种型3的共表达。在某些实施例中,治疗可涉及AAV.hUBE3A-同种型1和hUBE3A酶替代疗法(例如,与同种型3和/或同种型1酶)的联合疗法。在某些实施例中,治疗方案可涉及与AAV.hUBE3A-同种型1基因治疗载体和免疫调节方案的联合疗法。此类免疫调节方案可以包括例如,但不限于免疫抑制剂如糖皮质激素、类固醇、抗代谢药、T细胞抑制剂、大环内酯类(例如,雷帕霉素或雷帕霉素类似物)以及细胞生长抑制剂,包含烷化剂、抗代谢药、细胞毒性抗生素、抗体或对免疫亲和素具有活性的药剂。免疫抑制剂可以包含氮芥(nitrogen mustard)、亚硝基脲(nitrosourea)、铂化合物、甲氨蝶呤(methotrexate)、硫唑嘌呤(azathioprine)、巯嘌呤(mercaptopurine)、氟尿嘧啶(fluorouracil)、更生霉素(dactinomycin)、蒽环霉素(anthracycline)、丝裂霉素C(mitomycin C)、博来霉素(bleomycin)、光神霉素(mithramycin)、IL-2受体(CD25)或CD3定向抗体、抗IL-2抗体、环孢素(cyclosporin)、他克莫司(tacrolimus)、西罗莫司(sirolimus)、IFN-β、IFN-γ、阿片类或TNF-α(肿瘤坏死因子-α)结合剂。在某些实施例中,可以在施用基因疗法之前开始免疫抑制疗法。此类疗法可以涉及在同一天内共施用两种或更多种药物(例如,强的松、霉酚酸酯(MMF)和/或西罗莫司(即,雷帕霉素))。可以在基因疗法施用之后以相同的剂量或经过调整的剂量继续使用这些药物中的一种或多种药物。根据需要,此类疗法可以持续约1周、约15天、约30天、约45天、约60天或更长时间。还有其他联合治疗剂可以包括,例如,抗IgG酶,其已被描述为可用于消除抗AAV抗体(并且因此可能允许向患者施用,以测试所选AAV衣壳的抗体水平高于阈值水平)和/或递送例如,在2020年6月17日提交的标题为“用于治疗基因治疗患者的组合物和方法(Compositions and Methods for Treatment of Gene Therapy Patients)”的美国临时专利申请第63/040,381号中描述的抗FcRN抗体,和/或a)类固醇或类固醇的组合和/或(b)IgG裂解酶;(c)Fc-IgE结合抑制剂;(d)Fc-IgM结合抑制剂;(e)Fc-IgA结合抑制剂;和/或(f)γ干扰素中的一者或多者。
通常,该方法包括向有此需要的哺乳动物受试者施用药学有效量的组合物,该组合物包括在调控序列的控制下的携带编码UBE3A基因替代(表达)***的一个或多个元件的核酸序列的重组腺相关病毒(AAV),以及药学上可接受的载体。在一个实施例中,此类方法被设计用于治疗、延缓或停止哺乳动物受试者中的AS的进展。
在一个实施例中,提供了一种治疗AS的方法,该方法通过向有需要的受试者施用如本说明书中所述的载体、rAAV、水性悬浮液或药物组合物。在一个实施例中,rAAV以约1x1010至约1x1015基因组拷贝(GC)/kg体重递送。在某些实施例中,受试者是人。在一个实施例中,多次施用rAAV。在进一步的实施例中,rAAV间隔数天、数周、数月或数年施用。
实例
现在参考以下实例描述本发明。这些实例仅仅是为了说明的目的,本发明不应该被解释为局限于这些实例,而是应该被解释为涵盖由于本文提供的教导而变得明显的任何和所有变化。
安格尔曼综合征(AS)是一种罕见的神经发育疾患,影响全球约五十万人。AS的特征在于智力和身体残疾、癫痫发作和睡眠障碍以及肠道功能。许多这些缺陷是由母系遗传的泛素蛋白连接酶E3A(UBE3A)等位基因的丢失引起的。目前,AS的治疗选择有限。基于AAV的基因替代疗法代表了恢复UBE3A同种型表达和减轻AS严重程度的有前途的策略。然而,UBE3A基因编码三种同种型,且目前尚不清楚哪种UBE3A同种型是最有效的候选者。我们通过比较AAV载体在AS(UBE3Am-/p+)小鼠模型中递送工程化人UBE3A同种型的功效来解决这种不确定性。Western blotting和免疫组织化学分析表明,将AAV-UBE3A人同种型1和2载体脑室内注射到新生儿对照和AS小鼠中会导致稳健的蛋白质表达。Isoform 1替代品以剂量依赖性方式显著改善AS小鼠的步态、筑巢能力和运动协调能力。与同种型1不同,同种型2进一步损害了AS小鼠的筑巢能力和运动协调能力。在非人灵长类动物中进行的毒理学研究表明,将高剂量的AAV-UBE3A同种型1载体注射到小脑延髓池中没有显著的副作用。综上所述,这些数据表明AAV-UBE3A同种型1载体的治疗效果最好,安全性也很有前途。这些临床前发现代表了AS基因替代疗法发展的重要一步。
实例1–在修饰的人突触蛋白启动子的指导下的工程化hUBE3A同种型1和工程化hUBE3A同种型2编码序列
对于小鼠的第一组研究,我们设计了一系列含有工程化人UBE3A同种型1(SEQ IDNO:9)或UBE3A同种型2(SEQ ID NO:10)转基因,其受修饰的人突触蛋白(hSyn)启动子(SEQID NO:12)。SV40聚腺苷酸化序列(SEQ ID NO:13)被包括在内以促进转录物的稳定性。启动子-转基因-SV40构建体的两侧是反向末端重复序列(ITR)。质粒被包装到PHP.B中,这是一种AAV9变体,可稳健转导C57BL6/J小鼠中枢神经***的神经元和神经胶质细胞。
修饰的人突触蛋白启动子的编码序列提供于SEQ ID NO:12中。
得到的载体基因组在SEQ ID NO:3(hSyn.hUbe3a-1.GSco.SV40)和SEQ ID NO:7(同种型2hSyn.hUbe3a-2.GSco.SV40)中再现。
AAVPHP.B衣壳(US 9,585,971)是在包装宿主细胞中使用三重转染技术在包含AAV2rep编码序列和PHP.B VP1编码序列的反式质粒中生成的,与含有载体基因组的顺式质粒共转染和表达包装宿主细胞不提供的必要腺病毒辅助功能的反式质粒。
实例2–rAAV介导的hUBE3A向小鼠和NHP的递送
A.hUBE3A同种型1和同种型2在成年小鼠大脑中的表达测试
我们通过蛋白质印迹法将AAV-PHP.B-突触蛋白-UBE3A同种型1和AAV-PHP.B-突触蛋白-UBE3A-同种型2注射(脑室内-ICV)到野生型成年小鼠的大脑中并量化转基因表达,确定了表达最高的载体(图8)。
方法:5x1011GC/小鼠通过眼眶后(IV)注射在成年野生型WT(UBE3Am+/p+)和UBE3AKO/null(UBE3Am-/p+)同窝仔中递送。注射后14天收获大脑以用于蛋白质印迹。然后将cDNA亚克隆到具有完整ITR的质粒中以获得最佳表达。
B.确定治疗最有效的AAV-UBE3A同种型载体
我们直接比较了表达最高的AAV-PHP.B-突触蛋白-UBE3A-同种型1(同种型1)与AAV-PHP.B-突触蛋白-UBE3A-同种型2(同种型2)载体拯救AS小鼠模型的运动和行为缺陷的能力。新生野生型或AS(UBE3Am-/p+)小鼠以每只动物1x1011基因组拷贝的剂量脑室内(ICV)注射同种型1或同种型2载体。行为测试(8-10周龄),测试顺序:(1)走秀、(2)运动活动、(3)转杆、(4)筑巢。两个月后,注射同种型1而不是同种型2的AS小鼠在步态(步幅长度图11A至图11D)、筑巢能力(图10A和图10B)和运动协调能力(图9A和9B)方面显示出统计学上的显著改善。事实上,同种型2的表达加剧了AS小鼠筑巢能力的缺陷(图10C和图10D)。以每只动物1x1010基因组拷贝的较低剂量注射同种型1效果较差,但确实提高了AS小鼠的筑巢能力。我们还观察到,野生型小鼠中同种型1或2的过度表达对几个行为领域有不利影响,表明严格控制UBE3A同种型表达的重要性。总之,头对头测试表明核UBE3A同种型1载体在减少AS小鼠的行为缺陷方面比细胞质同种型2载体具有更大的治疗能力。通过与来自野生型UBE3Am-/p+和经治疗的UBE3Am-/p+小鼠的矢状脑部分(即皮层、海马、丘脑、下丘脑、中脑)中的神经元标记NeuN和细胞核共染色,免疫荧光图像证实了工程化人UBE3A同种型1蛋白的表达和定位。使用Visiopharm软件(图5和图6)来确定和量化UBE3A同种型1(图5和图6)和UBE3A同种型2(图7)蛋白阳性神经元在不同脑区的分数(百分比)。
在1x1010GC剂量下,AAV-PHP.B-hSyn-UBE3A-同种型1剂量实现了~50%的野生型内源性UBE3A同种型表达,不会显著影响运动活动、运动协调能力或筑巢方面的行为缺陷,并且改善了一些步态异常。图5显示了经治疗的UBE3Am-/p+小鼠中UBE3A蛋白阳性神经元的量化(统计分析:平均值±SD,未配对学生t检验)。治疗包括通过脑室内(ICV)以1x1010 GC/动物的剂量施用AAV-PHP.B-hSyn-UBE3A-同种型1。
在1x1011GC的较高剂量下,AAV-PHP.B-hSyn-UBE3A-同种型1给药实现了~100%的野生型内源性UBE3A同种型表达,显著提高了筑巢能力(图10A)。根据Deacon RMJ,2006,评估小鼠的筑巢能力,Nat Protoc 1(3):1117-9的方法进行治疗的UBE3Am-/p+小鼠使用明显更多的筑巢材料来筑巢(图10B)。UBE3A-同种型1剂量对活动减退没有影响,但归一化为先前公布的UBE3Amp+小鼠步态异常(步幅长度评估如Heck等人所述,Ube3a缺陷型小鼠小脑功能分析揭示基因型特异性行为,2008年,Hum Mol遗传学,17(14):2181-2189;电子版2008年4月15日)。UBE3A-同种型1给药(图9A)而非同种型2给药(图9B)显著降低了UBE3Am-/p+小鼠的运动协调能力缺陷。图6显示经治疗的UBE3Am-/p+小鼠中UBE3A蛋白阳性神经元的量化(统计分析:未配对t检验)。治疗包括通过脑室内(ICV)以1x1011 GC/动物的剂量施用AAV-PHP.B-hSyn-UBE3A-同种型1。来自图5的蛋白质表达的量化总结于下表1中。
表1.
大脑部分 UBE3A-1-百分比阳性神经元
皮层 ~68%
海马 ~63%
丘脑 ~58%
下丘脑 ~42%
中脑 ~47%
UBE3A-同种型替代的治疗效果:同种型1:(i)使步幅长度归一化(临床相关步态缺陷),(ii)改善运动协调能力,(iii)改善筑巢行为,(iv)对UBE3缺陷型(UBE3Am-/p+)小鼠的运动功能减退没有影响。同种型2:(i)损害筑巢行为和(ii)对运动功能减退(如同种型1)或运动协调能力没有影响。
另外地,如上所述,数据表明在几个大脑区域的大部分神经元中都可以看到稳健的UBE3A同种型1蛋白表达。UBE3A同种型1蛋白表达显示出剂量依赖性,在用1x1011 GC/动物与1x1010 GC/动物治疗的动物中,UBE3A阳性神经元的百分比更高。
对AS小鼠的临床前研究表明,AAV-PHP.B-突触蛋白-UBE3A-同种型1在AS小鼠中表达良好并减轻了运动和行为缺陷。我们接下来通过评估同种型1载体在高剂量下在恒河猴中的安全性来研究其治疗潜力,因为恒河猴的免疫***和大脑结构与人类类似。首先,我们生成了AAV-hu68-突触蛋白-UBE3A-同种型1载体。AAVhu68也是内部开发的AAV9变体,在非人灵长类动物中表现良好。我们以3x1013GC/动物的高剂量将AAVhu68-hSyn-UBE3A-同种型1载体注射到三只恒河猴(NHP-1、NHP-2、NHP-3)的大池脑脊液中。35天后,取下猕猴并评估转基因表达、免疫反应和不良反应。在笼侧评估中没有动物表现出临床上显著的病症或神经学问题。血液化学测试表明接受治疗的猕猴的凝血功能、肝肾功能正常。我们在几个大脑区域(包括髓质和顶叶和颞叶皮层)观察到低水平的同种型1载体,并且在脊柱的背根神经节中观察到更高水平的同种型1载体(图2A)。此外,我们在包括脊柱的背根神经节在内的几个大脑区域检测到人UBE3A-同种型1mRNA的低表达(图2B和图2C)。经处理的NHP的背根神经节(颈、胸和背节段)的荧光图像证实了工程化人UBE3A同种型1转录物的定位。使用对工程化人类序列特异的RNAscope探针来确定UBE3A同种型1转录物定位(图7A至图7I),并用DAPI(细胞核)复染。所关注的区域的图像是在不同的放大倍数下拍摄的,并且图像以20x的放大倍数呈现。图7A至图7I显示来自三种经处理的非人灵长类动物(NHP;在35天研究中)的工程化人UBE3A同种型1(hUBE3A-1)转录物在背根神经节(颈、胸和背节段)中的定位的荧光图像。治疗包括通过小脑延髓池(ICM)途径以3x1013 GC/动物的剂量施用AAV-hu68-hSyn-UBE3A-同种型1。所关注的区域的图像以20x的放大倍数呈现。图7A显示来自NHP-1的背根神经节颈段中工程化hUBE3A-1转录物定位的荧光图像。图7B显示来自NHP-2的背根神经节颈段中工程化hUBE3A-1转录物定位的荧光图像。图7C显示来自NHP-3的背根神经节颈段中工程化hUBE3A-1转录物定位的荧光图像。图7D显示来自NHP-1的背根神经节胸段中工程化hUBE3A-1转录物定位的荧光图像。图7E显示来自NHP-2的背根神经节胸段中工程化hUBE3A-1转录物定位的荧光图像。图7F显示来自NHP-3的背根神经节胸段中工程化hUBE3A-1转录物定位的荧光图像。图7G显示来自NHP-1的背根神经节腰段中工程化hUBE3A-1转录物定位的荧光图像。图7H显示来自NHP-2的背根神经节腰段中工程化hUBE3A-1转录物定位的荧光图像。图7I显示来自NHP-3的背根神经节腰段中工程化hUBE3A-1转录物定位的荧光图像。
ELISPOT分析的免疫反应最小,表明对hu68衣壳的适度免疫反应如预期的那样。最后,背根神经节(DRG)毒性是非人灵长类动物和潜在人中枢神经***定向和高剂量AAV的平台问题。然而,我们在一只动物的脊髓(图13A至图13C)和周围神经(图13A至图13C)中仅观察到轻微的DRG(图12至图12C)和神经元毒性。总之,这些发现表明AAVhu68-hSyn-UBE3A-同种型1载体的高剂量ICM递送在非人灵长类动物中具有良好的耐受性。另外地,从该数据集中得出的结论是,可以在所有DRG片段中检测到稳健的UBE3A同种型1转录物定位,这与pPCR分析一致。尽管有稳健的转基因DRG表达,但经处理的NHP中没有显著的AAV毒性。
实例3–NHP试点研究调查恒河猴中hUBE3A同种型1±miR183靶序列的安全性和表达
由于对非人灵长类动物和人高剂量AAV诱导的DRG毒性的担忧,我们同时采用微RNA策略来下调DRG中的同种型1蛋白表达,从而减轻DRG毒性。将miR183靶位点包含在转基因的3'UTR(在本例中为UBE3A-同种型1)选择性地促进RISC复合物介导的同种型1转基因mRNA在DRG感觉神经元中的降解,同时将治疗性转基因保留在大脑中的靶神经元中。我们在表达最高的工程化同种型1或同种型2的3'端与SV40聚腺苷酸化位点之间***了miR183结合位点的四个拷贝,并将其包装到AAVhu68衣壳中。SEQ ID NO:11提供了一个拷贝miRNA183(或miR183)靶序列的序列。以这种方式,我们生成了AAV-hu68-突触蛋白-UBE3A-同种型1-4xmiR183。AAVhu68衣壳是在包装宿主细胞中使用三重转染技术在包括AAV2 rep编码序列和SEQ ID NO:14的hu68 VP1编码序列的反式质粒中产生的,用含有载体基因组的顺式质粒和表达包装宿主细胞不提供的必要腺病毒辅助功能的反式质粒共转染。
以1x1011GC/动物的剂量静脉内注射4xmiR183盒不会显著影响成年野生型或AS小鼠的UBE3A-同种型1或同种型2蛋白表达。
我们接下来比较了rAAVhu68-突触蛋白-UBE3A-同种型1-4xmiR183载体与之前分析的rAAVhu68-突触蛋白-UBE3A-同种型1-miR183载体在恒河猴中的安全性和表达谱。将AAV-hu68-突触蛋白-UBE3A-同种型1-4xmiR183以3x1013GC/动物注射到三只猕猴的小脑池中,35天后取下猕猴进行分析。在研究期间,所有动物都处于临床上不显著的状态。我们在一些大脑区域观察到低水平的同种型1-miR183载体,如预期的那样在背根神经节和脊髓中具有更高水平的髓质。此外,我们在背根神经节和脊髓中检测到人同种型1-miR183 mRNA的低表达,这通常与同种型1相当。与同种型1一样,同种型1-miR183在非人灵长类动物中耐受性良好,免疫原性较小,并且对凝血、肝肾功能没有影响。类似地,我们没有观察到用同种型1-miR183处理的猕猴有明显的DRG或神经元毒性。参见图3A-B。rAAVhu68.突触蛋白-UBE3A-同种型1在周围神经中的影响如图4A-图4B所示。
评估载体生物分布和mRNA表达并显示在图2A-图2C中。
总之,这些发现表明AAVhu68-hSyn-UBE3A-同种型1-miR183载体的高剂量ICM递送在非人灵长类动物中具有良好的耐受性。这种载体虽然对非人类灵长类动物没有用,但如果它出现在人临床试验中,可能有助于减轻DRG和神经元毒性。
(序列表自由文本)
针对含有在数字标识符<223>下的自由文本的序列提供以下信息。
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
本说明书中引用的所有文献均通过引用并入本文。随此提交的名称为“21-9579PCT_SeqListing_ST25”的序列表及其中的序列和文本通过引用并入。于2020年12月1日提交的美国临时申请第63/119,860号和于2021年4月26日提交的美国临时申请第63/179,807号通过引用并入本文。虽然已经参考特定实施例描述了本发明,但是应理解,在不脱离本发明的精神的情况下可以进行修改。这些修改旨在落入所附权利要求的范围内。
序列表
<110> 宾夕法尼亚大学的受托人
<120> 组合物及其用于治疗安格尔曼综合征的用途
<130> UPN-21-9579.PCT
<150> US 63/119,860
<151> 2020-12-01
<150> US 63/179,807
<151> 2021-04-26
<160> 25
<170> 专利版本3.5
<210> 1
<211> 3804
<212> DNA
<213> 人工序列
<220>
<223> 载体基因组hSyn.hUbe3a-1.GSco.4XmiRNA183.SV40
<220>
<221> 重复_区域
<222> (1)..(130)
<223> ITR
<220>
<221> 启动子
<222> (213)..(678)
<223> 人突触蛋白
<220>
<221> misc_特征
<222> (690)..(695)
<223> Kozak
<220>
<221> CDS
<222> (696)..(3257)
<223> hUBE3a-1
<220>
<221> misc_特征
<222> (779)..(779)
<223> 突变
<220>
<221> misc_特征
<222> (824)..(824)
<223> 突变
<220>
<221> misc_特征
<222> (1028)..(1028)
<223> 突变
<220>
<221> misc_特征
<222> (1128)..(1128)
<223> 突变
<220>
<221> misc_特征
<222> (1181)..(1181)
<223> 突变
<220>
<221> misc_特征
<222> (1217)..(1217)
<223> 突变
<220>
<221> misc_特征
<222> (1283)..(1283)
<223> 突变SD/AS
<220>
<221> misc_特征
<222> (1715)..(1715)
<223> 突变
<220>
<221> misc_特征
<222> (1721)..(1721)
<223> 突变
<220>
<221> misc_特征
<222> (1766)..(1766)
<223> 突变
<220>
<221> misc_特征
<222> (1805)..(1805)
<223> 突变
<220>
<221> misc_特征
<222> (1814)..(1814)
<223> 突变
<220>
<221> misc_特征
<222> (1991)..(1991)
<223> 突变
<220>
<221> misc_特征
<222> (2063)..(2063)
<223> 突变
<220>
<221> misc_特征
<222> (2111)..(2111)
<223> 突变
<220>
<221> misc_特征
<222> (2294)..(2294)
<223> 突变
<220>
<221> misc_特征
<222> (2439)..(2440)
<223> 突变SD/AS
<220>
<221> misc_特征
<222> (2723)..(2723)
<223> 突变
<220>
<221> misc_特征
<222> (2957)..(2957)
<223> 突变
<220>
<221> misc_特征
<222> (3023)..(3023)
<223> 突变
<220>
<221> misc_特征
<222> (3056)..(3056)
<223> 突变SD/AS
<220>
<221> misc_特征
<222> (3152)..(3152)
<223> 突变
<220>
<221> misc_特征
<222> (3161)..(3161)
<223> 突变
<220>
<221> misc_特征
<222> (3230)..(3230)
<223> 突变
<220>
<221> misc_特征
<222> (3264)..(3285)
<223> miRNA183
<220>
<221> misc_特征
<222> (3318)..(3311)
<223> miRNA183
<220>
<221> misc_特征
<222> (3318)..(3339)
<223> miRNA183
<220>
<221> misc_特征
<222> (3346)..(3367)
<223> miRNA183
<220>
<221> polyA_信号
<222> (3379)..(3610)
<223> SV40 polyA
<220>
<221> 重复_区域
<222> (3675)..(3804)
<223> ITR
<400> 1
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240
gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300
ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360
aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420
ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480
tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540
gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600
ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660
gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg aag agg gca gca gca 713
Met Lys Arg Ala Ala Ala
1 5
aag cac ctg atc gag aga tac tat cac cag ctg acc gag gga tgc gga 761
Lys His Leu Ile Glu Arg Tyr Tyr His Gln Leu Thr Glu Gly Cys Gly
10 15 20
aac gag gca tgt aca aac gag ttc tgc gcc tcc tgt ccc acc ttt ctg 809
Asn Glu Ala Cys Thr Asn Glu Phe Cys Ala Ser Cys Pro Thr Phe Leu
25 30 35
agg atg gat aac aac gcc gcc gcc atc aag gcc ctg gag ctg tac aag 857
Arg Met Asp Asn Asn Ala Ala Ala Ile Lys Ala Leu Glu Leu Tyr Lys
40 45 50
atc aac gcc aag ctg tgc gac ccc cac cct agc aag aag ggc gcc agc 905
Ile Asn Ala Lys Leu Cys Asp Pro His Pro Ser Lys Lys Gly Ala Ser
55 60 65 70
tcc gcc tat ctg gag aac tcc aag ggc gcc cct aac aat agc tgt tcc 953
Ser Ala Tyr Leu Glu Asn Ser Lys Gly Ala Pro Asn Asn Ser Cys Ser
75 80 85
gag atc aag atg aat aag aag ggc gcc cgg atc gat ttc aag gac gtg 1001
Glu Ile Lys Met Asn Lys Lys Gly Ala Arg Ile Asp Phe Lys Asp Val
90 95 100
acc tac ctg aca gag gag aag gtg tac gag atc ctg gag ctg tgc cgg 1049
Thr Tyr Leu Thr Glu Glu Lys Val Tyr Glu Ile Leu Glu Leu Cys Arg
105 110 115
gag aga gag gat tac agc cca ctg atc aga gtg atc ggc aga gtg ttc 1097
Glu Arg Glu Asp Tyr Ser Pro Leu Ile Arg Val Ile Gly Arg Val Phe
120 125 130
tct agc gcc gag gcc ctg gtg cag tcc ttt aga aag gtg aag cag cac 1145
Ser Ser Ala Glu Ala Leu Val Gln Ser Phe Arg Lys Val Lys Gln His
135 140 145 150
aca aag gag gag ctg aag tct ctg cag gcc aag gac gag gac aag gac 1193
Thr Lys Glu Glu Leu Lys Ser Leu Gln Ala Lys Asp Glu Asp Lys Asp
155 160 165
gag gac gag aag gag aag gca gcc tgt tct gcc gca gca atg gag gag 1241
Glu Asp Glu Lys Glu Lys Ala Ala Cys Ser Ala Ala Ala Met Glu Glu
170 175 180
gac agc gag gca tcc tct agc cgg atc ggc gat tcc tct caa ggc gac 1289
Asp Ser Glu Ala Ser Ser Ser Arg Ile Gly Asp Ser Ser Gln Gly Asp
185 190 195
aac aat ctg cag aag ctg ggc ccc gac gac gtg agc gtg gat atc gac 1337
Asn Asn Leu Gln Lys Leu Gly Pro Asp Asp Val Ser Val Asp Ile Asp
200 205 210
gcc atc cgg aga gtg tac aca aga ctg ctg agc aac gag aag atc gag 1385
Ala Ile Arg Arg Val Tyr Thr Arg Leu Leu Ser Asn Glu Lys Ile Glu
215 220 225 230
acc gcc ttc ctg aac gcc ctg gtg tat ctg agc cct aat gtg gag tgc 1433
Thr Ala Phe Leu Asn Ala Leu Val Tyr Leu Ser Pro Asn Val Glu Cys
235 240 245
gat ctg acc tac cac aac gtg tac tcc cgg gac cca aac tac ctg aat 1481
Asp Leu Thr Tyr His Asn Val Tyr Ser Arg Asp Pro Asn Tyr Leu Asn
250 255 260
ctg ttc atc atc gtg atg gag aac aga aat ctg cac tcc ccc gag tat 1529
Leu Phe Ile Ile Val Met Glu Asn Arg Asn Leu His Ser Pro Glu Tyr
265 270 275
ctg gag atg gcc ctg cct ctg ttt tgt aag gcc atg tcc aag ctg cct 1577
Leu Glu Met Ala Leu Pro Leu Phe Cys Lys Ala Met Ser Lys Leu Pro
280 285 290
ctg gca gca cag ggc aag ctg atc agg ctg tgg tct aag tac aac gcc 1625
Leu Ala Ala Gln Gly Lys Leu Ile Arg Leu Trp Ser Lys Tyr Asn Ala
295 300 305 310
gat cag atc agg cgc atg atg gag acc ttc cag cag ctg atc aca tac 1673
Asp Gln Ile Arg Arg Met Met Glu Thr Phe Gln Gln Leu Ile Thr Tyr
315 320 325
aaa gtg atc tct aac gag ttt aat agc cgc aac ctg gtg aac gac gac 1721
Lys Val Ile Ser Asn Glu Phe Asn Ser Arg Asn Leu Val Asn Asp Asp
330 335 340
gac gcc atc gtg gcc gcc tct aag tgc ctg aag atg gtg tac tac gcc 1769
Asp Ala Ile Val Ala Ala Ser Lys Cys Leu Lys Met Val Tyr Tyr Ala
345 350 355
aac gtg gtg ggc ggc gag gtg gac aca aac cac aac gag gag gac gac 1817
Asn Val Val Gly Gly Glu Val Asp Thr Asn His Asn Glu Glu Asp Asp
360 365 370
gag gag cca atc ccc gag agc tcc gag ctg acc ctg cag gag ctg ctg 1865
Glu Glu Pro Ile Pro Glu Ser Ser Glu Leu Thr Leu Gln Glu Leu Leu
375 380 385 390
gga gag gag cgg aga aat aag aag gga cca agg gtg gat cct ctg gag 1913
Gly Glu Glu Arg Arg Asn Lys Lys Gly Pro Arg Val Asp Pro Leu Glu
395 400 405
acc gag ctg ggc gtg aag aca ctg gac tgc aga aag cct ctg atc cca 1961
Thr Glu Leu Gly Val Lys Thr Leu Asp Cys Arg Lys Pro Leu Ile Pro
410 415 420
ttc gag gag ttt atc aac gag ccc ctg aac gag gtg ctg gag atg gat 2009
Phe Glu Glu Phe Ile Asn Glu Pro Leu Asn Glu Val Leu Glu Met Asp
425 430 435
aag gac tac acc ttc ttt aag gtg gag aca gag aac aag ttc agc ttt 2057
Lys Asp Tyr Thr Phe Phe Lys Val Glu Thr Glu Asn Lys Phe Ser Phe
440 445 450
atg acc tgt cct ttc atc ctg aac gcc gtg acc aag aat ctg ggc ctg 2105
Met Thr Cys Pro Phe Ile Leu Asn Ala Val Thr Lys Asn Leu Gly Leu
455 460 465 470
tac tac gat aac agg atc cgc atg tac tcc gag agg cgc atc acc gtg 2153
Tyr Tyr Asp Asn Arg Ile Arg Met Tyr Ser Glu Arg Arg Ile Thr Val
475 480 485
ctg tat tct ctg gtg cag ggc cag cag ctg aat cct tac ctg agg ctg 2201
Leu Tyr Ser Leu Val Gln Gly Gln Gln Leu Asn Pro Tyr Leu Arg Leu
490 495 500
aag gtg cgg aga gac cac atc atc gat gac gcc ctg gtg cgc ctg gag 2249
Lys Val Arg Arg Asp His Ile Ile Asp Asp Ala Leu Val Arg Leu Glu
505 510 515
atg atc gcc atg gag aat cca gcc gat ctg aag aag cag ctg tac gtg 2297
Met Ile Ala Met Glu Asn Pro Ala Asp Leu Lys Lys Gln Leu Tyr Val
520 525 530
gag ttt gag gga gag cag gga gtg gac gag gga ggc gtg tct aag gag 2345
Glu Phe Glu Gly Glu Gln Gly Val Asp Glu Gly Gly Val Ser Lys Glu
535 540 545 550
ttc ttt cag ctg gtg gtg gag gag atc ttc aac ccc gat atc ggc atg 2393
Phe Phe Gln Leu Val Val Glu Glu Ile Phe Asn Pro Asp Ile Gly Met
555 560 565
ttt acc tac gac gag agc aca aag ctg ttc tgg ttt aat cct tct tcc 2441
Phe Thr Tyr Asp Glu Ser Thr Lys Leu Phe Trp Phe Asn Pro Ser Ser
570 575 580
ttc gag acc gag ggc cag ttt aca ctg atc ggc atc gtg ctg ggc ctg 2489
Phe Glu Thr Glu Gly Gln Phe Thr Leu Ile Gly Ile Val Leu Gly Leu
585 590 595
gcc atc tac aac aat tgt atc ctg gac gtg cac ttc cca atg gtg gtg 2537
Ala Ile Tyr Asn Asn Cys Ile Leu Asp Val His Phe Pro Met Val Val
600 605 610
tat agg aag ctg atg ggc aag aag ggc acc ttt cgc gat ctg ggc gac 2585
Tyr Arg Lys Leu Met Gly Lys Lys Gly Thr Phe Arg Asp Leu Gly Asp
615 620 625 630
tcc cac ccc gtg ctg tac cag tct ctg aag gat ctg ctg gag tat gag 2633
Ser His Pro Val Leu Tyr Gln Ser Leu Lys Asp Leu Leu Glu Tyr Glu
635 640 645
ggc aac gtg gag gat gac atg atg atc acc ttc cag atc tcc cag aca 2681
Gly Asn Val Glu Asp Asp Met Met Ile Thr Phe Gln Ile Ser Gln Thr
650 655 660
gac ctg ttt ggc aac cca atg atg tac gat ctg aag gag aac ggc gac 2729
Asp Leu Phe Gly Asn Pro Met Met Tyr Asp Leu Lys Glu Asn Gly Asp
665 670 675
aag atc ccc atc aca aac gag aat aga aag gag ttc gtg aac ctg tac 2777
Lys Ile Pro Ile Thr Asn Glu Asn Arg Lys Glu Phe Val Asn Leu Tyr
680 685 690
agc gat tat atc ctg aat aag tcc gtg gag aag cag ttc aag gcc ttt 2825
Ser Asp Tyr Ile Leu Asn Lys Ser Val Glu Lys Gln Phe Lys Ala Phe
695 700 705 710
agg cgc ggc ttc cac atg gtg acc aac gag agc cct ctg aag tat ctg 2873
Arg Arg Gly Phe His Met Val Thr Asn Glu Ser Pro Leu Lys Tyr Leu
715 720 725
ttt agg cca gag gag atc gag ctg ctg atc tgc ggc tcc cgc aat ctg 2921
Phe Arg Pro Glu Glu Ile Glu Leu Leu Ile Cys Gly Ser Arg Asn Leu
730 735 740
gac ttt cag gcc ctg gag gag acc aca gag tac gac ggc ggc tat acc 2969
Asp Phe Gln Ala Leu Glu Glu Thr Thr Glu Tyr Asp Gly Gly Tyr Thr
745 750 755
agg gac tct gtg ctg atc cgc gag ttc tgg gag atc gtg cac agc ttt 3017
Arg Asp Ser Val Leu Ile Arg Glu Phe Trp Glu Ile Val His Ser Phe
760 765 770
aca gac gag cag aag cgg ctg ttc ctg cag ttt acc acc ggc acc gac 3065
Thr Asp Glu Gln Lys Arg Leu Phe Leu Gln Phe Thr Thr Gly Thr Asp
775 780 785 790
aga gca cca gtg gga gga ctg ggc aag ctg aag atg atc atc gcc aag 3113
Arg Ala Pro Val Gly Gly Leu Gly Lys Leu Lys Met Ile Ile Ala Lys
795 800 805
aac ggc cca gac aca gag agg ctg ccc acc agc cac acc tgt ttc aac 3161
Asn Gly Pro Asp Thr Glu Arg Leu Pro Thr Ser His Thr Cys Phe Asn
810 815 820
gtg ctg ctg ctg ccc gag tac tcc tct aag gag aag ctg aag gag cgc 3209
Val Leu Leu Leu Pro Glu Tyr Ser Ser Lys Glu Lys Leu Lys Glu Arg
825 830 835
ctg ctg aag gcc atc acc tac gcc aag ggc ttt ggc atg ctg tga tga 3257
Leu Leu Lys Ala Ile Thr Tyr Ala Lys Gly Phe Gly Met Leu
840 845 850
ggtaccagtg aattctacca gtgccatagg atagtgaatt ctaccagtgc catacacgtg 3317
agtgaattct accagtgcca tagcatgcag tgaattctac cagtgccata ggcggccgct 3377
tcgagcagac atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg 3437
aaaaaaatgc tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag 3497
ctgcaataaa caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga 3557
gatgtgggag gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tcgataagga 3617
tcttcctaga gcatggctac gtagataagt agcatggcgg gttaatcatt aactacaagg 3677
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 3737
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 3797
cgcgcag 3804
<210> 2
<211> 852
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 2
Met Lys Arg Ala Ala Ala Lys His Leu Ile Glu Arg Tyr Tyr His Gln
1 5 10 15
Leu Thr Glu Gly Cys Gly Asn Glu Ala Cys Thr Asn Glu Phe Cys Ala
20 25 30
Ser Cys Pro Thr Phe Leu Arg Met Asp Asn Asn Ala Ala Ala Ile Lys
35 40 45
Ala Leu Glu Leu Tyr Lys Ile Asn Ala Lys Leu Cys Asp Pro His Pro
50 55 60
Ser Lys Lys Gly Ala Ser Ser Ala Tyr Leu Glu Asn Ser Lys Gly Ala
65 70 75 80
Pro Asn Asn Ser Cys Ser Glu Ile Lys Met Asn Lys Lys Gly Ala Arg
85 90 95
Ile Asp Phe Lys Asp Val Thr Tyr Leu Thr Glu Glu Lys Val Tyr Glu
100 105 110
Ile Leu Glu Leu Cys Arg Glu Arg Glu Asp Tyr Ser Pro Leu Ile Arg
115 120 125
Val Ile Gly Arg Val Phe Ser Ser Ala Glu Ala Leu Val Gln Ser Phe
130 135 140
Arg Lys Val Lys Gln His Thr Lys Glu Glu Leu Lys Ser Leu Gln Ala
145 150 155 160
Lys Asp Glu Asp Lys Asp Glu Asp Glu Lys Glu Lys Ala Ala Cys Ser
165 170 175
Ala Ala Ala Met Glu Glu Asp Ser Glu Ala Ser Ser Ser Arg Ile Gly
180 185 190
Asp Ser Ser Gln Gly Asp Asn Asn Leu Gln Lys Leu Gly Pro Asp Asp
195 200 205
Val Ser Val Asp Ile Asp Ala Ile Arg Arg Val Tyr Thr Arg Leu Leu
210 215 220
Ser Asn Glu Lys Ile Glu Thr Ala Phe Leu Asn Ala Leu Val Tyr Leu
225 230 235 240
Ser Pro Asn Val Glu Cys Asp Leu Thr Tyr His Asn Val Tyr Ser Arg
245 250 255
Asp Pro Asn Tyr Leu Asn Leu Phe Ile Ile Val Met Glu Asn Arg Asn
260 265 270
Leu His Ser Pro Glu Tyr Leu Glu Met Ala Leu Pro Leu Phe Cys Lys
275 280 285
Ala Met Ser Lys Leu Pro Leu Ala Ala Gln Gly Lys Leu Ile Arg Leu
290 295 300
Trp Ser Lys Tyr Asn Ala Asp Gln Ile Arg Arg Met Met Glu Thr Phe
305 310 315 320
Gln Gln Leu Ile Thr Tyr Lys Val Ile Ser Asn Glu Phe Asn Ser Arg
325 330 335
Asn Leu Val Asn Asp Asp Asp Ala Ile Val Ala Ala Ser Lys Cys Leu
340 345 350
Lys Met Val Tyr Tyr Ala Asn Val Val Gly Gly Glu Val Asp Thr Asn
355 360 365
His Asn Glu Glu Asp Asp Glu Glu Pro Ile Pro Glu Ser Ser Glu Leu
370 375 380
Thr Leu Gln Glu Leu Leu Gly Glu Glu Arg Arg Asn Lys Lys Gly Pro
385 390 395 400
Arg Val Asp Pro Leu Glu Thr Glu Leu Gly Val Lys Thr Leu Asp Cys
405 410 415
Arg Lys Pro Leu Ile Pro Phe Glu Glu Phe Ile Asn Glu Pro Leu Asn
420 425 430
Glu Val Leu Glu Met Asp Lys Asp Tyr Thr Phe Phe Lys Val Glu Thr
435 440 445
Glu Asn Lys Phe Ser Phe Met Thr Cys Pro Phe Ile Leu Asn Ala Val
450 455 460
Thr Lys Asn Leu Gly Leu Tyr Tyr Asp Asn Arg Ile Arg Met Tyr Ser
465 470 475 480
Glu Arg Arg Ile Thr Val Leu Tyr Ser Leu Val Gln Gly Gln Gln Leu
485 490 495
Asn Pro Tyr Leu Arg Leu Lys Val Arg Arg Asp His Ile Ile Asp Asp
500 505 510
Ala Leu Val Arg Leu Glu Met Ile Ala Met Glu Asn Pro Ala Asp Leu
515 520 525
Lys Lys Gln Leu Tyr Val Glu Phe Glu Gly Glu Gln Gly Val Asp Glu
530 535 540
Gly Gly Val Ser Lys Glu Phe Phe Gln Leu Val Val Glu Glu Ile Phe
545 550 555 560
Asn Pro Asp Ile Gly Met Phe Thr Tyr Asp Glu Ser Thr Lys Leu Phe
565 570 575
Trp Phe Asn Pro Ser Ser Phe Glu Thr Glu Gly Gln Phe Thr Leu Ile
580 585 590
Gly Ile Val Leu Gly Leu Ala Ile Tyr Asn Asn Cys Ile Leu Asp Val
595 600 605
His Phe Pro Met Val Val Tyr Arg Lys Leu Met Gly Lys Lys Gly Thr
610 615 620
Phe Arg Asp Leu Gly Asp Ser His Pro Val Leu Tyr Gln Ser Leu Lys
625 630 635 640
Asp Leu Leu Glu Tyr Glu Gly Asn Val Glu Asp Asp Met Met Ile Thr
645 650 655
Phe Gln Ile Ser Gln Thr Asp Leu Phe Gly Asn Pro Met Met Tyr Asp
660 665 670
Leu Lys Glu Asn Gly Asp Lys Ile Pro Ile Thr Asn Glu Asn Arg Lys
675 680 685
Glu Phe Val Asn Leu Tyr Ser Asp Tyr Ile Leu Asn Lys Ser Val Glu
690 695 700
Lys Gln Phe Lys Ala Phe Arg Arg Gly Phe His Met Val Thr Asn Glu
705 710 715 720
Ser Pro Leu Lys Tyr Leu Phe Arg Pro Glu Glu Ile Glu Leu Leu Ile
725 730 735
Cys Gly Ser Arg Asn Leu Asp Phe Gln Ala Leu Glu Glu Thr Thr Glu
740 745 750
Tyr Asp Gly Gly Tyr Thr Arg Asp Ser Val Leu Ile Arg Glu Phe Trp
755 760 765
Glu Ile Val His Ser Phe Thr Asp Glu Gln Lys Arg Leu Phe Leu Gln
770 775 780
Phe Thr Thr Gly Thr Asp Arg Ala Pro Val Gly Gly Leu Gly Lys Leu
785 790 795 800
Lys Met Ile Ile Ala Lys Asn Gly Pro Asp Thr Glu Arg Leu Pro Thr
805 810 815
Ser His Thr Cys Phe Asn Val Leu Leu Leu Pro Glu Tyr Ser Ser Lys
820 825 830
Glu Lys Leu Lys Glu Arg Leu Leu Lys Ala Ile Thr Tyr Ala Lys Gly
835 840 845
Phe Gly Met Leu
850
<210> 3
<211> 3700
<212> DNA
<213> 人工序列
<220>
<223> 载体基因组hSyn.hUbe3a-1.GSco.SV40
<220>
<221> 重复_区域
<222> (1)..(130)
<223> ITR
<220>
<221> 启动子
<222> (213)..(678)
<223> 人突触蛋白启动子
<220>
<221> misc_特征
<222> (690)..(695)
<223> Kozak
<220>
<221> CDS
<222> (696)..(3257)
<223> hUBE3a-1
<220>
<221> misc_特征
<222> (779)..(779)
<223> 突变
<220>
<221> misc_特征
<222> (824)..(824)
<223> 突变
<220>
<221> misc_特征
<222> (1028)..(1028)
<223> 突变
<220>
<221> misc_特征
<222> (1181)..(1181)
<223> 突变
<220>
<221> misc_特征
<222> (1193)..(1193)
<223> 突变
<220>
<221> misc_特征
<222> (1217)..(1217)
<223> 突变
<220>
<221> misc_特征
<222> (1283)..(1283)
<223> 突变SD/AS
<220>
<221> misc_特征
<222> (1715)..(1715)
<223> 突变
<220>
<221> misc_特征
<222> (1721)..(1721)
<223> 突变
<220>
<221> misc_特征
<222> (1766)..(1766)
<223> 突变
<220>
<221> misc_特征
<222> (1805)..(1805)
<223> 突变
<220>
<221> misc_特征
<222> (1814)..(1814)
<223> 突变
<220>
<221> misc_特征
<222> (1991)..(1991)
<223> 突变
<220>
<221> misc_特征
<222> (2063)..(2063)
<223> 突变
<220>
<221> misc_特征
<222> (2111)..(2111)
<223> 突变
<220>
<221> misc_特征
<222> (2294)..(2294)
<223> 突变
<220>
<221> misc_特征
<222> (2439)..(2440)
<223> 突变SD/AS
<220>
<221> misc_特征
<222> (2723)..(2723)
<223> 突变
<220>
<221> misc_特征
<222> (2957)..(2957)
<223> 突变
<220>
<221> misc_特征
<222> (3023)..(3023)
<223> 突变
<220>
<221> misc_特征
<222> (3056)..(3056)
<223> 突变SD/AS
<220>
<221> misc_特征
<222> (3152)..(3152)
<223> 突变
<220>
<221> misc_特征
<222> (3161)..(3161)
<223> 突变
<220>
<221> misc_特征
<222> (3230)..(3230)
<223> 突变
<220>
<221> polyA_信号
<222> (3275)..(3700)
<223> SV40 polyA
<220>
<221> 重复_区域
<222> (3571)..(3700)
<223> ITR
<400> 3
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240
gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300
ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360
aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420
ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480
tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540
gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600
ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660
gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg aag agg gca gca gca 713
Met Lys Arg Ala Ala Ala
1 5
aag cac ctg atc gag aga tac tat cac cag ctg acc gag gga tgc gga 761
Lys His Leu Ile Glu Arg Tyr Tyr His Gln Leu Thr Glu Gly Cys Gly
10 15 20
aac gag gca tgt aca aac gag ttc tgc gcc tcc tgt ccc acc ttt ctg 809
Asn Glu Ala Cys Thr Asn Glu Phe Cys Ala Ser Cys Pro Thr Phe Leu
25 30 35
agg atg gat aac aac gcc gcc gcc atc aag gcc ctg gag ctg tac aag 857
Arg Met Asp Asn Asn Ala Ala Ala Ile Lys Ala Leu Glu Leu Tyr Lys
40 45 50
atc aac gcc aag ctg tgc gac ccc cac cct agc aag aag ggc gcc agc 905
Ile Asn Ala Lys Leu Cys Asp Pro His Pro Ser Lys Lys Gly Ala Ser
55 60 65 70
tcc gcc tat ctg gag aac tcc aag ggc gcc cct aac aat agc tgt tcc 953
Ser Ala Tyr Leu Glu Asn Ser Lys Gly Ala Pro Asn Asn Ser Cys Ser
75 80 85
gag atc aag atg aat aag aag ggc gcc cgg atc gat ttc aag gac gtg 1001
Glu Ile Lys Met Asn Lys Lys Gly Ala Arg Ile Asp Phe Lys Asp Val
90 95 100
acc tac ctg aca gag gag aag gtg tac gag atc ctg gag ctg tgc cgg 1049
Thr Tyr Leu Thr Glu Glu Lys Val Tyr Glu Ile Leu Glu Leu Cys Arg
105 110 115
gag aga gag gat tac agc cca ctg atc aga gtg atc ggc aga gtg ttc 1097
Glu Arg Glu Asp Tyr Ser Pro Leu Ile Arg Val Ile Gly Arg Val Phe
120 125 130
tct agc gcc gag gcc ctg gtg cag tcc ttt aga aag gtg aag cag cac 1145
Ser Ser Ala Glu Ala Leu Val Gln Ser Phe Arg Lys Val Lys Gln His
135 140 145 150
aca aag gag gag ctg aag tct ctg cag gcc aag gac gag gac aag gac 1193
Thr Lys Glu Glu Leu Lys Ser Leu Gln Ala Lys Asp Glu Asp Lys Asp
155 160 165
gag gac gag aag gag aag gca gcc tgt tct gcc gca gca atg gag gag 1241
Glu Asp Glu Lys Glu Lys Ala Ala Cys Ser Ala Ala Ala Met Glu Glu
170 175 180
gac agc gag gca tcc tct agc cgg atc ggc gat tcc tct caa ggc gac 1289
Asp Ser Glu Ala Ser Ser Ser Arg Ile Gly Asp Ser Ser Gln Gly Asp
185 190 195
aac aat ctg cag aag ctg ggc ccc gac gac gtg agc gtg gat atc gac 1337
Asn Asn Leu Gln Lys Leu Gly Pro Asp Asp Val Ser Val Asp Ile Asp
200 205 210
gcc atc cgg aga gtg tac aca aga ctg ctg agc aac gag aag atc gag 1385
Ala Ile Arg Arg Val Tyr Thr Arg Leu Leu Ser Asn Glu Lys Ile Glu
215 220 225 230
acc gcc ttc ctg aac gcc ctg gtg tat ctg agc cct aat gtg gag tgc 1433
Thr Ala Phe Leu Asn Ala Leu Val Tyr Leu Ser Pro Asn Val Glu Cys
235 240 245
gat ctg acc tac cac aac gtg tac tcc cgg gac cca aac tac ctg aat 1481
Asp Leu Thr Tyr His Asn Val Tyr Ser Arg Asp Pro Asn Tyr Leu Asn
250 255 260
ctg ttc atc atc gtg atg gag aac aga aat ctg cac tcc ccc gag tat 1529
Leu Phe Ile Ile Val Met Glu Asn Arg Asn Leu His Ser Pro Glu Tyr
265 270 275
ctg gag atg gcc ctg cct ctg ttt tgt aag gcc atg tcc aag ctg cct 1577
Leu Glu Met Ala Leu Pro Leu Phe Cys Lys Ala Met Ser Lys Leu Pro
280 285 290
ctg gca gca cag ggc aag ctg atc agg ctg tgg tct aag tac aac gcc 1625
Leu Ala Ala Gln Gly Lys Leu Ile Arg Leu Trp Ser Lys Tyr Asn Ala
295 300 305 310
gat cag atc agg cgc atg atg gag acc ttc cag cag ctg atc aca tac 1673
Asp Gln Ile Arg Arg Met Met Glu Thr Phe Gln Gln Leu Ile Thr Tyr
315 320 325
aaa gtg atc tct aac gag ttt aat agc cgc aac ctg gtg aac gac gac 1721
Lys Val Ile Ser Asn Glu Phe Asn Ser Arg Asn Leu Val Asn Asp Asp
330 335 340
gac gcc atc gtg gcc gcc tct aag tgc ctg aag atg gtg tac tac gcc 1769
Asp Ala Ile Val Ala Ala Ser Lys Cys Leu Lys Met Val Tyr Tyr Ala
345 350 355
aac gtg gtg ggc ggc gag gtg gac aca aac cac aac gag gag gac gac 1817
Asn Val Val Gly Gly Glu Val Asp Thr Asn His Asn Glu Glu Asp Asp
360 365 370
gag gag cca atc ccc gag agc tcc gag ctg acc ctg cag gag ctg ctg 1865
Glu Glu Pro Ile Pro Glu Ser Ser Glu Leu Thr Leu Gln Glu Leu Leu
375 380 385 390
gga gag gag cgg aga aat aag aag gga cca agg gtg gat cct ctg gag 1913
Gly Glu Glu Arg Arg Asn Lys Lys Gly Pro Arg Val Asp Pro Leu Glu
395 400 405
acc gag ctg ggc gtg aag aca ctg gac tgc aga aag cct ctg atc cca 1961
Thr Glu Leu Gly Val Lys Thr Leu Asp Cys Arg Lys Pro Leu Ile Pro
410 415 420
ttc gag gag ttt atc aac gag ccc ctg aac gag gtg ctg gag atg gat 2009
Phe Glu Glu Phe Ile Asn Glu Pro Leu Asn Glu Val Leu Glu Met Asp
425 430 435
aag gac tac acc ttc ttt aag gtg gag aca gag aac aag ttc agc ttt 2057
Lys Asp Tyr Thr Phe Phe Lys Val Glu Thr Glu Asn Lys Phe Ser Phe
440 445 450
atg acc tgt cct ttc atc ctg aac gcc gtg acc aag aat ctg ggc ctg 2105
Met Thr Cys Pro Phe Ile Leu Asn Ala Val Thr Lys Asn Leu Gly Leu
455 460 465 470
tac tac gat aac agg atc cgc atg tac tcc gag agg cgc atc acc gtg 2153
Tyr Tyr Asp Asn Arg Ile Arg Met Tyr Ser Glu Arg Arg Ile Thr Val
475 480 485
ctg tat tct ctg gtg cag ggc cag cag ctg aat cct tac ctg agg ctg 2201
Leu Tyr Ser Leu Val Gln Gly Gln Gln Leu Asn Pro Tyr Leu Arg Leu
490 495 500
aag gtg cgg aga gac cac atc atc gat gac gcc ctg gtg cgc ctg gag 2249
Lys Val Arg Arg Asp His Ile Ile Asp Asp Ala Leu Val Arg Leu Glu
505 510 515
atg atc gcc atg gag aat cca gcc gat ctg aag aag cag ctg tac gtg 2297
Met Ile Ala Met Glu Asn Pro Ala Asp Leu Lys Lys Gln Leu Tyr Val
520 525 530
gag ttt gag gga gag cag gga gtg gac gag gga ggc gtg tct aag gag 2345
Glu Phe Glu Gly Glu Gln Gly Val Asp Glu Gly Gly Val Ser Lys Glu
535 540 545 550
ttc ttt cag ctg gtg gtg gag gag atc ttc aac ccc gat atc ggc atg 2393
Phe Phe Gln Leu Val Val Glu Glu Ile Phe Asn Pro Asp Ile Gly Met
555 560 565
ttt acc tac gac gag agc aca aag ctg ttc tgg ttt aat cct tct tcc 2441
Phe Thr Tyr Asp Glu Ser Thr Lys Leu Phe Trp Phe Asn Pro Ser Ser
570 575 580
ttc gag acc gag ggc cag ttt aca ctg atc ggc atc gtg ctg ggc ctg 2489
Phe Glu Thr Glu Gly Gln Phe Thr Leu Ile Gly Ile Val Leu Gly Leu
585 590 595
gcc atc tac aac aat tgt atc ctg gac gtg cac ttc cca atg gtg gtg 2537
Ala Ile Tyr Asn Asn Cys Ile Leu Asp Val His Phe Pro Met Val Val
600 605 610
tat agg aag ctg atg ggc aag aag ggc acc ttt cgc gat ctg ggc gac 2585
Tyr Arg Lys Leu Met Gly Lys Lys Gly Thr Phe Arg Asp Leu Gly Asp
615 620 625 630
tcc cac ccc gtg ctg tac cag tct ctg aag gat ctg ctg gag tat gag 2633
Ser His Pro Val Leu Tyr Gln Ser Leu Lys Asp Leu Leu Glu Tyr Glu
635 640 645
ggc aac gtg gag gat gac atg atg atc acc ttc cag atc tcc cag aca 2681
Gly Asn Val Glu Asp Asp Met Met Ile Thr Phe Gln Ile Ser Gln Thr
650 655 660
gac ctg ttt ggc aac cca atg atg tac gat ctg aag gag aac ggc gac 2729
Asp Leu Phe Gly Asn Pro Met Met Tyr Asp Leu Lys Glu Asn Gly Asp
665 670 675
aag atc ccc atc aca aac gag aat aga aag gag ttc gtg aac ctg tac 2777
Lys Ile Pro Ile Thr Asn Glu Asn Arg Lys Glu Phe Val Asn Leu Tyr
680 685 690
agc gat tat atc ctg aat aag tcc gtg gag aag cag ttc aag gcc ttt 2825
Ser Asp Tyr Ile Leu Asn Lys Ser Val Glu Lys Gln Phe Lys Ala Phe
695 700 705 710
agg cgc ggc ttc cac atg gtg acc aac gag agc cct ctg aag tat ctg 2873
Arg Arg Gly Phe His Met Val Thr Asn Glu Ser Pro Leu Lys Tyr Leu
715 720 725
ttt agg cca gag gag atc gag ctg ctg atc tgc ggc tcc cgc aat ctg 2921
Phe Arg Pro Glu Glu Ile Glu Leu Leu Ile Cys Gly Ser Arg Asn Leu
730 735 740
gac ttt cag gcc ctg gag gag acc aca gag tac gac ggc ggc tat acc 2969
Asp Phe Gln Ala Leu Glu Glu Thr Thr Glu Tyr Asp Gly Gly Tyr Thr
745 750 755
agg gac tct gtg ctg atc cgc gag ttc tgg gag atc gtg cac agc ttt 3017
Arg Asp Ser Val Leu Ile Arg Glu Phe Trp Glu Ile Val His Ser Phe
760 765 770
aca gac gag cag aag cgg ctg ttc ctg cag ttt acc acc ggc acc gac 3065
Thr Asp Glu Gln Lys Arg Leu Phe Leu Gln Phe Thr Thr Gly Thr Asp
775 780 785 790
aga gca cca gtg gga gga ctg ggc aag ctg aag atg atc atc gcc aag 3113
Arg Ala Pro Val Gly Gly Leu Gly Lys Leu Lys Met Ile Ile Ala Lys
795 800 805
aac ggc cca gac aca gag agg ctg ccc acc agc cac acc tgt ttc aac 3161
Asn Gly Pro Asp Thr Glu Arg Leu Pro Thr Ser His Thr Cys Phe Asn
810 815 820
gtg ctg ctg ctg ccc gag tac tcc tct aag gag aag ctg aag gag cgc 3209
Val Leu Leu Leu Pro Glu Tyr Ser Ser Lys Glu Lys Leu Lys Glu Arg
825 830 835
ctg ctg aag gcc atc acc tac gcc aag ggc ttt ggc atg ctg tga tga 3257
Leu Leu Lys Ala Ile Thr Tyr Ala Lys Gly Phe Gly Met Leu
840 845 850
ggtaccggcg gccgcttcga gcagacatga taagatacat tgatgagttt ggacaaacca 3317
caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat 3377
ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt 3437
ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg 3497
gtaaaatcga taaggatctt cctagagcat ggctacgtag ataagtagca tggcgggtta 3557
atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 3617
tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 3677
tcagtgagcg agcgagcgcg cag 3700
<210> 4
<211> 852
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 4
Met Lys Arg Ala Ala Ala Lys His Leu Ile Glu Arg Tyr Tyr His Gln
1 5 10 15
Leu Thr Glu Gly Cys Gly Asn Glu Ala Cys Thr Asn Glu Phe Cys Ala
20 25 30
Ser Cys Pro Thr Phe Leu Arg Met Asp Asn Asn Ala Ala Ala Ile Lys
35 40 45
Ala Leu Glu Leu Tyr Lys Ile Asn Ala Lys Leu Cys Asp Pro His Pro
50 55 60
Ser Lys Lys Gly Ala Ser Ser Ala Tyr Leu Glu Asn Ser Lys Gly Ala
65 70 75 80
Pro Asn Asn Ser Cys Ser Glu Ile Lys Met Asn Lys Lys Gly Ala Arg
85 90 95
Ile Asp Phe Lys Asp Val Thr Tyr Leu Thr Glu Glu Lys Val Tyr Glu
100 105 110
Ile Leu Glu Leu Cys Arg Glu Arg Glu Asp Tyr Ser Pro Leu Ile Arg
115 120 125
Val Ile Gly Arg Val Phe Ser Ser Ala Glu Ala Leu Val Gln Ser Phe
130 135 140
Arg Lys Val Lys Gln His Thr Lys Glu Glu Leu Lys Ser Leu Gln Ala
145 150 155 160
Lys Asp Glu Asp Lys Asp Glu Asp Glu Lys Glu Lys Ala Ala Cys Ser
165 170 175
Ala Ala Ala Met Glu Glu Asp Ser Glu Ala Ser Ser Ser Arg Ile Gly
180 185 190
Asp Ser Ser Gln Gly Asp Asn Asn Leu Gln Lys Leu Gly Pro Asp Asp
195 200 205
Val Ser Val Asp Ile Asp Ala Ile Arg Arg Val Tyr Thr Arg Leu Leu
210 215 220
Ser Asn Glu Lys Ile Glu Thr Ala Phe Leu Asn Ala Leu Val Tyr Leu
225 230 235 240
Ser Pro Asn Val Glu Cys Asp Leu Thr Tyr His Asn Val Tyr Ser Arg
245 250 255
Asp Pro Asn Tyr Leu Asn Leu Phe Ile Ile Val Met Glu Asn Arg Asn
260 265 270
Leu His Ser Pro Glu Tyr Leu Glu Met Ala Leu Pro Leu Phe Cys Lys
275 280 285
Ala Met Ser Lys Leu Pro Leu Ala Ala Gln Gly Lys Leu Ile Arg Leu
290 295 300
Trp Ser Lys Tyr Asn Ala Asp Gln Ile Arg Arg Met Met Glu Thr Phe
305 310 315 320
Gln Gln Leu Ile Thr Tyr Lys Val Ile Ser Asn Glu Phe Asn Ser Arg
325 330 335
Asn Leu Val Asn Asp Asp Asp Ala Ile Val Ala Ala Ser Lys Cys Leu
340 345 350
Lys Met Val Tyr Tyr Ala Asn Val Val Gly Gly Glu Val Asp Thr Asn
355 360 365
His Asn Glu Glu Asp Asp Glu Glu Pro Ile Pro Glu Ser Ser Glu Leu
370 375 380
Thr Leu Gln Glu Leu Leu Gly Glu Glu Arg Arg Asn Lys Lys Gly Pro
385 390 395 400
Arg Val Asp Pro Leu Glu Thr Glu Leu Gly Val Lys Thr Leu Asp Cys
405 410 415
Arg Lys Pro Leu Ile Pro Phe Glu Glu Phe Ile Asn Glu Pro Leu Asn
420 425 430
Glu Val Leu Glu Met Asp Lys Asp Tyr Thr Phe Phe Lys Val Glu Thr
435 440 445
Glu Asn Lys Phe Ser Phe Met Thr Cys Pro Phe Ile Leu Asn Ala Val
450 455 460
Thr Lys Asn Leu Gly Leu Tyr Tyr Asp Asn Arg Ile Arg Met Tyr Ser
465 470 475 480
Glu Arg Arg Ile Thr Val Leu Tyr Ser Leu Val Gln Gly Gln Gln Leu
485 490 495
Asn Pro Tyr Leu Arg Leu Lys Val Arg Arg Asp His Ile Ile Asp Asp
500 505 510
Ala Leu Val Arg Leu Glu Met Ile Ala Met Glu Asn Pro Ala Asp Leu
515 520 525
Lys Lys Gln Leu Tyr Val Glu Phe Glu Gly Glu Gln Gly Val Asp Glu
530 535 540
Gly Gly Val Ser Lys Glu Phe Phe Gln Leu Val Val Glu Glu Ile Phe
545 550 555 560
Asn Pro Asp Ile Gly Met Phe Thr Tyr Asp Glu Ser Thr Lys Leu Phe
565 570 575
Trp Phe Asn Pro Ser Ser Phe Glu Thr Glu Gly Gln Phe Thr Leu Ile
580 585 590
Gly Ile Val Leu Gly Leu Ala Ile Tyr Asn Asn Cys Ile Leu Asp Val
595 600 605
His Phe Pro Met Val Val Tyr Arg Lys Leu Met Gly Lys Lys Gly Thr
610 615 620
Phe Arg Asp Leu Gly Asp Ser His Pro Val Leu Tyr Gln Ser Leu Lys
625 630 635 640
Asp Leu Leu Glu Tyr Glu Gly Asn Val Glu Asp Asp Met Met Ile Thr
645 650 655
Phe Gln Ile Ser Gln Thr Asp Leu Phe Gly Asn Pro Met Met Tyr Asp
660 665 670
Leu Lys Glu Asn Gly Asp Lys Ile Pro Ile Thr Asn Glu Asn Arg Lys
675 680 685
Glu Phe Val Asn Leu Tyr Ser Asp Tyr Ile Leu Asn Lys Ser Val Glu
690 695 700
Lys Gln Phe Lys Ala Phe Arg Arg Gly Phe His Met Val Thr Asn Glu
705 710 715 720
Ser Pro Leu Lys Tyr Leu Phe Arg Pro Glu Glu Ile Glu Leu Leu Ile
725 730 735
Cys Gly Ser Arg Asn Leu Asp Phe Gln Ala Leu Glu Glu Thr Thr Glu
740 745 750
Tyr Asp Gly Gly Tyr Thr Arg Asp Ser Val Leu Ile Arg Glu Phe Trp
755 760 765
Glu Ile Val His Ser Phe Thr Asp Glu Gln Lys Arg Leu Phe Leu Gln
770 775 780
Phe Thr Thr Gly Thr Asp Arg Ala Pro Val Gly Gly Leu Gly Lys Leu
785 790 795 800
Lys Met Ile Ile Ala Lys Asn Gly Pro Asp Thr Glu Arg Leu Pro Thr
805 810 815
Ser His Thr Cys Phe Asn Val Leu Leu Leu Pro Glu Tyr Ser Ser Lys
820 825 830
Glu Lys Leu Lys Glu Arg Leu Leu Lys Ala Ile Thr Tyr Ala Lys Gly
835 840 845
Phe Gly Met Leu
850
<210> 5
<211> 3873
<212> DNA
<213> 人工序列
<220>
<223> 载体基因组hSyn.hUbe3a-2.GSco.4XmiRNA183.SV40
<220>
<221> 重复_区域
<222> (1)..(130)
<223> ITR
<220>
<221> 启动子
<222> (213)..(678)
<223> 人突触蛋白启动子
<220>
<221> misc_特征
<222> (690)..(695)
<223> Kozak
<220>
<221> CDS
<222> (696)..(3326)
<223> hUBE3a-2
<220>
<221> misc_特征
<222> (848)..(848)
<223> 突变
<220>
<221> misc_特征
<222> (893)..(893)
<223> 突变
<220>
<221> misc_特征
<222> (1097)..(1097)
<223> 突变
<220>
<221> misc_特征
<222> (1250)..(1250)
<223> 突变
<220>
<221> misc_特征
<222> (1262)..(1262)
<223> 突变
<220>
<221> misc_特征
<222> (1286)..(1286)
<223> 突变
<220>
<221> misc_特征
<222> (1352)..(1352)
<223> 突变SD/AS
<220>
<221> misc_特征
<222> (1784)..(1784)
<223> 突变
<220>
<221> misc_特征
<222> (1790)..(1790)
<223> 突变
<220>
<221> misc_特征
<222> (1835)..(1835)
<223> 突变
<220>
<221> misc_特征
<222> (1874)..(1874)
<223> 突变
<220>
<221> misc_特征
<222> (1883)..(1883)
<223> 突变
<220>
<221> misc_特征
<222> (2060)..(2060)
<223> 突变
<220>
<221> misc_特征
<222> (2132)..(2132)
<223> 突变
<220>
<221> misc_特征
<222> (2180)..(2180)
<223> 突变
<220>
<221> misc_特征
<222> (2363)..(2363)
<223> 突变
<220>
<221> misc_特征
<222> (2508)..(2508)
<223> 突变SD/AS
<220>
<221> misc_特征
<222> (2792)..(2792)
<223> 突变
<220>
<221> misc_特征
<222> (3026)..(3026)
<223> 突变
<220>
<221> misc_特征
<222> (3092)..(3092)
<223> 突变
<220>
<221> misc_特征
<222> (3125)..(3125)
<223> 突变SD/AS
<220>
<221> misc_特征
<222> (3221)..(3221)
<223> 突变
<220>
<221> misc_特征
<222> (3230)..(3230)
<223> 突变
<220>
<221> misc_特征
<222> (3299)..(3299)
<223> 突变
<220>
<221> misc_特征
<222> (3333)..(3354)
<223> miRNA183
<220>
<221> misc_特征
<222> (3359)..(3380)
<223> miRNA183
<220>
<221> misc_特征
<222> (3387)..(3408)
<223> miRNA183
<220>
<221> misc_特征
<222> (3415)..(3436)
<223> miRNA183
<220>
<221> polyA_信号
<222> (3448)..(3679)
<223> SV40 polyA
<220>
<221> 重复_区域
<222> (3744)..(3873)
<223> ITR
<400> 5
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240
gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300
ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360
aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420
ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480
tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540
gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600
ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660
gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg gag aag ctg cac cag 713
Met Glu Lys Leu His Gln
1 5
tgc tac tgg aag tct ggc gag cct cag agc gac gat atc gag gca agc 761
Cys Tyr Trp Lys Ser Gly Glu Pro Gln Ser Asp Asp Ile Glu Ala Ser
10 15 20
agg atg aag aga gca gca gcc aag cac ctg atc gag cgg tac tat cac 809
Arg Met Lys Arg Ala Ala Ala Lys His Leu Ile Glu Arg Tyr Tyr His
25 30 35
cag ctg acc gag ggc tgc gga aac gag gcc tgt aca aac gag ttc tgc 857
Gln Leu Thr Glu Gly Cys Gly Asn Glu Ala Cys Thr Asn Glu Phe Cys
40 45 50
gcc tcc tgt cca acc ttt ctg aga atg gat aac aac gcc gcc gcc atc 905
Ala Ser Cys Pro Thr Phe Leu Arg Met Asp Asn Asn Ala Ala Ala Ile
55 60 65 70
aag gcc ctg gag ctg tac aag atc aac gcc aag ctg tgc gac ccc cac 953
Lys Ala Leu Glu Leu Tyr Lys Ile Asn Ala Lys Leu Cys Asp Pro His
75 80 85
cct tct aag aag ggc gcc agc tcc gcc tat ctg gag aac agc aag ggc 1001
Pro Ser Lys Lys Gly Ala Ser Ser Ala Tyr Leu Glu Asn Ser Lys Gly
90 95 100
gcc ccc aac aat agc tgt tcc gag atc aag atg aat aag aag ggc gcc 1049
Ala Pro Asn Asn Ser Cys Ser Glu Ile Lys Met Asn Lys Lys Gly Ala
105 110 115
agg atc gat ttc aag gac gtg acc tac ctg aca gag gag aag gtg tac 1097
Arg Ile Asp Phe Lys Asp Val Thr Tyr Leu Thr Glu Glu Lys Val Tyr
120 125 130
gag atc ctg gag ctg tgc cgg gag aga gag gat tac tcc cct ctg atc 1145
Glu Ile Leu Glu Leu Cys Arg Glu Arg Glu Asp Tyr Ser Pro Leu Ile
135 140 145 150
aga gtg atc gga cgc gtg ttc tct agc gcc gag gcc ctg gtg cag agc 1193
Arg Val Ile Gly Arg Val Phe Ser Ser Ala Glu Ala Leu Val Gln Ser
155 160 165
ttt cgc aag gtg aag cag cac aca aag gag gag ctg aag tcc ctg cag 1241
Phe Arg Lys Val Lys Gln His Thr Lys Glu Glu Leu Lys Ser Leu Gln
170 175 180
gcc aag gac gag gac aag gac gag gac gag aag gag aag gca gct tgt 1289
Ala Lys Asp Glu Asp Lys Asp Glu Asp Glu Lys Glu Lys Ala Ala Cys
185 190 195
tcc gcc gca gca atg gag gag gac tct gag gcc tcc tct agc agg atc 1337
Ser Ala Ala Ala Met Glu Glu Asp Ser Glu Ala Ser Ser Ser Arg Ile
200 205 210
ggc gat tcc tct caa ggc gac aac aat ctg cag aag ctg ggc ccc gac 1385
Gly Asp Ser Ser Gln Gly Asp Asn Asn Leu Gln Lys Leu Gly Pro Asp
215 220 225 230
gac gtg agc gtg gat atc gac gcc atc cgg aga gtg tac aca cgc ctg 1433
Asp Val Ser Val Asp Ile Asp Ala Ile Arg Arg Val Tyr Thr Arg Leu
235 240 245
ctg tct aac gag aag atc gag acc gcc ttc ctg aac gcc ctg gtg tat 1481
Leu Ser Asn Glu Lys Ile Glu Thr Ala Phe Leu Asn Ala Leu Val Tyr
250 255 260
ctg tct cct aat gtg gag tgc gat ctg acc tac cac aac gtg tac agc 1529
Leu Ser Pro Asn Val Glu Cys Asp Leu Thr Tyr His Asn Val Tyr Ser
265 270 275
cgg gac cca aac tac ctg aat ctg ttc atc atc gtg atg gag aac aga 1577
Arg Asp Pro Asn Tyr Leu Asn Leu Phe Ile Ile Val Met Glu Asn Arg
280 285 290
aat ctg cac tct ccc gag tat ctg gag atg gcc ctg cct ctg ttt tgt 1625
Asn Leu His Ser Pro Glu Tyr Leu Glu Met Ala Leu Pro Leu Phe Cys
295 300 305 310
aag gcc atg agc aag ctg cca ctg gca gca cag ggc aag ctg atc agg 1673
Lys Ala Met Ser Lys Leu Pro Leu Ala Ala Gln Gly Lys Leu Ile Arg
315 320 325
ctg tgg tcc aag tac aac gcc gat cag atc agg cgc atg atg gag acc 1721
Leu Trp Ser Lys Tyr Asn Ala Asp Gln Ile Arg Arg Met Met Glu Thr
330 335 340
ttc cag cag ctg atc aca tat aaa gtg atc tcc aac gag ttt aat tct 1769
Phe Gln Gln Leu Ile Thr Tyr Lys Val Ile Ser Asn Glu Phe Asn Ser
345 350 355
aga aac ctg gtg aac gac gac gac gcc atc gtg gcc gcc agc aag tgc 1817
Arg Asn Leu Val Asn Asp Asp Asp Ala Ile Val Ala Ala Ser Lys Cys
360 365 370
ctg aag atg gtg tac tac gcc aac gtg gtg ggc ggc gag gtg gac aca 1865
Leu Lys Met Val Tyr Tyr Ala Asn Val Val Gly Gly Glu Val Asp Thr
375 380 385 390
aac cac aac gag gag gac gac gag gag cca atc ccc gag agc tcc gag 1913
Asn His Asn Glu Glu Asp Asp Glu Glu Pro Ile Pro Glu Ser Ser Glu
395 400 405
ctg acc ctg cag gag ctg ctg gga gag gag cgg aga aat aag aag gga 1961
Leu Thr Leu Gln Glu Leu Leu Gly Glu Glu Arg Arg Asn Lys Lys Gly
410 415 420
cca agg gtg gat cct ctg gag acc gag ctg ggc gtg aag aca ctg gac 2009
Pro Arg Val Asp Pro Leu Glu Thr Glu Leu Gly Val Lys Thr Leu Asp
425 430 435
tgc aga aag cct ctg atc cca ttc gag gag ttt atc aac gag ccc ctg 2057
Cys Arg Lys Pro Leu Ile Pro Phe Glu Glu Phe Ile Asn Glu Pro Leu
440 445 450
aac gag gtg ctg gag atg gat aag gac tac acc ttc ttt aag gtg gag 2105
Asn Glu Val Leu Glu Met Asp Lys Asp Tyr Thr Phe Phe Lys Val Glu
455 460 465 470
aca gag aac aag ttc agc ttt atg acc tgt cct ttc atc ctg aac gcc 2153
Thr Glu Asn Lys Phe Ser Phe Met Thr Cys Pro Phe Ile Leu Asn Ala
475 480 485
gtg acc aag aat ctg ggc ctg tac tac gat aac agg atc cgc atg tac 2201
Val Thr Lys Asn Leu Gly Leu Tyr Tyr Asp Asn Arg Ile Arg Met Tyr
490 495 500
agc gag agg cgc atc acc gtg ctg tat tcc ctg gtg cag ggc cag cag 2249
Ser Glu Arg Arg Ile Thr Val Leu Tyr Ser Leu Val Gln Gly Gln Gln
505 510 515
ctg aat cct tac ctg agg ctg aag gtg cgg aga gac cac atc atc gat 2297
Leu Asn Pro Tyr Leu Arg Leu Lys Val Arg Arg Asp His Ile Ile Asp
520 525 530
gac gcc ctg gtg cgc ctg gag atg atc gcc atg gag aat cca gcc gat 2345
Asp Ala Leu Val Arg Leu Glu Met Ile Ala Met Glu Asn Pro Ala Asp
535 540 545 550
ctg aag aag cag ctg tac gtg gag ttt gag gga gag cag gga gtg gac 2393
Leu Lys Lys Gln Leu Tyr Val Glu Phe Glu Gly Glu Gln Gly Val Asp
555 560 565
gag gga ggc gtg tcc aag gag ttc ttt cag ctg gtg gtg gag gag atc 2441
Glu Gly Gly Val Ser Lys Glu Phe Phe Gln Leu Val Val Glu Glu Ile
570 575 580
ttc aac ccc gat atc ggc atg ttt acc tac gac gag tct aca aag ctg 2489
Phe Asn Pro Asp Ile Gly Met Phe Thr Tyr Asp Glu Ser Thr Lys Leu
585 590 595
ttc tgg ttt aat cct tct tcc ttc gag acc gag ggc cag ttt aca ctg 2537
Phe Trp Phe Asn Pro Ser Ser Phe Glu Thr Glu Gly Gln Phe Thr Leu
600 605 610
atc ggc atc gtg ctg ggc ctg gcc atc tac aac aat tgt atc ctg gac 2585
Ile Gly Ile Val Leu Gly Leu Ala Ile Tyr Asn Asn Cys Ile Leu Asp
615 620 625 630
gtg cac ttc cca atg gtg gtg tat agg aag ctg atg ggc aag aag ggc 2633
Val His Phe Pro Met Val Val Tyr Arg Lys Leu Met Gly Lys Lys Gly
635 640 645
acc ttt cgc gat ctg ggc gac agc cac ccc gtg ctg tac cag tcc ctg 2681
Thr Phe Arg Asp Leu Gly Asp Ser His Pro Val Leu Tyr Gln Ser Leu
650 655 660
aag gat ctg ctg gag tat gag ggc aac gtg gag gat gac atg atg atc 2729
Lys Asp Leu Leu Glu Tyr Glu Gly Asn Val Glu Asp Asp Met Met Ile
665 670 675
acc ttc cag atc tcc cag aca gac ctg ttt ggc aac cca atg atg tac 2777
Thr Phe Gln Ile Ser Gln Thr Asp Leu Phe Gly Asn Pro Met Met Tyr
680 685 690
gat ctg aag gag aac ggc gac aag atc ccc atc aca aac gag aat agg 2825
Asp Leu Lys Glu Asn Gly Asp Lys Ile Pro Ile Thr Asn Glu Asn Arg
695 700 705 710
aag gag ttc gtg aac ctg tac tct gat tat atc ctg aat aag agc gtg 2873
Lys Glu Phe Val Asn Leu Tyr Ser Asp Tyr Ile Leu Asn Lys Ser Val
715 720 725
gag aag cag ttc aag gcc ttt agg cgc ggc ttc cac atg gtg acc aac 2921
Glu Lys Gln Phe Lys Ala Phe Arg Arg Gly Phe His Met Val Thr Asn
730 735 740
gag tct cct ctg aag tat ctg ttt agg cca gag gag atc gag ctg ctg 2969
Glu Ser Pro Leu Lys Tyr Leu Phe Arg Pro Glu Glu Ile Glu Leu Leu
745 750 755
atc tgc ggc agc cgc aat ctg gac ttt cag gcc ctg gag gag acc aca 3017
Ile Cys Gly Ser Arg Asn Leu Asp Phe Gln Ala Leu Glu Glu Thr Thr
760 765 770
gag tac gac ggc ggc tat acc cgg gac tcc gtg ctg atc aga gag ttc 3065
Glu Tyr Asp Gly Gly Tyr Thr Arg Asp Ser Val Leu Ile Arg Glu Phe
775 780 785 790
tgg gag atc gtg cac tct ttt aca gac gag cag aag cgg ctg ttc ctg 3113
Trp Glu Ile Val His Ser Phe Thr Asp Glu Gln Lys Arg Leu Phe Leu
795 800 805
cag ttt acc acc ggc acc gac aga gca cca gtg gga gga ctg ggc aag 3161
Gln Phe Thr Thr Gly Thr Asp Arg Ala Pro Val Gly Gly Leu Gly Lys
810 815 820
ctg aag atg atc atc gcc aag aac ggc cca gac aca gag agg ctg ccc 3209
Leu Lys Met Ile Ile Ala Lys Asn Gly Pro Asp Thr Glu Arg Leu Pro
825 830 835
acc agc cac acc tgt ttc aac gtg ctg ctg ctg ccc gag tac tcc tct 3257
Thr Ser His Thr Cys Phe Asn Val Leu Leu Leu Pro Glu Tyr Ser Ser
840 845 850
aag gag aag ctg aag gag cgc ctg ctg aag gcc atc acc tac gcc aag 3305
Lys Glu Lys Leu Lys Glu Arg Leu Leu Lys Ala Ile Thr Tyr Ala Lys
855 860 865 870
ggc ttt ggc atg ctg tga tga ggtaccagtg aattctacca gtgccatagg 3356
Gly Phe Gly Met Leu
875
atagtgaatt ctaccagtgc catacacgtg agtgaattct accagtgcca tagcatgcag 3416
tgaattctac cagtgccata ggcggccgct tcgagcagac atgataagat acattgatga 3476
gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga 3536
tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg 3596
cattcatttt atgtttcagg ttcaggggga gatgtgggag gttttttaaa gcaagtaaaa 3656
cctctacaaa tgtggtaaaa tcgataagga tcttcctaga gcatggctac gtagataagt 3716
agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg gccactccct 3776
ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct 3836
ttgcccgggc ggcctcagtg agcgagcgag cgcgcag 3873
<210> 6
<211> 875
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 6
Met Glu Lys Leu His Gln Cys Tyr Trp Lys Ser Gly Glu Pro Gln Ser
1 5 10 15
Asp Asp Ile Glu Ala Ser Arg Met Lys Arg Ala Ala Ala Lys His Leu
20 25 30
Ile Glu Arg Tyr Tyr His Gln Leu Thr Glu Gly Cys Gly Asn Glu Ala
35 40 45
Cys Thr Asn Glu Phe Cys Ala Ser Cys Pro Thr Phe Leu Arg Met Asp
50 55 60
Asn Asn Ala Ala Ala Ile Lys Ala Leu Glu Leu Tyr Lys Ile Asn Ala
65 70 75 80
Lys Leu Cys Asp Pro His Pro Ser Lys Lys Gly Ala Ser Ser Ala Tyr
85 90 95
Leu Glu Asn Ser Lys Gly Ala Pro Asn Asn Ser Cys Ser Glu Ile Lys
100 105 110
Met Asn Lys Lys Gly Ala Arg Ile Asp Phe Lys Asp Val Thr Tyr Leu
115 120 125
Thr Glu Glu Lys Val Tyr Glu Ile Leu Glu Leu Cys Arg Glu Arg Glu
130 135 140
Asp Tyr Ser Pro Leu Ile Arg Val Ile Gly Arg Val Phe Ser Ser Ala
145 150 155 160
Glu Ala Leu Val Gln Ser Phe Arg Lys Val Lys Gln His Thr Lys Glu
165 170 175
Glu Leu Lys Ser Leu Gln Ala Lys Asp Glu Asp Lys Asp Glu Asp Glu
180 185 190
Lys Glu Lys Ala Ala Cys Ser Ala Ala Ala Met Glu Glu Asp Ser Glu
195 200 205
Ala Ser Ser Ser Arg Ile Gly Asp Ser Ser Gln Gly Asp Asn Asn Leu
210 215 220
Gln Lys Leu Gly Pro Asp Asp Val Ser Val Asp Ile Asp Ala Ile Arg
225 230 235 240
Arg Val Tyr Thr Arg Leu Leu Ser Asn Glu Lys Ile Glu Thr Ala Phe
245 250 255
Leu Asn Ala Leu Val Tyr Leu Ser Pro Asn Val Glu Cys Asp Leu Thr
260 265 270
Tyr His Asn Val Tyr Ser Arg Asp Pro Asn Tyr Leu Asn Leu Phe Ile
275 280 285
Ile Val Met Glu Asn Arg Asn Leu His Ser Pro Glu Tyr Leu Glu Met
290 295 300
Ala Leu Pro Leu Phe Cys Lys Ala Met Ser Lys Leu Pro Leu Ala Ala
305 310 315 320
Gln Gly Lys Leu Ile Arg Leu Trp Ser Lys Tyr Asn Ala Asp Gln Ile
325 330 335
Arg Arg Met Met Glu Thr Phe Gln Gln Leu Ile Thr Tyr Lys Val Ile
340 345 350
Ser Asn Glu Phe Asn Ser Arg Asn Leu Val Asn Asp Asp Asp Ala Ile
355 360 365
Val Ala Ala Ser Lys Cys Leu Lys Met Val Tyr Tyr Ala Asn Val Val
370 375 380
Gly Gly Glu Val Asp Thr Asn His Asn Glu Glu Asp Asp Glu Glu Pro
385 390 395 400
Ile Pro Glu Ser Ser Glu Leu Thr Leu Gln Glu Leu Leu Gly Glu Glu
405 410 415
Arg Arg Asn Lys Lys Gly Pro Arg Val Asp Pro Leu Glu Thr Glu Leu
420 425 430
Gly Val Lys Thr Leu Asp Cys Arg Lys Pro Leu Ile Pro Phe Glu Glu
435 440 445
Phe Ile Asn Glu Pro Leu Asn Glu Val Leu Glu Met Asp Lys Asp Tyr
450 455 460
Thr Phe Phe Lys Val Glu Thr Glu Asn Lys Phe Ser Phe Met Thr Cys
465 470 475 480
Pro Phe Ile Leu Asn Ala Val Thr Lys Asn Leu Gly Leu Tyr Tyr Asp
485 490 495
Asn Arg Ile Arg Met Tyr Ser Glu Arg Arg Ile Thr Val Leu Tyr Ser
500 505 510
Leu Val Gln Gly Gln Gln Leu Asn Pro Tyr Leu Arg Leu Lys Val Arg
515 520 525
Arg Asp His Ile Ile Asp Asp Ala Leu Val Arg Leu Glu Met Ile Ala
530 535 540
Met Glu Asn Pro Ala Asp Leu Lys Lys Gln Leu Tyr Val Glu Phe Glu
545 550 555 560
Gly Glu Gln Gly Val Asp Glu Gly Gly Val Ser Lys Glu Phe Phe Gln
565 570 575
Leu Val Val Glu Glu Ile Phe Asn Pro Asp Ile Gly Met Phe Thr Tyr
580 585 590
Asp Glu Ser Thr Lys Leu Phe Trp Phe Asn Pro Ser Ser Phe Glu Thr
595 600 605
Glu Gly Gln Phe Thr Leu Ile Gly Ile Val Leu Gly Leu Ala Ile Tyr
610 615 620
Asn Asn Cys Ile Leu Asp Val His Phe Pro Met Val Val Tyr Arg Lys
625 630 635 640
Leu Met Gly Lys Lys Gly Thr Phe Arg Asp Leu Gly Asp Ser His Pro
645 650 655
Val Leu Tyr Gln Ser Leu Lys Asp Leu Leu Glu Tyr Glu Gly Asn Val
660 665 670
Glu Asp Asp Met Met Ile Thr Phe Gln Ile Ser Gln Thr Asp Leu Phe
675 680 685
Gly Asn Pro Met Met Tyr Asp Leu Lys Glu Asn Gly Asp Lys Ile Pro
690 695 700
Ile Thr Asn Glu Asn Arg Lys Glu Phe Val Asn Leu Tyr Ser Asp Tyr
705 710 715 720
Ile Leu Asn Lys Ser Val Glu Lys Gln Phe Lys Ala Phe Arg Arg Gly
725 730 735
Phe His Met Val Thr Asn Glu Ser Pro Leu Lys Tyr Leu Phe Arg Pro
740 745 750
Glu Glu Ile Glu Leu Leu Ile Cys Gly Ser Arg Asn Leu Asp Phe Gln
755 760 765
Ala Leu Glu Glu Thr Thr Glu Tyr Asp Gly Gly Tyr Thr Arg Asp Ser
770 775 780
Val Leu Ile Arg Glu Phe Trp Glu Ile Val His Ser Phe Thr Asp Glu
785 790 795 800
Gln Lys Arg Leu Phe Leu Gln Phe Thr Thr Gly Thr Asp Arg Ala Pro
805 810 815
Val Gly Gly Leu Gly Lys Leu Lys Met Ile Ile Ala Lys Asn Gly Pro
820 825 830
Asp Thr Glu Arg Leu Pro Thr Ser His Thr Cys Phe Asn Val Leu Leu
835 840 845
Leu Pro Glu Tyr Ser Ser Lys Glu Lys Leu Lys Glu Arg Leu Leu Lys
850 855 860
Ala Ile Thr Tyr Ala Lys Gly Phe Gly Met Leu
865 870 875
<210> 7
<211> 3769
<212> DNA
<213> 人工序列
<220>
<223> 载体基因组hSyn.hUbe3a-2.GSco.SV40
<220>
<221> 重复_区域
<222> (1)..(130)
<223> ITR
<220>
<221> 启动子
<222> (213)..(678)
<223> 人突触蛋白启动子
<220>
<221> misc_特征
<222> (690)..(695)
<223> Kozak
<220>
<221> CDS
<222> (696)..(3326)
<223> hUBE3a-2
<220>
<221> misc_特征
<222> (848)..(848)
<223> 突变
<220>
<221> misc_特征
<222> (893)..(893)
<223> 突变
<220>
<221> misc_特征
<222> (1097)..(1097)
<223> 突变
<220>
<221> misc_特征
<222> (1250)..(1250)
<223> 突变
<220>
<221> misc_特征
<222> (1262)..(1262)
<223> 突变
<220>
<221> misc_特征
<222> (1286)..(1286)
<223> 突变
<220>
<221> misc_特征
<222> (1352)..(1352)
<223> 突变SD/AS
<220>
<221> misc_特征
<222> (1784)..(1784)
<223> 突变
<220>
<221> misc_特征
<222> (1790)..(1790)
<223> 突变
<220>
<221> misc_特征
<222> (1835)..(1835)
<223> 突变
<220>
<221> misc_特征
<222> (1874)..(1874)
<223> 突变
<220>
<221> misc_特征
<222> (1883)..(1883)
<223> 突变
<220>
<221> misc_特征
<222> (2060)..(2060)
<223> 突变
<220>
<221> misc_特征
<222> (2132)..(2132)
<223> 突变
<220>
<221> misc_特征
<222> (2180)..(2180)
<223> 突变
<220>
<221> misc_特征
<222> (2363)..(2363)
<223> 突变
<220>
<221> misc_特征
<222> (2508)..(2509)
<223> 突变SD/AS
<220>
<221> misc_特征
<222> (2792)..(2792)
<223> 突变
<220>
<221> misc_特征
<222> (3026)..(3026)
<223> 突变
<220>
<221> misc_特征
<222> (3092)..(3092)
<223> 突变
<220>
<221> misc_特征
<222> (3125)..(3125)
<223> 突变SD/AS
<220>
<221> misc_特征
<222> (3221)..(3221)
<223> 突变
<220>
<221> misc_特征
<222> (3230)..(3230)
<223> 突变
<220>
<221> misc_特征
<222> (3299)..(3299)
<223> 突变
<220>
<221> polyA_信号
<222> (3344)..(3757)
<223> SV40 polyA
<220>
<221> 重复_区域
<222> (3640)..(3769)
<223> ITR
<400> 7
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240
gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300
ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360
aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420
ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480
tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540
gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600
ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660
gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg gag aag ctg cac cag 713
Met Glu Lys Leu His Gln
1 5
tgc tac tgg aag tct ggc gag cct cag agc gac gat atc gag gca agc 761
Cys Tyr Trp Lys Ser Gly Glu Pro Gln Ser Asp Asp Ile Glu Ala Ser
10 15 20
agg atg aag aga gca gca gcc aag cac ctg atc gag cgg tac tat cac 809
Arg Met Lys Arg Ala Ala Ala Lys His Leu Ile Glu Arg Tyr Tyr His
25 30 35
cag ctg acc gag ggc tgc gga aac gag gcc tgt aca aac gag ttc tgc 857
Gln Leu Thr Glu Gly Cys Gly Asn Glu Ala Cys Thr Asn Glu Phe Cys
40 45 50
gcc tcc tgt cca acc ttt ctg aga atg gat aac aac gcc gcc gcc atc 905
Ala Ser Cys Pro Thr Phe Leu Arg Met Asp Asn Asn Ala Ala Ala Ile
55 60 65 70
aag gcc ctg gag ctg tac aag atc aac gcc aag ctg tgc gac ccc cac 953
Lys Ala Leu Glu Leu Tyr Lys Ile Asn Ala Lys Leu Cys Asp Pro His
75 80 85
cct tct aag aag ggc gcc agc tcc gcc tat ctg gag aac agc aag ggc 1001
Pro Ser Lys Lys Gly Ala Ser Ser Ala Tyr Leu Glu Asn Ser Lys Gly
90 95 100
gcc ccc aac aat agc tgt tcc gag atc aag atg aat aag aag ggc gcc 1049
Ala Pro Asn Asn Ser Cys Ser Glu Ile Lys Met Asn Lys Lys Gly Ala
105 110 115
agg atc gat ttc aag gac gtg acc tac ctg aca gag gag aag gtg tac 1097
Arg Ile Asp Phe Lys Asp Val Thr Tyr Leu Thr Glu Glu Lys Val Tyr
120 125 130
gag atc ctg gag ctg tgc cgg gag aga gag gat tac tcc cct ctg atc 1145
Glu Ile Leu Glu Leu Cys Arg Glu Arg Glu Asp Tyr Ser Pro Leu Ile
135 140 145 150
aga gtg atc gga cgc gtg ttc tct agc gcc gag gcc ctg gtg cag agc 1193
Arg Val Ile Gly Arg Val Phe Ser Ser Ala Glu Ala Leu Val Gln Ser
155 160 165
ttt cgc aag gtg aag cag cac aca aag gag gag ctg aag tcc ctg cag 1241
Phe Arg Lys Val Lys Gln His Thr Lys Glu Glu Leu Lys Ser Leu Gln
170 175 180
gcc aag gac gag gac aag gac gag gac gag aag gag aag gca gct tgt 1289
Ala Lys Asp Glu Asp Lys Asp Glu Asp Glu Lys Glu Lys Ala Ala Cys
185 190 195
tcc gcc gca gca atg gag gag gac tct gag gcc tcc tct agc agg atc 1337
Ser Ala Ala Ala Met Glu Glu Asp Ser Glu Ala Ser Ser Ser Arg Ile
200 205 210
ggc gat tcc tct caa ggc gac aac aat ctg cag aag ctg ggc ccc gac 1385
Gly Asp Ser Ser Gln Gly Asp Asn Asn Leu Gln Lys Leu Gly Pro Asp
215 220 225 230
gac gtg agc gtg gat atc gac gcc atc cgg aga gtg tac aca cgc ctg 1433
Asp Val Ser Val Asp Ile Asp Ala Ile Arg Arg Val Tyr Thr Arg Leu
235 240 245
ctg tct aac gag aag atc gag acc gcc ttc ctg aac gcc ctg gtg tat 1481
Leu Ser Asn Glu Lys Ile Glu Thr Ala Phe Leu Asn Ala Leu Val Tyr
250 255 260
ctg tct cct aat gtg gag tgc gat ctg acc tac cac aac gtg tac agc 1529
Leu Ser Pro Asn Val Glu Cys Asp Leu Thr Tyr His Asn Val Tyr Ser
265 270 275
cgg gac cca aac tac ctg aat ctg ttc atc atc gtg atg gag aac aga 1577
Arg Asp Pro Asn Tyr Leu Asn Leu Phe Ile Ile Val Met Glu Asn Arg
280 285 290
aat ctg cac tct ccc gag tat ctg gag atg gcc ctg cct ctg ttt tgt 1625
Asn Leu His Ser Pro Glu Tyr Leu Glu Met Ala Leu Pro Leu Phe Cys
295 300 305 310
aag gcc atg agc aag ctg cca ctg gca gca cag ggc aag ctg atc agg 1673
Lys Ala Met Ser Lys Leu Pro Leu Ala Ala Gln Gly Lys Leu Ile Arg
315 320 325
ctg tgg tcc aag tac aac gcc gat cag atc agg cgc atg atg gag acc 1721
Leu Trp Ser Lys Tyr Asn Ala Asp Gln Ile Arg Arg Met Met Glu Thr
330 335 340
ttc cag cag ctg atc aca tat aaa gtg atc tcc aac gag ttt aat tct 1769
Phe Gln Gln Leu Ile Thr Tyr Lys Val Ile Ser Asn Glu Phe Asn Ser
345 350 355
aga aac ctg gtg aac gac gac gac gcc atc gtg gcc gcc agc aag tgc 1817
Arg Asn Leu Val Asn Asp Asp Asp Ala Ile Val Ala Ala Ser Lys Cys
360 365 370
ctg aag atg gtg tac tac gcc aac gtg gtg ggc ggc gag gtg gac aca 1865
Leu Lys Met Val Tyr Tyr Ala Asn Val Val Gly Gly Glu Val Asp Thr
375 380 385 390
aac cac aac gag gag gac gac gag gag cca atc ccc gag agc tcc gag 1913
Asn His Asn Glu Glu Asp Asp Glu Glu Pro Ile Pro Glu Ser Ser Glu
395 400 405
ctg acc ctg cag gag ctg ctg gga gag gag cgg aga aat aag aag gga 1961
Leu Thr Leu Gln Glu Leu Leu Gly Glu Glu Arg Arg Asn Lys Lys Gly
410 415 420
cca agg gtg gat cct ctg gag acc gag ctg ggc gtg aag aca ctg gac 2009
Pro Arg Val Asp Pro Leu Glu Thr Glu Leu Gly Val Lys Thr Leu Asp
425 430 435
tgc aga aag cct ctg atc cca ttc gag gag ttt atc aac gag ccc ctg 2057
Cys Arg Lys Pro Leu Ile Pro Phe Glu Glu Phe Ile Asn Glu Pro Leu
440 445 450
aac gag gtg ctg gag atg gat aag gac tac acc ttc ttt aag gtg gag 2105
Asn Glu Val Leu Glu Met Asp Lys Asp Tyr Thr Phe Phe Lys Val Glu
455 460 465 470
aca gag aac aag ttc agc ttt atg acc tgt cct ttc atc ctg aac gcc 2153
Thr Glu Asn Lys Phe Ser Phe Met Thr Cys Pro Phe Ile Leu Asn Ala
475 480 485
gtg acc aag aat ctg ggc ctg tac tac gat aac agg atc cgc atg tac 2201
Val Thr Lys Asn Leu Gly Leu Tyr Tyr Asp Asn Arg Ile Arg Met Tyr
490 495 500
agc gag agg cgc atc acc gtg ctg tat tcc ctg gtg cag ggc cag cag 2249
Ser Glu Arg Arg Ile Thr Val Leu Tyr Ser Leu Val Gln Gly Gln Gln
505 510 515
ctg aat cct tac ctg agg ctg aag gtg cgg aga gac cac atc atc gat 2297
Leu Asn Pro Tyr Leu Arg Leu Lys Val Arg Arg Asp His Ile Ile Asp
520 525 530
gac gcc ctg gtg cgc ctg gag atg atc gcc atg gag aat cca gcc gat 2345
Asp Ala Leu Val Arg Leu Glu Met Ile Ala Met Glu Asn Pro Ala Asp
535 540 545 550
ctg aag aag cag ctg tac gtg gag ttt gag gga gag cag gga gtg gac 2393
Leu Lys Lys Gln Leu Tyr Val Glu Phe Glu Gly Glu Gln Gly Val Asp
555 560 565
gag gga ggc gtg tcc aag gag ttc ttt cag ctg gtg gtg gag gag atc 2441
Glu Gly Gly Val Ser Lys Glu Phe Phe Gln Leu Val Val Glu Glu Ile
570 575 580
ttc aac ccc gat atc ggc atg ttt acc tac gac gag tct aca aag ctg 2489
Phe Asn Pro Asp Ile Gly Met Phe Thr Tyr Asp Glu Ser Thr Lys Leu
585 590 595
ttc tgg ttt aat cct tct tcc ttc gag acc gag ggc cag ttt aca ctg 2537
Phe Trp Phe Asn Pro Ser Ser Phe Glu Thr Glu Gly Gln Phe Thr Leu
600 605 610
atc ggc atc gtg ctg ggc ctg gcc atc tac aac aat tgt atc ctg gac 2585
Ile Gly Ile Val Leu Gly Leu Ala Ile Tyr Asn Asn Cys Ile Leu Asp
615 620 625 630
gtg cac ttc cca atg gtg gtg tat agg aag ctg atg ggc aag aag ggc 2633
Val His Phe Pro Met Val Val Tyr Arg Lys Leu Met Gly Lys Lys Gly
635 640 645
acc ttt cgc gat ctg ggc gac agc cac ccc gtg ctg tac cag tcc ctg 2681
Thr Phe Arg Asp Leu Gly Asp Ser His Pro Val Leu Tyr Gln Ser Leu
650 655 660
aag gat ctg ctg gag tat gag ggc aac gtg gag gat gac atg atg atc 2729
Lys Asp Leu Leu Glu Tyr Glu Gly Asn Val Glu Asp Asp Met Met Ile
665 670 675
acc ttc cag atc tcc cag aca gac ctg ttt ggc aac cca atg atg tac 2777
Thr Phe Gln Ile Ser Gln Thr Asp Leu Phe Gly Asn Pro Met Met Tyr
680 685 690
gat ctg aag gag aac ggc gac aag atc ccc atc aca aac gag aat agg 2825
Asp Leu Lys Glu Asn Gly Asp Lys Ile Pro Ile Thr Asn Glu Asn Arg
695 700 705 710
aag gag ttc gtg aac ctg tac tct gat tat atc ctg aat aag agc gtg 2873
Lys Glu Phe Val Asn Leu Tyr Ser Asp Tyr Ile Leu Asn Lys Ser Val
715 720 725
gag aag cag ttc aag gcc ttt agg cgc ggc ttc cac atg gtg acc aac 2921
Glu Lys Gln Phe Lys Ala Phe Arg Arg Gly Phe His Met Val Thr Asn
730 735 740
gag tct cct ctg aag tat ctg ttt agg cca gag gag atc gag ctg ctg 2969
Glu Ser Pro Leu Lys Tyr Leu Phe Arg Pro Glu Glu Ile Glu Leu Leu
745 750 755
atc tgc ggc agc cgc aat ctg gac ttt cag gcc ctg gag gag acc aca 3017
Ile Cys Gly Ser Arg Asn Leu Asp Phe Gln Ala Leu Glu Glu Thr Thr
760 765 770
gag tac gac ggc ggc tat acc cgg gac tcc gtg ctg atc aga gag ttc 3065
Glu Tyr Asp Gly Gly Tyr Thr Arg Asp Ser Val Leu Ile Arg Glu Phe
775 780 785 790
tgg gag atc gtg cac tct ttt aca gac gag cag aag cgg ctg ttc ctg 3113
Trp Glu Ile Val His Ser Phe Thr Asp Glu Gln Lys Arg Leu Phe Leu
795 800 805
cag ttt acc acc ggc acc gac aga gca cca gtg gga gga ctg ggc aag 3161
Gln Phe Thr Thr Gly Thr Asp Arg Ala Pro Val Gly Gly Leu Gly Lys
810 815 820
ctg aag atg atc atc gcc aag aac ggc cca gac aca gag agg ctg ccc 3209
Leu Lys Met Ile Ile Ala Lys Asn Gly Pro Asp Thr Glu Arg Leu Pro
825 830 835
acc agc cac acc tgt ttc aac gtg ctg ctg ctg ccc gag tac tcc tct 3257
Thr Ser His Thr Cys Phe Asn Val Leu Leu Leu Pro Glu Tyr Ser Ser
840 845 850
aag gag aag ctg aag gag cgc ctg ctg aag gcc atc acc tac gcc aag 3305
Lys Glu Lys Leu Lys Glu Arg Leu Leu Lys Ala Ile Thr Tyr Ala Lys
855 860 865 870
ggc ttt ggc atg ctg tga tga ggtaccggcg gccgcttcga gcagacatga 3356
Gly Phe Gly Met Leu
875
taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 3416
tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 3476
ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggagatg tgggaggttt 3536
tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatcga taaggatctt cctagagcat 3596
ggctacgtag ataagtagca tggcgggtta atcattaact acaaggaacc cctagtgatg 3656
gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc 3716
gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cag 3769
<210> 8
<211> 875
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 8
Met Glu Lys Leu His Gln Cys Tyr Trp Lys Ser Gly Glu Pro Gln Ser
1 5 10 15
Asp Asp Ile Glu Ala Ser Arg Met Lys Arg Ala Ala Ala Lys His Leu
20 25 30
Ile Glu Arg Tyr Tyr His Gln Leu Thr Glu Gly Cys Gly Asn Glu Ala
35 40 45
Cys Thr Asn Glu Phe Cys Ala Ser Cys Pro Thr Phe Leu Arg Met Asp
50 55 60
Asn Asn Ala Ala Ala Ile Lys Ala Leu Glu Leu Tyr Lys Ile Asn Ala
65 70 75 80
Lys Leu Cys Asp Pro His Pro Ser Lys Lys Gly Ala Ser Ser Ala Tyr
85 90 95
Leu Glu Asn Ser Lys Gly Ala Pro Asn Asn Ser Cys Ser Glu Ile Lys
100 105 110
Met Asn Lys Lys Gly Ala Arg Ile Asp Phe Lys Asp Val Thr Tyr Leu
115 120 125
Thr Glu Glu Lys Val Tyr Glu Ile Leu Glu Leu Cys Arg Glu Arg Glu
130 135 140
Asp Tyr Ser Pro Leu Ile Arg Val Ile Gly Arg Val Phe Ser Ser Ala
145 150 155 160
Glu Ala Leu Val Gln Ser Phe Arg Lys Val Lys Gln His Thr Lys Glu
165 170 175
Glu Leu Lys Ser Leu Gln Ala Lys Asp Glu Asp Lys Asp Glu Asp Glu
180 185 190
Lys Glu Lys Ala Ala Cys Ser Ala Ala Ala Met Glu Glu Asp Ser Glu
195 200 205
Ala Ser Ser Ser Arg Ile Gly Asp Ser Ser Gln Gly Asp Asn Asn Leu
210 215 220
Gln Lys Leu Gly Pro Asp Asp Val Ser Val Asp Ile Asp Ala Ile Arg
225 230 235 240
Arg Val Tyr Thr Arg Leu Leu Ser Asn Glu Lys Ile Glu Thr Ala Phe
245 250 255
Leu Asn Ala Leu Val Tyr Leu Ser Pro Asn Val Glu Cys Asp Leu Thr
260 265 270
Tyr His Asn Val Tyr Ser Arg Asp Pro Asn Tyr Leu Asn Leu Phe Ile
275 280 285
Ile Val Met Glu Asn Arg Asn Leu His Ser Pro Glu Tyr Leu Glu Met
290 295 300
Ala Leu Pro Leu Phe Cys Lys Ala Met Ser Lys Leu Pro Leu Ala Ala
305 310 315 320
Gln Gly Lys Leu Ile Arg Leu Trp Ser Lys Tyr Asn Ala Asp Gln Ile
325 330 335
Arg Arg Met Met Glu Thr Phe Gln Gln Leu Ile Thr Tyr Lys Val Ile
340 345 350
Ser Asn Glu Phe Asn Ser Arg Asn Leu Val Asn Asp Asp Asp Ala Ile
355 360 365
Val Ala Ala Ser Lys Cys Leu Lys Met Val Tyr Tyr Ala Asn Val Val
370 375 380
Gly Gly Glu Val Asp Thr Asn His Asn Glu Glu Asp Asp Glu Glu Pro
385 390 395 400
Ile Pro Glu Ser Ser Glu Leu Thr Leu Gln Glu Leu Leu Gly Glu Glu
405 410 415
Arg Arg Asn Lys Lys Gly Pro Arg Val Asp Pro Leu Glu Thr Glu Leu
420 425 430
Gly Val Lys Thr Leu Asp Cys Arg Lys Pro Leu Ile Pro Phe Glu Glu
435 440 445
Phe Ile Asn Glu Pro Leu Asn Glu Val Leu Glu Met Asp Lys Asp Tyr
450 455 460
Thr Phe Phe Lys Val Glu Thr Glu Asn Lys Phe Ser Phe Met Thr Cys
465 470 475 480
Pro Phe Ile Leu Asn Ala Val Thr Lys Asn Leu Gly Leu Tyr Tyr Asp
485 490 495
Asn Arg Ile Arg Met Tyr Ser Glu Arg Arg Ile Thr Val Leu Tyr Ser
500 505 510
Leu Val Gln Gly Gln Gln Leu Asn Pro Tyr Leu Arg Leu Lys Val Arg
515 520 525
Arg Asp His Ile Ile Asp Asp Ala Leu Val Arg Leu Glu Met Ile Ala
530 535 540
Met Glu Asn Pro Ala Asp Leu Lys Lys Gln Leu Tyr Val Glu Phe Glu
545 550 555 560
Gly Glu Gln Gly Val Asp Glu Gly Gly Val Ser Lys Glu Phe Phe Gln
565 570 575
Leu Val Val Glu Glu Ile Phe Asn Pro Asp Ile Gly Met Phe Thr Tyr
580 585 590
Asp Glu Ser Thr Lys Leu Phe Trp Phe Asn Pro Ser Ser Phe Glu Thr
595 600 605
Glu Gly Gln Phe Thr Leu Ile Gly Ile Val Leu Gly Leu Ala Ile Tyr
610 615 620
Asn Asn Cys Ile Leu Asp Val His Phe Pro Met Val Val Tyr Arg Lys
625 630 635 640
Leu Met Gly Lys Lys Gly Thr Phe Arg Asp Leu Gly Asp Ser His Pro
645 650 655
Val Leu Tyr Gln Ser Leu Lys Asp Leu Leu Glu Tyr Glu Gly Asn Val
660 665 670
Glu Asp Asp Met Met Ile Thr Phe Gln Ile Ser Gln Thr Asp Leu Phe
675 680 685
Gly Asn Pro Met Met Tyr Asp Leu Lys Glu Asn Gly Asp Lys Ile Pro
690 695 700
Ile Thr Asn Glu Asn Arg Lys Glu Phe Val Asn Leu Tyr Ser Asp Tyr
705 710 715 720
Ile Leu Asn Lys Ser Val Glu Lys Gln Phe Lys Ala Phe Arg Arg Gly
725 730 735
Phe His Met Val Thr Asn Glu Ser Pro Leu Lys Tyr Leu Phe Arg Pro
740 745 750
Glu Glu Ile Glu Leu Leu Ile Cys Gly Ser Arg Asn Leu Asp Phe Gln
755 760 765
Ala Leu Glu Glu Thr Thr Glu Tyr Asp Gly Gly Tyr Thr Arg Asp Ser
770 775 780
Val Leu Ile Arg Glu Phe Trp Glu Ile Val His Ser Phe Thr Asp Glu
785 790 795 800
Gln Lys Arg Leu Phe Leu Gln Phe Thr Thr Gly Thr Asp Arg Ala Pro
805 810 815
Val Gly Gly Leu Gly Lys Leu Lys Met Ile Ile Ala Lys Asn Gly Pro
820 825 830
Asp Thr Glu Arg Leu Pro Thr Ser His Thr Cys Phe Asn Val Leu Leu
835 840 845
Leu Pro Glu Tyr Ser Ser Lys Glu Lys Leu Lys Glu Arg Leu Leu Lys
850 855 860
Ala Ile Thr Tyr Ala Lys Gly Phe Gly Met Leu
865 870 875
<210> 9
<211> 2562
<212> DNA
<213> 人工序列
<220>
<223> 核酸序列hUbe31a-1
<400> 9
atgaagaggg cagcagcaaa gcacctgatc gagagatact atcaccagct gaccgaggga 60
tgcggaaacg aggcatgtac aaacgagttc tgcgcctcct gtcccacctt tctgaggatg 120
gataacaacg ccgccgccat caaggccctg gagctgtaca agatcaacgc caagctgtgc 180
gacccccacc ctagcaagaa gggcgccagc tccgcctatc tggagaactc caagggcgcc 240
cctaacaata gctgttccga gatcaagatg aataagaagg gcgcccggat cgatttcaag 300
gacgtgacct acctgacaga ggagaaggtg tacgagatcc tggagctgtg ccgggagaga 360
gaggattaca gcccactgat cagagtgatc ggcagagtgt tctctagcgc cgaggccctg 420
gtgcagtcct ttagaaaggt gaagcagcac acaaaggagg agctgaagtc tctgcaggcc 480
aaggacgagg acaaggacga ggacgagaag gagaaggcag cctgttctgc cgcagcaatg 540
gaggaggaca gcgaggcatc ctctagccgg atcggcgatt cctctcaagg cgacaacaat 600
ctgcagaagc tgggccccga cgacgtgagc gtggatatcg acgccatccg gagagtgtac 660
acaagactgc tgagcaacga gaagatcgag accgccttcc tgaacgccct ggtgtatctg 720
agccctaatg tggagtgcga tctgacctac cacaacgtgt actcccggga cccaaactac 780
ctgaatctgt tcatcatcgt gatggagaac agaaatctgc actcccccga gtatctggag 840
atggccctgc ctctgttttg taaggccatg tccaagctgc ctctggcagc acagggcaag 900
ctgatcaggc tgtggtctaa gtacaacgcc gatcagatca ggcgcatgat ggagaccttc 960
cagcagctga tcacatacaa agtgatctct aacgagttta atagccgcaa cctggtgaac 1020
gacgacgacg ccatcgtggc cgcctctaag tgcctgaaga tggtgtacta cgccaacgtg 1080
gtgggcggcg aggtggacac aaaccacaac gaggaggacg acgaggagcc aatccccgag 1140
agctccgagc tgaccctgca ggagctgctg ggagaggagc ggagaaataa gaagggacca 1200
agggtggatc ctctggagac cgagctgggc gtgaagacac tggactgcag aaagcctctg 1260
atcccattcg aggagtttat caacgagccc ctgaacgagg tgctggagat ggataaggac 1320
tacaccttct ttaaggtgga gacagagaac aagttcagct ttatgacctg tcctttcatc 1380
ctgaacgccg tgaccaagaa tctgggcctg tactacgata acaggatccg catgtactcc 1440
gagaggcgca tcaccgtgct gtattctctg gtgcagggcc agcagctgaa tccttacctg 1500
aggctgaagg tgcggagaga ccacatcatc gatgacgccc tggtgcgcct ggagatgatc 1560
gccatggaga atccagccga tctgaagaag cagctgtacg tggagtttga gggagagcag 1620
ggagtggacg agggaggcgt gtctaaggag ttctttcagc tggtggtgga ggagatcttc 1680
aaccccgata tcggcatgtt tacctacgac gagagcacaa agctgttctg gtttaatcct 1740
tcttccttcg agaccgaggg ccagtttaca ctgatcggca tcgtgctggg cctggccatc 1800
tacaacaatt gtatcctgga cgtgcacttc ccaatggtgg tgtataggaa gctgatgggc 1860
aagaagggca cctttcgcga tctgggcgac tcccaccccg tgctgtacca gtctctgaag 1920
gatctgctgg agtatgaggg caacgtggag gatgacatga tgatcacctt ccagatctcc 1980
cagacagacc tgtttggcaa cccaatgatg tacgatctga aggagaacgg cgacaagatc 2040
cccatcacaa acgagaatag aaaggagttc gtgaacctgt acagcgatta tatcctgaat 2100
aagtccgtgg agaagcagtt caaggccttt aggcgcggct tccacatggt gaccaacgag 2160
agccctctga agtatctgtt taggccagag gagatcgagc tgctgatctg cggctcccgc 2220
aatctggact ttcaggccct ggaggagacc acagagtacg acggcggcta taccagggac 2280
tctgtgctga tccgcgagtt ctgggagatc gtgcacagct ttacagacga gcagaagcgg 2340
ctgttcctgc agtttaccac cggcaccgac agagcaccag tgggaggact gggcaagctg 2400
aagatgatca tcgccaagaa cggcccagac acagagaggc tgcccaccag ccacacctgt 2460
ttcaacgtgc tgctgctgcc cgagtactcc tctaaggaga agctgaagga gcgcctgctg 2520
aaggccatca cctacgccaa gggctttggc atgctgtgat ga 2562
<210> 10
<211> 2631
<212> DNA
<213> 人工序列
<220>
<223> 核酸序列hUbe3a-2
<400> 10
atggagaagc tgcaccagtg ctactggaag tctggcgagc ctcagagcga cgatatcgag 60
gcaagcagga tgaagagagc agcagccaag cacctgatcg agcggtacta tcaccagctg 120
accgagggct gcggaaacga ggcctgtaca aacgagttct gcgcctcctg tccaaccttt 180
ctgagaatgg ataacaacgc cgccgccatc aaggccctgg agctgtacaa gatcaacgcc 240
aagctgtgcg acccccaccc ttctaagaag ggcgccagct ccgcctatct ggagaacagc 300
aagggcgccc ccaacaatag ctgttccgag atcaagatga ataagaaggg cgccaggatc 360
gatttcaagg acgtgaccta cctgacagag gagaaggtgt acgagatcct ggagctgtgc 420
cgggagagag aggattactc ccctctgatc agagtgatcg gacgcgtgtt ctctagcgcc 480
gaggccctgg tgcagagctt tcgcaaggtg aagcagcaca caaaggagga gctgaagtcc 540
ctgcaggcca aggacgagga caaggacgag gacgagaagg agaaggcagc ttgttccgcc 600
gcagcaatgg aggaggactc tgaggcctcc tctagcagga tcggcgattc ctctcaaggc 660
gacaacaatc tgcagaagct gggccccgac gacgtgagcg tggatatcga cgccatccgg 720
agagtgtaca cacgcctgct gtctaacgag aagatcgaga ccgccttcct gaacgccctg 780
gtgtatctgt ctcctaatgt ggagtgcgat ctgacctacc acaacgtgta cagccgggac 840
ccaaactacc tgaatctgtt catcatcgtg atggagaaca gaaatctgca ctctcccgag 900
tatctggaga tggccctgcc tctgttttgt aaggccatga gcaagctgcc actggcagca 960
cagggcaagc tgatcaggct gtggtccaag tacaacgccg atcagatcag gcgcatgatg 1020
gagaccttcc agcagctgat cacatataaa gtgatctcca acgagtttaa ttctagaaac 1080
ctggtgaacg acgacgacgc catcgtggcc gccagcaagt gcctgaagat ggtgtactac 1140
gccaacgtgg tgggcggcga ggtggacaca aaccacaacg aggaggacga cgaggagcca 1200
atccccgaga gctccgagct gaccctgcag gagctgctgg gagaggagcg gagaaataag 1260
aagggaccaa gggtggatcc tctggagacc gagctgggcg tgaagacact ggactgcaga 1320
aagcctctga tcccattcga ggagtttatc aacgagcccc tgaacgaggt gctggagatg 1380
gataaggact acaccttctt taaggtggag acagagaaca agttcagctt tatgacctgt 1440
cctttcatcc tgaacgccgt gaccaagaat ctgggcctgt actacgataa caggatccgc 1500
atgtacagcg agaggcgcat caccgtgctg tattccctgg tgcagggcca gcagctgaat 1560
ccttacctga ggctgaaggt gcggagagac cacatcatcg atgacgccct ggtgcgcctg 1620
gagatgatcg ccatggagaa tccagccgat ctgaagaagc agctgtacgt ggagtttgag 1680
ggagagcagg gagtggacga gggaggcgtg tccaaggagt tctttcagct ggtggtggag 1740
gagatcttca accccgatat cggcatgttt acctacgacg agtctacaaa gctgttctgg 1800
tttaatcctt cttccttcga gaccgagggc cagtttacac tgatcggcat cgtgctgggc 1860
ctggccatct acaacaattg tatcctggac gtgcacttcc caatggtggt gtataggaag 1920
ctgatgggca agaagggcac ctttcgcgat ctgggcgaca gccaccccgt gctgtaccag 1980
tccctgaagg atctgctgga gtatgagggc aacgtggagg atgacatgat gatcaccttc 2040
cagatctccc agacagacct gtttggcaac ccaatgatgt acgatctgaa ggagaacggc 2100
gacaagatcc ccatcacaaa cgagaatagg aaggagttcg tgaacctgta ctctgattat 2160
atcctgaata agagcgtgga gaagcagttc aaggccttta ggcgcggctt ccacatggtg 2220
accaacgagt ctcctctgaa gtatctgttt aggccagagg agatcgagct gctgatctgc 2280
ggcagccgca atctggactt tcaggccctg gaggagacca cagagtacga cggcggctat 2340
acccgggact ccgtgctgat cagagagttc tgggagatcg tgcactcttt tacagacgag 2400
cagaagcggc tgttcctgca gtttaccacc ggcaccgaca gagcaccagt gggaggactg 2460
ggcaagctga agatgatcat cgccaagaac ggcccagaca cagagaggct gcccaccagc 2520
cacacctgtt tcaacgtgct gctgctgccc gagtactcct ctaaggagaa gctgaaggag 2580
cgcctgctga aggccatcac ctacgccaag ggctttggca tgctgtgatg a 2631
<210> 11
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> miRNA183靶序列
<400> 11
agtgaattct accagtgcca ta 22
<210> 12
<211> 466
<212> DNA
<213> 人工序列
<220>
<223> 人突触蛋白启动子
<400> 12
ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60
gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120
aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180
actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240
ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300
cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360
cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420
tcagtctgcg gtgggcagcg gaggagtcgt gtcgtgcctg agagcg 466
<210> 13
<211> 232
<212> DNA
<213> 人工序列
<220>
<223> SV40 polyA
<400> 13
cgagcagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180
atgtgggagg ttttttaaag caagtaaaac ctctacaaat gtggtaaaat cg 232
<210> 14
<211> 2211
<212> DNA
<213> 腺相关病毒hu68
<220>
<221> CDS
<222> (1)..(2211)
<223> AAVhu68衣壳
<400> 14
atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc agt 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gaa ggc att cgc gag tgg tgg gct ttg aaa cct gga gcc cct caa ccc 96
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
aag gca aat caa caa cat caa gac aac gct cgg ggt ctt gtg ctt ccg 144
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
ggt tac aaa tac ctt gga ccc ggc aac gga ctc gac aag ggg gag ccg 192
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gaa gca gac gcg gcg gcc ctc gag cac gac aag gcc tac gac 240
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctc aag gcc gga gac aac ccg tac ctc aag tac aac cac gcc 288
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
gac gcc gag ttc cag gag cgg ctc aaa gaa gat acg tct ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctc ggg cga gca gtc ttc cag gcc aaa aag agg ctt ctt gaa cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
ctt ggt ctg gtt gag gaa gcg gct aag acg gct cct gga aag aag agg 432
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
cct gta gag cag tct cct cag gaa ccg gac tcc tcc gtg ggt att ggc 480
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Val Gly Ile Gly
145 150 155 160
aaa tcg ggt gca cag ccc gct aaa aag aga ctc aat ttc ggt cag act 528
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
ggc gac aca gag tca gtc ccc gac cct caa cca atc gga gaa cct ccc 576
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
gca gcc ccc tca ggt gtg gga tct ctt aca atg gct tca ggt ggt ggc 624
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
gca cca gtg gca gac aat aac gaa ggt gcc gat gga gtg ggt agt tcc 672
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
tcg gga aat tgg cat tgc gat tcc caa tgg ctg ggg gac aga gtc atc 720
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aat cac ctc 768
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
tac aag caa atc tcc aac agc aca tct gga gga tct tca aat gac aac 816
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
gcc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac aga 864
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
ttc cac tgc cac ttc tca cca cgt gac tgg caa aga ctc atc aac aac 912
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
aac tgg gga ttc cgg cct aag cga ctc aac ttc aag ctc ttc aac att 960
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
cag gtc aaa gag gtt acg gac aac aat gga gtc aag acc atc gct aat 1008
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
aac ctt acc agc acg gtc cag gtc ttc acg gac tca gac tat cag ctc 1056
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
ccg tac gtg ctc ggg tcg gct cac gag ggc tgc ctc ccg ccg ttc cca 1104
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
gcg gac gtt ttc atg att cct cag tac ggg tat cta acg ctt aat gat 1152
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
gga agc caa gcc gtg ggt cgt tcg tcc ttt tac tgc ctg gaa tat ttc 1200
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
ccg tcg caa atg cta aga acg ggt aac aac ttc cag ttc agc tac gag 1248
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
ttt gag aac gta cct ttc cat agc agc tat gct cac agc caa agc ctg 1296
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
gac cga ctc atg aat cca ctc atc gac caa tac ttg tac tat ctc tca 1344
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
aag act att aac ggt tct gga cag aat caa caa acg cta aaa ttc agt 1392
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
gtg gcc gga ccc agc aac atg gct gtc cag gga aga aac tac ata cct 1440
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
gga ccc agc tac cga caa caa cgt gtc tca acc act gtg act caa aac 1488
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
aac aac agc gaa ttt gct tgg cct gga gct tct tct tgg gct ctc aat 1536
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
gga cgt aat agc ttg atg aat cct gga cct gct atg gcc agc cac aaa 1584
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
gaa gga gag gac cgt ttc ttt cct ttg tct gga tct tta att ttt ggc 1632
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
aaa caa gga act gga aga gac aac gtg gat gcg gac aaa gtc atg ata 1680
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
acc aac gaa gaa gaa att aaa act acc aac cca gta gca acg gag tcc 1728
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
tat gga caa gtg gcc aca aac cac cag agt gcc caa gca cag gcg cag 1776
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
acc ggc tgg gtt caa aac caa gga ata ctt ccg ggt atg gtt tgg cag 1824
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
gac aga gat gtg tac ctg caa gga ccc att tgg gcc aaa att cct cac 1872
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
acg gac ggc aac ttt cac cct tct ccg ctg atg gga ggg ttt gga atg 1920
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
aag cac ccg cct cct cag atc ctc atc aaa aac aca cct gta cct gcg 1968
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
gat cct cca acg gct ttc aac aag gac aag ctg aac tct ttc atc acc 2016
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
cag tat tct act ggc caa gtc agc gtg gag att gag tgg gag ctg cag 2064
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
aag gaa aac agc aag cgc tgg aac ccg gag atc cag tac act tcc aac 2112
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
tat tac aag tct aat aat gtt gaa ttt gct gtt aat act gaa ggt gtt 2160
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
tat tct gaa ccc cgc ccc att ggc acc aga tac ctg act cgt aat ctg 2208
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
taa 2211
<210> 15
<211> 736
<212> PRT
<213> 腺相关病毒hu68
<400> 15
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Val Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 16
<211> 2211
<212> DNA
<213> 腺相关病毒hu68
<400> 16
atggctgccg atggttatct tccagattgg ctcgaggaca acctcagtga aggcattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcggg gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacga agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgt gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtccccg accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcaaaga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgctaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta tggatacctc 1140
accctgaacg acggcagtca ggcggtgggc cgctcatcct tctactgcct ggagtacttc 1200
ccttcgcaga tgctgaggac tggcaacaac ttccagttca gctacgagtt cgagaacgtc 1260
cctttccaca gcagctacgc ccacagccag agtttggacc gcttgatgaa ccctctgatc 1320
gaccagtacc tgtactacct gtcaaagacg atcaacggtt ctggccagaa ccagcagacg 1380
ctgaagttca gcgtggccgg gcctagcaac atggccgtcc agggcagaaa ctacatccct 1440
gggcccagct accggcagca gagagtctca accactgtga ctcagaacaa caacagtgag 1500
ttcgcctggc ctggcgccag ctcttgggcc ctcaacggcc gcaactcgct gatgaaccca 1560
ggcccagcca tggccagtca caaggagggc gaggaccgtt tcttcccttt gtctggctct 1620
ctgatcttcg gcaagcaggg gaccggcaga gacaacgtgg acgcggacaa ggtcatgatc 1680
acgaacgagg aggagatcaa gaccaccaac cctgtggcaa ccgagtccta cggccaggtg 1740
gcaaccaacc accagagcgc ccaggcacag gcgcagactg gctgggtcca gaaccagggg 1800
atcctgcctg gcatggtgtg gcaggaccgt gacgtgtacc tgcagggccc tatctgggca 1860
aagatccctc acacggacgg caacttccac ccttctcctc tgatgggcgg cttcggcatg 1920
aagcacccgc ctcctcagat cctcatcaag aacactccgg tcccggcaga ccctccgacg 1980
gccttcaaca aggacaagct gaactcattc atcactcagt actccactgg ccaggtcagc 2040
gtggagatcg agtgggagct gcagaaggag aacagcaagc gttggaaccc agagatccag 2100
tacacttcca actactacaa gtctaacaac gtggagttcg ccgtcaacac tgagggtgtg 2160
tacagtgagc ctcgccctat cggcacccgg tacctcaccc gaaacttgtg a 2211
<210> 17
<211> 2211
<212> DNA
<213> 腺相关病毒rh.91
<220>
<221> CDS
<222> (1)..(2211)
<223> AAVrh.91衣壳
<400> 17
atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aaa ccc 96
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
ttt ggt ctg gtt gag gaa gca gct aag acg gct cct gga aag aaa cgt 432
Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
ccg gta gag cag tcg ccc caa gaa cca gac tcc tcc tcg ggc att ggc 480
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
aaa tca ggc cag cag ccc gcc aaa aag aga ctc aat ttc ggt cag act 528
Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
ggc gac tca gag tca gtc ccc gac cct caa cct ctc gga gaa cct cca 576
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
gaa acc ccc gct gct gtg gga cct act aca atg gct tca ggc ggt ggc 624
Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt aat gcc 672
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc atc 720
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
acc acc agc acc cga acc tgg gcc ctt cct acc tac aac aac cac ctc 768
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
tac aag caa atc tcc agc gct tca acg ggg gcc agt aac gac aac cac 816
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
tac ttt ggc tac agc acc ccc tgg ggg tat ttt gat ttc aac aga ttc 864
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
cac tgc cac ttc tca cca cgt gac tgg cag cga ctc att aac aac aac 912
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
tgg gga ttc cgg ccc aag aga ctc aac ttc aag ctc ttc aac atc cag 960
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
gtc aag gag gtc acg acg aat gat ggc gtc aca acc atc gct aat aac 1008
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
ctt acc agc acg gtt caa gtg ttc tcg gac tcg gag tac cag ctg ccg 1056
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
tac gtc ctc ggt tct gcg cac cag ggc tgc ctc cct ccg ttc ccg gcg 1104
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
gac gta ttc atg att cct cag tac ggc tac cta acg ctc aac aat ggc 1152
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
agc cag gcc gta gga cgt tca tcc ttt tat tgc ctg gaa tat ttc cca 1200
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
tct caa atg ctg aga acg ggc aac aac ttt acc ttc agc tac acc ttt 1248
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
gaa gat gtg cct ttc cac agc agt tac gcg cac agc cag agc ctg gac 1296
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
agg cta atg aat cct cta atc gac cag tac ctg tat tac cta aac aga 1344
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
act cag aat caa tcc gga agt gca caa aac aag gac ttg ctg ttt agc 1392
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
cgg ggg tct cca gct ggc atg tct gtt cag ccc aaa aac tgg cta ccc 1440
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
ggg ccc tgt tac cga cag cag cgt gtt tct aaa aca aaa aca gac aac 1488
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
aac aac agc aac ttt acc tgg act ggt gcc tcc aaa tac aat ctg aac 1536
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
gga cgt gaa tcc atc att aac cct ggc acc gct atg gca tcc cac aag 1584
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
gac gac gaa gac aaa ttt ttt ccc atg agc ggt gtt atg att ttt ggc 1632
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
aaa gaa aat gca gga gca tca aac act gca tta gac aat gtt atg att 1680
Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
aca gat gaa gag gaa att aaa gct acc aac ccc gtg gcc acc gag aga 1728
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
ttt gga act gtg gca gtc aat ctc caa agc agc aat aca gac cct gca 1776
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala
580 585 590
aca gga gac gtg cat gtc atg ggg gct tta cct ggc atg gtg tgg caa 1824
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
gac aga gac gtg tac ctg cag ggt ccc att tgg gcc aag att cct cac 1872
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
acg gat gga cac ttt cac ccg tct cct ctt atg ggc ggc ttt gga ctt 1920
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
aag cac ccg cct cct cag atc ctc atc aaa aac acg cct gtt cct gcg 1968
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
aat cct ccg gca gag ttt tcg gct aca aag ttt gct tca ttc atc acc 2016
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
cag tac tcc aca gga caa gtg agc gtg gaa att gaa tgg gag ctg cag 2064
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
aaa gaa aac agt aag cgc tgg aat cct gaa gtg cag tac acc tcc aac 2112
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
tac gcg aaa tct gcc aac gtt gat ttc act gtg gac aac aat gga ctt 2160
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
tat act gag cct cgc ccc att ggc acc cgt tac ctt acc cgt ccc ctt 2208
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
taa 2211
<210> 18
<211> 736
<212> PRT
<213> 腺相关病毒rh.91
<400> 18
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 19
<211> 2211
<212> DNA
<213> 腺相关病毒rh.91
<400> 19
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagcccct aaacccaaag cgaaccaaca aaagcaggac 120
gacggccggg gtcttgtgct tccgggttac aaatacctcg gacccttcaa cggactcgac 180
aaaggagagc cggtcaacgc ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240
cagcagctca aggccggtga caacccgtac ctccggtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga gggttcttga gccttttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcatcatc tggtattggc 480
aaatcgggcc agcagcctgc caaaaaaaga ctaaatttcg gtcagactgg cgactcagag 540
tcagtccccg accctcaacc tctcggagaa cctccagaaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacctg ggcccttcct acctacaaca accacctcta caagcaaatc 780
tccagcgctt caacgggggc cagtaacgac aaccactact ttggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc cacttctcac cacgtgactg gcagcgactc 900
attaacaaca actggggatt ccggcccaag agactcaact tcaagctctt caacatccag 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtgt tctcggactc ggagtaccag ctgccgtacg tcctcggttc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgta ttcatgattc ctcagtatgg atacctcacc 1140
ctgaacaacg gaagtcaagc ggtgggacgc tcatcctttt actgcctgga gtacttccct 1200
tcgcagatgc taaggactgg aaataacttc accttcagct ataccttcga ggatgtacct 1260
tttcacagca gctacgctca cagccagagt ttggatcgct tgatgaatcc tcttattgat 1320
cagtatctgt actacctgaa cagaacgcaa aatcaatctg gaagtgcaca aaacaaggac 1380
ctgcttttta gccgggggtc tcctgctggc atgtctgttc agcccaaaaa ttggctacct 1440
gggccctgct accggcaaca gagagtttca aagactaaaa cagacaacaa caacagtaac 1500
tttacctgga caggtgccag caaatataat ctcaatggcc gcgaatcgat cattaatcca 1560
ggaaccgcta tggccagtca caaggacgat gaagacaaat ttttccctat gagcggcgtt 1620
atgatatttg gcaaagaaaa tgcaggagca agtaacactg cattagataa tgtaatgatt 1680
acggatgaag aagagattaa agctaccaat cctgtggcaa cagagagatt tggaactgtg 1740
gcagtcaact tgcagagctc aaatacagac cccgcaactg gagacgtcca tgtcatgggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat cctcatcaaa aatactccgg taccggcaaa tcctccggca 1980
gagttcagcg ctacaaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agaggtgcag 2100
tacacttcca actacgcgaa gtctgccaat gtggacttta ctgtagacaa caatggtctt 2160
tatactgaac ctcgccctat tggaacccgg tatctcacac gacccttgta a 2211
<210> 20
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> miRNA182靶序列
<400> 20
agtgtgagtt ctaccattgc caaa 24
<210> 21
<211> 872
<212> PRT
<213> 人工序列
<220>
<223> hUBE3a同种型3氨基酸序列
<400> 21
Met Ala Thr Ala Cys Lys Arg Ser Gly Glu Pro Gln Ser Asp Asp Ile
1 5 10 15
Glu Ala Ser Arg Met Lys Arg Ala Ala Ala Lys His Leu Ile Glu Arg
20 25 30
Tyr Tyr His Gln Leu Thr Glu Gly Cys Gly Asn Glu Ala Cys Thr Asn
35 40 45
Glu Phe Cys Ala Ser Cys Pro Thr Phe Leu Arg Met Asp Asn Asn Ala
50 55 60
Ala Ala Ile Lys Ala Leu Glu Leu Tyr Lys Ile Asn Ala Lys Leu Cys
65 70 75 80
Asp Pro His Pro Ser Lys Lys Gly Ala Ser Ser Ala Tyr Leu Glu Asn
85 90 95
Ser Lys Gly Ala Pro Asn Asn Ser Cys Ser Glu Ile Lys Met Asn Lys
100 105 110
Lys Gly Ala Arg Ile Asp Phe Lys Asp Val Thr Tyr Leu Thr Glu Glu
115 120 125
Lys Val Tyr Glu Ile Leu Glu Leu Cys Arg Glu Arg Glu Asp Tyr Ser
130 135 140
Pro Leu Ile Arg Val Ile Gly Arg Val Phe Ser Ser Ala Glu Ala Leu
145 150 155 160
Val Gln Ser Phe Arg Lys Val Lys Gln His Thr Lys Glu Glu Leu Lys
165 170 175
Ser Leu Gln Ala Lys Asp Glu Asp Lys Asp Glu Asp Glu Lys Glu Lys
180 185 190
Ala Ala Cys Ser Ala Ala Ala Met Glu Glu Asp Ser Glu Ala Ser Ser
195 200 205
Ser Arg Ile Gly Asp Ser Ser Gln Gly Asp Asn Asn Leu Gln Lys Leu
210 215 220
Gly Pro Asp Asp Val Ser Val Asp Ile Asp Ala Ile Arg Arg Val Tyr
225 230 235 240
Thr Arg Leu Leu Ser Asn Glu Lys Ile Glu Thr Ala Phe Leu Asn Ala
245 250 255
Leu Val Tyr Leu Ser Pro Asn Val Glu Cys Asp Leu Thr Tyr His Asn
260 265 270
Val Tyr Ser Arg Asp Pro Asn Tyr Leu Asn Leu Phe Ile Ile Val Met
275 280 285
Glu Asn Arg Asn Leu His Ser Pro Glu Tyr Leu Glu Met Ala Leu Pro
290 295 300
Leu Phe Cys Lys Ala Met Ser Lys Leu Pro Leu Ala Ala Gln Gly Lys
305 310 315 320
Leu Ile Arg Leu Trp Ser Lys Tyr Asn Ala Asp Gln Ile Arg Arg Met
325 330 335
Met Glu Thr Phe Gln Gln Leu Ile Thr Tyr Lys Val Ile Ser Asn Glu
340 345 350
Phe Asn Ser Arg Asn Leu Val Asn Asp Asp Asp Ala Ile Val Ala Ala
355 360 365
Ser Lys Cys Leu Lys Met Val Tyr Tyr Ala Asn Val Val Gly Gly Glu
370 375 380
Val Asp Thr Asn His Asn Glu Glu Asp Asp Glu Glu Pro Ile Pro Glu
385 390 395 400
Ser Ser Glu Leu Thr Leu Gln Glu Leu Leu Gly Glu Glu Arg Arg Asn
405 410 415
Lys Lys Gly Pro Arg Val Asp Pro Leu Glu Thr Glu Leu Gly Val Lys
420 425 430
Thr Leu Asp Cys Arg Lys Pro Leu Ile Pro Phe Glu Glu Phe Ile Asn
435 440 445
Glu Pro Leu Asn Glu Val Leu Glu Met Asp Lys Asp Tyr Thr Phe Phe
450 455 460
Lys Val Glu Thr Glu Asn Lys Phe Ser Phe Met Thr Cys Pro Phe Ile
465 470 475 480
Leu Asn Ala Val Thr Lys Asn Leu Gly Leu Tyr Tyr Asp Asn Arg Ile
485 490 495
Arg Met Tyr Ser Glu Arg Arg Ile Thr Val Leu Tyr Ser Leu Val Gln
500 505 510
Gly Gln Gln Leu Asn Pro Tyr Leu Arg Leu Lys Val Arg Arg Asp His
515 520 525
Ile Ile Asp Asp Ala Leu Val Arg Leu Glu Met Ile Ala Met Glu Asn
530 535 540
Pro Ala Asp Leu Lys Lys Gln Leu Tyr Val Glu Phe Glu Gly Glu Gln
545 550 555 560
Gly Val Asp Glu Gly Gly Val Ser Lys Glu Phe Phe Gln Leu Val Val
565 570 575
Glu Glu Ile Phe Asn Pro Asp Ile Gly Met Phe Thr Tyr Asp Glu Ser
580 585 590
Thr Lys Leu Phe Trp Phe Asn Pro Ser Ser Phe Glu Thr Glu Gly Gln
595 600 605
Phe Thr Leu Ile Gly Ile Val Leu Gly Leu Ala Ile Tyr Asn Asn Cys
610 615 620
Ile Leu Asp Val His Phe Pro Met Val Val Tyr Arg Lys Leu Met Gly
625 630 635 640
Lys Lys Gly Thr Phe Arg Asp Leu Gly Asp Ser His Pro Val Leu Tyr
645 650 655
Gln Ser Leu Lys Asp Leu Leu Glu Tyr Glu Gly Asn Val Glu Asp Asp
660 665 670
Met Met Ile Thr Phe Gln Ile Ser Gln Thr Asp Leu Phe Gly Asn Pro
675 680 685
Met Met Tyr Asp Leu Lys Glu Asn Gly Asp Lys Ile Pro Ile Thr Asn
690 695 700
Glu Asn Arg Lys Glu Phe Val Asn Leu Tyr Ser Asp Tyr Ile Leu Asn
705 710 715 720
Lys Ser Val Glu Lys Gln Phe Lys Ala Phe Arg Arg Gly Phe His Met
725 730 735
Val Thr Asn Glu Ser Pro Leu Lys Tyr Leu Phe Arg Pro Glu Glu Ile
740 745 750
Glu Leu Leu Ile Cys Gly Ser Arg Asn Leu Asp Phe Gln Ala Leu Glu
755 760 765
Glu Thr Thr Glu Tyr Asp Gly Gly Tyr Thr Arg Asp Ser Val Leu Ile
770 775 780
Arg Glu Phe Trp Glu Ile Val His Ser Phe Thr Asp Glu Gln Lys Arg
785 790 795 800
Leu Phe Leu Gln Phe Thr Thr Gly Thr Asp Arg Ala Pro Val Gly Gly
805 810 815
Leu Gly Lys Leu Lys Met Ile Ile Ala Lys Asn Gly Pro Asp Thr Glu
820 825 830
Arg Leu Pro Thr Ser His Thr Cys Phe Asn Val Leu Leu Leu Pro Glu
835 840 845
Tyr Ser Ser Lys Glu Lys Leu Lys Glu Arg Leu Leu Lys Ala Ile Thr
850 855 860
Tyr Ala Lys Gly Phe Gly Met Leu
865 870
<210> 22
<211> 3398
<212> DNA
<213> 人工序列
<220>
<223> 表达盒hSyn.hUbe3a-1.GSco.4XmiRNA183.SV40
<220>
<221> 启动子
<222> (1)..(466)
<223> 人突触蛋白
<220>
<221> misc_特征
<222> (478)..(483)
<223> Kozak
<220>
<221> misc_特征
<222> (484)..(3045)
<223> UBE3A-1
<220>
<221> misc_特征
<222> (3052)..(3073)
<223> miRNA183
<220>
<221> misc_特征
<222> (3078)..(3099)
<223> miRNA183
<220>
<221> misc_特征
<222> (3106)..(3127)
<223> miRNA183
<220>
<221> misc_特征
<222> (3134)..(3155)
<223> miRNA183
<220>
<221> polyA_信号
<222> (3167)..(3398)
<223> SV40晚期polyA
<400> 22
ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60
gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120
aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180
actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240
ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300
cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360
cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420
tcagtctgcg gtgggcagcg gaggagtcgt gtcgtgcctg agagcgcagt cgaattcgcc 480
accatgaaga gggcagcagc aaagcacctg atcgagagat actatcacca gctgaccgag 540
ggatgcggaa acgaggcatg tacaaacgag ttctgcgcct cctgtcccac ctttctgagg 600
atggataaca acgccgccgc catcaaggcc ctggagctgt acaagatcaa cgccaagctg 660
tgcgaccccc accctagcaa gaagggcgcc agctccgcct atctggagaa ctccaagggc 720
gcccctaaca atagctgttc cgagatcaag atgaataaga agggcgcccg gatcgatttc 780
aaggacgtga cctacctgac agaggagaag gtgtacgaga tcctggagct gtgccgggag 840
agagaggatt acagcccact gatcagagtg atcggcagag tgttctctag cgccgaggcc 900
ctggtgcagt cctttagaaa ggtgaagcag cacacaaagg aggagctgaa gtctctgcag 960
gccaaggacg aggacaagga cgaggacgag aaggagaagg cagcctgttc tgccgcagca 1020
atggaggagg acagcgaggc atcctctagc cggatcggcg attcctctca aggcgacaac 1080
aatctgcaga agctgggccc cgacgacgtg agcgtggata tcgacgccat ccggagagtg 1140
tacacaagac tgctgagcaa cgagaagatc gagaccgcct tcctgaacgc cctggtgtat 1200
ctgagcccta atgtggagtg cgatctgacc taccacaacg tgtactcccg ggacccaaac 1260
tacctgaatc tgttcatcat cgtgatggag aacagaaatc tgcactcccc cgagtatctg 1320
gagatggccc tgcctctgtt ttgtaaggcc atgtccaagc tgcctctggc agcacagggc 1380
aagctgatca ggctgtggtc taagtacaac gccgatcaga tcaggcgcat gatggagacc 1440
ttccagcagc tgatcacata caaagtgatc tctaacgagt ttaatagccg caacctggtg 1500
aacgacgacg acgccatcgt ggccgcctct aagtgcctga agatggtgta ctacgccaac 1560
gtggtgggcg gcgaggtgga cacaaaccac aacgaggagg acgacgagga gccaatcccc 1620
gagagctccg agctgaccct gcaggagctg ctgggagagg agcggagaaa taagaaggga 1680
ccaagggtgg atcctctgga gaccgagctg ggcgtgaaga cactggactg cagaaagcct 1740
ctgatcccat tcgaggagtt tatcaacgag cccctgaacg aggtgctgga gatggataag 1800
gactacacct tctttaaggt ggagacagag aacaagttca gctttatgac ctgtcctttc 1860
atcctgaacg ccgtgaccaa gaatctgggc ctgtactacg ataacaggat ccgcatgtac 1920
tccgagaggc gcatcaccgt gctgtattct ctggtgcagg gccagcagct gaatccttac 1980
ctgaggctga aggtgcggag agaccacatc atcgatgacg ccctggtgcg cctggagatg 2040
atcgccatgg agaatccagc cgatctgaag aagcagctgt acgtggagtt tgagggagag 2100
cagggagtgg acgagggagg cgtgtctaag gagttctttc agctggtggt ggaggagatc 2160
ttcaaccccg atatcggcat gtttacctac gacgagagca caaagctgtt ctggtttaat 2220
ccttcttcct tcgagaccga gggccagttt acactgatcg gcatcgtgct gggcctggcc 2280
atctacaaca attgtatcct ggacgtgcac ttcccaatgg tggtgtatag gaagctgatg 2340
ggcaagaagg gcacctttcg cgatctgggc gactcccacc ccgtgctgta ccagtctctg 2400
aaggatctgc tggagtatga gggcaacgtg gaggatgaca tgatgatcac cttccagatc 2460
tcccagacag acctgtttgg caacccaatg atgtacgatc tgaaggagaa cggcgacaag 2520
atccccatca caaacgagaa tagaaaggag ttcgtgaacc tgtacagcga ttatatcctg 2580
aataagtccg tggagaagca gttcaaggcc tttaggcgcg gcttccacat ggtgaccaac 2640
gagagccctc tgaagtatct gtttaggcca gaggagatcg agctgctgat ctgcggctcc 2700
cgcaatctgg actttcaggc cctggaggag accacagagt acgacggcgg ctataccagg 2760
gactctgtgc tgatccgcga gttctgggag atcgtgcaca gctttacaga cgagcagaag 2820
cggctgttcc tgcagtttac caccggcacc gacagagcac cagtgggagg actgggcaag 2880
ctgaagatga tcatcgccaa gaacggccca gacacagaga ggctgcccac cagccacacc 2940
tgtttcaacg tgctgctgct gcccgagtac tcctctaagg agaagctgaa ggagcgcctg 3000
ctgaaggcca tcacctacgc caagggcttt ggcatgctgt gatgaggtac cagtgaattc 3060
taccagtgcc ataggatagt gaattctacc agtgccatac acgtgagtga attctaccag 3120
tgccatagca tgcagtgaat tctaccagtg ccataggcgg ccgcttcgag cagacatgat 3180
aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat 3240
ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt 3300
taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt 3360
ttaaagcaag taaaacctct acaaatgtgg taaaatcg 3398
<210> 23
<211> 3294
<212> DNA
<213> 人工序列
<220>
<223> 表达盒hSyn.hUbe3a-1.GSco.SV40
<220>
<221> 启动子
<222> (1)..(466)
<223> 人突触蛋白启动子
<220>
<221> misc_特征
<222> (478)..(483)
<223> Kozak
<220>
<221> misc_特征
<222> (484)..(3045)
<223> UBE3A-1
<220>
<221> polyA_信号
<222> (3063)..(3294)
<223> SV40晚期polyA
<400> 23
ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60
gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120
aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180
actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240
ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300
cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360
cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420
tcagtctgcg gtgggcagcg gaggagtcgt gtcgtgcctg agagcgcagt cgaattcgcc 480
accatgaaga gggcagcagc aaagcacctg atcgagagat actatcacca gctgaccgag 540
ggatgcggaa acgaggcatg tacaaacgag ttctgcgcct cctgtcccac ctttctgagg 600
atggataaca acgccgccgc catcaaggcc ctggagctgt acaagatcaa cgccaagctg 660
tgcgaccccc accctagcaa gaagggcgcc agctccgcct atctggagaa ctccaagggc 720
gcccctaaca atagctgttc cgagatcaag atgaataaga agggcgcccg gatcgatttc 780
aaggacgtga cctacctgac agaggagaag gtgtacgaga tcctggagct gtgccgggag 840
agagaggatt acagcccact gatcagagtg atcggcagag tgttctctag cgccgaggcc 900
ctggtgcagt cctttagaaa ggtgaagcag cacacaaagg aggagctgaa gtctctgcag 960
gccaaggacg aggacaagga cgaggacgag aaggagaagg cagcctgttc tgccgcagca 1020
atggaggagg acagcgaggc atcctctagc cggatcggcg attcctctca aggcgacaac 1080
aatctgcaga agctgggccc cgacgacgtg agcgtggata tcgacgccat ccggagagtg 1140
tacacaagac tgctgagcaa cgagaagatc gagaccgcct tcctgaacgc cctggtgtat 1200
ctgagcccta atgtggagtg cgatctgacc taccacaacg tgtactcccg ggacccaaac 1260
tacctgaatc tgttcatcat cgtgatggag aacagaaatc tgcactcccc cgagtatctg 1320
gagatggccc tgcctctgtt ttgtaaggcc atgtccaagc tgcctctggc agcacagggc 1380
aagctgatca ggctgtggtc taagtacaac gccgatcaga tcaggcgcat gatggagacc 1440
ttccagcagc tgatcacata caaagtgatc tctaacgagt ttaatagccg caacctggtg 1500
aacgacgacg acgccatcgt ggccgcctct aagtgcctga agatggtgta ctacgccaac 1560
gtggtgggcg gcgaggtgga cacaaaccac aacgaggagg acgacgagga gccaatcccc 1620
gagagctccg agctgaccct gcaggagctg ctgggagagg agcggagaaa taagaaggga 1680
ccaagggtgg atcctctgga gaccgagctg ggcgtgaaga cactggactg cagaaagcct 1740
ctgatcccat tcgaggagtt tatcaacgag cccctgaacg aggtgctgga gatggataag 1800
gactacacct tctttaaggt ggagacagag aacaagttca gctttatgac ctgtcctttc 1860
atcctgaacg ccgtgaccaa gaatctgggc ctgtactacg ataacaggat ccgcatgtac 1920
tccgagaggc gcatcaccgt gctgtattct ctggtgcagg gccagcagct gaatccttac 1980
ctgaggctga aggtgcggag agaccacatc atcgatgacg ccctggtgcg cctggagatg 2040
atcgccatgg agaatccagc cgatctgaag aagcagctgt acgtggagtt tgagggagag 2100
cagggagtgg acgagggagg cgtgtctaag gagttctttc agctggtggt ggaggagatc 2160
ttcaaccccg atatcggcat gtttacctac gacgagagca caaagctgtt ctggtttaat 2220
ccttcttcct tcgagaccga gggccagttt acactgatcg gcatcgtgct gggcctggcc 2280
atctacaaca attgtatcct ggacgtgcac ttcccaatgg tggtgtatag gaagctgatg 2340
ggcaagaagg gcacctttcg cgatctgggc gactcccacc ccgtgctgta ccagtctctg 2400
aaggatctgc tggagtatga gggcaacgtg gaggatgaca tgatgatcac cttccagatc 2460
tcccagacag acctgtttgg caacccaatg atgtacgatc tgaaggagaa cggcgacaag 2520
atccccatca caaacgagaa tagaaaggag ttcgtgaacc tgtacagcga ttatatcctg 2580
aataagtccg tggagaagca gttcaaggcc tttaggcgcg gcttccacat ggtgaccaac 2640
gagagccctc tgaagtatct gtttaggcca gaggagatcg agctgctgat ctgcggctcc 2700
cgcaatctgg actttcaggc cctggaggag accacagagt acgacggcgg ctataccagg 2760
gactctgtgc tgatccgcga gttctgggag atcgtgcaca gctttacaga cgagcagaag 2820
cggctgttcc tgcagtttac caccggcacc gacagagcac cagtgggagg actgggcaag 2880
ctgaagatga tcatcgccaa gaacggccca gacacagaga ggctgcccac cagccacacc 2940
tgtttcaacg tgctgctgct gcccgagtac tcctctaagg agaagctgaa ggagcgcctg 3000
ctgaaggcca tcacctacgc caagggcttt ggcatgctgt gatgaggtac cggcggccgc 3060
ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt 3120
gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa 3180
gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg 3240
agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa atcg 3294
<210> 24
<211> 3467
<212> DNA
<213> 人工序列
<220>
<223> 表达盒hSyn.hUbe3a-2.GSco.4XmiRNA183.SV40
<220>
<221> 启动子
<222> (1)..(466)
<223> 人突触蛋白
<220>
<221> misc_特征
<222> (478)..(483)
<223> Kozak
<220>
<221> misc_特征
<222> (484)..(3114)
<223> hUBE3A-2
<220>
<221> misc_特征
<222> (3121)..(3142)
<223> miRNA183
<220>
<221> misc_特征
<222> (3147)..(3168)
<223> miRNA183
<220>
<221> misc_特征
<222> (3175)..(3196)
<223> miRNA183
<220>
<221> misc_特征
<222> (3203)..(3224)
<223> miRNA183
<220>
<221> polyA_信号
<222> (3236)..(3467)
<223> SV40晚期polyA
<400> 24
ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60
gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120
aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180
actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240
ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300
cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360
cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420
tcagtctgcg gtgggcagcg gaggagtcgt gtcgtgcctg agagcgcagt cgaattcgcc 480
accatggaga agctgcacca gtgctactgg aagtctggcg agcctcagag cgacgatatc 540
gaggcaagca ggatgaagag agcagcagcc aagcacctga tcgagcggta ctatcaccag 600
ctgaccgagg gctgcggaaa cgaggcctgt acaaacgagt tctgcgcctc ctgtccaacc 660
tttctgagaa tggataacaa cgccgccgcc atcaaggccc tggagctgta caagatcaac 720
gccaagctgt gcgaccccca cccttctaag aagggcgcca gctccgccta tctggagaac 780
agcaagggcg cccccaacaa tagctgttcc gagatcaaga tgaataagaa gggcgccagg 840
atcgatttca aggacgtgac ctacctgaca gaggagaagg tgtacgagat cctggagctg 900
tgccgggaga gagaggatta ctcccctctg atcagagtga tcggacgcgt gttctctagc 960
gccgaggccc tggtgcagag ctttcgcaag gtgaagcagc acacaaagga ggagctgaag 1020
tccctgcagg ccaaggacga ggacaaggac gaggacgaga aggagaaggc agcttgttcc 1080
gccgcagcaa tggaggagga ctctgaggcc tcctctagca ggatcggcga ttcctctcaa 1140
ggcgacaaca atctgcagaa gctgggcccc gacgacgtga gcgtggatat cgacgccatc 1200
cggagagtgt acacacgcct gctgtctaac gagaagatcg agaccgcctt cctgaacgcc 1260
ctggtgtatc tgtctcctaa tgtggagtgc gatctgacct accacaacgt gtacagccgg 1320
gacccaaact acctgaatct gttcatcatc gtgatggaga acagaaatct gcactctccc 1380
gagtatctgg agatggccct gcctctgttt tgtaaggcca tgagcaagct gccactggca 1440
gcacagggca agctgatcag gctgtggtcc aagtacaacg ccgatcagat caggcgcatg 1500
atggagacct tccagcagct gatcacatat aaagtgatct ccaacgagtt taattctaga 1560
aacctggtga acgacgacga cgccatcgtg gccgccagca agtgcctgaa gatggtgtac 1620
tacgccaacg tggtgggcgg cgaggtggac acaaaccaca acgaggagga cgacgaggag 1680
ccaatccccg agagctccga gctgaccctg caggagctgc tgggagagga gcggagaaat 1740
aagaagggac caagggtgga tcctctggag accgagctgg gcgtgaagac actggactgc 1800
agaaagcctc tgatcccatt cgaggagttt atcaacgagc ccctgaacga ggtgctggag 1860
atggataagg actacacctt ctttaaggtg gagacagaga acaagttcag ctttatgacc 1920
tgtcctttca tcctgaacgc cgtgaccaag aatctgggcc tgtactacga taacaggatc 1980
cgcatgtaca gcgagaggcg catcaccgtg ctgtattccc tggtgcaggg ccagcagctg 2040
aatccttacc tgaggctgaa ggtgcggaga gaccacatca tcgatgacgc cctggtgcgc 2100
ctggagatga tcgccatgga gaatccagcc gatctgaaga agcagctgta cgtggagttt 2160
gagggagagc agggagtgga cgagggaggc gtgtccaagg agttctttca gctggtggtg 2220
gaggagatct tcaaccccga tatcggcatg tttacctacg acgagtctac aaagctgttc 2280
tggtttaatc cttcttcctt cgagaccgag ggccagttta cactgatcgg catcgtgctg 2340
ggcctggcca tctacaacaa ttgtatcctg gacgtgcact tcccaatggt ggtgtatagg 2400
aagctgatgg gcaagaaggg cacctttcgc gatctgggcg acagccaccc cgtgctgtac 2460
cagtccctga aggatctgct ggagtatgag ggcaacgtgg aggatgacat gatgatcacc 2520
ttccagatct cccagacaga cctgtttggc aacccaatga tgtacgatct gaaggagaac 2580
ggcgacaaga tccccatcac aaacgagaat aggaaggagt tcgtgaacct gtactctgat 2640
tatatcctga ataagagcgt ggagaagcag ttcaaggcct ttaggcgcgg cttccacatg 2700
gtgaccaacg agtctcctct gaagtatctg tttaggccag aggagatcga gctgctgatc 2760
tgcggcagcc gcaatctgga ctttcaggcc ctggaggaga ccacagagta cgacggcggc 2820
tatacccggg actccgtgct gatcagagag ttctgggaga tcgtgcactc ttttacagac 2880
gagcagaagc ggctgttcct gcagtttacc accggcaccg acagagcacc agtgggagga 2940
ctgggcaagc tgaagatgat catcgccaag aacggcccag acacagagag gctgcccacc 3000
agccacacct gtttcaacgt gctgctgctg cccgagtact cctctaagga gaagctgaag 3060
gagcgcctgc tgaaggccat cacctacgcc aagggctttg gcatgctgtg atgaggtacc 3120
agtgaattct accagtgcca taggatagtg aattctacca gtgccataca cgtgagtgaa 3180
ttctaccagt gccatagcat gcagtgaatt ctaccagtgc cataggcggc cgcttcgagc 3240
agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa 3300
atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa 3360
taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg gggagatgtg 3420
ggaggttttt taaagcaagt aaaacctcta caaatgtggt aaaatcg 3467
<210> 25
<211> 3363
<212> DNA
<213> 人工序列
<220>
<223> 表达盒hSyn.hUbe3a-2.GSco.SV40
<220>
<221> 启动子
<222> (1)..(466)
<223> 人突触蛋白
<220>
<221> misc_特征
<222> (478)..(483)
<223> Kozak
<220>
<221> misc_特征
<222> (484)..(3114)
<223> hUBE3A-2
<220>
<221> polyA_信号
<222> (3132)..(3363)
<223> SV40 PolyA
<400> 25
ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60
gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120
aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180
actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240
ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300
cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360
cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420
tcagtctgcg gtgggcagcg gaggagtcgt gtcgtgcctg agagcgcagt cgaattcgcc 480
accatggaga agctgcacca gtgctactgg aagtctggcg agcctcagag cgacgatatc 540
gaggcaagca ggatgaagag agcagcagcc aagcacctga tcgagcggta ctatcaccag 600
ctgaccgagg gctgcggaaa cgaggcctgt acaaacgagt tctgcgcctc ctgtccaacc 660
tttctgagaa tggataacaa cgccgccgcc atcaaggccc tggagctgta caagatcaac 720
gccaagctgt gcgaccccca cccttctaag aagggcgcca gctccgccta tctggagaac 780
agcaagggcg cccccaacaa tagctgttcc gagatcaaga tgaataagaa gggcgccagg 840
atcgatttca aggacgtgac ctacctgaca gaggagaagg tgtacgagat cctggagctg 900
tgccgggaga gagaggatta ctcccctctg atcagagtga tcggacgcgt gttctctagc 960
gccgaggccc tggtgcagag ctttcgcaag gtgaagcagc acacaaagga ggagctgaag 1020
tccctgcagg ccaaggacga ggacaaggac gaggacgaga aggagaaggc agcttgttcc 1080
gccgcagcaa tggaggagga ctctgaggcc tcctctagca ggatcggcga ttcctctcaa 1140
ggcgacaaca atctgcagaa gctgggcccc gacgacgtga gcgtggatat cgacgccatc 1200
cggagagtgt acacacgcct gctgtctaac gagaagatcg agaccgcctt cctgaacgcc 1260
ctggtgtatc tgtctcctaa tgtggagtgc gatctgacct accacaacgt gtacagccgg 1320
gacccaaact acctgaatct gttcatcatc gtgatggaga acagaaatct gcactctccc 1380
gagtatctgg agatggccct gcctctgttt tgtaaggcca tgagcaagct gccactggca 1440
gcacagggca agctgatcag gctgtggtcc aagtacaacg ccgatcagat caggcgcatg 1500
atggagacct tccagcagct gatcacatat aaagtgatct ccaacgagtt taattctaga 1560
aacctggtga acgacgacga cgccatcgtg gccgccagca agtgcctgaa gatggtgtac 1620
tacgccaacg tggtgggcgg cgaggtggac acaaaccaca acgaggagga cgacgaggag 1680
ccaatccccg agagctccga gctgaccctg caggagctgc tgggagagga gcggagaaat 1740
aagaagggac caagggtgga tcctctggag accgagctgg gcgtgaagac actggactgc 1800
agaaagcctc tgatcccatt cgaggagttt atcaacgagc ccctgaacga ggtgctggag 1860
atggataagg actacacctt ctttaaggtg gagacagaga acaagttcag ctttatgacc 1920
tgtcctttca tcctgaacgc cgtgaccaag aatctgggcc tgtactacga taacaggatc 1980
cgcatgtaca gcgagaggcg catcaccgtg ctgtattccc tggtgcaggg ccagcagctg 2040
aatccttacc tgaggctgaa ggtgcggaga gaccacatca tcgatgacgc cctggtgcgc 2100
ctggagatga tcgccatgga gaatccagcc gatctgaaga agcagctgta cgtggagttt 2160
gagggagagc agggagtgga cgagggaggc gtgtccaagg agttctttca gctggtggtg 2220
gaggagatct tcaaccccga tatcggcatg tttacctacg acgagtctac aaagctgttc 2280
tggtttaatc cttcttcctt cgagaccgag ggccagttta cactgatcgg catcgtgctg 2340
ggcctggcca tctacaacaa ttgtatcctg gacgtgcact tcccaatggt ggtgtatagg 2400
aagctgatgg gcaagaaggg cacctttcgc gatctgggcg acagccaccc cgtgctgtac 2460
cagtccctga aggatctgct ggagtatgag ggcaacgtgg aggatgacat gatgatcacc 2520
ttccagatct cccagacaga cctgtttggc aacccaatga tgtacgatct gaaggagaac 2580
ggcgacaaga tccccatcac aaacgagaat aggaaggagt tcgtgaacct gtactctgat 2640
tatatcctga ataagagcgt ggagaagcag ttcaaggcct ttaggcgcgg cttccacatg 2700
gtgaccaacg agtctcctct gaagtatctg tttaggccag aggagatcga gctgctgatc 2760
tgcggcagcc gcaatctgga ctttcaggcc ctggaggaga ccacagagta cgacggcggc 2820
tatacccggg actccgtgct gatcagagag ttctgggaga tcgtgcactc ttttacagac 2880
gagcagaagc ggctgttcct gcagtttacc accggcaccg acagagcacc agtgggagga 2940
ctgggcaagc tgaagatgat catcgccaag aacggcccag acacagagag gctgcccacc 3000
agccacacct gtttcaacgt gctgctgctg cccgagtact cctctaagga gaagctgaag 3060
gagcgcctgc tgaaggccat cacctacgcc aagggctttg gcatgctgtg atgaggtacc 3120
ggcggccgct tcgagcagac atgataagat acattgatga gtttggacaa accacaacta 3180
gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct ttatttgtaa 3240
ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt atgtttcagg 3300
ttcaggggga gatgtgggag gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa 3360
tcg 3363

Claims (22)

1.一种组合物,其包含可用于治疗安格尔曼综合征(AS)的重组腺相关病毒(rAAV)的原种,所述rAAV包含AAV衣壳和包装在其中的载体基因组,所述载体基因组包含:
(a)AAV 5'反向末端重复序列(ITR);
(b)包含SEQ ID NO:9的UBE3A核酸序列或与其至少95%相同的编码UBE3A同种型1蛋白(SEQ ID NO:2)的序列,其中所述核酸序列可操作地连接到调控人细胞中UBE3A蛋白的表达的调控元件;
(c)直接表达(b)的UBE3A的调控元件;以及
(d)AAV 3'ITR。
2.根据权利要求1所述的组合物,其中所述调控元件包括神经元特异性启动子。
3.根据权利要求2所述的组合物,其中所述神经元特异性启动子是突触蛋白启动子。
4.根据权利要求3所述的组合物,其中所述突触蛋白启动子是具有SEQ ID NO:12的核酸序列的缩短的启动子。
5.根据权利要求1所述的组合物,其中所述调控元件包括组成型启动子。
6.根据权利要求1至5中任一项所述的组合物,其中所述调控元件进一步包括一种或多种增强子和一种或多种内含子。
7.根据权利要求1至6中任一项所述的组合物,其中所述调控序列进一步包括针对背根神经节中选自miR182和/或miR183的miR的一个或多个靶序列,所述靶序列可操作地连接到UBE3A核酸序列。
8.根据权利要求1至7所述的组合物,其中所述调控序列进一步包括针对背根神经节中选自miR182和/或miR183的miR的一个或多个靶序列,所述靶序列位于UBE3A核酸序列的下游。
9.根据权利要求1至8所述的组合物,其中所述调控序列进一步包括针对miR183的四个靶序列,所述靶序列位于所述UBE3A核酸序列的下游。
10.根据权利要求1至9所述的组合物,其中所述调控序列包括SEQ ID NO:11的四个拷贝。
11.根据权利要求1至10中任一项所述的组合物,其中所述AAV衣壳是AAVhu68衣壳。
12.根据权利要求1至10中任一项所述的组合物,其中所述AAV衣壳是由SEQ IDNO:14或SEQ ID NO:16的核酸序列的表达产生的AAVhu68衣壳。
13.根据权利要求1至10中任一项所述的组合物,其中所述AAV衣壳是AAVrh91衣壳。
14.根据权利要求1至10中任一项所述的组合物,其中所述AAV衣壳是由SEQ ID NO:17或SEQ ID NO:19的核酸序列的表达产生的AAVrh91衣壳。
15.根据权利要求1至14中任一项所述的组合物,其是进一步包含生理学上相容的载体、缓冲液、佐剂和/或稀释剂的水性悬浮液。
16.一种根据权利要求1至15中任一项所述的组合物,其用于治疗患有安格尔曼综合征的患者的用途。
17.一种根据权利要求1至15中任一项所述的组合物,其用于治疗安格尔曼综合征的一种或多种症状,任选地其中所述症状选自以下一者或多者:发育迟缓、智力残疾、严重语言障碍、共济失调和/或癫痫。
18.一种治疗安格尔曼综合征的方法,其包括向有此需要的患者施用根据权利要求1至15中任一项所述的组合物。
19.一种用于在具有神经元中的缺陷型UBE3A表达的患者中治疗安格尔曼综合征的一种或多种症状的方法,所述方法包括递送根据权利要求1至15中任一项所述的组合物。
20.根据权利要求18或19所述的方法,其中所述症状选自以下一者或多者:发育迟缓、智力残疾、严重语言障碍、共济失调和/或癫痫。
21.根据权利要求1至15中任一项所述的组合物、根据权利要求16或17所述的用途、或根据权利要求18至20所述的方法,其中所述组合物经鞘内递送给所述患者。
22.根据权利要求1至15中任一项所述的组合物、根据权利要求16或17所述的用途、或根据权利要求18至20所述的方法,其中所述患者被注射至少1x 1010至1x 1013GC/kg的所述rAAV。
CN202180085876.9A 2020-12-01 2021-12-01 组合物及其用于治疗安格尔曼综合征的用途 Pending CN116670159A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63/119860 2020-12-01
US202163179807P 2021-04-26 2021-04-26
US63/179807 2021-04-26
PCT/US2021/061346 WO2022119890A1 (en) 2020-12-01 2021-12-01 Compositions and uses thereof for treatment of angelman syndrome

Publications (1)

Publication Number Publication Date
CN116670159A true CN116670159A (zh) 2023-08-29

Family

ID=87726478

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180085876.9A Pending CN116670159A (zh) 2020-12-01 2021-12-01 组合物及其用于治疗安格尔曼综合征的用途

Country Status (1)

Country Link
CN (1) CN116670159A (zh)

Similar Documents

Publication Publication Date Title
JP7452953B2 (ja) 1色覚および他の疾患の治療のためのプロモーター、発現カセット、ベクター、キット、ならびに方法
AU2017202320B2 (en) Promoters, expression cassettes, vectors, kits, and methods for the treatment of achromatopsia and other diseases
KR102373765B1 (ko) 벡터 제조 및 유전자 전달을 위한 캡시드-결핍 aav 벡터, 조성물 및 방법
JP7384797B2 (ja) ムコ多糖症iiib型のための遺伝子療法
KR20220106852A (ko) 뇌 질환을 치료하기 위한 방법 및 조성물
CN111718947B (zh) 用于治疗ⅲa或ⅲb型粘多糖贮积症的腺相关病毒载体及用途
KR20200104307A (ko) 뮤코다당류증 iiia형에 대한 유전자 요법
CN112805382A (zh) 针对α-突触核蛋白的变体RNAi
CA3185281A1 (en) Compositions useful for treatment of charcot-marie-tooth disease
US20220370638A1 (en) Compositions and methods for treatment of maple syrup urine disease
CN113755524A (zh) 用于治疗脊髓性肌萎缩的腺相关病毒载体及其用途
CN115461066A (zh) 用于基因疗法的编码天冬氨酸酰化酶(aspa)的经修饰的核酸和载体
CN114127296A (zh) Ube3a基因和表达盒及其应用
CN116670159A (zh) 组合物及其用于治疗安格尔曼综合征的用途
KR20230128001A (ko) 엔젤만 증후군의 치료를 위한 조성물 및 이의 용도
WO2022261187A1 (en) Recombinant adeno-associated viruses for lesch-nyhan disorders and uses thereof
NZ753155B2 (en) Promoters, expression cassettes, vectors, kits, and methods for the treatment of achromatopsia and other diseases
NZ713958B2 (en) Promoters, expression cassettes, vectors, kits, and methods for the treatment of achromatopsia and other diseases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination