CN115715203A

CN115715203A - 对细胞进行基因修饰以递送治疗性蛋白质的方法

Info

Publication number: CN115715203A
Application number: CN202180042049.1A
Authority: CN
Inventors: 亚历山大·朱耶拉特; 菲利普·迪沙泰奥; 帕特里克·洪; 劳伦特·普瓦罗; 布莱恩·布瑟尔; 亚历克斯·博伊恩
Original assignee: Cellectis SA
Current assignee: Cellectis SA
Priority date: 2020-05-06
Filing date: 2021-05-06
Publication date: 2023-02-24
Also published as: US20230279440A1; JP2023525510A; WO2021224416A1; CA3177621A1; AU2021269103A1; EP4146284A1

Abstract

本公开提供了通过***人工外显子(ArtEx)对细胞进行基因修饰以便在特定细胞类型中递送治疗性蛋白质的方法，并且更特别地提供了用于将转基因表达到患者大脑的工程化细胞。

Description

对细胞进行基因修饰以递送治疗性蛋白质的方法

技术领域

本发明整体上涉及基因治疗领域，并且更具体地涉及遗传性基因疾病的治疗和预防。特别地，本公开提供了通过***人工外显子(ArtEx)对细胞进行基因修饰以便在特定细胞类型中递送治疗性蛋白质的方法，并且更特别地提供了用于将转基因表达到患者大脑的工程化的细胞。

背景技术

由于在通常编码酶的基因中的缺陷，先天性代谢错误是一大类单基因病症。这种遗传缺陷导致各种组织中未降解底物的积累，导致可变的临床表现，其通常会影响中枢神经***。这些疾病的护理标准(如果可用)通常涉及静脉内递送治疗性蛋白质。这可以改善病症，因为治疗性蛋白质被受影响的细胞所吸收，从而纠正了缺陷。这种在一个细胞中制造的基因产品(或以治疗方式递送)被受影响的细胞吸收以纠正缺陷的策略被称为交叉纠正。然而，治疗性地将蛋白质递送到血浆中并不能解决在这些患者中看到的神经***缺陷，因为该蛋白质不能穿过血脑屏障(或没有足够数量的蛋白质穿过血脑屏障)。因此，用于这些疾病的将治疗性蛋白质递送至血浆的任何治疗性策略，诸如静脉转移治疗性蛋白质或用基因疗法将肝脏或任何其它器官转换为治疗性蛋白质生产设施，将无法消散该疾病的神经症状。

因此，特别需要用于向大脑递送以治疗遗传性疾病的方法和治疗性组合物。

仅为提供信息目的而提供该背景信息。不一定承认且不应该解决任何前述信息构成针对本发明的现有技术。

发明内容

应当理解的是，上述对实施方式的一般描述以及下列详细描述均是示例性的，因此不限制实施方式的范围。

在一个方面，本发明提供了基因修饰的造血干细胞(HSC)，其包括在合适的基因座处共表达的治疗性基因产物，该合适的基因座在多种造血谱系中很活跃，诸如巨噬细胞，并且更特别地是填充大脑的组织驻留小胶质细胞。本文所描述的方法可以通过治疗性基因产物在髓***和来源于它的组织中的外源性表达来治疗患者。本发明特别有利的是，通过从造血谱系衍生出来的填充大脑的小胶质细胞，将健康等位基因交叉表达到大脑中，以获得有害等位基因的交叉纠正。

在另一方面，本发明依赖于使用可编程核酸酶(诸如转录激活器样效应物核酸酶(TALEN)、锌指核酸酶(ZFN)、簇状规则间隔的短回文重复序列(CRISPR)-Cas、大范围核酸酶和megaTAL(融合至大范围核酸酶的转录激活器样(TAL))加上用于该基因座的修复模板的递送对造血干细胞(HSC)或iPS细胞的离体修饰，修复模板提供有促进基因座的同源定向修复(HDR)的重组腺相关病毒(rAAV)。使用该策略，可以将修复模板DNA中编码的任何基因修饰并入在靶基因座处，包括并入治疗性基因产物，诸如互补DNA(cDNA)。在一些实施方式中，治疗性基因产物将受到靶基因座的调控控制并且促进造血细胞且特别是小胶质细胞中的表达。随后通过过继细胞转移或自体HSC移植将经修饰的细胞返回到患者。该方法将全身性递送治疗性基因产物以治疗身体，并且局部递送在大脑中以治疗疾病的全部症状。

在另一方面，本发明提供了一种将转基因表达到患者大脑中的方法，包括：

i)获得基因修饰的造血干细胞(HSC)，其中HSC分离自患者或者获自来源于患者并且分化成HSC的诱导多能干(iPS)细胞，其中基因修饰的HSC被工程化为包括整合在小胶质细胞中表达的基因座处的转基因；和

ii)将基因修饰的HSC移植到患者中，以使其分化为将转基因表达到患者大脑中的小胶质细胞。

i)获得基因修饰的造血干细胞(HSC)，其中HSC分离自相容供体或者获自来源于相容供体并且分化成HSC的诱导多能干(iPS)细胞，其中基因修饰的HSC被工程化为包括整合在小胶质细胞中表达的基因座处的转基因；

在另一方面，本发明提供了一种分离的HSC或iPS细胞，其具有整合在选自TMEM119、CD11B、B2m、CX3CR1或S100A9的基因座处的转基因，所述转基因受所述基因的内源性启动子的转录控制。在一些实施方式中，HSC或iPS细胞用于用作药物。在一些实施方式中，HSC或iPS细胞用于在治疗在与转基因同源的内源基因的表达方面有缺陷的患者中使用(交叉纠正)。在一些实施方式中，HSC或iPS细胞用于在溶酶体贮积病的治疗中使用。

在一些实施方式中，在小胶质细胞中表达的基因座选自由以下组成的组：TMEM119、S100A9、CD11B、B2m、Cx3cr1、MERTK、CD164、Tlr4、Tlr7、Cd14、Fcgr1a、Fcgr3a、TBXAS1、DOK3、ABCA1、TMEM195、MR1、CSF3R、FGD4、TSPAN14、TGFBRI、CCR5、GPR34、SERPINE2、SLCO2B1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfia4。在一些实施方式中，转基因的多个拷贝被整合在由2A自切割肽序列间隔开的同一基因座上。

作为独立的实施方式，本专利申请提供了一种将外源性编码序列整合到内源性内含子基因组区域的方法，优选地，其允许将所述外源性编码序列整合在所述基因组区域的第一内源性外显子和第二内源性外显子之间。在一些实施方式中，图2所示的该方法具有保留HSC的干性及其分化为各种骨髓细胞的能力的优点。在一些实施方式中，使用稀有切割核酸内切酶和/或病毒载体将转基因***到HSC或iPS细胞中。在一些实施方式中，病毒载体是AAV载体。该方法(也称为“ArtEx”)允许***人工外显子编码转基因(其置于内源性基因座的转录控制下)，优选地***到内含子序列中而不必使存在于所述基因座的内源性外显子的表达失活。

该方法更特别地包括以下步骤中的一个或多个：

-提供包括内源性内含子基因组区域的细胞，

-向所述细胞中引入包括外源性编码序列的多核苷酸模板，其中所述多核苷酸模板包括：

a)第一同源多核苷酸序列，其与***位点上游的内含子序列同源，

b)第一强剪接位点序列，其包括分支点和剪接受体；

c)编码2A自切割肽的第一序列；

d)编码目的蛋白质的外源序列；

e)编码2A自切割肽的第二序列；

f)第一外显子的编码序列的拷贝；

g)包括剪接供体的第二强剪接位点序列；和

h)第二同源多核苷酸序列，其与***位点下游的内含子序列同源；以及任选地

-诱导所述外源性多核苷酸整合到所述内含子序列中，优选地通过同源重组，以使所述外源性编码序列与第一外显子和优选第二外显子或其拷贝一起在所述内源性基因座上转录。

该方法特别有用于大量基因疾病(尤其是遗传性疾病)中缺陷性蛋白质表达的交叉纠正。

在一些实施方式中，转基因为用于治疗粘多糖病I型(Scheie、Hurler-Scheie或Hurler综合征)的IDUA。

在一些实施方式中，转基因为用于治疗粘多糖病II型(Hunter)的IDS。

在一些实施方式中，转基因为用于治疗粘多糖病VI型(Maroteaux-Lamy)的ARSB。

在一些实施方式中，转基因为用于治疗粘多糖病VII型(Sly)的GUSB。

在一些实施方式中，转基因为用于治疗X连锁肾上腺脑白质营养不良(X-linkedAdrenoleukodystrophy)的ABCD1。

在一些实施方式中，转基因为用于治疗球形细胞脑白质营养不良(Krabbe)的GALC。

在一些实施方式中，转基因为用于治疗异染性脑白质营养不良的ARSA。

在一些实施方式中，转基因为用于治疗戈谢病的GBA。

在一些实施方式中，转基因为用于治疗岩藻糖苷贮积症的FUCA1。

在一些实施方式中，转基因为用于治疗α-甘露糖苷过多症的MAN2B1。

在一些实施方式中，转基因为用于治疗天冬氨酰葡萄糖胺尿症的AGA。

在一些实施方式中，转基因为用于治疗Farber的ASAH1。

在一些实施方式中，转基因为用于治疗泰-萨克斯病(Tay-Sachs)的HEXA。

在一些实施方式中，转基因为用于治疗庞贝氏症(Pompe)的GAA。

在一些实施方式中，转基因为用于治疗尼曼匹克症(Niemann Pick)的SMPD1。

在一些实施方式中，转基因为用于治疗沃尔曼综合征的LIPA。

在一些实施方式中，转基因为用于CDKL5-缺陷相关疾病的CDKL5。

从以下的详细描述，本发明的其它目的(特别是载体、细胞及所得的细胞群)以及其它特征和优点将变得显而易见。然而，应当理解的是，详细描述和具体实施例(虽然指示了本发明的具体实施方式)仅以说明的方式给出，因为对于本领域技术人员而言，从该详细描述，在本发明精神和范围内的各种变化和修改均将变得显而易见。

附图说明

本领域技术人员将理解，以下描述的附图仅用于说明目的。附图不旨在以任何方式限制本教导的范围。

图1.将治疗性基因表达靶向包括小胶质细胞的髓***的体外基因治疗平台的示意图。

图2.根据本发明，为获得向包括小胶质细胞在内的组织驻留骨髓细胞的治疗性基因表达的一种基因编辑策略的示意图。所提出的策略靶向选定的内源性基因座的内含子序列(intronic sequence)，其中优选的基因座是TMEM119、MERTK、CD164、TLR7、CD14、FCGR3A(CD16)、TBXAS1、DOK3、ABCA1、TMEM195、TLR4、MR1、FCGR1A(CD64)、CSF3R、FGD4、TSPAN14、CXCR3、CD11B、S100A9和B2M。本申请中详细说明的该策略使得外源性治疗基因能够***到内源性内含子序列中，以在基因座处存在的内源性启动子的转录控制下，在骨髓细胞中转录和表达治疗性蛋白质。

图3.小胶质细胞中靶向基因座(TMEM119)的表达模式。将人类原代HSC移植到NBSGW小鼠中，以分化为人类小胶质细胞。将CD11b标志物用作确立的小胶质细胞特异性分化标志物。A：工程化细胞的3个重复(在CCR5基因座上，使用AAV作为多核苷酸模板和TALE-核酸酶作为稀有切割核酸内切酶位点定向***)。B：非工程化原代HSC。这些实验表明，根据本发明，人类HSC可有助于小胶质细胞在大脑中的周转以用作向大脑递送治疗性分子的载体。

图4.在工程化HSC细胞上进行的PCR实验。在CCR5基因座上***BFP报告基因。A：PCR阳性结果，显示转基因整合在预期基因座上。B：BFP流式细胞术测量结果显示基因组修饰率不影响表达，并且与骨髓特异性分化相关(CD14标志物)。

图5.在来自小鼠大脑匀浆的小胶质细胞中的表达模式。将CD11b标志物用作确立的小胶质细胞特异性分化标志物。A：CD11b/CCR5。B：将CD11B/F4-80用作对照。C：CD11b/CX3CR1。D：CD11b/TMEM119。结果显示，CX3CR1和TMEM119更加均匀地表达(TMEM119)或至少与F4-80的表达水平相当(CX3CR1)，因此表现为比CCR5更适合作为基因座，以在小胶质细胞中表达转基因，用于根据本发明的方法将治疗性多肽递送至大脑。

图6.通过靶向内含子序列获得治疗性基因在骨髓细胞中特异性表达的基因编辑策略的示意图。该策略具有的主要优点是其可以避免附带效应(collateral effect)(NHEJ事件)。

图7.实施例中描绘的实验设计的示意图。

图8.A.在CD11b或S100A9基因座上靶向整合GFP后，CD14hi HSC中GFP+细胞的百分比。B.在CD11b基因座上靶向整合GFP后，CD11b和GFP的CD14hi HSC的流式细胞术结果。C.在S100A9基因座上靶向整合GFP后，S110A9和GFP的CD14hi HSC的流式细胞术结果。

图9.在CD11b或S100A9基因座上靶向整合IDUA基因后，IDUA的量化结果。

图10.与未处理的(UT)细胞相比，在S100A9基因座上靶向整合GFP后，通过在血液(A)或在骨髓(B)中检测的人类细胞％年龄表征的嵌合性百分比。流式细胞术的示例通过对小鼠和人类CD45阳性细胞的量化显示了脾脏中的嵌合性。

图11.血液(A)或骨髓(B)中的hCD45+或hCD45和hCD33+细胞中S100A9基因座上GFP的靶向整合百分比。

图12.A.大脑中嵌合性的百分比(人类细胞的百分比)。B.在大脑中检测的人类细胞内小胶质细胞(P2RY12/TMEM119+细胞)的百分比。

图13.A.与未处理的HSC(对照)相比，在CD11b或S100A9基因座中通过HSC编辑的慢病毒载体或通过靶向人工外显子***增加的IDUA的表达。B.在移植经编辑的HSC后，在血液、脾脏、骨髓中检测到的人类细胞的嵌合性百分比。C.在大脑中人类细胞和人类小胶质细胞(TMEM119+和P2RY12+)的检测。

图14.用于在HSC或iPS中通过ArtEx***来治疗疾病的本发明方法的示意图，考虑了将转基因表达到不同的造血谱系中以在病理细胞类型中获得缺陷蛋白质的交叉纠正。HSC经离体工程化并且被注入到患者中。ArtEx是指通过基因靶向***将包括编码交叉纠正的蛋白质的序列的人工外显子引入到内源性基因座的内含子中，而不改变其它外显子在所述基因座的表达。该基因座因其在各自选定的细胞系或细胞类型(祖细胞、血液细胞、T细胞、B细胞、血小板、中性粒细胞、单核细胞……)中的表达而被选中。

具体实施方式

本文公开了用于将转基因表达到患者大脑中的方法。该方法包括获得基因修饰的造血干细胞(HSC)或iPS细胞(能够分化成HSC)，其中细胞包括编码治疗性蛋白质的转基因，该转基因至少在小胶质细胞中表达的基因座处整合在细胞中。该方法进一步包括将基因修饰的HSC移植到患者内，从而细胞分化成小胶质细胞并在患者大脑中表达治疗性蛋白质。造血干细胞或iPS细胞可以来自患者(自体方法)或来自供体(同种异体方法)。本发明可以被认为是将治疗性蛋白质递送到患者内以纠正基因疾病或病症(例如代谢疾病或溶酶体贮积病(LSD))的方法，其中患者表达蛋白质的缺陷拷贝。通过将编码功能性蛋白质的转基因靶向***至少在小胶质细胞中表达的基因座中来修饰细胞，从而治疗疾病。本发明的方法还允许将通过源自基因工程化HSC的小胶质细胞表达的治疗性蛋白质或酶递送至大脑解决遗传或非遗传起源的中枢神经***疾病。

治疗性蛋白质可以从小胶质细胞中分泌出，从而能够影响大脑中不具有对应于转基因的功能性蛋白质的其它细胞或被其它细胞吸收。本发明还提供了用于生产工程化HSC细胞的方法，该工程化HSC细胞产生高水平的治疗剂，其中将这些工程化细胞群引入患者内将提供治疗疾病或病症所需的蛋白质。

因此，本发明的方法和组合物可用于从转基因表达来自在小胶质细胞中表达的基因座的治疗上有益的蛋白质，以替代遗传性代谢疾病中缺陷的蛋白质，或将治疗性蛋白质或酶递送至大脑。例如，通过小胶质细胞可以向大脑中表达多巴脱羧酶[EC 4.1.1.28]，以将L-多巴转化为多巴胺，这缓解帕金森病的症状。

此外，本发明提供了通过将序列***到小胶质细胞中表达的基因座中来治疗这些疾病的方法和组合物。

在一些实施方式中，将转基因引入从患者或相容供体分离的HSC细胞中。在一些实施方式中，将转基因引入源自iPS细胞的HSC中，或者在iPS细胞分化成HSC之前将其引入iPS细胞。当HSC分化为小胶质细胞时，它们将表达治疗有效量的替代蛋白，以递送到大脑中的细胞。

现在将详细参考本发明的当前优选实施方式，其连同附图和以下实施例一起用于说明本发明的原理。这些实施方式足够详细地描述以使本领域技术人员能够实践本发明，并且应当理解的是，可以使用其它实施方式，并且在不背离本发明的精神和范围的情况下可以进行结构、生物和化学变化。除非另有定义，否则本文中使用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同含义。

除非另有说明，否则本发明的实践采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术，这些技术在本领域的技术范围内。文献中充分说明了这些技术。参见例如Sambrook et al.Molecular Cloning：A Laboratory Manual,2^ndedition(1989)；Current Protocols in Molecular Biology(F.M.Ausubel et al.eds.(1987))；the series Methods in Enzymology(Academic Press,Inc.)；PCR:A PracticalApproach(M.MacPherson et al.IRL Press at Oxford University Press(1991))；PCR2:A Practical Approach(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995))；Antibodies,A Laboratory Manual(Harlow and Lane eds.(1988))；Using Antibodies,ALaboratory Manual(Harlow and Lane eds.(1999))；和Animal Cell Culture(R.I.Freshney ed.(1987))。

除非本文特别定义，否则所使用的所有技术和科学术语具有与基因治疗、生物化学、遗传学、免疫学、癌症和分子生物学领域中技术人员通常理解的相同含义。分子生物学中常用术语的定义可参见例如Benjamin Lewin,Genes VII,published by OxfordUniversity Press,2000(ISBN 019879276X)；Kendrew et al.(eds.)；The Encyclopediaof Molecular Biology,published by Blackwell Publishers,1994(ISBN 0632021829)；和Robert A.Meyers(ed.),Molecular Biology and Biotechnology：a ComprehensiveDesk Reference,published by Wiley,John&Sons,Inc.,1995(ISBN 0471186341)。

为了解释本说明书的目的，将适用以下定义，并且在适当时，以单数形式使用的术语也将包括复数，反之亦然。如果下文提出的任何定义与该词在任何其它文献(包括通过引用并入本文的任何文献)中的使用相冲突，则出于解释本说明书及其相关权利要求的目的，下文提出的定义应始终优先，除非明确指示相反含义(例如在最初使用该术语的文献中)。除非另有说明，否则使用的“或”是指“和/或”。如在说明书和权利要求书中使用的单数形式“一个(a)”、“一种(an)”和“该(the)”包括复数引用，除非上下文另有明确规定。例如，术语“一个细胞”包括多个细胞，包括它们的混合物。使用的“包括(comprise)”、“包含(comprises)”、“含有(comprising)”、“包括(include)”、“包含(includes)”和“含有(including)”是可互换的，并且不旨在限制。此外，在一个或多个实施方式的描述使用术语“包括”的情况下，本领域技术人员将理解，在一些特定情况下，一个或多个实施方式可以替代地使用“基本上由……组成”和/或“由……组成”来描述。

如本文所用，术语“约”是指与其一起使用的数字的数值的加或减10％。

如本文所用，术语“造血干细胞”(或“HSC”)是指具有自我更新并分化为包括多样谱系的成熟血细胞的能力的未成熟血细胞，多样谱系包括但不限于粒细胞(例如早幼粒细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞)、红细胞(例如网织红细胞、红细胞)、凝血细胞(例如原巨核细胞、产生血小板的巨核细胞、血小板)、单核细胞(例如单核细胞、巨噬细胞)、树突细胞、小胶质细胞、破骨细胞和淋巴细胞(例如NK细胞、B细胞和T细胞)。本领域已知此类细胞可能包括或可能不包括CD34+细胞。CD34+细胞是表达CD34细胞表面标志物的未成熟细胞。在人类中，CD34+细胞被认为包括具有上述干细胞特性的细胞亚群，而在小鼠中，HSC是CD34-。此外，HSC还指长期重新填充HSC(LT-HSC)和短期重新填充HSC(ST-HSC)。LT-HSC和ST-HSC根据功能潜力和细胞表面标志物表达进行区分。例如，在一些实施方式中，人类HSC是CD34+、CD38-、CD45RA-、CD90+、CD49F+和lin-(对包括CD2、CD3、CD4、CD7、CD8、CD10、CD11B、CD19、CD20、CD56、CD235A在内的成熟谱系标志物呈阴性)。在小鼠中，骨髓LT-HSC是CD34-、SCA-1+、C-kit+、CD135-、Slamfl/CD150+、CD48-和lin-(对包括Ter119、CD11b、Gr1、CD3、CD4、CD8、B220、IL7ra在内的成熟谱系标志物呈阴性)，而ST-HSC是CD34+、SCA-1+、C-kit+、CD135-、Slamfl/CD150+和lin-(对包括Ter119、CD11b、Gr1、CD3、CD4、CD8、B220、IL7ra在内的成熟谱系标志物呈阴性)。此外，在稳态条件下，ST-HSC比LT-HSC更不静止(即更活跃)且更增殖。然而，LT-HSC具有更大的自我更新潜力(即它们可以在整个成年期存活，并且可以通过连续的接受者连续移植)，而ST-HSC的自我更新能力有限(即它们只能存活一段有限的时间，并且不具备连续移植潜力)。任何这些HSC都可以用于任何本文的方法中。在一些实施方式中，ST-HSC是有用的，因为它们是高度增殖的，因此可以更快地产生分化的后代。

如本文所用，“接受者”是接受移植物如含有造血干细胞群或分化细胞群的移植物的患者。施用于接受者的移植细胞可以是例如自体、同基因或同种异体细胞。

如本文所用，“供体”是人类或动物，从其分离一种或多种细胞，然后将细胞或其子代施用于接受者。在将细胞或其子代施用于接受者之前，一种或多种细胞可以是要根据本发明的方法进行扩增、强化(enrich)或维持的造血干细胞群。

如本文所用，术语“药物组合物”是指活性剂与药学上可接受的载体(例如制药工业中常用的载体)的组合。本文使用的短语“药学上可接受的”是指在合理的医学判断范围内，适合与人类和动物的组织接触使用而没有过度的毒性、刺激性、过敏反应或其它问题或并发症，与合理的效益/风险比相称的那些化合物、材料、组合物和/或剂型。

如本文所用，术语“施用”是指通过导致在所需部位至少部分递送药剂的方法或途径将本文公开的化合物、细胞或细胞群置于受试者体内。包括本文公开的化合物或细胞的药物组合物可以通过在受试者中产生有效治疗的任何合适途径施用。

如本文所用，“核酸”或“多核苷酸”是指核苷酸和/或多核苷酸，例如脱氧核糖核酸(DNA)或核糖核酸(RNA)、寡核苷酸、由聚合酶链式反应(PCR)产生的片段、以及由连接、断裂、核酸内切酶作用和核酸外切酶作用中任何一种产生的片段。核酸分子可由天然存在的核苷酸(例如DNA和RNA)或天然存在的核苷酸的类似物(例如天然存在的核苷酸的对映体形式)或两者的组合组成。修饰的核苷酸可以在糖部分和/或嘧啶或嘌呤碱基部分中具有改变。糖修饰包括例如用卤素、烷基、胺和叠氮基替换一个或多个羟基，或者糖可以被官能化为醚或酯。此外，整个糖部分可以用空间上和电子上相似的结构代替，例如氮杂糖和碳环糖类似物。碱基部分中修饰的实例包括烷基化的嘌呤和嘧啶、酰化的嘌呤或嘧啶、或其它众所周知的杂环取代物。核酸单体可以通过磷酸二酯键或这种键的类似物连接。核酸可以是单链的或双链的。

术语“多肽”、“肽”和“蛋白质”可互换使用，指氨基酸残基的聚合物。该术语也适用于其中一种或多种氨基酸是相应天然氨基酸的化学类似物或修饰衍生物的氨基酸聚合物。

“序列特异性试剂”是指具有特异性识别来自基因组基因座的选定多核苷酸序列的能力的任何活性分子，考虑到修改基因组基因座的表达，优选长度至少9bp，更优选至少10bp，甚至更优选至少12pb。在一个实施方式中，诱导稳定突变的序列特异性试剂是具有切口酶或核酸内切酶活性的试剂。

术语“核酸内切酶”是指能够催化DNA或RNA分子(优选DNA分子)内核酸之间的键的水解(切割)的任何野生型或变体酶。核酸内切酶不切割DNA或RNA分子而不管其序列如何，而是在特定的多核苷酸序列(进一步称为“靶序列”或“靶位点”)处识别和切割DNA或RNA分子。

“有效量”或“治疗有效量”是指本文的组合物的量，该量当施用于受试者(例如人)时足以帮助治疗疾病。构成“治疗有效量”的组合物的量将根据细胞制剂、病症及其严重程度、施用方式和待治疗受试者的年龄而变化，但可以由本领域普通技术人员在考虑到自己的知识和本公开内容后常规地确定。当提及单独施用的单个活性成分或组合物时，治疗有效剂量是指该单独的成分或组合物。当提及组合时，治疗有效剂量是指导致治疗效果的活性成分、组合物或两者的组合量，无论是连续施用、并行施用还是同时施用。

当通常具有长度大于10个碱基对(bp)的多核苷酸识别位点时，核酸内切酶可归类为稀有切割核酸内切酶。在一些实施方式中，稀有切割核酸内切酶具有14-55bp的识别位点。稀有切割核酸内切酶通过在特定位点诱导DNA双链断裂(DSB)而显著增加同源性重组，从而允许基因修复或基因***治疗(Pingoud，A.and G.H.Silva(2007).Nat.Biotechnol.25(7):743-4)。

“锌指DNA结合蛋白”(或结合结构域)是一种蛋白质、或较大蛋白质内的结构域，其通过一个或多个锌指以序列特异性方式结合DNA，锌指是结合结构域内的氨基酸序列的区域，其结构通过锌离子的配位而稳定。术语锌指DNA结合蛋白通常缩写为锌指蛋白或ZFP。

“TALE DNA结合结构域”或“TALE”是包括一个或多个TALE重复结构域/单元的多肽。重复结构域参与TALE与其同源靶DNA序列的结合。单个“重复单元”(也称为“重复”)的长度通常为33-35个氨基酸，并且与天然存在的TALE蛋白内的其它TALE重复序列表现出至少一定序列同源性。

锌指和TALE结合域可以被“工程化”以结合预定的核苷酸序列，例如通过工程化(改变一个或多个氨基酸)天然存在的锌指或TALE蛋白的识别螺旋区。因此，工程化的DNA结合蛋白(锌指或TALE)是非天然存在的蛋白质。用于工程化DNA结合蛋白的方法的非限制性例子是设计和选择。设计的DNA结合蛋白是自然界中不存在的蛋白质，其设计/组成主要来自合理的标准。用于设计的合理标准包括应用替换规则和计算机化算法来处理存储现有ZFP和/或TALE设计和结合数据的信息的数据库中的信息。参见例如美国专利号6,140,081；6,453,242；和6,534,261；还参见WO 98/53058；WO 98/53059；WO 98/53060；WO 02/016536和WO 03/016496以及美国公开号20110301073。

在一些实施方式中，核酸内切酶是工程化的并且在自然界中不存在。在一些实施方式中，核酸内切酶是使用诸如噬菌体展示、相互作用陷阱或杂交选择等方法产生的。参见例如美国专利号5,789,538；5,925,523；6,007,988；6,013,453；6,200,759；以及WO 95/19431；WO 96/06166；WO 98/53057；WO 98/54311；WO 00/27878；WO 01/60970；WO 01/88197；WO 02/099084和美国专利申请公开号2011/0301073。

“重组”是指在两个多核苷酸之间交换遗传信息的过程。为了本公开的目的，“同源重组(HR)”是指此类交换的特殊形式，例如在通过同源定向修复机制修复细胞中的双链断裂期间发生。该过程需要核苷酸序列同源性，并且通常使用“供体”分子(也称为“多核苷酸模板”)通过同源重组或NHEJ修复整合到内源基因座(“靶”序列)中。这导致遗传信息从供体转移到靶。不希望受任何特定理论的束缚，这种转移可涉及对在断裂靶和供体之间形成的异源双链DNA的错配纠正，和/或其中供体用于重新合成将成为靶的一部分的遗传信息的“合成依赖性链退火”，和/或相关过程。这种专门的HR通常导致靶分子序列的改变，使得供体多核苷酸的部分或全部序列并入靶多核苷酸中。

“突变”意指多核苷酸(cDNA、基因)或多肽序列中多达一、二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、二十、二十五、三十、四十、五十或更多个核苷酸/氨基酸的取代、缺失、***。在一些实施方式中，突变可以影响基因的编码序列或其调控序列。它还可能影响基因组序列的结构或所编码的mRNA的结构/稳定性。

“载体”是指一种核酸分子，其能够运输与其连接的另一种核酸。本发明中的“载体”包括但不限于病毒载体、质粒、寡核苷酸、RNA载体或线性或环状DNA或RNA分子，其可以由染色体、非染色体、半合成或合成核酸组成。优选的载体是能够自主复制(附加型载体)和/或表达它们所连接的核酸(表达载体)的那些载体。大量合适的载体是本领域技术人员已知的并且是可商购的。病毒载体包括：逆转录病毒，腺病毒，细小病毒(例如腺相关病毒(AAV)，冠状病毒，负链RNA病毒例如正粘病毒(例如流感病毒)，弹状病毒(例如狂犬病和水疱性口炎病毒)，副粘病毒(例如麻疹和仙台)，正链RNA病毒例如小核糖核酸病毒和甲病毒，以及双链DNA病毒，包括腺病毒、疱疹病毒(例如单纯疱疹病毒1型和2型、爱泼斯坦-巴尔病毒、巨细胞病毒)和痘病毒(例如牛痘、鸡痘和金丝雀痘)。例如，其它病毒包括例如诺沃克病毒、披膜病毒、黄病毒、呼肠孤病毒、乳多空病毒、嗜肝DNA病毒和肝炎病毒。逆转录病毒的例子包括：禽白血病-肉瘤，哺乳动物C型病毒、B型病毒、D型病毒，HTLV-BLV组，慢病毒，泡沫病毒(Coffin,J.M.,Retroviridae:The viruses and their replication,In FundamentalVirology,Third Edition,B.N.Fields,et al.,Eds.,Lippincott-Raven Publishers,Philadelphia,1996)。

如本文所用，术语“基因座”是DNA序列(例如基因的)在基因组中的特定物理位置。术语“基因座”可以指稀有切割核酸内切酶靶序列在染色体上或感染剂基因组序列上的特定物理位置。这样的基因座可以包括被根据本发明的序列特异性核酸内切酶识别和/或切割的靶序列。应当理解的是，本发明的目的基因座不仅可以限定存在于细胞遗传物质主体(即染色体中)的核酸序列，而且可以限定可以独立于遗传物质的所述主体而存在的遗传物质的一部分，例如质粒、附加体、病毒、转座子或在细胞器中,例如作为非限制性实例的线粒体。

术语“切割”是指多核苷酸共价骨架的断裂。切割可以通过多种方法引发，包括但不限于磷酸二酯键的酶水解或化学水解。单链切割和双链切割都是可能的，并且双链切割可以作为两个不同单链切割事件的结果而发生。双链DNA、RNA或DNA RNA杂合切割可导致产生平末端或交错末端。

“同一性”是指两个核酸分子或多肽之间的序列同一性。同一性可以通过比对为了对比目的而对齐的每个序列中的位置来确定。当比较的序列中的一个位置被相同碱基占据时，则分子在该位置是同一的。核酸或氨基酸序列之间的相似性或同一性程度是取决于多个核酸序列共有的位置处相同或匹配核苷酸数目。可以使用各种比对算法和/或程序来计算两个序列之间的同一性，包括FASTA或BLAST，它们可作为GCG序列分析包的一部分而获得(University of Wisconsin,Madison,Wis.)，并可以以例如默认设置使用。例如，考虑了与本文描述的特定多肽具有至少70％、85％、90％、95％、98％或99％同一性并且优选地表现出基本相同功能的多肽，以及编码此类多肽的多核苷酸。

如本文用，术语“治疗(treat)”、“治疗(treatment)”、“治疗(treating)”等是指获得期望药理学和/或生理学效果。就完全或部分预防疾病或其症状而言，效果可以是预防性的，和/或就部分或完全治愈疾病和/或归因于该疾病的副作用而言，效果可以是治疗性的。如本文所用，“治疗”涵盖哺乳动物(特别是人类)疾病的任何治疗，并且包括：(a)防止疾病在可能易患该疾病但尚未诊断患有该疾病的受试者中发生；(b)抑制疾病，即阻止其发展；和(c)缓解疾病，例如导致疾病消退，例如完全或部分消除疾病症状。

在细胞的背景下的“扩增”是指从可能相同或可能不同的细胞的初始细胞群开始，一种或多种特征性细胞类型的数量增加。用于扩增的初始细胞可能与扩增产生的细胞不同。

“细胞群”是指真核哺乳动物细胞，优选人类细胞，其分离自生物来源，例如血液制品或组织，并来源于多于一种细胞。

当在细胞群的背景下使用时，“富集的”是指基于存在的一种或多种标志物(例如CD34+)而选择的细胞群。

术语“CD34+细胞”是指在其表面表达CD34标记的细胞。可以使用例如流式细胞术和荧光标记的抗-CD34抗体检测和计数CD34+细胞。

“富含CD34+细胞”是指已基于CD34标志物的存在选择细胞群。因此，选择方法后细胞群中CD34+细胞的百分比高于基于CD34标志物的选择步骤之前的初始细胞群中CD34+细胞的百分比。例如，CD34+细胞可占富含CD34+细胞的细胞群中细胞的至少50％、60％、70％、80％或至少90％。

如本文所用，术语“受试者”或“患者”包括动物界的所有成员，包括非人类灵长类动物和人类。

在本文中说明数值限制或范围的情况下，包括端点。此外，数值限制或范围内的所有值和子范围都被特别地包括在内，如同明确写出一样。

治疗方法

在一个实施方式中，本发明提供了一种将转基因表达到患者大脑中的方法，包括：

i)获得基因修饰的造血干细胞(HSC)，其中HSC分离自患者或者获自来源于患者并且分化成HSC的诱导多能干(iPS)细胞，其中基因修饰的HSC被工程化为包括整合在小胶质细胞中表达的基因座上的转基因；和

ii)将基因修饰的HSC移植到患者中，使其分化为将转基因表达到患者大脑中的小胶质细胞。

在另一个实施方式中，本发明提供了一种将转基因表达到患者大脑中的方法，包括：

i)获得基因修饰的造血干细胞(HSC)，其中HSC分离自相容供体或者获自来源于相容供体并且分化成HSC的诱导多能干(iPS)细胞，其中基因修饰的HSC被工程化为包括整合在小胶质细胞中表达的基因座上的转基因；和

在另一个实施方式中，本发明提供了一种治疗患者中疾病或病症的方法，包括向患者施用有效量的基因修饰的HSC，其中基因修饰的HSC被工程化为包括整合在小胶质细胞中表达的基因座上的转基因，其中基因修饰的HSC在患者中分化为小胶质细胞并且将转基因表达到患者大脑中。在一些实施方式中，HSC分离自相容供体或者获自来源于相容供体并且分化成HSC的诱导多能干(iPS)细胞。在一些实施方式中，HSC分离自患者或者获自来源于患者并且分化成HSC的诱导多能干(iPS)细胞。

在一些实施方式中，患者患有单基因疾病或病症。在一些实施方式中，患者在与转基因同源的内源性基因的表达方面具有缺陷。在一些实施方式中，患者患有溶酶体贮积病。在一些实施方式中，疾病或病症选自粘多糖病I型(Scheie、Hurler-Scheie或Hurler综合征)、粘多糖病II型(亨特综合征)、粘多糖病VI型(Maroteaux-Lamy综合征)、粘多糖病VII型(Sly疾病)、X连锁肾上腺脑白质营养不良、球形细胞脑白质营养不良(克拉伯病)、异染性脑白质营养不良、戈谢病、岩藻糖苷贮积症、α-甘露糖苷过多症、天冬氨酰葡萄糖胺尿症、Farber病、泰-萨克斯病、庞贝氏病、尼曼匹克病和沃尔曼病。在一些实施方式中，患者患有中枢神经***(CNS)疾病。在一些实施方式中，CNS疾病选自阿尔茨海默病、帕金森病、亨廷顿氏病、多发性硬化症疾病。在一些实施方式中，患者患有CDKL5-缺陷相关疾病。在一些实施方式中，CDKL5-缺陷疾病选自婴儿早期癫痫性脑病(EIEE)、非典型Rett综合征、CDKL5相关癫痫性脑病和韦斯特综合征。

该方法可以是自体治疗的一部分或同种异体治疗的一部分。自体是指用于治疗患者的细胞来源于所述患者。同种异体是指用于治疗患者的细胞或细胞群不是源自所述患者而是源自供体。

在一些实施方式中，将细胞施用于正接受免疫抑制治疗的患者。在一个实施方式中，使施用的细胞对至少一种免疫抑制剂具有抗性。在一些实施方式中，免疫抑制治疗有助于基因修饰的HSC在患者内的选择和扩增。

细胞的施用可以任何方便的方式进行，包括通过雾化吸入、注射、摄取、输液、植入或移植。本文描述的组合物可以皮下、皮内、瘤内、结节内、髓内、肌内、通过静脉内或淋巴内注射、或腹膜内施用于患者。在一个实施方式中，细胞组合物通过静脉内注射施用，其中能够迁移至骨髓。

尽管个体需求不同，但对于特定疾病或病症，确定给定细胞类型的有效量的最佳范围在本领域的技术范围内。有效量是指提供治疗或预防益处的量。施用的剂量将取决于接受者的年龄、健康和体重、并存治疗的种类(如果有的话)、治疗频率和所需效果的性质。在一些实施方式中，细胞或细胞群的施用包括施用约10⁴-10⁹个细胞/kg体重。在一些实施方式中，施用约10⁵至10⁶个细胞/kg体重。那些范围内的细胞数的所有整数值都被考虑在内。

细胞可以以一剂或多剂施用。在另一个实施方式中，有效量的细胞作为单剂量施用。在另一个实施方式中，有效量的细胞在一段时间内作为多于一个剂量施用。施用时间在主治医师的判断范围内，并且取决于患者的临床状况。

在一些实施方式中，施用基因修饰的HSC细胞可以包括用清髓性和/或免疫抑制性方案治疗患者以消耗宿主骨髓干细胞并防止排斥。在一些实施方式中，对患者施用化学疗法和/或放射疗法。在一些实施方式中，对患者施用减少剂量的化疗方案。在一些实施方式中，以标准剂量的25％使用白消安的减少剂量化疗方案可足以实现修饰细胞的显著植入，同时降低与调理相关的毒性(Aiuti A.et al.(2013)，Science 23；341(6148))。更强的化疗方案可以基于施用白消安和氟达拉滨两者作为内源性HSC的消耗剂。在一些实施方式中，白消安和氟达拉滨的剂量约为标准同种异体移植中所用剂量的50％和30％。在另一个实施方式中，在B细胞消融疗法后施用细胞，例如与CD20反应的试剂，例如利妥昔单抗(Rituxan)。在一些实施方式中，向患者施用化疗剂例如氟达拉滨、外照射放射疗法(XRT)、环磷酰胺或抗体例如OKT3或CAMPATH。

在某些实施方案中，将基因修饰的细胞作为包括免疫抑制剂的联合疗法施用于受试者。示例性的免疫抑制剂包括西罗莫司、他克莫司、环孢霉素、麦考酚酯、抗胸腺细胞球蛋白、皮质类固醇、神经钙调蛋白抑制剂、抗代谢物诸如甲氨蝶呤、移植后环磷酰胺或其任何组合。在一些实施方式中，使用仅西罗莫司或他克莫司预治疗受试者作为针对GVHD的预防。在一些实施方式中，在免疫抑制剂之前将细胞施用于受试者。在一些实施方式中，在免疫抑制剂之后将细胞施用于受试者。在一些实施方式中，将细胞与免疫抑制剂同时施用于受试者。在一些实施方式中，细胞在没有免疫抑制剂的情况下施用于受试者。在一些实施方式中，接受基因修饰细胞的患者接受少于6个月、5个月、4个月、3个月、2个月、1个月、3周、2周或1周的免疫抑制剂。

转基因和疾病

如本文所用的转基因编码疾病相关基因的治疗性蛋白质。疾病相关基因是在疾病中以某种方式存在缺陷的基因。在一些实施方式中，待治疗的疾病和转基因如下表1所示。

表1.单基因疾病和用于其治疗的转基因。

在一些实施方式中，转基因包括从IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5中选择的基因的编码序列。

在一些实施方式中，IDUA的核苷酸序列包括SEQ ID NO:1并且氨基酸序列包括SEQID NO:2。

在一些实施方式中，IDS的核苷酸序列包括SEQ ID NO:3并且氨基酸序列包括SEQID NO:4。

在一些实施方式中，ARSB的核苷酸序列包括SEQ ID NO:5并且氨基酸序列包括SEQID NO:6。

在一些实施方式中，GUSB的核苷酸序列包括SEQ ID NO:7并且氨基酸序列包括SEQID NO:8。

在一些实施方式中，ABCD1的核苷酸序列包括SEQ ID NO:9并且氨基酸序列包括SEQ ID NO:10。

在一些实施方式中，GALC的核苷酸序列包括SEQ ID NO:11并且氨基酸序列包括SEQ ID NO:12。

在一些实施方式中，ARSA的核苷酸序列包括SEQ ID NO:13并且氨基酸序列包括SEQ ID NO:14。

在一些实施方式中，PSAP的核苷酸序列包括SEQ ID NO:15并且氨基酸序列包括SEQ ID NO:16。

在一些实施方式中，GBA的核苷酸序列包括SEQ ID NO:17并且氨基酸序列包括SEQID NO:18。

在一些实施方式中，FUCA1的核苷酸序列包括SEQ ID NO:19并且氨基酸序列包括SEQ ID NO:20。

在一些实施方式中，MAN2B1的核苷酸序列包括SEQ ID NO:21并且氨基酸序列包括SEQ ID NO:22。

在一些实施方式中，AGA的核苷酸序列包括SEQ ID NO:23并且氨基酸序列包括SEQID NO:24。

在一些实施方式中，ASAH1的核苷酸序列包括SEQ ID NO:25并且氨基酸序列包括SEQ ID NO:26。

在一些实施方式中，HEXA的核苷酸序列包括SEQ ID NO:27并且氨基酸序列包括SEQ ID NO:28。

在一些实施方式中，GAA的核苷酸序列包括SEQ ID NO:29并且氨基酸序列包括SEQID NO:30。

在一些实施方式中，SMPD1的核苷酸序列包括SEQ ID NO:31并且氨基酸序列包括SEQ ID NO:32。

在一些实施方式中，LIPA的核苷酸序列包括SEQ ID NO:33并且氨基酸序列包括SEQ ID NO:34。

在一些实施方式中，CDKL5的核苷酸序列包括SEQ ID NO:35并且氨基酸序列包括SEQ ID NO:36。

在一些实施方式中，转基因包括选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33和35中任一者的核苷酸序列的一个或多个拷贝。

在一些实施方式中，转基因包括编码选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34和36中任一者的氨基酸序列的核苷酸序列的一个或多个拷贝。

在一些实施方式中，转基因包括编码治疗性蛋白质的核苷酸序列，治疗性蛋白质是SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34和36中任一者的变体。

编码治疗性蛋白质的特定核苷酸序列可以在其全长上与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35中的编码序列相同。替代地，由于编码SEQ IDNO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34和36的多肽的遗传密码的简并性或密码子使用的变化，编码治疗性蛋白质的特定核苷酸序列可以是SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35的替代形式。在一些实施方式中，转基因包括与编码治疗性蛋白质的多核苷酸序列高度同一性(具有至少90％同一性)的核苷酸序列，或与SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35中阐述的编码核苷酸序列具有至少90％同一性的核苷酸序列。在一些实施方式中，转基因包括与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35中阐述的核苷酸序列具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％或99％同一性的核苷酸序列。

当包括编码本发明的治疗性蛋白质的多核苷酸的转基因用于治疗性蛋白质的重组生产时，多核苷酸本身可以包括全长多肽或其片段的编码序列；全长多肽或片段的编码序列与其它编码序列(例如编码前导或分泌序列、前蛋白质序列或原蛋白质序列或前原蛋白质序列或其它融合肽部分的那些序列)处于相同的阅读框。多核苷酸还可以含有非编码的5'和3'序列，例如转录的非翻译的序列、剪接和多腺苷酸化信号、核糖体结合位点和稳定mRNA的序列。

在一些实施方式中，治疗性蛋白质可以进一步包括允许其由本发明的基因编辑细胞分泌的分泌信号肽。下表2列出了此类信号肽的一些实例。

表2：有用的信号肽的实例

在一些实施方式中，治疗性蛋白质可以进一步包括允许细胞摄取的肽，例如细胞穿透肽(CPP)和载脂蛋白。下表3中列出了细胞穿透肽和载脂蛋白的实例。

表3：有用的CPP和载脂蛋白的实例

在一些实施方式中，转基因包括多核苷酸，该多核苷酸与编码具有SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34和36中氨基酸序列的治疗性蛋白质的核苷酸序列具有至少90％同一性且更优选地具有至少91％、92％、93％、94％、95％、96％、97％、98％或99％同一性的核苷酸序列。

可以使用利用已知的计算机程序的常规手段，例如BestFit程序(Wisconsin序列分析包,版本10，Unix,Genetics Computer Group.University Research Park,575Science Drive,Madison,Wis.53711)来确定特定的核酸序列是否与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35中所示核苷酸序列任一者具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的同一性。

在一些实施方式中，转基因包括编码治疗性蛋白质的多核苷酸，该治疗性蛋白质具有SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32或34的治疗性蛋白质的氨基酸序列，其中多个、1、1-2、1-3、1-5、5-10或10-20个氨基酸残基以任何组合被取代、缺失或添加。

在一些实施方式中，转基因包括在它们的全长上与编码具有SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36中列出的氨基酸序列的治疗性蛋白质的多核苷酸具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％或99％同一性的多核苷酸。

在一些实施方式中，由转基因表达的治疗性蛋白质与蛋白质的野生型氨基酸序列(例如SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36中任一项)是相同的。

在一些实施方式中，由转基因表达的治疗性蛋白质为SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36中任一者的功能性片段或变体。

在一些实施方式中，治疗性蛋白质包括SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的多肽，以及具有活性并且与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的多肽包括至少90％同一性的多肽和片段，或相关部分并且更优选与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的多肽包含至少96％、97％或98％的同一性，并且还更优选与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的多肽具有至少91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同一性。

治疗性蛋白质可以是较大蛋白质(诸如融合蛋白)的一部分。通常有利的是包括含有分泌或前导序列、原序列或可能有助于稳定性的其它序列的另外的氨基酸序列。

在一些实施方式中，转基因编码SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32或34中任一者的生物活性片段。片段是具有与上述治疗性蛋白质之一的氨基酸序列的一部分但不是全部完全相同的氨基酸序列的多肽。与全长治疗性蛋白质一样，片段可以是“独立的”或包括在更大多肽中，在该更大多肽中，它们形成一部分或区域，最优选形成为单个连续区域。在一些实施方式中，片段可以构成SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36中的约10个连续氨基酸。

在一些实施方式中，片段包括例如具有治疗性蛋白质的氨基酸序列的截短多肽，除了缺失包括氨基末端的一系列连续残基，或缺失包括羧基末端的一系列连续残基，或缺失两个系列连续残基，一个包括氨基末端且一个包括羧基末端。还优选以结构或功能属性为特征的片段，例如包括α-螺旋和α-螺旋形成区、β-折叠和β-折叠形成区、转角和转角形成区、线圈和线圈形成区、亲水区、疏水区、α两亲区、β两亲区、柔性区、表面形成区、底物结合区和高抗原指数区的片段。功能性片段是介导野生型蛋白质的蛋白质活性的那些片段，包括具有相似活性或改进活性的那些片段。

在一些实施方式中，片段可以缺少SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36中任一者的N-末端和/或C-末端的1-20个氨基酸(即1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸)。

在一些实施方式中，转基因编码具有与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36具有至少90％同一性的氨基酸序列的多肽、或其功能片段，该功能片段与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的对应片段具有至少90％同一性，它们全部均保留了治疗性蛋白质的生物活性。该组中包括的是确定序列和片段的变体。在一些实施方式中，变体是通过保守氨基酸取代而与参考序列不同的那些变体，即用相同特性的另一个残基取代的那些变体。典型的取代在Ala、Val、Leu和Ile中；在Ser和Thr中；在酸性残基Asp和Glu中；在Asn和Gln中；以及在碱性残基Lys和Arg中，或芳香族残基Phe和Tyr中。在一些实施方式中，转基因编码多肽变体，其中1-20氨基酸以任何组合被取代、缺失或添加。

CDKL5-缺陷相关疾病：

婴儿早期癫痫性脑病(EIEE)

婴儿早期癫痫性脑病(EIEE)是一种以癫痫发作为特征的神经***疾病。这种疾病影响新生儿，通常在生命的头三个月内(最常见的是头10天内)以癫痫发作的形式出现。婴儿主要有强直性癫痫发作(这导致身体肌肉僵硬，通常是背部、腿部和手臂的肌肉)，但也可能出现部分性癫痫发作，并且很少出现肌阵挛性癫痫发作(这导致上半身、手臂或腿猛拉或抽搐)。发作可能每天发生超过一百次。大多数患有这种病症的婴儿表现出部分或全部大脑半球发育不全或结构异常。有些病例是由代谢紊乱或多个不同基因的突变引起的。许多病例的原因无法确定。有多种类型的早期婴儿癫痫性脑病。EEG揭示了高压尖峰波放电的特征性模式，随后几乎没有活动。这种模式被称为“突发抑制”。与这种疾病相关的癫痫发作难以治疗，并且该综合征严重地进展。一些患有这种病症的儿童继续发展为其他癫痫性病症，例如韦斯特综合征和Lennox-Gestaut综合征。

EIEE可能是不同病因的结果。许多病例与脑结构异常有关。一些病例是由于代谢紊乱(细胞色素C氧化酶缺乏症、肉碱棕榈酰转移酶II缺乏症)或脑畸形(如孔洞脑或半侧巨脑畸形)引起的，这些疾病可能起源于遗传，也可能非遗传。EIEE的遗传变异与某些基因的突变有关，诸如ARX(Xp22.13)、CDKL5(Xp22)、SL25A22(11p15.5)和STXBP1(9q34.1)等。遗传异常被认为会导致EIEE，因为它们与神经元功能障碍或大脑发育不全有关。

非典型Rett综合征

非典型Rett综合征是一种神经发育障碍，当儿童有Rett综合征的一些症状但不符合所有诊断标准时被诊断出来。与经典形式的Rett综合征一样，非典型Rett综合征主要影响女孩。非典型Rett综合征患儿的症状可能比Rett综合征更轻或更严重。已经定义了多种非典型Rett综合征的亚型。早发性癫痫发作类型的特点是出生后头几个月癫痫发作，随后出现Rett特征(包括发育问题、语言技能丧失和反复拧手或洗手动作)。它通常由X连锁CDKL5基因(Xp22)的突变引起。

CDKL5相关癫痫性脑病

CDKL5相关癫痫性脑病的特点是由早期癫痫(第1阶段)、然后是婴儿痉挛(第2阶段)和最后的多灶性和难治性肌阵挛性癫痫(第3阶段)组成的3阶段演变。参见例如Bahi-Buisson et al.Epilepsia.49:1027–1037(2008)。细胞周期蛋白依赖性激酶样5(CDKL5)的遗传异常导致早发性癫痫性脑病。

韦斯特综合征

韦斯特综合征是一种癫痫症，其特征是痉挛、称为高节律失常的异常脑电波模式，并且有时还有智力障碍。发生的痉挛可能包括剧烈的屈身或全身弯曲成两半的“额手礼”运动，或者它们也可能只是肩膀的轻微抽搐或眼睛的变化。这些痉挛通常在出生后的最初几个月开始，并且有时可以通过药物治疗。韦斯特综合征有许多不同的致因，并且如果可以确定特定原因，则可以诊断为有症状的韦斯特综合征。如果无法确定致因，则诊断为隐源性韦斯特综合征。约70-75％的受影响者可以确定韦斯特综合征的特定原因。X连锁韦斯特综合征(X连锁婴儿痉挛综合征或ISSX)可由X染色体上的CDKL5基因或ARX基因突变引起。

粘多糖病

粘多糖病(MPS)是与酶缺陷相关的退行性基因疾病。特别地，MPS是由溶酶体酶缺乏或溶酶体酶不活跃引起的，溶酶体酶催化称为糖胺聚糖(GAG)的复杂糖分子的逐渐代谢。这些酶缺乏导致GAG在细胞、组织且特别是受影响受试者的细胞溶酶体中积累，导致永久性和进行性细胞损伤，这会影响外观、身体能力、器官功能和在大多数情况下受影响受试者的心理发展。

已鉴定出11种不同的酶缺陷，对应于MPS的7种不同临床类别。每种MPS的特点是一种或多种降解粘多糖的酶(即硫酸乙酰肝素、硫酸皮肤素、硫酸软骨素和硫酸角质素)的缺乏或无活性。

MPS I根据症状的严重程度分为三个亚型。所有这三种类型都是由于酶α-L-艾杜糖醛酸酶(IDIJA)的不存在或水平不足导致的。父母一方为MPS I的儿童携带缺陷基因。

MPS I H(也称为Hurler综合征或α-L-艾杜糖醛酸酶缺乏症)是MPS I亚型中最严重的一种。在第一年结束时发育迟缓很明显，并且患者通常在2至4岁之间停止发育。随后是进行性智力衰退和身体技能丧失。由于听力损失和舌头扩大，语言可能会受到限制。适时地，角膜的透明层变得混浊，并且视网膜可能开始退化。腕管综合征(或身体其它部位的类似神经压迫)和关节活动受限很常见。受影响的儿童在出生时可能很大并且看起来很正常，但可能有***(在腹股沟)或脐疝(脐带穿过腹部)。身高的增长可能比正常情况更快，但在第一年结束之前开始放缓，通常在3岁左右结束。许多儿童的身体躯干很短并最大身高不到4英尺。不同的面部特征(包括脸部扁平、鼻梁凹陷和额头凸出)在第二年变得更加明显。到2岁时，肋骨已经变宽且呈桨状。肝脏、脾脏和心脏经常肿大。儿童可能会经历嘈杂的呼吸和反复出现的上呼吸道和耳部感染。一些儿童可能难以进食，而且许多会出现周期性的肠道问题。患有Hurler综合征的儿童通常在10岁之前死于阻塞性气道疾病、呼吸道感染和心脏并发症。

MPS I S，Scheie综合征，是MPS 1最温和的形式。症状通常在5岁后开始出现，最常在10岁后作出诊断。患有Scheie综合征的儿童智力正常或可能有轻度学习障碍；有些可能有精神问题。青光眼、视网膜变性和角膜混浊可能会严重损害视力。其它问题包括腕管综合征或其它神经压迫、关节僵硬、爪形手和畸形脚、短颈和主动脉瓣疾病。一些受影响的个体还患有阻塞性气道疾病和睡眠呼吸暂停。患有Scheie综合征的人可以活到成年。

MPS I H-S，Hurler-Scheie综合征，严重性比单独的Hurler综合征要轻。症状通常在3至8岁之间开始。儿童可能有中度智力障碍和学习困难。骨骼和全身异常包括身材矮小、颚部明显变小、进行性关节僵硬、脊髓受压、角膜混浊、听觉损失、心脏病、面部特征粗糙和脐疝。***可能会出现呼吸问题、睡眠呼吸暂停和心脏病。一些MPS I H-S患者在睡眠期间需要持续气道正压通气以缓解呼吸。预期寿命一般在十几岁(late teens)或二十出头(early twenties)。

MPS II，也称为亨特综合征，是由缺乏艾杜糖醛酸硫酸酯酶引起的。亨特综合征有两种临床亚型，并且(因为它显示X连锁隐性遗传)是唯一一种只有母亲才能将缺陷基因传给儿子的粘多糖病。亨特综合征的发病率估计为每100,000至150,000名男性新生儿中的有1名。

IDS基因的突变导致MPS II。IDS基因提供产生I2S酶的指令，该酶参与称为糖胺聚糖(GAG)的大糖分子的分解。具体地，I2S从称为硫酸化α-L-艾杜糖醛酸的分子中去除称为硫酸根(sulfate)的化学基团，该分子存在于称为硫酸乙酰肝素和硫酸皮肤素的两种GAG中。I2S位于溶酶体中，在消化和回收不同类型分子的细胞隔室内。

粘多糖病VI型(MPS VI)或Maroteaux-Lamy疾病是粘多糖病组的溶酶体贮积病，其特点是严重的躯体受累和缺乏心理-智力退化。这种罕见粘多糖病的患病率在1/250,000至1/600,000个出生人数之间。在严重的形式下，第一个临床表现发生在6到24个月之间，并逐渐加重：面部畸形(巨舌，嘴经常半张，厚的特征)，关节受限，非常严重的多发性成骨异常(扁平椎、驼背、脊柱侧凸、鸡胸、膝外翻、长骨变形)，小尺寸(小于1.10m)，肝肿大，心脏瓣膜损伤，心肌病，耳聋，角膜混浊。智力发育通常正常或几乎正常，但听觉和眼科损伤会导致学习困难。疾病的症状和严重程度因患者相差悬殊，并且存在中间形式，甚至还存在非常温和的形式(与心血管受累相关的脊椎骨骺线-骨骺线发育不良)。与其它粘多糖病一样，Maroteaux-Lamy病与粘多糖代谢酶的缺陷有关，在这种情况下恰当地为N-乙酰半乳糖胺-4-硫酸酯酶(也称为芳基硫酸酯酶B)(ARSB)。这种酶代谢硫酸皮肤素的硫酸基团(Neufeldet al.："The mucopolysaccharidoses"The Metabolic Basis of Inherited Diseases,eds.Scriver et al,New York,McGraw-Hill,1989,p.1565-1587)。这种酶缺陷阻断了硫酸皮肤素的逐渐降解，从而导致硫酸皮肤素在储存组织的溶酶体中积累。

粘多糖病VII型(MPS VII)或Sly疾病是粘多糖病组中一种非常罕见的溶酶体贮积病。症状极其异质：产前形式(非免疫性胎儿胎盘全身水肿)，严重的新生儿形式(具有畸形、疝气、肝脾肿大、畸形足、骨发育不全、显著的肌张力减退以及演变为生长迟缓和生存时严重智力缺陷的神经***问题)以及在***或甚至成年时发现的非常温和的形式(胸椎后凸)。该疾病是由于β-D-葡萄糖醛酸酶(GUSB)的缺陷导致各种糖胺聚糖(硫酸皮肤素、硫酸乙酰肝素和硫酸软骨素)在溶酶体中积累引起的。目前针对这种疾病还没有有效治疗方法。

X连锁肾上腺脑白质营养不良

肾上腺脑白质营养不良(ALD)是一种X连锁疾病，影响1/20,000的男性，无论是儿童期的脑ALD还是成人的肾上腺脑神经病(adrenomyleneuropathy)(AMN)。儿童期ALD是更严重的形式，在5-12岁之间出现神经***症状。中枢神经***脱髓鞘进展迅速，并在几年内发生死亡。AMN是一种较温和的疾病形式，发病年龄为15-30岁并且病程进展较快。肾上腺功能不全(爱迪生氏病)可能仍然是ALD的唯一临床表现。ALD的主要生化异常是由于过氧化物酶体中的-氧化受损导致超长链脂肪酸(VLCFA)的积累。

已发现ABCD1基因中超过650个突变会导致X连锁肾上腺脑白质营养不良。这种病症的特点是不同程度的认知和运动问题以及激素失衡。导致X连锁肾上腺脑白质营养不良的突变在大约75％患有这种病症的人中阻止产生任何ALDP。患有X连锁肾上腺脑白质营养不良的其他人可以产生ALDP，但该蛋白质无法发挥其正常功能。在很少或没有功能性ALDP的情况下，VLCFA不会被分解，并且它们会在体内积聚。这些脂肪的积累可能对肾上腺(每个肾脏顶部的小腺体)和体内包围许多神经的脂肪绝缘层(髓磷脂)有毒。研究表明，VLCFA的积累会引发大脑中的炎症反应，这可能导致髓磷脂的分解。这些组织的破坏导致X连锁肾上腺脑白质营养不良的体征和症状。

球形细胞脑白质营养不良

婴儿球形细胞白质营养不良(GLD，半乳糖神经酰胺脂沉积症或克拉伯病)是一种罕见的中枢和外周神经***常染色体隐性遗传退行性疾病。在美国的发病率估计为1:100.000。它的特征是存在球状细胞(具有多个核的细胞)、神经保护性髓鞘层的退化和大脑中细胞的损失。GLD导致严重的精神减退和运动迟缓。它是由缺乏半乳糖脑苷脂-β-半乳糖苷酶(GALC)引起的，GALC是髓磷脂代谢中必不可少的酶。这种疾病通常会影响6个月大之前的婴儿，但它也可能出现在青年或成人中。症状包括易怒、不明原因的发烧、四肢僵硬(高血压)、癫痫发作、与食物摄入有关的问题、呕吐以及智力和运动能力的发育迟缓。其它症状包括肌肉无力、痉挛、耳聋和失明。

半乳糖基神经酰胺酶基因(GALC)长约60kb，并且由17个外显子组成。已在鼠和人类GALC基因中鉴定出许多突变和多态性，导致严重程度不同的GLD。

异染性脑白质营养不良

异染性脑白质营养不良是一种遗传性病症，其特点是细胞中称为硫苷脂的脂肪积累。这种积累尤其影响神经***中产生髓磷脂的细胞，髓磷脂是绝缘和保护神经的物质。被髓磷脂覆盖的神经细胞构成了一种称为白质的组织。产生髓磷脂的细胞中的硫苷脂积累会导致整个神经***的白质(脑白质营养不良)进行性破坏，包括大脑和脊髓(中枢神经***)中的神经以及将大脑和脊髓连接到肌肉和感觉细胞的神经，感染细胞检测诸如触觉、疼痛、热和声音(周围神经***)等感觉。

在患有异染性脑白质营养不良的人中，白质损伤会导致智力功能和运动技能(例如行走能力)进行性恶化。受影响的个体还会发展四肢感觉丧失(周围神经病变)、失禁、癫痫发作、瘫痪、无法说话、失明和听力损失。最终，他们丧失对周围环境的意识，变得反应迟钝。虽然神经***问题是异染性脑白质营养不良的主要特征，但已经报道了硫苷脂积累对其它器官和组织的影响，最常见涉及胆囊。

最常见的异染性脑白质营养不良形式，其影响患有这种病症的所有个体的约50％至60％，被称为婴幼儿后期形式。这种形式的病症通常出现在生命的第二年。受影响的儿童失去他们已经发展的任何语言，变得虚弱，并出现行走问题(步态障碍)。随着疾病的恶化，肌张力通常首先降低，然后增加至僵硬点。患有婴幼儿后期形式异染性脑白质营养不良的个体通常无法活过童年。

在20％至30％的异染性脑白质营养不良个体中，在4岁至***之间发病。在这种青少年形式中，病症的最初迹象可能是行为问题和学业难度增加。该病症的进展比婴幼儿后期形式慢，并且受影响的个体在确诊后可能存活约20年。

大多数患有异染性脑白质营养不良的个体的ARSA基因中具有突变，该基因提供了制备酶芳基硫酸酯酶A的指令。这种酶位于称为溶酶体的细胞结构中，溶酶体是细胞的回收中心。在溶酶体内，芳基硫酸酯酶A有助于分解硫苷脂。少数患有异染性脑白质营养不良的个体的PSAP基因中具有突变。该基因提供了制备蛋白质的指令，该蛋白质被分解(切割)成更小的蛋白质，帮助酶分解各种脂肪。这些较小蛋白质中的一种称为皂化蛋白B；这种蛋白质与芳基硫酸酯酶A一起分解硫苷脂。

ARSA或PSAP基因中的突变导致分解硫苷脂的能力下降，从而导致这些物质在细胞中积累。过量的硫苷脂对神经***有毒。积累逐渐破坏产生髓磷脂的细胞，导致在异染性脑白质营养不良中发生的神经***功能受损。

在某些情况下，芳基硫酸酯酶A活性非常低的个体不会表现出异染性脑白质营养不良的症状。这种病症也称为伪芳基硫酸酯酶缺乏症。

成人形式的异染性脑白质营养不良影响约15％至20％患有这种病症的个体。在这种形式中，最初的症状出现在青少年时期或更晚。通常，行为问题，例如酗酒、药物滥用、或在学校或工作中遇到困难是最先出现的症状。受影响的个体可能会经历精神症状，例如妄想或幻觉。患有成人形式异染性脑白质营养不良的人在确诊后可存活20至30年。在此期间，可能会有一些相对稳定的时期和其它更快速衰退的时期。

异染性脑白质营养不良的名称来源于在显微镜下观察时出现的具有硫脂苷积累的细胞的方式。硫苷脂形成被描述为异染性的颗粒，这意味着在染色检查时，它们呈现出与周围的细胞物质不同的颜色。

戈谢病

戈谢病是一种遗传性疾病，其影响许多的身体器官和组织。这种病症的体征和症状在受影响的个体中差异很大。研究人员根据其特征性特征描述了多种类型的戈谢病。

1型戈谢病是这种病症最常见的形式。1型也称为非神经元病性戈谢病，因为大脑和脊髓(中枢神经***)通常不受影响。这种病症的特征从轻微到严重不等，并且从童年到成年的任何时候都可能出现。主要体征和症状包括肝脏和脾脏肿大(肝脾肿大)、红细胞数量减少(贫血)、血小板减少引起的易瘀伤(血小板减少症)、肺部疾病和骨骼异常(如骨痛、骨折和关节炎)。

2型和3型戈谢病被称为该病症的神经元病形式，因为它们的特点是影响中枢神经***的问题。除了上述体征和症状外，这些病症还可能导致异常眼球运动、癫痫发作和脑损伤。2型戈谢病通常会从婴儿期开始导致危及生命的医疗问题。3型戈谢病也会影响神经***，但它的恶化往往比2型慢。

最严重的戈谢病类型称为围产期致死形式。从出生前或婴儿期开始，这种病症会导致严重或危及生命的并发症。围产期致死形式的特征可能包括由出生前积液引起的广泛肿胀(胎儿水肿)；干燥、鳞状皮肤(鱼鳞癣)或其它皮肤异常；肝脾肿大；独特的面部特征；和严重的神经问题。顾名思义，大多数患有围产期致命形式戈谢病的婴儿在出生后只能存活几天。

另一种形式的戈谢病被称为心血管类型，因为它主要影响心脏，导致心脏瓣膜硬化(钙化)。患有心血管形式戈谢病也可能有眼睛异常、骨骼疾病和脾脏轻度肿大(脾肿大)。

GBA基因中的突变导致戈谢病。GBA基因提供了制备称为β-葡萄糖脑苷脂酶的酶的指令。这种酶将一种叫做葡萄糖脑苷脂的脂肪物质分解成糖(葡萄糖)和更简单的脂肪分子(神经酰胺)。GBA基因中的突变大大降低或消除了β-葡萄糖脑苷脂酶的活性。如果没有足够的这种酶，葡萄糖脑苷脂和相关物质会在细胞内积累到毒性水平。这些物质的异常积累和储存会损害组织和器官，导致戈谢病的特征性特征。

岩藻糖苷贮积症

岩藻糖苷贮积症是一种影响身体许多区域的病症，尤其是大脑。受影响的个体的智力残疾会随着年龄的增长而恶化，并且许多人在以后的生活中会患上痴呆症。患有这种病症的人通常会延迟运动技能的发育，例如行走；他们确实获得的技能会随着时间的推移而退化。岩藻糖苷贮积症的其它体征和症状包括生长受损；骨发育异常(多发性成骨异常)；癫痫发作；肌肉异常僵硬(痉挛)；扩大的血管簇在皮肤上形成小而深的红色斑点(血管角质瘤)；通常被描述为“粗糙”的独特面部特征；反复呼吸道感染；和异常大的腹部器官(内脏肥大)。

在严重的情况下，症状通常出现在婴儿期，并且受影响的个体通常会活到童年晚期。在较轻的情况下，症状从1岁或2岁开始，并且受影响的个体往往会存活到成年中期。

过去，研究人员根据症状和发病年龄描述了两种这种病症的类型，但目前的观点是，这两种类型实际上是体征和症状的严重程度各不相同的单一病症。

FUCA1基因中的突变导致岩藻糖苷贮积症。FUCA1基因提供了制备称为α-L-岩藻糖苷酶的指令。这种酶在与某些蛋白质(糖蛋白)和脂肪(糖脂)相连的糖分子复合物(寡糖)的分解中起作用。α-L-岩藻糖苷酶负责在分解过程结束时切断(裂开)称为岩藻糖的糖分子。

FUCA1基因突变严重降低或消除了α-L-岩藻糖苷酶的活性。缺乏酶活性导致糖脂和糖蛋白的不完全分解。这些部分分解的化合物逐渐积聚在全身的各种细胞和组织中，并导致细胞发生故障。脑细胞对糖脂和糖蛋白的积累特别敏感，这会导致细胞死亡。脑细胞的丢失被认为会导致岩藻糖苷贮积症的神经***症状。糖脂和糖蛋白的积累也发生在其它器官中，如肝脏、脾脏、皮肤、心脏、胰腺和肾脏，导致岩藻糖苷贮积症的其它症状。

α-甘露糖苷过多症

α-甘露糖苷过多症是一种常染色体隐性遗传的溶酶体贮积症，其临床特征已得到很好的表征(M.A.Chester et al.，1982，in Genetic Errors of GlycoproteinMetabolism pp 90-119，Springer Verlag,Berlin)。糖蛋白通常在溶酶体中逐步降解，并且步骤之一(即在N-连接糖蛋白有序降解期间切割自非还原端的α-连接甘露糖残基)由酶溶酶体α-甘露糖苷酶(EC 3.2.1.24)催化。然而，在α-甘露糖苷过多症中，缺乏酶α-甘露糖苷酶会导致富含甘露糖的寡糖积累。结果，溶酶体尺寸增大并膨胀，从而损害细胞功能。

α-甘露糖苷过多症的症状包括精神运动迟缓、共济失调、听力受损、外周血中的空泡化淋巴细胞和骨骼变化。

MAN2B1基因中的突变导致α-甘露糖苷过多症。该基因提供了制备酶α-甘露糖苷酶的指令。这种酶在溶酶体中起作用，溶酶体是消化和回收细胞中物质的隔室。在溶酶体内，这种酶有助于分解附着在某些蛋白质(糖蛋白)上的糖分子复合物(寡糖)。特别是，α-甘露糖苷酶有助于分解含有称为甘露糖的糖分子的寡糖。

MAN2B1基因中的突变会干扰α-甘露糖苷酶在分解含甘露糖的寡糖中发挥作用的能力。这些寡糖在溶酶体中积聚并导致细胞发生故障并最终死亡。组织和器官因寡糖的异常积累和由此产生的细胞死亡而受损，导致α-甘露糖苷过多症的特征性特征。

天冬氨酰葡萄糖胺尿症

天冬氨酰葡萄糖胺尿症是一种导致精神功能进行性下降的疾病。患有天冬氨酰葡萄糖胺尿症的婴儿在出生时看起来很健康，并且在整个童年早期发育通常是正常的。这种病症的第一个体征在2或3岁左右很明显，通常是言语延迟。轻度智力障碍然后变得明显，并且学习速度变慢。智力障碍在***逐渐恶化。大多数患有这种病症的人失去了他们所学的大部分语言，并且受影响的成年人的词汇量通常只有几个单词。患有天冬氨酰葡萄糖胺尿症的成年人可能会出现癫痫发作或运动问题。

患有这种病症的人的骨骼也可能逐渐变弱并容易骨折(骨质疏松症)，关节运动范围异常大(运动过大)和皮肤松弛。受影响的个体往往具有特征性的面部外观，包括眼睛间距宽(两眼距离过远)、小耳朵和厚嘴唇。鼻子短而宽，并且脸通常是方形的。患有这种病症的儿童可能比他们的年龄高，但在***缺乏生长突增，通常会导致成年人身材矮小。受影响的儿童也往往有频繁的上呼吸道感染。患有天冬氨酰葡萄糖胺尿症的人通常会活到成年中期。

AGA基因中的突变导致天冬氨酰葡萄糖胺尿症。AGA基因提供了产生称为天冬氨酰氨基葡萄糖苷酶的指令。这种酶在溶酶体中具有活性，溶酶体是细胞内充当回收中心的结构。在溶酶体内，酶有助于分解附着在某些蛋白质(糖蛋白)上的糖分子的复合物(寡糖)。

AGA基因突变导致溶酶体中天冬氨酰氨基葡萄糖苷酶的缺失或缺乏，从而阻止糖蛋白的正常分解。结果，糖蛋白可在溶酶体内积聚。过量的糖蛋白会破坏细胞的正常功能，并可能导致细胞破坏。糖蛋白的堆积似乎特别影响大脑中的神经细胞；这些细胞的损失会导致天冬氨酰葡萄糖胺尿症的许多体征和症状。

Farber病

Farber病是一种遗传性病症，涉及体内脂肪的分解和使用(脂质代谢)。患有这种病症的人在整个身体的细胞和组织中，特别是在关节周围存在异常的脂质(脂肪)积累。Farber病的特点是三个典型症状：声音嘶哑或哭声微弱，皮下和其它组织中的小脂肪块(脂肪肉芽肿)，以及关节肿胀和疼痛。其它症状可包括呼吸困难、肝脏和脾脏肿大(肝脾肿大)和发育迟缓。研究人员根据其特征性特征描述了七种类型的Farber病。这种病症是由ASAH1基因中的突变引起的，并以常染色体隐性方式遗传。

泰-萨克斯病

泰-萨克斯病是一种罕见的遗传性病症，会逐渐破坏大脑和脊髓中的神经细胞(神经元)。

泰-萨克斯病最常见的形式在婴儿期变得明显。患有这种病症的婴儿通常在3到6个月年龄之前表现正常，此时他们的发育减慢并且用于运动的肌肉变弱。受影响的婴儿会失去运动技能，例如翻身、坐姿和爬行。他们还会对大声的噪音产生夸张的惊吓反应。随着疾病的进展，患有泰-萨克斯病的儿童会出现癫痫发作、视力和听力丧失、智力障碍和瘫痪。这种病症的特点是一种称为樱桃红斑的眼睛异常，可以通过眼科检查来识别。患有这种严重婴儿型泰-萨克斯病的儿童通常只能活到幼儿期。

其它形式的泰-萨克斯病病非常罕见。体征和症状可能出现在儿童期、***或成年期，并且通常比婴儿形式看到的症状和症状要轻。特征性特征包括肌肉无力、肌肉协调性丧失(共济失调)和其它运动问题、言语问题和精神疾病。这些体征和症状在患有迟发性形式的泰-萨克斯病的人群中差异很大。

HEXA基因中的突变导致泰-萨克斯病。HEXA基因提供了制备称为β-己糖胺酶A的酶的一部分的指令，该酶在大脑和脊髓中起关键作用。这种酶位于溶酶体中，溶酶体是细胞中分解有毒物质并充当回收中心的结构。在溶酶体内，β-己糖胺酶A有助于分解一种叫做GM2神经节苷脂的脂肪物质。

HEXA基因中的突变破坏了β-己糖胺酶A的活性，从而阻止酶分解GM2神经节苷脂。结果，这种物质积累到毒性水平，特别是在大脑和脊髓的神经元中。由GM2神经节苷脂的堆积引起的进行性损伤会导致这些神经元的破坏，从而导致泰-萨克斯病病的体征和症状。

因为泰-萨克斯病损害溶酶体酶的功能并涉及GM2神经节苷脂的堆积，这种病症有时被称为溶酶体贮积症或GM2-神经节苷脂贮积病。

庞贝氏病

庞贝氏病(也称为糖原贮积病II型；酸性α-葡糖苷酶缺乏症；酸性麦芽糖酶缺乏症；GAA缺乏症；GSD II；糖原病II型；糖原病，全身性，心脏型；弥漫性糖原性心肥大；酸性麦芽糖酶缺乏症；AMD；或α-1,4-葡萄糖苷酶缺乏症)是一种常染色体隐性代谢遗传病症，其特点是溶酶体酶酸性α-葡萄糖苷酶(GAA)(也称为酸性麦芽糖酶)的基因中的突变。GAA基因中的突变消除或降低了GAA酶水解糖原、麦芽糖和异麦芽糖中的α-1,4和α-1,6键的能力。结果，糖原在全身细胞的溶酶体和细胞质中积累，导致细胞和组织破坏。特别受影响的组织包括骨骼肌和心肌。积累的糖原导致进行性肌肉无力，导致心脏肥大、行走困难和呼吸功能不全。

已经确定了三种类型的庞贝氏病，包括典型的婴儿期发病的疾病、非经典型婴儿期发病的疾病和迟发型疾病。典型的婴儿期发病形式的特点是肌肉无力、肌张力差、肝肿大和心脏缺陷。该疾病的发病率约为140,000人中1人。患有这种形式疾病的患者通常在出生后的第一年死于心力衰竭。该疾病的非经典婴儿期发病形式的特点是运动技能延迟、进行性肌肉无力和在某些情况下心脏肥大。由于呼吸衰竭，患有这种形式疾病的患者通常只能活到幼儿期。迟发形式的疾病可能出现在童年晚期、***或成年期，并且特点是腿部和躯干进行性肌肉无力。

尼曼匹克病

尼曼匹克病是一种影响许多身体***的病症。它的症状范围很广，严重程度各不相同。尼曼匹克病分为四种主要类型：A型、B型、C1型和C2型。这些类型基于遗传原因和病症的体征和症状进行分类。

患有A型尼曼匹克病的婴儿通常会在3个月大时出现肝脏和脾脏肿大(肝脾肿大)，并且无法以预期的速度增加体重和生长(无法茁壮成长)。受影响的儿童发育正常，直到1岁左右，他们的心智能力和运动能力逐渐丧失(精神运动退化)。患有A型尼曼匹克病的儿童也会出现广泛的肺损伤(间质性肺病)，可导致反复肺部感染并最终导致呼吸衰竭。所有受影响的儿童都有一种称为樱桃红斑的眼睛异常，可以通过眼科检查来识别。患有A型尼曼匹克病的儿童通常无法存活过幼儿期。

B型尼曼匹克病通常出现在儿童中期。这种类型的体征和症状与A型相似，但没有那么严重。患有B型尼曼匹克病的患者通常有肝脾肿大、反复肺部感染和血液中的血小板数低(血小板减少症)。它们还具有身材矮小和骨矿化缓慢(骨龄延迟)。大约三分之一受影响个体患有樱桃红斑眼异常或神经功能缺损。患有B型尼曼匹克病的人通常能活到成年。

A型和B型尼曼匹克病是由SMPD1基因中的突变引起的。该基因提供了产生一种称为酸性鞘磷脂酶的指令。这种酶存在于溶酶体中，溶酶体是细胞内分解并回收不同类型分子的隔室。酸性鞘磷脂酶负责将称为鞘磷脂的脂肪(脂质)转化为称为神经酰胺的另一种脂质。SMPD1中的突变导致酸性鞘磷脂酶缺乏，这导致鞘磷脂的分解减少，从而导致这种脂肪在细胞中积累。这种脂肪堆积会导致细胞故障并最终死亡。随着时间的推移，细胞损失会损害A型和B型尼曼匹克病患者的组织和器官(包括脑、肺、脾和肝)功能。

沃尔曼病

溶酶体酸性脂肪酶缺乏症是一种遗传性病症，其特点是体内脂肪和胆固醇的分解和使用问题(脂质代谢)。在受影响的个体中，有害数量的脂肪(脂质)积累在全身的细胞和组织中，这通常会导致肝脏疾病。有两种形式的病症。最严重和最罕见的形式始于婴儿期。不太严重的形式可以从童年开始到成年后期。

在严重的早发性形式的溶酶体酸性脂肪酶缺乏症中，在生命的最初几周内，脂质会在全身积累，尤其是在肝脏中。这种脂质积累会导致多种健康问题，包括肝脏和脾脏肿大(肝脾肿大)、体重增加不足、皮肤和眼白呈黄色(黄疸)、呕吐、腹泻、脂性粪(脂肪痢)、以及从食物中吸收营养不良(吸收不良)。此外，受影响的婴儿通常在每个肾脏顶部的产生激素的小腺体(肾上腺)中有钙沉积，血液中的铁含量低(贫血)和发育迟缓。疤痕组织在肝脏中迅速堆积，导致肝脏疾病(肝硬化)。患有这种形式溶酶体酸性脂肪酶缺乏症的婴儿会出现多器官功能衰竭和严重的营养不良，且通常活不过1年。

在迟发性形式的溶酶体酸性脂肪酶缺乏症中，体征和症状各不相同，并且通常在儿童中期开始，尽管它们可以在到成年后期的任何时间出现。几乎所有受影响的个体都会出现肝脏肿大(肝肿大)；也可能发生脾肿大(脾肿大)。大约三分之二的人患有肝纤维化，最终导致肝硬化。大约三分之一迟发性形式的个体有吸收不良、腹泻、呕吐和脂肪痢。患有这种形式溶酶体酸性脂肪酶缺乏症的个体可能会具有增加的肝酶和高胆固醇水平，这可以通过血液检查来检测。

患有这种迟发性形式溶酶体酸性脂肪酶缺乏症的一些人会在动脉壁上积累脂肪沉积物(动脉粥样硬化)。尽管这些沉积物在普通人群中很常见，但它们通常在溶酶体酸性脂肪酶缺乏症患者的较早年龄开始。沉积物使动脉变窄，增加了心脏病发作或中风的机会。患有迟发性溶酶体酸性脂肪酶缺乏症的个体的预期寿命取决于相关健康问题的严重程度。

这两种形式的溶酶体酸性脂肪酶缺乏症曾被认为是不同的病症。早发性形式称为沃尔曼病，而迟发性形式称为胆固醇酯贮积病。尽管这两种病症具有相同的遗传原因并且现在被认为是单一病症的形式，但这些名称有时仍用于区分溶酶体酸性脂肪酶缺乏症的形式。

LIPA基因中的突变导致溶酶体酸性脂肪酶缺乏症。LIPA基因提供了产生称为溶酶体酸性脂肪酶的酶的指令。这种酶存在于称为溶酶体的细胞隔室中，溶酶体可以消化并回收细胞不再需要的物质。溶酶体酸性脂肪酶分解脂类，如胆固醇酯和甘油三酯。通过这些过程产生的脂质、胆固醇和脂肪酸被身体使用或运输到肝脏以去除。

LIPA基因中的突变导致功能性溶酶体酸性脂肪酶的短缺(缺乏)。病症的严重程度取决于有多少工作酶可用。患有早发性形式溶酶体酸性脂肪酶缺乏症的个体没有正常的酶活性。患有迟发性形式的那些个体被认为保留了一些酶活性，并且其数量通常决定体征和症状的严重程度。

溶酶体酸性脂肪酶活性降低会导致胆固醇酯、甘油三酯和其它脂质在溶酶体内积聚，从而导致多个组织中的脂肪堆积。身体无法从这些脂质的分解中产生胆固醇，导致替代胆固醇产生方法的增加和血液中胆固醇水平高于正常水平。过量的脂质被运送到肝脏以去除。因为它们中的许多没有被适当地分解，因此它们无法从体内去除；相反，它们会在肝脏中积累，导致肝脏疾病。组织中脂质的进行性积累导致器官功能障碍以及溶酶体酸性脂肪酶缺乏的体征和症状。

造血干细胞

如本文所用，造血干细胞(HSC)是指动物(优选哺乳动物，更优选人类)细胞，其具有分化成多种血细胞类型的能力，包括红细胞、白细胞，包括淋巴样细胞和骨髓细胞。HSC可以包括具有体内长期移植潜力的造血细胞。可以使用动物模型或体外模型确定长期移植潜力(例如长期造血干细胞)。用于候选人类造血干细胞群的长期移植潜力的动物模型包括SCID-hu骨模型(Kyoizumi et al.(1992)Blood 79:1704；Murray et al.(1995)Blood 85(2)368-378)和子宫内绵羊模型(Zanjani et al.(1992)J.Clin.Invest.89:1179)。有关人类造血用动物模型的综述，请参见Srour et al.(1992)J.Hematother.1:143-153和其中引用的参考文献。干细胞的体外模型是长期培养起始细胞(LTCIC)测定，基于5-8周后基质共培养中产生的克隆源性细胞数量的有限稀释分析(Sutherland et al.(1990)Proc.Nat'lAcad.Sci.87:3584-3588)。LTCIC测定已被证明与另一种常用的干细胞测定(即鹅卵石区域形成细胞(CAFC)测定)相关，并且与体内长期移植潜力相关(Breems et al.(1994)Leukemia 8:1095)。

造血干细胞(HSC)存在于骨髓中，并且具有产生所有不同成熟血细胞类型和组织的独特能力。HSC是自我更新的细胞：当它们增殖时，至少它们的一些子细胞仍然是HSC，因此干细胞库不会耗尽。其它细胞分化成产生淋巴细胞的普通淋巴祖细胞和产生单核细胞的普通骨髓祖细胞。

在一些实施方式中，从骨髓中分离出用于本文基因修饰的造血干细胞。在一些实施方式中，可以使用针头或注射器从骨盆的髂嵴处取出HSC。

在一些实施方式中，造血干细胞可以来源于人类脐带血或动员的外周血。从人类外周血获得的造血干细胞可以通过多种策略之一进行动员。可用于诱导造血干细胞从骨髓动员到外周血中的示例性药剂包括趋化因子(C-X-C基序)受体4(CXCR4)拮抗剂，诸如AMD3100(也称为普乐沙福和MOZOBIL(Genzyme，Boston，Mass.))和粒细胞集落刺激因子(GCSF)，在临床实验中，它们的组合已被证明可以快速动员CD34+细胞。此外，趋化因子(C-X-C基序)配体2(CXCL2，也称为GRO)代表另一种能够诱导造血干细胞从骨髓动员到外周血的药剂。与本发明的组合物和方法一起使用的能够诱导造血干细胞动员的药剂可以彼此组合使用。例如，CXCR4拮抗剂(例如AMD3100)、CXCL2和/或GCSF可以以单一混合物顺序或同时施用于受试者，以诱导造血干细胞从骨髓动员到外周血中。这些药剂作为造血干细胞动员的诱导剂的用途描述于例如Pelus，Current Opinion in Hematology 15:285(2008)中，其公开内容通过引用并入本文。

在一些实施方式中，从循环的外周血中采集HSC，同时向献血者注射从骨髓中动员HSC的药剂。在一些实施方式中，将HSC从骨髓动员到外周血的药剂是细胞因子，例如粒细胞集落刺激因子(G-CSF)。在一些实施方式中，从外周血中分离的HSC群体富含CD34+细胞，并且包括至少50％、至少70％或至少90％的CD34+细胞。

在一些实施方式中，对于动员外周血(MPB)白细胞除去法，CD34+细胞通常可以使用免疫磁珠诸如CliniMACS进行处理和富集，可以在细胞培养级干细胞因子(SCF)存在下、在无血清培养基中将纯化的CD34+细胞以1x10⁶个细胞/ml接种在培养袋上，优选300ng/ml(Amgen Inc.，Thousand Oaks，CA，USA)，优选具有FMS-样酪氨酸激酶3配体(FLT3L)300ng/ml和促血小板生成素(TPO)，优选约100ng/ml以及进一步的白细胞介素IL-3，优选多于60ng/ml(均来自Cell Genix Technologies)，在优选12至24小时之后，转移至包括序列特异性试剂(例如，mRNA)的电穿孔缓冲液。电穿孔后，将细胞转移回培养基中，然后重新悬浮在盐水中并转移到注射器中进行输注。

用于在细胞混合物中富集或消耗特定细胞群的方法是本领域众所周知的。例如，可以通过密度分离法、玫瑰花结四元聚体抗体复合物介导的富集/去除、磁激活细胞分选(MACS)、基于多参数荧光的分子表型如荧光激活细胞分选(FACS)或其任何组合来富集或耗尽细胞群。总的来说，这些富集或消耗细胞群的方法在本文中通常可以称为“分选”细胞群或“在一定条件下”接触细胞以形成或产生富集的(+)或耗尽的(-)细胞群。

在收集动员的细胞后，取出的造血干细胞可以如本文进行基因修饰，然后输注到有需要的患者体内，该患者可以是供体或另一受试者，例如与供体至少部分HLA-匹配的受试者，用于治疗本文描述的疾病。

在一些实施方式中，这些细胞形成细胞群，其优选源自单个供体或患者。这些细胞群可以在封闭的培养接受者下扩增，以符合最高的生产实践要求，并且可以在输注到患者体内之前冷冻，从而提供“现成的”或“即用型”的治疗组合物。

在一些实施方式中，HSC是CD34+。在一些实施方式中，HSC可以被进一步描述为CD133+、CD90+、CD38-、CD45RA-、Lin-或其任何组合。

在一些实施方式中，能够分化成小胶质细胞的HSC来源于多能干细胞，如诱导多能干细胞(iPS)。参见例如Abud et al.，Neuron 94，278–293(2017)。在一些实施方式中，如本文所描述的对iPS细胞进行基因修饰并且然后分化成HSC细胞。在一些实施方式中，iPS细胞分化成HSC，然后如本文所描述的对HSC进行基因修饰。在进一步的实施方式中，可以对细胞进行基因编辑，然后重编程成iPS细胞和HSC，如例如国际申请号PCT/EP2018/083180中所描述的。在一些实施方式中，可以从待治疗的患者中分离或从相容的供体中分离造血干细胞。

在一些实施方式中，造血干细胞获自诱导多能干(iPS)细胞，该iPS细胞来源于待治疗的患者的细胞或相容的供体。

在一些实施方式中，HSC可以在基因修饰这些细胞和/或将其输注到患者体内之前进行离体扩增。参见例如美国专利号9,580,426；9,956,249；9,527,828；9,428,748；9,394,520；9,328,085；9,226,942；9,115,341；8,927,281。

在一些实施方式中，细胞分离自供体，该供体是HLA匹配的同胞供体、HLA匹配的无关供体、部分匹配的无关供体、单倍体相合相关供体、自体供体、HLA不匹配供体、供体库或其任何组合。在一些实施方式中，治疗性细胞群是同种异体的。在一些实施方式中，治疗性细胞群是自体的。在一些实施方式中，治疗性细胞群是单倍体相合的。

基因修饰的细胞

在一些实施方式中，本发明提供了根据本文描述的方法的实施方式的任一个可获得的基因修饰的HSC或iPS细胞。

在一些实施方式中，本发明提供了基因修饰的HSC或iPS细胞，其包括整合在至少在小胶质细胞中具有转录活性的基因座处的转基因，其中转基因在基因座的内源启动子的转录控制下。在一些实施方式中，转基因包括选自由IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5组成的组中的基因的编码序列。

在一些实施方式中，转基因的多个拷贝整合在HSC或iPS细胞中。在一些实施方式中，多个拷贝整合在不同的基因座处。在一些实施方式中，多个拷贝整合在同一基因座处。在一些实施方式中，整合在同一基因座处的多个拷贝由2A自切割肽序列分隔开。

在一些实施方式中，引入的转基因受小胶质细胞中内源性启动子的控制。在一些实施方式中，在小胶质细胞中具有活性的基因座选自由以下组成的组：TMEM119、S100A9、CD11B、B2m、Cx3cr1、MERTK、CD164、Tlr4、Tlr7、Cd14、Fcgr1a、Fcgr3a、TBXAS1、DOK3、ABCA1、TMEM195、MR1、CSF3R、FGD4、TSPAN14、TGFBRI、CCR5、GPR34、SERPINE2、SLCO2B1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfia4。

在一些实施方式中，基因修饰的HSC或iPS细胞包括整合在在小胶质细胞中具有转录活性的基因座处的转基因，基因座选自TMEM119、CD11B、B2m、CX3CR1或S100A9，其中转基因受基因座的内源性启动子的转录控制。

在一些实施方式中，基因修饰的造血干细胞通过直接基因修饰造血干细胞来获得。在一些实施方式中，基因修饰的造血干细胞通过基因修饰诱导的多能干(iPS)细胞并且将iPS细胞分化以成为造血干细胞来获得。

在一些实施方式中，造血干细胞(HSC)或iPS细胞被基因修饰，使得细胞在它们分化成小胶质细胞后能够表达转基因。在一些实施方式中，细胞中经基因修饰的基因座在小胶质细胞中具有转录活性。

在一些实施方式中，使富集的HSC群经受一种方法以基因修饰细胞。在一些实施方式中，富集的群包括至少50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更多的CD34+HSC。

在一些实施方式中，使用序列特异性试剂对HSC或iPS细胞进行基因修饰。在一些实施方式中，序列特异性试剂识别在小胶质细胞中表达的基因座中存在的一个或多个序列。在一些实施方式中，序列特异性试剂切割细胞中的核酸。

在一些实施方式中，本发明提供了一种制备基因修饰的HSC或iPS细胞的方法，包括将转基因整合在HSC或iPS细胞中。在一些实施方式中，该方法包括使细胞与序列特异性试剂接触，序列特异性试剂切割在小胶质细胞中表达的基因座处的核酸序列。在一些实施方式中，该方法进一步包括使细胞与包括转基因的供体核酸接触。

在一些实施方式中，用于基因编辑本发明细胞的序列特异性试剂是稀有切割核酸内切酶，例如TALE-核酸酶(以Cellectis商标

市售)。优选的试剂切割本说明书表4中报道的一种或几种靶序列。

在一些实施方式中，序列特异性试剂靶向CX3CR1的内含子，优选位于第一编码外显子和第二编码外显子之间的CX3CR1的第一个内含子(SEQ ID NO:76)。本发明还提供了特异性TALE核酸酶，其优先靶向与SEQ ID NO:77至87类似的CX3CR1的内源性多核苷酸序列。在一些实施方式中，序列特异性试剂是CRISPR-Cas或CRISPR-Cpf，其使用gRNA靶向与SEQID NO:97至106类似的内源性序列。

在一些实施方式中，序列特异性试剂靶向CD11B的内含子，优选CD11B的第一个内含子。本发明还提供了特异性TALE核酸酶，其优先靶向与SEQ ID NO:108至137类似的CD11B的内源性多核苷酸序列。在一些实施方式中，序列特异性试剂是CRISPR-Cas或CRISPR-Cpf，其使用gRNA靶向与SEQ ID NO:138至147类似的内源性序列。

在一些实施方式中，序列特异性试剂靶向S100A9的内含子，优选S100A9的第一个内含子。本发明还提供了特异性TALE核酸酶，其优先靶向与SEQ ID NO:149至178类似的S100A9的内源性多核苷酸序列。在一些实施方式中，序列特异性试剂是CRISPR-Cas或CRISPR-Cpf，其使用gRNA靶向与SEQ ID NO:179至188类似的内源性序列。

在一些实施方式中，多核苷酸模板包括如本文所描述的转基因的编码序列。在一些实施方式中，多核苷酸模板包括选自由以下组成的组的基因的编码区：IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5。

在一些实施方式中，供体核酸包括选自由以下组成的组的核苷酸序列：SEQ IDNO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35和如本文所描述的其变体。

在一些实施方式中，供体核酸编码治疗性蛋白质，该治疗性蛋白质包括从SEQ IDNO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36和如本文所描述的的其变体中选择的氨基酸序列。

在一些实施方式中，序列特异性试剂可以是包括DNA结合结构域和展示催化活性的另一结构域的嵌合多肽。这种催化活性可以是切口酶或双切口酶，以通过产生粘性末端优先进行基因***，从而通过同源重组促进基因整合。

在一些实施方式中，核酸酶试剂诱导NHEJ或同源重组机制，其具有将稳定且可遗传的突变引入在小胶质细胞中表达的基因组基因座中的优势。

“核酸酶试剂”是指通过本身或作为诸如指导RNA Cas9等复合物的亚基有助于靶细胞中核酸酶催化反应(优选核酸内切酶反应)的核酸分子，优选导致切割核酸序列靶标。

本发明的核酸酶试剂通常是“序列特异性核酸酶试剂”，意指它们可以在细胞中在预定位点诱导DNA切割，延伸称为“靶向基因”。被序列特异性试剂识别的核酸序列称为“靶序列”。所述靶序列通常被选择为在细胞基因组中是稀有的或独特的，并且在人类基因组中更广泛选择，这可以使用软件和来自人类基因组数据库的数据来确定，例如http://www.ensembl.org/index.html。

在一些实施方式中，根据本发明使用的序列特异性核酸酶试剂(其特异性切割基因座内的序列)也可用于诱导外源性模板在基因座处的整合。“外源性序列”是指最初在选定基因座处不存在的任何核苷酸或核酸序列。外源性序列优选包括编码如本文所描述的用于治疗本文疾病的治疗性多肽的序列。根据本发明的方法通过***多核苷酸进行基因修饰以表达由其编码的多肽的内源性序列，广义地称为外源性编码序列。在一些实施方式中，靶向的基因***包括编码如本文所描述的治疗性多肽的外源性序列。

美国专利号5,789,538；5,925,523；6,007,988；6,013,453；6,410,248；6,140,466；6,200,759；和6,242,568；以及WO 98/37186；WO 98/53057；WO 00/27878；WO 01/88197和GB 2,338,237中公开了适用于DNA结合结构域的示例性选择方法，包括噬菌体展示和双杂交***。

靶位点的选择；用于设计和构建融合蛋白(和编码其的多核苷酸)的核酸酶和方法是本领域技术人员已知的，并且在美国专利申请公开号20050064474和20060188987中进行详细描述，通过引用将其全部内容并入本文。

DNA结构域可以工程化为与靶基因座中选择的任何序列结合。在一些实施方式中，用序列特异性试剂对细胞进行基因修饰，该序列特异性试剂已被工程化以结合在小胶质细胞中具有转录活性的基因座。与天然存在的DNA结合域相比，工程化的DNA结合域可以具有新的结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理设计包括例如使用包括三联体(或四联体)核苷酸序列和单个(例如锌指)氨基酸序列的数据库，其中每个三联体或四联体核苷酸序列与DNA结合结构域的一个或多个氨基酸序列相关联，氨基酸序列结合特定的三联体或四联体序列。参见，例如，美国专利号6,453,242和6,534,261，通过引用将其全部内容并入本文。也可以进行TAL效应物结构域的合理设计。参见例如美国专利申请公开号2011/0301073。

此外，如这些和其它参考文献中所公开的，可以使用任何合适的接头序列将DNA结合结构域(例如多指锌指蛋白)连接在一起，包括例如5个或更多个氨基酸的接头。对于长度为6个或更多氨基酸的示例性接头序列，参见例如题美国专利号6,479,626；6,903,185；和7,153,949。本文所描述的蛋白质可以在蛋白质的各个DNA结合结构域之间包括适合接头的任何组合。还参见美国专利申请公开号2011/0301073。

包括转基因的外源性/供体序列在其整个长度上与在小胶质细胞中表达的基因座内的序列不相同。供体序列可以含有由有两个同源区侧翼的非同源序列，以允许在目的位置进行有效的HDR。替代地，供体可能与DNA中的靶位置没有同源区域，并且可以在靶位点切割后通过NHEJ依赖性末端连接进行整合。此外，供体序列可以包括载体分子，该载体分子含有与细胞染色质中目的区域不同源的序列。供体分子可以含有多个与细胞染色质同源的不连续区域。例如，为了靶向***通常不存在于目的区域中的序列，所述序列可以存在于供体核酸分子中并且由与目的区域中的序列同源的区域侧翼。

在一些实施方式中，序列特异性试剂是编码“工程化的”或“可编程的”稀有切割核酸内切酶的核酸，稀有切割核酸内切酶诸如例如WO 2004067736中描述的归巢核酸内切酶、例如Urnov F.,et al.(Nature 435:646-651(2005))描述的锌指核酸酶(ZFN)、例如Mussolino et al.(Nucl.Acids Res.39(21):9283-9293(2011))描述的TALE-核酸酶、或例如Boissel et al.(Nucleic Acids Research 42(4):2591 -2601(2013))描述的MegaTAL核酸酶。

在一些实施方式中，核酸内切酶试剂瞬时表达到细胞中，这意味着该试剂不应该整合到基因组中或长时间持续存在，例如RNA(更特别是mRNA)、蛋白质或者混合蛋白质和核酸的复合物(例如：核糖核蛋白)的情况。

在一些实施方式中，序列特异性试剂是在靶基因座引入DNA双链断裂的核酸酶，利用其随后的修复来实现不同的结果。在一些实施方式中，基于同源重组的修复途径可用于从引入的DNA同源模板复制信息。此类同源定向修复(HDR)可促进特异性添加外源性多核苷酸序列(参见例如美国专利号8,921,332)，例如本文描述的转基因，其可以在存在于外源性多核苷酸序列上的启动子的控制下表达。在一些实施方式中，如本文描述的转基因可以在内源性启动子的控制下表达，并且同时实现该基因破坏。在实现基因破坏的一些实施方式中，转基因***在内源性基因的终止密码子处并且包括自切割2A肽或IRES序列。在更优选的实施方式中，转基因在内源性启动子的控制下表达而没有基因破坏。在一些实施方式中，可以利用非同源末端连接(NHEJ)修复途径(参见例如美国专利号9,458,439；He et al.,Nucleic Acids Research，44e85，https://doi.org/10.1093/nar/gkw064)。

在一些实施方式中，一种或多种靶核酸酶(例如，CRISPR/Cas、ZFNS或TALEN)在小胶质细胞中表达的基因座处在靶序列(例如细胞染色质)中产生双链断裂。在一些实施方式中，将包括编码治疗性蛋白质的转基因和与断裂区域侧翼的核苷酸序列同源的供体多核苷酸引入细胞中。已显示双链断裂的存在有助于供体序列的整合。供体序列可以物理整合，或者替代地，将供体多核苷酸用作模板，以通过同源重组修复断裂，导致将如供体中的核苷酸序列的全部或部分引入到细胞染色质中。因此，可以改变并且在某些实施方式中可以修饰在小胶质细胞中表达的基因座处的细胞染色质中的序列，以包括在供体多核苷酸中存在的序列。

在一些实施方式中，外源性核苷酸序列(包括转基因的“供体序列”)可以含有与在小胶质细胞中表达的目的基因座中的基因组序列同源但不相同的序列，从而刺激同源重组以在目的基因座中***不同序列。在一些实施方式中，与目的基因座中的序列同源的供体序列的部分与被替换的基因组序列表现出约70％至99％(或它们之间的任何整数)的序列同一性。在其它实施方式中，供体和基因组序列之间的同源性高于99％，例如如果在超过100个连续碱基对上供体和基因组序列之间只有1个核苷酸不同。供体序列的非同源部分含有目标基因座中不存在的序列，从而将新序列，即编码转基因的序列，引入目标基因座中。在一些实施方式中，非同源序列的侧翼通常为50-1,000个碱基对(或它们之间的任何整数值)或任何数量大于1,000的碱基对的序列，其与目的基因座中的序列同源或相同。在一些实施方式中，供体序列与第一序列非同源，并通过非同源重组机制***基因组。

核酸酶可以靶向在小胶质细胞中具有活性的基因以***转基因。在一些实施方式中，核酸酶是非天然存在的，即在DNA结合结构域和/或切割结构域中工程化。例如，可以改变天然存在的核酸酶或核酸酶***的DNA结合结构域以结合选定的靶位点(例如，已经工程化以结合与同源结合位点不同的位点的大范围核酸酶或利用工程化的单向导RNA的CRISPR/Cas***)。在其它实施方式中，核酸酶包括异源性DNA结合结构域和切割结构域(例如，锌指核酸酶；TAL效应物核酸酶；具有异源性切割结构域的大范围核酸酶DNA结合结构域)。

在一些实施方式中，核酸酶是大范围核酸酶(归巢核酸内切酶)。非天然存在的大范围核酸酶识别15-40个碱基对切割位点，并且通常分为四个家族：LAGLIDADG家族、GIY-YIG家族、His-Cyst盒家族和HNH家族。示例性的归巢核酸内切酶包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。它们的识别序列是已知的。还参见美国专利号5,420,032；美国专利号6,833,252；Belfort et al.(1997)Nucleic Acids Res.25:3379-3388；Dujon et al.(1989)Gene 82:115-118；Perler et al.(1994)Nucleic Acids Res.22,1125-1127；Jasin(1996)Trends Genet.12:224-228；Gimble et al.(1996)J.Mol.Biol.263:163-180；Argast etal.(1998)J.Mol.Biol.280:345-353以及新英格兰生物实验室目录。

在一些实施方式中，核酸酶包括工程化的(非天然存在的)归巢核酸内切酶(大范围核酸酶)。在一些实施方式中，归巢核酸内切酶和大范围核酸酶的DNA结合特异性可以被工程化以结合非天然靶位点。参见例如Chevalier et al.(2002)Molec.Cell 10:895-905；Epinat et al.(2003)Nucleic Acids Res.31:2952-2962；Ashworth et al.(2006)Nature441:656-659；Paques et al.(2007)Current Gene Therapy 7:49-66；美国专利公开号20070117128。归巢核酸内切酶和大范围核酸酶的DNA结合结构域可以在整个核酸酶的背景下发生改变(即使得核酸酶包括同源切割结构域)或可以融合到异源性切割结构域。

在一些实施方式中，DNA结合结构域包括天然存在的或工程化的(非天然存在的)TAL效应物DNA结合结构域。参见例如美国专利申请公开号2011/0301073，其通过引用整体并入本文。已知黄单胞菌属(genus Xanthomonas)的植物病原菌在重要的农作物中引起许多疾病。黄单胞菌的致病性取决于保守的III型分泌(T3S)***，该***将超过25种不同的效应蛋白注入植物细胞。在这些注入的蛋白质中有转录激活器样效应物(TALE)，它模拟植物转录激活器并操纵植物转录组(Kay et al.(2007)Science 318:648-651)。这些蛋白质含有DNA结合结构域和转录激活结构域。表征最完善的TALE之一是来自野油菜黄单胞菌辣椒斑点病致变种(Xanthomonas campestgris pv.Vesicatoria)的AvrBs3(见Bonas et al.(1989)Mol Gen Genet 218:127-136和WO 2010/079430)。TALE含有串联重复的集中结构域，每个重复含有约34个氨基酸，这是这些蛋白质DNA结合特异性的关键。此外，它们含有核定位序列和酸性转录激活结构域(对于综述，参见Schornack S,et al.(2006)J PlantPhysiol 163(3):256-272)。此外，在植物病原菌青枯雷尔氏菌中发现了两个基因，称为brg11和hpx17，它们与青枯雷尔氏菌生物变型1菌株GMI1000和生物变型4菌株RS1000中的黄单胞菌属的AvrBs3家族同源(参见Heuer et al.(2007)Appl and Envir Micro 73(13):4379-4384)。这些基因在核苷酸序列上彼此有98.9％的同一性，但不同之处在于在hpx17的重复结构域中缺失了1,575bp。然而，两个基因产物与黄单胞菌的AvrBs3家族蛋白的序列同一性均低于40％。

在一些实施方式中，与靶基因座中的靶位点结合的DNA结合结构域是来自TAL效应物的工程化结构域，类似于源自植物病原体黄单胞菌(参见Boch et al.(2009)Science326:1509-1512和Moscou and Bogdanove(2009)Science 326:1501)和雷尔氏菌(参见Heuer et al.(2007)Applied and Environmental Microbiology 73(13):4379-4384)；美国专利号8,420,782和8,440,431以及美国专利申请公开号2011/0301073)的那些效应物。

在一些实施方式中，DNA结合结构域包括锌指蛋白。在一些实施方式中，锌指蛋白是非天然存在的，因为它被工程化以结合选择的靶位点。参见例如Beerli et al.(2002)Nature Biotechnol.20:135-141；Pabo et al.(2001)Ann.Rev.Biochem.70:313-340；Isalan et al.(2001)Nature Biotechnol.19:656-660；Segal et al.(2001)Curr.Opin.Biotechnol.12:632-637；Choo et al.(2000)Curr.Opin.Struct.Biol.10:411-416；美国专利号6,453,242；6,534,261；6,599,692；6,503,717；6,689,558；7,030,215；6,794,136；7,067,317；7,262,054；7,070,934；7,361,635；7,253,273；和美国专利申请公开号2005/0064474；2007/0218528；2005/0267061，全部通过引用将其全部内容并入本文。

与天然存在的锌指蛋白相比，工程化的锌指结合或TALE结构域可以具有新的结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理设计包括例如使用包括三联体(或四联体)核苷酸序列和单独的锌指氨基酸序列的数据库，其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的锌指的一个或多个氨基酸序列相关联。参见例如美国专利号6,453,242和6,534,261，通过引用将其全部内容并入本文。

在一些实施方式中，DNA结构域(例如，多指锌指蛋白或TALE结构域)可以使用任何合适的接头序列连接在一起，包括例如长度为5个或更多个氨基酸的接头。对于长度为6个或更多个氨基酸的示例性接头序列，还参见美国专利号6,479,626；6,903,185；和7,153,949。本文描述的DNA结合蛋白可以在蛋白质的各个锌指之间包括适合接头的任何组合。此外，在共同拥有的WO 02/077227中已经描述了对锌指结合结构域的结合特异性的增强。

用于设计和构建融合蛋白(和编码它们的多核苷酸)的DNA结合结构域和方法是本领域技术人员已知的，并且在美国专利号6,140,0815；789,538；6,453,242；6,534,261；5,925,523；6,007,988；6,013,453；6,200,759；WO 95/19431；WO 96/06166；WO 98/53057；WO98/54311；WO 00/27878；WO 01/60970WO 01/88197；WO 02/099084；WO 98/53058；WO 98/53059；WO 98/53060；WO 02/016536和WO 03/016496以及美国专利申请公开号2011/0301073中进行了详细地描述。

可以将任何合适的切割结构域可操作地连接至DNA结合结构域以形成核酸酶。例如，已将ZFP DNA-结合结构域与核酸酶结构域融合以创建ZFN-一种功能实体，其能够通过其工程化(ZFP)DNA结合结构域识别其预期的核酸靶，并导致DNA在ZFP结合位点附近经由核酸酶活性被切割。参见例如Kim et al.(1996)Proc Nat'l Acad Sci USA 93(3):1156-1160。最近，ZFN已被用于多种生物体中的基因组修饰。参见例如美国专利申请公开号：2003/0232410；2005/0208489；2005/0026157；2005/0064474；2006/0188987；2006/0063231；以及国际公开WO 07/014275。同样地，已经将TALE DNA-结合结构域融合至核酸酶结构域以创建TALEN。参见例如美国专利申请公开号2011/0301073。

如上所看到的，切割结构域可以与DNA结合结构域异源，例如锌指DNA结合结构域和来自核酸酶的切割结构域或TALEN DNA-结合结构域和切割结构域，或大范围核酸酶DNA结合结构域和来自不同核酸酶的切割结构域。异源性切割结构域可以从任何核酸内切酶或核酸外切酶获得。可以衍生切割结构域的示例性核酸内切酶包括但不限于限制性核酸内切酶和归巢核酸内切酶。参见例如2002-2003Catalogue，New England Biolabs，Beverly，Mass.；和Belfort et al.(1997)Nucleic Acids Res.25:3379-3388。切割DNA的其它酶是已知的(例如S1核酸酶；绿豆核酸酶；胰腺DNase I；微球菌核酸酶；酵母HO核酸内切酶；还参见Linn et al.(eds.)Nucleases，Cold Spring Harbor Laboratory Press，1993)。可以将这些酶(或其功能片段)中的一种或多种用作切割结构域和切割半结构域的来源。

类似地，切割半结构域可以衍生自任何核酸酶或其部分，如上所给出的，其需要二聚化以实现切割活性。通常，如果融合蛋白包括切割半结构域，则切割需要两种融合蛋白。替代地，可以使用包括两个切割半结构域的单一蛋白质。两个切割半结构域可以来自相同的核酸内切酶(或其功能片段)，或每个切割半结构域可以衍生自不同的核酸内切酶(或其功能片段)。此外，优选使两个融合蛋白的靶位点相对于彼此布置，使得两个融合蛋白与其各自靶位点的结合将切割半结构域置于彼此的空间方向上，从而允许切割半结构域形成功能性切割结构域，例如，通过二聚化。因此，在某些实施方案中，靶位点的近边缘被5-8个核苷酸或15-18个核苷酸分隔开。然而，任何整数个核苷酸或核苷酸对都可以***两个靶位点之间(例如，2到50个核苷酸对或更多)。通常，切割位点位于靶位点之间。

在一些实施方式中，二聚化切割半结构域包括一个非活性切割结构域和一个活性切割结构域，使得靶向的DNA在一条链上被切口而不是被完全切割(“切口酶”，参见美国专利申请公开号2010/0047805)。在其它实施方式中，使用两对此种切口酶来切割靶，其在两条DNA链上都有切口。

限制性核酸内切酶(限制性内切酶)存在于许多物种中，并且能够与DNA序列特异性结合(在识别位点)，并在结合位点处或附近切割DNA。某些限制性酶(例如IIS型)在从识别位点移除的位点切割DNA，并具有可分离的结合和切割结构域。例如，IIS型酶Fok I催化DNA的双链切割，在一条链上距其识别位点9个核苷酸并且在另一条链上距其识别位点13个核苷酸。参见例如美国专利号5,356,802；5,436,150和5,487,994；以及Li et al.(1992)Proc.Natl.Acad.Sci.USA 89:4275-4279；Li et al.(1993)Proc.Natl.Acad.Sci.USA 90:2764-2768；Kim et al.(1994)Proc.Natl.Acad.Sci.USA 91:883-887；Kim et al.(1994)J.Biol.Chem.269:31,978-31,982。在一个实施方式中，融合蛋白包括来自至少一种IIS型限制性酶的切割结构域(或切割半结构域)和一个或多个锌指结合结构域，其可以工程化或可以不经工程化。

切割结构域与结合域可分离的示例性IIS型限制酶是Fok I。该特定酶作为二聚体具有活性。Bitinaite et al.(1998)Proc.Natl.Acad.Sci.USA 95：10,570-10,575。因此，出于本公开的目的，在所公开的融合蛋白中使用的Fok I酶的部分被认为是切割半结构域。因此，对于使用锌指-Fok I融合物的细胞序列的靶向双链切割和/或靶向置换，可以使用各自包括Fok I切割半结构域的两种融合蛋白来重构催化活性切割结构域。替代地，也可以使用包括DNA结合结构域和两个Fok I切割半结构域的单个多肽分子。

切割结构域或切割半结构域可以是保留切割活性或保留多聚化(例如二聚化)以形成功能性切割结构域的能力的蛋白质的任何部分。

整体并入本文的国际公开WO 07/014275中描述了示例性的IIS型限制性酶。其它限制性酶也含有可分开的结合结构域和切割结构域，并且本公开预期了这些。参见例如Roberts et al.(2003)Nucleic Acids Res.31:418-420。

在某些实施方式中，切割结构域包括一种或多种工程化的切割半结构域(也称为二聚化结构域突变体)，其最小化或防止同二聚化，如例如美国专利申请公开号2005/0064474；2006/0188987和2008/0131962中所描述的，它们的全部公开内容均通过引用整体并入本文。Fok I的位置446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538的氨基酸残基都是影响Fok I切割半结构域二聚化的靶。

形成专性异二聚体的示例性工程化的Fok I切割半结构域包括一对，其中第一个切割半结构域在Fok I的位置490和538的氨基酸残基处包括突变，并且第二个切割半结构域在氨基酸残基486和499处包括突变。

因此，在一个实施方式中，490处的突变将Glu(E)替换为Lys(K)；538处的突变将Iso(I)替换为Lys(K)；486处的突变将Gln(Q)替换为Glu(E)；并且位置499处的突变将Iso(I)替换为Lys(K)。具体地，在一个切割半结构域中通过突变位置490(E→K)和538(I→K)以产生命名为“E490K:1538K”的工程化的切割半结构域并且在另一切割半结构域中通过突变位置486(Q→E)和499(I→L)以产生命名为“Q486E:I499L”的工程化的切割半结构域，来制备本文描述的工程化的切割半结构域。本文描述的工程化的切割半结构域是专性异二聚体突变体，其中异常切割被最小化或消除。参见例如美国专利公开号2008/0131962，其公开的全部内容通过引用整体并入用于所有目的。

在一些实施方式中，工程化的切割半结构域在位置486、499和496(相对于野生型Fok I编号)包括突变，例如这样的突变：将位置486处的野生型Gln(Q)残基替换为Glu(E)残基，将位置499处的野生型Iso(I)残基替换为Leu(L)残基和将位置496处的野生型Asn(N)残基替换为Asp(D)或Glu(E)残基(也分别称为“ELD”和“ELE”结构域)。在其它实施方式中，工程化的切割半结构域在位置490、538和537(相对于野生型FokI编号)处包括突变，例如这样的突变：将位置490处的野生型Glu(E)残基替换为Lys(K)残基，将位置538处的野生型Iso(I)残基替换为Lys(K)残基和将位置537处的野生型His(H)残基替换为Lys(K)残基或Arg(R)残基(也分别称为"KKK"和"KKR"结构域)。在其它实施方式中，工程化的切割半结构域在位置490和537(相对于野生型FokI编号)处包括突变，例如这样的突变：将位置490处的野生型Glu(E)残基替换为Lys(K)残基和将位置537处的野生型His(H)残基替换为Lys(K)残基或Arg(R)残基(也分别称为"KIK"和"KIR"结构域)。(参见美国专利申请公开号2011/0201055，通过引用并入本文)。可以使用任何适合的方法制备本文描述的工程化的切割半结构域，例如通过如美国专利申请公开号2005/0064474；2008/0131962；和2011/0201055中描述的野生型切割半结构域(Fok I)的位点定向诱变。

在一些实施方式中，可以使用所谓的“***酶”技术在体内在核酸靶位点组装核酸酶(参见例如美国专利申请公开号2009/0068164)。此类***酶的组分可以在单独的表达构建体上表达，或者可以连接在一个开放阅读框中，其中各个组分例如通过自切割2A肽或IRES序列分隔开。组分可以是单独的锌指结合结构域或大范围核酸酶核酸结合结构域的结构域。

可以在使用前筛选核酸酶的活性，例如在WO 2009/042163和2009/0068164中描述的基于酵母的染色体***中。可以使用本领域已知的方法容易地设计核酸酶表达构建体。参见例如美国专利申请公开号：2003/0232410；2005/0208489；2005/0026157；2005/0064474；2006/0188987；2006/0063231；和国际公开WO 07/014275。核酸酶的表达可以在组成型启动子或诱导型启动子的控制下，例如半乳糖激酶启动子，其在棉子糖和/或半乳糖存在下被激活(去抑制)并且在葡萄糖存在下被抑制。

在一些实施方式中，核酸内切酶试剂是要与RNA引导的核酸内切酶结合使用的RNA指导，例如Cas9或Cpf1，诸如尤其根据Doudna,J.et al.,(Science 346(6213)：1077)(2014))和Zetsche,B.et al.(Cell 163(3)：759-771(2015))的教导，其教导通过引用并入本文。

在一些实施方式中，使用CRISPR(簇状规则间隔的短回文重复序列)/Cas(CRISPR相关的)核酸酶***来对细胞进行基因修饰。CRISPR/Cas是一种基于细菌***的工程化核酸酶***，可用于基因组工程。它基于许多细菌和古细菌的适应性免疫反应的一部分。当病毒或质粒入侵细菌时，入侵者的DNA区段会通过‘免疫’反应转化为CRISPR RNA(crRNA)。然后，该crRNA通过部分互补的区域与另一种称为tracrRNA的RNA相关联，以将Cas9核酸酶引导至与靶DNA中称为“原型间隔区”的crRNA同源的区域。Cas9切割DNA以在DSB处在由crRNA转录本中包括的20个核苷酸引导序列指定的位点处产生平末端。Cas9需要crRNA和tracrRNA进行位点特异性DNA识别和切割。该***现已经工程化，使得crRNA和tracrRNA可以组合成一个分子(“单向导RNA”)，并且单向导RNA的crRNA等效部分可以工程化为引导Cas9核酸酶以靶向任何所需的序列(参见Jinek et al.(2012)Science 337，p.816-821，Jinek et al.,(2013)，eLife 2:e00471，和David Segal，(2013)eLife 2:e00563)。

编码***的RNA组分的CRISPR(簇状规则间隔的短回文重复序列)基因座以及编码蛋白质的cas(CRISPR-相关的)基因座(Jansen et al.,2002.Mol.Microbiol.43:1565-1575；Makarova et al.,2002.Nucleic Acids Res.30:482-496；Makarova et al.,2006.Biol.Direct 1:7；Haft et al.,2005.PLoS Comput.Biol.1:e60)构成了CRISPR/Cas核酸酶***的基因序列。微生物宿主中的CRISPR基因座含有CRISPR相关(Cas)基因以及能够编程CRISPR介导的核酸切割特异性的非编码RNA元件的组合。

II型CRISPR是表征最完善的***之一，并且在四个连续步骤中进行靶向DNA双链断裂。首先，从CRISPR基因座转录两个非编码RNA，前-crRNA阵列和tracrRNA。其次，tracrRNA与前-crRNA的重复区域杂交，并介导前-crRNA加工成含有单个间隔区序列的成熟crRNA。第三，成熟的crRNA:tracrRNA复合物通过crRNA上的间隔区和与原型间隔区相邻基序(PAM)相邻的靶DNA上的原型间隔区之间的沃森-克里克碱基配对将Cas9引导至靶DNA，这是对靶标识别的附加需求。最后，Cas9介导靶DNA的切割，以在原型间隔区内产生双链断裂。CRISPR/Cas***的活性包括三个步骤：(i)在称为“适应”的过程中，将外来DNA序列***CRISPR阵列以防止未来的攻击，(ii)表达相关蛋白质以及表达和处理阵列，然后是(iii)RNA介导的对外来核酸的干扰。因此，在细菌细胞中，多种所谓的‘Cas’蛋白涉及CRISPR/Cas***的自然功能，并在诸如***外来DNA等功能中发挥作用。

在某些实施方式中，Cas蛋白可以是天然存在的Cas蛋白的“功能衍生物”。天然序列多肽的“功能衍生物”是具有与天然序列多肽共同的定性生物学特性的化合物。“功能衍生物”包括但不限于天然序列的片段和天然序列多肽的衍生物及其片段，条件是它们具有与相应天然序列多肽共同的生物学活性。本文所考虑的生物活性是功能衍生物将DNA底物水解成片段的能力。术语“衍生物”包括多肽的氨基酸序列变体、共价修饰及其融合物。Cas多肽或其片段的合适衍生物包括但不限于Cas蛋白或其片段的突变体、融合体、共价修饰。Cas蛋白(包括Cas蛋白或其片段)以及Cas蛋白或其片段的衍生物可以从细胞中获得或化学合成或通过这两种程序的组合获得。细胞可以是天然产生Cas蛋白的细胞，或天然产生Cas蛋白并且经基因工程化以更高表达水平产生内源性Cas蛋白或从外源引入的核酸产生Cas蛋白的细胞，该核酸编码与内源性Cas相同或不同的Cas。在某些情况下，细胞不会自然产生Cas蛋白，而是经过基因工程化以产生Cas蛋白。还包括在本发明含义中的RNA引导的核酸内切酶中的是核酸内切酶Cpf1，如Zetsche,B.et al.(Cell 163(3)：759-771(2015))所教导的。

Cas9相关的CRISPR/Cas***包括两个RNA非编码组分：tracrRNA和前-crRNA阵列，其含有由相同直接重复(DR)间隔的核酸酶引导序列(间隔区)。为了使用CRISPR/Cas***来完成基因组工程化，这些RNA的两种功能必须存在(参见Cong et al.,(2013)Sciencexpress 1/10.1126/science 1231143)。在一些实施方式中，通过单独的表达构建体或作为单独的RNA提供tracrRNA和前-crRNA。在其它实施方式中，构建了嵌合RNA，其中工程化的成熟crRNA(赋予靶特异性)与tracrRNA(提供与Cas9的相互作用)融合以产生嵌合cr-RNA-tracrRNA杂合体(也称为单一引导RNA)。

递送方法

核酸酶、编码这些核酸酶的多核苷酸、供体多核苷酸和用于对细胞进行基因修饰的包括本文描述的蛋白质和/或多核苷酸的组合物可以通过任何合适的方式在体内或离体递送。

在一些实施方式中，由于将编码多肽的多核苷酸引入细胞，因此多肽可以在细胞中原位合成。在一些实施方式中，多肽可以在细胞外产生，然后引入细胞中。用于将多核苷酸构建体引入细胞的方法是本领域已知的并且作为非限制性实例包括其中将多核苷酸构建体整合到细胞基因组中的稳定转化方法，其中不将多核苷酸构建体整合到细胞基因组中的瞬时转化方法以及病毒介导的方法。在一些实施方式中，可以通过重组病毒载体(例如逆转录病毒、腺病毒)、脂质体等将多核苷酸引入细胞中。例如，瞬时转化方法包括例如显微注射、电穿孔或粒子轰击。考虑到在细胞中表达，多核苷酸可以包括在载体中，更特别是质粒或病毒中。楼板

在一些实施方式中，用编码核酸内切酶试剂的核酸转染细胞。在一些实施方式中，到转染后30小时，优选到转染后24小时，更优选到转染后20小时，80％的核酸内切酶试剂被降解。

在一些实施方式中，根据本领域众所周知的技术，可以使用帽来合成由mRNA编码的核酸内切酶以增强其稳定性，如例如Kore A.L.,et al.(Locked nucleic acid(LNA)-modified dinucleotide mRNA cap analogue：synthesis，enzymatic incorporation，andutilization(2009)J Am Chem Soc.131(18):6364-5)描述的。

在一些实施方式中，如本文所描述的核酸酶和/或供体构建体也可以使用含有编码CRISPR/Cas***、锌指或TALEN蛋白中一种或多种的序列的载体来递送。可以使用任何载体***，包括但不限于质粒载体、逆转录病毒载体、慢病毒载体、腺病毒载体、痘病毒载体；疱疹病毒载体和腺相关病毒载体等。还参见美国专利号6,534,261；6,607,882；6,824,978；6,933,113；6,979,539；7,013,219；和7,163,824，通过引用将其整体并入本文。此外，显然这些载体中的任何一种都可以包括治疗所需的一种或多种序列。因此，当将一种或多种核酸酶和供体构建体引入细胞中时，核酸酶和/或供体多核苷酸可以携带在同一载体或不同载体上。当使用多个载体时，每个载体可以包括编码一种或多种核酸酶和/或供体构建体的序列。

常规的基于病毒和非病毒的基因转移方法可用于将编码核酸酶的核酸和供体构建体引入细胞(例如哺乳动物细胞)和靶组织中。

病毒载体递送***包括DNA和RNA病毒，它们在递送到细胞后具有附加型(episomal，游离型)或整合的基因组。对于基因疗法程序的综述，参见Anderson，Science256:808-813(1992)；Nabel&Feigner，TIBTECH 11:211-217(1993)；Mitani&Caskey，TIBTECH 11:162-166(1993)；Dillon，TIBTECH 11:167-175(1993)；Miller,Nature 357:455-460(1992)；Van Brunt，Biotechnology 6(10):1149-1154(1988)；Vigne，RestorativeNeurology and Neuroscience 8:35-36(1995)；Kremer&Perricaudet，British MedicalBulletin 51(1):31-44(1995)；Haddada et al.，in Current Topics in Microbiologyand Immunology，Doerfler and Bohm(eds.)(1995)；和Yu et al.,Gene Therapy 1:13-26(1994)。

在一些实施方式中，核酸的非病毒递送方法包括电穿孔、脂质转染、显微注射、基因枪、病毒体、脂质体、免疫脂质体、聚阳离子或脂质：核酸缀合物、裸DNA、裸RNA、加帽RNA、人工病毒体和试剂增强的DNA吸收。使用例如Sonitron 2000***(Rich-Mar)的声穿孔也可用于核酸的递送。

在一些实施方式中，电穿孔步骤可用于转染细胞。在一些实施方式中，这些步骤通常在包括平行板电极的封闭室中进行，在所述平行板电极之间产生大于100伏特/cm且小于5,000伏特/cm的脉冲电场，在整个治疗体积中基本均匀，例如在WO 2004/083379中描述的，其通过引用并入，尤其是从第23页第25行至第29页第11行。一种此类电穿孔室优选地具有由电极间隙的平方(cm²)除以室体积(cm³)的商定义的几何因子(cm^-1)，其中几何因子小于或等于0.1cm^-1，其中细胞和序列特异性试剂的悬浮液在培养基中，该培养基经过调整，使培养基的电导率在0.01至1.0毫西门子范围内。通常，细胞悬浮液经历一个或多个脉冲电场。采用该方法，悬浮液的处理体积可扩展，并且腔室中细胞的处理时间基本均匀。

在一些实施方式中，不同的转基因或转基因的多个拷贝可以包括在一个载体中。载体可以包括编码核糖体跳跃序列(例如编码2A肽的序列)的核酸序列。在小核糖核酸病毒的***病毒亚群中鉴别的2A肽会导致核糖体从一个密码子“跳跃”到下一个密码子，而不会在由密码子编码的两个氨基酸之间形成肽键(参见Donnelly et al.,J.of GeneralVirology 82:1013-1025(2001)；Donnelly et al.,J.of Gen.Virology 78:13-21(1997)；Doronina et al.,Mol.And.Cell.Biology 28(13):4227-4239(2008)；Atkins et al.,RNA13:803-810(2007))。

“密码子”是指mRNA(或DNA分子的有义链)上的三个核苷酸，它们被核糖体翻译成一个氨基酸残基。因此，当多肽被框内的2A寡肽序列分开时，可以从mRNA内的单个连续开放阅读框合成两条多肽。这种核糖体跳跃机制在本领域是众所周知的并且已知被多种载体用于表达由单个信使RNA编码的多种蛋白质。

在一个实施方式中，编码根据本发明的序列特异性试剂的多核苷酸可以是直接引入细胞中的mRNA，例如通过电穿孔。在一些实施方式中，可以使用细胞脉冲技术对细胞进行电穿孔，该技术允通许过使用脉冲电场瞬时透化活细胞以将材料递送到细胞中。该技术基于使用PulseAgile(BTX Havard Apparatus，84October Hill Road，Holliston，Mass.01746，USA)电穿孔波形允许精确控制脉冲持续时间、强度以及脉冲之间的间隔(参见美国专利号6,010,613和公布的国际申请WO 2004/083379)。所有这些参数都可以修改，以达到高转染效率和最低死亡率的最佳条件。第一个高电场脉冲允许孔形成，而随后的较低电场脉冲允许将多核苷酸移动到细胞中。

其它示例性的核酸递送***包括Amaxa Biosystems(Cologne，Germany)，Maxcyte,，Inc.(Rockville,Md.)、BTX Molecular Delivery Systems(Holliston，Mass.)和Copernicus Therapeutics Inc.(参见例如美国专利号6,008,336)描述的那些。例如美国专利号5,049,386；4,946,787；和4,897,355中描述了脂质转染并且脂质感染试剂在市场上有售(例如Transfectam和Lipofectin)。适用于多核苷酸的有效受体-识别脂质转染的阳离子和中性脂质包括Felgner、WO 91/17424、WO 91/16024的那些。

脂质：核酸复合物(包括靶向的脂质体，例如免疫脂质复合物)的制备为本领域技术人员所众所周知(参见例如Crystal，Science 270:404-410(1995)；Blaese et al.,Cancer Gene Ther.2:291-297(1995)；Behr et al.,Bioconjugate Chem.5:382-389(1994)；Remy et al.,Bioconjugate Chem.5:647-654(1994)；Gao et al.,Gene Therapy2:710-722(1995)；Ahmad et al.,Cancer Res.52:4817-4820(1992)；美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028和4,946,787)。

在一些实施方式中，供体序列和/或序列特异性试剂由病毒载体编码。在一些实施方式中，可以使用基于腺病毒的***。基于腺病毒的载体能够在许多细胞类型中实现非常高的转导效率，并且不需要细胞***。使用此类载体，已经获得了高滴度和高水平的表达。这种载体可以在相对简单的***中大量生产。腺相关病毒(“AAV”)载体也用于用靶核酸转导细胞，例如在核酸和肽的体外生产中，以及用于体内和离体基因疗法程序(参见例如Westet al，Virology 160:38-47(1987)；美国专利号4,797,368；WO 93/24641；Kotin,HumanGene Therapy 5:793-801(1994)；Muzyczka,J.Clin.Invest.94:1351(1994))。重组AAV载体的构建在许多出版物中都有描述，包括美国专利号5,173,414；Tratschin et al.,Mol.Cell.Biol.5:3251-3260(1985)；Tratschin,et al.,Mol.Cell.Biol.4:2072-2081(1984)；Hermonat&Muzyczka，PNAS 81:6466-6470(1984)；和Samulski et al.,J.Virol.63:03822-3828(1989)。

重组腺相关病毒载体(rAAV)是一种基于缺陷和非致病性细小病毒腺相关2型病毒的有前景的替代基因传递***。所有载体均源自仅保留转基因表达盒侧翼的AAV 145bp反向末端重复的质粒。由于整合到转导细胞的基因组中，有效的基因转移和稳定的转基因递送是该载体***的关键特征。(Wagner et al.,Lancet 351:9117 1702-3(1998)，Kearnset al.,Gene Ther.9:748-55(1996))。根据本发明还可以使用其它AAV血清型(包括非限制性示例的AAV1、AAV3、AAV4、AAV5、AAV6、AAV8、AAV 8.2、AAV9和AAV rh10)以及假型AAV(诸如AAV2/8、AAV2/5和AAV2/6)。

在一些实施方式中，细胞被施用有效量的一种或多种半胱天冬酶抑制剂与AAV载体的组合。

可以使用相同或不同的***递送核酸酶编码序列和供体构建体。例如，供体多核苷酸可以由病毒载体携带，而一种或多种核酸酶可以作为mRNA组合物递送。

在一些实施方式中，可以使用纳米颗粒将一种或多种试剂递送至细胞。在一些实施方式中，纳米颗粒涂有对HSC表面蛋白如CD105(Uniprot#P17813)具有特异性亲和力的配体如抗体。在一些实施方式中，纳米粒子是可生物降解的聚合物纳米颗粒，其中多核苷酸形式的序列特异性试剂与聚β氨基酯的聚合物复合并涂有聚谷氨酸(PGA)。

外显子整合到内源性内含子基因组基因座的策略

作为特定的实施方式，本专利申请提供了一种将外源性编码序列整合到内源性内含子基因组区域的方法，其允许将所述外源性编码序列优选地整合在所述基因组区域的第一内源性编码外显子和第二内源性编码外显子之间。

方法特别有用，例如，当进入基因组区域的外显子通常从位于第一外显子上游的共同内源性启动子主动转录时，例如图2所示。

所述方法具有防止破坏编码内源性外显子区域的转录物同时允许它们与外源性编码序列一起转录的优点。

一般而言，所述方法包括下列步骤中的一个或多个：

-提供包括内源性内含子基因组区域的细胞，

-向所述细胞中引入包括外源性编码序列的多核苷酸模板，

所述多核苷酸模板在5’至3’方向上包括或由以下组成：

·第一同源多核苷酸序列，其与***位点上游的内含子序列同源，

同时所述第一多核苷酸序列优选不包括分支点；

·第一强剪接位点序列，优选地包括分支点和剪接受体；

·编码2A自切割肽的第一序列；

·编码目的蛋白质的外源序列；

·编码2A自切割肽的第二序列；

·第一外显子的编码序列的拷贝，任选地重写；

·第二强剪接位点序列，优选地包括剪接供体；和

·第二同源多核苷酸序列，其与***位点下游的内含子序列同源；

-诱导所述外源性多核苷酸整合到所述内含子序列中，优选通过同源重组，以使所述外源性编码序列在所述内源性基因座处连同第一外显子和优选地第二(内源性)外显子或其拷贝一起被转录。

一般而言，第一外显子的拷贝下游的第二同源多核苷酸包括分支点，优选最初存在于内源性序列中的分支点，以允许正确的RNA剪接和第二外显子的表达。

作为优选的实施方式，所述第一外显子的序列的拷贝可以在多核苷酸水平上重写用于密码子优化和/或减少与内源性基因座序列的核苷酸序列同源性。

可以通过使用本领域公知的方法来执行上述每个步骤。根据优选的实施方式，也根据HSC或由其分化的细胞递送治疗性蛋白质，细胞可源自患者本人、供体或iPS细胞，例如根据WO2018/189360中描述的方法，其通过引用并入。

本方法的步骤通常离体进行，这意味着细胞在人体外培养和制造。一般而言，细胞不是生发细胞或源自人类胚胎的细胞，并且该方法不旨在改变人类的生殖线或遗传特性。

通过在***位点切割稀有切割核酸内切酶，可以促进通过同源重组将多核苷酸模板整合到所述内含子序列中。因此，用于外显子整合的所述方法由此可以包括以下步骤：向细胞中引入或表达稀有切割核酸内切酶，特别是TALE-核酸酶、锌指核酸酶、大范围核酸酶、例如本申请中已经描述的CRISPR，以在***位点切割所述内含子序列。

因此，***位点通常由所述稀有切割核酸内切酶的靶序列确定。因此，***位点包括在稀有切割核酸内切酶靶序列中，该靶序列本身包括在所选基因座的内含子序列中，并且更具体地包括在本发明所考虑的用于工程化本文公开的HSC的基因座中。

优选的基因座是为了治疗性蛋白质的表达和递送所选择的那些基因座，其包括至少两个内源性外显子序列，特别地是选自以下的内含子序列之一：CXCR3(SEQ ID NO:76)、CD11B(SEQ ID NO:107)、S100A9(SEQ ID NO:148)、TMEM119(SEQ ID NO:189)、MERTK(SEQID NO:190)、CD164(SEQ ID NO:191)、TLR7(SEQ ID NO:192)、CD14(SEQ ID NO:193)、FCGR3A(CD16)(SEQ ID NO:194)、TBXAS1(SEQ ID NO:195)、DOK3(SEQ ID NO:196)、ABCA1(SEQ ID NO:197)、TMEM195(SEQ ID NO:198)、TLR4(SEQ ID NO:199)、MR1(SEQ ID NO:200)、FCGR1A(CD64)(SEQ ID NO:201)、CSF3R(SEQ ID NO:202)、FGD4(SEQ ID NO：203)和TSPAN14(SEQ ID NO:204)以及B2M(SEQ ID NO:205)。

用于整合外源性编码序列的多核苷酸模板通常包括与上述内含子序列同源的第一多核苷酸序列和第二多核苷酸序列，或与所述多核苷酸序列具有或至少80％，优选至少75％、至少80％、至少90或甚至优选至少95％的同一性。第一和第二同源序列通常优选在超过50个碱基对(bp)上，更优选在超过100bp、200bp、500bp并且甚至更优选在50至500bp上分别与***位点上游和下游的内源性序列同源。

根据所提出的方法，要***到内源性内含子基因组序列中的多核苷酸模板包括外源性编码序列上游和下游的强剪接位点序列。剪接位点是特定的基序，剪接体通过这些基序识别外显子并去除介于中间的内含子。外源性剪接位点序列可以通过克隆或替代地通过将突变引入同源性序列来引入。文献中提供了鉴别或设计强剪接位点的标准以及此类序列的示例，例如Shepard,P.J et al.[Efficient internal exon recognition depends onnear equal contributions from the 3'and 5'splice sites(2011)Nucleic acidsresearch,39(20),8928-37]。

通常选择第一同源序列(即上游同源序列或左同源臂)以排除分支点，该分支点通常位于第二外显子序列上游10至100bp之间，优选20至50bp之间。对分支点序列的人类共识通常是yUnAy，其中A是分支点并且小写的嘧啶(‘y’)不如大写的U和A保守。分支点通常位于内含子3’端上游的21-34个核苷酸处，而所谓的多嘧啶道跨越分支点下游的4-24个核苷酸[Gao,K.,et al.(2008).Human branch point consensus sequence is yUnAy.Nucleicacids research,36(7),2257-67]。

2A自切割肽或2A肽是一类18–22个氨基酸长的肽，其可在细胞内诱导重组蛋白的切割。2A肽来源于病毒基因组的2A区。2A肽家族的四个成员经常用于生命科学研究：P2A、E2A、F2A和T2A。更常用的F2A来源于***病毒18；E2A来源于马鼻炎A病毒；P2A来源于猪捷申病毒-1 2A；T2A来源于Thosea asigna病毒2A[Liu et al.(2017)."Systematiccomparison of 2A peptides for cloning multi-genes in a polycistronic vector".Scientific Reports.7(1)]。

用于将外源性编码序列整合到内源性内含子基因组区的本方法本身可以被视为一项发明，因为其广泛适用于不限于HSC的任何类型的细胞，并且与可以***内源性基因座的外源性编码序列的类型无关。

然而，已发现所述方法特别适用于HSC以产生如本文所描述的治疗性细胞。使用上述方法整合基因的纠正的拷贝或附加拷贝具有显著优势，以便它们随后在分化的HSC中表达以获得遗传缺陷的交叉纠正。实际上，这尽可能地保留了***所靶向的内源性基因座的表达，因此不太容易干扰细胞分化和所得细胞的细胞功能。这对于旨在分化为巨噬细胞以实现大脑中小胶质细胞功能的工程化HSC尤为重要。

因此，本发明涵盖通过上述方法可获得并在图2中说明用于将外源性编码序列整合到内源性内含子基因组区的细胞，尤其是专门用于基因疗法的细胞，尤其是用于缺陷等位基因的交叉纠正的细胞。这种基因***可以在HSC中进行，以获得更多分化阶段的表达，例如用于将治疗性蛋白质递送到大脑用于治疗疾病的那些细胞，特别是巨噬细胞和小胶质细胞，如图14中更具体描述的。

如前所提及的，本发明涉及一种将外源性编码序列整合到内源性内含子基因组区域或基因座中的通用方法，其不会使存在于该基因座的内源性外显子的表达失活，尤其是不会使***位点下游的序列失活。因此，这种方法可以防止在转基因基因组整合中通常观察到的所谓“极性效应”。

所述方法包括下列步骤：

-提供包括内源性内含子基因组区域的细胞，

b)第一强剪接位点序列，其包括分支点和剪接受体；

c)编码2A自切割肽的第一序列；

d)编码目的蛋白质的外源序列；

e)编码2A自切割肽的第二序列；

f)第一外显子的编码序列的拷贝；

g)包括剪接供体的第二强剪接位点序列；和

-诱导所述外源性多核苷酸整合到所述内含子序列中，优选通过同源重组，以使所述外源性编码序列在所述内源基因座处连同第一外显子或其拷贝被转录。

通过本发明的方法，上述整合形成人工外显子(Artex)，其可以被引入造血干细胞(HSC)中以获得例如外源性编码序列到至少一种造血细胞谱系中的表达。

在一些优选的实施方式中，所述外源性编码序列编码用于治疗遗传疾病的目的蛋白质，其在祖细胞、红细胞、粒细胞、巨核细胞、单核细胞、B细胞和/或T细胞中的表达，如图14所示。

根据一些实施方式，该方法用于在祖细胞中表达选自FANCA、FANCC或FANCG中的蛋白质。

根据一些实施方式，该方法用于在红细胞中表达选自HBB、PKLR或RPS19中的蛋白质。

根据一些实施方式，该方法用于在粒细胞中表达选自HAX1、CYBA、CYBB、NCF1、NCF2或NCF4中的蛋白质。

根据一些实施方式，该方法用于在巨核细胞中表达选自因子8、因子9、因子11或WAS中的蛋白质。

根据一些实施方式，该方法用于在单核细胞中表达选自IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5中的蛋白质。

根据一些实施方式，该方法用于在B细胞中表达选自ADA、IL2RG、WAS或BTK中的蛋白质。

根据一些实施方式，该方法用于在T细胞中表达选自ADA、IL2RG、WAS、BTK或CCR5中的蛋白质。

因此，所述外源性编码序列的表达产生允许交叉纠正内源性缺陷蛋白的目的蛋白。该方法可以离体进行以产生工程化治疗性细胞，用于治疗在图14中列出的至少一种疾病，尤其是迄今为止鉴定的多种形式的溶酶体贮积病(LSD)。

本发明还涉及可用于进行上述方法的***载体，例如AAV载体，优选AAV6，其特征在于其包括用于***内源性基因座处的外源性多核苷酸序列，该外源性多核苷酸序列包括以下序列：

b)第一强剪接位点序列，其包括分支点和剪接受体；

c)编码2A自切割肽的第一序列；

d)编码目的蛋白质的外源序列；

e)编码2A自切割肽的第二序列；

f)第一外显子的编码序列的拷贝；

g)包括剪接供体的第二强剪接位点序列；和

h)第二同源多核苷酸序列，其与***位点下游的内含子序列同源。

在优选的实施方式中，所述第一同源序列和第二同源序列与选自以下的内源性基因座同源：tmem119、s100a9、cd11b、b2m、cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、p2ry12、olfml3、p2ry13、hexb、rhob、jun、rab3il1、ccl2、fcrls、scoc、siglech、slc2a5、lrrc3、plxdc2、usp2、ctsf、cttnbp2nl、atp8a2、lgmn、mafb、egr1、bhlhe41、hpgds、ctsd、hspa1a、lag3、csf1r、adamts1、f11r、golm1、nuak1、crybb1、ltc4s、sgce、pla2g15、ccl3l1、abhd12、ang、ophn1、sparc、pros1、p2ry6、lair1、il1a、epb41l2、adora3、rilpl1、pmepa1、ccl13、pde3b、scamp5、ppp1r9a、tjp1、ak1、b4galt4、gtf2h2、trem2、ckb、acp2、pon3、agmo、tnfrsf17、fscn1、st3gal6、adap2、ccl4、entpd1、tmem86a、kctd12、dst、ctsl2、abcc3、pdgfb、pald1、tubgcp5、rapgef5、stab1、lacc1、tmc7、nrip1、kcnd1、tmem206、hps4、dagla、extl3、mlph、arhgap22、cxxc5、p4ha1、cysltr1、fgd2、kcnk13、gbgt1、c18orf1、cadm1、bco2、adrb1、c3ar1、large、leprel1、liph、upk1b、p2rx7、slc46a1、ebf3、ppp1r15a、il10ra、rasgrp3、fos、tppp、slc24a3、havcr2、nav2、apbb2、clstn1、blnk、gnaq、ptprm、frmd4a、cd86、tnfrsf11a、spint1、ppm1l、tgfbr2、cmklr1、tlr6、gas6、hist1h2ab、atf3、acvr1、abi3、lrp12、ttc28、plxna4、adamts16、rgs1、icam1、snx24、ly96、dnajb4和ppfia4。

本发明还包括一种通过任何前述方法可获得的工程化细胞，且更具体地是特征在于外源性多核苷酸序列已被***内源性基因座处内含子中的工程化细胞，其中所述多核苷酸序列优选地包括：

-第一强剪接位点序列，包括分支点和受***点；

-编码2A自切割肽的第一序列；

-编码目的蛋白质(诸如治疗性蛋白质)的外源序列；

-编码2A自切割肽的第二序列；

-与所述基因座内源的前一外显子的编码序列的拷贝；

-包括剪接供***点的第二强剪接位点序列；

2.还根据一些优选的实施方式，所述工程化细胞中的所述外源性多核苷酸序列可以***在选自以下的内源性基因座处：tmem119、s100a9、cd11b、B2m、Cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfia4。优选的内源性基因基因座是S100A9或CD11b。

根据本发明的一些优选实施方式，将所述外源性多核苷酸序列***到第一和第二内源性编码外显子之间的内含子中，如图2所示。第一和第二编码2自切割肽通常不同以避免不期望的稀有重组事件，其可以选自SEQ ID NO:216和SEQ ID NO:217。

根据一些优选的实施方式，上述第一剪接位点包括实施例中所示的SEQ ID NO:206或SEQ ID NO:207。

编码序列，特别是由于图2所示的本整合方法可被同源重组替换的第一内源性外显子的编码序列，可以进行密码子优化(即重写)以增加多核苷酸序列多样性并防止不希望的内源性基因座处的重组事件。因此，本发明更特别地提供了工程化的细胞，其中编码从IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5(SEQ ID NO:1至SEQ ID NO:35–见表1)中选择的治疗性蛋白质的一个外源性序列被整合在从TMEM119、MERTK、CD164、TLR7、CD14、FCGR3A(CD16)、TBXAS1、DOK3、ABCA1、TMEM195、TLR4、MR1、FCGR1A(CD64)、CSF3R、FGD4、TSPAN14、CXCR3、CD11B、S100A9和B2M中选择的一个基因座处，更特别地整合在它们的内含子多核苷酸序列中或与所述多核苷酸序列具有至少80％(优选至少75％、至少80％、至少90或至少95％)同一性的任何内含子序列中(考虑到这些序列在整个动物界且特别是人类物种中的可变性)。

因此，本发明更具体地涉及以下类型的工程化细胞之一，其中：

-IDUA被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-IDS被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-ARSB被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-GUSB被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-ABCD1被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-GALC被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-ARSA被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-PSAP被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-GBA被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-FUCA1被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-MAN2B1被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-AGA被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-ASAH1被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-HEXA被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-GAA被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-SMPD1被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-LIPA被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-CDKL5被引入在CXCR3基因座处，优选地引入SEQ ID NO:76中；

-IDUA被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-IDS被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-ARSB被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-GUSB被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-ABCD1被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-GALC被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-ARSA被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-PSAP被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-GBA被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-FUCA1被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-MAN2B1被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-AGA被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-ASAH1被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-HEXA被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-GAA被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-SMPD1被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-LIPA被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-CDKL5被引入在CD11B基因座处，优选地引入SEQ ID NO:107中；

-IDUA被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-IDS被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-ARSB被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-GUSB被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-ABCD1被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-GALC被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-ARSA被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-PSAP被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-GBA被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-FUCA1被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-MAN2B1被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-AGA被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-ASAH1被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-HEXA被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-GAA被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-SMPD1被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-LIPA被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-CDKL5被引入在S100A9基因座处，优选地引入SEQ ID NO:148中；

-IDUA被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-IDS被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-ARSB被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-GUSB被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-ABCD1被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-GALC被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-ARSA被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-PSAP被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-GBA被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-FUCA1被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-MAN2B1被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-AGA被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-ASAH1被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-HEXA被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-GAA被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-SMPD1被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-LIPA被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-CDKL5被引入在TMEM119基因座处，优选地引入SEQ ID NO:189中；

-IDUA被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-IDS被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-ARSB被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-GUSB被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-ABCD1被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-GALC被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-ARSA被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-PSAP被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-GBA被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-FUCA1被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-MAN2B1被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-AGA被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-ASAH1被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-HEXA被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-GAA被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-SMPD1被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-LIPA被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-CDKL5被引入在MERTK基因座处，优选地引入SEQ ID NO:190中；

-IDUA被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-IDS被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-ARSB被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-GUSB被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-ABCD1被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-GALC被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-ARSA被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-PSAP被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-GBA被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-FUCA1被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-MAN2B1被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-AGA被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-ASAH1被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-HEXA被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-GAA被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-SMPD1被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-LIPA被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-CDKL5被引入在CD164基因座处，优选地引入SEQ ID NO:191中；

-IDUA被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-IDS被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-ARSB被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-GUSB被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-ABCD1被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-GALC被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-ARSA被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-PSAP被引入在基因座TLR7处，优选地引入SEQ ID NO:192中；

-GBA被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-FUCA1被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-MAN2B1被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-AGA被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-ASAH1被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-HEXA被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-GAA被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-SMPD1被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-LIPA被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-CDKL5被引入在TLR7基因座处，优选地引入SEQ ID NO:192中；

-IDUA被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-IDS被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-ARSB被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-GUSB被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-ABCD1被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-GALC被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-ARSA被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-PSAP被引入在基因座CD14处，优选地引入SEQ ID NO:193中；

-GBA被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-FUCA1被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-MAN2B1被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-AGA被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-ASAH1被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-HEXA被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-GAA被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-SMPD1被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-LIPA被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-CDKL5被引入在CD14基因座处，优选地引入SEQ ID NO:193中；

-IDUA被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-IDS被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-ARSB被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-GUSB被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-ABCD1被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-GALC被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-ARSA被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-PSAP被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-GBA被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-FUCA1被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-MAN2B1被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-AGA被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-ASAH1被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-HEXA被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-GAA被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-SMPD1被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-LIPA被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-CDKL5被引入在FCGR3A基因座处，优选地引入SEQ ID NO:194中；

-IDUA被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-IDS被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-ARSB被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-GUSB被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-ABCD1被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-GALC被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-ARSA被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-PSAP被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-GBA被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-FUCA1被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-MAN2B1被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-AGA被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-ASAH1被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-HEXA被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-GAA被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-SMPD1被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-LIPA被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-CDKL5被引入在TBXAS1基因座处，优选地引入SEQ ID NO:195中；

-IDUA被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-IDS被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-ARSB被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-GUSB被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-ABCD1被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-GALC被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-ARSA被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-PSAP被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-GBA被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-FUCA1被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-MAN2B1被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-AGA被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-ASAH1被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-HEXA被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-GAA被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-SMPD1被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-LIPA被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-CDKL5被引入在DOK3基因座处，优选地引入SEQ ID NO:196中；

-IDUA被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-IDS被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-ARSB被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-GUSB被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-ABCD1被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-GALC被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-ARSA被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-PSAP被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-GBA被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-FUCA1被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-MAN2B1被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-AGA被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-ASAH1被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-HEXA被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-GAA被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-SMPD1被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-LIPA被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-CDKL5被引入在ABCA1基因座处，优选地引入SEQ ID NO:197中；

-IDUA被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-IDS被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-ARSB被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-GUSB被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-ABCD1被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-GALC被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-ARSA被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-PSAP被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-GBA被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-FUCA1被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-MAN2B1被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-AGA被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-ASAH1被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-HEXA被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-GAA被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-SMPD1被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-LIPA被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-CDKL5被引入在TMEM195基因座处，优选地引入SEQ ID NO:198中；

-IDUA被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-IDS被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-ARSB被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-GUSB被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-ABCD1被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-GALC被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-ARSA被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-PSAP被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-GBA被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-FUCA1被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-MAN2B1被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-AGA被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-ASAH1被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-HEXA被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-GAA被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-SMPD1被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-LIPA被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-CDKL5被引入在TLR4基因座处，优选地引入SEQ ID NO:199中；

-IDUA被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-IDS被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-ARSB被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-GUSB被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-ABCD1被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-GALC被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-ARSA被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-PSAP被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-GBA被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-FUCA1被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-MAN2B1被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-AGA被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-ASAH1被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-HEXA被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-GAA被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-SMPD1被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-LIPA被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-CDKL5被引入在MR1基因座处，优选地引入SEQ ID NO:200中；

-IDUA被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-IDS被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-ARSB被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-GUSB被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-ABCD1被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-GALC被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-ARSA被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-PSAP被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-GBA被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-FUCA1被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-MAN2B1被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-AGA被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-ASAH1被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-HEXA被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-GAA被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-SMPD1被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-LIPA被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-CDKL5被引入在FCGR1A基因座处，优选地引入SEQ ID NO:201中；

-IDUA被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-IDS被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-ARSB被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-GUSB被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-ABCD1被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-GALC被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-ARSA被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-PSAP被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-GBA被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-FUCA1被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-MAN2B1被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-AGA被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-ASAH1被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-HEXA被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-GAA被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-SMPD1被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-LIPA被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-CDKL5被引入在CSF3R基因座处，优选地引入SEQ ID NO:202中；

-IDUA被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-IDS被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-ARSB被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-GUSB被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-ABCD1被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-GALC被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-ARSA被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-PSAP被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-GBA被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-FUCA1被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-MAN2B1被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-AGA被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-ASAH1被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-HEXA被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-GAA被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-SMPD1被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-LIPA被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-CDKL5被引入在FGD4基因座处，优选地引入SEQ ID NO:203中；

-IDUA被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-IDS被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-ARSB被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-GUSB被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-ABCD1被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-GALC被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-ARSA被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-PSAP被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-GBA被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-FUCA1被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-MAN2B1被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-AGA被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-ASAH1被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-HEXA被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-GAA被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-SMPD1被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-LIPA被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-CDKL5被引入在TSPAN14基因座处，优选地引入SEQ ID NO:204中；

-IDUA被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-IDS被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-ARSB被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-GUSB被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-ABCD1被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-GALC被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-ARSA被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-PSAP被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-GBA被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-FUCA1被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-MAN2B1被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-AGA被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-ASAH1被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-HEXA被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-GAA被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-SMPD1被引入在B2M基因座处，优选地引入SEQ ID NO:205中；

-LIPA被引入在B2M基因座处，优选地引入SEQ ID NO:205中；和

-CDKL5被引入在B2M基因座处，优选地引入SEQ ID NO:205中。

此类工程化细胞(优选人类细胞)更特别地特征在于它们在一个内源性基因座处包括多核苷酸序列，该多核苷酸序列包括以下各项：

-第一强剪接位点序列，其优选地包括分支点和受***点；

-编码2A自切割肽的第一序列；

-编码目的蛋白质(诸如治疗性蛋白质)的外源序列；

-编码2A自切割肽的第二序列；

-与所述基因座内源的前一外显子的编码序列的拷贝，优选重写；

-任选地，第二强剪接位点序列，优选地包括剪接供***点。

本发明还涉及DNA模板或任何多核苷酸，其可用作有用于进行上述细胞工程化的***载体，尤其是AAV载体，更优选AAV6载体，如Ling,C.et al.[High-EfficiencyTransduction of Primary Human Hematopoietic Stem/Progenitor Cells by AAV6Vectors:Strategies for Overcoming Donor-Variation and Implications in GenomeEditing(2016)Scientific Reports 6:35495]中描述的。此类多核苷酸的特征在于它们包括以下序列中的一种或多种：

-第一强剪接位点，其包括分支点和受***点；

-编码2A自切割肽的第一序列；

-编码目的蛋白质的外源序列；

-编码2A自切割肽的第二序列；

-任选地，第二强剪接位点，其包括剪接供***点。

根据优选的实施方式，所述多核苷酸还包括上游和下游序列，它们与如前所述的内源性基因座同源。一般而言，这些上游和下游序列中的至少一者或两者与内含子序列同源，尤其是在本文中称为SEQ ID NO:76、SEQ ID NO:107、SEQ ID NO:148和SEQ ID NO:189至SEQ ID NO:205的那些内含子序列，并且更优选地与此类内含子序列排他地同源(即在基因座处存在跨越外显子序列)。

组合物

本发明还涉及一种组合物，其包括有效量的如本文所述的基因工程化的HSC或iPS细胞。在一些实施方式中，本发明提供了一种药物组合物，其包括有效量的如本文所述的基因工程化的HSC或iPS细胞。

在一些实施方式中，组合物可以用作药物。在一些实施方式中，组合物可以用于治疗如本文所述的单基因病。

在一些实施方式中，组合物包括细胞群，其中该群中细胞的至少40％已经根据本文描述的任一何种方法进行了修饰。在一些实施方式中，群中细胞的至少50％、60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％已经根据本文描述的方法的任何一种进行了修饰。在一些实施方式中，组合物包括纯细胞群，其中100％的细胞已经如本文描述的进行了基因修饰。

基因修饰的细胞可以单独给药，或者作为与稀释剂和/或与其它组分组合的药物组合物给药。在一些实施方式中，药物组合物可包括如本文描述的基因修饰的HSC或iPS细胞，以及与一种或多种药学或生理学可接受的载体、稀释剂或赋形剂的组合。此类组合物可包括缓冲剂，例如中性缓冲盐水、磷酸盐缓冲盐水等；碳水化合物，例如葡萄糖、甘露糖、蔗糖或葡萄聚糖、甘露醇；蛋白质；多肽或氨基酸，例如甘氨酸；抗氧化剂；螯合剂，例如EDTA或谷胱甘肽；佐剂(例如氢氧化铝)；和防腐剂。在一些实施方式中，组合物被配制用于静脉内给药。

基因修饰的HSC或iPS细胞可以用作治疗疾病的药物。在一些实施方式中，基因修饰的HSC或iPS细胞用于在治疗在与转基因同源的内源性基因表达方面具有缺陷的患者(交叉纠正)中使用。在一些实施方式中，基因修饰的HSC或iPS细胞用于在治疗溶酶体贮积病中使用。在一些实施方式中，基因修饰的HSC或iPS细胞用于在治疗从粘多糖病I型(Scheie、Hurler-Scheie或Hurler综合征)、粘多糖病II型(亨特综合征)、粘多糖病VI型(Maroteaux-Lamy综合征)、粘多糖病VII型(Sly疾病)、X连锁肾上腺脑白质营养不良、球形细胞脑白质营养不良(克拉伯病)、异染性脑白质营养不良、戈谢病、岩藻糖苷贮积症、α-甘露糖苷过多症、天冬氨酸葡萄糖胺尿症、Farber病、泰-萨克斯病、庞贝氏病、尼曼匹克病和沃尔曼病中选择的疾病中使用。

在一些实施方式中，如本文描述的HSC和iPS细胞可以被冷冻保存。在一些实施方式中，细胞可以在它们从受试者分离之后并且在任何基因修饰之前被冷冻保存。在一些实施方式中，基因修饰的细胞在基因修饰之后且在输注到受试者中之前被冷冻保存。在一些实施方式中，基因修饰的细胞在它们已经离体扩增后被冷冻保存。

在一个实施方式中，本发明提供了一种冷冻保存的药物组合物，其包括：(a)基因修饰的HSC或iPS细胞的存活(viable)组合物；(b)足以冷冻保存HSC或iPS细胞的量的冷冻保存剂；和(c)药学上可接受的载体。

如本文所用，“冷冻保存”是指通过冷却至零以下低温来保存细胞，例如(通常)77K或-196℃(液氮的沸点)。冷冻保存也指在没有任何冷冻保存剂的情况下将细胞储存在0°-10℃的温度下。在这些低温下，任何生物活动，包括会导致细胞死亡的生化反应，都会被有效地停止。冷冻保护剂通常在零以下温度下使用，以保护细胞免受由于低温冷冻或升温至室温造成的损害。

在一些实施方式中，与冷冻相关的有害影响可以通过以下方式来避免：(a)使用冷冻保护剂，(b)控制冷冻速率，和(c)在足够低的温度下储存以最小化降解反应。

可以使用的冷冻保护剂包括但不限于二甲亚砜(DMSO)、甘油、聚乙烯吡咯烷、聚乙二醇、白蛋白、葡萄聚糖、蔗糖、乙二醇、异赤藓糖醇、D-山梨糖醇、D-甘露糖醇、D-山梨糖醇、异肌醇、D-乳糖、氯化胆碱、氨基酸、甲醇、乙酰胺、甘油单乙酸酯和无机盐。在优选的实施方式中，以低浓度使用DMSO，一种对细胞无毒的液体。作为一种小分子，DMSO自由渗透细胞并通过与水结合来保护细胞内的细胞器，从而改变其可冷冻性并防止结冰造成的损害。加入血浆(例如至浓度20-25％)可以增强DMSO的保护作用。添加DMSO后，细胞应保持在0-4℃直到冻住，因为约1％的DMSO浓度在高于4℃的温度下有毒。

不同的冷冻保护剂(Rapatz,G.,et al.，1968，Cryobiology 5(1):18-25)和不同的细胞类型具有不同的最佳冷却速率(关于冷却速度对骨髓干细胞存活及其移植潜力的影响，参见例如Rowe,A.W.和Rinfret,A.P.,1962,Blood 20:636；Rowe,A.W.,1966,Cryobiology 3(1):12-18；Lewis,J.P.,et al.,1967,Transfusion 7(1):17-32；和Mazur,P.,1970,Science 168:939-949)。水变成冰的熔相(fusion phase)热量应该是最小的。可以通过使用例如可编程冷冻装置或甲醇浴程序来进行冷却程序。

彻底冷冻后，细胞可以迅速转移到长期低温储存容器中。在一个实施方式中，扩增的HSC或IPs细胞可以低温储存在液氮(-196℃)或其蒸气(-165℃)中。通过可用的高效液氮冰箱极大地促进了这种储存，这种冰箱类似于具有极低真空和内部超级绝缘的大型热水瓶容器，从而将热泄漏和氮损失保持在绝对最小值。

在特定的实施方式中，使用Current Protocols in Stem Cell Biology，2007，(Mick Bhatia,et.al.,ed.,John Wiley and Sons,Inc.)中描述并在此通过引用并入的冷冻保存程序。主要是当10-cm组织培养板上的HSC达到约50％的汇合度时，吸出板内的培养基并用磷酸盐缓冲盐水冲洗HSC。然后通过3ml的0.025％胰蛋白酶/0.04％ EDTA处理使粘附的HSC脱附。通过7ml培养基中和胰蛋白酶/EDTA，并通过以200xg离心2分钟收集脱附的HSC。吸出上清液并将HSC团粒重悬于1.5ml培养基中。将一等分1ml100％ DMSO添加到HSC悬浮液中并轻轻混合。然后将该HSC在DMSO中的悬浮液的1ml等分试样分配到CRYULES中，为冷冻保存做准备。无菌储存CRYULES的盖子最好在里面有螺纹，这允许轻松处理而不会造成污染。合适的托架***是市售的，并且可用于对单个样本进行编目、存储和检索。

例如，可以在通过引用并入本文的以下参考文献中找到对HSC(特别是来自骨髓或外周血的HSC)的操作、冷冻保存和长期储存的注意事项和程序：Gorin,N.C.,1986,ClinicsIn Haematology 15(1):19-48；Bone-Marrow Conservation,Culture andTransplantation,Proceedings of a Panel,Moscow,Jul.22-26,1968,InternationalAtomic Energy Agency,Vienna,pp.107-186。

可供使用和设想使用活细胞冷冻保存的其它方法或其修改(例如，cold metal-minor techniques；Livesey,S.A.和Linner,J.G.,1987,Nature 327:255；Linner,J.G.,etal.,1986,J.Histochem.Cytochem.34(9):1123-1135；美国专利号4,199,022、3,753,357和4,559,298)，并且这些全部均在此通过引用以其整体并入。

在一些实施方式中，将冷冻的HSC或iPS细胞快速解冻(例如，在保持在37°-41℃的水浴中)并在解冻后立即在冰上冰镇。特别地，可以将装有冷冻HSC或iPS细胞的低温小瓶浸入温水浴中直至其颈部；温和的旋转将确保细胞悬浮液在其解冻时混合，并增加从温水到内部冰块的热传递。冰完全融化后，可以立即将小瓶放入冰中。

在一个实施方式中，Current Protocols in Stem Cell Biology 2007(MickBhatia,et al.,ed.,John Wiley and Sons,Inc.)中描述了冷冻保存后的解冻程序并且在此通过引用并入。从低温冷冻箱中取出低温小瓶后，立即将小瓶在双手之间滚动10至30秒，直到小瓶外部无霜。然后将小瓶直立在37℃水浴中直至内容物明显解冻。将小瓶浸入95％乙醇中或喷洒70％乙醇以杀死水浴中的微生物并在无菌罩中风干。然后使用无菌技术将小瓶的内容物转移到含有9ml培养基的10-cm无菌培养物中。然后，可以在37℃和5％加湿CO₂的培养箱中培养HSC并进一步扩增。

可能需要处理HSC或IPs细胞以防止在解冻时细胞凝结。为了防止凝结，可以使用各种程序，包括但不限于在冷冻之前和/或之后添加DNase(Spitzer,G.,et al.,1980,Cancer 45:3075-3085)、低分子量葡聚糖和柠檬酸盐、羟乙基淀粉(Stiff,P.J.,et al.,1983,Cryobiology 20:17-24)。

如果冷冻保护剂对人体有毒，则应在解冻的HSC或iPS细胞的治疗性用途之前去除。在使用DMSO作为冷冻保存剂的实施方式中，优选省略该步骤以避免细胞损失，因为DMSO没有严重的毒性。然而，在需要去除冷冻保护剂的情况下，优选在解冻时完成去除。

去除冷冻保护剂的一种方式是通过稀释至微不足道的浓度。这可以通过添加培养基来完成，随后如果需要，进行一个或多个离心循环以团粒化细胞、去除上清液和重悬细胞。例如，可以将解冻细胞中的细胞内DMSO降低到不会对回收细胞产生不利影响的水平(小于1％)。这优选缓慢地进行，以尽量最小化在去除DMSO期间发生的潜在破坏性渗透梯度。

在去除冷冻保护剂后，可以进行细胞计数(例如通过使用血细胞计数器)和活力测试(例如通过台盼蓝排除；Kuchler,R.J.1977,Biochemical Methods in Cell Cultureand Virology,Dowden,Hutchinson&Ross,Stroudsburg,Pa.,pp.18-19；1964,Methods inMedical Research,Eisen,H.N.,et al.,eds.,Vol.10,Year Book Medical Publishers,Inc.,Chicago,pp.39-47)以确认细胞存活。

在一个实施方式中，通过如本文描述的活力(例如台盼蓝排除)和微生物无菌性的标准测定法来测试解冻细胞，并测试以确认和/或确定它们相对于接受者的特性。

尽管结合各种实施方式描述了本教导，但本教导并不旨在限于此类实施方式。相反，如本领域技术人员将理解的，本教导包括各种替代、修改和等效物。

在整个本公开中，通过识别引文来引用各种出版物、专利和公布的专利说明书。这些出版物、专利和公布的专利说明书的公开内容在此通过引用并入本公开中以更全面地描述本发明所属的现有技术。

表4：定义用于对本发明的细胞进行基因编辑的优选靶序列

根据本公开，本发明更特别地包括下列项目：

1.一种将转基因表达到患者大脑中的方法，包括：

2.一种将转基因表达到患者大脑中的方法，包括：

3.根据项目1或2的方法，其中所述基因座选自由以下组成的组：TMEM119、S100A9、CD11B、B2m、Cx3cr1、MERTK、CD164、Tlr4、Tlr7、Cd14、Fcgr1a、Fcgr3a、TBXAS1、DOK3、ABCA1、TMEM195、MR1、CSF3R、FGD4、TSPAN14、TGFBRI、CCR5、GPR34、SERPINE2、SLCO2B1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfia4。

4.根据项目1-3中任一项的方法，其中所述基因座为cx3cr1。

5.根据项目1-3中任一项的方法，其中所述基因座为cd11b。

6.根据项目1-3中任一项的方法，其中所述基因座为tmem119。

7.根据项目1-3中任一项的方法，其中所述基因座为s100a9。

8.根据项目1-7中任一项的方法，其中细胞已经使用序列特异性试剂和包括转基因的供体序列进行了基因修饰。

9.根据项目8的方法，其中将包括转基因的供体序列在病毒载体中提供给细胞。

10.根据项目9的方法，其中病毒载体为AAV载体。

11.根据项目8-10中任一项的方法，其中序列特异性试剂包括工程化的稀有切割核酸内切酶。

12.根据项目11的方法，其中工程化的稀有切割核酸内切酶选自由以下组成的组：转录激活器样效应物核酸酶(TALEN)、锌指核酸酶(ZFN)、簇状规则间隔的短回文重复序列(CRISPR)-Cas、大范围核酸酶和megaTAL。

13.根据项目12的方法，其中序列特异性试剂作为核酸提供给细胞。

14.根据项目13的方法，其中核酸为mRNA。

15.根据任一项目1至14的方法，其中所述转基因包括用于治疗粘多糖病I型(Scheie、Hurler-Scheie或Hurler综合征)的IDUA。

16.根据任一项目1至14的方法，其中所述转基因包括用于治疗粘多糖病II型(Hunter)的IDS。

17.根据任一项目1至14的方法，其中所述转基因包括用于治疗粘多糖病VI型(Maroteaux-Lamy)的ARSB。

18.根据任一项目1至14的方法，其中所述转基因包括用于治疗粘多糖病VII型(Sly)的GUSB。

19.根据任一项目1至14的方法，其中所述转基因包括用于治疗X连锁肾上腺脑白质营养不良的ABCD1。

20.根据任一项目1至14的方法，其中所述转基因包括用于治疗球形细胞脑白质营养不良(Krabbe)的GALC。

21.根据任一项目1至14的方法，其中所述转基因包括用于治疗异染性脑白质营养不良的ARSA。

22.根据任一项目1至14的方法，其中所述转基因包括用于治疗戈谢病的GBA。

23.根据任一项目1至14的方法，其中所述转基因包括用于治疗岩藻糖苷贮积症的FUCA1。

24.根据任一项目1至14的方法，其中所述转基因包括用于治疗α-甘露糖苷过多症的MAN2B1。

25.根据任一项目1至14的方法，其中所述转基因包括用于治疗天冬氨酸葡萄糖胺尿症的AGA。

26.根据任一项目1至14的方法，其中所述转基因包括用于治疗Farber的ASAH1。

27.根据任一项目1至14的方法，其中所述转基因包括用于治疗泰-萨克斯病的HEXA。

28.根据任一项目1至14的方法，其中所述转基因包括用于治疗庞贝氏症的GAA。

29.根据任一项目1至14的方法，其中所述转基因包括用于治疗尼曼匹克症的SMPD1。

30.根据任一项目1至14的方法，其中所述转基因包括用于治疗沃尔曼综合征的LIPA。

31.根据任一项目1至14的方法，其中所述转基因包括用于治疗CDKL5-缺陷相关疾病的CDKL5。

32.一种基因修饰的HSC或iPS细胞，其具有整合在选自tmem119、cd11b或cx3cr1的基因座处的转基因，所述转基因在所述基因的内源性启动子的转录控制下。

33.根据项目32的HSC或iPS细胞，用作药物使用。

34.根据项目32的HSC或iPS细胞，用于在治疗在与所述转基因同源的内源性基因表达方面具有缺陷的患者(交叉纠正)中使用。

35.根据项目33的HSC或iPS细胞，用于在治疗溶酶体贮积病中使用。

36.根据项目32的HSC或iPS细胞，其中所述转基因包括IDUA以用于在治疗粘多糖病I型(Scheie、Hurler-Scheie或Hurler综合征)中使用。

37.根据项目32的HSC或iPS细胞，其中所述转基因包括IDS，以用于在治疗粘多糖病II型(Hunter)中使用。

38.根据项目32的HSC或iPS细胞，其中所述转基因包括ARSB，以用于在治疗粘多糖病VI型(Maroteaux-Lamy)中使用。

39.根据项目32的HSC或iPS细胞，其中所述转基因包括GUSB，以用于在治疗粘多糖病VII型(Sly)中使用。

40.根据项目32的HSC或iPS细胞，其中所述转基因包括用于治疗X连锁肾上腺脑白质营养不良的ABCD1。

41.根据项目32的HSC或iPS细胞，其中所述转基因包括GALC以用于在治疗球形细胞脑白质营养不良(Krabbe)中使用。

42.根据项目32的HSC或iPS细胞，其中所述转基因包括ARSA，以用于在治疗异染性脑白质营养不良中使用。

43.根据项目32的HSC或iPS细胞，其中所述转基因包括GBA，以用于在治疗戈谢病中使用。

44.根据项目32的HSC或iPS细胞，其中所述转基因包括FUCA1，以用于在治疗岩藻糖苷贮积症中使用。

45.根据项目32的HSC或iPS细胞，其中所述转基因包括MAN2B1，以用于在治疗α-甘露糖苷过多症中使用。

46.根据项目32的HSC或iPS细胞，其中所述转基因包括AGA，以用于在治疗天冬氨酸葡萄糖胺尿症中使用。

47.根据项目32的HSC或iPS细胞，其中所述转基因包括ASAH1，以用于在治疗Farber中使用。

48.根据项目32的HSC或iPS细胞，其中所述转基因包括用于治疗泰-萨克斯病的HEXA。

49.根据项目32的HSC或iPS细胞，其中所述转基因包括GAA，以用于在治疗庞贝氏症中使用。

50.根据项目32的HSC或iPS细胞，其中所述转基因包括SMPD1，以用于在治疗尼曼匹克症中使用。

51.根据项目32的HSC或iPS细胞，其中所述转基因包括LIPA，以用于在治疗沃尔曼综合征中使用。

52.根据项目32的HSC或iPS细胞，其中所述转基因包括CDKL5，以用于在治疗CDKL5-缺陷相关疾病中使用。

53.根据项目32-50中任一项的HSC或iPS细胞，其中所述转基因的多个拷贝被整合在由2A自切割肽序列分隔开的同一基因座处。

54.一种药物组合物，包括根据项目32-51中任一项的HSC或iPS细胞。

55.一种用于在***位点将外源性编码序列整合到内源性内含子基因组区域中的方法，包括下列步骤：

-提供包括内源性内含子基因组区域的细胞，

b)第一强剪接位点序列，其包括分支点和剪接受体；

c)编码2A自切割肽的第一序列；

d)编码目的蛋白质的外源序列；

e)编码2A自切割肽的第二序列；

f)第一外显子的编码序列的拷贝；

g)包括剪接供体的第二强剪接位点序列；和

h)第二同源多核苷酸序列，其与***位点下游的内含子序列同源；

56.一种***载体，诸如AAV载体，其特征在于它包括用于***在内源性基因座处的外源性多核苷酸序列，该外源性多核苷酸序列包括以下序列：

b)第一强剪接位点序列，其包括分支点和剪接受体；

c)编码2A自切割肽的第一序列；

d)编码目的蛋白质的外源序列；

e)编码2A自切割肽的第二序列；

f)第一外显子的编码序列的拷贝；

g)包括剪接供体的第二强剪接位点序列；和

57.根据项目56的***载体，其中所述第一和第二同源序列与选自以下的内源性基因座同源：tmem119、s100a9、cd11b、b2m、cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、p2ry12、olfml3、p2ry13、hexb、rhob、jun、rab3il1、ccl2、fcrls、scoc、siglech、slc2a5、lrrc3、plxdc2、usp2、ctsf、cttnbp2nl、atp8a2、lgmn、mafb、egr1、bhlhe41、hpgds、ctsd、hspa1a、lag3、csf1r、adamts1、f11r、golm1、nuak1、crybb1、ltc4s、sgce、pla2g15、ccl3l1、abhd12、ang、ophn1、sparc、pros1、p2ry6、lair1、il1a、epb41l2、adora3、rilpl1、pmepa1、ccl13、pde3b、scamp5、ppp1r9a、tjp1、ak1、b4galt4、gtf2h2、trem2、ckb、acp2、pon3、agmo、tnfrsf17、fscn1、st3gal6、adap2、ccl4、entpd1、tmem86a、kctd12、dst、ctsl2、abcc3、pdgfb、pald1、tubgcp5、rapgef5、stab1、lacc1、tmc7、nrip1、kcnd1、tmem206、hps4、dagla、extl3、mlph、arhgap22、cxxc5、p4ha1、cysltr1、fgd2、kcnk13、gbgt1、c18orf1、cadm1、bco2、adrb1、c3ar1、large、leprel1、liph、upk1b、p2rx7、slc46a1、ebf3、ppp1r15a、il10ra、rasgrp3、fos、tppp、slc24a3、havcr2、nav2、apbb2、clstn1、blnk、gnaq、ptprm、frmd4a、cd86、tnfrsf11a、spint1、ppm1l、tgfbr2、cmklr1、tlr6、gas6、hist1h2ab、atf3、acvr1、abi3、lrp12、ttc28、plxna4、adamts16、rgs1、icam1、snx24、ly96、dnajb4和ppfia4。

58.根据项目56或57的***，其中由所述外源性编码序列编码的所述治疗性蛋白质与IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5(SEQ ID NO:1至SEQ ID NO:35–见表1)具有至少80％多肽序列同一性。

59.一种工程化细胞，其特征在于外源性多核苷酸序列已经***在内源性基因座处，该外源性多核苷酸序列包括以下各项：

-第一强剪接位点序列，其包括分支点和受***点；

-编码2A自切割肽的第一序列；

-编码目的蛋白质(诸如治疗性蛋白质)的外源序列,；

-编码2A自切割肽的第二序列；

-与所述基因座内源的前一外显子的编码序列的拷贝；

-包括剪接供***点的第二强剪接位点序列。

60.根据项目59的工程化细胞，其中所述外源性多核苷酸序列被***在选自以下的内源性基因座处：tmem119、s100a9、cd11b、B2m、Cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfia4。

61.根据项目59或60的工程化细胞，其中由所述外源性编码序列编码的治疗性蛋白质与IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5(SEQ ID NO:1至SEQ ID NO:35–见表1)具有至少80％多肽序列同一性。

已经对本发明进行了一般性描述，通过参考某些具体实施例可以获得进一步的理解，本文中提供这些实施例仅用于说明目的，并不旨在限制所要求保护的发明的范围。

实施例

实施例1：材料和方法

细胞培养：

HSC培养：将由GCS-F动员的Leukopak(Miltenyi)制备的HSC解冻并以0.4x10⁶个细胞/ml接种到由STEM Span II培养基(cat.#09655，Stemcell Technologies)组成的HSC培养基中，该培养基具有1x最终浓度的CD34+扩增混合物(cocktail)(#02691，StemcellTechnologies)和Pen-Strep(#15140-122，Gibco Life Technologies)。将细胞在37℃和5％ CO₂下温育48小时以在解冻后恢复，然后进行TALEN转染和AAV转导。

修复模板构建体：

对于S100A9，使用从Vigene获得的AAV6颗粒将合成外显子序列***S100A9基因座的第一个内含子中。该供体含有用于该内含子区域的左同源臂(SEQ ID NO:209)，随后是3’白蛋白剪接信号序列(SEQ ID NO:206)，随后是编码GSG接头的序列(SEQ ID NO:215)，随后是编码P2A肽的序列(SEQ ID NO:224)，随后是编码EGFP的序列(SEQ ID NO:218)或编码IDUA的序列(SEQ ID NO:2)，没有终止密码子，随后是T2A自切割肽(SEQ ID NO:225)，随后是S100A9的第一个外显子(SEQ ID NO:210)，随后是5’白蛋白剪接信号序列(SEQ ID NO:208)，随后是用于该内含子区域的右同源臂(SEQ ID NO:211)。

对于CD11b，使用从Vigene获得的AAV6颗粒将合成外显子序列***CD11b基因座的第一个内含子中。该供体含有用于该内含子区的左同源臂(SEQ ID NO:212)，随后是3’白蛋白剪接信号序列(SEQ ID NO:206)，随后是编码GSG接头的序列(SEQ ID NO:215)，随后是P2A自切割肽(SEQ ID NO:224)，随后是编码EGFP的序列(SEQ ID NO:218)或编码IDUA的序列(SEQ ID NO:2)，没有终止密码子，随后是T2A自切割肽(SEQ ID NO:225)，随后是CD11b重写的第一个外显子(SEQ ID NO:213)，随后是5’白蛋白剪接信号序列(SEQ ID NO:208)，随后是用于该内含子区域的右同源臂(SEQ ID NO:214)。

TALE-核酸酶试剂：

根据先前描述的协议(Poirot et al.2015)，生产了编码靶向CD11b(SEQ ID NO:TALEN_CD11B左和SEQ ID NO:TALEN_CD11B右)以及S100A9(SEQ ID NO:TALENS100A9左和SEQ ID NO:TALEN S100A9右)的TALE-核酸酶的mRNA。对于CD11b，所靶向的序列是TACAACATATTCTATCAgcctcttggtctgcaAAACCTAAAATTTACTA(SEQ IDNO:125)，而对于S100A9基因座，所靶向的序列为TTAGGGGCCCTGACAGCtctccataggtggagGCCTCAGGCAGGCAGGA(SEQ ID NO:175)。(TALEN是指定由Cellectis(8rue de la Croix Jarry,Paris,France)设计的TALE-核酸酶异二聚体的商标，包括如WO2011072246中描述的Fok-1核酸酶催化头。

基因编辑协议：转染

解冻48小时后，对HSC进行基因编辑。为此，收获HSC，用PBS洗涤一次，并以10x10⁶个细胞/ml的浓度重悬于高效电穿孔缓冲液(#45-0802，BTX)中。将TALEN mRNA与5μg每种TALEN臂和每百万个细胞的细胞悬浮液混合。使用表5中所示的程序，在BTX PulseAgile上对细胞和mRNA混合物进行电穿孔。将HSC转移到预热的扩增培养基中，最终浓度为2x10⁶个细胞/ml。

表5：用于HSC的BTX PulseAgile设置

设置	组1	组2	组3
				振幅(V)	1000	1000	130
持续时间(ms)	0.1	0.1	0.2
				间隔(ms)	0.2	100	2
次数	1	1	4

基因编辑：AAV制备和转导：

电穿孔后立即用不同剂量的AAV转导HSC，剂量包括0.3e4、1e4或3.2e4病毒基因组/细胞(vg/细胞)。在37C下温育15分钟，然后转移到30℃下22小时以恢复。第二天对细胞进行计数并在扩增培养基中稀释为0.2-0.6x10⁶个细胞/ml，并在37℃下培养。

髓样分化

如CD11b和S100A9等髓样基因在HSC中不表达。为了查看这些编辑基因座的表型表达，在髓样分化培养基中温育HSC。转染/转导后24小时，对HSC进行计数并以2e5个细胞/mL重新悬浮在稀释在STEM Span II(Stemcell Technologies，cat号09655)并补充有青霉素/链霉素(Pen/strep)的髓样扩增补充剂(Stemcell Technologies，cat号02694)中。然后将髓样扩增培养基中的细胞接种在非组织培养处理的平板中，每3-4天***，以约2e5个细胞/mL接种。培养14天后，回收细胞用于流式细胞术染色，和/或接种用于IDUA分泌。

IDUA分泌测定

髓样分化后14天，将细胞以相等数量(2e5个细胞/孔)接种在非组织培养96孔培养板中，并在37℃的髓样培养基中温育。播种后四天，收集上清液并使用商业ELISA(G-Biosciences，cat:IT2013)表征IDUA的量。

体内小鼠实验

从Jackson实验室订购六周龄的雌性NSG小鼠，并随意用水和食物饲养。用在DMSO中重构并在PBS中进一步稀释的白消安(Sigma Aldrich，cat号B3625)(在注射的第一天新鲜制备)对小鼠进行HSC移植预调理。然后，使用0.2μm注射器过滤器对白消安进行灭菌。小鼠腹腔注射15mg/kg白消安，每天一次，连续3天，然后注射HSC。在注射当天，用3％异氟烷(isoflorine)麻醉动物并通过眶后注射来注射1.5e6 HSC。在注射后16周，通过分析血液、骨髓和脑中是否存在人体细胞来评估移植情况。

大脑分离

首先用4％异氟烷麻醉小鼠并用50mL冷PBS灌注。提取大脑并置于含有5％ FBS+青霉素/链霉素的5mL DMEM中，并在处理所有小鼠和组织时将其保持在冰上。一旦提取出所有大脑，用无菌剪刀将大脑切成小块，并通过16g针头3次以均质化。为了进一步消化脑组织，将500μg/mL木瓜蛋白酶和20U/mL DNase I添加到脑匀浆中并在37℃下温育30分钟。温育后，剩余的脑组织通过40μM细胞过滤器并用新鲜的DMEM洗涤。然后将细胞重新悬浮在30％Percoll梯度中，用70％ Percoll梯度做底层，并在600g下旋转25分钟以去除髓磷脂。回收Percoll梯度界面中的细胞、洗涤和染色以用于流式细胞术或保留用于基因组DNA提取。

流式细胞术

将细胞在400xg下旋转5分钟。去除上清液并在FACS缓冲液(1mM EDTA+0.5％BSA在PBS中)中洗涤细胞一次。洗涤后，将细胞重悬于50μL在FACS缓冲液中以5μg/mL稀释的Fc封阻液(BD Bioscience，cat号564220)中。在4℃下温育5分钟后，向细胞中加入50μL在FACS缓冲液中稀释的表面抗体母液混合液，并在4℃下再温育30分钟。然后将细胞在FACS缓冲液中洗涤两次，然后在4℃下在100μμL固定剂/Perm溶液(BD Bioscience，cat号554722)中固定20分钟。将细胞在透化缓冲液中洗涤一次，然后在4℃下在细胞内抗体混合物(在透化缓冲液中稀释)中温育30分钟。将细胞在透化缓冲液中再次洗涤一次并重悬于100-200μL FACS缓冲液中，然后在BD Canto上进行分析。

对于体外髓样分化，使用下列抗体：CD11b APC(Miltenyi 130-110-554)、CD14VioBlue(Miltenyi 130-113-152)和S100A9 PE(Invitrogen MA5-28130)。对于骨髓细胞的染色，使用下列抗体：hCD45 PE-Cy7(BD 103114)、mCD45 V450(BD 560501)、CD33 PE(Miltenyi 130-113-349)、CD3 PerCP-Cy5.5(BD 560835)、CD34 APC-V770(Miltenyi 130-113-180)、CD19 FITC(BD 555412)。对于分离的脑细胞染色，使用以下抗体：hCD45 FITC(Miltenyi 130-113-117)、mCD45 APC-Cy7(BD 557659)、P2RY12 BV421(Biolegend392106)、纯化的TMEM119(Biolegend 853302)、抗-mIgG2b AF647(Biolegend 406716)、CD11b PE(Biolegend 101208)。对于每种抗体，包括荧光减一(fluorescence minus one，荧光扣除)(FMO)对照和单染色补偿珠。

实施例2：用于表达GFP的人工外显子(ArtEx)可以被***在外显子#1和#2之间并且充分处理以用于表达–体外结果

在髓样基因S100A9或CD11b的2个第一个外显子之间***人工外显子，应该实现从髓样谱系中表达治疗性蛋白质，而不损害S100A9或CD11b的内源性表达。为了概念验证，我们生成了靶向每个基因的内含子区域的TALEN，以及携带允许表达监测的GFP盒的AAV供体。作为我们方法的谱系特异性表达的对照，我们还生成了将含有GFP盒的启动子***AAVS1基因座的试剂，作为将在所有血液谱系中表达的更传统的安全港方法。

用靶向AAVS1、S100A9和CD11b基因座的TALEN mRNA转染预刺激的HSC，并用增加剂量的相应AAV-GFP修复模板进行转导。然后，在骨髓样细胞中分化经编辑的HSC。十四天后，通过流式细胞仪筛选分化细胞以表征不同细胞子集中的GFP表达。

分化后十四天，40-60％的细胞为CD14+。在CD14高细胞中，由GFP表达定义的基因编辑率为26％至60％，很大程度上取决于所使用的AAV剂量，对于CD11b和S100A9基因座，实现的最大值分别为56％和60％(图8A)。我们还评估了CD 14高细胞中内源性S100A9和CD11b的表达。所有CD14高细胞对CD11b和S100A9都是阳性的，无论它们是否被编辑(GFP+)或未编辑(GFP-)(图8B和8C)。

在任一基因座中都存在大量GFP细胞，这表明GFP盒已充分***第一2个外显子之间，并且我们添加的剪接信号已被剪接细胞机器充分处理。这种ArtEx策略允许表达双功能mRNA分子，该分子能够为***的基因(即GFP)蛋白和内源性CD11b或S100A9蛋白进行翻译。

实施例3：用于表达IDUA的人工外显子可以***外显子#1和#2之间并充分处理以用于表达和分泌-体外结果

用靶向S100A9和CD11b基因座的TALEN mRNA转染预刺激的HSC，并用增加剂量的相应AAV-IDUA修复模板进行转导。将编辑的HSC放入髓样分化培养基中。十四天后，将髓样分化细胞接种用于IDUA生产，而没有任何富集(髓样的％在40-60％之间)。3天后收集细胞上清液并通过ELISA定量IDUA。我们观察到在CD11b和S100A9基因座编辑的细胞分泌的IDUA分别是未编辑对照的10x倍和15x倍多(图9)。

这些结果证实，ArtEx策略允许特异性表达和治疗性蛋白质分泌。

实施例4：经编辑的HSC成功移植到动物模型的血液和骨髓中：体内结果

作为我们治疗方法的基础，HSC更相关的特征之一是它们能够在一次干预后提供终生供应的编辑细胞的能力。为此，HSC需要植入到骨髓中，增殖并产生血细胞，这些血细胞随后将填充体内的多个组织。

为了提供对这种HSC能力的一些了解，使用了免疫缺陷动物模型。具有靶向S100A9基因座的上述GFP盒的经编辑的HSC在编辑后24小时注射到条件NSG雌性动物中。该动物模型已显示出维持人类HSC在动物骨髓中的移植。

注射经编辑的HSC后16周，在所有动物中检测到血液和骨髓中的移植，在研究组中的水平相似，血液中平均为3.3％且骨髓中平均为40.8％(图10A和B)。此外，在动物的脾脏中可以检测到24％至30％的人体细胞(图10C)。更重要的是，在所有这些隔室中可以检测经编辑的细胞。

分析了这些动物血液中经编辑的细胞的存在。在大量人类CD45细胞上，我们发现在注射了在S100A9基因座处编辑的HSC的动物血液中平均有1.4％的GFP+细胞。然而，当分析到髓样隔室(在该模型中定义为CD33+细胞)时，编辑率增加到3.3％，是大批群体的两倍高(图11A)。

还分析了骨髓中经编码的细胞的百分比，并且1.3％的人类细胞是GFP+。此外，骨髓中2.8％的hCD45+和CD33+人类细胞是GFP+(图10B)。

实施例5：经编辑的HSC成功地移植到动物模型的大脑中：体内结果

这种治疗方法的另一个潜在优势是HSC衍生的小胶质细胞能够在脑室中分泌缺乏的LSD酶的能力，从而能够治疗与这些LSD疾病相关的破坏性神经症状。为了研究这一潜在特征，分析了上述动物大脑中人类细胞的存在。

在分离小鼠大脑和细胞处理后，在小鼠大脑中可以检测到大量人类细胞。大脑中平均2.7％的细胞来源于人类(图12A)。更重要的是，使用P2RY12和TMEM119小胶质细胞标志物，这些人类细胞中有18.5％含有衍生的小胶质细胞(图12B)。由于在这些动物外周血中存在的任何人类细胞中均未发现这2种标志物，这排除了在提取过程中外周血细胞对脑分离物的任何潜在污染。

在该脑室中，GFP阳性细胞分别占所有人类细胞和人类小胶质细胞的至少1.2％和1.6％。

实施例6：ArtEx编辑的HSC具有高分泌谱

比较了ArtEx编辑的HSC与经典慢病毒编辑的HSC关于它们分泌治疗性蛋白质的能力。

未经处理的HSC、用允许表达IDUA的慢病毒载体转导的HSC以及如前述实施例所描述的在S100A9或CD11b基因座处靶向整合IDUA的HSC。将经编辑的HSC放入髓样分化培养基中。十四天后，将髓样分化细胞接种用于IDUA生产。3天后收集细胞上清液并通过ELISA定量IDUA。我们观察到，在CD11b和S100A9基因座处编辑的细胞分泌的IDUA分别是未编辑的对照的10x和15x倍多(图13A)。

结果表明，ArtEx编辑的HSC能够通过10倍因子刺激IDUA分泌，而用慢病毒载体转导的HSC通过5倍因子刺激IDUA分泌。

此外，在小鼠中测试了HSC的移植效率，并且如先前观察到的，经编辑的HSC可以有效地移植入骨髓(50％)、脾脏(41％)和血液(45％)，并且最重要的是移植入大脑中，高达3.3％，具有大量的小胶质细胞(图13B和C)。

总之，这些结果表明，甚至在大脑中，ArtEx策略具有分泌高水平治疗性蛋白质的潜力。

序列表

<110> 塞勒克提斯公司(Cellectis S.A.)

<120> 对细胞进行基因修饰以递送治疗性蛋白质的方法（METHODS TO GENETICALLYMODIFY CELLS FOR DELIVERY OF THERAPEUTIC PROTEINS）

<130> P82103035PCT00

<150> US63020894

<151> 2020-05-06

<160> 226

<170> PatentIn version 3.5

<210> 1

<211> 1962

<212> DNA

<213> 人类(homo sapiens)

<220>

<223> IDUA多核苷酸序列

<400> 1

atgcgtcccc tgcgcccccg cgccgcgctg ctggcgctcc tggcctcgct cctggccgcg 60

cccccggtgg ccccggccga ggccccgcac ctggtgcatg tggacgcggc ccgcgcgctg 120

tggcccctgc ggcgcttctg gaggagcaca ggcttctgcc ccccgctgcc acacagccag 180

gctgaccagt acgtcctcag ctgggaccag cagctcaacc tcgcctatgt gggcgccgtc 240

cctcaccgcg gcatcaagca ggtccggacc cactggctgc tggagcttgt caccaccagg 300

gggtccactg gacggggcct gagctacaac ttcacccacc tggacgggta cctggacctt 360

ctcagggaga accagctcct cccagggttt gagctgatgg gcagcgcctc gggccacttc 420

actgactttg aggacaagca gcaggtgttt gagtggaagg acttggtctc cagcctggcc 480

aggagataca tcggtaggta cggactggcg catgtttcca agtggaactt cgagacgtgg 540

aatgagccag accaccacga ctttgacaac gtctccatga ccatgcaagg cttcctgaac 600

tactacgatg cctgctcgga gggtctgcgc gccgccagcc ccgccctgcg gctgggaggc 660

cccggcgact ccttccacac cccaccgcga tccccgctga gctggggcct cctgcgccac 720

tgccacgacg gtaccaactt cttcactggg gaggcgggcg tgcggctgga ctacatctcc 780

ctccacagga agggtgcgcg cagctccatc tccatcctgg agcaggagaa ggtcgtcgcg 840

cagcagatcc ggcagctctt ccccaagttc gcggacaccc ccatttacaa cgacgaggcg 900

gacccgctgg tgggctggtc cctgccacag ccgtggaggg cggacgtgac ctacgcggcc 960

atggtggtga aggtcatcgc gcagcatcag aacctgctac tggccaacac cacctccgcc 1020

ttcccctacg cgctcctgag caacgacaat gccttcctga gctaccaccc gcaccccttc 1080

gcgcagcgca cgctcaccgc gcgcttccag gtcaacaaca cccgcccgcc gcacgtgcag 1140

ctgttgcgca agccggtgct cacggccatg gggctgctgg cgctgctgga tgaggagcag 1200

ctctgggccg aagtgtcgca ggccgggacc gtcctggaca gcaaccacac ggtgggcgtc 1260

ctggccagcg cccaccgccc ccagggcccg gccgacgcct ggcgcgccgc ggtgctgatc 1320

tacgcgagcg acgacacccg cgcccacccc aaccgcagcg tcgcggtgac cctgcggctg 1380

cgcggggtgc cccccggccc gggcctggtc tacgtcacgc gctacctgga caacgggctc 1440

tgcagccccg acggcgagtg gcggcgcctg ggccggcccg tcttccccac ggcagagcag 1500

ttccggcgca tgcgcgcggc tgaggacccg gtggccgcgg cgccccgccc cttacccgcc 1560

ggcggccgcc tgaccctgcg ccccgcgctg cggctgccgt cgcttttgct ggtgcacgtg 1620

tgtgcgcgcc ccgagaagcc gcccgggcag gtcacgcggc tccgcgccct gcccctgacc 1680

caagggcagc tggttctggt ctggtcggat gaacacgtgg gctccaagtg cctgtggaca 1740

tacgagatcc agttctctca ggacggtaag gcgtacaccc cggtcagcag gaagccatcg 1800

accttcaacc tctttgtgtt cagcccagac acaggtgctg tctctggctc ctaccgagtt 1860

cgagccctgg actactgggc ccgaccaggc cccttctcgg accctgtgcc gtacctggag 1920

gtccctgtgc caagagggcc cccatccccg ggcaatccat ga 1962

<210> 2

<211> 653

<212> PRT

<213> 人类

<220>

<223> IDUA多肽序列

<400> 2

Met Arg Pro Leu Arg Pro Arg Ala Ala Leu Leu Ala Leu Leu Ala Ser

1 5 10 15

Leu Leu Ala Ala Pro Pro Val Ala Pro Ala Glu Ala Pro His Leu Val

20 25 30

His Val Asp Ala Ala Arg Ala Leu Trp Pro Leu Arg Arg Phe Trp Arg

35 40 45

Ser Thr Gly Phe Cys Pro Pro Leu Pro His Ser Gln Ala Asp Gln Tyr

50 55 60

Val Leu Ser Trp Asp Gln Gln Leu Asn Leu Ala Tyr Val Gly Ala Val

65 70 75 80

Pro His Arg Gly Ile Lys Gln Val Arg Thr His Trp Leu Leu Glu Leu

85 90 95

Val Thr Thr Arg Gly Ser Thr Gly Arg Gly Leu Ser Tyr Asn Phe Thr

100 105 110

His Leu Asp Gly Tyr Leu Asp Leu Leu Arg Glu Asn Gln Leu Leu Pro

115 120 125

Gly Phe Glu Leu Met Gly Ser Ala Ser Gly His Phe Thr Asp Phe Glu

130 135 140

Asp Lys Gln Gln Val Phe Glu Trp Lys Asp Leu Val Ser Ser Leu Ala

145 150 155 160

Arg Arg Tyr Ile Gly Arg Tyr Gly Leu Ala His Val Ser Lys Trp Asn

165 170 175

Phe Glu Thr Trp Asn Glu Pro Asp His His Asp Phe Asp Asn Val Ser

180 185 190

Met Thr Met Gln Gly Phe Leu Asn Tyr Tyr Asp Ala Cys Ser Glu Gly

195 200 205

Leu Arg Ala Ala Ser Pro Ala Leu Arg Leu Gly Gly Pro Gly Asp Ser

210 215 220

Phe His Thr Pro Pro Arg Ser Pro Leu Ser Trp Gly Leu Leu Arg His

225 230 235 240

Cys His Asp Gly Thr Asn Phe Phe Thr Gly Glu Ala Gly Val Arg Leu

245 250 255

Asp Tyr Ile Ser Leu His Arg Lys Gly Ala Arg Ser Ser Ile Ser Ile

260 265 270

Leu Glu Gln Glu Lys Val Val Ala Gln Gln Ile Arg Gln Leu Phe Pro

275 280 285

Lys Phe Ala Asp Thr Pro Ile Tyr Asn Asp Glu Ala Asp Pro Leu Val

290 295 300

Gly Trp Ser Leu Pro Gln Pro Trp Arg Ala Asp Val Thr Tyr Ala Ala

305 310 315 320

Met Val Val Lys Val Ile Ala Gln His Gln Asn Leu Leu Leu Ala Asn

325 330 335

Thr Thr Ser Ala Phe Pro Tyr Ala Leu Leu Ser Asn Asp Asn Ala Phe

340 345 350

Leu Ser Tyr His Pro His Pro Phe Ala Gln Arg Thr Leu Thr Ala Arg

355 360 365

Phe Gln Val Asn Asn Thr Arg Pro Pro His Val Gln Leu Leu Arg Lys

370 375 380

Pro Val Leu Thr Ala Met Gly Leu Leu Ala Leu Leu Asp Glu Glu Gln

385 390 395 400

Leu Trp Ala Glu Val Ser Gln Ala Gly Thr Val Leu Asp Ser Asn His

405 410 415

Thr Val Gly Val Leu Ala Ser Ala His Arg Pro Gln Gly Pro Ala Asp

420 425 430

Ala Trp Arg Ala Ala Val Leu Ile Tyr Ala Ser Asp Asp Thr Arg Ala

435 440 445

His Pro Asn Arg Ser Val Ala Val Thr Leu Arg Leu Arg Gly Val Pro

450 455 460

Pro Gly Pro Gly Leu Val Tyr Val Thr Arg Tyr Leu Asp Asn Gly Leu

465 470 475 480

Cys Ser Pro Asp Gly Glu Trp Arg Arg Leu Gly Arg Pro Val Phe Pro

485 490 495

Thr Ala Glu Gln Phe Arg Arg Met Arg Ala Ala Glu Asp Pro Val Ala

500 505 510

Ala Ala Pro Arg Pro Leu Pro Ala Gly Gly Arg Leu Thr Leu Arg Pro

515 520 525

Ala Leu Arg Leu Pro Ser Leu Leu Leu Val His Val Cys Ala Arg Pro

530 535 540

Glu Lys Pro Pro Gly Gln Val Thr Arg Leu Arg Ala Leu Pro Leu Thr

545 550 555 560

Gln Gly Gln Leu Val Leu Val Trp Ser Asp Glu His Val Gly Ser Lys

565 570 575

Cys Leu Trp Thr Tyr Glu Ile Gln Phe Ser Gln Asp Gly Lys Ala Tyr

580 585 590

Thr Pro Val Ser Arg Lys Pro Ser Thr Phe Asn Leu Phe Val Phe Ser

595 600 605

Pro Asp Thr Gly Ala Val Ser Gly Ser Tyr Arg Val Arg Ala Leu Asp

610 615 620

Tyr Trp Ala Arg Pro Gly Pro Phe Ser Asp Pro Val Pro Tyr Leu Glu

625 630 635 640

Val Pro Val Pro Arg Gly Pro Pro Ser Pro Gly Asn Pro

645 650

<210> 3

<211> 1383

<212> DNA

<213> 人类

<220>

<223> IDS多核苷酸序列

<400> 3

atgcctttgc gcaggagacc tgacaccacc cgcctgtacg acttcaactc ctactggagg 60

gtgcacgctg gaaacttctc caccatcccc cagtacttca aggagaatgg ctatgtgacc 120

atgtcggtgg gaaaagtctt tcaccctggg atatcttcta accataccga tgattctccg 180

tatagctggt cttttccacc ttatcatcct tcctctgaga agtatgaaaa cactaagaca 240

tgtcgagggc cagatggaga actccatgcc aacctgcttt gccctgtgga tgtgctggat 300

gttcccgagg gcaccttgcc tgacaaacag agcactgagc aagccataca gttgttggaa 360

aagatgaaaa cgtcagccag tcctttcttc ctggccgttg ggtatcataa gccacacatc 420

cccttcagat accccaagga atttcagaag ttgtatccct tggagaacat caccctggcc 480

cccgatcccg aggtccctga tggcctaccc cctgtggcct acaacccctg gatggacatc 540

aggcaacggg aagacgtcca agccttaaac atcagtgtgc cgtatggtcc aattcctgtg 600

gactttcagc ggaaaatccg ccagagctac tttgcctctg tgtcatattt ggatacacag 660

gtcggccgcc tcttgagtgc tttggacgat cttcagctgg ccaacagcac catcattgca 720

tttacctcgg atcatgggtg ggctctaggt gaacatggag aatgggccaa atacagcaat 780

tttgatgttg ctacccatgt tcccctgata ttctatgttc ctggaaggac ggcttcactt 840

ccggaggcag gcgagaagct tttcccttac ctcgaccctt ttgattccgc ctcacagttg 900

atggagccag gcaggcaatc catggacctt gtggaacttg tgtctctttt tcccacgctg 960

gctggacttg caggactgca ggttccacct cgctgccccg ttccttcatt tcacgttgag 1020

ctgtgcagag aaggcaagaa ccttctgaag cattttcgat tccgtgactt ggaagaggat 1080

ccgtacctcc ctggtaatcc ccgtgaactg attgcctata gccagtatcc ccggccttca 1140

gacatccctc agtggaattc tgacaagccg agtttaaaag atataaagat catgggctat 1200

tccatacgca ccatagacta taggtatact gtgtgggttg gcttcaatcc tgatgaattt 1260

ctagctaact tttctgacat ccatgcaggg gaactgtatt ttgtggattc tgacccattg 1320

caggatcaca atatgtataa tgattcccaa ggtggagatc ttttccagtt gttgatgcct 1380

tga 1383

<210> 4

<211> 460

<212> PRT

<213> 人类

<220>

<223> IDS多肽序列

<400> 4

Met Pro Leu Arg Arg Arg Pro Asp Thr Thr Arg Leu Tyr Asp Phe Asn

1 5 10 15

Ser Tyr Trp Arg Val His Ala Gly Asn Phe Ser Thr Ile Pro Gln Tyr

20 25 30

Phe Lys Glu Asn Gly Tyr Val Thr Met Ser Val Gly Lys Val Phe His

35 40 45

Pro Gly Ile Ser Ser Asn His Thr Asp Asp Ser Pro Tyr Ser Trp Ser

50 55 60

Phe Pro Pro Tyr His Pro Ser Ser Glu Lys Tyr Glu Asn Thr Lys Thr

65 70 75 80

Cys Arg Gly Pro Asp Gly Glu Leu His Ala Asn Leu Leu Cys Pro Val

85 90 95

Asp Val Leu Asp Val Pro Glu Gly Thr Leu Pro Asp Lys Gln Ser Thr

100 105 110

Glu Gln Ala Ile Gln Leu Leu Glu Lys Met Lys Thr Ser Ala Ser Pro

115 120 125

Phe Phe Leu Ala Val Gly Tyr His Lys Pro His Ile Pro Phe Arg Tyr

130 135 140

Pro Lys Glu Phe Gln Lys Leu Tyr Pro Leu Glu Asn Ile Thr Leu Ala

145 150 155 160

Pro Asp Pro Glu Val Pro Asp Gly Leu Pro Pro Val Ala Tyr Asn Pro

165 170 175

Trp Met Asp Ile Arg Gln Arg Glu Asp Val Gln Ala Leu Asn Ile Ser

180 185 190

Val Pro Tyr Gly Pro Ile Pro Val Asp Phe Gln Arg Lys Ile Arg Gln

195 200 205

Ser Tyr Phe Ala Ser Val Ser Tyr Leu Asp Thr Gln Val Gly Arg Leu

210 215 220

Leu Ser Ala Leu Asp Asp Leu Gln Leu Ala Asn Ser Thr Ile Ile Ala

225 230 235 240

Phe Thr Ser Asp His Gly Trp Ala Leu Gly Glu His Gly Glu Trp Ala

245 250 255

Lys Tyr Ser Asn Phe Asp Val Ala Thr His Val Pro Leu Ile Phe Tyr

260 265 270

Val Pro Gly Arg Thr Ala Ser Leu Pro Glu Ala Gly Glu Lys Leu Phe

275 280 285

Pro Tyr Leu Asp Pro Phe Asp Ser Ala Ser Gln Leu Met Glu Pro Gly

290 295 300

Arg Gln Ser Met Asp Leu Val Glu Leu Val Ser Leu Phe Pro Thr Leu

305 310 315 320

Ala Gly Leu Ala Gly Leu Gln Val Pro Pro Arg Cys Pro Val Pro Ser

325 330 335

Phe His Val Glu Leu Cys Arg Glu Gly Lys Asn Leu Leu Lys His Phe

340 345 350

Arg Phe Arg Asp Leu Glu Glu Asp Pro Tyr Leu Pro Gly Asn Pro Arg

355 360 365

Glu Leu Ile Ala Tyr Ser Gln Tyr Pro Arg Pro Ser Asp Ile Pro Gln

370 375 380

Trp Asn Ser Asp Lys Pro Ser Leu Lys Asp Ile Lys Ile Met Gly Tyr

385 390 395 400

Ser Ile Arg Thr Ile Asp Tyr Arg Tyr Thr Val Trp Val Gly Phe Asn

405 410 415

Pro Asp Glu Phe Leu Ala Asn Phe Ser Asp Ile His Ala Gly Glu Leu

420 425 430

Tyr Phe Val Asp Ser Asp Pro Leu Gln Asp His Asn Met Tyr Asn Asp

435 440 445

Ser Gln Gly Gly Asp Leu Phe Gln Leu Leu Met Pro

450 455 460

<210> 5

<211> 1956

<212> DNA

<213> 人类

<220>

<223> ARSB多核苷酸序列

<400> 5

atggcccggg ggtcggcggt tgcctgggcg gcgctcgggc cgttgttgtg gggctgcgcg 60

ctggggctgc agggcgggat gctgtacccc caggagagcc cgtcgcggga gtgcaaggag 120

ctggacggcc tctggagctt ccgcgccgac ttctctgaca accgacgccg gggcttcgag 180

gagcagtggt accggcggcc gctgtgggag tcaggcccca ccgtggacat gccagttccc 240

tccagcttca atgacatcag ccaggactgg cgtctgcggc attttgtcgg ctgggtgtgg 300

tacgaacggg aggtgatcct gccggagcga tggacccagg acctgcgcac aagagtggtg 360

ctgaggattg gcagtgccca ttcctatgcc atcgtgtggg tgaatggggt cgacacgcta 420

gagcatgagg ggggctacct ccccttcgag gccgacatca gcaacctggt ccaggtgggg 480

cccctgccct cccggctccg aatcactatc gccatcaaca acacactcac ccccaccacc 540

ctgccaccag ggaccatcca atacctgact gacacctcca agtatcccaa gggttacttt 600

gtccagaaca catattttga ctttttcaac tacgctggac tgcagcggtc tgtacttctg 660

tacacgacac ccaccaccta catcgatgac atcaccgtca ccaccagcgt ggagcaagac 720

agtgggctgg tgaattacca gatctctgtc aagggcagta acctgttcaa gttggaagtg 780

cgtcttttgg atgcagaaaa caaagtcgtg gcgaatggga ctgggaccca gggccaactt 840

aaggtgccag gtgtcagcct ctggtggccg tacctgatgc acgaacgccc tgcctatctg 900

tattcattgg aggtgcagct gactgcacag acgtcactgg ggcctgtgtc tgacttctac 960

acactccctg tggggatccg cactgtggct gtcaccaaga gccagttcct catcaatggg 1020

aaacctttct atttccacgg tgtcaacaag catgaggatg cggacatccg agggaagggc 1080

ttcgactggc cgctgctggt gaaggacttc aacctgcttc gctggcttgg tgccaacgct 1140

ttccgtacca gccactaccc ctatgcagag gaagtgatgc agatgtgtga ccgctatggg 1200

attgtggtca tcgatgagtg tcccggcgtg ggcctggcgc tgccgcagtt cttcaacaac 1260

gtttctctgc atcaccacat gcaggtgatg gaagaagtgg tgcgtaggga caagaaccac 1320

cccgcggtcg tgatgtggtc tgtggccaac gagcctgcgt cccacctaga atctgctggc 1380

tactacttga agatggtgat cgctcacacc aaatccttgg acccctcccg gcctgtgacc 1440

tttgtgagca actctaacta tgcagcagac aagggggctc cgtatgtgga tgtgatctgt 1500

ttgaacagct actactcttg gtatcacgac tacgggcacc tggagttgat tcagctgcag 1560

ctggccaccc agtttgagaa ctggtataag aagtatcaga agcccattat tcagagcgag 1620

tatggagcag aaacgattgc agggtttcac caggatccac ctctgatgtt cactgaagag 1680

taccagaaaa gtctgctaga gcagtaccat ctgggtctgg atcaaaaacg cagaaaatac 1740

gtggttggag agctcatttg gaattttgcc gatttcatga ctgaacagtc accgacgaga 1800

gtgctgggga ataaaaaggg gatcttcact cggcagagac aaccaaaaag tgcagcgttc 1860

cttttgcgag agagatactg gaagattgcc aatgaaacca ggtatcccca ctcagtagcc 1920

aagtcacaat gtttggaaaa cagcctgttt acttga 1956

<210> 6

<211> 533

<212> PRT

<213> 人类

<220>

<223> ARSB多肽序列

<400> 6

Met Gly Pro Arg Gly Ala Ala Ser Leu Pro Arg Gly Pro Gly Pro Arg

1 5 10 15

Arg Leu Leu Leu Pro Val Val Leu Pro Leu Leu Leu Leu Leu Leu Leu

20 25 30

Ala Pro Pro Gly Ser Gly Ala Gly Ala Ser Arg Pro Pro His Leu Val

35 40 45

Phe Leu Leu Ala Asp Asp Leu Gly Trp Asn Asp Val Gly Phe His Gly

50 55 60

Ser Arg Ile Arg Thr Pro His Leu Asp Ala Leu Ala Ala Gly Gly Val

65 70 75 80

Leu Leu Asp Asn Tyr Tyr Thr Gln Pro Leu Cys Thr Pro Ser Arg Ser

85 90 95

Gln Leu Leu Thr Gly Arg Tyr Gln Ile Arg Thr Gly Leu Gln His Gln

100 105 110

Ile Ile Trp Pro Cys Gln Pro Ser Cys Val Pro Leu Asp Glu Lys Leu

115 120 125

Leu Pro Gln Leu Leu Lys Glu Ala Gly Tyr Thr Thr His Met Val Gly

130 135 140

Lys Trp His Leu Gly Met Tyr Arg Lys Glu Cys Leu Pro Thr Arg Arg

145 150 155 160

Gly Phe Asp Thr Tyr Phe Gly Tyr Leu Leu Gly Ser Glu Asp Tyr Tyr

165 170 175

Ser His Glu Arg Cys Thr Leu Ile Asp Ala Leu Asn Val Thr Arg Cys

180 185 190

Ala Leu Asp Phe Arg Asp Gly Glu Glu Val Ala Thr Gly Tyr Lys Asn

195 200 205

Met Tyr Ser Thr Asn Ile Phe Thr Lys Arg Ala Ile Ala Leu Ile Thr

210 215 220

Asn His Pro Pro Glu Lys Pro Leu Phe Leu Tyr Leu Ala Leu Gln Ser

225 230 235 240

Val His Glu Pro Leu Gln Val Pro Glu Glu Tyr Leu Lys Pro Tyr Asp

245 250 255

Phe Ile Gln Asp Lys Asn Arg His His Tyr Ala Gly Met Val Ser Leu

260 265 270

Met Asp Glu Ala Val Gly Asn Val Thr Ala Ala Leu Lys Ser Ser Gly

275 280 285

Leu Trp Asn Asn Thr Val Phe Ile Phe Ser Thr Asp Asn Gly Gly Gln

290 295 300

Thr Leu Ala Gly Gly Asn Asn Trp Pro Leu Arg Gly Arg Lys Trp Ser

305 310 315 320

Leu Trp Glu Gly Gly Val Arg Gly Val Gly Phe Val Ala Ser Pro Leu

325 330 335

Leu Lys Gln Lys Gly Val Lys Asn Arg Glu Leu Ile His Ile Ser Asp

340 345 350

Trp Leu Pro Thr Leu Val Lys Leu Ala Arg Gly His Thr Asn Gly Thr

355 360 365

Lys Pro Leu Asp Gly Phe Asp Val Trp Lys Thr Ile Ser Glu Gly Ser

370 375 380

Pro Ser Pro Arg Ile Glu Leu Leu His Asn Ile Asp Pro Asn Phe Val

385 390 395 400

Asp Ser Ser Pro Cys Pro Arg Asn Ser Met Ala Pro Ala Lys Asp Asp

405 410 415

Ser Ser Leu Pro Glu Tyr Ser Ala Phe Asn Thr Ser Val His Ala Ala

420 425 430

Ile Arg His Gly Asn Trp Lys Leu Leu Thr Gly Tyr Pro Gly Cys Gly

435 440 445

Tyr Trp Phe Pro Pro Pro Ser Gln Tyr Asn Val Ser Glu Ile Pro Ser

450 455 460

Ser Asp Pro Pro Thr Lys Thr Leu Trp Leu Phe Asp Ile Asp Arg Asp

465 470 475 480

Pro Glu Glu Arg His Asp Leu Ser Arg Glu Tyr Pro His Ile Val Thr

485 490 495

Lys Leu Leu Ser Arg Leu Gln Phe Tyr His Lys His Ser Val Pro Val

500 505 510

Tyr Phe Pro Ala Gln Asp Pro Arg Cys Asp Pro Lys Ala Thr Gly Val

515 520 525

Trp Gly Pro Trp Met

530

<210> 7

<211> 1956

<212> DNA

<213> 人类

<220>

<223> GUSB多核苷酸序列

<400> 7

atggcccggg ggtcggcggt tgcctgggcg gcgctcgggc cgttgttgtg gggctgcgcg 60

ctggggctgc agggcgggat gctgtacccc caggagagcc cgtcgcggga gtgcaaggag 120

ctggacggcc tctggagctt ccgcgccgac ttctctgaca accgacgccg gggcttcgag 180

gagcagtggt accggcggcc gctgtgggag tcaggcccca ccgtggacat gccagttccc 240

tccagcttca atgacatcag ccaggactgg cgtctgcggc attttgtcgg ctgggtgtgg 300

tacgaacggg aggtgatcct gccggagcga tggacccagg acctgcgcac aagagtggtg 360

ctgaggattg gcagtgccca ttcctatgcc atcgtgtggg tgaatggggt cgacacgcta 420

gagcatgagg ggggctacct ccccttcgag gccgacatca gcaacctggt ccaggtgggg 480

cccctgccct cccggctccg aatcactatc gccatcaaca acacactcac ccccaccacc 540

ctgccaccag ggaccatcca atacctgact gacacctcca agtatcccaa gggttacttt 600

gtccagaaca catattttga ctttttcaac tacgctggac tgcagcggtc tgtacttctg 660

tacacgacac ccaccaccta catcgatgac atcaccgtca ccaccagcgt ggagcaagac 720

agtgggctgg tgaattacca gatctctgtc aagggcagta acctgttcaa gttggaagtg 780

cgtcttttgg atgcagaaaa caaagtcgtg gcgaatggga ctgggaccca gggccaactt 840

aaggtgccag gtgtcagcct ctggtggccg tacctgatgc acgaacgccc tgcctatctg 900

tattcattgg aggtgcagct gactgcacag acgtcactgg ggcctgtgtc tgacttctac 960

acactccctg tggggatccg cactgtggct gtcaccaaga gccagttcct catcaatggg 1020

aaacctttct atttccacgg tgtcaacaag catgaggatg cggacatccg agggaagggc 1080

ttcgactggc cgctgctggt gaaggacttc aacctgcttc gctggcttgg tgccaacgct 1140

ttccgtacca gccactaccc ctatgcagag gaagtgatgc agatgtgtga ccgctatggg 1200

attgtggtca tcgatgagtg tcccggcgtg ggcctggcgc tgccgcagtt cttcaacaac 1260

gtttctctgc atcaccacat gcaggtgatg gaagaagtgg tgcgtaggga caagaaccac 1320

cccgcggtcg tgatgtggtc tgtggccaac gagcctgcgt cccacctaga atctgctggc 1380

tactacttga agatggtgat cgctcacacc aaatccttgg acccctcccg gcctgtgacc 1440

tttgtgagca actctaacta tgcagcagac aagggggctc cgtatgtgga tgtgatctgt 1500

ttgaacagct actactcttg gtatcacgac tacgggcacc tggagttgat tcagctgcag 1560

ctggccaccc agtttgagaa ctggtataag aagtatcaga agcccattat tcagagcgag 1620

tatggagcag aaacgattgc agggtttcac caggatccac ctctgatgtt cactgaagag 1680

taccagaaaa gtctgctaga gcagtaccat ctgggtctgg atcaaaaacg cagaaaatac 1740

gtggttggag agctcatttg gaattttgcc gatttcatga ctgaacagtc accgacgaga 1800

gtgctgggga ataaaaaggg gatcttcact cggcagagac aaccaaaaag tgcagcgttc 1860

cttttgcgag agagatactg gaagattgcc aatgaaacca ggtatcccca ctcagtagcc 1920

aagtcacaat gtttggaaaa cagcctgttt acttga 1956

<210> 8

<211> 651

<212> PRT

<213> 人类

<220>

<223> GUSB多肽序列

<400> 8

Met Ala Arg Gly Ser Ala Val Ala Trp Ala Ala Leu Gly Pro Leu Leu

1 5 10 15

Trp Gly Cys Ala Leu Gly Leu Gln Gly Gly Met Leu Tyr Pro Gln Glu

20 25 30

Ser Pro Ser Arg Glu Cys Lys Glu Leu Asp Gly Leu Trp Ser Phe Arg

35 40 45

Ala Asp Phe Ser Asp Asn Arg Arg Arg Gly Phe Glu Glu Gln Trp Tyr

50 55 60

Arg Arg Pro Leu Trp Glu Ser Gly Pro Thr Val Asp Met Pro Val Pro

65 70 75 80

Ser Ser Phe Asn Asp Ile Ser Gln Asp Trp Arg Leu Arg His Phe Val

85 90 95

Gly Trp Val Trp Tyr Glu Arg Glu Val Ile Leu Pro Glu Arg Trp Thr

100 105 110

Gln Asp Leu Arg Thr Arg Val Val Leu Arg Ile Gly Ser Ala His Ser

115 120 125

Tyr Ala Ile Val Trp Val Asn Gly Val Asp Thr Leu Glu His Glu Gly

130 135 140

Gly Tyr Leu Pro Phe Glu Ala Asp Ile Ser Asn Leu Val Gln Val Gly

145 150 155 160

Pro Leu Pro Ser Arg Leu Arg Ile Thr Ile Ala Ile Asn Asn Thr Leu

165 170 175

Thr Pro Thr Thr Leu Pro Pro Gly Thr Ile Gln Tyr Leu Thr Asp Thr

180 185 190

Ser Lys Tyr Pro Lys Gly Tyr Phe Val Gln Asn Thr Tyr Phe Asp Phe

195 200 205

Phe Asn Tyr Ala Gly Leu Gln Arg Ser Val Leu Leu Tyr Thr Thr Pro

210 215 220

Thr Thr Tyr Ile Asp Asp Ile Thr Val Thr Thr Ser Val Glu Gln Asp

225 230 235 240

Ser Gly Leu Val Asn Tyr Gln Ile Ser Val Lys Gly Ser Asn Leu Phe

245 250 255

Lys Leu Glu Val Arg Leu Leu Asp Ala Glu Asn Lys Val Val Ala Asn

260 265 270

Gly Thr Gly Thr Gln Gly Gln Leu Lys Val Pro Gly Val Ser Leu Trp

275 280 285

Trp Pro Tyr Leu Met His Glu Arg Pro Ala Tyr Leu Tyr Ser Leu Glu

290 295 300

Val Gln Leu Thr Ala Gln Thr Ser Leu Gly Pro Val Ser Asp Phe Tyr

305 310 315 320

Thr Leu Pro Val Gly Ile Arg Thr Val Ala Val Thr Lys Ser Gln Phe

325 330 335

Leu Ile Asn Gly Lys Pro Phe Tyr Phe His Gly Val Asn Lys His Glu

340 345 350

Asp Ala Asp Ile Arg Gly Lys Gly Phe Asp Trp Pro Leu Leu Val Lys

355 360 365

Asp Phe Asn Leu Leu Arg Trp Leu Gly Ala Asn Ala Phe Arg Thr Ser

370 375 380

His Tyr Pro Tyr Ala Glu Glu Val Met Gln Met Cys Asp Arg Tyr Gly

385 390 395 400

Ile Val Val Ile Asp Glu Cys Pro Gly Val Gly Leu Ala Leu Pro Gln

405 410 415

Phe Phe Asn Asn Val Ser Leu His His His Met Gln Val Met Glu Glu

420 425 430

Val Val Arg Arg Asp Lys Asn His Pro Ala Val Val Met Trp Ser Val

435 440 445

Ala Asn Glu Pro Ala Ser His Leu Glu Ser Ala Gly Tyr Tyr Leu Lys

450 455 460

Met Val Ile Ala His Thr Lys Ser Leu Asp Pro Ser Arg Pro Val Thr

465 470 475 480

Phe Val Ser Asn Ser Asn Tyr Ala Ala Asp Lys Gly Ala Pro Tyr Val

485 490 495

Asp Val Ile Cys Leu Asn Ser Tyr Tyr Ser Trp Tyr His Asp Tyr Gly

500 505 510

His Leu Glu Leu Ile Gln Leu Gln Leu Ala Thr Gln Phe Glu Asn Trp

515 520 525

Tyr Lys Lys Tyr Gln Lys Pro Ile Ile Gln Ser Glu Tyr Gly Ala Glu

530 535 540

Thr Ile Ala Gly Phe His Gln Asp Pro Pro Leu Met Phe Thr Glu Glu

545 550 555 560

Tyr Gln Lys Ser Leu Leu Glu Gln Tyr His Leu Gly Leu Asp Gln Lys

565 570 575

Arg Arg Lys Tyr Val Val Gly Glu Leu Ile Trp Asn Phe Ala Asp Phe

580 585 590

Met Thr Glu Gln Ser Pro Thr Arg Val Leu Gly Asn Lys Lys Gly Ile

595 600 605

Phe Thr Arg Gln Arg Gln Pro Lys Ser Ala Ala Phe Leu Leu Arg Glu

610 615 620

Arg Tyr Trp Lys Ile Ala Asn Glu Thr Arg Tyr Pro His Ser Val Ala

625 630 635 640

Lys Ser Gln Cys Leu Glu Asn Ser Leu Phe Thr

645 650

<210> 9

<211> 2238

<212> DNA

<213> 人类

<220>

<223> ABCD1多核苷酸序列

<400> 9

atgccggtgc tctccaggcc ccggccctgg cgggggaaca cgctgaagcg cacggccgtg 60

ctcctggccc tcgcggccta tggagcccac aaagtctacc ccttggtgcg ccagtgcctg 120

gccccggcca ggggtcttca ggcgcccgcc ggggagccca cgcaggaggc ctccggggtc 180

gcggcggcca aagctggcat gaaccgggta ttcctgcagc ggctcctgtg gctcctgcgg 240

ctgctgttcc cccgggtcct gtgccgggag acggggctgc tggccctgca ctcggccgcc 300

ttggtgagcc gcaccttcct gtcggtgtat gtggcccgcc tggacggaag gctggcccgc 360

tgcatcgtcc gcaaggaccc gcgggctttt ggctggcagc tgctgcagtg gctcctcatc 420

gccctccctg ctaccttcgt caacagtgcc atccgttacc tggagggcca actggccctg 480

tcgttccgca gccgtctggt ggcccacgcc taccgcctct acttctccca gcagacctac 540

taccgggtca gcaacatgga cgggcggctt cgcaaccctg accagtctct gacggaggac 600

gtggtggcct ttgcggcctc tgtggcccac ctctactcca acctgaccaa gccactcctg 660

gacgtggctg tgacttccta caccctgctt cgggcggccc gctcccgtgg agccggcaca 720

gcctggccct cggccatcgc cggcctcgtg gtgttcctca cggccaacgt gctgcgggcc 780

ttctcgccca agttcgggga gctggtggca gaggaggcgc ggcggaaggg ggagctgcgc 840

tacatgcact cgcgtgtggt ggccaactcg gaggagatcg ccttctatgg gggccatgag 900

gtggagctgg ccctgctaca gcgctcctac caggacctgg cctcgcagat caacctcatc 960

cttctggaac gcctgtggta tgttatgctg gagcagttcc tcatgaagta tgtgtggagc 1020

gcctcgggcc tgctcatggt ggctgtcccc atcatcactg ccactggcta ctcagagtca 1080

gatgcagagg ccgtgaagaa ggcagccttg gaaaagaagg aggaggagct ggtgagcgag 1140

cgcacagaag ccttcactat tgcccgcaac ctcctgacag cggctgcaga tgccattgag 1200

cggatcatgt cgtcgtacaa ggaggtgacg gagctggctg gctacacagc ccgggtgcac 1260

gagatgttcc aggtatttga agatgttcag cgctgtcact tcaagaggcc cagggagcta 1320

gaggacgctc aggcggggtc tgggaccata ggccggtctg gtgtccgtgt ggagggcccc 1380

ctgaagatcc gaggccaggt ggtggatgtg gaacagggga tcatctgcga gaacatcccc 1440

atcgtcacgc cctcaggaga ggtggtggtg gccagcctca acatcagggt ggaggaaggc 1500

atgcatctgc tcatcacagg ccccaatggc tgcggcaaga gctccctgtt ccggatcctg 1560

ggtgggctct ggcccacgta cggtggtgtg ctctacaagc ccccacccca gcgcatgttc 1620

tacatcccgc agaggcccta catgtctgtg ggctccctgc gtgaccaggt gatctacccg 1680

gactcagtgg aggacatgca aaggaagggc tactcggagc aggacctgga agccatcctg 1740

gacgtcgtgc acctgcacca catcctgcag cgggagggag gttgggaggc tatgtgtgac 1800

tggaaggacg tcctgtcggg tggcgagaag cagagaatcg gcatggcccg catgttctac 1860

cacaggccca agtacgccct cctggatgaa tgcaccagcg ccgtgagcat cgacgtggaa 1920

ggcaagatct tccaggcggc caaggacgcg ggcattgccc tgctctccat cacccaccgg 1980

ccctccctgt ggaaatacca cacacacttg ctacagttcg atggggaggg cggctggaag 2040

ttcgagaagc tggactcagc tgcccgcctg agcctgacgg aggagaagca gcggctggag 2100

cagcagctgg cgggcattcc caagatgcag cggcgcctcc aggagctctg ccagatcctg 2160

ggcgaggccg tggccccagc gcatgtgccg gcacctagcc cgcaaggccc tggtggcctc 2220

cagggtgcct ccacctga 2238

<210> 10

<211> 745

<212> PRT

<213> 人类

<220>

<223> ABCD1多肽序列

<400> 10

Met Pro Val Leu Ser Arg Pro Arg Pro Trp Arg Gly Asn Thr Leu Lys

1 5 10 15

Arg Thr Ala Val Leu Leu Ala Leu Ala Ala Tyr Gly Ala His Lys Val

20 25 30

Tyr Pro Leu Val Arg Gln Cys Leu Ala Pro Ala Arg Gly Leu Gln Ala

35 40 45

Pro Ala Gly Glu Pro Thr Gln Glu Ala Ser Gly Val Ala Ala Ala Lys

50 55 60

Ala Gly Met Asn Arg Val Phe Leu Gln Arg Leu Leu Trp Leu Leu Arg

65 70 75 80

Leu Leu Phe Pro Arg Val Leu Cys Arg Glu Thr Gly Leu Leu Ala Leu

85 90 95

His Ser Ala Ala Leu Val Ser Arg Thr Phe Leu Ser Val Tyr Val Ala

100 105 110

Arg Leu Asp Gly Arg Leu Ala Arg Cys Ile Val Arg Lys Asp Pro Arg

115 120 125

Ala Phe Gly Trp Gln Leu Leu Gln Trp Leu Leu Ile Ala Leu Pro Ala

130 135 140

Thr Phe Val Asn Ser Ala Ile Arg Tyr Leu Glu Gly Gln Leu Ala Leu

145 150 155 160

Ser Phe Arg Ser Arg Leu Val Ala His Ala Tyr Arg Leu Tyr Phe Ser

165 170 175

Gln Gln Thr Tyr Tyr Arg Val Ser Asn Met Asp Gly Arg Leu Arg Asn

180 185 190

Pro Asp Gln Ser Leu Thr Glu Asp Val Val Ala Phe Ala Ala Ser Val

195 200 205

Ala His Leu Tyr Ser Asn Leu Thr Lys Pro Leu Leu Asp Val Ala Val

210 215 220

Thr Ser Tyr Thr Leu Leu Arg Ala Ala Arg Ser Arg Gly Ala Gly Thr

225 230 235 240

Ala Trp Pro Ser Ala Ile Ala Gly Leu Val Val Phe Leu Thr Ala Asn

245 250 255

Val Leu Arg Ala Phe Ser Pro Lys Phe Gly Glu Leu Val Ala Glu Glu

260 265 270

Ala Arg Arg Lys Gly Glu Leu Arg Tyr Met His Ser Arg Val Val Ala

275 280 285

Asn Ser Glu Glu Ile Ala Phe Tyr Gly Gly His Glu Val Glu Leu Ala

290 295 300

Leu Leu Gln Arg Ser Tyr Gln Asp Leu Ala Ser Gln Ile Asn Leu Ile

305 310 315 320

Leu Leu Glu Arg Leu Trp Tyr Val Met Leu Glu Gln Phe Leu Met Lys

325 330 335

Tyr Val Trp Ser Ala Ser Gly Leu Leu Met Val Ala Val Pro Ile Ile

340 345 350

Thr Ala Thr Gly Tyr Ser Glu Ser Asp Ala Glu Ala Val Lys Lys Ala

355 360 365

Ala Leu Glu Lys Lys Glu Glu Glu Leu Val Ser Glu Arg Thr Glu Ala

370 375 380

Phe Thr Ile Ala Arg Asn Leu Leu Thr Ala Ala Ala Asp Ala Ile Glu

385 390 395 400

Arg Ile Met Ser Ser Tyr Lys Glu Val Thr Glu Leu Ala Gly Tyr Thr

405 410 415

Ala Arg Val His Glu Met Phe Gln Val Phe Glu Asp Val Gln Arg Cys

420 425 430

His Phe Lys Arg Pro Arg Glu Leu Glu Asp Ala Gln Ala Gly Ser Gly

435 440 445

Thr Ile Gly Arg Ser Gly Val Arg Val Glu Gly Pro Leu Lys Ile Arg

450 455 460

Gly Gln Val Val Asp Val Glu Gln Gly Ile Ile Cys Glu Asn Ile Pro

465 470 475 480

Ile Val Thr Pro Ser Gly Glu Val Val Val Ala Ser Leu Asn Ile Arg

485 490 495

Val Glu Glu Gly Met His Leu Leu Ile Thr Gly Pro Asn Gly Cys Gly

500 505 510

Lys Ser Ser Leu Phe Arg Ile Leu Gly Gly Leu Trp Pro Thr Tyr Gly

515 520 525

Gly Val Leu Tyr Lys Pro Pro Pro Gln Arg Met Phe Tyr Ile Pro Gln

530 535 540

Arg Pro Tyr Met Ser Val Gly Ser Leu Arg Asp Gln Val Ile Tyr Pro

545 550 555 560

Asp Ser Val Glu Asp Met Gln Arg Lys Gly Tyr Ser Glu Gln Asp Leu

565 570 575

Glu Ala Ile Leu Asp Val Val His Leu His His Ile Leu Gln Arg Glu

580 585 590

Gly Gly Trp Glu Ala Met Cys Asp Trp Lys Asp Val Leu Ser Gly Gly

595 600 605

Glu Lys Gln Arg Ile Gly Met Ala Arg Met Phe Tyr His Arg Pro Lys

610 615 620

Tyr Ala Leu Leu Asp Glu Cys Thr Ser Ala Val Ser Ile Asp Val Glu

625 630 635 640

Gly Lys Ile Phe Gln Ala Ala Lys Asp Ala Gly Ile Ala Leu Leu Ser

645 650 655

Ile Thr His Arg Pro Ser Leu Trp Lys Tyr His Thr His Leu Leu Gln

660 665 670

Phe Asp Gly Glu Gly Gly Trp Lys Phe Glu Lys Leu Asp Ser Ala Ala

675 680 685

Arg Leu Ser Leu Thr Glu Glu Lys Gln Arg Leu Glu Gln Gln Leu Ala

690 695 700

Gly Ile Pro Lys Met Gln Arg Arg Leu Gln Glu Leu Cys Gln Ile Leu

705 710 715 720

Gly Glu Ala Val Ala Pro Ala His Val Pro Ala Pro Ser Pro Gln Gly

725 730 735

Pro Gly Gly Leu Gln Gly Ala Ser Thr

740 745

<210> 11

<211> 2058

<212> DNA

<213> 人类

<220>

<223> GALC多核苷酸序列

<400> 11

atggctgagt ggctactctc ggcttcctgg caacgccgag cgaaagctat gactgcggcc 60

gcgggttcgg cgggccgcgc cgcggtgccc ttgctgctgt gtgcgctgct ggcgcccggc 120

ggcgcgtacg tgctcgacga ctccgacggg ctgggccggg agttcgacgg catcggcgcg 180

gtcagcggcg gcggggcaac ctcccgactt ctagtaaatt acccagagcc ctatcgttct 240

cagatattgg attatctctt taagccgaat tttggtgcct ctttgcatat tttaaaagtg 300

gaaataggtg gtgatgggca gacaacagac ggcactgagc cctcccacat gcattatgca 360

ctagatgaga attatttccg aggatacgag tggtggttga tgaaagaagc taagaagagg 420

aatcccaata ttacactcat tgggttgcca tggtcattcc ctggatggct gggaaaaggt 480

ttcgactggc cttatgtcaa tcttcagctg actgcctatt atgtcgtgac ctggattgtg 540

ggcgccaagc gttaccatga tttggacatt gattatattg gaatttggaa tgagaggtca 600

tataatgcca attatattaa gatattaaga aaaatgctga attatcaagg tctccagcga 660

gtgaaaatca tagcaagtga taatctctgg gagtccatct ctgcatccat gctccttgat 720

gccgaactct tcaaggtggt tgatgttata ggggctcatt atcctggaac ccattcagca 780

aaagatgcaa agttgactgg gaagaagctt tggtcttctg aagactttag cactttaaat 840

agtgacatgg gtgcaggctg ctggggtcgc attttaaatc agaattatat caatggctat 900

atgacttcca caatcgcatg gaatttagtg gctagttact atgaacagtt gccttatggg 960

agatgcgggt tgatgacggc ccaggagcca tggagtgggc actacgtggt agaatctcct 1020

gtctgggtat cagctcatac cactcagttt actcaacctg gctggtatta cctgaagaca 1080

gttggccatt tagagaaagg aggaagctac gtagctctga ctgatggctt agggaacctc 1140

accatcatca ttgaaaccat gagtcataaa cattctaagt gcatacggcc atttcttcct 1200

tatttcaatg tgtcacaaca atttgccacc tttgttctta agggatcttt tagtgaaata 1260

ccagagctac aggtatggta taccaaactt ggaaaaacat ccgaaagatt tctttttaag 1320

cagctggatt ctctatggct ccttgacagc gatggcagtt tcacactgag cctgcatgaa 1380

gatgagctgt tcacactcac cactctcacc actggtcgca aaggcagcta cccgcttcct 1440

ccaaaatccc agcccttccc aagtacctat aaggatgatt tcaatgttga ttacccattt 1500

tttagtgaag ctccaaactt tgctgatcaa actggtgtat ttgaatattt tacaaatatt 1560

gaagaccctg gcgagcatca cttcacgcta cgccaagttc tcaaccagag acccattaca 1620

tgggctgccg atgcatccaa cacaatcagt attataggag actacaactg gaccaatctg 1680

actataaagt gtgatgtata catagagacc cctgacacag gaggtgtgtt cattgcagga 1740

agagtaaata aaggtggtat tttgattaga agtgccagag gaattttctt ctggattttt 1800

gcaaatggat cttacagggt tacaggtgat ttagctggat ggattatata tgctttagga 1860

cgtgttgaag ttacagcaaa aaaatggtat acactcacgt taactattaa gggtcatttc 1920

acctctggca tgctgaatga caagtctctg tggacagaca tccctgtgaa ttttccaaag 1980

aatggctggg ctgcaattgg aactcactcc tttgaatttg cacagtttga caactttctt 2040

gtggaagcca cacgctaa 2058

<210> 12

<211> 685

<212> PRT

<213> 人类

<220>

<223> GALC 多肽序列

<400> 12

Met Ala Glu Trp Leu Leu Ser Ala Ser Trp Gln Arg Arg Ala Lys Ala

1 5 10 15

Met Thr Ala Ala Ala Gly Ser Ala Gly Arg Ala Ala Val Pro Leu Leu

20 25 30

Leu Cys Ala Leu Leu Ala Pro Gly Gly Ala Tyr Val Leu Asp Asp Ser

35 40 45

Asp Gly Leu Gly Arg Glu Phe Asp Gly Ile Gly Ala Val Ser Gly Gly

50 55 60

Gly Ala Thr Ser Arg Leu Leu Val Asn Tyr Pro Glu Pro Tyr Arg Ser

65 70 75 80

Gln Ile Leu Asp Tyr Leu Phe Lys Pro Asn Phe Gly Ala Ser Leu His

85 90 95

Ile Leu Lys Val Glu Ile Gly Gly Asp Gly Gln Thr Thr Asp Gly Thr

100 105 110

Glu Pro Ser His Met His Tyr Ala Leu Asp Glu Asn Tyr Phe Arg Gly

115 120 125

Tyr Glu Trp Trp Leu Met Lys Glu Ala Lys Lys Arg Asn Pro Asn Ile

130 135 140

Thr Leu Ile Gly Leu Pro Trp Ser Phe Pro Gly Trp Leu Gly Lys Gly

145 150 155 160

Phe Asp Trp Pro Tyr Val Asn Leu Gln Leu Thr Ala Tyr Tyr Val Val

165 170 175

Thr Trp Ile Val Gly Ala Lys Arg Tyr His Asp Leu Asp Ile Asp Tyr

180 185 190

Ile Gly Ile Trp Asn Glu Arg Ser Tyr Asn Ala Asn Tyr Ile Lys Ile

195 200 205

Leu Arg Lys Met Leu Asn Tyr Gln Gly Leu Gln Arg Val Lys Ile Ile

210 215 220

Ala Ser Asp Asn Leu Trp Glu Ser Ile Ser Ala Ser Met Leu Leu Asp

225 230 235 240

Ala Glu Leu Phe Lys Val Val Asp Val Ile Gly Ala His Tyr Pro Gly

245 250 255

Thr His Ser Ala Lys Asp Ala Lys Leu Thr Gly Lys Lys Leu Trp Ser

260 265 270

Ser Glu Asp Phe Ser Thr Leu Asn Ser Asp Met Gly Ala Gly Cys Trp

275 280 285

Gly Arg Ile Leu Asn Gln Asn Tyr Ile Asn Gly Tyr Met Thr Ser Thr

290 295 300

Ile Ala Trp Asn Leu Val Ala Ser Tyr Tyr Glu Gln Leu Pro Tyr Gly

305 310 315 320

Arg Cys Gly Leu Met Thr Ala Gln Glu Pro Trp Ser Gly His Tyr Val

325 330 335

Val Glu Ser Pro Val Trp Val Ser Ala His Thr Thr Gln Phe Thr Gln

340 345 350

Pro Gly Trp Tyr Tyr Leu Lys Thr Val Gly His Leu Glu Lys Gly Gly

355 360 365

Ser Tyr Val Ala Leu Thr Asp Gly Leu Gly Asn Leu Thr Ile Ile Ile

370 375 380

Glu Thr Met Ser His Lys His Ser Lys Cys Ile Arg Pro Phe Leu Pro

385 390 395 400

Tyr Phe Asn Val Ser Gln Gln Phe Ala Thr Phe Val Leu Lys Gly Ser

405 410 415

Phe Ser Glu Ile Pro Glu Leu Gln Val Trp Tyr Thr Lys Leu Gly Lys

420 425 430

Thr Ser Glu Arg Phe Leu Phe Lys Gln Leu Asp Ser Leu Trp Leu Leu

435 440 445

Asp Ser Asp Gly Ser Phe Thr Leu Ser Leu His Glu Asp Glu Leu Phe

450 455 460

Thr Leu Thr Thr Leu Thr Thr Gly Arg Lys Gly Ser Tyr Pro Leu Pro

465 470 475 480

Pro Lys Ser Gln Pro Phe Pro Ser Thr Tyr Lys Asp Asp Phe Asn Val

485 490 495

Asp Tyr Pro Phe Phe Ser Glu Ala Pro Asn Phe Ala Asp Gln Thr Gly

500 505 510

Val Phe Glu Tyr Phe Thr Asn Ile Glu Asp Pro Gly Glu His His Phe

515 520 525

Thr Leu Arg Gln Val Leu Asn Gln Arg Pro Ile Thr Trp Ala Ala Asp

530 535 540

Ala Ser Asn Thr Ile Ser Ile Ile Gly Asp Tyr Asn Trp Thr Asn Leu

545 550 555 560

Thr Ile Lys Cys Asp Val Tyr Ile Glu Thr Pro Asp Thr Gly Gly Val

565 570 575

Phe Ile Ala Gly Arg Val Asn Lys Gly Gly Ile Leu Ile Arg Ser Ala

580 585 590

Arg Gly Ile Phe Phe Trp Ile Phe Ala Asn Gly Ser Tyr Arg Val Thr

595 600 605

Gly Asp Leu Ala Gly Trp Ile Ile Tyr Ala Leu Gly Arg Val Glu Val

610 615 620

Thr Ala Lys Lys Trp Tyr Thr Leu Thr Leu Thr Ile Lys Gly His Phe

625 630 635 640

Thr Ser Gly Met Leu Asn Asp Lys Ser Leu Trp Thr Asp Ile Pro Val

645 650 655

Asn Phe Pro Lys Asn Gly Trp Ala Ala Ile Gly Thr His Ser Phe Glu

660 665 670

Phe Ala Gln Phe Asp Asn Phe Leu Val Glu Ala Thr Arg

675 680 685

<210> 13

<211> 1530

<212> DNA

<213> 人类

<220>

<223> ARSA多核苷酸序列

<400> 13

atgtccatgg gggcaccgcg gtccctcctc ctggccctgg ctgctggcct ggccgttgcc 60

cgtccgccca acatcgtgct gatctttgcc gacgacctcg gctatgggga cctgggctgc 120

tatgggcacc ccagctctac cactcccaac ctggaccagc tggcggcggg agggctgcgg 180

ttcacagact tctacgtgcc tgtgtctctg tgcacaccct ctagggccgc cctcctgacc 240

ggccggctcc cggttcggat gggcatgtac cctggcgtcc tggtgcccag ctcccggggg 300

ggcctgcccc tggaggaggt gaccgtggcc gaagtcctgg ctgcccgagg ctacctcaca 360

ggaatggccg gcaagtggca ccttggggtg gggcctgagg gggccttcct gcccccccat 420

cagggcttcc atcgatttct aggcatcccg tactcccacg accagggccc ctgccagaac 480

ctgacctgct tcccgccggc cactccttgc gacggtggct gtgaccaggg cctggtcccc 540

atcccactgt tggccaacct gtccgtggag gcgcagcccc cctggctgcc cggactagag 600

gcccgctaca tggctttcgc ccatgacctc atggccgacg cccagcgcca ggatcgcccc 660

ttcttcctgt actatgcctc tcaccacacc cactaccctc agttcagtgg gcagagcttt 720

gcagagcgtt caggccgcgg gccatttggg gactccctga tggagctgga tgcagctgtg 780

gggaccctga tgacagccat aggggacctg gggctgcttg aagagacgct ggtcatcttc 840

actgcagaca atggacctga gaccatgcgt atgtcccgag gcggctgctc cggtctcttg 900

cggtgtggaa agggaacgac ctacgagggc ggtgtccgag agcctgcctt ggccttctgg 960

ccaggtcata tcgctcccgg cgtgacccac gagctggcca gctccctgga cctgctgcct 1020

accctggcag ccctggctgg ggccccactg cccaatgtca ccttggatgg ctttgacctc 1080

agccccctgc tgctgggcac aggcaagagc cctcggcagt ctctcttctt ctacccgtcc 1140

tacccagacg aggtccgtgg ggtttttgct gtgcggactg gaaagtacaa ggctcacttc 1200

ttcacccagg gctctgccca cagtgatacc actgcagacc ctgcctgcca cgcctccagc 1260

tctctgactg ctcatgagcc cccgctgctc tatgacctgt ccaaggaccc tggtgagaac 1320

tacaacctgc tggggggtgt ggccggggcc accccagagg tgctgcaagc cctgaaacag 1380

cttcagctgc tcaaggccca gttagacgca gctgtgacct tcggccccag ccaggtggcc 1440

cggggcgagg accccgccct gcagatctgc tgtcatcctg gctgcacccc ccgcccagct 1500

tgctgccatt gcccagatcc ccatgcctga 1530

<210> 14

<211> 509

<212> PRT

<213> 人类

<220>

<223> ARSA 多肽序列

<400> 14

Met Ser Met Gly Ala Pro Arg Ser Leu Leu Leu Ala Leu Ala Ala Gly

1 5 10 15

Leu Ala Val Ala Arg Pro Pro Asn Ile Val Leu Ile Phe Ala Asp Asp

20 25 30

Leu Gly Tyr Gly Asp Leu Gly Cys Tyr Gly His Pro Ser Ser Thr Thr

35 40 45

Pro Asn Leu Asp Gln Leu Ala Ala Gly Gly Leu Arg Phe Thr Asp Phe

50 55 60

Tyr Val Pro Val Ser Leu Cys Thr Pro Ser Arg Ala Ala Leu Leu Thr

65 70 75 80

Gly Arg Leu Pro Val Arg Met Gly Met Tyr Pro Gly Val Leu Val Pro

85 90 95

Ser Ser Arg Gly Gly Leu Pro Leu Glu Glu Val Thr Val Ala Glu Val

100 105 110

Leu Ala Ala Arg Gly Tyr Leu Thr Gly Met Ala Gly Lys Trp His Leu

115 120 125

Gly Val Gly Pro Glu Gly Ala Phe Leu Pro Pro His Gln Gly Phe His

130 135 140

Arg Phe Leu Gly Ile Pro Tyr Ser His Asp Gln Gly Pro Cys Gln Asn

145 150 155 160

Leu Thr Cys Phe Pro Pro Ala Thr Pro Cys Asp Gly Gly Cys Asp Gln

165 170 175

Gly Leu Val Pro Ile Pro Leu Leu Ala Asn Leu Ser Val Glu Ala Gln

180 185 190

Pro Pro Trp Leu Pro Gly Leu Glu Ala Arg Tyr Met Ala Phe Ala His

195 200 205

Asp Leu Met Ala Asp Ala Gln Arg Gln Asp Arg Pro Phe Phe Leu Tyr

210 215 220

Tyr Ala Ser His His Thr His Tyr Pro Gln Phe Ser Gly Gln Ser Phe

225 230 235 240

Ala Glu Arg Ser Gly Arg Gly Pro Phe Gly Asp Ser Leu Met Glu Leu

245 250 255

Asp Ala Ala Val Gly Thr Leu Met Thr Ala Ile Gly Asp Leu Gly Leu

260 265 270

Leu Glu Glu Thr Leu Val Ile Phe Thr Ala Asp Asn Gly Pro Glu Thr

275 280 285

Met Arg Met Ser Arg Gly Gly Cys Ser Gly Leu Leu Arg Cys Gly Lys

290 295 300

Gly Thr Thr Tyr Glu Gly Gly Val Arg Glu Pro Ala Leu Ala Phe Trp

305 310 315 320

Pro Gly His Ile Ala Pro Gly Val Thr His Glu Leu Ala Ser Ser Leu

325 330 335

Asp Leu Leu Pro Thr Leu Ala Ala Leu Ala Gly Ala Pro Leu Pro Asn

340 345 350

Val Thr Leu Asp Gly Phe Asp Leu Ser Pro Leu Leu Leu Gly Thr Gly

355 360 365

Lys Ser Pro Arg Gln Ser Leu Phe Phe Tyr Pro Ser Tyr Pro Asp Glu

370 375 380

Val Arg Gly Val Phe Ala Val Arg Thr Gly Lys Tyr Lys Ala His Phe

385 390 395 400

Phe Thr Gln Gly Ser Ala His Ser Asp Thr Thr Ala Asp Pro Ala Cys

405 410 415

His Ala Ser Ser Ser Leu Thr Ala His Glu Pro Pro Leu Leu Tyr Asp

420 425 430

Leu Ser Lys Asp Pro Gly Glu Asn Tyr Asn Leu Leu Gly Gly Val Ala

435 440 445

Gly Ala Thr Pro Glu Val Leu Gln Ala Leu Lys Gln Leu Gln Leu Leu

450 455 460

Lys Ala Gln Leu Asp Ala Ala Val Thr Phe Gly Pro Ser Gln Val Ala

465 470 475 480

Arg Gly Glu Asp Pro Ala Leu Gln Ile Cys Cys His Pro Gly Cys Thr

485 490 495

Pro Arg Pro Ala Cys Cys His Cys Pro Asp Pro His Ala

500 505

<210> 15

<211> 1584

<212> DNA

<213> 人类

<220>

<223> PSAP多核苷酸序列

<400> 15

atgtacgccc tcttcctcct ggccagcctc ctgggcgcgg ctctagccgg cccggtcctt 60

ggactgaaag aatgcaccag gggctcggca gtgtggtgcc agaatgtgaa gacggcgtcc 120

gactgcgggg cagtgaagca ctgcctgcag accgtttgga acaagccaac agtgaaatcc 180

cttccctgcg acatatgcaa agacgttgtc accgcagctg gtgatatgct gaaggacaat 240

gccactgagg aggagatcct tgtttacttg gagaagacct gtgactggct tccgaaaccg 300

aacatgtctg cttcatgcaa ggagatagtg gactcctacc tccctgtcat cctggacatc 360

attaaaggag aaatgagccg tcctggggag gtgtgctctg ctctcaacct ctgcgagtct 420

ctccagaagc acctagcaga gctgaatcac cagaagcagc tggagtccaa taagatccca 480

gagctggaca tgactgaggt ggtggccccc ttcatggcca acatccctct cctcctctac 540

cctcaggacg gcccccgcag caagccccag ccaaaggata atggggacgt ttgccaggac 600

tgcattcaga tggtgactga catccagact gctgtacgga ccaactccac ctttgtccag 660

gccttggtgg aacatgtcaa ggaggagtgt gaccgcctgg gccctggcat ggccgacata 720

tgcaagaact atatcagcca gtattctgaa attgctatcc agatgatgat gcacatgcag 780

gatcagcaac ccaaggagat ctgtgcgctg gttgggttct gtgatgaggt gaaagagatg 840

cccatgcaga ctctggtccc cgccaaagtg gcctccaaga atgtcatccc tgccctggaa 900

ctggtggagc ccattaagaa gcacgaggtc ccagcaaagt ctgatgttta ctgtgaggtg 960

tgtgaattcc tggtgaagga ggtgaccaag ctgattgaca acaacaagac tgagaaagaa 1020

atactcgacg cttttgacaa aatgtgctcg aagctgccga agtccctgtc ggaagagtgc 1080

caggaggtgg tggacacgta cggcagctcc atcctgtcca tcctgctgga ggaggtcagc 1140

cctgagctgg tgtgcagcat gctgcacctc tgctctggca cgcggctgcc tgcactgacc 1200

gttcacgtga ctcagccaaa ggacggtggc ttctgcgaag tgtgcaagaa gctggtgggt 1260

tatttggatc gcaacctgga gaaaaacagc accaagcagg agatcctggc tgctcttgag 1320

aaaggctgca gcttcctgcc agacccttac cagaagcagt gtgatcagtt tgtggcagag 1380

tacgagcccg tgctgatcga gatcctggtg gaggtgatgg atccttcctt cgtgtgcttg 1440

aaaattggag cctgcccctc ggcccataag cccttgttgg gaactgagaa gtgtatatgg 1500

ggcccaagct actggtgcca gaacacagag acagcagccc agtgcaatgc tgtcgagcat 1560

tgcaaacgcc atgtgtggaa ctag 1584

<210> 16

<211> 527

<212> PRT

<213> 人类

<220>

<223> PSAP多肽序列

<400> 16

Met Tyr Ala Leu Phe Leu Leu Ala Ser Leu Leu Gly Ala Ala Leu Ala

1 5 10 15

Gly Pro Val Leu Gly Leu Lys Glu Cys Thr Arg Gly Ser Ala Val Trp

20 25 30

Cys Gln Asn Val Lys Thr Ala Ser Asp Cys Gly Ala Val Lys His Cys

35 40 45

Leu Gln Thr Val Trp Asn Lys Pro Thr Val Lys Ser Leu Pro Cys Asp

50 55 60

Ile Cys Lys Asp Val Val Thr Ala Ala Gly Asp Met Leu Lys Asp Asn

65 70 75 80

Ala Thr Glu Glu Glu Ile Leu Val Tyr Leu Glu Lys Thr Cys Asp Trp

85 90 95

Leu Pro Lys Pro Asn Met Ser Ala Ser Cys Lys Glu Ile Val Asp Ser

100 105 110

Tyr Leu Pro Val Ile Leu Asp Ile Ile Lys Gly Glu Met Ser Arg Pro

115 120 125

Gly Glu Val Cys Ser Ala Leu Asn Leu Cys Glu Ser Leu Gln Lys His

130 135 140

Leu Ala Glu Leu Asn His Gln Lys Gln Leu Glu Ser Asn Lys Ile Pro

145 150 155 160

Glu Leu Asp Met Thr Glu Val Val Ala Pro Phe Met Ala Asn Ile Pro

165 170 175

Leu Leu Leu Tyr Pro Gln Asp Gly Pro Arg Ser Lys Pro Gln Pro Lys

180 185 190

Asp Asn Gly Asp Val Cys Gln Asp Cys Ile Gln Met Val Thr Asp Ile

195 200 205

Gln Thr Ala Val Arg Thr Asn Ser Thr Phe Val Gln Ala Leu Val Glu

210 215 220

His Val Lys Glu Glu Cys Asp Arg Leu Gly Pro Gly Met Ala Asp Ile

225 230 235 240

Cys Lys Asn Tyr Ile Ser Gln Tyr Ser Glu Ile Ala Ile Gln Met Met

245 250 255

Met His Met Gln Asp Gln Gln Pro Lys Glu Ile Cys Ala Leu Val Gly

260 265 270

Phe Cys Asp Glu Val Lys Glu Met Pro Met Gln Thr Leu Val Pro Ala

275 280 285

Lys Val Ala Ser Lys Asn Val Ile Pro Ala Leu Glu Leu Val Glu Pro

290 295 300

Ile Lys Lys His Glu Val Pro Ala Lys Ser Asp Val Tyr Cys Glu Val

305 310 315 320

Cys Glu Phe Leu Val Lys Glu Val Thr Lys Leu Ile Asp Asn Asn Lys

325 330 335

Thr Glu Lys Glu Ile Leu Asp Ala Phe Asp Lys Met Cys Ser Lys Leu

340 345 350

Pro Lys Ser Leu Ser Glu Glu Cys Gln Glu Val Val Asp Thr Tyr Gly

355 360 365

Ser Ser Ile Leu Ser Ile Leu Leu Glu Glu Val Ser Pro Glu Leu Val

370 375 380

Cys Ser Met Leu His Leu Cys Ser Gly Thr Arg Leu Pro Ala Leu Thr

385 390 395 400

Val His Val Thr Gln Pro Lys Asp Gly Gly Phe Cys Glu Val Cys Lys

405 410 415

Lys Leu Val Gly Tyr Leu Asp Arg Asn Leu Glu Lys Asn Ser Thr Lys

420 425 430

Gln Glu Ile Leu Ala Ala Leu Glu Lys Gly Cys Ser Phe Leu Pro Asp

435 440 445

Pro Tyr Gln Lys Gln Cys Asp Gln Phe Val Ala Glu Tyr Glu Pro Val

450 455 460

Leu Ile Glu Ile Leu Val Glu Val Met Asp Pro Ser Phe Val Cys Leu

465 470 475 480

Lys Ile Gly Ala Cys Pro Ser Ala His Lys Pro Leu Leu Gly Thr Glu

485 490 495

Lys Cys Ile Trp Gly Pro Ser Tyr Trp Cys Gln Asn Thr Glu Thr Ala

500 505 510

Ala Gln Cys Asn Ala Val Glu His Cys Lys Arg His Val Trp Asn

515 520 525

<210> 17

<211> 1611

<212> DNA

<213> 人类

<220>

<223> GBA多核苷酸序列

<400> 17

atggagtttt caagtccttc cagagaggaa tgtcccaagc ctttgagtag ggtaagcatc 60

atggctggca gcctcacagg attgcttcta cttcaggcag tgtcgtgggc atcaggtgcc 120

cgcccctgca tccctaaaag cttcggctac agctcggtgg tgtgtgtctg caatgccaca 180

tactgtgact cctttgaccc cccgaccttt cctgcccttg gtaccttcag ccgctatgag 240

agtacacgca gtgggcgacg gatggagctg agtatggggc ccatccaggc taatcacacg 300

ggcacaggcc tgctactgac cctgcagcca gaacagaagt tccagaaagt gaagggattt 360

ggaggggcca tgacagatgc tgctgctctc aacatccttg ccctgtcacc ccctgcccaa 420

aatttgctac ttaaatcgta cttctctgaa gaaggaatcg gatataacat catccgggta 480

cccatggcca gctgtgactt ctccatccgc acctacacct atgcagacac ccctgatgat 540

ttccagttgc acaacttcag cctcccagag gaagatacca agctcaagat acccctgatt 600

caccgagccc tgcagttggc ccagcgtccc gtttcactcc ttgccagccc ctggacatca 660

cccacttggc tcaagaccaa tggagcggtg aatgggaagg ggtcactcaa gggacagccc 720

ggagacatct accaccagac ctgggccaga tactttgtga agttcctgga tgcctatgct 780

gagcacaagt tacagttctg ggcagtgaca gctgaaaatg agccttctgc tgggctgttg 840

agtggatacc ccttccagtg cctgggcttc acccctgaac atcagcgaga cttcattgcc 900

cgtgacctag gtcctaccct cgccaacagt actcaccaca atgtccgcct actcatgctg 960

gatgaccaac gcttgctgct gccccactgg gcaaaggtgg tactgacaga cccagaagca 1020

gctaaatatg ttcatggcat tgctgtacat tggtacctgg actttctggc tccagccaaa 1080

gccaccctag gggagacaca ccgcctgttc cccaacacca tgctctttgc ctcagaggcc 1140

tgtgtgggct ccaagttctg ggagcagagt gtgcggctag gctcctggga tcgagggatg 1200

cagtacagcc acagcatcat cacgaacctc ctgtaccatg tggtcggctg gaccgactgg 1260

aaccttgccc tgaaccccga aggaggaccc aattgggtgc gtaactttgt cgacagtccc 1320

atcattgtag acatcaccaa ggacacgttt tacaaacagc ccatgttcta ccaccttggc 1380

cacttcagca agttcattcc tgagggctcc cagagagtgg ggctggttgc cagtcagaag 1440

aacgacctgg acgcagtggc actgatgcat cccgatggct ctgctgttgt ggtcgtgcta 1500

aaccgctcct ctaaggatgt gcctcttacc atcaaggatc ctgctgtggg cttcctggag 1560

acaatctcac ctggctactc cattcacacc tacctgtggc gtcgccagtg a 1611

<210> 18

<211> 536

<212> PRT

<213> 人类

<220>

<223> GBA多肽序列

<400> 18

Met Glu Phe Ser Ser Pro Ser Arg Glu Glu Cys Pro Lys Pro Leu Ser

1 5 10 15

Arg Val Ser Ile Met Ala Gly Ser Leu Thr Gly Leu Leu Leu Leu Gln

20 25 30

Ala Val Ser Trp Ala Ser Gly Ala Arg Pro Cys Ile Pro Lys Ser Phe

35 40 45

Gly Tyr Ser Ser Val Val Cys Val Cys Asn Ala Thr Tyr Cys Asp Ser

50 55 60

Phe Asp Pro Pro Thr Phe Pro Ala Leu Gly Thr Phe Ser Arg Tyr Glu

65 70 75 80

Ser Thr Arg Ser Gly Arg Arg Met Glu Leu Ser Met Gly Pro Ile Gln

85 90 95

Ala Asn His Thr Gly Thr Gly Leu Leu Leu Thr Leu Gln Pro Glu Gln

100 105 110

Lys Phe Gln Lys Val Lys Gly Phe Gly Gly Ala Met Thr Asp Ala Ala

115 120 125

Ala Leu Asn Ile Leu Ala Leu Ser Pro Pro Ala Gln Asn Leu Leu Leu

130 135 140

Lys Ser Tyr Phe Ser Glu Glu Gly Ile Gly Tyr Asn Ile Ile Arg Val

145 150 155 160

Pro Met Ala Ser Cys Asp Phe Ser Ile Arg Thr Tyr Thr Tyr Ala Asp

165 170 175

Thr Pro Asp Asp Phe Gln Leu His Asn Phe Ser Leu Pro Glu Glu Asp

180 185 190

Thr Lys Leu Lys Ile Pro Leu Ile His Arg Ala Leu Gln Leu Ala Gln

195 200 205

Arg Pro Val Ser Leu Leu Ala Ser Pro Trp Thr Ser Pro Thr Trp Leu

210 215 220

Lys Thr Asn Gly Ala Val Asn Gly Lys Gly Ser Leu Lys Gly Gln Pro

225 230 235 240

Gly Asp Ile Tyr His Gln Thr Trp Ala Arg Tyr Phe Val Lys Phe Leu

245 250 255

Asp Ala Tyr Ala Glu His Lys Leu Gln Phe Trp Ala Val Thr Ala Glu

260 265 270

Asn Glu Pro Ser Ala Gly Leu Leu Ser Gly Tyr Pro Phe Gln Cys Leu

275 280 285

Gly Phe Thr Pro Glu His Gln Arg Asp Phe Ile Ala Arg Asp Leu Gly

290 295 300

Pro Thr Leu Ala Asn Ser Thr His His Asn Val Arg Leu Leu Met Leu

305 310 315 320

Asp Asp Gln Arg Leu Leu Leu Pro His Trp Ala Lys Val Val Leu Thr

325 330 335

Asp Pro Glu Ala Ala Lys Tyr Val His Gly Ile Ala Val His Trp Tyr

340 345 350

Leu Asp Phe Leu Ala Pro Ala Lys Ala Thr Leu Gly Glu Thr His Arg

355 360 365

Leu Phe Pro Asn Thr Met Leu Phe Ala Ser Glu Ala Cys Val Gly Ser

370 375 380

Lys Phe Trp Glu Gln Ser Val Arg Leu Gly Ser Trp Asp Arg Gly Met

385 390 395 400

Gln Tyr Ser His Ser Ile Ile Thr Asn Leu Leu Tyr His Val Val Gly

405 410 415

Trp Thr Asp Trp Asn Leu Ala Leu Asn Pro Glu Gly Gly Pro Asn Trp

420 425 430

Val Arg Asn Phe Val Asp Ser Pro Ile Ile Val Asp Ile Thr Lys Asp

435 440 445

Thr Phe Tyr Lys Gln Pro Met Phe Tyr His Leu Gly His Phe Ser Lys

450 455 460

Phe Ile Pro Glu Gly Ser Gln Arg Val Gly Leu Val Ala Ser Gln Lys

465 470 475 480

Asn Asp Leu Asp Ala Val Ala Leu Met His Pro Asp Gly Ser Ala Val

485 490 495

Val Val Val Leu Asn Arg Ser Ser Lys Asp Val Pro Leu Thr Ile Lys

500 505 510

Asp Pro Ala Val Gly Phe Leu Glu Thr Ile Ser Pro Gly Tyr Ser Ile

515 520 525

His Thr Tyr Leu Trp Arg Arg Gln

530 535

<210> 19

<211> 1401

<212> DNA

<213> 人类

<220>

<223> FUCA1多核苷酸序列

<400> 19

atgcgggctc cggggatgag gtcgcggccg gcgggtcccg cgctgttgct gctgctgctc 60

ttcctcggag cggccgagtc ggtgcgtcgg gcccagcctc cgcgccgcta caccccagac 120

tggccgagcc tggattctcg gccgctgccg gcctggttcg acgaagccaa gttcggggtg 180

ttcatccact ggggcgtgtt ctcggtgccc gcctggggca gcgagtggtt ctggtggcac 240

tggcagggcg aggggcggcc gcagtaccag cgcttcatgc gcgacaacta cccgcccggc 300

ttcagctacg ccgacttcgg accgcagttc actgcgcgct tcttccaccc ggaggagtgg 360

gccgacctct tccaggccgc gggcgccaag tatgtagttt tgacgacaaa gcatcacgaa 420

ggcttcacaa actggccgag tcctgtgtct tggaactgga actccaaaga cgtggggcct 480

catcgggatt tggttggtga attgggaaca gctctccgga agaggaacat ccgctatgga 540

ctataccact cactcttaga gtggttccat ccactctatc tacttgataa gaaaaatggc 600

ttcaaaacac agcattttgt cagtgcaaaa acaatgccag agctgtacga ccttgttaac 660

agctataaac ctgatctgat ctggtctgat ggggagtggg aatgtcctga tacttactgg 720

aactccacaa attttctttc atggctctac aatgacagcc ctgtcaagga tgaggtggta 780

gtaaatgacc gatggggtca gaactgttcc tgtcaccatg gaggatacta taactgtgaa 840

gataaattca agccacagag cttgccagat cacaagtggg agatgtgcac cagcattgac 900

aagttttcct ggggctatcg tcgtgacatg gcattgtctg atgttacaga agaatctgaa 960

atcatttcgg aactggttca gacagtaagt ttgggaggca actatcttct gaacattgga 1020

ccaactaaag atggactgat tgttcccatc ttccaagaaa ggcttcttgc tgttgggaaa 1080

tggctgagca tcaatgggga ggctatctat gcctccaaac catggcgggt gcaatgggaa 1140

aagaacacaa catctgtatg gtatacctca aagggatcgg ctgtttatgc catttttctg 1200

cactggccag aaaatggagt cttaaacctt gaatccccca taactacctc aactacaaag 1260

ataacaatgc tgggaattca aggagatctg aagtggtcca cagatccaga taaaggtctc 1320

ttcatctctc taccccagtt gccaccctct gctgtccccg cagagtttgc ttggactata 1380

aagctgacag gagtgaagta a 1401

<210> 20

<211> 466

<212> PRT

<213> 人类

<220>

<223> FUCA1多肽序列

<400> 20

Met Arg Ala Pro Gly Met Arg Ser Arg Pro Ala Gly Pro Ala Leu Leu

1 5 10 15

Leu Leu Leu Leu Phe Leu Gly Ala Ala Glu Ser Val Arg Arg Ala Gln

20 25 30

Pro Pro Arg Arg Tyr Thr Pro Asp Trp Pro Ser Leu Asp Ser Arg Pro

35 40 45

Leu Pro Ala Trp Phe Asp Glu Ala Lys Phe Gly Val Phe Ile His Trp

50 55 60

Gly Val Phe Ser Val Pro Ala Trp Gly Ser Glu Trp Phe Trp Trp His

65 70 75 80

Trp Gln Gly Glu Gly Arg Pro Gln Tyr Gln Arg Phe Met Arg Asp Asn

85 90 95

Tyr Pro Pro Gly Phe Ser Tyr Ala Asp Phe Gly Pro Gln Phe Thr Ala

100 105 110

Arg Phe Phe His Pro Glu Glu Trp Ala Asp Leu Phe Gln Ala Ala Gly

115 120 125

Ala Lys Tyr Val Val Leu Thr Thr Lys His His Glu Gly Phe Thr Asn

130 135 140

Trp Pro Ser Pro Val Ser Trp Asn Trp Asn Ser Lys Asp Val Gly Pro

145 150 155 160

His Arg Asp Leu Val Gly Glu Leu Gly Thr Ala Leu Arg Lys Arg Asn

165 170 175

Ile Arg Tyr Gly Leu Tyr His Ser Leu Leu Glu Trp Phe His Pro Leu

180 185 190

Tyr Leu Leu Asp Lys Lys Asn Gly Phe Lys Thr Gln His Phe Val Ser

195 200 205

Ala Lys Thr Met Pro Glu Leu Tyr Asp Leu Val Asn Ser Tyr Lys Pro

210 215 220

Asp Leu Ile Trp Ser Asp Gly Glu Trp Glu Cys Pro Asp Thr Tyr Trp

225 230 235 240

Asn Ser Thr Asn Phe Leu Ser Trp Leu Tyr Asn Asp Ser Pro Val Lys

245 250 255

Asp Glu Val Val Val Asn Asp Arg Trp Gly Gln Asn Cys Ser Cys His

260 265 270

His Gly Gly Tyr Tyr Asn Cys Glu Asp Lys Phe Lys Pro Gln Ser Leu

275 280 285

Pro Asp His Lys Trp Glu Met Cys Thr Ser Ile Asp Lys Phe Ser Trp

290 295 300

Gly Tyr Arg Arg Asp Met Ala Leu Ser Asp Val Thr Glu Glu Ser Glu

305 310 315 320

Ile Ile Ser Glu Leu Val Gln Thr Val Ser Leu Gly Gly Asn Tyr Leu

325 330 335

Leu Asn Ile Gly Pro Thr Lys Asp Gly Leu Ile Val Pro Ile Phe Gln

340 345 350

Glu Arg Leu Leu Ala Val Gly Lys Trp Leu Ser Ile Asn Gly Glu Ala

355 360 365

Ile Tyr Ala Ser Lys Pro Trp Arg Val Gln Trp Glu Lys Asn Thr Thr

370 375 380

Ser Val Trp Tyr Thr Ser Lys Gly Ser Ala Val Tyr Ala Ile Phe Leu

385 390 395 400

His Trp Pro Glu Asn Gly Val Leu Asn Leu Glu Ser Pro Ile Thr Thr

405 410 415

Ser Thr Thr Lys Ile Thr Met Leu Gly Ile Gln Gly Asp Leu Lys Trp

420 425 430

Ser Thr Asp Pro Asp Lys Gly Leu Phe Ile Ser Leu Pro Gln Leu Pro

435 440 445

Pro Ser Ala Val Pro Ala Glu Phe Ala Trp Thr Ile Lys Leu Thr Gly

450 455 460

Val Lys

465

<210> 21

<211> 3036

<212> DNA

<213> 人类

<220>

<223> MAN2B1多核苷酸序列

<400> 21

atgggcgcct acgcgcgggc ttcgggggtc tgcgctcgcg gctgcctgga ctcagcaggc 60

ccctggacca tgtcccgcgc cctgcggcca ccgctcccgc ctctctgctt tttccttttg 120

ttgctggcgg ctgccggtgc tcgggccggg ggatacgaga catgccccac agtgcagccg 180

aacatgctga acgtgcacct gctgcctcac acacatgatg acgtgggctg gctcaaaacc 240

gtggaccagt acttttatgg aatcaagaat gacatccagc acgccggtgt gcagtacatc 300

ctggactcgg tcatctctgc cttgctggca gatcccaccc gtcgcttcat ttacgtggag 360

attgccttct tctcccgttg gtggcaccag cagacaaatg ccacacagga agtcgtgcga 420

gaccttgtgc gccaggggcg cctggagttc gccaatggtg gctgggtgat gaacgatgag 480

gcagccaccc actacggtgc catcgtggac cagatgacac ttgggctgcg ctttctggag 540

gacacatttg gcaatgatgg gcgaccccgt gtggcctggc acattgaccc cttcggccac 600

tctcgggagc aggcctcgct gtttgcgcag atgggcttcg acggcttctt ctttgggcgc 660

cttgattatc aagataagtg ggtacggatg cagaagctgg agatggagca ggtgtggcgg 720

gccagcacca gcctgaagcc cccgaccgcg gacctcttca ctggtgtgct tcccaatggt 780

tacaacccgc caaggaatct gtgctgggat gtgctgtgtg tcgatcagcc gctggtggag 840

gaccctcgca gccccgagta caacgccaag gagctggtcg attacttcct aaatgtggcc 900

actgcccagg gccggtatta ccgcaccaac cacactgtga tgaccatggg ctcggacttc 960

caatatgaga atgccaacat gtggttcaag aaccttgaca agctcatccg gctggtaaat 1020

gcgcagcagg caaaaggaag cagtgtccat gttctctact ccacccccgc ttgttacctc 1080

tgggagctga acaaggccaa cctcacctgg tcagtgaaac atgacgactt cttcccttac 1140

gcggatggcc cccaccagtt ctggaccggt tacttttcca gtcggccggc cctcaaacgc 1200

tacgagcgcc tcagctacaa cttcctgcag gtgtgcaacc agctggaggc gctggtgggc 1260

ctggcggcca acgtgggacc ctatggctcc ggagacagtg cacccctcaa tgaggcgatg 1320

gctgtgctcc agcatcacga cgccgtcagc ggcacctccc gccagcacgt ggccaacgac 1380

tacgcgcgcc agcttgcggc aggctggggg ccttgcgagg ttcttctgag caacgcgctg 1440

gcgcggctca gaggcttcaa agatcacttc accttttgcc aacagctaaa catcagcatc 1500

tgcccgctca gccagacggc ggcgcgcttc caggtcatcg tttataatcc cctggggcgg 1560

aaggtgaatt ggatggtacg gctgccggtc agcgaaggcg ttttcgttgt gaaggacccc 1620

aatggcagga cagtgcccag cgatgtggta atatttccca gctcagacag ccaggcgcac 1680

cctccggagc tgctgttctc agcctcactg cccgccctgg gcttcagcac ctattcagta 1740

gcccaggtgc ctcgctggaa gccccaggcc cgcgcaccac agcccatccc cagaagatcc 1800

tggtcccctg ctttaaccat cgaaaatgag cacatccggg caacgtttga tcctgacaca 1860

gggctgttga tggagattat gaacatgaat cagcaactcc tgctgcctgt tcgccagacc 1920

ttcttctggt acaacgccag tataggtgac aacgaaagtg accaggcctc aggtgcctac 1980

atcttcagac ccaaccaaca gaaaccgctg cctgtgagcc gctgggctca gatccacctg 2040

gtgaagacac ccttggtgca ggaggtgcac cagaacttct cagcttggtg ttcccaggtg 2100

gttcgcctgt acccaggaca gcggcacctg gagctagagt ggtcggtggg gccgatacct 2160

gtgggcgaca cctgggggaa ggaggtcatc agccgttttg acacaccgct ggagacaaag 2220

ggacgcttct acacagacag caatggccgg gagatcctgg agaggaggcg ggattatcga 2280

cccacctgga aactgaacca gacggagccc gtggcaggaa actactatcc agtcaacacc 2340

cggatttaca tcacggatgg aaacatgcag ctgactgtgc tgactgaccg ctcccagggg 2400

ggcagcagcc tgagagatgg ctcgctggag ctcatggtgc accgaaggct gctgaaggac 2460

gatggacgcg gagtatcgga gccactaatg gagaacgggt cgggggcgtg ggtgcgaggg 2520

cgccacctgg tgctgctgga cacagcccag gctgcagccg ccggacaccg gctcctggcg 2580

gagcaggagg tcctggcccc tcaggtggtg ctggccccgg gtggcggcgc cgcctacaat 2640

ctcggggctc ctccgcgcac gcagttctca gggctgcgca gggacctgcc gccctcggtg 2700

cacctgctca cgctggccag ctggggcccc gaaatggtgc tgctgcgctt ggagcaccag 2760

tttgccgtag gagaggattc cggacgtaac ctgagcgccc ccgttacctt gaacttgagg 2820

gacctgttct ccaccttcac catcacccgc ctgcaggaga ccacgctggt ggccaaccag 2880

ctccgcgagg cagcctccag gctcaagtgg acaacaaaca caggccccac accccaccaa 2940

actccgtacc agctggaccc ggccaacatc acgctggaac ccatggaaat ccgcactttc 3000

ctggcctcag ttcaatggaa ggaggtggat ggttag 3036

<210> 22

<211> 1011

<212> PRT

<213> 人类

<220>

<223> MAN2B1多肽序列

<400> 22

Met Gly Ala Tyr Ala Arg Ala Ser Gly Val Cys Ala Arg Gly Cys Leu

1 5 10 15

Asp Ser Ala Gly Pro Trp Thr Met Ser Arg Ala Leu Arg Pro Pro Leu

20 25 30

Pro Pro Leu Cys Phe Phe Leu Leu Leu Leu Ala Ala Ala Gly Ala Arg

35 40 45

Ala Gly Gly Tyr Glu Thr Cys Pro Thr Val Gln Pro Asn Met Leu Asn

50 55 60

Val His Leu Leu Pro His Thr His Asp Asp Val Gly Trp Leu Lys Thr

65 70 75 80

Val Asp Gln Tyr Phe Tyr Gly Ile Lys Asn Asp Ile Gln His Ala Gly

85 90 95

Val Gln Tyr Ile Leu Asp Ser Val Ile Ser Ala Leu Leu Ala Asp Pro

100 105 110

Thr Arg Arg Phe Ile Tyr Val Glu Ile Ala Phe Phe Ser Arg Trp Trp

115 120 125

His Gln Gln Thr Asn Ala Thr Gln Glu Val Val Arg Asp Leu Val Arg

130 135 140

Gln Gly Arg Leu Glu Phe Ala Asn Gly Gly Trp Val Met Asn Asp Glu

145 150 155 160

Ala Ala Thr His Tyr Gly Ala Ile Val Asp Gln Met Thr Leu Gly Leu

165 170 175

Arg Phe Leu Glu Asp Thr Phe Gly Asn Asp Gly Arg Pro Arg Val Ala

180 185 190

Trp His Ile Asp Pro Phe Gly His Ser Arg Glu Gln Ala Ser Leu Phe

195 200 205

Ala Gln Met Gly Phe Asp Gly Phe Phe Phe Gly Arg Leu Asp Tyr Gln

210 215 220

Asp Lys Trp Val Arg Met Gln Lys Leu Glu Met Glu Gln Val Trp Arg

225 230 235 240

Ala Ser Thr Ser Leu Lys Pro Pro Thr Ala Asp Leu Phe Thr Gly Val

245 250 255

Leu Pro Asn Gly Tyr Asn Pro Pro Arg Asn Leu Cys Trp Asp Val Leu

260 265 270

Cys Val Asp Gln Pro Leu Val Glu Asp Pro Arg Ser Pro Glu Tyr Asn

275 280 285

Ala Lys Glu Leu Val Asp Tyr Phe Leu Asn Val Ala Thr Ala Gln Gly

290 295 300

Arg Tyr Tyr Arg Thr Asn His Thr Val Met Thr Met Gly Ser Asp Phe

305 310 315 320

Gln Tyr Glu Asn Ala Asn Met Trp Phe Lys Asn Leu Asp Lys Leu Ile

325 330 335

Arg Leu Val Asn Ala Gln Gln Ala Lys Gly Ser Ser Val His Val Leu

340 345 350

Tyr Ser Thr Pro Ala Cys Tyr Leu Trp Glu Leu Asn Lys Ala Asn Leu

355 360 365

Thr Trp Ser Val Lys His Asp Asp Phe Phe Pro Tyr Ala Asp Gly Pro

370 375 380

His Gln Phe Trp Thr Gly Tyr Phe Ser Ser Arg Pro Ala Leu Lys Arg

385 390 395 400

Tyr Glu Arg Leu Ser Tyr Asn Phe Leu Gln Val Cys Asn Gln Leu Glu

405 410 415

Ala Leu Val Gly Leu Ala Ala Asn Val Gly Pro Tyr Gly Ser Gly Asp

420 425 430

Ser Ala Pro Leu Asn Glu Ala Met Ala Val Leu Gln His His Asp Ala

435 440 445

Val Ser Gly Thr Ser Arg Gln His Val Ala Asn Asp Tyr Ala Arg Gln

450 455 460

Leu Ala Ala Gly Trp Gly Pro Cys Glu Val Leu Leu Ser Asn Ala Leu

465 470 475 480

Ala Arg Leu Arg Gly Phe Lys Asp His Phe Thr Phe Cys Gln Gln Leu

485 490 495

Asn Ile Ser Ile Cys Pro Leu Ser Gln Thr Ala Ala Arg Phe Gln Val

500 505 510

Ile Val Tyr Asn Pro Leu Gly Arg Lys Val Asn Trp Met Val Arg Leu

515 520 525

Pro Val Ser Glu Gly Val Phe Val Val Lys Asp Pro Asn Gly Arg Thr

530 535 540

Val Pro Ser Asp Val Val Ile Phe Pro Ser Ser Asp Ser Gln Ala His

545 550 555 560

Pro Pro Glu Leu Leu Phe Ser Ala Ser Leu Pro Ala Leu Gly Phe Ser

565 570 575

Thr Tyr Ser Val Ala Gln Val Pro Arg Trp Lys Pro Gln Ala Arg Ala

580 585 590

Pro Gln Pro Ile Pro Arg Arg Ser Trp Ser Pro Ala Leu Thr Ile Glu

595 600 605

Asn Glu His Ile Arg Ala Thr Phe Asp Pro Asp Thr Gly Leu Leu Met

610 615 620

Glu Ile Met Asn Met Asn Gln Gln Leu Leu Leu Pro Val Arg Gln Thr

625 630 635 640

Phe Phe Trp Tyr Asn Ala Ser Ile Gly Asp Asn Glu Ser Asp Gln Ala

645 650 655

Ser Gly Ala Tyr Ile Phe Arg Pro Asn Gln Gln Lys Pro Leu Pro Val

660 665 670

Ser Arg Trp Ala Gln Ile His Leu Val Lys Thr Pro Leu Val Gln Glu

675 680 685

Val His Gln Asn Phe Ser Ala Trp Cys Ser Gln Val Val Arg Leu Tyr

690 695 700

Pro Gly Gln Arg His Leu Glu Leu Glu Trp Ser Val Gly Pro Ile Pro

705 710 715 720

Val Gly Asp Thr Trp Gly Lys Glu Val Ile Ser Arg Phe Asp Thr Pro

725 730 735

Leu Glu Thr Lys Gly Arg Phe Tyr Thr Asp Ser Asn Gly Arg Glu Ile

740 745 750

Leu Glu Arg Arg Arg Asp Tyr Arg Pro Thr Trp Lys Leu Asn Gln Thr

755 760 765

Glu Pro Val Ala Gly Asn Tyr Tyr Pro Val Asn Thr Arg Ile Tyr Ile

770 775 780

Thr Asp Gly Asn Met Gln Leu Thr Val Leu Thr Asp Arg Ser Gln Gly

785 790 795 800

Gly Ser Ser Leu Arg Asp Gly Ser Leu Glu Leu Met Val His Arg Arg

805 810 815

Leu Leu Lys Asp Asp Gly Arg Gly Val Ser Glu Pro Leu Met Glu Asn

820 825 830

Gly Ser Gly Ala Trp Val Arg Gly Arg His Leu Val Leu Leu Asp Thr

835 840 845

Ala Gln Ala Ala Ala Ala Gly His Arg Leu Leu Ala Glu Gln Glu Val

850 855 860

Leu Ala Pro Gln Val Val Leu Ala Pro Gly Gly Gly Ala Ala Tyr Asn

865 870 875 880

Leu Gly Ala Pro Pro Arg Thr Gln Phe Ser Gly Leu Arg Arg Asp Leu

885 890 895

Pro Pro Ser Val His Leu Leu Thr Leu Ala Ser Trp Gly Pro Glu Met

900 905 910

Val Leu Leu Arg Leu Glu His Gln Phe Ala Val Gly Glu Asp Ser Gly

915 920 925

Arg Asn Leu Ser Ala Pro Val Thr Leu Asn Leu Arg Asp Leu Phe Ser

930 935 940

Thr Phe Thr Ile Thr Arg Leu Gln Glu Thr Thr Leu Val Ala Asn Gln

945 950 955 960

Leu Arg Glu Ala Ala Ser Arg Leu Lys Trp Thr Thr Asn Thr Gly Pro

965 970 975

Thr Pro His Gln Thr Pro Tyr Gln Leu Asp Pro Ala Asn Ile Thr Leu

980 985 990

Glu Pro Met Glu Ile Arg Thr Phe Leu Ala Ser Val Gln Trp Lys Glu

995 1000 1005

Val Asp Gly

1010

<210> 23

<211> 1041

<212> DNA

<213> 人类

<220>

<223> AGA多核苷酸序列

<400> 23

atggcgcgga agtcgaactt gcctgtgctt ctcgtgccgt ttctgctctg ccaggcccta 60

gtgcgctgct ccagccctct gcccctggtc gtcaacactt ggccctttaa gaatgcaacc 120

gaagcagcgt ggagggcatt agcatctgga ggctctgccc tggatgcagt ggagagcggc 180

tgtgccatgt gtgagagaga gcagtgtgac ggctctgtag gctttggagg aagtcctgat 240

gaacttggag aaaccacact agatgccatg atcatggatg gcactactat ggatgtagga 300

gcagtaggag atctcagacg aattaaaaat gctattggtg tggcacggaa agtactggaa 360

catacaacac acacactttt agtaggagag tcagccacca catttgctca aagtatgggg 420

tttatcaatg aagacttatc taccactgct tctcaagctc ttcattcaga ttggcttgct 480

cggaattgcc agccaaatta ttggaggaat gttataccag atccctcaaa atactgcgga 540

ccctacaaac cacctggtat cttaaagcag gatattccta tccataaaga aacagaagat 600

gatcgtggtc atgacactat tggcatggtt gtaatccata agacaggaca tattgctgct 660

ggtacatcta caaatggtat aaaattcaaa atacatggcc gtgtaggaga ctcaccaata 720

cctggagctg gagcctatgc tgacgatact gcaggggcag ccgcagccac tgggaatggt 780

gatatattga tgcgcttcct gccaagctac caagctgtag aatacatgag aagaggagaa 840

gatccaacca tagcttgcca aaaagtgatt tcaagaatcc agaagcattt tccagaattc 900

tttggggctg ttatatgtgc caatgtgact ggaagttacg gtgctgcttg caataaactt 960

tcaacattta ctcagtttag tttcatggtt tataattccg aaaaaaatca gccaactgag 1020

gaaaaagtgg actgcatcta a 1041

<210> 24

<211> 346

<212> PRT

<213> 人类

<220>

<223> AGA多肽序列

<400> 24

Met Ala Arg Lys Ser Asn Leu Pro Val Leu Leu Val Pro Phe Leu Leu

1 5 10 15

Cys Gln Ala Leu Val Arg Cys Ser Ser Pro Leu Pro Leu Val Val Asn

20 25 30

Thr Trp Pro Phe Lys Asn Ala Thr Glu Ala Ala Trp Arg Ala Leu Ala

35 40 45

Ser Gly Gly Ser Ala Leu Asp Ala Val Glu Ser Gly Cys Ala Met Cys

50 55 60

Glu Arg Glu Gln Cys Asp Gly Ser Val Gly Phe Gly Gly Ser Pro Asp

65 70 75 80

Glu Leu Gly Glu Thr Thr Leu Asp Ala Met Ile Met Asp Gly Thr Thr

85 90 95

Met Asp Val Gly Ala Val Gly Asp Leu Arg Arg Ile Lys Asn Ala Ile

100 105 110

Gly Val Ala Arg Lys Val Leu Glu His Thr Thr His Thr Leu Leu Val

115 120 125

Gly Glu Ser Ala Thr Thr Phe Ala Gln Ser Met Gly Phe Ile Asn Glu

130 135 140

Asp Leu Ser Thr Thr Ala Ser Gln Ala Leu His Ser Asp Trp Leu Ala

145 150 155 160

Arg Asn Cys Gln Pro Asn Tyr Trp Arg Asn Val Ile Pro Asp Pro Ser

165 170 175

Lys Tyr Cys Gly Pro Tyr Lys Pro Pro Gly Ile Leu Lys Gln Asp Ile

180 185 190

Pro Ile His Lys Glu Thr Glu Asp Asp Arg Gly His Asp Thr Ile Gly

195 200 205

Met Val Val Ile His Lys Thr Gly His Ile Ala Ala Gly Thr Ser Thr

210 215 220

Asn Gly Ile Lys Phe Lys Ile His Gly Arg Val Gly Asp Ser Pro Ile

225 230 235 240

Pro Gly Ala Gly Ala Tyr Ala Asp Asp Thr Ala Gly Ala Ala Ala Ala

245 250 255

Thr Gly Asn Gly Asp Ile Leu Met Arg Phe Leu Pro Ser Tyr Gln Ala

260 265 270

Val Glu Tyr Met Arg Arg Gly Glu Asp Pro Thr Ile Ala Cys Gln Lys

275 280 285

Val Ile Ser Arg Ile Gln Lys His Phe Pro Glu Phe Phe Gly Ala Val

290 295 300

Ile Cys Ala Asn Val Thr Gly Ser Tyr Gly Ala Ala Cys Asn Lys Leu

305 310 315 320

Ser Thr Phe Thr Gln Phe Ser Phe Met Val Tyr Asn Ser Glu Lys Asn

325 330 335

Gln Pro Thr Glu Glu Lys Val Asp Cys Ile

340 345

<210> 25

<211> 1236

<212> DNA

<213> 人类

<220>

<223> ASAH1多核苷酸序列

<400> 25

atgaactgct gcatcgggct gggagagaaa gctcgcgggt cccaccgggc ctcctaccca 60

agtctcagcg cgcttttcac cgaggcctca attctgggat ttggcagctt tgctgtgaaa 120

gcccaatgga cagaggactg cagaaaatca acctatcctc cttcaggacc aacgtacaga 180

ggtgcagttc catggtacac cataaatctt gacttaccac cctacaaaag atggcatgaa 240

ttgatgcttg acaaggcacc agtgctaaag gttatagtga attctctgaa gaatatgata 300

aatacattcg tgccaagtgg aaaaattatg caggtggtgg atgaaaaatt gcctggccta 360

cttggcaact ttcctggccc ttttgaagag gaaatgaagg gtattgccgc tgttactgat 420

atacctttag gagagattat ttcattcaat attttttatg aattatttac catttgtact 480

tcaatagtag cagaagacaa aaaaggtcat ctaatacatg ggagaaacat ggattttgga 540

gtatttcttg ggtggaacat aaataatgat acctgggtca taactgagca actaaaacct 600

ttaacagtga atttggattt ccaaagaaac aacaaaactg tcttcaaggc ttcaagcttt 660

gctggctatg tgggcatgtt aacaggattc aaaccaggac tgttcagtct tacactgaat 720

gaacgtttca gtataaatgg tggttatctg ggtattctag aatggattct gggaaagaaa 780

gatgtcatgt ggatagggtt cctcactaga acagttctgg aaaatagcac aagttatgaa 840

gaagccaaga atttattgac caagaccaag atattggccc cagcctactt tatcctggga 900

ggcaaccagt ctggggaagg ttgtgtgatt acacgagaca gaaaggaatc attggatgta 960

tatgaactcg atgctaagca gggtagatgg tatgtggtac aaacaaatta tgaccgttgg 1020

aaacatccct tcttccttga tgatcgcaga acgcctgcaa agatgtgtct gaaccgcacc 1080

agccaagaga atatctcatt tgaaaccatg tatgatgtcc tgtcaacaaa acctgtcctc 1140

aacaagctga ccgtatacac aaccttgata gatgttacca aaggtcaatt cgaaacttac 1200

ctgcgggact gccctgaccc ttgtataggt tggtga 1236

<210> 26

<211> 411

<212> PRT

<213> 人类

<220>

<223> ASAH1多肽序列

<400> 26

Met Asn Cys Cys Ile Gly Leu Gly Glu Lys Ala Arg Gly Ser His Arg

1 5 10 15

Ala Ser Tyr Pro Ser Leu Ser Ala Leu Phe Thr Glu Ala Ser Ile Leu

20 25 30

Gly Phe Gly Ser Phe Ala Val Lys Ala Gln Trp Thr Glu Asp Cys Arg

35 40 45

Lys Ser Thr Tyr Pro Pro Ser Gly Pro Thr Tyr Arg Gly Ala Val Pro

50 55 60

Trp Tyr Thr Ile Asn Leu Asp Leu Pro Pro Tyr Lys Arg Trp His Glu

65 70 75 80

Leu Met Leu Asp Lys Ala Pro Val Leu Lys Val Ile Val Asn Ser Leu

85 90 95

Lys Asn Met Ile Asn Thr Phe Val Pro Ser Gly Lys Ile Met Gln Val

100 105 110

Val Asp Glu Lys Leu Pro Gly Leu Leu Gly Asn Phe Pro Gly Pro Phe

115 120 125

Glu Glu Glu Met Lys Gly Ile Ala Ala Val Thr Asp Ile Pro Leu Gly

130 135 140

Glu Ile Ile Ser Phe Asn Ile Phe Tyr Glu Leu Phe Thr Ile Cys Thr

145 150 155 160

Ser Ile Val Ala Glu Asp Lys Lys Gly His Leu Ile His Gly Arg Asn

165 170 175

Met Asp Phe Gly Val Phe Leu Gly Trp Asn Ile Asn Asn Asp Thr Trp

180 185 190

Val Ile Thr Glu Gln Leu Lys Pro Leu Thr Val Asn Leu Asp Phe Gln

195 200 205

Arg Asn Asn Lys Thr Val Phe Lys Ala Ser Ser Phe Ala Gly Tyr Val

210 215 220

Gly Met Leu Thr Gly Phe Lys Pro Gly Leu Phe Ser Leu Thr Leu Asn

225 230 235 240

Glu Arg Phe Ser Ile Asn Gly Gly Tyr Leu Gly Ile Leu Glu Trp Ile

245 250 255

Leu Gly Lys Lys Asp Val Met Trp Ile Gly Phe Leu Thr Arg Thr Val

260 265 270

Leu Glu Asn Ser Thr Ser Tyr Glu Glu Ala Lys Asn Leu Leu Thr Lys

275 280 285

Thr Lys Ile Leu Ala Pro Ala Tyr Phe Ile Leu Gly Gly Asn Gln Ser

290 295 300

Gly Glu Gly Cys Val Ile Thr Arg Asp Arg Lys Glu Ser Leu Asp Val

305 310 315 320

Tyr Glu Leu Asp Ala Lys Gln Gly Arg Trp Tyr Val Val Gln Thr Asn

325 330 335

Tyr Asp Arg Trp Lys His Pro Phe Phe Leu Asp Asp Arg Arg Thr Pro

340 345 350

Ala Lys Met Cys Leu Asn Arg Thr Ser Gln Glu Asn Ile Ser Phe Glu

355 360 365

Thr Met Tyr Asp Val Leu Ser Thr Lys Pro Val Leu Asn Lys Leu Thr

370 375 380

Val Tyr Thr Thr Leu Ile Asp Val Thr Lys Gly Gln Phe Glu Thr Tyr

385 390 395 400

Leu Arg Asp Cys Pro Asp Pro Cys Ile Gly Trp

405 410

<210> 27

<211> 1590

<212> DNA

<213> 人类

<220>

<223> HEXA多核苷酸序列

<400> 27

atgacaagct ccaggctttg gttttcgctg ctgctggcgg cagcgttcgc aggacgggcg 60

acggccctct ggccctggcc tcagaacttc caaacctccg accagcgcta cgtcctttac 120

ccgaacaact ttcaattcca gtacgatgtc agctcggccg cgcagcccgg ctgctcagtc 180

ctcgacgagg ccttccagcg ctatcgtgac ctgcttttcg gttccgggtc ttggccccgt 240

ccttacctca cagggaaacg gcatacactg gagaagaatg tgttggttgt ctctgtagtc 300

acacctggat gtaaccagct tcctactttg gagtcagtgg agaattatac cctgaccata 360

aatgatgacc agtgtttact cctctctgag actgtctggg gagctctccg aggtctggag 420

acttttagcc agcttgtttg gaaatctgct gagggcacat tctttatcaa caagactgag 480

attgaggact ttccccgctt tcctcaccgg ggcttgctgt tggatacatc tcgccattac 540

ctgccactct ctagcatcct ggacactctg gatgtcatgg cgtacaataa attgaacgtg 600

ttccactggc atctggtaga tgatccttcc ttcccatatg agagcttcac ttttccagag 660

ctcatgagaa aggggtccta caaccctgtc acccacatct acacagcaca ggatgtgaag 720

gaggtcattg aatacgcacg gctccggggt atccgtgtgc ttgcagagtt tgacactcct 780

ggccacactt tgtcctgggg accaggtatc cctggattac tgactccttg ctactctggg 840

tctgagccct ctggcacctt tggaccagtg aatcccagtc tcaataatac ctatgagttc 900

atgagcacat tcttcttaga agtcagctct gtcttcccag atttttatct tcatcttgga 960

ggagatgagg ttgatttcac ctgctggaag tccaacccag agatccagga ctttatgagg 1020

aagaaaggct tcggtgagga cttcaagcag ctggagtcct tctacatcca gacgctgctg 1080

gacatcgtct cttcttatgg caagggctat gtggtgtggc aggaggtgtt tgataataaa 1140

gtaaagattc agccagacac aatcatacag gtgtggcgag aggatattcc agtgaactat 1200

atgaaggagc tggaactggt caccaaggcc ggcttccggg cccttctctc tgccccctgg 1260

tacctgaacc gtatatccta tggccctgac tggaaggatt tctacatagt ggaacccctg 1320

gcatttgaag gtacccctga gcagaaggct ctggtgattg gtggagaggc ttgtatgtgg 1380

ggagaatatg tggacaacac aaacctggtc cccaggctct ggcccagagc aggggctgtt 1440

gccgaaaggc tgtggagcaa caagttgaca tctgacctga catttgccta tgaacgtttg 1500

tcacacttcc gctgtgaatt gctgaggcga ggtgtccagg cccaacccct caatgtaggc 1560

ttctgtgagc aggagtttga acagacctga 1590

<210> 28

<211> 529

<212> PRT

<213> 人类

<220>

<223> HEXA多肽序列

<400> 28

Met Thr Ser Ser Arg Leu Trp Phe Ser Leu Leu Leu Ala Ala Ala Phe

1 5 10 15

Ala Gly Arg Ala Thr Ala Leu Trp Pro Trp Pro Gln Asn Phe Gln Thr

20 25 30

Ser Asp Gln Arg Tyr Val Leu Tyr Pro Asn Asn Phe Gln Phe Gln Tyr

35 40 45

Asp Val Ser Ser Ala Ala Gln Pro Gly Cys Ser Val Leu Asp Glu Ala

50 55 60

Phe Gln Arg Tyr Arg Asp Leu Leu Phe Gly Ser Gly Ser Trp Pro Arg

65 70 75 80

Pro Tyr Leu Thr Gly Lys Arg His Thr Leu Glu Lys Asn Val Leu Val

85 90 95

Val Ser Val Val Thr Pro Gly Cys Asn Gln Leu Pro Thr Leu Glu Ser

100 105 110

Val Glu Asn Tyr Thr Leu Thr Ile Asn Asp Asp Gln Cys Leu Leu Leu

115 120 125

Ser Glu Thr Val Trp Gly Ala Leu Arg Gly Leu Glu Thr Phe Ser Gln

130 135 140

Leu Val Trp Lys Ser Ala Glu Gly Thr Phe Phe Ile Asn Lys Thr Glu

145 150 155 160

Ile Glu Asp Phe Pro Arg Phe Pro His Arg Gly Leu Leu Leu Asp Thr

165 170 175

Ser Arg His Tyr Leu Pro Leu Ser Ser Ile Leu Asp Thr Leu Asp Val

180 185 190

Met Ala Tyr Asn Lys Leu Asn Val Phe His Trp His Leu Val Asp Asp

195 200 205

Pro Ser Phe Pro Tyr Glu Ser Phe Thr Phe Pro Glu Leu Met Arg Lys

210 215 220

Gly Ser Tyr Asn Pro Val Thr His Ile Tyr Thr Ala Gln Asp Val Lys

225 230 235 240

Glu Val Ile Glu Tyr Ala Arg Leu Arg Gly Ile Arg Val Leu Ala Glu

245 250 255

Phe Asp Thr Pro Gly His Thr Leu Ser Trp Gly Pro Gly Ile Pro Gly

260 265 270

Leu Leu Thr Pro Cys Tyr Ser Gly Ser Glu Pro Ser Gly Thr Phe Gly

275 280 285

Pro Val Asn Pro Ser Leu Asn Asn Thr Tyr Glu Phe Met Ser Thr Phe

290 295 300

Phe Leu Glu Val Ser Ser Val Phe Pro Asp Phe Tyr Leu His Leu Gly

305 310 315 320

Gly Asp Glu Val Asp Phe Thr Cys Trp Lys Ser Asn Pro Glu Ile Gln

325 330 335

Asp Phe Met Arg Lys Lys Gly Phe Gly Glu Asp Phe Lys Gln Leu Glu

340 345 350

Ser Phe Tyr Ile Gln Thr Leu Leu Asp Ile Val Ser Ser Tyr Gly Lys

355 360 365

Gly Tyr Val Val Trp Gln Glu Val Phe Asp Asn Lys Val Lys Ile Gln

370 375 380

Pro Asp Thr Ile Ile Gln Val Trp Arg Glu Asp Ile Pro Val Asn Tyr

385 390 395 400

Met Lys Glu Leu Glu Leu Val Thr Lys Ala Gly Phe Arg Ala Leu Leu

405 410 415

Ser Ala Pro Trp Tyr Leu Asn Arg Ile Ser Tyr Gly Pro Asp Trp Lys

420 425 430

Asp Phe Tyr Ile Val Glu Pro Leu Ala Phe Glu Gly Thr Pro Glu Gln

435 440 445

Lys Ala Leu Val Ile Gly Gly Glu Ala Cys Met Trp Gly Glu Tyr Val

450 455 460

Asp Asn Thr Asn Leu Val Pro Arg Leu Trp Pro Arg Ala Gly Ala Val

465 470 475 480

Ala Glu Arg Leu Trp Ser Asn Lys Leu Thr Ser Asp Leu Thr Phe Ala

485 490 495

Tyr Glu Arg Leu Ser His Phe Arg Cys Glu Leu Leu Arg Arg Gly Val

500 505 510

Gln Ala Gln Pro Leu Asn Val Gly Phe Cys Glu Gln Glu Phe Glu Gln

515 520 525

Thr

<210> 29

<211> 2859

<212> DNA

<213> 人类

<220>

<223> GAA多核苷酸序列

<400> 29

atgggagtga ggcacccgcc ctgctcccac cggctcctgg ccgtctgcgc cctcgtgtcc 60

ttggcaaccg ctgcactcct ggggcacatc ctactccatg atttcctgct ggttccccga 120

gagctgagtg gctcctcccc agtcctggag gagactcacc cagctcacca gcagggagcc 180

agcagaccag ggccccggga tgcccaggca caccccggcc gtcccagagc agtgcccaca 240

cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 300

gaacagtgcg aggcccgcgg ctgttgctac atccctgcaa agcaggggct gcagggagcc 360

cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 420

ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 480

cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 540

ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcatgtc 600

cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 660

atcgtgcgcc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 720

tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 780

gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 840

cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 900

ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 960

gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1020

atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1080

ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1140

accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1200

cagtggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1260

ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 1320

atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 1380

ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 1440

tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 1500

gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 1560

gagccttcca acttcatcag gggctctgag gacggctgcc ccaacaatga gctggagaac 1620

ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 1680

agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 1740

atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 1800

tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 1860

tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 1920

ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 1980

tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2040

ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2100

ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2160

gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2220

gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 2280

gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccagta 2340

gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 2400

gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 2460

gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 2520

atggccctgg ctgtggccct gaccaagggt ggggaggccc gaggggagct gttctgggac 2580

gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 2640

aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 2700

ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 2760

gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 2820

ctgttgatgg gagagcagtt tctcgtcagc tggtgttag 2859

<210> 30

<211> 952

<212> PRT

<213> 人类

<220>

<223> GAA多肽序列

<400> 30

Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys

1 5 10 15

Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu

20 25 30

His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val

35 40 45

Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly

50 55 60

Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr

65 70 75 80

Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys

85 90 95

Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro

100 105 110

Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe

115 120 125

Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser

130 135 140

Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe

145 150 155 160

Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu

165 170 175

Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu

180 185 190

Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu

195 200 205

Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg

210 215 220

Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe

225 230 235 240

Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr

245 250 255

Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser

260 265 270

Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly

275 280 285

Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly

290 295 300

Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val

305 310 315 320

Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile

325 330 335

Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln

340 345 350

Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly

355 360 365

Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr

370 375 380

Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val

385 390 395 400

Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe

405 410 415

Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His

420 425 430

Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser

435 440 445

Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg

450 455 460

Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val

465 470 475 480

Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu

485 490 495

Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe

500 505 510

Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly

515 520 525

Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val

530 535 540

Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser

545 550 555 560

Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly

565 570 575

Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly

580 585 590

Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg

595 600 605

Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu

610 615 620

Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro

625 630 635 640

Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu

645 650 655

Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg

660 665 670

Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser

675 680 685

Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala

690 695 700

Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly

705 710 715 720

Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser

725 730 735

Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile

740 745 750

Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro

755 760 765

Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly

770 775 780

Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser

785 790 795 800

Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val

805 810 815

His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr

820 825 830

Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr

835 840 845

Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser

850 855 860

Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala

865 870 875 880

Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly

885 890 895

Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala

900 905 910

Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr

915 920 925

Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly

930 935 940

Glu Gln Phe Leu Val Ser Trp Cys

945 950

<210> 31

<211> 1896

<212> DNA

<213> 人类

<220>

<223> SMPD1多核苷酸序列

<400> 31

atgccccgct acggagcgtc actccgccag agctgcccca ggtccggccg ggagcaggga 60

caagacggga ccgccggagc ccccggactc ctttggatgg gcctggtgct ggcgctggcg 120

ctggcgctgg cgctggcgct ggctctgtct gactctcggg ttctctgggc tccggcagag 180

gctcaccctc tttctcccca aggccatcct gccaggttac atcgcatagt gccccggctc 240

cgagatgtct ttgggtgggg gaacctcacc tgcccaatct gcaaaggtct attcaccgcc 300

atcaacctcg ggctgaagaa ggaacccaat gtggctcgcg tgggctccgt ggccatcaag 360

ctgtgcaatc tgctgaagat agcaccacct gccgtgtgcc aatccattgt ccacctcttt 420

gaggatgaca tggtggaggt gtggagacgc tcagtgctga gcccatctga ggcctgtggc 480

ctgctcctgg gctccacctg tgggcactgg gacattttct catcttggaa catctctttg 540

cctactgtgc cgaagccgcc ccccaaaccc cctagccccc cagccccagg tgcccctgtc 600

agccgcatcc tcttcctcac tgacctgcac tgggatcatg actacctgga gggcacggac 660

cctgactgtg cagacccact gtgctgccgc cggggttctg gcctgccgcc cgcatcccgg 720

ccaggtgccg gatactgggg cgaatacagc aagtgtgacc tgcccctgag gaccctggag 780

agcctgttga gtgggctggg cccagccggc ccttttgata tggtgtactg gacaggagac 840

atccccgcac atgatgtctg gcaccagact cgtcaggacc aactgcgggc cctgaccacc 900

gtcacagcac ttgtgaggaa gttcctgggg ccagtgccag tgtaccctgc tgtgggtaac 960

catgaaagca cacctgtcaa tagcttccct ccccccttca ttgagggcaa ccactcctcc 1020

cgctggctct atgaagcgat ggccaaggct tgggagccct ggctgcctgc cgaagccctg 1080

cgcaccctca gaattggggg gttctatgct ctttccccat accccggtct ccgcctcatc 1140

tctctcaata tgaatttttg ttcccgtgag aacttctggc tcttgatcaa ctccacggat 1200

cccgcaggac agctccagtg gctggtgggg gagcttcagg ctgctgagga tcgaggagac 1260

aaagtgcata taattggcca cattccccca gggcactgtc tgaagagctg gagctggaat 1320

tattaccgaa ttgtagccag gtatgagaac accctggctg ctcagttctt tggccacact 1380

catgtggatg aatttgaggt cttctatgat gaagagactc tgagccggcc gctggctgta 1440

gccttcctgg cacccagtgc aactacctac atcggcctta atcctggtta ccgtgtgtac 1500

caaatagatg gaaactactc cgggagctct cacgtggtcc tggaccatga gacctacatc 1560

ctgaatctga cccaggcaaa cataccggga gccataccgc actggcagct tctctacagg 1620

gctcgagaaa cctatgggct gcccaacaca ctgcctaccg cctggcacaa cctggtatat 1680

cgcatgcggg gcgacatgca acttttccag accttctggt ttctctacca taagggccac 1740

ccaccctcgg agccctgtgg cacgccctgc cgtctggcta ctctttgtgc ccagctctct 1800

gcccgtgctg acagccctgc tctgtgccgc cacctgatgc cagatgggag cctcccagag 1860

gcccagagcc tgtggccaag gccactgttt tgctag 1896

<210> 32

<211> 631

<212> PRT

<213> 人类

<220>

<223> SMPD1多肽序列

<400> 32

Met Pro Arg Tyr Gly Ala Ser Leu Arg Gln Ser Cys Pro Arg Ser Gly

1 5 10 15

Arg Glu Gln Gly Gln Asp Gly Thr Ala Gly Ala Pro Gly Leu Leu Trp

20 25 30

Met Gly Leu Val Leu Ala Leu Ala Leu Ala Leu Ala Leu Ala Leu Ala

35 40 45

Leu Ser Asp Ser Arg Val Leu Trp Ala Pro Ala Glu Ala His Pro Leu

50 55 60

Ser Pro Gln Gly His Pro Ala Arg Leu His Arg Ile Val Pro Arg Leu

65 70 75 80

Arg Asp Val Phe Gly Trp Gly Asn Leu Thr Cys Pro Ile Cys Lys Gly

85 90 95

Leu Phe Thr Ala Ile Asn Leu Gly Leu Lys Lys Glu Pro Asn Val Ala

100 105 110

Arg Val Gly Ser Val Ala Ile Lys Leu Cys Asn Leu Leu Lys Ile Ala

115 120 125

Pro Pro Ala Val Cys Gln Ser Ile Val His Leu Phe Glu Asp Asp Met

130 135 140

Val Glu Val Trp Arg Arg Ser Val Leu Ser Pro Ser Glu Ala Cys Gly

145 150 155 160

Leu Leu Leu Gly Ser Thr Cys Gly His Trp Asp Ile Phe Ser Ser Trp

165 170 175

Asn Ile Ser Leu Pro Thr Val Pro Lys Pro Pro Pro Lys Pro Pro Ser

180 185 190

Pro Pro Ala Pro Gly Ala Pro Val Ser Arg Ile Leu Phe Leu Thr Asp

195 200 205

Leu His Trp Asp His Asp Tyr Leu Glu Gly Thr Asp Pro Asp Cys Ala

210 215 220

Asp Pro Leu Cys Cys Arg Arg Gly Ser Gly Leu Pro Pro Ala Ser Arg

225 230 235 240

Pro Gly Ala Gly Tyr Trp Gly Glu Tyr Ser Lys Cys Asp Leu Pro Leu

245 250 255

Arg Thr Leu Glu Ser Leu Leu Ser Gly Leu Gly Pro Ala Gly Pro Phe

260 265 270

Asp Met Val Tyr Trp Thr Gly Asp Ile Pro Ala His Asp Val Trp His

275 280 285

Gln Thr Arg Gln Asp Gln Leu Arg Ala Leu Thr Thr Val Thr Ala Leu

290 295 300

Val Arg Lys Phe Leu Gly Pro Val Pro Val Tyr Pro Ala Val Gly Asn

305 310 315 320

His Glu Ser Thr Pro Val Asn Ser Phe Pro Pro Pro Phe Ile Glu Gly

325 330 335

Asn His Ser Ser Arg Trp Leu Tyr Glu Ala Met Ala Lys Ala Trp Glu

340 345 350

Pro Trp Leu Pro Ala Glu Ala Leu Arg Thr Leu Arg Ile Gly Gly Phe

355 360 365

Tyr Ala Leu Ser Pro Tyr Pro Gly Leu Arg Leu Ile Ser Leu Asn Met

370 375 380

Asn Phe Cys Ser Arg Glu Asn Phe Trp Leu Leu Ile Asn Ser Thr Asp

385 390 395 400

Pro Ala Gly Gln Leu Gln Trp Leu Val Gly Glu Leu Gln Ala Ala Glu

405 410 415

Asp Arg Gly Asp Lys Val His Ile Ile Gly His Ile Pro Pro Gly His

420 425 430

Cys Leu Lys Ser Trp Ser Trp Asn Tyr Tyr Arg Ile Val Ala Arg Tyr

435 440 445

Glu Asn Thr Leu Ala Ala Gln Phe Phe Gly His Thr His Val Asp Glu

450 455 460

Phe Glu Val Phe Tyr Asp Glu Glu Thr Leu Ser Arg Pro Leu Ala Val

465 470 475 480

Ala Phe Leu Ala Pro Ser Ala Thr Thr Tyr Ile Gly Leu Asn Pro Gly

485 490 495

Tyr Arg Val Tyr Gln Ile Asp Gly Asn Tyr Ser Gly Ser Ser His Val

500 505 510

Val Leu Asp His Glu Thr Tyr Ile Leu Asn Leu Thr Gln Ala Asn Ile

515 520 525

Pro Gly Ala Ile Pro His Trp Gln Leu Leu Tyr Arg Ala Arg Glu Thr

530 535 540

Tyr Gly Leu Pro Asn Thr Leu Pro Thr Ala Trp His Asn Leu Val Tyr

545 550 555 560

Arg Met Arg Gly Asp Met Gln Leu Phe Gln Thr Phe Trp Phe Leu Tyr

565 570 575

His Lys Gly His Pro Pro Ser Glu Pro Cys Gly Thr Pro Cys Arg Leu

580 585 590

Ala Thr Leu Cys Ala Gln Leu Ser Ala Arg Ala Asp Ser Pro Ala Leu

595 600 605

Cys Arg His Leu Met Pro Asp Gly Ser Leu Pro Glu Ala Gln Ser Leu

610 615 620

Trp Pro Arg Pro Leu Phe Cys

625 630

<210> 33

<211> 1200

<212> DNA

<213> 人类

<220>

<223> LIPA多核苷酸序列

<400> 33

atgaaaatgc ggttcttggg gttggtggtc tgtttggttc tctggaccct gcattctgag 60

gggtctggag ggaaactgac agctgtggat cctgaaacaa acatgaatgt gagtgaaatt 120

atctcttact ggggattccc tagtgaggaa tacctagttg agacagaaga tggatatatt 180

ctgtgcctta accgaattcc tcatgggagg aagaaccatt ctgacaaagg tcccaaacca 240

gttgtcttcc tgcaacatgg cttgctggca gattctagta actgggtcac aaaccttgcc 300

aacagcagcc tgggcttcat tcttgctgat gctggttttg acgtgtggat gggcaacagc 360

agaggaaata cctggtctcg gaaacataag acactctcag tttctcagga tgaattctgg 420

gctttcagtt atgatgagat ggcaaaatat gacctaccag cttccattaa cttcattctg 480

aataaaactg gccaagaaca agtgtattat gtgggtcatt ctcaaggcac cactataggt 540

tttatagcat tttcacagat ccctgagctg gctaaaagga ttaaaatgtt ttttgccctg 600

ggtcctgtgg cttccgtcgc cttctgtact agccctatgg ccaaattagg acgattacca 660

gatcatctca ttaaggactt atttggagac aaagaatttc ttccccagag tgcgtttttg 720

aagtggctgg gtacccacgt ttgcactcat gtcatactga aggagctctg tggaaatctc 780

tgttttcttc tgtgtggatt taatgagaga aatttaaata tgtctagagt ggatgtatat 840

acaacacatt ctcctgctgg aacttctgtg caaaacatgt tacactggag ccaggctgtt 900

aaattccaaa agtttcaagc ctttgactgg ggaagcagtg ccaagaatta ttttcattac 960

aaccagagtt atcctcccac atacaatgtg aaggacatgc ttgtgccgac tgcagtctgg 1020

agcgggggtc acgactggct tgcagatgtc tacgacgtca atatcttact gactcagatc 1080

accaacttgg tgttccatga gagcattccg gaatgggagc atcttgactt catttggggc 1140

ctggatgccc cttggaggct ttataataaa attattaatc taatgaggaa atatcagtga 1200

<210> 34

<211> 399

<212> PRT

<213> 人类

<220>

<223> LIPA多肽序列

<400> 34

Met Lys Met Arg Phe Leu Gly Leu Val Val Cys Leu Val Leu Trp Thr

1 5 10 15

Leu His Ser Glu Gly Ser Gly Gly Lys Leu Thr Ala Val Asp Pro Glu

20 25 30

Thr Asn Met Asn Val Ser Glu Ile Ile Ser Tyr Trp Gly Phe Pro Ser

35 40 45

Glu Glu Tyr Leu Val Glu Thr Glu Asp Gly Tyr Ile Leu Cys Leu Asn

50 55 60

Arg Ile Pro His Gly Arg Lys Asn His Ser Asp Lys Gly Pro Lys Pro

65 70 75 80

Val Val Phe Leu Gln His Gly Leu Leu Ala Asp Ser Ser Asn Trp Val

85 90 95

Thr Asn Leu Ala Asn Ser Ser Leu Gly Phe Ile Leu Ala Asp Ala Gly

100 105 110

Phe Asp Val Trp Met Gly Asn Ser Arg Gly Asn Thr Trp Ser Arg Lys

115 120 125

His Lys Thr Leu Ser Val Ser Gln Asp Glu Phe Trp Ala Phe Ser Tyr

130 135 140

Asp Glu Met Ala Lys Tyr Asp Leu Pro Ala Ser Ile Asn Phe Ile Leu

145 150 155 160

Asn Lys Thr Gly Gln Glu Gln Val Tyr Tyr Val Gly His Ser Gln Gly

165 170 175

Thr Thr Ile Gly Phe Ile Ala Phe Ser Gln Ile Pro Glu Leu Ala Lys

180 185 190

Arg Ile Lys Met Phe Phe Ala Leu Gly Pro Val Ala Ser Val Ala Phe

195 200 205

Cys Thr Ser Pro Met Ala Lys Leu Gly Arg Leu Pro Asp His Leu Ile

210 215 220

Lys Asp Leu Phe Gly Asp Lys Glu Phe Leu Pro Gln Ser Ala Phe Leu

225 230 235 240

Lys Trp Leu Gly Thr His Val Cys Thr His Val Ile Leu Lys Glu Leu

245 250 255

Cys Gly Asn Leu Cys Phe Leu Leu Cys Gly Phe Asn Glu Arg Asn Leu

260 265 270

Asn Met Ser Arg Val Asp Val Tyr Thr Thr His Ser Pro Ala Gly Thr

275 280 285

Ser Val Gln Asn Met Leu His Trp Ser Gln Ala Val Lys Phe Gln Lys

290 295 300

Phe Gln Ala Phe Asp Trp Gly Ser Ser Ala Lys Asn Tyr Phe His Tyr

305 310 315 320

Asn Gln Ser Tyr Pro Pro Thr Tyr Asn Val Lys Asp Met Leu Val Pro

325 330 335

Thr Ala Val Trp Ser Gly Gly His Asp Trp Leu Ala Asp Val Tyr Asp

340 345 350

Val Asn Ile Leu Leu Thr Gln Ile Thr Asn Leu Val Phe His Glu Ser

355 360 365

Ile Pro Glu Trp Glu His Leu Asp Phe Ile Trp Gly Leu Asp Ala Pro

370 375 380

Trp Arg Leu Tyr Asn Lys Ile Ile Asn Leu Met Arg Lys Tyr Gln

385 390 395

<210> 35

<211> 3093

<212> DNA

<213> 人类

<220>

<223> CDKL5多核苷酸序列

<400> 35

atgaagattc ctaacattgg taatgtgatg aataaatttg agatccttgg ggttgtaggt 60

gaaggagcct atggagttgt acttaaatgc agacacaagg aaacacatga aattgtggcg 120

atcaagaaat tcaaggacag tgaagaaaat gaagaagtca aagaaacgac tttacgagag 180

cttaaaatgc ttcggactct caagcaggaa aacattgtgg agttgaagga agcatttcgt 240

cggaggggaa agttgtactt ggtgtttgag tatgttgaaa aaaatatgct cgaattgctg 300

gaagaaatgc caaatggagt tccacctgag aaagtaaaaa gctacatcta tcagctaatc 360

aaggctattc actggtgcca taagaatgat attgtccatc gagatataaa accagaaaat 420

ctcttaatca gccacaatga tgtcctaaaa ctgtgtgact ttggttttgc tcgtaatctg 480

tcagaaggca ataatgctaa ttacacagag tacgttgcca ccagatggta tcggtcccca 540

gaactcttac ttggcgctcc ctatggaaag tccgtggaca tgtggtcggt gggctgtatt 600

cttggggagc ttagcgatgg acagccttta tttcctggag aaagtgaaat tgaccaactt 660

tttactattc agaaggtgct aggaccactt ccatctgagc agatgaagct tttctacagt 720

aatcctcgct tccatgggct ccggtttcca gctgttaacc atcctcagtc cttggaaaga 780

agataccttg gaattttgaa tagtgttcta cttgacctaa tgaagaattt actgaagttg 840

gacccagctg acagatactt gacagaacag tgtttgaatc accctacatt tcaaacccag 900

agacttctgg atcgttctcc ttcaaggtca gcaaaaagaa aaccttacca tgtggaaagc 960

agcacattgt ctaatagaaa ccaagccggc aaaagtactg ctttgcagtc tcaccacaga 1020

tctaacagca aggacatcca gaacctgagt gtaggcctgc cccgggctga cgaaggtctc 1080

cctgccaatg aaagcttcct aaatggaaac cttgctggag ctagtcttag tccactgcac 1140

accaaaacct accaagcaag cagccagcct gggtctacca gcaaagatct caccaacaac 1200

aacataccac accttcttag cccaaaagaa gccaagtcaa aaacagagtt tgattttaat 1260

attgacccaa agccttcaga aggcccaggg acaaagtacc tcaagtcaaa cagcagatct 1320

cagcagaacc gccactcatt catggaaagc tctcaaagca aagctgggac actgcagccc 1380

aatgaaaagc agagtcggca tagctatatt gacacaattc cccagtcctc taggagtccc 1440

tcctacagga ccaaggccaa aagccatggg gcactgagtg actccaagtc tgtgagcaac 1500

ctttctgaag ccagggccca aattgcggag cccagtacca gtaggtactt cccatctagc 1560

tgcttagact tgaattctcc caccagccca acccccacca gacacagtga cacgagaact 1620

ttgctcagcc cttctggaag aaataaccga aatgagggaa cgctggactc acgtcgaacc 1680

acaaccagac attctaagac gatggaggaa ttgaagctgc cggagcacat ggacagtagc 1740

cattcccatt cactgtctgc acctcacgaa tctttttctt atggactggg ctacaccagc 1800

cccttttctt cccagcaacg tcctcatagg cattctatgt atgtgacccg tgacaaagtg 1860

agagccaagg gcttggatgg aagcttgagc atagggcaag ggatggcagc tagagccaac 1920

agcctgcaac tcttgtcacc ccagcctgga gaacagctcc ctccagagat gactgtggca 1980

agatcttcgg tcaaagagac ctccagagaa ggcacctctt ccttccatac acgccagaag 2040

tctgagggtg gagtgtatca tgacccacac tctgatgatg gcacagcccc caaagaaaat 2100

agacacctat acaatgatcc tgtgccaagg agagttggta gcttttacag agtgccatct 2160

ccacgtccag acaattcttt ccatgaaaat aatgtgtcaa ctagagtttc ttctctacca 2220

tcagagagca gttctggaac caaccactca aaaagacaac cagcattcga tccatggaaa 2280

agtcctgaaa atattagtca ttcagagcaa ctcaaggaaa aagagaagca aggatttttc 2340

aggtcaatga aaaagaaaaa gaagaaatct caaacagtac ccaattccga cagccctgat 2400

cttctgacgt tgcagaaatc cattcattct gctagcactc caagcagcag accaaaggag 2460

tggcgccccg agaagatctc agatctgcag acccaaagcc agccattaaa atcactgcgc 2520

aagttgttac atctctcttc ggcctcaaat cacccggctt cctcagatcc ccgcttccag 2580

cccttaacag ctcaacaaac caaaaattcc ttctcagaaa ttcggattca ccccctgagc 2640

caggcctctg gcgggagcag caacatccgg caggaacccg caccgaaggg caggccagcc 2700

ctccagctgc cagacggtgg atgtgatggc agaagacaga gacaccattc tggaccccaa 2760

gatagacgct tcatgttaag gacgacagaa caacaaggag aatacttctg ctgtggtgac 2820

ccaaagaagc ctcacactcc gtgcgtccca aaccgagccc ttcatcgtcc aatctccagt 2880

cctgctccct atccagtact ccaggtccga ggcacttcca tgtgcccgac actccaggtc 2940

cgaggcactg atgctttcag ctgcccaacc cagcaatccg ggttctcttt cttcgtgaga 3000

cacgttatga gggaagccct gattcacagg gcccaggtaa accaagctgc gctcctgaca 3060

taccatgaga atgcggcact gacgggcaag tga 3093

<210> 36

<211> 1030

<212> PRT

<213> 人类

<220>

<223> CDKL5多肽序列

<400> 36

Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu

1 5 10 15

Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His

20 25 30

Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu

35 40 45

Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu

50 55 60

Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg

65 70 75 80

Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met

85 90 95

Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val

100 105 110

Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys

115 120 125

Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser

130 135 140

His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu

145 150 155 160

Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp

165 170 175

Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val

180 185 190

Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln

195 200 205

Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln

210 215 220

Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser

225 230 235 240

Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln

245 250 255

Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp

260 265 270

Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr

275 280 285

Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp

290 295 300

Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser

305 310 315 320

Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln

325 330 335

Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly

340 345 350

Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn

355 360 365

Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr

370 375 380

Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn

385 390 395 400

Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu

405 410 415

Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys

420 425 430

Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met

435 440 445

Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln

450 455 460

Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro

465 470 475 480

Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys

485 490 495

Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser

500 505 510

Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr

515 520 525

Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro

530 535 540

Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr

545 550 555 560

Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His

565 570 575

Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe

580 585 590

Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro

595 600 605

His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly

610 615 620

Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn

625 630 635 640

Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu

645 650 655

Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr

660 665 670

Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp

675 680 685

Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr

690 695 700

Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser

705 710 715 720

Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val

725 730 735

Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg

740 745 750

Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser

755 760 765

Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys

770 775 780

Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp

785 790 795 800

Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser

805 810 815

Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln

820 825 830

Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala

835 840 845

Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala

850 855 860

Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser

865 870 875 880

Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys

885 890 895

Gly Arg Pro Ala Leu Gln Leu Pro Asp Gly Gly Cys Asp Gly Arg Arg

900 905 910

Gln Arg His His Ser Gly Pro Gln Asp Arg Arg Phe Met Leu Arg Thr

915 920 925

Thr Glu Gln Gln Gly Glu Tyr Phe Cys Cys Gly Asp Pro Lys Lys Pro

930 935 940

His Thr Pro Cys Val Pro Asn Arg Ala Leu His Arg Pro Ile Ser Ser

945 950 955 960

Pro Ala Pro Tyr Pro Val Leu Gln Val Arg Gly Thr Ser Met Cys Pro

965 970 975

Thr Leu Gln Val Arg Gly Thr Asp Ala Phe Ser Cys Pro Thr Gln Gln

980 985 990

Ser Gly Phe Ser Phe Phe Val Arg His Val Met Arg Glu Ala Leu Ile

995 1000 1005

His Arg Ala Gln Val Asn Gln Ala Ala Leu Leu Thr Tyr His Glu Asn

1010 1015 1020

Ala Ala Leu Thr Gly Lys

1025 1030

<210> 37

<211> 18

<212> PRT

<213> 人类

<220>

<223> 白蛋白肽

<400> 37

Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala

1 5 10 15

Tyr Ser

<210> 38

<211> 18

<212> PRT

<213> 人类

<220>

<223> 糜蛋白酶原肽

<400> 38

Met Ala Phe Leu Trp Leu Leu Ser Cys Trp Ala Leu Leu Gly Thr Thr

1 5 10 15

Phe Gly

<210> 39

<211> 14

<212> PRT

<213> 人类

<220>

<223> 白细胞介素-2肽

<400> 39

Met Gln Leu Leu Ser Cys Ile Ala Leu Ile Leu Ala Leu Val

1 5 10

<210> 40

<211> 15

<212> PRT

<213> 人类

<220>

<223> 胰蛋白酶原-2肽

<400> 40

Met Asn Leu Leu Leu Ile Leu Thr Phe Val Ala Ala Ala Val Ala

1 5 10 15

<210> 41

<211> 17

<212> PRT

<213> 人类

<220>

<223> BM40肽

<400> 41

Met Arg Ala Trp Ile Phe Phe Leu Leu Cys Leu Ala Gly Arg Ala Leu

1 5 10 15

Ala

<210> 42

<211> 21

<212> PRT

<213> 人工的

<220>

<223> Secrecon

<400> 42

Met Trp Trp Arg Leu Trp Trp Leu Leu Leu Leu Leu Leu Leu Leu Trp

1 5 10 15

Pro Met Val Trp Ala

20

<210> 43

<211> 20

<212> PRT

<213> 人工的

<220>

<223> 小鼠IgKVIII

<400> 43

Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro

1 5 10 15

Gly Ser Thr Gly

20

<210> 44

<211> 22

<212> PRT

<213> 人工的

<220>

<223> 人类IgKVIII

<400> 44

Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Arg Gly Ala Arg Cys

20

<210> 45

<211> 16

<212> PRT

<213> 人工的

<220>

<223> CD33

<400> 45

Met Pro Leu Leu Leu Leu Leu Pro Leu Leu Trp Ala Gly Ala Leu Ala

1 5 10 15

<210> 46

<211> 23

<212> PRT

<213> 人工的

<220>

<223> tPA

<400> 46

Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly

1 5 10 15

Ala Val Phe Val Ser Pro Ser

20

<210> 47

<211> 16

<212> PRT

<213> 人工的

<220>

<223> 共有的

<400> 47

Met Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Ala Leu Ala Leu Ala

1 5 10 15

<210> 48

<211> 17

<212> PRT

<213> 人工的

<220>

<223> 天然的

<400> 48

Met Leu Leu Leu Leu Leu Leu Leu Gly Leu Arg Leu Gln Leu Ser Leu

1 5 10 15

Gly

<210> 49

<211> 16

<212> PRT

<213> 人工的

<220>

<223> Penetratin

<400> 49

Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys

1 5 10 15

<210> 50

<211> 11

<212> PRT

<213> 人工的

<220>

<223> TAT

<400> 50

Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg

1 5 10

<210> 51

<211> 18

<212> PRT

<213> 人工的

<220>

<223> SynB1

<400> 51

Arg Gly Gly Arg Leu Ser Tyr Ser Arg Arg Arg Phe Ser Thr Ser Thr

1 5 10 15

Gly Arg

<210> 52

<211> 10

<212> PRT

<213> 人工的

<220>

<223> SynB3

<400> 52

Arg Arg Leu Ser Tyr Ser Arg Arg Arg Phe

1 5 10

<210> 53

<211> 12

<212> PRT

<213> 人工的

<220>

<223> PTD-4

<400> 53

Pro Ile Arg Arg Arg Lys Lys Leu Arg Arg Leu Lys

1 5 10

<210> 54

<211> 12

<212> PRT

<213> 人工的

<220>

<223> PTD-5

<400> 54

Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg

1 5 10

<210> 55

<211> 15

<212> PRT

<213> 人工的

<220>

<223> FHV衣

<400> 55

Arg Arg Arg Arg Asn Arg Thr Arg Arg Asn Arg Arg Arg Val Arg

1 5 10 15

<210> 56

<211> 19

<212> PRT

<213> 人工的

<220>

<223> BMV Gag

<400> 56

Lys Met Thr Arg Ala Gln Arg Arg Ala Ala Ala Arg Arg Asn Arg Trp

1 5 10 15

Thr Ala Arg

<210> 57

<211> 13

<212> PRT

<213> 人工的

<220>

<223> HTLV-II Rex

<400> 57

Thr Arg Arg Gln Arg Thr Arg Arg Ala Arg Arg Asn Arg

1 5 10

<210> 58

<211> 13

<212> PRT

<213> 人工的

<220>

<223> D-Tat

<400> 58

Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln

1 5 10

<210> 59

<211> 13

<212> PRT

<213> 人工的

<220>

<223> R9-Tat

<400> 59

Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg Pro Pro Gln

1 5 10

<210> 60

<211> 27

<212> PRT

<213> 人工的

<220>

<223> 细胞穿膜肽 (Transportan)

<400> 60

Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu

1 5 10 15

Lys Ala Leu Ala Ala Leu Ala Lys Lys Ile Leu

20 25

<210> 61

<211> 17

<212> PRT

<213> 人工的

<220>

<223> MAP

<400> 61

Lys Leu Ala Leu Lys Leu Ala Leu Lys Leu Ala Leu Ala Leu Lys Leu

1 5 10 15

Ala

<210> 62

<211> 27

<212> PRT

<213> 人工的

<220>

<223> SBP

<400> 62

Met Gly Leu Gly Leu His Leu Leu Val Leu Ala Ala Ala Leu Gln Gly

1 5 10 15

Ala Trp Ser Gln Pro Lys Lys Lys Arg Lys Val

20 25

<210> 63

<211> 27

<212> PRT

<213> 人工的

<220>

<223> FBP

<400> 63

Gly Ala Leu Phe Leu Gly Trp Leu Gly Ala Ala Gly Ser Thr Met Gly

1 5 10 15

Ala Trp Ser Gln Pro Lys Lys Lys Arg Lys Val

20 25

<210> 64

<211> 27

<212> PRT

<213> 人工的

<220>

<223> MPG ac

<400> 64

Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly

1 5 10 15

Ala Trp Ser Gln Pro Lys Lys Lys Arg Lys Val

20 25

<210> 65

<211> 27

<212> PRT

<213> 人工的

<220>

<223> MPG(ΔNLS)

<400> 65

Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly

1 5 10 15

Ala Trp Ser Gln Pro Lys Ser Lys Arg Lys Val

20 25

<210> 66

<211> 21

<212> PRT

<213> 人工的

<220>

<223> Pep-1

<400> 66

Lys Glu Thr Trp Trp Glu Thr Trp Trp Thr Glu Trp Ser Gln Pro Lys

1 5 10 15

Lys Lys Arg Lys Val

20

<210> 67

<211> 21

<212> PRT

<213> 人工的

<220>

<223> Pep-2

<400> 67

Lys Glu Thr Trp Phe Glu Thr Trp Phe Thr Glu Trp Ser Gln Pro Lys

1 5 10 15

Lys Lys Arg Lys Val

20

<210> 68

<211> 18

<212> PRT

<213> 人工的

<220>

<223> ApoE p1

<400> 68

Leu Arg Lys Leu Arg Lys Arg Leu Leu Leu Arg Lys Leu Arg Lys Arg

1 5 10 15

Leu Leu

<210> 69

<211> 30

<212> PRT

<213> 人工的

<220>

<223> ApoE p2

<400> 69

Leu Arg Lys Leu Arg Lys Arg Leu Leu Arg Asp Ala Asp Asp Leu Leu

1 5 10 15

Arg Lys Leu Arg Lys Arg Leu Leu Arg Asp Ala Asp Asp Leu

20 25 30

<210> 70

<211> 17

<212> PRT

<213> 人工的

<220>

<223> ApoE p3

<400> 70

Leu Arg Val Arg Leu Ala Ser His Leu Arg Lys Leu Arg Lys Arg Leu

1 5 10 15

Leu

<210> 71

<211> 20

<212> PRT

<213> 人工的

<220>

<223> ApoE p4

<400> 71

Thr Glu Glu Leu Arg Val Arg Leu Ala Ser His Leu Arg Lys Leu Arg

1 5 10 15

Lys Arg Leu Leu

20

<210> 72

<211> 34

<212> PRT

<213> 人工的

<220>

<223> ApoE p5

<400> 72

Leu Arg Val Arg Leu Ala Ser His Leu Arg Lys Leu Arg Lys Arg Leu

1 5 10 15

Leu Leu Arg Val Arg Leu Ala Ser His Leu Arg Lys Leu Arg Lys Arg

20 25 30

Leu Leu

<210> 73

<211> 40

<212> PRT

<213> 人工的

<220>

<223> ApoE p6

<400> 73

Thr Glu Glu Leu Arg Val Arg Leu Ala Ser His Leu Arg Lys Leu Arg

1 5 10 15

Lys Arg Leu Leu Thr Glu Glu Leu Arg Val Arg Leu Ala Ser His Leu

20 25 30

Arg Lys Leu Arg Lys Arg Leu Leu

35 40

<210> 74

<211> 10

<212> PRT

<213> 人工的

<220>

<223> Myc肽

<400> 74

Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu

1 5 10

<210> 75

<211> 39

<212> PRT

<213> 人工的

<220>

<223> ApoB肽

<400> 75

Ser Ser Val Ile Asp Ala Leu Gln Tyr Lys Leu Glu Gly Thr Thr Arg

1 5 10 15

Leu Thr Arg Lys Arg Gly Leu Lys Leu Ala Thr Ala Leu Ser Leu Ser

20 25 30

Asn Lys Phe Val Glu Gly Ser

35

<210> 76

<211> 18242

<212> DNA

<213> 人类

<220>

<223> CX3CR1_基因座

<400> 76

ggggcgggcc gtgcttacca ggccgtggac ttaaaccagg atgagagaac ccctggaggc 60

gtttaagttg gcagacttgg atttcaggaa gagctctctg gcttctgggt ggagaatggc 120

cagtggggta agtggtgaga ggaaagacag agaacggaga aggttagatg ggcttgggaa 180

attatccagg ccctggatgg aggtagagat gtgtgctcat gaacacggag gggattactg 240

atgtggggtg gatgagactg tcgtcaagag tgtgggacag gaagagaggg agagtcttgg 300

ccagatccaa gaaaggagcc ctcagaagag gaggggagtc agaggcaagg aaggggctga 360

ggcagccagc ccagctgagt ggaccccagg agaggtatca aggggtggtg tggggtgggg 420

aggggccagt gtcagaaagt ggatggggag cggcctgact ctgcttttgt cctgtggcct 480

tctggccaaa ggcagggaaa ggtggccaaa cactgagacc aagaacaaag aaagaaaact 540

gctggtggac ttcttccacc atgagcaggc caccaagccc gcagcactgc actgcagccc 600

ccagctctgt cctggggttg ggggaggtga ggaggggcaa ggtggggagc acacagagca 660

cccgctgtcc tcggaacacc acagcgacta gaggtaaggg agcaccggat gtggctggga 720

tgtgggcagc aaggggccag aggggccttg aaggggtcac agaccattta atgaaggtgt 780

attgaaggcc accatgggcc aggccctagt tagggatgga tcagaattat atagcatatg 840

ccaggggtca ggcaggtaat gaagtgatcg gaaggtgatg aggcagtggc agttgagatt 900

cacgttgcag tcgccccaag ctggccaggc cagggagcag aagcatggct ggatgccgga 960

gcccaccagg ctccccactg cagggcaaga gtggcagggg gagagactgt gaaaggagca 1020

taggccaggt cctgggtgaa agctgtgtcc tcagccttga ctgatgggta tagggagcca 1080

ctaaatgcct tggggcagag aggtgaggaa aaaaatattt accgagcatc tacaaggtgc 1140

aaggtactca ctagatgcct tcagtaccaa agcttctcaa acttagtatg catatcactc 1200

ttctaagaat ttcattaaaa tgcagattct aattcagcag atatagggca gggcttgagg 1260

tgctgtcttt aataagctcc cagtgcctgg gactgcactt tgaggagaag agctgtgtgt 1320

gccccagtgt ggtccagtga gtactctggg ctccctctcg tgggcaggga agctgagggc 1380

cccatgagct ctcccagctt cctgaaggct ccccattaat gagagctgac tgtgctgtgc 1440

tttgctgact gcagggcctg ctccctgccc cccacctcca ggttggggta agtggcacct 1500

ctctccctcc agctccgcag tcttccctga ggtttagatc ttccaggttt ataaagtcag 1560

gccctcctgt tggcagctgg cctccaccct ggagtatctg agcttgcctg tggcagcatc 1620

taaagatagt ctcccttaca ggaaacaaga tactattggc taactctgca aataaaatgc 1680

tcttagaggg aaggaaaggg aaatactcgt ctctggtaaa gtctgagcag gacagggtgg 1740

ctgactggca gatccagagg ttcccttggc agtccacgcc aggtaggtgc acaggactag 1800

ttgggtacct gtgggtgggg tggagcagtg gacagctaat aggttaataa tgcctgtttg 1860

cttacgtgca gacaatggaa accattttcc tggggatgtt gtagcctaaa tatgtccaag 1920

gggatggaag agtgggaggc aaggggtgat cagatcattt ataatacact caacctggtg 1980

gaatagtatt agaagcatta gtaattacat tttagagaca tggagaaaag ctcatgattt 2040

taaactaact gaaaaaagca tgaaaaattg catctggatg ctgttgagga attattgcta 2100

attttttgag atgagaaatt gtattaaagt ctttttcaaa aaagagtcct taacttttag 2160

agatgcacac aagtgtttat gggtgaaatt aaataattca gtagagacat taagtgggaa 2220

atagaggaaa tattgaccat gggttgctaa tagttgaagc caggtgttgg gtataaggag 2280

gttctcgctg cttttatttg aaaagttgct ttttatttga aaatttaata ataaagagtt 2340

tttaaatttg tatctgtatt ttaatataaa tataaatgca cttaatataa atataaaata 2400

tgtataacat ttagatagag aaaagctaaa agattactgt ggttgattct aggaaactgc 2460

attgcagata gtttcatggg tttttttttc ctttttcttc cactttttgt accatctatg 2520

ggtttttgtt tgttttttgt tttttgggtt ttctttcttg tttgtgtttt gttttttgag 2580

acggagtttt gctcttgttg cctaagctgg agtgcaatgg cacagtctcg gctcactgca 2640

acctctgcct cctgggttca agtgattctc ctgcctcagc ctcccaagta gctgggatta 2700

taggcatgta ccaccgcccg gctaattttg tatttttagt agaggcgggg tttctccatt 2760

aataaattcc tggcacaaat ttagtgttca attttgatat atgttgttat aaccattgtg 2820

aggatactca ggctcaggtt tgtgtgggtg gaaaacatgg tcttcagaaa gaaattatga 2880

gtgcaagaca ggaggaaatc catcagaggc cccagctgag gactgaccac ggcttgttat 2940

ttctcttgcc ttgcctctgg caatcacagc ctcacagagc ctgcaatcct tgctttgtga 3000

gtttatagct cagtccagag aatggctaag aaagtttagg attctttcaa cacccactcc 3060

acaaaaaaaa aaaaaaaaaa gaaaagaaaa aaaaattaat ttttgaaata cttgaggtag 3120

aaaacttgag gcagaaaaaa attgagccaa aaaaaaagga aaattgaacc acgtgaaagc 3180

aggcaagaaa gcttgcattg ctcagggcat cccaggccca gagggcgctt tggagggagc 3240

tgggtttcct gagaggaggc agggtgggtg acggacctgt gctggagagc cttgaggacc 3300

actgtgggtt gggaatgggg gcagtggatt ggggttcaaa acccctggga atgagaaatg 3360

ggctcaggaa ggctagggtg gattctttca tcttcctctt tgcttggctt tattttcaca 3420

aaggaaggca gggcaggaaa tagtctcagc ccaacttcag tgtggttctt cttagtgctc 3480

aggcttacct ggcacttgcc acacctctgg gatgggagca cctactatcc atcagccacg 3540

tgccagtctc cacaaagtct gctcctgaac cctgctcctc agctggcccc acttcacaga 3600

tggggacata ggcagcttgg ctttggaatg aaggaatgaa gtcaggaatg aagtcctggc 3660

tctgcacttg gtgactgtgc actgggcttg ctaagtctgt ttcctgcttt taaaatggag 3720

attgtccatc agcctttgaa gccatgtaat gggtatgtgt caactttctg caaggattaa 3780

aggcatggta taggaagtcc caaacacact gcctgaccca tctttgatgc tcaagaaacg 3840

atatatgttg ttgtcatgag gaaactgagc ctcagaaagt ttggatacct gaaaaacact 3900

gactactatt gaatgaggtt gtgaagaatc cagagctgta ggggcaggaa agcaaagaac 3960

gtattagagc tgacccagtc aggacgatcg tctatcccct tcctcacccc accccatccc 4020

aggaggaagc ctgcccggcc ctaggcagct atggcacagt ggcaatgtca ggtatggttc 4080

tccctagcca gagaccctag cctcaaaaaa cctccttctt gggatccagg catccaactg 4140

ctcctcccca gccccagcct ctgacccagt atcctgagtc cagagacgtt tggaaccagc 4200

acctgtaatg gaggagctga acaaggaggg gaacttctgc tgctccacag caggtcacgg 4260

tcataggagg gagtggaacc agaatggcag aatccagatc ttggctgcct ttcccaagga 4320

cttgttctga ttcctagcag cacagcccag gcattccgag aagttgggct ctctggcatc 4380

actcactctg cccagaagag ccaggggaaa gttggggctt ctagctgaac cttgatccca 4440

cctgccctct tgaggggctc agaatctgct ggctgcttca caggtgggat tctcacggca 4500

cgctggccac agctgatgct tcgaccccct catcttgttt ggccaaagtg cagcttttta 4560

gcttgtgagt aaggaagaaa agctgtatca tatgtcttta aacatcttcc tagaccacct 4620

ttgttttccc cttaaagtgt gcttaaggag aaaatggaaa gtctcttttc agtgtgttgt 4680

attttgttta ttgcaaaata caacacactg aaagaacaat gtctgggtta gcaaagtatt 4740

agatttaatt tcccacatta ctaccatcca ggctgagaaa gagaacccca gaagcctctc 4800

tcatgtccct tcctgaccac agcctcttcc tctcccacaa agaaccacaa gtctgacttc 4860

tatggtgatc acttccttgc ttttccctat agtttgactg aatctaaata tcatccctaa 4920

acaatatagc ttagctttgc ctatttttga tcttcatatt tggattcata ctttttggtt 4980

tggctcaaga ctaaactttt aaaatgcatc cacgttgtag gagatgtaca tgcacaaaaa 5040

ttttcacggc aacattgtcc aaactagcaa caaactgaaa gccacctatg tgtgcattag 5100

cagtagaaat ggcaataaat catggactag tcacacagtg gaatcctacg cagcaaggag 5160

aattagcagt ctacagccaa accaacagca tgggtgagat gcttccagaa atactgagat 5220

gaatttagag ataaaggcac aattggtcca tatctacagg gcacttaatc cagtgcatct 5280

ccactagaca aaatttgtat ttccatgagc aagagtcatt tgcactgcta tctgctataa 5340

cctacggtgc tgtaaaatta gctcaggcaa taaaaggggg aggtagcccc aaagagtatg 5400

ccagaaagga ctcccagtaa tcttcagtgt gtgtctattt caaagtcttt catcattttt 5460

ccttgtagtt acttagtgtg gaatttcaga cccctctcta tgtccctctt ctcccttttc 5520

agccttggct ttctctgcat ccttccccga agccctgcac tcagcctaaa ctgactttcc 5580

tgaacactct gggagcatgt gggctcctcc caactccacc atcttcactg ccttctgttc 5640

ctatttccct ctgcctggcc ttggccccag gaaaccttcc tatgctcaga ccctctgtgc 5700

ctttgtcttc aaagcccacc cactattcac tgccacctcc atcttggtca acctggaaga 5760

ctttccccat ccttaaaaca tcagctcaaa cggcagattt tttttttttt ttttgtgata 5820

tcctcttgat caccctcccc cagtttttaa ggagacagat atagaggttc aatccttggg 5880

cttcccatga cttttcttat attctgttac tgagcaataa taaacacttc taggaactgt 5940

atcttaaaca cttttgcctc tacagaatct agcacagtgc ctagtattgg tgaaatataa 6000

ttaacaaagt cttctttcaa cacagagatt ctctccacaa aaggagtaga gaaagaacag 6060

ttttattatg gaataagcag taaaccaaaa tatgcagagc attataggcc atctactaag 6120

aggttgcaag aacagaaaga aatctccccc ttttgtatag ccaagtagat acaacctgtt 6180

acatacatgt tatcaaggca aacaataact gttcctcaag taagaggtct tgccagcacc 6240

gtttgccgta catggttcac tctaaattta cctggtaatt agggtaacca cttgtgttag 6300

ctaactggct ctacccagag gaaaatcaaa tttatcttta agacaagggg taattttgca 6360

gcactgagca aggctcttca gttaggctca taccttccca cagaaactaa gagatagaag 6420

cactatctcc cttaggtttg tttacatttc aaagagatga cgcccaggtc cttgggaaag 6480

actagcttag ctcataaagc tgacaaaaag cctatctagt ttcaaaagga tttacacatg 6540

ttcaaagaga ggagaaagta tgtaaaagtt ttctaggtgg gcacggtggc tcacacctgt 6600

attcccagca ctttgagagg ctgaggcggg tggatcacct gaagtcagga atttgagatc 6660

agcctggcca acatggtgaa accttgtctc tactaaaaat acaaaaatta gctgggcatg 6720

gtggtgggcg cctgtaatcc cagctacttg ggaggctgag gcaggagaat cacttgaacc 6780

caggaggtgg aggtggcagt gagccaagat ggcaccattg cactccagcc tgggcgatga 6840

gagtgaaact ccatgtcaaa aaaaaaaaaa gttttctaaa gtaaatgctc tgagaaaaaa 6900

acagaaggtg aggagatctc tgtccttatt tttaacaaga ataattaaat gtttttattt 6960

ttaatttcta cttagactag aatatggtac agatgctcaa aaatattgac ttaattaata 7020

attaaacaat taacaagtct atctctttcc taattattaa aaaaattatg aagtatttcc 7080

cttcaaaatt tcacagttta ctttgacata aataaataaa taccataaag tattttgaag 7140

aggaaaggga agggtggggc ttcaaacaca aaataatggc aggttttgta aaggggcaat 7200

tcactaaacc caataggatt ctcctgttgc tatttttttt tttttttttt ttttggtggt 7260

ggttggaggg aagggttggg tgtgcatttg gcctgtgtga aaaactggtg ggtagacaat 7320

gccatgctgt tctagatggg ctcattgcta taggaataga tagtcactga atttacttgc 7380

ataggggatg gggtataaaa tgtttcctta tagctcctta acatggaatt cagcacccct 7440

ctccccatca gccttagctc tctctgaatc ccaagggata tgtgttataa aaatagctgc 7500

catcataaat gagaaaacca tcaggacctg gtaaaacttg gcttcccaaa cagtcagggg 7560

tctgggcatg gcagccgact gagaaccttt ctatctagta caaggtaaac aagatttgcc 7620

aagacttgat caactgatcc agctccctat ctccaaacag aacctcatct gaatgctcac 7680

aggctgtgcc ccagaagtgt agaagtgtca tgttccctgg gcaggctgct gggcagcctc 7740

tctgttgaca atagaccaca cttttgctga cctaggactc atgttgctct ttaagactgc 7800

ttccttggcc aggcatgatg gctcacacct gtaatcctgg cactttgaga ggcccaggca 7860

ggaggatctc ttgaggccag atgttcaaga ccagcctggt caacatagta agaccccata 7920

tctaccaaaa atagctgggc atggtggtgc acacctatac tcccagctac ttaggagact 7980

gaggtgggag gattgctaca tcccaggagt tcaaggctgt agtgagctat gatcatgcca 8040

ctgcactcca gcctgggcaa cagagcgaga tcctgtctca aacaaacagt ttccttctgt 8100

ttgattcttg ctgaaaaatt gagcatgcca gagctagcaa ggctcttaga ggtggtctgg 8160

tccaatgctt taatttcata catcaagaaa ctgaagcaga gcagagtgac ctgcccaggg 8220

tctctcagcc attcatgctc agaaatgtat gggctcctgt gaaacatgtg gctcttaaaa 8280

gcactatcat atatttgaag gcagaaaata ggctaaacct tcagccttca gacttttcct 8340

ctccagagaa aatgacccca gtttcctcac tatggttgct gggagctaga ttcctgggga 8400

tctggcagtg tggaccacct agtggtggct agaggagcaa ataatatccc gcattccatt 8460

ttccactcac caatccctga ggggcagcct gctgggttat gagcccacag ggggagaacc 8520

ccaacgaatt cagagatgca tcatggacca gtttctctta aggggcctgg gtctactatt 8580

ttcagttcta cttcgagaga agtggcctgc aatatcctgc agatttcccc tccagggaga 8640

aaagcattgt gcggtgcaag gagcacaggc tttgtggaaa gaggcatctg gggttgagat 8700

cctggctctt ttgcttcctt gaacaagtta accaaatctc tgggcctctg ctggttaatt 8760

tataccatgg ggatcatcat ttctccagtg gggttgtgaa gagaatgtgg tgggatcttg 8820

tgtgtggagc atgacactta gcaggcatcc gggaatggca gcctcctccc tttctaaact 8880

ggggctttct gagggtgact tcagattcca caatgtcaac agcacaatgg catcctcata 8940

aggaaagttt gggttggggc tcctcaagca attctctact ctcatttggt acaaagaaaa 9000

aaattaagcc tcacaatttt cttggcacca gactgaacct caaacccagt cttcactttt 9060

actaaaaagc cataaacaga gaccaggagg gtaaaaacta ccagaagata cactggattt 9120

agaaaacagt aagctggatg tgaagccaaa agagagggag aaagcaacat aaaagaatgt 9180

cagattgaag aagaaatgga ttctggccac ctaaagaaga agggaagtat agaaaaggga 9240

agctgattgg aaacaatggg taatgatgag tgtccctccc ctaaaaagtt aaaaaataaa 9300

tgagcaggca tgagaaaagg aagtaggcca gaggaagtag accaggatca gccacggatg 9360

tgagtgggga attttacaaa tttctacttg ggtgtgaaac atgtgtacac tcaaagctct 9420

gtctaggttc accgaaactc tcccagctca aggccattta gtaaaacctt ggcttaactg 9480

aatagtgggt aaggaggcct gaggatggcc cagagaaggt ttaaattctt actggctgct 9540

gcactaagtt gtaaagtgca gccttagttg atgatgcctt tattagtgca acatcccaga 9600

atgcatgcgt cttacaaccc ttgtggatat gaaacccagc tgggtagaca ctgcaaagtc 9660

ttctcatttg attcttccac ttggtttcta gtgtccctca gggacaaagg aaagccatgg 9720

tccagtctaa gatgaaaacc aattagacct ctggcaggcc tttgaccacc ctgagggcca 9780

cccccaaggc acggccacac tcgcatctgc tgccaggagg ccctatctta ggctcagctc 9840

ccaaaccttg aacatcttgg aggatccaca aataggaggt acactcagct caggctcagt 9900

cttccttaaa aagcgccttg ctaaagctat caagttcact ggaatacttc tgcgaaggac 9960

acagcttcag cgatgtcaga ttttttatgt aaatggtgcc ttcacatgct ctggggcatt 10020

tggctaccaa gggcggtttg aactagctcc agcacacaga atacaagtct cttcagaacc 10080

aggcaaaacc ctatgttgcc caatgactcc tgctgtttct tgagatttgc acagaagaca 10140

gagctgcaat tacccacgct gatatctatt tcatgaccac atatgttcaa aagccacatg 10200

tgagaggtat ggttgaaatg agaggttgtg tttgccaagt tgtcttctga ctgtggagag 10260

ctggtgagcc tcttctcatc tcctggggct ccatattata gagctgacga atctcttttc 10320

ttgctccttg aagtctttca ttcacttatt tattaattca tttaacacat caggcaccta 10380

ctaacttctc agagttcaag gcttcctagc ctatgatcag aaaggacacc tgtgtgctca 10440

tgagcacccc tgggatcagg gtgactgata gggtgctgtc atcactacta gatgaaactc 10500

tttggaacaa aggtctagga tataatattt atccttctgc aaatattcat atggcattcg 10560

ctgtgtacca ggccttctgt tgaacattgg cctgcagagc tgaagaggac gtgggtcttc 10620

tcttaggaac tcctagtctt gggaaaaagg aatggggaag ggctgtaatg tgaagttaaa 10680

aaaaagtgct gaggccgaac acatctgggc cctcactgca gccctattgc acacacactg 10740

catcacctcg aacaagttat tcaccctctc tgaattcatc tatttgccca taaaaataga 10800

gatgatcctt ttatatgttg gctaccactt attatgtgca gcatgcttgt tattgtacta 10860

agttactcat tttttagttt ttcatataac tcatattttt gttgattttt attttaaaat 10920

tccaaacgaa ttaattaaac tattttccaa aatacgtagt atgtgtacat ggtaaaaaac 10980

atttccaaaa gtttaccata aaaactgtct cctttcccat atcctcaatc cttcagaatc 11040

cctctccagg gataattacc accaccagtg tattccttaa gagatattta aactttatac 11100

aaaatacgca cacatcattc ttttccacaa atgacagcat actatgtaca tggtacctca 11160

cctagctttt ttcacttacc agtatatctt agagattgtt gcatgacaga atatacagat 11220

ctgcctgttt ttgttgtttt tcccaagttt ccaagagcta gaaactgttt ggtttttaag 11280

cagctgcttg gtattccatt aattggactt atcgtgcttt gatctgtccc tagtgatgga 11340

cattggggtt gtttcccttc atttatattt gaagcttgtt gcagtgacag tgtacacact 11400

tgcttgagca tgtgtgtgtc tacgataaat cccaataagc aatttaaagt aatttaattc 11460

ttatgctctc aacaaaccta agaggttatt tttttagagg aggaagctaa ggctgttgtt 11520

ttgatgcctt tttaccactg gacttgggac tcaactgttt gatagtcatc gagtccttga 11580

ctcttctccc ctgccaggat ttggccccta agcccagggc ccgagtctcc tccatcttca 11640

agggagagtg ggaacagcac aggccttggc ctcagtcctg ctccccctgc ttctagctgt 11700

gggatgggcc aggtgcttca cccagctgtg cctcctgtga ggcacagtgt gtgcaaaatg 11760

gaaatgtgaa catgaagatc aaaaatgtcc ctcaatgacc agtgctgttc ctcagagtca 11820

cgtgggaact catagaaagc gatattggta ctgctctttc ctctgtagca tggtccagat 11880

ggctcatagc agggaccatg atatgctggg tgagcaccca ctgcatgcac ccactgtgcc 11940

agcactgaga gactcctgtg ggagccacag caattctagg gtcttcactg gggactctga 12000

gacagcaggg agctaggatg agggctgcag agtgttcgtc tgccctcact gagcagaccc 12060

cctggatggc agggagcagt cccaagccag atggatgccc ataaccagcc atttggctct 12120

caatacataa tatcaccacg tatcaggcaa aaccatcctg cccagagcat tatctgaatt 12180

tgcatcccat ctgcagaaga tacattcacc cacttcttcc attctgtctt aatcaaagtc 12240

tttatgtgaa ttttccccat tgagaagaca agccccttcc tggcttagac tgtacctgac 12300

tgatcttttc atgagctcct tgccaagcca gaccaccccc agcttatatg gagacttggt 12360

gcaaattaga gatgcccctg tgcacgtggc agccctgagc ccaagcaccc agtaaggcaa 12420

agggcctgat ttgggacccc tctgccactc caccaggcaa tcagttgctt atttctaact 12480

ttcccttcct tctccacatt tgtcccattc cttcctctca tcatgaatat ccccagaggc 12540

attcagcagt gcagtgaatt aaatatagaa cttttttttt tcagaattgc agaacggatt 12600

agatcaatat taatccaaac agagcaatga gcctgacagt ttagtaaaag ctcaataaag 12660

ggtggcttac ctcccccaaa ataatctgaa aagaaagcat gtcttatttc agggggaaaa 12720

aaaaataaag tgacctttaa agaccaaatt cccaggatac ccagggtgga ggtggaacat 12780

gggagtccac aggcagcctg gatgtttcca aagatccaaa gggcttttgc ttcctcacat 12840

aatgcaggaa acaaattgaa catgtattaa gtgcttgctg tatgtgacac actgtgccag 12900

gtgctcccct taaaacagtt ctgtgggcag gcatgagaat gaatcccgat cttacagaca 12960

aggaatgtta ggctcagagg tttcaagctc acccatcact cagccagaga ggacagatgc 13020

aggattcaat ctcgggagtg cccgagtcca cagaagttcc tgtgctgaag gaccgaccac 13080

aggcacataa agagatgcga gacaattttt actggatttg gccacctctc gaggtcggct 13140

ttgccagctc ttctcactgg gggaagggga gggagaaagt agctagctcc agggtcccta 13200

acatagaacc accaaggact tgactatttt tactcataca gcagcttgtc tgggaagatc 13260

atgctctgtg acaagctgca ggcactaagt agcaatttct gtttcccaca tattagcttg 13320

agtcatataa aactgacatg gatgtggctc aaaaatagct gtatgtcagc cattttatac 13380

catttgactt aaatgttatt aattaacgtc acagccagag attattctct gagaaaaggg 13440

cattgtagcc tgaagcagag aaagcataca cgttccctgg ggttgagaac tcatcacagc 13500

ctgagacagc ttaggttgta aagccccggc ccacttatcc caggagagtc tgggtgagat 13560

gcaggcccca aagcagaggc tgggaagcga gaagtgacac accctggctg ggtgggccct 13620

catcttggtg agacaccacc tgggtaaaac catcatggaa agggtgtagt ggggcgtgga 13680

aactccctcg gttaaagcgt gagctttgct gtaagttgtg gtaaggaggg aggcagtgac 13740

aaccaggagg cctgttttga gggtttctga gggacccatc tgtggtatca cgaggagacg 13800

cccagaggag ccgtgtgaaa gggctgcctc ccagccggct ctggagtgaa tgagcagcaa 13860

gtcctggctg cgaaaagaag gggagtgcag cctgcagaag tgtcttcttt tttcaattcc 13920

tgctcagaag gaaacaggag ataagaatag tggggaagtc caaaccaaag tgaactatag 13980

ggctggtaat cgtaggggga attagtcacc cggagactag cccagcagac taacggagcc 14040

ccatcctcca tcttgaatca gtcagcccct ctatgactgc agagtcctga atgatggcaa 14100

caccttctct tcacttagcg ttgtaggatg accaacagtc ctgatttgcc tgggactgag 14160

gggttcccaa tagatgggac tttcagggct aaaaccagga aagtcctggg cagcccaaaa 14220

caaggtagtc actctagagt gtatgactct gtctgatacc tgctaagaaa gagaaggact 14280

tgttgattat aaggagaaga ggaggtgaaa tggttctcaa aaaacaaaga tgagggcttc 14340

cgggtgctgt tctgcccaag gctctgggtc tgaggcttct ctctccaggc ctagcttcat 14400

ggaaaagtaa ggggccagag ggtggaaaag gtggaaacaa aggaagagga tggagaattg 14460

ctttggggaa gtttggactg gaagtgtgaa ttacagctgc acccccaatt caccccatct 14520

cacccccctc cccctcctgc tcatggttct ccctttctca tccacacatt ggtcaaacta 14580

gctagctttt ggagagattt tgggcagtaa aagtaaaaca gatctgtctc aagcttcaaa 14640

aagcctagag ctggctgggc gctgtggctc acgcctgtaa tcctagcatt ttgggaggct 14700

gaggcggaag gataatctga ggtcaggagt ttgagaccag cctggctaac atgatgaaac 14760

cccatctcta ctaaaaatac aaaaattagc caggcgtggt agtgcacgcc tataatccca 14820

gctatttggg aggctgaggc aggagaatcg cttgaacccc aggggacaga ggttgcagtg 14880

agctgagatc gcaccactgc actccagcct gggtgacaca gcgagactcc atttaaaaaa 14940

aaaaaaatgc ctagagccaa atgctcacag agccatttac tgcatggctt tgggcaagtc 15000

aaaggagtcc gcctctcctg tcagaagagt ctgttgcagt cttcatcaca agactgttgt 15060

ggggattaaa caagatggca agtgggaagt tgggaaatgt agtgtgcacc caaccaatat 15120

ttgtttcttc ctgcctgcct acatatgagg ccacacagaa ttccaacttt gtttctctga 15180

taactaacac agttacttgt ttttctttct gatccaggcc ttcaccatgg atcagttccc 15240

tgaatcagtg acagaaaact ttgagtacga tgatttggct gaggcctgtt atattgggga 15300

catcgtggtc tttgggactg tgttcctgtc catattctac tccgtcatct ttgccattgg 15360

cctggtggga aatttgttgg tagtgtttgc cctcaccaac agcaagaagc ccaagagtgt 15420

caccgacatt tacctcctga acctggcctt gtctgatctg ctgtttgtag ccactttgcc 15480

cttctggact cactatttga taaatgaaaa gggcctccac aatgccatgt gcaaattcac 15540

taccgccttc ttcttcatcg gcttttttgg aagcatattc ttcatcaccg tcatcagcat 15600

tgataggtac ctggccatcg tcctggccgc caactccatg aacaaccgga ccgtgcagca 15660

tggcgtcacc atcagcctag gcgtctgggc agcagccatt ttggtggcag caccccagtt 15720

catgttcaca aagcagaaag aaaatgaatg ccttggtgac taccccgagg tcctccagga 15780

aatctggccc gtgctccgca atgtggaaac aaattttctt ggcttcctac tccccctgct 15840

cattatgagt tattgctact tcagaatcat ccagacgctg ttttcctgca agaaccacaa 15900

gaaagccaaa gccattaaac tgatccttct ggtggtcatc gtgtttttcc tcttctggac 15960

accctacaac gttatgattt tcctggagac gcttaagctc tatgacttct ttcccagttg 16020

tgacatgagg aaggatctga ggctggccct cagtgtgact gagacggttg catttagcca 16080

ttgttgcctg aatcctctca tctatgcatt tgctggggag aagttcagaa gataccttta 16140

ccacctgtat gggaaatgcc tggctgtcct gtgtgggcgc tcagtccacg ttgatttctc 16200

ctcatctgaa tcacaaagga gcaggcatgg aagtgttctg agcagcaatt ttacttacca 16260

cacgagtgat ggagatgcat tgctccttct ctgaagggaa tcccaaagcc ttgtgtctac 16320

agagaacctg gagttcctga acctgatgct gactagtgag gaaagatttt tgttgttatt 16380

tcttacaggc acaaaatgat ggacccaatg cacacaaaac aaccctagag tgttgttgag 16440

aattgtgctc aaaatttgaa gaatgaacaa attgaactct ttgaatgaca aagagtagac 16500

atttctctta ctgcaaatgt catcagaact ttttggtttg cagatgacaa aaattcaact 16560

cagactagtt tagttaaatg agggtggtga atattgttca tattgtggca caagcaaaag 16620

ggtgtctgag ccctcaaagt gaggggaaac cagggcctga gccaagctag aattccctct 16680

ctctgactct caaatctttt agtcattata gatcccccag actttacatg acacagcttt 16740

atcaccagag agggactgac acccatgttt ctctggcccc aagggcaaaa ttcccaggga 16800

agtgctctga taggccaagt ttgtatcagg tgcccatccc tggaaggtgc tgttatccat 16860

ggggaaggga tatataagat ggaagcttcc agtccaatct catggagaag cagaaataca 16920

tatttccaag aagttggatg ggtgggtact attctgatta cacaaaacaa atgccacaca 16980

tcacccttac catgtgcctg atccagcctc tcccctgatt acaccagcct cgtcttcatt 17040

aagccctctt ccatcatgtc cccaaacctg caagggctcc ccactgccta ctgcatcgag 17100

tcaaaactca aatgcttggc ttctcatacg tccaccatgg ggtcctacca atagattccc 17160

cattgcctcc tccttcccaa aggactccac ccatcctatc agcctgtctc ttccatatga 17220

cctcatgcat ctccacctgc tcccaggcca gtaagggaaa tagaaaaacc ctgcccccaa 17280

ataagaaggg atggattcca accccaactc cagtagcttg ggacaaatca agcttcagtt 17340

tcctggtctg tagaagaggg ataaggtacc tttcacatag agatcatcct ttccagcatg 17400

aggaactagc caccaactct tgcaggtctc aacccttttg tctgcctctt agacttctgc 17460

tttccacacc tggcactgct gtgctgtgcc caagttgtgg tgctgacaaa gcttggaaga 17520

gcctgcaggt gctgctgcgt ggcatagccc agacacagaa gaggctggtt cttacgatgg 17580

cacccagtga gcactcccaa gtctacagag tgatagcctt ccgtaaccca actctcctgg 17640

actgccttga atatcccctc ccagtcacct tgtggcaagc ccctgcccat ctgggaaaat 17700

accccatcat tcatgctact gccaacctgg ggagccaggg ctatgggagc agcttttttt 17760

tcccccctag aaacgtttgg aacaatctaa aagtttaaag ctcgaaaaca attgtaataa 17820

tgctaaagaa aaagtcatcc aatctaacca catcaatatt gtcattcctg tattcacccg 17880

tccagacctt gttcacactc tcacatgttt agagttgcaa tcgtaatgta cagatggttt 17940

tataatctga tttgttttcc tcttaacgtt agaccacaaa tagtgctcgc tttctatgta 18000

gtttggtaat tatcatttta gaagactcta ccagactgtg tattcattga agtcagatgt 18060

ggtaactgtt aaattgctgt gtatctgata gctctttggc agtctatatg tttgtataat 18120

gaatgagaga ataagtcatg ttccttcaag atcatgtacc ccaatttact tgccattact 18180

caattgataa acatttaact tgtttccaat gtttagcaaa tacatatttt atagaacttc 18240

ca 18242

<210> 77

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T01

<400> 77

tctttcctct gtagcatggt ccagatggct catagcaggg accatgata 49

<210> 78

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T02

<400> 78

tatgctgggt gagcacccac tgcatgcacc cactgtgcca gcactgaga 49

<210> 79

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T03

<400> 79

tgctgggtga gcacccactg catgcaccca ctgtgccagc actgagaga 49

<210> 80

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T04

<400> 80

tgagagactc ctgtgggagc cacagcaatt ctagggtctt cactgggga 49

<210> 81

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T05

<400> 81

tcctgtggga gccacagcaa ttctagggtc ttcactgggg actctgaga 49

<210> 82

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T06

<400> 82

tgggagccac agcaattcta gggtcttcac tggggactct gagacagca 49

<210> 83

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T07

<400> 83

tcgtctgccc tcactgagca gaccccctgg atggcaggga gcagtccca 49

<210> 84

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T08

<400> 84

tgccctcact gagcagaccc cctggatggc agggagcagt cccaagcca 49

<210> 85

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T09

<400> 85

tggatggcag ggagcagtcc caagccagat ggatgcccat aaccagcca 49

<210> 86

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T10

<400> 86

tctcaataca taatatcacc acgtatcagg caaaaccatc ctgcccaga 49

<210> 87

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T11

<400> 87

tatcaggcaa aaccatcctg cccagagcat tatctgaatt tgcatccca 49

<210> 88

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T12

<400> 88

tcctgcccag agcattatct gaatttgcat cccatctgca gaagataca 49

<210> 89

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T13

<400> 89

tctgaatttg catcccatct gcagaagata cattcaccca cttcttcca 49

<210> 90

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T14

<400> 90

ttccattctg tcttaatcaa agtctttatg tgaattttcc ccattgaga 49

<210> 91

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T15

<400> 91

tccattctgt cttaatcaaa gtctttatgt gaattttccc cattgagaa 49

<210> 92

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T16

<400> 92

ttctgtctta atcaaagtct ttatgtgaat tttccccatt gagaagaca 49

<210> 93

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T17

<400> 93

tctgtcttaa tcaaagtctt tatgtgaatt ttccccattg agaagacaa 49

<210> 94

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T18

<400> 94

tttatgtgaa ttttccccat tgagaagaca agccccttcc tggcttaga 49

<210> 95

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T19

<400> 95

ttcctggctt agactgtacc tgactgatct tttcatgagc tccttgcca 49

<210> 96

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_T20

<400> 96

tcctggctta gactgtacct gactgatctt ttcatgagct ccttgccaa 49

<210> 97

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_gRNA1

<400> 97

gtacagtcta agccaggaag ggg 23

<210> 98

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_gRNA2

<400> 98

gggagcagtc ccaagccaga tgg 23

<210> 99

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_gRNA3

<400> 99

gactgctccc tgccatccag ggg 23

<210> 100

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_gRNA4

<400> 100

gtgaatgtat cttctgcaga tgg 23

<210> 101

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_gRNA5

<400> 101

gtctctcagt gctggcacag tgg 23

<210> 102

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_gRNA6

<400> 102

gacagcaggg agctaggatg agg 23

<210> 103

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_gRNA7

<400> 103

gaaggggctt gtcttctcaa tgg 23

<210> 104

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_gRNA8

<400> 104

gcaaattcag ataatgctct ggg 23

<210> 105

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_gRNA9

<400> 105

gagcagaccc cctggatggc agg 23

<210> 106

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CX3CR1_gRNA10

<400> 106

gaactcatag aaagcgatat tgg 23

<210> 107

<211> 1599

<212> DNA

<213> 人类

<220>

<223> CD11b_基因座

<400> 107

gtgcatgggg gtggggtggg ggactctggg tggggaggag ggtaactttt gggtctgtca 60

taaatagagg gcccagaata tgtaggagtc agtctgggga gaggcaaagg ggatttgggg 120

aaggagaaag ggttcaagaa gaagcaggga gaacagctag acccagacag gctggccagg 180

gaagcctgga tgaatgacca cattcatgga ctgtgcaagg ctgcttgccg gtccccttgc 240

ttcacacatg aggagacgga ggcccaggga ggagaagtga catggctcag ggtgcgcagc 300

aggtgtgaga cccctttcct gagtgcttcc tcctggatcc cctctcacca tctccacttt 360

gcctccggtt ctattttcca aggtcccggg tgcaaatgtt tgttgaatga ctgatgaatg 420

aaaatgattt gagtttgtta ccttttatgc ttatatgttg tggaaaatga aattctcctc 480

aaaagggaag gaaatacttg agagctgcat aggaaggaaa ttatctaatt aagaatgtat 540

agaaacttca ctgttgggca aatcatcgtt gtgacaccgg gggaagaagc catttaggtg 600

ctcagaaggg aggctggaat tcagagcagg actggacgtg ccccacgacg gtggttctta 660

ggtcaggagt cagcaaacag tggcctgggg gcccgatatg gcccacgacc tgtttttgca 720

caacctgcca gctagagatt gaagatgaac actgataatc gatttgatga tagggagcac 780

cacccccaaa gaattctatt tgtctcattt gtaaacccgt attacaaaca aattgtactc 840

aatcattatg tttgaaattt ccctaatgac aaatttgtgg aaaagtattt tctgtcttgt 900

tatataagta cttgtacaac atattctatc agcctcttgg tctgcaaaac ctaaaattta 960

ctatctggct gtttacagaa taagtgtgct aatccccgcc ccaggctaac agagctggac 1020

ctgggaggca gacatctgga tgctgggtta gttagggtga ccgaatggat gggaaaggga 1080

atggagcagg aagacatgct gctatctttt tttttttttt ttttttttga tacagggtct 1140

ttctctgttg cccaggctgt agtgcagtgg catgatcatg gttcactgca gccttgacct 1200

cctgggttca agcaatcctc ccacctcagc ctcctgagta ccactacacc cggctaattt 1260

tttatttttt gtagagatgg ggtctcactg tgttgcctag gctggtctta aactcctgag 1320

cccaggtgat cctcccacgt cagcctctta aattattggg ataacaggcc tgagccacca 1380

cacccagcca ttgctttctt ttaaattatt attagttttt gttttttttt tgtatttaat 1440

tttgagatag gatctctctc tgttgctcag gctggagtgc agtggcacaa tcagggctca 1500

agtgatcctc ctgcctcagc cctccaaagt gctaggacta cagcccctaa ctggcatgct 1560

actttcctct gcttgatcct tcccccattc tccctttag 1599

<210> 108

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T01

<400> 108

ttcagagcag gactggacgt gccccacgac ggtggttctt aggtcagga 49

<210> 109

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T02

<400> 109

tatggcccac gacctgtttt tgcacaacct gccagctaga gattgaaga 49

<210> 110

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T03

<400> 110

tgatgatagg gagcaccacc cccaaagaat tctatttgtc tcatttgta 49

<210> 111

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T04

<400> 111

ttctatttgt ctcatttgta aacccgtatt acaaacaaat tgtactcaa 49

<210> 112

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T05

<400> 112

tatttgtctc atttgtaaac ccgtattaca aacaaattgt actcaatca 49

<210> 113

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T06

<400> 113

tttgtaaacc cgtattacaa acaaattgta ctcaatcatt atgtttgaa 49

<210> 114

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T07

<400> 114

ttgtaaaccc gtattacaaa caaattgtac tcaatcatta tgtttgaaa 49

<210> 115

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T08

<400> 115

tacaaacaaa ttgtactcaa tcattatgtt tgaaatttcc ctaatgaca 49

<210> 116

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T09

<400> 116

ttgtactcaa tcattatgtt tgaaatttcc ctaatgacaa atttgtgga 49

<210> 117

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T10

<400> 117

tgtactcaat cattatgttt gaaatttccc taatgacaaa tttgtggaa 49

<210> 118

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T11

<400> 118

tactcaatca ttatgtttga aatttcccta atgacaaatt tgtggaaaa 49

<210> 119

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T12

<400> 119

tttccctaat gacaaatttg tggaaaagta ttttctgtct tgttatata 49

<210> 120

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T13

<400> 120

ttccctaatg acaaatttgt ggaaaagtat tttctgtctt gttatataa 49

<210> 121

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T14

<400> 121

ttgtggaaaa gtattttctg tcttgttata taagtacttg tacaacata 49

<210> 122

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T15

<400> 122

tgttatataa gtacttgtac aacatattct atcagcctct tggtctgca 49

<210> 123

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T16

<400> 123

ttatataagt acttgtacaa catattctat cagcctcttg gtctgcaaa 49

<210> 124

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T17

<400> 124

tatataagta cttgtacaac atattctatc agcctcttgg tctgcaaaa 49

<210> 125

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T18

<400> 125

tacaacatat tctatcagcc tcttggtctg caaaacctaa aatttacta 49

<210> 126

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T19

<400> 126

tcttggtctg caaaacctaa aatttactat ctggctgttt acagaataa 49

<210> 127

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T20

<400> 127

tgcaaaacct aaaatttact atctggctgt ttacagaata agtgtgcta 49

<210> 128

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T21

<400> 128

tgaaaatgat ttgagtttgt taccttttat gcttatatgt tgtggaaaa 49

<210> 129

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T22

<400> 129

tttgttacct tttatgctta tatgttgtgg aaaatgaaat tctcctcaa 49

<210> 130

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T23

<400> 130

ttgttacctt ttatgcttat atgttgtgga aaatgaaatt ctcctcaaa 49

<210> 131

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T24

<400> 131

tgttaccttt tatgcttata tgttgtggaa aatgaaattc tcctcaaaa 49

<210> 132

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T25

<400> 132

tttatgctta tatgttgtgg aaaatgaaat tctcctcaaa agggaagga 49

<210> 133

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T26

<400> 133

ttatgcttat atgttgtgga aaatgaaatt ctcctcaaaa gggaaggaa 49

<210> 134

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T27

<400> 134

tatgcttata tgttgtggaa aatgaaattc tcctcaaaag ggaaggaaa 49

<210> 135

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T28

<400> 135

tgcttatatg ttgtggaaaa tgaaattctc ctcaaaaggg aaggaaata 49

<210> 136

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T29

<400> 136

tggaaaatga aattctcctc aaaagggaag gaaatacttg agagctgca 49

<210> 137

<211> 49

<212> DNA

<213> 人工的

<220>

<223> CD11b_T30

<400> 137

tacttgagag ctgcatagga aggaaattat ctaattaaga atgtataga 49

<210> 138

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CD11b_gRNA1

<400> 138

ggttgtgcaa aaacaggtcg tgg 23

<210> 139

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CD11b_gRNA2

<400> 139

gggaggctgg aattcagagc agg 23

<210> 140

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CD11b_gRNA3

<400> 140

ggagtcagca aacagtggcc tgg 23

<210> 141

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CD11b_gRNA4

<400> 141

gagtcagcaa acagtggcct ggg 23

<210> 142

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CD11b_gRNA5

<400> 142

gacctaagaa ccaccgtcgt ggg 23

<210> 143

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CD11b_gRNA6

<400> 143

gcaaatcatc gttgtgacac cgg 23

<210> 144

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CD11b_gRNA7

<400> 144

gagacaaata gaattctttg ggg 23

<210> 145

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CD11b_gRNA8

<400> 145

gccccacgac ggtggttctt agg 23

<210> 146

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CD11b_gRNA9

<400> 146

gaaatacttg agagctgcat agg 23

<210> 147

<211> 23

<212> DNA

<213> 人工的

<220>

<223> CD11b_gRNA10

<400> 147

ggtcaggagt cagcaaacag tgg 23

<210> 148

<211> 387

<212> DNA

<213> 人类

<220>

<223> S100A9_基因座

<400> 148

gtaagtgagc tgccagcttc cccaggcaga agcctgcctg ccgattcctt ctttccttcc 60

ctgacccaac ttccttccaa atcctcctcc tagaagccct ccttggttgg ccctgcctac 120

tttaaagctt ctttcacatt ttcttaggtc atgttcccct ggggcctcct gccctcaaat 180

gctttgcttt ttggcactct gtagatattc taaaaaatca ttttgtacat gtgtgtgaca 240

ggccatctcc cagttaagtt gcagcctgtg ctttcttttt attttgcact tcccccacta 300

tttctgtgag tgcttagtag gaagtgtcaa agaagcttga cagcattttc ttctaagtgt 360

cccaactctt ggttttccat tacacag 387

<210> 149

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T01

<400> 149

tttccccgtt gtattggttg aaataagttt cactaattgg taacctcca 49

<210> 150

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T02

<400> 150

tattggttga aataagtttc actaattggt aacctccaga gggaaggga 49

<210> 151

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T03

<400> 151

tttcactaat tggtaacctc cagagggaag ggaagggagg gcaggggaa 49

<210> 152

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T04

<400> 152

tggaactggc ctctaagtca gatctgaatt tgcatgccct caatagtca 49

<210> 153

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T05

<400> 153

tctaagtcag atctgaattt gcatgccctc aatagtcaag ctgtgaaaa 49

<210> 154

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T06

<400> 154

tgcatgccct caatagtcaa gctgtgaaaa ctaatgaccc tctctagga 49

<210> 155

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T07

<400> 155

tgaaaactaa tgaccctctc taggactggt ttcaagtctt cctccagga 49

<210> 156

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T08

<400> 156

tcttcctcca ggaagatacc attcctagct gttaaagttg ttataagga 49

<210> 157

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T09

<400> 157

tcctccagga agataccatt cctagctgtt aaagttgtta taaggacca 49

<210> 158

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T10

<400> 158

ttcctagctg ttaaagttgt tataaggacc aaatgaggtg acatttcca 49

<210> 159

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T11

<400> 159

ttaaagttgt tataaggacc aaatgaggtg acatttccag gcttactca 49

<210> 160

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T12

<400> 160

tgaccagggc aagaccctgg aactcagctt cctcttctat aaatagaga 49

<210> 161

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T13

<400> 161

ttcctcttct ataaatagag aatcagcacc caagtcacag ggtcatgga 49

<210> 162

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T14

<400> 162

tcttctataa atagagaatc agcacccaag tcacagggtc atggaggga 49

<210> 163

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T15

<400> 163

tctataaata gagaatcagc acccaagtca cagggtcatg gagggaata 49

<210> 164

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T16

<400> 164

tataaataga gaatcagcac ccaagtcaca gggtcatgga gggaataaa 49

<210> 165

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T17

<400> 165

tggagagcgt ttggtatgtg ctcagtgtct gctccattgt gcgcactca 49

<210> 166

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T18

<400> 166

tggtatgtgc tcagtgtctg ctccattgtg cgcactcagc ctatggtca 49

<210> 167

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T19

<400> 167

ttgtgcgcac tcagcctatg gtcattttta atttttaaat ccagcccca 49

<210> 168

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T20

<400> 168

ttcccttgta catttgccag ctggtcattt actgtgctcc cagtcccca 49

<210> 169

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T21

<400> 169

ttttgttttc ttttcaaatt tggggaaagt cgggaaacag aggcctgca 49

<210> 170

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T22

<400> 170

tttcttttca aatttgggga aagtcgggaa acagaggcct gcattaaga 49

<210> 171

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T23

<400> 171

ttcttttcaa atttggggaa agtcgggaaa cagaggcctg cattaagaa 49

<210> 172

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T24

<400> 172

ttggggaaag tcgggaaaca gaggcctgca ttaagaaggg tggaacaca 49

<210> 173

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T25

<400> 173

taggtcccca gccctcccag tgcccctccc tccgccttgg taaggtgga 49

<210> 174

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T26

<400> 174

ttcagagtta ggggccctga cagctctcca taggtggagg cctcaggca 49

<210> 175

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T27

<400> 175

ttaggggccc tgacagctct ccataggtgg aggcctcagg caggcagga 49

<210> 176

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T28

<400> 176

tccataggtg gaggcctcag gcaggcagga tgctgggtgg ggtaggcaa 49

<210> 177

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T29

<400> 177

taggtggagg cctcaggcag gcaggatgct gggtggggta ggcaagaaa 49

<210> 178

<211> 49

<212> DNA

<213> 人工的

<220>

<223> S100A9_T30

<400> 178

tgggtggggt aggcaagaaa gggcccagca gagaggccgc atggcaaaa 49

<210> 179

<211> 23

<212> DNA

<213> 人工的

<220>

<223> S100A9_gRNA1

<400> 179

gcacaggaga gtgctcgcat tgg 23

<210> 180

<211> 23

<212> DNA

<213> 人工的

<220>

<223> S100A9_gRNA2

<400> 180

ggtaccccac aggttctggg agg 23

<210> 181

<211> 23

<212> DNA

<213> 人工的

<220>

<223> S100A9_gRNA3

<400> 181

ggagccagac atcctggggt agg 23

<210> 182

<211> 23

<212> DNA

<213> 人工的

<220>

<223> S100A9_gRNA4

<400> 182

ggagagtgct cgcattggct ggg 23

<210> 183

<211> 23

<212> DNA

<213> 人工的

<220>

<223> S100A9_gRNA5

<400> 183

ggaagcagag cctcatggat ggg 23

<210> 184

<211> 23

<212> DNA

<213> 人工的

<220>

<223> S100A9_gRNA6

<400> 184

ggcttactca tgccatgacc agg 23

<210> 185

<211> 23

<212> DNA

<213> 人工的

<220>

<223> S100A9_gRNA7

<400> 185

gggaaacacc tagaaaaact agg 23

<210> 186

<211> 23

<212> DNA

<213> 人工的

<220>

<223> S100A9_gRNA8

<400> 186

gtggggggtg aagcgggcat agg 23

<210> 187

<211> 23

<212> DNA

<213> 人工的

<220>

<223> S100A9_gRNA9

<400> 187

ggggggtgaa gcgggcatag ggg 23

<210> 188

<211> 23

<212> DNA

<213> 人工的

<220>

<223> S100A9_gRNA10

<400> 188

gagggctggg gacctacccc agg 23

<210> 189

<211> 3424

<212> DNA

<213> 人类

<220>

<223> TMEM119

<400> 189

gtgagtcctg gggtcccctc ctctgtcctg agagcctgga gctatcttgg agcttaggga 60

ctggggactg ttggagcact ctggggggcc tctctaagtg tgtgtgggct ttgagtgtgt 120

gtttggtgtt gtgtgcatga gtgtggtgga atctgagtcc cgtgtgcggt gctggggtgg 180

gccagggtgg gccggagtgt tgtgtgtgtg cggctggggc cttggtgtag ggggtgtgtt 240

gcttccactt ttctgcaagt ggatgccagg ctgttgcttc caggatctgt gtgagggtga 300

tgtggacggt attgtcctgt gtgcagggat cggctgtgtg tcagggggtt gtgtatgtat 360

atgtgttgtg tgtccgtgtg tgttctctgt gtattgtgtg catgggccat gagagtgctg 420

ttgggtgtct cagtgctgtg tgagtcggtg tgcctgtgtt gtgtgtcttt atattgtgtg 480

tccatgctgc tctgtgtgtg tgtgtgtgtg tggaggggga ttgtgccccc aggacccccc 540

tccccatcca gacctccagg gcccaggtcc ctgtccttgg ctggccctgg ggtcgggggc 600

atgtgcagtg ctccaaccag aacacccctc ccccacaagg ccactgattg aagccaggtt 660

tccgtgggcc gcccctcccc caaaggccac cagtctctgg gtgggggtgg ggcagccccc 720

ggtcccctag cttcaagtct tggggccccc aggcctcagg ggtgcatctg cactcctcca 780

cagactcagg accatcttag ggcatttgcc acacttacac acggccagcc ctgcctgaca 840

tgtccccagg cagggagtcc tgggcaatca cgtggtacct gctaattggc acccactgtg 900

caccaggcat ggccgcatct tgtcctaaca gcagtccagg gaggtggctc ttatccccat 960

tgtacagata tggaaaccga ggctcagaga ggtgacatgc ccagcccaag gacacatagc 1020

cgggaagtga cctcctctgg gatataccaa gacaggcttc tctgtccagg gctctgctgg 1080

gctcacccct gactttctgt gtgacctggg caggctgttt ccagtctctg gacctgagtt 1140

acctctaagg tgaagcaaga ggcgttgggc ctgaccccag ctcctaatgg cctgttagat 1200

tctgagtcct tgaaaaaatt agggtccggg gggaggtagg cagaataatg acttcagagc 1260

tgcccagaac agtgcttcat tccacagatg ggaaactgag gcccagagag ggcaggggcc 1320

gtccagggcc acacaaccat cttttttgag gctctgctga ctgcaggtgg ggctgggtcc 1380

tccatacgtt gcccccacct ttccctggaa gccaggaggg gttgtggggt gcaggggact 1440

ctgagagtca gggtctcagc cttaaagagc cagtggcagt ttgtgtgttc tcctttcttg 1500

ccctctgcct ctgacttcgt gtgtgtgtgt gtgtgtgtgt tgtatgtata tgtgtgtgta 1560

ggtgtatgtg tgcatgtgtg tgtatgtgta tgtgtgtgca tgtgtgtgtt tggttctgca 1620

ttccttggcg gccagagcta aagaggtttc actgaacggg gtgaaaaggt tggtctttca 1680

ctgggtggcg gccggaccag acagtgagcg catgttccca tccggcgatg gtgctcattt 1740

gtcgactcag ggtgggaaat tgctggctga acctggagtt cggctaggga aggaattcag 1800

ctaccccaga ccctatcttt cctcggggct cagctacttc gcaccaggca ctctctgaaa 1860

gttgtctcat ttggccctaa cagctctgag aggtgctacc tgtggtcacc ctgtcccaac 1920

ttacggatgg ggaaagtgag gcccacagga gccagaccac agagctggat gcgatggagc 1980

cgggattctt gacccagcca gaacttgagt gggtctccag ccacccatgg tcccagctgc 2040

cctctgcagt gagaagtggt agttgttgcc acaaaagctc tctcctaggc ttgactgggg 2100

gtgggaggca gggaggtgac tggcaggtca cagaccccaa agctcaaggt tgtctgtagg 2160

aacctttgct aacaggtgcc agagaggtga gggggtcctt tcctcattta gcatctgaca 2220

ggtgatgtcc accagcggga acaagccatt cctggctcag agtgtgtggt gtgtgcatgt 2280

gtgtgtggtt gtgtaggtga gtgtgtgtgg tgtatgtgta tggttgtgtg tatgtggagt 2340

gtatgcatat atgtgtggtg tgtgcatgtg tgtatgattg tgtgtagtat gtgaatgtgt 2400

gtataggggt gtgtgtgggg catgtgtgta cgtggttgtg tgtggggtgt atatgggtat 2460

gtgtggcgtg tgtgcatgtt tgtgtgtggg gtgtgtgtgc atgtgtgtag atgattgtgt 2520

gtgtagtatg tgcatgtgtg tatatgggtg tgtgagtgtg tgtgtggtat gtgtgtgcat 2580

ggttgtgtgt ggtgtgtgtg catgtgtgta tgattgtgta gtctgtgcat gtgtgtatat 2640

gggtgtgtgt gtgtgtggcg tgtgtgcatg attatgtgtg gggtgtgtat ggggatgtgt 2700

gtgtgagtgt gtggcgtgta tgaatggttg tgtgtgtggt gagtgtgcat gtgtatgtat 2760

ggctgtgtat gagtgtgagt gtggtttgtg tgaatgtgcg tgtaaactcc tgggatcaga 2820

cagaggaagg ttcagatccc agctcagcta cttatcatct gtgtgtcctt ggggaagtca 2880

ctgtctgtct ctgaacctct gtttcctcat ctgtaaaatg gggataatga agctgcctca 2940

gggctcctgt aggattaaag gcatgaaaag ggcttagatg agtacccgcg aggaaagcac 3000

aggtgaccag ctcatttaaa atgagcccct gagaagcttt gtctcttttt taaaaaattg 3060

aaatatttta atatatttca tagagatgga ggtttcctta tgttgcccag gctggtcttg 3120

aactcctggg ctcaagcgat cctcccaagt agctgggact acaggcatac accaccaggc 3180

ctggctactt ttttattttt ttgtagaggt ggggtcttac tatgttgctc aaactcctgc 3240

cctcaatcaa tcctccggcc tcggcctccc aaagtgctgg gattacaagt gtgagccacc 3300

acacctggcc aattttgcct ctttttatgt cctggaatta tttttttatt ttttccatct 3360

aagccagttt gttcacattt aatttctttt ttttcttttc tttctttctt tttttttttg 3420

acag 3424

<210> 190

<211> 6273

<212> DNA

<213> 人类

<220>

<223> MERTK

<400> 190

gtgagtgcgc ccggctgggg gccaggcgag ggggtggggg ctcccaggag gaagcagggg 60

cctctgggga gggagcgcgt ccacaggggc gcgcctggct gctggacaag tttgcaaaca 120

ccctccaccc actgcggtgc cagaggaggg ggcgtaggcg aacctaccgt ccactgaccg 180

cggcgcctca agcgtcccga gggcacccag cctggcttgc gggtgcgcat cgtggtgaag 240

ccgggtcggg gtcggcgttg caggctcccc tcttcaccgc agaggaggaa atcgagctcg 300

gccgggcgcg ctgcaagtcc tgaagttccg acgagtggaa cgtaggtagc aggtctggtc 360

tgggatgcga cgagaacttt ccactagagt tgcatggtgg ggccccgctc tggccggagt 420

cccgggggcc acagatccgg tctcccgagg gaccggcgcg gggcgaacga acgggctgcg 480

ggagtcggag ccgcagtccg ggagccgcga tagactgagg ccgagcgacg ggccaggggg 540

ggacggcagt cctggctgct cccaatgggc ccttacgggc attattagta tcccttttta 600

ggggcaccca gagagtgtgg gaaaagggga gcgttctttt cactcctgtt atggcagaac 660

agaacttaca gtgctcggca gcgtttacgt ttatctggat tcagcgaagt gttgttacag 720

gctttttttt ttttaatttg agaccgagtc tcgccctgtc gcccaggctg gagtgccgcg 780

gcgcgatctc ggctcactgc aggctccgcc tcccgggttc aagcgattct cctgcctcag 840

cctcccgagt agctgagact atagacgcgc gctaccacgt ccggctaatt tttgtatttt 900

tagtagagac ggggtttcac catgttggcc aggatggtct cgatctcttg acctcgtgat 960

ctgctctcct tggcctccca aagttctggg attacagtcg tgagccaccg cgcccggctt 1020

gttccaggca ttttaataca agatgctgga ctgatacgtg gaggcaagga aggccggttt 1080

cattctgctt gaacagctta tttggggagt gagtgatgaa cagatttcaa gtttgatcgc 1140

tgatgcactt cttgaggagg ctggaataaa cttaccaggc tttacccaaa agaaaaagaa 1200

aggggaaaaa tgctaaataa acacattcca agtattttct ctcagctaaa aggtttctat 1260

ttccattcag catgtagatt ttctctcttt tgatcgagaa tgcacttgac tagccttcac 1320

ctattacagt caaagatgtt ttttaggaat acctggaaag ctcagtttat agtcaagtaa 1380

gttacttaaa agtttttcct ttgagatttt cctttgaaag ctcatttact caaatgaaaa 1440

attcttaaac agtgcaccca ctttttgcac gttaaattac ataagcaatt tataatttgg 1500

ggcaacatag caatttgaaa caaactttaa gagccaggca aagaactaaa gcagttctgt 1560

tctccactgc ccctccctcc accaaacctt caaaaattcc tcagcatttc tgccagcccc 1620

atttttcata atctgctgca aatctgttat ttgttgctac tagtgaggac tggccgtgaa 1680

tagtcttgga ggtagtgaat gtggtgagaa ctatggagaa agtaatggga acaatagttt 1740

tgtgttaaat acttaaaaat tggagtgctt ttgtttttct aaaattttaa aaggctgtaa 1800

taacaaattt ttgtagctga caatcaactt taatcagaca atcataaaaa ggccttttaa 1860

aatccaccca gctggaagaa tgaaaagttt caccaatcgt tcttgcactt tttgcttttg 1920

gttttgaact ttacctatga gatgtgtgac agttttacat ctcaccttgt gaaaagctta 1980

aagaatggga ttctcactgg cagaattaca gcacaaagga gtgctgtatg aagaaattaa 2040

acatggaaat tagactcttc atctaatttt aagattttcc tattacacat tgtgggtctg 2100

agtgctttgc tgaccacaca ggggagacag agagagagac aatgagaata tgtgtgtaga 2160

ttctacactg ttagcagtat agaagaatgg gtaaataaaa tttaagcatc actttaaccc 2220

aggaaatccc ctctgccccc caacacacat acacactaca cgtctcacaa agacatgcac 2280

acacagaact ggaactgcca aaccaggagc atttcgaggc tttccagtct ttcctttctg 2340

ctcagtctct gatgggggtg ccattgagca gcaaaatgag gcaagcggtg gctctctgaa 2400

gggccaggga gaggatggag caagataaat ataaatgtgg ataaaaatga atgcattatg 2460

aggacttagc tcatgacgag gctgtgtgtg cagctaaact caacccttag agtaaattag 2520

gcttttaaga ttctttaatg ttaatatttc ttttccaaac tgatattgta acatgtattc 2580

cagtatattg taaacatctt cccagaggga acttttaagt tgttctgttg cttgtgggct 2640

ttattccaaa ggcttcaaat gctttttgaa agtacatcgt gcatatttta aaaatgaata 2700

cttttagaaa attattctga cccattaaag tgctgagtgg aattcttttc ttttctttct 2760

ttcttttttt tttttttttg gcaggttctc attctgccac ccaggctaga gtgcagtggc 2820

accatcacgg ctcactgcaa cctcaacctt ccgggctcaa gtgatcctcc cacctcagcc 2880

tcccaagtag ctatgaccac aggcacatac caccatgcct ggctaatttt ttattttttg 2940

tagagacagg atctcactat gttgcccagg ctggtcttga actcctgggc tcaagcgatc 3000

ttcccacctt agcctctcag agtgtgggga ttataggcat gagccaccat gcacagctga 3060

atacaatttt taaaaaatta acaataatta tgtttttttg tttttgagat agagtttcac 3120

tcttgctgtc caggctagag tgcaatggca caatctcggc tcaccgcaac ttcccgcctc 3180

ccgggttcaa gcagttctcc tgcctcagcc tcctgagtag ctgggattac aggcatgcac 3240

caccacgcct ggctaatttt gtatttttgg tagagacagg gtttctccgt gttggttagg 3300

ttggtctcga actcccaacc tcaggtgatc tgcctgcctt ggcctcccaa agtgctggga 3360

ttacaggcat gagccaccac acccagccaa taattatatt tttaaatctt aatttttgaa 3420

ataatttcca gataattgta gaagggccag tgagttacta gtcagcattg gtcaagaaga 3480

ggttcaatct ttttatgcct gtgaattggg aacatgctgc tgggtagaaa aactgagctg 3540

ggaccttgaa cacacatgtg aaacagtcgc tttccatata atagccagaa tgagattttg 3600

gaaacgaatc tgattgtatt ttccatttga aaatcttcca gtggcttcct gttccctact 3660

agaatttgca gagactcaca gcgaacctct ttgacccatt tccattcact tccctcttgt 3720

tcctaccact ccagccacct gtgtcttctt tctagggcct gagcagcctt tgcagtgact 3780

cttccctctg gctggaacct ttttcccaag atctcggcat gctggcttct tctcatcctt 3840

tgggtttcag ttcagaggtt ctccttgaga agccttcccc aataaccacc ccctgccaaa 3900

gtatcatatg catacacccc actatccctt aaatttaatt tcctgataat gcttctcaca 3960

acctgatcag ttccttcctt ccttccttcc ttcctccctc cctccctccc tctatttctt 4020

tattgacaga gtcttgcaat ggcaaattct ctgctcactg caacctccgc ctcccaggtt 4080

caagcaattc tcctgcctca gccttcccag tagctgggat tacaggcacc tgccaccaca 4140

gctggctaat ttttgtattt ttagtagaga cagggtttca ccatgttggc caggctggtc 4200

tcgaactcct gacctcaggt gatccgccta cctcagcctc ccaaagtgca gagattacag 4260

gcgtgagcta tggcacccag ccttacctct ttgtttactc cttttcctcc actgtccccc 4320

caccacaagg taagctcctg gtggcagggc tgctgtcttt ttcactgcta acacagcatg 4380

gagctcatac gggtgctcag tgagtatcag agcacagcat gaaggaacca agcccctgca 4440

tgtcttacca ggtgctcttc acccttatct tttcctactg gcttttccag aaacagaatt 4500

gctggagctc ccatgccctc acattcgggg cttggttaat agaaaacaat cttttatttt 4560

gctgtgatgc caatgtgatt tcattgctgg aggagctagt caattaaaac cagacagatt 4620

tttgggctgt attaacccca aacatatttt acattgtcct aactattcca actagaaaaa 4680

aaaatgtcag aaggtaattt ttcatgttaa acacagttct aacaactcct tgctcagggg 4740

caggtagccc tgggtgcctt gactttggcc cttgccgtta gtttaatctt aacccaaagc 4800

acatggctct gaattggtat gtttctcagc aggagattaa ttattataaa aactgaaagg 4860

ggtctcacac tgtgtgaggc acactatgcc tctggggact ggaatgaaag tgttaaccgg 4920

gactggcttc tggggctttg ggggtggtga ttaactttca ggacctctgt tcctttttgg 4980

gtacagtggg aggctctttt catagaattg ttaggaggac gtaatgagct aatggcaggt 5040

gatatgtgct taaaatatat ttgccattat taccaatggt tctcctccat tcttctgaac 5100

tcaagtatgg gggaaatgtt tttcctagac aaaaggtgtt gggaggaggg ttcttttctt 5160

attgaagtgt atcctgaatg gtccaccctc cattgttcag aatgctttgg tgaaggggcc 5220

ctccggtgtc gccctagagt gcccaagtcc tttgctgcag ctctttaggt ttttgtttcc 5280

tagtagtttg agcaaaaccc acccaggacc aagcagttct ccagagaagc agggcccgcc 5340

ctgactgcca ttcccctcct actcctgccc ccataccttc ccttatggag ttcaaacttg 5400

acatagtaca ggaatagctt cttgtcatgt gcctctcagg aaggtataaa aatgaagtcc 5460

agttcctgtt caacttttcc cacataactc ttttccaaac tgggtgtggt ttaaattttt 5520

ttatttttat tttttgtgtt tgttttgttt tagggttttt gagtgtgaac atccagaaaa 5580

ttcttttttt tttttttgag atggaatctt gctctgtcgc ccaggctgga gtgcatgtgg 5640

cgcgatctcg gctcactgca acctccgcct cctggcttca agcaattctc tgcctcagcc 5700

tcccaagtag ctgggattac aggtgccctc caccagacct ggctaatttt tgtattttaa 5760

gtagagacgg ggtttcaccg tgttgggcag gctggtcttg aactcctgac ctcgcgatcc 5820

acccacctcg gcctctcaaa gtgctgggat tacaggagtg aaccacctca cccagctcag 5880

aaaattcttt tcctttttac cacatcgagc taggttttcc caatgaggtc agttggctgc 5940

aacatagaga aaatgaggct ttggttctta gagtagattc cgtgtacagg cgtgagtatg 6000

tgtccgcagg tggtcttgta ggaaatgcaa agggcgccag gtgcactcct ggcttctggt 6060

acttcctgct taatggcatg ggtgagccaa ccctcaggtg cccgggaggg agccctgatt 6120

actctccctc tggcactctg ggcattggct aacccgtgac cggagttaaa ccagttccct 6180

ctcttttcat tctatgtctc ccactcctgc ctccagccga agtgctaaaa atgcagcctg 6240

gcaggggcag agaattccat taggatcagc agg 6273

<210> 191

<211> 2541

<212> DNA

<213> 人类

<220>

<223> CD164

<400> 191

gtgggcgcgg gccctgtggg cttcccgccc tcccctgccc agccgagccg cactgcctcc 60

tcgccgtgcg ggcggggccc gggttcgggc cacggtcggg cgggcgggcc gcgctcgggg 120

tgcggcggcg actccggcaa catggcggcc agcctggagt ccactcgtgg ccgggccggg 180

tggggagcgc gctgggggga agcggacgcg cggttcccag tggctgcggg gctggggccc 240

ccctcgaagt gttgcaagtc gaggtgcctt ttaaaagtgc atcgtaattc ctagcctcac 300

ttggggtcgg aaatggggac gtggcttcct tccgcggggg cagcggtggg gttgaggatg 360

gggccgggcg tcgcgcctct gaggttggcg gtggggccga gctgcctctc cctgccactg 420

gttgttcacc ctcccggcgc ctctctccgg aggtagcctt ctccggaagt ccgggaaaga 480

gaaacttaaa gacggtaatg ctcgttcgtg tctcagactt gagtctgaga aggtcgcttg 540

agatttaatt acattggttt tgcagatagg aatagaatgt agctgacgtt tgagcacgta 600

gttagtgaaa acttcacact tcaaagtatg cgaaaaggaa gaaaagtacc catgtatgta 660

ccgggtgttt tgcgtacgta tcctaaggct aaactggaag gtaggtagtg aaacctagga 720

ggtagatgca gagacggaga tgagtaaact ctcctgacat tgtatgttta ttcttttttc 780

aattgttttt aaaattttct taactatgtc ctgtgctcag atagcgtatg tttagtaggt 840

cgtggaacgg gggtttgtgc ccaggtctgt gggttttcta aaacccgatc aggagcgtgt 900

cttttgttat gtgcagtcgc atagggctgg ttaaggcata catacatttt aaagcagaaa 960

ttgccatata ccgtgacaac acaaaagaga gaaggaagat aagtttgagg taataagcgg 1020

gagaaacact agaggtttaa aacctgcagt ctcgtatgat tggttattct agttaacatt 1080

agttaaggag taatgtttac gtagttaaca ttggcttctt gaccgaagaa tgccgaagtg 1140

taatgatttt tatcacggca ttcatattct acaaattctc ctctagtttt agtattttat 1200

aaaagtttaa taaagtatat agtaaactta atgttttgtt tttagtttaa ggaagatgta 1260

atggtaacat ttcaaaacga gggaagtaaa ttgcagtata atactgggaa ttctaaccgc 1320

actattttaa gatgatagag cagaatatgt ttgtctcagt cttaatttga cagtttcctt 1380

tcagaattgt agtgtgtgtg taagagaagg ttggaagtat caaattaatt tgtctttgtg 1440

taattgaagt gcgtgcaaag gaggtatgta ttttctggaa atcataagtg gatgtagtgt 1500

ggtctgaaag gtagcaagtt tagttcattg taaagaacat ttcagacatt tcactttgct 1560

acacccgtca agcacaaagg tttttaaaca gcatgtttta tctatacaaa cttcagaaaa 1620

tttattttta ctttatgaac ccttccccac cccaccgtac atgtcccagt ctttaataag 1680

tactaatgat gaagtattga aagcagtgcc tctgcagaac tattttttag gcaggagcaa 1740

agcaaacgag aatgtttgga ggcatctagt ttctaggaaa atgaatggag cccaattctt 1800

ttttttcttt tattttgctg ctttttctca ctggaaaata gagcccaatt ttatagtccg 1860

ttcttctcca gaaattgaat tatggtgatg agtacttgtt tctggattgt ttggcctagg 1920

atgaactatt gacaaatacc ttgttaacct gaattgtatg cacttgaata tgggctttta 1980

gatgttgtct ccagttgtgg aggatcctgt cgagagtgga tcatttatga atcgagaatc 2040

cctgggaaat tatctttgtt tgcagcagaa tgggcatcat cagtgcttgg gttcaacctg 2100

ttaaactact actgttacta ctaaaaatct cagggtttta tctgatgttt gggggtagtg 2160

gttttcctat gtgtagtgtt ggtattatat caaagccttt ttctcgatat ttttatgtat 2220

taaggatgct ttgaaatgcc taaatcctta gtggctgtgg gtgtcttcca atagttgtcc 2280

tgtgaaaaag gattggttag acagatacca tcaggcactg tactgagagt gaccactagc 2340

ttgtttttct aatgcgttta cttacagctt tgtaatgatt ggaatttctt agtaaaccag 2400

tataaagttt tatcatttat ctgaattagt aattttgatg ctgtatgtaa tgcttattgt 2460

tcaaaaagat aagtaataca gattcaaata agatactaat aaaatcattg atttcatgca 2520

tctctccccc caactcccca g 2541

<210> 192

<211> 357

<212> DNA

<213> 人类

<220>

<223> TLR7

<400> 192

gtattttaaa cattggaaca catatagata atttaagtag gtagatgtat gtgctgttat 60

aaggaagtgg ggaggagaga agagggaacc gaaatcatat gcacaaaaat tttttttaga 120

atataaataa aaaatgtggt agtctaaaat gtcaattctt caaagataaa gttaggcttt 180

cagtaacgtt agaaatggtt ttctggaata tgtctccagt ctacctaact ttgaggaagt 240

aaatactgta aatagatgtt tcaaacgcat tttaaagcaa tgatcctagc atgtctttaa 300

gctacagtat tgtgctgtct ttgaaatgta aactttgatg tcttctcttt ctcttag 357

<210> 193

<211> 359

<212> DNA

<213> 人类

<220>

<223> CD14

<400> 193

gtagattctc tgggatataa ggtaggggga ttggggggtt ggatagtgca gagtatggta 60

ctggcctaag gcactgagga tcatcctttt cccacaccca ccagagaagg cttaggctcc 120

cgagtcaaca gggcattcac cgcctggggc gcctgagtca tcaggacact gccaggagac 180

acagaaccct agatgccctg cagaatcctt cctgttacgg tccccctccc tgaaacatcc 240

ttcattgcaa tatttccagg aaaggaaggg ggctggctcg gaggaagaga ggtggggagg 300

tgatcagggt tcacagagga gggaactgaa tgacatccca ggattacata aactgtcag 359

<210> 194

<211> 855

<212> DNA

<213> 人类

<220>

<223> FCGR3A (CD16)

<400> 194

gtaaggagcc ctggagcccc ggctcctagg ctgacagacc agcccagatc cagtggcccg 60

gaggggcctg agctaaatcc gcaggacctg ggtaacacga ggaaggtaaa gagttcctgt 120

cctcgcccct ccccaccccc accttttctg tgatcttttc agcctttcgc tggtgacttg 180

ttcttccagg gcccatttct ctaccctacc tgggtttctt ctaacctgga aatctaatga 240

tcaaatcaca ctaaaaagtc agtagctcct gtggattaca tatcccagga gcatatagat 300

tttgaatttt gaattttgaa agaaattctg cgtggagata atattgaggc agagacactg 360

ctagtggtct gaagatttga aaggaccact ttctgtgtgc aggcagggcc tcagctggag 420

atagatgggt ctgggcgagg caggagagtg acaagttctg aggtgaaatg aaggaagccc 480

tcagagaatg ctcctcccac cttgaatctc atccccaggg tctcactgtc ccattcttgg 540

tgctgggtgg atccaaatcc aggagatggg gcaagcatcc tgggatggct gagggcacac 600

tctggcagat tctgtgtgtg tcctcagatg ctcagccaca gacctttgag ggagtaaagg 660

gggcagaccc acccaccttg cctccaggct ctttccttcc tggtcctgtt ctatggtggg 720

gctcccttgc cagacttcag actgagaagt cagatgaagt ttcaagaaaa ggaaattggt 780

gggtgacaga gatgggtgga ggggctgggg aaaggctgtt tacttcctcc tgtctagtcg 840

gtttggtccc tttag 855

<210> 195

<211> 2268

<212> DNA

<213> 人类

<220>

<223> TBXAS1

<400> 195

gtaggagtgg aatgaatgaa tgaaggagtg ggcgcgcgcc gtgctccgga ggagggcggg 60

tgagtggagg agcttcggaa agccacacga ggtcagaggc accgaagccc tgccgtgcac 120

gccgcggaaa tgcagccccc ggggtggtcg ctgggttcct gccggagtct ggcttccacg 180

ccaccctgat cttctcctcc tcgcgtctac actgtcccga gggccgccac tccatcactt 240

gaatgggagc tcacaactct ctgggtcctc gcttttctca gcgctctctc ctatcagggc 300

ttccgctaaa cactctccag actctcccca gccgggagcc tctccaggtt tgcttctcca 360

gctgcctccc ggatgcttgg ataggatgcc ctgccatccc ctccaactta ggaagacttg 420

ttgagtctcc tcttaggcac tgtttttaaa actgtgggtc gtgacacagt aatagatcat 480

aaaataaatg cagcggaagg caaccagctt tcaaaaagaa cgaaatggaa tccaatagaa 540

aatattagag tccattgccc ttagtaaggg caactattgt ttcataaacc ttttgtttcg 600

attataggta ctggacaagt gtactggacc atgatgtcaa ttttatttcc gtctgtgaat 660

cgtgggttta aaaaagttga aaagctatct gtgtaaaata atgatctcta acactgtata 720

actttcttaa aaacaacctc gtgattttct cactacttct tatcctttcc ggtctccatc 780

ctccgttccc atccttcagt ccttcccaaa aaaggcaagc tctttcacac ttttttagtg 840

gtacatcacg acaccttcct ctgtgtgatc ttgtactctg cggtcttcct tgcccccata 900

atcaatgcta cacttcctat cccttctctt aacctaatgc cattcacgtt tgcagaatcc 960

tagactactg ttgctaaaag gacctcagag gtcatctggg ccagccctgc ccttttagag 1020

ttgaagaaat ggagtccaga gaagtaaaat ctgttgccca atgtcacaca gtattgaagc 1080

ttaggaatag gtctcgtggc tcccactcta gtgttttttg ctccacaccg gtcatttatc 1140

tccttccctt ctatcctccc tgcaatcttt aactttagtc ttggcccagg tcatcctaaa 1200

tattgccatc ttcataatac gtggttctgg ccatgccacg ctcctggcta acatcctcta 1260

aggactcaac ctctgcaggt ggggctgagt gccttggctt ttcatcaagg caggcgagtc 1320

ctgacttagc tttctaagga catgagttca gcaagtcact gcttctctag ccaaactggt 1380

ttacttgtag cccagtgcca gcttcaccca tctctgtcac tgtgcctttg cccaagcggt 1440

cactttccca cccactttcc cagaggggta ccttctccat cttctctctt taagcagatt 1500

ctacctgtgc ctggctcacc tcctccacaa aacagcccga gatagcgtgg gagtaagtca 1560

gacctaggtt caaatcctag ctcttccact taactatgtg atcttggtca aaatgcttaa 1620

cctctctgag cctcagtgtc tgtattttga ttatgagaag gagaacaata gtaatgttct 1680

ccttttgcat ctgtaaatct ctatcatagc cttcaccaca caggtatgta actccctgtt 1740

aatacatacc ctacatgcat gtctctctgc ccctttctag tgctggccat tagaacttgc 1800

tgccataatg gcagtgtagc tacttatgtc tgtggagcac atgaaatgtg gctagtatga 1860

ctgaggaact gaatttttaa ttttaataac catgggtggt tagtggctac cattttggac 1920

aaggtgtctc tagactgtaa gctcagtaag gacagaaacc atgtttttct tgttttggat 1980

tgtatgtcca ataactgcat tgcctaacgc atggtgagta ctgcacacat atttgttgaa 2040

tggatgatag ctgcaatttg ttgcatgctc ccttgtgtcc agcacaacac tacaaactcg 2100

ataaaaggca tttcatatag tcctcatcac agcctctgag gctgggttag attagagaga 2160

gagttttata tagagggcag acacatagta ggggttcaat aaaagttatt attattctaa 2220

ctcctccctc tgaccagccc cactgacttt tgtctcatct ttccttag 2268

<210> 196

<211> 602

<212> DNA

<213> 人类

<220>

<223> DOK3

<400> 196

gtgagggggc cctggagggg ctggcctggg ggagatgcag gccagaacac acaggtccct 60

gagtgttggg ctgaggagcc tgggctgcac cccaggaagg ggagagacag gttggtcttg 120

ggttgtggag agtgctgcat ggaggcccag tggggcagtg gcccctgggg ggatgccaaa 180

ggctggtgat gttcagtggc tcgtgaggtg gagaggagca ggtgaacacg agagagattt 240

cagggagaaa gaaaagcagc aagatggggt gaggcgctca aaccaggacg ccgagtggga 300

aagccaggag ttggctagag aagggtcctg ggtggaggca gggccaggga gtgtcaggcc 360

cagggtgcgc agctgcccgg ggcgggacgg gggaggggcg ggaactcatg actcggggag 420

ccagactgcg atcagacgcg cgtgcccagc tgaaccaggt gcgtgagaag gctgccttca 480

ggtggccggg ggctccctcc aggtaggtgt gggcaccttg ggcagccaga accccaggga 540

ggaaatacat gctgccccca gcccctgagc tgaagacagg ctcccctccc cccggcctgc 600

ag 602

<210> 197

<211> 14420

<212> DNA

<213> 人类

<220>

<223> ABCA1

<400> 197

agtaagcttg ggtttttcag cagcgggggg ttctctcatt ttttctttgt ggttttgagt 60

tggggattgg aggagggagg gagggaagga agctgtgttg gttttcacac agggattgat 120

ggaatctggc tcttatggac acaggactgt gtggtccgga tatggcatgt ggcttatcat 180

agagggcaga tttgcagcca ggtagaaata gtagctttgg tttgtgctac tgcccaggca 240

tgagttctga tccctaggac ctggctccga atcgcccctg agcaccccac tttttccttt 300

tgctgcagcc ctgggagcca cctggctctc caaaagcccc taatgggccc ctgtatttct 360

ggaagctgtg ggtgaagtga gttagtggcc ccactcttag agatcaatac tgggtatctt 420

ggtgtcaatc tggattcttt ccttcaggcc tggaggaata taataactga gacttgtttt 480

atttctgcag agggttctaa gccattcact tcccagatgg gccaataatg ctttgagtaa 540

tctggagatc atctttaatg cgcaggtgaa tggaactctt ccacagaggg atgtgagggc 600

tgtagagcag agtgaactcc ctgaaactca gacgtcagct ctttgtctct ctatctctga 660

acacccttcc ttagagatcc catctctagg atgcatttct ctgtagttag tttctaagtc 720

tcttgttcct gttctgcctt tatttttttt tcctggattc taagccagta tccccacttg 780

gctgtcttaa tgtagcttaa catgtctgta atcaaaatga tcatctttct gagattcaaa 840

gggctataag ggactttgga gagaatttca ttcagttttc ctcaaactag aataatgctt 900

gcactgtctg taaaagaaca aaagtgtcaa agcatccttt tgttcactaa atttcctttt 960

ttattatagt gttacttaaa tattaggaag taaaagtagg tataaacttc ttataggctg 1020

ttattataca actatatgac ccatacatat ttacaaatta agtgcagcca aaattgcaaa 1080

atcaatacca ttcaaattaa taccttaaat gtggtgaggc agctgttgtt caactgaaac 1140

caaattataa gttgcatggc agtaaatgct atcatgctga tcattttgag tttggccagt 1200

ctatattatc atgtgctaat gattgaattc tccacccatt tttctacttg tatgacctta 1260

atttgatggc acctgttcca tcctcatgag tttgctacaa ttatactggt gccaacacaa 1320

tcataaacac aaatataaac ttgggctttg aaatcttgtg ccagaacttg gctttaaagt 1380

aagcatttaa aaaatccata tgtgtttatt agactttgtt tagatgactg ttgaaatgaa 1440

aacaaagtgt ttaaaatcct cttagagaac ttaaatataa tccctcagca atatgtatac 1500

agatcttcct ttgagaaaaa ctgattgtgt tcagcctctc atgttacaaa tggggaacct 1560

gaattctgag gtctctagtg agagaacagg gactggaatc tgtggatcct atctgtttta 1620

ataataattg taaagtataa tagataatat tatattaata aaataaaagc aaacacttag 1680

aatgagcttc catgtgtgag gcactaactg attaggcatt attaactaga tttattcctt 1740

ttaaggcccc gcgatgtact gttatttcca catgttgtag ctggggaacg tgctactcag 1800

agaggttaag taacttgtct gaggtccaca ccactaacaa ggagcacagg tagggttcaa 1860

atccagataa tctgactttg gagctggcac tctaactcaa tgtgcctaat cgcttttcag 1920

tggtgtcatt attttgccta ttctccatct gagaatattg aagtttctga ctccttcctt 1980

gcctttctcc ctgcctcccg tggttatccc caggtcttgg tgttccagtc ctctatgtcc 2040

gtccttactc ttattccttt gctacagtgt gatccagggc tcctgcccct tcttatcctg 2100

gtagaggggg cccacttgct gggaaattgt ctccgccatg gtttatccat gttgtgtgtc 2160

cattagtgag tagtgggaag aatcatatca tgttggcaat gaaagggggg ctatggctct 2220

ggggtagtct agtctgaacc tcttatttta cggatgagaa agctgaggta caaagcaggg 2280

aagggatttc ttgaggtcac ccagccagca actgagctgc aaccagaagc tgagatcccc 2340

aggactaggg ccgagcctca ttctgtccca tcacagtgac ttttcttccc tcctccaaac 2400

tatttttatt ttttattttt ttgcagctgc ttagcagctt gaagttagaa gaaagggcag 2460

ggaaaaggtt ttccgtgctt agccagggaa ggaatcctgc aacaggatgt ggggttgggt 2520

cattcaaatt gggccagact ccactggtct tgttgcttct tgcttggtat tgcagatggg 2580

tttaaaagtg ttaggattag agagataggc aggtttagcc aaaggcagtt tgtagccttg 2640

tggcagagtt ctttttaaag aaggaagtgg gatgcaacac cctgacacaa aggggcttaa 2700

gttgttatac cactgcctgc taacctgttt tccttaactc tcttcctgat ttctaaagga 2760

agtatatttt gctgaatcag aaagaaaagt gatttatttc aggttgctga tgcttagatt 2820

gttagagttg gaaagatctg gcttgcatct tgtacagctg acagaactgg ggctcagggg 2880

ggcacaggtg cccagagttg gtcagtcagg aaagtagcac cagaaccagt ctcctggtgg 2940

ccctacagtt gcagaccctt ttttgctttg ctctctgtgt atactaaagc ttctatgtct 3000

ctgaatctca agttctgact ggtagctact ttccaatcca cctggcttag atttctagat 3060

tatattgttt agacgtcaga acctcttaag ggttttgggg ccacttgtta gctcacatag 3120

tgagaaccag ccctgcccat taggtagggg aagaagttag cagtccatga tagctgttgc 3180

ctgcagcgta tggatgttca ttgcacagtt cctgtctcct gagatcctgg agtgtatacg 3240

cttggcctca gagcccagca cagagcctgg cccttgggac atgcttagta agtatttact 3300

gaatgagtgg gaaatgtctt aaggcccatt agtttgcagg tcttgaggag gctcccttgc 3360

actaggaaga atagaaagca tacataaagc ctgtgtgctg ccgccaggaa gactagaaac 3420

gctatgttca gcctggagct gaatggtata ccccagagca accctgttga aaggcagtgc 3480

ttgccttttc attctgtgtc ctggtttgct ggtaactcct gggtcccctg cctctcctgt 3540

acccccattg tgcagactga ggggggacca tcagccaggg ttagttttcc gctgtttctg 3600

ttaggcaaag aataaattga attgagttgt gaaagttggg tgcaaagctc agtttgggtc 3660

caaagtaaca gttaacttgt gtgggtggca ggtattcagt acaaacaggg ctggggacag 3720

gaaggggaag agaacttcag agctttcacg atcctcatct ggttttaggc tgatccagag 3780

gccaaggtcc ccatggaaca aactggacaa agtgagggtg gccacatggc ctcttttctt 3840

ttgcctttat tattaatttt ctcaaataga tctgactagt catgtggctg ggaaaatagt 3900

taattgtgat tttttttttt ttaaactgag tctcactcta ttgcccaggc tggagtgcag 3960

tggtatgatc tcagctcgcc gcaacctctg cctcccggga tcaagcaatt gtcatgcctc 4020

agcctcccgg gtagctggga ttatgggcac acagcaccac gcctggctaa tttttgtatt 4080

tttagtagag acatggtttt agcatgttgg ccaggctggt cttgaactcc tgacctcaag 4140

tgatccaccc acctcagcct tccaatctgc tgggattaca ggcatgagcc actgcaccca 4200

gccagagtac cactatttgg gcattcttta atgaaaaaga atgaactatc caaaaattaa 4260

aactcctcat ttatgagctt ttagagaatt ttacagagta gatggaaact ctctgcatcc 4320

tttccccact tctagtttca cctgacacat ttcttccctg tccttactcc tgggccggca 4380

gcagtggtca tgattccaat cccagcttgg ccaccatctg cctcagtggc ctaggaaaac 4440

tcctttctcc agagctttag ttttctcttc tacggaatga agaaagttaa aacaaataga 4500

catttattgt ttcatttgga taaatatcta ttaagcatct attacttgtg gtatggttag 4560

ctgggtatat agtggtgaag cagctgggca tgagtactgc tttcgtagag cttacagttc 4620

agtgaggcca gcagatgtga aacatatcat cacacaaata aaaatataac tatcaactgt 4680

gatgaggatt atgaaggaaa aaatccggca aactatggta ctggtgttag atactagcag 4740

gtgtgggtag ggatttcatt tagattgaca ggttgtcaca ttaaagctga gagccctgaa 4800

gttcaagcaa tggttagcca ggcaaagatc agaggcttag agatagggaa atccattcca 4860

ggcagagaga ctgggggtgc ctgtccccta ggtcagggaa cagaagaaag ccagtggcac 4920

tggtggagtg aataagactg gcgggggatg agttggtagt agacatgacc agatcattta 4980

gggccaattc tcctggggaa ggagaattta atttaatatt tatttattta tttatttatt 5040

tatttattta tttatttatt tatttttcaa gacggagtct agttctgtcg cccaggctgg 5100

agtgcagtgg agcaatctcg gctcactgca acttttgcct cctggtttca agcgattctc 5160

ctgcctcagc ctcctagtag ctgggattac agacgcccac caccatgccc agctaatttt 5220

tgtattttta tagagatgcg gtttcaccat attggccagg ctggtctgaa actcctgacc 5280

ttgtgatcct cctacctcgg cttcccaaag tgctgggatt acaggcgtga cccacagtgc 5340

cccctgagaa tttaatttta ttttatgtgc aagaggattc cctgaggtag tcaggccaca 5400

ttgtctggtg actcttggga tagagggaac ttgaatgaca aaggcccaag aaagcaattg 5460

taatcattac atatacatgg accattttat gctgttttct tctttcattt aacattattt 5520

agtgtgcgtg ttcacatatt tctaaatcat cttctgattt agaataatga tttctgatgt 5580

gtaggctgtg ttttatagtt ttgaaagtaa tactttgata tccattactt tcttgattct 5640

cacagcaatt ctgaggtgta tgcgttgcaa tttctgtttc acagatgaag agagtattgt 5700

taataagtta atggccgggc atggtggctc acacctataa ttccagcact ttgggagacc 5760

aaggtgggcg gatcacttga ggccaggaat ttgagaccag cctggtcaat gtggtgacac 5820

ccatctctac taaaaataca aaaattagcc aggcgtggta gcacttgcct gtaatcccag 5880

ctatttggga gggtgaggca ggagaatttg cttgaacctg gcaggtggaa gttgcagtga 5940

gccaagattg caccactgta ctcctgcctg ggtgacagag cgagactctg tctcaaaaaa 6000

taaaaagttg ctaagaggag ggctgggatc ttttggctcc aaatctactg tgggatgatg 6060

cctttgacat tcctgatagc tgtgcagtaa tccattaaca cagtttttat aagttcaaac 6120

cctgttgcca acatttagat tgttccatgt gtgctgttac aaataaatta ctataaagat 6180

tctatacatt taatctttta ttatttttgt attatttctg taggccaaaa tctgaggaac 6240

aggattacta ggttgaaggg aaatggccct tgaagtgtct gatcagatgt ctttccagag 6300

gatccaacca atttaaatag ccaccatcaa tgcatgagac tttgtagttc agggaaggca 6360

ggcctggttt taaaaatcat ttcccctctc tagcattttt ctgatgtgat ccttaagatt 6420

tcactttagt tttcccaggt ctcattggca tgtatgctgt tagggatggg tctaaaatta 6480

atttttcttc acattcatat catgtcatcc cagtgattat ttaataaata atcacttgat 6540

taaatagtga ttccttttct agttattttt gggacattta ttaaaacctg gatatggtgg 6600

ctcatgcctg tattcccagc actttgggag gctgaggtgg ggggattgct tgagactagg 6660

agttcaacac cagcctgggc agcatagcaa gactccatct ctataaaaat aaggaaatta 6720

gtcaggcatg gtggtacttg cctggagtcc cagctacttg gaaggctgag gtaggagaat 6780

tgcttgagtc caggtggtca aggctgcagt gagctatgac catactactg tactccagcc 6840

tgggcaacag agtgaaactc tgtctgaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6900

aaagatgtgt agggagcaat tttggagtta ttcatttggt catttgatat gtagttttag 6960

ttttggtgct gatagagccc agaatgtacc ctgaatttga tgaacattct gatatatggg 7020

ggagctcatt gtcccccact tacctttttg cctctcagaa tatcttttga tatttttatc 7080

tgttttttcc ccattgaatg ttattacctt atcaagctca aaaaagtacc ctatcgctat 7140

tttaagttca gttgtgttaa atctataaat tagcttggga aatttggata ttaaatgaac 7200

tcatgaagaa gcagagttta gctctcctta attctcatct tcctttattt atcctactac 7260

agttctgtgg ttttctttta tgtaagaagc acatgtttgg ctaagttaat gcctaggttt 7320

ttttgtttat gtgtccattc tcactgtgga tagtattctc ttttccccac attatattaa 7380

tttaactggt tttcagagac taatagcaat gctattattt aggagaattt accttggttc 7440

tgattaactt acccatactt gcaaatcatt tgcagctttt tagttaactt tgtgagttct 7500

cttagattta cgaccatgcc agaaacagaa aggatatttt catctcttcc tttctgatgt 7560

ttattcttct tgtttccttt ttttatcccc cattatattc tcaagaatct ctcaatacta 7620

agaaatagcg acttcatttt tcagcgcgga gtgcattatt ttggctacca tgattcagaa 7680

gcctcttgcc taaggcccaa ttttattctg ctagttttct ctgttctttg tacatggccc 7740

ttgcgctgcc ctaaccttga attaacgtgg ctaaatctca agaatttaag agcaccgtga 7800

ctgtgtcctc aggctaggga gggaaatggg ttcacagagt gactggattg tggtctatga 7860

acttcggcag ccagcagcaa aagtcaggca tgaataatca agtggacagt gaacatctgt 7920

agtgtgggag atgttggcat aactatgaat gatgattcaa gagtggtttg atgcatattg 7980

aataacatga tgataagtac tagactctgt gctaagcctt ctatgtgaaa tacatttaat 8040

tctcataata actctagagc agtggttctc gaccggggcc ggttatcccc ctaccccacc 8100

ccaccctcac ccttccacca gggacataac atctggagat atttttggtt gtcacaatcc 8160

tgggaatgta tgtgctgata tttagaggtt gaggtcaggg atgctgctga acttcgtaga 8220

attcatagga gagtctctca caacacctat ctggccccaa atgtcagtag ggtcactatc 8280

aagaaaatct gctctagcag tgcctgctca tattatcccc atgttgaaat agcaagatgg 8340

gaagtgcaaa gtggtgcttc ggtactcttg gagcagcttt gactttggtg agaaacgcct 8400

tttaaaaaca atgtttcttc ccatcttccc accccatggg gaggtgtggg gttgggtggg 8460

taggcaccaa agcaagattt agaagagttt tctgtaggaa tttataatgg taaaggatca 8520

acttcatttc caagctattt atgagggttt atgtttagga aaagtgctaa gcttagagaa 8580

ggaggagaaa tctgatttta ttaatgagtg tagccataat ggcatatcct ggcagaagtc 8640

aactttggtt tctagaggga ggctattatg aaaagaaata cctggaacat tcccctgggt 8700

ttggaaggtg agttctaggt tcaatgatgg gaagaatttt agaggtccaa gataaaaggg 8760

caaagattaa attttgtctc tcatgagttc tctggctcag gtggtgtgaa ctttgcagac 8820

agtctcttta attcactcat acatgctagt ctcccagctc agcaagggct ttgagagagc 8880

aggtgtctgt atgctctggt aagtgaaggc aaagtgcata aggaggttgg ggtccataat 8940

ggcgaagaga aggagccctt cagtcagagt ggctttgaat cttggctctg ccatttgcca 9000

atcttggacc attgggcagt gtattaactc tttgaatctc agcttcctct tctgtaaaat 9060

gtgtataaca agagtactaa ttggattgtt tgatgattaa atgagttaat gtgtataaag 9120

cactcacaac cctggtacat agtaagacct ttcattatta ttatcatcat caattttttt 9180

taacctcttt tcctgatctg cttacactca ccagcttcag ctgctccaaa tggcttgtaa 9240

gattttttgt ttgccctttg ctgtcagttg ccatggggaa gatccattca tttttttcag 9300

tcaaccaaca tattttgagc atctgctgcc ctacaggatc ctagatatgg gggctgcaga 9360

gatatccagg aacataagcc ttgattaatt gggtcagatc agtgctcagc agggctggca 9420

agtgctaggt ttcttttaag tggcatatct taaaaggtat atgtcctaaa catagctttg 9480

tgatggcagc atgatgggta caaaagcaca cacttaagtg tcagtagatc tgggttcaaa 9540

cattggtgca gtttcttatg gctcgtaact tgttcaaacc tcagtttctt cacttctaaa 9600

acggtaatga tacaacctac ctcacagggt tattatgaat taaatactgg agatgagata 9660

cacaaaacgt cttgagtaca cagtagctgc ccaatattgg ctgtaagtat tataaatcta 9720

caagctgtga attaatttta cctctctgga tcctgttgat atttctagac cattccacct 9780

agtggggcca tttcctacct gagtcacccg tggtgtcaaa tagaatgtca tgtggcctcc 9840

tgagttgggt agaattggct gctcatctca accccgctac tgactatctc tgtgatttac 9900

ccttcctcca gccttagcct tgctacatat aaaatcaaga caataatgtt tcctatctca 9960

cagggttgtc ctgaggatta aattaagtaa ttaatataaa atgtgccttg tacatattgg 10020

gccctaaata aacagtagct actatttatc cttaaagtac aaatggtagt ttcagagctt 10080

caaggctgat ggctatttat cttactcata ctctttgttt agcttcattt ttttccccta 10140

atttcattag tattttcttt tctttttttt tttttttttt tttttttttt tttgaggtga 10200

agtctcactc tgttgcccag gctggagtgc aatggagcga tcttggctca ccccaacctc 10260

tgtctcctgg gttcaaacag ttctcctgcc tcagcctccc gagtagctgg gattacaggc 10320

tcccgccacc atgcccagct atttttttgt attttcagta gagatggggt ttcacccttt 10380

tgaccaggct ggtcttgaac tcctgacctc atgatcaacc cacctcagcc tcccaaagtg 10440

ctgggattac aggtgtgagc caccacgccc ggcctcataa gtattttcta aatttattta 10500

cagtcatgcc atttaaaagg aaagttgtat tcctgtcttt gttaatattt ataagtgatt 10560

ttattcagct acaagcttgg aatggcatat aattttgtat tctgcttttt tcacttaata 10620

ttacatggct aatgatttct gtgtttcata aacattattc tgatgatggc atgatatatt 10680

gttgagtaca tgtaccataa ttgaatcatt tccctattgc tatgcaatta agttgtttcc 10740

aatattttgc aattataatg tttcaatgaa tgaataactt tatgcatata gctttttgat 10800

atcttaagtt cagtttccta ggatgaattt ccaggaatag taattgggca aatgggataa 10860

acatgactct tgaatacgta ttgttaacat tgctttccca aagggctcaa ctgatttata 10920

tttccgtgtt cattatcttt taaaccagct catttactca ccaaacattt ttaaagccat 10980

tatcatgtgg taggcttagt aagaagaaag tgaccctaag ggagaagctt atatataaat 11040

agggtccctg gtgtaccaag tgctgataca gacacaaagt acctggggaa attgagatga 11100

gggagtcctg gctcagctgg gagaaaagtt cattttcata gagtcatggt tttgttcttt 11160

ggcagaaaga aaattgcttt cttccccacc cccaccccca gctttattga ggtataattg 11220

acaaataaaa attgtatatc tttaagatat gcaatgtgat atatatgtat atctcaactt 11280

aaaaaataag ctacagaata aaaaggtgtt tgctattaaa aaaaaagaaa aggctgaatg 11340

tcattcccaa gcttggaaat ttgagtatgt tgcctctttg ggattattta cagaaatatt 11400

agcaagacca gccccatctt tggtcttgag tactccactg tcagcatgct ttcttccaga 11460

gagggatcca tttgccttta tttttcattc tgttgtgccg tctatgcaaa ctattcttga 11520

tagttttatg gtaacagtgt ttttttgttc catgagataa tttatacatg ctcattgtgg 11580

aaaatttaga aaagacagga aagtattaaa aacatcactt tttttttttt tttttttttt 11640

ttttttttaa gagacagagt cttgctctgt cgcccaggcc ggagtgcagt ggcgtgatct 11700

cagctcacag caacctccgc ttcccaggtt taagtgattc tcctgcctca gcctcccaag 11760

tagctgggag tacaggcatg caccaccacg cccggctaat tttgtatttt tagtagagat 11820

ggggtttcac catgttggcc aggctggtct caaactcctg acctcaggtg atccgcctgc 11880

cttggcctcg caaagttctg ggattatagg caggagccac tgcgccagcc acacctacgt 11940

tcttatcatc ctagtacatc cactgtcatt atcttgctgt atttccttct gcccagtctc 12000

actctgatca tgcagtggcg tgatcatgca gtgatctcgg ctcactgcaa cctaggcctt 12060

ctgggttcga gtgattctcc tgccttagcc tcctgggttc aagtgattct cttgccttgg 12120

cctcccaagt agctgggatt acaggcatac acccccatgc ccatctaatt tttgtatttt 12180

tagtagacac agcgtttcac taaaattttg tatttttagt agagatgggg tttcaccatg 12240

ttggccaggc tggtctccaa ctcctgacct caggtgatcc gcctgccttg gcctcacaaa 12300

gtgattacag gcatgagcca ctgcatccat cgccaaaaag attttttaaa agagtttaat 12360

gtagaaccat atcaaaggtc tttggaaata aaaaacagtt ttttaaaaat atcagaaata 12420

aaacaacaaa taaataaata aataaaaaca cccaaaacaa tctgaagcac gagcacctag 12480

cagaaaggtt caattatgat ctattcatag agtggaatat caagtagaca ttacaggaca 12540

tgttttaaga ttatatttta tgtcatggga aatgctctcc cagtatgatg ttaaatgaaa 12600

aaacagaata caaaagtata tatgctgcat agtctcaata ttgtagagaa aaaatattat 12660

ttatgtatgc atgaaaaaag acaaaagatg ttaacagaga tccattgtta cttcagttta 12720

ctagggattg tctctgggag gtaggattaa ggtgatttat atttaccttt ttaaactttt 12780

ctgtattttt ttattttcaa attttccata aaaatataag gacttgaaga tcaagaaaaa 12840

atttctgctt tggctcagtg cagtggctca cgcctgtaat cccagcagtt tgggagccct 12900

aggggagagg atcacttgaa cccaagagtt tgacgttcca gtgagctatg atctccggat 12960

cgtaccgcct ggacgatgga gcaagaccct gtctcaaaaa aaaaaatctt tgcttttttt 13020

ttttgtttgt ttttgagacg gagtctctct ctgttgcccc agctggagta cagtggcaca 13080

atctcagctc accgcaacct ctgcctcctg ggttcaagcg attctcttgc ctcagcctcc 13140

caagtacctg ggattccatg cacccaccac tatgcccagc tacttttttg tattttcagt 13200

agagacaggg tttcaccatg ttggccaggc tggtctcgaa ttcctgacct cagctgatcc 13260

accggccttg gcctcccaaa gtgctgggat tacaggcatg agccactgtg cccagcccaa 13320

tcttttgctt tttttaaaaa aagaagacaa aaagggattt tataccagta ttatcttggc 13380

tgtgtgactc tgaagccaca gttgtaagtt ataattactc tgaaacacaa ggccctgtga 13440

ctcttttggg ctctttggtg tttatcttga ttacaacgtt ggaatataga aatgaaagga 13500

atgggagagg tgatagactt caggcagtgt aactagttgt ctgaacacta ctggctcaat 13560

tatattgtgt ctagtgattt ccatcttgtc cgtctgctaa tttatcgcct ggtaactcac 13620

tgaggcaggg ttttcctttg gagaaacctc attgttttaa ccagtgtatc atgcttgttt 13680

agaagttcaa tgatcttttt aactcatcgg agaagatgat gaccagacct ggacagatgg 13740

ggaaggactt tgcactctct ctttacagtc ctgagtgcac acaggtcaat atggaactat 13800

gtgtgaattt tcattgtctt tgagagccct cttctctgcc ccatagggag cagctttgtg 13860

tgcaattaga ggagcaaggg ttgtgtgtat ttagcacagc aggttggcct ggtcctctcc 13920

tctcaacata gtcaccacat acctggcact atgctaaggc tgggaatgca gacagatggg 13980

tgcctgcttt cagagtgctc aatgtgctga ggaagccagc aacagaaaca gatgatttca 14040

ggagctccag gaaaatgcta caggaggagt gtgcctgggt tactggagta gcacaggagg 14100

agggcttcta gctcaggctg agattttagt aaaggaaatt atgccacgat gaatcctgaa 14160

gaatgaatag aagtgaacca gataaagcac gataggaagc atcttccctt acctaaggga 14220

agacacagag gtatatggaa tggtatgtta aaaggttggg actccaaaca gttctgttaa 14280

agcttagaga gtggtgggag agactggaga agttgattaa ttagtaaatg aagttgtctg 14340

tggatttccc agatcccagt ggcattggat atccatatta tttttaaatt tacagtgttc 14400

tatcttattt cccactcagt 14420

<210> 198

<211> 1448

<212> DNA

<213> 人类

<220>

<223> TMEM195

<400> 198

gtgagacttt attggaagag gctactctta ttcttgctgc tttcttaata aatggtaagg 60

tcaatctcct tagggttttg ttcactttca ttattcaaat gattacattc taataataat 120

aattcagttt cttaaaggcg tgaagcaaaa gtagaatttc cacttgaatt ttcttacaat 180

ccatagccat cttcacctgt aaattccctc ttttatatgt cactccagaa tatgacaaaa 240

acaaaagttt aaagttttcc tggactccat ggcattgtaa atgtagctat tggaagctca 300

atgacaaata gttacaccac atcagtaaac tttgtaacaa tttcattttt aaatctttca 360

cttgtccacc ccttccaggg aaactatttc ctctttcatt tggtagagta gttcagcaga 420

atgaaggata tgcagcttga ccaggtccag ctctgacttc ctaagtttga atttgaccca 480

agttttcttt gaaactctga agtgctcaga ggcacatttc acttctggtt cctggctatg 540

attggaagtg gaaatatcca gaattagaac ttgaatactg aagttcccca ccctatcaaa 600

gttattccta caacactcac tagttcatgg cagaaataga aaaaaaatga catcatagaa 660

tatgttattg agagttcagt ttagaaagct tcaaaactca tgattagctt ccaaatgagt 720

aaaatccgta tctttttcaa gattagatat tacactttct ttctgagttt ttaagttaaa 780

aaaagtggca ctgatatctt cataaattat tattgtttat actgcaatat caaaccaaat 840

tcaatgctcc atcaccaata gtggagcttt caaaacatct cttattatgt gaaacaaaaa 900

tcaaaaccaa atgaataaaa tctgaatcat gttttaagca aacatgtaaa attaccatat 960

tctctaaaat tctaagcaga aaattgtctc tactctttga atttcatcat tagaaatagt 1020

tctggtaagt ctaatatgaa aaattagaat tatgtgcatc tttaaggaaa gcctcttgaa 1080

gtgggtctaa attatacatg tagagacaat agacctctaa ttatctacct tattctaaat 1140

gtatttttta aactaatttg gaagatgttc ctcttaatct tataatatta taattatcgt 1200

ggttatatct atgattacat ttcatattca aattggatga tagaatttga gcacatgttt 1260

agtgtatgtc taaaataatt agacttcttt accactgtgt aggaagtaat cctctaaaat 1320

gagtgtctac catctcctgc agggcttccc aaatctgggc ctttcaattc tgaaatgact 1380

aatcaggaaa tgtaaaataa tttcatatgg aacataatag catctctttt ctgcaacttc 1440

ctttccag 1448

<210> 199

<211> 3633

<212> DNA

<213> 人类

<220>

<223> TLR4

<400> 199

gtatgtggct ggagtcagct cctctgaact ttccctcact tctgcccaga acttctcact 60

gtgtgccctg gtttgtttat ttttgcaaaa aaaaaaaaga gttaaattac cttaaagact 120

caagaagcca cagagatcaa ataattcatt gttacagggc actagaggca gccattgggg 180

gtttgttcca tttggaaatt ttgagtgcta acaggggcat gagataacat agatctgctt 240

aaggtccctg ctctgctacc ttgtggctct gtgaagaaat tatcaaacct gtctgagact 300

agttttcgca tctgtaagag aattataata ccttcttcac tagagagtaa gcagactgct 360

tcagtgtcat ttcttcccac tggtggtctt tacactcagc ttcaagcagt caccctgctc 420

ctttcaatct caggaaaaag atggcttttg tgtgtgtgtc tctagagaaa gaactttcta 480

agtgggtgtc agacttctgt atgcagtaat atagtttagt ccagaggatg aaaaaaataa 540

gagaatgaaa aaggaaaaga gagagagaga gaagaaaaaa gcaagaggga aatatgtata 600

atgtcagcta atgcaacagt ttctttctta gtgaaatacc aatcagctgg ttggtaatct 660

tattcatgat ggatctcttt tgtttttccc ctgcgcagac ttcacagttg ctttagaaac 720

ccatagtaga gccgaacagc taagaaaatg atttacagtg aggcagggtc agaaactcaa 780

gagagaaaaa gccagctgca gtcctgaagt tgaggatata ggagaaaatc aagtaatatt 840

tagcaaagac taattcatta tcttgaagcc atcccttccc tcaattccct gcccatagtc 900

ctcctccttg tcctcttctc tgtatccctc tgctgttagg ttaatggaga tagattttct 960

aattaggctc actgcgagat aaaaccacag ccaaacttga cttcttttcc ccatgtacct 1020

tttcctgtca gtccctgaag cctgtccatc cctgcccatc cccttagttc cactgtaagg 1080

caggccctca tttcccctgg cattgactct tacacactaa ctgctttcct gattccagtc 1140

ttcttccttt aattcattct gcacgttctt gtttgttatg tacttgcatt tgttgttatt 1200

atttttcctt aggcttcaat ctaacaaatt actctcctta aaaactttta ataactctcc 1260

attgccatta gaacagcttt ctaccacagg gcctttgcac tggctatttc ttctacctag 1320

aatgctagat cagtgctatc cattggcaat attatgtgag ccacatatgt acttttaaag 1380

tttttagtag cctcattaaa aaaagaaaca agtgaattta atttcgataa tagttttatt 1440

taacttagcg tatttaaaat aatgtttaaa attttaatat atatttacct attattgata 1500

tttttacatt ccttgtttgg tactaagtct ggaatttagt atatgtttta catttaccac 1560

acttctcaat ttacactatt cacatttctt gtgtttgata actgtgtatg gctagtgact 1620

accgtattgg tcagtgcagc ccaagtcctt ttcatgcttt aatcactcca ttcagatctc 1680

tgattaaatg tcccctcctc agggcagtct tccttgattg ccccatgtag agctctccag 1740

cctcacttat ttgcctcaaa tccccttata ctgcttaata tttttttttc tagagcacaa 1800

cattttatat ttttgtttgt ttattttctc tctctccctt tgtaatggaa tcggtaagga 1860

ggcaggatca ttgctggttt tatttaccac tatatttcca gtggccagca cacagtagcc 1920

gctagatgtg taagtgataa atgattgaaa taattgctgc aggacaaagt ctgaggccct 1980

cctgatctgg cttgccctct tacttagatt tcaccactcc caccactcac cagctaatct 2040

gagtttgttt tccactcttt acgtgctcac gttgtcctct ccttaggaca tgtttttctt 2100

cccctttcca catatctaaa ccttactcat cttccaagac ccactttaaa atcttccttt 2160

tctgggaagc ctttcctgaa tccagacttg atctctgctt tctctgaacc acagggcata 2220

ttttctaagc ctattttatg gccccttgag atagtgttag ctttgctcct atctaaactc 2280

ttactctaga ctgtgagtcc attgaagtct ggagctgcat catatttttc tttgtaatgc 2340

ccacagcact tggcaggaaa tgcctacaat ttggacttaa gtaaaccttc atttaatcag 2400

ttattcaatc agttagtgat tcagcaaata tttattgagc accaaccatt tgccagacac 2460

cattctgagt gctggagaca aagcagtggg caaacccatc aaacttgcaa tggaatacag 2520

gagatgaaca atacgatgag aacaatcaga tagacaacat aatgttagat ggttgtgctt 2580

cccgtgaaag ggaataaaag agggcaaaga aagagtgcct ggcactgttt ctattagaca 2640

atattgtctt tgaggctcca tggcttgcaa catttaagca gacatacgaa tgaagatctg 2700

catgtttgaa ctctgacttt gcgcatatta cttcatttct ttgaatttcc attttcctca 2760

tctttaaatg cttatttgaa gattaagtga aagtatataa caaacaagaa ctatgcaggc 2820

atatggtaag ggattaatga tagatgataa taattaatgt tgacatctat tgatcactta 2880

tactgtagcg ggcttttaaa taaactcttt aaacacctta tctcatttaa tccttcaaac 2940

attctattgg tttcaaacaa cagaaaacta caattagctg gcttctgcaa ggaattttgt 3000

tggaggaaat gagagcattc agaaattaga tgggagcgtt agagaattag gcttacaaag 3060

aatgtgggaa agtaggctag aaagcagtgt aaaaacaaag acagcataaa gcacttgacc 3120

ttatttacta ggttccacca tgggaatcca tgcactctaa agatttcccc ctatttctac 3180

atcactttgc tcaagggtca atgagccaag aaaaagaatg cagttgtcaa aatctgggcc 3240

atgactaagg aaggtctgga catcttgact gccagacagt ctccccaatg atatggagta 3300

tttaaaatga tactggatat tttatttatt ttttgtattt tcaactttta agttcagagg 3360

cacatgtgca gagcatgcag gtttattaca taagtaaatg tgtgccatgg tgatttgctg 3420

catagatcat gaaaatatgg aacgcatcat ggatttgtgt gtcatccttg tgcaggggcc 3480

atgctcatct tctctgtatc cttccaattt tagtgtatgt gctactgcag caagcacgat 3540

attggatatt ttattaccta cattttacat atgataaaat gaggctcact gaggtttttc 3600

ttttgttcgt tttattttgt tttgttttta aag 3633

<210> 200

<211> 422

<212> DNA

<213> 人类

<220>

<223> MR1

<400> 200

gtaagtgttt tgagcttatt gtgctgggtg ctagagtagc agggaggaca gacctaagtt 60

gaagattacg ggacaatcta agtgacacct gctatctcag acagagactt cagcatcata 120

gggagccaga gcagggagtt ccaagccgtg ggaactgtga ctctttctta ctgaccctta 180

agcaaaattc taagctccag ggaagcagag gcagcagctt gagctccctg attgaccaga 240

tatgattaat ctttgtttct ctgtgctttg aacatgacta tgctccataa atatttaaaa 300

attgggaata gggtgaagat agatacacca aaaggagcaa gcagtgtctg aaaccagcaa 360

agacttaaaa gttaccgaag aaggtgttca tgctttcatt ttatcttttt tttttaacct 420

ag 422

<210> 201

<211> 393

<212> DNA

<213> 人类

<220>

<223> FCGR1A (CD64)

<400> 201

gtaagttgga ctcagagggg acagttagaa gggtacaggc tgtggctgtt gtgagtcaag 60

agttttgtct tcctgtggta actctgggta gaactcatga gtatgaagca acttgtatct 120

gtgcttccat ggtttattag agcttatttt atgaaaagga tgggaagggc aaccctgagg 180

tagcattaag cctggacgca ccgcagtgaa gtttccttga taaccacctg tagcttgttc 240

agttctgtta gtactggatt ttgagaaaga gaaatagaaa ctcaagagat ctgagttgat 300

ccctcagagt ctacattaat tctgtctccc caattctctc ttcctcatta ttttccttgg 360

accaactgat atctttattc tctgatctct tgc 393

<210> 202

<211> 1273

<212> DNA

<213> 人类

<220>

<223> CSF3R

<400> 202

gtgagtaggg gatccctaga gaggggctga gccttgggct tgatggagag ctggaatcct 60

ggggccactc cccacagctc tgccaagtgt tcatgtccgg ggtcctaggc ctggggcccg 120

ggattcgtcc tttggaaccc cagccctgga cactgagtct cttttcacag gatgccccta 180

cttttggggg tattgcacca gggaagtcac tcacagccaa gtatctcctt ggggacactg 240

agctgggctg gggacaggca taatcattct cccctcccca tgcctctgtc tctcaggacg 300

tgtgtgtctg tgagttccag ccgcgcaacc cctccccgtc tgggtctcta tttcactctc 360

tgtttccatc tttcctcctc agcttctctc tggcttgcta tctctctgag tttctctgtc 420

tcgcatattt cctgctatct cttgaatctt aaactctcgg taacagacgc ttcccgggct 480

ccaggcctcc gagtgccccc cccccgccca ctctctgggt cggcgtacat tgggcccttt 540

ttctctgtct ctcgatatct ctctggcctc aatcgtcctc ttggcgagtc tctctgtcgt 600

ttcagtctgt gtggatttca gtcaccgcct cactctgtca ctcttcctgt tgctctctct 660

ttttctttat ctgcagcata tctggaaatg cctctcccct ctgtttattc ccagccccct 720

cctccctccc cacccttccc acagaaagaa tctcgaggtg agagtagaaa cagcaaggga 780

gcgaggggtg tgaagtgggg aagagagtgt gaggggagag ggctgagcgt gatgagggag 840

aaacagaaag agggaatgtg aaggcagcca gcccaggaga catcgagctg tgctgggcca 900

caggagtgag cacctgcaga gcccagcaga gatggccgca gtgacaggag ggccaggggg 960

cccaggagtt aggaggagag gatccagaaa gggggctttg gaactgcgca gtgtggcaca 1020

gacaaaagca aggtggcagt cctgggaggt gtgaccacac aggctgtgag ggaggcaggg 1080

gtgaggggaa aactgaactg tgctggattc tgtgagctgc tgacctgcta tttatggctc 1140

gtgaaaataa cctatggttg ctgagtgcca actccatgca aggcacaggg ctaaatgcct 1200

ttaccaaaat aatctcattt catcctcaca acaacgctga ggagtgagtg ctaatgttat 1260

ttctttccca cag 1273

<210> 203

<211> 29639

<212> DNA

<213> 人类

<220>

<223> FGD4

<400> 203

gtaagtggtt tcattttcta gtagatatat ttttttcttc cccagcgtgg gtcactttat 60

aacactgcat gccgagggat gtaaaagtgg cagagtttgg ttttctttta aagttaataa 120

agctcacatt ggttttcaag ttcaagatta aaatatgtgc tattgatggg ttttggctct 180

ccaggaggct tcttctgggc taaccagata caaatgagtt tgatagttaa gtttctctgg 240

cttattttta ttatcataag taaagtttgg aaatttggtc attgagggga gaaatataga 300

gaaagaaagg aacagttttc tctttttcct cccatttctg gtgtgaacaa atgttaagaa 360

atatttacca ctaatcattt ttctagtgct actgcacgga gcattgttct gttaaaacaa 420

acaaaaattc ccaccatccc agtcttgttt tggtgaagtt caggggagta agtattattt 480

gtttttctgt aaaagacaac attgtagaga taggcatgag tttgtttttt aaaaattgtt 540

agtggtagta gtattaagcc actgtggtct ctttgagtgt tgtagagagc atattaatga 600

gaaattgagt ctttgaaata gaaatgtaat tcaactgtgt gatagaaatg taatcatgtg 660

acgggaaatg tctgctaaaa atatttttaa tcactgaaat gggttcattt tgtttatttt 720

cccattcgtt tttgactgga tataagcctc actgaaaaat gtccacactg ctgaacaaga 780

taaactacaa cttagaaccg gcagccttca cagttaccag tattctttct gatggtggtg 840

tggctctttc cttccttaag tgtcaggggc atacgctgag tgtggaagcc caaggttggg 900

gttggtgaca gcactgcctc aggagagctg aggcgccact cctgcagctg cacagctggc 960

tccgttccca ggttctagta gctgcgggag ggttaagcag cccagtccat gcctgcccct 1020

gctccctcca tcactcaggc agaagcctga attcttttgc aggcgttcca ccactcttgc 1080

ataaagtttg gaggtcttgt gatctctcca aaatttacca tcatactcta aatatgaaat 1140

taaaaaaaaa aaaagaaatg cagcaaaagg gaagtgtttt ctcaccccaa gcagtgaagt 1200

tttaggttct ctttttcctg aaatagcttc tgtccattct catttatctt caaacagtta 1260

gagatgattg gagagacagt attccctcct ggaaggcagc tcttaattag agaggaaaat 1320

atttctagaa caggaagatg aagcttgaga ggtgaatgtt gataaacata gagaacttgt 1380

tggctcttgt tttctgcttt aatggacagc accctttaga gagtggccac tacaacaata 1440

tggactttat aagttccttt ttaggttttt aaactgagaa gacagtaata tagcacttcc 1500

tgcctacact actggataat tttgttaaat catctaagaa aaattgtaaa tatgcatatt 1560

tagtgcacat gttattttat aacagttttt tttttttaat gacctgaaaa aacttctctt 1620

tctaaagctt acgctttcag gcaaactcct ttcacatgaa agaaatgaaa tatgatagag 1680

tatgatgaat gactcaatag gaaatattat gcagttcttt ggaagaatga taacttggtg 1740

ttcctttaat aaacatccaa atgtacatgt aacctaaact gcaaactagg attaagattt 1800

aaatttaatc agttcttctt agatactaga atagacttga ggaggtcaag agtagatagg 1860

agactcctgg aataatccag ggaaaagttg aagtcattta tttcaaaaat aaaaaggtat 1920

tttcttagat gttttgtgga ccatccctgc ccacttcctg agccaccttc tgataacctt 1980

tactgtaggc acctgttttc tttataaaat aacaagctaa tttttattgg ctaaagtaca 2040

tttgtaaatg tcttcaccct ggtttgtgtg tgttctctga tttatctccc accacagcac 2100

ctgctaagct ctggctagaa cagatccttc catttttatt ccctggcgaa ttgacacaag 2160

ttagttggtt atacgttgaa gcaggcagaa ggaaaacact taggagaaga aaaatagtgt 2220

taatcgtaga atttggtcat tctacatggt ggttattata ataaaacttg gcctggggaa 2280

aatgagtctt tcaccctctt agagaataag tacacacaaa tacattttta aaacatttaa 2340

acaaacaaac aaaaaagact gtgtcactgt ggtcttgtct tttccatgcc attataaagc 2400

agttatttct tttttttctc tctctctttt cttttttttt tttgagacag agtctcgctc 2460

tgtcacccag gctggagtgc agtggcgcta agctccacct ccggggttca caccattctc 2520

ctgcctcagc ctcccgagta gctgggacta caggcacccg ccaccatgcc cggctaattt 2580

tttgcatttt tagtagagac agggtttcac cgtgttagcc aggatggtct caatctcctg 2640

atctcattat ccgcccacct cggcctccca aagtgctggg attacaggcg tgagccacca 2700

cgcctggcca taaagcagtt attatttctt atgcttagtc ccaaaaacct agtcttcctt 2760

gagtcatttt tctcttatgt acaatctggc aacaaatctt gcttcaagat atatcaaact 2820

gactatgtct tattgcctct actgttactt gccctgcttt aggttacaca cagctttccc 2880

ctggattgct tctactagcc tcctatctac ccttgacctc ctggagtcca ttgtctacct 2940

aacagcctgt gtgcacctct aaaaacggag ggcagataat tgccacttct ctgctcgcag 3000

tccttcagtg aattcccatc tctttcaaag gaaatcccct gttctttcaa tgatgtgcaa 3060

ggccctacct tctctagccc ctatccctat ccctacccct taactttctg acctcagcat 3120

caaatatgct ccctagtcta tccatgttgt cttccttatt tctctttgaa catatcaact 3180

gtgcttctac cttaggattt ttgtagtttt acactttgct tggaatgcta atcctcaaaa 3240

tatgttatgc cttattccct tcatgtctac tcagctagca gagtattagt gagacctcct 3300

tgtcctccct gtatatagga tataataata gcctctcacc taatagcacg cctgttcctt 3360

cacccagctt tactttcgtt atagcagttt ttttgtttgt ttgttttgtt ttgttttgag 3420

acagagtctt tctgtcatcc aggctggagt gcagtggcgc agtcttggct cactgcaacc 3480

tctgcctctc aggctgaaac gatcctccca cctcagcctc cacagtagcc aggacttaca 3540

ggcacacacc accatgcctg gctacttttt atatttttag tagagacatg ggttttgtca 3600

tgttgcccag gcaggtctcg aactcctgag ctcaagcaat tcacctgcct tggtttccca 3660

aaatgctggg attacaggtg tgagccactg tgcctggccc atcatagcac ttttaccatt 3720

tagcatgtta tacaggttat ttttttgttg tggtgttcac tgctatgttc ctagggtcta 3780

gaaaggtaac taatagatac tgggtgcttt gttaatattt gttgattgaa tacatttcta 3840

atattcagtg cctttttctg ttgggaaatg taaaatgagc aggaatataa gaagtttaat 3900

aaattataaa tatttgtagt gttctccatt tcttcccttc agttctcttt taagaataaa 3960

tatccttgct tgctaacctc tggtgtccct tgttgagcag catgtcaata atgagttcct 4020

gctattggaa gcctcacagg ccaagttgat ataaagaagt atgaagaaag tatggagggg 4080

ttagtgggtt agtgagattg gaatctgtgg ctgagcccgt acatgatttt ggatgattaa 4140

ttaatgggct gtgtcgtaag acagaaaaga gatgagggag aagctttggg gtgtgaaacc 4200

aagaaatctg gagcgatact gtctgtgtgg agaaaattgt ggccaagatt ttttgctatt 4260

aaagatgtac ttaggccagg cgcagtggct cacacctgta atcccagcac tttgggaggc 4320

caaggaggga agatcatgag gtcagaagat ccgagaccat cctggctaac accgtgaaac 4380

tccgtctcta gtaaagatac aaaaaatcag ctgggcgtgg tggcacgcac ctgtagtccc 4440

atctactcag taggttgagg caggagaatt gcttgaaccc aggaggtgga ggttgcagtg 4500

agctgagatc gtgctattgc acttcagcct aggtgacaga gggagactct gtctcaataa 4560

ataaaaagat aaaaataaat aagaaaaaga ggtccttaat attttatatt aatgatatac 4620

ttgccccact ttttgttttt tctcttccta catttaagtc atttcactct ttgaagcact 4680

cttgtaggag ggtgatagga aaagtaaaac gattgaataa aaaataatct agaaatattt 4740

ccttagtagt tcctgtaagg cttgatgtgg aatagaaaac caatacacgg gccaggtgcg 4800

gtggctcaca tccgtaatcc cagcacattg ggaggctgag gtgggtggat catctgaggt 4860

tgggagttca agaccagcct gaccaacatg gagaaaccgc atctctacta aaaatatcaa 4920

attagctggg cgtagtggca catgcctata atcccagcta cttgggaggc tgaggcagga 4980

caatcgcttg aacctgagag gcggaggttg cagtgagctg agatcgcgcc attgcactcc 5040

agcctgggca acaagagcga aactctgtct caggggggaa aaaaaaaaaa gccagtacat 5100

gaattaaagt gtaagaatta tttgtgttta cacttcatgt aatttatttc caaatttatc 5160

tagataattg gaaattgacc tgcattttaa aatctgtagc caacagttaa tgttaaaaaa 5220

aaaagttccc ttccccaaat gcagttaaaa tctatgaact gctgtttgct atttgataat 5280

atacttgatc tgaatagtaa ttatacatta ttagattaca tgacttctta gaaatatgga 5340

atcaattttg actatagcaa aaagaaatta tacaaagctt gaaaataatt ttgttatttt 5400

ataaatgtgt aagcccctta atgtctatca gtagttactg atttattaga aatatcatgt 5460

ttttctctaa tattgcccag taaatttttt ttaaatttat ttccatcaga gttactaatt 5520

tagagtgtaa aatagcaaaa taagaaatat caaggaaaaa aggtatttct ggtaactttt 5580

tatctaaaat tgaccatttt gatacagaat ggtaacaagt catgcttagg gttaggaaat 5640

gtaactgtat tcactatact caatcctaaa aattgtgtaa tacctctatg ttcaaggagg 5700

tttaagttcg cctccctcat agacctctaa atgcagtgac tatgagaaat gtcataggag 5760

aggtacaaaa tatgtttgga gaatagaaaa ggaggaacaa ctgtttcatt gattcaagga 5820

aatttcctca aaaaaggtaa cattggagct agatattgat aaatttgttt aaacaaagac 5880

tttctgtttt ttaagctaaa agaaccaacg tatgcaaaag cagagagaaa catatgaaaa 5940

gagaactgtg ttttccagga atggagaaga tgagaatgtg gctagagtgt taggggtgca 6000

tagttctgag tagatggata ttaggccctt caggagattg acgccttttt ttttctttct 6060

ttcttttctt tttttttttt ttgtgagaca gagtttcact cttgtcgctc aagctggagt 6120

gtgatggtgt gatctcagct caccgcaacc tccacctccc aggttcaagc aattctcctg 6180

cctcagcctc ccgagtagct gggattacag gcatgtgcca ccacccccag ctaattttgt 6240

atttttagta gagatgggat ttctccatgt cggtcaggct ggtctcgaac tcctgacttc 6300

aggtgattcg cccgcctctg cctcccaaag cgctgggatt acaggcaaga ttgatgtctt 6360

aatgtgaagg gtcctttatg caagctagag gttttgaggt tccccctccc catcgagcct 6420

tgcagttcca ttaaaggatt ttaagcaagg gagtaataaa attcgttata tcattgaatg 6480

aataaaatag tcagactttt tatttgtagg agaaaaattg tattagatgt agccaaatat 6540

ggcttaagta atgcagtttt aaaattcaga attggaaaat tggtttatct ttgattaact 6600

ggttcatttt ttttcttcct aacttctttc ttctgtcagc caaaaaaaaa taggaaataa 6660

tggataagct agaagcagta tttgcttttt aagttttgca tgactgaaac aatcccctac 6720

actgttagaa gcctaacaca caatgctatt gtgctctggg tctagaaaaa atgtgaggcc 6780

tgctagtctg attttgcagc agggagtaag gaaagccaat acttaacttt gtaagctgct 6840

aaatattaaa tgtttagtaa aatggggttt atagtaatgt tttttttgag acagagtctc 6900

actctgttgc caggctggag tacagtggct cagtctcggc tcactgcaac ctctgcctcc 6960

gggttcaagc ggttctcctt cctcagcctc ctgagtagct gggattagag gcgcctgcca 7020

ccacacccag ctaatttttg tatttttagt agagacgggg tttcaccacg ttggccaggc 7080

tggtgtcaat ctcctgacct ggtgatccgc ccgcctcagc ctcccaaagt gctgggaata 7140

caggcgttag ccaccgtgcc cggccagtaa tattttttct taaaaagaga atatcaaaat 7200

aaagaggaga gtcaggagta gagggtatca ccaagccttt tttagagtca cctaatttgt 7260

tacatgtttt tcttaaaatt accaaccatc aaaaagaaga attttgatct atatctatgc 7320

ctaagagatg tcagtagagc agtaaaaata tttctctaat ttataaggaa gttaagtaac 7380

tttcccacag tcaaaataat catgtcaaaa atttgacctt tcaaccacta gttttagtaa 7440

tccaccctgc ttttttcctc agggaaaaaa aaaaatgtac ttcccagata aacatcacct 7500

tgcgtttcac cgcaggtctg ggtgatcctt accttggaac aaatgatagt gttggtgcat 7560

ttaaagtagc agcttttggg tgactggctg gtcctgagga gtttttccta cttagcagtg 7620

ttcattttat ctattaatgc cgtgaagcaa aatacaggtt gaatgagcag tgttggtaac 7680

tgcaaaacaa agtgttgcaa cacagtaggc tgaggtagtt ttaagcagat aaagtctaca 7740

gaaattagtt tacagaaata gtgttaggct gggatgtttt agctgctaga tttcagattt 7800

agagaaatca agtttagaaa aataaaccag caaagtagta caaaattaat agcaacaatg 7860

tcaggaagaa tttgcttatg aaaaggatct attttccctt ttgtgaagag aaacatttgt 7920

tcacccttgg ttacttgtga ttgagataat taaaaacaat tttatttggt tttagcagcc 7980

tccttgtgaa aacttatgaa atattaggca gtttgatttt cttctcctct ctggacctgc 8040

agataaattt gttgtgaata aatggaaaat agtttggcag tgggcagaag caagggaaaa 8100

gccaagaatc tggtcgattt ataaaccaga cattgtgaat aaatgagttg gctacagctc 8160

ttagaaaaag gcttttgcct ttcgagttct tttcctacat ctgcttttat ttctttcaca 8220

ctttatgaag tcaataaaaa ttttgatttc attgttacag aagtttctcc ttgtatagga 8280

gcttttcatg ccctctgttg gccataaata atttactttt gatttctcaa ggctcctaac 8340

tggtgacttt tcatataagg ggatgtctag gttgtttttg gtagtgatat tatctctttg 8400

tacccagaga acacttctga caccaaatgg ggggttttct tcacagcaac aaccagttct 8460

tcagctctac ctggagttag cgtcagatcc cataggtgaa acgctgagtc ccacaagact 8520

atccccactt tagatgccag tcacaagtcc caggcatccc gtagttctga ctgactcacc 8580

gtaaatcaga ggttcccatg aactcctcat cagatttaat aatttgctag attgggtcac 8640

agaactcagg aaagcacttt actgacattt gcttgtttat tataaaggat actatgaaga 8700

atatagatga acagccagat aaagagagat taatacataa ggtgaggtcc agaagattcc 8760

tgaacatggg tgctcctgtc ccatggggtt agggtaggcc accctccctg cacatggatg 8820

tattcaccaa cttggaagct ctctgatcct tgtcacttag aggtttcatc atgtagacgt 8880

gatcaattat taactcagtc tccaggcact ctccctctcc agaagttggg aggaataggt 8940

ctgaaagttc catgcttctg atcattactt ggtctttctg gcagccacct ccatcctgag 9000

gctacctagg gttacgccaa gagtcatttc atcaaaagag gcttctacca cccaggaagt 9060

gtcaagagat ttaagaactc tccgttagga acaaaagatg ctcctattat ccccaccact 9120

taggaaatta caagagtttt gtttttgaga cagggtctca ctgtgttgcc caggctggag 9180

tgcagtggtg caatctcagc tcactgcaag ctccgcctcc tgggttcatg ccattctcct 9240

gcctcagcct cccaagtagc tgggactaca gatgcccgcc accacgccca gctaattttt 9300

ttgtattttt agtagagacg gggtttcacc atcttagcca ggatggtctt gatctcctga 9360

cctcatgatc cgcccgcctc ggcctcccaa agtgctggga ttacaggtgt gagccaccgc 9420

acccagccgg aaattacaag agatttaagt gctgtccttt gtcagaaacc agagatcaag 9480

tatatatatt tttattatgt cacaaatgga ttctaaaatc agataatctt actattactt 9540

atctgtgaag aggacttcat actttgcaca gaagtatttg ctgtgactta aacaagagtc 9600

acatggtgct atgagcttaa ataattacta gtaaaatttg gccagagcca gcagccatgg 9660

cttatgtctg taatcccagc actttgggag tccgagatgg gtggatctcc tgaggtcagg 9720

atttcgagac cagcctggcc aacatggtga aacaaaaaat gtctctacaa aaaatgcaaa 9780

aatgagctgg gcgtggtggt gggtacctgt aatcccagct acttgggagc ctgaggcagg 9840

agaatcactt gaacctggga gggagaggtt gcagtgagcc gagatggtgc cactgcactc 9900

cagcctgggt gacaaagcaa gactctctca aaacaaagaa aattgttttt ggctgggtgc 9960

agtggctcat gcctgtaatc ccagcactct gggaggctga ggcaggtgga tcactttgaa 10020

ctcagtcgtt tgagaccagc ctggtcagta tggtgaaatc ccgtctctac aaaaaaatac 10080

aaaaatgagc cgggcgtggt ggctcacacc tgtggttcca gctactcagg aggctgaggc 10140

tagaggactg cttgagccag gaagtggagg ttgcagtgag ttgagatcgc accattgcac 10200

tccagcctgg tgacagaagg atactctgtc tccaaaaaaa aaaaattact attaaaatta 10260

gtcttcatgg tgttttggtg aactttagct taccagctga aaattatgga attcatttca 10320

tatagcttcc actataaata ctattttgat ccaagcctgt taataacact aagcatggtg 10380

actctcaacc atgactgcac agtgggattg cctgggaagc tttaacatac actgatacct 10440

gggtctcata tcccagagat tgacttaagt ggtttggggt gcaacccagg tattgcagtt 10500

ttctttctta aagttccaca ggtgattcta atgtagtcat ggttgagagc tactgacctt 10560

gagaagcatg attttttaga ggtggctaac ccgttctggt ctactggttt acatgcagta 10620

gagatagttg gggaagataa tttttgctta aaataggaaa gcaactgaca caatcgcatg 10680

gtaggcatgc agggtttaga acagtaagaa actgaagatt ataccatata acactgtgaa 10740

tttattaaat acattccaga gtgggttatc agccaagatg tgctagatca actgtgtatg 10800

gtgctgctaa tgagttcaca gaaacctaga ggtttttact tgcccaaggt cacaccacta 10860

gctggggaca caaccaaaac tggaaaatta tagtggtaat tcatagtttg ttgccttgat 10920

tatttaggtc aagttctgta aactttttct gtgaagggcc agattgtaaa cattttaggc 10980

tttgcaggcc atatggtccc tgttgcaact actcaactct actaacatag taaaaagcat 11040

catacacatt atgtaaatga atgaatgtgt attctagtaa aactttattg acagaagctg 11100

gatttggcct gtgacctgta ggctgcagat ccctgattga ggattgtttt aatcttccca 11160

ttggaaagtt ggctccttaa gagtaggctg aagatgttac tggtcccacg tggtgcctta 11220

cttcctggta ctgttacagt ggcctctgtt gcaaggtgtt agatgagtgc ttgttgaatt 11280

catatctatg cagctcttaa cgtttttctg ttgcttctaa cccttccagt aggggaaaca 11340

gttggcacat attccagctt tggagaggaa atgcttgaag tctgtagcag ggtataattg 11400

ctgaattctt caagcgaatt aaagatctga atttgctcta gggcattcat aattatttta 11460

atttcctgga acagattcta agaattcatt ttaaatctga aagtttttct taaaatctgt 11520

tttatgatac actgtcttta tttttgtgaa tattgttagt ttctcacaac aatatttatt 11580

tcagttcatt tggatctaag atctttgttg tacttatgtg tggccagtag actctttagc 11640

aaaattaaac aaatgctaat gggttcccac agccacccaa atattagaag tacagctcca 11700

gattatgagc ctgtttctct ttttcttttc ttcttctcat tattttaaag agatggagtc 11760

tcagtatgtt gcttaggctg gtctcaaact cctgggctga agccattctc ccgcctcagc 11820

cttccaagta gctgggatta caggcaggag ccaccacccc agacatgaac ccacttctaa 11880

tgcaaaacac atattgacct gacaacaggg ccctcagttg tggtggaaag agcagtgacc 11940

ttggaattaa aagccctgtt gtgactcgtg gctttgccac ttttaaccaa ccctactttt 12000

atttacctat aatgtgcagg tatctgtctc actctttagg gatgccaaag gtgaaatgag 12060

gtgtgctgtc tatgtgacag tgccttgtga gcacttttct gacttctccc tgaggaggtt 12120

tgggtcaggc ctagcagaaa ctgcagccat agagcatgga gggaagtagg acttgactag 12180

cataaagtga gtctatgaga gtgtgcccac tggtttccaa agagaatgtc gaagagtcta 12240

caatggtgag gcctcatcag cctcgatttg agaagcaaat gtaggtcaga aatggggagc 12300

agaacaagag gaaaagaaga aggtcaggag tgtgcagagc tgaagaggtg gtgagaagtg 12360

gttcaaagct ggaaacaggc aaggtaatct ggaattctgt cttgatgtct attgagttat 12420

cctaaatcaa gactcatgtt cctcttacct tatatttctt aaattgattt gtttgatgcc 12480

ctgggtattt tgaagctcct agctgcataa tcttgcctaa taaaggcaca gaattagggc 12540

aaatagctgc agtgacttgt gtacctgctc agtgaaagcc aaagaatcaa tagctagaat 12600

ctgtgtccac aaattgctta caaaccacat gtagatatga cattcaacat caggcaaggc 12660

tgggcacggt ggctcagatc tgtaattcca gcactttggg aggccaaggc aggaggatca 12720

ctagagttca ggagtttgag accagcctgg gcaagatgat gagactcagt ctctacaaaa 12780

atgaaaaaaa aaatagctga gtgtggtggc atacacctgt agtcccacct ccttgggagg 12840

ctgaggtgag aggatcactt gagcccagga gtttgaggtt gcagtgagat atggtcatgc 12900

cactatattc cagcctgtct gcatgtaaaa acaaaaaata cacacacata cacacacacc 12960

ccagcctaac cacttaccac ctcttaatca tctgtataat ggacataaaa atgcctgcta 13020

tactttacat catagtattc ttgagtggag taaatgaaat aatgcatata aggtgctttg 13080

cacaatgtgt gcttgcctca caataaacac tcaatattat tagatatgat ttctaccatt 13140

attactaaca gtagtaagaa tagcagtagt atttaaaagc aagtttgcat tagttttaaa 13200

gcactatgaa atcccaagtc ttttttaaga cggagtctca ctttgttgcc caggctggag 13260

tgcagtggtg cagtctctgc tcactacaat ctccgcctcc cgggttcaag cgattctcct 13320

gcttcagcct cctgagtagc tctgattata ggtacccgcc accacaccca gctaattttt 13380

attttttagt agagacgggg ttttaccatg ttggccagac tggtctcaaa ctgctgacct 13440

caagtgatcc acctgcctcg gcctcccaaa gtgctaggat tacagggatg agccactgca 13500

cccggcctca agttatgatt gttaatattt ttgtgacatt caggataaat attttttagt 13560

atgctactga aggacatgtc tcagcatcgg tgtatccctt cctgaagcta tatgttacct 13620

tgcatttaca gagttgactt ggtgtccaga gaacaaatca gttgagaaaa ggccattttg 13680

aaaacgattt tttccaggga gcatacgcta gtaccctgtt gcggcatcca tgtgtgaggg 13740

ggtggttgga ttatagatct tcaatgtgaa gtcaagtttc ttatcaaatg aagtgttttg 13800

tccgatctta gagtttaaac ccacaaggag gtaacaaagc aaagggctaa tatatctttt 13860

cgctacttag aactacaggc cagaaatttg cttttgtatt ctgagatctt atgatacttg 13920

tctcaatgaa ataaaactgc atgcattatt ctgcatttcc atattactat tctctgtatt 13980

ggtaattatt atgatacttg cttcctgtac ttaaagcagc atgcagattt attttataat 14040

cacttcaagg aaagaaccag ttcctttgga gatttcctgt ggttccaaag ttgcatgcct 14100

ccaagtctgt taggttgtgg gattttgcat ttgagagaaa tgagggaggt ggagagaatg 14160

aagagaaagt ggactggcag aattacagaa tgtggtttca tctgatcttt taggctgagg 14220

gctactccat ttgtagactc catgcataaa actcaggcat cctgggtcct gccctactgc 14280

tgctttgtgg tcagaacatc gtgagatcat gcagcctcaa ggctgggaac atacgggatc 14340

aggtccaaca gcaggttgga gtttgggttc atgatttcaa agtcagggtc gtgagggcac 14400

ccaagatgat taccgagaag tcaaaagcac gtgccagtaa tggcaatgtg aaggtctggg 14460

aaacagccaa aacgtagctg tcaggaatgt gggacagagt ccctagggca gcttttccca 14520

aaacatgttc caagatatac tagctctatg ggatgttgac ttacaataat atgtggtgaa 14580

aaggttttcc agacaaacac tgagttcaga gttaagcagg tttttttcta ttgcagagct 14640

tgtcagagcc tctgatatgc ccactagtat tgtaagtgta caagatgaag ctttaaaatt 14700

gggcaaataa cagatatttc atacagaatc ctggatgtgg ccaggagtga tgggagatga 14760

aggatcctct tgtcagagta gcactccaca gaacacactt ggggaaaagt tgtcccaggg 14820

cctgtggcat gtgctctgaa ttcattttcg cctggctctt aattctgggg ttcggaagga 14880

actggcaaac acccacagaa gttatctagg atcttattga gtgcttcccc ctcgtccttc 14940

catccgaatc acttggctga tatttgttgc tgctattaac agaattcagg aaatcagccc 15000

ttcttagagg aagaaggaca agtgagacca caaacaacaa aacataatga atggatcaga 15060

gcctgtgtat aattggccct gaattaggca aataggcttt ccccactccc ttaaaatgaa 15120

aacaaaatgg tagtttaaag aaagtaccaa agggactata tctaataata acaatgagat 15180

tgaaaatgag ggcacatggt gtgtttaggg acggctgagg ccagtgaatg tcaaggcaga 15240

ctgcatcttt gacagcctcg cctcactggc tcctgaaatc ctcacacaca aaacagcatt 15300

cttcttgtgt tcttaaagtg aaaggcactg tttccctgtc acactagcaa tgttgcgaag 15360

taaatgtcat cctttcctcc tccttggccc tgccttctac agctagtgcc cctgccagtt 15420

gtttcctcag cacgtctcca gcgttcctct tctcttcccc ctcggcacgg ccttacttct 15480

ggtctcatca tcctatgcct gggctgatgc ctttgcttcc cagctgcagt cggctgggga 15540

tgaatgtggg gttaaggcag gcattccaga tatttataga attgttcatg gttcttttcc 15600

cattagccat gagttacttg agggtgaaga tagtgtctta tttgtctctc tgtctctagt 15660

aattagccaa gtacctggca cttttaatta aggagttatc actcagtaca tttaaatagg 15720

gagaaaaaga aaaaaacaaa gaatggaata aagtaaaagc atgataggtt ttgttactct 15780

ttttgcagtt gatcattggc tattcttaat tcttatagac cagttagtac tttagcagca 15840

tacagataag atatattaaa atcatacact gagtttttaa aaagtagatg ggcatgagtg 15900

gtggctcatg cctgtaatcc catcactttg ggagggcgag gcagtaggat cgcttgagcc 15960

caagagttcg agaccagcct gggcaaaata gtgggacccc gtctctacaa aatatttttt 16020

aaaaattagc cgggtgtgat ggtgcacctg ccgtcctagc tgcttgtgag gctgaagtga 16080

gaggatcact tgagcctgta aggtcagagc tgcagtgagc catgacagtg ccactgcact 16140

ccagcctggg cgacagagca agacactgtc tcaaaaaaaa aaaaaaaaaa aaagaaagag 16200

acaaaaagtt cattagcact taaacatgct tttcagaaaa tgactaatta tcaaaaacta 16260

gcaattgtga tactagcaaa tgaagaaacg tcaaatggag aagaaatgaa aaacgttttt 16320

agaatccagg acacacattt acaagaatgt aaaatattgt gaaaataatt tggaggagaa 16380

ttatgattaa attatttgag acttgaatta cctgcagtaa attcagctgc gtatcggttg 16440

ttaggcattt tatcattact aatcctgtta ccatctttgt tgaataagag attcatactt 16500

gatatacaag gtccatacat ttgtaaataa ttcattatta tattagtttg caagagtcat 16560

gattttgcca gaatttatcc aaaatggtct attggtaatc ccagagagta gcagaggcat 16620

tgggcagtga agctaacagg cggtgctaaa gccagcatga gcaagtgctg ggtggtagga 16680

aaatagaact caggcagtag tgagggcaaa taggagcaga cagggcagac ctagaaggag 16740

acagcaagta agaggcttag gaggctggag gagcagagac taaggaacgc tcccctggca 16800

tcatgcagca ttattacata agtgttagta atttcaaata gttataacta ttttagatat 16860

accatgtgct agctactgtt gtagtatgct cactagaatt taatacttga atcctcacag 16920

caacctaggt ggatactatt atgaatccta tgaattttca tttatagatg acaaaattga 16980

agtacaggga aagtaagtca ttcacccagc tgatcatcag taaatggaaa agccatgatt 17040

tgacctcagg aaaatgaggg ttatttgaca gggctgactt gaagaatgtt tagattgctg 17100

tagaactgta tttagtgctt aacgatatat aataactgat acaattggta tccaaacagc 17160

cgaatgtcat gcttttaggg atcaaggaaa gttgcctaag tgtgcatgtg cctagcattt 17220

gagttttgat acggatgatc ataccagaaa aatataccat cagttttcag gcctatctgc 17280

acagtaatat gcgtggagtt cttcatgatg tattcactga tattaaagct caaaactatt 17340

atgaatctta ggctctggcg aaaaaatgtg atcgtttaaa aattcggcat ttatcttatc 17400

ctgtggaatg ggcaacttct caggcccatt tgtcaccacc aacaaagcag taacacgagg 17460

tgttttaata aatctgttgc ccagtctctt ccatattgct atgcttagct gtaaaagaag 17520

ggaccaagaa atgggtgtta agctgaattg gaaacaattt tcagataaag cacagcagtc 17580

tgcgaacctc ctccagctca agatggtgtc aactagaatt gccttttgta agcaggcaga 17640

aagagacaca tgtacttgat tgtggtttct ctttactccc actttccact ctggtcatcc 17700

ctgtagacac agagtaattt gtgtactgta aatagctaga tctttctgta atctttattt 17760

gtttctttgt ttgttttttg agatggagtc tcacactgtc gcccaggctg gagtgcagtg 17820

gctcaatctc ggctcactgc aacctccacc tcctaggttc aagcgattct cctgcttcag 17880

cctcctgagt agctgggatt acaggcgccc gccgccatgc ccgactaatt tttgcatttt 17940

tttttttttt tttttttttt tgtagtagag acaatgtttc accatgttgg ctaggcttct 18000

ctcgaactcc tgacctcagg tgatccgcct gccttggcct ctcaaagtgc tgggattaca 18060

ggcgtgaacc accactctcg gctttaacca acattcttag ttgaacacag cagaaaggga 18120

aacctccatt agtacatgga actcgggcag tagtgagggc aaatatgagg gagagctgcc 18180

ttcctgttgc agtggtaagt tcagtctcta cctaagaaaa cagcatgcca aggtacagca 18240

gagcacactg gccagctcca atgcaagagt catcatggag tgtacctttt ttttttttga 18300

cagagtttcg ctcttgttgc ctaggctgga gtgcaatggc gcgatcttgg ctcaccgcaa 18360

cctccacctc ctgggttcaa gcgattctcc tacctcagcc tcttgagtag ctgggattac 18420

aggcatgcgc caccacgcct ggctaatttt tttttttttt tttttttgta tttttagtag 18480

agacagggtt tctccatgtt ggtcaggctg gtctcaaact ccctacctca ggtgatccac 18540

ccgcctcggc ctcccaaagt gctgggatta caagcatgag ccactgcacc tggccggagt 18600

atgcactttt aacatgtcta tgcagggaca catgtcctct aacaacaaat ggccatcccg 18660

agagtggtgg agcagagtgt tggacctctg gagcccaaat ttttattgta gcaatacaca 18720

gtcttcttat aacaggcact gtggccatgg gtcttatcag ctcctattca aaattggaat 18780

taggacaagt atagcaggtt gtgttctaac agaattctaa cttttaaggt gccacagaca 18840

ataatattct ttagaaatct tagtgttatc ctttttatcc tttcagggta gcaaacaaaa 18900

ggcactcagt aaataattat ggagtataat ttggggaaaa caaaatattt ctagtctgaa 18960

aattattgtt ttaaaaatta tttttgtctt gagaggctgt acatttctgt caactgcgtg 19020

gccacattgt tgatatgctt aagaaagata acagtcaaag ttgccttttt acactttgta 19080

tttgtgctca tccaaccatg agacctttaa aaatattgaa tatctgtagt tatctccctt 19140

caagtcttat tttgagttta tattaccttt gaactcaaaa gatctcaagc catttgcttt 19200

acctgacagt atgacattct ttaattttag gtagcattgt atgatgagtc tcaaatattg 19260

gcagcctata atgcatataa gttagtgatc ctagtaaatg taaataaaat aataaacaga 19320

aacatgctgg gcatggtggc ttatgcctgt aattccgtaa ctttgggagg ctgaggcagg 19380

aggattgctt cacaccagga gttagagacc agcttgggca acagaaaccc caatttttaa 19440

aaaatcagct gaacgtggtg gtgcatgcct gtagtcacag ctactcagga ggctgaggtg 19500

ggaggatcac ttgagctcag attgaggctg cagtgagttg tgagtgcacc tcagtctagg 19560

tggcagagtg aggtcctgtc tcaaaaacat aatgataaat gaaaataata acagaaacat 19620

tcagtcaata actgggattt ttttttactg ttactatttt ttatcaagac aaacatctgg 19680

agagttctac aattccagat gcttaccaat ctgcttctgg gttgtgaaaa aattatttgg 19740

gtatgtatag cttttaactt tttttttgtt tgttttaact gaatattgag gattttggta 19800

gaataacttt gaatgttttg gattttagat ttaaatggaa atatcaaatt ttatataggt 19860

tgggctctag atatttccat attgtcagaa tttagaaaac atcttttatg aaatagaaac 19920

taagaatttt ggcaaacaga gaaagttgcc caaggtctcc agaattcatt tgtttgacaa 19980

atacatattg agcatctacc ctgtgacagg tggtattcct gggatttgtc aggagcacaa 20040

ttgctgcctt cctggagctt acattctaac cagggaaaac tgacaataaa caataaaaaa 20100

agtaagtaaa taatgtagtt tgttagaaag ccataggtgc tacagaaaaa aataaactat 20160

aaagtagggg tcggactagc aataaaacta aatagtgtgg tcagggtagt ccatgtggac 20220

aagatgcaat ttgagccaag atttaaaaaa gataaagcaa ttagcctcaa aataatcggg 20280

gggaagaact ttccagcacc aagtagtttg ctcggcctgt tggaggaata gcaaggagcc 20340

agtgtgcctg gaatggaatg cccaaggggc aatagtggcc ataaggtaaa agtggtaatg 20400

gggctaaggc cagatcctat agagcttaca aactactgca aagaacttga gattttactc 20460

tcagtagaat gtggatccat tggagaattt taagcacagg atctgacttg ggttttaaaa 20520

gggtctctct ggtcctggtt tgacaatatg gactgcactg ggaacaaggg aaggagcagg 20580

ggtcttactg ctgtaattca gttaaaaatt atggtagttt aggctggaat agtagcacca 20640

gagatagtgc tagatggtaa aatctggaaa tattttgaaa gtagagccac caggatttcc 20700

tggtgaatag gatgtagagt atgagagaaa aagaggattt ggggtgtttc caaggtttta 20760

gcctgtgcat aaatggagtt attactattg attcagagaa aaccttaagg cagctacttt 20820

tagataagag ttgggtgatg aggggttcag atatgaatct gttgatagtg agatggctct 20880

tagacatact ggggaagatg ctggtaggca actgcatgtg taaatctgga gacgggtgag 20940

gtctgcagta gagatttaag tgtaggataa tctcaacatg tggaaggcat ggaagtgtgg 21000

gtgcaagtgg gagacgagaa ccaagcacta atccaagtgc acttcaatat ttaattttaa 21060

gagacaaggt cttttttttt tttttttttt cgagatggag tctcgctctg tcacccaggc 21120

tgaagtgcag tggcgccatc tcggctcact gcaagctccg cctcccggtt tcacgccatt 21180

ctcctgcctc agcctcccga gtagctggga ccacaggcgc ccaccaccac gcccggctaa 21240

tttttgtatt tttggtagag acggggtttc accgtgttag ccaggatggt ctcgatctcc 21300

tgacctcatg attcacctgc ctcagcctcc caaagtgcta ggattacagg cgtgagccac 21360

tgcgcccagc cgagacaagg tctttcactc tgttacagct ggagcacagt ggtgcaatca 21420

caggtcactg caatctcaaa ctcctgggct caagtaatct tcccaagtag ctaagactat 21480

aggtgtgcac caccatgccc agctaatttt tttttttact ttttgtagag atagtgtctt 21540

gctgtgttgc cgaagctagt ctcaaactct tatcttaagc agtcctctct ccgtggcgtc 21600

cctaagtgct gggattacag gcatgagcca tcatgcctgg ccaggcactt taattttaaa 21660

gagcctttaa tatggtttct tgccatgtca gagataagaa cagcttaata tttcttgact 21720

tttccttggt taaacaaggg gtatgcttta aaattttttt taattttaat tgtggtaaaa 21780

ggtacttaaa atttgccatc atagccattt ttaaatgtac atttcactgt cattaaatac 21840

attcaccact atcatccaca gaactcttca tcttgcaaaa ctgaattctg cacccactaa 21900

acaataactc ccttttcttc ttcctcccag gtcctcaaaa ccttcattcc attttctgtt 21960

tctatgattt taaagtggaa ttatacagta tttctctttt tgtaactggc ttatttcact 22020

tagcattatg tatgtcctca agattcatcc atgctgtagc atatgataga atttcctgct 22080

gggcgcagtg gctcacacct gtaatcccag cactttggga ggccaaggtg ggtggatcac 22140

ctgaagtcag gagttcgaga ccagcctggc cgacgtggtg aaaccctgtc tctactaaaa 22200

aatacaaaaa ttagctgcac atggtggtgg gcgacacagc ctcccaaagt gttgggatta 22260

caggtgtgag ctgctgcgcc aggcctgctt ctactctttg actattgtga attaatgctg 22320

ctgtgaacat ggatgtacaa atgtaaggga tatgtttttg ttttttgttt ttaagatgga 22380

gtctcactct gtcacctagg ctggtgtgca gtggcacagt cttggctcac tgcaacctcc 22440

gcctcccgga ttcaagcaat tctcccacct cagtctcctg agtagctgag attacaggta 22500

cccaccatca tgaccagcta ctttttgtat ttttagtaga aactgggttt caccatgttt 22560

cccaggctgg tcttgaactc ctgacctcag gtgatctgcc cgcctcaccc tcccaaagtg 22620

ttgggattac aggcctgcgc cacgatgccc agcagggata tgctttttta aaagtctctg 22680

tgatatgtat acttggtgac tttcatagat ttttaaaaat ataagtgata tataaataca 22740

tttttattat aaaagattta aatgatatag ctgttaacag accaaaatat gaaaattctc 22800

attcattctc tcacctcacc tccatctgca attcccaaag ttacatttgg tgtgctatct 22860

tccctctctt tcagtacatt tctatacatt tgtctataac ttattctttt taaaaactga 22920

gatattatac atattctaca gtttaataat gtcttggaga cctctcaatt atttatattt 22980

tggaaatatt cccagtctgc tgcatatgtt ctatagtgtt atatttacct ttacatgtac 23040

agggctatta ctgtagatta gagtcctaga agtgcatgca gttcctaggt ccaaggaact 23100

ttctttaact cttcatcaga ttttcttttt gaagaacctt tgtggcttga taattatgtt 23160

tctagaaaat ttattattca ggtttagaag tttggggagc tgtttgaaat aacactcaaa 23220

taaatttcct ggctatggat ttgttcccca tagcaagaga gttgtaaact atgagtttta 23280

taaccttaat gtcttttttt taaaaaaggc aattgatctc ttaatctagg tgttttagct 23340

agcatatggg agatgtaatc tgcaatctat gggacaaatg ggggagtttt gggagttatg 23400

atagaagact gttgaaaaat gttttataat aatgttttac agtagagaaa cctggtagat 23460

gccacctcat cagccgacca gggttaacat cacatgataa tcatattgct atcatgcagt 23520

gatattaata taataaagtg agatgggtgc attgcctctg tgatattctt accccaaacc 23580

cataaccaca gtctcataat gagaaaataa cagaaaccca atttgaggga cattccacaa 23640

aatacctgac catgttcttc aaaagtgcta tggtgccaaa agtcatgcaa gacaaatcta 23700

agtaattctc acaggttgta gtacactaag gagacagtga aaactaaatg caaataaagt 23760

ggtttttggt tttttaaagt atgtttatcc ttatggacaa tatgctccca taaagatcgt 23820

ctaccctaga aaactgtgtc ttccctctta aatccaagag atgcttgtcc caaagggtgg 23880

accccattga gatctcctgg gctagagacc cagtgcatgg atggatgaga cagtataagc 23940

aagaccgtat aaagctgtga tctgagctca tggacactgt ggtaagaggt caggctcgaa 24000

gaatcagaga actgagtgga ttttgcaatg gatagccaaa gagagggtcc aaacttaaaa 24060

tgcgaaacaa taattcaaga atgatttggt aaaatgtaat ataacagcct ataacagagt 24120

ctagcaaata gtagccaaaa gtcaccctaa ccaatcgtag ggcatatcta ccacacaaaa 24180

gtgtgactta gcgcatgact gtttaaatgc caaaaaagac agataaagga aagttaagcc 24240

atagtggcaa cctctgcagt tggaacgagg gagctatatc agtcaacagt gaggctaatt 24300

gagaatattt gaggttggcg tatgtctagg gattcctata ggagatacaa cccagcaagc 24360

ataggtcagc aacccaaggt cagagtacaa aatgggttaa tactaaaaag tggttaaaaa 24420

gatgaccagt cctcaagagg agatagtatt taaatcggat acctctcctt ccccatgcta 24480

actaacatac tgtaatttgt tatggctgtt tctaaggtaa ctgtttataa ttataaatca 24540

gccctactgg ttcttcttga tattgtaatt tgcaatcaaa gaacctctag agttaatgta 24600

aaacttcttg aatgagagac catctggtta caattttggt ttcaattccc tgttaggcaa 24660

ctgacaccca aataaggact gtttccaaat atgagtaggc taagtcagtc ataaacaaac 24720

aaaaagtttc agtttttgtt gctattatcc aagatgttag cagatgaagt gtttaatgaa 24780

agggtgcttc ttttaggcaa acttctttta ccatgatttg tttaacctat accagtggtc 24840

cgtacatttt tttcctgtaa agggccaaat aattattaat agtattttta gccttgcagc 24900

cacgtatgat ctctatgtat ttgtcattgc ctttttgttt ttttaaacaa atgtttaaaa 24960

atgtaaatgt tctctgtgtc cttcaccatg ttttcatgct ttgtgatagt ggctgaaatt 25020

tagagacttg ttttaataaa caatgttctg aaatgttgat ctaattgcct ctggcaaaag 25080

atgtgtaatc atgactttga tgaacttatt ttaaaaatag atgcacagtt gatctcttat 25140

tgcacgcatt ttggcacatt cgtgggagat attctctgta aacatgacac ttgcgaaacc 25200

taccataccc tgaaagtttg ctgtctagaa attaagtgcc tagttttcat tcaaattaat 25260

atttaggtaa gacatgtttt atttctaaat agactgtcaa acatttttca tattttaatg 25320

tgtaatggtg atgacctttt taaaaagact caacgtaatt tgttttctca tttaacccat 25380

taactgcccc ctttgtgtag tattgttgct gctttctctt ataaattgat gatgtctcag 25440

ggtctcaatt tacaattaca ttagtttctt cctctagttt gtagttgagc tgtggctctg 25500

cactgttggg gcctgtacag ccatccttca ctagaccccg ggaggtggcc tttagtaggc 25560

tcaaaggtgg cctttaagcc attcttagta tcactgtgaa aaagcatcca gattttcccc 25620

ctgaaaggcc aagtggttgc atgatgtgtt gtggatttta gggatatact ttgcctattt 25680

cacatacttt tttccaagaa gatagataag cttacacatg taaaggtttc aactgtattt 25740

cttctgttta taattttatt tattttgaga tggtgtctcg ctctgtcact cattttggag 25800

tgcagcgcaa tggtgtgatc acggctcact gtggcctcaa actcccaggt ttaagccatc 25860

ctcgcacctc ggccttctaa gtagctggga ctacagatgt atgccaccac acccagttaa 25920

tgttttttgt atttttttga agagacagga ttttgccatg gctgcctacc tggtctcaaa 25980

ctcctgggct taagtgatct gcctgcctca gcctcgcaaa gtgttgagat tacgtgagcc 26040

actgcaccca gcctttttat aattttaata ataatctgtc aatctttcat tacttttgcc 26100

ttctaaattc ttgttatatt ttactaaaca atgcttaatc tcgctgataa accattttag 26160

cagaagtatg tctgatgagg accacccctg cctttttttt tcttttctca gagttgcaag 26220

gtctccctct gttgaccagg ctggagtgca gtggtgtgat tatagctcac tgcttcctca 26280

acctcctggg ctcaagagat cctctcacct caacctcccc agtagctggg accacaagcg 26340

cgcaccacca tgcccagcta atttttattt tttttaagta aaggcagggt cttatgttgc 26400

ccaggctggt ctcaaattcc tagcgtcatt taatttctgt tttggtattg gctctgaaag 26460

aactgttgag acaatacttg gaactcttga tattttccaa aatctgtttt accaagataa 26520

attttaagga gagcaacaga aaataaagca gaaatgtggt ttctttgttg ggttttgttt 26580

tttttttttt tttttttttt tttgagatgg agtttcactc ttgttgccca ggctggagtg 26640

caatggtgcg atctcagctc actgcaacct ccccccatcc tgggttcagg tgattctcct 26700

gtctcaccct cctgagtagc taggattaca ggcgcccacc accacatctg gctaattttt 26760

gtatttttag tagagacggg gttttaccat gttggccagg ctggtcttga actcctgacc 26820

tcaggtgatc cacccgcctt ggcctcccag agtgctggga ttacaggcat gagccaccgc 26880

acctggccca aatgtggttt ctaatcaata ttatttaata atgaattgga ttaagaattt 26940

tttgggtttt ttttactcaa tagaaagttg attgggtttt ttaaaaatag cttgttttca 27000

ataattaagg cttaaaaaaa tctctgagtt ctctttgaga tatttggatt ctataaaaaa 27060

tgaaactctt tgtttcttaa ccaaatgata attccttaaa ttgcattctt tgattcaatt 27120

atactgaatt tcctggtaga aattttattt tctctgaagc agagtcagtg gtcttaatat 27180

caccatgtca accagaagag aaggaaatct aatatgcata atagagaaca ctgacacatg 27240

acttctttaa aagtctctga aattcaacat ataacttttt ataccagaaa gtgaacaaac 27300

atttaatcct tcctcttcat ctatgtctca tgatgtattt gtgtgatttt aaagaacatt 27360

ttggagtttt tgagttctat ataaatgtga ccatgttatc tgtataatct tgccatcctt 27420

tctttggaaa acatgggtca ccgttagcgt atgtcatgga tgttgatgtg gagtctgagt 27480

aagctagtgg gcgagagggt gtgtgtgtgg acgtgggcgc atgtgtgtat ttgttagttt 27540

caaatcgagc cattcttcta gagtctttag gtcagctgtc acgttgggct ttcctccttt 27600

gttcttttga gttgctctgt gactagccac agacccaaca ctaaaaagga aggcttttaa 27660

cggattaatt ccgtcctttc cttcgcctac attgtagcag ctgcgttctg ccctttctgt 27720

ggccctgcaa ggagaggagg cctgtgtata acagtcttct gtcaacatcc attataagat 27780

tcctaaagca catggaatga gatagttccc aggaaaactc tttgtcaagg ccagcccatg 27840

tgggaaaagt gtttctatgc ttagtcttgt aactatgact gtttttgttt tatggggtca 27900

ggggaaattt aacttatttt atttttcttt tttattgatc attcttgggt gtttctcgca 27960

gagggggatt tggcagggtc ataggacaat agtggaggga aggtcagcag ataaacaagt 28020

gaacaaaggt ctctggtttt cctaggcaga ggaccctgcg gccttccgca gtgtttgtgt 28080

ccctgggtac ttgagattag ggagtggtga tgattcttaa cgagcatgct gccttcaagc 28140

tctgtttaac aaagcacatc ctgcaccgcc cttaatccat ttaaccctga gtggacacag 28200

cacatgtttc agagagcaca gggttggggg taaaaggtca ccgatcaaca ggatcccaag 28260

gcagaagaat ttttcttagt acagaacaaa atgaaaagtc tcccatgtct acttctttct 28320

acacagacac ggcaaccatc cgacttctca atcttttccc cacctttccc ccctttctat 28380

tccacaaaac cgccattgtc atcccggccc gttctcaatg agctgttggg tacacctccc 28440

agacggggtg gtggccgggc agaggggctt ctcacatccc agtaggggcg gccgggcaga 28500

ggtgcccctc acctcccgga cggggcggct ggccgggcgg ggggctgaca cccccacctc 28560

cctcccggac ggggcggctg gccgggcggg gggctgaccc cccccacctc cctcccggac 28620

gggacggctg gcctggcggg ggctgacccc cacctccctc ccggatgggg tggctgccgg 28680

gcggagacgc tcctcacttc ccagaggggg tggctgccgg gcagaggggc tcctcacttc 28740

tcagacgggg cggttgccag gcggagggtc tcctcacttc tcagacgggg cggccgggca 28800

gagacgctcc tcacctccca gacggggtcg cggccgggca ggggcgctcc tcacatccca 28860

gacggggtgg cggggcagag gtgctcccca catctcagac gatgggcggc cgggcagaga 28920

cgctcctcag ttcctagatg ggatggcggc cgggaagagg cactcctcac ttcctagatg 28980

agatggcggc caggcagaga cactcctcac tttccagact gggcagccag gcagaggggc 29040

tcctcacgtc ccagacgatg ggcagccggg cagagacgct cctcacttcc cagacggggt 29100

ggcggccggg cagaggctgc aatctcggca ctttgggagg ccaaggcagg cggctgggag 29160

gtggaggttg tagcgagccg cgatcacgcc actgcactcc agcctgggca ccattgagca 29220

ctgagtgaac cagactccat ctgcaatccc ggcacctcgg gaggccgagg ctggcggatc 29280

actcgcggtt aggagctgga gaccagccca gccaacccag cgaaaccccg tctccaccaa 29340

aaaagtacga aaaccaatca ggcatggcgg cgcgggcatg taatcgcagg cactcggcag 29400

gctgaggcag gagaatcagg cagggaggtt gcagtgagcc gagatggcag cagtacagtc 29460

cagcttcggc tcggcatcag agggagaccg tggaaagaga gggagaccgt ggaaagggga 29520

gagggagagg gagggggagg gggagggaga gggagtggga gaggggaaat ttaacttata 29580

aggcagtatt gtgatatgcc tccatactta cctgcccttt ctttctgaac tcttgcagg 29639

<210> 204

<211> 8716

<212> DNA

<213> 人类

<220>

<223> TSPAN14

<400> 204

gtgagtagag cgcggagacc tggctggggc gtcgggccct gcccctttct ttgtctgagg 60

ccgacttccc cgagcgttct ccgggggcga gggctgctcc ttaggtccct gtttggcccc 120

tcagcctccc tccccgcctg cccaggagcg gccccgcggg cggcgctggc tttgtctgcc 180

aggattgctc gctagaggtt ggaggcctcc gccgggaccc cgctgagccg aactccggcg 240

ccgcgcggac gagagccgcg gcgggcccgg ggccggcact cctggttcgg tagccctcgc 300

cccatcagcg cgccccggcg agtgcgcgcc cgtgccgggc ggggtgaggg cgacgggagc 360

ctggacggcc gctgctgctc ggggctctgc ttctcgtccc cagcagcgag ctcggggatg 420

ggccaccctt tcggctcagt cacccaccct cggctcccag gagatcgggt ccggggtggg 480

ggtgggcgta ggccggggcg ggccgcccct tcctcctgcc ccgccgtggt tgtgctcagt 540

ctcccacgcc gccgtgggtc ccactctgcc cggcttgggt ttgggacggc cggagtttga 600

gtaggcggtg acccagcttc tccgcgttag tcgtgtgggg ttgtgtttgg gagcaaagcc 660

tgacccctga cctagccgga gttctggtag agtgaggttt gtggctgcgg actgtgcttg 720

tcccgggccg ctgctgcttc tcctccaccc ccaggggtgg ggtgcgggtg ggtaggaagt 780

gcctgtgtga gggtgtgtgg agggactttg gccctgggac cgcaggagca cttgtcttgg 840

ggacttaaag ttgatctccg gcgagaaaca gtccgtgcta gggggagtcg ggggaagtcg 900

tgggcccggg tactggcctg gggctgggcg cagagcggtg gtgagtgcgg cggtgtcaca 960

cactcgttgg ctgtgctggc gctgctatcc gggaggtcag gcggtgctgg gcggctgtgc 1020

agagcattgt attggagcct ctgcaggtgt gctcttggca gtggtctgct ctccagggga 1080

tcttcctccc ttccgagagg gagttgctct tgggctagtg agagagtggc ctgccaaatc 1140

ctcaaaagta gccttcccct tgccccttga ccttgaagtc cagaagcagt tagtgcctgc 1200

tgagtgctcc ggccaccctt ctctatttgt gaagggaaac ctggggacag gccatcggag 1260

cacccctatg tccttgccac atttcagcta gccgagtggt tggtgggggc ggccgtcttt 1320

ccagggatct tcctgggccc tggcaccccc agaatgaagc ccagactcca ccataatggc 1380

cctgtatgcc cttctatccc cttagctgct ggtgtgatca tagcctcaaa ttgctgggct 1440

caagtgatcc tcccacctca gcctcccaaa gcacagggat tacaggtgtg agccaccacg 1500

cgcagtctga tcccactccg atccctaacg ttatagtgac aggccctgga aacccagggc 1560

caccagatgt attttccctt tccttctcat tgtgttgcac cccaacttca gttggagact 1620

ctggatatat ccatccccac atctctgaac tccactgctt gggccaccta atgtcatcct 1680

cagtttagtt aacaaagcat ggttgagatt tctgtggggt gcgaggcatt gttgcaggca 1740

ctattccaag tctggaaagt ccctcaccag ctatgaactt ggtgtggtct tagaacccag 1800

gctggacatg gcataggtgc tcagtagtgt ttattgatct gagcttgatc tcagcgtagc 1860

aggatcattt agggagacgg ggttgtgggg ggggtctgag cccatgggtg cttctgaagg 1920

tttgtggctg ccccaggaag aaagggcatg gagctgcaga atggttggct gcccagggaa 1980

ttgtcccctt caccagctgg gcagctgtgc tagtctctga ggactggtga aggtccttct 2040

catgtaggaa gtggcagtat gaagtgggag aggagatggc tctgccctga aggttgtggc 2100

ggcagtgaag tgaagttccc atggaggccg gggagcagga aagccctggg ttctggaact 2160

atttcctgag gcctcactct atgccaccat gtgctcagga atttgaccca tttaacttca 2220

actgaggtag aattcctttt agcagtgcct gcaaagtggc attgtgccag gcctgggaaa 2280

cctttgctgg cttaaaattt agtgaaggac aagattattt catagtgata ctaatgtgag 2340

tttattgaga cttacaccct agaagtttga cttgtaataa ctcatttaat ccttgaaaac 2400

agctgtgatg gctgggcgtg atggctcatg cctgtaatcc cagcactttg ggaggccgag 2460

gtgggtggat cacctgaggt caggagttca agaccagcct gaccaacacg gtgaaaccct 2520

gtctctacga aaaatacaaa attagctggg cgtggtggca catgcctata atcccagcta 2580

cttgggaggc tgaggcagga gaattgcttc aatctgggag gtggaggttg cagtgagctg 2640

agatcgcgcc gttgcactcc agcctgggca acaagaatga aactccatct caaaaaacaa 2700

aaaacaaaaa gcaaaacaac cgtgatgtca acagctccat tttacagatg aggaaactgt 2760

ggtcccgaga ggtcacagag taacttgctt gaagtctcaa tatgagctgg gttttctcat 2820

ttcttttttt ttgatactga gtctcactct attgcccagg ctggagtgca gtggcgtgat 2880

ctcggctcac tgcaacctcc gcctcctggg ttcaagtgat tcttctcctg cctcagcctc 2940

ccaagtagct tggactacag gtgtgcacca ccacacccag ctaatttttg tatttttagt 3000

agagatgggg tttcaccatg ttggccaggc tggtcttgaa ctcctgacct caagtgatcc 3060

gcccgcctcg gcctcccaaa gtgctgggat tacaggcgtg agccactgtg ccggaccagg 3120

ttttctcatt tctaatttag acaatatgtt cctctcagag gtgattaaaa tggattcata 3180

taccaaacaa gcctggccca cagtggaact aatgaatgtt ttcagtgaag gtgcccttgt 3240

atccctgcct ctgaacacat ctcatctgtc cagcacagcc tgggcacata gcaggtaccc 3300

cggaaccccc gctgattggt gatggagctt ctgtctccct aaggccaggg aatgggaaga 3360

ccagcactac cacatgcaga agattgggga gtcactgctt gtgtctgtct ggacagatca 3420

cggtttgctg tggtaacagc aatccccagg tctcagaggc ttaaagcaac agaggtttat 3480

ttcttgttca cactgcatgt tcatcactta tctgctttat gttgtcctca ctggggggac 3540

ccatagtgat tagtgggaac acccctggtg gcttggacag agggacagag aacatgatga 3600

tccctgtgtc ctgccactga gtcctggtgg cctttaagat gcctatggga aggggattag 3660

gttcctgctg cctgtctctg ccctgccgtg tcagtccttg gatatcttgc atgttccatc 3720

cgctacctgg atgtggcctg taggggcagc cacctttcct agaagcagga gcaggtagcg 3780

atacccaggc aggcctggtc ctccccactt ttgtgggact cggggattga gcttgcaggc 3840

ataggggtgt agaaagcagt ggtagcgagg tgactgaagg tggactccca ctggggatgg 3900

gattgagtgt ggggctagat ccctggtctg tagaagggag taggaaccct gttagttaaa 3960

ttttccccct caggccacgt tagtaggatt ttgaagagtc agccacactg tggctcttga 4020

ttttgtgcct ggtcacctgc ttggtctctg gtgatttccc tcggggccag cagacactgt 4080

tggaggtggt gaggcctcag gttcttctgc ttcatggtta actcactctg cttaggcata 4140

tttccacctt ttccagggcc tccgtttttc tgccagtgga ttgagaggtg gtggtggtct 4200

ccagcagtgg tctcactctt ggcaggctat cagagtaccc agggagctgc gtagaatgaa 4260

gttttgagag tctttggtct aggtgaatgc cagcgtttca gtttgcttat cttccattat 4320

agtagtgtcc tctgtaactg tgaatcaggg aggttattca taatatctcc acatccattt 4380

tctcccttaa ttgcgtatgc ttttgattta gacagggcaa gtagccattt tggtggagcg 4440

caggccctgg caggggggca gtgtccagtg ccgctctcaa ttaaacgtga agatgtgaag 4500

atgaataaca ctgtccagct tgcagagtgg acggtggtga ggcaagcttt caagttgcac 4560

ctactttcta gttgagtgac ctacacaagt ctttgatttt tttttttttt cttcctggaa 4620

aaaaaaagtt gtctactttt ctcatctgta aagtgagaag aatcaagtct gccttttctg 4680

tctcacgggg ttgcagtgaa gcattagtac cctgagaagc aagatccaaa gcccctgagt 4740

taggcctgac actggtgtga gacagctgcc atctctggcg gcactcagca agtgttcacc 4800

agcagctgat tctgggaacc tcacttcctc cgcccttggg cttggtgggg ttgggtaggg 4860

ttgggtgggg ctgtggtttt cttttaggag gcagcaggcc aggcctggag accagagctt 4920

aagtgggcct gggcaggctg gggttgaaac tcttcacccc ttgcggtctg tactgcctcc 4980

caactgagca gccagggaga aggcctagag cctgtgcctt tcagctagat agctggagga 5040

actggctcct ccctccttag gctgtgctgg cctgagctgg gagcctgaga gctggggcag 5100

ttgtctctaa agtggcttct gggattctgg taagaggtga gctcctggtg ctgcctcaga 5160

gtctttgtgt ttcctggcat ttgggagagc tggagttggg ctgtcctgca tgggtaaggt 5220

ttggggaggg actggaacaa ggggctagtg aaccttctct gggtttttcc tgcctgacta 5280

tgcgttgaca gtcccagctg ttgggcctgt gctcctgtac actgcacggc cttgagagga 5340

gttcggagcc ctaacatcca ggagagaggc cccacagcag tggaaggaaa tgggcctctc 5400

ccgaatctct tgtttgtacc ccgaggtctg agtggtgatc ctggggatgc tatgggactc 5460

tcagcagtag gagtgtgtct gtccccagtc tgggtgccca ccagctgtgc tgagggtcct 5520

ctcctgtgtc cctgggccag gcagacaggg tctttttctg gggcttgtta ggggaggtca 5580

gccacagccc cagaccaagt aatttacaca ccctgagtga ggggtgggag cagtgggtcc 5640

aggaagactt agggagctgg tgaaagaaaa acttaattct gacacttgtt aaactggtaa 5700

ggtagactgt atcaggacta ttacgataga tgtaggaatt atcgcaatgg attttgcagt 5760

agaggggaga gagtgggcca actccaaata caacaaagaa aagtgggaac ttatagccaa 5820

ggagcggagt gtgggggctc ctgaaaattt ctaagagggt agggaaattt ttactaaact 5880

tagctaactg aattcttgct gcaggcaggc cagggtgatc aggttttacc tgggagatag 5940

tacaggatga gaaatacgtt cagatatcca gggtgattag atattgaggt tgggggattc 6000

tggttaacag gagttttgct aaaactaggc tcttagagag aatggagtta ggaaccctag 6060

gtcaggacca gatgagtaga gggctcagag gaataaagtt tggtgaggga cagaatctct 6120

gtcagtatcc cgtggttggc agtgtcctgt ccattcttct tgcactggcc tgtccctcag 6180

gagacaggtg tgagtggtcc tgagcttggg ccagtgtaag agtaggggac aggtttctct 6240

ccttgtaggt gtcccttctt gtaagtgtca ctctcttttt ttccagaaac cttggtcctt 6300

ttcagcatct gctggcccct tgtcccttgg ctcccttgct cttggcctgc tggatttccc 6360

ctctgcaccc aggaaatcgc atggacctgg gtccttgttt ccctacagcc caccaatttt 6420

gctgcttttt tctgccccct gaagctgagc tcctgctgca atttgtgttc cctgctctcc 6480

ctgtcctggg caaaccagtc tgacaacttt gtggttctcg ctcccgcctc catcagcctg 6540

gggattgact gtcccatttg tctgagctgg gcagagggag gtgctgtggg ggatctcttc 6600

ctcttgcctg gactgcacac tcctgctgcc ttctagccgg agctcctggg cattttgcct 6660

atgggagctt caccagcttc cttctgtctg aggcctacaa gtccctgcct ccagcctacc 6720

ttgttcctcc tccatgagtg aggctcctcc ttttctctct ggccctcctg tctacttgat 6780

cagactctgc ctctcttgag ggccggctcc ctccagccta ccctgcacag gtgaccctgt 6840

ttggcctgcc tccttttctt gaggctgatc ttgtctcaac agtcagcttt tcaggaacca 6900

ggcccttgct gttgtaagga aaacctgtcg gctgtggatg gggccttccc tccttcctaa 6960

aggctctgta gccagcttcc acccttgcag tggaacagtg gtggtgccag aaccctgctc 7020

tctgcagcca tcctgcctac cacagtcatt gtgttttgta actctagtag cttcttgtga 7080

aatacaagtg atggtataaa cgtggatagg tttttgaggg gggcatgcca aaatcagagt 7140

tggtggtagt ggtgggggat tcattcccaa gggctctggg gtgctaagtg tgtgagcaaa 7200

gaggaacaag tggcatgtgc ccaggatggg gtggggcggg caggtttagt tgagggctcc 7260

tctggtgtag ggtagccctg acgctcccct ccatggcatg actgatgagg tggcaaaggc 7320

aggtgccagg atttggtgtg ttgaagatta gtgcctgggt tgggctctgc tcactcctgc 7380

agaaagacgg ttggagaggg gctggtcttg gtttcacaga ggattgtggg attacaggca 7440

agacctgctg agggcttgca ctgagccacc gagaggagca gaaagagata cgagggcttc 7500

aggtgccagt atggttctca ctgttgtgag atctcatttg tgcctttttt ttttttcctt 7560

cagacagggt ctcactctgt tgcccaggct ggagtgcagt ggccctatca cagctcactg 7620

aggcctccac cttcctggct caagtgatcc tcccgcctca gcctcctgag tagcagggac 7680

cacaggcatg cagcaccaca cccagctaat ttaaagaatt ttttgtagag attggatctt 7740

gctatgttgc ctaggctggt gtcaaactcc tgggcacttg atttgtgctt cttaattcag 7800

gggctactta ttgaacatat ttagcagtct tcagaaagca tcttattctg taaggggaac 7860

caaatatacc cattccccct ctctggcctt ctttccctgt ggtctgggcg gtctttgagc 7920

ttgaggtcat taggaggtgt ttatttctgt ccgccctggt ggcctagggc gtaggaatgg 7980

ggtgggatgg gatgggatgg ggtggggtgg ggtggaggag ttattctaca tagatagagt 8040

tctgtttatg cagcactccc tgccatacac atctctcact caaatggtct ggccagtcct 8100

ggttctaatg gtcattgtgt cattcccctc agcagcagga aaggctggaa tggtttttgt 8160

attgttcctt agggggaaaa atcacttgga ggaagtatat cagtgcttct gagtgcagag 8220

tatttattga cacgtcagtt aaaggaagct tttaaacaac atatatgtat ctctttagtg 8280

aggaataaat ctacaagtgc atctcacagc tccattttgc agcttccatt tcctggaagg 8340

tacatggagt ttagtggtta gggaatgggg ttttgagctg ggattttgga gaaactgttt 8400

ttagcctgtc cttggaattg ggccaggcct agaaatctgt tgaaatagct ttctttagtt 8460

gctgaaactg ggatgtgttc atagcactag gacctcgagc tccactgatg actgagtggg 8520

gagggctcag agaagggtcc ctgtggatgc ccgggatgcc tgggtttcag tcccgtctcc 8580

tgcatcgcct acattgcctg aatcttaggg tcttacagat ttatcatgaa gtgggcttgg 8640

cagcagatgg tctggtttct tttgtgcctt tgtcagaatc tgttcttgct cttcttagga 8700

aaactttcta tttcag 8716

<210> 205

<211> 3812

<212> DNA

<213> 人类

<220>

<223> B2M

<400> 205

gcgtgagtct ctcctaccct cccgctctgg tccttcctct cccgctctgc accctctgtg 60

gccctcgctg tgctctctcg ctccgtgact tcccttctcc aagttctcct tggtggcccg 120

ccgtggggct agtccagggc tggatctcgg ggaagcggcg gggtggcctg ggagtgggga 180

agggggtgcg cacccgggac gcgcgctact tgcccctttc ggcggggagc aggggagacc 240

tttggcctac ggcgacggga gggtcgggac aaagtttagg gcgtcgataa gcgtcagagc 300

gccgaggttg ggggagggtt tctcttccgc tctttcgcgg ggcctctggc tcccccagcg 360

cagctggagt gggggacggg taggctcgtc ccaaaggcgc ggcgctgagg tttgtgaacg 420

cgtggagggg cgcttggggt ctgggggagg cgtcgcccgg gtaagcctgt ctgctgcggc 480

tctgcttccc ttagactgga gagctgtgga cttcgtctag gcgcccgcta agttcgcatg 540

tcctagcacc tctgggtcta tgtggggcca caccgtgggg aggaaacagc acgcgacgtt 600

tgtagaatgc ttggctgtga tacaaagcgg tttcgaataa ttaacttatt tgttcccatc 660

acatgtcact tttaaaaaat tataagaact acccgttatt gacatctttc tgtgtgccaa 720

ggactttatg tgctttgcgt catttaattt tgaaaacagt tatcttccgc catagataac 780

tactatggtt atcttctgcc tctcacagat gaagaaacta aggcaccgag attttaagaa 840

acttaattac acaggggata aatggcagca atcgagattg aagtcaagcc taaccagggc 900

ttttgcggga gcgcatgcct tttggctgta attcgtgcat ttttttttaa gaaaaacgcc 960

tgccttctgc gtgagattct ccagagcaaa ctgggcggca tgggccctgt ggtcttttcg 1020

tacagagggc ttcctctttg gctctttgcc tggttgtttc caagatgtac tgtgcctctt 1080

actttcggtt ttgaaaacat gagggggttg ggcgtggtag cttacgcctg taatcccagc 1140

acttagggag gccgaggcgg gaggatggct tgaggtccgt agttgagacc agcctggcca 1200

acatggtgaa gcctggtctc tacaaaaaat aataacaaaa attagccggg tgtggtggct 1260

cgtgcctgtg gtcccagctg ctccggtggc tgaggcggga ggatctcttg agcttaggct 1320

tttgagctat catggcgcca gtgcactcca gcgtgggcaa cagagcgaga ccctgtctct 1380

caaaaaagaa aaaaaaaaaa aaagaaagag aaaagaaaag aaagaaagaa gtgaaggttt 1440

gtcagtcagg ggagctgtaa aaccattaat aaagataatc caagatggtt accaagactg 1500

ttgaggacgc cagagatctt gagcactttc taagtacctg gcaatacact aagcgcgctc 1560

accttttcct ctggcaaaac atgatcgaaa gcagaatgtt ttgatcatga gaaaattgca 1620

tttaatttga atacaattta tttacaacat aaaggataat gtatatatca ccaccattac 1680

tggtatttgc tggttatgtt agatgtcatt ttaaaaaata acaatctgat atttaaaaaa 1740

aaatcttatt ttgaaaattt ccaaagtaat acatgccatg catagaccat ttctggaaga 1800

taccacaaga aacatgtaat gatgattgcc tctgaaggtc tattttcctc ctctgacctg 1860

tgtgtgggtt ttgtttttgt tttactgtgg gcataaatta atttttcagt taagttttgg 1920

aagcttaaat aactctccaa aagtcataaa gccagtaact ggttgagccc aaattcaaac 1980

ccagcctgtc tgatacttgt cctcttctta gaaaagatta cagtgatgct ctcacaaaat 2040

cttgccgcct tccctcaaac agagagttcc aggcaggatg aatctgtgct ctgatccctg 2100

aggcatttaa tatgttctta ttattagaag ctcagatgca aagagctctc ttagctttta 2160

atgttatgaa aaaaatcagg tcttcattag attccccaat ccacctcttg atggggctag 2220

tagcctttcc ttaatgatag ggtgtttcta gagagatata tctggtcaag gtggcctggt 2280

actcctcctt ctccccacag cctcccagac aaggaggagt agctgccttt tagtgatcat 2340

gtaccctgaa tataagtgta tttaaaagaa ttttatacac atatatttag tgtcaatctg 2400

tatatttagt agcactaaca cttctcttca ttttcaatga aaaatataga gtttataata 2460

ttttcttccc acttccccat ggatggtcta gtcatgcctc tcattttgga aagtactgtt 2520

tctgaaacat taggcaatat attcccaacc tggctagttt acagcaatca cctgtggatg 2580

ctaattaaaa cgcaaatccc actgtcacat gcattactcc atttgatcat aatggaaagt 2640

atgttctgtc ccatttgcca tagtcctcac ctatccctgt tgtattttat cgggtccaac 2700

tcaaccattt aaggtatttg ccagctcttg tatgcattta ggttttgttt ctttgttttt 2760

tagctcatga aattaggtac aaagtcagag aggggtctgg catataaaac ctcagcagaa 2820

ataaagaggt tttgttgttt ggtaagaaca taccttgggt tggttgggca cggtggctcg 2880

tgcctgtaat cccaacactt tgggaggcca aggcaggctg atcacttgaa gttgggagtt 2940

caagaccagc ctggccaaca tggtgaaatc ccgtctctac tgaaaataca aaaattaacc 3000

aggcatggtg gtgtgtgcct gtagtcccag gaatcacttg aacccaggag gcggaggttg 3060

cagtgagctg agatctcacc actgcacact gcactccagc ctgggcaatg gaatgagatt 3120

ccatcccaaa aaataaaaaa ataaaaaaat aaagaacata ccttgggttg atccacttag 3180

gaacctcaga taataacatc tgccacgtat agagcaattg ctatgtccca ggcactctac 3240

tagacacttc atacagttta gaaaatcaga tgggtgtaga tcaaggcagg agcaggaacc 3300

aaaaagaaag gcataaacat aagaaaaaaa atggaagggg tggaaacaga gtacaataac 3360

atgagtaatt tgatgggggc tattatgaac tgagaaatga actttgaaaa gtatcttggg 3420

gccaaatcat gtagactctt gagtgatgtg ttaaggaatg ctatgagtgc tgagagggca 3480

tcagaagtcc ttgagagcct ccagagaaag gctcttaaaa atgcagcgca atctccagtg 3540

acagaagata ctgctagaaa tctgctagaa aaaaaacaaa aaaggcatgt atagaggaat 3600

tatgagggaa agataccaag tcacggttta ttcttcaaaa tggaggtggc ttgttgggaa 3660

ggtggaagct catttggcca gagtggaaat ggaattggga gaaatcgatg accaaatgta 3720

aacacttggt gcctgatata gcttgacacc aagttagccc caagtgaaat accctggcaa 3780

tattaatgtg tcttttcccg atattcctca gg 3812

<210> 206

<211> 23

<212> DNA

<213> 人工的

<220>

<223> SS 3'白蛋白

<400> 206

attggcgatt ttctttttag ggc 23

<210> 207

<211> 20

<212> DNA

<213> 人工的

<220>

<223> SS 3'共有

<400> 207

tttttttttt tttttttcag 20

<210> 208

<211> 7

<212> DNA

<213> 人工的

<220>

<223> SS 5 白蛋白

<400> 208

ggtaggt 7

<210> 209

<211> 888

<212> DNA

<213> 人工的

<220>

<223> anHAL_S100A9

<400> 209

ctgacccagc ctcaccgcag tttgggttga caagggagga tgggagtatg ggctacagca 60

atcaagggga agatttgagc tcctggagcc cagccccaag acgcagcgag tgtcctgtta 120

tacagggcag gtgctcacag ttacacagga cgacagggtc aagaaattgc tcaattgaac 180

acctgctatt tgtcgggccc tgttctgggc agagggatgt agtggtaaat ggggagccca 240

ctattccagt ggagggagac acacagtaaa gttgttggcc aataaagagc acagataaag 300

ccaaatgcca ataagtgcct ggaagaaaat gagatagagt gcgctgtggg caatggggct 360

gggtggggtg gaggtgacca gttagggtac atgagaaggg cctctttgag gaggtaacat 420

ttgagctgag ccccgaatgt tggggaggga agcccctgag gatgacactt ggcacaaagc 480

tgaggagacc ctaagcctca ggcgggaact tggggtggaa gacttggggg cttttctaat 540

cctaagggtc tgcggtggaa aatgaatgca taaagagcac atggagagca cctgcacagc 600

actcagggaa ctgggaggtt tttcccccgc tccaaaaatg attaggcagt tctaagaaaa 660

aggctgagca cttccaacag cctttttgtt ttcttttcaa atttggggaa agtcgggaaa 720

cagaggcctg cattaagaag ggtggaacac atgggtctca gtctcagttc cagtcccgga 780

gccagacatc ctggggtagg tccccagccc tcccagtgcc cctccctccg ccttggtaag 840

gtggagaatt gcagccttca gagttagggg ccctgacagc tctccata 888

<210> 210

<211> 149

<212> DNA

<213> 人工的

<220>

<223> 重写的S100A9 ex1

<400> 210

atgacttgca aaatgtcgca gctggaacgc aacatagaga ccatcatcaa caccttccac 60

caatactctg tgaagctggg gcacccagac accctgaacc agggggaatt caaagagctg 120

gtgcgaaaag atctgcaaaa ttttctcaa 149

<210> 211

<211> 340

<212> DNA

<213> 人工的

<220>

<223> anHAR_S100A9

<400> 211

ggtggaggcc tcaggcaggc aggatgctgg gtggggtagg caagaaaggg cccagcagag 60

aggccgcatg gcaaaactat cctccatgtg accccctatg cccgcttcac cccccacctg 120

acatccccca ccagaagcaa agcgatgctg tgggaaagga agcagagcct catggatggg 180

ctgcacagga gagtgctcgc attggctggg taccccacag gttctgggag gggacttagc 240

gaggtgactc agccagaggg tggcagagct ggaaccaacc agtgctctct tggaccccgc 300

ctgggtctgg gtcttccacc tcccctgatg tctctccttt 340

<210> 212

<211> 895

<212> DNA

<213> 人工的

<220>

<223> anHAL_CD11b

<400> 212

aacttttggg tctgtcataa atagagggcc cagaatatgt aggagtcagt ctggggagag 60

gcaaagggga tttggggaag gagaaagggt tcaagaagaa gcagggagaa cagctagacc 120

cagacaggct ggccagggaa gcctggatga atgaccacat tcatggactg tgcaaggctg 180

cttgccggtc cccttgcttc acacatgagg agacggaggc ccagggagga gaagtgacat 240

ggctcagggt gcgcagcagg tgtgagaccc ctttcctgag tgcttcctcc tggatcccct 300

ctcaccatct ccactttgcc tccggttcta ttttccaagg tcccgggtgc aaatgtttgt 360

tgaatgactg atgaatgaaa atgatttgag tttgttacct tttatgctta tatgttgtgg 420

aaaatgaaat tctcctcaaa agggaaggaa atacttgaga gctgcatagg aaggaaatta 480

tctaattaag aatgtataga aacttcactg ttgggcaaat catcgttgtg acaccggggg 540

aagaagccat ttaggtgctc agaagggagg ctggaattca gagcaggact ggacgtgccc 600

cacgacggtg gttcttaggt caggagtcag caaacagtgg cctgggggcc cgatatggcc 660

cacgacctgt ttttgcacaa cctgccagct agagattgaa gatgaacact gataatcgat 720

ttgatgatag ggagcaccac ccccaaagaa ttctatttgt ctcatttgta aacccgtatt 780

acaaacaaat tgtactcaat cattatgttt gaaatttccc taatgacaaa tttgtggaaa 840

agtattttct gtcttgttat ataagtactt gtacaacata ttctatcagc ctctt 895

<210> 213

<211> 28

<212> DNA

<213> 人工的

<220>

<223> 重写的CD11b ex1

<400> 213

atggctctca gagtccttct gttaacag 28

<210> 214

<211> 430

<212> DNA

<213> 人工的

<220>

<223> anHAR_CD11b

<400> 214

ggtctgcaaa acctaaaatt tactatctgg ctgtttacag aataagtgtg ctaatccccg 60

ccccaggcta acagagctgg acctgggagg cagacatctg gatgctgggt tagttagggt 120

gaccgaatgg atgggaaagg gaatggagca ggaagacatg ctgctatctt tttttttttt 180

tttttttttt gatacagggt ctttctctgt tgcccaggct gtagtgcagt ggcatgatca 240

tggttcactg cagccttgac ctcctgggtt caagcaatcc tcccacctca gcctcctgag 300

taccactaca cccggctaat tttttatttt ttgtagagat ggggtctcac tgtgttgcct 360

aggctggtct taaactcctg agcccaggtg atcctcccac gtcagcctct taaattattg 420

ggataacagg 430

<210> 215

<211> 3

<212> PRT

<213> 人工的

<220>

<223> GSG接头

<400> 215

Gly Ser Gly

1

<210> 216

<211> 19

<212> PRT

<213> 人工的

<220>

<223> aaP2A

<400> 216

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn

1 5 10 15

Pro Gly Pro

<210> 217

<211> 18

<212> PRT

<213> 人工的

<220>

<223> aaT2A

<400> 217

Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro

1 5 10 15

Gly Pro

<210> 218

<211> 239

<212> PRT

<213> 人工的

<220>

<223> aaEGFP

<400> 218

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210> 219

<211> 925

<212> PRT

<213> 人工的

<220>

<223> TALEN CD11b左

<400> 219

Met Gly Asp Pro Lys Lys Lys Arg Lys Val Ile Asp Ile Ala Asp Leu

1 5 10 15

Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys

20 25 30

Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly

35 40 45

Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu

50 55 60

Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu

65 70 75 80

Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala

85 90 95

Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro

100 105 110

Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly

115 120 125

Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr

130 135 140

Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser

145 150 155 160

Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro

165 170 175

Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile

180 185 190

Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

195 200 205

Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val

210 215 220

Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

225 230 235 240

Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln

245 250 255

Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr

260 265 270

Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

275 280 285

Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu

290 295 300

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

305 310 315 320

Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln

325 330 335

Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His

340 345 350

Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly

355 360 365

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

370 375 380

Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile

385 390 395 400

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu

405 410 415

Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser

420 425 430

Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

435 440 445

Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile

450 455 460

Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

465 470 475 480

Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val

485 490 495

Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

500 505 510

Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln

515 520 525

Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr

530 535 540

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

545 550 555 560

Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu

565 570 575

Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

580 585 590

Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln

595 600 605

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His

610 615 620

Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly

625 630 635 640

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

645 650 655

Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly

660 665 670

Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro

675 680 685

Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala

690 695 700

Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Gly

705 710 715 720

Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys

725 730 735

Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile

740 745 750

Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu

755 760 765

Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys

770 775 780

His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly

785 790 795 800

Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly

805 810 815

Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val

820 825 830

Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp

835 840 845

Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser

850 855 860

Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His

865 870 875 880

Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile

885 890 895

Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg

900 905 910

Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ala Ala Asp

915 920 925

<210> 220

<211> 925

<212> PRT

<213> 人工的

<220>

<223> TALEN CD11b右

<400> 220

Met Gly Asp Pro Lys Lys Lys Arg Lys Val Ile Asp Ile Ala Asp Leu

1 5 10 15

Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys

20 25 30

Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly

35 40 45

Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu

50 55 60

Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu

65 70 75 80

Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala

85 90 95

Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro

100 105 110

Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly

115 120 125

Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr

130 135 140

Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser

145 150 155 160

Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro

165 170 175

Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile

180 185 190

Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

195 200 205

Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val

210 215 220

Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

225 230 235 240

Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln

245 250 255

Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr

260 265 270

Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

275 280 285

Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu

290 295 300

Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

305 310 315 320

Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln

325 330 335

Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His

340 345 350

Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly

355 360 365

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

370 375 380

Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly

385 390 395 400

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

405 410 415

Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser

420 425 430

Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

435 440 445

Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile

450 455 460

Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

465 470 475 480

Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val

485 490 495

Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

500 505 510

Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln

515 520 525

Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr

530 535 540

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

545 550 555 560

Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu

565 570 575

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

580 585 590

Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln

595 600 605

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His

610 615 620

Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly

625 630 635 640

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

645 650 655

Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly

660 665 670

Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro

675 680 685

Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala

690 695 700

Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Gly

705 710 715 720

Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys

725 730 735

Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile

740 745 750

Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu

755 760 765

Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys

770 775 780

His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly

785 790 795 800

Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly

805 810 815

Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val

820 825 830

Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp

835 840 845

Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser

850 855 860

Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His

865 870 875 880

Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile

885 890 895

Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg

900 905 910

Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ala Ala Asp

915 920 925

<210> 221

<211> 925

<212> PRT

<213> 人工的

<220>

<223> TALEN S100A9左

<400> 221

Met Gly Asp Pro Lys Lys Lys Arg Lys Val Ile Asp Ile Ala Asp Leu

1 5 10 15

Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys

20 25 30

Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly

35 40 45

Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu

50 55 60

Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu

65 70 75 80

Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala

85 90 95

Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro

100 105 110

Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly

115 120 125

Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr

130 135 140

Gly Ala Pro Leu Asn Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser

145 150 155 160

Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

165 170 175

Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile

180 185 190

Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu

195 200 205

Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val

210 215 220

Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

225 230 235 240

Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln

245 250 255

Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr

260 265 270

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

275 280 285

Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu

290 295 300

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

305 310 315 320

Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln

325 330 335

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His

340 345 350

Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly

355 360 365

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

370 375 380

Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp

385 390 395 400

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

405 410 415

Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser

420 425 430

His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

435 440 445

Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile

450 455 460

Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

465 470 475 480

Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val

485 490 495

Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

500 505 510

Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln

515 520 525

Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr

530 535 540

Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

545 550 555 560

Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu

565 570 575

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

580 585 590

Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln

595 600 605

Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His

610 615 620

Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly

625 630 635 640

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

645 650 655

Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly

660 665 670

Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro

675 680 685

Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala

690 695 700

Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Gly

705 710 715 720

Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys

725 730 735

Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile

740 745 750

Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu

755 760 765

Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys

770 775 780

His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly

785 790 795 800

Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly

805 810 815

Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val

820 825 830

Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp

835 840 845

Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser

850 855 860

Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His

865 870 875 880

Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile

885 890 895

Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg

900 905 910

Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ala Ala Asp

915 920 925

<210> 222

<211> 925

<212> PRT

<213> 人工的

<220>

<223> TALEN S100A9右

<400> 222

Met Gly Asp Pro Lys Lys Lys Arg Lys Val Ile Asp Ile Ala Asp Leu

1 5 10 15

Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys

20 25 30

Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly

35 40 45

Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu

50 55 60

Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu

65 70 75 80

Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala

85 90 95

Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro

100 105 110

Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly

115 120 125

Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr

130 135 140

Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser

145 150 155 160

His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

165 170 175

Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile

180 185 190

Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

195 200 205

Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val

210 215 220

Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

225 230 235 240

Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln

245 250 255

Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr

260 265 270

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

275 280 285

Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu

290 295 300

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

305 310 315 320

Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln

325 330 335

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His

340 345 350

Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly

355 360 365

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

370 375 380

Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn

385 390 395 400

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

405 410 415

Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser

420 425 430

His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

435 440 445

Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile

450 455 460

Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

465 470 475 480

Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val

485 490 495

Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

500 505 510

Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln

515 520 525

Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr

530 535 540

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro

545 550 555 560

Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu

565 570 575

Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu

580 585 590

Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln

595 600 605

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His

610 615 620

Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly

625 630 635 640

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

645 650 655

Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly

660 665 670

Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro

675 680 685

Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala

690 695 700

Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Gly

705 710 715 720

Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys

725 730 735

Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile

740 745 750

Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu

755 760 765

Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys

770 775 780

His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly

785 790 795 800

Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly

805 810 815

Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val

820 825 830

Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp

835 840 845

Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser

850 855 860

Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His

865 870 875 880

Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile

885 890 895

Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg

900 905 910

Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ala Ala Asp

915 920 925

<210> 223

<211> 717

<212> DNA

<213> 人工的

<220>

<223> 多核苷酸EGFP

<400> 223

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480

ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaag 717

<210> 224

<211> 57

<212> DNA

<213> 人工的

<220>

<223> 多核苷酸P2A

<400> 224

gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacct 57

<210> 225

<211> 54

<212> DNA

<213> 人工的

<220>

<223> 多核苷酸T2A

<400> 225

gagggcagag gcagcctgct gacctgcggc gacgtcgagg agaaccccgg gccc 54

<210> 226

<211> 9

<212> DNA

<213> 人工的

<220>

<223> GSG多核苷酸接头

<400> 226

ggaagcgga

Claims

1.一种用于在***位点处将外源性编码序列整合到内源性内含子基因组区域中的方法，包括下列步骤：

-提供包括内源性内含子基因组区域的细胞，

a)第一同源多核苷酸序列，其与所述***位点上游的内含子序列同源，

b)第一强剪接位点序列，包括分支点和剪接受体；

c)编码2A自切割肽的第一序列；

d)编码目的蛋白质的外源序列；

e)编码2A自切割肽的第二序列；

f)第一外显子的编码序列的拷贝；

g)包括剪接供体的第二强剪接位点序列；和

h)第二同源多核苷酸序列，其与所述***位点下游的内含子序列同源；

-诱导所述外源性多核苷酸至所述内含子序列中的整合，优选地通过同源重组，以使所述外源性编码序列在所述内源性基因座处与所述第一外显子或它的拷贝一起转录。

2.根据权利要求1所述的方法，其中所述整合形成人工外显子(Artex)并且被引入到造血干细胞(HSC)中，以获得所述外源性编码序列到至少一种造血细胞谱系中的表达。

3.根据权利要求1至2中任一项所述的方法，其中所述外源性编码序列编码用于治疗基因疾病的目的蛋白质。

4.根据权利要求1至3中任一项所述的方法，其中所述外源性编码序列用于在祖细胞中表达。

5.根据权利要求4所述的方法，其中所述外源性编码序列表达从FANCA、FANCC或FANCG中选择的蛋白质。

6.根据权利要求1至5中任一项所述的方法，其中所述外源性编码序列使所述目的蛋白质在红细胞中表达。

7.根据权利要求6所述的方法，其中所述外源性编码序列表达选自HBB、PKLR或RPS19中的蛋白质。

8.根据权利要求1至3中任一项所述的方法，其中所述外源性编码序列用于在粒细胞中表达。

9.根据权利要求9所述的方法，其中所述外源性编码序列表达选自HAX1、CYBA、CYBB、NCF1、NCF2或NCF4中的蛋白质。

10.根据权利要求1至4中任一项所述的方法，其中所述外源性编码序列用于在巨核细胞中表达。

11.根据权利要求11所述的方法，其中所述外源性编码序列表达选自因子8、因子9、因子11或WAS中的蛋白质。

12.根据权利要求1至4中任一项所述的方法，其中所述外源性编码序列用于在单核细胞中表达。

13.根据权利要求13所述的方法，其中所述外源性编码序列表达选自IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5中的蛋白质。

14.根据权利要求1至4中任一项所述的方法，其中所述外源性编码序列用于在B细胞中表达。

15.根据权利要求15所述的方法，其中所述外源性编码序列表达选自ADA、IL2RG、WAS或BTK中的蛋白质。

16.根据权利要求1至4中任一项所述的方法，其中所述外源性编码序列用于在T细胞中表达。

17.根据权利要求5所述的方法，其中所述外源性编码序列表达选自ADA、IL2RG、WAS、BTK或CCR5中的蛋白质。

18.根据权利要求1至18中任一项所述的方法，其中所述外源性序列的所述表达还允许所述内源性基因座的表达，尤其是所述***位点下游的内含子序列。

19.根据权利要求1至19中任一项所述的方法，其中所述外源性编码序列的表达产生允许交叉纠正内源性缺陷蛋白的目的蛋白质。

20.根据权利要求1至20中任一项所述的方法，其中所述方法离体进行以生产工程化的治疗性细胞。

21.一种***载体，例如AAV载体，其特征在于所述载体包括用于在内源性基因座处***的外源性多核苷酸序列，所述外源性多核苷酸序列包括下列序列：

a)第一同源多核苷酸序列，其与***位点上游的所述内含子序列同源，

b)第一强剪接位点序列，包括分支点和剪接受体；

c)编码2A自切割肽的第一序列；

d)编码目的蛋白质的外源序列；

e)编码2A自切割肽的第二序列；

f)第一外显子的编码序列的拷贝；

g)包括剪接供体的第二强剪接位点序列；和

h)第二同源多核苷酸序列，其与所述***位点下游的所述内含子序列同源。

22.根据权利要求22所述的***载体，其中所述第一同源序列和第二同源序列与选自以下的内源性基因座同源：tmem119、s100a9、cd11b、b2m、cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、p2ry12、olfml3、p2ry13、hexb、rhob、jun、rab3il1、ccl2、fcrls、scoc、siglech、slc2a5、lrrc3、plxdc2、usp2、ctsf、cttnbp2nl、atp8a2、lgmn、mafb、egr1、bhlhe41、hpgds、ctsd、hspa1a、lag3、csf1r、adamts1、f11r、golm1、nuak1、crybb1、ltc4s、sgce、pla2g15、ccl3l1、abhd12、ang、ophn1、sparc、pros1、p2ry6、lair1、il1a、epb41l2、adora3、rilpl1、pmepa1、ccl13、pde3b、scamp5、ppp1r9a、tjp1、ak1、b4galt4、gtf2h2、trem2、ckb、acp2、pon3、agmo、tnfrsf17、fscn1、st3gal6、adap2、ccl4、entpd1、tmem86a、kctd12、dst、ctsl2、abcc3、pdgfb、pald1、tubgcp5、rapgef5、stab1、lacc1、tmc7、nrip1、kcnd1、tmem206、hps4、dagla、extl3、mlph、arhgap22、cxxc5、p4ha1、cysltr1、fgd2、kcnk13、gbgt1、c18orf1、cadm1、bco2、adrb1、c3ar1、large、leprel1、liph、upk1b、p2rx7、slc46a1、ebf3、ppp1r15a、il10ra、rasgrp3、fos、tppp、slc24a3、havcr2、nav2、apbb2、clstn1、blnk、gnaq、ptprm、frmd4a、cd86、tnfrsf11a、spint1、ppm1l、tgfbr2、cmklr1、tlr6、gas6、hist1h2ab、atf3、acvr1、abi3、lrp12、ttc28、plxna4、adamts16、rgs1、icam1、snx24、ly96、dnajb4和ppfia4。

23.根据权利要求22或23所述的***，其中由所述外源性编码序列编码的所述治疗性蛋白质与IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5(SEQ ID NO:1至SEQ IDNO:35–见表1)具有至少80％多肽序列同一性。

24.一种工程化的细胞，其特征在于所述细胞根据权利要求1至21中任一项所述的一种方法可获得。

25.一种工程化的细胞，其特征在于外源性多核苷酸序列被***到内源性基因座处的内含子中，所述多核苷酸序列包括：

-第一强剪接位点序列，包括分支点和受***点；

-编码2A自切割肽的第一序列；

-编码目的蛋白质如治疗性蛋白质的外源序列；

-编码2A自切割肽的第二序列；

-与所述基因座内源的前一外显子的编码序列的拷贝；

-包括剪接供***点的第二强剪接位点序列。

26.根据权利要求26所述的工程化的细胞，其中所述外源性多核苷酸序列被***在选自以下的内源性基因座处：tmem119、s100a9、cd11b、B2m、Cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfia4。

27.根据权利要求26或27所述的工程化的细胞，其中所述目的蛋白质为IDUA、IDS、ARSA、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA、CDKL5、FANCA、FANCC、FANCG、HBB、PKLR、RPS19、HAX1、CYBA、CYBB、NCF1、NCF2、NCF4、因子8、因子9、因子11、WAS、IL2RG或BTK。

28.根据权利要求28所述的工程化的细胞，其中由所述外源性编码序列编码的所述治疗性蛋白质与IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5(SEQ ID NO:1至SEQ IDNO:35–见表1)具有至少80％多肽序列同一性。

29.根据权利要求25至29中任一项所述的工程化的细胞，其中所述内含子位于第一编码外显子和第二编码外显子之间。

30.根据权利要求25至30中任一项所述的工程化的细胞，其中所述第一和第二编码2自切割肽不同。

31.根据权利要求25至31中任一项所述的工程化的细胞，其中所述2自切割肽中的至少一种选自SEQ ID NO:216和SEQ ID NO:217。

32.根据权利要求1所述的工程化的细胞，其中所述第一剪接位点包括SEQ ID NO:206或SEQ ID NO:207。

33.根据权利要求1所述的工程化的细胞，其中与所述基因座内源的与所述基因座内源的前一外显子的所述编码序列被重写。

34.根据权利要求1所述的工程化的细胞，其中所述内源性基因选自tmem119、s100a9、cd11b、B2m、Cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfi。

35.根据权利要求1所述的工程化的细胞，其中所述内源性基因为S100A9或CD11b。