CN115715203A - 对细胞进行基因修饰以递送治疗性蛋白质的方法 - Google Patents

对细胞进行基因修饰以递送治疗性蛋白质的方法 Download PDF

Info

Publication number
CN115715203A
CN115715203A CN202180042049.1A CN202180042049A CN115715203A CN 115715203 A CN115715203 A CN 115715203A CN 202180042049 A CN202180042049 A CN 202180042049A CN 115715203 A CN115715203 A CN 115715203A
Authority
CN
China
Prior art keywords
seq
locus
sequence
cells
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180042049.1A
Other languages
English (en)
Inventor
亚历山大·朱耶拉特
菲利普·迪沙泰奥
帕特里克·洪
劳伦特·普瓦罗
布莱恩·布瑟尔
亚历克斯·博伊恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cellectis SA
Original Assignee
Cellectis SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cellectis SA filed Critical Cellectis SA
Publication of CN115715203A publication Critical patent/CN115715203A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/44Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Virology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本公开提供了通过***人工外显子(ArtEx)对细胞进行基因修饰以便在特定细胞类型中递送治疗性蛋白质的方法,并且更特别地提供了用于将转基因表达到患者大脑的工程化细胞。

Description

对细胞进行基因修饰以递送治疗性蛋白质的方法
技术领域
本发明整体上涉及基因治疗领域,并且更具体地涉及遗传性基因疾病的治疗和预防。特别地,本公开提供了通过***人工外显子(ArtEx)对细胞进行基因修饰以便在特定细胞类型中递送治疗性蛋白质的方法,并且更特别地提供了用于将转基因表达到患者大脑的工程化的细胞。
背景技术
由于在通常编码酶的基因中的缺陷,先天性代谢错误是一大类单基因病症。这种遗传缺陷导致各种组织中未降解底物的积累,导致可变的临床表现,其通常会影响中枢神经***。这些疾病的护理标准(如果可用)通常涉及静脉内递送治疗性蛋白质。这可以改善病症,因为治疗性蛋白质被受影响的细胞所吸收,从而纠正了缺陷。这种在一个细胞中制造的基因产品(或以治疗方式递送)被受影响的细胞吸收以纠正缺陷的策略被称为交叉纠正。然而,治疗性地将蛋白质递送到血浆中并不能解决在这些患者中看到的神经***缺陷,因为该蛋白质不能穿过血脑屏障(或没有足够数量的蛋白质穿过血脑屏障)。因此,用于这些疾病的将治疗性蛋白质递送至血浆的任何治疗性策略,诸如静脉转移治疗性蛋白质或用基因疗法将肝脏或任何其它器官转换为治疗性蛋白质生产设施,将无法消散该疾病的神经症状。
因此,特别需要用于向大脑递送以治疗遗传性疾病的方法和治疗性组合物。
仅为提供信息目的而提供该背景信息。不一定承认且不应该解决任何前述信息构成针对本发明的现有技术。
发明内容
应当理解的是,上述对实施方式的一般描述以及下列详细描述均是示例性的,因此不限制实施方式的范围。
在一个方面,本发明提供了基因修饰的造血干细胞(HSC),其包括在合适的基因座处共表达的治疗性基因产物,该合适的基因座在多种造血谱系中很活跃,诸如巨噬细胞,并且更特别地是填充大脑的组织驻留小胶质细胞。本文所描述的方法可以通过治疗性基因产物在髓***和来源于它的组织中的外源性表达来治疗患者。本发明特别有利的是,通过从造血谱系衍生出来的填充大脑的小胶质细胞,将健康等位基因交叉表达到大脑中,以获得有害等位基因的交叉纠正。
在另一方面,本发明依赖于使用可编程核酸酶(诸如转录激活器样效应物核酸酶(TALEN)、锌指核酸酶(ZFN)、簇状规则间隔的短回文重复序列(CRISPR)-Cas、大范围核酸酶和megaTAL(融合至大范围核酸酶的转录激活器样(TAL))加上用于该基因座的修复模板的递送对造血干细胞(HSC)或iPS细胞的离体修饰,修复模板提供有促进基因座的同源定向修复(HDR)的重组腺相关病毒(rAAV)。使用该策略,可以将修复模板DNA中编码的任何基因修饰并入在靶基因座处,包括并入治疗性基因产物,诸如互补DNA(cDNA)。在一些实施方式中,治疗性基因产物将受到靶基因座的调控控制并且促进造血细胞且特别是小胶质细胞中的表达。随后通过过继细胞转移或自体HSC移植将经修饰的细胞返回到患者。该方法将全身性递送治疗性基因产物以治疗身体,并且局部递送在大脑中以治疗疾病的全部症状。
在另一方面,本发明提供了一种将转基因表达到患者大脑中的方法,包括:
i)获得基因修饰的造血干细胞(HSC),其中HSC分离自患者或者获自来源于患者并且分化成HSC的诱导多能干(iPS)细胞,其中基因修饰的HSC被工程化为包括整合在小胶质细胞中表达的基因座处的转基因;和
ii)将基因修饰的HSC移植到患者中,以使其分化为将转基因表达到患者大脑中的小胶质细胞。
在另一方面,本发明提供了一种将转基因表达到患者大脑中的方法,包括:
i)获得基因修饰的造血干细胞(HSC),其中HSC分离自相容供体或者获自来源于相容供体并且分化成HSC的诱导多能干(iPS)细胞,其中基因修饰的HSC被工程化为包括整合在小胶质细胞中表达的基因座处的转基因;
ii)将基因修饰的HSC移植到患者中,以使其分化为将转基因表达到患者大脑中的小胶质细胞。
在另一方面,本发明提供了一种分离的HSC或iPS细胞,其具有整合在选自TMEM119、CD11B、B2m、CX3CR1或S100A9的基因座处的转基因,所述转基因受所述基因的内源性启动子的转录控制。在一些实施方式中,HSC或iPS细胞用于用作药物。在一些实施方式中,HSC或iPS细胞用于在治疗在与转基因同源的内源基因的表达方面有缺陷的患者中使用(交叉纠正)。在一些实施方式中,HSC或iPS细胞用于在溶酶体贮积病的治疗中使用。
在一些实施方式中,在小胶质细胞中表达的基因座选自由以下组成的组:TMEM119、S100A9、CD11B、B2m、Cx3cr1、MERTK、CD164、Tlr4、Tlr7、Cd14、Fcgr1a、Fcgr3a、TBXAS1、DOK3、ABCA1、TMEM195、MR1、CSF3R、FGD4、TSPAN14、TGFBRI、CCR5、GPR34、SERPINE2、SLCO2B1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfia4。在一些实施方式中,转基因的多个拷贝被整合在由2A自切割肽序列间隔开的同一基因座上。
作为独立的实施方式,本专利申请提供了一种将外源性编码序列整合到内源性内含子基因组区域的方法,优选地,其允许将所述外源性编码序列整合在所述基因组区域的第一内源性外显子和第二内源性外显子之间。在一些实施方式中,图2所示的该方法具有保留HSC的干性及其分化为各种骨髓细胞的能力的优点。在一些实施方式中,使用稀有切割核酸内切酶和/或病毒载体将转基因***到HSC或iPS细胞中。在一些实施方式中,病毒载体是AAV载体。该方法(也称为“ArtEx”)允许***人工外显子编码转基因(其置于内源性基因座的转录控制下),优选地***到内含子序列中而不必使存在于所述基因座的内源性外显子的表达失活。
该方法更特别地包括以下步骤中的一个或多个:
-提供包括内源性内含子基因组区域的细胞,
-向所述细胞中引入包括外源性编码序列的多核苷酸模板,其中所述多核苷酸模板包括:
a)第一同源多核苷酸序列,其与***位点上游的内含子序列同源,
b)第一强剪接位点序列,其包括分支点和剪接受体;
c)编码2A自切割肽的第一序列;
d)编码目的蛋白质的外源序列;
e)编码2A自切割肽的第二序列;
f)第一外显子的编码序列的拷贝;
g)包括剪接供体的第二强剪接位点序列;和
h)第二同源多核苷酸序列,其与***位点下游的内含子序列同源;以及任选地
-诱导所述外源性多核苷酸整合到所述内含子序列中,优选地通过同源重组,以使所述外源性编码序列与第一外显子和优选第二外显子或其拷贝一起在所述内源性基因座上转录。
该方法特别有用于大量基因疾病(尤其是遗传性疾病)中缺陷性蛋白质表达的交叉纠正。
在一些实施方式中,转基因为用于治疗粘多糖病I型(Scheie、Hurler-Scheie或Hurler综合征)的IDUA。
在一些实施方式中,转基因为用于治疗粘多糖病II型(Hunter)的IDS。
在一些实施方式中,转基因为用于治疗粘多糖病VI型(Maroteaux-Lamy)的ARSB。
在一些实施方式中,转基因为用于治疗粘多糖病VII型(Sly)的GUSB。
在一些实施方式中,转基因为用于治疗X连锁肾上腺脑白质营养不良(X-linkedAdrenoleukodystrophy)的ABCD1。
在一些实施方式中,转基因为用于治疗球形细胞脑白质营养不良(Krabbe)的GALC。
在一些实施方式中,转基因为用于治疗异染性脑白质营养不良的ARSA。
在一些实施方式中,转基因为用于治疗戈谢病的GBA。
在一些实施方式中,转基因为用于治疗岩藻糖苷贮积症的FUCA1。
在一些实施方式中,转基因为用于治疗α-甘露糖苷过多症的MAN2B1。
在一些实施方式中,转基因为用于治疗天冬氨酰葡萄糖胺尿症的AGA。
在一些实施方式中,转基因为用于治疗Farber的ASAH1。
在一些实施方式中,转基因为用于治疗泰-萨克斯病(Tay-Sachs)的HEXA。
在一些实施方式中,转基因为用于治疗庞贝氏症(Pompe)的GAA。
在一些实施方式中,转基因为用于治疗尼曼匹克症(Niemann Pick)的SMPD1。
在一些实施方式中,转基因为用于治疗沃尔曼综合征的LIPA。
在一些实施方式中,转基因为用于CDKL5-缺陷相关疾病的CDKL5。
从以下的详细描述,本发明的其它目的(特别是载体、细胞及所得的细胞群)以及其它特征和优点将变得显而易见。然而,应当理解的是,详细描述和具体实施例(虽然指示了本发明的具体实施方式)仅以说明的方式给出,因为对于本领域技术人员而言,从该详细描述,在本发明精神和范围内的各种变化和修改均将变得显而易见。
附图说明
本领域技术人员将理解,以下描述的附图仅用于说明目的。附图不旨在以任何方式限制本教导的范围。
图1.将治疗性基因表达靶向包括小胶质细胞的髓***的体外基因治疗平台的示意图。
图2.根据本发明,为获得向包括小胶质细胞在内的组织驻留骨髓细胞的治疗性基因表达的一种基因编辑策略的示意图。所提出的策略靶向选定的内源性基因座的内含子序列(intronic sequence),其中优选的基因座是TMEM119、MERTK、CD164、TLR7、CD14、FCGR3A(CD16)、TBXAS1、DOK3、ABCA1、TMEM195、TLR4、MR1、FCGR1A(CD64)、CSF3R、FGD4、TSPAN14、CXCR3、CD11B、S100A9和B2M。本申请中详细说明的该策略使得外源性治疗基因能够***到内源性内含子序列中,以在基因座处存在的内源性启动子的转录控制下,在骨髓细胞中转录和表达治疗性蛋白质。
图3.小胶质细胞中靶向基因座(TMEM119)的表达模式。将人类原代HSC移植到NBSGW小鼠中,以分化为人类小胶质细胞。将CD11b标志物用作确立的小胶质细胞特异性分化标志物。A:工程化细胞的3个重复(在CCR5基因座上,使用AAV作为多核苷酸模板和TALE-核酸酶作为稀有切割核酸内切酶位点定向***)。B:非工程化原代HSC。这些实验表明,根据本发明,人类HSC可有助于小胶质细胞在大脑中的周转以用作向大脑递送治疗性分子的载体。
图4.在工程化HSC细胞上进行的PCR实验。在CCR5基因座上***BFP报告基因。A:PCR阳性结果,显示转基因整合在预期基因座上。B:BFP流式细胞术测量结果显示基因组修饰率不影响表达,并且与骨髓特异性分化相关(CD14标志物)。
图5.在来自小鼠大脑匀浆的小胶质细胞中的表达模式。将CD11b标志物用作确立的小胶质细胞特异性分化标志物。A:CD11b/CCR5。B:将CD11B/F4-80用作对照。C:CD11b/CX3CR1。D:CD11b/TMEM119。结果显示,CX3CR1和TMEM119更加均匀地表达(TMEM119)或至少与F4-80的表达水平相当(CX3CR1),因此表现为比CCR5更适合作为基因座,以在小胶质细胞中表达转基因,用于根据本发明的方法将治疗性多肽递送至大脑。
图6.通过靶向内含子序列获得治疗性基因在骨髓细胞中特异性表达的基因编辑策略的示意图。该策略具有的主要优点是其可以避免附带效应(collateral effect)(NHEJ事件)。
图7.实施例中描绘的实验设计的示意图。
图8.A.在CD11b或S100A9基因座上靶向整合GFP后,CD14hi HSC中GFP+细胞的百分比。B.在CD11b基因座上靶向整合GFP后,CD11b和GFP的CD14hi HSC的流式细胞术结果。C.在S100A9基因座上靶向整合GFP后,S110A9和GFP的CD14hi HSC的流式细胞术结果。
图9.在CD11b或S100A9基因座上靶向整合IDUA基因后,IDUA的量化结果。
图10.与未处理的(UT)细胞相比,在S100A9基因座上靶向整合GFP后,通过在血液(A)或在骨髓(B)中检测的人类细胞%年龄表征的嵌合性百分比。流式细胞术的示例通过对小鼠和人类CD45阳性细胞的量化显示了脾脏中的嵌合性。
图11.血液(A)或骨髓(B)中的hCD45+或hCD45和hCD33+细胞中S100A9基因座上GFP的靶向整合百分比。
图12.A.大脑中嵌合性的百分比(人类细胞的百分比)。B.在大脑中检测的人类细胞内小胶质细胞(P2RY12/TMEM119+细胞)的百分比。
图13.A.与未处理的HSC(对照)相比,在CD11b或S100A9基因座中通过HSC编辑的慢病毒载体或通过靶向人工外显子***增加的IDUA的表达。B.在移植经编辑的HSC后,在血液、脾脏、骨髓中检测到的人类细胞的嵌合性百分比。C.在大脑中人类细胞和人类小胶质细胞(TMEM119+和P2RY12+)的检测。
图14.用于在HSC或iPS中通过ArtEx***来治疗疾病的本发明方法的示意图,考虑了将转基因表达到不同的造血谱系中以在病理细胞类型中获得缺陷蛋白质的交叉纠正。HSC经离体工程化并且被注入到患者中。ArtEx是指通过基因靶向***将包括编码交叉纠正的蛋白质的序列的人工外显子引入到内源性基因座的内含子中,而不改变其它外显子在所述基因座的表达。该基因座因其在各自选定的细胞系或细胞类型(祖细胞、血液细胞、T细胞、B细胞、血小板、中性粒细胞、单核细胞……)中的表达而被选中。
具体实施方式
本文公开了用于将转基因表达到患者大脑中的方法。该方法包括获得基因修饰的造血干细胞(HSC)或iPS细胞(能够分化成HSC),其中细胞包括编码治疗性蛋白质的转基因,该转基因至少在小胶质细胞中表达的基因座处整合在细胞中。该方法进一步包括将基因修饰的HSC移植到患者内,从而细胞分化成小胶质细胞并在患者大脑中表达治疗性蛋白质。造血干细胞或iPS细胞可以来自患者(自体方法)或来自供体(同种异体方法)。本发明可以被认为是将治疗性蛋白质递送到患者内以纠正基因疾病或病症(例如代谢疾病或溶酶体贮积病(LSD))的方法,其中患者表达蛋白质的缺陷拷贝。通过将编码功能性蛋白质的转基因靶向***至少在小胶质细胞中表达的基因座中来修饰细胞,从而治疗疾病。本发明的方法还允许将通过源自基因工程化HSC的小胶质细胞表达的治疗性蛋白质或酶递送至大脑解决遗传或非遗传起源的中枢神经***疾病。
治疗性蛋白质可以从小胶质细胞中分泌出,从而能够影响大脑中不具有对应于转基因的功能性蛋白质的其它细胞或被其它细胞吸收。本发明还提供了用于生产工程化HSC细胞的方法,该工程化HSC细胞产生高水平的治疗剂,其中将这些工程化细胞群引入患者内将提供治疗疾病或病症所需的蛋白质。
因此,本发明的方法和组合物可用于从转基因表达来自在小胶质细胞中表达的基因座的治疗上有益的蛋白质,以替代遗传性代谢疾病中缺陷的蛋白质,或将治疗性蛋白质或酶递送至大脑。例如,通过小胶质细胞可以向大脑中表达多巴脱羧酶[EC 4.1.1.28],以将L-多巴转化为多巴胺,这缓解帕金森病的症状。
此外,本发明提供了通过将序列***到小胶质细胞中表达的基因座中来治疗这些疾病的方法和组合物。
在一些实施方式中,将转基因引入从患者或相容供体分离的HSC细胞中。在一些实施方式中,将转基因引入源自iPS细胞的HSC中,或者在iPS细胞分化成HSC之前将其引入iPS细胞。当HSC分化为小胶质细胞时,它们将表达治疗有效量的替代蛋白,以递送到大脑中的细胞。
现在将详细参考本发明的当前优选实施方式,其连同附图和以下实施例一起用于说明本发明的原理。这些实施方式足够详细地描述以使本领域技术人员能够实践本发明,并且应当理解的是,可以使用其它实施方式,并且在不背离本发明的精神和范围的情况下可以进行结构、生物和化学变化。除非另有定义,否则本文中使用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同含义。
除非另有说明,否则本发明的实践采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术,这些技术在本领域的技术范围内。文献中充分说明了这些技术。参见例如Sambrook et al.Molecular Cloning:A Laboratory Manual,2ndedition(1989);Current Protocols in Molecular Biology(F.M.Ausubel et al.eds.(1987));the series Methods in Enzymology(Academic Press,Inc.);PCR:A PracticalApproach(M.MacPherson et al.IRL Press at Oxford University Press(1991));PCR2:A Practical Approach(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995));Antibodies,A Laboratory Manual(Harlow and Lane eds.(1988));Using Antibodies,ALaboratory Manual(Harlow and Lane eds.(1999));和Animal Cell Culture(R.I.Freshney ed.(1987))。
除非本文特别定义,否则所使用的所有技术和科学术语具有与基因治疗、生物化学、遗传学、免疫学、癌症和分子生物学领域中技术人员通常理解的相同含义。分子生物学中常用术语的定义可参见例如Benjamin Lewin,Genes VII,published by OxfordUniversity Press,2000(ISBN 019879276X);Kendrew et al.(eds.);The Encyclopediaof Molecular Biology,published by Blackwell Publishers,1994(ISBN 0632021829);和Robert A.Meyers(ed.),Molecular Biology and Biotechnology:a ComprehensiveDesk Reference,published by Wiley,John&Sons,Inc.,1995(ISBN 0471186341)。
为了解释本说明书的目的,将适用以下定义,并且在适当时,以单数形式使用的术语也将包括复数,反之亦然。如果下文提出的任何定义与该词在任何其它文献(包括通过引用并入本文的任何文献)中的使用相冲突,则出于解释本说明书及其相关权利要求的目的,下文提出的定义应始终优先,除非明确指示相反含义(例如在最初使用该术语的文献中)。除非另有说明,否则使用的“或”是指“和/或”。如在说明书和权利要求书中使用的单数形式“一个(a)”、“一种(an)”和“该(the)”包括复数引用,除非上下文另有明确规定。例如,术语“一个细胞”包括多个细胞,包括它们的混合物。使用的“包括(comprise)”、“包含(comprises)”、“含有(comprising)”、“包括(include)”、“包含(includes)”和“含有(including)”是可互换的,并且不旨在限制。此外,在一个或多个实施方式的描述使用术语“包括”的情况下,本领域技术人员将理解,在一些特定情况下,一个或多个实施方式可以替代地使用“基本上由……组成”和/或“由……组成”来描述。
如本文所用,术语“约”是指与其一起使用的数字的数值的加或减10%。
如本文所用,术语“造血干细胞”(或“HSC”)是指具有自我更新并分化为包括多样谱系的成熟血细胞的能力的未成熟血细胞,多样谱系包括但不限于粒细胞(例如早幼粒细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞)、红细胞(例如网织红细胞、红细胞)、凝血细胞(例如原巨核细胞、产生血小板的巨核细胞、血小板)、单核细胞(例如单核细胞、巨噬细胞)、树突细胞、小胶质细胞、破骨细胞和淋巴细胞(例如NK细胞、B细胞和T细胞)。本领域已知此类细胞可能包括或可能不包括CD34+细胞。CD34+细胞是表达CD34细胞表面标志物的未成熟细胞。在人类中,CD34+细胞被认为包括具有上述干细胞特性的细胞亚群,而在小鼠中,HSC是CD34-。此外,HSC还指长期重新填充HSC(LT-HSC)和短期重新填充HSC(ST-HSC)。LT-HSC和ST-HSC根据功能潜力和细胞表面标志物表达进行区分。例如,在一些实施方式中,人类HSC是CD34+、CD38-、CD45RA-、CD90+、CD49F+和lin-(对包括CD2、CD3、CD4、CD7、CD8、CD10、CD11B、CD19、CD20、CD56、CD235A在内的成熟谱系标志物呈阴性)。在小鼠中,骨髓LT-HSC是CD34-、SCA-1+、C-kit+、CD135-、Slamfl/CD150+、CD48-和lin-(对包括Ter119、CD11b、Gr1、CD3、CD4、CD8、B220、IL7ra在内的成熟谱系标志物呈阴性),而ST-HSC是CD34+、SCA-1+、C-kit+、CD135-、Slamfl/CD150+和lin-(对包括Ter119、CD11b、Gr1、CD3、CD4、CD8、B220、IL7ra在内的成熟谱系标志物呈阴性)。此外,在稳态条件下,ST-HSC比LT-HSC更不静止(即更活跃)且更增殖。然而,LT-HSC具有更大的自我更新潜力(即它们可以在整个成年期存活,并且可以通过连续的接受者连续移植),而ST-HSC的自我更新能力有限(即它们只能存活一段有限的时间,并且不具备连续移植潜力)。任何这些HSC都可以用于任何本文的方法中。在一些实施方式中,ST-HSC是有用的,因为它们是高度增殖的,因此可以更快地产生分化的后代。
如本文所用,“接受者”是接受移植物如含有造血干细胞群或分化细胞群的移植物的患者。施用于接受者的移植细胞可以是例如自体、同基因或同种异体细胞。
如本文所用,“供体”是人类或动物,从其分离一种或多种细胞,然后将细胞或其子代施用于接受者。在将细胞或其子代施用于接受者之前,一种或多种细胞可以是要根据本发明的方法进行扩增、强化(enrich)或维持的造血干细胞群。
如本文所用,术语“药物组合物”是指活性剂与药学上可接受的载体(例如制药工业中常用的载体)的组合。本文使用的短语“药学上可接受的”是指在合理的医学判断范围内,适合与人类和动物的组织接触使用而没有过度的毒性、刺激性、过敏反应或其它问题或并发症,与合理的效益/风险比相称的那些化合物、材料、组合物和/或剂型。
如本文所用,术语“施用”是指通过导致在所需部位至少部分递送药剂的方法或途径将本文公开的化合物、细胞或细胞群置于受试者体内。包括本文公开的化合物或细胞的药物组合物可以通过在受试者中产生有效治疗的任何合适途径施用。
如本文所用,“核酸”或“多核苷酸”是指核苷酸和/或多核苷酸,例如脱氧核糖核酸(DNA)或核糖核酸(RNA)、寡核苷酸、由聚合酶链式反应(PCR)产生的片段、以及由连接、断裂、核酸内切酶作用和核酸外切酶作用中任何一种产生的片段。核酸分子可由天然存在的核苷酸(例如DNA和RNA)或天然存在的核苷酸的类似物(例如天然存在的核苷酸的对映体形式)或两者的组合组成。修饰的核苷酸可以在糖部分和/或嘧啶或嘌呤碱基部分中具有改变。糖修饰包括例如用卤素、烷基、胺和叠氮基替换一个或多个羟基,或者糖可以被官能化为醚或酯。此外,整个糖部分可以用空间上和电子上相似的结构代替,例如氮杂糖和碳环糖类似物。碱基部分中修饰的实例包括烷基化的嘌呤和嘧啶、酰化的嘌呤或嘧啶、或其它众所周知的杂环取代物。核酸单体可以通过磷酸二酯键或这种键的类似物连接。核酸可以是单链的或双链的。
术语“多肽”、“肽”和“蛋白质”可互换使用,指氨基酸残基的聚合物。该术语也适用于其中一种或多种氨基酸是相应天然氨基酸的化学类似物或修饰衍生物的氨基酸聚合物。
“序列特异性试剂”是指具有特异性识别来自基因组基因座的选定多核苷酸序列的能力的任何活性分子,考虑到修改基因组基因座的表达,优选长度至少9bp,更优选至少10bp,甚至更优选至少12pb。在一个实施方式中,诱导稳定突变的序列特异性试剂是具有切口酶或核酸内切酶活性的试剂。
术语“核酸内切酶”是指能够催化DNA或RNA分子(优选DNA分子)内核酸之间的键的水解(切割)的任何野生型或变体酶。核酸内切酶不切割DNA或RNA分子而不管其序列如何,而是在特定的多核苷酸序列(进一步称为“靶序列”或“靶位点”)处识别和切割DNA或RNA分子。
“有效量”或“治疗有效量”是指本文的组合物的量,该量当施用于受试者(例如人)时足以帮助治疗疾病。构成“治疗有效量”的组合物的量将根据细胞制剂、病症及其严重程度、施用方式和待治疗受试者的年龄而变化,但可以由本领域普通技术人员在考虑到自己的知识和本公开内容后常规地确定。当提及单独施用的单个活性成分或组合物时,治疗有效剂量是指该单独的成分或组合物。当提及组合时,治疗有效剂量是指导致治疗效果的活性成分、组合物或两者的组合量,无论是连续施用、并行施用还是同时施用。
当通常具有长度大于10个碱基对(bp)的多核苷酸识别位点时,核酸内切酶可归类为稀有切割核酸内切酶。在一些实施方式中,稀有切割核酸内切酶具有14-55bp的识别位点。稀有切割核酸内切酶通过在特定位点诱导DNA双链断裂(DSB)而显著增加同源性重组,从而允许基因修复或基因***治疗(Pingoud,A.and G.H.Silva(2007).Nat.Biotechnol.25(7):743-4)。
“锌指DNA结合蛋白”(或结合结构域)是一种蛋白质、或较大蛋白质内的结构域,其通过一个或多个锌指以序列特异性方式结合DNA,锌指是结合结构域内的氨基酸序列的区域,其结构通过锌离子的配位而稳定。术语锌指DNA结合蛋白通常缩写为锌指蛋白或ZFP。
“TALE DNA结合结构域”或“TALE”是包括一个或多个TALE重复结构域/单元的多肽。重复结构域参与TALE与其同源靶DNA序列的结合。单个“重复单元”(也称为“重复”)的长度通常为33-35个氨基酸,并且与天然存在的TALE蛋白内的其它TALE重复序列表现出至少一定序列同源性。
锌指和TALE结合域可以被“工程化”以结合预定的核苷酸序列,例如通过工程化(改变一个或多个氨基酸)天然存在的锌指或TALE蛋白的识别螺旋区。因此,工程化的DNA结合蛋白(锌指或TALE)是非天然存在的蛋白质。用于工程化DNA结合蛋白的方法的非限制性例子是设计和选择。设计的DNA结合蛋白是自然界中不存在的蛋白质,其设计/组成主要来自合理的标准。用于设计的合理标准包括应用替换规则和计算机化算法来处理存储现有ZFP和/或TALE设计和结合数据的信息的数据库中的信息。参见例如美国专利号6,140,081;6,453,242;和6,534,261;还参见WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496以及美国公开号20110301073。
在一些实施方式中,核酸内切酶是工程化的并且在自然界中不存在。在一些实施方式中,核酸内切酶是使用诸如噬菌体展示、相互作用陷阱或杂交选择等方法产生的。参见例如美国专利号5,789,538;5,925,523;6,007,988;6,013,453;6,200,759;以及WO 95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970;WO 01/88197;WO 02/099084和美国专利申请公开号2011/0301073。
“重组”是指在两个多核苷酸之间交换遗传信息的过程。为了本公开的目的,“同源重组(HR)”是指此类交换的特殊形式,例如在通过同源定向修复机制修复细胞中的双链断裂期间发生。该过程需要核苷酸序列同源性,并且通常使用“供体”分子(也称为“多核苷酸模板”)通过同源重组或NHEJ修复整合到内源基因座(“靶”序列)中。这导致遗传信息从供体转移到靶。不希望受任何特定理论的束缚,这种转移可涉及对在断裂靶和供体之间形成的异源双链DNA的错配纠正,和/或其中供体用于重新合成将成为靶的一部分的遗传信息的“合成依赖性链退火”,和/或相关过程。这种专门的HR通常导致靶分子序列的改变,使得供体多核苷酸的部分或全部序列并入靶多核苷酸中。
“突变”意指多核苷酸(cDNA、基因)或多肽序列中多达一、二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、二十、二十五、三十、四十、五十或更多个核苷酸/氨基酸的取代、缺失、***。在一些实施方式中,突变可以影响基因的编码序列或其调控序列。它还可能影响基因组序列的结构或所编码的mRNA的结构/稳定性。
“载体”是指一种核酸分子,其能够运输与其连接的另一种核酸。本发明中的“载体”包括但不限于病毒载体、质粒、寡核苷酸、RNA载体或线性或环状DNA或RNA分子,其可以由染色体、非染色体、半合成或合成核酸组成。优选的载体是能够自主复制(附加型载体)和/或表达它们所连接的核酸(表达载体)的那些载体。大量合适的载体是本领域技术人员已知的并且是可商购的。病毒载体包括:逆转录病毒,腺病毒,细小病毒(例如腺相关病毒(AAV),冠状病毒,负链RNA病毒例如正粘病毒(例如流感病毒),弹状病毒(例如狂犬病和水疱性口炎病毒),副粘病毒(例如麻疹和仙台),正链RNA病毒例如小核糖核酸病毒和甲病毒,以及双链DNA病毒,包括腺病毒、疱疹病毒(例如单纯疱疹病毒1型和2型、爱泼斯坦-巴尔病毒、巨细胞病毒)和痘病毒(例如牛痘、鸡痘和金丝雀痘)。例如,其它病毒包括例如诺沃克病毒、披膜病毒、黄病毒、呼肠孤病毒、乳多空病毒、嗜肝DNA病毒和肝炎病毒。逆转录病毒的例子包括:禽白血病-肉瘤,哺乳动物C型病毒、B型病毒、D型病毒,HTLV-BLV组,慢病毒,泡沫病毒(Coffin,J.M.,Retroviridae:The viruses and their replication,In FundamentalVirology,Third Edition,B.N.Fields,et al.,Eds.,Lippincott-Raven Publishers,Philadelphia,1996)。
如本文所用,术语“基因座”是DNA序列(例如基因的)在基因组中的特定物理位置。术语“基因座”可以指稀有切割核酸内切酶靶序列在染色体上或感染剂基因组序列上的特定物理位置。这样的基因座可以包括被根据本发明的序列特异性核酸内切酶识别和/或切割的靶序列。应当理解的是,本发明的目的基因座不仅可以限定存在于细胞遗传物质主体(即染色体中)的核酸序列,而且可以限定可以独立于遗传物质的所述主体而存在的遗传物质的一部分,例如质粒、附加体、病毒、转座子或在细胞器中,例如作为非限制性实例的线粒体。
术语“切割”是指多核苷酸共价骨架的断裂。切割可以通过多种方法引发,包括但不限于磷酸二酯键的酶水解或化学水解。单链切割和双链切割都是可能的,并且双链切割可以作为两个不同单链切割事件的结果而发生。双链DNA、RNA或DNA RNA杂合切割可导致产生平末端或交错末端。
“同一性”是指两个核酸分子或多肽之间的序列同一性。同一性可以通过比对为了对比目的而对齐的每个序列中的位置来确定。当比较的序列中的一个位置被相同碱基占据时,则分子在该位置是同一的。核酸或氨基酸序列之间的相似性或同一性程度是取决于多个核酸序列共有的位置处相同或匹配核苷酸数目。可以使用各种比对算法和/或程序来计算两个序列之间的同一性,包括FASTA或BLAST,它们可作为GCG序列分析包的一部分而获得(University of Wisconsin,Madison,Wis.),并可以以例如默认设置使用。例如,考虑了与本文描述的特定多肽具有至少70%、85%、90%、95%、98%或99%同一性并且优选地表现出基本相同功能的多肽,以及编码此类多肽的多核苷酸。
如本文用,术语“治疗(treat)”、“治疗(treatment)”、“治疗(treating)”等是指获得期望药理学和/或生理学效果。就完全或部分预防疾病或其症状而言,效果可以是预防性的,和/或就部分或完全治愈疾病和/或归因于该疾病的副作用而言,效果可以是治疗性的。如本文所用,“治疗”涵盖哺乳动物(特别是人类)疾病的任何治疗,并且包括:(a)防止疾病在可能易患该疾病但尚未诊断患有该疾病的受试者中发生;(b)抑制疾病,即阻止其发展;和(c)缓解疾病,例如导致疾病消退,例如完全或部分消除疾病症状。
在细胞的背景下的“扩增”是指从可能相同或可能不同的细胞的初始细胞群开始,一种或多种特征性细胞类型的数量增加。用于扩增的初始细胞可能与扩增产生的细胞不同。
“细胞群”是指真核哺乳动物细胞,优选人类细胞,其分离自生物来源,例如血液制品或组织,并来源于多于一种细胞。
当在细胞群的背景下使用时,“富集的”是指基于存在的一种或多种标志物(例如CD34+)而选择的细胞群。
术语“CD34+细胞”是指在其表面表达CD34标记的细胞。可以使用例如流式细胞术和荧光标记的抗-CD34抗体检测和计数CD34+细胞。
“富含CD34+细胞”是指已基于CD34标志物的存在选择细胞群。因此,选择方法后细胞群中CD34+细胞的百分比高于基于CD34标志物的选择步骤之前的初始细胞群中CD34+细胞的百分比。例如,CD34+细胞可占富含CD34+细胞的细胞群中细胞的至少50%、60%、70%、80%或至少90%。
如本文所用,术语“受试者”或“患者”包括动物界的所有成员,包括非人类灵长类动物和人类。
在本文中说明数值限制或范围的情况下,包括端点。此外,数值限制或范围内的所有值和子范围都被特别地包括在内,如同明确写出一样。
治疗方法
在一个实施方式中,本发明提供了一种将转基因表达到患者大脑中的方法,包括:
i)获得基因修饰的造血干细胞(HSC),其中HSC分离自患者或者获自来源于患者并且分化成HSC的诱导多能干(iPS)细胞,其中基因修饰的HSC被工程化为包括整合在小胶质细胞中表达的基因座上的转基因;和
ii)将基因修饰的HSC移植到患者中,使其分化为将转基因表达到患者大脑中的小胶质细胞。
在另一个实施方式中,本发明提供了一种将转基因表达到患者大脑中的方法,包括:
i)获得基因修饰的造血干细胞(HSC),其中HSC分离自相容供体或者获自来源于相容供体并且分化成HSC的诱导多能干(iPS)细胞,其中基因修饰的HSC被工程化为包括整合在小胶质细胞中表达的基因座上的转基因;和
ii)将基因修饰的HSC移植到患者中,使其分化为将转基因表达到患者大脑中的小胶质细胞。
在另一个实施方式中,本发明提供了一种治疗患者中疾病或病症的方法,包括向患者施用有效量的基因修饰的HSC,其中基因修饰的HSC被工程化为包括整合在小胶质细胞中表达的基因座上的转基因,其中基因修饰的HSC在患者中分化为小胶质细胞并且将转基因表达到患者大脑中。在一些实施方式中,HSC分离自相容供体或者获自来源于相容供体并且分化成HSC的诱导多能干(iPS)细胞。在一些实施方式中,HSC分离自患者或者获自来源于患者并且分化成HSC的诱导多能干(iPS)细胞。
在一些实施方式中,患者患有单基因疾病或病症。在一些实施方式中,患者在与转基因同源的内源性基因的表达方面具有缺陷。在一些实施方式中,患者患有溶酶体贮积病。在一些实施方式中,疾病或病症选自粘多糖病I型(Scheie、Hurler-Scheie或Hurler综合征)、粘多糖病II型(亨特综合征)、粘多糖病VI型(Maroteaux-Lamy综合征)、粘多糖病VII型(Sly疾病)、X连锁肾上腺脑白质营养不良、球形细胞脑白质营养不良(克拉伯病)、异染性脑白质营养不良、戈谢病、岩藻糖苷贮积症、α-甘露糖苷过多症、天冬氨酰葡萄糖胺尿症、Farber病、泰-萨克斯病、庞贝氏病、尼曼匹克病和沃尔曼病。在一些实施方式中,患者患有中枢神经***(CNS)疾病。在一些实施方式中,CNS疾病选自阿尔茨海默病、帕金森病、亨廷顿氏病、多发性硬化症疾病。在一些实施方式中,患者患有CDKL5-缺陷相关疾病。在一些实施方式中,CDKL5-缺陷疾病选自婴儿早期癫痫性脑病(EIEE)、非典型Rett综合征、CDKL5相关癫痫性脑病和韦斯特综合征。
该方法可以是自体治疗的一部分或同种异体治疗的一部分。自体是指用于治疗患者的细胞来源于所述患者。同种异体是指用于治疗患者的细胞或细胞群不是源自所述患者而是源自供体。
在一些实施方式中,将细胞施用于正接受免疫抑制治疗的患者。在一个实施方式中,使施用的细胞对至少一种免疫抑制剂具有抗性。在一些实施方式中,免疫抑制治疗有助于基因修饰的HSC在患者内的选择和扩增。
细胞的施用可以任何方便的方式进行,包括通过雾化吸入、注射、摄取、输液、植入或移植。本文描述的组合物可以皮下、皮内、瘤内、结节内、髓内、肌内、通过静脉内或淋巴内注射、或腹膜内施用于患者。在一个实施方式中,细胞组合物通过静脉内注射施用,其中能够迁移至骨髓。
尽管个体需求不同,但对于特定疾病或病症,确定给定细胞类型的有效量的最佳范围在本领域的技术范围内。有效量是指提供治疗或预防益处的量。施用的剂量将取决于接受者的年龄、健康和体重、并存治疗的种类(如果有的话)、治疗频率和所需效果的性质。在一些实施方式中,细胞或细胞群的施用包括施用约104-109个细胞/kg体重。在一些实施方式中,施用约105至106个细胞/kg体重。那些范围内的细胞数的所有整数值都被考虑在内。
细胞可以以一剂或多剂施用。在另一个实施方式中,有效量的细胞作为单剂量施用。在另一个实施方式中,有效量的细胞在一段时间内作为多于一个剂量施用。施用时间在主治医师的判断范围内,并且取决于患者的临床状况。
在一些实施方式中,施用基因修饰的HSC细胞可以包括用清髓性和/或免疫抑制性方案治疗患者以消耗宿主骨髓干细胞并防止排斥。在一些实施方式中,对患者施用化学疗法和/或放射疗法。在一些实施方式中,对患者施用减少剂量的化疗方案。在一些实施方式中,以标准剂量的25%使用白消安的减少剂量化疗方案可足以实现修饰细胞的显著植入,同时降低与调理相关的毒性(Aiuti A.et al.(2013),Science 23;341(6148))。更强的化疗方案可以基于施用白消安和氟达拉滨两者作为内源性HSC的消耗剂。在一些实施方式中,白消安和氟达拉滨的剂量约为标准同种异体移植中所用剂量的50%和30%。在另一个实施方式中,在B细胞消融疗法后施用细胞,例如与CD20反应的试剂,例如利妥昔单抗(Rituxan)。在一些实施方式中,向患者施用化疗剂例如氟达拉滨、外照射放射疗法(XRT)、环磷酰胺或抗体例如OKT3或CAMPATH。
在某些实施方案中,将基因修饰的细胞作为包括免疫抑制剂的联合疗法施用于受试者。示例性的免疫抑制剂包括西罗莫司、他克莫司、环孢霉素、麦考酚酯、抗胸腺细胞球蛋白、皮质类固醇、神经钙调蛋白抑制剂、抗代谢物诸如甲氨蝶呤、移植后环磷酰胺或其任何组合。在一些实施方式中,使用仅西罗莫司或他克莫司预治疗受试者作为针对GVHD的预防。在一些实施方式中,在免疫抑制剂之前将细胞施用于受试者。在一些实施方式中,在免疫抑制剂之后将细胞施用于受试者。在一些实施方式中,将细胞与免疫抑制剂同时施用于受试者。在一些实施方式中,细胞在没有免疫抑制剂的情况下施用于受试者。在一些实施方式中,接受基因修饰细胞的患者接受少于6个月、5个月、4个月、3个月、2个月、1个月、3周、2周或1周的免疫抑制剂。
转基因和疾病
如本文所用的转基因编码疾病相关基因的治疗性蛋白质。疾病相关基因是在疾病中以某种方式存在缺陷的基因。在一些实施方式中,待治疗的疾病和转基因如下表1所示。
表1.单基因疾病和用于其治疗的转基因。
Figure BDA0003994978620000171
Figure BDA0003994978620000181
在一些实施方式中,转基因包括从IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5中选择的基因的编码序列。
在一些实施方式中,IDUA的核苷酸序列包括SEQ ID NO:1并且氨基酸序列包括SEQID NO:2。
在一些实施方式中,IDS的核苷酸序列包括SEQ ID NO:3并且氨基酸序列包括SEQID NO:4。
在一些实施方式中,ARSB的核苷酸序列包括SEQ ID NO:5并且氨基酸序列包括SEQID NO:6。
在一些实施方式中,GUSB的核苷酸序列包括SEQ ID NO:7并且氨基酸序列包括SEQID NO:8。
在一些实施方式中,ABCD1的核苷酸序列包括SEQ ID NO:9并且氨基酸序列包括SEQ ID NO:10。
在一些实施方式中,GALC的核苷酸序列包括SEQ ID NO:11并且氨基酸序列包括SEQ ID NO:12。
在一些实施方式中,ARSA的核苷酸序列包括SEQ ID NO:13并且氨基酸序列包括SEQ ID NO:14。
在一些实施方式中,PSAP的核苷酸序列包括SEQ ID NO:15并且氨基酸序列包括SEQ ID NO:16。
在一些实施方式中,GBA的核苷酸序列包括SEQ ID NO:17并且氨基酸序列包括SEQID NO:18。
在一些实施方式中,FUCA1的核苷酸序列包括SEQ ID NO:19并且氨基酸序列包括SEQ ID NO:20。
在一些实施方式中,MAN2B1的核苷酸序列包括SEQ ID NO:21并且氨基酸序列包括SEQ ID NO:22。
在一些实施方式中,AGA的核苷酸序列包括SEQ ID NO:23并且氨基酸序列包括SEQID NO:24。
在一些实施方式中,ASAH1的核苷酸序列包括SEQ ID NO:25并且氨基酸序列包括SEQ ID NO:26。
在一些实施方式中,HEXA的核苷酸序列包括SEQ ID NO:27并且氨基酸序列包括SEQ ID NO:28。
在一些实施方式中,GAA的核苷酸序列包括SEQ ID NO:29并且氨基酸序列包括SEQID NO:30。
在一些实施方式中,SMPD1的核苷酸序列包括SEQ ID NO:31并且氨基酸序列包括SEQ ID NO:32。
在一些实施方式中,LIPA的核苷酸序列包括SEQ ID NO:33并且氨基酸序列包括SEQ ID NO:34。
在一些实施方式中,CDKL5的核苷酸序列包括SEQ ID NO:35并且氨基酸序列包括SEQ ID NO:36。
在一些实施方式中,转基因包括选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33和35中任一者的核苷酸序列的一个或多个拷贝。
在一些实施方式中,转基因包括编码选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34和36中任一者的氨基酸序列的核苷酸序列的一个或多个拷贝。
在一些实施方式中,转基因包括编码治疗性蛋白质的核苷酸序列,治疗性蛋白质是SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34和36中任一者的变体。
编码治疗性蛋白质的特定核苷酸序列可以在其全长上与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35中的编码序列相同。替代地,由于编码SEQ IDNO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34和36的多肽的遗传密码的简并性或密码子使用的变化,编码治疗性蛋白质的特定核苷酸序列可以是SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35的替代形式。在一些实施方式中,转基因包括与编码治疗性蛋白质的多核苷酸序列高度同一性(具有至少90%同一性)的核苷酸序列,或与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35中阐述的编码核苷酸序列具有至少90%同一性的核苷酸序列。在一些实施方式中,转基因包括与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35中阐述的核苷酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列。
当包括编码本发明的治疗性蛋白质的多核苷酸的转基因用于治疗性蛋白质的重组生产时,多核苷酸本身可以包括全长多肽或其片段的编码序列;全长多肽或片段的编码序列与其它编码序列(例如编码前导或分泌序列、前蛋白质序列或原蛋白质序列或前原蛋白质序列或其它融合肽部分的那些序列)处于相同的阅读框。多核苷酸还可以含有非编码的5'和3'序列,例如转录的非翻译的序列、剪接和多腺苷酸化信号、核糖体结合位点和稳定mRNA的序列。
在一些实施方式中,治疗性蛋白质可以进一步包括允许其由本发明的基因编辑细胞分泌的分泌信号肽。下表2列出了此类信号肽的一些实例。
表2:有用的信号肽的实例
Figure BDA0003994978620000201
在一些实施方式中,治疗性蛋白质可以进一步包括允许细胞摄取的肽,例如细胞穿透肽(CPP)和载脂蛋白。下表3中列出了细胞穿透肽和载脂蛋白的实例。
表3:有用的CPP和载脂蛋白的实例
Figure BDA0003994978620000202
Figure BDA0003994978620000211
在一些实施方式中,转基因包括多核苷酸,该多核苷酸与编码具有SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34和36中氨基酸序列的治疗性蛋白质的核苷酸序列具有至少90%同一性且更优选地具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列。
可以使用利用已知的计算机程序的常规手段,例如BestFit程序(Wisconsin序列分析包,版本10,Unix,Genetics Computer Group.University Research Park,575Science Drive,Madison,Wis.53711)来确定特定的核酸序列是否与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35中所示核苷酸序列任一者具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方式中,转基因包括编码治疗性蛋白质的多核苷酸,该治疗性蛋白质具有SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32或34的治疗性蛋白质的氨基酸序列,其中多个、1、1-2、1-3、1-5、5-10或10-20个氨基酸残基以任何组合被取代、缺失或添加。
在一些实施方式中,转基因包括在它们的全长上与编码具有SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36中列出的氨基酸序列的治疗性蛋白质的多核苷酸具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多核苷酸。
在一些实施方式中,由转基因表达的治疗性蛋白质与蛋白质的野生型氨基酸序列(例如SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36中任一项)是相同的。
在一些实施方式中,由转基因表达的治疗性蛋白质为SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36中任一者的功能性片段或变体。
在一些实施方式中,治疗性蛋白质包括SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的多肽,以及具有活性并且与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的多肽包括至少90%同一性的多肽和片段,或相关部分并且更优选与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的多肽包含至少96%、97%或98%的同一性,并且还更优选与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的多肽具有至少91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性。
治疗性蛋白质可以是较大蛋白质(诸如融合蛋白)的一部分。通常有利的是包括含有分泌或前导序列、原序列或可能有助于稳定性的其它序列的另外的氨基酸序列。
在一些实施方式中,转基因编码SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32或34中任一者的生物活性片段。片段是具有与上述治疗性蛋白质之一的氨基酸序列的一部分但不是全部完全相同的氨基酸序列的多肽。与全长治疗性蛋白质一样,片段可以是“独立的”或包括在更大多肽中,在该更大多肽中,它们形成一部分或区域,最优选形成为单个连续区域。在一些实施方式中,片段可以构成SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36中的约10个连续氨基酸。
在一些实施方式中,片段包括例如具有治疗性蛋白质的氨基酸序列的截短多肽,除了缺失包括氨基末端的一系列连续残基,或缺失包括羧基末端的一系列连续残基,或缺失两个系列连续残基,一个包括氨基末端且一个包括羧基末端。还优选以结构或功能属性为特征的片段,例如包括α-螺旋和α-螺旋形成区、β-折叠和β-折叠形成区、转角和转角形成区、线圈和线圈形成区、亲水区、疏水区、α两亲区、β两亲区、柔性区、表面形成区、底物结合区和高抗原指数区的片段。功能性片段是介导野生型蛋白质的蛋白质活性的那些片段,包括具有相似活性或改进活性的那些片段。
在一些实施方式中,片段可以缺少SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36中任一者的N-末端和/或C-末端的1-20个氨基酸(即1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸)。
在一些实施方式中,转基因编码具有与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36具有至少90%同一性的氨基酸序列的多肽、或其功能片段,该功能片段与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的对应片段具有至少90%同一性,它们全部均保留了治疗性蛋白质的生物活性。该组中包括的是确定序列和片段的变体。在一些实施方式中,变体是通过保守氨基酸取代而与参考序列不同的那些变体,即用相同特性的另一个残基取代的那些变体。典型的取代在Ala、Val、Leu和Ile中;在Ser和Thr中;在酸性残基Asp和Glu中;在Asn和Gln中;以及在碱性残基Lys和Arg中,或芳香族残基Phe和Tyr中。在一些实施方式中,转基因编码多肽变体,其中1-20氨基酸以任何组合被取代、缺失或添加。
CDKL5-缺陷相关疾病:
婴儿早期癫痫性脑病(EIEE)
婴儿早期癫痫性脑病(EIEE)是一种以癫痫发作为特征的神经***疾病。这种疾病影响新生儿,通常在生命的头三个月内(最常见的是头10天内)以癫痫发作的形式出现。婴儿主要有强直性癫痫发作(这导致身体肌肉僵硬,通常是背部、腿部和手臂的肌肉),但也可能出现部分性癫痫发作,并且很少出现肌阵挛性癫痫发作(这导致上半身、手臂或腿猛拉或抽搐)。发作可能每天发生超过一百次。大多数患有这种病症的婴儿表现出部分或全部大脑半球发育不全或结构异常。有些病例是由代谢紊乱或多个不同基因的突变引起的。许多病例的原因无法确定。有多种类型的早期婴儿癫痫性脑病。EEG揭示了高压尖峰波放电的特征性模式,随后几乎没有活动。这种模式被称为“突发抑制”。与这种疾病相关的癫痫发作难以治疗,并且该综合征严重地进展。一些患有这种病症的儿童继续发展为其他癫痫性病症,例如韦斯特综合征和Lennox-Gestaut综合征。
EIEE可能是不同病因的结果。许多病例与脑结构异常有关。一些病例是由于代谢紊乱(细胞色素C氧化酶缺乏症、肉碱棕榈酰转移酶II缺乏症)或脑畸形(如孔洞脑或半侧巨脑畸形)引起的,这些疾病可能起源于遗传,也可能非遗传。EIEE的遗传变异与某些基因的突变有关,诸如ARX(Xp22.13)、CDKL5(Xp22)、SL25A22(11p15.5)和STXBP1(9q34.1)等。遗传异常被认为会导致EIEE,因为它们与神经元功能障碍或大脑发育不全有关。
非典型Rett综合征
非典型Rett综合征是一种神经发育障碍,当儿童有Rett综合征的一些症状但不符合所有诊断标准时被诊断出来。与经典形式的Rett综合征一样,非典型Rett综合征主要影响女孩。非典型Rett综合征患儿的症状可能比Rett综合征更轻或更严重。已经定义了多种非典型Rett综合征的亚型。早发性癫痫发作类型的特点是出生后头几个月癫痫发作,随后出现Rett特征(包括发育问题、语言技能丧失和反复拧手或洗手动作)。它通常由X连锁CDKL5基因(Xp22)的突变引起。
CDKL5相关癫痫性脑病
CDKL5相关癫痫性脑病的特点是由早期癫痫(第1阶段)、然后是婴儿痉挛(第2阶段)和最后的多灶性和难治性肌阵挛性癫痫(第3阶段)组成的3阶段演变。参见例如Bahi-Buisson et al.Epilepsia.49:1027–1037(2008)。细胞周期蛋白依赖性激酶样5(CDKL5)的遗传异常导致早发性癫痫性脑病。
韦斯特综合征
韦斯特综合征是一种癫痫症,其特征是痉挛、称为高节律失常的异常脑电波模式,并且有时还有智力障碍。发生的痉挛可能包括剧烈的屈身或全身弯曲成两半的“额手礼”运动,或者它们也可能只是肩膀的轻微抽搐或眼睛的变化。这些痉挛通常在出生后的最初几个月开始,并且有时可以通过药物治疗。韦斯特综合征有许多不同的致因,并且如果可以确定特定原因,则可以诊断为有症状的韦斯特综合征。如果无法确定致因,则诊断为隐源性韦斯特综合征。约70-75%的受影响者可以确定韦斯特综合征的特定原因。X连锁韦斯特综合征(X连锁婴儿痉挛综合征或ISSX)可由X染色体上的CDKL5基因或ARX基因突变引起。
粘多糖病
粘多糖病(MPS)是与酶缺陷相关的退行性基因疾病。特别地,MPS是由溶酶体酶缺乏或溶酶体酶不活跃引起的,溶酶体酶催化称为糖胺聚糖(GAG)的复杂糖分子的逐渐代谢。这些酶缺乏导致GAG在细胞、组织且特别是受影响受试者的细胞溶酶体中积累,导致永久性和进行性细胞损伤,这会影响外观、身体能力、器官功能和在大多数情况下受影响受试者的心理发展。
已鉴定出11种不同的酶缺陷,对应于MPS的7种不同临床类别。每种MPS的特点是一种或多种降解粘多糖的酶(即硫酸乙酰肝素、硫酸皮肤素、硫酸软骨素和硫酸角质素)的缺乏或无活性。
MPS I根据症状的严重程度分为三个亚型。所有这三种类型都是由于酶α-L-艾杜糖醛酸酶(IDIJA)的不存在或水平不足导致的。父母一方为MPS I的儿童携带缺陷基因。
MPS I H(也称为Hurler综合征或α-L-艾杜糖醛酸酶缺乏症)是MPS I亚型中最严重的一种。在第一年结束时发育迟缓很明显,并且患者通常在2至4岁之间停止发育。随后是进行性智力衰退和身体技能丧失。由于听力损失和舌头扩大,语言可能会受到限制。适时地,角膜的透明层变得混浊,并且视网膜可能开始退化。腕管综合征(或身体其它部位的类似神经压迫)和关节活动受限很常见。受影响的儿童在出生时可能很大并且看起来很正常,但可能有***(在腹股沟)或脐疝(脐带穿过腹部)。身高的增长可能比正常情况更快,但在第一年结束之前开始放缓,通常在3岁左右结束。许多儿童的身体躯干很短并最大身高不到4英尺。不同的面部特征(包括脸部扁平、鼻梁凹陷和额头凸出)在第二年变得更加明显。到2岁时,肋骨已经变宽且呈桨状。肝脏、脾脏和心脏经常肿大。儿童可能会经历嘈杂的呼吸和反复出现的上呼吸道和耳部感染。一些儿童可能难以进食,而且许多会出现周期性的肠道问题。患有Hurler综合征的儿童通常在10岁之前死于阻塞性气道疾病、呼吸道感染和心脏并发症。
MPS I S,Scheie综合征,是MPS 1最温和的形式。症状通常在5岁后开始出现,最常在10岁后作出诊断。患有Scheie综合征的儿童智力正常或可能有轻度学习障碍;有些可能有精神问题。青光眼、视网膜变性和角膜混浊可能会严重损害视力。其它问题包括腕管综合征或其它神经压迫、关节僵硬、爪形手和畸形脚、短颈和主动脉瓣疾病。一些受影响的个体还患有阻塞性气道疾病和睡眠呼吸暂停。患有Scheie综合征的人可以活到成年。
MPS I H-S,Hurler-Scheie综合征,严重性比单独的Hurler综合征要轻。症状通常在3至8岁之间开始。儿童可能有中度智力障碍和学习困难。骨骼和全身异常包括身材矮小、颚部明显变小、进行性关节僵硬、脊髓受压、角膜混浊、听觉损失、心脏病、面部特征粗糙和脐疝。***可能会出现呼吸问题、睡眠呼吸暂停和心脏病。一些MPS I H-S患者在睡眠期间需要持续气道正压通气以缓解呼吸。预期寿命一般在十几岁(late teens)或二十出头(early twenties)。
MPS II,也称为亨特综合征,是由缺乏艾杜糖醛酸硫酸酯酶引起的。亨特综合征有两种临床亚型,并且(因为它显示X连锁隐性遗传)是唯一一种只有母亲才能将缺陷基因传给儿子的粘多糖病。亨特综合征的发病率估计为每100,000至150,000名男性新生儿中的有1名。
IDS基因的突变导致MPS II。IDS基因提供产生I2S酶的指令,该酶参与称为糖胺聚糖(GAG)的大糖分子的分解。具体地,I2S从称为硫酸化α-L-艾杜糖醛酸的分子中去除称为硫酸根(sulfate)的化学基团,该分子存在于称为硫酸乙酰肝素和硫酸皮肤素的两种GAG中。I2S位于溶酶体中,在消化和回收不同类型分子的细胞隔室内。
粘多糖病VI型(MPS VI)或Maroteaux-Lamy疾病是粘多糖病组的溶酶体贮积病,其特点是严重的躯体受累和缺乏心理-智力退化。这种罕见粘多糖病的患病率在1/250,000至1/600,000个出生人数之间。在严重的形式下,第一个临床表现发生在6到24个月之间,并逐渐加重:面部畸形(巨舌,嘴经常半张,厚的特征),关节受限,非常严重的多发性成骨异常(扁平椎、驼背、脊柱侧凸、鸡胸、膝外翻、长骨变形),小尺寸(小于1.10m),肝肿大,心脏瓣膜损伤,心肌病,耳聋,角膜混浊。智力发育通常正常或几乎正常,但听觉和眼科损伤会导致学习困难。疾病的症状和严重程度因患者相差悬殊,并且存在中间形式,甚至还存在非常温和的形式(与心血管受累相关的脊椎骨骺线-骨骺线发育不良)。与其它粘多糖病一样,Maroteaux-Lamy病与粘多糖代谢酶的缺陷有关,在这种情况下恰当地为N-乙酰半乳糖胺-4-硫酸酯酶(也称为芳基硫酸酯酶B)(ARSB)。这种酶代谢硫酸皮肤素的硫酸基团(Neufeldet al.:"The mucopolysaccharidoses"The Metabolic Basis of Inherited Diseases,eds.Scriver et al,New York,McGraw-Hill,1989,p.1565-1587)。这种酶缺陷阻断了硫酸皮肤素的逐渐降解,从而导致硫酸皮肤素在储存组织的溶酶体中积累。
粘多糖病VII型(MPS VII)或Sly疾病是粘多糖病组中一种非常罕见的溶酶体贮积病。症状极其异质:产前形式(非免疫性胎儿胎盘全身水肿),严重的新生儿形式(具有畸形、疝气、肝脾肿大、畸形足、骨发育不全、显著的肌张力减退以及演变为生长迟缓和生存时严重智力缺陷的神经***问题)以及在***或甚至成年时发现的非常温和的形式(胸椎后凸)。该疾病是由于β-D-葡萄糖醛酸酶(GUSB)的缺陷导致各种糖胺聚糖(硫酸皮肤素、硫酸乙酰肝素和硫酸软骨素)在溶酶体中积累引起的。目前针对这种疾病还没有有效治疗方法。
X连锁肾上腺脑白质营养不良
肾上腺脑白质营养不良(ALD)是一种X连锁疾病,影响1/20,000的男性,无论是儿童期的脑ALD还是成人的肾上腺脑神经病(adrenomyleneuropathy)(AMN)。儿童期ALD是更严重的形式,在5-12岁之间出现神经***症状。中枢神经***脱髓鞘进展迅速,并在几年内发生死亡。AMN是一种较温和的疾病形式,发病年龄为15-30岁并且病程进展较快。肾上腺功能不全(爱迪生氏病)可能仍然是ALD的唯一临床表现。ALD的主要生化异常是由于过氧化物酶体中的-氧化受损导致超长链脂肪酸(VLCFA)的积累。
已发现ABCD1基因中超过650个突变会导致X连锁肾上腺脑白质营养不良。这种病症的特点是不同程度的认知和运动问题以及激素失衡。导致X连锁肾上腺脑白质营养不良的突变在大约75%患有这种病症的人中阻止产生任何ALDP。患有X连锁肾上腺脑白质营养不良的其他人可以产生ALDP,但该蛋白质无法发挥其正常功能。在很少或没有功能性ALDP的情况下,VLCFA不会被分解,并且它们会在体内积聚。这些脂肪的积累可能对肾上腺(每个肾脏顶部的小腺体)和体内包围许多神经的脂肪绝缘层(髓磷脂)有毒。研究表明,VLCFA的积累会引发大脑中的炎症反应,这可能导致髓磷脂的分解。这些组织的破坏导致X连锁肾上腺脑白质营养不良的体征和症状。
球形细胞脑白质营养不良
婴儿球形细胞白质营养不良(GLD,半乳糖神经酰胺脂沉积症或克拉伯病)是一种罕见的中枢和外周神经***常染色体隐性遗传退行性疾病。在美国的发病率估计为1:100.000。它的特征是存在球状细胞(具有多个核的细胞)、神经保护性髓鞘层的退化和大脑中细胞的损失。GLD导致严重的精神减退和运动迟缓。它是由缺乏半乳糖脑苷脂-β-半乳糖苷酶(GALC)引起的,GALC是髓磷脂代谢中必不可少的酶。这种疾病通常会影响6个月大之前的婴儿,但它也可能出现在青年或成人中。症状包括易怒、不明原因的发烧、四肢僵硬(高血压)、癫痫发作、与食物摄入有关的问题、呕吐以及智力和运动能力的发育迟缓。其它症状包括肌肉无力、痉挛、耳聋和失明。
半乳糖基神经酰胺酶基因(GALC)长约60kb,并且由17个外显子组成。已在鼠和人类GALC基因中鉴定出许多突变和多态性,导致严重程度不同的GLD。
异染性脑白质营养不良
异染性脑白质营养不良是一种遗传性病症,其特点是细胞中称为硫苷脂的脂肪积累。这种积累尤其影响神经***中产生髓磷脂的细胞,髓磷脂是绝缘和保护神经的物质。被髓磷脂覆盖的神经细胞构成了一种称为白质的组织。产生髓磷脂的细胞中的硫苷脂积累会导致整个神经***的白质(脑白质营养不良)进行性破坏,包括大脑和脊髓(中枢神经***)中的神经以及将大脑和脊髓连接到肌肉和感觉细胞的神经,感染细胞检测诸如触觉、疼痛、热和声音(周围神经***)等感觉。
在患有异染性脑白质营养不良的人中,白质损伤会导致智力功能和运动技能(例如行走能力)进行性恶化。受影响的个体还会发展四肢感觉丧失(周围神经病变)、失禁、癫痫发作、瘫痪、无法说话、失明和听力损失。最终,他们丧失对周围环境的意识,变得反应迟钝。虽然神经***问题是异染性脑白质营养不良的主要特征,但已经报道了硫苷脂积累对其它器官和组织的影响,最常见涉及胆囊。
最常见的异染性脑白质营养不良形式,其影响患有这种病症的所有个体的约50%至60%,被称为婴幼儿后期形式。这种形式的病症通常出现在生命的第二年。受影响的儿童失去他们已经发展的任何语言,变得虚弱,并出现行走问题(步态障碍)。随着疾病的恶化,肌张力通常首先降低,然后增加至僵硬点。患有婴幼儿后期形式异染性脑白质营养不良的个体通常无法活过童年。
在20%至30%的异染性脑白质营养不良个体中,在4岁至***之间发病。在这种青少年形式中,病症的最初迹象可能是行为问题和学业难度增加。该病症的进展比婴幼儿后期形式慢,并且受影响的个体在确诊后可能存活约20年。
大多数患有异染性脑白质营养不良的个体的ARSA基因中具有突变,该基因提供了制备酶芳基硫酸酯酶A的指令。这种酶位于称为溶酶体的细胞结构中,溶酶体是细胞的回收中心。在溶酶体内,芳基硫酸酯酶A有助于分解硫苷脂。少数患有异染性脑白质营养不良的个体的PSAP基因中具有突变。该基因提供了制备蛋白质的指令,该蛋白质被分解(切割)成更小的蛋白质,帮助酶分解各种脂肪。这些较小蛋白质中的一种称为皂化蛋白B;这种蛋白质与芳基硫酸酯酶A一起分解硫苷脂。
ARSA或PSAP基因中的突变导致分解硫苷脂的能力下降,从而导致这些物质在细胞中积累。过量的硫苷脂对神经***有毒。积累逐渐破坏产生髓磷脂的细胞,导致在异染性脑白质营养不良中发生的神经***功能受损。
在某些情况下,芳基硫酸酯酶A活性非常低的个体不会表现出异染性脑白质营养不良的症状。这种病症也称为伪芳基硫酸酯酶缺乏症。
成人形式的异染性脑白质营养不良影响约15%至20%患有这种病症的个体。在这种形式中,最初的症状出现在青少年时期或更晚。通常,行为问题,例如酗酒、药物滥用、或在学校或工作中遇到困难是最先出现的症状。受影响的个体可能会经历精神症状,例如妄想或幻觉。患有成人形式异染性脑白质营养不良的人在确诊后可存活20至30年。在此期间,可能会有一些相对稳定的时期和其它更快速衰退的时期。
异染性脑白质营养不良的名称来源于在显微镜下观察时出现的具有硫脂苷积累的细胞的方式。硫苷脂形成被描述为异染性的颗粒,这意味着在染色检查时,它们呈现出与周围的细胞物质不同的颜色。
戈谢病
戈谢病是一种遗传性疾病,其影响许多的身体器官和组织。这种病症的体征和症状在受影响的个体中差异很大。研究人员根据其特征性特征描述了多种类型的戈谢病。
1型戈谢病是这种病症最常见的形式。1型也称为非神经元病性戈谢病,因为大脑和脊髓(中枢神经***)通常不受影响。这种病症的特征从轻微到严重不等,并且从童年到成年的任何时候都可能出现。主要体征和症状包括肝脏和脾脏肿大(肝脾肿大)、红细胞数量减少(贫血)、血小板减少引起的易瘀伤(血小板减少症)、肺部疾病和骨骼异常(如骨痛、骨折和关节炎)。
2型和3型戈谢病被称为该病症的神经元病形式,因为它们的特点是影响中枢神经***的问题。除了上述体征和症状外,这些病症还可能导致异常眼球运动、癫痫发作和脑损伤。2型戈谢病通常会从婴儿期开始导致危及生命的医疗问题。3型戈谢病也会影响神经***,但它的恶化往往比2型慢。
最严重的戈谢病类型称为围产期致死形式。从出生前或婴儿期开始,这种病症会导致严重或危及生命的并发症。围产期致死形式的特征可能包括由出生前积液引起的广泛肿胀(胎儿水肿);干燥、鳞状皮肤(鱼鳞癣)或其它皮肤异常;肝脾肿大;独特的面部特征;和严重的神经问题。顾名思义,大多数患有围产期致命形式戈谢病的婴儿在出生后只能存活几天。
另一种形式的戈谢病被称为心血管类型,因为它主要影响心脏,导致心脏瓣膜硬化(钙化)。患有心血管形式戈谢病也可能有眼睛异常、骨骼疾病和脾脏轻度肿大(脾肿大)。
GBA基因中的突变导致戈谢病。GBA基因提供了制备称为β-葡萄糖脑苷脂酶的酶的指令。这种酶将一种叫做葡萄糖脑苷脂的脂肪物质分解成糖(葡萄糖)和更简单的脂肪分子(神经酰胺)。GBA基因中的突变大大降低或消除了β-葡萄糖脑苷脂酶的活性。如果没有足够的这种酶,葡萄糖脑苷脂和相关物质会在细胞内积累到毒性水平。这些物质的异常积累和储存会损害组织和器官,导致戈谢病的特征性特征。
岩藻糖苷贮积症
岩藻糖苷贮积症是一种影响身体许多区域的病症,尤其是大脑。受影响的个体的智力残疾会随着年龄的增长而恶化,并且许多人在以后的生活中会患上痴呆症。患有这种病症的人通常会延迟运动技能的发育,例如行走;他们确实获得的技能会随着时间的推移而退化。岩藻糖苷贮积症的其它体征和症状包括生长受损;骨发育异常(多发性成骨异常);癫痫发作;肌肉异常僵硬(痉挛);扩大的血管簇在皮肤上形成小而深的红色斑点(血管角质瘤);通常被描述为“粗糙”的独特面部特征;反复呼吸道感染;和异常大的腹部器官(内脏肥大)。
在严重的情况下,症状通常出现在婴儿期,并且受影响的个体通常会活到童年晚期。在较轻的情况下,症状从1岁或2岁开始,并且受影响的个体往往会存活到成年中期。
过去,研究人员根据症状和发病年龄描述了两种这种病症的类型,但目前的观点是,这两种类型实际上是体征和症状的严重程度各不相同的单一病症。
FUCA1基因中的突变导致岩藻糖苷贮积症。FUCA1基因提供了制备称为α-L-岩藻糖苷酶的指令。这种酶在与某些蛋白质(糖蛋白)和脂肪(糖脂)相连的糖分子复合物(寡糖)的分解中起作用。α-L-岩藻糖苷酶负责在分解过程结束时切断(裂开)称为岩藻糖的糖分子。
FUCA1基因突变严重降低或消除了α-L-岩藻糖苷酶的活性。缺乏酶活性导致糖脂和糖蛋白的不完全分解。这些部分分解的化合物逐渐积聚在全身的各种细胞和组织中,并导致细胞发生故障。脑细胞对糖脂和糖蛋白的积累特别敏感,这会导致细胞死亡。脑细胞的丢失被认为会导致岩藻糖苷贮积症的神经***症状。糖脂和糖蛋白的积累也发生在其它器官中,如肝脏、脾脏、皮肤、心脏、胰腺和肾脏,导致岩藻糖苷贮积症的其它症状。
α-甘露糖苷过多症
α-甘露糖苷过多症是一种常染色体隐性遗传的溶酶体贮积症,其临床特征已得到很好的表征(M.A.Chester et al.,1982,in Genetic Errors of GlycoproteinMetabolism pp 90-119,Springer Verlag,Berlin)。糖蛋白通常在溶酶体中逐步降解,并且步骤之一(即在N-连接糖蛋白有序降解期间切割自非还原端的α-连接甘露糖残基)由酶溶酶体α-甘露糖苷酶(EC 3.2.1.24)催化。然而,在α-甘露糖苷过多症中,缺乏酶α-甘露糖苷酶会导致富含甘露糖的寡糖积累。结果,溶酶体尺寸增大并膨胀,从而损害细胞功能。
α-甘露糖苷过多症的症状包括精神运动迟缓、共济失调、听力受损、外周血中的空泡化淋巴细胞和骨骼变化。
MAN2B1基因中的突变导致α-甘露糖苷过多症。该基因提供了制备酶α-甘露糖苷酶的指令。这种酶在溶酶体中起作用,溶酶体是消化和回收细胞中物质的隔室。在溶酶体内,这种酶有助于分解附着在某些蛋白质(糖蛋白)上的糖分子复合物(寡糖)。特别是,α-甘露糖苷酶有助于分解含有称为甘露糖的糖分子的寡糖。
MAN2B1基因中的突变会干扰α-甘露糖苷酶在分解含甘露糖的寡糖中发挥作用的能力。这些寡糖在溶酶体中积聚并导致细胞发生故障并最终死亡。组织和器官因寡糖的异常积累和由此产生的细胞死亡而受损,导致α-甘露糖苷过多症的特征性特征。
天冬氨酰葡萄糖胺尿症
天冬氨酰葡萄糖胺尿症是一种导致精神功能进行性下降的疾病。患有天冬氨酰葡萄糖胺尿症的婴儿在出生时看起来很健康,并且在整个童年早期发育通常是正常的。这种病症的第一个体征在2或3岁左右很明显,通常是言语延迟。轻度智力障碍然后变得明显,并且学习速度变慢。智力障碍在***逐渐恶化。大多数患有这种病症的人失去了他们所学的大部分语言,并且受影响的成年人的词汇量通常只有几个单词。患有天冬氨酰葡萄糖胺尿症的成年人可能会出现癫痫发作或运动问题。
患有这种病症的人的骨骼也可能逐渐变弱并容易骨折(骨质疏松症),关节运动范围异常大(运动过大)和皮肤松弛。受影响的个体往往具有特征性的面部外观,包括眼睛间距宽(两眼距离过远)、小耳朵和厚嘴唇。鼻子短而宽,并且脸通常是方形的。患有这种病症的儿童可能比他们的年龄高,但在***缺乏生长突增,通常会导致成年人身材矮小。受影响的儿童也往往有频繁的上呼吸道感染。患有天冬氨酰葡萄糖胺尿症的人通常会活到成年中期。
AGA基因中的突变导致天冬氨酰葡萄糖胺尿症。AGA基因提供了产生称为天冬氨酰氨基葡萄糖苷酶的指令。这种酶在溶酶体中具有活性,溶酶体是细胞内充当回收中心的结构。在溶酶体内,酶有助于分解附着在某些蛋白质(糖蛋白)上的糖分子的复合物(寡糖)。
AGA基因突变导致溶酶体中天冬氨酰氨基葡萄糖苷酶的缺失或缺乏,从而阻止糖蛋白的正常分解。结果,糖蛋白可在溶酶体内积聚。过量的糖蛋白会破坏细胞的正常功能,并可能导致细胞破坏。糖蛋白的堆积似乎特别影响大脑中的神经细胞;这些细胞的损失会导致天冬氨酰葡萄糖胺尿症的许多体征和症状。
Farber病
Farber病是一种遗传性病症,涉及体内脂肪的分解和使用(脂质代谢)。患有这种病症的人在整个身体的细胞和组织中,特别是在关节周围存在异常的脂质(脂肪)积累。Farber病的特点是三个典型症状:声音嘶哑或哭声微弱,皮下和其它组织中的小脂肪块(脂肪肉芽肿),以及关节肿胀和疼痛。其它症状可包括呼吸困难、肝脏和脾脏肿大(肝脾肿大)和发育迟缓。研究人员根据其特征性特征描述了七种类型的Farber病。这种病症是由ASAH1基因中的突变引起的,并以常染色体隐性方式遗传。
泰-萨克斯病
泰-萨克斯病是一种罕见的遗传性病症,会逐渐破坏大脑和脊髓中的神经细胞(神经元)。
泰-萨克斯病最常见的形式在婴儿期变得明显。患有这种病症的婴儿通常在3到6个月年龄之前表现正常,此时他们的发育减慢并且用于运动的肌肉变弱。受影响的婴儿会失去运动技能,例如翻身、坐姿和爬行。他们还会对大声的噪音产生夸张的惊吓反应。随着疾病的进展,患有泰-萨克斯病的儿童会出现癫痫发作、视力和听力丧失、智力障碍和瘫痪。这种病症的特点是一种称为樱桃红斑的眼睛异常,可以通过眼科检查来识别。患有这种严重婴儿型泰-萨克斯病的儿童通常只能活到幼儿期。
其它形式的泰-萨克斯病病非常罕见。体征和症状可能出现在儿童期、***或成年期,并且通常比婴儿形式看到的症状和症状要轻。特征性特征包括肌肉无力、肌肉协调性丧失(共济失调)和其它运动问题、言语问题和精神疾病。这些体征和症状在患有迟发性形式的泰-萨克斯病的人群中差异很大。
HEXA基因中的突变导致泰-萨克斯病。HEXA基因提供了制备称为β-己糖胺酶A的酶的一部分的指令,该酶在大脑和脊髓中起关键作用。这种酶位于溶酶体中,溶酶体是细胞中分解有毒物质并充当回收中心的结构。在溶酶体内,β-己糖胺酶A有助于分解一种叫做GM2神经节苷脂的脂肪物质。
HEXA基因中的突变破坏了β-己糖胺酶A的活性,从而阻止酶分解GM2神经节苷脂。结果,这种物质积累到毒性水平,特别是在大脑和脊髓的神经元中。由GM2神经节苷脂的堆积引起的进行性损伤会导致这些神经元的破坏,从而导致泰-萨克斯病病的体征和症状。
因为泰-萨克斯病损害溶酶体酶的功能并涉及GM2神经节苷脂的堆积,这种病症有时被称为溶酶体贮积症或GM2-神经节苷脂贮积病。
庞贝氏病
庞贝氏病(也称为糖原贮积病II型;酸性α-葡糖苷酶缺乏症;酸性麦芽糖酶缺乏症;GAA缺乏症;GSD II;糖原病II型;糖原病,全身性,心脏型;弥漫性糖原性心肥大;酸性麦芽糖酶缺乏症;AMD;或α-1,4-葡萄糖苷酶缺乏症)是一种常染色体隐性代谢遗传病症,其特点是溶酶体酶酸性α-葡萄糖苷酶(GAA)(也称为酸性麦芽糖酶)的基因中的突变。GAA基因中的突变消除或降低了GAA酶水解糖原、麦芽糖和异麦芽糖中的α-1,4和α-1,6键的能力。结果,糖原在全身细胞的溶酶体和细胞质中积累,导致细胞和组织破坏。特别受影响的组织包括骨骼肌和心肌。积累的糖原导致进行性肌肉无力,导致心脏肥大、行走困难和呼吸功能不全。
已经确定了三种类型的庞贝氏病,包括典型的婴儿期发病的疾病、非经典型婴儿期发病的疾病和迟发型疾病。典型的婴儿期发病形式的特点是肌肉无力、肌张力差、肝肿大和心脏缺陷。该疾病的发病率约为140,000人中1人。患有这种形式疾病的患者通常在出生后的第一年死于心力衰竭。该疾病的非经典婴儿期发病形式的特点是运动技能延迟、进行性肌肉无力和在某些情况下心脏肥大。由于呼吸衰竭,患有这种形式疾病的患者通常只能活到幼儿期。迟发形式的疾病可能出现在童年晚期、***或成年期,并且特点是腿部和躯干进行性肌肉无力。
尼曼匹克病
尼曼匹克病是一种影响许多身体***的病症。它的症状范围很广,严重程度各不相同。尼曼匹克病分为四种主要类型:A型、B型、C1型和C2型。这些类型基于遗传原因和病症的体征和症状进行分类。
患有A型尼曼匹克病的婴儿通常会在3个月大时出现肝脏和脾脏肿大(肝脾肿大),并且无法以预期的速度增加体重和生长(无法茁壮成长)。受影响的儿童发育正常,直到1岁左右,他们的心智能力和运动能力逐渐丧失(精神运动退化)。患有A型尼曼匹克病的儿童也会出现广泛的肺损伤(间质性肺病),可导致反复肺部感染并最终导致呼吸衰竭。所有受影响的儿童都有一种称为樱桃红斑的眼睛异常,可以通过眼科检查来识别。患有A型尼曼匹克病的儿童通常无法存活过幼儿期。
B型尼曼匹克病通常出现在儿童中期。这种类型的体征和症状与A型相似,但没有那么严重。患有B型尼曼匹克病的患者通常有肝脾肿大、反复肺部感染和血液中的血小板数低(血小板减少症)。它们还具有身材矮小和骨矿化缓慢(骨龄延迟)。大约三分之一受影响个体患有樱桃红斑眼异常或神经功能缺损。患有B型尼曼匹克病的人通常能活到成年。
A型和B型尼曼匹克病是由SMPD1基因中的突变引起的。该基因提供了产生一种称为酸性鞘磷脂酶的指令。这种酶存在于溶酶体中,溶酶体是细胞内分解并回收不同类型分子的隔室。酸性鞘磷脂酶负责将称为鞘磷脂的脂肪(脂质)转化为称为神经酰胺的另一种脂质。SMPD1中的突变导致酸性鞘磷脂酶缺乏,这导致鞘磷脂的分解减少,从而导致这种脂肪在细胞中积累。这种脂肪堆积会导致细胞故障并最终死亡。随着时间的推移,细胞损失会损害A型和B型尼曼匹克病患者的组织和器官(包括脑、肺、脾和肝)功能。
沃尔曼病
溶酶体酸性脂肪酶缺乏症是一种遗传性病症,其特点是体内脂肪和胆固醇的分解和使用问题(脂质代谢)。在受影响的个体中,有害数量的脂肪(脂质)积累在全身的细胞和组织中,这通常会导致肝脏疾病。有两种形式的病症。最严重和最罕见的形式始于婴儿期。不太严重的形式可以从童年开始到成年后期。
在严重的早发性形式的溶酶体酸性脂肪酶缺乏症中,在生命的最初几周内,脂质会在全身积累,尤其是在肝脏中。这种脂质积累会导致多种健康问题,包括肝脏和脾脏肿大(肝脾肿大)、体重增加不足、皮肤和眼白呈黄色(黄疸)、呕吐、腹泻、脂性粪(脂肪痢)、以及从食物中吸收营养不良(吸收不良)。此外,受影响的婴儿通常在每个肾脏顶部的产生激素的小腺体(肾上腺)中有钙沉积,血液中的铁含量低(贫血)和发育迟缓。疤痕组织在肝脏中迅速堆积,导致肝脏疾病(肝硬化)。患有这种形式溶酶体酸性脂肪酶缺乏症的婴儿会出现多器官功能衰竭和严重的营养不良,且通常活不过1年。
在迟发性形式的溶酶体酸性脂肪酶缺乏症中,体征和症状各不相同,并且通常在儿童中期开始,尽管它们可以在到成年后期的任何时间出现。几乎所有受影响的个体都会出现肝脏肿大(肝肿大);也可能发生脾肿大(脾肿大)。大约三分之二的人患有肝纤维化,最终导致肝硬化。大约三分之一迟发性形式的个体有吸收不良、腹泻、呕吐和脂肪痢。患有这种形式溶酶体酸性脂肪酶缺乏症的个体可能会具有增加的肝酶和高胆固醇水平,这可以通过血液检查来检测。
患有这种迟发性形式溶酶体酸性脂肪酶缺乏症的一些人会在动脉壁上积累脂肪沉积物(动脉粥样硬化)。尽管这些沉积物在普通人群中很常见,但它们通常在溶酶体酸性脂肪酶缺乏症患者的较早年龄开始。沉积物使动脉变窄,增加了心脏病发作或中风的机会。患有迟发性溶酶体酸性脂肪酶缺乏症的个体的预期寿命取决于相关健康问题的严重程度。
这两种形式的溶酶体酸性脂肪酶缺乏症曾被认为是不同的病症。早发性形式称为沃尔曼病,而迟发性形式称为胆固醇酯贮积病。尽管这两种病症具有相同的遗传原因并且现在被认为是单一病症的形式,但这些名称有时仍用于区分溶酶体酸性脂肪酶缺乏症的形式。
LIPA基因中的突变导致溶酶体酸性脂肪酶缺乏症。LIPA基因提供了产生称为溶酶体酸性脂肪酶的酶的指令。这种酶存在于称为溶酶体的细胞隔室中,溶酶体可以消化并回收细胞不再需要的物质。溶酶体酸性脂肪酶分解脂类,如胆固醇酯和甘油三酯。通过这些过程产生的脂质、胆固醇和脂肪酸被身体使用或运输到肝脏以去除。
LIPA基因中的突变导致功能性溶酶体酸性脂肪酶的短缺(缺乏)。病症的严重程度取决于有多少工作酶可用。患有早发性形式溶酶体酸性脂肪酶缺乏症的个体没有正常的酶活性。患有迟发性形式的那些个体被认为保留了一些酶活性,并且其数量通常决定体征和症状的严重程度。
溶酶体酸性脂肪酶活性降低会导致胆固醇酯、甘油三酯和其它脂质在溶酶体内积聚,从而导致多个组织中的脂肪堆积。身体无法从这些脂质的分解中产生胆固醇,导致替代胆固醇产生方法的增加和血液中胆固醇水平高于正常水平。过量的脂质被运送到肝脏以去除。因为它们中的许多没有被适当地分解,因此它们无法从体内去除;相反,它们会在肝脏中积累,导致肝脏疾病。组织中脂质的进行性积累导致器官功能障碍以及溶酶体酸性脂肪酶缺乏的体征和症状。
造血干细胞
如本文所用,造血干细胞(HSC)是指动物(优选哺乳动物,更优选人类)细胞,其具有分化成多种血细胞类型的能力,包括红细胞、白细胞,包括淋巴样细胞和骨髓细胞。HSC可以包括具有体内长期移植潜力的造血细胞。可以使用动物模型或体外模型确定长期移植潜力(例如长期造血干细胞)。用于候选人类造血干细胞群的长期移植潜力的动物模型包括SCID-hu骨模型(Kyoizumi et al.(1992)Blood 79:1704;Murray et al.(1995)Blood 85(2)368-378)和子宫内绵羊模型(Zanjani et al.(1992)J.Clin.Invest.89:1179)。有关人类造血用动物模型的综述,请参见Srour et al.(1992)J.Hematother.1:143-153和其中引用的参考文献。干细胞的体外模型是长期培养起始细胞(LTCIC)测定,基于5-8周后基质共培养中产生的克隆源性细胞数量的有限稀释分析(Sutherland et al.(1990)Proc.Nat'lAcad.Sci.87:3584-3588)。LTCIC测定已被证明与另一种常用的干细胞测定(即鹅卵石区域形成细胞(CAFC)测定)相关,并且与体内长期移植潜力相关(Breems et al.(1994)Leukemia 8:1095)。
造血干细胞(HSC)存在于骨髓中,并且具有产生所有不同成熟血细胞类型和组织的独特能力。HSC是自我更新的细胞:当它们增殖时,至少它们的一些子细胞仍然是HSC,因此干细胞库不会耗尽。其它细胞分化成产生淋巴细胞的普通淋巴祖细胞和产生单核细胞的普通骨髓祖细胞。
在一些实施方式中,从骨髓中分离出用于本文基因修饰的造血干细胞。在一些实施方式中,可以使用针头或注射器从骨盆的髂嵴处取出HSC。
在一些实施方式中,造血干细胞可以来源于人类脐带血或动员的外周血。从人类外周血获得的造血干细胞可以通过多种策略之一进行动员。可用于诱导造血干细胞从骨髓动员到外周血中的示例性药剂包括趋化因子(C-X-C基序)受体4(CXCR4)拮抗剂,诸如AMD3100(也称为普乐沙福和MOZOBIL(Genzyme,Boston,Mass.))和粒细胞集落刺激因子(GCSF),在临床实验中,它们的组合已被证明可以快速动员CD34+细胞。此外,趋化因子(C-X-C基序)配体2(CXCL2,也称为GRO)代表另一种能够诱导造血干细胞从骨髓动员到外周血的药剂。与本发明的组合物和方法一起使用的能够诱导造血干细胞动员的药剂可以彼此组合使用。例如,CXCR4拮抗剂(例如AMD3100)、CXCL2和/或GCSF可以以单一混合物顺序或同时施用于受试者,以诱导造血干细胞从骨髓动员到外周血中。这些药剂作为造血干细胞动员的诱导剂的用途描述于例如Pelus,Current Opinion in Hematology 15:285(2008)中,其公开内容通过引用并入本文。
在一些实施方式中,从循环的外周血中采集HSC,同时向献血者注射从骨髓中动员HSC的药剂。在一些实施方式中,将HSC从骨髓动员到外周血的药剂是细胞因子,例如粒细胞集落刺激因子(G-CSF)。在一些实施方式中,从外周血中分离的HSC群体富含CD34+细胞,并且包括至少50%、至少70%或至少90%的CD34+细胞。
在一些实施方式中,对于动员外周血(MPB)白细胞除去法,CD34+细胞通常可以使用免疫磁珠诸如CliniMACS进行处理和富集,可以在细胞培养级干细胞因子(SCF)存在下、在无血清培养基中将纯化的CD34+细胞以1x106个细胞/ml接种在培养袋上,优选300ng/ml(Amgen Inc.,Thousand Oaks,CA,USA),优选具有FMS-样酪氨酸激酶3配体(FLT3L)300ng/ml和促血小板生成素(TPO),优选约100ng/ml以及进一步的白细胞介素IL-3,优选多于60ng/ml(均来自Cell Genix Technologies),在优选12至24小时之后,转移至包括序列特异性试剂(例如,mRNA)的电穿孔缓冲液。电穿孔后,将细胞转移回培养基中,然后重新悬浮在盐水中并转移到注射器中进行输注。
用于在细胞混合物中富集或消耗特定细胞群的方法是本领域众所周知的。例如,可以通过密度分离法、玫瑰花结四元聚体抗体复合物介导的富集/去除、磁激活细胞分选(MACS)、基于多参数荧光的分子表型如荧光激活细胞分选(FACS)或其任何组合来富集或耗尽细胞群。总的来说,这些富集或消耗细胞群的方法在本文中通常可以称为“分选”细胞群或“在一定条件下”接触细胞以形成或产生富集的(+)或耗尽的(-)细胞群。
在收集动员的细胞后,取出的造血干细胞可以如本文进行基因修饰,然后输注到有需要的患者体内,该患者可以是供体或另一受试者,例如与供体至少部分HLA-匹配的受试者,用于治疗本文描述的疾病。
在一些实施方式中,这些细胞形成细胞群,其优选源自单个供体或患者。这些细胞群可以在封闭的培养接受者下扩增,以符合最高的生产实践要求,并且可以在输注到患者体内之前冷冻,从而提供“现成的”或“即用型”的治疗组合物。
在一些实施方式中,HSC是CD34+。在一些实施方式中,HSC可以被进一步描述为CD133+、CD90+、CD38-、CD45RA-、Lin-或其任何组合。
在一些实施方式中,能够分化成小胶质细胞的HSC来源于多能干细胞,如诱导多能干细胞(iPS)。参见例如Abud et al.,Neuron 94,278–293(2017)。在一些实施方式中,如本文所描述的对iPS细胞进行基因修饰并且然后分化成HSC细胞。在一些实施方式中,iPS细胞分化成HSC,然后如本文所描述的对HSC进行基因修饰。在进一步的实施方式中,可以对细胞进行基因编辑,然后重编程成iPS细胞和HSC,如例如国际申请号PCT/EP2018/083180中所描述的。在一些实施方式中,可以从待治疗的患者中分离或从相容的供体中分离造血干细胞。
在一些实施方式中,造血干细胞获自诱导多能干(iPS)细胞,该iPS细胞来源于待治疗的患者的细胞或相容的供体。
在一些实施方式中,HSC可以在基因修饰这些细胞和/或将其输注到患者体内之前进行离体扩增。参见例如美国专利号9,580,426;9,956,249;9,527,828;9,428,748;9,394,520;9,328,085;9,226,942;9,115,341;8,927,281。
在一些实施方式中,细胞分离自供体,该供体是HLA匹配的同胞供体、HLA匹配的无关供体、部分匹配的无关供体、单倍体相合相关供体、自体供体、HLA不匹配供体、供体库或其任何组合。在一些实施方式中,治疗性细胞群是同种异体的。在一些实施方式中,治疗性细胞群是自体的。在一些实施方式中,治疗性细胞群是单倍体相合的。
基因修饰的细胞
在一些实施方式中,本发明提供了根据本文描述的方法的实施方式的任一个可获得的基因修饰的HSC或iPS细胞。
在一些实施方式中,本发明提供了基因修饰的HSC或iPS细胞,其包括整合在至少在小胶质细胞中具有转录活性的基因座处的转基因,其中转基因在基因座的内源启动子的转录控制下。在一些实施方式中,转基因包括选自由IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5组成的组中的基因的编码序列。
在一些实施方式中,转基因的多个拷贝整合在HSC或iPS细胞中。在一些实施方式中,多个拷贝整合在不同的基因座处。在一些实施方式中,多个拷贝整合在同一基因座处。在一些实施方式中,整合在同一基因座处的多个拷贝由2A自切割肽序列分隔开。
在一些实施方式中,引入的转基因受小胶质细胞中内源性启动子的控制。在一些实施方式中,在小胶质细胞中具有活性的基因座选自由以下组成的组:TMEM119、S100A9、CD11B、B2m、Cx3cr1、MERTK、CD164、Tlr4、Tlr7、Cd14、Fcgr1a、Fcgr3a、TBXAS1、DOK3、ABCA1、TMEM195、MR1、CSF3R、FGD4、TSPAN14、TGFBRI、CCR5、GPR34、SERPINE2、SLCO2B1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfia4。
在一些实施方式中,基因修饰的HSC或iPS细胞包括整合在在小胶质细胞中具有转录活性的基因座处的转基因,基因座选自TMEM119、CD11B、B2m、CX3CR1或S100A9,其中转基因受基因座的内源性启动子的转录控制。
在一些实施方式中,基因修饰的造血干细胞通过直接基因修饰造血干细胞来获得。在一些实施方式中,基因修饰的造血干细胞通过基因修饰诱导的多能干(iPS)细胞并且将iPS细胞分化以成为造血干细胞来获得。
在一些实施方式中,造血干细胞(HSC)或iPS细胞被基因修饰,使得细胞在它们分化成小胶质细胞后能够表达转基因。在一些实施方式中,细胞中经基因修饰的基因座在小胶质细胞中具有转录活性。
在一些实施方式中,使富集的HSC群经受一种方法以基因修饰细胞。在一些实施方式中,富集的群包括至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多的CD34+HSC。
在一些实施方式中,使用序列特异性试剂对HSC或iPS细胞进行基因修饰。在一些实施方式中,序列特异性试剂识别在小胶质细胞中表达的基因座中存在的一个或多个序列。在一些实施方式中,序列特异性试剂切割细胞中的核酸。
在一些实施方式中,本发明提供了一种制备基因修饰的HSC或iPS细胞的方法,包括将转基因整合在HSC或iPS细胞中。在一些实施方式中,该方法包括使细胞与序列特异性试剂接触,序列特异性试剂切割在小胶质细胞中表达的基因座处的核酸序列。在一些实施方式中,该方法进一步包括使细胞与包括转基因的供体核酸接触。
在一些实施方式中,用于基因编辑本发明细胞的序列特异性试剂是稀有切割核酸内切酶,例如TALE-核酸酶(以Cellectis商标
Figure BDA0003994978620000401
市售)。优选的试剂切割本说明书表4中报道的一种或几种靶序列。
在一些实施方式中,序列特异性试剂靶向CX3CR1的内含子,优选位于第一编码外显子和第二编码外显子之间的CX3CR1的第一个内含子(SEQ ID NO:76)。本发明还提供了特异性TALE核酸酶,其优先靶向与SEQ ID NO:77至87类似的CX3CR1的内源性多核苷酸序列。在一些实施方式中,序列特异性试剂是CRISPR-Cas或CRISPR-Cpf,其使用gRNA靶向与SEQID NO:97至106类似的内源性序列。
在一些实施方式中,序列特异性试剂靶向CD11B的内含子,优选CD11B的第一个内含子。本发明还提供了特异性TALE核酸酶,其优先靶向与SEQ ID NO:108至137类似的CD11B的内源性多核苷酸序列。在一些实施方式中,序列特异性试剂是CRISPR-Cas或CRISPR-Cpf,其使用gRNA靶向与SEQ ID NO:138至147类似的内源性序列。
在一些实施方式中,序列特异性试剂靶向S100A9的内含子,优选S100A9的第一个内含子。本发明还提供了特异性TALE核酸酶,其优先靶向与SEQ ID NO:149至178类似的S100A9的内源性多核苷酸序列。在一些实施方式中,序列特异性试剂是CRISPR-Cas或CRISPR-Cpf,其使用gRNA靶向与SEQ ID NO:179至188类似的内源性序列。
在一些实施方式中,多核苷酸模板包括如本文所描述的转基因的编码序列。在一些实施方式中,多核苷酸模板包括选自由以下组成的组的基因的编码区:IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5。
在一些实施方式中,供体核酸包括选自由以下组成的组的核苷酸序列:SEQ IDNO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35和如本文所描述的其变体。
在一些实施方式中,供体核酸编码治疗性蛋白质,该治疗性蛋白质包括从SEQ IDNO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36和如本文所描述的的其变体中选择的氨基酸序列。
在一些实施方式中,序列特异性试剂可以是包括DNA结合结构域和展示催化活性的另一结构域的嵌合多肽。这种催化活性可以是切口酶或双切口酶,以通过产生粘性末端优先进行基因***,从而通过同源重组促进基因整合。
在一些实施方式中,核酸酶试剂诱导NHEJ或同源重组机制,其具有将稳定且可遗传的突变引入在小胶质细胞中表达的基因组基因座中的优势。
“核酸酶试剂”是指通过本身或作为诸如指导RNA Cas9等复合物的亚基有助于靶细胞中核酸酶催化反应(优选核酸内切酶反应)的核酸分子,优选导致切割核酸序列靶标。
本发明的核酸酶试剂通常是“序列特异性核酸酶试剂”,意指它们可以在细胞中在预定位点诱导DNA切割,延伸称为“靶向基因”。被序列特异性试剂识别的核酸序列称为“靶序列”。所述靶序列通常被选择为在细胞基因组中是稀有的或独特的,并且在人类基因组中更广泛选择,这可以使用软件和来自人类基因组数据库的数据来确定,例如http://www.ensembl.org/index.html。
在一些实施方式中,根据本发明使用的序列特异性核酸酶试剂(其特异性切割基因座内的序列)也可用于诱导外源性模板在基因座处的整合。“外源性序列”是指最初在选定基因座处不存在的任何核苷酸或核酸序列。外源性序列优选包括编码如本文所描述的用于治疗本文疾病的治疗性多肽的序列。根据本发明的方法通过***多核苷酸进行基因修饰以表达由其编码的多肽的内源性序列,广义地称为外源性编码序列。在一些实施方式中,靶向的基因***包括编码如本文所描述的治疗性多肽的外源性序列。
美国专利号5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;和6,242,568;以及WO 98/37186;WO 98/53057;WO 00/27878;WO 01/88197和GB 2,338,237中公开了适用于DNA结合结构域的示例性选择方法,包括噬菌体展示和双杂交***。
靶位点的选择;用于设计和构建融合蛋白(和编码其的多核苷酸)的核酸酶和方法是本领域技术人员已知的,并且在美国专利申请公开号20050064474和20060188987中进行详细描述,通过引用将其全部内容并入本文。
DNA结构域可以工程化为与靶基因座中选择的任何序列结合。在一些实施方式中,用序列特异性试剂对细胞进行基因修饰,该序列特异性试剂已被工程化以结合在小胶质细胞中具有转录活性的基因座。与天然存在的DNA结合域相比,工程化的DNA结合域可以具有新的结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理设计包括例如使用包括三联体(或四联体)核苷酸序列和单个(例如锌指)氨基酸序列的数据库,其中每个三联体或四联体核苷酸序列与DNA结合结构域的一个或多个氨基酸序列相关联,氨基酸序列结合特定的三联体或四联体序列。参见,例如,美国专利号6,453,242和6,534,261,通过引用将其全部内容并入本文。也可以进行TAL效应物结构域的合理设计。参见例如美国专利申请公开号2011/0301073。
此外,如这些和其它参考文献中所公开的,可以使用任何合适的接头序列将DNA结合结构域(例如多指锌指蛋白)连接在一起,包括例如5个或更多个氨基酸的接头。对于长度为6个或更多氨基酸的示例性接头序列,参见例如题美国专利号6,479,626;6,903,185;和7,153,949。本文所描述的蛋白质可以在蛋白质的各个DNA结合结构域之间包括适合接头的任何组合。还参见美国专利申请公开号2011/0301073。
包括转基因的外源性/供体序列在其整个长度上与在小胶质细胞中表达的基因座内的序列不相同。供体序列可以含有由有两个同源区侧翼的非同源序列,以允许在目的位置进行有效的HDR。替代地,供体可能与DNA中的靶位置没有同源区域,并且可以在靶位点切割后通过NHEJ依赖性末端连接进行整合。此外,供体序列可以包括载体分子,该载体分子含有与细胞染色质中目的区域不同源的序列。供体分子可以含有多个与细胞染色质同源的不连续区域。例如,为了靶向***通常不存在于目的区域中的序列,所述序列可以存在于供体核酸分子中并且由与目的区域中的序列同源的区域侧翼。
在一些实施方式中,序列特异性试剂是编码“工程化的”或“可编程的”稀有切割核酸内切酶的核酸,稀有切割核酸内切酶诸如例如WO 2004067736中描述的归巢核酸内切酶、例如Urnov F.,et al.(Nature 435:646-651(2005))描述的锌指核酸酶(ZFN)、例如Mussolino et al.(Nucl.Acids Res.39(21):9283-9293(2011))描述的TALE-核酸酶、或例如Boissel et al.(Nucleic Acids Research 42(4):2591 -2601(2013))描述的MegaTAL核酸酶。
在一些实施方式中,核酸内切酶试剂瞬时表达到细胞中,这意味着该试剂不应该整合到基因组中或长时间持续存在,例如RNA(更特别是mRNA)、蛋白质或者混合蛋白质和核酸的复合物(例如:核糖核蛋白)的情况。
在一些实施方式中,序列特异性试剂是在靶基因座引入DNA双链断裂的核酸酶,利用其随后的修复来实现不同的结果。在一些实施方式中,基于同源重组的修复途径可用于从引入的DNA同源模板复制信息。此类同源定向修复(HDR)可促进特异性添加外源性多核苷酸序列(参见例如美国专利号8,921,332),例如本文描述的转基因,其可以在存在于外源性多核苷酸序列上的启动子的控制下表达。在一些实施方式中,如本文描述的转基因可以在内源性启动子的控制下表达,并且同时实现该基因破坏。在实现基因破坏的一些实施方式中,转基因***在内源性基因的终止密码子处并且包括自切割2A肽或IRES序列。在更优选的实施方式中,转基因在内源性启动子的控制下表达而没有基因破坏。在一些实施方式中,可以利用非同源末端连接(NHEJ)修复途径(参见例如美国专利号9,458,439;He et al.,Nucleic Acids Research,44e85,https://doi.org/10.1093/nar/gkw064)。
在一些实施方式中,一种或多种靶核酸酶(例如,CRISPR/Cas、ZFNS或TALEN)在小胶质细胞中表达的基因座处在靶序列(例如细胞染色质)中产生双链断裂。在一些实施方式中,将包括编码治疗性蛋白质的转基因和与断裂区域侧翼的核苷酸序列同源的供体多核苷酸引入细胞中。已显示双链断裂的存在有助于供体序列的整合。供体序列可以物理整合,或者替代地,将供体多核苷酸用作模板,以通过同源重组修复断裂,导致将如供体中的核苷酸序列的全部或部分引入到细胞染色质中。因此,可以改变并且在某些实施方式中可以修饰在小胶质细胞中表达的基因座处的细胞染色质中的序列,以包括在供体多核苷酸中存在的序列。
在一些实施方式中,外源性核苷酸序列(包括转基因的“供体序列”)可以含有与在小胶质细胞中表达的目的基因座中的基因组序列同源但不相同的序列,从而刺激同源重组以在目的基因座中***不同序列。在一些实施方式中,与目的基因座中的序列同源的供体序列的部分与被替换的基因组序列表现出约70%至99%(或它们之间的任何整数)的序列同一性。在其它实施方式中,供体和基因组序列之间的同源性高于99%,例如如果在超过100个连续碱基对上供体和基因组序列之间只有1个核苷酸不同。供体序列的非同源部分含有目标基因座中不存在的序列,从而将新序列,即编码转基因的序列,引入目标基因座中。在一些实施方式中,非同源序列的侧翼通常为50-1,000个碱基对(或它们之间的任何整数值)或任何数量大于1,000的碱基对的序列,其与目的基因座中的序列同源或相同。在一些实施方式中,供体序列与第一序列非同源,并通过非同源重组机制***基因组。
核酸酶可以靶向在小胶质细胞中具有活性的基因以***转基因。在一些实施方式中,核酸酶是非天然存在的,即在DNA结合结构域和/或切割结构域中工程化。例如,可以改变天然存在的核酸酶或核酸酶***的DNA结合结构域以结合选定的靶位点(例如,已经工程化以结合与同源结合位点不同的位点的大范围核酸酶或利用工程化的单向导RNA的CRISPR/Cas***)。在其它实施方式中,核酸酶包括异源性DNA结合结构域和切割结构域(例如,锌指核酸酶;TAL效应物核酸酶;具有异源性切割结构域的大范围核酸酶DNA结合结构域)。
在一些实施方式中,核酸酶是大范围核酸酶(归巢核酸内切酶)。非天然存在的大范围核酸酶识别15-40个碱基对切割位点,并且通常分为四个家族:LAGLIDADG家族、GIY-YIG家族、His-Cyst盒家族和HNH家族。示例性的归巢核酸内切酶包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。它们的识别序列是已知的。还参见美国专利号5,420,032;美国专利号6,833,252;Belfort et al.(1997)Nucleic Acids Res.25:3379-3388;Dujon et al.(1989)Gene 82:115-118;Perler et al.(1994)Nucleic Acids Res.22,1125-1127;Jasin(1996)Trends Genet.12:224-228;Gimble et al.(1996)J.Mol.Biol.263:163-180;Argast etal.(1998)J.Mol.Biol.280:345-353以及新英格兰生物实验室目录。
在一些实施方式中,核酸酶包括工程化的(非天然存在的)归巢核酸内切酶(大范围核酸酶)。在一些实施方式中,归巢核酸内切酶和大范围核酸酶的DNA结合特异性可以被工程化以结合非天然靶位点。参见例如Chevalier et al.(2002)Molec.Cell 10:895-905;Epinat et al.(2003)Nucleic Acids Res.31:2952-2962;Ashworth et al.(2006)Nature441:656-659;Paques et al.(2007)Current Gene Therapy 7:49-66;美国专利公开号20070117128。归巢核酸内切酶和大范围核酸酶的DNA结合结构域可以在整个核酸酶的背景下发生改变(即使得核酸酶包括同源切割结构域)或可以融合到异源性切割结构域。
在一些实施方式中,DNA结合结构域包括天然存在的或工程化的(非天然存在的)TAL效应物DNA结合结构域。参见例如美国专利申请公开号2011/0301073,其通过引用整体并入本文。已知黄单胞菌属(genus Xanthomonas)的植物病原菌在重要的农作物中引起许多疾病。黄单胞菌的致病性取决于保守的III型分泌(T3S)***,该***将超过25种不同的效应蛋白注入植物细胞。在这些注入的蛋白质中有转录激活器样效应物(TALE),它模拟植物转录激活器并操纵植物转录组(Kay et al.(2007)Science 318:648-651)。这些蛋白质含有DNA结合结构域和转录激活结构域。表征最完善的TALE之一是来自野油菜黄单胞菌辣椒斑点病致变种(Xanthomonas campestgris pv.Vesicatoria)的AvrBs3(见Bonas et al.(1989)Mol Gen Genet 218:127-136和WO 2010/079430)。TALE含有串联重复的集中结构域,每个重复含有约34个氨基酸,这是这些蛋白质DNA结合特异性的关键。此外,它们含有核定位序列和酸性转录激活结构域(对于综述,参见Schornack S,et al.(2006)J PlantPhysiol 163(3):256-272)。此外,在植物病原菌青枯雷尔氏菌中发现了两个基因,称为brg11和hpx17,它们与青枯雷尔氏菌生物变型1菌株GMI1000和生物变型4菌株RS1000中的黄单胞菌属的AvrBs3家族同源(参见Heuer et al.(2007)Appl and Envir Micro 73(13):4379-4384)。这些基因在核苷酸序列上彼此有98.9%的同一性,但不同之处在于在hpx17的重复结构域中缺失了1,575bp。然而,两个基因产物与黄单胞菌的AvrBs3家族蛋白的序列同一性均低于40%。
在一些实施方式中,与靶基因座中的靶位点结合的DNA结合结构域是来自TAL效应物的工程化结构域,类似于源自植物病原体黄单胞菌(参见Boch et al.(2009)Science326:1509-1512和Moscou and Bogdanove(2009)Science 326:1501)和雷尔氏菌(参见Heuer et al.(2007)Applied and Environmental Microbiology 73(13):4379-4384);美国专利号8,420,782和8,440,431以及美国专利申请公开号2011/0301073)的那些效应物。
在一些实施方式中,DNA结合结构域包括锌指蛋白。在一些实施方式中,锌指蛋白是非天然存在的,因为它被工程化以结合选择的靶位点。参见例如Beerli et al.(2002)Nature Biotechnol.20:135-141;Pabo et al.(2001)Ann.Rev.Biochem.70:313-340;Isalan et al.(2001)Nature Biotechnol.19:656-660;Segal et al.(2001)Curr.Opin.Biotechnol.12:632-637;Choo et al.(2000)Curr.Opin.Struct.Biol.10:411-416;美国专利号6,453,242;6,534,261;6,599,692;6,503,717;6,689,558;7,030,215;6,794,136;7,067,317;7,262,054;7,070,934;7,361,635;7,253,273;和美国专利申请公开号2005/0064474;2007/0218528;2005/0267061,全部通过引用将其全部内容并入本文。
与天然存在的锌指蛋白相比,工程化的锌指结合或TALE结构域可以具有新的结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理设计包括例如使用包括三联体(或四联体)核苷酸序列和单独的锌指氨基酸序列的数据库,其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的锌指的一个或多个氨基酸序列相关联。参见例如美国专利号6,453,242和6,534,261,通过引用将其全部内容并入本文。
在一些实施方式中,DNA结构域(例如,多指锌指蛋白或TALE结构域)可以使用任何合适的接头序列连接在一起,包括例如长度为5个或更多个氨基酸的接头。对于长度为6个或更多个氨基酸的示例性接头序列,还参见美国专利号6,479,626;6,903,185;和7,153,949。本文描述的DNA结合蛋白可以在蛋白质的各个锌指之间包括适合接头的任何组合。此外,在共同拥有的WO 02/077227中已经描述了对锌指结合结构域的结合特异性的增强。
用于设计和构建融合蛋白(和编码它们的多核苷酸)的DNA结合结构域和方法是本领域技术人员已知的,并且在美国专利号6,140,0815;789,538;6,453,242;6,534,261;5,925,523;6,007,988;6,013,453;6,200,759;WO 95/19431;WO 96/06166;WO 98/53057;WO98/54311;WO 00/27878;WO 01/60970WO 01/88197;WO 02/099084;WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496以及美国专利申请公开号2011/0301073中进行了详细地描述。
可以将任何合适的切割结构域可操作地连接至DNA结合结构域以形成核酸酶。例如,已将ZFP DNA-结合结构域与核酸酶结构域融合以创建ZFN-一种功能实体,其能够通过其工程化(ZFP)DNA结合结构域识别其预期的核酸靶,并导致DNA在ZFP结合位点附近经由核酸酶活性被切割。参见例如Kim et al.(1996)Proc Nat'l Acad Sci USA 93(3):1156-1160。最近,ZFN已被用于多种生物体中的基因组修饰。参见例如美国专利申请公开号:2003/0232410;2005/0208489;2005/0026157;2005/0064474;2006/0188987;2006/0063231;以及国际公开WO 07/014275。同样地,已经将TALE DNA-结合结构域融合至核酸酶结构域以创建TALEN。参见例如美国专利申请公开号2011/0301073。
如上所看到的,切割结构域可以与DNA结合结构域异源,例如锌指DNA结合结构域和来自核酸酶的切割结构域或TALEN DNA-结合结构域和切割结构域,或大范围核酸酶DNA结合结构域和来自不同核酸酶的切割结构域。异源性切割结构域可以从任何核酸内切酶或核酸外切酶获得。可以衍生切割结构域的示例性核酸内切酶包括但不限于限制性核酸内切酶和归巢核酸内切酶。参见例如2002-2003Catalogue,New England Biolabs,Beverly,Mass.;和Belfort et al.(1997)Nucleic Acids Res.25:3379-3388。切割DNA的其它酶是已知的(例如S1核酸酶;绿豆核酸酶;胰腺DNase I;微球菌核酸酶;酵母HO核酸内切酶;还参见Linn et al.(eds.)Nucleases,Cold Spring Harbor Laboratory Press,1993)。可以将这些酶(或其功能片段)中的一种或多种用作切割结构域和切割半结构域的来源。
类似地,切割半结构域可以衍生自任何核酸酶或其部分,如上所给出的,其需要二聚化以实现切割活性。通常,如果融合蛋白包括切割半结构域,则切割需要两种融合蛋白。替代地,可以使用包括两个切割半结构域的单一蛋白质。两个切割半结构域可以来自相同的核酸内切酶(或其功能片段),或每个切割半结构域可以衍生自不同的核酸内切酶(或其功能片段)。此外,优选使两个融合蛋白的靶位点相对于彼此布置,使得两个融合蛋白与其各自靶位点的结合将切割半结构域置于彼此的空间方向上,从而允许切割半结构域形成功能性切割结构域,例如,通过二聚化。因此,在某些实施方案中,靶位点的近边缘被5-8个核苷酸或15-18个核苷酸分隔开。然而,任何整数个核苷酸或核苷酸对都可以***两个靶位点之间(例如,2到50个核苷酸对或更多)。通常,切割位点位于靶位点之间。
在一些实施方式中,二聚化切割半结构域包括一个非活性切割结构域和一个活性切割结构域,使得靶向的DNA在一条链上被切口而不是被完全切割(“切口酶”,参见美国专利申请公开号2010/0047805)。在其它实施方式中,使用两对此种切口酶来切割靶,其在两条DNA链上都有切口。
限制性核酸内切酶(限制性内切酶)存在于许多物种中,并且能够与DNA序列特异性结合(在识别位点),并在结合位点处或附近切割DNA。某些限制性酶(例如IIS型)在从识别位点移除的位点切割DNA,并具有可分离的结合和切割结构域。例如,IIS型酶Fok I催化DNA的双链切割,在一条链上距其识别位点9个核苷酸并且在另一条链上距其识别位点13个核苷酸。参见例如美国专利号5,356,802;5,436,150和5,487,994;以及Li et al.(1992)Proc.Natl.Acad.Sci.USA 89:4275-4279;Li et al.(1993)Proc.Natl.Acad.Sci.USA 90:2764-2768;Kim et al.(1994)Proc.Natl.Acad.Sci.USA 91:883-887;Kim et al.(1994)J.Biol.Chem.269:31,978-31,982。在一个实施方式中,融合蛋白包括来自至少一种IIS型限制性酶的切割结构域(或切割半结构域)和一个或多个锌指结合结构域,其可以工程化或可以不经工程化。
切割结构域与结合域可分离的示例性IIS型限制酶是Fok I。该特定酶作为二聚体具有活性。Bitinaite et al.(1998)Proc.Natl.Acad.Sci.USA 95:10,570-10,575。因此,出于本公开的目的,在所公开的融合蛋白中使用的Fok I酶的部分被认为是切割半结构域。因此,对于使用锌指-Fok I融合物的细胞序列的靶向双链切割和/或靶向置换,可以使用各自包括Fok I切割半结构域的两种融合蛋白来重构催化活性切割结构域。替代地,也可以使用包括DNA结合结构域和两个Fok I切割半结构域的单个多肽分子。
切割结构域或切割半结构域可以是保留切割活性或保留多聚化(例如二聚化)以形成功能性切割结构域的能力的蛋白质的任何部分。
整体并入本文的国际公开WO 07/014275中描述了示例性的IIS型限制性酶。其它限制性酶也含有可分开的结合结构域和切割结构域,并且本公开预期了这些。参见例如Roberts et al.(2003)Nucleic Acids Res.31:418-420。
在某些实施方式中,切割结构域包括一种或多种工程化的切割半结构域(也称为二聚化结构域突变体),其最小化或防止同二聚化,如例如美国专利申请公开号2005/0064474;2006/0188987和2008/0131962中所描述的,它们的全部公开内容均通过引用整体并入本文。Fok I的位置446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538的氨基酸残基都是影响Fok I切割半结构域二聚化的靶。
形成专性异二聚体的示例性工程化的Fok I切割半结构域包括一对,其中第一个切割半结构域在Fok I的位置490和538的氨基酸残基处包括突变,并且第二个切割半结构域在氨基酸残基486和499处包括突变。
因此,在一个实施方式中,490处的突变将Glu(E)替换为Lys(K);538处的突变将Iso(I)替换为Lys(K);486处的突变将Gln(Q)替换为Glu(E);并且位置499处的突变将Iso(I)替换为Lys(K)。具体地,在一个切割半结构域中通过突变位置490(E→K)和538(I→K)以产生命名为“E490K:1538K”的工程化的切割半结构域并且在另一切割半结构域中通过突变位置486(Q→E)和499(I→L)以产生命名为“Q486E:I499L”的工程化的切割半结构域,来制备本文描述的工程化的切割半结构域。本文描述的工程化的切割半结构域是专性异二聚体突变体,其中异常切割被最小化或消除。参见例如美国专利公开号2008/0131962,其公开的全部内容通过引用整体并入用于所有目的。
在一些实施方式中,工程化的切割半结构域在位置486、499和496(相对于野生型Fok I编号)包括突变,例如这样的突变:将位置486处的野生型Gln(Q)残基替换为Glu(E)残基,将位置499处的野生型Iso(I)残基替换为Leu(L)残基和将位置496处的野生型Asn(N)残基替换为Asp(D)或Glu(E)残基(也分别称为“ELD”和“ELE”结构域)。在其它实施方式中,工程化的切割半结构域在位置490、538和537(相对于野生型FokI编号)处包括突变,例如这样的突变:将位置490处的野生型Glu(E)残基替换为Lys(K)残基,将位置538处的野生型Iso(I)残基替换为Lys(K)残基和将位置537处的野生型His(H)残基替换为Lys(K)残基或Arg(R)残基(也分别称为"KKK"和"KKR"结构域)。在其它实施方式中,工程化的切割半结构域在位置490和537(相对于野生型FokI编号)处包括突变,例如这样的突变:将位置490处的野生型Glu(E)残基替换为Lys(K)残基和将位置537处的野生型His(H)残基替换为Lys(K)残基或Arg(R)残基(也分别称为"KIK"和"KIR"结构域)。(参见美国专利申请公开号2011/0201055,通过引用并入本文)。可以使用任何适合的方法制备本文描述的工程化的切割半结构域,例如通过如美国专利申请公开号2005/0064474;2008/0131962;和2011/0201055中描述的野生型切割半结构域(Fok I)的位点定向诱变。
在一些实施方式中,可以使用所谓的“***酶”技术在体内在核酸靶位点组装核酸酶(参见例如美国专利申请公开号2009/0068164)。此类***酶的组分可以在单独的表达构建体上表达,或者可以连接在一个开放阅读框中,其中各个组分例如通过自切割2A肽或IRES序列分隔开。组分可以是单独的锌指结合结构域或大范围核酸酶核酸结合结构域的结构域。
可以在使用前筛选核酸酶的活性,例如在WO 2009/042163和2009/0068164中描述的基于酵母的染色体***中。可以使用本领域已知的方法容易地设计核酸酶表达构建体。参见例如美国专利申请公开号:2003/0232410;2005/0208489;2005/0026157;2005/0064474;2006/0188987;2006/0063231;和国际公开WO 07/014275。核酸酶的表达可以在组成型启动子或诱导型启动子的控制下,例如半乳糖激酶启动子,其在棉子糖和/或半乳糖存在下被激活(去抑制)并且在葡萄糖存在下被抑制。
在一些实施方式中,核酸内切酶试剂是要与RNA引导的核酸内切酶结合使用的RNA指导,例如Cas9或Cpf1,诸如尤其根据Doudna,J.et al.,(Science 346(6213):1077)(2014))和Zetsche,B.et al.(Cell 163(3):759-771(2015))的教导,其教导通过引用并入本文。
在一些实施方式中,使用CRISPR(簇状规则间隔的短回文重复序列)/Cas(CRISPR相关的)核酸酶***来对细胞进行基因修饰。CRISPR/Cas是一种基于细菌***的工程化核酸酶***,可用于基因组工程。它基于许多细菌和古细菌的适应性免疫反应的一部分。当病毒或质粒入侵细菌时,入侵者的DNA区段会通过‘免疫’反应转化为CRISPR RNA(crRNA)。然后,该crRNA通过部分互补的区域与另一种称为tracrRNA的RNA相关联,以将Cas9核酸酶引导至与靶DNA中称为“原型间隔区”的crRNA同源的区域。Cas9切割DNA以在DSB处在由crRNA转录本中包括的20个核苷酸引导序列指定的位点处产生平末端。Cas9需要crRNA和tracrRNA进行位点特异性DNA识别和切割。该***现已经工程化,使得crRNA和tracrRNA可以组合成一个分子(“单向导RNA”),并且单向导RNA的crRNA等效部分可以工程化为引导Cas9核酸酶以靶向任何所需的序列(参见Jinek et al.(2012)Science 337,p.816-821,Jinek et al.,(2013),eLife 2:e00471,和David Segal,(2013)eLife 2:e00563)。
编码***的RNA组分的CRISPR(簇状规则间隔的短回文重复序列)基因座以及编码蛋白质的cas(CRISPR-相关的)基因座(Jansen et al.,2002.Mol.Microbiol.43:1565-1575;Makarova et al.,2002.Nucleic Acids Res.30:482-496;Makarova et al.,2006.Biol.Direct 1:7;Haft et al.,2005.PLoS Comput.Biol.1:e60)构成了CRISPR/Cas核酸酶***的基因序列。微生物宿主中的CRISPR基因座含有CRISPR相关(Cas)基因以及能够编程CRISPR介导的核酸切割特异性的非编码RNA元件的组合。
II型CRISPR是表征最完善的***之一,并且在四个连续步骤中进行靶向DNA双链断裂。首先,从CRISPR基因座转录两个非编码RNA,前-crRNA阵列和tracrRNA。其次,tracrRNA与前-crRNA的重复区域杂交,并介导前-crRNA加工成含有单个间隔区序列的成熟crRNA。第三,成熟的crRNA:tracrRNA复合物通过crRNA上的间隔区和与原型间隔区相邻基序(PAM)相邻的靶DNA上的原型间隔区之间的沃森-克里克碱基配对将Cas9引导至靶DNA,这是对靶标识别的附加需求。最后,Cas9介导靶DNA的切割,以在原型间隔区内产生双链断裂。CRISPR/Cas***的活性包括三个步骤:(i)在称为“适应”的过程中,将外来DNA序列***CRISPR阵列以防止未来的攻击,(ii)表达相关蛋白质以及表达和处理阵列,然后是(iii)RNA介导的对外来核酸的干扰。因此,在细菌细胞中,多种所谓的‘Cas’蛋白涉及CRISPR/Cas***的自然功能,并在诸如***外来DNA等功能中发挥作用。
在某些实施方式中,Cas蛋白可以是天然存在的Cas蛋白的“功能衍生物”。天然序列多肽的“功能衍生物”是具有与天然序列多肽共同的定性生物学特性的化合物。“功能衍生物”包括但不限于天然序列的片段和天然序列多肽的衍生物及其片段,条件是它们具有与相应天然序列多肽共同的生物学活性。本文所考虑的生物活性是功能衍生物将DNA底物水解成片段的能力。术语“衍生物”包括多肽的氨基酸序列变体、共价修饰及其融合物。Cas多肽或其片段的合适衍生物包括但不限于Cas蛋白或其片段的突变体、融合体、共价修饰。Cas蛋白(包括Cas蛋白或其片段)以及Cas蛋白或其片段的衍生物可以从细胞中获得或化学合成或通过这两种程序的组合获得。细胞可以是天然产生Cas蛋白的细胞,或天然产生Cas蛋白并且经基因工程化以更高表达水平产生内源性Cas蛋白或从外源引入的核酸产生Cas蛋白的细胞,该核酸编码与内源性Cas相同或不同的Cas。在某些情况下,细胞不会自然产生Cas蛋白,而是经过基因工程化以产生Cas蛋白。还包括在本发明含义中的RNA引导的核酸内切酶中的是核酸内切酶Cpf1,如Zetsche,B.et al.(Cell 163(3):759-771(2015))所教导的。
Cas9相关的CRISPR/Cas***包括两个RNA非编码组分:tracrRNA和前-crRNA阵列,其含有由相同直接重复(DR)间隔的核酸酶引导序列(间隔区)。为了使用CRISPR/Cas***来完成基因组工程化,这些RNA的两种功能必须存在(参见Cong et al.,(2013)Sciencexpress 1/10.1126/science 1231143)。在一些实施方式中,通过单独的表达构建体或作为单独的RNA提供tracrRNA和前-crRNA。在其它实施方式中,构建了嵌合RNA,其中工程化的成熟crRNA(赋予靶特异性)与tracrRNA(提供与Cas9的相互作用)融合以产生嵌合cr-RNA-tracrRNA杂合体(也称为单一引导RNA)。
递送方法
核酸酶、编码这些核酸酶的多核苷酸、供体多核苷酸和用于对细胞进行基因修饰的包括本文描述的蛋白质和/或多核苷酸的组合物可以通过任何合适的方式在体内或离体递送。
在一些实施方式中,由于将编码多肽的多核苷酸引入细胞,因此多肽可以在细胞中原位合成。在一些实施方式中,多肽可以在细胞外产生,然后引入细胞中。用于将多核苷酸构建体引入细胞的方法是本领域已知的并且作为非限制性实例包括其中将多核苷酸构建体整合到细胞基因组中的稳定转化方法,其中不将多核苷酸构建体整合到细胞基因组中的瞬时转化方法以及病毒介导的方法。在一些实施方式中,可以通过重组病毒载体(例如逆转录病毒、腺病毒)、脂质体等将多核苷酸引入细胞中。例如,瞬时转化方法包括例如显微注射、电穿孔或粒子轰击。考虑到在细胞中表达,多核苷酸可以包括在载体中,更特别是质粒或病毒中。楼板
在一些实施方式中,用编码核酸内切酶试剂的核酸转染细胞。在一些实施方式中,到转染后30小时,优选到转染后24小时,更优选到转染后20小时,80%的核酸内切酶试剂被降解。
在一些实施方式中,根据本领域众所周知的技术,可以使用帽来合成由mRNA编码的核酸内切酶以增强其稳定性,如例如Kore A.L.,et al.(Locked nucleic acid(LNA)-modified dinucleotide mRNA cap analogue:synthesis,enzymatic incorporation,andutilization(2009)J Am Chem Soc.131(18):6364-5)描述的。
在一些实施方式中,如本文所描述的核酸酶和/或供体构建体也可以使用含有编码CRISPR/Cas***、锌指或TALEN蛋白中一种或多种的序列的载体来递送。可以使用任何载体***,包括但不限于质粒载体、逆转录病毒载体、慢病毒载体、腺病毒载体、痘病毒载体;疱疹病毒载体和腺相关病毒载体等。还参见美国专利号6,534,261;6,607,882;6,824,978;6,933,113;6,979,539;7,013,219;和7,163,824,通过引用将其整体并入本文。此外,显然这些载体中的任何一种都可以包括治疗所需的一种或多种序列。因此,当将一种或多种核酸酶和供体构建体引入细胞中时,核酸酶和/或供体多核苷酸可以携带在同一载体或不同载体上。当使用多个载体时,每个载体可以包括编码一种或多种核酸酶和/或供体构建体的序列。
常规的基于病毒和非病毒的基因转移方法可用于将编码核酸酶的核酸和供体构建体引入细胞(例如哺乳动物细胞)和靶组织中。
病毒载体递送***包括DNA和RNA病毒,它们在递送到细胞后具有附加型(episomal,游离型)或整合的基因组。对于基因疗法程序的综述,参见Anderson,Science256:808-813(1992);Nabel&Feigner,TIBTECH 11:211-217(1993);Mitani&Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature 357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,RestorativeNeurology and Neuroscience 8:35-36(1995);Kremer&Perricaudet,British MedicalBulletin 51(1):31-44(1995);Haddada et al.,in Current Topics in Microbiologyand Immunology,Doerfler and Bohm(eds.)(1995);和Yu et al.,Gene Therapy 1:13-26(1994)。
在一些实施方式中,核酸的非病毒递送方法包括电穿孔、脂质转染、显微注射、基因枪、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸DNA、裸RNA、加帽RNA、人工病毒体和试剂增强的DNA吸收。使用例如Sonitron 2000***(Rich-Mar)的声穿孔也可用于核酸的递送。
在一些实施方式中,电穿孔步骤可用于转染细胞。在一些实施方式中,这些步骤通常在包括平行板电极的封闭室中进行,在所述平行板电极之间产生大于100伏特/cm且小于5,000伏特/cm的脉冲电场,在整个治疗体积中基本均匀,例如在WO 2004/083379中描述的,其通过引用并入,尤其是从第23页第25行至第29页第11行。一种此类电穿孔室优选地具有由电极间隙的平方(cm2)除以室体积(cm3)的商定义的几何因子(cm-1),其中几何因子小于或等于0.1cm-1,其中细胞和序列特异性试剂的悬浮液在培养基中,该培养基经过调整,使培养基的电导率在0.01至1.0毫西门子范围内。通常,细胞悬浮液经历一个或多个脉冲电场。采用该方法,悬浮液的处理体积可扩展,并且腔室中细胞的处理时间基本均匀。
在一些实施方式中,不同的转基因或转基因的多个拷贝可以包括在一个载体中。载体可以包括编码核糖体跳跃序列(例如编码2A肽的序列)的核酸序列。在小核糖核酸病毒的***病毒亚群中鉴别的2A肽会导致核糖体从一个密码子“跳跃”到下一个密码子,而不会在由密码子编码的两个氨基酸之间形成肽键(参见Donnelly et al.,J.of GeneralVirology 82:1013-1025(2001);Donnelly et al.,J.of Gen.Virology 78:13-21(1997);Doronina et al.,Mol.And.Cell.Biology 28(13):4227-4239(2008);Atkins et al.,RNA13:803-810(2007))。
“密码子”是指mRNA(或DNA分子的有义链)上的三个核苷酸,它们被核糖体翻译成一个氨基酸残基。因此,当多肽被框内的2A寡肽序列分开时,可以从mRNA内的单个连续开放阅读框合成两条多肽。这种核糖体跳跃机制在本领域是众所周知的并且已知被多种载体用于表达由单个信使RNA编码的多种蛋白质。
在一个实施方式中,编码根据本发明的序列特异性试剂的多核苷酸可以是直接引入细胞中的mRNA,例如通过电穿孔。在一些实施方式中,可以使用细胞脉冲技术对细胞进行电穿孔,该技术允通许过使用脉冲电场瞬时透化活细胞以将材料递送到细胞中。该技术基于使用PulseAgile(BTX Havard Apparatus,84October Hill Road,Holliston,Mass.01746,USA)电穿孔波形允许精确控制脉冲持续时间、强度以及脉冲之间的间隔(参见美国专利号6,010,613和公布的国际申请WO 2004/083379)。所有这些参数都可以修改,以达到高转染效率和最低死亡率的最佳条件。第一个高电场脉冲允许孔形成,而随后的较低电场脉冲允许将多核苷酸移动到细胞中。
其它示例性的核酸递送***包括Amaxa Biosystems(Cologne,Germany),Maxcyte,,Inc.(Rockville,Md.)、BTX Molecular Delivery Systems(Holliston,Mass.)和Copernicus Therapeutics Inc.(参见例如美国专利号6,008,336)描述的那些。例如美国专利号5,049,386;4,946,787;和4,897,355中描述了脂质转染并且脂质感染试剂在市场上有售(例如Transfectam和Lipofectin)。适用于多核苷酸的有效受体-识别脂质转染的阳离子和中性脂质包括Felgner、WO 91/17424、WO 91/16024的那些。
脂质:核酸复合物(包括靶向的脂质体,例如免疫脂质复合物)的制备为本领域技术人员所众所周知(参见例如Crystal,Science 270:404-410(1995);Blaese et al.,Cancer Gene Ther.2:291-297(1995);Behr et al.,Bioconjugate Chem.5:382-389(1994);Remy et al.,Bioconjugate Chem.5:647-654(1994);Gao et al.,Gene Therapy2:710-722(1995);Ahmad et al.,Cancer Res.52:4817-4820(1992);美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028和4,946,787)。
在一些实施方式中,供体序列和/或序列特异性试剂由病毒载体编码。在一些实施方式中,可以使用基于腺病毒的***。基于腺病毒的载体能够在许多细胞类型中实现非常高的转导效率,并且不需要细胞***。使用此类载体,已经获得了高滴度和高水平的表达。这种载体可以在相对简单的***中大量生产。腺相关病毒(“AAV”)载体也用于用靶核酸转导细胞,例如在核酸和肽的体外生产中,以及用于体内和离体基因疗法程序(参见例如Westet al,Virology 160:38-47(1987);美国专利号4,797,368;WO 93/24641;Kotin,HumanGene Therapy 5:793-801(1994);Muzyczka,J.Clin.Invest.94:1351(1994))。重组AAV载体的构建在许多出版物中都有描述,包括美国专利号5,173,414;Tratschin et al.,Mol.Cell.Biol.5:3251-3260(1985);Tratschin,et al.,Mol.Cell.Biol.4:2072-2081(1984);Hermonat&Muzyczka,PNAS 81:6466-6470(1984);和Samulski et al.,J.Virol.63:03822-3828(1989)。
重组腺相关病毒载体(rAAV)是一种基于缺陷和非致病性细小病毒腺相关2型病毒的有前景的替代基因传递***。所有载体均源自仅保留转基因表达盒侧翼的AAV 145bp反向末端重复的质粒。由于整合到转导细胞的基因组中,有效的基因转移和稳定的转基因递送是该载体***的关键特征。(Wagner et al.,Lancet 351:9117 1702-3(1998),Kearnset al.,Gene Ther.9:748-55(1996))。根据本发明还可以使用其它AAV血清型(包括非限制性示例的AAV1、AAV3、AAV4、AAV5、AAV6、AAV8、AAV 8.2、AAV9和AAV rh10)以及假型AAV(诸如AAV2/8、AAV2/5和AAV2/6)。
在一些实施方式中,细胞被施用有效量的一种或多种半胱天冬酶抑制剂与AAV载体的组合。
可以使用相同或不同的***递送核酸酶编码序列和供体构建体。例如,供体多核苷酸可以由病毒载体携带,而一种或多种核酸酶可以作为mRNA组合物递送。
在一些实施方式中,可以使用纳米颗粒将一种或多种试剂递送至细胞。在一些实施方式中,纳米颗粒涂有对HSC表面蛋白如CD105(Uniprot#P17813)具有特异性亲和力的配体如抗体。在一些实施方式中,纳米粒子是可生物降解的聚合物纳米颗粒,其中多核苷酸形式的序列特异性试剂与聚β氨基酯的聚合物复合并涂有聚谷氨酸(PGA)。
外显子整合到内源性内含子基因组基因座的策略
作为特定的实施方式,本专利申请提供了一种将外源性编码序列整合到内源性内含子基因组区域的方法,其允许将所述外源性编码序列优选地整合在所述基因组区域的第一内源性编码外显子和第二内源性编码外显子之间。
方法特别有用,例如,当进入基因组区域的外显子通常从位于第一外显子上游的共同内源性启动子主动转录时,例如图2所示。
所述方法具有防止破坏编码内源性外显子区域的转录物同时允许它们与外源性编码序列一起转录的优点。
一般而言,所述方法包括下列步骤中的一个或多个:
-提供包括内源性内含子基因组区域的细胞,
-向所述细胞中引入包括外源性编码序列的多核苷酸模板,
所述多核苷酸模板在5’至3’方向上包括或由以下组成:
·第一同源多核苷酸序列,其与***位点上游的内含子序列同源,
同时所述第一多核苷酸序列优选不包括分支点;
·第一强剪接位点序列,优选地包括分支点和剪接受体;
·编码2A自切割肽的第一序列;
·编码目的蛋白质的外源序列;
·编码2A自切割肽的第二序列;
·第一外显子的编码序列的拷贝,任选地重写;
·第二强剪接位点序列,优选地包括剪接供体;和
·第二同源多核苷酸序列,其与***位点下游的内含子序列同源;
-诱导所述外源性多核苷酸整合到所述内含子序列中,优选通过同源重组,以使所述外源性编码序列在所述内源性基因座处连同第一外显子和优选地第二(内源性)外显子或其拷贝一起被转录。
一般而言,第一外显子的拷贝下游的第二同源多核苷酸包括分支点,优选最初存在于内源性序列中的分支点,以允许正确的RNA剪接和第二外显子的表达。
作为优选的实施方式,所述第一外显子的序列的拷贝可以在多核苷酸水平上重写用于密码子优化和/或减少与内源性基因座序列的核苷酸序列同源性。
可以通过使用本领域公知的方法来执行上述每个步骤。根据优选的实施方式,也根据HSC或由其分化的细胞递送治疗性蛋白质,细胞可源自患者本人、供体或iPS细胞,例如根据WO2018/189360中描述的方法,其通过引用并入。
本方法的步骤通常离体进行,这意味着细胞在人体外培养和制造。一般而言,细胞不是生发细胞或源自人类胚胎的细胞,并且该方法不旨在改变人类的生殖线或遗传特性。
通过在***位点切割稀有切割核酸内切酶,可以促进通过同源重组将多核苷酸模板整合到所述内含子序列中。因此,用于外显子整合的所述方法由此可以包括以下步骤:向细胞中引入或表达稀有切割核酸内切酶,特别是TALE-核酸酶、锌指核酸酶、大范围核酸酶、例如本申请中已经描述的CRISPR,以在***位点切割所述内含子序列。
因此,***位点通常由所述稀有切割核酸内切酶的靶序列确定。因此,***位点包括在稀有切割核酸内切酶靶序列中,该靶序列本身包括在所选基因座的内含子序列中,并且更具体地包括在本发明所考虑的用于工程化本文公开的HSC的基因座中。
优选的基因座是为了治疗性蛋白质的表达和递送所选择的那些基因座,其包括至少两个内源性外显子序列,特别地是选自以下的内含子序列之一:CXCR3(SEQ ID NO:76)、CD11B(SEQ ID NO:107)、S100A9(SEQ ID NO:148)、TMEM119(SEQ ID NO:189)、MERTK(SEQID NO:190)、CD164(SEQ ID NO:191)、TLR7(SEQ ID NO:192)、CD14(SEQ ID NO:193)、FCGR3A(CD16)(SEQ ID NO:194)、TBXAS1(SEQ ID NO:195)、DOK3(SEQ ID NO:196)、ABCA1(SEQ ID NO:197)、TMEM195(SEQ ID NO:198)、TLR4(SEQ ID NO:199)、MR1(SEQ ID NO:200)、FCGR1A(CD64)(SEQ ID NO:201)、CSF3R(SEQ ID NO:202)、FGD4(SEQ ID NO:203)和TSPAN14(SEQ ID NO:204)以及B2M(SEQ ID NO:205)。
用于整合外源性编码序列的多核苷酸模板通常包括与上述内含子序列同源的第一多核苷酸序列和第二多核苷酸序列,或与所述多核苷酸序列具有或至少80%,优选至少75%、至少80%、至少90或甚至优选至少95%的同一性。第一和第二同源序列通常优选在超过50个碱基对(bp)上,更优选在超过100bp、200bp、500bp并且甚至更优选在50至500bp上分别与***位点上游和下游的内源性序列同源。
根据所提出的方法,要***到内源性内含子基因组序列中的多核苷酸模板包括外源性编码序列上游和下游的强剪接位点序列。剪接位点是特定的基序,剪接体通过这些基序识别外显子并去除介于中间的内含子。外源性剪接位点序列可以通过克隆或替代地通过将突变引入同源性序列来引入。文献中提供了鉴别或设计强剪接位点的标准以及此类序列的示例,例如Shepard,P.J et al.[Efficient internal exon recognition depends onnear equal contributions from the 3'and 5'splice sites(2011)Nucleic acidsresearch,39(20),8928-37]。
通常选择第一同源序列(即上游同源序列或左同源臂)以排除分支点,该分支点通常位于第二外显子序列上游10至100bp之间,优选20至50bp之间。对分支点序列的人类共识通常是yUnAy,其中A是分支点并且小写的嘧啶(‘y’)不如大写的U和A保守。分支点通常位于内含子3’端上游的21-34个核苷酸处,而所谓的多嘧啶道跨越分支点下游的4-24个核苷酸[Gao,K.,et al.(2008).Human branch point consensus sequence is yUnAy.Nucleicacids research,36(7),2257-67]。
2A自切割肽或2A肽是一类18–22个氨基酸长的肽,其可在细胞内诱导重组蛋白的切割。2A肽来源于病毒基因组的2A区。2A肽家族的四个成员经常用于生命科学研究:P2A、E2A、F2A和T2A。更常用的F2A来源于***病毒18;E2A来源于马鼻炎A病毒;P2A来源于猪捷申病毒-1 2A;T2A来源于Thosea asigna病毒2A[Liu et al.(2017)."Systematiccomparison of 2A peptides for cloning multi-genes in a polycistronic vector".Scientific Reports.7(1)]。
用于将外源性编码序列整合到内源性内含子基因组区的本方法本身可以被视为一项发明,因为其广泛适用于不限于HSC的任何类型的细胞,并且与可以***内源性基因座的外源性编码序列的类型无关。
然而,已发现所述方法特别适用于HSC以产生如本文所描述的治疗性细胞。使用上述方法整合基因的纠正的拷贝或附加拷贝具有显著优势,以便它们随后在分化的HSC中表达以获得遗传缺陷的交叉纠正。实际上,这尽可能地保留了***所靶向的内源性基因座的表达,因此不太容易干扰细胞分化和所得细胞的细胞功能。这对于旨在分化为巨噬细胞以实现大脑中小胶质细胞功能的工程化HSC尤为重要。
因此,本发明涵盖通过上述方法可获得并在图2中说明用于将外源性编码序列整合到内源性内含子基因组区的细胞,尤其是专门用于基因疗法的细胞,尤其是用于缺陷等位基因的交叉纠正的细胞。这种基因***可以在HSC中进行,以获得更多分化阶段的表达,例如用于将治疗性蛋白质递送到大脑用于治疗疾病的那些细胞,特别是巨噬细胞和小胶质细胞,如图14中更具体描述的。
如前所提及的,本发明涉及一种将外源性编码序列整合到内源性内含子基因组区域或基因座中的通用方法,其不会使存在于该基因座的内源性外显子的表达失活,尤其是不会使***位点下游的序列失活。因此,这种方法可以防止在转基因基因组整合中通常观察到的所谓“极性效应”。
所述方法包括下列步骤:
-提供包括内源性内含子基因组区域的细胞,
-向所述细胞中引入包括外源性编码序列的多核苷酸模板,其中所述多核苷酸模板包括:
a)第一同源多核苷酸序列,其与***位点上游的内含子序列同源,
b)第一强剪接位点序列,其包括分支点和剪接受体;
c)编码2A自切割肽的第一序列;
d)编码目的蛋白质的外源序列;
e)编码2A自切割肽的第二序列;
f)第一外显子的编码序列的拷贝;
g)包括剪接供体的第二强剪接位点序列;和
h)第二同源多核苷酸序列,其与***位点下游的内含子序列同源;以及任选地
-诱导所述外源性多核苷酸整合到所述内含子序列中,优选通过同源重组,以使所述外源性编码序列在所述内源基因座处连同第一外显子或其拷贝被转录。
通过本发明的方法,上述整合形成人工外显子(Artex),其可以被引入造血干细胞(HSC)中以获得例如外源性编码序列到至少一种造血细胞谱系中的表达。
在一些优选的实施方式中,所述外源性编码序列编码用于治疗遗传疾病的目的蛋白质,其在祖细胞、红细胞、粒细胞、巨核细胞、单核细胞、B细胞和/或T细胞中的表达,如图14所示。
根据一些实施方式,该方法用于在祖细胞中表达选自FANCA、FANCC或FANCG中的蛋白质。
根据一些实施方式,该方法用于在红细胞中表达选自HBB、PKLR或RPS19中的蛋白质。
根据一些实施方式,该方法用于在粒细胞中表达选自HAX1、CYBA、CYBB、NCF1、NCF2或NCF4中的蛋白质。
根据一些实施方式,该方法用于在巨核细胞中表达选自因子8、因子9、因子11或WAS中的蛋白质。
根据一些实施方式,该方法用于在单核细胞中表达选自IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5中的蛋白质。
根据一些实施方式,该方法用于在B细胞中表达选自ADA、IL2RG、WAS或BTK中的蛋白质。
根据一些实施方式,该方法用于在T细胞中表达选自ADA、IL2RG、WAS、BTK或CCR5中的蛋白质。
因此,所述外源性编码序列的表达产生允许交叉纠正内源性缺陷蛋白的目的蛋白。该方法可以离体进行以产生工程化治疗性细胞,用于治疗在图14中列出的至少一种疾病,尤其是迄今为止鉴定的多种形式的溶酶体贮积病(LSD)。
本发明还涉及可用于进行上述方法的***载体,例如AAV载体,优选AAV6,其特征在于其包括用于***内源性基因座处的外源性多核苷酸序列,该外源性多核苷酸序列包括以下序列:
a)第一同源多核苷酸序列,其与***位点上游的内含子序列同源,
b)第一强剪接位点序列,其包括分支点和剪接受体;
c)编码2A自切割肽的第一序列;
d)编码目的蛋白质的外源序列;
e)编码2A自切割肽的第二序列;
f)第一外显子的编码序列的拷贝;
g)包括剪接供体的第二强剪接位点序列;和
h)第二同源多核苷酸序列,其与***位点下游的内含子序列同源。
在优选的实施方式中,所述第一同源序列和第二同源序列与选自以下的内源性基因座同源:tmem119、s100a9、cd11b、b2m、cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、p2ry12、olfml3、p2ry13、hexb、rhob、jun、rab3il1、ccl2、fcrls、scoc、siglech、slc2a5、lrrc3、plxdc2、usp2、ctsf、cttnbp2nl、atp8a2、lgmn、mafb、egr1、bhlhe41、hpgds、ctsd、hspa1a、lag3、csf1r、adamts1、f11r、golm1、nuak1、crybb1、ltc4s、sgce、pla2g15、ccl3l1、abhd12、ang、ophn1、sparc、pros1、p2ry6、lair1、il1a、epb41l2、adora3、rilpl1、pmepa1、ccl13、pde3b、scamp5、ppp1r9a、tjp1、ak1、b4galt4、gtf2h2、trem2、ckb、acp2、pon3、agmo、tnfrsf17、fscn1、st3gal6、adap2、ccl4、entpd1、tmem86a、kctd12、dst、ctsl2、abcc3、pdgfb、pald1、tubgcp5、rapgef5、stab1、lacc1、tmc7、nrip1、kcnd1、tmem206、hps4、dagla、extl3、mlph、arhgap22、cxxc5、p4ha1、cysltr1、fgd2、kcnk13、gbgt1、c18orf1、cadm1、bco2、adrb1、c3ar1、large、leprel1、liph、upk1b、p2rx7、slc46a1、ebf3、ppp1r15a、il10ra、rasgrp3、fos、tppp、slc24a3、havcr2、nav2、apbb2、clstn1、blnk、gnaq、ptprm、frmd4a、cd86、tnfrsf11a、spint1、ppm1l、tgfbr2、cmklr1、tlr6、gas6、hist1h2ab、atf3、acvr1、abi3、lrp12、ttc28、plxna4、adamts16、rgs1、icam1、snx24、ly96、dnajb4和ppfia4。
本发明还包括一种通过任何前述方法可获得的工程化细胞,且更具体地是特征在于外源性多核苷酸序列已被***内源性基因座处内含子中的工程化细胞,其中所述多核苷酸序列优选地包括:
-第一强剪接位点序列,包括分支点和受***点;
-编码2A自切割肽的第一序列;
-编码目的蛋白质(诸如治疗性蛋白质)的外源序列;
-编码2A自切割肽的第二序列;
-与所述基因座内源的前一外显子的编码序列的拷贝;
-包括剪接供***点的第二强剪接位点序列;
2.还根据一些优选的实施方式,所述工程化细胞中的所述外源性多核苷酸序列可以***在选自以下的内源性基因座处:tmem119、s100a9、cd11b、B2m、Cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfia4。优选的内源性基因基因座是S100A9或CD11b。
根据本发明的一些优选实施方式,将所述外源性多核苷酸序列***到第一和第二内源性编码外显子之间的内含子中,如图2所示。第一和第二编码2自切割肽通常不同以避免不期望的稀有重组事件,其可以选自SEQ ID NO:216和SEQ ID NO:217。
根据一些优选的实施方式,上述第一剪接位点包括实施例中所示的SEQ ID NO:206或SEQ ID NO:207。
编码序列,特别是由于图2所示的本整合方法可被同源重组替换的第一内源性外显子的编码序列,可以进行密码子优化(即重写)以增加多核苷酸序列多样性并防止不希望的内源性基因座处的重组事件。因此,本发明更特别地提供了工程化的细胞,其中编码从IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5(SEQ ID NO:1至SEQ ID NO:35–见表1)中选择的治疗性蛋白质的一个外源性序列被整合在从TMEM119、MERTK、CD164、TLR7、CD14、FCGR3A(CD16)、TBXAS1、DOK3、ABCA1、TMEM195、TLR4、MR1、FCGR1A(CD64)、CSF3R、FGD4、TSPAN14、CXCR3、CD11B、S100A9和B2M中选择的一个基因座处,更特别地整合在它们的内含子多核苷酸序列中或与所述多核苷酸序列具有至少80%(优选至少75%、至少80%、至少90或至少95%)同一性的任何内含子序列中(考虑到这些序列在整个动物界且特别是人类物种中的可变性)。
因此,本发明更具体地涉及以下类型的工程化细胞之一,其中:
-IDUA被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-IDS被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-ARSB被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-GUSB被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-ABCD1被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-GALC被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-ARSA被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-PSAP被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-GBA被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-FUCA1被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-MAN2B1被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-AGA被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-ASAH1被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-HEXA被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-GAA被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-SMPD1被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-LIPA被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-CDKL5被引入在CXCR3基因座处,优选地引入SEQ ID NO:76中;
-IDUA被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-IDS被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-ARSB被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-GUSB被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-ABCD1被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-GALC被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-ARSA被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-PSAP被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-GBA被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-FUCA1被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-MAN2B1被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-AGA被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-ASAH1被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-HEXA被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-GAA被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-SMPD1被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-LIPA被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-CDKL5被引入在CD11B基因座处,优选地引入SEQ ID NO:107中;
-IDUA被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-IDS被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-ARSB被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-GUSB被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-ABCD1被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-GALC被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-ARSA被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-PSAP被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-GBA被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-FUCA1被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-MAN2B1被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-AGA被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-ASAH1被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-HEXA被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-GAA被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-SMPD1被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-LIPA被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-CDKL5被引入在S100A9基因座处,优选地引入SEQ ID NO:148中;
-IDUA被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-IDS被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-ARSB被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-GUSB被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-ABCD1被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-GALC被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-ARSA被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-PSAP被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-GBA被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-FUCA1被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-MAN2B1被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-AGA被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-ASAH1被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-HEXA被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-GAA被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-SMPD1被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-LIPA被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-CDKL5被引入在TMEM119基因座处,优选地引入SEQ ID NO:189中;
-IDUA被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-IDS被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-ARSB被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-GUSB被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-ABCD1被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-GALC被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-ARSA被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-PSAP被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-GBA被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-FUCA1被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-MAN2B1被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-AGA被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-ASAH1被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-HEXA被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-GAA被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-SMPD1被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-LIPA被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-CDKL5被引入在MERTK基因座处,优选地引入SEQ ID NO:190中;
-IDUA被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-IDS被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-ARSB被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-GUSB被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-ABCD1被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-GALC被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-ARSA被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-PSAP被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-GBA被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-FUCA1被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-MAN2B1被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-AGA被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-ASAH1被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-HEXA被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-GAA被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-SMPD1被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-LIPA被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-CDKL5被引入在CD164基因座处,优选地引入SEQ ID NO:191中;
-IDUA被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-IDS被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-ARSB被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-GUSB被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-ABCD1被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-GALC被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-ARSA被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-PSAP被引入在基因座TLR7处,优选地引入SEQ ID NO:192中;
-GBA被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-FUCA1被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-MAN2B1被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-AGA被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-ASAH1被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-HEXA被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-GAA被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-SMPD1被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-LIPA被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-CDKL5被引入在TLR7基因座处,优选地引入SEQ ID NO:192中;
-IDUA被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-IDS被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-ARSB被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-GUSB被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-ABCD1被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-GALC被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-ARSA被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-PSAP被引入在基因座CD14处,优选地引入SEQ ID NO:193中;
-GBA被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-FUCA1被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-MAN2B1被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-AGA被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-ASAH1被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-HEXA被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-GAA被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-SMPD1被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-LIPA被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-CDKL5被引入在CD14基因座处,优选地引入SEQ ID NO:193中;
-IDUA被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-IDS被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-ARSB被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-GUSB被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-ABCD1被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-GALC被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-ARSA被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-PSAP被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-GBA被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-FUCA1被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-MAN2B1被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-AGA被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-ASAH1被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-HEXA被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-GAA被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-SMPD1被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-LIPA被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-CDKL5被引入在FCGR3A基因座处,优选地引入SEQ ID NO:194中;
-IDUA被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-IDS被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-ARSB被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-GUSB被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-ABCD1被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-GALC被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-ARSA被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-PSAP被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-GBA被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-FUCA1被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-MAN2B1被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-AGA被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-ASAH1被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-HEXA被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-GAA被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-SMPD1被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-LIPA被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-CDKL5被引入在TBXAS1基因座处,优选地引入SEQ ID NO:195中;
-IDUA被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-IDS被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-ARSB被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-GUSB被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-ABCD1被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-GALC被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-ARSA被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-PSAP被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-GBA被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-FUCA1被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-MAN2B1被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-AGA被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-ASAH1被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-HEXA被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-GAA被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-SMPD1被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-LIPA被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-CDKL5被引入在DOK3基因座处,优选地引入SEQ ID NO:196中;
-IDUA被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-IDS被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-ARSB被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-GUSB被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-ABCD1被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-GALC被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-ARSA被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-PSAP被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-GBA被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-FUCA1被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-MAN2B1被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-AGA被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-ASAH1被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-HEXA被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-GAA被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-SMPD1被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-LIPA被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-CDKL5被引入在ABCA1基因座处,优选地引入SEQ ID NO:197中;
-IDUA被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-IDS被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-ARSB被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-GUSB被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-ABCD1被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-GALC被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-ARSA被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-PSAP被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-GBA被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-FUCA1被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-MAN2B1被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-AGA被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-ASAH1被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-HEXA被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-GAA被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-SMPD1被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-LIPA被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-CDKL5被引入在TMEM195基因座处,优选地引入SEQ ID NO:198中;
-IDUA被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-IDS被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-ARSB被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-GUSB被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-ABCD1被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-GALC被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-ARSA被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-PSAP被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-GBA被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-FUCA1被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-MAN2B1被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-AGA被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-ASAH1被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-HEXA被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-GAA被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-SMPD1被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-LIPA被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-CDKL5被引入在TLR4基因座处,优选地引入SEQ ID NO:199中;
-IDUA被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-IDS被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-ARSB被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-GUSB被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-ABCD1被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-GALC被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-ARSA被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-PSAP被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-GBA被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-FUCA1被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-MAN2B1被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-AGA被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-ASAH1被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-HEXA被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-GAA被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-SMPD1被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-LIPA被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-CDKL5被引入在MR1基因座处,优选地引入SEQ ID NO:200中;
-IDUA被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-IDS被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-ARSB被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-GUSB被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-ABCD1被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-GALC被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-ARSA被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-PSAP被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-GBA被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-FUCA1被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-MAN2B1被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-AGA被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-ASAH1被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-HEXA被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-GAA被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-SMPD1被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-LIPA被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-CDKL5被引入在FCGR1A基因座处,优选地引入SEQ ID NO:201中;
-IDUA被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-IDS被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-ARSB被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-GUSB被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-ABCD1被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-GALC被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-ARSA被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-PSAP被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-GBA被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-FUCA1被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-MAN2B1被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-AGA被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-ASAH1被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-HEXA被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-GAA被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-SMPD1被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-LIPA被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-CDKL5被引入在CSF3R基因座处,优选地引入SEQ ID NO:202中;
-IDUA被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-IDS被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-ARSB被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-GUSB被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-ABCD1被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-GALC被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-ARSA被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-PSAP被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-GBA被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-FUCA1被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-MAN2B1被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-AGA被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-ASAH1被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-HEXA被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-GAA被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-SMPD1被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-LIPA被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-CDKL5被引入在FGD4基因座处,优选地引入SEQ ID NO:203中;
-IDUA被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-IDS被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-ARSB被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-GUSB被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-ABCD1被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-GALC被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-ARSA被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-PSAP被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-GBA被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-FUCA1被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-MAN2B1被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-AGA被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-ASAH1被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-HEXA被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-GAA被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-SMPD1被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-LIPA被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-CDKL5被引入在TSPAN14基因座处,优选地引入SEQ ID NO:204中;
-IDUA被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-IDS被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-ARSB被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-GUSB被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-ABCD1被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-GALC被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-ARSA被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-PSAP被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-GBA被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-FUCA1被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-MAN2B1被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-AGA被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-ASAH1被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-HEXA被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-GAA被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-SMPD1被引入在B2M基因座处,优选地引入SEQ ID NO:205中;
-LIPA被引入在B2M基因座处,优选地引入SEQ ID NO:205中;和
-CDKL5被引入在B2M基因座处,优选地引入SEQ ID NO:205中。
此类工程化细胞(优选人类细胞)更特别地特征在于它们在一个内源性基因座处包括多核苷酸序列,该多核苷酸序列包括以下各项:
-第一强剪接位点序列,其优选地包括分支点和受***点;
-编码2A自切割肽的第一序列;
-编码目的蛋白质(诸如治疗性蛋白质)的外源序列;
-编码2A自切割肽的第二序列;
-与所述基因座内源的前一外显子的编码序列的拷贝,优选重写;
-任选地,第二强剪接位点序列,优选地包括剪接供***点。
本发明还涉及DNA模板或任何多核苷酸,其可用作有用于进行上述细胞工程化的***载体,尤其是AAV载体,更优选AAV6载体,如Ling,C.et al.[High-EfficiencyTransduction of Primary Human Hematopoietic Stem/Progenitor Cells by AAV6Vectors:Strategies for Overcoming Donor-Variation and Implications in GenomeEditing(2016)Scientific Reports 6:35495]中描述的。此类多核苷酸的特征在于它们包括以下序列中的一种或多种:
-第一强剪接位点,其包括分支点和受***点;
-编码2A自切割肽的第一序列;
-编码目的蛋白质的外源序列;
-编码2A自切割肽的第二序列;
-与所述基因座内源的前一外显子的编码序列的拷贝,优选重写;
-任选地,第二强剪接位点,其包括剪接供***点。
根据优选的实施方式,所述多核苷酸还包括上游和下游序列,它们与如前所述的内源性基因座同源。一般而言,这些上游和下游序列中的至少一者或两者与内含子序列同源,尤其是在本文中称为SEQ ID NO:76、SEQ ID NO:107、SEQ ID NO:148和SEQ ID NO:189至SEQ ID NO:205的那些内含子序列,并且更优选地与此类内含子序列排他地同源(即在基因座处存在跨越外显子序列)。
组合物
本发明还涉及一种组合物,其包括有效量的如本文所述的基因工程化的HSC或iPS细胞。在一些实施方式中,本发明提供了一种药物组合物,其包括有效量的如本文所述的基因工程化的HSC或iPS细胞。
在一些实施方式中,组合物可以用作药物。在一些实施方式中,组合物可以用于治疗如本文所述的单基因病。
在一些实施方式中,组合物包括细胞群,其中该群中细胞的至少40%已经根据本文描述的任一何种方法进行了修饰。在一些实施方式中,群中细胞的至少50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%已经根据本文描述的方法的任何一种进行了修饰。在一些实施方式中,组合物包括纯细胞群,其中100%的细胞已经如本文描述的进行了基因修饰。
基因修饰的细胞可以单独给药,或者作为与稀释剂和/或与其它组分组合的药物组合物给药。在一些实施方式中,药物组合物可包括如本文描述的基因修饰的HSC或iPS细胞,以及与一种或多种药学或生理学可接受的载体、稀释剂或赋形剂的组合。此类组合物可包括缓冲剂,例如中性缓冲盐水、磷酸盐缓冲盐水等;碳水化合物,例如葡萄糖、甘露糖、蔗糖或葡萄聚糖、甘露醇;蛋白质;多肽或氨基酸,例如甘氨酸;抗氧化剂;螯合剂,例如EDTA或谷胱甘肽;佐剂(例如氢氧化铝);和防腐剂。在一些实施方式中,组合物被配制用于静脉内给药。
基因修饰的HSC或iPS细胞可以用作治疗疾病的药物。在一些实施方式中,基因修饰的HSC或iPS细胞用于在治疗在与转基因同源的内源性基因表达方面具有缺陷的患者(交叉纠正)中使用。在一些实施方式中,基因修饰的HSC或iPS细胞用于在治疗溶酶体贮积病中使用。在一些实施方式中,基因修饰的HSC或iPS细胞用于在治疗从粘多糖病I型(Scheie、Hurler-Scheie或Hurler综合征)、粘多糖病II型(亨特综合征)、粘多糖病VI型(Maroteaux-Lamy综合征)、粘多糖病VII型(Sly疾病)、X连锁肾上腺脑白质营养不良、球形细胞脑白质营养不良(克拉伯病)、异染性脑白质营养不良、戈谢病、岩藻糖苷贮积症、α-甘露糖苷过多症、天冬氨酸葡萄糖胺尿症、Farber病、泰-萨克斯病、庞贝氏病、尼曼匹克病和沃尔曼病中选择的疾病中使用。
在一些实施方式中,如本文描述的HSC和iPS细胞可以被冷冻保存。在一些实施方式中,细胞可以在它们从受试者分离之后并且在任何基因修饰之前被冷冻保存。在一些实施方式中,基因修饰的细胞在基因修饰之后且在输注到受试者中之前被冷冻保存。在一些实施方式中,基因修饰的细胞在它们已经离体扩增后被冷冻保存。
在一个实施方式中,本发明提供了一种冷冻保存的药物组合物,其包括:(a)基因修饰的HSC或iPS细胞的存活(viable)组合物;(b)足以冷冻保存HSC或iPS细胞的量的冷冻保存剂;和(c)药学上可接受的载体。
如本文所用,“冷冻保存”是指通过冷却至零以下低温来保存细胞,例如(通常)77K或-196℃(液氮的沸点)。冷冻保存也指在没有任何冷冻保存剂的情况下将细胞储存在0°-10℃的温度下。在这些低温下,任何生物活动,包括会导致细胞死亡的生化反应,都会被有效地停止。冷冻保护剂通常在零以下温度下使用,以保护细胞免受由于低温冷冻或升温至室温造成的损害。
在一些实施方式中,与冷冻相关的有害影响可以通过以下方式来避免:(a)使用冷冻保护剂,(b)控制冷冻速率,和(c)在足够低的温度下储存以最小化降解反应。
可以使用的冷冻保护剂包括但不限于二甲亚砜(DMSO)、甘油、聚乙烯吡咯烷、聚乙二醇、白蛋白、葡萄聚糖、蔗糖、乙二醇、异赤藓糖醇、D-山梨糖醇、D-甘露糖醇、D-山梨糖醇、异肌醇、D-乳糖、氯化胆碱、氨基酸、甲醇、乙酰胺、甘油单乙酸酯和无机盐。在优选的实施方式中,以低浓度使用DMSO,一种对细胞无毒的液体。作为一种小分子,DMSO自由渗透细胞并通过与水结合来保护细胞内的细胞器,从而改变其可冷冻性并防止结冰造成的损害。加入血浆(例如至浓度20-25%)可以增强DMSO的保护作用。添加DMSO后,细胞应保持在0-4℃直到冻住,因为约1%的DMSO浓度在高于4℃的温度下有毒。
不同的冷冻保护剂(Rapatz,G.,et al.,1968,Cryobiology 5(1):18-25)和不同的细胞类型具有不同的最佳冷却速率(关于冷却速度对骨髓干细胞存活及其移植潜力的影响,参见例如Rowe,A.W.和Rinfret,A.P.,1962,Blood 20:636;Rowe,A.W.,1966,Cryobiology 3(1):12-18;Lewis,J.P.,et al.,1967,Transfusion 7(1):17-32;和Mazur,P.,1970,Science 168:939-949)。水变成冰的熔相(fusion phase)热量应该是最小的。可以通过使用例如可编程冷冻装置或甲醇浴程序来进行冷却程序。
彻底冷冻后,细胞可以迅速转移到长期低温储存容器中。在一个实施方式中,扩增的HSC或IPs细胞可以低温储存在液氮(-196℃)或其蒸气(-165℃)中。通过可用的高效液氮冰箱极大地促进了这种储存,这种冰箱类似于具有极低真空和内部超级绝缘的大型热水瓶容器,从而将热泄漏和氮损失保持在绝对最小值。
在特定的实施方式中,使用Current Protocols in Stem Cell Biology,2007,(Mick Bhatia,et.al.,ed.,John Wiley and Sons,Inc.)中描述并在此通过引用并入的冷冻保存程序。主要是当10-cm组织培养板上的HSC达到约50%的汇合度时,吸出板内的培养基并用磷酸盐缓冲盐水冲洗HSC。然后通过3ml的0.025%胰蛋白酶/0.04% EDTA处理使粘附的HSC脱附。通过7ml培养基中和胰蛋白酶/EDTA,并通过以200xg离心2分钟收集脱附的HSC。吸出上清液并将HSC团粒重悬于1.5ml培养基中。将一等分1ml100% DMSO添加到HSC悬浮液中并轻轻混合。然后将该HSC在DMSO中的悬浮液的1ml等分试样分配到CRYULES中,为冷冻保存做准备。无菌储存CRYULES的盖子最好在里面有螺纹,这允许轻松处理而不会造成污染。合适的托架***是市售的,并且可用于对单个样本进行编目、存储和检索。
例如,可以在通过引用并入本文的以下参考文献中找到对HSC(特别是来自骨髓或外周血的HSC)的操作、冷冻保存和长期储存的注意事项和程序:Gorin,N.C.,1986,ClinicsIn Haematology 15(1):19-48;Bone-Marrow Conservation,Culture andTransplantation,Proceedings of a Panel,Moscow,Jul.22-26,1968,InternationalAtomic Energy Agency,Vienna,pp.107-186。
可供使用和设想使用活细胞冷冻保存的其它方法或其修改(例如,cold metal-minor techniques;Livesey,S.A.和Linner,J.G.,1987,Nature 327:255;Linner,J.G.,etal.,1986,J.Histochem.Cytochem.34(9):1123-1135;美国专利号4,199,022、3,753,357和4,559,298),并且这些全部均在此通过引用以其整体并入。
在一些实施方式中,将冷冻的HSC或iPS细胞快速解冻(例如,在保持在37°-41℃的水浴中)并在解冻后立即在冰上冰镇。特别地,可以将装有冷冻HSC或iPS细胞的低温小瓶浸入温水浴中直至其颈部;温和的旋转将确保细胞悬浮液在其解冻时混合,并增加从温水到内部冰块的热传递。冰完全融化后,可以立即将小瓶放入冰中。
在一个实施方式中,Current Protocols in Stem Cell Biology 2007(MickBhatia,et al.,ed.,John Wiley and Sons,Inc.)中描述了冷冻保存后的解冻程序并且在此通过引用并入。从低温冷冻箱中取出低温小瓶后,立即将小瓶在双手之间滚动10至30秒,直到小瓶外部无霜。然后将小瓶直立在37℃水浴中直至内容物明显解冻。将小瓶浸入95%乙醇中或喷洒70%乙醇以杀死水浴中的微生物并在无菌罩中风干。然后使用无菌技术将小瓶的内容物转移到含有9ml培养基的10-cm无菌培养物中。然后,可以在37℃和5%加湿CO2的培养箱中培养HSC并进一步扩增。
可能需要处理HSC或IPs细胞以防止在解冻时细胞凝结。为了防止凝结,可以使用各种程序,包括但不限于在冷冻之前和/或之后添加DNase(Spitzer,G.,et al.,1980,Cancer 45:3075-3085)、低分子量葡聚糖和柠檬酸盐、羟乙基淀粉(Stiff,P.J.,et al.,1983,Cryobiology 20:17-24)。
如果冷冻保护剂对人体有毒,则应在解冻的HSC或iPS细胞的治疗性用途之前去除。在使用DMSO作为冷冻保存剂的实施方式中,优选省略该步骤以避免细胞损失,因为DMSO没有严重的毒性。然而,在需要去除冷冻保护剂的情况下,优选在解冻时完成去除。
去除冷冻保护剂的一种方式是通过稀释至微不足道的浓度。这可以通过添加培养基来完成,随后如果需要,进行一个或多个离心循环以团粒化细胞、去除上清液和重悬细胞。例如,可以将解冻细胞中的细胞内DMSO降低到不会对回收细胞产生不利影响的水平(小于1%)。这优选缓慢地进行,以尽量最小化在去除DMSO期间发生的潜在破坏性渗透梯度。
在去除冷冻保护剂后,可以进行细胞计数(例如通过使用血细胞计数器)和活力测试(例如通过台盼蓝排除;Kuchler,R.J.1977,Biochemical Methods in Cell Cultureand Virology,Dowden,Hutchinson&Ross,Stroudsburg,Pa.,pp.18-19;1964,Methods inMedical Research,Eisen,H.N.,et al.,eds.,Vol.10,Year Book Medical Publishers,Inc.,Chicago,pp.39-47)以确认细胞存活。
在一个实施方式中,通过如本文描述的活力(例如台盼蓝排除)和微生物无菌性的标准测定法来测试解冻细胞,并测试以确认和/或确定它们相对于接受者的特性。
尽管结合各种实施方式描述了本教导,但本教导并不旨在限于此类实施方式。相反,如本领域技术人员将理解的,本教导包括各种替代、修改和等效物。
在整个本公开中,通过识别引文来引用各种出版物、专利和公布的专利说明书。这些出版物、专利和公布的专利说明书的公开内容在此通过引用并入本公开中以更全面地描述本发明所属的现有技术。
表4:定义用于对本发明的细胞进行基因编辑的优选靶序列
Figure BDA0003994978620000791
Figure BDA0003994978620000801
Figure BDA0003994978620000811
Figure BDA0003994978620000821
Figure BDA0003994978620000831
根据本公开,本发明更特别地包括下列项目:
1.一种将转基因表达到患者大脑中的方法,包括:
i)获得基因修饰的造血干细胞(HSC),其中HSC分离自患者或者获自来源于患者并且分化成HSC的诱导多能干(iPS)细胞,其中基因修饰的HSC被工程化为包括整合在小胶质细胞中表达的基因座上的转基因;和
ii)将基因修饰的HSC移植到患者中,使其分化为将转基因表达到患者大脑中的小胶质细胞。
2.一种将转基因表达到患者大脑中的方法,包括:
i)获得基因修饰的造血干细胞(HSC),其中HSC分离自相容供体或者获自来源于相容供体并且分化成HSC的诱导多能干(iPS)细胞,其中基因修饰的HSC被工程化为包括整合在小胶质细胞中表达的基因座上的转基因;和
ii)将基因修饰的HSC移植到患者中,使其分化为将转基因表达到患者大脑中的小胶质细胞。
3.根据项目1或2的方法,其中所述基因座选自由以下组成的组:TMEM119、S100A9、CD11B、B2m、Cx3cr1、MERTK、CD164、Tlr4、Tlr7、Cd14、Fcgr1a、Fcgr3a、TBXAS1、DOK3、ABCA1、TMEM195、MR1、CSF3R、FGD4、TSPAN14、TGFBRI、CCR5、GPR34、SERPINE2、SLCO2B1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfia4。
4.根据项目1-3中任一项的方法,其中所述基因座为cx3cr1。
5.根据项目1-3中任一项的方法,其中所述基因座为cd11b。
6.根据项目1-3中任一项的方法,其中所述基因座为tmem119。
7.根据项目1-3中任一项的方法,其中所述基因座为s100a9。
8.根据项目1-7中任一项的方法,其中细胞已经使用序列特异性试剂和包括转基因的供体序列进行了基因修饰。
9.根据项目8的方法,其中将包括转基因的供体序列在病毒载体中提供给细胞。
10.根据项目9的方法,其中病毒载体为AAV载体。
11.根据项目8-10中任一项的方法,其中序列特异性试剂包括工程化的稀有切割核酸内切酶。
12.根据项目11的方法,其中工程化的稀有切割核酸内切酶选自由以下组成的组:转录激活器样效应物核酸酶(TALEN)、锌指核酸酶(ZFN)、簇状规则间隔的短回文重复序列(CRISPR)-Cas、大范围核酸酶和megaTAL。
13.根据项目12的方法,其中序列特异性试剂作为核酸提供给细胞。
14.根据项目13的方法,其中核酸为mRNA。
15.根据任一项目1至14的方法,其中所述转基因包括用于治疗粘多糖病I型(Scheie、Hurler-Scheie或Hurler综合征)的IDUA。
16.根据任一项目1至14的方法,其中所述转基因包括用于治疗粘多糖病II型(Hunter)的IDS。
17.根据任一项目1至14的方法,其中所述转基因包括用于治疗粘多糖病VI型(Maroteaux-Lamy)的ARSB。
18.根据任一项目1至14的方法,其中所述转基因包括用于治疗粘多糖病VII型(Sly)的GUSB。
19.根据任一项目1至14的方法,其中所述转基因包括用于治疗X连锁肾上腺脑白质营养不良的ABCD1。
20.根据任一项目1至14的方法,其中所述转基因包括用于治疗球形细胞脑白质营养不良(Krabbe)的GALC。
21.根据任一项目1至14的方法,其中所述转基因包括用于治疗异染性脑白质营养不良的ARSA。
22.根据任一项目1至14的方法,其中所述转基因包括用于治疗戈谢病的GBA。
23.根据任一项目1至14的方法,其中所述转基因包括用于治疗岩藻糖苷贮积症的FUCA1。
24.根据任一项目1至14的方法,其中所述转基因包括用于治疗α-甘露糖苷过多症的MAN2B1。
25.根据任一项目1至14的方法,其中所述转基因包括用于治疗天冬氨酸葡萄糖胺尿症的AGA。
26.根据任一项目1至14的方法,其中所述转基因包括用于治疗Farber的ASAH1。
27.根据任一项目1至14的方法,其中所述转基因包括用于治疗泰-萨克斯病的HEXA。
28.根据任一项目1至14的方法,其中所述转基因包括用于治疗庞贝氏症的GAA。
29.根据任一项目1至14的方法,其中所述转基因包括用于治疗尼曼匹克症的SMPD1。
30.根据任一项目1至14的方法,其中所述转基因包括用于治疗沃尔曼综合征的LIPA。
31.根据任一项目1至14的方法,其中所述转基因包括用于治疗CDKL5-缺陷相关疾病的CDKL5。
32.一种基因修饰的HSC或iPS细胞,其具有整合在选自tmem119、cd11b或cx3cr1的基因座处的转基因,所述转基因在所述基因的内源性启动子的转录控制下。
33.根据项目32的HSC或iPS细胞,用作药物使用。
34.根据项目32的HSC或iPS细胞,用于在治疗在与所述转基因同源的内源性基因表达方面具有缺陷的患者(交叉纠正)中使用。
35.根据项目33的HSC或iPS细胞,用于在治疗溶酶体贮积病中使用。
36.根据项目32的HSC或iPS细胞,其中所述转基因包括IDUA以用于在治疗粘多糖病I型(Scheie、Hurler-Scheie或Hurler综合征)中使用。
37.根据项目32的HSC或iPS细胞,其中所述转基因包括IDS,以用于在治疗粘多糖病II型(Hunter)中使用。
38.根据项目32的HSC或iPS细胞,其中所述转基因包括ARSB,以用于在治疗粘多糖病VI型(Maroteaux-Lamy)中使用。
39.根据项目32的HSC或iPS细胞,其中所述转基因包括GUSB,以用于在治疗粘多糖病VII型(Sly)中使用。
40.根据项目32的HSC或iPS细胞,其中所述转基因包括用于治疗X连锁肾上腺脑白质营养不良的ABCD1。
41.根据项目32的HSC或iPS细胞,其中所述转基因包括GALC以用于在治疗球形细胞脑白质营养不良(Krabbe)中使用。
42.根据项目32的HSC或iPS细胞,其中所述转基因包括ARSA,以用于在治疗异染性脑白质营养不良中使用。
43.根据项目32的HSC或iPS细胞,其中所述转基因包括GBA,以用于在治疗戈谢病中使用。
44.根据项目32的HSC或iPS细胞,其中所述转基因包括FUCA1,以用于在治疗岩藻糖苷贮积症中使用。
45.根据项目32的HSC或iPS细胞,其中所述转基因包括MAN2B1,以用于在治疗α-甘露糖苷过多症中使用。
46.根据项目32的HSC或iPS细胞,其中所述转基因包括AGA,以用于在治疗天冬氨酸葡萄糖胺尿症中使用。
47.根据项目32的HSC或iPS细胞,其中所述转基因包括ASAH1,以用于在治疗Farber中使用。
48.根据项目32的HSC或iPS细胞,其中所述转基因包括用于治疗泰-萨克斯病的HEXA。
49.根据项目32的HSC或iPS细胞,其中所述转基因包括GAA,以用于在治疗庞贝氏症中使用。
50.根据项目32的HSC或iPS细胞,其中所述转基因包括SMPD1,以用于在治疗尼曼匹克症中使用。
51.根据项目32的HSC或iPS细胞,其中所述转基因包括LIPA,以用于在治疗沃尔曼综合征中使用。
52.根据项目32的HSC或iPS细胞,其中所述转基因包括CDKL5,以用于在治疗CDKL5-缺陷相关疾病中使用。
53.根据项目32-50中任一项的HSC或iPS细胞,其中所述转基因的多个拷贝被整合在由2A自切割肽序列分隔开的同一基因座处。
54.一种药物组合物,包括根据项目32-51中任一项的HSC或iPS细胞。
55.一种用于在***位点将外源性编码序列整合到内源性内含子基因组区域中的方法,包括下列步骤:
-提供包括内源性内含子基因组区域的细胞,
-向所述细胞中引入包括外源性编码序列的多核苷酸模板,其中所述多核苷酸模板包括:
a)第一同源多核苷酸序列,其与***位点上游的内含子序列同源,
b)第一强剪接位点序列,其包括分支点和剪接受体;
c)编码2A自切割肽的第一序列;
d)编码目的蛋白质的外源序列;
e)编码2A自切割肽的第二序列;
f)第一外显子的编码序列的拷贝;
g)包括剪接供体的第二强剪接位点序列;和
h)第二同源多核苷酸序列,其与***位点下游的内含子序列同源;
-诱导所述外源性多核苷酸整合到所述内含子序列中,优选地通过同源重组,以使所述外源性编码序列与第一外显子和优选第二外显子或其拷贝一起在所述内源性基因座上转录。
56.一种***载体,诸如AAV载体,其特征在于它包括用于***在内源性基因座处的外源性多核苷酸序列,该外源性多核苷酸序列包括以下序列:
a)第一同源多核苷酸序列,其与***位点上游的内含子序列同源,
b)第一强剪接位点序列,其包括分支点和剪接受体;
c)编码2A自切割肽的第一序列;
d)编码目的蛋白质的外源序列;
e)编码2A自切割肽的第二序列;
f)第一外显子的编码序列的拷贝;
g)包括剪接供体的第二强剪接位点序列;和
h)第二同源多核苷酸序列,其与***位点下游的内含子序列同源。
57.根据项目56的***载体,其中所述第一和第二同源序列与选自以下的内源性基因座同源:tmem119、s100a9、cd11b、b2m、cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、p2ry12、olfml3、p2ry13、hexb、rhob、jun、rab3il1、ccl2、fcrls、scoc、siglech、slc2a5、lrrc3、plxdc2、usp2、ctsf、cttnbp2nl、atp8a2、lgmn、mafb、egr1、bhlhe41、hpgds、ctsd、hspa1a、lag3、csf1r、adamts1、f11r、golm1、nuak1、crybb1、ltc4s、sgce、pla2g15、ccl3l1、abhd12、ang、ophn1、sparc、pros1、p2ry6、lair1、il1a、epb41l2、adora3、rilpl1、pmepa1、ccl13、pde3b、scamp5、ppp1r9a、tjp1、ak1、b4galt4、gtf2h2、trem2、ckb、acp2、pon3、agmo、tnfrsf17、fscn1、st3gal6、adap2、ccl4、entpd1、tmem86a、kctd12、dst、ctsl2、abcc3、pdgfb、pald1、tubgcp5、rapgef5、stab1、lacc1、tmc7、nrip1、kcnd1、tmem206、hps4、dagla、extl3、mlph、arhgap22、cxxc5、p4ha1、cysltr1、fgd2、kcnk13、gbgt1、c18orf1、cadm1、bco2、adrb1、c3ar1、large、leprel1、liph、upk1b、p2rx7、slc46a1、ebf3、ppp1r15a、il10ra、rasgrp3、fos、tppp、slc24a3、havcr2、nav2、apbb2、clstn1、blnk、gnaq、ptprm、frmd4a、cd86、tnfrsf11a、spint1、ppm1l、tgfbr2、cmklr1、tlr6、gas6、hist1h2ab、atf3、acvr1、abi3、lrp12、ttc28、plxna4、adamts16、rgs1、icam1、snx24、ly96、dnajb4和ppfia4。
58.根据项目56或57的***,其中由所述外源性编码序列编码的所述治疗性蛋白质与IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5(SEQ ID NO:1至SEQ ID NO:35–见表1)具有至少80%多肽序列同一性。
59.一种工程化细胞,其特征在于外源性多核苷酸序列已经***在内源性基因座处,该外源性多核苷酸序列包括以下各项:
-第一强剪接位点序列,其包括分支点和受***点;
-编码2A自切割肽的第一序列;
-编码目的蛋白质(诸如治疗性蛋白质)的外源序列,;
-编码2A自切割肽的第二序列;
-与所述基因座内源的前一外显子的编码序列的拷贝;
-包括剪接供***点的第二强剪接位点序列。
60.根据项目59的工程化细胞,其中所述外源性多核苷酸序列被***在选自以下的内源性基因座处:tmem119、s100a9、cd11b、B2m、Cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfia4。
61.根据项目59或60的工程化细胞,其中由所述外源性编码序列编码的治疗性蛋白质与IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5(SEQ ID NO:1至SEQ ID NO:35–见表1)具有至少80%多肽序列同一性。
已经对本发明进行了一般性描述,通过参考某些具体实施例可以获得进一步的理解,本文中提供这些实施例仅用于说明目的,并不旨在限制所要求保护的发明的范围。
实施例
实施例1:材料和方法
细胞培养:
HSC培养:将由GCS-F动员的Leukopak(Miltenyi)制备的HSC解冻并以0.4x106个细胞/ml接种到由STEM Span II培养基(cat.#09655,Stemcell Technologies)组成的HSC培养基中,该培养基具有1x最终浓度的CD34+扩增混合物(cocktail)(#02691,StemcellTechnologies)和Pen-Strep(#15140-122,Gibco Life Technologies)。将细胞在37℃和5% CO2下温育48小时以在解冻后恢复,然后进行TALEN转染和AAV转导。
修复模板构建体:
对于S100A9,使用从Vigene获得的AAV6颗粒将合成外显子序列***S100A9基因座的第一个内含子中。该供体含有用于该内含子区域的左同源臂(SEQ ID NO:209),随后是3’白蛋白剪接信号序列(SEQ ID NO:206),随后是编码GSG接头的序列(SEQ ID NO:215),随后是编码P2A肽的序列(SEQ ID NO:224),随后是编码EGFP的序列(SEQ ID NO:218)或编码IDUA的序列(SEQ ID NO:2),没有终止密码子,随后是T2A自切割肽(SEQ ID NO:225),随后是S100A9的第一个外显子(SEQ ID NO:210),随后是5’白蛋白剪接信号序列(SEQ ID NO:208),随后是用于该内含子区域的右同源臂(SEQ ID NO:211)。
对于CD11b,使用从Vigene获得的AAV6颗粒将合成外显子序列***CD11b基因座的第一个内含子中。该供体含有用于该内含子区的左同源臂(SEQ ID NO:212),随后是3’白蛋白剪接信号序列(SEQ ID NO:206),随后是编码GSG接头的序列(SEQ ID NO:215),随后是P2A自切割肽(SEQ ID NO:224),随后是编码EGFP的序列(SEQ ID NO:218)或编码IDUA的序列(SEQ ID NO:2),没有终止密码子,随后是T2A自切割肽(SEQ ID NO:225),随后是CD11b重写的第一个外显子(SEQ ID NO:213),随后是5’白蛋白剪接信号序列(SEQ ID NO:208),随后是用于该内含子区域的右同源臂(SEQ ID NO:214)。
TALE-核酸酶试剂:
根据先前描述的协议(Poirot et al.2015),生产了编码靶向CD11b(SEQ ID NO:TALEN_CD11B左和SEQ ID NO:TALEN_CD11B右)以及S100A9(SEQ ID NO:TALENS100A9左和SEQ ID NO:TALEN S100A9右)的TALE-核酸酶的mRNA。对于CD11b,所靶向的序列是TACAACATATTCTATCAgcctcttggtctgcaAAACCTAAAATTTACTA(SEQ IDNO:125),而对于S100A9基因座,所靶向的序列为TTAGGGGCCCTGACAGCtctccataggtggagGCCTCAGGCAGGCAGGA(SEQ ID NO:175)。(TALEN是指定由Cellectis(8rue de la Croix Jarry,Paris,France)设计的TALE-核酸酶异二聚体的商标,包括如WO2011072246中描述的Fok-1核酸酶催化头。
基因编辑协议:转染
解冻48小时后,对HSC进行基因编辑。为此,收获HSC,用PBS洗涤一次,并以10x106个细胞/ml的浓度重悬于高效电穿孔缓冲液(#45-0802,BTX)中。将TALEN mRNA与5μg每种TALEN臂和每百万个细胞的细胞悬浮液混合。使用表5中所示的程序,在BTX PulseAgile上对细胞和mRNA混合物进行电穿孔。将HSC转移到预热的扩增培养基中,最终浓度为2x106个细胞/ml。
表5:用于HSC的BTX PulseAgile设置
设置 组1 组2 组3
振幅(V) 1000 1000 130
持续时间(ms) 0.1 0.1 0.2
间隔(ms) 0.2 100 2
次数 1 1 4
基因编辑:AAV制备和转导:
电穿孔后立即用不同剂量的AAV转导HSC,剂量包括0.3e4、1e4或3.2e4病毒基因组/细胞(vg/细胞)。在37C下温育15分钟,然后转移到30℃下22小时以恢复。第二天对细胞进行计数并在扩增培养基中稀释为0.2-0.6x106个细胞/ml,并在37℃下培养。
髓样分化
如CD11b和S100A9等髓样基因在HSC中不表达。为了查看这些编辑基因座的表型表达,在髓样分化培养基中温育HSC。转染/转导后24小时,对HSC进行计数并以2e5个细胞/mL重新悬浮在稀释在STEM Span II(Stemcell Technologies,cat号09655)并补充有青霉素/链霉素(Pen/strep)的髓样扩增补充剂(Stemcell Technologies,cat号02694)中。然后将髓样扩增培养基中的细胞接种在非组织培养处理的平板中,每3-4天***,以约2e5个细胞/mL接种。培养14天后,回收细胞用于流式细胞术染色,和/或接种用于IDUA分泌。
IDUA分泌测定
髓样分化后14天,将细胞以相等数量(2e5个细胞/孔)接种在非组织培养96孔培养板中,并在37℃的髓样培养基中温育。播种后四天,收集上清液并使用商业ELISA(G-Biosciences,cat:IT2013)表征IDUA的量。
体内小鼠实验
从Jackson实验室订购六周龄的雌性NSG小鼠,并随意用水和食物饲养。用在DMSO中重构并在PBS中进一步稀释的白消安(Sigma Aldrich,cat号B3625)(在注射的第一天新鲜制备)对小鼠进行HSC移植预调理。然后,使用0.2μm注射器过滤器对白消安进行灭菌。小鼠腹腔注射15mg/kg白消安,每天一次,连续3天,然后注射HSC。在注射当天,用3%异氟烷(isoflorine)麻醉动物并通过眶后注射来注射1.5e6 HSC。在注射后16周,通过分析血液、骨髓和脑中是否存在人体细胞来评估移植情况。
大脑分离
首先用4%异氟烷麻醉小鼠并用50mL冷PBS灌注。提取大脑并置于含有5% FBS+青霉素/链霉素的5mL DMEM中,并在处理所有小鼠和组织时将其保持在冰上。一旦提取出所有大脑,用无菌剪刀将大脑切成小块,并通过16g针头3次以均质化。为了进一步消化脑组织,将500μg/mL木瓜蛋白酶和20U/mL DNase I添加到脑匀浆中并在37℃下温育30分钟。温育后,剩余的脑组织通过40μM细胞过滤器并用新鲜的DMEM洗涤。然后将细胞重新悬浮在30%Percoll梯度中,用70% Percoll梯度做底层,并在600g下旋转25分钟以去除髓磷脂。回收Percoll梯度界面中的细胞、洗涤和染色以用于流式细胞术或保留用于基因组DNA提取。
流式细胞术
将细胞在400xg下旋转5分钟。去除上清液并在FACS缓冲液(1mM EDTA+0.5%BSA在PBS中)中洗涤细胞一次。洗涤后,将细胞重悬于50μL在FACS缓冲液中以5μg/mL稀释的Fc封阻液(BD Bioscience,cat号564220)中。在4℃下温育5分钟后,向细胞中加入50μL在FACS缓冲液中稀释的表面抗体母液混合液,并在4℃下再温育30分钟。然后将细胞在FACS缓冲液中洗涤两次,然后在4℃下在100μμL固定剂/Perm溶液(BD Bioscience,cat号554722)中固定20分钟。将细胞在透化缓冲液中洗涤一次,然后在4℃下在细胞内抗体混合物(在透化缓冲液中稀释)中温育30分钟。将细胞在透化缓冲液中再次洗涤一次并重悬于100-200μL FACS缓冲液中,然后在BD Canto上进行分析。
对于体外髓样分化,使用下列抗体:CD11b APC(Miltenyi 130-110-554)、CD14VioBlue(Miltenyi 130-113-152)和S100A9 PE(Invitrogen MA5-28130)。对于骨髓细胞的染色,使用下列抗体:hCD45 PE-Cy7(BD 103114)、mCD45 V450(BD 560501)、CD33 PE(Miltenyi 130-113-349)、CD3 PerCP-Cy5.5(BD 560835)、CD34 APC-V770(Miltenyi 130-113-180)、CD19 FITC(BD 555412)。对于分离的脑细胞染色,使用以下抗体:hCD45 FITC(Miltenyi 130-113-117)、mCD45 APC-Cy7(BD 557659)、P2RY12 BV421(Biolegend392106)、纯化的TMEM119(Biolegend 853302)、抗-mIgG2b AF647(Biolegend 406716)、CD11b PE(Biolegend 101208)。对于每种抗体,包括荧光减一(fluorescence minus one,荧光扣除)(FMO)对照和单染色补偿珠。
实施例2:用于表达GFP的人工外显子(ArtEx)可以被***在外显子#1和#2之间并 且充分处理以用于表达–体外结果
在髓样基因S100A9或CD11b的2个第一个外显子之间***人工外显子,应该实现从髓样谱系中表达治疗性蛋白质,而不损害S100A9或CD11b的内源性表达。为了概念验证,我们生成了靶向每个基因的内含子区域的TALEN,以及携带允许表达监测的GFP盒的AAV供体。作为我们方法的谱系特异性表达的对照,我们还生成了将含有GFP盒的启动子***AAVS1基因座的试剂,作为将在所有血液谱系中表达的更传统的安全港方法。
用靶向AAVS1、S100A9和CD11b基因座的TALEN mRNA转染预刺激的HSC,并用增加剂量的相应AAV-GFP修复模板进行转导。然后,在骨髓样细胞中分化经编辑的HSC。十四天后,通过流式细胞仪筛选分化细胞以表征不同细胞子集中的GFP表达。
分化后十四天,40-60%的细胞为CD14+。在CD14高细胞中,由GFP表达定义的基因编辑率为26%至60%,很大程度上取决于所使用的AAV剂量,对于CD11b和S100A9基因座,实现的最大值分别为56%和60%(图8A)。我们还评估了CD 14高细胞中内源性S100A9和CD11b的表达。所有CD14高细胞对CD11b和S100A9都是阳性的,无论它们是否被编辑(GFP+)或未编辑(GFP-)(图8B和8C)。
在任一基因座中都存在大量GFP细胞,这表明GFP盒已充分***第一2个外显子之间,并且我们添加的剪接信号已被剪接细胞机器充分处理。这种ArtEx策略允许表达双功能mRNA分子,该分子能够为***的基因(即GFP)蛋白和内源性CD11b或S100A9蛋白进行翻译。
实施例3:用于表达IDUA的人工外显子可以***外显子#1和#2之间并充分处理以 用于表达和分泌-体外结果
用靶向S100A9和CD11b基因座的TALEN mRNA转染预刺激的HSC,并用增加剂量的相应AAV-IDUA修复模板进行转导。将编辑的HSC放入髓样分化培养基中。十四天后,将髓样分化细胞接种用于IDUA生产,而没有任何富集(髓样的%在40-60%之间)。3天后收集细胞上清液并通过ELISA定量IDUA。我们观察到在CD11b和S100A9基因座编辑的细胞分泌的IDUA分别是未编辑对照的10x倍和15x倍多(图9)。
这些结果证实,ArtEx策略允许特异性表达和治疗性蛋白质分泌。
实施例4:经编辑的HSC成功移植到动物模型的血液和骨髓中:体内结果
作为我们治疗方法的基础,HSC更相关的特征之一是它们能够在一次干预后提供终生供应的编辑细胞的能力。为此,HSC需要植入到骨髓中,增殖并产生血细胞,这些血细胞随后将填充体内的多个组织。
为了提供对这种HSC能力的一些了解,使用了免疫缺陷动物模型。具有靶向S100A9基因座的上述GFP盒的经编辑的HSC在编辑后24小时注射到条件NSG雌性动物中。该动物模型已显示出维持人类HSC在动物骨髓中的移植。
注射经编辑的HSC后16周,在所有动物中检测到血液和骨髓中的移植,在研究组中的水平相似,血液中平均为3.3%且骨髓中平均为40.8%(图10A和B)。此外,在动物的脾脏中可以检测到24%至30%的人体细胞(图10C)。更重要的是,在所有这些隔室中可以检测经编辑的细胞。
分析了这些动物血液中经编辑的细胞的存在。在大量人类CD45细胞上,我们发现在注射了在S100A9基因座处编辑的HSC的动物血液中平均有1.4%的GFP+细胞。然而,当分析到髓样隔室(在该模型中定义为CD33+细胞)时,编辑率增加到3.3%,是大批群体的两倍高(图11A)。
还分析了骨髓中经编码的细胞的百分比,并且1.3%的人类细胞是GFP+。此外,骨髓中2.8%的hCD45+和CD33+人类细胞是GFP+(图10B)。
实施例5:经编辑的HSC成功地移植到动物模型的大脑中:体内结果
这种治疗方法的另一个潜在优势是HSC衍生的小胶质细胞能够在脑室中分泌缺乏的LSD酶的能力,从而能够治疗与这些LSD疾病相关的破坏性神经症状。为了研究这一潜在特征,分析了上述动物大脑中人类细胞的存在。
在分离小鼠大脑和细胞处理后,在小鼠大脑中可以检测到大量人类细胞。大脑中平均2.7%的细胞来源于人类(图12A)。更重要的是,使用P2RY12和TMEM119小胶质细胞标志物,这些人类细胞中有18.5%含有衍生的小胶质细胞(图12B)。由于在这些动物外周血中存在的任何人类细胞中均未发现这2种标志物,这排除了在提取过程中外周血细胞对脑分离物的任何潜在污染。
在该脑室中,GFP阳性细胞分别占所有人类细胞和人类小胶质细胞的至少1.2%和1.6%。
实施例6:ArtEx编辑的HSC具有高分泌谱
比较了ArtEx编辑的HSC与经典慢病毒编辑的HSC关于它们分泌治疗性蛋白质的能力。
未经处理的HSC、用允许表达IDUA的慢病毒载体转导的HSC以及如前述实施例所描述的在S100A9或CD11b基因座处靶向整合IDUA的HSC。将经编辑的HSC放入髓样分化培养基中。十四天后,将髓样分化细胞接种用于IDUA生产。3天后收集细胞上清液并通过ELISA定量IDUA。我们观察到,在CD11b和S100A9基因座处编辑的细胞分泌的IDUA分别是未编辑的对照的10x和15x倍多(图13A)。
结果表明,ArtEx编辑的HSC能够通过10倍因子刺激IDUA分泌,而用慢病毒载体转导的HSC通过5倍因子刺激IDUA分泌。
此外,在小鼠中测试了HSC的移植效率,并且如先前观察到的,经编辑的HSC可以有效地移植入骨髓(50%)、脾脏(41%)和血液(45%),并且最重要的是移植入大脑中,高达3.3%,具有大量的小胶质细胞(图13B和C)。
总之,这些结果表明,甚至在大脑中,ArtEx策略具有分泌高水平治疗性蛋白质的潜力。
序列表
<110> 塞勒克提斯公司(Cellectis S.A.)
<120> 对细胞进行基因修饰以递送治疗性蛋白质的方法(METHODS TO GENETICALLYMODIFY CELLS FOR DELIVERY OF THERAPEUTIC PROTEINS)
<130> P82103035PCT00
<150> US63020894
<151> 2020-05-06
<160> 226
<170> PatentIn version 3.5
<210> 1
<211> 1962
<212> DNA
<213> 人类(homo sapiens)
<220>
<223> IDUA多核苷酸序列
<400> 1
atgcgtcccc tgcgcccccg cgccgcgctg ctggcgctcc tggcctcgct cctggccgcg 60
cccccggtgg ccccggccga ggccccgcac ctggtgcatg tggacgcggc ccgcgcgctg 120
tggcccctgc ggcgcttctg gaggagcaca ggcttctgcc ccccgctgcc acacagccag 180
gctgaccagt acgtcctcag ctgggaccag cagctcaacc tcgcctatgt gggcgccgtc 240
cctcaccgcg gcatcaagca ggtccggacc cactggctgc tggagcttgt caccaccagg 300
gggtccactg gacggggcct gagctacaac ttcacccacc tggacgggta cctggacctt 360
ctcagggaga accagctcct cccagggttt gagctgatgg gcagcgcctc gggccacttc 420
actgactttg aggacaagca gcaggtgttt gagtggaagg acttggtctc cagcctggcc 480
aggagataca tcggtaggta cggactggcg catgtttcca agtggaactt cgagacgtgg 540
aatgagccag accaccacga ctttgacaac gtctccatga ccatgcaagg cttcctgaac 600
tactacgatg cctgctcgga gggtctgcgc gccgccagcc ccgccctgcg gctgggaggc 660
cccggcgact ccttccacac cccaccgcga tccccgctga gctggggcct cctgcgccac 720
tgccacgacg gtaccaactt cttcactggg gaggcgggcg tgcggctgga ctacatctcc 780
ctccacagga agggtgcgcg cagctccatc tccatcctgg agcaggagaa ggtcgtcgcg 840
cagcagatcc ggcagctctt ccccaagttc gcggacaccc ccatttacaa cgacgaggcg 900
gacccgctgg tgggctggtc cctgccacag ccgtggaggg cggacgtgac ctacgcggcc 960
atggtggtga aggtcatcgc gcagcatcag aacctgctac tggccaacac cacctccgcc 1020
ttcccctacg cgctcctgag caacgacaat gccttcctga gctaccaccc gcaccccttc 1080
gcgcagcgca cgctcaccgc gcgcttccag gtcaacaaca cccgcccgcc gcacgtgcag 1140
ctgttgcgca agccggtgct cacggccatg gggctgctgg cgctgctgga tgaggagcag 1200
ctctgggccg aagtgtcgca ggccgggacc gtcctggaca gcaaccacac ggtgggcgtc 1260
ctggccagcg cccaccgccc ccagggcccg gccgacgcct ggcgcgccgc ggtgctgatc 1320
tacgcgagcg acgacacccg cgcccacccc aaccgcagcg tcgcggtgac cctgcggctg 1380
cgcggggtgc cccccggccc gggcctggtc tacgtcacgc gctacctgga caacgggctc 1440
tgcagccccg acggcgagtg gcggcgcctg ggccggcccg tcttccccac ggcagagcag 1500
ttccggcgca tgcgcgcggc tgaggacccg gtggccgcgg cgccccgccc cttacccgcc 1560
ggcggccgcc tgaccctgcg ccccgcgctg cggctgccgt cgcttttgct ggtgcacgtg 1620
tgtgcgcgcc ccgagaagcc gcccgggcag gtcacgcggc tccgcgccct gcccctgacc 1680
caagggcagc tggttctggt ctggtcggat gaacacgtgg gctccaagtg cctgtggaca 1740
tacgagatcc agttctctca ggacggtaag gcgtacaccc cggtcagcag gaagccatcg 1800
accttcaacc tctttgtgtt cagcccagac acaggtgctg tctctggctc ctaccgagtt 1860
cgagccctgg actactgggc ccgaccaggc cccttctcgg accctgtgcc gtacctggag 1920
gtccctgtgc caagagggcc cccatccccg ggcaatccat ga 1962
<210> 2
<211> 653
<212> PRT
<213> 人类
<220>
<223> IDUA多肽序列
<400> 2
Met Arg Pro Leu Arg Pro Arg Ala Ala Leu Leu Ala Leu Leu Ala Ser
1 5 10 15
Leu Leu Ala Ala Pro Pro Val Ala Pro Ala Glu Ala Pro His Leu Val
20 25 30
His Val Asp Ala Ala Arg Ala Leu Trp Pro Leu Arg Arg Phe Trp Arg
35 40 45
Ser Thr Gly Phe Cys Pro Pro Leu Pro His Ser Gln Ala Asp Gln Tyr
50 55 60
Val Leu Ser Trp Asp Gln Gln Leu Asn Leu Ala Tyr Val Gly Ala Val
65 70 75 80
Pro His Arg Gly Ile Lys Gln Val Arg Thr His Trp Leu Leu Glu Leu
85 90 95
Val Thr Thr Arg Gly Ser Thr Gly Arg Gly Leu Ser Tyr Asn Phe Thr
100 105 110
His Leu Asp Gly Tyr Leu Asp Leu Leu Arg Glu Asn Gln Leu Leu Pro
115 120 125
Gly Phe Glu Leu Met Gly Ser Ala Ser Gly His Phe Thr Asp Phe Glu
130 135 140
Asp Lys Gln Gln Val Phe Glu Trp Lys Asp Leu Val Ser Ser Leu Ala
145 150 155 160
Arg Arg Tyr Ile Gly Arg Tyr Gly Leu Ala His Val Ser Lys Trp Asn
165 170 175
Phe Glu Thr Trp Asn Glu Pro Asp His His Asp Phe Asp Asn Val Ser
180 185 190
Met Thr Met Gln Gly Phe Leu Asn Tyr Tyr Asp Ala Cys Ser Glu Gly
195 200 205
Leu Arg Ala Ala Ser Pro Ala Leu Arg Leu Gly Gly Pro Gly Asp Ser
210 215 220
Phe His Thr Pro Pro Arg Ser Pro Leu Ser Trp Gly Leu Leu Arg His
225 230 235 240
Cys His Asp Gly Thr Asn Phe Phe Thr Gly Glu Ala Gly Val Arg Leu
245 250 255
Asp Tyr Ile Ser Leu His Arg Lys Gly Ala Arg Ser Ser Ile Ser Ile
260 265 270
Leu Glu Gln Glu Lys Val Val Ala Gln Gln Ile Arg Gln Leu Phe Pro
275 280 285
Lys Phe Ala Asp Thr Pro Ile Tyr Asn Asp Glu Ala Asp Pro Leu Val
290 295 300
Gly Trp Ser Leu Pro Gln Pro Trp Arg Ala Asp Val Thr Tyr Ala Ala
305 310 315 320
Met Val Val Lys Val Ile Ala Gln His Gln Asn Leu Leu Leu Ala Asn
325 330 335
Thr Thr Ser Ala Phe Pro Tyr Ala Leu Leu Ser Asn Asp Asn Ala Phe
340 345 350
Leu Ser Tyr His Pro His Pro Phe Ala Gln Arg Thr Leu Thr Ala Arg
355 360 365
Phe Gln Val Asn Asn Thr Arg Pro Pro His Val Gln Leu Leu Arg Lys
370 375 380
Pro Val Leu Thr Ala Met Gly Leu Leu Ala Leu Leu Asp Glu Glu Gln
385 390 395 400
Leu Trp Ala Glu Val Ser Gln Ala Gly Thr Val Leu Asp Ser Asn His
405 410 415
Thr Val Gly Val Leu Ala Ser Ala His Arg Pro Gln Gly Pro Ala Asp
420 425 430
Ala Trp Arg Ala Ala Val Leu Ile Tyr Ala Ser Asp Asp Thr Arg Ala
435 440 445
His Pro Asn Arg Ser Val Ala Val Thr Leu Arg Leu Arg Gly Val Pro
450 455 460
Pro Gly Pro Gly Leu Val Tyr Val Thr Arg Tyr Leu Asp Asn Gly Leu
465 470 475 480
Cys Ser Pro Asp Gly Glu Trp Arg Arg Leu Gly Arg Pro Val Phe Pro
485 490 495
Thr Ala Glu Gln Phe Arg Arg Met Arg Ala Ala Glu Asp Pro Val Ala
500 505 510
Ala Ala Pro Arg Pro Leu Pro Ala Gly Gly Arg Leu Thr Leu Arg Pro
515 520 525
Ala Leu Arg Leu Pro Ser Leu Leu Leu Val His Val Cys Ala Arg Pro
530 535 540
Glu Lys Pro Pro Gly Gln Val Thr Arg Leu Arg Ala Leu Pro Leu Thr
545 550 555 560
Gln Gly Gln Leu Val Leu Val Trp Ser Asp Glu His Val Gly Ser Lys
565 570 575
Cys Leu Trp Thr Tyr Glu Ile Gln Phe Ser Gln Asp Gly Lys Ala Tyr
580 585 590
Thr Pro Val Ser Arg Lys Pro Ser Thr Phe Asn Leu Phe Val Phe Ser
595 600 605
Pro Asp Thr Gly Ala Val Ser Gly Ser Tyr Arg Val Arg Ala Leu Asp
610 615 620
Tyr Trp Ala Arg Pro Gly Pro Phe Ser Asp Pro Val Pro Tyr Leu Glu
625 630 635 640
Val Pro Val Pro Arg Gly Pro Pro Ser Pro Gly Asn Pro
645 650
<210> 3
<211> 1383
<212> DNA
<213> 人类
<220>
<223> IDS多核苷酸序列
<400> 3
atgcctttgc gcaggagacc tgacaccacc cgcctgtacg acttcaactc ctactggagg 60
gtgcacgctg gaaacttctc caccatcccc cagtacttca aggagaatgg ctatgtgacc 120
atgtcggtgg gaaaagtctt tcaccctggg atatcttcta accataccga tgattctccg 180
tatagctggt cttttccacc ttatcatcct tcctctgaga agtatgaaaa cactaagaca 240
tgtcgagggc cagatggaga actccatgcc aacctgcttt gccctgtgga tgtgctggat 300
gttcccgagg gcaccttgcc tgacaaacag agcactgagc aagccataca gttgttggaa 360
aagatgaaaa cgtcagccag tcctttcttc ctggccgttg ggtatcataa gccacacatc 420
cccttcagat accccaagga atttcagaag ttgtatccct tggagaacat caccctggcc 480
cccgatcccg aggtccctga tggcctaccc cctgtggcct acaacccctg gatggacatc 540
aggcaacggg aagacgtcca agccttaaac atcagtgtgc cgtatggtcc aattcctgtg 600
gactttcagc ggaaaatccg ccagagctac tttgcctctg tgtcatattt ggatacacag 660
gtcggccgcc tcttgagtgc tttggacgat cttcagctgg ccaacagcac catcattgca 720
tttacctcgg atcatgggtg ggctctaggt gaacatggag aatgggccaa atacagcaat 780
tttgatgttg ctacccatgt tcccctgata ttctatgttc ctggaaggac ggcttcactt 840
ccggaggcag gcgagaagct tttcccttac ctcgaccctt ttgattccgc ctcacagttg 900
atggagccag gcaggcaatc catggacctt gtggaacttg tgtctctttt tcccacgctg 960
gctggacttg caggactgca ggttccacct cgctgccccg ttccttcatt tcacgttgag 1020
ctgtgcagag aaggcaagaa ccttctgaag cattttcgat tccgtgactt ggaagaggat 1080
ccgtacctcc ctggtaatcc ccgtgaactg attgcctata gccagtatcc ccggccttca 1140
gacatccctc agtggaattc tgacaagccg agtttaaaag atataaagat catgggctat 1200
tccatacgca ccatagacta taggtatact gtgtgggttg gcttcaatcc tgatgaattt 1260
ctagctaact tttctgacat ccatgcaggg gaactgtatt ttgtggattc tgacccattg 1320
caggatcaca atatgtataa tgattcccaa ggtggagatc ttttccagtt gttgatgcct 1380
tga 1383
<210> 4
<211> 460
<212> PRT
<213> 人类
<220>
<223> IDS多肽序列
<400> 4
Met Pro Leu Arg Arg Arg Pro Asp Thr Thr Arg Leu Tyr Asp Phe Asn
1 5 10 15
Ser Tyr Trp Arg Val His Ala Gly Asn Phe Ser Thr Ile Pro Gln Tyr
20 25 30
Phe Lys Glu Asn Gly Tyr Val Thr Met Ser Val Gly Lys Val Phe His
35 40 45
Pro Gly Ile Ser Ser Asn His Thr Asp Asp Ser Pro Tyr Ser Trp Ser
50 55 60
Phe Pro Pro Tyr His Pro Ser Ser Glu Lys Tyr Glu Asn Thr Lys Thr
65 70 75 80
Cys Arg Gly Pro Asp Gly Glu Leu His Ala Asn Leu Leu Cys Pro Val
85 90 95
Asp Val Leu Asp Val Pro Glu Gly Thr Leu Pro Asp Lys Gln Ser Thr
100 105 110
Glu Gln Ala Ile Gln Leu Leu Glu Lys Met Lys Thr Ser Ala Ser Pro
115 120 125
Phe Phe Leu Ala Val Gly Tyr His Lys Pro His Ile Pro Phe Arg Tyr
130 135 140
Pro Lys Glu Phe Gln Lys Leu Tyr Pro Leu Glu Asn Ile Thr Leu Ala
145 150 155 160
Pro Asp Pro Glu Val Pro Asp Gly Leu Pro Pro Val Ala Tyr Asn Pro
165 170 175
Trp Met Asp Ile Arg Gln Arg Glu Asp Val Gln Ala Leu Asn Ile Ser
180 185 190
Val Pro Tyr Gly Pro Ile Pro Val Asp Phe Gln Arg Lys Ile Arg Gln
195 200 205
Ser Tyr Phe Ala Ser Val Ser Tyr Leu Asp Thr Gln Val Gly Arg Leu
210 215 220
Leu Ser Ala Leu Asp Asp Leu Gln Leu Ala Asn Ser Thr Ile Ile Ala
225 230 235 240
Phe Thr Ser Asp His Gly Trp Ala Leu Gly Glu His Gly Glu Trp Ala
245 250 255
Lys Tyr Ser Asn Phe Asp Val Ala Thr His Val Pro Leu Ile Phe Tyr
260 265 270
Val Pro Gly Arg Thr Ala Ser Leu Pro Glu Ala Gly Glu Lys Leu Phe
275 280 285
Pro Tyr Leu Asp Pro Phe Asp Ser Ala Ser Gln Leu Met Glu Pro Gly
290 295 300
Arg Gln Ser Met Asp Leu Val Glu Leu Val Ser Leu Phe Pro Thr Leu
305 310 315 320
Ala Gly Leu Ala Gly Leu Gln Val Pro Pro Arg Cys Pro Val Pro Ser
325 330 335
Phe His Val Glu Leu Cys Arg Glu Gly Lys Asn Leu Leu Lys His Phe
340 345 350
Arg Phe Arg Asp Leu Glu Glu Asp Pro Tyr Leu Pro Gly Asn Pro Arg
355 360 365
Glu Leu Ile Ala Tyr Ser Gln Tyr Pro Arg Pro Ser Asp Ile Pro Gln
370 375 380
Trp Asn Ser Asp Lys Pro Ser Leu Lys Asp Ile Lys Ile Met Gly Tyr
385 390 395 400
Ser Ile Arg Thr Ile Asp Tyr Arg Tyr Thr Val Trp Val Gly Phe Asn
405 410 415
Pro Asp Glu Phe Leu Ala Asn Phe Ser Asp Ile His Ala Gly Glu Leu
420 425 430
Tyr Phe Val Asp Ser Asp Pro Leu Gln Asp His Asn Met Tyr Asn Asp
435 440 445
Ser Gln Gly Gly Asp Leu Phe Gln Leu Leu Met Pro
450 455 460
<210> 5
<211> 1956
<212> DNA
<213> 人类
<220>
<223> ARSB多核苷酸序列
<400> 5
atggcccggg ggtcggcggt tgcctgggcg gcgctcgggc cgttgttgtg gggctgcgcg 60
ctggggctgc agggcgggat gctgtacccc caggagagcc cgtcgcggga gtgcaaggag 120
ctggacggcc tctggagctt ccgcgccgac ttctctgaca accgacgccg gggcttcgag 180
gagcagtggt accggcggcc gctgtgggag tcaggcccca ccgtggacat gccagttccc 240
tccagcttca atgacatcag ccaggactgg cgtctgcggc attttgtcgg ctgggtgtgg 300
tacgaacggg aggtgatcct gccggagcga tggacccagg acctgcgcac aagagtggtg 360
ctgaggattg gcagtgccca ttcctatgcc atcgtgtggg tgaatggggt cgacacgcta 420
gagcatgagg ggggctacct ccccttcgag gccgacatca gcaacctggt ccaggtgggg 480
cccctgccct cccggctccg aatcactatc gccatcaaca acacactcac ccccaccacc 540
ctgccaccag ggaccatcca atacctgact gacacctcca agtatcccaa gggttacttt 600
gtccagaaca catattttga ctttttcaac tacgctggac tgcagcggtc tgtacttctg 660
tacacgacac ccaccaccta catcgatgac atcaccgtca ccaccagcgt ggagcaagac 720
agtgggctgg tgaattacca gatctctgtc aagggcagta acctgttcaa gttggaagtg 780
cgtcttttgg atgcagaaaa caaagtcgtg gcgaatggga ctgggaccca gggccaactt 840
aaggtgccag gtgtcagcct ctggtggccg tacctgatgc acgaacgccc tgcctatctg 900
tattcattgg aggtgcagct gactgcacag acgtcactgg ggcctgtgtc tgacttctac 960
acactccctg tggggatccg cactgtggct gtcaccaaga gccagttcct catcaatggg 1020
aaacctttct atttccacgg tgtcaacaag catgaggatg cggacatccg agggaagggc 1080
ttcgactggc cgctgctggt gaaggacttc aacctgcttc gctggcttgg tgccaacgct 1140
ttccgtacca gccactaccc ctatgcagag gaagtgatgc agatgtgtga ccgctatggg 1200
attgtggtca tcgatgagtg tcccggcgtg ggcctggcgc tgccgcagtt cttcaacaac 1260
gtttctctgc atcaccacat gcaggtgatg gaagaagtgg tgcgtaggga caagaaccac 1320
cccgcggtcg tgatgtggtc tgtggccaac gagcctgcgt cccacctaga atctgctggc 1380
tactacttga agatggtgat cgctcacacc aaatccttgg acccctcccg gcctgtgacc 1440
tttgtgagca actctaacta tgcagcagac aagggggctc cgtatgtgga tgtgatctgt 1500
ttgaacagct actactcttg gtatcacgac tacgggcacc tggagttgat tcagctgcag 1560
ctggccaccc agtttgagaa ctggtataag aagtatcaga agcccattat tcagagcgag 1620
tatggagcag aaacgattgc agggtttcac caggatccac ctctgatgtt cactgaagag 1680
taccagaaaa gtctgctaga gcagtaccat ctgggtctgg atcaaaaacg cagaaaatac 1740
gtggttggag agctcatttg gaattttgcc gatttcatga ctgaacagtc accgacgaga 1800
gtgctgggga ataaaaaggg gatcttcact cggcagagac aaccaaaaag tgcagcgttc 1860
cttttgcgag agagatactg gaagattgcc aatgaaacca ggtatcccca ctcagtagcc 1920
aagtcacaat gtttggaaaa cagcctgttt acttga 1956
<210> 6
<211> 533
<212> PRT
<213> 人类
<220>
<223> ARSB多肽序列
<400> 6
Met Gly Pro Arg Gly Ala Ala Ser Leu Pro Arg Gly Pro Gly Pro Arg
1 5 10 15
Arg Leu Leu Leu Pro Val Val Leu Pro Leu Leu Leu Leu Leu Leu Leu
20 25 30
Ala Pro Pro Gly Ser Gly Ala Gly Ala Ser Arg Pro Pro His Leu Val
35 40 45
Phe Leu Leu Ala Asp Asp Leu Gly Trp Asn Asp Val Gly Phe His Gly
50 55 60
Ser Arg Ile Arg Thr Pro His Leu Asp Ala Leu Ala Ala Gly Gly Val
65 70 75 80
Leu Leu Asp Asn Tyr Tyr Thr Gln Pro Leu Cys Thr Pro Ser Arg Ser
85 90 95
Gln Leu Leu Thr Gly Arg Tyr Gln Ile Arg Thr Gly Leu Gln His Gln
100 105 110
Ile Ile Trp Pro Cys Gln Pro Ser Cys Val Pro Leu Asp Glu Lys Leu
115 120 125
Leu Pro Gln Leu Leu Lys Glu Ala Gly Tyr Thr Thr His Met Val Gly
130 135 140
Lys Trp His Leu Gly Met Tyr Arg Lys Glu Cys Leu Pro Thr Arg Arg
145 150 155 160
Gly Phe Asp Thr Tyr Phe Gly Tyr Leu Leu Gly Ser Glu Asp Tyr Tyr
165 170 175
Ser His Glu Arg Cys Thr Leu Ile Asp Ala Leu Asn Val Thr Arg Cys
180 185 190
Ala Leu Asp Phe Arg Asp Gly Glu Glu Val Ala Thr Gly Tyr Lys Asn
195 200 205
Met Tyr Ser Thr Asn Ile Phe Thr Lys Arg Ala Ile Ala Leu Ile Thr
210 215 220
Asn His Pro Pro Glu Lys Pro Leu Phe Leu Tyr Leu Ala Leu Gln Ser
225 230 235 240
Val His Glu Pro Leu Gln Val Pro Glu Glu Tyr Leu Lys Pro Tyr Asp
245 250 255
Phe Ile Gln Asp Lys Asn Arg His His Tyr Ala Gly Met Val Ser Leu
260 265 270
Met Asp Glu Ala Val Gly Asn Val Thr Ala Ala Leu Lys Ser Ser Gly
275 280 285
Leu Trp Asn Asn Thr Val Phe Ile Phe Ser Thr Asp Asn Gly Gly Gln
290 295 300
Thr Leu Ala Gly Gly Asn Asn Trp Pro Leu Arg Gly Arg Lys Trp Ser
305 310 315 320
Leu Trp Glu Gly Gly Val Arg Gly Val Gly Phe Val Ala Ser Pro Leu
325 330 335
Leu Lys Gln Lys Gly Val Lys Asn Arg Glu Leu Ile His Ile Ser Asp
340 345 350
Trp Leu Pro Thr Leu Val Lys Leu Ala Arg Gly His Thr Asn Gly Thr
355 360 365
Lys Pro Leu Asp Gly Phe Asp Val Trp Lys Thr Ile Ser Glu Gly Ser
370 375 380
Pro Ser Pro Arg Ile Glu Leu Leu His Asn Ile Asp Pro Asn Phe Val
385 390 395 400
Asp Ser Ser Pro Cys Pro Arg Asn Ser Met Ala Pro Ala Lys Asp Asp
405 410 415
Ser Ser Leu Pro Glu Tyr Ser Ala Phe Asn Thr Ser Val His Ala Ala
420 425 430
Ile Arg His Gly Asn Trp Lys Leu Leu Thr Gly Tyr Pro Gly Cys Gly
435 440 445
Tyr Trp Phe Pro Pro Pro Ser Gln Tyr Asn Val Ser Glu Ile Pro Ser
450 455 460
Ser Asp Pro Pro Thr Lys Thr Leu Trp Leu Phe Asp Ile Asp Arg Asp
465 470 475 480
Pro Glu Glu Arg His Asp Leu Ser Arg Glu Tyr Pro His Ile Val Thr
485 490 495
Lys Leu Leu Ser Arg Leu Gln Phe Tyr His Lys His Ser Val Pro Val
500 505 510
Tyr Phe Pro Ala Gln Asp Pro Arg Cys Asp Pro Lys Ala Thr Gly Val
515 520 525
Trp Gly Pro Trp Met
530
<210> 7
<211> 1956
<212> DNA
<213> 人类
<220>
<223> GUSB多核苷酸序列
<400> 7
atggcccggg ggtcggcggt tgcctgggcg gcgctcgggc cgttgttgtg gggctgcgcg 60
ctggggctgc agggcgggat gctgtacccc caggagagcc cgtcgcggga gtgcaaggag 120
ctggacggcc tctggagctt ccgcgccgac ttctctgaca accgacgccg gggcttcgag 180
gagcagtggt accggcggcc gctgtgggag tcaggcccca ccgtggacat gccagttccc 240
tccagcttca atgacatcag ccaggactgg cgtctgcggc attttgtcgg ctgggtgtgg 300
tacgaacggg aggtgatcct gccggagcga tggacccagg acctgcgcac aagagtggtg 360
ctgaggattg gcagtgccca ttcctatgcc atcgtgtggg tgaatggggt cgacacgcta 420
gagcatgagg ggggctacct ccccttcgag gccgacatca gcaacctggt ccaggtgggg 480
cccctgccct cccggctccg aatcactatc gccatcaaca acacactcac ccccaccacc 540
ctgccaccag ggaccatcca atacctgact gacacctcca agtatcccaa gggttacttt 600
gtccagaaca catattttga ctttttcaac tacgctggac tgcagcggtc tgtacttctg 660
tacacgacac ccaccaccta catcgatgac atcaccgtca ccaccagcgt ggagcaagac 720
agtgggctgg tgaattacca gatctctgtc aagggcagta acctgttcaa gttggaagtg 780
cgtcttttgg atgcagaaaa caaagtcgtg gcgaatggga ctgggaccca gggccaactt 840
aaggtgccag gtgtcagcct ctggtggccg tacctgatgc acgaacgccc tgcctatctg 900
tattcattgg aggtgcagct gactgcacag acgtcactgg ggcctgtgtc tgacttctac 960
acactccctg tggggatccg cactgtggct gtcaccaaga gccagttcct catcaatggg 1020
aaacctttct atttccacgg tgtcaacaag catgaggatg cggacatccg agggaagggc 1080
ttcgactggc cgctgctggt gaaggacttc aacctgcttc gctggcttgg tgccaacgct 1140
ttccgtacca gccactaccc ctatgcagag gaagtgatgc agatgtgtga ccgctatggg 1200
attgtggtca tcgatgagtg tcccggcgtg ggcctggcgc tgccgcagtt cttcaacaac 1260
gtttctctgc atcaccacat gcaggtgatg gaagaagtgg tgcgtaggga caagaaccac 1320
cccgcggtcg tgatgtggtc tgtggccaac gagcctgcgt cccacctaga atctgctggc 1380
tactacttga agatggtgat cgctcacacc aaatccttgg acccctcccg gcctgtgacc 1440
tttgtgagca actctaacta tgcagcagac aagggggctc cgtatgtgga tgtgatctgt 1500
ttgaacagct actactcttg gtatcacgac tacgggcacc tggagttgat tcagctgcag 1560
ctggccaccc agtttgagaa ctggtataag aagtatcaga agcccattat tcagagcgag 1620
tatggagcag aaacgattgc agggtttcac caggatccac ctctgatgtt cactgaagag 1680
taccagaaaa gtctgctaga gcagtaccat ctgggtctgg atcaaaaacg cagaaaatac 1740
gtggttggag agctcatttg gaattttgcc gatttcatga ctgaacagtc accgacgaga 1800
gtgctgggga ataaaaaggg gatcttcact cggcagagac aaccaaaaag tgcagcgttc 1860
cttttgcgag agagatactg gaagattgcc aatgaaacca ggtatcccca ctcagtagcc 1920
aagtcacaat gtttggaaaa cagcctgttt acttga 1956
<210> 8
<211> 651
<212> PRT
<213> 人类
<220>
<223> GUSB多肽序列
<400> 8
Met Ala Arg Gly Ser Ala Val Ala Trp Ala Ala Leu Gly Pro Leu Leu
1 5 10 15
Trp Gly Cys Ala Leu Gly Leu Gln Gly Gly Met Leu Tyr Pro Gln Glu
20 25 30
Ser Pro Ser Arg Glu Cys Lys Glu Leu Asp Gly Leu Trp Ser Phe Arg
35 40 45
Ala Asp Phe Ser Asp Asn Arg Arg Arg Gly Phe Glu Glu Gln Trp Tyr
50 55 60
Arg Arg Pro Leu Trp Glu Ser Gly Pro Thr Val Asp Met Pro Val Pro
65 70 75 80
Ser Ser Phe Asn Asp Ile Ser Gln Asp Trp Arg Leu Arg His Phe Val
85 90 95
Gly Trp Val Trp Tyr Glu Arg Glu Val Ile Leu Pro Glu Arg Trp Thr
100 105 110
Gln Asp Leu Arg Thr Arg Val Val Leu Arg Ile Gly Ser Ala His Ser
115 120 125
Tyr Ala Ile Val Trp Val Asn Gly Val Asp Thr Leu Glu His Glu Gly
130 135 140
Gly Tyr Leu Pro Phe Glu Ala Asp Ile Ser Asn Leu Val Gln Val Gly
145 150 155 160
Pro Leu Pro Ser Arg Leu Arg Ile Thr Ile Ala Ile Asn Asn Thr Leu
165 170 175
Thr Pro Thr Thr Leu Pro Pro Gly Thr Ile Gln Tyr Leu Thr Asp Thr
180 185 190
Ser Lys Tyr Pro Lys Gly Tyr Phe Val Gln Asn Thr Tyr Phe Asp Phe
195 200 205
Phe Asn Tyr Ala Gly Leu Gln Arg Ser Val Leu Leu Tyr Thr Thr Pro
210 215 220
Thr Thr Tyr Ile Asp Asp Ile Thr Val Thr Thr Ser Val Glu Gln Asp
225 230 235 240
Ser Gly Leu Val Asn Tyr Gln Ile Ser Val Lys Gly Ser Asn Leu Phe
245 250 255
Lys Leu Glu Val Arg Leu Leu Asp Ala Glu Asn Lys Val Val Ala Asn
260 265 270
Gly Thr Gly Thr Gln Gly Gln Leu Lys Val Pro Gly Val Ser Leu Trp
275 280 285
Trp Pro Tyr Leu Met His Glu Arg Pro Ala Tyr Leu Tyr Ser Leu Glu
290 295 300
Val Gln Leu Thr Ala Gln Thr Ser Leu Gly Pro Val Ser Asp Phe Tyr
305 310 315 320
Thr Leu Pro Val Gly Ile Arg Thr Val Ala Val Thr Lys Ser Gln Phe
325 330 335
Leu Ile Asn Gly Lys Pro Phe Tyr Phe His Gly Val Asn Lys His Glu
340 345 350
Asp Ala Asp Ile Arg Gly Lys Gly Phe Asp Trp Pro Leu Leu Val Lys
355 360 365
Asp Phe Asn Leu Leu Arg Trp Leu Gly Ala Asn Ala Phe Arg Thr Ser
370 375 380
His Tyr Pro Tyr Ala Glu Glu Val Met Gln Met Cys Asp Arg Tyr Gly
385 390 395 400
Ile Val Val Ile Asp Glu Cys Pro Gly Val Gly Leu Ala Leu Pro Gln
405 410 415
Phe Phe Asn Asn Val Ser Leu His His His Met Gln Val Met Glu Glu
420 425 430
Val Val Arg Arg Asp Lys Asn His Pro Ala Val Val Met Trp Ser Val
435 440 445
Ala Asn Glu Pro Ala Ser His Leu Glu Ser Ala Gly Tyr Tyr Leu Lys
450 455 460
Met Val Ile Ala His Thr Lys Ser Leu Asp Pro Ser Arg Pro Val Thr
465 470 475 480
Phe Val Ser Asn Ser Asn Tyr Ala Ala Asp Lys Gly Ala Pro Tyr Val
485 490 495
Asp Val Ile Cys Leu Asn Ser Tyr Tyr Ser Trp Tyr His Asp Tyr Gly
500 505 510
His Leu Glu Leu Ile Gln Leu Gln Leu Ala Thr Gln Phe Glu Asn Trp
515 520 525
Tyr Lys Lys Tyr Gln Lys Pro Ile Ile Gln Ser Glu Tyr Gly Ala Glu
530 535 540
Thr Ile Ala Gly Phe His Gln Asp Pro Pro Leu Met Phe Thr Glu Glu
545 550 555 560
Tyr Gln Lys Ser Leu Leu Glu Gln Tyr His Leu Gly Leu Asp Gln Lys
565 570 575
Arg Arg Lys Tyr Val Val Gly Glu Leu Ile Trp Asn Phe Ala Asp Phe
580 585 590
Met Thr Glu Gln Ser Pro Thr Arg Val Leu Gly Asn Lys Lys Gly Ile
595 600 605
Phe Thr Arg Gln Arg Gln Pro Lys Ser Ala Ala Phe Leu Leu Arg Glu
610 615 620
Arg Tyr Trp Lys Ile Ala Asn Glu Thr Arg Tyr Pro His Ser Val Ala
625 630 635 640
Lys Ser Gln Cys Leu Glu Asn Ser Leu Phe Thr
645 650
<210> 9
<211> 2238
<212> DNA
<213> 人类
<220>
<223> ABCD1多核苷酸序列
<400> 9
atgccggtgc tctccaggcc ccggccctgg cgggggaaca cgctgaagcg cacggccgtg 60
ctcctggccc tcgcggccta tggagcccac aaagtctacc ccttggtgcg ccagtgcctg 120
gccccggcca ggggtcttca ggcgcccgcc ggggagccca cgcaggaggc ctccggggtc 180
gcggcggcca aagctggcat gaaccgggta ttcctgcagc ggctcctgtg gctcctgcgg 240
ctgctgttcc cccgggtcct gtgccgggag acggggctgc tggccctgca ctcggccgcc 300
ttggtgagcc gcaccttcct gtcggtgtat gtggcccgcc tggacggaag gctggcccgc 360
tgcatcgtcc gcaaggaccc gcgggctttt ggctggcagc tgctgcagtg gctcctcatc 420
gccctccctg ctaccttcgt caacagtgcc atccgttacc tggagggcca actggccctg 480
tcgttccgca gccgtctggt ggcccacgcc taccgcctct acttctccca gcagacctac 540
taccgggtca gcaacatgga cgggcggctt cgcaaccctg accagtctct gacggaggac 600
gtggtggcct ttgcggcctc tgtggcccac ctctactcca acctgaccaa gccactcctg 660
gacgtggctg tgacttccta caccctgctt cgggcggccc gctcccgtgg agccggcaca 720
gcctggccct cggccatcgc cggcctcgtg gtgttcctca cggccaacgt gctgcgggcc 780
ttctcgccca agttcgggga gctggtggca gaggaggcgc ggcggaaggg ggagctgcgc 840
tacatgcact cgcgtgtggt ggccaactcg gaggagatcg ccttctatgg gggccatgag 900
gtggagctgg ccctgctaca gcgctcctac caggacctgg cctcgcagat caacctcatc 960
cttctggaac gcctgtggta tgttatgctg gagcagttcc tcatgaagta tgtgtggagc 1020
gcctcgggcc tgctcatggt ggctgtcccc atcatcactg ccactggcta ctcagagtca 1080
gatgcagagg ccgtgaagaa ggcagccttg gaaaagaagg aggaggagct ggtgagcgag 1140
cgcacagaag ccttcactat tgcccgcaac ctcctgacag cggctgcaga tgccattgag 1200
cggatcatgt cgtcgtacaa ggaggtgacg gagctggctg gctacacagc ccgggtgcac 1260
gagatgttcc aggtatttga agatgttcag cgctgtcact tcaagaggcc cagggagcta 1320
gaggacgctc aggcggggtc tgggaccata ggccggtctg gtgtccgtgt ggagggcccc 1380
ctgaagatcc gaggccaggt ggtggatgtg gaacagggga tcatctgcga gaacatcccc 1440
atcgtcacgc cctcaggaga ggtggtggtg gccagcctca acatcagggt ggaggaaggc 1500
atgcatctgc tcatcacagg ccccaatggc tgcggcaaga gctccctgtt ccggatcctg 1560
ggtgggctct ggcccacgta cggtggtgtg ctctacaagc ccccacccca gcgcatgttc 1620
tacatcccgc agaggcccta catgtctgtg ggctccctgc gtgaccaggt gatctacccg 1680
gactcagtgg aggacatgca aaggaagggc tactcggagc aggacctgga agccatcctg 1740
gacgtcgtgc acctgcacca catcctgcag cgggagggag gttgggaggc tatgtgtgac 1800
tggaaggacg tcctgtcggg tggcgagaag cagagaatcg gcatggcccg catgttctac 1860
cacaggccca agtacgccct cctggatgaa tgcaccagcg ccgtgagcat cgacgtggaa 1920
ggcaagatct tccaggcggc caaggacgcg ggcattgccc tgctctccat cacccaccgg 1980
ccctccctgt ggaaatacca cacacacttg ctacagttcg atggggaggg cggctggaag 2040
ttcgagaagc tggactcagc tgcccgcctg agcctgacgg aggagaagca gcggctggag 2100
cagcagctgg cgggcattcc caagatgcag cggcgcctcc aggagctctg ccagatcctg 2160
ggcgaggccg tggccccagc gcatgtgccg gcacctagcc cgcaaggccc tggtggcctc 2220
cagggtgcct ccacctga 2238
<210> 10
<211> 745
<212> PRT
<213> 人类
<220>
<223> ABCD1多肽序列
<400> 10
Met Pro Val Leu Ser Arg Pro Arg Pro Trp Arg Gly Asn Thr Leu Lys
1 5 10 15
Arg Thr Ala Val Leu Leu Ala Leu Ala Ala Tyr Gly Ala His Lys Val
20 25 30
Tyr Pro Leu Val Arg Gln Cys Leu Ala Pro Ala Arg Gly Leu Gln Ala
35 40 45
Pro Ala Gly Glu Pro Thr Gln Glu Ala Ser Gly Val Ala Ala Ala Lys
50 55 60
Ala Gly Met Asn Arg Val Phe Leu Gln Arg Leu Leu Trp Leu Leu Arg
65 70 75 80
Leu Leu Phe Pro Arg Val Leu Cys Arg Glu Thr Gly Leu Leu Ala Leu
85 90 95
His Ser Ala Ala Leu Val Ser Arg Thr Phe Leu Ser Val Tyr Val Ala
100 105 110
Arg Leu Asp Gly Arg Leu Ala Arg Cys Ile Val Arg Lys Asp Pro Arg
115 120 125
Ala Phe Gly Trp Gln Leu Leu Gln Trp Leu Leu Ile Ala Leu Pro Ala
130 135 140
Thr Phe Val Asn Ser Ala Ile Arg Tyr Leu Glu Gly Gln Leu Ala Leu
145 150 155 160
Ser Phe Arg Ser Arg Leu Val Ala His Ala Tyr Arg Leu Tyr Phe Ser
165 170 175
Gln Gln Thr Tyr Tyr Arg Val Ser Asn Met Asp Gly Arg Leu Arg Asn
180 185 190
Pro Asp Gln Ser Leu Thr Glu Asp Val Val Ala Phe Ala Ala Ser Val
195 200 205
Ala His Leu Tyr Ser Asn Leu Thr Lys Pro Leu Leu Asp Val Ala Val
210 215 220
Thr Ser Tyr Thr Leu Leu Arg Ala Ala Arg Ser Arg Gly Ala Gly Thr
225 230 235 240
Ala Trp Pro Ser Ala Ile Ala Gly Leu Val Val Phe Leu Thr Ala Asn
245 250 255
Val Leu Arg Ala Phe Ser Pro Lys Phe Gly Glu Leu Val Ala Glu Glu
260 265 270
Ala Arg Arg Lys Gly Glu Leu Arg Tyr Met His Ser Arg Val Val Ala
275 280 285
Asn Ser Glu Glu Ile Ala Phe Tyr Gly Gly His Glu Val Glu Leu Ala
290 295 300
Leu Leu Gln Arg Ser Tyr Gln Asp Leu Ala Ser Gln Ile Asn Leu Ile
305 310 315 320
Leu Leu Glu Arg Leu Trp Tyr Val Met Leu Glu Gln Phe Leu Met Lys
325 330 335
Tyr Val Trp Ser Ala Ser Gly Leu Leu Met Val Ala Val Pro Ile Ile
340 345 350
Thr Ala Thr Gly Tyr Ser Glu Ser Asp Ala Glu Ala Val Lys Lys Ala
355 360 365
Ala Leu Glu Lys Lys Glu Glu Glu Leu Val Ser Glu Arg Thr Glu Ala
370 375 380
Phe Thr Ile Ala Arg Asn Leu Leu Thr Ala Ala Ala Asp Ala Ile Glu
385 390 395 400
Arg Ile Met Ser Ser Tyr Lys Glu Val Thr Glu Leu Ala Gly Tyr Thr
405 410 415
Ala Arg Val His Glu Met Phe Gln Val Phe Glu Asp Val Gln Arg Cys
420 425 430
His Phe Lys Arg Pro Arg Glu Leu Glu Asp Ala Gln Ala Gly Ser Gly
435 440 445
Thr Ile Gly Arg Ser Gly Val Arg Val Glu Gly Pro Leu Lys Ile Arg
450 455 460
Gly Gln Val Val Asp Val Glu Gln Gly Ile Ile Cys Glu Asn Ile Pro
465 470 475 480
Ile Val Thr Pro Ser Gly Glu Val Val Val Ala Ser Leu Asn Ile Arg
485 490 495
Val Glu Glu Gly Met His Leu Leu Ile Thr Gly Pro Asn Gly Cys Gly
500 505 510
Lys Ser Ser Leu Phe Arg Ile Leu Gly Gly Leu Trp Pro Thr Tyr Gly
515 520 525
Gly Val Leu Tyr Lys Pro Pro Pro Gln Arg Met Phe Tyr Ile Pro Gln
530 535 540
Arg Pro Tyr Met Ser Val Gly Ser Leu Arg Asp Gln Val Ile Tyr Pro
545 550 555 560
Asp Ser Val Glu Asp Met Gln Arg Lys Gly Tyr Ser Glu Gln Asp Leu
565 570 575
Glu Ala Ile Leu Asp Val Val His Leu His His Ile Leu Gln Arg Glu
580 585 590
Gly Gly Trp Glu Ala Met Cys Asp Trp Lys Asp Val Leu Ser Gly Gly
595 600 605
Glu Lys Gln Arg Ile Gly Met Ala Arg Met Phe Tyr His Arg Pro Lys
610 615 620
Tyr Ala Leu Leu Asp Glu Cys Thr Ser Ala Val Ser Ile Asp Val Glu
625 630 635 640
Gly Lys Ile Phe Gln Ala Ala Lys Asp Ala Gly Ile Ala Leu Leu Ser
645 650 655
Ile Thr His Arg Pro Ser Leu Trp Lys Tyr His Thr His Leu Leu Gln
660 665 670
Phe Asp Gly Glu Gly Gly Trp Lys Phe Glu Lys Leu Asp Ser Ala Ala
675 680 685
Arg Leu Ser Leu Thr Glu Glu Lys Gln Arg Leu Glu Gln Gln Leu Ala
690 695 700
Gly Ile Pro Lys Met Gln Arg Arg Leu Gln Glu Leu Cys Gln Ile Leu
705 710 715 720
Gly Glu Ala Val Ala Pro Ala His Val Pro Ala Pro Ser Pro Gln Gly
725 730 735
Pro Gly Gly Leu Gln Gly Ala Ser Thr
740 745
<210> 11
<211> 2058
<212> DNA
<213> 人类
<220>
<223> GALC多核苷酸序列
<400> 11
atggctgagt ggctactctc ggcttcctgg caacgccgag cgaaagctat gactgcggcc 60
gcgggttcgg cgggccgcgc cgcggtgccc ttgctgctgt gtgcgctgct ggcgcccggc 120
ggcgcgtacg tgctcgacga ctccgacggg ctgggccggg agttcgacgg catcggcgcg 180
gtcagcggcg gcggggcaac ctcccgactt ctagtaaatt acccagagcc ctatcgttct 240
cagatattgg attatctctt taagccgaat tttggtgcct ctttgcatat tttaaaagtg 300
gaaataggtg gtgatgggca gacaacagac ggcactgagc cctcccacat gcattatgca 360
ctagatgaga attatttccg aggatacgag tggtggttga tgaaagaagc taagaagagg 420
aatcccaata ttacactcat tgggttgcca tggtcattcc ctggatggct gggaaaaggt 480
ttcgactggc cttatgtcaa tcttcagctg actgcctatt atgtcgtgac ctggattgtg 540
ggcgccaagc gttaccatga tttggacatt gattatattg gaatttggaa tgagaggtca 600
tataatgcca attatattaa gatattaaga aaaatgctga attatcaagg tctccagcga 660
gtgaaaatca tagcaagtga taatctctgg gagtccatct ctgcatccat gctccttgat 720
gccgaactct tcaaggtggt tgatgttata ggggctcatt atcctggaac ccattcagca 780
aaagatgcaa agttgactgg gaagaagctt tggtcttctg aagactttag cactttaaat 840
agtgacatgg gtgcaggctg ctggggtcgc attttaaatc agaattatat caatggctat 900
atgacttcca caatcgcatg gaatttagtg gctagttact atgaacagtt gccttatggg 960
agatgcgggt tgatgacggc ccaggagcca tggagtgggc actacgtggt agaatctcct 1020
gtctgggtat cagctcatac cactcagttt actcaacctg gctggtatta cctgaagaca 1080
gttggccatt tagagaaagg aggaagctac gtagctctga ctgatggctt agggaacctc 1140
accatcatca ttgaaaccat gagtcataaa cattctaagt gcatacggcc atttcttcct 1200
tatttcaatg tgtcacaaca atttgccacc tttgttctta agggatcttt tagtgaaata 1260
ccagagctac aggtatggta taccaaactt ggaaaaacat ccgaaagatt tctttttaag 1320
cagctggatt ctctatggct ccttgacagc gatggcagtt tcacactgag cctgcatgaa 1380
gatgagctgt tcacactcac cactctcacc actggtcgca aaggcagcta cccgcttcct 1440
ccaaaatccc agcccttccc aagtacctat aaggatgatt tcaatgttga ttacccattt 1500
tttagtgaag ctccaaactt tgctgatcaa actggtgtat ttgaatattt tacaaatatt 1560
gaagaccctg gcgagcatca cttcacgcta cgccaagttc tcaaccagag acccattaca 1620
tgggctgccg atgcatccaa cacaatcagt attataggag actacaactg gaccaatctg 1680
actataaagt gtgatgtata catagagacc cctgacacag gaggtgtgtt cattgcagga 1740
agagtaaata aaggtggtat tttgattaga agtgccagag gaattttctt ctggattttt 1800
gcaaatggat cttacagggt tacaggtgat ttagctggat ggattatata tgctttagga 1860
cgtgttgaag ttacagcaaa aaaatggtat acactcacgt taactattaa gggtcatttc 1920
acctctggca tgctgaatga caagtctctg tggacagaca tccctgtgaa ttttccaaag 1980
aatggctggg ctgcaattgg aactcactcc tttgaatttg cacagtttga caactttctt 2040
gtggaagcca cacgctaa 2058
<210> 12
<211> 685
<212> PRT
<213> 人类
<220>
<223> GALC 多肽序列
<400> 12
Met Ala Glu Trp Leu Leu Ser Ala Ser Trp Gln Arg Arg Ala Lys Ala
1 5 10 15
Met Thr Ala Ala Ala Gly Ser Ala Gly Arg Ala Ala Val Pro Leu Leu
20 25 30
Leu Cys Ala Leu Leu Ala Pro Gly Gly Ala Tyr Val Leu Asp Asp Ser
35 40 45
Asp Gly Leu Gly Arg Glu Phe Asp Gly Ile Gly Ala Val Ser Gly Gly
50 55 60
Gly Ala Thr Ser Arg Leu Leu Val Asn Tyr Pro Glu Pro Tyr Arg Ser
65 70 75 80
Gln Ile Leu Asp Tyr Leu Phe Lys Pro Asn Phe Gly Ala Ser Leu His
85 90 95
Ile Leu Lys Val Glu Ile Gly Gly Asp Gly Gln Thr Thr Asp Gly Thr
100 105 110
Glu Pro Ser His Met His Tyr Ala Leu Asp Glu Asn Tyr Phe Arg Gly
115 120 125
Tyr Glu Trp Trp Leu Met Lys Glu Ala Lys Lys Arg Asn Pro Asn Ile
130 135 140
Thr Leu Ile Gly Leu Pro Trp Ser Phe Pro Gly Trp Leu Gly Lys Gly
145 150 155 160
Phe Asp Trp Pro Tyr Val Asn Leu Gln Leu Thr Ala Tyr Tyr Val Val
165 170 175
Thr Trp Ile Val Gly Ala Lys Arg Tyr His Asp Leu Asp Ile Asp Tyr
180 185 190
Ile Gly Ile Trp Asn Glu Arg Ser Tyr Asn Ala Asn Tyr Ile Lys Ile
195 200 205
Leu Arg Lys Met Leu Asn Tyr Gln Gly Leu Gln Arg Val Lys Ile Ile
210 215 220
Ala Ser Asp Asn Leu Trp Glu Ser Ile Ser Ala Ser Met Leu Leu Asp
225 230 235 240
Ala Glu Leu Phe Lys Val Val Asp Val Ile Gly Ala His Tyr Pro Gly
245 250 255
Thr His Ser Ala Lys Asp Ala Lys Leu Thr Gly Lys Lys Leu Trp Ser
260 265 270
Ser Glu Asp Phe Ser Thr Leu Asn Ser Asp Met Gly Ala Gly Cys Trp
275 280 285
Gly Arg Ile Leu Asn Gln Asn Tyr Ile Asn Gly Tyr Met Thr Ser Thr
290 295 300
Ile Ala Trp Asn Leu Val Ala Ser Tyr Tyr Glu Gln Leu Pro Tyr Gly
305 310 315 320
Arg Cys Gly Leu Met Thr Ala Gln Glu Pro Trp Ser Gly His Tyr Val
325 330 335
Val Glu Ser Pro Val Trp Val Ser Ala His Thr Thr Gln Phe Thr Gln
340 345 350
Pro Gly Trp Tyr Tyr Leu Lys Thr Val Gly His Leu Glu Lys Gly Gly
355 360 365
Ser Tyr Val Ala Leu Thr Asp Gly Leu Gly Asn Leu Thr Ile Ile Ile
370 375 380
Glu Thr Met Ser His Lys His Ser Lys Cys Ile Arg Pro Phe Leu Pro
385 390 395 400
Tyr Phe Asn Val Ser Gln Gln Phe Ala Thr Phe Val Leu Lys Gly Ser
405 410 415
Phe Ser Glu Ile Pro Glu Leu Gln Val Trp Tyr Thr Lys Leu Gly Lys
420 425 430
Thr Ser Glu Arg Phe Leu Phe Lys Gln Leu Asp Ser Leu Trp Leu Leu
435 440 445
Asp Ser Asp Gly Ser Phe Thr Leu Ser Leu His Glu Asp Glu Leu Phe
450 455 460
Thr Leu Thr Thr Leu Thr Thr Gly Arg Lys Gly Ser Tyr Pro Leu Pro
465 470 475 480
Pro Lys Ser Gln Pro Phe Pro Ser Thr Tyr Lys Asp Asp Phe Asn Val
485 490 495
Asp Tyr Pro Phe Phe Ser Glu Ala Pro Asn Phe Ala Asp Gln Thr Gly
500 505 510
Val Phe Glu Tyr Phe Thr Asn Ile Glu Asp Pro Gly Glu His His Phe
515 520 525
Thr Leu Arg Gln Val Leu Asn Gln Arg Pro Ile Thr Trp Ala Ala Asp
530 535 540
Ala Ser Asn Thr Ile Ser Ile Ile Gly Asp Tyr Asn Trp Thr Asn Leu
545 550 555 560
Thr Ile Lys Cys Asp Val Tyr Ile Glu Thr Pro Asp Thr Gly Gly Val
565 570 575
Phe Ile Ala Gly Arg Val Asn Lys Gly Gly Ile Leu Ile Arg Ser Ala
580 585 590
Arg Gly Ile Phe Phe Trp Ile Phe Ala Asn Gly Ser Tyr Arg Val Thr
595 600 605
Gly Asp Leu Ala Gly Trp Ile Ile Tyr Ala Leu Gly Arg Val Glu Val
610 615 620
Thr Ala Lys Lys Trp Tyr Thr Leu Thr Leu Thr Ile Lys Gly His Phe
625 630 635 640
Thr Ser Gly Met Leu Asn Asp Lys Ser Leu Trp Thr Asp Ile Pro Val
645 650 655
Asn Phe Pro Lys Asn Gly Trp Ala Ala Ile Gly Thr His Ser Phe Glu
660 665 670
Phe Ala Gln Phe Asp Asn Phe Leu Val Glu Ala Thr Arg
675 680 685
<210> 13
<211> 1530
<212> DNA
<213> 人类
<220>
<223> ARSA多核苷酸序列
<400> 13
atgtccatgg gggcaccgcg gtccctcctc ctggccctgg ctgctggcct ggccgttgcc 60
cgtccgccca acatcgtgct gatctttgcc gacgacctcg gctatgggga cctgggctgc 120
tatgggcacc ccagctctac cactcccaac ctggaccagc tggcggcggg agggctgcgg 180
ttcacagact tctacgtgcc tgtgtctctg tgcacaccct ctagggccgc cctcctgacc 240
ggccggctcc cggttcggat gggcatgtac cctggcgtcc tggtgcccag ctcccggggg 300
ggcctgcccc tggaggaggt gaccgtggcc gaagtcctgg ctgcccgagg ctacctcaca 360
ggaatggccg gcaagtggca ccttggggtg gggcctgagg gggccttcct gcccccccat 420
cagggcttcc atcgatttct aggcatcccg tactcccacg accagggccc ctgccagaac 480
ctgacctgct tcccgccggc cactccttgc gacggtggct gtgaccaggg cctggtcccc 540
atcccactgt tggccaacct gtccgtggag gcgcagcccc cctggctgcc cggactagag 600
gcccgctaca tggctttcgc ccatgacctc atggccgacg cccagcgcca ggatcgcccc 660
ttcttcctgt actatgcctc tcaccacacc cactaccctc agttcagtgg gcagagcttt 720
gcagagcgtt caggccgcgg gccatttggg gactccctga tggagctgga tgcagctgtg 780
gggaccctga tgacagccat aggggacctg gggctgcttg aagagacgct ggtcatcttc 840
actgcagaca atggacctga gaccatgcgt atgtcccgag gcggctgctc cggtctcttg 900
cggtgtggaa agggaacgac ctacgagggc ggtgtccgag agcctgcctt ggccttctgg 960
ccaggtcata tcgctcccgg cgtgacccac gagctggcca gctccctgga cctgctgcct 1020
accctggcag ccctggctgg ggccccactg cccaatgtca ccttggatgg ctttgacctc 1080
agccccctgc tgctgggcac aggcaagagc cctcggcagt ctctcttctt ctacccgtcc 1140
tacccagacg aggtccgtgg ggtttttgct gtgcggactg gaaagtacaa ggctcacttc 1200
ttcacccagg gctctgccca cagtgatacc actgcagacc ctgcctgcca cgcctccagc 1260
tctctgactg ctcatgagcc cccgctgctc tatgacctgt ccaaggaccc tggtgagaac 1320
tacaacctgc tggggggtgt ggccggggcc accccagagg tgctgcaagc cctgaaacag 1380
cttcagctgc tcaaggccca gttagacgca gctgtgacct tcggccccag ccaggtggcc 1440
cggggcgagg accccgccct gcagatctgc tgtcatcctg gctgcacccc ccgcccagct 1500
tgctgccatt gcccagatcc ccatgcctga 1530
<210> 14
<211> 509
<212> PRT
<213> 人类
<220>
<223> ARSA 多肽序列
<400> 14
Met Ser Met Gly Ala Pro Arg Ser Leu Leu Leu Ala Leu Ala Ala Gly
1 5 10 15
Leu Ala Val Ala Arg Pro Pro Asn Ile Val Leu Ile Phe Ala Asp Asp
20 25 30
Leu Gly Tyr Gly Asp Leu Gly Cys Tyr Gly His Pro Ser Ser Thr Thr
35 40 45
Pro Asn Leu Asp Gln Leu Ala Ala Gly Gly Leu Arg Phe Thr Asp Phe
50 55 60
Tyr Val Pro Val Ser Leu Cys Thr Pro Ser Arg Ala Ala Leu Leu Thr
65 70 75 80
Gly Arg Leu Pro Val Arg Met Gly Met Tyr Pro Gly Val Leu Val Pro
85 90 95
Ser Ser Arg Gly Gly Leu Pro Leu Glu Glu Val Thr Val Ala Glu Val
100 105 110
Leu Ala Ala Arg Gly Tyr Leu Thr Gly Met Ala Gly Lys Trp His Leu
115 120 125
Gly Val Gly Pro Glu Gly Ala Phe Leu Pro Pro His Gln Gly Phe His
130 135 140
Arg Phe Leu Gly Ile Pro Tyr Ser His Asp Gln Gly Pro Cys Gln Asn
145 150 155 160
Leu Thr Cys Phe Pro Pro Ala Thr Pro Cys Asp Gly Gly Cys Asp Gln
165 170 175
Gly Leu Val Pro Ile Pro Leu Leu Ala Asn Leu Ser Val Glu Ala Gln
180 185 190
Pro Pro Trp Leu Pro Gly Leu Glu Ala Arg Tyr Met Ala Phe Ala His
195 200 205
Asp Leu Met Ala Asp Ala Gln Arg Gln Asp Arg Pro Phe Phe Leu Tyr
210 215 220
Tyr Ala Ser His His Thr His Tyr Pro Gln Phe Ser Gly Gln Ser Phe
225 230 235 240
Ala Glu Arg Ser Gly Arg Gly Pro Phe Gly Asp Ser Leu Met Glu Leu
245 250 255
Asp Ala Ala Val Gly Thr Leu Met Thr Ala Ile Gly Asp Leu Gly Leu
260 265 270
Leu Glu Glu Thr Leu Val Ile Phe Thr Ala Asp Asn Gly Pro Glu Thr
275 280 285
Met Arg Met Ser Arg Gly Gly Cys Ser Gly Leu Leu Arg Cys Gly Lys
290 295 300
Gly Thr Thr Tyr Glu Gly Gly Val Arg Glu Pro Ala Leu Ala Phe Trp
305 310 315 320
Pro Gly His Ile Ala Pro Gly Val Thr His Glu Leu Ala Ser Ser Leu
325 330 335
Asp Leu Leu Pro Thr Leu Ala Ala Leu Ala Gly Ala Pro Leu Pro Asn
340 345 350
Val Thr Leu Asp Gly Phe Asp Leu Ser Pro Leu Leu Leu Gly Thr Gly
355 360 365
Lys Ser Pro Arg Gln Ser Leu Phe Phe Tyr Pro Ser Tyr Pro Asp Glu
370 375 380
Val Arg Gly Val Phe Ala Val Arg Thr Gly Lys Tyr Lys Ala His Phe
385 390 395 400
Phe Thr Gln Gly Ser Ala His Ser Asp Thr Thr Ala Asp Pro Ala Cys
405 410 415
His Ala Ser Ser Ser Leu Thr Ala His Glu Pro Pro Leu Leu Tyr Asp
420 425 430
Leu Ser Lys Asp Pro Gly Glu Asn Tyr Asn Leu Leu Gly Gly Val Ala
435 440 445
Gly Ala Thr Pro Glu Val Leu Gln Ala Leu Lys Gln Leu Gln Leu Leu
450 455 460
Lys Ala Gln Leu Asp Ala Ala Val Thr Phe Gly Pro Ser Gln Val Ala
465 470 475 480
Arg Gly Glu Asp Pro Ala Leu Gln Ile Cys Cys His Pro Gly Cys Thr
485 490 495
Pro Arg Pro Ala Cys Cys His Cys Pro Asp Pro His Ala
500 505
<210> 15
<211> 1584
<212> DNA
<213> 人类
<220>
<223> PSAP多核苷酸序列
<400> 15
atgtacgccc tcttcctcct ggccagcctc ctgggcgcgg ctctagccgg cccggtcctt 60
ggactgaaag aatgcaccag gggctcggca gtgtggtgcc agaatgtgaa gacggcgtcc 120
gactgcgggg cagtgaagca ctgcctgcag accgtttgga acaagccaac agtgaaatcc 180
cttccctgcg acatatgcaa agacgttgtc accgcagctg gtgatatgct gaaggacaat 240
gccactgagg aggagatcct tgtttacttg gagaagacct gtgactggct tccgaaaccg 300
aacatgtctg cttcatgcaa ggagatagtg gactcctacc tccctgtcat cctggacatc 360
attaaaggag aaatgagccg tcctggggag gtgtgctctg ctctcaacct ctgcgagtct 420
ctccagaagc acctagcaga gctgaatcac cagaagcagc tggagtccaa taagatccca 480
gagctggaca tgactgaggt ggtggccccc ttcatggcca acatccctct cctcctctac 540
cctcaggacg gcccccgcag caagccccag ccaaaggata atggggacgt ttgccaggac 600
tgcattcaga tggtgactga catccagact gctgtacgga ccaactccac ctttgtccag 660
gccttggtgg aacatgtcaa ggaggagtgt gaccgcctgg gccctggcat ggccgacata 720
tgcaagaact atatcagcca gtattctgaa attgctatcc agatgatgat gcacatgcag 780
gatcagcaac ccaaggagat ctgtgcgctg gttgggttct gtgatgaggt gaaagagatg 840
cccatgcaga ctctggtccc cgccaaagtg gcctccaaga atgtcatccc tgccctggaa 900
ctggtggagc ccattaagaa gcacgaggtc ccagcaaagt ctgatgttta ctgtgaggtg 960
tgtgaattcc tggtgaagga ggtgaccaag ctgattgaca acaacaagac tgagaaagaa 1020
atactcgacg cttttgacaa aatgtgctcg aagctgccga agtccctgtc ggaagagtgc 1080
caggaggtgg tggacacgta cggcagctcc atcctgtcca tcctgctgga ggaggtcagc 1140
cctgagctgg tgtgcagcat gctgcacctc tgctctggca cgcggctgcc tgcactgacc 1200
gttcacgtga ctcagccaaa ggacggtggc ttctgcgaag tgtgcaagaa gctggtgggt 1260
tatttggatc gcaacctgga gaaaaacagc accaagcagg agatcctggc tgctcttgag 1320
aaaggctgca gcttcctgcc agacccttac cagaagcagt gtgatcagtt tgtggcagag 1380
tacgagcccg tgctgatcga gatcctggtg gaggtgatgg atccttcctt cgtgtgcttg 1440
aaaattggag cctgcccctc ggcccataag cccttgttgg gaactgagaa gtgtatatgg 1500
ggcccaagct actggtgcca gaacacagag acagcagccc agtgcaatgc tgtcgagcat 1560
tgcaaacgcc atgtgtggaa ctag 1584
<210> 16
<211> 527
<212> PRT
<213> 人类
<220>
<223> PSAP多肽序列
<400> 16
Met Tyr Ala Leu Phe Leu Leu Ala Ser Leu Leu Gly Ala Ala Leu Ala
1 5 10 15
Gly Pro Val Leu Gly Leu Lys Glu Cys Thr Arg Gly Ser Ala Val Trp
20 25 30
Cys Gln Asn Val Lys Thr Ala Ser Asp Cys Gly Ala Val Lys His Cys
35 40 45
Leu Gln Thr Val Trp Asn Lys Pro Thr Val Lys Ser Leu Pro Cys Asp
50 55 60
Ile Cys Lys Asp Val Val Thr Ala Ala Gly Asp Met Leu Lys Asp Asn
65 70 75 80
Ala Thr Glu Glu Glu Ile Leu Val Tyr Leu Glu Lys Thr Cys Asp Trp
85 90 95
Leu Pro Lys Pro Asn Met Ser Ala Ser Cys Lys Glu Ile Val Asp Ser
100 105 110
Tyr Leu Pro Val Ile Leu Asp Ile Ile Lys Gly Glu Met Ser Arg Pro
115 120 125
Gly Glu Val Cys Ser Ala Leu Asn Leu Cys Glu Ser Leu Gln Lys His
130 135 140
Leu Ala Glu Leu Asn His Gln Lys Gln Leu Glu Ser Asn Lys Ile Pro
145 150 155 160
Glu Leu Asp Met Thr Glu Val Val Ala Pro Phe Met Ala Asn Ile Pro
165 170 175
Leu Leu Leu Tyr Pro Gln Asp Gly Pro Arg Ser Lys Pro Gln Pro Lys
180 185 190
Asp Asn Gly Asp Val Cys Gln Asp Cys Ile Gln Met Val Thr Asp Ile
195 200 205
Gln Thr Ala Val Arg Thr Asn Ser Thr Phe Val Gln Ala Leu Val Glu
210 215 220
His Val Lys Glu Glu Cys Asp Arg Leu Gly Pro Gly Met Ala Asp Ile
225 230 235 240
Cys Lys Asn Tyr Ile Ser Gln Tyr Ser Glu Ile Ala Ile Gln Met Met
245 250 255
Met His Met Gln Asp Gln Gln Pro Lys Glu Ile Cys Ala Leu Val Gly
260 265 270
Phe Cys Asp Glu Val Lys Glu Met Pro Met Gln Thr Leu Val Pro Ala
275 280 285
Lys Val Ala Ser Lys Asn Val Ile Pro Ala Leu Glu Leu Val Glu Pro
290 295 300
Ile Lys Lys His Glu Val Pro Ala Lys Ser Asp Val Tyr Cys Glu Val
305 310 315 320
Cys Glu Phe Leu Val Lys Glu Val Thr Lys Leu Ile Asp Asn Asn Lys
325 330 335
Thr Glu Lys Glu Ile Leu Asp Ala Phe Asp Lys Met Cys Ser Lys Leu
340 345 350
Pro Lys Ser Leu Ser Glu Glu Cys Gln Glu Val Val Asp Thr Tyr Gly
355 360 365
Ser Ser Ile Leu Ser Ile Leu Leu Glu Glu Val Ser Pro Glu Leu Val
370 375 380
Cys Ser Met Leu His Leu Cys Ser Gly Thr Arg Leu Pro Ala Leu Thr
385 390 395 400
Val His Val Thr Gln Pro Lys Asp Gly Gly Phe Cys Glu Val Cys Lys
405 410 415
Lys Leu Val Gly Tyr Leu Asp Arg Asn Leu Glu Lys Asn Ser Thr Lys
420 425 430
Gln Glu Ile Leu Ala Ala Leu Glu Lys Gly Cys Ser Phe Leu Pro Asp
435 440 445
Pro Tyr Gln Lys Gln Cys Asp Gln Phe Val Ala Glu Tyr Glu Pro Val
450 455 460
Leu Ile Glu Ile Leu Val Glu Val Met Asp Pro Ser Phe Val Cys Leu
465 470 475 480
Lys Ile Gly Ala Cys Pro Ser Ala His Lys Pro Leu Leu Gly Thr Glu
485 490 495
Lys Cys Ile Trp Gly Pro Ser Tyr Trp Cys Gln Asn Thr Glu Thr Ala
500 505 510
Ala Gln Cys Asn Ala Val Glu His Cys Lys Arg His Val Trp Asn
515 520 525
<210> 17
<211> 1611
<212> DNA
<213> 人类
<220>
<223> GBA多核苷酸序列
<400> 17
atggagtttt caagtccttc cagagaggaa tgtcccaagc ctttgagtag ggtaagcatc 60
atggctggca gcctcacagg attgcttcta cttcaggcag tgtcgtgggc atcaggtgcc 120
cgcccctgca tccctaaaag cttcggctac agctcggtgg tgtgtgtctg caatgccaca 180
tactgtgact cctttgaccc cccgaccttt cctgcccttg gtaccttcag ccgctatgag 240
agtacacgca gtgggcgacg gatggagctg agtatggggc ccatccaggc taatcacacg 300
ggcacaggcc tgctactgac cctgcagcca gaacagaagt tccagaaagt gaagggattt 360
ggaggggcca tgacagatgc tgctgctctc aacatccttg ccctgtcacc ccctgcccaa 420
aatttgctac ttaaatcgta cttctctgaa gaaggaatcg gatataacat catccgggta 480
cccatggcca gctgtgactt ctccatccgc acctacacct atgcagacac ccctgatgat 540
ttccagttgc acaacttcag cctcccagag gaagatacca agctcaagat acccctgatt 600
caccgagccc tgcagttggc ccagcgtccc gtttcactcc ttgccagccc ctggacatca 660
cccacttggc tcaagaccaa tggagcggtg aatgggaagg ggtcactcaa gggacagccc 720
ggagacatct accaccagac ctgggccaga tactttgtga agttcctgga tgcctatgct 780
gagcacaagt tacagttctg ggcagtgaca gctgaaaatg agccttctgc tgggctgttg 840
agtggatacc ccttccagtg cctgggcttc acccctgaac atcagcgaga cttcattgcc 900
cgtgacctag gtcctaccct cgccaacagt actcaccaca atgtccgcct actcatgctg 960
gatgaccaac gcttgctgct gccccactgg gcaaaggtgg tactgacaga cccagaagca 1020
gctaaatatg ttcatggcat tgctgtacat tggtacctgg actttctggc tccagccaaa 1080
gccaccctag gggagacaca ccgcctgttc cccaacacca tgctctttgc ctcagaggcc 1140
tgtgtgggct ccaagttctg ggagcagagt gtgcggctag gctcctggga tcgagggatg 1200
cagtacagcc acagcatcat cacgaacctc ctgtaccatg tggtcggctg gaccgactgg 1260
aaccttgccc tgaaccccga aggaggaccc aattgggtgc gtaactttgt cgacagtccc 1320
atcattgtag acatcaccaa ggacacgttt tacaaacagc ccatgttcta ccaccttggc 1380
cacttcagca agttcattcc tgagggctcc cagagagtgg ggctggttgc cagtcagaag 1440
aacgacctgg acgcagtggc actgatgcat cccgatggct ctgctgttgt ggtcgtgcta 1500
aaccgctcct ctaaggatgt gcctcttacc atcaaggatc ctgctgtggg cttcctggag 1560
acaatctcac ctggctactc cattcacacc tacctgtggc gtcgccagtg a 1611
<210> 18
<211> 536
<212> PRT
<213> 人类
<220>
<223> GBA多肽序列
<400> 18
Met Glu Phe Ser Ser Pro Ser Arg Glu Glu Cys Pro Lys Pro Leu Ser
1 5 10 15
Arg Val Ser Ile Met Ala Gly Ser Leu Thr Gly Leu Leu Leu Leu Gln
20 25 30
Ala Val Ser Trp Ala Ser Gly Ala Arg Pro Cys Ile Pro Lys Ser Phe
35 40 45
Gly Tyr Ser Ser Val Val Cys Val Cys Asn Ala Thr Tyr Cys Asp Ser
50 55 60
Phe Asp Pro Pro Thr Phe Pro Ala Leu Gly Thr Phe Ser Arg Tyr Glu
65 70 75 80
Ser Thr Arg Ser Gly Arg Arg Met Glu Leu Ser Met Gly Pro Ile Gln
85 90 95
Ala Asn His Thr Gly Thr Gly Leu Leu Leu Thr Leu Gln Pro Glu Gln
100 105 110
Lys Phe Gln Lys Val Lys Gly Phe Gly Gly Ala Met Thr Asp Ala Ala
115 120 125
Ala Leu Asn Ile Leu Ala Leu Ser Pro Pro Ala Gln Asn Leu Leu Leu
130 135 140
Lys Ser Tyr Phe Ser Glu Glu Gly Ile Gly Tyr Asn Ile Ile Arg Val
145 150 155 160
Pro Met Ala Ser Cys Asp Phe Ser Ile Arg Thr Tyr Thr Tyr Ala Asp
165 170 175
Thr Pro Asp Asp Phe Gln Leu His Asn Phe Ser Leu Pro Glu Glu Asp
180 185 190
Thr Lys Leu Lys Ile Pro Leu Ile His Arg Ala Leu Gln Leu Ala Gln
195 200 205
Arg Pro Val Ser Leu Leu Ala Ser Pro Trp Thr Ser Pro Thr Trp Leu
210 215 220
Lys Thr Asn Gly Ala Val Asn Gly Lys Gly Ser Leu Lys Gly Gln Pro
225 230 235 240
Gly Asp Ile Tyr His Gln Thr Trp Ala Arg Tyr Phe Val Lys Phe Leu
245 250 255
Asp Ala Tyr Ala Glu His Lys Leu Gln Phe Trp Ala Val Thr Ala Glu
260 265 270
Asn Glu Pro Ser Ala Gly Leu Leu Ser Gly Tyr Pro Phe Gln Cys Leu
275 280 285
Gly Phe Thr Pro Glu His Gln Arg Asp Phe Ile Ala Arg Asp Leu Gly
290 295 300
Pro Thr Leu Ala Asn Ser Thr His His Asn Val Arg Leu Leu Met Leu
305 310 315 320
Asp Asp Gln Arg Leu Leu Leu Pro His Trp Ala Lys Val Val Leu Thr
325 330 335
Asp Pro Glu Ala Ala Lys Tyr Val His Gly Ile Ala Val His Trp Tyr
340 345 350
Leu Asp Phe Leu Ala Pro Ala Lys Ala Thr Leu Gly Glu Thr His Arg
355 360 365
Leu Phe Pro Asn Thr Met Leu Phe Ala Ser Glu Ala Cys Val Gly Ser
370 375 380
Lys Phe Trp Glu Gln Ser Val Arg Leu Gly Ser Trp Asp Arg Gly Met
385 390 395 400
Gln Tyr Ser His Ser Ile Ile Thr Asn Leu Leu Tyr His Val Val Gly
405 410 415
Trp Thr Asp Trp Asn Leu Ala Leu Asn Pro Glu Gly Gly Pro Asn Trp
420 425 430
Val Arg Asn Phe Val Asp Ser Pro Ile Ile Val Asp Ile Thr Lys Asp
435 440 445
Thr Phe Tyr Lys Gln Pro Met Phe Tyr His Leu Gly His Phe Ser Lys
450 455 460
Phe Ile Pro Glu Gly Ser Gln Arg Val Gly Leu Val Ala Ser Gln Lys
465 470 475 480
Asn Asp Leu Asp Ala Val Ala Leu Met His Pro Asp Gly Ser Ala Val
485 490 495
Val Val Val Leu Asn Arg Ser Ser Lys Asp Val Pro Leu Thr Ile Lys
500 505 510
Asp Pro Ala Val Gly Phe Leu Glu Thr Ile Ser Pro Gly Tyr Ser Ile
515 520 525
His Thr Tyr Leu Trp Arg Arg Gln
530 535
<210> 19
<211> 1401
<212> DNA
<213> 人类
<220>
<223> FUCA1多核苷酸序列
<400> 19
atgcgggctc cggggatgag gtcgcggccg gcgggtcccg cgctgttgct gctgctgctc 60
ttcctcggag cggccgagtc ggtgcgtcgg gcccagcctc cgcgccgcta caccccagac 120
tggccgagcc tggattctcg gccgctgccg gcctggttcg acgaagccaa gttcggggtg 180
ttcatccact ggggcgtgtt ctcggtgccc gcctggggca gcgagtggtt ctggtggcac 240
tggcagggcg aggggcggcc gcagtaccag cgcttcatgc gcgacaacta cccgcccggc 300
ttcagctacg ccgacttcgg accgcagttc actgcgcgct tcttccaccc ggaggagtgg 360
gccgacctct tccaggccgc gggcgccaag tatgtagttt tgacgacaaa gcatcacgaa 420
ggcttcacaa actggccgag tcctgtgtct tggaactgga actccaaaga cgtggggcct 480
catcgggatt tggttggtga attgggaaca gctctccgga agaggaacat ccgctatgga 540
ctataccact cactcttaga gtggttccat ccactctatc tacttgataa gaaaaatggc 600
ttcaaaacac agcattttgt cagtgcaaaa acaatgccag agctgtacga ccttgttaac 660
agctataaac ctgatctgat ctggtctgat ggggagtggg aatgtcctga tacttactgg 720
aactccacaa attttctttc atggctctac aatgacagcc ctgtcaagga tgaggtggta 780
gtaaatgacc gatggggtca gaactgttcc tgtcaccatg gaggatacta taactgtgaa 840
gataaattca agccacagag cttgccagat cacaagtggg agatgtgcac cagcattgac 900
aagttttcct ggggctatcg tcgtgacatg gcattgtctg atgttacaga agaatctgaa 960
atcatttcgg aactggttca gacagtaagt ttgggaggca actatcttct gaacattgga 1020
ccaactaaag atggactgat tgttcccatc ttccaagaaa ggcttcttgc tgttgggaaa 1080
tggctgagca tcaatgggga ggctatctat gcctccaaac catggcgggt gcaatgggaa 1140
aagaacacaa catctgtatg gtatacctca aagggatcgg ctgtttatgc catttttctg 1200
cactggccag aaaatggagt cttaaacctt gaatccccca taactacctc aactacaaag 1260
ataacaatgc tgggaattca aggagatctg aagtggtcca cagatccaga taaaggtctc 1320
ttcatctctc taccccagtt gccaccctct gctgtccccg cagagtttgc ttggactata 1380
aagctgacag gagtgaagta a 1401
<210> 20
<211> 466
<212> PRT
<213> 人类
<220>
<223> FUCA1多肽序列
<400> 20
Met Arg Ala Pro Gly Met Arg Ser Arg Pro Ala Gly Pro Ala Leu Leu
1 5 10 15
Leu Leu Leu Leu Phe Leu Gly Ala Ala Glu Ser Val Arg Arg Ala Gln
20 25 30
Pro Pro Arg Arg Tyr Thr Pro Asp Trp Pro Ser Leu Asp Ser Arg Pro
35 40 45
Leu Pro Ala Trp Phe Asp Glu Ala Lys Phe Gly Val Phe Ile His Trp
50 55 60
Gly Val Phe Ser Val Pro Ala Trp Gly Ser Glu Trp Phe Trp Trp His
65 70 75 80
Trp Gln Gly Glu Gly Arg Pro Gln Tyr Gln Arg Phe Met Arg Asp Asn
85 90 95
Tyr Pro Pro Gly Phe Ser Tyr Ala Asp Phe Gly Pro Gln Phe Thr Ala
100 105 110
Arg Phe Phe His Pro Glu Glu Trp Ala Asp Leu Phe Gln Ala Ala Gly
115 120 125
Ala Lys Tyr Val Val Leu Thr Thr Lys His His Glu Gly Phe Thr Asn
130 135 140
Trp Pro Ser Pro Val Ser Trp Asn Trp Asn Ser Lys Asp Val Gly Pro
145 150 155 160
His Arg Asp Leu Val Gly Glu Leu Gly Thr Ala Leu Arg Lys Arg Asn
165 170 175
Ile Arg Tyr Gly Leu Tyr His Ser Leu Leu Glu Trp Phe His Pro Leu
180 185 190
Tyr Leu Leu Asp Lys Lys Asn Gly Phe Lys Thr Gln His Phe Val Ser
195 200 205
Ala Lys Thr Met Pro Glu Leu Tyr Asp Leu Val Asn Ser Tyr Lys Pro
210 215 220
Asp Leu Ile Trp Ser Asp Gly Glu Trp Glu Cys Pro Asp Thr Tyr Trp
225 230 235 240
Asn Ser Thr Asn Phe Leu Ser Trp Leu Tyr Asn Asp Ser Pro Val Lys
245 250 255
Asp Glu Val Val Val Asn Asp Arg Trp Gly Gln Asn Cys Ser Cys His
260 265 270
His Gly Gly Tyr Tyr Asn Cys Glu Asp Lys Phe Lys Pro Gln Ser Leu
275 280 285
Pro Asp His Lys Trp Glu Met Cys Thr Ser Ile Asp Lys Phe Ser Trp
290 295 300
Gly Tyr Arg Arg Asp Met Ala Leu Ser Asp Val Thr Glu Glu Ser Glu
305 310 315 320
Ile Ile Ser Glu Leu Val Gln Thr Val Ser Leu Gly Gly Asn Tyr Leu
325 330 335
Leu Asn Ile Gly Pro Thr Lys Asp Gly Leu Ile Val Pro Ile Phe Gln
340 345 350
Glu Arg Leu Leu Ala Val Gly Lys Trp Leu Ser Ile Asn Gly Glu Ala
355 360 365
Ile Tyr Ala Ser Lys Pro Trp Arg Val Gln Trp Glu Lys Asn Thr Thr
370 375 380
Ser Val Trp Tyr Thr Ser Lys Gly Ser Ala Val Tyr Ala Ile Phe Leu
385 390 395 400
His Trp Pro Glu Asn Gly Val Leu Asn Leu Glu Ser Pro Ile Thr Thr
405 410 415
Ser Thr Thr Lys Ile Thr Met Leu Gly Ile Gln Gly Asp Leu Lys Trp
420 425 430
Ser Thr Asp Pro Asp Lys Gly Leu Phe Ile Ser Leu Pro Gln Leu Pro
435 440 445
Pro Ser Ala Val Pro Ala Glu Phe Ala Trp Thr Ile Lys Leu Thr Gly
450 455 460
Val Lys
465
<210> 21
<211> 3036
<212> DNA
<213> 人类
<220>
<223> MAN2B1多核苷酸序列
<400> 21
atgggcgcct acgcgcgggc ttcgggggtc tgcgctcgcg gctgcctgga ctcagcaggc 60
ccctggacca tgtcccgcgc cctgcggcca ccgctcccgc ctctctgctt tttccttttg 120
ttgctggcgg ctgccggtgc tcgggccggg ggatacgaga catgccccac agtgcagccg 180
aacatgctga acgtgcacct gctgcctcac acacatgatg acgtgggctg gctcaaaacc 240
gtggaccagt acttttatgg aatcaagaat gacatccagc acgccggtgt gcagtacatc 300
ctggactcgg tcatctctgc cttgctggca gatcccaccc gtcgcttcat ttacgtggag 360
attgccttct tctcccgttg gtggcaccag cagacaaatg ccacacagga agtcgtgcga 420
gaccttgtgc gccaggggcg cctggagttc gccaatggtg gctgggtgat gaacgatgag 480
gcagccaccc actacggtgc catcgtggac cagatgacac ttgggctgcg ctttctggag 540
gacacatttg gcaatgatgg gcgaccccgt gtggcctggc acattgaccc cttcggccac 600
tctcgggagc aggcctcgct gtttgcgcag atgggcttcg acggcttctt ctttgggcgc 660
cttgattatc aagataagtg ggtacggatg cagaagctgg agatggagca ggtgtggcgg 720
gccagcacca gcctgaagcc cccgaccgcg gacctcttca ctggtgtgct tcccaatggt 780
tacaacccgc caaggaatct gtgctgggat gtgctgtgtg tcgatcagcc gctggtggag 840
gaccctcgca gccccgagta caacgccaag gagctggtcg attacttcct aaatgtggcc 900
actgcccagg gccggtatta ccgcaccaac cacactgtga tgaccatggg ctcggacttc 960
caatatgaga atgccaacat gtggttcaag aaccttgaca agctcatccg gctggtaaat 1020
gcgcagcagg caaaaggaag cagtgtccat gttctctact ccacccccgc ttgttacctc 1080
tgggagctga acaaggccaa cctcacctgg tcagtgaaac atgacgactt cttcccttac 1140
gcggatggcc cccaccagtt ctggaccggt tacttttcca gtcggccggc cctcaaacgc 1200
tacgagcgcc tcagctacaa cttcctgcag gtgtgcaacc agctggaggc gctggtgggc 1260
ctggcggcca acgtgggacc ctatggctcc ggagacagtg cacccctcaa tgaggcgatg 1320
gctgtgctcc agcatcacga cgccgtcagc ggcacctccc gccagcacgt ggccaacgac 1380
tacgcgcgcc agcttgcggc aggctggggg ccttgcgagg ttcttctgag caacgcgctg 1440
gcgcggctca gaggcttcaa agatcacttc accttttgcc aacagctaaa catcagcatc 1500
tgcccgctca gccagacggc ggcgcgcttc caggtcatcg tttataatcc cctggggcgg 1560
aaggtgaatt ggatggtacg gctgccggtc agcgaaggcg ttttcgttgt gaaggacccc 1620
aatggcagga cagtgcccag cgatgtggta atatttccca gctcagacag ccaggcgcac 1680
cctccggagc tgctgttctc agcctcactg cccgccctgg gcttcagcac ctattcagta 1740
gcccaggtgc ctcgctggaa gccccaggcc cgcgcaccac agcccatccc cagaagatcc 1800
tggtcccctg ctttaaccat cgaaaatgag cacatccggg caacgtttga tcctgacaca 1860
gggctgttga tggagattat gaacatgaat cagcaactcc tgctgcctgt tcgccagacc 1920
ttcttctggt acaacgccag tataggtgac aacgaaagtg accaggcctc aggtgcctac 1980
atcttcagac ccaaccaaca gaaaccgctg cctgtgagcc gctgggctca gatccacctg 2040
gtgaagacac ccttggtgca ggaggtgcac cagaacttct cagcttggtg ttcccaggtg 2100
gttcgcctgt acccaggaca gcggcacctg gagctagagt ggtcggtggg gccgatacct 2160
gtgggcgaca cctgggggaa ggaggtcatc agccgttttg acacaccgct ggagacaaag 2220
ggacgcttct acacagacag caatggccgg gagatcctgg agaggaggcg ggattatcga 2280
cccacctgga aactgaacca gacggagccc gtggcaggaa actactatcc agtcaacacc 2340
cggatttaca tcacggatgg aaacatgcag ctgactgtgc tgactgaccg ctcccagggg 2400
ggcagcagcc tgagagatgg ctcgctggag ctcatggtgc accgaaggct gctgaaggac 2460
gatggacgcg gagtatcgga gccactaatg gagaacgggt cgggggcgtg ggtgcgaggg 2520
cgccacctgg tgctgctgga cacagcccag gctgcagccg ccggacaccg gctcctggcg 2580
gagcaggagg tcctggcccc tcaggtggtg ctggccccgg gtggcggcgc cgcctacaat 2640
ctcggggctc ctccgcgcac gcagttctca gggctgcgca gggacctgcc gccctcggtg 2700
cacctgctca cgctggccag ctggggcccc gaaatggtgc tgctgcgctt ggagcaccag 2760
tttgccgtag gagaggattc cggacgtaac ctgagcgccc ccgttacctt gaacttgagg 2820
gacctgttct ccaccttcac catcacccgc ctgcaggaga ccacgctggt ggccaaccag 2880
ctccgcgagg cagcctccag gctcaagtgg acaacaaaca caggccccac accccaccaa 2940
actccgtacc agctggaccc ggccaacatc acgctggaac ccatggaaat ccgcactttc 3000
ctggcctcag ttcaatggaa ggaggtggat ggttag 3036
<210> 22
<211> 1011
<212> PRT
<213> 人类
<220>
<223> MAN2B1多肽序列
<400> 22
Met Gly Ala Tyr Ala Arg Ala Ser Gly Val Cys Ala Arg Gly Cys Leu
1 5 10 15
Asp Ser Ala Gly Pro Trp Thr Met Ser Arg Ala Leu Arg Pro Pro Leu
20 25 30
Pro Pro Leu Cys Phe Phe Leu Leu Leu Leu Ala Ala Ala Gly Ala Arg
35 40 45
Ala Gly Gly Tyr Glu Thr Cys Pro Thr Val Gln Pro Asn Met Leu Asn
50 55 60
Val His Leu Leu Pro His Thr His Asp Asp Val Gly Trp Leu Lys Thr
65 70 75 80
Val Asp Gln Tyr Phe Tyr Gly Ile Lys Asn Asp Ile Gln His Ala Gly
85 90 95
Val Gln Tyr Ile Leu Asp Ser Val Ile Ser Ala Leu Leu Ala Asp Pro
100 105 110
Thr Arg Arg Phe Ile Tyr Val Glu Ile Ala Phe Phe Ser Arg Trp Trp
115 120 125
His Gln Gln Thr Asn Ala Thr Gln Glu Val Val Arg Asp Leu Val Arg
130 135 140
Gln Gly Arg Leu Glu Phe Ala Asn Gly Gly Trp Val Met Asn Asp Glu
145 150 155 160
Ala Ala Thr His Tyr Gly Ala Ile Val Asp Gln Met Thr Leu Gly Leu
165 170 175
Arg Phe Leu Glu Asp Thr Phe Gly Asn Asp Gly Arg Pro Arg Val Ala
180 185 190
Trp His Ile Asp Pro Phe Gly His Ser Arg Glu Gln Ala Ser Leu Phe
195 200 205
Ala Gln Met Gly Phe Asp Gly Phe Phe Phe Gly Arg Leu Asp Tyr Gln
210 215 220
Asp Lys Trp Val Arg Met Gln Lys Leu Glu Met Glu Gln Val Trp Arg
225 230 235 240
Ala Ser Thr Ser Leu Lys Pro Pro Thr Ala Asp Leu Phe Thr Gly Val
245 250 255
Leu Pro Asn Gly Tyr Asn Pro Pro Arg Asn Leu Cys Trp Asp Val Leu
260 265 270
Cys Val Asp Gln Pro Leu Val Glu Asp Pro Arg Ser Pro Glu Tyr Asn
275 280 285
Ala Lys Glu Leu Val Asp Tyr Phe Leu Asn Val Ala Thr Ala Gln Gly
290 295 300
Arg Tyr Tyr Arg Thr Asn His Thr Val Met Thr Met Gly Ser Asp Phe
305 310 315 320
Gln Tyr Glu Asn Ala Asn Met Trp Phe Lys Asn Leu Asp Lys Leu Ile
325 330 335
Arg Leu Val Asn Ala Gln Gln Ala Lys Gly Ser Ser Val His Val Leu
340 345 350
Tyr Ser Thr Pro Ala Cys Tyr Leu Trp Glu Leu Asn Lys Ala Asn Leu
355 360 365
Thr Trp Ser Val Lys His Asp Asp Phe Phe Pro Tyr Ala Asp Gly Pro
370 375 380
His Gln Phe Trp Thr Gly Tyr Phe Ser Ser Arg Pro Ala Leu Lys Arg
385 390 395 400
Tyr Glu Arg Leu Ser Tyr Asn Phe Leu Gln Val Cys Asn Gln Leu Glu
405 410 415
Ala Leu Val Gly Leu Ala Ala Asn Val Gly Pro Tyr Gly Ser Gly Asp
420 425 430
Ser Ala Pro Leu Asn Glu Ala Met Ala Val Leu Gln His His Asp Ala
435 440 445
Val Ser Gly Thr Ser Arg Gln His Val Ala Asn Asp Tyr Ala Arg Gln
450 455 460
Leu Ala Ala Gly Trp Gly Pro Cys Glu Val Leu Leu Ser Asn Ala Leu
465 470 475 480
Ala Arg Leu Arg Gly Phe Lys Asp His Phe Thr Phe Cys Gln Gln Leu
485 490 495
Asn Ile Ser Ile Cys Pro Leu Ser Gln Thr Ala Ala Arg Phe Gln Val
500 505 510
Ile Val Tyr Asn Pro Leu Gly Arg Lys Val Asn Trp Met Val Arg Leu
515 520 525
Pro Val Ser Glu Gly Val Phe Val Val Lys Asp Pro Asn Gly Arg Thr
530 535 540
Val Pro Ser Asp Val Val Ile Phe Pro Ser Ser Asp Ser Gln Ala His
545 550 555 560
Pro Pro Glu Leu Leu Phe Ser Ala Ser Leu Pro Ala Leu Gly Phe Ser
565 570 575
Thr Tyr Ser Val Ala Gln Val Pro Arg Trp Lys Pro Gln Ala Arg Ala
580 585 590
Pro Gln Pro Ile Pro Arg Arg Ser Trp Ser Pro Ala Leu Thr Ile Glu
595 600 605
Asn Glu His Ile Arg Ala Thr Phe Asp Pro Asp Thr Gly Leu Leu Met
610 615 620
Glu Ile Met Asn Met Asn Gln Gln Leu Leu Leu Pro Val Arg Gln Thr
625 630 635 640
Phe Phe Trp Tyr Asn Ala Ser Ile Gly Asp Asn Glu Ser Asp Gln Ala
645 650 655
Ser Gly Ala Tyr Ile Phe Arg Pro Asn Gln Gln Lys Pro Leu Pro Val
660 665 670
Ser Arg Trp Ala Gln Ile His Leu Val Lys Thr Pro Leu Val Gln Glu
675 680 685
Val His Gln Asn Phe Ser Ala Trp Cys Ser Gln Val Val Arg Leu Tyr
690 695 700
Pro Gly Gln Arg His Leu Glu Leu Glu Trp Ser Val Gly Pro Ile Pro
705 710 715 720
Val Gly Asp Thr Trp Gly Lys Glu Val Ile Ser Arg Phe Asp Thr Pro
725 730 735
Leu Glu Thr Lys Gly Arg Phe Tyr Thr Asp Ser Asn Gly Arg Glu Ile
740 745 750
Leu Glu Arg Arg Arg Asp Tyr Arg Pro Thr Trp Lys Leu Asn Gln Thr
755 760 765
Glu Pro Val Ala Gly Asn Tyr Tyr Pro Val Asn Thr Arg Ile Tyr Ile
770 775 780
Thr Asp Gly Asn Met Gln Leu Thr Val Leu Thr Asp Arg Ser Gln Gly
785 790 795 800
Gly Ser Ser Leu Arg Asp Gly Ser Leu Glu Leu Met Val His Arg Arg
805 810 815
Leu Leu Lys Asp Asp Gly Arg Gly Val Ser Glu Pro Leu Met Glu Asn
820 825 830
Gly Ser Gly Ala Trp Val Arg Gly Arg His Leu Val Leu Leu Asp Thr
835 840 845
Ala Gln Ala Ala Ala Ala Gly His Arg Leu Leu Ala Glu Gln Glu Val
850 855 860
Leu Ala Pro Gln Val Val Leu Ala Pro Gly Gly Gly Ala Ala Tyr Asn
865 870 875 880
Leu Gly Ala Pro Pro Arg Thr Gln Phe Ser Gly Leu Arg Arg Asp Leu
885 890 895
Pro Pro Ser Val His Leu Leu Thr Leu Ala Ser Trp Gly Pro Glu Met
900 905 910
Val Leu Leu Arg Leu Glu His Gln Phe Ala Val Gly Glu Asp Ser Gly
915 920 925
Arg Asn Leu Ser Ala Pro Val Thr Leu Asn Leu Arg Asp Leu Phe Ser
930 935 940
Thr Phe Thr Ile Thr Arg Leu Gln Glu Thr Thr Leu Val Ala Asn Gln
945 950 955 960
Leu Arg Glu Ala Ala Ser Arg Leu Lys Trp Thr Thr Asn Thr Gly Pro
965 970 975
Thr Pro His Gln Thr Pro Tyr Gln Leu Asp Pro Ala Asn Ile Thr Leu
980 985 990
Glu Pro Met Glu Ile Arg Thr Phe Leu Ala Ser Val Gln Trp Lys Glu
995 1000 1005
Val Asp Gly
1010
<210> 23
<211> 1041
<212> DNA
<213> 人类
<220>
<223> AGA多核苷酸序列
<400> 23
atggcgcgga agtcgaactt gcctgtgctt ctcgtgccgt ttctgctctg ccaggcccta 60
gtgcgctgct ccagccctct gcccctggtc gtcaacactt ggccctttaa gaatgcaacc 120
gaagcagcgt ggagggcatt agcatctgga ggctctgccc tggatgcagt ggagagcggc 180
tgtgccatgt gtgagagaga gcagtgtgac ggctctgtag gctttggagg aagtcctgat 240
gaacttggag aaaccacact agatgccatg atcatggatg gcactactat ggatgtagga 300
gcagtaggag atctcagacg aattaaaaat gctattggtg tggcacggaa agtactggaa 360
catacaacac acacactttt agtaggagag tcagccacca catttgctca aagtatgggg 420
tttatcaatg aagacttatc taccactgct tctcaagctc ttcattcaga ttggcttgct 480
cggaattgcc agccaaatta ttggaggaat gttataccag atccctcaaa atactgcgga 540
ccctacaaac cacctggtat cttaaagcag gatattccta tccataaaga aacagaagat 600
gatcgtggtc atgacactat tggcatggtt gtaatccata agacaggaca tattgctgct 660
ggtacatcta caaatggtat aaaattcaaa atacatggcc gtgtaggaga ctcaccaata 720
cctggagctg gagcctatgc tgacgatact gcaggggcag ccgcagccac tgggaatggt 780
gatatattga tgcgcttcct gccaagctac caagctgtag aatacatgag aagaggagaa 840
gatccaacca tagcttgcca aaaagtgatt tcaagaatcc agaagcattt tccagaattc 900
tttggggctg ttatatgtgc caatgtgact ggaagttacg gtgctgcttg caataaactt 960
tcaacattta ctcagtttag tttcatggtt tataattccg aaaaaaatca gccaactgag 1020
gaaaaagtgg actgcatcta a 1041
<210> 24
<211> 346
<212> PRT
<213> 人类
<220>
<223> AGA多肽序列
<400> 24
Met Ala Arg Lys Ser Asn Leu Pro Val Leu Leu Val Pro Phe Leu Leu
1 5 10 15
Cys Gln Ala Leu Val Arg Cys Ser Ser Pro Leu Pro Leu Val Val Asn
20 25 30
Thr Trp Pro Phe Lys Asn Ala Thr Glu Ala Ala Trp Arg Ala Leu Ala
35 40 45
Ser Gly Gly Ser Ala Leu Asp Ala Val Glu Ser Gly Cys Ala Met Cys
50 55 60
Glu Arg Glu Gln Cys Asp Gly Ser Val Gly Phe Gly Gly Ser Pro Asp
65 70 75 80
Glu Leu Gly Glu Thr Thr Leu Asp Ala Met Ile Met Asp Gly Thr Thr
85 90 95
Met Asp Val Gly Ala Val Gly Asp Leu Arg Arg Ile Lys Asn Ala Ile
100 105 110
Gly Val Ala Arg Lys Val Leu Glu His Thr Thr His Thr Leu Leu Val
115 120 125
Gly Glu Ser Ala Thr Thr Phe Ala Gln Ser Met Gly Phe Ile Asn Glu
130 135 140
Asp Leu Ser Thr Thr Ala Ser Gln Ala Leu His Ser Asp Trp Leu Ala
145 150 155 160
Arg Asn Cys Gln Pro Asn Tyr Trp Arg Asn Val Ile Pro Asp Pro Ser
165 170 175
Lys Tyr Cys Gly Pro Tyr Lys Pro Pro Gly Ile Leu Lys Gln Asp Ile
180 185 190
Pro Ile His Lys Glu Thr Glu Asp Asp Arg Gly His Asp Thr Ile Gly
195 200 205
Met Val Val Ile His Lys Thr Gly His Ile Ala Ala Gly Thr Ser Thr
210 215 220
Asn Gly Ile Lys Phe Lys Ile His Gly Arg Val Gly Asp Ser Pro Ile
225 230 235 240
Pro Gly Ala Gly Ala Tyr Ala Asp Asp Thr Ala Gly Ala Ala Ala Ala
245 250 255
Thr Gly Asn Gly Asp Ile Leu Met Arg Phe Leu Pro Ser Tyr Gln Ala
260 265 270
Val Glu Tyr Met Arg Arg Gly Glu Asp Pro Thr Ile Ala Cys Gln Lys
275 280 285
Val Ile Ser Arg Ile Gln Lys His Phe Pro Glu Phe Phe Gly Ala Val
290 295 300
Ile Cys Ala Asn Val Thr Gly Ser Tyr Gly Ala Ala Cys Asn Lys Leu
305 310 315 320
Ser Thr Phe Thr Gln Phe Ser Phe Met Val Tyr Asn Ser Glu Lys Asn
325 330 335
Gln Pro Thr Glu Glu Lys Val Asp Cys Ile
340 345
<210> 25
<211> 1236
<212> DNA
<213> 人类
<220>
<223> ASAH1多核苷酸序列
<400> 25
atgaactgct gcatcgggct gggagagaaa gctcgcgggt cccaccgggc ctcctaccca 60
agtctcagcg cgcttttcac cgaggcctca attctgggat ttggcagctt tgctgtgaaa 120
gcccaatgga cagaggactg cagaaaatca acctatcctc cttcaggacc aacgtacaga 180
ggtgcagttc catggtacac cataaatctt gacttaccac cctacaaaag atggcatgaa 240
ttgatgcttg acaaggcacc agtgctaaag gttatagtga attctctgaa gaatatgata 300
aatacattcg tgccaagtgg aaaaattatg caggtggtgg atgaaaaatt gcctggccta 360
cttggcaact ttcctggccc ttttgaagag gaaatgaagg gtattgccgc tgttactgat 420
atacctttag gagagattat ttcattcaat attttttatg aattatttac catttgtact 480
tcaatagtag cagaagacaa aaaaggtcat ctaatacatg ggagaaacat ggattttgga 540
gtatttcttg ggtggaacat aaataatgat acctgggtca taactgagca actaaaacct 600
ttaacagtga atttggattt ccaaagaaac aacaaaactg tcttcaaggc ttcaagcttt 660
gctggctatg tgggcatgtt aacaggattc aaaccaggac tgttcagtct tacactgaat 720
gaacgtttca gtataaatgg tggttatctg ggtattctag aatggattct gggaaagaaa 780
gatgtcatgt ggatagggtt cctcactaga acagttctgg aaaatagcac aagttatgaa 840
gaagccaaga atttattgac caagaccaag atattggccc cagcctactt tatcctggga 900
ggcaaccagt ctggggaagg ttgtgtgatt acacgagaca gaaaggaatc attggatgta 960
tatgaactcg atgctaagca gggtagatgg tatgtggtac aaacaaatta tgaccgttgg 1020
aaacatccct tcttccttga tgatcgcaga acgcctgcaa agatgtgtct gaaccgcacc 1080
agccaagaga atatctcatt tgaaaccatg tatgatgtcc tgtcaacaaa acctgtcctc 1140
aacaagctga ccgtatacac aaccttgata gatgttacca aaggtcaatt cgaaacttac 1200
ctgcgggact gccctgaccc ttgtataggt tggtga 1236
<210> 26
<211> 411
<212> PRT
<213> 人类
<220>
<223> ASAH1多肽序列
<400> 26
Met Asn Cys Cys Ile Gly Leu Gly Glu Lys Ala Arg Gly Ser His Arg
1 5 10 15
Ala Ser Tyr Pro Ser Leu Ser Ala Leu Phe Thr Glu Ala Ser Ile Leu
20 25 30
Gly Phe Gly Ser Phe Ala Val Lys Ala Gln Trp Thr Glu Asp Cys Arg
35 40 45
Lys Ser Thr Tyr Pro Pro Ser Gly Pro Thr Tyr Arg Gly Ala Val Pro
50 55 60
Trp Tyr Thr Ile Asn Leu Asp Leu Pro Pro Tyr Lys Arg Trp His Glu
65 70 75 80
Leu Met Leu Asp Lys Ala Pro Val Leu Lys Val Ile Val Asn Ser Leu
85 90 95
Lys Asn Met Ile Asn Thr Phe Val Pro Ser Gly Lys Ile Met Gln Val
100 105 110
Val Asp Glu Lys Leu Pro Gly Leu Leu Gly Asn Phe Pro Gly Pro Phe
115 120 125
Glu Glu Glu Met Lys Gly Ile Ala Ala Val Thr Asp Ile Pro Leu Gly
130 135 140
Glu Ile Ile Ser Phe Asn Ile Phe Tyr Glu Leu Phe Thr Ile Cys Thr
145 150 155 160
Ser Ile Val Ala Glu Asp Lys Lys Gly His Leu Ile His Gly Arg Asn
165 170 175
Met Asp Phe Gly Val Phe Leu Gly Trp Asn Ile Asn Asn Asp Thr Trp
180 185 190
Val Ile Thr Glu Gln Leu Lys Pro Leu Thr Val Asn Leu Asp Phe Gln
195 200 205
Arg Asn Asn Lys Thr Val Phe Lys Ala Ser Ser Phe Ala Gly Tyr Val
210 215 220
Gly Met Leu Thr Gly Phe Lys Pro Gly Leu Phe Ser Leu Thr Leu Asn
225 230 235 240
Glu Arg Phe Ser Ile Asn Gly Gly Tyr Leu Gly Ile Leu Glu Trp Ile
245 250 255
Leu Gly Lys Lys Asp Val Met Trp Ile Gly Phe Leu Thr Arg Thr Val
260 265 270
Leu Glu Asn Ser Thr Ser Tyr Glu Glu Ala Lys Asn Leu Leu Thr Lys
275 280 285
Thr Lys Ile Leu Ala Pro Ala Tyr Phe Ile Leu Gly Gly Asn Gln Ser
290 295 300
Gly Glu Gly Cys Val Ile Thr Arg Asp Arg Lys Glu Ser Leu Asp Val
305 310 315 320
Tyr Glu Leu Asp Ala Lys Gln Gly Arg Trp Tyr Val Val Gln Thr Asn
325 330 335
Tyr Asp Arg Trp Lys His Pro Phe Phe Leu Asp Asp Arg Arg Thr Pro
340 345 350
Ala Lys Met Cys Leu Asn Arg Thr Ser Gln Glu Asn Ile Ser Phe Glu
355 360 365
Thr Met Tyr Asp Val Leu Ser Thr Lys Pro Val Leu Asn Lys Leu Thr
370 375 380
Val Tyr Thr Thr Leu Ile Asp Val Thr Lys Gly Gln Phe Glu Thr Tyr
385 390 395 400
Leu Arg Asp Cys Pro Asp Pro Cys Ile Gly Trp
405 410
<210> 27
<211> 1590
<212> DNA
<213> 人类
<220>
<223> HEXA多核苷酸序列
<400> 27
atgacaagct ccaggctttg gttttcgctg ctgctggcgg cagcgttcgc aggacgggcg 60
acggccctct ggccctggcc tcagaacttc caaacctccg accagcgcta cgtcctttac 120
ccgaacaact ttcaattcca gtacgatgtc agctcggccg cgcagcccgg ctgctcagtc 180
ctcgacgagg ccttccagcg ctatcgtgac ctgcttttcg gttccgggtc ttggccccgt 240
ccttacctca cagggaaacg gcatacactg gagaagaatg tgttggttgt ctctgtagtc 300
acacctggat gtaaccagct tcctactttg gagtcagtgg agaattatac cctgaccata 360
aatgatgacc agtgtttact cctctctgag actgtctggg gagctctccg aggtctggag 420
acttttagcc agcttgtttg gaaatctgct gagggcacat tctttatcaa caagactgag 480
attgaggact ttccccgctt tcctcaccgg ggcttgctgt tggatacatc tcgccattac 540
ctgccactct ctagcatcct ggacactctg gatgtcatgg cgtacaataa attgaacgtg 600
ttccactggc atctggtaga tgatccttcc ttcccatatg agagcttcac ttttccagag 660
ctcatgagaa aggggtccta caaccctgtc acccacatct acacagcaca ggatgtgaag 720
gaggtcattg aatacgcacg gctccggggt atccgtgtgc ttgcagagtt tgacactcct 780
ggccacactt tgtcctgggg accaggtatc cctggattac tgactccttg ctactctggg 840
tctgagccct ctggcacctt tggaccagtg aatcccagtc tcaataatac ctatgagttc 900
atgagcacat tcttcttaga agtcagctct gtcttcccag atttttatct tcatcttgga 960
ggagatgagg ttgatttcac ctgctggaag tccaacccag agatccagga ctttatgagg 1020
aagaaaggct tcggtgagga cttcaagcag ctggagtcct tctacatcca gacgctgctg 1080
gacatcgtct cttcttatgg caagggctat gtggtgtggc aggaggtgtt tgataataaa 1140
gtaaagattc agccagacac aatcatacag gtgtggcgag aggatattcc agtgaactat 1200
atgaaggagc tggaactggt caccaaggcc ggcttccggg cccttctctc tgccccctgg 1260
tacctgaacc gtatatccta tggccctgac tggaaggatt tctacatagt ggaacccctg 1320
gcatttgaag gtacccctga gcagaaggct ctggtgattg gtggagaggc ttgtatgtgg 1380
ggagaatatg tggacaacac aaacctggtc cccaggctct ggcccagagc aggggctgtt 1440
gccgaaaggc tgtggagcaa caagttgaca tctgacctga catttgccta tgaacgtttg 1500
tcacacttcc gctgtgaatt gctgaggcga ggtgtccagg cccaacccct caatgtaggc 1560
ttctgtgagc aggagtttga acagacctga 1590
<210> 28
<211> 529
<212> PRT
<213> 人类
<220>
<223> HEXA多肽序列
<400> 28
Met Thr Ser Ser Arg Leu Trp Phe Ser Leu Leu Leu Ala Ala Ala Phe
1 5 10 15
Ala Gly Arg Ala Thr Ala Leu Trp Pro Trp Pro Gln Asn Phe Gln Thr
20 25 30
Ser Asp Gln Arg Tyr Val Leu Tyr Pro Asn Asn Phe Gln Phe Gln Tyr
35 40 45
Asp Val Ser Ser Ala Ala Gln Pro Gly Cys Ser Val Leu Asp Glu Ala
50 55 60
Phe Gln Arg Tyr Arg Asp Leu Leu Phe Gly Ser Gly Ser Trp Pro Arg
65 70 75 80
Pro Tyr Leu Thr Gly Lys Arg His Thr Leu Glu Lys Asn Val Leu Val
85 90 95
Val Ser Val Val Thr Pro Gly Cys Asn Gln Leu Pro Thr Leu Glu Ser
100 105 110
Val Glu Asn Tyr Thr Leu Thr Ile Asn Asp Asp Gln Cys Leu Leu Leu
115 120 125
Ser Glu Thr Val Trp Gly Ala Leu Arg Gly Leu Glu Thr Phe Ser Gln
130 135 140
Leu Val Trp Lys Ser Ala Glu Gly Thr Phe Phe Ile Asn Lys Thr Glu
145 150 155 160
Ile Glu Asp Phe Pro Arg Phe Pro His Arg Gly Leu Leu Leu Asp Thr
165 170 175
Ser Arg His Tyr Leu Pro Leu Ser Ser Ile Leu Asp Thr Leu Asp Val
180 185 190
Met Ala Tyr Asn Lys Leu Asn Val Phe His Trp His Leu Val Asp Asp
195 200 205
Pro Ser Phe Pro Tyr Glu Ser Phe Thr Phe Pro Glu Leu Met Arg Lys
210 215 220
Gly Ser Tyr Asn Pro Val Thr His Ile Tyr Thr Ala Gln Asp Val Lys
225 230 235 240
Glu Val Ile Glu Tyr Ala Arg Leu Arg Gly Ile Arg Val Leu Ala Glu
245 250 255
Phe Asp Thr Pro Gly His Thr Leu Ser Trp Gly Pro Gly Ile Pro Gly
260 265 270
Leu Leu Thr Pro Cys Tyr Ser Gly Ser Glu Pro Ser Gly Thr Phe Gly
275 280 285
Pro Val Asn Pro Ser Leu Asn Asn Thr Tyr Glu Phe Met Ser Thr Phe
290 295 300
Phe Leu Glu Val Ser Ser Val Phe Pro Asp Phe Tyr Leu His Leu Gly
305 310 315 320
Gly Asp Glu Val Asp Phe Thr Cys Trp Lys Ser Asn Pro Glu Ile Gln
325 330 335
Asp Phe Met Arg Lys Lys Gly Phe Gly Glu Asp Phe Lys Gln Leu Glu
340 345 350
Ser Phe Tyr Ile Gln Thr Leu Leu Asp Ile Val Ser Ser Tyr Gly Lys
355 360 365
Gly Tyr Val Val Trp Gln Glu Val Phe Asp Asn Lys Val Lys Ile Gln
370 375 380
Pro Asp Thr Ile Ile Gln Val Trp Arg Glu Asp Ile Pro Val Asn Tyr
385 390 395 400
Met Lys Glu Leu Glu Leu Val Thr Lys Ala Gly Phe Arg Ala Leu Leu
405 410 415
Ser Ala Pro Trp Tyr Leu Asn Arg Ile Ser Tyr Gly Pro Asp Trp Lys
420 425 430
Asp Phe Tyr Ile Val Glu Pro Leu Ala Phe Glu Gly Thr Pro Glu Gln
435 440 445
Lys Ala Leu Val Ile Gly Gly Glu Ala Cys Met Trp Gly Glu Tyr Val
450 455 460
Asp Asn Thr Asn Leu Val Pro Arg Leu Trp Pro Arg Ala Gly Ala Val
465 470 475 480
Ala Glu Arg Leu Trp Ser Asn Lys Leu Thr Ser Asp Leu Thr Phe Ala
485 490 495
Tyr Glu Arg Leu Ser His Phe Arg Cys Glu Leu Leu Arg Arg Gly Val
500 505 510
Gln Ala Gln Pro Leu Asn Val Gly Phe Cys Glu Gln Glu Phe Glu Gln
515 520 525
Thr
<210> 29
<211> 2859
<212> DNA
<213> 人类
<220>
<223> GAA多核苷酸序列
<400> 29
atgggagtga ggcacccgcc ctgctcccac cggctcctgg ccgtctgcgc cctcgtgtcc 60
ttggcaaccg ctgcactcct ggggcacatc ctactccatg atttcctgct ggttccccga 120
gagctgagtg gctcctcccc agtcctggag gagactcacc cagctcacca gcagggagcc 180
agcagaccag ggccccggga tgcccaggca caccccggcc gtcccagagc agtgcccaca 240
cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 300
gaacagtgcg aggcccgcgg ctgttgctac atccctgcaa agcaggggct gcagggagcc 360
cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 420
ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 480
cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 540
ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcatgtc 600
cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 660
atcgtgcgcc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 720
tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 780
gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 840
cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 900
ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 960
gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1020
atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1080
ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1140
accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1200
cagtggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1260
ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 1320
atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 1380
ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 1440
tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 1500
gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 1560
gagccttcca acttcatcag gggctctgag gacggctgcc ccaacaatga gctggagaac 1620
ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 1680
agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 1740
atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 1800
tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 1860
tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 1920
ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 1980
tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2040
ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2100
ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2160
gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2220
gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 2280
gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccagta 2340
gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 2400
gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 2460
gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 2520
atggccctgg ctgtggccct gaccaagggt ggggaggccc gaggggagct gttctgggac 2580
gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 2640
aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 2700
ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 2760
gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 2820
ctgttgatgg gagagcagtt tctcgtcagc tggtgttag 2859
<210> 30
<211> 952
<212> PRT
<213> 人类
<220>
<223> GAA多肽序列
<400> 30
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940
Glu Gln Phe Leu Val Ser Trp Cys
945 950
<210> 31
<211> 1896
<212> DNA
<213> 人类
<220>
<223> SMPD1多核苷酸序列
<400> 31
atgccccgct acggagcgtc actccgccag agctgcccca ggtccggccg ggagcaggga 60
caagacggga ccgccggagc ccccggactc ctttggatgg gcctggtgct ggcgctggcg 120
ctggcgctgg cgctggcgct ggctctgtct gactctcggg ttctctgggc tccggcagag 180
gctcaccctc tttctcccca aggccatcct gccaggttac atcgcatagt gccccggctc 240
cgagatgtct ttgggtgggg gaacctcacc tgcccaatct gcaaaggtct attcaccgcc 300
atcaacctcg ggctgaagaa ggaacccaat gtggctcgcg tgggctccgt ggccatcaag 360
ctgtgcaatc tgctgaagat agcaccacct gccgtgtgcc aatccattgt ccacctcttt 420
gaggatgaca tggtggaggt gtggagacgc tcagtgctga gcccatctga ggcctgtggc 480
ctgctcctgg gctccacctg tgggcactgg gacattttct catcttggaa catctctttg 540
cctactgtgc cgaagccgcc ccccaaaccc cctagccccc cagccccagg tgcccctgtc 600
agccgcatcc tcttcctcac tgacctgcac tgggatcatg actacctgga gggcacggac 660
cctgactgtg cagacccact gtgctgccgc cggggttctg gcctgccgcc cgcatcccgg 720
ccaggtgccg gatactgggg cgaatacagc aagtgtgacc tgcccctgag gaccctggag 780
agcctgttga gtgggctggg cccagccggc ccttttgata tggtgtactg gacaggagac 840
atccccgcac atgatgtctg gcaccagact cgtcaggacc aactgcgggc cctgaccacc 900
gtcacagcac ttgtgaggaa gttcctgggg ccagtgccag tgtaccctgc tgtgggtaac 960
catgaaagca cacctgtcaa tagcttccct ccccccttca ttgagggcaa ccactcctcc 1020
cgctggctct atgaagcgat ggccaaggct tgggagccct ggctgcctgc cgaagccctg 1080
cgcaccctca gaattggggg gttctatgct ctttccccat accccggtct ccgcctcatc 1140
tctctcaata tgaatttttg ttcccgtgag aacttctggc tcttgatcaa ctccacggat 1200
cccgcaggac agctccagtg gctggtgggg gagcttcagg ctgctgagga tcgaggagac 1260
aaagtgcata taattggcca cattccccca gggcactgtc tgaagagctg gagctggaat 1320
tattaccgaa ttgtagccag gtatgagaac accctggctg ctcagttctt tggccacact 1380
catgtggatg aatttgaggt cttctatgat gaagagactc tgagccggcc gctggctgta 1440
gccttcctgg cacccagtgc aactacctac atcggcctta atcctggtta ccgtgtgtac 1500
caaatagatg gaaactactc cgggagctct cacgtggtcc tggaccatga gacctacatc 1560
ctgaatctga cccaggcaaa cataccggga gccataccgc actggcagct tctctacagg 1620
gctcgagaaa cctatgggct gcccaacaca ctgcctaccg cctggcacaa cctggtatat 1680
cgcatgcggg gcgacatgca acttttccag accttctggt ttctctacca taagggccac 1740
ccaccctcgg agccctgtgg cacgccctgc cgtctggcta ctctttgtgc ccagctctct 1800
gcccgtgctg acagccctgc tctgtgccgc cacctgatgc cagatgggag cctcccagag 1860
gcccagagcc tgtggccaag gccactgttt tgctag 1896
<210> 32
<211> 631
<212> PRT
<213> 人类
<220>
<223> SMPD1多肽序列
<400> 32
Met Pro Arg Tyr Gly Ala Ser Leu Arg Gln Ser Cys Pro Arg Ser Gly
1 5 10 15
Arg Glu Gln Gly Gln Asp Gly Thr Ala Gly Ala Pro Gly Leu Leu Trp
20 25 30
Met Gly Leu Val Leu Ala Leu Ala Leu Ala Leu Ala Leu Ala Leu Ala
35 40 45
Leu Ser Asp Ser Arg Val Leu Trp Ala Pro Ala Glu Ala His Pro Leu
50 55 60
Ser Pro Gln Gly His Pro Ala Arg Leu His Arg Ile Val Pro Arg Leu
65 70 75 80
Arg Asp Val Phe Gly Trp Gly Asn Leu Thr Cys Pro Ile Cys Lys Gly
85 90 95
Leu Phe Thr Ala Ile Asn Leu Gly Leu Lys Lys Glu Pro Asn Val Ala
100 105 110
Arg Val Gly Ser Val Ala Ile Lys Leu Cys Asn Leu Leu Lys Ile Ala
115 120 125
Pro Pro Ala Val Cys Gln Ser Ile Val His Leu Phe Glu Asp Asp Met
130 135 140
Val Glu Val Trp Arg Arg Ser Val Leu Ser Pro Ser Glu Ala Cys Gly
145 150 155 160
Leu Leu Leu Gly Ser Thr Cys Gly His Trp Asp Ile Phe Ser Ser Trp
165 170 175
Asn Ile Ser Leu Pro Thr Val Pro Lys Pro Pro Pro Lys Pro Pro Ser
180 185 190
Pro Pro Ala Pro Gly Ala Pro Val Ser Arg Ile Leu Phe Leu Thr Asp
195 200 205
Leu His Trp Asp His Asp Tyr Leu Glu Gly Thr Asp Pro Asp Cys Ala
210 215 220
Asp Pro Leu Cys Cys Arg Arg Gly Ser Gly Leu Pro Pro Ala Ser Arg
225 230 235 240
Pro Gly Ala Gly Tyr Trp Gly Glu Tyr Ser Lys Cys Asp Leu Pro Leu
245 250 255
Arg Thr Leu Glu Ser Leu Leu Ser Gly Leu Gly Pro Ala Gly Pro Phe
260 265 270
Asp Met Val Tyr Trp Thr Gly Asp Ile Pro Ala His Asp Val Trp His
275 280 285
Gln Thr Arg Gln Asp Gln Leu Arg Ala Leu Thr Thr Val Thr Ala Leu
290 295 300
Val Arg Lys Phe Leu Gly Pro Val Pro Val Tyr Pro Ala Val Gly Asn
305 310 315 320
His Glu Ser Thr Pro Val Asn Ser Phe Pro Pro Pro Phe Ile Glu Gly
325 330 335
Asn His Ser Ser Arg Trp Leu Tyr Glu Ala Met Ala Lys Ala Trp Glu
340 345 350
Pro Trp Leu Pro Ala Glu Ala Leu Arg Thr Leu Arg Ile Gly Gly Phe
355 360 365
Tyr Ala Leu Ser Pro Tyr Pro Gly Leu Arg Leu Ile Ser Leu Asn Met
370 375 380
Asn Phe Cys Ser Arg Glu Asn Phe Trp Leu Leu Ile Asn Ser Thr Asp
385 390 395 400
Pro Ala Gly Gln Leu Gln Trp Leu Val Gly Glu Leu Gln Ala Ala Glu
405 410 415
Asp Arg Gly Asp Lys Val His Ile Ile Gly His Ile Pro Pro Gly His
420 425 430
Cys Leu Lys Ser Trp Ser Trp Asn Tyr Tyr Arg Ile Val Ala Arg Tyr
435 440 445
Glu Asn Thr Leu Ala Ala Gln Phe Phe Gly His Thr His Val Asp Glu
450 455 460
Phe Glu Val Phe Tyr Asp Glu Glu Thr Leu Ser Arg Pro Leu Ala Val
465 470 475 480
Ala Phe Leu Ala Pro Ser Ala Thr Thr Tyr Ile Gly Leu Asn Pro Gly
485 490 495
Tyr Arg Val Tyr Gln Ile Asp Gly Asn Tyr Ser Gly Ser Ser His Val
500 505 510
Val Leu Asp His Glu Thr Tyr Ile Leu Asn Leu Thr Gln Ala Asn Ile
515 520 525
Pro Gly Ala Ile Pro His Trp Gln Leu Leu Tyr Arg Ala Arg Glu Thr
530 535 540
Tyr Gly Leu Pro Asn Thr Leu Pro Thr Ala Trp His Asn Leu Val Tyr
545 550 555 560
Arg Met Arg Gly Asp Met Gln Leu Phe Gln Thr Phe Trp Phe Leu Tyr
565 570 575
His Lys Gly His Pro Pro Ser Glu Pro Cys Gly Thr Pro Cys Arg Leu
580 585 590
Ala Thr Leu Cys Ala Gln Leu Ser Ala Arg Ala Asp Ser Pro Ala Leu
595 600 605
Cys Arg His Leu Met Pro Asp Gly Ser Leu Pro Glu Ala Gln Ser Leu
610 615 620
Trp Pro Arg Pro Leu Phe Cys
625 630
<210> 33
<211> 1200
<212> DNA
<213> 人类
<220>
<223> LIPA多核苷酸序列
<400> 33
atgaaaatgc ggttcttggg gttggtggtc tgtttggttc tctggaccct gcattctgag 60
gggtctggag ggaaactgac agctgtggat cctgaaacaa acatgaatgt gagtgaaatt 120
atctcttact ggggattccc tagtgaggaa tacctagttg agacagaaga tggatatatt 180
ctgtgcctta accgaattcc tcatgggagg aagaaccatt ctgacaaagg tcccaaacca 240
gttgtcttcc tgcaacatgg cttgctggca gattctagta actgggtcac aaaccttgcc 300
aacagcagcc tgggcttcat tcttgctgat gctggttttg acgtgtggat gggcaacagc 360
agaggaaata cctggtctcg gaaacataag acactctcag tttctcagga tgaattctgg 420
gctttcagtt atgatgagat ggcaaaatat gacctaccag cttccattaa cttcattctg 480
aataaaactg gccaagaaca agtgtattat gtgggtcatt ctcaaggcac cactataggt 540
tttatagcat tttcacagat ccctgagctg gctaaaagga ttaaaatgtt ttttgccctg 600
ggtcctgtgg cttccgtcgc cttctgtact agccctatgg ccaaattagg acgattacca 660
gatcatctca ttaaggactt atttggagac aaagaatttc ttccccagag tgcgtttttg 720
aagtggctgg gtacccacgt ttgcactcat gtcatactga aggagctctg tggaaatctc 780
tgttttcttc tgtgtggatt taatgagaga aatttaaata tgtctagagt ggatgtatat 840
acaacacatt ctcctgctgg aacttctgtg caaaacatgt tacactggag ccaggctgtt 900
aaattccaaa agtttcaagc ctttgactgg ggaagcagtg ccaagaatta ttttcattac 960
aaccagagtt atcctcccac atacaatgtg aaggacatgc ttgtgccgac tgcagtctgg 1020
agcgggggtc acgactggct tgcagatgtc tacgacgtca atatcttact gactcagatc 1080
accaacttgg tgttccatga gagcattccg gaatgggagc atcttgactt catttggggc 1140
ctggatgccc cttggaggct ttataataaa attattaatc taatgaggaa atatcagtga 1200
<210> 34
<211> 399
<212> PRT
<213> 人类
<220>
<223> LIPA多肽序列
<400> 34
Met Lys Met Arg Phe Leu Gly Leu Val Val Cys Leu Val Leu Trp Thr
1 5 10 15
Leu His Ser Glu Gly Ser Gly Gly Lys Leu Thr Ala Val Asp Pro Glu
20 25 30
Thr Asn Met Asn Val Ser Glu Ile Ile Ser Tyr Trp Gly Phe Pro Ser
35 40 45
Glu Glu Tyr Leu Val Glu Thr Glu Asp Gly Tyr Ile Leu Cys Leu Asn
50 55 60
Arg Ile Pro His Gly Arg Lys Asn His Ser Asp Lys Gly Pro Lys Pro
65 70 75 80
Val Val Phe Leu Gln His Gly Leu Leu Ala Asp Ser Ser Asn Trp Val
85 90 95
Thr Asn Leu Ala Asn Ser Ser Leu Gly Phe Ile Leu Ala Asp Ala Gly
100 105 110
Phe Asp Val Trp Met Gly Asn Ser Arg Gly Asn Thr Trp Ser Arg Lys
115 120 125
His Lys Thr Leu Ser Val Ser Gln Asp Glu Phe Trp Ala Phe Ser Tyr
130 135 140
Asp Glu Met Ala Lys Tyr Asp Leu Pro Ala Ser Ile Asn Phe Ile Leu
145 150 155 160
Asn Lys Thr Gly Gln Glu Gln Val Tyr Tyr Val Gly His Ser Gln Gly
165 170 175
Thr Thr Ile Gly Phe Ile Ala Phe Ser Gln Ile Pro Glu Leu Ala Lys
180 185 190
Arg Ile Lys Met Phe Phe Ala Leu Gly Pro Val Ala Ser Val Ala Phe
195 200 205
Cys Thr Ser Pro Met Ala Lys Leu Gly Arg Leu Pro Asp His Leu Ile
210 215 220
Lys Asp Leu Phe Gly Asp Lys Glu Phe Leu Pro Gln Ser Ala Phe Leu
225 230 235 240
Lys Trp Leu Gly Thr His Val Cys Thr His Val Ile Leu Lys Glu Leu
245 250 255
Cys Gly Asn Leu Cys Phe Leu Leu Cys Gly Phe Asn Glu Arg Asn Leu
260 265 270
Asn Met Ser Arg Val Asp Val Tyr Thr Thr His Ser Pro Ala Gly Thr
275 280 285
Ser Val Gln Asn Met Leu His Trp Ser Gln Ala Val Lys Phe Gln Lys
290 295 300
Phe Gln Ala Phe Asp Trp Gly Ser Ser Ala Lys Asn Tyr Phe His Tyr
305 310 315 320
Asn Gln Ser Tyr Pro Pro Thr Tyr Asn Val Lys Asp Met Leu Val Pro
325 330 335
Thr Ala Val Trp Ser Gly Gly His Asp Trp Leu Ala Asp Val Tyr Asp
340 345 350
Val Asn Ile Leu Leu Thr Gln Ile Thr Asn Leu Val Phe His Glu Ser
355 360 365
Ile Pro Glu Trp Glu His Leu Asp Phe Ile Trp Gly Leu Asp Ala Pro
370 375 380
Trp Arg Leu Tyr Asn Lys Ile Ile Asn Leu Met Arg Lys Tyr Gln
385 390 395
<210> 35
<211> 3093
<212> DNA
<213> 人类
<220>
<223> CDKL5多核苷酸序列
<400> 35
atgaagattc ctaacattgg taatgtgatg aataaatttg agatccttgg ggttgtaggt 60
gaaggagcct atggagttgt acttaaatgc agacacaagg aaacacatga aattgtggcg 120
atcaagaaat tcaaggacag tgaagaaaat gaagaagtca aagaaacgac tttacgagag 180
cttaaaatgc ttcggactct caagcaggaa aacattgtgg agttgaagga agcatttcgt 240
cggaggggaa agttgtactt ggtgtttgag tatgttgaaa aaaatatgct cgaattgctg 300
gaagaaatgc caaatggagt tccacctgag aaagtaaaaa gctacatcta tcagctaatc 360
aaggctattc actggtgcca taagaatgat attgtccatc gagatataaa accagaaaat 420
ctcttaatca gccacaatga tgtcctaaaa ctgtgtgact ttggttttgc tcgtaatctg 480
tcagaaggca ataatgctaa ttacacagag tacgttgcca ccagatggta tcggtcccca 540
gaactcttac ttggcgctcc ctatggaaag tccgtggaca tgtggtcggt gggctgtatt 600
cttggggagc ttagcgatgg acagccttta tttcctggag aaagtgaaat tgaccaactt 660
tttactattc agaaggtgct aggaccactt ccatctgagc agatgaagct tttctacagt 720
aatcctcgct tccatgggct ccggtttcca gctgttaacc atcctcagtc cttggaaaga 780
agataccttg gaattttgaa tagtgttcta cttgacctaa tgaagaattt actgaagttg 840
gacccagctg acagatactt gacagaacag tgtttgaatc accctacatt tcaaacccag 900
agacttctgg atcgttctcc ttcaaggtca gcaaaaagaa aaccttacca tgtggaaagc 960
agcacattgt ctaatagaaa ccaagccggc aaaagtactg ctttgcagtc tcaccacaga 1020
tctaacagca aggacatcca gaacctgagt gtaggcctgc cccgggctga cgaaggtctc 1080
cctgccaatg aaagcttcct aaatggaaac cttgctggag ctagtcttag tccactgcac 1140
accaaaacct accaagcaag cagccagcct gggtctacca gcaaagatct caccaacaac 1200
aacataccac accttcttag cccaaaagaa gccaagtcaa aaacagagtt tgattttaat 1260
attgacccaa agccttcaga aggcccaggg acaaagtacc tcaagtcaaa cagcagatct 1320
cagcagaacc gccactcatt catggaaagc tctcaaagca aagctgggac actgcagccc 1380
aatgaaaagc agagtcggca tagctatatt gacacaattc cccagtcctc taggagtccc 1440
tcctacagga ccaaggccaa aagccatggg gcactgagtg actccaagtc tgtgagcaac 1500
ctttctgaag ccagggccca aattgcggag cccagtacca gtaggtactt cccatctagc 1560
tgcttagact tgaattctcc caccagccca acccccacca gacacagtga cacgagaact 1620
ttgctcagcc cttctggaag aaataaccga aatgagggaa cgctggactc acgtcgaacc 1680
acaaccagac attctaagac gatggaggaa ttgaagctgc cggagcacat ggacagtagc 1740
cattcccatt cactgtctgc acctcacgaa tctttttctt atggactggg ctacaccagc 1800
cccttttctt cccagcaacg tcctcatagg cattctatgt atgtgacccg tgacaaagtg 1860
agagccaagg gcttggatgg aagcttgagc atagggcaag ggatggcagc tagagccaac 1920
agcctgcaac tcttgtcacc ccagcctgga gaacagctcc ctccagagat gactgtggca 1980
agatcttcgg tcaaagagac ctccagagaa ggcacctctt ccttccatac acgccagaag 2040
tctgagggtg gagtgtatca tgacccacac tctgatgatg gcacagcccc caaagaaaat 2100
agacacctat acaatgatcc tgtgccaagg agagttggta gcttttacag agtgccatct 2160
ccacgtccag acaattcttt ccatgaaaat aatgtgtcaa ctagagtttc ttctctacca 2220
tcagagagca gttctggaac caaccactca aaaagacaac cagcattcga tccatggaaa 2280
agtcctgaaa atattagtca ttcagagcaa ctcaaggaaa aagagaagca aggatttttc 2340
aggtcaatga aaaagaaaaa gaagaaatct caaacagtac ccaattccga cagccctgat 2400
cttctgacgt tgcagaaatc cattcattct gctagcactc caagcagcag accaaaggag 2460
tggcgccccg agaagatctc agatctgcag acccaaagcc agccattaaa atcactgcgc 2520
aagttgttac atctctcttc ggcctcaaat cacccggctt cctcagatcc ccgcttccag 2580
cccttaacag ctcaacaaac caaaaattcc ttctcagaaa ttcggattca ccccctgagc 2640
caggcctctg gcgggagcag caacatccgg caggaacccg caccgaaggg caggccagcc 2700
ctccagctgc cagacggtgg atgtgatggc agaagacaga gacaccattc tggaccccaa 2760
gatagacgct tcatgttaag gacgacagaa caacaaggag aatacttctg ctgtggtgac 2820
ccaaagaagc ctcacactcc gtgcgtccca aaccgagccc ttcatcgtcc aatctccagt 2880
cctgctccct atccagtact ccaggtccga ggcacttcca tgtgcccgac actccaggtc 2940
cgaggcactg atgctttcag ctgcccaacc cagcaatccg ggttctcttt cttcgtgaga 3000
cacgttatga gggaagccct gattcacagg gcccaggtaa accaagctgc gctcctgaca 3060
taccatgaga atgcggcact gacgggcaag tga 3093
<210> 36
<211> 1030
<212> PRT
<213> 人类
<220>
<223> CDKL5多肽序列
<400> 36
Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu
1 5 10 15
Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His
20 25 30
Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu
35 40 45
Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu
50 55 60
Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg
65 70 75 80
Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met
85 90 95
Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val
100 105 110
Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys
115 120 125
Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser
130 135 140
His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu
145 150 155 160
Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp
165 170 175
Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val
180 185 190
Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln
195 200 205
Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln
210 215 220
Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser
225 230 235 240
Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln
245 250 255
Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp
260 265 270
Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr
275 280 285
Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp
290 295 300
Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser
305 310 315 320
Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln
325 330 335
Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly
340 345 350
Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn
355 360 365
Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr
370 375 380
Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn
385 390 395 400
Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu
405 410 415
Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys
420 425 430
Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met
435 440 445
Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln
450 455 460
Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro
465 470 475 480
Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys
485 490 495
Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser
500 505 510
Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr
515 520 525
Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro
530 535 540
Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr
545 550 555 560
Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His
565 570 575
Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe
580 585 590
Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro
595 600 605
His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly
610 615 620
Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn
625 630 635 640
Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu
645 650 655
Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr
660 665 670
Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp
675 680 685
Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr
690 695 700
Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser
705 710 715 720
Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val
725 730 735
Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg
740 745 750
Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser
755 760 765
Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys
770 775 780
Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp
785 790 795 800
Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser
805 810 815
Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln
820 825 830
Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala
835 840 845
Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala
850 855 860
Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser
865 870 875 880
Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys
885 890 895
Gly Arg Pro Ala Leu Gln Leu Pro Asp Gly Gly Cys Asp Gly Arg Arg
900 905 910
Gln Arg His His Ser Gly Pro Gln Asp Arg Arg Phe Met Leu Arg Thr
915 920 925
Thr Glu Gln Gln Gly Glu Tyr Phe Cys Cys Gly Asp Pro Lys Lys Pro
930 935 940
His Thr Pro Cys Val Pro Asn Arg Ala Leu His Arg Pro Ile Ser Ser
945 950 955 960
Pro Ala Pro Tyr Pro Val Leu Gln Val Arg Gly Thr Ser Met Cys Pro
965 970 975
Thr Leu Gln Val Arg Gly Thr Asp Ala Phe Ser Cys Pro Thr Gln Gln
980 985 990
Ser Gly Phe Ser Phe Phe Val Arg His Val Met Arg Glu Ala Leu Ile
995 1000 1005
His Arg Ala Gln Val Asn Gln Ala Ala Leu Leu Thr Tyr His Glu Asn
1010 1015 1020
Ala Ala Leu Thr Gly Lys
1025 1030
<210> 37
<211> 18
<212> PRT
<213> 人类
<220>
<223> 白蛋白肽
<400> 37
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser
<210> 38
<211> 18
<212> PRT
<213> 人类
<220>
<223> 糜蛋白酶原肽
<400> 38
Met Ala Phe Leu Trp Leu Leu Ser Cys Trp Ala Leu Leu Gly Thr Thr
1 5 10 15
Phe Gly
<210> 39
<211> 14
<212> PRT
<213> 人类
<220>
<223> 白细胞介素-2肽
<400> 39
Met Gln Leu Leu Ser Cys Ile Ala Leu Ile Leu Ala Leu Val
1 5 10
<210> 40
<211> 15
<212> PRT
<213> 人类
<220>
<223> 胰蛋白酶原-2肽
<400> 40
Met Asn Leu Leu Leu Ile Leu Thr Phe Val Ala Ala Ala Val Ala
1 5 10 15
<210> 41
<211> 17
<212> PRT
<213> 人类
<220>
<223> BM40肽
<400> 41
Met Arg Ala Trp Ile Phe Phe Leu Leu Cys Leu Ala Gly Arg Ala Leu
1 5 10 15
Ala
<210> 42
<211> 21
<212> PRT
<213> 人工的
<220>
<223> Secrecon
<400> 42
Met Trp Trp Arg Leu Trp Trp Leu Leu Leu Leu Leu Leu Leu Leu Trp
1 5 10 15
Pro Met Val Trp Ala
20
<210> 43
<211> 20
<212> PRT
<213> 人工的
<220>
<223> 小鼠IgKVIII
<400> 43
Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro
1 5 10 15
Gly Ser Thr Gly
20
<210> 44
<211> 22
<212> PRT
<213> 人工的
<220>
<223> 人类IgKVIII
<400> 44
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
1 5 10 15
Leu Arg Gly Ala Arg Cys
20
<210> 45
<211> 16
<212> PRT
<213> 人工的
<220>
<223> CD33
<400> 45
Met Pro Leu Leu Leu Leu Leu Pro Leu Leu Trp Ala Gly Ala Leu Ala
1 5 10 15
<210> 46
<211> 23
<212> PRT
<213> 人工的
<220>
<223> tPA
<400> 46
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser
20
<210> 47
<211> 16
<212> PRT
<213> 人工的
<220>
<223> 共有的
<400> 47
Met Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Ala Leu Ala Leu Ala
1 5 10 15
<210> 48
<211> 17
<212> PRT
<213> 人工的
<220>
<223> 天然的
<400> 48
Met Leu Leu Leu Leu Leu Leu Leu Gly Leu Arg Leu Gln Leu Ser Leu
1 5 10 15
Gly
<210> 49
<211> 16
<212> PRT
<213> 人工的
<220>
<223> Penetratin
<400> 49
Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys
1 5 10 15
<210> 50
<211> 11
<212> PRT
<213> 人工的
<220>
<223> TAT
<400> 50
Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5 10
<210> 51
<211> 18
<212> PRT
<213> 人工的
<220>
<223> SynB1
<400> 51
Arg Gly Gly Arg Leu Ser Tyr Ser Arg Arg Arg Phe Ser Thr Ser Thr
1 5 10 15
Gly Arg
<210> 52
<211> 10
<212> PRT
<213> 人工的
<220>
<223> SynB3
<400> 52
Arg Arg Leu Ser Tyr Ser Arg Arg Arg Phe
1 5 10
<210> 53
<211> 12
<212> PRT
<213> 人工的
<220>
<223> PTD-4
<400> 53
Pro Ile Arg Arg Arg Lys Lys Leu Arg Arg Leu Lys
1 5 10
<210> 54
<211> 12
<212> PRT
<213> 人工的
<220>
<223> PTD-5
<400> 54
Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg
1 5 10
<210> 55
<211> 15
<212> PRT
<213> 人工的
<220>
<223> FHV衣
<400> 55
Arg Arg Arg Arg Asn Arg Thr Arg Arg Asn Arg Arg Arg Val Arg
1 5 10 15
<210> 56
<211> 19
<212> PRT
<213> 人工的
<220>
<223> BMV Gag
<400> 56
Lys Met Thr Arg Ala Gln Arg Arg Ala Ala Ala Arg Arg Asn Arg Trp
1 5 10 15
Thr Ala Arg
<210> 57
<211> 13
<212> PRT
<213> 人工的
<220>
<223> HTLV-II Rex
<400> 57
Thr Arg Arg Gln Arg Thr Arg Arg Ala Arg Arg Asn Arg
1 5 10
<210> 58
<211> 13
<212> PRT
<213> 人工的
<220>
<223> D-Tat
<400> 58
Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln
1 5 10
<210> 59
<211> 13
<212> PRT
<213> 人工的
<220>
<223> R9-Tat
<400> 59
Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg Pro Pro Gln
1 5 10
<210> 60
<211> 27
<212> PRT
<213> 人工的
<220>
<223> 细胞穿膜肽 (Transportan)
<400> 60
Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu
1 5 10 15
Lys Ala Leu Ala Ala Leu Ala Lys Lys Ile Leu
20 25
<210> 61
<211> 17
<212> PRT
<213> 人工的
<220>
<223> MAP
<400> 61
Lys Leu Ala Leu Lys Leu Ala Leu Lys Leu Ala Leu Ala Leu Lys Leu
1 5 10 15
Ala
<210> 62
<211> 27
<212> PRT
<213> 人工的
<220>
<223> SBP
<400> 62
Met Gly Leu Gly Leu His Leu Leu Val Leu Ala Ala Ala Leu Gln Gly
1 5 10 15
Ala Trp Ser Gln Pro Lys Lys Lys Arg Lys Val
20 25
<210> 63
<211> 27
<212> PRT
<213> 人工的
<220>
<223> FBP
<400> 63
Gly Ala Leu Phe Leu Gly Trp Leu Gly Ala Ala Gly Ser Thr Met Gly
1 5 10 15
Ala Trp Ser Gln Pro Lys Lys Lys Arg Lys Val
20 25
<210> 64
<211> 27
<212> PRT
<213> 人工的
<220>
<223> MPG ac
<400> 64
Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly
1 5 10 15
Ala Trp Ser Gln Pro Lys Lys Lys Arg Lys Val
20 25
<210> 65
<211> 27
<212> PRT
<213> 人工的
<220>
<223> MPG(&#916;NLS)
<400> 65
Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly
1 5 10 15
Ala Trp Ser Gln Pro Lys Ser Lys Arg Lys Val
20 25
<210> 66
<211> 21
<212> PRT
<213> 人工的
<220>
<223> Pep-1
<400> 66
Lys Glu Thr Trp Trp Glu Thr Trp Trp Thr Glu Trp Ser Gln Pro Lys
1 5 10 15
Lys Lys Arg Lys Val
20
<210> 67
<211> 21
<212> PRT
<213> 人工的
<220>
<223> Pep-2
<400> 67
Lys Glu Thr Trp Phe Glu Thr Trp Phe Thr Glu Trp Ser Gln Pro Lys
1 5 10 15
Lys Lys Arg Lys Val
20
<210> 68
<211> 18
<212> PRT
<213> 人工的
<220>
<223> ApoE p1
<400> 68
Leu Arg Lys Leu Arg Lys Arg Leu Leu Leu Arg Lys Leu Arg Lys Arg
1 5 10 15
Leu Leu
<210> 69
<211> 30
<212> PRT
<213> 人工的
<220>
<223> ApoE p2
<400> 69
Leu Arg Lys Leu Arg Lys Arg Leu Leu Arg Asp Ala Asp Asp Leu Leu
1 5 10 15
Arg Lys Leu Arg Lys Arg Leu Leu Arg Asp Ala Asp Asp Leu
20 25 30
<210> 70
<211> 17
<212> PRT
<213> 人工的
<220>
<223> ApoE p3
<400> 70
Leu Arg Val Arg Leu Ala Ser His Leu Arg Lys Leu Arg Lys Arg Leu
1 5 10 15
Leu
<210> 71
<211> 20
<212> PRT
<213> 人工的
<220>
<223> ApoE p4
<400> 71
Thr Glu Glu Leu Arg Val Arg Leu Ala Ser His Leu Arg Lys Leu Arg
1 5 10 15
Lys Arg Leu Leu
20
<210> 72
<211> 34
<212> PRT
<213> 人工的
<220>
<223> ApoE p5
<400> 72
Leu Arg Val Arg Leu Ala Ser His Leu Arg Lys Leu Arg Lys Arg Leu
1 5 10 15
Leu Leu Arg Val Arg Leu Ala Ser His Leu Arg Lys Leu Arg Lys Arg
20 25 30
Leu Leu
<210> 73
<211> 40
<212> PRT
<213> 人工的
<220>
<223> ApoE p6
<400> 73
Thr Glu Glu Leu Arg Val Arg Leu Ala Ser His Leu Arg Lys Leu Arg
1 5 10 15
Lys Arg Leu Leu Thr Glu Glu Leu Arg Val Arg Leu Ala Ser His Leu
20 25 30
Arg Lys Leu Arg Lys Arg Leu Leu
35 40
<210> 74
<211> 10
<212> PRT
<213> 人工的
<220>
<223> Myc肽
<400> 74
Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1 5 10
<210> 75
<211> 39
<212> PRT
<213> 人工的
<220>
<223> ApoB肽
<400> 75
Ser Ser Val Ile Asp Ala Leu Gln Tyr Lys Leu Glu Gly Thr Thr Arg
1 5 10 15
Leu Thr Arg Lys Arg Gly Leu Lys Leu Ala Thr Ala Leu Ser Leu Ser
20 25 30
Asn Lys Phe Val Glu Gly Ser
35
<210> 76
<211> 18242
<212> DNA
<213> 人类
<220>
<223> CX3CR1_基因座
<400> 76
ggggcgggcc gtgcttacca ggccgtggac ttaaaccagg atgagagaac ccctggaggc 60
gtttaagttg gcagacttgg atttcaggaa gagctctctg gcttctgggt ggagaatggc 120
cagtggggta agtggtgaga ggaaagacag agaacggaga aggttagatg ggcttgggaa 180
attatccagg ccctggatgg aggtagagat gtgtgctcat gaacacggag gggattactg 240
atgtggggtg gatgagactg tcgtcaagag tgtgggacag gaagagaggg agagtcttgg 300
ccagatccaa gaaaggagcc ctcagaagag gaggggagtc agaggcaagg aaggggctga 360
ggcagccagc ccagctgagt ggaccccagg agaggtatca aggggtggtg tggggtgggg 420
aggggccagt gtcagaaagt ggatggggag cggcctgact ctgcttttgt cctgtggcct 480
tctggccaaa ggcagggaaa ggtggccaaa cactgagacc aagaacaaag aaagaaaact 540
gctggtggac ttcttccacc atgagcaggc caccaagccc gcagcactgc actgcagccc 600
ccagctctgt cctggggttg ggggaggtga ggaggggcaa ggtggggagc acacagagca 660
cccgctgtcc tcggaacacc acagcgacta gaggtaaggg agcaccggat gtggctggga 720
tgtgggcagc aaggggccag aggggccttg aaggggtcac agaccattta atgaaggtgt 780
attgaaggcc accatgggcc aggccctagt tagggatgga tcagaattat atagcatatg 840
ccaggggtca ggcaggtaat gaagtgatcg gaaggtgatg aggcagtggc agttgagatt 900
cacgttgcag tcgccccaag ctggccaggc cagggagcag aagcatggct ggatgccgga 960
gcccaccagg ctccccactg cagggcaaga gtggcagggg gagagactgt gaaaggagca 1020
taggccaggt cctgggtgaa agctgtgtcc tcagccttga ctgatgggta tagggagcca 1080
ctaaatgcct tggggcagag aggtgaggaa aaaaatattt accgagcatc tacaaggtgc 1140
aaggtactca ctagatgcct tcagtaccaa agcttctcaa acttagtatg catatcactc 1200
ttctaagaat ttcattaaaa tgcagattct aattcagcag atatagggca gggcttgagg 1260
tgctgtcttt aataagctcc cagtgcctgg gactgcactt tgaggagaag agctgtgtgt 1320
gccccagtgt ggtccagtga gtactctggg ctccctctcg tgggcaggga agctgagggc 1380
cccatgagct ctcccagctt cctgaaggct ccccattaat gagagctgac tgtgctgtgc 1440
tttgctgact gcagggcctg ctccctgccc cccacctcca ggttggggta agtggcacct 1500
ctctccctcc agctccgcag tcttccctga ggtttagatc ttccaggttt ataaagtcag 1560
gccctcctgt tggcagctgg cctccaccct ggagtatctg agcttgcctg tggcagcatc 1620
taaagatagt ctcccttaca ggaaacaaga tactattggc taactctgca aataaaatgc 1680
tcttagaggg aaggaaaggg aaatactcgt ctctggtaaa gtctgagcag gacagggtgg 1740
ctgactggca gatccagagg ttcccttggc agtccacgcc aggtaggtgc acaggactag 1800
ttgggtacct gtgggtgggg tggagcagtg gacagctaat aggttaataa tgcctgtttg 1860
cttacgtgca gacaatggaa accattttcc tggggatgtt gtagcctaaa tatgtccaag 1920
gggatggaag agtgggaggc aaggggtgat cagatcattt ataatacact caacctggtg 1980
gaatagtatt agaagcatta gtaattacat tttagagaca tggagaaaag ctcatgattt 2040
taaactaact gaaaaaagca tgaaaaattg catctggatg ctgttgagga attattgcta 2100
attttttgag atgagaaatt gtattaaagt ctttttcaaa aaagagtcct taacttttag 2160
agatgcacac aagtgtttat gggtgaaatt aaataattca gtagagacat taagtgggaa 2220
atagaggaaa tattgaccat gggttgctaa tagttgaagc caggtgttgg gtataaggag 2280
gttctcgctg cttttatttg aaaagttgct ttttatttga aaatttaata ataaagagtt 2340
tttaaatttg tatctgtatt ttaatataaa tataaatgca cttaatataa atataaaata 2400
tgtataacat ttagatagag aaaagctaaa agattactgt ggttgattct aggaaactgc 2460
attgcagata gtttcatggg tttttttttc ctttttcttc cactttttgt accatctatg 2520
ggtttttgtt tgttttttgt tttttgggtt ttctttcttg tttgtgtttt gttttttgag 2580
acggagtttt gctcttgttg cctaagctgg agtgcaatgg cacagtctcg gctcactgca 2640
acctctgcct cctgggttca agtgattctc ctgcctcagc ctcccaagta gctgggatta 2700
taggcatgta ccaccgcccg gctaattttg tatttttagt agaggcgggg tttctccatt 2760
aataaattcc tggcacaaat ttagtgttca attttgatat atgttgttat aaccattgtg 2820
aggatactca ggctcaggtt tgtgtgggtg gaaaacatgg tcttcagaaa gaaattatga 2880
gtgcaagaca ggaggaaatc catcagaggc cccagctgag gactgaccac ggcttgttat 2940
ttctcttgcc ttgcctctgg caatcacagc ctcacagagc ctgcaatcct tgctttgtga 3000
gtttatagct cagtccagag aatggctaag aaagtttagg attctttcaa cacccactcc 3060
acaaaaaaaa aaaaaaaaaa gaaaagaaaa aaaaattaat ttttgaaata cttgaggtag 3120
aaaacttgag gcagaaaaaa attgagccaa aaaaaaagga aaattgaacc acgtgaaagc 3180
aggcaagaaa gcttgcattg ctcagggcat cccaggccca gagggcgctt tggagggagc 3240
tgggtttcct gagaggaggc agggtgggtg acggacctgt gctggagagc cttgaggacc 3300
actgtgggtt gggaatgggg gcagtggatt ggggttcaaa acccctggga atgagaaatg 3360
ggctcaggaa ggctagggtg gattctttca tcttcctctt tgcttggctt tattttcaca 3420
aaggaaggca gggcaggaaa tagtctcagc ccaacttcag tgtggttctt cttagtgctc 3480
aggcttacct ggcacttgcc acacctctgg gatgggagca cctactatcc atcagccacg 3540
tgccagtctc cacaaagtct gctcctgaac cctgctcctc agctggcccc acttcacaga 3600
tggggacata ggcagcttgg ctttggaatg aaggaatgaa gtcaggaatg aagtcctggc 3660
tctgcacttg gtgactgtgc actgggcttg ctaagtctgt ttcctgcttt taaaatggag 3720
attgtccatc agcctttgaa gccatgtaat gggtatgtgt caactttctg caaggattaa 3780
aggcatggta taggaagtcc caaacacact gcctgaccca tctttgatgc tcaagaaacg 3840
atatatgttg ttgtcatgag gaaactgagc ctcagaaagt ttggatacct gaaaaacact 3900
gactactatt gaatgaggtt gtgaagaatc cagagctgta ggggcaggaa agcaaagaac 3960
gtattagagc tgacccagtc aggacgatcg tctatcccct tcctcacccc accccatccc 4020
aggaggaagc ctgcccggcc ctaggcagct atggcacagt ggcaatgtca ggtatggttc 4080
tccctagcca gagaccctag cctcaaaaaa cctccttctt gggatccagg catccaactg 4140
ctcctcccca gccccagcct ctgacccagt atcctgagtc cagagacgtt tggaaccagc 4200
acctgtaatg gaggagctga acaaggaggg gaacttctgc tgctccacag caggtcacgg 4260
tcataggagg gagtggaacc agaatggcag aatccagatc ttggctgcct ttcccaagga 4320
cttgttctga ttcctagcag cacagcccag gcattccgag aagttgggct ctctggcatc 4380
actcactctg cccagaagag ccaggggaaa gttggggctt ctagctgaac cttgatccca 4440
cctgccctct tgaggggctc agaatctgct ggctgcttca caggtgggat tctcacggca 4500
cgctggccac agctgatgct tcgaccccct catcttgttt ggccaaagtg cagcttttta 4560
gcttgtgagt aaggaagaaa agctgtatca tatgtcttta aacatcttcc tagaccacct 4620
ttgttttccc cttaaagtgt gcttaaggag aaaatggaaa gtctcttttc agtgtgttgt 4680
attttgttta ttgcaaaata caacacactg aaagaacaat gtctgggtta gcaaagtatt 4740
agatttaatt tcccacatta ctaccatcca ggctgagaaa gagaacccca gaagcctctc 4800
tcatgtccct tcctgaccac agcctcttcc tctcccacaa agaaccacaa gtctgacttc 4860
tatggtgatc acttccttgc ttttccctat agtttgactg aatctaaata tcatccctaa 4920
acaatatagc ttagctttgc ctatttttga tcttcatatt tggattcata ctttttggtt 4980
tggctcaaga ctaaactttt aaaatgcatc cacgttgtag gagatgtaca tgcacaaaaa 5040
ttttcacggc aacattgtcc aaactagcaa caaactgaaa gccacctatg tgtgcattag 5100
cagtagaaat ggcaataaat catggactag tcacacagtg gaatcctacg cagcaaggag 5160
aattagcagt ctacagccaa accaacagca tgggtgagat gcttccagaa atactgagat 5220
gaatttagag ataaaggcac aattggtcca tatctacagg gcacttaatc cagtgcatct 5280
ccactagaca aaatttgtat ttccatgagc aagagtcatt tgcactgcta tctgctataa 5340
cctacggtgc tgtaaaatta gctcaggcaa taaaaggggg aggtagcccc aaagagtatg 5400
ccagaaagga ctcccagtaa tcttcagtgt gtgtctattt caaagtcttt catcattttt 5460
ccttgtagtt acttagtgtg gaatttcaga cccctctcta tgtccctctt ctcccttttc 5520
agccttggct ttctctgcat ccttccccga agccctgcac tcagcctaaa ctgactttcc 5580
tgaacactct gggagcatgt gggctcctcc caactccacc atcttcactg ccttctgttc 5640
ctatttccct ctgcctggcc ttggccccag gaaaccttcc tatgctcaga ccctctgtgc 5700
ctttgtcttc aaagcccacc cactattcac tgccacctcc atcttggtca acctggaaga 5760
ctttccccat ccttaaaaca tcagctcaaa cggcagattt tttttttttt ttttgtgata 5820
tcctcttgat caccctcccc cagtttttaa ggagacagat atagaggttc aatccttggg 5880
cttcccatga cttttcttat attctgttac tgagcaataa taaacacttc taggaactgt 5940
atcttaaaca cttttgcctc tacagaatct agcacagtgc ctagtattgg tgaaatataa 6000
ttaacaaagt cttctttcaa cacagagatt ctctccacaa aaggagtaga gaaagaacag 6060
ttttattatg gaataagcag taaaccaaaa tatgcagagc attataggcc atctactaag 6120
aggttgcaag aacagaaaga aatctccccc ttttgtatag ccaagtagat acaacctgtt 6180
acatacatgt tatcaaggca aacaataact gttcctcaag taagaggtct tgccagcacc 6240
gtttgccgta catggttcac tctaaattta cctggtaatt agggtaacca cttgtgttag 6300
ctaactggct ctacccagag gaaaatcaaa tttatcttta agacaagggg taattttgca 6360
gcactgagca aggctcttca gttaggctca taccttccca cagaaactaa gagatagaag 6420
cactatctcc cttaggtttg tttacatttc aaagagatga cgcccaggtc cttgggaaag 6480
actagcttag ctcataaagc tgacaaaaag cctatctagt ttcaaaagga tttacacatg 6540
ttcaaagaga ggagaaagta tgtaaaagtt ttctaggtgg gcacggtggc tcacacctgt 6600
attcccagca ctttgagagg ctgaggcggg tggatcacct gaagtcagga atttgagatc 6660
agcctggcca acatggtgaa accttgtctc tactaaaaat acaaaaatta gctgggcatg 6720
gtggtgggcg cctgtaatcc cagctacttg ggaggctgag gcaggagaat cacttgaacc 6780
caggaggtgg aggtggcagt gagccaagat ggcaccattg cactccagcc tgggcgatga 6840
gagtgaaact ccatgtcaaa aaaaaaaaaa gttttctaaa gtaaatgctc tgagaaaaaa 6900
acagaaggtg aggagatctc tgtccttatt tttaacaaga ataattaaat gtttttattt 6960
ttaatttcta cttagactag aatatggtac agatgctcaa aaatattgac ttaattaata 7020
attaaacaat taacaagtct atctctttcc taattattaa aaaaattatg aagtatttcc 7080
cttcaaaatt tcacagttta ctttgacata aataaataaa taccataaag tattttgaag 7140
aggaaaggga agggtggggc ttcaaacaca aaataatggc aggttttgta aaggggcaat 7200
tcactaaacc caataggatt ctcctgttgc tatttttttt tttttttttt ttttggtggt 7260
ggttggaggg aagggttggg tgtgcatttg gcctgtgtga aaaactggtg ggtagacaat 7320
gccatgctgt tctagatggg ctcattgcta taggaataga tagtcactga atttacttgc 7380
ataggggatg gggtataaaa tgtttcctta tagctcctta acatggaatt cagcacccct 7440
ctccccatca gccttagctc tctctgaatc ccaagggata tgtgttataa aaatagctgc 7500
catcataaat gagaaaacca tcaggacctg gtaaaacttg gcttcccaaa cagtcagggg 7560
tctgggcatg gcagccgact gagaaccttt ctatctagta caaggtaaac aagatttgcc 7620
aagacttgat caactgatcc agctccctat ctccaaacag aacctcatct gaatgctcac 7680
aggctgtgcc ccagaagtgt agaagtgtca tgttccctgg gcaggctgct gggcagcctc 7740
tctgttgaca atagaccaca cttttgctga cctaggactc atgttgctct ttaagactgc 7800
ttccttggcc aggcatgatg gctcacacct gtaatcctgg cactttgaga ggcccaggca 7860
ggaggatctc ttgaggccag atgttcaaga ccagcctggt caacatagta agaccccata 7920
tctaccaaaa atagctgggc atggtggtgc acacctatac tcccagctac ttaggagact 7980
gaggtgggag gattgctaca tcccaggagt tcaaggctgt agtgagctat gatcatgcca 8040
ctgcactcca gcctgggcaa cagagcgaga tcctgtctca aacaaacagt ttccttctgt 8100
ttgattcttg ctgaaaaatt gagcatgcca gagctagcaa ggctcttaga ggtggtctgg 8160
tccaatgctt taatttcata catcaagaaa ctgaagcaga gcagagtgac ctgcccaggg 8220
tctctcagcc attcatgctc agaaatgtat gggctcctgt gaaacatgtg gctcttaaaa 8280
gcactatcat atatttgaag gcagaaaata ggctaaacct tcagccttca gacttttcct 8340
ctccagagaa aatgacccca gtttcctcac tatggttgct gggagctaga ttcctgggga 8400
tctggcagtg tggaccacct agtggtggct agaggagcaa ataatatccc gcattccatt 8460
ttccactcac caatccctga ggggcagcct gctgggttat gagcccacag ggggagaacc 8520
ccaacgaatt cagagatgca tcatggacca gtttctctta aggggcctgg gtctactatt 8580
ttcagttcta cttcgagaga agtggcctgc aatatcctgc agatttcccc tccagggaga 8640
aaagcattgt gcggtgcaag gagcacaggc tttgtggaaa gaggcatctg gggttgagat 8700
cctggctctt ttgcttcctt gaacaagtta accaaatctc tgggcctctg ctggttaatt 8760
tataccatgg ggatcatcat ttctccagtg gggttgtgaa gagaatgtgg tgggatcttg 8820
tgtgtggagc atgacactta gcaggcatcc gggaatggca gcctcctccc tttctaaact 8880
ggggctttct gagggtgact tcagattcca caatgtcaac agcacaatgg catcctcata 8940
aggaaagttt gggttggggc tcctcaagca attctctact ctcatttggt acaaagaaaa 9000
aaattaagcc tcacaatttt cttggcacca gactgaacct caaacccagt cttcactttt 9060
actaaaaagc cataaacaga gaccaggagg gtaaaaacta ccagaagata cactggattt 9120
agaaaacagt aagctggatg tgaagccaaa agagagggag aaagcaacat aaaagaatgt 9180
cagattgaag aagaaatgga ttctggccac ctaaagaaga agggaagtat agaaaaggga 9240
agctgattgg aaacaatggg taatgatgag tgtccctccc ctaaaaagtt aaaaaataaa 9300
tgagcaggca tgagaaaagg aagtaggcca gaggaagtag accaggatca gccacggatg 9360
tgagtgggga attttacaaa tttctacttg ggtgtgaaac atgtgtacac tcaaagctct 9420
gtctaggttc accgaaactc tcccagctca aggccattta gtaaaacctt ggcttaactg 9480
aatagtgggt aaggaggcct gaggatggcc cagagaaggt ttaaattctt actggctgct 9540
gcactaagtt gtaaagtgca gccttagttg atgatgcctt tattagtgca acatcccaga 9600
atgcatgcgt cttacaaccc ttgtggatat gaaacccagc tgggtagaca ctgcaaagtc 9660
ttctcatttg attcttccac ttggtttcta gtgtccctca gggacaaagg aaagccatgg 9720
tccagtctaa gatgaaaacc aattagacct ctggcaggcc tttgaccacc ctgagggcca 9780
cccccaaggc acggccacac tcgcatctgc tgccaggagg ccctatctta ggctcagctc 9840
ccaaaccttg aacatcttgg aggatccaca aataggaggt acactcagct caggctcagt 9900
cttccttaaa aagcgccttg ctaaagctat caagttcact ggaatacttc tgcgaaggac 9960
acagcttcag cgatgtcaga ttttttatgt aaatggtgcc ttcacatgct ctggggcatt 10020
tggctaccaa gggcggtttg aactagctcc agcacacaga atacaagtct cttcagaacc 10080
aggcaaaacc ctatgttgcc caatgactcc tgctgtttct tgagatttgc acagaagaca 10140
gagctgcaat tacccacgct gatatctatt tcatgaccac atatgttcaa aagccacatg 10200
tgagaggtat ggttgaaatg agaggttgtg tttgccaagt tgtcttctga ctgtggagag 10260
ctggtgagcc tcttctcatc tcctggggct ccatattata gagctgacga atctcttttc 10320
ttgctccttg aagtctttca ttcacttatt tattaattca tttaacacat caggcaccta 10380
ctaacttctc agagttcaag gcttcctagc ctatgatcag aaaggacacc tgtgtgctca 10440
tgagcacccc tgggatcagg gtgactgata gggtgctgtc atcactacta gatgaaactc 10500
tttggaacaa aggtctagga tataatattt atccttctgc aaatattcat atggcattcg 10560
ctgtgtacca ggccttctgt tgaacattgg cctgcagagc tgaagaggac gtgggtcttc 10620
tcttaggaac tcctagtctt gggaaaaagg aatggggaag ggctgtaatg tgaagttaaa 10680
aaaaagtgct gaggccgaac acatctgggc cctcactgca gccctattgc acacacactg 10740
catcacctcg aacaagttat tcaccctctc tgaattcatc tatttgccca taaaaataga 10800
gatgatcctt ttatatgttg gctaccactt attatgtgca gcatgcttgt tattgtacta 10860
agttactcat tttttagttt ttcatataac tcatattttt gttgattttt attttaaaat 10920
tccaaacgaa ttaattaaac tattttccaa aatacgtagt atgtgtacat ggtaaaaaac 10980
atttccaaaa gtttaccata aaaactgtct cctttcccat atcctcaatc cttcagaatc 11040
cctctccagg gataattacc accaccagtg tattccttaa gagatattta aactttatac 11100
aaaatacgca cacatcattc ttttccacaa atgacagcat actatgtaca tggtacctca 11160
cctagctttt ttcacttacc agtatatctt agagattgtt gcatgacaga atatacagat 11220
ctgcctgttt ttgttgtttt tcccaagttt ccaagagcta gaaactgttt ggtttttaag 11280
cagctgcttg gtattccatt aattggactt atcgtgcttt gatctgtccc tagtgatgga 11340
cattggggtt gtttcccttc atttatattt gaagcttgtt gcagtgacag tgtacacact 11400
tgcttgagca tgtgtgtgtc tacgataaat cccaataagc aatttaaagt aatttaattc 11460
ttatgctctc aacaaaccta agaggttatt tttttagagg aggaagctaa ggctgttgtt 11520
ttgatgcctt tttaccactg gacttgggac tcaactgttt gatagtcatc gagtccttga 11580
ctcttctccc ctgccaggat ttggccccta agcccagggc ccgagtctcc tccatcttca 11640
agggagagtg ggaacagcac aggccttggc ctcagtcctg ctccccctgc ttctagctgt 11700
gggatgggcc aggtgcttca cccagctgtg cctcctgtga ggcacagtgt gtgcaaaatg 11760
gaaatgtgaa catgaagatc aaaaatgtcc ctcaatgacc agtgctgttc ctcagagtca 11820
cgtgggaact catagaaagc gatattggta ctgctctttc ctctgtagca tggtccagat 11880
ggctcatagc agggaccatg atatgctggg tgagcaccca ctgcatgcac ccactgtgcc 11940
agcactgaga gactcctgtg ggagccacag caattctagg gtcttcactg gggactctga 12000
gacagcaggg agctaggatg agggctgcag agtgttcgtc tgccctcact gagcagaccc 12060
cctggatggc agggagcagt cccaagccag atggatgccc ataaccagcc atttggctct 12120
caatacataa tatcaccacg tatcaggcaa aaccatcctg cccagagcat tatctgaatt 12180
tgcatcccat ctgcagaaga tacattcacc cacttcttcc attctgtctt aatcaaagtc 12240
tttatgtgaa ttttccccat tgagaagaca agccccttcc tggcttagac tgtacctgac 12300
tgatcttttc atgagctcct tgccaagcca gaccaccccc agcttatatg gagacttggt 12360
gcaaattaga gatgcccctg tgcacgtggc agccctgagc ccaagcaccc agtaaggcaa 12420
agggcctgat ttgggacccc tctgccactc caccaggcaa tcagttgctt atttctaact 12480
ttcccttcct tctccacatt tgtcccattc cttcctctca tcatgaatat ccccagaggc 12540
attcagcagt gcagtgaatt aaatatagaa cttttttttt tcagaattgc agaacggatt 12600
agatcaatat taatccaaac agagcaatga gcctgacagt ttagtaaaag ctcaataaag 12660
ggtggcttac ctcccccaaa ataatctgaa aagaaagcat gtcttatttc agggggaaaa 12720
aaaaataaag tgacctttaa agaccaaatt cccaggatac ccagggtgga ggtggaacat 12780
gggagtccac aggcagcctg gatgtttcca aagatccaaa gggcttttgc ttcctcacat 12840
aatgcaggaa acaaattgaa catgtattaa gtgcttgctg tatgtgacac actgtgccag 12900
gtgctcccct taaaacagtt ctgtgggcag gcatgagaat gaatcccgat cttacagaca 12960
aggaatgtta ggctcagagg tttcaagctc acccatcact cagccagaga ggacagatgc 13020
aggattcaat ctcgggagtg cccgagtcca cagaagttcc tgtgctgaag gaccgaccac 13080
aggcacataa agagatgcga gacaattttt actggatttg gccacctctc gaggtcggct 13140
ttgccagctc ttctcactgg gggaagggga gggagaaagt agctagctcc agggtcccta 13200
acatagaacc accaaggact tgactatttt tactcataca gcagcttgtc tgggaagatc 13260
atgctctgtg acaagctgca ggcactaagt agcaatttct gtttcccaca tattagcttg 13320
agtcatataa aactgacatg gatgtggctc aaaaatagct gtatgtcagc cattttatac 13380
catttgactt aaatgttatt aattaacgtc acagccagag attattctct gagaaaaggg 13440
cattgtagcc tgaagcagag aaagcataca cgttccctgg ggttgagaac tcatcacagc 13500
ctgagacagc ttaggttgta aagccccggc ccacttatcc caggagagtc tgggtgagat 13560
gcaggcccca aagcagaggc tgggaagcga gaagtgacac accctggctg ggtgggccct 13620
catcttggtg agacaccacc tgggtaaaac catcatggaa agggtgtagt ggggcgtgga 13680
aactccctcg gttaaagcgt gagctttgct gtaagttgtg gtaaggaggg aggcagtgac 13740
aaccaggagg cctgttttga gggtttctga gggacccatc tgtggtatca cgaggagacg 13800
cccagaggag ccgtgtgaaa gggctgcctc ccagccggct ctggagtgaa tgagcagcaa 13860
gtcctggctg cgaaaagaag gggagtgcag cctgcagaag tgtcttcttt tttcaattcc 13920
tgctcagaag gaaacaggag ataagaatag tggggaagtc caaaccaaag tgaactatag 13980
ggctggtaat cgtaggggga attagtcacc cggagactag cccagcagac taacggagcc 14040
ccatcctcca tcttgaatca gtcagcccct ctatgactgc agagtcctga atgatggcaa 14100
caccttctct tcacttagcg ttgtaggatg accaacagtc ctgatttgcc tgggactgag 14160
gggttcccaa tagatgggac tttcagggct aaaaccagga aagtcctggg cagcccaaaa 14220
caaggtagtc actctagagt gtatgactct gtctgatacc tgctaagaaa gagaaggact 14280
tgttgattat aaggagaaga ggaggtgaaa tggttctcaa aaaacaaaga tgagggcttc 14340
cgggtgctgt tctgcccaag gctctgggtc tgaggcttct ctctccaggc ctagcttcat 14400
ggaaaagtaa ggggccagag ggtggaaaag gtggaaacaa aggaagagga tggagaattg 14460
ctttggggaa gtttggactg gaagtgtgaa ttacagctgc acccccaatt caccccatct 14520
cacccccctc cccctcctgc tcatggttct ccctttctca tccacacatt ggtcaaacta 14580
gctagctttt ggagagattt tgggcagtaa aagtaaaaca gatctgtctc aagcttcaaa 14640
aagcctagag ctggctgggc gctgtggctc acgcctgtaa tcctagcatt ttgggaggct 14700
gaggcggaag gataatctga ggtcaggagt ttgagaccag cctggctaac atgatgaaac 14760
cccatctcta ctaaaaatac aaaaattagc caggcgtggt agtgcacgcc tataatccca 14820
gctatttggg aggctgaggc aggagaatcg cttgaacccc aggggacaga ggttgcagtg 14880
agctgagatc gcaccactgc actccagcct gggtgacaca gcgagactcc atttaaaaaa 14940
aaaaaaatgc ctagagccaa atgctcacag agccatttac tgcatggctt tgggcaagtc 15000
aaaggagtcc gcctctcctg tcagaagagt ctgttgcagt cttcatcaca agactgttgt 15060
ggggattaaa caagatggca agtgggaagt tgggaaatgt agtgtgcacc caaccaatat 15120
ttgtttcttc ctgcctgcct acatatgagg ccacacagaa ttccaacttt gtttctctga 15180
taactaacac agttacttgt ttttctttct gatccaggcc ttcaccatgg atcagttccc 15240
tgaatcagtg acagaaaact ttgagtacga tgatttggct gaggcctgtt atattgggga 15300
catcgtggtc tttgggactg tgttcctgtc catattctac tccgtcatct ttgccattgg 15360
cctggtggga aatttgttgg tagtgtttgc cctcaccaac agcaagaagc ccaagagtgt 15420
caccgacatt tacctcctga acctggcctt gtctgatctg ctgtttgtag ccactttgcc 15480
cttctggact cactatttga taaatgaaaa gggcctccac aatgccatgt gcaaattcac 15540
taccgccttc ttcttcatcg gcttttttgg aagcatattc ttcatcaccg tcatcagcat 15600
tgataggtac ctggccatcg tcctggccgc caactccatg aacaaccgga ccgtgcagca 15660
tggcgtcacc atcagcctag gcgtctgggc agcagccatt ttggtggcag caccccagtt 15720
catgttcaca aagcagaaag aaaatgaatg ccttggtgac taccccgagg tcctccagga 15780
aatctggccc gtgctccgca atgtggaaac aaattttctt ggcttcctac tccccctgct 15840
cattatgagt tattgctact tcagaatcat ccagacgctg ttttcctgca agaaccacaa 15900
gaaagccaaa gccattaaac tgatccttct ggtggtcatc gtgtttttcc tcttctggac 15960
accctacaac gttatgattt tcctggagac gcttaagctc tatgacttct ttcccagttg 16020
tgacatgagg aaggatctga ggctggccct cagtgtgact gagacggttg catttagcca 16080
ttgttgcctg aatcctctca tctatgcatt tgctggggag aagttcagaa gataccttta 16140
ccacctgtat gggaaatgcc tggctgtcct gtgtgggcgc tcagtccacg ttgatttctc 16200
ctcatctgaa tcacaaagga gcaggcatgg aagtgttctg agcagcaatt ttacttacca 16260
cacgagtgat ggagatgcat tgctccttct ctgaagggaa tcccaaagcc ttgtgtctac 16320
agagaacctg gagttcctga acctgatgct gactagtgag gaaagatttt tgttgttatt 16380
tcttacaggc acaaaatgat ggacccaatg cacacaaaac aaccctagag tgttgttgag 16440
aattgtgctc aaaatttgaa gaatgaacaa attgaactct ttgaatgaca aagagtagac 16500
atttctctta ctgcaaatgt catcagaact ttttggtttg cagatgacaa aaattcaact 16560
cagactagtt tagttaaatg agggtggtga atattgttca tattgtggca caagcaaaag 16620
ggtgtctgag ccctcaaagt gaggggaaac cagggcctga gccaagctag aattccctct 16680
ctctgactct caaatctttt agtcattata gatcccccag actttacatg acacagcttt 16740
atcaccagag agggactgac acccatgttt ctctggcccc aagggcaaaa ttcccaggga 16800
agtgctctga taggccaagt ttgtatcagg tgcccatccc tggaaggtgc tgttatccat 16860
ggggaaggga tatataagat ggaagcttcc agtccaatct catggagaag cagaaataca 16920
tatttccaag aagttggatg ggtgggtact attctgatta cacaaaacaa atgccacaca 16980
tcacccttac catgtgcctg atccagcctc tcccctgatt acaccagcct cgtcttcatt 17040
aagccctctt ccatcatgtc cccaaacctg caagggctcc ccactgccta ctgcatcgag 17100
tcaaaactca aatgcttggc ttctcatacg tccaccatgg ggtcctacca atagattccc 17160
cattgcctcc tccttcccaa aggactccac ccatcctatc agcctgtctc ttccatatga 17220
cctcatgcat ctccacctgc tcccaggcca gtaagggaaa tagaaaaacc ctgcccccaa 17280
ataagaaggg atggattcca accccaactc cagtagcttg ggacaaatca agcttcagtt 17340
tcctggtctg tagaagaggg ataaggtacc tttcacatag agatcatcct ttccagcatg 17400
aggaactagc caccaactct tgcaggtctc aacccttttg tctgcctctt agacttctgc 17460
tttccacacc tggcactgct gtgctgtgcc caagttgtgg tgctgacaaa gcttggaaga 17520
gcctgcaggt gctgctgcgt ggcatagccc agacacagaa gaggctggtt cttacgatgg 17580
cacccagtga gcactcccaa gtctacagag tgatagcctt ccgtaaccca actctcctgg 17640
actgccttga atatcccctc ccagtcacct tgtggcaagc ccctgcccat ctgggaaaat 17700
accccatcat tcatgctact gccaacctgg ggagccaggg ctatgggagc agcttttttt 17760
tcccccctag aaacgtttgg aacaatctaa aagtttaaag ctcgaaaaca attgtaataa 17820
tgctaaagaa aaagtcatcc aatctaacca catcaatatt gtcattcctg tattcacccg 17880
tccagacctt gttcacactc tcacatgttt agagttgcaa tcgtaatgta cagatggttt 17940
tataatctga tttgttttcc tcttaacgtt agaccacaaa tagtgctcgc tttctatgta 18000
gtttggtaat tatcatttta gaagactcta ccagactgtg tattcattga agtcagatgt 18060
ggtaactgtt aaattgctgt gtatctgata gctctttggc agtctatatg tttgtataat 18120
gaatgagaga ataagtcatg ttccttcaag atcatgtacc ccaatttact tgccattact 18180
caattgataa acatttaact tgtttccaat gtttagcaaa tacatatttt atagaacttc 18240
ca 18242
<210> 77
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T01
<400> 77
tctttcctct gtagcatggt ccagatggct catagcaggg accatgata 49
<210> 78
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T02
<400> 78
tatgctgggt gagcacccac tgcatgcacc cactgtgcca gcactgaga 49
<210> 79
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T03
<400> 79
tgctgggtga gcacccactg catgcaccca ctgtgccagc actgagaga 49
<210> 80
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T04
<400> 80
tgagagactc ctgtgggagc cacagcaatt ctagggtctt cactgggga 49
<210> 81
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T05
<400> 81
tcctgtggga gccacagcaa ttctagggtc ttcactgggg actctgaga 49
<210> 82
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T06
<400> 82
tgggagccac agcaattcta gggtcttcac tggggactct gagacagca 49
<210> 83
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T07
<400> 83
tcgtctgccc tcactgagca gaccccctgg atggcaggga gcagtccca 49
<210> 84
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T08
<400> 84
tgccctcact gagcagaccc cctggatggc agggagcagt cccaagcca 49
<210> 85
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T09
<400> 85
tggatggcag ggagcagtcc caagccagat ggatgcccat aaccagcca 49
<210> 86
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T10
<400> 86
tctcaataca taatatcacc acgtatcagg caaaaccatc ctgcccaga 49
<210> 87
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T11
<400> 87
tatcaggcaa aaccatcctg cccagagcat tatctgaatt tgcatccca 49
<210> 88
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T12
<400> 88
tcctgcccag agcattatct gaatttgcat cccatctgca gaagataca 49
<210> 89
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T13
<400> 89
tctgaatttg catcccatct gcagaagata cattcaccca cttcttcca 49
<210> 90
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T14
<400> 90
ttccattctg tcttaatcaa agtctttatg tgaattttcc ccattgaga 49
<210> 91
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T15
<400> 91
tccattctgt cttaatcaaa gtctttatgt gaattttccc cattgagaa 49
<210> 92
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T16
<400> 92
ttctgtctta atcaaagtct ttatgtgaat tttccccatt gagaagaca 49
<210> 93
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T17
<400> 93
tctgtcttaa tcaaagtctt tatgtgaatt ttccccattg agaagacaa 49
<210> 94
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T18
<400> 94
tttatgtgaa ttttccccat tgagaagaca agccccttcc tggcttaga 49
<210> 95
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T19
<400> 95
ttcctggctt agactgtacc tgactgatct tttcatgagc tccttgcca 49
<210> 96
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_T20
<400> 96
tcctggctta gactgtacct gactgatctt ttcatgagct ccttgccaa 49
<210> 97
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_gRNA1
<400> 97
gtacagtcta agccaggaag ggg 23
<210> 98
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_gRNA2
<400> 98
gggagcagtc ccaagccaga tgg 23
<210> 99
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_gRNA3
<400> 99
gactgctccc tgccatccag ggg 23
<210> 100
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_gRNA4
<400> 100
gtgaatgtat cttctgcaga tgg 23
<210> 101
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_gRNA5
<400> 101
gtctctcagt gctggcacag tgg 23
<210> 102
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_gRNA6
<400> 102
gacagcaggg agctaggatg agg 23
<210> 103
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_gRNA7
<400> 103
gaaggggctt gtcttctcaa tgg 23
<210> 104
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_gRNA8
<400> 104
gcaaattcag ataatgctct ggg 23
<210> 105
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_gRNA9
<400> 105
gagcagaccc cctggatggc agg 23
<210> 106
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CX3CR1_gRNA10
<400> 106
gaactcatag aaagcgatat tgg 23
<210> 107
<211> 1599
<212> DNA
<213> 人类
<220>
<223> CD11b_基因座
<400> 107
gtgcatgggg gtggggtggg ggactctggg tggggaggag ggtaactttt gggtctgtca 60
taaatagagg gcccagaata tgtaggagtc agtctgggga gaggcaaagg ggatttgggg 120
aaggagaaag ggttcaagaa gaagcaggga gaacagctag acccagacag gctggccagg 180
gaagcctgga tgaatgacca cattcatgga ctgtgcaagg ctgcttgccg gtccccttgc 240
ttcacacatg aggagacgga ggcccaggga ggagaagtga catggctcag ggtgcgcagc 300
aggtgtgaga cccctttcct gagtgcttcc tcctggatcc cctctcacca tctccacttt 360
gcctccggtt ctattttcca aggtcccggg tgcaaatgtt tgttgaatga ctgatgaatg 420
aaaatgattt gagtttgtta ccttttatgc ttatatgttg tggaaaatga aattctcctc 480
aaaagggaag gaaatacttg agagctgcat aggaaggaaa ttatctaatt aagaatgtat 540
agaaacttca ctgttgggca aatcatcgtt gtgacaccgg gggaagaagc catttaggtg 600
ctcagaaggg aggctggaat tcagagcagg actggacgtg ccccacgacg gtggttctta 660
ggtcaggagt cagcaaacag tggcctgggg gcccgatatg gcccacgacc tgtttttgca 720
caacctgcca gctagagatt gaagatgaac actgataatc gatttgatga tagggagcac 780
cacccccaaa gaattctatt tgtctcattt gtaaacccgt attacaaaca aattgtactc 840
aatcattatg tttgaaattt ccctaatgac aaatttgtgg aaaagtattt tctgtcttgt 900
tatataagta cttgtacaac atattctatc agcctcttgg tctgcaaaac ctaaaattta 960
ctatctggct gtttacagaa taagtgtgct aatccccgcc ccaggctaac agagctggac 1020
ctgggaggca gacatctgga tgctgggtta gttagggtga ccgaatggat gggaaaggga 1080
atggagcagg aagacatgct gctatctttt tttttttttt ttttttttga tacagggtct 1140
ttctctgttg cccaggctgt agtgcagtgg catgatcatg gttcactgca gccttgacct 1200
cctgggttca agcaatcctc ccacctcagc ctcctgagta ccactacacc cggctaattt 1260
tttatttttt gtagagatgg ggtctcactg tgttgcctag gctggtctta aactcctgag 1320
cccaggtgat cctcccacgt cagcctctta aattattggg ataacaggcc tgagccacca 1380
cacccagcca ttgctttctt ttaaattatt attagttttt gttttttttt tgtatttaat 1440
tttgagatag gatctctctc tgttgctcag gctggagtgc agtggcacaa tcagggctca 1500
agtgatcctc ctgcctcagc cctccaaagt gctaggacta cagcccctaa ctggcatgct 1560
actttcctct gcttgatcct tcccccattc tccctttag 1599
<210> 108
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T01
<400> 108
ttcagagcag gactggacgt gccccacgac ggtggttctt aggtcagga 49
<210> 109
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T02
<400> 109
tatggcccac gacctgtttt tgcacaacct gccagctaga gattgaaga 49
<210> 110
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T03
<400> 110
tgatgatagg gagcaccacc cccaaagaat tctatttgtc tcatttgta 49
<210> 111
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T04
<400> 111
ttctatttgt ctcatttgta aacccgtatt acaaacaaat tgtactcaa 49
<210> 112
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T05
<400> 112
tatttgtctc atttgtaaac ccgtattaca aacaaattgt actcaatca 49
<210> 113
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T06
<400> 113
tttgtaaacc cgtattacaa acaaattgta ctcaatcatt atgtttgaa 49
<210> 114
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T07
<400> 114
ttgtaaaccc gtattacaaa caaattgtac tcaatcatta tgtttgaaa 49
<210> 115
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T08
<400> 115
tacaaacaaa ttgtactcaa tcattatgtt tgaaatttcc ctaatgaca 49
<210> 116
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T09
<400> 116
ttgtactcaa tcattatgtt tgaaatttcc ctaatgacaa atttgtgga 49
<210> 117
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T10
<400> 117
tgtactcaat cattatgttt gaaatttccc taatgacaaa tttgtggaa 49
<210> 118
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T11
<400> 118
tactcaatca ttatgtttga aatttcccta atgacaaatt tgtggaaaa 49
<210> 119
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T12
<400> 119
tttccctaat gacaaatttg tggaaaagta ttttctgtct tgttatata 49
<210> 120
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T13
<400> 120
ttccctaatg acaaatttgt ggaaaagtat tttctgtctt gttatataa 49
<210> 121
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T14
<400> 121
ttgtggaaaa gtattttctg tcttgttata taagtacttg tacaacata 49
<210> 122
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T15
<400> 122
tgttatataa gtacttgtac aacatattct atcagcctct tggtctgca 49
<210> 123
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T16
<400> 123
ttatataagt acttgtacaa catattctat cagcctcttg gtctgcaaa 49
<210> 124
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T17
<400> 124
tatataagta cttgtacaac atattctatc agcctcttgg tctgcaaaa 49
<210> 125
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T18
<400> 125
tacaacatat tctatcagcc tcttggtctg caaaacctaa aatttacta 49
<210> 126
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T19
<400> 126
tcttggtctg caaaacctaa aatttactat ctggctgttt acagaataa 49
<210> 127
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T20
<400> 127
tgcaaaacct aaaatttact atctggctgt ttacagaata agtgtgcta 49
<210> 128
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T21
<400> 128
tgaaaatgat ttgagtttgt taccttttat gcttatatgt tgtggaaaa 49
<210> 129
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T22
<400> 129
tttgttacct tttatgctta tatgttgtgg aaaatgaaat tctcctcaa 49
<210> 130
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T23
<400> 130
ttgttacctt ttatgcttat atgttgtgga aaatgaaatt ctcctcaaa 49
<210> 131
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T24
<400> 131
tgttaccttt tatgcttata tgttgtggaa aatgaaattc tcctcaaaa 49
<210> 132
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T25
<400> 132
tttatgctta tatgttgtgg aaaatgaaat tctcctcaaa agggaagga 49
<210> 133
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T26
<400> 133
ttatgcttat atgttgtgga aaatgaaatt ctcctcaaaa gggaaggaa 49
<210> 134
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T27
<400> 134
tatgcttata tgttgtggaa aatgaaattc tcctcaaaag ggaaggaaa 49
<210> 135
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T28
<400> 135
tgcttatatg ttgtggaaaa tgaaattctc ctcaaaaggg aaggaaata 49
<210> 136
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T29
<400> 136
tggaaaatga aattctcctc aaaagggaag gaaatacttg agagctgca 49
<210> 137
<211> 49
<212> DNA
<213> 人工的
<220>
<223> CD11b_T30
<400> 137
tacttgagag ctgcatagga aggaaattat ctaattaaga atgtataga 49
<210> 138
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CD11b_gRNA1
<400> 138
ggttgtgcaa aaacaggtcg tgg 23
<210> 139
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CD11b_gRNA2
<400> 139
gggaggctgg aattcagagc agg 23
<210> 140
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CD11b_gRNA3
<400> 140
ggagtcagca aacagtggcc tgg 23
<210> 141
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CD11b_gRNA4
<400> 141
gagtcagcaa acagtggcct ggg 23
<210> 142
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CD11b_gRNA5
<400> 142
gacctaagaa ccaccgtcgt ggg 23
<210> 143
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CD11b_gRNA6
<400> 143
gcaaatcatc gttgtgacac cgg 23
<210> 144
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CD11b_gRNA7
<400> 144
gagacaaata gaattctttg ggg 23
<210> 145
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CD11b_gRNA8
<400> 145
gccccacgac ggtggttctt agg 23
<210> 146
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CD11b_gRNA9
<400> 146
gaaatacttg agagctgcat agg 23
<210> 147
<211> 23
<212> DNA
<213> 人工的
<220>
<223> CD11b_gRNA10
<400> 147
ggtcaggagt cagcaaacag tgg 23
<210> 148
<211> 387
<212> DNA
<213> 人类
<220>
<223> S100A9_基因座
<400> 148
gtaagtgagc tgccagcttc cccaggcaga agcctgcctg ccgattcctt ctttccttcc 60
ctgacccaac ttccttccaa atcctcctcc tagaagccct ccttggttgg ccctgcctac 120
tttaaagctt ctttcacatt ttcttaggtc atgttcccct ggggcctcct gccctcaaat 180
gctttgcttt ttggcactct gtagatattc taaaaaatca ttttgtacat gtgtgtgaca 240
ggccatctcc cagttaagtt gcagcctgtg ctttcttttt attttgcact tcccccacta 300
tttctgtgag tgcttagtag gaagtgtcaa agaagcttga cagcattttc ttctaagtgt 360
cccaactctt ggttttccat tacacag 387
<210> 149
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T01
<400> 149
tttccccgtt gtattggttg aaataagttt cactaattgg taacctcca 49
<210> 150
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T02
<400> 150
tattggttga aataagtttc actaattggt aacctccaga gggaaggga 49
<210> 151
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T03
<400> 151
tttcactaat tggtaacctc cagagggaag ggaagggagg gcaggggaa 49
<210> 152
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T04
<400> 152
tggaactggc ctctaagtca gatctgaatt tgcatgccct caatagtca 49
<210> 153
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T05
<400> 153
tctaagtcag atctgaattt gcatgccctc aatagtcaag ctgtgaaaa 49
<210> 154
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T06
<400> 154
tgcatgccct caatagtcaa gctgtgaaaa ctaatgaccc tctctagga 49
<210> 155
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T07
<400> 155
tgaaaactaa tgaccctctc taggactggt ttcaagtctt cctccagga 49
<210> 156
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T08
<400> 156
tcttcctcca ggaagatacc attcctagct gttaaagttg ttataagga 49
<210> 157
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T09
<400> 157
tcctccagga agataccatt cctagctgtt aaagttgtta taaggacca 49
<210> 158
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T10
<400> 158
ttcctagctg ttaaagttgt tataaggacc aaatgaggtg acatttcca 49
<210> 159
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T11
<400> 159
ttaaagttgt tataaggacc aaatgaggtg acatttccag gcttactca 49
<210> 160
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T12
<400> 160
tgaccagggc aagaccctgg aactcagctt cctcttctat aaatagaga 49
<210> 161
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T13
<400> 161
ttcctcttct ataaatagag aatcagcacc caagtcacag ggtcatgga 49
<210> 162
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T14
<400> 162
tcttctataa atagagaatc agcacccaag tcacagggtc atggaggga 49
<210> 163
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T15
<400> 163
tctataaata gagaatcagc acccaagtca cagggtcatg gagggaata 49
<210> 164
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T16
<400> 164
tataaataga gaatcagcac ccaagtcaca gggtcatgga gggaataaa 49
<210> 165
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T17
<400> 165
tggagagcgt ttggtatgtg ctcagtgtct gctccattgt gcgcactca 49
<210> 166
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T18
<400> 166
tggtatgtgc tcagtgtctg ctccattgtg cgcactcagc ctatggtca 49
<210> 167
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T19
<400> 167
ttgtgcgcac tcagcctatg gtcattttta atttttaaat ccagcccca 49
<210> 168
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T20
<400> 168
ttcccttgta catttgccag ctggtcattt actgtgctcc cagtcccca 49
<210> 169
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T21
<400> 169
ttttgttttc ttttcaaatt tggggaaagt cgggaaacag aggcctgca 49
<210> 170
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T22
<400> 170
tttcttttca aatttgggga aagtcgggaa acagaggcct gcattaaga 49
<210> 171
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T23
<400> 171
ttcttttcaa atttggggaa agtcgggaaa cagaggcctg cattaagaa 49
<210> 172
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T24
<400> 172
ttggggaaag tcgggaaaca gaggcctgca ttaagaaggg tggaacaca 49
<210> 173
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T25
<400> 173
taggtcccca gccctcccag tgcccctccc tccgccttgg taaggtgga 49
<210> 174
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T26
<400> 174
ttcagagtta ggggccctga cagctctcca taggtggagg cctcaggca 49
<210> 175
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T27
<400> 175
ttaggggccc tgacagctct ccataggtgg aggcctcagg caggcagga 49
<210> 176
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T28
<400> 176
tccataggtg gaggcctcag gcaggcagga tgctgggtgg ggtaggcaa 49
<210> 177
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T29
<400> 177
taggtggagg cctcaggcag gcaggatgct gggtggggta ggcaagaaa 49
<210> 178
<211> 49
<212> DNA
<213> 人工的
<220>
<223> S100A9_T30
<400> 178
tgggtggggt aggcaagaaa gggcccagca gagaggccgc atggcaaaa 49
<210> 179
<211> 23
<212> DNA
<213> 人工的
<220>
<223> S100A9_gRNA1
<400> 179
gcacaggaga gtgctcgcat tgg 23
<210> 180
<211> 23
<212> DNA
<213> 人工的
<220>
<223> S100A9_gRNA2
<400> 180
ggtaccccac aggttctggg agg 23
<210> 181
<211> 23
<212> DNA
<213> 人工的
<220>
<223> S100A9_gRNA3
<400> 181
ggagccagac atcctggggt agg 23
<210> 182
<211> 23
<212> DNA
<213> 人工的
<220>
<223> S100A9_gRNA4
<400> 182
ggagagtgct cgcattggct ggg 23
<210> 183
<211> 23
<212> DNA
<213> 人工的
<220>
<223> S100A9_gRNA5
<400> 183
ggaagcagag cctcatggat ggg 23
<210> 184
<211> 23
<212> DNA
<213> 人工的
<220>
<223> S100A9_gRNA6
<400> 184
ggcttactca tgccatgacc agg 23
<210> 185
<211> 23
<212> DNA
<213> 人工的
<220>
<223> S100A9_gRNA7
<400> 185
gggaaacacc tagaaaaact agg 23
<210> 186
<211> 23
<212> DNA
<213> 人工的
<220>
<223> S100A9_gRNA8
<400> 186
gtggggggtg aagcgggcat agg 23
<210> 187
<211> 23
<212> DNA
<213> 人工的
<220>
<223> S100A9_gRNA9
<400> 187
ggggggtgaa gcgggcatag ggg 23
<210> 188
<211> 23
<212> DNA
<213> 人工的
<220>
<223> S100A9_gRNA10
<400> 188
gagggctggg gacctacccc agg 23
<210> 189
<211> 3424
<212> DNA
<213> 人类
<220>
<223> TMEM119
<400> 189
gtgagtcctg gggtcccctc ctctgtcctg agagcctgga gctatcttgg agcttaggga 60
ctggggactg ttggagcact ctggggggcc tctctaagtg tgtgtgggct ttgagtgtgt 120
gtttggtgtt gtgtgcatga gtgtggtgga atctgagtcc cgtgtgcggt gctggggtgg 180
gccagggtgg gccggagtgt tgtgtgtgtg cggctggggc cttggtgtag ggggtgtgtt 240
gcttccactt ttctgcaagt ggatgccagg ctgttgcttc caggatctgt gtgagggtga 300
tgtggacggt attgtcctgt gtgcagggat cggctgtgtg tcagggggtt gtgtatgtat 360
atgtgttgtg tgtccgtgtg tgttctctgt gtattgtgtg catgggccat gagagtgctg 420
ttgggtgtct cagtgctgtg tgagtcggtg tgcctgtgtt gtgtgtcttt atattgtgtg 480
tccatgctgc tctgtgtgtg tgtgtgtgtg tggaggggga ttgtgccccc aggacccccc 540
tccccatcca gacctccagg gcccaggtcc ctgtccttgg ctggccctgg ggtcgggggc 600
atgtgcagtg ctccaaccag aacacccctc ccccacaagg ccactgattg aagccaggtt 660
tccgtgggcc gcccctcccc caaaggccac cagtctctgg gtgggggtgg ggcagccccc 720
ggtcccctag cttcaagtct tggggccccc aggcctcagg ggtgcatctg cactcctcca 780
cagactcagg accatcttag ggcatttgcc acacttacac acggccagcc ctgcctgaca 840
tgtccccagg cagggagtcc tgggcaatca cgtggtacct gctaattggc acccactgtg 900
caccaggcat ggccgcatct tgtcctaaca gcagtccagg gaggtggctc ttatccccat 960
tgtacagata tggaaaccga ggctcagaga ggtgacatgc ccagcccaag gacacatagc 1020
cgggaagtga cctcctctgg gatataccaa gacaggcttc tctgtccagg gctctgctgg 1080
gctcacccct gactttctgt gtgacctggg caggctgttt ccagtctctg gacctgagtt 1140
acctctaagg tgaagcaaga ggcgttgggc ctgaccccag ctcctaatgg cctgttagat 1200
tctgagtcct tgaaaaaatt agggtccggg gggaggtagg cagaataatg acttcagagc 1260
tgcccagaac agtgcttcat tccacagatg ggaaactgag gcccagagag ggcaggggcc 1320
gtccagggcc acacaaccat cttttttgag gctctgctga ctgcaggtgg ggctgggtcc 1380
tccatacgtt gcccccacct ttccctggaa gccaggaggg gttgtggggt gcaggggact 1440
ctgagagtca gggtctcagc cttaaagagc cagtggcagt ttgtgtgttc tcctttcttg 1500
ccctctgcct ctgacttcgt gtgtgtgtgt gtgtgtgtgt tgtatgtata tgtgtgtgta 1560
ggtgtatgtg tgcatgtgtg tgtatgtgta tgtgtgtgca tgtgtgtgtt tggttctgca 1620
ttccttggcg gccagagcta aagaggtttc actgaacggg gtgaaaaggt tggtctttca 1680
ctgggtggcg gccggaccag acagtgagcg catgttccca tccggcgatg gtgctcattt 1740
gtcgactcag ggtgggaaat tgctggctga acctggagtt cggctaggga aggaattcag 1800
ctaccccaga ccctatcttt cctcggggct cagctacttc gcaccaggca ctctctgaaa 1860
gttgtctcat ttggccctaa cagctctgag aggtgctacc tgtggtcacc ctgtcccaac 1920
ttacggatgg ggaaagtgag gcccacagga gccagaccac agagctggat gcgatggagc 1980
cgggattctt gacccagcca gaacttgagt gggtctccag ccacccatgg tcccagctgc 2040
cctctgcagt gagaagtggt agttgttgcc acaaaagctc tctcctaggc ttgactgggg 2100
gtgggaggca gggaggtgac tggcaggtca cagaccccaa agctcaaggt tgtctgtagg 2160
aacctttgct aacaggtgcc agagaggtga gggggtcctt tcctcattta gcatctgaca 2220
ggtgatgtcc accagcggga acaagccatt cctggctcag agtgtgtggt gtgtgcatgt 2280
gtgtgtggtt gtgtaggtga gtgtgtgtgg tgtatgtgta tggttgtgtg tatgtggagt 2340
gtatgcatat atgtgtggtg tgtgcatgtg tgtatgattg tgtgtagtat gtgaatgtgt 2400
gtataggggt gtgtgtgggg catgtgtgta cgtggttgtg tgtggggtgt atatgggtat 2460
gtgtggcgtg tgtgcatgtt tgtgtgtggg gtgtgtgtgc atgtgtgtag atgattgtgt 2520
gtgtagtatg tgcatgtgtg tatatgggtg tgtgagtgtg tgtgtggtat gtgtgtgcat 2580
ggttgtgtgt ggtgtgtgtg catgtgtgta tgattgtgta gtctgtgcat gtgtgtatat 2640
gggtgtgtgt gtgtgtggcg tgtgtgcatg attatgtgtg gggtgtgtat ggggatgtgt 2700
gtgtgagtgt gtggcgtgta tgaatggttg tgtgtgtggt gagtgtgcat gtgtatgtat 2760
ggctgtgtat gagtgtgagt gtggtttgtg tgaatgtgcg tgtaaactcc tgggatcaga 2820
cagaggaagg ttcagatccc agctcagcta cttatcatct gtgtgtcctt ggggaagtca 2880
ctgtctgtct ctgaacctct gtttcctcat ctgtaaaatg gggataatga agctgcctca 2940
gggctcctgt aggattaaag gcatgaaaag ggcttagatg agtacccgcg aggaaagcac 3000
aggtgaccag ctcatttaaa atgagcccct gagaagcttt gtctcttttt taaaaaattg 3060
aaatatttta atatatttca tagagatgga ggtttcctta tgttgcccag gctggtcttg 3120
aactcctggg ctcaagcgat cctcccaagt agctgggact acaggcatac accaccaggc 3180
ctggctactt ttttattttt ttgtagaggt ggggtcttac tatgttgctc aaactcctgc 3240
cctcaatcaa tcctccggcc tcggcctccc aaagtgctgg gattacaagt gtgagccacc 3300
acacctggcc aattttgcct ctttttatgt cctggaatta tttttttatt ttttccatct 3360
aagccagttt gttcacattt aatttctttt ttttcttttc tttctttctt tttttttttg 3420
acag 3424
<210> 190
<211> 6273
<212> DNA
<213> 人类
<220>
<223> MERTK
<400> 190
gtgagtgcgc ccggctgggg gccaggcgag ggggtggggg ctcccaggag gaagcagggg 60
cctctgggga gggagcgcgt ccacaggggc gcgcctggct gctggacaag tttgcaaaca 120
ccctccaccc actgcggtgc cagaggaggg ggcgtaggcg aacctaccgt ccactgaccg 180
cggcgcctca agcgtcccga gggcacccag cctggcttgc gggtgcgcat cgtggtgaag 240
ccgggtcggg gtcggcgttg caggctcccc tcttcaccgc agaggaggaa atcgagctcg 300
gccgggcgcg ctgcaagtcc tgaagttccg acgagtggaa cgtaggtagc aggtctggtc 360
tgggatgcga cgagaacttt ccactagagt tgcatggtgg ggccccgctc tggccggagt 420
cccgggggcc acagatccgg tctcccgagg gaccggcgcg gggcgaacga acgggctgcg 480
ggagtcggag ccgcagtccg ggagccgcga tagactgagg ccgagcgacg ggccaggggg 540
ggacggcagt cctggctgct cccaatgggc ccttacgggc attattagta tcccttttta 600
ggggcaccca gagagtgtgg gaaaagggga gcgttctttt cactcctgtt atggcagaac 660
agaacttaca gtgctcggca gcgtttacgt ttatctggat tcagcgaagt gttgttacag 720
gctttttttt ttttaatttg agaccgagtc tcgccctgtc gcccaggctg gagtgccgcg 780
gcgcgatctc ggctcactgc aggctccgcc tcccgggttc aagcgattct cctgcctcag 840
cctcccgagt agctgagact atagacgcgc gctaccacgt ccggctaatt tttgtatttt 900
tagtagagac ggggtttcac catgttggcc aggatggtct cgatctcttg acctcgtgat 960
ctgctctcct tggcctccca aagttctggg attacagtcg tgagccaccg cgcccggctt 1020
gttccaggca ttttaataca agatgctgga ctgatacgtg gaggcaagga aggccggttt 1080
cattctgctt gaacagctta tttggggagt gagtgatgaa cagatttcaa gtttgatcgc 1140
tgatgcactt cttgaggagg ctggaataaa cttaccaggc tttacccaaa agaaaaagaa 1200
aggggaaaaa tgctaaataa acacattcca agtattttct ctcagctaaa aggtttctat 1260
ttccattcag catgtagatt ttctctcttt tgatcgagaa tgcacttgac tagccttcac 1320
ctattacagt caaagatgtt ttttaggaat acctggaaag ctcagtttat agtcaagtaa 1380
gttacttaaa agtttttcct ttgagatttt cctttgaaag ctcatttact caaatgaaaa 1440
attcttaaac agtgcaccca ctttttgcac gttaaattac ataagcaatt tataatttgg 1500
ggcaacatag caatttgaaa caaactttaa gagccaggca aagaactaaa gcagttctgt 1560
tctccactgc ccctccctcc accaaacctt caaaaattcc tcagcatttc tgccagcccc 1620
atttttcata atctgctgca aatctgttat ttgttgctac tagtgaggac tggccgtgaa 1680
tagtcttgga ggtagtgaat gtggtgagaa ctatggagaa agtaatggga acaatagttt 1740
tgtgttaaat acttaaaaat tggagtgctt ttgtttttct aaaattttaa aaggctgtaa 1800
taacaaattt ttgtagctga caatcaactt taatcagaca atcataaaaa ggccttttaa 1860
aatccaccca gctggaagaa tgaaaagttt caccaatcgt tcttgcactt tttgcttttg 1920
gttttgaact ttacctatga gatgtgtgac agttttacat ctcaccttgt gaaaagctta 1980
aagaatggga ttctcactgg cagaattaca gcacaaagga gtgctgtatg aagaaattaa 2040
acatggaaat tagactcttc atctaatttt aagattttcc tattacacat tgtgggtctg 2100
agtgctttgc tgaccacaca ggggagacag agagagagac aatgagaata tgtgtgtaga 2160
ttctacactg ttagcagtat agaagaatgg gtaaataaaa tttaagcatc actttaaccc 2220
aggaaatccc ctctgccccc caacacacat acacactaca cgtctcacaa agacatgcac 2280
acacagaact ggaactgcca aaccaggagc atttcgaggc tttccagtct ttcctttctg 2340
ctcagtctct gatgggggtg ccattgagca gcaaaatgag gcaagcggtg gctctctgaa 2400
gggccaggga gaggatggag caagataaat ataaatgtgg ataaaaatga atgcattatg 2460
aggacttagc tcatgacgag gctgtgtgtg cagctaaact caacccttag agtaaattag 2520
gcttttaaga ttctttaatg ttaatatttc ttttccaaac tgatattgta acatgtattc 2580
cagtatattg taaacatctt cccagaggga acttttaagt tgttctgttg cttgtgggct 2640
ttattccaaa ggcttcaaat gctttttgaa agtacatcgt gcatatttta aaaatgaata 2700
cttttagaaa attattctga cccattaaag tgctgagtgg aattcttttc ttttctttct 2760
ttcttttttt tttttttttg gcaggttctc attctgccac ccaggctaga gtgcagtggc 2820
accatcacgg ctcactgcaa cctcaacctt ccgggctcaa gtgatcctcc cacctcagcc 2880
tcccaagtag ctatgaccac aggcacatac caccatgcct ggctaatttt ttattttttg 2940
tagagacagg atctcactat gttgcccagg ctggtcttga actcctgggc tcaagcgatc 3000
ttcccacctt agcctctcag agtgtgggga ttataggcat gagccaccat gcacagctga 3060
atacaatttt taaaaaatta acaataatta tgtttttttg tttttgagat agagtttcac 3120
tcttgctgtc caggctagag tgcaatggca caatctcggc tcaccgcaac ttcccgcctc 3180
ccgggttcaa gcagttctcc tgcctcagcc tcctgagtag ctgggattac aggcatgcac 3240
caccacgcct ggctaatttt gtatttttgg tagagacagg gtttctccgt gttggttagg 3300
ttggtctcga actcccaacc tcaggtgatc tgcctgcctt ggcctcccaa agtgctggga 3360
ttacaggcat gagccaccac acccagccaa taattatatt tttaaatctt aatttttgaa 3420
ataatttcca gataattgta gaagggccag tgagttacta gtcagcattg gtcaagaaga 3480
ggttcaatct ttttatgcct gtgaattggg aacatgctgc tgggtagaaa aactgagctg 3540
ggaccttgaa cacacatgtg aaacagtcgc tttccatata atagccagaa tgagattttg 3600
gaaacgaatc tgattgtatt ttccatttga aaatcttcca gtggcttcct gttccctact 3660
agaatttgca gagactcaca gcgaacctct ttgacccatt tccattcact tccctcttgt 3720
tcctaccact ccagccacct gtgtcttctt tctagggcct gagcagcctt tgcagtgact 3780
cttccctctg gctggaacct ttttcccaag atctcggcat gctggcttct tctcatcctt 3840
tgggtttcag ttcagaggtt ctccttgaga agccttcccc aataaccacc ccctgccaaa 3900
gtatcatatg catacacccc actatccctt aaatttaatt tcctgataat gcttctcaca 3960
acctgatcag ttccttcctt ccttccttcc ttcctccctc cctccctccc tctatttctt 4020
tattgacaga gtcttgcaat ggcaaattct ctgctcactg caacctccgc ctcccaggtt 4080
caagcaattc tcctgcctca gccttcccag tagctgggat tacaggcacc tgccaccaca 4140
gctggctaat ttttgtattt ttagtagaga cagggtttca ccatgttggc caggctggtc 4200
tcgaactcct gacctcaggt gatccgccta cctcagcctc ccaaagtgca gagattacag 4260
gcgtgagcta tggcacccag ccttacctct ttgtttactc cttttcctcc actgtccccc 4320
caccacaagg taagctcctg gtggcagggc tgctgtcttt ttcactgcta acacagcatg 4380
gagctcatac gggtgctcag tgagtatcag agcacagcat gaaggaacca agcccctgca 4440
tgtcttacca ggtgctcttc acccttatct tttcctactg gcttttccag aaacagaatt 4500
gctggagctc ccatgccctc acattcgggg cttggttaat agaaaacaat cttttatttt 4560
gctgtgatgc caatgtgatt tcattgctgg aggagctagt caattaaaac cagacagatt 4620
tttgggctgt attaacccca aacatatttt acattgtcct aactattcca actagaaaaa 4680
aaaatgtcag aaggtaattt ttcatgttaa acacagttct aacaactcct tgctcagggg 4740
caggtagccc tgggtgcctt gactttggcc cttgccgtta gtttaatctt aacccaaagc 4800
acatggctct gaattggtat gtttctcagc aggagattaa ttattataaa aactgaaagg 4860
ggtctcacac tgtgtgaggc acactatgcc tctggggact ggaatgaaag tgttaaccgg 4920
gactggcttc tggggctttg ggggtggtga ttaactttca ggacctctgt tcctttttgg 4980
gtacagtggg aggctctttt catagaattg ttaggaggac gtaatgagct aatggcaggt 5040
gatatgtgct taaaatatat ttgccattat taccaatggt tctcctccat tcttctgaac 5100
tcaagtatgg gggaaatgtt tttcctagac aaaaggtgtt gggaggaggg ttcttttctt 5160
attgaagtgt atcctgaatg gtccaccctc cattgttcag aatgctttgg tgaaggggcc 5220
ctccggtgtc gccctagagt gcccaagtcc tttgctgcag ctctttaggt ttttgtttcc 5280
tagtagtttg agcaaaaccc acccaggacc aagcagttct ccagagaagc agggcccgcc 5340
ctgactgcca ttcccctcct actcctgccc ccataccttc ccttatggag ttcaaacttg 5400
acatagtaca ggaatagctt cttgtcatgt gcctctcagg aaggtataaa aatgaagtcc 5460
agttcctgtt caacttttcc cacataactc ttttccaaac tgggtgtggt ttaaattttt 5520
ttatttttat tttttgtgtt tgttttgttt tagggttttt gagtgtgaac atccagaaaa 5580
ttcttttttt tttttttgag atggaatctt gctctgtcgc ccaggctgga gtgcatgtgg 5640
cgcgatctcg gctcactgca acctccgcct cctggcttca agcaattctc tgcctcagcc 5700
tcccaagtag ctgggattac aggtgccctc caccagacct ggctaatttt tgtattttaa 5760
gtagagacgg ggtttcaccg tgttgggcag gctggtcttg aactcctgac ctcgcgatcc 5820
acccacctcg gcctctcaaa gtgctgggat tacaggagtg aaccacctca cccagctcag 5880
aaaattcttt tcctttttac cacatcgagc taggttttcc caatgaggtc agttggctgc 5940
aacatagaga aaatgaggct ttggttctta gagtagattc cgtgtacagg cgtgagtatg 6000
tgtccgcagg tggtcttgta ggaaatgcaa agggcgccag gtgcactcct ggcttctggt 6060
acttcctgct taatggcatg ggtgagccaa ccctcaggtg cccgggaggg agccctgatt 6120
actctccctc tggcactctg ggcattggct aacccgtgac cggagttaaa ccagttccct 6180
ctcttttcat tctatgtctc ccactcctgc ctccagccga agtgctaaaa atgcagcctg 6240
gcaggggcag agaattccat taggatcagc agg 6273
<210> 191
<211> 2541
<212> DNA
<213> 人类
<220>
<223> CD164
<400> 191
gtgggcgcgg gccctgtggg cttcccgccc tcccctgccc agccgagccg cactgcctcc 60
tcgccgtgcg ggcggggccc gggttcgggc cacggtcggg cgggcgggcc gcgctcgggg 120
tgcggcggcg actccggcaa catggcggcc agcctggagt ccactcgtgg ccgggccggg 180
tggggagcgc gctgggggga agcggacgcg cggttcccag tggctgcggg gctggggccc 240
ccctcgaagt gttgcaagtc gaggtgcctt ttaaaagtgc atcgtaattc ctagcctcac 300
ttggggtcgg aaatggggac gtggcttcct tccgcggggg cagcggtggg gttgaggatg 360
gggccgggcg tcgcgcctct gaggttggcg gtggggccga gctgcctctc cctgccactg 420
gttgttcacc ctcccggcgc ctctctccgg aggtagcctt ctccggaagt ccgggaaaga 480
gaaacttaaa gacggtaatg ctcgttcgtg tctcagactt gagtctgaga aggtcgcttg 540
agatttaatt acattggttt tgcagatagg aatagaatgt agctgacgtt tgagcacgta 600
gttagtgaaa acttcacact tcaaagtatg cgaaaaggaa gaaaagtacc catgtatgta 660
ccgggtgttt tgcgtacgta tcctaaggct aaactggaag gtaggtagtg aaacctagga 720
ggtagatgca gagacggaga tgagtaaact ctcctgacat tgtatgttta ttcttttttc 780
aattgttttt aaaattttct taactatgtc ctgtgctcag atagcgtatg tttagtaggt 840
cgtggaacgg gggtttgtgc ccaggtctgt gggttttcta aaacccgatc aggagcgtgt 900
cttttgttat gtgcagtcgc atagggctgg ttaaggcata catacatttt aaagcagaaa 960
ttgccatata ccgtgacaac acaaaagaga gaaggaagat aagtttgagg taataagcgg 1020
gagaaacact agaggtttaa aacctgcagt ctcgtatgat tggttattct agttaacatt 1080
agttaaggag taatgtttac gtagttaaca ttggcttctt gaccgaagaa tgccgaagtg 1140
taatgatttt tatcacggca ttcatattct acaaattctc ctctagtttt agtattttat 1200
aaaagtttaa taaagtatat agtaaactta atgttttgtt tttagtttaa ggaagatgta 1260
atggtaacat ttcaaaacga gggaagtaaa ttgcagtata atactgggaa ttctaaccgc 1320
actattttaa gatgatagag cagaatatgt ttgtctcagt cttaatttga cagtttcctt 1380
tcagaattgt agtgtgtgtg taagagaagg ttggaagtat caaattaatt tgtctttgtg 1440
taattgaagt gcgtgcaaag gaggtatgta ttttctggaa atcataagtg gatgtagtgt 1500
ggtctgaaag gtagcaagtt tagttcattg taaagaacat ttcagacatt tcactttgct 1560
acacccgtca agcacaaagg tttttaaaca gcatgtttta tctatacaaa cttcagaaaa 1620
tttattttta ctttatgaac ccttccccac cccaccgtac atgtcccagt ctttaataag 1680
tactaatgat gaagtattga aagcagtgcc tctgcagaac tattttttag gcaggagcaa 1740
agcaaacgag aatgtttgga ggcatctagt ttctaggaaa atgaatggag cccaattctt 1800
ttttttcttt tattttgctg ctttttctca ctggaaaata gagcccaatt ttatagtccg 1860
ttcttctcca gaaattgaat tatggtgatg agtacttgtt tctggattgt ttggcctagg 1920
atgaactatt gacaaatacc ttgttaacct gaattgtatg cacttgaata tgggctttta 1980
gatgttgtct ccagttgtgg aggatcctgt cgagagtgga tcatttatga atcgagaatc 2040
cctgggaaat tatctttgtt tgcagcagaa tgggcatcat cagtgcttgg gttcaacctg 2100
ttaaactact actgttacta ctaaaaatct cagggtttta tctgatgttt gggggtagtg 2160
gttttcctat gtgtagtgtt ggtattatat caaagccttt ttctcgatat ttttatgtat 2220
taaggatgct ttgaaatgcc taaatcctta gtggctgtgg gtgtcttcca atagttgtcc 2280
tgtgaaaaag gattggttag acagatacca tcaggcactg tactgagagt gaccactagc 2340
ttgtttttct aatgcgttta cttacagctt tgtaatgatt ggaatttctt agtaaaccag 2400
tataaagttt tatcatttat ctgaattagt aattttgatg ctgtatgtaa tgcttattgt 2460
tcaaaaagat aagtaataca gattcaaata agatactaat aaaatcattg atttcatgca 2520
tctctccccc caactcccca g 2541
<210> 192
<211> 357
<212> DNA
<213> 人类
<220>
<223> TLR7
<400> 192
gtattttaaa cattggaaca catatagata atttaagtag gtagatgtat gtgctgttat 60
aaggaagtgg ggaggagaga agagggaacc gaaatcatat gcacaaaaat tttttttaga 120
atataaataa aaaatgtggt agtctaaaat gtcaattctt caaagataaa gttaggcttt 180
cagtaacgtt agaaatggtt ttctggaata tgtctccagt ctacctaact ttgaggaagt 240
aaatactgta aatagatgtt tcaaacgcat tttaaagcaa tgatcctagc atgtctttaa 300
gctacagtat tgtgctgtct ttgaaatgta aactttgatg tcttctcttt ctcttag 357
<210> 193
<211> 359
<212> DNA
<213> 人类
<220>
<223> CD14
<400> 193
gtagattctc tgggatataa ggtaggggga ttggggggtt ggatagtgca gagtatggta 60
ctggcctaag gcactgagga tcatcctttt cccacaccca ccagagaagg cttaggctcc 120
cgagtcaaca gggcattcac cgcctggggc gcctgagtca tcaggacact gccaggagac 180
acagaaccct agatgccctg cagaatcctt cctgttacgg tccccctccc tgaaacatcc 240
ttcattgcaa tatttccagg aaaggaaggg ggctggctcg gaggaagaga ggtggggagg 300
tgatcagggt tcacagagga gggaactgaa tgacatccca ggattacata aactgtcag 359
<210> 194
<211> 855
<212> DNA
<213> 人类
<220>
<223> FCGR3A (CD16)
<400> 194
gtaaggagcc ctggagcccc ggctcctagg ctgacagacc agcccagatc cagtggcccg 60
gaggggcctg agctaaatcc gcaggacctg ggtaacacga ggaaggtaaa gagttcctgt 120
cctcgcccct ccccaccccc accttttctg tgatcttttc agcctttcgc tggtgacttg 180
ttcttccagg gcccatttct ctaccctacc tgggtttctt ctaacctgga aatctaatga 240
tcaaatcaca ctaaaaagtc agtagctcct gtggattaca tatcccagga gcatatagat 300
tttgaatttt gaattttgaa agaaattctg cgtggagata atattgaggc agagacactg 360
ctagtggtct gaagatttga aaggaccact ttctgtgtgc aggcagggcc tcagctggag 420
atagatgggt ctgggcgagg caggagagtg acaagttctg aggtgaaatg aaggaagccc 480
tcagagaatg ctcctcccac cttgaatctc atccccaggg tctcactgtc ccattcttgg 540
tgctgggtgg atccaaatcc aggagatggg gcaagcatcc tgggatggct gagggcacac 600
tctggcagat tctgtgtgtg tcctcagatg ctcagccaca gacctttgag ggagtaaagg 660
gggcagaccc acccaccttg cctccaggct ctttccttcc tggtcctgtt ctatggtggg 720
gctcccttgc cagacttcag actgagaagt cagatgaagt ttcaagaaaa ggaaattggt 780
gggtgacaga gatgggtgga ggggctgggg aaaggctgtt tacttcctcc tgtctagtcg 840
gtttggtccc tttag 855
<210> 195
<211> 2268
<212> DNA
<213> 人类
<220>
<223> TBXAS1
<400> 195
gtaggagtgg aatgaatgaa tgaaggagtg ggcgcgcgcc gtgctccgga ggagggcggg 60
tgagtggagg agcttcggaa agccacacga ggtcagaggc accgaagccc tgccgtgcac 120
gccgcggaaa tgcagccccc ggggtggtcg ctgggttcct gccggagtct ggcttccacg 180
ccaccctgat cttctcctcc tcgcgtctac actgtcccga gggccgccac tccatcactt 240
gaatgggagc tcacaactct ctgggtcctc gcttttctca gcgctctctc ctatcagggc 300
ttccgctaaa cactctccag actctcccca gccgggagcc tctccaggtt tgcttctcca 360
gctgcctccc ggatgcttgg ataggatgcc ctgccatccc ctccaactta ggaagacttg 420
ttgagtctcc tcttaggcac tgtttttaaa actgtgggtc gtgacacagt aatagatcat 480
aaaataaatg cagcggaagg caaccagctt tcaaaaagaa cgaaatggaa tccaatagaa 540
aatattagag tccattgccc ttagtaaggg caactattgt ttcataaacc ttttgtttcg 600
attataggta ctggacaagt gtactggacc atgatgtcaa ttttatttcc gtctgtgaat 660
cgtgggttta aaaaagttga aaagctatct gtgtaaaata atgatctcta acactgtata 720
actttcttaa aaacaacctc gtgattttct cactacttct tatcctttcc ggtctccatc 780
ctccgttccc atccttcagt ccttcccaaa aaaggcaagc tctttcacac ttttttagtg 840
gtacatcacg acaccttcct ctgtgtgatc ttgtactctg cggtcttcct tgcccccata 900
atcaatgcta cacttcctat cccttctctt aacctaatgc cattcacgtt tgcagaatcc 960
tagactactg ttgctaaaag gacctcagag gtcatctggg ccagccctgc ccttttagag 1020
ttgaagaaat ggagtccaga gaagtaaaat ctgttgccca atgtcacaca gtattgaagc 1080
ttaggaatag gtctcgtggc tcccactcta gtgttttttg ctccacaccg gtcatttatc 1140
tccttccctt ctatcctccc tgcaatcttt aactttagtc ttggcccagg tcatcctaaa 1200
tattgccatc ttcataatac gtggttctgg ccatgccacg ctcctggcta acatcctcta 1260
aggactcaac ctctgcaggt ggggctgagt gccttggctt ttcatcaagg caggcgagtc 1320
ctgacttagc tttctaagga catgagttca gcaagtcact gcttctctag ccaaactggt 1380
ttacttgtag cccagtgcca gcttcaccca tctctgtcac tgtgcctttg cccaagcggt 1440
cactttccca cccactttcc cagaggggta ccttctccat cttctctctt taagcagatt 1500
ctacctgtgc ctggctcacc tcctccacaa aacagcccga gatagcgtgg gagtaagtca 1560
gacctaggtt caaatcctag ctcttccact taactatgtg atcttggtca aaatgcttaa 1620
cctctctgag cctcagtgtc tgtattttga ttatgagaag gagaacaata gtaatgttct 1680
ccttttgcat ctgtaaatct ctatcatagc cttcaccaca caggtatgta actccctgtt 1740
aatacatacc ctacatgcat gtctctctgc ccctttctag tgctggccat tagaacttgc 1800
tgccataatg gcagtgtagc tacttatgtc tgtggagcac atgaaatgtg gctagtatga 1860
ctgaggaact gaatttttaa ttttaataac catgggtggt tagtggctac cattttggac 1920
aaggtgtctc tagactgtaa gctcagtaag gacagaaacc atgtttttct tgttttggat 1980
tgtatgtcca ataactgcat tgcctaacgc atggtgagta ctgcacacat atttgttgaa 2040
tggatgatag ctgcaatttg ttgcatgctc ccttgtgtcc agcacaacac tacaaactcg 2100
ataaaaggca tttcatatag tcctcatcac agcctctgag gctgggttag attagagaga 2160
gagttttata tagagggcag acacatagta ggggttcaat aaaagttatt attattctaa 2220
ctcctccctc tgaccagccc cactgacttt tgtctcatct ttccttag 2268
<210> 196
<211> 602
<212> DNA
<213> 人类
<220>
<223> DOK3
<400> 196
gtgagggggc cctggagggg ctggcctggg ggagatgcag gccagaacac acaggtccct 60
gagtgttggg ctgaggagcc tgggctgcac cccaggaagg ggagagacag gttggtcttg 120
ggttgtggag agtgctgcat ggaggcccag tggggcagtg gcccctgggg ggatgccaaa 180
ggctggtgat gttcagtggc tcgtgaggtg gagaggagca ggtgaacacg agagagattt 240
cagggagaaa gaaaagcagc aagatggggt gaggcgctca aaccaggacg ccgagtggga 300
aagccaggag ttggctagag aagggtcctg ggtggaggca gggccaggga gtgtcaggcc 360
cagggtgcgc agctgcccgg ggcgggacgg gggaggggcg ggaactcatg actcggggag 420
ccagactgcg atcagacgcg cgtgcccagc tgaaccaggt gcgtgagaag gctgccttca 480
ggtggccggg ggctccctcc aggtaggtgt gggcaccttg ggcagccaga accccaggga 540
ggaaatacat gctgccccca gcccctgagc tgaagacagg ctcccctccc cccggcctgc 600
ag 602
<210> 197
<211> 14420
<212> DNA
<213> 人类
<220>
<223> ABCA1
<400> 197
agtaagcttg ggtttttcag cagcgggggg ttctctcatt ttttctttgt ggttttgagt 60
tggggattgg aggagggagg gagggaagga agctgtgttg gttttcacac agggattgat 120
ggaatctggc tcttatggac acaggactgt gtggtccgga tatggcatgt ggcttatcat 180
agagggcaga tttgcagcca ggtagaaata gtagctttgg tttgtgctac tgcccaggca 240
tgagttctga tccctaggac ctggctccga atcgcccctg agcaccccac tttttccttt 300
tgctgcagcc ctgggagcca cctggctctc caaaagcccc taatgggccc ctgtatttct 360
ggaagctgtg ggtgaagtga gttagtggcc ccactcttag agatcaatac tgggtatctt 420
ggtgtcaatc tggattcttt ccttcaggcc tggaggaata taataactga gacttgtttt 480
atttctgcag agggttctaa gccattcact tcccagatgg gccaataatg ctttgagtaa 540
tctggagatc atctttaatg cgcaggtgaa tggaactctt ccacagaggg atgtgagggc 600
tgtagagcag agtgaactcc ctgaaactca gacgtcagct ctttgtctct ctatctctga 660
acacccttcc ttagagatcc catctctagg atgcatttct ctgtagttag tttctaagtc 720
tcttgttcct gttctgcctt tatttttttt tcctggattc taagccagta tccccacttg 780
gctgtcttaa tgtagcttaa catgtctgta atcaaaatga tcatctttct gagattcaaa 840
gggctataag ggactttgga gagaatttca ttcagttttc ctcaaactag aataatgctt 900
gcactgtctg taaaagaaca aaagtgtcaa agcatccttt tgttcactaa atttcctttt 960
ttattatagt gttacttaaa tattaggaag taaaagtagg tataaacttc ttataggctg 1020
ttattataca actatatgac ccatacatat ttacaaatta agtgcagcca aaattgcaaa 1080
atcaatacca ttcaaattaa taccttaaat gtggtgaggc agctgttgtt caactgaaac 1140
caaattataa gttgcatggc agtaaatgct atcatgctga tcattttgag tttggccagt 1200
ctatattatc atgtgctaat gattgaattc tccacccatt tttctacttg tatgacctta 1260
atttgatggc acctgttcca tcctcatgag tttgctacaa ttatactggt gccaacacaa 1320
tcataaacac aaatataaac ttgggctttg aaatcttgtg ccagaacttg gctttaaagt 1380
aagcatttaa aaaatccata tgtgtttatt agactttgtt tagatgactg ttgaaatgaa 1440
aacaaagtgt ttaaaatcct cttagagaac ttaaatataa tccctcagca atatgtatac 1500
agatcttcct ttgagaaaaa ctgattgtgt tcagcctctc atgttacaaa tggggaacct 1560
gaattctgag gtctctagtg agagaacagg gactggaatc tgtggatcct atctgtttta 1620
ataataattg taaagtataa tagataatat tatattaata aaataaaagc aaacacttag 1680
aatgagcttc catgtgtgag gcactaactg attaggcatt attaactaga tttattcctt 1740
ttaaggcccc gcgatgtact gttatttcca catgttgtag ctggggaacg tgctactcag 1800
agaggttaag taacttgtct gaggtccaca ccactaacaa ggagcacagg tagggttcaa 1860
atccagataa tctgactttg gagctggcac tctaactcaa tgtgcctaat cgcttttcag 1920
tggtgtcatt attttgccta ttctccatct gagaatattg aagtttctga ctccttcctt 1980
gcctttctcc ctgcctcccg tggttatccc caggtcttgg tgttccagtc ctctatgtcc 2040
gtccttactc ttattccttt gctacagtgt gatccagggc tcctgcccct tcttatcctg 2100
gtagaggggg cccacttgct gggaaattgt ctccgccatg gtttatccat gttgtgtgtc 2160
cattagtgag tagtgggaag aatcatatca tgttggcaat gaaagggggg ctatggctct 2220
ggggtagtct agtctgaacc tcttatttta cggatgagaa agctgaggta caaagcaggg 2280
aagggatttc ttgaggtcac ccagccagca actgagctgc aaccagaagc tgagatcccc 2340
aggactaggg ccgagcctca ttctgtccca tcacagtgac ttttcttccc tcctccaaac 2400
tatttttatt ttttattttt ttgcagctgc ttagcagctt gaagttagaa gaaagggcag 2460
ggaaaaggtt ttccgtgctt agccagggaa ggaatcctgc aacaggatgt ggggttgggt 2520
cattcaaatt gggccagact ccactggtct tgttgcttct tgcttggtat tgcagatggg 2580
tttaaaagtg ttaggattag agagataggc aggtttagcc aaaggcagtt tgtagccttg 2640
tggcagagtt ctttttaaag aaggaagtgg gatgcaacac cctgacacaa aggggcttaa 2700
gttgttatac cactgcctgc taacctgttt tccttaactc tcttcctgat ttctaaagga 2760
agtatatttt gctgaatcag aaagaaaagt gatttatttc aggttgctga tgcttagatt 2820
gttagagttg gaaagatctg gcttgcatct tgtacagctg acagaactgg ggctcagggg 2880
ggcacaggtg cccagagttg gtcagtcagg aaagtagcac cagaaccagt ctcctggtgg 2940
ccctacagtt gcagaccctt ttttgctttg ctctctgtgt atactaaagc ttctatgtct 3000
ctgaatctca agttctgact ggtagctact ttccaatcca cctggcttag atttctagat 3060
tatattgttt agacgtcaga acctcttaag ggttttgggg ccacttgtta gctcacatag 3120
tgagaaccag ccctgcccat taggtagggg aagaagttag cagtccatga tagctgttgc 3180
ctgcagcgta tggatgttca ttgcacagtt cctgtctcct gagatcctgg agtgtatacg 3240
cttggcctca gagcccagca cagagcctgg cccttgggac atgcttagta agtatttact 3300
gaatgagtgg gaaatgtctt aaggcccatt agtttgcagg tcttgaggag gctcccttgc 3360
actaggaaga atagaaagca tacataaagc ctgtgtgctg ccgccaggaa gactagaaac 3420
gctatgttca gcctggagct gaatggtata ccccagagca accctgttga aaggcagtgc 3480
ttgccttttc attctgtgtc ctggtttgct ggtaactcct gggtcccctg cctctcctgt 3540
acccccattg tgcagactga ggggggacca tcagccaggg ttagttttcc gctgtttctg 3600
ttaggcaaag aataaattga attgagttgt gaaagttggg tgcaaagctc agtttgggtc 3660
caaagtaaca gttaacttgt gtgggtggca ggtattcagt acaaacaggg ctggggacag 3720
gaaggggaag agaacttcag agctttcacg atcctcatct ggttttaggc tgatccagag 3780
gccaaggtcc ccatggaaca aactggacaa agtgagggtg gccacatggc ctcttttctt 3840
ttgcctttat tattaatttt ctcaaataga tctgactagt catgtggctg ggaaaatagt 3900
taattgtgat tttttttttt ttaaactgag tctcactcta ttgcccaggc tggagtgcag 3960
tggtatgatc tcagctcgcc gcaacctctg cctcccggga tcaagcaatt gtcatgcctc 4020
agcctcccgg gtagctggga ttatgggcac acagcaccac gcctggctaa tttttgtatt 4080
tttagtagag acatggtttt agcatgttgg ccaggctggt cttgaactcc tgacctcaag 4140
tgatccaccc acctcagcct tccaatctgc tgggattaca ggcatgagcc actgcaccca 4200
gccagagtac cactatttgg gcattcttta atgaaaaaga atgaactatc caaaaattaa 4260
aactcctcat ttatgagctt ttagagaatt ttacagagta gatggaaact ctctgcatcc 4320
tttccccact tctagtttca cctgacacat ttcttccctg tccttactcc tgggccggca 4380
gcagtggtca tgattccaat cccagcttgg ccaccatctg cctcagtggc ctaggaaaac 4440
tcctttctcc agagctttag ttttctcttc tacggaatga agaaagttaa aacaaataga 4500
catttattgt ttcatttgga taaatatcta ttaagcatct attacttgtg gtatggttag 4560
ctgggtatat agtggtgaag cagctgggca tgagtactgc tttcgtagag cttacagttc 4620
agtgaggcca gcagatgtga aacatatcat cacacaaata aaaatataac tatcaactgt 4680
gatgaggatt atgaaggaaa aaatccggca aactatggta ctggtgttag atactagcag 4740
gtgtgggtag ggatttcatt tagattgaca ggttgtcaca ttaaagctga gagccctgaa 4800
gttcaagcaa tggttagcca ggcaaagatc agaggcttag agatagggaa atccattcca 4860
ggcagagaga ctgggggtgc ctgtccccta ggtcagggaa cagaagaaag ccagtggcac 4920
tggtggagtg aataagactg gcgggggatg agttggtagt agacatgacc agatcattta 4980
gggccaattc tcctggggaa ggagaattta atttaatatt tatttattta tttatttatt 5040
tatttattta tttatttatt tatttttcaa gacggagtct agttctgtcg cccaggctgg 5100
agtgcagtgg agcaatctcg gctcactgca acttttgcct cctggtttca agcgattctc 5160
ctgcctcagc ctcctagtag ctgggattac agacgcccac caccatgccc agctaatttt 5220
tgtattttta tagagatgcg gtttcaccat attggccagg ctggtctgaa actcctgacc 5280
ttgtgatcct cctacctcgg cttcccaaag tgctgggatt acaggcgtga cccacagtgc 5340
cccctgagaa tttaatttta ttttatgtgc aagaggattc cctgaggtag tcaggccaca 5400
ttgtctggtg actcttggga tagagggaac ttgaatgaca aaggcccaag aaagcaattg 5460
taatcattac atatacatgg accattttat gctgttttct tctttcattt aacattattt 5520
agtgtgcgtg ttcacatatt tctaaatcat cttctgattt agaataatga tttctgatgt 5580
gtaggctgtg ttttatagtt ttgaaagtaa tactttgata tccattactt tcttgattct 5640
cacagcaatt ctgaggtgta tgcgttgcaa tttctgtttc acagatgaag agagtattgt 5700
taataagtta atggccgggc atggtggctc acacctataa ttccagcact ttgggagacc 5760
aaggtgggcg gatcacttga ggccaggaat ttgagaccag cctggtcaat gtggtgacac 5820
ccatctctac taaaaataca aaaattagcc aggcgtggta gcacttgcct gtaatcccag 5880
ctatttggga gggtgaggca ggagaatttg cttgaacctg gcaggtggaa gttgcagtga 5940
gccaagattg caccactgta ctcctgcctg ggtgacagag cgagactctg tctcaaaaaa 6000
taaaaagttg ctaagaggag ggctgggatc ttttggctcc aaatctactg tgggatgatg 6060
cctttgacat tcctgatagc tgtgcagtaa tccattaaca cagtttttat aagttcaaac 6120
cctgttgcca acatttagat tgttccatgt gtgctgttac aaataaatta ctataaagat 6180
tctatacatt taatctttta ttatttttgt attatttctg taggccaaaa tctgaggaac 6240
aggattacta ggttgaaggg aaatggccct tgaagtgtct gatcagatgt ctttccagag 6300
gatccaacca atttaaatag ccaccatcaa tgcatgagac tttgtagttc agggaaggca 6360
ggcctggttt taaaaatcat ttcccctctc tagcattttt ctgatgtgat ccttaagatt 6420
tcactttagt tttcccaggt ctcattggca tgtatgctgt tagggatggg tctaaaatta 6480
atttttcttc acattcatat catgtcatcc cagtgattat ttaataaata atcacttgat 6540
taaatagtga ttccttttct agttattttt gggacattta ttaaaacctg gatatggtgg 6600
ctcatgcctg tattcccagc actttgggag gctgaggtgg ggggattgct tgagactagg 6660
agttcaacac cagcctgggc agcatagcaa gactccatct ctataaaaat aaggaaatta 6720
gtcaggcatg gtggtacttg cctggagtcc cagctacttg gaaggctgag gtaggagaat 6780
tgcttgagtc caggtggtca aggctgcagt gagctatgac catactactg tactccagcc 6840
tgggcaacag agtgaaactc tgtctgaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6900
aaagatgtgt agggagcaat tttggagtta ttcatttggt catttgatat gtagttttag 6960
ttttggtgct gatagagccc agaatgtacc ctgaatttga tgaacattct gatatatggg 7020
ggagctcatt gtcccccact tacctttttg cctctcagaa tatcttttga tatttttatc 7080
tgttttttcc ccattgaatg ttattacctt atcaagctca aaaaagtacc ctatcgctat 7140
tttaagttca gttgtgttaa atctataaat tagcttggga aatttggata ttaaatgaac 7200
tcatgaagaa gcagagttta gctctcctta attctcatct tcctttattt atcctactac 7260
agttctgtgg ttttctttta tgtaagaagc acatgtttgg ctaagttaat gcctaggttt 7320
ttttgtttat gtgtccattc tcactgtgga tagtattctc ttttccccac attatattaa 7380
tttaactggt tttcagagac taatagcaat gctattattt aggagaattt accttggttc 7440
tgattaactt acccatactt gcaaatcatt tgcagctttt tagttaactt tgtgagttct 7500
cttagattta cgaccatgcc agaaacagaa aggatatttt catctcttcc tttctgatgt 7560
ttattcttct tgtttccttt ttttatcccc cattatattc tcaagaatct ctcaatacta 7620
agaaatagcg acttcatttt tcagcgcgga gtgcattatt ttggctacca tgattcagaa 7680
gcctcttgcc taaggcccaa ttttattctg ctagttttct ctgttctttg tacatggccc 7740
ttgcgctgcc ctaaccttga attaacgtgg ctaaatctca agaatttaag agcaccgtga 7800
ctgtgtcctc aggctaggga gggaaatggg ttcacagagt gactggattg tggtctatga 7860
acttcggcag ccagcagcaa aagtcaggca tgaataatca agtggacagt gaacatctgt 7920
agtgtgggag atgttggcat aactatgaat gatgattcaa gagtggtttg atgcatattg 7980
aataacatga tgataagtac tagactctgt gctaagcctt ctatgtgaaa tacatttaat 8040
tctcataata actctagagc agtggttctc gaccggggcc ggttatcccc ctaccccacc 8100
ccaccctcac ccttccacca gggacataac atctggagat atttttggtt gtcacaatcc 8160
tgggaatgta tgtgctgata tttagaggtt gaggtcaggg atgctgctga acttcgtaga 8220
attcatagga gagtctctca caacacctat ctggccccaa atgtcagtag ggtcactatc 8280
aagaaaatct gctctagcag tgcctgctca tattatcccc atgttgaaat agcaagatgg 8340
gaagtgcaaa gtggtgcttc ggtactcttg gagcagcttt gactttggtg agaaacgcct 8400
tttaaaaaca atgtttcttc ccatcttccc accccatggg gaggtgtggg gttgggtggg 8460
taggcaccaa agcaagattt agaagagttt tctgtaggaa tttataatgg taaaggatca 8520
acttcatttc caagctattt atgagggttt atgtttagga aaagtgctaa gcttagagaa 8580
ggaggagaaa tctgatttta ttaatgagtg tagccataat ggcatatcct ggcagaagtc 8640
aactttggtt tctagaggga ggctattatg aaaagaaata cctggaacat tcccctgggt 8700
ttggaaggtg agttctaggt tcaatgatgg gaagaatttt agaggtccaa gataaaaggg 8760
caaagattaa attttgtctc tcatgagttc tctggctcag gtggtgtgaa ctttgcagac 8820
agtctcttta attcactcat acatgctagt ctcccagctc agcaagggct ttgagagagc 8880
aggtgtctgt atgctctggt aagtgaaggc aaagtgcata aggaggttgg ggtccataat 8940
ggcgaagaga aggagccctt cagtcagagt ggctttgaat cttggctctg ccatttgcca 9000
atcttggacc attgggcagt gtattaactc tttgaatctc agcttcctct tctgtaaaat 9060
gtgtataaca agagtactaa ttggattgtt tgatgattaa atgagttaat gtgtataaag 9120
cactcacaac cctggtacat agtaagacct ttcattatta ttatcatcat caattttttt 9180
taacctcttt tcctgatctg cttacactca ccagcttcag ctgctccaaa tggcttgtaa 9240
gattttttgt ttgccctttg ctgtcagttg ccatggggaa gatccattca tttttttcag 9300
tcaaccaaca tattttgagc atctgctgcc ctacaggatc ctagatatgg gggctgcaga 9360
gatatccagg aacataagcc ttgattaatt gggtcagatc agtgctcagc agggctggca 9420
agtgctaggt ttcttttaag tggcatatct taaaaggtat atgtcctaaa catagctttg 9480
tgatggcagc atgatgggta caaaagcaca cacttaagtg tcagtagatc tgggttcaaa 9540
cattggtgca gtttcttatg gctcgtaact tgttcaaacc tcagtttctt cacttctaaa 9600
acggtaatga tacaacctac ctcacagggt tattatgaat taaatactgg agatgagata 9660
cacaaaacgt cttgagtaca cagtagctgc ccaatattgg ctgtaagtat tataaatcta 9720
caagctgtga attaatttta cctctctgga tcctgttgat atttctagac cattccacct 9780
agtggggcca tttcctacct gagtcacccg tggtgtcaaa tagaatgtca tgtggcctcc 9840
tgagttgggt agaattggct gctcatctca accccgctac tgactatctc tgtgatttac 9900
ccttcctcca gccttagcct tgctacatat aaaatcaaga caataatgtt tcctatctca 9960
cagggttgtc ctgaggatta aattaagtaa ttaatataaa atgtgccttg tacatattgg 10020
gccctaaata aacagtagct actatttatc cttaaagtac aaatggtagt ttcagagctt 10080
caaggctgat ggctatttat cttactcata ctctttgttt agcttcattt ttttccccta 10140
atttcattag tattttcttt tctttttttt tttttttttt tttttttttt tttgaggtga 10200
agtctcactc tgttgcccag gctggagtgc aatggagcga tcttggctca ccccaacctc 10260
tgtctcctgg gttcaaacag ttctcctgcc tcagcctccc gagtagctgg gattacaggc 10320
tcccgccacc atgcccagct atttttttgt attttcagta gagatggggt ttcacccttt 10380
tgaccaggct ggtcttgaac tcctgacctc atgatcaacc cacctcagcc tcccaaagtg 10440
ctgggattac aggtgtgagc caccacgccc ggcctcataa gtattttcta aatttattta 10500
cagtcatgcc atttaaaagg aaagttgtat tcctgtcttt gttaatattt ataagtgatt 10560
ttattcagct acaagcttgg aatggcatat aattttgtat tctgcttttt tcacttaata 10620
ttacatggct aatgatttct gtgtttcata aacattattc tgatgatggc atgatatatt 10680
gttgagtaca tgtaccataa ttgaatcatt tccctattgc tatgcaatta agttgtttcc 10740
aatattttgc aattataatg tttcaatgaa tgaataactt tatgcatata gctttttgat 10800
atcttaagtt cagtttccta ggatgaattt ccaggaatag taattgggca aatgggataa 10860
acatgactct tgaatacgta ttgttaacat tgctttccca aagggctcaa ctgatttata 10920
tttccgtgtt cattatcttt taaaccagct catttactca ccaaacattt ttaaagccat 10980
tatcatgtgg taggcttagt aagaagaaag tgaccctaag ggagaagctt atatataaat 11040
agggtccctg gtgtaccaag tgctgataca gacacaaagt acctggggaa attgagatga 11100
gggagtcctg gctcagctgg gagaaaagtt cattttcata gagtcatggt tttgttcttt 11160
ggcagaaaga aaattgcttt cttccccacc cccaccccca gctttattga ggtataattg 11220
acaaataaaa attgtatatc tttaagatat gcaatgtgat atatatgtat atctcaactt 11280
aaaaaataag ctacagaata aaaaggtgtt tgctattaaa aaaaaagaaa aggctgaatg 11340
tcattcccaa gcttggaaat ttgagtatgt tgcctctttg ggattattta cagaaatatt 11400
agcaagacca gccccatctt tggtcttgag tactccactg tcagcatgct ttcttccaga 11460
gagggatcca tttgccttta tttttcattc tgttgtgccg tctatgcaaa ctattcttga 11520
tagttttatg gtaacagtgt ttttttgttc catgagataa tttatacatg ctcattgtgg 11580
aaaatttaga aaagacagga aagtattaaa aacatcactt tttttttttt tttttttttt 11640
ttttttttaa gagacagagt cttgctctgt cgcccaggcc ggagtgcagt ggcgtgatct 11700
cagctcacag caacctccgc ttcccaggtt taagtgattc tcctgcctca gcctcccaag 11760
tagctgggag tacaggcatg caccaccacg cccggctaat tttgtatttt tagtagagat 11820
ggggtttcac catgttggcc aggctggtct caaactcctg acctcaggtg atccgcctgc 11880
cttggcctcg caaagttctg ggattatagg caggagccac tgcgccagcc acacctacgt 11940
tcttatcatc ctagtacatc cactgtcatt atcttgctgt atttccttct gcccagtctc 12000
actctgatca tgcagtggcg tgatcatgca gtgatctcgg ctcactgcaa cctaggcctt 12060
ctgggttcga gtgattctcc tgccttagcc tcctgggttc aagtgattct cttgccttgg 12120
cctcccaagt agctgggatt acaggcatac acccccatgc ccatctaatt tttgtatttt 12180
tagtagacac agcgtttcac taaaattttg tatttttagt agagatgggg tttcaccatg 12240
ttggccaggc tggtctccaa ctcctgacct caggtgatcc gcctgccttg gcctcacaaa 12300
gtgattacag gcatgagcca ctgcatccat cgccaaaaag attttttaaa agagtttaat 12360
gtagaaccat atcaaaggtc tttggaaata aaaaacagtt ttttaaaaat atcagaaata 12420
aaacaacaaa taaataaata aataaaaaca cccaaaacaa tctgaagcac gagcacctag 12480
cagaaaggtt caattatgat ctattcatag agtggaatat caagtagaca ttacaggaca 12540
tgttttaaga ttatatttta tgtcatggga aatgctctcc cagtatgatg ttaaatgaaa 12600
aaacagaata caaaagtata tatgctgcat agtctcaata ttgtagagaa aaaatattat 12660
ttatgtatgc atgaaaaaag acaaaagatg ttaacagaga tccattgtta cttcagttta 12720
ctagggattg tctctgggag gtaggattaa ggtgatttat atttaccttt ttaaactttt 12780
ctgtattttt ttattttcaa attttccata aaaatataag gacttgaaga tcaagaaaaa 12840
atttctgctt tggctcagtg cagtggctca cgcctgtaat cccagcagtt tgggagccct 12900
aggggagagg atcacttgaa cccaagagtt tgacgttcca gtgagctatg atctccggat 12960
cgtaccgcct ggacgatgga gcaagaccct gtctcaaaaa aaaaaatctt tgcttttttt 13020
ttttgtttgt ttttgagacg gagtctctct ctgttgcccc agctggagta cagtggcaca 13080
atctcagctc accgcaacct ctgcctcctg ggttcaagcg attctcttgc ctcagcctcc 13140
caagtacctg ggattccatg cacccaccac tatgcccagc tacttttttg tattttcagt 13200
agagacaggg tttcaccatg ttggccaggc tggtctcgaa ttcctgacct cagctgatcc 13260
accggccttg gcctcccaaa gtgctgggat tacaggcatg agccactgtg cccagcccaa 13320
tcttttgctt tttttaaaaa aagaagacaa aaagggattt tataccagta ttatcttggc 13380
tgtgtgactc tgaagccaca gttgtaagtt ataattactc tgaaacacaa ggccctgtga 13440
ctcttttggg ctctttggtg tttatcttga ttacaacgtt ggaatataga aatgaaagga 13500
atgggagagg tgatagactt caggcagtgt aactagttgt ctgaacacta ctggctcaat 13560
tatattgtgt ctagtgattt ccatcttgtc cgtctgctaa tttatcgcct ggtaactcac 13620
tgaggcaggg ttttcctttg gagaaacctc attgttttaa ccagtgtatc atgcttgttt 13680
agaagttcaa tgatcttttt aactcatcgg agaagatgat gaccagacct ggacagatgg 13740
ggaaggactt tgcactctct ctttacagtc ctgagtgcac acaggtcaat atggaactat 13800
gtgtgaattt tcattgtctt tgagagccct cttctctgcc ccatagggag cagctttgtg 13860
tgcaattaga ggagcaaggg ttgtgtgtat ttagcacagc aggttggcct ggtcctctcc 13920
tctcaacata gtcaccacat acctggcact atgctaaggc tgggaatgca gacagatggg 13980
tgcctgcttt cagagtgctc aatgtgctga ggaagccagc aacagaaaca gatgatttca 14040
ggagctccag gaaaatgcta caggaggagt gtgcctgggt tactggagta gcacaggagg 14100
agggcttcta gctcaggctg agattttagt aaaggaaatt atgccacgat gaatcctgaa 14160
gaatgaatag aagtgaacca gataaagcac gataggaagc atcttccctt acctaaggga 14220
agacacagag gtatatggaa tggtatgtta aaaggttggg actccaaaca gttctgttaa 14280
agcttagaga gtggtgggag agactggaga agttgattaa ttagtaaatg aagttgtctg 14340
tggatttccc agatcccagt ggcattggat atccatatta tttttaaatt tacagtgttc 14400
tatcttattt cccactcagt 14420
<210> 198
<211> 1448
<212> DNA
<213> 人类
<220>
<223> TMEM195
<400> 198
gtgagacttt attggaagag gctactctta ttcttgctgc tttcttaata aatggtaagg 60
tcaatctcct tagggttttg ttcactttca ttattcaaat gattacattc taataataat 120
aattcagttt cttaaaggcg tgaagcaaaa gtagaatttc cacttgaatt ttcttacaat 180
ccatagccat cttcacctgt aaattccctc ttttatatgt cactccagaa tatgacaaaa 240
acaaaagttt aaagttttcc tggactccat ggcattgtaa atgtagctat tggaagctca 300
atgacaaata gttacaccac atcagtaaac tttgtaacaa tttcattttt aaatctttca 360
cttgtccacc ccttccaggg aaactatttc ctctttcatt tggtagagta gttcagcaga 420
atgaaggata tgcagcttga ccaggtccag ctctgacttc ctaagtttga atttgaccca 480
agttttcttt gaaactctga agtgctcaga ggcacatttc acttctggtt cctggctatg 540
attggaagtg gaaatatcca gaattagaac ttgaatactg aagttcccca ccctatcaaa 600
gttattccta caacactcac tagttcatgg cagaaataga aaaaaaatga catcatagaa 660
tatgttattg agagttcagt ttagaaagct tcaaaactca tgattagctt ccaaatgagt 720
aaaatccgta tctttttcaa gattagatat tacactttct ttctgagttt ttaagttaaa 780
aaaagtggca ctgatatctt cataaattat tattgtttat actgcaatat caaaccaaat 840
tcaatgctcc atcaccaata gtggagcttt caaaacatct cttattatgt gaaacaaaaa 900
tcaaaaccaa atgaataaaa tctgaatcat gttttaagca aacatgtaaa attaccatat 960
tctctaaaat tctaagcaga aaattgtctc tactctttga atttcatcat tagaaatagt 1020
tctggtaagt ctaatatgaa aaattagaat tatgtgcatc tttaaggaaa gcctcttgaa 1080
gtgggtctaa attatacatg tagagacaat agacctctaa ttatctacct tattctaaat 1140
gtatttttta aactaatttg gaagatgttc ctcttaatct tataatatta taattatcgt 1200
ggttatatct atgattacat ttcatattca aattggatga tagaatttga gcacatgttt 1260
agtgtatgtc taaaataatt agacttcttt accactgtgt aggaagtaat cctctaaaat 1320
gagtgtctac catctcctgc agggcttccc aaatctgggc ctttcaattc tgaaatgact 1380
aatcaggaaa tgtaaaataa tttcatatgg aacataatag catctctttt ctgcaacttc 1440
ctttccag 1448
<210> 199
<211> 3633
<212> DNA
<213> 人类
<220>
<223> TLR4
<400> 199
gtatgtggct ggagtcagct cctctgaact ttccctcact tctgcccaga acttctcact 60
gtgtgccctg gtttgtttat ttttgcaaaa aaaaaaaaga gttaaattac cttaaagact 120
caagaagcca cagagatcaa ataattcatt gttacagggc actagaggca gccattgggg 180
gtttgttcca tttggaaatt ttgagtgcta acaggggcat gagataacat agatctgctt 240
aaggtccctg ctctgctacc ttgtggctct gtgaagaaat tatcaaacct gtctgagact 300
agttttcgca tctgtaagag aattataata ccttcttcac tagagagtaa gcagactgct 360
tcagtgtcat ttcttcccac tggtggtctt tacactcagc ttcaagcagt caccctgctc 420
ctttcaatct caggaaaaag atggcttttg tgtgtgtgtc tctagagaaa gaactttcta 480
agtgggtgtc agacttctgt atgcagtaat atagtttagt ccagaggatg aaaaaaataa 540
gagaatgaaa aaggaaaaga gagagagaga gaagaaaaaa gcaagaggga aatatgtata 600
atgtcagcta atgcaacagt ttctttctta gtgaaatacc aatcagctgg ttggtaatct 660
tattcatgat ggatctcttt tgtttttccc ctgcgcagac ttcacagttg ctttagaaac 720
ccatagtaga gccgaacagc taagaaaatg atttacagtg aggcagggtc agaaactcaa 780
gagagaaaaa gccagctgca gtcctgaagt tgaggatata ggagaaaatc aagtaatatt 840
tagcaaagac taattcatta tcttgaagcc atcccttccc tcaattccct gcccatagtc 900
ctcctccttg tcctcttctc tgtatccctc tgctgttagg ttaatggaga tagattttct 960
aattaggctc actgcgagat aaaaccacag ccaaacttga cttcttttcc ccatgtacct 1020
tttcctgtca gtccctgaag cctgtccatc cctgcccatc cccttagttc cactgtaagg 1080
caggccctca tttcccctgg cattgactct tacacactaa ctgctttcct gattccagtc 1140
ttcttccttt aattcattct gcacgttctt gtttgttatg tacttgcatt tgttgttatt 1200
atttttcctt aggcttcaat ctaacaaatt actctcctta aaaactttta ataactctcc 1260
attgccatta gaacagcttt ctaccacagg gcctttgcac tggctatttc ttctacctag 1320
aatgctagat cagtgctatc cattggcaat attatgtgag ccacatatgt acttttaaag 1380
tttttagtag cctcattaaa aaaagaaaca agtgaattta atttcgataa tagttttatt 1440
taacttagcg tatttaaaat aatgtttaaa attttaatat atatttacct attattgata 1500
tttttacatt ccttgtttgg tactaagtct ggaatttagt atatgtttta catttaccac 1560
acttctcaat ttacactatt cacatttctt gtgtttgata actgtgtatg gctagtgact 1620
accgtattgg tcagtgcagc ccaagtcctt ttcatgcttt aatcactcca ttcagatctc 1680
tgattaaatg tcccctcctc agggcagtct tccttgattg ccccatgtag agctctccag 1740
cctcacttat ttgcctcaaa tccccttata ctgcttaata tttttttttc tagagcacaa 1800
cattttatat ttttgtttgt ttattttctc tctctccctt tgtaatggaa tcggtaagga 1860
ggcaggatca ttgctggttt tatttaccac tatatttcca gtggccagca cacagtagcc 1920
gctagatgtg taagtgataa atgattgaaa taattgctgc aggacaaagt ctgaggccct 1980
cctgatctgg cttgccctct tacttagatt tcaccactcc caccactcac cagctaatct 2040
gagtttgttt tccactcttt acgtgctcac gttgtcctct ccttaggaca tgtttttctt 2100
cccctttcca catatctaaa ccttactcat cttccaagac ccactttaaa atcttccttt 2160
tctgggaagc ctttcctgaa tccagacttg atctctgctt tctctgaacc acagggcata 2220
ttttctaagc ctattttatg gccccttgag atagtgttag ctttgctcct atctaaactc 2280
ttactctaga ctgtgagtcc attgaagtct ggagctgcat catatttttc tttgtaatgc 2340
ccacagcact tggcaggaaa tgcctacaat ttggacttaa gtaaaccttc atttaatcag 2400
ttattcaatc agttagtgat tcagcaaata tttattgagc accaaccatt tgccagacac 2460
cattctgagt gctggagaca aagcagtggg caaacccatc aaacttgcaa tggaatacag 2520
gagatgaaca atacgatgag aacaatcaga tagacaacat aatgttagat ggttgtgctt 2580
cccgtgaaag ggaataaaag agggcaaaga aagagtgcct ggcactgttt ctattagaca 2640
atattgtctt tgaggctcca tggcttgcaa catttaagca gacatacgaa tgaagatctg 2700
catgtttgaa ctctgacttt gcgcatatta cttcatttct ttgaatttcc attttcctca 2760
tctttaaatg cttatttgaa gattaagtga aagtatataa caaacaagaa ctatgcaggc 2820
atatggtaag ggattaatga tagatgataa taattaatgt tgacatctat tgatcactta 2880
tactgtagcg ggcttttaaa taaactcttt aaacacctta tctcatttaa tccttcaaac 2940
attctattgg tttcaaacaa cagaaaacta caattagctg gcttctgcaa ggaattttgt 3000
tggaggaaat gagagcattc agaaattaga tgggagcgtt agagaattag gcttacaaag 3060
aatgtgggaa agtaggctag aaagcagtgt aaaaacaaag acagcataaa gcacttgacc 3120
ttatttacta ggttccacca tgggaatcca tgcactctaa agatttcccc ctatttctac 3180
atcactttgc tcaagggtca atgagccaag aaaaagaatg cagttgtcaa aatctgggcc 3240
atgactaagg aaggtctgga catcttgact gccagacagt ctccccaatg atatggagta 3300
tttaaaatga tactggatat tttatttatt ttttgtattt tcaactttta agttcagagg 3360
cacatgtgca gagcatgcag gtttattaca taagtaaatg tgtgccatgg tgatttgctg 3420
catagatcat gaaaatatgg aacgcatcat ggatttgtgt gtcatccttg tgcaggggcc 3480
atgctcatct tctctgtatc cttccaattt tagtgtatgt gctactgcag caagcacgat 3540
attggatatt ttattaccta cattttacat atgataaaat gaggctcact gaggtttttc 3600
ttttgttcgt tttattttgt tttgttttta aag 3633
<210> 200
<211> 422
<212> DNA
<213> 人类
<220>
<223> MR1
<400> 200
gtaagtgttt tgagcttatt gtgctgggtg ctagagtagc agggaggaca gacctaagtt 60
gaagattacg ggacaatcta agtgacacct gctatctcag acagagactt cagcatcata 120
gggagccaga gcagggagtt ccaagccgtg ggaactgtga ctctttctta ctgaccctta 180
agcaaaattc taagctccag ggaagcagag gcagcagctt gagctccctg attgaccaga 240
tatgattaat ctttgtttct ctgtgctttg aacatgacta tgctccataa atatttaaaa 300
attgggaata gggtgaagat agatacacca aaaggagcaa gcagtgtctg aaaccagcaa 360
agacttaaaa gttaccgaag aaggtgttca tgctttcatt ttatcttttt tttttaacct 420
ag 422
<210> 201
<211> 393
<212> DNA
<213> 人类
<220>
<223> FCGR1A (CD64)
<400> 201
gtaagttgga ctcagagggg acagttagaa gggtacaggc tgtggctgtt gtgagtcaag 60
agttttgtct tcctgtggta actctgggta gaactcatga gtatgaagca acttgtatct 120
gtgcttccat ggtttattag agcttatttt atgaaaagga tgggaagggc aaccctgagg 180
tagcattaag cctggacgca ccgcagtgaa gtttccttga taaccacctg tagcttgttc 240
agttctgtta gtactggatt ttgagaaaga gaaatagaaa ctcaagagat ctgagttgat 300
ccctcagagt ctacattaat tctgtctccc caattctctc ttcctcatta ttttccttgg 360
accaactgat atctttattc tctgatctct tgc 393
<210> 202
<211> 1273
<212> DNA
<213> 人类
<220>
<223> CSF3R
<400> 202
gtgagtaggg gatccctaga gaggggctga gccttgggct tgatggagag ctggaatcct 60
ggggccactc cccacagctc tgccaagtgt tcatgtccgg ggtcctaggc ctggggcccg 120
ggattcgtcc tttggaaccc cagccctgga cactgagtct cttttcacag gatgccccta 180
cttttggggg tattgcacca gggaagtcac tcacagccaa gtatctcctt ggggacactg 240
agctgggctg gggacaggca taatcattct cccctcccca tgcctctgtc tctcaggacg 300
tgtgtgtctg tgagttccag ccgcgcaacc cctccccgtc tgggtctcta tttcactctc 360
tgtttccatc tttcctcctc agcttctctc tggcttgcta tctctctgag tttctctgtc 420
tcgcatattt cctgctatct cttgaatctt aaactctcgg taacagacgc ttcccgggct 480
ccaggcctcc gagtgccccc cccccgccca ctctctgggt cggcgtacat tgggcccttt 540
ttctctgtct ctcgatatct ctctggcctc aatcgtcctc ttggcgagtc tctctgtcgt 600
ttcagtctgt gtggatttca gtcaccgcct cactctgtca ctcttcctgt tgctctctct 660
ttttctttat ctgcagcata tctggaaatg cctctcccct ctgtttattc ccagccccct 720
cctccctccc cacccttccc acagaaagaa tctcgaggtg agagtagaaa cagcaaggga 780
gcgaggggtg tgaagtgggg aagagagtgt gaggggagag ggctgagcgt gatgagggag 840
aaacagaaag agggaatgtg aaggcagcca gcccaggaga catcgagctg tgctgggcca 900
caggagtgag cacctgcaga gcccagcaga gatggccgca gtgacaggag ggccaggggg 960
cccaggagtt aggaggagag gatccagaaa gggggctttg gaactgcgca gtgtggcaca 1020
gacaaaagca aggtggcagt cctgggaggt gtgaccacac aggctgtgag ggaggcaggg 1080
gtgaggggaa aactgaactg tgctggattc tgtgagctgc tgacctgcta tttatggctc 1140
gtgaaaataa cctatggttg ctgagtgcca actccatgca aggcacaggg ctaaatgcct 1200
ttaccaaaat aatctcattt catcctcaca acaacgctga ggagtgagtg ctaatgttat 1260
ttctttccca cag 1273
<210> 203
<211> 29639
<212> DNA
<213> 人类
<220>
<223> FGD4
<400> 203
gtaagtggtt tcattttcta gtagatatat ttttttcttc cccagcgtgg gtcactttat 60
aacactgcat gccgagggat gtaaaagtgg cagagtttgg ttttctttta aagttaataa 120
agctcacatt ggttttcaag ttcaagatta aaatatgtgc tattgatggg ttttggctct 180
ccaggaggct tcttctgggc taaccagata caaatgagtt tgatagttaa gtttctctgg 240
cttattttta ttatcataag taaagtttgg aaatttggtc attgagggga gaaatataga 300
gaaagaaagg aacagttttc tctttttcct cccatttctg gtgtgaacaa atgttaagaa 360
atatttacca ctaatcattt ttctagtgct actgcacgga gcattgttct gttaaaacaa 420
acaaaaattc ccaccatccc agtcttgttt tggtgaagtt caggggagta agtattattt 480
gtttttctgt aaaagacaac attgtagaga taggcatgag tttgtttttt aaaaattgtt 540
agtggtagta gtattaagcc actgtggtct ctttgagtgt tgtagagagc atattaatga 600
gaaattgagt ctttgaaata gaaatgtaat tcaactgtgt gatagaaatg taatcatgtg 660
acgggaaatg tctgctaaaa atatttttaa tcactgaaat gggttcattt tgtttatttt 720
cccattcgtt tttgactgga tataagcctc actgaaaaat gtccacactg ctgaacaaga 780
taaactacaa cttagaaccg gcagccttca cagttaccag tattctttct gatggtggtg 840
tggctctttc cttccttaag tgtcaggggc atacgctgag tgtggaagcc caaggttggg 900
gttggtgaca gcactgcctc aggagagctg aggcgccact cctgcagctg cacagctggc 960
tccgttccca ggttctagta gctgcgggag ggttaagcag cccagtccat gcctgcccct 1020
gctccctcca tcactcaggc agaagcctga attcttttgc aggcgttcca ccactcttgc 1080
ataaagtttg gaggtcttgt gatctctcca aaatttacca tcatactcta aatatgaaat 1140
taaaaaaaaa aaaagaaatg cagcaaaagg gaagtgtttt ctcaccccaa gcagtgaagt 1200
tttaggttct ctttttcctg aaatagcttc tgtccattct catttatctt caaacagtta 1260
gagatgattg gagagacagt attccctcct ggaaggcagc tcttaattag agaggaaaat 1320
atttctagaa caggaagatg aagcttgaga ggtgaatgtt gataaacata gagaacttgt 1380
tggctcttgt tttctgcttt aatggacagc accctttaga gagtggccac tacaacaata 1440
tggactttat aagttccttt ttaggttttt aaactgagaa gacagtaata tagcacttcc 1500
tgcctacact actggataat tttgttaaat catctaagaa aaattgtaaa tatgcatatt 1560
tagtgcacat gttattttat aacagttttt tttttttaat gacctgaaaa aacttctctt 1620
tctaaagctt acgctttcag gcaaactcct ttcacatgaa agaaatgaaa tatgatagag 1680
tatgatgaat gactcaatag gaaatattat gcagttcttt ggaagaatga taacttggtg 1740
ttcctttaat aaacatccaa atgtacatgt aacctaaact gcaaactagg attaagattt 1800
aaatttaatc agttcttctt agatactaga atagacttga ggaggtcaag agtagatagg 1860
agactcctgg aataatccag ggaaaagttg aagtcattta tttcaaaaat aaaaaggtat 1920
tttcttagat gttttgtgga ccatccctgc ccacttcctg agccaccttc tgataacctt 1980
tactgtaggc acctgttttc tttataaaat aacaagctaa tttttattgg ctaaagtaca 2040
tttgtaaatg tcttcaccct ggtttgtgtg tgttctctga tttatctccc accacagcac 2100
ctgctaagct ctggctagaa cagatccttc catttttatt ccctggcgaa ttgacacaag 2160
ttagttggtt atacgttgaa gcaggcagaa ggaaaacact taggagaaga aaaatagtgt 2220
taatcgtaga atttggtcat tctacatggt ggttattata ataaaacttg gcctggggaa 2280
aatgagtctt tcaccctctt agagaataag tacacacaaa tacattttta aaacatttaa 2340
acaaacaaac aaaaaagact gtgtcactgt ggtcttgtct tttccatgcc attataaagc 2400
agttatttct tttttttctc tctctctttt cttttttttt tttgagacag agtctcgctc 2460
tgtcacccag gctggagtgc agtggcgcta agctccacct ccggggttca caccattctc 2520
ctgcctcagc ctcccgagta gctgggacta caggcacccg ccaccatgcc cggctaattt 2580
tttgcatttt tagtagagac agggtttcac cgtgttagcc aggatggtct caatctcctg 2640
atctcattat ccgcccacct cggcctccca aagtgctggg attacaggcg tgagccacca 2700
cgcctggcca taaagcagtt attatttctt atgcttagtc ccaaaaacct agtcttcctt 2760
gagtcatttt tctcttatgt acaatctggc aacaaatctt gcttcaagat atatcaaact 2820
gactatgtct tattgcctct actgttactt gccctgcttt aggttacaca cagctttccc 2880
ctggattgct tctactagcc tcctatctac ccttgacctc ctggagtcca ttgtctacct 2940
aacagcctgt gtgcacctct aaaaacggag ggcagataat tgccacttct ctgctcgcag 3000
tccttcagtg aattcccatc tctttcaaag gaaatcccct gttctttcaa tgatgtgcaa 3060
ggccctacct tctctagccc ctatccctat ccctacccct taactttctg acctcagcat 3120
caaatatgct ccctagtcta tccatgttgt cttccttatt tctctttgaa catatcaact 3180
gtgcttctac cttaggattt ttgtagtttt acactttgct tggaatgcta atcctcaaaa 3240
tatgttatgc cttattccct tcatgtctac tcagctagca gagtattagt gagacctcct 3300
tgtcctccct gtatatagga tataataata gcctctcacc taatagcacg cctgttcctt 3360
cacccagctt tactttcgtt atagcagttt ttttgtttgt ttgttttgtt ttgttttgag 3420
acagagtctt tctgtcatcc aggctggagt gcagtggcgc agtcttggct cactgcaacc 3480
tctgcctctc aggctgaaac gatcctccca cctcagcctc cacagtagcc aggacttaca 3540
ggcacacacc accatgcctg gctacttttt atatttttag tagagacatg ggttttgtca 3600
tgttgcccag gcaggtctcg aactcctgag ctcaagcaat tcacctgcct tggtttccca 3660
aaatgctggg attacaggtg tgagccactg tgcctggccc atcatagcac ttttaccatt 3720
tagcatgtta tacaggttat ttttttgttg tggtgttcac tgctatgttc ctagggtcta 3780
gaaaggtaac taatagatac tgggtgcttt gttaatattt gttgattgaa tacatttcta 3840
atattcagtg cctttttctg ttgggaaatg taaaatgagc aggaatataa gaagtttaat 3900
aaattataaa tatttgtagt gttctccatt tcttcccttc agttctcttt taagaataaa 3960
tatccttgct tgctaacctc tggtgtccct tgttgagcag catgtcaata atgagttcct 4020
gctattggaa gcctcacagg ccaagttgat ataaagaagt atgaagaaag tatggagggg 4080
ttagtgggtt agtgagattg gaatctgtgg ctgagcccgt acatgatttt ggatgattaa 4140
ttaatgggct gtgtcgtaag acagaaaaga gatgagggag aagctttggg gtgtgaaacc 4200
aagaaatctg gagcgatact gtctgtgtgg agaaaattgt ggccaagatt ttttgctatt 4260
aaagatgtac ttaggccagg cgcagtggct cacacctgta atcccagcac tttgggaggc 4320
caaggaggga agatcatgag gtcagaagat ccgagaccat cctggctaac accgtgaaac 4380
tccgtctcta gtaaagatac aaaaaatcag ctgggcgtgg tggcacgcac ctgtagtccc 4440
atctactcag taggttgagg caggagaatt gcttgaaccc aggaggtgga ggttgcagtg 4500
agctgagatc gtgctattgc acttcagcct aggtgacaga gggagactct gtctcaataa 4560
ataaaaagat aaaaataaat aagaaaaaga ggtccttaat attttatatt aatgatatac 4620
ttgccccact ttttgttttt tctcttccta catttaagtc atttcactct ttgaagcact 4680
cttgtaggag ggtgatagga aaagtaaaac gattgaataa aaaataatct agaaatattt 4740
ccttagtagt tcctgtaagg cttgatgtgg aatagaaaac caatacacgg gccaggtgcg 4800
gtggctcaca tccgtaatcc cagcacattg ggaggctgag gtgggtggat catctgaggt 4860
tgggagttca agaccagcct gaccaacatg gagaaaccgc atctctacta aaaatatcaa 4920
attagctggg cgtagtggca catgcctata atcccagcta cttgggaggc tgaggcagga 4980
caatcgcttg aacctgagag gcggaggttg cagtgagctg agatcgcgcc attgcactcc 5040
agcctgggca acaagagcga aactctgtct caggggggaa aaaaaaaaaa gccagtacat 5100
gaattaaagt gtaagaatta tttgtgttta cacttcatgt aatttatttc caaatttatc 5160
tagataattg gaaattgacc tgcattttaa aatctgtagc caacagttaa tgttaaaaaa 5220
aaaagttccc ttccccaaat gcagttaaaa tctatgaact gctgtttgct atttgataat 5280
atacttgatc tgaatagtaa ttatacatta ttagattaca tgacttctta gaaatatgga 5340
atcaattttg actatagcaa aaagaaatta tacaaagctt gaaaataatt ttgttatttt 5400
ataaatgtgt aagcccctta atgtctatca gtagttactg atttattaga aatatcatgt 5460
ttttctctaa tattgcccag taaatttttt ttaaatttat ttccatcaga gttactaatt 5520
tagagtgtaa aatagcaaaa taagaaatat caaggaaaaa aggtatttct ggtaactttt 5580
tatctaaaat tgaccatttt gatacagaat ggtaacaagt catgcttagg gttaggaaat 5640
gtaactgtat tcactatact caatcctaaa aattgtgtaa tacctctatg ttcaaggagg 5700
tttaagttcg cctccctcat agacctctaa atgcagtgac tatgagaaat gtcataggag 5760
aggtacaaaa tatgtttgga gaatagaaaa ggaggaacaa ctgtttcatt gattcaagga 5820
aatttcctca aaaaaggtaa cattggagct agatattgat aaatttgttt aaacaaagac 5880
tttctgtttt ttaagctaaa agaaccaacg tatgcaaaag cagagagaaa catatgaaaa 5940
gagaactgtg ttttccagga atggagaaga tgagaatgtg gctagagtgt taggggtgca 6000
tagttctgag tagatggata ttaggccctt caggagattg acgccttttt ttttctttct 6060
ttcttttctt tttttttttt ttgtgagaca gagtttcact cttgtcgctc aagctggagt 6120
gtgatggtgt gatctcagct caccgcaacc tccacctccc aggttcaagc aattctcctg 6180
cctcagcctc ccgagtagct gggattacag gcatgtgcca ccacccccag ctaattttgt 6240
atttttagta gagatgggat ttctccatgt cggtcaggct ggtctcgaac tcctgacttc 6300
aggtgattcg cccgcctctg cctcccaaag cgctgggatt acaggcaaga ttgatgtctt 6360
aatgtgaagg gtcctttatg caagctagag gttttgaggt tccccctccc catcgagcct 6420
tgcagttcca ttaaaggatt ttaagcaagg gagtaataaa attcgttata tcattgaatg 6480
aataaaatag tcagactttt tatttgtagg agaaaaattg tattagatgt agccaaatat 6540
ggcttaagta atgcagtttt aaaattcaga attggaaaat tggtttatct ttgattaact 6600
ggttcatttt ttttcttcct aacttctttc ttctgtcagc caaaaaaaaa taggaaataa 6660
tggataagct agaagcagta tttgcttttt aagttttgca tgactgaaac aatcccctac 6720
actgttagaa gcctaacaca caatgctatt gtgctctggg tctagaaaaa atgtgaggcc 6780
tgctagtctg attttgcagc agggagtaag gaaagccaat acttaacttt gtaagctgct 6840
aaatattaaa tgtttagtaa aatggggttt atagtaatgt tttttttgag acagagtctc 6900
actctgttgc caggctggag tacagtggct cagtctcggc tcactgcaac ctctgcctcc 6960
gggttcaagc ggttctcctt cctcagcctc ctgagtagct gggattagag gcgcctgcca 7020
ccacacccag ctaatttttg tatttttagt agagacgggg tttcaccacg ttggccaggc 7080
tggtgtcaat ctcctgacct ggtgatccgc ccgcctcagc ctcccaaagt gctgggaata 7140
caggcgttag ccaccgtgcc cggccagtaa tattttttct taaaaagaga atatcaaaat 7200
aaagaggaga gtcaggagta gagggtatca ccaagccttt tttagagtca cctaatttgt 7260
tacatgtttt tcttaaaatt accaaccatc aaaaagaaga attttgatct atatctatgc 7320
ctaagagatg tcagtagagc agtaaaaata tttctctaat ttataaggaa gttaagtaac 7380
tttcccacag tcaaaataat catgtcaaaa atttgacctt tcaaccacta gttttagtaa 7440
tccaccctgc ttttttcctc agggaaaaaa aaaaatgtac ttcccagata aacatcacct 7500
tgcgtttcac cgcaggtctg ggtgatcctt accttggaac aaatgatagt gttggtgcat 7560
ttaaagtagc agcttttggg tgactggctg gtcctgagga gtttttccta cttagcagtg 7620
ttcattttat ctattaatgc cgtgaagcaa aatacaggtt gaatgagcag tgttggtaac 7680
tgcaaaacaa agtgttgcaa cacagtaggc tgaggtagtt ttaagcagat aaagtctaca 7740
gaaattagtt tacagaaata gtgttaggct gggatgtttt agctgctaga tttcagattt 7800
agagaaatca agtttagaaa aataaaccag caaagtagta caaaattaat agcaacaatg 7860
tcaggaagaa tttgcttatg aaaaggatct attttccctt ttgtgaagag aaacatttgt 7920
tcacccttgg ttacttgtga ttgagataat taaaaacaat tttatttggt tttagcagcc 7980
tccttgtgaa aacttatgaa atattaggca gtttgatttt cttctcctct ctggacctgc 8040
agataaattt gttgtgaata aatggaaaat agtttggcag tgggcagaag caagggaaaa 8100
gccaagaatc tggtcgattt ataaaccaga cattgtgaat aaatgagttg gctacagctc 8160
ttagaaaaag gcttttgcct ttcgagttct tttcctacat ctgcttttat ttctttcaca 8220
ctttatgaag tcaataaaaa ttttgatttc attgttacag aagtttctcc ttgtatagga 8280
gcttttcatg ccctctgttg gccataaata atttactttt gatttctcaa ggctcctaac 8340
tggtgacttt tcatataagg ggatgtctag gttgtttttg gtagtgatat tatctctttg 8400
tacccagaga acacttctga caccaaatgg ggggttttct tcacagcaac aaccagttct 8460
tcagctctac ctggagttag cgtcagatcc cataggtgaa acgctgagtc ccacaagact 8520
atccccactt tagatgccag tcacaagtcc caggcatccc gtagttctga ctgactcacc 8580
gtaaatcaga ggttcccatg aactcctcat cagatttaat aatttgctag attgggtcac 8640
agaactcagg aaagcacttt actgacattt gcttgtttat tataaaggat actatgaaga 8700
atatagatga acagccagat aaagagagat taatacataa ggtgaggtcc agaagattcc 8760
tgaacatggg tgctcctgtc ccatggggtt agggtaggcc accctccctg cacatggatg 8820
tattcaccaa cttggaagct ctctgatcct tgtcacttag aggtttcatc atgtagacgt 8880
gatcaattat taactcagtc tccaggcact ctccctctcc agaagttggg aggaataggt 8940
ctgaaagttc catgcttctg atcattactt ggtctttctg gcagccacct ccatcctgag 9000
gctacctagg gttacgccaa gagtcatttc atcaaaagag gcttctacca cccaggaagt 9060
gtcaagagat ttaagaactc tccgttagga acaaaagatg ctcctattat ccccaccact 9120
taggaaatta caagagtttt gtttttgaga cagggtctca ctgtgttgcc caggctggag 9180
tgcagtggtg caatctcagc tcactgcaag ctccgcctcc tgggttcatg ccattctcct 9240
gcctcagcct cccaagtagc tgggactaca gatgcccgcc accacgccca gctaattttt 9300
ttgtattttt agtagagacg gggtttcacc atcttagcca ggatggtctt gatctcctga 9360
cctcatgatc cgcccgcctc ggcctcccaa agtgctggga ttacaggtgt gagccaccgc 9420
acccagccgg aaattacaag agatttaagt gctgtccttt gtcagaaacc agagatcaag 9480
tatatatatt tttattatgt cacaaatgga ttctaaaatc agataatctt actattactt 9540
atctgtgaag aggacttcat actttgcaca gaagtatttg ctgtgactta aacaagagtc 9600
acatggtgct atgagcttaa ataattacta gtaaaatttg gccagagcca gcagccatgg 9660
cttatgtctg taatcccagc actttgggag tccgagatgg gtggatctcc tgaggtcagg 9720
atttcgagac cagcctggcc aacatggtga aacaaaaaat gtctctacaa aaaatgcaaa 9780
aatgagctgg gcgtggtggt gggtacctgt aatcccagct acttgggagc ctgaggcagg 9840
agaatcactt gaacctggga gggagaggtt gcagtgagcc gagatggtgc cactgcactc 9900
cagcctgggt gacaaagcaa gactctctca aaacaaagaa aattgttttt ggctgggtgc 9960
agtggctcat gcctgtaatc ccagcactct gggaggctga ggcaggtgga tcactttgaa 10020
ctcagtcgtt tgagaccagc ctggtcagta tggtgaaatc ccgtctctac aaaaaaatac 10080
aaaaatgagc cgggcgtggt ggctcacacc tgtggttcca gctactcagg aggctgaggc 10140
tagaggactg cttgagccag gaagtggagg ttgcagtgag ttgagatcgc accattgcac 10200
tccagcctgg tgacagaagg atactctgtc tccaaaaaaa aaaaattact attaaaatta 10260
gtcttcatgg tgttttggtg aactttagct taccagctga aaattatgga attcatttca 10320
tatagcttcc actataaata ctattttgat ccaagcctgt taataacact aagcatggtg 10380
actctcaacc atgactgcac agtgggattg cctgggaagc tttaacatac actgatacct 10440
gggtctcata tcccagagat tgacttaagt ggtttggggt gcaacccagg tattgcagtt 10500
ttctttctta aagttccaca ggtgattcta atgtagtcat ggttgagagc tactgacctt 10560
gagaagcatg attttttaga ggtggctaac ccgttctggt ctactggttt acatgcagta 10620
gagatagttg gggaagataa tttttgctta aaataggaaa gcaactgaca caatcgcatg 10680
gtaggcatgc agggtttaga acagtaagaa actgaagatt ataccatata acactgtgaa 10740
tttattaaat acattccaga gtgggttatc agccaagatg tgctagatca actgtgtatg 10800
gtgctgctaa tgagttcaca gaaacctaga ggtttttact tgcccaaggt cacaccacta 10860
gctggggaca caaccaaaac tggaaaatta tagtggtaat tcatagtttg ttgccttgat 10920
tatttaggtc aagttctgta aactttttct gtgaagggcc agattgtaaa cattttaggc 10980
tttgcaggcc atatggtccc tgttgcaact actcaactct actaacatag taaaaagcat 11040
catacacatt atgtaaatga atgaatgtgt attctagtaa aactttattg acagaagctg 11100
gatttggcct gtgacctgta ggctgcagat ccctgattga ggattgtttt aatcttccca 11160
ttggaaagtt ggctccttaa gagtaggctg aagatgttac tggtcccacg tggtgcctta 11220
cttcctggta ctgttacagt ggcctctgtt gcaaggtgtt agatgagtgc ttgttgaatt 11280
catatctatg cagctcttaa cgtttttctg ttgcttctaa cccttccagt aggggaaaca 11340
gttggcacat attccagctt tggagaggaa atgcttgaag tctgtagcag ggtataattg 11400
ctgaattctt caagcgaatt aaagatctga atttgctcta gggcattcat aattatttta 11460
atttcctgga acagattcta agaattcatt ttaaatctga aagtttttct taaaatctgt 11520
tttatgatac actgtcttta tttttgtgaa tattgttagt ttctcacaac aatatttatt 11580
tcagttcatt tggatctaag atctttgttg tacttatgtg tggccagtag actctttagc 11640
aaaattaaac aaatgctaat gggttcccac agccacccaa atattagaag tacagctcca 11700
gattatgagc ctgtttctct ttttcttttc ttcttctcat tattttaaag agatggagtc 11760
tcagtatgtt gcttaggctg gtctcaaact cctgggctga agccattctc ccgcctcagc 11820
cttccaagta gctgggatta caggcaggag ccaccacccc agacatgaac ccacttctaa 11880
tgcaaaacac atattgacct gacaacaggg ccctcagttg tggtggaaag agcagtgacc 11940
ttggaattaa aagccctgtt gtgactcgtg gctttgccac ttttaaccaa ccctactttt 12000
atttacctat aatgtgcagg tatctgtctc actctttagg gatgccaaag gtgaaatgag 12060
gtgtgctgtc tatgtgacag tgccttgtga gcacttttct gacttctccc tgaggaggtt 12120
tgggtcaggc ctagcagaaa ctgcagccat agagcatgga gggaagtagg acttgactag 12180
cataaagtga gtctatgaga gtgtgcccac tggtttccaa agagaatgtc gaagagtcta 12240
caatggtgag gcctcatcag cctcgatttg agaagcaaat gtaggtcaga aatggggagc 12300
agaacaagag gaaaagaaga aggtcaggag tgtgcagagc tgaagaggtg gtgagaagtg 12360
gttcaaagct ggaaacaggc aaggtaatct ggaattctgt cttgatgtct attgagttat 12420
cctaaatcaa gactcatgtt cctcttacct tatatttctt aaattgattt gtttgatgcc 12480
ctgggtattt tgaagctcct agctgcataa tcttgcctaa taaaggcaca gaattagggc 12540
aaatagctgc agtgacttgt gtacctgctc agtgaaagcc aaagaatcaa tagctagaat 12600
ctgtgtccac aaattgctta caaaccacat gtagatatga cattcaacat caggcaaggc 12660
tgggcacggt ggctcagatc tgtaattcca gcactttggg aggccaaggc aggaggatca 12720
ctagagttca ggagtttgag accagcctgg gcaagatgat gagactcagt ctctacaaaa 12780
atgaaaaaaa aaatagctga gtgtggtggc atacacctgt agtcccacct ccttgggagg 12840
ctgaggtgag aggatcactt gagcccagga gtttgaggtt gcagtgagat atggtcatgc 12900
cactatattc cagcctgtct gcatgtaaaa acaaaaaata cacacacata cacacacacc 12960
ccagcctaac cacttaccac ctcttaatca tctgtataat ggacataaaa atgcctgcta 13020
tactttacat catagtattc ttgagtggag taaatgaaat aatgcatata aggtgctttg 13080
cacaatgtgt gcttgcctca caataaacac tcaatattat tagatatgat ttctaccatt 13140
attactaaca gtagtaagaa tagcagtagt atttaaaagc aagtttgcat tagttttaaa 13200
gcactatgaa atcccaagtc ttttttaaga cggagtctca ctttgttgcc caggctggag 13260
tgcagtggtg cagtctctgc tcactacaat ctccgcctcc cgggttcaag cgattctcct 13320
gcttcagcct cctgagtagc tctgattata ggtacccgcc accacaccca gctaattttt 13380
attttttagt agagacgggg ttttaccatg ttggccagac tggtctcaaa ctgctgacct 13440
caagtgatcc acctgcctcg gcctcccaaa gtgctaggat tacagggatg agccactgca 13500
cccggcctca agttatgatt gttaatattt ttgtgacatt caggataaat attttttagt 13560
atgctactga aggacatgtc tcagcatcgg tgtatccctt cctgaagcta tatgttacct 13620
tgcatttaca gagttgactt ggtgtccaga gaacaaatca gttgagaaaa ggccattttg 13680
aaaacgattt tttccaggga gcatacgcta gtaccctgtt gcggcatcca tgtgtgaggg 13740
ggtggttgga ttatagatct tcaatgtgaa gtcaagtttc ttatcaaatg aagtgttttg 13800
tccgatctta gagtttaaac ccacaaggag gtaacaaagc aaagggctaa tatatctttt 13860
cgctacttag aactacaggc cagaaatttg cttttgtatt ctgagatctt atgatacttg 13920
tctcaatgaa ataaaactgc atgcattatt ctgcatttcc atattactat tctctgtatt 13980
ggtaattatt atgatacttg cttcctgtac ttaaagcagc atgcagattt attttataat 14040
cacttcaagg aaagaaccag ttcctttgga gatttcctgt ggttccaaag ttgcatgcct 14100
ccaagtctgt taggttgtgg gattttgcat ttgagagaaa tgagggaggt ggagagaatg 14160
aagagaaagt ggactggcag aattacagaa tgtggtttca tctgatcttt taggctgagg 14220
gctactccat ttgtagactc catgcataaa actcaggcat cctgggtcct gccctactgc 14280
tgctttgtgg tcagaacatc gtgagatcat gcagcctcaa ggctgggaac atacgggatc 14340
aggtccaaca gcaggttgga gtttgggttc atgatttcaa agtcagggtc gtgagggcac 14400
ccaagatgat taccgagaag tcaaaagcac gtgccagtaa tggcaatgtg aaggtctggg 14460
aaacagccaa aacgtagctg tcaggaatgt gggacagagt ccctagggca gcttttccca 14520
aaacatgttc caagatatac tagctctatg ggatgttgac ttacaataat atgtggtgaa 14580
aaggttttcc agacaaacac tgagttcaga gttaagcagg tttttttcta ttgcagagct 14640
tgtcagagcc tctgatatgc ccactagtat tgtaagtgta caagatgaag ctttaaaatt 14700
gggcaaataa cagatatttc atacagaatc ctggatgtgg ccaggagtga tgggagatga 14760
aggatcctct tgtcagagta gcactccaca gaacacactt ggggaaaagt tgtcccaggg 14820
cctgtggcat gtgctctgaa ttcattttcg cctggctctt aattctgggg ttcggaagga 14880
actggcaaac acccacagaa gttatctagg atcttattga gtgcttcccc ctcgtccttc 14940
catccgaatc acttggctga tatttgttgc tgctattaac agaattcagg aaatcagccc 15000
ttcttagagg aagaaggaca agtgagacca caaacaacaa aacataatga atggatcaga 15060
gcctgtgtat aattggccct gaattaggca aataggcttt ccccactccc ttaaaatgaa 15120
aacaaaatgg tagtttaaag aaagtaccaa agggactata tctaataata acaatgagat 15180
tgaaaatgag ggcacatggt gtgtttaggg acggctgagg ccagtgaatg tcaaggcaga 15240
ctgcatcttt gacagcctcg cctcactggc tcctgaaatc ctcacacaca aaacagcatt 15300
cttcttgtgt tcttaaagtg aaaggcactg tttccctgtc acactagcaa tgttgcgaag 15360
taaatgtcat cctttcctcc tccttggccc tgccttctac agctagtgcc cctgccagtt 15420
gtttcctcag cacgtctcca gcgttcctct tctcttcccc ctcggcacgg ccttacttct 15480
ggtctcatca tcctatgcct gggctgatgc ctttgcttcc cagctgcagt cggctgggga 15540
tgaatgtggg gttaaggcag gcattccaga tatttataga attgttcatg gttcttttcc 15600
cattagccat gagttacttg agggtgaaga tagtgtctta tttgtctctc tgtctctagt 15660
aattagccaa gtacctggca cttttaatta aggagttatc actcagtaca tttaaatagg 15720
gagaaaaaga aaaaaacaaa gaatggaata aagtaaaagc atgataggtt ttgttactct 15780
ttttgcagtt gatcattggc tattcttaat tcttatagac cagttagtac tttagcagca 15840
tacagataag atatattaaa atcatacact gagtttttaa aaagtagatg ggcatgagtg 15900
gtggctcatg cctgtaatcc catcactttg ggagggcgag gcagtaggat cgcttgagcc 15960
caagagttcg agaccagcct gggcaaaata gtgggacccc gtctctacaa aatatttttt 16020
aaaaattagc cgggtgtgat ggtgcacctg ccgtcctagc tgcttgtgag gctgaagtga 16080
gaggatcact tgagcctgta aggtcagagc tgcagtgagc catgacagtg ccactgcact 16140
ccagcctggg cgacagagca agacactgtc tcaaaaaaaa aaaaaaaaaa aaagaaagag 16200
acaaaaagtt cattagcact taaacatgct tttcagaaaa tgactaatta tcaaaaacta 16260
gcaattgtga tactagcaaa tgaagaaacg tcaaatggag aagaaatgaa aaacgttttt 16320
agaatccagg acacacattt acaagaatgt aaaatattgt gaaaataatt tggaggagaa 16380
ttatgattaa attatttgag acttgaatta cctgcagtaa attcagctgc gtatcggttg 16440
ttaggcattt tatcattact aatcctgtta ccatctttgt tgaataagag attcatactt 16500
gatatacaag gtccatacat ttgtaaataa ttcattatta tattagtttg caagagtcat 16560
gattttgcca gaatttatcc aaaatggtct attggtaatc ccagagagta gcagaggcat 16620
tgggcagtga agctaacagg cggtgctaaa gccagcatga gcaagtgctg ggtggtagga 16680
aaatagaact caggcagtag tgagggcaaa taggagcaga cagggcagac ctagaaggag 16740
acagcaagta agaggcttag gaggctggag gagcagagac taaggaacgc tcccctggca 16800
tcatgcagca ttattacata agtgttagta atttcaaata gttataacta ttttagatat 16860
accatgtgct agctactgtt gtagtatgct cactagaatt taatacttga atcctcacag 16920
caacctaggt ggatactatt atgaatccta tgaattttca tttatagatg acaaaattga 16980
agtacaggga aagtaagtca ttcacccagc tgatcatcag taaatggaaa agccatgatt 17040
tgacctcagg aaaatgaggg ttatttgaca gggctgactt gaagaatgtt tagattgctg 17100
tagaactgta tttagtgctt aacgatatat aataactgat acaattggta tccaaacagc 17160
cgaatgtcat gcttttaggg atcaaggaaa gttgcctaag tgtgcatgtg cctagcattt 17220
gagttttgat acggatgatc ataccagaaa aatataccat cagttttcag gcctatctgc 17280
acagtaatat gcgtggagtt cttcatgatg tattcactga tattaaagct caaaactatt 17340
atgaatctta ggctctggcg aaaaaatgtg atcgtttaaa aattcggcat ttatcttatc 17400
ctgtggaatg ggcaacttct caggcccatt tgtcaccacc aacaaagcag taacacgagg 17460
tgttttaata aatctgttgc ccagtctctt ccatattgct atgcttagct gtaaaagaag 17520
ggaccaagaa atgggtgtta agctgaattg gaaacaattt tcagataaag cacagcagtc 17580
tgcgaacctc ctccagctca agatggtgtc aactagaatt gccttttgta agcaggcaga 17640
aagagacaca tgtacttgat tgtggtttct ctttactccc actttccact ctggtcatcc 17700
ctgtagacac agagtaattt gtgtactgta aatagctaga tctttctgta atctttattt 17760
gtttctttgt ttgttttttg agatggagtc tcacactgtc gcccaggctg gagtgcagtg 17820
gctcaatctc ggctcactgc aacctccacc tcctaggttc aagcgattct cctgcttcag 17880
cctcctgagt agctgggatt acaggcgccc gccgccatgc ccgactaatt tttgcatttt 17940
tttttttttt tttttttttt tgtagtagag acaatgtttc accatgttgg ctaggcttct 18000
ctcgaactcc tgacctcagg tgatccgcct gccttggcct ctcaaagtgc tgggattaca 18060
ggcgtgaacc accactctcg gctttaacca acattcttag ttgaacacag cagaaaggga 18120
aacctccatt agtacatgga actcgggcag tagtgagggc aaatatgagg gagagctgcc 18180
ttcctgttgc agtggtaagt tcagtctcta cctaagaaaa cagcatgcca aggtacagca 18240
gagcacactg gccagctcca atgcaagagt catcatggag tgtacctttt ttttttttga 18300
cagagtttcg ctcttgttgc ctaggctgga gtgcaatggc gcgatcttgg ctcaccgcaa 18360
cctccacctc ctgggttcaa gcgattctcc tacctcagcc tcttgagtag ctgggattac 18420
aggcatgcgc caccacgcct ggctaatttt tttttttttt tttttttgta tttttagtag 18480
agacagggtt tctccatgtt ggtcaggctg gtctcaaact ccctacctca ggtgatccac 18540
ccgcctcggc ctcccaaagt gctgggatta caagcatgag ccactgcacc tggccggagt 18600
atgcactttt aacatgtcta tgcagggaca catgtcctct aacaacaaat ggccatcccg 18660
agagtggtgg agcagagtgt tggacctctg gagcccaaat ttttattgta gcaatacaca 18720
gtcttcttat aacaggcact gtggccatgg gtcttatcag ctcctattca aaattggaat 18780
taggacaagt atagcaggtt gtgttctaac agaattctaa cttttaaggt gccacagaca 18840
ataatattct ttagaaatct tagtgttatc ctttttatcc tttcagggta gcaaacaaaa 18900
ggcactcagt aaataattat ggagtataat ttggggaaaa caaaatattt ctagtctgaa 18960
aattattgtt ttaaaaatta tttttgtctt gagaggctgt acatttctgt caactgcgtg 19020
gccacattgt tgatatgctt aagaaagata acagtcaaag ttgccttttt acactttgta 19080
tttgtgctca tccaaccatg agacctttaa aaatattgaa tatctgtagt tatctccctt 19140
caagtcttat tttgagttta tattaccttt gaactcaaaa gatctcaagc catttgcttt 19200
acctgacagt atgacattct ttaattttag gtagcattgt atgatgagtc tcaaatattg 19260
gcagcctata atgcatataa gttagtgatc ctagtaaatg taaataaaat aataaacaga 19320
aacatgctgg gcatggtggc ttatgcctgt aattccgtaa ctttgggagg ctgaggcagg 19380
aggattgctt cacaccagga gttagagacc agcttgggca acagaaaccc caatttttaa 19440
aaaatcagct gaacgtggtg gtgcatgcct gtagtcacag ctactcagga ggctgaggtg 19500
ggaggatcac ttgagctcag attgaggctg cagtgagttg tgagtgcacc tcagtctagg 19560
tggcagagtg aggtcctgtc tcaaaaacat aatgataaat gaaaataata acagaaacat 19620
tcagtcaata actgggattt ttttttactg ttactatttt ttatcaagac aaacatctgg 19680
agagttctac aattccagat gcttaccaat ctgcttctgg gttgtgaaaa aattatttgg 19740
gtatgtatag cttttaactt tttttttgtt tgttttaact gaatattgag gattttggta 19800
gaataacttt gaatgttttg gattttagat ttaaatggaa atatcaaatt ttatataggt 19860
tgggctctag atatttccat attgtcagaa tttagaaaac atcttttatg aaatagaaac 19920
taagaatttt ggcaaacaga gaaagttgcc caaggtctcc agaattcatt tgtttgacaa 19980
atacatattg agcatctacc ctgtgacagg tggtattcct gggatttgtc aggagcacaa 20040
ttgctgcctt cctggagctt acattctaac cagggaaaac tgacaataaa caataaaaaa 20100
agtaagtaaa taatgtagtt tgttagaaag ccataggtgc tacagaaaaa aataaactat 20160
aaagtagggg tcggactagc aataaaacta aatagtgtgg tcagggtagt ccatgtggac 20220
aagatgcaat ttgagccaag atttaaaaaa gataaagcaa ttagcctcaa aataatcggg 20280
gggaagaact ttccagcacc aagtagtttg ctcggcctgt tggaggaata gcaaggagcc 20340
agtgtgcctg gaatggaatg cccaaggggc aatagtggcc ataaggtaaa agtggtaatg 20400
gggctaaggc cagatcctat agagcttaca aactactgca aagaacttga gattttactc 20460
tcagtagaat gtggatccat tggagaattt taagcacagg atctgacttg ggttttaaaa 20520
gggtctctct ggtcctggtt tgacaatatg gactgcactg ggaacaaggg aaggagcagg 20580
ggtcttactg ctgtaattca gttaaaaatt atggtagttt aggctggaat agtagcacca 20640
gagatagtgc tagatggtaa aatctggaaa tattttgaaa gtagagccac caggatttcc 20700
tggtgaatag gatgtagagt atgagagaaa aagaggattt ggggtgtttc caaggtttta 20760
gcctgtgcat aaatggagtt attactattg attcagagaa aaccttaagg cagctacttt 20820
tagataagag ttgggtgatg aggggttcag atatgaatct gttgatagtg agatggctct 20880
tagacatact ggggaagatg ctggtaggca actgcatgtg taaatctgga gacgggtgag 20940
gtctgcagta gagatttaag tgtaggataa tctcaacatg tggaaggcat ggaagtgtgg 21000
gtgcaagtgg gagacgagaa ccaagcacta atccaagtgc acttcaatat ttaattttaa 21060
gagacaaggt cttttttttt tttttttttt cgagatggag tctcgctctg tcacccaggc 21120
tgaagtgcag tggcgccatc tcggctcact gcaagctccg cctcccggtt tcacgccatt 21180
ctcctgcctc agcctcccga gtagctggga ccacaggcgc ccaccaccac gcccggctaa 21240
tttttgtatt tttggtagag acggggtttc accgtgttag ccaggatggt ctcgatctcc 21300
tgacctcatg attcacctgc ctcagcctcc caaagtgcta ggattacagg cgtgagccac 21360
tgcgcccagc cgagacaagg tctttcactc tgttacagct ggagcacagt ggtgcaatca 21420
caggtcactg caatctcaaa ctcctgggct caagtaatct tcccaagtag ctaagactat 21480
aggtgtgcac caccatgccc agctaatttt tttttttact ttttgtagag atagtgtctt 21540
gctgtgttgc cgaagctagt ctcaaactct tatcttaagc agtcctctct ccgtggcgtc 21600
cctaagtgct gggattacag gcatgagcca tcatgcctgg ccaggcactt taattttaaa 21660
gagcctttaa tatggtttct tgccatgtca gagataagaa cagcttaata tttcttgact 21720
tttccttggt taaacaaggg gtatgcttta aaattttttt taattttaat tgtggtaaaa 21780
ggtacttaaa atttgccatc atagccattt ttaaatgtac atttcactgt cattaaatac 21840
attcaccact atcatccaca gaactcttca tcttgcaaaa ctgaattctg cacccactaa 21900
acaataactc ccttttcttc ttcctcccag gtcctcaaaa ccttcattcc attttctgtt 21960
tctatgattt taaagtggaa ttatacagta tttctctttt tgtaactggc ttatttcact 22020
tagcattatg tatgtcctca agattcatcc atgctgtagc atatgataga atttcctgct 22080
gggcgcagtg gctcacacct gtaatcccag cactttggga ggccaaggtg ggtggatcac 22140
ctgaagtcag gagttcgaga ccagcctggc cgacgtggtg aaaccctgtc tctactaaaa 22200
aatacaaaaa ttagctgcac atggtggtgg gcgacacagc ctcccaaagt gttgggatta 22260
caggtgtgag ctgctgcgcc aggcctgctt ctactctttg actattgtga attaatgctg 22320
ctgtgaacat ggatgtacaa atgtaaggga tatgtttttg ttttttgttt ttaagatgga 22380
gtctcactct gtcacctagg ctggtgtgca gtggcacagt cttggctcac tgcaacctcc 22440
gcctcccgga ttcaagcaat tctcccacct cagtctcctg agtagctgag attacaggta 22500
cccaccatca tgaccagcta ctttttgtat ttttagtaga aactgggttt caccatgttt 22560
cccaggctgg tcttgaactc ctgacctcag gtgatctgcc cgcctcaccc tcccaaagtg 22620
ttgggattac aggcctgcgc cacgatgccc agcagggata tgctttttta aaagtctctg 22680
tgatatgtat acttggtgac tttcatagat ttttaaaaat ataagtgata tataaataca 22740
tttttattat aaaagattta aatgatatag ctgttaacag accaaaatat gaaaattctc 22800
attcattctc tcacctcacc tccatctgca attcccaaag ttacatttgg tgtgctatct 22860
tccctctctt tcagtacatt tctatacatt tgtctataac ttattctttt taaaaactga 22920
gatattatac atattctaca gtttaataat gtcttggaga cctctcaatt atttatattt 22980
tggaaatatt cccagtctgc tgcatatgtt ctatagtgtt atatttacct ttacatgtac 23040
agggctatta ctgtagatta gagtcctaga agtgcatgca gttcctaggt ccaaggaact 23100
ttctttaact cttcatcaga ttttcttttt gaagaacctt tgtggcttga taattatgtt 23160
tctagaaaat ttattattca ggtttagaag tttggggagc tgtttgaaat aacactcaaa 23220
taaatttcct ggctatggat ttgttcccca tagcaagaga gttgtaaact atgagtttta 23280
taaccttaat gtcttttttt taaaaaaggc aattgatctc ttaatctagg tgttttagct 23340
agcatatggg agatgtaatc tgcaatctat gggacaaatg ggggagtttt gggagttatg 23400
atagaagact gttgaaaaat gttttataat aatgttttac agtagagaaa cctggtagat 23460
gccacctcat cagccgacca gggttaacat cacatgataa tcatattgct atcatgcagt 23520
gatattaata taataaagtg agatgggtgc attgcctctg tgatattctt accccaaacc 23580
cataaccaca gtctcataat gagaaaataa cagaaaccca atttgaggga cattccacaa 23640
aatacctgac catgttcttc aaaagtgcta tggtgccaaa agtcatgcaa gacaaatcta 23700
agtaattctc acaggttgta gtacactaag gagacagtga aaactaaatg caaataaagt 23760
ggtttttggt tttttaaagt atgtttatcc ttatggacaa tatgctccca taaagatcgt 23820
ctaccctaga aaactgtgtc ttccctctta aatccaagag atgcttgtcc caaagggtgg 23880
accccattga gatctcctgg gctagagacc cagtgcatgg atggatgaga cagtataagc 23940
aagaccgtat aaagctgtga tctgagctca tggacactgt ggtaagaggt caggctcgaa 24000
gaatcagaga actgagtgga ttttgcaatg gatagccaaa gagagggtcc aaacttaaaa 24060
tgcgaaacaa taattcaaga atgatttggt aaaatgtaat ataacagcct ataacagagt 24120
ctagcaaata gtagccaaaa gtcaccctaa ccaatcgtag ggcatatcta ccacacaaaa 24180
gtgtgactta gcgcatgact gtttaaatgc caaaaaagac agataaagga aagttaagcc 24240
atagtggcaa cctctgcagt tggaacgagg gagctatatc agtcaacagt gaggctaatt 24300
gagaatattt gaggttggcg tatgtctagg gattcctata ggagatacaa cccagcaagc 24360
ataggtcagc aacccaaggt cagagtacaa aatgggttaa tactaaaaag tggttaaaaa 24420
gatgaccagt cctcaagagg agatagtatt taaatcggat acctctcctt ccccatgcta 24480
actaacatac tgtaatttgt tatggctgtt tctaaggtaa ctgtttataa ttataaatca 24540
gccctactgg ttcttcttga tattgtaatt tgcaatcaaa gaacctctag agttaatgta 24600
aaacttcttg aatgagagac catctggtta caattttggt ttcaattccc tgttaggcaa 24660
ctgacaccca aataaggact gtttccaaat atgagtaggc taagtcagtc ataaacaaac 24720
aaaaagtttc agtttttgtt gctattatcc aagatgttag cagatgaagt gtttaatgaa 24780
agggtgcttc ttttaggcaa acttctttta ccatgatttg tttaacctat accagtggtc 24840
cgtacatttt tttcctgtaa agggccaaat aattattaat agtattttta gccttgcagc 24900
cacgtatgat ctctatgtat ttgtcattgc ctttttgttt ttttaaacaa atgtttaaaa 24960
atgtaaatgt tctctgtgtc cttcaccatg ttttcatgct ttgtgatagt ggctgaaatt 25020
tagagacttg ttttaataaa caatgttctg aaatgttgat ctaattgcct ctggcaaaag 25080
atgtgtaatc atgactttga tgaacttatt ttaaaaatag atgcacagtt gatctcttat 25140
tgcacgcatt ttggcacatt cgtgggagat attctctgta aacatgacac ttgcgaaacc 25200
taccataccc tgaaagtttg ctgtctagaa attaagtgcc tagttttcat tcaaattaat 25260
atttaggtaa gacatgtttt atttctaaat agactgtcaa acatttttca tattttaatg 25320
tgtaatggtg atgacctttt taaaaagact caacgtaatt tgttttctca tttaacccat 25380
taactgcccc ctttgtgtag tattgttgct gctttctctt ataaattgat gatgtctcag 25440
ggtctcaatt tacaattaca ttagtttctt cctctagttt gtagttgagc tgtggctctg 25500
cactgttggg gcctgtacag ccatccttca ctagaccccg ggaggtggcc tttagtaggc 25560
tcaaaggtgg cctttaagcc attcttagta tcactgtgaa aaagcatcca gattttcccc 25620
ctgaaaggcc aagtggttgc atgatgtgtt gtggatttta gggatatact ttgcctattt 25680
cacatacttt tttccaagaa gatagataag cttacacatg taaaggtttc aactgtattt 25740
cttctgttta taattttatt tattttgaga tggtgtctcg ctctgtcact cattttggag 25800
tgcagcgcaa tggtgtgatc acggctcact gtggcctcaa actcccaggt ttaagccatc 25860
ctcgcacctc ggccttctaa gtagctggga ctacagatgt atgccaccac acccagttaa 25920
tgttttttgt atttttttga agagacagga ttttgccatg gctgcctacc tggtctcaaa 25980
ctcctgggct taagtgatct gcctgcctca gcctcgcaaa gtgttgagat tacgtgagcc 26040
actgcaccca gcctttttat aattttaata ataatctgtc aatctttcat tacttttgcc 26100
ttctaaattc ttgttatatt ttactaaaca atgcttaatc tcgctgataa accattttag 26160
cagaagtatg tctgatgagg accacccctg cctttttttt tcttttctca gagttgcaag 26220
gtctccctct gttgaccagg ctggagtgca gtggtgtgat tatagctcac tgcttcctca 26280
acctcctggg ctcaagagat cctctcacct caacctcccc agtagctggg accacaagcg 26340
cgcaccacca tgcccagcta atttttattt tttttaagta aaggcagggt cttatgttgc 26400
ccaggctggt ctcaaattcc tagcgtcatt taatttctgt tttggtattg gctctgaaag 26460
aactgttgag acaatacttg gaactcttga tattttccaa aatctgtttt accaagataa 26520
attttaagga gagcaacaga aaataaagca gaaatgtggt ttctttgttg ggttttgttt 26580
tttttttttt tttttttttt tttgagatgg agtttcactc ttgttgccca ggctggagtg 26640
caatggtgcg atctcagctc actgcaacct ccccccatcc tgggttcagg tgattctcct 26700
gtctcaccct cctgagtagc taggattaca ggcgcccacc accacatctg gctaattttt 26760
gtatttttag tagagacggg gttttaccat gttggccagg ctggtcttga actcctgacc 26820
tcaggtgatc cacccgcctt ggcctcccag agtgctggga ttacaggcat gagccaccgc 26880
acctggccca aatgtggttt ctaatcaata ttatttaata atgaattgga ttaagaattt 26940
tttgggtttt ttttactcaa tagaaagttg attgggtttt ttaaaaatag cttgttttca 27000
ataattaagg cttaaaaaaa tctctgagtt ctctttgaga tatttggatt ctataaaaaa 27060
tgaaactctt tgtttcttaa ccaaatgata attccttaaa ttgcattctt tgattcaatt 27120
atactgaatt tcctggtaga aattttattt tctctgaagc agagtcagtg gtcttaatat 27180
caccatgtca accagaagag aaggaaatct aatatgcata atagagaaca ctgacacatg 27240
acttctttaa aagtctctga aattcaacat ataacttttt ataccagaaa gtgaacaaac 27300
atttaatcct tcctcttcat ctatgtctca tgatgtattt gtgtgatttt aaagaacatt 27360
ttggagtttt tgagttctat ataaatgtga ccatgttatc tgtataatct tgccatcctt 27420
tctttggaaa acatgggtca ccgttagcgt atgtcatgga tgttgatgtg gagtctgagt 27480
aagctagtgg gcgagagggt gtgtgtgtgg acgtgggcgc atgtgtgtat ttgttagttt 27540
caaatcgagc cattcttcta gagtctttag gtcagctgtc acgttgggct ttcctccttt 27600
gttcttttga gttgctctgt gactagccac agacccaaca ctaaaaagga aggcttttaa 27660
cggattaatt ccgtcctttc cttcgcctac attgtagcag ctgcgttctg ccctttctgt 27720
ggccctgcaa ggagaggagg cctgtgtata acagtcttct gtcaacatcc attataagat 27780
tcctaaagca catggaatga gatagttccc aggaaaactc tttgtcaagg ccagcccatg 27840
tgggaaaagt gtttctatgc ttagtcttgt aactatgact gtttttgttt tatggggtca 27900
ggggaaattt aacttatttt atttttcttt tttattgatc attcttgggt gtttctcgca 27960
gagggggatt tggcagggtc ataggacaat agtggaggga aggtcagcag ataaacaagt 28020
gaacaaaggt ctctggtttt cctaggcaga ggaccctgcg gccttccgca gtgtttgtgt 28080
ccctgggtac ttgagattag ggagtggtga tgattcttaa cgagcatgct gccttcaagc 28140
tctgtttaac aaagcacatc ctgcaccgcc cttaatccat ttaaccctga gtggacacag 28200
cacatgtttc agagagcaca gggttggggg taaaaggtca ccgatcaaca ggatcccaag 28260
gcagaagaat ttttcttagt acagaacaaa atgaaaagtc tcccatgtct acttctttct 28320
acacagacac ggcaaccatc cgacttctca atcttttccc cacctttccc ccctttctat 28380
tccacaaaac cgccattgtc atcccggccc gttctcaatg agctgttggg tacacctccc 28440
agacggggtg gtggccgggc agaggggctt ctcacatccc agtaggggcg gccgggcaga 28500
ggtgcccctc acctcccgga cggggcggct ggccgggcgg ggggctgaca cccccacctc 28560
cctcccggac ggggcggctg gccgggcggg gggctgaccc cccccacctc cctcccggac 28620
gggacggctg gcctggcggg ggctgacccc cacctccctc ccggatgggg tggctgccgg 28680
gcggagacgc tcctcacttc ccagaggggg tggctgccgg gcagaggggc tcctcacttc 28740
tcagacgggg cggttgccag gcggagggtc tcctcacttc tcagacgggg cggccgggca 28800
gagacgctcc tcacctccca gacggggtcg cggccgggca ggggcgctcc tcacatccca 28860
gacggggtgg cggggcagag gtgctcccca catctcagac gatgggcggc cgggcagaga 28920
cgctcctcag ttcctagatg ggatggcggc cgggaagagg cactcctcac ttcctagatg 28980
agatggcggc caggcagaga cactcctcac tttccagact gggcagccag gcagaggggc 29040
tcctcacgtc ccagacgatg ggcagccggg cagagacgct cctcacttcc cagacggggt 29100
ggcggccggg cagaggctgc aatctcggca ctttgggagg ccaaggcagg cggctgggag 29160
gtggaggttg tagcgagccg cgatcacgcc actgcactcc agcctgggca ccattgagca 29220
ctgagtgaac cagactccat ctgcaatccc ggcacctcgg gaggccgagg ctggcggatc 29280
actcgcggtt aggagctgga gaccagccca gccaacccag cgaaaccccg tctccaccaa 29340
aaaagtacga aaaccaatca ggcatggcgg cgcgggcatg taatcgcagg cactcggcag 29400
gctgaggcag gagaatcagg cagggaggtt gcagtgagcc gagatggcag cagtacagtc 29460
cagcttcggc tcggcatcag agggagaccg tggaaagaga gggagaccgt ggaaagggga 29520
gagggagagg gagggggagg gggagggaga gggagtggga gaggggaaat ttaacttata 29580
aggcagtatt gtgatatgcc tccatactta cctgcccttt ctttctgaac tcttgcagg 29639
<210> 204
<211> 8716
<212> DNA
<213> 人类
<220>
<223> TSPAN14
<400> 204
gtgagtagag cgcggagacc tggctggggc gtcgggccct gcccctttct ttgtctgagg 60
ccgacttccc cgagcgttct ccgggggcga gggctgctcc ttaggtccct gtttggcccc 120
tcagcctccc tccccgcctg cccaggagcg gccccgcggg cggcgctggc tttgtctgcc 180
aggattgctc gctagaggtt ggaggcctcc gccgggaccc cgctgagccg aactccggcg 240
ccgcgcggac gagagccgcg gcgggcccgg ggccggcact cctggttcgg tagccctcgc 300
cccatcagcg cgccccggcg agtgcgcgcc cgtgccgggc ggggtgaggg cgacgggagc 360
ctggacggcc gctgctgctc ggggctctgc ttctcgtccc cagcagcgag ctcggggatg 420
ggccaccctt tcggctcagt cacccaccct cggctcccag gagatcgggt ccggggtggg 480
ggtgggcgta ggccggggcg ggccgcccct tcctcctgcc ccgccgtggt tgtgctcagt 540
ctcccacgcc gccgtgggtc ccactctgcc cggcttgggt ttgggacggc cggagtttga 600
gtaggcggtg acccagcttc tccgcgttag tcgtgtgggg ttgtgtttgg gagcaaagcc 660
tgacccctga cctagccgga gttctggtag agtgaggttt gtggctgcgg actgtgcttg 720
tcccgggccg ctgctgcttc tcctccaccc ccaggggtgg ggtgcgggtg ggtaggaagt 780
gcctgtgtga gggtgtgtgg agggactttg gccctgggac cgcaggagca cttgtcttgg 840
ggacttaaag ttgatctccg gcgagaaaca gtccgtgcta gggggagtcg ggggaagtcg 900
tgggcccggg tactggcctg gggctgggcg cagagcggtg gtgagtgcgg cggtgtcaca 960
cactcgttgg ctgtgctggc gctgctatcc gggaggtcag gcggtgctgg gcggctgtgc 1020
agagcattgt attggagcct ctgcaggtgt gctcttggca gtggtctgct ctccagggga 1080
tcttcctccc ttccgagagg gagttgctct tgggctagtg agagagtggc ctgccaaatc 1140
ctcaaaagta gccttcccct tgccccttga ccttgaagtc cagaagcagt tagtgcctgc 1200
tgagtgctcc ggccaccctt ctctatttgt gaagggaaac ctggggacag gccatcggag 1260
cacccctatg tccttgccac atttcagcta gccgagtggt tggtgggggc ggccgtcttt 1320
ccagggatct tcctgggccc tggcaccccc agaatgaagc ccagactcca ccataatggc 1380
cctgtatgcc cttctatccc cttagctgct ggtgtgatca tagcctcaaa ttgctgggct 1440
caagtgatcc tcccacctca gcctcccaaa gcacagggat tacaggtgtg agccaccacg 1500
cgcagtctga tcccactccg atccctaacg ttatagtgac aggccctgga aacccagggc 1560
caccagatgt attttccctt tccttctcat tgtgttgcac cccaacttca gttggagact 1620
ctggatatat ccatccccac atctctgaac tccactgctt gggccaccta atgtcatcct 1680
cagtttagtt aacaaagcat ggttgagatt tctgtggggt gcgaggcatt gttgcaggca 1740
ctattccaag tctggaaagt ccctcaccag ctatgaactt ggtgtggtct tagaacccag 1800
gctggacatg gcataggtgc tcagtagtgt ttattgatct gagcttgatc tcagcgtagc 1860
aggatcattt agggagacgg ggttgtgggg ggggtctgag cccatgggtg cttctgaagg 1920
tttgtggctg ccccaggaag aaagggcatg gagctgcaga atggttggct gcccagggaa 1980
ttgtcccctt caccagctgg gcagctgtgc tagtctctga ggactggtga aggtccttct 2040
catgtaggaa gtggcagtat gaagtgggag aggagatggc tctgccctga aggttgtggc 2100
ggcagtgaag tgaagttccc atggaggccg gggagcagga aagccctggg ttctggaact 2160
atttcctgag gcctcactct atgccaccat gtgctcagga atttgaccca tttaacttca 2220
actgaggtag aattcctttt agcagtgcct gcaaagtggc attgtgccag gcctgggaaa 2280
cctttgctgg cttaaaattt agtgaaggac aagattattt catagtgata ctaatgtgag 2340
tttattgaga cttacaccct agaagtttga cttgtaataa ctcatttaat ccttgaaaac 2400
agctgtgatg gctgggcgtg atggctcatg cctgtaatcc cagcactttg ggaggccgag 2460
gtgggtggat cacctgaggt caggagttca agaccagcct gaccaacacg gtgaaaccct 2520
gtctctacga aaaatacaaa attagctggg cgtggtggca catgcctata atcccagcta 2580
cttgggaggc tgaggcagga gaattgcttc aatctgggag gtggaggttg cagtgagctg 2640
agatcgcgcc gttgcactcc agcctgggca acaagaatga aactccatct caaaaaacaa 2700
aaaacaaaaa gcaaaacaac cgtgatgtca acagctccat tttacagatg aggaaactgt 2760
ggtcccgaga ggtcacagag taacttgctt gaagtctcaa tatgagctgg gttttctcat 2820
ttcttttttt ttgatactga gtctcactct attgcccagg ctggagtgca gtggcgtgat 2880
ctcggctcac tgcaacctcc gcctcctggg ttcaagtgat tcttctcctg cctcagcctc 2940
ccaagtagct tggactacag gtgtgcacca ccacacccag ctaatttttg tatttttagt 3000
agagatgggg tttcaccatg ttggccaggc tggtcttgaa ctcctgacct caagtgatcc 3060
gcccgcctcg gcctcccaaa gtgctgggat tacaggcgtg agccactgtg ccggaccagg 3120
ttttctcatt tctaatttag acaatatgtt cctctcagag gtgattaaaa tggattcata 3180
taccaaacaa gcctggccca cagtggaact aatgaatgtt ttcagtgaag gtgcccttgt 3240
atccctgcct ctgaacacat ctcatctgtc cagcacagcc tgggcacata gcaggtaccc 3300
cggaaccccc gctgattggt gatggagctt ctgtctccct aaggccaggg aatgggaaga 3360
ccagcactac cacatgcaga agattgggga gtcactgctt gtgtctgtct ggacagatca 3420
cggtttgctg tggtaacagc aatccccagg tctcagaggc ttaaagcaac agaggtttat 3480
ttcttgttca cactgcatgt tcatcactta tctgctttat gttgtcctca ctggggggac 3540
ccatagtgat tagtgggaac acccctggtg gcttggacag agggacagag aacatgatga 3600
tccctgtgtc ctgccactga gtcctggtgg cctttaagat gcctatggga aggggattag 3660
gttcctgctg cctgtctctg ccctgccgtg tcagtccttg gatatcttgc atgttccatc 3720
cgctacctgg atgtggcctg taggggcagc cacctttcct agaagcagga gcaggtagcg 3780
atacccaggc aggcctggtc ctccccactt ttgtgggact cggggattga gcttgcaggc 3840
ataggggtgt agaaagcagt ggtagcgagg tgactgaagg tggactccca ctggggatgg 3900
gattgagtgt ggggctagat ccctggtctg tagaagggag taggaaccct gttagttaaa 3960
ttttccccct caggccacgt tagtaggatt ttgaagagtc agccacactg tggctcttga 4020
ttttgtgcct ggtcacctgc ttggtctctg gtgatttccc tcggggccag cagacactgt 4080
tggaggtggt gaggcctcag gttcttctgc ttcatggtta actcactctg cttaggcata 4140
tttccacctt ttccagggcc tccgtttttc tgccagtgga ttgagaggtg gtggtggtct 4200
ccagcagtgg tctcactctt ggcaggctat cagagtaccc agggagctgc gtagaatgaa 4260
gttttgagag tctttggtct aggtgaatgc cagcgtttca gtttgcttat cttccattat 4320
agtagtgtcc tctgtaactg tgaatcaggg aggttattca taatatctcc acatccattt 4380
tctcccttaa ttgcgtatgc ttttgattta gacagggcaa gtagccattt tggtggagcg 4440
caggccctgg caggggggca gtgtccagtg ccgctctcaa ttaaacgtga agatgtgaag 4500
atgaataaca ctgtccagct tgcagagtgg acggtggtga ggcaagcttt caagttgcac 4560
ctactttcta gttgagtgac ctacacaagt ctttgatttt tttttttttt cttcctggaa 4620
aaaaaaagtt gtctactttt ctcatctgta aagtgagaag aatcaagtct gccttttctg 4680
tctcacgggg ttgcagtgaa gcattagtac cctgagaagc aagatccaaa gcccctgagt 4740
taggcctgac actggtgtga gacagctgcc atctctggcg gcactcagca agtgttcacc 4800
agcagctgat tctgggaacc tcacttcctc cgcccttggg cttggtgggg ttgggtaggg 4860
ttgggtgggg ctgtggtttt cttttaggag gcagcaggcc aggcctggag accagagctt 4920
aagtgggcct gggcaggctg gggttgaaac tcttcacccc ttgcggtctg tactgcctcc 4980
caactgagca gccagggaga aggcctagag cctgtgcctt tcagctagat agctggagga 5040
actggctcct ccctccttag gctgtgctgg cctgagctgg gagcctgaga gctggggcag 5100
ttgtctctaa agtggcttct gggattctgg taagaggtga gctcctggtg ctgcctcaga 5160
gtctttgtgt ttcctggcat ttgggagagc tggagttggg ctgtcctgca tgggtaaggt 5220
ttggggaggg actggaacaa ggggctagtg aaccttctct gggtttttcc tgcctgacta 5280
tgcgttgaca gtcccagctg ttgggcctgt gctcctgtac actgcacggc cttgagagga 5340
gttcggagcc ctaacatcca ggagagaggc cccacagcag tggaaggaaa tgggcctctc 5400
ccgaatctct tgtttgtacc ccgaggtctg agtggtgatc ctggggatgc tatgggactc 5460
tcagcagtag gagtgtgtct gtccccagtc tgggtgccca ccagctgtgc tgagggtcct 5520
ctcctgtgtc cctgggccag gcagacaggg tctttttctg gggcttgtta ggggaggtca 5580
gccacagccc cagaccaagt aatttacaca ccctgagtga ggggtgggag cagtgggtcc 5640
aggaagactt agggagctgg tgaaagaaaa acttaattct gacacttgtt aaactggtaa 5700
ggtagactgt atcaggacta ttacgataga tgtaggaatt atcgcaatgg attttgcagt 5760
agaggggaga gagtgggcca actccaaata caacaaagaa aagtgggaac ttatagccaa 5820
ggagcggagt gtgggggctc ctgaaaattt ctaagagggt agggaaattt ttactaaact 5880
tagctaactg aattcttgct gcaggcaggc cagggtgatc aggttttacc tgggagatag 5940
tacaggatga gaaatacgtt cagatatcca gggtgattag atattgaggt tgggggattc 6000
tggttaacag gagttttgct aaaactaggc tcttagagag aatggagtta ggaaccctag 6060
gtcaggacca gatgagtaga gggctcagag gaataaagtt tggtgaggga cagaatctct 6120
gtcagtatcc cgtggttggc agtgtcctgt ccattcttct tgcactggcc tgtccctcag 6180
gagacaggtg tgagtggtcc tgagcttggg ccagtgtaag agtaggggac aggtttctct 6240
ccttgtaggt gtcccttctt gtaagtgtca ctctcttttt ttccagaaac cttggtcctt 6300
ttcagcatct gctggcccct tgtcccttgg ctcccttgct cttggcctgc tggatttccc 6360
ctctgcaccc aggaaatcgc atggacctgg gtccttgttt ccctacagcc caccaatttt 6420
gctgcttttt tctgccccct gaagctgagc tcctgctgca atttgtgttc cctgctctcc 6480
ctgtcctggg caaaccagtc tgacaacttt gtggttctcg ctcccgcctc catcagcctg 6540
gggattgact gtcccatttg tctgagctgg gcagagggag gtgctgtggg ggatctcttc 6600
ctcttgcctg gactgcacac tcctgctgcc ttctagccgg agctcctggg cattttgcct 6660
atgggagctt caccagcttc cttctgtctg aggcctacaa gtccctgcct ccagcctacc 6720
ttgttcctcc tccatgagtg aggctcctcc ttttctctct ggccctcctg tctacttgat 6780
cagactctgc ctctcttgag ggccggctcc ctccagccta ccctgcacag gtgaccctgt 6840
ttggcctgcc tccttttctt gaggctgatc ttgtctcaac agtcagcttt tcaggaacca 6900
ggcccttgct gttgtaagga aaacctgtcg gctgtggatg gggccttccc tccttcctaa 6960
aggctctgta gccagcttcc acccttgcag tggaacagtg gtggtgccag aaccctgctc 7020
tctgcagcca tcctgcctac cacagtcatt gtgttttgta actctagtag cttcttgtga 7080
aatacaagtg atggtataaa cgtggatagg tttttgaggg gggcatgcca aaatcagagt 7140
tggtggtagt ggtgggggat tcattcccaa gggctctggg gtgctaagtg tgtgagcaaa 7200
gaggaacaag tggcatgtgc ccaggatggg gtggggcggg caggtttagt tgagggctcc 7260
tctggtgtag ggtagccctg acgctcccct ccatggcatg actgatgagg tggcaaaggc 7320
aggtgccagg atttggtgtg ttgaagatta gtgcctgggt tgggctctgc tcactcctgc 7380
agaaagacgg ttggagaggg gctggtcttg gtttcacaga ggattgtggg attacaggca 7440
agacctgctg agggcttgca ctgagccacc gagaggagca gaaagagata cgagggcttc 7500
aggtgccagt atggttctca ctgttgtgag atctcatttg tgcctttttt ttttttcctt 7560
cagacagggt ctcactctgt tgcccaggct ggagtgcagt ggccctatca cagctcactg 7620
aggcctccac cttcctggct caagtgatcc tcccgcctca gcctcctgag tagcagggac 7680
cacaggcatg cagcaccaca cccagctaat ttaaagaatt ttttgtagag attggatctt 7740
gctatgttgc ctaggctggt gtcaaactcc tgggcacttg atttgtgctt cttaattcag 7800
gggctactta ttgaacatat ttagcagtct tcagaaagca tcttattctg taaggggaac 7860
caaatatacc cattccccct ctctggcctt ctttccctgt ggtctgggcg gtctttgagc 7920
ttgaggtcat taggaggtgt ttatttctgt ccgccctggt ggcctagggc gtaggaatgg 7980
ggtgggatgg gatgggatgg ggtggggtgg ggtggaggag ttattctaca tagatagagt 8040
tctgtttatg cagcactccc tgccatacac atctctcact caaatggtct ggccagtcct 8100
ggttctaatg gtcattgtgt cattcccctc agcagcagga aaggctggaa tggtttttgt 8160
attgttcctt agggggaaaa atcacttgga ggaagtatat cagtgcttct gagtgcagag 8220
tatttattga cacgtcagtt aaaggaagct tttaaacaac atatatgtat ctctttagtg 8280
aggaataaat ctacaagtgc atctcacagc tccattttgc agcttccatt tcctggaagg 8340
tacatggagt ttagtggtta gggaatgggg ttttgagctg ggattttgga gaaactgttt 8400
ttagcctgtc cttggaattg ggccaggcct agaaatctgt tgaaatagct ttctttagtt 8460
gctgaaactg ggatgtgttc atagcactag gacctcgagc tccactgatg actgagtggg 8520
gagggctcag agaagggtcc ctgtggatgc ccgggatgcc tgggtttcag tcccgtctcc 8580
tgcatcgcct acattgcctg aatcttaggg tcttacagat ttatcatgaa gtgggcttgg 8640
cagcagatgg tctggtttct tttgtgcctt tgtcagaatc tgttcttgct cttcttagga 8700
aaactttcta tttcag 8716
<210> 205
<211> 3812
<212> DNA
<213> 人类
<220>
<223> B2M
<400> 205
gcgtgagtct ctcctaccct cccgctctgg tccttcctct cccgctctgc accctctgtg 60
gccctcgctg tgctctctcg ctccgtgact tcccttctcc aagttctcct tggtggcccg 120
ccgtggggct agtccagggc tggatctcgg ggaagcggcg gggtggcctg ggagtgggga 180
agggggtgcg cacccgggac gcgcgctact tgcccctttc ggcggggagc aggggagacc 240
tttggcctac ggcgacggga gggtcgggac aaagtttagg gcgtcgataa gcgtcagagc 300
gccgaggttg ggggagggtt tctcttccgc tctttcgcgg ggcctctggc tcccccagcg 360
cagctggagt gggggacggg taggctcgtc ccaaaggcgc ggcgctgagg tttgtgaacg 420
cgtggagggg cgcttggggt ctgggggagg cgtcgcccgg gtaagcctgt ctgctgcggc 480
tctgcttccc ttagactgga gagctgtgga cttcgtctag gcgcccgcta agttcgcatg 540
tcctagcacc tctgggtcta tgtggggcca caccgtgggg aggaaacagc acgcgacgtt 600
tgtagaatgc ttggctgtga tacaaagcgg tttcgaataa ttaacttatt tgttcccatc 660
acatgtcact tttaaaaaat tataagaact acccgttatt gacatctttc tgtgtgccaa 720
ggactttatg tgctttgcgt catttaattt tgaaaacagt tatcttccgc catagataac 780
tactatggtt atcttctgcc tctcacagat gaagaaacta aggcaccgag attttaagaa 840
acttaattac acaggggata aatggcagca atcgagattg aagtcaagcc taaccagggc 900
ttttgcggga gcgcatgcct tttggctgta attcgtgcat ttttttttaa gaaaaacgcc 960
tgccttctgc gtgagattct ccagagcaaa ctgggcggca tgggccctgt ggtcttttcg 1020
tacagagggc ttcctctttg gctctttgcc tggttgtttc caagatgtac tgtgcctctt 1080
actttcggtt ttgaaaacat gagggggttg ggcgtggtag cttacgcctg taatcccagc 1140
acttagggag gccgaggcgg gaggatggct tgaggtccgt agttgagacc agcctggcca 1200
acatggtgaa gcctggtctc tacaaaaaat aataacaaaa attagccggg tgtggtggct 1260
cgtgcctgtg gtcccagctg ctccggtggc tgaggcggga ggatctcttg agcttaggct 1320
tttgagctat catggcgcca gtgcactcca gcgtgggcaa cagagcgaga ccctgtctct 1380
caaaaaagaa aaaaaaaaaa aaagaaagag aaaagaaaag aaagaaagaa gtgaaggttt 1440
gtcagtcagg ggagctgtaa aaccattaat aaagataatc caagatggtt accaagactg 1500
ttgaggacgc cagagatctt gagcactttc taagtacctg gcaatacact aagcgcgctc 1560
accttttcct ctggcaaaac atgatcgaaa gcagaatgtt ttgatcatga gaaaattgca 1620
tttaatttga atacaattta tttacaacat aaaggataat gtatatatca ccaccattac 1680
tggtatttgc tggttatgtt agatgtcatt ttaaaaaata acaatctgat atttaaaaaa 1740
aaatcttatt ttgaaaattt ccaaagtaat acatgccatg catagaccat ttctggaaga 1800
taccacaaga aacatgtaat gatgattgcc tctgaaggtc tattttcctc ctctgacctg 1860
tgtgtgggtt ttgtttttgt tttactgtgg gcataaatta atttttcagt taagttttgg 1920
aagcttaaat aactctccaa aagtcataaa gccagtaact ggttgagccc aaattcaaac 1980
ccagcctgtc tgatacttgt cctcttctta gaaaagatta cagtgatgct ctcacaaaat 2040
cttgccgcct tccctcaaac agagagttcc aggcaggatg aatctgtgct ctgatccctg 2100
aggcatttaa tatgttctta ttattagaag ctcagatgca aagagctctc ttagctttta 2160
atgttatgaa aaaaatcagg tcttcattag attccccaat ccacctcttg atggggctag 2220
tagcctttcc ttaatgatag ggtgtttcta gagagatata tctggtcaag gtggcctggt 2280
actcctcctt ctccccacag cctcccagac aaggaggagt agctgccttt tagtgatcat 2340
gtaccctgaa tataagtgta tttaaaagaa ttttatacac atatatttag tgtcaatctg 2400
tatatttagt agcactaaca cttctcttca ttttcaatga aaaatataga gtttataata 2460
ttttcttccc acttccccat ggatggtcta gtcatgcctc tcattttgga aagtactgtt 2520
tctgaaacat taggcaatat attcccaacc tggctagttt acagcaatca cctgtggatg 2580
ctaattaaaa cgcaaatccc actgtcacat gcattactcc atttgatcat aatggaaagt 2640
atgttctgtc ccatttgcca tagtcctcac ctatccctgt tgtattttat cgggtccaac 2700
tcaaccattt aaggtatttg ccagctcttg tatgcattta ggttttgttt ctttgttttt 2760
tagctcatga aattaggtac aaagtcagag aggggtctgg catataaaac ctcagcagaa 2820
ataaagaggt tttgttgttt ggtaagaaca taccttgggt tggttgggca cggtggctcg 2880
tgcctgtaat cccaacactt tgggaggcca aggcaggctg atcacttgaa gttgggagtt 2940
caagaccagc ctggccaaca tggtgaaatc ccgtctctac tgaaaataca aaaattaacc 3000
aggcatggtg gtgtgtgcct gtagtcccag gaatcacttg aacccaggag gcggaggttg 3060
cagtgagctg agatctcacc actgcacact gcactccagc ctgggcaatg gaatgagatt 3120
ccatcccaaa aaataaaaaa ataaaaaaat aaagaacata ccttgggttg atccacttag 3180
gaacctcaga taataacatc tgccacgtat agagcaattg ctatgtccca ggcactctac 3240
tagacacttc atacagttta gaaaatcaga tgggtgtaga tcaaggcagg agcaggaacc 3300
aaaaagaaag gcataaacat aagaaaaaaa atggaagggg tggaaacaga gtacaataac 3360
atgagtaatt tgatgggggc tattatgaac tgagaaatga actttgaaaa gtatcttggg 3420
gccaaatcat gtagactctt gagtgatgtg ttaaggaatg ctatgagtgc tgagagggca 3480
tcagaagtcc ttgagagcct ccagagaaag gctcttaaaa atgcagcgca atctccagtg 3540
acagaagata ctgctagaaa tctgctagaa aaaaaacaaa aaaggcatgt atagaggaat 3600
tatgagggaa agataccaag tcacggttta ttcttcaaaa tggaggtggc ttgttgggaa 3660
ggtggaagct catttggcca gagtggaaat ggaattggga gaaatcgatg accaaatgta 3720
aacacttggt gcctgatata gcttgacacc aagttagccc caagtgaaat accctggcaa 3780
tattaatgtg tcttttcccg atattcctca gg 3812
<210> 206
<211> 23
<212> DNA
<213> 人工的
<220>
<223> SS 3'白蛋白
<400> 206
attggcgatt ttctttttag ggc 23
<210> 207
<211> 20
<212> DNA
<213> 人工的
<220>
<223> SS 3'共有
<400> 207
tttttttttt tttttttcag 20
<210> 208
<211> 7
<212> DNA
<213> 人工的
<220>
<223> SS 5 白蛋白
<400> 208
ggtaggt 7
<210> 209
<211> 888
<212> DNA
<213> 人工的
<220>
<223> anHAL_S100A9
<400> 209
ctgacccagc ctcaccgcag tttgggttga caagggagga tgggagtatg ggctacagca 60
atcaagggga agatttgagc tcctggagcc cagccccaag acgcagcgag tgtcctgtta 120
tacagggcag gtgctcacag ttacacagga cgacagggtc aagaaattgc tcaattgaac 180
acctgctatt tgtcgggccc tgttctgggc agagggatgt agtggtaaat ggggagccca 240
ctattccagt ggagggagac acacagtaaa gttgttggcc aataaagagc acagataaag 300
ccaaatgcca ataagtgcct ggaagaaaat gagatagagt gcgctgtggg caatggggct 360
gggtggggtg gaggtgacca gttagggtac atgagaaggg cctctttgag gaggtaacat 420
ttgagctgag ccccgaatgt tggggaggga agcccctgag gatgacactt ggcacaaagc 480
tgaggagacc ctaagcctca ggcgggaact tggggtggaa gacttggggg cttttctaat 540
cctaagggtc tgcggtggaa aatgaatgca taaagagcac atggagagca cctgcacagc 600
actcagggaa ctgggaggtt tttcccccgc tccaaaaatg attaggcagt tctaagaaaa 660
aggctgagca cttccaacag cctttttgtt ttcttttcaa atttggggaa agtcgggaaa 720
cagaggcctg cattaagaag ggtggaacac atgggtctca gtctcagttc cagtcccgga 780
gccagacatc ctggggtagg tccccagccc tcccagtgcc cctccctccg ccttggtaag 840
gtggagaatt gcagccttca gagttagggg ccctgacagc tctccata 888
<210> 210
<211> 149
<212> DNA
<213> 人工的
<220>
<223> 重写的S100A9 ex1
<400> 210
atgacttgca aaatgtcgca gctggaacgc aacatagaga ccatcatcaa caccttccac 60
caatactctg tgaagctggg gcacccagac accctgaacc agggggaatt caaagagctg 120
gtgcgaaaag atctgcaaaa ttttctcaa 149
<210> 211
<211> 340
<212> DNA
<213> 人工的
<220>
<223> anHAR_S100A9
<400> 211
ggtggaggcc tcaggcaggc aggatgctgg gtggggtagg caagaaaggg cccagcagag 60
aggccgcatg gcaaaactat cctccatgtg accccctatg cccgcttcac cccccacctg 120
acatccccca ccagaagcaa agcgatgctg tgggaaagga agcagagcct catggatggg 180
ctgcacagga gagtgctcgc attggctggg taccccacag gttctgggag gggacttagc 240
gaggtgactc agccagaggg tggcagagct ggaaccaacc agtgctctct tggaccccgc 300
ctgggtctgg gtcttccacc tcccctgatg tctctccttt 340
<210> 212
<211> 895
<212> DNA
<213> 人工的
<220>
<223> anHAL_CD11b
<400> 212
aacttttggg tctgtcataa atagagggcc cagaatatgt aggagtcagt ctggggagag 60
gcaaagggga tttggggaag gagaaagggt tcaagaagaa gcagggagaa cagctagacc 120
cagacaggct ggccagggaa gcctggatga atgaccacat tcatggactg tgcaaggctg 180
cttgccggtc cccttgcttc acacatgagg agacggaggc ccagggagga gaagtgacat 240
ggctcagggt gcgcagcagg tgtgagaccc ctttcctgag tgcttcctcc tggatcccct 300
ctcaccatct ccactttgcc tccggttcta ttttccaagg tcccgggtgc aaatgtttgt 360
tgaatgactg atgaatgaaa atgatttgag tttgttacct tttatgctta tatgttgtgg 420
aaaatgaaat tctcctcaaa agggaaggaa atacttgaga gctgcatagg aaggaaatta 480
tctaattaag aatgtataga aacttcactg ttgggcaaat catcgttgtg acaccggggg 540
aagaagccat ttaggtgctc agaagggagg ctggaattca gagcaggact ggacgtgccc 600
cacgacggtg gttcttaggt caggagtcag caaacagtgg cctgggggcc cgatatggcc 660
cacgacctgt ttttgcacaa cctgccagct agagattgaa gatgaacact gataatcgat 720
ttgatgatag ggagcaccac ccccaaagaa ttctatttgt ctcatttgta aacccgtatt 780
acaaacaaat tgtactcaat cattatgttt gaaatttccc taatgacaaa tttgtggaaa 840
agtattttct gtcttgttat ataagtactt gtacaacata ttctatcagc ctctt 895
<210> 213
<211> 28
<212> DNA
<213> 人工的
<220>
<223> 重写的CD11b ex1
<400> 213
atggctctca gagtccttct gttaacag 28
<210> 214
<211> 430
<212> DNA
<213> 人工的
<220>
<223> anHAR_CD11b
<400> 214
ggtctgcaaa acctaaaatt tactatctgg ctgtttacag aataagtgtg ctaatccccg 60
ccccaggcta acagagctgg acctgggagg cagacatctg gatgctgggt tagttagggt 120
gaccgaatgg atgggaaagg gaatggagca ggaagacatg ctgctatctt tttttttttt 180
tttttttttt gatacagggt ctttctctgt tgcccaggct gtagtgcagt ggcatgatca 240
tggttcactg cagccttgac ctcctgggtt caagcaatcc tcccacctca gcctcctgag 300
taccactaca cccggctaat tttttatttt ttgtagagat ggggtctcac tgtgttgcct 360
aggctggtct taaactcctg agcccaggtg atcctcccac gtcagcctct taaattattg 420
ggataacagg 430
<210> 215
<211> 3
<212> PRT
<213> 人工的
<220>
<223> GSG接头
<400> 215
Gly Ser Gly
1
<210> 216
<211> 19
<212> PRT
<213> 人工的
<220>
<223> aaP2A
<400> 216
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 217
<211> 18
<212> PRT
<213> 人工的
<220>
<223> aaT2A
<400> 217
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 218
<211> 239
<212> PRT
<213> 人工的
<220>
<223> aaEGFP
<400> 218
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 219
<211> 925
<212> PRT
<213> 人工的
<220>
<223> TALEN CD11b左
<400> 219
Met Gly Asp Pro Lys Lys Lys Arg Lys Val Ile Asp Ile Ala Asp Leu
1 5 10 15
Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys
20 25 30
Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly
35 40 45
Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu
50 55 60
Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu
65 70 75 80
Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala
85 90 95
Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro
100 105 110
Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly
115 120 125
Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr
130 135 140
Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
145 150 155 160
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro
165 170 175
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
180 185 190
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
195 200 205
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
210 215 220
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
225 230 235 240
Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
245 250 255
Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr
260 265 270
Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
275 280 285
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
290 295 300
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
305 310 315 320
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
325 330 335
Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His
340 345 350
Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
355 360 365
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
370 375 380
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile
385 390 395 400
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu
405 410 415
Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser
420 425 430
Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
435 440 445
Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile
450 455 460
Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
465 470 475 480
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
485 490 495
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
500 505 510
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln
515 520 525
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
530 535 540
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
545 550 555 560
Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
565 570 575
Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
580 585 590
Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
595 600 605
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
610 615 620
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
625 630 635 640
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
645 650 655
Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly
660 665 670
Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro
675 680 685
Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala
690 695 700
Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Gly
705 710 715 720
Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
725 730 735
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
740 745 750
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
755 760 765
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
770 775 780
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
785 790 795 800
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
805 810 815
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
820 825 830
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
835 840 845
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
850 855 860
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His
865 870 875 880
Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile
885 890 895
Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg
900 905 910
Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ala Ala Asp
915 920 925
<210> 220
<211> 925
<212> PRT
<213> 人工的
<220>
<223> TALEN CD11b右
<400> 220
Met Gly Asp Pro Lys Lys Lys Arg Lys Val Ile Asp Ile Ala Asp Leu
1 5 10 15
Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys
20 25 30
Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly
35 40 45
Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu
50 55 60
Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu
65 70 75 80
Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala
85 90 95
Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro
100 105 110
Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly
115 120 125
Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr
130 135 140
Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
145 150 155 160
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro
165 170 175
Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile
180 185 190
Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
195 200 205
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val
210 215 220
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
225 230 235 240
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
245 250 255
Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr
260 265 270
Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
275 280 285
Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
290 295 300
Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
305 310 315 320
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
325 330 335
Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His
340 345 350
Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
355 360 365
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
370 375 380
Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly
385 390 395 400
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
405 410 415
Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser
420 425 430
Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
435 440 445
Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile
450 455 460
Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
465 470 475 480
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
485 490 495
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
500 505 510
Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln
515 520 525
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
530 535 540
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
545 550 555 560
Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
565 570 575
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
580 585 590
Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
595 600 605
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
610 615 620
Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
625 630 635 640
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
645 650 655
Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly
660 665 670
Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro
675 680 685
Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala
690 695 700
Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Gly
705 710 715 720
Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
725 730 735
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
740 745 750
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
755 760 765
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
770 775 780
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
785 790 795 800
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
805 810 815
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
820 825 830
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
835 840 845
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
850 855 860
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His
865 870 875 880
Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile
885 890 895
Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg
900 905 910
Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ala Ala Asp
915 920 925
<210> 221
<211> 925
<212> PRT
<213> 人工的
<220>
<223> TALEN S100A9左
<400> 221
Met Gly Asp Pro Lys Lys Lys Arg Lys Val Ile Asp Ile Ala Asp Leu
1 5 10 15
Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys
20 25 30
Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly
35 40 45
Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu
50 55 60
Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu
65 70 75 80
Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala
85 90 95
Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro
100 105 110
Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly
115 120 125
Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr
130 135 140
Gly Ala Pro Leu Asn Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser
145 150 155 160
Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
165 170 175
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
180 185 190
Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu
195 200 205
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val
210 215 220
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
225 230 235 240
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln
245 250 255
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
260 265 270
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
275 280 285
Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
290 295 300
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
305 310 315 320
Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
325 330 335
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
340 345 350
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
355 360 365
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
370 375 380
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp
385 390 395 400
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
405 410 415
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
420 425 430
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
435 440 445
Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile
450 455 460
Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
465 470 475 480
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val
485 490 495
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
500 505 510
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
515 520 525
Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr
530 535 540
Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
545 550 555 560
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
565 570 575
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
580 585 590
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
595 600 605
Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His
610 615 620
Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly
625 630 635 640
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
645 650 655
Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly
660 665 670
Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro
675 680 685
Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala
690 695 700
Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Gly
705 710 715 720
Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
725 730 735
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
740 745 750
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
755 760 765
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
770 775 780
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
785 790 795 800
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
805 810 815
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
820 825 830
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
835 840 845
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
850 855 860
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His
865 870 875 880
Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile
885 890 895
Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg
900 905 910
Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ala Ala Asp
915 920 925
<210> 222
<211> 925
<212> PRT
<213> 人工的
<220>
<223> TALEN S100A9右
<400> 222
Met Gly Asp Pro Lys Lys Lys Arg Lys Val Ile Asp Ile Ala Asp Leu
1 5 10 15
Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys
20 25 30
Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly
35 40 45
Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu
50 55 60
Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu
65 70 75 80
Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala
85 90 95
Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro
100 105 110
Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly
115 120 125
Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr
130 135 140
Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
145 150 155 160
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
165 170 175
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
180 185 190
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
195 200 205
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val
210 215 220
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
225 230 235 240
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln
245 250 255
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
260 265 270
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
275 280 285
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
290 295 300
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
305 310 315 320
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
325 330 335
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
340 345 350
Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
355 360 365
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
370 375 380
Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn
385 390 395 400
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
405 410 415
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
420 425 430
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
435 440 445
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
450 455 460
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
465 470 475 480
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val
485 490 495
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
500 505 510
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln
515 520 525
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
530 535 540
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
545 550 555 560
Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
565 570 575
Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
580 585 590
Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
595 600 605
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
610 615 620
Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly
625 630 635 640
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
645 650 655
Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly
660 665 670
Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro
675 680 685
Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala
690 695 700
Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Gly
705 710 715 720
Asp Pro Ile Ser Arg Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
725 730 735
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
740 745 750
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
755 760 765
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
770 775 780
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
785 790 795 800
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
805 810 815
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
820 825 830
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
835 840 845
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
850 855 860
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His
865 870 875 880
Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile
885 890 895
Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg
900 905 910
Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ala Ala Asp
915 920 925
<210> 223
<211> 717
<212> DNA
<213> 人工的
<220>
<223> 多核苷酸EGFP
<400> 223
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaag 717
<210> 224
<211> 57
<212> DNA
<213> 人工的
<220>
<223> 多核苷酸P2A
<400> 224
gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacct 57
<210> 225
<211> 54
<212> DNA
<213> 人工的
<220>
<223> 多核苷酸T2A
<400> 225
gagggcagag gcagcctgct gacctgcggc gacgtcgagg agaaccccgg gccc 54
<210> 226
<211> 9
<212> DNA
<213> 人工的
<220>
<223> GSG多核苷酸接头
<400> 226
ggaagcgga

Claims (35)

1.一种用于在***位点处将外源性编码序列整合到内源性内含子基因组区域中的方法,包括下列步骤:
-提供包括内源性内含子基因组区域的细胞,
-向所述细胞中引入包括外源性编码序列的多核苷酸模板,其中所述多核苷酸模板包括:
a)第一同源多核苷酸序列,其与所述***位点上游的内含子序列同源,
b)第一强剪接位点序列,包括分支点和剪接受体;
c)编码2A自切割肽的第一序列;
d)编码目的蛋白质的外源序列;
e)编码2A自切割肽的第二序列;
f)第一外显子的编码序列的拷贝;
g)包括剪接供体的第二强剪接位点序列;和
h)第二同源多核苷酸序列,其与所述***位点下游的内含子序列同源;
-诱导所述外源性多核苷酸至所述内含子序列中的整合,优选地通过同源重组,以使所述外源性编码序列在所述内源性基因座处与所述第一外显子或它的拷贝一起转录。
2.根据权利要求1所述的方法,其中所述整合形成人工外显子(Artex)并且被引入到造血干细胞(HSC)中,以获得所述外源性编码序列到至少一种造血细胞谱系中的表达。
3.根据权利要求1至2中任一项所述的方法,其中所述外源性编码序列编码用于治疗基因疾病的目的蛋白质。
4.根据权利要求1至3中任一项所述的方法,其中所述外源性编码序列用于在祖细胞中表达。
5.根据权利要求4所述的方法,其中所述外源性编码序列表达从FANCA、FANCC或FANCG中选择的蛋白质。
6.根据权利要求1至5中任一项所述的方法,其中所述外源性编码序列使所述目的蛋白质在红细胞中表达。
7.根据权利要求6所述的方法,其中所述外源性编码序列表达选自HBB、PKLR或RPS19中的蛋白质。
8.根据权利要求1至3中任一项所述的方法,其中所述外源性编码序列用于在粒细胞中表达。
9.根据权利要求9所述的方法,其中所述外源性编码序列表达选自HAX1、CYBA、CYBB、NCF1、NCF2或NCF4中的蛋白质。
10.根据权利要求1至4中任一项所述的方法,其中所述外源性编码序列用于在巨核细胞中表达。
11.根据权利要求11所述的方法,其中所述外源性编码序列表达选自因子8、因子9、因子11或WAS中的蛋白质。
12.根据权利要求1至4中任一项所述的方法,其中所述外源性编码序列用于在单核细胞中表达。
13.根据权利要求13所述的方法,其中所述外源性编码序列表达选自IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5中的蛋白质。
14.根据权利要求1至4中任一项所述的方法,其中所述外源性编码序列用于在B细胞中表达。
15.根据权利要求15所述的方法,其中所述外源性编码序列表达选自ADA、IL2RG、WAS或BTK中的蛋白质。
16.根据权利要求1至4中任一项所述的方法,其中所述外源性编码序列用于在T细胞中表达。
17.根据权利要求5所述的方法,其中所述外源性编码序列表达选自ADA、IL2RG、WAS、BTK或CCR5中的蛋白质。
18.根据权利要求1至18中任一项所述的方法,其中所述外源性序列的所述表达还允许所述内源性基因座的表达,尤其是所述***位点下游的内含子序列。
19.根据权利要求1至19中任一项所述的方法,其中所述外源性编码序列的表达产生允许交叉纠正内源性缺陷蛋白的目的蛋白质。
20.根据权利要求1至20中任一项所述的方法,其中所述方法离体进行以生产工程化的治疗性细胞。
21.一种***载体,例如AAV载体,其特征在于所述载体包括用于在内源性基因座处***的外源性多核苷酸序列,所述外源性多核苷酸序列包括下列序列:
a)第一同源多核苷酸序列,其与***位点上游的所述内含子序列同源,
b)第一强剪接位点序列,包括分支点和剪接受体;
c)编码2A自切割肽的第一序列;
d)编码目的蛋白质的外源序列;
e)编码2A自切割肽的第二序列;
f)第一外显子的编码序列的拷贝;
g)包括剪接供体的第二强剪接位点序列;和
h)第二同源多核苷酸序列,其与所述***位点下游的所述内含子序列同源。
22.根据权利要求22所述的***载体,其中所述第一同源序列和第二同源序列与选自以下的内源性基因座同源:tmem119、s100a9、cd11b、b2m、cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、p2ry12、olfml3、p2ry13、hexb、rhob、jun、rab3il1、ccl2、fcrls、scoc、siglech、slc2a5、lrrc3、plxdc2、usp2、ctsf、cttnbp2nl、atp8a2、lgmn、mafb、egr1、bhlhe41、hpgds、ctsd、hspa1a、lag3、csf1r、adamts1、f11r、golm1、nuak1、crybb1、ltc4s、sgce、pla2g15、ccl3l1、abhd12、ang、ophn1、sparc、pros1、p2ry6、lair1、il1a、epb41l2、adora3、rilpl1、pmepa1、ccl13、pde3b、scamp5、ppp1r9a、tjp1、ak1、b4galt4、gtf2h2、trem2、ckb、acp2、pon3、agmo、tnfrsf17、fscn1、st3gal6、adap2、ccl4、entpd1、tmem86a、kctd12、dst、ctsl2、abcc3、pdgfb、pald1、tubgcp5、rapgef5、stab1、lacc1、tmc7、nrip1、kcnd1、tmem206、hps4、dagla、extl3、mlph、arhgap22、cxxc5、p4ha1、cysltr1、fgd2、kcnk13、gbgt1、c18orf1、cadm1、bco2、adrb1、c3ar1、large、leprel1、liph、upk1b、p2rx7、slc46a1、ebf3、ppp1r15a、il10ra、rasgrp3、fos、tppp、slc24a3、havcr2、nav2、apbb2、clstn1、blnk、gnaq、ptprm、frmd4a、cd86、tnfrsf11a、spint1、ppm1l、tgfbr2、cmklr1、tlr6、gas6、hist1h2ab、atf3、acvr1、abi3、lrp12、ttc28、plxna4、adamts16、rgs1、icam1、snx24、ly96、dnajb4和ppfia4。
23.根据权利要求22或23所述的***,其中由所述外源性编码序列编码的所述治疗性蛋白质与IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5(SEQ ID NO:1至SEQ IDNO:35–见表1)具有至少80%多肽序列同一性。
24.一种工程化的细胞,其特征在于所述细胞根据权利要求1至21中任一项所述的一种方法可获得。
25.一种工程化的细胞,其特征在于外源性多核苷酸序列被***到内源性基因座处的内含子中,所述多核苷酸序列包括:
-第一强剪接位点序列,包括分支点和受***点;
-编码2A自切割肽的第一序列;
-编码目的蛋白质如治疗性蛋白质的外源序列;
-编码2A自切割肽的第二序列;
-与所述基因座内源的前一外显子的编码序列的拷贝;
-包括剪接供***点的第二强剪接位点序列。
26.根据权利要求26所述的工程化的细胞,其中所述外源性多核苷酸序列被***在选自以下的内源性基因座处:tmem119、s100a9、cd11b、B2m、Cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfia4。
27.根据权利要求26或27所述的工程化的细胞,其中所述目的蛋白质为IDUA、IDS、ARSA、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA、CDKL5、FANCA、FANCC、FANCG、HBB、PKLR、RPS19、HAX1、CYBA、CYBB、NCF1、NCF2、NCF4、因子8、因子9、因子11、WAS、IL2RG或BTK。
28.根据权利要求28所述的工程化的细胞,其中由所述外源性编码序列编码的所述治疗性蛋白质与IDUA、IDS、ARSB、GUSB、ABCD1、GALC、ARSA、PSAP、GBA、FUCA1、MAN2B1、AGA、ASAH1、HEXA、GAA、SMPD1、LIPA和CDKL5(SEQ ID NO:1至SEQ IDNO:35–见表1)具有至少80%多肽序列同一性。
29.根据权利要求25至29中任一项所述的工程化的细胞,其中所述内含子位于第一编码外显子和第二编码外显子之间。
30.根据权利要求25至30中任一项所述的工程化的细胞,其中所述第一和第二编码2自切割肽不同。
31.根据权利要求25至31中任一项所述的工程化的细胞,其中所述2自切割肽中的至少一种选自SEQ ID NO:216和SEQ ID NO:217。
32.根据权利要求1所述的工程化的细胞,其中所述第一剪接位点包括SEQ ID NO:206或SEQ ID NO:207。
33.根据权利要求1所述的工程化的细胞,其中与所述基因座内源的与所述基因座内源的前一外显子的所述编码序列被重写。
34.根据权利要求1所述的工程化的细胞,其中所述内源性基因选自tmem119、s100a9、cd11b、B2m、Cx3cr1、mertk、cd164、tlr4、tlr7、cd14、fcgr1a、fcgr3a、tbxas1、dok3、abca1、tmem195、mr1、csf3r、fgd4、tspan14、tgfbri、ccr5、gpr34、serpine2、slco2b1、P2ry12、Olfml3、P2ry13、Hexb、Rhob、Jun、Rab3il1、Ccl2、Fcrls、Scoc、Siglech、Slc2a5、Lrrc3、Plxdc2、Usp2、Ctsf、Cttnbp2nl、Atp8a2、Lgmn、Mafb、Egr1、Bhlhe41、Hpgds、Ctsd、Hspa1a、Lag3、Csf1r、Adamts1、F11r、Golm1、Nuak1、Crybb1、Ltc4s、Sgce、Pla2g15、Ccl3l1、Abhd12、Ang、Ophn1、Sparc、Pros1、P2ry6、Lair1、Il1a、Epb41l2、Adora3、Rilpl1、Pmepa1、Ccl13、Pde3b、Scamp5、Ppp1r9a、Tjp1、Ak1、B4galt4、Gtf2h2、Trem2、Ckb、Acp2、Pon3、Agmo、Tnfrsf17、Fscn1、St3gal6、Adap2、Ccl4、Entpd1、Tmem86a、Kctd12、Dst、Ctsl2、Abcc3、Pdgfb、Pald1、Tubgcp5、Rapgef5、Stab1、Lacc1、Tmc7、Nrip1、Kcnd1、Tmem206、Hps4、Dagla、Extl3、Mlph、Arhgap22、Cxxc5、P4ha1、Cysltr1、Fgd2、Kcnk13、Gbgt1、C18orf1、Cadm1、Bco2、Adrb1、C3ar1、Large、Leprel1、Liph、Upk1b、P2rx7、Slc46a1、Ebf3、Ppp1r15a、Il10ra、Rasgrp3、Fos、Tppp、Slc24a3、Havcr2、Nav2、Apbb2、Clstn1、Blnk、Gnaq、Ptprm、Frmd4a、Cd86、Tnfrsf11a、Spint1、Ppm1l、Tgfbr2、Cmklr1、Tlr6、Gas6、Hist1h2ab、Atf3、Acvr1、Abi3、Lrp12、Ttc28、Plxna4、Adamts16、Rgs1、Icam1、Snx24、Ly96、Dnajb4和Ppfi。
35.根据权利要求1所述的工程化的细胞,其中所述内源性基因为S100A9或CD11b。
CN202180042049.1A 2020-05-06 2021-05-06 对细胞进行基因修饰以递送治疗性蛋白质的方法 Pending CN115715203A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063020894P 2020-05-06 2020-05-06
US63/020,894 2020-05-06
PCT/EP2021/062054 WO2021224416A1 (en) 2020-05-06 2021-05-06 Methods to genetically modify cells for delivery of therapeutic proteins

Publications (1)

Publication Number Publication Date
CN115715203A true CN115715203A (zh) 2023-02-24

Family

ID=75801614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180042049.1A Pending CN115715203A (zh) 2020-05-06 2021-05-06 对细胞进行基因修饰以递送治疗性蛋白质的方法

Country Status (7)

Country Link
US (1) US20230279440A1 (zh)
EP (1) EP4146284A1 (zh)
JP (1) JP2023525510A (zh)
CN (1) CN115715203A (zh)
AU (1) AU2021269103A1 (zh)
CA (1) CA3177621A1 (zh)
WO (1) WO2021224416A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117551619A (zh) * 2024-01-10 2024-02-13 广东工业大学 一种具备高破骨细胞分化能力的thp-1细胞、破骨细胞及制备与应用

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2018251150B2 (en) * 2017-04-13 2024-05-09 Albert-Ludwigs-Universität Freiburg New sequence specific reagents targeting CCR5 in primary hematopoietic cells
AU2020289581A1 (en) 2019-06-07 2021-11-18 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized albumin locus
WO2023233003A1 (en) 2022-06-03 2023-12-07 Cellectis Sa Tale base editors for gene and cell therapy

Family Cites Families (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US789538A (en) 1904-11-11 1905-05-09 Colin E Ham Dumb-bell.
US3753357A (en) 1970-12-14 1973-08-21 Ovitron Res Corp Method and apparatus for the preservation of cells and tissues
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4199022A (en) 1978-12-08 1980-04-22 The United States Of America As Represented By The Department Of Energy Method of freezing living cells and tissues with improved subsequent survival
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4559298A (en) 1982-11-23 1985-12-17 American National Red Cross Cryopreservation of biological materials in a non-frozen or vitreous state
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
AU7979491A (en) 1990-05-03 1991-11-27 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5420032A (en) 1991-12-23 1995-05-30 Universitge Laval Homing endonuclease which originates from chlamydomonas eugametos and recognizes and cleaves a 15, 17 or 19 degenerate double stranded nucleotide sequence
US5487994A (en) 1992-04-03 1996-01-30 The Johns Hopkins University Insertion and deletion mutants of FokI restriction endonuclease
US5356802A (en) 1992-04-03 1994-10-18 The Johns Hopkins University Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
US5792632A (en) 1992-05-05 1998-08-11 Institut Pasteur Nucleotide sequence encoding the enzyme I-SceI and the uses thereof
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US6242568B1 (en) 1994-01-18 2001-06-05 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
CA2681922C (en) 1994-01-18 2012-05-15 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
WO1995025809A1 (en) 1994-03-23 1995-09-28 Ohio University Compacted nucleic acids and their delivery to cells
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
ATE407205T1 (de) 1994-08-20 2008-09-15 Gendaq Ltd Verbesserung in bezug auf bindungsproteine bei der erkennung von dna
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
US6010613A (en) 1995-12-08 2000-01-04 Cyto Pulse Sciences, Inc. Method of treating materials with pulsed electrical fields
US5925523A (en) 1996-08-23 1999-07-20 President & Fellows Of Harvard College Intraction trap assay, reagents and uses thereof
GB2338237B (en) 1997-02-18 2001-02-28 Actinova Ltd In vitro peptide or protein expression library
GB9703369D0 (en) 1997-02-18 1997-04-09 Lindqvist Bjorn H Process
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6410248B1 (en) 1998-01-30 2002-06-25 Massachusetts Institute Of Technology General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites
WO1999045132A1 (en) 1998-03-02 1999-09-10 Massachusetts Institute Of Technology Poly zinc finger proteins with improved linkers
US6140815A (en) 1998-06-17 2000-10-31 Dover Instrument Corporation High stability spin stand platform
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US7070934B2 (en) 1999-01-12 2006-07-04 Sangamo Biosciences, Inc. Ligand-controlled regulation of endogenous gene expression
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US7013219B2 (en) 1999-01-12 2006-03-14 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
AU2982900A (en) 1999-02-03 2000-08-25 Children's Medical Center Corporation Gene repair involving the induction of double-stranded dna cleavage at a chromosomal target site
US7030215B2 (en) 1999-03-24 2006-04-18 Sangamo Biosciences, Inc. Position dependent recognition of GNN nucleotide triplets by zinc fingers
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
AU776576B2 (en) 1999-12-06 2004-09-16 Sangamo Biosciences, Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
DE60143192D1 (de) 2000-02-08 2010-11-18 Sangamo Biosciences Inc Zellen zur entdeckung von medikamenten
US20020061512A1 (en) 2000-02-18 2002-05-23 Kim Jin-Soo Zinc finger domains and methods of identifying same
WO2001088197A2 (en) 2000-05-16 2001-11-22 Massachusetts Institute Of Technology Methods and compositions for interaction trap assays
JP2002060786A (ja) 2000-08-23 2002-02-26 Kao Corp 硬質表面用殺菌防汚剤
US7067317B2 (en) 2000-12-07 2006-06-27 Sangamo Biosciences, Inc. Regulation of angiogenesis with zinc finger proteins
GB0108491D0 (en) 2001-04-04 2001-05-23 Gendaq Ltd Engineering zinc fingers
EP1421177A4 (en) 2001-08-20 2006-06-07 Scripps Research Inst ZINC FINGER FASTENING DOMAINS FOR CNN
US7262054B2 (en) 2002-01-22 2007-08-28 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
ATE347593T1 (de) 2002-01-23 2006-12-15 Univ Utah Res Found Zielgerichtete chromosomale mutagenese mit zinkfingernukleasen
WO2003080809A2 (en) 2002-03-21 2003-10-02 Sangamo Biosciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7361635B2 (en) 2002-08-29 2008-04-22 Sangamo Biosciences, Inc. Simultaneous modulation of multiple genes
EP1581610A4 (en) 2002-09-05 2009-05-27 California Inst Of Techn USE OF CHIMERIC NUCLEASES TO STIMULATE GENE TARGETING
JP4966006B2 (ja) 2003-01-28 2012-07-04 セレクティス カスタムメイドメガヌクレアーゼおよびその使用
JP4753119B2 (ja) 2003-03-14 2011-08-24 セレクティス ソシエテ アノニム 大量処理の生体外エレクトロポレーション法
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7972854B2 (en) 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
AU2005232665B2 (en) 2004-04-08 2010-05-13 Sangamo Therapeutics, Inc. Methods and compositions for treating neuropathic and neurodegenerative conditions
EP1737498A2 (en) 2004-04-08 2007-01-03 Sangamo Biosciences Inc. Zinc finger proteins for treatment of neuropathic pain
US20060063231A1 (en) 2004-09-16 2006-03-23 Sangamo Biosciences, Inc. Compositions and methods for protein production
CA2607104A1 (en) 2005-05-05 2006-11-16 The Arizona Board Of Regents On Behalf Of The University Of Arizona Sequence enabled reassembly (seer) - a novel method for visualizing specific dna sequences
CN101273141B (zh) 2005-07-26 2013-03-27 桑格摩生物科学股份有限公司 外源核酸序列的靶向整合和表达
EP2341135A3 (en) 2005-10-18 2011-10-12 Precision Biosciences Rationally-designed meganucleases with altered sequence specificity and DNA-binding affinity
WO2007139898A2 (en) 2006-05-25 2007-12-06 Sangamo Biosciences, Inc. Variant foki cleavage half-domains
EP2094839B1 (en) 2006-12-08 2020-02-05 University of Rochester Expansion of hematopoietic stem cells
EP2188384B1 (en) 2007-09-27 2015-07-15 Sangamo BioSciences, Inc. Rapid in vivo identification of biologically active nucleases
DE102007056956B4 (de) 2007-11-27 2009-10-29 Moosbauer, Peter, Dipl.-Ing.(FH) Schaltung zur Regelung der Stromversorgung eines Verbrauchers und Verfahren zum Betrieb einer Schaltung
JP5573161B2 (ja) 2007-12-05 2014-08-20 日産化学工業株式会社 ヘテロ環化合物による造血幹細胞の増幅方法
JP5663169B2 (ja) 2007-12-06 2015-02-04 日産化学工業株式会社 ヘテロ環化合物による造血幹細胞の増幅方法
CA2734235C (en) 2008-08-22 2019-03-26 Sangamo Biosciences, Inc. Methods and compositions for targeted single-stranded cleavage and targeted integration
PE20100362A1 (es) 2008-10-30 2010-05-27 Irm Llc Derivados de purina que expanden las celulas madre hematopoyeticas
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
JP5737177B2 (ja) 2009-06-04 2015-06-17 日産化学工業株式会社 ヘテロ環化合物及び造血幹細胞の増幅剤
US8586526B2 (en) 2010-05-17 2013-11-19 Sangamo Biosciences, Inc. DNA-binding proteins and uses thereof
CN106834320B (zh) 2009-12-10 2021-05-25 明尼苏达大学董事会 Tal效应子介导的dna修饰
EP4328304A2 (en) 2010-02-08 2024-02-28 Sangamo Therapeutics, Inc. Engineered cleavage half-domains
CN103415615B (zh) 2010-11-24 2015-11-25 高红 扩增造血干细胞
US10648001B2 (en) * 2012-07-11 2020-05-12 Sangamo Therapeutics, Inc. Method of treating mucopolysaccharidosis type I or II
EP2872625B1 (en) * 2012-07-11 2016-11-16 Sangamo BioSciences, Inc. Methods and compositions for the treatment of lysosomal storage diseases
AU2014205662B2 (en) 2013-01-08 2019-09-05 Fred Hutchinson Cancer Research Center Compositions and methods for expansion of embryonic hematopoietic stem cells
US9428748B2 (en) 2013-06-17 2016-08-30 Hong Gao Method of expanding hematopoietic stem cells
AU2018251150B2 (en) 2017-04-13 2024-05-09 Albert-Ludwigs-Universität Freiburg New sequence specific reagents targeting CCR5 in primary hematopoietic cells
US20230201373A1 (en) * 2017-12-15 2023-06-29 Regents Of The University Of Minnesota Crispr-mediated genome editing with vectors

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117551619A (zh) * 2024-01-10 2024-02-13 广东工业大学 一种具备高破骨细胞分化能力的thp-1细胞、破骨细胞及制备与应用
CN117551619B (zh) * 2024-01-10 2024-04-26 广东工业大学 一种具备高破骨细胞分化能力的thp-1细胞、破骨细胞及制备与应用

Also Published As

Publication number Publication date
US20230279440A1 (en) 2023-09-07
JP2023525510A (ja) 2023-06-16
WO2021224416A1 (en) 2021-11-11
CA3177621A1 (en) 2021-11-11
AU2021269103A1 (en) 2022-12-15
EP4146284A1 (en) 2023-03-15

Similar Documents

Publication Publication Date Title
AU2020233603A1 (en) Compositions and methods
CN115715203A (zh) 对细胞进行基因修饰以递送治疗性蛋白质的方法
KR102175230B1 (ko) 헌팅틴 발현의 조절
KR20200097760A (ko) 유전자 편집을 위한 cpf1-관련 방법 및 조성물
CN107250373A (zh) 通过微流体递送实现的基因编辑
TWI834177B (zh) 用於減少tau表現之組合物及方法
KR20180016970A (ko) 타우 안티센스 올리고머와 그 용도
KR102585973B1 (ko) 타우 발현을 조절하기 위한 올리고뉴클레오티드
KR20140084232A (ko) Gccr 발현의 안티센스 조절
KR20240001333A (ko) Hsd17b13 변종 및 이것의 용도
CN115003387A (zh) 用于活化和扩增肿瘤浸润淋巴细胞的方法
KR20220097414A (ko) X-연관 연소 망막층간분리 치료법을 위한 crispr 및 aav 전략
CN111032093A (zh) 控制心肌纤维化和重塑的方法和组合物
CN112384230A (zh) 用于自身免疫障碍的基因编辑
CN115803435A (zh) 用于在细胞基因组中靶向***外源序列的方法
US6399349B1 (en) Human aminopeptidase P gene
CN114026243A (zh) 营养缺陷型选择方法
CN111565731B (zh) 治疗缺血性疾病的方法
TWI232883B (en) Novel enzyme gene and expression product thereof
CN111278468A (zh) 用于脂肪营养不良的自体细胞疗法的人脂肪组织祖细胞
CN110167563A (zh) 用于调节心脏细胞功能的方法、相关核苷酸和化合物
RU2777570C2 (ru) Композиции и способы для снижения экспрессии tau
US20040014193A1 (en) Isolated human kinase proteins, nucleic acid molecules encoding human kinase proteins, and uses thereof
US20030096240A1 (en) Genomic organization of mouse and human sGC
US20020115179A1 (en) Isolated human phosphodiesterase proteins, nucleic acid molecules encoding human phosphodiesterase proteins, and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination