CN111954540A - 工程化靶标特异性核酸酶 - Google Patents

工程化靶标特异性核酸酶 Download PDF

Info

Publication number
CN111954540A
CN111954540A CN201980024453.9A CN201980024453A CN111954540A CN 111954540 A CN111954540 A CN 111954540A CN 201980024453 A CN201980024453 A CN 201980024453A CN 111954540 A CN111954540 A CN 111954540A
Authority
CN
China
Prior art keywords
sequence
zfn
subject
polynucleotide
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980024453.9A
Other languages
English (en)
Inventor
R·德克尔弗
I·克里维加
J·C·米勒
张雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangamo Therapeutics Inc
Original Assignee
Sangamo Therapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangamo Therapeutics Inc filed Critical Sangamo Therapeutics Inc
Publication of CN111954540A publication Critical patent/CN111954540A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/47Hydrolases (3) acting on glycosyl compounds (3.2), e.g. cellulases, lactases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/48Hydrolases (3) acting on peptide bonds (3.4)
    • A61K38/482Serine endopeptidases (3.4.21)
    • A61K38/4846Factor VII (3.4.21.21); Factor IX (3.4.21.22); Factor Xa (3.4.21.6); Factor XI (3.4.21.27); Factor XII (3.4.21.38)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • C12N9/644Coagulation factor IXa (3.4.21.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/06Sulfuric ester hydrolases (3.1.6)
    • C12Y301/06013Iduronate-2-sulfatase (3.1.6.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01076L-Iduronidase (3.2.1.76)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21022Coagulation factor IXa (3.4.21.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14311Parvovirus, e.g. minute virus of mice
    • C12N2750/14341Use of virus, viral particle or viral elements as a vector
    • C12N2750/14343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Virology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hematology (AREA)
  • Diabetes (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本文描述了工程化核酸酶,其包含在切割结构域(例如,FokI或其同源物)和/或DNA结合结构域(锌指蛋白、TALE、单指导RNA)中的突变使得中靶特异性增加。

Description

工程化靶标特异性核酸酶
相关申请的交叉引用
本申请要求以下美国临时申请的权益:2018年2月8日提交的美国临时申请号62/628,016;2018年9月7日提交的美国临时申请号62/728,226;2018年11月12日提交的美国临时申请号62/758,786;2019年1月23日提交的美国临时申请号62/795,937;和2019年2月6日提交的美国临时申请号62/802,092,将所述美国临时申请的披露内容通过引用以其整体特此并入。
根据联邦资助的研究
作出的发明权利声明
不适用。
序列表
本申请含有以ASCII格式电子提交并且通过引用以其整体特此并入的序列表。在2019年2月8日创建的所述ASCII副本命名为8325016940SL.txt并且大小为54,302字节。
技术领域
本公开文本属于多肽和基因组工程化以及同源重组领域。
背景技术
人工核酸酶(诸如工程化锌指核酸酶(ZFN)、转录激活因子样效应子核酸酶(TALEN)、具有工程化crRNA/tracr RNA(‘单指导RNA’)的CRISPR/Cas***(也称为RNA指导的核酸酶)、和/或基于Argonaute***的核酸酶(例如来自嗜热栖热菌(T.thermophilus),称为‘TtAgo’)(Swarts等人(2014)Nature 507(7491):258-261))包含与切割结构域缔合或可操作地连接的DNA结合结构域(核苷酸或多肽),并且已经用于基因组序列的靶向改变。例如,核酸酶已被用于***外源序列、使一个或多个内源基因失活、产生具有改变的基因表达模式的生物体(例如作物)和细胞系。参见例如,美国专利号9,255,250;9,200,266;9,045,763;9,005,973;8,956,828;8,945,868;8,703,489;8,586,526;6,534,261;6,599,692;6,503,717;6,689,558;7,067,317;7,262,054;7,888,121;7,972,854;7,914,796;7,951,925;8,110,379;8,409,861;美国专利公开20030232410;20050208489;20050026157;20050064474;20060063231;20080159996;201000218264;20120017290;20110265198;20130137104;20130122591;20130177983和20130177960和20150056705。例如,核酸酶(例如,锌指核酸酶、TALEN、dCas-Fok融合物)对可以用于切割基因组序列。所述对中的每个成员通常包括与核酸酶的一个或多个切割结构域(或半结构域)连接的工程化(非天然存在的)DNA结合蛋白。当DNA结合蛋白与它们的靶位点结合时,与那些DNA结合蛋白连接的切割结构域被定位成使得可以发生二聚化和随后对基因组的切割。
关于锌指蛋白,ZFP对靶DNA序列的特异性取决于锌指结构域与特定DNA碱基之间的序列特异性接触。此外,锌指结构域还包含氨基酸残基,所述氨基酸残基参与跟DNA骨架的磷酸进行的非特异性离子对相互作用。Elrod-Erickson等人((1996)Structure 4:1171)通过锌指蛋白和它的同源DNA靶标的共结晶证明,存在特定的氨基酸能够通过形成氢键与DNA骨架上的磷酸相互作用。采用熟知的Zif268骨架的锌指蛋白通常具有一个精氨酸作为它们β折叠的第二链的氨基末端残基,这也是第二个不变半胱氨酸的羧基末端的第二个位置。这个位置在每个锌指结构域内可以被称为(-5),因为它是α螺旋开始前的第5个残基。这个位置的精氨酸可以经由与其侧链胍基形成带电荷的氢键而与DNA骨架上的磷酸相互作用。Zif268骨架中的锌指蛋白还经常在位于第一个不变半胱氨酸的氨基末端的第4个残基的位置处具有一个赖氨酸。这个位置在每个锌指内可以被称为(-14),因为它是在锌配位半胱氨酸残基之间具有两个残基的锌指的α螺旋开始前的第14个残基。赖氨酸可以经由与其侧链氨基形成水介导的带电荷的氢键而与DNA骨架上的磷酸相互作用。由于磷酸基团发现于所有DNA骨架上,所以锌指与DNA分子之间的这种类型的相互作用通常被认为是非序列特异性的(J.Miller,Massachusetts Institute of Technology博士论文,2002)。
为了减少脱靶切割事件,已经开发了工程化的专性异二聚体切割半结构域。参见例如,美国专利号7,914,796;8,034,598;8,961,281和8,623,618;美国专利公开号20080131962和20120040398。这些专性异二聚体仅在不同的工程化切割结构域被ZFP定位在适当的靶位点时才二聚化并切割它们的靶标,从而减少和/或消除单体脱靶切割。
为了生产最有效的人工核酸酶,可以探索的另一个领域是在编码人工核酸酶的基因中可能包括的非编码序列中。例如,在mRNA分子中的3’非翻译区(“UTR”)可以在转录后水平上在基因表达调节方面起着重要作用。3’UTR通过mRNA的结构组分与特定的反式作用RNA结合蛋白和非编码RNA之间的精心安排的相互作用来控制mRNA表达(Vislovukh等人(2014)World J Biol Chem 5(1):40-57),并且还包含多聚腺苷酸化序列。常用的3’UTR的例子包括SV40病毒多聚A片段、牛生长激素(BGH)基因的多聚A区域、和兔β球蛋白UTR(Ludwig,Dale(2006)BioProcess International,增刊)。5’UTR在高等真核生物中的长度可以为100-200bp,并且包含高的GC含量(通常>60%)。这些序列可以包括元件(诸如用于核糖体结合的Kozak共有序列和用于帽附接的序列)。高GC含量可以导致复杂的发夹结构(被称为顺式作用调节序列),其可能影响翻译效率并被称为内部核糖体进入位点(IRES)。5’UTR也可以具有结合用于调节表达的基因特异性调节蛋白(例如铁调节蛋白)的序列,并且还可以在其他功能中发挥作用,所述其他功能诸如提供与翻译机器的相互作用(Araujo等人(2012)Compand Funct Genom(2012)doi:10.1155/2012/475731)。常用的5’UTR序列的例子是β球蛋白5’UTR。UTR还可以在转录后水平上在基因调节的空间控制方面起作用,其通常由3’UTR中的顺式作用元件介导(Mignone等人(2002)Genome Biol 3(3):PMCID:PMC139023)。
然而,仍然需要将核酸酶切割***工程化以提供增强的转录/翻译效率并增加核酸酶活性和/或特异性的另外的方法和组合物。
发明内容
本公开文本提供了增加人工核酸酶表达以及增加核酸酶(例如核酸酶对)对其预期靶标的效率(活性)和/或特异性的方法和组合物。因此,本文描述了用于表达人工核酸酶(例如,锌指核酸酶(ZFN)、TALEN、CRISPR/Cas核酸酶)的多核苷酸(例如,DNA表达载体或mRNA),其包含工程化启动子,所述工程化启动子包含在5’和/或3’非翻译序列中的增强所述人工核酸酶表达的元件。任选地,编码核酸酶的多核苷酸还包含编码小肽的序列(包括但不限于聚阳离子肽,诸如肽标签和/或核定位序列),和/或包含在一个或多个DNA结合结构域区域(例如锌指蛋白或TALE的骨架)中的突变和/或在FokI核酸酶切割结构域或切割半结构域中的一个或多个突变。当这些多核苷酸组分被单独使用或以任何组合使用(例如,以任何组合的肽序列,诸如FLAG(例如,3X FLAG)、NLS、WPRE和/或多聚A信号)时,本发明的方法和组合物提供了人工核酸酶表达的令人惊讶和出乎意料的增加,以及在体外或体内的增加的切割和/或靶向整合转基因效率(例如,与没有本文所述的序列/修饰的核酸酶相比,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多倍的切割)和/或增加的靶向特异性(脱靶效应降低)。本公开文本还提供了使用这些组合物靶向切割目的区域中的细胞染色质和/或经由在细胞中的预定目的区域处的靶向整合来整合转基因的方法。
因此,本文描述了编码核酸酶(例如,ZFN、TALEN、CRISPR/Cas核酸酶等)的多核苷酸(mRNA、质粒、病毒载体(诸如AAV)),所述多核苷酸还包含以下元件的任何组合中的至少一种、两种、三种、四种、五种、六种、七种或八种:(i)任选地位于所述核酸酶编码序列的5’处的编码聚阳离子序列(例如,3X FLAG序列)的序列;(ii)任选地位于所述核酸酶编码序列的5’处的5’UTR序列(例如,非洲爪蟾(Xenopus)β球蛋白序列,诸如SEQ ID NO:1所示);(iii)位于所述核酸酶编码序列的3’和/或5’处的WPRE序列;(iv)对编码所述核酸酶结构域的骨架(非DNA结合残基)的序列(例如,ZFN的磷酸骨架残基)的修饰;(v)对所述核酸酶的切割结构域序列(例如,工程化FokI结构域)的修饰;(vi)任选地与编码所述核酸酶的序列可操作地连接的组织特异性启动子和/或增强子(例如,hAAT、ApoE等);(vii)NLS序列(位于所述核酸酶编码序列的5’或3’处);和/或(viii)多聚A序列。在某些实施方案中,所述多核苷酸是mRNA。在其他实施方案中,所述多核苷酸是AAV载体,还任选地包含ITR,例如,如附图和/或表中任一构建体所示的AAV载体。单个多核苷酸可以编码所述核酸酶的一些或全部组分,例如,ZFN对、单指导RNA等。可替代地,单独的多核苷酸(相同或不同类型的)可以编码所述核酸酶的组分,例如,单独的核苷酸各自编码ZFN对或TALEN对的一种ZFN或TALEN。因此,本文提供了编码一种或多种核酸酶(例如ZFN)的一种或多种多核苷酸(例如AAV载体)。本文所述的多核苷酸可以被用于至少一个供体的靶向切割和/或整合的体外、离体和/或体内方法,并且可以将核酸酶活性(切割和/或整合)和/或特异性(与脱靶活性相比的中靶)增加1-50倍(或其间的任何值,包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20倍,等等)。
在一个方面,本发明描述了一种多核苷酸,其包含用于在所需组织中表达人工核酸酶的组织特异性启动子。在一些实施方案中,所述组织特异性启动子是肝特异性启动子。在另外的实施方案中,所述肝特异性启动子是人α1抗胰蛋白酶启动子(hAAT)或转甲状腺素蛋白最小启动子(参见美国专利公开20170119906)。在一些情形中,所述肝特异性启动子包含ApoE增强子序列(Shachter等人(1993)J.Lipid Res 34(10):1699-707)。在一些实施方案中,所述肝特异性启动子包含一个或多个ApoE增强子序列(例如,1个、2个、3个和/或4个;参见Okuyama等人(1996)Hum Gen Ther 7(5):637-45)。在另外的实施方案中,所述启动子与内含子连接。在优选实施方案中,所述内含子是HGG-IGG嵌合内含子,其包含来自人β球蛋白基因的第一内含子的5’供***点以及来自免疫球蛋白基因重链可变区的内含子的分支和3’受***点。本文所述的多核苷酸可以是cDNA构建体(例如在病毒载体(诸如AAV)上携带的)、mRNA、质粒DNA、或用于***基因组中的表达盒的一部分。
因此,在一个方面,本文描述了编码核酸酶的mRNA或AAV载体,所述mRNA或AAV载体包含用于增加转录和翻译效率的元件。在一些实施方案中,所述元件包含非翻译序列,诸如天然或人工的5’和/或3’UTR序列。在一些方面,表达盒中包括5’UTR序列,而在其他方面,使用3’UTR序列。在优选实施方案中,编码人工核酸酶的mRNA或AAV包含5’UTR和3’UTR两者。在一个实施方案中,所述5’UTR是非洲爪蟾β球蛋白UTR(参见Falcone和Andrews(1991)MolCell Bio 11(5):2656-2664;Krieg和Melton(1994)Nuc Acid Res 12(18):7057)。在优选实施方案中,编码所述非洲爪蟾β球蛋白UTR的DNA序列是5’[TG]CTTGTTCTTTTTGCAGAAGCTCAGAATAAACGCTCAACTTTGGCAGAT(SEQ ID NO:1)(其中TG是任选的)。在一些方面,编码所述核酸酶的mRNA或AAV包含3’WPRE序列(参见美国专利公开20160326548)。在另外的实施方案中,所述WPRE元件在‘X’区域中发生突变,以阻止蛋白X的表达(参见美国专利7,419,829)。在一些实施方案中,突变的WPRE序列是截短的WPRE元件。在一些实施方案中,突变的WPRE序列在J02442或J04514土拨鼠肝炎病毒的X区域中发生突变(Galibert等人(1982)J.Virol41(1):51-65;Zanta-Boussif等人(2009)Gene Ther 16(5):605-619)。可以用于本文所述的多核苷酸中的WPRE序列的非限制性例子在下面的实施例中示出。在另外的方面,所述3’UTR包含多聚A信号序列。当这些元件组合使用时,所述多聚A信号可以位于WPRE序列的3’或5’处。在优选实施方案中,多聚A信号序列是牛生长激素信号序列(参见Woychik等人(1984)Proc Natl Acad Sci 81(13):3944-8)。如本文所述的编码核酸酶的多核苷酸(mRNA、AAV载体)还可以包括对所述核酸酶编码序列的修饰,例如对所述核酸酶的ZFP DNA结合结构域的骨架区域的修饰和/或对所述一种或多种核酸酶的切割结构域(或切割半结构域)的修饰。
在另一个方面,本文描述了工程化核酸酶切割半结构域,其与这些突变体所来源的亲本(例如野生型)切割结构域和/或包含这些切割结构域的多核苷酸(mRNA)相比包含一个或多个突变。如本文所述的突变包括但不限于改变所述切割结构域的电荷的突变,例如带正电荷的残基突变为不带正电荷的残基(例如,K和R残基的突变(例如,突变为S);N残基的突变(例如,突变为D)和Q残基的突变(例如,突变为E);突变为基于分子建模预测靠近DNA骨架并显示FokI同源物的变异的残基;和/或其他残基的突变(例如,美国专利号8,623,618以及Guo等人,(2010)J.Mol.Biol.400(1):96-107)。
在某些实施方案中,所述工程化切割半结构域源自FokI或FokI同源物,并且包含在相对于如SEQ ID NO:2所示的野生型全长FokI编号的氨基酸残基416、422、447、448和/或525中的一个或多个中或在FokI同源物中的相应残基中的突变。在其他实施方案中,源自FokI的切割半结构域包含在相对于野生型FokI编号的氨基酸残基414-426、443-450、467-488、501-502和/或521-531中的一个或多个(包括387、393、394、398、400、416、418、422、427、434、439、441、442、444、446、448、472、473、476、478、479、480、481、487、495、497、506、516、523、525、527、529、534、542、559、569、570和/或571中的一个或多个)中或在任何FokI同源物中的相应残基中的突变。所述突变可以包括在与FokI同源的天然限制酶中相应位置发现的残基的突变。在某些实施方案中,所述突变是取代,例如用任何不同的氨基酸取代野生型残基,所述任何不同的氨基酸是例如丙氨酸(A)、半胱氨酸(C)、天冬氨酸(D)、谷氨酸(E)、组氨酸(H)、苯丙氨酸(F)、甘氨酸(G)、天冬酰胺(N)、丝氨酸(S)或苏氨酸(T)。在某些实施方案中,所述FokI核酸酶结构域包含在416、422、447、479和/或525(相对于野生型SEQ IDNO:2编号的)中的一个或多个处的突变。所述核酸酶结构域还可以包含在位置418、432、441、448、476、481、483、486、487、490、496、499、523、527、537、538和559处的一个或多个突变,包括但不限于ELD、KKR、ELE、KKS。参见例如美国专利号8,623,618。在仍另外的实施方案中,所述切割结构域包括在残基(例如,419、420、425、446、447、470、471、472、475、478、480、492、500、502、521、523、526、530、536、540、545、573和/或574)中的一个或多个处的突变。在某些实施方案中,本文所述的变体切割结构域包括参与核酸酶二聚化的残基的突变(二聚化结构域突变),以及一个或多个另外的突变,例如磷酸接触残基的突变:例如二聚化突变体(诸如ELD、KKR、ELE、KKS等)与在所述二聚化结构域之外的氨基酸位置处(例如在可能参与磷酸接触的氨基酸残基中)的一个、两个、三个、四个、五个、六个或更多个突变的组合。在优选实施方案中,在位置416、422、447、448和/或525处的突变包括用不带电荷或带负电荷的氨基酸替代带正电荷的氨基酸。在其他实施方案中,在位置446、472和/或478(以及任选地例如在所述二聚化或催化结构域中的另外的残基)进行突变。在某些实施方案中,所述工程化切割半结构域包含在位置542(例如N542D)和/或478(例如P478S)处的突变。还描述了工程化切割结构域的异二聚体,例如,第一(左)核酸酶包含一个工程化切割结构域(例如N542D)并且第二核酸酶包含不同的工程化切割结构域(例如P478S)。
可以将上述任何工程化切割半结构域例如通过将它们与DNA结合结构域缔合而掺入人工核酸酶(和表达这些人工核酸酶的多核苷酸)中,所述人工核酸酶包括但不限于锌指核酸酶、TALEN、CRISPR/Cas核酸酶等。所述锌指核酸酶的锌指蛋白可以包含非典型锌配位残基(例如CCHC而不是典型C2H2构型,参见美国专利9,234,187)。
在另一个方面,提供了产生人工核酸酶的融合分子,所述融合分子包含DNA结合结构域和如本文所述的工程化FokI或其同源物的切割半结构域。在某些实施方案中,所述融合分子的DNA结合结构域是锌指结合结构域(例如,工程化锌指结合结构域)。在其他实施方案中,所述DNA结合结构域是TALE DNA结合结构域。在仍另外的实施方案中,所述DNA结合结构域包含DNA结合分子(例如指导RNA)和无催化活性的Cas9或Cfp1蛋白(dCas9或dCfp1)。在一些实施方案中,所述工程化融合分子与无催化活性的工程化切割半结构域形成核酸酶复合物,使得所述二聚体核酸酶仅能够切割双链DNA分子的仅一条链,从而形成切口酶(参见美国专利9,200,266)。
本发明的方法和组合物还可以包括在DNA结合结构域内的在识别靶序列核苷酸的残基之外的一个或多个氨基酸的突变(例如,‘ZFP骨架’(在DNA识别螺旋区域之外)或‘TALE骨架’(在RVD之外)的一个或多个突变),所述一个或多个氨基酸可以与DNA骨架上的磷酸非特异性地相互作用。因此,在某些实施方案中,本发明包括ZFP骨架中的对于核苷酸靶标特异性不需要的阳离子氨基酸残基的突变。在一些实施方案中,所述ZFP骨架中的这些突变包含使阳离子氨基酸残基突变为中性或阴离子氨基酸残基。在一些实施方案中,所述ZFP骨架中的这些突变包含使极性氨基酸残基突变为中性或非极性氨基酸残基。在优选实施方案中,突变是在相对于DNA结合螺旋的位置(-5)、(-9)和/或位置(-14)进行。在一些实施方案中,锌指可以包含在(-5)、(-9)和/或(-14)处的一个或多个突变。在另外的实施方案中,多指锌指蛋白中的一个或多个锌指可以包含(-5)、(-9)和/或(-14)中的突变。在一些实施方案中,在(-5)、(-9)和/或(-14)的氨基酸(例如精氨酸(R)或赖氨酸(K))突变为丙氨酸(A)、亮氨酸(L)、Ser(S)、Asp(N)、Glu(E)、Tyr(Y)和/或谷氨酰胺(Q)。参见例如,美国公开号US-2018-0087072。
在另一个方面,提供了编码如本文所述的任何工程化切割半结构域或融合分子(包括人工核酸酶)的多核苷酸。合适的多核苷酸的非限制性例子包括mRNA、cDNA、病毒载体(AAV、Ad、LV)和/或非病毒载体(质粒载体)。
在一些方面,本发明的方法和组合物包括与真核转基因序列融合的编码外源肽序列的序列的用途。在一些实施方案中,外源肽在翻译后与蛋白质序列融合,并且在其他实施方案中,编码所述外源肽的序列在框架中(3’和/或5’)与编码人工核酸酶(例如融合蛋白)的序列连接。所述外源肽可以编码可用于纯化或标记(例如亲和纯化或免疫组织化学)的序列。此类肽的例子是聚组氨酸标签(“His标签”,Hochuli等人(1988),Bio/Technol 6(11):1321-5)或阳离子肽标签,诸如Flag标签(Hopp等人(1988)Bio/Technol 6(10):1204-10;Hernan等人(2000)BioTechniques 28(4),789-793)。这些肽标签序列中的一个或多个(1个、2个、3个、4个、5个或更多个)可以以任何组合使用。在一些实施方案中,编码包含序列N末端DYKDDDK(SEQ ID NO:3)的外源Flag肽的序列在编码人工核酸酶的序列的C末端或N末端被融合到框架中。在优选实施方案中,使用了编码3个FLAG序列(3xFLAG肽)的序列(参见美国专利6,379,903),其中所述氨基酸序列是N末端(M)DYKDHDG-DYKDHDI-DYKDDDDK(SEQID NO:4),其中N末端甲硫氨酸(M)是任选的。与没有所述肽序列的核酸酶相比,包含一个或多个此类肽序列(例如,聚阳离子序列(诸如3X FLAG))可以将核酸酶(切割)活性增加2、3、4、5、6、7、8、9、10、11倍或更多倍。
在一些方面,编码人工核酸酶的mRNA包含核定位肽序列(NLS)。在一些实施方案中,所述NLS包含来自SV40病毒大T基因的序列PKKKRKV(SEQ ID NO:5)(参见Kalderon等人(1984)Nature 311(5981):33-8),而在其他实施方案中,所述NLS包含来自c-myc蛋白的序列PAAKRVKLD(SEQ ID NO:6)(参见Dang和Lee(1988)Mol Cell Biol 8(10):4048-54)。在一些实施方案中,所述NLS包含来自δ型肝炎病毒的序列EGAPPAKRAR(SEQ ID NO:7)(参见Alves等人(2008)Virology 370:12-21)或来自多瘤T蛋白的序列VSRKRPRP(SEQ ID NO:8)(Richardson等人(1986)Cell 44(1):77-85)。在其他实施方案中,所述NLS包含源自核质蛋白羧基尾部的序列KRPAATKKAGQAKKKKLD(SEQ ID NO:9)(参见Dingwall(1988)J CellBiol107:841-849以及Robbins等人(1991)Cell 64(3):615-23),而在一些实施方案中,所述NLS包含序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:10),其首先由Siomi和Dreyfuss描述(Siomi和Dreyfus(1995)J Cell Biol 129(3):551-560)。在另外的实施方案中,所述NLS包含来自HTLV-1中的Rex蛋白的序列PKTRRRPRRSQRKRPPT(SEQ ID NO:11)(Siomi等人(1988)Cell 55(2):197-209)。与没有所述肽序列的核酸酶相比,包含如本文所述的一个或多个NLS序列可以将核酸酶(切割)活性增加2、3、4、5、6、7、8、9、10、11倍或更多倍。
在又另一个方面,还提供了包含如本文所述的任何核酸酶、多肽(例如,融合分子或融合多肽)和/或多核苷酸的细胞。在一个实施方案中,所述细胞包含融合多肽对,即一个融合多肽,其除了包含在氨基酸残基393、394、398、416、421、422、442、444、447、448、473、480、530和/或525中的一个或多个突变以外,还包含ELD或ELE切割半结构域;和另一个融合多肽,其除了包含在残基393、394、398、416、421、422、442、444、446、447、448、472、473、478、480、530和/或525处的一个或多个突变以外,还包含KKK或KKR切割半结构域(参见美国专利8,962,281)。在一些实施方案中,一个融合蛋白包含在FokI的残基542(所述切割结构域的残基159)中的突变(诸如N542D),并且一个融合多肽包含在FokI的残基478(所述切割结构域的残基95)中的突变(诸如P478S)。
在本文所述的这些融合多肽中的任何一种中,所述ZFP配偶体还可以包含在所述锌指DNA结合结构域中的(-5)、(-9)和/或(-14)位置中的突变。在一些实施方案中,在位置-5处的Arg(R)被改变为Tyr(Y)、Asp(N)、Glu(E)、Leu(L)、Gln(Q)或Ala(A)。在其他实施方案中,在位置(-9)处的Arg(R)被Ser(S)、Asp(N)或Glu(E)替代。在另外的实施方案中,在位置(-14)处的Arg(R)被Ser(S)或Gln(Q)替代。在其他实施方案中,所述融合多肽可以包含在锌指DNA结合结构域中的突变,其中在(-5)、(-9)和/或(-14)位置处的氨基酸被改变为以任何组合的任何上文所列氨基酸。
本文还提供了已被本发明的多肽和/或多核苷酸修饰的细胞,包括从包含如本文所述的一种或多种人工核酸酶的细胞起源和/或分化的细胞。在一些实施方案中,所述细胞包含核酸酶介导的转基因***、或核酸酶介导的基因敲除。所述经修饰的细胞和源自所述经修饰的细胞的任何细胞不一定长久地包含本发明的核酸酶,但是由此类核酸酶介导的基因组修饰得以保留。
在又另一个方面,提供了用于靶向切割目的区域中的细胞染色质的方法;导致在细胞中发生同源重组的方法;治疗感染的方法;和/或治疗疾病的方法。这些方法可以在体外、离体或在体内或以其组合实施。所述方法涉及使用如本文所述的一种或多种人工核酸酶切割细胞中预定的目的区域处的细胞染色质。在某些实施方案中,如本文所述的融合多肽对(即融合多肽对,其中一个或两个融合多肽包含如本文所述的工程化切割半结构域)。在某些实施方案中,与没有如本文所述的突变的切割结构域相比,所述中靶位点的靶向切割增加了至少50%至200%(或其间的任何值)或更多,包括50%-60%(或其间的任何值)、60%-70%(或其间的任何值)、70%-80%(或其间的任何值)、80%-90%(或其间的任何值)、90%至200%(或其间的任何值)。类似地,使用如本文所述的方法和组合物,脱靶位点切割减少了1-100倍或更多倍,包括但不限于1-50倍(或其间的任何值)。在某些实施方案中,与当编码本文所述的核酸酶的构建体不包含修饰(增强)时相比,所述核酸酶活性的靶向切割增加了至少50%至200%(或其间的任何值)或更多,包括50%-60%(或其间的任何值)、60%-70%(或其间的任何值)、70%-80%(或其间的任何值)、80%-90%(或其间的任何值)、90%至200%(或其间的任何值)或者增加了1-100倍或更多倍,包括但不限于1-50倍(或其间的任何值)。
本文所述的人工核酸酶(及编码其的多核苷酸)可以用于靶向切割细胞中的目的区域中的细胞染色质和/或在预定的目的区域处的同源重组的方法中。细胞包括培养的细胞;细胞系;生物体中的细胞;在以下情况下已经从生物体移取以进行处理的细胞,在所述情况下所述细胞和/或其后代将在处理之后返回至所述生物体;以及从生物体移取、使用本发明的融合分子进行修饰、然后在治疗方法(细胞疗法)中返回至生物体的细胞。细胞染色质中的目的区域可以是例如基因组序列或其部分。组合物包含融合分子或编码融合分子的多核苷酸,所述融合分子包含DNA结合分子(例如,工程化锌指或TALE结合结构域或工程化CRISPR指导RNA)和如所描述的切割半结构域。
例如,通过将融合分子作为多肽递送至细胞或者通过将编码融合分子的多核苷酸递送至细胞,所述融合分子可以在所述细胞中表达,其中所述多核苷酸(如果是DNA的话)被转录并被翻译以产生所述融合分子。此外,如果所述多核苷酸是编码所述融合分子(或其组分)的mRNA,则在将所述mRNA递送至所述细胞后,所述mRNA被翻译,从而产生所述融合分子。
在本发明的其他方面,提供了用于增加工程化核酸酶特异性的方法和组合物。在一个方面,提供了通过降低脱靶切割活性增加总体中靶切割特异性的方法。在一些实施方案中,将工程化核酸酶复合物的含有组分工程化切割半结构域的配偶体用于接触细胞,其中所述复合物的每个配偶体与其他配偶体是以非一比一的比率给出。在一些实施方案中,所述两个配偶体(半切割结构域)的比率是以1:2、1:3、1:4、1:5、1:6、1:8、1:9、1:10或1:20的比率或其间的任何值给出。在其他实施方案中,所述两个配偶体的比率为大于1:30。在其他实施方案中,将所述两个配偶体以被选择为不同于1:1的比率部署。在一些方面,将每个配偶体作为mRNA递送至细胞,或者在病毒或非病毒载体中递送,其中递送不同量的编码每个配偶体的mRNA或载体。在另外的实施方案中,所述核酸酶复合物的每个配偶体可以被包含在单一的病毒或非病毒载体上,但是被刻意表达使得一个配偶体以比另一个配偶体更高或更低的值表达,最终向所述细胞递送非一比一比率的切割半结构域。在一些实施方案中,使用具有不同表达效率的不同启动子表达每个切割半结构域。在其他实施方案中,使用病毒或非病毒载体将所述两个切割结构域递送至所述细胞,其中两者均从相同的开放阅读框表达,但是编码所述两个配偶体的基因被序列(例如自切割2A序列或IRES)分隔开,所述序列导致3’配偶体以较低速率表达,使得所述两个配偶体的比率为1:2、1:3、1:4、1:5、1:6、1:8、1:9、1:10或1:20的比率、或其间的任何值。在其他实施方案中,将所述两个配偶体以被选择为不同于1:1的比率部署。
因此,在另一个方面,用于切割目的区域中的细胞染色质的方法可以包括(a)选择所述目的区域中的第一序列;(b)将第一DNA结合分子工程化以与所述第一序列特异性地结合;(c)在所述细胞中表达第一融合分子,所述第一融合分子包含所述第一DNA结合分子(例如锌指、TALE、sgRNA)和切割结构域(或半结构域);和(d)在所述细胞中表达第二融合蛋白,所述第二融合分子包含第二DNA结合结构域和第二切割结构域(或半结构域),其中所述融合分子中的至少一个包含如本文所述的接头,并且进一步其中所述第一融合分子与所述第一序列结合,并且所述第二融合分子与位于从所述第一序列起2个与50个核苷酸之间的第二序列结合,使得可以形成活性核酸酶复合物并且在所述目的区域中切割细胞染色质。在某些实施方案中,两个融合分子均包含如本文所述的在所述DNA结合结构域与所述催化核酸酶结构域之间的接头。
还提供了改变细胞染色质区域(例如内源基因)的方法,例如以引入靶向突变。在某些实施方案中,改变细胞染色质的方法包括向所述细胞中引入用于在细胞染色质中预定位点处产生双链断裂的一种或多种靶向核酸酶,以及与所述断裂的区域中细胞染色质的核苷酸序列具有同源性的供体多核苷酸。所述双链断裂的存在激活细胞DNA修复过程,并且所述供体多核苷酸被用作断裂修复的模板,从而导致将所述供体的全部或部分核苷酸序列引入所述细胞染色质中。因此,细胞染色质中的序列可以被改变,并且在某些实施方案中可以被转换为存在于供体多核苷酸中的序列。可以使用本文所述的方法和组合物改变一个或多个靶标。
靶向改变包括但不限于点突变(即单个碱基对转换为不同的碱基对)、取代(即多个碱基对转换为相同长度的不同序列)、一个或多个碱基对的***、一个或多个碱基对的缺失、以及上述序列改变的任何组合。改变还可以包括作为编码序列的一部分的碱基对的转换,使得编码的氨基酸被改变。
所述供体多核苷酸可以是DNA或RNA,可以是线性的或环状的,并且可以是单链的或双链的。可以将其作为裸核酸、作为与一种或多种递送剂(例如脂质体、纳米颗粒、泊洛沙姆)的复合物、或者包含在病毒递送载体(例如腺病毒、慢病毒或腺相关病毒(AAV))中递送至所述细胞。供体序列的长度范围可以为从10至1,000个核苷酸(或其间的任何整数值的核苷酸)或更长。在一些实施方案中,所述供体包含侧接有与所靶向的切割位点具有同源性的区域的全长基因。在一些实施方案中,所述供体缺少同源区域并通过非同源性依赖性机制(即,NHEJ)被整合至靶基因座中。在其他实施方案中,所述供体包含较小的核酸片段,其侧接有用于在所述细胞中使用(即用于基因校正)的同源区域。在一些实施方案中,所述供体包含编码功能性或结构性组分的基因(诸如shRNA、RNAi、miRNA等)。在其他实施方案中,所述供体包含编码与目的基因结合和/或调节目的基因表达的调节元件的序列。在其他实施方案中,所述供体是与目的基因结合和/或调节目的基因表达的目的调节蛋白(例如ZFPTF、TALE TF或CRISPR/Cas TF)。
在本文所述的某些方法和组合物中,使用一种或多种mRNA和/或AAV载体来递送所述核酸酶和供体。可以使用任何剂量的mRNA(ng)或AAV载体(vg/剂量)。在使用mRNA来递送所述一种或多种核酸酶和/或任选的供体的实施方案中,mRNA的剂量范围通常在10与5000ng/细胞或受试者之间(例如,2000ng、62.5ng、31.3ng、15.6ng)。在使用AAV载体来携带所述核酸酶和/或任选的供体的实施方案中,对于每种核酸酶(例如,左和右ZFN),剂量范围通常在1.00E+9至1.00E+13vg/受试者或细胞之间,并且所述任选的供体是以1.00E+10至1.00E+13给出。在某些实施方案中,一对核酸酶中的每种核酸酶都被携带在单独的AAV载体上并且是以2.00E+10、6.00E+10或2.00E+11vg/细胞或受试者给出,并且所述供体被携带在另一个AAV载体上并且是以1.60E+11、4.8E+11或1.6E+12vg/细胞或受试者给出。
对于任何上述方法,所述细胞染色质可以在染色体、附加体或细胞器基因组中。细胞染色质可以存在于任何类型的细胞中,所述任何类型的细胞包括但不限于原核和真核细胞、真菌细胞、植物细胞、动物细胞、哺乳动物细胞、灵长类动物细胞和人细胞。
在一个方面,本文描述了包含第一和第二(也称为左和右或ZFN配偶体)ZFN的锌指核酸酶,所述第一ZFN包含命名为71557的ZFN(包含具有表1中所示的针对SBS 42875的识别螺旋区域并具有表3和表4所示的另外的特征(例如,FokI序列和ZFP骨架、5’UTR序列等中的突变)的ZFP),并且所述第二ZFN包含命名为71728的ZFN(包含具有表1所示的针对SBS47874的识别螺旋区域和表3和表5所示的其他特征(例如,FokI序列和ZFP骨架、5’UTR序列等中的突变)的ZFP);和/或编码所述左和右ZFN中的一者或两者的一种或多种多核苷酸。在某些实施方案中,所述第一和第二(左和右)ZFN由单独的多核苷酸编码,所述单独的多核苷酸可以是相同或不同的类型(例如,2个AAV载体,其中一个AAV包含编码所述左ZFN的序列并且一个AAV包含编码所述右ZFN的序列;2个mRNA,其中一个mRNA编码所述左ZFN并且另一个编码所述右ZFN;1个AAV包含通过自切割肽序列(例如2A)连接在一起的两个ZFN;以及编码一个ZFN的1个mRNA与包含编码另一个ZFN的序列的一个AAV一起使用,等等)。在某些实施方案中,所述载体是包含如表4和/或表5所示的元件(序列)的AAV载体,包括如本文所示的完整AAV序列,其被命名为“71557AAV”或“SB71557 AAV”(SEQ ID NO:43)和“71728 AAV”或“SB71728 AAV”(SEQ ID NO:56)。在其他实施方案中,表4和表5所示的元件中的一个或多个被任何类似的序列替代,例如,这些表的WPRE序列可以被本领域已知的或在本文实施例4中所述的WPRE序列(例如,SEQ ID NO:68或SEQ ID NO:69或代替SEQ ID NO:53的其他WPRE序列)替代。在一些实施方案中,可以对ZFN进行许多氨基酸修饰。在一些实施方案中,进行了3个、6个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或更多个氨基酸取代。在一些实施方案中,对右侧和左侧的六个指状物进行了13个组合氨基酸取代。
因此,本文描述了包含第一ZFN和第二ZFN的锌指核酸酶,所述第一ZFN包含命名为71557的ZFN,并且所述第二ZFN包含命名为71728的ZFN。还提供了包含编码如本文所述的第一ZFN和第二ZFN的序列的一种或多种多核苷酸。在某些实施方案中,单一多核苷酸编码所述第一ZFN和第二ZFN,并且在其他实施方案中,两种单独的多核苷酸包含编码所述第一ZFN和第二ZFN的序列。可以在相同或不同的AAV载体上携带编码所述ZFN的一种或多种多核苷酸。在某些实施方案中,本文提供了两种多核苷酸,第一多核苷酸(例如AAV载体)包含如表4所示的序列或如SEQ ID NO:43所示的序列,并且第二多核苷酸(例如AAV载体)包含如表5所示的序列或如SEQ ID NO:56所示的序列。在一些实施方案中,包含所述左ZFN(SB-71557)的AAV被称为SB-A6P-ZL2。在一些实施方案中,包含所述右ZFN(SB-71728)的AAV被称为SB-A6P-ZR2。
在另一个方面,本文描述了包含如本文所述的一种或多种ZFN和/或多核苷酸(例如AAV载体)的细胞(例如,受试者的干细胞、前体细胞或肝细胞)。可以使用任何细胞或细胞系,包括但不限于干细胞、前体细胞、肝细胞、血细胞等。细胞还可以包含供体多核苷酸,通常是编码外源序列的多核苷酸,诸如编码治疗性蛋白质或其片段的转基因,所述外源序列在切割所述内源白蛋白基因后被整合到所述细胞的基因组中。所述供体可以与一个或两个ZFN配偶体被携带在同一载体上,或者可替代地,可以使用单独的载体给予所述供体,所述单独的载体可以是与携带一个或两个ZFN配偶体的所述一种或多种载体相同或不同的类型。在某些实施方案中,所述细胞包含3种单独的AAV载体,第一种包含编码所述左ZFN的序列,第二种包含编码所述右ZFN的序列,并且第三种包含所述供体多核苷酸。还描述了由包含所述ZFN和供体多核苷酸的细胞起源的子细胞,所述子细胞包括由所述ZFN(例如,整合的供体多核苷酸)进行的基因修饰。此类基因修饰可以通过本领域已知的标准方法来鉴定,所述标准方法包括对子细胞的基因组DNA的下一代测序,其中将此类序列结果与未用所述ZFN和供体多核苷酸处理的野生型细胞进行比较。
在另一个方面,本文描述了药物组合物,其包含如本文所述的一种或多种ZFN、一种或多种多核苷酸(例如AAV载体)和/或一种或多种细胞。在某些实施方案中,所述药物组合物包含3种单独的AAV载体:包含ZFN 71557的第一AAV(例如,“71557AAV”);包含ZFN71728的第二AAV(例如,“71728 AAV”);和包含供体多核苷酸的第三AAV。
在另一个方面,使用如本文所述的一种或多种ZFN、一种或多种多核苷酸(例如,AAV载体)、一种或多种细胞和/或一种或多种药物组合物(例如,包含3种单独的AAV载体的药物组合物)来切割内源白蛋白基因的方法,任选地其中所述方法(用途)还包括给予包含外源序列的供体多核苷酸(例如,由AAV载体携带的),使得所述外源序列被整合到分离的细胞中或受试者的细胞中的切割的白蛋白基因中。在一些实施方案中,将本文所述的此类一种或多种ZFN、一种或多种多核苷酸、一种或多种细胞和/或一种或多种药物组合物用于预防或治疗人类疾病。
还提供了试剂盒,其包含如本文所述的一种或多种锌指核酸酶、一种或多种多核苷酸、一种或多种细胞和/或一种或多种药物组合物以及任选的关于它们使用的说明书。
在又另一个方面,本文描述了一种组合物(也称为“FIX组合物”),其包含:(a)含有编码命名为71557的第一ZFN的序列的第一多核苷酸(例如AAV),所述第一多核苷酸任选地包含如表4所示的序列或命名为SB71557AAV(SEQ ID NO:43)的序列;(b)含有编码命名为71728的第二ZFN的序列的第二多核苷酸(例如AAV),所述第二多核苷酸任选地包含如表5所示的序列或命名为SB71728 AAV(SEQ ID NO:56)的序列;和(c)含有编码因子IX(FIX)蛋白的序列的供体多核苷酸(例如AAV)。在某些实施方案中,所述供体包含如表6所示的序列、任选地如SEQ ID NO:59所示的序列。在本文所述的任何FIX组合物中,所述第一、第二和供体多核苷酸可以被携带在三种单独的AAV载体上。还提供了使用如本文所述的组合物以在有需要的受试者中表达FIX的方法。在某些实施方案中,将所述组合物给予至所述受试者,使得所述ZFN(71557和71728)切割所述受试者中的内源白蛋白基因,所述FIX序列被整合到切割的白蛋白基因中,并且FIX蛋白在所述受试者中表达。本文所述的方法和组合物可以用于治疗和/或预防有需要的受试者的血友病。还提供了试剂盒,其包含一种或多种所述FIX组合物和任选地关于它们使用的说明书。
在仍另外的方面,本文描述了一种组合物(也称为“MPS II组合物”或“IDS组合物”),其包含:(a)含有编码命名为71557的第一ZFN的序列的第一多核苷酸(例如AAV),所述第一多核苷酸任选地包含如表4所示的序列或命名为SB 71557AAV(SEQ ID NO:43)的序列;(b)含有编码命名为71728的第二ZFN的序列的第二多核苷酸(例如AAV),所述第二多核苷酸任选地包含如表5所示的序列或命名为SB 71728(SEQ ID NO:56)的序列;和(c)含有编码艾杜糖-2-硫酸酯酶(IDS)序列的序列的供体多核苷酸(例如AAV)。在某些实施方案中,所述供体包含如表7所示的序列、任选地如SEQ ID NO:65所示的序列。在本文所述的任何MPS II组合物中,所述第一、第二和供体多核苷酸可以被携带在三种单独的AAV载体上。还提供了使用如本文所述的组合物以在有需要的受试者中表达IDS的方法。在某些实施方案中,将所述组合物给予至所述受试者,使得所述ZFN(71557和71728)切割所述受试者中的内源白蛋白基因,所述IDS序列被整合到切割的白蛋白基因中,并且IDS蛋白在受试者中表达。本文所述的方法和组合物可以用于治疗和/或预防有需要的受试者的MPS II。还提供了试剂盒,其包含一种或多种MPS II组合物和任选地关于它们使用的说明书。
在仍另外的方面,本文描述了一种组合物(也称为“MPS I组合物”或“IDUA组合物”),其包含:(a)含有编码命名为71557的第一ZFN的序列的第一多核苷酸(例如AAV),所述第一多核苷酸任选地包含如表4所示的序列或命名为SB 71557AAV(SEQ ID NO:43)的序列;(b)含有编码命名为71728的第二ZFN的序列的第二多核苷酸(例如AAV),所述第二多核苷酸任选地包含如表5所示的序列或命名为SB SEQ ID NO:56的序列;和(c)含有编码α-L-艾杜糖醛酸酶(IDUA)序列的序列的供体多核苷酸(例如AAV)。在某些实施方案中,所述供体包含如表8所示的序列、任选地如SEQ ID NO:72所示的序列。在本文所述的任何MPS I组合物中,所述第一、第二和供体多核苷酸可以被携带在三种单独的AAV载体上。还提供了使用如本文所述的组合物以在有需要的受试者中表达IDUA的方法。在某些实施方案中,将所述组合物给予至所述受试者,使得所述ZFN(71557和71728)切割所述受试者中的内源白蛋白基因,所述IDUA序列被整合到切割的白蛋白基因中,并且IDUA蛋白在受试者中表达。本文所述的方法和组合物可以用于治疗和/或预防有需要的受试者的MPS I。还提供了试剂盒,其包含一种或多种MPS I组合物和任选地关于它们使用的说明书。
在一些实施方案中,将本文公开的任何组合物以单一剂量给予至有需要的受试者。在其他实施方案中,将所述组合物以多于一个剂量给予。在一些实施方案中,将所述组合物以多于一个剂量给予,其中两个剂量之间有一定的时间段。在一些实施方案中,所述时间段包括1、2、3、4、5或6个月。在一些实施方案中,所述时间段包括半年、一年、两年、三年、四年、5年或更长时间。
在又另一个方面,还提供了包含如本文所述的任何多肽(例如,融合分子)和/或多核苷酸的细胞。在一个实施方案中,所述细胞包含融合分子对,每个融合分子包含如本文所公开的切割结构域。细胞包括培养的细胞、生物体中的细胞、以及在以下情况下已经从生物体移取以进行处理的细胞,在所述情况下所述细胞和/或其后代将在处理之后返回至所述生物体。细胞染色质中的目的区域可以是例如基因组序列或其部分。
在另一个方面,本文描述了一种试剂盒,其包含如本文所述的融合蛋白或编码如本文所述的一种或多种锌指蛋白、切割结构域和/或融合蛋白的多核苷酸;辅助试剂;以及任选地说明书和合适的容器。所述试剂盒还可以包含一种或多种核酸酶或编码此类核酸酶的多核苷酸。
从整体而言鉴于本公开文本,这些和其他方面对于熟练技术人员来说都是易于清楚的。
附图说明
图1A和图1B描绘了人白蛋白基因组序列(SEQ ID NO:41)的部分序列,并示出了示例性ZFN 47171-FLAG和47898-FLAG的结合位点(由下划线或上划线示出靶位点)。图1A还示出了(加框)大约20%的个体中出现的从A/T到G/C的单核苷酸多态性(SNP)。图1B示意性描绘了其中左和右ZFN与靶白蛋白序列关联的方式。
图2是示出由指示的示例性核酸酶和指示的剂量引起的基因组修饰(***缺失%)的图。每种条件下的左条示出了野生型A/T序列的修饰,并且右条示出了G/C SNP的修饰。
图3A至图3H示出了使用如本文所述的ZFN编码载体的基因组修饰的示例性结果。图3A示出了与不包含本文所述的修饰的核酸酶(“亲本”)相比,使用如本文所述的示例性人工核酸酶(名称中指示的修饰)在指示的条件下(与脱靶位点(SMCHD1)的修饰相比,在预期靶标(白蛋白)处)的修饰结果。如图所示,与亲本核酸酶相比,本文所述的核酸酶展现出增加的活性和特异性。图3B示出了切割活性(针对预期靶位点(“白蛋白-中靶”)(2000ng、62.5ng、31.3ng、15.6ng)或针对脱靶位点(“脱靶”)(2000ng)使用在指示剂量下的指示的亲本或优化的ZFN的***缺失%,如通过深度测序所测量的)。图中所显示的工程化FokI结构域N159D也被称为N542D,并且命名为P95S的FokI结构域也被称为P478S。图3B还示出了在改进形式中进行了修饰的ZFN表达盒的示意图。图3C示出了在用本文所述的ZFN处理的K562和HepG2细胞中,在指示的中靶位点(白蛋白)和脱靶位点(第1至26行)处的活性结果(如***缺失%所示的切割活性和命名为“捕获事件”的靶向整合)。“ns”是指不显著;“ns*”是指与ZFN切割不一致的***缺失;“^”是指与ZFN切割一致的***缺失和非显著p值;并且“ND”是指无数据。图3D是示出使用亲本47171/47898ZFN对(“ZFN标准”,每种条件的左条)或优化的71557/71728ZFN对(“ZFN 2.0”,每种条件的右条)在AAV载体所携带的白蛋白ZFN和携带IDS转基因的AAV供体的指示剂量(低=30/240ZFN/供体MOI;中=100/800ZFN/供体MOI;和高=300/2400ZFN/供体MOI)下的切割(***缺失%)的图。本实验中使用的编码71557/71728ZFN的AAV构建体包括5’β球蛋白非翻译区(UTR)、3xFLAG和土拨鼠肝炎病毒(WHV)转录后调节元件突变体6(WPREmut6)。图3E(i)是示出使用亲本(“ZFN标准”,每种条件的左条)或优化的ZFN(“ZFN 2.0”,每种条件的右条)在AAV载体所携带的白蛋白ZFN和携带IDS转基因的AAV供体的指示剂量(低=30/240ZFN/供体MOI,中=100/800ZFN/供体MOI;和高=300/2400ZFN/供体MOI)下由供体转基因(IDS)编码的蛋白质的活性的图。图3E(ii)是示出在指示剂量下的IDS活性的图。在每种条件下从左到右显示(从左到右):在第5天的标准ZFN;在第7天的标准ZFN;在第5天的ZFN 2.0;和在第7天的ZFN 2.0。图3F(i)和3F(ii)描绘了47171/47898对和71557/47898对的比较结果。将指示量的编码ZFN的mRNA一式三份地转染到原代人肝细胞中,所述原代人肝细胞对于含WT(A:T)和SNP(G:C)的ZFN靶位点而言是杂合的。本实验中使用的编码71557ZFN的mRNA包括5’β球蛋白非翻译区(UTR)和土拨鼠肝炎病毒(WHV)转录后调节元件(WPRE)。通过深度测序在转染后24-hr确定了ZFN活性水平。图3F(i)示出了在A:T WT等位基因(深灰色)和G:C SNP等位基因(浅灰色)靶位点处的ZFN活性(以***缺失%表示)。图3F(ii)示出了在A:T WT等位基因靶位点处与在G:C SNP等位基因靶位点处的ZFN活性比率,其中值1.0表示在每个等位基因的切割相等(浅灰色为47171/47898ZFN对,深灰色为71557/47898ZFN对)。图3G是描绘47171/47898和71557/71728ZFN对在原代人肝细胞中的切割动力学的图,其中ZFN通过AAV被递送至细胞。本实验中使用的编码71557/71728 ZFN的AAV构建体包括5’β球蛋白非翻译区(UTR)、3xFLAG和土拨鼠肝炎病毒(WHV)转录后调节元件突变体6(WPREmut6)。图3H示出了在原代人肝细胞中47171/47898和71557/71728ZFN对的中靶和脱靶切割数据的比较。本实验中使用的编码71557/71728ZFN的AAV构建体包括5’β球蛋白非翻译区(UTR)、3xFLAG和土拨鼠肝炎病毒(WHV)转录后调节元件突变体6(WPREmut6)。最上面一行示出了在从3K至600K的MOI浓度下71557/71728ZFN对在白蛋白基因座和SMCHD1基因座上的活性。在顶部左图上还指示了预期的临床剂量范围。通过MiSeq深度测序评价了用编码第二代ZFN的AAV2/6转导的人原代肝细胞。NS-无统计学意义(双尾t检验),*-p值<0.05(双尾t检验)。最下面一行示出了与针对SMCHD1基因座的单独实验相比,针对白蛋白基因座的第一代和第二代ZFN对的100K和600K MOI剂量的放大图。在100K MOI剂量下,第一代ZFN显示出平均中靶活性为17%***缺失和脱靶活性为0.11%***缺失,并且第二代ZFN显示出平均中靶活性为35%和脱靶活性为0.08%。比较这两个中靶与脱靶比率,第二代ZFN的选择性比第一代ZFN高约2.8倍。在600K MOI剂量下,第一代ZFN显示出平均中靶活性为25%***缺失和脱靶活性为0.36%***缺失,并且第二代ZFN显示出平均中靶活性为44%和脱靶活性为0.34%。比较这两个比率,第二代ZFN的选择性比第一代ZFN的选择性高约1.9倍。在100K和600K MOI下,47171/47898和71557/71728ZFN对的***缺失%分别为17%和35%、以及25%和44%,这表明71557/71728ZFN对的效力比47171/47898ZFN对的效力高约2倍。
图4A至图4C示出了当核酸酶由还包含一个或多个FLAG序列的多核苷酸表达时增加的核酸酶活性(***缺失%,如过下一代测序所确定)。图4A是示出在引入编码具有(y轴)或不具有(x轴)3xFLAG序列的人工核酸酶的多核苷酸后的活性(***缺失%)的图。斜线左边的数据点指示3xFLAG对核酸酶活性有益的情况,相比之下线右边的数据点表示3xFLAG序列是有害的情况。图4B示出了与不具有FLAG序列的多核苷酸相比活性平均增加高于4倍。图4C是示出在具有(浅色圆圈显示为“+肽”)或不具有(深色圆圈显示为“无肽”)FLAG肽的情况下用编码白蛋白靶向ZFN的mRNA在指示的mRNA量下转染的K562细胞中的核酸酶活性(***缺失%,如通过深度测序所确定的)的图。在转染后24小时评估细胞的ZFN活性。浅色圆圈(包括5’肽的mRNA)上方的数字指示与没有5’肽的mRNA相比的倍数增加。
图5A至图5C是描绘与未经修饰的3’UTR相比当核酸酶由还包含经修饰的3’UTR(例如WPRE序列)的多核苷酸表达时增加的核酸酶活性(***缺失%,如过下一代测序所确定)的图。图5A示出了当编码人工核酸酶的多核苷酸(mRNA)在3’UTR中包括WPRE时在分离细胞中增加的切割活性。图5B示出了在向小鼠给予指示的mRNA(使用LNP)后在体内(在小鼠肝中)使用包括WPRE的ZFN的增加的活性。图5B示出了在向小鼠给予指示的AAV后在体内(在小鼠肝中)使用包括WPRE的ZFN的增加的切割活性。
图6是示出在指示的MOI下使用指示的多核苷酸组分组合的增加的核酸酶活性(***缺失%,如通过下一代测序所确定)的图。在每种条件下最左边的条(“标准”)示出了在编码核酸酶的多核苷酸不包括3xFLAG、WPRE序列或多聚A序列的情况下的结果。从左边起第二条(“3xFlag、WPRE”)示出了在编码核酸酶的多核苷酸包括3xFLAG肽序列和WPRE序列的情况下的结果。从右边起第二条(“5’XBG、WPRE”)示出了在编码核酸酶的多核苷酸包括牛生长激素(“BG”)多聚A序列和WPRE序列的情况下的结果。最右边的条(“5XBG、3xFLAG、WPRE”)示出了在编码核酸酶的多核苷酸包括BG多聚A序列、3xFLAG肽序列和WPRE序列的情况下的结果。在每种条件(MOI)上面显示了观察到的核酸酶活性的倍数增加。
图7A和图7B是制备和测试的示例性不同变体构建体的图示。图7A描绘了V1是初始的表达结构,并且V2-V8描绘了各种变体结构。缩写如下:“ApoE”是Apo E增强子;“hAAT”是人α1抗胰蛋白酶启动子;“HBB-IGG”是人β嵌合内含子,其包含来自人β球蛋白基因的第一内含子的5’供***点以及来自免疫球蛋白基因重链可变区的内含子的分支和3’受***点;“NLS”是核定位序列;“多聚A”是多聚A序列;“WPRE”是土拨鼠肝炎病毒转录后调节元件;“3xFLAG”是描述为SEQ ID NO:4和/或SEQ ID NO:71的肽;并且“β-glb”是非洲爪蟾β球蛋白基因的5’非翻译区。图7B示出了包含编码ZFN47171、47898、71557和71728的序列的AAV的示意图。
图8是示出在指示的MOI下使用指示的多核苷酸组分组合的核酸酶活性(***缺失%,如通过下一代测序所确定)的图。在每种条件下最左边的条(“标准(V1)”)示出了在编码核酸酶的多核苷酸不包括3xFLAG、WPRE序列或多聚A序列的情况下(也称为变体1(V1)或亲本)的结果。从左边起第二条(“WPRE(V2)”)示出了在编码核酸酶的多核苷酸包括WPRE序列的情况下的结果。中间条(“3xFlag、WPRE(V4)”)示出了包括3xFLAG序列和WPRE序列的变体(命名为V4)的结果。从右边起第二条(“5’XBG、WPRE(V6)”)示出了在编码核酸酶的多核苷酸(命名为变体6或V6)包括牛生长激素(“BG”)多聚A序列和WPRE序列的情况下的结果。最右边的条(“5XBG、3xFLAG、WPRE”)示出了在编码核酸酶的多核苷酸(命名为变体8或V8)包括BG多聚A序列、3xFLAG肽序列和WPRE序列的情况下的结果。
图9是示出在具有(浅色圆圈显示为“+新的5’UTR”)或不具有(深色圆圈显示为“没有5’UTR”)5’UTR序列(如SEQ ID NO:1所示的非洲爪蟾β球蛋白UTR)的情况下用编码白蛋白靶向ZFN的mRNA在指示的mRNA量下转染的K562细胞中的核酸酶活性(***缺失%,如通过深度测序所确定的)的图。在转染后24小时评估细胞的ZFN活性。浅色圆圈(包括5’UTR的mRNA)上方的数字表明与没有5’UTR的mRNA相比的倍数增加。
图10A至图10C是示出在体内或在体外的切割效率和ZFN表达的图。图10A是示出在注射指示的ZFN构建体后56天如通过小鼠肝细胞中的***缺失%所确定的体内切割的图,并且图10B示出了ZFN表达水平。向野生型雄性小鼠以三个剂量(2.0E+11vg/小鼠(低剂量)、6.0E+11vg/小鼠(中剂量)和2.0E+12vg/小鼠(高剂量))静脉内注射不具有(“ZFN标准”)或具有5’UTR、FLAG肽和WPRE序列(“ZFN改进”或“ZFP 2.0”)和IDS供体的编码白蛋白ZFN的AAV6构建体。注射后56天收集肝样品。从左至右,显示了在给予配制品缓冲液、低剂量的未经修饰(标准)的ZFN编码载体、低剂量的如本文所述修饰的AAV ZFN编码载体、中剂量的未经修饰(标准)、中剂量的如本文所述修饰的AAV ZFN编码载体ZFN、高剂量的未经修饰(标准)、和高剂量的如本文所述修饰的AAV ZFN编码载体ZFN后的***缺失。如图所示,如与未经修饰的AAV载体相比,包括本文所述的修饰(5’UTR、5’肽、WPRE)的AAV载体提供了7倍增加的切割效率。*-p<0.05,**-p<0.01(双尾学生t检验)。图10C展示了使用71557/71728或47171/47898ZFN对的增加的FIX供体表达。在第1天将ZFN对用于处理HepG2细胞,然后在第2天使用FIX转基因。在第9天,对培养基进行ELISA以确定所表达的FIX蛋白的量。数据证明,与47171/47898对相比,使用71557/71728ZFN对导致培养基中表达的FIX多了近3倍。
图11A至图11C描绘了这些研究中使用的供体设计。图11A是示出由供体AAV包含的元件和转基因的三个供体的图示。图11B示出了用于对原代人肝细胞(左图)进行编辑的修饰的结果,以及与改进的ZFN(在指示剂量下的“ZFN 2.0”,显示为右条)相比,在已使用标准(在指示剂量下的“当前”,显示为左条)ZFN对进行ZFN驱动的靶向整合的肝细胞的上清液中检测到的增加的活性。图11C是示出如图10和实施例7中所描述进行处理的小鼠受试者的体内转基因表达(IDS)的图。向野生型雄性小鼠以三个剂量(2.0E+11vg/小鼠(低剂量)、6.0E+11vg/小鼠(中剂量)和2.0E+12vg/小鼠(高剂量))静脉内注射不具有(“ZFN标准”)或具有5’UTR、FLAG肽和WPRE序列(“ZFN改进”)和IDS供体的编码白蛋白ZFN的AAV6构建体。注射后56天收集肝样品,并如实施例中所描述的测量相对转基因表达。从左至右,显示了在给予配制品缓冲液、低剂量的未经修饰(标准)的ZFN编码载体、低剂量的如本文所述修饰的AAV ZFN编码载体、中剂量的未经修饰(标准)、中剂量的如本文所述修饰的AAV ZFN编码载体ZFN、高剂量的未经修饰(标准)、和高剂量的如本文所述修饰的AAV ZFN编码载体ZFN后的结果。如图所示,与未经修饰的AAV载体相比,包括本文所述的修饰(5’UTR、5’肽、WPRE)的AAV载体提供了18倍增加的供体(IDS)表达。
图12示出了如实施例7以及图10和图11中所描述进行处理的受试者的肝样品中IDS表达的蛋白质印迹分析的结果。
图13是示出由与经修饰和未经修饰的ZFN(以低、中和高剂量)一起给予以进行靶向整合(参见实施例7)的供体所编码的IDS蛋白的酶促活性的图。如在实施例中所描述的测量酶促活性。从左至右,显示了在给予配制品缓冲液、低剂量的未经修饰(标准)的ZFN编码载体、低剂量的如本文所述修饰的AAV ZFN编码载体、中剂量的未经修饰(标准)、中剂量的如本文所述修饰的AAV ZFN编码载体ZFN、高剂量的未经修饰(标准)、和高剂量的如本文所述修饰的AAV ZFN编码载体ZFN后的结果。
图14A和图14B描绘了使用标准47171/47898ZFN对或71557/71728ZFN对在HepG2细胞中***IDUA供体。图14A描绘了用ZFN和供体处理的HepG2细胞的上清液中随时间推移的IDUA活性。ZFN剂量为600K MOI,并且供体剂量为1200K MOI。图14B描绘了在细胞中对于每种测试条件的***缺失百分比。数据证明两对ZFN都有活性,并且导致IDUA转基因的ZFN定向靶向整合。
具体实施方式
本文公开了用于增加工程化核酸酶表达的效率(切割活性)以及增加中靶工程化核酸酶切割活性的特异性的方法和组合物。所述方法涉及优化核酸酶表达载体中的表达元件的组合,和减少FokI切割结构域与DNA之间的非特异性相互作用,以及减少锌指骨架与DNA之间的非特异性相互作用。此外,本发明的方法和组合物提供了能够以高特异性切割人白蛋白基因座的优化的ZFN试剂,并且优化的白蛋白试剂也能够切割野生型白蛋白靶序列和包含SNP的相同靶序列。本文所述的ZFN试剂可以用于白蛋白基因的有效和高度靶向切割,包括用于将一种或多种治疗性蛋白质(例如,患有疾病或障碍的受试者中缺乏或不足的蛋白质)编码序列经核酸酶介导整合到切割的白蛋白基因中,使得所述一种或多种蛋白质在受试者中表达并且减少、预防和/或治疗(例如,减轻症状)受试者的疾病或障碍。
乙型血友病是由编码凝血因子IX(FIX)的基因的突变引起的一种X连锁隐性遗传出血障碍。它也被称为克雷司马斯病(Christmas disease),并且是血友病的第二最常见形式,仅次于甲型血友病或因子VIII缺乏症。在美国,每25,000名男性中就有约一人患有此病,其中患病人数为大约4,000人。疾病表现取决于因子IX凝血活性的水平而变化。大多数患有乙型血友病的受试者都具有严重的疾病形式(<1%FIX活性)。他们通常在生命的头两年在发生自发性关节或深层肌肉出血之后被诊断。具有中度疾病的那些(1%-5%FIX活性)在相对较小的创伤后呈现延长或延迟出血,并在六岁前被诊断。相比之下,轻度血友病患者(>5%-30%FIX活性)在生命后期被诊断,并且不会遭受自发性出血,但将在手术或拔牙后发生过度出血。最后,大约10%的女性携带者的FIX活性低于30%,并且在大型创伤或手术后有过度出血的风险。
目前对乙型血友病的治疗包括使用最初在20世纪60年代末源自供体血浆的FIX浓缩物。随后的改进(诸如病毒灭活和供体筛选)导致了更高纯度的浓缩物,最终在1997年引入了重组FIX。最近,一种允许每周或每两周给予一次的重组FIX Fc融合蛋白被批准在美国上市。将因子IX的水平增加至正常水平(即约250ng/mL)的约5%导致症状明显改善,并且足以预防自发性和危及生命的出血发作。(Scriver,CR等人The Metabolic and Molecular Bases of Inherited Disease.纽约:McGraw-Hill(2001);Lofqvist,T等人(1997)J.Intern.Med.241(5):395-400;Ljung,RC.(1998)Br.J.Haematol.101(2):215-219)。这些治疗进步已经将中值预期寿命从引入血浆来源的FIX前的11岁增加至使用重组蛋白后的63岁(Darby,SC等人(2007)Blood.110(3):815-25)。
目前对乙型血友病的治疗依赖于长期反复静脉内输注纯化的重组因子IX,并且有许多缺点。这包括需要反复静脉内输注,对于反复静脉内输注的需要与抑制剂形成相关并且是预防性的而不是治愈性的。基于在原位(在受试者的肝内)由治疗性转基因合成的凝血因子递送的替代方法提供了消除这些担忧的前景。本文公开的方法和组合物描述了经由一种新的策略治疗乙型血友病,所述新的策略将纠正性FIX转基因置于基因组中并在受试者的自身内源白蛋白基因座或高表达的外源启动子的控制下,从而导致因子IX的肝特异性合成。特别地,将如本文所述的工程化锌指核酸酶(ZFN)用于在体内将FIX转基因位点特异性地整合到受试者自身肝细胞的基因组中。使用如本文所述的核酸酶整合FIX转基因导致FIX的稳定、高水平、肝特异性表达及其向受试者血液中的分泌。
粘多糖贮积症I型(MPS I)也称为赫勒/赫勒-舍伊/舍伊综合征(Hurler/Hurler-Scheie/Scheie syndrome),它是一种隐性遗传溶酶体贮积障碍。根据国家神经障碍和中风研究所(National Institute of Neurological Disorders and Stroke,NINDS)关于MPSI的资料页,严重MPS I的估计发病率为约100,000名新生儿中有1例,减弱MPS I的估计发病率为约500,000名新生儿中有1例,并且介于严重与减弱之间的疾病的估计发病率为约115,000名新生儿中有1例。
MPS I与编码艾杜糖醛酸酶(IDUA)酶的基因中的突变相关,所述酶降解糖胺聚糖(硫酸化碳水化合物聚合物;GAG)。IDUA基因的突变降低或消除了IDUA酶活性,这导致在尿液、血浆和身体组织中有毒GAG的积累。
取决于IDUA突变的具体类型(已经描述了多于100种不同的突变)和所得的残留IDUA酶的水平,患者将发展成赫勒综合征(Hurler syndrome)(MPS I H)或减弱的变体(MPSI H/S和MPS I S)。据估计,50%-80%的所有MPS I患者呈现出严重形式,这可能部分归因于相对容易诊断(Muenzer等人(2009)Pediatrics.123(1):19-29)。MPS I H患者在他们第一年结束前显示出发育迟缓的症状,并且在2-4岁之间显示出生长停滞和进行性精神衰退。其他症状包括脏器肿大、角膜混浊、关节僵硬和骨骼变形(包括异常的脊椎骨)、伴有巨舌的粗陋面部特征、听力丧失和疝气。这些MPS I H患者的预期寿命小于10岁。患有减弱形式的患者具有这些临床表现中的大部分,但症状不太严重。此外,没有CNS受累,因此他们没有遭受精神发育迟滞。
这些患者中的许多人可以存活到成年期,但患病率很高。目前对MPS I的疗法包括造血干细胞移植(HSCT)和酶替代疗法(ERT)。如果患有严重MPS I形式(MPS I-H)的患者可以得到早期诊断(<2.5岁),通过HSCT(骨髓或脐带干细胞)的治疗性干预可以预防或逆转大多数临床特征,包括神经认知。目前,几乎所有患有MPS I H的患者都要进行HSCT。对于MPSI,HSCT后的死亡率为15%,并且成功移植的存活率为56%。自2003年以来使用在中国仓鼠卵巢细胞中生产的多态性重组蛋白
Figure BDA0002714495690000261
的ERT一直在使用。这种酶已被证明可改善肺功能、肝脾肿大和运动能力,并导致改善的健康相关生活质量。应尽可能早地制定ERT。酶替代疗法的局限性包括需要终身治疗;中和抗体的开发;不能穿过血脑屏障;持续的心脏、矫形、眼部并发症;以及每周静脉内输注的不便。总之,这些局限性加强了开发更广泛的针对MPS I的治愈疗法的迫切需要。
使用本文公开的方法和组合物的目的和原理是通过体内基因组编辑来消除或减少对酶替代疗法的需求。特别地,如本文所述的工程化锌指核酸酶(ZFN)用于在体内将正确拷贝的艾杜糖醛酸酶(hIDUA)转基因位点特异性地整合到受试者自身肝细胞的基因组中。hIDUA转基因的整合可以靶向白蛋白基因座的内含子1,导致艾杜糖醛酸酶的稳定、高水平、肝特异性表达及其向血液中的分泌。预期将huIDUA转基因置于高表达内源白蛋白基因座的控制之下可为MPS I患者的一生提供艾杜糖醛酸酶的永久性肝特异性表达。
粘多糖贮积症II(MPS II)也称为亨特综合征(Hunter syndrome),是一种主要在男性中的X连锁隐性遗传溶酶体贮积障碍。据报道MPS II的发病率为每100,000名活产中有0.3至0.71例(Burton和Giugliani(2012)Eur J Pediatr.171(4):631-9.doi:10.1007/s00431-012-1703-y.电子出版2012年3月1日)。将减弱形式的疾病的更保守中值预期寿命21.7岁(严重形式的疾病的预期寿命为11.8岁)(Burrow和Leslie(2008)Biologics.2008年6月;2(2):311-20;Young和Harper(1982)J Med Genet.19(6):408-11)应用于年发病率得出估计患病人数为约629名目前生活在美国的患有MPS II的个体。
MPS II是由艾杜糖-2-硫酸酯酶(IDS)基因突变引起的,所述基因编码一种参与粘多糖糖胺聚糖(GAG)溶酶体降解的酶。这导致在尿液、血浆和组织中GAG的积累,并引起多***的进行性疾病。亨特综合征代表了一种疾病谱,其跨越伴有躯体和认知受累的早发的严重疾病(三分之二的患者)至以躯体疾病晚发和很少或没有中枢神经***(CNS)疾病为特征的减弱MPS II。IDS突变的具体类型(已鉴定出>150个基因突变)和所得的残留IDS酶的水平最有可能决定疾病的严重性。减弱形式中的残留IDS活性已经被测量为野生型IDS活性的0.2%-2.4%,并且具有严重表型的那些没有活性(Sukegawa-Hayasaka等人(2006)JInherit Metab Dis 29(6):755-61)。IDS基因被定位于Xq28,并且含有九个外显子,覆盖24kb。较多的缺失和重排总是与严重形式的疾病相关。
严重的MPS II患者通常在18个月与3岁之间开始出现言语迟缓和发育迟滞。所述疾病的特征在于在严重的MPS II患者中脏器肿大、活动过度和攻击性、神经***退化、关节僵硬和骨骼变形(包括异常的脊椎骨)、伴有巨舌的粗陋面部特征、心脏瓣膜增厚、听力丧失和疝气。未接受治疗的严重亨特综合征患者的预期寿命会持续到青少年中期,并因神经***退化和/或心肺功能衰竭而死亡。患有减弱形式的患者通常比严重患者更晚地被诊断出。躯体临床特征与严重患者相似,但总体疾病严重性较轻,一般疾病进展较慢,没有或仅有轻度认知损害。未经治疗的减弱形式的死亡通常在20-30岁之间因心脏和呼吸***疾病而发生。
针对MPS II唯一被批准的疗法是酶替代疗法(ERT)。使用重组IDS蛋白(艾度硫酸酯酶;
Figure BDA0002714495690000271
)的静脉内(IV)ERT已于2006年获得批准。已经显示,使用艾度硫酸酯酶的ERT可改善肝脾肿大、肺功能(FVC)和运动能力(步行6分钟),并导致改善的健康相关生活质量。对ERT的反应取决于受试者在开始治疗时的疾病严重性。ERT的局限性包括需要终身治疗、中和抗体的开发、酶不能穿过血脑屏障、以及每周静脉内输注的不便。与赫勒综合征(MPS I的严重形式)相反,不建议将造血干细胞移植(HSCT)用于MPS II的严重形式。总之,这些局限性加强了开发更广泛的针对MPS II的治愈疗法的迫切需要。
因此,本文公开的方法和组合物通过对患有MPS II的受试者进行体内基因组编辑来消除或减少对酶替代疗法的需求。特别地,如本文所述的工程化锌指核酸酶(ZFN)用于在体内将正确拷贝的酶艾杜糖-2-硫酸酯酶(hIDS)转基因位点特异性地整合到受试者自身肝细胞的基因组中。hIDS转基因的整合被靶向白蛋白基因座的内含子1,导致艾杜糖-2-硫酸酯酶的稳定、高水平、肝特异性表达及其向血液中的分泌。预期将hIDS转基因置于高表达的内源白蛋白基因座的控制之下可为MPS II患者的一生提供艾杜糖-2-硫酸酯酶的永久性肝特异性表达。
概述
除非另有指示,否则方法的实践以及本文所公开的组合物的制备和使用采用分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组DNA和相关领域的常规技术,这些技术是本领域所熟知的。这些技术在文献中有充分解释。参见例如,Sambrook等人MOLECULAR CLONING:A LABORATORY MANUAL,第二版,Cold Spring Harbor LaboratoryPress,1989和第三版,2001;Ausubel等人,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,John Wiley&Sons,纽约,1987和定期更新;丛书METHODS IN ENZYMOLOGY,Academic Press,圣地亚哥;Wolffe,CHROMATIN STRUCTURE AND FUNCTION,第三版,Academic Press,圣地亚哥,1998;METHODS IN ENZYMOLOGY,第304卷,“Chromatin”(P.M.Wassarman和A.P.Wolffe编辑),Academic Press,圣地亚哥,1999;以及METHODS IN MOLECULAR BIOLOGY,第119卷,“Chromatin Protocols”(P.B.Becker编辑)Humana Press,托托瓦,1999。
定义
术语“核酸”、“多核苷酸”和“寡核苷酸”可互换使用,并且是指线性或环状构象的脱氧核糖核苷酸或核糖核苷酸聚合物,并且是单链或双链形式。出于本公开文本的目的,不应将这些术语视为在聚合物的长度方面加以限制。这些术语可以涵盖天然核苷酸的已知类似物,以及在碱基、糖和/或磷酸部分(例如,硫代磷酸酯骨架)中被修饰的核苷酸。通常,特定核苷酸的类似物具有相同的碱基配对特异性;即,A的类似物将与T进行碱基配对。
术语“多肽”、“肽”和“蛋白质”可互换使用以指代氨基酸残基的聚合物。所述术语还适用于如下氨基酸聚合物,其中一个或多个氨基酸是相应天然存在的氨基酸的化学类似物或经修饰衍生物。
“结合”是指高分子之间(例如,蛋白质与核酸之间)的序列特异性非共价相互作用。并非结合相互作用的所有组分都需要是序列特异性的(例如,与DNA骨架中的磷酸残基接触),只要所述相互作用作为整体是序列特异性的即可。此类相互作用的特征通常是解离常数(Kd)为10-6M-1或更低。“亲和力”是指结合强度:增强的结合亲和力与较低的Kd相关。“非特异性结合”是指在任何目的分子(例如工程化核酸酶)与不依赖于中靶序列的大分子(例如DNA)之间发生的非共价相互作用。
“结合蛋白”是能够与另一分子共价结合的蛋白质。结合蛋白可以与例如DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)结合。在蛋白质结合蛋白的情形中,其可以与自身结合(以形成同二聚体、同三聚体等),和/或其可以与一种或多种不同蛋白质的一个或多个分子结合。结合蛋白可以具有多于一种类型的结合活性。例如,锌指蛋白具有DNA结合、RNA结合和蛋白质结合活性。在RNA指导的核酸酶***的情况下,RNA指导对于核酸酶组分(Cas9或Cfp1)是异源的,并且两者都可以被工程化。
“DNA结合分子”是可以与DNA结合的分子。这种DNA结合分子可以是多肽、蛋白质结构域、较大蛋白质内的结构域或多核苷酸。在一些实施方案中,多核苷酸是DNA,而在其他实施方案中,多核苷酸是RNA。在一些实施方案中,DNA结合分子是核酸酶的蛋白质结构域(例如FokI结构域),而在其他实施方案中,DNA结合分子是RNA指导的核酸酶的指导RNA组分(例如Cas9或Cfp1)。
“DNA结合蛋白”(或结合结构域)是例如分别通过一个或多个锌指或通过与锌指蛋白或TALE中的一个或多个RVD的相互作用以序列特异性方式结合DNA的一种蛋白质或在较大蛋白质内的结构域。术语锌指DNA结合蛋白通常缩写为锌指蛋白或ZFP。
“锌指DNA结合蛋白”(或结合结构域)是蛋白质或较大蛋白质内的结构域,其以序列特异性方式通过一个或多个锌指结合DNA,所述锌指是结合结构域内的氨基酸序列区域,所述结合结构域的结构通过锌离子的配位而稳定。术语锌指DNA结合蛋白通常缩写为锌指蛋白或ZFP。人工核酸酶和转录因子可以包含ZFP DNA结合结构域和功能结构域(ZFN的核酸酶结构域或ZFP-TF的转录调节结构域)。术语“锌指核酸酶”包括一个ZFN以及二聚化以切割靶基因的ZFN对(所述对的成员被称为“左和右”或“第一和第二”或“对”)。
“TALE DNA结合结构域”或“TALE”是包含一个或多个TALE重复结构域/单元的多肽。重复结构域参与TALE与其同源靶DNA序列的结合。单一“重复单元”(也称为“重复序列”)的长度典型地是33-35个氨基酸,并展现与天然存在的TALE蛋白内的其他TALE重复序列的至少一定序列同源性。参见例如,美国专利号8,586,526和9,458,205。人工核酸酶和转录因子可以包含TALE DNA结合结构域和功能结构域(TALEN的核酸酶结构域或TALEN-TF的转录调节结构域)。术语“TALEN”包括一个TALEN以及二聚化以切割靶基因的TALEN对(所述对的成员被称为“左和右”或“第一和第二”或“对”)。
锌指和TALE DNA结合结构域可以经“工程化”以与预定的核苷酸序列结合,例如通过对天然存在的锌指蛋白的识别螺旋区域工程化(改变一个或多个氨基酸)或通过对DNA结合中涉及的氨基酸(重复可变双残基或RVD区域)工程化。因此,工程化的锌指蛋白或TALE蛋白是非天然存在的蛋白质。对锌指蛋白和TALE工程化的方法的非限制性例子是设计和选择。设计的蛋白质是在自然界中不存在的蛋白质,其设计/组成主要源自合理标准。设计的合理标准包括应用替换规则和计算机化算法,以用于处理存储现有ZFP或TALE设计和绑定数据的信息的数据库中的信息。参见例如,美国专利号8,586,526;6,140,081;6,453,242;和6,534,261;还参见WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536;和WO 03/016496。
“所选择的”锌指蛋白或TALE蛋白或CRISPR/Cas***不是在自然界中发现的,其产生主要源自经验过程,诸如噬菌体展示、相互作用陷阱、合理设计或杂交体选择。参见例如,US 5,789,538;US 5,925,523;US 6,007,988;US 6,013,453;US 6,200,759;WO 95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970;WO 01/88197和WO02/099084。
“TtAgo”是原核Argonaute蛋白,被认为参与基因沉默。TtAgo源自细菌嗜热栖热菌(Thermus thermophilus)。参见例如,Swarts等人,同上;G.Sheng等人,(2013)Proc.Natl.Acad.Sci.U.S.A.111,652)。“TtAgo***”是所需的所有组分,包括例如用于通过TtAgo酶切割的指导DNA。
“重组”是指在两个多核苷酸之间交换遗传信息的过程,包括但不限于通过非同源末端连接(NHEJ)的捕获和同源重组。出于本公开文本的目的,“同源重组(HR)”是指这种交换的特化形式,其发生于例如细胞中的双链断裂通过同源定向修复机制修复期间。这个过程需要核苷酸序列同源性,使用“供体”分子模板修复“靶”分子(即,经历双链断裂的分子),并且因为其导致遗传信息从供体转移至靶标,被不同地称为“非交换型基因转化”或“短束基因转化”。不希望受任何特定理论约束,这种转移可以涉及在断裂的靶标与供体之间形成的异源双链体DNA的错配修正,和/或“合成依赖性链退火”(其中使用供体重合成将成为靶标的一部分的遗传信息),和/或相关过程。这种特化的HR通常导致靶分子序列的改变,使得供体多核苷酸的部分或全部序列掺入靶多核苷酸中。
在本公开文本的某些方法中,如本文所述的一种或多种靶向核酸酶在靶序列(例如细胞染色质)中预定位点(例如目的基因或基因座)处产生双链断裂(DSB)。如本文所述,DSB介导构建体(例如供体)的整合。任选地,所述构建体与断裂区域中的核苷酸序列具有同源性。表达构建体可以是物理整合的,或可替代地,表达盒被用作经由同源重组修复断裂的模板,从而导致将表达盒中的全部或部分核苷酸序列引入细胞染色质中。因此,可以改变细胞染色质中的第一序列,并且在某些实施方案中,可以将所述第一序列转换为表达盒中存在的序列。因此,术语“替代”(“replace”或“replacement”)的使用可以理解为代表一个核苷酸序列被另一个核苷酸序列替代(即,在信息意义上的序列替代),并且不一定需要将一个多核苷酸物理地或化学地被另一个多核苷酸替代。
在本文所述的任何方法中,可以将另外的工程化核酸酶用于细胞内另外靶位点的另外双链切割。
在用于细胞染色质的目的区域中的序列的靶向重组和/或替代和/或改变的方法的某些实施方案中,通过与外源“供体”核苷酸序列的同源重组来改变染色体序列。如果存在与断裂区域同源的序列,细胞染色质中双链断裂的存在会刺激这种同源重组。
在本文描述的任何方法中,第一核苷酸序列(“供体序列”)可包含与目的区域中的基因组序列同源但不相同的序列,从而刺激同源重组以在目的区域中***不同序列。因此,在某些实施方案中,与目的区域中的序列同源的供体序列的部分相对于被替代的基因组序列展现出约80%至99%(或其之间的任何整数)的序列同一性。在其他实施方案中,供体与基因组序列之间的同源性高于99%,例如,如果超过100个连续碱基对的供体和基因组序列之间只有1个核苷酸不同。在某些情况下,供体序列的非同源部分可以包含在目的区域中不存在的序列,从而将新序列引入目的区域中。在这些情形中,通常非同源序列的侧接有与目的区域中的序列同源或相同的50-1,000个碱基对(或其间的任何整数值)或大于1,000的任意数量的碱基对的序列。在其他实施方案中,供体序列与第一序列非同源,并通过非同源重组机制***基因组中。
本文所述的任何方法可以用于通过靶向整合供体序列或经由对所述一个或多个靶序列的切割、接着进行易错NHEJ介导的修复(其破坏一个或多个目的基因的表达)而使细胞中的一个或多个靶序列部分或完全失活。还提供了具有部分或完全失活的基因的细胞系。
此外,本文描述的靶向整合的方法也可用于整合一种或多种外源序列。外源核酸序列可以包含例如一种或多种基因或cDNA分子、或任何类型的编码或非编码序列、以及一种或多种控制元件(例如启动子)。另外,外源核酸序列可产生一种或多种RNA分子(例如,小发夹RNA(shRNA)、抑制性RNA(RNAi)、微小RNA(miRNA)等)。
“切割”是指DNA分子的共价骨架的断裂。切割可以通过多种方法引发,所述方法包括但不限于磷酸二酯键的酶促或化学水解。单链切割和双链切割都是可能的,并且作为两个不同的单链切割事件的结果,可发生双链切割。DNA切割可以导致钝端或交错端的产生。在某些实施方案中,将融合多肽用于靶向双链DNA切割。
“切割半结构域”是与第二多肽(相同或不同)连接形成具有切割活性(优选地双链切割活性)的复合物的多肽序列。术语“第一和第二切割半结构域”、“+和-切割半结构域”和“左和右切割半结构域”可互换使用,以指二聚化的切割半结构域对。术语“切割结构域”可与术语“切割半结构域”互换使用。术语“FokI切割结构域”包括如SEQ ID NO:2所示的FokI序列以及任何FokI同源物。
“工程化切割半结构域”是已经被修饰以便与另一个切割半结构域(例如,另一个工程化切割半结构域)形成专性异二聚体的切割半结构域。
术语“序列”是指任何长度的核苷酸序列,其可以是DNA或RNA;可以是线性、环状或分支的,并且可以是单链或双链的。术语“转基因”是指被***基因组中的核苷酸序列。转基因可以具有任何长度,例如长度在2与100,000,000个核苷酸之间(或其之间或高于其的任何整数值),优选地长度在约100与100,000个核苷酸之间(或其之间的任何整数),更优选地长度在约2000与20,000个核苷酸之间(或其之间的任何值),以及甚至更优选地长度在约5与15kb之间(或其之间的任何值)。
“染色体”是包含细胞基因组的全部或一部分的染色质复合物。细胞的基因组通常以其核型为特征,所述核型是包含所述细胞基因组的所有染色体的集合。细胞的基因组可以包含一条或多条染色体。
“附加体”是复制型核酸,核蛋白复合物或包含不属于细胞染色体核型的一部分的核酸的其他结构。附加体的例子包括质粒、微环和某些病毒基因组。本文所述的肝特异性构建体可以以附加体形式维持,或可替代地,可以被稳定地整合到细胞中。
“外源”分子是正常地在细胞中不存在,但可以通过一种或多种遗传、生物化学或其他方法引入细胞中的分子。“在细胞中正常存在”是关于细胞的特定发育阶段和环境条件来确定。因此,例如,仅在肌肉的胚胎发育期间存在的分子是关于成体肌肉细胞的外源分子。类似地,通过热休克引入的分子是关于非热休克细胞的外源分子。外源分子可以包含例如功能失常的内源分子的功能形式或功能正常的内源分子的功能失常形式。
外源分子尤其可以是小分子,如通过组合化学工艺产生的小分子,或高分子,如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、上述分子的任何经修饰衍生物、或者包含一种或多种上述分子的任何复合物。核酸包括DNA和RNA,可以是单链或双链的;可以是线性、分支或环状的;并且可以是任何长度。核酸包括能够形成双螺旋的那些,以及形成三螺旋的核酸。参见,例如,美国专利号5,176,996和5,422,251。蛋白质包括但不限于DNA结合蛋白、转录因子、染色质重塑因子、甲基化的DNA结合蛋白、聚合酶、甲基化酶、脱甲基酶、乙酰基酯酶、脱乙酰酶、激酶、磷酸酶、连接酶、去泛素化酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶和解螺旋酶。
外源分子可以是与内源分子类型相同的分子,例如,外源蛋白质或核酸。例如,外源核酸可以包含引入细胞中的感染性病毒基因组、质粒或附加体,或正常地在细胞中不存在的染色体。将外源分子引入细胞中的方法是本领域技术人员已知的,并且包括但不限于脂质介导的转移(即,脂质体,包括中性和阳离子脂质)、电穿孔、直接注射、细胞融合、粒子轰击、磷酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。外源分子还可以是与内源分子类型相同,但源自与细胞来源不同物种的分子。例如,可将人核酸序列引入最初源自小鼠或仓鼠的细胞系中。将外源分子引入植物细胞中的方法对本领域技术人员而言是已知的,并且包括但不限于原生质体转化、碳化硅(例如WHISKERSTM)、土壤杆菌(Agrobacterium)介导的转化、脂质介导的转移(即,脂质体,包括中性和阳离子脂质)、电穿孔、直接注射、细胞融合、粒子轰击(例如,使用“基因枪”)、磷酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。
相比之下,“内源”分子是在特定发育阶段在特定环境条件下在特定细胞中正常存在的分子。例如,内源核酸可以包含染色体、线粒体、叶绿体或其他细胞器的基因组、或天然存在的游离型核酸。其他内源分子可以包括蛋白质,例如转录因子和酶。
如本文所用,术语“外源核酸的产物”包括多核苷酸和多肽产物两者,例如转录产物(多核苷酸诸如RNA)和翻译产物(多肽)。
“融合”分子是其中两个或更多个亚基分子被连接(优选地共价连接)的分子。亚基分子可以是相同化学类型的分子,或者可以是不同化学类型的分子。融合分子的例子包括但不限于融合蛋白(例如,在蛋白质DNA结合结构域与切割结构域(诸如ZFN或TALEN)之间的融合物)、与切割结构域操作性地缔合的多核苷酸DNA结合结构域(例如sgRNA)与融合核酸(例如,编码融合蛋白的核酸)之间的融合物。
融合分子在细胞中的表达可以源于将融合分子的组分递送至细胞或者是通过将编码融合分子的一种或多种组分的一种或多种多核苷酸递送至细胞而获得,其中必需的多核苷酸被转录并且转录物被翻译以产生融合分子。反式剪接、多肽切割和多肽连接也可以参与蛋白质在细胞中的表达。将多核苷酸和多肽递送至细胞的方法呈现于本公开文本中的其他地方。
出于本公开文本的目的,“基因”包括编码基因产物(参见下文)的DNA区域,以及所有调节基因产物的产生的DNA区域,不论此类调节序列是否与编码序列和/或所转录序列相邻。因此,基因包括但不必限于启动子序列、终止子、翻译调节序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附接位点和基因座控制区域。
“基因表达”是指将基因中所含的信息转化为基因产物。基因产物可以是基因的直接转录产物(例如,mRNA、tRNA、rRNA、反义RNA、核酶、结构RNA或任何其他类型的RNA)或通过mRNA翻译产生的蛋白质。基因产物还包括通过诸如加帽、多聚腺苷酸化、甲基化和编辑等方法修饰的RNA,以及通过例如甲基化、乙酰化、磷酸化、泛素化、ADP核糖基化、肉豆蔻酸化(myristilation)和糖基化修饰的蛋白质。
对基因表达的“调节”是指基因活性的变化。对表达的调节可以包括但不限于基因激活和基因阻遏。基因组编辑(例如,切割、改变、失活、随机突变)可以用于调节表达。基因失活是指如与不包括如本文所述的ZFP、TALE或CRISPR/Cas***的细胞相比,基因表达的任何减少。因此,基因失活可以是部分失活或完全失活。
“目的区域”是细胞染色质的任何区域,例如基因或者基因内或与基因相邻的非编码序列,其中可期望所述区域结合外源分子。结合可以用于靶向DNA切割和/或靶向重组的目的。例如,目的区域可以存在于染色体、附加体、细胞器基因组(例如,线粒体、叶绿体)或感染性病毒基因组中。目的区域可以位于基因的编码区内,位于经转录非编码区内(例如前导序列、尾随序列或内含子),或位于在编码区上游或下游的非转录区内。目的区域的长度可以小至单一核苷酸对或多达2,000个核苷酸对,或任何整数值的核苷酸对。
“安全港”基因座是基因组内的基因座,在其中可以***基因而对宿主细胞没有任何有害作用。最有益的是安全港基因座,其中所***的基因序列的表达不受邻近基因的任何通读表达的干扰。由一种或多种核酸酶靶向的安全港基因座的非限制性例子包括CCR5、HPRT、AAVS1、Rosa和白蛋白。参见例如,美国专利号7,951,925;8,771,985;8,110,379;7,951,925;美国公开号20100218264;20110265198;20130137104;20130122591;20130177983;20130177960;20150056705和20150159172。
“报告基因”或“报告序列”是指产生蛋白质产物的任何序列,所述蛋白质产物在常规测定中优选地但不一定易于测量。适宜报告基因包括但不限于编码介导抗生素抗性(例如,氨苄青霉素抗性、新霉素抗性、G418抗性、嘌呤霉素抗性)的蛋白质的序列、编码有色或荧光或发光蛋白(例如,绿色荧光蛋白、增强绿色荧光蛋白、红色荧光蛋白、萤光素酶)和介导增强的细胞生长和/或基因扩增的蛋白质(例如,二氢叶酸还原酶)的序列。表位标签包括例如一个或多个拷贝的FLAG、His、myc、Tap、HA或任何可检测的氨基酸序列。“表达标签”包括编码报告基因的序列,其可与所需基因序列可操作地连接以监测目的基因的表达。
“WPRE”序列是源自土拨鼠肝炎病毒的土拨鼠肝炎转录后调节元件。WPRE是一个600bp长的含有以给定顺序排列的γ、α和β元件的三部分元件(Donello等人(1992)J Virol72:5085-5092),并且有助于转基因在AAV***中的强表达(Loeb等人(1999)Hum Gene Ther10:2295-2305)。它还增强缺乏内含子的转基因的表达。在其自然形式中,WPRE含有WHV-X蛋白的部分开放阅读框(ORF)。在其他病毒元件像WHV(We2)增强子的情境下完全表达的WHV-X蛋白已与土拨鼠和小鼠中较高的肝癌风险相关(Hohne等人(1990)EMBO J 9(4):1137-45;Flajolet等人(1998)J Virol 72(7):6175-80)。WHV-X蛋白显现出不是直接致癌的,但一些研究表明,在某些情况下,它可以用作弱辅因子以产生与嗜肝病毒(hepadnavirus)(对于人为乙型肝炎病毒;对于土拨鼠为土拨鼠肝炎病毒)感染相关的肝癌。很多时候,提到“野生型”WPRE是指在其3’区域中含有WHV X蛋白开放阅读框(ORF)的一部分的591bp序列(GenBank登录号J02442中的核苷酸1094-1684)。在此元件中,WHV-X在位置1502处存在初始ATG起始密码子,并在位置1488处存在带有序列GCTGA的启动子区域。在Zanta-Boussif(同上)中,披露了一种mut6WPRE序列,其中在位置1488处的启动子序列被修饰为ATCAT,并且在位置1502处的起始密码子被修饰为TTG,从而有效地抑制WHV-X的表达。在J04514.1WPRE变体中,ATG WHV X起始位点是位置1504,并且可以在此J04514.1株系中制备mut6型变体。另一个WPRE变体是仅包含来自野生型WPRE的最小γ和α元件的247bp的WPRE3变体(Choi等人(2014)Mol Brain 7:17),其缺乏WHV X序列。
“真核”细胞包括但不限于真菌细胞(诸如酵母)、植物细胞、动物细胞、哺乳动物细胞和人细胞(例如,T细胞),包括干细胞(多潜能和多能)。
关于两个或更多个组分(诸如序列元件)的并列,术语“操作性连接”和“操作性地连接”(或“可操作地连接”)可互换使用,其中所述组分经排列使得两个组分正常发挥功能并允许以下可能性:至少一个所述组分可以介导对至少一个其他组分发挥的功能。通过说明,如果转录调节序列响应一种或多种转录调节因子的存在或不存在控制编码序列的转录水平,那么转录调节序列(诸如启动子)与编码序列操作性地连接。转录调节序列通常与编码序列顺式操作性地连接,但无需与其直接相邻。例如,增强子是与编码序列操作性地连接的转录调节序列,即使其不邻接。
蛋白质、多肽或核酸的“功能性片段”是蛋白质、多肽或核酸,其序列与全长蛋白质、多肽或核酸不同,但保留与全长蛋白质、多肽或核酸相同的功能。功能性片段可以具有与相应的天然分子相比较多、较少或相同的残基数,和/或可以含有一个或多个氨基酸或核苷酸取代。确定核酸或蛋白质功能(例如,编码功能、与另一核酸杂交的能力、酶促活性测定)的方法是本领域所熟知的。
多肽“载体”或“构建体”能将基因序列转移至靶细胞。典型地,“载体构建体”、“表达载体”、“表达构建体”、“表达盒”和“基因转移载体”意指能引导目的基因表达并且可以将基因序列转移至靶细胞的任何核酸构建体。因此,所述术语包括克隆和表达媒介物,以及整合载体。
术语“受试者”和“患者”可互换使用,并且是指哺乳动物(诸如人患者和非人灵长类动物),以及实验动物(诸如兔、狗、猫、大鼠、小鼠和其他动物)。因此,如本文所用的术语“受试者”或“患者”意指可以向其给予本发明表达盒的任何哺乳动物患者或受试者。本发明的受试者包括患有障碍的那些。
如本文所用,术语“治疗”(“treating”和“treatment”)是指减轻症状的严重性和/或频率,消除症状和/或根本原因,预防症状和/或其根本原因的发生,以及损害的改善或补救。癌症、单基因疾病和移植物抗宿主疾病是可以使用本文描述的组合物和方法治疗的病症的非限制性例子。
“染色质”是包含细胞基因组的核蛋白结构。细胞染色质包含核酸(主要是DNA)和蛋白质(包含组蛋白和非组蛋白染色体蛋白)。大多数的真核细胞染色质以核小体的形式存在,其中核小体核心包含约150个碱基对的DNA,所述DNA与八聚体相缔合,所述八聚体包含组蛋白H2A、H2B、H3和H4各两个,并且接头DNA(长度可变,取决于生物体)在核小体核心之间延伸。组蛋白H1分子通常与接头DNA相缔合。出于本公开文本的目的,术语“染色质”意为涵盖原核和真核的所有类型的细胞核蛋白。细胞染色质包含染色体和游离型染色质。
“可及区域”是细胞染色质中的位点,其中在核酸中存在的靶位点可以被识别靶位点的外源分子结合。不希望受任何特定理论的束缚,据信可及区域是未被包装到核小体结构中的一个区域。可及区域的独特结构通常可以通过其对化学和酶探针(例如核酸酶)的敏感性来检测。
“靶位点”或“靶序列”是定义核酸的一部分的核酸序列,结合分子将与所述部分结合,前提是存在用于结合的充分条件。例如,序列5’-GAATTC-3’是Eco RI限制性核酸内切酶的靶位点。“预期”或“中靶”序列是结合分子预期结合的序列,“非预期”或“脱靶”序列包括被非预期靶标的结合分子结合的任何序列。
DNA结合分子/结构域
本文描述了包含与任何目的基因或基因座中的靶位点特异性地结合的DNA结合分子/结构域的组合物。任何DNA结合分子/结构域均可用于本文公开的组合物和方法中,所述DNA结合分子/结构域包括但不限于锌指DNA结合结构域、TALE DNA结合结构域、CRISPR/Cas核酸酶的DNA结合部分(指导或sgRNA)、或来自大范围核酸酶的DNA结合结构域。
在某些实施方案中,DNA结合结构域包含锌指蛋白。优选地,锌指蛋白是非天然存在的,其被工程化为结合所选的靶位点。参见例如,Beerli等人(2002)NatureBiotechnol.20:135-141;Pabo等人(2001)Ann.Rev.Biochem.70:313-340;Isalan等人(2001)Nature Biotechnol.19:656-660;Segal等人(2001)Curr.Opin.Biotechnol.12:632-637;Choo等人(2000)Curr.Opin.Struct.Biol.10:411-416;美国专利号6,453,242;6,534,261;6,599,692;6,503,717;6,689,558;7,030,215;6,794,136;7,067,317;7,262,054;7,070,934;7,361,635;7,253,273;以及美国专利公开号2005/0064474;2007/0218528;2005/0267061,将全部文献都通过引用以其整体并入本文。在某些实施方案中,DNA结合结构域包含美国专利公开号2012/0060230(例如,表1)中披露的锌指蛋白,将所述专利通过引用以其整体并入本文。
与天然存在的锌指蛋白相比,工程化的锌指结合结构域可以具有新颖的结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理设计包括例如使用数据库,所述数据库包含三联体(或四联体)核苷酸序列和个别锌指氨基酸序列,其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的锌指的一个或多个氨基酸序列缔合。参见例如,美国专利号6,453,242和6,534,261,将其通过引用以其整体并入本文。
包括噬菌体展示和双杂交***的示例性选择方法披露于以下文献中:美国专利5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;和6,242,568;以及WO 98/37186;WO 98/53057;WO 00/27878;WO 01/88197和GB 2,338,237。另外,例如在美国专利号6,794,136中已经描述了对锌指结合结构域的结合特异性的增强。
另外,如这些和其他参考文献中所披露,锌指结构域和/或多指锌指蛋白可使用任何适宜的接头序列(包括例如,长度为5个或更多个氨基酸的接头)连接在一起。对于长度为6个或更多个氨基酸的示例性接头序列,还参见美国专利号6,479,626;6,903,185;和7,153,949。本文描述的蛋白质可包括蛋白质的个别锌指之间的适宜接头的任一组合。另外,例如在美国专利号6,794,136中已经描述了对锌指结合结构域的结合特异性的增强。
靶位点的选择;用于设计和构建融合分子(和编码所述融合分子的多核苷酸)的ZFP和方法是本领域技术人员已知的并且详细描述于以下文献中:美国专利号6,140,081;5,789,538;6,453,242;6,534,261;5,925,523;6,007,988;6,013,453;6,200,759;WO 95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970;WO 01/88197;WO 02/099084;WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496。
另外,如这些和其他参考文献中所披露,锌指结构域和/或多指锌指蛋白可使用任何适宜的接头序列(包括例如,长度为5个或更多个氨基酸的接头)连接在一起。对于长度为6个或更多个氨基酸的示例性接头序列,还参见美国专利号6,479,626;6,903,185;和7,153,949。本文描述的蛋白质可包括蛋白质的个别锌指之间的适宜接头的任一组合。
通常,ZFP包含至少三个指状物。某些ZFP包含四个、五个或六个指状物。包括三个指状物的ZFP典型地识别包括9或10个核苷酸的靶位点;包括四个指状物的ZFP典型地识别包括12至14个核苷酸的靶位点;而具有六个指状物的ZFP可以识别包括18至21个核苷酸的靶位点。ZFP还可以是融合蛋白,其包括一个或多个调节结构域,所述结构域可以是转录激活或阻遏结构域。
在一些实施方案中,DNA结合结构域可能源自核酸酶。例如,归巢核酸内切酶和大范围核酸酶如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII的识别序列是已知的。还参见美国专利号5,420,032;美国专利号6,833,252;Belfort等人(1997)Nucleic Acids Res.25:3379-3388;Dujon等人(1989)Gene82:115-118;Perler等人(1994)Nucleic Acids Res.22,1125-1127;Jasin(1996)Trends Genet.12:224-228;Gimble等人(1996)J.Mol.Biol.263:163-180;Argast等人(1998)J.Mol.Biol.280:345-353以及New England Biolabs目录。另外,可以对归巢核酸内切酶和大范围核酸酶的DNA结合特异性进行工程化以结合非天然靶位点。参见例如,Chevalier等人(2002)Molec.Cell 10:895-905;Epinat等人(2003)NucleicAcids Res.31:2952-2962;Ashworth等人(2006)Nature 441:656-659;Paques等人(2007)Current Gene Therapy 7:49-66;美国专利公开号20070117128。
在某些实施方案中,如本文所述的锌指蛋白(例如,在具有野生型或突变切割结构域的融合分子中使用的)包含骨架区域(例如,编号为-1至6的7氨基酸识别螺旋区域之外的区域)(例如在位置-14、-9和/或-5中的一个或多个位置处)的一个或多个突变(取代、缺失和/或***)(参见例如图5A)。在一个或多个这些位置处的野生型残基可以是缺失的,被任何氨基酸残基替代和/或包括一个或多个另外的残基。在一些实施方案中,在位置-5处的Arg(R)被改变为Tyr(Y)、Asp(N)、Glu(E)、Leu(L)、Gln(Q)或Ala(A)。在其他实施方案中,在位置(-9)处的Arg(R)被Ser(S)、Asp(N)或Glu(E)替代。在另外的实施方案中,在位置(-14)处的Arg(R)被Ser(S)或Gln(Q)替代。在其他实施方案中,所述融合多肽可以包含在锌指DNA结合结构域中的突变,其中在(-5)、(-9)和/或(-14)位置处的氨基酸被改变为以任何组合的任何上文所列氨基酸。
在某些实施方案中,ZFN包含第一和第二(左和右)ZFN,如任何所附的表或图中所描述。在某些实施方案中,第一ZFN包含命名为71557的ZFN,并且第二ZFN包含命名为71728的ZFN。在某些实施方案中,命名为71557的ZFN被携带在AAV载体(例如包含如表4所示序列和/或如SEQ ID NO:43所示序列的AAV载体)上。在其他实施方案中,命名为71728的ZFN被携带在AAV载体(例如包含如表5和/或SEQ ID NO:56所示序列的AAV载体)上。
在其他实施方案中,DNA结合结构域包含来自转录激活因子样(TAL)效应子(TALE)的工程化结构域,其类似于源自植物病原体黄单胞菌属(Xanthomonas)(参见Boch等人(2009)Science 326:1509-1512,以及Moscou和Bogdanove,(2009)Science 326:1501)和罗尔斯通氏菌属(Ralstonia)(参见Heuer等人(2007)Applied and EnvironmentalMicrobiology73(13):4379-4384;美国专利公开号20110301073和20110145940)的工程化结构域。已知黄单胞菌属(Xanthomonas)的植物病原性细菌会在重要的作物植物中引起许多种疾病。黄单胞菌属的致病性取决于保守的III型分泌(T3S)***,其将多于25种不同的效应蛋白注入植物细胞中。所注入的这些蛋白质包括有转录激活因子样效应子(TALE),其模拟植物转录激活因子并操纵植物转录组(参见Kay等人(2007)Science 318:648-651)。这些蛋白质含有DNA结合结构域和转录激活结构域。最具特色的TALE之一是来自野油菜黄单胞菌(Xanthomonas campestgris pv.Vesicatoria)的AvrBs3(参见Bonas等人(1989)MolGen Genet 218:127-136和WO 2010079430)。TALE含有串联重复序列的中心化结构域,每个重复序列含有约34个氨基酸,所述重复序列是这些蛋白质的DNA结合特异性的关键。另外,其含有核定位序列和酸性转录激活结构域(综述参见Schornack S等人(2006)J PlantPhysiol 163(3):256-272)。另外,在植物致病性细菌青枯雷尔氏菌(Ralstoniasolanacearum)中,已经发现在青枯雷尔氏菌生物变型1菌株GMI1000和生物变型4菌株RS1000中,名为brg11和hpx17的两种基因与黄单胞菌属的AvrBs3家族是同源的(参见Heuer等人(2007)Appl and Envir Micro 73(13):4379-4384)。这些基因的核苷酸序列彼此98.9%一致,但不同之处在于hpx17的重复结构域中1,575个碱基对的缺失。然而,两种基因产物与黄单胞菌属的AvrBs3家族蛋白具有小于40%序列同一性。
这些TAL效应因子的特异性取决于在串联重复序列中发现的序列。重复序列包含约102个碱基对,并且这些重复序列典型地彼此91%-100%同源(Bonas等人,同上)。重复序列的多态性通常位于位置12和13处,并且在位置12和13的高变双残基(重复可变双残基或RVD区域)的身份与TAL效应子的靶序列中连续核苷酸的身份之间显现存在一一对应关系(参见Moscou和Bogdanove(2009)Science 326:1501,以及Boch等人(2009)Science 326:1509-1512)。在实验中,已经确定这些TAL效应因子的DNA识别天然代码,使得位置12和13的HD序列(重复可变双残基或RVD)导致与胞嘧啶(C)结合,NG与T结合,NI与A、C、G或T结合,NN与A或G结合,并且ING与T结合。这些DNA结合重复序列已经与新组合和数目的重复序列装配为蛋白质,以制造能与新序列相互作用的人工转录因子,并激活非内源报告基因在植物细胞中的表达(Boch等人,同上)。工程化TAL蛋白已与FokI切割半结构域相连,以产生TAL效应因子结构域核酸酶融合物(TALEN),包括带有非典型RVD的TALEN。参见例如,美国专利号8,586,526。
在一些实施方案中,TALEN包含核酸内切酶(例如FokI)切割结构域或切割半结构域。在其他实施方案中,TALE-核酸酶是大范围TAL。这些大范围TAL核酸酶是包含TALE DNA结合结构域和大范围核酸酶切割结构域的融合蛋白。大范围核酸酶切割结构域作为单体具有活性,并且其活性不需要二聚化。(参见Boissel等人,(2013)Nucl Acid Res:1-13,doi:10.1093/nar/gkt1224)。
在更进一步的实施方案中,核酸酶包含紧凑TALEN。这些是将TALE DNA结合结构域与TevI核酸酶结构域连接的单链融合蛋白。融合蛋白可以用作通过TALE区域定位的切口酶,或者可以产生双链断裂,取决于TALE DNA结合结构域关于TevI核酸酶结构域定位的位置(参见Beurdeley等人(2013)Nat Comm:1-8DOI:10.1038/ncomms2782)。另外,核酸酶结构域还可展现DNA结合功能性。任何TALEN可与另外的TALEN(例如,具有一个或多个大范围TALE的一个或多个TALEN(cTALEN或FokI-TALEN))组合使用。
另外,如这些和其他参考文献中所披露,锌指结构域和/或多指锌指蛋白或TALE可使用任何适宜的接头序列(包括例如,长度为5个或更多个氨基酸的接头)连接在一起。对于长度为6个或更多个氨基酸的示例性接头序列,还参见美国专利号6,479,626;6,903,185;和7,153,949。本文描述的蛋白质可包括蛋白质的个别锌指之间的适宜接头的任一组合。此外,增强针对锌指结合结构域的结合特异性已在例如美国专利号6,794,136中进行了描述。在某些实施方案中,DNA结合结构域是CRISPR/Cas核酸酶***的一部分,所述DNA结合结构域包括与DNA结合的单指导RNA(sgRNA)DNA结合分子。参见例如,美国专利号8,697,359和美国专利公开号20150056705和20150159172。CRISPR(成簇的规律间隔短回文重复序列)基因座(其编码***的RNA组分)和cas(CRISPR相关)基因座(其编码蛋白质)(Jansen等人,2002.Mol.Microbiol.43:1565-1575;Makarova等人,2002.Nucleic Acids Res.30:482-496;Makarova等人,2006.Biol.Direct 1:7;Haft等人,2005.PLoS Comput.Biol.1:e60)组成CRISPR/Cas核酸酶***的基因序列。微生物宿主中的CRISPR基因座含有CRISPR相关(Cas)基因以及能将CRISPR介导的核酸切割的特异性程序化的非编码RNA元件的组合。
在一些实施方案中,DNA结合结构域是TtAgo***的一部分(参见Swarts等人,同上;Sheng等人,同上)。在真核生物中,基因沉默是由蛋白质的Argonaute(Ago)家族介导的。在这个范例中,Ago与小(19-31nt)RNA结合。此蛋白质-RNA沉默复合物通过所述小RNA与靶标之间的Watson-Crick碱基配对来识别靶RNA,并且以核酸内切方式切割靶RNA(Vogel(2014)Science 344:972-973)。相比之下,原核Ago蛋白与小的单链DNA片段结合,并可能起检测和去除外来(通常是病毒)DNA的作用(Yuan等人(2005)Mol.Cell 19,405;Olovnikov等人(2013)Mol.Cell 51,594;Swarts等人,同上)。示例性的原核Ago蛋白包括来自风产液菌(Aquifex aeolicus)、类球红细菌(Rhodobacter sphaeroides)、和嗜热栖热菌(Thermusthermophilus)的那些。
最充分表征的原核Ago蛋白之一是来自嗜热栖热菌(T.thermophilus)的蛋白(TtAgo;Swarts等人,同上)。TtAgo与带有5’磷酸基团的15nt或13-25nt单链DNA片段缔合。TtAgo结合的这种“指导DNA”用于引导蛋白质-DNA复合物结合第三方DNA分子中的Watson-Crick互补DNA序列。一旦这些指导DNA中的序列信息允许鉴定靶DNA,TtAgo-指导DNA复合物就会切割靶DNA。TtAgo-指导DNA复合物与其靶DNA结合时的结构也支持这种机制(G.Sheng等人,同上)。来自类球红细菌(RsAgo)的Ago具有相似的特性(Olivnikov等人,同上)。
可以将任意DNA序列的外源指导DNA加载到TtAgo蛋白上(Swarts等人,同上)。由于TtAgo切割的特异性是由指导DNA引导的,因此,由外源的由研究者指定的指导DNA形成的TtAgo-DNA复合物将TtAgo靶DNA切割引导至互补的由研究者指定的靶DNA。以此方式,可以在DNA中产生靶向双链断裂。使用TtAgo-指导DNA***(或来自其他生物的直系同源Ago-指导DNA***)允许在细胞内靶向切割基因组DNA。这种切割可以是单链的或双链的。为了切割哺乳动物基因组DNA,优选使用为在哺乳动物细胞中表达而优化的TtAgo密码子形式。另外,可能优选的是用体外形成的TtAgo-DNA复合物处理细胞,其中TtAgo蛋白与细胞穿透肽融合。另外,可能优选的是使用已经通过诱变改变以使其在37℃时具有改进活性的TtAgo蛋白形式。使用本领域中利用DNA断裂的标准技术,可以使用Ago-RNA介导的DNA切割来影响结果的全景图(包括基因敲除、靶向基因添加、基因校正、靶向基因缺失)。
因此,可以使用任何DNA结合分子/结构域。
融合分子
还提供了包含如本文描述的DNA结合结构域(例如,ZFP或TALE、CRISPR/Cas组分(例如单指导RNA))和异源调节(功能)结构域(或其功能片段)的融合分子。常见结构域包括,例如转录因子结构域(激活因子、阻遏物、共激活因子、共阻遏物)、沉默子、癌基因(例如,myc、jun、fos、myb、max、mad、rel、ets、bcl、myb、mos家族成员等);DNA修复酶和其相关因子和修饰剂;DNA重排酶和其相关因子和修饰剂;染色质相关蛋白和其修饰剂(例如激酶、乙酰基酯酶和脱乙酰酶);和DNA修饰酶(例如,甲基转移酶、拓扑异构酶、解螺旋酶、连接酶、激酶、磷酸酶、聚合酶、核酸内切酶)和其相关因子和修饰剂。美国专利公开号20050064474;20060188987和2007/0218528有关于DNA结合结构域和核酸酶切割结构域的融合的细节,将这些专利通过引用以其整体并入本文。
实现激活的合适结构域包括HSV VP16激活结构域(参见例如,Hagmann等人,J.Virol.71,5952-5962(1997))核激素受体(参见例如,Torchia等人,Curr.Opin.Cell.Biol.10:373-383(1998));核因子κB的p65亚单位(Bitko和Barik,J.Virol.72:5610-5618(1998)以及Doyle和Hunt,Neuroreport 8:2937-2942(1997));Liu等人,Cancer Gene Ther.5:3-28(1998))或人工嵌合功能结构域,诸如VP64(Beerli等人,(1998)Proc.Natl.Acad.Sci.USA 95:14623-33)和降解决定子(degron)(Molinari等人,(1999)EMBO J.18,6439-6447)。其他示例性激活结构域包括Oct 1、Oct-2A、Sp1、AP-2和CTF1(Seipel等人,EMBO J.11,4961-4968(1992))以及p300、CBP、PCAF、SRC1 PvALF、AtHD2A和ERF-2。参见例如,Robyr等人(2000)Mol.Endocrinol.14:329-347;Collingwood等人(1999)J.Mol.Endocrinol.23:255-275;Leo等人(2000)Gene 245:1-11;Manteuffel-Cymborowska(1999)Acta Biochim.Pol.46:77-89;McKenna等人(1999)J.SteroidBiochem.Mol.Biol.69:3-12;Malik等人(2000)Trends Biochem.Sci.25:277-283;以及Lemon等人(1999)Curr.Opin.Genet.Dev.9:499-504。其他示例性激活结构域包括但不限于OsGAI、HALF-1、C1、AP1、ARF-5、ARF-6、ARF-7和ARF-8、CPRF1、CPRF4、MYC-RP/GP和TRAB1。参见例如,Ogawa等人(2000)Gene 245:21-29;Okanami等人(1996)Genes Cells 1:87-99;Goff等人(1991)Genes Dev.5:298-309;Cho等人(1999)Plant Mol.Biol.40:419-429;Ulmason等人(1999)Proc.Natl.Acad.Sci.USA96:5844-5849;Sprenger-Haussels等人(2000)Plant J.22:1-8;Gong等人(1999)Plant Mol.Biol.41:33-44;以及Hobo等人(1999)Proc.Natl.Acad.Sci.USA96:15,348-15,353。
本领域技术人员将清楚,在DNA结合结构域与功能结构域之间形成融合分子(或编码所述融合分子的核酸)时,激活结构域或与激活结构域相互作用的分子都适合作为功能结构域。本质上能够将激活复合物和/或激活活性(例如,组蛋白乙酰化)募集到靶基因的任何分子都可用作融合蛋白的激活结构域。例如在美国专利公开2002/0115215和2003/0082552以及在WO 02/44376中描述了适用于融合分子中的功能结构域的绝缘子结构域、定位结构域、和染色质重塑蛋白,例如含ISWI的结构域和/或甲基结合结构域蛋白。
示例性阻遏结构域包括但不限于KRAB A/B、KOX、TGF-β诱导型早期基因(TIEG)、v-erbA、SID、MBD2、MBD3、DNMT家族的成员(例如,DNMT1、DNMT3A、DNMT3B)、Rb和MeCP2。参见例如,Bird等人(1999)Cell 99:451-454;Tyler等人(1999)Cell 99:443-446;Knoepfler等人(1999)Cell99:447-450;以及Robertson等人(2000)Nature Genet.25:338-342。其他示例性阻遏结构域包括但不限于ROM2和AtHD2A。参见例如,Chem等人(1996)Plant Cell 8:305-321;以及Wu等人(2000)Plant J.22:19-27。
融合分子是通过克隆和生化缀合方法来构建的,所述方法是本领域技术人员所熟知的。融合分子包含DNA结合结构域和功能结构域(例如,转录激活或阻遏结构域)。融合分子还任选地包含核定位信号(例如,来自SV40中型T抗原)和表位标签(例如,FLAG和血凝素)。融合分子(和编码所述融合分子的核酸)被设计为使得在融合物的组分之间保存翻译阅读框。
一方面功能结构域(或其功能性片段)的多肽组分与另一方面非蛋白质DNA结合结构域(例如,抗生素、嵌入剂、小沟结合物、核酸)之间的融合物是通过本领域技术人员已知的生化缀合方法来构建。参见例如,Pierce Chemical Company(Rockford,IL)目录。已经描述用于制造小沟结合物与多肽之间的融合物的方法和组合物。Mapp等人(2000)Proc.Natl.Acad.Sci.USA 97:3930-3935。此外,CRISPR/Cas***的单指导RNA与功能结构域缔合形成活性转录调节因子和核酸酶。
在某些实施方案中,靶位点存在于细胞染色质的可及区域。可以按照例如在美国专利号7,217,509和7,923,542中描述的那样确定可及区域。如果在细胞染色质的可及区域中不存在靶位点,则可以产生一个或多个可及区域,如美国专利号7,785,792和8,071,370中所述。在另外的实施方案中,融合分子的DNA结合结构域不论其靶位点是否在可及区域中都能够结合细胞染色质。例如,此类DNA结合结构域能够与接头DNA和/或核小体DNA结合。在某些类固醇受体和肝细胞核因子3(HNF3)中发现了这种类型的“先驱”DNA结合结构域的例子(Cordingley等人(1987)Cell 48:261-270;Pina等人(1990)Cell 60:719-731;以及Cirillo等人(1998)EMBO J.17:244-254)。如本文所述的融合分子(例如人工核酸酶)的靶位点长度可以是9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个或更多个连续或非连续的碱基对。
融合分子可以用药学上可接受的载体来配制,如本领域技术人员已知。参见例如,Remington’s Pharmaceutical Sciences,第17版,1985;以及美国专利号6,453,242和6,534,261。
融合分子的功能性组分/结构域可以选自多种不同组分中的任一种,所述组分能在融合分子通过其DNA结合结构域与靶序列结合后影响基因转录。因此,功能性组分可以包括但不限于各种转录因子结构域,如激活因子、阻遏物、共激活因子、共阻遏物和沉默子。
另外的示例性功能结构域披露于例如美国专利号6,534,261和6,933,113。
也可以选择由外源小分子或配体调节的功能结构域。例如,可以使用
Figure BDA0002714495690000461
技术,其中功能结构域仅在外部RheoChemTM配体存在时才采取其活性构象(参见例如,US 20090136465)。因此,ZFP可以与可调节的功能结构域可操作地连接,其中ZFP-TF的所得活性由外部配体控制。
核酸酶
在某些实施方案中,融合分子包含DNA结合结构域和切割(核酸酶)结构域以形成人工核酸酶。因此,基因修饰可以使用核酸酶(例如工程化核酸酶)来实现。工程化核酸酶技术是基于天然存在的DNA结合蛋白的工程化。例如,已经描述了具有定制的DNA结合特异性的归巢核酸内切酶的工程化。Chames等人(2005)Nucleic Acids Res 33(20):e178;Arnould等人(2006)J.Mol.Biol.355:443-458。此外,还描述了ZFP的工程化。参见例如,美国专利号6,534,261;6,607,882;6,824,978;6,979,539;6,933,113;7,163,824;和7,013,219。
此外,ZFP和/或TALE已与核酸酶结构域融合形成ZFN和TALEN,这是功能实体,所述功能实体能够通过其工程化(ZFP或TALE)DNA结合结构域识别其预期核酸靶标,并导致DNA通过核酸酶活性在DNA结合位点附近被切割。参见例如,Kim等人(1996)Proc Nat’l AcadSci USA 93(3):1156-1160。最近,此类核酸酶已用于多种生物的基因组修饰。参见例如,美国专利公开20030232410;20050208489;20050026157;20050064474;20060188987;20060063231;和国际公开WO 07/014275。
因此,本文描述的方法和组合物是广泛适用的,并且可包括任何目的核酸酶。核酸酶的非限制性例子包括大范围核酸酶、TALEN和锌指核酸酶。核酸酶可包含异源DNA结合和切割结构域(例如,锌指核酸酶;大范围核酸酶DNA结合结构域和异源切割结构域),或者可替代地,天然存在的核酸酶的DNA结合结构域可发生改变以与所选靶位点结合(例如,已经工程化以与不同于同源结合位点的位点结合的大范围核酸酶)。
在某些实施方案中,ZFN包含第一和第二(左和右)ZFN,如任何所附的表或图中所描述。在某些实施方案中,第一ZFN包含命名为71557的ZFN,并且第二ZFN包含命名为71728的ZFN。在某些实施方案中,命名为71557的ZFN被携带在AAV载体(例如包含如表4所示序列和/或如SEQ ID NO:43所示序列的AAV载体)上。在其他实施方案中,命名为71728的ZFN被携带在AAV载体(例如包含如表5和/或SEQ ID NO:56所示序列的AAV载体)上。
在本文描述的任何核酸酶中,所述核酸酶可以包含工程化TALE DNA结合结构域和核酸酶结构域(例如,核酸内切酶和/或大范围核酸酶结构域),也称为TALEN。工程化这些TALEN蛋白以与用户选择的靶序列进行稳健的、位点特异性的相互作用的方法和组合物已经公布(参见美国专利号8,586,526)。在一些实施方案中,TALEN包含核酸内切酶(例如FokI)切割结构域或切割半结构域。在其他实施方案中,TALE-核酸酶是大范围TAL。这些大范围TAL核酸酶是包含TALE DNA结合结构域和大范围核酸酶切割结构域的融合蛋白。大范围核酸酶切割结构域作为单体具有活性,并且其活性不需要二聚化。(参见Boissel等人,(2013)Nucl Acid Res:1-13,doi:10.1093/nar/gkt1224)。另外,核酸酶结构域还可展现DNA结合功能性。
在更进一步的实施方案中,核酸酶包含紧凑TALEN(cTALEN)。这些是将TALE DNA结合结构域与TevI核酸酶结构域连接的单链融合蛋白。融合蛋白可以用作通过TALE区域定位的切口酶,或者可以产生双链断裂,取决于TALE DNA结合结构域关于TevI核酸酶结构域定位的位置(参见Beurdeley等人(2013)Nat Comm:1-8DOI:10.1038/ncomms2782)。任何TALEN可与另外的TALEN(例如,具有一个或多个大范围TAL的一个或多个TALEN(cTALEN或FokI-TALEN))或其他DNA切割酶组合使用。
在某些实施方案中,核酸酶包含展现切割活性的大范围核酸酶(归巢核酸内切酶)或其一部分。天然存在的大范围核酸酶识别15-40个碱基对的切割位点,并且通常分为四个家族:LAGLIDADG家族(如SEQ ID NO:70所公开的“LAGLIDADG”)、GIY-YIG家族、His-Cys盒家族和HNH家族。示例性归巢核酸内切酶包括I-SceI、I-CeuI、PI-PspI、I-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。上述示例性归巢核酸内切酶的识别序列是已知的。还参见美国专利号5,420,032;美国专利号6,833,252;Belfort等人(1997)Nucleic Acids Res.25:3379-3388;Dujon等人(1989)Gene 82:115-118;Perler等人(1994)Nucleic Acids Res.22,1125-1127;Jasin(1996)TrendsGenet.12:224-228;Gimble等人(1996)J.Mol.Biol.263:163-180;Argast等人(1998)J.Mol.Biol.280:345-353以及New England Biolabs目录。
来自天然存在的大范围核酸酶(主要来自LAGLIDADG家族(公开为SEQ ID NO:70的“LAGLIDADG”))的DNA结合结构域已经被用于促进植物、酵母、果蝇(Drosophila)、哺乳动物细胞和小鼠中的位点特异性基因组修饰,但是这种方法被限制于修饰保存大范围核酸酶识别序列的同源基因(Monet等人(1999),Biochem.Biophysics.Res.Common.255:88-93)或被限制于已向其中引入识别序列的预工程化基因组(Route等人(1994),Mol.Cell.Biol.14:8096-106;Chilton等人(2003),Plant Physiology.133:956-65;Puchta等人(1996),Proc.Natl.Acad.Sci.USA 93:5055-60;Rong等人(2002),Genes Dev.16:1568-81;Gouble等人(2006),J.Gene Med.8(5):616-622)。因此,已经进行尝试将大范围核酸酶工程化以在医学或生物技术相关位点展现出新的结合特异性(Porteus等人(2005),Nat.Biotechnol.23:967-73;Sussman等人(2004),J.Mol.Biol.342:31-41;Epinat等人(2003),Nucleic Acids Res.31:2952-62;Chevalier等人(2002)Molec.Cell 10:895-905;Epinat等人(2003)Nucleic Acids Res.31:2952-2962;Ashworth等人(2006)Nature 441:656-659;Paques等人(2007)Current Gene Therapy 7:49-66;美国专利公开号20070117128;20060206949;20060153826;20060078552;和20040002092)。另外,来自大范围核酸酶的天然存在的或工程化DNA结合结构域可与来自异源核酸酶(例如FokI)的切割结构域可操作地连接,和/或来自大范围核酸酶的切割结构域可与异源DNA结合结构域(例如ZFP或TALE)可操作地连接。
在其他实施方案中,核酸酶是锌指核酸酶(ZFN)或TALE DNA结合结构域-核酸酶融合蛋白(TALEN)。ZFN和TALEN包含DNA结合结构域(锌指蛋白或TALE DNA结合结构域),其已被工程化为可结合选择基因中的靶位点;以及切割结构域或切割半结构域(例如,来自本文描述的限制性核酸酶和/或大范围核酸酶)。
如上所述,锌指结合结构域和TALE DNA结合结构域可以被工程化为可结合选择的序列。参见例如,Beerli等人(2002)Nature Biotechnol.20:135-141;Pabo等人(2001)Ann.Rev.Biochem.70:313-340;Isalan等人(2001)Nature Biotechnol.19:656-660;Segal等人(2001)Curr.Opin.Biotechnol.12:632-637;Choo等人(2000)Curr.Opin.Struct.Biol.10:411-416。与天然存在的蛋白质相比,工程化的锌指结合结构域或TALE蛋白可以具有新颖的结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理设计包括例如使用数据库,所述数据库包含三联体(或四联体)核苷酸序列和个别锌指或TALE氨基酸序列,其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的锌指或TALE重复单元的一个或多个氨基酸序列缔合。参见例如,美国专利号6,453,242和6,534,261,将其通过引用以其整体并入本文。
选择靶位点;以及设计和构建融合分子(和编码所述融合分子的多核苷酸)的方法是本领域技术人员已知的,并且在美国专利号7,888,121和8,409,861中进行了详细描述,将所述专利通过引用以其整体并入本文。
另外,如这些和其他参考文献中所披露,锌指结构域、TALE和/或多指锌指蛋白可使用任何适宜的接头序列(包括例如,长度为5个或更多个氨基酸的接头)连接在一起。关于长度为6个或更多个氨基酸的示例性接头序列,参见例如,美国专利号6,479,626;6,903,185;和7,153,949。本文所述的蛋白质可以包括在蛋白质的单个锌指之间和/或在DNA结合结构域与核酸酶结构域之间的合适接头的任何组合。还参见美国专利号8,772,453和9,567,609。
因此,核酸酶例如ZFN、TALEN和/或大范围核酸酶可包含任何DNA结合结构域和任何核酸酶(切割)结构域(切割结构域,切割半结构域)。如上所述,切割结构域可以与DNA结合结构域异源,例如锌指或TAL效应因子DNA结合结构域和来自核酸酶的切割结构域、或大范围核酸酶DNA结合结构域和来自不同核酸酶的切割结构域。异源切割结构域可以从任何核酸内切酶或核酸外切酶获得。可以是切割结构域所来源的示例性核酸内切酶包括但不限于限制性核酸内切酶和归巢核酸内切酶。参见例如,2002-2003目录,New EnglandBiolabs,Beverly,MA;和Belfort等人(1997)Nucleic Acids Res.25:3379-3388。切割DNA的其他酶是已知的(例如S1核酸酶;绿豆核酸酶;胰腺DNase I;微球菌核酸酶;酵母HO核酸内切酶;还参见Linn等人(编辑)Nucleases,Cold Spring Harbor Laboratory Press,1993)。这些酶(或其功能片段)中的一种或多种可以用作切割结构域和切割半结构域的来源。
类似地,切割半结构域可以源自需要二聚化以获得切割活性的任何核酸酶或其部分,如上所述。通常,如果融合分子包含切割半结构域,那么切割需要两个融合分子。可替代地,可以使用包含两个切割半结构域的单一蛋白质。两个切割半结构域可以源自相同核酸内切酶(或其功能性片段),或者每个切割半结构域可以源自不同核酸内切酶(或其功能性片段)。另外,两个融合分子的靶位点优选地关于彼此来布置,使得两个融合分子与其各自的靶位点的结合将切割半结构域置于针对彼此的空间定向中,此允许切割半结构域例如通过二聚化形成功能性切割结构域。因此,在某些实施方案中,配对的靶位点的近边缘被5-10个核苷酸或15-18个核苷酸分隔开。但是,任何整数个核苷酸或核苷酸对(例如2至50个核苷酸对或更多)都可以***两个靶位点之间。通常,切割位点位于靶位点之间。
限制性核酸内切酶(限制酶)存在于许多物种中,并且能够与DNA(在识别位点)进行序列特异性结合,并能够在结合位点或结合位点附近切割DNA。某些限制酶(例如,IIS型)在远离识别位点的位点处切割DNA,并且具有可分离的结合结构域和切割结构域。例如,IIS型FokI酶催化DNA的双链切割,在一条链上距其识别位点9个核苷酸处,并且在另一条链上距其识别位点13个核苷酸处进行切割。参见例如,美国专利5,356,802;5,436,150和5,487,994;以及Li等人(1992)Proc.Natl.Acad.Sci.USA 89:4275-4279;Li等人(1993)Proc.Natl.Acad.Sci.USA 90:2764-2768;Kim等人(1994a)Proc.Natl.Acad.Sci.USA 91:883-887;Kim等人(1994b)J.Biol.Chem.269:31,978-31,982。因此,在一个实施方案中,融合分子包含来自至少一种IIS型限制酶的切割结构域(或切割半结构域)和一个或多个锌指结合结构域(其可以工程化或可以不经工程化)。
其切割结构域可与结合结构域分离的示例性IIS型限制酶是FokI。这种特殊的酶作为二聚体是有活性的。Bitinaite等人(1998)Proc.Natl.Acad.Sci.USA 95:10,570-10,575。因此,出于本公开文本的目的,在公开的融合分子中使用的FokI酶的部分被认为是切割半结构域。因此,对于使用锌指-FokI融合物的靶向双链切割和/或靶向替代细胞序列,可以使用各自包含FokI切割半结构域的两个融合分子来重构有催化活性的切割结构域。可替代地,也可以使用包含锌指结合结构域和两个FokI切割半结构域的单一多肽分子。在本公开文本的其他地方提供了使用锌指-FokI融合物进行靶向切割和靶向序列改变的参数。
切割结构域或切割半结构域可以是蛋白质的任一部分,其保留切割活性,或者保留多聚化(例如,二聚化)以形成功能性切割结构域的能力。
示例性的IIS型限制酶描述于国际公开WO 07/014275(以其整体并入本文)中。另外的限制酶也包含可分离的结合结构域和切割结构域,并且本公开文本考虑了这些。参见例如,Roberts等人(2003)Nucleic Acids Res.31:418-420。
在某些实施方案中,切割结构域包含用于产生晶体结构1FOK.pdb和2FOK.pdb的FokI切割结构域(参见Wah等人(1997)Nature 388:97-100)。全长FokI的序列如下所示。在本文所述核酸酶中使用的切割结构域以斜体和下划线表示(全长蛋白的位置384至579),其中全蛋白序列描述如下(SEQ ID NO:2):
Figure BDA0002714495690000511
Figure BDA0002714495690000521
源自FokI的切割半结构域可以包含如SEQ ID NO:2所示的氨基酸残基中的一个或多个的突变。突变包括取代(野生型氨基酸残基取代为不同的残基)、***(一个或多个氨基酸残基的***)和/或缺失(一个或多个氨基酸残基的缺失)。在某些实施方案中,残基414-426、443-450、467-488、501-502和/或521-531(相对于SEQ ID NO:2编号的)中的一个或多个进行突变,因为这些残基位于Miller等人((2007)Nat Biotechnol 25:778-784)所述的ZFN的分子模型中,靠近与其靶位点结合的DNA骨架。FokI突变体的非限制性例子包括如本文美国专利公开号20180087072所述的一个或多个突变,包括但不限于在位置416、421、422、424、472、478、480、525或542处的一个或多个残基进行突变。在某些实施方案中,突变包括野生型残基被任何不同的残基取代,所述不同的残基是例如丙氨酸(A)残基、半胱氨酸(C)残基、天冬氨酸(D)残基、谷氨酸(E)残基、组氨酸(H)残基、苯丙氨酸(F)残基、甘氨酸(G)残基、天冬酰胺(N)残基、丝氨酸(S)残基或苏氨酸(T)残基。在其他实施方案中,在位置416、418、421、422、424、446、448、472、476、478、479、480、481、525和/或542中的一个或多个处的野生型残基被任何其他残基替代,所述其他残基包括但不限于R416D、R416E、S418E、S418D、R422H、S446D、K448A、N476D、P478S、I479Q、I479T、G480D、Q481A、Q481E、K525S、K525A、N527D、N542D、R416E+R422H、R416D+R422H、R416E+K448A、R416D+R422H、K448A+I479Q、K448A+Q481A、K448A+K525A、R416E、R416D、R416H、R416N、S418D、S418E、D421S、L424F、S446D、K448A、S472D、N476E、N476G、N476K、P478D、I479Q、I479T、G480D、Q481A、Q481C、Q481D、Q481S、Q481E、Q481H、K525A、K525C、K525AE、K525I、K525S、K525T、K525V、和/或N542D。
在某些实施方案中,所述切割结构域包含最小化或防止同二聚化的一个或多个工程化切割半结构域(也称为二聚化结构域突变体),例如如在美国专利号7,914,796;8,034,598和8,623,618;以及美国专利公开号20110201055所述,将所述专利全部的披露内容通过引用以其整体并入本文。在FokI的位置446、447、478、479、483、484、486、487、490、491、496、498、499、500、531、534、537、538和542(相对于SEQ ID NO:2进行编号)处的氨基酸残基都是影响FokI切割半结构域二聚化的靶标。突变可以包括在与FokI同源的天然限制性酶中发现的残基的突变。在优选实施方案中,在位置416、422、447、448、478、525和/或542(相对于SEQID NO:2进行编号)处的突变包括用不带电荷或带负电荷的氨基酸替代带正电荷的氨基酸。在另一个实施方案中,除了在一个或多个氨基酸残基416、422、447、448或525中的突变以外,工程化切割半结构域还包含在氨基酸残基499、496和486中的突变,所有氨基酸残基都相对于SEQ ID NO:2进行编号。
在某些实施方案中,本文所述的组合物包括FokI的工程化切割半结构域,其形成专性异二聚体,如例如在美国专利号7,914,796;8,034,598;8,961,281和8,623,618;美国专利公开号20080131962和20120040398中所描述的。因此,在一个优选实施方案中,本发明提供了融合分子,其中所述工程化切割半结构域包含多肽,其中除了在位置416、422、447、448或525(相对于SEQ ID NO:2进行编号)处的一个或多个突变以外,在位置486处的野生型Gln(Q)残基被Glu(E)残基替代,在位置499处的野生型Ile(I)残基被Leu(L)残基替代,在位置496处的野生型Asn(N)残基被Asp(D)或Glu(E)残基替代(“ELD”或“ELE”)。在另一个实施方案中,工程化切割半结构域源自野生型FokI切割半结构域,并且除了在氨基酸残基416、422、447、448或525处的一个或多个突变以外,还包含相对于野生型FokI(SEQ ID NO:2)进行编号的氨基酸残基490、538和537中的突变。在优选实施方案中,本发明提供了融合分子,其中所述工程化切割半结构域包含多肽,其中除了在位置416、422、447、448或525处的一个或多个突变以外,在位置490处的野生型Glu(E)残基被Lys(K)残基替代,在位置538处的野生型Ile(I)残基被Lys(K)残基替代,并且在位置537处的野生型His(H)残基被Lys(K)残基或Arg(R)残基替代(“KKK”或“KKR”)(参见U.S.8,962,281,将其通过引用并入本文)。参见例如,美国专利号7,914,796;8,034,598和8,623,618;出于所有目的,将所述专利的披露内容通过引用以其整体并入。在其他实施方案中,在位置542的野生型Asn(N)残基被Asp(D)残基替代,或者在位置478处的野生型Pro(P)残基被Ser(S)残基替代。在其他实施方案中,工程化切割半结构域包含“Sharkey”和/或“Sharkey”突变(参见Guo等人(2010)J.Mol.Biol.400(1):96-107)。
在另一个实施方案中,工程化切割半结构域源自野生型FokI切割半结构域,并且除了在氨基酸残基416、422、447、448或525处的一个或多个突变以外,还包含相对于野生型FokI或FokI同源物进行编号的氨基酸残基490和538中的突变。在优选实施方案中,本发明提供了融合分子,其中所述工程化切割半结构域包含多肽,其中除了在位置416、422、447、448或525处的一个或多个突变以外,在位置490处的野生型Glu(E)残基被Lys(K)残基替代,在位置538处的野生型Ile(I)残基被Lys(K)残基替代(“KK”)。在优选实施方案中,本发明提供了融合分子,其中所述工程化切割半结构域包含多肽,其中除了在位置416、422、447、448或525处的一个或多个突变以外,在位置486处的野生型Gln(Q)残基被Glu(E)残基替代,并且在位置499处的野生型Ile(I)残基被Leu(L)残基(“EL”)替代(参见U.S.8,034,598,通过引用并入本文)。
在一个方面,本发明提供了融合分子,其中所述工程化切割半结构域包含多肽,其中在FokI催化结构域中的位置387、393、394、398、400、402、416、422、427、434、439、441、447、448、469、478、487、495、497、506、516、525、529、534、542、559、569、570、571中的一个或多个处的野生型氨基酸残基被突变。提供了包含一个或多个突变的核酸酶结构域,如任何所附的表和图中所示。在一些实施方案中,所述一个或多个突变将野生型氨基酸从带正电荷的残基改变为中性残基或带负电荷的残基。在任何这些实施方案中,也可以在包含一个或多个另外突变的FokI结构域中制备所描述的突变体。在优选实施方案中,这些另外的突变是在二聚化结构域中,例如在位置418、432、441、481、483、486、487、490、496、499、523、527、537、538和/或559。突变的非限制性例子包括将任何切割结构域(例如FokI或FokI的同源物)在位置393、394、398、416、421、422、442、444、472、473、478、480、525或530处的野生型残基突变(例如取代)为任何氨基酸残基(例如,K393X、K394X、R398X、R416S、D421X、R422X、K444X、S472X、G473X、S472、P478X、G480X、K525X、A530X和/或N542X,其中第一残基描绘野生型并且X是指针对野生型残基取代的任何氨基酸)。在一些实施方案中,X是E、D、H、A、K、S、T、D或N。其他示例性突变包括S418E、S418D、S446D、K448A、P478S、I479Q、I479T、Q481A、Q481N、Q481E、A530E、A530K和/或N542D,其中氨基酸残基相对于全长FokI野生型切割结构域及其同源物进行编号。在某些实施方案中,组合可以包括416和422;在位置416处的突变和K448A;K448A和I479Q;K448A和Q481A;和/或K448A和在位置525处的突变。在一个实施方案中,在位置416处的野生型残基可以被Glu(E)残基替代(R416E),在位置422处的野生型残基被His(H)残基替代(R422H),并且在位置525处的野生型残基被Ala(A)残基替代。如本文所述的切割结构域还可以包括另外的突变,包括但不限于在位置432、441、483、486、487、490、496、499、527、537、538和/或559处的突变,例如二聚化结构域突变体(例如,ELD、KKR)和/或切口酶突变体(对催化结构域的突变)。具有本文所述突变的切割半结构域形成如本领域已知的异二聚体。
可替代地,核酸酶可使用所谓的“***酶”技术在体内装配于核酸靶位点处(参见例如,美国专利公开号20090068164)。此类***酶的组分可在单独的表达构建体上表达,或者可以连接于一个开放式阅读框中,其中个别组分例如由自切割2A肽或IRES序列隔开。组分可以是个别锌指结合结构域或大范围核酸酶核酸结合结构域的结构域。
可以在使用前例如在基于酵母的染色体***中针对活性来筛选核酸酶(例如,ZFN和/或TALEN),如美国专利号8,563,314中所述。
在某些实施方案中,核酸酶包含CRISPR/Cas***。CRISPR(成簇的规律间隔短回文重复序列)基因座(其编码***的RNA组分)和Cas(CRISPR相关)基因座(其编码蛋白质)(Jansen等人,2002.Mol.Microbiol.43:1565-1575;Makarova等人,2002.Nucleic AcidsRes.30:482-496;Makarova等人,2006.Biol.Direct 1:7;Haft等人,2005.PLoSComput.Biol.1:e60)组成CRISPR/Cas核酸酶***的基因序列。微生物宿主中的CRISPR基因座含有CRISPR相关(Cas)基因以及能将CRISPR介导的核酸切割的特异性程序化的非编码RNA元件的组合。
II型CRISPR是最充分表征的***之一,并在四个连续步骤中进行靶向DNA双链断裂。第一步,从CRISPR基因座转录两个非编码RNA:前crRNA阵列和tracrRNA。第二步,tracrRNA杂交到前crRNA的重复区域上,并且介导将前crRNA加工成含有单独间隔子序列的成熟crRNA。第三步,成熟的crRNA:tracrRNA复合物通过crRNA上的间隔子与靶DNA上的原型间隔子之间的Watson-Crick碱基配对将Cas9引导至靶DNA,靶DNA靠近原型间隔子邻近基序(PAM)是靶标识别的附加要求。最后,Cas9介导靶DNA的切割以在原型间隔子内产生双链断裂。CRISPR/Cas***的活性包括三个步骤:(i)在称为‘适应’的过程中将外来DNA序列***CRISPR阵列中以防止后来的攻击,(ii)表达相关蛋白质,以及表达并加工所述阵列,之后(iii)RNA介导干扰外来核酸。因此,在细菌细胞中,若干种所谓的‘Cas’蛋白与CRISPR/Cas***的天然功能有关,并在诸如***外源DNA等功能中发挥作用。
在一些实施方案中,使用CRISPR-Cpf1***。在弗朗西斯氏菌属物种(Francisellaspp)中鉴定出的CRISPR-Cpf1***是一种2类CRISPR-Cas***,其在人细胞中介导稳健的DNA干扰。尽管Cpf1和Cas9在功能上是保守的,但它们在许多方面(包括Cpf1和Cas9的指导RNA和底物特异性)都存在差异(参见Fagerlund等人(2015)Genom Bio 16:251)。Cas9与Cpf1蛋白之间的主要区别是Cpf1不利用tracrRNA,并且因此仅需要crRNA。FnCpf1 crRNA为42-44个核苷酸长(19核苷酸重复序列和23-25核苷酸间隔子),并且含有耐受保留二级结构的序列变化的单个茎-环。此外,Cpf1 crRNA明显短于Cas9所需的约100个核苷酸的工程化sgRNA,并且对于FnCpfl的PAM要求是在置换链上的5'-TTN-3'和5'-CTA-3'。尽管Cas9和Cpf1都在靶DNA中产生双链断裂,但是Cas9使用其RuvC和HNH样结构域以在指导RNA的种子序列内进行平末端切割,而Cpf1使用RuvC样结构域以在种子序列外产生交错切割。由于Cpf1远离关键种子区域进行交错切割,因此NHEJ不会破坏靶位点,因此确保Cpf1可以继续切割同一位点,直到发生所需的HDR重组事件为止。因此,在本文描述的方法和组合物中,应理解术语“Cas”包括Cas9和Cfp1蛋白二者。因此,如本文所用,“CRISPR/Cas***”是指CRISPR/Cas和/或CRISPR/Cfp1***,包括核酸酶和/或转录因子***二者。
在某些实施方案中,Cas蛋白可以是天然存在的Cas蛋白的“功能衍生物”。天然序列多肽的“功能衍生物”是具有与天然序列多肽共同的定性生物特性的化合物。“功能衍生物”包括但不限于天然序列的片段和天然序列多肽及其片段的衍生物,条件是它们具有与相应的天然序列多肽共同的生物活性。本文考虑的生物活性是功能衍生物将DNA底物水解成片段的能力。术语“衍生物”包括多肽的氨基酸序列变体、共价修饰和其融合物,例如衍生的Cas蛋白。Cas多肽或其片段的合适衍生物包括但不限于Cas蛋白或其片段的突变体、融合物、共价修饰物。Cas蛋白,包括Cas蛋白或其片段,以及Cas蛋白或其片段的衍生物,可以从细胞中获得或化学合成或通过这两种程序的组合获得。细胞可以是天然产生Cas蛋白的细胞,或天然产生Cas蛋白并且经基因工程改造以产生更高表达水平的内源Cas蛋白或从外源引入的核酸(所述核酸编码与内源Cas相同或不同的Cas)产生Cas蛋白的细胞。在一些情况下,细胞并非天然地产生Cas蛋白,并且进行基因工程化以产生Cas蛋白。在一些实施方案中,Cas蛋白是一种经由AAV载体进行递送的小的Cas9直向同源物(Ran等人(2015)Nature510,第186页)。
一种或多种核酸酶可以在靶位点进行一个或多个双链和/或单链切割。在某些实施方案中,核酸酶包含催化无活性切割结构域(例如,FokI和/或Cas蛋白)。参见例如,美国专利号9,200,266;8,703,489以及Guillinger等人(2014)Nature Biotech.32(6):577-582。催化无活性切割结构域在与催化活性结构域组合时可以充当切口酶以进行单链切割。因此,可以组合使用两种切口酶以在特定区域中进行双链切割。另外的切口酶在本领域中也是已知的,例如,McCaffery等人(2016)Nucleic Acids Res.44(2):e11.doi:10.1093/nar/gkv878.电子出版于2015年10月19日。
在某些实施方案中,核酸酶是一种锌指核酸酶,其包含第一和第二(也称为“左和右”和“配偶体”)锌指核酸酶,各自包含锌指DNA结合结构域和切割结构域(例如,工程化FokI)。ZFN可能被一个或多个AAV载体携带。在某些实施方案中,单独的AAV载体被携带核酸酶的左和右ZFN。所述一个或多个AAV载体可以包括另外的编码和/或非编码序列,包括但不限于一个5’ITR、一个或多个增强子序列(例如ApoE增强子)、一个或多个启动子序列(例如hAAT启动子)、5’UTR、一个或多个内含子序列(例如人β球蛋白/IgG嵌合内含子)、一个N末端肽编码序列、一个NLS信号、一个或多个WPRE序列(例如WPREmut6)、一个多聚A信号和/或一个3’ITR。下表4和表5显示了示例性核酸酶AAV。将清楚的是,一个或多个列出的元件(不包括ZFN编码序列)可以被省略;被类似的序列(例如,不同的启动子序列、不同的WPRE序列(诸如本领域已知的或实施例4中所描述的那些)、不同的内含子序列等)替代;和/或可以添加另外的元件。所述编码核酸酶的一个或多个AAV载体可以与供体用于***中,例如2种ZFNAAV(例如,表4和5中公开的左和右ZFN AAV)与通常编码治疗性肽的供体AAV的组合。AAV供体可包括以下元件中的一种或多种:来自任何来源的5’ITR和/或3’ITR;任何长度的转基因(编码任何蛋白质或其功能片段的任何长度的治疗性蛋白质编码序列)侧翼的左和/或右同源臂(与白蛋白同源);剪接受体序列;和/或多聚腺苷酸化(多聚A)信号。在某些实施方案中,AAV供体编码因子IX、IDS或IDUA蛋白,例如如下表6-8所示的供体。
递送
可以通过任何合适的手段将本文描述的蛋白质(例如,核酸酶)、多核苷酸、和/或包含所述蛋白质和/或多核苷酸的组合物递送至靶细胞,所述任何合适的手段包括例如通过注射蛋白质和/或mRNA组分。
合适的细胞包括但不限于真核和原核细胞和/或细胞系。此类细胞或由此类细胞生成的细胞系的非限制性例子包括T细胞、COS、CHO(例如CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11、CHO-DUKX、CHOK1SV)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、HeLa、HEK293(例如HEK293-F、HEK293-H、HEK293-T)、和perC6细胞以及昆虫细胞(诸如草地贪夜蛾(Spodoptera fugiperda(Sf)))或真菌细胞(诸如酵母属(Saccharomyces)、毕赤酵母属(Pichia)和裂殖酵母属(Schizosaccharomyces))。在某些实施方案中,细胞系是CHO-K1细胞系、MDCK细胞系或HEK293细胞系。合适的细胞还包括干细胞,举例来说,例如为胚胎干细胞、诱导性多能干细胞(iPS细胞)、造血干细胞、神经元干细胞和间充质干细胞。
递送如本文描述的包含DNA结合结构域的蛋白质的方法描述于例如以下文献中:美国专利号6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219;和7,163,824,将所述文献全部的披露内容都通过引用以其整体并入本文。
如本文描述的DNA结合结构域和包含这些DNA结合结构域的融合分子也可以使用包含编码一种或多种DNA结合蛋白的序列的载体来递送。另外,还可以通过这些载体递送另外的核酸(例如,供体)。可以使用任何载体***,包括但不限于质粒载体、逆转录病毒载体、慢病毒载体、腺病毒载体、痘病毒载体、疱疹病毒载体和腺相关病毒载体等。还参见,美国专利号6,534,261;6,607,882;6,824,978;6,933,113;6,979,539;7,013,219和7,163,824,将它们通过引用以其全文并入本文。此外,将清楚的是,这些载体中的任何一种都可以在适当时包含一种或多种DNA结合蛋白编码序列和/或另外的核酸。因此,当将如本文描述的一种或多种DNA结合蛋白引入细胞中,并在适当时将另外的DNA引入细胞中时,它们可以被携带在同一载体或不同载体上。当使用多个载体时,每个载体可以根据需要包含编码一种或多种DNA结合蛋白和另外的核酸序列。
常规的基于病毒和非病毒的基因转移方法可用于将编码工程化DNA结合蛋白的核酸引入细胞(例如哺乳动物细胞)和靶组织中,并根据需要共引入另外的核苷酸序列。此类方法还可用于在体外向细胞给予核酸(例如,其编码DNA结合蛋白和/或供体)。在某些实施方案中,给予核酸以用于体内或离体基因治疗用途。非病毒载体递送***包括DNA质粒、裸核酸、和与递送媒介物(如脂质体或泊洛沙姆)复合的核酸。病毒载体递送***包括DNA和RNA病毒,其在递送至细胞后具有游离型或整合的基因组。关于基因治疗程序的综述,参见Anderson,Science 256:808-813(1992);Nabel和Felgner,TIBTECH 11:211-217(1993);Mitani和Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature 357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer和Perricaudet,British Medical Bulletin51(1):31-44(1995);Haddada等人,CurrentTopics in Microbiology and Immunology Doerfler和
Figure BDA0002714495690000591
(编辑)(1995);以及Yu等人,Gene Therapy1:13-26(1994)。
非病毒递送核酸的方法包括电穿孔、脂质转染、显微注射、基因枪、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸DNA、mRNA、人工病毒粒子、和DNA的药剂增强摄取。还可以使用采用例如Sonitron 2000***(Rich-Mar)的声致穿孔(sonoporation)来递送核酸。在优选实施方案中,一种或多种核酸是作为mRNA来递送。同样优选的是使用加帽的mRNA来增加翻译效率和/或mRNA稳定性。尤其优选的是ARCA(抗反向帽类似物)帽或其变体。参见美国专利号7,074,596和8,153,773,其是通过引用并入本文。
另外的示例性核酸递送***包括由以下各项提供的那些:Amaxa Biosystems(Cologne,德国)、Maxcyte,Inc.(Rockville,马里兰)、BTX分子递送***(Holliston,MA)和Copernicus Therapeutics Inc(参见例如US6008336)。脂质转染描述于例如US 5,049,386、US 4,946,787和US 4,897,355中,并且脂质转染试剂是市售的(例如TransfectamTM、LipofectinTM、和LipofectamineTMRNAiMAX)。适合用于多核苷酸的有效受体识别脂质转染的阳离子和中性脂质包括Felgner的WO 91/17424、WO 91/16024中的那些。可以递送至细胞(离体给予)或靶组织(体内给予)。
脂质:核酸复合物(包括靶向脂质体,诸如免疫脂质复合物)的制备对本领域技术人员而言是熟知的(参见例如,Crystal,Science 270:404-410(1995);Blaese等人,CancerGene Ther.2:291-297(1995);Behr等人,Bioconjugate Chem.5:382-389(1994);Remy等人,Bioconjugate Chem.5:647-654(1994);Gao等人,Gene Therapy 2:710-722(1995);Ahmad等人,Cancer Res.52:4817-4820(1992);美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028和4,946,787)。
另外的递送方法包括使用将要递送的核酸包装至EnGeneIC递送媒介物(EDV)中。这些EDV被使用双特异性抗体特异性地递送至靶组织中,其中所述抗体的一个臂对所述靶组织具有特异性,并且另一个臂对EDV具有特异性。抗体将EDV携带至靶细胞表面,然后EDV通过内吞作用被引入细胞中。一旦进入细胞后,内容物被释放出来(参见MacDiarmid等人(2009)Nature Biotechnology 27(7)第643页)。
根据需要使用基于RNA或DNA病毒的***来递送编码工程化DNA结合蛋白和/或供体(例如CAR或ACTR)的核酸,这利用了高度进化的过程将病毒靶向至体内的特定细胞并将病毒有效载荷运输至细胞核。可以将病毒载体直接给予患者(体内),或其可以用于在体外处理细胞,以及将经修饰细胞给予患者(离体)。常规的递送核酸的基于病毒的***包括但不限于用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘苗病毒和单纯疱疹病毒载体。使用逆转录病毒、慢病毒和腺相关病毒基因转移方法时,在宿主基因组中整合是可能的,通常导致所***转基因的长期表达。另外,已经在许多不同细胞类型和靶组织中观察到高转导效率。
逆转录病毒的向性可以通过掺入外来包膜蛋白来改变,从而扩大靶细胞的潜在靶群体。慢病毒载体是能够转导或感染非***细胞并且典型地产生高病毒滴度的逆转录病毒载体。逆转录病毒基因转移***的选择取决于靶组织。逆转录病毒载体包括顺式作用的长末端重复序列,其具有对多达6-10kb的外来序列的包装能力。最小顺式作用LTR对载体的复制和包装而言是足够的,所述载体随后用于将治疗性基因整合至靶细胞中以提供持久的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的那些载体(参见例如,Buchscher等人,J.Virol.66:2731-2739(1992);Johann等人,J.Virol.66:1635-1640(1992);Sommerfelt等人,Virol.176:58-59(1990);Wilson等人,J.Virol.63:2374-2378(1989);Miller等人,J.Virol.65:2220-2224(1991);PCT/US94/05700)。
在其中瞬时表达是优选的应用中,可以使用基于腺病毒的***。基于腺病毒的载体能够在许多细胞类型中具有极高的转导效率,并且不需要细胞***。使用此类载体,已经获得高滴度和高表达水平。这种载体可以在相对简单的***中大量生产。腺相关病毒(“AAV”)载体还用于例如在核酸和肽的体外生产中用靶核酸转导细胞,以及用于体内和离体基因治疗程序中(参见例如,West等人,Virology 160:38-47(1987);美国专利号4,797,368;WO 93/24641;Kotin,Human Gene Therapy 5:793-801(1994);Muzyczka,J.Clin.Invest.94:1351(1994))。重组AAV载体的构建描述于许多出版物中,包括美国专利号5,173,414;Tratschin等人,Mol.Cell.Biol.5:3251-3260(1985);Tratschin等人,Mol.Cell.Biol.4:2072-2081(1984);Hermonat和Muzyczka,PNAS USA 81:6466-6470(1984);以及Samulski等人,J.Virol.63:03822-3828(1989)。
至少六种病毒载体方法目前可用于临床试验中的基因转移,所述试验利用涉及通过***辅助细胞系中的基因与缺陷性载体互补以产生转导剂的途径。
pLASN和MFG-S是已经用于临床试验中的逆转录病毒载体的例子(Dunbar等人,Blood 85:3048-305(1995);Kohn等人,Nat.Med.1:1017-102(1995);Malech等人,PNAS USA94:22 12133-12138(1997))。PA317/pLASN是第一个用于基因治疗试验中的治疗性载体。(Blaese等人,Science 270:475-480(1995))。已经观察到MFG-S包装载体的转导效率为50%或更高。(Ellem等人,Immunol Immunother.44(1):10-20(1997);Dranoff等人,Hum.Gene Ther.1:111-2(1997))。
重组腺相关病毒载体(rAAV)是有前景的基于缺陷性和非病原性细小病毒腺相关2型病毒的替代性基因递送***。所有载体都源自仅保留侧接转基因表达盒的AAV 145bp反相末端重复序列的质粒。由于整合至经转导细胞基因组中所致的有效基因转移和稳定转基因递送是这种载体***的关键特征。(Wagner等人,Lancet 351:9117 1702-3(1998),Kearns等人,Gene Ther.9:748-55(1996))。根据本发明,也可以使用其他AAV血清型,包括AAV1、AAV3、AAV4、AAV5、AAV6、AAV8、AAV8.2、AAV9和AAVrh10以及假型化AAV,例如AAV2/8、AAV2/5和AAV2/6。
复制缺陷型重组腺病毒载体(Ad)可以以高滴度产生,并且易于感染多种不同的细胞类型。对大多数腺病毒载体进行工程化,使得转基因替代Ad E1a、E1b和/或E3基因;随后使复制缺陷性载体在反式供应所缺失的基因功能的人293细胞中增殖。Ad载体可以在体内转导多种类型的组织,包括非***的已分化细胞,如在肝、肾和肌肉中发现的那些。常规Ad载体具有较大运载能力。Ad载体在临床试验中的使用的例子涉及使用肌内注射的用于抗肿瘤免疫的多核苷酸疗法(Sterman等人,Hum.Gene Ther.7:1083-9(1998))。在临床试验中使用腺病毒载体进行基因转移的另外的例子包括Rosenecker等人,Infection 24:1 5-10(1996);Sterman等人,Hum.Gene Ther.9:7 1083-1089(1998);Welsh等人,Hum.GeneTher.2:205-18(1995);Alvarez等人,Hum.Gene Ther.5:597-613(1997);Topf等人,GeneTher.5:507-513(1998);Sterman等人,Hum.Gene Ther.7:1083-1089(1998)。
包装细胞用于形成能感染宿主细胞的病毒粒子。此类细胞包括包装腺病毒的293细胞以及包装逆转录病毒的ψ2细胞或PA317细胞。用于基因疗法中的病毒载体通常是由将核酸载体包装至病毒粒子中的生产细胞系产生。载体典型地含有包装和随后整合至宿主中(如果适用)所需的最小病毒序列,其他病毒序列由编码要表达的蛋白质的表达盒替代。失去的病毒功能由包装细胞系反式供应。例如,用于基因疗法中的AAV载体典型地仅具有来自AAV基因组的反相末端重复(ITR)序列,所述序列是包装和整合至宿主基因组中所需的。将病毒DNA包装于细胞系中,所述细胞系含有编码其他AAV基因(即,rep和cap)但缺少ITR序列的辅助质粒。所述细胞系还被作为辅助者的腺病毒感染。辅助病毒促进AAV载体的复制和来自辅助质粒的AAV基因的表达。由于缺少ITR序列,辅助质粒并未被大量包装。腺病毒的污染可通过例如热处理来减少,腺病毒对所述热处理比AAV更敏感。
在许多基因疗法应用中,可期望以高度特异性将基因疗法载体递送至特定组织类型。因此,可以修饰病毒载体,以通过将配体表达为与病毒外表面上的病毒外壳蛋白的融合物而具有对给定细胞类型的特异性。配体被选择以具有对已知存在于目的细胞类型上的受体的亲和力。例如,Han等人,Proc.Natl.Acad.Sci.USA 92:9747-9751(1995)报道,莫洛尼鼠白血病病毒可以被修饰以表达与gp70融合的人神经生长因子,并且重组病毒感染某些表达人表皮生长因子受体的人乳腺癌细胞。这个原则可以扩展至其他病毒-靶细胞对,其中靶细胞表达受体并且病毒表达包含针对细胞表面受体的配体的融合分子。例如,丝状噬菌体可以被工程化以展示对实际上任何所选细胞受体具有特定结合亲和力的抗体片段(例如,FAB或Fv)。虽然上述说明主要适用于病毒载体,但是相同原则可以适用于非病毒载体。此类载体可以被工程化以含有特定摄取序列,所述摄取序列有利于被特定靶细胞摄取。
CRISPR/Cas***的递送方法可以包含上述那些方法。例如,在动物模型中,可以将体外转录的Cas编码mRNA或重组Cas蛋白使用玻璃针直接注射到基因组编辑的动物的单细胞期胚胎中。为了在细胞中体外表达Cas和指导RNA,通常经由脂质转染或电穿孔将编码它们的质粒转染到细胞中。另外,重组Cas蛋白可以与体外转录的指导RNA复合,其中Cas指导的RNA核糖核蛋白被目的细胞摄取(Kim等人(2014)Genome Res 24(6):1012)。出于治疗目的,可以通过病毒和非病毒技术的组合来递送Cas和指导RNA。例如,可以经由纳米颗粒递送来递送编码Cas的mRNA,而指导RNA和任何所需的转基因或修复模板是经由AAV来递送的(Yin等人(2016)Nat Biotechnol 34(3)第328页)。
如下所述,基因治疗载体可以通常通过全身给药(例如,静脉内、腹膜内、肌内、皮下或颅内输注)或局部施用在体内给予至个体患者来递送。可替代地,可以将载体离体递送至细胞中,例如从个别患者外植的细胞(例如,淋巴细胞、骨髓抽取物、组织活检)或全适供血者造血干细胞,之后将所述细胞再植入患者体内,通常在选择已经并入所述载体的细胞后再植入。
用于诊断学、研究、移植或基因疗法的离体细胞转染(例如,通过将经转染细胞再输注至宿主生物体中)是本领域技术人员所熟知的。在优选的实施方案中,从受试者生物体中分离细胞,用DNA结合蛋白核酸(基因或cDNA)转染,然后再输注回受试者生物体(例如患者)中。适于离体转染的多种细胞类型是本领域技术人员所熟知的(参见例如,Freshney等人,Culture of Animal Cells,A Manual of Basic Technique(第3版1994)和其中关于如何从患者分离并培养细胞的讨论引用的参考文献)。
在一个实施方案中,在离体程序中使用干细胞进行细胞转染和基因疗法。使用干细胞的优点在于,其可以在体外分化为其他细胞类型,或者可以被引入哺乳动物(如细胞供体)中,其中其将移入骨髓中。在体外使用细胞因子(如GM-CSF、IFN-γ和TNF-α)将CD34+细胞分化为临床上重要的免疫细胞类型的方法是已知的(参见Inaba等人,J.Exp.Med.176:1693-1702(1992))。
使用已知方法分离干细胞以供转导和分化。例如,通过用结合不期望细胞(如CD4+和CD8+(T细胞)、CD45+(全B细胞)、GR-1(粒细胞)和Iad(已分化的抗原呈递细胞))的抗体淘选骨髓细胞来从骨髓细胞分离干细胞(参见Inaba等人,J.Exp.Med.176:1693-1702(1992))。
已经被修饰的干细胞也可以用于一些实施方案中。例如,已经变得可抵抗细胞凋亡的神经元干细胞可用作治疗性组合物,其中干细胞还含有本发明的ZFP TF。对细胞凋亡的抵抗可例如通过在干细胞中使用BAX-或BAK-特异性ZFN敲除BAX和/或BAK来实现(参见,美国专利号8,597,912),或者例如在那些半胱天冬酶被破坏的干细胞中,也使用半胱天冬酶-6特异性ZFN来进行。
也可以将含有治疗性DNA结合蛋白(或编码这些蛋白的核酸)的载体(例如,逆转录病毒、腺病毒、脂质体等)直接给予生物体以用于在体内转导细胞。可替代地,可给予裸DNA。通过通常用于引入分子以与血液或组织细胞最终接触的任何途径给药,所述途径包括但不限于注射、输注、局部施用和电穿孔。给予此类核酸的合适方法是本领域技术人员可获得的并且熟知的,并且尽管可以使用多于一种途径来给予特定组合物,但是特定途径通常可以提供比另一条途径更直接且更有效的反应。
将DNA引入造血干细胞中的方法披露于例如美国专利号5,928,638中。可用于将转基因引入造血干细胞(例如,CD34+细胞)中的载体包括腺病毒35型。
适于将转基因引入免疫细胞(例如,T细胞)中的载体包括非整合性慢病毒载体。参见例如,Ory等人(1996)Proc.Natl.Acad.Sci.USA93:11382-11388;Dull等人(1998)J.Virol.72:8463-8471;Zuffery等人(1998)J.Virol.72:9873-9880;Follenzi等人(2000)Nature Genetics 25:217-222。
药学上可接受的载体部分取决于所给予的特定组合物,以及取决于用于给予所述组合物的特定方法。因此,存在众多种可使用的药物组合物的适宜制剂,如下文所述(参见例如,Remington's Pharmaceutical Sciences,第17版,1989)。
如上所述,所公开的方法和组合物可以用于任何类型的细胞中,包括但不限于原核细胞、真菌细胞、古细菌细胞、植物细胞、昆虫细胞、动物细胞、脊椎动物细胞、哺乳动物细胞和人细胞,包括任何类型的T细胞和干细胞。用于蛋白质表达的适宜细胞系是本领域技术人员已知的,并且包括但不限于COS、CHO(例如,CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、HeLa、HEK293(例如,HEK293-F、HEK293-H、HEK293-T)、perC6、昆虫细胞(如草地贪夜蛾(Spodoptera fugiperda)(Sf))和真菌细胞(如酵母菌属(Saccharomyces)、毕赤酵母属(Pichia)和裂殖酵母属(Schizosaccharomyces)。还可以使用这些细胞系的子代、变体和衍生物。
应用
使用工程化核酸酶治疗和预防疾病是未来几年医学领域最重要的发展之一。本文所述的方法和组合物用于增加这些新颖工具的特异性,以确保所需的靶位点将是切割的主要位置。最小化或消除脱靶切割将是实现此技术用于所有体外、体内和离体应用的全部潜力所必需的。
示例性遗传疾病包括但不限于软骨发育不全、全色盲、酸性麦芽糖酶缺乏症、腺苷脱氨酶缺乏症(OMIM号102700)、肾上腺脑白质营养不良、艾卡尔迪综合征(aicardisyndrome)、α1抗胰蛋白酶缺乏症、α地中海贫血、雄激素不敏感综合征、阿佩尔综合征(apert syndrome)、致心律失常性右室心肌病、发育不良、共济失调性毛细血管扩张、barth综合征、β地中海贫血、蓝色橡皮大疱样痣综合征、卡纳万病(canavan disease)、慢性肉芽肿疾病(CGD)、猫叫综合征、囊性纤维化、德尔肯氏病(dercum's disease)、外胚层发育不良、范可尼贫血、进行性骨化性纤维发育不良、脆性X综合征、半乳糖血症、戈谢病、全身型神经节苷脂贮积病(例如GM1)、血色素沉着病、β球蛋白第6密码子的血红蛋白C突变(HbC)、血友病、亨廷顿病、赫勒综合征、低磷酸酯酶症、克兰费尔特综合征(Klinefleter syndrome)、克拉贝氏病(Krabbes Disease)、Langer-Giedion综合征(Langer-Giedion Syndrome)、白细胞粘附缺乏症(LAD,OMIM号116920)、脑白质营养不良、长QT综合征、马凡综合征、莫比乌斯综合征(Moebius syndrome)、粘多糖贮积症(MPS)、指甲髌骨综合征、肾源性尿崩症、神经纤维瘤病、尼曼-皮克病、成骨不全、苯丙酮尿症(PKU)、卟啉症、普拉德-威利综合征、早衰、变形杆菌(Proteus)综合征、视网膜母细胞瘤、雷特综合征、鲁宾斯坦-泰比综合征、圣菲利波综合征(Sanfilippo syndrome)、严重联合免疫缺陷综合征(SCID)、施瓦赫曼综合征(Shwachman syndrome)、镰状细胞病(镰状细胞贫血)、史密斯-马吉利综合征(Smith-Magenis syndrome)、斯蒂克勒综合征、泰-萨克斯病、血小板减少伴桡骨缺失(TAR)综合征、特雷彻-柯林斯综合征、三体综合征、结节性硬化症、特纳综合征、尿素循环障碍、冯·希佩尔-林道病(von Hippel-Landau disease)、瓦登伯格综合征、威廉姆斯综合征、威尔逊病、威斯科特-奥尔德里奇综合征、X连锁淋巴组织增生综合征(XLP,OMIM号308240)。
可以通过靶向DNA切割和/或同源重组进行治疗的另外的示例性疾病包括获得性免疫缺陷、溶酶体贮积病(例如,戈谢病、GM1、法布里病和泰-萨克斯病)、粘多糖贮积症(例如,MPSII(亨特病)、MPSI病(赫勒病)、血红蛋白病(例如,镰状细胞病、HbC、α地中海贫血、β地中海贫血)和血友病。参见例如,美国专利号9,877,988和9,956,247。特别地,葡糖脑苷脂酶(GBA)在戈谢病患者中是不足的,α半乳糖苷酶(GLA)在法布里病患者中是不足的,艾杜糖-2-硫酸酯酶缺陷(IDS)在MPS II(亨特病)患者中是不足的,α-L-艾杜糖醛酸酶缺陷(IDUA)在MPS I(赫勒病)患者中是不足的,并且鞘磷脂磷酸二酯酶1缺陷(SMPD1)在尼曼-皮克病患者中是不足的。因此,可以使用本文所述的核酸酶将表达在这些疾病中缺乏或不足的一种或多种蛋白质的供体引入,以提供对这些疾病的治疗和/或预防。
此类方法还允许(例如,通过阻断病毒或细菌受体的表达,从而防止感染和/或在宿主生物体中的传播)治疗宿主中的感染(病毒或细菌)以治疗遗传疾病。
感染或整合的病毒基因组的靶向切割可以用于治疗宿主中的病毒感染。此外,编码病毒受体的基因的靶向切割可以用于阻断此类受体的表达,从而防止病毒感染和/或病毒在宿主生物体中的传播。编码病毒受体(例如,HIV的CCR5和CXCR4受体)的基因的靶向诱变可以用于使受体不能与病毒结合,从而防止新的感染并阻断现有感染的传播。参见美国专利公开号2008/015996。可以被靶向的病毒或病毒受体的非限制性例子包括单纯疱疹病毒(HSV),诸如HSV-1和HSV-2;水痘带状疱疹病毒(VZV)、EB病毒(EBV)和巨细胞病毒(CMV)、HHV6和HHV7。肝炎病毒家族包括甲型肝炎病毒(HAV)、乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、丁型肝炎病毒(HDV)、戊型肝炎病毒(HEV)和庚型肝炎病毒(HGV)。可以靶向其他病毒或其受体,包括但不限于细小RNA病毒科(Picornaviridae)(例如脊髓灰质炎病毒等);嵌杯病毒科(Caliciviridae);披膜病毒科(Togaviridae)(例如风疹病毒、登革热病毒等);黄病毒科(Flaviviridae);冠状病毒科(Coronaviridae);呼肠孤病毒科(Reoviridae);双RNA病毒科(Birnaviridae);弹状病毒科(Rhabodoviridae)(例如狂犬病病毒等);纤丝病毒科(Filoviridae);副粘病毒科(Paramyxoviridae)(例如腮腺炎病毒、麻疹病毒、呼吸道合胞病毒等);正粘病毒科(Orthomyxoviridae)(例如甲型、乙型和丙型流感病毒等);布尼亚病毒科(Bunyaviridae);沙粒病毒科(Arenaviridae);逆转录病毒科(Retroviradae);慢病毒(例如HTLV-I;HTLV-II;HIV-1(也称为HTLV-III、LAV、ARV、hTLR等)HIV-II);猿猴免疫缺陷病毒(SIV)、人***瘤病毒(HPV)、流感病毒和蜱传脑炎病毒。关于这些和其他病毒的描述,参见例如,Virology,第3版(W.K.Joklik编辑1988);Fundamental Virology,第2版(B.N.Fields和D.M.Knipe,编辑1991)。例如,HIV受体包括CCR-5和CXCR-4。
因此,如本文所述的异二聚体切割结构域变体提供了对于提高在基因修饰应用中的ZFN特异性的广泛实用性。这些变体切割结构域可以通过定点诱变或亚克隆容易地整合到任何现有ZFN中,以提高任何ZFN二聚体的体内特异性。
如上所述,本文所述的组合物和方法可以用于基因修饰、基因校正和基因破坏。基因修饰的非限制性例子包括基于同源定向修复(HDR)的靶向整合;基于HDR的基因校正;基于HDR的基因修饰;基于HDR的基因破坏;基于NHEJ的基因破坏;和/或HDR、NHEJ和/或单链退火(SSA)的组合。单链退火(SSA)是指通过5’-3’外切核酸酶切除DSB以暴露2个互补区域来修复在相同方向上发生的两个重复序列之间的双链断裂。然后,编码2个同向重复序列的单链彼此退火,并且退火的中间体可以被处理使得单链尾部(单链DNA中未与任何序列退火的部分)被消化掉,间隙被DNA聚合酶填上,并且DNA末端重新连接。这导致位于同向重复序列之间的序列缺失。
本文所述的包含切割结构域(例如,ZFN、TALEN、CRISPR/Cas***)的组合物和方法也可以用于治疗各种遗传疾病和/或感染性疾病。
所述组合物和方法也可以应用于基于干细胞的疗法,包括但不限于:通过短补丁基因转化或单基因的基因疗法的靶向整合来纠正体细胞突变;显性负等位基因的破坏;病原体进入细胞或生产性感染细胞所需的基因的破坏;增强的组织工程化,例如,通过修饰基因活性来促进功能组织的分化或形成;和/或破坏基因活性以促进功能组织的分化或形成;阻断或诱导分化,例如,通过破坏阻断分化的基因以促进干细胞沿特定谱系途径分化、靶向***可以刺激干细胞分化的基因或siRNA表达盒、靶向***可以阻断干细胞分化并允许更好地扩增和维持多能性的基因或siRNA表达盒、和/或将报告基因靶向***具有内源基因的框架中,所述内源基因是多能性或分化状态的标记,所述标记将允许简单标记来评分干细胞的分化状态,以及培养基,细胞因子,生长条件,基因表达,siRNA、shRNA或miRNA分子的表达,暴露于针对细胞表面标记的抗体,或药物的变化如何改变这种状态;体细胞核转移,例如,可以分离患者自身的体细胞,以适当的方式修饰预期的靶基因,产生细胞克隆(并控制质量以确保基因组安全性),并且从这些细胞分离细胞核并转移到未受精的卵中以产生患者特异性hES细胞,可以将所述患者特异性hES细胞直接注射或在移植到患者体内之前进行分化,从而减少或消除组织排斥;通过敲除MHC受体(例如,以产生免疫同一性减弱或完全消失的细胞)获得通用干细胞。此程序的细胞类型包括但不限于T细胞、B细胞、造血干细胞和胚胎干细胞。此外,可以使用诱导性多能干细胞(iPSC),其也将由患者自身的体细胞产生。因此,这些干细胞或其衍生物(分化的细胞类型或组织)可以潜在地被移植到任何人体内,而不管其来源或组织相容性如何。
所述组合物和方法也可以用于体细胞疗法,从而允许产生已经被修饰以增强其生物学特性的细胞原液。可以将此类细胞输注到各种患者中,而与细胞的供体来源及其与接受者的组织相容性无关。
除了治疗性应用以外,当用于工程化核酸酶时,由本文所述变体提供的增加的特异性可以用于作物工程化、细胞系工程化和疾病模型的构建。专性异二聚体切割半结构域为改善核酸酶特性提供了一种直接的手段。
所描述的工程化切割半结构域也可以用于基因修饰方案,所述基因修饰方案要求在多个靶标处同时切割,以缺失中间区域或一次性地改变两个特定基因座。在两个靶标上切割将需要细胞表达四种ZFN或TALEN,这可能潜在地产生十种不同的活性ZFN或TALEN组合。对于此类应用,用这些新的变体取代野生型核酸酶结构域将消除不需要的组合的活性,并减少脱靶切割的机会。如果在某个期望的DNA靶标处的切割需要核酸酶对A+B的活性,并且在第二个期望的DNA靶标处的同时切割需要核酸酶对X+Y的活性,那么使用本文所述的突变可以防止A与A、A与X、A与Y等等的配对。因此,这些FokI突变会降低由于“非法”对形成而引起的非特异性切割活性,并允许产生更有效的正交核酸酶突变对(参见共同拥有的专利美国专利公开号20080131962和20090305346)。
实施例
实施例1:ZFN的制备
靶向人白蛋白基因的ZFN被设计并整合到基本上如以下文献所描述的质粒载体中:Urnov等人(2005)Nature 435(7042):646-651;Perez等人(2008)NatureBiotechnology 26(7):808-816;以及美国专利9,394,545。
实施例2:优化白蛋白特异性ZFN
在20%的人中,左手边ZFN配偶体的结合位点(SBS47171-FLAG,参见表1)包含一个SNP(参见图1)。在野生型序列中,所述序列包含一个AT碱基对(用椭圆形指示),而在包含SNP的序列中,在此位置有一个GC碱基对(用序列上方的矩形指示)。在对于野生型和SNP白蛋白序列而言是杂合的人肝细胞中,47171-FLAG/47898-FLAG对针对野生型序列具有3-4倍的偏好性(参见图2)。鉴定了第二左手边配偶体(42875),发现其以相等的活性切割野生型白蛋白序列和含SNP的序列,然而,42875/47898对还在SMCHD1脱靶位点显示出一些切割活性。
因此,对另外的候选ZFN进行了研究,其中对ZFP骨架内的磷酸接触氨基酸进行了修饰。所用的蛋白质在下表1中示出。
表1:白蛋白特异性ZFN设计
Figure BDA0002714495690000701
Figure BDA0002714495690000711
然后对上面列出的ZFN进行修饰,使其包含ZFP骨架的改变,以减少在ZFP与DNA磷酸骨架之间的任何潜在的非特异性接触(参见美国专利公开号US-2018-0087072-A1)。在下面的表2A和表2B中,显示了在表1的亲本ZFN的标题下的示例性ZFP骨架变化、以及分配给每个变体的新的SBS唯一数字标识符。
表2:磷酸接触变体ZFN
表2A:左配偶体
Figure BDA0002714495690000721
表2B:右配偶体
Figure BDA0002714495690000722
然后测试这些蛋白质针对白蛋白基因座(ALB)或SMCHD1脱靶的活性,其中使变体与原始的右手边配偶体(47898-FLAG)或左手边配偶体(47171-FLAG)配对。按照制造商的说明书,通过Amaxa电穿孔用ZFN mRNA电穿孔K562细胞。在电穿孔后16小时收获细胞。按照制造商的说明书,使用QuickExtractTMDNA提取溶液(Lucigen)提取gDNA。通过对在白蛋白ZFN切割位点或SMCHD1脱靶位点周围用引物获得的PCR产物的MiSeq测序来测量***缺失的百分比。在所有变体中都观察到高活性,并且在大多数变体(特别是F1和F3变体)中观察到增加的特异性(与脱靶位点相比)(图3A)。
接下来,使在ELD/KKR FokI核酸酶结构域中产生的磷酸接触氨基酸侧链突变(参见美国专利8,962,281)与上述ZFP骨架突变配对。在这些实验中,表1所示的亲本ZFN被重述为包含在骨架和核酸酶结构域中的突变,并且每个突变都被给予了新的唯一数字标识符(参见表3)。
表3:白蛋白特异性ZFN变体
Figure BDA0002714495690000731
*FokI结构域可以相对于如表中所示的全长或仅相对于FokI的切割结构域进行编号(例如,N542D和N159D是指相同的工程化FokI结构域,并且P478S和P95S是指相同的工程化FokI结构域)
然后在K562细胞中测试了包含这些ZFN的对,以观察在白蛋白基因座处和在脱靶位点SMCHD1处的ZFN活性。简言之,用所指示的白蛋白靶向ZFN转染K562细胞。如上所述,在转染后24小时通过深度测序评估细胞的ZFN活性(***缺失%)。
结果(如图3A-图3C所示)证明白蛋白特异性活性被大大提高,而脱靶活性下降到背景水平。图3A和图3B显示了在脱靶位点SMCHD1处的结果。还使用无偏捕获测定来鉴定在K562细胞和HepG2细胞两者中这些ZFN对的潜在脱靶基因座(参见美国临时专利申请62/675,435),并且如图所示(参见图3C),经修饰的ZFN对在这些位点几乎没有可检测的活性。
因此,设计了优化的人白蛋白特异性ZFN,其在白蛋白基因座处保持高水平的中靶切割,同时耐受A至G SNP并具有高度的特异性。
还测试了优化的ZFN在iPS来源的人肝细胞中的活性(供体的切割和靶向整合)。简言之,iPS来源的人肝细胞购自Cellular Dynamics international,按照制造商的方案进行铺板和培养。在铺板后第4天以如下剂量用人ZFN AAV转导细胞:低-30MOI、中-100MOI和高-300MOI。第二天,用人供体AAV转导细胞:低-240MOI、中-800MOI和高-2400MOI。在ZFNAAV转导后第7天收获细胞和条件培养基用于分析。
如图3D和图3E(i)所示,与亲本ZFN相比,优化的ZFN显示出高多达12倍的切割效率,以及由使用优化的ZFN整合的转基因产生的转基因(IDS)水平高13倍。
进行了研究以评价用这两个ZFN对切割后随时间的推移捕获的转基因的表达。简言之,用编码第一代(47171:47898)或第二代(71557:71728)ZFN的rAAV2/6载体与人IDS转基因供体(SB-IDS)的组合一式三份地转导人iPSC来源的肝细胞。通过IDS酶活性测定来确定在转导后第5天和第7天的IDS酶活性(表示为每小时每mL细胞培养物上清液中的nmol产物[nmol/hr/mL])。以1:1:2的左ZFN:右ZFN:供体比率来递送ZFN和SB-IDS供体。在100:100:200(ZFN:ZFN:供体的MOI)的剂量下,用第二代ZFN对处理细胞导致在第5天和第7天的细胞上清液中的IDS分别比用第一代ZFN对处理多2倍和5倍。在300:300:600的剂量下,用第二代ZFN对处理细胞导致在第5天和第7天的上清液中的IDS分别比第一代ZFN对多7倍和21倍(参见图3E(ii))。
接下来,用编码47171/47898或71557/47898对的信使RNA(mRNA)以10或50ngmRNA/ZFN的浓度转染对于在左ZFN结合位点内的A至G SNP而言杂合的原代人肝细胞。通过MiSeq深度测序评价基因组DNA在野生型(A:T)或SNP(G:C)中靶位点处的基因修饰水平(***和缺失[***缺失]%)。结果(参见图3F(i)和图3F(ii))证明71557/47898对在含SNP和不含SNP的等位基因两处具有相等的活性。
还分析了在体外细胞中的基因修饰率。在三个生物重复实验中,评估了经10天暴露于人原代肝细胞中,在将ZFN(100K和600K MOI)经AAV2/6介导递送至细胞后的基因修饰水平。在第1天、第3天、第5天和第10天收获细胞,分离基因组DNA,对其进行PCR扩增和MiSeq深度测序。与47171/47898ZFN对相比,71557/71728ZFN对在10天内显示出更快的动力学(图3G)。早在第3天,71557/71728ZFN对的两个剂量水平的更快动力学就已明显,其中此对在100K和600K剂量水平下分别产生8.3%和17.8%***缺失,相比之下,47171/47898ZFN对分别产生2.2%和3.0%***缺失。71557/71728ZFN对显现出在第10天达到高于40%***缺失的饱和效应。与47171/47898ZFN对相比,用71557/71728ZFN对处理导致了更高水平的基因修饰。对于100K和600K MOI剂量水平,给予47171/47898ZFN对分别导致16.9%和25.4%***缺失的基因修饰水平,而71557/71728ZFN对分别产生35.1%和44.2%***缺失。在第10天,对于低剂量组和高剂量组,71557/71728ZFN对活性分别比47171/47898ZFN对活性高2.1倍和1.7倍。由于在10天的细胞培养实验期间没有获得完整的剂量-反应曲线,因此不可能计算和比较真实的EC50值。然而,上述结果提供了一个合理的估计:使用第2代ZFN的情况下在10天内ZFN活性增加了大约2倍。
还在人原代肝细胞中进行了评价研究,以表征与第二代ZFN对相关的任何脱靶切割事件。通过先前披露的方法(参见PCT公开WO 2018039440)确定脱靶切割。按照制造条件,使用QuickExtractTMDNA提取溶液(Lucigen)提取基因组DNA。
SMCHD1已被确定为ZFN的一个检测到的脱靶位点。通过MiSeq深度测序评价用编码47171/47898或71557/71728ZFN对的AAV2/6转导的人原代肝细胞。将人原代肝细胞用包含第二代ZFN对的AAV在以下MOI下处理10天:3K、10K、30K、100K、300K、600K和模拟物。观察到在中靶白蛋白位点处关于ZFN修饰的剂量反应。在用71557/71728ZFN对处理后,在第10天在白蛋白基因座处的平均***缺失%为0.16%、7%、15%、15%、21%、30%和44%(参见图3H,顶行)。NS-无统计学意义(双尾t检验),*-p值<0.05(双尾t检验)。在100K MOI剂量下,47171/47898ZFN显示平均中靶活性为17%***缺失且脱靶活性为0.11%***缺失(17/0.11比率=154);并且71557/71728ZFN显示平均中靶活性为35%且脱靶活性为0.08%(35/0.08比率=438)。比较两个比率,第2代ZFN的选择性比第1代ZFN的选择性高约2.8倍。在600K MOI剂量下,47171/47898ZFN显示平均中靶活性为25%***缺失且脱靶活性为0.36%***缺失(25/0.36比率=69);并且71557/71728ZFN显示平均中靶活性为44%且脱靶活性为0.34%(44/0.34比率=130)。比较两个比率,第2代ZFN的选择性比第一代ZFN的选择性高约1.9倍。在100K和600K MOI下,第1代和第2代ZFN的***缺失%分别为17%和35%、以及25%和44%,这指示第2代ZFN(ZFN 2.0)的效力比第1代ZFN的效力高约2倍(参见图3H)。
在用第1代左ZFN(47171)处理的细胞中,含SNP等位基因的ZFN活性仅是野生型等位基因活性的39%-44%。相比之下,在用第2代左ZFN(71557)处理的细胞中,含SNP等位基因的ZFN活性是野生型等位基因活性的91%-108%。
实施例3:使用聚阳离子肽标签增加ZFN活性
检查包括聚阳离子肽标签的ZFN的切割活性。所使用的肽是3xFlag标签(参见PCT公开号WO 2001027293),其包含氨基酸序列N末端-DYKDHDG-DYKDHDI-DYKDDDDK(SEQ IDNO:71)。编码3xFlag标签的序列在蛋白质的N末端处与ZFN融合蛋白融合(参见表1)。
针对在小鼠、NHP和人之间保守的7个超保守DNA靶标(参见Bejerano等人(2004)Science 302(5675):1321-1325)制备了本研究的ZFN,以控制被测试细胞的细胞来源。制备了针对超保守DNA靶标的74个ZFN对,并且在具有或不具有3X Flag标签的情况下在K562细胞中测试它们的活性。
结果(图4A)证明,聚阳离子3xFlag标签的存在对ZFN切割活性(如通过测量***缺失%的细胞测定所确定)非常有益,并且与缺乏Flag标签的ZFN相比,在包含3xFlag标签的这些ZFN对中,活性增加了平均4.1倍(图4B)。如图4C所示,3xFlag标签的添加导致ZFN活性增加2-3倍。
实施例4:WPRE调节元件的添加
在体外(图5A,参见美国专利公开2016-0326548)和在体内通过LNP递送后(图5B,参见美国专利公开号US-2018-0185516-A1)或通过AAV递送后(图5C,参见美国专利公开2016-0326548)都已经发现WPRE增加ZFN的活性。
在其自然形式中,WPRE含有WHV-X蛋白的部分开放阅读框(ORF)。在其他病毒元件像WHV(We2)增强子的情境下完全表达的WHV-X蛋白已与土拨鼠和小鼠中较高的肝癌风险相关(Hohne等人(1990)EMBO J9(4):1137-45;Flajolet等人(1998)J Virol 72(7):6175-80)。WHV-X蛋白显现出不是直接致癌的,但一些研究表明,在某些情况下,它可以用作弱辅因子以产生与嗜肝病毒(hepadnavirus)(对于人为乙型肝炎病毒;对于土拨鼠为土拨鼠肝炎病毒)感染相关的肝癌。所使用的WPRE序列含有WHV-X蛋白的部分开放阅读框,但不含有被认为增强WHV-X蛋白表达的We2增强子。此外,WPRE序列被置于终止密码子的3’处,并且不在启动子和治疗性转基因的框架内;因此,即使发生了终止密码子的通读,预计此序列不翻译。
因此,WPRE元件被添加到本文所述的多核苷酸中,通常位于核酸酶编码序列的3’处(图7)。所使用的WPRE元件可以是源自J02442变体的WPREmut6(Zanta-Boussif,同上),如下所示:
J02442 WPREmut6:
5’AATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTAATGCCTCTGTATCATGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCAACTGGATCCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCTCTCAATCCAGCGGACCTCCCTTCCCGAGGCCTTCTGCCGGTTCTGCGGCCTCTCCCGCGTCTTCGCTTTCGGCCTCCGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCCTG(SEQ IDNO:42)。
在一些实施方案中,WPRE元件是仅包含γ和α元件的截短构建体。
WPRE3的序列如下所示:
WPRE3:
GATAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTAGTTCTTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGG(SEQ ID NO:68)。
在一些实施方案中,使用J04514.1变体,并将mut6变体添加到序列中,如下所示:
J04514.1 WPREmut6:
AATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCCTG(SEQ IDNO:69)
所有三种WPRE变体都缺乏表达WHV X基因的能力,并且可以在本文所述的表达构建体中互换使用。
实施例5:5’UTR的添加
在1994年,Krieg和Melton(Nucl.Acid.Res 12(18):7057)描述了非洲爪蟾β球蛋白基因的5’非翻译区,并认识到其作为mRNA稳定序列的潜力。因此,在核酸酶编码表达盒的5’非翻译区中测试了此元件的序列([TG]CTTGTTCTTTTTGCAGAAGCTCAGAATAAACGCTCAACTTTGGCAGAT(SEQ ID NO:1),其中TG是任选的缩写βglb)。如上所述在K562细胞中测试构建体,但在转染后24小时测定细胞。
如图9所示,添加新的5’UTR导致ZFN活性增加2-3倍。
实施例6:增强的组合
在iPSC来源的人肝细胞中以各种组合尝试了包括3xFlag标签(“3xFlag”)、非洲爪蟾β-glb(“XBG”)和/或WPRE元件的ZFN。所使用的ZFN为42877/47931,并且将所述ZFN经由AAV6递送。转导后6天收获细胞,并针对白蛋白靶标测量活性。
结果证明,与初始载体相比,在所有三种元件的存在下,ZFN活性增强(参见图6)。
此外,因此构建了一系列8个表达构建体,其包括不具有或具有上述所有不同元件的各种组合的ZFN(参见图7A,示出了变体V1至V8)。所有变体都被用于AAV 6载体中,并与ApoE-hAAT启动子一起使用(Okuyama等人(1996)Hum Gene Ther 7(5):637-45)。这些载体还包含人β球蛋白-免疫球蛋白嵌合内含子序列,其被描述为由以下项构成的嵌合内含子:来自人β球蛋白基因的第一内含子的5’供***点以及来自免疫球蛋白基因重链可变区的内含子的分支和3’受***点(Promega)。这些构建体中使用的NLS来自SV40。
然后针对所递送的ZFN对(42877/47931)的切割活性对载体进行测试,其中两种ZFN以相同的变体结构递送。
如图8所示,与其他变体(包括目前使用的载体结构)相比,两种变体结构(变体4和变体8)(这两者都包括FLAG序列(表1))提供了更优异的结果。这些实验是在HepG2细胞中使用300,000MOI的包含不同载体的AAV进行的。
如上所述,71557/71728对是制备的包含各种增强的组合的一种白蛋白特异性ZFN对。图7B描绘了编码这些ZFN的AAV的示意图。所述对的元件显示在下表和序列中。将清楚的是,任何元件都可以用类似的序列取代,例如本领域已知或如上面的实施例4所示的WPRE序列代替下面的WPRE序列。
表4:SB71557 AAV(SEQ ID NO:43)的元件
Figure BDA0002714495690000801
Figure BDA0002714495690000811
Figure BDA0002714495690000821
71557 AAV完整序列:
Figure BDA0002714495690000822
Figure BDA0002714495690000831
Figure BDA0002714495690000841
表5:SB71728 AAV(SEQ ID NO:56)的元件
Figure BDA0002714495690000851
Figure BDA0002714495690000861
Figure BDA0002714495690000871
Figure BDA0002714495690000881
Figure BDA0002714495690000891
71728AAV完整序列:
Figure BDA0002714495690000892
Figure BDA0002714495690000901
Figure BDA0002714495690000911
使用上文所示ZFN对(71557/71728)制备一系列转基因载体(F9、IDS和IDUA)以***白蛋白基因中,参见图11,其描绘了hIDS***的结果。载体是AAV载体,并且全部包含侧接ZFN切割位点的同源区域(左同源臂:LA,和右同源臂:RA)。载体还包含剪接受体序列(SA)和多聚A信号序列(多聚A)。最后,全部包含5’和3’AAV ITR序列。因子9外显子2-9AAV转基因供体的元件和序列如下所示。
表6:因子9AAV(SEQ ID NO:59)的元件
Figure BDA0002714495690000912
Figure BDA0002714495690000921
Figure BDA0002714495690000931
F9 AAV的序列:
Figure BDA0002714495690000932
Figure BDA0002714495690000941
Figure BDA0002714495690000951
Figure BDA0002714495690000961
IDS AAV转基因供体的元件和序列如下所示:
表7:IDS AAV(SEQ ID NO:65)的元件
Figure BDA0002714495690000962
Figure BDA0002714495690000971
Figure BDA0002714495690000981
hIDS AAV的序列:
Figure BDA0002714495690000982
Figure BDA0002714495690000991
Figure BDA0002714495690001001
IDUA AAV转基因供体的元件和序列如下所示:
表8:IDUA AAV(SEQ ID NO:72)的元件
Figure BDA0002714495690001002
Figure BDA0002714495690001011
Figure BDA0002714495690001021
IDUA AAV的序列:
Figure BDA0002714495690001022
Figure BDA0002714495690001031
Figure BDA0002714495690001041
将白蛋白特异性71557/71728对用于切割靶人细胞中的白蛋白基因座,使得在转基因供体AAV(AAV-F.IX、AAV-IDS、AAV-IDUA)中的一种的存在下,将转基因通过同源定向靶向整合而整合到白蛋白基因座中。在整合后,转基因的表达受白蛋白启动子的调节。
根据标准方案,针对切割HepG2细胞中的白蛋白基因座和***FIX转基因,将71557/71728ZFN与47171/47898ZFN对进行比较。简言之,将HepG2细胞用ZFN批次进行转导,每个ZFN批次的MOI为1.25x106vg/细胞,总体积为500μL。将细胞在37℃/5%CO2培养箱中孵育过夜(12至24小时)。第二天,将FIX供体用FIX供体进行转导,MOI为2.5x106vg/细胞,总体积为500μL。在第9天,根据制造商的说明书通过ELISA使用VisuLize FIX抗原试剂盒(Affinity Biologicals)测试培养基中的FIX蛋白。
结果(参见图10C)指示,在此测定中,与使用47171/47898对时相比,使用71557/71728ZFN将FIX供体***导致多近3倍的FIX产生。
以类似的方式,根据标准方案,针对切割HepG2细胞中的白蛋白基因座和***IDUA转基因,将71557/71728ZFN与47171/47898ZFN对进行比较。结果(图14)证明,两对都能够将IDUA转基因在ZFN的引导下靶向整合到白蛋白基因座中,并且转基因能够被表达,使得在细胞上清液中存在IDUA活性。
实施例7:体内切割和靶向整合
还在体内测试了本文所述的构建体。
动物研究设计
42只至少6-8周龄的雄性野生型C57BL/6小鼠购自Charles River Laboratories,Inc.(马萨诸塞州威尔明顿(Wilmington,MA))。小鼠处理、注射和样品收集是由Experimur(伊利诺伊州芝加哥(Chicago IL))根据与畜牧业相关的标准协议进行的。在处理开始之前,将小鼠在Experimur隔离至少1周。
AAV是由Sangamo Therapeutics制备的,并在接收时储存在-70℃下直至使用。本研究中使用了五种工程化AAV2/6载体:编码具有标准结构的两种ZFN(“ZFN标准”)的两种AAV载体;编码具有改进结构的两种ZFN(“ZFN改进”,例如ZFN标准+5’UTR、3xFLAG和WPREmut6)的两种AAV载体;和编码侧接有小鼠白蛋白内含子1同源臂的无启动子hIDS转基因DNA模板(供体)的一种AAV载体。
将AAV2/6载体在配制品缓冲液(补充有35mM NaCl和5%甘油的PBS[pH 7.1])中稀释至如表1所示的剂量。在6与9周龄之间的小鼠被随机分配到第1-7组。向第1组的小鼠静脉内注射媒介物,即配制品缓冲液,并且向第2-7组的小鼠静脉内注射如下表9所示的不同剂量下的载体组合。注射总剂量体积为每只小鼠200μL。
表9:组名称和剂量
Figure BDA0002714495690001061
AAV载体构建体和包装
异二聚体ZFN靶向在FokI结构域1中含有专性异二聚体ELD/KKR突变的小鼠白蛋白基因座的内含子1。对于小鼠体内研究,使用标准ZFN(48641和31523)或改进的ZFN(具有5’UTR、N末端3xFLAG和3’WPREmut6的48641和31523)。对于人体外研究,使用标准ZFN(47171和47898)或ZFN2.0(具有5’UTR、N末端3xFLAG和3’WPREmut6的71557和71728)。先前已经描述过hIDS供体构建体(Sharma等人(2015)Blood 126,1777-1784)。hIDS供体构建体含有一个缺乏内源性IDS信号肽的hIDS cDNA、一个hF9剪接受体序列、以及与小鼠或人白蛋白靶位点同源的全长大约600bp的臂。重组AAV2/6载体(由AAV2 ITR和AAV6衣壳组成)是通过在10室CELLSTACK培养室(Corning)中三重转染293细胞来产生的,通过氯化铯密度梯度离心、接着透析来纯化,并如先前所述进行滴度(Sharma,同上)。
组织收集
在第56天,将小鼠在CO2烟雾室中以2L/min的流速实施安乐死,持续3min。收集肝样品并将其分成3个部分:一个部分用于在10%中性缓冲***中进行组织病理学分析,并且其余部分被快速冷冻并在-70℃下储存,直到加工以进行对IDS酶促活性的评估、RNA提取、蛋白质印迹和基因修饰。
通过下一代测序在肝中检测***缺失
按照制造商的方案使用AllPrep DNA/RNA/蛋白质迷你试剂盒(Qiagen)从小鼠肝样品提取基因组DNA。按照制造商的方案使用QIAamp DNA Micro Kit(Qiagen)提取iPS来源的肝细胞gDNA。使用表10中所描述的引物通过PCR扩增ZFN靶位点。使用MiSeq(Illumina)对PCR产物进行测序,并如先前所述进行分析(Laoharawee,K.等人(2018)Mol.Ther.26,1127-1136)。
表10:用于MiSeq分析的引物
Figure BDA0002714495690001071
RT-qPCR
按照制造商的方案使用AllPrep DNA/RNA/蛋白质迷你试剂盒(Qiagen)从肝样品提取总RNA。按照制造商的方案使用SuperScriptTMIII First-Strand Synthesis SuperMix(Thermo Fisher Scientific)产生cDNA。使用TaqMan Universal PCR主混合物(ThermoFisher Scientific)进行qPCR。关于引物和探针序列,参见表11。将数据针对肌动蛋白进行归一化。
表11:RT-qPCR引物和探针
Figure BDA0002714495690001072
蛋白质印迹
如之前所述3,从肝样品制备总蛋白质提取物。在通过蛋白质印迹检测IDS之前,使用Pierce双金鸡宁酸(BCA)蛋白质测定试剂盒(Thermo Fisher Scientific)确定蛋白质浓度。所使用的抗体是IDS(AF2449;R&D Systems)和甘油醛3-磷酸脱氢酶(GAPDH)(A00191-40,GeneScript)。
IDS测定
如先前所述(Laoharawee,K.等人,同上),使用1ug总肝蛋白质提取物或1:3稀释的iPS来源的肝细胞条件培养基进行测定。
在注射后56天从经处理的动物收集肝样品,并如上所述测量白蛋白切割活性。此外,通过以下方式来分析转基因表达:将肝mRNA逆转录并使用覆盖内源性小鼠白蛋白外显子1与转基因人IDS之间的连接的TaqMan引物-探针对产物进行qPCR。在肝总蛋白质提取物与人特异性IDS抗体杂交的情况下还进行IDS的蛋白质印迹(GAPDH用作加载对照)。
如图10A和图10B所示,与没有修饰的AAV载体相比,包括本文所述修饰(5’UTR、FLAG、mut6WPRE)的AAV载体在体内切割的白蛋白基因增加多达7倍。类似地,经修饰的ZFN能够导致F.IX供体整合的增加(参见图10C)。
此外,如图11至图13所示,与由编码未经修饰的ZFN的AAV载体介导的整合相比,当将编码经修饰的ZFN的AAV载体用于靶向整合时供体IDS转基因在体内供体转基因(IDS)的表达增加了18倍(图11和图12),并且血浆中(IDS的)酶促活性也增加了。图11A示出了本研究中使用的三种不同供体的示意图:SB-IDS、SB-F9和SB-IDUA。如图11B所示,经修饰的ZFN导致原代肝细胞中针对白蛋白靶标的活性增加,其中与原始ZFN对(“当前”)相比,改进的ZFN(“ZFN 2.0”)导致在中剂量下的***缺失百分比增加了34倍,并且在高剂量下的活性增加了22倍。当这些ZFN与IDS供体配对时,与标准ZFN(“当前”)相比,对于改进的(“ZFN 2.0”)ZFN,在中剂量下在细胞上清液中检测到IDS活性增加了5倍,并且在较高剂量下增加了21倍。
IDUA活性测定
根据本领域已知的方法测量IDUA活性。例如,一个示例性测定如下:根据已确立的测定条件(Whitley 1987同上;Whitley 1986,同上)使用4-甲基伞形酮基α-L-艾杜糖醛酸苷(iduronide)(Glycosynth)作为底物通过荧光测定确定了α-L-艾杜糖醛酸酶的活性。将4MU-艾杜糖醛酸苷底物用蚁酸钠缓冲液(0.4M,pH 3.5)在窄的合理最佳pH范围内(Hopwood等人(1979),Clin Chim Acta.92:257-265;Whitley 1986同上)并以所选底物浓度进行稀释。然后,将25μL底物等分试样与25μL生物样品(例如血浆、白细胞、组织匀浆)混合。将混合物在37℃下孵育30min,并且添加200μL甘氨酸碳酸盐缓冲液(pH 10.4)以猝灭反应。α-L-艾杜糖醛酸酶催化将非荧光底物(4MU-艾杜糖醛酸苷)切割成荧光产物(4-MU)。将4-甲基伞形酮(4-MU,Sigma)用于制作标准曲线。使用在355nm处激发和460nm处发射的Bio-Tek读板器测量所得荧光。如用Pierce蛋白质测定试剂盒(Fisher)所确定,将α-L-艾杜糖醛酸酶活性以每mg蛋白质的单位(每小时转化为产物的nmol)表示。所有反应一式三份地运行。
数据证明,AAV-ZFN表达构建体的优化在基因组编辑方面产生了令人惊讶和出乎意料的优点(包括切割增加多达7倍和转基因表达增加多达18倍),体外和体内基因组编辑构建体两者都用于纠正单基因疾病。因此,通过优化组成ZFN表达载体的元件,在体外和在体内实现了总体ZFN活性和/或特异性的增强。这些方法可以用于将任何转基因供体(例如,IDS、IDUA和F.IX)***白蛋白基因座中。由转基因编码的蛋白质的表达和分泌允许有需要的受试者在体内产生。
本文提及的所有专利、专利申请和出版物均通过引用以其整体特此并入。
虽然已经出于清晰理解的目的通过说明和实施例详细提供了公开文本,但是本领域技术人员将了解,可以在不背离本公开文本的精神或范围的情况下进行各种改变和修改。因此,前述说明和实施例不应视为限制性的。
序列表
<110> 桑格摩生物治疗股份有限公司
<120> 工程化靶标特异性核酸酶
<130> 8325-0169.40
<140>
<141>
<150> 62/802,092
<151> 2019-02-06
<150> 62/795,937
<151> 2019-01-23
<150> 62/758,786
<151> 2018-11-12
<150> 62/728,226
<151> 2018-09-07
<150> 62/628,016
<151> 2018-02-08
<160> 72
<170> PatentIn版本3.5
<210> 1
<211> 50
<212> DNA
<213> 非洲爪蟾属物种(Xenopus sp.)
<220>
<221> 尚未归类的特征
<222> (1)..(2)
<223> 此区域可能以其整体或者可能不以其整体存在
<400> 1
tgcttgttct ttttgcagaa gctcagaata aacgctcaac tttggcagat 50
<210> 2
<211> 579
<212> PRT
<213> 海床动性微菌(Planomicrobium okeanokoites)
<400> 2
Met Val Ser Lys Ile Arg Thr Phe Gly Trp Val Gln Asn Pro Gly Lys
1 5 10 15
Phe Glu Asn Leu Lys Arg Val Val Gln Val Phe Asp Arg Asn Ser Lys
20 25 30
Val His Asn Glu Val Lys Asn Ile Lys Ile Pro Thr Leu Val Lys Glu
35 40 45
Ser Lys Ile Gln Lys Glu Leu Val Ala Ile Met Asn Gln His Asp Leu
50 55 60
Ile Tyr Thr Tyr Lys Glu Leu Val Gly Thr Gly Thr Ser Ile Arg Ser
65 70 75 80
Glu Ala Pro Cys Asp Ala Ile Ile Gln Ala Thr Ile Ala Asp Gln Gly
85 90 95
Asn Lys Lys Gly Tyr Ile Asp Asn Trp Ser Ser Asp Gly Phe Leu Arg
100 105 110
Trp Ala His Ala Leu Gly Phe Ile Glu Tyr Ile Asn Lys Ser Asp Ser
115 120 125
Phe Val Ile Thr Asp Val Gly Leu Ala Tyr Ser Lys Ser Ala Asp Gly
130 135 140
Ser Ala Ile Glu Lys Glu Ile Leu Ile Glu Ala Ile Ser Ser Tyr Pro
145 150 155 160
Pro Ala Ile Arg Ile Leu Thr Leu Leu Glu Asp Gly Gln His Leu Thr
165 170 175
Lys Phe Asp Leu Gly Lys Asn Leu Gly Phe Ser Gly Glu Ser Gly Phe
180 185 190
Thr Ser Leu Pro Glu Gly Ile Leu Leu Asp Thr Leu Ala Asn Ala Met
195 200 205
Pro Lys Asp Lys Gly Glu Ile Arg Asn Asn Trp Glu Gly Ser Ser Asp
210 215 220
Lys Tyr Ala Arg Met Ile Gly Gly Trp Leu Asp Lys Leu Gly Leu Val
225 230 235 240
Lys Gln Gly Lys Lys Glu Phe Ile Ile Pro Thr Leu Gly Lys Pro Asp
245 250 255
Asn Lys Glu Phe Ile Ser His Ala Phe Lys Ile Thr Gly Glu Gly Leu
260 265 270
Lys Val Leu Arg Arg Ala Lys Gly Ser Thr Lys Phe Thr Arg Val Pro
275 280 285
Lys Arg Val Tyr Trp Glu Met Leu Ala Thr Asn Leu Thr Asp Lys Glu
290 295 300
Tyr Val Arg Thr Arg Arg Ala Leu Ile Leu Glu Ile Leu Ile Lys Ala
305 310 315 320
Gly Ser Leu Lys Ile Glu Gln Ile Gln Asp Asn Leu Lys Lys Leu Gly
325 330 335
Phe Asp Glu Val Ile Glu Thr Ile Glu Asn Asp Ile Lys Gly Leu Ile
340 345 350
Asn Thr Gly Ile Phe Ile Glu Ile Lys Gly Arg Phe Tyr Gln Leu Lys
355 360 365
Asp His Ile Leu Gln Phe Val Ile Pro Asn Arg Gly Val Thr Lys Gln
370 375 380
Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys
385 390 395 400
Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg
405 410 415
Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe
420 425 430
Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys
435 440 445
Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val
450 455 460
Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly
465 470 475 480
Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn
485 490 495
Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val
500 505 510
Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr
515 520 525
Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala
530 535 540
Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala
545 550 555 560
Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu
565 570 575
Ile Asn Phe
<210> 3
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 3
Asp Tyr Lys Asp Asp Asp Lys
1 5
<210> 4
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 可能存在或可能不存在
<400> 4
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys
20
<210> 5
<211> 7
<212> PRT
<213> 猿猴病毒40
<400> 5
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 6
<211> 9
<212> PRT
<213> 未知
<220>
<223> 未知的描述:C-myc NLS序列
<400> 6
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 7
<211> 10
<212> PRT
<213> 丁型肝炎病毒
<400> 7
Glu Gly Ala Pro Pro Ala Lys Arg Ala Arg
1 5 10
<210> 8
<211> 8
<212> PRT
<213> 未知
<220>
<223> 未知的描述:多瘤T蛋白NLS序列
<400> 8
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 9
<211> 18
<212> PRT
<213> 未知
<220>
<223> 未知的描述:核质蛋白羧基尾部NLS序列
<400> 9
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
Leu Asp
<210> 10
<211> 38
<212> PRT
<213> 未知
<220>
<223> 未知的描述:NLS序列
<400> 10
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 11
<211> 17
<212> PRT
<213> 人T细胞白血病病毒1型
<400> 11
Pro Lys Thr Arg Arg Arg Pro Arg Arg Ser Gln Arg Lys Arg Pro Pro
1 5 10 15
Thr
<210> 12
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 12
tttgggatag ttatgaattc aatcttca 28
<210> 13
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 13
cctatccatt gcactatgct ttatttaa 28
<210> 14
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 14
Gln Ser Gly Asn Leu Ser Arg
1 5
<210> 15
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 15
Leu Lys Gln Asn Leu Cys Met
1 5
<210> 16
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 16
Trp Ala Asp Asn Leu Gln Asn
1 5
<210> 17
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 17
Thr Ser Gly Asn Leu Thr Arg
1 5
<210> 18
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 18
Arg Gln Ser His Leu Cys Leu
1 5
<210> 19
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 19
Gln Ser Gly Asn Leu Ala Arg
1 5
<210> 20
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 20
Trp Gln Ser Asn Leu Gln Asn
1 5
<210> 21
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 21
Arg Arg Ser His Leu Thr Ser
1 5
<210> 22
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 22
Leu Ile Thr Thr Leu Arg Asn
1 5
<210> 23
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 23
Trp Ala Ser Asn Leu Gln Asn
1 5
<210> 24
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 24
Thr Pro Gln Leu Leu Asp Arg
1 5
<210> 25
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 25
Leu Lys His Asn Leu Leu Thr
1 5
<210> 26
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 26
Asp Gln Ser Asn Leu Asn Ala
1 5
<210> 27
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 27
Arg Asn Phe Ser Leu Thr Met
1 5
<210> 28
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 28
Leu Arg His Asp Leu Asp Arg
1 5
<210> 29
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 29
His Arg Ser Asn Leu Asn Lys
1 5
<210> 30
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 30
Gln Ser Ser Asp Leu Ser Arg
1 5
<210> 31
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 31
Asp Gln Ser Asn Leu Arg Ala
1 5
<210> 32
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 32
Leu Arg His Asp Leu Glu Arg
1 5
<210> 33
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 33
Leu Lys Trp Asn Leu Arg Thr
1 5
<210> 34
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<220>
<221> 经修饰的碱基
<222> (21)..(24)
<223> a、c、t、g、未知或其他
<400> 34
acacgacgct cttccgatct nnnnttgagt ttgaatgcac agat 44
<210> 35
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<220>
<221> 经修饰的碱基
<222> (21)..(24)
<223> a、c、t、g、未知或其他
<400> 35
gacgtgtgct cttccgatct nnnngaaaca gggagagaaa aacc 44
<210> 36
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<220>
<221> 经修饰的碱基
<222> (21)..(24)
<223> a、c、t、g、未知或其他
<400> 36
acacgacgct cttccgatct nnnngcacta aggaaagtgc aaag 44
<210> 37
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<220>
<221> 经修饰的碱基
<222> (21)..(24)
<223> a、c、t、g、未知或其他
<400> 37
gacgtgtgct cttccgatct nnnnaaccaa gaagacagac taaaatg 47
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 38
caggggtgtg tttcgtcgag 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 39
atgagcagga cgttaagcgc 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成探针
<400> 40
aaacccaggc caactcaact 20
<210> 41
<211> 51
<212> DNA
<213> 智人(Homo sapiens)
<400> 41
attgaattca tarctatccc aaagacctat ccattgcact atgctttatt t 51
<210> 42
<211> 592
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 42
aatcaacctc tggattacaa aatttgtgaa agattgactg atattcttaa ctatgttgct 60
ccttttacgc tgtgtggata tgctgcttta atgcctctgt atcatgctat tgcttcccgt 120
acggctttcg ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180
tggcccgttg tccgtcaacg tggcgtggtg tgctctgtgt ttgctgacgc aacccccact 240
ggctggggca ttgccaccac ctgtcaactc ctttctggga ctttcgcttt ccccctcccg 300
atcgccacgg cagaactcat cgccgcctgc cttgcccgct gctggacagg ggctaggttg 360
ctgggcactg ataattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 420
gcctgtgttg ccaactggat cctgcgcggg acgtccttct gctacgtccc ttcggctctc 480
aatccagcgg acctcccttc ccgaggcctt ctgccggttc tgcggcctct cccgcgtctt 540
cgctttcggc ctccgacgag tcggatctcc ctttgggccg cctccccgcc tg 592
<210> 43
<211> 3195
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 43
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggcctaag cttgagctct tcgaaaggct cagaggcaca caggagtttc 180
tgggctcacc ctgccccctt ccaacccctc agttcccatc ctccagcagc tgtttgtgtg 240
ctgcctctga agtccacact gaacaaactt cagcctactc atgtccctaa aatgggcaaa 300
cattgcaagc agcaaacagc aaacacacag ccctccctgc ctgctgacct tggagctggg 360
gcagaggtca gagacctctc tgggcccatg ccacctccaa catccactcg accccttgga 420
atttcggtgg agaggagcag aggttgtcct ggcgtggttt aggtagtgtg agaggggtcc 480
cggggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca 540
gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca 600
ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg 660
tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg 720
gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca 780
gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc 840
tcctcagctt caggcaccac cactgacctg ggacagtcct aggtgcttgt tctttttgca 900
gaagctcaga ataaacgctc aactttggca gatactagtc aggtaagtat caaggttaca 960
agacaggttt aaggagacca atagaaactg ggcttgtcga gacagagaag actcttgcgt 1020
ttctgatagg cacctattgg tcttactgac atccactttg cctttctctc cacaggaccg 1080
gtgccatgga ctacaaagac catgacggtg attataaaga tcatgacatc gattacaagg 1140
atgacgatga caagatggcc cccaagaaga agaggaaggt cggcattcat ggggtacccg 1200
ccgctatggc tgagaggccc ttccagtgtc gaatctgcat gcagaacttc agtcagtccg 1260
gcaacctggc ccgccacatc cgcacccaca ccggcgagaa gccttttgcc tgtgacattt 1320
gtgggaggaa atttgccctg aagcagaacc tgtgtatgca taccaagata cacacgggcg 1380
agaagccctt ccagtgtcga atctgcatgc agaagtttgc ctggcagtcc aacctgcaga 1440
accataccaa gatacacacg ggcgagaagc ccttccagtg tcgaatctgc atgcgtaact 1500
tcagtacctc cggcaacctg acccgccaca tccgcaccca caccggcgag aagccttttg 1560
cctgtgacat ttgtgggagg aaatttgccc gccgctccca cctgacctcc cataccaaga 1620
tacacctgcg gggatcccag ctggtgaaga gcgagctgga ggagaagaag tccgagctgc 1680
ggcacaagct gaagtacgtg ccccacgagt acatcgagct gatcgagatc gccaggaaca 1740
gcacccagga ccgcatcctg gagatgaagg tgatggagtt cttcatgaag gtgtacggct 1800
acaggggaaa gcacctgggc ggaagcagaa agcctgacgg cgccatctat acagtgggca 1860
gccccatcga ttacggcgtg atcgtggaca caaaggccta cagcggcggc tacaatctgc 1920
ctatcggcca ggccgacgag atggagagat acgtggagga gaaccagacc cgggataagc 1980
acctcaaccc caacgagtgg tggaaggtgt accctagcag cgtgaccgag ttcaagttcc 2040
tgttcgtgag cggccacttc aagggcaact acaaggccca gctgaccagg ctgaaccaca 2100
tcaccaactg cgacggcgcc gtgctgagcg tggaggagct gctgatcggc ggcgagatga 2160
tcaaagccgg caccctgaca ctggaggagg tgcggcgcaa gttcaacaac ggcgagatca 2220
acttcagatc ttgataactc gagtctagaa atcaacctct ggattacaaa atttgtgaaa 2280
gattgactga tattcttaac tatgttgctc cttttacgct gtgtggatat gctgctttaa 2340
tgcctctgta tcatgctatt gcttcccgta cggctttcgt tttctcctcc ttgtataaat 2400
cctggttgct gtctctttat gaggagttgt ggcccgttgt ccgtcaacgt ggcgtggtgt 2460
gctctgtgtt tgctgacgca acccccactg gctggggcat tgccaccacc tgtcaactcc 2520
tttctgggac tttcgctttc cccctcccga tcgccacggc agaactcatc gccgcctgcc 2580
ttgcccgctg ctggacaggg gctaggttgc tgggcactga taattccgtg gtgttgtcgg 2640
ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc caactggatc ctgcgcggga 2700
cgtccttctg ctacgtccct tcggctctca atccagcgga cctcccttcc cgaggccttc 2760
tgccggttct gcggcctctc ccgcgtcttc gctttcggcc tccgacgagt cggatctccc 2820
tttgggccgc ctccccgcct ggctagcctg tgccttctag ttgccagcca tctgttgttt 2880
gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat 2940
aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg 3000
tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg 3060
tgggctctat gcggccgcgt cgagcgcagg aacccctagt gatggagttg gccactccct 3120
ctctgcgcgc tcgctcgctc actgaggccg cccgggcttt gcccgggcgg cctcagtgag 3180
cgagcgagcg cgcag 3195
<210> 44
<211> 130
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 44
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 45
<211> 321
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 45
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg g 321
<210> 46
<211> 393
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 46
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300
cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 360
cagcttcagg caccaccact gacctgggac agt 393
<210> 47
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 47
cttgttcttt ttgcagaagc tcagaataaa cgctcaactt tggcagat 48
<210> 48
<211> 133
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 48
gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60
cagagaagac tcttgcgttt ctgataggca cctattggtc ttactgacat ccactttgcc 120
tttctctcca cag 133
<210> 49
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 49
gactacaaag accatgacgg tgattataaa gatcatgaca tcgattacaa ggatgacgat 60
gacaag 66
<210> 50
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 50
cccaagaaga agaggaaggt c 21
<210> 51
<211> 432
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 51
gccgctatgg ctgagaggcc cttccagtgt cgaatctgca tgcagaactt cagtcagtcc 60
ggcaacctgg cccgccacat ccgcacccac accggcgaga agccttttgc ctgtgacatt 120
tgtgggagga aatttgccct gaagcagaac ctgtgtatgc ataccaagat acacacgggc 180
gagaagccct tccagtgtcg aatctgcatg cagaagtttg cctggcagtc caacctgcag 240
aaccatacca agatacacac gggcgagaag cccttccagt gtcgaatctg catgcgtaac 300
ttcagtacct ccggcaacct gacccgccac atccgcaccc acaccggcga gaagcctttt 360
gcctgtgaca tttgtgggag gaaatttgcc cgccgctccc acctgacctc ccataccaag 420
atacacctgc gg 432
<210> 52
<211> 600
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 52
cagctggtga agagcgagct ggaggagaag aagtccgagc tgcggcacaa gctgaagtac 60
gtgccccacg agtacatcga gctgatcgag atcgccagga acagcaccca ggaccgcatc 120
ctggagatga aggtgatgga gttcttcatg aaggtgtacg gctacagggg aaagcacctg 180
ggcggaagca gaaagcctga cggcgccatc tatacagtgg gcagccccat cgattacggc 240
gtgatcgtgg acacaaaggc ctacagcggc ggctacaatc tgcctatcgg ccaggccgac 300
gagatggaga gatacgtgga ggagaaccag acccgggata agcacctcaa ccccaacgag 360
tggtggaagg tgtaccctag cagcgtgacc gagttcaagt tcctgttcgt gagcggccac 420
ttcaagggca actacaaggc ccagctgacc aggctgaacc acatcaccaa ctgcgacggc 480
gccgtgctga gcgtggagga gctgctgatc ggcggcgaga tgatcaaagc cggcaccctg 540
acactggagg aggtgcggcg caagttcaac aacggcgaga tcaacttcag atcttgataa 600
<210> 53
<211> 592
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 53
aatcaacctc tggattacaa aatttgtgaa agattgactg atattcttaa ctatgttgct 60
ccttttacgc tgtgtggata tgctgcttta atgcctctgt atcatgctat tgcttcccgt 120
acggctttcg ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180
tggcccgttg tccgtcaacg tggcgtggtg tgctctgtgt ttgctgacgc aacccccact 240
ggctggggca ttgccaccac ctgtcaactc ctttctggga ctttcgcttt ccccctcccg 300
atcgccacgg cagaactcat cgccgcctgc cttgcccgct gctggacagg ggctaggttg 360
ctgggcactg ataattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 420
gcctgtgttg ccaactggat cctgcgcggg acgtccttct gctacgtccc ttcggctctc 480
aatccagcgg acctcccttc ccgaggcctt ctgccggttc tgcggcctct cccgcgtctt 540
cgctttcggc ctccgacgag tcggatctcc ctttgggccg cctccccgcc tg 592
<210> 54
<211> 223
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 54
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180
gggaagacaa tagcaggcat gctggggatg cggtgggctc tat 223
<210> 55
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 55
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 108
<210> 56
<211> 3273
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 56
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggcctaag cttgagctct tcgaaaggct cagaggcaca caggagtttc 180
tgggctcacc ctgccccctt ccaacccctc agttcccatc ctccagcagc tgtttgtgtg 240
ctgcctctga agtccacact gaacaaactt cagcctactc atgtccctaa aatgggcaaa 300
cattgcaagc agcaaacagc aaacacacag ccctccctgc ctgctgacct tggagctggg 360
gcagaggtca gagacctctc tgggcccatg ccacctccaa catccactcg accccttgga 420
atttcggtgg agaggagcag aggttgtcct ggcgtggttt aggtagtgtg agaggggtcc 480
cggggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca 540
gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca 600
ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg 660
tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg 720
gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca 780
gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc 840
tcctcagctt caggcaccac cactgacctg ggacagtcct aggtgcttgt tctttttgca 900
gaagctcaga ataaacgctc aactttggca gatactagtc aggtaagtat caaggttaca 960
agacaggttt aaggagacca atagaaactg ggcttgtcga gacagagaag actcttgcgt 1020
ttctgatagg cacctattgg tcttactgac atccactttg cctttctctc cacaggaccg 1080
gtgccatgga ctacaaagac catgacggtg attataaaga tcatgacatc gattacaagg 1140
atgacgatga caagatggcc cccaagaaga agaggaaggt cggcattcat ggggtacccg 1200
ccgctatggc tgagaggccc ttccagtgtc gaatctgcat gcgtaacttc agtcagtcct 1260
ccgacctgtc ccgccacatc cgcacccaca ccggcgagaa gccttttgcc tgtgacattt 1320
gtgggaggaa atttgccctg aagcacaacc tgctgaccca taccaagata cacacgggcg 1380
agaagccctt ccagtgtcga atctgcatgc agaacttcag tgaccagtcc aacctgcgcg 1440
cccacatccg cacccacacc ggcgagaagc cttttgcctg tgacatttgt gggaggaaat 1500
ttgcccgcaa cttctccctg accatgcata ccaagataca caccggagag cgcggcttcc 1560
agtgtcgaat ctgcatgcgt aacttcagtc tgcgccacga cctggagcgc cacatccgca 1620
cccacaccgg cgagaagcct tttgcctgtg acatttgtgg gaggaaattt gcccaccgct 1680
ccaacctgaa caagcatacc aagatacacc tgcggggatc ccagctggtg aagagcgagc 1740
tggaggagaa gaagtccgag ctgcggcaca agctgaagta cgtgccccac gagtacatcg 1800
agctgatcga gatcgccagg aacagcaccc aggaccgcat cctggagatg aaggtgatgg 1860
agttcttcat gaaggtgtac ggctacaggg gaaagcacct gggcggaagc agaaagcctg 1920
acggcgccat ctatacagtg ggcagcccca tcgattacgg cgtgatcgtg gacacaaagg 1980
cctacagcgg cggctacaat ctgagcatcg gccaggccga cgagatgcag agatacgtga 2040
aggagaacca gacccggaat aagcacatca accccaacga gtggtggaag gtgtacccta 2100
gcagcgtgac cgagttcaag ttcctgttcg tgagcggcca cttcaagggc aactacaagg 2160
cccagctgac caggctgaac cgcaaaacca actgcaatgg cgccgtgctg agcgtggagg 2220
agctgctgat cggcggcgag atgatcaaag ccggcaccct gacactggag gaggtgcggc 2280
gcaagttcaa caacggcgag atcaacttct gataactcga gtctagaaat caacctctgg 2340
attacaaaat ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt 2400
gtggatatgc tgctttaatg cctctgtatc atgctattgc ttcccgtacg gctttcgttt 2460
tctcctcctt gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtcc 2520
gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg 2580
ccaccacctg tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag 2640
aactcatcgc cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata 2700
attccgtggt gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc tgtgttgcca 2760
actggatcct gcgcgggacg tccttctgct acgtcccttc ggctctcaat ccagcggacc 2820
tcccttcccg aggccttctg ccggttctgc ggcctctccc gcgtcttcgc tttcggcctc 2880
cgacgagtcg gatctccctt tgggccgcct ccccgcctgg ctagcctgtg ccttctagtt 2940
gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 3000
ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 3060
ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 3120
ggcatgctgg ggatgcggtg ggctctatgc ggccgcgtcg agcgcaggaa cccctagtga 3180
tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccgcc cgggctttgc 3240
ccgggcggcc tcagtgagcg agcgagcgcg cag 3273
<210> 57
<211> 516
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 57
gccgctatgg ctgagaggcc cttccagtgt cgaatctgca tgcgtaactt cagtcagtcc 60
tccgacctgt cccgccacat ccgcacccac accggcgaga agccttttgc ctgtgacatt 120
tgtgggagga aatttgccct gaagcacaac ctgctgaccc ataccaagat acacacgggc 180
gagaagccct tccagtgtcg aatctgcatg cagaacttca gtgaccagtc caacctgcgc 240
gcccacatcc gcacccacac cggcgagaag ccttttgcct gtgacatttg tgggaggaaa 300
tttgcccgca acttctccct gaccatgcat accaagatac acaccggaga gcgcggcttc 360
cagtgtcgaa tctgcatgcg taacttcagt ctgcgccacg acctggagcg ccacatccgc 420
acccacaccg gcgagaagcc ttttgcctgt gacatttgtg ggaggaaatt tgcccaccgc 480
tccaacctga acaagcatac caagatacac ctgcgg 516
<210> 58
<211> 594
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 58
cagctggtga agagcgagct ggaggagaag aagtccgagc tgcggcacaa gctgaagtac 60
gtgccccacg agtacatcga gctgatcgag atcgccagga acagcaccca ggaccgcatc 120
ctggagatga aggtgatgga gttcttcatg aaggtgtacg gctacagggg aaagcacctg 180
ggcggaagca gaaagcctga cggcgccatc tatacagtgg gcagccccat cgattacggc 240
gtgatcgtgg acacaaaggc ctacagcggc ggctacaatc tgagcatcgg ccaggccgac 300
gagatgcaga gatacgtgaa ggagaaccag acccggaata agcacatcaa ccccaacgag 360
tggtggaagg tgtaccctag cagcgtgacc gagttcaagt tcctgttcgt gagcggccac 420
ttcaagggca actacaaggc ccagctgacc aggctgaacc gcaaaaccaa ctgcaatggc 480
gccgtgctga gcgtggagga gctgctgatc ggcggcgaga tgatcaaagc cggcaccctg 540
acactggagg aggtgcggcg caagttcaac aacggcgaga tcaacttctg ataa 594
<210> 59
<211> 2474
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 59
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggcctaag cttgagcgga gttccaattg tactgtacag aaccatggtc 180
acatgtttaa cgctagcgtg ccgacctggt aaactgatca gtgggtgcac ttaggactgc 240
gtcttacgct aatcacatgc gtgcggccgc tttattctat tttcccagta aaataaagtt 300
ttagtaaact ctgcatcttt aaagaattat tttggcattt atttctaaaa tggcatagta 360
ttttgtattt gtgaagtctt acaaggttat cttattaata aaattcaaac atcctaggta 420
aaaaaaaaaa aaggtcagaa ttgtttagtg actgtaattt tcttttgcgc actaaggaaa 480
gtgcaaagta acttagagtg actgaaactt cacagaatag ggttgaagat tgaattcata 540
actatcccaa ggtaccacta aagaattatt cttttacatt tcagtttttc ttgatcatga 600
aaacgccaac aaaatcctga accggcccaa gcggtacaac tcaggcaagc tggaagagtt 660
cgtgcagggc aacctggaac gggagtgcat ggaagagaag tgcagcttcg aggaagcccg 720
ggaggtgttc gagaacaccg agcggaccac cgagttctgg aagcagtacg tggacggcga 780
ccagtgcgag tcaaacccct gcctgaacgg cggcagctgc aaggacgata tcaacagcta 840
cgagtgctgg tgccccttcg gcttcgaggg caagaactgc gagctggacg tgacctgcaa 900
catcaagaac ggccgctgcg agcagttctg caagaacagc gccgacaaca aggtggtgtg 960
ctcatgcact gagggctacc ggctggccga gaaccagaag agctgcgagc ccgccgtgcc 1020
cttcccctgc ggcagagtgt ccgtgagcca gaccagcaag ctgaccaggg ccgaggccgt 1080
gttccctgac gtggactacg tgaactcaac cgaggccgag acaatcctgg acaacatcac 1140
ccagagcacc cagtccttca acgacttcac ccgggtggtg ggcggcgagg acgccaagcc 1200
cggccagttc ccttggcagg tggtgctgaa cggcaaggtg gacgccttct gcggcggctc 1260
aatcgtgaac gagaagtgga tcgtgacagc cgcccactgc gtggagacag gcgtgaagat 1320
caccgtggtg gccggcgaac acaatatcga ggaaaccgag cacaccgagc agaaacggaa 1380
cgtgatccgg attatccccc accacaacta caacgccgcc atcaacaagt acaaccacga 1440
tatcgccctg ctggaactgg acgagcctct ggtgctgaat tcatacgtga cccccatctg 1500
tatcgccgac aaagagtaca ccaacatctt tctgaagttc ggcagcggct acgtgtccgg 1560
ctggggcagg gtgttccaca agggccgcag cgccctggtg ctgcagtacc tgcgggtgcc 1620
cctggtggac agagccacct gcctgcggtc aaccaagttc accatctaca acaacatgtt 1680
ctgcgccggc ttccacgagg gcggcaggga cagctgccag ggcgacagcg gcggacccca 1740
cgtgaccgag gtggagggca ccagctttct gaccggcatc atctcatggg gcgaggaatg 1800
cgccatgaag ggcaagtacg gaatctacac taaggtgtca agatacgtga actggatcaa 1860
agagaaaacc aagctgacct gagtttaaac tgtgccttct agttgccagc catctgttgt 1920
ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta 1980
ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg 2040
ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc 2100
ggtgggctct atggaccggt ctatccattg cactatgctt tatttaaaaa ccacaaaacc 2160
tgtgctgttg atctcataaa tagaacttgt atttatattt attttcattt tagtctgtct 2220
ggatccacaa attaatcgaa cctgcagctg atatcgacgc ttaagtaggg cttagcaaac 2280
gcgtctccaa cgtttcgccg ttaacacccc acatagtgag tggtcttagt agtccgggtg 2340
tttaaactga aagataactc gagcgcagga acccctagtg atggagttgg ccactccctc 2400
tctgcgcgct cgctcgctca ctgaggccgc ccgggctttg cccgggcggc ctcagtgagc 2460
gagcgagcgc gcag 2474
<210> 60
<211> 280
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 60
tttattctat tttcccagta aaataaagtt ttagtaaact ctgcatcttt aaagaattat 60
tttggcattt atttctaaaa tggcatagta ttttgtattt gtgaagtctt acaaggttat 120
cttattaata aaattcaaac atcctaggta aaaaaaaaaa aaggtcagaa ttgtttagtg 180
actgtaattt tcttttgcgc actaaggaaa gtgcaaagta acttagagtg actgaaactt 240
cacagaatag ggttgaagat tgaattcata actatcccaa 280
<210> 61
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 61
actaaagaat tattctttta catttcag 28
<210> 62
<211> 1298
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 62
tttttcttga tcatgaaaac gccaacaaaa tcctgaaccg gcccaagcgg tacaactcag 60
gcaagctgga agagttcgtg cagggcaacc tggaacggga gtgcatggaa gagaagtgca 120
gcttcgagga agcccgggag gtgttcgaga acaccgagcg gaccaccgag ttctggaagc 180
agtacgtgga cggcgaccag tgcgagtcaa acccctgcct gaacggcggc agctgcaagg 240
acgatatcaa cagctacgag tgctggtgcc ccttcggctt cgagggcaag aactgcgagc 300
tggacgtgac ctgcaacatc aagaacggcc gctgcgagca gttctgcaag aacagcgccg 360
acaacaaggt ggtgtgctca tgcactgagg gctaccggct ggccgagaac cagaagagct 420
gcgagcccgc cgtgcccttc ccctgcggca gagtgtccgt gagccagacc agcaagctga 480
ccagggccga ggccgtgttc cctgacgtgg actacgtgaa ctcaaccgag gccgagacaa 540
tcctggacaa catcacccag agcacccagt ccttcaacga cttcacccgg gtggtgggcg 600
gcgaggacgc caagcccggc cagttccctt ggcaggtggt gctgaacggc aaggtggacg 660
ccttctgcgg cggctcaatc gtgaacgaga agtggatcgt gacagccgcc cactgcgtgg 720
agacaggcgt gaagatcacc gtggtggccg gcgaacacaa tatcgaggaa accgagcaca 780
ccgagcagaa acggaacgtg atccggatta tcccccacca caactacaac gccgccatca 840
acaagtacaa ccacgatatc gccctgctgg aactggacga gcctctggtg ctgaattcat 900
acgtgacccc catctgtatc gccgacaaag agtacaccaa catctttctg aagttcggca 960
gcggctacgt gtccggctgg ggcagggtgt tccacaaggg ccgcagcgcc ctggtgctgc 1020
agtacctgcg ggtgcccctg gtggacagag ccacctgcct gcggtcaacc aagttcacca 1080
tctacaacaa catgttctgc gccggcttcc acgagggcgg cagggacagc tgccagggcg 1140
acagcggcgg accccacgtg accgaggtgg agggcaccag ctttctgacc ggcatcatct 1200
catggggcga ggaatgcgcc atgaagggca agtacggaat ctacactaag gtgtcaagat 1260
acgtgaactg gatcaaagag aaaaccaagc tgacctga 1298
<210> 63
<211> 225
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 63
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180
gggaagacaa tagcaggcat gctggggatg cggtgggctc tatgg 225
<210> 64
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 64
ctatccattg cactatgctt tatttaaaaa ccacaaaacc tgtgctgttg atctcataaa 60
tagaacttgt atttatattt attttcattt tagtctgtct 100
<210> 65
<211> 2758
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 65
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggcctaag cttgagcgga gttccaattg tactgtacag aaccatggtc 180
acatgtttaa cgctagcgtg ccgacctggt aaactgatca gtgggtgcac ttaggactgc 240
gtcttacgct aatcacatgc gtgcggccgc tttattctat tttcccagta aaataaagtt 300
ttagtaaact ctgcatcttt aaagaattat tttggcattt atttctaaaa tggcatagta 360
ttttgtattt gtgaagtctt acaaggttat cttattaata aaattcaaac atcctaggta 420
aaaaaaaaaa aaggtcagaa ttgtttagtg actgtaattt tcttttgcgc actaaggaaa 480
gtgcaaagta acttagagtg actgaaactt cacagaatag ggttgaagat tgaattcata 540
actatcccaa ggtaccacta aagaattatt cttttacatt tcagttagcg aaacccaggc 600
caactcaact acagatgcgc ttaacgtcct gctcatcatc gtggacgatt tgcggccgtc 660
gcttggctgc tatggagata agctcgtccg ctcgccgaac atcgatcagt tggcctcaca 720
ctcactgctt ttccaaaatg cgtttgcgca gcaggctgtc tgtgcacctt caagagtctc 780
attcttgacc gggcgacgcc ctgacacaac gcggctgtac gacttcaaca gctactggag 840
agtccacgcg ggtaactttt caactatccc acagtacttt aaagagaacg gatacgtgac 900
aatgagcgtg ggaaaggtct ttcaccccgg catctcctcg aatcacaccg acgattcgcc 960
ctactcgtgg tcgtttcctc cctaccatcc ttcgagcgag aagtatgaga acacgaaaac 1020
ttgtcgcgga cccgacggag agctgcacgc taatctgctg tgtccggtgg atgtcttgga 1080
cgtgcccgag ggaacgctcc ccgacaagca gtcaacggag caggcgattc agttgctgga 1140
gaagatgaaa acaagcgcgt cgcctttctt cctcgccgtg gggtatcaca agccccatat 1200
tcctttccgc tacccgaagg agttccagaa actttatcct ttggaaaaca tcactttggc 1260
accggacccg gaagtccccg acggtctgcc acccgtggcc tacaatccct ggatggatat 1320
caggcagagg gaagatgtgc aggcactcaa catctcagtc ccctacgggc ctattccagt 1380
cgattttcaa cgcaagattc ggcagtcgta ttttgcgtcg gtgtcctacc tcgatacgca 1440
agtaggtcga cttctgagcg cgcttgatga ccttcagctg gcaaattcca caatcatcgc 1500
ctttacgtcg gaccatgggt gggcgttggg agagcatgga gagtgggcaa agtatagcaa 1560
ttttgatgta gcaacgcacg tgcccctgat tttctacgtg ccgggtagaa cggcctcgct 1620
tcccgaggca ggcgaaaaac tttttcccta tctcgatcca ttcgactcgg cgagccagct 1680
tatggaaccg ggcagacaat ccatggactt ggtagaattg gtgtcccttt ttccgaccct 1740
cgccgggttg gcgggcttgc aagtaccccc tagatgccct gtaccgagct tccatgtgga 1800
actctgccgc gaagggaaaa acctcctcaa acactttcgg ttcagggacc ttgaggagga 1860
cccctatctg ccagggaatc cgcgagagtt gattgcctat tcccagtatc cgcgacccag 1920
cgatattcct caatggaact ccgataagcc ctccctcaaa gacatcaaga ttatggggta 1980
ctcgatcagg accatcgact atcgctacac agtgtgggta gggttcaatc ctgacgaatt 2040
cctcgcgaac ttttcggaca tccacgctgg tgagctgtat ttcgtagact cggacccgtt 2100
gcaagatcac aatatgtata atgattccca aggaggagat ttgttccagc tgctcatgcc 2160
gtgataaaga tctctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 2220
ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 2280
gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 2340
aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggac 2400
cggtctatcc attgcactat gctttattta aaaaccacaa aacctgtgct gttgatctca 2460
taaatagaac ttgtatttat atttattttc attttagtct gtctggatcc acaaattaat 2520
cgaacctgca gctgatatcg acgcttaagt agggcttagc aaacgcgtct ccaacgtttc 2580
gccgttaaca ccccacatag tgagtggtct tagtagtccg ggtgtttaaa ctgaaagata 2640
actcgagcgc aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg 2700
ctcactgagg ccgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 2758
<210> 66
<211> 1575
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 66
agcgaaaccc aggccaactc aactacagat gcgcttaacg tcctgctcat catcgtggac 60
gatttgcggc cgtcgcttgg ctgctatgga gataagctcg tccgctcgcc gaacatcgat 120
cagttggcct cacactcact gcttttccaa aatgcgtttg cgcagcaggc tgtctgtgca 180
ccttcaagag tctcattctt gaccgggcga cgccctgaca caacgcggct gtacgacttc 240
aacagctact ggagagtcca cgcgggtaac ttttcaacta tcccacagta ctttaaagag 300
aacggatacg tgacaatgag cgtgggaaag gtctttcacc ccggcatctc ctcgaatcac 360
accgacgatt cgccctactc gtggtcgttt cctccctacc atccttcgag cgagaagtat 420
gagaacacga aaacttgtcg cggacccgac ggagagctgc acgctaatct gctgtgtccg 480
gtggatgtct tggacgtgcc cgagggaacg ctccccgaca agcagtcaac ggagcaggcg 540
attcagttgc tggagaagat gaaaacaagc gcgtcgcctt tcttcctcgc cgtggggtat 600
cacaagcccc atattccttt ccgctacccg aaggagttcc agaaacttta tcctttggaa 660
aacatcactt tggcaccgga cccggaagtc cccgacggtc tgccacccgt ggcctacaat 720
ccctggatgg atatcaggca gagggaagat gtgcaggcac tcaacatctc agtcccctac 780
gggcctattc cagtcgattt tcaacgcaag attcggcagt cgtattttgc gtcggtgtcc 840
tacctcgata cgcaagtagg tcgacttctg agcgcgcttg atgaccttca gctggcaaat 900
tccacaatca tcgcctttac gtcggaccat gggtgggcgt tgggagagca tggagagtgg 960
gcaaagtata gcaattttga tgtagcaacg cacgtgcccc tgattttcta cgtgccgggt 1020
agaacggcct cgcttcccga ggcaggcgaa aaactttttc cctatctcga tccattcgac 1080
tcggcgagcc agcttatgga accgggcaga caatccatgg acttggtaga attggtgtcc 1140
ctttttccga ccctcgccgg gttggcgggc ttgcaagtac cccctagatg ccctgtaccg 1200
agcttccatg tggaactctg ccgcgaaggg aaaaacctcc tcaaacactt tcggttcagg 1260
gaccttgagg aggaccccta tctgccaggg aatccgcgag agttgattgc ctattcccag 1320
tatccgcgac ccagcgatat tcctcaatgg aactccgata agccctccct caaagacatc 1380
aagattatgg ggtactcgat caggaccatc gactatcgct acacagtgtg ggtagggttc 1440
aatcctgacg aattcctcgc gaacttttcg gacatccacg ctggtgagct gtatttcgta 1500
gactcggacc cgttgcaaga tcacaatatg tataatgatt cccaaggagg agatttgttc 1560
cagctgctca tgccg 1575
<210> 67
<211> 1872
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 67
cacttggtcc acgtcgacgc tgccagagcc ctgtggccgc ttcgaagatt ttggaggtca 60
acgggtttct gtcctcccct tccccactcg caagcagatc agtatgtact gtcatgggat 120
caacagctta acctcgccta tgtcggagca gtgcctcacc gcgggatcaa gcaagtaagg 180
acacattggc tccttgaact cgtcaccacg agaggatcga cgggaagggg gctttcgtac 240
aacttcactc atctcgatgg ctatttggat ctcctccgcg agaatcagtt gttgccaggc 300
ttcgaattga tgggatcggc gagcgggcac tttacagact tcgaggacaa gcagcaagtg 360
tttgagtgga aggacctcgt gtcgtcgctc gcgaggagat acattggtcg ctacggtttg 420
gcgcatgtgt caaagtggaa cttcgaaacg tggaacgagc ccgatcatca cgattttgac 480
aacgtgtcaa tgaccatgca gggtttcctt aactattacg acgcctgttc cgagggattg 540
agggcagcat caccggcgct tcggctggga gggcctggtg atagctttca tacaccacct 600
cgatcgccac tttcgtgggg gctgctgcgc cattgtcacg atggtacgaa cttcttcacc 660
ggggaagcgg gggtacggct tgattacatc agcctccacc gaaagggagc gcggtcaagc 720
atctcgattc tggagcagga gaaggtagtc gctcagcaga tccggcaact ctttcccaag 780
ttcgcagaca cacctatcta caatgatgag gcagacccac ttgtgggatg gtcccttccg 840
cagccatggc gcgcagatgt gacttatgcc gcgatggtag tgaaagtcat cgcccagcac 900
cagaatctgc ttcttgcgaa tacgaccagc gcgtttcctt acgcgctttt gtcgaacgat 960
aatgccttcc tgtcatatca cccccatccg tttgcgcaga ggactcttac ggcgcgattc 1020
caagtgaata acaccagacc gccgcacgtg cagctgttgc gaaaacccgt gttgactgcg 1080
atggggcttc tggcgttgct tgatgaggaa caactctggg ctgaagtgtc ccaggcgggg 1140
acagtacttg atagcaatca tacagtaggc gtgttggcgt cggcgcaccg accgcaggga 1200
cccgcggatg cttggagggc agcggtcctg atctacgcct cggacgatac tagggcacat 1260
cccaacagat cggtcgctgt cacccttcgc ctcagagggg tcccgcctgg tcccggcttg 1320
gtatacgtca ctagatatct cgacaatgga ctgtgcagcc ccgacggaga gtggcggagg 1380
ctgggacggc cggtgtttcc gacagccgag cagtttagac ggatgagggc cgctgaggac 1440
cccgtggcag cggcaccgag gcccctcccg gcaggaggtc gcctcactct tcgaccggca 1500
ctgcggctgc cgtcccttct gctcgtacac gtctgcgcgc gacccgaaaa gccgcctgga 1560
caggtaacca ggctcagggc gctccccttg acgcaggggc agttggtact tgtctggtcg 1620
gacgaacacg tggggtccaa atgcttgtgg acgtatgaaa ttcagttttc ccaagacggg 1680
aaagcgtaca ctccggtgtc gcgcaaaccc tccacgttca acctcttcgt cttttcccca 1740
gacacgggag ccgtatcagg gtcgtaccga gtcagagccc tcgattattg ggcgaggcct 1800
gggccgttct cggaccctgt accatacttg gaagtgccgg tgcccagggg accgccctcg 1860
cctggtaatc ct 1872
<210> 68
<211> 247
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 68
gataatcaac ctctggatta caaaatttgt gaaagattga ctggtattct taactatgtt 60
gctcctttta cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc tattgcttcc 120
cgtatggctt tcattttctc ctccttgtat aaatcctggt tagttcttgc cacggcggaa 180
ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat 240
tccgtgg 247
<210> 69
<211> 592
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 69
aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60
ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120
atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180
tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240
ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300
attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360
ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 420
gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480
aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540
cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592
<210> 70
<211> 9
<212> PRT
<213> 未知
<220>
<223> 未知的描述:"LAGLIDADG"家族基序肽
<400> 70
Leu Ala Gly Leu Ile Asp Ala Asp Gly
1 5
<210> 71
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<400> 71
Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr
1 5 10 15
Lys Asp Asp Asp Asp Lys
20
<210> 72
<211> 3055
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 72
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggcctaag cttgagcgga gttccaattg tactgtacag aaccatggtc 180
acatgtttaa cgctagcgtg ccgacctggt aaactgatca gtgggtgcac ttaggactgc 240
gtcttacgct aatcacatgc gtgcggccgc tttattctat tttcccagta aaataaagtt 300
ttagtaaact ctgcatcttt aaagaattat tttggcattt atttctaaaa tggcatagta 360
ttttgtattt gtgaagtctt acaaggttat cttattaata aaattcaaac atcctaggta 420
aaaaaaaaaa aaggtcagaa ttgtttagtg actgtaattt tcttttgcgc actaaggaaa 480
gtgcaaagta acttagagtg actgaaactt cacagaatag ggttgaagat tgaattcata 540
actatcccaa ggtaccacta aagaattatt cttttacatt tcagcgcact tggtccacgt 600
cgacgctgcc agagccctgt ggccgcttcg aagattttgg aggtcaacgg gtttctgtcc 660
tccccttccc cactcgcaag cagatcagta tgtactgtca tgggatcaac agcttaacct 720
cgcctatgtc ggagcagtgc ctcaccgcgg gatcaagcaa gtaaggacac attggctcct 780
tgaactcgtc accacgagag gatcgacggg aagggggctt tcgtacaact tcactcatct 840
cgatggctat ttggatctcc tccgcgagaa tcagttgttg ccaggcttcg aattgatggg 900
atcggcgagc gggcacttta cagacttcga ggacaagcag caagtgtttg agtggaagga 960
cctcgtgtcg tcgctcgcga ggagatacat tggtcgctac ggtttggcgc atgtgtcaaa 1020
gtggaacttc gaaacgtgga acgagcccga tcatcacgat tttgacaacg tgtcaatgac 1080
catgcagggt ttccttaact attacgacgc ctgttccgag ggattgaggg cagcatcacc 1140
ggcgcttcgg ctgggagggc ctggtgatag ctttcataca ccacctcgat cgccactttc 1200
gtgggggctg ctgcgccatt gtcacgatgg tacgaacttc ttcaccgggg aagcgggggt 1260
acggcttgat tacatcagcc tccaccgaaa gggagcgcgg tcaagcatct cgattctgga 1320
gcaggagaag gtagtcgctc agcagatccg gcaactcttt cccaagttcg cagacacacc 1380
tatctacaat gatgaggcag acccacttgt gggatggtcc cttccgcagc catggcgcgc 1440
agatgtgact tatgccgcga tggtagtgaa agtcatcgcc cagcaccaga atctgcttct 1500
tgcgaatacg accagcgcgt ttccttacgc gcttttgtcg aacgataatg ccttcctgtc 1560
atatcacccc catccgtttg cgcagaggac tcttacggcg cgattccaag tgaataacac 1620
cagaccgccg cacgtgcagc tgttgcgaaa acccgtgttg actgcgatgg ggcttctggc 1680
gttgcttgat gaggaacaac tctgggctga agtgtcccag gcggggacag tacttgatag 1740
caatcataca gtaggcgtgt tggcgtcggc gcaccgaccg cagggacccg cggatgcttg 1800
gagggcagcg gtcctgatct acgcctcgga cgatactagg gcacatccca acagatcggt 1860
cgctgtcacc cttcgcctca gaggggtccc gcctggtccc ggcttggtat acgtcactag 1920
atatctcgac aatggactgt gcagccccga cggagagtgg cggaggctgg gacggccggt 1980
gtttccgaca gccgagcagt ttagacggat gagggccgct gaggaccccg tggcagcggc 2040
accgaggccc ctcccggcag gaggtcgcct cactcttcga ccggcactgc ggctgccgtc 2100
ccttctgctc gtacacgtct gcgcgcgacc cgaaaagccg cctggacagg taaccaggct 2160
cagggcgctc cccttgacgc aggggcagtt ggtacttgtc tggtcggacg aacacgtggg 2220
gtccaaatgc ttgtggacgt atgaaattca gttttcccaa gacgggaaag cgtacactcc 2280
ggtgtcgcgc aaaccctcca cgttcaacct cttcgtcttt tccccagaca cgggagccgt 2340
atcagggtcg taccgagtca gagccctcga ttattgggcg aggcctgggc cgttctcgga 2400
ccctgtacca tacttggaag tgccggtgcc caggggaccg ccctcgcctg gtaatccttg 2460
ataaagatct ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct 2520
tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca 2580
tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag 2640
ggggaggatt gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggaccgg 2700
tctatccatt gcactatgct ttatttaaaa accacaaaac ctgtgctgtt gatctcataa 2760
atagaacttg tatttatatt tattttcatt ttagtctgtc tggatccaca aattaatcga 2820
acctgcagct gatatcgacg cttaagtagg gcttagcaaa cgcgtctcca acgtttcgcc 2880
gttaacaccc cacatagtga gtggtcttag tagtccgggt gtttaaactg aaagataact 2940
cgagcgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc 3000
actgaggccg cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcag 3055

Claims (35)

1.一种锌指核酸酶(ZFN),其包含第一ZFN和第二ZFN,所述第一ZFN包含命名为71557的ZFN,并且所述第二ZFN包含命名为71728的ZFN。
2.一种或多种多核苷酸,其编码根据权利要求1所述的第一ZFN和第二ZFN,任选地其中所述一种或多种多核苷酸被携带在AAV载体上。
3.根据权利要求2所述的一种或多种多核苷酸,其中编码所述第一ZFN的第一多核苷酸包含含有如表4所示序列的AAV载体,并且编码所述第二ZFN的第二多核苷酸包含含有如表5所示序列的AAV载体。
4.根据权利要求2或3所述的AAV载体,其中编码所述第一ZFN的所述AAV载体包含SEQID NO:43所示的序列。
5.根据权利要求2或3所述的AAV载体,其中编码所述第二ZFN的所述AAV载体包含SEQID NO:56所示的序列。
6.一种细胞,其包含一种或多种根据权利要求1所述的ZFN、根据权利要求2至3中任一项所述的一种或多种多核苷酸、和/或一种或多种根据权利要求4和5所述的AAV载体,所述细胞任选地是干细胞或前体细胞。
7.一种药物组合物,其包含一种或多种根据权利要求1所述的ZFN、根据权利要求2至3中任一项所述的一种或多种多核苷酸、一种或多种根据权利要求4和5所述的AAV载体和/或一种或多种根据权利要求6所述的细胞。
8.根据前述权利要求中任一项所述的一种或多种ZFN、一种或多种多核苷酸、一种或多种AAV载体、一种或多种细胞和/或一种或多种药物组合物用于切割受试者的内源白蛋白基因的用途。
9.根据权利要求8所述的用途,其还包括向所述受试者给予任选地携带在AAV载体上的供体,使得所述供体被整合到所述受试者的经切割的白蛋白基因中。
10.一种切割受试者细胞中的内源白蛋白基因的方法,所述方法包括向所述受试者给予一种或多种根据权利要求1所述的ZFN、根据权利要求2至3中任一项所述的一种或多种多核苷酸、一种或多种根据权利要求4和5所述的AAV载体、一种或多种根据权利要求6所述的细胞和/或一种或多种根据权利要求7所述的药物组合物。
11.一种试剂盒,其包含一种或多种根据权利要求1所述的ZFN、根据权利要求2至3中任一项所述的一种或多种多核苷酸、一种或多种根据权利要求4和5所述的AAV载体、一种或多种根据权利要求6所述的细胞和/或一种或多种根据权利要求7所述的药物组合物。
12.一种组合物,其包含
(a)编码命名为71557的第一ZFN的第一多核苷酸,所述第一多核苷酸任选地包含含有如表4或SEQ ID NO:43所示的序列的AAV载体;
(b)编码命名为71728的第二ZFN的第二多核苷酸,所述第二多核苷酸任选地包含含有如表5或SEQ ID NO:56所示的序列的AAV载体;和
(c)供体多核苷酸,所述供体多核苷酸包含编码因子IX(FIX)序列的序列。
13.根据权利要求12所述的组合物,其中所述供体多核苷酸是AAV载体,所述AAV载体包含如表6所示的序列,任选地如SEQ ID NO:59所示的序列。
14.根据权利要求12或13所述的组合物,其中所述第一多核苷酸、第二多核苷酸和供体多核苷酸被携带在单独的AAV载体上。
15.根据权利要求12至14中任一项所述的组合物用于在有需要的受试者中表达FIX转基因的用途,其中向所述受试者给予所述组合物,使得所述ZFN切割所述受试者中的内源白蛋白基因,所述FIX序列被整合到经切割的白蛋白基因中,并且FIX蛋白在所述受试者中表达。
16.根据权利要求15所述的用途,其中在表达所述FIX蛋白后在所述受试者中治疗血友病。
17.一种在有需要的受试者中表达FIX蛋白的方法,所述方法包括向所述受试者给予一种或多种根据权利要求12至14中任一项所述的组合物,使得所述FIX蛋白在所述细胞中表达。
18.根据权利要求17所述的方法,其中所述受试者患有血友病,并且所述FIX蛋白的表达治疗和/或预防所述疾病。
19.一种试剂盒,其包含一种或多种根据权利要求12-14中任一项所述的组合物。
20.一种组合物,其包含
(a)编码命名为71557的第一ZFN的第一多核苷酸,所述第一多核苷酸任选地包含含有如表4或SEQ ID NO:43所示的序列的AAV载体;
(b)编码命名为71728的第二ZFN的第二多核苷酸,所述第二多核苷酸任选地包含含有如表5或SEQ ID NO:56所示的序列的AAV载体;和
(c)供体多核苷酸,所述供体多核苷酸包含编码艾杜糖-2-硫酸酯酶(IDS)序列的序列。
21.根据权利要求19所述的组合物,其中所述供体多核苷酸是AAV载体,所述AAV载体包含如表7所示的序列,任选地如SEQ ID NO:65所示的序列。
22.根据权利要求20或21所述的组合物,其中所述第一多核苷酸、第二多核苷酸和供体多核苷酸被携带在单独的AAV载体上。
23.根据权利要求20至22中任一项所述的组合物用于在有需要的受试者中表达IDS转基因的用途,其中向所述受试者给予所述组合物,使得所述ZFN切割所述受试者中的内源白蛋白基因,所述IDS序列被整合到经切割的白蛋白基因中,并且IDS蛋白在所述受试者中表达。
24.根据权利要求23所述的用途,其中在表达所述IDS序列后在所述受试者中治疗MPSII。
25.一种在有需要的受试者中表达IDS蛋白的方法,所述方法包括向所述受试者给予一种或多种根据权利要求20至22中任一项所述的组合物,使得所述IDS蛋白在所述细胞中表达。
26.根据权利要求25所述的方法,其中所述受试者患有MPS II疾病,并且所述IDS蛋白的表达治疗和/或预防所述疾病。
27.一种试剂盒,其包含一种或多种根据权利要求20至22中任一项所述的组合物。
28.一种组合物,其包含
(a)编码命名为71557的第一ZFN的第一多核苷酸,所述第一多核苷酸任选地包含含有如表4或SEQ ID NO:43所示的序列的AAV载体;
(b)编码命名为71728的第二ZFN的第二多核苷酸,所述第二多核苷酸任选地包含含有如表5或SEQ ID NO:56所示的序列的AAV载体;和
(c)供体多核苷酸,所述供体多核苷酸包含编码α-L-艾杜糖醛酸酶(IDUA)序列的序列。
29.根据权利要求28所述的组合物,其中所述供体包含如表8所示的序列,任选地如SEQID NO:72所示的序列。
30.根据权利要求28或权利要求29所述的组合物,其中所述第一多核苷酸、第二多核苷酸和供体多核苷酸被携带在单独的AAV载体上。
31.根据权利要求28至30中任一项所述的组合物用于在有需要的受试者中表达IDUA转基因的用途,其中向所述受试者给予所述组合物,使得所述ZFN切割所述受试者中的内源白蛋白基因,所述IDUA序列被整合到经切割的白蛋白基因中,并且IDUA蛋白在所述受试者中表达。
32.根据权利要求31所述的用途,其中在表达所述IDUA序列后在所述受试者中治疗MPSI。
33.一种在有需要的受试者中表达IDUA蛋白的方法,所述方法包括向所述受试者给予一种或多种根据权利要求28至30中任一项所述的组合物,使得所述IDUA蛋白在所述细胞中表达。
34.根据权利要求33所述的方法,其中所述受试者患有MPS I疾病,并且所述IDUA蛋白的表达治疗和/或预防所述疾病。
35.一种试剂盒,其包含一种或多种根据权利要求28至30中任一项所述的组合物。
CN201980024453.9A 2018-02-08 2019-02-08 工程化靶标特异性核酸酶 Pending CN111954540A (zh)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201862628016P 2018-02-08 2018-02-08
US62/628,016 2018-02-08
US201862728226P 2018-09-07 2018-09-07
US62/728,226 2018-09-07
US201862758786P 2018-11-12 2018-11-12
US62/758,786 2018-11-12
US201962795937P 2019-01-23 2019-01-23
US62/795,937 2019-01-23
US201962802092P 2019-02-06 2019-02-06
US62/802,092 2019-02-06
PCT/US2019/017273 WO2019157324A1 (en) 2018-02-08 2019-02-08 Engineered target specific nucleases

Publications (1)

Publication Number Publication Date
CN111954540A true CN111954540A (zh) 2020-11-17

Family

ID=67476462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980024453.9A Pending CN111954540A (zh) 2018-02-08 2019-02-08 工程化靶标特异性核酸酶

Country Status (13)

Country Link
US (2) US11401512B2 (zh)
EP (1) EP3749350A4 (zh)
JP (2) JP7275152B2 (zh)
KR (1) KR20200118468A (zh)
CN (1) CN111954540A (zh)
AU (1) AU2019218118A1 (zh)
BR (1) BR112020015488A2 (zh)
CA (1) CA3089587A1 (zh)
IL (1) IL276490A (zh)
MX (1) MX2020008272A (zh)
RU (1) RU2020129448A (zh)
SG (1) SG11202007440YA (zh)
WO (1) WO2019157324A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3528852A4 (en) 2016-10-20 2020-06-03 Sangamo Therapeutics, Inc. METHODS AND COMPOSITIONS FOR THE TREATMENT OF FABRY'S DISEASE
US11512287B2 (en) * 2017-06-16 2022-11-29 Sangamo Therapeutics, Inc. Targeted disruption of T cell and/or HLA receptors
CA3106691A1 (en) 2018-08-07 2020-02-13 Sangamo Therapeutics, Inc. Method for the treatment of mucopolysaccharidosis type ii
MX2021008131A (es) * 2019-01-04 2021-10-13 Sangamo Therapeutics Inc Metodos y composiciones para el tratamiento de la enfermedad de fabry.
WO2020162978A1 (en) * 2019-02-06 2020-08-13 Sangamo Therapeutics, Inc. Method for the treatment of mucopolysaccharidosis type i
AU2020376048A1 (en) 2019-11-01 2022-06-02 Sangamo Therapeutics, Inc. Compositions and methods for genome engineering
WO2021252952A1 (en) * 2020-06-11 2021-12-16 Sangamo Therapeutics, Inc. Methods and compositions for expressing phenylalanine hydroxylase
CN113293165B (zh) * 2021-06-21 2022-11-15 军事科学院军事医学研究院环境医学与作业医学研究所 一种基于CRISPR-Cas12a技术的HEV特异crRNA、检测试剂盒及其应用
WO2023039598A1 (en) * 2021-09-13 2023-03-16 Life Technologies Corporation Gene editing tools

Family Cites Families (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5356802A (en) 1992-04-03 1994-10-18 The Johns Hopkins University Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease
US5487994A (en) 1992-04-03 1996-01-30 The Johns Hopkins University Insertion and deletion mutants of FokI restriction endonuclease
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6242568B1 (en) 1994-01-18 2001-06-05 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
ATE310812T1 (de) 1994-01-18 2005-12-15 Scripps Research Inst Derivate von zinkfingerproteinen und methoden
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
ATE407205T1 (de) 1994-08-20 2008-09-15 Gendaq Ltd Verbesserung in bezug auf bindungsproteine bei der erkennung von dna
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
US5925523A (en) 1996-08-23 1999-07-20 President & Fellows Of Harvard College Intraction trap assay, reagents and uses thereof
GB2338237B (en) 1997-02-18 2001-02-28 Actinova Ltd In vitro peptide or protein expression library
GB9703369D0 (en) 1997-02-18 1997-04-09 Lindqvist Bjorn H Process
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6410248B1 (en) 1998-01-30 2002-06-25 Massachusetts Institute Of Technology General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites
AU746454B2 (en) 1998-03-02 2002-05-02 Massachusetts Institute Of Technology Poly zinc finger proteins with improved linkers
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US7013219B2 (en) 1999-01-12 2006-03-14 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US7070934B2 (en) 1999-01-12 2006-07-04 Sangamo Biosciences, Inc. Ligand-controlled regulation of endogenous gene expression
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
US7030215B2 (en) 1999-03-24 2006-04-18 Sangamo Biosciences, Inc. Position dependent recognition of GNN nucleotide triplets by zinc fingers
US6379903B1 (en) 1999-10-08 2002-04-30 Sigma-Aldrich Co. Purification of recombinant proteins fused to multiple epitopes
CA2394850C (en) 1999-12-06 2012-02-07 Sangamo Biosciences, Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
DE60143192D1 (de) 2000-02-08 2010-11-18 Sangamo Biosciences Inc Zellen zur entdeckung von medikamenten
US20020061512A1 (en) 2000-02-18 2002-05-23 Kim Jin-Soo Zinc finger domains and methods of identifying same
WO2001088197A2 (en) 2000-05-16 2001-11-22 Massachusetts Institute Of Technology Methods and compositions for interaction trap assays
JP2002060786A (ja) 2000-08-23 2002-02-26 Kao Corp 硬質表面用殺菌防汚剤
US7419829B2 (en) 2000-10-06 2008-09-02 Oxford Biomedica (Uk) Limited Vector system
AU2002217929A1 (en) 2000-11-28 2002-06-11 Sangamo Biosciences, Inc. Modulation of gene expression using insulator binding proteins
US7067317B2 (en) 2000-12-07 2006-06-27 Sangamo Biosciences, Inc. Regulation of angiogenesis with zinc finger proteins
AU2002243645A1 (en) 2001-01-22 2002-07-30 Sangamo Biosciences, Inc. Zinc finger proteins for dna binding and gene regulation in plants
GB0108491D0 (en) 2001-04-04 2001-05-23 Gendaq Ltd Engineering zinc fingers
JP2005500061A (ja) 2001-08-20 2005-01-06 ザ スクリップス リサーチ インスティテュート Cnnについての亜鉛フィンガー結合ドメイン
US7262054B2 (en) 2002-01-22 2007-08-28 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
JP4968498B2 (ja) 2002-01-23 2012-07-04 ユニバーシティ オブ ユタ リサーチ ファウンデーション ジンクフィンガーヌクレアーゼを用いる、標的化された染色体変異誘発
US20030232410A1 (en) 2002-03-21 2003-12-18 Monika Liljedahl Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7361635B2 (en) 2002-08-29 2008-04-22 Sangamo Biosciences, Inc. Simultaneous modulation of multiple genes
AU2003298574B2 (en) 2002-09-05 2008-04-24 California Institute Of Technology Use of chimeric nucleases to stimulate gene targeting
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US7972854B2 (en) 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
ATE418346T1 (de) 2004-04-08 2009-01-15 Sangamo Biosciences Inc Zusammensetzungen zur behandlung von neuropathischen und neurodegenerativen erkrankungen
US7253273B2 (en) 2004-04-08 2007-08-07 Sangamo Biosciences, Inc. Treatment of neuropathic pain with zinc finger proteins
CA2579677A1 (en) 2004-09-16 2006-03-30 Sangamo Biosciences, Inc. Compositions and methods for protein production
EP1913149A4 (en) 2005-07-26 2009-08-05 Sangamo Biosciences Inc TARGETED INTEGRATION AND EXPRESSION OF EXOGENOUS NUCLEIC ACID SEQUENCES
WO2007139898A2 (en) 2006-05-25 2007-12-06 Sangamo Biosciences, Inc. Variant foki cleavage half-domains
ES2378333T3 (es) 2006-05-25 2012-04-11 Sangamo Biosciences, Inc. Métodos y composiciones para la inactivación de genes
ATE489465T1 (de) 2007-04-26 2010-12-15 Sangamo Biosciences Inc Gezielte integration in die ppp1r12c-position
US8563314B2 (en) 2007-09-27 2013-10-22 Sangamo Biosciences, Inc. Methods and compositions for modulating PD1
JP2011518555A (ja) 2008-04-14 2011-06-30 サンガモ バイオサイエンシーズ, インコーポレイテッド 標的組込みのための線形ドナーコンストラクト
CA2726768C (en) 2008-06-10 2016-09-06 Sangamo Biosciences, Inc. Methods and compositions for generation of bax- and bak-deficient cell lines
CA2734235C (en) 2008-08-22 2019-03-26 Sangamo Biosciences, Inc. Methods and compositions for targeted single-stranded cleavage and targeted integration
EP3156494B8 (en) 2008-12-04 2018-09-19 Sangamo Therapeutics, Inc. Genome editing in rats using zinc-finger nucleases
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US8956828B2 (en) 2009-11-10 2015-02-17 Sangamo Biosciences, Inc. Targeted disruption of T cell receptor genes using engineered zinc finger protein nucleases
PT2534173T (pt) 2010-02-08 2019-10-31 Sangamo Therapeutics Inc Semidomínios de clivagem manipulados
EP2660318A1 (en) 2010-02-09 2013-11-06 Sangamo BioSciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
WO2011139335A1 (en) 2010-04-26 2011-11-10 Sangamo Biosciences, Inc. Genome editing of a rosa locus using zinc-finger nucleases
WO2011139349A1 (en) 2010-05-03 2011-11-10 Sangamo Biosciences, Inc. Compositions for linking zinc finger modules
CA2798988C (en) 2010-05-17 2020-03-10 Sangamo Biosciences, Inc. Tal-effector (tale) dna-binding polypeptides and uses thereof
US8945868B2 (en) 2010-07-21 2015-02-03 Sangamo Biosciences, Inc. Methods and compositions for modification of a HLA locus
CN102358902B (zh) 2011-04-02 2013-01-02 西南大学 家蚕丝素重链基因突变序列及突变的方法和应用
KR102061557B1 (ko) 2011-09-21 2020-01-03 상가모 테라퓨틱스, 인코포레이티드 이식 유전자 발현의 조절을 위한 방법 및 조성물
CA2852955C (en) 2011-10-27 2021-02-16 Sangamo Biosciences, Inc. Methods and compositions for modification of the hprt locus
WO2013074999A1 (en) 2011-11-16 2013-05-23 Sangamo Biosciences, Inc. Modified dna-binding proteins and uses thereof
EP3444342B1 (en) 2012-07-11 2020-05-27 Sangamo Therapeutics, Inc. Methods and compositions for the treatment of lysosomal storage diseases
UA118957C2 (uk) * 2012-08-29 2019-04-10 Сангамо Біосайєнсиз, Інк. Спосіб і композиція для лікування генетичного захворювання
US9255250B2 (en) 2012-12-05 2016-02-09 Sangamo Bioscience, Inc. Isolated mouse or human cell having an exogenous transgene in an endogenous albumin gene
JP6392245B2 (ja) * 2012-12-18 2018-09-19 ノバルティス アーゲー 遺伝子改変哺乳動物細胞における治療用タンパク質の産生
US9873894B2 (en) 2013-05-15 2018-01-23 Sangamo Therapeutics, Inc. Methods and compositions for treatment of a genetic condition
AU2014312295C1 (en) 2013-08-28 2020-08-13 Sangamo Therapeutics, Inc. Compositions for linking DNA-binding domains and cleavage domains
CA2931637C (en) * 2013-12-09 2023-10-10 Sangamo Biosciences, Inc. Methods and compositions for treating hemophilia
US10179918B2 (en) 2015-05-07 2019-01-15 Sangamo Therapeutics, Inc. Methods and compositions for increasing transgene activity
AU2016343887B2 (en) 2015-10-28 2023-04-06 Sangamo Therapeutics, Inc. Liver-specific constructs, factor VIII expression cassettes and methods of use thereof
IL297018A (en) 2015-12-18 2022-12-01 Sangamo Therapeutics Inc Directed cleavage of cell mhc receptor
CA3010738A1 (en) 2016-01-15 2017-07-20 Sangamo Therapeutics, Inc. Methods and compositions for the treatment of neurologic disease
MY193234A (en) 2016-08-24 2022-09-27 Sangamo Therapeutics Inc Regulation of gene expression using engineered nucleases
SG10201913948PA (en) 2016-08-24 2020-03-30 Sangamo Therapeutics Inc Engineered target specific nucleases
US20180185516A1 (en) 2016-12-09 2018-07-05 Sangamo Therapeutics, Inc. Delivery of target specific nucleases
CA3106691A1 (en) 2018-08-07 2020-02-13 Sangamo Therapeutics, Inc. Method for the treatment of mucopolysaccharidosis type ii

Also Published As

Publication number Publication date
JP2023090871A (ja) 2023-06-29
US11401512B2 (en) 2022-08-02
CA3089587A1 (en) 2019-08-15
US20190241877A1 (en) 2019-08-08
AU2019218118A1 (en) 2020-08-13
RU2020129448A (ru) 2022-03-09
IL276490A (en) 2020-09-30
EP3749350A4 (en) 2021-12-01
EP3749350A1 (en) 2020-12-16
MX2020008272A (es) 2020-09-21
KR20200118468A (ko) 2020-10-15
JP7275152B2 (ja) 2023-05-17
BR112020015488A2 (pt) 2020-12-08
WO2019157324A1 (en) 2019-08-15
US20230067653A1 (en) 2023-03-02
SG11202007440YA (en) 2020-09-29
JP2021513338A (ja) 2021-05-27

Similar Documents

Publication Publication Date Title
US11827900B2 (en) Engineered target specific nucleases
AU2020203792B2 (en) Compositions For Linking DNA-Binding Domains And Cleavage Domains
US11834686B2 (en) Engineered target specific base editors
US10179918B2 (en) Methods and compositions for increasing transgene activity
US11920169B2 (en) Compositions for linking DNA-binding domains and cleavage domains
US20230067653A1 (en) Engineered target specific nucleases
RU2782794C2 (ru) Сконструированные мишень-специфические нуклеазы
NZ791740A (en) Engineered target specific nucleases
NZ791711A (en) Engineered target specific nucleases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination