CN108779466A - 用于通过基因编辑修正人肌营养不良蛋白基因的治疗靶标和使用方法 - Google Patents

用于通过基因编辑修正人肌营养不良蛋白基因的治疗靶标和使用方法 Download PDF

Info

Publication number
CN108779466A
CN108779466A CN201680080439.7A CN201680080439A CN108779466A CN 108779466 A CN108779466 A CN 108779466A CN 201680080439 A CN201680080439 A CN 201680080439A CN 108779466 A CN108779466 A CN 108779466A
Authority
CN
China
Prior art keywords
seq
nucleotide sequence
structural domain
grna molecules
listed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680080439.7A
Other languages
English (en)
Other versions
CN108779466B (zh
Inventor
C.A.格尔斯巴赫
J.N.罗宾逊哈姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Duke University
Original Assignee
Duke University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Duke University filed Critical Duke University
Publication of CN108779466A publication Critical patent/CN108779466A/zh
Application granted granted Critical
Publication of CN108779466B publication Critical patent/CN108779466B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/06Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite
    • A61K47/26Carbohydrates, e.g. sugar alcohols, amino sugars, nucleic acids, mono-, di- or oligo-saccharides; Derivatives thereof, e.g. polysorbates, sorbitan fatty acid esters or glycyrrhizin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/54Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound
    • A61K47/549Sugars, nucleosides, nucleotides or nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0016Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the nucleic acid is delivered as a 'naked' nucleic acid, i.e. not combined with an entity such as a cationic lipid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • A61P21/04Drugs for disorders of the muscular or neuromuscular system for myasthenia gravis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • C12N2015/8527Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic for producing animal models, e.g. for tests or diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Veterinary Medicine (AREA)
  • Microbiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Plant Pathology (AREA)
  • Epidemiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Environmental Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Neurology (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Mycology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)

Abstract

本文披露了用于通过基因编辑修正人肌营养不良蛋白基因的治疗靶标和使用方法。

Description

用于通过基因编辑修正人肌营养不良蛋白基因的治疗靶标和 使用方法
相关申请的交叉引用
本申请要求2015年11月30日提交的美国临时申请号62/260,712和2016年5月2日提交的美国临时申请号62/330,336的优先权,将其全部通过引用以其全部内容并入本文。
政府利益的声明
本发明是在国家科学基金会研究生研究奖学金项目的奖励下在政府支持下完成的。美国政府对本发明享有一定的权利。
技术领域
本披露涉及使用基于成簇规律间隔短回文重复序列(CRISPR)/CRISPR相关(Cas)9的***和病毒递送***的基因表达改变、基因组工程和基因的基因组改变的领域。本披露还涉及肌肉(如骨骼肌和心肌)中基因的基因组工程和基因组改变的领域。
背景技术
合成转录因子已被工程化为控制基因表达用于哺乳动物***中许多不同医学和科学应用,包括刺激组织再生、药物筛选、补偿遗传缺陷、激活沉默肿瘤抑制因子、控制干细胞分化、进行遗传筛选、以及创造合成基因电路。这些转录因子可以靶向内源基因的启动子或增强子,或有目的地设计为识别与哺乳动物基因组正交的序列以进行转基因调控。用于工程化靶向用户定义序列的新颖转录因子的最常见策略是基于锌指蛋白和转录激活因子样效应子(TALE)的可编程DNA结合结构域。这两种方法都涉及应用这些结构域的蛋白质-DNA相互作用的原理来工程化具有独特DNA结合特异性的新蛋白。尽管这些方法在许多应用中已经取得了广泛的成功,但操纵蛋白质-DNA相互作用所必需的蛋白质工程可能很费力并且需要专业知识。
此外,这些新蛋白并不总是有效。造成这种情况的原因尚不清楚,但可能与表观遗传修饰和染色质状态对蛋白质与基因组靶位点结合的影响有关。此外,在确保将这些新蛋白以及其他组分递送至每个细胞方面存在挑战。用于递送这些新蛋白及其多种组分的现有方法包括在单独的质粒或载体上递送至细胞,由于拷贝数的差异这导致每个细胞中高度变化的表达水平。此外,转染后的基因激活由于质粒DNA的稀释而是短暂的,并且临时基因表达可能不足以诱导治疗效果。此外,这种方法不适用于不容易转染的细胞类型。因此,这些新蛋白的另一个限制是转录激活的效力。
基于CRISPR/Cas9的基因编辑***可以用于在靶向基因座处引入位点特异性双链断裂。这种DNA裂解刺激天然DNA修复机器,导致两种可能的修复途径之一。在不存在供体模板的情况下,断裂将通过非同源末端连接(NHEJ)修复,这是一种导致DNA的小***或缺失的易错的修复途径。此方法可以用于有意地破坏、缺失或改变靶基因序列的阅读框。然而,如果供体模板与核酸酶一起提供,则细胞机器将通过同源重组修复断裂,在存在DNA裂解的情况下该修复增强几个数量级。此方法可以用于在DNA序列中在靶位点处引入特定变化。工程化的核酸酶已被用于多种人干细胞和细胞系中的基因编辑以及小鼠肝脏中的基因编辑。然而,实施这些技术的主要障碍是以有效、高效并有助于成功进行基因组修饰的方式体内递送至特定组织。
遗传性的遗传疾病对美国的儿童具有破坏性影响。这些疾病目前无法治愈,并且只能通过试图缓解症状来进行管理。几十年来,基因治疗领域已经承诺治愈这些疾病。然而,关于安全且高效地将治疗基因递送至细胞和患者的技术障碍限制了这种方法。杜氏肌营养不良(DMD)是一种致命的遗传疾病,临床特征为由于功能性肌营养不良蛋白的丧失,典型地在生命的第三个十年中出现肌肉萎缩、无法步行和死亡。DMD的致因是在肌营养不良蛋白(dystrophin)基因中的遗传或自发突变。导致DMD的大多数突变是一个或多个外显子缺失的结果,推动翻译阅读框脱框。
肌营养不良蛋白是负责调控肌细胞完整性和功能的蛋白质复合体的关键组分。DMD患者典型地在童年时期失去了自我身体支撑的能力,在青少年时期逐渐变得更弱,并且在二十多岁时死亡。当前用于DMD的实验性基因治疗策略需要重复给予瞬时基因递送运载体或依赖于将外源遗传物质永久整合到基因组DNA中。这两种方法都有严重的安全问题。此外,这些策略受到无法递送大且复杂的肌营养不良蛋白基因序列的限制。仍需要更精确且有效的基因编辑工具来修正和治疗在肌营养不良蛋白基因中具有突变的患者。
发明内容
本发明涉及包含靶向结构域的指导RNA(gRNA),该靶向结构域包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQID NO:41、SEQ ID NO:42中列出的核苷酸序列或其互补序列。
本发明还涉及包含第一gRNA和第二gRNA的DNA靶向组合物。第一gRNA分子和第二gRNA分子包含靶向结构域,该靶向结构域包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:1 3、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:41、SEQ ID NO:42中列出的核苷酸序列或其互补序列。第一gRNA分子和第二gRNA分子包含不同的靶向结构域。
本发明还涉及包含上述gRNA分子或上述DNA靶向组合物的分离的多核苷酸。
本发明涉及包含上述gRNA、上述DNA靶向组合物或上述分离的多核苷酸的载体。
本发明还涉及包含上述DNA靶向组合物的载体。
本发明还涉及如下载体,其编码:(a)第一指导RNA(gRNA)分子,(b)第二gRNA分子和(c)至少一种识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的Cas9分子。第一gRNA分子和第二gRNA分子包含靶向结构域,该靶向结构域包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:41、SEQ ID NO:42中列出的核苷酸序列或其互补序列。第一gRNA分子和第二gRNA分子包含不同的靶向结构域。
本发明还涉及包含上述gRNA、上述DNA靶向组合物、上述分离的多核苷酸或上述载体的细胞。 本发明还涉及包含上述gRNA、上述DNA靶向***、上述分离的多核苷酸、上述载体或上述细胞和任选地使用说明书的试剂盒。
本发明还涉及修正细胞中突变型肌营养不良蛋白基因的方法。该方法包括向细胞给予上述gRNA、上述DNA靶向***、上述分离的多核苷酸或上述载体。
本发明还涉及基因组编辑受试者中突变型肌营养不良蛋白基因的方法。该方法包括向该受试者给予包含上述gRNA、上述DNA靶向***、上述分离的多核苷酸、上述载体或上述细胞的基因组编辑组合物。
本发明还涉及治疗具有突变型肌营养不良蛋白基因的有需要的受试者的方法。该方法包括向该受试者给予上述gRNA、上述DNA靶向***、上述分离的多核苷酸、上述载体或上述细胞。
本发明还涉及用于基因组编辑受试者中突变型肌营养不良蛋白基因的经修饰腺相关病毒载体,其包含编码上述gRNA的第一多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的Cas9分子的第二多核苷酸序列。
本发明还涉及用于缺失包含外显子51的肌营养不良蛋白基因区段的组合物,该组合物包含:(a)第一载体,其包含编码第一指导RNA(gRNA)分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第一Cas9分子的多核苷酸序列,以及(b)第二载体,其包含编码第二gRNA分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第二Cas9分子的多核苷酸序列。第一和第二gRNA分子各自具有长度为19至24个核苷酸的靶向结构域,并且其中第一载体和第二载体被配置为分别形成在人DMD基因的外显子51侧翼的第一内含子和第二内含子中的第一和第二双链断裂,从而缺失包含外显子51的肌营养不良蛋白基因区段。
本发明还涉及包含上述组合物的细胞。
本发明还涉及修正细胞中突变型肌营养不良蛋白基因的方法,该方法包括向该细胞给予:(a)第一载体,其包含编码第一指导RNA(gRNA)分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第一Cas9分子的多核苷酸序列,以及(b)第二载体,其包含编码第二gRNA分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第二Cas9分子的多核苷酸序列。第一gRNA和第二gRNA分子各自具有长度为19至24个核苷酸的靶向结构域,并且其中载体被配置为分别形成在人肌营养不良蛋白基因的外显子51侧翼的第一和第二内含子中的第一和第二双链断裂,从而缺失包含外显子51的肌营养不良蛋白基因区段。
本发明还涉及治疗具有突变型肌营养不良蛋白基因的有需要的受试者的方法。该方法包括向该受试者给予:(a)第一载体,其包含编码第一指导RNA(gRNA)分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第一Cas9分子的多核苷酸序列,以及(b)第二载体,其包含编码第二gRNA分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第二Cas9分子的多核苷酸序列。第一gRNA和第二gRNA分子各自具有长度为19至24个核苷酸的靶向结构域,并且其中载体被配置为分别形成在人肌营养不良蛋白基因的外显子51侧翼的第一和第二内含子中的第一和第二双链断裂,从而缺失包含外显子51的肌营养不良蛋白基因区段。
本发明还涉及产生具有外显子52缺失(Δ52)的人肌营养不良蛋白基因(hDMD)的转基因啮齿动物胚胎的方法。该方法包括向啮齿动物胚胎给予上述gRNA、上述DNA靶向***、上述分离的多核苷酸、上述载体、上述经修饰腺相关病毒载体或上述组合物,从而缺失人肌营养不良蛋白基因的外显子52,并选择具有人肌营养不良蛋白基因外显子52缺失的转基因啮齿动物胚胎,其中该啮齿动物胚胎包含正常的人肌营养不良蛋白基因。
本发明还涉及通过上述方法产生的转基因啮齿动物胚胎。
本发明还涉及由上述转基因啮齿动物胚胎产生的转基因啮齿动物。
附图说明
图1显示了靶向HEK293T细胞(野生型肌营养不良蛋白基因)和DMD患者成肌细胞系(DMD 8036和DMD 6594,其各自具有肌营养不良蛋白基因的突变形式)中的人肌营养不良蛋白基因的单独gRNA JCR89和JCR91的活性,如通过Surveyor测定确定的。
图2A和2B显示了通过用SaCas9和gRNA JCR89和JCR91共处理,HEK293T细胞和DMD成肌细胞(DMD 8036和DMD 6594)的基因组DNA(图2A)和来自DMD成肌细胞的cDNA(图2B)中的外显子51的缺失。
图3显示了用于将两种病毒载体上的SaCas9和gRNA JCR89和JCR91共同递送至肌肉组织的基于AAV的体内***。
图4显示了在将携带SaCas9和gRNA的病毒载体局部AAV8递送至胫骨前肌(TA)肌肉之后,携带人DMD基因的转基因小鼠(hDMD/mdx小鼠)中人外显子51缺失的检测。
图5显示了在通过尾静脉注射进行的***性AAV8递送之后,携带hDMD基因的转基因小鼠中人外显子51缺失的检测。
图6显示了人和恒河猴基因组之间保守的不同gRNA靶标(参见表2中的gRNA的序列)。每种gRNA的位置都关于人肌营养不良蛋白基因的外显子51来指示。
图7显示了如通过Surveyor测定确定的在转染人HEK293T细胞后单独gRNA的活性。
图8显示了如使用CasOFFinder程序(Bae et al.(2014)Bioinformatics[Bae等人(2014)生物信息学]30:1473-1475)预测的候选gRNA的特异性。
图9显示了如通过基因组DNA的PCR确定的HEK293T细胞和DMD 6594细胞中gRNAJCR157和JCR160引起的外显子51的缺失。
图10显示了如通过Surveyor测定确定的各种靶标长度的gRNA JCR157的活性:19、20、21、22和23个核苷酸。
图11显示了如通过Surveyor测定确定的各种靶标长度的gRNA JCR160的活性:19、20、21、22和23个核苷酸。
图12显示了如通过基因组DNA的PCR确定的通过组合各种长度(21、22或23个核苷酸)的JCR157和JCR160产生的缺失。
图13显示了如通过Surveyor测定测得的体外中靶核酸酶活性。
图14显示了基因组DNA中外显子51的体外缺失。
图15显示了分化7天的人DMD成肌细胞的cDNA中外显子51的体外缺失。
图16显示了DMD患者成肌细胞的cDNA中体外外显子47至52的连接。
图17显示了从健康hDMD/mdx小鼠开始的Δ52/mdx小鼠的设计。
图18显示了体外指导物验证:单独的(Surveyor测定)。
图19显示了体外指导物验证:成对的:使用gRNA对产生HEK293T细胞的基因组DNA中外显子51的缺失。
图20显示了DNA显微注射方案的示意图。
图21示出了小鼠繁殖的示意图。
图22显示了首建小鼠基因分型结果。
图23显示了首建小鼠7、63和76的测序结果的一部分。
图24显示了进一步的小鼠繁殖的示意图。
图25显示了来自首建雄鼠76+mdx/mdx繁殖结果的第5窝(仅雄鼠)的基因分型。“63”是首建雄鼠(但在这种情况下不是亲本)。“293”代表HEK293T细胞基因组DNA对照。
图26显示了来自首建雄鼠63+mdx/mdx繁殖结果的第1窝的基因分型。
图27显示了幼鼠54497和54498的392bp测序读数的一部分。
图28显示了来自幼鼠54497和54498的心脏和TA的免疫组织化学染色。
图29显示Δ52/mdx小鼠缺乏肌营养不良蛋白。
图30显示了蛋白质印迹,指示Δ52/mdx小鼠缺乏与DMD基因型一致的肌营养不良蛋白,而健康的hDMD/mdx小鼠表达肌营养不良蛋白。
图31显示了如通过运动和探索所示的,Δ52/mdx小鼠与mdx小鼠和hDMD/mdx小鼠相比的整体活动。
图32显示了使用SaCas9和gRNA,通过靶向要去除的内含子区域中的外显子51的上游和下游的gRNA来跳过外显子51的针对Δ52/mdx小鼠的修正策略。
图33显示了使用SaCas9以及gRNA JCR179和JCR183,在DMD患者成肌细胞(DMD6594细胞)中从外显子51缺失体外恢复肌营养不良蛋白。
图34显示了使用gRNA和SaCas9***处理Δ52/mdx小鼠的实验设计。
图35显示了右侧TA肌肉中的体内外显子51缺失。
图36显示了右侧TA肌肉中的体内外显子51缺失。
图37显示了经处理的TA肌肉中的体内肌营养不良蛋白恢复。
图38显示了经处理的TA肌肉中的体内肌营养不良蛋白恢复。
图39显示了总移动距离的所有时间点的平均值。
图40显示了总饲养姿势(rearing posture)的所有时间点的平均值。
图41显示了16周的未经处理和经处理的小鼠的握力。
图42显示了心脏组织的cDNA PCR结果。
图43显示了来自图42的经扩增的cDNA PCR带的测序。
具体实施方式
如本文所述,已经发现某些方法和工程化的gRNA可以与基于CRISPR/CRISPR相关(Cas)9的基因编辑***一起用于改变遗传疾病(例如,DMD)中涉及的肌营养不良蛋白基因的表达、基因组工程和修正或减少其突变的影响。产生所披露的gRNA以靶向更适于临床翻译的位点。例如,编码化脓链球菌Cas9(SpCas9)的基因太大而无法通过腺相关病毒(AAV)递送,腺相关病毒是当包括所有其他必需调控序列时用于向肌肉递送***性基因的载体。作为替代,选择并筛选所披露的gRNA与比SpCas9小约1kb的金黄色葡萄球菌Cas9(SaCas9)一起使用。针对在人和恒河猴基因组之间保守的序列上为SaCas9相容靶标来筛选靶标选择,这极大地限制了可能的基因靶标的数目。此选择标准被选取为允许在人和恒河猴中都可能有活性的gRNA候选物,以便于在非人灵长类动物模型中进行临床前测试。所披露的靶向人和恒河猴两者的肌营养不良蛋白基因序列的gRNA可以与基于CRISPR/Cas9的***一起用于靶向人肌营养不良蛋白基因的外显子51周围的内含子区域,导致此区域的基因组缺失以恢复来自DMD患者的细胞中功能性肌营养不良蛋白的表达。
本文还描述了用于递送基于CRISPR/Cas9的基因编辑***和多种gRNA以靶向肌营养不良蛋白基因的基因构建体、组合物和方法。本发明披露的主题还提供了用于将基因构建体(例如,载体)或包含其的组合物递送至骨骼肌和心肌的方法。载体可以是AAV,包括经修饰的AAV载体。本发明披露的主题描述了将这类治疗剂的活性形式递送至骨骼肌或心肌的方式,其是有效、高效并有助于成功进行基因组修饰,连同提供了重写人类基因组用于治疗应用并且靶向模型物种用于基础科学应用的手段。
如在本节和本文的整个披露中所用的节标题只是出于组织的目的,而不旨在进行限制。
1.定义
除非另外定义,否则本文使用的所有技术和科学术语具有与本领域普通技术人员通常所理解的相同的含义。在矛盾的情况下,应以本文件(包括定义)为准。虽然与本文描述的那些方法和材料类似或等效的方法和材料可以用于本发明的实践或测试中,但以下描述优选的方法和材料。本文提及的所有出版物、专利申请、专利以及其他参考文献通过引用以其全部内容并入本文。本文披露的材料、方法以及实例仅是说明性的并且不旨在是限制性的。
如本文所用,术语“包含(comprise(s))”、“包括(include(s))”、“具有(having)”、“有(has)”、“可以(can)”、“含有(contain(s))”及其变体旨在是不排除另外的行为或结构的可能性的开放性的过渡短语、术语或词语。单数形式“一个/一种(a/an)”和“该(the)”包括复数个指示物,除非上下文中另外明确指明。本披露还涵盖“包括本文所呈现的实施例或要素”、“由本文所呈现的实施例或要素组成”以及“基本上由本文所呈现的实施例或要素组成”的其他实施例,无论是否明确地提出。
对于本文数值范围的叙述,明确考虑了具有相同精度的介于两者之间的每个介于中间的数字。例如,对于范围6-9,除了6和9之外还考虑了数字7和8,并且对于范围6.0-7.0,明确考虑了数字6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9和7.0。
如本文所用,术语“约(about)”或“大约(approximately)”意指由本领域普通技术人员确定的特定值在可接受的误差范围之内,这将部分地取决于该值是怎样测定或确定的,即,受到测量***的限制。例如,“约”可以意指根据本领域的实践在3个或大于3个标准差之内。可替代地,“约”可以意指给定值的高达20%、优选高达10%、更优选高达5%并且还更优选高达1%的范围。可替代地,特别是对于生物学***和方法,该术语可以意指在某一值的数量级内,优选在5倍内并且更优选在2倍内。
如在本文中可互换使用的“腺相关病毒”或“AAV”是指感染人及其他一些灵长类物种的属于细小病毒科(Parvoviridae)依赖病毒属(Dependovirus)的小病毒。当前尚不知AAV引起疾病并且因此该病毒引起非常轻微的免疫应答。
如本文所用,“结合区”是指在核酸靶区域内被核酸酶识别并结合的区域。
如在本文中可互换使用的“心肌(cardiac muscle)”或“心肌(heart muscle)”意指心脏的壁和组织学基础中发现的一种类型的不随意横纹肌(involuntary striatedmuscle),即心肌(myocardium)。心肌由心肌细胞(cardiomyocyte或myocardiocyte)组成。心肌细胞显示与骨骼肌细胞相似的条纹,但只含有一个独特的核,与多核骨骼细胞不同。在某些实施例中,“心肌病症”是指与心肌有关的病症,如心肌病、心力衰竭、心律失常和炎症性心脏病。
如本文所用,“编码序列”或“编码核酸”意指包含编码蛋白质的核苷酸序列的核酸(RNA或DNA分子)。编码序列可以进一步包括可操作地连接至调控元件的起始信号和终止信号,这些调控元件包括能够在向其给予核酸的个体或哺乳动物的细胞中指导核酸的表达的启动子和聚腺苷酸化信号。编码序列可以是密码子优化的。
如本文所用,意指核酸的“互补”或“互补的”可以意指核酸分子的核苷酸或核苷酸类似物之间的沃森-克里克(例如,AT/U和C-G)或胡斯坦(Hoogsteen)碱基配对。“互补性”是指两个核酸序列之间共有的特性,以使得当它们彼此反平行比对时,每个位置上的核苷酸碱基将是互补的。
如本文所用,“修正”、“基因组编辑”和“恢复”是指改变编码截短蛋白或根本不编码蛋白的突变基因,以使得获得全长功能性或部分全长功能性蛋白的表达。修正或恢复突变基因可以包括利用修复机制如同源定向修复(HDR)用不具有突变的基因拷贝替换具有突变的基因区域或替换整个突变基因。修正或恢复突变基因还可以包括通过以下方式修复引起提前终止密码子、异常剪接受***点或异常剪接供***点的移码突变:在基因中产生双链断裂,然后使用非同源末端连接(NHEJ)进行修复。NHEJ可以在修复过程中添加或缺失至少一个碱基对,从而可以恢复正确的阅读框并消除提前终止密码子。修正或恢复突变基因还可以包括破坏异常剪接受***点或剪接供体序列。修正或恢复突变基因还可以包括通过两种核酸酶在同一DNA链上的同时作用来缺失非必需基因区段,以便通过去除两个核酸酶靶位点之间的DNA并修复由NHEJ产生的DNA断裂来恢复正确的阅读框。
如在本文中可互换使用的“供体DNA”、“供体模板”和“修复模板”是指包括感兴趣的基因的至少一部分的双链DNA片段或分子。供体DNA可以编码全功能性蛋白或部分功能性蛋白。
如在本文中可互换使用的“杜氏肌营养不良”或“DMD”是指一种隐性遗传的、致命的、X连锁病症,其导致肌肉变性和最终的死亡。DMD是一种常见的遗传性单基因疾病,并且在3500名男性中发生1例。DMD的致因是在肌营养不良蛋白基因中引起无义或移码突变的遗传或自发突变。引起DMD的大多数肌营养不良蛋白突变是破坏阅读框并且引起肌营养不良蛋白基因的提前翻译终止的外显子缺失。DMD患者典型地在童年时期失去了自我身体支撑的能力,在青少年时期逐渐变得更弱,并且在二十多岁时死亡。
如本文所用,“肌营养不良蛋白”是指棒状胞质蛋白,其是通过细胞膜将肌纤维细胞骨架连接到周围的细胞外基质的蛋白质复合体的一部分。肌营养不良蛋白提供负责调控肌细胞完整性和功能的细胞膜肌营养不良蛋白聚糖复合体的结构稳定性。如在本文中可互换使用的肌营养不良蛋白基因或“DMD基因”是在基因座Xp21处的2.2兆碱基。初级转录测量了约2,400kb,其中成熟mRNA是约14kb。79个外显子编码超过3500个氨基酸的蛋白质。
如本文所用,“外显子51”是指肌营养不良蛋白基因的第51个外显子。在DMD患者中,外显子51常常邻近破坏框的缺失并且已在临床试验中被靶向用于基于寡核苷酸的外显子跳跃。外显子51跳跃化合物依替利森(eteplirsen)的临床试验最近报道了跨48周的显著功能益处,与基线相比具平均47%的肌营养不良蛋白阳性纤维。外显子51中的突变理想地适合于通过基于NHEJ的基因组编辑进行永久性修正。
如在本文中可互换使用的“移码”或“移码突变”是指一种类型的基因突变,其中一个或多个核苷酸的添加或缺失引起mRNA中密码子的阅读框移位。阅读框的移位可能导致蛋白质翻译时氨基酸序列改变,如错义突变或提前终止密码子。
如本文所用,“功能性”和“全功能性”描述了具有生物活性的蛋白质。“功能性基因“是指转录成mRNA的基因,mRNA被翻译成功能性蛋白。
如本文所用,“融合蛋白”是指通过最初编码单独蛋白质的两个或更多个基因的连接产生的嵌合蛋白。融合基因的翻译产生具有来源于每种原始蛋白质的功能特性的单一多肽。
如本文所用,“基因构建体”是指包含编码蛋白质的核苷酸序列的DNA或RNA分子。编码序列包括可操作地连接至调控元件的起始信号和终止信号,这些调控元件包括能够在向其给予核酸分子的个体的细胞中指导核酸的表达的启动子和聚腺苷酸化信号。如本文所用,术语“可表达形式”是指如下基因构建体,该基因构建体含有可操作连接至编码蛋白质的编码序列的必需调控元件,使得当存在于个体的细胞中时,编码序列将被表达。
如本文所用,“遗传疾病”是指部分或完全、直接或间接地由基因组中的一个或多个异常引起的疾病,特别是从出生就存在的病状。异常可以是突变、***或缺失。异常可以影响基因或其调控序列的编码序列。遗传疾病可以是但不限于DMD、贝克肌营养不良(BMD)、血友病、囊性纤维化、亨廷顿氏舞蹈病、家族性高胆固醇血症(LDL受体缺陷)、肝母细胞瘤、威尔逊氏病、先天性肝性卟啉症、遗传性肝性代谢病症、莱施-尼汉综合征(Lesch Nyhansyndrome)、镰状细胞性贫血、地中海贫血、着色性干皮病、范可尼氏贫血(Fanconi′sanemia)、色素性视网膜炎、共济失调毛细血管扩张、布卢姆综合征(Bloom′s syndrome)、成视网膜细胞瘤以及泰-萨二氏病(Tay-Sachs disease)。
如在本文中可互换使用的“同源定向修复”或“HDR”是指在细胞中当DNA的同样片段存在于细胞核时(主要在细胞周期的G2和S期)修复双链DNA损伤的机理。HDR使用供体DNA模板来指导修复,并且可以用于产生基因组的特定序列变化,包括整个基因的靶向添加。如果供体模板与基于CRISPR/Cas9的基因编辑***一起提供,则细胞机构将通过同源重组修复断裂,在存在DNA裂解的情况下该修复增强几个数量级。当不存在同源DNA片段时,可以作为替代发生非同源末端连接。
如本文所用,“基因组编辑”是指改变基因。基因组编辑可以包括修正或恢复突变基因。基因组编辑可以包括敲除基因,如突变基因或正常基因。基因组编辑可以通过改变感兴趣的基因用于治疗疾病或增强肌肉修复。
如本文所用,“相同”或“同一性”在两个或更多个核酸或多肽序列的背景下意指序列在指定区域上具有指定百分比的相同残基。百分比可以通过以下方式计算:最佳比对两个序列,在指定区域上比较两个序列,确定两个序列中出现相同残基的位置数以产生匹配位置数,将匹配位置数除以指定区域中的位置总数,并且将结果乘以100而得出序列同一性百分比。在两个序列具有不同长度或者比对产生一个或多个交错末端并且比较的指定区域仅包括单个序列的情况下,单个序列的残基包括在计算的分母中,而不包括在计算的分子中。当比较DNA和RNA时,可以认为胸腺嘧啶(T)和尿嘧啶(U)是等同的。可以手动或通过使用计算机序列算法如BLAST或BLAST 2.0来获得同一性。
如在本文中可互换使用的“突变基因“或“突变的基因“是指已经经历可检测的突变的基因。突变基因经历了改变,如遗传物质的丢失、获得或交换,该改变影响基因的正常传递和表达。如本文所用,“破坏的基因”是指具有引起提前终止密码子的突变的突变基因。破坏的基因产物相对于全长未破坏的基因产物是截短的。
如本文所用,“非同源末端连接(NHEJ)途径”是指通过在不需要同源模板的情况下直接连接断裂末端来修复双链断裂的途径。NHEJ对DNA末端的不依赖模板的重新连接是随机的、易错的修复过程,该过程在DNA断点处引入随机微***和微缺失(***缺失(indel))。此方法可以用于有意地破坏、缺失或改变靶基因序列的阅读框。NHEJ通常使用短同源DNA序列(称为微同源物)指导修复。这些微同源物常常存在于双链断裂末端上的单链突出端中。当突出端完全相容时,NHEJ通常准确地修复断裂,然而导致核苷酸丢失的不精确修复也可能发生,但是当突出端不相容时不精确修复更普遍得多。
如本文所用,“正常基因”是指未经历改变(如遗传物质的丢失、获得或交换)的基因。正常基因经历正常的基因传递和基因表达。
如本文所用,“核酸酶介导的NHEJ”是指核酸酶如cas9分子切割双链DNA后开始的NHEJ。
如本文所用,“核酸”或“寡核苷酸”或“多核苷酸”意指共价连接在一起的至少两个核苷酸。单链的描绘也定义了互补链的序列。因此,核酸也涵盖所描绘的单链的互补链。核酸的许多变体可以用于与给定核酸相同的目的。因此,核酸也涵盖基本相同的核酸及其互补序列。单链提供可以在严格杂交条件下与靶序列杂交的探针。因此,核酸还涵盖在严格杂交条件下杂交的探针。
核酸可以是单链或双链的,或者可以含有双链和单链序列两者的部分。核酸可以是基因组和cDNA的DNA、RNA或杂交体,其中核酸可以含有脱氧核糖核苷酸和核糖核苷酸的组合,以及碱基的组合,这些碱基包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶和异鸟嘌呤。核酸可以通过化学合成方法或通过重组方法来获得。
如本文所用,“可操作地连接”意指基因的表达在与之在空间上连接的启动子的控制下。启动子可以位于在其控制下的基因的5’(上游)或3’(下游)。启动子与基因之间的距离可以与该启动子与它控制的基因(在启动子所来源的基因中)之间的距离大致相同。正如本领域已知,可以调节此距离的变化而不丧失启动子功能。
如本文所用,“部分功能性”描述由突变基因编码并具有比功能性蛋白低但比非功能性蛋白高的生物活性的蛋白质。
如在本文中可互换使用的“提前终止密码子”或“框外终止密码子”是指DNA序列的无义突变,其导致通常不存在于野生型基因中的位置处的终止密码子。提前终止密码子可能引起蛋白质被截短或短于蛋白质的全长型式。
如本文所用,“启动子”是指合成的或天然来源的分子,其能够赋予、激活或增强细胞中核酸的表达。启动子可以包含一个或多个特异性转录调控序列以进一步增强表达和/或改变该序列的空间表达和/或时间表达。启动子还可以包含远端增强子或阻遏物元件,其可以定位于距转录起始位点多达几千个碱基对。启动子可以来源于以下来源:包括病毒、细菌、真菌、植物、昆虫和动物。就其中发生表达的细胞、组织或器官而言,或者就发生表达时的发育阶段而言,或者在响应于外部刺激如生理应激、病原体、金属离子或诱导剂时,启动子可以组成型地或差异性地调控基因组分的表达。启动子的代表性实例包括噬菌体T7启动子、噬菌体T3启动子、SP6启动子、乳糖操纵基因启动子、tac启动子、SV40晚期启动子、SV40早期启动子、RSV-LTR启动子、CMV IE启动子、SV40早期启动子或SV40晚期启动子、人U6(hU6)启动子和CMV IE启动子。
如本文所用,“骨骼肌”是指一种类型的横纹肌,其在躯体神经***的控制下,并通过称为肌腱的胶原纤维束与骨连接。骨骼肌由称为肌细胞或“肌肉细胞”(有时通称为“肌纤维”)的各组分组成。肌细胞在称为肌生成的过程中由发育的成肌细胞(一种类型的产生肌肉细胞的胚胎祖细胞)融合形成。这些长的圆柱形多核细胞也称为肌纤维。
如本文所用,“骨骼肌病状”是指与骨骼肌有关的病状,如肌营养不良、老化、肌肉变性、伤口愈合和肌无力或萎缩。
如在本文中可互换使用的“受试者”和“患者”是指任何脊椎动物,包括但不限于哺乳动物(例如,牛、猪、骆驼、美洲驼、马、山羊、兔、绵羊、仓鼠、豚鼠、猫、狗、大鼠和小鼠、非人灵长类动物(例如,猴,如食蟹猴(cynomolgous)或恒河猴、黑猩猩等)和人)。在一些实施例中,受试者可以是人或非人。受试者或患者可能正在接受其他形式的治疗。
如本文所用,“靶基因”是指编码已知或推定的基因产物的任何核苷酸序列。靶基因可以是遗传疾病中涉及的突变的基因。在某些实施例中,靶基因是人肌营养不良蛋白基因。在某些实施例中,靶基因是突变型人肌营养不良蛋白基因。
如本文所用,“靶区域”是指被设计为基于CRISPR/Cas9的基因编辑***结合和裂解的靶基因的区域。
如本文所用,“转基因“是指含有从一种生物体分离并引入不同生物体中的基因序列的基因或遗传物质。DNA的这种非天然区段可以保留在转基因生物体中产生RNA或蛋白质的能力,或可以改变转基因生物体的遗传密码的正常功能。转基因的引入具有改变生物体的表型的潜力。
本文关于核酸使用的“变体”意指(i)参比核苷酸序列的一部分或片段;(ii)参比核苷酸序列的互补序列或其部分;(iii)与参比核酸基本上相同的核酸或其互补序列;或(iv)在严格条件下与参比核酸、其互补序列或与其基本上相同的序列杂交的核酸。
有关肽或多肽的“变体”因氨基酸的***、缺失或保守取代而在氨基酸序列上不同但保留至少一种生物活性。变体还可以意指具有如下氨基酸序列的蛋白质,该氨基酸序列与具有保留至少一种生物活性的氨基酸序列的参比蛋白质基本相同。氨基酸的保守取代(即,将氨基酸用具有相似特性(例如,亲水性、带电荷区域的程度和分布)的不同氨基酸替换)在本领域中被视为典型涉及微小变化。正如本领域所了解的,通过考虑氨基酸的亲水指数可以部分地鉴定这些微小变化。Kyte et al.,J.Mol.Biol.[Kyte等人,分子生物学杂志]157:105-132(1982)。氨基酸的亲水指数是基于其疏水性和电荷的考量。本领域已知,具有类似亲水指数的氨基酸可以被取代并仍保留蛋白质功能。在一方面,具有±2的亲水指数的氨基酸是取代的。氨基酸的亲水性还可以用于揭示将产生保留生物功能的蛋白质的取代。在肽的背景下考虑氨基酸的亲水性允许计算该肽的最大局部平均亲水性。取代可以用彼此亲水性值在±2内的氨基酸进行。氨基酸的疏水性指数和亲水性值两者受氨基酸的特定侧链影响。应了解,与该观察结果一致,与生物功能相容的氨基酸取代取决于如通过疏水性、亲水性、电荷、大小和其他性质揭示的氨基酸、并且特别是那些氨基酸的侧链的相对相似性。
如本文所用,“载体”意指含有复制起点的核酸序列。载体可以是病毒载体、噬菌体、细菌人工染色体或酵母人工染色体。载体可以是DNA或RNA载体。载体可以是自我复制的染色体外载体,并且优选地是DNA质粒。例如,载体可以编码Cas9蛋白和至少一种gRNA分子,如包含SEQ ID NO:1-19、41、42中任一个或其互补序列的靶向结构域的gRNA。在一些实施例中,Cas9蛋白可以具有SEQ ID NO:27、SEQ ID NO:33或SEQ ID NO:45的氨基酸序列。在一些实施例中,Cas9蛋白可以是金黄色葡萄球菌Cas9,如具有SEQ ID NO:33或45的氨基酸序列的SaCas9。在一些实施例中,Cas9蛋白是由如下核酸序列编码,该核酸序列包含SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:35、SEQ ID NO:43或SEQ ID NO:44的核酸序列。
除非本文另外定义,否则结合本披露使用的科学和技术术语应具有本领域的普通技术人员通常所理解的含义。例如,与本文所描述的细胞和组织培养、分子生物学、免疫学、微生物学、遗传学以及蛋白质和核酸化学及杂交学结合使用的任何命名法是本领域众所周知并且常用的那些。术语的含义和范围应是清楚的;然而在任何潜在歧义的情况下,本文提供的定义优先于任何字典或外在定义。此外,除非上下文另外要求,单数术语应该包括复数含义并且复数术语应该包括单数含义。
2.用于肌营养不良蛋白基因的基因组编辑的基因构建体
本发明涉及用于基因组编辑、基因组改变或改变肌营养不良蛋白基因(例如,人肌营养不良蛋白基因)的基因表达的基因构建体。基因构建体包括靶向人和恒河猴两者的肌营养不良蛋白基因序列(如SaCas9相容靶标)的至少一种gRNA。所披露的gRNA可以被包括在基于CRISPR/Cas9的基因编辑***中,包括使用SaCas9的***,来靶向人肌营养不良蛋白基因的外显子51周围的内含子区域,导致此区域的基因组缺失以恢复来自DMD患者的细胞中功能性肌营养不良蛋白的表达。
a.肌营养不良蛋白基因
肌营养不良蛋白是指棒状胞质蛋白,其是通过细胞膜将肌纤维细胞骨架连接到周围的细胞外基质的蛋白质复合体的一部分。肌营养不良蛋白提供细胞膜肌营养不良蛋白聚糖复合体的结构稳定性。肌营养不良蛋白基因是在基因座Xp21处的2.2兆碱基。初级转录测量了约2,400kb,其中成熟mRNA是约14kb。79个外显子编码超过3500个氨基酸的蛋白质。正常骨骼肌组织仅含有少量肌营养不良蛋白,但不存在异常表达会导致严重且无法治愈的症状的发展。肌营养不良蛋白基因中的一些突变导致受影响患者中产生缺陷型肌营养不良蛋白和严重肌营养不良表型。肌营养不良蛋白基因中的一些突变导致受影响患者中的部分功能性肌营养不良蛋白和轻微得多的肌营养不良表型。
DMD的致因是在肌营养不良蛋白基因中引起无义或移码突变的遗传或自发突变。对于DMD,天然存在的突变及其后果相对较好地理解。已知在棒结构域内包含的外显子45-55区域(例如,外显子51)中发生的框内缺失可产生高度功能性肌营养不良蛋白,并且许多携带者无症状或显示轻度症状。此外,超过60%的患者理论上可以通过靶向肌营养不良蛋白基因的此区域的外显子(例如,靶向外显子51)进行治疗。已经做出努力通过在mRNA剪接期间跳过非必需外显子(例如,外显子51跳跃)以产生内部缺失但为功能性的肌营养不良蛋白,来恢复DMD患者中被破坏的肌营养不良蛋白阅读框。一个或多个内部肌营养不良蛋白外显子的缺失(例如,外显子51的缺失)保留了正确的阅读框,但导致不那么严重的贝克肌营养不良或BMD。贝克肌营养不良或BMD基因型与DMD类似的地方在于肌营养不良蛋白基因中存在缺失。然而,这些缺失使得阅读框完好。因此,创建了内部截短但为部分功能性的肌营养不良蛋白。BMD具有广泛的表型,但通常如果缺失在肌营养不良蛋白的外显子45-55之间,则与DMD相比,表型轻微得多。因此,将DMD基因型改为BMD基因型是修正肌营养不良蛋白的常用策略。修正肌营养不良蛋白有许多策略,其中许多依赖于恢复内源肌营养不良蛋白的阅读框。这将疾病基因型从DMD转换为贝克肌营养不良。许多BMD患者具有维持翻译阅读框的基因内缺失,导致较短但很大程度上为功能性的肌营养不良蛋白。
在某些实施例中,修饰外显子51(例如,通过例如NHEJ进行的外显子51的缺失或切除)以恢复阅读框改善了表型DMD受试者,包括具有缺失突变的DMD受试者。在某些实施例中,肌营养不良蛋白基因的外显子51是指肌营养不良蛋白基因的第51个外显子。在DMD患者中,外显子51常常邻近破坏框的缺失并且已在临床试验中被靶向用于基于寡核苷酸的外显子跳跃。外显子51跳跃化合物依替利森的临床试验报道了跨48周的显著功能益处,与基线相比具平均47%的肌营养不良蛋白阳性纤维。外显子51中的突变理想地适合于通过基于NHEJ的基因组编辑进行永久性修正。
本发明披露的载体可以在肌营养不良蛋白基因(例如,人肌营养不良蛋白基因)中产生缺失。在某些实施例中,载体被配置为形成在肌营养不良蛋白基因的靶位置侧翼的两个内含子(第一内含子和第二内含子)中的两个双链断裂(第一双链断裂和第二双链断裂),从而缺失包含肌营养不良蛋白靶位置的肌营养不良蛋白基因区段。“肌营养不良蛋白靶位置”可以是肌营养不良蛋白外显子靶位置或肌营养不良蛋白外显子内靶位置,如本文所述。肌营养不良蛋白外显子靶位置的缺失可以优化患有杜氏肌营养不良的受试者的肌营养不良蛋白序列,例如它可以增加所编码的肌营养不良蛋白的功能或活性,或导致受试者疾病状态的改进。在某些实施例中,肌营养不良蛋白外显子靶位置的切除恢复阅读框。肌营养不良蛋白外显子靶位置可以包含肌营养不良蛋白基因的一个或多个外显子。在某些实施例中,肌营养不良蛋白靶位置包含肌营养不良蛋白基因(例如,人肌营养不良蛋白基因)的外显子51。
本发明披露的基因构建体(例如,载体)可以介导肌营养不良蛋白基因(例如,人肌营养不良蛋白基因)的外显子51处的高效基因编辑。本发明披露的基因构建体(例如,载体)恢复来自DMD患者的细胞中的肌营养不良蛋白表达。
在DMD中,外显子51常常邻近破坏框的缺失。通过外显子跳跃消除肌营养不良蛋白的外显子51可以用于治疗大约15%的所有DMD患者。这类肌营养不良蛋白突变理想地适合通过基于NHEJ的基因组编辑和HDR进行的永久性修正。本文所述的基因构建体(例如,载体)已经开发用于人肌营养不良蛋白基因中外显子51的靶向修饰。将本发明披露的基因构建体(例如,载体)转染到人DMD细胞中并介导有效的基因修饰和向正确阅读框的转化。蛋白质修复伴随着阅读框修复,并在基于CRISPR/Cas9的基因编辑***处理的细胞的大群体中检测到。
b.CRISPR***
本发明披露的基因构建体(例如,载体)编码对肌营养不良蛋白基因(例如,人肌营养不良蛋白基因)有特异性的基于CRISPR/Cas9的基因编辑***。如在本文中可互换使用的“成簇规律间隔短回文重复序列”和“CRISPR”是指含有多个短的正向重复序列的基因座,这些重复序列存在于大约40%的测序细菌和90%的测序古细菌的基因组中。CRISPR***是一种微生物核酸酶***,其参与防御提供获得性免疫形式的入侵噬菌体和质粒。微生物宿主中的CRISPR基因座含有CRISPR相关(Cas)基因以及能够编程CRISPR介导的核酸裂解特异性的非编码RNA元件的组合。将短的外来DNA区段(称为间隔子)在CRISPR重复序列之间整合到基因组中,并用作暴露后的“记忆”。Cas9与sgRNA(在本文中也可互换地称为“gRNA”)的3’端形成复合体,并且该蛋白质-RNA对通过sgRNA序列的5’端与预先确定的20bp DNA序列(称为原型间隔子)之间的互补碱基配对识别其基因组靶标。此复合体经由crRNA内编码的区域(即,原型间隔子)和病原体基因组内的原型间隔子邻近基序(PAM)指导至病原体DNA的同源基因座。同向重复序列内的非编码CRISPR阵列被转录并裂解成含有单独间隔子序列的短的crRNA,这些crRNA将Cas核酸酶指导至靶位点(原型间隔子)。通过简单交换所表达的sgRNA的20bp识别序列,Cas9核酸酶可以被指导至新的基因组靶标。使用CRISPR间隔子以类似于真核生物的RNAi的方式识别外源遗传元件并使其沉默。
已知CRISPR***的3个类别(I、II和III型效应器***)。II型效应器***使用单一效应酶Cas9以四个相继步骤进行靶向DNA双链断裂以裂解dsDNA。与需要多个不同的效应器作为复合体起作用的I型和III型效应器***相比,II型效应器***可以在替代性情况(如真核细胞)中起作用。II型效应器***由长的前crRNA(其自含有间隔子的CRISPR基因座转录)、Cas9蛋白和参与前crRNA加工的tracrRNA组成。tracrRNA与分隔前crRNA的间隔子的重复区杂交,因此通过内源RNA酶III开始dsRNA裂解。此裂解之后是通过Cas9在各间隔子内的第二裂解事件,产生保持与tracrRNA和Cas9缔合的成熟crRNA,从而形成Cas9:crRNA-tracrRNA复合体。
Cas9:crRNA-tracrRNA复合体解开DNA双链体,并搜寻匹配crRNA的序列以裂解。靶标识别在检测靶DNA中的“原型间隔子”序列与crRNA中的其余间隔子序列之间的互补性时发生。如果正确的原型间隔子邻近基序(PAM)也存在于原型间隔子的3’端,则Cas9介导靶DNA的裂解。对于原型间隔子靶向,序列必须紧接原型间隔子邻近基序(PAM)(一种被为DNA裂解所必需的Cas9核酸酶识别的短序列)之后。不同的II型***具有不同的PAM要求。化脓链球菌CRISPR***可以具有作为5’-NRG-3’的这种Cas9(SpCas9)的PAM序列,其中R为A或G,并以此***在人细胞中的特异性为特征。基于CRISPR/Cas9的基因编辑***的独特能力是通过共表达单一Cas9蛋白与两种或更多种sgRNA同时靶向多个不同基因座的直接能力。例如,化脓链球菌II型***天然更喜欢使用“NGG”序列,其中“N”可以是任何核苷酸,但在工程化***中还可接受其他PAM序列,如“NAG”(Hsu et al.,Nature Biotechnology[Hsu等人,自然生物技术](2013)doi:10.1038/nbt.2647)。类似地,来源于脑膜炎奈瑟球菌(Neisseria meningitidis)的Cas9(NmCas9)通常具有NNNNGATT的天然PAM,但具有多种PAM间的活性,包括高度简并的NNNNGNNN PAM(Esvelt et al.Nature Methods[Esvelt等人自然方法](2013)doi:10.1038/nmeth.2681)。
金黄色葡萄球菌的Cas9分子识别序列基序NNGRR(R=A或G)(SEQ ID NO:22)并指导裂解靶核酸序列的在该序列上游的1至10(例如,3至5)bp。在某些实施例中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRRN(R=A或G)(SEQ ID NO:23)并指导裂解靶核酸序列的在该序列上游的1至10(例如,3至5)bp。在某些实施例中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRRT(R=A或G)(SEQ ID NO:24)并指导裂解靶核酸序列的在该序列上游的1至10(例如,3至5)bp。在某些实施例中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRRV(R=A或G)(SEQ ID NO:25)并指导裂解靶核酸序列的在该序列上游的1至10(例如,3至5)bp。在前述实施例中,N可以是任何核苷酸残基,例如A、G、C或T中的任一个。可以工程化Cas9分子以改变Cas9分子的PAM特异性。
(1)基于CRISPRlCas9的基因编辑***
化脓链球菌的II型效应器***的一种工程化形式显示在人细胞中发挥作用而用于基因组工程。在此***中,通过合成再造的“指导RNA”(“gRNA”,在本文中也可互换地用作嵌合单指导RNA(“sgRNA”))(该指导RNA是一般避免RNA酶III和crRNA加工的需要的crRNA-tracrRNA融合物)将Cas9蛋白指导至基因组靶位点。本文提供了用于基因组编辑和治疗遗传疾病的基于CRISPR/Cas9的工程化***。基于CRISPR/Cas9的工程化***可以被设计为靶向任何基因,包括遗传疾病、老化、组织再生或伤口愈合中涉及的基因。基于CRISPR/Cas9的基因编辑***可以包括Cas9蛋白或Cas9融合蛋白和至少一种gRNA。在某些实施例中,该***包含两种gRNA分子。Cas9融合蛋白可以包括例如具有不同活性、对Cas9是内源的结构域,如反式激活结构域。
靶基因(例如,肌营养不良蛋白基因,例如人肌营养不良蛋白基因)可参与细胞的分化或其中可能希望激活基因的任何其他过程,或可具有突变如移码突变或无义突变。如果靶基因具有引起提前终止密码子、异常剪接受***点或异常剪接供***点的突变,则基于CRISPR/Cas9的基因编辑***可以被设计为识别并结合提前终止密码子、异常剪接受***点或异常剪接供***点的上游或下游的核苷酸序列。基于CRISPR-Cas9的***也可以用来通过靶向剪接受体和供体破坏正常基因剪接以诱导提前终止密码子跳跃或恢复被破坏的阅读框。基于CRISPR/Cas9的基因编辑***可以介导或可以不介导脱靶改变成为基因组的蛋白质编码区。
(a)Cas9分子和Cas9融合蛋白
基于CRISPR/Cas9的基因编辑***可以包括Cas9蛋白或Cas9融合蛋白。Cas9蛋白是一种裂解核酸的内切核酸酶,并且由CRISPR基因座编码并参与II型CRISPR***。Cas9蛋白可以来自任何细菌或古细菌物种,包括但不限于化脓链球菌、金黄色葡萄球菌(S.aureus)、燕麦食酸菌(Acidovorax avenae)、胸膜肺炎放线杆菌(Actinobacilluspleuropneumoniae)、琥珀酸放线杆菌(Actinobacillus succinogenes)、猪放线杆菌(Actinobacillus suis)、放线菌属(Actinomyces sp.)、cycliphilus denitrificans、少食氨基单胞菌(Aminomonas paucivorans)、蜡样芽孢杆菌(Bacillus cereus)、史氏芽孢杆菌(Bacillus smithii)、苏云金芽孢杆菌(Bacillus thuringiensis)、拟杆菌属(Bacteroides sp.)、Blastopirellula marina、慢生根瘤菌属(Bradyrhizobium sp.)、侧孢短芽孢杆菌(Brevibacillus laterosporus)、结肠弯曲杆菌(Campylobacter coli)、空肠弯曲杆菌(Campylobacter jejuni)、红嘴鸥弯曲杆菌(Campylobacter lari)、Candidatus Puniceispirillum、解纤维梭菌(Clostridium cellulolyticum)、产气荚膜梭菌(Clostridium perfringens)、拥挤棒状杆菌(Corynebacterium accolens)、白喉棒状杆菌(Corynebacterium diphtheria)、马氏棒状杆菌(Corynebacterium matruchotii)、Dinoroseobacter shibae、细长真杆菌(Eubacterium dolichum)、γ-变形菌(gammaproteobacterium)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、副流感嗜血杆菌(Haemophilus parainfluenzae)、生痰嗜血杆菌(Haemophilus sputorum)、加拿大螺杆菌(Helicobacter canadensis)、同性恋螺杆菌(Helicobacter cinaedi)、鼬鼠螺杆菌(Helicobacter mustelae)、多营养泥杆菌(Ilyobacter polytropus)、金氏金氏菌(Kingella kingae)、卷曲乳酸杆菌(Lactobacillus crispatus)、伊氏李斯特菌(Listeriaivanovii)、单核细胞增生李斯特菌(Listeria monocytogenes)、李斯特氏菌科菌(Listeriaceae bacterium)、甲基孢囊菌属(Methylocystts sp.)、甲烷氧化菌(Methylosinus trichosporium)、羞怯动弯杆菌(Mobiluncus mulieris)、杆状奈瑟球菌(Neisseria bacilliformis)、灰色奈瑟球菌(Neisseria cinerea)、浅黄色奈瑟球菌(Neisseria flavescens)、乳糖奈瑟球菌(Neisseria lactamica)、奈瑟球菌属(Neisseriasp.)、瓦茨瓦尔西奈瑟球菌(Neisseria wadsworthii)、亚硝化单胞菌属(Nitrosomonassp.)、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、多杀巴氏杆菌(Pasteurellamultocida)、Phascolarctobacterium succinatutens、Ralstonia syzygii、沼泽红假单胞菌(Rhodopseudomonas palustris)、小红卵菌属(Rhodovulum sp.)、米氏西蒙斯氏菌(Simonsiella muelleri)、鞘氨醇单胞菌属(Sphingomonas sp.)、Sporolactobacillusvineae、路邓葡萄球菌(Staphylococcus lugdunensis)、链球菌属(Streptococcus sp.)、Subdoligranulum sp.、运动替斯崔纳菌(Tistrella mobilis)、密螺旋体属(Treponemasp.)或Verminephrobacter eiseniae。在某些实施例中,Cas9分子是化脓链球菌Cas9分子(在本文中也称为“SpCas9”)。在某些实施例中,Cas9分子是金黄色葡萄球菌Cas9分子(在本文中也称为“SaCas9”)。
Cas9分子或Cas9融合蛋白可以与一种或多种gRNA分子相互作用,并且与该一种或多种gRNA分子一起定位至包含靶结构域(并且在某些实施例中为PAM序列)的位点。Cas9分子或Cas9融合蛋白识别PAM序列的能力可以例如使用如前所述的转化测定(Jinek 2012)来确定。
在某些实施例中,Cas9分子或Cas9融合蛋白与靶核酸相互作用并裂解靶核酸的能力是PAM序列依赖性的。PAM序列是靶核酸中的序列。在某些实施例中,靶核酸的裂解发生在PAM序列的上游。来自不同细菌物种的Cas9分子可以识别不同的序列基序(例如,PAM序列)。在某些实施例中,化脓链球菌的Cas9分子识别序列基序NGG并指导裂解靶核酸序列的在该序列上游的1至10(例如,3至5)bp(参见例如,Mali 2013)。在某些实施例中,嗜热链球菌的Cas9分子识别序列基序NGGNG(SEQ ID NO:36)和/或NNAGAAW(W=A或T)(SEQ ID NO:20)并指导裂解靶核酸序列的这些序列上游的1至10(例如,3至5)bp(参见例如,Horvath 2010;Deveau 2008)。在某些实施例中,变异链球菌的Cas9分子识别序列基序NGG和/或NAAR(R=A或G)(SEQ ID NO:21)并指导裂解靶核酸序列的此序列上游的1至10(例如,3至5)bp(参见例如,Deveau 2008)。在某些实施例中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRR(R=A或G)(SEQ ID NO:22)并指导裂解靶核酸序列的在该序列上游的1至10(例如,3至5)bp。在某些实施例中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRRN(R=A或G)(SEQ ID NO:23)并指导裂解靶核酸序列的在该序列上游的1至10(例如,3至5)bp。在某些实施例中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRRT(R=A或G)(SEQ ID NO:24)并指导裂解靶核酸序列的在该序列上游的1至10(例如,3至5)bp。在某些实施例中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRRV(R=A或G;V=A或C或G)(SEO ID NO:25)并指导裂解靶核酸序列的在该序列上游的1至10(例如,)3至5bp。在前述实施例中,N可以是任何核苷酸残基,例如A、G、C或T中的任一个。可以工程化Cas9分子以改变Cas9分子的PAM特异性。
在某些实施例中,载体编码至少一种识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQID NO:25)的原型间隔子邻近基序(PAM)的Cas9分子。在某些实施例中,该至少一种Cas9分子是金黄色葡萄球菌Cas9分子。在某些实施例中,该至少一种Cas9分子是突变型金黄色葡萄球菌Cas9分子。
可以使Cas9蛋白突变,使得核酸酶活性失活。没有内切核酸酶活性的失活Cas9蛋白(iCas9,也称为“dCas9”)最近通过gRNA靶向细菌、酵母和人细胞中的基因以通过位阻使基因表达沉默。关于化脓链球菌Cas9序列的示例性突变包括:D10A、E762A、H840A、N854A、N863A和/或D986A。关于金黄色葡萄球菌Cas9序列的示例性突变包括D10A和N580A。在某些实施例中,Cas9分子是突变型金黄色葡萄球菌Cas9分子。在某些实施例中,突变型金黄色葡萄球菌Cas9分子包含D10A突变。编码此突变型金黄色葡萄球菌Cas9的核苷酸序列在下文提供的SEQ ID NO:34中列出:
在某些实施例中,突变型金黄色葡萄球菌Cas9分子包含N580A突变。编码此突变型金黄色葡萄球菌Cas9分子的核苷酸序列在下文提供的SEQ ID NO:35中列出:
编码Cas9分子的核酸可以是合成核酸序列。例如,合成核酸分子可以经化学修饰。可以对合成核酸序列进行密码子优化,例如,至少一个非常见密码子或较不常见密码子已被常见密码子替换。例如,合成核酸可以指导优化的信使mRNA的合成,例如针对哺乳动物表达***中的表达优化的,例如本文所述的。
此外或可替代地,编码Cas9分子或Cas9多肽的核酸可以包含核定位序列(NLS)。核定位序列在本领域是已知的。
编码化脓链球菌的Cas9分子的示例性密码子优化的核酸序列在下文提供的SEQID NO:26中列出:
化脓链球菌Cas9分子的相应氨基酸序列在下文提供的SEQ ID NO:27中列出:
编码金黄色葡萄球菌的Cas9分子并且任选含有核定位序列(NLS)的示例性密码子优化的核酸序列在下文提供的SEQ ID NO:28-32、43和44中列出。编码金黄色葡萄球菌的Cas9分子的另一示例性密码子优化的核酸序列包含SEQ ID NO:83的核苷酸1293-4451。
下文列出了SEQ ID NO:28:
下文列出了SEQ ID NO:29。
下文列出了SEQ ID NO:30。
下文列出了SEQ ID NO:31。
下文列出了SEQ ID NO:32。
下文列出了SEQ ID NO:43。
在一些实施例中,编码金黄色葡萄球菌Cas9分子的核苷酸序列包括下文提供的SEQ ID NO:44的核苷酸序列:
金黄色葡萄球菌Cas9分子的氨基酸序列在下文提供的SEQ ID NO:33中列出。
金黄色葡萄球菌Cas9分子的氨基酸序列在下文提供的SEQ ID NO:45中列出。
可替代地或此外,基于CRISPR/Cas9的基因编辑***可以包括融合蛋白。融合蛋白可以包含两个异源多肽结构域,其中第一多肽结构域包含Cas蛋白,并且第二多肽结构域具有诸如转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、核酸结合活性、甲基化酶活性或脱甲基酶活性等活性。融合蛋白可以包括与第二多肽结构域融合的Cas9蛋白或突变的Cas9蛋白,该第二多肽结构域具有诸如转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、核酸结合活性、甲基化酶活性或脱甲基酶活性等活性。
(a)转录激活活性
第二多肽结构域可以具有转录激活活性,即反式激活结构域。例如,内源哺乳动物基因(如人类基因)的基因表达可以通过将iCas9和反式激活结构域的融合蛋白经由gRNA的组合靶向哺乳动物启动子来实现。反式激活结构域可以包括一种VP 16蛋白、多种VP 16蛋白,如VP48结构域或VP64结构域,或NFκB转录激活物活性的p65结构域。例如,融合蛋白可以是iCas9-VP64。
(b)转录抑制活性
第二多肽结构域可以具有转录抑制活性。第二多肽结构域可以具有Kruppel相关盒活性如KRAB结构域、ERF阻遏物结构域活性、Mxil阻遏物结构域活性、SID4X阻遏物结构域活性、Mad-SID阻遏物结构域活性或TATA盒结合蛋白活性。例如,融合蛋白可以是dCas9-KRAB。
(c)转录释放因子活性
第二多肽结构域可以具有转录释放因子活性。第二多肽结构域可以具有真核释放因子1(ERF1)活性或真核释放因子3(ERF3)活性。
(d)组蛋白修饰活性
第二多肽结构域可以具有组蛋白修饰活性。第二多肽结构域可以具有组蛋白脱乙酰酶、组蛋白乙酰转移酶、组蛋白脱甲基酶或组蛋白甲基转移酶活性。组蛋白乙酰转移酶可以是p300或CREB结合蛋白(CBP)或其片段。例如,融合蛋白可以是dCas9-p300。
(e)核酸酶活性
第二多肽结构域可以具有不同于Cas9蛋白的核酸酶活性的核酸酶活性。核酸酶或具有核酸酶活性的蛋白质是能够裂解核酸的核苷酸亚单位之间的磷酸二酯键的酶。核酸酶通常进一步分为内切核酸酶和外切核酸酶,但是一些酶可落入两个类别内。众所周知的核酸酶是脱氧核糖核酸酶和核糖核酸酶。
(f)核酸结合活性
第二多肽结构域可以具有核酸结合活性,或者核酸结合蛋白-DNA结合结构域(DBD)是独立折叠的蛋白结构域,其含有至少一个识别双链或单链DNA的基序。DBD可以识别特定的DNA序列(识别序列)或对选自下组的DNA核酸结合区具有一般亲和力,该组由以下组成:螺旋-转角-螺旋区域、亮氨酸拉链区域、有翼螺旋区域、有翼螺旋-转角-螺旋区域、螺旋-环-螺旋区域、免疫球蛋白折叠、B3结构域、锌指、HMG盒、Wor3结构域、TAL效应子DNA结合结构域。
(g)甲基化酶活性
第二多肽结构域可以具有甲基化酶活性,其涉及将甲基转移至DNA、RNA、蛋白质、小分子、胞嘧啶或腺嘌呤。第二多肽结构域可以包括DNA甲基转移酶。
(h)脱甲基酶活性
第二多肽结构域可以具有脱甲基酶活性。第二多肽结构域可以包括从核酸、蛋白(特别是组蛋白)和其他分子中去除甲基(CH3-)基团的酶。可替代地,在使DNA脱甲基化的机制中,第二多肽可以将甲基基团转化为羟甲基胞嘧啶。第二多肽可以催化此反应。例如,催化此反应的第二多肽可以是Tet1。
(b)靶向肌营养不良蛋白基因的gRNA
基于CRISPR/Cas9的基因编辑***包括至少一种gRNA分子,例如两种gRNA分子。gRNA提供了基于CRISPR/Cas9的基因编辑***的靶向。gRNA是以下两种非编码RNA的融合物:crRNA和tracrRNA。sgRNA可以通过交换编码20bp原型间隔子的序列(该序列通过与所需DNA靶标的互补碱基配对赋予靶向特异性)而靶向任何所需的DNA序列。gRNA模拟参与II型效应器***的天然存在的crRNA:tracrRNA双链体。可以包括例如42个核苷酸crRNA和75个核苷酸tracrRNA的这种双链体起指导Cas9裂解靶核酸的作用。如在本文中可互换使用的“靶区域”、“靶序列”或“原型间隔子”是指基于CRISPR/Cas9的基因编辑***所靶向的靶基因(例如,肌营养不良蛋白基因)的区域。基于CRISPR/Cas9的基因编辑***可以包括至少一种gRNA,其中这些gRNA靶向不同的DNA序列。靶DNA序列可以是重叠的。靶序列或原型间隔子后面是在原型间隔子3’端处的PAM序列。不同的II型***具有不同的PAM要求。例如,化脓链球菌II型***使用“NGG”序列,其中“N”可以是任何核苷酸。在一些实施例中,PAM序列可以是“NGG”,其中“N”可以是任何核苷酸。在一些实施例中,PAM序列可以是NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)。
由本发明披露的基因构建体(例如,AAV载体)编码的gRNA分子的数目可以是至少1种gRNA、至少2种不同的gRNA、至少3种不同的gRNA、至少4种不同的gRNA、至少5种不同的gRNA、至少6种不同的gRNA、至少7种不同的gRNA、至少8种不同的gRNA、至少9种不同的gRNA、至少10种不同的gRNA、至少11种不同的gRNA、至少12种不同的gRNA、至少13种不同的gRNA、至少14种不同的gRNA、至少15种不同的gRNA、至少16种不同的gRNA、至少17种不同的gRNA、至少18种不同的gRNA、至少18种不同的gRNA、至少20种不同的gRNA、至少25种不同的gRNA、至少30种不同的gRNA、至少35种不同的gRNA、至少40种不同的gRNA、至少45种不同的gRNA或至少50种不同的gRNA。由本发明披露的载体编码的gRNA的数目可以是在至少1种gRNA到至少50种不同的gRNA、至少1种gRNA到至少45种不同的gRNA、至少1种gRNA到至少40种不同的gRNA、至少1种gRNA到至少35种不同的gRNA、至少1种gRNA到至少30种不同的gRNA、至少1种gRNA到至少25种不同的gRNA、至少1种gRNA到至少20种不同的gRNA、至少1种gRNA到至少16种不同的gRNA、至少1种gRNA到至少12种不同的gRNA、至少1种gRNA到至少8种不同的gRNA、至少1种gRNA到至少4种不同的gRNA、至少4种gRNA到至少50种不同的gRNA、至少4种不同的gRNA到至少45种不同的gRNA、至少4种不同的gRNA到至少40种不同的gRNA、至少4种不同的gRNA到至少35种不同的gRNA、至少4种不同的gRNA到至少30种不同的gRNA、至少4种不同的gRNA到至少25种不同的gRNA、至少4种不同的gRNA到至少20种不同的gRNA、至少4种不同的gRNA到至少16种不同的gRNA、至少4种不同的gRNA到至少12种不同的gRNA、至少4种不同的gRNA到至少8种不同的gRNA、至少8种不同的gRNA到至少50种不同的gRNA、至少8种不同的gRNA到至少45种不同的gRNA、至少8种不同的gRNA到至少40种不同的gRNA、至少8种不同的gRNA到至少35种不同的gRNA、8种不同的gRNA到至少30种不同的gRNA、至少8种不同的gRNA到至少25种不同的gRNA、8种不同的gRNA到至少20种不同的gRNA、至少8种不同的gRNA到至少16种不同的gRNA或8种不同的gRNA到至少12种不同的gRNA之间。在某些实施例中,基因构建体(例如,AAV载体)编码一种gRNA分子(即,第一gRNA分子)和任选地Cas9分子。在某些实施例中,第一基因构建体(例如,第一AAV载体)编码一种gRNA分子(即,第一gRNA分子)和任选地Cas9分子,并且第二基因构建体(例如,第二AAV载体)编码一种gRNA分子(即,第二gRNA分子)和任选地Cas9分子。
gRNA分子包含靶向结构域,即后跟PAM序列的靶DNA序列的互补多核苷酸序列。gRNA可以在靶向结构域或互补多核苷酸序列的5’端包含“G”。gRNA分子的靶向结构域可以包含后跟PAM序列的靶DNA序列的至少10个碱基对、至少11个碱基对、至少12个碱基对、至少13个碱基对、至少14个碱基对、至少15个碱基对、至少16个碱基对、至少17个碱基对、至少18个碱基对、至少19个碱基对、至少20个碱基对、至少21个碱基对、至少22个碱基对、至少23个碱基对、至少24个碱基对、至少25个碱基对、至少30个碱基对或至少35个碱基对互补多核苷酸序列。在某些实施例中,gRNA分子的靶向结构域的长度为19-25个核苷酸。在某些实施例中,gRNA分子的靶向结构域的长度为20个核苷酸。在某些实施例中,gRNA分子的靶向结构域的长度为21个核苷酸。在某些实施例中,gRNA分子的靶向结构域的长度为22个核苷酸。在某些实施例中,gRNA分子的靶向结构域的长度为23个核苷酸。
gRNA可以靶向肌营养不良蛋白基因(DMD)的区域。在某些实施例中,gRNA可以靶向肌营养不良蛋白基因的外显子、内含子、启动子区、增强子区、转录区中的至少一种。在某些实施例中,gRNA分子靶向人肌营养不良蛋白基因的内含子50。在某些实施例中,gRNA分子靶向人肌营养不良蛋白基因的内含子51。在某些实施例中,gRNA分子靶向人肌营养不良蛋白基因的外显子51。gRNA可以包括靶向结构域,该靶向结构域包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19中列出的核苷酸序列或其互补序列。
可以设计单一或多重gRNA,以通过靶向外显子51处的突变热点或和引入外显子51的外显子内小***和缺失或切除来恢复肌营养不良蛋白阅读框。用本发明披露的载体处理后,在体外在杜氏肌营养不良患者肌肉细胞中的肌营养不良蛋白表达可以恢复。在将基因修正的患者细胞移植到免疫缺陷小鼠中之后,在体内检测到人肌营养不良蛋白。值得注意的是,基于CRISPR/Cas9的基因编辑***的独特的多重基因编辑能力使得能够高效地产生此突变热点区域的大量缺失,其通过通用或患者特异性基因编辑方法可以修正多达62%的患者突变。在一些实施例中,基于如通过surveyor测量的脱靶活性、中靶活性和距外显子的距离来评估和选取候选gRNA。
3.DNA靶向组合物
本发明还涉及包含此类基因构建体的DNA靶向组合物。如上所述,DNA靶向组合物包括至少一种靶向肌营养不良蛋白基因(例如,人肌营养不良蛋白基因)的gRNA分子(例如,两种gRNA分子)。该至少一种gRNA分子可以结合并识别靶区域。可以在可能的框外终止密码子的临上游选取靶区域,使得修复过程中的***或缺失通过框转换恢复肌营养不良蛋白阅读框。靶区域也可以是剪接受***点或剪接供***点,使得修复过程中的***或缺失破坏剪接并通过剪接位点破坏和外显子排除来恢复肌营养不良蛋白阅读框。靶区域也可以是异常终止密码子,使得修复过程中的***或缺失通过消除或破坏终止密码子来恢复肌营养不良蛋白阅读框。
在某些实施例中,本发明披露的DNA靶向组合物包括第一gRNA和第二gRNA,其中第一gRNA分子和第二gRNA分子包含靶向结构域,该靶向结构域包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19中列出的核苷酸序列或其互补序列。在某些实施例中,第一gRNA分子和第二gRNA分子包含不同的靶向结构域。在某些实施例中,第一gRNA分子是SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14或SEQ ID NO:15,并且第二gRNA分子是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18或SEQ ID NO:19。在某些实施例中,第一gRNA分子选自下组,该组由以下组成:SEQ ID NO:1、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14和SEQ ID NO:15,并且第二gRNA分子选自下组,该组由以下组成:SEQID NO:2、SEQ ID NO:4、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18和SEQ ID NO:19。
在某些实施例中,第一gRNA分子和第二gRNA分子选自下组,该组由以下组成:(i)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:1中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:2中列出的核苷酸序列;(ii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ IDNO:4中列出的核苷酸序列;(iii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(iv)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;(v)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(vi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(vii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ IDNO:18中列出的核苷酸序列;(viii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(ix)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(x)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列;(xi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;以及(xii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ IDNO:41中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:42中列出的核苷酸序列。在一些实施例中,DNA靶向组合物包括SEQ ID NO:37中列出的核苷酸序列和/或SEQ ID NO:38中列出的核苷酸序列。
在某些实施例中,DNA靶向组合物可以进一步包括至少一种识别NNGRRT(SEQ IDNO:24)或NNGRRV(SEQ ID NO:25)的PAM的Cas9分子或Cas9融合蛋白。在一些实施例中,DNA靶向组合物包括SEQ ID NO:83或SEQ ID NO:84中列出的核苷酸序列。在某些实施例中,载体被配置为分别形成在人肌营养不良蛋白基因的外显子51侧翼的第一和第二内含子中的第一和第二双链断裂,从而缺失包含外显子51的肌营养不良蛋白基因区段。
本发明披露的载体的缺失效率可以与缺失大小(即,通过载体缺失的区段的大小)相关。在某些实施例中,特定缺失的长度或大小由被靶向的基因(例如,肌营养不良蛋白基因)中PAM序列之间的距离决定。在某些实施例中,肌营养不良蛋白基因区段的根据其长度和其包含的序列(例如,外显子51)定义的特定缺失是与靶基因(例如,肌营养不良蛋白基因)内与特定PAM序列相邻的断裂的结果。
在某些实施例中,缺失大小为约50至约2,000个碱基对(bp),例如约50至约1999bp、约50至约1900bp、约50至约1800bp、约50至约1700bp、约50至约1650bp、约50至约1600bp、约50至约1500bp、约50至约1400bp、约50至约1300bp、约50至约1200bp、约50至约1150bp、约50至约1100bp、约50至约1000bp、约50至约900bp、约50至约850bp、约50至约800bp、约50至约750bp、约50至约700bp、约50至约600bp、约50至约500bp、约50至约400bp、约50至约350bp、约50至约300bp、约50至约250bp、约50至约200bp、约50至约150bp、约50至约100bp、约100至约1999bp、约100至约1900bp、约100至约1800bp、约100至约1700bp、约100至约1650bp、约100至约1600bp、约100至约1500bp、约100至约1400bp、约100至约1300bp、约100至约1200bp、约100至约1150bp、约100至约1100bp、约100至约1000bp、约100至约900bp、约100至约850bp、约100至约800bp、约100至约750bp、约100至约700bp、约100至约600bp、约100至约1000bp、约100至约400bp、约100至约350bp、约100至约300bp、约100至约250bp、约100至约200bp、约100至约150bp、约200至约1999bp、约200至约1900bp、约200至约1800bp、约200至约1700bp、约200至约1650bp、约200至约1600bp、约200至约1500bp、约200至约1400bp、约200至约1300bp、约200至约1200bp、约200至约1150bp、约200至约1100bp、约200至约1000bp、约200至约900bp、约200至约850bp、约200至约800bp、约200至约750bp、约200至约700bp、约200至约600bp、约200至约2000bp、约200至约400bp、约200至约350bp、约200至约300bp、约200至约250bp、约300至约1999bp、约300至约1900bp、约300至约1800bp、约300至约1700bp、约300至约1650bp、约300至约1600bp、约300至约1500bp、约300至约1400bp、约300至约1300bp、约300至约1200bp、约300至约1150bp、约300至约1100bp、约300至约1000bp、约300至约900bp、约300至约850bp、约300至约800bp、约300至约750bp、约300至约700bp、约300至约600bp、约300至约3000bp、约300至约400bp或约300至约350bp。在某些实施例中,缺失大小可以是约118个碱基对、约233个碱基对、约326个碱基对、约766个碱基对、约805个碱基对或约1611个碱基对。
4.用于肌肉中基因组编辑的组合物
本发明涉及用于基因组编辑受试者的骨骼肌或心肌中的靶基因的基因构建体(例如,载体)或其组合物。组合物包括经修饰的AAV载体和编码基于CRISPR/Cas9的基因编辑***(例如,gRNA分子和Cas9分子)的核苷酸序列。组合物向骨骼肌或心肌递送基于CRISPR/Cas9的基因编辑***的活性形式。本发明披露的基因构建体(例如,载体)可以用于修正或减少遗传疾病和/或其他骨骼肌或心肌病症(例如,DMD)中涉及的肌营养不良蛋白基因中的突变的影响。组合物可以进一步包含供体DNA或转基因。这些组合物可以用于基因组编辑、基因组工程以及修正或减小遗传疾病和/或其他骨骼肌或心肌病症中涉及的基因突变的影响。
a.用于靶向肌营养不良蛋白的基于CRISPR/Cas9的基因编辑***
本文披露了对肌营养不良蛋白基因有特异性的基于CRISPR/Cas9的基因编辑***。基于CRISPR/Cas9的基因编辑***可以包括Cas9和至少一种靶向肌营养不良蛋白基因的gRNA。基于CRISPR/Cas9的基因编辑***可以结合并识别靶区域。可以在可能的框外终止密码子的临上游选取靶区域,使得修复过程中的***或缺失通过框转换恢复肌营养不良蛋白阅读框。靶区域也可以是剪接受***点或剪接供***点,使得修复过程中的***或缺失破坏剪接并通过剪接位点破坏和外显子排除来恢复肌营养不良蛋白阅读框。靶区域也可以是异常终止密码子,使得修复过程中的***或缺失通过消除或破坏终止密码子来恢复肌营养不良蛋白阅读框。
gRNA可以靶向选自SEQ ID NO:1-19、41、42的核苷酸序列或其互补序列。例如,所披露的基于CRISPR/Cas9的基因编辑***被工程化为介导肌营养不良蛋白基因的外显子51处的高效基因编辑。这些基于CRISPR/Cas9的基因编辑***恢复来自DMD患者的细胞中的肌营养不良蛋白表达。在一些实施例中,DNA靶向组合物包括SEQ ID NO:37中列出的核苷酸序列、SEQ ID NO:38中列出的核苷酸序列、SEQ ID NO:83中列出的核苷酸序列和/或SEQ IDNO:84中列出的核苷酸序列。例如,DNA靶向组合物包括SEQ ID NO:37中列出的核苷酸序列、SEQ ID NO:38中列出的核苷酸序列和SEQ ID NO:83中列出的核苷酸序列,或者DNA靶向组合物包括SEQ ID NO:37中列出的核苷酸序列、SEQ ID NO:38中列出的核苷酸序列和SEQ IDNO:84中列出的核苷酸序列。
b.腺相关病毒载体
组合物还可以包括病毒递送***。在某些实施例中,载体是腺相关病毒(AAV)载体。AAV载体是感染人及其他一些灵长类物种的属于细小病毒科依赖病毒属的小病毒。AAV载体可以用于使用不同构建体配置来递送基于CRISPR/Cas9的基因编辑***。例如,AAV载体可以在单独的载体上或在相同的载体上递送Cas9和gRNA表达盒。可替代地,如果使用来源于如金黄色葡萄球菌或脑膜炎奈瑟球菌等物种的小Cas9蛋白,则Cas9和最多两种gRNA的表达盒可以组合在4.7kb包装限制内的单一AAV载体中。
在某些实施例中,AAV载体是经修饰的AAV载体。经修饰的AAV载体可以具有增强的心肌和骨骼肌组织嗜性。经修饰的AAV载体可以能够在哺乳动物的细胞中递送基于CRISPR/Cas9的基因编辑***并且使该***在该细胞中表达。例如,经修饰的AAV载体可以是AAV-SASTG载体(Piacentino et al.(2012)Human Gene Therapy[Piacentino等人(2012)人类基因治疗]23:635-646)。经修饰的AAV载体可以在体内将核酸酶递送至骨骼肌和心肌。经修饰的AAV载体可以基于若干种衣壳类型中的一种或多种,这些衣壳类型包括AAV1、AAV2、AAV5、AAV6、AAV8和AAV9。经修饰的AAV载体可以基于具有替代性肌肉向性AAV衣壳的AAV2假型,如AAV2/1、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2.5和AAV/SASTG载体,这些载体通过***性和局部递送高效转导骨骼肌或心肌(Seto et al.Current Gene Therapy[Seto等人当今基因治疗](2012)12:139-151)。经修饰的AAV载体可以是AAV2i8G9(Shen etal.J.Biol.Chem.[Shen等人生物化学杂志](2013)288:28814-28823)。在一些实施例中,组合物包括SEQ ID NO:39中列出的核苷酸序列和/或SEQ ID NO:40中列出的核苷酸序列。在一些实施例中,组合物包括包含SEQ ID NO:39中列出的核苷酸序列的第一载体和包含SEQID NO:40中列出的核苷酸序列的第二载体。
5.肌肉中基因组编辑的方法
本披露涉及在受试者的骨骼肌或心肌中进行基因组编辑的方法。该方法包括向该受试者的骨骼肌或心肌给予如上所述的用于在骨骼肌或心肌中进行基因组编辑的组合物。基因组编辑可以包括修正突变基因或***转基因。修正突变基因可以包括缺失、重排或替换突变基因。修正突变基因可以包括核酸酶介导的NHEJ或HDR。
6.修正突变基因和治疗受试者的方法
本发明披露的主题提供了修正细胞中的突变基因(例如,突变型肌营养不良蛋白基因,例如突变型人肌营养不良蛋白基因)和治疗患有遗传疾病(如DMD)的受试者的方法。该方法可以包括向细胞或受试者给予如上所述的本发明披露的基因构建体(例如,载体)或包含其的组合物。该方法可以包括向该受试者的骨骼肌或心肌给予如上所述的本发明披露的基因构建体(例如,载体)或包含其的用于在骨骼肌或心肌中进行基因组编辑的组合物。使用本发明披露的基因构建体(例如,载体)或包含其的组合物将基于CRISPR/Cas9的基因编辑***递送至骨骼肌或心肌,用可以替换整个基因或含有突变的区域的修复模板或供体DNA,可以使全功能性或部分功能性蛋白的表达恢复。基于CRISPR/Cas9的基因编辑***可以用于在靶向基因组座处引入位点特异性双链断裂。当使基于CRISPR/Cas9的基因编辑***与靶DNA序列结合时,产生位点特异性双链断裂,从而允许裂解靶DNA。这种DNA裂解可以刺激天然DNA修复机器,导致两种可能的修复途径之一:同源定向修复(HDR)或非同源末端连接(NHEJ)途径。
本披露涉及在没有修复模板的情况下用基于CRISPR/Cas9的基因编辑***进行基因组编辑,这可以高效地修正阅读框并恢复遗传疾病中涉及的功能性蛋白的表达。所披露的基于CRISPR/Cas9的基因编辑***可以涉及使用同源定向修复或核酸酶介导的非同源末端连接(NHEJ)修正方法,其使得在可能不适于同源重组或基于选择的基因修正的增殖受限制的原代细胞系中的高效修正成为可能。此策略将活性的基于CRISPR/Cas9的基因编辑***的快速且稳健的组织与高效的基因编辑方法整合用于治疗由引起移码、提前终止密码子、异常剪接供***点或异常剪接受***点的非必需编码区中的突变所引起的遗传疾病。
a.核酸酶介导的非同源末端连接
从内源突变的基因恢复蛋白质表达可以通过无模板NHEJ介导的DNA修复。与靶向靶基因RNA的瞬时方法相对比,通过瞬时表达基于CRISPR/Cas9的基因编辑***修正基因组中的靶基因阅读框可以导致各个经修饰细胞及其所有子代永久性地恢复靶基因表达。在某些实施例中,NHEJ是核酸酶介导的NHEJ,其在某些实施例中是指启动Cas9分子、切割双链DNA的NHEJ。该方法包括将本发明披露的基因构建体(例如,载体)或包含其的组合物给予至受试者的骨骼肌或心肌以在骨骼肌或心肌中进行基因组编辑。
核酸酶介导的NHEJ基因修正可以修正突变的靶基因,并提供优于HDR途径的若干潜在优势。例如,NHEJ不需要可能引起非特异性***诱变的供体模板。与HDR相对比,NHEJ在细胞周期的所有阶段都高效地操作,因此可以有效用于周期中的细胞和有丝***后细胞(如肌纤维)两者中。相对于基于寡核苷酸的外显子跳跃或终止密码子的药理学强制通读,这提供了替代性的稳健的永久性基因恢复,并且在理论上可以将需要少至一种药物治疗。除本文所述的质粒电穿孔方法以外,使用基于CRISPR/Cas9的基因编辑***以及包括大范围核酸酶和锌指核酸酶的其他工程化核酸酶的基于NHEJ的基因修正可以与用于基于细胞和基因的疗法的其他现有离体和体内平台联合。例如,基于CRISPR/Cas9的基因编辑***通过基于mRNA的基因转移或作为纯化的细胞可渗透蛋白质的递送可以使不含DNA的基因组编辑方法成为可能,该方法将克服***诱变的任何可能性。
b.同源定向修复
从内源突变的基因恢复蛋白质表达可以涉及同源定向修复。如上所述的方法进一步包括将供体模板给予至细胞。供体模板可以包括编码全功能性蛋白或部分功能性蛋白的核苷酸序列。例如,供体模板可以包括小型化肌营养不良蛋白构建体,称为微小肌营养不良蛋白(“minidys”),即一种用于恢复突变型肌营养不良蛋白基因或肌营养不良蛋白基因的片段的全功能性肌营养不良蛋白构建体,其在同源定向修复后导致突变型肌营养不良蛋白基因的恢复。
c.使用CRISPR/Cas9修正突变基因和治疗受试者的方法
本披露还涉及用基于CRISPR/Cas9的基因编辑***进行基因组编辑以用修复模板或供体DNA恢复全功能性或部分功能性蛋白的表达,从而可以替换整个基因或含有突变的区域。基于CRISPR/Cas9的基因编辑***可以用于在靶向基因组座处引入位点特异性双链断裂。当使用gRNA使基于CRISPR/Cas9的基因编辑***与靶DNA序列结合时,产生位点特异性双链断裂,从而允许裂解靶DNA。基于CRISPR/Cas9的基因编辑***由于其高速率的成功且高效的遗传修饰而具有高级基因组编辑的优势。这种DNA裂解可以刺激天然DNA修复机器,导致两种可能的修复途径之一:同源定向修复(HDR)或非同源末端连接(NHEJ)途径。例如,针对肌营养不良蛋白基因的基于CRISPR/Cas9的基因编辑***可以包括具有SEQ IDNO:1-19、41、42中任一个的核酸序列或其互补序列的gRNA。
本披露涉及在没有修复模板的情况下用基于CRISPR/Cas9的基因编辑***进行基因组编辑,这可以高效地修正阅读框并恢复遗传疾病中涉及的功能性蛋白的表达。所披露的基于CRISPR/Cas9的基因编辑***和方法可以涉及使用同源定向修复或核酸酶介导的非同源末端连接(NHEJ)修正方法,其使得在可能不适于同源重组或基于选择的基因修正的增殖受限制的原代细胞系中的高效修正成为可能。此策略将活性的基于CRISPR/Cas9的基因编辑***的快速且稳健的组织与高效的基因编辑方法整合用于治疗由引起移码、提前终止密码子、异常剪接供***点或异常剪接受***点的非必需编码区中的突变所引起的遗传疾病。
本披露提供了修正细胞中的突变基因和治疗患有遗传疾病(如DMD)的受试者的方法。该方法可以包括向细胞或受试者给予如上所述的基于CRISPR/Cas9的基因编辑***、编码所述基于CRISPR/Cas9的基因编辑***的多核苷酸或载体、或所述基于CRISPR/Cas9的基因编辑***的组合物。该方法可以包括给予基于CRISPR/Cas9的基因编辑***,如给予含有具有核酸酶活性的第二结构域的Cas9蛋白或Cas9融合蛋白、编码所述Cas9蛋白或Cas9融合蛋白的核苷酸序列,和/或至少一种gRNA,其中这些gRNA靶向不同的DNA序列。靶DNA序列可以是重叠的。如上所述,给予至细胞的gRNA的数目可以是至少1种gRNA、至少2种不同的gRNA、至少3种不同的gRNA、至少4种不同的gRNA、至少5种不同的gRNA、至少6种不同的gRNA、至少7种不同的gRNA、至少8种不同的gRNA、至少9种不同的gRNA、至少10种不同的gRNA、至少15种不同的gRNA、至少20种不同的gRNA、至少30种不同的gRNA或至少50种不同的gRNA。gRNA可以包括SEQ ID NO:1-19、41、42中的至少一个的核酸序列或其互补序列。该方法可以涉及同源定向修复或非同源末端连接。
7.治疗疾病的方法
本披露涉及治疗有需要的受试者的方法。该方法包括向受试者的组织给予如上所述的本发明披露的基因构建体(例如,载体)或包含其的组合物。在某些实施例中,该方法可以包括向该受试者的骨骼肌或心肌给予如上所述的本发明披露的基因构建体(例如,载体)或包含其的组合物。在某些实施例中,该方法可以包括向该受试者的静脉给予如上所述的本发明披露的基因构建体(例如,载体)或包含其的组合物。在某些实施例中,该受试者患有引起变性或无力或遗传疾病的骨骼肌或心肌病症。例如,如上所述,该受试者可能患有杜氏肌营养不良。
a.杜氏肌营养不良
如上所述,该方法可以用于修正肌营养不良蛋白基因并恢复所述突变的肌营养不良蛋白基因的全功能性或部分功能性蛋白表达。在一些方面和实施例中,本披露提供了用于减少患者中DMD的影响(例如,临床症状/适应症)的方法。在一些方面和实施例中,本披露提供了用于治疗患者的DMD的方法。在一些方面和实施例中,本披露提供了用于预防患者的DMD的方法。在一些方面和实施例中,本披露提供了用于预防患者的DMD进一步发展的方法。
8.具有Δ52 hDMD的转基因啮齿动物的方法
本披露涉及产生具有外显子52缺失的人肌营养不良蛋白基因的转基因啮齿动物胚胎的方法。该方法包括向啮齿动物胚胎给予gRNA从而缺失人肌营养不良蛋白基因的外显子52,并选择具有人肌营养不良蛋白基因外显子52缺失的转基因啮齿动物胚胎,其中该啮齿动物胚胎包含正常的人肌营养不良蛋白基因。在一些实施例中,啮齿动物胚胎是小鼠胚胎。在一些实施例中,转基因啮齿动物胚胎是杂合hDMD或杂合hDMD-Δ52。在一些实施例中,将包含包括SEQ ID NO:41中列出的核苷酸序列的靶向结构域的第一gRNA分子和包含包括SEQ ID NO:42中列出的核苷酸序列的靶向结构域的第二gRNA分子给予至啮齿动物胚胎以缺失人肌营养不良蛋白基因的外显子52。在一些实施例中,该方法进一步包括向啮齿动物胚胎给予包含SEQ ID NO:27中列出的氨基酸序列的Cas蛋白。本披露涉及通过此方法产生的转基因啮齿动物胚胎。本披露还涉及由转基因啮齿动物胚胎产生的转基因啮齿动物。
9.构建体和质粒
如上所述的组合物可以包含编码如本文所披露的基于CRISPR/Cas9的基因编辑***的基因构建体。基因构建体(如质粒)可以包含编码基于CRISPR/Cas9的基因编辑***如Cas9蛋白和Cas9融合蛋白和/或至少一种gRNA的核酸。如上所述的组合物可以包含编码经修饰的AAV载体的基因构建体和编码如本文所披露的基于CRISPR/Cas9的基因编辑***的核酸序列。基因构建体(如质粒)可以包含编码基于CRISPR/Cas9的基因编辑***的核酸。如上所述的组合物可以包含编码如本文所披露的经修饰慢病毒载体的基因构建体。
基因构建体(如重组质粒或重组病毒颗粒)可以包含编码Cas9-融合蛋白和至少一种gRNA的核酸。在一些实施例中,基因构建体可以包含编码Cas9融合蛋白和至少两种不同gRNA的核酸。在一些实施例中,基因构建体可以包含编码Cas9融合蛋白和超过两种不同gRNA的核酸。在一些实施例中,基因构建体可以包含可操作地连接至编码至少一种gRNA分子和/或Cas9分子的核苷酸序列的启动子。在一些实施例中,启动子可操作地连接至编码第一gRNA分子、第二gRNA分子和/或Cas9分子的核苷酸序列。基因构建体可以存在于细胞中作为起作用的染色体外分子。基因构建体可以是线性微染色体,包括着丝粒、端粒或质粒或粘粒。
基因构建体还可以是重组病毒载体的基因组的一部分,该重组病毒载体包括重组慢病毒、重组腺病毒和重组腺病毒相关病毒。基因构建体可以是生活在细胞中的活的减毒微生物或重组微生物载体中的遗传物质中的一部分。基因构建体可以包含核酸编码序列的基因表达的调控元件。调控元件可以是启动子、增强子、起始密码子、终止密码子或聚腺苷酸化信号。
在某些实施例中,基因构建体是载体。载体可以是腺相关病毒(AAV)载体,其编码至少一种Cas9分子和至少一种gRNA分子;载体能够在哺乳动物的细胞中表达至少一种Cas9分子和至少gRNA分子。载体可以是质粒。载体可以用于体内基因疗法。载体可以是重组的。载体可以包含编码融合蛋白(如Cas9-融合蛋白或基于CRISPR/Cas9的基因编辑***)的异源核酸。载体可以是质粒。载体可以用于用编码Cas9-融合蛋白或基于CRISPR/Cas9的基因编辑***的核酸转染细胞,在其中发生Cas9-融合蛋白或基于CRISPR/Cas9的基因编辑***表达的条件下培养并维持转化的宿主细胞。
可以针对表达的稳定性和高水平优化编码序列。在一些情况下,选择密码子以减少RNA的二级结构形成,如因分子内键合形成的二级结构。
载体可以包含编码基于CRISPR/Cas9的基因编辑***的异源核酸,并且可以进一步包含起始密码子(其可以在基于CRISPR/Cas9的基因编辑***编码序列的上游)和终止密码子(其可以在基于CRISPR/Cas9的基因编辑***编码序列的下游)。起始密码子和终止密码子可以与基于CRISPR/Cas9的基因编辑***编码序列一起处于阅读框中。载体还可以包含可操作地连接至基于CRISPR/Cas9的基因编辑***编码序列的启动子。可操作地连接至基于CRISPR/Cas9的基因编辑***编码序列的启动子可以是来自猿猴病毒40(SV40)的启动子、小鼠乳腺瘤病毒(MMTV)启动子、人免疫缺陷病毒(HIV)启动子如牛免疫缺陷病毒(BIV)长末端重复序列(LTR)启动子、莫洛尼病毒启动子、禽类白血病病毒(ALV)启动子、巨细胞病毒(CMV)启动子如CMV即时早期启动子、EB病毒(EBV)启动子、U6启动子如人U6启动子或劳斯肉瘤病毒(RSV)启动子。启动子还可以是来自以下的启动子:人基因如人泛素C(hUbC)、人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸或人金属硫蛋白。启动子还可以是天然或合成的组织特异性启动子,如肌肉或皮肤特异性启动子。此类启动子的实例描述于美国专利申请公开号US 20040175727和US 20040192593中,将其内容通过引用以其全部内容并入本文。肌肉特异性启动子的实例包括Spc5-12启动子(描述于通过引用以其全部内容并入本文的美国专利申请公开号US 20040192593;Hakim et al.Mol.Ther.Methods Clin.Dev.[Hakim等人,分子疗法-方法和临床开发](2014)1:14002;和Lai et al.Hum Mol Genet.[Lai等人,人类分子遗传学](2014)23(12):3189-3199中)、MHCK7启动子(描述于Salva etal.,Mol.Ther.[Salva等人,分子疗法](2007)15:320-329中)、CK8启动子(描述于Park etal.PLoS ONE[Park等人,公共科学图书馆综合](2015)10(4):e0124914中)和CK8e启动子(描述于Muir et al.,Mol.Ther.Methods Clin.Dev.[Muir等人,分子疗法-方法和临床开发](2014)1:14025中)。在一些实施例中,gRNA和/或Cas9蛋白的表达由tRNA驱动。
编码gRNA分子和/或Cas9分子的每个多核苷酸序列可以各自可操作地连接至启动子。可操作地连接至gRNA分子和/或Cas9分子的启动子可以是相同的启动子。可操作地连接至gRNA分子和/或Cas9分子的启动子可以是不同的启动子。启动子可以是组成型启动子、诱导型启动子、阻抑型启动子或调控型启动子。
载体还可以包含聚腺苷酸化信号,其可以在基于CRISPR/Cas9的基因编辑***下游。聚腺苷酸化信号可以是SV40聚腺苷酸化信号、LTR聚腺苷酸化信号、牛生长激素(bGH)聚腺苷酸化信号、人生长激素(hGH)聚腺苷酸化信号或人β-珠蛋白聚腺苷酸化信号。SV40聚腺苷酸化信号可以是来自pCEP4载体(英杰公司(Invitrogen),加利福尼亚州圣迭哥)的聚腺苷酸化信号。
载体还可以包含在基于CRISPR/Cas9的基因编辑***(即,Cas9蛋白或Cas9融合蛋白编码序列或sgRNA,或基于CRISPR/Cas9的基因编辑***)上游的增强子。增强子可能是DNA表达必需的。增强子可以是人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸或病毒增强子,如来自CMV、HA、RSV或EBV的增强子。多核苷酸功能增强子描述于美国专利号5,593,972、5,962,428和WO 94/016737中,将其各自的内容通过引用完全并入。载体还可以包含哺乳动物复制起点以在染色体外保持载体,并在细胞中产生多拷贝的载体。载体还可以包含调控序列,其非常适于在其中给予载体的哺乳动物或人细胞中的基因表达。载体还可以包含报告基因,如绿色荧光蛋白(“GFP”)和/或选择性标记,如潮霉素(“Hygro”)。
载体可以是表达载体或通过常规技术和容易获得的起始原料产生蛋白质的***,包括Sambrook et al.,Molecular Cloning and Laboratory Manual,Second Ed.,ColdSpring Harbor[Sambrook等人,分子克隆和实验室手册,第2版,冷泉港出版社](1989),将其通过引用完全并入。在一些实施例中,载体可以包含编码基于CRISPR/Cas9的基因编辑***的核酸序列,包括编码Cas9蛋白或Cas9融合蛋白的核酸序列和编码至少一种gRNA的核酸序列,该至少一种gRNA包含SEQ ID NO:1-19、41、42中的至少一个的核酸序列或其互补序列。在一些实施例中,Cas9蛋白或Cas9融合蛋白由SEQ ID NO:26中任一个的核酸序列编码。在一些实施例中,载体包含SEQ ID NO:39或SEQ ID NO:40的核酸序列。
10.药物组合物
本发明披露的主题提供了包含上述基因构建体的组合物。根据本发明的药物组合物可以根据有待使用的给药方式进行配制。在药物组合物是注射用药物组合物的情况下,它们是无菌、无致热原且无颗粒的。优选使用等渗配制品。一般而言,用于等渗性的添加剂可以包括氯化钠、右旋糖、甘露糖醇、山梨糖醇和乳糖。在一些情况下,优选等渗溶液,如磷酸盐缓冲盐水。稳定剂包括明胶和白蛋白。在一些实施例中,将血管收缩剂添加到配制品中。
组合物可以进一步包含药学上可接受的赋形剂。药学上可接受的赋形剂可以为作为媒介物、辅助剂、载体或稀释剂的功能性分子。药学上可接受的赋形剂可以是转染促进剂,该转染促进剂可以包括表面活性剂(如免疫刺激复合体(ISCOMS))、弗氏不完全佐剂、LPS类似物(包括单磷酰脂质A)、胞壁酰肽、醌类似物、囊泡(如角鲨烯和角鲨烯)、透明质酸、脂质、脂质体、钙离子、病毒蛋白、聚阴离子、聚阳离子或纳米粒子或其他已知的转染促进剂。
转染促进剂为聚阴离子、聚阳离子(包括聚-L-谷氨酸(LGS))或脂质。转染促进剂为聚-L-谷氨酸,并且更优选地,聚-L-谷氨酸以小于6mg/ml的浓度存在于用于骨骼肌或心肌中的基因组编辑的组合物中。转染促进剂还可以包括表面活性剂(如免疫刺激复合体(ISCOMS))、弗氏不完全佐剂、LPS类似物(包括单磷酰脂质A)、胞壁酰肽、醌类似物和囊泡(如角鲨烯和角鲨烯),而且透明质酸也可以用来与基因构建体联合给予。在一些实施例中,编码组合物的DNA载体还可以包括转染促进剂如脂质、脂质体(包括卵磷脂脂质体或本领域已知的其他脂质体,像DNA-脂质体混合物(参见例如国际专利公开号W09324640))、钙离子、病毒蛋白、聚阴离子、聚阳离子或纳米粒子或其他已知的转染促进剂。优选地,转染促进剂为聚阴离子、聚阳离子(包括聚-L-谷氨酸(LGS))或脂质。
11.递送方法
本文提供了用于将本发明披露的基因构建体(例如,载体)或其组合物递送至细胞的方法。组合物的递送可以是组合物的转染或电穿孔,作为在细胞中表达并递送至细胞表面的核酸分子。可以使用Biorad Gene Pulser Xcell或Amaxa Nucleofector IIb装置将核酸分子电穿孔。可以使用几种不同的缓冲液,包括BioRad电穿孔溶液、Sigma磷酸盐缓冲盐水制品#D8537(PBS),Invitrogen OptiMEM I(OM)或Amaxa Nucleofector溶液V(N.V.)。转染可以包括转染试剂,如Lipofectamine 2000。
在将本发明披露的基因构建体或组合物递送至组织并且随即将载体递送至哺乳动物的细胞中后,转染的细胞将表达该一种或多种gRNA分子和Cas9分子。基因构建体或组合物可以给予哺乳动物以改变基因表达或者重组或改变基因组。例如,可以将基因构建体或组合物给予哺乳动物以修正哺乳动物中的肌营养不良蛋白基因。哺乳动物可以是人、非人灵长类动物、牛、猪、绵羊、山羊、羚羊、野牛、水牛、牛科动物、鹿、刺猜、大象、美洲驼、羊驼、小鼠、大鼠或鸡,并且优选人、牛、猪或鸡。
可以在有或没有体内电穿孔,脂质体介导的、纳米粒子促进的和/或重组载体的情况下,通过DNA注射(也称为DNA疫苗接种)将编码该一种或多种gRNA分子和Cas9分子的基因构建体(例如,载体)递送至哺乳动物。重组载体可以通过任何病毒方式递送。病毒方式可以是重组慢病毒、重组腺病毒和/或重组腺相关病毒。
可以将本发明披露的基因构建体(例如,载体)或包含其的组合物引入细胞中以基因修正肌营养不良蛋白基因(例如,人肌营养不良蛋白基因)。在某些实施例中,将本发明披露的基因构建体(例如,载体)或包含其的组合物引入来自DMD患者的成肌细胞中。在某些实施例中,将基因构建体(例如,载体)或包含其的组合物引入来自DMD患者的成纤维细胞中,并且经基因修正的成纤维细胞可以用MyoD处理以诱导分化成成肌细胞,其可以被植入受试者体内(如受试者的受损肌肉),以验证经修正的肌营养不良蛋白是功能性的和/或治疗受试者。经修饰的细胞也可以是干细胞,如诱导多能干细胞、骨髓衍生的祖细胞、骨骼肌祖细胞、来自DMD患者的人骨骼肌成肌细胞、CD 133+细胞、中成血管细胞(mesoangioblast)和MyoD或Pax7转导的细胞、或其他生肌祖细胞。例如,基于CRISPR/Cas9的基因编辑***可以导致诱导多能干细胞的神经元或肌源性分化。
12.给药途径
可以通过不同的途径将本发明披露的基因构建体(例如,载体)或包含其的组合物给予受试者,这些不同途径包括口服、胃肠外、舌下、经皮、直肠、经粘膜、局部、经由吸入、经颊给药、胸膜内、静脉内、动脉内、腹膜内、皮下、肌内、鼻内、鞘内和关节内或其组合。在某些实施例中,将本发明披露的基因构建体(例如,载体)或组合物肌内、静脉内或其组合给予受试者(例如,患有DMD的受试者)。对于兽用,按照正常的兽医实践,将本发明披露的基因构建体(例如,载体)或组合物作为合适的可接受的配制品给予。兽医可以容易地确定最适合于具体动物的给药方案和给药途径。可以通过传统注射器、无针注射装置、“微弹轰击基因枪”或其他物理方法如电穿孔(“EP”)、“流体动力学方法”或超声给予组合物。
可以在有或没有体内电穿孔,脂质体介导的、纳米粒子促进的、重组载体如重组慢病毒、重组腺病毒和重组腺病毒相关病毒的情况下,通过若干种技术包括DNA注射(也称为DNA疫苗接种)将本发明披露的基因构建体(例如,载体)或组合物递送至哺乳动物。可以将组合物注射到骨骼肌或心肌中。例如,可以将组合物注射到胫骨前肌或尾巴中。
在一些实施例中,通过以下方式给予本发明披露的基因构建体(例如,载体)或其组合物:1)尾静脉注射(***性)到成年小鼠中;2)肌内注射(例如,局部注射)到成年小鼠的肌肉如TA或腓肠肌中;3)腹膜内注射到P2小鼠中;或4)面静脉注射(***性)到P2小鼠中。
13.细胞类型
这些递送方法和/或给药途径中的任一种可以与无数种细胞类型一起应用,例如,目前正在研究用于DMD的基于细胞的疗法的那些细胞类型,包括但不限于永生化成肌细胞,如野生型和DMD患者衍生的细胞系,例如Δ48-50 DMD、DMD 6594(del48-50)、DMD 8036(del48-50)、C25C14和DMD-7796细胞系,原代DMD真皮成纤维细胞,诱导多能干细胞,骨髓衍生的祖细胞,骨骼肌祖细胞,来自DMD患者的人骨骼肌成肌细胞,CD 133+细胞,中成血管细胞,心肌细胞,肝细胞,软骨细胞,间充质祖细胞,造血干细胞,平滑肌细胞和MyoD-或Pax7转导的细胞或其他生肌祖细胞。人生肌细胞的永生化可以用于基因修正的生肌细胞的克隆衍生。细胞可以被离体修饰以分离和扩增永生化DMD成肌细胞的克隆群体,这些DMD成肌细胞包括基因修正的肌营养不良蛋白基因,并且在基因组的蛋白质编码区中不含其他核酸酶引入的突变。可替代地,通过非病毒或非整合病毒基因转移或通过直接递送纯化的蛋白质和含有细胞穿透基序的gRNA进行的基于CRISPR/Cas9的***的瞬时体内递送可以实现高度特异性的原位修正,有极小或没有外源DNA整合的风险。
14.试剂盒
本文提供了可以用于修正突变的肌营养不良蛋白基因的试剂盒。试剂盒至少包含用于修正突变的肌营养不良蛋白基因的gRNA和用于使用基于CRISPR/Cas9的基因编辑***的说明书。本文还提供了可以用于骨骼肌或心肌中肌营养不良蛋白基因的基因组编辑的试剂盒。试剂盒包含如上所述的用于骨骼肌或心肌中的基因组编辑的基因构建体(例如,载体)或包含其的组合物以及用于使用所述组合物的说明书。
试剂盒中所包括的说明书可以贴在包装材料上,或者可以作为包装***物而被包括。虽然说明书通常是书面材料或印刷材料,但它们不限于此。任何能够存储此类说明书并将其传送给最终使用者的介质都被本披露所涵盖。这样的介质包括但不限于电子存储介质(例如,磁盘、磁带、盒式磁带(cartridge)、芯片)、光学介质(例如,CD ROM)等。如本文所用,术语“说明书”可以包括提供说明书的互联网网站的地址。
用于修正骨骼肌或心肌中突变的肌营养不良蛋白或者肌营养不良蛋白基因的基因组编辑的基因构建体(例如,载体)或包含其的组合物可以包括含如上所述的一种或多种gRNA分子和Cas9分子的经修饰的AAV载体,该Cas9分子特异性结合并裂解肌营养不良蛋白基因的区域。如上所述的基于CRISPR/Cas9的基因编辑***可以包括在试剂盒中以特异性结合和靶向突变的肌营养不良蛋白基因中的特定区域。如上所述,试剂盒可以进一步包括供体DNA、不同的gRNA或转基因。
15.实例
对于本领域技术人员应容易地显而易见的是,本文描述的本披露的方法的其他适合修改和改编是可容易应用和感知的并且可以使用合适的等价方案进行而不脱离本披露或本文披露的方面和实施例的范围。现在已详细描述了本披露,同样将通过参考以下实例更清楚地理解,这些实例仅旨在说明本披露的一些方面和实施例,并且不应被视为对本披露的范围的限制。本文提到的所有期刊参考文献、美国专利和公开的披露通过引用以其全部内容并入本文。
本发明具有多个方面,这些方面通过以下非限制性实例说明。
实例1
靶向人肌营养不良蛋白基因
使用基于CRISPR/Cas9的基因编辑***来靶向和缺失人肌营养不良蛋白基因的外显子51。比化脓链球菌Cas9小约1kb的金黄色葡萄球菌Cas9(SaCas9)与腺相关病毒(AAV)一起使用以递送基于CRISPR/Cas9的基因编辑***。编码金黄色葡萄球菌Cas9分子的密码子优化的核酸序列在SEQ ID NO:43或SEQ ID NO:44中列出。图3显示了基于AAV的体内共同递送两种病毒载体上的SaCas9和两种gRNA至肌肉组织的示意图。每种载体具有分别由CMV和hU6启动子驱动的SaCas9和一种gRNA的拷贝(PT366-179(SEQ ID NO:39)和PT366-183(SEQID NO:40))。
通过Surveyor测定确定了HEK293T细胞(具有正常型式的肌营养不良蛋白基因)和DMD患者成肌细胞系(DMD 8036和DMD 6594,其各自具有肌营养不良蛋白基因的突变形式)中针对人类基因组设计的靶向人肌营养不良蛋白基因的单独的gRNA JCR89(靶向外显子51的上游)和JCR91(靶向外显子51的下游)的活性(参见图1)。Surveyor测定检测基因组DNA中的错配,这指示着来自基于CRISPR/Cas9的基因编辑***的***缺失。对于JCR89,亲本带的大小是555nt,并且所用的引物是:正向引物-aagttacttgtccaggcatga(SEQ ID NO:91);和反向引物-gaaaaacttctgccaacttttatca(SEQ ID NO:92)。预期的切割带的大小为134nt和421nt。对于JCR91,亲本带的大小是632nt,并且所用的引物是:正向引物-tgcaaataacaaaagtagccataca(SEQ ID NO:93);和反向引物-tctttagaaaggcttgaaagctg(SEQ ID NO:94)。预期的切割带的大小为210nt和422nt。
用SaCas9和gRNA JCR89和JCR91(SEQ ID NO:37和SEQ ID NO:38)共同处理HEK293T细胞和DMD成肌细胞(DMD 8036和DMD 6594)。使用正向引物-cttcactgctggccagttta(SEQ ID NO:95)和反向引物-tctttagaaaggcttgaaagctg(SEQ IDNO:94)扩增基因组DNA。预期的亲本带的大小为1646nt,并且预期的“完美”缺失带为766nt(由于***缺失的发生,gRNA切割位点之间的实际缺失大小与766nt不同)。图2A显示了HEK293T细胞和DMD成肌细胞的基因组DNA中外显子51的缺失。图2B显示了DMD成肌细胞的cDNA中外显子51的缺失。“无RT”是没有添加逆转录酶的阴性对照。
将基于CRISPR/Cas9的基因编辑***注射到携带人DMD基因的转基因小鼠(hDMD/mdx小鼠)中以缺失外显子51。将携带SaCas9和gRNA的病毒载体的局部AAV8递送应用于胫骨前肌(TA)肌肉。参见表1。3只小鼠注射AAV8:1只小鼠在两侧TA中注射高剂量的AAV8(“HH”),1只小鼠在两侧TA中注射低剂量的AAV8(“LL”),并且1只小鼠在左侧TA中注射低剂量且在右侧TA中注射高剂量(“LH”)。剂量列于表1的第2栏中。处理后8周(“周PT”)将小鼠处死以收获组织用于分析。巢式PCR揭示了HH小鼠两侧肢体、LL小鼠右侧TA和LH小鼠右侧肢体中外显子51的缺失。
表1
在第一次PCR反应中,使用正向引物:cttcactgctggccagttta(SEQ ID NO:95)和反向引物:tctttagaaaggcttgaaagctg(SEQ ID NO:94)来扩增从小鼠TA肌肉收获的基因组DNA。在使用正向引物-aagttacttgtccaggcatga(SEQ ID NO:91)和反向引物-ttgaacatggcattgcataaA(SEQ ID NO:96)的第二次PCR反应(2X gDNA PCR)中,使用1-3μLPCR产物。这第二次PCR具有1089nt的预期的亲本带和323nt的预期的缺失带(由于***缺失的发生,gRNA切割位点之间的实际缺失大小与323nt不同)。图4显示了第二次PCR结果。“L”泳道显示了左侧TA肌肉的结果,其被用作对照并接受盐水溶液。“R”泳道显示了右侧TA肌肉的结果,其被注射了等量预先混合的2种病毒载体。基于CRISPR/Cas9的基因编辑***也通过***性AAV8递送注射到hDMD/mdx小鼠的尾静脉中(参见图5)。从小鼠肝脏(图5-左图)和心脏(图5-右图)收获的基因组DNA也使用与图4相同的方案进行扩增。大约300个核苷酸的预期带指示外显子51的缺失。
产生并选择靶向人和恒河猴肌营养不良蛋白基因序列或人肌营养不良蛋白基因序列的其他gRNA(参见图6和表2)。表2列出了gRNA的一般靶标、识别的基因组链、gRNA序列和与gRNA相关的PAM序列。表3列出了gRNA的靶基因组序列,如基因组+链所示。在培养的人细胞中测试了这些gRNA,以发现gRNA的最佳活性和组合以产生缺失。基于人类基因组中预测的特异性(图8),将选定的gRNA也优先化,并针对从19-23个核苷酸变化的最佳靶序列长度进行筛选(图10和11)。图6显示了表2中列出的人和恒河猴基因组之间保守的各gRNA靶标。每种gRNA的位置都关于人肌营养不良蛋白基因的外显子51来指示。
表2 gRNA列表
表3 gRNA的靶序列
用表2中列出的单独的候选gRNA转染人HEK293T细胞。通过Surveyor测定确定候选gRNA的活性(参见图7)。对于JCR160,亲本带的大小是483nt,并且所用的引物是:正向引物-cgggcttggacagaacttac(SEQ ID NO:97);和反向引物-ctgcgtagtgccaaaacaaa(SEQ ID NO:98)。预期的切割带的大小为192nt和291nt。对于JCR157,亲本带的大小是631nt,并且所用的引物是:正向引物-gagatgtcttttgcagctttcc(SEQ ID NO:99);和反向引物-gggaccttggtaaagccaca(SEQ ID NO:100)。预期的切割带的大小为147nt和484nt。
使用CasOFFinder程序预测候选gRNA的特异性(Bae et al.(2014)Bioinformatics[Bae等人(2014)生物信息学]30:1473-1475;参见图8)。基于通过Surveyor测定测量的脱靶活性、中靶活性和距外显子的距离来评估和选取候选gRNA。gRNA JCR157和JCR160具有低的预测脱靶结合并用于进一步测试。
用含有gRNA JCR157的经修饰的pDO240质粒、含有gRNA JCR160的经修饰的pDO240质粒和含有SaCas9的质粒(pDO242;SEQ ID NO:83)对HEK293T细胞进行转染并对DMD 6594细胞进行电穿孔。预测亲本带为2451nt,并且预测缺失带为约840-850nt。图9显示了使用正向引物-tgcctttcaatcattgtttcg(SEQ ID NO:101)和反向引物-agaaggcaaattggcacaga(SEQ ID NO:102)通过基因组DNA的PCR(大约850个核苷酸)确定的外显子51的缺失。在gRNA切割位点之间产生的缺失为大约1611nt。
图10显示了使用图7中针对JCR157的引物和PCR条件,通过Surveyor测定确定HEK293T细胞中各靶标长度的gRNA JCR157(19、20、21、22和23个核苷酸)的活性。图11显示了使用正向引物-cgggcttggacagaacttac(SEQ ID NO:97)和反向引物-ctgcgtagtgccaaaacaaa(SEQ ID NO:98),通过Surveyor测定确定HEK293T细胞中各靶标长度的gRNA JCR160(19、20、21、22和23个核苷酸)的活性。预测亲本带的大小为483nt,并且预期的切割带的大小为209nt和274nt。
使用图9中使用的条件,在HEK293T细胞中使用各靶标长度的gRNA JCR157和JCR160(21、22或23个核苷酸)的组合。图12显示了基因组DNA的PCR。各自具有23个核苷酸靶标的JCR157和JCR160的组合具有几乎50%的缺失。
使用23nt的靶序列用SaCas9单独执行外显子51侧翼的每种gRNA(上游JCR179和下游JCR183)以证明HEK293T细胞(“293s”)和DMD6594细胞(“DMD6594s”)中的中靶核酸酶活性(参见图13)。对于JCR179,亲本带的大小是594nt,并且所用的引物是:正向引物-tgcctttcaatcattgtttcg(SEQ ID NO:101);和反向引物-aaggccccaaaatgtgaaat(SEQ IDNO:103)。预期的切割带的大小为594nt和130nt。对于JCR183,亲本带的大小是731nt,并且所用的引物是:正向引物-gagtttggctcaaattgttactctt(SEQ ID NO:104);和反向引物-ctgcgtagtgccaaaacaaa(SEQ ID NO:98)。预期的切割带的大小为440nt和291nt。图13显示了如通过Surveyor测定测得的体外中靶核酸酶活性。
用含有SaCas9以及gRNA JCR179和JCR183(JCR157和JCR160的23nt靶标;SEQ IDNO:37和SEQ ID NO:38)的质粒对人HEK293T细胞进行转染并对DMD成肌细胞(DMD 6594s)进行电穿孔。DMD 6594细胞是已经缺乏外显子48-50的永生化DMD患者成肌细胞。预测亲本带为2451nt,并且预测缺失带为约823nt。图14显示了使用正向引物-tgcctttcaatcattgtttcg(SEQ ID NO:101)和反向引物-agaaggcaaattggcacaga(SEQ ID NO:102)如通过基因组DNA的PCR确定的人HEK293T细胞(左图)和DMD 6594s细胞(右图)的基因组DNA中外显子51的体外缺失。在gRNA切割位点之间产生的缺失为大约1628nt。顶图显示了HEK293T细胞和DMD6594细胞中上游和下游gRNA的靶基因的示意图,其中紫色指示正常加工的外显子,并且黄色指示突变型外显子。中图显示了跨越基因组缺失区域的PCR结果,其中星号指示缺失。底图显示了基因组DNA的液滴数字PCR。在HEK293T细胞中,gRNA和SaCas9具有16%的缺失,其中DMD6594细胞具有约10%的编辑。
为了确定基因组DNA中的变化是否转录为RNA,从用SaCas9和两种gRNA共转染并分化7天的DMD成肌细胞收获RNA(参见图15)。使用本领域已知的标准方法,将RNA逆转录成cDNA,并对cDNA进行PCR扩增。在图15中,左下图显示了使用正向引物-tggcggcgttttcattat(SEQ ID NO:105)和反向引物-TTCGATCCGTAATGATTGTTCTAGCC(SEQ ID NO:106)从外显子44到外显子52的PCR扩增。预测亲本带为948nt,并且预测缺失带为约715nt。图15显示了用SaCas9和两种gRNA处理的细胞中仅有的缺失带。右下图显示了揭示约14%的cDNA的编辑的ddPCR。对DMD患者成肌细胞cDNA的体外外显子47至52的连接进行测序(参见图16)。在图16中,来自未经处理的细胞(对照细胞Δ48-50)的带序列指示外显子47至51连接,如预期的那样,而经处理的细胞中的缺失带(Δ48-50+Δ51)显示了外显子47至52的连接。因此,外显子51的明显缺乏和针对基因组DNA水平的所披露的***正在通过转录进行。
实例2
Δ52/mdx小鼠的产生
图17显示了Δ52/mdx小鼠的设计。从莱顿大学获得hDMD/mdx小鼠并操作以产生DMD的相关模型,其中外显子52被去除并且该缺失导致阅读框外移和DMD基因型。在mdx背景下,hDMD/mdx小鼠在5号染色体上含有全长野生型人肌营养不良蛋白基因,因此不表达小鼠肌营养不良蛋白。
为了产生DMD的相关模型,使用SpCas9 CRISPR/Cas9编辑***和gRNA靶向和缺失人肌营养不良蛋白基因的外显子52。使用Surveyor测定来测试和验证靶向外显子52上游和下游的各种gRNA(参见图18)。对于上游gRNA,使用正向引物-ctccggaatgtctccatttg(SEQID NO:87)和反向引物-TTGTGTGTCCCATGCTTGTT(SEQ ID NO:107),并且亲本带的大小为402nt。对于JCR94(AACAAATATCCCTTAGTATC(SEQ ID NO:41)),预期的切割的大小为243nt和159nt。对于下游gRNA,使用正向引物-CAACGCTGAAGAACCCTGAT(SEQ ID NO:108)和反向引物-atgagggagagactggcatc(SEQ ID NO:88),并且亲本带的大小为509nt。对于JCR99(AATGTATTTCTTCTATTCAA(SEQ ID NO:42)),预期的切割的大小为346nt和163nt。使用正向引物-ctccggaatgtctccatttg(SEQ ID NO:87)和反向引物-atgagggagagactggcatc(SEQ IDNO:88),通过检测HEK293T细胞(包括JCR94和JCR99)的基因组DNA中外显子51的缺失来测试和验证gRNA对(参见图19)。亲本带的大小为718nt,缺失带为392nt,并且gRNA之间的缺失为326nt。在基因组编辑***中使用这对JCR94和JCR99来产生Δ52/mdx小鼠。确切地说,通过将JCR94gRNA、JCR99gRNA和SaCas9mRNA注射到小鼠胚胎中来创建小鼠。
图20显示了包括BAC重组工程服务的DNA显微注射方案。第1天:用血清***腹膜内处理孕鼠以诱导***。第3天:用人绒毛膜***腹膜内处理孕鼠。在第1轮中,产生了471个胚胎,但只有5个塞(plug)可见。使用150个受精的胚胎(14只雌鼠超***)。用少于50ng Cas9且每种指导物20ng进行原核注射。图21显示了产生转基因小鼠的小鼠繁殖方案。
使用以下基因分型方案对首建小鼠进行基因分型。使用DNEasy血液和组织试剂盒(凯杰公司(QIagen))从小鼠的尾巴剪块中提取基因组DNA(gDNA)。为了对每只幼鼠进行基因分型,如下使用AccuPrime HiFi Taq试剂盒扩增gDNA:i.100ng gDNA;ii.2.5μLAccuPrime缓冲液II;iii.0.1μL AccuPrime HiFi Taq;iv.1μL JRH261(ctccggaatgtctccatttg(SEQ ID NO:87))(10μM);v.1μL JRH264(atgagggagagactggcatc(SEQ ID NO:88))(10μM);以及vi.加水到25uL总体积。如下在热循环仪上运行反应:i.95度持续4分钟;ii.95度持续30秒;iii.52度持续30秒;iv.68度持续1:00分钟;v.将步骤ii-iv循环35次;和4度恒温。在凝胶上分离PCR反应(图22)。如果不存在缺失(即,外显子52仍然存在),则预期的带的大小为718nt,并且如果存在外显子52的缺失,则预期的带的大小为大约392nt。如图22所示,首建小鼠7、63和76具有外显子52缺失。
使用JRH264引物对经扩增的带进行测序(参见图23)以测序靶向区域的重新连接的末端。图23显示了测序区域,其中粗体、加下划线和正常字母指示天然序列,并且斜体字母指示***或缺失。在预期序列(“Δ52”)中,粗体字母连接带下划线的字母。在首建小鼠中,在此区域存在***(斜体字母)和缺失(连字符)。
使雄性首建小鼠与mdx/mdx雌鼠交配以繁殖出嵌合体(图24)。使用在图22中使用的条件筛选来自首建雄鼠76或首建雄鼠63与mdx/mdx雌鼠产生的仔,并对外显子52缺失进行基因分型(分别为图25和图26)。如果外显子52缺失,则预期的带的大小为约392nt。如果外显子52存在,则预期的带的大小为约718nt。幼鼠54497和54498(来自首建雄鼠63+mdx/mdx雌鼠繁殖对)具有外显子52缺失并被测序(图27)。在392bp测序读数中,幼鼠54497和54498彼此具有92.86%同一性,并且***缺失是相同的。
使用荧光免疫组织化学比较健康hDMD/mdx小鼠和Δ52/mdx小鼠中肌营养不良蛋白的表达。如图28所示,Δ52/mdx小鼠幼仔54497和54498缺乏肌营养不良蛋白。对于心脏染色,层粘连蛋白探针的暴露为100ms,而肌营养不良蛋白的暴露为900ms。对于TA肌肉样品,层粘连蛋白和肌营养不良蛋白探针的暴露时间为2.0s。还参见图29,其显示Δ52/mdx小鼠缺乏肌营养不良蛋白。在心脏和TA肌肉两者中,Δ52/mdx小鼠中失去了肌营养不良蛋白表达。在TA肌肉中,有一些自发回复突变纤维(随机剪接事件或体细胞突变),但这与mdx小鼠模型一致。蛋白质印迹也指示,Δ52/mdx小鼠缺乏与DMD基因型一致的肌营养不良蛋白,而健康的hDMD/mdx小鼠表达肌营养不良蛋白。参见图30。
在旷场试验的前五分钟后,Δ52/mdx小鼠显示出与mdx小鼠相似的活性水平。在旷场试验中,允许小鼠自由地探索旷场竞技场(20 x 20 x 30cm)30分钟。使用与计算机运行Fusion Activitv软件(版本5.3,欧姆尼技术公司(Omnitech),俄亥俄州哥伦布市)接口的红外二极管(x、y和z轴)来自动监测动物的活动和位置。图31显示了如通过运动和探索所示的,Δ52/mdx小鼠与mdx小鼠和hDMD/mdx小鼠相比的整体活动。行进距离和直立的竖直活动分别显示在左图和右图中。
实例3
通过去除外显子51进行的肌营养不良蛋白恢复
在Δ52/mdx小鼠中,外显子51的去除可以产生贝克肌营养不良(BMD)样基因型,并且理论上恢复肌营养不良蛋白表达。使用Δ52/mdx小鼠来证明使用所披露的基于CRISPR/Cas9的基因编辑***,通过去除外显子51而进行的肌营养不良蛋白表达的恢复。图32显示了使用SaCas9和gRNA,通过靶向内含子区域中的外显子51的上游和下游的gRNA来跳过外显子51的修正策略。
标准:将含有gRNA JCR179(上游)或JCR183(下游)(分别为SEQ ID NO:37和SEQ IDNO:38)和SaCas9的质粒电穿孔到DMD患者成肌细胞中。从分化的细胞中收获蛋白质,并使用肌营养不良蛋白抗体的蛋白质印迹进行分析。图33显示可以编辑基因组DNA以恢复肌营养不良蛋白,因为用全部3种组分(即,gRNA和SaCas9两者)处理的细胞显示出肌营养不良蛋白表达。
然后用Δ52/mdx小鼠对***进行测试。图34显示了使用gRNA和SaCas9***处理Δ52/mdx小鼠的实验设计,包括在实验设计中使用的2种病毒载体的示意图。使用载体PT366-179(SEQ ID NO:39)和PT366-183(SEQ ID NO:40)和本领域已知的产生病毒颗粒的方法来创建AAV8重组病毒构建体。这些病毒载体(AAV8)作为两种病毒颗粒在体内共同递送。每种病毒颗粒含有SaCas9和一种gRNA(参见图3)。用5E11的AAV8重组病毒构建体处理Δ52/mdx小鼠。将病毒肌内注射到右侧TA肌肉中,而左侧TA肌肉充当对侧对照并注射PBS。处理后,去除左侧和右侧TA肌肉,并取各自的切片进行基因组DNA分析。如图35所示,跨感兴趣的区域进行PCR,并且在左侧凝胶上记录了经处理的右侧TA肌肉中的缺失带,指示一定水平的基因编辑。对缺失带进行测序,并且主要产物是来自每种gRNA的PAM的3个碱基对的预期连接。图35显示了右侧TA肌肉中的体内外显子51缺失。
类似地,分析经处理的右侧TA和对照左侧TA肌肉的切片以确定编辑是否进行到RNA。跨cDNA中的外显子50至53进行PCR。如图36的右侧凝胶所示,在两个经处理的样品中缺乏外显子51和52。正如预期的那样,鉴于小鼠已经缺乏外显子52并且基于CRISPR/Cas9的基因编辑***去除了外显子51,所以对缺失带进行测序并且主要产物是外显子50至53的连接(参见右下序列色谱图)。图36显示了右侧TA肌肉中的体内外显子51缺失。
图37显示了代表性荧光免疫组织化学染色,指示在Δ52/mdx小鼠的对照PBS注射的左侧TA肌肉中存在微量肌营养不良蛋白。对照左侧TA上的一定程度的呈绿色的肌营养不良蛋白染色可能归因于回复突变纤维或死细胞(有时也染绿色)。经处理的右侧TA肌肉中绿色肌营养不良蛋白染色有明显增加,如右图所示。图37显示了经处理的TA肌肉中的体内肌营养不良蛋白恢复。
从3只测试小鼠的左侧和右侧TA肌肉提取蛋白质,并进行蛋白质印迹分析。图38显示了经处理的TA肌肉中的体内肌营养不良蛋白恢复。在对照左侧TA肌肉中没有看到蛋白质表达,而所有三个右侧TA肌肉都展示不同水平的肌营养不良蛋白表达。来自小鼠1的右侧TA的蛋白质表达最强,而小鼠2和3有微弱但仍然存在的带。所披露的基于CRISPR/Cas9的基因编辑***在体内起作用以在Δ52/mdx小鼠中一定程度上恢复肌营养不良蛋白表达。
小鼠生理学测试。用含有SaCas9和gRNA的AAV8(n=10)或AAV9(n=10)重组病毒构建体处理经处理的小鼠(所有雄性hDMD-Δ52(het)/mdx(hemi)小鼠),并与未经处理的小鼠(hDMD-Δ52/mdx)(n=10)进行比较。使用载体PT366-179(SEQ ID NO:39)和PT366-183(SEQID NO:40)并使用本领域已知的方法创建AAV重组病毒构建体。将经处理的小鼠在6-8周龄之间尾静脉注射200μL病毒。小鼠在8周后进行测试。
旷场距离测试。允许小鼠自由探索旷场竞技场30分钟。使用与计算机运行FusionActivitv软件接口的红外二极管来自动监测动物的活动和位置。连续收集数据并将其分档为5分钟的时间间隔。图39显示了与未经处理的16周龄小鼠相比,在8周龄时处理的16周龄小鼠移动总距离的所有时间点的平均值。图40显示了16周后总饲养姿势的所有时间点的平均值。统计资料为:单因素ANOVA,将每列均值与未经处理的均值进行比较,以及邓尼特事后检验(Dunnett post hoc)(均值+/-SEM)。与未经处理的年龄匹配的小鼠相比,经AAV8和AAV9处理的小鼠显示出统计显著更大的行进距离(统计学显著)。与未经处理的年龄匹配的对照相比,所有经处理的小鼠显示出统计学显著增加的饲养姿势量。
握力。测试16周的未经处理和经处理的小鼠的握力。为了测试握力,对小鼠进行了分别针对前后脚的3-5次试验。图41显示了平均值试验。握力以克力报告。如图41所示,与未经处理的年龄匹配的小鼠相比,经AAV9处理的小鼠显示出统计学显著增加的前爪握力。统计资料为:双因素ANOVA,图基事后检验(Tukey′s test post hoc)。
cDNA PCR。使用RNEasy Plus通用迷你试剂盒(凯杰公司)处理来自小鼠心脏的组织。使用SuperScript VILO cDNA合成试剂盒将得到的RNA逆转录为eDNA。使用AccuPrimeDNA聚合酶和外显子48(正向引物:gtttccagagctttacctgagaa(SEQ ID NO:89))和外显子54(反向引物:CTTTTATGAATGCTTCTCCAAG(SEQ ID NO:90))的引物对1μL cDNA进行PCR扩增。如果不存在缺失(即,外显子52仍然存在),则预期的带的大小为997nt,并且如果存在外显子52的缺失,则预期的带的大小为大约764nt。图42显示了面静脉注射AAV9(“JA10(P2AAV9)”)的36-50小时龄之间的P2小鼠,以及尾静脉注射3.3-7.7E12AAV8(“JA11(TV AAV8)”)或4.3-7.5E12 AAV9(“JA12(TV AAV9)”)的成年小鼠。如图42所示,在经AAV9处理的P2小鼠(48-54小时龄的小鼠)和经AAV8和AAV9处理的成年小鼠中发生不同程度的编辑,这通过使用与外显子53结合的引物tttctgtgattttcttttggattg(SEQ ID NO:109)对缺失带进行测序而得到进一步证实。图43显示了代表性色谱图,显示来自Ja10小鼠1的缺失带的序列中外显子51和52的缺失。
应理解以上具体实施方式和随附实例仅是说明性的,并且不应视为对本发明范围的限制,该范围仅由随附权利要求和它们的等效物限定。
所披露的实施例的各种变化和修改对本领域技术人员将是显而易见的。可以在不脱离本发明的精神和范围的情况下进行此类变化和修改,包括但不限于与本发明的化学结构、取代基、衍生物、中间体、合成、组合物、配制品或使用方法有关的那些变化和修改。
出于完整性的原因,本发明的各个方面将在以下编号的条款中阐述:
条款1.一种包含靶向结构域的指导RNA(gRNA),该靶向结构域包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQID NO:41、SEQ ID NO:42中列出的核苷酸序列或其互补序列。
条款2.一种包含第一gRNA和第二gRNA的DNA靶向组合物,该第一gRNA分子和该第二gRNA分子包含靶向结构域,该靶向结构域包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:41、SEQ ID NO:42中列出的核苷酸序列或其互补序列,其中该第一gRNA分子和该第二gRNA分子包含不同的靶向结构域。
条款3.如条款2所述的DNA靶向组合物,其中该第一gRNA分子是SEQ ID NO:1、SEQID NO:3、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:41,并且该第二gRNA分子是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:42。
条款4.如条款2或3所述的DNA靶向组合物,其中该第一gRNA分子选自下组,该组由以下组成:SEQ ID NO:1、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14和SEQID NO:15,并且该第二gRNA分子选自下组,该组由以下组成:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18和SEQ ID NO:19。
条款5.如条款2-4中任一项所述的DNA靶向组合物,其中该第一gRNA分子和该第二gRNA分子选自下组,该组由以下组成:(i)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:1中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:2中列出的核苷酸序列;(ii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(iii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(iv)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;(v)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQID NO:4中列出的核苷酸序列;(vi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(vii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;(viii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(ix)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(x)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQID NO:15中列出的核苷酸序列;(xi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;以及(xii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:41中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:42中列出的核苷酸序列。
条款6.如条款2-5中任一项所述的DNA靶向组合物,进一步包含成簇规律间隔短回文重复序列相关(Cas)蛋白。
条款7.如条款6所述的DNA靶向组合物,其中该Cas蛋白包含识别NNGRRT(SEQ IDNO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的Cas9分子。
条款8.如条款6或7所述的DNA靶向组合物,其中该Cas蛋白包含具有SEQ ID NO:45的氨基酸序列的金黄色葡萄球菌Cas9分子。
条款9.如条款2-8中任一项所述的DNA靶向组合物,其中该DNA靶向组合物包含SEQID NO:83的核苷酸序列、SEQ ID NO:84的核苷酸序列、SEQ ID NO:37的核苷酸序列和/或SEQ ID NO:38的核苷酸序列。
条款10.一种分离的多核苷酸,包含如条款1所述的gRNA分子或如条款2-9中任一项所述的DNA靶向组合物。
条款11.一种载体,包含如条款1所述的gRNA、如条款2-9中任一项所述的DNA靶向组合物或如条款10所述的分离的多核苷酸。
条款12.一种载体,包含如条款6-9中任一项所述的DNA靶向组合物。
条款13.一种载体,编码:(a)第一指导RNA(gRNA)分子,(b)第二gRNA分子和(c)至少一种识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的Cas9分子,其中该第一gRNA分子和该第二gRNA分子包含靶向结构域,该靶向结构域包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:41、SEQ ID NO:42中列出的核苷酸序列或其互补序列,其中该第一gRNA分子和该第二gRNA分子包含不同的靶向结构域。
条款14.如条款13所述的载体,其中该载体被配置为形成在人DMD基因的外显子51侧翼的第一和第二内含子中的第一和第二双链断裂。
条款15.如条款13或14所述的载体,其中该第一gRNA分子是SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:41,并且该第二gRNA分子是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19或SEQ ID NO:42。
条款16.如条款13-15中任一项所述的载体,其中该第一gRNA分子选自下组,该组由以下组成:SEQ ID NO:1、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14和SEQ ID NO:15,并且该第二gRNA分子选自下组,该组由以下组成:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18和SEQ ID NO:19。
条款17.如条款13-16中任一项所述的载体,该第一gRNA分子和该第二gRNA分子选自下组,该组由以下组成:(i)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQID NO:1中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:2中列出的核苷酸序列;(ii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(iii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(iv)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;(v)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(vi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ IDNO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(vii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;(viii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(ix)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(x)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列;以及(xi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:1 8中列出的核苷酸序列。
条款18.如条款11-17中任一项所述的载体,其中该载体是病毒载体。
条款19.如条款18所述的载体,其中该载体是腺相关病毒(AAV)载体。
条款20.如条款19所述的载体,其中该AAV载体是AAV8载体或AAV9载体。
条款21.如条款11-20中任一项所述的载体,其中该载体包含可操作地连接至编码该第一gRNA分子、该第二gRNA分子和/或该Cas9分子的核苷酸序列的组织特异性启动子。
条款22.如条款21所述的载体,其中该组织特异性启动子是肌肉特异性启动子。
条款23.一种细胞,包含如条款1所述的gRNA、如条款2-9中任一项所述的DNA靶向组合物、如条款10所述的分离的多核苷酸或如条款11-22中任一项所述的载体。
条款24.一种试剂盒,包含如条款1所述的gRNA、如条款2-9中任一项所述的DNA靶向***、如条款10所述的分离的多核苷酸、如条款11-22中任一项所述的载体或如条款23所述的细胞以及任选地使用说明书。
条款25.一种修正细胞中突变型肌营养不良蛋白基因的方法,该方法包括向细胞给予如条款1所述的gRNA、如条款2-9中任一项所述的DNA靶向***、如条款10所述的分离的多核苷酸或如条款11-22中任一项所述的载体。
条款26.一种基因组编辑受试者中突变型肌营养不良蛋白基因的方法,该方法包括向该受试者给予包含如条款1所述的gRNA、如条款2-9中任一项所述的DNA靶向***、如条款10所述的分离的多核苷酸、如条款11-22中任一项所述的载体或如条款23所述的细胞的基因组编辑组合物。
条款27.如条款26所述的方法,其中将该基因组编辑组合物肌内、静脉内或其组合给予该受试者。
条款28.如条款25-27中任一项所述的方法,其中修正该突变型肌营养不良蛋白基因包括核酸酶介导的非同源末端连接。
条款29.一种治疗具有突变型肌营养不良蛋白基因的有需要的受试者的方法,该方法包括向该受试者给予如条款1所述的gRNA、如条款2-9中任一项所述的DNA靶向***、如条款10所述的分离的多核苷酸、如条款11-22中任一项所述的载体或如条款23所述的细胞。
条款30.一种用于基因组编辑受试者中突变型肌营养不良蛋白基因的经修饰腺相关病毒载体,包含编码如条款1所述的gRNA的第一多核苷酸序列和编码识别NNGRRT(SEQ IDNO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的Cas9分子的第二多核苷酸序列。
条款31.如条款30所述的经修饰腺相关病毒载体,其中该经修饰腺相关病毒载体包含SEQ ID NO:39或SEQ ID NO:40中列出的核苷酸序列。
条款32.一种用于缺失包含外显子51的肌营养不良蛋白基因区段的组合物,该组合物包含:(a)第一载体,其包含编码第一指导RNA(gRNA)分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第一Cas9分子的多核苷酸序列,以及(b)第二载体,其包含编码第二gRNA分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第二Cas9分子的多核苷酸序列,其中该第一和第二gRNA分子各自具有长度为19至24个核苷酸的靶向结构域,并且其中该第一载体和第二载体被配置为分别形成在人DMD基因的外显子51侧翼的第一内含子和第二内含子中的第一和第二双链断裂,从而缺失包含外显子51的肌营养不良蛋白基因区段。
条款33.如条款32所述的组合物,其中该区段具有约50个碱基对至约2,000个碱基对的长度。
条款34.如条款33所述的组合物,其中该区段具有约118个碱基对、约233个碱基对、约326个碱基对、约766个碱基对、约805个碱基对或约1611个碱基对的长度。
条款35.如条款32-34中任一项所述的组合物,其中该第一Cas9分子和该第二Cas9分子是相同的。
条款36.如条款35所述的组合物,其中该第一Cas9分子和该第二Cas9分子是金黄色葡萄球菌Cas9分子。
条款37.如条款36所述的组合物,其中该第一Cas9分子和该第二Cas9分子是突变型金黄色葡萄球菌Cas9分子。
条款38.如条款32-34中任一项所述的组合物,其中该第一Cas9分子和该第二Cas9分子是不同的。
条款39.如条款38所述的组合物,其中该第一Cas9分子或该第二Cas9分子是金黄色葡萄球菌Cas9分子。
条款40.如条款32-39中任一项所述的组合物,其中该第一Cas9分子和/或该第二Cas9分子包含具有SEQ ID NO:45的氨基酸序列的SaCas9分子。
条款41.如条款32-40中任一项所述的组合物,其中该第一载体和/或该第二载体是病毒载体。
条款42.如条款41所述的组合物,其中该第一载体和/或该第二载体是腺相关病毒(AAV)载体。
条款43.如条款42所述的组合物,其中该AAV载体是AAV8载体或AAV9载体。
条款44.如条款32-43中任一项所述的组合物,其中该肌营养不良蛋白基因是人肌营养不良蛋白基因。
条款45.如条款32-44中任一项所述的组合物,其中该第一gRNA分子和该第二gRNA分子包含靶向结构域,该靶向结构域包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19中列出的核苷酸序列或其互补序列,其中该第一gRNA分子和该第二gRNA分子包含不同的靶向结构域。
条款46.如条款32-45中任一项所述的组合物,其中该第一gRNA分子是SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14或SEQ ID NO:15,并且该第二gRNA分子是SEQID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18或SEQ ID NO:19。
条款47.如条款32-46中任一项所述的组合物,其中该第一gRNA分子选自下组,该组由以下组成:SEQ ID NO:1、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14和SEQ ID NO:15,并且该第二gRNA分子选自下组,该组由以下组成:SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18和SEQ ID NO:19。
条款48.如条款32-47中任一项所述的组合物,其中该第一gRNA分子和该第二gRNA分子选自下组,该组由以下组成:(i)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:1中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:2中列出的核苷酸序列;(ii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(iii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(iv)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;(v)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ IDNO:4中列出的核苷酸序列;(vi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(vii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;(viii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(ix)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(x)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ IDNO:15中列出的核苷酸序列;以及(xi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列。
条款49.如条款32-48中任一项所述的组合物,其中该第一载体包含SEQ ID NO:39中列出的核苷酸序列,并且该第二载体包含SEQ ID NO:40中列出的核苷酸序列。
条款50.如条款32-49中任一项所述的组合物,用于在药物中使用。
条款51.如条款32-50中任一项所述的组合物,用于在治疗杜氏肌营养不良中使用。
条款52.一种细胞,包含如条款32-51中任一项所述的组合物。
条款53.一种修正细胞中突变型肌营养不良蛋白基因的方法,包括向该细胞给予:(a)第一载体,其包含编码第一指导RNA(gRNA)分子的多核苷酸序列和编码识别NNGRRT(SEQID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第一Cas9分子的多核苷酸序列,以及(b)第二载体,其包含编码第二gRNA分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第二Cas9分子的多核苷酸序列,其中该第一gRNA和第二gRNA分子各自具有长度为19至24个核苷酸的靶向结构域,并且其中该载体被配置为分别形成在人肌营养不良蛋白基因的外显子51侧翼的第一和第二内含子中的第一和第二双链断裂,从而缺失包含外显子51的肌营养不良蛋白基因区段。
条款54.如条款53所述的方法,其中该第一gRNA分子和该第二gRNA分子选自下组,该组由以下组成:(i)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:1中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQID NO:2中列出的核苷酸序列;(ii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(iii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(iv)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;(v)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(vi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ IDNO:19中列出的核苷酸序列;(vii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;(viii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(ix)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(x)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列;以及(xi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ IDNO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列。
条款55.如条款53或54所述的方法,其中该突变型肌营养不良蛋白基因包含提前终止密码子、被破坏的阅读框、异常剪接受***点或异常剪接供***点。
条款56.如条款53-55中任一项所述的方法,其中该突变型肌营养不良蛋白基因包含导致提前终止密码子和截短的基因产物的移码突变。
条款57.如条款53-55中任一项所述的方法,其中该突变型肌营养不良蛋白基因包含破坏阅读框的一个或多个外显子的缺失。
条款58.如条款53-57中任一项所述的方法,其中该突变型肌营养不良蛋白基因的修正包括提前终止密码子的缺失、被破坏的阅读框的修正或通过破坏剪接受***点或破坏剪接供体序列对剪接进行的调节。
条款59.如条款53-58中任一项所述的方法,其中该突变型肌营养不良蛋白基因的修正包括外显子51的缺失。
条款60.如条款53-59中任一项所述的方法,其中该突变型肌营养不良蛋白基因的修正包括同源定向修复。
条款61.如条款60所述的方法,进一步包括向该细胞给予供体DNA。
条款62.如条款53-61中任一项所述的方法,其中该突变型肌营养不良蛋白基因的修正包括核酸酶介导的非同源末端连接。
条款63.如条款53-62中任一项所述的方法,其中该细胞是成肌细胞。
条款64.如条款53-63中任一项所述的方法,其中该细胞来自患有杜氏肌营养不良的受试者。
条款65.如条款53-64中任一项所述的方法,其中该细胞是来自患有杜氏肌营养不良的人类受试者的成肌细胞。
条款66.如条款53-65中任一项所述的方法,其中该第一gRNA分子和该第二gRNA分子选自下组,该组由以下组成:(i)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:1中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:2中列出的核苷酸序列;(ii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;以及(iii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列。
条款67.一种治疗具有突变型肌营养不良蛋白基因的有需要的受试者的方法,该方法包括向该受试者给予:(a)第一载体,其包含编码第一指导RNA(gRNA)分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第一Cas9分子的多核苷酸序列,以及(b)第二载体,其包含编码第二gRNA分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第二Cas9分子的多核苷酸序列,其中该第一gRNA和第二gRNA分子各自具有长度为19至24个核苷酸的靶向结构域,并且其中该载体被配置为分别形成在人肌营养不良蛋白基因的外显子51侧翼的第一和第二内含子中的第一和第二双链断裂,从而缺失包含外显子51的肌营养不良蛋白基因区段。
条款68.如条款67所述的方法,其中该第一gRNA分子和该第二gRNA分子选自下组,该组由以下组成:(i)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:1中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQID NO:2中列出的核苷酸序列;(ii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(iii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(iv)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;(v)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(vi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ IDNO:19中列出的核苷酸序列;(vii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;(viii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;(ix)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;(x)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列;以及(xi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ IDNO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列。
条款69.如条款68所述的方法,其中该受试者患有杜氏肌营养不良。
条款70.如条款67-69中任一项所述的方法,其中将该第一载体和第二载体给予至该受试者的肌肉。
条款71.如条款70所述的方法,其中该肌肉是骨骼肌或心肌。
条款72.如条款71所述的方法,其中该骨骼肌是胫骨前肌。
条款73.如条款67-72中任一项所述的方法,其中将该第一载体和第二载体肌内、静脉内或其组合给予该受试者。
条款74.一种产生具有外显子52缺失(Δ52)的人肌营养不良蛋白基因(hDMD)的转基因啮齿动物胚胎的方法,该方法包括向啮齿动物胚胎给予如条款1所述的gRNA、如条款2-9中任一项所述的DNA靶向***、如条款10所述的分离的多核苷酸、如条款11-22中任一项所述的载体、如条款30或31所述的经修饰腺相关病毒载体或如条款32-51中任一项所述的组合物,从而缺失人肌营养不良蛋白基因的外显子52,并选择具有人肌营养不良蛋白基因外显子52缺失的转基因啮齿动物胚胎,其中该啮齿动物胚胎包含正常的人肌营养不良蛋白基因。
条款75.如条款74所述的方法,其中该啮齿动物胚胎是小鼠胚胎。
条款76.如条款74或75所述的方法,其中该转基因啮齿动物胚胎是杂合hDMD或杂合hDMD-Δ52。
条款77.如条款74-76中任一项所述的方法,其中将包含含SEQ ID NO:41中列出的核苷酸序列的靶向结构域的第一gRNA分子和包含含SEQ ID NO:42中列出的核苷酸序列的靶向结构域的第二gRNA分子给予至该啮齿动物胚胎以缺失人肌营养不良蛋白基因的外显子52。
条款78.如条款74-77中任一项所述的方法,进一步包括向该啮齿动物胚胎给予包含SEQ ID NO:27中列出的氨基酸序列的Cas蛋白。
条款79.一种通过如条款74-78中任一项所述的方法产生的转基因啮齿动物胚胎。
条款80.一种由如条款79所述的转基因啮齿动物胚胎产生的转基因啮齿动物。
附录
含JCR179(SEQ ID NO:37)的pDO240(gRNA为粗体)
含JCR183(SEQ ID NO:38)的pDO240(gRNA为粗体)
含JCR179 PT366AAV 179(SEQ ID NO:39)的PT366-用于体内起作用的AAV质粒(gRNA为粗体;SaCas9为大写;NLS为小写、粗体且加下划线)
含JCR183(SEQ ID NO:40)的PT366-用于体内起作用(gRNA为粗体;SaCas9为大写;NLS为小写、粗体且加下划线)
pDO242(用于体外起作用的所有JCR89/91项目和JCRl57/160项目的SaCas9;SaCas9为大写)(SEQ ID NO:83)
pJRH1(用于所有JCRl79/183项目的SaCas9,SaCas9为大写:NLS为小写、粗体且加下划线)(SEQ ID NO:84)
PT366中的NLS序列(SEQ ID NO:85)
pDO203-针对SpCas9的gRNA克隆进的通用主链;JCR94和JCR99置于粗***置以在细胞中测试,然后从中制备mRNA以制备hDMD-Δ52/mdx小鼠(SEQ ID NO:86)

Claims (77)

1.一种包含靶向结构域的指导RNA(gRNA),该靶向结构域包含SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:41、SEQ ID NO:42中列出的核苷酸序列或其互补序列。
2.一种包含第一gRNA和第二gRNA的DNA靶向组合物,该第一gRNA分子和该第二gRNA分子包含靶向结构域,该靶向结构域包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:41、SEQ ID NO:42中列出的核苷酸序列或其互补序列,其中该第一gRNA分子和该第二gRNA分子包含不同的靶向结构域。
3.如权利要求2所述的DNA靶向组合物,其中该第一gRNA分子是SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:41,并且该第二gRNA分子是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19或SEQ ID NO:42。
4.如权利要求2所述的DNA靶向组合物,其中该第一gRNA分子选自下组,该组由以下组成:SEQ ID NO:1、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14和SEQ IDNO:15,并且该第二gRNA分子选自下组,该组由以下组成:SEQ ID NO:2、SEQ ID NO:4、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18和SEQ ID NO:19。
5.如权利要求2所述的DNA靶向组合物,其中该第一gRNA分子和该第二gRNA分子选自下组,该组由以下组成:
(i)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:1中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:2中列出的核苷酸序列;
(ii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(iii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(iv)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;
(v)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(vi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(vii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;
(viii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(ix)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(x)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列;
(xi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;以及
(xii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:41中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:42中列出的核苷酸序列。
6.如权利要求2所述的DNA靶向组合物,进一步包含成簇规律间隔短回文重复序列相关(Cas)蛋白。
7.如权利要求6所述的DNA靶向组合物,其中该Cas蛋白包含识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的Cas9分子。
8.如权利要求6所述的DNA靶向组合物,其中该Cas蛋白包含具有SEQ ID NO:45的氨基酸序列的金黄色葡萄球菌Cas9分子。
9.如权利要求2所述的DNA靶向组合物,其中该DNA靶向组合物包含SEQ ID NO:83的核苷酸序列、SEQ ID NO:84的核苷酸序列、SEQ ID NO:37的核苷酸序列和/或SEQ ID NO:38的核苷酸序列。
10.一种分离的多核苷酸,包含如权利要求1所述的gRNA分子。
11.一种载体,包含如权利要求1所述的gRNA。
12.一种载体,包含如权利要求6所述的DNA靶向组合物。
13.一种载体,编码:
(a)第一指导RNA(gRNA)分子,
(b)第二gRNA分子,以及
(c)至少一种识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的Cas9分子,
其中该第一gRNA分子和该第二gRNA分子包含靶向结构域,该靶向结构域包含SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:41、SEQ ID NO:42中列出的核苷酸序列或其互补序列,其中该第一gRNA分子和该第二gRNA分子包含不同的靶向结构域。
14.如权利要求13所述的载体,其中该载体被配置为形成在人DMD基因的外显子51侧翼的第一和第二内含子中的第一和第二双链断裂。
15.如权利要求13所述的载体,其中该第一gRNA分子是SEQ ID NO:1、SEQ ID NO:3、SEQID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:41,并且该第二gRNA分子是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:42。
16.如权利要求13所述的载体,其中该第一gRNA分子选自下组,该组由以下组成:SEQID NO:1、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14和SEQ ID NO:15,并且该第二gRNA分子选自下组,该组由以下组成:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18和SEQ ID NO:19。
17.如权利要求13所述的载体,该第一gRNA分子和该第二gRNA分子选自下组,该组由以下组成:
(i)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:1中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:2中列出的核苷酸序列;
(ii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(iii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(iv)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;
(v)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(vi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(vii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;
(viii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(ix)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(x)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列;以及
(xi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列。
18.如权利要求11所述的载体,其中该载体是病毒载体。
19.如权利要求18所述的载体,其中该载体是腺相关病毒(AAV)载体。
20.如权利要求19所述的载体,其中该AAV载体是AAV8载体或AAV9载体。
21.如权利要求11所述的载体,其中该载体包含可操作地连接至编码该第一gRNA分子、该第二gRNA分子和/或该Cas9分子的核苷酸序列的组织特异性启动子。
22.如权利要求21所述的载体,其中该组织特异性启动子是肌肉特异性启动子。
23.一种细胞,包含如权利要求1所述的gRNA。
24.一种试剂盒,包含如权利要求1所述的gRNA。
25.一种修正细胞中突变型肌营养不良蛋白基因的方法,该方法包括向细胞给予如权利要求1所述的gRNA。
26.一种基因组编辑受试者中突变型肌营养不良蛋白基因的方法,该方法包括向该受试者给予包含如权利要求1所述的gRNA的基因组编辑组合物。
27.如权利要求26所述的方法,其中将该基因组编辑组合物肌内、静脉内或其组合给予该受试者。
28.如权利要求25或26所述的方法,其中修正该突变型肌营养不良蛋白基因包括核酸酶介导的非同源末端连接。
29.一种治疗具有突变型肌营养不良蛋白基因的有需要的受试者的方法,该方法包括向该受试者给予如权利要求1所述的gRNA。
30.一种用于基因组编辑受试者中突变型肌营养不良蛋白基因的经修饰腺相关病毒载体,包含编码如权利要求1所述的gRNA的第一多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的Cas9分子的第二多核苷酸序列。
31.如权利要求30所述的经修饰腺相关病毒载体,其中该经修饰腺相关病毒载体包含SEQ ID NO:39或SEQ ID NO:40中列出的核苷酸序列。
32.一种用于缺失包含外显子51的肌营养不良蛋白基因区段的组合物。该组合物包含:
(a)第一载体,其包含编码第一指导RNA(gRNA)分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第一Cas9分子的多核苷酸序列,以及
(b)第二载体,其包含编码第二gRNA分子的多核苷酸序列和编码识别NNGRRT(SEQ IDNO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第二Cas9分子的多核苷酸序列,
其中该第一和第二gRNA分子各自具有长度为19至24个核苷酸的靶向结构域,并且其中该第一载体和第二载体被配置为分别形成在人DMD基因的外显子51侧翼的第一内含子和第二内含子中的第一和第二双链断裂,从而缺失包含外显子51的肌营养不良蛋白基因区段。
33.如权利要求32所述的组合物,其中该区段具有约50个碱基对至约2,000个碱基对的长度。
34.如权利要求33所述的组合物,其中该区段具有约118个碱基对、约233个碱基对、约326个碱基对、约766个碱基对、约805个碱基对或约1611个碱基对的长度。
35.如权利要求32所述的组合物,其中该第一Cas9分子和该第二Cas9分子是相同的。
36.如权利要求35所述的组合物,其中该第一Cas9分子和该第二Cas9分子是金黄色葡萄球菌Cas9分子。
37.如权利要求36所述的组合物,其中该第一Cas9分子和该第二Cas9分子是突变型金黄色葡萄球菌Cas9分子。
38.如权利要求32所述的组合物,其中该第一Cas9分子和该第二Cas9分子是不同的。
39.如权利要求38所述的组合物,其中该第一Cas9分子或该第二Cas9分子是金黄色葡萄球菌Cas9分子。
40.如权利要求32所述的组合物,其中该第一Cas9分子和/或该第二Cas9分子包含具有SEQ ID NO:45的氨基酸序列的SaCas9分子。
41.如权利要求32所述的组合物,其中该第一载体和/或该第二载体是病毒载体。
42.如权利要求41所述的组合物,其中该第一载体和/或该第二载体是腺相关病毒(AAV)载体。
43.如权利要求42所述的组合物,其中该AAV载体是AAV8载体或AAV9载体。
44.如权利要求32所述的组合物,其中该肌营养不良蛋白基因是人肌营养不良蛋白基因。
45.如权利要求32所述的组合物,其中该第一gRNA分子和该第二gRNA分子包含靶向结构域,该靶向结构域包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19中列出的核苷酸序列或其互补序列,其中该第一gRNA分子和该第二gRNA分子包含不同的靶向结构域。
46.如权利要求32所述的组合物,其中该第一gRNA分子是SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14或SEQ ID NO:15,并且该第二gRNA分子是SEQ ID NO:2、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18或SEQID NO:19。
47.如权利要求32所述的组合物,其中该第一gRNA分子选自下组,该组由以下组成:SEQID NO:1、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14和SEQ ID NO:15,并且该第二gRNA分子选自下组,该组由以下组成:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18和SEQ ID NO:19。
48.如权利要求32所述的组合物,其中该第一gRNA分子和该第二gRNA分子选自下组,该组由以下组成:
(i)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:1中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:2中列出的核苷酸序列;
(ii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(iii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(iv)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;
(v)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(vi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(vii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;
(viii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(ix)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(x)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列;以及
(xi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列。
49.如权利要求32所述的组合物,其中该第一载体包含SEQ ID NO:39中列出的核苷酸序列,并且该第二载体包含SEQ ID NO:40中列出的核苷酸序列。
50.如权利要求32所述的组合物,用于在药物中使用。
51.如权利要求32所述的组合物,用于在治疗杜氏肌营养不良中使用。
52.一种细胞,包含如权利要求32所述的组合物。
53.一种修正细胞中突变型肌营养不良蛋白基因的方法,包括向该细胞给予:
(a)第一载体,其包含编码第一指导RNA(gRNA)分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第一Cas9分子的多核苷酸序列,以及
(b)第二载体,其包含编码第二gRNA分子的多核苷酸序列和编码识别NNGRRT(SEQ IDNO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第二Cas9分子的多核苷酸序列,
其中该第一gRNA和第二gRNA分子各自具有长度为19至24个核苷酸的靶向结构域,并且其中该载体被配置为分别形成在人肌营养不良蛋白基因的外显子51侧翼的第一和第二内含子中的第一和第二双链断裂,从而缺失包含外显子51的肌营养不良蛋白基因区段。
54.如权利要求53所述的方法,其中该第一gRNA分子和该第二gRNA分子选自下组,该组由以下组成:
(i)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:1中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:2中列出的核苷酸序列;
(ii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(iii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(iv)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;
(v)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(vi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(vii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;
(viii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列:
(ix)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(x)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列;以及
(xi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列。
55.如权利要求53所述的方法,其中该突变型肌营养不良蛋白基因包含提前终止密码子、被破坏的阅读框、异常剪接受***点或异常剪接供***点。
56.如权利要求53所述的方法,其中该突变型肌营养不良蛋白基因包含导致提前终止密码子和截短的基因产物的移码突变。
57.如权利要求53所述的方法,其中该突变型肌营养不良蛋白基因包含破坏阅读框的一个或多个外显子的缺失。
58.如权利要求53所述的方法,其中该突变型肌营养不良蛋白基因的修正包括提前终止密码子的缺失、被破坏的阅读框的修正或通过破坏剪接受***点或破坏剪接供体序列对剪接进行的调节。
59.如权利要求53所述的方法,其中该突变型肌营养不良蛋白基因的修正包括外显子51的缺失。
60.如权利要求53所述的方法,其中该突变型肌营养不良蛋白基因的修正包括同源定向修复。
61.如权利要求60所述的方法,进一步包括向该细胞给予供体DNA。
62.如权利要求53所述的方法,其中该突变型肌营养不良蛋白基因的修正包括核酸酶介导的非同源末端连接。
63.如权利要求53所述的方法,其中该细胞是成肌细胞。
64.如权利要求53所述的方法,其中该细胞来自患有杜氏肌营养不良的受试者。
65.如权利要求53所述的方法,其中该细胞是来自患有杜氏肌营养不良的人类受试者的成肌细胞。
66.如权利要求53所述的方法,其中该第一gRNA分子和该第二gRNA分子选自下组,该组由以下组成:
(i)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:1中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:2中列出的核苷酸序列;
(ii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;以及
(iii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列。
67.一种治疗具有突变型肌营养不良蛋白基因的有需要的受试者的方法,该方法包括向该受试者给予:
(a)第一载体,其包含编码第一指导RNA(gRNA)分子的多核苷酸序列和编码识别NNGRRT(SEQ ID NO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第一Cas9分子的多核苷酸序列,以及
(b)第二载体,其包含编码第二gRNA分子的多核苷酸序列和编码识别NNGRRT(SEQ IDNO:24)或NNGRRV(SEQ ID NO:25)的原型间隔子邻近基序(PAM)的第二Cas9分子的多核苷酸序列,
其中该第一gRNA和第二gRNA分子各自具有长度为19至24个核苷酸的靶向结构域,并且其中该载体被配置为分别形成在人肌营养不良蛋白基因的外显子51侧翼的第一和第二内含子中的第一和第二双链断裂,从而缺失包含外显子51的肌营养不良蛋白基因区段。
68.如权利要求67所述的方法,其中该第一gRNA分子和该第二gRNA分子选自下组,该组由以下组成:
(i)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:1中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:2中列出的核苷酸序列;
(ii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(iii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(iv)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:1 5中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;
(v)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(vi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(vii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列;
(viii)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:4中列出的核苷酸序列;
(ix)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:19中列出的核苷酸序列;
(x)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:14中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:15中列出的核苷酸序列;以及
(xi)包含如下靶向结构域的第一gRNA分子,该靶向结构域包含SEQ ID NO:11中列出的核苷酸序列,以及包含如下靶向结构域的第二gRNA分子,该靶向结构域包含SEQ ID NO:18中列出的核苷酸序列。
69.如权利要求68所述的方法,其中该受试者患有杜氏肌营养不良。
70.如权利要求67所述的方法,其中将该第一载体和第二载体肌内、静脉内或其组合给予该受试者。
71.一种产生具有外显子52缺失(Δ52)的人肌营养不良蛋白基因(hDMD)的转基因啮齿动物胚胎的方法,该方法包括向啮齿动物胚胎给予如权利要求1所述的gRNA。
72.如权利要求71所述的方法,其中该啮齿动物胚胎是小鼠胚胎。
73.如权利要求71所述的方法,其中该转基因啮齿动物胚胎是杂合hDMD或杂合hDMD-Δ52。
74.如权利要求71所述的方法,其中将包含含SEQ ID NO:41中列出的核苷酸序列的靶向结构域的第一gRNA分子和包含含SEQ ID NO:42中列出的核苷酸序列的靶向结构域的第二gRNA分子给予至该啮齿动物胚胎以缺失人肌营养不良蛋白基因的外显子52。
75.如权利要求71所述的方法,进一步包括向该啮齿动物胚胎给予包含SEQ ID NO:27中列出的氨基酸序列的Cas蛋白。
76.一种通过如权利要求71所述的方法产生的转基因啮齿动物胚胎。
77.一种由如权利要求71所述的转基因啮齿动物胚胎产生的转基因啮齿动物。
CN201680080439.7A 2015-11-30 2016-11-30 用于通过基因编辑修正人肌营养不良蛋白基因的治疗靶标和使用方法 Active CN108779466B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562260712P 2015-11-30 2015-11-30
US62/260712 2015-11-30
US201662330336P 2016-05-02 2016-05-02
US62/330336 2016-05-02
PCT/US2016/064285 WO2017095967A2 (en) 2015-11-30 2016-11-30 Therapeutic targets for the correction of the human dystrophin gene by gene editing and methods of use

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202410269446.8A Division CN118147141A (zh) 2015-11-30 2016-11-30 用于通过基因编辑修正人肌营养不良蛋白基因的治疗靶标和使用方法

Publications (2)

Publication Number Publication Date
CN108779466A true CN108779466A (zh) 2018-11-09
CN108779466B CN108779466B (zh) 2024-03-29

Family

ID=58797730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680080439.7A Active CN108779466B (zh) 2015-11-30 2016-11-30 用于通过基因编辑修正人肌营养不良蛋白基因的治疗靶标和使用方法

Country Status (12)

Country Link
US (1) US20180353615A1 (zh)
EP (1) EP3384055A4 (zh)
JP (2) JP7108307B2 (zh)
KR (1) KR20180081618A (zh)
CN (1) CN108779466B (zh)
AU (1) AU2016362282B2 (zh)
BR (1) BR112018011133A2 (zh)
CA (1) CA3001623A1 (zh)
EA (1) EA201891317A3 (zh)
IL (1) IL259100B2 (zh)
MX (1) MX2018005377A (zh)
WO (1) WO2017095967A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111718964A (zh) * 2019-08-01 2020-09-29 广东赤萌医疗科技有限公司 用于修复dmd基因突变的核酸序列及***
CN112522256A (zh) * 2020-08-19 2021-03-19 南京启真基因工程有限公司 CRISPR/Cas9***及其在构建抗肌萎缩蛋白基因缺陷的猪源重组细胞中的应用
CN113646004A (zh) * 2018-12-12 2021-11-12 坚固生物科技公司 用于治疗肌营养不良的组合疗法
CN113785063A (zh) * 2019-04-14 2021-12-10 杜克大学 用于治疗杜氏肌营养不良症的aav载体介导的大规模突变热点缺失
CN116783293A (zh) * 2020-11-12 2023-09-19 精密生物科学公司 对肌营养不良蛋白基因中的识别序列具有特异性的工程化大范围核酸酶

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013163628A2 (en) 2012-04-27 2013-10-31 Duke University Genetic correction of mutated genes
US10676726B2 (en) 2015-02-09 2020-06-09 Duke University Compositions and methods for epigenome editing
JP6905755B2 (ja) 2015-08-25 2021-07-21 デューク ユニバーシティ Rnaガイド型エンドヌクレアーゼを使用してゲノム工学における特異性を改善する組成物および方法
EP4089175A1 (en) 2015-10-13 2022-11-16 Duke University Genome engineering with type i crispr systems in eukaryotic cells
EP3368063B1 (en) 2015-10-28 2023-09-06 Vertex Pharmaceuticals Inc. Materials and methods for treatment of duchenne muscular dystrophy
EP3452498B1 (en) * 2016-05-05 2023-07-05 Duke University Crispr/cas-related compositions for treating duchenne muscular dystrophy
JOP20190166A1 (ar) * 2017-01-05 2019-07-02 Univ Texas استراتيجية مثلى من أجل تعديلات تخطي إكسون باستخدام crispr/cas9 مع متواليات توجيه ثلاثي
US10687520B2 (en) 2017-03-07 2020-06-23 The Board Of Regents Of The University Of Texas System Generation and correction of a humanized mouse model with a deletion of dystrophin exon 44
US20200260698A1 (en) * 2017-08-18 2020-08-20 The Board Of Regents Of The University Of Texas System Exon deletion correction of duchenne muscular dystrophy mutations in the dystrophin actin binding domain 1 using crispr genome editing
WO2019092507A2 (en) * 2017-11-09 2019-05-16 Crispr Therapeutics Ag Crispr/cas systems for treatment of dmd
EP3728598A1 (en) 2017-12-21 2020-10-28 Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft Nucleic acid sequence replacement by nhej
BR112020019079A2 (pt) * 2018-03-23 2020-12-29 Massachusetts Eye And Ear Infirmary Abordagem de salto de éxon mediada por crispr/cas9 para síndrome de usher associada a ush2a
JP2022526669A (ja) * 2019-04-12 2022-05-25 デューク ユニバーシティ ジストロフィン機能を修復するためのCRISPR/Casをベースにした塩基編集組成物
US20210047649A1 (en) * 2019-05-08 2021-02-18 Vertex Pharmaceuticals Incorporated Crispr/cas all-in-two vector systems for treatment of dmd
US20240091379A1 (en) * 2019-10-11 2024-03-21 Yale University Compositions and methods for upregulating isoforms of dystrophin as therapy for duchenne muscular dystrophy (dmd)
JP2023500357A (ja) * 2019-11-07 2023-01-05 チンタオ、キングアグルート、ケミカル、コンパウンド、カンパニー、リミテッド 生物内に新規突然変異を作出するための方法およびその適用
US20230348870A1 (en) * 2020-04-27 2023-11-02 Duke University Gene editing of satellite cells in vivo using aav vectors encoding muscle-specific promoters
WO2022081612A1 (en) * 2020-10-12 2022-04-21 Duke University Crispr/cas-based base editing composition for restoring dystrophin function
EP4215614A1 (en) 2022-01-24 2023-07-26 Dynacure Combination therapy for dystrophin-related diseases

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140315862A1 (en) * 2013-03-15 2014-10-23 Sarepta Therapeutics, Inc. Compositions for treating muscular dystrophy
WO2014197748A2 (en) * 2013-06-05 2014-12-11 Duke University Rna-guided gene editing and gene regulation

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9011454D0 (en) * 1990-05-22 1990-07-11 Medical Res Council Polynucleotide amplification
AU4528493A (en) 1992-06-04 1994-01-04 Regents Of The University Of California, The In vivo gene therapy with intron-free sequence of interest
ATE302854T1 (de) 1993-01-26 2005-09-15 Univ Pennsylvania Zusammensetzungen und verfahren zur verabreichung von genetischem material
US5593972A (en) 1993-01-26 1997-01-14 The Wistar Institute Genetic immunization
US5962428A (en) 1995-03-30 1999-10-05 Apollon, Inc. Compositions and methods for delivery of genetic material
US20040192593A1 (en) 1999-07-26 2004-09-30 Baylor College Of Medicine Protease resistant ti-growth hormone releasing hormone
CA2504593C (en) 2002-11-04 2016-08-09 Advisys, Inc. Synthetic muscle promoters with activities exceeding naturally occurring regulatory sequences in cardiac cells
AU2016244033A1 (en) * 2015-04-01 2017-10-19 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating Duchenne Muscular Dystrophy and Becker Muscular Dystrophy
EP3452498B1 (en) * 2016-05-05 2023-07-05 Duke University Crispr/cas-related compositions for treating duchenne muscular dystrophy

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140315862A1 (en) * 2013-03-15 2014-10-23 Sarepta Therapeutics, Inc. Compositions for treating muscular dystrophy
WO2014197748A2 (en) * 2013-06-05 2014-12-11 Duke University Rna-guided gene editing and gene regulation

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DAVID G. OUSTEROUT等: "Multiplex CRISPR/Cas9-Based Genome Editing for Correction of Dystrophin Mutations that Cause Duchenne Muscular Dystrophy", 《NATURE COMMUNICATIONS》 *
HEATHER WOOD: "Neuromuscular disease: CRISPR/Cas9 gene-editing platform corrects mutations associated with Duchenne muscular dystrophy", 《NATURE REVIEWS. NEUROLOGY》 *
XINRAN YU等: "Dystrophin-deficient large animal models: translational research and exon skipping", 《AMERICAN JOURNAL OF TRANSLATIONAL RESEARCH》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113646004A (zh) * 2018-12-12 2021-11-12 坚固生物科技公司 用于治疗肌营养不良的组合疗法
CN113785063A (zh) * 2019-04-14 2021-12-10 杜克大学 用于治疗杜氏肌营养不良症的aav载体介导的大规模突变热点缺失
CN111718964A (zh) * 2019-08-01 2020-09-29 广东赤萌医疗科技有限公司 用于修复dmd基因突变的核酸序列及***
CN112522256A (zh) * 2020-08-19 2021-03-19 南京启真基因工程有限公司 CRISPR/Cas9***及其在构建抗肌萎缩蛋白基因缺陷的猪源重组细胞中的应用
CN112522256B (zh) * 2020-08-19 2023-08-22 南京启真基因工程有限公司 CRISPR/Cas9***及其在构建抗肌萎缩蛋白基因缺陷的猪源重组细胞中的应用
CN116783293A (zh) * 2020-11-12 2023-09-19 精密生物科学公司 对肌营养不良蛋白基因中的识别序列具有特异性的工程化大范围核酸酶

Also Published As

Publication number Publication date
IL259100B2 (en) 2023-09-01
IL259100A (en) 2018-06-28
CN108779466B (zh) 2024-03-29
JP7108307B2 (ja) 2022-07-28
CA3001623A1 (en) 2017-06-08
EP3384055A2 (en) 2018-10-10
MX2018005377A (es) 2018-11-09
EA201891317A2 (ru) 2018-12-28
BR112018011133A2 (pt) 2018-11-21
JP2018534950A (ja) 2018-11-29
US20180353615A1 (en) 2018-12-13
IL259100B1 (en) 2023-05-01
WO2017095967A2 (en) 2017-06-08
AU2016362282B2 (en) 2023-03-16
EP3384055A4 (en) 2019-04-17
JP2022160426A (ja) 2022-10-19
EA201891317A3 (ru) 2019-04-30
KR20180081618A (ko) 2018-07-16
AU2016362282A1 (en) 2018-05-10

Similar Documents

Publication Publication Date Title
CN108779466A (zh) 用于通过基因编辑修正人肌营养不良蛋白基因的治疗靶标和使用方法
JP2024023294A (ja) 遺伝子編集のためのcpf1関連方法及び組成物
CN109996880A (zh) 基于模块化aav递送***的crispr-cas基因组工程
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
KR20230057487A (ko) 게놈 조정을 위한 방법 및 조성물
CN105658805A (zh) Rna指导的基因编辑和基因调节
CN108351350A (zh) 使用rna指导型内切核酸酶改善基因组工程特异性的组合物和方法
JP2019522461A (ja) デュシェンヌ型筋ジストロフィーを治療するためのcrispr/cas関連の方法および組成物
CN107532177A (zh) 腺相关病毒变体及其使用方法
WO2018112415A1 (en) ENHANCED hAT FAMILY TRANSPOSON-MEDIATED GENE TRANSFER AND ASSOCIATED COMPOSITIONS, SYSTEMS, AND METHODS
KR20230053735A (ko) 게놈의 조정을 위한 개선된 방법 및 조성물
WO2019152519A1 (en) Systems and methods for modulating chromosomal rearrangements
CN109069668A (zh) 用于眼病的基因疗法
CN113785063A (zh) 用于治疗杜氏肌营养不良症的aav载体介导的大规模突变热点缺失
KR20210049131A (ko) 재조합 인간 II형 미토콘드리아 다이네인-유사 GTPase의 유전자 서열 및 이의 용도
CN109385421A (zh) 基因敲除方法
WO2017165688A1 (en) Compositions and methods for genetically modifying myosin phosphatase target subunit (mypt1) gene for lowering blood pressure
Muzaffar et al. History of biotechnology
CN112813063A (zh) 脂代谢紊乱动物模型构建以及利用aav-crispr/cas9的修复
WO2023184107A1 (en) Crispr-cas13 system for treating mecp2-associated diseases
Žideková Translation potential of current preclinical techniques for gene therapy of neurological diseases in clinic. A critical review.
CN118147141A (zh) 用于通过基因编辑修正人肌营养不良蛋白基因的治疗靶标和使用方法
US20240175007A1 (en) Compositions for and methods of improving directed evolution of biomolecules
RU2782356C2 (ru) Способы и композиции для оценки опосредованного crispr/cas разрушения или вырезания и индуцированной crispr/cas рекомбинации с экзогенной донорской нуклеиновой кислотой in vivo
Pakalniškytė Novel CD64-DTR mouse model generation using CRISPR-Cas9 technology and functional characterization of renal dendritic cells

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant