CN114829602A - 拟杆菌属中的基因组编辑 - Google Patents

拟杆菌属中的基因组编辑 Download PDF

Info

Publication number
CN114829602A
CN114829602A CN202080087712.5A CN202080087712A CN114829602A CN 114829602 A CN114829602 A CN 114829602A CN 202080087712 A CN202080087712 A CN 202080087712A CN 114829602 A CN114829602 A CN 114829602A
Authority
CN
China
Prior art keywords
crispr
protein
bacteroides
nucleobase
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080087712.5A
Other languages
English (en)
Inventor
E·伊斯特伦德
Z·张
G·D·戴维斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sigma Aldrich Co LLC
Original Assignee
Sigma Aldrich Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sigma Aldrich Co LLC filed Critical Sigma Aldrich Co LLC
Publication of CN114829602A publication Critical patent/CN114829602A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/16Aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文提供了用于拟杆菌属(Bacteroides)物种的基因组编辑的组合物和方法。RNA引导的核碱基修饰***被改造为靶向靶细菌细胞的染色体DNA中的特定基因座,其中可以修饰靶细菌细胞的基因组。

Description

拟杆菌属中的基因组编辑
相关申请的交叉引用
本申请要求于2019年12月17日提交的美国临时申请号62/949,314的优先权利益,所述美国临时申请的整体内容通过引用并入本文。
序列表
本申请包含序列表,所述序列表已经由EFS-Web以ASCII格式提交,并且在此通过引用以其整体并入。于2020年12月17日创建的ASCII副本命名为P19-235_WO-PCT_SL.txt,且大小为38,913字节。
技术领域
本公开内容涉及用于拟杆菌属中的基因组编辑的组合物和方法。
背景技术
控制特异性修饰微生物基因组中的DNA序列的能力是医学和生物技术研究的重要方面。最近的进展指示RNA引导的***可以设计为靶向微生物基因组中的特定DNA序列,然而,各种微生物基因组中存在的独特DNA修复状态和分子表观遗传结构产生了关于特定基因组编辑技术的有效性的不确定性。在此处,我们描述了对于修饰拟杆菌属物种的基因组有效的组合物和方法。
附图说明
专利或申请文件含有至少一幅彩色绘图。本专利或专利申请公开的带有彩色附图的副本将在请求和支付必要费用后由专利局提供。
专利或申请文件含有至少一幅彩色绘图。本专利或专利申请公开的带有彩色附图的副本将在请求和支付必要费用后由专利局提供。
图1呈现了用于CRISPR碱基编辑(dSpCas9-CDA/sgRNA)的示意性模型。dSpCas9-CDA/sgRNA复合物与双链DNA结合,以sgRNA和PAM依赖性方式形成R环。CDA催化定位于PAM上游15-20个碱基内的底部(非互补)链处的胞嘧啶的脱氨,其导致C至T诱变。
图2呈现了靶向多形拟杆菌中的tdk (BT_2275)的CRISPR碱基编辑器整合质粒[pNBU2.CRISPR-CDA]的示意图。
图3A显示了通过dSpCas9-CDA编辑的tdk_Bt突变体的序列比对。显示了通过tdk_Bt sgRNA (N20)靶向的基因组基因座和位点,伴随PAM。tdk_Bt的编码序列显示于顶部,从ATG起始密码子开始。从aTc100琼脂平板中随机挑选的8个菌落中发现的突变位点显示于底部。突变的碱基(在距离PAM的位置-17处的C至T)导致在tdk_Bt编码序列的位置28处的终止密码子。图3A按出现次序分别公开了SEQ ID NO 10-13。
图3B呈现了通过dSpCas9-CDA编辑的susC_Bt突变体的序列比对。显示了通过susC_Bt sgRNA (N20)靶向的基因组基因座和位点,伴随PAM。susC_Bt的编码序列显示于顶部。从aTc100琼脂平板中随机挑选的8个菌落中发现的突变位点显示于底部。突变的碱基(在距离PAM的位置-17和-19处的C至T)导致在susC_Bt编码序列的位置491和493处的氨基酸取代和终止密码子。图3B按出现次序分别公开了SEQ ID NO 14-17。
图4呈现了CRISPR碱基编辑器稳定维持的质粒(pmobA.repA.CRISPR-CDA.NT)的示意图,所述质粒具有并不靶向多形拟杆菌VPI-5482基因组的非靶向的引导RNA乱序核苷酸序列。
图5A显示了25 µg/ml红霉素(Em)和200 µg/ml庆大霉素(Gm)脑心浸液(BHI)血琼脂平板,所述平板用100 µl来自重构的1 ml需氧大肠杆菌/多形拟杆菌VPI-5482接合浆料(conjugation slurry)的1:10稀释物铺平板。这些重构的接合浆料来自非选择BHI血琼脂平板。平板从左到右显示了非靶向样品、BT_0362样品和BT_0364样品。
图5B显示了在25 µg/ml Em、200 µg/ml Gm和100 ng/ml脱水四环素(aTc)选择和诱导的BHI血琼脂平板上的无菌环生长划线。来自图5A中所示的每块平板的各个菌落在5ml选择和诱导TYG液体培养基中生长,所述TYG液体培养基补充有25 µg/ml Em、200 µg/mlGm和100 ng/ml aTc。无菌环样品取自这些选择和诱导TYG液体培养基培养物。平板从左到右显示了非靶向样品、BT_0362样品和BT_0364样品。
图6A示出了使用MilliporeSigma内部开发的称为“SangerTrace”的软件的定量突变分析。该分析软件基于Applied Biosystem’s,Inc.格式(ABI)文件提取每个碱基信号峰值,并且通过比较“对照”和“样品”桑格测序数据来计算突变百分比。顶部的桑格迹线是非靶向样品,其中引导RNA序列是加下划线的。红色箭头显示了相对于PAM的碱基-17,其为胞嘧啶脱氨的定位,所述胞嘧啶脱氨导致C至T诱变和截断BT_0362编码序列的终止密码子的引入。中间的桑格轨迹显示了BT_0362编辑的样品,并且下图显示了C至T突变频率。图6A按出现次序分别公开了SEQ ID NO 18-20。
图6B示出了使用MilliporeSigma内部开发的称为“SangerTrace”的软件的定量突变分析。该分析软件基于Applied Biosystem’s,Inc.格式(ABI)文件提取每个碱基信号峰值,并且通过比较“对照”和“样品”桑格测序数据来计算突变百分比。顶部的桑格迹线是非靶向样品,其中引导RNA序列是加下划线的。红色箭头显示了相对于PAM的碱基-18、-19和-20,其为胞嘧啶脱氨的定位,所述胞嘧啶脱氨导致C至T诱变和截断BT_0364编码序列的终止密码子的引入。中间的桑格轨迹显示了BT_0364编辑的样品,并且下图显示了C至T突变频率。图6B按出现次序分别公开了SEQ ID NO 21-23。
具体实施方式
本公开内容提供了可以用于修饰特定DNA序列的改造的RNA引导的基因组修饰***。特别地,RNA引导的基因组修饰***被改造为靶向细菌界的靶向成员的染色体DNA中的特定基因座,特别是拟杆菌门(Bacteroidetes)的属于拟杆菌属的成员,包括定居于宿主动物物种(包括但不限于智人(H. sapiens))的一个或多个身体栖息地中的那些成员,导致基因组DNA序列的修饰(例如,敲除、敲入)。
(I) 蛋白质-核酸复合物
本公开内容的一个方面提供了蛋白质-核酸复合物,其包含与靶细菌物种(或该物种的菌株水平变种)的染色体缔合的改造的RNA引导的核碱基修饰***,其中所述改造的RNA引导的核碱基修饰***靶向生物体的染色体中的特定基因座,并且所述生物体的染色体编码HU家族DNA结合蛋白,其包含与SEQ ID NO: 1: (MNKADLISAVAAEAGLSKVDAKKAVEAFVSTVTKALQEGDKVSLIGFGTFSVAERSARTGINPSTKATITIPAKKVTKFKPGAELADAIK)的氨基酸序列具有至少50%序列同一性(例如,至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%序列同一性)的氨基酸序列,并且所述物种/菌株的染色体与HU家族DNA结合蛋白缔合,所述HU家族DNA结合蛋白与SEQ ID NO: 1的氨基酸序列具有至少50%的序列同一性(例如,至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%的序列同一性)。
在各个实施方案中,RNA引导的核碱基修饰***包括(i)包含CRISPR蛋白和引导RNA (gRNA)的成簇规律间隔短回文重复(CRISPR)***、以及(ii)核碱基修饰酶或催化其结构域,其中所述CRISPR蛋白是核酸酶缺陷型CRISPR变体(例如,死亡的CRISPR)或CRISPR切口酶。CRISPR***的gRNA被改造为指导RNA引导的核碱基修饰***与细菌物种/菌株的染色体中的特定基因座的结合。因为在一些实施方案中,CRISPR蛋白是核酸酶缺陷型CRISPR变体或CRISPR切口酶,所以可以修饰细菌染色体的特定基因座中的一个或多个核碱基,而不在生物体的染色体中生成可以是致命的双链断裂。细菌生物体表达与细菌染色体DNA缔合的HU家族蛋白。因此,本文公开的蛋白质-核酸复合物包含与DNA/蛋白质复合物(细菌染色体DNA和相关的HU家族蛋白)结合的核糖核蛋白复合物(gRNA/CRISPR蛋白/核碱基修饰酶)。
(a)改造的RNA引导的核碱基修饰***
本文公开的蛋白质-核酸复合物通常包含改造的RNA引导的核碱基修饰***,其包括(i)包含CRISPR蛋白和引导RNA (gRNA)的CRISPR***,其中所述CRISPR蛋白是核酸酶缺陷型CRISPR变体或CRISPR切口酶,以及(ii)核碱基修饰酶或其催化结构域。
(i) CRISPR***
RNA引导的CRISPR***是细菌和古细菌中天然存在的防御机制,其已重新用作RNA引导的DNA靶向平台,其用于许多细胞类型中的基因编辑。参见例如,Chen等人的国际公开号WO 2014/089190 (在此通过引用以其整体并入本文)。如下文详述的,与CRISPR蛋白相互作用的引导RNA可以进行改造,以与目的核酸中的特定序列碱基配对,从而将CRISPR蛋白靶向目的核酸中的特定序列。
本文公开的RNA引导的核碱基修饰***的CRISPR***可以衍生自I型CRISPR***、II型CRISPR***、III型CRISPR***、IV型CRISPR***、V型CRISPR***或VI型CRISPR***。在具体实施方案中,CRISPR核酸酶可以来自单亚基效应***,例如II型、V型或VI型***。在各个实施方案中,CRISPR蛋白可以衍生自II型Cas9蛋白、V型Cas12 (以前称为Cpf1)蛋白、VI型Cas13 (以前称为C2cd)蛋白、CasX蛋白或CasY蛋白。在一个特定实施方案中,CRISPR核酸酶衍生自II型Cas9蛋白。在另一个特定实施方案中,CRISPR核酸酶衍生自V型Cas12蛋白。
CRISPR蛋白可以衍生自单细胞蓝藻菌属物种(Acaryochloris spp.)、醋卤菌属物种(Acetohalobium spp.)、氨基酸球菌属(Acidaminococcus spp.)、酸硫杆菌属物种(Acidithiobacillus spp.)、热酸菌属物种(Acidothermus spp.)、艾克曼氏菌属物种(Akkermansia spp.)、脂环酸芽孢杆菌属物种(Alicyclobacillus spp.)、异色菌属物种(Allochromatium spp.)、制氨菌属物种(Ammonifex spp.)、鱼腥藻属物种(Anabaena spp.)、节旋藻属物种(Arthrospira spp.)、芽孢杆菌属物种(Bacillus spp.)、双歧杆菌属物种(Bifidobacterium spp.)、伯克氏菌目物种(Burkholderiales spp.)、热解纤维素菌属物种(Caldicelulosiruptor spp.)、弯曲杆菌属物种(Campylobacter spp.)、韧皮杆菌属物种(Candidatus spp.)、梭菌属物种(Clostridium spp.)、棒状杆菌属物种(Corynebacterium spp.)、鳄球藻属物种(Crocosphaera spp.)、蓝杆藻属物种(Cyanothece spp.)、δ变形杆菌属物种(Deltaproteobacterium spp.)、微小杆菌属物种(Exiguobacterium spp.)、大芬戈尔德菌属物种(Finegoldia spp.)、弗朗西斯氏菌属物种(Francisella spp.)、纤线杆菌属物种(Ktedonobacter spp.)、毛螺菌科物种(Lachnospiraceae spp.)、乳杆菌属物种(Lactobacillus spp.)、纤毛菌属物种(Leptotrichia spp.)、鞘丝藻属物种(Lyngbya spp.)、海杆菌属物种(Marinobacter spp.)、甲烷盐菌属物种(Methanohalobium spp.)、微颤菌属物种(Microscilla spp.)、微鞘藻属物种(Microcoleus spp.)、微囊藻属物种(Microcystis spp.)、支原体属物种(Mycoplasma spp.)、盐碱厌氧菌属物种(Natranaerobius spp.)、奈瑟球菌属物种(Neisseria spp.)、硝酸盐裂解菌属物种(Nitratifractor spp.)、亚硝化球菌属物种(Nitrosococcus spp.)、拟诺卡氏菌属物种(Nocardiopsis spp.)、节球藻属物种(Nodularia spp.)、念珠藻属物种(Nostoc spp.)、酒球菌属物种(Oenococcus spp.)、颤藻属物种(Oscillatoria spp.)、副萨特氏菌属物种(Parasutterella spp.)、Pelotomaculum属物种(Pelotomaculum spp.)、热袍菌属物种(Petrotoga spp.)、浮霉菌属物种(Planctomyces spp.)、极地单胞菌属物种(Polaromonas spp.)、普雷沃菌属物种(Prevotella spp.)、假交替单胞菌属物种(Pseudoalteromonas spp.)、雷尔氏菌属物种(Ralstonia spp.)、瘤胃球菌属物种(Ruminococcus spp.)、葡萄球菌属物种(Staphylococcus spp.)、链球菌属物种(Streptococcus spp.)、链霉菌属物种(Streptomyces spp.)、链孢囊菌属物种(Streptosporangium spp.)、聚球藻属物种(Synechococcus spp.)、栖热腔菌属物种(Thermosipho spp.)、疣微菌门物种(Verrucomicrobia spp.)或沃林氏菌属物种(Wolinella spp.)、和/或在基因组数据库的生物信息学调查中描绘的物种,所述基因组数据库例如在以下中公开的那些:Makarova,Kira S.等人"An updated evolutionary classification of CRISPR–Cas systems."Nature Reviews Microbiology 13.11 (2015): 722,以及Koonin,Eugene V.,Kira S.Makarova和Feng Zhang. "Diversity,classification and evolution of CRISPR-Cassystems." Current opinion in microbiology 37 (2017): 67-78,所述参考文献各自在此通过引用以其整体并入本文。
在一些方面,CRISPR蛋白可以衍生自化脓性链球菌(Streptococcus pyogenes)Cas9、新泽西弗朗西斯菌(Francisella novicida) Cas9、金黄色葡萄球菌(Staphylococcus aureus) Cas9、嗜热链球菌(Streptococcus thermophilus) Cas9、巴氏链球菌(Streptococcus pasteurianus) Cas9、空肠弯曲杆菌(Campylobacter jejuni)Cas9、脑膜炎奈瑟球菌(Neisseria meningitis) Cas9、灰色奈瑟球菌(Neisseria cinerea) Cas9、新泽西弗朗西斯菌Cas12a、氨基酸球菌属物种Cas12a、毛螺菌科细菌(Lachnospiraceae bacterium) ND2006 Cas12a、瓦氏纤毛菌(Leptotrichia wadeii)Cas13a、沙氏纤毛菌(Leptotrichia shahii) Cas13a、普雷沃菌属物种P5-125 Cas13、生黄瘤胃球菌(Ruminococcus flavefaciens) Cas13d、δ变形杆菌属CasX、浮霉菌属CasX或韧皮杆菌属CasY。
在一些实施方案中,本文公开的RNA引导的核碱基修饰***的CRISPR蛋白可以是核酸酶缺陷型CRISPR变体,其已修饰为缺乏所有核酸酶活性。野生型CRISPR核酸酶一般包含两个核酸酶结构域,例如,Cas9核酸酶包含RuvC和HNH结构域,其各自切割双链序列的一条链。RuvC核酸酶结构域和HNH核酸酶结构域中的一种或多种突变可以消除所有核酸酶活性。例如,核酸酶缺陷型CRISPR变体可以包含RuvC结构域中的突变如D10A、D8A、E762A和/或D986A,以及HNH结构域中的突变如H840A、H559A、N854A、N856A和/或N863A (参考化脓性链球菌Cas9,SpyCas9的编号***。核酸酶缺陷型Cas12变体可以包含在两个核酸酶结构域中的可比较突变。在一些实施方案中,核酸酶缺陷型CRISPR变体可以是具有D10A和H840A突变的死亡Cas9 (dCas9)变体。
在其它实施方案中,本文公开的RNA引导的核碱基修饰***的CRISPR蛋白可以是CRISPR切口酶,其切割双链序列的一条链。可以经由CRISPR核酸酶的核酸酶结构域之一的失活来改造切口酶。例如,Cas9蛋白的RuvC结构域或HNH结构域可以通过如上所述的一种或多种突变进行失活,以生成Cas9切口酶(例如,nCas9)。其它CRISPR核酸酶中的可比较突变可以生成其它CRISPR切口酶(例如,nCas12)。
另外,CRISPR蛋白可以进行修饰,以具有改善的靶向特异性、改善的保真度、改变的PAM特异性和/或增加的稳定性。例如,CRISPR蛋白可以进行修饰,以包含一种或多种突变(即,至少一个氨基酸的取代、缺失和/或***)。改善靶向特异性、改善保真度和/或减少脱靶效应的突变的非限制性实例包括N497A、R661A、Q695A、K810A、K848A、K855A、Q926A、K1003A、R1060A和/或D1135E (参考SpyCas9的编号***)。
CRISPR***还包含引导RNA。引导RNA与CRISPR蛋白和目的核酸中的靶序列相互作用,并且将CRISPR蛋白引导至靶序列。靶序列没有序列限制,除了序列与前间隔序列邻近基序(PAM)序列相邻之外。不同的CRISPR蛋白识别不同的PAM序列。例如,Cas9蛋白的PAM序列包括5'-NGG、5'-NGGNG、5'-NNAGAAW、5'-NNNNGATT、5-NNNNRYAC、5’-NNNNCAAA、5’-NGAAA、5’-NNAAT、5’-NNNRTA、5’-NNGG、5’-NNNRTA、5’-MMACCA、5’-NNNNGRY、5’-NRGNK、5’-GGGRG、5’-NNAMMMC和5’-NNG,并且Cas12a蛋白的PAM序列包括5'-TTN和5'-TTTV,其中N定义为任何核苷酸,R定义为G或A,W定义为A或T,Y定义为C或T,而V定义为A、C或G。一般而言,Cas9 PAM定位于靶序列的3',而Cas12a PAM定位于靶序列的5'。各种PAM序列和识别其的CRISPR蛋白是本领域已知的,例如,美国专利申请公开2019/0249200;Leenay,Ryan T.等人"Identifying and visualizing functional PAM diversity across CRISPR-Cassystems." Molecular cell 62.1 (2016): 137-147;以及Kleinstiver,Benjamin P.等人"Engineered CRISPR-Cas9 nucleases with altered PAM specificities." Nature523.7561 (2015): 481,所述参考文献各自通过引用以其整体并入本文。
引导RNA被改造为与特定的CRISPR蛋白复合。一般而言,引导RNA包含(i) CRISPRRNA (crRNA),其包含在5'端处的在靶位点处杂交的引导或间隔区序列,以及(ii)与crRNA和CRISPR蛋白相互作用的反式作用crRNA (tracrRNA)序列。每种引导RNA的引导或间隔区序列是不同的(即,是序列特异性的)。引导RNA序列的剩余部分在设计为与特定CRISPR蛋白复合的引导RNA中一般是相同的。
crRNA包含在5'端处的引导序列,以及在3'端处的另外序列,其与在tracrRNA的5'端处的序列碱基配对以形成双链体结构,并且tracrRNA包含形成与CRISPR核酸酶相互作用的至少一个茎环结构的另外序列。引导RNA可以是单分子(例如,单引导RNA (sgRNA)或1片sgRNA),其中所述crRNA序列与tracrRNA序列连接。可替代地,引导RNA可以是双分子gRNA,其包含分开的分子,即crRNA和tracrRNA。
crRNA引导序列被设计为与目的核酸中的靶序列(即前间隔序列)的互补体杂交。“靶核酸”为双链分子;一条链包含靶序列,并且被称为“PAM链”,而另一条互补链被称为“非PAM链”。本领域技术人员认识到gRNA间隔区序列与定位于靶核酸的非PAM链中的靶序列的反向互补体杂交。一般而言,引导序列和靶序列之间的序列同一性为至少80%、至少85%、至少90%、至少95%或至少99%。在具体实施方案中,互补性是完全的(即,100%)。在各个实施方案中,crRNA引导序列的长度范围可以为约15个核苷酸至约25个核苷酸。例如,crRNA引导序列的长度可以为约15、16、17、18、19、20、21、22、23、24或25个核苷酸。在具体实施方案中,引导的长度是约19、20或21个核苷酸。在一个实施方案中,crRNA引导序列具有20个核苷酸的长度。在某些实施方案中,crRNA可以包含与tracrRNA相互作用的另外的3'序列。另外序列可以包含约10至约40个核苷酸。在其中引导RNA包含单个分子的实施方案中,gRNA的crRNA和tracrRNA部分可以通过形成环的序列连接。形成环的序列的长度范围可以为约4个核苷酸至约10个或更多个核苷酸。
如上文提到的,tracrRNA包含形成至少一个茎环结构的重复序列,其与CRISPR核酸酶相互作用。每个环和茎的长度可以变化。例如,环的长度范围可以为约3至约10个核苷酸,而茎的长度范围可以为约6至约20个碱基对。茎可以包含1至约10个核苷酸的一个或多个凸起。引导RNA中的tracrRNA序列一般基于与野生型CRISPR核酸酶相互作用的野生型tracrRNA的序列。野生型序列可以进行修饰,以促进二级结构形成、增加二级结构稳定性等等。例如,可以将一种或多种核苷酸变化引入引导RNA序列内。tracrRNA序列的长度范围可以为约50个核苷酸至约300个核苷酸。在各个实施方案中,tracrRNA的长度范围可以为约50至约90个核苷酸、约90至约110个核苷酸、约110至约130个核苷酸、约130至约150个核苷酸、约150至约170个核苷酸,约170至约200个核苷酸、约200至约250个核苷酸或约250至约300个核苷酸。tracrRNA可以包含在tracrRNA的3'端处的任选延伸。
引导RNA可以包含标准核糖核苷酸和/或修饰的核糖核苷酸。在一些实施方案中,引导RNA可以包含标准或修饰的脱氧核糖核苷酸。在其中酶促合成(即,在体内或体外)引导RNA的实施方案中,引导RNA一般包含标准核糖核苷酸。在其中化学合成引导RNA的实施方案中,引导RNA可以包含标准或修饰的核糖核苷酸和/或脱氧核糖核苷酸。修饰的核糖核苷酸和/或脱氧核糖核苷酸包括碱基修饰(例如假尿苷、2-硫代尿苷、N6-甲基腺苷等等)和/或糖修饰(例如2'-O-甲基、2'-氟、2'-氨基、锁核酸(LNA)等等)。引导RNA的骨架也可以进行修饰,以包含硫代磷酸酯键合、硼烷磷酸酯键合或肽核酸。
任选的适体序列。在一些情形下,CRISPR蛋白或引导RNA的tracrRNA可以进一步包含一种或多种适体序列(Konermann等人,Nature,2015,517(7536):583-588;Zalatan等人,Cell,2015,160(1-2):339-50)。适体序列可以是核酸(例如,RNA)或肽。适体序列可以被特定的衔接蛋白识别并结合。合适的适体序列的非限制性实例包括MS2/MSP、PP7/PCP、Com、N22、AP205、BZ13、F1、F2、fd、fr、GA、ID2、JP34、JP500、JP501、KU1、M11、M12、MX1、NL95、PRR1、ϕCb5、ϕCb8r、ϕCb12r、ϕCb23r、Qβ、R17、SP、TW18、TW19、VK和7s。本领域技术人员应了解适体序列的长度可以变化。适体序列可以经由共价键直接连接至CRISPR蛋白或tracrRNA。可替代地,适体序列可以经由接头间接连接至CRISPR蛋白或tracrRNA。
接头是经由至少一个共价键连接一个或多个其它化学基团的化学基团。合适的接头包括氨基酸、肽、核苷酸、核酸、有机接头分子(例如,马来酰亚胺衍生物、N-乙氧基苄基咪唑、联苯-3,4',5-三羧酸、对氨基苄氧羰基等等)、二硫键接头和聚合物接头(例如,PEG)。接头可以包括一个或多个间隔基团,包括但不限于亚烷基、亚烯基、亚炔基、烷基、烯基、炔基、烷氧基、芳基、杂芳基、芳烷基、芳烯基、芳炔基等等。接头可以是中性的,或者携带正电荷或负电荷。在一些实施方案中,接头可以是肽接头。肽接头可以是柔性氨基酸接头(例如,包含小的、非极性或极性氨基酸)。可替代地,肽接头可以是刚性氨基酸接头(例如,α-螺旋)。肽接头的长度可以从约四个氨基酸直到一百个或更多个氨基酸不等。例如,合适的接头可以包含10-20个氨基酸、20-40个氨基酸、40-80个氨基酸或80-120个氨基酸。合适接头的实例是本领域众所周知的,并且设计接头的程序是容易获得的(Crasto等人,Protein Eng.,2000,13 (5):309-312)。
(ii) 核碱基修饰酶
本文公开的改造的RNA引导的(CRISPR)核碱基修饰***还包含核碱基修饰酶或其催化结构域。
各种核碱基修饰酶适用于本文公开的***。核碱基修饰酶可以是DNA碱基编辑器。在一些实施方案中,DNA碱基编辑器可以是胞苷脱氨酶,其将胞苷转换成尿苷,所述尿苷被聚合酶读取为胸腺嘧啶。胞苷脱氨酶的非限制性实例包括胞苷脱氨酶1 (CDA1)、胞苷脱氨酶2 (CDA2)、活化诱导胞苷脱氨酶(AICDA)、载脂蛋白B mRNA编辑复合物(APOBEC)家族胞苷脱氨酶(例如,APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D/E、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4)、APOBEC1互补因子/APOBEC1刺激因子(ACF1/ASF)胞苷脱氨酶、作用于RNA的胞嘧啶脱氨酶(CDAR)、细菌长同种型胞苷脱氨酶(CDDL)和作用于tRNA的胞嘧啶脱氨酶(CDAT)。在其它实施方案中,DNA碱基编辑器可以是腺苷脱氨酶,其将腺苷转化为肌苷,所述肌苷被聚合酶读取为鸟苷。腺苷脱氨酶的非限制性实例包括tRNA腺嘌呤脱氨酶、腺苷脱氨酶、作用于RNA的腺苷脱氨酶(ADAR)和作用于tRNA的腺苷脱氨酶(ADAT)。
核碱基修饰酶(碱基编辑器)可以是野生型或其片段、其修饰形式(例如,可以缺失非必需结构域)或其改造的形式。核碱基修饰酶(碱基编辑器)可以具有真核、细菌或古细菌起源。
在一些实施方案中,核碱基修饰酶(碱基编辑器)可以是胞苷脱氨酶或其催化结构域。胞苷脱氨酶可以具有人、小鼠、七鳃鳗、鲍鱼或大肠杆菌起源。在其中核碱基修饰酶是胞苷脱氨酶的实施方案中,RNA引导的核碱基修饰***可以进一步包含至少一种尿嘧啶糖基化酶抑制剂(UGI)结构域。通过UGI抑制了从DNA中去除尿嘧啶,这是胞嘧啶脱氨基作用的结果。合适的UGI结构域是本领域已知的。
在一些实施方案中,如果这些组分是过表达的,则采用胞苷脱氨酶和UGI的***可能具有负面效应。为了防止过表达,可以添加降解标签。降解标签发出蛋白质待被蛋白质回收***降解的信号。这些降解标签导致不同的蛋白质半衰期。非限制性降解标签的实例是LVA、AAV、ASV和LAA。
任选的衔接蛋白。在一些实施方案中,核碱基修饰酶或其催化结构域可以连接至识别并结合适体序列的衔接蛋白。在一些实施方案中,衔接蛋白可以是识别并结合MCP适体序列的MS2细菌噬菌体外壳蛋白、或识别并结合PCP适体序列的PP7细菌噬菌体外壳蛋白。在其它实施方案中,衔接蛋白可以识别并结合Com、N22、AP205、BZ13、F1、F2、fd、fr、GA、ID2、JP34、JP500、JP501、KU1、M11、M12、MX1、NL95、PRR1、ϕCb5、ϕCb8r、ϕCb12r、ϕCb23r、Qβ、R17、SP、TW18、TW19、VK或7s衔接序列。
核碱基修饰酶或其催化结构域与衔接蛋白之间的键合可以是经由共价键直接的。可替代地,核碱基修饰酶或其催化结构域与衔接蛋白之间的键合可以是经由接头间接的。接头在上文部分(I) (a) (i)中进行描述。衔接蛋白可以连接至核碱基修饰酶或其催化结构域的氨基末端和/或羧基末端。
(iii) CRISPR***与核碱基修饰酶之间的相互作用
本文公开的改造的RNA引导的核碱基修饰***包含(i)不具有核酸酶活性或具有切口酶活性的CRISPR***(在上文部分(I) (a) (i)中描述),以及(ii)核碱基修饰酶(碱基编辑器)或其催化结构域(在上文部分(I) (a) (ii)中描述)。CRISPR***和核碱基修饰酶或其催化结构域可以以各种方式相互作用。
在一些实施方案中,CRISPR***的CRISPR蛋白可以连接至核碱基修饰酶或其催化结构域。在一些方面,CRISPR蛋白和核碱基修饰酶或其催化结构域之间的键合可以是经由共价键(例如肽键)直接的。在其它方面,CRISPR蛋白和核碱基修饰酶或其催化结构域之间的键合可以是经由接头。接头在上文部分(I) (a) (i)中进行描述。核碱基修饰酶或其催化结构域可以连接至CRISPR蛋白的氨基末端和/或羧基末端。
在其它实施方案中,核碱基修饰酶或其催化结构域可以连接至衔接蛋白(在上文部分(I) (a) (ii)中描述),并且CRISPR蛋白或gRNA可以包含能够结合衔接蛋白的适体序列(在上文部分(I) (a) (i)中描述)。例如,核碱基修饰酶(例如胞苷/腺苷脱氨酶)可以连接至MS2细菌噬菌体外壳蛋白,并且CRISPR***的gRNA可以包含形成茎环结构的MCP适体序列,其中所述MS2蛋白可以结合MSP适体序列,从而形成CRISPR-胞苷/腺苷脱氨酶***。
(iv) 改造的RNA引导的核碱基修饰***的表达
CRISPR***的引导RNA被改造为将RNA引导的(CRISPR)核碱基修饰***靶向细菌染色体DNA中的特定基因座,使得可以形成如上所述的蛋白质-核酸复合物。一般而言,蛋白质-核酸复合物在细菌细胞内形成。
在一些实施方案中,改造的RNA引导的(CRISPR)核碱基修饰***可以由编码所述***的至少一种核酸表达,所述核酸整合到细菌物种或菌株的染色体内。在其它实施方案中,改造的RNA引导的(CRISPR)核碱基修饰***可以由编码所述***的至少一种核酸表达,所述核酸在至少一种染色体外载体上携带。用于将核酸引入细菌内的技术是本领域众所周知的,如用于将核酸整合到细菌染色体内的手段一样。
可以调控改造的RNA引导的(CRISPR)核碱基修饰***的表达。例如,改造的CRISPR核酸酶***的表达可以由诱导型启动子调控,如下文部分(II)中所述。
在一些实施方案中,改造的RNA引导的(CRISPR)核碱基修饰***可以形成为合并的引导RNA文库,以平行靶向许多基因组定位,使得能够产生拟杆菌属细胞群体,每个细胞具有不同的RNA引导的基因组修饰。然后可以将这些合并的细胞群体置于选择压力下,并且通过DNA测序分析选择的细胞。
(b) 细菌染色体
本文公开的蛋白质-核酸复合物进一步包含细菌染色体,其中所述细菌染色体编码HU家族DNA结合蛋白,其包含与SEQ ID NO: 1的氨基酸序列具有至少50%序列同一性(与SEQ ID NO: 1至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%的序列同一性)的氨基酸序列,并且所述细菌的染色体DNA与所述HU家族DNA结合蛋白缔合。DNA结合蛋白的HU家族包含小的(~ 90个氨基酸)碱性组蛋白样蛋白,其结合双链DNA而无序列特异性,并且结合DNA结构如叉、三/四向连接、切口、突出端和凸起。HU家族DNA结合蛋白的结合可以稳定DNA,并且保护其免于在极端环境条件下的变性。拟杆菌属HU家族DNA蛋白与染色体DNA的缔合产生了独特的结构环境,其它DNA结合蛋白例如CRISPR***的那些必须与所述结构环境相容,以便结合染色体靶并且充当核酸酶、切口酶、脱氨酶或其它基因组修饰模式。
一般而言,染色体(或其染色体区域)可以在拟杆菌门的任何成员内。在一些实施方案中,HU家族DNA结合蛋白包含与SEQ ID NO: 1具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%序列同一性的氨基酸序列。在其它实施方案中,HU家族DNA结合蛋白具有SEQ ID NO: 1的氨基酸序列。
在一些实施方案中,生物体是拟杆菌属的成员。拟杆菌属物种是哺乳动物肠道微生物群的占优势厌氧共生体。它们含有各种糖分解酶,并且是肠道中多糖的主要发酵剂。当保留在肠道中时,它们维持与宿主复杂且一般有益的关系,但如果它们逃离这个环境,则可以引起显著的病理状况。拟杆菌属物种的非限制性实例包括产酸拟杆菌(B. acidifaciens)、B. bacterium、巴恩斯氏拟杆菌(B. barnesiaes)、粪拟杆菌(B. caccae)、B. caecicolaB. caecigallinarum、多毛拟杆菌(B. capillosis)、解纤维素拟杆菌、溶纤维素拟杆菌(B. cellulosolvens)、B. clarus、凝固拟杆菌(B. coagulans)、粪居拟杆菌(B. coprocola)、B. coprophilus、猪粪拟杆菌(B. coprosuis)、吉氏拟杆菌(B. distasonis)、多氏拟杆菌(B. dorei)、埃氏拟杆菌(B. eggerthii)、B. gracilisB. faecichinchillaeB. faecis、芬氏拟杆菌(B. finegoldii)、B. fluxus、脆弱拟杆菌、半乳糖醛酸拟杆菌(B. galacturonicus)、B. gallinaceumB. gallinarum、金氏拟杆菌(B. goldsteinii)、B. graminisolvens、溃疡拟杆菌、解肝素拟杆菌(B. heparinolyticus)、肠拟杆菌(B. intestinalis)、B. johnsoniiB. luti、马赛拟杆菌(B. massiliensis)、产黑色素拟杆菌(B. melaninogenicus)、B. neonati、诺德氏拟杆菌(B. nordii)、B. oleiciplenus、口拟杆菌(B. oris)、卵形拟杆菌、B. paurosaccharolyticus、平常拟杆菌(B. plebeius)、B. polypragmatusB. propionicifaciens、腐败拟杆菌(B. putredinis)、化脓拟杆菌(B. pyogenes)、B. reticulotermitisB. rodentium、萨氏拟杆菌、B. salyersiaeB. sartoriiB. sediment、粪便拟杆菌(B. stercoris)、B. stercorirosoris、猪拟杆菌(B. suis)、隐蔽拟杆菌(B. tectus)、多形拟杆菌、B. timonensis、单形拟杆菌、普通拟杆菌、解木糖拟杆菌、解木聚糖拟杆菌(B. xylanolyticus)和B. zoogleoformans以及这些物种的菌株水平变种。例如,解纤维素拟杆菌的菌株水平变种包括但不限于解纤维素拟杆菌DSM 14838、解纤维素拟杆菌WH2、解纤维素拟杆菌CL02T12C19、解纤维素拟杆菌CRE21 (T)和解纤维素拟杆菌JCM 15632T。
在一些实施方案中,染色体(或其染色体区域)选自多形拟杆菌、普通拟杆菌、解纤维素拟杆菌、脆弱拟杆菌、溃疡拟杆菌、卵形拟杆菌、萨氏拟杆菌、单形拟杆菌或解木糖拟杆菌以及这些物种的菌株水平变种。
在一些实施方案中,染色体(或其染色体区域)选自巴恩斯氏菌属物种(Barnesiella sp.)、肠居巴恩斯氏菌(Barnesiella viscericola)、二氧化碳嗜纤维菌属物种(Capnocytphaga sp.)、内脏臭气杆菌(Odoribacter splanchnicus)、Paludibacter物种、副拟杆菌属物种(Parabacteroides sp.)、紫单胞菌科细菌(Porphyromonadaceae bacterium)和Schleiferia物种以及这些物种的菌株水平变种。
例如,染色体区域可以具有与质粒DNA或细菌人工染色体相关的长度(大约2,000至350,000个碱基的长度)、或与初级细菌染色体相关的长度(130,000个碱基至14,000,000个碱基的长度)。
因此,例如,染色体区域的长度可以是约2000、约3000、约4000、约5000、约6000、约7000、约8000、约9000、约10000、约11000、约12000、约13000、约14000、约15000、约16000、约17000、约18000、约19000、约20000、约21000、约22000、约23000、约24000、约25000、约26000、约27000、约28000、约29000、约30000、约31000、约32000、约33000、约34000、约35000、约36000、约37000、约38000、约39000、约40000、约41000、约42000、约43000、约44000、约45000、约46000、约47000、约48000、约49000、约50000、约51000、约52000、约53000、约54000、约55000、约56000、约57000、约58000、约59000、约60000、约61000、约62000、约63000、约64000、约65000、约66000、约67000、约68000、约69000、约70000、约71000、约72000、约73000、约74000、约75000、约76000、约77000、约78000、约79000、约80000、约81000、约82000、约83000、约84000、约85000、约86000、约87000、约88000、约89000、约90000、约91000、约92000、约93000、约94000、约95000、约96000、约97000、约98000、约99000、约100000、约101000、约102000、约103000、约104000、约105000、约106000、约107000、约108000、约109000、约110000、约111000、约112000、约113000、约114000、约115000、约116000、约117000、约118000、约119000、约120000、约121000、约122000、约123000、约124000、约125000、约126000、约127000、约128000、约129000、约130000、约131000、约132000、约133000、约134000、约135000、约136000、约137000、约138000、约139000、约140000、约141000、约142000、约143000、约144000、约145000、约146000、约147000、约148000、约149000、约150000、约151000、约152000、约153000、约154000、约155000、约156000、约157000、约158000、约159000、约160000、约161000、约162000、约163000、约164000、约165000、约166000、约167000、约168000、约169000、约170000、约171000、约172000、约173000、约174000、约175000、约176000、约177000、约178000、约179000、约180000、约181000、约182000、约183000、约184000、约185000、约186000、约187000、约188000、约189000、约190000、约191000、约192000、约193000、约194000、约195000、约196000、约197000、约198000、约199000、约200000、约201000、约202000、约203000、约204000、约205000、约206000、约207000、约208000、约209000、约210000、约211000、约212000、约213000、约214000、约215000、约216000、约217000、约218000、约219000、约220000、约221000、约222000、约223000、约224000、约225000、约226000、约227000、约228000、约229000、约230000、约231000、约232000、约233000、约234000、约235000、约236000、约237000、约238000、约239000、约240000、约241000、约242000、约243000、约244000、约245000、约246000、约247000、约248000、约249000、约250000、约251000、约252000、约253000、约254000、约255000、约256000、约257000、约258000、约259000、约260000、约261000、约262000、约263000、约264000、约265000、约266000、约267000、约268000、约269000、约270000、约271000、约272000、约273000、约274000、约275000、约276000、约277000、约278000、约279000、约280000、约281000、约282000、约283000、约284000、约285000、约286000、约287000、约288000、约289000、约290000、约291000、约292000、约293000、约294000、约295000、约296000、约297000、约298000、约299000、约300000、约301000、约302000、约303000、约304000、约305000、约306000、约307000、约308000、约309000、约310000、约311000、约312000、约313000、约314000、约315000、约316000、约317000、约318000、约319000、约320000、约321000、约322000、约323000、约324000、约325000、约326000、约327000、约328000、约329000、约330000、约331000、约332000、约333000、约334000、约335000、约336000、约337000、约338000、约339000、约340000、约341000、约342000、约343000、约344000、约345000、约346000、约347000、约348000、约349000、约350000、约351000、约352000、约353000、约354000、约355000、约356000、约357000、约358000、约359000、约360000、约361000、约362000、约363000、约364000、约365000、约366000、约367000、约368000、约369000、约370000、约371000、约372000、约373000、约374000、约375000、约376000、约377000、约378000、约379000、约380000、约381000、约382000、约383000、约384000、约385000、约386000、约387000、约388000、约389000、约390000、约391000、约392000、约393000、约394000、约395000、约396000、约397000、约398000、约399000、约400000、约401000、约402000、约403000、约404000、约405000、约406000、约407000、约408000、约409000、约410000、约411000、约412000、约413000、约414000、约415000、约416000、约417000、约418000、约419000、约420000、约421000、约422000、约423000、约424000、约425000、约426000、约427000、约428000、约429000、约430000、约431000、约432000、约433000、约434000、约435000、约436000、约437000、约438000、约439000、约440000、约441000、约442000、约443000、约444000、约445000、约446000、约447000、约448000、约449000、约450000、约451000、约452000、约453000、约454000、约455000、约456000、约457000、约458000、约459000、约460000、约461000、约462000、约463000、约464000、约465000、约466000、约467000、约468000、约469000、约470000、约471000、约472000、约473000、约474000、约475000、约476000、约477000、约478000、约479000、约480000、约481000、约482000、约483000、约484000、约485000、约486000、约487000、约488000、约489000、约490000、约491000、约492000、约493000、约494000、约495000、约496000、约497000、约498000、约499000、约500000、约501000、约502000、约503000、约504000、约505000、约506000、约507000、约508000、约509000、约510000、约511000、约512000、约513000、约514000、约515000、约516000、约517000、约518000、约519000、约520000、约521000、约522000、约523000、约524000、约525000、约526000、约527000、约528000、约529000、约530000、约531000、约532000、约533000、约534000、约535000、约536000、约537000、约538000、约539000、约540000、约541000、约542000、约543000、约544000、约545000、约546000、约547000、约548000、约549000、约550000、约551000、约552000、约553000、约554000、约555000、约556000、约557000、约558000、约559000、约560000、约561000、约562000、约563000、约564000、约565000、约566000、约567000、约568000、约569000、约570000、约571000、约572000、约573000、约574000、约575000、约576000、约577000、约578000、约579000、约580000、约581000、约582000、约583000、约584000、约585000、约586000、约587000、约588000、约589000、约590000、约591000、约592000、约593000、约594000、约595000、约596000、约597000、约598000、约599000、约600000、约601000、约602000、约603000、约604000、约605000、约606000、约607000、约608000、约609000、约610000、约611000、约612000、约613000、约614000、约615000、约616000、约617000、约618000、约619000、约620000、约621000、约622000、约623000、约624000、约625000、约626000、约627000、约628000、约629000、约630000、约631000、约632000、约633000、约634000、约635000、约636000、约637000、约638000、约639000、约640000、约641000、约642000、约643000、约644000、约645000、约646000、约647000、约648000、约649000、约650000、约651000、约652000、约653000、约654000、约655000、约656000、约657000、约658000、约659000、约660000、约661000、约662000、约663000、约664000、约665000、约666000、约667000、约668000、约669000、约670000、约671000、约672000、约673000、约674000、约675000、约676000、约677000、约678000、约679000、约680000、约681000、约682000、约683000、约684000、约685000、约686000、约687000、约688000、约689000、约690000、约691000、约692000、约693000、约694000、约695000、约696000、约697000、约698000、约699000、约700000、约701000、约702000、约703000、约704000、约705000、约706000、约707000、约708000、约709000、约710000、约711000、约712000、约713000、约714000、约715000、约716000、约717000、约718000、约719000、约720000、约721000、约722000、约723000、约724000、约725000、约726000、约727000、约728000、约729000、约730000、约731000、约732000、约733000、约734000、约735000、约736000、约737000、约738000、约739000、约740000、约741000、约742000、约743000、约744000、约745000、约746000、约747000、约748000、约749000、约750000、约751000、约752000、约753000、约754000、约755000、约756000、约757000、约758000、约759000、约760000、约761000、约762000、约763000、约764000、约765000、约766000、约767000、约768000、约769000、约770000、约771000、约772000、约773000、约774000、约775000、约776000、约777000、约778000、约779000、约780000、约781000、约782000、约783000、约784000、约785000、约786000、约787000、约788000、约789000、约790000、约791000、约792000、约793000、约794000、约795000、约796000、约797000、约798000、约799000、约800000、约801000、约802000、约803000、约804000、约805000、约806000、约807000、约808000、约809000、约810000、约811000、约812000、约813000、约814000、约815000、约816000、约817000、约818000、约819000、约820000、约821000、约822000、约823000、约824000、约825000、约826000、约827000、约828000、约829000、约830000、约831000、约832000、约833000、约834000、约835000、约836000、约837000、约838000、约839000、约840000、约841000、约842000、约843000、约844000、约845000、约846000、约847000、约848000、约849000、约850000、约851000、约852000、约853000、约854000、约855000、约856000、约857000、约858000、约859000、约860000、约861000、约862000、约863000、约864000、约865000、约866000、约867000、约868000、约869000、约870000、约871000、约872000、约873000、约874000、约875000、约876000、约877000、约878000、约879000、约880000、约881000、约882000、约883000、约884000、约885000、约886000、约887000、约888000、约889000、约890000、约891000、约892000、约893000、约894000、约895000、约896000、约897000、约898000、约899000、约900000、约901000、约902000、约903000、约904000、约905000、约906000、约907000、约908000、约909000、约910000、约911000、约912000、约913000、约914000、约915000、约916000、约917000、约918000、约919000、约920000、约921000、约922000、约923000、约924000、约925000、约926000、约927000、约928000、约929000、约930000、约931000、约932000、约933000、约934000、约935000、约936000、约937000、约938000、约939000、约940000、约941000、约942000、约943000、约944000、约945000、约946000、约947000、约948000、约949000、约950000、约951000、约952000、约953000、约954000、约955000、约956000、约957000、约958000、约959000、约960000、约961000、约962000、约963000、约964000、约965000、约966000、约967000、约968000、约969000、约970000、约971000、约972000、约973000、约974000、约975000、约976000、约977000、约978000、约979000、约980000、约981000、约982000、约983000、约984000、约985000、约986000、约987000、约988000、约989000、约990000、约991000、约992000、约993000、约994000、约995000、约996000、约997000、约998000、约999000、约1000000、约1001000、约1002000、约1003000、约1004000、约1005000、约1006000、约1007000、约1008000、约1009000、约1010000、约1011000、约1012000、约1013000、约1014000、约1015000、约1016000、约1017000、约1018000、约1019000、约1020000、约1021000、约1022000、约1023000、约1024000、约1025000、约1026000、约1027000、约1028000、约1029000、约1030000、约1031000、约1032000、约1033000、约1034000、约1035000、约1036000、约1037000、约1038000、约1039000、约1040000、约1041000、约1042000、约1043000、约1044000、约1045000、约1046000、约1047000、约1048000、约1049000、约1050000、约1051000、约1052000、约1053000、约1054000、约1055000、约1056000、约1057000、约1058000、约1059000、约1060000、约1061000、约1062000、约1063000、约1064000、约1065000、约1066000、约1067000、约1068000、约1069000、约1070000、约1071000、约1072000、约1073000、约1074000、约1075000、约1076000、约1077000、约1078000、约1079000、约1080000、约1081000、约1082000、约1083000、约1084000、约1085000、约1086000、约1087000、约1088000、约1089000、约1090000、约1091000、约1092000、约1093000、约1094000、约1095000、约1096000、约1097000、约1098000、约1099000、约1100000、约1101000、约1102000、约1103000、约1104000、约1105000、约1106000、约1107000、约1108000、约1109000、约1110000、约1111000、约1112000、约1113000、约1114000、约1115000、约1116000、约1117000、约1118000、约1119000、约1120000、约1121000、约1122000、约1123000、约1124000、约1125000、约1126000、约1127000、约1128000、约1129000、约1130000、约1131000、约1132000、约1133000、约1134000、约1135000、约1136000、约1137000、约1138000、约1139000、约1140000、约1141000、约1142000、约1143000、约1144000、约1145000、约1146000、约1147000、约1148000、约1149000、约1150000、约1151000、约1152000、约1153000、约1154000、约1155000、约1156000、约1157000、约1158000、约1159000、约1160000、约1161000、约1162000、约1163000、约1164000、约1165000、约1166000、约1167000、约1168000、约1169000、约1170000、约1171000、约1172000、约1173000、约1174000、约1175000、约1176000、约1177000、约1178000、约1179000、约1180000、约1181000、约1182000、约1183000、约1184000、约1185000、约1186000、约1187000、约1188000、约1189000、约1190000、约1191000、约1192000、约1193000、约1194000、约1195000、约1196000、约1197000、约1198000、约1199000、约1200000、约1201000、约1202000、约1203000、约1204000、约1205000、约1206000、约1207000、约1208000、约1209000、约1210000、约1211000、约1212000、约1213000、约1214000、约1215000、约1216000、约1217000、约1218000、约1219000、约1220000、约1221000、约1222000、约1223000、约1224000、约1225000、约1226000、约1227000、约1228000、约1229000、约1230000、约1231000、约1232000、约1233000、约1234000、约1235000、约1236000、约1237000、约1238000、约1239000、约1240000、约1241000、约1242000、约1243000、约1244000、约1245000、约1246000、约1247000、约1248000、约1249000、约1250000、约1251000、约1252000、约1253000、约1254000、约1255000、约1256000、约1257000、约1258000、约1259000、约1260000、约1261000、约1262000、约1263000、约1264000、约1265000、约1266000、约1267000、约1268000、约1269000、约1270000、约1271000、约1272000、约1273000、约1274000、约1275000、约1276000、约1277000、约1278000、约1279000、约1280000、约1281000、约1282000、约1283000、约1284000、约1285000、约1286000、约1287000、约1288000、约1289000、约1290000、约1291000、约1292000、约1293000、约1294000、约1295000、约1296000、约1297000、约1298000、约1299000、约1300000、约1301000、约1302000、约1303000、约1304000、约1305000、约1306000、约1307000、约1308000、约1309000、约1310000、约1311000、约1312000、约1313000、约1314000、约1315000、约1316000、约1317000、约1318000、约1319000、约1320000、约1321000、约1322000、约1323000、约1324000、约1325000、约1326000、约1327000、约1328000、约1329000、约1330000、约1331000、约1332000、约1333000、约1334000、约1335000、约1336000、约1337000、约1338000、约1339000、约1340000、约1341000、约1342000、约1343000、约1344000、约1345000、约1346000、约1347000、约1348000、约1349000、约1350000、约1351000、约1352000、约1353000、约1354000、约1355000、约1356000、约1357000、约1358000、约1359000、约1360000、约1361000、约1362000、约1363000、约1364000、约1365000、约1366000、约1367000、约1368000、约1369000、约1370000、约1371000、约1372000、约1373000、约1374000、约1375000、约1376000、约1377000、约1378000、约1379000、约1380000、约1381000、约1382000、约1383000、约1384000、约1385000、约1386000、约1387000、约1388000、约1389000、约1390000、约1391000、约1392000、约1393000、约1394000、约1395000、约1396000、约1397000、约1398000、约1399000或约1400000个碱基对。
(c)特定的蛋白质-核酸复合物
在具体实施方案中,蛋白质-核酸复合物可以包含改造的RNA引导的(CRISPR)核碱基修饰***,其包含(i)核酸酶缺陷型Cas9或Cas12a变体和(ii)碱基编辑器,例如与拟杆菌属染色体结合或缔合的胞苷脱氨酶或腺苷脱氨酶(或其催化结构域)。在一些实施方案中,改造的RNA引导的(CRISPR)核碱基修饰***包含与胞苷脱氨酶或腺苷脱氨酶(或其催化结构域)连接的核酸酶缺陷型Cas9或Cas12a变体。
(II) 用于生成蛋白质-核酸复合物的方法
本公开内容的一个进一步方面提供了用于生成如上文部分(I)中所述的复合物的方法,所述复合物包含改造的RNA引导的(CRISPR)核碱基修饰***和编码HU家族DNA结合蛋白的细菌染色体。所述方法包括(a)改造核碱基修饰***的CRISPR***,以靶向细菌染色体中的特定基因座,并且(b)将改造的RNA引导的(CRISPR)核碱基修饰***引入拟杆菌属物种/菌株内。
改造核碱基修饰***的CRISPR***包括设计引导RNA,其crRNA引导序列靶向细菌染色体中的特定(~19-22 nt)序列或基因座,所述特定序列或基因座与PAM序列(其由目的CRISPR蛋白识别)相邻,并且其tracrRNA序列由目的CRISPR蛋白识别,如上文部分(I) (a)(i)中所述。
可以将改造的CRISPR核碱基修饰***作为至少一种编码核酸引入细菌细胞内。例如,编码核酸可以是一种或多种载体的部分。编码改造的CRISPR核碱基修饰***(例如,CRISPR-碱基编辑器融合物和一种或多种gRNA)的载体可以是质粒载体、噬菌粒载体、病毒载体、细菌噬菌体载体、细菌噬菌体-质粒杂合载体或其它合适的载体。载体可以是整合载体、接合载体、穿梭载体、表达载体、染色体外载体等等。用于将各种载体递送或引入拟杆菌属内的手段是本领域众所周知的。
编码CRISPR-碱基编辑器融合物的核酸序列可以与启动子可操作地连接,用于在目的细菌中表达。在具体实施方案中,编码CRISPR-碱基编辑器融合物的序列可以与调控型启动子可操作地连接。在一些方面,调控型启动子可以由启动子诱导化学制品调控。在此类实施方案中,启动子可以是pTetO,其基于大肠杆菌Tn10衍生的tet调控***,并且由含有强tet操纵子(tetO)的分枝杆菌启动子和阻遏物TetR)的表达盒组成,并且启动子诱导化学制品可以是脱水四环素(aTc)。在其它实施方案中,启动子可以是pBAD或araC-ParaBAD,并且启动子诱导化学制品可以是***糖。在进一步的实施方案中,启动子可以是pLac或tac(trp-lac),并且启动子诱导化学制品可以是乳糖/IPTG。在其它实施方案中,启动子可以是pPrpB,并且启动子诱导化学制品可以是丙酸盐。
编码至少一种引导RNA的核酸序列可以与启动子可操作地连接,用于在目的细菌中表达。一般而言,至少一种引导RNA的表达可以由组成型启动子调控。在其中目的细菌是拟杆菌属的实施方案中,组成型启动子可以是P1启动子,其位于多形拟杆菌16S rRNA基因BT_r09的上游(Wegmann等人,Applied Environ. Microbiol.,2013,79:1980-1989)。其它合适的拟杆菌属启动子包括P2、P1TD、P1TP、P1TDP (Lim等人,Cell,2017,169:547-558)、PAM、PcfiA、PcepA、PBT1311 (Mimee等人,Cell Systems,2015,1:62-71)或前述启动子中任一种的变体。在其它实施方案中,组成型启动子可以是大肠杆菌σ70启动子或其衍生物、枯草芽孢杆菌(B. subtilis) σA启动子或其衍生物、或沙门氏菌属(Salmonella) Pspv2启动子或其衍生物。本领域技术人员熟悉适合于目的细菌的另外的组成型启动子。
在一些实施方案中,载体可以是整合载体,并且可以进一步包含编码重组酶的序列、以及一个或多个重组酶识别位点。一般而言,重组酶是不可逆的重组酶。合适重组酶的非限制性实例包括拟杆菌属intN2酪氨酸整合酶(由NBU2基因编码)、链霉菌属(Streptomyces)噬菌体phiC31 (φC31)重组酶、大肠杆菌噬菌体P4重组酶、大肠杆菌噬菌体λ整合酶、李斯特菌属(Listeria) A118噬菌体重组酶和放线菌噬菌体R4 Sre重组酶。重组酶/整合酶介导两个序列特异性识别(或附着)位点(例如attP位点和attB位点)之间的重组。在一些实施方案中,载体可以包含重组酶识别位点之一(例如,attP),并且另一个重组酶识别位点(例如,attB)可以定位于细菌的染色体中(例如,接近tRNA-Ser基因)。在此类情形下,整个载体可以整合到细菌的染色体内。在其它实施方案中,编码改造的CRISPR核碱基修饰***的序列的侧翼可以是两个重组酶识别位点,使得仅编码改造的CRISPR核碱基修饰***的序列整合到细菌染色体内。
上述载体中的任一种都可以进一步包含至少一个转录终止序列,以及至少一个复制起点和/或至少一个可选择标记物序列(例如抗生素抗性基因),用于在目的拟杆菌属细胞中的繁殖和选择。
关于载体及其使用的另外信息可以在“Current Protocols in MolecularBiology” Ausubel等人,John Wiley & Sons,New York,2003,或“Molecular Cloning: ALaboratory Manual” Sambrook & Russell,Cold Spring Harbor Press,Cold SpringHarbor,NY,第3版,2001中找到。
在其中编码改造的CRISPR核碱基修饰***的载体是整合载体的实施方案中,在载体递送至生物体(和重组酶/整合酶的表达)后,编码改造的***的核酸(或整个载体)可以稳定地整合到拟杆菌属染色体内。在其中编码改造的CRISPR核碱基修饰***的载体并非整合载体的实施方案中,在载体递送至细菌后,载体可以保持在染色体外。
在其中编码CRISPR-碱基编辑器融合物的核酸序列与诱导型启动子可操作连接的实施方案中,CRISPR核碱基修饰***的表达可以通过将启动子诱导化学制品引入细菌内进行诱导。在具体实施方案中,启动子诱导化学制品可以是脱水四环素。在诱导后,CRISPR-碱基编辑器融合物被合成并与至少一种引导RNA复合,所述引导RNA将CRISPR核碱基修饰***靶向细菌染色体中的靶基因座,从而形成如本文公开的蛋白质-核酸复合物。
(III) 用于修饰细菌中的核碱基的方法
本公开内容的一个进一步方面涵盖用于修饰拟杆菌属的靶成员的染色体中的至少一个核碱基的方法。该方法包括在靶物种/菌株中表达改造的RNA引导的(CRISPR)核碱基修饰***,其中所述改造的RNA引导的(CRISPR)核碱基修饰***靶向靶细菌的染色体中的特定基因座,并且所述改造的RNA引导的核碱基修饰***修饰在特定基因座内的至少一个核碱基,使得包含特定基因座的基因被修饰和/或失活,并且其中所述靶细菌物种/菌株的染色体编码HU家族DNA结合蛋白,其包含与SEQ ID NO: 1具有至少50%序列同一性(例如,与SEQ ID NO: 1至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%的序列同一性)的氨基酸序列。核碱基修饰(例如,胞嘧啶转换为胸腺嘧啶或腺嘌呤转换为鸟嘌呤)可以在特定基因座内引入单核苷酸多态性(SNP)和/或终止密码子。作为至少一种核碱基修饰的结果,靶细菌的包含特定基因座的至少一种基因的表达可以被改变、降低或消除。
上文部分(I) (a)中所述的任何RNA引导的(CRISPR)核碱基修饰***都可以如上文部分(II)中所述进行改造,以靶向目的拟杆菌属***发育谱系中的细菌物种/菌株的染色体中的特定基因座,其在上文部分(I) (b)中进行描述。改造的CRISPR核碱基修饰***可以作为载体的部分引入细菌内,如上文部分(II)中所述。一般而言,CRISPR-核碱基修饰***是可诱导的(例如,编码CRISPR-碱基编辑器融合物的核酸序列可操作地连接至诱导型启动子)。因此,CRISPR核碱基修饰***可以在限定的时间点表达。在不存在启动子诱导化学制品的情况下,无法生成CRISPR核碱基修饰***。CRISPR-碱基编辑器融合物可以通过将细菌暴露于启动子诱导化学制品来产生,使得CRISPR-碱基编辑器融合蛋白由如上文部分(II)中所述的染色体整合的编码序列或染色体外编码序列表达。CRISPR-碱基编辑器融合物与至少一种引导RNA复合,所述引导RNA由染色体整合的编码序列或染色体外编码序列组成型表达,从而形成活性CRISPR核碱基修饰***。CRISPR核碱基修饰***靶向细菌染色体中的特定基因座,在其中它修饰至少一个核碱基,使得改变、降低或消除包含特定基因座的基因的表达。
在一些实施方案中,靶生物可以是拟杆菌属物种或菌株水平变种,如上文部分(I)(b)中详述的。
在其它实施方案中,生物体可以包含在哺乳动物的消化道(或肠道)中,其中启动子诱导化学制品的施用可以导致核碱基修饰(例如,胞嘧啶转换为胸腺嘧啶或腺嘌呤转换为鸟嘌呤),其可能导致肠道微生物群中靶细菌的水平降低或消除。启动子诱导化学制品可以经口(例如,经由食物、饮料或药物制剂)施用。哺乳动物可以是小鼠、大鼠或其它研究动物。在具体实施方案中,哺乳动物可以是人。例如,靶细菌生物体(例如,拟杆菌属的成员)的减少或消除可以导致改善的肠道健康。
混合的细菌群体(在细胞培养物或消化道中)可以包含广泛多样的分类群。例如,人肠道微生物群可以包含数百个不同的细菌物种,伴随着显著的菌株水平多样性。
在某些实施方案中,哺乳动物(例如,人)可以正在经历癌症免疫疗法,其中与无应答者相比,免疫疗法应答者已显示在其肠道微生物群中具有较低水平的拟杆菌属物种(Gopalakrishnan等人,Science,2018,359:97-103)。因此,肠道微生物群中的拟杆菌属物种水平的降低可能导致更好的人癌症免疫治疗结果。
在某些实施方案中,哺乳动物(例如,人、犬科动物、猫科动物、猪科动物、马科动物或牛科动物)可以出于多种原因而经历肠道手术,所述原因包括但不限于炎性肠病、克罗恩氏病、憩室炎、肠阻塞、息肉切除、癌性组织切除、溃疡性结肠炎、肠切除术、直肠切除术、完全结肠切除术或部分结肠切除术,其中通过诱导型CRISPR核碱基修饰***在术前减弱哺乳动物肠道内的脆弱拟杆菌物种,可以降低在肠道外但在哺乳动物体内的定位处的术后脆弱拟杆菌感染风险。肠道外的定位包括肠道的外表面。可以将脆弱拟杆菌内的诱导型CRISPR核碱基修饰***靶向修饰与致病岛、毒素(即脆弱拟杆菌毒素或BFT)、或者与脆弱拟杆菌的感染性菌株或已知引起术后感染的其它天然肠道细菌相关的其它独特序列相似的定位,但不限于此。例如,非产毒脆弱拟杆菌(NTBF)和产肠毒素脆弱拟杆菌(ETBF)的水平可以使用置于ETBF菌株而非NTBF菌株内的改造的诱导型CRISPR核碱基修饰***进行选择性调节。在肠道手术后有风险引起感染的其它肠道细菌可能包括多毛拟杆菌、大肠杆菌、粪肠球菌(Enterococcus faecalis)、溶血孪生球菌(Gamella haemolysan)和摩氏摩根氏菌(Morganella morganii)。诱导型CRISPR核碱基修饰***递送至肠道微生物群可以作为益生菌治疗的部分,在手术前、手术过程中或手术后发生。诱导型CRISPR核碱基修饰***递送至靶细菌可以在哺乳动物体外或哺乳动物体内发生。诱导型CRISPR核碱基修饰***递送至靶细菌可以经由核酸载体例如质粒或细菌噬菌体而发生。质粒的递送可以经由电穿孔、化学转化或细菌与细菌的接合而发生。
(IV) 作为益生菌的CRISPR整合的细菌物种/菌株
本公开内容的又一个方面涵盖例如用作益生菌的改造的细菌菌株。改造的菌株包含在部分(I) (a)中所述的任何改造的CRISPR核碱基修饰***,其整合到细菌染色体内或作为附加型载体维持在目的生物体内。在一些实施方案中,改造的细菌是改造的拟杆菌属,其包含诱导型CRISPR核碱基修饰***。向哺乳动物受试者施用改造的拟杆菌属,随后为CRISPR***的诱导,可以用于靶向细菌染色体中的特定基因座。通过该CRISPR***修饰至少一个核碱基,使得改变、降低或消除包含特定基因座的基因的表达,从而为哺乳动物受试者提供治疗益处。在其它实施方案中,拟杆菌属菌株可以进行改造,以在与肠道微生物群中拟杆菌属的野生型菌株的竞争中胜出。在这些及其它实施方案中,然后可以通过诱导型CRISPR核碱基修饰***的诱导,从哺乳动物受试者中移出对于哺乳动物受试者提供治疗益处的改造的拟杆菌属菌株。
定义
除非另有定义,否则本文使用的所有技术和科学术语都具有由本发明所属领域的技术人员通常理解的含义。下述参考文献为技术人员提供了本发明中使用的许多术语的一般定义:Singleton等人,Dictionary of Microbiology and Molecular Biology (第2版,1994);The Cambridge Dictionary of Science and Technology (Walker编辑,1988);The Glossary of Genetics,第5版,R. Rieger等人(编辑),Springer Verlag (1991);以及Hale & Marham,The Harper Collins Dictionary of Biology (1991)。如本文使用的,除非另有说明,否则下述术语具有归于其的含义。
当介绍本公开内容或其优选实施方案的要素时,冠词“一个”、“一种”、“该”和“所述”预期意指存在一个或多个要素。术语“包含”、“包括”和“具有”预期是包含性的,并且意指可以存在除所列要素外的另外要素。
当关于数值x使用时,术语“约”例如意指x ± 5%。
如本文使用的,术语“互补的”或“互补性”指通过特定氢键的碱基配对的双链核酸缔合。碱基配对可以是标准的沃森-克里克碱基配对(例如5’-A G T C-3’与互补序列3’-TC A G-5’配对)。碱基配对也可以是Hoogsteen或反向Hoogsteen氢键合。互补性通常关于双链体区域进行测量,并且因此,例如排除突出端。如果仅一些(例如70%)碱基是互补的,则双链体区域的两条链之间的互补性可以是部分的,并且表示为百分比(例如70%)。并不互补的碱基是“错配的”。如果双链体区域中的所有碱基都是互补的,则互补性也可以是完全的(即,100%)。
关于基因或多核苷酸的术语“表达”指基因或多核苷酸的转录,以及适当时mRNA转录物翻译成蛋白质或多肽。因此,如根据上下文中将明确的,蛋白质或多肽的表达起因于开放读码框的转录和/或翻译。
如本文使用的,“基因”指编码基因产物的DNA区域(包括外显子和内含子),以及调控基因产物的产生的所有DNA区域,无论此类调控序列是否与编码序列和/或转录序列相邻。相应地,基因包括但不一定限于启动子序列、终止子、翻译调控序列如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点和基因座控制区域。
术语“异源的”指对于目的细胞并非内源或天然的实体。例如,异源蛋白质指衍生自或最初衍生自外源来源(例如外源引入的核酸序列)的蛋白质。在一些情况下,异源蛋白质通常并非由目的细胞产生。
术语“切口酶”指切割双链核酸序列的一条链的酶。
与术语“核酸内切酶”可互换使用的术语“核酸酶”指切割双链核酸序列的两条链或切割单链核酸序列的酶。
术语“核酸”和“多核苷酸”指呈线性或环状构象、以及以单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物。为了本公开内容的目的,这些术语不应解释为关于聚合物长度的限制。该术语可以涵盖天然核苷酸的已知类似物,以及在碱基、糖和/或磷酸酯部分(例如,硫代磷酸酯骨架)中修饰的核苷酸。一般而言,特定核苷酸的类似物具有相同的碱基配对特异性;即A的类似物将与T碱基配对。
术语“核苷酸”指脱氧核糖核苷酸或核糖核苷酸。核苷酸可以是标准核苷酸(即,腺苷、鸟苷、胞苷、胸苷和尿苷),核苷酸异构体或核苷酸类似物。核苷酸类似物指具有修饰的嘌呤或嘧啶碱基或者修饰的核糖部分的核苷酸。核苷酸类似物可以是天然存在的核苷酸(例如肌苷、假尿苷等)或非天然存在的核苷酸。核苷酸的糖或碱基部分上的修饰的非限制性实例包括乙酰基、氨基、羧基、羧甲基、羟基、甲基、磷酰基和硫醇基的添加(或去除),以及碱基的碳和氮原子被其它原子的取代(例如7-脱氮嘌呤)。核苷酸类似物还包括双脱氧核苷酸、2'-O-甲基核苷酸、锁核酸(LNA)、肽核酸(PNA)和吗啉代寡核苷酸(morpholino)。
术语“多肽”和“蛋白质”可互换使用,以指氨基酸残基的聚合物。
术语“靶序列”、“靶位点”和“特定基因座”可互换使用,以指CRISPR***所靶向的目的核酸(例如,染色体DNA或细胞RNA)中的特定序列,以及CRISPR***修饰核酸或与核酸缔合的蛋白质的位点。
用于确定核酸和氨基酸序列同一性的技术是本领域已知的。通常,此类技术包括确定基因的mRNA的核苷酸序列和/或确定由此编码的氨基酸序列,并且将这些序列与第二核苷酸或氨基酸序列进行比较。基因组序列也可以以这种方式来确定且比较。一般而言,同一性分别指两个多核苷酸或多肽序列的精确核苷酸对核苷酸或氨基酸对氨基酸的对应关系。可以通过确定其同一性百分比来比较两个或更多个序列(多核苷酸或氨基酸)。两个序列(无论是核酸序列还是氨基酸序列)的同一性百分比是两个比对序列之间的精确匹配数目除以较短序列的长度,且乘以100。核酸序列的近似比对由Smith和Waterman,Advancesin Applied Mathematics 2:482-489(1981)的局部同源性算法提供。这种算法可以通过使用评分矩阵应用于氨基酸序列,所述评分矩阵由Dayhoff,Atlas of Protein Sequencesand Structure,M. O. Dayhoff编辑,5 suppl. 3:353-358,National BiomedicalResearch Foundation,Washington,D.C.,USA开发,并且由Gribskov,Nucl. Acids Res.14(6):6745-6763(1986)标准化。这种算法确定序列的同一性百分比的示例性实现由“BestFit”实用应用程序中的Genetics Computer Group(Madison,Wis.)提供。用于计算序列之间的同一性或相似性百分比的其它合适程序是本领域一般已知的,例如,另一种比对程序是与缺省参数一起使用的BLAST。例如,可以使用下述缺省参数来使用BLASTN和BLASTP:遗传密码=标准;过滤器=无;链=两条;截断=60;期望=10;矩阵=BLOSUM62;描述=50个序列;排序方式=高得分;数据库=非冗余,GenBank+EMBL+DDBJ+PDB+GenBank CDS翻译+Swiss蛋白+Spupdate+PIR。这些程序的详细信息可以在GenBank网站上找到。
由于可以在上述细胞和方法中作出各种变化,而不背离本发明的范围,因此预期上述说明和下文给出的实施例中包含的所有内容,都应该解释为示例性的而不是限制性的。
实施例
下述实施例示出了本公开内容的某些方面。
实施例1. 多形拟杆菌中的CRISPR碱基编辑
在拟杆菌属中进行脱氨酶介导的靶向碱基编辑,以直接编辑由引导RNA指定的在靶基因座处的核苷酸,而无需DNA切割或模板供体DNA (图1)。实现了接近100%的编辑效率,而不诱导细胞死亡,并且因此适合于拟杆菌属的基因组改造。
构建了拟杆菌属dCas9-AlD载体pNBU2.CRISPR-CDA。该载体表达(i)在脱水四环素诱导型启动子下,与海七鳃鳗(Petromyzon marinus)胞嘧啶脱氨酶PmCDA1 (CDA)融合的催化失活的Cas9 (dCas:D10A和H840A突变),以及(ii)在组成型启动子PI下的20核苷酸(nt)靶序列—gRNA支架杂合体(sgRNA)。该质粒含有R6K复制起点和用于大肠杆菌中的氨苄青霉素选择的bla序列、用于接合的RP4-oriT序列和用于拟杆菌属中的红霉素(Em)选择的ermG序列。NBU2编码intN2酪氨酸整合酶,其介导pNBU2.CRISPR-CDA质粒上的attN2位点与定位于拟杆菌属细胞的染色体上的attB位点之一之间的序列特异性重组(Wang等人,J. Bacteriology,2000,182 (12):3559-3571)。NBU2整合酶识别序列(attN2/attB)是5’-CCTGTCTCTCCGC-3’ (SEQ ID NO: 2)。CRISPR-CDA单元由具有D10A和H840A突变的可诱导的、核酸酶缺陷型SpCas9组成,所述SpCas9与海七鳃鳗胞嘧啶脱氨酶(PmCDA1)融合。dCas9-CDA1融合物受TetR调节因子(P2-A21-tetR,P1TDP-GH023-dSpCas9-PmCDA1)控制,所述TetR调节因子处于脱水四环素(aTc)的控制下,并且引导RNA受组成型P1启动子(P1-N20 sgRNA支架)控制。如Lim等人,Cell,2017,169:547-558中所述,启动子和核糖体结合位点由多形拟杆菌(Bt) 16S rRNA基因的调控序列进行衍生且改造。引导RNA是与编码或非编码DNA序列同源的核苷酸序列,或者是非靶向的乱序核苷酸序列。该序列可以变化,只要它与不同的Cas9同源物的前间隔序列相邻基序(PAM)要求相容。引导RNA可以在tracrRNA和crRNA的分开的转录单元中,或融合成杂合的嵌合tracr/crRNA单引导(sgRNA)。质粒pNBU2.CRISPR-STOP.tdkfit DNA序列(11,383 bp)的图谱显示于图2中,并且作为SEQ ID NO: 3列出:GGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCCTTAAGACCCACTTTCACATTTAAGTTGTTTTTCTAATCCGCATATGATCAATTCAAGGCCGAATAAGAAGGCTGGCTCTGCACCTTGGTGATCAAATAATTCGATAGCTTGTCGTAATAATGGCGGCATACTATCAGTAGTAGGTGTTTCCCTTTCTTCTTTAGCGACTTGATGCTCTTGATCTTCCAATACGCAACCTAAAGTAAAATGCCCCACAGCGCTGAGTGCATATAATGCATTCTCTAGTGAAAAACCTTGTTGGCATAAAAAGGCTAATTGATTTTCGAGAGTTTCATACTGTTTTTCTGTAGGCCGTGTACCTAAATGTACTTTTGCTCCATCGCGATGACTTAGTAAAGCACATCTAAAACTTTTAGCGTTATTACGTAAAAAATCTTGCCAGCTTTCCCCTTCTAAAGGGCAAAAGTGAGTATGGTGCCTATCTAACATCTCAATGGCTAAGGCGTCGAGCAAAGCCCGCTTATTTTTTACATGCCAATACAATGTAGGCTGCTCTACACCTAGCTTCTGGGCGAGTTTACGGGTTGTTAAACCTTCGATTCCGACCTCATTAAGCAGCTCTAATGCGCTGTTAATCACTTTACTTTTATCTAATCTAGACATATTCGTTTAATATCATAAATAATTTATTTTATTTTAAAATGCGCGGGTGCAAAGGTAAGAGGTTTTATTTTAACTACCAAATGTTTTCGGAAGTTTTTTCGCTTTTCTTTTTCTATCGTTTCTCAGACTCTCTTAGCGAAAGGGAAAGAAGGTAAAGAAGAAAAACAAAACGCCTTTTCTTTTTTGCACCCGCTTTCCAAGAGAAGAAAGCCTTGTTAAATTGACTTAGTGTAAAAGCGCAGTACTGCTTGACCATAAGAACAAAAAAATCTCTATCACTGATAGGGATAAAGTTTGGAAGATAAAGCTAAAAGTTCTTATCTTTGCAGTCTCCCTATCAGTGATAGAGACGAAATAAAGACATATAAAAGAAAAGACACCATGGATAAGAAATACTCAATAGGCTTAGCTATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATGCCATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACGGTGGAGGAGGTTCTGGAGGTGGAGGTTCTGCTGAGTATGTGCGAGCCCTCTTTGACTTTAATGGGAATGATGAAGAGGATCTTCCCTTTAAGAAAGGAGACATCCTGAGAATCCGGGATAAGCCTGAGGAGCAGTGGTGGAATGCAGAGGACAGCGAAGGAAAGAGGGGGATGATTCCTGTCCCTTACGTGGAGAAGTATTCCGGAGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGTCTAGGCTCGAGTCCGGAGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGTCTAGGATGACCGACGCTGAGTACGTGAGAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCATAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTGAATAAACCACAGAGCGGGACAGAACGTGGCATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAATACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGCTGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGCAAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAATCTCAGAGATAACGGGGTTGGGTTGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATTGAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATGATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAATTAATGCGGCTGCAATTTTTTTGGGCGGGGCCGCCCAAAAAAATCCTAGCACCCTGCAGCAGTACTGCTTGACCATAAGAACAAAAAAACTTCCGATAAAGTTTGGAAGATAAAGCTAAAAGTTCTTATCTTTGCAGTATACAAGAGACCAGAAGAAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGAGATCTGTCGACTCTAGAGGATCCCCGGGTACCGAGCTCGAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGTACTTGTGCCTGTTCTATTTCCGAACCGACCGCTTGTATGAATCCATCAAAATTCGTTTTCTCTATGTTGGATTCCTTGTTGCTCATATTGTGATGATAATTTCTACAAATATAGTCATTGGTAACTATCTATGAAACTGTTTGATACTTTTATAGTTGATTAAACTTGTTCATGGCATTTGCCTTAATATCATCCGCTATGTCAATGTAGGGTTTCATAGCTTTGTAGTCGCTGTGTCCCGTCCATTTCATGACCACCTGTGCCGGGATTCCGAGAGCCAGCGCATTGCAGATGAATGTCCTTCTTCCTGCATGGGTACTGAGCAAAGCGTATTTGGGTGTGACTTCATCAATACGTTCATTTCCCTTGTAGTAGGTTTCCCGTACAGGCTCGTTGATTTCTGCCAGTTCGCCCAGCTCTTTCAGGTAATCGTTCATCTTCTGGTTGCTGATGACGGGCAGAGCCATGTAATTCTCGAAATGGATGTCCTTGTATTTGTCCAGTATGGCTTTGCTGTATTTGTTCAGTTCAATCGTCAGGCTGTCGGCAGTCTTGACTGTGGTTATTTCGATGTGGTCGGACTTCACATCGCTTCTTTTCAGATTGCGAACATCCGAATACCGCAAACTCGTAAAGCAGCAGAACAGGAAAACATCACGCACACGTTCCAGGTATTGCTTATCCTTGGGTATCTGGTAGTCTTTCAGCTTGTTCAGTTCATCCCAAGTCAGGAAGATTACTTTTTTCGAGGTGGTTTTCAGTTTCGGTTTGAACGTATCGTATGCAATGTTCTGATGATGTCCTTTCTTGAAGCTCCAGCGCAGGAACCATTTGAGGAATCCCATTTGCTTGCCGATGGTGCTGTTTCTCATATCCTTGGTGTCACGCAGGAAGTTGACGTATTCGTTCAATCCAAACTCGTTGAAATAGTTGAACGTTGCATCCTCCTTGAACTCTTTGAGGTGGTTCCTCACTGCTGCAAATTTTTCATAGGTGGATGCCGTCCAGTTATTCTGGTTACCGCACTCTTTTACAAACTCATCGAACACCTCCCAAAAGCTGACAGGGGCTTCTTCCGGCTGTTCTTCGCTGGTGTCTTTCATTCTCATGTTGAAAGCTTCCTTCAACTGTTGGGTCGTTGGCATGACCTCCTGCACCTCAAATTCCTTGAAAATATTCTGGATTTCGGCATAGTATTTCAGCAAGTCCGTATTGATTTCGGCTGCACTTTGCTTTAGCTTGTTGGTACATCCGCTCTTTACCCGCTGCTTATCTGCATCCCATTTGGCTACGTCAATCCGGTAGCCCGTTGTAAACTCGATGCGTTGGCTGGCAAAGATGACACGCATACGGATGGGTACGTTCTCTACGATTGGCACACCGTTCTTTTTCCGGCTCTCCAATGCAAAAATGATGTTGCGCTTGATATTCATAATTGGGTGCGTTTGAAATTCTACACCCAAATATACACCCAATTATTGAGATAGCAAAAGACATTTAGAAACATTTACTTTTACTCTATATTGTAATTTACACTTGATTATCAGTCGTTTGCAGTCTTATGATATTCTGTGAAAGTATAAGTTCGAGAGCCTGTCTCTCCGCAAAAAACGCTGAAAATCAGCAGATTGCAAAACAAACACCCTGTTTTACACCCAAGAATGTAAAGTCGGCTGTTTTTGTTTTATTTAAGATAATACAACCACTACATAATAAAAGAGTAGCGATATTAAAAGAATCCGATGAGAAAAGACTAATATTTATCTATCCATTCAGTTTGATTTTTCAGGACTTTACATCGTCCTGAAAGTATTTGTTGGTACCGGTACCGAGGACGCGTAAACATTTACAGTTGCATGTGGCCTATTGTTTTTAGCCGTTAAATATTTTATAACTATTAAATAGCGATACAAATTGTTCGAAACTAATATTGTTTATATCATATATTCTCGCATGTTTTAAAGCTTTATTAAATTGATTTTTTGTAAACAGTTTTTCGTACTCTTTGTTAACCCATTTCATTACAAAAGTTTCATATTTTTTTCTCTCTTTAAATGCCATTTTTGCTGGCTTTCTTTTTAATACAATTAATGTGCTATCCACTTTAGGTTTTGGATGGAAATAATACCTAGGAATTTTTGCTAATATAGAAATATCTACCTCTGCCATTAACAGCAATGCTAGTGATCTGTTTGTATCTAATAACATTTTAGCAAAACCATATTCCACTATTAAATAACTTATTGTGGCTGAACTTTCAAAAACAATTTTTCGAATTATATTTGTGCTTATGTTGTAAGGTATGCTGCCAAATATTTTATATGGATTGTGGCTAGGAAATGTAAATTTCAGTATATCATCATTTACTATTTGATAGTTAGGATAATTTAAGAGCTTATTACGAGTTACCTCACATAATTTAGAATCAATTTCTATCGCCGTTACAAAATTACATCTCTTTACCAATCCAGCAGTAAAATGACCTTTCCCTGCACCTATTTCAAAGATGTTATCTTTTTCATCTAAACTTATGCAATTCATTATTTTTTCTATGTGATATTTTGAAGTAATAAAATTTTGACTATCTTTTATATTTACTTTGTTCATTATAACCTCTCCTTAATTTATTGCATCTCTTTTCGAATATTTATGTTTTTTGAGAAAAGAACGTACTCATGGTTCATCCCGATATGCGTATCGGTCTGTATATCAGCAACTTTCTATGTGTTTCAACTACAATAGTCATCTATTCTCATCTTTCTGAGTCCACCCCCTGCAAAGCCCCTCTTTACGACATAAAAATTCGGTCGGAAAAGGTATGCAAAAGATGTTTCTCTCTTTAAGAGAAACTCTTCGGGATGCAAAAATATGAAAATAACTCCAATTCACCAAATTATATAGCGACTTTTTTACAAAATGCTAAAATTTGTTGATTTCCGTCAAGCAATTGTTGAGCAAAAATGTCTTTTACGATAAAATGATACCTCAATATCAACTGTTTAGCAAAACGATATTTCTCTTAAAGAGAGAAACACCTTTTTGTTCACCAATCCCCGACTTTTAATCCCGCGGCCATGATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATAACGCGTCAATTCGAGGGGGATCAATTCCGTGATAGGTGGGCTGCCCTTCCTGGTTGGCTTGGTTTCATCAGCCATCCGCTTGCCCTCATCTGTTACGCCGGCGGTAGCCGGCCAGCCTCGCAGAGCAGGATTCCCGTTGAGCACCGCCAGGTGCGAATAAGGGACAGTGAAGAAGGAACACCCGCTCGCGGGTGGGCCTACTTCACCTATCCTGCCCGGCTGACGCCGTTGGATACACCAAGGAAAGTCTACACGAACCCTTTGGCAAAATCCTGTATATCGTGCGAAAAAGGATGGATATACCGAAAAAATCGCTATAATGACCCCGAAGCAGGGTTATGCAGCGGAAAACGGAATTGATCCGGCCACGATGCGTCCGGCGTAGAGGATCTGAAGATCAGCAGTTCAACCTGTTGATAGTACGTACTAAGCTCTCATGTTTCACGTACTAAGCTCTCATGTTTAACGTACTAAGCTCTCATGTTTAACGAACTAAACCCTCATGGCTAACGTACTAAGCTCTCATGGCTAACGTACTAAGCTCTCATGTTTCACGTACTAAGCTCTCATGTTTGAACAATAAAATTAATATAAATCAGCAACTTAAATAGCCTCTAAGGTTTTAAGTTTTATAAGAAAAAAAAGAATATATAAGGCTTTTAAAGCTTTTAAGGTTTAACGGTTGTGGACAACAAGCCAGGGATGTAACGCACTGAGAAGCCCTTAGAGCCTCTCAAAGCAATTTTGAGTGACACAGGAACACTTAACGGCTGACATGGGAATTCCCCTCCACCGCGGTGG。
在该具体实例中,构建了三种质粒,其表达非靶向对照引导RNA (5'-TGATGGAGAGGTGCAAGTAG -3',称为'NT',SEQ ID NO: 4)、或者靶向Bt基因组上的tdk_Bt(BT_2275)或susC_Bt (BT_3702)编码序列的引导RNA。tdk基因编码胸苷激酶,而susC基因编码多形拟杆菌中的涉及淀粉结合的外膜蛋白。tdk_Bt的前间隔序列是5'-ATACAAGAGACCAGAAGAAG-3'(SEQ ID NO:5),而susC_Bt的前间隔序列是5'-GCTCAAATCCGTATTCGTGG-3' (SEQ ID NO: 6)。针对拟杆菌属基因组的非靶向对照前间隔序列的计算机分析并未导致任何显著的序列匹配,指示了没有‘脱靶’活性。如果C至T突变在定位于PAM上游大约15-20个碱基的胞嘧啶核苷酸(C)处发生,则选择tdk_BtsusC_Bt的靶向序列以引入终止密码子(Nishida等人,Science,2016,353 (6305),doi: 10.1126/science.aaf8729;12016,Banno等人,Nature Microbiology,2018,3. 10.1038/s41564-017-0102-6)。所得到的质粒命名为pNBU2.CRISPR-CDA.NT、pNBU2.CRISPR-CDA.tdk_Bt和pNBU2.CRISPR-CDA.susC_Bt。
用红霉素选择将pNBU2.CRISPR-CDA质粒与Bt细胞接合,每次接合导致500-1000个菌落。由于缺乏拟杆菌属的复制起点,这些质粒无法维持。红霉素抗性菌落很可能是染色体整合体。从每次接合中挑选菌落,用于在Bt染色体上的两个attBT基因座的任一处的CRISPR-CDA整合的菌落PCR筛选。使用靶向每个attBT基因座处的染色体序列的引物的PCR用于推断整合基因座,随后为染色体和整合载体序列之间的进一步连接PCR和DNA测序确认。获得了具有在attBT2-1基因座处整合的诱导型CRISPR-CDA盒的三种CRISPR-CDA整合菌株,其标记为NT (非靶向)、T (tdk_Bt)和S (susC_Bt),用于随后的诱导型CRISPR碱基编辑实验。NT、T和S CRISPR-CDA整合体的单个菌落在含有5 ml TYG液体培养基(Holdeman等人,Anaerobe Laboratory Manual,1977;Blacksburg,Va.,Virginia Polytechnic Instituteand State University Anaerobe Laboratory)的falcon管培养物中的coy室(CoyLaboratory Products Inc.)中厌氧生长过夜,所述TYG液体培养基补充有200 µg/ml庆大霉素(Gm)和25 µg/ml红霉素(Em)。将培养物稀释(10-6或10-8),并且将100 µL涂抹到分别补充有浓度为0和100 ng/ml的aTc的脑心浸液(BHI;Beckton Dickinson,Co.)血琼脂平板(Gm200 µg/mL和Em 25 µg/mL)上。使琼脂平板在37℃下厌氧温育2-3天。对于所有3种菌株,在每块血琼脂平板上获得了约102-103 CFU (菌落形成单位)。
对于tdk_Bt碱基编辑,从aTc0和aTc100琼脂平板中挑选了8个菌落。这些菌落在补充有以200 μg/mL的Gm和以200 μg/mL的5-氟-20-脱氧尿苷(FUdR)的BHI血琼脂平板上进行划线培养,并且在37℃下厌氧温育2-3天。虽然来自aTc100琼脂平板的所有菌落都长大,但没有观察到来自aTc0琼脂平板的菌落的生长。执行tdk_Bt区域的菌落PCR,随后为DNA测序。测序结果指示,来自aTc100琼脂平板的8个菌落中的8个包含在相对于PAM的-17位置处的预计的C至T取代,导致早期终止密码子的引入(图3A)。这种tdk失活突变赋予对有毒核苷酸类似物FUdR的抗性。将来自NT-aTc0、NT-aTc100、T-aTc0和T-aTc100琼脂平板的各自至多50个菌落在BHI血琼脂平板上进一步划线培养,所述BHI血琼脂平板补充有以200 µg/mL的Gm和以200 µg/mL的FUdR。观察到来自T-aTc100琼脂平板的所有菌落都长大,但没有观察到其它菌落的生长。这提示了在Bt细胞中的诱导型、RNA引导的、高效的核苷酸诱变。
对于susC_Bt碱基编辑,从aTc0和aTc100琼脂平板中挑选了8个菌落。执行susC_Bt区域的菌落PCR,随后为DNA测序。测序结果指示,来自aTc100琼脂平板的8个菌落中的8个包含在相对于PAM的-17和-19位置处的预计的C至T取代,导致氨基酸取代(在位置491处的A至V)和早期终止密码子引入(在3,012 bp susC编码序列的位置493处) (图3B)。来自aTc0琼脂平板的所有8个菌落都包含野生型susC_Bt序列。这指示了Bt细胞中的诱导型、高效、RNA引导的碱基编辑。
实施例2. 在多形拟杆菌VPI-5482中稳定维持的CRISPR碱基编辑
构建了拟杆菌属dCas9-AID载体pmobA.repA.CRISPR-CDA.NT。该载体表达(i)在脱水四环素诱导型启动子下,与海七鳃鳗(Petromyzon marinus)胞嘧啶脱氨酶PmCDA1 (CDA)融合的催化失活的Cas9 (dCas:D10A和H840A突变),以及(ii)在组成型启动子P1下的20个核苷酸(nt)的靶序列—gRNA支架杂合体(sgRNA)。该质粒含有pBR322复制起点和用于大肠杆菌中的氨苄青霉素选择的bla序列。mobA序列是动员所需的,repA序列是复制所需的,并且ermF序列是拟杆菌属中的红霉素(Em)选择所需的(Smith,C. J.等人,Plasmid,1995,34,211-222)。CRISPR-CDA单元由具有D10A和H840A突变的可诱导的、核酸酶缺陷型SpCas9组成,所述SpCas9与海七鳃鳗胞嘧啶脱氨酶(PmCDA1)融合。dCas9-CDA1融合物受TetR调节因子(P2-A21-tetR,P1TDP-GH023-dSpCas9-PmCDA1)控制,所述TetR调节因子处于脱水四环素(aTc)的控制下,并且引导RNA受组成型P1启动子(P1-N20 sgRNA支架)控制。如Lim等人,Cell,2017,169:547-558中所述,启动子和核糖体结合位点由多形拟杆菌(Bt) 16S rRNA基因的调控序列进行衍生且改造。引导RNA是与编码或非编码DNA序列同源的核苷酸序列,或者是非靶向的乱序核苷酸序列。该序列可以变化,只要它与不同的Cas9同源物的前间隔序列相邻基序(PAM)要求相容。引导RNA可以在tracrRNA和crRNA的分开的转录单元中,或融合成杂合的嵌合tracr/crRNA单引导(sgRNA)。质粒pmobA.repA.CRISPR-CDA.NT DNA序列(13,307 bp)的图谱显示于图4中,并且作为SEQ ID NO: 7列出:
TCGGGACGCTCATCAATATCCACCCTGCCTGGGATAAATCCTCGCCCTGCATTTTTAGAACCACGTTTGGCATACCTGCGACCTTGTCTGCGAAGATATTTGTGCAGTTTGCCACCCCGCCGCTTATCCTCCCAAATCCAGCGATATATCGTTTCGTGAGATACCATCGCAATTCCCTCCAAGCGGCTCCTGCCGACAATCTGCTCCGGGCTGAATCCTTTCTTCAACAGCTTTATTATCCGTTTTCTCATTGCCGGTGTAAGCACTTCCTTGCGATGTTTTTGCTGCTTGCGCCTGTCTGCTTTTCGCTGGGCAAGCTCCATGCTATAGCTACCACTTCGGGCGTCGCAATTGCGCTTTATCTCCCTGTAAACAGTGCTTTTATCTACTCCGATAGCTTCCGCTATTGCTTTTTTGCTCATCGGTATTTGCAACATCATAGAAATTGCATACCTTTGTTCCTCGGTTATATGTTTGCTCATCTGCAACTTTTTTTTCTTTGGACGGACAATTAAAGCAAAGATAGCAAACTTTATCCATTCAGAGTGAGAGAAAGGGGGACATTGTCTCTCTTTCCTCTCTGAAAAATAAATGTTTTTATTGCTTATTATCCGCACCCAAAAAGTTGCATTTATAAGTTGAACTCAAGAAGTATTCACCTGTAAGAAGTTACTAATGACAAAAAAGAAATTGCCCGTTCGTTTTACGGGTCAGCACTTTACTATTGATAAAGTGCTAATAAAAGATGCAATAAGACAAGCAAATATAAGTAATCAGGATACGGTTTTAGATATTGGGGCAGGCAAGGGGTTTCTTACTGTTCATTTATTAAAAATCGCCAACAATGTTGTTGCTATTGAAAACGACACAGCTTTGGTTGAACATTTACGAAAATTATTTTCTGATGCCCGAAATGTTCAAGTTGTCGGTTGTGATTTTAGGAATTTTGCAGTTCCGAAATTTCCTTTCAAAGTGGTGTCAAATATTCCTTATGGCATTACTTCCGATATTTTCAAAATCCTGATGTTTGAGAGTCTTGGAAATTTTCTGGGAGGTTCCATTGTCCTTCAATTAGAACCTACACAAAAGTTATTTTCGAGGAAGCTTTACAATCCATATACCGTTTTCTATCATACTTTTTTTGATTTGAAACTTGTCTATGAGGTAGGTCCTGAAAGTTTCTTGCCACCGCCAACTGTCAAATCAGCCCTGTTAAACATTAAAAGAAAACACTTATTTTTTGATTTTAAGTTTAAAGCCAAATACTTAGCATTTATTTCCTGTCTGTTAGAGAAACCTGATTTATCTGTAAAAACAGCTTTAAAGTCGATTTTCAGGAAAAGTCAGGTCAGGTCAATTTCGGAAAAATTCGGTTTAAACCTTAATGCTCAAATTGTTTGTTTGTCTCCAAGTCAATGGTTAAACTGTTTTTTGGAAATGCTGGAAGTTGTCCCTGAAAAATTTCATCCTTCGTAGTTCAAAGTCGGGTGGTTGTCAAGATGATTTTTTTGGTTTGGTGTCGTCTTTTTTTAAGCTGCCGCATAACGGCTGGCAAATTGGCGATGGAGCCGACTTTGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCCTTAAGACCCACTTTCACATTTAAGTTGTTTTTCTAATCCGCATATGATCAATTCAAGGCCGAATAAGAAGGCTGGCTCTGCACCTTGGTGATCAAATAATTCGATAGCTTGTCGTAATAATGGCGGCATACTATCAGTAGTAGGTGTTTCCCTTTCTTCTTTAGCGACTTGATGCTCTTGATCTTCCAATACGCAACCTAAAGTAAAATGCCCCACAGCGCTGAGTGCATATAATGCATTCTCTAGTGAAAAACCTTGTTGGCATAAAAAGGCTAATTGATTTTCGAGAGTTTCATACTGTTTTTCTGTAGGCCGTGTACCTAAATGTACTTTTGCTCCATCGCGATGACTTAGTAAAGCACATCTAAAACTTTTAGCGTTATTACGTAAAAAATCTTGCCAGCTTTCCCCTTCTAAAGGGCAAAAGTGAGTATGGTGCCTATCTAACATCTCAATGGCTAAGGCGTCGAGCAAAGCCCGCTTATTTTTTACATGCCAATACAATGTAGGCTGCTCTACACCTAGCTTCTGGGCGAGTTTACGGGTTGTTAAACCTTCGATTCCGACCTCATTAAGCAGCTCTAATGCGCTGTTAATCACTTTACTTTTATCTAATCTAGACATATTCGTTTAATATCATAAATAATTTATTTTATTTTAAAATGCGCGGGTGCAAAGGTAAGAGGTTTTATTTTAACTACCAAATGTTTTCGGAAGTTTTTTCGCTTTTCTTTTTCTATCGTTTCTCAGACTCTCTTAGCGAAAGGGAAAGAAGGTAAAGAAGAAAAACAAAACGCCTTTTCTTTTTTGCACCCGCTTTCCAAGAGAAGAAAGCCTTGTTAAATTGACTTAGTGTAAAAGCGCAGTACTGCTTGACCATAAGAACAAAAAAATCTCTATCACTGATAGGGATAAAGTTTGGAAGATAAAGCTAAAAGTTCTTATCTTTGCAGTCTCCCTATCAGTGATAGAGACGAAATAAAGACATATAAAAGAAAAGACACCATGGATAAGAAATACTCAATAGGCTTAGCTATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATGCCATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACGGTGGAGGAGGTTCTGGAGGTGGAGGTTCTGCTGAGTATGTGCGAGCCCTCTTTGACTTTAATGGGAATGATGAAGAGGATCTTCCCTTTAAGAAAGGAGACATCCTGAGAATCCGGGATAAGCCTGAGGAGCAGTGGTGGAATGCAGAGGACAGCGAAGGAAAGAGGGGGATGATTCCTGTCCCTTACGTGGAGAAGTATTCCGGAGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGTCTAGGCTCGAGTCCGGAGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGTCTAGGATGACCGACGCTGAGTACGTGAGAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCATAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTGAATAAACCACAGAGCGGGACAGAACGTGGCATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAATACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGCTGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGCAAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAATCTCAGAGATAACGGGGTTGGGTTGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATTGAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATGATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAATTAATGCGGCTGCAATTTTTTTGGGCGGGGCCGCCCAAAAAAATCCTAGCACCCTGCAGCAGTACTGCTTGACCATAAGAACAAAAAAACTTCCGATAAAGTTTGGAAGATAAAGCTAAAAGTTCTTATCTTTGCAGTTGATGGAGAGGTGCAAGTAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGTCGACTCTAGAGGATCCCCGGGTACCGAGCTCGAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACACACCATAAACTTTTTTTAGAATAAGCACACAACCGTTTTCCGAACCCTGCAAAATGTTTTCTGAATCCGAACGGTGTAACACTCCATTGAGAGAGGCTGCCGTTTGGTCGCTCCCCCTTTGGGGGCGGGGGGGGGTTACATACCCATGCCGAAACCTCTGCTTCTGGTGATTTGCTTGAATAGGTCTTTCCCCTCTTCCATAGCTTTTGATATGTTTGGGAAATGATGCCTTAAAGCCTCCAGTTGTTCGGAATTGAACAAGTCTTTCATCTTACCAAGTTCTTTTTTCAACTCCTTGGTTTCGGCTTTTAGTTTTTGGTTCTCCGTCCTTAATAGGTTACTGGTTGTCCTTGCGTTGTCCATTTGTTGTCTATAATACTCCTTGTCATTCTCGGCTTTGAATGCCTTTGTGCTGTTTCGCTCTTTTTCAAGTATAGCCTTTCCCAGTCTATCGGATAGTTGTTCATTTTCCCCCTCTAAAGTCTTTACTTTGGCTTTTAAGGCATCCTTTTCCCTATCGTTGACTGTTTTTCCAATCAAGCCGTAAAACTTCTCTGAAGCCTTAGAAATGAGTTTTTGGACGTTCTTCTTTGTTTCAATGGAACGTAGTTCCTTCTGAAGCTGAAGAAGCTGGTTTTGTGCGTCCTTGTATTTGTCTAATGCACTGGATATATCGTTGGATAGTTCCTGAAGCTGTTCTTTCGCACATTCGGTCTTGTACTGCATAGCCGATAAGTGTTTGCGGTCAGAAGAAACGCCACGTTCCATGCCCAGTGTTTCAGATGCTATGGTTTGGAGTTCTGCCATGTCATCACGCGATAAACGCACACTTTTCCCATTCGGCTGCGTCCAATCGAAAACTACATGGGCATGAAGGTTAGGTGTCCACTGCTTTGCGTTCATGTATCCTTCGTCCTTGTGTATATGGATTTGAAACGCTTCGATACCGAAACGTTCTTTGCAGACCGTGGCAAACTGCTGGAGTTCCTGCATAGTGGTTTCTTGTTTGATTACTATTACTCCCTCTCGTATGGGTGCGGCTTTAGCCTGCATCTTCTGCCCAACCGTATCGAGATATCTTTGTTTTGCACTCTCCAGCCGATGGGAAATGCTATCTCCAACCCAGCTTTCATTCAAATGACTAAGTTCGGGACGAACATAGTCCAACTCTTTTTCCCTAAAGTTGTGAATCTCGCTCCCCGGCTTCACTGCTTGTACATGAATACTTGTTGCTCCCATAAGTTAACATTTTTGTGACAATCGATAACAGCCGGTGACAGCCGGCTGACAGGGGGTTAAGGGGGCTTGTCCCCTTACACACGCACTCTTTAGGGTGCTAGTGTGCTATCACCATACTGCATAGGTGCGAAGTTAGTGAATGTTTTGTAAATGCACAAATAAAGGGAAAAACATTTGGATTTGCGATAATAAAGTACTACCTTTGTTGCTGACCAAACGGTAGCTGACCGATACGGGAGAGTTACCAAAATACAAGCCGCTGGAGTTAATTGACGGACATCCGACATCTCCAGCGGCTTTATTTTTGCCTATCTGCTTCGCCTAGGCACACCAGTACCTCTACTAAAAATGTACTTCAAAGATACTTATTTTCTACCGACTTGATAGTTTTTACCCCATATTCTTGGACATTTTTCCCCCATGAGGTTATCTTTGTAGGGTGAAAGAGAAACCCATAAACGGGGATAGATTGAATGCTGGGAAGCATAAACAATCGGGGTAAGGTTAGCGAACCTTGCCTTTCATCCCCCATTATAACTTTACATAGAGGAACTTTATCTATCCCCCCCCGCCCCCAAAGGGGGAGCGACCAAACGGCAGCTTCACTCAATGGAGTGTTACTGTTCATCAAAGCCAAGTGATAATTGTCGTTTCTCTGCTTCTTCTTTCTTTTGGGCAGCTAAAGTCTTTTTCCGAACGTATGTTTTAGCAAATGTCACTCGGTCACCATTGAATACTATCAGAGGATTAATAAACCAAAGATTATCGGCTGGTCCTCGGGCTATGATTTCAGCTTTTACAAGTTCTGCAAGTCCTTTATAAACGGCTTTGTCTGTTTTGTATTTGGTATATTCTAGGCATTTTTTTCTATTGAAAATGATTAAATCATTTTTGGGTTTCATGCAGGTCATAAAGTAACCAAAAACCCGAATAGCTGCTTGTGATAGGTCAAAGAATGCAGCAAAGTTAGAAAGATACAATTTAGTGAATTGTTCTTCATCTACTTCTATTTGACGGATAAACGAAGTCTTAAACACTTCTCCAGTTTCAGTGTCGGCTAAAGCTACTACAGCTCTCTTATCGCCACCACTATTACTCTTATACTTTTTAACAACATGATTTTCAATACCTTCTATAGCTTGTTTCATAAAAGGATTTTCTTCGTTCTTTTGAAAATCGGTTAACTTAACTGCTTTTTTATTTTCCATTTTGATATGTTTTTGGGAAATATTATTCTCCACAAAGTAAACTATTATTTTCCATAAAAACAATATTAAGGGAAATATTATTTTCCTATTTAGTATCATATTAGGAAATCGGTATTTTCTAGATTGGAAAATGAGAATTTCCAATATGGAAAATGCCCTATATTGTGTATCAAGTACTTAACTTATTCTATTTCTTTTATTCTTAATATACCCCCAAAACAGCACAAAATCAGTCACTTAAAAATCATCGGTCGGGGAATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGCTAAATTTAAATATAAACAA
在该具体实例中,构建了三种质粒,其表达非靶向对照引导RNA (5’-TGATGGAGAGGTGCAAGTAG -3’,称为‘NT’,SEQ ID NO: 4)、或者靶向Bt基因组上的BT_0362或BT_0364编码序列的引导RNA。BT_0362的前间隔序列是5’- GGACGAATCGTAAATGCAGA -3’(SEQ ID NO: 8),而BT_0364的前间隔序列是5’- CCCATTGGCTGAATGTGGCG -3’ (SEQ IDNO: 9)。针对拟杆菌属基因组的非靶向对照前间隔序列的计算机分析并未导致任何显著的序列匹配,指示了没有‘脱靶’活性。如果C至T突变在定位于PAM上游大约15-20个碱基的胞嘧啶核苷酸(C)处发生,则选择BT_0362和BT_0364的靶向序列以引入终止密码子(Nishida等人,Science,2016,353 (6305),doi: 10.1126/science.aaf8729;12016,Banno等人,Nature Microbiology,2018,3. 10.1038/s41564-017-0102-6)。所得到的质粒命名为pmobA.repA.CRISPR-CDA.NT、pmobA.repA.CRISPR-CDA.BT_0362和pmobA.repA.CRISPR-CDA.BT_0364。
pmobA.repA.CRISPR-CDA质粒最初在需氧条件下,在脑心浸液(BHI;BecktonDickinson,Co.)血琼脂平板上,无需选择或诱导与Bt细胞接合。将该接合涂片刮下并且用1ml TYG液体培养基(Holdeman等人,Anaerobe Laboratory Manual,1977;Blacksburg,Va.,Virginia Polytechnic Institute and State University Anaerobe Laboratory)重构。对于TYG培养基中的每个接合质粒样品,100 µl在TYG培养基中的1:10稀释物在25 µg/ml红霉素(Em)和200 µg/ml庆大霉素(Gm) BHI 10%血琼脂平板上进行铺平板,导致数百个菌落/接合(图5A)。由于拟杆菌属的repA复制起点,这些质粒可以得到维持。在25 μg/ml红霉素(Em)和200 μg/ml庆大霉素(Gm)选择下,挑选来自每次接合的单个菌落用于持续的TYG培养基液体培养物生长,随后为质粒纯化以验证正确的质粒维持。pmobA.repA.CRISPR-CDA引导区的PCR扩增和桑格测序验证了每个质粒的正确引导序列。获得了三种pmobA.repA.CRISPR-CDA稳定维持的质粒菌株,其标记为NT (非靶向)、BT_0362和BT_0364,用于随后的诱导型CRISPR碱基编辑实验。NT、BT_0362和BT_0364 pmobA.repA.CRISPR-CDA质粒菌株的单个菌落在含有5 ml TYG液体培养基的falcon管培养物中的coy室(CoyLaboratory Products Inc.)中厌氧生长过夜,所述TYG液体培养基补充有200 µg/ml庆大霉素(Gm)、25 µg/ml红霉素(Em)和100 ng/ml aTc。然后将来自这些培养物的样品用塑料环划线培养到补充有100 ng/ml aTc的BHI 10%血琼脂平板(Gm 200 μg/mL和Em 25 μg/mL)上。使琼脂平板在37℃下厌氧温育2-3天。对于所有3种菌株,沿着在每块血琼脂平板上的环划线区域获得了各个菌落(图5B)。
从这三块aTc100琼脂平板中挑选菌落。执行BT_0362和BT_0364区域的菌落PCR,随后为桑格测序。使用MilliporeSigma内部开发的软件的定量突变分析指示,BT_0362和BT_0364碱基编辑的样品aTc100琼脂平板包含对于BT_0362样品在相对于PAM的-17位置处,以及对于BT_0364样品在相对于PAM的-18、-19和-20位置处的预计的C至T取代。代表性的BT_0362和BT_0364样品显示于(图6A和B)中。这些C-T取代导致在BT_0362和BT_0364碱基编辑样品两者中的早期终止密码子引入。NT菌株在aTC诱导后并未显示在靶向BT_0362或BT_0364区域中的任何C-T取代。
这个分析软件被称为“SangerTrace”。它基于Applied Biosystem’s,Inc.格式(ABI)文件提取每个碱基信号峰值,并且通过比较“对照”和“样品”的桑格测序数据来计算突变百分比。
实施例3. 其它拟杆菌属菌株中的CRISPR碱基编辑
基于公开的基因组序列,NBU2整合酶重组tRNA-ser位点(5’-CCTGTCTCTCCGC-3’(SEQ ID NO: 2)是保守的,并且存在于许多拟杆菌属菌株中,包括普通拟杆菌、解纤维素拟杆菌、脆弱拟杆菌、溃疡拟杆菌、卵形拟杆菌、萨氏拟杆菌、单形拟杆菌和解木糖拟杆菌。表达靶向引导RNA的诱导型CRISPR-CDA盒可以整合到这些拟杆菌属菌株的染色体上,并且可以通过用aTc诱导剂处理来实现表达靶向引导RNA的菌株中的特定基因的靶向CRISPR-CDAC至T碱基编辑(如实施例1中所述)。在其中特定物种的染色体上不存在NBU2整合酶位点的情况下,这13个碱基对的DNA序列可以如本领域中描述的经由重组(例如,Cre//oxP)或等位基因交换容易地***染色体上,以允许染色体CRISPR-CDA整合和靶向基因碱基编辑。
实施例4. 小鼠肠道中的拟杆菌属的CRISPR碱基编辑
小鼠肠道原位的特定拟杆菌属物种的靶向、诱导型CRISPR-CDA C至T碱基编辑,可以通过经由细菌接合通过NBU2整合酶介导的CRISPR-CDA盒整合到其基因组的染色体上来进行,所述CRISPR-CDA盒表达靶向物种特异性前间隔序列的引导RNA。在示例性的情况下,小鼠是由一种或多种拟杆菌属定殖的定菌动物,所述拟杆菌属衍生自哺乳动物肠道微生物群,包括人。aTc诱导剂可以在特定的时间点应用于小鼠肠道,导致肠道微生物群的物种中特定基因的靶向突变或失活。
Figure IDA0003699748150000011
Figure IDA0003699748150000021
Figure IDA0003699748150000031
Figure IDA0003699748150000041
Figure IDA0003699748150000051
Figure IDA0003699748150000061
Figure IDA0003699748150000071
Figure IDA0003699748150000081
Figure IDA0003699748150000091
Figure IDA0003699748150000101
Figure IDA0003699748150000111
Figure IDA0003699748150000121
Figure IDA0003699748150000131
Figure IDA0003699748150000141
Figure IDA0003699748150000151

Claims (37)

1. 一种蛋白质-核酸复合物,其包含与细菌细胞的染色体缔合的改造的RNA引导的核碱基修饰***,其中所述改造的RNA引导的核碱基修饰***靶向细菌细胞的染色体中的特定基因座,并且所述细菌细胞的染色体编码HU家族DNA结合蛋白,其包含与SEQ ID NO: 1具有至少50%序列同一性的氨基酸序列。
2. 权利要求1的蛋白质-核酸复合物,其中所述改造的RNA引导的核碱基修饰***包括(i)包含CRISPR蛋白和引导RNA (gRNA)的CRISPR***、以及(ii)核碱基修饰酶或其催化结构域,其中所述CRISPR蛋白是核酸酶缺陷型变体或切口酶。
3.权利要求2的蛋白质-核酸复合物,其中所述CRISPR***是I型CRISPR***、II型CRISPR***、III型CRISPR***、IV型CRISPR***、V型CRISPR***或VI型CRISPR***。
4.权利要求2或3的蛋白质-核酸复合物,其中所述CRISPR蛋白是Cas9、Cas12、Cas13、Cas14或CasX。
5. 权利要求2至4中任一项的蛋白质-核酸复合物,其中所述gRNA是双分子gRNA,其包含CRISPR RNA (crRNA)和反式作用crRNA (tracrRNA)。
6. 权利要求2至4中任一项的蛋白质-核酸复合物,其中所述gRNA是单分子gRNA,其包含CRISPR RNA (crRNA)和反式作用crRNA (tracrRNA)的融合杂合体。
7. 权利要求2至6中任一项的蛋白质-核酸复合物,其中所述核碱基修饰酶或其催化结构域选自胞苷脱氨酶1 (CDA1)、胞苷脱氨酶2 (CDA2)、活化诱导胞苷脱氨酶(AICDA)、载脂蛋白B mRNA编辑复合物(APOBEC)家族胞苷脱氨酶、APOBEC1互补因子/APOBEC1刺激因子(ACF1/ASF)胞苷脱氨酶、作用于RNA的胞嘧啶脱氨酶(CDAR)、作用于tRNA的胞嘧啶脱氨酶(CDAT)、tRNA腺嘌呤脱氨酶、腺苷脱氨酶、作用于RNA的腺苷脱氨酶(ADAR)或作用于tRNA的腺苷脱氨酶(ADAT)。
8.权利要求2至7中任一项的蛋白质-核酸复合物,其中所述核碱基修饰酶或其催化结构域是胞苷脱氨酶或其催化结构域,并且所述改造的RNA引导的核碱基修饰***进一步包含至少一种尿嘧啶糖基化酶抑制剂结构域。
9.权利要求2至8中任一项的蛋白质-核酸复合物,其中所述CRISPR蛋白直接或经由接头连接至所述核碱基修饰酶或其催化结构域。
10.权利要求2至8中任一项的蛋白质-核酸复合物,其中所述核碱基修饰酶或其催化结构域直接或经由接头连接至衔接蛋白,并且所述CRISPR蛋白或所述gRNA包含能够与衔接蛋白结合的适体序列。
11.权利要求10的蛋白质-核酸复合物,其中所述适体序列选自MS2/MSP、PP7/PCP、Com、N22、AP205、BZ13、F1、F2、fd、fr、GA、ID2、JP34、JP500、JP501、KU1、M11、M12、MX1、NL95、PRR1、ϕCb5、ϕCb8r、ϕCb12r、ϕCb23r、Qβ、R17、SP、TW18、TW19、VK或7s。
12.权利要求2至11中任一项的蛋白质-核酸复合物,其中所述改造的RNA引导的核碱基修饰***包含与胞苷脱氨酶或其催化结构域连接的核酸酶缺陷型Cas9或Cas12a变体。
13.权利要求1至12中任一项的蛋白质-核酸复合物,其中所述改造的RNA引导的核碱基修饰***由核酸表达,所述核酸编码改造的RNA引导的核碱基修饰***,并且整合到细菌染色体内。
14.权利要求1至12中任一项的蛋白质-核酸复合物,其中所述改造的RNA引导的核碱基修饰***由核酸表达,所述核酸编码改造的RNA引导的核碱基修饰***,并且在染色体外载体上携带。
15. 权利要求1至14中任一项的蛋白质-核酸复合物,其中在所述细菌细胞的染色体上编码的所述HU家族DNA结合蛋白的氨基酸序列与SEQ ID NO: 1具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的序列同一性。
16.权利要求1至15中任一项的蛋白质-核酸复合物,其中所述细菌是拟杆菌属物种或其菌株水平变种。
17. 权利要求16的蛋白质-核酸复合物,其中所述拟杆菌属物种或其菌株水平变种选自多形拟杆菌(Bacteroides thetaiotaomicron)、普通拟杆菌(Bacteroides vulgatus)、解纤维素拟杆菌(B.cellulosilyticus)、脆弱拟杆菌(Bacteroides fragilis)、溃疡拟杆菌(B. helcogenes)、卵形拟杆菌(B. ovatus)、萨氏拟杆菌(B. salanitronis)、单形拟杆菌(B. uniformis)或解木糖拟杆菌(B. xylanisolvens)。
18. 一种用于修饰靶细菌细胞的染色体中的至少一个核碱基的方法,所述方法包括在靶细菌细胞中表达改造的RNA引导的核碱基修饰***,其中所述改造的RNA引导的核碱基修饰***靶向靶细菌细胞的染色体中的特定基因座,并且所述改造的RNA引导的核碱基修饰***修饰在特定基因座内的至少一个核碱基,使得包含特定基因座的基因的表达被改变、修饰和/或失活,并且其中所述靶细菌细胞的染色体编码HU家族DNA结合蛋白,其包含与SEQID NO: 1具有至少50%序列同一性的氨基酸序列。
19.权利要求18的方法,其中所述至少一种核碱基的修饰导致在所述靶细菌细胞的染色体中的特定基因座内的至少一种单核苷酸多态性和/或至少一个终止密码子引入。
20. 权利要求18至19中任一项的方法,其中所述改造的RNA引导的核碱基修饰***包括(i)包含CRISPR蛋白和引导RNA (gRNA)的CRISPR***、以及(ii)核碱基修饰酶或其催化结构域,其中所述CRISPR蛋白是核酸酶缺陷型CRISPR变体或CRISPR切口酶。
21.权利要求20的方法,其中所述CRISPR***是I型CRISPR***、II型CRISPR***、III型CRISPR***、IV型CRISPR***、V型CRISPR***或VI型CRISPR***。
22.权利要求20或21的方法,其中所述CRISPR蛋白是Cas9、Cas12、Cas13、Cas14或CasX。
23. 权利要求20至22中任一项的方法,其中所述gRNA是双分子gRNA,其包含CRISPRRNA (crRNA)和反式作用crRNA (tracrRNA)。
24. 权利要求20至22中任一项的方法,其中所述gRNA是单分子gRNA,其包含CRISPRRNA (crRNA)和反式作用crRNA (tracrRNA)的融合杂合体。
25. 权利要求20至24中任一项的方法,其中所述核碱基修饰酶或其催化结构域选自胞苷脱氨酶1 (CDA1)、胞苷脱氨酶2 (CDA2)、活化诱导胞苷脱氨酶(AICDA)、载脂蛋白B mRNA编辑复合物(APOBEC)家族胞苷脱氨酶、APOBEC1互补因子/APOBEC1刺激因子(ACF1/ASF)胞苷脱氨酶、作用于RNA的胞嘧啶脱氨酶(CDAR)、作用于tRNA的胞嘧啶脱氨酶(CDAT)、tRNA腺嘌呤脱氨酶、腺苷脱氨酶、作用于RNA的腺苷脱氨酶(ADAR)或作用于tRNA的腺苷脱氨酶(ADAT)。
26.权利要求20至25中任一项的方法,其中所述核碱基修饰酶或其催化结构域是胞苷脱氨酶或其催化结构域,并且所述改造的RNA引导的核碱基修饰***进一步包含至少一种尿嘧啶糖基化酶抑制剂结构域。
27.权利要求20至26中任一项的方法,其中所述CRISPR蛋白直接或经由接头连接至所述核碱基修饰酶或其催化结构域。
28.权利要求20至26中任一项的方法,其中所述核碱基修饰酶或其催化结构域直接或经由接头连接至衔接蛋白,并且所述CRISPR蛋白或所述gRNA包含能够与衔接蛋白结合的适体序列。
29.权利要求28的方法,其中所述适体序列选自MS2、PP7、Com、N22、AP205、BZ13、F1、F2、fd、fr、GA、ID2、JP34、JP500、JP501、KU1、M11、M12、MX1、NL95、PRR1、ϕCb5、ϕCb8r、ϕCb12r、ϕCb23r、Qβ、R17、SP、TW18、TW19、VK或7s。
30.权利要求20至29中任一项的方法,其中所述改造的RNA引导的核碱基修饰***包含与胞苷脱氨酶或其催化结构域连接的核酸酶缺陷型Cas9或Cas12a变体。
31.权利要求20至30中任一项的方法,其中所述核碱基修饰酶或其催化结构域、所述CRISPR蛋白和所述gRNA由整合到靶细菌细胞的染色体内的至少一种核酸表达。
32.权利要求20至31中任一项的方法,其中所述核碱基修饰酶或其催化结构域、所述CRISPR蛋白和所述gRNA由在染色体外载体上携带的至少一种核酸表达。
33.权利要求31或32的方法,其中编码CRISPR蛋白的核酸与诱导型启动子可操作地连接。
34.权利要求33的方法,其中所述启动子诱导化学制品是脱水四环素。
35. 权利要求18至34中任一项的方法,其中在所述靶细菌细胞的染色体中编码的所述HU家族DNA结合蛋白的氨基酸序列与SEQ ID NO: 1具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%的序列同一性。
36.权利要求18至35中任一项的方法,其中所述靶细菌细胞是拟杆菌属物种或其菌株水平变种。
37.权利要求36的方法,其中所述拟杆菌属物种或菌株水平变种属于定义为多形拟杆菌、普通拟杆菌、解纤维素拟杆菌、脆弱拟杆菌、溃疡拟杆菌、卵形拟杆菌、萨氏拟杆菌、单形拟杆菌或解木糖拟杆菌的***发育组。
CN202080087712.5A 2019-12-17 2020-12-17 拟杆菌属中的基因组编辑 Pending CN114829602A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962949314P 2019-12-17 2019-12-17
US62/949314 2019-12-17
PCT/US2020/065654 WO2021127209A1 (en) 2019-12-17 2020-12-17 Genome editing in bacteroides

Publications (1)

Publication Number Publication Date
CN114829602A true CN114829602A (zh) 2022-07-29

Family

ID=74285544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080087712.5A Pending CN114829602A (zh) 2019-12-17 2020-12-17 拟杆菌属中的基因组编辑

Country Status (9)

Country Link
US (1) US20210180071A1 (zh)
EP (1) EP4077675A1 (zh)
JP (1) JP2023507163A (zh)
KR (1) KR20220116512A (zh)
CN (1) CN114829602A (zh)
AU (1) AU2020405038A1 (zh)
CA (1) CA3156789A1 (zh)
IL (1) IL292517A (zh)
WO (1) WO2021127209A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024085539A1 (ko) * 2022-10-17 2024-04-25 한국생명공학연구원 박테로이데스 속에 속하는 미생물에서 작동하는 에피솜 벡터

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002077183A2 (en) * 2001-03-21 2002-10-03 Elitra Pharmaceuticals, Inc. Identification of essential genes in microorganisms
US10956422B2 (en) 2012-12-05 2021-03-23 Oracle International Corporation Integrating event processing with map-reduce
CA2943775A1 (en) * 2014-03-25 2015-10-01 Ginkgo Bioworks, Inc. Methods and genetic systems for cell engineering
EP3365027B1 (en) * 2015-10-14 2022-03-30 Research Institute at Nationwide Children's Hospital Hu specific antibodies and their use in inhibiting biofilm
JP7109784B2 (ja) * 2015-10-23 2022-08-01 プレジデント アンド フェローズ オブ ハーバード カレッジ 遺伝子編集のための進化したCas9蛋白質
JP2020510439A (ja) * 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
US20200181623A1 (en) * 2017-05-18 2020-06-11 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
WO2019005886A1 (en) * 2017-06-26 2019-01-03 The Broad Institute, Inc. CRISPR / CAS-CYTIDINE DEAMINASE COMPOSITIONS, SYSTEMS AND METHODS FOR TARGETED EDITING OF NUCLEIC ACIDS
EP3752607A1 (en) 2018-02-15 2020-12-23 Sigma Aldrich Co. LLC Engineered cas9 systems for eukaryotic genome modification
AU2019265019A1 (en) * 2018-05-11 2020-11-26 Beam Therapeutics Inc. Methods of substituting pathogenic amino acids using programmable base editor systems
JP2022549519A (ja) * 2019-09-30 2022-11-25 シグマ-アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニー 標的化ヌクレアーゼを用いたマイクロバイオータ組成の調節

Also Published As

Publication number Publication date
WO2021127209A1 (en) 2021-06-24
US20210180071A1 (en) 2021-06-17
CA3156789A1 (en) 2021-06-24
EP4077675A1 (en) 2022-10-26
KR20220116512A (ko) 2022-08-23
IL292517A (en) 2022-06-01
JP2023507163A (ja) 2023-02-21
AU2020405038A1 (en) 2022-04-21

Similar Documents

Publication Publication Date Title
CN107208070B (zh) 细菌基因的靶向消除
CN107787367B (zh) 用于crispr/cas介导的基因调控的化学修饰的引导rna
US10913941B2 (en) Enzymes with RuvC domains
AU2014287397B2 (en) Orthogonal Cas9 proteins for RNA-guided gene regulation and editing
EP3510151A1 (en) High-throughput precision genome editing
CN110520163A (zh) 独立于dna双链断裂的靶向基因编辑平台及其用途
CA2759882A1 (en) Novel dna cloning method
CN114929873A (zh) 使用靶向核酸酶调节微生物群的组成
US20230374482A1 (en) Base editing enzymes
AU2011273176A1 (en) Self-deleting plasmid
US20220056457A1 (en) Cis conjugative plasmid system
US20220220460A1 (en) Enzymes with ruvc domains
CN113774077A (zh) 一种应用于结核分枝杆菌的单碱基基因编辑***及方法
US20210180071A1 (en) Genome editing in bacteroides
CN114630670A (zh) 用于将基因编辑***递送至真核细胞的细菌平台
US20230159957A1 (en) Compositions and methods for modifying a target nucleic acid
US20210093679A1 (en) Engineered gut microbes and uses thereof
Lobanova et al. Genome engineering of the Corynebacterium glutamicum chromosome by the Extended Dual-In/Out strategy
US20230348877A1 (en) Base editing enzymes
US20230295667A1 (en) Use of anti-crispr agents to control editing in human embryos
Disha et al. Factors and Conditions That Impact Electroporation of Clostridioides difficile Strains
EP4384616A2 (en) High-throughput precision genome editing in human cells
WO2024023734A1 (en) MULTI-gRNA GENOME EDITING
CN116867897A (zh) 碱基编辑酶

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination