CN116751764B - 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用 - Google Patents

一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用 Download PDF

Info

Publication number
CN116751764B
CN116751764B CN202310510300.3A CN202310510300A CN116751764B CN 116751764 B CN116751764 B CN 116751764B CN 202310510300 A CN202310510300 A CN 202310510300A CN 116751764 B CN116751764 B CN 116751764B
Authority
CN
China
Prior art keywords
cas9
gene editing
crispr
sequence
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310510300.3A
Other languages
English (en)
Other versions
CN116751764A (zh
Inventor
田瑞
赵停停
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Shutong Medical Technology Co ltd
Original Assignee
Zhuhai Shutong Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Shutong Medical Technology Co ltd filed Critical Zhuhai Shutong Medical Technology Co ltd
Priority to CN202311513462.9A priority Critical patent/CN117757774A/zh
Priority to CN202310510300.3A priority patent/CN116751764B/zh
Priority to CN202311513465.2A priority patent/CN117448300B/zh
Publication of CN116751764A publication Critical patent/CN116751764A/zh
Application granted granted Critical
Publication of CN116751764B publication Critical patent/CN116751764B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于基因工程技术领域,公开了一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用。本发明筛选了一种Cas9蛋白,其氨基酸序列如SEQ ID NO.1~3中任一种序列所示。本发明还提供了一种编码Cas9蛋白的核苷酸序列。本发明提供了一种II型CRISPR/Cas9基因编辑***,包括上述的Cas9蛋白、辅助蛋白、CRISPR RNA和tracrRNA序列。采用本发明的II型CRISPR/Cas9基因编辑***能够在crRNA的引导下,在原核细胞或真核细胞中行使基因编辑功能。本发明Cas9蛋白及基因编辑***的发现扩大了基因编辑工具的种类,对推动基因编辑应用于临床治疗具有重要的作用。

Description

一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用
技术领域
本发明涉及基因工程技术领域,具体涉及一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用。
背景技术
CRISPR/Cas(Clustered Regularly Interspaced Palindromic Repeats/CRISPR-ass ociated proteins system)基因编辑技术作为第三代编辑工具,比第一代ZFNs(Zinc Finger Nucleases)和TALENs(Transcription Activator-like EffectorNucleases)相比,有着设计简单、成本较低和编辑效率高的优点,成为当今最主流的基因编辑***。CRISPR/Cas***是帮助细菌和古菌防御外来核酸入侵的自适应免疫***,作用原理为:当某些细菌在遭到病毒入侵后,能够把病毒基因的一小段储存到自身DNA里面,当病毒再次入侵时,细菌能够根据记忆读取识别出病毒基因,并将其切断以沉默表达。
CRISPR/Cas基因编辑***通过外源DNA的采集、crRNA的合成、靶向干扰这三个过程行使编辑功能。CRISPR array包含直接重复序列(Direct Repeat,DR),这些重复序列由外源DNA的独特间隔序列(Spacer)分离。CRISPR array被转录成长转录物(pre-crRNA,CRISPR RNA的前体),然后被加工处理以产生小的成熟的CRISPR RNA(crRNA),由间隔序列和部分相邻的直接重复组成。crRNA与Cas核酸内切酶形成复合物,在某些情况下,还与辅助蛋白形成复合物并用作靶向和切割外来核酸的指南,从而实现干扰。Cas–crRNA复合物的DNA识别需要靶位点附近存在原间隔物相邻基序(PAM,Proto-spacer Adjacent Motif),这有助于自我与非自我辨别。CRISPR/Cas基因编辑***根据不同蛋白酶数量大致分为两类:I类***使用多种Cas蛋白的复合物,如Cascade,而II类***使用单一效应酶,如Cas9。目前,II型CRISPR/Cas基因编辑***已成为基因编辑中重要的工具。
现有技术中,源自化脓链球菌(Streptococcus pyogene Cas,SpCas9)的II型***因其切割效率高,成为现下应用最为广泛的基因编辑***。这一***通过识别序列为NGG的PAM靶向切割。然而,这一PAM要求也限制了SpCas9的应用,某些靶位点可能因存在较少GG而无法使用SpCas9进行识别与编辑。因此,基于现有II型CRISPR/Cas9***存在的不足,急需开发新的CRISPR/Cas基因编辑***。
发明内容
本发明的目的在于克服现有技术的不足之处而提供一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用。
为实现上述目的,本发明采取的技术方案如下:
第一方面,本发明筛选了一种Cas9蛋白,所述Cas9蛋白的氨基酸序列如SEQ IDNO.1~3中任一种序列所示。
本发明筛选得到三种新型编辑***的Cas9蛋白分别来自:一种未注释细菌继而将其命名为HqCas9;Dialister sp.900538805细菌中的DspCas9;Dialistersuccinatiphilus细菌中的DsuCas9。采用本发明Cas9蛋白的II型CRISPR/Cas9基因编辑***可识别多种不同的PAM序列,HqCas9识别的PAM序列为NGNGNC,相对比较复杂的PAM可以更精确的识别靶位点,提高Cas9蛋白识别的精确性。DspCas9与DsuCas9所识别的PAM相近,第4位和第5位均为A,两个蛋白都可识别PAM为NNNAA的靶位点。通过对人类基因组上“AA”序列位点覆盖的长度频率进行分析,平均每隔5bp就有一个AA出现,这极大的增加了DspCas9与DsuCas9在人类基因组上的靶向范围,克服了SpCas9的局限性。
第二方面,本发明提供一种编码Cas9蛋白的核苷酸序列,所述核苷酸序列如SEQID NO.10~12中任一种序列所示。
第三方面,本发明提供了一种II型CRISPR/Cas9基因编辑***,包括上述的Cas9蛋白、辅助蛋白、CRISPR RNA和tracrRNA序列。
采用本发明的II型CRISPR/Cas9基因编辑***能够在crRNA的引导下,在原核细胞或真核细胞中行使基因编辑功能。本发明的基因编辑***的发现扩大了基因编辑工具的种类,对推动基因编辑应用于临床治疗具有重要的作用。
作为本发明所述的II型CRISPR/Cas9基因编辑***的优选实施方式,所述tracrRNA序列包括重复序列,所述重复序列如SEQ ID NO.7~9中任一种序列所示。进一步的,所述的tracrRNA序列如SEQ ID NO.14~16中任一种序列所示。
作为本发明所述的II型CRISPR/Cas9基因编辑***的优选实施方式,所述辅助蛋白的核苷酸序列如SEQ ID NO.4~6中任一种序列所示。
第四方面,本发明将所述II型CRISPR/Cas9基因编辑***在原核或真核生物基因编辑中的应用。
第五方面,本发明将所述II型CRISPR/Cas9基因编辑***在制备生物基因编辑制剂中的应用。
与现有技术相比,本发明的有益效果为:
(1)本发明的三种II型CRISPR/Cas9基因编辑***可以识别特定的PAM序列(NGNGNC、NNNAA、NNNAA),能够在crRNA的引导下在原核环境或真核细胞中行使基因编辑功能,极大的增加了可靶向的范围,克服了SpCas9的局限性。
(2)采用本发明Cas9蛋白的II型CRISPR/Cas9基因编辑***能够在crRNA的引导下,在原核细胞或真核细胞中行使基因编辑功能。本发明Cas9蛋白及基因编辑***的发现扩大了基因编辑工具的种类,对推动基因编辑应用于临床治疗具有重要的作用。
附图说明
图1为本发明CRISPR/Cas9基因编辑***的进化树、***组成和蛋白生物信息学分析结果示意图。
图2为本发明三种CRISPR/Cas9基因编辑***的原核PAM序列图。
图3为本发明三种CRISPR/Cas9基因编辑***的原核干扰图。
图4为本发明三种CRISPR/Cas9基因编辑***的NC确认原核干扰图。
图5为本发明三种CRISPR/Cas9基因编辑***的scaffold结构图。
图6为本发明三种CRISPR/Cas9基因编辑***的真核细胞spacer最适长度探究图。
图7为本发明所述三种CRISPR/Cas9基因编辑***的GUIDE-seq在靶与脱靶检测图。
具体实施方式
为更好地说明本发明的目的、技术方案和优点,下面将结合具体实施例对本发明作进一步说明。本领域技术人员应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。本发明所述Cas9核酸内切酶是一种DNA内切酶。本发明所述的碱基序列中的所述N,表示A、G、C、T中的任意一种。本发明所述的Cas9蛋白,是一种多结构域的DNA核酸内切酶,包括REC结构域、RuvC结构域、HNH结构域和PI结构域,它能识别在PAM5’端识别与sgRNA互补的DNA序列,分别通过HNH结构域切割与sgRNA互补的DNA链,RuvC结构域切割非互补链DNA。本发明所述的crRNA,以碱基互补的方式引导Cas蛋白识别入侵的DNA,5’端为间隔序列,与靶DNA互补,3’端为重复序列。本发明所述CRISPR/Cas9基因编辑***还需要tracrRNA的参与,tracrRNA是单独转录的,tracrRNA与pre-crRNA通过剪辑互补配对结合,经过RNA酶III酶切处理将pre-crRNA的5’部分间隔序列和3’部分重复序列,形成成熟的crRNA,与tracrRNA结合形成tracrRNA-crRNA复合体,通过在crRNA下游和tracrRNA上游之间添加四个碱基的tetraloop(如“GAAA”、“TGAA”或“AAAC”序列)可以将tracrRNA和crRNA连接起来形成scaffold。通过调节tracrRNA的长度以及可识别间隔序列的长度能进一步优化Cas9核酸内切酶的切割功能。
实施例中所用的试验方法如无特殊说明,均为常规方法;所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1:三种新型CRISPR/Cas9基因编辑***
利用宏基因组生物信息手段对II型CRISPR/Cas9基因编辑***相关蛋白及其元件进行分析、预测、筛选,利用CRISPRCas Finder软件进行宏基因组注释,通过NUPACK软件预测crRNA和tracrRNA的二级结构,使用HHpred软件预测功能域,并利用FastTree软件构建***发育树。提供了三种新II型CRISPR/Cas9基因编辑***,包括Cas9蛋白、辅助蛋白、CRISPRRNA和tracrRNA,如图1所示。
本发明筛选得到三种新型编辑***的Cas9蛋白,分别来自:一种未注释细菌继而将其命名为HqCas9;Dialister sp.900538805细菌中的DspCas9;Dialistersuccinatiphilus细菌中的DsuCas9。HqCas9蛋白编码1353个氨基酸,其序列如SEQ ID NO.1所示;DspCas9蛋白编码1383个氨基酸,其序列如SEQ ID NO.2所示;DsuCas9蛋白编码1389个氨基酸,其序列如SEQ ID NO.3所示。将3种Cas9蛋白与已发表的其他14种II型CRISPR/Cas9基因编辑***进行***发育树分析,显示HqCas9、DspCas9、DsuCas9归为Type II A这一支,三种Cas9蛋白之间序列相似性较高,与FrCas9亲缘关系最近,进化树如图1A所示。
所得CRISPR/Cas9基因编辑***由以下多个元件组成:基因编码的Cas9核酸内切酶,辅助蛋白Cas1、Cas2、Csn2、CRISPR array以及反式激活CRISPR RNA(trans-activatingcrRNA,tracrRNA)。本发明所述三种新型CRISPR/Cas9基因编辑***的组成图如图1B所示、Cas9蛋白结构图如图1C所示。辅助蛋白Cas1,其序列如SEQ ID NO.4所示;辅助蛋白Cas2,其序列如SEQ ID NO.5所示;辅助蛋白Csn2,其序列如SEQ ID NO.6所示。三种辅助蛋白参与外源基因捕获,以及crRNA的成熟。
CRISPR array包括直接重复序列和间隔序列,这两种序列是间隔排列的,两个重复序列中间夹一个间隔序列,重复序列在同一细菌中的碱基组成和长度是相对保守的,在不同的细菌之间会有些许差异。本发明的三种新型CRISPR/Cas9基因编辑***所对应的重复序列,依次如SEQ ID NO.7~9所示。
上述序列信息如下:
SEQ ID NO.1:
MQTKKVDEYYVGFDIGTNSVGYAVTDKNYNLIKHGGEPMWGSHVFEAASTAQERRTFRTARRRNDRKKQRIALVSEIFAPEIAKVDPRFFIRRRESALFRDDVDIKDRYVVFNDDDFTDKDYYDIYPTIHHLIYDLMSNKEKHDIRLVYMACAYLVAHRGHFLSEVSKDNIEDVLDFDVVYCNFLNVMDNYAEIPWKCDISKFKEILKKKQTVTNKEREFLQLLNEGKKFKTSEEDDVSREGLVKLLSGGTYELGKLFPKLTFEEKVSVSFNMAEEDFAMVLQQLGDEGDIISSLRNVYDWAILSDVLNGKNSVSEGKITVYEQHKKDLSFLKYFVKKYIPNRYYEVFRDGNIVGNYVSYSYNLKNVQNVSKFKGAKKDVFCDYIKKVVKDIKVDDEDKVEYEDMMFRLDTYSFIPKQVENDNRVIPYQLYYYELKRILDNASSYLEFLDEKDMDGYTSREKLLSIMEFRIPYYVGPLRTDNGQHGWMKRKAEGRIYPWNFEDKVDLDASEQEFINRMTNSCTYLPGETVVPKYSLLYCKFNVLNEINNIKINDCSIPIEHKQGIYKLFERYRKVTPKKIKDFLISNNLLHPEDVISGIDVTIKSSLKSYHDFKKLLESCVLKENQVEAIIERLTYSEDKGRILRWLHMEFPDLSDDDVKYISKLKYSDFGRLSRKLLVGIRGCNKDTGEVDSIMGMLWSTNDNMMKLLSNSYTFIEEIEAIKNEYYVEHPANLDSMLDEMYVSNAVRRPIHRTLDILSDIRKVCGKNPSKIFVEMARGGGEKGVRTKSRRDQISELYKNMDKAEVRELSEQLEGKTDNELQSEVLFLYFMQLGKCAYTQKTIDIDKLKTNIYNVDHIYPQSYVKDDSITNKVLVISEENGQKGDKYPISKDIREKMQPFWYRLLSNKLISEEKYRRLTRCTSFTEEELTGFINRQLVETHQSTKAVTTVFRTLFPDVEIVYSKAGLVSEFRKEFDMLKTRSVNDLHHAKDAYLNIVVGNVYHCRFTKNFYITQKYSLKTKTLFTHSVKLGDDVIWNGQESIGNVRKVLAKNNIHYTKYPFMRKGGLFDQMPVKAAAGLIPRKTGLDTEKYGGYNKSTATAFLLVKYKEKGKQEAMIMPVDYMYSEKVFSDNEYALKYSKENIKKIWGRTEDQVIDVSLPLGLRPIKINTMLSFDGFRACITGKANAGQKIGFTSMMPLVIGNEWENYIKKIDNYIEKKGKNKNITLNEKNDGICGEKNEKLYCILTDKIINNIYSIPFNSQQKILENGYDKFKKLDIERQVYFLQNLVLVLKSGRAGSCDMSAIGGSKNAATFAFGSKLSLWAKKFQKVYLIDNSSSGIYQNMSDNLLDIIK;
SEQ ID NO.2:
MMKEIKNYFIGLDMGTTSVGWAATDENYEIIKKNGKALWGIRLFDEAQTAADRRMHRIARRRIERRSRRIDLLQELFAQEICKKDPGFYERLNESGLYEEDKTVHQKNSLFNDVDFDDKAYYKEYPTIYHLRYDLMTKDRPFDVRLVYLAVHHILKHRGHFLFDHFQVDENGVSGFEESFAAFGDALEHIKGESFDMGKEEEMKALCRDKKLGVRHKALALAQCLGRSKDKDFKAMMTLAAGGTALLSEVFKDEGLKDFSKNKVSFSDSQFENDKPEIIAELGDRYDLIAALHGLYNWSFLAELMRGHKYISEAKIEIYDKHKEDLALLKKVLKQDRSVYNLMFKEPGDKKPINYSAYVKACKTNGKKLPLPYGKFKYEEFIKTVKFCLKNLPDSPDKKNIENKLEEGSFLLKAVSVENGAIPYQLHLQELKIILSKAEAYLPFLKVRDQYGTVSDKIISLFTFRIPYYVGPINEHAGSCWVVKKDKQGKVYPWNFTEKIDIEKSAEGFIRNLTNKCTYLIGEDVLPKNSLLYSEFTVLNELNNVRIGENAQKLSPELKEKVLENLFKKHKHVSRRKFINYLVTEGIDKKEAESISGLDGDFKSSMSSLIDMKHILGNDFSREDAEKMIKDITIFGGDKKMLKKRLHREFSYLTSEQLTSLTRLSYDGWGRLSKELLVNLLPVEKSTGEVLVDKGSGEVLNIISAMEQTSYNLMELLSSRFGYATAIEERNREKEGNGTISYQDVEDMYISPAVKRPLWQALKIVREIVKILGKEPSKIFIEMARENGEKGKRTISRKARLQELYKKCRDDSRDWAKELAEKPEEDFRSDRLYLYYTQMGRSMYTGKPIDINQLFDRNVYDIDHIYPQSLTGDDSLDNRVLVEKTVNAKKGDIYPLGSALDGCHIQGEIHIQDIQREMRPFWHMLLEKGLISKEKYNRLSRTTPLSDTEKAAFIGRQLVETRQSTKACAELLSKAYPQARIVYTKAGNASRFRQYGGFIKVRDMNDYHHAKDAYLNIVVGNVFDTRFTANPLHFLKGNHPVYSLNTEALYGHKVSRGGVDAWIPPEKDDEGHIMAGHEGTMGTVRKWMRKNNILFTRMPLEGKGGLFDQTIMKKGKGQVPLKGDSPVSDIEKYGGYNKASSAYFVLTSSKLKDETIYTIETIPLIIKRMIQTNKDKEDYIKRHWKDHGKKMVNPHICYGHIPVQSLLEINGFKVHLTGKSGKDFKLRNAEQLCISNDDAAVLKRVLKYNERSSLSKGKEALLITPFDNIQEVDLNRLYQVFEDKLTNQVYKVKLGKQASVLKKGEDKFNELPLEVKCRVIGEILHLFQCNAAIADLRLIGGAKNAGALTMNPRVSPEDHVYLIEQSVTGFFEKRILLAPYGGK;
SEQ ID NO.3:
MKEIKKIFIGLDMGTNSVGWTATDENYEVIKKNGKALWGIRLFDEAQTAEDRRMHRIARRRIERRSRRIDLLQELFAQEICKKDPGFYERLNESGLYEEDKTVHQTNSLFNDVDFNDKAYYKKYPTIYHLRHALMTENHPFDVRLVYLAIHHILKHRGHFLFENFQTDEKGTSGFDESFAAFGSALDRIKGSSPDVRKADSMKDILKDKKLGVKEKAASLLQCLGQGKEKDFKAMMTLAAGGTASLSDIFNDEKLKDFEKNKVNFSSAQFEENEPDIMAELGDRYDLIAALHGFYNWSLLAELMGEYHYISEAKIAVYDKHKADLKVLKRVLKQRPDIYAKIFREPGSSANKNYSAYVGVCKVKGKKAAIEKCSYEDFTKTLKPCLKDMPDSNDKDYISRELNMGTFLPKSVSKENGVIPYQLHLQELKIILSKAEAYLPFLKVKDQYGTVSDKIISLFTFRIPYYVGPINEHAGSCWVVKKDKRGKVYPWNFTEKIDIEKSAEGFIRNLTNKCTYLIGEDVLPKNSLLYSEFTVLNELNNVRIGETMQKLPLRLKEKVMDNLFSRYKHVSRTKFIKYLVSEGIDKKEAESISGLDGDFKSSLSSLIDMKHILGNDFSRENAEKMIQDITIFGGDKKMLKNRLHREFSYLTPEQLTSLTQLSYDGWGRLSKEFLVNLLPAEGDSCEVLVDHTSGEVLNIISAMRQTSYNLMELLGSRFGYGQAIEERNKKEEGQGRITYKDVEDLYISPAVRRPLWQALKIVREIVKITGKEPSKIFIEMARENGEKGKRTISRKARLQALYKKCRDDTRDWAKELEGKSEEDFRSDRLYLYYTQMGRSMYTGKPIDINRLFDRNVYDIDHIYPQSLTGDDSLDNRVLVEKTVNAKKGDTYPLSSALDGCYISGQQIRIQDIQKEMRPFWHMLLEKELISKEKYNRLSRTIPLSDAEKAAFIGRQLVETRQSTKACAELLSKAYPQTRIVYTKAGNASRFRQYGGFIKVRDMNDYHHAKDAYLNIVVGNVFNTRFTANPLHFLKGNHQAYSLNTEALYGHKVSRNGVDAWIPAEKDEKGQVMAGHEGTMGTVRKWMRKNNILFTRMPYEGKGGLFDQNIMKKEKGQVPIKGDSPISNIKKYGGYNKAKVAYFVLTQSKLNKKTVYTLEAIPLILKNSIQSNEDKETYIQKQWRKNGKKMEHPIVCLGHIPVQSLLEINGFKVHLSGKNGKDILLRNAEQLCINEADTAVLKKILKFNQRAAMSKKGEEIFINSFDNIQEEDLNRLYHVFEDKLTNQIYKVKLEKQAAVLKKGEETFNRLSPEQKCKLIGEILHLCQCKATHADLRLIGGAKKAGILTMGTQIYPKDHVYLIEQSVTGFFEKRILLAPFGEK;
SEQ ID NO.4:
MNQLVTGGISVLNKGEFIKKQILVYEPFLGDKMSYKNDNMVIRDGNGKIKYQVSCYRIFMVLIVGDVTITTGILRRQQKFGFRLCFLTLGLKVYSVIGPQLQGNTLLHCKQYAYDELTVGKSIIINKILNQRAALTRLRSKTEDVWECISLLEQYSKRLQNDSLNLQEIIGIEGMASKIYFPRIFSNTQWIGRKPRIKFDYINTLLDIGYNALFNFIDAILQVFGFDVYYGVLHTCFYMRKSLVCDIMEPMRPIVDWQIRKSINLKQFKQDDFVQVGKQYQLKYKKSTQYLQVFLEAILNYKEEIFVYVRDYYRSFMKNNPIEAYPVFKLEEL;
SEQ ID NO.5:
MIIVSYDISDDKLRTKFSKYLSRFGHRIQYSMFEIDNSERILNNIICDIHNQFEK KFSQEDSIYIFNLSKWCKIERFGYAKNETNDLLVLTGCKPRP;
SEQ ID NO.6:
MRFFHHIFSKPIIFRENKVNLLVIENKKLFANFVRDFSVQSRGEEGEILLSDDVSDLDFEKHAEVIADYFSLDFNGKKLSSKLITELKQSALYGFAGEAGELLGLLNSFGSKVISSVEFPLEWETVYDIGAVLKLFDYRLNVSSENFLEMLVDYMEVCSHFLKKDIFVLVNLKSYFDMEEIKLLYKEAFFRKWNLIVLEPSSSGSLHEYEDIVIIDKDICEIRLDNEEFL;
SEQ ID NO.7:
GTTTGAGAGTAATGTAAATTCATAGAGGTATAAGA;
SEQ ID NO.8:
GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAA;
SEQ ID NO.9:
GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAA。
实施例2:原核PAM耗竭实验
本实施例通过原核PAM耗竭实验挖掘本发明实施例1的II型CRISPR/Cas9基因编辑***Cas核酸酶识别间隔序列所需的PAM序列。HqCas9、DspCas9、DsuCas9的核苷酸序列分别如SEQ ID NO.10~12所示。
具体操作如下:
(1)在PAM library间隔序列(其序列如SEQ ID NO.14所示)的3’端添加6个位置随机碱基NNNNNN(共4096条***片段),采用overlap PCR方法把library构建到pUC19骨架载体上,得到具有4096种不同PAM组合的PAM library质粒,但5’端间隔序列是一样的spacer-PAM混合质粒,经二代测序检测到6个位置的随机碱基丰度Gini值小于0.1,表明6个位置的随机碱基分布较均匀,PAM library质粒具有Amp抗性基因。
(2)构建原核表达的pET28a-Cas9质粒:分别在pET28a载体(addgene,108303)的EcoR I和BamH I酶切位点上***本发明所述三种CRISPR/Cas9基因编辑***,包括Cas9蛋白、sgRNA与tracrRNA,Cas9蛋白经大肠杆菌密码子优化,最后添加TAA终止密码子;在异源启动子J23119启动子后添加5’-重复序列-间隔序列(与PAM library间隔序列互补)-重复序列-3’,即组成sgRNA后接T7terminator;在异源启动子J23119启动子后添加鉴定出来的tracrRNA(其序列依次如SEQ ID NO.14~16所示),三种质粒具有Kana抗性基因。
(3)把含有pET28a-Cas9(或pET28a空载质粒)和PAM library质粒共同通过细菌电转进DH5α(全式金生物,CD201-01)感受态,37℃复苏1h后均匀涂抹在Amp(100μg/mL)以及Kana(50μg/mL)双重抗性的固体培养皿上置于37℃培养18h后刮取全部单克隆至无抗性培养基中,离心提取含pET28a-Cas9(或pET28a空载质粒)和PAM library质粒的混合质粒。
(4)在混合质粒上,随机碱基的两端设计合适的引物对(library-NGS-F和library-NGS-R)含有间隔序列和PAM组合的位置进行PCR扩增及纯化,在产物两端加上接头(采用商业的illumina测序接头引物:Hieff NGS384 Dual Index Primer Kit forSet1(货号12613ES02)I5primer:TAAGATTA)进行二代测序(I7primer:GAGATTCC),以pET28a空载对照组的PAM耗竭阈值为对照基准,利用Weblogo 3分析6个随机碱基的消耗,通过负向筛选的方式得到每个Cas9蛋白所识别的PAM序列。
PAM序列分析结果如图2所示,HqCas9、DspCas9、DsuCas9能分别识别序列为NGNGNC、NNNAA、NNNAA的PAM。
上述序列信息如下:
SEQ ID NO.10:
ATGCAGACCAAAAAAGTTGATGAATACTACGTGGGCTTCGATATCGGCACCAACTCCGTTGGCTACGCGGTGACCGATAAAAACTACAACCTGATTAAACACGGCGGTGAACCGATGTGGGGCTCCCACGTTTTCGAGGCGGCGAGCACCGCCCAGGAACGCCGTACCTTCCGCACCGCTCGCCGCCGTAACGATCGTAAAAAACAGCGTATCGCGCTGGTGTCTGAAATCTTCGCGCCGGAAATCGCGAAAGTGGACCCGCGTTTCTTCATCCGTCGCCGTGAATCCGCGCTGTTCCGCGACGACGTGGACATTAAAGATCGTTACGTGGTTTTCAACGACGACGATTTCACCGATAAAGACTACTACGATATCTACCCGACCATCCACCACCTGATCTACGACCTGATGAGCAACAAAGAAAAACACGATATTCGCCTGGTTTACATGGCGTGCGCCTACCTGGTGGCGCATCGCGGCCACTTCCTGTCTGAAGTTTCTAAAGATAACATCGAAGATGTTCTGGACTTCGATGTCGTGTACTGTAACTTTCTGAACGTTATGGACAACTACGCGGAAATCCCGTGGAAATGCGATATTTCCAAATTCAA
AGAAATCCTGAAGAAAAAACAGACCGTGACCAACAAAGAACGTGAATTCCTCCAGCTGCTT
AACGAAGGTAAAAAATTCAAAACCAGCGAAGAGGATGATGTGTCTCGTGAAGGCCTGGTG
AAACTGCTGTCGGGTGGCACCTACGAACTGGGTAAACTGTTTCCGAAACTGACCTTTGAAG
AAAAAGTGAGCGTTAGCTTCAACATGGCGGAAGAAGATTTTGCGATGGTTCTGCAGCAGCT
GGGTGACGAAGGTGACATCATCTCCAGCCTGCGTAACGTTTACGATTGGGCGATCCTGAGC
GACGTGCTTAACGGCAAAAACAGCGTGTCTGAAGGCAAAATTACCGTCTACGAACAGCACA
AAAAAGATCTGTCTTTCCTGAAATACTTCGTGAAAAAATACATCCCGAACCGTTATTACGAA
GTTTTCCGTGATGGCAACATCGTTGGCAACTATGTGAGCTATAGCTACAACCTGAAAAACGT
TCAGAACGTATCCAAATTCAAAGGCGCCAAAAAAGACGTTTTCTGTGATTACATTAAAAAA
GTTGTTAAAGATATTAAAGTTGACGATGAAGATAAAGTTGAATACGAAGATATGATGTTCC
GCCTGGATACGTACAGCTTCATCCCGAAACAAGTTGAAAACGACAATCGTGTTATCCCGTA
CCAGCTGTACTACTACGAACTGAAACGTATCCTGGACAACGCGTCCTCTTACCTGGAATTTC
TGGACGAAAAAGATATGGACGGTTACACTTCGCGCGAAAAACTGCTGTCCATCATGGAATT
CCGTATCCCGTATTATGTGGGTCCGCTGCGTACCGATAACGGTCAGCACGGCTGGATGAAA
CGTAAAGCGGAAGGCCGTATCTACCCGTGGAACTTCGAAGATAAAGTGGATCTGGACGCTA
GCGAACAGGAATTTATTAACCGTATGACCAACTCTTGCACCTACCTGCCGGGTGAAACCGT
GGTGCCGAAATATAGCCTGCTGTACTGCAAATTCAACGTTCTGAACGAAATTAACAACATC
AAAATCAACGACTGTTCTATCCCGATCGAGCACAAACAGGGCATCTACAAACTGTTCGAAC
GCTACCGCAAAGTGACCCCGAAAAAGATTAAAGACTTCCTGATCTCTAACAACCTGCTGCA
CCCGGAAGATGTTATCAGCGGCATCGATGTTACCATCAAAAGCAGCCTGAAATCCTACCAC
GACTTCAAAAAACTGCTGGAAAGCTGTGTGCTGAAAGAAAACCAGGTGGAAGCTATCATCG
AACGCCTGACCTACAGCGAAGATAAAGGCCGTATCCTGCGTTGGCTGCACATGGAATTCCC
GGACCTGAGCGATGATGACGTTAAATACATCTCCAAACTGAAATACAGCGACTTCGGCCGC
CTGAGCCGCAAACTGCTGGTCGGCATCCGTGGCTGCAACAAAGACACCGGCGAAGTGGATA
GCATCATGGGCATGCTGTGGAGCACCAACGACAACATGATGAAACTGCTGTCTAACAGCTA
CACCTTTATCGAAGAAATCGAAGCGATCAAAAACGAATACTACGTTGAACACCCGGCGAAC
CTGGACAGCATGCTGGATGAAATGTACGTTAGTAACGCTGTGCGTCGTCCGATTCACCGTAC
CCTGGATATCCTGAGCGACATTCGCAAAGTTTGCGGCAAAAACCCGAGCAAAATCTTCGTT
GAAATGGCGCGCGGTGGTGGTGAAAAAGGTGTTCGTACCAAATCCCGCCGTGACCAGATCT
CTGAACTGTATAAAAACATGGATAAAGCGGAAGTGCGTGAACTGTCTGAACAGCTTGAAGG
TAAAACCGATAACGAATTACAGTCCGAAGTGCTGTTCCTGTACTTTATGCAATTGGGTAAAT
GCGCGTACACCCAGAAAACCATCGACATCGACAAGCTGAAAACCAACATTTACAACGTGGA
TCACATTTACCCGCAGTCTTACGTAAAAGATGATAGCATCACCAACAAAGTGCTGGTTATTA
GTGAAGAAAACGGCCAGAAAGGTGATAAATATCCGATCTCTAAAGACATCCGTGAAAAAA
TGCAGCCGTTCTGGTACCGTTTGCTGAGCAACAAACTGATTTCTGAAGAAAAATACCGCCG
CCTGACCCGCTGTACCTCCTTCACCGAAGAAGAACTGACCGGTTTCATTAACCGCCAGCTCG
TTGAAACCCACCAGTCCACCAAAGCGGTTACCACGGTTTTCCGTACTCTGTTCCCGGACGTG
GAGATCGTTTACTCTAAAGCGGGCCTGGTGTCCGAATTCCGTAAAGAATTCGACATGCTGA
AAACCCGTAGTGTGAACGATCTGCACCACGCCAAAGATGCGTATCTGAACATCGTCGTGGG
CAACGTTTACCATTGTCGTTTCACCAAAAACTTCTACATTACCCAGAAATACAGCCTGAAAA
CCAAAACCCTGTTCACCCATTCTGTTAAACTGGGTGATGACGTTATCTGGAACGGCCAGGA
GAGCATTGGTAACGTGCGTAAAGTGCTGGCGAAAAACAACATCCACTACACTAAATATCCG
TTCATGCGTAAAGGTGGCCTGTTCGACCAGATGCCGGTTAAAGCGGCGGCCGGTCTGATCC
CGCGTAAAACCGGCCTGGATACCGAAAAATACGGTGGTTATAACAAATCCACTGCTACCGC
ATTTCTGTTAGTGAAATACAAAGAAAAAGGCAAACAGGAAGCCATGATCATGCCGGTAGAC
TACATGTACAGCGAAAAAGTTTTCTCCGATAACGAATACGCCTTAAAATACTCCAAAGAAA
ATATCAAAAAGATCTGGGGTCGCACGGAAGATCAGGTGATCGATGTGTCTTTACCGCTGGG
CCTGCGTCCGATCAAAATTAACACCATGCTGAGCTTCGACGGCTTCCGCGCGTGCATCACCG
GCAAAGCAAACGCTGGTCAGAAAATTGGCTTCACCAGCATGATGCCGCTGGTGATCGGTAA
CGAATGGGAAAACTACATCAAAAAGATTGACAACTACATTGAGAAAAAAGGTAAAAACAA
AAACATCACCCTGAATGAAAAGAACGATGGCATCTGCGGCGAAAAGAACGAAAAACTGTA
CTGTATCCTGACTGACAAAATCATCAACAACATCTACTCGATCCCGTTCAACTCCCAGCAGA
AAATCCTGGAGAACGGCTACGACAAATTCAAAAAACTGGATATCGAACGCCAGGTGTACTT
CCTGCAGAACCTGGTTCTCGTTCTGAAATCGGGCCGTGCTGGTTCCTGTGATATGAGCGCAA
TCGGTGGCTCGAAAAACGCGGCGACCTTTGCGTTCGGTTCCAAGCTGAGCCTGTGGGCGAA
AAAATTCCAGAAAGTGTACCTGATCGATAACAGCAGCTCTGGCATCTACCAGAACATGAGCGATAACCTGCTGGACATCATCAAATAA;
SEQ ID NO.11:
ATGATGAAAGAAATTAAAAACTATTTTATTGGCCTGGATATGGGCACCACTAGTGTGG
GCTGGGCAGCCACTGATGAAAACTATGAAATTATTAAGAAGAATGGCAAAGCCCTGTGGGG
CATTAGACTGTTTGATGAAGCGCAGACTGCAGCAGATAGAAGAATGCATAGAATTGCAAGA
AGAAGAATTGAGAGAAGAAGCAGAAGAATTGACCTGCTGCAAGAACTTTTTGCCCAAGAA
ATTTGCAAAAAAGATCCTGGCTTTTATGAAAGACTGAATGAAAGTGGCCTGTATGAAGAAG
ATAAAACTGTGCATCAGAAAAACTCTCTGTTTAATGATGTGGATTTTGATGATAAAGCCTAT
TATAAAGAATATCCAACCATTTATCATCTGAGATATGATCTGATGACCAAAGATAGACCATT
TGATGTGAGACTGGTGTATCTGGCCGTGCATCATATTCTGAAACATAGAGGCCATTTTCTGT
TTGATCATTTTCAAGTGGATGAAAATGGTGTGAGTGGCTTTGAAGAAAGCTTTGCAGCCTTT
GGTGATGCCCTGGAACATATTAAAGGTGAAAGCTTTGATATGGGCAAAGAAGAAGAAATG
AAAGCCCTGTGCAGAGACAAGAAACTGGGTGTGAGACATAAAGCCCTGGCCCTGGCACAG
TGCCTTGGCAGAAGCAAAGACAAAGACTTTAAAGCCATGATGACCCTGGCAGCTGGTGGCA
CTGCCCTGCTGAGTGAAGTGTTTAAAGATGAAGGCCTGAAAGATTTTAGCAAAAACAAAGT
GAGCTTTAGTGATAGTCAGTTTGAAAATGATAAACCTGAAATTATTGCAGAACTGGGTGAT
AGATATGATCTGATTGCAGCCCTGCATGGCCTGTATAACTGGAGCTTTCTGGCAGAACTGAT
GAGAGGCCATAAATATATTAGTGAAGCCAAAATTGAAATTTATGATAAACATAAAGAAGAT
CTGGCCTTGCTGAAAAAAGTGCTGAAACAAGATAGAAGTGTGTATAACCTGATGTTCAAGG
AACCTGGTGATAAAAAACCTATTAACTATAGTGCCTATGTGAAAGCCTGCAAAACCAATGG
TAAAAAATTACCACTGCCATATGGCAAGTTTAAATATGAAGAATTTATTAAAACTGTGAAA
TTTTGCCTGAAAAACCTGCCTGATAGCCCTGATAAAAAAAACATTGAAAACAAACTGGAAG
AAGGCAGCTTTCTGCTGAAAGCAGTGAGTGTGGAAAATGGTGCCATTCCATATCAGCTGCA
TCTGCAAGAACTGAAAATTATTCTGTCTAAGGCAGAAGCCTATCTGCCATTTCTGAAAGTGA
GAGATCAGTATGGCACTGTGAGTGATAAAATTATTAGCCTGTTTACCTTTAGAATTCCATAT
TATGTGGGCCCAATTAATGAACATGCTGGCAGCTGCTGGGTGGTGAAAAAAGATAAACAAG
GCAAAGTGTATCCATGGAACTTTACTGAAAAAATTGACATTGAAAAAAGTGCAGAAGGCTT
TATTAGAAACCTGACCAACAAATGCACCTATCTGATTGGTGAAGATGTGCTGCCAAAAAAC
AGCCTGCTGTATAGTGAATTTACTGTGCTGAATGAACTGAACAATGTGAGAATTGGTGAAA
ATGCACAGAAACTGAGCCCTGAACTGAAAGAAAAAGTGCTGGAAAACCTGTTTAAAAAAC
ATAAACATGTGAGCAGAAGAAAATTTATTAACTATCTGGTGACTGAAGGCATTGATAAAAA
AGAAGCAGAAAGCATTAGTGGCCTGGATGGTGATTTTAAAAGCAGCATGAGCAGCCTGATT
GATATGAAACATATTCTGGGCAATGATTTTAGCAGAGAAGATGCAGAAAAAATGATTAAAG
ATATTACCATTTTTGGTGGTGATAAAAAAATGCTGAAAAAAAGACTGCATAGAGAATTTAG
CTATCTGACTAGTGAACAGCTGACTAGCCTGACTAGACTGAGCTATGATGGCTGGGGCAGA
CTGAGCAAGGAACTTCTGGTGAACCTGCTGCCTGTGGAAAAAAGCACTGGTGAAGTCCTGG
TGGATAAAGGCAGTGGTGAGGTGCTGAACATTATTAGTGCCATGGAACAGACTAGCTATAA
TCTGATGGAATTACTGAGCAGCAGATTTGGCTATGCCACTGCCATTGAAGAAAGAAACAGA
GAAAAAGAAGGCAATGGCACCATTAGCTATCAAGATGTGGAAGATATGTATATTAGCCCTG
CAGTGAAAAGACCACTGTGGCAAGCCCTGAAAATTGTGAGAGAAATTGTGAAAATTCTGGG
CAAAGAACCAAGCAAAATTTTTATTGAAATGGCAAGAGAAAATGGTGAAAAGGGCAAAAG
AACCATTAGCAGAAAAGCAAGACTTCAAGAGCTGTATAAGAAATGCAGAGATGATAGTAG
AGATTGGGCCAAAGAACTGGCAGAAAAACCTGAAGAAGATTTTAGAAGTGATAGACTGTA
TCTGTATTATACTCAGATGGGAAGAAGCATGTACACTGGCAAACCAATTGATATTAATCAG
CTGTTTGATAGAAATGTGTATGATATTGATCATATATATCCACAAAGCCTGACTGGTGATGA
CAGCCTGGACAACAGAGTGCTGGTGGAAAAAACTGTGAATGCCAAAAAAGGAGATATCTA
CCCCTTAGGTAGTGCCCTGGATGGCTGCCATATTCAAGGTGAAATTCATATTCAAGATATTC
AGAGAGAAATGAGACCATTTTGGCATATGCTGCTGGAAAAAGGCCTGATTAGTAAAGAAA
AATATAACAGACTGAGCAGAACCACCCCACTGAGTGATACTGAAAAAGCAGCCTTTATTGG
CAGACAGCTGGTGGAAACTAGACAGAGCACCAAAGCATGTGCAGAATTACTGAGCAAAGC
CTATCCACAAGCAAGAATTGTGTATACCAAAGCTGGCAATGCAAGCAGATTTAGACAGTAT
GGTGGCTTTATTAAAGTAAGAGACATGAATGATTATCATCATGCCAAAGATGCCTATCTGA
ACATTGTGGTGGGCAATGTGTTTGATACTAGATTTACCGCCAACCCACTGCATTTTCTGAAA
GGCAACCATCCTGTGTATAGCCTGAACACTGAAGCCCTGTATGGCCATAAAGTGAGCAGAG
GTGGTGTGGATGCCTGGATTCCACCTGAAAAAGATGATGAAGGCCATATTATGGCTGGCCA
TGAAGGCACCATGGGCACTGTGAGAAAATGGATGAGAAAAAACAACATTCTGTTTACTAGA
ATGCCATTGGAAGGCAAAGGTGGCCTGTTTGATCAGACCATTATGAAAAAAGGCAAAGGCC
AAGTGCCACTGAAAGGTGATAGCCCTGTGAGTGATATTGAAAAATATGGTGGCTATAACAA
AGCAAGCAGTGCCTATTTTGTGCTGACTAGCAGCAAACTGAAAGATGAAACCATTTATACC
ATTGAAACCATTCCACTGATTATTAAAAGAATGATTCAGACCAACAAAGATAAAGAAGATT
ATATTAAAAGACATTGGAAAGATCATGGCAAGAAAATGGTTAACCCACATATTTGCTATGG
CCATATTCCTGTGCAGAGCCTGCTGGAAATTAATGGCTTTAAAGTGCATCTGACTGGCAAAT
CTGGCAAGGACTTTAAGCTGAGAAATGCAGAACAGCTGTGCATTAGCAATGATGATGCAGC
AGTGCTGAAAAGAGTGCTGAAATATAATGAAAGAAGCAGCCTGAGTAAAGGCAAAGAAGC
CCTGCTGATTACCCCATTTGATAACATTCAAGAAGTGGATCTGAACAGACTGTATCAAGTGT
TTGAAGATAAACTGACCAACCAAGTGTATAAAGTGAAACTGGGCAAACAAGCAAGTGTGTT
AAAGAAGGGTGAAGATAAATTTAATGAACTCCCACTGGAAGTGAAATGCAGAGTGATTGGT
GAAATTCTGCATCTGTTTCAGTGCAATGCAGCCATTGCAGATCTGAGACTGATTGGTGGTGC
CAAAAATGCTGGTGCCCTGACCATGAACCCAAGAGTGAGCCCTGAAGATCATGTGTATCTG
ATTGAACAGAGTGTGACTGGCTTTTTTGAAAAAAGAATTCTGCTGGCCCCATATGGTGGCAAATAA;
SEQ ID NO.12:
ATGAAAGAAATTAAAAAGATCTTCATCGGTCTGGATATGGGCACCAACAGCGTGGGCT
GGACCGCGACCGATGAAAACTACGAAGTGATCAAAAAGAACGGTAAAGCGCTGTGGGGTA
TCCGTCTGTTCGATGAAGCACAGACCGCAGAAGATCGTCGTATGCACCGCATCGCGCGTCG
CCGCATCGAACGCCGCTCCCGTCGTATCGATCTGCTGCAGGAACTGTTCGCGCAGGAAATCT
GCAAAAAAGATCCGGGCTTCTACGAACGTCTGAACGAAAGCGGTCTGTACGAAGAAGATA
AAACTGTGCACCAGACCAACTCCCTGTTTAACGACGTGGATTTCAACGATAAAGCGTACTA
CAAAAAATACCCGACCATTTACCACCTGCGCCATGCGCTGATGACCGAAAACCACCCGTTC
GACGTTCGCCTGGTTTACCTGGCGATCCACCACATCCTGAAACATCGTGGTCACTTCCTGTT
CGAAAACTTCCAGACGGACGAAAAAGGCACCTCCGGCTTCGACGAATCTTTTGCTGCTTTC
GGCTCTGCGCTGGATCGTATTAAAGGCTCCTCACCAGATGTGCGTAAAGCCGACTCTATGA
AAGACATCCTGAAAGATAAAAAACTGGGTGTTAAAGAAAAAGCAGCGAGCCTGCTGCAGT
GCCTGGGCCAGGGCAAAGAAAAAGACTTCAAAGCTATGATGACCCTGGCGGCAGGCGGCA
CCGCGTCCCTGTCCGATATCTTCAACGACGAAAAACTGAAAGACTTCGAAAAGAACAAAGT
GAACTTCAGCTCTGCACAGTTCGAAGAAAACGAACCGGACATCATGGCGGAACTGGGCGAC
CGTTATGATCTGATCGCGGCCCTGCACGGCTTCTATAACTGGTCTCTGCTGGCAGAACTGAT
GGGTGAATACCATTACATCAGCGAAGCTAAAATTGCGGTGTACGACAAACACAAAGCGGAT
CTGAAAGTTCTGAAACGCGTTCTGAAACAGCGTCCGGACATCTACGCGAAAATCTTCCGCG
AACCGGGTTCCTCTGCGAACAAAAACTACAGCGCGTACGTGGGCGTTTGCAAAGTTAAAGG
CAAAAAAGCCGCGATCGAAAAATGTAGCTACGAAGATTTCACTAAAACCCTGAAACCGTGC
CTGAAAGATATGCCGGATTCTAACGACAAAGATTATATCTCTCGCGAACTGAACATGGGTA
CCTTCCTGCCGAAATCCGTTAGCAAAGAAAACGGCGTGATCCCGTACCAGCTGCACCTGCA
GGAACTGAAAATCATCCTGTCTAAAGCAGAAGCGTACCTGCCGTTCCTGAAAGTGAAAGAC
CAGTACGGCACCGTTTCCGACAAAATTATCTCCCTGTTCACCTTCCGTATCCCGTACTATGT
GGGTCCAATCAACGAACACGCGGGCTCCTGCTGGGTGGTTAAAAAAGATAAACGCGGTAA
AGTGTACCCGTGGAACTTCACCGAAAAAATCGATATCGAAAAGTCCGCGGAAGGCTTCATC
CGTAACCTGACCAACAAATGCACCTACCTGATCGGTGAGGATGTTCTGCCGAAAAACAGCC
TGCTGTACAGCGAATTCACCGTTCTGAACGAACTGAACAACGTGCGCATCGGCGAAACCAT
GCAGAAACTGCCGCTGCGTCTGAAAGAGAAAGTGATGGACAACCTGTTCAGCCGTTACAAA
CACGTGAGCCGCACCAAATTCATCAAATACCTGGTGAGCGAAGGCATCGATAAAAAAGAA
GCTGAAAGCATCTCTGGCCTGGACGGCGATTTCAAAAGCTCTCTGAGCTCCCTGATCGACAT
GAAACACATCCTGGGTAACGACTTCAGCCGTGAAAACGCGGAAAAAATGATCCAGGATATC
ACCATCTTCGGCGGCGATAAAAAGATGCTGAAAAACCGCCTGCACCGTGAATTCTCCTACC
TGACCCCGGAACAGCTGACCAGCCTGACCCAGCTGTCCTACGACGGCTGGGGCCGTCTGAG
CAAAGAATTCCTGGTTAACTTACTGCCGGCTGAAGGTGATAGCTGTGAAGTGCTGGTTGATC
ACACCAGCGGCGAAGTGCTGAACATTATCAGCGCGATGCGTCAGACCTCCTACAACCTGAT
GGAACTGCTGGGCAGCCGCTTCGGCTACGGCCAGGCGATCGAAGAACGTAACAAAAAAGA
AGAAGGCCAGGGCCGTATCACCTACAAAGACGTTGAGGATCTGTACATCAGCCCGGCGGTT
CGTCGTCCGCTGTGGCAGGCGCTGAAAATCGTGCGCGAAATCGTGAAAATCACCGGCAAAG
AACCGAGCAAAATCTTCATCGAAATGGCGCGTGAAAACGGTGAAAAAGGTAAACGTACCA
TCTCTCGCAAAGCTCGCCTGCAGGCTCTGTACAAAAAATGTCGTGATGACACCCGTGACTG
GGCGAAAGAACTGGAAGGCAAATCCGAAGAAGATTTTCGCTCTGATCGTCTGTATCTGTAC
TACACCCAGATGGGTCGCAGCATGTACACCGGTAAACCGATCGATATTAACCGTCTGTTCG
ATCGTAACGTGTATGACATTGATCACATTTACCCGCAGTCCCTGACCGGTGACGATAGCCTG
GATAACCGCGTACTGGTGGAAAAAACCGTTAACGCAAAGAAAGGTGACACCTACCCGCTGT
CTAGCGCACTGGATGGTTGCTACATTTCTGGTCAGCAGATTCGTATCCAGGATATCCAGAAA
GAAATGCGTCCGTTCTGGCACATGCTGCTGGAAAAAGAACTGATTTCTAAAGAAAAATACA
ACCGCCTGTCTCGCACCATCCCGCTGTCCGACGCGGAAAAAGCAGCGTTCATTGGTCGTCA
GCTGGTTGAGACCCGCCAGTCCACCAAAGCCTGCGCGGAACTGCTGTCTAAAGCGTATCCG
CAGACCCGTATCGTGTACACCAAAGCGGGCAACGCTAGCCGTTTCCGTCAATACGGTGGCT
TTATCAAAGTGCGTGATATGAACGACTACCACCACGCGAAAGATGCATATCTGAACATCGT
AGTTGGCAACGTTTTCAACACCCGTTTCACCGCCAACCCGCTGCACTTCCTGAAGGGTAACC
ACCAGGCTTACTCCCTGAACACCGAAGCGTTGTACGGTCATAAAGTATCCCGTAACGGCGT
GGATGCGTGGATCCCGGCGGAGAAAGATGAAAAAGGCCAGGTTATGGCAGGCCACGAAGG
CACCATGGGTACCGTTCGCAAATGGATGCGCAAAAACAACATCCTGTTTACCCGCATGCCG
TACGAAGGCAAAGGCGGCCTGTTCGACCAGAACATCATGAAAAAAGAAAAAGGCCAGGTG
CCGATCAAAGGTGATTCCCCGATTAGCAACATCAAAAAATACGGTGGCTATAACAAAGCCA
AAGTGGCGTATTTCGTTCTGACGCAGTCTAAACTGAACAAAAAGACCGTTTATACCCTGGA
AGCCATCCCGCTGATTCTGAAAAACAGCATTCAGTCCAACGAAGATAAAGAAACCTATATT
CAGAAACAGTGGCGTAAAAACGGTAAGAAAATGGAACATCCGATCGTTTGTCTGGGCCATA
TTCCGGTGCAGTCCCTGCTGGAAATTAACGGCTTCAAAGTGCACCTGTCAGGCAAAAACGG
TAAAGATATCCTGCTGCGCAACGCGGAACAGCTGTGTATCAACGAAGCAGATACCGCTGTT
CTGAAGAAAATCCTGAAATTCAACCAGCGTGCCGCGATGAGTAAAAAAGGCGAAGAAATC
TTCATCAACAGCTTCGATAACATCCAGGAAGAAGATCTGAACCGCCTGTACCACGTTTTCGA
AGATAAACTGACCAACCAGATCTACAAAGTTAAACTGGAAAAACAGGCTGCTGTGCTGAAA
AAAGGCGAAGAAACCTTCAACCGCCTGAGCCCAGAACAGAAATGTAAACTGATCGGTGAA
ATCCTGCACCTGTGCCAGTGCAAAGCTACTCACGCTGATCTGCGTCTGATTGGCGGCGCGAA
AAAAGCCGGCATCCTGACCATGGGTACCCAGATCTACCCGAAAGACCACGTTTACCTGATC
GAACAGTCCGTTACCGGCTTCTTCGAAAAACGTATCCTGCTGGCGCCGTTCGGTGAAAAATAA;SEQID NO.13:ATGGCGAATACTTTTAAAGTCAT;
SEQ ID NO.14:
ACATTACTCTCAAACTACAAATGTATTCATTTGATACATTTGATATCAAATTTTGAAAATCCAGCTTGCAACTGGTATGTAAATCCACATCTTTGTTATACATTCTTATACAATAAATATCAACACATATCTTTCCTAATACCATAACAATACCTATAACCTGAACTCCTATTCAAAATATTGACAATTCCCCTTTCATGATGTAATGTGTAAATGAATTTACATTGCGAGTTCAAATAAAGTTTTTACCAAATCGCCGTTTTCCGGTTACACAGTGTGTGTATCAATCCTAAGTTTTTACTTAGGATTTTTTATTATCATTATATATTGTATATTTCATTTTCTCGAATAGTATATATTTTATATTTTTGATTT;
SEQ ID NO.15:
AAACCGAACGAACACATTGACAAAACCGATAATGGTTTTACCACTATCAAGAATCACAACACTCTCAAACCTCAAATTGCATTTTCATGCATCGGTTCTCTGCAAGTGTATCCGCTTACACCGGGCGGCGCGACTCTTGGCAGTGTATCAAATGACACCCTCCCTGAAATGGAGTATCCTGTAGATGTCAGGATAACTTACCACTATCCGATCACAACACGAGTTCAAATAAAAATTCATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAAAGAGCTCCTTCGGGAGTTCTTTTTATTTGCCCGGATATACGCACAACAAAAGGCCCCATTATCTCATATCCCAAAAGACATGAAATAACAGAGCCTGAAAAAGCCTCTTTTGCCACCTTCCCTGCTGTCCTGTCCATCATCATAATCATCCCTTCTCTAATAATTAATATAAAAAGGATTTCCTATGAACTCATTTTATCATTAAACTCATTATATCATGAGTGACCGGTCTACGCCTTCTACCTAAAGCATGTTACCTTCTACTTCTATTATACTCAGAGGCATGACACACTCTGTCGCTCCGCGAAAAAATCCTGAATTTTTATCAAAAATTAATCTTACGAATAAAAGGAATGCCTATAATCCTCATCTGCAGAAGAAATCGGCAGCCTGATCTATCTCCTTTCTATATACAGAGGAGTCCCCTGAAAGCACAAAAACTTCCTGAATCTCCTGTGGCAGTGACCTGCCTTTAGAGTTTCAGGAAGTTTTTGCTCCTCACGGTTTCCCGCAAGGGCGGCAATCGGAATCGCCATTAGGGAAGCGCTGATTAAATCGTTATCGAATTTCATTCTTGTATTTTTATTCAATGCAAGGAATTAGTCGACGCGAATAGCGAGCTATTTAAGGAGACTGATGACGAAGCATTGGATAAAAATACATATGAAATTCGATTCTACGAATTAATCAGTGCTTCCTTAGGATTGCCATTTGCTGCATCTTTCCCATGCGCTTTATGTAAGCTAAGGAAACGCATGCCGAATGACCGTCACATAGCACCCGGTCATTTTCTTTATTATACTATTTTTTACAGCAGTCTGCTTTCTTTTTCTGTACATATTCTGTACATATCAAATCAAAAGTCCCCTGA;
SEQ ID NO.16:
TACTCTGCAAATTGTTACATAATCTTCTCCATTGAAATTTATTTTATAAGCAAAAAATAAGTCCTTCGGCAATAGAGCCAAATTGCAATCCACGCTTCCCTTGGGGTGCAGAAAAAAGGAGGCAGAAGCCGCCAAAGGTTCTGCCCCCTTTCAAATTGCATTTTCATGCAGCAGTTCTCCGCAAGTGTATCCGCTTACACCAGACGGCGCAGTTCCTGACAGTGTATCAAACCCTTCATCAGGCAGTCGATAAAAGGCAAATTGACACCCTCCCTGAAATGGAGTATCCTGTAGATGTCAGGATAACTTACCACTATCCGATCACAACACAAGTTCAAATAAAAATTTATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAGAGAGCTCCTTCGGGAGTTCTTTTTATTTGCCCGATTTGAGCCACAATAAAAGGTCCCGTTATTTCATATCTCAAAAGACATGAATAACA;
library-NGS-F引物的序列为:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTgtctacaatcggctcgatcga;
library-NGS-R引物的序列为:
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTgcgcagaccaaaacgatctc。
实施例3:原核干扰实验一
本实施例通过原核干扰实验验证本发明实施例1的三种II型CRISPR/Cas9基因编辑***在原核生物中具有切割能力(即是否能够识别实施例2得到的PAM序列),并且验证本发明实施例2所鉴定的PAM的正确性。
具体操作如下:
(1)构建PAM-target单条质粒,将实施例2所构建的PAM library质粒的6位随机碱基替换为三种Cas9蛋白对应的PAM序列(HqCas9:AGCGAC;DspCas9:GGATAA;DsuCas9:GGATAA)。
(2)将PAM-target单条质粒分别电转入含有三种Cas9基因编辑***的DH5α感受态中,以PAM空载质粒作为对照,37℃复苏1h后梯度稀释培养基,采用滴板法在含有Amp(100μg/mL)以及Kana(50μg/mL)双重抗性的培养皿上滴涂20μL培养基,置于37℃培养18h后,观察双抗板上的单克隆细菌数。
原核干扰结果如图3所示,从右向左为稀释方向,最右列为未稀释原菌液,稀释倍数越大单克隆长得越少。对照组为电转PAM空白质粒组,与Cas9基因编辑***中的间隔序列不存在互补配对的靶序列,则Cas9蛋白无法行使切割功能,细菌具有双抗性基因则正常生长。实验组的PAM单条质粒中具有能与Cas9基因编辑***中的间隔序列互补配对的靶点以及PAM,实验组的单克隆数量与对照组相比明显下降,说明Cas9蛋白能识别本实施例选定的PAM序列而发挥切割能力,使细菌不具备抗Amp能力而不能生长。该实验结果表明,本发明的HqCas9、DspCas9、DsuCas9能分别识别序列为AGCGAC、GGATAA、GGACAA的PAM序列,在原核***中具备切割能力。
实施例4:原核干扰实验二
本实施例通过原核干扰实验验证本发明实施例1的三种II型CRISPR/Cas9基因编辑***中发挥切割靶向DNA序列所需要的tracrRNA范围。
具体操作如下所示:
(1)把本发明实施例1的三种CRISPR/Cas9基因编辑***中的非编码区域(Noncoding,NC)分为4段,分别通过Gibson方法组装进target质粒中,前面加上强异源启动子J23119,分别构建为target-NC 1-4质粒。
(2)构建pET28a-ΔCas9质粒:将实施例2得到的pET28a-Cas9质粒中删除所有的NC部分,保留Cas9蛋白、重复序列和间隔序列。
(3)把target-NC 1-4质粒分别电转进入含有pET28a-ΔCas9的大肠杆菌DH5α感受态中,37℃复苏1h后梯度稀释培养基,采用滴板法在含有Amp(100μg/mL)以及Kana(50μg/mL)双重抗性的培养皿上滴涂20μL培养基,置于37℃培养18h后,观察双抗平板上的单克隆细菌数。
原核干扰结果如图4所示,结果表明,HqCas9的NC4、DspCas9的NC2、DsuCas9的NC1所对应的生长菌落最少,说明这三段对应的NC区域是辅助Cas9核酸酶发挥有效切割效应的主要序列。
实施例5:预测CRISPR/Cas9基因编辑***识别靶位点的RNA二级结构
为预测本发明实施例1的三种II型CRISPR/Cas9基因编辑***识别靶位点的RNA二级结构,通过模拟tracrRNA与重复序列转录后的RNA结合过程,预测两者结合后的RNA二级结构,通过使用在线软件NUPACK进行模拟,结果如图5所示,重复序列与tracrRNA之间通过“GAAA”进行连接。三种CRISPR/Cas9基因编辑***发挥靶向切割所需要的scaffold序列如SEQ ID NO.17~19所示。
上述序列信息如下:
SEQ ID NO.17:
GTTTGAGAGTAATGTAAATTCATAGAGGTATAAGAgaaaATGAATTTACATTGCGAGTTC AAATAAAGTTTTTACCAAATCGCCGTTTTCCGGTTACACAGTGTGTGTATCAATCCTAAGTT;
SEQ ID NO.18:
GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAAGAAATTACCACTATCCGATCACAACA CGAGTTCAAATAAAAATTCATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAA AGAGCTCCTTCGGGAGTTCTT;
SEQ ID NO.19:
GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAAGAAATTACCACTATCCGATCACAACA CAAGTTCAAATAAAAATTTATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAG AGAGCTCCTTCGGGAGTTCTT。
实施例6:dsODN***实验一
本实施例通过dsODN***实验验证本发明实施例1的三种II型CRISPR/Cas9基因编辑***在真核细胞中发挥靶向切割的最适间隔序列的长度。
具体操作如下:
(1)根据本发明实施例1的三种Cas9蛋白进行人源密码子优化,将对应的核苷酸序列克隆进PX330真核表达载体上(addgene,59909),获得PX330-蛋白真核表达质粒。
(2)在哺乳动物细胞中,以HEK293T细胞为例,选取内源性基因,以本实施例3所鉴定的能在原核生物中识别切割的PAM序列,寻找到合适的靶位点,序列格式为5’-不同长度的间隔序列(18~30bp)-直接重复序列-3’,通过Gibson方法克隆到PXZ载体上(addgene,160229),构建靶向同一靶位点、具有不同spacer长度的PXZ-target质粒,同时转染PX330-蛋白真核表达质粒与PXZ-target质粒。具体target序列见表1。
(3)在生长状态良好的HEK293T细胞24孔板中共转染PX330-蛋白真核质粒、PXZ-target质粒、1.2μL dsODN,72h后收细胞抽提DNA。
(4)在对应的基因靶点上游以及dsODN序列上设计一对引物(见表1)进行dsODN-PCR扩增,跑琼脂糖胶检测是否出现目的条带,用来判断是否有dsODN的***,通过检测dsODN的***情况验证本发明所述Cas9基因编辑***在真核细胞环境下是否具有编辑能力,并比较不同长度的间隔序列对应的条带强弱。
表1碱基大小和序列
检测结果如图6所示,对应长度的PCR条带用红色三角标注,代表有dsODN的***,说明这三种CRISPR/Cas9基因编辑***在真核细胞中均具有靶向切割能力。根据条带强弱比较发现HqCas9的spacer最佳间隔序列识别长度是20~24bp,DspCas9的spacer最佳识别长度是21~24bp,DsuCas9的spacer最佳识别长度是22~24bp。
实施例7:dsODN的***实验二
本实施例通过dsODN的***实验,检测本发明实施例1的三种II型CRISPR/Cas9基因编辑***在真核细胞中的在靶和脱靶情况以检测切割效果。
具体操作如下所示:
(a)构建位点质粒,实施例6的结果已表明三种Cas9的最适识别的spacer的长度,哺乳动物细胞中,以HEK293T细胞为例,选取内源性基因,寻找到合适的靶位点(见表2),序列格式为5’-与靶点互补的间隔序列-scaffold-3’,通过Gibson方法克隆到PXZ载体上,构建PXZ-target质粒。
表2靶位点及其序列
(b)同时电转实施例6制备的PX330-蛋白真核表达质粒、PXZ-target质粒和1.2μLdsODN,72h后收细胞抽提DNA。
(c)在对应的基因靶点上游以及dsODN序列上设计引物(见表1)进行dsODN-PCR扩增,跑琼脂糖胶检测是否出现目的条带,用来判断是否有dsODN的***,首先通过检测dsODN的***情况验证本发明所述Cas9基因编辑***在该选择的靶位点上是否发生靶向切割。
(d)挑选能检测到dsODN-PCR条带的DNA进行GUIDE-seq建库,上机进行二代测序,通过生物信息学分析检测三种Cas9基因编辑***的在靶切割以及脱靶情况。
GUIDE-seq检测结果如图7所示,三个蛋白在对应的多个靶位点上的在靶Reads数较高,脱靶位点较少或检测不到脱靶,说明本发明所述HqCas9、DspCas9、DsuCas9基因编辑***均在真核生物中具备较强的切割效率和较好的切割特异性。
综上,本发明首次鉴定出三种全新的II型CRISPR/Cas9基因编辑***,三种新型编辑***的Cas9蛋白分别命名为HqCas9、DspCas9和DsuCas9,通过以上实施例证明本发明的三种II型CRISPR/Cas9基因编辑***可以识别特定的PAM序列(NGNGNC、NNNAA、NNNAA),能够在crRNA的引导下在原核环境或真核细胞中行使基因编辑功能,极大的增加了可靶向的范围,克服了SpCas9的局限性。
本发明选择原核和真核DNA来验证三种II型CRISPR/Cas9基因编辑***的编辑能力。Cas9蛋白识别靶向序列需要与crRNA间隔序列互补的核苷酸序列、可以识别的PAM序列。首先,通过原核耗竭实验证明本发明的Cas9蛋白在原核生物中具有切割能力,获知了Cas9蛋白在原核***中识别的PAM序列。再通过原核干扰实验和真核细胞实验验证了PAM的正确性。本发明通过人为设计crRNA中的间隔序列,得到的II型CRISPR/Cas9基因编辑***可以靶向基因组中几乎所有感兴趣的DNA序列,产生位点特异的平末端双链断裂(DSB)。通过非同源末端修复DSB,在切割位点产生小的随机***/缺失(indels)使目的基因失活;或者通过高保真同源修复,可以使用同源修复模板在DSB位点进行精确的基因组修饰。通过GUIDE-seq结果显示两个蛋白的编辑在靶数较高,说明编辑效率高,脱靶数少说明编辑精确率高。HqCas9识别的PAM序列为NGNGNC,相对比较复杂的PAM可以更精确的识别靶位点,提高Cas9蛋白识别的精确性。DspCas9与DsuCas9所识别的PAM相近,第4位和第5位均为A,两个蛋白都可识别PAM为NNNAA的靶位点。通过对人类基因组上“AA”序列位点覆盖的长度频率进行分析,平均每隔5bp就有一个AA出现,这极大的增加了DspCas9与DsuCas9在人类基因组上的靶向范围。
本发明的三种II型CRISPR/Cas9基因编辑***的发现进一步扩大了基因编辑工具的种类,为科学研究与疾病治疗提供了有力的研究工具,对推动将基因编辑应用于临床治疗具有重要的作用。
最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (5)

1.一种II型CRISPR/Cas9基因编辑***,其特征在于,包括Cas9蛋白、辅助蛋白、CRISPRRNA和tracrRNA序列;
所述Cas9蛋白的氨基酸序列如SEQ ID NO.1所示;
所述tracrRNA序列如SEQ ID NO.14所示。
2.根据权利要求1所述的II型CRISPR/Cas9基因编辑***,其特征在于,编码所述Cas9蛋白的核苷酸序列如SEQ ID NO.10所示。
3.根据权利要求1所述的II型CRISPR/Cas9基因编辑***,其特征在于,编码所述辅助蛋白的核苷酸序列如SEQ ID NO.4所示。
4.权利要求1~3任一项所述II型CRISPR/Cas9基因编辑***在原核或真核生物基因编辑中的应用。
5.权利要求1~3任一项所述II型CRISPR/Cas9基因编辑***在制备生物基因编辑制剂中的应用。
CN202310510300.3A 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用 Active CN116751764B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202311513462.9A CN117757774A (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用
CN202310510300.3A CN116751764B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用
CN202311513465.2A CN117448300B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310510300.3A CN116751764B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CN202311513465.2A Division CN117448300B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用
CN202311513462.9A Division CN117757774A (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用

Publications (2)

Publication Number Publication Date
CN116751764A CN116751764A (zh) 2023-09-15
CN116751764B true CN116751764B (zh) 2024-01-30

Family

ID=87952200

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202310510300.3A Active CN116751764B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用
CN202311513465.2A Active CN117448300B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用
CN202311513462.9A Pending CN117757774A (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN202311513465.2A Active CN117448300B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用
CN202311513462.9A Pending CN117757774A (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用

Country Status (1)

Country Link
CN (3) CN116751764B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117866926A (zh) * 2024-03-07 2024-04-12 珠海舒桐医疗科技有限公司 一种CRISPR-FrCas9蛋白突变体及应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110913881A (zh) * 2017-03-14 2020-03-24 加利福尼亚大学董事会 工程化crispr cas9免疫隐身
CN112331264A (zh) * 2020-09-11 2021-02-05 中山大学附属第一医院 一种同源2型CRISPR/Cas基因编辑***的构建方法
CN113234701A (zh) * 2020-10-20 2021-08-10 珠海舒桐医疗科技有限公司 一种Cpf1蛋白及基因编辑***
CN114075559A (zh) * 2020-09-14 2022-02-22 珠海舒桐医疗科技有限公司 一种2型CRISPR/Cas9基因编辑***及其应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210301269A1 (en) * 2020-01-22 2021-09-30 New York Genome Center, Inc. Recombinant crispr-cas9 nucleases with altered pam specificity
CN113234702B (zh) * 2021-03-26 2023-02-10 珠海舒桐医疗科技有限公司 一种Lt1Cas13d蛋白及基因编辑***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110913881A (zh) * 2017-03-14 2020-03-24 加利福尼亚大学董事会 工程化crispr cas9免疫隐身
CN112331264A (zh) * 2020-09-11 2021-02-05 中山大学附属第一医院 一种同源2型CRISPR/Cas基因编辑***的构建方法
WO2022052211A1 (zh) * 2020-09-11 2022-03-17 中山大学附属第一医院 一种同源2型CRISPR/Cas9基因编辑***及其构建方法
CN114075559A (zh) * 2020-09-14 2022-02-22 珠海舒桐医疗科技有限公司 一种2型CRISPR/Cas9基因编辑***及其应用
CN113234701A (zh) * 2020-10-20 2021-08-10 珠海舒桐医疗科技有限公司 一种Cpf1蛋白及基因编辑***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"FrCas9 is a CRISPR/Cas9 system with high editing efficiency and fidelity";Cui 等;《NATURE COMMUNICATIONS》;第13卷(第1期);文献号1425 *
"MAG: type II CRISPR RNA-guided endonuclease Cas9 [Agathobacter sp.]";Homan等;《GenBank database》;Accession:MCI6243088 *

Also Published As

Publication number Publication date
CN117448300A (zh) 2024-01-26
CN117448300B (zh) 2024-04-30
CN116751764A (zh) 2023-09-15
CN117757774A (zh) 2024-03-26

Similar Documents

Publication Publication Date Title
US11155814B2 (en) Methods for using DNA repair for cell engineering
CN107922931B (zh) 热稳定的Cas9核酸酶
CN109880851B (zh) 用于富集CRISPR/Cas9介导的同源重组修复细胞的筛选报告载体及筛选方法
CN112430586B (zh) 一种VI-B型CRISPR/Cas13基因编辑***及其应用
WO2022199511A1 (zh) 一种Lt1Cas13d蛋白及基因编辑***
WO2023142594A1 (zh) 一种精确无pam限制的腺嘌呤碱基编辑器及其应用
CN116751764B (zh) 一种Cas9蛋白、II型CRISPR/Cas9基因编辑***及应用
CN113234701B (zh) 一种Cpf1蛋白及基因编辑***
CN116179512A (zh) 靶标识别范围广的核酸内切酶及其应用
EP4116430A1 (en) Method for detecting random off-target effect of single-base editing system
CN116286737B (zh) 无pam限制的核酸内切酶及其介导的基因编辑***
CN116751763B (zh) 一种Cpf1蛋白、V型基因编辑***及应用
CN113151277A (zh) 鸡DF-1细胞IHH基因敲除稳定细胞株的构建方法及其特异性sgRNA
CN113278646A (zh) 一种构建水稻多基因编辑突变体库的方法及应用
JP2021151200A (ja) 連結dnaの製造方法及びそれに用いるためのベクターの組み合わせ
CN116179513B (zh) 一种Cpf1蛋白及其在基因编辑中的应用
Gutierrez et al. Genome-wide CRISPR-Cas9 screen in E. coli identifies design rules for efficient targeting
RU2794774C1 (ru) Система редактирования генома crispr/cas9 ii типа и ее применение
CN110129359B (zh) 检测基因编辑事件以及测定基因编辑效率的方法以及其应用
RU2712497C1 (ru) Средство разрезания ДНК на основе Cas9 белка из биотехнологически значимой бактерии Clostridium cellulolyticum
US20240055077A1 (en) SYSTEM AND METHOD FOR PREDICTING ACTIVITY AND SPECIFICITY OF 17 SMALL Cas9s USING DEEP LEARNING
Wei et al. A Novel White-to-Blue Colony Formation Assay to Select for Optimized sgRNAs
Zhu Optimal gRNA design of different CRISPR-Cas systems for DNA and RNA editing
CN116978444A (zh) 利用深度学习的碱基编辑基因剪刀的效率和结果预测***和方法
CN117126827A (zh) 一种融合蛋白及含有由尿嘧啶-n-糖基化酶突变体介导的碱基编辑***和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant