CN114763559A - 一种不依赖于同源重组的靶向性基因捕获***及其应用 - Google Patents

一种不依赖于同源重组的靶向性基因捕获***及其应用 Download PDF

Info

Publication number
CN114763559A
CN114763559A CN202110057414.8A CN202110057414A CN114763559A CN 114763559 A CN114763559 A CN 114763559A CN 202110057414 A CN202110057414 A CN 202110057414A CN 114763559 A CN114763559 A CN 114763559A
Authority
CN
China
Prior art keywords
gene
module
vector
cas9 protein
promoter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110057414.8A
Other languages
English (en)
Inventor
吴森
杜旭光
鲁恒星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Agricultural University
Original Assignee
China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Agricultural University filed Critical China Agricultural University
Priority to CN202110057414.8A priority Critical patent/CN114763559A/zh
Publication of CN114763559A publication Critical patent/CN114763559A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/60Vectors containing traps for, e.g. exons, promoters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/44Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及生物技术领域,具体涉及一种不依赖于同源重组的靶向性基因捕获***及其应用。本发明提供一种不依赖于同源重组的靶向性基因捕获***,该***包含以下模块:Cas9蛋白识别位点模块,识别Cas9蛋白识别位点的sgRNA表达模块,基因捕获模块,Cas9蛋白表达模块以及识别基因捕获靶位点的sgRNA表达模块。该***可实现高效的靶向性基因捕获,在多种哺乳动物细胞中均具有较高的敲入效率,极大地简化了突变型等位基因的制备,为高效向哺乳动物细胞中引入靶向性突变提供了新的路径。

Description

一种不依赖于同源重组的靶向性基因捕获***及其应用
技术领域
本发明涉及生物技术领域,具体涉及一种不依赖于同源重组的靶向性基因捕获***及其应用。
背景技术
基因突变技术在基因工程技术中占有重要地位。一方面,基因突变是研究基因功能最直接的方法,将目标基因突变后,再分析该突变体的表型,可确定该基因的功能。另一方面,利用基因编辑突变疾病相关基因制备的疾病模型动物对于研究人类疾病及开发相关治疗手段有着重要意义。因此,开发快速高效的基因突变技术一直以来都是研究的热点。
基因捕获(gene trapping)又可称之为基因诱捕、基因陷阱等,是一种基于小鼠ES细胞与捕获载体***诱变而建立的高通量基因突变技术,其基本原理是将基因捕获载体随机整合到小鼠ES细胞的基因组中,利用载体上的转录元件破坏所***位置的基因的功能,同时提供标记能够指征该基因的表达情况。研究表明,基因捕获技术结合同源重组产生的靶向性捕获技术可以对特定的基因实现高效地突变,而与位点特异性重组技术的结合,更是能够用于制备条件性敲除,用于研究胚胎致死基因。截至目前,这些以基因捕获技术为基础的基因突变策略已经在小鼠功能基因组学研究上取得了一系列重要的成果。然而这些技术目前大多应用于小鼠ES细胞中,在其他仍未得到ES细胞的动物中效率低下,在应用上仍然具有一定的局限性。
将外源DNA精确地整合到基因组上特定位置的基因敲入技术是基因组定向***诱变的基础。另外,利用基因敲入技术还可以对目的基因进行标记方便研究其功能。而且,基因敲入还可以实现特定位置稳定的转基因过表达,避免了随机整合可能造成的不利影响。因此,基因敲入技术在基础及应用生物学中占据着重要地位。然而,传统的基因敲入依赖于同源重组,效率太低,且在很多细胞类型及组织中并不适用。在哺乳动物细胞中,NHEJ修复占据主导地位,外源DNA通过NHEJ介导的随机整合已被广泛应用于转基因动物和细胞系的产生,其效率比HDR介导的DNA***高大约1000倍以上。近些年来,NHEJ通路用于外源DNA定向整合的应用潜力才逐渐被人们所开发。Orlando等人首次发现短的寡核苷酸(<100bp)可以通过NHEJ修复的方式有效地***ZFN诱导的基因组DSBs中(Orlando,S.J.,Santiago,Y.,DeKelver,R.C.,Freyvert,Y.,Boydston,E.A.,Moehle,E.A.,Choi,V.M.,Gopalan,S.M.,Lou,J.F.,Li,J.,et al.(2010)Zinc-finger nuclease-driven targeted integrationinto mammalian genomes using donors with limited chromosomal homology.NucleicAcids Res.,38,e152–e152)。在进一步研究中,Cristea和Maresca等人通过在供体质粒载体中引入ZFN或TALEN靶序列,核酸酶同时切割质粒和基因组DNA后,就可以通过NHEJ修复将质粒DNA定点整合到基因组上的DSB中(Cristea,S.,Freyvert,Y.,Santiago,Y.,Holmes,M.C.,Urnov,F.D.,Gregory,P.D.and Cost,G.J.(2013)In vivo cleavage of transgenedonors promotes nuclease-mediated targeted integration.Biotechnol.Bioeng.,110,871–880;Maresca,M.,Lin,V.G.,Guo,N.and Yang,Y.(2013)Obligate ligation-gated recombination(ObLiGaRe):Custom-designed nuclease-mediated targetedintegration through nonhomologous end joining.Genome Res.,23,539–546.)。这种设计思路同样适用于CRISPR/Cas9产生的NHEJ修复中,Suzuki等人利用CRISPR/Cas9和NHEJ开发出了一种不依赖于同源重组的定点整合技术(Homology-independent targetedintegration,HITI),能够在体内与体外高效地将外源DNA整合到靶位点,甚至在不***的神经元细胞中都能发挥作用,而HDR修复在这类细胞中则没有活性(Suzuki,K.,Tsunekawa,Y.,Hernandez-Benitez,R.,Wu,J.,Zhu,J.,Kim,E.J.,Hatanaka,F.,Yamamoto,M.,Araoka,T.,Li,Z.,et al.(2016)In vivo genome editing via CRISPR/Cas9 mediatedhomology-independent targeted integration.Nature,540,144–149.)。在随后的研究中,人们基于NHEJ介导的DNA定点敲入分别实现了报告基因的标记,大片段载体的定点整合,靶基因的破坏等一系列应用,使其成为了一种高效简单且功能丰富的分子生物学工具而被人们所关注。虽然NHEJ介导的DNA定点敲入技术已取得了显著进展,但是,尚未见其与基因捕获技术联合使用的靶向性基因突变技术。
发明内容
本发明的目的是提供一种不依赖于同源重组的靶向性基因捕获***,本发明的另一目的是提供一种不依赖于同源重组、可实现可回复性和条件性敲除的靶向性基因捕获***。
为实现上述目的,本发明将CRISPR/Cas9介导的依赖于非同源末端连接(Non-homologous end-joining,NHEJ)的DNA敲入策略和基因捕获技术相结合,开发一种新的靶向性基因突变***,命名为不依赖于同源重组的靶向性基因捕获***(Homology-independent targeted trapping,HIT-trapping)。与传统的基因捕获载体不同,该***包含的基因捕获载体上含有一个通用的Cas9识别位点,使其能够在细胞内与基因组同时被切割,随后细胞在利用NHEJ信号通路修复基因组的过程中将载体整合到靶位点,该***还包含Cas9蛋白表达模块和sgRNA表达模块。该***在进行基因突变时,由于捕获载体的整合不需要借助于位点特异的同源臂,而且通用于哺乳动物的所有靶位点,在更换靶点时只需要重新设计针对靶位点的sgRNA即可,与传统的同源重组技术相比绕开了繁琐的载体构建过程,在应用时更加简便。在上述靶向性基因捕获***的基础上,本发明提供一种不依赖于同源重组、可实现可回复性和条件性敲除的靶向性基因捕获***。该***通过将位点特异性重组酶技术介导的FlEx转换***整合到载体上,使得捕获元件在***到靶位点后能够在Cre酶的作用下发生倒位。这种可倒位的基因捕获载体结合NHEJ敲入的特点,更是可以在一次实验中同时获得可回复性和条件性的敲除。
具体地,本发明提供以下技术方案:
本发明提供一种不依赖于同源重组的靶向性基因捕获***,所述***包含以下模块:
Cas9蛋白识别位点模块,包含用于Cas9蛋白识别的核苷酸序列;
识别Cas9蛋白识别位点的sgRNA表达模块,包含启动子1以及可操作性连接于所述启动子1下游的sgRNA1,所述sgRNA1能够识别Cas9蛋白识别位点,用于引导Cas9蛋白将载体切割为线性;
基因捕获模块,包含剪接受体SA、来源于脑心肌炎病毒的IRES、标记基因和多聚腺苷酸加尾序列(polyA),且不包含基因捕获靶位点的同源臂;
Cas9蛋白表达模块,包含启动子2以及可操作性连接在所述启动子2下游的Cas9基因;
识别基因捕获靶位点的sgRNA表达模块,包含启动子1以及可操作性连接在所述启动子1下游的sgRNA2,所述sgRNA2能够识别基因捕获靶位点。
进一步地,为便于基因捕获元件***细胞的筛选,所述基因捕获***还包含基因捕获筛选模块,所述基因捕获筛选模块包含启动子3和药物筛选基因,用于筛选基因捕获模块成功***到靶位点的细胞。
优选地,所述启动子3为可在目的细胞中持续表达的启动子。更优选地,所述启动子3为SV40启动子,所述药物筛选基因为Puro抗性基因。
以上所述的靶向性基因捕获***中,所述基因捕获筛选模块可操作性连接于所述基因捕获模块的下游,所述识别Cas9蛋白识别位点的sgRNA表达模块和Cas9蛋白识别位点模块沿上游至下游的方向顺次、可操作性地连接于所述基因捕获模块的上游。
本发明发现,由上述模块组成的靶向性基因捕获***能够在细胞中实现靶向性基因捕获。为进一步提高靶向性基因捕获的敲入效率,本发明对各模块的元件选择进行了筛选和优化。
具体地,所述启动子1为U6启动子,所述启动子2为CMV启动子。
优选地,所述用于Cas9蛋白识别的核苷酸序列如SEQ ID NO.1所示,所述sgRNA1的序列如SEQ ID NO.2所示。
优选地,所述基因捕获模块(SA-ires-GFP-pA)的序列如SEQ ID NO.3所示。
为更有利于提高靶向性基因捕获的敲入效率,同时便于操作,优选将所述Cas9蛋白识别位点模块、识别Cas9蛋白识别位点的sgRNA表达模块和基因捕获模块置于第一载体上。
将所述Cas9蛋白表达模块和识别基因捕获靶位点的sgRNA表达模块分别置于第二载体和第三载体上。
优选地,所述第一载体的骨架载体为pX330,所述第二载体的骨架载体为pMax-GFP(Lonza)。
所述第三载体的骨架载体可采用本领域常用的可表达sgRNA的载体,包括但不限于pCRISPR-sg6(Xu C,Qi X,Du X,et al.piggyBac mediates efficient in vivo CRISPRlibrary screening for tumorigenesis in mice[J].Proceedings of the NationalAcademy of Sciences of the United States of America,2017,114(4):201615735.)。
作为本发明的优选实施方案,以上所述的靶向性基因捕获***包含三个载体。其中,第一载体为基因捕获载体,包含Cas9蛋白识别位点模块、识别Cas9蛋白识别位点的sgRNA表达模块和基因捕获模块,其序列如SEQ ID NO.4所示。SEQ ID NO.4所示序列的第15~233位为U6启动子。第二载体为Cas9表达载体,包含CMV启动子和Cas9基因,其序列如SEQID NO.5所示。SEQ ID NO.5所示的序列的第1~798位为CMV启动子,第1077~5201位为Cas9基因。第三载体为靶位点sgRNA表达载体,包含U6启动子和识别基因捕获靶位点的sgRNA。
在上述靶向性基因捕获***的基础上,本发明还提供一种可回复性和条件性敲除的靶向性基因捕获***,所述可回复性和条件性的靶向性敲除的基因捕获***包含所述靶向性基因捕获***,还包含Cre酶介导的FlEx转换模块,所述FlEx转换模块包含loxP/lox2272序列和Cre酶表达元件,所述loxP/lox2272序列分别位于基因捕获模块和Cas9蛋白识别位点模块之间以及基因捕获筛选模块的下游。
具体地,所述Cre酶表达元件在靶向性基因捕获需要回复或条件性敲除时,再单独转入细胞中。
为避免将sgRNA的启动子整合至基因组上,优选地,将所述Cas9蛋白识别位点模块、基因捕获模块、基因捕获筛选模块置于第一载体上;所述识别Cas9蛋白识别位点的sgRNA表达模块置于第二载体上。
所述Cas9蛋白表达模块和识别基因捕获靶位点的sgRNA表达模块分别位于第三载体和第四载体上。
优选地,所述第二载体的骨架载体为pX330,所述第三载体的骨架载体为pMax-GFP。
所述第四载体的骨架载体可采用本领域常用的可表达sgRNA的载体,包括但不限于pCRISPR-sg6。
进一步优选地,在第一载体构建时,先将所述Cas9蛋白识别位点模块、基因捕获模块、基因捕获筛选模块与载体pUC57-simple连接,再去除pUC57-simple的载体骨架,得到所述第一载体,用于转化细胞进行打靶。
作为本发明的优选方案,用限制性性内切酶PvuI处理连接所述Cas9蛋白识别位点模块、基因捕获模块和基因捕获筛选模块的pUC57-simple,电泳分离去除载体骨架部分并纯化***元件,再用T4 DNA连接酶处理环化,得到所述第一载体。
本发明还提供所述不依赖于同源重组的靶向性基因捕获***或所述可回复性和条件性敲除的靶向性基因捕获***在靶向性基因捕获、动物模型制备或药物筛选中的应用。
本发明所述的不依赖于同源重组的靶向性基因捕获***和可回复性和条件性敲除的靶向性基因捕获***可应用于动物细胞(包括但不限于哺乳动物细胞)。
本发明的有益效果在于:
本发明提供的不依赖于同源重组的靶向性基因捕获***(HIT-trapping)可实现高效的靶向性基因捕获,在小鼠ES细胞和多种哺乳动物细胞中均具有较高的敲入效率,极大地简化了突变型等位基因的制备,为高效向哺乳动物细胞中引入靶向性突变提供了新的路径。
本发明提供的不依赖于同源重组、可实现可回复性和条件性敲除的靶向性基因捕获***可通过Cre酶接到的FlEx转换***实现可回复性的基因敲除和基因的条件性敲除,为可回复性和条件性基因突变提供了有力的分子工具和新方法。
附图说明
图1为本发明实施例1中HIT-trapping***设计及作用原理示意图,其中,a,图中展示的为***的核心部分,HIT-trap-1C为基因捕获载体,基因捕获元件SA-ires-GFP-pA上有一个U6-sgA表达元件及sgA识别位点用于Cas9细胞内切割载体自身,药筛元件中Puro抗性基因由SV40启动子启动,SA,剪接受体;ATS,sgA靶位点(sgA target site);pM3-Cas9为Cas9蛋白瞬时表达载体,由CMV启动子启动;b,图中显示的为HIT-trapping技术在针对表达基因时的情况,Cas9 RNP复合物切割基因组上的靶位点与载体HIT-trap-1C,利用NHEJ修复将载体整合到靶位点上,载体中的基因捕获元件与内源基因发生剪接作用,内源的启动子转录并翻译出一个截短了的蛋白和GFP,同时载体上的药筛元件独立表达出Puro抗性基因,为细胞提供了抗药性。
图2为本发明实施例2中HIT-trapping在小鼠ES细胞中敲入效率的检测,其中,a,药筛后的小鼠ES细胞克隆的状态,细胞经过药筛并恢复培养后,有部分克隆存活,最上面的箭头表示经药筛后凋亡的细胞,中间箭头指的是存活但GFP不表达的克隆,最下面的箭头指的是存活且GFP表达的克隆。比例尺=50μm;b,小鼠ES细胞中载体敲入效率的统计。
图3为本发明实施例3中HIT-trapping***敲除靶基因的结果图,其中,a,测序确认载体正确敲入到靶位点,Seamless为载体与基因组无缝连接时的序列情况并作为参照,基因组序列标识为绿色,载体序列标识为黑色,PAM序列标识为蓝色,虚线表示碱基缺失,红色部分表示碱基增加或错配,5/3J,5’/3’接头(5’/3’junction);b,c,蛋白及RNA水平上检测HIT-trapping技术对Hprt基因的诱变性。Th-1,Th2-4和Th3-5为Hprt基因内含子上整合有HIT-trapping载体的单克隆细胞系。Hk-2/8/12为Hprt基因外显子上有indel的单克隆细胞系。柱状图是三次技术重复的统计结果,平均值±标准差(**P<0.01,Student’s t-test);d,HIT-trapping技术敲除Hprt基因的表型分析,图中展示为在针对Hprt基因的HIT-trapping实验中,对所得克隆进行药物抗性测试的典型结果,只有PCR鉴定阳性的GFP克隆(中间)才会具有6-TG抗性,GFP阳性但PCR鉴定阴性的克隆(右边)和野生型细胞(左边)经6-TG处理后均凋亡;比例尺=100μM。
图4为本发明实施例4中在多种哺乳动物细胞系中检测HIT-trapping***的有效性,其中,a,检测流程示意图;b,HIT-trapping技术在哺乳动物细胞中载体敲入的效率统计,每组数据至少两个重复实验,结果取平均值±标准差;c,各靶位点载体与基因组连接处的修复形式统计。5/3J,5’/3’接头,n=所测序的TA克隆的数目;d,碱基缺失情况统计,包括indels及MMEJ造成的碱基缺失。
图5为本发明实施例5中利用载体HIT-trap-FlEx同时获得靶基因的可回复性以及条件性敲除,其中,a,载体优化流程示意图;b,HIT-trap-FlEx载体示意图,SA-ires-pA为启动子捕获元件,SV40-Puro-pA为药筛元件;蓝色三角形,loxP位点;红色三角形,lox2272位点;洋红色箭头,PvuI酶切位点,ATS,sgA靶位点;c,载体经PvuI酶切后电泳分离***元件部分与载体骨架部分,最上面的条带为***元件部分,大小为3399bp;d,HIT-trap-FlEx载体的作用机制示意图。PvuI处理质粒,体外分离并纯化***元件部分,再通过自连环化得到载体LigFV3;载体LigFV3在细胞内经Cas9产生的NHEJ的作用,以正向或者反向的方式整合到靶位点得到带有可回复性或者条件性敲除的等位基因。在Cre酶介导的FlEx转换的作用下,基因捕获元件发生倒位并删除药筛元件,从而实现表型回复或者条件性敲除。
图6为本发明实施例5中优化载体LigFV3在哺乳动物细胞中的敲入效率检测,其中,a-c分别为针对mESC中的Nes和Hprt位点,A375细胞中的ACTB位点时,所挑选的克隆的PCR鉴定结果,其中对于Nes位点,每个克隆中正向和反向***的情况均作检测。5/3J,5’/3’接头;d,优化载体LigFV3在各靶位点的敲入效率统计。
图7为本发明实施例5中Cre酶重组产生的载体倒位导致细胞中GFP表达的变化,细胞中转入Cre酶后,靶位点上整合有载体的克隆GFP状态发生了转变,说明了细胞内的载体元件发生了倒位;单克隆细胞系AG1和H10中载体正向***到靶位点,而AN3和H17中载体反向***到靶位点;比例尺=50μm。
图8为本发明实施例5中测序进一步确认FlEx转换的作用,Cre酶介导的FlEx转换不仅能够使捕获元件发生倒位,还可以去除载体上的药筛元件,产生新的特异的载体与基因组的接头序列。
图9为本发明实施例5中验证FlEx转换产生的表型回复和条件性敲除,亚甲基蓝染色检测细胞的存活,H10和H17分为Hprt基因内含子上正向及反向整合有HIT-trapping载体的mESCs单克隆细胞系,Cre酶处理前后的克隆对6-TG和HAT的抗性发生了转换,证明了载体倒位产生的表型变化。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例1不依赖于同源重组的靶向性基因捕获***(HIT-trapping)的设计和构建
本发明的不依赖于同源重组的靶向性基因捕获***的设计构思如下:由于CRISPR/Cas9产生的NHEJ修复能够将外源DNA高效地整合到基因组的DSB处,基于此,将CRISPR/Cas9介导的NHEJ敲入技术与基因捕获技术相结合,在不依赖于同源重组的情况下将基因捕获载体敲入到目的基因的内含子中,从而实现基因的靶向性捕获。
为此,本实施例构建了可利用NHEJ修复实现敲入的基因靶向性基因捕获***,该***共包含三个载体:基因捕获载体HIT-trap-1C、Cas9表达载体pM3-Cas9(图1的a)和靶位点sgRNA表达载体。与传统的靶向性基因捕获载体不同,在HIT-trap-1C中,无启动子的SA-ires-GFP-pA(启动子捕获元件,序列如SEQ ID NO.3所示)两侧没有同源臂,而在其上游添加有一个在哺乳动物上中无同源性的Cas9识别位点(斑马鱼基因tia1l的一段序列,如SEQID NO.1所示)以及一个转录出识别此位点sgRNA(命名为sgA)的U6-sgA表达元件(sgRNA的序列如SEQ ID NO.2所示),用于Cas9细胞内切割载体自身。pM3-Cas9中由一个CMV启动子启动Cas9蛋白的表达。靶位点sgRNA表达载体中由一个U6启动子启动识别靶位点的sgRNA。
当HIT-trapping载体与Cas9蛋白和针对基因组上靶位点的sgRNA表达载体共转入细胞中后,表达转录出的Cas9蛋白与两种sgRNA分别结合形成针对载体及基因组的RNP复合物并切割载体与基因组上相对应的靶位点,随后细胞利用NHEJ信号通路修复基因组DSB的时候就可能会通过末端连接的方式将体内线性化的基因捕获载体引入到靶位点上。
此外,载体上还包含有一个药物筛选元件(SV40-Puro-pA),用于富集靶向捕获成功的细胞。当载体整合到表达基因的内含子中后,基因捕获元件(SA-ires-GFP-pA)上的剪接受体与内源基因发生剪接作用,最终产生了一段截短的内源靶基因蛋白及GFP信号蛋白,从而破坏靶基因并同时指征其表达情况。药筛标记由载体上持续表达的启动子SV40启动,使得无论靶基因是否表达,都可以使用Puro进行筛选富集捕获载体成功***到靶位点的细胞(图1的b)。
经各元件的筛选和优化,最终确定的基因捕获载体HIT-trap-1C的序列如SEQ IDNO.4所示,包含Cas9蛋白识别位点、U6启动子、识别Cas9蛋白识别位点的sgRNA和基因捕获元件,其中,SEQ ID NO.4所示序列的第15~233位为U6启动子。Cas9表达载体pM3-Cas9的序列如SEQ ID NO.5所示,包含CMV启动子和Cas9基因,SEQ ID NO.5所示的序列的第1~798位为CMV启动子,第1077~5201位为Cas9基因。
实施例2HIT-trapping***在小鼠ES细胞中的敲入效率检测
为了检测HIT-trapping***中载体敲入到靶位点的效率,首先在小鼠Hprt基因的第一内含子上选择了三个靶位点用于检测实验。将HIT-trapping载体、Cas9蛋白及针对靶位点的sgRNA表达载体共转至小鼠ES细胞中,添加Puro进行药物筛选并恢复培养后,可以发现,部分存活的克隆GFP表达呈阳性,初步表明了载体成功整合到了靶位点,但同时也有少量的克隆GFP不表达,这可能是由于载体反向整合到靶位点或者整合到其他位点造成的(图2的a)。
另外选择Sall4、Tet1为靶基因用于检测实验,方法同上,各靶基因所使用的sgRNA序列如表1所示。
对药筛后存活的GFP阳性的克隆进行PCR鉴定,确定载体是否正确敲入到靶位点。结果显示,在针对Hprt、Sall4、Tet1这三个基因所挑选的克隆中均存在载体成功***到了靶位点的情况,总的效率达到了51.6%(16/31)(图2的b)。
表1各靶基因的sgRNA序列
Figure BDA0002901288400000051
实施例3HIT-trapping***对靶基因的诱变性检测
为了检测HIT-trapping***在靶位点是否产生了基因敲除的作用,在实施例2得到的细胞系中选择三个确定在Hprt位点上整合有基因捕获载体的单克隆细胞系:Th1-1,Th2-4和Th3-5作为实验组在蛋白及RNA水平上检测靶基因活性。
对这些克隆中载体与基因组连接处的序列进行测序,结果进一步确认了敲入事件的发生,由于NHEJ修复的非精确性,连接处存在一定程度的indels(图3的a)。与此同时,还选择了三个由传统的Cas9技术敲除Hprt基因的单克隆细胞系:hk-2,hk-8和hk-12(hk-2和hk-8中第二外显子上分别缺失了12bp和5bp碱基,hk-12第二外显子上增加了2bp碱基)以及野生型细胞系作为对照组。
Western blot结果显示,在内含子中敲入HIT-trapping载体与在外显子上产生indels均能在蛋白水平上有效地敲除Hprt基因(图3的b)。而q-PCR结果表明两种形式的敲除在一定程度上都会降解靶基因的mRNA,但基因捕获造成的降解更加彻底(图3的c),这与之前的研究结果相吻合(Reber,S.,Mechtersheimer,J.,Nasif,S.,Benitez,J.A.,Colombo,M.,Domanski,M.,Jutzi,D.,Hedlund,E.and Ruepp,M.D.(2018)CRISPR-Trap:aclean approach for the generation of gene knockouts and gene replacements inhuman cells.Mol.Biol.Cell,29,75–83.)。
由于Hprt敲除的细胞会产生6-TG抗性。因此,为了从表型上检测HIT-trapping技术制备的基因敲除细胞系,用6-TG处理上述实验中靶向Hprt的小鼠ES细胞克隆,结果显示,有的克隆虽然GFP为阳性,但PCR未检测到载体的***,这样的克隆没有6-TG抗性,只有PCR鉴定阳性的克隆才会产生抗药性(图3的d),证明了利用HIT-trapping技术所产生的细胞在表型上同样达到了敲除的标准,同时也说明了PCR检测方式的可靠性与严格性。
以上结果表明,HIT-trapping技术应用在小鼠ES细胞中时具有较高的打靶效率,尽管NHEJ修复会引入一定程度的indels,但并不影响敲入的载体对基因产生诱变的效果。
实施例4HIT-trapping***通用于多种哺乳动物细胞系
当基因捕获载体***到具有转录活性的基因中时,基因捕获元件劫持内源基因的转录本,并破坏该基因,同时被捕获基因的启动子启动载体上的GFP表达。因此,可以直接通过FACS技术在整体水平上检测出载体敲入到靶位点的效率(图4的a)。为了检测HIT-trapping技术在哺乳动物细胞系中的效率以及是否具有通用性,选择小鼠ES细胞、人类293T和A375细胞、猪的胎儿成纤维细胞(pFFs)这四个细胞系进行实验。
在靶点选择方面,小鼠的基因组上选择Hprt,Sall4和Tet1作为靶点,人的基因组上选择ACTB和HPRT1作为靶点,猪的基因组上选择ROSA26和THY1作为靶点,以上这些基因在对应的细胞系中均为表达的状态,各靶基因所使用的sgRNA序列如表1所示。将HIT-trapping载体(HIT-trap-1C)与Cas9蛋白和sgRNA表达载体共转至相应的细胞系中,经过药物筛选富集,能够获得大量含有捕获载体整合的细胞用于后续分析,其中对照组中除了缺少针对基因组的sgRNA外,其余条件相同。
FACS结果显示(图4的b),在药筛富集到的细胞群中,均存在一定比例的GFP阳性细胞。实验组中GFP阳性细胞比例与细胞类型和靶位点相关,最低的为24.6±2.7%(pFF,THY1),最高达到了68.0±0.4%(A375,ACTB)。虽然对照组中载体随机整合也会产生部分GFP阳性细胞(12.6±1.3%-17.9±2.0%),但对照组中细胞经药筛后存活量较少,因此,总体上而言,实验组中筛选得到的大部分GFP阳性的细胞均为载体正确***到靶位点而产生的。
由于NHEJ修复会产生一定程度的indels,这有可能会破坏载体上的捕获元件,从而造成捕获载体失去功能,因此载体整合到靶位点的精确程度也是评估HIT-trapping技术的一个重要指标。为此,选择小鼠ES细胞中的Hprt位点,人类A375细胞中的ACTB位点和pFFs中的THY1位点,检测HIT-trapping载体被整合到这三个位点的过程中,NHEJ修复产生的indels的情况。收集上一步实验中这三个靶点筛选富集到的细胞,提取基因组并PCR扩增出载体两侧与基因组接头处的序列,通过TA克隆测序并比对分析。结果显示,各位点中载体与基因组均存在一定比例的无缝连接的情况,其中A375细胞与pFFs中无缝连接的比例相对于小鼠ES细胞更高,最高甚至达到了92.4%(A375,5’接头);无缝连接的比例与细胞类型相关,而同一靶点上5’端和3’端无缝连接的比例差异不是很大。而且,还发现有部分的连接是由微同源末端连接(microhomology-mediated end joining,MMEJ)修复产生的,这种情况在小鼠ES细胞中更为常见。统计碱基缺失的情况发现(图4的c),91%的序列缺失是小于50bp碱基的,这种程度的碱基缺失并不会破坏到载体上的功能元件,而且又由于靶位点又位于内含子中,该位置上轻微的碱基缺失对基因组的影响较小。因此,NHEJ产生的indels并不会对实验造成太大影响,绝大部分***到靶位点的捕获载体都可发挥作用。以上结果表明HIT-trapping技术可以高效地通用于多种哺乳动物细胞系。
实施例5HIT-trapping***可以同时实现靶基因的可回复性以及条件性敲除
由于NHEJ介导的载体敲入没有方向性,在实验中能够同时得到载体正向及反向敲入到靶位点的等位基因。之前的研究表明,基因捕获载体在内含子中正向***时,能够产生功能缺失型的突变,起到基因敲除的作用,而当反向***时,基因捕获元件不发挥作用,对基因功能的影响较小(Schnütgen,F.,De-Zolt,S.,Van Sloun,P.,Hollatz,M.,Floss,T.,Hansen,J.,Altschmied,J.,Seisenberger,C.,Ghyselinck,N.B.,Ruiz,P.,et al.(2005)Genomewide production of multipurpose alleles for the functional analysis ofthe mouse genome.Proc.Natl.Acad.Sci.U.S.A.,102,7221–7226;Xin,H.B.,Deng,K.Y.,Shui,B.,Qu,S.,Sun,Q.,Lee,J.,Greene,K.S.,Wilson,J.,Yu,Y.,Feldman,M.,et al.(2005)Gene trap and gene inversion methods for conditional gene inactivationin the mouse.Nucleic Acids Res.,33,1–10;Ni,T.T.,Lu,J.,Zhu,M.,Maddison,L.A.,Boyd,K.L.,Huskey,L.,Ju,B.,Hesselson,D.,Zhong,T.P.,Page-McCaw,P.S.,et al.(2012)Conditional control of gene function by an invertible gene trap in zebrafish.Proc.Natl.Acad.Sci.U.S.A.,109,15389–15394.)。
本实施例通过将HIT-trapping***与位点特异性重组酶(Site-specificrecombinase,SSR)***相结合,将基因捕获元件设计为可以倒位的结构,实现载体正向与反向的敲入分别产生可回复性及条件性的敲除。
为了实现基因捕获元件的倒位,选择了Cre酶介导的FlEx(flip-excision)转换***,该***已经被证实能够在哺乳动物中高效稳定地实现载体结构的倒位。此外,为了避免载体骨架部分整合到靶位点上,还开发了一种简便的优化策略,如图5的a所示:利用同一种限制性内切酶将***元件部分与载体骨架部分分离,再用T4 DNA连接酶将纯化得到的线性DNA自连成环,以此作为打靶载体。
基于以上因素,设计了一种新的HIT-trapping***:该***包含基因捕获载体HIT-trap-FlEx载体(图5的b)、识别Cas9识别位点的sgRNA表达载体pKin-sgA、Cas9表达载体pM3-Cas9和靶位点sgRNA表达载体。在HIT-trap-FlEx载体中,基因捕获与药筛元件与HIT-trap-1C相同,但在这两个功能元件的两侧添加有一对反向平行的loxP/lox2272序列,用于FlEx转换作用。为了实现NHEJ介导的敲入,该***同样带有一个sgA靶位点用于Cas9体内切割载体,而转录切割该位点的sgA则由另一载体pKin-sgA单独表达,避免了U6启动子整合到靶位点。
此外,为了便于在体外去除载体骨架部分,在设计上只需一种PvuI限制性内切酶即可实现***元件与载体骨架部分的有效分离(图5的c)。在实验中,首先用限制性性内切酶PvuI处理HIT-trap-FlEx载体,酶切完全后,电泳分离去除载体骨架部分并纯化***元件,再用T4 DNA连接酶处理环化,由此得到HIT-trapping实验所用的优化载体并命名为LigFV3。将打靶载体与Cas9和相应的sgRNA表达载体共转入细胞中后,在Cas9产生的NHEJ修复作用下,载体会以随机的方向***到靶位点上。由于基因捕获元件的可倒位性,当再次转入Cre酶后,Cre酶介导的阶段性重组能够使基因捕获元件发生倒位,并同时删除药筛元件,使得载体在靶位点正向整合的敲除事件转变为非突变性的***,反之,无诱变作用的反向整合转变为了突变型,从而分别实现了靶基因的表型回复及条件性敲除。因此,载体在靶位点正向***的为可回复性敲除,而反向***的为条件性敲除(图5的d)。
为了检测优化得到的HIT-trapping载体LigFV3在哺乳动物细胞中的敲入效率,选择了小鼠ES细胞中的Nes基因和Hprt基因,人类A375细胞中的ACTB基因作为靶点进行检测,各靶基因所使用的sgRNA序列如表1所示。细胞电转完成后,药筛挑取单克隆细胞系并进行PCR鉴定。由于Hprt和ACTB基因在各自的细胞类型中均为表达状态,故针对这两个位点所挑选的克隆可以根据GFP表达情况初步判断载体的敲入情况,并对其进行对应的检测,即GFP阳性的克隆检测正向敲入事件,反之则检测反向敲入事件。而Nes基因在小鼠ES细胞中不表达,观察发现筛选到的绝大部分的克隆GFP为阴性,无法通过GFP判断载体的敲入。因此,对于所挑选的每个克隆,正向及反向***事件均作检测。PCR鉴定结果显示,所有的靶点均可成功得到载体正向及反向敲入的克隆,且大部分的鉴定结果中5’/3’接头PCR均为阳性(图6的a,b,c)。总结基因型鉴定的结果得知,通过鉴定少量的克隆(不超过24个)即可同时得到捕获载体正向及反向***的情况,特别是针对表达基因时所得的GFP阳性克隆中,包含有载体正向整合的克隆比例更高(图6的d)。这些结果说明了优化后得到的载体LigFV3通过NHEJ的作用敲入到靶位点的高效率。
为了检测整合到靶位点的捕获元件在FlEx转换的作用下是否可以发生倒位,选择了上述实验中的获得的一些确定有载体整合的克隆进行实验。载体正向***的选择靶向ACTB基因的A375单克隆细胞系AG1和靶向Hprt基因的mESCs单克隆细胞系H10;载体反向***的选择靶向ACTB基因的A375单克隆细胞系AN3和靶向Hprt基因的mESCs单克隆细胞系H17。由于这些克隆中GFP信号与载体的***方向相关,从而可以直观地从GFP表达的情况来判断载体在靶位点的方向。将Cre酶表达载体分别转入这四个单克隆细胞系中后,发现原先GFP表达的克隆AG1和H10中GFP停止表达,而GFP不表达的克隆AN3和H17中则激活了GFP的表达(图7)。因此,从GFP荧光的变化上初步确认了细胞内靶位点上的载体元件发生了倒位。
为了进一步确认基因捕获元件在靶位点上由FlEx转换造成的倒位,还提取了mES细胞系H10和H17转入Cre酶发生重组后细胞的DNA,位点特异性的PCR扩增出载体两端与基因组连接处的序列并测序。结果表明,整合到靶位点的载体在Cre酶的作用下经FlEx转换后,产生了新的特异性的载体与基因组接头序列,证明了基因捕获元件发生了倒位,并且删除了药筛元件(图8)。
由于mES细胞中Hprt功能缺失会产生6-TG抗性和对HAT敏感的表型,而含有野生型Hprt的细胞表型则与之相反(对HAT有抗性,但对6-TG敏感)。所以在针对Hprt基因的实验中所获得的单克隆细胞系H10和H17为检测Cre酶介导的载体元件倒位所产生的表型回补和条件性敲除提供了便利。利用6-TG和HAT分别处理这两个细胞系及转入Cre酶所得的亚克隆细胞系(H10+cre,H17+Cre)后,亚甲基蓝染色检测细胞的存活。结果显示,载体正向敲入的单克隆细胞系H10在6-TG处理后存活,经HAT处理后没有克隆形成,而载体反向敲入的单克隆细胞系H17的表型与其相反。当它们经过Cre酶的作用后,细胞的存活情况又与Cre酶处理前相反(图9)。这些现象说明了这些细胞中Hprt基因的功能与其内含子上所整合的基因捕获元件的方向相关,正向***造成Hprt基因功能的缺失,而反向***则对其功能影响不大,在Cre酶的作用下可以分别实现表型回复以及条件性敲除。
以上结果从分子水平及表型上证明,HIT-trapping***能够高效地针对靶基因同时产生可回复性及条件性的敲除。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
序列表
<110> 中国农业大学
<120> 一种不依赖于同源重组的靶向性基因捕获***及其应用
<130> KHP201120031.0
<160> 13
<170> SIPOSequenceListing 1.0
<210> 1
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ggtatgtcgg gaacctctcc agg 23
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ggtatgtcgg gaacctctcc 20
<210> 3
<211> 1713
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gcgattaagg gatctgtagg gcgcagtagt ccagggtttc cttgatgatg tcatacttat 60
cctgtccctt ttttttccac agctcgcggt tgaggacaaa ctcttcgcgg tctttccagt 120
ggggatcgac ggtatcgtag agtcgaggcc gctctagcgg atctgcccct ctccctcccc 180
cccccctaac gttactggcc gaagccgctt ggaataaggc cggtgtgcgt ttgtctatat 240
gttattttcc accatattgc cgtcttttgg caatgtgagg gcccggaaac ctggccctgt 300
cttcttgacg agcattccta ggggtctttc ccctctcgcc aaaggaatgc aaggtctgtt 360
gaatgtcgtg aaggaagcag ttcctctgga agcttcttga agacaaacaa cgtctgtagc 420
gaccctttgc aggcagcgga accccccacc tggcgacagg tgcctctgcg gccaaaagcc 480
acgtgtataa gatacacctg caaaggcggc acaaccccag tgccacgttg tgagttggat 540
agttgtggaa agagtcaaat ggctctcctc aagcgtattc aacaaggggc tgaaggatgc 600
ccagaaggta ccccattgta tgggatctga tctggggcct cggtgcacat gctttacatg 660
tgtttagtcg aggttaaaaa aacgtctagg ccccccgaac cacggggacg tggttttcct 720
ttgaaaaaca cgatgataat atggccacaa ccatggtgag caagggcgag gagctgttca 780
ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg 840
tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca 900
ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc tacggcgtgc 960
agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc 1020
ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc 1080
gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg 1140
acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac aacagccaca 1200
acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc aagatccgcc 1260
acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac acccccatcg 1320
gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc gccctgagca 1380
aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga 1440
tcactctcgg catggacgag ctgtacaagt aaagcgaatt cctagagctc gctgatcagc 1500
ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 1560
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 1620
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 1680
ggattgggaa gagaatagca ggcatgctgg gga 1713
<210> 4
<211> 6246
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
catgtgaggg cctatttccc atgattcctt catatttgca tatacgatac aaggctgtta 60
gagagataat tggaattaat ttgactgtaa acacaaagat attagtacaa aatacgtgac 120
gtagaaagta ataatttctt gggtagtttg cagttttaaa attatgtttt aaaatggact 180
atcatatgct taccgtaact tgaaagtatt tcgatttctt ggctttatat atcttgtgga 240
aaggacgaaa caccgggtat gtcgggaacc tctccgtttt agagctagaa atagcaagtt 300
aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg cttttttgtt 360
ttagagctag aaatagcaag ttaaaataag gctagtccgt ttttagcgcg tgcgccaatt 420
ctgcagacaa atggctctag aggtaccggt atgtcgggaa cctctccagg tgcgattaag 480
ggatctgtag ggcgcagtag tccagggttt ccttgatgat gtcatactta tcctgtccct 540
tttttttcca cagctcgcgg ttgaggacaa actcttcgcg gtctttccag tggggatcga 600
cggtatcgta gagtcgaggc cgctctagcg gatctgcccc tctccctccc ccccccctaa 660
cgttactggc cgaagccgct tggaataagg ccggtgtgcg tttgtctata tgttattttc 720
caccatattg ccgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac 780
gagcattcct aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt 840
gaaggaagca gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg 900
caggcagcgg aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata 960
agatacacct gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga 1020
aagagtcaaa tggctctcct caagcgtatt caacaagggg ctgaaggatg cccagaaggt 1080
accccattgt atgggatctg atctggggcc tcggtgcaca tgctttacat gtgtttagtc 1140
gaggttaaaa aaacgtctag gccccccgaa ccacggggac gtggttttcc tttgaaaaac 1200
acgatgataa tatggccaca accatggtga gcaagggcga ggagctgttc accggggtgg 1260
tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg 1320
agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gttcatctgc accaccggca 1380
agctgcccgt gccctggccc accctcgtga ccaccctgac ctacggcgtg cagtgcttca 1440
gccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct 1500
acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg 1560
tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg 1620
aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata 1680
tcatggccga caagcagaag aacggcatca aggtgaactt caagatccgc cacaacatcg 1740
aggacggcag cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc 1800
ccgtgctgct gcccgacaac cactacctga gcacccagtc cgccctgagc aaagacccca 1860
acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg 1920
gcatggacga gctgtacaag taaagcgaat tcctagagct cgctgatcag cctcgactgt 1980
gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 2040
aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 2100
taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 2160
agagaatagc aggcatgctg gggagcagga agagtcctga ggcggaaaga accagctgtg 2220
gaatgtgtgt cagttagggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca 2280
aagcatgcat ctcaattagt cagcaaccag gtgtggaaag tccccaggct ccccagcagg 2340
cagaagtatg caaagcatgc atctcaatta gtcagcaacc atagtcccgc ccctaactcc 2400
gcccatcccg cccctaactc cgcccagttc cgcccattct ccgccccatg gctgactaat 2460
tttttttatt tatgcagagg ccgaggccgc ctcggcctct gagctattcc agaagtagtg 2520
aggaggcttt tttggaggcc taggcttttg caaagatcga tcaagagaca ggatgaggat 2580
cgtttcgctc tagagtggcc acaaccatga ccgagtacaa gcccacggtg cgcctcgcca 2640
cccgcgacga cgtccccagg gccgtacgca ccctcgccgc cgcgttcgcc gactaccccg 2700
ccacgcgcca caccgtcgat ccggaccgcc acatcgagcg ggtcaccgag ctgcaagaac 2760
tcttcctcac gcgcgtcggg ctcgacatcg gcaaggtgtg ggtcgcggac gacggcgccg 2820
cggtggcggt ctggaccacg ccggagagcg tcgaagcggg ggcggtgttc gccgagatcg 2880
gcccgcgcat ggccgagttg agcggttccc ggctggccgc gcagcaacag atggaaggcc 2940
tcctggcgcc gcaccggccc aaggagcccg cgtggttcct ggccaccgtc ggcgtctcgc 3000
ccgaccacca gggcaagggt ctgggcagcg ccgtcgtgct ccccggagtg gaggcggccg 3060
agcgcgccgg ggtgcccgcc ttcctggaga cctccgcgcc ccgcaacctc cccttctacg 3120
agcggctcgg cttcaccgtc accgccgacg tcgaggtgcc cgaaggaccg cgcacctggt 3180
gcatgacccg caagcccggt gcctgagata aacgcgggac tctggggttc gaaatgaccg 3240
accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 3300
ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 3360
tcatgctgga gttcttcgcc caccctaggg ggaggctaac tgaaacacgg aaggagacaa 3420
taccggaagg aacccgcgct atgacggcaa taaaaagaca gaataaaacg cacggtgttg 3480
ggtcgtttgt tcggcgcgcc gatctcttaa ggcaggaacc cctagtgatg gagttggcca 3540
ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc 3600
cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg caggggcgcc 3660
tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata cgtcaaagca 3720
accatagtac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 3780
cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 3840
tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt 3900
ccgatttagt gctttacggc acctcgaccc caaaaaactt gatttgggtg atggttcacg 3960
tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 4020
taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg gctattcttt 4080
tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca 4140
aaaatttaac gcgaatttta acaaaatatt aacgtttaca attttatggt gcactctcag 4200
tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 4260
cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 4320
cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg 4380
cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 4440
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 4500
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 4560
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 4620
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 4680
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 4740
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 4800
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 4860
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 4920
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 4980
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 5040
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 5100
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 5160
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 5220
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 5280
gcgtggaagc cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 5340
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 5400
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 5460
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 5520
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 5580
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 5640
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 5700
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 5760
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 5820
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 5880
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 5940
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 6000
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 6060
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 6120
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 6180
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 6240
tgctca 6246
<210> 5
<211> 7079
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60
ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120
aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360
ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac 540
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 600
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaataaccc 660
cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagg 720
tcgtttagtg aaccgtcaga tcactagtag ctttattgcg gtagtttatc acagttaaat 780
tgctaacgca gtcagtgctc gactgatcac aggtaagtat caaggttaca agacaggttt 840
aaggaggcca atagaaactg ggcttgtcga gacagagaag attcttgcgt ttctgatagg 900
cacctattgg tcttactgac atccactttg cctttctctc cacaggggta ccgaagccgc 960
tagtcgacac cggtgccacc atggactata aggaccacga cggagactac aaggatcatg 1020
atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg aaggtcggta 1080
tccacggagt cccagcagcc gacaagaagt acagcatcgg cctggacatc ggcaccaact 1140
ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc 1200
tgggcaacac cgaccggcac agcatcaaga agaacctgat cggagccctg ctgttcgaca 1260
gcggcgaaac agccgaggcc acccggctga agagaaccgc cagaagaaga tacaccagac 1320
ggaagaaccg gatctgctat ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg 1380
acagcttctt ccacagactg gaagagtcct tcctggtgga agaggataag aagcacgagc 1440
ggcaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag taccccacca 1500
tctaccacct gagaaagaaa ctggtggaca gcaccgacaa ggccgacctg cggctgatct 1560
atctggccct ggcccacatg atcaagttcc ggggccactt cctgatcgag ggcgacctga 1620
accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc tacaaccagc 1680
tgttcgagga aaaccccatc aacgccagcg gcgtggacgc caaggccatc ctgtctgcca 1740
gactgagcaa gagcagacgg ctggaaaatc tgatcgccca gctgcccggc gagaagaaga 1800
atggcctgtt cggaaacctg attgccctga gcctgggcct gacccccaac ttcaagagca 1860
acttcgacct ggccgaggat gccaaactgc agctgagcaa ggacacctac gacgacgacc 1920
tggacaacct gctggcccag atcggcgacc agtacgccga cctgtttctg gccgccaaga 1980
acctgtccga cgccatcctg ctgagcgaca tcctgagagt gaacaccgag atcaccaagg 2040
cccccctgag cgcctctatg atcaagagat acgacgagca ccaccaggac ctgaccctgc 2100
tgaaagctct cgtgcggcag cagctgcctg agaagtacaa agagattttc ttcgaccaga 2160
gcaagaacgg ctacgccggc tacattgacg gcggagccag ccaggaagag ttctacaagt 2220
tcatcaagcc catcctggaa aagatggacg gcaccgagga actgctcgtg aagctgaaca 2280
gagaggacct gctgcggaag cagcggacct tcgacaacgg cagcatcccc caccagatcc 2340
acctgggaga gctgcacgcc attctgcggc ggcaggaaga tttttaccca ttcctgaagg 2400
acaaccggga aaagatcgag aagatcctga ccttccgcat cccctactac gtgggccctc 2460
tggccagggg aaacagcaga ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc 2520
cctggaactt cgaggaagtg gtggacaagg gcgcttccgc ccagagcttc atcgagcgga 2580
tgaccaactt cgataagaac ctgcccaacg agaaggtgct gcccaagcac agcctgctgt 2640
acgagtactt caccgtgtat aacgagctga ccaaagtgaa atacgtgacc gagggaatga 2700
gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga 2760
ccaaccggaa agtgaccgtg aagcagctga aagaggacta cttcaagaaa atcgagtgct 2820
tcgactccgt ggaaatctcc ggcgtggaag atcggttcaa cgcctccctg ggcacatacc 2880
acgatctgct gaaaattatc aaggacaagg acttcctgga caatgaggaa aacgaggaca 2940
ttctggaaga tatcgtgctg accctgacac tgtttgagga cagagagatg atcgaggaac 3000
ggctgaaaac ctatgcccac ctgttcgacg acaaagtgat gaagcagctg aagcggcgga 3060
gatacaccgg ctggggcagg ctgagccgga agctgatcaa cggcatccgg gacaagcagt 3120
ccggcaagac aatcctggat ttcctgaagt ccgacggctt cgccaacaga aacttcatgc 3180
agctgatcca cgacgacagc ctgaccttta aagaggacat ccagaaagcc caggtgtccg 3240
gccagggcga tagcctgcac gagcacattg ccaatctggc cggcagcccc gccattaaga 3300
agggcatcct gcagacagtg aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca 3360
agcccgagaa catcgtgatc gaaatggcca gagagaacca gaccacccag aagggacaga 3420
agaacagccg cgagagaatg aagcggatcg aagagggcat caaagagctg ggcagccaga 3480
tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa cgagaagctg tacctgtact 3540
acctgcagaa tgggcgggat atgtacgtgg accaggaact ggacatcaac cggctgtccg 3600
actacgatgt ggaccatatc gtgcctcaga gctttctgaa ggacgactcc atcgacaaca 3660
aggtgctgac cagaagcgac aagaaccggg gcaagagcga caacgtgccc tccgaagagg 3720
tcgtgaagaa gatgaagaac tactggcggc agctgctgaa cgccaagctg attacccaga 3780
gaaagttcga caatctgacc aaggccgaga gaggcggcct gagcgaactg gataaggccg 3840
gcttcatcaa gagacagctg gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc 3900
tggactcccg gatgaacact aagtacgacg agaatgacaa gctgatccgg gaagtgaaag 3960
tgatcaccct gaagtccaag ctggtgtccg atttccggaa ggatttccag ttttacaaag 4020
tgcgcgagat caacaactac caccacgccc acgacgccta cctgaacgcc gtcgtgggaa 4080
ccgccctgat caaaaagtac cctaagctgg aaagcgagtt cgtgtacggc gactacaagg 4140
tgtacgacgt gcggaagatg atcgccaaga gcgagcagga aatcggcaag gctaccgcca 4200
agtacttctt ctacagcaac atcatgaact ttttcaagac cgagattacc ctggccaacg 4260
gcgagatccg gaagcggcct ctgatcgaga caaacggcga aaccggggag atcgtgtggg 4320
ataagggccg ggattttgcc accgtgcgga aagtgctgag catgccccaa gtgaatatcg 4380
tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga gtctatcctg cccaagagga 4440
acagcgataa gctgatcgcc agaaagaagg actgggaccc taagaagtac ggcggcttcg 4500
acagccccac cgtggcctat tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca 4560
agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat catggaaaga agcagcttcg 4620
agaagaatcc catcgacttt ctggaagcca agggctacaa agaagtgaaa aaggacctga 4680
tcatcaagct gcctaagtac tccctgttcg agctggaaaa cggccggaag agaatgctgg 4740
cctctgccgg cgaactgcag aagggaaacg aactggccct gccctccaaa tatgtgaact 4800
tcctgtacct ggccagccac tatgagaagc tgaagggctc ccccgaggat aatgagcaga 4860
aacagctgtt tgtggaacag cacaagcact acctggacga gatcatcgag cagatcagcg 4920
agttctccaa gagagtgatc ctggccgacg ctaatctgga caaagtgctg tccgcctaca 4980
acaagcaccg ggataagccc atcagagagc aggccgagaa tatcatccac ctgtttaccc 5040
tgaccaatct gggagcccct gccgccttca agtactttga caccaccatc gaccggaaga 5100
ggtacaccag caccaaagag gtgctggacg ccaccctgat ccaccagagc atcaccggcc 5160
tgtacgagac acggatcgac ctgtctcagc tgggaggcga caaaaggccg gcggccacga 5220
aaaaggccgg ccaggcaaaa aagaaaaagg aattcctaga gctcgctgat cagcctcgac 5280
tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 5340
ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 5400
gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 5460
ggaagagaat agcaggcatg ctggggagcg gccgccgtga catgtgagca aaaggccagc 5520
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 5580
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 5640
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 5700
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 5760
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 5820
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 5880
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 5940
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 6000
ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 6060
gctcttgatc cggcaaacaa accacgctgg tagcggtggt ttttttgttt gcaagcagca 6120
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 6180
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgccgtctc agaagaactc 6240
gtcaagaagg cgatagaagg cgatgcgctg cgaatcggga gcggcgatac cgtaaagcac 6300
gaggaagcgg tcagcccatt cgccgccaag ctcttcagca atatcacggg tagccaacgc 6360
tatgtcctga tagcggtccg ccacacccag ccggccacag tcgatgaatc cagaaaagcg 6420
gccattttcc accatgatat tcggcaagca ggcatcgcca tgggtcacga cgagatcctc 6480
gccgtcgggc atgctcgcct tgagcctggc gaacagttcg gctggcgcga gcccctgatg 6540
ctcttcgtcc agatcatcct gatcgacaag accggcttcc atccgagtac gtgctcgctc 6600
gatgcgatgt ttcgcttggt ggtcgaatgg gcaggtagcc ggatcaagcg tatgcagccg 6660
ccgcattgca tcagccatga tggatacttt ctcggcagga gcaaggtgag atgacaggag 6720
atcctgcccc ggcacttcgc ccaatagcag ccagtccctt cccgcttcag tgacaacgtc 6780
gagcacagct gcgcaaggaa cgcccgtcgt ggccagccac gatagccgcg ctgcctcgtc 6840
ttgcagttca ttcagggcac cggacaggtc ggtcttgaca aaaagaaccg ggcgcccctg 6900
cgctgacagc cggaacacgg cggcatcaga gcagccgatt gtctgttgtg cccagtcata 6960
gccgaatagc ctctccaccc aagcggccgg agaacctgcg tgcaatccat cttgttcaat 7020
cataatatta ttgaagcatt tatcagggtt cgtctcgtcc cggtctcctc ccatgcatg 7079
<210> 6
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ggtaatgtag accatcaagc 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gtggacagac ttaactaggt 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ggactttaat tattaggtga 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
tatcaagagt cgcctcgaga 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ccttggagtg tgtattaagt 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
tcttaaccgt aatcagcctc 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
tgtgggaata tagagaaatt 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
tgatacttgt tcaagggctc 20

Claims (10)

1.一种不依赖于同源重组的靶向性基因捕获***,其特征在于,所述***包含以下模块:
Cas9蛋白识别位点模块,包含用于Cas9蛋白识别的核苷酸序列;
识别Cas9蛋白识别位点的sgRNA表达模块,包含启动子1以及可操作性连接在所述启动子1下游的sgRNA1,所述sgRNA1能够识别Cas9蛋白识别位点,用于引导Cas9蛋白将载体切割为线性;
基因捕获模块,包含剪接受体SA、来源于脑心肌炎病毒的IRES、标记基因和多聚腺苷酸加尾序列(polyA),且不包含基因捕获靶位点的同源臂;
Cas9蛋白表达模块,包含启动子2以及可操作性连接在所述启动子2下游的Cas9基因;
识别基因捕获靶位点的sgRNA表达模块,包含启动子1以及可操作性连接在所述启动子1下游的sgRNA2,所述sgRNA2能够识别基因捕获靶位点。
2.根据权利要求1所述的不依赖于同源重组的靶向性基因捕获***,其特征在于,所述基因捕获***还包含基因捕获筛选模块,所述基因捕获筛选模块包含启动子3和药物筛选基因,用于筛选基因捕获模块成功***到靶位点的细胞;
优选地,所述启动子3为SV40启动子,所述药物筛选基因为Puro抗性基因。
3.根据权利要求2所述的不依赖于同源重组的靶向性基因捕获***,其特征在于,所述基因捕获筛选模块可操作性连接于所述基因捕获模块的下游,所述识别Cas9蛋白识别位点的sgRNA表达模块和Cas9蛋白识别位点模块沿上游至下游的方向顺次、可操作性地连接于所述基因捕获模块的上游。
4.根据权利要求1~3任一种所述的不依赖于同源重组的靶向性基因捕获***,其特征在于,所述启动子1为U6启动子,所述启动子2为CMV启动子。
5.根据权利要求1所述的不依赖于同源重组的靶向性基因捕获***,其特征在于,所述用于Cas9蛋白识别的核苷酸序列如SEQ ID NO.1所示,所述sgRNA1的序列如SEQ ID NO.2所示,和/或,所述基因捕获模块的序列如SEQ ID NO.3所示。
6.根据权利要求1~5任一项所述的不依赖于同源重组的靶向性基因捕获***,其特征在于,所述Cas9蛋白识别位点模块、识别Cas9蛋白识别位点的sgRNA表达模块和基因捕获模块位于第一载体上;
优选地,所述Cas9蛋白表达模块和识别基因捕获靶位点的sgRNA表达模块分别位于第二载体和第三载体上。
7.一种可回复性和条件性敲除的靶向性基因捕获***,其特征在于,所述可回复性和条件性敲除的靶向性基因捕获***包含权利要求1~5任一项所述的靶向性基因捕获***,还包含Cre酶介导的FlEx转换模块,所述FlEx转换模块包含loxP/lox2272序列和Cre酶表达元件,所述loxP/lox2272序列分别位于基因捕获模块和Cas9蛋白识别位点模块之间以及基因捕获筛选模块的下游。
8.根据权利要求7所述的可回复性和条件性敲除的靶向性基因捕获***,其特征在于,所述Cre酶表达元件在靶向性基因捕获需要回复或条件性敲除时,再单独转入细胞中。
9.根据权利要求7或8所述的可回复性和条件性敲除的靶向性基因捕获***,其特征在于,所述Cas9蛋白识别位点模块、基因捕获模块、基因捕获筛选模块位于第一载体上;所述识别Cas9蛋白识别位点的sgRNA表达模块位于第二载体上;
优选地,所述Cas9蛋白表达模块和识别基因捕获靶位点的sgRNA表达模块分别位于第三载体和第四载体上。
10.根据权利要求1~6任一项所述的不依赖于同源重组的靶向性基因捕获***或权利要求7~9任一项所述的可回复性和条件性敲除的靶向性基因捕获***在靶向性基因捕获、动物模型制备或药物筛选中的应用。
CN202110057414.8A 2021-01-15 2021-01-15 一种不依赖于同源重组的靶向性基因捕获***及其应用 Pending CN114763559A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110057414.8A CN114763559A (zh) 2021-01-15 2021-01-15 一种不依赖于同源重组的靶向性基因捕获***及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110057414.8A CN114763559A (zh) 2021-01-15 2021-01-15 一种不依赖于同源重组的靶向性基因捕获***及其应用

Publications (1)

Publication Number Publication Date
CN114763559A true CN114763559A (zh) 2022-07-19

Family

ID=82365482

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110057414.8A Pending CN114763559A (zh) 2021-01-15 2021-01-15 一种不依赖于同源重组的靶向性基因捕获***及其应用

Country Status (1)

Country Link
CN (1) CN114763559A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106795521A (zh) * 2014-06-06 2017-05-31 瑞泽恩制药公司 用于修饰所靶向基因座的方法和组合物
WO2018096356A1 (en) * 2016-11-28 2018-05-31 Horizon Discovery Limited Methods for conditional gene knock-out
CN109207517A (zh) * 2017-07-07 2019-01-15 中国科学院动物研究所 用于基因组编辑和转录调控的药物诱导型CRISPR/Cas9***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106795521A (zh) * 2014-06-06 2017-05-31 瑞泽恩制药公司 用于修饰所靶向基因座的方法和组合物
WO2018096356A1 (en) * 2016-11-28 2018-05-31 Horizon Discovery Limited Methods for conditional gene knock-out
CN109207517A (zh) * 2017-07-07 2019-01-15 中国科学院动物研究所 用于基因组编辑和转录调控的药物诱导型CRISPR/Cas9***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王超玄;孙航;: "基因敲除小鼠技术的研究进展", 生物工程学报, no. 05, pages 784 - 794 *

Similar Documents

Publication Publication Date Title
KR101748575B1 (ko) Ins 유전자 녹아웃 당뇨병 또는 당뇨병 합병증 동물모델 및 이의 제조방법
US5885836A (en) FLP-mediated gene modification in mammalian cells, and compositions and cells useful therefor
CN112375748B (zh) 基于水疱性口炎病毒载体的新型冠状病毒嵌合重组疫苗及其制备方法与应用
CN109415756B (zh) 用于以高通量方式体内评估rna引导的核酸酶的活性的方法
EP1222262B1 (en) Conditional gene trapping construct for the disruption of genes
US20040003420A1 (en) Modified recombinase
CN103173492B (zh) 携带外源基因的复制型hbv载体、其转染后产生的重组hbv,和相应的制备方法与应用
CN112852875B (zh) 示踪肿瘤T淋巴细胞浸润的CD3e转基因小鼠模型的构建方法
CN108085328A (zh) 一种dna序列编辑的方法
CN112251464B (zh) 一种基因点突变的诱导方法
CN112941038A (zh) 基于水疱性口炎病毒载体的重组新型冠状病毒及其制备方法与应用
CN114921439A (zh) CRISPR-Cas效应子蛋白、其基因编辑***及应用
US20030145345A1 (en) LexA DNA binding domain optimized for arabidopsis species
CN112301018A (zh) 新型的Cas蛋白、Crispr-Cas***及其在基因编辑领域中的用途
CN112522264B (zh) 一种导致先天性耳聋的CRISPR/Cas9***及其在制备模型猪核供体细胞中的应用
CN114763559A (zh) 一种不依赖于同源重组的靶向性基因捕获***及其应用
KR102027400B1 (ko) 정의된 항원에 대한 보호 체액성 면역 반응을 형성하는 재조합 효모를 이용한 예방 접종
CN101570758A (zh) 一种双荧光蛋白分子细胞标记的方法
EP1395612A2 (en) Modified recombinase
US20030186291A1 (en) Genetically engineered phiC31-integrase genes
KR20230021676A (ko) 단백질 제조를 위한 핵산 구조체
CN112899306B (zh) Crispr***及其在构建gabrg2基因突变的克隆猪核供体细胞中的应用
CN115125270A (zh) 一种α-珠蛋白过表达载体及其应用
CN112680453B (zh) Crispr***及其在构建stxbp1突变的癫痫性脑病克隆猪核供体细胞中的应用
KR20130137944A (ko) 미토콘드리아 특이적으로 형광능이 부여된 퇴행성 뇌질환에 대한 약물 검출용 형질전환체 및 이를 이용한 약물 검출 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination