CN115704040A - 基于CRISPRi和CRISPRa的转录调控***、其建立方法及应用 - Google Patents

基于CRISPRi和CRISPRa的转录调控***、其建立方法及应用 Download PDF

Info

Publication number
CN115704040A
CN115704040A CN202110901314.9A CN202110901314A CN115704040A CN 115704040 A CN115704040 A CN 115704040A CN 202110901314 A CN202110901314 A CN 202110901314A CN 115704040 A CN115704040 A CN 115704040A
Authority
CN
China
Prior art keywords
promoter
seq
expression
girna
crarna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110901314.9A
Other languages
English (en)
Inventor
蔡孟浩
刘启
张元兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China University of Science and Technology
Original Assignee
East China University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China University of Science and Technology filed Critical East China University of Science and Technology
Priority to CN202110901314.9A priority Critical patent/CN115704040A/zh
Priority to PCT/CN2022/110767 priority patent/WO2023011659A1/zh
Publication of CN115704040A publication Critical patent/CN115704040A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了一种基于CRISPRi和CRISPRa的转录调控***、其建立方法及应用。本发明的新型转录调控***是一种高表达强度、低渗漏水平、灵活可编程的新型转录调控***。本发明也揭示了该转录调控***实现基因高强度低渗漏表达的方法:通过CRISPRi器件和CRISPRa器件对下游信号效应器件的协同调控,在压制本底表达的同时实现高强度转录水平。本发明所述的新型转录调控***,通过装载不同输入启动子,可以得到响应特定信号的新型表达***,对于高效的异源蛋白表达平台和微生物细胞工厂的开发和建立具有应用价值。

Description

基于CRISPRi和CRISPRa的转录调控***、其建立方法及应用
技术领域
本发明属于生物技术领域,更具体地,本发明涉及一种基于CRISPRi和CRISPRa的转录调控***、其建立方法及应用。
背景技术
基于优质底盘宿主,通过异源表达实现功能蛋白和化学品的高水平、可调控生产,是目前合成生物学和代谢工程领域的研究热点和主要方向之一。
由启动子介导的基因转录过程是决定基因表达强度和调控模式的关键步骤,一些来源于不同宿主的高效天然启动子被鉴定开发并广泛应用于学术研究和工业生产。然而,随着生物产业的快速发展,受限于有限的优质启动子数量及单一的信号响应模式,天然转录***已经难以满足本领域中日渐多样化的研究及生产需求。因此,需要通过启动子工程和转录因子工程技术,对天然转录***进行改造,以期开发出新型调控***。
然而,对于天然转录***的改造不可避免地会与细胞自身调控网络和遗传背景产生相互干扰,使基因转录强度和调控模式难以取得突破性进展。
因此,本领域有必要开发能够人工定制且高效可控的通用转录***和蛋白表达平台,以满足日益增长的研究及生产需求。
发明内容
本发明的目的在于提供一种基于CRISPRi和CRISPRa的新型转录调控***及其应用。
在本发明的第一方面,提供一种基于CRISPRi和CRISPRa的转录调控***,包括:信号效应器件,其包括目标启动子以及与之操作性连接的目的基因;CRISPRi阻遏器件,其靶向阻遏所述目标启动子,减弱目标启动子驱动的目的基因的表达;CRISPRa激活器件,其靶向激活所述目标启动子,增强目标启动子驱动的目的基因的表达。
在一个优选例中,所述CRISPRi阻遏器件包括:表达盒a,其表达基于CRISPR***的失活Cas蛋白1(CRISPR-dCas);及,表达盒b,其表达引导RNA即giRNA,所述giRNA引导所述失活Cas蛋白1至所述信号效应器件中的目标启动子区;所述CRISPRa激活器件包括:表达盒c,其表达基于CRISPR***的失活Cas蛋白2与转录激活因子的融合多肽;及,表达盒d,其表达引导RNA即gaRNA或craRNA,所述gaRNA或craRNA引导所述失活Cas蛋白2至所述信号效应器件中的目标启动子区;其中,所述失活Cas蛋白1与所述失活Cas蛋白2识别目标启动子序列中不同的PAM序列,相互正交(较佳地,所述“正交”指功能独立,相互之间的元件不发生串扰);所述giRNA与gaRNA或craRNA能形成giRNA-gaRNA或giRNA-craRNA二聚体,相互作用以调控阻遏或激活作用的强弱;较佳地,所述gaRNA或craRNA与所述giRNA的部分序列互补以形成二聚体。
在另一优选例中,所述giRNA包括区段a和Cas蛋白结合区a,所述区段a与所述信号效应器件中的目标启动子互补;所述gaRNA或craRNA包括区段b和Cas蛋白结合区b;所述区段b与区段a互补,或所述区段a或b与Cas蛋白结合区a或b互补结合。
在另一优选例中,所述互补包括基本上互补,如60%、70%、80%、90%、95%或98%的碱基互补。
在另一优选例中,表达盒a中,包括启动子,其驱动失活Cas蛋白1的表达;较佳地,所述启动子包括:组成型启动子或诱导型启动子;更佳地,所述启动子包括(但不限于):GAP启动子、ENO1启动子、GPM1启动子、ICL1启动子、AOX2启动子、TEF1启动子、PGK1启动子、GTH1启动子、DAS1启动子、FBA2启动子、THI11启动子、LRA3启动子;较佳地,表达盒a中的启动子不同于信号效应器件中的目标启动子。
在另一优选例中,表达盒a中,所述失活Cas蛋白1为核酸酶活性缺失的Cas蛋白或其突变体;较佳地,为dCas9;较佳地,所述dCas9基因的核苷酸序列如SEQ ID NO:1所示或其简并的序列。
在另一优选例中,所述dCas9基因还包括:与SEQ ID NO:1序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列的基因。
在另一优选例中,表达盒b中,包括启动子,其驱动giRNA的表达;较佳地,所述启动子包括:组成型启动子或诱导型启动子;较佳地,所述组成型启动子包括(但不限于):GAP启动子、ENO1启动子、GPM1启动子、TEF1启动子、PGK1启动子;较佳地,所述诱导型启动子包括(但不限于):鼠李糖诱导型启动子、甲醇诱导型启动子、硫胺素饥饿诱导型启动子;更佳地,所述的鼠李糖诱导型启动子包括(但不限于)LRA3启动子,所述的甲醇诱导型启动子包括(但不限于)DAS1启动子、FBA2启动子,或所述的硫胺素饥饿诱导型启动子包括(但不限于)THI11启动子;较佳地,表达盒b中的启动子不同于信号效应器件中的目标启动子。
在另一优选例中,表达盒b中,所述的giRNA引导表达盒a中失活Cas蛋白1至所述信号效应器件中的目标启动子区。
在另一优选例中,表达盒c中,包括启动子,其驱动失活Cas蛋白2与转录激活因子的融合多肽的表达;较佳地,所述启动子包括:组成型启动子或诱导型启动子;更佳地,所述启动子包括(但不限于):GAP启动子、ENO1启动子、GPM1启动子、ICL1启动子、AOX2启动子、TEF1启动子、PGK1启动子、GTH1启动子、DAS1启动子、FBA2启动子、THI11启动子、LRA3启动子;较佳地,表达盒c中的启动子不同于信号效应器件中的目标启动子。
在另一优选例中,表达盒c中,所述失活Cas蛋白2为核酸酶活性缺失的Cas蛋白或其突变体;较佳地,包括VRER或dCpf1;较佳地,所述的VRER基因的核苷酸序列如SEQ ID NO:7所示或其简并的序列,所述的dCpf1基因的核苷酸序列如SEQ ID NO:8所示或其简并的序列。
在另一优选例中,所述VRER基因还包括:与SEQ ID NO:7序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列的基因;
在另一优选例中,所述dCpf1基因还包括:与SEQ ID NO:8序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列的基因。
在另一优选例中,表达盒d中,包括启动子,其驱动gaRNA或craRNA的表达;较佳地,所述启动子包括:组成型启动子或诱导型启动子;较佳地,所述组成型启动子包括(但不限于):GAP启动子、ENO1启动子、GPM1启动子、TEF1启动子、PGK1启动子;较佳地,所述诱导型启动子包括(但不限于):鼠李糖诱导型启动子、甲醇诱导型启动子、硫胺素饥饿诱导型启动子;更佳地,所述的鼠李糖诱导型启动子包括LRA3启动子,所述的甲醇诱导型启动子包括DAS1启动子、FBA2启动子,或所述的硫胺素饥饿诱导型启动子包括THI11启动子;较佳地,表达盒d中的启动子不同于信号效应器件中的目标启动子。
在另一优选例中,表达盒d中,所述的gaRNA或CraRNA引导表达盒c中失活Cas蛋白2至所述信号效应器件中的目标启动子区。
在另一优选例中,所述转录激活因子为具有独立招募RNA聚合酶能力的转录因子蛋白;较佳地,为VP16、VP64、VPR;较佳地,所述的VP16基因的核苷酸序列如SEQ ID NO:9所示或其简并的序列。
在另一优选例中,所述VP16基因还包括:与SEQ ID NO:9序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列的基因。
在另一优选例中,所述giRNA的长度为50~300碱基(如60、80、100、120、140、160、180、200、250碱基;较佳地80~180碱基);较佳地所述区段a位于giRNA的5’端,更佳地所述区段a长度为10~50碱基(如12、15、18、20、22、25、28、30、35、40、45碱基;较佳地15~25碱基);较佳地所述区段b位于所述gaRNA的5’端或craRNA的3’端,其长度与所述区段a相应。
在另一优选例中,所述Cas蛋白结合区a或Cas蛋白结合区b在二级结构上具有至少1个茎环(如1~8个,更具体如2、3、4、5、6或7个)。
在另一优选例中,所述目标启动子包括核心启动子,所述核心启动子为具备基础转录活性的最小启动子区域;较佳地,所述目标启动子包括:AOX1启动子或AOX1核心启动子;更佳地,所述的AOX1核心启动子序列如SEQ ID NO:28所示。
在另一优选例中,所述目标启动子为AOX1启动子或AOX1核心启动子;所述giRNA所对应的DNA序列如SEQ ID NO:2~6(分别为giRNA_1,giRNA_2,giRNA_3,giRNA_1c,giRNA_1m)任一所示。
在另一优选例中,所述区段a所对应的DNA序列如SEQ ID NO:2中第1~21位、SEQID NO:3中第1~20位或SEQ ID NO:4中第1~20位所示。
在另一优选例中,所述Cas蛋白结合区a所对应的DNA序列如SEQ ID NO:2中第22~101位或SEQ ID NO:6中第22~101位所示。
在另一优选例中,所述的giRNA可以单独应用,或可以组合应用。
在另一优选例中,所述gaRNA所对应的RNA序列如SEQ ID NO:10~12任一序列所示(分别为gaRNA_1、gaRNA_2、gaRNA_3,较佳地为gaRNA_2),较佳地如SEQ ID NO:11所示;所述craRNA所对应的RNA序列如SEQ ID NO:13~15任一序列所示(分别为craRNA_1、craRNA_2、craRNA_3,较佳地为craRNA_3),较佳地如SEQ ID NO:15所示。
在另一优选例中,所述区段b所对应的DNA序列如SEQ ID NO:10中第1~21位、SEQID NO:11中第1~21位或SEQ ID NO:12中第1~91位所示(对应于gaRNA);或如SEQ ID NO:13中第21~40位、SEQ ID NO:14中第21~42位或SEQ ID NO:15中第21~40位所示(对应于craRNA)。
在另一优选例中,所述Cas蛋白结合区b所对应的DNA序列如SEQ ID NO:10中第22~101位或SEQ ID NO:11中第22~101位所示(对应于gaRNA);或如SEQ ID NO:13中第1~20位所示(对应于craRNA)。
在另一优选例中,所述的信号效应器件包括从5’到3’依次操作性连接的:gaRNA结合序列或craRNA结合序列(包括与gaRNA或craRNA的序列互补的序列)、目标启动子(包括启动子或核心启动子)和目的基因;较佳地,所述gaRNA结合序列或craRNA结合序列能以模板链或非模板链与对应的gaRNA或craRNA结合;其中,所述gaRNA结合序列如SEQ ID NO:16~21任一序列所示;所述craRNA结合序列如SEQ ID NO:22~27任一序列所示。
在另一优选例中,所述的信号效应器件中还包括信号增益元件以及受其激活的中间启动子;较佳地,所述信号效应器件包括:(a)目标启动子和由其驱动表达的信号增益元件;及(b)能由所述信号增益元件激活的中间启动子和由其驱动表达的目的基因;更佳地,所述信号增益器件包括人工转录激活因子STA、杂合启动子HP(中间启动子),以及由HP驱动的目的基因。
在另一优选例中,所述的STA基因的核苷酸序列如SEQ ID NO:29所示或其简并的序列,或与SEQ ID NO:29序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列。
在另一优选例中,所述的HP启动子的序列如SEQ ID NO:30所示或其同功能变体。
在本发明的另一方面,提供前面任一所述的转录调控***的应用,用于调控目的基因的表达强度;较佳地,包括弱化目的基因的表达或增强目的基因的表达。
在本发明的另一方面,提供一种调控目的基因表达的方法,包括:建立前面任一所述的转录调控***,根据目的基因的表达强度期望值,对其进行表达阻遏或表达激活。
在一个优选例中,所述CRISPRi阻遏器件中包括giRNA作为引导RNA(如,giRNA_1、其核苷酸序列如SEQ ID NO:2所示),以dCas9作为失活Cas蛋白1;所述CRISPRi激活器件中包括gaRNA作为引导RNA(如,gaRNA_2、其核苷酸序列如SEQ ID NO:11所示),以VRER作为失活Cas蛋白2;当giRNA和gaRNA的不同强度表达(较佳地,利用不同强度的启动子驱动其发生不同强度表达)时,所述目的基因发生不同强度的表达(如实施例3的举例)。
在另一优选例中,所述CRISPRi阻遏器件中包括giRNA作为引导RNA(如,giRNA_1),以dCas9作为失活Cas蛋白1;所述CRISPRi激活器件中包括craRNA作为引导RNA(如,craRNA_3、其核苷酸序列如SEQ ID NO:15所示),以dCpf1作为失活Cas蛋白2;当giRNA和craRNA的不同强度表达(较佳地,利用不同强度的启动子驱动其发生不同强度表达)时,所述目的基因发生不同强度的表达(如实施例4的举例)。
在另一优选例中,所述CRISPRi阻遏器件中包括giRNA作为引导RNA(如,giRNA_1)、且以诱导型启动子控制(开启或关闭)其表达,以dCas9作为失活Cas蛋白1;所述CRISPRi激活器件中包括craRNA作为引导RNA(如,craRNA_3、其核苷酸序列如SEQ ID NO:15所示),以dCpf1作为失活Cas蛋白2;当giRNA和craRNA的不同强度表达(较佳地,利用不同强度的启动子驱动其发生不同强度表达)时,所述目的基因发生不同强度的表达;较佳地,所述诱导型启动子包括(但不限于):鼠李糖诱导型启动子、甲醇诱导型启动子、硫胺素饥饿诱导型启动子(如实施例5、6或7的举例)。
在本发明的另一方面,提供一种用于调控目的基因表达的试剂盒,其中含有前面任一所述的转录调控***。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
附图说明
图1、RNA相互作用示意图。
图2A-B、CRISPRi器件中giRNA设计(A)及其对PAOX1的阻遏效果(B)。
图3A-C、CRISPRa器件对cPAOX1的激活原理(A)、结合链的设计(B)以及激活效果(C)。
图4 A-B、VRER+gaRNA_2介导的人工转录调控***的调控模型的作用原理(A)及其调控效果(B)。
图5 A-B、dCpf1+craRNA_3介导的人工转录调控***的调控模型的作用原理(A)及其调控效果(B)。
图6 A-B、鼠李糖阻遏型表达***的效果验证。
图7、鼠李糖阻遏型表达***对鼠李糖浓度的剂量响应曲线。
图8 A-B、甲醇阻遏型表达***的效果验证。
图9 A-B、硫胺素诱导型表达***的效果验证。
具体实施方式
本发明人经过深入的研究,揭示了一种利用CRISPRi和CRISPRa实现基因高强度低渗漏表达的方法,分别设计及组装CRISPRi阻遏器件和CRISPRa激活器件,构建得到新型转录调控***,通过CRISPRi器件和CRISPRa器件对下游信号效应器件的协同调控,在压制本底表达的同时实现高强度转录水平。本发明所述的新型转录调控***,通过装载不同输入启动子,可以得到响应特定信号的新型表达***,对于高效的异源蛋白表达平台和微生物细胞工厂的开发和建立具有良好的应用价值。
如本文所用,所述的“启动子”是指一种核酸序列,其通常存在于目的基因编码序列的上游(5’端),能够引导核酸序列转录为mRNA。一般地,启动子或启动子区提供RNA聚合酶和正确起始转录所必需的其它因子的识别位点。在本文中,所述的启动子或启动子区包括启动子的活性变异体,该变异体可以是天然发生的等位变异体或非天然发生的变异体。所述的变异体包括取代变异体、缺失变异体和***变异体。
如本文所用,所述的“组成型启动子”是指在其调控下,目的基因的表达基本恒定在同样的水平上,在不同组织器官和发育阶段的基因表达没有明显差异的一类启动子。
如本文所用,所述的“诱导型启动子”可根据需要在特定细胞生长阶段或特定生长环境下,快速诱导基因转录的“开”与“关”或者“高”与“低”。根据来源,可将诱导型启动子分为天然存在的启动子和人工构建的启动子。
如本文所用,所述的“中间启动子”是指一种能接收特定元件(如信号增益元件)的信号并发生激活,驱动下游目的基因表达的启动子。
如本文所用,“目的基因”是指可由本发明的目标启动子指导表达的基因。本发明对合适的目的基因没有特别的限制,其可以是结构基因或非结构基因。例如,所述“目的基因”包括但不限于:结构基因、编码具有特定功能的蛋白的基因、酶、报告基因(如绿色荧光蛋白、荧光素酶基因或半乳糖苷酶基因LacZ)。由所述“目的基因”所表达的蛋白可称为“目的蛋白”。
如本文所用,所述“目标启动子”是指存在于本发明的“信号效应器件”中,由本发明的CRISPRi阻遏器件和/或CRISPRi激活器件调控的启动子。
如本文所用,所述“CRISPRi阻遏器件”为一种构建体,含有适当的表达盒,能够靶向阻遏所述目标启动子,减弱目标启动子驱动的目的基因的表达。
如本文所用,所述“CRISPRa激活器件”为一种构建体,含有适当的表达盒,能够靶向激活所述目标启动子,增强目标启动子驱动的目的基因的表达。
如本文所用,所述“信号效应器件”为一种构建体,包括目标启动子以及与之操作性连接的目的基因;所述的CRISPRi阻遏器件或CRISPRa激活器件或相互组合形成的功能性分子能够作用于所述“信号效应器件”的目标启动子,从而调控目的基因的表达。
如本文所用,“外源的”或“异源的”是指来自不同来源的两条或多条核酸或蛋白质序列之间的关系。例如,如果启动子与目的基因序列的组合通常不是天然存在的,则启动子对于该目的基因来说是外源的。特定序列对于其所***的细胞或生物体来说是“外源的”。
如本文所用,所述的“表达盒”是指包含有表达目的多肽所需的所有必要元件的基因表达***,通常其包括以下元件:启动子、编码多肽的基因序列,终止子;此外还可选择性包括信号肽编码序列等。这些元件是操作性相连的。
如本文所用,所述的“可操作性连接”是指两个或多个核酸区域或核酸序列的功能性的空间排列。例如:启动子区被置于相对于目的基因核酸序列的特定位置,使得核酸序列的转录受到该启动子区域的引导,从而,启动子区域被“可操作地连接”到该核酸序列上。
如本文所用,所述的失活Cas蛋白是Cas蛋白的突变体,其核酸内切酶活性发生缺失,但保留有向导RNA(gRNA)引导达到基因组特定位置的能力,保留有在gRNA的指导下与特定靶向的DNA有效结合的能力。
如本文所用,所述的“含有”,“具有”或“包括”包括了“包含”、“主要由……构成”、“基本上由……构成”、和“由……构成”;“主要由……构成”、“基本上由……构成”和“由……构成”属于“含有”、“具有”或“包括”的下位概念。
CRISPR/Cas作为新兴的基因编辑技术,其高效、灵活和简单易操作等特性使其已成为生物科学和生物技术的领域研究和应用的工具。基于Cas蛋白的无核酸酶活性突变体dCas蛋白的CRISPRi***和CRISPRa***可以分别实现对转录过程的阻遏或激活,目前已有一定的研究进展;但是,两个***如何进行有效地整合利用,在本领域中尚没有成熟可靠的方法。
本发明揭示了一种利用CRISPRi和CRISPRa实现基因高强度低渗漏表达的方法,通过CRISRPi器件和CRISPRa器件的协同作用,控制下游核心启动子的表达,实现对转录过程的高效、严谨调控。更具体地,在本发明构建的新型转录调控***,一方面,CRISPRi器件中的dCas蛋白会与giRNA结合,并在giRNA的引导下定位至下游核心启动子内部,阻遏转录过程;另一方面,CRISPRa器件中的dCas与转录激活因子的融合蛋白会与gaRNA或craRNA结合,在其引导下与核心启动子上游的对应的gaRNA或craRNA结合序列结合,使转录激活因子与核心启动子在空间上靠近。从而,所述的转录激活因子能够招募RNA聚合酶结合到所述的核心启动子上,启动目的基因的转录。其中,CRISPRi器件中的dCas蛋白和CRISPRa器件中的dCas蛋白所识别的PAM序列不同,相互正交;CRISPRi器件中的giRNA和CRISPRa器件中的gaRNA或craRNA能够相互结合,形成二聚体,从而干扰彼此的功能。
本发明中,所述的CRISPRi器件中的dCas蛋白包括但不限于:dCas9。所述的dCas9基因的核苷酸序列可以是SEQ ID NO:1所示。本发明还涉及上述多核苷酸的简并的序列。本发明还涉及上述多核苷酸的变异体,其编码与上述核苷酸所编码的相同氨基酸序列的多肽或多肽的片段、类似物和衍生物。这些核苷酸变异体包括取代变异体、缺失变异体和***变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或***,但不会从实质上改变其编码的多肽的功能。本发明还涉及与上述多核苷酸同源的多核苷酸,较佳地同源性为70%以上、80%以上、90%以上、93%、95%以上或97%以上,这些多核苷酸所编码的多肽也具有与前述多核苷酸所编码的多肽相同的功能。
所述的giRNA包括但不限于:giRNA_1、giRNA_2、giRNA_3、giRNA_1c、giRNA_1m。
所述的giRNA_1所对应的DNA序列如SEQ ID NO:2所示;所述的giRNA_2所对应的DNA序列如SEQ ID NO:3所示;所述的giRNA_3所对应的DNA序列如SEQ ID NO:4所示;所述的giRNA_1c所对应的DNA序列如SEQ ID NO:5所示;所述的giRNA_1m所对应的DNA序列如SEQID NO:6所示。本发明还涉及上述多核苷酸的简并的序列。本发明还涉及上述多核苷酸的变异体,这些核苷酸变异体包括取代变异体、缺失变异体和***变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或***,但不会从实质上改变其编码的RNA的功能。本发明还涉及与上述多核苷酸同源的多核苷酸,较佳地同源性为70%以上、80%以上、90%以上、93%、95%以上或97%以上,这些多核苷酸所编码的RNA也具有与前述多核苷酸所编码的RNA相同的功能。
所述的CRISPRi器件中,也包括使得dCas蛋白顺利表达的启动子元件。任意能使dCas蛋白大量表达的启动子均可应用于CRISPRi器件中。所述的启动子可以是:组成型启动子,诱导型启动子等。较佳地,所述的启动子包括(但不限于):组成型启动子PGAP。同样地,所述的CRISPRi器件中也包括适用的终止子,这是本领域技术人员构建基因表达盒所熟知的元件。
所述的CRISPRi器件中,也包括使得giRNA顺利表达的启动子元件。所述的启动子包括(但不限于):组成型启动子PGAP。鼠李糖诱导型启动子、甲醇诱导型启动子、硫胺素饥饿诱导型启动子;较佳地,所述的鼠李糖诱导型启动子包括LRA3启动子;较佳地,所述的甲醇诱导型启动子包括DAS1启动子、FBA2启动子;较佳地,所述的硫胺素饥饿诱导型启动子包括THI11启动子。
本发明中,所述的CRISPRa激活器件中的dCas蛋白包括但不限于:VRER、dCpf1;所述的转录激活因子包括但不限于:VP16;所述的gaRNA包括但不限于:gaRNA_1、gaRNA_2、gaRNA_3;所述的craRNA包括但不限于:craRNA_1、craRNA_2、craRNA_3。并且,VRER与gaRNA对应结合,dCpf1与craRNA对应结合;gaRNA_1、gaRNA_2、craRNA_1、craRNA_3与giRNA_1对应结合;gaRNA_3与giRNA_1c对应结合;craRNA_2与giRNA_1m对应结合。
所述的VRER基因的核苷酸序列如SEQ ID NO:7所示;所述的dCpf1基因的核苷酸序列如SEQ ID NO:8所示;所述的VP16基因的核苷酸序列如SEQ ID NO:9所示;所述的gaRNA_1所对应的DNA序列如SEQ ID NO:10所示;所述的gaRNA_2所对应的DNA序列如SEQ ID NO:11所示;所述的gaRNA_3所对应的DNA序列如SEQ ID NO:12所示;所述的craRNA_1所对应的DNA序列如SEQ ID NO:13所示;所述的craRNA_2所对应的DNA序列如SEQ ID NO:14所示;所述的craRNA_3所对应的DNA序列如SEQ ID NO:15所示。本发明还涉及上述多核苷酸的简并的序列。本发明还涉及上述多核苷酸的变异体,这些核苷酸变异体包括取代变异体、缺失变异体和***变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或***,但不会从实质上改变其编码的多肽或RNA的功能。本发明还涉及与上述多核苷酸同源的多核苷酸,较佳地同源性为70%以上、80%以上、90%以上、93%、95%以上或97%以上,这些多核苷酸所编码的RNA也具有与前述多核苷酸所编码的多肽或RNA相同的功能。
所述的CRISPRa器件中,也包括使得dCas和转录激活因子的融合多肽以及gaRNA或craRNA顺利表达的启动子元件。任意能使融合多肽以及gaRNA或craRNA大量表达的启动子均可应用于CRISPRa器件中。所述的启动子可以是:组成型启动子,诱导型启动子等。较佳地,所述的启动子包括(但不限于):组成型启动子PGAP。同样地,所述的CRISPRa器件中也包括适用的终止子,这是本领域技术人员构建基因表达盒所熟知的元件。
本发明中,所述的gaRNA结合序列包括但不限于:g1、g1r、g2、g2r、g3、g3r;所述的craRNA结合序列但不限于:cr1、cr1r、cr2、cr2r、cr3、cr3r。并且,当gaRNA应用gaRNA_1时,相应的gaRNA结合序列应用g1或g1r;当gaRNA应用gaRNA_2时,相应的gaRNA结合序列应用g2或g2r;当gaRNA应用gaRNA_3时,相应的gaRNA结合序列应用g3或g3r;当craRNA应用craRNA_1时,相应的craRNA结合序列应用cr1或cr1r;当craRNA应用craRNA_2时,相应的craRNA结合序列应用cr2或cr2r;当craRNA应用craRNA_3时,相应的craRNA结合序列应用cr3或cr3r。
所述的g1的核苷酸序列如SEQ ID NO:16所示;所述的g1r的核苷酸序列如SEQ IDNO:17所示;所述的g2的核苷酸序列如SEQ ID NO:18所示;所述的g2r的核苷酸序列如SEQID NO:19所示;所述的g3的核苷酸序列如SEQ ID NO:20所示;所述的g3r的核苷酸序列如SEQ ID NO:21所示;所述的cr1的核苷酸序列如SEQ ID NO:22所示;所述的cr1r的核苷酸序列如SEQ ID NO:23所示;所述的cr2的核苷酸序列如SEQ ID NO:24所示;所述的cr2r的核苷酸序列如SEQ ID NO:25所示;所述的cr3的核苷酸序列如SEQ ID NO:26所示;所述的cr3r的核苷酸序列如SEQ ID NO:27所示。本发明还涉及上述多核苷酸的简并的序列。本发明还涉及上述多核苷酸的变异体,这些核苷酸变异体包括取代变异体、缺失变异体和***变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或***,但不会从实质上改变其功能。本发明还涉及与上述多核苷酸同源的多核苷酸,较佳地同源性为70%以上、80%以上、90%以上、93%、95%以上或97%以上。
作为本发明的优选方式,所述的核心启动子为AOX1核心启动子。所述的AOX1核心启动子序列如SEQ ID NO:28所示。本发明还涉及上述多核苷酸的简并的序列。本发明还涉及上述多核苷酸的变异体,这些核苷酸变异体包括取代变异体、缺失变异体和***变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或***,但不会从实质上改变其功能。本发明还涉及与上述多核苷酸同源的多核苷酸,较佳地同源性为70%以上、80%以上、90%以上、93%、95%以上或97%以上。此外,其它的启动子或核心启动子也可被应用于本发明中。
不同来源、不同种类的dCas蛋白识别的PAM序列可能存在较大差异,为CRISPRi***和CRISPRa***的正交设计和协同使用奠定了基础。而gRNA灵活的可编程性能也为使用CRISPR***开发较为复杂的多功能遗传线路提供了可能。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如J.萨姆布鲁克等编著,分子克隆实验指南,第三版,科学出版社,2002中所述的条件,或按照制造厂商所建议的条件。
材料
质粒构建方法应用诺唯赞生物科技公司的无缝克隆试剂盒。
所使用的工具酶均购自TaKaRa生物公司(大连,中国)。
下面的商品化质粒和菌株用于基因克隆和蛋白表达:质粒pGAPZ B、质粒pPIC3.5k、大肠杆菌Top10、毕赤酵母菌株GS115,均购自Invitrogen公司;毕赤酵母菌株Δku70(参见专利申请CN201910403132.1);pAG32质粒来自美国加州大学圣地亚哥分校;p414-TEF1p-Cas9-CYC1t质粒来自Addgene(43802);pET28TEV-LbCpf1质粒来自华东理工大学谭高翼副教授(参见Liang M,et al.A CRISPR-Cas12a-derived biosensing platform forthe highly sensitive detection of diverse small molecules.Nat Commun.2019;10(1):3672)。
由pPIC3.5k出发构建3.5k-TEF1-gRNA1质粒,具体方法参见Liu Q et al.CRISPR-Cas9-mediated genomic multiloci integration in Pichia pastoris.Microb CellFact.2019;18(1):144。
pDTg1PGAPdCas9质粒:参见Liu Q et al.CRISPR-Cas9-mediated genomicmultiloci integration in Pichia pastoris.Microb Cell Fact.2019;18(1):144。
质粒pPAG是通过在质粒pPIC 3.5k的AOX1启动子下游的SnaB I酶切位点处***GFP基因(全长714bp,序列见GenBank登录号AY656807.1中第80~793位)而获得。
STA多肽、VP16多肽、HP启动子、giRNA_1、giRNA_2、giRNA_3、giRNA_4、giRNA_5、giRNA_6、gaRNA_1、gaRNA_2、gaRNA_3、craRNA_1、craRNA_2、craRNA_3的DNA片段均通过金唯智生物科技有限公司人工合成。
其中,STA多肽的DNA序列如SEQ ID NO:29所示;
VP16多肽的DNA序列如SEQ ID NO:9所示;
HP启动子序列如SEQ ID NO:30所示;
giRNA_1所对应的DNA序列如SEQ ID NO:2所示;
giRNA_2所对应的DNA序列如SEQ ID NO:3所示;
giRNA_3所对应的DNA序列如SEQ ID NO:4所示;
giRNA_4所对应的DNA序列如SEQ ID NO:31所示;
giRNA_5所对应的DNA序列如SEQ ID NO:32所示;
giRNA_6所对应的DNA序列如SEQ ID NO:33所示;
gaRNA_1所对应的DNA序列如SEQ ID NO:10所示;
gaRNA_2所对应的DNA序列如SEQ ID NO:11所示;
gaRNA_3所对应的DNA序列如SEQ ID NO:12所示;
craRNA_1所对应的DNA序列如SEQ ID NO:13所示;
craRNA_2所对应的DNA序列如SEQ ID NO:14所示;
craRNA_3所对应的DNA序列如SEQ ID NO:15所示。
代表性的giRNA、gaRNA和craRNA能够形成的二级结构如图1。对于giRNA,黄色区域代表对应DNA结合区域,对于gaRNA或craRNA,粉色区域代表对应DNA结合区域。对于gaRNA_2,其茎环结构上的红色区域代表与天然序列不同的突变区域。对于giRNA_1m,其3’端红色茎环区域代表与天然序列不同的突变区域。突变的目的是形成更长的二聚体结合序列。对于giRNA_1c,其在5’端加入一段茎环结构,可以与gaRNA_3的5’端对应结合形成二聚体。二聚体的形成会破坏引导RNA与对应Cas蛋白的结合,或者对特定DNA位点的识别。图中的复合体二级结构,是一种预测的结构,在不同的序列设计或不同的操作环境下,所形成的二级结构可能具有一定的差异性,但发挥同样的功能。
各个培养基的配方如下:
YPD培养基:2%蛋白胨,1%酵母粉,2%葡萄糖。
YPG培养基:2%蛋白胨,1%酵母粉,2%甘油。
YPR培养基:2%蛋白胨,1%酵母粉,2%鼠李糖。
YND培养基:1%葡萄糖,0.67%YNB。
YNE培养基:0.5%乙醇,0.67%YNB。
YNM培养基:0.5%甲醇,0.67%YNB。
合成培养基:2%甘油,2%(NH4)2SO4,1.2%KH2PO4,0.47%MgSO4·7H2O,0.036%CaCl2,微量元素:0.2μmol/L CaSO4·5H2O,1.25μmol/L NaI,4.5μmol/L MnSO4·4H2O,2μmol/L Na2MoO4·2H2O,0.75μmol/L H3BO3,17.5μmol/L ZnSO4·7H2O,44.5μmol/L FeCl3·6H2O,pH 5.5。
配制以上培养基时,葡萄糖、甘油、鼠李糖、微量元素均单独配制,并于使用时添加。葡萄糖115℃高压灭菌20min,微量元素溶液配制后过滤除菌,其它成分121℃高压灭菌20min。甲醇、乙醇在使用时添加。固体培养基加2%琼脂粉。
序列信息
SEQ ID NO:1(dCas9):
atggacaagaagtactccattgggctcgctatcggcacaaacagcgtcggttgggccgtcattacggacgagtacaaggtgccgagcaaaaaattcaaagttctgggcaataccgatcgccacagcataaagaagaacctcattggcgccctcctgttcgactccggggagacggccgaagccacgcggctcaaaagaacagcacggcgcagatatacccgcagaaagaatcggatctgctacctgcaggagatctttagtaatgagatggctaaggtggatgactctttcttccataggctggaggagtcctttttggtggaggaggataaaaagcacgagcgccacccaatctttggcaatatcgtggacgaggtggcgtaccatgaaaagtacccaaccatatatcatctgaggaagaagcttgtagacagtactgataaggctgacttgcggttgatctatctcgcgctggcgcatatgatcaaatttcggggacacttcctcatcgagggggacctgaacccagacaacagcgatgtcgacaaactctttatccaactggttcagacttacaatcagcttttcgaagagaacccgatcaacgcatccggagttgacgccaaagcaatcctgagcgctaggctgtccaaatcccggcggctcgaaaacctcatcgcacagctccctggggagaagaagaacggcctgtttggtaatcttatcgccctgtcactcgggctgacccccaactttaaatctaacttcgacctggccgaagatgccaagcttcaactgagcaaagacacctacgatgatgatctcgacaatctgctggcccagatcggcgaccagtacgcagacctttttttggcggcaaagaacctgtcagacgccattctgctgagtgatattctgcgagtgaacacggagatcaccaaagctccgctgagcgctagtatgatcaagcgctatgatgagcaccaccaagacttgactttgctgaaggcccttgtcagacagcaactgcctgagaagtacaaggaaattttcttcgatcagtctaaaaatggctacgccggatacattgacggcggagcaagccaggaggaattttacaaatttattaagcccatcttggaaaaaatggacggcaccgaggagctgctggtaaagcttaacagagaagatctgttgcgcaaacagcgcactttcgacaatggaagcatcccccaccagattcacctgggcgaactgcacgctatcctcaggcggcaagaggatttctacccctttttgaaagataacagggaaaagattgagaaaatcctcacatttcggataccctactatgtaggccccctcgcccggggaaattccagattcgcgtggatgactcgcaaatcagaagagaccatcactccctggaacttcgaggaagtcgtggataagggggcctctgcccagtccttcatcgaaaggatgactaactttgataaaaatctgcctaacgaaaaggtgcttcctaaacactctctgctgtacgagtacttcacagtttataacgagctcaccaaggtcaaatacgtcacagaagggatgagaaagccagcattcctgtctggagagcagaagaaagctatcgtggacctcctcttcaagacgaaccggaaagttaccgtgaaacagctcaaagaagactatttcaaaaagattgaatgtttcgactctgttgaaatcagcggagtggaggatcgcttcaacgcatccctgggaacgtatcacgatctcctgaaaatcattaaagacaaggacttcctggacaatgaggagaacgaggacattcttgaggacattgtcctcacccttacgttgtttgaagatagggagatgattgaagaacgcttgaaaacttacgctcatctcttcgacgacaaagtcatgaaacagctcaagaggcgccgatatacaggatgggggcggctgtcaagaaaactgatcaatgggatccgagacaagcagagtggaaagacaatcctggattttcttaagtccgatggatttgccaaccggaacttcatgcagttgatccatgatgactctctcacctttaaggaggacatccagaaagcacaagtttctggccagggggacagtcttcacgagcacatcgctaatcttgcaggtagcccagctatcaaaaagggaatactgcagaccgttaaggtcgtggatgaactcgtcaaagtaatgggaaggcataagcccgagaatatcgttatcgagatggcccgagagaaccaaactacccagaagggacagaagaacagtagggaaaggatgaagaggattgaagagggtataaaagaactggggtcccaaatccttaaggaacacccagttgaaaacacccagcttcagaatgagaagctctacctgtactacctgcagaacggcagggacatgtacgtggatcaggaactggacatcaatcggctctccgactacgacgtggatgccatcgtgccccagtcttttctcaaagatgattctattgataataaagtgttgacaagatccgataaaaatagagggaagagtgataacgtcccctcagaagaagttgtcaagaaaatgaaaaattattggcggcagctgctgaacgccaaactgatcacacaacggaagttcgataatctgactaaggctgaacgaggtggcctgtctgagttggataaagccggcttcatcaaaaggcagcttgttgagacacgccagatcaccaagcacgtggcccaaattctcgattcacgcatgaacaccaagtacgatgaaaatgacaaactgattcgagaggtgaaagttattactctgaagtctaagctggtctcagatttcagaaaggactttcagttttataaggtgagagagatcaacaattaccaccatgcgcatgatgcctacctgaatgcagtggtaggcactgcacttatcaaaaaatatcccaagcttgaatctgaatttgtttacggagactataaagtgtacgatgttaggaaaatgatcgcaaagtctgagcaggaaataggcaaggccaccgctaagtacttcttttacagcaatattatgaattttttcaagaccgagattacactggccaatggagagattcggaagcgaccacttatcgaaacaaacggagaaacaggagaaatcgtgtgggacaagggtagggatttcgcgacagtccggaaggtcctgtccatgccgcaggtgaacatcgttaaaaagaccgaagtacagaccggaggcttctccaaggaaagtatcctcccgaaaaggaacagcgacaagctgatcgcacgcaaaaaagattgggaccccaagaaatacggcggattcgattctcctacagtcgcttacagtgtactggttgtggccaaagtggagaaagggaagtctaaaaaactcaaaagcgtcaaggaactgctgggcatcacaatcatggagcgatcaagcttcgaaaaaaaccccatcgactttctcgaggcgaaaggatataaagaggtcaaaaaagacctcatcattaagcttcccaagtactctctctttgagcttgaaaacggccggaaacgaatgctcgctagtgcgggcgagctgcagaaaggtaacgagctggcactgccctctaaatacgttaatttcttgtatctggccagccactatgaaaagctcaaagggtctcccgaagataatgagcagaagcagctgttcgtggaacaacacaaacactaccttgatgagatcatcgagcaaataagcgaattctccaaaagagtgatcctcgccgacgctaacctcgataaggtgctttctgcttacaataagcacagggataagcccatcagggagcaggcagaaaacattatccacttgtttactctgaccaacttgggcgcgcctgcagccttcaagtacttcgacaccaccatagacagaaagcggtacacctctacaaaggaggtcctggacgccacactgattcatcagtcaattacggggctctatgaaacaagaatcgacctctctcagctcggtggagacagcagggctgactaa
SEQ ID NO:2(giRNA_1):
tgacagcaatatataaacagagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt
SEQ ID NO:3(giRNA_2):
tttatatattgctgtcaagtgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt
SEQ ID NO:4(giRNA_3):
aataatgatgataaaaaaaagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt
SEQ ID NO:5(giRNA_1c):
gatacttttcagagagcaatatatattgggttatatcttgctctcagaaatgacagcaatatataaacagagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt
SEQ ID NO:6(giRNA_1m):
tgacagcaatatataaacagagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtgtctgctagtagcagatatt
SEQ ID NO:7(VRER):
atggacaagaagtactccattgggctcgctatcggcacaaacagcgtcggttgggccgtcattacggacgagtacaaggtgccgagcaaaaaattcaaagttctgggcaataccgatcgccacagcataaagaagaacctcattggcgccctcctgttcgactccggggagacggccgaagccacgcggctcaaaagaacagcacggcgcagatatacccgcagaaagaatcggatctgctacctgcaggagatctttagtaatgagatggctaaggtggatgactctttcttccataggctggaggagtcctttttggtggaggaggataaaaagcacgagcgccacccaatctttggcaatatcgtggacgaggtggcgtaccatgaaaagtacccaaccatatatcatctgaggaagaagcttgtagacagtactgataaggctgacttgcggttgatctatctcgcgctggcgcatatgatcaaatttcggggacacttcctcatcgagggggacctgaacccagacaacagcgatgtcgacaaactctttatccaactggttcagacttacaatcagcttttcgaagagaacccgatcaacgcatccggagttgacgccaaagcaatcctgagcgctaggctgtccaaatcccggcggctcgaaaacctcatcgcacagctccctggggagaagaagaacggcctgtttggtaatcttatcgccctgtcactcgggctgacccccaactttaaatctaacttcgacctggccgaagatgccaagcttcaactgagcaaagacacctacgatgatgatctcgacaatctgctggcccagatcggcgaccagtacgcagacctttttttggcggcaaagaacctgtcagacgccattctgctgagtgatattctgcgagtgaacacggagatcaccaaagctccgctgagcgctagtatgatcaagcgctatgatgagcaccaccaagacttgactttgctgaaggcccttgtcagacagcaactgcctgagaagtacaaggaaattttcttcgatcagtctaaaaatggctacgccggatacattgacggcggagcaagccaggaggaattttacaaatttattaagcccatcttggaaaaaatggacggcaccgaggagctgctggtaaagcttaacagagaagatctgttgcgcaaacagcgcactttcgacaatggaagcatcccccaccagattcacctgggcgaactgcacgctatcctcaggcggcaagaggatttctacccctttttgaaagataacagggaaaagattgagaaaatcctcacatttcggataccctactatgtaggccccctcgcccggggaaattccagattcgcgtggatgactcgcaaatcagaagagaccatcactccctggaacttcgaggaagtcgtggataagggggcctctgcccagtccttcatcgaaaggatgactaactttgataaaaatctgcctaacgaaaaggtgcttcctaaacactctctgctgtacgagtacttcacagtttataacgagctcaccaaggtcaaatacgtcacagaagggatgagaaagccagcattcctgtctggagagcagaagaaagctatcgtggacctcctcttcaagacgaaccggaaagttaccgtgaaacagctcaaagaagactatttcaaaaagattgaatgtttcgactctgttgaaatcagcggagtggaggatcgcttcaacgcatccctgggaacgtatcacgatctcctgaaaatcattaaagacaaggacttcctggacaatgaggagaacgaggacattcttgaggacattgtcctcacccttacgttgtttgaagatagggagatgattgaagaacgcttgaaaacttacgctcatctcttcgacgacaaagtcatgaaacagctcaagaggcgccgatatacaggatgggggcggctgtcaagaaaactgatcaatgggatccgagacaagcagagtggaaagacaatcctggattttcttaagtccgatggatttgccaaccggaacttcatgcagttgatccatgatgactctctcacctttaaggaggacatccagaaagcacaagtttctggccagggggacagtcttcacgagcacatcgctaatcttgcaggtagcccagctatcaaaaagggaatactgcagaccgttaaggtcgtggatgaactcgtcaaagtaatgggaaggcataagcccgagaatatcgttatcgagatggcccgagagaaccaaactacccagaagggacagaagaacagtagggaaaggatgaagaggattgaagagggtataaaagaactggggtcccaaatccttaaggaacacccagttgaaaacacccagcttcagaatgagaagctctacctgtactacctgcagaacggcagggacatgtacgtggatcaggaactggacatcaatcggctctccgactacgacgtggatgccatcgtgccccagtcttttctcaaagatgattctattgataataaagtgttgacaagatccgataaaaatagagggaagagtgataacgtcccctcagaagaagttgtcaagaaaatgaaaaattattggcggcagctgctgaacgccaaactgatcacacaacggaagttcgataatctgactaaggctgaacgaggtggcctgtctgagttggataaagccggcttcatcaaaaggcagcttgttgagacacgccagatcaccaagcacgtggcccaaattctcgattcacgcatgaacaccaagtacgatgaaaatgacaaactgattcgagaggtgaaagttattactctgaagtctaagctggtctcagatttcagaaaggactttcagttttataaggtgagagagatcaacaattaccaccatgcgcatgatgcctacctgaatgcagtggtaggcactgcacttatcaaaaaatatcccaagcttgaatctgaatttgtttacggagactataaagtgtacgatgttaggaaaatgatcgcaaagtctgagcaggaaataggcaaggccaccgctaagtacttcttttacagcaatattatgaattttttcaagaccgagattacactggccaatggagagattcggaagcgaccacttatcgaaacaaacggagaaacaggagaaatcgtgtgggacaagggtagggatttcgcgacagtccggaaggtcctgtccatgccgcaggtgaacatcgttaaaaagaccgaagtacagaccggaggcttctccaaggaaagtatcctcccgaaaaggaacagcgacaagctgatcgcacgcaaaaaagattgggaccccaagaaatacggcggattcgtttctcctacagtcgcttacagtgtactggttgtggccaaagtggagaaagggaagtctaaaaaactcaaaagcgtcaaggaactgctgggcatcacaatcatggagcgatcaagcttcgaaaaaaaccccatcgactttctcgaggcgaaaggatataaagaggtcaaaaaagacctcatcattaagcttcccaagtactctctctttgagcttgaaaacggccggaaacgaatgctcgctagtgcgcgcgagctgcagaaaggtaacgagctggcactgccctctaaatacgttaatttcttgtatctggccagccactatgaaaagctcaaagggtctcccgaagataatgagcagaagcagctgttcgtggaacaacacaaacactaccttgatgagatcatcgagcaaataagcgaattctccaaaagagtgatcctcgccgacgctaacctcgataaggtgctttctgcttacaataagcacagggataagcccatcagggagcaggcagaaaacattatccacttgtttactctgaccaacttgggcgcgcctgcagccttcaagtacttcgacaccaccatagacagaaaggagtacaggtctacaaaggaggtcctggacgccacactgattcatcagtcaattacggggctctatgaaacaagaatcgacctctctcagctcggtggagacagcagggctgac
SEQ ID NO:8(dcpf1):
atgagcaagctggagaagttcaccaactgctacagcctgagcaagaccctgagattcaaggccatccccgtgggaaaaacccaggagaacatcgacaacaagagactgctggtggaggacgaaaagagagccgaggactacaagggcgtgaagaagctgctggacagatactacctgagcttcatcaacgacgtgctgcacagcatcaagctgaagaacctgaacaactacatcagcctgttcagaaagaagaccagaaccgagaaggagaacaaggagctggagaacctggagatcaacctgagaaaggagatcgccaaggccttcaagggaaacgagggctacaagagcctgttcaagaaggacatcatcgagaccatcctgcccgagttcctggatgacaaggacgagatcgccctggtgaacagcttcaacggcttcaccaccgctttcaccggcttcttcgacaacagagagaacatgttcagcgaggaggccaagtctacaagcatcgccttcagatgcatcaacgagaacctgaccagatacatcagcaacatggacatcttcgagaaggtggacgccatcttcgacaagcacgaggtgcaggagatcaaggagaagatcctgaacagcgactacgacgtggaggacttcttcgagggcgagttcttcaacttcgtgctgacccaggaaggcatcgacgtgtacaacgccatcatcggcggatttgtgacagagagcggcgagaaaatcaagggcctgaacgagtacatcaacctgtacaaccagaagaccaagcagaagctgcccaagttcaagcccctgtacaagcaggtgctgagcgacagagagagcctgagcttctatggcgagggctacaccagcgatgaagaggtgctggaggtgttcagaaacaccctgaacaagaacagcgagatcttcagcagcatcaagaagctggagaagctgttcaagaacttcgacgagtacagcagcgccggcatctttgtgaaaaacggccccgctatcagcacaatcagcaaggacatcttcggcgagtggaacgtgatcagagacaagtggaacgccgagtacgacgacatccacctgaagaagaaggccgtggtgaccgagaaatacgaggacgacagaagaaagagcttcaagaagatcggcagcttcagcctggaacagctgcaagagtacgctgacgctgacctgagcgttgtggagaagctgaaggagatcatcatccagaaggtggacgagatctacaaggtgtacggcagcagcgagaaacttttcgacgccgacttcgtgcttgagaagagcctgaagaagaacgatgccgtggtggccatcatgaaggacctgctggacagcgtgaagagcttcgagaactacatcaaggccttcttcggcgaaggcaaggagaccaacagagacgagagcttctacggcgacttcgtgctggcttacgacatcctgctgaaggtggaccacatctacgacgccatcagaaactacgtgacccagaagccctacagcaaggacaagttcaagctgtacttccagaacccccagtttatgggcggatgggacaaggataaggagaccgactacagagccaccatcctgagatacggcagcaagtactacctggccatcatggacaagaagtacgccaagtgcctgcagaagatcgacaaggacgacgtgaacggcaactacgagaagatcaactacaagctgctgcccggccctaataaaatgctgcccaaggtgttcttcagcaagaagtggatggcctactacaaccccagcgaggacatccagaagatctacaagaacggcaccttcaagaagggcgacatgttcaacctgaacgactgccacaagctgatcgacttcttcaaggacagcatcagcagataccccaagtggagcaacgcctacgacttcaacttcagcgagaccgagaagtacaaggacatcgccggcttctacagagaagtggaggagcagggatacaaggtgagcttcgagagcgccagcaagaaggaggtggacaagctggtggaagagggcaagctgtacatgttccagatctacaacaaggacttcagcgacaagtctcacggaacccccaatctgcacaccatgtacttcaagctgctgttcgacgagaacaaccacggccagatcagactttctggaggcgctgaactgttcatgagaagagccagcctgaagaaggaagagctggtggtgcatcctgccaatagccccatcgctaacaagaaccccgacaaccccaagaaaaccaccaccctgagctacgacgtgtacaaggacaagagattcagcgaggaccagtacgagctgcatatccccatcgccatcaacaagtgccccaagaacatcttcaagatcaacaccgaggtgagagtgctgctgaagcacgacgacaacccctacgtgatcggcattgccagaggcgagagaaacctgctgtacatcgtggtggtggacggcaagggaaacatcgtggagcagtacagcctgaacgagatcatcaacaacttcaacggcatcagaatcaagaccgactaccacagcctgctggacaagaaggagaaggagagattcgaggccagacagaactggaccagcatcgagaacatcaaggagctgaaggccggctacattagccaggtggtgcacaagatctgcgagctggtggagaagtacgatgccgtgatcgctctggaggatctgaacagcggcttcaagaacagcagagtgaaggtggagaagcaggtgtaccagaagttcgagaagatgctgatcgacaagctgaactacatggtggacaagaagagcaacccctgtgctacaggcggagctctgaagggataccagatcaccaacaagttcgagagcttcaagagcatgagcacccagaacggcttcatcttctacatccccgcctggctgacatctaagatcgaccctagcaccggctttgtgaacctgctgaagaccaagtacaccagcatcgccgacagcaagaagttcatcagcagcttcgacagaatcatgtacgtgcccgaggaggacctgtttgaatttgccctggactacaagaacttcagcagaaccgacgccgactacatcaagaagtggaagctgtacagctacggcaacagaatcagaatcttcagaaaccccaagaagaacaacgtgttcgactgggaggaggtgtgtctgacaagcgcctacaaggagctgttcaacaagtacggcatcaactaccagcagggcgacattagagccctgctgtgcgaacagagcgacaaggccttctacagcagcttcatggccctgatgagcctgatgctgcagatgagaaacagcatcaccggcagaaccgacgtggacttccttatcagccccgtgaaaaacagcgacggcatcttctacgacagcagaaactacgaggcccaggagaatgctatcctgcccaagaatgccgatgctaacggcgcttacaacatcgccagaaaggtgctttgggccatcggccagtttaagaaggccgaggacgagaagctggacaaggtgaagatcgccatcagcaacaaggagtggctggagtatgctcagaccagcgtgaaacac
SEQ ID NO:9(VP16):
gctccaccaaccgacgtttctttgggtgacgagttgcacttggacggtgaagatgttgccatggctcatgctgacgctttggacgacttcgacttggacatgttgggtgacggtgattctccaggtccaggtttcactccacacgattctgctccatacggtgctttggacatggccgacttcgagtttgagcagatgttcaccgacgctttgggtattgacgagtacggtggttaa
SEQ ID NO:10(gaRNA_1):
tctgtttatatattgctgtcagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt
SEQ ID NO:11(gaRNA_2):
tagctcttaaagtctgtttatgttttagagtcagaaatgacaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt
SEQ ID NO:12(gaRNA_3):
cgtcacccaatatatattgctctctgaaaatggtggttaatgaaaattaacttactattttctgacagcaaagaaattgtgctatcagatcgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt
SEQ ID NO:13(crarna_1):aatttctactaagtgtagatgcacaaactcggacccactt
SEQ ID NO:14(crarna_2):aatttctactaagtgtagatactttttcacattgataacgga
SEQ ID NO:15(crarna_3):aatttctactaagtgtagatttgataacggactagcctta
SEQ ID NO:16(g1):tctgtttatatattgctgtcaagcg
SEQ ID NO:17(g1r):cgcttgacagcaatatataaacaga
SEQ ID NO:18(g2):tagctcttaaagtctgtttatcgcg
SEQ ID NO:19(g2r):cgcgataaacagactttaagagcta
SEQ ID NO:20(g3):agaaattgtgctatcagatcagcg
SEQ ID NO:21(g3r):cgctgatctgatagcacaatttct
SEQ ID NO:22(cr1):tttagcacaaactcggacccactt
SEQ ID NO:23(cr1r):aagtgggtccgagtttgtgctaaa
SEQ ID NO:24(cr2):tttgactttttcacattgataacgga
SEQ ID NO:25(cr2r):tccgttatcaatgtgaaaaagtcaaa
SEQ ID NO:26(cr3):tttgttgataacggactagcctta
SEQ ID NO:27(cr3r):taaggctagtccgttatcaacaaa
SEQ ID NO:28(AOX1核心):
ctaacccctacttgacagcaatatataaacagaaggaagctgccctgtcttaaacctttttttttatcatcattattagcttactttcataattgcgactggttccaattgacaagcttttgattttaacgacttttaacgacaacttgagaagatcaaaaaacaactaattattcgaa
SEQ ID NO:29(STA):
atgggtgttaagccagttactttgtatgacgttgctgaatacgctggagtttcctaccaaactgtctc tagagttgttaatcaagcttctcatgtctccgctaagactagagagaaggttgaggctgctatggctgaattgaac tatattccaaatagagttgctcagcagttggctggaaagcaatctttgttgattggagtcgctacttcttctttgg ctttgcatgctccatctcagattgttgctgctattaagtccagagctgaccagttgggagcttctgttgttgtttc tatggttgagagatctggagttgaggcttgcaaggctgctgttcataacttgttggctcagagagtttctggattg attattaattacccattggacgatcaagacgctattgccgttgaggccgcttgtaccaacgtcccagctttgttct tggacgtttccgatcaaactccaattaattctattattttttctcacgaggatggaactagattgggagttgaaca cttggttgctttgggacatcaacagattgctttgttggctggaccattgtcttccgtttctgctagattgagattg gccggatggcacaagtacttgaccagaaaccagattcaaccaattgctgagagagagggagattggtctgctatgt ctggattccagcagactatgcagatgttgaacgaaggaattgtcccaaccgctatgttggtcgctaatgaccaaat ggctttgggagctatgagagctattactgaatctggattgagagtcggagctgacatttctgttgttggatatgat gacactgaggattcttcttgctacattccaccattgactactattaagcaagacttcagattgttgggacagactt ctgttgatagattgttgcagttgtcccaaggacaagctgttaaaggaaaccaattgttgccagtttctttggttaa gagaaagactactttggctccaaacactcagactgcttccccaagagctttggctgactctttgatgcaattggct agacaagtctctagattggagtctggacaaggtggcggcggctctgttaacaactccatgaaggatttcttaggcaagaaaacggtggatggagctgatagtctcaatttggccgtgaatctgcaacaacagcagagttcaaacacaattgccaatcaatcgctttcctcaattggattggaaagttttggttacggctctggtatcaaaaacgagtttaacttccaagacttgataggttcaaactctggcagttcagatccgacattttcagtagacgctgacgaggcccaaaaactcgacatttccaacaagaacagtcgtaagagacagaaactaggtttgctgccggtcagcaatgcaacttcccatttgaacggtttcaatggaatgtccaatggaaagtcacactctttctcttcaccgtctgggactaatgacgatgaactaagtggcttgatgttcaactcaccaagcttcaaccccctcacagttaacgattctaccaacaacagcaaccacaatataggtttgtctccgatgtcatgcttattttctacagttcaagaagcatctcaaaaaaagcatggaaattccagtagacacttttcatacccatctgggccggaggacctttggttcaatgagttccaaaaacaggccctcacagccaatggagaaaatgctgtccaacagggagatgatgcttctaagaacaacacagccattcctaaggaccagtcttcgaactcatcgattttcagttcacgttctagtgcagcttctagcaactcaggagacgatattggaaggatgggcccattctccaaaggaccagagattgagttcaactacgattcttttttggaatcgttgaaggcagagtcaccctcttcttcaaagtacaatctgccggaaactttgaaagagtacatgacccttagttcgtctcatctgaatagtcaacactccgacactttggcaaatggcactaacggtaactattctagcaccgtttccaacaacttgagcttaagtttgaactccttctctttctctgacaagttctcattgagtccaccaacaatcactgacgccgaaaagttttcattgatgagaaacttcattgacaacatctcgccatggtttgacacttttgacaataccaaacagtttggaacaaaaattccagttctggccaaaaaatgttcttcattgtactatgccattctggctatatcttctcgtcaaagagaaaggataaagaaagagcacaatgaaaaaacattgcaatgctaccaatactcactacaacagctcatccctactgttcaaagctcaaataatattgagtacattatcacatgtattctcctgagtgtgttccacatcatgtctagtgaaccttcaacccagagggacatcattgtgtcattggcaaaatacattcaagcatgcaacataaacggatttacatctaatgacaaactggaaaagagtattttctggaactatgtcaatttggatttggctacttgtgcaatcggtgaagagtcaatggtcattccttttagctactgggttaaagagacaactgactacaagaccattcaagatgtgaagccatttttcaccaagaagactagcacgacaactgacgatgacttggacgatatgtatgccatctacatgctgtacattagtggtagaatcattaacctgttgaactgcagagatgcgaagctcaattttgagcccaagtgggagtttttgtggaatgaactcaatgaatgggaattgaacaaacccttgacctttcaaagtattgttcagttcaaggccaatgacgaatcgcagggcggatcaacttttccaactgttctattctccaactctcgaagctgttacagtaaccagctgtatcatatgagctacatcatcttagtgcagaataaaccacgattatacaaaatcccctttactacagtttctgcttcaatgtcatctccatcggacaacaaagctgggatgtctgcttccagcacacctgcttcagaccaccacgcttctggtgatcatttgtctccaagaagtgtagagccctctctttcgacaacgttgagccctccgcctaatgcaaacggtgcaggtaacaagttccgctctacgctctggcatgccaagcagatctgtgggatttctatcaacaacaaccacaacagcaatctagcagccaaagtgaactcattgcaaccattgtggcacgctggaaagctaattagttccaagtctgaacatacacagttgctgaaactgttgaacaaccttgagtgtgcaacaggctggcctatgaactggaagggcaaggagttaattgactactggaatgttgaagaataa
SEQ ID NO:30(HP):
tctcatgtttgacagcttatcatcgataagctgactcatgttggtattgtgaaatagacgcagatcgggaacgagctcctcgagtgtgtggaattgtgagcggataacaatttcacacagtcgagtgtgtggaattgtgagcggataacaatttcacacagtcgagtgtgtggaattgtgagcggataacaatttcacacagtcgagtgtgtggaattgtgagcggataacaatttcacacagtcgagtgtgtggaattgtgagcggataacaatttcacacagggcccctaacccctacttgacagcaatatataaacagaaggaagctgccctgtcttaaacctttttttttatcatcattattagcttactttcataattgcgactggttccaattgacaagcttttgattttaacgacttttaacgacaacttgagaagatcaaaaaacaactaattattcgaa
SEQ ID NO:31(giRNA_4):
cttactttcataattgcgacgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt
SEQ ID NO:32(giRNA_5):
aaaaacaactaattattcgagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt
SEQ ID NO:33(giRNA_6):
aaaatcaaaagcttgtcaatgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttt
SEQ ID NO:34(dcas9-TT F):gagacagcagggctgactaagtcgaccatcatcatcatcatc
SEQ ID NO:35(dcas9-gapr):gacctttctcttcttttttggaggagtgcaacccatactagtcgaaatagttgttcaattgattgaaatagggac
SEQ ID NO:36(dcas9 F1):caaaaaagaagagaaaggtcatggacaagaagtactccattgggctcgctatcggcacaaacagc
SEQ ID NO:37(dcas9 R1):cacgatggcatccacgtcgtagtc
SEQ ID NO:38(dcas9 F2):acgacgtggatgccatcgtgcc
SEQ ID NO:39(dcas9 R2):ttagtcagccctgctgtctc
SEQ ID NO:40(pA-AOX1 F):tccagtgtcgaaaacgagctagatctaacatccaaagacgaaag
SEQ ID NO:41(pA-AOX1 R):gcggccgcataggccactagataattagttgttttttgatcttctcaagttgtc
SEQ ID NO:42(pAA-GAP F):cgcgccttaattaacccggggatccctcgagagatcttttttgtagaaatgtcttggtg
SEQ ID NO:43(gi1-GAP R):
ctgtttatatattgctgtcagacgagcttactcgtttcgtcctcacggactcatcagtgacagtctagaggtaccatagttgttcaattgattgaaatagggac
SEQ ID NO:44(gi1-TT F):
ggcaccgagtcggtgcttttggccggcatggtcccagcctcctcgctggcgccggctgggcaacatgcttcggcatggcgaatgggacactagtggatgtcagaatgcc
SEQ ID NO:45(pAA-TT R):gaagcttcgtacgctgcaggtcgacaagcttgcacaaacgaacgtctcacttaatcttctgtactctgaag
SEQ ID NO:46(gi2-GAP R):acttgacagcaatatataaagacgagcttactcgtttcgt
SEQ ID NO:47(handle-tt f):
ggcaccgagtcggtgcttttggccggcatggtcccagcctcctcgctggcgccggctgggcaacatgcttcggcatggc
SEQ ID NO:48(gi3-GAP R):ttttttttatcatcattattgacgagcttactcgtttcgt
SEQ ID NO:49(gi4-GAP R):gtcgcaattatgaaagtaaggacgagcttactcgtttcgt
SEQ ID NO:50(gi5-GAP R):tcgaataattagttgtttttgacgagcttactcgtttcgt
SEQ ID NO:51(gi6-GAP R):attgacaagcttttgattttgacgagcttactcgtttcgt
SEQ ID NO:52(VP-pG F):ttgacgagtacggtggttaacatcatcatcatcatcattgagtttg
SEQ ID NO:53(dcas9V R):gtaggagaaacgaatccgccgtatttc
SEQ ID NO:54(dcas9V F):ggcggattcgtttctcctacagtcgct
SEQ ID NO:55(dcas9R R):tctgcagctcgcgcgcactagcgagc
SEQ ID NO:56(dcas9R F):tagtgcgcgcgagctgcagaaaggta
SEQ ID NO:57(dcas9ER R):gtagacctgtactcctttctgtctat
SEQ ID NO:58(dcas9ER F):agaaaggagtacaggtctacaaag
SEQ ID NO:59(VP-dcas9 R):gaaacgtcggttggtggagcagagccgccgccaccgtcagccctgctgtctcc
SEQ ID NO:60(dcpf1-VP F):ctcagaccagcgtgaaacacggtggcggcggctctgctccaccaaccgac
SEQ ID NO:61(dcpf1-GAP R):aacttctccagcttgctcatgacctttctcttcttttttggagg
SEQ ID NO:62(dcpf1 F1):atgagcaagctggagaagttc
SEQ ID NO:63(dcpf1 R1):tcgcctctggcaatgccgat
SEQ ID NO:64(dcpf1 F2):atcggcattgccagaggcgag
SEQ ID NO:65(dcpf1 R2):gtgtttcacgctggtctg
SEQ ID NO:66(ga1-GAP R):tgacagcaatatataaacagagacgagcttactcgtttcgt
SEQ ID NO:67(ga2-GAP R):ataaacagactttaagagctagacgagcttactcgtttcgt
SEQ ID NO:68(ga3-GAP R):gcaatatatattgggtgacggacgagcttactcgtttcgt
SEQ ID NO:69(DR-GAP R):atctacacttagtagaaattgacgagcttactcgtttcgt
SEQ ID NO:70(cra1-TT F):
gcacaaactcggacccacttggccggcatggtcccagcctcctcgctggcgccggctgggcaacatgcttcggcatggc
SEQ ID NO:71(cra2-TT F):
actttttcacattgataacggaggccggcatggtcccagcctcctcgctggcgccggctgggcaacatgcttcggcatggc
SEQ ID NO:72(cra3-TT F):
ttgataacggactagccttaggccggcatggtcccagcctcctcgctggcgccggctgggcaacatgcttcggcatggc
SEQ ID NO:73(g1-cA F):ttatatattgctgtcaagcgctaacccctacttgacagca
SEQ ID NO:74(pPcAG R):ctgatgttactgaaggatcagatcacgcat
SEQ ID NO:75(pPcAG F):tgatccttcagtaacatcagagattttgag
SEQ ID NO:76(g1-pP R):cgcttgacagcaatatataaacagactcgaggagctcgttcccgatctgcgtctatttc
SEQ ID NO:77(g1r-cA F):cgcttgacagcaatatataaacagactaacccctacttgacagca
SEQ ID NO:78(g1r-pP R):tctgtttatatattgctgtcaagcgctcgaggagctcgttcccgatctgcgtctatttc
SEQ ID NO:79(g2-cA F):tagctcttaaagtctgtttatcgcgctaacccctacttgacagca
SEQ ID NO:80(g2-pP R):cgcgataaacagactttaagagctactcgaggagctcgttcccgatctgcgtctatttc
SEQ ID NO:81(g2r-cA F):cgcgataaacagactttaagagctactaacccctacttgacagca
SEQ ID NO:82(g2r-pP R):tagctcttaaagtctgtttatcgcgctcgaggagctcgttcccgatctgcgtctatttc
SEQ ID NO:83(g3-cA F):agaaattgtgctatcagatcagcgctaacccctacttgacagca
SEQ ID NO:84(g3-pP R):cgctgatctgatagcacaatttctctcgaggagctcgttcccgatctgcgtctatttc
SEQ ID NO:85(g3r-cA F):cgctgatctgatagcacaatttctctaacccctacttgacagca
SEQ ID NO:86(g3r-pP R):agaaattgtgctatcagatcagcgctcgaggagctcgttcccgatctgcgtctatttc
SEQ ID NO:87(cr1-cA F):tttagcacaaactcggacccacttctaacccctacttgacagca
SEQ ID NO:88(cr1-pP R):aagtgggtccgagtttgtgctaaactcgaggagctcgttcccgatctgcgtctatttc
SEQ ID NO:89(cr1r-cA F):aagtgggtccgagtttgtgctaaactaacccctacttgacagca
SEQ ID NO:90(cr1r-pP R):tttagcacaaactcggacccacttctcgaggagctcgttcccgatctgcgtctatttc
SEQ ID NO:91(cr2-cA F):tttgactttttcacattgataacggactaacccctacttgacagca
SEQ ID NO:92(cr2-pP R):tccgttatcaatgtgaaaaagtcaaactcgaggagctcgttcccgatctgcgtctatttc
SEQ ID NO:93(cr2r-cA F):tccgttatcaatgtgaaaaagtcaaactaacccctacttgacagca
SEQ ID NO:94(cr2r-pP R):tttgactttttcacattgataacggactcgaggagctcgttcccgatctgcgtctatttc
SEQ ID NO:95(cr3-cA F):tttgttgataacggactagccttactaacccctacttgacagca
SEQ ID NO:96(cr3-pP R):taaggctagtccgttatcaacaaactcgaggagctcgttcccgatctgcgtctatttc
SEQ ID NO:97(cr3r-cA F):taaggctagtccgttatcaacaaactaacccctacttgacagca
SEQ ID NO:98(cr3r-pP R):tttgttgataacggactagccttactcgaggagctcgttcccgatctgcgtctatttc
SEQ ID NO:99(HAPTg1UP F):ctatgaccatgattacgaattcgagct
SEQ ID NO:100(HAPTG1DO R):tgcctgcaggtcgactctag
SEQ ID NO:101(HP-GFP F):aaaacaactaattattcgaaggatcctacaccatgggttc
SEQ ID NO:102(HP-pP R):ataagctgtcaaacatgagaattaattcttgaagacgaaagggc
SEQ ID NO:103(STA-TT F):actggaatgttgaagaataaccgcggcggccgcca
SEQ ID NO:104(STA-cA r):gtaactggcttaacacccatggtactagtttcgaataattagttgttttttgatc
SEQ ID NO:105(TT-HP F):ttaagtgagatcgagtgtgtggaattgtga
SEQ ID NO:106(inOri R):gggagaaaggcggacaggta
SEQ ID NO:107(inOri F):tacctgtccgcctttctccc
SEQ ID NO:108(HP-TT F):acacactcgatctcacttaatcttctgtactctgaag
SEQ ID NO:109(pAA-AOX2 F):ttaattaacccggggatccctcgaggcttaaaggactccatttcctaaaat
SEQ ID NO:110(HH-AOX2 R):tcatcagtgacagtctagaggtaccttttctcagttgatttgtttg
SEQ ID NO:111(pAA-ICL1 F):ttaattaacccggggatccctcgagtcatctaacactttgtatagcacatc
SEQ ID NO:112(HH-ICL1 R):tcatcagtgacagtctagaggtacctcttgatatacttgatactgtgttctttga
SEQ ID NO:113(pAA-GPM1 F):ttaattaacccggggatccctcgagccttgggttattagtagtgtccgttatttt
SEQ ID NO:114(HH-GPM1 R):tcatcagtgacagtctagaggtacctgtttgtttgtgtaattgaaagttgttac
SEQ ID NO:115(pAA-ENO1 F):ttaattaacccggggatccctcgagatgaaagagtgagaggaaagtacct
SEQ ID NO:116(HH-ENO1 R):tcatcagtgacagtctagaggtaccttttagatgtagattgttataattgtgtgtttcaa
SEQ ID NO:117(pAA-LRA3 F):ttaattaacccggggatccctcgagaactgacagaatgactgactcccta
SEQ ID NO:118(HH-LRA3 R):tcatcagtgacagtctagaggtaccatttttaggagataaaaattctggggtaaat
SEQ ID NO:119(pAA-DAS1 F):ttaattaacccggggatccctcgagaataaaaaaacgttatagaaagaaattggactac
SEQ ID NO:120(HH-DAS1 R):tcatcagtgacagtctagaggtacctttgttcgattattctccagataaaatcaac
SEQ ID NO:121(pAA-THI11 F):ttaattaacccggggatccctcgagatcttttcagcttcatcgtcag
SEQ ID NO:122(HH-THI11 R):tcatcagtgacagtctagaggtaccgatgatttattgaagtttccaaagttgag
实施例1、CRISPRi器件对PAOX1的阻遏
本实施例中,菌株为毕赤酵母GS115,各个主要器件如下:
Figure BDA0003199870590000161
主要建立方法如下:
1、pGPGAPdCas9质粒的构建
以dCas9-TT F(SEQ ID NO:34)和dCas9-GAP R(SEQ ID NO:35)为引物,通过PCR的方法,从pGAPZ B质粒上扩增GAP启动子、AOXTT终止子和质粒骨架区域。
分别以dCas9 F1(SEQ ID NO:36)和dCas9 R1(SEQ ID NO:37)为引物以及以dCas9F2(SEQ ID NO:38)和dCas9 R2(SEQ ID NO:39)为引物,通过PCR的方法,从p414-TEF1p-Cas9-CYC1t质粒上扩增dCas9的两个片段。
通过无缝克隆试剂盒将上述片段进行组装,得到的重组质粒为pGPGAPdCas9。
2、电转毕赤酵母和GS_AGdCas9菌株的筛选
将重组质粒pPAG电转毕赤酵母菌株GS115,涂于不含组氨酸的YND平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证GFP拷贝数。把Real-time PCR检验GFP为单拷贝的毕赤酵母表达菌株命名为GS_AG。
将重组质粒pGPGAPdCas9电转毕赤酵母菌株GS-AG,涂于添加Zeocin抗生素的YPD固体培养基平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证dCas9拷贝数。把Real-time PCR检验dCas9为单拷贝的毕赤酵母表达菌株命名为GS_AGdCas9。
3、giRNA表达质粒的构建
以pA-AOX1 F(SEQ ID NO:40)和pA-AOX1 R(SEQ ID NO:41)为引物,通过PCR的方法,从质粒pPAG上扩增得到AOX1启动子片段)。通过酶切的方法,将质粒pAG32在SacI/SpeI进行双酶切线性化,将线性化片段与AOX1启动子片段进行无缝组装,得到的重组质粒为pAA。
分别以pAA-GAP F(SEQ ID NO:42)和gi1-GAP R(SEQ ID NO:43)为引物以及以gi1-TT F(SEQ ID NO:44)和pAA-TT R(SEQ ID NO:45)为引物,通过PCR的方法,从质粒pPAG上扩增得到GAP启动子区域和AOX1终止子区域;通过酶切的方法,将质粒pAA在BamHI/SalI进行双酶切线性化。将上述片段与giRNA_1片段进行无缝组装,得到的重组质粒为pAA-PGAPgi1(GAP启动子、giRNA_1、AOX1终止子,作为一个表达盒)。
以gi2-GAP R(SEQ ID NO:46)和handle-TT F(SEQ ID NO:47)为引物,通过PCR的方法,从质粒pAA-PGAPgi1上扩增得到质粒骨架区域,通过无缝克隆试剂盒与giRNA_2片段进行组装,得到的重组质粒为pAA-PGAPgi2。
同理,可得到重组质粒pAA-PGAPgi3、pAA-PGAPgi4、pAA-PGAPgi5、pAA-PGAPgi6。
pAA-PGAPgi3构建所用引物:gi3-GAP R(SEQ ID NO:48)和handle-TT F(SEQ IDNO:47);
pAA-PGAPgi4构建所用引物:gi4-GAP R(SEQ ID NO:49)和handle-TT F(SEQ IDNO:47);
pAA-PGAPgi5构建所用引物:gi5-GAP R(SEQ ID NO:50)和handle-TT F(SEQ IDNO:47);
pAA-PGAPgi6构建所用引物:gi6-GAP R(SEQ ID NO:51)和handle-TT F(SEQ IDNO:47)。
4、毕赤酵母CRISPRi器件阻遏菌株的筛选
将重组质粒pAA-PGAPgi1、pAA-PGAPgi2、pAA-PGAPgi3、pAA-PGAPgi4、pAA-PGAPgi5、pAA-PGAPgi6分别电转毕赤酵母菌株GS_AGdCas9,涂于添加Hygromycin抗生素的YPD固体培养基平板,放在30℃培养箱培养48-72小时。
将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证giRNA拷贝数。
把Real-time PCR检验giRNA为单拷贝的毕赤酵母表达菌株分别命名为:
GS_AGdCas9-GAPgi1、GS_AGdCas9-GAPgi2、GS_AGdCas9-GAPgi3、
GS_AGdCas9-GAPgi4、GS_AGdCas9-GAPgi5、GS_AGdCas9-GAPgi6。
5、酶标仪检测GFP荧光强度
将菌株GS_AG、GS_AGdCas9-GAPgi1、GS_AGdCas9-GAPgi2、GS_AGdCas9-GAPgi3、GS_AGdCas9-GAPgi4、GS_AGdCas9-GAPgi5、GS_AGdCas9-GAPgi6分别在YPD液体培养基中过夜预培养,离心收集菌体,用蒸馏水洗涤2次后,转移至YNM液体培养基中进行培养,取样后用酶标仪检测样品中GFP的荧光强度。
结果如图2A和图2B所示,相比于野生型AOX1启动子,在引入由dCas9和giRNA组成的CRISPRi阻遏器件后,各菌株荧光强度均有不同程度的降低。其中,giRNA_1介导的CRISPRi阻遏器件对AOX1启动子的阻遏效果最好,可使AOX1启动子表达强度下降65.9%。
实施例2、CRISPRa器件对cPAOX1(AOX1核心启动子)的激活
本实施例中,菌株为毕赤酵母菌株GS115,各个主要器件如下:
Figure BDA0003199870590000171
Figure BDA0003199870590000181
主要建立方法如下:
1、pGPGAPVRERVP16质粒和pGPGAPdCpf1VP16质粒的构建
分别以VP-pG F(SEQ ID NO:52)和dCas9V R(SEQ ID NO:53)、dCas9V F(SEQ IDNO:54)和dCas9R R(SEQ ID NO:55)、dCas9R F(SEQ ID NO:56)和dCas9ER R(SEQ ID NO:57)、dCas9ER F(SEQ ID NO:58)和VP-dCas9 R(SEQ ID NO:59)为引物,通过PCR的方法,从质粒pGPGAPdCas9上扩增得到VRER(SEQ ID NO:7)的不同区域以及质粒骨架区域。通过无缝克隆试剂盒将上述片段与VP16片段进行组装,得到的重组质粒为pGPGAPVRERVP16。
以dCpf1-VP F(SEQ ID NO:60)和dCpf1-GAP R(SEQ ID NO:61)为引物,通过PCR的方法,从质粒pGPGAPVRERVP16上扩增得到除VRER以外的质粒骨架区域;分别以dCpf1 F1(SEQID NO:62)和dCpf1 R1(SEQ ID NO:63)为引物以及以dCpf1 F2(SEQ ID NO:64)和dCpf1 R2(SEQ ID NO:65)为引物,通过PCR的方法,从质粒pET28TEV-LbCpf1上扩增得到dCpf1的两个区域。通过无缝克隆试剂盒将上述片段进行组装,得到的重组质粒为pGPGAPdCpf1VP16。
2、毕赤酵母GS_VV菌株和GS_dCV菌株的筛选
将重组质粒pGPGAPVRERVP16和pGPGAPdCpf1VP16分别电转毕赤酵母菌株GS115,涂于添加Zeocin抗生素的YPD固体培养基平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证VP16拷贝数。把Real-time PCR检验VP16为单拷贝的毕赤酵母表达菌株分别命名为GS_VV和GS_dCV。
3、PGAP表达gaRNA或craRNA质粒的构建
以ga1-GAP R(SEQ ID NO:66)和handle-TT F(SEQ ID NO:47)为引物,通过PCR的方法,从质粒pAA-PGAPgi1上扩增得到质粒骨架区域,通过无缝克隆试剂盒与gaRNA_1片段进行组装,得到的重组质粒为pAA-PGAPga1。
同理,可得到重组质粒pAA-PGAPga2(组装入gaRNA_2片段)、pAA-PGAPga3(组装入gaRNA_3片段)、pAA-PGAPcra1(组装入craRNA_1片段)、pAA-PGAPcra2(组装入craRNA_2片段)、pAA-PGAPcra3(组装入craRNA_3片段)。
pAA-PGAPga2构建所用引物:ga2-GAP R(SEQ ID NO:67)和handle-TT F(SEQ IDNO:47);
pAA-PGAPga3构建所用引物:ga3-GAP R(SEQ ID NO:68)和handle-TT F(SEQ IDNO:47);
pAA-PGAPcra1构建所用引物:DR-GAP R(SEQ ID NO:69)和cra1-TT F(SEQ ID NO:70);
pAA-PGAPcra2构建所用引物:DR-GAP R(SEQ ID NO:69)和cra2-TT F(SEQ ID NO:71);
pAA-PGAPcra3构建所用引物:DR-GAP R(SEQ ID NO:69)和cra3-TT F(SEQ ID NO:72)。
4、PGAP表达gaRNA或craRNA菌株的筛选
将重组质粒pAA-PGAPga1、pAA-PGAPga2、pAA-PGAPga3分别电转毕赤酵母菌株GS_VV,涂于添加Hygromycin抗生素的YPD固体培养基平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证gaRNA拷贝数。把Real-time PCR检验gaRNA为单拷贝的毕赤酵母表达菌株分别命名为GS_VV-ga1、GS_VV-ga2、GS_VV-ga3。
将重组质粒pAA-PGAPcra1、pAA-PGAPcra2、pAA-PGAPcra3分别电转毕赤酵母菌株GS_dCV,涂于添加Hygromycin抗生素的YPD固体培养基平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证craRNA拷贝数。把Real-time PCR检验gaRNA为单拷贝的毕赤酵母表达菌株分别命名为GS_dCV-cra1、GS_dCV-cra2、GS_dCV-cra3。
5、GFP表达质粒的构建
分别以g1-cA F(SEQ ID NO:73)和pPcAG R(SEQ ID NO:74)为引物以及以pPcAG F(SEQ ID NO:75)和g1-pP R(SEQ ID NO:76)为引物,通过PCR的方法,从质粒pPAG上扩增得到AOX1核心启动子和GFP的区域以及质粒骨架区域(除了核心启动子和GFP,还含有gaRNA结合序列或craRNA结合序列),通过无缝克隆试剂盒将两条片段进行组装,得到的重组质粒为pPg1cAG。
同理可得到重组质粒pPg1rcAG、pPg2cAG、pPg2rcAG、pPg3cAG、pPg3rcAG、pPcr1cAG、pPcr1rcAG、pPcr2cAG、pPcr2rcAG、pPcr3cAG、pPcr3rcAG。
pPg1rcAG构建所用引物:g1r-cA F(SEQ ID NO:77)和g1r-pP R(SEQ ID NO:78);
pPg2cAG构建所用引物:g2-cA F(SEQ ID NO:79)和g2-pP R(SEQ ID NO:80);
pPg2rcAG构建所用引物:g2r-cA F(SEQ ID NO:81)和g2r-pP R(SEQ ID NO:82);
pPg3cAG构建所用引物:g3-cA F(SEQ ID NO:83)和g3-pP R(SEQ ID NO:84);
pPg3rcAG构建所用引物:g3r-cA F(SEQ ID NO:85)和g3r-pP R(SEQ ID NO:86);
pPcr1cAG构建所用引物:cr1-cA F(SEQ ID NO:87)和cr1-pP R(SEQ ID NO:88);
pPcr1rcAG构建所用引物:cr1r-cA F(SEQ ID NO:89)和cr1r-pP R(SEQ ID NO:90);
pPcr2cAG构建所用引物:cr2-cA F(SEQ ID NO:91)和cr2-pP R(SEQ ID NO:92);
pPcr2rcAG构建所用引物:cr2r-cA F(SEQ ID NO:93)和cr2r-pP R(SEQ ID NO:94);
pPcr3cAG构建所用引物:cr3-cA F(SEQ ID NO:95)和cr3-pP R(SEQ ID NO:96);
pPcr3rcAG构建所用引物:cr3r-cA F(SEQ ID NO:97)和cr3r-pP R(SEQ ID NO:98)。
6、毕赤酵母CRISPRa激活菌株的筛选
将重组质粒pPg1cAG和pPg1rcAG分别电转毕赤酵母菌株GS_VV-ga1,涂于不含组氨酸的YND平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证GFP拷贝数。把Real-time PCR检验GFP为单拷贝的毕赤酵母表达菌株分别命名为GS_VV-ga1-g1cAG和GS_VV-ga1-g1rcAG。
将重组质粒pPg2cAG和pPg2rcAG分别电转毕赤酵母菌株GS_VV-ga2,涂于不含组氨酸的YND平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证GFP拷贝数。把Real-time PCR检验GFP为单拷贝的毕赤酵母表达菌株分别命名为GS_VV-ga2-g2cAG和GS_VV-ga2-g2rcAG。
将重组质粒pPg3cAG和pPg3rcAG分别电转毕赤酵母菌株GS_VV-ga3,涂于不含组氨酸的YND平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证GFP拷贝数。把Real-time PCR检验GFP为单拷贝的毕赤酵母表达菌株分别命名为GS_VV-ga3-g3cAG和GS_VV-ga3-g3rcAG。
将重组质粒pPcr1cAG和pPcr1rcAG分别电转毕赤酵母菌株GS_dCV-cra1,涂于不含组氨酸的YND平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证GFP拷贝数。把Real-time PCR检验GFP为单拷贝的毕赤酵母表达菌株分别命名为GS_dCV-cra1-cr1cAG和GS_dCV-cra1-cr1rcAG。
将重组质粒pPcr2cAG和pPcr2rcAG分别电转毕赤酵母菌株GS_dCV-cra2,涂于不含组氨酸的YND平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证GFP拷贝数。把Real-time PCR检验GFP为单拷贝的毕赤酵母表达菌株分别命名为GS_dCV-cra2-cr2cAG和GS_dCV-cra2-cr2rcAG。
将重组质粒pPcr3cAG和pPcr3rcAG分别电转毕赤酵母菌株GS_dCV-cra3,涂于不含组氨酸的YND平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证GFP拷贝数。把Real-time PCR检验GFP为单拷贝的毕赤酵母表达菌株分别命名为GS_dCV-cra3-cr3cAG和GS_dCV-cra3-cr3rcAG。
7、酶标仪检测GFP荧光强度
将菌株GS_VV-ga1-g1cAG、GS_VV-ga1-g1rcAG、GS_VV-ga2-g2cAG、GS_VV-ga2-g2rcAG、GS_VV-ga3-g3cAG、GS_VV-ga3-g3rcAG、GS_dCV-cra1-cr1cAG、GS_dCV-cra1-cr1rcAG、GS_dCV-cra2-cr2cAG、GS_dCV-cra2-cr2rcAG、GS_dCV-cra3-cr3cAG、GS_dCV-cra3-cr3rcAG分别在YPD液体培养基中过夜预培养,离心收集菌体,用蒸馏水洗涤2次后,转移至YNM液体培养基中进行培养,取样后用酶标仪检测样品中GFP的荧光强度。
结果如图3A-C所示,各菌株均有荧光蛋白表达。其中,在使用VRER-VP16作为激活因子时,gaRNA_2介导的CRISPRa激活器件效果最好,其次gaRNA_3也展现了一定程度的激活效果,均可以使cPAOX1的活性显著提高,且当gaRNA结合非模板链(NT)时,eGFP荧光强度略高。
在使用dCpf1-VP16作为激活因子时,craRNA_1和craRNA_3介导的CRISPRa激活器件效果较好,且craRNA在结合模板链时能够展现更好的激活效果。
实施例3、阻遏器件(dCas9+giRNA_1)与激活器件(VRER+gaRNA_2)介导的人工转录调控***
本实施例中,菌株为毕赤酵母菌株Δku70,各个主要器件如下:
Figure BDA0003199870590000201
主要建立方法如下:
1、毕赤酵母Δku_VVdCas9菌株的筛选
以HAPTg1UP F(SEQ ID NO:99)和HAPTg1DO R(SEQ ID NO:100)为引物,通过PCR的方法,从pDTg1PGAPdCas9上扩增dCas9-HA片段。将100ng 3.5k-TEF1-gRNA1质粒、1μg dCas9-HA片段同时转入Δku70菌株中,涂于不含组氨酸的YND平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组。将验证正确的转化子在YPD平板上划线,将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证dCas9拷贝数。把Real-time PCR检验dCas9为单拷贝的毕赤酵母表达菌株分别命名为Δku_dCas9。
将重组质粒pGPGAPVRERVP16电转毕赤酵母菌株Δku_dCas9,涂于添加Zeocin抗生素的YPD固体培养基平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证VP16拷贝数。把Real-timePCR检验VP16为单拷贝的毕赤酵母表达菌株分别命名为Δku_VVdCas9。
2、pPg2cATSAD质粒的构建
以HP-GFP F(SEQ ID NO:101)和HP-pP R(SEQ ID NO:102)为引物,通过PCR的方法,从pPAG上扩增GFP编码基因和质粒骨架区域,通过无缝克隆试剂盒与HP启动子片段进行组装,得到的重组质粒为pPHPGFP。
以STA-TT F(SEQ ID NO:103)和STA-cA R(SEQ ID NO:104)为引物,通过PCR的方法,从pPg2rcAG质粒上扩增AOX1核心启动子、AOXTT终止子和质粒骨架区域,通过无缝克隆试剂盒与STA片段进行组装,得到的重组质粒为pPg2rcASTA。该STA中(SEQ ID NO:29),第1-1086位为LacI蛋白编码序列,LacI可以与HP中的对应操纵序列结合;第1102-3456位为Mit1AD激活域,具有转录激活作用;其中,HP中(SEQ ID NO:30)相应的lac操纵序列为其第81-283位,其可以被LacI蛋白识别并结合。
以TT-HP F(SEQ ID NO:105)和inOri R(SEQ ID NO:106)为引物,通过PCR的方法,从pPHPGFP质粒上扩增HP启动子区域、GFP区域和质粒骨架区域;以inOri F(SEQ ID NO:107)和HP-TT F(SEQ ID NO:108)为引物,通过PCR的方法,从pPg2rcASTA上扩增AOX1核心启动子、STA编码基因和AOXTT终止子区域。通过无缝克隆试剂盒将两个片段进行组装,得到的重组质粒为pPg2rcATSAD。
3、毕赤酵母Δku_VVdCas9-g2rcATSAD菌株的筛选
将重组质粒pPg2rcATSAD电转毕赤酵母菌株Δku_VVdCas9,涂于不含组氨酸的YND平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证GFP拷贝数。把Real-time PCR检验GFP为单拷贝的毕赤酵母表达菌株分别命名为Δku_VVdCas9-g2rcATSAD。
4、giRNA_1和gaRNA_2共表达质粒的构建
通过酶切的方法,将重组质粒pAA-PGAPgi1在XhoI/KpnI进行双酶切线性化,回收较长片段(~5500bp),分别与从毕赤酵母GS115基因组上扩增出的AOX2启动子片段、ICL1启动子片段、GPM1启动子片段、ENO1启动子片段(在葡萄糖条件下启动强度依次增强)通过无缝克隆试剂盒进行无缝组装,分别得到重组质粒pAA-PAOX2gi1、pAA-PICL1gi1、pAA-PGPM1gi1和pAA-PENO1gi1。
AOX2启动子扩增引物:pAA-AOX2 F(SEQ ID NO:109)和HH-AOX2 R(SEQ ID NO:110);
ICL1启动子扩增引物:pAA-ICL1 F(SEQ ID NO:111)和HH-ICL1 R(SEQ ID NO:112);
GPM1启动子扩增引物:pAA-GPM1 F(SEQ ID NO:113)和HH-GPM1 R(SEQ ID NO:114);
ENO1启动子扩增引物:pAA-ENO1 F(SEQ ID NO:115)和HH-ENO1 R(SEQ ID NO:116)。
通过酶切的方法,分别将重组质粒pAA-PGAPga2和pAA-PAOX2gi1在XhoI/KpnI进行双酶切线性化,分别回收长片段(~5500bp)和短片段(~1000bp),将两片段进行连接反应,得到的重组质粒为pAA-PAOX2ga2。按相同方法,分别得到重组质粒pAA-PICL1ga2、pAA-PGPM1ga2、pAA-PENO1ga2。
通过酶切的方法,将重组质粒pAA-PAOX2ga2在XhoI/EcoRI进行双酶切,回收长片段(~5400bp);分别将重组质粒pAA-PICL1gi1、pAA-PGPM1gi1、pAA-PENO1gi1、pAA-PGAPgi1在EcoRI/SalI进行双酶切,回收短片段,并分别与前述片段进行连接反应,得到重组质粒pAA-PICL1gi1-PAOX2ga2、pAA-PGPM1gi1-PAOX2ga2、pAA-PENO1gi1-PAOX2ga2、pAA-PGAPgi1-PAOX2ga2。按照相同方法,依次得到重组质粒pAA-PAOX2gi1-PICL1ga2、pAA-PGPM1gi1-PICL1ga2、pAA-PENO1gi1-PICL1ga2、pAA-PGAPgi1-PICL1ga2、pAA-PAOX2gi1-PGPM1ga2、pAA-PICL1gi1-PGPM1ga2、pAA-PENO1gi1-PGPM1ga2、pAA-PGAPgi1-PGPM1ga2、pAA-PAOX2gi1-PENO1ga2、pAA-PICL1gi1-PENO1ga2、pAA-PGPM1gi1-PENO1ga2、pAA-PGAPgi1-PENO1ga2、pAA-PAOX2gi1-PGAPga2、pAA-PICL1gi1-PGAPga2、pAA-PGPM1gi1-PGAPga2、pAA-PENO1gi1-PGAPga2。
5、电转毕赤酵母和单拷贝菌株的筛选
将上述20个重组质粒分别电转毕赤酵母菌株Δku_VVdCas9-g2rcATSAD,涂于添加Hygromycin抗生素的YPD固体培养基平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证giRNA_1拷贝数,得到一系列使用不同启动子表达giRNA_1和gaRNA_2的单拷贝毕赤酵母表达菌株。
6、酶标仪检测GFP荧光强度
将上述20个毕赤酵母菌株分别在YPD液体培养基中过夜预培养,离心收集菌体,用蒸馏水洗涤2次后,转移至YPD液体培养基中进行培养,取样后用酶标仪检测样品中GFP的荧光强度。
结果如图4A-B所示,VRER+gaRNA_2介导的人工转录调控***的输出信号强度会随giRNA_1表达量升高而降低,随gaRNA_2表达量升高而升高。当giRNA_1表达量最高(PGAP)而gaRNA_2表达量最低(PAOX2)时,整个***的输出信号强度最低,处于阻遏状态;当giRNA_1表达量最低(PAOX2)而gaRNA_2表达量最高(PGAP)时,整个***的输出强度达到最高水平,处于激活状态。输出信号强度差异最高可达29.1倍,展现了很好的精细调控性能。
实施例4、阻遏器件(dCas9+giRNA_1)与激活器件(dCpf1+craRNA_3)介导的人工转录调控***
本实施例中,菌株为毕赤酵母菌株Δku70,各个主要器件如下:
Figure BDA0003199870590000221
Figure BDA0003199870590000231
主要建立方法如下:
1、毕赤酵母Δku_dCVdCas9菌株的筛选
将重组质粒pGPGAPdCpf1VP16电转毕赤酵母菌株Δku_dCas9,涂于添加Zeocin抗生素的YPD固体培养基平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证VP16拷贝数。把Real-timePCR检验VP16为单拷贝的毕赤酵母表达菌株分别命名为Δku_dCVdCas9。
2、pPcr3cATSAD质粒的构建
以STA-TT F(SEQ ID NO:103)和STA-cA R(SEQ ID NO:104)为引物,通过PCR的方法,从pPcr3cAG质粒上扩增AOX1核心启动子、AOXTT终止子和质粒骨架区域,通过无缝克隆试剂盒与STA片段进行组装,得到的重组质粒为pPcr3cASTA。
以TT-HP(SEQ ID NO:105)和inOri R(SEQ ID NO:106)为引物,通过PCR的方法,从pPHPGFP质粒上扩增HP启动子区域、GFP区域和质粒骨架区域;以inOri F(SEQ ID NO:107)和HP-TT(SEQ ID NO:108)为引物,通过PCR的方法,从pPcr3cASTA上扩增AOX1核心启动子、STA编码基因和AOXTT终止子区域。通过无缝克隆试剂盒将两个片段进行组装,得到的重组质粒为pPcr3cATSAD。
3、毕赤酵母Δku_dCVdCas9-cr3cATSAD菌株的筛选
将重组质粒pPcr3cATSAD电转毕赤酵母菌株Δku_dCVdCas9,涂于不含组氨酸的YND平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证GFP拷贝数。把Real-time PCR检验GFP为单拷贝的毕赤酵母表达菌株分别命名为Δku_dCVdCas9-cr3cATSAD。
4、giRNA_1和craRNA_3共表达质粒的构建
通过酶切的方法,分别将重组质粒pAA-PGAPcra3和pAA-PAOX2gi1在XhoI/KpnI进行双酶切线性化,分别回收长片段(~5500bp)和短片段(~1000bp),将两片段进行连接反应,得到的重组质粒为pAA-PAOX2cra3。按相同方法,分别得到重组质粒pAA-PICL1cra3、pAA-PGPM1cra3、pAA-PENO1cra3。
通过酶切的方法,将重组质粒pAA-PAOX2cra3在XhoI/EcoRI进行双酶切,回收长片段(~5400bp);分别将重组质粒pAA-PICL1gi1、pAA-PGPM1gi1、pAA-PENO1gi1、pAA-PGAPgi1在EcoRI/SalI进行双酶切,回收短片段,并分别与前述片段进行连接反应,得到重组质粒pAA-PICL1gi1-PAOX2cra3、pAA-PGPM1gi1-PAOX2cra3、pAA-PENO1gi1-PAOX2cra3、pAA-PGAPgi1-PAOX2cra3。按照相同方法,依次得到重组质粒pAA-PAOX2gi1-PICL1cra3、pAA-PGPM1gi1-PICL1cra3、pAA-PENO1gi1-PICL1cra3、pAA-PGAPgi1-PICL1cra3、pAA-PAOX2gi1-PGPM1cra3、pAA-PICL1gi1-PGPM1cra3、pAA-PENO1gi1-PGPM1cra3、pAA-PGAPgi1-PGPM1cra3、pAA-PAOX2gi1-PENO1cra3、pAA-PICL1gi1-PENO1cra3、pAA-PGPM1gi1-PENO1cra3、pAA-PGAPgi1-PENO1cra3、pAA-PAOX2gi1-PGAPcra3、pAA-PICL1gi1-PGAPcra3、pAA-PGPM1gi1-PGAPcra3、pAA-PENO1gi1-PGAPcra3。
5、电转毕赤酵母和单拷贝菌株的筛选
将上述20个重组质粒分别电转毕赤酵母菌株Δku_dCVdCas9-cr3cATSAD,涂于添加Hygromycin抗生素的YPD固体培养基平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证giRNA_1拷贝数,得到一系列使用不同启动子表达giRNA_1和craRNA_3的单拷贝毕赤酵母表达菌株。
6、酶标仪检测GFP荧光强度
将上述20个毕赤酵母菌株分别在YPD液体培养基中过夜预培养,离心收集菌体,用蒸馏水洗涤2次后,转移至YPD液体培养基中进行培养,取样后用酶标仪检测样品中GFP的荧光强度。
结果如图5A-B所示,dCpf1+craRNA_3介导的人工转录调控***的输出信号强度会随giRNA_1表达量升高而降低,随craRNA_3表达量升高而升高。当giRNA_1表达量最高(PGAP)而craRNA_3表达量最低(PAOX2)时,整个***的输出信号强度最低,处于阻遏状态;当giRNA_1表达量最低(PAOX2)而craRNA_3表达量最高(PGAP)时,整个***的输出强度达到最高水平,处于激活状态。输出信号强度差异最高可达23.4倍,相比于VRER+gaRNA_2介导的人工转录调控***,本套***的调控更为严格,信号可调节范围更广,更适合用于基因表达的精细调控。
实施例5、鼠李糖阻遏型表达调控***的开发
本实施例中,菌株为毕赤酵母菌株Δku70,各个主要器件如下:
Figure BDA0003199870590000241
主要建立方法如下:
1、pAA-PLRA3gi1-PGAPcra3质粒的构建
通过酶切的方法,将重组质粒pAA-PGAPgi1在XhoI/KpnI进行双酶切线性化,回收较长片段(~5500bp);以pAA-LRA3 F(SEQ ID NO:117)和HH-LRA3 R(SEQ ID NO:118)为引物,通过PCR的方法,从毕赤酵母GS115基因组上扩增LRA3启动子片段。通过无缝克隆试剂盒将两片段进行组装,得到的重组质粒为pAA-PLRA3gi1。
通过酶切的方法,将重组质粒pAA-PGAPcra3在XhoI/MluI进行双酶切,回收长片段(~5700bp);将重组质粒pAA-PLRA3gi1在MluI/SalI进行双酶切,回收短片段(~1000bp)。将两个片段进行连接反应,得到重组质粒pAA-PLRA3gi1-PGAPcra3。
2、毕赤酵母Δku_dCVdCas9-cr3cATSAD-LRA3gi1GAPcra3菌株的筛选
将重组质粒pAA-PLRA3gi1-PGAPcra3电转毕赤酵母菌株Δku_dCVdCas9-cr3cATSAD,涂于添加Hygromycin抗生素的YPD固体培养基平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证giRNA_1拷贝数。把Real-time PCR检验giRNA_1为单拷贝的毕赤酵母表达菌株命名为Δku_dCVdCas9-cr3cATSAD-LRA3gi1GAPcra3。
3、不同碳源条件下GFP荧光强度检测
将菌株Δku_dCVdCas9-cr3cATSAD-LRA3gi1GAPcra3在YPD液体培养基中过夜预培养,离心收集菌体,用蒸馏水洗涤2次后,分别转移至含有葡萄糖(YPD)、甘油(YPG)、乙醇(YNE)、甲醇(YNM)、鼠李糖(YPR)的液体培养基中进行培养,取样后用酶标仪检测样品中GFP的荧光强度。
结果如图6所示,鼠李糖作为碳源的条件下,LRA3启动子被激活,giRNA_1大量表达,本表达***被阻遏,处于“Off”状态;在葡萄糖、甘油、乙醇、甲醇等碳源条件下,LRA3启动子被阻遏,giRNA_1表达被抑制,本表达***被激活(激活器件(dCpf1+craRNA_3)介导的人工转录调控***的运行),处于“On”状态。其中,本套鼠李糖阻遏型表达***在葡萄糖条件下输出强度最高,相比于鼠李糖条件下的“Off”状态,eGFP表达水平的差异可达22.9倍,同时实现了高效表达和严谨调控,展现了很好的应用潜力。
4、不同鼠李糖浓度条件下GFP荧光强度检测
将菌株Δku_dCVdCas9-cr3cATSAD-LRA3gi1GAPcra3在YPD液体培养基中过夜预培养,离心收集菌体,用蒸馏水洗涤2次后,分别转移至含有不同浓度鼠李糖(分别为20,15,10,5,2.5,1,0.5,0.25,0.2,0.08,0.025,0.016,0.01,0.0064,0.0025,0.00128,0.001,0.000512,0.00025,0.0001,0.000025,0.00001,0.0000025g/L)的YP液体培养基中,进行培养,取样后用酶标仪检测样品中GFP的荧光强度。
结果如图7所示,本表达***的输出信号与鼠李糖浓度之间具有非常明显的剂量响应关系,输出信号的强度会随鼠李糖浓度降低而升高。当鼠李糖浓度低于0.0001g/L时,输出强度基本达到最高水平,呈现“On”状态。本表达***在不同鼠李糖浓度下的输出强度差异可达24.1倍,展现了很好的精细调控性能。
本实验例中,激活器件均由GAP启动子驱动,为组成型表达,在阻遏器件被抑制后***既转为激活状态。
实施例6、甲醇阻遏型表达调控***的开发
本实施例中,菌株为毕赤酵母菌株Δku70,各个主要器件如下:
Figure BDA0003199870590000251
主要建立方法如下:
1、pAA-PDAS1gi1-PGAPcra3质粒的构建
通过酶切的方法,将重组质粒pAA-PGAPgi1在XhoI/KpnI进行双酶切线性化,回收较长片段(~5500bp);以pAA-DAS1 F(SEQ ID NO:119)和HH-DAS1 R(SEQ ID NO:120)为引物,通过PCR的方法,从毕赤酵母GS115基因组上扩增DAS1启动子片段。通过无缝克隆试剂盒将两片段进行组装,得到的重组质粒为pAA-PDAS1gi1。
通过酶切的方法,将重组质粒pAA-PGAPcra3在XhoI/MluI进行双酶切,回收长片段(~5700bp);将重组质粒pAA-PDAS1gi1在MluI/SalI进行双酶切,回收短片段(~1800bp)。将两个片段进行连接反应,得到重组质粒pAA-PDAS1gi1-PGAPcra3。
2、毕赤酵母Δku_dCVdCas9-cr3cATSAD-DAS1gi1GAPcra3菌株的筛选
将重组质粒pAA-PDAS1gi1-PGAPcra3电转毕赤酵母菌株Δku_dCVdCas9-cr3cATSAD,涂于添加Hygromycin抗生素的YPD固体培养基平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证giRNA_1拷贝数。把Real-time PCR检验giRNA_1为单拷贝的毕赤酵母表达菌株命名为Δku_dCVdCas9-cr3cATSAD-DAS1gi1GAPcra3。
3、不同碳源条件下GFP荧光强度检测
将菌株Δku_dCVdCas9-cr3cATSAD-DAS1gi1GAPcra3在YPD液体培养基中过夜预培养,离心收集菌体,用蒸馏水洗涤2次后,分别转移至含有葡萄糖(YPD)、甘油(YPG)、乙醇(YNE)、甲醇(YNM)的液体培养基中进行培养,取样后用酶标仪检测样品中GFP的荧光强度。
结果如图8所示,甲醇条件下,DAS1启动子被激活,giRNA_1大量表达,本表达***被阻遏,处于“Off”状态;在葡萄糖、甘油、乙醇等碳源条件下,DAS1启动子被阻遏,giRNA_1表达被抑制,本表达***被激活,处于“On”状态。其中,本套甲醇阻遏型表达***在葡萄糖条件下输出强度最高,相比于甲醇条件下的“Off”状态,eGFP表达水平的差异可达54.3倍,同时实现了高效表达和严谨调控,展现了很好的应用潜力。
本实验例中,激活器件均由GAP启动子驱动,为组成型表达,在阻遏器件被抑制后***既转为激活状态
实施例7、硫胺素诱导型表达***的开发
本实施例中,菌株为毕赤酵母菌株Δku70,各个主要器件如下:
Figure BDA0003199870590000261
主要建立方法如下:
1、pAA-PTHI11gi1-PGAPcra3质粒的构建
通过酶切的方法,将重组质粒pAA-PGAPgi1在XhoI/KpnI进行双酶切线性化,回收较长片段(~5500bp);以pAA-THI11 F(SEQ ID NO:121)和HH-THI11 R(SEQ ID NO:122)为引物,通过PCR的方法,从毕赤酵母GS115基因组上扩增THI11启动子片段。通过无缝克隆试剂盒将两片段进行组装,得到的重组质粒为pAA-PTHI11gi1。
通过酶切的方法,将重组质粒pAA-PGAPcra3在XhoI/MluI进行双酶切,回收长片段(~5700bp);将重组质粒pAA-PTHI11gi1在MluI/SalI进行双酶切,回收短片段(~1800bp)。将两个片段进行连接反应,得到重组质粒pAA-PTHI11gi1-PGAPcra3。
2、毕赤酵母Δku_dCVdCas9-cr3cATSAD-THI11gi1GAPcra3菌株的筛选
将重组质粒pAA-PTHI11gi1-PGAPcra3电转毕赤酵母菌株Δku_dCVdCas9-cr3cATSAD,涂于添加Hygromycin抗生素的YPD固体培养基平板,放在30℃培养箱培养48-72小时。将平板上长出的单克隆挑至液体培养基中,30℃摇床培养后提基因组,用Real-time PCR验证giRNA_1拷贝数。把Real-time PCR检验giRNA_1为单拷贝的毕赤酵母表达菌株命名为Δku_dCVdCas9-cr3cATSAD-THI11gi1GAPcra3。
3、不同条件下GFP荧光强度检测
将菌株Δku_dCVdCas9-cr3cATSAD-THI11gi1GAPcra3在YPD液体培养基中过夜预培养,离心收集菌体,用蒸馏水洗涤2次后,分别转移至硫胺素含量为0和4mmol/L的合成培养基中进行培养,取样后用酶标仪检测样品中GFP的荧光强度。
结果如图9所示,无硫胺素条件下,THI11启动子被激活,giRNA_1大量表达,本表达***被阻遏,处于“Off”状态;在硫胺素存在条件下,THI11启动子被阻遏,giRNA_1表达被抑制,本表达***被激活,处于“On”状态。本套硫胺素诱导型表达***的eGFP表达水平差异可达12.5倍,具备良好的可调控性能。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 华东理工大学
<120> 基于CRISPRi和CRISPRa的转录调控***、其建立方法及应用
<130> 212449
<160> 122
<170> SIPOSequenceListing 1.0
<210> 1
<211> 4119
<212> DNA
<213> dCas9
<400> 1
atggacaaga agtactccat tgggctcgct atcggcacaa acagcgtcgg ttgggccgtc 60
attacggacg agtacaaggt gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc 120
cacagcataa agaagaacct cattggcgcc ctcctgttcg actccgggga gacggccgaa 180
gccacgcggc tcaaaagaac agcacggcgc agatataccc gcagaaagaa tcggatctgc 240
tacctgcagg agatctttag taatgagatg gctaaggtgg atgactcttt cttccatagg 300
ctggaggagt cctttttggt ggaggaggat aaaaagcacg agcgccaccc aatctttggc 360
aatatcgtgg acgaggtggc gtaccatgaa aagtacccaa ccatatatca tctgaggaag 420
aagcttgtag acagtactga taaggctgac ttgcggttga tctatctcgc gctggcgcat 480
atgatcaaat ttcggggaca cttcctcatc gagggggacc tgaacccaga caacagcgat 540
gtcgacaaac tctttatcca actggttcag acttacaatc agcttttcga agagaacccg 600
atcaacgcat ccggagttga cgccaaagca atcctgagcg ctaggctgtc caaatcccgg 660
cggctcgaaa acctcatcgc acagctccct ggggagaaga agaacggcct gtttggtaat 720
cttatcgccc tgtcactcgg gctgaccccc aactttaaat ctaacttcga cctggccgaa 780
gatgccaagc ttcaactgag caaagacacc tacgatgatg atctcgacaa tctgctggcc 840
cagatcggcg accagtacgc agaccttttt ttggcggcaa agaacctgtc agacgccatt 900
ctgctgagtg atattctgcg agtgaacacg gagatcacca aagctccgct gagcgctagt 960
atgatcaagc gctatgatga gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga 1020
cagcaactgc ctgagaagta caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc 1080
ggatacattg acggcggagc aagccaggag gaattttaca aatttattaa gcccatcttg 1140
gaaaaaatgg acggcaccga ggagctgctg gtaaagctta acagagaaga tctgttgcgc 1200
aaacagcgca ctttcgacaa tggaagcatc ccccaccaga ttcacctggg cgaactgcac 1260
gctatcctca ggcggcaaga ggatttctac ccctttttga aagataacag ggaaaagatt 1320
gagaaaatcc tcacatttcg gataccctac tatgtaggcc ccctcgcccg gggaaattcc 1380
agattcgcgt ggatgactcg caaatcagaa gagaccatca ctccctggaa cttcgaggaa 1440
gtcgtggata agggggcctc tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa 1500
aatctgccta acgaaaaggt gcttcctaaa cactctctgc tgtacgagta cttcacagtt 1560
tataacgagc tcaccaaggt caaatacgtc acagaaggga tgagaaagcc agcattcctg 1620
tctggagagc agaagaaagc tatcgtggac ctcctcttca agacgaaccg gaaagttacc 1680
gtgaaacagc tcaaagaaga ctatttcaaa aagattgaat gtttcgactc tgttgaaatc 1740
agcggagtgg aggatcgctt caacgcatcc ctgggaacgt atcacgatct cctgaaaatc 1800
attaaagaca aggacttcct ggacaatgag gagaacgagg acattcttga ggacattgtc 1860
ctcaccctta cgttgtttga agatagggag atgattgaag aacgcttgaa aacttacgct 1920
catctcttcg acgacaaagt catgaaacag ctcaagaggc gccgatatac aggatggggg 1980
cggctgtcaa gaaaactgat caatgggatc cgagacaagc agagtggaaa gacaatcctg 2040
gattttctta agtccgatgg atttgccaac cggaacttca tgcagttgat ccatgatgac 2100
tctctcacct ttaaggagga catccagaaa gcacaagttt ctggccaggg ggacagtctt 2160
cacgagcaca tcgctaatct tgcaggtagc ccagctatca aaaagggaat actgcagacc 2220
gttaaggtcg tggatgaact cgtcaaagta atgggaaggc ataagcccga gaatatcgtt 2280
atcgagatgg cccgagagaa ccaaactacc cagaagggac agaagaacag tagggaaagg 2340
atgaagagga ttgaagaggg tataaaagaa ctggggtccc aaatccttaa ggaacaccca 2400
gttgaaaaca cccagcttca gaatgagaag ctctacctgt actacctgca gaacggcagg 2460
gacatgtacg tggatcagga actggacatc aatcggctct ccgactacga cgtggatgcc 2520
atcgtgcccc agtcttttct caaagatgat tctattgata ataaagtgtt gacaagatcc 2580
gataaaaata gagggaagag tgataacgtc ccctcagaag aagttgtcaa gaaaatgaaa 2640
aattattggc ggcagctgct gaacgccaaa ctgatcacac aacggaagtt cgataatctg 2700
actaaggctg aacgaggtgg cctgtctgag ttggataaag ccggcttcat caaaaggcag 2760
cttgttgaga cacgccagat caccaagcac gtggcccaaa ttctcgattc acgcatgaac 2820
accaagtacg atgaaaatga caaactgatt cgagaggtga aagttattac tctgaagtct 2880
aagctggtct cagatttcag aaaggacttt cagttttata aggtgagaga gatcaacaat 2940
taccaccatg cgcatgatgc ctacctgaat gcagtggtag gcactgcact tatcaaaaaa 3000
tatcccaagc ttgaatctga atttgtttac ggagactata aagtgtacga tgttaggaaa 3060
atgatcgcaa agtctgagca ggaaataggc aaggccaccg ctaagtactt cttttacagc 3120
aatattatga attttttcaa gaccgagatt acactggcca atggagagat tcggaagcga 3180
ccacttatcg aaacaaacgg agaaacagga gaaatcgtgt gggacaaggg tagggatttc 3240
gcgacagtcc ggaaggtcct gtccatgccg caggtgaaca tcgttaaaaa gaccgaagta 3300
cagaccggag gcttctccaa ggaaagtatc ctcccgaaaa ggaacagcga caagctgatc 3360
gcacgcaaaa aagattggga ccccaagaaa tacggcggat tcgattctcc tacagtcgct 3420
tacagtgtac tggttgtggc caaagtggag aaagggaagt ctaaaaaact caaaagcgtc 3480
aaggaactgc tgggcatcac aatcatggag cgatcaagct tcgaaaaaaa ccccatcgac 3540
tttctcgagg cgaaaggata taaagaggtc aaaaaagacc tcatcattaa gcttcccaag 3600
tactctctct ttgagcttga aaacggccgg aaacgaatgc tcgctagtgc gggcgagctg 3660
cagaaaggta acgagctggc actgccctct aaatacgtta atttcttgta tctggccagc 3720
cactatgaaa agctcaaagg gtctcccgaa gataatgagc agaagcagct gttcgtggaa 3780
caacacaaac actaccttga tgagatcatc gagcaaataa gcgaattctc caaaagagtg 3840
atcctcgccg acgctaacct cgataaggtg ctttctgctt acaataagca cagggataag 3900
cccatcaggg agcaggcaga aaacattatc cacttgttta ctctgaccaa cttgggcgcg 3960
cctgcagcct tcaagtactt cgacaccacc atagacagaa agcggtacac ctctacaaag 4020
gaggtcctgg acgccacact gattcatcag tcaattacgg ggctctatga aacaagaatc 4080
gacctctctc agctcggtgg agacagcagg gctgactaa 4119
<210> 2
<211> 101
<212> DNA
<213> girna_1
<400> 2
tgacagcaat atataaacag agttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt t 101
<210> 3
<211> 100
<212> DNA
<213> girna_2
<400> 3
tttatatatt gctgtcaagt gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 100
<210> 4
<211> 100
<212> DNA
<213> girna_3
<400> 4
aataatgatg ataaaaaaaa gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 100
<210> 5
<211> 151
<212> DNA
<213> girna_1c
<400> 5
gatacttttc agagagcaat atatattggg ttatatcttg ctctcagaaa tgacagcaat 60
atataaacag agttttagag ctagaaatag caagttaaaa taaggctagt ccgttatcaa 120
cttgaaaaag tggcaccgag tcggtgcttt t 151
<210> 6
<211> 101
<212> DNA
<213> girna_1m
<400> 6
tgacagcaat atataaacag agttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tgtctgctag tagcagatat t 101
<210> 7
<211> 4116
<212> DNA
<213> vrer
<400> 7
atggacaaga agtactccat tgggctcgct atcggcacaa acagcgtcgg ttgggccgtc 60
attacggacg agtacaaggt gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc 120
cacagcataa agaagaacct cattggcgcc ctcctgttcg actccgggga gacggccgaa 180
gccacgcggc tcaaaagaac agcacggcgc agatataccc gcagaaagaa tcggatctgc 240
tacctgcagg agatctttag taatgagatg gctaaggtgg atgactcttt cttccatagg 300
ctggaggagt cctttttggt ggaggaggat aaaaagcacg agcgccaccc aatctttggc 360
aatatcgtgg acgaggtggc gtaccatgaa aagtacccaa ccatatatca tctgaggaag 420
aagcttgtag acagtactga taaggctgac ttgcggttga tctatctcgc gctggcgcat 480
atgatcaaat ttcggggaca cttcctcatc gagggggacc tgaacccaga caacagcgat 540
gtcgacaaac tctttatcca actggttcag acttacaatc agcttttcga agagaacccg 600
atcaacgcat ccggagttga cgccaaagca atcctgagcg ctaggctgtc caaatcccgg 660
cggctcgaaa acctcatcgc acagctccct ggggagaaga agaacggcct gtttggtaat 720
cttatcgccc tgtcactcgg gctgaccccc aactttaaat ctaacttcga cctggccgaa 780
gatgccaagc ttcaactgag caaagacacc tacgatgatg atctcgacaa tctgctggcc 840
cagatcggcg accagtacgc agaccttttt ttggcggcaa agaacctgtc agacgccatt 900
ctgctgagtg atattctgcg agtgaacacg gagatcacca aagctccgct gagcgctagt 960
atgatcaagc gctatgatga gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga 1020
cagcaactgc ctgagaagta caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc 1080
ggatacattg acggcggagc aagccaggag gaattttaca aatttattaa gcccatcttg 1140
gaaaaaatgg acggcaccga ggagctgctg gtaaagctta acagagaaga tctgttgcgc 1200
aaacagcgca ctttcgacaa tggaagcatc ccccaccaga ttcacctggg cgaactgcac 1260
gctatcctca ggcggcaaga ggatttctac ccctttttga aagataacag ggaaaagatt 1320
gagaaaatcc tcacatttcg gataccctac tatgtaggcc ccctcgcccg gggaaattcc 1380
agattcgcgt ggatgactcg caaatcagaa gagaccatca ctccctggaa cttcgaggaa 1440
gtcgtggata agggggcctc tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa 1500
aatctgccta acgaaaaggt gcttcctaaa cactctctgc tgtacgagta cttcacagtt 1560
tataacgagc tcaccaaggt caaatacgtc acagaaggga tgagaaagcc agcattcctg 1620
tctggagagc agaagaaagc tatcgtggac ctcctcttca agacgaaccg gaaagttacc 1680
gtgaaacagc tcaaagaaga ctatttcaaa aagattgaat gtttcgactc tgttgaaatc 1740
agcggagtgg aggatcgctt caacgcatcc ctgggaacgt atcacgatct cctgaaaatc 1800
attaaagaca aggacttcct ggacaatgag gagaacgagg acattcttga ggacattgtc 1860
ctcaccctta cgttgtttga agatagggag atgattgaag aacgcttgaa aacttacgct 1920
catctcttcg acgacaaagt catgaaacag ctcaagaggc gccgatatac aggatggggg 1980
cggctgtcaa gaaaactgat caatgggatc cgagacaagc agagtggaaa gacaatcctg 2040
gattttctta agtccgatgg atttgccaac cggaacttca tgcagttgat ccatgatgac 2100
tctctcacct ttaaggagga catccagaaa gcacaagttt ctggccaggg ggacagtctt 2160
cacgagcaca tcgctaatct tgcaggtagc ccagctatca aaaagggaat actgcagacc 2220
gttaaggtcg tggatgaact cgtcaaagta atgggaaggc ataagcccga gaatatcgtt 2280
atcgagatgg cccgagagaa ccaaactacc cagaagggac agaagaacag tagggaaagg 2340
atgaagagga ttgaagaggg tataaaagaa ctggggtccc aaatccttaa ggaacaccca 2400
gttgaaaaca cccagcttca gaatgagaag ctctacctgt actacctgca gaacggcagg 2460
gacatgtacg tggatcagga actggacatc aatcggctct ccgactacga cgtggatgcc 2520
atcgtgcccc agtcttttct caaagatgat tctattgata ataaagtgtt gacaagatcc 2580
gataaaaata gagggaagag tgataacgtc ccctcagaag aagttgtcaa gaaaatgaaa 2640
aattattggc ggcagctgct gaacgccaaa ctgatcacac aacggaagtt cgataatctg 2700
actaaggctg aacgaggtgg cctgtctgag ttggataaag ccggcttcat caaaaggcag 2760
cttgttgaga cacgccagat caccaagcac gtggcccaaa ttctcgattc acgcatgaac 2820
accaagtacg atgaaaatga caaactgatt cgagaggtga aagttattac tctgaagtct 2880
aagctggtct cagatttcag aaaggacttt cagttttata aggtgagaga gatcaacaat 2940
taccaccatg cgcatgatgc ctacctgaat gcagtggtag gcactgcact tatcaaaaaa 3000
tatcccaagc ttgaatctga atttgtttac ggagactata aagtgtacga tgttaggaaa 3060
atgatcgcaa agtctgagca ggaaataggc aaggccaccg ctaagtactt cttttacagc 3120
aatattatga attttttcaa gaccgagatt acactggcca atggagagat tcggaagcga 3180
ccacttatcg aaacaaacgg agaaacagga gaaatcgtgt gggacaaggg tagggatttc 3240
gcgacagtcc ggaaggtcct gtccatgccg caggtgaaca tcgttaaaaa gaccgaagta 3300
cagaccggag gcttctccaa ggaaagtatc ctcccgaaaa ggaacagcga caagctgatc 3360
gcacgcaaaa aagattggga ccccaagaaa tacggcggat tcgtttctcc tacagtcgct 3420
tacagtgtac tggttgtggc caaagtggag aaagggaagt ctaaaaaact caaaagcgtc 3480
aaggaactgc tgggcatcac aatcatggag cgatcaagct tcgaaaaaaa ccccatcgac 3540
tttctcgagg cgaaaggata taaagaggtc aaaaaagacc tcatcattaa gcttcccaag 3600
tactctctct ttgagcttga aaacggccgg aaacgaatgc tcgctagtgc gcgcgagctg 3660
cagaaaggta acgagctggc actgccctct aaatacgtta atttcttgta tctggccagc 3720
cactatgaaa agctcaaagg gtctcccgaa gataatgagc agaagcagct gttcgtggaa 3780
caacacaaac actaccttga tgagatcatc gagcaaataa gcgaattctc caaaagagtg 3840
atcctcgccg acgctaacct cgataaggtg ctttctgctt acaataagca cagggataag 3900
cccatcaggg agcaggcaga aaacattatc cacttgttta ctctgaccaa cttgggcgcg 3960
cctgcagcct tcaagtactt cgacaccacc atagacagaa aggagtacag gtctacaaag 4020
gaggtcctgg acgccacact gattcatcag tcaattacgg ggctctatga aacaagaatc 4080
gacctctctc agctcggtgg agacagcagg gctgac 4116
<210> 8
<211> 3684
<212> DNA
<213> dcpf1
<400> 8
atgagcaagc tggagaagtt caccaactgc tacagcctga gcaagaccct gagattcaag 60
gccatccccg tgggaaaaac ccaggagaac atcgacaaca agagactgct ggtggaggac 120
gaaaagagag ccgaggacta caagggcgtg aagaagctgc tggacagata ctacctgagc 180
ttcatcaacg acgtgctgca cagcatcaag ctgaagaacc tgaacaacta catcagcctg 240
ttcagaaaga agaccagaac cgagaaggag aacaaggagc tggagaacct ggagatcaac 300
ctgagaaagg agatcgccaa ggccttcaag ggaaacgagg gctacaagag cctgttcaag 360
aaggacatca tcgagaccat cctgcccgag ttcctggatg acaaggacga gatcgccctg 420
gtgaacagct tcaacggctt caccaccgct ttcaccggct tcttcgacaa cagagagaac 480
atgttcagcg aggaggccaa gtctacaagc atcgccttca gatgcatcaa cgagaacctg 540
accagataca tcagcaacat ggacatcttc gagaaggtgg acgccatctt cgacaagcac 600
gaggtgcagg agatcaagga gaagatcctg aacagcgact acgacgtgga ggacttcttc 660
gagggcgagt tcttcaactt cgtgctgacc caggaaggca tcgacgtgta caacgccatc 720
atcggcggat ttgtgacaga gagcggcgag aaaatcaagg gcctgaacga gtacatcaac 780
ctgtacaacc agaagaccaa gcagaagctg cccaagttca agcccctgta caagcaggtg 840
ctgagcgaca gagagagcct gagcttctat ggcgagggct acaccagcga tgaagaggtg 900
ctggaggtgt tcagaaacac cctgaacaag aacagcgaga tcttcagcag catcaagaag 960
ctggagaagc tgttcaagaa cttcgacgag tacagcagcg ccggcatctt tgtgaaaaac 1020
ggccccgcta tcagcacaat cagcaaggac atcttcggcg agtggaacgt gatcagagac 1080
aagtggaacg ccgagtacga cgacatccac ctgaagaaga aggccgtggt gaccgagaaa 1140
tacgaggacg acagaagaaa gagcttcaag aagatcggca gcttcagcct ggaacagctg 1200
caagagtacg ctgacgctga cctgagcgtt gtggagaagc tgaaggagat catcatccag 1260
aaggtggacg agatctacaa ggtgtacggc agcagcgaga aacttttcga cgccgacttc 1320
gtgcttgaga agagcctgaa gaagaacgat gccgtggtgg ccatcatgaa ggacctgctg 1380
gacagcgtga agagcttcga gaactacatc aaggccttct tcggcgaagg caaggagacc 1440
aacagagacg agagcttcta cggcgacttc gtgctggctt acgacatcct gctgaaggtg 1500
gaccacatct acgacgccat cagaaactac gtgacccaga agccctacag caaggacaag 1560
ttcaagctgt acttccagaa cccccagttt atgggcggat gggacaagga taaggagacc 1620
gactacagag ccaccatcct gagatacggc agcaagtact acctggccat catggacaag 1680
aagtacgcca agtgcctgca gaagatcgac aaggacgacg tgaacggcaa ctacgagaag 1740
atcaactaca agctgctgcc cggccctaat aaaatgctgc ccaaggtgtt cttcagcaag 1800
aagtggatgg cctactacaa ccccagcgag gacatccaga agatctacaa gaacggcacc 1860
ttcaagaagg gcgacatgtt caacctgaac gactgccaca agctgatcga cttcttcaag 1920
gacagcatca gcagataccc caagtggagc aacgcctacg acttcaactt cagcgagacc 1980
gagaagtaca aggacatcgc cggcttctac agagaagtgg aggagcaggg atacaaggtg 2040
agcttcgaga gcgccagcaa gaaggaggtg gacaagctgg tggaagaggg caagctgtac 2100
atgttccaga tctacaacaa ggacttcagc gacaagtctc acggaacccc caatctgcac 2160
accatgtact tcaagctgct gttcgacgag aacaaccacg gccagatcag actttctgga 2220
ggcgctgaac tgttcatgag aagagccagc ctgaagaagg aagagctggt ggtgcatcct 2280
gccaatagcc ccatcgctaa caagaacccc gacaacccca agaaaaccac caccctgagc 2340
tacgacgtgt acaaggacaa gagattcagc gaggaccagt acgagctgca tatccccatc 2400
gccatcaaca agtgccccaa gaacatcttc aagatcaaca ccgaggtgag agtgctgctg 2460
aagcacgacg acaaccccta cgtgatcggc attgccagag gcgagagaaa cctgctgtac 2520
atcgtggtgg tggacggcaa gggaaacatc gtggagcagt acagcctgaa cgagatcatc 2580
aacaacttca acggcatcag aatcaagacc gactaccaca gcctgctgga caagaaggag 2640
aaggagagat tcgaggccag acagaactgg accagcatcg agaacatcaa ggagctgaag 2700
gccggctaca ttagccaggt ggtgcacaag atctgcgagc tggtggagaa gtacgatgcc 2760
gtgatcgctc tggaggatct gaacagcggc ttcaagaaca gcagagtgaa ggtggagaag 2820
caggtgtacc agaagttcga gaagatgctg atcgacaagc tgaactacat ggtggacaag 2880
aagagcaacc cctgtgctac aggcggagct ctgaagggat accagatcac caacaagttc 2940
gagagcttca agagcatgag cacccagaac ggcttcatct tctacatccc cgcctggctg 3000
acatctaaga tcgaccctag caccggcttt gtgaacctgc tgaagaccaa gtacaccagc 3060
atcgccgaca gcaagaagtt catcagcagc ttcgacagaa tcatgtacgt gcccgaggag 3120
gacctgtttg aatttgccct ggactacaag aacttcagca gaaccgacgc cgactacatc 3180
aagaagtgga agctgtacag ctacggcaac agaatcagaa tcttcagaaa ccccaagaag 3240
aacaacgtgt tcgactggga ggaggtgtgt ctgacaagcg cctacaagga gctgttcaac 3300
aagtacggca tcaactacca gcagggcgac attagagccc tgctgtgcga acagagcgac 3360
aaggccttct acagcagctt catggccctg atgagcctga tgctgcagat gagaaacagc 3420
atcaccggca gaaccgacgt ggacttcctt atcagccccg tgaaaaacag cgacggcatc 3480
ttctacgaca gcagaaacta cgaggcccag gagaatgcta tcctgcccaa gaatgccgat 3540
gctaacggcg cttacaacat cgccagaaag gtgctttggg ccatcggcca gtttaagaag 3600
gccgaggacg agaagctgga caaggtgaag atcgccatca gcaacaagga gtggctggag 3660
tatgctcaga ccagcgtgaa acac 3684
<210> 9
<211> 237
<212> DNA
<213> vp16
<400> 9
gctccaccaa ccgacgtttc tttgggtgac gagttgcact tggacggtga agatgttgcc 60
atggctcatg ctgacgcttt ggacgacttc gacttggaca tgttgggtga cggtgattct 120
ccaggtccag gtttcactcc acacgattct gctccatacg gtgctttgga catggccgac 180
ttcgagtttg agcagatgtt caccgacgct ttgggtattg acgagtacgg tggttaa 237
<210> 10
<211> 101
<212> DNA
<213> garna_1
<400> 10
tctgtttata tattgctgtc agttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt t 101
<210> 11
<211> 101
<212> DNA
<213> garna_2
<400> 11
tagctcttaa agtctgttta tgttttagag tcagaaatga caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt t 101
<210> 12
<211> 171
<212> DNA
<213> garna_3
<400> 12
cgtcacccaa tatatattgc tctctgaaaa tggtggttaa tgaaaattaa cttactattt 60
tctgacagca aagaaattgt gctatcagat cgttttagag ctagaaatag caagttaaaa 120
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt t 171
<210> 13
<211> 40
<212> DNA
<213> crarna_1
<400> 13
aatttctact aagtgtagat gcacaaactc ggacccactt 40
<210> 14
<211> 42
<212> DNA
<213> crarna_2
<400> 14
aatttctact aagtgtagat actttttcac attgataacg ga 42
<210> 15
<211> 40
<212> DNA
<213> crarna_3
<400> 15
aatttctact aagtgtagat ttgataacgg actagcctta 40
<210> 16
<211> 25
<212> DNA
<213> g1
<400> 16
tctgtttata tattgctgtc aagcg 25
<210> 17
<211> 25
<212> DNA
<213> g1r
<400> 17
cgcttgacag caatatataa acaga 25
<210> 18
<211> 25
<212> DNA
<213> g2
<400> 18
tagctcttaa agtctgttta tcgcg 25
<210> 19
<211> 25
<212> DNA
<213> g2r
<400> 19
cgcgataaac agactttaag agcta 25
<210> 20
<211> 24
<212> DNA
<213> g3
<400> 20
agaaattgtg ctatcagatc agcg 24
<210> 21
<211> 24
<212> DNA
<213> g3r
<400> 21
cgctgatctg atagcacaat ttct 24
<210> 22
<211> 24
<212> DNA
<213> cr1
<400> 22
tttagcacaa actcggaccc actt 24
<210> 23
<211> 24
<212> DNA
<213> cr1r
<400> 23
aagtgggtcc gagtttgtgc taaa 24
<210> 24
<211> 26
<212> DNA
<213> cr2
<400> 24
tttgactttt tcacattgat aacgga 26
<210> 25
<211> 26
<212> DNA
<213> cr2r
<400> 25
tccgttatca atgtgaaaaa gtcaaa 26
<210> 26
<211> 24
<212> DNA
<213> cr3
<400> 26
tttgttgata acggactagc ctta 24
<210> 27
<211> 24
<212> DNA
<213> cr3r
<400> 27
taaggctagt ccgttatcaa caaa 24
<210> 28
<211> 179
<212> DNA
<213> aox1核心
<400> 28
ctaaccccta cttgacagca atatataaac agaaggaagc tgccctgtct taaacctttt 60
tttttatcat cattattagc ttactttcat aattgcgact ggttccaatt gacaagcttt 120
tgattttaac gacttttaac gacaacttga gaagatcaaa aaacaactaa ttattcgaa 179
<210> 29
<211> 3456
<212> DNA
<213> sta
<400> 29
atgggtgtta agccagttac tttgtatgac gttgctgaat acgctggagt ttcctaccaa 60
actgtctcta gagttgttaa tcaagcttct catgtctccg ctaagactag agagaaggtt 120
gaggctgcta tggctgaatt gaactatatt ccaaatagag ttgctcagca gttggctgga 180
aagcaatctt tgttgattgg agtcgctact tcttctttgg ctttgcatgc tccatctcag 240
attgttgctg ctattaagtc cagagctgac cagttgggag cttctgttgt tgtttctatg 300
gttgagagat ctggagttga ggcttgcaag gctgctgttc ataacttgtt ggctcagaga 360
gtttctggat tgattattaa ttacccattg gacgatcaag acgctattgc cgttgaggcc 420
gcttgtacca acgtcccagc tttgttcttg gacgtttccg atcaaactcc aattaattct 480
attatttttt ctcacgagga tggaactaga ttgggagttg aacacttggt tgctttggga 540
catcaacaga ttgctttgtt ggctggacca ttgtcttccg tttctgctag attgagattg 600
gccggatggc acaagtactt gaccagaaac cagattcaac caattgctga gagagaggga 660
gattggtctg ctatgtctgg attccagcag actatgcaga tgttgaacga aggaattgtc 720
ccaaccgcta tgttggtcgc taatgaccaa atggctttgg gagctatgag agctattact 780
gaatctggat tgagagtcgg agctgacatt tctgttgttg gatatgatga cactgaggat 840
tcttcttgct acattccacc attgactact attaagcaag acttcagatt gttgggacag 900
acttctgttg atagattgtt gcagttgtcc caaggacaag ctgttaaagg aaaccaattg 960
ttgccagttt ctttggttaa gagaaagact actttggctc caaacactca gactgcttcc 1020
ccaagagctt tggctgactc tttgatgcaa ttggctagac aagtctctag attggagtct 1080
ggacaaggtg gcggcggctc tgttaacaac tccatgaagg atttcttagg caagaaaacg 1140
gtggatggag ctgatagtct caatttggcc gtgaatctgc aacaacagca gagttcaaac 1200
acaattgcca atcaatcgct ttcctcaatt ggattggaaa gttttggtta cggctctggt 1260
atcaaaaacg agtttaactt ccaagacttg ataggttcaa actctggcag ttcagatccg 1320
acattttcag tagacgctga cgaggcccaa aaactcgaca tttccaacaa gaacagtcgt 1380
aagagacaga aactaggttt gctgccggtc agcaatgcaa cttcccattt gaacggtttc 1440
aatggaatgt ccaatggaaa gtcacactct ttctcttcac cgtctgggac taatgacgat 1500
gaactaagtg gcttgatgtt caactcacca agcttcaacc ccctcacagt taacgattct 1560
accaacaaca gcaaccacaa tataggtttg tctccgatgt catgcttatt ttctacagtt 1620
caagaagcat ctcaaaaaaa gcatggaaat tccagtagac acttttcata cccatctggg 1680
ccggaggacc tttggttcaa tgagttccaa aaacaggccc tcacagccaa tggagaaaat 1740
gctgtccaac agggagatga tgcttctaag aacaacacag ccattcctaa ggaccagtct 1800
tcgaactcat cgattttcag ttcacgttct agtgcagctt ctagcaactc aggagacgat 1860
attggaagga tgggcccatt ctccaaagga ccagagattg agttcaacta cgattctttt 1920
ttggaatcgt tgaaggcaga gtcaccctct tcttcaaagt acaatctgcc ggaaactttg 1980
aaagagtaca tgacccttag ttcgtctcat ctgaatagtc aacactccga cactttggca 2040
aatggcacta acggtaacta ttctagcacc gtttccaaca acttgagctt aagtttgaac 2100
tccttctctt tctctgacaa gttctcattg agtccaccaa caatcactga cgccgaaaag 2160
ttttcattga tgagaaactt cattgacaac atctcgccat ggtttgacac ttttgacaat 2220
accaaacagt ttggaacaaa aattccagtt ctggccaaaa aatgttcttc attgtactat 2280
gccattctgg ctatatcttc tcgtcaaaga gaaaggataa agaaagagca caatgaaaaa 2340
acattgcaat gctaccaata ctcactacaa cagctcatcc ctactgttca aagctcaaat 2400
aatattgagt acattatcac atgtattctc ctgagtgtgt tccacatcat gtctagtgaa 2460
ccttcaaccc agagggacat cattgtgtca ttggcaaaat acattcaagc atgcaacata 2520
aacggattta catctaatga caaactggaa aagagtattt tctggaacta tgtcaatttg 2580
gatttggcta cttgtgcaat cggtgaagag tcaatggtca ttccttttag ctactgggtt 2640
aaagagacaa ctgactacaa gaccattcaa gatgtgaagc catttttcac caagaagact 2700
agcacgacaa ctgacgatga cttggacgat atgtatgcca tctacatgct gtacattagt 2760
ggtagaatca ttaacctgtt gaactgcaga gatgcgaagc tcaattttga gcccaagtgg 2820
gagtttttgt ggaatgaact caatgaatgg gaattgaaca aacccttgac ctttcaaagt 2880
attgttcagt tcaaggccaa tgacgaatcg cagggcggat caacttttcc aactgttcta 2940
ttctccaact ctcgaagctg ttacagtaac cagctgtatc atatgagcta catcatctta 3000
gtgcagaata aaccacgatt atacaaaatc ccctttacta cagtttctgc ttcaatgtca 3060
tctccatcgg acaacaaagc tgggatgtct gcttccagca cacctgcttc agaccaccac 3120
gcttctggtg atcatttgtc tccaagaagt gtagagccct ctctttcgac aacgttgagc 3180
cctccgccta atgcaaacgg tgcaggtaac aagttccgct ctacgctctg gcatgccaag 3240
cagatctgtg ggatttctat caacaacaac cacaacagca atctagcagc caaagtgaac 3300
tcattgcaac cattgtggca cgctggaaag ctaattagtt ccaagtctga acatacacag 3360
ttgctgaaac tgttgaacaa ccttgagtgt gcaacaggct ggcctatgaa ctggaagggc 3420
aaggagttaa ttgactactg gaatgttgaa gaataa 3456
<210> 30
<211> 468
<212> DNA
<213> hp
<400> 30
tctcatgttt gacagcttat catcgataag ctgactcatg ttggtattgt gaaatagacg 60
cagatcggga acgagctcct cgagtgtgtg gaattgtgag cggataacaa tttcacacag 120
tcgagtgtgt ggaattgtga gcggataaca atttcacaca gtcgagtgtg tggaattgtg 180
agcggataac aatttcacac agtcgagtgt gtggaattgt gagcggataa caatttcaca 240
cagtcgagtg tgtggaattg tgagcggata acaatttcac acagggcccc taacccctac 300
ttgacagcaa tatataaaca gaaggaagct gccctgtctt aaaccttttt ttttatcatc 360
attattagct tactttcata attgcgactg gttccaattg acaagctttt gattttaacg 420
acttttaacg acaacttgag aagatcaaaa aacaactaat tattcgaa 468
<210> 31
<211> 100
<212> DNA
<213> girna_4
<400> 31
cttactttca taattgcgac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 100
<210> 32
<211> 100
<212> DNA
<213> girna_5
<400> 32
aaaaacaact aattattcga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 100
<210> 33
<211> 100
<212> DNA
<213> girna_6
<400> 33
aaaatcaaaa gcttgtcaat gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 100
<210> 34
<211> 42
<212> DNA
<213> dcas9-tt f
<400> 34
gagacagcag ggctgactaa gtcgaccatc atcatcatca tc 42
<210> 35
<211> 75
<212> DNA
<213> dcas9-gap r
<400> 35
gacctttctc ttcttttttg gaggagtgca acccatacta gtcgaaatag ttgttcaatt 60
gattgaaata gggac 75
<210> 36
<211> 65
<212> DNA
<213> dcas9 f1
<400> 36
caaaaaagaa gagaaaggtc atggacaaga agtactccat tgggctcgct atcggcacaa 60
acagc 65
<210> 37
<211> 24
<212> DNA
<213> dcas9 r1
<400> 37
cacgatggca tccacgtcgt agtc 24
<210> 38
<211> 22
<212> DNA
<213> dcas9 f2
<400> 38
acgacgtgga tgccatcgtg cc 22
<210> 39
<211> 20
<212> DNA
<213> dcas9 r2
<400> 39
ttagtcagcc ctgctgtctc 20
<210> 40
<211> 44
<212> DNA
<213> pa-aox1 f
<400> 40
tccagtgtcg aaaacgagct agatctaaca tccaaagacg aaag 44
<210> 41
<211> 54
<212> DNA
<213> pa-aox1 r
<400> 41
gcggccgcat aggccactag ataattagtt gttttttgat cttctcaagt tgtc 54
<210> 42
<211> 59
<212> DNA
<213> paa-gap f
<400> 42
cgcgccttaa ttaacccggg gatccctcga gagatctttt ttgtagaaat gtcttggtg 59
<210> 43
<211> 104
<212> DNA
<213> gi1-gap r
<400> 43
ctgtttatat attgctgtca gacgagctta ctcgtttcgt cctcacggac tcatcagtga 60
cagtctagag gtaccatagt tgttcaattg attgaaatag ggac 104
<210> 44
<211> 109
<212> DNA
<213> gi1-tt f
<400> 44
ggcaccgagt cggtgctttt ggccggcatg gtcccagcct cctcgctggc gccggctggg 60
caacatgctt cggcatggcg aatgggacac tagtggatgt cagaatgcc 109
<210> 45
<211> 71
<212> DNA
<213> paa-tt r
<400> 45
gaagcttcgt acgctgcagg tcgacaagct tgcacaaacg aacgtctcac ttaatcttct 60
gtactctgaa g 71
<210> 46
<211> 40
<212> DNA
<213> gi2-gap r
<400> 46
acttgacagc aatatataaa gacgagctta ctcgtttcgt 40
<210> 47
<211> 79
<212> DNA
<213> handle-tt f
<400> 47
ggcaccgagt cggtgctttt ggccggcatg gtcccagcct cctcgctggc gccggctggg 60
caacatgctt cggcatggc 79
<210> 48
<211> 40
<212> DNA
<213> gi3-gap r
<400> 48
ttttttttat catcattatt gacgagctta ctcgtttcgt 40
<210> 49
<211> 40
<212> DNA
<213> gi4-gap r
<400> 49
gtcgcaatta tgaaagtaag gacgagctta ctcgtttcgt 40
<210> 50
<211> 40
<212> DNA
<213> gi5-gap r
<400> 50
tcgaataatt agttgttttt gacgagctta ctcgtttcgt 40
<210> 51
<211> 40
<212> DNA
<213> gi6-gap r
<400> 51
attgacaagc ttttgatttt gacgagctta ctcgtttcgt 40
<210> 52
<211> 46
<212> DNA
<213> vp-pg f
<400> 52
ttgacgagta cggtggttaa catcatcatc atcatcattg agtttg 46
<210> 53
<211> 27
<212> DNA
<213> dcas9v r
<400> 53
gtaggagaaa cgaatccgcc gtatttc 27
<210> 54
<211> 27
<212> DNA
<213> dcas9v f
<400> 54
ggcggattcg tttctcctac agtcgct 27
<210> 55
<211> 26
<212> DNA
<213> dcas9r r
<400> 55
tctgcagctc gcgcgcacta gcgagc 26
<210> 56
<211> 26
<212> DNA
<213> dcas9r f
<400> 56
tagtgcgcgc gagctgcaga aaggta 26
<210> 57
<211> 26
<212> DNA
<213> dcas9er r
<400> 57
gtagacctgt actcctttct gtctat 26
<210> 58
<211> 24
<212> DNA
<213> dcas9er f
<400> 58
agaaaggagt acaggtctac aaag 24
<210> 59
<211> 53
<212> DNA
<213> vp-dcas9 r
<400> 59
gaaacgtcgg ttggtggagc agagccgccg ccaccgtcag ccctgctgtc tcc 53
<210> 60
<211> 50
<212> DNA
<213> dcpf1-vp f
<400> 60
ctcagaccag cgtgaaacac ggtggcggcg gctctgctcc accaaccgac 50
<210> 61
<211> 44
<212> DNA
<213> dcpf1-gap r
<400> 61
aacttctcca gcttgctcat gacctttctc ttcttttttg gagg 44
<210> 62
<211> 21
<212> DNA
<213> dcpf1 f1
<400> 62
atgagcaagc tggagaagtt c 21
<210> 63
<211> 20
<212> DNA
<213> dcpf1 r1
<400> 63
tcgcctctgg caatgccgat 20
<210> 64
<211> 21
<212> DNA
<213> dcpf1 f2
<400> 64
atcggcattg ccagaggcga g 21
<210> 65
<211> 18
<212> DNA
<213> dcpf1 r2
<400> 65
gtgtttcacg ctggtctg 18
<210> 66
<211> 41
<212> DNA
<213> ga1-gap r
<400> 66
tgacagcaat atataaacag agacgagctt actcgtttcg t 41
<210> 67
<211> 41
<212> DNA
<213> ga2-gap r
<400> 67
ataaacagac tttaagagct agacgagctt actcgtttcg t 41
<210> 68
<211> 40
<212> DNA
<213> ga3-gap r
<400> 68
gcaatatata ttgggtgacg gacgagctta ctcgtttcgt 40
<210> 69
<211> 40
<212> DNA
<213> dr-gap r
<400> 69
atctacactt agtagaaatt gacgagctta ctcgtttcgt 40
<210> 70
<211> 79
<212> DNA
<213> cra1-tt f
<400> 70
gcacaaactc ggacccactt ggccggcatg gtcccagcct cctcgctggc gccggctggg 60
caacatgctt cggcatggc 79
<210> 71
<211> 81
<212> DNA
<213> cra2-tt f
<400> 71
actttttcac attgataacg gaggccggca tggtcccagc ctcctcgctg gcgccggctg 60
ggcaacatgc ttcggcatgg c 81
<210> 72
<211> 79
<212> DNA
<213> cra3-tt f
<400> 72
ttgataacgg actagcctta ggccggcatg gtcccagcct cctcgctggc gccggctggg 60
caacatgctt cggcatggc 79
<210> 73
<211> 40
<212> DNA
<213> g1-ca f
<400> 73
ttatatattg ctgtcaagcg ctaaccccta cttgacagca 40
<210> 74
<211> 30
<212> DNA
<213> ppcag r
<400> 74
ctgatgttac tgaaggatca gatcacgcat 30
<210> 75
<211> 30
<212> DNA
<213> ppcag f
<400> 75
tgatccttca gtaacatcag agattttgag 30
<210> 76
<211> 59
<212> DNA
<213> g1-pp r
<400> 76
cgcttgacag caatatataa acagactcga ggagctcgtt cccgatctgc gtctatttc 59
<210> 77
<211> 45
<212> DNA
<213> g1r-ca f
<400> 77
cgcttgacag caatatataa acagactaac ccctacttga cagca 45
<210> 78
<211> 59
<212> DNA
<213> g1r-pp r
<400> 78
tctgtttata tattgctgtc aagcgctcga ggagctcgtt cccgatctgc gtctatttc 59
<210> 79
<211> 45
<212> DNA
<213> g2-ca f
<400> 79
tagctcttaa agtctgttta tcgcgctaac ccctacttga cagca 45
<210> 80
<211> 59
<212> DNA
<213> g2-pp r
<400> 80
cgcgataaac agactttaag agctactcga ggagctcgtt cccgatctgc gtctatttc 59
<210> 81
<211> 45
<212> DNA
<213> g2r-ca f
<400> 81
cgcgataaac agactttaag agctactaac ccctacttga cagca 45
<210> 82
<211> 59
<212> DNA
<213> g2r-pp r
<400> 82
tagctcttaa agtctgttta tcgcgctcga ggagctcgtt cccgatctgc gtctatttc 59
<210> 83
<211> 44
<212> DNA
<213> g3-ca f
<400> 83
agaaattgtg ctatcagatc agcgctaacc cctacttgac agca 44
<210> 84
<211> 58
<212> DNA
<213> g3-pp r
<400> 84
cgctgatctg atagcacaat ttctctcgag gagctcgttc ccgatctgcg tctatttc 58
<210> 85
<211> 44
<212> DNA
<213> g3r-ca f
<400> 85
cgctgatctg atagcacaat ttctctaacc cctacttgac agca 44
<210> 86
<211> 58
<212> DNA
<213> g3r-pp r
<400> 86
agaaattgtg ctatcagatc agcgctcgag gagctcgttc ccgatctgcg tctatttc 58
<210> 87
<211> 44
<212> DNA
<213> cr1-ca f
<400> 87
tttagcacaa actcggaccc acttctaacc cctacttgac agca 44
<210> 88
<211> 58
<212> DNA
<213> cr1-pp r
<400> 88
aagtgggtcc gagtttgtgc taaactcgag gagctcgttc ccgatctgcg tctatttc 58
<210> 89
<211> 44
<212> DNA
<213> cr1r-ca f
<400> 89
aagtgggtcc gagtttgtgc taaactaacc cctacttgac agca 44
<210> 90
<211> 58
<212> DNA
<213> cr1r-pp r
<400> 90
tttagcacaa actcggaccc acttctcgag gagctcgttc ccgatctgcg tctatttc 58
<210> 91
<211> 46
<212> DNA
<213> cr2-ca f
<400> 91
tttgactttt tcacattgat aacggactaa cccctacttg acagca 46
<210> 92
<211> 60
<212> DNA
<213> cr2-pp r
<400> 92
tccgttatca atgtgaaaaa gtcaaactcg aggagctcgt tcccgatctg cgtctatttc 60
<210> 93
<211> 46
<212> DNA
<213> cr2r-ca f
<400> 93
tccgttatca atgtgaaaaa gtcaaactaa cccctacttg acagca 46
<210> 94
<211> 60
<212> DNA
<213> cr2r-pp r
<400> 94
tttgactttt tcacattgat aacggactcg aggagctcgt tcccgatctg cgtctatttc 60
<210> 95
<211> 44
<212> DNA
<213> cr3-ca f
<400> 95
tttgttgata acggactagc cttactaacc cctacttgac agca 44
<210> 96
<211> 58
<212> DNA
<213> cr3-pp r
<400> 96
taaggctagt ccgttatcaa caaactcgag gagctcgttc ccgatctgcg tctatttc 58
<210> 97
<211> 44
<212> DNA
<213> cr3r-ca f
<400> 97
taaggctagt ccgttatcaa caaactaacc cctacttgac agca 44
<210> 98
<211> 58
<212> DNA
<213> cr3r-pp r
<400> 98
tttgttgata acggactagc cttactcgag gagctcgttc ccgatctgcg tctatttc 58
<210> 99
<211> 27
<212> DNA
<213> haptg1up f
<400> 99
ctatgaccat gattacgaat tcgagct 27
<210> 100
<211> 20
<212> DNA
<213> haptg1do r
<400> 100
tgcctgcagg tcgactctag 20
<210> 101
<211> 40
<212> DNA
<213> hp-gfp f
<400> 101
aaaacaacta attattcgaa ggatcctaca ccatgggttc 40
<210> 102
<211> 44
<212> DNA
<213> hp-pp r
<400> 102
ataagctgtc aaacatgaga attaattctt gaagacgaaa gggc 44
<210> 103
<211> 35
<212> DNA
<213> sta-tt f
<400> 103
actggaatgt tgaagaataa ccgcggcggc cgcca 35
<210> 104
<211> 55
<212> DNA
<213> sta-ca r
<400> 104
gtaactggct taacacccat ggtactagtt tcgaataatt agttgttttt tgatc 55
<210> 105
<211> 30
<212> DNA
<213> tt-hp f
<400> 105
ttaagtgaga tcgagtgtgt ggaattgtga 30
<210> 106
<211> 20
<212> DNA
<213> inori r
<400> 106
gggagaaagg cggacaggta 20
<210> 107
<211> 20
<212> DNA
<213> inori f
<400> 107
tacctgtccg cctttctccc 20
<210> 108
<211> 37
<212> DNA
<213> hp-tt f
<400> 108
acacactcga tctcacttaa tcttctgtac tctgaag 37
<210> 109
<211> 51
<212> DNA
<213> paa-aox2 f
<400> 109
ttaattaacc cggggatccc tcgaggctta aaggactcca tttcctaaaa t 51
<210> 110
<211> 46
<212> DNA
<213> hh-aox2 r
<400> 110
tcatcagtga cagtctagag gtaccttttc tcagttgatt tgtttg 46
<210> 111
<211> 51
<212> DNA
<213> paa-icl1 f
<400> 111
ttaattaacc cggggatccc tcgagtcatc taacactttg tatagcacat c 51
<210> 112
<211> 55
<212> DNA
<213> hh-icl1 r
<400> 112
tcatcagtga cagtctagag gtacctcttg atatacttga tactgtgttc tttga 55
<210> 113
<211> 55
<212> DNA
<213> paa-gpm1 f
<400> 113
ttaattaacc cggggatccc tcgagccttg ggttattagt agtgtccgtt atttt 55
<210> 114
<211> 54
<212> DNA
<213> hh-gpm1 r
<400> 114
tcatcagtga cagtctagag gtacctgttt gtttgtgtaa ttgaaagttg ttac 54
<210> 115
<211> 50
<212> DNA
<213> paa-eno1 f
<400> 115
ttaattaacc cggggatccc tcgagatgaa agagtgagag gaaagtacct 50
<210> 116
<211> 60
<212> DNA
<213> hh-eno1 r
<400> 116
tcatcagtga cagtctagag gtacctttta gatgtagatt gttataattg tgtgtttcaa 60
<210> 117
<211> 50
<212> DNA
<213> paa-lra3 f
<400> 117
ttaattaacc cggggatccc tcgagaactg acagaatgac tgactcccta 50
<210> 118
<211> 56
<212> DNA
<213> hh-lra3 r
<400> 118
tcatcagtga cagtctagag gtaccatttt taggagataa aaattctggg gtaaat 56
<210> 119
<211> 59
<212> DNA
<213> paa-das1 f
<400> 119
ttaattaacc cggggatccc tcgagaataa aaaaacgtta tagaaagaaa ttggactac 59
<210> 120
<211> 56
<212> DNA
<213> hh-das1 r
<400> 120
tcatcagtga cagtctagag gtacctttgt tcgattattc tccagataaa atcaac 56
<210> 121
<211> 47
<212> DNA
<213> paa-thi11 f
<400> 121
ttaattaacc cggggatccc tcgagatctt ttcagcttca tcgtcag 47
<210> 122
<211> 54
<212> DNA
<213> hh-thi11 r
<400> 122
tcatcagtga cagtctagag gtaccgatga tttattgaag tttccaaagt tgag 54

Claims (17)

1.一种基于CRISPRi和CRISPRa的转录调控***,包括:
信号效应器件,其包括目标启动子以及与之操作性连接的目的基因;
CRISPRi阻遏器件,其靶向阻遏所述目标启动子,减弱目标启动子驱动的目的基因的表达;
CRISPRa激活器件,其靶向激活所述目标启动子,增强目标启动子驱动的目的基因的表达。
2.如权利要求1所述的转录调控***,其特征在于,所述CRISPRi阻遏器件包括:表达盒a,其表达基于CRISPR***的失活Cas蛋白1;及,表达盒b,其表达引导RNA即giRNA,所述giRNA引导所述失活Cas蛋白1至所述信号效应器件中的目标启动子区;
所述CRISPRa激活器件包括:表达盒c,其表达基于CRISPR***的失活Cas蛋白2与转录激活因子的融合多肽;及,表达盒d,其表达引导RNA即gaRNA或craRNA,所述gaRNA或craRNA引导所述失活Cas蛋白2至所述信号效应器件中的目标启动子区;
其中,所述失活Cas蛋白1与所述失活Cas蛋白2识别目标启动子序列中不同的PAM序列,相互正交;所述giRNA与gaRNA或craRNA能形成giRNA-gaRNA或giRNA-craRNA二聚体,相互作用以调控阻遏或激活作用的强弱;较佳地,所述gaRNA或craRNA与所述giRNA的部分序列互补以形成二聚体。
3.如权利要求2所述的转录调控***,其特征在于,所述giRNA包括区段a和Cas蛋白结合区a,所述区段a与所述信号效应器件中的目标启动子互补;所述gaRNA或craRNA包括区段b和Cas蛋白结合区b;所述区段b与区段a互补,或所述区段a或b与Cas蛋白结合区a或b互补结合。
4.如权利要求2所述的转录调控***,其特征在于,表达盒a中,包括启动子,其驱动失活Cas蛋白1的表达;较佳地,所述启动子包括:组成型启动子或诱导型启动子;更佳地,所述启动子包括:GAP启动子、ENO1启动子、GPM1启动子、ICL1启动子、AOX2启动子、TEF1启动子、PGK1启动子、GTH1启动子、DAS1启动子、FBA2启动子、THI11启动子、LRA3启动子;较佳地,表达盒a中的启动子不同于信号效应器件中的目标启动子;和/或
表达盒a中,所述失活Cas蛋白1为核酸酶活性缺失的Cas蛋白或其突变体;较佳地,为dCas9;较佳地,所述dCas9基因的核苷酸序列如SEQ ID NO:1所示或其简并的序列。
5.如权利要求2所述的转录调控***,其特征在于,表达盒b中,包括启动子,其驱动giRNA的表达;较佳地,所述启动子包括:组成型启动子或诱导型启动子;较佳地,所述组成型启动子包括:GAP启动子、ENO1启动子、GPM1启动子、TEF1启动子、PGK1启动子;较佳地,所述诱导型启动子包括:鼠李糖诱导型启动子、甲醇诱导型启动子、硫胺素饥饿诱导型启动子;更佳地,所述的鼠李糖诱导型启动子包括LRA3启动子,所述的甲醇诱导型启动子包括DAS1启动子、FBA2启动子,或所述的硫胺素饥饿诱导型启动子包括THI11启动子;较佳地,表达盒b中的启动子不同于信号效应器件中的目标启动子;和/或
表达盒b中,所述的giRNA引导表达盒a中失活Cas蛋白1至所述信号效应器件中的目标启动子区。
6.如权利要求2所述的转录调控***,其特征在于,表达盒c中,包括启动子,其驱动失活Cas蛋白2与转录激活因子的融合多肽的表达;较佳地,所述启动子包括:组成型启动子或诱导型启动子;更佳地,所述启动子包括:GAP启动子、ENO1启动子、GPM1启动子、ICL1启动子、AOX2启动子、TEF1启动子、PGK1启动子、GTH1启动子、DAS1启动子、FBA2启动子、THI11启动子、LRA3启动子;较佳地,表达盒c中的启动子不同于信号效应器件中的目标启动子;和/或
表达盒c中,所述失活Cas蛋白2为核酸酶活性缺失的Cas蛋白或其突变体;较佳地,包括VRER或dCpf1;较佳地,所述的VRER基因的核苷酸序列如SEQ ID NO:7所示或其简并的序列,所述的dCpf1基因的核苷酸序列如SEQ ID NO:8所示或其简并的序列。
7.如权利要求2所述的转录调控***,其特征在于,表达盒d中,包括启动子,其驱动gaRNA或craRNA的表达;较佳地,所述启动子包括:组成型启动子或诱导型启动子;较佳地,所述组成型启动子包括:GAP启动子、ENO1启动子、GPM1启动子、TEF1启动子、PGK1启动子;较佳地,所述诱导型启动子包括:鼠李糖诱导型启动子、甲醇诱导型启动子、硫胺素饥饿诱导型启动子;更佳地,所述的鼠李糖诱导型启动子包括LRA3启动子,所述的甲醇诱导型启动子包括DAS1启动子、FBA2启动子,或所述的硫胺素饥饿诱导型启动子包括THI11启动子;较佳地,表达盒d中的启动子不同于信号效应器件中的目标启动子;和/或
表达盒d中,所述的gaRNA或craRNA引导表达盒c中失活Cas蛋白2至所述信号效应器件中的目标启动子区。
8.如权利要求2或6所述的转录调控***,其特征在于,所述转录激活因子为具有独立招募RNA聚合酶能力的转录因子蛋白;较佳地,为VP16、VP64、VPR;较佳地,所述的VP16基因的核苷酸序列如SEQ ID NO:9所示或其简并的序列。
9.如权利要求2或3所述的转录调控***,其特征在于,所述giRNA的长度为50~300碱基;较佳地所述区段a位于giRNA的5’端,更佳地所述区段a长度为10~50碱基;较佳地所述区段b位于所述gaRNA的5’端或craRNA的3’端,其长度与所述区段a相应;
所述Cas蛋白结合区a或Cas蛋白结合区b在二级结构上具有至少1个茎环。
10.如权利要求2或3所述的转录调控***,其特征在于,所述目标启动子包括核心启动子,所述核心启动子为具备基础转录活性的最小启动子区域;较佳地,所述目标启动子包括:AOX1启动子或AOX1核心启动子;更佳地,所述的AOX1核心启动子序列如SEQ ID NO:28所示。
11.如权利要求10所述的转录调控***,其特征在于,所述目标启动子为AOX1启动子或AOX1核心启动子;所述giRNA所对应的DNA序列如SEQ ID NO:2~6任一所示;或
所述区段a所对应的DNA序列如SEQ ID NO:2中第1~21位、SEQ ID NO:3中第1~20位或SEQ ID NO:4中第1~20位所示;或
所述Cas蛋白结合区a所对应的DNA序列如SEQ ID NO:2中第22~101位或SEQ ID NO:6中第22~101位所示。
12.如权利要求11所述的转录调控***,其特征在于,所述gaRNA所对应的RNA序列如SEQ ID NO:10~12任一序列所示,较佳地如SEQ ID NO:11所示;所述craRNA所对应的RNA序列如SEQ ID NO:13~15任一序列所示,较佳地如SEQ ID NO:15所示;或
所述区段b所对应的DNA序列如SEQ ID NO:10中第1~21位、SEQ ID NO:11中第1~21位或SEQ ID NO:12中第1~91位所示;或如SEQ ID NO:13中第21~40位、SEQ ID NO:14中第21~42位或SEQ ID NO:15中第21~40位所示;或
所述Cas蛋白结合区b所对应的DNA序列如SEQ ID NO:10中第22~101位或SEQ ID NO:11中第22~101位所示;或如SEQ ID NO:13中第1~20位所示。
13.如权利要求1所述的转录调控***,其特征在于,所述的信号效应器件包括从5’到3’依次操作性连接的:gaRNA结合序列或craRNA结合序列、目标启动子和目的基因;较佳地,所述gaRNA结合序列或craRNA结合序列能以模板链或非模板链与对应的gaRNA或craRNA结合;其中,所述gaRNA结合序列如SEQ ID NO:16~21任一序列所示;所述craRNA结合序列如SEQ ID NO:22~27任一序列所示;或
所述的信号效应器件中还包括信号增益元件以及受其激活的中间启动子;较佳地,所述信号效应器件包括:(a)目标启动子和由其驱动表达的信号增益元件;及(b)能由所述信号增益元件激活的中间启动子和由其驱动表达的目的基因;更佳地,所述信号增益器件包括人工转录激活因子STA、杂合启动子HP,以及由HP驱动的目的基因。
14.权利要求1~13任一所述的转录调控***的应用,其特征在于,用于调控目的基因的表达强度;较佳地,包括弱化目的基因的表达或增强目的基因的表达。
15.一种调控目的基因表达的方法,其特征在于,所述方法包括:建立如权利要求1~13任一所述的转录调控***,根据目的基因的表达强度期望值,对其进行表达阻遏或表达激活。
16.如权利要求15所述的方法,其特征在于,所述CRISPRi阻遏器件中包括giRNA作为引导RNA,以dCas9作为失活Cas蛋白1;所述CRISPRi激活器件中包括gaRNA作为引导RNA,以VRER作为失活Cas蛋白2;当giRNA和gaRNA的不同强度表达时,所述目的基因发生不同强度的表达;或
所述CRISPRi阻遏器件中包括giRNA作为引导RNA,以dCas9作为失活Cas蛋白1;所述CRISPRi激活器件中包括craRNA作为引导RNA,以dCpf1作为失活Cas蛋白2;当giRNA和craRNA的不同强度表达时,所述目的基因发生不同强度的表达;或
所述CRISPRi阻遏器件中包括giRNA作为引导RNA、且以诱导型启动子控制其表达,以dCas9作为失活Cas蛋白1;所述CRISPRi激活器件中包括craRNA作为引导RNA,以dCpf1作为失活Cas蛋白2;当giRNA和craRNA的不同强度表达时,所述目的基因发生不同强度的表达;较佳地,所述诱导型启动子包括:鼠李糖诱导型启动子、甲醇诱导型启动子、硫胺素饥饿诱导型启动子。
17.一种用于调控目的基因表达的试剂盒,其特征在于,其中含有权利要求1~13任一所述的转录调控***。
CN202110901314.9A 2021-08-06 2021-08-06 基于CRISPRi和CRISPRa的转录调控***、其建立方法及应用 Pending CN115704040A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110901314.9A CN115704040A (zh) 2021-08-06 2021-08-06 基于CRISPRi和CRISPRa的转录调控***、其建立方法及应用
PCT/CN2022/110767 WO2023011659A1 (zh) 2021-08-06 2022-08-08 基于CRISPRi和CRISPRa的转录调控***、其建立方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110901314.9A CN115704040A (zh) 2021-08-06 2021-08-06 基于CRISPRi和CRISPRa的转录调控***、其建立方法及应用

Publications (1)

Publication Number Publication Date
CN115704040A true CN115704040A (zh) 2023-02-17

Family

ID=85154868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110901314.9A Pending CN115704040A (zh) 2021-08-06 2021-08-06 基于CRISPRi和CRISPRa的转录调控***、其建立方法及应用

Country Status (2)

Country Link
CN (1) CN115704040A (zh)
WO (1) WO2023011659A1 (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
UA124375C2 (uk) * 2014-03-14 2021-09-08 Кібус Юс Ллс Спосіб здійснення спрямованої генетичної зміни днк в клітині рослини з використанням нуклеази crispr і модифікованого gron
JP2017509350A (ja) * 2014-04-03 2017-04-06 マサチューセッツ インスティテュート オブ テクノロジー ガイドrnaの生成のための方法および組成物
US11254933B2 (en) * 2014-07-14 2022-02-22 The Regents Of The University Of California CRISPR/Cas transcriptional modulation
CN106978428A (zh) * 2017-03-15 2017-07-25 上海吐露港生物科技有限公司 一种Cas蛋白特异结合靶标DNA、调控靶标基因转录的方法及试剂盒
JP2021533773A (ja) * 2018-08-15 2021-12-09 ザイマージェン インコーポレイテッド ハイスループット代謝操作におけるCRISPRiの適用
WO2020123512A1 (en) * 2018-12-10 2020-06-18 The Board Of Trustees Of The Leland Stanford Junior University Anti-crispr-mediated control of genome editing and synthetic circuits in eukaryotic cells
WO2021021677A1 (en) * 2019-07-26 2021-02-04 The Regents Of The University Of California Control of mammalian gene dosage using crispr

Also Published As

Publication number Publication date
WO2023011659A1 (zh) 2023-02-09

Similar Documents

Publication Publication Date Title
CN113174389B (zh) 一种岷江百合诱导型启动子pr4及其应用
CN108118058B (zh) 一种改进的启动子及其应用
AU2005240741A1 (en) Methods for assembling multiple expression constructs
CN112410365B (zh) 伯克氏菌同源重组***及其应用
CN110499274B (zh) 一种基因工程红球菌及其构建方法与应用
JP5641297B2 (ja) 構成型プロモーター
JP2002539795A (ja) エンドウマメ由来のプラストシアニンpetEプロモータに基づいたキメラプロモータ
CA2438473C (en) Soybean isoflavone reductase 1 promoter
CN112226437B (zh) 梯度调控芽胞杆菌启动子启动效率的序列组合及应用
CN115704040A (zh) 基于CRISPRi和CRISPRa的转录调控***、其建立方法及应用
CN108823208B (zh) 一种四环素诱导启动子及其制备方法和应用
KR100917574B1 (ko) 톡소플라빈 분해 효소를 선별 마커로 이용한 형질전환 감자식물체 제조
CN111893118B (zh) 一种来源于甘蓝型油菜的双向启动子及其应用
EP2537928A1 (en) Novel promoter for use in transformation of algae
WO2020232734A1 (zh) 使不产毒微藻产生微囊藻毒素的方法及得到的产毒微藻
CN116875594B (zh) 乳酸片球菌高强度组合启动子的构建及应用
US10023619B1 (en) Production of spider silk protein in corn
CN114107309B (zh) 一种非天然茶碱rna分子开关
CN113817736B (zh) 一种具有群体感应特征的启动子及其应用
CN114908111B (zh) 连续克隆长dna片段的方法和***
CN114672488B (zh) 烟草维管组织启动子pNtAED3a及其应用
CN111893115B (zh) 一种低温和qs双重诱导型启动子及其应用
KR102010246B1 (ko) 미세조류 에틀리아 유래의 프로모터 및 이의 용도
CN115322998A (zh) 一种人工转录器件库的构建方法及应用
CN117126854A (zh) 一种生物膜形成调控基因及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication