CN112980709B - 一种工程菌株及其构建方法和应用 - Google Patents

一种工程菌株及其构建方法和应用 Download PDF

Info

Publication number
CN112980709B
CN112980709B CN201911285329.6A CN201911285329A CN112980709B CN 112980709 B CN112980709 B CN 112980709B CN 201911285329 A CN201911285329 A CN 201911285329A CN 112980709 B CN112980709 B CN 112980709B
Authority
CN
China
Prior art keywords
strain
cals
ldp1
delta
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911285329.6A
Other languages
English (en)
Other versions
CN112980709A (zh
Inventor
赵宗保
吕力婷
焦翔
张素芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Institute of Chemical Physics of CAS
Original Assignee
Dalian Institute of Chemical Physics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Institute of Chemical Physics of CAS filed Critical Dalian Institute of Chemical Physics of CAS
Priority to CN201911285329.6A priority Critical patent/CN112980709B/zh
Publication of CN112980709A publication Critical patent/CN112980709A/zh
Application granted granted Critical
Publication of CN112980709B publication Critical patent/CN112980709B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mycology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本申请公开了一种工程菌株,所述工程菌株为LDP1基因和CALs基因功能灭活的工程菌株ΔCALsΔLDP1。本申请提供了一种通过脂滴蛋白基因的敲除实现对脂滴大小调控的方法。本申请通过基因工程,实现调控脂滴大小并弱化油脂合成代谢途径,为天然产油酵母菌株工程改造,使代谢流更多地流向其他代谢途径,为萜类化合物的合成奠定了基础,将有力促进今后圆红冬孢酵母或其他产油酵母萜类化合物合成的代谢工程研究。

Description

一种工程菌株及其构建方法和应用
技术领域
本申请涉及一种工程菌株及其构建方法和应用,属于生物技术领域。
背景技术
自然界中存在一类酵母,它胞内能够积累超过自身细胞干重20%的油脂,这类酵母统称为产油酵母(Ratledge C,et al.Adv Appl Microbiol 2002, 51:1-51.)。圆红冬孢酵母是一株具有广泛应用前景的产油酵母,它能够生产两类具有工业价值的产物-类胡萝卜素与油脂,产量分别可以超过自身细胞干重的0.1%和60%。
圆红冬孢酵母中,油脂合成以柠檬酸的裂解产生的乙酰辅酶A为前体,先合成脂肪酸再转化成油脂,主要储存在脂滴中。目前,大家普遍认可脂滴起源于内质网,通过“出芽模型”生成(Walther TC,et al.Annu Rev Biochem 2012,81:687-714.)。内质网上存在许多与油脂合成相关的蛋白,这些蛋白催化生成的中性脂不能与内质网膜上的磷脂互溶,因此不断在磷脂层中的非极性区域积累,积累到一定程度后,内质网膜将其包裹,最终形成新的具有磷脂单分子层的细胞器-脂滴。脂滴从内质网上脱落的同时携带内质网膜上的相关蛋白,我们将其统称为脂滴蛋白。这些脂滴蛋白主要参与细胞代谢、蛋白合成与加工、线粒体功能与膜泡运输等功能。其中,有两个脂滴结构蛋白(类周脂素蛋白Ldp1与油体钙蛋白Cals),对脂滴形成与结构保持具有重要作用。脂滴作为能量的存储器,普遍存在于胞质中,充当中性脂质储库和脂质代谢的中枢。
随着从微生物中提取类胡萝卜素的兴起,红酵母作为一类天然生产类胡萝卜素的菌株逐渐引起了人们的关注。但是,野生型菌株中类胡萝卜素的含量非常低。目前通过基因工程提高β-胡萝卜素产量主要通过过表达类胡萝卜素合成途径中关键基因获得。在圆红冬孢酵母中通过2A序列连接,同时表达来源于三孢布拉霉三个β-胡萝卜素合成基因,得到的工程菌株中β-胡萝卜素的含量可以达到1.7mg/g DCW,相对于野生型菌株提高了4.5 倍(Jiao X,et al.Fems Yeast Res 2018,18(7),foy086)。但是,通过这种操作提高类胡萝卜素产量会受到一定的限制。因为在产油酵母圆红冬孢酵母中,即使过表达类胡萝卜素途径基因,乙酰-CoA前体还是主要流向油脂合成途径。那么通过基因编辑,灭活脂滴结构蛋白Ldp1与Cals,或许可以达到弱化油脂代谢的目的,从而使得代谢流更多的流向萜类合成。
因此,有必要提供一种调控脂滴大小并弱化油脂代谢的方法。
发明内容
根据本申请的第一方面,提供了一种工程菌株,该工程菌株中脂滴关键蛋白基因LDP1和CALs功能灭活,通过观察脂滴功能缺陷菌株中脂滴大小的变化,进一步揭示脂滴蛋白在油脂合成及储存中的重要作用及对天然产油酵母生长和代谢途径的影响。
所述工程菌株为LDP1基因和CALs基因功能灭活的工程菌株ΔCALsΔLDP1。
可选地,所述工程菌株ΔCALsΔLDP1的保藏编号为CGMCC:18930。
可选地,所述工程菌株ΔCALsΔLDP1为调控出发菌株中LDP1基因和 CALs基因的表达后所得。
可选地,所述出发菌株为天然产油酵母菌。
可选地,所述出发菌株包括圆红冬孢酵母Rhodosporidium toruloides。
可选地,所述出发菌株为表达Cas9蛋白的工程菌株。
根据本申请的第二方面,提供了一种工程菌株的构建方法,其特征在于,所述方法包括:敲除出发菌株基因组中LDP1基因和CAL s基因,得到LDP1和CALs功能灭活的所述工程菌株。
可选地,所述方法包括:(1)敲除出发菌株基因组中CALs基因,得到工程菌株ΔCALs;(2)敲除所述工程菌株ΔCALs基因组中LDP1基因,得到工程菌株ΔCALsΔLDP1。
可选地,所述步骤(1)包括:构建具有SEQ ID NO:1所示的核苷酸序列的CALs-sgRNA载体;将CALs-sgRNA载体导入表达Cas9蛋白的工程菌株,筛选、培养后得到所述工程菌株ΔCALs;
可选地,所述步骤(2)包括:构建具有SEQ ID NO:2所示的核苷酸序列的LDP1-sgRNA载体;将LDP1-sgRNA载体导入工程菌株ΔCALs,筛选、培养后得到工程菌株ΔCALsΔLDP1。
可选地,所述出发菌株为天然产油酵母菌;
可选地,所述出发菌株包括圆红冬孢酵母Rhodosporidium toruloides。
根据本申请的第三方面,提供了一种载体试剂盒,其特征在于,所述载体试剂盒包括具有SEQ ID NO:1所示的核苷酸序列的CALs-sgRNA载体和具有SEQ ID NO:2所示的核苷酸序列的LDP1-sgRNA载体中的至少一种。
根据本申请的第四方面,提供了根据本申请的第一方面提供的工程菌株或根据本申请的第二方面提供的构建方法构建的工程菌株在调控脂滴大小中的应用。
可选地,所述应用包括通过调控工程菌株中LDP1和CALs基因的表达水平来调控脂滴的大小。
本发明所述工程菌株缺少脂滴合成关键蛋白基因LDP1或CALs,显微镜观察到脂滴功能缺陷菌株中脂滴变化,进一步揭示脂滴蛋白在油脂合成及储存中的重要作用及对圆红冬孢酵母生长和代谢途径的影响,同时提供所述重组菌株的构建方法及应用。
为实现上述发明目的,本发明提供如下技术方案:
本发明中所敲除基因LDP1的详细序列及功能信息等可参见专利CN 103965307B中描述。
本申请以表达了Cas9蛋白的圆红冬孢酵母NP11-SaCas9作为出发菌株。
LDP1基因上选择靶位点进行载体设计,构建载体pZPK-PGPD-NAT- Tnos-U6b-LDP1-sgRNA;CALs基因上选择靶位点进行载体设计,构建载体pZPK-PGPD-HYG-Tnos-U6b-CALs-sgRNA。如上,抗性基因使用GPD启动子及Tnos终止子,靶基因guide序列使用RNA聚合酶III型启动子U6b 及sgRNA整合至同一基因元件中。以上sgRNA表达盒,均可通过农杆菌介导转化或电转化方法导入到目的菌株中。
本发明所述表达SaCas9的NP11工程菌株及敲除盒所用启动子及载体构建方法均可参见文献Jiao X,Zhang Y,Liu XJ,Zhang Q,Zhang SF,Zhao ZB.Biotechnol J,2019,1900036.及专利201910005293.5中记载,线性DNA 片段电转化方法可参见文献Liu HD,etal.FEMS Yeast Res,2017,17,fox017。
本发明通过利用特定的酵母内源基因以及外源基因进行基因元件、基因模块的构建,并转入到表达SaCas9的产油酵母基因组上,实现重组菌株油脂合成减少,同时将代谢流导向萜类化合物的生成,提高了类胡萝卜素的产量。其中,所涉及的酵母中的抗性标记、启动子和终止子,包括但不局限于NAT、HYG、GPD、Tnos、U6b,上述基因元件的获得可以红酵母基因组或其它携带相应元件的载体为模板,通过PCR扩增获得或进行人工基因合成;在本发明中,上述U6b启动子为圆红冬孢酵母菌株NP11 基因组中通过PCR扩增得到;而NAT及HYG抗性标记基因,GPD启动子及Tnos终止子从载体pZPK-PGPD-HYG-Tnos或pZPK-PGPD-NAT-Tnos通过PCR扩增得到,LDP1基因靶位点guide序列及sgRNA通过人工基因合成得到,再设计特异性引物进行RF克隆得到上述所用载体。
本发明所涉及的外源基因蛋白包括SaCas9来源于金黄色葡萄球菌(Staphylococcus aureus)通过密码子优化后人工合成并得到。密码子优化及全基因合成:遗传密码有64种,但生物对这些密码子的利用具有偏好性。因此在导入外源基因时,为降低其对翻译蛋白在异源***中表达的影响,需要根据圆红冬孢酵母的密码子偏好性对外源基因进行重新设计,即密码子优化。密码子优化及全基因合成均委托苏州泓迅生物科技股份有限公司进行,并连接于pUC57载体,以干粉质粒形式保存。通过对应的引物扩增SaCas9片段,然后通过EcoRV/SpeI双酶切目的片段与目标载体pZPK- PPGK-BLE-Tnos-PGPD-mcs-Thsp,通过DNA Ligation Kit试剂盒连接得到 pZPK-PPGK-BLE-Tnos-PGPD-SaCas9-Thsp。通过酶切连接得到的载体,直接转化到大肠杆菌电转感受态中。
将上述构建的质粒通过农杆菌介导转化导入到圆红冬孢酵母,具体步骤参考方法可参见文献Lin XP,et al.FEMS Yeast Res,2014,14,547-555。
作为优选,所述SaCas9的序列及功能信息详细记录在文献Jiao X, Zhang Y,LiuXJ,Zhang Q,Zhang SF,Zhao ZB.Biotechnol J,2019,1900036. 中。
本发明的另一个目的是提供一种调控圆红冬孢酵母工程菌株脂滴大小的方法,所述酵母为红冬孢酵母属(Rhodosporidium)圆红冬孢酵母 (Rhodosporidium toruloides)单倍体NP11。除此之外,也可以圆红冬孢酵母NP5-2为改造菌株将本发明所限定的基因元件和模块根据这些菌株的已被解析的脂滴蛋白基因序列进行敲除。
在本申请中,所用出发菌株为表达SaCas9的工程菌株,采用 CRISPR/Cas9***引导的非同源末端连接的修复机制。
在本申请的工程菌株的构建方法中,LDP1基因上选择靶位点进行载体设计,构建载体pZPK-PGPD-NAT-Tnos-U6b-LDP1-sgRNA;CALs基因上选择靶位点进行载体设计,构建载体pZPK-PGPD-HYG-Tnos-U6b-CALs- sgRNA。转化方法为ATMT和电转化方法。转化后对ΔCALs工程菌株的筛选在添加潮霉素的抗性平板上完成,对ΔLDP1及ΔCALsΔLDP1工程菌株的筛选在添加诺尔斯菌素的抗性平板上完成。所述抗性平板培养基为 YPD,并添加1.5%琼脂粉及50μg/mL头孢菌素,潮霉素或诺尔斯菌素添加量为10μg/mL。所述YPD培养基组成为20g/L葡萄糖、20g/L蛋白胨、 10g/L酵母浸粉,pH=6.0。
在本申请中,提供了一种弱化油脂代谢合成的方法,包括将工程菌株ΔCALsΔLDP1接种于培养基培养活化后,重新接种至发酵培养基中发酵培养,发酵结束后收集菌体细胞提取油脂,并通过荧光显微镜观测脂滴大小变化。具体地,将ΔCALsΔLDP1工程菌株接种于5mL YPD培养基活化24 h制备种子液,将种子液转接到新鲜的50mL限氮培养基,控制初始OD=2,发酵培养144h,所述限氮培养基为70g/L葡萄糖、0.75g/L酵母浸粉,0.1 g/L硫铵、1g/L磷酸二氢钾,1.5g/L结晶硫酸镁,痕量元素1%(V/V) (痕量元素储液组成4.0g/L结晶氯化钙,0.55g/L结晶硫酸亚铁,0.52g/L 一水合柠檬酸,0.1g/L结晶硫酸锌,0.076g/L结晶硫酸锰和100μL/L 18M 浓硫酸),pH=6.0。所述培养条件均为30℃、200rpm。发酵结束后油脂提取法为酸热法。发酵结束后取1mL发酵液,并添加尼罗红染料进行荧光观察。
本申请的构建方法通过构建LDP1或CALs目的基因的sgRNA表达载体,通过PCR扩增线性化sgRNA表达盒、电转化至表达了Cas9蛋白的圆红冬孢酵母工程菌,实现脂滴蛋白基因敲除,获得工程菌株ΔCALs与ΔLDP1;再通过PCR扩增LDP1-sgRNA表达盒、电转化至工程菌株ΔCALs,获得工程菌株ΔCALsΔLDP1;荧光观测显示敲除脂滴蛋白基因的工程菌株具有脂滴大小明显改变的特征,发酵后油脂产量显著减少。本发明能通过调节脂滴大小弱化油脂代谢途径,为天然产油酵母菌株工程改造,使代谢流更多地流向其他代谢途径,如萜类化合物的合成奠定了基础。
本发明涉及的专用名词的术语解释如下:
LDP1基因:产油酵母脂滴蛋白编码基因,具有促进脂滴融合、生长,增加脂滴内油脂积累,稳定脂滴形态与功能,参与油脂贮运和代谢调控相关的脂滴蛋白活性。
CALs基因:是一个caleosin家族蛋白编码基因,其中caleosin是脂滴 Ca2+结合蛋白,被命名为CALs,对天然产油酵母脂滴合成具有重要作用。
CRISPR/Cas9技术:有规律的成串的间隔短回文重复序列并与之相关联蛋白的免疫***(Clustered Regularly Interspaced Short Palindromic Repeats/CRISPR-Associated Systems CRISPR/Cas9)是第三类已报道的能够进行特异性基因编辑的技术。相比于ZFN与TALEN,CRISPR***以其操作方便、编辑高效、成本低廉等明显优势在所有的基因编辑技术中发展最快,也是目前应用最广泛的技术。
sgRNA:向导RNA(guide RNA,gRNA),也称为小向导RNA(small guide RNA,sgRNA)。是作用于动质体(kinetoplastid)体内一种称为RNA 编辑(RNA editing)的后转录修饰过程中。也是一种小型非编码RNA。可与pre-mRNA配对,并在其中***一些尿嘧啶(U),产生具有作用的mRNA。
敲除:基因敲除即通过现有技术对靶细胞基因组进行定点修饰,从而改造染色体上特定基因,令其丧失作用,从而使部分功能被屏蔽,并可进一步对生物体造成影响,进而推测出该基因的生物学功能。
本申请能产生的有益效果包括:
1)本申请通过调控出发菌株中的LDP1基因和CALs基因功能灭活,提供了一种工程菌株。
2)本申请提供的工程菌株脂滴合成关键蛋白基因LDP1和CALs功能灭活,显微镜检观察到脂滴功能缺陷菌株中脂滴变小,进一步揭示脂滴蛋白在油脂合成及储存中的重要作用及对天然产油酵母生长和代谢途径的影响。
3)本申请通过首先构建LDP1-sgRNA载体和CALs-sgRNA载体,然后将LDP1-sgRNA表达盒和CALs-sgRNA表达盒导入出发菌株,提供了一种工程菌株的构建方法。
4)本申请还提供了构建工程菌株的载体试剂盒。
5)本申请提供了一种通过脂滴基因的敲除实现对脂滴大小的调控。本申请通过基因工程,实现调控脂滴大小并弱化油脂合成代谢途径,为天然产油酵母菌株工程改造,使代谢流更多地流向其他代谢途径,为萜类化合物的合成奠定了基础,将有力促进今后圆红冬孢酵母或其他产油酵母萜类化合物合成的代谢工程研究。
附图说明
图1是根据本申请实施例1和实施例2构建的LDP1-sgRNA载体、 CALs-sgRNA载体组成示意图。
图2是根据本申请实施例3的圆红冬孢酵母NP11靶基因设计位点及敲除后序列缺失信息的示意图。
图3是根据本申请实施例3的出发菌株NP11-SaCas9及本发明ΔCALs、ΔLDP1、ΔCALsΔLDP1工程菌株发酵后油脂含量及生物量对比。
图4是根据本申请实施例3的出发菌株NP11-SaCas9及本发明ΔCALs、ΔLDP1、ΔCALsΔLDP1工程菌株在发酵结束后的脂滴染色图。
具体实施方式
下面结合实施例详述本申请,但本申请并不局限于这些实施例。
如无特别说明,本申请的实施例中的原料均通过商业途径购买。
本发明公开了一种调控产油酵母脂滴大小工程菌株的构建方法及其应用,本领域技术人员可以借鉴本文内容,适当改进工艺参数实现。特别需要指出的是,所有类似的替换和改动对本领域技术人员来说是显而易见的,它们都被视为包括在本发明。本发明所述方法和应用已经通过较佳实施例进行了描述,相关人员明显能在不脱离本发明内容、精神和范围内对本文所述的方法和应用进行改动或适当变更与组合,来实现和应用本发明技术。
下面结合附图及实施例对本发明作进一步说明,将有助于本领域的普通技术人员理解本发明,但不以任何形式限制本发明。下述实施例中所有引物合成及测序工作,如无特别说明则均由上海生工公司完成。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的实验材料,如无特殊说明,均为自常规生化试剂公司购买得到的。
圆红冬孢酵母(R.toruloides)CGMCC 2.1389:购自中国普通微生物菌种保藏中心(CGMCC,保藏号为CGMCC 2.1389)。
PrimeSTAR DNA聚合酶:购自大连TakaRa公司。
根癌农杆菌Agrobacterium tumefaciems AGL1(购自美国标准生物品收藏中心(ATCC),保藏编号为:ATCC BAA-100。
通过EVOS荧光显微镜观察进行荧光观测。
实施例1:LDP1-sgRNA载体构建
具体地,圆红冬孢酵母NP11的获得方法包括:圆红冬孢酵母 R.toruloides NP11单倍体菌株,为中科院大连化学物理研究所张素芳博士以木质纤维素水解液驯化的R.toruloides Y4(源自CGMCC 2.1389=CBS 6016=IFO 0559x IFO 0880)为母本菌株,通过产孢、冬孢子萌发、担孢子分离等操作得到,具体操作方法参见Nat.Commun.2012,3,1112,R. toruloides NP11单倍体保藏于广东省微生物菌种保藏中心,保藏号为 GDMCC2.224,公众可购买。
以圆红冬孢酵母NP11为例,设计引物用以扩增及克隆得到LPD1- sgRNA载体。所用的质粒全部采用RF克隆方法进行构建。以质粒pZPK- PGPD-NAT-Tnos-U6b-sgRNA为模板,利用引物Tnos-U6b-sgRNA-F/LPD1- sgRNA-R(见表1)扩增得到U6b-LPD1-sgRNA片段。然后通过RF克隆的方法将片段整合到目标载体,得到质粒pZPK-PGPD-NAT-Tnos-U6b-LDP1- sgRNA。
pZPK-PGPD-NAT-Tnos-U6b-sgRNA制备方法为:以圆红冬孢酵母NP11 基因组为模板,以Tnos-U6b-F(5’- GCAGCATGCAAGCTTGGAGCTTGAGCTTGGGGCGGGATGACCCAGC GCTTTCAC-3’)与U6-sgRNA-R(5’- TAACTTGCTATTTCTAGCTCTAAAACGTATGGGGCTCAGTAGGCAGTGTGGCTCGACGAACAAGTT-3’)扩增U6b启动子;sgRNA碱基序列由苏州泓迅生物科技股份有限公司合成。然后通过融合PCR,将扩增得到的 U6b序列与sgRNA连接,然后根据RF克隆方法整合到载体pZPK-PGPD- NAT-Tnos(FEMS Yeast Research 2014,14:547-555),得到载体pZPK-PGPD- NAT-Tnos-U6b-sgRNA。
质粒pZPK-PGPD-HYG-Tnos-U6b-sgRNA以pZPK-PGPD-HYG-Tnos为模版,用同样的构建方法与引物得到。
pZPK-PGPD-NAT-Tnos与pZPK-PGPD-HYG-Tnos的制备方法参考文献 XinPing Lin,etal.FEMS Yeast Research 2014,14:547-555。
RF克隆:5×PCR缓冲液10.0μL,dNTPs(10mM)1.0μL,上述扩增的片段300ng作为大引物(mega-primer),20ng质粒pZPK-PGPD-NAT- Tnos-U6b-sgRNA作为模板,PrimeSTAR DNA聚合酶(大连TakaRa)0.5 μL,ddH2O补加至50μL,于94℃保温3min,然后于98℃保温10s, 62℃10s,72℃10min,15个循环,72℃15min,4℃结束反应。
DpnI消化和电击转化:取8μL RF反应产物加入1μL DpnI(购自 TaKaRa)和1μLDpnI buffer,混匀后在37℃作用120min去除原pZPK- PGPD-NAT-Tnos-U6b-sgRNA质粒后,取10μL电击转化至100μL DH10B 感受态细胞,感受态细胞按标准方法制备(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版),电击转化参数:2200-2500 V,400Ω,25μF,0℃,4-8ms。电击后立即加入900μL LB培养液,于 37℃,200rpm复壮45min。随后将菌液涂布于卡那霉素抗性平板,10h 后挑选转化子进行增菌培养、质粒提取,并利用引物HSPT-R(5’- AGAGGAAAAGCGGACGACTG-3’)和PZPK-F(5’- GCTGGTGGCAGGATATATTG-3’)进行菌落PCR鉴定,鉴定阳性的重组载体送大连TakaRa进行测序,得到正确的载体。同时,该重组载体命名为LDP1-sgRNA。
LB培养基:10g/L氯化钠、10g/L蛋白胨、5g/L酵母浸粉,其余为水,pH=7.0。
卡那霉素抗性平板:上述LB培养基添加50μg/mL卡那霉素。
构建的LDP1-sgRNA载体具有如SEQ ID NO:2所示的核苷酸序列。
LDP1-sgRNA载体组成如图1所示。
表1构建载体所用引物序列表
Figure RE-GDA0002414342830000101
实施例2:CALs-sgRNA载体构建
以圆红冬孢酵母NP11为例,设计引物用以扩增及克隆得到CALs- sgRNA载体。以质粒pZPK-PGPD-HYG-Tnos-U6b-sgRNA为模板,利用引物Tnos-U6b-sgRNA-F/CALs-sgRNA-R(见表1)扩增得到U6b-CALs-sgRNA 片段。然后通过RF克隆的方法将片段整合到目标载体,得到质粒pZPK- PGPD-HYG-Tnos-U6b-CALs-sgRNA,如图1所示。
质粒pZPK-PGPD-HYG-Tnos-U6b-sgRNA以pZPK-PGPD-HYG-Tnos (XinPing Lin,etal.FEMS Yeast Research 2014,14:547-555)为模版,用实施例1所述同样的构建方法与引物得到。
载体pZPK-PGPD-HYG-Tnos构建方法同实施例1所述。
构建的CALs-sgRNA载体具有如SEQ ID NO:1所示的核苷酸序列。
CALs-sgRNA载体组成如图1所示。
实施例3:圆红冬孢酵母NP11脂滴功能缺陷工程菌株的构建
YPD培养基(种子培养基):20g/L葡萄糖、20g/L蛋白胨、10g/L酵母浸粉,其余为水,pH=6.0。
TMLSD培养基:10mM Tris-HCl,1mM MgCl2,100mM LiOAc,270 mM蔗糖,5mM DTT(过滤除菌分装,-20℃保存),0.22μM滤膜过滤除菌,pH 7.5。
TMS培养基:10mM Tris-HCl,1mM MgCl2,270mM蔗糖,0.22μM 滤膜过滤除菌,pH7.5。
TES缓冲液:300mM NaCl,50mM Tris-HCl,25mM EDTA,0.2%(V/V) SDS,2mg/ml蛋白酶K(用时再加入),pH=8.0。
TE缓冲液:10mM Tris-HCl,1mM EDTA,pH=8.0。
潮霉素抗性平板:20g/L葡萄糖、20g/L蛋白胨、10g/L酵母浸粉, 1.5%琼脂粉,潮霉素20μg/mL,头孢菌素300μg/mL,其余为水,pH=6.0。
诺尔斯菌素抗性平板:20g/L葡萄糖、20g/L蛋白胨、10g/L酵母浸粉,1.5%琼脂粉,诺尔斯菌素10μg/mL,头孢菌素300ug/mL,其余为水, pH=6.0。
LDP1的氨基酸序列如序列表中SEQ ID NO:3所示,LDP1基因gDNA 序列如SEQ IDNO:4所示,CALs的氨基酸序列如SEQ ID NO:5所示, CALs的基因gDNA序列如SEQ ID NO:6所示。
以圆红冬孢酵母NP11为例,NP11-SaCas9工程菌株为出发菌,构建 LDP1和CALs(RHTO_05627和RHTO_03414)基因敲除菌株ΔLDP1及ΔCALs;进而以工程菌株ΔCALs为出发菌,构建双基因敲除菌株ΔCALsΔLDP1。具体实施过程如下所述:
NP11-SaCas9工程菌株的构建:
通过引物EcoRV-Cas9-F(5’- CCGGATATCATGCACCACCATCACCAT CACGATAAGAAG)与Cas9-SpeI-R(5’-CGGACTAGTCTAGTGATGGT GATGGTGGTGGACCTTCCGCTTCTTCTTCGGATC-3’)扩增SaCas9片段,然后通过EcoRV/SpeI双酶切目的片段与目标载体pZPK-PPGK-BLE- Tnos -PGPD-mcs-Thsp,通过DNA Ligation Kit试剂盒连接得到pZPK-PPGK-BLE- Tnos-PGPD-SaCas9-Thsp。通过酶切连接得到的载体,直接转化到大肠杆菌电转感受态中。
将上述构建的质粒通过农杆菌介导转化导入到圆红冬孢酵母,得到 NP11-SaCas9工程菌株。具体步骤参考方法可参见文献Lin XP,et al.FEMS Yeast Res,2014,14,547-555。
首先将构建好的CALs-sgRNA载体通过电转化方法导入NP11-SaCas9,将菌体涂布于潮霉素抗性平板;筛选得到的转化子传5代进行稳定性验证;之后将稳定传代的工程菌株进行基因组DNA提取;用基因上下游引物: CALs-F(5’-ATGTCACCCTCTTACGCACAAGC-3’)与CALs-R(5’- CTTCACGGAAGGTCAAGCCGCCT-3’)对基因组DNA进行扩增,将得到的PCR产物进行测序,获得基因缺失型ΔCALs工程菌株,该基因缺失型ΔCALs工程菌株保藏在位于北京市朝阳区北辰西路1号院3号的中国微生物菌种保藏管理委员会普通微生物中心(CGMCC),保藏时间为2019年 11月8日,保藏编号为CGMCC No.18928,该保藏菌种的分类命名为:圆红冬孢酵母Rhodosporidium toruloides。
用上述同样方法将LDP1-sgRNA载体导入NP11-SaCas9,获得基因缺失型ΔLDP1工程菌株,该基因缺失型ΔLDP1工程菌株保藏在位于北京市朝阳区北辰西路1号院3号的中国微生物菌种保藏管理委员会普通微生物中心(CGMCC),保藏时间为2019年11月8日,保藏编号为CGMCC No.18929,该保藏菌种的分类命名为:圆红冬孢酵母Rhodosporidiumtoruloides;筛选平板为诺尔斯菌素抗性平板,扩增引物为LDP1-F(5’-CAAACAACGAGCACAGCGACAC-3’)与LDP1-R(5’- AAACCGAGAAGAAACCCGAAC-3’)。
用上述同样方法将LDP1-sgRNA载体导入工程菌株ΔCALs,获得双基因缺失型ΔCALsΔLDP1工程菌株,该基因缺失型ΔCALsΔLDP1工程菌株保藏在位于北京市朝阳区北辰西路1号院3号的中国微生物菌种保藏管理委员会普通微生物中心(CGMCC),保藏时间为2019年11月8日,保藏编号为CGMCC No.18930,该保藏菌种的分类命名为:圆红冬孢酵母Rhodosporidium toruloides;筛选平板为诺尔斯菌素抗性平板,扩增引物为 LDP1-F(5’-CAAACAACGAGCACAGCGACAC-3’)与LDP1-R(5’- AAACCGAGAAGAAACCCGAAC-3’)。
靶基因序列及测序比对结果如图2所示,靶基因上有碱基缺失代表实现了该基因及其功能敲除。
电转化方法参考文献(Liu HD,et al.FEMS Yeast Res,2017,17,fox017):将外源DNA电击转化到圆红冬孢酵母,首先需要制备圆红冬孢酵母的电转感受态细胞。将圆红冬孢酵母菌株从活化的平板上挑取单克隆接种到10 mL YPD培养基中,30℃,200rpm培养24h制备种子液。将种子液按照 1:100的比例接种到200mL YPD培养基中,30℃,200rpm培养7-8h至 OD600=1.0左右。4℃,4000g离心5min,弃上清。200mL新配制的TMLSD 重悬细胞,4℃,4000g离心5min,弃上清。100mL新配制的TMLSD 重悬细胞,25℃,50rpm孵育60min,4℃,1300g离心5min,弃上清。 100mL预冷的TMS洗涤沉淀,4℃,1300g离心5min,弃上清。重复洗涤一次。最后菌体用0.5mL预冷的TMS重悬沉淀。每100μL电转感受态细胞分装到2mL离心管中。将浓度大于800ng/μL的线性化载体加入 100μL电转感受态中,冰浴5-10min。然后将混合物转移到0.2cm已预冷的电转杯进行电击转化,电压700V。电击后马上加入1mL TMS,30℃静置培养2h进行复壮。600g,离心2min,弃上清,再加入1mL YPD培养基,30℃ 200rpm培养2h再次进行复壮。600g,离心2min,取适量的菌体涂布于相应的抗生素平板上,30℃培养直至转化子长出。
载体线性化方法:设计通用引物PZPK-F(启动子PGD上游100bp左右,5’-CCGGACTGATGGGCTGCCTG-3’)与PZPK-R(sgRNA下游100 bp左右,5’-ATCCCGAGGGGAACCCTGTG-3’),对构建载体进行PCR扩增并回收扩增产物。
基因组DNA提取方法(精编分子生物学实验指南):稳定性验证后的菌株在YPD培养基中,30℃培养24h。取2-5mL菌液,离心后用超纯水洗涤一遍。加入400μL TES缓冲液,适量玻璃珠,利用
Figure RE-GDA0002414342830000131
-24细胞破碎仪振荡1min,冰浴1min,重复2-3次。然后加入400μLTris饱和酚混合物(Tris饱和酚:氯仿:异戊醇=25:24:1),反复颠倒混匀后,室温静置5min。4℃,15000g离心10min,取200μL转移到新的1.5mL离心管中,加入1/10体积的醋酸钠(3M pH 5.2),2倍体积的冰冷的无水乙醇,-20℃沉淀30-60min。4℃,15000g离心10min,弃上清。沉淀用冰冷的75%乙醇洗涤后,离心晾干。加入适量TE缓冲液溶解,NanoDrop 测定浓度后备用。
实施例4:圆红冬孢酵母NP11脂滴功能缺陷工程菌株的摇瓶发酵
菌株:NP11(出发菌株,同实施例3)、NP11-SaCas9(出发菌株,同实施例3)、实施例3制备的工程菌株ΔCALs(保藏编号为:CGMCC 18928)、ΔLDP1(保藏编号为:CGMCC 18929)、ΔCALsΔLDP1(保藏编号为:CGMCC 18930)。
试验方法:
种子培养基:如实施例3所述。
限氮培养基:70g/L葡萄糖、0.75g/L酵母浸粉,0.1g/L硫酸铵、1g/L 磷酸二氢钾,1.5g/L结晶硫酸镁,其余为水,pH=6.0。
将上述菌株接种于5mL种子培养基活化24h制备种子液,将种子液转接到新鲜的50mL限氮培养基,并设置三个生物学平行;控制初始OD=2,在30℃、200rpm条件下培养144h,发酵培养后收集菌体细胞提取油脂并对脂滴染色进行荧光观测。
油脂提取方法:取30mL发酵液,离心烘干后计算生物量。然后采用酸热法提油。干菌体中加入5mL 4M盐酸,置于78℃水浴处理1.5h。冷却后加入等体积的氯仿/甲醇溶剂,涡旋振荡5min,8000g离心5min,将下层有机相转移至新的离心管中。上层再加入等体积的氯仿萃取,重复两次。收集的有机相中加入等体积的0.1%氯化钠溶液,涡旋振荡1min, 8000g离心5min,将下层有机相转移至盛有无水硫酸钠的玻璃漏斗中进行干燥,过程中不断添加氯仿,直至无水硫酸钠上面的红色全部消失。收集油脂的油瓶通过减压蒸馏除去溶剂,称重后计算油脂含量。
荧光观测方法:取1mL发酵液,8000g离心5min,弃上清。用1mL 超纯水重悬菌体,8000g离心5min,弃上清。添加50μL 20x尼罗红染料,染色5-10min。取适量菌体至于载玻片上,EVOS荧光显微镜观察(激发波长475nm,发射波长580nm)。
试验结果:由图3可知,发酵结束后,NP11-SaCas9在生物量或油脂含量上与野生型菌株NP11几乎一致,说明在NP11中表达SaCas9蛋白不会影响菌株生长及油脂代谢;工程菌株ΔCALs、ΔLDP1、ΔCALsΔLDP1与 NP11或NP11-SaCas9相比,在生物量及油脂含量上均有明显下降;其中,工程菌株ΔLDP1、ΔCALsΔLDP1平均油脂含量分别为0.42g/g与0.33g/g,相比出发菌株NP11-SaCas9的0.59g/g,分别下降29%与44%,油脂合成代谢弱化显著;对应的生物量分别减少25%与36%。图4示出了出发菌株 NP11-SaCas9及本发明ΔCALs、ΔLDP1、ΔCALsΔLDP1工程菌株在发酵结束后的脂滴染色图;其中,左侧为白光拍摄,中间为尼罗红染色拍摄,后侧为前二者合成图;绿色荧光区域代表脂滴范围。荧光染色成像结果显示,工程菌株ΔCALs、ΔLDP1、ΔCALsΔLDP1脂滴体积相比野生菌株NP11 或出发菌株NP11-SaCas9均有减小,且工程菌株ΔLDP1与ΔCALsΔLDP1 的脂滴减小显著(图4),与油脂含量的变化趋势相吻合,说明本发明所述的一种调控产油酵母脂滴大小的工程菌株构建方法具备可行性。
以上所述,仅是本申请的几个实施例,并非对本申请做任何形式的限制,虽然本申请以较佳实施例揭示如上,然而并非用以限制本申请,任何熟悉本专业的技术人员,在不脱离本申请技术方案的范围内,利用上述揭示的技术内容做出些许的变动或修饰均等同于等效实施案例,均属于技术方案范围内。
序列表
<110> 中国科学院大连化学物理研究所
<120> 一种工程菌株及其构建方法和应用
<130> DD190634I
<141> 2019-12-13
<160> 6
<170> SIPOSequenceListing 1.0
<210> 1
<211> 8746
<212> DNA
<213> synthetic
<400> 1
agtactttga tccaacccct ccgctgctat agtgcagtcg gcttctgacg ttcagtgcag 60
ccgtcttctg aaaacgacat gtcgcacaag tcctaagtta cgcgacaggc tgccgccctg 120
cccttttcct ggcgttttct tgtcgcgtgt tttagtcgca taaagtagaa tacttgcgac 180
tagaaccgga gacattacgc catgaacaag agcgccgccg ctggcctgct gggctatgcc 240
cgcgtcagca ccgacgacca ggacttgacc aaccaacggg ccgaactgca cgcggccggc 300
tgcaccaagc tgttttccga gaagatcacc ggcaccaggc gcgaccgccc ggagctggcc 360
aggatgcttg accacctacg ccctggcgac gttgtgacag tgaccaggct agaccgcctg 420
gcccgcagca cccgcgacct actggacatt gccgagcgca tccaggaggc cggcgcgggc 480
ctgcgtagcc tggcagagcc gtgggccgac accaccacgc cggccggccg catggtgttg 540
accgtgttcg ccggcattgc cgagttcgag cgttccctaa tcatcgaccg cacccggagc 600
gggcgcgagg ccgccaaggc ccgaggcgtg aagtttggcc cccgccctac cctcaccccg 660
gcacagatcg cgcacgcccg cgagctgatc gaccaggaag gccgcaccgt gaaagaggcg 720
gctgcactgc ttggcgtgca tcgctcgacc ctgtaccgcg cacttgagcg cagcgaggaa 780
gtgacgccca ccgaggccag gcggcgcggt gccttccgtg aggacgcatt gaccgaggcc 840
gacgccctgg cggccgccga gaatgaacgc caagaggaac aagcatgaaa ccgcaccagg 900
acggccagga cgaaccgttt ttcattaccg aagagatcga ggcggagatg atcgcggccg 960
ggtacgtgtt cgagccgccc gcgcacgtct caaccgtgcg gctgcatgaa atcctggccg 1020
gtttgtctga tgccaagctg gcggcctggc cggccagctt ggccgctgaa gaaaccgagc 1080
gccgccgtct aaaaaggtga tgtgtatttg agtaaaacag cttgcgtcat gcggtcgctg 1140
cgtatatgat gcgatgagta aataaacaaa tacgcaaggg gaacgcatga aggttatcgc 1200
tgtacttaac cagaaaggcg ggtcaggcaa gacgaccatc gcaacccatc tagcccgcgc 1260
cctgcaactc gccggggccg atgttctgtt agtcgattcc gatccccagg gcagtgcccg 1320
cgattgggcg gccgtgcggg aagatcaacc gctaaccgtt gtcggcatcg accgcccgac 1380
gattgaccgc gacgtgaagg ccatcggccg gcgcgacttc gtagtgatcg acggagcgcc 1440
ccaggcggcg gacttggctg tgtccgcgat caaggcagcc gacttcgtgc tgattccggt 1500
gcagccaagc ccttacgaca tatgggccac cgccgacctg gtggagctgg ttaagcagcg 1560
cattgaggtc acggatggaa ggctacaagc ggcctttgtc gtgtcgcggg cgatcaaagg 1620
cacgcgcatc ggcggtgagg ttgccgaggc gctggccggg tacgagctgc ccattcttga 1680
gtcccgtatc acgcagcgcg tgagctaccc aggcactgcc gccgccggca caaccgttct 1740
tgaatcagaa cccgagggcg acgctgcccg cgaggtccag gcgctggccg ctgaaattaa 1800
atcaaaactc atttgagtta atgaggtaaa gagaaaatga gcaaaagcac aaacacgcta 1860
agtgccggcc gtccgagcgc acgcagcagc aaggctgcaa cgttggccag cctggcagac 1920
acgccagcca tgaagcgggt caactttcag ttgccggcgg aggatcacac caagctgaag 1980
atgtacgcgg tacgccaagg caagaccatt accgagctgc tatctgaata catcgcgcag 2040
ctaccagagt aaatgagcaa atgaataaat gagtagatga attttagcgg ctaaaggagg 2100
cggcatggaa aatcaagaac aaccaggcac cgacgccgtg gaatgcccca tgtgtggagg 2160
aacgggcggt tggccaggcg taagcggctg ggttgtctgc cggccctgca atggcactgg 2220
aacccccaag cccgaggaat cggcgtgacg gtcgcaaacc atccggcccg gtacaaatcg 2280
gcgcggcgct gggtgatgac ctggtggaga agttgaaggc cgcgcaggcc gcccagcggc 2340
aacgcatcga ggcagaagca cgccccggtg aatcgtggca agcggccgct gatcgaatcc 2400
gcaaagaatc ccggcaaccg ccggcagccg gtgcgccgtc gattaggaag ccgcccaagg 2460
gcgacgagca accagatttt ttcgttccga tgctctatga cgtgggcacc cgcgatagtc 2520
gcagcatcat ggacgtggcc gttttccgtc tgtcgaagcg tgaccgacga gctggcgagg 2580
tgatccgcta cgagcttcca gacgggcacg tagaggtttc cgcagggccg gccggcatgg 2640
ccagtgtgtg ggattacgac ctggtactga tggcggtttc ccatctaacc gaatccatga 2700
accgataccg ggaagggaag ggagacaagc ccggccgcgt gttccgtcca cacgttgcgg 2760
acgtactcaa gttctgccgg cgagccgatg gcggaaagca gaaagacgac ctggtagaaa 2820
cctgcattcg gttaaacacc acgcacgttg ccatgcagcg tacgaagaag gccaagaacg 2880
gccgcctggt gacggtatcc gagggtgaag ccttgattag ccgctacaag atcgtaaaga 2940
gcgaaaccgg gcggccggag tacatcgaga tcgagctagc tgattggatg taccgcgaga 3000
tcacagaagg caagaacccg gacgtgctga cggttcaccc cgattacttt ttgatcgatc 3060
ccggcatcgg ccgttttctc taccgcctgg cacgccgcgc cgcaggcaag gcagaagcca 3120
gatggttgtt caagacgatc tacgaacgca gtggcagcgc cggagagttc aagaagttct 3180
gtttcaccgt gcgcaagctg atcgggtcaa atgacctgcc ggagtacgat ttgaaggagg 3240
aggcggggca ggctggcccg atcctagtca tgcgctaccg caacctgatc gagggcgaag 3300
catccgccgg ttcctaatgt acggagcaga tgctagggca aattgcccta gcaggggaaa 3360
aaggtcgaaa aggtctcttt cctgtggata gcacgtacat tgggaaccca aagccgtaca 3420
ttgggaaccg gaacccgtac attgggaacc caaagccgta cattgggaac cggtcacaca 3480
tgtaagtgac tgatataaaa gagaaaaaag gcgatttttc cgcctaaaac tctttaaaac 3540
ttattaaaac tcttaaaacc cgcctggcct gtgcataact gtctggccag cgcacagccg 3600
aagagctgca aaaagcgcct acccttcggt cgctgcgctc cctacgcccc gccgcttcgc 3660
gtcggcctat cgcggccgct ggccgctcaa aaatggctgg cctacggcca ggcaatctac 3720
cagggcgcgg acaagccgcg ccgtcgccac tcgaccgccg gcgcccacat caaggcaccc 3780
tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg 3840
gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg 3900
ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac gtagcgatag cggagtgtat 3960
actggcttaa ctatgcggca tcagagcaga ttgtactgag agtgcaccat atgcggtgtg 4020
aaataccgca cagatgcgta aggagaaaat accgcatcag gcgctcttcc gcttcctcgc 4080
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 4140
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 4200
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 4260
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 4320
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 4380
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 4440
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 4500
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 4560
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 4620
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 4680
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 4740
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 4800
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 4860
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agccatattc 4920
aacgggaaac gtcttgctct aggccgcgat taaattccaa catggatgct gatttatatg 4980
ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat cgattgtatg 5040
ggaagcccga tgcgccagag ttgtttctga aacatggcaa aggtagcgtt gccaatgatg 5100
ttacagatga gatggtcaga ctaaactggc tgacggaatt tatgcctctt ccgaccatca 5160
agcattttat ccgtactcct gatgatgcat ggttactcac cactgcgatc cccgggaaaa 5220
cagcattcca ggtattagaa gaatatcctg attcaggtga aaatattgtt gatgcgctgg 5280
cagtgttcct gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt aacagcgatc 5340
gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa cggtttggtt gatgcgagtg 5400
attttgatga cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa atgcataaac 5460
ttttgccatt ctcaccggat tcagtcgtca ctcatggtga tttctcactt gataacctta 5520
tttttgacga ggggaaatta ataggttgta ttgatgttgg acgagtcgga atcgcagacc 5580
gataccagga tcttgccatc ctatggaact gcctcggtga gttttctcct tcattacaga 5640
aacggctttt tcaaaaatat ggtattgata atcctgatat gaataaattg cagtttcatt 5700
tgatgctcga tgagtttttc taatcacagg cagcaacgct ctgtcatcgt tacaatcaac 5760
atgctaccct ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc 5820
gaatagcatc ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc 5880
gtcccggact gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg 5940
gagctgttgg ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca 6000
acttaataac acattgcgga cgtttttaat gtactgaatt aacgccgaat tgaattcgag 6060
ctcggtacct ggagttcgac gttctcctcg ctccgcaagc attggaatga accttgctct 6120
ctagttccct cctccgtgac ctcgtttcgt cctttagacg gcacgatgga aggaagaaat 6180
ctctgcggac aagcaaatct gctggctcgc cttgtaggtc gcctaccgga gcaagccttg 6240
tgccgccggg atgccaacgt cgttttttga cgtttgcaag acgtagagga cgcttcggac 6300
gacgaaacaa gctgtgagga catggaagtc gtgggaggaa cggcgcagag cggcgccgcg 6360
ggagcataag gcaagcgaga tagtccagaa atcgcggcgc caagtacagt aatttattgg 6420
agcaggcacc agaagcgggc agcagtatgc gcaggcttgg ggtcgacgag agacgactcc 6480
ctcatactcg gttacctcga gcaatacaat caatcgaagc tgcgcgaatc tcggcttgta 6540
agggtcggaa aggaacctcg gagatggcca cgtcacatca ccaacttatc gatctcagcc 6600
gacgtcgcag agagggcgag cgaagcggtg aaggagggaa acaatccctc gagagcatga 6660
tccgtctgaa tctgcagcgc aggaagccgt cacacgcccg cctcgagcgc aggtcgggtc 6720
cagccggggg acgaaacgcg cgagggctga tttcgtgagc gaaggaagcc gcatcgacaa 6780
gttcgcgtcc ctttgccctc tttcccatca cccgctctcg ctctacccgc tcagaacaac 6840
accagatcag tcacaatgcc ggagctcacg gcgacgtcgg tcgagaagtt cctcatcgaa 6900
aagttcgact cggtctcgga cctcatgcaa ctctcggagg gagaggaatc gcgcgcgttc 6960
tcgttcgacg tcggaggccg cggatacgtc ctccgcgtca actcgtgtgc ggacggattc 7020
tacaaggatc ggtacgtcta ccgccatttt gcgtcggcgg cgctcccgat ccccgaagtc 7080
ctcgacatcg gagagttctc ggaatccctc acgtactgta tctcgcgccg ggcgcaagga 7140
gtcacgctcc aagatctccc ggagacggaa ctcccggcgg tcctccaacc ggtcgcggaa 7200
gcgatggacg cgatcgcggc cgcggacctc tcgcaaacgt cgggattcgg accgtttgga 7260
ccgcaaggaa tcggacaata cacgacgtgg cgcgacttca tctgtgcgat cgcggatccc 7320
catgtctacc actggcaaac ggtcatggat gacacggtct cggcgtcggt cgcgcaagcg 7380
ctcgacgagc tcatgctctg ggcggaggac tgtccggagg tccgccacct cgtccacgcg 7440
gactttggat cgaacaacgt cctcacggac aacggacgca tcacggcggt catcgactgg 7500
tcggaggcga tgtttggaga ctcgcaatac gaggtcgcga acatcttctt ctggcgcccg 7560
tggctcgcgt gcatggagca acagacgcgc tacttcgagc gccgccaccc ggagctcgcg 7620
ggatcgccgc gcctccgcgc gtacatgctc cgcatcggcc tcgaccaact ctaccagtcg 7680
ctcgtcgacg gaaacttcga cgatgccgcg tgggcccaag gacgctgcga cgcgattgtc 7740
cgctcgggag cgggaaccgt gggacgcacg caaattgcgc ggcgctcggc ggccgtctgg 7800
acggatggat gtgtcgaagt cctcgcggat tcgggaaacc ggcgcccgtc gacgcgcccg 7860
cgggcgaaag aacaccacca tcaccatcac taggatcgtt caaacatttg gcaataaagt 7920
ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat 7980
tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt 8040
atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca 8100
aactaggata aattatcgcg cgcggtgtca tctatgttac tagatcgggc ctggatcctc 8160
tagagtcgac ctgcagcatg caagcttgga gcttgagctt ggggcgggat gacccagcgc 8220
tttcaccctc gcctgaccgg gcgctctcac cgtcgtcggc tgcgctcgct cgagacgacg 8280
ccgccgactc gccgcgctac cactcgtcgt cgtcaacccc ccaaaaagcc aggcctttat 8340
aagcagattc gctgcgtcga cctcagcacc cctacggggg ttgcatacaa taaacttgtt 8400
cgtcgagcca catgcacgga tatcttccag cgacttcggt cttggaggag cacgatgtcc 8460
cgggcgtttt agagctagaa atagcaagtt aaaataaggc tagtccgtta tcaacttgaa 8520
aaagtggcac cgagtcggtg gtgctttttt tgttttttat gtctatcaga ttgtcgtttc 8580
ccgccttcag tttaaactat cagtgtttga caggatatat tggcgggtaa acctaagaga 8640
aaagagcgtt tattagaata atcggatatt taaaagggcg tgaaaaggtt tatccgttcg 8700
tccatttgta tgtgcatgcc aaccacaggg ttcccctcgg gatcaa 8746
<210> 2
<211> 8746
<212> DNA
<213> synthetic
<400> 2
agtactttga tccaacccct ccgctgctat agtgcagtcg gcttctgacg ttcagtgcag 60
ccgtcttctg aaaacgacat gtcgcacaag tcctaagtta cgcgacaggc tgccgccctg 120
cccttttcct ggcgttttct tgtcgcgtgt tttagtcgca taaagtagaa tacttgcgac 180
tagaaccgga gacattacgc catgaacaag agcgccgccg ctggcctgct gggctatgcc 240
cgcgtcagca ccgacgacca ggacttgacc aaccaacggg ccgaactgca cgcggccggc 300
tgcaccaagc tgttttccga gaagatcacc ggcaccaggc gcgaccgccc ggagctggcc 360
aggatgcttg accacctacg ccctggcgac gttgtgacag tgaccaggct agaccgcctg 420
gcccgcagca cccgcgacct actggacatt gccgagcgca tccaggaggc cggcgcgggc 480
ctgcgtagcc tggcagagcc gtgggccgac accaccacgc cggccggccg catggtgttg 540
accgtgttcg ccggcattgc cgagttcgag cgttccctaa tcatcgaccg cacccggagc 600
gggcgcgagg ccgccaaggc ccgaggcgtg aagtttggcc cccgccctac cctcaccccg 660
gcacagatcg cgcacgcccg cgagctgatc gaccaggaag gccgcaccgt gaaagaggcg 720
gctgcactgc ttggcgtgca tcgctcgacc ctgtaccgcg cacttgagcg cagcgaggaa 780
gtgacgccca ccgaggccag gcggcgcggt gccttccgtg aggacgcatt gaccgaggcc 840
gacgccctgg cggccgccga gaatgaacgc caagaggaac aagcatgaaa ccgcaccagg 900
acggccagga cgaaccgttt ttcattaccg aagagatcga ggcggagatg atcgcggccg 960
ggtacgtgtt cgagccgccc gcgcacgtct caaccgtgcg gctgcatgaa atcctggccg 1020
gtttgtctga tgccaagctg gcggcctggc cggccagctt ggccgctgaa gaaaccgagc 1080
gccgccgtct aaaaaggtga tgtgtatttg agtaaaacag cttgcgtcat gcggtcgctg 1140
cgtatatgat gcgatgagta aataaacaaa tacgcaaggg gaacgcatga aggttatcgc 1200
tgtacttaac cagaaaggcg ggtcaggcaa gacgaccatc gcaacccatc tagcccgcgc 1260
cctgcaactc gccggggccg atgttctgtt agtcgattcc gatccccagg gcagtgcccg 1320
cgattgggcg gccgtgcggg aagatcaacc gctaaccgtt gtcggcatcg accgcccgac 1380
gattgaccgc gacgtgaagg ccatcggccg gcgcgacttc gtagtgatcg acggagcgcc 1440
ccaggcggcg gacttggctg tgtccgcgat caaggcagcc gacttcgtgc tgattccggt 1500
gcagccaagc ccttacgaca tatgggccac cgccgacctg gtggagctgg ttaagcagcg 1560
cattgaggtc acggatggaa ggctacaagc ggcctttgtc gtgtcgcggg cgatcaaagg 1620
cacgcgcatc ggcggtgagg ttgccgaggc gctggccggg tacgagctgc ccattcttga 1680
gtcccgtatc acgcagcgcg tgagctaccc aggcactgcc gccgccggca caaccgttct 1740
tgaatcagaa cccgagggcg acgctgcccg cgaggtccag gcgctggccg ctgaaattaa 1800
atcaaaactc atttgagtta atgaggtaaa gagaaaatga gcaaaagcac aaacacgcta 1860
agtgccggcc gtccgagcgc acgcagcagc aaggctgcaa cgttggccag cctggcagac 1920
acgccagcca tgaagcgggt caactttcag ttgccggcgg aggatcacac caagctgaag 1980
atgtacgcgg tacgccaagg caagaccatt accgagctgc tatctgaata catcgcgcag 2040
ctaccagagt aaatgagcaa atgaataaat gagtagatga attttagcgg ctaaaggagg 2100
cggcatggaa aatcaagaac aaccaggcac cgacgccgtg gaatgcccca tgtgtggagg 2160
aacgggcggt tggccaggcg taagcggctg ggttgtctgc cggccctgca atggcactgg 2220
aacccccaag cccgaggaat cggcgtgacg gtcgcaaacc atccggcccg gtacaaatcg 2280
gcgcggcgct gggtgatgac ctggtggaga agttgaaggc cgcgcaggcc gcccagcggc 2340
aacgcatcga ggcagaagca cgccccggtg aatcgtggca agcggccgct gatcgaatcc 2400
gcaaagaatc ccggcaaccg ccggcagccg gtgcgccgtc gattaggaag ccgcccaagg 2460
gcgacgagca accagatttt ttcgttccga tgctctatga cgtgggcacc cgcgatagtc 2520
gcagcatcat ggacgtggcc gttttccgtc tgtcgaagcg tgaccgacga gctggcgagg 2580
tgatccgcta cgagcttcca gacgggcacg tagaggtttc cgcagggccg gccggcatgg 2640
ccagtgtgtg ggattacgac ctggtactga tggcggtttc ccatctaacc gaatccatga 2700
accgataccg ggaagggaag ggagacaagc ccggccgcgt gttccgtcca cacgttgcgg 2760
acgtactcaa gttctgccgg cgagccgatg gcggaaagca gaaagacgac ctggtagaaa 2820
cctgcattcg gttaaacacc acgcacgttg ccatgcagcg tacgaagaag gccaagaacg 2880
gccgcctggt gacggtatcc gagggtgaag ccttgattag ccgctacaag atcgtaaaga 2940
gcgaaaccgg gcggccggag tacatcgaga tcgagctagc tgattggatg taccgcgaga 3000
tcacagaagg caagaacccg gacgtgctga cggttcaccc cgattacttt ttgatcgatc 3060
ccggcatcgg ccgttttctc taccgcctgg cacgccgcgc cgcaggcaag gcagaagcca 3120
gatggttgtt caagacgatc tacgaacgca gtggcagcgc cggagagttc aagaagttct 3180
gtttcaccgt gcgcaagctg atcgggtcaa atgacctgcc ggagtacgat ttgaaggagg 3240
aggcggggca ggctggcccg atcctagtca tgcgctaccg caacctgatc gagggcgaag 3300
catccgccgg ttcctaatgt acggagcaga tgctagggca aattgcccta gcaggggaaa 3360
aaggtcgaaa aggtctcttt cctgtggata gcacgtacat tgggaaccca aagccgtaca 3420
ttgggaaccg gaacccgtac attgggaacc caaagccgta cattgggaac cggtcacaca 3480
tgtaagtgac tgatataaaa gagaaaaaag gcgatttttc cgcctaaaac tctttaaaac 3540
ttattaaaac tcttaaaacc cgcctggcct gtgcataact gtctggccag cgcacagccg 3600
aagagctgca aaaagcgcct acccttcggt cgctgcgctc cctacgcccc gccgcttcgc 3660
gtcggcctat cgcggccgct ggccgctcaa aaatggctgg cctacggcca ggcaatctac 3720
cagggcgcgg acaagccgcg ccgtcgccac tcgaccgccg gcgcccacat caaggcaccc 3780
tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg 3840
gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg 3900
ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac gtagcgatag cggagtgtat 3960
actggcttaa ctatgcggca tcagagcaga ttgtactgag agtgcaccat atgcggtgtg 4020
aaataccgca cagatgcgta aggagaaaat accgcatcag gcgctcttcc gcttcctcgc 4080
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 4140
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 4200
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 4260
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 4320
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 4380
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 4440
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 4500
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 4560
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 4620
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 4680
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 4740
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 4800
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 4860
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agccatattc 4920
aacgggaaac gtcttgctct aggccgcgat taaattccaa catggatgct gatttatatg 4980
ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat cgattgtatg 5040
ggaagcccga tgcgccagag ttgtttctga aacatggcaa aggtagcgtt gccaatgatg 5100
ttacagatga gatggtcaga ctaaactggc tgacggaatt tatgcctctt ccgaccatca 5160
agcattttat ccgtactcct gatgatgcat ggttactcac cactgcgatc cccgggaaaa 5220
cagcattcca ggtattagaa gaatatcctg attcaggtga aaatattgtt gatgcgctgg 5280
cagtgttcct gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt aacagcgatc 5340
gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa cggtttggtt gatgcgagtg 5400
attttgatga cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa atgcataaac 5460
ttttgccatt ctcaccggat tcagtcgtca ctcatggtga tttctcactt gataacctta 5520
tttttgacga ggggaaatta ataggttgta ttgatgttgg acgagtcgga atcgcagacc 5580
gataccagga tcttgccatc ctatggaact gcctcggtga gttttctcct tcattacaga 5640
aacggctttt tcaaaaatat ggtattgata atcctgatat gaataaattg cagtttcatt 5700
tgatgctcga tgagtttttc taatcacagg cagcaacgct ctgtcatcgt tacaatcaac 5760
atgctaccct ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc 5820
gaatagcatc ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc 5880
gtcccggact gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg 5940
gagctgttgg ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca 6000
acttaataac acattgcgga cgtttttaat gtactgaatt aacgccgaat tgaattcgag 6060
ctcggtacct ggagttcgac gttctcctcg ctccgcaagc attggaatga accttgctct 6120
ctagttccct cctccgtgac ctcgtttcgt cctttagacg gcacgatgga aggaagaaat 6180
ctctgcggac aagcaaatct gctggctcgc cttgtaggtc gcctaccgga gcaagccttg 6240
tgccgccggg atgccaacgt cgttttttga cgtttgcaag acgtagagga cgcttcggac 6300
gacgaaacaa gctgtgagga catggaagtc gtgggaggaa cggcgcagag cggcgccgcg 6360
ggagcataag gcaagcgaga tagtccagaa atcgcggcgc caagtacagt aatttattgg 6420
agcaggcacc agaagcgggc agcagtatgc gcaggcttgg ggtcgacgag agacgactcc 6480
ctcatactcg gttacctcga gcaatacaat caatcgaagc tgcgcgaatc tcggcttgta 6540
agggtcggaa aggaacctcg gagatggcca cgtcacatca ccaacttatc gatctcagcc 6600
gacgtcgcag agagggcgag cgaagcggtg aaggagggaa acaatccctc gagagcatga 6660
tccgtctgaa tctgcagcgc aggaagccgt cacacgcccg cctcgagcgc aggtcgggtc 6720
cagccggggg acgaaacgcg cgagggctga tttcgtgagc gaaggaagcc gcatcgacaa 6780
gttcgcgtcc ctttgccctc tttcccatca cccgctctcg ctctacccgc tcagaacaac 6840
accagatcag tcacaatgcc ggagctcacg gcgacgtcgg tcgagaagtt cctcatcgaa 6900
aagttcgact cggtctcgga cctcatgcaa ctctcggagg gagaggaatc gcgcgcgttc 6960
tcgttcgacg tcggaggccg cggatacgtc ctccgcgtca actcgtgtgc ggacggattc 7020
tacaaggatc ggtacgtcta ccgccatttt gcgtcggcgg cgctcccgat ccccgaagtc 7080
ctcgacatcg gagagttctc ggaatccctc acgtactgta tctcgcgccg ggcgcaagga 7140
gtcacgctcc aagatctccc ggagacggaa ctcccggcgg tcctccaacc ggtcgcggaa 7200
gcgatggacg cgatcgcggc cgcggacctc tcgcaaacgt cgggattcgg accgtttgga 7260
ccgcaaggaa tcggacaata cacgacgtgg cgcgacttca tctgtgcgat cgcggatccc 7320
catgtctacc actggcaaac ggtcatggat gacacggtct cggcgtcggt cgcgcaagcg 7380
ctcgacgagc tcatgctctg ggcggaggac tgtccggagg tccgccacct cgtccacgcg 7440
gactttggat cgaacaacgt cctcacggac aacggacgca tcacggcggt catcgactgg 7500
tcggaggcga tgtttggaga ctcgcaatac gaggtcgcga acatcttctt ctggcgcccg 7560
tggctcgcgt gcatggagca acagacgcgc tacttcgagc gccgccaccc ggagctcgcg 7620
ggatcgccgc gcctccgcgc gtacatgctc cgcatcggcc tcgaccaact ctaccagtcg 7680
ctcgtcgacg gaaacttcga cgatgccgcg tgggcccaag gacgctgcga cgcgattgtc 7740
cgctcgggag cgggaaccgt gggacgcacg caaattgcgc ggcgctcggc ggccgtctgg 7800
acggatggat gtgtcgaagt cctcgcggat tcgggaaacc ggcgcccgtc gacgcgcccg 7860
cgggcgaaag aacaccacca tcaccatcac taggatcgtt caaacatttg gcaataaagt 7920
ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat 7980
tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt 8040
atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca 8100
aactaggata aattatcgcg cgcggtgtca tctatgttac tagatcgggc ctggatcctc 8160
tagagtcgac ctgcagcatg caagcttgga gcttgagctt ggggcgggat gacccagcgc 8220
tttcaccctc gcctgaccgg gcgctctcac cgtcgtcggc tgcgctcgct cgagacgacg 8280
ccgccgactc gccgcgctac cactcgtcgt cgtcaacccc ccaaaaagcc aggcctttat 8340
aagcagattc gctgcgtcga cctcagcacc cctacggggg ttgcatacaa taaacttgtt 8400
cgtcgagcca catgcacgga tatcttccag cgacttcggt cttgtcgaga gggtgtcttt 8460
gatcagtttt agagctagaa atagcaagtt aaaataaggc tagtccgtta tcaacttgaa 8520
aaagtggcac cgagtcggtg gtgctttttt tgttttttat gtctatcaga ttgtcgtttc 8580
ccgccttcag tttaaactat cagtgtttga caggatatat tggcgggtaa acctaagaga 8640
aaagagcgtt tattagaata atcggatatt taaaagggcg tgaaaaggtt tatccgttcg 8700
tccatttgta tgtgcatgcc aaccacaggg ttcccctcgg gatcaa 8746
<210> 3
<211> 265
<212> PRT
<213> Rhodosporidium toruloides
<400> 3
Met Ala Thr Val Asn Glu Lys Gln Pro Ala Thr Asp Ala Pro Leu Ala
1 5 10 15
His Glu Thr Ala Ile His Arg Ala Leu Asp Tyr Pro Val Ile Lys Asp
20 25 30
Thr Leu Ser Thr Phe Asp His Tyr Ala His Ser His Pro Tyr Ile Ser
35 40 45
Ser Leu Tyr Ser Arg Thr Leu Ser Leu Ser Arg Gln Ile Leu Ala His
50 55 60
Val Gln Pro Val Leu Pro Leu Glu Leu Ala Asp Gln Tyr Ala Asn Lys
65 70 75 80
Thr Leu Asp Val Val Glu Lys Tyr Val Pro Gln Val Lys Met Glu Thr
85 90 95
Gly Glu Leu Ile Gly Lys Ala Arg Gly Pro Ala Asp Ala Ala Phe Gln
100 105 110
Thr Ala Gln Glu Tyr Arg Gln Gly Ile Gln Ser Arg Ile Ser Pro Val
115 120 125
Thr Asp Gln Leu Tyr Gln Arg Ile Thr Thr Ser Gln Ala His Leu Ser
130 135 140
Ser Leu Gln Asp Arg Leu Gln Lys Thr Ile Lys Gln Leu Pro His Asp
145 150 155 160
Thr Glu Ser Leu Gln Ser Thr Leu His Ser Ile Leu Asn Glu Val Asp
165 170 175
Gly Leu Val Lys Ser Ala Gln Ser Ile Pro Ala Asn Ala Gln Ala Thr
180 185 190
Ala Lys Pro Val Phe Asp Gly Val Val Glu Ala Ala Asp His Ile Arg
195 200 205
Lys Glu Val Thr Arg Thr Asp Ile Pro Met Gly Ala Arg Ala Gln Asn
210 215 220
Val Leu Thr Tyr Thr Gln Asp Arg Leu Gln Pro Val Val Glu Gln Ile
225 230 235 240
Lys Ser Phe Val Leu Lys Lys Lys Asp Glu Val Ala Glu Thr Val Glu
245 250 255
Glu Lys Glu Gly Glu Gly Glu Lys Gln
260 265
<210> 4
<211> 1240
<212> DNA
<213> Rhodosporidium toruloides
<400> 4
atggccaccg tcaacgagaa gcagcccgcc accgacgcgc ccctcgcgca cgagaccgcc 60
atccaccgcg tgcgtcccca tctcttcctc gtgaaaaccc gctcaacaac tcacacacgt 120
gcaacacagg cgctcgacta ccccgtgatc aaagacaccc tctcgacctt tgaccactac 180
gcccactcgc acccctacat ctcgtccctc tactcgcgca ccctcagcct ctcgcgccag 240
atcctcgctc acgtccagcc cgtcctcccc ctcgagttgg cggaccagta cgcgaacaag 300
acgctcgatg tcgtcgagaa gtatgtcccg caggtcaaga tggagacggg agagttgatt 360
ggaaaggcga gggggcccgc cgatgccgcg ttccagacgg cccaggagta caggcaggga 420
atccagtctg tgagtcgcgc gccggcgttt tctctccttc tttgtcgctc gttctcgccg 480
agcgcgaggg cggtcgactg cttcagggag agcgctgtcg ctgacatttc tcccttctcc 540
cttgtgcgcg tcccgcagcg catctcgccc gtgacggacc agctctacca gcgcatcacg 600
acctcgcaag cgcacctctc gtccctccaa gaccgtctcc aaaagacgat caagcagcgt 660
gcgtccctct ccctcccttt cccttcctcc cttctcccgc tgacaggctt gagtggatgc 720
gatgcagtcc cccacgacac ggagagcctc cagtctacgc tccactcgat cctcaacgag 780
gtcgacgggt tggtcaagtc tgctcagtcg atcgtgcgtc cttccctccc ctccctccct 840
tcttccgacc gacgagctga cgataggatt tgtggggatg tgataaagcc cgccaacgcc 900
caagcgaccg ccaagcccgt ctttgacgga gtcgtcgagg ctgcggacca cattcgcaag 960
gaggtcactc gcaccggtgc gtcctcccgc gctctctcct ctcttctcgt cgactttgac 1020
gagataccga gaaagttcag caagacgacg ctgactctct gccctcgctg cgctcgcgca 1080
aacagacatc ccgatgggcg cccgcgcgca aaacgtcctc acctacaccc aggaccgcct 1140
ccagcccgtc gtcgagcaga tcaagagttt cgtgctcaag aagaaggacg aggttgccga 1200
gactgtcgag gagaaggagg gcgaggggga gaagcagtga 1240
<210> 5
<211> 372
<212> PRT
<213> Rhodosporidium toruloides
<400> 5
Met Ser Pro Ser Tyr Ala Gln Ala Thr Ser Ala Trp Leu Pro Ser Pro
1 5 10 15
Ser Glu Met Pro Gln Pro Asp Lys Ala Leu Leu Ala Thr Thr Glu Asp
20 25 30
Val Thr Ala Gly Lys His Ser Pro Ser Thr Ile Ala His Gly Asn Glu
35 40 45
Asn Ala Lys Val Gln Val Val Gly Glu Leu Thr Pro Pro Leu Thr Pro
50 55 60
Pro Gly Glu Lys Glu Asp Ser Ile Ala Ala Gly Glu Gly Val Arg Arg
65 70 75 80
Arg Lys Val Gly Lys Ser Ser Glu Asp Glu Glu His Asp Val Pro Gly
85 90 95
Lys Gly Phe Val Gln Ser Ile Glu Gly Thr Val Ser Ala Glu Arg Tyr
100 105 110
Val Pro Glu Asp Leu Asp Lys Arg Ile Tyr Lys Pro Trp Val Pro Arg
115 120 125
Ala Asn Ile Ala Ala Thr Pro Glu His Pro Tyr Gly Thr Thr Ala Gly
130 135 140
Gly Tyr Ala Glu Lys His Lys Asp Glu Pro Val Leu Ala Gln His Val
145 150 155 160
Ala Phe Phe Asp Lys Asp Arg Asp Asn Ile Leu Trp Pro Leu Asp Thr
165 170 175
Trp Arg Gly Phe Arg Glu Met Gly Tyr Ser Phe Phe Trp Cys Thr Phe
180 185 190
Ala Met Cys Val Ile His Phe Phe Phe Ser Trp Phe Thr Thr Pro Asn
195 200 205
Arg Ile Leu Pro Asp Pro Phe Phe Arg Val Tyr Ile Ser Asn Gly His
210 215 220
Arg Ser Lys His Gly Ser Asp Thr Ala Val Phe Asp Ser Glu Gly Arg
225 230 235 240
Phe Ile Pro Ala Lys Phe Glu Glu Ile Phe Thr Lys Phe Asp Lys Gly
245 250 255
Asn Lys Gly Gly Leu Thr Phe Arg Glu Gly Val Gln Leu Ile His Ala
260 265 270
Gln Arg Gln Ala Val Asp Pro Ile Gly Val Ala Ala Glu Cys Phe Glu
275 280 285
Trp Ala Ser Thr Tyr Leu Leu Ile Trp Pro Lys Asp Gly Ile Cys Asp
290 295 300
Lys Glu Ser Ile Arg Thr Val Tyr Asp Gly Ser Leu Phe Tyr Leu Val
305 310 315 320
Ala Asp Ala Glu Arg Gln Arg Ser Leu Ala Arg Leu Glu Ala Arg Lys
325 330 335
His Met Ser Trp Pro Ala Trp Val Trp Asp Ser Val Pro Gly Pro Trp
340 345 350
Arg Gly Trp Gly Lys Glu Asn Lys Ala Ser Gly Phe Glu Trp Thr Glu
355 360 365
Glu Lys Phe Leu
370
<210> 6
<211> 1800
<212> DNA
<213> Rhodosporidium toruloides
<400> 6
atgtcaccct cttacgcaca agctacttca gcgtggttac cctccccctc cgaaatgccg 60
caacccgaca aggctctcct cgcgacgaca gaggacgtga cggcggggaa acactctcca 120
tcgacgatcg cgcacggaaa cgagaacgca aaggtgcagg tcgttgggga gttgacgccc 180
cctcttacgc cgccgggtga gaaggaggat tcgattgcgg cgggagaggg cgtgaggagg 240
aggaaagtgg ggaagtcttc cgaggacgag gagcacgatg tcccgggcaa gggtttcgtg 300
cagagtattg aggggactgt gagtgcggaa cgctacgtcc cggaggacct cgacaagcgg 360
atctacaagc cttgtgcgtc ctccctctcc tctcttcctc gcgagttcct tggagagctg 420
atggtgggca cgcaggggtt ccgcgcgcga acatcgctgc gacgccggag catccgtacg 480
gcacgaccgc gggcgggtac gcggagaagc acaaggacga gcccgttctc gctcagcacg 540
tcgctttctt cgacaaggtg cgatcccttt cacccccctt aaaccctgcg agtgagactg 600
atggtggcga atgataggac cgcgacaaca tcctgtggcc gctcgatacc tggcgcgggt 660
tccgcgagat ggggtacagt ttcttctggt gcaccttcgc catgtggtgc gtccctgcgc 720
tcttgtttcc cttcccttct ctcccgtcgt ccgccgctcc gtctctcgcc catgccactc 780
ccacgtatcg ctccgctcgg tcgcagtcgc taacgctcct gcacgcagtg tgatccactt 840
cttcttctcc tggttcacca cccccaaccg catcctcccc gaccccttct tccgcgtcta 900
catctcgaac ggacaccgct cgaaacacgg ttccgacacg gccgtgtttg attcagaagg 960
caggttcatc ccggctaagt ttgaggagat ctttaccaag tgcgtggagc gtgcgatgtg 1020
aaagagggag gagggctgat gaggttttgt ttgtttggtg gcgggaacag gttcgataag 1080
ggcaacaaag gcggcttgac cttccgtgaa ggcgtccagg tgcgttcctt ctcccttccc 1140
tcctccgtat gaagcgactg actgacgccc gctcgcggca cacagctcat ccacgcccaa 1200
cgccaggccg tcgacccgat cggcgtagct gccgagtgct tcgagtgggc tagcacgtac 1260
ttgctgagta cgtctctccc tctctctctc caaccttcct tagggtgagt atgaggcgct 1320
gacgagattt gcggtggtcg tggcggtggt gcgcgcagtt tggccgaaag acggggtatg 1380
tttccgcctc tctcatccct ctcttcttcc tcttccctct ctccctagct ctcgaccgtc 1440
gcagagcttc gtactgactc tccgcactcg tctcgtctcg tctcgtctcg cttcgcccgg 1500
aactagattt gcgacaaaga gtccatccgt acagtctacg acgtgcgtct cccctctcct 1560
ccctcgtccc tcccacaagc cctgaccctc tgccttccct tgcttctccg gaattcgcag 1620
ggttcgctct tctacctcgt cgccgacgca gaacgccaac gctccctcgc gcgcctcgaa 1680
gctcgcaaac acatgtcctg gcccgcttgg gtttgggatt cggtgcccgg tccgtggagg 1740
gggtggggga aggagaacaa ggcgagtggg tttgagtgga cggaggagaa gttcctgtaa 1800

Claims (11)

1.一种工程菌株,其特征在于,所述工程菌株为LDP1基因和CALs基因,即RHTO_05627和RHTO_03414,双基因功能灭活的工程菌株ΔCALsΔLDP1,所述工程菌株的出发菌株为圆红冬孢酵母Rhodosporidium toruloides
2.根据权利要求1所述的工程菌株,其特征在于,所述工程菌株ΔCALsΔLDP1于2019年11月08日保藏在中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为CGMCC:18930。
3.根据权利要求1所述的工程菌株,其特征在于,所述工程菌株ΔCALsΔLDP1为调控出发菌株圆红冬孢酵母Rhodosporidium toruloides中LDP1基因和CALs基因的表达后所得。
4.根据权利要求1所述的工程菌株,所述出发菌株为表达Cas9蛋白的圆红冬孢酵母Rhodosporidium toruloides
5.根据权利要求1~4中任一项所述的工程菌株的构建方法,其特征在于,所述方法包括:
敲除出发菌株圆红冬孢酵母Rhodosporidium toruloides基因组中LDP1基因和CAL s基因,即RHTO_05627和RHTO_03414,得到双基因缺失型工程菌株ΔCALsΔLDP1。
6.根据权利要求5所述的构建方法,其特征在于,所述构建方法包括:
(1)敲除出发菌株基因组中CALs基因,得到工程菌株ΔCALs;
(2)敲除所述工程菌株ΔCALs基因组中LDP1基因,得到双基因缺失型工程菌株ΔCALsΔLDP1。
7.根据权利要求6所述的构建方法,其特征在于,
所述步骤(1)包括:
构建具有SEQ ID NO:1所示的核苷酸序列的CALs-sgRNA载体;
将CALs-sgRNA载体导入表达Cas9蛋白的工程菌株圆红冬孢酵母Rhodosporidium toruloides,筛选、培养后得到所述工程菌株ΔCALs;
所述步骤(2)包括:
构建具有SEQ ID NO:2所示的核苷酸序列的LDP1-sgRNA载体;
将LDP1-sgRNA载体导入工程菌株ΔCALs,筛选、培养后得到双基因缺失型工程菌株ΔCALsΔLDP1。
8.根据权利要求6所述的构建方法,其特征在于,
经所述步骤(1) 得到工程菌株ΔCALs,于2019 年11月08日保藏在中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为:CGMCC 18928;
经所述步骤(2) 得到双基因缺失型工程菌株ΔCALsΔLDP1工程菌株,于2019年11月08日保藏在中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为:CGMCC 18930。
9.一种载体试剂盒在构建脂滴大小降低的工程菌株的方法中的应用,其特征在于,所述载体试剂盒包括具有SEQ ID NO:1所示的核苷酸序列的CALs-sgRNA载体和具有SEQ IDNO:2所示的核苷酸序列的LDP1-sgRNA载体;所述构建的脂滴大小降低的工程菌株的出发菌株为圆红冬孢酵母Rhodosporidiumtoruloides。
10.根据权利要求9所述的应用,其所述脂滴大小降低的工程菌株为权利要求1~4所述的双基因功能灭活的工程菌株ΔCALsΔLDP1或根据权利要求5~8任一项所述的构建方法构建的双基因缺失型工程菌株ΔCALsΔLDP1。
11.根据权利要求10所述的应用,其特征在于,所述应用包括通过敲除出发菌株中LDP1和CALs基因,即RHTO_05627和RHTO_03414,来降低脂滴的大小。
CN201911285329.6A 2019-12-13 2019-12-13 一种工程菌株及其构建方法和应用 Active CN112980709B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911285329.6A CN112980709B (zh) 2019-12-13 2019-12-13 一种工程菌株及其构建方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911285329.6A CN112980709B (zh) 2019-12-13 2019-12-13 一种工程菌株及其构建方法和应用

Publications (2)

Publication Number Publication Date
CN112980709A CN112980709A (zh) 2021-06-18
CN112980709B true CN112980709B (zh) 2022-06-03

Family

ID=76342283

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911285329.6A Active CN112980709B (zh) 2019-12-13 2019-12-13 一种工程菌株及其构建方法和应用

Country Status (1)

Country Link
CN (1) CN112980709B (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012162368A1 (en) * 2011-05-26 2012-11-29 E. I. Du Pont De Nemours And Company Expression of caleosin in recombinant oleaginous microorganisms to increase oil content therein
DK3411485T3 (da) * 2016-02-05 2021-03-29 Temasek Life Sciences Laboratory Ltd Intronholdige promotorer og anvendelser deraf

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Gross DN.Dynamics of lipid droplet-associated proteins during hormonaly stimulatedlipolysis in engineered adipocytes: stabilization and lipid droplet binding of adipocyte differentiation-related protein/adipophilin..《Molecular Endocrinology》.2005,第20卷(第2期),459-466. *
Xiang Jiao.Reduction of lipid-accumulation of oleaginous yeast Rhodosporidium toruloides through CRISPR/Cas9-mediated inactivation of lipid droplet structural proteins.《FEMS Microbiology Letters》.2021,第368卷(第16期),全文. *
Zheng Yang.ABA-INSENSITIVE 3 with or without FUSCA3 highly up-regulates lipid droplet proteins and activates oil accumulation.《Journal of Experimental Botany》.2021,第73卷(第7期),2077-2092. *
Zhiwei Zhu.Dynamics of the lipid droplet proteome of the oleaginous yeast rhodosporidium toruloides.《Eukaryotic Cell》.2015,252-264. *

Also Published As

Publication number Publication date
CN112980709A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN108486146B (zh) LbCpf1-RR突变体用于CRISPR/Cpf1***在植物基因编辑中的应用
CN111534535B (zh) 一种构建麦角硫因生产菌的方法
CN108997484B (zh) 小麦TaWox5基因在提高小麦转化效率中的应用
Ding et al. Agrobacterium tumefaciens mediated fused egfp-hph gene expression under the control of gpd promoter in Pleurotus ostreatus
CN109609396B (zh) 一种基因工程菌及其构建方法与应用
CN113234738A (zh) 鄞红葡萄ABA8ox3基因过表达载体及其构建方法和应用
CN109022285B (zh) 一种提高集胞藻pcc6803铵盐耐受能力的方法与应用
CN112980709B (zh) 一种工程菌株及其构建方法和应用
CN111154764B (zh) 一种通过基因组编辑提高水稻抗病性的方法及其使用的sgRNA
CN108531502A (zh) 柑桔衰退病毒侵染性克隆的构建及接种方法
CN112553246A (zh) 一种基于CRISPR-SaCas9***的高效基因组编辑载体及其应用
CN112608936A (zh) 调控酵母外源基因表达的启动子,调控方法及其应用
CN112980710B (zh) 一种工程菌株、其构建方法和应用
CN114672509B (zh) 一种具有高表达能力的棒状杆菌和大肠杆菌双表达载体及其构建方法
CN109456990A (zh) 一种利用基因组编辑技术提高叶绿体遗传转化效率的方法
CN108559759A (zh) 三元穿梭载体及利用其构建clbv侵染性克隆的方法
CN110669794B (zh) 以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用
KR102170566B1 (ko) 목적 유전자의 발현을 조기 종결하기 위한 벡터 및 이를 포함하는 균주
CN115011539A (zh) 重组大肠杆菌及其制备方法和应用以及降解塑料的方法
CN110938650B (zh) 一种mRNA可变剪切-荧光素酶报告***及其应用
CN113621531B (zh) 一种酵母工程菌及其构建方法和应用
CN112626104A (zh) 一种用毕赤酵母生产菌丝霉素的方法
CN110724689B (zh) Cas9介导的麻竹基因编辑载体和应用
US20040158889A1 (en) Efficient system for RNA silencing
Soltani et al. A survey on optimization of Agrobacterium-mediated genetic transformation (AtMT) of Colletotrichum gloeosporioides

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant