CN114317386B - 一种生产肌苷的基因工程菌株及其构建方法与应用 - Google Patents

一种生产肌苷的基因工程菌株及其构建方法与应用 Download PDF

Info

Publication number
CN114317386B
CN114317386B CN202111481366.1A CN202111481366A CN114317386B CN 114317386 B CN114317386 B CN 114317386B CN 202111481366 A CN202111481366 A CN 202111481366A CN 114317386 B CN114317386 B CN 114317386B
Authority
CN
China
Prior art keywords
gene
fragment
strain
homology arm
inosine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111481366.1A
Other languages
English (en)
Other versions
CN114317386A (zh
Inventor
谢希贤
朱彦凯
刘铁重
吴鹤云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University of Science and Technology
Original Assignee
Tianjin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University of Science and Technology filed Critical Tianjin University of Science and Technology
Priority to CN202111481366.1A priority Critical patent/CN114317386B/zh
Publication of CN114317386A publication Critical patent/CN114317386A/zh
Application granted granted Critical
Publication of CN114317386B publication Critical patent/CN114317386B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明属于基因工程技术领域,涉及工业微生物的育种,特别涉及一种生产肌苷的基因工程菌株及其构建方法与应用。该基因工程菌株异源过表达核苷转运蛋白基因pbuE,嘌呤操纵子突变基因purEKBCSQLFK316QMNHD和PRPP转酰胺酶突变基因purFK316Q,并且以异源腺苷琥珀酸合成酶突变基因purAP242N替换了基因purA,并且不表达嘌呤核苷磷酸化酶基因deoD、ppnP以及核苷水解酶基因rihA、rihB、rihC。本发明从大肠杆菌基因组水平出发,主要通过代谢工程技术手段,对肌苷分解途径、肌苷合成途径、肌苷转运***及分支代谢途径各模块进行***全面的组合优化,提高菌株的肌苷发酵性能。

Description

一种生产肌苷的基因工程菌株及其构建方法与应用
技术领域
本发明属于基因工程技术领域,涉及工业微生物的育种,特别涉及一种生产肌苷的基因工程菌株及其构建方法与应用。
背景技术
肌苷是一种嘌呤核苷,参与机体物质代谢和能量代谢,具有重要的应用价值。微生物发酵法是目前工业生产肌苷的主要方法,但由于现存菌株的发酵性能较差,发酵法生产肌苷的生产水平仍较低,亟需高性能的菌株以满足肌苷的产业化需求。传统肌苷生产菌株的选育是通过诱变筛选结构类似物抗性菌株获得,然而由于遗传背景不清晰和大量负向突变的积累,不利于诱变所得菌株性能的持续改良。随着***生物学的发展,代谢工程等理性构建的方法逐渐成为肌苷生产菌株从头构建和持续改良的首选方法。现有研究成果已为肌苷工程菌株的理性构建提供了重要参考,但仍存在许多问题尚未解决。具体表现在:(1)目前理性构建菌株的肌苷生产性能普遍偏低,最高产量仅为14g/L,且生产周期较长,普遍长达72h甚至更久。(2)菌株多携带质粒,菌体负担重,并且质粒易丢失会造成生产的不稳定。为维持质粒的稳定存在需添加抗生素,不仅提高了生产成本,也增加耐药性等安全隐患。(3)在构建策略方面,现有菌株多局限在对降解途径、从头合成途径、前体合成途径和分支代谢途径等个别节点进行改造,缺乏对整个肌苷代谢网络各模块的***组合。(4)菌株多为腺嘌呤缺陷型,发酵过程中需要添加腺嘌呤,原料成本高、发酵工艺复杂、生产稳定性降低。
常见的肌苷生产菌株从头构建策略主要包括阻断降解途径、加强从头合成途径、加强前体合成途径与阻断分支代谢途径四个方面。Shimaoka M等(Effect ofamplification of desensitized purF and prs on inosine accumulation inEscherichia coli.Journal of bioscience and bioengineering,2007,103(3):255-261.)以大肠杆菌W3110为出发菌株,通过敲除deoD和xapA基因,阻断了肌苷降解途径;通过敲除purR基因和过表达purFK326Q,P410W基因,加强了从头合成途径;通过敲除pgi、edd基因及过表达prsD128A基因,加强了前体合成途径;通过敲除purA基因,阻断了腺苷合成支路。所得菌株I-9m/pMWKQ-pSTVDA经72h发酵,肌苷的产量达到7.5g/L。Asahara T等(Accumulationof gene-targeted Bacillus subtilis mutations that enhance fermentativeinosine production.Appl Microbiol Biotechnol,2010,87(6):2195-2207.)以枯草芽胞杆菌W168为出发菌株,通过敲除deoD和punA基因,阻断了肌苷降解途径;通过敲除purR基因、嘌呤操纵子的5'-UTR区及优化嘌呤操纵子启动子的-10区,加强了从头合成途径;通过敲除purA和guaB基因,阻断了腺苷合成支路和鸟苷合成支路。所得菌株KMBS375经72h发酵,肌苷的产量达到6g/L。李昊剑等(De novo engineering and metabolic flux analysisof inosine biosynthesis in Bacillus subtilis.Biotechnol Lett,2011,33(8):1575-1580.)以枯草芽胞杆菌W168为出发菌株,通过敲除deoD基因,阻断了肌苷降解途径;通过敲除purA基因,阻断了腺苷合成支路。所得菌株BS019经72h发酵,肌苷产量达到7.6g/L。温廷益等(CN106906174A)以枯草芽胞杆菌W168为出发菌株,通过敲除purA基因,阻断了腺苷合成支路;通过敲除drm基因,阻断了核糖1-磷酸向核糖5-磷酸的降解途径。所得菌株IR-2经72h发酵,肌苷产量达到14g/L,这是目前为止理性构建菌株中肌苷最高产量。
发明内容
针对上述问题,本发明的目的是构建一株高效稳定生产肌苷的工程菌株并利用该菌株发酵生产肌苷,本发明从大肠杆菌基因组水平出发,主要通过代谢工程技术手段,对肌苷分解途径、肌苷合成途径、肌苷转运***及分支代谢途径各模块进行***全面的组合优化,提高菌株的肌苷发酵性能。
为了实现上述目的,本发明采取如下的技术方案:
第一方面,本发明提供了一种大肠杆菌基因工程菌株,该基因工程菌株异源过表达核苷转运蛋白基因pbuE,嘌呤操纵子突变基因purEKBCSQLFK316QMNHD和PRPP转酰胺酶突变基因purFK316Q,并且以异源腺苷琥珀酸合成酶突变基因purAP242N替换了基因purA,并且不表达嘌呤核苷磷酸化酶基因deoD、ppnP以及核苷水解酶基因rihA、rihB、rihC。
第二方面,本发明提供了如上所述的大肠杆菌基因工程菌株的构建方法,包括:在出发菌株大肠杆菌中引入核苷转运蛋白基因pbuE,嘌呤操纵子突变基因purEKBCSQLFK316QMNHD和PRPP转酰胺酶突变基因purFK316Q,并且以异源腺苷琥珀酸合成酶突变基因purAP242N替换了基因purA,并且将嘌呤核苷磷酸化酶基因deoD、ppnP以及核苷水解酶基因rihA、rihB、rihC敲除或失活。
第三方面,本发明提供了如上所述的大肠杆菌基因工程菌株在高产肌苷中的用途。
本发明的有益效果如下:
本发明利用理性代谢工程改造的方法获得了具有清晰遗传背景,不含质粒并且高效生产肌苷的工程菌株。从生产表型来看,本发明所述菌株在5L罐上发酵48h,肌苷产量达到了20.16g/L,与现有技术目前理性构建菌株的最高产量相比提高了42.8%,发酵周期缩减1/3,且不含质粒。从构建策略来看,本发明通过代谢工程技术手段,分模块对肌苷分解途径、肌苷合成途径、肌苷转运***及分支代谢途径进行了***全面的组合优化,菌株遗传背景清晰且生产性能更高更稳定。特别地,相比其他肌苷生产菌株,本发明通过弱化而非直接阻断腺苷合成支路的方法,既保证了足够的肌苷支路通量,又维持了菌株一定的生长水平。最终所得菌株可稳定高效生产肌苷,具有良好的工业化应用前景。
附图说明
图1A:deoD基因敲除片段的构建及验证电泳图。其中,M:Marker;1:上游同源臂;2:下游同源臂;3:重叠片段;4:阳性菌鉴定片段5:阴性对照。
图1B:ppnP基因敲除片段的构建及验证电泳图。其中,M:Marker;1:上游同源臂;2:下游同源臂;3:重叠片段;4:阳性菌鉴定片段5:阴性对照。
图1C:rihA基因敲除片段的构建及验证电泳图。其中,M:Marker;1:上游同源臂;2:下游同源臂;3:重叠片段;4:阳性菌鉴定片段5:阴性对照。
图1D:rihB基因敲除片段的构建及验证电泳图。其中,M:Marker;1:上游同源臂;2:下游同源臂;3:重叠片段;4:阳性菌鉴定片段5:阴性对照。
图1E:rihC基因敲除片段的构建及验证电泳图。其中,M:Marker;1:上游同源臂;2:下游同源臂;3:重叠片段;4:阳性菌鉴定片段5:阴性对照。
图2A:pur1整合片段构建及验证电泳图。其中:M:marker;1:上游同源臂;2:pur1片段;3:下游同源臂;4:重叠片段;5:阳性菌鉴定片段;6:阴性对照。
图2B:pur2整合片段构建及验证电泳图。其中:M:marker;1::pur2上游片段-pur2片段;2:下游同源臂;3:重叠片段;4:阳性菌鉴定片段;5:阴性对照。
图2C:pur3整合片段构建及验证电泳图。其中:M:marker;1::pur3上游片段-pur3片段;2:下游同源臂;3:重叠片段;4:阳性菌鉴定片段;5:阴性对照。
图2D:pur4整合片段构建及验证电泳图。其中:M:marker;1::pur4上游片段-pur4片段;2:下游同源臂;3:重叠片段;4:阳性菌鉴定片段;5:阴性对照。
图2E:pur5整合片段构建及验证电泳图。其中:M:marker;1::pur5上游片段-pur5片段;2:下游同源臂;3:重叠片段;4:阳性菌鉴定片段;5:阴性对照。
图2F:pur6整合片段构建及验证电泳图。其中:M:marker;1::pur6上游片段-pur6片段;2:下游同源臂;3:重叠片段;4:阳性菌鉴定片段;5:阴性对照。
图2G:purFK326Q,P410W整合片段构建及验证电泳图。其中:M:marker;1:上游同源臂;2:purFK326Q,P410W基因片段;3:下游同源臂;4:重叠片段;5:阳性菌鉴定片段;6:阴性对照。
图2H:purFD293V,K316Q,S400W整合片段构建及验证电泳图。其中:M:marker;1:上游同源臂;2:purFD293V,K316Q,S400W基因片段;3:下游同源臂;4:重叠片段;5:阳性菌鉴定片段;6:阴性对照。
图2I:purFK316Q整合片段构建及验证电泳图。其中:M:marker;1:上游同源臂;2:purFK316Q基因片段;3:下游同源臂;4:重叠片段;5:阳性菌鉴定片段;6:阴性对照。
图3:pbuE整合片段构建及验证电泳图。其中:M:marker;1:上游同源臂;2:pbuE基因片段;3:下游同源臂;4:重叠片段;5:阳性菌鉴定片段;6:阴性对照。
图4:purAP242N整合片段构建及验证电泳图。其中:M:marker;1:上游同源臂;2:purAP242N基因片段;3:下游同源臂;4:重叠片段;5:阳性菌鉴定片段;6:阴性对照。
图5:过表达不同PurF突变体对肌苷产率的影响。
图6:菌株INO4在5L发酵罐分批补料发酵曲线。
图7:本发明技术方案原理示意图。
具体实施方式
下面通过具体的实施方案叙述本发明。除非特别说明,本发明中所用的技术手段均为本领域技术人员所公知的方法。另外,实施方案应理解为说明性的,而非限制本发明的范围,本发明的实质和范围仅由权利要求书所限定。对于本领域技术人员而言,在不背离本发明实质和范围的前提下,对这些实施方案中的物料成分和用量进行的各种改变或改动也属于本发明的保护范围。
第一方面,本发明提供了一种大肠杆菌基因工程菌株,该基因工程菌株异源过表达核苷转运蛋白基因pbuE,嘌呤操纵子突变基因purEKBCSQLFK316QMNHD和PRPP转酰胺酶突变基因purFK316Q,其中purFK316Q是purF基因编码氨基酸序列第316位的赖氨酸替换为谷氨酰胺,并且以腺苷琥珀酸合成酶突变基因purAP242N替换了基因purA,并且不表达嘌呤核苷磷酸化酶基因deoD、ppnP以及核苷水解酶基因rihA、rihB、rihC。
优选的,所述核苷转运蛋白基因pbuE的核苷酸序列如SEQ ID NO:1所示,其NCBI-GeneID:12132461。
优选的,所述PRPP转酰胺酶突变基因purFK316Q的核苷酸序列如SEQ ID NO:2所示。其中,purFK316Q是表示purF基因编码氨基酸序列的第316位的赖氨酸(K)替换为谷氨酰胺(Q)。位置的编号是对应于亲本PRPP转酰胺酶氨基酸序列的位置。
优选的,所述嘌呤操纵子突变基因purEKBCSQLFK316QMNHD的核苷酸序列如SEQ IDNO:3所示。其中包含的purFK316Q是purF的突变基因,表示purF基因编码氨基酸序列的第316位的赖氨酸(K)替换为谷氨酰胺(Q)。
优选的,所述腺苷琥珀酸合成酶突变基因purAP242N的核苷酸序列如SEQ ID NO:4所示。其中purAP242N是表示purA基因编码氨基酸序列的第128位的脯氨酸(P)替换为天冬酰胺(N)。位置的编号是对应于亲本腺苷琥珀酸合成酶氨基酸序列的位置。
根据本发明,不表达上述基因的方式可以采取本领域常规手段,例如,通过本领域常规手段使该基因失活或者将该基因敲除。
根据本发明,所述不表达是指该基因表达产物的量显著低于原有水平,例如,显著降低了至少50%、60%、70%、80%、90%、100%。
根据本发明,过表达上述基因的方式可以采取本领域常规手段,例如,增加基因的拷贝数或者使该基因连接强启动子。
根据本发明,所述过表达是指该基因表达产物的量显著高于原有水平。
根据本发明一种优选的实施方式,所述核苷转运蛋白基因pbuE连接有启动子Ptrc;和/或所述嘌呤操纵子突变基因purEKBCSQLFK316QMNHD连接有启动子Ptrc;和/或所述PRPP转酰胺酶突变基因purFK316Q连接有启动子Ptrc;优选的,所述启动子Ptrc的核苷酸序列如SEQ IDNO:5所示。
根据本发明,用于构建所述大肠杆菌基因工程菌株的出发菌株可以是任意的大肠杆菌,根据本发明一种优选的实施方式,所述出发菌株是E.coli MG1655。
第二方面,本发明提供了如上所述的大肠杆菌基因工程菌株的构建方法,包括:在出发菌株大肠杆菌中引入核苷转运蛋白基因pbuE,嘌呤操纵子突变基因purEKBCSQLFK316QMNHD和PRPP转酰胺酶突变基因purFK316Q,其中purFK316Q是氨基酸序列第316位的赖氨酸替换为谷氨酰胺,,并且以腺苷琥珀酸合成酶突变基因purAP242N替换了基因purA,并且将嘌呤核苷磷酸化酶基因deoD、ppnP以及核苷水解酶基因rihA、rihB、rihC敲除或失活。
本发明第一方面已经详细介绍了上述各基因的选择、启动子的选择、出发菌株的选择等,此处不再赘述第一方面已经介绍过的内容。
根据本发明一种具体的实施方式,该方法包括:
(1)阻断肌苷分解途径
从菌株E.coli MG1655基因组出发,敲除嘌呤核苷磷酸化酶基因deoD、ppnP,并敲除核苷水解酶基因rihA、rihB、rihC;该步骤阻断了肌苷的降解;
(2)增强肌苷合成途径
将Bacillus amyloliquefaciens TA208的嘌呤操纵子purEKBCSQLFK316QMNHD与启动子Ptrc的融合片段Ptrc-purEKBCSQLFK316QMNHD整合在yghE假基因位点;该步骤强化了嘌呤从头合成代谢通量,同时解除了AMP和GMP对PRPP转酰胺酶的反馈抑制;
将Bacillus amyloliquefaciens TA208的PRPP转酰胺酶突变基因purFK316Q与启动子Ptrc的融合片段Ptrc-purFK316Q整合在yeeP假基因位点;该步骤进一步加强PRPP转酰胺酶的转录表达,促进肌苷合成;
(3)修饰肌苷转运***
将Bacillus amyloliquefaciens TA208的核苷转运蛋白基因pbuE与启动子Ptrc的融合片段Ptrc-pbuE整合在yjiT假基因位点;该步骤加强了肌苷向胞外转运的能力;
(4)弱化腺苷合成支路
将腺苷琥珀酸合成酶purA基因替换为B.subtilis W168的突变基因purAP242N;该步骤弱化了肌苷竞争途径中的腺苷合成支路。
本发明上述构建过程的原理可参考图7所示。
第三方面,本发明提供了如上所述的大肠杆菌基因工程菌株在高产肌苷中的应用,包括:在适宜条件培养所述基因工程菌株,并从其培养物中收集肌苷。
根据本发明一种优选的实施方式,所述适宜条件是指培养温度35℃,维持pH在7.0左右,溶氧在25-35%之间,并且培养基组成为:葡萄糖15-25g/L,酵母粉1-4g/L,蛋白胨1-5g/L,柠檬酸钠0.1-2g/L,腺嘌呤0.1-0.3g/L,KH2PO4·3H2O 0.1-2g/L,MgSO4·7H2O 0.1-2g/L,FeSO4·7H2O 5-20mg/L,MnSO4·H2O 5-20mg/L,VB1、VB3、VB5、VB12和VH各0.1-2mg/L,消泡剂2滴,其余为水,pH 7.0-7.2。
以下将通过具体的实施例对本发明进行更详细描述。以下实施例中:
如无特别说明,本发明实施例中所涉及的基因编辑方法参照文献(Li Y,Lin Z,Huang C,et al.Metabolic engineering of Escherichia coli using CRISPR–Cas9meditated genome editing.Metabolic engineering,2015,31:13-21.)进行,其他所涉及的分子生物学、基因工程等具体操作手段根据本领域人员容易获得的技术手册、教科书或文献报道均可以实现。
实施例1:大肠杆菌基因工程菌株E.coli INO4的构建
1.阻断肌苷分解途径
1.1deoD基因的敲除:
以E.coli MG1655基因组为模板,根据其deoD基因(NCBI-GeneID:945654)的上下游序列设计上游同源臂引物(UP-deoD-S、UP-deoD-A)和下游同源臂引物(DN-deoD-S、DN-deoD-A),并PCR扩增其上下游同源臂片段。上述片段通过重叠PCR的方法融合获得deoD基因的敲除片段(上游同源臂-下游同源臂)。构建pGRB-deoD使用的含靶序列的DNA片段通过引物gRNA-deoD-S和gRNA-deoD-A的退火制得。将该重组片段和质粒pGRB-deoD电转至E.coliMG1655的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO1-1。deoD敲除片段的构建和阳性菌株的PCR验证的电泳图见附图1A。其中,上游同源臂的长度为458bp,下游同源臂的长度为613bp,重叠片段的总长为1029bp。PCR验证时,阳性菌PCR扩增片段长度应为1029bp,原菌PCR扩增片段长度应为1630bp。
1.2ppnP基因的敲除:
以E.coli MG1655基因组为模板,根据其ppnP基因(NCBI-GeneID:945048)的上下游序列设计上游同源臂引物(UP-ppnP-S、UP-ppnP-A)和下游同源臂引物(DN-ppnP-S、DN-ppnP-A),并PCR扩增其上下游同源臂片段。上述片段通过重叠PCR的方法融合获得ppnP基因的敲除片段(上游同源臂-下游同源臂)。构建pGRB-ppnP使用的含靶序列的DNA片段通过引物gRNA-ppnP-S和gRNA-ppnP-A的退火制得。将该重组片段和质粒pGRB-ppnP电转至INO1-1的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO1-2。ppnP敲除片段的构建和阳性菌株的PCR验证的电泳图见附图1B。其中,上游同源臂的长度为394bp,下游同源臂的长度为690bp,重叠片段的总长为1040bp。PCR验证时,阳性菌PCR扩增片段长度应为1040bp,原菌PCR扩增片段长度应为1361bp。
1.3rihA基因的敲除:
以E.coli MG1655基因组为模板,根据其rihA基因(NCBI-GeneID:945503)的上下游序列设计上游同源臂引物(UP-rihA-S、UP-rihA-A)和下游同源臂引物(DN-rihA-S、DN-rihA-A),并PCR扩增其上下游同源臂片段。上述片段通过重叠PCR的方法融合获得rihA基因的敲除片段(上游同源臂-下游同源臂)。构建pGRB-rihA使用的含靶序列的DNA片段通过引物gRNA-rihA-S和gRNA-rihA-A的退火制得。将该重组片段和质粒pGRB-rihA电转至INO1-2的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO1-3。rihA敲除片段的构建和阳性菌株的PCR验证的电泳图见附图1C。其中,上游同源臂的长度为547bp,下游同源臂的长度为536bp,重叠片段的总长为1042bp。PCR验证时,阳性菌PCR扩增片段长度应为1042bp,原菌PCR扩增片段长度应为1857bp。
1.4rihB基因的敲除:
以E.coli MG1655基因组为模板,根据其rihB基因(NCBI-GeneID:946646)的上下游序列设计上游同源臂引物(UP-rihB-S、UP-rihB-A)和下游同源臂引物(DN-rihB-S、DN-rihB-A),并PCR扩增其上下游同源臂片段。上述片段通过重叠PCR的方法融合获得rihB基因的敲除片段(上游同源臂-下游同源臂)。构建pGRB-rihB使用的含靶序列的DNA片段通过引物gRNA-rihB-S和gRNA-rihB-A的退火制得。将该重组片段和质粒pGRB-rihB电转至INO1-3的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO1-4。rihB敲除片段的构建和阳性菌株的PCR验证的电泳图见附图1D。其中,上游同源臂的长度为494bp,下游同源臂的长度为459bp,重叠片段的总长为912bp。PCR验证时,阳性菌PCR扩增片段长度应为912bp,原菌PCR扩增片段长度应为1789bp。
1.5rihC基因的敲除:
以E.coli MG1655基因组为模板,根据其rihC基因(NCBI-GeneID:944796)的上下游序列设计上游同源臂引物(UP-rihC-S、UP-rihC-A)和下游同源臂引物(DN-rihC-S、DN-rihC-A),并PCR扩增其上下游同源臂片段。上述片段通过重叠PCR的方法融合获得rihC基因的敲除片段(上游同源臂-下游同源臂)。构建pGRB-rihC使用的含靶序列的DNA片段通过引物gRNA-rihC-S和gRNA-rihC-A的退火制得。将该重组片段和质粒pGRB-rihC电转至INO1-4的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO1-5。rihC敲除片段的构建和阳性菌株的PCR验证的电泳图见附图1E。其中,上游同源臂的长度为539bp,下游同源臂的长度为475bp,重叠片段的总长为975bp。PCR验证时,阳性菌PCR扩增片段长度应为975bp,原菌PCR扩增片段长度应为1787bp。
2.增强肌苷合成途径
2.1将解淀粉芽孢杆菌的嘌呤操纵子突变基因purEKBCSQLFK316QMNHD整合在E.coliINO1-5的yghE基因位点
解淀粉芽孢杆菌(Bacillus amyloliquefaciens TA208)的嘌呤操纵子purEKBCSQLFMNHD(包含purE、purK、purB、purC、purS、purQ、purL、purF、purM、purN、purH、purD十二个基因)共12797bp,在本实施例中分pur1、pur2、pur3、pur4、pur5、pur6六段依次整合至大肠杆菌yghE基因位点(其中包含的purF替换为突变基因purFK316Q),并由启动子Ptrc启动该外源操纵子的转录表达,构建了菌株E.coli INO2-6。具体包括:
2.1.1Ptrc-pur1的整合:
以E.coli MG1655基因组为模板,根据其yghE基因的上下游序列设计上游同源臂引物(UP-yghE-S、UP-yghE-A)和下游同源臂引物(DN-yghE-S1、DN-yghE-A),PCR扩增其上下游同源臂片段;以Bacillus amyloliquefaciens TA208基因组为模板,根据pur1(SEQ IDNO:3所示核苷酸序列的第1-2113位)设计引物(UP-pur1-S、UP-pur1-A),PCR扩增pur1片段;启动子Ptrc则设计在上游同源臂的下游引物和pur1基因的上游引物中。上述片段通过重叠PCR的方法融合,获得pur1基因的整合片段(上游同源臂-Ptrc-pur1-下游同源臂),构建pGRB-yghE使用的含靶序列的DNA片段通过引物gRNA-yghE-S和gRNA-yghE-A的退火制得。将该重组片段和质粒pGRB-yghE电转至INO1-5的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO2-1。Ptrc-pur1片段整合过程中,整合片段的构建和阳性菌株的PCR验证的电泳图见附图2A。其中上游同源臂长度为559bp,pur1基因片段长度为2236bp,下游同源臂长度为554bp,重叠片段的长度为3244bp。PCR验证时,鉴定引物所扩增片段长度应为1188bp,原菌应无条带。
2.1.2pur2的整合:
以Bacillus amyloliquefaciens TA208基因组为模板,根据pur2(SEQ ID NO:3所示核苷酸序列第1603-4203位)及其上游序列设计上游同源臂引物(UP-pur2-S、UP-pur2-A),PCR扩增其上游同源臂片段;以E.coli MG1655基因组为模板,根据其yghE基因的下游序列设计下游同源臂引物(DN-yghE-S2、DN-yghE-A),PCR扩增其下游同源臂片段。上述片段通过重叠PCR的方法融合,获得pur2的整合片段(pur2的上游片段-pur2-下游同源臂)。构建pGRB-pur2使用的含靶序列的DNA片段通过引物gRNA-pur2-S和gRNA-pur2-A的退火制得。将该重组片段和质粒pGRB-pur2电转至INO2-1的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO2-2。pur2片段整合过程中,整合片段的构建和阳性菌株的PCR验证的电泳图见附图2B。其中pur2的上游片段-pur2的总长度为2664bp,下游同源臂长度为554bp,重叠片段的长度为3155bp。PCR验证时,鉴定引物所扩增片段长度应为1513bp,原菌应无条带。
2.1.3pur3的整合:
以Bacillus amyloliquefaciens TA208基因组为模板,根据pur3(SEQ ID NO:3所示核苷酸序列第3494-6132位)及其上游序列设计上游同源臂引物(UP-pur3-S、UP-pur3-A),PCR扩增其上游同源臂片段;以E.coli MG1655基因组为模板,根据其yghE基因的下游序列设计下游同源臂引物(DN-yghE-S1、DN-yghE-A),PCR扩增其下游同源臂片段。上述片段通过重叠PCR的方法融合,获得pur3的整合片段(pur3的上游片段-pur3-下游同源臂)。构建pGRB-pur3使用的含靶序列的DNA片段通过引物gRNA-pur3-S和gRNA-pur3-A的退火制得。将该重组片段和质粒pGRB-pur3电转至INO2-2的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO2-3。pur3片段整合过程中,整合片段的构建和阳性菌株的PCR验证的电泳图见附图2C。其中pur3的上游片段-pur3的总长度为2702bp,下游同源臂长度为554bp,重叠片段的长度为3193bp。PCR验证时,鉴定引物所扩增片段长度应为1393bp,原菌应无条带。
2.1.4pur4的整合:
以Bacillus amyloliquefaciens TA208基因组为基础,通过化学合成的方法获得pur4片段(SEQ ID NO:3所示核苷酸序列第5543-8228位),根据pur4片段设计引物(UP-pur4-S、UP-pur4-A),扩增pur4片段;以E.coli MG1655基因组为模板,根据其yghE基因的下游序列设计下游同源臂引物(DN-yghE-S2、DN-yghE-A),PCR扩增其下游同源臂片段。上述片段通过重叠PCR的方法融合,获得pur4的整合片段(pur4的上游片段-pur4-下游同源臂)。构建pGRB-pur2使用的含靶序列的DNA片段通过引物gRNA-pur2-S和gRNA-pur2-A的退火制得。将该重组片段和质粒pGRB-pur2电转至INO2-3的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO2-4。pur4片段整合过程中,整合片段的构建和阳性菌株的PCR验证的电泳图见附图2D。其中pur4的上游片段-pur3的总长度为2749bp,下游同源臂长度为554bp,重叠片段的长度为3240bp。PCR验证时,鉴定引物所扩增片段长度应为1328bp,原菌应无条带。
2.1.5pur5的整合:
以Bacillus amyloliquefaciens TA208基因组为基础,通过化学合成的方法获得pur5片段(SEQ ID NO:3所示核苷酸序列第7704-10592位),根据pur5片段设计引物(UP-pur5-S、UP-pur5-A),扩增pur5片段;以E.coli MG1655基因组为模板,根据其yghE基因的下游序列设计下游同源臂引物(DN-yghE-S2、DN-yghE-A),PCR扩增其下游同源臂片段。上述片段通过重叠PCR的方法融合,获得pur5的整合片段(pur5的上游片段-pur5-下游同源臂)。构建pGRB-pur3使用的含靶序列的DNA片段通过引物gRNA-pur3-S和gRNA-pur3-A的退火制得。将该重组片段和质粒pGRB-pur3电转至INO2-4的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO2-5。pur5片段整合过程中,整合片段的构建和阳性菌株的PCR验证的电泳图见附图2E。其中pur5的上游片段-pur5的总长度为2952bp,下游同源臂长度为554bp,重叠片段的长度为3443bp。PCR验证时,鉴定引物所扩增片段长度应为1308bp,原菌应无条带。
2.1.6pur6的整合:
以Bacillus amyloliquefaciens TA208基因组为模板,根据pur6(SEQ ID NO:3所示核苷酸序列第10088-12797位)及其上游序列设计上游同源臂引物(UP-pur6-S、UP-pur6-A),PCR扩增其上游同源臂片段;以E.coli MG1655基因组为模板,根据其yghE基因的下游序列设计下游同源臂引物(DN-yghE-S3、DN-yghE-A),PCR扩增其下游同源臂片段。上述片段通过重叠PCR的方法融合,获得pur6的整合片段(pur6的上游片段-pur6-下游同源臂)。构建pGRB-pur2使用的含靶序列的DNA片段通过引物gRNA-pur2-S和gRNA-pur2-A的退火制得。将该重组片段和质粒pGRB-pur2电转至INO2-5的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO2-6。pur6的整合过程中,整合片段的构建和阳性菌株的PCR验证的电泳图见附图2F。其中pur6的上游片段的总长度为2773bp,下游同源臂长度为554bp,重叠片段的总长度为3288bp。PCR验证时,鉴定引物所扩增片段长度应为1114bp,原菌应无条带。
2.2PRPP转酰胺酶突变体基因的整合
为了加强PRPP转酰胺酶的转录表达,选择了purFK326Q,P410W,purFD293V,K316Q,S400W,purFK316Q等几种不同来源的PRPP转酰胺酶突变基因进行整合过表达。
突变体的标识:采用公认IUPAC命名法,氨基酸残基用单字母符号表示。采用“原始氨基酸位置替换的氨基酸”来表示PRPP转酰胺酶突变体中突变的氨基酸。如purFK316Q,表示第316位的氨基酸由亲本的赖氨酸(K)替换成谷氨酰胺(Q),位置的编号对应于亲本PRPP转酰胺酶的氨基酸序列编号。如purFK326Q,P410W,表示第326位和第410位的氨基酸都发生了突变。具体如下:
2.2.1将E.coli MG1655的PRPP转酰胺酶突变基因purFK326Q,P410W整合在E.coliINO2-6的yeeP基因位点:
以E.coli MG1655基因组为模板,根据其yeeP基因的上下游序列设计上游同源臂引物(UP-yeeP-S、UP-yeeP-A)和下游同源臂引物(DN-yeeP-S、DN-yeeP-A),PCR扩增其上下游同源臂片段;以E.coli MG1655基因组为基础,通过化学合成的方法获得purFK326Q,P410W基因,根据purFK326Q,P410W基因设计引物(ecoF-S,ecoF-A),扩增purFK326Q,P410W基因片段,启动子Ptrc则设计在上游同源臂的下游引物和purFK326Q,P410W基因的上游引物中,终止子Ttrc则设计在下游同源臂的上游引物和purFK326Q,P410W基因的下游引物中。上述片段通过重叠PCR的方法融合获得purFK326Q,P410W基因的整合片段(上游同源臂-Ptrc-purFK326Q,P410W-Ttrc-下游同源臂),构建pGRB-yeeP使用的含靶序列的DNA片段通过引物gRNA-yeeP-S和gRNA-yeeP-A的退火制得。将该重组片段和质粒pGRB-yeeP电转至INO2-6的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO2-7。purFK326Q,P410W整合片段的构建和阳性菌株的PCR验证的电泳图见附图2G。其中,上游同源臂的长度为568bp,purFK326Q,P410W基因片段长度为1641bp,下游同源臂的长度为576bp,整合片段的总长为2704bp。PCR验证时,阳性菌PCR扩增片段长度应为2704bp,原菌PCR扩增片段长度应为1396bp。
2.2.2将B.subtilis W168的PRPP转酰胺酶突变基因purFD293V,K316Q,S400W整合在E.coli INO2-6的yeeP基因位点:
以E.coli MG1655基因组为模板,根据其yeeP基因的上下游序列设计上游同源臂引物(UP-yeeP-S、UP-yeeP-A)和下游同源臂引物(DN-yeeP-S、DN-yeeP-A),PCR扩增其上下游同源臂片段;以B.subtilis W168基因组为基础,通过化学合成的方法获得purFD293V ,K316Q,S400W基因,根据purFD293V,K316Q,S400W基因设计引物(bsuF-S,bsuF-A),扩增purFD293V ,K316Q,S400W基因片段,启动子Ptrc则设计在上游同源臂的下游引物和purFD293V,K316Q,S400W基因的上游引物中,终止子Ttrc则设计在下游同源臂的上游引物和purFD293V,K316Q,S400W基因的下游引物中。上述片段通过重叠PCR的方法融合获得purFD293V,K316Q,S400W基因的整合片段(上游同源臂-Ptrc-purFD293V,K316Q,S400W-Ttrc-下游同源臂),构建pGRB-yeeP使用的含靶序列的DNA片段通过引物gRNA-yeeP-S和gRNA-yeeP-A的退火制得。将该重组片段和质粒pGRB-yeeP电转至INO2-6的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO2-8。purFD293V,K316Q,S400W整合片段的构建和阳性菌株的PCR验证的电泳图见附图2H。其中,上游同源臂的长度为568bp,purFD293V,K316Q,S400W基因片段长度为1554bp,下游同源臂的长度为576bp,整合片段的总长为2617bp。PCR验证时,阳性菌PCR扩增片段长度应为2617bp,原菌PCR扩增片段长度应为1396bp。
2.2.3将Bacillus amyloliquefaciens TA208的PRPP转酰胺酶突变基因purFK316Q整合在E.coli INO2-6的yeeP基因位点:
以E.coli MG1655基因组为模板,根据其yeeP基因的上下游序列设计上游同源臂引物(UP-yeeP-S、UP-yeeP-A)和下游同源臂引物(DN-yeeP-S、DN-yeeP-A),PCR扩增其上下游同源臂片段;以Bacillus amyloliquefaciens TA208基因组为基础,通过化学合成的方法获得purFK316Q基因(SEQ ID NO:2),根据purFK316Q基因设计引物(bazF-S,bazF-A),扩增purFK316Q基因片段,启动子Ptrc则设计在上游同源臂的下游引物和purFK316Q基因的上游引物中,终止子Ttrc则设计在下游同源臂的上游引物和purFK316Q基因的下游引物中。上述片段通过重叠PCR的方法融合获得purFK316Q基因的整合片段(上游同源臂-Ptrc-purFK316Q-Ttrc-下游同源臂),构建pGRB-yeeP使用的含靶序列的DNA片段通过引物gRNA-yeeP-S和gRNA-yeeP-A的退火制得。将该重组片段和质粒pGRB-yeeP电转至INO2-6的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO2-9。purFK316Q整合片段的构建和阳性菌株的PCR验证的电泳图见附图2I。其中,上游同源臂的长度为568bp,purFK316Q基因片段长度为1552bp,下游同源臂的长度为576bp,整合片段的总长为2615bp。PCR验证时,阳性菌PCR扩增片段长度应为2615bp,原菌PCR扩增片段长度应为1396bp。
3.修饰肌苷转运***
将Bacillus amyloliquefaciens TA208的pbuE基因整合在E.coli INO2-9的yjiT假基因位点:
以E.coli MG1655基因组为模板,根据其yjiT基因的上下游序列设计上游同源臂引物(UP-yjiT-S、UP-yjiT-A)和下游同源臂引物(DN-yjiT-S、DN-yjiT-A),PCR扩增其上下游同源臂片段;以Bacillus amyloliquefaciens TA208的基因组为模板,根据pbuE基因(SEQ ID NO:1)设计引物(pbuE-S、pbuE-A),扩增pbuE基因片段。启动子Ptrc则设计在上游同源臂的下游引物和pbuE基因的上游引物中,终止子Ttrc则设计在下游同源臂的上游引物和pbuE基因的下游引物中。上述片段通过重叠PCR的方法融合获得pbuE基因的整合片段(上游同源臂-Ptrc-pbuE-Ttrc-下游同源臂),构建pGRB-yjiT使用的含靶序列的DNA片段通过引物gRNA-yjiT-S和gRNA-yjiT-A的退火制得。将该重组片段和质粒pGRB-yjiT电转至INO2-9的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO3。pbuE整合片段的构建和阳性菌株的PCR验证的电泳图见附图3。其中,上游同源臂的长度为373bp,pbuE基因片段长度为1284bp,下游同源臂的长度为530bp,整合片段的总长为2108bp。PCR验证时,阳性菌PCR扩增片段长度应为2108bp,原菌PCR扩增片段长度应为1873bp。
4.弱化腺苷合成支路
将E.coli MG1655的purA基因替换为B.subtilis W168的腺苷琥珀酸合成酶突变基因purAP242N。具体如下:
以E.coli MG1655基因组为模板,根据其purA基因的上下游序列设计上游同源臂引物(UP-purA-S、UP-purA-A)和下游同源臂引物(DN-purA-S、DN-purA-A),PCR扩增其上下游同源臂片段;以B.subtilis W168基因组为基础,通过化学合成的方法获得purAP242N基因(SEQ ID NO:4),根据purAP242N基因设计引物(bsuA-S,bsuA-A),扩增purAP242N基因片段。上述片段通过重叠PCR的方法融合获得purAP242N突变基因的整合片段(上游同源臂-purAP242N-下游同源臂),构建pGRB-purA使用的含靶序列的DNA片段通过引物gRNA-purA-S和gRNA-purA-A的退火制得。将该重组片段和质粒pGRB-purA电转至INO3的感受态细胞,筛选阳性菌株后再将质粒消除获得菌株INO4。purAP242N整合片段的构建和阳性菌株的PCR验证的电泳图见附图4。其中,上游同源臂的长度为515bp,purAP242N突变基因片段长度为1337bp,下游同源臂的长度为511bp,整合片段的总长为2275bp。PCR验证时,鉴定引物所扩增片段长度应为1879bp,原菌应无条带。
5.上述构建过程所涉及的引物见下表:
/>
/>
实施例2:菌株INO2-6、INO2-7、INO2-8和INO2-9摇瓶发酵生产肌苷实验摇瓶培养方法如下:
斜面活化培养:取-80℃保藏菌种划线接种于活化斜面,37℃培养12h,再传代一次;
种子培养:用接种环刮取一环斜面种子接种于装有30mL种子培养基的500mL三角瓶中,九层纱布封口,37℃,200rpm培养7-10h;
发酵培养:按种子培养液体积10-15%的接种量接种到装有发酵培养基的500mL三角瓶中(终体积为30mL),九层纱布封口,37℃,200r/min振荡培养,发酵过程中通过补加氨水维持pH在7.0-7.2;补加60%(m/v)葡萄糖溶液维持发酵进行;发酵周期24h。
斜面培养基:葡萄糖1-5g/L,蛋白胨5-10g/L,酵母粉1-5g/L,牛肉膏5-10g/L,腺嘌呤0.1-0.3g/L,NaCl 1-2.5g/L,琼脂15-20g/L,其余为水,pH 7.0-7.2。
种子培养基::葡萄糖15-30g/L,酵母粉1-5g/L,蛋白胨1-3g/L,腺嘌呤0.1-0.3g/L,KH2PO4·3H2O 0.1-1.2g/L,MgSO4·7H2O 0.1-0.5g/L,FeSO4·7H2O 2-10mg/L,MnSO4·H2O2-10mg/L,VB1、VB3、VB5、VB12和VH各0.1-1mg/L,消泡剂2滴,其余为水,pH 7.0-7.2。
发酵培养基:葡萄糖15-25g/L,酵母粉1-4g/L,蛋白胨1-5g/L,柠檬酸钠0.1-2g/L,腺嘌呤0.1-0.3g/L,KH2PO4·3H2O 0.1-2g/L,MgSO4·7H2O 0.1-2g/L,FeSO4·7H2O 5-20mg/L,MnSO4·H2O 5-20mg/L,VB1、VB3、VB5、VB12和VH各0.1-2mg/L,消泡剂2滴,其余为水,pH 7.0-7.2。
摇瓶发酵结果:
以INO2-6为出发菌株,分别过表达purFK326Q,P410W、purFD293V,K316Q,S400W、purFK316Q突变基因后,得到菌株INO2-7、INO2-8、INO2-9。摇瓶发酵结果显示(图5),三个菌株的OD600均无明显变化,但肌苷产率均得到不同程度的提升。其中INO2-9的肌苷产率最高,达到1.3g/L,相比INO2-6提升了85.7%。INO2-7与INO2-8肌苷产率相比INO2-6分别提升14.3%和71.4%。我们推测Bacillus amyloliquefaciens TA208来源的PurFK316Q突变体(氨基酸序列如SEQ ID NO:6所示)解反馈效果更好,进而带来了最高的肌苷产率。
实施例3:INO4在5-L罐上发酵生产肌苷实验
发酵罐培养方法如下:
斜面活化培养:取-80℃保藏菌种划线接种于活化斜面,37℃培养12h,转接茄形瓶继续培养12-16h;
种子培养:取适量无菌水于茄形瓶中,将菌悬液接入种子培养基中,pH稳定在7.0左右,温度恒定在37℃,溶氧在25-35%之间,培养至细胞干重达到5-6g/L;
发酵培养:按照15-20%接种量接入新鲜的发酵培养基,开始发酵,发酵过程中控制pH稳定在7.0左右,温度维持在35℃,溶氧在25-35%之间;当培养基中的葡萄糖消耗完之后,流加80%(m/v)的葡萄糖溶液(含1g/L腺嘌呤),维持发酵培养基中的葡萄糖浓度在0.1-2g/L。
斜面培养基:葡萄糖1-5g/L,蛋白胨5-10g/L,酵母粉1-5g/L,牛肉膏5-10g/L,腺嘌呤0.1-0.3g/L,NaCl 1-2.5g/L,琼脂15-20g/L,其余为水,pH 7.0-7.2。
种子培养基::葡萄糖15-30g/L,酵母粉1-5g/L,蛋白胨1-3g/L,腺嘌呤0.1-0.3g/L,KH2PO4·3H2O 0.1-1.2g/L,MgSO4·7H2O 0.1-0.5g/L,FeSO4·7H2O 2-10mg/L,MnSO4·H2O2-10mg/L,VB1、VB3、VB5、VB12和VH各0.1-1mg/L,消泡剂2滴,其余为水,pH 7.0-7.2。
发酵培养基:葡萄糖15-25g/L,酵母粉1-4g/L,蛋白胨1-5g/L,柠檬酸钠0.1-2g/L,腺嘌呤0.1-0.3g/L,KH2PO4·3H2O 0.1-2g/L,MgSO4·7H2O 0.1-2g/L,FeSO4·7H2O 5-20mg/L,MnSO4·H2O 5-20mg/L,VB1、VB3、VB5、VB12和VH各0.1-2mg/L,消泡剂2滴,其余为水,pH 7.0-7.2。
5L发酵罐分批补料发酵结果:如图6所示,发酵初期菌株生长迅速,于16h OD600值达到最高,随后逐渐降低。12~32h,肌苷保持了较高的合成速率,48h的产量达到20.16g/L,糖酸转化率和生产强度分别达到0.114g/g葡萄糖和0.42g/L/h。
虽然本发明已经以较佳实施例公开如上,但其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和原理的情况下,可以对这些实施例进行各种形式和细节的变化、修改、替换和变型,本发明的范围由权利要求及其等同物所限定。
SEQUENCE LISTING
<110> 天津科技大学
<120> 一种生产肌苷的基因工程菌株及其构建方法与应用
<160> 6
<170> PatentIn version 3.5
<210> 1
<211> 1161
<212> DNA
<213> Bacillus amyloliquefaciens TA208
<400> 1
atgaatttca aagtatttct gcttgcagca tctactattg cagtcggatt ggttgaatta 60
attgtgggcg gtattctccc gcaaatcgct tccgacttag acatatcgat cgtcagcgcc 120
gggcagctga tcagcgtgtt cgcgctcggt tacgcggtat caggccctct gcttttggca 180
gtgacggcaa aagctgaacg aaagcggctt tatttaatcg cactttttgt tttcttcctg 240
agtaatctgg tcgcttactt cagtcccaat ttcgccgtac ttatggtgtc acgagtgctc 300
gcttccatga gcacagggct gattgtcgtc ctttctttaa cgattgctcc taaaatcgtg 360
gcgccggaat acagagcgcg ggcgatcggc atcattttca tgggcttcag ctccgcaatc 420
gctttaggcg tgcctgtcgg cattatcatc agcaatgcct tcggatggcg cgtgctgttt 480
ttgggaatcg gcgtattatc tctggtttcc atgctgatta tcagcgtctt ttttgaaaaa 540
atacctgctg aaaaaatgat cccgttccgt gagcagatta aaacgattgg gaacgccaag 600
attgccagcg cgcatcttgt taccttattt acattggcgg ggcattacac actatatgcc 660
tactttgcgc cttttttgga aacaacgctt catttgagtt ctgtttgggt cagtgtatgc 720
tactttttgt tcggcctgtc agcggtatgc ggcggcccgt tcggaggctg gctgtatgac 780
cgtttaggat catttaaaag catcatgctt gtgaccgttt ctttcgcttt gatcctgttt 840
atccttccgc tgtcaacggt ttctttaatc gttttcctgc ctgcgatggt catttgggga 900
ttgctcagct ggagccttgc gccggcgcag caaagctatt tgatcaaaat cgcgcctgag 960
tcttccgata ttcagcaaag cttcaatacg tccgctttgc aaatcggcat tgcgctcggg 1020
tcagccatcg gcggcggcgt gatcggacaa acgggttctg tcacagcaac cgcctggtgc 1080
ggcggtttga ttgtcattat cgcagtcagc ttagccgtat tctctttaac gagacccgct 1140
ttgaaaagaa aatccgcata a 1161
<210> 2
<211> 1431
<212> DNA
<213> 人工序列
<400> 2
atgcttgctg aaatcaaagg cctgaatgaa gaatgcggtg tgtttggcat ctgggggcat 60
gaagaggctc cgcagattac gtattacggc ctgcacagcc tgcagcacag agggcaggag 120
ggcgccggca tcgtggcgac cgacggccaa aaactgacgg ctcataaagg gcaggggctt 180
attaccgagg tttttcaaaa cggcgaactg agcaaagtga aaggcaaagg cgcgatcggt 240
cacgtccgct atgcgacggc cggcggcggc ggatatgaaa atgtccagcc gctcctgttc 300
cgttcgcaaa acaacggcag tctcgcgctc gcccataacg gcaacctggt caatgccaca 360
caattgaaac agcagcttga aaaccaaggg agcatctttc agacttcctc cgatacggaa 420
gtgctggctc atctgattaa acgcagcggc cacttttcac tgaaggatca gatcaaaaat 480
tcgctatcca tgctgaaagg cgcttacgcc tttttaatca tgacagaaac agaaatgatt 540
gtagcgcttg acccgaacgg actcagaccg ctttcactcg gcatgctcgg cgacgcttac 600
gtcgtcgcat cagaaacatg cgcatttgat gtggtcggcg ccacgtacct tcgtgacgta 660
gaaccgggcg aaatgcttat cataaacgat gaaggcttga aatcagagcg tttctccatg 720
aatatcaacc gttctatctg cagcatggag tatatctatt tttcccgtcc ggacagcaat 780
atcgacggca ttaacgtgca cagcgcccgg aagagcctcg ggaaaatgct tgcccaagag 840
tccgctgttg aagcggatgt cgtcacaggc gtgcctgatt ccagtatttc cgcggccatc 900
ggctatgccg aggcaacggg cattccgtac gaactcggtc tcattcaaaa ccgttacgtc 960
ggcagaacgt ttatccagcc gtctcaagct cttcgtgagc aaggagtaag aatgaagctg 1020
tccgccgtcc gcggtgttgt tgaaggaaaa cgggtcgtca tggttgatga ttccatcgtg 1080
cgcgggacga caagccgccg gatcgtcaca atgctccgag aagcgggagc gacagaggtg 1140
catgtaaaga tcagttcgcc tccgatcgcc catccttgct tctacggcat cgacacatca 1200
acccatgagg agctgatcgc ttcctcgcat tcagtggaag aaatccgcca gattatcggc 1260
gccgacacgc tttctttctt aagtgtagac ggattgttaa aaggagtcgg ccgaaaattt 1320
gaagacacca attgcggaca atgcctcgct tgttttacgg gcaaatatcc gacggaaatt 1380
tatcaggata cagtgcttcc tcacgtaaaa gaagcagtgc tgacaaaata a 1431
<210> 3
<211> 12797
<212> DNA
<213> 人工序列
<400> 3
atgcagccgc tagcaggaat catcatggga agcacctccg attgggagac aatgaaacat 60
gcatgcgaca tacttgacga acttcacatt ccttatgaaa aacaggtggt atccgcgcat 120
cggacgcctg atttgatgtt tgaatatgca gaaagcgcca ggagcagagg cttaaaagtc 180
attattgccg gagccggagg agcggcgcat ctgccgggaa tgacggcggc caaaacgaca 240
ctgccggtga tcggtgttcc ggttcagaca aaatcgctta acgggcttga ttctcttttg 300
tctatcgtac agatgcccgg cggcgtgccg gtcgcgacga cagcgatcgg aaaagcgggc 360
gcagtgaacg cgggtctgtt agccgcgcaa attttgtcgg catttgacga tgacattgcg 420
gataaactag aggcgagaag aaatgcgaca aaacaaacgg tgctggaaag cagtgatcag 480
cttgtctgat aaaaaaacga tttttcccgg cgccgtcatc ggcattatcg gaggcggaca 540
gctcggaaaa atgatggctg tcgccgcaaa acagatgggg tataaagtcg cagtcgtcga 600
tcccgtaaaa gactcgccat gcggacagat cgccgatatt gagattaccg cccagtacaa 660
tgaccgtgaa gcgattcaaa aattggccgg agtcagtgac atcattacct acgaatttga 720
aaatatcgat tacgaggcgc tcaactggct caaagaacat gcatatcttc cccagggaag 780
cgagctgctg ctcatcaccc aaaacaggga aacggaaaaa aaggcgatcc agtcagccgg 840
atgtcaggtc gctccttatc ggatcgtaaa cagcagacgg gagcttgagg aagccgttca 900
gtcattgggt cttccggcgg tgctgaaaac atgccggggc ggatatgacg gcaaaggtca 960
atttgtcatt aaggaagaag gacagacaga tgaagcggcc gcactgttag aaaacggcgc 1020
gtgcatactt gaaagctggg tgtcattccg aatggagctt tccgttatcg tgacgagatc 1080
ggtgcacgga gagatttcaa cctttcccgc tgctgaaaat atccaccacc ataatattct 1140
gttccaaagc atcgtgcccg cgagagcgga ggaaacggtt caaaagcggg cagaggcgct 1200
tgccgttcag ctcgcggaga aactggagct cgtcgggccg cttgcggtgg aaatgttcgt 1260
cacggaagac ggagaccttt tgattaatga attggcgccg cgtcctcaca attcagggca 1320
ttatacgctc gatctttgtg aaacgagcca gttcgaacag cacatcagag cggtctgcgg 1380
acttcctctc ggcagaaccg atctgcttaa accgggaatg atggtgaatc ttctcggtga 1440
cgaagtgaag ctggcggagg agcatacgga gcttttaaag gaagccaaac tgtacctgta 1500
cggaaaacat gagattaaaa aaggccgcaa aatggggcat atgacatttt tgcgggagcc 1560
tgatgaaaaa tggattcagg acatcacgaa catatggatg aaaagagacg gaggacgagc 1620
ataatgatcg aacgttattc aagacctgaa atgtccgcga tctggacgga cgaaaacaga 1680
taccaggcat ggctggaagt cgagatttta gcctgtgaag cctgggctga acttggcgtc 1740
attccgaaag aagacgtcaa agtcatgcga gaaaacgcgt ctttcgacat taaccgcatt 1800
ttagaaatcg agcaggatac gcgccatgac gtcgtggcat tcacacgcgc ggtttcagaa 1860
tcattgggcg aagaaagaaa atgggttcac tacggcctga cgtcaacaga tgtcgtggat 1920
accgctcttt cctatctatt aaaacaggcg aatgagattt tactcaagga cattgagaga 1980
tttgttgaca ttataaaaga aaaagcgaaa gaacataaat acacggtcat gatgggccgc 2040
acacacggcg tacacgcaga accaacgaca ttcggcctga agctcgcgct gtggcacgaa 2100
gaaatgaaac gcaaccttga acgtttcaag caggcaaaag aaggaatcga agtcgggaag 2160
ctttccggag cggtcggcac atatgcaaat attgatccgt tcgtagagca gtatgtctgt 2220
gaaaaactcg gcctgaaagc ggcgccgatc tccactcaga cattacagcg cgaccgtcat 2280
gcggattaca tggcggcact tgccctgatc gcgacgagca ttgaaaaatt cgcagtggaa 2340
atccgcggtc tgcaaaagag tgaaacacgg gaagtggaag agttttttgc aaaaggacaa 2400
aaaggctcat cagctatgcc acataaacgg aatccgatcg ggtctgaaaa tatgacgggg 2460
atggcgcgcg tgatccgcgg atacatgctg acggcatacg aaaatgttcc gttatggcat 2520
gagcgtgata tttctcattc atcagctgag cgcatcattc ttcctgacgc gacaaccgcg 2580
ctgaattaca tgctgaaccg tttcagcaat atcgtcaaaa acttaacggt attcccggaa 2640
aatatgaaac gcaacatgga ccgcacactg ggtctaatct attctcagcg cgtgctgctc 2700
gctttaattg acacgggtct gcctcgtgaa gaagcatatg acacggttca gccgaaagcg 2760
atggaagcgt gggaaaaaca agtgccgttc cgtcagcttg tcgaagcgga ggaaaaaatc 2820
acgtcccgtc ttacaccgga acagattgcc gattgctttg actacaatta tcatttgaaa 2880
aacgtcgact tgatctttga tcgtttaggt ttatagaaga agccagccgg aggcggcttc 2940
ttcagccgcc atagattgaa tattcccaac attcgggtta ggaggccttc cgtgaatatt 3000
gtgaaaagta atcttcttta tgaaggaaaa gcgaaacgaa tttatcaaac tgaggacgaa 3060
cagattctcc gtgtggtcta caaggattcc gcaacagcct ttaacggcga gaaaaaagcg 3120
gagatcactg gaaagggccg tctgaacaat gaaatttcaa gcctgatctt caaacatctg 3180
cacgccaaag gaattgacaa ccattttgtg gagcgtgttt cagaatcaga gcagcttatc 3240
aaaaaagtaa gcatcgttcc gcttgaagtc gtggtcagaa acattgccgc cggaagcatg 3300
tcgaaacgcc tcggcatccc ggaaggaaca gagcttccgc agccgattat cgaattttac 3360
tataaagatg acgcactcgg tgatccgctc ataaccgaag atcatatctg gctgttaaaa 3420
gcagcttcat ccgaacaggt ggaaacgatc aaatcaatta caagacaggt gaataaagag 3480
ctgcagctta tttttgaaga ctgcggtgtc agattaatag attttaagct ggaattcggc 3540
ttagacgcag agggacgggt gcttttagcg gatgagattt ctcctgacac gtgccgtctg 3600
tgggacaaag acacgaacga aaagctcgat aaagatttgt tcagacggaa cctgggaagc 3660
ttaaccgacg catatgaaga gattttcaaa agactgggag gcatttcata atgtataaag 3720
tgaaagttta tgtcagctta aaagaaagtg tgcttgatcc tcaaggaagc gcggtgcagc 3780
atgcattgca cagcatgacc tacaatgaag tgcaggatgt gcgcatcgga aaatacatgg 3840
agctgacgct ggaaaaatca gaccgcgatc ttgatgaact cgtgaaagaa atgtgtgaga 3900
agctccttgc caatacagtc attgaagact accgatatga agttgaggag gttgtcgcac 3960
agtgaaattt gcggtgattg tgttaccagg ctctaactgc gatattgata tgtatcacgc 4020
cgtaaaggac gaactcggcg aagaagtgga gtatgtctgg cacgaggaaa caagccttga 4080
cggatttgac ggcgtgctca tccccggcgg cttttcttac ggcgactacc tgagatgcgg 4140
cgccatcgcc agattcgcca acatcatgcc ggccgtgaaa aaagcggctg ctgaaggaaa 4200
accggttctc ggcgtctgca acggattcca gattttgcag gagctcggtc tgctgcccgg 4260
cgccatgaga cgcaataaag atttaaaatt catttgccgc ccggttgaat taatcgtgca 4320
gaacggtgaa acaatgttca cttcttccta caaagaggga caatcaatta cgattcccgt 4380
tgcccacggc gaaggcaatt tctactgtga tgacgaaacg cttgaaagat taaaagaaaa 4440
caatcaaatc gctttcacat acggcggcga tattaacgga agcgtcagcg gcattgccgg 4500
cgtcgtgaat gagaaaggca acgtattagg catgatgcct cacccggagc gcgcggtcga 4560
tgaactgctc ggcagcgcag acggtcttac attgttccag tctatcgtga aaaattggag 4620
ggaaattcat gtcgctactg cttgaaccaa gtaaagaaca aataaaagaa gagaaactct 4680
atcagcaaat gggtgtcagt gatgacgagt tcgcactcat tgaatctatt atcggaagat 4740
tgccaaacta cacggaaatc gggatttttt ccgtgatgtg gtcagagcac tgcagctata 4800
aaaattctaa gccgatttta cgcaaattcc cgacaagcgg cgaacgcgtg ctgcaaggtc 4860
ccggggaagg cgcggggatc gttgacatcg gtgacaatca ggcggttgtg ttcaaaattg 4920
aatcgcataa ccacccgtca gcgcttgagc cataccaggg tgctgcgacg ggagtgggcg 4980
gcatcatccg tgacgttttc tcaatgggcg cccgtccgat agctgtatta aactctcttc 5040
gatttggtga actcacttca ccgcgtgtga agtacttgtt tgaagaagta gtggctggaa 5100
tcgcgggata cggaaactgt atcggcattc cgacggtcgg cggggaagtt cagtttgacg 5160
caagctatga gggcaatccg cttgtcaatg ccatgtgcgt cggcctaatt gatcataagg 5220
atattaaaaa aggccaggcg aaaggtgtcg gcaacacggt tatgtacgtc ggcgctaaga 5280
cgggacgcga cggcattcac ggcgctactt tcgcatcaga agaaatgtca gattcatctg 5340
aagaaaaacg ctccgcggtg caggtcggcg atcctttcat ggaaaagctt cttcttgaag 5400
cctgcctgga agtcatccag tgcgacgcgt tagtcggcat tcaggatatg ggagcggccg 5460
gtctgacaag ttcaagcgct gaaatggcaa gtaaagccgg atcaggcatt gaaatgaacc 5520
ttgatctcat tccgcagcgg gaaacgggta tgaccgctta tgaaatgatg ctttccgaat 5580
ctcaggaacg catgcttctc gttattgaac gcgggcgtga acaggaaatt gtcgatattt 5640
ttaataaata tgatcttgaa gcggtttccg tgggtcatgt cacggatgat aaaatgctcc 5700
gcctccgcca taacggagag gttgtttgcg agcttccggt tgacgcgctg gcggaagaag 5760
cccctgtata tcataagccg tcagcagaac ccgcgtacta ccgcgagttt caggaaactg 5820
aagttcccgc gcctgaagta aaagacgcga cagagacgct ttttgccctg ctgcagcagc 5880
cgacaattgc gagcaaagag tgggtgtacg atcaatatga ttacatggtg cgcacgaaca 5940
cggtggtggc tccgggctct gacgcgggag tgctcagaat ccgcggcacg aaaaaggcgc 6000
tggcaatgac gacggattgc aacgcccgct atttgtatct cgatcctgaa gaaggcggaa 6060
aaatcgccgt tgccgaagcg gcgcgcaaca tcgtttgctc cggtgccgag ccgcttgcgg 6120
tcacggataa tctgaatttc ggaaacccgg aaaaacctga aattttctgg cagatcgaaa 6180
aagcggccga cggcatcagc gaggcatgca atgttctcag cacacctgtc atcggcggaa 6240
acgtatcact ttataatgaa tcgaacggaa cggccatcta tccgacgccg gtcatcggta 6300
tggtcgggtt aatcgaagat acggctcata ttacgacaca gcatgtcaaa gcggcgggag 6360
acttgattta cgtcatcggt gaaacgaagc ctgagtatgc aggaagtgaa cttcagaaaa 6420
tgactgaagg gaaaatctat ggcaaagcgc ctgaaattga tcttgacgtt gaaaaagccc 6480
gccaaacatc gcttctgaac gccattaaac aaggtctggt ccaatctgcg catgacgtgt 6540
cagaaggcgg attgggtgtg gcgattgcag aaagcgtcat gacgacagac ggactcggcg 6600
caaacatcac ggcatttaat gaagcggctc ttttgttcag tgagtctcaa tcccgcttcg 6660
tcgtttccgt aaaggaagaa aacaaggcgg cgtttgaagc ggctgcggca gatgccgttc 6720
atatcggtga agtgacaggg gacggacagt tgacgatccg aagccaagaa ggacaacaat 6780
tggttcacgc gcaaacgaaa gaacttgagc gcgcgtggaa aggagctatt ccatgcttgc 6840
tgaaatcaaa ggcctgaatg aagaatgcgg tgtgtttggc atctgggggc atgaagaggc 6900
tccgcagatt acgtattacg gcctgcacag cctgcagcac agagggcagg agggcgccgg 6960
catcgtggcg accgacggcc aaaaactgac ggctcataaa gggcaggggc ttattaccga 7020
ggtttttcaa aacggcgaac tgagcaaagt gaaaggcaaa ggcgcgatcg gtcacgtccg 7080
ctatgcgacg gccggcggcg gcggatatga aaatgtccag ccgctcctgt tccgttcgca 7140
aaacaacggc agtctcgcgc tcgcccataa cggcaacctg gtcaatgcca cacaattgaa 7200
acagcagctt gaaaaccaag ggagcatctt tcagacttcc tccgatacgg aagtgctggc 7260
tcatctgatt aaacgcagcg gccacttttc actgaaggat cagatcaaaa attcgctatc 7320
catgctgaaa ggcgcttacg cctttttaat catgacagaa acagaaatga ttgtagcgct 7380
tgacccgaac ggactcagac cgctttcact cggcatgctc ggcgacgctt acgtcgtcgc 7440
atcagaaaca tgcgcatttg atgtggtcgg cgccacgtac cttcgtgacg tagaaccggg 7500
cgaaatgctt atcataaacg atgaaggctt gaaatcagag cgtttctcca tgaatatcaa 7560
ccgttctatc tgcagcatgg agtatatcta tttttcccgt ccggacagca atatcgacgg 7620
cattaacgtg cacagcgccc ggaagagcct cgggaaaatg cttgcccaag agtccgctgt 7680
tgaagcggat gtcgtcacag gcgtgcctga ttccagtatt tccgcggcca tcggctatgc 7740
cgaggcaacg ggcattccgt acgaactcgg tctcattcaa aaccgttacg tcggcagaac 7800
gtttatccag ccgtctcaag ctcttcgtga gcaaggagta agaatgaagc tgtccgccgt 7860
ccgcggtgtt gttgaaggaa aacgggtcgt catggttgat gattccatcg tgcgcgggac 7920
gacaagccgc cggatcgtca caatgctccg agaagcggga gcgacagagg tgcatgtaaa 7980
gatcagttcg cctccgatcg cccatccttg cttctacggc atcgacacat caacccatga 8040
ggagctgatc gcttcctcgc attcagtgga agaaatccgc cagattatcg gcgccgacac 8100
gctttctttc ttaagtgtag acggattgtt aaaaggagtc ggccgaaaat ttgaagacac 8160
caattgcgga caatgcctcg cttgttttac gggcaaatat ccgacggaaa tttatcagga 8220
tacagtgctt cctcacgtaa aagaagcagt gctgacaaaa taaagtctga aaatgatata 8280
aaggcagcgc gatttcaggc tgcctttctc tttctgcctt ttgaggagaa acgaattgac 8340
aaggagtgat agggatgtct gatgcttata aaaatgccgg agttgacatt gaagccggat 8400
atgaagccgt caaacgaatg aaaaaacatg tggagcgcac gaaaaggctc ggcgttatgg 8460
gaagcttggg cggttttggc ggaatgtttg atctgtcaga gctcccgtat caaaagcctg 8520
ttttaatttc cggaacagac ggtgtcggca ccaagctgaa actcgctttt tcaatggata 8580
agcatgacac gatcggcgta gatgcggtgg cgatgtgtgt aaatgatgtg ctcgcccaag 8640
gagcggagcc gctgtttttc cttgattatt tagcagtcgg caaggccgat ccggtaaaaa 8700
ttgagcagat cgttcagggc gtggcagatg gctgcgagca gtcaggatca gcgcttatcg 8760
gcggtgagac ggcggaaatg ccggggctct atacggctga tgaatacgat attgccggct 8820
tttcagtcgg agtcgcggaa aaagacgaaa tcgtcaccgg tgaacatatc gaagaggggc 8880
atctcttaat cggacttact tcaagcggcc ttcacagcaa cggattttcc cttgtgagaa 8940
aggtgcttct tgatgacggc ggacttgatt tggatactgt ctatgaaccc ttcgcgcggc 9000
cgctcggaga agaattgctg gaaccgacga gaatatatgt gaagccggtg cttgaagcgg 9060
tgaaaagcgg taaggtggac ggcatggcgc atgtgacagg cggaggattc atcgagaaca 9120
ttccgcggat gctgccggac ggattgagcg cggaaattga tcacgggtca tggccgatcc 9180
cgccgatttt tccgtttttg caggagcacg gcaagctgaa agaagaagaa atgttcaacg 9240
tctttaacat gggcatcggt tttgtccttg ccgttaaaga agaaaacctg acagacgtca 9300
tcgacacgct tgaagctaag ggcgagaagg cttatttgat cgggcgggtc aagcagggcg 9360
aaggcatttc tttcggcggt gcggctcttt catgaaaaaa tttgcagtat ttgcttcagg 9420
aaacggatcg aacttcgagg ccattgccaa acgcatgaga gaagagaagt gggacgcgga 9480
gctatcgctt ctcgtgacgg acaagcctca ggcgaaggcg gtggaaaggg ccgaggcttt 9540
acaaatcccg tcattcgcct ttgaaccgtc agcttttgaa aacaaggccg cctttgaacg 9600
ggccattatt gagcagcttc gccttcacgg ggttgaatta atcgttctcg ccggctatat 9660
gagactgatc ggagatacgc tgcttgaagc atacggaggc aggattatca atatacatcc 9720
gtcgcttctc ccggcgtttc cgggcattga cgctgtcgga caagcgcatc gtgccggtgt 9780
gaaagtggcg ggcattaccg ttcattacgt cgacgaaggc atggacaccg gaccgattat 9840
cgcgcaaaaa gcattcgaga tacaggaaaa cgatacgctt gaagatatgg aacatacaat 9900
acacgagctt gagcacaaat ggtatccgag cgttgtgaaa cagctgctgg gactaaataa 9960
cagaggtgaa aaggcatgac aatcaaacgc gcactaatca gtgtttctga taaaacaaat 10020
cttgtacctt tcgtaaagga actgacagag ctcggcgtcg aagtcatttc gaccggagga 10080
acaaaaaaac ttctccagga aaacggtgtg gatgtcatcg gcatttcgga agtgactgga 10140
tttcctgaaa ttatggacgg acggttaaaa acgctccatc ctaatattca cggcggcctg 10200
cttgccgtaa gagacaatga agagcatatg gcgcagatca atgaacacgg cattgcaccc 10260
attgatcttg tggtcgtcaa cctttacccg tttaaagaaa cgatttcaaa agaagacgta 10320
acatacgatg aagcgataga aaacattgat atcggcggtc ccggcatgct gcgcgccgca 10380
tcgaaaaacc atcaggatgt gacggtcatc acggacccgg ccgattacag ctccgtgctc 10440
aatgagatta aagaatacgg cggcgtttcg cttaaaagaa aacgcgagct tgcggccaaa 10500
gtattccgcc acaccgcggc atacgacgca ttaattgctg attacttaac acacgaggcc 10560
ggtgagaaag accctgagca attcaccgtt acatttgaga aaaaacaatc gctccgctac 10620
ggcgaaaacc ctcaccaaga ggctgttttc taccaaagcg cactgcctgt ctccggttcc 10680
attgcggcgg caaaacagct tcacggcaaa gagctttctt acaacaacat taaagacgcg 10740
gatgcggccg ttcaaatcgt ccgggaattt acagaacccg ccgctgttgc cgttaaacat 10800
atgaacccat gcggagtcgg tacgggagcc acaattgagg aagcgttcaa taaagcgtat 10860
gaagcggaca aaacgtccat tttcggcggc atcatcgcgc tcaaccgtga agttgatcag 10920
gcaacggccg aagcccttca cggcatcttt ttagaaatca tcatcgcccc ttctttcagt 10980
gaagaagcgc tgaatgtgct gacgtcgaag aaaaaccttc gtctgctcac gcttgacgtg 11040
aatgcagcag ggaagaaaga aaaacagctg acttccgtac agggcggcct tttgattcaa 11100
gatttagacg tgcacggatt tgatgacgca aaaatcagca ttccgacaaa aagagagccg 11160
agcgagcagg agtgggaaga tctgaagctg gcttggaaag tcgtcaaaca cgtgaaatca 11220
aacgcgatcg ttcttgcaaa agaccatatg acggtcggtg tgggtgcagg acagatgaat 11280
cgcgtcggtt cggccaaaat cgccatcgag caggccggag aaaaagcaaa aggcagcgcg 11340
ctcggatcag acgcgttttt cccgatgccg gatacagtcg aagaagccgc aaaagcgggc 11400
gtcacggcga tcatccagcc cggcggatcg gtccgcgacg aagattcaat taaaaaagcg 11460
gatgaatacg gcatcgccat ggtcttcaca ggcatcagac atttcaaaca ttaagggagg 11520
aacgaagcgt gaatgtattg attatcggta aaggcggcag agagcataca ttggcttgga 11580
aagcggcgca aagtccgctt actgacacgg tgtacgccgc gcccggaaat gacggtatgg 11640
cagactgcgc gacgctggtc agcatcgaag aaagcgatca tgccggactc attgcctttg 11700
cgaaagaaca tcatgtcggc ctgacgatta tcggtcccga ggttcctctc attgaaggga 11760
tagcggacga gtttgaaaaa gccggactcc ttgttttcgg gccgtccgaa caagcggcaa 11820
tcattgaagg aagcaaacag tttgcgaagg atttaatgaa aaaatacggt ataccgacgg 11880
cggagtatga gacgtttact tcatttgaag aggcgaaagc atatgtgcag cagaaaggcg 11940
cgccgattgt cattaaagcg gacgggcttg ccgccggaaa aggtgtgacg gtcgcgatga 12000
cggaagagga agcgattgaa tgccttcatg attttctcga ggatgagaaa ttcggcgagg 12060
cgagcgcatc cgtggtcatt gaagaatttc tcgccggtga agaattttcc ttaatggcgt 12120
ttgtaaaagg ggagaccgtc tatccgatgg tgatcgccca agaccataaa cgcgccttcg 12180
acggagacaa agggccgaat acgggcggaa tgggcgccta ctcaccggtg ccgcacattt 12240
ccgatgacat cgtcaaaagc gctgtcgaaa cgattgtgaa gccggcggca aaagctatgg 12300
tgaaagaggg acgctccttc acaggcgtgc tgtacgcggg gctgattctg acggaaaacg 12360
gatcaaaagt cattgaattc aacgcgcgct tcggtgatcc ggaaacacag gttgtggtgc 12420
cgagaatgga atcagacctc attcaggtgc ttttggatct gcttcatgag aaggatgttg 12480
acctaaggtg gaaggatacg gccgctgtca gcgttgtgct ggcttctgag ggctatcctg 12540
aaggctatgc gaaagggaca ccgatcggca gtttgacatc cgctgaagac gggatcgccg 12600
tttttcatgc cggaacgaaa aaagacggcg atcaatttgt cacaaacggc ggccgggtcg 12660
ccaatgtcac ggcatttgct gagacatttg aagaggcgag agataaagtg tacagcgccg 12720
tttccggtct gacaaaaccc ggactgtttt acagaagcga tatcggcgtc cgtgcgctga 12780
aagcatcgct gcgataa 12797
<210> 4
<211> 1293
<212> DNA
<213> 人工序列
<400> 4
atgtcttcag tagttgtagt aggtacgcaa tggggcgatg aaggaaaagg taaaattaca 60
gatttcctat cagaaaatgc agaagtgatc gcccgttatc aaggcggaaa taacgcaggg 120
catacaatca agtttgacgg aatcacatat aagcttcact taatcccgtc tggaattttc 180
tataaggata aaacgtgtgt aatcggaaac ggaatggttg tagatccgaa agcattagtc 240
acagagcttg cgtatcttca tgagcgcaac gtgagtacag ataacctgag aatcagcaac 300
agagctcacg tcattctgcc gtatcatttg aaattggatg aagtggaaga agagcgtaaa 360
ggggctaaca agatcggcac aacgaaaaaa ggaatcggcc ctgcttacat ggataaagca 420
gcccgcatcg gaattcgcat cgcggatctg ttagaccgtg acgcgtttgc ggaaaagctt 480
gagcgcaatc ttgaagaaaa aaaccgtctt ctcgagaaaa tgtacgagac agaagggttt 540
aaacttgagg atatcttaga cgaatattat gagtacggac agcagattaa aaagtatgtt 600
tgcgatacat ctgttgtctt aaacgatgct cttgatgaag ggcgccgtgt attatttgaa 660
ggcgcacaag gggttatgct cgatatcgac caaggaacat acccgtttgt tacgtcatct 720
aacaatgttg ccggcggtgt cacgatcggt tctggtgtcg gcccgaccaa aatcaagcac 780
gttgtcggtg tatcaaaagc atatacgact cgtgtcggcg acggtccttt tccgactgag 840
ctgaaagatg aaatcggcga tcaaatccgt gaagtcggac gcgaatatgg aacaacaaca 900
ggccgcccgc gccgtgtcgg ctggtttgac agcgttgttg tccgccacgc ccgccgtgtg 960
agcggaatta cagatctttc tctgaactca attgacgtcc tagcaggaat tgaaacgttg 1020
aaaatctgtg tggcgtaccg ctacaaaggc gaaatcattg aagaattccc agcaagtctt 1080
aaggcacttg ctgaatgtga gccggtatat gaagaaatgc cgggctggac tgaggatatt 1140
acaggtgcga agagcttgag cgagcttccg gaaaatgcgc gccattatct tgagcgtgtg 1200
tctcagctga caggcattcc gctttctatt ttctctgtcg gtccagaccg ctcacaaaca 1260
aatgtccttc gcagtgtgta ccgtgcgaac taa 1293
<210> 5
<211> 74
<212> DNA
<213> 人工序列
<400> 5
ttgacaatta atcatccggc tcgtataatg tgtggaattg tgagcggata acaatttcac 60
acaggaaaca gacc 74
<210> 6
<211> 476
<212> PRT
<213> 人工序列
<400> 6
Met Leu Ala Glu Ile Lys Gly Leu Asn Glu Glu Cys Gly Val Phe Gly
1 5 10 15
Ile Trp Gly His Glu Glu Ala Pro Gln Ile Thr Tyr Tyr Gly Leu His
20 25 30
Ser Leu Gln His Arg Gly Gln Glu Gly Ala Gly Ile Val Ala Thr Asp
35 40 45
Gly Gln Lys Leu Thr Ala His Lys Gly Gln Gly Leu Ile Thr Glu Val
50 55 60
Phe Gln Asn Gly Glu Leu Ser Lys Val Lys Gly Lys Gly Ala Ile Gly
65 70 75 80
His Val Arg Tyr Ala Thr Ala Gly Gly Gly Gly Tyr Glu Asn Val Gln
85 90 95
Pro Leu Leu Phe Arg Ser Gln Asn Asn Gly Ser Leu Ala Leu Ala His
100 105 110
Asn Gly Asn Leu Val Asn Ala Thr Gln Leu Lys Gln Gln Leu Glu Asn
115 120 125
Gln Gly Ser Ile Phe Gln Thr Ser Ser Asp Thr Glu Val Leu Ala His
130 135 140
Leu Ile Lys Arg Ser Gly His Phe Ser Leu Lys Asp Gln Ile Lys Asn
145 150 155 160
Ser Leu Ser Met Leu Lys Gly Ala Tyr Ala Phe Leu Ile Met Thr Glu
165 170 175
Thr Glu Met Ile Val Ala Leu Asp Pro Asn Gly Leu Arg Pro Leu Ser
180 185 190
Leu Gly Met Leu Gly Asp Ala Tyr Val Val Ala Ser Glu Thr Cys Ala
195 200 205
Phe Asp Val Val Gly Ala Thr Tyr Leu Arg Asp Val Glu Pro Gly Glu
210 215 220
Met Leu Ile Ile Asn Asp Glu Gly Leu Lys Ser Glu Arg Phe Ser Met
225 230 235 240
Asn Ile Asn Arg Ser Ile Cys Ser Met Glu Tyr Ile Tyr Phe Ser Arg
245 250 255
Pro Asp Ser Asn Ile Asp Gly Ile Asn Val His Ser Ala Arg Lys Ser
260 265 270
Leu Gly Lys Met Leu Ala Gln Glu Ser Ala Val Glu Ala Asp Val Val
275 280 285
Thr Gly Val Pro Asp Ser Ser Ile Ser Ala Ala Ile Gly Tyr Ala Glu
290 295 300
Ala Thr Gly Ile Pro Tyr Glu Leu Gly Leu Ile Gln Asn Arg Tyr Val
305 310 315 320
Gly Arg Thr Phe Ile Gln Pro Ser Gln Ala Leu Arg Glu Gln Gly Val
325 330 335
Arg Met Lys Leu Ser Ala Val Arg Gly Val Val Glu Gly Lys Arg Val
340 345 350
Val Met Val Asp Asp Ser Ile Val Arg Gly Thr Thr Ser Arg Arg Ile
355 360 365
Val Thr Met Leu Arg Glu Ala Gly Ala Thr Glu Val His Val Lys Ile
370 375 380
Ser Ser Pro Pro Ile Ala His Pro Cys Phe Tyr Gly Ile Asp Thr Ser
385 390 395 400
Thr His Glu Glu Leu Ile Ala Ser Ser His Ser Val Glu Glu Ile Arg
405 410 415
Gln Ile Ile Gly Ala Asp Thr Leu Ser Phe Leu Ser Val Asp Gly Leu
420 425 430
Leu Lys Gly Val Gly Arg Lys Phe Glu Asp Thr Asn Cys Gly Gln Cys
435 440 445
Leu Ala Cys Phe Thr Gly Lys Tyr Pro Thr Glu Ile Tyr Gln Asp Thr
450 455 460
Val Leu Pro His Val Lys Glu Ala Val Leu Thr Lys
465 470 475

Claims (5)

1.一种大肠杆菌基因工程菌株,其特征在于:该基因工程菌株以E.coli MG1655为出发菌株,将SEQ ID NO:1所示的核苷转运蛋白基因pbuE整合在yjiT假基因位点,将SEQ ID NO:2所示的PRPP转酰胺酶突变基因purFK316Q整合在yeeP假基因位点,将SEQ ID NO:3所示的嘌呤操纵子突变基因purEKBCSQLFK316Q MNHD整合在yghE假基因位点,将腺苷琥珀酸合成酶基因purA替换为SEQ ID NO:4所示的突变基因purAP242N,并且敲除嘌呤核苷磷酸化酶基因deoD、ppnP以及核苷水解酶基因rihA、rihB、rihC。
2.根据权利要求1所述的基因工程菌株,其特征在于:所述核苷转运蛋白基因pbuE连接有启动子Ptrc;和/或
所述嘌呤操纵子突变基因purEKBCSQLFK316QMNHD连接有启动子Ptrc;和/或
所述PRPP转酰胺酶突变基因purFK316Q连接有启动子Ptrc
所述启动子Ptrc的核苷酸序列如SEQ ID NO:5所示。
3.权利要求1或2所述基因工程菌株的构建方法,其特征在于:所述构建方法包括:
(1)从菌株E.coli MG1655基因组出发,敲除嘌呤核苷磷酸化酶基因deoD、ppnP,并敲除核苷水解酶基因rihA、rihB、rihC;
(2)将核苷酸序列如SEQ ID NO:3所示的嘌呤操纵子purEKBCSQLFK316QMNHD与启动子Ptrc的融合片段Ptrc-purEKBCSQLFK316QMNHD整合在yghE假基因位点;
(3)将核苷酸序列如SEQ ID NO:2所示的PRPP转酰胺酶突变基因purFK316Q与启动子Ptrc的融合片段Ptrc-purFK316Q整合在yeeP假基因位点;
(4)将核苷酸序列如SEQ ID NO:1所示的核苷转运蛋白基因pbuE与启动子Ptrc的融合片段Ptrc-pbuE整合在yjiT假基因位点;
(5)将腺苷琥珀酸合成酶基因purA替换为核苷酸序列如SEQ ID NO:4所示的突变基因purAP242N,获得所述基因工程菌株。
4.权利要求1或2所述基因工程菌株在发酵生产肌苷中的应用。
5.根据权利要求4所述的应用,其特征在于,所述应用包括:在适宜条件培养所述基因工程菌株,并从其培养物中收集肌苷;所述适宜条件是指培养温度35℃,维持pH在7.0左右,溶氧在25-35%之间,并且培养基组成为:葡萄糖15-25g/L,酵母粉1-4g/L,蛋白胨1-5g/L,柠檬酸钠0.1-2g/L,腺嘌呤0.1-0.3g/L,KH2PO4·3H2O 0.1-2g/L,MgSO4·7H2O 0.1-2g/L,FeSO4·7H2O 5-20mg/L,MnSO4·H2O 5-20mg/L,VB1、VB3、VB5、VB12和VH各0.1-2mg/L,消泡剂2滴,其余为水,pH 7.0-7.2。
CN202111481366.1A 2021-12-06 2021-12-06 一种生产肌苷的基因工程菌株及其构建方法与应用 Active CN114317386B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111481366.1A CN114317386B (zh) 2021-12-06 2021-12-06 一种生产肌苷的基因工程菌株及其构建方法与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111481366.1A CN114317386B (zh) 2021-12-06 2021-12-06 一种生产肌苷的基因工程菌株及其构建方法与应用

Publications (2)

Publication Number Publication Date
CN114317386A CN114317386A (zh) 2022-04-12
CN114317386B true CN114317386B (zh) 2023-12-08

Family

ID=81047956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111481366.1A Active CN114317386B (zh) 2021-12-06 2021-12-06 一种生产肌苷的基因工程菌株及其构建方法与应用

Country Status (1)

Country Link
CN (1) CN114317386B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110656073B (zh) * 2018-06-28 2022-06-28 中国科学院青岛生物能源与过程研究所 一种生产黄嘌呤的重组菌及其构建方法和应用
CN117363553B (zh) * 2023-12-07 2024-02-20 天津科技大学 一种生产2’-脱氧腺苷的基因工程菌及其构建方法与应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103952422A (zh) * 2014-04-15 2014-07-30 天津大学 枯草芽孢杆菌编码PRPP转酰胺酶突变基因purF及应用
WO2019013696A1 (en) * 2017-07-14 2019-01-17 Biopetrolia Ab MICROBIAL CELLS FOR THE PRODUCTION OF SPERMIDINE
CN113278596A (zh) * 2021-05-24 2021-08-20 廊坊梅花生物技术开发有限公司 可提高芽孢杆菌核苷产量的突变体及其应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103952422A (zh) * 2014-04-15 2014-07-30 天津大学 枯草芽孢杆菌编码PRPP转酰胺酶突变基因purF及应用
WO2019013696A1 (en) * 2017-07-14 2019-01-17 Biopetrolia Ab MICROBIAL CELLS FOR THE PRODUCTION OF SPERMIDINE
CN111201316A (zh) * 2017-07-14 2020-05-26 克里希有限公司 用于亚精胺产生的微生物细胞
CN113278596A (zh) * 2021-05-24 2021-08-20 廊坊梅花生物技术开发有限公司 可提高芽孢杆菌核苷产量的突变体及其应用

Also Published As

Publication number Publication date
CN114317386A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN114317386B (zh) 一种生产肌苷的基因工程菌株及其构建方法与应用
CN106795485A (zh) 生产o‑磷酸丝氨酸的微生物和利用其生产o‑磷酸丝氨酸或l‑半胱氨酸的方法
CN110325642A (zh) 产生l-氨基酸的棒状杆菌属微生物和使用其生产l-氨基酸的方法
CN117363553B (zh) 一种生产2’-脱氧腺苷的基因工程菌及其构建方法与应用
CN110846333B (zh) 一种deoB基因改造的重组菌株及其构建方法与应用
CN110592084B (zh) 一种rhtA基因启动子改造的重组菌株及其构建方法与应用
CN112708569B (zh) 发酵生产硫酸软骨素的酵母工程菌及其应用
JP7072809B2 (ja) 組換え微生物、その製造方法及び補酵素q10の生産における使用
CN110592109B (zh) 一种spoT基因改造的重组菌株及其构建方法与应用
CN114410561B (zh) 一种生产胸苷的基因工程菌株及其构建方法与应用
CN114181288B (zh) 制备l-缬氨酸的方法及其所用的基因与该基因编码的蛋白质
CN108690837B (zh) 一种提高多聚体蛋白热稳定性的方法及热稳定性提高的醇脱氢酶
CN112266923A (zh) 一种表达腺苷蛋氨酸合酶的枯草芽孢杆菌及应用
CN107810269A (zh) 新颖的启动子及其用途
WO2024099089A1 (zh) 一种生产假尿苷的基因工程菌株及其构建方法与应用
KR102634303B1 (ko) 퓨린 뉴클레오티드를 생산하는 미생물 및 이를 이용한 퓨린 뉴클레오티드의 생산방법
CN114315998B (zh) Cey17_rs00300基因突变体及其在制备l-缬氨酸中的应用
KR102613937B1 (ko) 갈락토스 이용에 관여하는 모든 유전자가 결손된 효모 균주 및 이를 이용한 재조합 단백질 생산방법
CN114539367B (zh) Cey17_rs11900基因突变体及其在制备l-缬氨酸中的应用
CN110331121B (zh) 一种高产脂肽的重组菌及其应用
EP4253570A2 (en) Escherichia coli-based recombinant strain and construction method therefor and application thereof
KR20230171239A (ko) 부티레이트를 생산하는 박테로이데스 테타이오타오미크론 균주 및 이를 이용한 부티레이트 생산 방법
CN115678869A (zh) 一株重组菌株及其生产氨基酸的方法
CN114315999A (zh) leuD蛋白突变体和相关生物材料及其在制备L-缬氨酸中的应用
EP4253569A2 (en) Escherichia coli-based recombinant strain, construction method therefor and use thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant