CN114774421B

CN114774421B - 运动发酵单胞菌内源性启动子突变体

Info

Publication number: CN114774421B
Application number: CN202210493106.4A
Authority: CN
Inventors: 杨世辉; 宋皓月; 杨永富; 李涵; 杜军
Original assignee: Hubei University
Current assignee: Wuhan Ruijiakang Biotechnology Co ltd
Priority date: 2022-05-07
Filing date: 2022-05-07
Publication date: 2023-04-28
Anticipated expiration: 2042-05-07
Also published as: CN114774421A

Abstract

本申请公开了运动发酵单胞菌内源性启动子突变体，所述启动子突变体引导可嵌合连接的异源核酸的表达，促进异源核酸的表达，同时这些启动子突变体是相对于野生型启动子具有显著增强功能的高表达启动子，用于在发运动发酵单胞菌属和/或埃希氏菌属细胞中表达嵌合基因。

Description

运动发酵单胞菌内源性启动子突变体

技术领域

本申请涉及合成生物学和基因工程技术领域，尤其涉及运动发酵单胞菌内源性启动子突变体。

背景技术

合成生物学作为一门新兴的交叉学科，正在蓬勃发展中，在农业、工业、智能材料和生物医学等领域都有广泛的应用。合成生物学的基础是生物元件，充足且与底盘兼容的生物元件(包括启动子、终止子、核糖体结合位点和核糖开关等)是有效设计和组装基因线路，实现合成生物学工程化的关键。启动子作为核心生物元件，是转录起始所需的一段DNA序列，通常位于功能基因5'端上游，包含特异性结合RNA聚合酶和转录调节因子(如调节蛋白和small RNA)的保守序列。启动子的基因序列决定了下游基因的表达强度和表达模式(组成型或诱导型)，因此成为驱动基因表达、调节基因回路和获得高效细胞工厂的关键组成部分，现阶段可以通过不同强度的启动子实现靶基因高效和精准的表达和调控。

然而，随着对靶基因的高效表达和精准调控的要求不断提高，对启动子的强度和在不同底盘细胞中的兼容性的要求也不断提高，例如，往往当一个宿主内源性启动子在另一个宿主中使用时，启动子的强度通常会发生改变，从而影响下游基因的表达。

发明内容

运动发酵单胞菌是一种天然产乙醇的非模式菌株，是目前已知的唯一一种利用Entner-Doudoroff(ED)途径厌氧发酵的微生物。它具有许多作为工业底盘开发的优良特性，例如：快速高效的糖利用、高乙醇产量和耐受性、厌氧发酵副产物少、在酸性pH范围(pH4～8)内具有出色的发酵性能。此外，运动发酵单胞菌的基因组很小，包括内源性和外源性CRISPR-cas编辑***在内的各种基因组工程工具已被开发；全基因组代谢网络模型的发展和积累的组学数据的可用性也使运动发酵单胞菌成为进一步发展的理想底盘。

在运动发酵单胞菌中，驱动编码参与糖酵解的酶基因表达的启动子(如Pgap、Ppdc、Peno和PadhB)通常是强启动子。其中，Pgap启动子是一个组成型串联启动子，驱动编码甘油醛-3-磷酸脱氢酶(Gap)基因的表达。它是运动发酵单胞菌中最强的启动子之一，长度为305bp，包含9个预测的转录起始位点(TSS)。通过生化手段已经鉴定出Pgap两个转录起始位点(TSS)，一个起始于胸腺嘧啶，另一个起始于腺嘌呤。近端启动子(Pgap 2)的-35区与远端启动子(Pgap1)的-10区具有重叠。Pgap在代谢工程中被广泛使用，已在运动发酵单胞菌、恶臭假单胞菌等多种菌株的功能回路中构建，以达到高产的目的。基于以上研究背景，本申请以运动发酵单胞菌内源启动子为基础，得到了一系列强启动子突变体，这些启动子不仅在运动发酵单胞菌中皆具有强启动子活性，而且在异源的大肠杆菌中亦具有强启动子活性，为提供一些强启动子和/或提高底盘细胞的兼容性提供了帮助。

第一方面，本申请实施例公开了包含运动发酵单胞菌内源性启动子突变体的核酸分子，其中，所述启动子突变体包括甘油醛-3-磷酸脱氢酶基因启动子突变体和ZMO1609基因启动子的至少一种，所述甘油醛-3-磷酸脱氢酶基因启动子突变体是由甘油醛-3-磷酸脱氢酶基因启动子包括28位、30位、86位、107位、109位、136位、142位、164位和197位中的至少一处位置具有碱基取代形成的，或者为甘油醛-3-磷酸脱氢酶基因启动子的UP元件发生替代形成的；其中所述甘油醛-3-磷酸脱氢酶基因启动子的核苷酸序列如SEQ ID NO：1所示；所述ZMO1609基因启动子突变体是由ZMO1609基因启动子的UP元件发生替代形成的，其中所述ZMO1609基因启动子的核苷酸序列如SEQ ID NO：2所示。

在本申请实施例中，所述碱基取代包括：28T>A、30A>G、86G>T、107C>T、109G>C、109G>A、136T>C、142T>A、164C>T、197A>T。

在本申请实施例中，其中所述UP元件是被来源于E.coli的UP元件进行1～2个替代。

在本申请实施例中，所述核酸分子包含选自SEQ ID NO.3～20所示任一的序列。

在本申请实施例中，所述核酸分子包括SEQ ID NO.21所示的序列。

第二方面，本申请实施例公开了包含第一方面的核酸分子的嵌合基因，所述核酸分子嵌合连接至异源核酸分子。

在本申请实施例中，所述异源核酸分子编码蛋白或肽。

第三方面，本申请实施例公开了包含第一方面的核酸分子的载体。

第四方面，本申请实施例公开了包含第三方面的载体的宿主细胞。

在本申请实施例中，其中所述宿主细胞包括运动发酵单胞菌属细胞和/或埃希氏菌属细胞。

附图说明

图1为本申请实施例提供的现有的运动发酵单胞菌内源强启动子(Pgap、Ppdc、Peno)分别在大肠杆菌与运动发酵单胞菌中强度测试结果；图1A是启动子(Pgap、Ppdc、Peno)在大肠杆菌中测试的流式二维散点图；图1B是启动子(Pgap、Ppdc、Peno)在运动发酵单胞菌中测试的流式二维散点图；图1C是启动子(Pgap、Ppdc、Peno)在大肠杆菌与运动发酵单胞菌中绿色荧光强度；图1D是启动子Pgap在大肠杆菌与运动发酵单胞菌中指数期与稳定期EGFP/opmCherry的比值；pEZ15A代表只有载体骨架的对照。

图2为本申请实施例提供的野生型Pgap启动子和Pgap启动子突变文库片段的DNA凝胶电泳检测结果，泳道1为野生型Pgap启动子目的片段，泳道2为Pgap启动子突变文库片段，泳道3为Marker。

图3为本申请实施例提供的双荧光报告***载体扩增产物的DNA凝胶电泳检测结果，泳道1和泳道2均为双荧光报告***载体扩增产物，泳道3为Marker。

图4为本申请实施例提供的基于sanger测序得到的7个Pgap突变体在大肠杆菌与运动发酵单胞菌中指数期与稳定期EGFP/opmCherry的比值。

图5为本申请实施例通过定点突变得到的Pgap突变体在大肠杆菌指数期与稳定期的绿色荧光强度差异倍数。

图6为本申请实施例提供的替换UP元件的Pgap和Ptt1609突变体在大肠杆菌中的表达；图6A是Pgap启动子包含两个UP元件、-10区和-35区的示意图；图6B是Pgap和Ptt1609突变体在大肠杆菌指数期与稳定期的绿色荧光强度差异倍数。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合实施例对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。本申请中未详细单独说明的试剂均为常规试剂，均可从商业途径获得；未详细特别说明的方法均为常规实验方法，可从现有技术中获知。

本申请所述的是可用于表达宿主细胞中的嵌合基因的新启动子。本申请发明人创造性地发现，运动发酵单胞菌内源性启动子：甘油醛-3-磷酸脱氢酶基因启动子和ZMO1609基因启动子的不同类型突变体可提高由该启动子引导的表达水平。

甘油醛-3-磷酸脱氢酶基因启动子突变体是由甘油醛-3-磷酸脱氢酶基因启动子包括28位、30位、86位、107位、109位、136位、142位、164位和197位中的至少一处位置具有碱基取代形成的，或者为甘油醛-3-磷酸脱氢酶基因启动子的UP元件发生替代形成的；其中所述甘油醛-3-磷酸脱氢酶基因启动子的核苷酸序列如SEQ ID NO.1所示。

ZMO1609基因启动子突变体是由ZMO1609基因启动子的UP元件发生替代形成的，其中，所述ZMO1609基因启动子的核苷酸序列如SEQ ID NO.2所示。

运动发酵单胞菌甘油醛-3-磷酸脱氢酶基因启动子包含这些突变中的任何至少一种，这些启动子可用于在宿主细胞中表达异源的、嵌合连接的DNA序列。

以下缩写和定义将用于说明书和权利要求的解释。

在本申请中，术语“基因”指表达特定蛋白质或功能RNA分子的核酸片段，该核酸片段可包含位于编码序列之前的调节序列(5′非编码区)和之后的调节序列(3′非编码区)。“天然基因”或“野生型基因”指具有其自身调控序列的天然存在的基因。“嵌合基因”指不是天然基因的任何基因，包含在天然情况下不是一起存在的调控序列和编码序列。因此，嵌合基因可包括源于不同来源的调控序列和编码序列，或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。“内源性基因”指位于生物的基因组内它的天然位置的天然基因。“外源基因”指正常情况下不存在于宿主生物中的基因，它通过基因转移导入宿主生物。外来基因可以包含***到非天然生物体内的天然基因，或嵌合基因。“内源性”是指位于生物的基因组中内在的天然位置来源。“UP元件”(upstream promoter elements)称为上游启动子元件，是位于核心启动子元件-35区上游-40～-60的一段序列，该元件可被RNA聚合酶自身所识别，仅在RNA聚合酶存在的情况下，UP元件能将大肠杆菌rrmB P1基因的转录效率提高30倍。

在本申请中，术语“遗传构建体”指编码表达一种或多种特定蛋白或功能RNA分子的核酸片段。在基因构建体中某一基因可以是天然的、嵌合的、或外来的。通常基因构建体将包含“编码序列”。“编码序列”指编码特定氨基酸序列的DNA序列。

在本申请中，“启动子”指能够控制编码序列或功能RNA的表达的DNA序列。一般来讲，编码序列位于启动子序列的3′端。启动子可整个源于天然基因，或者由源于不同的天然存在的启动子的不同元件组成，或者甚至包含合成的DNA片段。本领域技术人员应当理解，不同的启动子可以在不同的组织或细胞类型中，或者在不同的发育阶段，或者响应不同的环境条件而引导基因的表达。通常将在大多数细胞类型中、在大多数情况下引起基因表达的启动子称为“组成型启动子”。

在本申请中，术语“表达”指转录和衍生自基因的编码RNA(mRNA)或功能RNA的稳定积聚，也可指将mRNA翻译成多肽或蛋白。“超表达”指在转基因生物中产生的基因产物超出在正常生物或未转化生物中产生的基因产物的水平。

在本申请中，术语“信使RNA(mRNA)”指无内含子并且可以由细胞翻译成蛋白质的RNA。

在本申请中，术语“转化”指将核酸片段转移至宿主生物体内，导致在基因上稳定遗传。转化的核酸可以是宿主细胞中保留的质粒形式，或者一些转化的核酸可以被整合进宿主细胞基因组中。含有转化核酸片段的宿主生物被称为“转基因”或“重组”或“转化”生物体。

在本申请中，术语“质粒”和“载体”是指通常携带有不属于细胞中心代谢的部分的基因的染色体外元件，并且常常是环状双链DNA分子的形式。这类元件可以是源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或环状)，其中多个核苷酸序列已连接或重组进入一种独特构建体中，该独特构建体能够将所选基因产物的启动子片段和DNA序列与相应的3′末端非翻译序列一起引入细胞中。

在本申请中，术语“嵌合连接”指单个核酸片段上的核酸序列的关联，使得其中一个核酸序列的功能受到另一个核酸序列的影响。例如，当启动子能够影响编码序列的表达(即，该编码序列受到该启动子的转录控制)时，则该启动子与该编码序列嵌合连接。编码序列可以以有义或反义的取向嵌合连接至调节序列。对应的，“嵌合基因”是指经过“嵌合连接”在一起的核酸序列，例如可以是启动子与其能够影响的编码序列“嵌合连接”在一起，形成的。

在本申请中，术语“异源”指不天然存在于受关注的位点。例如“异源基因”是指不天然存在于宿主生物中的基因，它通过基因转移导入宿主生物。例如存在于嵌合基因中的异源核酸分子是不与嵌合基因中的其他片段一起天然存在的核酸分子，如具有彼此不天然相关联存在的编码区和启动子片段的核酸分子。

在本申请中，“核酸分子”是RNA或DNA的聚合物，它是单链或双链的，任选地包含合成的、非天然的或改变的核苷酸碱基。DNA聚合物形式的核酸分子可由cDNA、基因组DNA或合成DNA的一个或多个区段构成。

在本申请中，术语“运动发酵单胞菌甘油醛-3-磷酸脱氢酶基因启动子”和“ZMO1609基因启动子”均指具有启动子活性的核酸分子。“运动发酵单胞菌甘油醛-3-磷酸脱氢酶基因启动子”具有天然存在于运动发酵单胞菌基因组中的甘油醛-3-磷酸脱氢酶基因(Gene ID:58026057)编码区上游的核苷酸序列，“ZMO1609基因启动子”具有天然存在于运动发酵单胞菌基因组中的ZMO1609基因(Gene ID:58027328)编码区上游的核苷酸序列。这些术语还包括指运动发酵单胞菌菌株如ZM4菌株(ATCC 31821)的启动子以及引导表达的序列和/或长度上的变异体，如，所述变异体引导的表达水平无显著不同。

运动发酵单胞菌的内源性启动子突变体的发现

运动发酵单胞菌内源性启动子(甘油醛-3-磷酸脱氢酶启动子Pgap、丙酮酸脱羧酶启动子Ppdc、烯醇化酶启动子Peno)已经被用于在运动发酵单胞菌、棕榈发酵细菌和大肠杆菌中表达嵌合基因。然而单用于表达启动某些基因表达时，其表达效果并不如期望有效，例如图1所示，将之前在运动发酵单胞菌中的鉴定出的三个强启动子(Pgap、Ppdc、Peno)在大肠杆菌中测试强度，运动发酵单胞菌中的强启动子在大肠杆菌中强度显著下降。

为此，本申请发明人从运动发酵单胞菌内源性启动子Pgap出发，利用易错PCR技术构建Pgap突变文库，构建至双报告***载体上，然后以质粒的形式转化大肠杆菌T1，得到在大肠杆菌中的突变体文库，运用流式细胞仪分选出EGFP荧光强度高的细胞亚群。结合Sanger测序测序与新一代测序(Next-generation sequencing，NGS)手段方法测定出多个突变位点，通过正反向实验设计验证出多个突变位点确实能影响Pgap启动子兼容性，结果如图4～5所示。联系突变位点与启动子的结构特征，解析出启动子UP元件对于启动子在运动发酵单胞菌与大肠杆菌中的兼容性作用重大，并在运动发酵单胞菌另一强启动子Ptt1609中得到验证，进一步解析了制约启动子通用性的分子机制，结果如图6所示。

本申请发明人进一步发现，在野生型Pgap启动子(SEQ ID NO.1所示)中具有单个或多个的核苷酸改变，由此导致了该启动子的突变体嵌合连接的编码取的表达增强。并且与运动发酵单胞菌菌株(ZM4，ATCC 31821)野生型Pgap启动子(如SEQ ID NO.1所示)的序列相比，这种核苷酸改变是相对于该菌株Pgap启动子的新改变。该甘油醛-3-磷酸脱氢酶基因启动子突变体是由甘油醛-3-磷酸脱氢酶基因启动子包括28位、30位、86位、107位、109位、136位、142位、164位和197位中的至少一处位置具有碱基取代形成的，或者为甘油醛-3-磷酸脱氢酶基因启动子的UP元件发生替代形成的。

制备Pgap突变体和Ptt1609突变体

可通过本领域技术人员已知的任何方法将28位、30位、86位、107位、109位、136位、142位、164位和197位的所述突变导入野生型Pgap启动子(SEQ ID NO.1所示)的核酸分子中，或者得到UP元件被大肠杆菌UP元件替换的Pgap启动子，或者对野生型Ptt1609启动子(SEQ ID NO.2所示)的中的UP元件进行替换得到Ptt1609启动子突变体。例如可合成具有突变和围绕DNA序列的寡核苷酸并将其克隆到较大的启动子DNA片段中以取代无突变的片段。可合成包含该突变和一些邻近启动子序列的引物并用于PCR中以制备启动子片段。可合成全长启动子DNA片段使之成为连接到一起的多个寡核苷酸。可使用定点诱变导入突变。此外可使用来自ZM4(ATCC 3182)的基因组DNA作模板制备突变启动子，作为PCR扩增的DNA片段。

表1示出了本申请实施例制得的Pgap突变体和Ptt1609突变体，以及各突变体的突变位点。其中，“Pgap-WT”代表SEQ ID NO.1所示的野生型甘油醛-3-磷酸脱氢酶基因启动子，“Ptt1609-WT”代表SEQ ID NO.2所示的野生型ZMO1609基因启动子，“28T>A”代表“Pgap-WT”的28位碱基T替换为A，其他的碱基替换形式依次类推。“E.coli的UP元件”的核苷酸序列如SEQ ID NO.36～38任一所示。“+”表示质粒已转化进入运动发酵单胞菌属或者埃希氏菌属。

表1 Pgap突变体和Ptt1609突变体

包含Pgap突变体和Ptt1609突变体的嵌合基因和载体导入宿主细胞

可将本申请公开的Pgap突变体和Ptt1609突变体作为启动子嵌合连接至意欲在宿主细胞中表达异源核酸分子，形成嵌合核酸分子或本申请的嵌合基因。嵌合基因的设计和构建是为本领域技术人员熟知的。嵌合基因通常包括一个启动子、一个意欲表达的异源核酸分子、以及3'端终止控制区。终止控制区可来源于不同基因，并且常来自靶宿主细胞天然具有的基因。嵌合连接的异源核酸分子可为期望在宿主细胞中表达的任何核酸分子，包括例如蛋白或肽的编码区。此外可构建一个操纵子，该操纵子包含本文所述的启动子和多个从该启动子表达的编码区。

本申请中所述的启动子可在嵌合基因中使用以在属于运动发酵单胞菌属和/或埃希氏菌属的细菌中表达嵌合基因。嵌合基因可用于表达涉及运动发酵单胞菌属和/或埃希氏菌属产物生产的任何蛋白。例如一种或多种涉及生物能源物质如异丁醇合成的酶，在生产生物塑料如PHB可从具有这些启动子的嵌合基因开始表达。嵌合基因可在不利用木糖的天然运动发酵单胞菌属和/或埃希氏菌属菌株中表达，或者在利用木糖的菌株中表达。本文所述的启动子还可用于表达与异丁醇代谢或另一种代谢途径有关的酶。

本申请所述的嵌合基因通常在载体中构建或者转移到载体中以进行进一步的操纵。载体为人们所熟知。某些载体能够在广泛的宿主细菌中复制并可通过接合进行转移，例如，pET系列的载体是目前应用最广泛的载体之一，在大肠杆菌中具有强大的功能，能表达重组蛋白；pEZ-Dual双报告基因载体已经在运动发酵单胞菌鉴定出不同强度的启动子、终止子，RBS和酒精诱导型启动子。载体可包括用于在细胞中自主复制的质粒，以及用于运送构建体以将其整合进细菌基因组的质粒。用于DNA整合的质粒可包括转座子、与靶细菌基因组同源的核酸序列区域、或者参与整合的其他序列。

本申请所述的启动子也可在无嵌合连接的核酸分子的载体中构建用于表达，并且将其整合进内源编码区附近以置换细菌基因组中的内源启动子或者添加至少一个启动子至例如操纵子内的编码区。可通过熟知的方法，例如使用冻-融转化、钙介导转化、电穿孔、或接合，将包含本文所述的启动子的载体导入细菌细胞中。

使用Pgap突变体和Ptt1609突变体作为启动子的表达

可使用本申请公开的Pgap突变体和Ptt1609突变体作为启动子来提高荧光素酶基因的表达。例如如图2、3所示，Pgap突变体嵌合进入pEZ-Dual(参照CN109913487A公开的方法)中，与pEZ-Dual中EGFP构成嵌合基因，转化进入运动发酵单胞菌和大肠杆菌，挑选阳性克隆，鉴定转化子，对阳性克隆的PCR产物进行荧光检测，如表1所示，发现其中16个Pgap突变体以及Pgap-COUP(SEQ ID NO.3)，Pgap-2COUP(SEQ ID NO.4)启动子强度比野生型Pgap增强至少1.5倍，特别是6M、UP-3M启动子强度比野生型Pgap增强了20倍。并且这些突变体在运动发酵单胞菌中仍具有高启动子强度。结果如图4～6所示。

例如，如表1和图6所示，Ptt1609突变体(SEQ ID NO.5)嵌合进入pEZ-Dual(参照CN109913487A公开的方法)中，与pEZ-Dual中EGFP构成嵌合基因，转化进入运动发酵单胞菌和大肠杆菌，挑选阳性克隆，鉴定转化子，对阳性克隆的PCR产物进行荧光检测，发现Ptt1609突变体Ptt1609-COUP启动子强度比野生型Ptt1609增强大于5倍，并且在原始宿主运动发酵单胞菌中依旧保持高强度。

以下通过更加具体的实施例进行说明。

一、随机突变制得Pgap启动子

1、野生型Pgap启动子目的片段的获得

以运动发酵单胞菌菌株ZM4(ATCC 31821)基因组DNA为模板扩增得到Pgap启动子(SEQ ID NO.1)作为目的片段，用于扩增Pgap的引物为Pgap-fra-F(SEQ ID NO.6)和Pgap-fra-R(SEQ ID NO.7)，引物由武汉擎科公司合成。目的片段扩增结果如图2所示。

2、随机突变

本步骤采用了随机突变获得Pgap启动子突变体，具体通过易错PCR进行随机突变，其中使用了低保真度DNA聚合酶，并通过调整Mg²⁺、模板浓度、及循环数三个因素来提高扩增过程中引入错配碱基的频率，从而使目标基因Pgap的扩增产物发生适量的随机突变，构建随机突变文库。使用Pgap-fra-F、Pgap-fra-R作为引物分别进行4次易错PCR，并将4次易错PCR后的产物进行混合后纯化回收。PCR反应体系(50μL)和程序如表2所示。目的片段扩增结果如图2所示。

表2易错PCR反应体系和反应程序

3、扩增双荧光报告***载体

质粒pEZ-Dual(参照CN109913487A公开的方法制得，p15A_ori,Zymo_Ori,Ptet,SpeR,PlacUV5::opmCherry,Ptet::EGFP)为DNA扩增模板，设计引物mDual-Rev-F(SEQ IDNO.8)和mDual-Rev-R(SEQ ID NO.9)扩增得到双荧光报告载体(引物由武汉擎科公司合成)。利用mDual-F、mDual-R反扩质粒pEZ-Dual，20μL PCR反应体系如下，PCR扩增程序为：98℃预变性3min；98℃变性10s，53℃退火10s，72℃延伸50s，共29个循环；循环结束后72℃保持5min得到双荧光报告***载体，并纯化回收得到一段大小为4871bp的片段。纯化片段进行DNA凝胶电泳所示。

表3扩增双荧光报告***载体的反应体系

4、重组大肠杆菌文库的构建

将经过随机突变的的纯化后的Pgap启动子混合片段分别与双荧光报告***载体、水、T5酶，Buffer溶液按照如表4所示的反应体系进行添加，冰上静5min，并于无菌操作台内加入50μL大肠杆菌感受态T1，冰上静置30min；42℃热激45s后冰上静置2min；再加入500μL的LB液体培养基于37℃，250rpm摇床中培养1h；使用台式高速离心机中5000rpm,2min离心，去掉400μL上清液，将剩下菌液吹打混匀，均匀涂布于LB+Spectinomycin(Spe，100μg/mL)固体平板上，37℃倒置培养过夜。次日收集平板上全部菌落于EP管中，加入60％甘油冷冻保存。

表4

5、重组大肠杆菌文库的荧光激活细胞分选及检测

通过荧光激活细胞分选Pgap突变体库重组大肠杆菌细胞库中强度不同的细胞亚群。使用磷酸盐缓冲液(PBS)洗涤收集到的细胞3次，最后重悬至10⁷个细胞/mL，配置成为样品液。超声清洗实验将用的喷嘴，排出气泡。利用75％酒精对工作环境及仪器进行消毒。使用分选质控微球，调试至最佳值。设置488nm激发波长和FITC通道。打开侧液流窗口的偏转电压板电压，设置适合的偏转角度，使液流分束清楚，便于分选。使用0.5％次氯酸钠溶液清洗管道5min后，将样品放置于上样架，对表达EGFP蛋白的细胞进行检测，设置门，收集细胞。对分选后得到的细胞进行无菌培养。将培养后的菌液吸取200μL均匀涂布于LB+Spe固体平板上，37℃恒温生化培养箱中倒置培养过夜。

6、Sanger测序筛选随机突变得到的Pgap突变体

分选后在平板上长出的单菌落作为DNA扩增模板，设计引物Pseq-F(SEQ IDNO.10)和Pseq-R(SEQ ID NO.11)单克隆进行菌落PCR检测(引物由武汉擎科公司合成)，具体如下：

从平板中随机挑选若干个单克隆，运用菌落PCR鉴定转化子，所用引物为Pseq-F、Pseq-R，阳性克隆PCR产物条带理论大小为815bp。用10μL无菌小枪头从过夜培养后的固体平板中随机挑选15个单菌落于200μL离心管，加入10μL超纯水充分混匀，从中吸取1μL作为菌落PCR扩增所需的DNA模板。采用10μL PCR反应体系如下，PCR扩增程序为：98℃预变性3min；98℃变性10s，53℃退火10s，72℃延伸10s，共27个循环；循环结束后72℃保持5min。琼脂糖凝胶电泳检测PCR产物，利用紫外线凝胶成像***观察结果。选取电泳结果中条带大小正确的菌进行培养。

表5

试剂	体积(μL)	浓度
			Primer F	0.4	10μM
Primer R	0.4	10μM
			模板	1
<![CDATA[ddH<sub>2</sub>O]]>	3.2
			T5 Super PCR Mix	5	2×

将经过四次连续分选后的Pgap启动子文库送往苏州GENEWIZ公司进行NGS测序。使用FastQC程序(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)检查配对端读取质量，然后将数据映射到Pgap野生型DNA序列以识别变异。NGS结果数据如表6所示。

表6基于NGS的读取数与突变类型数据

总读取数	18402322
		读取数(未突变)	6251443
读取数(突变)	12150879
		突变类型种类	593745
读取数>1,000的突变	356

7、流式细胞检测及荧光强度计算

使用Beckman CytoFLEX FCM流式细胞仪分析，用FITC通道检测EGFP荧光，用PC5.5通道检测opmCherry，并设置荧光补偿。使用FlowJo软件推荐的参数进行处理，设置Events最小值为20000，有效减少分析时的误差并缩短流式细胞分析时间。计算每一份样品的平均荧光强度，使用三个平行组的平均EGFP/opmCherry的比值来量化每个启动子的强度，并设置标准偏差(STDEV)为误差线。将得到的EGFP/opmCherry比值导入GraphPad Prism 8.0软件，并进行显著性分析。

结果如图4所示，相对于野生型启动子，上述经过随机突变筛选得到的Pgap启动子突变体在大肠杆菌同一生长时间内的EGFP/opmC herry值均有显著增强，说明本申请实施例提供的Pgap启动子突变体具有相对于野生型Pgap启动子的表达增强功能。

8、突变体在运动发酵单胞菌中的强度检测

(1)目的运动发酵单胞菌菌株感受态的制备

用接种环挑取适量运动发酵单胞菌ZM4甘油菌在RMG5固体培养基(RMG5:50g/L葡萄糖，10g/L酵母提取物，2g/L KH₂PO₄，3g/L琼脂)平板上划线，30℃倒置培养2～3天活化；挑取活化的单菌落转接至含有10mL左右的RMG5(RMG5:50g/L葡萄糖，10g/L酵母提取物，2g/LKH₂PO₄)液体培养基中，于30℃静置培养至对数中期用作种子液；转接种子液至含有200mLRMG5液体培养基的250mL蓝盖瓶中，控制初始OD在0.025～0.03之间。30℃静置培养至OD＝0.4～0.6；将装有菌液的蓝盖瓶放至冰上冷却30min后，用预冷的50mL离心管于4000rpm，离心10min收集菌体，弃上清；向离心管中加入30mL预冷的无菌水重悬洗涤菌体，混合均匀后，4000rpm离心10min弃上清；向离心管中加入30mL预冷的10％甘油重悬洗涤菌体，混合均匀后，4000rpm离心10min弃上清，并重复该步骤一次；加入1％(体积比)的预冷的10％甘油重悬菌体，缓慢混合均匀后于冰上进行分装，每50μL分装至无菌的1.5mL离心管中，置于液氮中速冻后于-80℃保存。

(2)将突变体转化进入目的运动发酵单胞菌感受态细胞中

取运动发酵单胞菌ZM4感受态细胞于冰上，待感受态细胞融化后取50μL加入电转杯中，并在电转杯中加入1μg质粒。电转条件为1600V，25μF，200Ω。电转完毕后于RMG5液体培养基中于30℃培养箱复苏。复苏4～6小时的培养物于6000rpm，1min离心，除去部分上清。悬浮菌体取100μL涂布于100μg/mL壮观霉素抗性平板，30℃培养2天。

待有菌落生长出来之后，对重组菌株进行菌落PCR检测，PCR扩增程序设置为：98℃预变性2min；98℃变性10s，55℃退火10s，72℃延伸(根据片段长度按照10s/kb进行设置)，共30个循环；循环反应结束后72℃保持5min；反应体系如下：

表7

试剂	体积
		F-primer(10μM)	0.3μL
R-primer(10μM)	0.3μL
		2×T5 Super PCR Mix(Tsingke)	5μL
Template	XμL
		<![CDATA[ddH<sub>2</sub>O]]>	To 10μL
Total volume	10μL

将获得的正确阳性克隆在所带抗性液体RMG5培养基中活化后，甘油保菌。

采用如上述实施例所述的流式细胞检测及荧光强度计算平均EGFP/opmCherry的比值来量化每个启动子的强度，并设置标准偏差(STDEV)为误差线。结果如图4，相对于野生型启动子，上述经过随机突变筛选得到的Pgap启动子突变体在运动发酵单胞菌同一生长时间内的EGFP/opmCherry值无显著性降低，说明本申请实施例提供的Pgap启动子突变体具有相对于野生型Pgap启动子的表达增强功能。

二、UP元件替换突变

分别以野生型Pgap启动子的序列和野生型Ptt1609基因序列为模板，参照上述实施例制得目的片段，设计引物(如表5所示)以构建重组质粒，转化至大肠杆菌T1感受态细胞后，利用壮观霉素抗性(100μg/mL)平板进行筛选，挑取单菌落，通过Pseq-F(SEQ IDNO.10)、Pseq-R(SEQ ID NO.11)两个引物进行PCR验证，引物如表8所示，由武汉擎科公司合成。验证体系如上述实施例所述，并采用如上述实施例所述的方法对制得几种UP元件的启动子突变体进行荧光蛋白表达检测。

结果如图6所示，在同一生长时间内的EGFP/opmCherry值均有显著增强，说明本申请实施例提供的UP元件的启动子突变体具有相对于野生型Pgap启动子的表达增强功能。

表8 Pgap-COUP、Pgap-2COUP和Ptt1609-COUP构建所用引物

三、组合突变

将经过四次连续分选后的Pgap启动子文库送往苏州GENEWIZ公司进行NGS测序。使用FastQC程序(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)检查配对端读取质量，然后将数据映射到Pgap野生型DNA序列以识别变异。NGS数据已上传到NCBI生物样本数据库，编号为SAMN24913892。与野生型Pgap序列相比，鉴定出突变率显著的6个位点，分别为Pgap序列中的T28、G86、C107、G109、T136和C164。将6个位点进行组合突变，构建质粒Pgap-6M。

以sanger测序得到的Pgap-4M为DNA扩增模板，设计引物扩增得到目的片段(引物由武汉擎科公司合成)，具体质粒构建所需扩增引物如下：分别用4M+C107T-F(SEQ IDNO.20)和DOWN-spe-R(SEQ ID NO.13)；4M+G86T-R(SEQ ID NO.21)和UP-spe-F(SEQ IDNO.15)两组引物，以Pgap-4M质粒为DNA扩增模板进行DNA扩增，得到两段具同源臂的片段,转化到大肠杆菌T1感受态细胞后，利用壮观霉素抗性(100μg/mL)平板进行筛选，挑取单菌落，通过Pseq-F、Pseq-R两个引物进行PCR验证，测序得到正确转化子Pgap-6M。

并采用如上述实施例所述的方法对制得几种UP元件的启动子突变体进行荧光蛋白表达检测。

结果如图5所示，在同一生长时间内Pgap-6M的EGFP/opmCherry值均有显著增强，说明本申请实施例提供的Pgap-6M启动子突变体具有相对于野生型Pgap启动子的最佳表达增强功能

以上所述，仅为本申请较佳的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。

序列表

<110> 湖北大学

<120> 运动发酵单胞菌内源性启动子突变体

<160> 21

<170> SIPOSequenceListing 1.0

<210> 1

<211> 305

<212> DNA

<213> Artificial Sequence

<400> 1

gttcgatcaa caacccgaat cctatcgtaa tgatgttttg cccgatcagc ctcaatcgac 60

aattttacgc gtttcgatcg aagcagggac gacaattggc tgggaacggt atactggaat 120

aaatggtctt cgttatggta ttgatgtttt tggtgcatcg gccccggcga atgatctata 180

tgctcatttc ggcttgaccg cagtcggcat cacgaacaag gtgttggccg cgatcgccgg 240

taagtcggca cgttaaaaaa tagctatgga atatagtagc tacttaataa gttaggagaa 300

taaac 305

<210> 2

<211> 201

<212> DNA

<213> Artificial Sequence

<400> 2

atcgaaacct ttcttaaaaa atttttttcg aaaatctttt tgaactcagt ccgtcaatga 60

tctatccttc cttgacgcat aaggcaattc cactgttgca atgaatatat tgcttatggt 120

gaaacgttat cgcttctcat gcgattctat agttaggata aactgattat tgttacgtat 180

tgagtaactg gagtatagac a 201

<210> 3

<211> 305

<212> DNA

<213> Artificial Sequence

<400> 3

gttcgatcaa caacccgaat cctatcgtaa tgatgttttg cccgatcagc ctcaatcgac 60

aattttacgc gtttcgatcg aagcagggac gaaaaattat tttgaaaaat atactggaat 120

aaatggtctt cgttatggta ttgatgtttt tggtgcatcg gccccggcga atgatctata 180

tgctcatttc ggcttgaccg cagtcggcat cacgaacaag gtgttggccg cgatcgccgg 240

taagtcggca cgttaaaaaa tagctatgga atatagtagc tacttaataa gttaggagaa 300

taaac 305

<210> 4

<211> 305

<212> DNA

<213> Artificial Sequence

<400> 4

gttcgatcaa caacccgaat cctatcgtaa tgatgttttg cccgatcagc ctcaatcgac 60

aataaaatta ttttcgaaaa aagcagggac gaaaaattat tttgaaaaat atactggaat 120

aaatggtctt cgttatggta ttgatgtttt tggtgcatcg gccccggcga atgatctata 180

tgctcatttc ggcttgaccg cagtcggcat cacgaacaag gtgttggccg cgatcgccgg 240

taagtcggca cgttaaaaaa tagctatgga atatagtagc tacttaataa gttaggagaa 300

taaac 305

<210> 5

<211> 201

<212> DNA

<213> Artificial Sequence

<400> 5

atcgaaacct ttcttaaaaa atttttttcg aaaatctttt tgaactcagt ccgtcaatga 60

tctatccttc cttgacgcat aaggcaattc cactgttgca atgaatatat tgcttatggt 120

gaaacgttat cgcttctcat gcgattctat agttaggata aactgattat tgttacgtat 180

tgagtaactg gagtatagac a 201

<210> 6

<211> 36

<212> DNA

<213> Artificial Sequence

<400> 6

gcggccgcta ctagtgttcg atcaacaacc cgaatc 36

<210> 7

<211> 42

<212> DNA

<213> Artificial Sequence

<400> 7

gcccttgctc accatgttta ttctcctaac ttattaagta gc 42

<210> 8

<211> 18

<212> DNA

<213> Artificial Sequence

<400> 8

atggtgagca agggcgag 18

<210> 9

<211> 17

<212> DNA

<213> Artificial Sequence

<400> 9

actagtagcg gccgctg 17

<210> 10

<211> 17

<212> DNA

<213> Artificial Sequence

<400> 10

gccattgacg ctacctt 17

<210> 11

<211> 17

<212> DNA

<213> Artificial Sequence

<400> 11

tggtggcatc gccctcg 17

<210> 12

<211> 30

<212> DNA

<213> Artificial Sequence

<400> 12

ggacgaaaaa ttattttgaa aaatatactg 30

<210> 13

<211> 22

<212> DNA

<213> Artificial Sequence

<400> 13

gagaatctcg ctctctccag gg 22

<210> 14

<211> 60

<212> DNA

<213> Artificial Sequence

<400> 14

aataattttt cgtccctgct tttttcgaaa ataattttat tgtcgattga ggctgatcgg 60

<210> 15

<211> 20

<212> DNA

<213> Artificial Sequence

<400> 15

gagagcgaga ttctccgcgc 20

<210> 16

<211> 52

<212> DNA

<213> Artificial Sequence

<400> 16

ggacgaaaaa ttattttgaa aaatatactg gaataaatgg tcttcgttat gg 52

<210> 17

<211> 33

<212> DNA

<213> Artificial Sequence

<400> 17

tttcaaaata atttttcgtc cctgcttcga tcg 33

<210> 18

<211> 42

<212> DNA

<213> Artificial Sequence

<400> 18

aaaatttttt tcgaaaatct ttttgaactc agtccgtcaa tg 42

<210> 19

<211> 45

<212> DNA

<213> Artificial Sequence

<400> 19

gcccttgctc accattgtct atactccagt tactcaatac gtaac 45

<210> 20

<211> 43

<212> DNA

<213> Artificial Sequence

<400> 20

cgacaattgg ctgggaatgc tatactggaa taaatggtct tcg 43

<210> 21

<211> 31

<212> DNA

<213> Artificial Sequence

<400> 21

cccagccaat tgtcgtccat gcttcgatcg a 31

Claims

1.一种运动发酵单胞菌内源性启动子突变体，其中，所述启动子突变体为甘油醛-3-磷酸脱氢酶基因启动子突变体，所述甘油醛-3-磷酸脱氢酶基因启动子突变体是由甘油醛-3-磷酸脱氢酶基因启动子经过6个位点突变获得，具体突变为：

28T>A、86G>T、107C>T、109G>A、136T>C和164C>T；

所述甘油醛-3-磷酸脱氢酶基因启动子的核苷酸序列如SEQ ID NO.1所示。

2.一种核酸分子，其包含权利要求1所述的启动子突变体。

3.包含权利要求2所述核酸分子的嵌合基因，所述核酸分子嵌合连接至异源核酸分子。

4.根据权利要求3所述的嵌合基因，其中所述异源核酸分子编码蛋白或肽。

5.包含权利要求2所述核酸分子的载体。

6.包含权利要求5所述载体的宿主细胞，其中，所述宿主细胞包括运动发酵单胞菌属细胞和/或埃希氏菌属细胞。