具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合实施例对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请中未详细单独说明的试剂均为常规试剂,均可从商业途径获得;未详细特别说明的方法均为常规实验方法,可从现有技术中获知。
本申请所述的是可用于表达宿主细胞中的嵌合基因的新启动子。本申请发明人创造性地发现,运动发酵单胞菌内源性启动子:甘油醛-3-磷酸脱氢酶基因启动子和ZMO1609基因启动子的不同类型突变体可提高由该启动子引导的表达水平。
甘油醛-3-磷酸脱氢酶基因启动子突变体是由甘油醛-3-磷酸脱氢酶基因启动子包括28位、30位、86位、107位、109位、136位、142位、164位和197位中的至少一处位置具有碱基取代形成的,或者为甘油醛-3-磷酸脱氢酶基因启动子的UP元件发生替代形成的;其中所述甘油醛-3-磷酸脱氢酶基因启动子的核苷酸序列如SEQ ID NO.1所示。
ZMO1609基因启动子突变体是由ZMO1609基因启动子的UP元件发生替代形成的,其中,所述ZMO1609基因启动子的核苷酸序列如SEQ ID NO.2所示。
运动发酵单胞菌甘油醛-3-磷酸脱氢酶基因启动子包含这些突变中的任何至少一种,这些启动子可用于在宿主细胞中表达异源的、嵌合连接的DNA序列。
以下缩写和定义将用于说明书和权利要求的解释。
在本申请中,术语“基因”指表达特定蛋白质或功能RNA分子的核酸片段,该核酸片段可包含位于编码序列之前的调节序列(5′非编码区)和之后的调节序列(3′非编码区)。“天然基因”或“野生型基因”指具有其自身调控序列的天然存在的基因。“嵌合基因”指不是天然基因的任何基因,包含在天然情况下不是一起存在的调控序列和编码序列。因此,嵌合基因可包括源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。“内源性基因”指位于生物的基因组内它的天然位置的天然基因。“外源基因”指正常情况下不存在于宿主生物中的基因,它通过基因转移导入宿主生物。外来基因可以包含***到非天然生物体内的天然基因,或嵌合基因。“内源性”是指位于生物的基因组中内在的天然位置来源。“UP元件”(upstream promoter elements)称为上游启动子元件,是位于核心启动子元件-35区上游-40~-60的一段序列,该元件可被RNA聚合酶自身所识别,仅在RNA聚合酶存在的情况下,UP元件能将大肠杆菌rrmB P1基因的转录效率提高30倍。
在本申请中,术语“遗传构建体”指编码表达一种或多种特定蛋白或功能RNA分子的核酸片段。在基因构建体中某一基因可以是天然的、嵌合的、或外来的。通常基因构建体将包含“编码序列”。“编码序列”指编码特定氨基酸序列的DNA序列。
在本申请中,“启动子”指能够控制编码序列或功能RNA的表达的DNA序列。一般来讲,编码序列位于启动子序列的3′端。启动子可整个源于天然基因,或者由源于不同的天然存在的启动子的不同元件组成,或者甚至包含合成的DNA片段。本领域技术人员应当理解,不同的启动子可以在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件而引导基因的表达。通常将在大多数细胞类型中、在大多数情况下引起基因表达的启动子称为“组成型启动子”。
在本申请中,术语“表达”指转录和衍生自基因的编码RNA(mRNA)或功能RNA的稳定积聚,也可指将mRNA翻译成多肽或蛋白。“超表达”指在转基因生物中产生的基因产物超出在正常生物或未转化生物中产生的基因产物的水平。
在本申请中,术语“信使RNA(mRNA)”指无内含子并且可以由细胞翻译成蛋白质的RNA。
在本申请中,术语“转化”指将核酸片段转移至宿主生物体内,导致在基因上稳定遗传。转化的核酸可以是宿主细胞中保留的质粒形式,或者一些转化的核酸可以被整合进宿主细胞基因组中。含有转化核酸片段的宿主生物被称为“转基因”或“重组”或“转化”生物体。
在本申请中,术语“质粒”和“载体”是指通常携带有不属于细胞中心代谢的部分的基因的染色体外元件,并且常常是环状双链DNA分子的形式。这类元件可以是源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或环状),其中多个核苷酸序列已连接或重组进入一种独特构建体中,该独特构建体能够将所选基因产物的启动子片段和DNA序列与相应的3′末端非翻译序列一起引入细胞中。
在本申请中,术语“嵌合连接”指单个核酸片段上的核酸序列的关联,使得其中一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达(即,该编码序列受到该启动子的转录控制)时,则该启动子与该编码序列嵌合连接。编码序列可以以有义或反义的取向嵌合连接至调节序列。对应的,“嵌合基因”是指经过“嵌合连接”在一起的核酸序列,例如可以是启动子与其能够影响的编码序列“嵌合连接”在一起,形成的。
在本申请中,术语“异源”指不天然存在于受关注的位点。例如“异源基因”是指不天然存在于宿主生物中的基因,它通过基因转移导入宿主生物。例如存在于嵌合基因中的异源核酸分子是不与嵌合基因中的其他片段一起天然存在的核酸分子,如具有彼此不天然相关联存在的编码区和启动子片段的核酸分子。
在本申请中,“核酸分子”是RNA或DNA的聚合物,它是单链或双链的,任选地包含合成的、非天然的或改变的核苷酸碱基。DNA聚合物形式的核酸分子可由cDNA、基因组DNA或合成DNA的一个或多个区段构成。
在本申请中,术语“运动发酵单胞菌甘油醛-3-磷酸脱氢酶基因启动子”和“ZMO1609基因启动子”均指具有启动子活性的核酸分子。“运动发酵单胞菌甘油醛-3-磷酸脱氢酶基因启动子”具有天然存在于运动发酵单胞菌基因组中的甘油醛-3-磷酸脱氢酶基因(Gene ID:58026057)编码区上游的核苷酸序列,“ZMO1609基因启动子”具有天然存在于运动发酵单胞菌基因组中的ZMO1609基因(Gene ID:58027328)编码区上游的核苷酸序列。这些术语还包括指运动发酵单胞菌菌株如ZM4菌株(ATCC 31821)的启动子以及引导表达的序列和/或长度上的变异体,如,所述变异体引导的表达水平无显著不同。
运动发酵单胞菌的内源性启动子突变体的发现
运动发酵单胞菌内源性启动子(甘油醛-3-磷酸脱氢酶启动子Pgap、丙酮酸脱羧酶启动子Ppdc、烯醇化酶启动子Peno)已经被用于在运动发酵单胞菌、棕榈发酵细菌和大肠杆菌中表达嵌合基因。然而单用于表达启动某些基因表达时,其表达效果并不如期望有效,例如图1所示,将之前在运动发酵单胞菌中的鉴定出的三个强启动子(Pgap、Ppdc、Peno)在大肠杆菌中测试强度,运动发酵单胞菌中的强启动子在大肠杆菌中强度显著下降。
为此,本申请发明人从运动发酵单胞菌内源性启动子Pgap出发,利用易错PCR技术构建Pgap突变文库,构建至双报告***载体上,然后以质粒的形式转化大肠杆菌T1,得到在大肠杆菌中的突变体文库,运用流式细胞仪分选出EGFP荧光强度高的细胞亚群。结合Sanger测序测序与新一代测序(Next-generation sequencing,NGS)手段方法测定出多个突变位点,通过正反向实验设计验证出多个突变位点确实能影响Pgap启动子兼容性,结果如图4~5所示。联系突变位点与启动子的结构特征,解析出启动子UP元件对于启动子在运动发酵单胞菌与大肠杆菌中的兼容性作用重大,并在运动发酵单胞菌另一强启动子Ptt1609中得到验证,进一步解析了制约启动子通用性的分子机制,结果如图6所示。
本申请发明人进一步发现,在野生型Pgap启动子(SEQ ID NO.1所示)中具有单个或多个的核苷酸改变,由此导致了该启动子的突变体嵌合连接的编码取的表达增强。并且与运动发酵单胞菌菌株(ZM4,ATCC 31821)野生型Pgap启动子(如SEQ ID NO.1所示)的序列相比,这种核苷酸改变是相对于该菌株Pgap启动子的新改变。该甘油醛-3-磷酸脱氢酶基因启动子突变体是由甘油醛-3-磷酸脱氢酶基因启动子包括28位、30位、86位、107位、109位、136位、142位、164位和197位中的至少一处位置具有碱基取代形成的,或者为甘油醛-3-磷酸脱氢酶基因启动子的UP元件发生替代形成的。
制备Pgap突变体和Ptt1609突变体
可通过本领域技术人员已知的任何方法将28位、30位、86位、107位、109位、136位、142位、164位和197位的所述突变导入野生型Pgap启动子(SEQ ID NO.1所示)的核酸分子中,或者得到UP元件被大肠杆菌UP元件替换的Pgap启动子,或者对野生型Ptt1609启动子(SEQ ID NO.2所示)的中的UP元件进行替换得到Ptt1609启动子突变体。例如可合成具有突变和围绕DNA序列的寡核苷酸并将其克隆到较大的启动子DNA片段中以取代无突变的片段。可合成包含该突变和一些邻近启动子序列的引物并用于PCR中以制备启动子片段。可合成全长启动子DNA片段使之成为连接到一起的多个寡核苷酸。可使用定点诱变导入突变。此外可使用来自ZM4(ATCC 3182)的基因组DNA作模板制备突变启动子,作为PCR扩增的DNA片段。
表1示出了本申请实施例制得的Pgap突变体和Ptt1609突变体,以及各突变体的突变位点。其中,“Pgap-WT”代表SEQ ID NO.1所示的野生型甘油醛-3-磷酸脱氢酶基因启动子,“Ptt1609-WT”代表SEQ ID NO.2所示的野生型ZMO1609基因启动子,“28T>A”代表“Pgap-WT”的28位碱基T替换为A,其他的碱基替换形式依次类推。“E.coli的UP元件”的核苷酸序列如SEQ ID NO.36~38任一所示。“+”表示质粒已转化进入运动发酵单胞菌属或者埃希氏菌属。
表1 Pgap突变体和Ptt1609突变体
包含Pgap突变体和Ptt1609突变体的嵌合基因和载体导入宿主细胞
可将本申请公开的Pgap突变体和Ptt1609突变体作为启动子嵌合连接至意欲在宿主细胞中表达异源核酸分子,形成嵌合核酸分子或本申请的嵌合基因。嵌合基因的设计和构建是为本领域技术人员熟知的。嵌合基因通常包括一个启动子、一个意欲表达的异源核酸分子、以及3'端终止控制区。终止控制区可来源于不同基因,并且常来自靶宿主细胞天然具有的基因。嵌合连接的异源核酸分子可为期望在宿主细胞中表达的任何核酸分子,包括例如蛋白或肽的编码区。此外可构建一个操纵子,该操纵子包含本文所述的启动子和多个从该启动子表达的编码区。
本申请中所述的启动子可在嵌合基因中使用以在属于运动发酵单胞菌属和/或埃希氏菌属的细菌中表达嵌合基因。嵌合基因可用于表达涉及运动发酵单胞菌属和/或埃希氏菌属产物生产的任何蛋白。例如一种或多种涉及生物能源物质如异丁醇合成的酶,在生产生物塑料如PHB可从具有这些启动子的嵌合基因开始表达。嵌合基因可在不利用木糖的天然运动发酵单胞菌属和/或埃希氏菌属菌株中表达,或者在利用木糖的菌株中表达。本文所述的启动子还可用于表达与异丁醇代谢或另一种代谢途径有关的酶。
本申请所述的嵌合基因通常在载体中构建或者转移到载体中以进行进一步的操纵。载体为人们所熟知。某些载体能够在广泛的宿主细菌中复制并可通过接合进行转移,例如,pET系列的载体是目前应用最广泛的载体之一,在大肠杆菌中具有强大的功能,能表达重组蛋白;pEZ-Dual双报告基因载体已经在运动发酵单胞菌鉴定出不同强度的启动子、终止子,RBS和酒精诱导型启动子。载体可包括用于在细胞中自主复制的质粒,以及用于运送构建体以将其整合进细菌基因组的质粒。用于DNA整合的质粒可包括转座子、与靶细菌基因组同源的核酸序列区域、或者参与整合的其他序列。
本申请所述的启动子也可在无嵌合连接的核酸分子的载体中构建用于表达,并且将其整合进内源编码区附近以置换细菌基因组中的内源启动子或者添加至少一个启动子至例如操纵子内的编码区。可通过熟知的方法,例如使用冻-融转化、钙介导转化、电穿孔、或接合,将包含本文所述的启动子的载体导入细菌细胞中。
使用Pgap突变体和Ptt1609突变体作为启动子的表达
可使用本申请公开的Pgap突变体和Ptt1609突变体作为启动子来提高荧光素酶基因的表达。例如如图2、3所示,Pgap突变体嵌合进入pEZ-Dual(参照CN109913487A公开的方法)中,与pEZ-Dual中EGFP构成嵌合基因,转化进入运动发酵单胞菌和大肠杆菌,挑选阳性克隆,鉴定转化子,对阳性克隆的PCR产物进行荧光检测,如表1所示,发现其中16个Pgap突变体以及Pgap-COUP(SEQ ID NO.3),Pgap-2COUP(SEQ ID NO.4)启动子强度比野生型Pgap增强至少1.5倍,特别是6M、UP-3M启动子强度比野生型Pgap增强了20倍。并且这些突变体在运动发酵单胞菌中仍具有高启动子强度。结果如图4~6所示。
例如,如表1和图6所示,Ptt1609突变体(SEQ ID NO.5)嵌合进入pEZ-Dual(参照CN109913487A公开的方法)中,与pEZ-Dual中EGFP构成嵌合基因,转化进入运动发酵单胞菌和大肠杆菌,挑选阳性克隆,鉴定转化子,对阳性克隆的PCR产物进行荧光检测,发现Ptt1609突变体Ptt1609-COUP启动子强度比野生型Ptt1609增强大于5倍,并且在原始宿主运动发酵单胞菌中依旧保持高强度。
以下通过更加具体的实施例进行说明。
一、随机突变制得Pgap启动子
1、野生型Pgap启动子目的片段的获得
以运动发酵单胞菌菌株ZM4(ATCC 31821)基因组DNA为模板扩增得到Pgap启动子(SEQ ID NO.1)作为目的片段,用于扩增Pgap的引物为Pgap-fra-F(SEQ ID NO.6)和Pgap-fra-R(SEQ ID NO.7),引物由武汉擎科公司合成。目的片段扩增结果如图2所示。
2、随机突变
本步骤采用了随机突变获得Pgap启动子突变体,具体通过易错PCR进行随机突变,其中使用了低保真度DNA聚合酶,并通过调整Mg2+、模板浓度、及循环数三个因素来提高扩增过程中引入错配碱基的频率,从而使目标基因Pgap的扩增产物发生适量的随机突变,构建随机突变文库。使用Pgap-fra-F、Pgap-fra-R作为引物分别进行4次易错PCR,并将4次易错PCR后的产物进行混合后纯化回收。PCR反应体系(50μL)和程序如表2所示。目的片段扩增结果如图2所示。
表2易错PCR反应体系和反应程序
3、扩增双荧光报告***载体
质粒pEZ-Dual(参照CN109913487A公开的方法制得,p15A_ori,Zymo_Ori,Ptet,SpeR,PlacUV5::opmCherry,Ptet::EGFP)为DNA扩增模板,设计引物mDual-Rev-F(SEQ IDNO.8)和mDual-Rev-R(SEQ ID NO.9)扩增得到双荧光报告载体(引物由武汉擎科公司合成)。利用mDual-F、mDual-R反扩质粒pEZ-Dual,20μL PCR反应体系如下,PCR扩增程序为:98℃预变性3min;98℃变性10s,53℃退火10s,72℃延伸50s,共29个循环;循环结束后72℃保持5min得到双荧光报告***载体,并纯化回收得到一段大小为4871bp的片段。纯化片段进行DNA凝胶电泳所示。
表3扩增双荧光报告***载体的反应体系
4、重组大肠杆菌文库的构建
将经过随机突变的的纯化后的Pgap启动子混合片段分别与双荧光报告***载体、水、T5酶,Buffer溶液按照如表4所示的反应体系进行添加,冰上静5min,并于无菌操作台内加入50μL大肠杆菌感受态T1,冰上静置30min;42℃热激45s后冰上静置2min;再加入500μL的LB液体培养基于37℃,250rpm摇床中培养1h;使用台式高速离心机中5000rpm,2min离心,去掉400μL上清液,将剩下菌液吹打混匀,均匀涂布于LB+Spectinomycin(Spe,100μg/mL)固体平板上,37℃倒置培养过夜。次日收集平板上全部菌落于EP管中,加入60%甘油冷冻保存。
表4
5、重组大肠杆菌文库的荧光激活细胞分选及检测
通过荧光激活细胞分选Pgap突变体库重组大肠杆菌细胞库中强度不同的细胞亚群。使用磷酸盐缓冲液(PBS)洗涤收集到的细胞3次,最后重悬至107个细胞/mL,配置成为样品液。超声清洗实验将用的喷嘴,排出气泡。利用75%酒精对工作环境及仪器进行消毒。使用分选质控微球,调试至最佳值。设置488nm激发波长和FITC通道。打开侧液流窗口的偏转电压板电压,设置适合的偏转角度,使液流分束清楚,便于分选。使用0.5%次氯酸钠溶液清洗管道5min后,将样品放置于上样架,对表达EGFP蛋白的细胞进行检测,设置门,收集细胞。对分选后得到的细胞进行无菌培养。将培养后的菌液吸取200μL均匀涂布于LB+Spe固体平板上,37℃恒温生化培养箱中倒置培养过夜。
6、Sanger测序筛选随机突变得到的Pgap突变体
分选后在平板上长出的单菌落作为DNA扩增模板,设计引物Pseq-F(SEQ IDNO.10)和Pseq-R(SEQ ID NO.11)单克隆进行菌落PCR检测(引物由武汉擎科公司合成),具体如下:
从平板中随机挑选若干个单克隆,运用菌落PCR鉴定转化子,所用引物为Pseq-F、Pseq-R,阳性克隆PCR产物条带理论大小为815bp。用10μL无菌小枪头从过夜培养后的固体平板中随机挑选15个单菌落于200μL离心管,加入10μL超纯水充分混匀,从中吸取1μL作为菌落PCR扩增所需的DNA模板。采用10μL PCR反应体系如下,PCR扩增程序为:98℃预变性3min;98℃变性10s,53℃退火10s,72℃延伸10s,共27个循环;循环结束后72℃保持5min。琼脂糖凝胶电泳检测PCR产物,利用紫外线凝胶成像***观察结果。选取电泳结果中条带大小正确的菌进行培养。
表5
试剂 |
体积(μL) |
浓度 |
Primer F |
0.4 |
10μM |
Primer R |
0.4 |
10μM |
模板 |
1 |
|
<![CDATA[ddH<sub>2</sub>O]]> |
3.2 |
|
T5 Super PCR Mix |
5 |
2× |
将经过四次连续分选后的Pgap启动子文库送往苏州GENEWIZ公司进行NGS测序。使用FastQC程序(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)检查配对端读取质量,然后将数据映射到Pgap野生型DNA序列以识别变异。NGS结果数据如表6所示。
表6基于NGS的读取数与突变类型数据
总读取数 |
18402322 |
读取数(未突变) |
6251443 |
读取数(突变) |
12150879 |
突变类型种类 |
593745 |
读取数>1,000的突变 |
356 |
7、流式细胞检测及荧光强度计算
使用Beckman CytoFLEX FCM流式细胞仪分析,用FITC通道检测EGFP荧光,用PC5.5通道检测opmCherry,并设置荧光补偿。使用FlowJo软件推荐的参数进行处理,设置Events最小值为20000,有效减少分析时的误差并缩短流式细胞分析时间。计算每一份样品的平均荧光强度,使用三个平行组的平均EGFP/opmCherry的比值来量化每个启动子的强度,并设置标准偏差(STDEV)为误差线。将得到的EGFP/opmCherry比值导入GraphPad Prism 8.0软件,并进行显著性分析。
结果如图4所示,相对于野生型启动子,上述经过随机突变筛选得到的Pgap启动子突变体在大肠杆菌同一生长时间内的EGFP/opmC herry值均有显著增强,说明本申请实施例提供的Pgap启动子突变体具有相对于野生型Pgap启动子的表达增强功能。
8、突变体在运动发酵单胞菌中的强度检测
(1)目的运动发酵单胞菌菌株感受态的制备
用接种环挑取适量运动发酵单胞菌ZM4甘油菌在RMG5固体培养基(RMG5:50g/L葡萄糖,10g/L酵母提取物,2g/L KH2PO4,3g/L琼脂)平板上划线,30℃倒置培养2~3天活化;挑取活化的单菌落转接至含有10mL左右的RMG5(RMG5:50g/L葡萄糖,10g/L酵母提取物,2g/LKH2PO4)液体培养基中,于30℃静置培养至对数中期用作种子液;转接种子液至含有200mLRMG5液体培养基的250mL蓝盖瓶中,控制初始OD在0.025~0.03之间。30℃静置培养至OD=0.4~0.6;将装有菌液的蓝盖瓶放至冰上冷却30min后,用预冷的50mL离心管于4000rpm,离心10min收集菌体,弃上清;向离心管中加入30mL预冷的无菌水重悬洗涤菌体,混合均匀后,4000rpm离心10min弃上清;向离心管中加入30mL预冷的10%甘油重悬洗涤菌体,混合均匀后,4000rpm离心10min弃上清,并重复该步骤一次;加入1%(体积比)的预冷的10%甘油重悬菌体,缓慢混合均匀后于冰上进行分装,每50μL分装至无菌的1.5mL离心管中,置于液氮中速冻后于-80℃保存。
(2)将突变体转化进入目的运动发酵单胞菌感受态细胞中
取运动发酵单胞菌ZM4感受态细胞于冰上,待感受态细胞融化后取50μL加入电转杯中,并在电转杯中加入1μg质粒。电转条件为1600V,25μF,200Ω。电转完毕后于RMG5液体培养基中于30℃培养箱复苏。复苏4~6小时的培养物于6000rpm,1min离心,除去部分上清。悬浮菌体取100μL涂布于100μg/mL壮观霉素抗性平板,30℃培养2天。
待有菌落生长出来之后,对重组菌株进行菌落PCR检测,PCR扩增程序设置为:98℃预变性2min;98℃变性10s,55℃退火10s,72℃延伸(根据片段长度按照10s/kb进行设置),共30个循环;循环反应结束后72℃保持5min;反应体系如下:
表7
试剂 |
体积 |
F-primer(10μM) |
0.3μL |
R-primer(10μM) |
0.3μL |
2×T5 Super PCR Mix(Tsingke) |
5μL |
Template |
XμL |
<![CDATA[ddH<sub>2</sub>O]]> |
To 10μL |
Total volume |
10μL |
将获得的正确阳性克隆在所带抗性液体RMG5培养基中活化后,甘油保菌。
采用如上述实施例所述的流式细胞检测及荧光强度计算平均EGFP/opmCherry的比值来量化每个启动子的强度,并设置标准偏差(STDEV)为误差线。结果如图4,相对于野生型启动子,上述经过随机突变筛选得到的Pgap启动子突变体在运动发酵单胞菌同一生长时间内的EGFP/opmCherry值无显著性降低,说明本申请实施例提供的Pgap启动子突变体具有相对于野生型Pgap启动子的表达增强功能。
二、UP元件替换突变
分别以野生型Pgap启动子的序列和野生型Ptt1609基因序列为模板,参照上述实施例制得目的片段,设计引物(如表5所示)以构建重组质粒,转化至大肠杆菌T1感受态细胞后,利用壮观霉素抗性(100μg/mL)平板进行筛选,挑取单菌落,通过Pseq-F(SEQ IDNO.10)、Pseq-R(SEQ ID NO.11)两个引物进行PCR验证,引物如表8所示,由武汉擎科公司合成。验证体系如上述实施例所述,并采用如上述实施例所述的方法对制得几种UP元件的启动子突变体进行荧光蛋白表达检测。
结果如图6所示,在同一生长时间内的EGFP/opmCherry值均有显著增强,说明本申请实施例提供的UP元件的启动子突变体具有相对于野生型Pgap启动子的表达增强功能。
表8 Pgap-COUP、Pgap-2COUP和Ptt1609-COUP构建所用引物
三、组合突变
将经过四次连续分选后的Pgap启动子文库送往苏州GENEWIZ公司进行NGS测序。使用FastQC程序(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)检查配对端读取质量,然后将数据映射到Pgap野生型DNA序列以识别变异。NGS数据已上传到NCBI生物样本数据库,编号为SAMN24913892。与野生型Pgap序列相比,鉴定出突变率显著的6个位点,分别为Pgap序列中的T28、G86、C107、G109、T136和C164。将6个位点进行组合突变,构建质粒Pgap-6M。
以sanger测序得到的Pgap-4M为DNA扩增模板,设计引物扩增得到目的片段(引物由武汉擎科公司合成),具体质粒构建所需扩增引物如下:分别用4M+C107T-F(SEQ IDNO.20)和DOWN-spe-R(SEQ ID NO.13);4M+G86T-R(SEQ ID NO.21)和UP-spe-F(SEQ IDNO.15)两组引物,以Pgap-4M质粒为DNA扩增模板进行DNA扩增,得到两段具同源臂的片段,转化到大肠杆菌T1感受态细胞后,利用壮观霉素抗性(100μg/mL)平板进行筛选,挑取单菌落,通过Pseq-F、Pseq-R两个引物进行PCR验证,测序得到正确转化子Pgap-6M。
并采用如上述实施例所述的方法对制得几种UP元件的启动子突变体进行荧光蛋白表达检测。
结果如图5所示,在同一生长时间内Pgap-6M的EGFP/opmCherry值均有显著增强,说明本申请实施例提供的Pgap-6M启动子突变体具有相对于野生型Pgap启动子的最佳表达增强功能
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。
序列表
<110> 湖北大学
<120> 运动发酵单胞菌内源性启动子突变体
<160> 21
<170> SIPOSequenceListing 1.0
<210> 1
<211> 305
<212> DNA
<213> Artificial Sequence
<400> 1
gttcgatcaa caacccgaat cctatcgtaa tgatgttttg cccgatcagc ctcaatcgac 60
aattttacgc gtttcgatcg aagcagggac gacaattggc tgggaacggt atactggaat 120
aaatggtctt cgttatggta ttgatgtttt tggtgcatcg gccccggcga atgatctata 180
tgctcatttc ggcttgaccg cagtcggcat cacgaacaag gtgttggccg cgatcgccgg 240
taagtcggca cgttaaaaaa tagctatgga atatagtagc tacttaataa gttaggagaa 300
taaac 305
<210> 2
<211> 201
<212> DNA
<213> Artificial Sequence
<400> 2
atcgaaacct ttcttaaaaa atttttttcg aaaatctttt tgaactcagt ccgtcaatga 60
tctatccttc cttgacgcat aaggcaattc cactgttgca atgaatatat tgcttatggt 120
gaaacgttat cgcttctcat gcgattctat agttaggata aactgattat tgttacgtat 180
tgagtaactg gagtatagac a 201
<210> 3
<211> 305
<212> DNA
<213> Artificial Sequence
<400> 3
gttcgatcaa caacccgaat cctatcgtaa tgatgttttg cccgatcagc ctcaatcgac 60
aattttacgc gtttcgatcg aagcagggac gaaaaattat tttgaaaaat atactggaat 120
aaatggtctt cgttatggta ttgatgtttt tggtgcatcg gccccggcga atgatctata 180
tgctcatttc ggcttgaccg cagtcggcat cacgaacaag gtgttggccg cgatcgccgg 240
taagtcggca cgttaaaaaa tagctatgga atatagtagc tacttaataa gttaggagaa 300
taaac 305
<210> 4
<211> 305
<212> DNA
<213> Artificial Sequence
<400> 4
gttcgatcaa caacccgaat cctatcgtaa tgatgttttg cccgatcagc ctcaatcgac 60
aataaaatta ttttcgaaaa aagcagggac gaaaaattat tttgaaaaat atactggaat 120
aaatggtctt cgttatggta ttgatgtttt tggtgcatcg gccccggcga atgatctata 180
tgctcatttc ggcttgaccg cagtcggcat cacgaacaag gtgttggccg cgatcgccgg 240
taagtcggca cgttaaaaaa tagctatgga atatagtagc tacttaataa gttaggagaa 300
taaac 305
<210> 5
<211> 201
<212> DNA
<213> Artificial Sequence
<400> 5
atcgaaacct ttcttaaaaa atttttttcg aaaatctttt tgaactcagt ccgtcaatga 60
tctatccttc cttgacgcat aaggcaattc cactgttgca atgaatatat tgcttatggt 120
gaaacgttat cgcttctcat gcgattctat agttaggata aactgattat tgttacgtat 180
tgagtaactg gagtatagac a 201
<210> 6
<211> 36
<212> DNA
<213> Artificial Sequence
<400> 6
gcggccgcta ctagtgttcg atcaacaacc cgaatc 36
<210> 7
<211> 42
<212> DNA
<213> Artificial Sequence
<400> 7
gcccttgctc accatgttta ttctcctaac ttattaagta gc 42
<210> 8
<211> 18
<212> DNA
<213> Artificial Sequence
<400> 8
atggtgagca agggcgag 18
<210> 9
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 9
actagtagcg gccgctg 17
<210> 10
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 10
gccattgacg ctacctt 17
<210> 11
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 11
tggtggcatc gccctcg 17
<210> 12
<211> 30
<212> DNA
<213> Artificial Sequence
<400> 12
ggacgaaaaa ttattttgaa aaatatactg 30
<210> 13
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 13
gagaatctcg ctctctccag gg 22
<210> 14
<211> 60
<212> DNA
<213> Artificial Sequence
<400> 14
aataattttt cgtccctgct tttttcgaaa ataattttat tgtcgattga ggctgatcgg 60
<210> 15
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 15
gagagcgaga ttctccgcgc 20
<210> 16
<211> 52
<212> DNA
<213> Artificial Sequence
<400> 16
ggacgaaaaa ttattttgaa aaatatactg gaataaatgg tcttcgttat gg 52
<210> 17
<211> 33
<212> DNA
<213> Artificial Sequence
<400> 17
tttcaaaata atttttcgtc cctgcttcga tcg 33
<210> 18
<211> 42
<212> DNA
<213> Artificial Sequence
<400> 18
aaaatttttt tcgaaaatct ttttgaactc agtccgtcaa tg 42
<210> 19
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 19
gcccttgctc accattgtct atactccagt tactcaatac gtaac 45
<210> 20
<211> 43
<212> DNA
<213> Artificial Sequence
<400> 20
cgacaattgg ctgggaatgc tatactggaa taaatggtct tcg 43
<210> 21
<211> 31
<212> DNA
<213> Artificial Sequence
<400> 21
cccagccaat tgtcgtccat gcttcgatcg a 31