CN112679587B - 易于激活b细胞的重组抗原蛋白及其制备方法 - Google Patents

易于激活b细胞的重组抗原蛋白及其制备方法 Download PDF

Info

Publication number
CN112679587B
CN112679587B CN202011507132.5A CN202011507132A CN112679587B CN 112679587 B CN112679587 B CN 112679587B CN 202011507132 A CN202011507132 A CN 202011507132A CN 112679587 B CN112679587 B CN 112679587B
Authority
CN
China
Prior art keywords
protein
antigen
recombinant
rrbd
epitopes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011507132.5A
Other languages
English (en)
Other versions
CN112679587A (zh
Inventor
张改平
王爱萍
丁培阳
刘红亮
陈玉梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Longfor Modern Immunology Laboratory
Original Assignee
Longfor Modern Immunology Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Longfor Modern Immunology Laboratory filed Critical Longfor Modern Immunology Laboratory
Publication of CN112679587A publication Critical patent/CN112679587A/zh
Application granted granted Critical
Publication of CN112679587B publication Critical patent/CN112679587B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Peptides Or Proteins (AREA)

Abstract

本发明涉及易于激活B细胞的重组抗原蛋白及其制备方法。本发明提供的重组抗原蛋白将两个或两个以上至少含有一个相同抗原表位肽的抗原蛋白通过连接肽连接起来,制备成二聚体或多聚体重组抗原,其中,所述连接肽的长度需要使至少两个相同抗原表位之间的距离处在3‑50nm之间。该重组抗原能够使得抗原蛋白的相同抗原表位中至少两个同时被B细胞上的BCR识别,导致BCR被交联,从而更有效的激活B细胞。本发明还提供了上述重组蛋白抗原的制备方法,该方法具有普适性,能够获得B细胞激活效率显著提高的重组抗原,可广泛应用于疫苗抗原制备、抗体制备等领域。

Description

易于激活B细胞的重组抗原蛋白及其制备方法
技术领域
本发明属于免疫学技术领域,具体涉及易于激活B细胞的重组抗原蛋白及其制备方法。
背景技术
一个多世纪以来,疫苗为控制传染病做出了重要贡献。多年来,疫苗的研究大多依靠无限次传代来获得弱化的毒株,该方法具有不确定性和盲目性。随着蛋白结构学的发展以及冷冻电镜等蛋白结构解析技术的出现,人们已经掌握了许多病原体表面蛋白的结构信息。此外,随着基础免疫学的发展,抗原的免疫原性设计越来越合理。基于结构的抗原设计大大降低了疫苗研发的不确定性。
目前,新获得许可的疫苗中出现了许多重组产品,如亚单位疫苗和VLPs疫苗等。多数亚单位疫苗虽然安全性高的,但其免疫效果并不理想,商品化的亚单位疫苗多数需要注射2至3次,才能维持体内抗体水平,达到免疫保护作用。针对这一问题,本领域技术人员试图通过构建VLPs疫苗来增强蛋白质的免疫原性。此技术主要通过构建具有众多相同表位的VLPs疫苗,形成多重复表位、体积增大的病毒样颗粒来提高疫苗的免疫效果。这种策略在理论上能够增加激活B细胞的概率,但事实上,该策略并没有增加激活B细胞的概率,反而导致VLPs疫苗具有均一性和稳定性的问题,例如表位封闭和组装不均一等等,故而安全高效的新型亚单位疫苗的研发至关重要。
发明内容
本发明的目的在于提供易于激活B细胞的重组抗原,并提供其制备方法。
本发明是基于发明人的下列发现完成的:
抗原蛋白激活B细胞主要为两个过程,首先抗原蛋白要与B细胞相遇并接触,其次在接触的过程中,抗原蛋白的两个相同表位被B细胞的两个BCR同时识别并且发生交联。
如图1和图2所示,图1为B细胞识别抗原后发生活化的扫描电镜图,图2为在B细胞活化过程中,BCR在B细胞与抗原接触表面的分布示意图。先前有研究通过一系列的电子显微镜图片,展示了在细胞环境中B细胞的活化过程。该研究表明,B细胞遇到抗原呈递细胞后,会经历扩散和收缩两个反应阶段,此过程依赖于BCR抗原识别信号和细胞骨架的重排。在快速扩散阶段,B细胞通过扩散将结合的抗原量最大化,并且形成大量交联的“BCR-抗原”微簇。随后B细胞进入缓慢的收缩阶段,将抗原聚集到一个中心簇中,形成成熟的免疫突触(immunological synapse)并引发后续的信号反应。
如图3所示,BCR交联引发B细胞激活模式图中,当抗原具有成对表位并且相同表位之间的距离合适时,该抗原可以同时与B细胞膜上处于静息状态下的两个及以上BCR识别位点结合,引起多个BCR发生交联,从而触发B细胞内的信号传导级联反应,导致B细胞激活,发生细胞的增殖和分化。(胞内信号传导过程包括激活Src家族的Lyn、Blk、Fyn激酶,促使Igα/Igβ结构域发生磷酸化,随后Syk激酶和Tec激酶参与级联反应,招募大量的衔接蛋白,最终通过NF-κB、NF-AT、MAPK和FoxO等至少四种不同的信号通路诱发下游靶基因的转录。)
此外,影响抗原蛋白激活B细胞的因素也主要有两个:一个是生物因素,一个是物理结构因素。生物因素例如:抗原蛋白与B细胞生物上的吸引与排斥、相同表位被识别并且交联;但是生物因素的影响有时受到物理结构因素的限制,例如:B细胞膜是一种液态镶嵌模型,两个BCR的距离是相对可变,在蛋白表位结合时由于其极性作用,使得BCR之间的距离可调控;但是可调控的距离有一定的范围,超出一定的距离范围,就不能调控BCR之间的距离。因此,欲使抗原蛋白的两个相同表位被B细胞的两个BCR同时识别并且发生交联,两个相同表位之间的距离与两个BCR之间的距离就不能相差太大,否则就不能调控BCR之间的距离,进而抗原蛋白的两个相同表位也就不能被B细胞的两个BCR同时识别并且发生交联。至此能够得出,生物因素是抗原蛋白激活B细胞的本质因素,但适当的物理结构因素能够促使抗原蛋白更容易激活B细胞。基于此,本发明通过人工构建抗原蛋白的物理结构特征,使得重组抗原蛋白更容易激活B细胞。
所述构建抗原蛋白的结构特征,是指通过人工干预构建抗原蛋白相同表位之间的距离特征,通过该距离特征表现出的生物特征,使得抗原蛋白的相同表位中的至少两个能够同时被B细胞的两个BCR识别,从而发生交联,更易于激活B细胞。该技术特征包括任何以相同表位之间的距离为特征并被B细胞上BCR的两个抗原结合位点同时识别并且容易发生交联的抗原蛋白,不限于二连体,也可以是其它结构,但是至少部分相同表位之间的距离通过人工干预形成。
所述抗原蛋白的相同表位中的至少两个能够同时被B细胞的两个BCR识别,是指抗原蛋白相同表位之间的距离与B细胞的BCR之间的距离相互配合,这种配合关系,增加了抗原蛋白上两个相同表位同时与B细胞的两个BCR结合的概率,从而更易于激活B细胞。由于B细胞膜是一种液态镶嵌模型,两个BCR的距离是相对可变,在域蛋白表位结合时由于其极性作用,可调控BCR之间的距离,这种可调控距离的范围,就是抗原蛋白相同表位之间的距离与B细胞的BCR之间的距离的差值,这个差值越小越好,差值为零,抗原蛋白相同表位之间的距离与B细胞的BCR之间的距离相等,这种情况下,只要二者相遇,抗原蛋白上的两个相同表位非常容易同时被B细胞的两个BCR识别并且发生交联,形成二者之间的配合关系;如果多聚体重组抗原蛋白中仅有两个相同表位,那么就是两个相同表位之间的距离与B细胞的BCR之间的距离配合;如果多聚体重组抗原蛋白中相同表位大于两个,那么就可能存在抗原蛋白单体上相同表位之间的距离也与B细胞的BCR之间的距离配合,但是,本技术方案在抗原蛋白单体的基础上,通过人工干预增加了相同表位的数量,且增加的这部分相同表位之间的距离也与B细胞的BCR之间的距离配合,就大大增加了其中两个相同表位被B细胞的BCR同时识别并发生交联的概率。因此,本发明的技术方案包括但不限于二聚体,也可以是三聚体、四聚体等多聚体结构。
所述抗原蛋白相同表位之间的距离与B细胞的BCR之间的距离相互配合,指已知B细胞的BCR之间的距离在3-50nm之内,构建的抗原蛋白相同表位之间的距离在3-50nm,使得抗原蛋白相同表位之间的距离与B细胞的BCR之间的距离相互配合。
本发明采用以下技术方案:
本发明一方面提供了易于激活B细胞的重组抗原,将两个或两个以上至少含有一个位于蛋白表面的相同抗原表位的抗原蛋白直接连接或通过连接肽连接起来,制备成多聚体重组抗原;所述直接连接或通过连接肽连接需要使至少两个相同抗原表位之间的距离处在3-50nm之间。
优选的,所述的连接肽为柔性连接肽或者刚性连接肽,其长度为0-30个氨基酸。
优选的,所述连接肽的序列为(G4S)n或(AP)nA,其中,n=0-6。
具体的,在一个实施方案中,所述重组抗原为猪瘟病毒重组抗原,是将两个至少含有一个相同抗原表位肽的重组猪瘟病毒E2蛋白(rE2)通过连接肽(G4S)n连接起来制备成的二聚体重组抗原;所述重组猪瘟病毒E2蛋白(rE2)的氨基酸序列如SEQ ID NO.1所示;所述二聚体重组抗原的连接方式为氨基酸序列从N端到C端依次为:rE2-(G4S)n-rE2,其中,n=1、n=2或n=3。
优选的,所述猪瘟病毒重组抗原的氨基酸序列从N端到C端依次为:rE2-(G4S)3-rE2,其中,重组猪瘟病毒E2蛋白(rE2)的氨基酸序列如SEQ ID NO.1所示。
具体的,在另一个实施方案中,所述重组抗原为新城疫病毒重组抗原,是将两个至少含有一个相同抗原表位肽的新城疫病毒血凝素神经氨酸酶重组蛋白(rHN)通过连接肽(G4S)n连接起来制备成的二聚体重组抗原;所述新城疫病毒血凝素神经氨酸酶重组蛋白的氨基酸序列如SEQ ID NO.3所示;所述二聚体重组抗原的连接方式为氨基酸序列从N端到C端依次为:rHN-(G4S)n-rHN,其中,n=2、n=3或n=4。
优选的,所述新城疫病毒重组抗原的氨基酸序列从N端到C端依次为:rHN-(G4S)n-rHN,其中,新城疫病毒血凝素神经氨酸酶重组蛋白(rHN)的氨基酸序列如SEQ ID NO.3所示。
具体的,在另一个实施方案中,所述重组抗原为新型冠状病毒重组抗原,是将两个至少含有一个相同抗原表位肽的的重组S蛋白(rRBD)直接连接起来制备成的二聚体重组抗原;所述重组S蛋白(rRBD)的氨基酸序列如SEQ ID NO.5所示;所述二聚体重组抗原的连接方式为氨基酸序列从N端到C端依次为:rRBD-rRBD。
具体的,在另一个实施方案中,所述重组抗原为新型冠状病毒重组抗原,是将两个至少含有一个相同抗原表位肽的的重组S蛋白(rRBD)通过连接肽(G4S)n连接起来制备成的二聚体重组抗原;所述重组S蛋白(rRBD)的氨基酸序列如SEQ ID NO.5所示;所述二聚体重组抗原的连接方式为氨基酸序列从N端到C端依次为:RBDM-(G4S)n-RBDM,其中,n=1、n=2或n=3
优选的,所述新型冠状病毒重组抗原的氨基酸序列从N端到C端依次为:rRBD-(G4S)2-rRBD,其中,重组S蛋白(rRBD)的氨基酸序列如SEQ ID NO.5所示。
具体的,在另一个实施方案中,所述重组抗原为新型冠状病毒重组抗原,是将三个至少含有一个相同抗原表位肽的的重组S蛋白(rRBD)通过连接肽(G4S)n连接起来制备成的三聚体重组抗原;所述重组S蛋白(rRBD)的氨基酸序列如SEQ ID NO.5所示;所述三聚体重组抗原的连接方式为氨基酸序列从N端到C端依次为:rRBD-(G4S)n-rRBD-(G4S)n-rRBD,其中,n=1、n=2或n=3。
优选的,所述新型冠状病毒重组抗原的氨基酸序列从N端到C端依次为:rRBD-(G4S)2-rRBD-(G4S)2-rRBD,其中,重组S蛋白(rRBD)的氨基酸序列如SEQ ID NO.5所示。
本发明第二方面提供上述易于激活B细胞的重组抗原的制备方法,将两个或两个以上至少含有一个相同抗原表位肽的抗原蛋白直接连接或通过连接肽连接起来,制备成多聚体重组抗原;所述直接连接或通过连接肽连接需要使至少两个相同抗原表位之间的距离处在3-50nm之间。
具体的,包括如下步骤:
1)确定靶标蛋白;
2)对靶标蛋白进行结构分析并确定关键抗原表位在靶蛋白中所处的位置;
3)确定重组抗原单体的氨基酸序列;
4)确定连接肽序列,得到多聚体重组抗原的氨基酸序列;
5)构建重组蛋白的抗原表达载体并进行重组蛋白的表达纯化,获得重组抗原蛋白;
其中,步骤4)中所述的多聚体重组抗原是将重组蛋白单体通过连接肽尾首相连;根据重组抗原单体的结构、重组抗原表面抗原表位之间的位置和距离、结合BCR结构与蛋白对接分析结果,确定连接抗原蛋白的连接肽(Linker)的种类和大小,使得相同抗原表位之间的距离与B细胞表面的B细胞抗原受体BCR之间的距离相匹配,即连接肽的长度需要使至少两个相同抗原表位之间的距离处在3-50nm之间,使得重组抗原蛋白含有的相同抗原表位中至少两个同时被B细胞上的BCR识别,导致BCR被交联,从而更有效的激活B细胞。
优选的,步骤1)通过生物信息学预测分析病毒的结构,选择包含关键中和表位及主要B细胞表位的病毒结构蛋白作为靶标蛋白。
优选的,步骤2)对靶标蛋白质进行二级结构、三级结构预测分析,对靶标蛋白的B细胞表位尤其是中和表位的信息进行预测分析,找到关键抗原表位在靶蛋白中所处的位置。
优选的,步骤3)通过预测靶标蛋白质三级结构,分析抗原表位在靶标蛋白表面的分布情况及其具***置;并通过上述分析结果,将靶标蛋白表面三维结构上位置相近的关键抗原表位进行序列优化,结合支撑结构的关键氨基酸序列经优化、重排,得到重组抗原单体的氨基酸序列。
优选的,步骤4)中所述的连接肽为柔性连接肽或者刚性连接肽,其长度为0-30个氨基酸。
优选的,步骤4)中所述连接肽的序列为(G4S)n或(AP)nA,其中,n=0-6。
优选的,步骤5)通过原核表达***或真核表达***获得重组抗原蛋白。
优选的,上述方法还包括步骤6)通过动物实验对获得的重组抗原蛋白进行免疫评价。
在一个实施方案中,本发明提供了猪瘟病毒重组抗原的制备方法,包括如下步骤:
1)选择猪瘟病毒E2蛋白作为靶标蛋白;
2)对靶标蛋白进行结构分析并确定关键抗原表位在靶蛋白中所处的位置:E2蛋白N端1~176aa至少存在7个抗原表位13~18,32~44,85~97,111~123,143~150,154~160以及170~176;另外E2蛋白C端还存在两个优势表位237~244、304~312;
3)将猪瘟病毒E2蛋白的氨基酸序列进行优化,得到重组抗原单体rE2的氨基酸序列,如SEQ ID NO.1所示;
4)选择(G4S)2、(G4S)3或(G4S)4作为连接肽,得到多聚体重组抗原rE2-(G4S)2-rE2rE2-(G4S)3-rE2或rE2-(G4S)4-rE2的氨基酸序列;
5)构建重组蛋白抗原的表达载体,通过转基因水稻***表达猪瘟病毒重组抗原并进行纯化,获得猪瘟病毒重组抗原。
在另一个实施方案中,本发明提供了新城疫病毒重组抗原的制备方法,包括如下步骤:
1)选择新城疫病毒重HN蛋白作为靶标蛋白;
2)对靶标蛋白进行结构分析并确定关键抗原表位在靶蛋白中所处的位置:主要集中在53~192aa,至少存在3个关键抗原表位117~124,128~134以及157~166;
3)将新城疫病毒重HN蛋白的氨基酸序列进行优化,得到重组抗原单体HNM的氨基酸序列,如SEQ ID NO.3所示;
4)选择(G4S)2、(G4S)3或(G4S)4作为连接肽,得到多聚体重组抗原rHN-(G4S)2-rHN、rHN-(G4S)3-rHN或rHN-(G4S)4-rHN的氨基酸序列;
5)构建重组蛋白抗原的表达载体,通过转基因水稻***表达新城疫病毒重组抗原并纯化,获得新城疫病毒重组抗原。
在另一个实施方案中,本发明提供了新型冠状病毒重组抗原的制备方法,包括如下步骤:
1)选择新型冠状病毒S蛋白作为靶标蛋白;
2)对靶标蛋白进行结构分析并确定关键抗原表位在靶蛋白中所处的位置:RBD区域包含了至少8个细胞表位250~258,279~286,310~317,355~359,384~387,424~428,438~448,457~470,另外499~639也包含有关键中和表位;
3)将型冠状病毒S蛋白RBD基序的氨基酸序列进行优化,得到重组抗原单体RBD的氨基酸序列,如SEQ ID NO.5所示;
4)选择直接尾首连接或选择(G4S)、(G4S)2或(G4S)3作为连接肽,得到多聚体重组抗原rRBD-rRBD、rRBD-(G4S)-rRBD、rRBD-(G4S)2-rRBD、rRBD-(G4S)3-rRBD、rRBD-rRBD-rRBD、rRBD-(G4S)-rRBD-(G4S)–rRBD、rRBD-(G4S)2-rRBD-(G4S)2-rRBD或rRBD-(G4S)3-rRBD-(G4S)3-rRBD的氨基酸序列;
5)构建重组蛋白抗原的表达载体并进行重组蛋白的表达纯化,获得重组抗原蛋白。
本发明的有益效果在于:
本发明提供的重组抗原蛋白将两个或两个以上至少含有一个位于蛋白表面的相同抗原表位的抗原蛋白通过连接肽连接起来,制备成二聚体或多聚体重组抗原,其中,所述连接肽的长度需要使至少两个相同抗原表位之间的距离处在3-50nm之间。该重组抗原能够使得抗原蛋白的相同抗原表位中至少两个同时被B细胞上的BCR识别,导致BCR被交联,从而更有效的激活B细胞。B细胞激活效率的提高可显著降低疫苗的接种剂量,获得更高的免疫效率。
本发明还提供了上述重组蛋白抗原的制备方法,该方法具有普适性,能够获得B细胞激活效率显著提高的重组抗原。因此,相比于传统的单价抗原,该方法所制备的多聚体重组抗原蛋白能产生更有效的体液免疫反应。此外,该方法制备多聚体重组抗原蛋白结构导致蛋白分子量增大,能够延长抗体蛋白在体内的滞留时间,从而延长动物体内的抗体持续期。本发明还提供的易于激活B细胞的重组蛋白抗原的制备方法可广泛应用于疫苗抗原制备、抗体制备等领域,具有良好的应用前景。
附图说明
图1为B细胞识别抗原后发生活化的扫描电镜图;
图2为BCR交联引发B细胞激活模式图;
图3为在B细胞活化过程中,BCR在B细胞与抗原接触表面的分布示意图;
图4为CSFV病毒结构示意图;
图中,A为CSFV病毒结构电镜图;B为CSFV结构示意图。
图5为E2蛋白的二级结构分析及抗原表位预测;
图中,A为DNASTAR预测E2蛋白的二级结构;B为SOMPA预测E2蛋白的二级结构;C为PDB预测的BVDV E2蛋白的二级结构。
图6为CSFV的E2蛋白三维结构预测;
图中,A为CSFV单体E2蛋白结构同源建模;B为CSFV E2蛋白二聚体结构同源建模;C为参考序列BVDV单体E2蛋白结构;D为参考序列BVDV E2蛋白二聚体结构;(其中参考序列为PDB ID:2YQ2)。
图7为BCR复合物(BCR Complex)结构示意图;
图8为rE2-(G4S)n-rE2二连体蛋白同源建模结构图;
图中,A-C为SWISS-MODEL同源建模结果,其中A为Linker的n=2时CSFV E2蛋白二连体同源建模结构rE2-(G4S)2-rE2;B为Linker的n=3时CSFV E2蛋白二连体同源建模结构rE2-(G4S)3-rE2;C为Linker的n=4时CSFV E2蛋白二连体同源建模结构rE2-(G4S)4-rE2。图中,D-F为SWISS-MODEL同源建模结果,其中D为Linker的n=2时CSFV E2蛋白二连体同源建模结构rE2-(G4S)2-rE2;E为Linker的n=3时CSFV E2蛋白二连体同源建模结构rE2-(G4S)3-rE2;F为Linker的n=4时CSFV E2蛋白二连体同源建模结构rE2-(G4S)4-rE2。
图9为rE2尾头相连的二聚体结构示意图(rE2-(G4S)3-rE2);
图10为rE2-(G4S)3-rE2转基因水稻植株的表达量;
图11为rE2-(G4S)3-rE2蛋白的非还原SDS/PAGE鉴定;
图12为rE2-(G4S)3-rE2蛋白的晶体结构解析;
图13为rE2-(G4S)3-rE2蛋白体外形成的四聚体结构;
图14为小鼠和家兔的免疫保护实验;
图中,a为重组蛋白免疫小鼠血清的抗体消长规律测定;b为重组蛋白免疫小鼠血清的抑制率测定;c为重组蛋白免疫家兔血清的抗体消长规律测定;d为重组蛋白免疫家兔血清的抑制率测定。
图15为NDV病毒结构示意图;
图中,A.NDV结构电镜图;B.NDV结构示意图。
图16为HN蛋白的二级结构分析及抗原表位预测;
图中,A.PDB预测结果;B.DNASTAR预测结果;C.SOMPA预测结果。
图17为NDV的HN蛋白三维结构;
图中,A.HN蛋白单体结构;B.HN蛋白二聚体结构;C.HN蛋白同源四聚体结构;参考序列(PDB ID:4FZH)。
图18为NDV临床毒株的HN蛋白序列比对及进化分析;
图19为重组蛋白rHN二级结构及三维结构预测分析;
图中,A.重组蛋白rHN二级结构预测;B.重组蛋白rHN三级结构同源建模;C.同源建模参考序列NDV HN蛋白(PDB ID:4FZH)。
图20为rHN-(G4S)n-rHN二连体蛋白同源建模结构图;
图中,A为Linker的n=2时rHN蛋白二连体同源建模结构rHN-(G4S)2-rHN;B为Linker的n=3时rHN蛋白二连体同源建模结构rHN-(G4S)3-rHN;C为Linker的n=4时rHN蛋白二连体同源建模结构rHN-(G4S)4-rHN。
图21为HN基因扩增产物图;
图22为HN二连体和HN单体的SDS-PAGE结果;
图中,Osr2HN为rHN二连体蛋白rHN-(G4S)3-rHN;OsrHN为rHN单体蛋白。
图23为rHN-(G4S)3-rHN蛋白的结晶与衍射图;
图24为rHN-(G4S)3-rHN的晶体结构;
图25为rHN-(G4S)3-rHN的小角衍射结构;
图26为rHN-(G4S)3-rHN形成的四聚体结构;
图27为血凝抑制实验(HI)测定rHN-(G4S)3-rHN抗原免疫后小鼠HI抗体随时间推移的消长情况;
图28为SARS-CoV-2病毒结构示意图;
图中,A.SARS-CoV-2病毒结构电镜图;B.SARS-CoV-2病毒结构示意图。
图29为SARS-CoV-2S蛋白的二级结构分析及抗原表位预测;
图中,A-B.S蛋白的二级结构分析;C-D.S蛋白抗原表位预测。
图30为SARS-CoV-2的S蛋白及RBD基序三维结构;
图中,A.SARS-CoV-2病毒S蛋白结构;B.SARS-CoV-2病毒RBD基序与ACE2结合的结构示意图。
图31为重组蛋白rRBD二级结构及三维结构预测分析;
图中,A.重组蛋白rRBD二级结构预测;B.重组蛋白rRBD三级结构同源建模;C.SARS-CoV-2S蛋白RBD参考序列(PDB ID:6XLU)。
图32为rRBD-(G4S)n-rRBD二连体蛋白同源建模结构图;
图中,A为n=0时rRBD蛋白二连体同源建模结构rRBD-rRBD;B为Linker的n=1时rRBD蛋白二连体同源建模结构rRBD-(G4S)1-rRBD;C为Linker的n=2时rRBD蛋白二连体同源建模结构rRBD-(G4S)2-rRBD;D为Linker的n=3时rRBD蛋白二连体同源建模结构rRBD-(G4S)3-rRBD。
图33为rRBD-(G4S)n-rRBD-(G4S)n-rRBD三连体蛋白同源建模结构图;
图中,A为Linker的n=1时rRBD蛋白二连体同源建模结构rRBD-(G4S)1-rRBD-(G4S)1-rRBD;B为Linker的n=2时rRBD蛋白二连体同源建模结构rRBD-(G4S)2-rRBD-(G4S)2-rRBD;C为Linker的n=3时rRBD蛋白二连体同源建模结构rRBD-(G4S)3-rRBD-(G4S)3-rRBD。
图34为rRBD多连体结构示意图;
图中,A为首尾直接相连RBD二连体(rRBD2)序列结构示意图;B为通过连接子首尾相连RBD二连体(rRBDL2)序列结构示意图;C为通过连接子首尾相连RBD三连体(rRBD3)序列结构示意图。
图35为Western blot检测rRBD多连体蛋白在CHO细胞培养上清中的表达;图中,A为首尾直接相连RBD二连体(rRBD2)蛋白;B为通过连接子首尾相连RBD二连体(rRBDL2)蛋白;C为通过连接子首尾相连RBD三连体(rRBD3)蛋白。
图36为rRBD多连体蛋白的纯化;
图中,A为纯化的首尾直接相连RBD二连体(rRBD2)蛋白;B为纯化的通过连接子首尾相连RBD二连体(rRBDL2)蛋白;C为纯化的通过连接子首尾相连RBD三连体(rRBD3)蛋白。
图37为小鼠血清抗体滴度测定.
图中,RBD为rRBD单体、rRBD2为首尾直接相连RBD二连体蛋白;rRBDL2为通过连接子首尾相连RBD二连体蛋白;rRBD3为通过连接子首尾相连RBD三连体蛋白。
具体实施方式
下面结合具体实施方式对本发明作进一步描述,但本发明的保护范围并不仅限于此;若未特别指明,实施例中所用的设备和试剂均常规市售可得。若未特别指明,实施例中所使用的实验方法均为常规方法。
本发明提供的易于激活B细胞的重组抗原,是将两个或两个以上至少含有一个相同抗原表位的抗原蛋白直接连接或通过连接肽连接起来制备成的多聚体重组抗原;所述直接连接或通过连接肽连接需要使至少两个相同抗原表位之间的距离处在3-50nm之间。
本发明提供的易于激活B细胞的重组抗原的制备步骤主要包括抗原蛋白的选择、抗原蛋白表位分析、序列优化及蛋白质结构重构等,结合三维结构预测和BCR结构分析,确定Linker长度并构建多聚体重组抗原蛋白;后期再通过体外表达***表达、纯化获得重组抗原蛋白,并对其结构及免疫评价效果进行验证。具体的,包括以下步骤:
1)确定靶标蛋白:
通过生物信息学预测分析病毒结构的,选择包含关键中和表位及主要B细胞表位的病毒结构蛋白作为靶标蛋白。
2)靶标蛋白进行结构分析及关键抗原表位在靶蛋白中所处的位置的确定:
①靶标蛋白二级结构预测:结合Chou-Fasman方法、PSIPRED方法等对靶标蛋白氨基酸序列进行分析,基于多重序列比对预测靶标蛋白的二级结构。
②蛋白质三维结构的预测:根据蛋白质结构的相似性,以已知蛋白质的结构为模板构建重组抗原蛋白质的三维结构或者通过蛋白质三维结构的模建,通过查找蛋白质结构数据库(Protein Data Bank,简称PDB)查找靶标蛋白三维结构,选用互联网上的同源模建服务器(如:SWISS-MODEL http://www.expasy.ch/swissmod/SWISS-MODEL.html)进行同源建模。主要步骤包括:确定模板、确定重组抗原蛋白质与已知结构蛋白质的序列比对(BLASThttp://www.ncbi.nlm.nih.gov/BLAST/)、确定结构保守性的主链结构片断、构建结构变化的区域、侧链模建、用能量计算的方法进行结构优化。当目标序列与数据库模板序列一致度较高(>30%)时,可选择此法。若一致度较低,应采用综合法预测靶标蛋白结构:综合同源建模法、穿线法和从头计算法等多种方法,将氨基酸序列分段,情况不同的片段采用不同的方法。针对同源性较高的氨基酸序列分段采用同源建模法;针对那些没有明显的同源性但又采取类似结构的蛋白质采用穿线法,将一个序列与蛋白质折叠库中的所有结构类型进行匹配,找出最接近的一种需要构建非重复的蛋白质折叠模式库。
③靶标蛋白质B细胞表位预测分析:综合选用DNASTAR、SOPMA、ProtScale和IEDB多种软件分析靶标蛋白的二级结构及其疏水性、表面可及性、柔性等相关参数,结合抗原性指数分析结果对靶标蛋白抗原表位进行预测;同时结合已发表文献报道的靶标蛋白B细胞表位尤其是中和表位的相关信息进行综合分析,找到关键抗原表位在靶蛋白中所处的位置。
3)确定重组抗原单体(Recombinant antigen protein monomer,RAPM)的氨基酸序列:
①通过预测靶标蛋白质三级结构,分析抗原表位在靶标蛋白表面的分布情况及其具***置;通过上述分析结果,将靶标蛋白表面三维结构上位置相近的关键抗原表位进行序列优化,结合支撑结构的关键氨基酸序列经优化、重排,获得重组抗原单体的氨基酸序列。
②重组抗原单体的蛋白质二级结构和三级结构分析:参照靶标蛋白结构分析方法对重组抗原的蛋白质结构进行分析,确定重组抗原单体的三维结构。
4)选择不同类型的连接肽序列及连接肽的长度:
①确定B细胞抗原受体(B-cell receptor,BCR)在细胞表面的分布及结构:在成熟B细胞表面(图1),BCR总是和负责传递抗原刺激信号的Igα/Igβ(CD79a/b)异二聚体共同表达,形成BCR-Igα/Igβ复合体(BCR复合物),Igα/Igβ和mIg的跨膜区均有极性氨基酸,能够借助静电吸引而组成稳定的BCR复合物(图2)。BCR具有抗原结合特异性,每个个体的BCR多样性高达5×1013,构成容量巨大的BCR库,赋予个体识别各种抗原、产生特异性抗体的巨大潜能(图3)。B细胞膜是一种液态镶嵌模型,两个BCR的距离是相对可变,在3-50nm之内,在蛋白表位结合时由于其极性作用,使得BCR之间的距离可调控;但是可调控的距离有一定的范围,超出一定的距离范围,就不能调控BCR之间的距离。
②连接肽(Linker)的设计:设计原则是重组抗原单体之间不应相互影响,也不应相互折叠或缠绕在一起而导致彼此的活性丧失;重组抗原单体的核心区域(关键中和表位)要相互远离,不会形成空间位阻而影响表位的呈现;结合设计连接肽的常用的工具与数据库http://www.fccc.edu/research/labs/feng/1inker/html、http://www.ibi.vu.nl/programs/linkerdbwww/等),通过PDB代码、PDB数据头、连接肽长度、溶剂可及性和二级结构或序列等查询、分析具有所需性质的序列,从中获得候选序列。
③根据重组抗原单体的结构、重组抗原表面抗原表位之间的位置和距离,结合BCR结构,确定连接抗原蛋白的连接肽(Linker)的种类和大小,得到多聚体重组抗原的氨基酸序列。以常用的柔性linker(G4S)n为例,二连体重组蛋白连接方式为:RAPM-(G4S)n-RAPM(其中n介于0~6之间);三连体重组蛋白连接方式为:RAPM-(G4S)n-RAPM-(G4S)n-RAPM(其中n介于0~6之间)。以刚性linker(AP)nA为例,二连体重组蛋白连接方式为:RAPM-(AP)nA-RAPM(其中n介于0~6之间);三连体重组蛋白连接方式为:RAPM-(AP)nA-RAPM-(AP)nA-RAPM(其中n介于0~6之间)。其中,RAPM为所有靶蛋白二连体、三连体结构中的单体蛋白的简称
5)构建重组抗原蛋白表达载体并进行重组蛋白的表达纯化,获得重组抗原蛋白:
①基因序列优化合成及表达载体构建:将上述重组抗原蛋白(二聚体或多聚体)及重组抗原单体氨基酸序列对应编码基因按照对应表达***密码子偏爱性、同时兼顾mRNA二级结构、核糖体结合位点等信息,优化合成基因序列,并构建表达载体;
②重组蛋白表达纯化:经体外表达纯化获得重组抗原蛋白及重组抗原单体。
6)结构验证及免疫评价:
①重组抗原蛋白结构验证:经小角X射线衍射分析重组抗原蛋白及重组抗原单体的结构,与前期的预测结果进行比对分析。
②动物实验:进一步用纯化重组抗原蛋白及重组抗原单体免疫靶动物,通过动物实验评价分析该重组抗原刺激机体产生特异性免疫应答的效果。
实施例1猪瘟病毒重组抗原
本实施例提供了易于激活B细胞的猪瘟病毒重组抗原及其制备方法。
1.确定靶标蛋白:
猪瘟(classical swine fever,CSF)是由猪瘟病毒(classical swine fevervirus,CSFV)引起的一种高度接触性、急性、致死性传染病。CSFV基因组为单股正链RNA,呈球形的囊膜病毒。通过文献检索及生物信息学预测分析CSFV结构(图4)发现,CSFV的4种主要的结构蛋白是C、Erns(gp44/48)、E1(gp33)、E2(gp55)。其中结构蛋白E2分子量约55kDa,为糖基化的囊膜蛋白,主要位于病毒粒子表面,在病毒入侵细胞的过程中发挥重要作用;同时E2蛋白也是CSFV主要保护性抗原,能够诱导机体产生中和抗体,抵抗病毒的入侵,是CSFV疫苗研究的重要靶标。因此,选择E2蛋白作为靶标蛋白。
2.靶标蛋白结构分析及关键抗原表位的确定
1)靶标蛋白二级结构预测
通过生物信息学预测E2蛋白的二级结构,DNASTAR中Garnier-Robson方法和Chou-Fasman方法(图5A)以及SOMPA预测(图5B)和PDB预测(图5C)的α螺旋、β折叠、转角及无规卷曲区域略有不同;SOMPA预测结果显示HN蛋白二级结构中无规卷曲(Random coil,c)约占47.98%、α螺旋(Alpha helix,h)16.17%、延伸链(Extended strand,e)27.76%、β转角(Beta turn,t)8.09%(图5B)。经预测发现,E2蛋白大概包含22个线性表位(图5A),另据文献报道,E2蛋白N端1~176aa是中和性抗原簇集聚的区域。经预测发现该区域至少存在7个抗原表位13~18,32~44,85~97,111~123,143~150,154~160以及170~176;另外经预测在E2蛋白C端还存在两个优势表位237~244、304~312。
2)靶标蛋白三级结构分析
研究发现,CSFV E2蛋白的氨基酸序列与同属的BVDV同源性高达79%,两者在结构、极性及电荷分布上相似性很高。同源建模获得CSFV E2蛋白单体结构(图6A)、及E2蛋白天然形成的二聚体结构(图6B)与BVDV E2蛋白单体(图6C)、二聚体结构(图6D)(PDB ID:2YQ2)高度相似。
3.确定重组抗原单体的氨基酸序列
通过靶标蛋白质三级结构分析及生物信息学预测抗原表位在靶标蛋白表面的分布情况及其具***置;结合分析结果及已有文献报道,选择包含关键中和表位及主要B细胞表位的E2蛋白基序作为重组抗原的关键骨架,根据GenBank中登录的猪瘟E2基因序列(GenBank编号:AAK21202.1),先把E2基因密码子优化成水稻偏好的氨基酸序列,得到重组抗原单体的氨基酸序列(如SEQ ID NO.1所示),将重组抗原单体命名为rE2。
4.确定连接肽序列,得到多聚体重组抗原的氨基酸序列
1)B细胞抗原受体(B-cell receptor,BCR)在细胞表面的分布及其特点
在成熟B细胞表面,BCR总是和负责传递抗原刺激信号的Igα/Igβ(CD79a/b)异二聚体共同表达,形成BCR-Igα/Igβ复合体(BCR复合物)(图7),Igα/Igβ和mIg的跨膜区均有极性氨基酸,能够借助静电吸引而组成稳定的BCR复合物。BCR具有抗原结合特异性,每个个体的BCR多样性高达5×1013,构成容量巨大的BCR库,赋予个体识别各种抗原、产生特异性抗体的巨大潜能。
2)连接肽(Linker)类型及长度的确定
Linker设计的基本原则是重组抗原单体之间不应相互影响,也不应相互折叠或缠绕在一起而导致彼此的活性丧失;重组抗原单体的核心区域(关键中和表位)要相互远离,不会形成空间位阻而影响表位的呈现。而根据BCR复合物的结构特点(图7),B细胞膜是一种液态镶嵌模型,两个BCR的距离是相对可变,在3-50nm之内,在蛋白表位结合时由于其极性作用,使得BCR之间的距离可调控;但是可调控的距离有一定的范围,超出一定的距离范围,就不能调控BCR之间的距离。结合设计连接肽的常用的工具与数据库,通过连接肽长度、溶剂可及性和二级结构或序列等查询、分析常用Linker序列及其特点。为使相同抗原表位更容易被B细胞上的BCR识别,导致BCR被交联,从而容易激活B细胞,结合上述分析结果,根据不同Linker特性,(G4S)n是最常用的柔性Linker,较为复杂的蛋白选择柔性linker能尽量减少Linker自身氨基酸序列对靶蛋白结构的影响,因而rE2重组蛋白以Linker(G4S)n为连接肽,二连体重组抗原蛋白连接方式为:氨基酸序列从N端到C端依次为:rE2-(G4S)n-rE2,经同源建模该二连体重组抗原蛋白的预测结构如图8所示,分别为不同预测软件同源建模获得的二连体重组抗原蛋白三维结构示意图,分析n=2、n=3、n=4时形成的二连体结构的稳定性及关键抗原表位EP-1(13~18位氨基酸)、EP-2(32~44位氨基酸)、EP-3(154~176位氨基酸)以及EP-4(237~244位氨基酸)在二连体重组抗原蛋白中两个相同表位之间的距离(表1),两个相同表位之间的距离基本上都在10~50nm之间,可与B细胞表面的BCR之间的距离相匹配,当Linker为(G4S)3时(图8B、图8E),rE2-(G4S)3-rE2形成的二连体蛋白结构更稳定,优选n=3的Linker进行二连体蛋白的构建。
表1 rE2-(G4S)n-rE2二连体中两个相同表位之间的距离(nm)
Figure GDA0003847505190000111
因此,我们设计了“尾对头”rE2(Gen-Bank登录号:AAK21202.1))二连体模型。这种结构通过柔性肽(G4S)3在一个分子的C末端与另一分子的N末端之间相互连接。知道模板蛋白被柔性肽接头延长成杆状,故尾头相连的设计建立了一个模型,使成对的相同表位沿着线圈的轴成对分布(图9)。
5.构建重组抗原蛋白表达载体并进行重组蛋白的表达纯化,获得重组抗原蛋白
1)水稻胚乳的遗传转化:合成的rE2-(G4S)3-rE2基因(如SEQ ID NO.2所示)通过双酶切MlyⅠ和XhoⅠ连接到中间载体pMP3中。质粒-pCAMBIA-1300-rE2-(G4S)3-rE2最终被引入到农杆菌EHA105。然后将质粒-pCAMBIA-1300-rE2-(G4S)3-rE2共转化到TP309水稻种子的愈伤组织。通过农杆菌介导转化最终获得表达rE2-(G4S)3-rE2蛋白的转基因株系。PCR用于鉴定表达的转基因植株,正向引物(5'-CACATCCATCATTATCCATC CACC-3')和反向引物(5'-GTTGAGGAGGGTGGTGTTGTACT-3')。
2)重组rE2-(G4S)3-rE2蛋白的鉴定:使用提取缓冲液[25mM Tris-HCl(pH 8.6),1mM EDTA]提取总可溶性蛋白。通过非还原性SDS/PAGE和天然PAGE验证蛋白质的大小。将约10μg的蛋白质上样并在10%的聚丙烯酰胺凝胶上分离,然后进行蛋白质印迹分析。抗CSFV血清稀释度为500倍,辣根过氧化物酶(Jackson Immuno Research)的抗猪IgG山羊抗体稀释度为5,000倍。CSFV E2抗原快速测试纸用于鉴定和筛选rE2表达的转基因植物。QPCR用于鉴定纯合植物,正向引物是(5'-GACCAGCTGCACCTTCAACTA-3')和反向引物是(5'-AGTACTGGTACTCGCCCTTGAG-3')。
3)重组rE2-(G4S)3-rE2蛋白的纯化和定量:将转基因水稻种子研磨成粉末,并在室温下以1:5(w/v)的比例匀浆提取2小时。提取缓冲液为[25mM Tris-HCl(pH 8.9),1mMEDTA]。然后在12,000×g下离心10分钟使粗提物澄清,并通过0.22um的滤膜(Millipore)。将澄清的提取物上样至Q-650M(TOSOH)层析柱。后用Superdex 200 16/60色谱柱(GE)通过尺寸排阻色谱法进一步纯化rE2-(G4S)3-rE2。纯化的rE2-(G4S)3-rE2蛋白用BCA蛋白测定法(Pierce)定量。使用纯化的rE2-(G4S)3-rE2蛋白作为标准品,通过直接ELISA(CSFV AgElisa试剂盒,Median,Korea)评估纯合植株和杂交植物中rE2-(G4S)3-rE2蛋白的表达量。
4)分析超速离心(AUC)分析:沉降速度实验是在Beckmann XL-A分析型超速离心机上进行的,转速为40,000r.p.m(20℃)。总共收集了444次扫描。蛋白质样品的浓度为1.1mgmL-1。加载样品溶液(380μL)和参比溶液(400μL)。初步实验进行平衡沉降和数据分析。根据氨基酸序列计算出分子质量(63kDa和165kDa)。使用SEDFIT程序分析了沉降速率的数据。
通过QPCR确定转基因水稻的稳定表达株系,并从T3代的119个株系中选出5个高表达纯合株系。如图10所示,通过水稻杂交,提高rE2-(G4S)3-rE2蛋白的表达量并进行检测为128μg/g至480μg/g。离子交换介质和疏水介质可将rE2蛋白纯度提高到90%以上,从而提高了生物安全性。如图11所示,非还原SDS/PAGE和尺寸排阻色谱(SEC)结果表明,重组蛋白分子为二聚体,分子量约为63kDa。超离心分析(AUC)实验表明,87%的rE2蛋白形成二聚体,13%的rE2形成了多聚体。为了验证纯化的rE2蛋白的抗原活性,猪瘟E2抗原快速检测试纸的效价为1:3.2×104。这些数据证明,我们成功建立了稳定表达rE2-(G4S)3-rE2蛋白的转基因株系。
6.结构验证及免疫评价
1)重组抗原蛋白结构验证
①结晶、数据收集和结构确定:将rE2-(G4S)3-rE2蛋白浓缩至7mg·mL-1,并通过坐滴蒸气扩散法获得rE2晶体。在蛋白质:母液的的比例为1:1的的条件下使其生长,该母液中含有0.1M甲酸镁,15%(w/v)PEG 3350(20℃)。衍射数据记录在上海国家蛋白质科学中心(NCPSS)的BL19U2光束线上,并用HKL2000处理数据。使用程序PHENIX AUTOSOL,通过使用晶体的多波长异常色散(MAD)相位确定结构。手动构建是通过COOT程序执行的。
②小角度X射线散射(SAXS):rE2的SAXS数据是在SIBYLS Beamline 12.3.1的高级光源(上海同步加速器)上进行的。所有数据集均在283K下以三个暴露时间(0.5、1和6s)进行测量。使用三种不同浓度的蛋白质(分别为1、3和5mg·mL-1)进行测量。最后,散射曲线以6s的曝光时间收集。浓度为5mg·mL-1的样品未显示出辐射损伤和较高的信噪比。使用程序PRIMUS分析散射曲线的质量,以确保在进一步分析之前没有明显的聚集和辐射损伤。初始Rg值是从Guinier图计算得出的。仅使用低q值的数据进行计算。使用程序GNOM计算P(r)分布函数。使用P(r)分布函数直接从SAXS MoW服务器估算分子量。使用原始散射曲线和计算出的P(r)分布曲线,通过程序DAMMIF以非对称单位和P2对称性对溶液中蛋白质的低分辨率棒状进行建模。使用DAMAVER程序对20个连续且有意义的单个DAMMIF计算进行对齐,合并和过滤,以生成最终模型。使用Chimera软件查看低分辨率结果rE2蛋白结构。
X射线晶体结构显示rE2-(G4S)3-rE2蛋白是由两个不对称分子组成。通过质谱检测证实两个分子链的N和C末端通过(G4S)3连接。晶体结构与单体BVDV E2(PDB:2yq2)表现出总体一致性-在所有残基上的主链RMSD为
Figure GDA0003847505190000131
而域D(DD)的全原子RMDS为
Figure GDA0003847505190000132
二硫键检测证明rE2无法形成同源二聚体,表明DD已完全暴露。尽管结构域B(DB)和C(DC)与BVDV E2保持良好的一致性,但DB,DC和DD的rE2的表面静电势表明,活性位点大部分被带正电的基团包围。
如图12所示,小角度X射线散射(SAXS)用于确定液体中rE2的分子结构。蛋白的大致轮廓约
Figure GDA0003847505190000133
图中显示成对的抗原表位位于同一水平面,距离约为
Figure GDA0003847505190000134
位于3-50nm之间,提高了激活概率。P(r)函数表明,rE2在溶液中的呈棒状,最大尺寸约
Figure GDA0003847505190000135
SMXS结果的密度与晶体结构一致,表明rE2二聚体符合尾头相连的设计。
如图13所示,rE2形成四聚体后,存在两个相同的抗原表位,具有3种不同的两两组合方式,由图可以看出,四聚体增加的抗原表位之间距离的可能性,在3种组合中至少存在一种组合与BCR之间的距离相接近。具体距离如表2所示。
表2 rE2-(G4S)n-rE2形成四聚体后两个相同表位之间的距离(nm)
Figure GDA0003847505190000136
2)动物实验
将Balb/C小鼠(雌性,6周大;郑州大学动物中心)随机分为四组(每组n=5)。纯化的rE2-(G4S)3-rE2-蛋白的5只小鼠免疫剂量均为200μL(5μg/只)。。阳性对照组和阴性对照组分别注射200μL猪瘟减毒活疫苗和非转基因水稻TP309。间隔7天采集血清样品。小鼠血清用PBS稀释10倍进行检测。新西兰白兔(每组n=4)肌肉注射20μg/只rE2-(G4S)3-rE2和1mL阴性对照(TP309)。阳性对照静脉注射1mL商品化的减毒活疫苗。在免疫3周后,用15,000RID50商业减毒活疫苗静脉注射进行攻毒实验。每8小时记录一次体温记录有无发烧体征。直肠温度≥40℃且持续至少18小时被认定为发烧。根据猪瘟病毒(CSFV)抗体检测试剂盒(IDEXX,US)说明书,当计算的S/P比率超过40%时,检测血清被判断为阳性。
用Balb/C小鼠(每组n=5)和兔子(每组n=4)验证rE2-(G4S)3-rE2蛋白的免疫原性,免疫注射两次的Balb/C小鼠产生了明显优于减毒活疫苗的抗体反应。与阳性对照(减毒活疫苗)和阴性对照(非转基因植物TP309)之间均差异显著。用rE2-(G4S)3-rE2和减毒活疫苗免疫的家兔,在免疫后7天就产生了特异性抗体反应,抗体水平与减毒活疫苗相当。首次免疫后,以15,000RID50减毒活疫苗静脉注射。阴性对照有明显的发烧症状。rE2-(G4S)3-rE2组和阳性对照组均正常,说明rE2-(G4S)3-rE2重组疫苗能有效抵御CSFV病毒攻击,起到有效的免疫保护作用,,如图14所示。(请核对上述内容,建议进行修改,明确获得的重组抗原蛋白rE2-(G4S)3-rE2的有益效果)
实施例2新城疫病毒重组抗原
本实施例提供了易于激活B细胞的新城疫病毒重组抗原及其制备方法。
1.确定靶标蛋白:
新城疫病毒(Newcastle disease virus,NDV)为有囊膜的近似球形的颗粒,也常因囊膜破损而呈不规则形态,可见横断面直径为100nm左右的不同长度的细丝。通过文献检索及生物信息学预测分析NDV病毒结构(图15)。病毒囊膜表面覆盖有8nm长的纤突,病毒粒子内部为一直径约17nm的卷曲的核衣壳,NDV的6种特异性结构蛋白是L蛋白(largeprotein,大蛋白)、NP(nucleuo protein,核蛋白)、P蛋白(phosphor protein,磷蛋白)、M蛋白(matrix protein,基质蛋白)、F蛋白(fusion protein)和HN(haemagglutinin-neuraminidase protein,血凝素—神经氨酸酶蛋白)。其中HN蛋白是使病毒体吸附于细胞表面的唾液酸脂质受体(即神经节苷脂,ganglioside),并通过血凝素和神经氨酸酶两种生物活性破坏这种受体的功能,使释放的病毒不能再吸附到细胞上。HN蛋白以四聚体形式存在,分为胞内区(CT)、跨膜区(TM)、颈部(stalk)和球状头部(head),在HN的颈部(49~126)由内侧的疏水aa残基形成一个四聚体束状结构(4HB)。球状头部的核心结构为6组
Figure GDA0003847505190000141
片层结构,通过一种"velcro"搭扣结构相互连接,并在其N-端和C-端通过二硫键稳固其构象,球状头部既包含受体结合区域又包含NA活性位点,是NDV疫苗研究的关键靶点。因此,选择NDV的HN蛋白作为靶标蛋白。
2.靶标蛋白结构分析及关键抗原表位的确定
1)靶标蛋白二级结构预测
通过生物信息学预测HN蛋白的二级结构,PDB(图16A)、DNASTAR中Garnier-Robson方法和Chou-Fasman方法预测的α螺旋、β折叠、转角及无规卷曲区域略有不同(图16B);SOMPA预测结果显示HN蛋白二级结构中无规卷曲(Random coil,c)约占40.04%、α螺旋(Alpha helix,h)21.37%、延伸链(Extended strand,e)26.09%、β转角(Beta turn,t)3.50%(图16C)。经预测发现,HN蛋白大概包含27个线性表位(图16C),另据文献报道,按照HN抗原效力将其分为四个不同区域:P1(1~52aa),P2(53~192aa),P3(193~302aa)和P4(303~571aa)。其中P2区域为主要线性抗原结构域,P1、P3和P4区域的抗原性较弱。P2抗原结构域上的89~161aa区域以高频率出现,可能是P2抗原结构域的抗原核心,经预测发现该区域至少存在3个抗原表位117~124,128~134,以及157~166。
2)靶标蛋白三级结构分析
研究发现,HN蛋白单体(图17A)、二聚体(图17B)及同源四聚体的结构(图17C,PDBID:4FZH),通常以同源四聚体形式存在,包含受体结合区域又包含NA活性位点,是NDV疫苗研究的关键靶点。
3.确定重组抗原单体的氨基酸序列
1)重组抗原单体的氨基酸序列
通过靶标蛋白质三级结构分析及生物信息学预测抗原表位在靶标蛋白表面的分布情况及其具***置;结合分析结果及已有文献报道,选择包含关键中和表位及主要B细胞表位的HN蛋白基序作为重组抗原的关键骨架,截除1~49aa的胞内区和跨膜区,同时在NCBI中选择35个NDV临床毒株的HN序列进行比对和同源分析(图18),将高变区位点中稀有氨基酸替换为不同毒株中出现频率高的氨基酸,得到重组抗原单体的氨基酸序列(如SEQ IDNO.3所示),将重组抗原单体命名为rHN。
2)重组抗原单体的二级结构和三级结构分析
通过重组蛋白rHN二级结构的分析(图19A)与预测发现,该重组蛋白抗原指数均值较高,与预期结果相符合;经同源建模发现该重组蛋白的三维结构(图19B)与NDV的HN蛋白(19C)结构相似性比较高,又存在一定差异,且HN蛋白的主要抗原表位在该重组蛋白上能被较好的展示。
4.确定连接肽序列,得到多聚体重组抗原的氨基酸序列
1)B细胞抗原受体(B-cell receptor,BCR)在细胞表面的分布及其特点
在成熟B细胞表面,BCR总是和负责传递抗原刺激信号的Igα/Igβ(CD79a/b)异二聚体共同表达,形成BCR-Igα/Igβ复合体(BCR复合物)(图7),Igα/Igβ和mIg的跨膜区均有极性氨基酸,能够借助静电吸引而组成稳定的BCR复合物。BCR具有抗原结合特异性,每个个体的BCR多样性高达5×1013,构成容量巨大的BCR库,赋予个体识别各种抗原、产生特异性抗体的巨大潜能。
2)连接肽(Linker)类型及长度的确定
B细胞膜是一种液态镶嵌模型,两个BCR的距离是相对可变,在3-50nm之内,在蛋白表位结合时由于其极性作用,使得BCR之间的距离可调控;但是可调控的距离有一定的范围,超出一定的距离范围,就不能调控BCR之间的距离。结合设计连接肽的常用的工具与数据库,通过连接肽长度、溶剂可及性和二级结构或序列等查询、分析常用Linker序列及其特点。根据重组抗原单体的结构、重组抗原表面抗原表位之间的位置和距离,结合BCR结构与rHN蛋白结构分析结果,rHN重组蛋白以Linker(G4S)n为连接肽,二连体重组蛋白连接方式为:氨基酸序列从N端到C端依次为:rHN-(G4S)n-rHN,经同源建模该二连体蛋白的预测结构如图20所示,分别分析n=2、n=3、n=4时形成的二连体结构的稳定性及HNM重组蛋白关键抗原表位EP1:117~124,EP2:128~134,EP3:157~166,EP4:333~345,EP5:457~465在二连体蛋白中两个相同表位之间的距离(表3),两个相同表位之间的距离基本上都在3~10nm之间,可与B细胞表面的B细胞抗原受体(B-cell receptor,BCR)之间的距离相匹配,当Linker为(G4S)3时,rHN-(G4S)3-rHN形成的二连体蛋白结构更稳定(图20B),与天然二聚体结构相似性最高。故选择n=3的结构作为候选疫苗。
表3 HNM-(G4S)n-HNM二连体中两个相同表位之间的距离(nm)
Figure GDA0003847505190000161
因此,将两个HN蛋白的胞外区(如SEQ ID NO.3所示)用连接肽(GGGGS)3连接起来,获得二连体重组抗原蛋白的氨基酸序列。
5.构建重组抗原蛋白表达载体并进行重组蛋白的表达纯化,获得重组抗原蛋白
1)水稻胚乳的遗传转化:利用水稻密码子偏好性进行rHN-(G4S)3-rHN编码基因的密码子优化,通过由南京金斯瑞公司人工合成编码rHN-(G4S)3-rHN的DNA序列(如SEQ IDNO.4所示)。将rHN二连体(rHN-(G4S)3-rHN,OsrHN)的基因序列通过双酶切MlyⅠ和XhoⅠ连接到中间载体pMP3,随后将重组质粒pMP3-OsrHN再克隆到植物载体pCAMBIA1300中,该载体以潮霉素(hptⅡ)基因为选择标记。通过农杆菌介导将质粒pCAMBIA1300-OsrHN转化到水稻品种TP309的愈伤组织中。在潮霉素选择培养基上进行筛选。将具有潮霉素抗性的愈伤组织分化成为绿色植株,即为转基因水稻植株。
2)PCR鉴定:从转基因水稻的幼叶中提取总基因组DNA。用正向引物HN1(5′-CACATCCATCATTATCCATCCACC-3′)和反向引物HN2(5′-TGACGAACTGC TGCATCTTG-3′)扩增PCR产物。PCR程序为94℃5分钟,94℃40s,52℃40s,72℃50s,35个循环,72℃10min。PCR产物在1%琼脂糖凝胶电泳上鉴定并拍照。
3)水稻源rHN-(G4S)3-rHN蛋白的提取:将脱壳后的转基因rHN-(G4S)3-rHN蛋白水稻种子研磨成米粉。按照质量体积比(g/mL)1:6的比例,将水稻米粉于提取buffer(25mMPB,pH=5.7)混合。室温条件下以30rmp/min转速搅拌提取1h。随后将提取物在4℃条件下,10000rpm/min离心10min去除残渣。收取上清液,分别选择孔径为3μm,0.8μm,0.45μm,0.22μm纤维滤膜,进行逐级过滤。最终获得澄清样品用于纯化。
4)SDS-PAGE和Western blot:转基因水稻提取物通过12%SDS-PAGE分离,然后转移至PVDF膜(Millipore)。用5%脱脂奶封闭膜以防止非特异性反应。2h后,用PBST缓冲液洗涤3次,并与抗HN蛋白的单克隆抗体(1:1000倍稀释)孵育。随后加入HRP标记山羊抗小鼠抗体(1:8000)。最后,通过ECL检测HN二聚体蛋白的表达。
5)rHN-(G4S)3-rHN蛋白的纯化:将大米种子磨成粉末,以磷酸盐缓冲液(25mM PB,pH 5.7)按1:6(wt/vol)的比例萃取1.5h并在室温下不断搅拌。4℃10,000rpm离心30min,除去种子残留物和沉淀。吸出上清液并测量电导值和pH。通过用0.8至0.22μm的过滤器沉淀过滤残渣。然后,将澄清的提取物上样至带有PB缓冲液(25mM,pH 5.7)的SP HP纯化柱(GEHealthcare)中。用30%的缓冲液B(25mMPB,1M NaCl)洗脱HN蛋白。将富集的HN蛋白上样至75pg凝胶过滤纯化柱,并收集第一个峰。将样品上样到Superdex 200increase凝胶过滤纯化柱(GE Healthcare)上进一步纯化,以获得用于结晶的最终样品。
为了鉴定rHN-(G4S)3-rHN二聚体基因是否成功整合至水稻基因组中,利用rHN-(G4S)3-rHN基因的鉴定引物,扩增目的基因。实验结果表明共筛选出109株rHN-(G4S)3-rHN二聚体阳性转基因植株,其中部分检测结果显示在图21中。
通过SDS-PAGE和蛋白质印迹分析转基因种子中的rHN-(G4S)3-rHN(Osr2HN)和HN单体(OsrHN)的表达。与非转基因TP309水稻相比,在HN二聚体(Osr2HN)和HN单体转基因谷物中分别发现了约120kDa和60KD的主要蛋白带,如图22所示。
6.结构验证及免疫评价
1)重组抗原蛋白结构验证
①OsrHN蛋白结晶条件的筛选:蛋白结晶是蛋白在合适溶液中的有序堆积而形成的。蛋白的结晶条件与蛋白的分子大小、表面电荷、蛋白的亲疏水性等理化条件有关。蛋白的溶解度收到诸多因素的影响如结晶条件中的沉淀剂、离子等。因此蛋白结晶条件的筛选和优化是一项繁琐而精细的过程。本研究中采用气相扩散法中的坐滴法进行蛋白晶体生长实验。将纯化后的HN蛋白浓度调整在5~15mg/mL,进行结晶条件的筛选。筛选的晶体生长试剂盒包括Hampton Research公司的Index、Crystal Screen、Crystal Screen II,PEG/Ion、SaltRx、SaltScreen,Rigaku公司的WizardI,WizardII,WizardIIIe系列。取100μL不同的生长buffer加入坐滴板的结晶池中。在结晶孔中加入1μL蛋白样品,随后取1μL结晶池液加入蛋白样品中。用密封胶带封好坐滴板,以形成一个密闭体系。将晶体板放置20℃晶体培养箱中培养。每间隔24h在显微镜下观察各结晶条件下晶体的生长情况。
②衍射数据的收集与处理:将蛋白晶体至于适当的防冻液中,防冻液是在原有的晶体生长条件下添加不同比例的甘油、乙二醇等。若晶体没有发生冻裂或者形成冰晶说明条件不适合,需要进行更改。随后将晶体置于液氮罐中,在上海同步辐射光源收集X射线。根据数据质量选择合适的曝光时间、探测器距离等。用HKL2000软件对衍射数据进行预处理。随后采用分子置换法进行晶体的结构学解析。采用COOT软件进行手动搭建,采用PHENIX软件进行修正。采用PyMOL软件生成最后的结构图。
③小角X射线衍射:采用小角X射线衍射(Small angel X-ray scattering,SAXS)验证HN蛋白在溶液中的蛋白结构。将蛋白浓度调整为三个不同梯度,分别是1mg/mL、3mg/mL和5mg/mL。在上海同步衍射光源线站收集小角衍射数据。首先收集样品缓冲液的衍射数据,随后收集不同浓度的样品数据。将样品的衍射数据减去样品缓冲液数据的均值。采用PRIMUS程序分析衍射曲线的质量,以确保没有明显的聚集和辐射损伤。采用GNOM软件计算P(r)曲线。采用DAMMIF程序模拟蛋白在溶液中的结构轮廓。采用Chimera程序将蛋白的结构轮廓与晶体结构相叠加并生成最终的结构图。
结果如下:
将纯度>95%的OsrHN二聚体蛋白(25mM PB,100mM NaCl,pH 5.7)用超滤浓缩管浓缩至5mg/ml和10mg/ml,采用蒸汽扩散坐滴法进行晶体生长条件的筛选。采用结晶筛选试剂盒Crystal Screen(HR2-110)、Crystal ScreenII(HR2-112)和Index(HR2-114)筛选结晶缓冲液。结果显示,水稻源HN二聚体蛋白浓度为7.7mg/ml时,在60%Tacsimate(pH7.0)的条件下有晶体长出。蛋白和池液的混合比例为1:1,晶体生长环境温度为25℃。在3~4天,显微镜下观察到晶体成长方形,如图23所示。采用60%Tacsimate(pH 7.0),15%甘油的防冻液在液氮中冻存晶体,用于晶体数据收集。
为了表征HN二聚体的结构,使用了纯Osr2HN蛋白进行结晶。通过分子置换法将结构替换为先前确定的HN结构作为模板(PDB ID 3t1e)。HN二聚体的晶体空间群为P21 2121,晶体结构的分辨率范围为
Figure GDA0003847505190000181
R-free值为0.3392。在晶体的一个不对称单元中有4个HN分子,如图24所示。由于连接肽的高柔韧性导致无序的晶体积累,因此在结构中未发现连接肽的电子云。为了证明连接肽存在,我们对纯化的Osr2HN进行了质谱分析。单次检测的序列覆盖率达到83%,完全覆盖了HN蛋白的头部、颈部、和连接肽3个结构域,如图25所示。此外,在质谱中检测到包括HN的C末端,柔性接头和HN的N末端的长度为32aa的肽。证明连接肽没有被蛋白酶降解。成功获得了HN二聚体。
为了检测在溶液中的HN二聚体结构的聚合物状态,采用小角X射线衍射技术分析不同浓度下的HN二聚体的衍射数据,并将蛋白的二维数据处理为一维散射曲线。通过Primus软件进行归一化并去除缓冲液的散射背景。采用Gnom程序获得输出的文件。采用Chimera进行3D建模,获得HN二聚体的结构轮廓。将先前解析的HN蛋白二聚体的晶体结构与SAXS获得的结构轮廓进行比较,结果显示,SAXS结构与HN四聚体完全匹配。表明晶体结构获得的HN四聚体不是由晶体堆积形成的,而是由HN二聚体自身形成的二聚体。
如图26所示,HN形成四聚体后,存在4个相同的抗原表位,具有6种不同的两两组合方式。由图可以看出,四聚体增加的抗原表位对之间距离的可能性,在6种组合中至少存在一种组合与BCR之间的距离相接近。具体距离如表4所示。
Figure GDA0003847505190000182
2)动物实验
将28日龄的SPF鸡随机分成ABC组,每组10只。A组中每只鸡皮下接种200μL乳化后的HN蛋白单体,B组每只鸡接种200μl的HN蛋白二聚体,C组接种相同体积的PBS。接种后每周进行静脉采血并分离血清。采用血凝抑制方法检测鸡体内产生的HN特异性抗体。
结果如图27所示。根据结果可以看出,在相同的免疫剂量下,HN二聚体比HN单体更有效地激活B细胞,以产生更高的滴度血凝抑制抗体。同时,由HN二聚体产生的抗体在免疫后21天到28天内下降了1log2,随后在49天内保持稳定。相应地,由HN单体产生的特异性抗体从免疫后的21天到49天显着减少。
实施例3新型冠状病毒重组抗原
本实施例提供了易于激活B细胞的新型冠状病毒重组抗原及其制备方法。
1.确定靶标蛋白:
通过文献检索及生物信息学预测分析SARS-CoV-2病毒结构(图28),SARS-CoV-2的4种主要结构蛋白是刺突蛋白(Spike protein,S)、包膜蛋白(Envelop protein,E)、基质蛋白(Membrane protein,M)和核衣壳蛋白(Nucleocapsid protein,N)。其中S蛋白是冠状病毒表面的一类重要的糖蛋白,包含冠状病毒的关键抗原表位,是病原检测及疫苗研究的主要靶点。因此,选择S蛋白作为靶标蛋白。
2.靶标蛋白结构分析及关键抗原表位的确定
1)靶标蛋白二级结构预测
通过生物信息学预测S蛋白的二级结构,DNASTAR中Garnier-Robson方法和Chou-Fasman方法预测的α螺旋、β折叠、转角及无规卷曲区域略有不同(图29A);SOMPA预测结果显示S蛋白二级结构中无规卷曲(Random coil,c)约占37.31%、α螺旋(Alpha helix,h)30.09%、延伸链(Extended strand,e)24.27%、β转角(Beta turn,t)8.33%(图29B)。经预测发现,S蛋白大概包含28个线性表位(图29C、图29D),其中RBD区域包含了至少8个细胞表位250~258,279~286,310~317,355~359,384~387,424~428,438~448,457~470。另据文献报道SARS-CoV的S蛋白中的485~625为氨基酸产生的抗体可中和Vero E6细胞中SARS病毒;经比对发现SARS-CoV-2S蛋白对应位置的499~639段与上述序列高度同源,经预测发现该区域至少存在4个抗原表位526~536,602~606,637~645。
2)靶标蛋白三级结构分析
研究发现,S蛋白以同源三聚体形式存在(图30A,PDB No.6xlu),主要由S1亚基与S2亚基构成,S1亚基位于N端,包含受体结合域(receptor-binding domain,RBD),与人ACE2受体相互作用(图30B),在病毒感染宿主细胞中起到关键作用,是目前疫苗研究的重要靶点。
3.确定重组抗原单体的氨基酸序列
1)重组抗原单体的氨基酸序列
通过靶标蛋白质三级结构分析及生物信息学预测抗原表位在靶标蛋白表面的分布情况及其具***置;结合分析结果及已有文献报道,选择包含关键中和表位及主要B细胞表位的S蛋白RBD基序作为重组抗原的关键骨架,同时组合RBD基序外的关键抗原表位,得到重组抗原单体的氨基酸序列(如SEQ ID NO.5所示),将重组抗原单体命名为rRBD。
2)重组抗原单体的二级结构和三级结构分析
通过对重组蛋白rRBD二级结构的分析(图31A)与预测发现,该重组蛋白抗原指数均值较高,与预期结果相符合;经同源建模发现该重组蛋白rRBD的三维结构(图31B)与SARS-CoV-2的S蛋白RBD基序(图31C)结构相似性比较高,又存在一定差异,且S蛋白的主要抗原表位在该重组蛋白上能被较好的展示。
4.确定连接肽序列,得到多聚体重组抗原的氨基酸序列
1)B细胞抗原受体(B-cell receptor,BCR)在细胞表面的分布及其特点
在成熟B细胞表面,BCR总是和负责传递抗原刺激信号的Igα/Igβ(CD79a/b)异二聚体共同表达,形成BCR-Igα/Igβ复合体(BCR复合物)(图7),Igα/Igβ和mIg的跨膜区均有极性氨基酸,能够借助静电吸引而组成稳定的BCR复合物。BCR具有抗原结合特异性,每个个体的BCR多样性高达5×1013,构成容量巨大的BCR库,赋予个体识别各种抗原、产生特异性抗体的巨大潜能。
2)连接肽(Linker)类型及长度的确定
Linker设计的基本原则是重组抗原单体之间不应相互影响,也不应相互折叠或缠绕在一起而导致彼此的活性丧失;重组抗原单体的核心区域(关键中和表位)要相互远离,不会形成空间位阻而影响表位的呈现。而根据BCR复合物的结构特点(图7),B细胞膜是一种液态镶嵌模型,两个BCR的距离是相对可变,在3-50nm之内,在蛋白表位结合时由于其极性作用,使得BCR之间的距离可调控;但是可调控的距离有一定的范围,超出一定的距离范围,就不能调控BCR之间的距离。为使相同抗原表位更容易被B细胞上的BCR识别,导致BCR被交联,从而容易激活B细胞,结合上述分析结果,rRBD重组蛋白以Linker(G4S)n为连接肽,二连体重组蛋白连接方式为:rRBD-(G4S)n-rRBD,三连体重组蛋白的连接方式为:rRBD-(G4S)n-rRBD-(G4S)n-rRBD;经同源建模该二连体蛋白的预测结构如图32所示,分别分析n=0、n=1、n=2、n=3时形成的二连体结构的稳定性及rRBD重组蛋白关键抗原表位EP-1(45~50位氨基酸)、EP-2(129~139位氨基酸)、EP-3(233~243位氨基酸)以及EP-4(255~267位氨基酸)在二连体蛋白中两个相同表位之间的距离(表5),两个相同表位之间的距离基本上都在3~5nm之间,可与B细胞表面的B细胞抗原受体(B-cell receptor,BCR)之间的距离相匹配,当rRBD重组蛋白不经过连接肽直接首尾相连时(rRBD-rRBD),预测其N端和C端抗原表位可能会有部分表位被掩盖,可能会对免疫效果造成一定影响;而当Linker为(G4S)2时,rRBD-(G4S)2-rRBD形成的二联体蛋白结构更稳定,且两个相同表位之间的距离相对更近。
表5 rRBD-(G4S)n-rRBD二连体中两个相同表位之间的距离(nm)
Figure GDA0003847505190000201
而三连体重组蛋白连接方式为:rRBD-(G4S)n-rRBD-(G4S)n-rRBD,经同源建模该三连体蛋白的预测结构如图33所示,分别分析n=1、n=2、n=3时形成的二连体结构的稳定性及RBDM重组蛋白关键抗原表位EP-1(45~50位氨基酸)、EP-2(129~139位氨基酸)、EP-3(233~243位氨基酸)以及EP-4(255~267位氨基酸)在三连体蛋白中两相同表位之间的距离(表6),两个相同表位之间的距离基本上都在3~5nm之间,可与B细胞表面的B细胞抗原受体(B-cell receptor,BCR)之间的距离相匹配,当Linker为(G4S)2时,rRBD-(G4S)2-rRBD形成的二联体蛋白结构更稳定,且两个相同表位之间的距离相对更近。
表6 rRBD-(G4S)n-rRBD-(G4S)n-rRBD三连体中两相同表位间的距离(nm)
Figure GDA0003847505190000211
因此,将两个或三个重组抗原单体,即rRBD蛋白(氨基酸序列如SEQ ID NO.5所示)用连接肽(G4S)2连接起来(图34),获得二聚体或三聚体重组抗原蛋白的氨基酸序列。
5.构建重组抗原蛋白表达载体并进行重组蛋白的表达纯化,获得重组抗原蛋白
1)重组抗原蛋白在CHO细胞中的表达:根据GenBank中登录的新型冠状病毒S蛋白氨基酸序列(GenBank编号:MN908947),将两个RBD序列直接或通过柔性连接子(G4S)2尾首相连(图34A、B),并按照CHO细胞密码子偏好性优化rRBD-rRBD及rRBD-(G4S)2-rRBD蛋白基因序列(如SEQ ID NO.6、SEQ ID NO.7所示)。将合成的rRBD二连体基因分别通过EcoR I和BamHI双酶切后克隆入pLVX-IRES-ZsGreen1表达载体中,用去内毒素质粒提取试剂盒提取pLVX-rRBD2-IRES-ZsGreen1及pLVX-rRBD3-IRES-ZsGreen1重组表达载体,并转染CHO细胞,转染后7天收获培养上清。
通过两个柔性连接子(G4S)2将三个新型冠状病毒S蛋白rRBD基因序列尾首相连,组成三连体结构(图34C)。根据CHO细胞密码子偏好性优化上述多聚体蛋白DNA序列(如SEQID NO.8所示)并合成。将rRBD多聚体基因克隆入pLVX-IRES-ZsGreen1表达载体中,构建pLVX-rRBD2-IRES-ZsGreen1和pLVX-rRBD3-IRES-ZsGreen1重组表达载体,转染CHO细胞,7天后取培养上清。
2)重组抗原蛋白的鉴定:取培养上清,进行SDS-PAGE电泳,然后转膜,通过Westernblot方法,用RBD单克隆抗体检测重组抗原蛋白(包括rRBD-rRBD、rRBD-(G4S)2-rRBD及rRBD-(G4S)2-rRBD-(G4S)2-rRBD)的表达情况。
3)重组抗原蛋白的纯化:用PBS缓冲液平衡Anti-RBD亲和凝胶层析柱,将培养上清加入到平衡好的层析柱中,用15倍柱体积的PBS缓冲液清洗层析柱,用洗脱液((0.1MGlycine-HCl,pH3.5)洗脱重组抗原蛋白,收集洗脱液并迅速用中和液(1M Tris,pH9.0)中和,将含有蛋白的收集管合并,测定蛋白含量并进行SDS-PAGE电泳分析。
用Western blot方法检测重组抗原蛋白表达情况,结果如图35所示,rRBD–rRBD(图35A中rRBD2泳道)和rRBD-(G4S)2-rRBD(图35B中rRBDL2泳道)重组蛋白在65kD附近均有特异性条带,rBDM-(G4S)2-rRBD-(G4S)2-rRBD(图35C中rRBDL3泳道)与预期大小一致,说明两种形式的二聚体重组抗原蛋白和三聚体重组抗原代表均在CHO细胞中以分泌蛋白的形式表达;用亲和层析法对三种重组抗原蛋白进行纯化,得到具有较高纯度的rRBD–rRBD(图36A中rRBD2泳道)、rRBD-(G4S)2-rRBD(图36B中rRBDL2泳道)以及rRBD-(G4S)2-rRBD-(G4S)2-rRBD(图36C中rRBDL3泳道)。
6.免疫评价
将Balb/C小鼠(雌性,6周龄)随机分为四组,每组5只。RBD单体蛋白组每只小鼠皮下接种5μg RBD蛋白,直接尾首相连的rRBD二连体蛋白(rRBD2)组中每只小鼠皮下接种5μgrRBD2蛋白,通过连接肽连接的rRBD二连体蛋白(rRBDL2)组中每只小鼠皮下接种5μgrRBDL2蛋白,rRBD三连体蛋白组中每只小鼠皮下接种5μg rRBD三连体蛋白,阴性对照组接种相同体积的PBS,各组首免后两周加强免疫一次。首次免疫后第2周开始每周进行尾静脉采血,用新型冠状病毒抗体检测试纸检测小鼠血清效价。
经过两次免疫接种后,两种形式的rRBD二连体重组抗原蛋白和三连体重组抗原蛋白均诱导小鼠产生了较高水平的抗体反应,抗体滴度是RBD单体组小鼠的10~40倍,同时与免疫RBD单体组相比,免疫三连体重组抗原蛋白组的小鼠血清抗体滴度维持时间更久(图37)。以上结果表明rRBD多连体重组抗原蛋白免疫效果明显优于RBD单体蛋白。
<110> 河南中泽生物工程有限公司
<120> 易于激活B细胞的重组抗原蛋白及其制备方法
<150> CN202010455701.X
<151> 2020-05-26
<150> CN202010818901.7
<151> 2020-08-14
<160> 8
<170> PatentIn version 3.5
<210> 1
<211> 371
<212> PRT
<213> 人工序列
<221> rE2氨基酸序列
<400> 1
Arg Leu Ala Cys Lys Glu Asp Tyr Arg Tyr Ala Ile Ser Ser Thr Asn
1 5 10 15
Glu Ile Gly Leu Leu Gly Ala Gly Gly Leu Thr Thr Thr Trp Lys Glu
20 25 30
Tyr Ser His Asp Leu Gln Leu Asn Asp Gly Thr Val Lys Ala Ile Cys
35 40 45
Val Ala Gly Ser Phe Lys Ile Thr Ala Leu Asn Val Val Ser Arg Arg
50 55 60
Tyr Leu Ala Ser Leu His Lys Gly Ala Leu Leu Thr Ser Val Thr Phe
65 70 75 80
Glu Leu Leu Phe Asp Gly Thr Asn Pro Ser Thr Glu Glu Met Gly Asp
85 90 95
Asp Phe Gly Phe Gly Leu Cys Pro Phe Asp Thr Ser Pro Val Val Lys
100 105 110
Gly Lys Tyr Asn Thr Thr Leu Leu Asn Gly Ser Ala Phe Tyr Leu Val
115 120 125
Cys Pro Ile Gly Trp Thr Gly Val Ile Glu Cys Thr Ala Val Ser Pro
130 135 140
Thr Thr Leu Arg Thr Glu Val Val Lys Thr Phe Arg Arg Glu Lys Pro
145 150 155 160
Phe Pro His Arg Met Asp Cys Val Thr Thr Thr Val Glu Asn Glu Asp
165 170 175
Leu Phe Tyr Cys Lys Leu Gly Gly Asn Trp Thr Cys Val Lys Gly Glu
180 185 190
Pro Val Val Tyr Thr Gly Gly Gln Val Lys Gln Cys Lys Trp Cys Gly
195 200 205
Phe Asp Phe Asn Glu Pro Asp Gly Leu Pro His Tyr Pro Ile Gly Lys
210 215 220
Cys Ile Leu Ala Asn Glu Thr Gly Tyr Arg Ile Val Asp Ser Thr Asp
225 230 235 240
Cys Asn Arg Asp Gly Val Val Ile Ser Ala Lys Gly Ser His Glu Cys
245 250 255
Leu Ile Gly Asn Thr Thr Val Lys Val His Ala Ser Asp Glu Arg Leu
260 265 270
Gly Pro Met Pro Cys Arg Pro Lys Glu Ile Val Ser Ser Ala Gly Pro
275 280 285
Val Arg Lys Thr Ser Cys Thr Phe Asn Tyr Ala Lys Thr Leu Lys Asn
290 295 300
Lys Tyr Tyr Glu Pro Arg Asp Ser Tyr Phe Gln Gln Tyr Met Leu Lys
305 310 315 320
Gly Glu Tyr Gln Tyr Trp Phe Asp Leu Asp Val Thr Asp Arg His Ser
325 330 335
Gly Tyr Phe Ala Glu Phe Val Val Leu Val Val Val Ala Leu Leu Gly
340 345 350
Gly Arg Tyr Val Leu Trp Leu Ile Val Thr Tyr Ile Val Leu Thr Glu
355 360 365
Gln Leu Ala
370
<210> 2
<211> 2271
<212> DNA
<213> 人工序列
<221> rE2–(G4S)3–rE2基因序列
<400> 2
cgtctcgcct gtaaggaaga ttatagatat gctataagca gcaccaatga gattggtctg 60
ctcggggctg gcggtttaac aacaacttgg aaagagtata gtcatgatct tcagctgaac 120
gatggaacag tgaaggctat ctgcgttgcc ggttccttta aaattactgc tctaaatgtt 180
gtcagcagga gatacctcgc ttctttgcac aaaggagcat tgctcacatc tgttactttt 240
gagttattat tcgacgggac taaccccagc accgaggaaa tgggtgatga ttttgggttt 300
ggactctgcc catttgatac atcacctgtt gttaagggga aatataatac taccttatta 360
aacggttcag cattctacct tgtatgccca attggctgga ctggagttat tgagtgcaca 420
gctgtttctc ccactactct gcgtaccgaa gtggtgaaga ccttcagaag agaaaaacca 480
tttccccata gaatggactg tgttactact accgttgaga atgaggatct tttctattgc 540
aaacttggtg gcaattggac ttgtgtgaaa ggagaacctg tagtctacac aggtggacaa 600
gtgaagcaat gtaaatggtg cggatttgac tttaatgaac ctgatggtct tcctcattat 660
ccaattggaa agtgcattct tgctaatgaa acaggatata gaattgtaga ctcaaccgat 720
tgtaacagag atggagtcgt catctcagct aaaggaagtc atgaatgtct tattggtaac 780
actacagtga aagtacacgc atctgatgaa agattgggtc ccatgccctg ccgtcccaaa 840
gagattgttt ctagtgctgg gccagttcgt aagactagtt gtactttcaa ttacgctaaa 900
actctcaaga ataagtatta tgagccaaga gactcatatt tccaacaata catgctaaag 960
ggagaatacc aatactggtt tgatcttgat gtgactgata gacattcagg ttacttcgct 1020
gaattcgtcg ttctagttgt agtcgccttg cttggaggtc gatatgtact ttggcttatt 1080
gttacttaca ttgtcttaac tgaacaattg gctgggggtg gtggtagtgg tggtggtggt 1140
agcggtggcg gaggttctcg actagcttgc aaggaggatt atcgatacgc aatttctagt 1200
actaatgaga ttggattgtt aggagcaggc ggacttacta ccacatggaa ggaatatagt 1260
cacgatttgc aattgaacga tggtactgtc aaagccattt gtgtagctgg atcattcaag 1320
atcactgcac ttaatgtggt aagtcgacgt tatttggctt ctcttcacaa gggagctttg 1380
ctcactagtg tgaccttcga acttttgttc gacggaacca atccaagcac tgaagaaatg 1440
ggcgatgatt ttggtttcgg attatgtcct tttgatacaa gtccagtggt taaagggaaa 1500
tataatacta ctcttcttaa cggaagtgca ttttatctcg tttgtccaat aggctggact 1560
ggtgtaatcg aatgtacagc agtatctcct actacacttc gaactgaggt ggttaaaacc 1620
tttaggagag agaaaccttt tccacacaga atggactgtg tcaccactac agtcgaaaat 1680
gaagaccttt tttattgtaa gctgggggga aattggacct gcgtaaaggg agaaccagta 1740
gtgtatacag gtggacaagt taagcagtgt aaatggtgcg gcttcgattt taacgagcct 1800
gacggtctgc cacactatcc aatagggaaa tgtattttgg ctaacgaaac tggctataga 1860
atcgttgact caactgattg taatagagac ggtgtagtaa tttccgccaa gggatcacac 1920
gaatgtctta ttgggaatac cactgttaaa gttcacgcta gtgatgaaag acttggtcca 1980
atgccatgtc gtcctaagga gatcgtgagc agcgcaggac ctgttaggaa gacttcttgc 2040
acttttaatt acgcaaaaac cttgaagaat aaatattatg aacctaggga ttcttatttt 2100
caacagtaca tgttaaaagg ggagtaccag tattggttcg atttggatgt tacagatagg 2160
cattcaggtt attttgcaga gttcgtggta ctcgttgtgg ttgctttgct tgggggtaga 2220
tatgtgcttt ggctgatagt tacttacatt gttcttactg agcaacttgc a 2271
<210> 3
<211> 571
<212> PRT
<213> 人工序列
<221> rHN 氨基酸序列
<400> 3
Met Asp Arg Val Val Ser Gln Val Ala Leu Glu Asn Asp Glu Arg Glu
1 5 10 15
Ala Lys Asn Thr Trp Arg Leu Val Phe Arg Thr Ala Val Ile Leu Leu
20 25 30
Ile Val Val Thr Phe Ser Ile Ser Ala Ala Ala Leu Met Tyr Ser Met
35 40 45
Glu Ala Ser Thr Pro Gly Asp Leu Val Gly Ile Leu Thr Ala Ile Ser
50 55 60
Arg Ala Glu Glu Lys Ile Thr Ser Ala Leu Gly Ser Asn Gln Asp Val
65 70 75 80
Val Asp Arg Ile Tyr Lys Gln Val Ala Leu Glu Ser Pro Leu Ala Leu
85 90 95
Leu Asn Thr Glu Ser Ile Ile Met Ser Ala Ile Thr Ser Leu Ser Tyr
100 105 110
Gln Ile Asn Arg Ala Ala Asn Asn Ser Gly Cys Gly Ala Pro Val His
115 120 125
Asp Pro Asp Tyr Ile Gly Gly Ile Gly Lys Glu Leu Ile Val Asp Asp
130 135 140
Ala Ser Asp Val Thr Ser Phe Tyr Pro Ser Ala Ser Gln Glu His Leu
145 150 155 160
Asn Phe Ile Pro Ala Pro Thr Thr Gly Ser Gly Cys Thr Arg Ile Pro
165 170 175
Ser Phe Asp Met Ser Ala Thr His Tyr Cys Tyr Thr His Asn Val Ile
180 185 190
Leu Ser Gly Cys Arg Asp His Pro His Ser His Gln Tyr Leu Ala Leu
195 200 205
Gly Val Leu Arg Thr Ser Ala Thr Gly Arg Val Phe Phe Ser Thr Leu
210 215 220
Arg Ser Ile Asn Leu Asp Asp Asn Gln Asn Arg Lys Ser Cys Ser Val
225 230 235 240
Ser Ala Thr Pro Leu Gly Cys Asp Met Leu Cys Ser Lys Val Thr Glu
245 250 255
Thr Glu Glu Glu Asp Tyr Asn Ser Val Ile Pro Thr Pro Met Val His
260 265 270
Gly Arg Leu Gly Phe Asp Gly Gln Tyr His Glu Lys Asp Leu Asp Val
275 280 285
Ala Thr Leu Phe Gly Asp Trp Val Ala Asn Tyr Pro Gly Val Gly Gly
290 295 300
Gly Ser Phe Ile Asp Asn Arg Val Trp Phe Pro Val Tyr Gly Gly Leu
305 310 315 320
Lys Pro Asn Ser Pro Ser Asp Thr Ala Gln Glu Gly Arg Tyr Val Ile
325 330 335
Tyr Lys Arg Tyr Asn Asp Thr Cys Pro Asp Glu Gln Asp Tyr Gln Ile
340 345 350
Arg Met Ala Lys Ser Ser Tyr Lys Pro Gly Arg Phe Gly Gly Lys Arg
355 360 365
Val Gln Gln Ala Ile Leu Ser Ile Lys Val Ser Thr Ser Leu Gly Glu
370 375 380
Asp Pro Val Leu Thr Val Pro Pro Asn Thr Ile Thr Leu Met Gly Ala
385 390 395 400
Glu Gly Arg Val Leu Thr Val Gly Thr Ser His Phe Phe Tyr Gln Arg
405 410 415
Gly Ser Ser Tyr Phe Ser Pro Ala Leu Leu Tyr Pro Met Thr Val Asp
420 425 430
Asn Lys Thr Ala Thr Leu His Ser Pro Tyr Ala Phe Asn Ala Phe Thr
435 440 445
Arg Pro Gly Ser Val Pro Cys Gln Ala Ser Ala Arg Cys Pro Asn Ser
450 455 460
Cys Val Thr Gly Val Tyr Thr Asp Pro Tyr Pro Leu Val Phe His Arg
465 470 475 480
Asn His Thr Leu Arg Gly Val Phe Gly Thr Met Leu Asp Asp Lys Gln
485 490 495
Ala Arg Leu Asn Pro Val Ser Ala Val Phe Asp Asn Ile Ser Arg Ser
500 505 510
Arg Ile Thr Arg Val Ser Ser Ser Ser Thr Lys Ala Ala Tyr Thr Thr
515 520 525
Ser Thr Cys Phe Lys Val Val Lys Thr Asn Lys Thr Tyr Cys Leu Ser
530 535 540
Ile Ala Glu Ile Ser Asn Thr Leu Phe Gly Glu Phe Arg Ile Val Pro
545 550 555 560
Leu Leu Val Glu Ile Leu Lys Asp Asp Gly Ile
565 570
<210> 4
<211> 3471
<212> DNA
<213> 人工序列
<221> rHN–(G4S)3–rHN 基因序列
<400> 4
atggatagag tagtgtccca ggtcgctttg gagaacgatg aacgtgaagc aaagaatact 60
tggcgactgg ttttcagaac tgctgttatt ctacttattg tggttacttt ttcaataagc 120
gctgctgcct taatgtattc tatggaagca tcaacacctg gagacttagt cggaatcttg 180
actgctattt ctagagctga agaaaaaatt acttcagctt tgggctctaa tcaagatgtg 240
gtagaccgta tctataaaca ggttgcactc gaatcaccac ttgctctttt gaatactgaa 300
tctataataa tgtccgcaat tacttcactg agttatcaaa tcaaccgtgc agcaaacaat 360
agtggttgtg gagcccctgt acatgatcca gattatattg gtggaatcgg caaggaactt 420
attgttgatg atgcatctga cgttactagc ttctacccta gtgcaagtca ggagcatctt 480
aactttattc cagcacctac aacagggagt ggttgtacaa gaatcccatc ttttgacatg 540
tcagcaactc attattgcta cacacacaac gttatattat caggatgtag agatcatcct 600
cattcccatc agtatcttgc acttggagtt cttcgaacca gtgccacagg ccgtgttttc 660
tttagtacat taagatcaat taatttggat gacaaccaga acaggaagtc atgttctgtt 720
tccgctactc ctttgggatg cgatatgctt tgctcaaaag tcactgagac agaagaagaa 780
gattataact ctgttattcc tacacctatg gtgcacggcc gacttggttt tgatggtcaa 840
tatcatgaga aggatttgga cgttgctaca ttattcggcg attgggtcgc taattatccc 900
ggtgttggcg gaggctcatt tatagataat agagtttggt ttcctgtcta cggtggtttg 960
aagcctaatt caccctccga tactgctcag gaaggacgat atgttattta taaaaggtat 1020
aatgatactt gtcctgacga acaagattat cagattagaa tggcaaaaag ctcctacaag 1080
ccaggccgtt tcggcggaaa gagagttcaa caagctatac tcagcataaa agtctccacc 1140
tccttgggcg aagatccagt tctgaccgtt ccaccaaata ctataactct catgggggcc 1200
gaaggtagag tgctgacagt cggtacttct catttcttct atcaaagagg tagttcatac 1260
ttttctccag ctcttcttta ccctatgaca gttgacaaca agactgcaac tttgcatagt 1320
ccttacgctt tcaacgcttt cactagacca ggttcagtcc catgtcaagc atccgctaga 1380
tgtcctaatt catgcgtcac cggcgtttat actgacccat acccattggt tttccacaga 1440
aatcatactc ttagaggagt tttcggtact atgttggacg ataagcaagc caggttaaac 1500
cctgttagcg ccgtttttga taatatttct aggagtagga ttacaagggt ttcatcatct 1560
agtactaaag cagcttacac taccagcact tgctttaagg tagtcaaaac taacaaaact 1620
tattgtctga gtattgctga aatctctaac acccttttcg gcgaattcag gatagtgcca 1680
ttactagttg agattctcaa agacgatggt attggtggag gcggatccgg aggaggtgga 1740
agtggaggtg gaggcagcat ggatcgtgtg gtctcacaag tggctctaga aaatgatgag 1800
agagaggcta aaaatacttg gcgtctagtt ttcagaacag ctgtgattct attaatagta 1860
gttacattca gtatctccgc agctgccctg atgtatagta tggaagcaag cactcctggc 1920
gatctggttg gtatattgac cgcaatcagc cgagcagagg agaaaatcac atcagcctta 1980
ggcagtaatc aggatgtggt ggacagaatt tacaaacaag ttgctcttga gtcacctttg 2040
gctcttctta acactgagtc aataattatg tcagccatta caagtttatc ataccaaatc 2100
aatcgagctg ctaataatag cggctgtgga gcacctgtgc atgatcctga ctatataggg 2160
ggaattggta aggaattaat tgtggacgat gcctcagatg taacctcatt ctatccatca 2220
gcctcacaag aacatcttaa ttttatacct gctcccacca ctggatcagg ttgcacaaga 2280
atacctagct tcgatatgag tgctacccat tactgttaca cacacaatgt tattttgtcc 2340
ggttgtagag atcaccccca ctctcatcaa tatcttgctc tcggtgtgct taggacatct 2400
gctacaggaa gagtgttttt ttcaactcta aggagtatca atttggatga taatcaaaat 2460
agaaaaagct gttctgtatc cgccacacca ttggggtgcg acatgctttg ctcaaaagtg 2520
actgaaacag aagaagaaga ctacaatagc gttattccta ctccaatggt gcacggaagg 2580
cttgggttcg atggacagta ccatgagaag gatttggatg tcgcaacttt gtttggtgat 2640
tgggtcgcta attaccccgg ggttggggga ggtagtttta ttgataatag agtatggttt 2700
cctgtatatg gtggtctgaa gccaaacagt ccatcagaca ctgctcaaga aggtaggtat 2760
gttatttata aaagatataa tgacacatgt ccagatgaac aagactatca gattaggatg 2820
gccaagagtt catataaacc tggacgtttt ggaggaaaac gtgttcaaca agctatccta 2880
tcaattaagg tttctacctc ccttggagag gatcccgtat taacagtccc accaaataca 2940
attactttaa tgggtgctga agggagggtt ttgacagttg gaacatcaca cttcttctat 3000
cagagaggga gtagctattt ttcccctgcc ttactttatc ctatgactgt tgataataag 3060
accgccactt tgcactcccc ttatgcattt aacgcattta cacgtcctgg aagtgttcct 3120
tgtcaggctt ctgctagatg tccaaactct tgcgttacag gtgtttacac cgacccatac 3180
cccttggttt tccataggaa ccacactctg aggggcgtgt tcggcactat gctggatgac 3240
aaacaagcaa gacttaatcc agtatctgct gtctttgata atattagtag gtcaaggatt 3300
acaagagtgt cttcatcctc cacaaaagca gcttatacaa catcaacctg tttcaaggta 3360
gttaagacta acaaaacata ctgtttgtca atcgctgaaa tctctaatac actgttcgga 3420
gaatttagaa tagtcccact cctcgttgag attctcaaag atgacggtat t 3471
<210> 5
<211> 273
<212> PRT
<213> 人工序列
<221> rRBD氨基酸序列
<400> 5
Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser
1 5 10 15
Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val
20 25 30
Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg
35 40 45
Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser
50 55 60
Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp
65 70 75 80
Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp
85 90 95
Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr
100 105 110
Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn
115 120 125
Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr
130 135 140
Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser
145 150 155 160
Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly
165 170 175
Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn
180 185 190
Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu
195 200 205
Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu
210 215 220
Val Lys Asn Lys Cys Val Asn Phe Leu Pro Asp Pro Ser Lys Pro Ser
225 230 235 240
Lys Arg Ser Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser
245 250 255
Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp
260 265 270
Val
<210> 6
<211>
<212> DNA
<213> 人工序列
<221> rRBD–rRBD基因序列
<400> 6
aagggcattt atcaaacgtc caattttcgg gtccagccta ccgagtccat cgttcggttt 60
cccaatataa caaacctttg tcctttcggc gaggttttca atgctaccag atttgcaagc 120
gtctacgcct ggaatcgcaa aagaatttct aattgtgtag cagactactc agtgctgtat 180
aattccgctt cttttagtac attcaaatgt tatggggtca gccccacgaa acttaatgat 240
ttgtgcttta caaatgttta cgcagattca ttcgtgattc gaggagacga ggtgcggcaa 300
atcgccccag gtcagacagg aaaaattgcc gattacaatt acaaactccc agacgacttt 360
accggatgtg tgatagcatg gaacagcaat aacctggact ctaaggtggg aggcaactac 420
aactacctct accggctgtt tcggaaatct aacctgaagc cattcgaaag agacatctct 480
accgagatct accaggcagg ctctacaccc tgtaacggtg tcgaaggctt caactgctac 540
tttccacttc agtcttacgg ctttcagccg acaaacggcg tgggttacca accttatagg 600
gttgtagttc tcagctttga gcttctccat gcacctgcta ccgtgtgtgg ccccaagaag 660
agtacaaatt tggtcaaaaa caagtgcgtg aactttctgc cagatcctag caagccaagt 720
aagaggagca acacggtcta tgacccactg cagcccgagc tcgacagttt taaagaagag 780
ctggacaaat acttcaagaa tcacacttct ccagatgtta aggggattta tcagacctct 840
aatttccggg tccaacccac tgaatcaata gttagatttc ctaacattac aaacctttgc 900
ccgtttgggg aagtcttcaa cgccactaga tttgcatccg tttatgcttg gaatcgaaaa 960
aggatcagta attgtgtggc agattattct gttctgtata actctgcatc tttttctacc 1020
ttcaaatgtt acggagtgtc acccactaaa ctgaacgact tgtgctttac caacgtgtac 1080
gccgactctt tcgtcatcag gggcgatgaa gtgaggcaga ttgctcctgg gcagaccggc 1140
aaaatagcag actacaatta taaattgcca gacgatttca ccggttgtgt tatcgcctgg 1200
aactctaata acttggacag caaggtcggt ggaaactaca attacttgta cagactgttc 1260
cggaaaagta acctgaagcc cttcgagcgc gacatcagca ctgagatata tcaggcaggc 1320
agtaccccat gtaacggcgt ggagggattc aattgctact tcccactcca gagctatggc 1380
ttccagccaa caaacggtgt tggctaccaa ccctacagag tagtcgttct gtcctttgag 1440
ctcttgcacg ctcctgcgac tgtatgcggg cctaagaagt ctaccaacct ggttaagaac 1500
aaatgtgtca acttcctccc agatccaagc aagccctcaa agcgaagtaa taccgtgtat 1560
gacccccttc aacccgaact ggactcattt aaagaggagc ttgacaagta ctttaagaac 1620
catacatccc ccgatgtg 1638
<210> 7
<211> 1668
<212> DNA
<213> 人工序列
<221> rRBD–(G4S)2–rRBD基因序列
<400> 7
aagggcattt atcaaacgtc caattttcgg gtccagccta ccgagtccat cgttcggttt 60
cccaatataa caaacctttg tcctttcggc gaggttttca atgctaccag atttgcaagc 120
gtctacgcct ggaatcgcaa aagaatttct aattgtgtag cagactactc agtgctgtat 180
aattccgctt cttttagtac attcaaatgt tatggggtca gccccacgaa acttaatgat 240
ttgtgcttta caaatgttta cgcagattca ttcgtgattc gaggagacga ggtgcggcaa 300
atcgccccag gtcagacagg aaaaattgcc gattacaatt acaaactccc agacgacttt 360
accggatgtg tgatagcatg gaacagcaat aacctggact ctaaggtggg aggcaactac 420
aactacctct accggctgtt tcggaaatct aacctgaagc cattcgaaag agacatctct 480
accgagatct accaggcagg ctctacaccc tgtaacggtg tcgaaggctt caactgctac 540
tttccacttc agtcttacgg ctttcagccg acaaacggcg tgggttacca accttatagg 600
gttgtagttc tcagctttga gcttctccat gcacctgcta ccgtgtgtgg ccccaagaag 660
agtacaaatt tggtcaaaaa caagtgcgtg aactttctgc cagatcctag caagccaagt 720
aagaggagca acacggtcta tgacccactg cagcccgagc tcgacagttt taaagaagag 780
ctggacaaat acttcaagaa tcacacttct ccagatgttg gaggaggtgg ttctggagga 840
ggtggctcaa aggggattta tcagacctct aatttccggg tccaacccac tgaatcaata 900
gttagatttc ctaacattac aaacctttgc ccgtttgggg aagtcttcaa cgccactaga 960
tttgcatccg tttatgcttg gaatcgaaaa aggatcagta attgtgtggc agattattct 1020
gttctgtata actctgcatc tttttctacc ttcaaatgtt acggagtgtc acccactaaa 1080
ctgaacgact tgtgctttac caacgtgtac gccgactctt tcgtcatcag gggcgatgaa 1140
gtgaggcaga ttgctcctgg gcagaccggc aaaatagcag actacaatta taaattgcca 1200
gacgatttca ccggttgtgt tatcgcctgg aactctaata acttggacag caaggtcggt 1260
ggaaactaca attacttgta cagactgttc cggaaaagta acctgaagcc cttcgagcgc 1320
gacatcagca ctgagatata tcaggcaggc agtaccccat gtaacggcgt ggagggattc 1380
aattgctact tcccactcca gagctatggc ttccagccaa caaacggtgt tggctaccaa 1440
ccctacagag tagtcgttct gtcctttgag ctcttgcacg ctcctgcgac tgtatgcggg 1500
cctaagaagt ctaccaacct ggttaagaac aaatgtgtca acttcctccc agatccaagc 1560
aagccctcaa agcgaagtaa taccgtgtat gacccccttc aacccgaact ggactcattt 1620
aaagaggagc ttgacaagta ctttaagaac catacatccc ccgatgtg 1668
<210> 8
<211> 2517
<212> DNA
<213> 人工序列
<221> rRBD–(G4S)2–rRBD-(G4S)2–rRBD 基因序列
<400> 8
aagggaattt accagacaag taatttcaga gttcagccaa ccgaaagcat cgtgagattt 60
cctaacatta ctaacctctg cccttttggc gaggtgttta atgcaacaag gtttgcatct 120
gtgtatgcct ggaatagaaa gagaatctcc aactgtgttg cagattactc agtgctgtat 180
aactcagcct cattctctac gttcaagtgt tacggggtga gtcctacaaa gctgaatgac 240
ctgtgtttta ctaatgtgta tgccgactcc tttgtgatta gaggagacga ggtgaggcag 300
atagcccctg gccagaccgg aaagattgcc gactacaact acaaactccc tgacgatttt 360
acagggtgtg ttatcgcatg gaactccaat aacctggaca gcaaagtcgg tggaaactac 420
aactacctct accgactgtt caggaaatca aatttgaaac ccttcgaacg ggatatcagc 480
actgaaatct atcaggccgg cagtactcca tgtaacggag tcgaggggtt caattgttat 540
ttcccacttc agtcttacgg gttccagccc acaaatggcg tgggctacca gccctacagg 600
gtagtggtgt tgagcttcga gctgctgcat gctcccgcaa ctgtctgcgg cccaaagaag 660
tcaacaaatc tggttaaaaa caagtgcgtc aatttccttc cagacccttc caagccctct 720
aagaggagca acaccgtgta cgatcccctc cagcctgagt tggactcctt caaggaagag 780
ctggacaaat acttcaagaa tcatacaagc cctgatgtag gaggtggcgg tagtggagga 840
ggaggctcaa agggcatcta ccagacatcc aacttccgcg tgcagcccac agagagcatt 900
gtgcgatttc cgaacataac caacctctgc ccctttggcg aggtgttcaa tgctacacgc 960
tttgcctccg tctatgcctg gaaccgcaaa aggattagta actgcgttgc agattacagt 1020
gtgttgtaca actctgccag cttctcaaca ttcaaatgct atggcgtgag tcccactaaa 1080
cttaacgatc tgtgctttac caacgtgtac gccgatagct ttgtcattag aggcgatgag 1140
gtcaggcaaa ttgcgccagg acagactgga aaaatagccg attataatta caagctgcca 1200
gacgacttca ctggatgtgt tattgcttgg aatagcaata accttgactc taaagtaggc 1260
ggaaattaca actaccttta ccgcttgttt cgcaagtcta acctcaaacc attcgagcgc 1320
gatatctcaa ccgagattta tcaagcagga tctactccct gcaacggcgt ggagggattc 1380
aattgttact tccctctgca gagctacggc ttccagccta ccaatggtgt tggctaccaa 1440
ccgtatcggg tcgtcgtgct ttcttttgaa cttctccacg cacctgcaac agtttgcggc 1500
ccaaagaaat ccacaaacct ggtcaagaac aaatgtgtta acttcctgcc ggacccgtcc 1560
aagccaagca aacgctctaa tactgtctac gaccctctgc aaccagaact tgactctttt 1620
aaagaggagc tggataaata ttttaaaaac catacttcac ccgatgttgg agggggtggt 1680
tcaggtggag gaggctctaa gggtatctac cagaccagta attttagggt gcaacccacg 1740
gaatcaatcg tgaggtttcc caatattaca aacctctgcc ccttcgggga ggtgttcaat 1800
gctaccaggt ttgcttctgt gtacgcctgg aaccggaagc ggatctctaa ttgcgtggct 1860
gactactccg tactgtacaa ttccgcgtct ttttccacgt tcaaatgcta cggagtctcc 1920
cccaccaagc tcaacgatct ttgctttacc aatgtgtacg ccgacagctt cgtaattcga 1980
ggagatgagg tgaggcagat agctccagga cagacaggta aaatcgctga ctacaattac 2040
aagctgcccg atgatttcac tgggtgtgtt attgcatgga acagcaacaa cttggactca 2100
aaagtgggtg gaaattataa ctatctttac agactcttcc ggaaatccaa tctcaagcca 2160
tttgagagag atatttctac agagatctac caggcaggca gcactccctg taatggcgtg 2220
gagggcttca actgttattt tccactgcag agctatggat ttcaacctac aaatggcgtg 2280
ggataccagc cctacagagt ggtggttctc agctttgaac tgttgcacgc gccagctact 2340
gtgtgtggac caaaaaagag cactaacctg gtcaaaaaca agtgcgttaa cttcctgccc 2400
gatcccagca agccaagcaa gaggagtaac actgtttacg atccgctgca gcccgagttg 2460
gacagcttta aggaagaact cgacaaatat ttcaagaacc atacctcacc agacgtc 2517

Claims (10)

1.一种易于激活B细胞的重组抗原制备方法,其特征在于,将两个或两个以上至少含有一个相同抗原表位肽的抗原蛋白直接连接或通过连接肽连接起来,制备成多聚体重组抗原;所述直接连接或通过连接肽连接需要使至少两个相同抗原表位之间的距离处在3-50nm之间;
所述抗原蛋白为猪瘟病毒重组抗原单体rE2,rE2的氨基酸序列如SEQ ID NO.1所示;或所述抗原蛋白为新城疫病毒重组抗原单体rHN,rHN的氨基酸序列如SEQ ID NO.3所示;或所述抗原蛋白为新型冠状病毒重组抗原单体rRBD,rRBD的氨基酸序列如SEQ ID NO.5所示;
所述连接肽的序列为(G4S)n,其中,n=1-4。
2.如权利要求1所述的易于激活B细胞的重组抗原制备方法,其特征在于,包括如下步骤:
1)确定靶标蛋白;
2)对靶标蛋白进行结构分析并确定关键抗原表位所处的位置;
3)确定重组抗原单体的氨基酸序列;
4)确定连接肽序列,得到多聚体重组抗原的氨基酸序列;
5)构建重组蛋白抗原的表达载体,并进行重组蛋白的表达纯化,获得重组抗原蛋白;
其中,步骤4)中所述的多聚体重组抗原是将重组蛋白单体通过连接肽尾首相连;根据重组抗原单体的结构、重组抗原含有的抗原表位之间的位置和距离、结合BCR结构与蛋白对接分析结果,确定连接抗原蛋白的连接肽的种类和大小,使得相同抗原表位之间的距离与B细胞表面的B细胞抗原受体BCR之间的距离相匹配,即连接肽的长度需要使至少两个相同抗原表位之间的距离处在3-50nm之间,使得重组抗原蛋白含有的相同抗原表位中至少两个同时被B细胞上的BCR识别,导致BCR被交联,从而更有效的激活B细胞。
3.根据权利要求2所述的方法,其特征在于,步骤1)通过生物信息学预测分析病毒的结构,选择包含关键中和表位及主要B细胞表位的病毒结构蛋白作为靶标蛋白。
4.根据权利要求2所述的方法,其特征在于,步骤2)对靶标蛋白质进行二级结构、三级结构预测分析,对靶标蛋白的B细胞表位尤其是中和表位的信息进行预测分析,找到关键抗原表位在靶蛋白中所处的位置。
5.根据权利要求2所述的方法,其特征在于,步骤3)通过预测靶标蛋白质三级结构,分析抗原表位在靶标蛋白表面的分布情况及其具***置;并通过上述分析结果,将靶标蛋白表面三维结构上位置相近的关键抗原表位进行序列优化,结合支撑结构的关键氨基酸序列经优化、重排,得到重组抗原单体的氨基酸序列。
6.根据权利要求2所述的方法,其特征在于,步骤5)通过原核表达***或真核表达***获得重组抗原蛋白。
7.根据权利要求2所述的方法,其特征在于,还包括步骤6)通过动物实验对获得的重组抗原蛋白进行免疫评价。
8.根据权利要求2所述的方法,其特征在于,所述方法用于猪瘟病毒重组抗原的制备,包括如下步骤:
1)选择猪瘟病毒E2蛋白作为靶标蛋白;
2)对靶标蛋白进行结构分析并确定关键抗原表位在靶蛋白中所处的位置:E2蛋白N端1~176 aa至少存在7个抗原表位13~18,32~44,85~97,111~123,143~150,154~160以及170~176;另外E2蛋白C端还存在两个优势表位237~244、304~312;
3)将猪瘟病毒E2蛋白的氨基酸序列进行优化,得到重组抗原单体rE2的氨基酸序列,如SEQ ID NO.1所示;
4)选择(G4S)2、(G4S)3或(G4S)4作为连接肽,得到多聚体重组抗原rE2-(G4S)2-rE2 rE2-(G4S)3- rE2或 rE2-(G4S)4- rE2的氨基酸序列;
5)构建重组蛋白抗原的表达载体,通过转基因水稻***表达猪瘟病毒重组抗原并进行纯化,获得猪瘟病毒重组抗原。
9.根据权利要求2所述的方法,其特征在于,所述方法用于新城疫病毒重组抗原的制备,包括如下步骤:
1)选择新城疫病毒重HN蛋白作为靶标蛋白;
2)对靶标蛋白进行结构分析并确定关键抗原表位在靶蛋白中所处的位置:主要集中在53~192 aa,至少存在3个关键抗原表位117~124,128~134以及157~166;
3)将新城疫病毒重HN蛋白的氨基酸序列进行优化,得到重组抗原单体rHN的氨基酸序列,如SEQ ID NO.3所示;
4)选择(G4S)2、(G4S)3或(G4S)4作为连接肽,得到多聚体重组抗原rHN-(G4S)2-rHN 、rHN-(G4S)3-rHN或 rHN-(G4S)4-rHN的氨基酸序列;
5)构建重组蛋白抗原的表达载体,通过转基因水稻***表达新城疫病毒重组抗原并纯化,获得新城疫病毒重组抗原。
10.根据权利要求2所述的方法,其特征在于,所述方法用于新型冠状病毒重组抗原的制备,包括如下步骤:
1)选择新型冠状病毒S蛋白作为靶标蛋白;
2)对靶标蛋白进行结构分析并确定关键抗原表位在靶蛋白中所处的位置:RBD区域包含了至少8个细胞表位250~258,279~286,310~317,355~359,384~387,424~428,438~448,457~470,另外499~639也包含有关键中和表位;
3)将型冠状病毒S蛋白RBD基序及关键中和抗原表位的氨基酸序列进行优化,得到重组抗原单体rRBD的氨基酸序列,如SEQ ID NO.5所示;
4)选择直接尾首连接或选择(G4S)、(G4S)2或(G4S)3作为连接肽,得到多聚体重组抗原rRBD-rRBD、rRBD-(G4S)-rRBD、rRBD-(G4S)2-rRBD、rRBD-(G4S)3-rRBD、rRBD-rRBD-rRBD、rRBD-(G4S)-rRBD-(G4S)-rRBD、rRBD-(G4S)2-rRBD-(G4S)2-rRBD或rRBD-(G4S)3-rRBD-(G4S)3-rRBD的氨基酸序列;
5)构建重组蛋白抗原的表达载体并进行重组蛋白的表达纯化,获得重组抗原蛋白。
CN202011507132.5A 2020-05-26 2020-12-18 易于激活b细胞的重组抗原蛋白及其制备方法 Active CN112679587B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN202010455701 2020-05-26
CN202010455701X 2020-05-26
CN2020108189017 2020-08-14
CN202010818901 2020-08-14

Publications (2)

Publication Number Publication Date
CN112679587A CN112679587A (zh) 2021-04-20
CN112679587B true CN112679587B (zh) 2022-10-21

Family

ID=75449876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011507132.5A Active CN112679587B (zh) 2020-05-26 2020-12-18 易于激活b细胞的重组抗原蛋白及其制备方法

Country Status (1)

Country Link
CN (1) CN112679587B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113861278B (zh) * 2021-06-18 2022-08-05 国药中生生物技术研究院有限公司 一种产生广谱交叉中和活性的重组新型冠状病毒rbd三聚体蛋白疫苗、其制备方法和应用
CN113769080B (zh) * 2021-09-17 2023-04-07 清华大学 多肽免疫偶联物及其应用
CN113881704B (zh) * 2021-11-17 2024-02-13 浙江迪福润丝生物科技有限公司 一种包含新型冠状病毒双抗原靶标序列组合的重组新城疫病毒载体及相应疫苗株和疫苗

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101152570B (zh) * 2007-10-19 2010-11-24 清华大学 一种猪瘟病毒表位疫苗及其制备方法
CN101991848B (zh) * 2010-11-10 2013-03-27 中国农业科学院上海兽医研究所 猪瘟合成肽疫苗及其应用
CN110029116B (zh) * 2019-03-12 2022-09-13 华南农业大学 一种分泌表达多抗原表位猪瘟病毒e2基因的重组病毒及制备方法与应用
CN110845584B (zh) * 2019-11-27 2023-04-18 诺华生物科技(武汉)有限责任公司 一种猪瘟病毒囊膜蛋白寡聚蛋白体及其制备方法和应用

Also Published As

Publication number Publication date
CN112679587A (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
CN112679587B (zh) 易于激活b细胞的重组抗原蛋白及其制备方法
CN113861278B (zh) 一种产生广谱交叉中和活性的重组新型冠状病毒rbd三聚体蛋白疫苗、其制备方法和应用
CN106928326B (zh) 一种基于二聚化的受体结合区亚单位的冠状病毒疫苗
CN113164586B (zh) 免疫组合物及其制备方法与应用
CN112076315A (zh) 新冠病毒s蛋白和铁蛋白亚基融合的纳米抗原颗粒、新冠疫苗及其制备方法和应用
WO2023186170A1 (zh) 一种新冠病毒Delta和Omicron变异株嵌合抗原、其制备方法和应用
CN107098974B (zh) 一种融合蛋白及其应用
WO2018187325A1 (en) Self-assembling protein nanostructures displaying paramyxovirus and/or pneumovirus f proteins and their use
CN112062862B (zh) 疫苗通用载体及其制备方法和应用
CN114315989A (zh) 一种重组新型冠状病毒蛋白疫苗、其制备方法和应用
CN109575142B (zh) 一种cd4辅助性t细胞表位融合肽及其疫苗
JP2021502807A (ja) 新規足場hiv−1ワクチン免疫原
JP2003525619A (ja) ウイルスコートタンパク質融合体としての植物における外来ポリペプチドの産生
Dalvie et al. Engineered SARS-CoV-2 receptor binding domain improves immunogenicity in mice and elicits protective immunity in hamsters
CN114478718A (zh) 一种重组新型冠状病毒蛋白疫苗、其制备方法和应用
CN109966483B (zh) 一种基于铁蛋白的多抗原通用流感疫苗及其制备方法和应用
JP2022505094A (ja) 改変されたサイトメガロウイルスタンパク質及び安定化された複合体
CN108823245A (zh) 一种病毒样颗粒的纯化方法
WO2024067182A1 (zh) 一种可增强与佐剂协同免疫效力的电荷调控型抗原蛋白
CN109776657B (zh) 重组诺如病毒vlp颗粒和制备方法及其用途
KR20100102114A (ko) 인간 파필로마 바이러스의 주요 캡시드 단백질 l1을 암호화하는 유전자 및 이의 용도
Wang et al. Major immunodominant region of hepatitis B virus core antigen as a delivery vector to improve the immunogenicity of the fusion antigen ROP2-SAG1 multiepitope from Toxoplasma gondii in Mice
CN111094323B (zh) 修饰的巨细胞病毒蛋白和稳定的复合物
CN110551185A (zh) 一种人***瘤病毒68型l1蛋白的突变体
CN116041448A (zh) 新型冠状病毒免疫原性物质、其制备方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220822

Address after: 450046 No. 218, Ping An Avenue, Zhengdong New District, Zhengzhou City, Henan Province

Applicant after: Longfor Modern Immunology Laboratory

Address before: 450000 floors 1-2, building 4, south of Yingbin Road, HANGGANG District, Zhengzhou City, Henan Province

Applicant before: HENAN ZHONGZE BIOLOGICAL ENGINEERING CO.,LTD.

GR01 Patent grant
GR01 Patent grant