WO2021047558A1

WO2021047558A1 - 断裂型内含肽、使用其的重组多肽的制备方法

Info

Publication number: WO2021047558A1
Application number: PCT/CN2020/114271
Authority: WO
Inventors: 张敬; 罗芳; 龚承; 王鑫; 方丽娟; 周鹏飞
Original assignee: 武汉友芝友生物制药有限公司
Priority date: 2019-09-09
Filing date: 2020-09-09
Publication date: 2021-03-18
Also published as: CN114450406A; CN114450292A; US20220340677A1; US20220332757A1; WO2021047559A1

Abstract

涉及了用于SspDnaE、SspDnaB、MxeGyrA、MjaTFIIB、PhoVMA、TvoVMA、Gp41-1、Gp41-8、IMPDH-1或PhoRadA断裂型内含肽的侧翼序列对。所述侧翼序列对包括：侧翼序列a和侧翼序列b；所述侧翼序列a位于断裂型内含肽N端蛋白质剪接区域(In)的N端，且介于N端外显肽(En)和In之间；所述侧翼序列b位于断裂型内含肽C端蛋白质剪接区域(Ic)的C端，且介于Ic和C端外显肽(Ec)之间。

Description

断裂型内含肽、使用其的重组多肽的制备方法

技术领域

本发明涉及含有新型侧翼序列对的断裂型内含肽、使用其的重组多肽，所述内含肽在制备抗体，特别是双特异性抗体中的应用。本发明还涉及所述含有新型侧翼序列对的断裂型内含肽的筛选方法。

背景技术

蛋白质反式剪接(Protein trans-splicing)是指由断裂型内含肽介导的蛋白质剪接反应。在这种类型的剪接过程中，首先是断裂型内含肽的N端片段或N端蛋白质剪接区域(In)和C端片段或C端蛋白质剪接区域(Ic)相互识别并以非共价键结合，一旦结合后正确折叠其结构，则重建活性中心的断裂型内含肽按照典型的蛋白质剪接途径完成蛋白质剪接反应，将两侧的外显肽连接(Saleh.L.，Chemical Record.6(2006)183-193)。

在制备重组蛋白的技术中，可以通过将表达前体蛋白质的基因***在两个开放阅读框中，利用包括N端蛋白质剪接区域(N’fragment of intein，简称In)和C端蛋白质剪接区域(C’fragment of intein，简称Ic)两部分的断裂型内含肽(split intein)催化蛋白质反式剪接反应进行，从而将构成所述前体蛋白质的两个分离的外显肽(En、Ec)以肽键连接，得到重组蛋白(Ozawa.T.，Nat Biotechbol.21(2003)287-93)。

双特异性抗体是指可以同时识别两个抗原或者两个表位的一个抗体分子，诸如能够结合两种以上抗原的双特异性或者多特异型抗体在本领域中是已知的，可以通过细胞融合法、化学修饰法、基因重组等方法，在真核表达***或者在原核表达***中获得。

目前，已经开发了广泛多样的重组双特异性抗体形式。例如，通过融合例如IgG抗体形式和单链结构域的四价双特异性抗体(参见例如Coloma，M.J.，等，Nature Biotech.15(1997)159-163；WO 2001077342；和Morrison，S.，L.，Nature Biotech.25(2007)1233-1234)。但这样的抗体由于与天然抗体结构相差大，进入体内之后会引起强烈的免疫反应以及较短的半衰期。

此外，也开发了能够结合两种以上抗原的若干其他新型形式，例如：小分子抗体如微型抗体(minibodies)、若干单链形式(scFv双-scFv)等。在这些小分子抗体中，抗体中心结构(IgA、IgD、IgE、IgG或IgM)不再保持(Holliger，P.，等，Nature Biotech.23(2005)1126-1136；Fischer，N，和Leger，O.，Pathobiology(病理学)74(2007)3-14；Shen，J.，等，J.Immunol.Methods.318(2007)65-74；Wu，C.，等.，Nature Biotech.25(2007)1290-1297)。

这种将抗体的核心结合区域通过连接肽(linker)与其它抗体核心结合区相连接的改造，虽然相对于双特异性抗体有明显优势，但是，在作为药物应用中也存在问题，大大限制了其成药。

实际上，就免疫原性而言，这些外源蛋白可能引起针对连接肽本身、或含有连接肽的蛋白质的免疫反应，甚至引起免疫风暴。此外，由于这些连接肽灵活的本质，使其倾向于发生蛋白质的降解，容易导致抗体的稳定性差，易于聚集，半衰期缩短以及使免疫原性进一步增强。例如，安进公司的博纳吐单抗(Blinatumomab)，在血液中的半衰期仅为1.25小时，导致需通过注射泵24小时持续给药，这大大限制了其应用(Bargou，R和Leo.E.，Science.321(2008)974-7)。

此外，希望在对双特异性抗体的改造中，能够保留抗体的Fc片段效应功能：例如，CDC(补体依赖的细胞毒性)、或ADCC(细胞毒作用)，并使抗体与血管内壁FcRn(Fc受体)结合的半衰期延长。而这些功能必须通过Fc区来介导，因此，需要在改造后的双特异性抗体中保留Fc区。

因此，需要开发结构与天然存在的抗体(如IgA、IgD、IgE、IgG、IgM)的结构极其相似的双特异性抗体，进一步，需要与人抗体序列具有最小差异的人源化双特异性抗体以及全人源的双特异性抗体。

目前，已经尝试了使用Npu-PCC73102 DnaE(简称NpuDnaE)内含肽的反式剪接机制来制备双特异性抗体。使用内含肽的反式剪接机制制备双特异性抗体，在剪接产物中不具有连接肽，但存在以下问题：在这样得到的双特异性抗体中，无法避免Ic侧翼序列所引入的自由巯基，导致该类双特异性抗体存在很大的错误折叠和不稳定风险，剪接效率也存在问题(Han L，Zong H，等，Naturally split intein Npu DnaE mediated rapid generation of bispecific IgG antibodies，Methods，.Vol 154，2019 Feb 1；154：32-37)。

断裂型内含肽介导的蛋白质剪接效率，与所述内含肽的内含肽序列以及侧翼序列(flanking sequences)直接相关。

在NEB的数据库里(http：//inteins.com/)列举了超过600种断裂型内含肽，较为常用的例如：NpuDnaE及SspDnaE。但是，根据这些内含肽的侧翼序列，如NpuDnaE的In侧翼序列为AEY(En-AEY-In)，Ic侧翼序列为CFNGT(Ic-CFNGT-Ec)，SspDnaE的In侧翼序列为AEY(En-AEY-In)、Ic侧翼序列为CFNKS(Ic-CFNKS-Ec)可知，En-AEY-In和Ic-CFNGT-Ec在剪接后为En-AEYCFNGT-Ec的蛋白形式，En-AEY-In和Ic-CFNKS-Ec剪接后为En-AEYCFNKS-Ec的蛋白形式，均残留有一个半胱氨酸，从而在剪接产物中具有自由巯基，使产物的错误折叠和不稳定性风险大大增加。

为了避免在剪接产物中具有自由巯基，需要对现有的断裂型内含肽的侧翼序列对进行改良，需要这样的新型侧翼序列：其保持了内含肽的良好剪切效率，且不含有半胱氨酸残基的新型的侧翼序列对。

已有文献报道，一些断裂型内含肽，它们本身的Ic侧翼序列中就没有半胱氨酸而具有丝氨酸或苏氨酸，使用这些内含肽则可以让剪接产物的连接处不产生自由巯基。例如，SspDnaB、TvoVMA、MxeGyrA、PhoRadA、Gp41-1、Gp41-8、Nrdj-1、IMPDH-1等(Bareket Dassa，等，Nucleic Acids Res.2009 May；37(8)：2560-2573)。但对于使用这些内含肽进行双特异性抗体的制备，尚没有报道。

另外，对已有的断裂型内含肽的侧翼序列对进行氨基酸突变后，会对其进行反式剪接的效率造成影响，因此，需要一种筛选方法，来筛选含有新型侧翼序列对的内含肽，其反式剪接的效率优秀、且不在剪接产物中引入接口处的自由巯基。进一步，需要一种适用于制备抗体，特别是双特异性抗体的断裂型内含肽，其反式剪接的效率优秀、且不在剪切产物中的接口处引入游离巯基的含有新型侧翼序列对的断裂型内含肽。

发明内容

本发明通过发明人的努力研究，通过对已有的内含肽的侧翼序列对进行有规律的氨基酸突变，并筛选其中反式剪接的效率优秀的侧翼序列对，从而获得了一类具有新型侧翼序列对的断裂型内含肽，其具有无半胱氨酸残基的侧翼序列，且不在剪切产物中的接口处引入游离巯基，反式剪接的效率优秀，特别适用于制备抗体(特别是双特异性抗体)。

使用本发明的断裂型内含肽，可以在相对温和的条件(如常温、生理盐浓度、中性pH等)下，以高剪切效率将来自不同蛋白的多肽片段剪接在一起，形成重组融合多肽蛋白。

此外，本发明人在基于对上述断裂型内含肽的筛选基础上，建立了一种利用断裂型内含肽制备重组多肽，特别是双特异性抗体的方法。根据本发明的制备双特异性抗体的方法制备的双特异性抗体，不存在非天然的结构域，其结构与天然抗体(IgA、IgD、IgE、IgG或IgM)的结构极其相似，并具有Fc结构域。所述双特异性抗体的结构完整稳定性好，可以根据不同的IgG亚型保留或去除CDC(补体依赖的细胞毒性)或者ADCC(抗体依赖的细胞毒作用)或者ADCP(抗体依赖的细胞吞噬作用)或者FcRn(Fc受体)结合活性。

利用本发明的方法制备的双特异性抗体具有以下优点：所述双特异性抗体的体内半衰期长，免疫原性低；不引入任何形式的连接肽(linker)，抗体分子稳定性提高，在体内的免疫反应降低。

利用本发明的方法制备的双特异性抗体可以利用哺乳动物细胞表达***制备，从而具有与野生型IgG一致的糖基化修饰，得到更好的生物学功能，并且更加稳定，体内半衰期长；利用由内含肽进行的体外剪接方法，可以完全避免传统方法中极易出现的重链错配、轻链错配的问题。

本发明的制备双特异性抗体的方法，还可以用于生产人源化的双特异性抗体，以及全人序列的双特异性抗体。利用本发明的方法制备的这样的抗体的序列与人源抗体更接近，可以有效降低免疫反应的发生。

本发明的制备双特异性抗体的方法是通用型双特异性抗体的构建方法，不受抗体亚型(IgG、IgA、IgM、IgD、IgE，以及轻链κ和λ型)的限制，不需要根据具体的靶点设计不同的突变，可以用于构建任何双特异性的抗体。

本发明提供以下技术方案。

1.用于断裂型内含肽的侧翼序列对，其中，

所述侧翼序列对包括：侧翼序列a和侧翼序列b；所述侧翼序列a位于断裂型内含肽N端蛋白质剪接区域(In)的N端，且介于N端外显肽(En)和In之间；所述侧翼序列b位于断裂型内含肽C端蛋白质剪接区域(Ic)的C端，且介于Ic和C端外显肽(Ec)之间；

所述断裂型内含肽选自：SspDnaE、SspDnaB、MxeGyrA、MjaTFIIB、PhoVMA、TvoVMA、Gp41-1、Gp41-8、IMPDH-1或PhoRadA，

(1)所述断裂型内含肽为IMPDH-1时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失，或优选为G或D；A _-2为X或缺失，或优选为G或K；A _-1选自G或T；

B ₁为S；B ₂为I或T或S；B ₃为X或缺失；

优选地，

侧翼序列a为G、XG、XGG、DKG或DKT且侧翼序列b为SI、ST、SS、SIX、STX或SSX；

(2)所述断裂型内含肽为Gp41-8时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自N或D；A _-1选自R或K；

B ₁为S或T；B ₂为A或H；B ₃为X或缺失，或优选为V、Y或T，

优选地，

侧翼序列a为NR、XNR、DK、XDK、DR或XDR且侧翼序列b为SA或SAX；

(3)所述断裂型内含肽为SspDnaB时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自S或D；A _-1选自G或K；

B ₁为S；B ₂为I；B ₃为X或缺失，或优选为E或T，

优选地，

侧翼序列a为SG、XSG、DK、XDK，侧翼序列b为SI或SIX；

(4)所述内含肽为MjaTFIIB时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中

A _-3为X或缺失；A _-2选自T或D；A _-1选自Y；

B ₁为T；B ₂为I或H；B ₃为X或缺失，或优选为H或T；

优选地，

侧翼序列a为TY、DY、XTY或XDY，侧翼序列b为TI、TIX、TH或THX；

(5)所述断裂型内含肽为PhoRadA时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自G或D；A _-1选自K；

B ₁为T；B ₂为Q或H；B ₃为X或缺失，或优选为L或T，

优选地，

侧翼序列a为GK、XGK、DK或XDK，侧翼序列b为TQ、TH、TQX或THX；

(6)所述断裂型内含肽为TvoVMA时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自G或D；A _-1为K；

B ₁为T；B ₂为V或H；B ₃为X或缺失，或优选为I或T，

优选地，

侧翼序列a为GK、XGK、DK或XDK，侧翼序列b为TV、TH、TVX或THX；

(7)所述断裂型内含肽为MxeGyrA时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自R或D；A _-1选自Y、K或T；

B ₁为T；B ₂为E或H；B ₃为X或缺失，或优选为A或T，

优选地，

侧翼序列a为RY、XRY、DK或XDK，侧翼序列b为TE、TH、TEX或THX；

(8)所述断裂型内含肽为PhoVMA时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自G或D；A _-1选自K；

B ₁为T；B ₂为V或H；B ₃为X或缺失，或优选为I或T，

优选地，

侧翼序列a为GK、XGK、DK或XDK，侧翼序列b为TV、TH、TVX或THX；

(9)所述断裂型内含肽为Gp41-1时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自G或D；A _-1选自Y或K；

B ₁为S或T；B ₂为S或H；B ₃为X或缺失，或优选为S或T；

优选地，

侧翼序列a为GY、XGY、DK或XDK，侧翼序列b为SS、SH、SSX或SHX；

(10)所述断裂型内含肽为SspDnaE时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自G或D；A _-1选自G、S或K；

B ₁为T或S；B ₂为E或H；B ₃为X或缺失，或优选为T；

优选地，

侧翼序列a为GG、XGG、GK、XGK、DK或XDK，侧翼序列b为SE、TH、SEX或THX；

其中所述X为选自：G、A、V、L、M、I、S、T、P、N、Q、F、Y、W、K、R、H、D、E、C中的任一种氨基酸。

2.根据上述1所述的用于断裂型内含肽的侧翼序列对，其中，所述断裂型内含肽与所述侧翼序列对共同使用用于进行反式剪接，

其中，

所述SspDnaE由序列为SEQ ID NO：31的In和序列为SEQ ID NO：32的Ic组成，

所述SspDnaB由序列为SEQ ID NO：33的In和序列为SEQ ID NO：34的Ic组成，

所述MxeGyrA由序列为SEQ ID NO：35的In和序列为SEQ ID NO：36的Ic组成，

所述MjaTFHB由序列为SEQ ID NO：37的In和序列为SEQ ID NO：38的Ic组成，

所述PhoVMA由序列为SEQ ID NO：39的In和序列为SEQ ID NO：40的Ic组成，

所述TvoVMA由序列为SEQ ID NO：41的In和序列为SEQ ID NO：42的Ic组成，

所述Gp41-1由序列为SEQ ID NO：43的In和序列为SEQ ID NO：44的Ic组成，

所述Gp41-8由序列为SEQ ID NO：45的In和序列为SEQ ID NO：46的Ic组成，

所述IMPDH-1由序列为SEQ ID NO：47的In和序列为SEQ ID NO：48的Ic组成，

所述PhoRadA由序列为SEQ ID NO：49的In和序列为SEQ ID NO：50的Ic组成，

优选地，

(1)当所述断裂型内含肽为IMPDH-1时，所述侧翼序列a为XGG且侧翼序列b为SI、ST、SS；或侧翼序列a为DKG且侧翼序列b为SI、ST、SS；或侧翼序列a为DKT且侧翼序列b为SI、ST、SS；

(2)当所述断裂型内含肽为Gp41-8时，所述侧翼序列a为NR且侧翼序列b为SAV；或侧翼序列a为DK且侧翼序列b为SAV；侧翼序列a为NR且侧翼序列b为SAT；或侧翼序列a为DK且侧翼序列b为SAT；

(3)当所述断裂型内含肽为SspDnaB时，所述侧翼序列a为SG且侧翼序列b为SIE；

(4)当所述断裂型内含肽为PhoRadA时，所述侧翼序列a为GK且侧翼序列b为TQL或THT；或侧翼序列a为DK且侧翼序列b为TQL或THT；

(5)当所述断裂型内含肽为TvoVMA时，所述侧翼序列a为GK且侧翼序列b为TVI或THT；或侧翼序列a为DK且侧翼序列b为TVI或THT；

(6)当所述断裂型内含肽为MxeGyrA时，所述侧翼序列a为RY且侧翼序列b为TEA或THT；或侧翼序列a为DK且侧翼序列b为TEA或THT；

(7)当所述断裂型内含肽为MjaTFIIB时，所述侧翼序列a为TY且侧翼序列b为TIH；或侧翼序列a为TY且侧翼序列b为THT；

(8)当所述断裂型内含肽为PhoVMA时，所述侧翼序列a为GK且侧翼序列b为TVI或THT；或侧翼序列a为DK且侧翼序列b为TVI或THT；

(9)当所述断裂型内含肽为Gp41-1时，所述侧翼序列a为GY且侧翼序列b为SSS或SHT；或侧翼序列a为DK且侧翼序列b为SSS或SHT；

(10)当所述断裂型内含肽为SspDnaE时，所述侧翼序列a为GG且侧翼序列b为SET或THT；或侧翼序列a为GK且侧翼序列b为SET或THT；或侧翼序列a为DK且侧翼序列b为SET或THT；

3.重组多肽，其由利用上述1或2所述的用于断裂型内含肽的侧翼序列对进行反式剪接而获得。

4.根据上述3所述的重组多肽，其中，所述重组多肽由组分A与组分B经过反式剪接得到；

在组分A中，所述侧翼序列a的N端与En的C端连接、且所述侧翼序列a的C端与所述In连接，任选在In的C端连接有标签蛋白；

在组分B中，所述侧翼序列b的C端与Ec的N端连接、且所述侧翼序列b的N端与所述Ic连接，任选在Ic的N端连接有标签蛋白；

其中，所述En与Ec的编码序列分别来自同一蛋白的N端部分和C端部分，

优选地，所述标签蛋白选自SEQ ID NO：24、25、26、27、28、29或30。

5.根据上述3所述的重组多肽，其中，所述重组多肽由组分A与组分B经过反式剪接得到；

其中，所述En与Ec的编码序列来自不同蛋白。

6.根据上述4或5所述的重组多肽，其为荧光蛋白、蛋白酶、信号肽、抗菌肽、抗体、或具备生物毒性的多肽。

7.根据上述4或5所述的重组多肽，其中，所述同一蛋白、或所述不同蛋白中的一种以上为抗体。

8.根据上述7所述的重组多肽，其中，所述抗体为天然免疫球蛋白IgG、IgM、IgA、IgD、或IgE类，或免疫球蛋白亚类：IgG1、IgG2、IgG3、IgG4、IgG5，或不同类的轻链：κ、λ；或单域抗体；或

所述抗体为全长抗体或抗体的功能片段。

9.根据上述8所述的重组多肽，其中，所述抗体的功能片段为选自：抗体重链可变区VH、抗体轻链可变区VL、抗体重链恒定区片段Fc、抗体重链恒定区1 CH1、抗体重链恒定区2 CH2、抗体重链恒定区3 CH3、抗体轻链恒定区CL、或单域抗体可变区VHH中的一种或多种。

10.根据上述7所述的重组多肽，其中，所述同一蛋白、或所述不同蛋白中的一种以上针对抗原或表位A具有特异性，

所述抗原A包括：肿瘤细胞表面抗原、免疫细胞表面抗原、细胞因子、细胞因子受体、转录因子、膜蛋白、肌动蛋白、病毒、细菌、内毒素、FIXa、FX、CD3、SLAMF7、CD38、BCMA、CD20、CD16、CEA、PD-L1、PD-1、CTLA-4、TIGIT、LAG-3、VEGF、B7-H3、Claudin18.2、TGF-β、Her2、IL-10、Siglec-15、 Ras、C-myc，所述表位A为所述抗原A的免疫原性表位。

11.根据上述10所述的重组多肽，其中，所述同一蛋白、或所述不同蛋白中的一种以上针对与抗原或表位A不同的抗原或表位B具有特异性，

所述抗原B包括：肿瘤细胞表面抗原、免疫细胞表面抗原、细胞因子、细胞因子受体、转录因子、膜蛋白、肌动蛋白、病毒、细菌、内毒素、FIXa、FX、CD3、SLAMF7、CD38、BCMA、CD20、CD16、CEA、PD-L1、PD-1、CTLA-4、TIGIT、LAG-3、VEGF、B7-H3、Claudin18.2、TGF-β、Her2、IL-10、Siglec-15、Ras、C-myc，所述表位B为所述抗原B的免疫原性表位。

12.根据上述11所述的重组多肽，其为双特异性抗体，可同时结合抗原或表位A和B，优选为人源化的双特异性抗体或全人序列的双特异性抗体。

13.根据上述7～11任一项所述的重组多肽，其中，

所述组分A包含：抗体的轻链、C端融合有In的抗体的VH+CH1链，或C端融合有In的单域抗体可变区VHHa，任选在In的C端连接有标签蛋白，

所述组分B包含：抗体的轻链、抗体的完整重链、以及N端融合有Ic的Fc链，或N端融合有Ic的单域抗体可变区VHHb，任选在Ic的N端连接有标签蛋白，所述VHHa和VHHb可以相同或不同。

14.根据上述3～13中任一项所述的重组多肽，其中，

所述标签蛋白选自：Fc、His-tag、Strep-tag、Flag、HA或麦芽糖结合蛋白MBP。

15.组合物，其包含上述3～14中任一项所述的重组多肽。

16.组合物，其中，除了上述3～14中任一项所述的重组多肽以外，还包含载体。

17.根据上述16所述的组合物，其为药物组合物，所述载体为药学上可接受的载体。

18.载体，其连接有上述3～14中任一项所述的重组多肽，优选用于包括层析的纯化用途。

19.试剂盒，其包含上述3～14中任一项所述的重组多肽，其用于检测样品中是否存在抗原或表位A和/或抗原或表位B，其中优选所述重组多肽为保存于液体中的状态或冻干粉，任选为单独存在或为被连接、络合、缔合、螯合而固定于载体的状态。

20.表达载体，其用于制备上述3～14中任一项所述的重组多肽的表达载体。

21.重组多肽的制备方法，其包括：

(1)提供组分A和组分B，所述组分A包括侧翼序列a、N端外显肽En和In，所述侧翼序列a的N端与所述N端外显肽En的C端连接、且所述侧翼序列a的C端与所述In连接，任选在In的C端还连接有标签蛋白；

所述组分B包括侧翼序列b、C端外显肽Ec和Ic，所述侧翼序列b的C端与C端外显肽Ec的N端连接、且所述侧翼序列b的N端与所述Ic连接，任选在Ic的N端连接有标签蛋白；

其中，所述的侧翼序列a和侧翼序列b如上述1或2中所述，所述N端外显肽En与C端外显肽Ec的编码序列来自同一蛋白或不同蛋白；和

(2)将所述组分A和组分B进行体外反式剪接，得到重组多肽；

优选地，在步骤(1)中，包括使含有编码组分A和组分B的核酸序列的细胞表达所述组分A和组分B；优选地，N端外显肽En和C端外显肽Ec可以为抗体的不同结构域。

22.上述21所述的重组多肽的制备方法，其还包括：

对进行反式剪接前的组分A、组分B进行层析的第一纯化步骤；

对反式剪接得到的重组多肽进行层析的第二纯化步骤；

优选所述第一纯化步骤中的层析方法选自proteinA、proteinG、镍柱、Strep-Tactin亲和层析、抗Flag抗体亲和层析、抗HA抗体亲和层析或交联淀粉亲和层析，和

优选所述第二纯化步骤中的层析方法为选自与标签蛋白对应的亲和层析方法，以去除未剪接组分，或通过离子交换、疏水、分子筛去除未剪接组分。

23.根据上述21所述的重组多肽的制备方法，其中，所述重组多肽为双特异性抗体，其中所述双特异性抗体的编码序列分别属于两种不同的抗体P和抗体R；

1)对于抗体P进行拆分为En _P和Ec _P，设计组分A和组分B的序列；对于抗体R进行拆分为En _R和Ec _R，设计组分A’和组分B’；其中，

组分A包括侧翼序列a、En _P和In，所述侧翼序列a的N端与所述En _P的C端连接、且所述侧翼序列a的C端与所述In连接，任选在In的C端还连接有标签蛋白；组分B包括侧翼序列b、Ec _P和Ic，所述侧翼序列b的C端与Ec _P的N端连接、且所述侧翼序列b的N端与所述Ic连接，任选在Ic的N端连接有标签蛋白；

组分A’包括侧翼序列a、En _R和In，所述侧翼序列a的N端与所述Ra的C端连接、且所述侧翼序列a的C端与所述In连接，任选在In的C端还连接有标签蛋白；组分B’包括侧翼序列b、Ec _R和Ic，所述侧翼序列b的C端与Ec _R的N端连接、且所述侧翼序列b的N端与所述Ic连接，任选在Ic的N端连接有标签蛋白；

2)将所述组分A与组分B’，和/或将组分A’与组分B进行反式剪接，得到所述双特异性抗体。

24.用于断裂型内含肽的侧翼序列对的筛选方法，所述方法包括：

1)将蛋白P的氨基酸序列拆分；

2)侧翼序列a为独立设计的2～3个氨基酸组合，记为侧翼序列a1～an，侧翼序列b为独立设计的2～3个氨基酸组合，记为侧翼序列b1～bn；其中，所述氨基酸为选自G、A、V、L、M、I、S、T、P、N、Q、F、Y、W、K、R、H、D、E、C中的任一种氨基酸；

3)针对断裂型内含肽，使用2)中设计的侧翼序列a1～an和b1-bn，设计含有蛋白P拆分而成序列的组分A1～An和组分B1～Bn的表达序列；

4)将所述表达序列分别与载体连接，进行组分A和B一一对应的共转染及细胞内反式剪接，得到剪接产物F1～Fn；

5)检测剪接产物F1～Fn，选择剪接效率超过20％的侧翼序列对；

6)对5)中选择的侧翼序列对进行分析，淘汰该侧翼序列中的能够导致剪接后产生自由巯基的侧翼序列，以优化5)中选择的侧翼序列对；

7)重复所述步骤1)～5)，选择剪接效率在所有候选序列对中处于前20％，且作为剪接产物的重组多肽中不存在自由巯基的侧翼序列对1～m，

其中n为2或3，m为正整数。

25.根据上述24所述的断裂型内含肽的侧翼序列对的筛选方法，所述方法还包括：

1)将与蛋白P不同的蛋白R拆分；

2)利用侧翼序列对1～m，设计组分A’1～A’m和组分B’1～B’m的表达序列；

3)将所述表达序列与载体连接，进行转染、表达和纯化，得到组分A’1～A’m、组分B’1～B’m，

4)分别将与利用侧翼序列对1～m得到的组分A1～Am与组分B’1～B’m，和/或组分A’1～A’m与组分B1～Bm一一对应进行体外反式剪接，检测剪接产物蛋白，选择剪接效率超过50％的多个侧翼序列对。

26.制备重组多肽的方法，其特征在于利用上述1或2所述的用于断裂型内含肽的侧翼序列对进行反式剪接。

27.上述1或2所述的用于断裂型内含肽的侧翼序列对的用途，其特征在于，用于制备重组多肽，优选地用于与断裂型内含肽共同进行反式剪接。

利用本发明所述的用于断裂型内含肽的侧翼序列对介导剪接的重组多肽(如双特异性抗体)的优势，包括(1)无自由巯基；(2)高通量高效率制备；(3)目的产物和杂质易于区分和鉴别。

定义

应注意，非明确数量的实体限定应指一或多个(种)该实体；例如，“双特异性抗体”应理解为表示一或多个(种)双特异性抗体。同样地，非明确数量限定的、术语“一个或多个”和“至少一个”本文中可互换使用。

本文使用的术语“多肽”包括单数的“多肽”以及复数的“多肽”，并且也指通过酰胺键(也称为肽键)线性连接的单体(氨基酸)组成的分子。多肽可衍生自天然的生物源或通过重组技术生产，不一定由指定核酸序列翻译而成，可以任何方式产生，包括化学合成方式。

本文使用的术语“重组”，在涉及多肽或多核苷酸时指自然状态下不存在的多肽或多核苷酸的形式，其中一个非限制性的例子，可以通过将通常不会一起出现的多核苷酸或多肽组合在一起来实现。

“同源性”或“同一性”或“相似性”，是指两个肽链分子之间或两个核酸分子之间的序列相似程度。当在被比较的序列中的位置上有相同的碱基或氨基酸时，在该位置上的分子为同源的。多个序列之间的同源度为这些序列共有的配对或同源位点数量的函数。“无关的”或“非同源的”序列与本发明的序列之一之间具有少于40％的同源性，但优选小于25％的同源性。

多核苷酸或多核苷酸区域(或多肽或多肽区域)与另一序列具有一定的百分比(例如，60％、65％、70％、75％、80％、85％、90％、95％、98％或99％)的“序列同一性”是指，比对时在这两个序列比较时该百分比的碱基(或氨基酸)相同。

生物学等效的多核苷酸是具有上面提到的特定百分比的同源性，并编码具有相同或相似的生物活性多肽的多核苷酸。

术语“断裂型内含肽”，是指由N端蛋白质剪接区域或N端片段(In，N’fragment of intein)和C端蛋白质剪接区域或C端片段(Ic，C fragment of intein)两部分组成的断裂型内含肽(split intein)，表达前体蛋白质的基因被***在两个开放阅读框中，断裂位点在内含肽序列的内部。

“N端前体蛋白质”是指N端外显肽(En)与断裂型内含肽的N端片段(In)的基因形成融合基因，翻译形成的融合蛋白。

“C端前体蛋白质”是指断裂型内含肽的C端片段(Ic)与C端外显肽(Ec)的表达基因形成融合基因翻译后产生的融合蛋白。

单独的断裂型内含肽的N端片段(In)或C端片段(Ic)不具有蛋白质剪接功能。在蛋白质翻译以后，N端前体蛋白质中的In与C端前体蛋白质的Ic通过互相识别以非共价键结合，形成有功能的内含肽，能够催化蛋白质反式剪接反应，从而以肽键连接两个分离的蛋白质外显子(N端蛋白质外显子或N端外显肽称为En、C端蛋白质外显子或C端外显肽称为Ec)(Ozawa.T.Nat Biotechbol.21(2003)28793)。

蛋白质反式剪接(protein trans-splicing)，是指由断裂型内含肽介导的蛋白质剪接反应。在反式剪接过程中，首先，断裂型内含肽的N端片段(In)和C端片段(Ic)相互识别，并以非共价键结合。在一旦结合后，其结构发生正确折叠，此时的断裂型内含肽具有重建的活性中心，然后，按照典型的蛋白质剪接途径完成蛋白质剪接反应，从而将两侧的外显肽连接。

In是指单独的断裂型内含肽的N端部分，在本文中也称为断裂型内含肽的N端片段或N端蛋白质剪接区域。

Ic是指单独的断裂型内含肽的C端部分，在本文中也称为断裂型内含肽的C端片段或C端蛋白质剪接区域。

侧翼序列a是侧接In的N端并且侧接En的C端的氨基酸序列，连接In和En。这里，如图5所示，将紧邻In的N端第一个氨基酸定义为第-1位，再往N端的第二个氨基酸残基为第-2位，第三个氨基酸残基为第-3位，依此类推直至En为止。一般而言，侧翼序列a的核心序列为第-1位和第-2位，与剪接效率直接相关。

侧翼序列b是侧接Ic的C端并且侧接Ec的N端的氨基酸序列，连接Ic和Ec。这里，如图5所示，将紧邻Ic的C端第一个氨基酸残基定义为第+1位，再往C端的第二个氨基酸残基为第+2位，第三个氨基酸残基为第+3位，依此类推直至Ec为止。一般而言，侧翼序列b的核心序列为第+1位和第+2位，与剪接效率直接相关。

断裂型内含肽介导的反式剪接，例如如图5所示，In与侧翼序列a分开，Ic与侧翼序列b分开，侧翼序列a和侧翼序列b连接，由此将与侧翼序列相连的En和Ec连接，使得侧翼序列a的第-1位氨基酸残基与侧翼序列b的第+1位氨基酸残基直接肽键相连，且第-1位氨基酸位于第+1位氨基酸的N端。

本发明使用进行侧翼序列筛选的20种常见氨基酸(下文简称20种氨基酸)，指：甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、亮氨酸(L)、甲硫氨酸(M)、异亮氨酸(I)、丝氨酸(S)、苏氨酸(T)、脯氨酸(P)、天冬酰胺(N)、谷氨酰胺(Q)、苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)、赖氨酸(K)、精氨酸(R)、组氨酸(H)、天冬氨酸(D)、谷氨酸(E)和半胱氨酸(C)。

本文使用的“抗体”或者“抗原结合多肽”指特定识别并结合抗原或免疫原性表位的多肽或多肽复合体。

抗体可为完整抗体也可为任何抗原结合片段或者其单链。因此术语“抗体”包括含有特定分子的任何蛋白或肽，该特定分子含有至少一部分的免疫球蛋白分子，该免疫球蛋白分子具有结合至抗原或免疫原性表位的生物活性。此种情况的实例包括但不限于，重链或轻链或其配体结合部分的互补决定区(CDR)、重链或轻链可变区、重链或轻链恒定区、框架(FR)区或其任何部分，或结合蛋白的至少一部分。

本文使用的术语“抗体片段”或“抗原结合片段”为抗体的一部分，术语“抗体片段”包括适配体、适配体对映体(spiegelmers)和双体(diabodies)，也包括任何合成的或基因改造的蛋白，它们与抗体一样可结合至特定的抗原或免疫原性表位以形成复合体。

“单链可变片段”或“scFv”指免疫球蛋白的重链(VH)和轻链(VL)的可变区域的融合蛋白。

术语“抗体”包括多种可被生化识别的宽泛类别的多肽。本领域技术人员应理解，重链分为γ、μ、α、δ、ε并具有一些亚类(例如，γ1-4)。该链的性质决定了抗体的“类”，如IgG、IgM、IgA、IgD或IgE。免疫球蛋白亚类(同型)例如IgG1、IgG2、IgG3、IgG4、IgG5等被很好表征并在功能上具有特异性。本领域技术人员参考本申请可容易识别这些类和同型的每一种修饰形式，因此，这些形式在本申请范围内。

所有免疫球蛋白类明确地在本申请的范围内，下列讨论通常将针对免疫球蛋白分子的IgG类。

关于IgG，标准免疫球蛋白分子包含经二硫键以“Y”型连接在一起的两个相同的轻链多肽(分子量约为23,000道尔顿)、和两个相同的重链多肽(分子量约为53,000-70,000道尔顿)。

本申请的抗体、抗原结合多肽、它们的变体或衍生物，包括但不限于：多克隆抗体、单克隆抗体、多特异性抗体、人抗体、人源化的抗体、灵长类化的(primatized)抗体、或嵌合抗体、单链抗体、抗原表位结合片段，例如，Fab、Fab′和F(ab′) ₂、Fd、Fvs、单链Fvs(scFv)、单链抗体、二硫键连接的Fvs(sdFv)、包含VL结构域或VH结构域的片段、由Fab表达库产生的片段、和抗独特型(Anti-idiotypic)(抗-Id)抗体。本申请的免疫球蛋白分子或抗体分子可为任何类型的(例如IgG、IgE、IgM、IgD、IgA和IgY)、免疫球蛋白分子的任何类(例如IgG1、IgG2、IgG3、IgG4、IgA1和IgA2)或亚类。

在一些实例中，例如，某些衍生自骆驼种或基于骆驼免疫球蛋白改造的免疫球蛋白，完整的免疫球蛋白分子可仅由重链组成，而没有轻链。参见，例如，Hamers-Casterman等，Nature.363：446-448(1993)。

轻链和重链两者都分成结构区和功能同源区。术语“恒定”和“可变的”为功能上的使用。在此，应认识到轻链可变结构域(VL)和重链可变结构域(VH)同时决定了抗原识别和特异性。通常恒定区结构域的数量随着远离抗体的抗原结合位点或氨基端的末端位置而增加。N末端部分为可变区，而在C末端部分为恒定区；CH3和CL结构域实际上分别包含重链和轻链的羧基末端。

抗原结合位点是指：针对任何给定的重链或轻链可变区，本领域技术人员可容易地识别分别包括CDR和框架区的氨基酸，因为它们已经被明确定义(参见，“Sequences of Proteins of Immunological Interest，”Kabat，E.，等，美国卫生和公共服务部(U.S.Department of Health and Human Services，)，(1983)；Chothia和Lesk，J.MoI.Biol.，196：901-917(1987)，其在此通过引用以全文形式结合至本文)。

在本技术领域内使用和/或可接受的情况下，一个术语有两个或两个以上定义时，本文使用的术语的定义用于包括所有的含义，除非明确说明与此相反。

术语“互补决定区”(“CDR”)描述在重链和轻链多肽的可变区中都存在的非连续的抗原结合位点。这种具体区域由Kabat等描述于美国卫生和公共服务部，“Sequences of Proteins of Immunological Interest”(1983)和由Chothia等描述与J.MoI.Biol.196：901-917(1987)中，其通过全文引用结合至本文。给定该抗体的可变区氨基酸序列，则本领域技术人员通常可确定哪些残基包含特定CDR。

本文使用的“Kabat编号”是指Kabat等描述的编号***，其内容记载于美国卫生和公共服务部，“Sequence of Proteins of Immunological Interest”(1983)。

本文使用的术语“重链恒定区”包括来自免疫球蛋白重链的氨基酸序列。包含重链恒定区的多肽至少包含以下一种：CH1结构域、铰链(例如，上部铰链区、中间铰链区，和/或下部铰链区)结构域、CH2结构域、CH3结构域，或其变体或片段。例如，本申请中使用的抗原结合多肽可包含具有CH1结构域的多肽链；具有CH1结构域、至少一部分的铰链结构域和CH2结构域的多肽；具有CH1结构域和CH3结构域的多肽链；具有CH1结构域、至少一部分铰链结构域和CH3结构域的多肽链，或者具有CH1结构域，至少一部分铰链结构，CH2结构域，和CH3结构域的多肽链。在另一个实施例中，本申请的多肽包括具有CH3结构域的多肽链。另外，在本申请中使用的抗体可能缺少至少一部分CH2结构域(例如，所有的或一部分的CH2结构域)。如上文所述，但本技术领域的普通技术人员应理解，重链恒定区可能会被修改，使得它们在氨基酸序列上与天然存在的免疫球蛋白分子不同。

本文所公开的抗体的重链恒定区可以来自于不同的免疫球蛋白分子。例如，多肽的重链恒定区可以包含来自IgG1分子的CH1结构域和来自IgG3的分子的铰链区。在另一例子中，重链恒定区可以包含铰链区，该铰链区部分来自IgG1分子，且部分地来自IgG3分子。在另一例子中，重链部分可包含嵌合铰链，该嵌合铰链一部分来自IgG1分子，并且一部分来自IgG4分子。

术语“轻链恒定区”包括来自抗体轻链的氨基酸序列。优选地，所述轻链恒定区包括恒定kappa结构域和恒定lambda结构域中的至少一个。

术语“VH结构域”包括免疫球蛋白重链的氨基末端可变结构域，而术语“CH1结构域”包括免疫球蛋白重链的第一(多数为氨基末端)恒定区。CH1结构域邻近VH结构域并且是免疫球蛋白重链分子的铰链区的氨基末端。

术语“CH2结构域”包括一部分的重链分子，该部分范围，例如，从抗体的约残基244到残基360，使用常规的编号方案(残基244至360，Kabat编号***；和残基231-340，EU编号***；见Kabat等，美国卫生和公共服务部，“Sequences of Proteins of Immunological Interest”(1983)。CH2结构域是独特的，因为它与另一个结构域配对不紧密。相反，两个N-连接的支链的糖链***至完整的天然IgG分子的两个CH2结构域之间。有文献记载，CH3结构域从CH2结构域延伸至IgG分子的C-末端，并包含约108个残基。

所谓“特异性结合”或“对...有特异性”，通常意味着抗体结合到该抗原表位时，经抗原结合结构域的结合相比于结合至随机的、不相关的抗原表位更容易。本文中使用术语“特异性”以确定某一抗体结合至特定抗原表位的亲和力。

本文使用的术语“治疗”(“treat”或“treatment”)是指治疗性治疗和预防或防治措施，其中对于受试者进行防止或减慢(减轻)不良的生理变化或疾病，如癌症的发展。有益的或所需的临床结果包括但不限于，减轻症状，降低疾病的程度、稳定(例如使其不恶化)疾病的状态，延迟或减缓疾病发展，改善或缓和疾病状态，并缓解(无论是部分或全部)，无论可否被检测到。“治疗”也可指与不接受治疗时的预计生存期相比能延长生存期。

任何上述的抗体或多肽还可包括额外的多肽，例如，如本文所述的编码的多肽，抗体N端的用于指导分泌的信号肽，或如本文所述的其他异源多肽。

在其它实施例中，本申请的多肽可包含保守的氨基酸替换。

“保守氨基酸替换”是指氨基酸残基被具有类似侧链的氨基酸残基替换。具有类似侧链的氨基酸残基家族已在本领域中定义，其包括碱性侧链(例如赖氨酸、精氨酸、组氨酸)，酸性侧链(例如天冬氨酸，谷氨酸)，不带电荷的极性侧链(例如，甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)，非极性侧链(例如，丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸、色氨酸)，β-支链的侧链(例如，苏氨酸、缬氨酸、异亮氨酸)和芳族侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此，免疫球蛋白多肽的非必需氨基酸残基优选被来自相同侧链家族的其他氨基酸残基替换。在另一实施例中，一串氨基酸可被结构上类似的氨基酸串替换，后者在顺序上和/或侧链家族的组成上不同。

瞬时转染：瞬时转染是将DNA导入真核细胞的方式之一。在瞬时转染中，重组DNA导入感染性强的细胞系以获得目的基因暂时但高水平的表达。转染的DNA不必整合到宿主染色体，可在比稳定转染较短时间内收获转染的细胞，并对表达上清中的目的产物进行检测。

附图说明

图1为断裂型内含肽介导的同源多肽片段剪接示意图(A)和各组分的蛋白质一级结构示意图(B)。

图2为断裂型内含肽介导的异源多肽片段剪接示意图(A)和各组分的蛋白质一级结构示意图(B)。

图3为断裂型内含肽介导的抗体体外剪接示意图(A)和各组分的蛋白质一级结构示意图(B)，该剪接产物为双特异性抗体。(C)为断裂型内含肽介导的抗体剪接处附近的氨基酸序列的示例性示意图，“X”表示该位置氨基酸为任意氨基酸或者缺失。

图4为双特异性抗体的组分A表达质粒构建示意图(A)，和组分B表达质粒构建示意图(B)。

图5为侧翼序列编号示意图。

图6为不同内含肽及不同侧翼序列相对应的表达质粒共转染293E细胞的表达上清经proteinA亲和纯化后的还原SDS-PAGE和考马斯亮蓝染色检测结果。(A)～(E)分别为不同内含肽基于不同侧翼序列共转染组分A和组分B的细胞上清，纯化后检测结果。

图7为293E细胞分别表达的具有不同内含肽的组分A和组分B’的纯化产物的非还原SDS-PAGE和考马斯亮蓝染色检测结果。(A)Fab5，Fab9和Fab11纯化产物检测结果；(B)HAb5，HAb9和HAb11纯化产物检测结果。

图8为不同内含肽的组分A和组分B’的剪接产物的非还原SDS-PAGE和考马斯亮蓝染色检测，其中，(A)内含肽为IMPDH-1，侧翼序列a为GGG，侧翼序列b为SI；(B)内含肽为PhoRadA，侧翼序列a为GK，侧翼序列b为THT。(A)和(B)剪接产物1表示组分A和B混合前加DTT，剪接产物2表示组分A和B’混合后加DTT，还原表示加DTT，非还原表示未加DTT，未剪接表示混合组分A和B’不加DTT。(C)内含肽为PhoRadA，侧翼序列a为GK，侧翼序列b为THT，“剪接1”和“无剪接1”为组分A与组分B’浓度分别为5μM和4μM且反应体系中含2mM DTT，“剪接2”和“无剪接2”为组分A和组分B’浓度分别为10uM和1uM且反应体系中含2mM DTT，“剪接3”和“无剪接3”为组分A和组分B’浓度分别为5uM和1uM且反应体系中含2mM DTT，其中“剪接1”～“剪接3”均为37℃孵育过夜，“无剪接1”～“无剪接3”均为4℃孵育过夜；对照条带为组分A为Fab11(非还原)，组分B’为HAb11(非还原)，以及单抗。

图9为内含肽为IMPDH-1，侧翼序列a为GGG，侧翼序列b为SI的剪接产物的双抗原夹心ELISA检测结果。其中，包被抗原为CD38，检测抗原为辣根过氧化物酶(HRP)标记的PD-L1。

图10为Fab5+HAb5(剪接产物1)的酶解后的基峰离子(Base peak ion，BPI)图谱。(A)Fab5+HAb5(剪接产物1)经胰蛋白酶酶解后的BPI图谱；(B)Fab5+HAb5(剪接产物1)经胰凝乳蛋白酶酶解后的BPI图谱；(C)Fab5+HAb5(剪接产物1)经Glu-C酶酶解后的BPI图谱。

图11为内含肽PhoRadA和IMPDH-1应用于人IgG2，IgG3或IgG4亚型的组分A和组分B的共转染表达和亲和纯化后SDS-PAGE及考马斯亮蓝染色检测。

具体实施方式

本发明涉及得到双特异性抗体的制备方法，其包括：将目标的抗体相应的DNA序列进行拆分，经过全基因合成构建哺乳动物细胞表达载体，纯化载体，纯化后的载体分别瞬时转染或稳定转染HEK293或CHO等哺乳动物细胞。分别收集发酵液，通过proteinA、proteinL、镍柱、Strep-Tactin亲和层析、抗Flag抗体亲和层析、抗HA抗体亲和层析或交联淀粉亲和层析等方法纯化组分A和组分B，将纯化所得组分A和组分B进行体外反式剪接，对剪接所得产物进行镍柱等标签蛋白对应的亲和层析，得到高纯度的双特异性抗体，工艺流程如图3A所示。

本文描述的抗体可来自任何动物源，包括鸟和哺乳动物。优选地，抗体为人、鼠、驴、兔、山羊、豚鼠、骆驼、驼马、马或鸡的抗体。在另一个实施例中，可变区可来自于软骨鱼(condricthoid)(例如，来自鲨鱼)。

在一些实施例中，所述抗体可以结合：治疗剂、药物前体、肽、蛋白、酶、病毒、脂质、生物反应调节剂、药剂或PEG。

该抗体可以连接至或融合至治疗剂上，该治疗剂可包括可检测标记物，如放射性标记物、免疫调节剂、激素、酶、寡核苷酸、光活性治疗剂或诊断剂、细胞毒性剂，其可为：药物或毒素、超声增强剂、非放射性标记物，它们的组合和其他这类本领域已知的成分。

通过将其偶联化学发光化合物，该抗体被可检测地标记。然后，通过检测化学反应过程中产生的发光来确定化学发光物标记的抗原结合多肽的存在。特别有用的化学发光物标记化合物的例子有鲁米诺、异鲁米诺、热性(theromatic)吖啶鎓酯、咪唑、吖啶鎓盐和草酸酯。

该抗体也可使用荧光发光金属如152Eu，或其他的镧系标记可检测地标记。这些金属可使用金属螯合基团如二亚乙基三胺五乙酸(DTPN)或乙二胺四乙酸(EDTA)连接到抗体上。

本申请的抗原结合多肽的结合特异性可通过体外实验，例如：免疫沉淀、放射免疫分析法(RIA)或酶联免疫吸附法(ELISA)测得。

用于产生重组多肽的细胞系可使用本领域技术人员熟知的技术选择和培养。

对在编码本申请抗体的核苷酸序列中引入突变，可使用本领域技术人员公知的标准技术，包括但不限于：产生氨基酸替换的定点诱变和PCR介导的突变。优选地，所述变体(包括衍生物)，相对于参考可变重链区，CDR-H1、CDR-H2、CDR-H3、轻链可变区、CDR-L1、CDR-L2或CDR-L3，编码少于50个氨基酸替换、少于40个氨基酸替换、少于30个氨基酸替换、少于25个氨基酸替换、少于20个氨基酸替换、少于15个氨基酸替换、少于10个氨基酸替换、少于5个氨基酸替换、少于4个氨基酸替换、少于3个氨基酸替换、或少于2个氨基酸替换。或者，可沿着全部或部分的编码序列随机引入突变，例如通过饱和诱变可对所得到的突变体针对生物活性筛选，以确定保留有活性的突变。

本发明中使用的标签蛋白可以是Fc、寡聚组氨酸(His-tag)、Strep-tag、Flag、HA或麦芽糖结合蛋白(MBP)等。

本发明中使用的转染可以是瞬时转染或稳定转染。

本发明中使用了HEK293或CHO等哺乳动物细胞，但不限于此。

来自哺乳细胞的包含表达产物的液体例如发酵液、培养基上清，可以采用proteinA、proteinG、镍柱、Strep-Tactin亲和层析、抗Flag抗体亲和层析、抗HA抗体亲和层析或交联淀粉亲和层析等方法纯化。

剪接所得产物可以进行标签蛋白对应的亲和层析，去除未剪接的成分。

本发明用于构建载体的基因片段，可以通过全基因合成构建，但不限于此。

本发明所用的载体为pcDNA3.1或pCHO1.0，但不限于此。

本发明所用的限制性内切酶，可列举例如：NotI、NruI或BamHI-HF等，但不限于此。

BLAST是一种比对程序，使用默认参数。具体地，程序为BLASTN和BLASTP。这些程序的详细信息，可于以下互联网地址获得： http：//www.ncbi.nlm.nih.gov/blast/Blast.cgi。

在本发明的一个具体实施方式中，如图1、2、3所示，可以构建组分A表达质粒(pPa-FSa-In-Tag)和组分B表达质粒(pTag-Ic-FSb-Pb)，或组分A’表达质粒(pRa-FSa-In-Tag)和组分B’表达质粒(pTag-Ic-FSb-Rb)。

在本发明的另一个具体实施方式中，如图4A和B所示，可以通过酶切、酶连等分子克隆方法，将Pa-HIn和Pa-L构建到同一个质粒中，即组分A表达质粒(pBi-Pa-FSa-In-Tag)；或将pB’-L、pB’-H和pB’-FcIc构建到同一个质粒，即组分B’表达质粒(pBi-Tag-Ic-FSb-Rb)。

在本发明的另一个具体实施方式中，组分B表达质粒可以包括pB-L、pB-H、pB-FcIc三类表达质粒。

在本发明中，Pa也用来表示蛋白P的N端蛋白质外显子或N端外显肽，也表示为Enp；Pb也用来表示蛋白P的C端蛋白质外显子或C端外显肽，也表示为Ecp。Ra也用来表示蛋白R的N端蛋白质外显子或N端外显肽，也表示为En _R；Rb也用来表示蛋白R的C端蛋白质外显子或C端外显肽，也表示为Ec _R。

表4 部分断裂型内含肽的侧翼序列a

序列号	编号	侧翼序列a氨基酸序列
51	FSa1	AEY
52	FSa2	SG
53	FSa3	GS
54	FSa4	MGG
55	FSa5	RY
56	FSa6	TY
57	FSa7	GK
58	FSa8	NR
59	FSa9	GGG
60	FSa10	DK
61	FSa11	GY
62	FSa12	XX ^*
63	FSa13	XXX ^*
202	FSa14	DKG
203	FSa15	DKT

*：X代表选自本发明定义的20种氨基酸(A、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Y、C)中的任意氨基酸。

实施例1

试验方法

1.重组多肽的制备

本发明的实施例中的DNA序列，均根据氨基酸序列进行逆向翻译获得，并由武汉金开瑞合成。

实施例中涉及的重组多肽制备均是通过下述方法制备：将DNA序列在重组酶作用下，与经限制性内切酶EcoRI酶切处理后的载体pcDNA3.1于37℃连接30分钟，然后通过热激法转化Trans10感受态细胞。通过测序(武汉金开瑞公司)验证正确后瞬时转染293E细胞(购自Thermo Fisher公司)。表达后进行纯化。

2.实施例中涉及的共转染的质粒DNA具体如下：

1)表达图1所示的组分A和组分B，需要质粒pPa-FSa-In-Tag和pTag-Ic-FSb-Pb分别转染或共转染至293E细胞进行表达；。

2)表达图2所示的组分A和组分B’，需要质粒pPa-FSa-In-Tag和pTag-Ic-FSb-Rb分别转染或共转染至293E细胞进行表达；

3)表达图3所示的组分A，需要质粒Pa-HIn和Pa-L共转染至293E细胞进行表达，或者单转染质粒pBi-Pa-FSa-In-Tag进行表达；表达图3所示的组分B’，需要质粒pB’-L、pB’-H和pB’-FcIc共转染至293E细胞进行表达，或者单转染质粒pBi-Tag-Ic-FSb-Rb进行表达。

一般情况下，如是两种质粒共转染表达，则两种质粒的摩尔数之比可以为1∶1，也可以为其他任意比例。如是三种质粒共转染表达，则三种质粒的摩尔数之比可为1∶1∶1，也可以为其他任意比例。

3.具有标签蛋白的多肽的纯化

(1)当标签蛋白为Fc时，采用亲和层析，使用MabSelect SuRe(GE，货号17-5438-01)，18ml柱。

(2)当标签蛋白为His-tag时，采用亲和层析，使用Ni-NTA(江苏千纯，货号：A41002-06)。

(3)当标签蛋白为Strep-tag，Flag、HA或MBP等，分别选择Strep-Tactin亲和层析、抗Flag抗体亲和层析、抗HA抗体亲和层析、或交联淀粉亲和层析相应的填料和缓冲液即可。

(4)离子交换层析，当组分A(A’)或组分B(B’)不带标签蛋白时，可根据等电点的差异使用离子交换层析方法分离剪接产物，使用的层析填料可以是阳离子交换层析填料或阴离子交换层析填料，如Hitrap SP-HP(GE公司)。

(5)疏水层析，当组分A(A’)或组分B(B’)不带标签蛋白时，可根据疏水性的差异使用疏水层析方法分离剪接产物，使用的层析填料如Capto phenyl ImpRes填料(GE公司)。

(6)分子筛，当组分A(A’)或组分B(B’)不带标签蛋白时，可根据分子量的差异使用分子筛层析方法分离剪接产物，使用的层析填料如HiLoad Superdex 200pg(GE公司)。

实施例2内含肽SspDnaB、MxeGyrA、MjaTFIIB、PhoVMA、TvoVMA、Gp41-1、Gp41-8、IMPDH-1、PhoRadA的侧翼序列对的筛选

●表达质粒A-Hln、pA-L，质粒(pTag-Ic-FSb-Pb)的构建

使用“重组多肽的制备”中的条件，如图4A、4B所示，使用pcDNA3.1质粒载体按照表31、表32中所示的构成分别构建了内含肽SspDnaB、MxeGyrA、MjaTFIIB、PhoVMA、TvoVMA、Gp41-1、Gp41-8、IMPDH-1、PhoRadA的组分表达质粒。pA-L质粒使用了与实施例1中相同的pA-L质粒。

其中，对于内含肽SspDnaB，构建了与A-Fab20、A-Fab21对应的pA-HIn(20)～pA-HIn(21)，以及质粒B-FcIc20、B-FcIc21对应的pTag-Ic-FSb-(B-FcIc20)、pTag-Ic-FSb-(B-FcIc21)。

对于内含肽MxeGyrA，构建了与A-Fab30、A-Fab31对应的质粒pA-HIn(30)～pA-HIn(31)，以及B-FcIc30、B-FcIc31对应的质粒pTag-Ic-FSb-(B-FcIc30)、pTag-Ic-FSb-(B-FcIc31)。

对于内含肽MjaTFIIB，构建了与A-Fab40、A-Fab41对应的质粒pA-HIn(40)～pA-HIn(41)，以及B-FcIc40、B-FcIc41对应的质粒pTag-Ic-FSb-(B-FcIc40)、pTag-Ic-FSb-(B-FcIc41)。

对于内含肽PhoVMA，构建了与A-Fab50、A-Fab51对应的质粒pA-HIn(50)～pA-HIn(51)，以及B-FcIc50、B-FcIc51对应的质粒pTag-Ic-FSb-(B-FcIc50)、pTag-Ic-FSb-(B-FcIc51)。

对于内含肽TvoVMA，构建了与A-Fab60、A-Fab61对应的质粒pA-HIn(60)～pA-HIn(61)，以及B-FcIc60、B-FcIc61对应的质粒pTag-Ic-FSb-(B-FcIc60)、pTag-Ic-FSb-(B-FcIc61)。

对于内含肽Gp41-1，构建了与A-Fab70、A-Fab71对应的质粒pA-HIn(70)～pA-HIn(71)，以及B-FcIc70、B-FcIc71对应的质粒pTag-Ic-FSb-(B-FcIc70)、pTag-Ic-FSb-(B-FcIc71)。

对于内含肽Gp41-8，构建了与A-Fab80、A-Fab81对应的质粒pA-HIn(80)～pA-HIn(81)，以及B-FcIc80、B-FcIc81对应的质粒pTag-Ic-FSb-(B-FcIc80)、pTag-Ic-FSb-(B-FcIc81)。

对于内含肽IMPDH-1，构建了与A-Fab90、A-Fab91、A-Fab92对应的质粒pA-HIn(90)～pA-HIn(92)，以及B-FcIc90～B-FcIc92对应的质粒pTag-Ic-FSb-(B-FcIc90)～pTag-Ic-FSb-(B-FcIc92)。

对于内含肽PhoRadA，构建了与A-Fab100、A-Fab101对应的质粒pA-HIn(100)～pA-HIn(101)，以及B-FcIc100、B-FcIc101对应的质粒pTag-Ic-FSb-(B-FcIc100)、pTag-Ic-FSb-(B-FcIc101)。

本实施例中使用的表达组分A的质粒包括：pA-HIn(20)～(21)、(30)～(31)、(40)～(41)、(50)～(51)、(60)～(61)、(70)～(71)、(80)～(81)、(90)～(91)、(100)～(101)、以及pA-L。

本实施例中使用的表达组分B的质粒包括：pTag-Ic-FSb-(B-FcIc20～21)、(30)～(31)、(40)～(41)、(50)～(51)、(60)～(61)、(70)～(71)、(80)～(81)、(90)～(91)、(100)～(101)。

表34 内含肽的共转染配对表

按表34中的配对进行了转染。转染条件为：质粒摩尔数比例为pTag-Ic-FSb(XX或XXX)-(B-FcIc)∶pA-HIn(XX或XXX)∶pA-L＝3∶1∶1。并设置了阳性对照为单克隆抗体的瞬时转染。

经转染的细胞培养5天后取上清。对上清中的蛋白进行proteinA亲和层析，proteinA亲和层析后，通过SDS-PAGE法(加还原剂)进行考马斯亮蓝染色检测上清中的蛋白。结果示于图6A～D，根据结果可知，在组A22、A27、A31、A45、 A49、A52、A53、A55、A56中发生了显著剪接。

图6E，结果显示，组A58、A59发生显著剪接。

组A22、A27、A31、A45、A49、A52、A53、A55、A56、A58、A59对应的内含肽及侧翼序列示于表35中。

表35 不同的内含肽及相应的有效侧翼序列对

内含肽	编号	侧翼序列a	侧翼序列b
IMPDH-1	A22	GGG	SI
IMPDH-1	A58	DKG	SI
IMPDH-1	A59	DKG	ST
Gp41-8	A27	NR	SAV
Gp41-8	A31	DK	SAV
SSpDnaB	A45	SG	SIE
MjaTFIIB	A49	TY	TIH
MjaTFIIB	A52	TY	THT
PhoRadA	A53	GK	TQL
PhoRadA	A55	GK	THT
PhoRadA	A56	DK	TQL

综上所述，结果显示，对于内含肽IMPDH-1，其对应的具有优秀剪接效率的侧翼序列对为：侧翼序列a为GGG时，侧翼序列b为SI；或者侧翼序列a为DKG，侧翼序列b为ST；或者侧翼序列a为DKG，侧翼序列b为SI。

对于内含肽Gp41-8，其对应的具有优秀剪接效率的侧翼序列对为：侧翼序列a为NR时，侧翼序列b为SAV；或侧翼序列a为DK时，侧翼序列b为SAV。

对于内含肽SSpDnaB，其对应的具有优秀剪接效率的侧翼序列对为：侧翼序列a为SG时，侧翼序列b为SIE。

对于内含肽MjaTFIIB，其对应的具有优秀剪接效率的侧翼序列对为：侧翼序列a为TY时，侧翼序列b为TIH；或侧翼序列a为TY时，侧翼序列b为THT。

对于内含肽PhoRadA，其对应的具有优秀剪接效率的侧翼序列对为：侧翼序列a为GK时，侧翼序列b为TQL或THT；或侧翼序列a为DK时，侧翼序列b为TQL。

实施例3不同蛋白来源的多肽片段的内含肽介导的体外剪接

●载体构建及多肽的表达

使用与实施例1中相同的条件，使用pcDNA3.1按照表31和33中所示的构成分别构建了经由内含肽SspDnaB、MxeGyrA、MjaTFIIB、PhoVMA、TvoVMA、Gp41-1、Gp41-8、IMPDH-1、PhoRadA的组分表达质粒。

对于同一种组分B’，上述组分表达质粒均分为B’-L表达质粒(pB’-L)、B’-H表达质粒(pB’-H)和B’-FcIc表达质粒(pB’-FcIc)三种。其中，pB’-L、B’-H表达质粒在各组分B’之间是通用的。

对于内含肽SspDnaB，构建了与B’-HAb20～B’-HAb21对应的质粒pB’-FcIc(20)～B’-FcIc(21)。

对于内含肽MxeGyrA，构建了与B’-HAb30～B’-HAb31对应的质粒pB’-FcIc(30)～B’-FcIc(31)。

对于内含肽MjaTFIIB，构建了与B’-HAb40～B’-HAb41对应的质粒pB’-FcIc(40)～B’-FcIc(41)。

对于内含肽PhoVMA，构建了与B’-HAb50～B’-HAb51对应的质粒pB’-FcIc(50)～B’-FcIc(51)。

对于内含肽TvoVMA，构建了与B’-HAb60～B’-HAb61对应的质粒pB’-FcIc(60)～B’-FcIc(61)。

对于内含肽Gp41-1，构建了与B’-HAb70～B’-HAb71对应的质粒pB’-FcIc(70)～B’-FcIc(71)。

对于内含肽Gp41-8，构建了与B’-HAb80～B’-HAb81对应的质粒pB’-FcIc(80)～B’-FcIc(81)。

对于内含肽IMPDH-1，构建了与B’-HAb90～B’-HAb92对应的质粒pB’-FcIc(90)～B’-FcIc(92)。

对于内含肽PhoRadA，构建了与B’-HAb100～B’-HAb101对应的质粒pB’-FcIc(100)～B’-FcIc(101)。

本实施例中使用的表达组分A的质粒包括：pA-HIn(90)、pA-HIn(80)、pA-HIn(81)、pA-HIn(61)、pA-HIn(20)、pA-HIn(40)、pA-HIn(100)以及pA-L。

本实施例中使用的表达组分B’的质粒包括：pB’-FcIc(90)、pB’-FcIc(80)、pB’-FcIc(61)、pB’-FcIc(20)、pB’-FcIc(41)、pB’-FcIc(101)以及pB’-L、pB’-H。

组分A的表达和纯化：

将各质粒pA-HIn和质粒pA-L共转染至CHO细胞，37℃培养，质粒摩尔数比例为pA-HIn∶pA-L＝1∶1，转染后10天收获细胞上清。用镍柱层析(江苏千纯，货号：A41002-06)纯化上清液，获得经纯化的组分A的多肽片段。

组分B’的表达和纯化：

将质粒pB’-L，质粒pB’-H和各质粒pB’-FcIc共转染至293E细胞，37℃培养，质粒摩尔数比例为pB’-L∶pB’-H∶pB’-FcIc＝1∶1∶3，转染后10天收获细胞上清。用镍柱层析纯化上清液，获得经纯化的组分B’的多肽片段。

如表36所示，将获得的组分A及组分B’的多肽片段分别称为Fab5～Fab11，HAb5～HAb11。

表36 获得的组分A及组分B’的多肽片段

将获得的经纯化的组分A和组分B’的多肽片段进行非还原SDS-PAGE和考马斯亮蓝染色，结果示于图7A～B。

E1、E2、E3表示镍柱层析过程中咪唑浓度从低到高不同的洗脱组分。由图7A可知，Fab5和Fab11均得到了较高的表达水平。并且，在Fab5和Fab11组中，通过采用镍柱层析对多肽进行纯化可获得纯度较高的多肽。由图7B可知，HAb5、HAb9和HAb11均得到了较高的表达水平，且HAb5、HAb9和HAb11经镍柱层析可获得纯度较高的多肽。

●体外剪接

将获得的纯化后的组分A和组分B’的多肽片段Fab5、Fab11、HAb5、HAb11分别用3kD的透析袋(购自Sigma公司)4℃透析至缓冲液中，组分的蛋白的浓度1～10微摩尔。所述缓冲液包含：10～50mM Tris/HCl(pH7.0～8.0)、100～500mM NaCl、0～0.5mM EDTA。再将具有同一内含肽来源的组分A和组分B’分别按对应序号(例如，Fab5与HAb5等)进行摩尔比1∶5～5∶1混合，补加DTT至0.5～5mM，于37℃孵育过夜。

对得到的剪接产物多肽进行SDS-PAGE和考马斯亮蓝染色，结果示于图8A～C。

在图8A～B中，“剪接1”为先混合组分A和组分B’，再加入2mM DTT；“剪接2”为先分别在组分A和组分B’里加入2mM DTT，再将两者混合；“还原”表示该组分含2mM DTT，非还原表示不含DTT；“无剪接”表示溶液中不加DTT；单抗为Herceptin(购自罗氏)。

图8C中，“剪接1”和“无剪接1”为组分A与组分B’浓度分别为5μM和4μM且反应体系中含2mM DTT，“剪接2”和“无剪接2”为组分A和组分B’浓度分别为10μM和1μM且反应体系中含2mM DTT，“剪接3”和“无剪接3”为组分A和组分B’浓度分别为5μM和1μM且反应体系中含2mM DTT，其中“剪接1”～“剪接3”均为37℃孵育过夜，“无剪接1”～“无剪接3”均为4℃孵育过夜；对照条带为组分A为Fab11(非还原)，组分B’为HAb11(非还原)，以及单抗。

由图8可知，具有本发明的新型侧翼序列对的两种断裂型内含肽IMPDH-1和PhoRadA均能在体外发生高效率的有效剪接，从而得到来自不同蛋白的多肽片段的体外剪接重组多肽，分别得到了剪接产物Fab5+HAb5及Fab11+HAb11。这些剪接产物与单抗对照，其条带大小一致，为150kD，证明该产物其理论分子量与天然IgG单抗一致。

●剪接产物的生物学活性检测

针对重组多肽Fab5+HAb5(剪接1)进行了基于双抗原夹心ELISA的生物学活性检测。1)抗原准备：针对蛋白PD-L1和CD38，以只选择胞外结构域的方式进行构建，构建了带His标签的表达质粒，使用载体为pcDNA3.1。

构建后，使用293E细胞进行瞬时转染，进行了包括镍柱纯化和分子筛纯化两步的表达纯化。纯化后，获得了经SDS-PAGE检测纯度不小于95％的抗原蛋白。

用辣根过氧化物酶(HRP)标记了PD-L1蛋白。

2)第一抗原包被：调整使得CD38蛋白浓度为2μg/ml，使用所述含有CD38蛋白的液体以100μl/孔包被酶标板，4度过夜；弃上清，每孔加入250μl封闭液(含3％BSA的PBS)；

3)抗体添加：按照实验设计，室温操作，梯度稀释抗体，稀释液为1％BSA的PBS。比如抗体稀释的初始浓度为20μg/ml，2倍稀释，稀释5个浓度梯度。将稀释好的抗体以每孔200μl加入到酶标板孔中，室温下静置孵育2h，然后弃上清；

4)洗涤：用200μl/孔PBST(PBS含0.1％Tween20)洗涤3次；

5)第二抗原孵育：加入稀释好的第二抗原(经HRP标记的PD-L1蛋白)，第二抗原以1∶1000稀释后进行使用，

稀释液为1％BSA的PBS，体积为100μl/孔，室温孵育1h；

6)洗涤：用200μl/孔PBST洗涤5次；

7)显色：加TMB显色液(配制A，B显色液，购自武汉博士德公司；按A∶B＝1∶1混匀，即用即配)100μl/孔，37℃显色5min。

8)加2M HCl终止液100μl/孔，终止液加入后，在30min内进行酶标仪450nm读数。

对Fab5、HAb5多肽片段、两者未剪接的混合物及两者经由内含肽体外剪接后的多肽片段Fab5+HAb5的ELISA检测结果示于图9。

由图9可知，Fab5+HAb5(剪接1)具有同时结合CD38和PD-L1两种抗原的活性。而经体外未剪接的混合物，以及单独的组分A(Fab5)和组分B(HAb5)不具有同时结合两种抗原的活性。

结果可以证明，利用本发明的内含肽及其含有的新型侧翼序列对进行剪接，得到的所述Fab5+HAb5(剪接1)剪接产物具备良好的双特异性抗体活性。

●剪接产物的肽图覆盖检测

肽段覆盖率是指检测到的肽段的氨基酸数量占该蛋白质总氨基酸数量的比例。

蛋白质供试品肽段覆盖率的检测，对于蛋白质类药物的一级氨基酸序列的确证，保证蛋白质类药物的高级结构的形成及维持蛋白质类药物性质都具有重要的意义。目前，对蛋白质肽段覆盖率的检测根据药物申报要求的规定，均采用质谱法进行检测。可以快速、准确、高效的完成肽段覆盖率的检测。

本实施例对蛋白质Fab5+HAb5(剪接产物1)的肽段覆盖率进行了分析，使用胰蛋白酶、胰凝乳蛋白酶和Glu-C酶分别对蛋白质Fab5+HAb5(剪接产物1)进行酶解，然后使用LC-MS/MS(XevoG2-XS QTof，waters)对酶解后的肽段样品进行分析。并使用UNIFI(1.8.2，Waters)软件对LC-MS/MS数据进行分析，根据算法结果确定了Fab5+HAb5(剪接产物1)的肽段覆盖率。

实验仪器：

1)高分辨质谱仪：XevoG2-XS QTof(Waters公司)

2)超高效液相色谱：UPLC(Acquity UPLC I-Class)(Waters公司)

材料和试剂：

1)Guanidine HCl(Sigma)

2)Urea(Bio-Rad)

3)Tris-base(Bio-Rad)

4)DTT(Bio-Rad)

5)IAM(Sigma)

6)Zeba Spin column(Pierce)

7)ACQUITY UPLC CSH C18 Column，

1.7μm，2.1mm X 150mm(Waters)

8)UNIFI(Waters)

9)胰蛋白酶(Trypsin，Promega)

10)胰凝乳蛋白酶(Chymotrypsin，Sigma)

11)Glu-C酶(Wako)

实验方法

1)胰蛋白酶、胰凝乳蛋白酶、Glu-C酶解：取适量Fab5+HAb5(剪接1)经适当前处理后分别加入胰蛋白酶、胰凝乳蛋白酶、Glu-C酶，37℃酶切20小时。

2)高效液相色谱：Fab5+HAb5(剪接产物1)经酶解处理后采超高效液相***Acquity UPLC I-Class进行分离。液相A液为0.1％FA水溶液，B液为0.1％FA乙腈溶液。Fab5+HAb5(剪接产物1)由自动进样器上样到Column，再经色谱柱分离，柱温为55℃，流速为300μl/min，TUV检测器波长为214nm。相关液相梯度如表37。

表37 高效液相色谱A、B溶液比例

	时间/min	A液比例(％)	B液比例(％)
1	3	98	2
2	63	60	40
3	63.1	2	98
4	66	2	98
5	66.1	98	2
6	75	98	2

3)质谱鉴定：Fab5+HAb5(剪接产物1)经超高效液相色谱脱盐及分离后用XevoG2-XS QTof质谱仪(Waters)进行质谱检测分析。分析时长：63min，检测方式：正离子，MS，扫描范围(m/z)：300-2000。

4)质谱数据处理：原始使用UNIFI(1.8.2，Waters)软件查库，主要参数如(表38)：

表38 质谱数据处理主要参数列表

实验结果和分析

在使用胰蛋白酶、胰凝乳蛋白酶、Glu-C酶分别对Fab5+HAb5(剪接产物1)进行溶液内酶解后得到的肽段样品，经过LC-MS/MS设备的分析，经过UNIFI软件对得到的原始数据进行了查库。所使用的数据库为客户提供的 Fab5+HAb5(剪接产物1)理论序列。

1)Fab5+HAb5(剪接产物1)的酶解后的BPI图谱见图10A～C。

2)胰蛋白酶、胰凝乳蛋白酶、Glu-C酶等酶解覆盖率分别为：

胰蛋白酶酶解后覆盖率100％，

胰凝乳蛋白酶酶解后覆盖率100％，

Glu-C酶酶解后覆盖率100％，

酶解后的样品经过LC-MS/MS分析后查库结果进行整合，最终得到该Fab5+HAb5(剪接1)的肽段覆盖率为100.00％。基于内含肽的剪接原理，根据本发明中获得的剪接产物分子量、双抗原夹心ELISA及肽图覆盖检测结果，可推测通过本发明获得了有效且类天然IgG结构的双特异性抗体，试验结果确认该双特异性抗体的结构是两条不同重链和两条不同轻链组合成的异二聚体IgG结构，而不是两条相同重链两条和相同轻链组合成的同二聚体IgG结构的混合物。

实施例4内含肽介导的不同IgG亚型的体外剪接

(1)组分A的序列

如表39所示，三种不同IgG亚型的组分A对应的序列为：

表39 人的IgG2，IgG3和IgG4的组分A对应的序列

如表40所示，三种不同IgG亚型的组分B对应的序列为：

表40.人的IgG2，IgG3和IgG4的组分B对应的序列

按表41中的配对与实施例2同样地进行了转染。转染条件为：质粒摩尔数比例为pTag-Ic-FSb-(B-FcIcxxx)∶pA-HIn(xxx)∶pA-L(1)＝3∶1∶1。并与上述同样地设置了阳性对照单抗。

表41 内含肽的共转染表达不同IgG亚型的配对表

经转染的细胞培养5天后取上清。对上清中的蛋白进行proteinA亲和层析，proteinA亲和层析后，通过SDS-PAGE法(加还原剂)进行考马斯亮蓝染色检测上清中的蛋白。结果示于图11。

根据结果可知，应用所述的内含肽在人IgG2，IgG3和IgG4亚型中均发生了显著剪接。A102为内含肽PhoRadA应用于人IgG2亚型的组分A和组分B的胞内表达，可在胞内发生剪接形成完整的IgG2单抗；A103为内含肽PhoRadA应用于人IgG3亚型的组分A和组分B的胞内表达，可在胞内发生剪接形成完整的IgG3单抗；A104为内含肽IMPDH-1应用于人IgG4亚型的组分A和组分 B的胞内表达，可在胞内发生剪接形成完整的IgG4单抗。

实施例5内含肽介导的绿色荧光蛋白的体外剪接

绿色荧光蛋白为EGFP(来源：UniProtKB-A0A076FL24)，其全长氨基酸序列为SEQ ID No：23，共239个氨基酸残基。将其序列分为组分A和组分B，其中(1)组分A为EGFP第1～158位氨基酸与内含肽的融合，对应的编码DNA构建至真核表达载体pcDNA3.1中，C端增加侧翼序列a、内含肽N端和终止密码子(TAA，TGA或TAG)，构建的表达质粒命名见表42；(2)组分B为EGFP第159～239位氨基酸与内含肽的融合，对应的编码DNA构建至真核表达载体pcDNA3.1中，并在其N端增加起始密码子ATG、内含肽C端和侧翼序列b，C端增加终止密码子(TAA，TGA或TAG)，构建的表达质粒命名见表43。另外构建EGFP全长蛋白编码DNA至pcDNA3.1(含终止密码子)，该质粒记命名为pEGFP。

表42 EGFP的组分A表达质粒命名

表43 EGFP的组分B表达质粒命名

将质粒pEGFP-A和pEGFP单独转染或共转染至293细胞或CHO细胞中，共转染比例为1∶1，转染方式参考实施例1，另外单独转染pEGFP至293或CHO细胞中作为阳性对照。单转或共转的每个质粒浓度均保持相同。转染48小时用流式细胞仪检测细胞的绿色荧光表达情况，具体统计见表44。

表44 转染48小时的293细胞的绿色荧光表达情况统计

转染质粒	平均荧光强度	荧光细胞比例
pEGFP	1×10^5	99％
pGFP-N1+pGFP-C1	3×10^4	57％
pGFP-N1	221	0.1％
pGFP-C1	105	0
pGFP-N2+pGFP-C2	9.9×10^4	99％
pGFP-N2	277	0.1％
pGFP-C2	146	0
pGFP-N3+pGFP-C3	1×10^4	47％

pGFP-N3	177	0
pGFP-C3	133	0
pGFP-N4+pGFP-C4	7×10^4	88％
pGFP-N4	321	0.2％
pGFP-C4	152	0
pGFP-N5+pGFP-C5	8×10^4	95％
pGFP-N5	274	0.1％
pGFP-C5	106	0
空白对照	139	0

根据以上结果可知，不同内含肽及侧翼序列均可在细胞内有效剪接绿色荧光蛋白，并形成与原绿色荧光蛋白非常相似的结构，从而产生绿色荧光。组分A或组分B单独表达均不能发出绿色荧光。

工业实用性

本发明提供了利用具备新型侧翼序列对的断裂型内含肽制备重组多肽，特别是双特异性抗体的方法。根据本发明的具备新型侧翼序列对的断裂型内含肽，可以广泛用于在医药、生物工程领域制备重组多肽，特别是抗体领域，尤其是双特异性抗体的制备。使用本发明的具备新型侧翼序列对的断裂型内含肽制备的双特异性抗体，不存在非天然的结构域，其结构与天然抗体(IgA、IgD、IgE、IgG或IgM)的结构极其相似，并具有Fc结构域。所述双特异性抗体的结构完整稳定性好，可以根据不同的IGG亚型保留或去除CDC(补体依赖的细胞毒性)或者ADCC(抗体依赖的细胞毒作用)或者ADCP(抗体依赖的细胞吞噬作用)或者FcRn(Fc受体)结合活性。

利用本发明的方法制备的双特异性抗体的体内半衰期长，免疫原性低；不引入任何形式的连接肽，抗体分子稳定性提高，在体内的免疫反应降低。利用本发明的方法制备的双特异性抗体具有与野生型IgG一致的糖基化修饰，得到更好的生物学功能，并且更加稳定，体内半衰期长；利用由内含肽进行的体外剪接方法，可以完全避免传统方法中极易出现的重链错配、轻链错配的问题。

本发明的制备双特异性抗体的方法，可以用于生产人源化的双特异性抗体，以及全人序列的双特异性抗体。利用本发明的方法制备的这样的抗体的序列与人源抗体更接近，可以有效降低免疫反应的发生。本发明的制备双特异性抗体的方法可以不受抗体亚型(IgG、IgA、IgM、IgD、IgE，以及轻链K和λ型)的限制地构建任何双特异性的抗体。

Claims

用于断裂型内含肽的侧翼序列对，其中，

所述侧翼序列对包括：侧翼序列a和侧翼序列b；所述侧翼序列a位于断裂型内含肽N端蛋白质剪接区域(In)的N端，且介于N端外显肽(En)和In之间；所述侧翼序列b位于断裂型内含肽C端蛋白质剪接区域(Ic)的C端，且介于Ic和C端外显肽(Ec)之间；

所述断裂型内含肽选自：SspDnaE、SspDnaB、MxeGyrA、MjaTFIIB、PhoVMA、TvoVMA、Gp41-1、Gp41-8、IMPDH-1或PhoRadA，

(1)所述断裂型内含肽为IMPDH-1时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失，或优选为G或D；A _-2为X或缺失，或优选为G或K；A _-1选自G或T；

B ₁为S；B ₂为I或T或S；B ₃为X或缺失；

优选地，

侧翼序列a为G、XG、XGG、DKG或DKT且侧翼序列b为SI、ST、SS、SIX、STX或SSX；

(2)所述断裂型内含肽为Gp41-8时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自N或D；A _-1选自R或K；

B ₁为S或T；B ₂为A或H；B ₃为X或缺失，或优选为V、Y或T，

优选地，

侧翼序列a为NR、XNR、DK、XDK、DR或XDR且侧翼序列b为SA或SAX；

(3)所述断裂型内含肽为SspDnaB时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自S或D；A _-1选自G或K；

B ₁为S；B ₂为I；B ₃为X或缺失，或优选为E或T，

优选地，

侧翼序列a为SG、XSG、DK、XDK，侧翼序列b为SI或SIX；

(4)所述内含肽为MjaTFIIB时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中

A _-3为X或缺失；A _-2选自T或D；A _-1选自Y；

B ₁为T；B ₂为I或H；B ₃为X或缺失，或优选为H或T；

优选地，

侧翼序列a为TY、DY、XTY或XDY，侧翼序列b为TI、TIX、TH或THX；

(5)所述断裂型内含肽为PhoRadA时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自G或D；A _-1选自K；

B ₁为T；B ₂为Q或H；B ₃为X或缺失，或优选为L或T，

优选地，

侧翼序列a为GK、XGK、DK或XDK，侧翼序列b为TQ、TH、TQX或THX；

(6)所述断裂型内含肽为TvoVMA时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自G或D；A _-1选自K；

B ₁为T；B ₂为V或H；B ₃为X或缺失，或优选为I或T，

优选地，

侧翼序列a为GK、XGK、DK或XDK，侧翼序列b为TV、TH、TVX或THX；

(7)所述断裂型内含肽为MxeGyrA时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自R或D；A _-1选自Y、K或T；

B ₁为T；B ₂为E或H；B ₃为X或缺失，或优选为A或T，

优选地，

侧翼序列a为RY、XRY、DK或XDK，侧翼序列b为TE、TH、TEX或THX；

(8)所述断裂型内含肽为PhoVMA时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自G或D；A _-1为K；

B ₁为T；B ₂为V或H；B ₃为X或缺失，或优选为I或T，

优选地，

侧翼序列a为GK、XGK、DK或XDK，侧翼序列b为TV、TH、TVX或THX；

(9)所述断裂型内含肽为Gp41-1时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自G或D；A _-1选自Y或K；

B ₁为S或T；B ₂为S或H；B ₃为X或缺失，或优选为S或T；

优选地，

侧翼序列a为GY、XGY、DK或XDK，侧翼序列b为SS、SH、SSX或SHX；

(10)所述断裂型内含肽为SspDnaE时，

侧翼序列a为A _-3A _-2A _-1，侧翼序列b为B ₁B ₂B ₃，其中：

A _-3为X或缺失；A _-2选自G或D；A _-1选自G、S或K；

B ₁为T或S；B ₂为E或H；B ₃为X或缺失，或优选为T；

优选地，

侧翼序列a为GG、XGG、GK、XGK、DK或XDK，侧翼序列b为SE、TH、SEX或THX；

其中所述X为选自：G、A、V、L、M、I、S、T、P、N、Q、F、Y、W、K、R、H、D、E、C中的任一种氨基酸。
根据权利要求1所述的用于断裂型内含肽的侧翼序列对，其中，所述断裂型内含肽与所述侧翼序列对共同使用用于进行反式剪接，

其中，

所述SspDnaE由序列为SEQ ID NO：31的In和序列为SEQ ID NO：32的Ic组成，

所述SspDnaB由序列为SEQ ID NO：33的In和序列为SEQ ID NO：34的Ic组成，

所述MxeGyrA由序列为SEQ ID NO：35的In和序列为SEQ ID NO：36的Ic组成，

所述MjaTFIIB由序列为SEQ ID NO：37的In和序列为SEQ ID NO：38的Ic组成，

所述PhoVMA由序列为SEQ ID NO：39的In和序列为SEQ ID NO：40的Ic组成，

所述TvoVMA由序列为SEQ ID NO：41的In和序列为SEQ ID NO：42的Ic组成，

所述Gp41-1由序列为SEQ ID NO：43的In和序列为SEQ ID NO：44的Ic组成，

所述Gp41-8由序列为SEQ ID NO：45的In和序列为SEQ ID NO：46的Ic组成，

所述IMPDH-1由序列为SEQ ID NO：47的In和序列为SEQ ID NO：48的Ic组成，

所述PhoRadA由序列为SEQ ID NO：49的In和序列为SEQ ID NO：50的Ic组成，

优选地，

(1)当所述断裂型内含肽为IMPDH-1时，所述侧翼序列a为XGG且侧翼序列b为SI、ST、SS；或侧翼序列a为DKG且侧翼序列b为SI、ST、SS；或侧翼序列a为DKT且侧翼序列b为SI、ST、SS；

(2)当所述断裂型内含肽为Gp41-8时，所述侧翼序列a为NR且侧翼序列b为SAV；或侧翼序列a为DK且侧翼序列b为SAV；侧翼序列a为NR且侧翼序列b为SAT；或侧翼序列a为DK且侧翼序列b为SAT；

(3)当所述断裂型内含肽为SspDnaB时，所述侧翼序列a为SG且侧翼序列b为SIE；

(4)当所述断裂型内含肽为PhoRadA时，所述侧翼序列a为GK且侧翼序列b为TQL或THT；或侧翼序列a为DK且侧翼序列b为TQL或THT；

(5)当所述断裂型内含肽为TvoVMA时，所述侧翼序列a为GK且侧翼序列b为TVI或THT；或侧翼序列a为DK且侧翼序列b为TVI或THT；

(6)当所述断裂型内含肽为MxeGyrA时，所述侧翼序列a为RY且侧翼序列b为TEA或THT；或侧翼序列a为DK且侧翼序列b为TEA或THT；

(7)当所述断裂型内含肽为MjaTFIIB时，所述侧翼序列a为TY且侧翼序列b为TIH；或侧翼序列a为TY且侧翼序列b为THT；

(8)当所述断裂型内含肽为PhoVMA时，所述侧翼序列a为GK且侧翼序列b为TVI或THT；或侧翼序列a为DK且侧翼序列b为TVI或THT；

(9)当所述断裂型内含肽为Gp41-1时，所述侧翼序列a为GY且侧翼序列b为SSS或SHT；或侧翼序列a为DK且侧翼序列b为SSS或SHT；

(10)当所述断裂型内含肽为SspDnaE时，所述侧翼序列a为GG且侧翼序列b为SET或THT；或侧翼序列a为GK且侧翼序列b为SET或THT；或侧翼序列a为DK且侧翼序列b为SET或THT；

其中所述X为选自：G、A、V、L、M、I、S、T、P、N、Q、F、Y、W、K、R、H、D、E、C中的任一种氨基酸。
重组多肽，其由利用权利要求1或2所述的用于断裂型内含肽的侧翼序列对进行反式剪接而获得。
根据权利要求3所述的重组多肽，其中，所述重组多肽由组分A与组分B经过反式剪接得到；

在组分A中，所述侧翼序列a的N端与En的C端连接、且所述侧翼序列a的C端与所述In连接，任选在In的C端连接有标签蛋白；

在组分B中，所述侧翼序列b的C端与Ec的N端连接、且所述侧翼序列b的N端与所述Ic连接，任选在Ic的N端连接有标签蛋白；

其中，所述En与Ec的编码序列分别来自同一蛋白的N端部分和C端部分，

优选地，所述标签蛋白选自SEQ ID NO：24、25、26、27、28、29或30。
根据权利要求3所述的重组多肽，其中，所述重组多肽由组分A与组分B经过反式剪接得到；

在组分A中，所述侧翼序列a的N端与En的C端连接、且所述侧翼序列a的C端与所述In连接，任选在In的C端连接有标签蛋白；

在组分B中，所述侧翼序列b的C端与Ec的N端连接、且所述侧翼序列b的N端与所述Ic连接，任选在Ic的N端连接有标签蛋白；

其中，所述En与Ec的编码序列来自不同蛋白。
根据权利要求4或5所述的重组多肽，其为荧光蛋白、蛋白酶、信号肽、抗菌肽、抗体、或具备生物毒性的多肽。
根据权利要求4或5所述的重组多肽，其中，所述同一蛋白、或所述不同蛋白中的一种以上为抗体。
根据权利要求7所述的重组多肽，其中，所述抗体为天然免疫球蛋白IgG、IgM、IgA、IgD、或IgE类，或免疫球蛋白亚类：IgG1、IgG2、IgG3、IgG4、IgG5，或不同类的轻链：κ、λ；或单域抗体；或

所述抗体为全长抗体或抗体的功能片段。
根据权利要求8所述的重组多肽，其中，所述抗体的功能片段为选自：抗体重链可变区VH、抗体轻链可变区VL、抗体重链恒定区片段Fc、抗体重链恒定区1 CH1、抗体重链恒定区2 CH2、抗体重链恒定区3 CH3、抗体轻链恒定区CL、或单域抗体可变区VHH中的一种或多种。
根据权利要求7所述的重组多肽，其中，所述同一蛋白、或所述不同蛋白中的一种以上针对抗原或表位A具有特异性，

所述抗原A包括：肿瘤细胞表面抗原、免疫细胞表面抗原、细胞因子、细胞因子受体、转录因子、膜蛋白、肌动蛋白、病毒、细菌、内毒素、FIXa、FX、CD3、SLAMF7、CD38、BCMA、CD20、CD16、CEA、PD-L1、PD-1、CTLA-4、TIGIT、LAG-3、VEGF、B7-H3、Claudin18.2、TGF-β、Her2、IL-10、Siglec-15、Ras、C-myc，所述表位A为所述抗原A的免疫原性表位。
根据权利要求10所述的重组多肽，其中，所述同一蛋白、或所述不同蛋白中的一种以上针对与抗原或表位A不同的抗原或表位B具有特异性，

所述抗原B包括：肿瘤细胞表面抗原、免疫细胞表面抗原、细胞因子、细胞因子受体、转录因子、膜蛋白、肌动蛋白、病毒、细菌、内毒素、FIXa、FX、CD3、SLAMF7、CD38、BCMA、CD20、CD16、CEA、PD-L1、PD-1、CTLA-4、TIGIT、LAG-3、VEGF、B7-H3、Claudin18.2、TGF-β、Her2、IL-10、Siglec-15、Ras、C-myc，所述表位B为所述抗原B的免疫原性表位。
根据权利要求11所述的重组多肽，其为双特异性抗体，可同时结合抗原或表位A和B，优选为人源化的双特异性抗体或全人序列的双特异性抗体。