CN101688200A

CN101688200A - 单链抗体的基于序列的改造和优化

Info

Publication number: CN101688200A
Application number: CN200880021937A
Authority: CN
Inventors: L·博拉斯; D·厄驰
Original assignee: Esbatech An Alcon Biomedical Research Unit LLC
Current assignee: Novartis AG
Priority date: 2007-06-25
Filing date: 2008-06-25
Publication date: 2010-03-31
Anticipated expiration: 2028-06-25
Also published as: CA2689064C; RU2010102064A; PT2164961E; DK2164961T3; EP2164961B1; CA2689064A1; AU2008267733B2; US9908945B2; CN101688200B; KR20100028053A; WO2009000098A2; ZA200908314B; JP5506670B2; HK1137035A1; US20090028848A1; KR101530723B1; SI2164961T1; JP2010532324A; NZ581470A; AU2008267733A1

Abstract

本发明提供了使用基于序列的分析和合理的策略来修饰和改善单链抗体(scFv)的结构和生物物理学性质(包括稳定性、溶解性和抗原结合亲和力)的方法。这些方法和策略可以单独或组合使用。本发明的方法还包括使用包含来自实验筛选的scFv抗体文库的scFv序列的数据库，所述抗体因具有优良溶解性和稳定性而被选择。本发明还提供了在一般方法中将在这些所选择的抗体中发现的性质用于重塑scFv抗体的方法，以改善单链抗体片段的稳定性和溶解性性质。

Description

单链抗体的基于序列的改造和优化

相关申请

本申请要求于2007年6月25日提交的美国临时申请序列号60/937,112的优先权，所述美国临时申请的名称为“Sequence BasedEngineering and Optimization of Single Chain Antibodies”。本申请还要求于2008年3月12日提交的美国临时申请序列号61/069,057的优先权，所述美国临时申请的名称为“Sequence Based Engineering andOptimization of Single Chain Antibodies”。

发明背景

已证明抗体在癌症、自身免疫疾病和其他病症的治疗中是非常有效和成功的治疗剂。尽管一般已在临床上使用全长抗体，但存在使用抗体片段可以提供的许多优点，例如增加组织穿透力、与增加其他效应子功能的能力结合的Fc效应子功能的不存在、和由较短的全身体内半衰期导致的较少全身性副作用的可能性。抗体片段的药代动力学性质表明，它们可能特别良好地适合于局部治疗方法。此外，抗体片段在特定表达***中可以比全长抗体更容易产生。

一个类型的抗体片段是单链抗体(scFv)，其由经由接头序列缀合的轻链可变结构域(V_L)与重链可变结构域(V_H)组成。因此，scFv缺乏所有抗体恒定区结构域，并且先前的可变/恒定结构域界面的氨基酸残基(界面残基)变成溶剂暴露的。scFv可以通过已建立的重组改造技术由全长抗体(例如IgG分子)制备。然而，全长抗体转变成scFv通常导致蛋白质的弱稳定性和溶解性、低产量和高聚集趋势，这增加免疫原性危险。

因此，已尝试改善scFv的性质例如溶解性和稳定性。例如，Nieba，L.等人(Prot.Eng.(1997)10：435-444)选择已知为界面残基的3个氨基酸残基且使其突变。他们观察到突变的scFv在细菌中周质表达增加，以及热诱导聚集速率减小，尽管热力学稳定性和溶解性未显著改变。其中对scFv内的特定氨基酸残基进行定点诱变的其他研究也已得到报告(参见例如，Tan，P.H.等人(1988)Biophys.J.75：1473-1482；

A.和Plückthun，A.(1998)Biochem.37：13120-13127；

A.和Plückthun，A.(1999)Biochem.38：8739-8750)。在这些各种研究中，选择用于诱变的氨基酸残基基于其在scFv结构内的已知位置(例如，来自分子建模研究)进行选择。

在另一种方法中，将来自表达极弱的scFv的互补决定区(CDR)移植到已证实具有有利性质的scFv的构架区内(Jung，S.和Plückthun，A.(1997)Prot.Eng.10：959-966)。所得到的scFv显示改善的可溶性表达和热力学稳定性。

改造scFv以改善功能性质中的进展在例如

，A.和Plückthun，A.(2001)J.Mol.Biol.305：989-1010中综述。然而，仍需要允许合理设计具有优良功能性质的scFv的新方法，特别是帮助技术人员选择潜在有问题的氨基酸残基用于改造的方法。

发明概述

本发明提供了允许使用基于序列的分析鉴定scFv序列中对于稳定性和/或溶解性潜在有问题的氨基酸残基的方法。此外，可选择根据本发明的方法鉴定的氨基酸残基进行突变，可制备已进行突变的经改造的scFv并且就提高的功能性质(例如稳定性和/或溶解性)对其进行筛选。在特别优选的实施方案中，本发明提供了其中将功能性选择的(functionally-selected)scFv的数据库用于鉴定氨基酸残基位置的方法，所述氨基酸残基位置比种系和/或成熟抗体免疫球蛋白序列中相应的位置更加耐受或更不耐受变异性，从而表明此类鉴定的残基位置可适合用于改造以提高scFv功能性例如稳定性和/或溶解性。因此，本发明提供了基于功能性选择的scFv序列的数据库的使用的“功能共有区(functional consensus)”方法并证明了其优点。

在其他优选实施方案中，本发明提供了用于鉴定免疫结合剂(immunobinder)中目的氨基酸位置(例如，通过将具有至少一个期望的性质的scFv序列(如使用QC测定法选择的)的数据库与成熟抗体序列的数据库例如Kabat数据库比较而鉴定的氨基酸位置)上要置换的优选氨基酸残基(或备选地，要排除的氨基酸残基)的方法。因此本发明还提供了用于选择特定氨基酸残基的“富集/排除”法。此外，本发明提供了通过突变使用本文中描述的“功能共有区”方法鉴定的特定构架氨基酸位置来对免疫结合剂(例如，scFv、全长免疫球蛋白、Fab片段、单结构域抗体(例如，Dab)和纳米抗体)进行改造的方法。在优选实施方案中，通过用使用本文中描述的“富集/排除”分析法发现为“富集的”残基的残基置换现有的氨基酸残基来突变构架氨基酸位置。

在一个方面，本发明提供了鉴定单链抗体(scFv)中用于突变的氨基酸位置的方法，所述scFv具有V_H和V_L氨基酸序列，该方法包括：

a)将scFv V_H、V_L或V_H和V_L氨基酸序列输入数据库(所述数据库包含大量抗体V_H、V_L或V_H和V_L氨基酸序列)以使scFv V_H、V_L或V_H和V_L氨基酸序列与数据库的抗体V_H、V_L或V_H和V_L氨基酸序列进行比对；

b)将scFv V_H或V_L氨基酸序列中的氨基酸位置与数据库的抗体V_H或V_L氨基酸序列中相应的位置相比较；

c)确定scFv V_H或V_L氨基酸序列中的氨基酸位置是否被在数据库的抗体V_H或V_L氨基酸序列中的相应位置上保守的氨基酸残基占据；和

d)当氨基酸位置被在数据库的抗体V_H或V_L氨基酸序列中的相应位置上不保守的氨基酸残基占据时，将scFv V_H或V_L氨基酸序列中的该氨基酸位置鉴定为用于突变的氨基酸位置。

该方法还可包括突变scFv V_H或V_L氨基酸序列中经鉴定用于突变的氨基酸位置。例如，可用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上保守的氨基酸残基置换经鉴定用于突变的氨基酸位置。另外或备选地，可通过随机诱变或通过偏好性诱变(biased mutagenesis)突变经鉴定用于突变的氨基酸位置以产生突变的scFv的文库，然后筛选突变的scFv的文库，选择具有至少一个提高的功能性质的scFv(例如，通过使用酵母质量控制***(QC-***)筛选文库)。

各种类型的数据库可用于本发明的方法。例如，在一个实施方案中，数据库的抗体V_H、V_L或V_H和V_L氨基酸序列是种系抗体V_H、V_L或V_H和V_L氨基酸序列。在另一个实施方案中，数据库的抗体V_H、V_L或V_H和V_L氨基酸序列是重排的亲和力成熟的抗体V_H、V_L或V_H和V_L氨基酸序列。在另一个特别优选的实施方案中，数据库的抗体V_H、V_L或V_H和V_L氨基酸序列是因具有至少一个期望的功能性质(例如scFv的稳定性或scFv的溶解性)而被选择的scFv抗体V_H、V_L或V_H和V_L氨基酸序列。在另一个实施方案中，多于一个数据库可用于比较目的。例如，在特别优选的实施方案中，使用因具有至少一个期望的功能性质而被选择的scFv的数据库以及一个或多个种系数据库或重排的亲和力成熟的抗体数据库，其中将来自scFv数据库的序列比较结果与来自其他数据库的结果相比较。

本发明的方法可用于分析例如scFv的V_H区、scFv的V_L区或两者。

虽然本发明的方法可用于分析目的scFv内的单个目的氨基酸位置，但更优选该方法用于分析沿着scFv序列的多个氨基酸位置。因此，在优选实施方案中，在该方法的步骤b)中，将scFv V_H或V_L氨基酸序列中的多个氨基酸位置与数据库的抗体V_H或V_L氨基酸序列中的相应位置相比较。例如，在优选实施方案中，将scFv V_H、V_L或V_H和V_L氨基酸序列中的各构架位置(framework position)与数据库的抗体V_H、V_L或V_H和V_L氨基酸序列中的各相应构架位置相比较。另外地或备选地，可分析scFv的一个或多个CDR中的一个或多个位置。在另一个实施方案中，将scFv V_H、V_L或V_H和V_L氨基酸序列中的各氨基酸位置与数据库的抗体V_H、V_L或V_H和V_L氨基酸序列中的各相应的氨基酸位置相比较。

在数据库的序列之间“保守”的氨基酸位置可被一种或多种特定类型的氨基酸残基占据。例如，在一个实施方案中，“保守的”位置被在该位置以极高频率出现的一个特定氨基酸残基占据。即，在该方法的步骤c)中，在数据库的抗体V_H或V_L氨基酸序列中的相应位置上保守的氨基酸残基是在数据库的抗体V_H或V_L氨基酸序列中在该位置上出现频率最高或最显著富集的氨基酸残基。在该情况下，为了产生经改造的scFv，经鉴定用于突变的氨基酸位置可用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上最频繁观察到或最显著富集的氨基酸残基进行置换。在另一个实施方案中，在数据库的序列之间“保守的”氨基酸位置可被例如：(i)疏水氨基酸残基，(ii)亲水氨基酸残基，(iii)能够形成氢键的氨基酸残基或(iv)具有形成β折叠倾向的氨基酸残基占据。即，在该方法的步骤c)中，数据库的抗体V_H或V_L氨基酸序列中的相应位置对于：(i)疏水氨基酸残基，(ii)亲水氨基酸残基，(iii)能够形成氢键的氨基酸残基或(iv)具有形成β折叠倾向的氨基酸残基是保守的。

因此，为了产生经改造的scFv，当数据库的抗体V_H或V_L氨基酸序列中的相应位置对于疏水氨基酸残基是保守的时候，scFv中经鉴定用于突变的氨基酸位置可用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上出现频率最高的疏水氨基酸残基进行置换。此外或备选地，scFv中经鉴定用于突变的氨基酸位置可用因在scFv中的该位置上为最适合的而被选择的疏水氨基酸残基(例如，基于分子建模研究，最可能保持scFv的结构和功能的疏水残基)置换。此外或备选地，scFv中经鉴定用于突变的氨基酸位置可通过定点诱变用一组疏水氨基酸残基进行置换，从而产生经改造的scFv的文库，并且最优选的置换可通过就期望的功能性质筛选文库来选择(例如，在酵母QC-***中)。

此外，为了产生经改造的scFv，当数据库的抗体V_H或V_L氨基酸序列中的相应位置对于亲水氨基酸残基是保守的时候，scFv中经鉴定用于突变的氨基酸位置可用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上出现频率最高的亲水氨基酸残基进行置换。另外或备选地，scFv中经鉴定用于突变的氨基酸位置可用因在scFv中的该位置上是最合适的而被选择的亲水氨基酸残基(例如，基于分子建模研究，最可能保持scFv的结构和功能的亲水残基)置换。另外或备选地，scFv中经鉴定用于突变的氨基酸位置可通过定点诱变用一组亲水氨基酸残基来置换，从而产生经改造的scFv文库，并且最优选的置换可通过就期望的功能性质筛选文库来选择(例如，在酵母QC-***中)。

此外，为产生经改造的scFv，当数据库的抗体V_H或V_L氨基酸序列中的相应位置对于能够形成氢键的氨基酸残基是保守的时候，scFv中经鉴定用于突变的氨基酸位置可用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上出现频率最高的能够形成氢键的氨基酸残基进行置换。另外或备选地，scFv中经鉴定用于突变的氨基酸位置可用因在scFv中的该位置上是最合适的而被选择的能够形成氢键的氨基酸残基(例如，基于分子建模研究，最可能保持scFv的结构和功能的残基)置换。另外或备选地，scFv中经鉴定用于突变的氨基酸位置可通过定点诱变用一组能够形成氢键的氨基酸残基进行置换，从而产生经改造的scFv的文库，并且最优选的置换可通过就期望的功能性质筛选文库来选择(例如，在酵母QC-***中)。

此外，为产生经改造的scFv，当数据库的抗体V_H或V_L氨基酸序列中的相应位置对于具有形成β折叠的倾向的氨基酸残基是保守的时候，scFv中的经鉴定用于突变的氨基酸位置可用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上出现频率最高的具有形成β折叠的倾向的氨基酸残基进行置换。另外或备选地，scFv中经鉴定用于突变的氨基酸位置可用因在scFv中的该位置上是最合适的而被选择的具有形成β折叠的倾向的氨基酸残基(例如，基于分子建模研究，最可能保持scFv的结构和功能的残基)置换。另外或备选地，scFv中经鉴定用于突变的氨基酸位置可通过定点诱变用一组具有形成β折叠的倾向的氨基酸残基进行置换，从而产生经改造的scFv的文库，并且最优选的置换可通过就期望的功能性质筛选文库来选择(例如，在酵母QC-***中)。

在另一个实施方案中，可使用数据库进行用于鉴定scFv中用于突变的氨基酸位置的本发明的方法，所述数据库是其中只有与scFv抗体V_H、V_L或V_H和V_L氨基酸序列具有高度相似性的抗体V_H、V_L或V_H和VL氨基酸序列包括在该数据库中的受限制的数据库。

在优选实施方案中，为了定量分析的氨基酸位置(即，数据库的抗体V_H或V_L氨基酸序列中的“相应位置”)的保守性，使用辛普森指数(Simpson′s Index)给氨基酸位置的保守程度赋值。

本发明的方法还可用于检查scFv序列中的成对的氨基酸位置，以鉴定彼此共变的氨基酸位置，这样此类共变对位置的一个或两个位置可被鉴定用于突变。因此，在另一个实施方案中，本发明提供了这样的方法，其包括：

a)对数据库的抗体V_H或V_L氨基酸序列进行协方差分析(covariance analysis)以鉴定氨基酸位置的共变对；

b)将氨基酸位置的共变对与scFv V_H或V_L氨基酸序列中的相应位置相比较；

c)确定scFv V_H或V_L氨基酸序列中的相应位置是否被在数据库的抗体V_H或V_L氨基酸序列中的氨基酸位置的共变对上保守的氨基酸残基占据；和

d)当scFv中的相应位置中的一个或两个位置被在数据库的抗体V_H或V_L氨基酸序列中的氨基酸位置的共变对上不保守的氨基酸残基占据时，将scFv V_H或V_L氨基酸序列中的相应位置中的一个或两个位置鉴定为用于突变的氨基酸位置。

该协方差分析还可与单个氨基酸位置的分析组合，这样具有步骤a)-d)的上述鉴定scFv中用于突变的氨基酸位置的方法可进一步包括步骤：

e)对数据库的抗体V_H或V_L氨基酸序列进行协方差分析以鉴定氨基酸位置的共变对；

f)将氨基酸位置的共变对与scFv V_H或V_L氨基酸序列中的相应位置相比较；

g)确定scFv V_H或V_L氨基酸序列中的相应位置是否被在数据库的抗体V_H或V_L氨基酸序列中的氨基酸位置的共变对上保守的氨基酸残基占据；和

h)当scFv中的相应位置中的一个或两个位置被在数据库的抗体V_H或V_L氨基酸序列中的氨基酸位置的共变对上不保守的氨基酸残基占据时，将scFv V_H或V_L氨基酸序列中的相应位置中的一个或两个位置鉴定为用于突变的氨基酸位置。

可将协方差分析法用于单个共变对或，备选地，可在数据库的抗体V_H或V_L氨基酸序列中鉴定多个氨基酸位置共变对并且将其与scFvV_H或V_L氨基酸序列中的相应位置相比较。

该方法还可包括突变scFv中的相应位置中的一个或两个位置，所述位置被在数据库的抗体V_H或V_L氨基酸序列中的氨基酸位置的共变对上不保守的氨基酸残基占据。例如，在一个实施方案中，scFv中的相应位置中的一个位置(所述位置被在氨基酸位置的共变对上不保守的氨基酸残基占据)用在共变对氨基酸位置上出现频率最高的氨基酸残基进行置换。在另一个实施方案中，scFv中的两个相应位置(所述位置都被在氨基酸位置的共变对上不保守的氨基酸残基占据)用在共变对氨基酸位置上出现频率最高的氨基酸残基进行置换。

可将用于鉴定scFv序列中用于突变的氨基酸位置的本发明的基于序列的方法与允许进行scFv的结构分析的其他方法组合。例如，在一个实施方案中，可将基于序列的方法与分子建模法组合来进一步分析scFv的结构。因此，在一个实施方案中，具有步骤a)-d)的上述方法还可包括例如步骤：

e)使scFv V_H、V_L或V_H和V_L氨基酸序列经历分子建模；和

f)在scFv V_H、V_L或V_H和V_L氨基酸序列中鉴定至少一个另外的氨基酸位置用于突变。

该方法还可包括突变scFv V_H、V_L或V_H和V_L氨基酸序列中的该至少一个通过分子建模鉴定用于突变的另外的氨基酸位置。

在另一个方面，本发明涉及根据本发明的方法制备的scFv组合物，其中在经鉴定用于突变的一个或多个氨基酸位置上进行了一个或多个突变。还提供了药物制剂，该制剂通常包含scFv组合物和药学上可接受的载体。

在另一个方面，本发明提供了在单链抗体(scFv)中鉴定一个或多个用于突变的构架氨基酸位置的方法，所述scFv具有V_H和V_L氨基酸序列，该方法包括：

a)提供V_H、V_L或V_H和V_L氨基酸序列的第一数据库；

b)提供因具有至少一个期望的功能性质而被选择的scFv抗体V_H、V_L或V_H和V_L氨基酸序列的第二数据库；

c)确定第一数据库的各构架位置和第二数据库的各构架位置上的氨基酸变异性(variability)；

d)鉴定在其上氨基酸变异性的程度在第一数据库和第二数据库之间不同的一个或多个构架位置，从而鉴定单链抗体(scFv)中用于突变的一个或多个构架氨基酸位置。

优选，各构架位置上的氨基酸变异性通过使用辛普森指数给保守程度赋值来测定。在一个实施方案中，基于与第一数据库相比在第二数据库中具有更低的辛普森指数(SI)值的一个或多个构架氨基酸位置鉴定用于突变的一个或多个构架氨基酸位置。在另一个实施方案中，基于与第一数据库(例如，种系数据库)相比在第二数据库中具有更高的辛普森指数值的一个或多个构架氨基酸位置鉴定用于突变的一个或多个构架氨基酸位置。在一个优选实施方案中，第二数据库(例如，QC数据库)的氨基酸位置具有比第一数据库(例如，Kabat数据库)中的相应的氨基酸位置的SI值低至少0.01，和更优选低至少0.05(例如，0.06、0.07、0.08、0.09或0.1)的SI值。在更优选实施方案中，第二数据库的氨基酸位置具有比第一数据库中的相应的氨基酸位置的SI值低至少0.1(例如，低0.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45或0.5)的SI值。

在另一个方面，本发明提供了鉴定用于免疫结合剂中的置换的优选氨基酸残基的方法，该方法包括：

a)提供已分组的V_H或V_L氨基酸序列(例如按照Kabat家族亚型分组的种系和/或成熟抗体序列)的第一数据库；

b)提供因具有至少一个期望的功能性质而被选择(例如，根据QC测定)的已分组的scFv抗体V_H或V_L氨基酸序列的第二数据库；

c)测定第一数据库的构架位置和第二数据库的相应构架位置上的氨基酸残基的氨基酸频率；

d)当相对于第一数据库，氨基酸残基以更高的频率在第二数据库中发生(即，富集的残基)时，将该氨基酸残基鉴定为用于免疫结合剂的相应氨基酸位置上的置换的优选氨基酸残基。

在另一个方面，本发明提供了鉴定待从免疫结合剂排除的氨基酸残基的方法，该方法包括：

d)当相对于第一数据库，氨基酸残基以更低的频率在第二数据库中发生时，将该氨基酸残基鉴定为用于免疫结合剂的相应氨基酸位置上的置换的不利氨基酸残基，其中所述氨基酸残基的类型是不利氨基酸残基(即，被排除的残基)。在某些优选实施方案中，如果富集因子(EF)小于1，则鉴定了不利的氨基酸残基。

在某些实施方案中，第一数据库包含种系V_H、V_L或V_H和V_L氨基酸序列。在其他实施方案中，第一数据库由种系V_H、V_L或V_H和V_L氨基酸序列组成。在另一个实施方案中，第一数据库包含成熟V_H、V_L或V_H和V_L氨基酸序列。在另一个实施方案中，第一数据库由成熟V_H、V_L或V_H和V_L氨基酸序列组成。在示例性实施方案中，成熟V_H、V_L或V_H和V_L氨基酸序列来自Kabat数据库(KDB)。

在某些实施方案中，第二数据库包含根据QC测定选择的scFv抗体V_H、V_L或V_H和V_L氨基酸序列。在另一个实施方案中，第二数据库由根据QC测定选择的scFv抗体V_H、V_L或V_H和V_L氨基酸序列组成。

在一个实施方案中，期望的功能性质是提高的稳定性。在另一个实施方案中，期望的功能性质是提高的溶解性。在另一个实施方案中，期望的功能性质是非聚集性(non-aggregation)。在另一个实施方案中，期望的功能性质是表达的提高(例如，在原核细胞中)。在另一个实施方案中，功能性质是在内含体纯化方法后重折叠产量的提高。在某些实施方案中，期望的功能性质不是抗原结合亲和力的提高。在另一个实施方案中，获得一种或多种期望的功能的组合。

在另一个方面，本发明提供了改造免疫结合剂的方法，该方法包括：

a)在免疫结合剂内选择一个或多个氨基酸位置用于突变；和

b)使选择用于突变的一个或多个氨基酸位置突变，

其中如果选择用于突变的一个或多个氨基酸位置是重链氨基酸位置，那么所述氨基酸位置选自使用AHo编号的位置1、6、7、10、12、13、14、19、20、21、45、47、50、55、77、78、82、86、87、89、90、92、95、98、103和107(使用Kabat编号的氨基酸位置1、6、7、9、11、12、13、18、19、20、38、40、43、48、66、67、71、75、76、78、79、81、82b、84、89和93)，和

其中如果选择用于突变的一个或多个氨基酸位置是轻链氨基酸位置，那么所述氨基酸位置选自使用AHo编号的位置1、2、3、4、7、10、11、12、14、18、20、24、46、47、50、53、56、57、74、82、91、92、94、101和103(使用Kabat编号的氨基酸位置1、2、3、4、7、10、11、12、14、18、20、24、38、39、42、45、48、49、58、66、73、74、76、83和85)。

在一个实施方案中，本发明提供了改造免疫结合剂的方法，所述方法包括：

a)在免疫结合剂内选择一个或多个氨基酸位置用于突变；和

b)使选择用于突变的一个或多个氨基酸位置突变，其中选择用于突变的一个或多个氨基酸位置选自：

(i)使用AHo编号的VH3的氨基酸位置1、6、7、89和103(使用Kabat编号的氨基酸位置1、6、7、78和89)；

(ii)使用AHo编号的VH1a的氨基酸位置1、6、12、13、14、19、21、90、92、95和98(使用Kabat编号的氨基酸位置1、6、11、12、13、18、20、79、81、82b和84)；

(iii)使用AHo编号的VH1b的氨基酸位置1、10、12、13、14、20、21、45、47、50、55、77、78、82、86、87和107(使用Kabat编号的氨基酸位置1、9、11、12、13、19、20、38、40、43、48、66、67、71、75、76和93)；

(iv)使用AHo编号的Vκ1的氨基酸位置1、3、4、24、47、50、57、91和103(使用Kabat编号的氨基酸位置1、3、4、24、39、42、49、73和85)；

(v)使用AHo编号的Vκ3的氨基酸位置2、3、10、12、18、20、56、74、94、101和103(使用Kabat编号的氨基酸位置2、3、10、12、18、20、48、58、76、83和85)；和

(vi)使用AHo编号的Vλ1的氨基酸位置1、2、4、7、11、14、46、53、82、92和103(使用Kabat编号的氨基酸位置1、2、4、7、11、14、38、45、66、74和85)。

在另一个实施方案中，突变进一步包括一个或多个(优选所有)选自使用AHo编号的氨基酸位置12、13和144(使用Kabat编号的氨基酸位置12、85和103)的重链氨基酸位置的链置换。

在某些优选实施方案中，将选择用于突变的一个或多个氨基酸位置突变成在因具有至少一个期望的功能性质而被选择(例如，在酵母QC-***中)的抗体序列中的相应氨基酸位置上发现的氨基酸残基。在另一个实施方案中，将选择用于突变的一个或多个氨基酸位置突变成按照本发明的富集/排除分析法鉴定的氨基酸残基(例如，“富集的氨基酸残基”)。

优选，免疫结合剂是scFv，但其他免疫结合剂例如全长免疫球蛋白和其他抗体片段(例如，Fab或Dab)也可按照该方法进行改造。本发明还包括按照改造方法制备的免疫结合剂以及包含所述免疫结合剂和药学上可接受的载体的组合物。

附图简述

当考虑本文的下列详细描述时，本发明将得到更好地理解，并且除上文所述的那些外的目的将变得显而易见。此种描述参考附图，其中：

图1是概括根据本发明的方法的scFv的一般的基于序列的分析的流程图。

在第一个步骤中，提供了待在溶解性和稳定性方面进行改善的scFv的序列(框1)，其随后与抗体序列数据库进行比较(框2)，例如开放源种系序列数据库(例如，Vbase，IMGT；框3)、开放源成熟抗体序列数据库(例如，KDB；框4)或全长人稳定和可溶scFv片段的数据库(例如，QC；框5)。

应用例如框3中描述的开放源种系序列数据库允许鉴定高度保守的位置，其在进化过程中进行选择，并且因此被认为促成全长抗体背景中的可变结构域的稳定性(框3’)。针对开放源成熟抗体序列数据库4的比较允许鉴定这样的模式，其代表不依赖于各自的CDR的稳定性、溶解性和/或结合的改善(框4’)。此外，针对全长人稳定和可溶scFv片段的数据库(框5)的比较导致鉴定对于稳定性和/或溶解性关键的残基(特别是在scFv形式中)，以及鉴定这样的模式，其代表特别是在scFv形式，例如VL和VH组合中不依赖于各自的CDR的稳定性、溶解性和/或结合的改善(框5’)。

在下一个步骤中(框6)，用各个数据库中鉴定的最频繁的合适氨基酸置换关键残基。

最后(框7)，可以在酵母QC***中进行关键残基的随机或偏好性诱变并且随后就改善的稳定性和/或溶解性进行筛选。突变体可以再次经历上文描述的操作(至框2的箭头)。

图2是用于scFv的基于序列的分析的示例性多步骤方法的流程图。

在第一个步骤中(框1)，基于生物信息学工具提供的结果，通过比较每个位置处不同氨基酸的出现情况，测定每一个残基在构架中的频率。在第二个步骤中，例如通过使用用式D＝∑ni(ni-1)/N(N-1)计算的辛普森(Simpson′s)指数，定义每个位置处的保守程度。在第三个步骤中，测定了使总体自由能降到最低的最佳置换(例如，通过应用玻尔兹曼(Boltzmann′s)定律：ΔΔGth＝-RTln(f亲本/f共有区))。最后(步骤4)，测定潜在的稳定性突变的作用。为了这个目的，可以考虑因素例如局部和非局部相互作用、规范残基(canonical residue)、界面、暴露程度和β-转角倾向。

图3是用于在酵母中选择稳定和可溶scFv的示例性质量控制(QC)***的示意图。利用这个***，通过诱导型报告构建体的存在(所述构建体的表达依赖于稳定和可溶scFv-AD-Gal 11p融合蛋白的存在)选择在还原环境中能够表达稳定和可溶scFv的宿主细胞。融合蛋白与Gal4(1-100)的相互作用形成激活可选标记的表达的功能转录因子(参见图3A)。不稳定和/或不溶性scFv无法形成功能转录因子并且诱导可选标记的表达，并且因此从选择中排除(图3B)。即使在其中二硫键不折叠的还原条件下，所选择的scFv也能够获得稳定和可溶的蛋白质折叠，而不稳定和/或不溶性scFv趋于去折叠、聚集和/或降解。在氧化条件下，所选择的scFv仍展现优良的溶解性和稳定性特征。

图4是另一个示例性质量控制(QC)***的示意图。用于选择可溶和稳定scFv的总体概念与图3描述的相同，然而，在这个形式中，scFv与包含活化结构域(AD)和DNA结合结构域(DBD)的功能转录因子直接融合。图4A描述了示例性可溶和稳定scFv，其当与功能转录因子融合时，不阻碍可选标记的转录。相比之下，图4B描述了其中不稳定scFv与转录因子融合而产生无功能融合构建体的情形，所述构建体无法激活可选标记的转录。

图5是体细胞突变前在天然种系序列内的特定构架(FW)位置处(图5A)，和在QC***中选择的体细胞突变后在成熟抗体序列内的相应FW位置处(图5B)的变异性分析的示意图。可以赋予种系和QC序列内分别的FW位置(例如，高度可变构架残基(“hvFR”))不同的变异性值(即，分别为“G”和“Q”值)。如果对于特定位置G＞Q，那么在那个位置处存在有限数目的合适的稳定FW残基。如果对于特定位置G＜Q，那么这可能表明该残基已就最佳溶解性和稳定性进行了天然选择。

图6描述了在25-95℃下的热诱导胁迫后对于ESBA105变体观察到的变性曲线图。虚线表示具有至种系共有残基的回复突变(V3Q、R47K或V103T)的ESBA-105变体。实线表示包含通过本发明的方法鉴定的优选置换的变体(QC11.2、QC15.2和QC23.2)。

图7描述了包含共有序列回复突变(S-2、D-2、D-3)、至丙氨酸(D-1)或QC残基(QC7.1、QC11.2、QC15.2、QC23.2)的突变的一组ESBA105变体的热稳定性的比较。提供了每种变体的热稳定性(以任意去折叠单位表示)。

图8描述了在25-95℃下的热诱导胁迫后对于ESBA212变体观察到的变性曲线图。虚线表示具有至种系共有残基的回复突变(V3Q或R47K)的ESBA-212变体。实线表示亲本ESBA212分子。

图9描述了野生型ESBA105及其可溶性变体的PEG沉淀溶解度曲线。

图10描述了如在广泛温度范围(25-96℃)下的热攻击后测量的野生型ESBA105及其可溶性变体的热变性曲线图。

图11描述了SDS-PAGE凝胶，其显示了在热胁迫条件下温育2周后各种ESBA105可溶性突变体的降解行为。

发明详述

本发明涉及用于免疫结合剂性质，特别地scFv性质(包括但不限于稳定性、溶解性和亲和力)的基于序列的改造和优化的方法。更具体地，本发明公开了使用抗体序列分析鉴定scFv中待突变的氨基酸位置来优化scFv抗体，从而提高scFv的一个或多个物理性质的方法。本发明还涉及按照本发明的方法产生的经改造的免疫结合剂例如scFv。

本发明至少部分基于抗体序列的多个数据库中的各重链和轻链构架位置上的氨基酸频率的分析。特别地，已将种系和/或成熟抗体数据库的频率分析与因具有期望的功能性质而被选择的scFv序列的数据库的频率分析相比较。通过给各构架位置的变异性程度赋值(例如，通过使用辛普森指数)和通过比较不同类型的抗体序列数据库中的各构架位置上的变异性程度，现已能够鉴定对于scFv的功能性质(例如，稳定性、溶解性)是重要的构架位置。这现允许对构架氨基酸位置定义“功能共有区”，其中已鉴定了比种系和/或成熟抗体免疫球蛋白序列中的相应位置更耐受变异性或更不耐受变异性的构架位置。因此，本发明提供基于功能性选择的scFv序列的数据库的使用的“功能共有区”方法并证明了其优点。此外，本发明提供了通过突变使用本文中描述的“功能共有区”方法鉴定的特定构架氨基酸位置来对免疫结合剂(例如，scFv)进行改造的方法。

首先定义某些术语，这样可使本发明更容易被理解。除非另外指出，本文中使用的所有技术和科学术语具有与本发明所属领域内的技术人员通常理解的意义相同的意义。虽然与本文中描述的方法和材料相似或等同的方法和材料可用于本发明的实践或试验中，但下面描述了适当的方法和材料。本文中提及的所有公开物、专利申请、专利和其他参考资料以它们的全文通过引用合并入本文。在矛盾的情况下，以本说明书(包括定义)为准。此外，材料、方法和实施例只是举例说明性的而非限定性的。

本文中使用的术语“抗体”是免疫球蛋白的同义词。根据本发明的抗体可以是完整的免疫球蛋白或其片段，其包括免疫球蛋白的至少一个可变结构域，例如单个可变结构域，Fv(Skerra A.和Plückthun，A.(1988)Science 240：1038-41)、scFv(Bird，R.E.等人(1988)Science 242：423-26；Huston，J.S.等人(1988；Proc.Natl.Acad.Sci.USA 85：5879-83)，Fab、(Fab′)2、或本领域技术人员熟知的其他片段。

本文中使用的术语“抗体构架(antibody framework)”是指可变结构域VL或VH的一部分，其用作该可变结构域的抗原结合环的支架(Kabat，E.A.等人，(1991)Sequences of proteins of immunologicalinterest.NIH Publication 91-3242)。

本文中使用的“抗体CDR”是指抗体的互补决定区，其如KabatE.A.等人，(1991)Sequences of proteins of immunological interest.NIHPublication 91-3242)定义的由抗原结合环组成。抗体Fv片段的两个可变结构域中的每一个包含例如3个CDR。

术语“单链抗体”或“scFv”意指包含通过接头连接的抗体重链可变区(V_H)和抗体轻链可变区(V_L)的分子。此类scFv分子可具有一般结构：NH₂-V_L-接头-V_H-COOH或NH₂-V_H-接头-V_L-COOH。

如本文中所使用的，“同一性”是指两个多肽、分子之间或两个核酸之间匹配的序列。当两个进行比较的序列中的位置都被相同的碱基或氨基酸单体亚单元占据(例如，如果两个多肽的每一个中的位置都被赖氨酸占据)时，各个分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目再乘以100的函数。例如，如果两个序列的10个位置中有6个匹配，那么这两个序列具有60％的同一性。通常，在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用，例如，通过计算机程序例如Align程序(DNAstar，Inc.)方便地进行的Needleman等人(1970)J.Mol.Biol.48：443-453的方法来提供。

“相似的”序列是当比对时共有相同和相似氨基酸残基的序列，其中相似的残基是进行比对的参照序列中的相应氨基酸残基的保守置换。在这点上，参照序列中的残基的“保守置换”是用在物理或功能上与相应的参照残基相似(例如具有相似大小、形状、电荷、化学性质，包括形成共价键或氢键的能力等)的残基进行的置换。因此，“经保守置换修饰的”序列是与参照序列或野生型序列相异在于存在一个或多个保守置换的序列。两个序列之间的“百分数相似性”是包含由两个序列共有的匹配残基或保守置换的位置数目除以进行比较的位置数目再乘以100的函数。例如，如果两个序列的10个位置中有6个匹配以及10个位置中有2个包含保守置换，那么这两个序列具有80％的正相似性。

本文中使用的“氨基酸共有序列”是指可使用至少两个，优选更多的进行比对的氨基酸序列的矩阵产生的氨基酸序列(允许在比对中出现缺口)，其使得可能确定各位置上出现频率最高的氨基酸残基。共有序列是包含在各位置上出现频率最高的氨基酸的序列。如果两个或更多个氨基酸等同地出现在单个位置上，那么共有序列包括两个或所有此类氨基酸。

可在不同水平上分析蛋白质的氨基酸序列。例如，可在单个残基水平、多个残基水平、具有缺口的多个残基水平等上展示保守性或变异性。残基可展示相同残基的保守性或可在种类水平上保守。氨基酸种类的实例包括极性但不带电荷的R组(丝氨酸、苏氨酸、天冬酰胺和谷氨酰胺)；带正电荷的R组(赖氨酸、精氨酸和组氨酸)；带负电荷的R组(谷氨酸和天冬氨酸)；疏水R组(丙氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、色氨酸、缬氨酸和酪氨酸)；以及特殊氨基酸(半胱氨酸、甘氨酸和脯氨酸)。其他种类对于本领域技术人员来说是已知的并且可使用结构测定法或其他数据来定义以估量可置换性。在该意义上，可置换的氨基酸可以指可在该位置上进行置换并且保持功能保守性的任何氨基酸。

如本文中所使用的，当一个氨基酸序列(例如，第一V_H或V_L序列)与一个或多个另外的氨基酸序列(例如，数据库中的一个或多个VH或VL序列)比对时，可将一个序列(例如，第一V_H或V_L序列)中的氨基酸位置与一个或多个另外的氨基酸序列中的“相应位置”相比较。如本文中所使用的，“相应位置”表示当对序列进行最优比对时，即当序列进行比对以获得最高百分数同一性或百分数相似性时进行比较的序列中的等同位置。

如本文中所使用的，术语“抗体数据库”是指两个或更多个抗体氨基酸序列(“多个”序列)的集合，通常是指数十个、数百个或甚至数千个抗体氨基酸序列的集合。抗体数据库可存储例如抗体V_H区、抗体V_L区或两者的集合的氨基酸序列，或可存储由V_H和V_L区域组成的scFv序列的集合。优选，可将数据库存储在可检索的、固定的介质中，例如计算机上可检索的计算机程序中。在一个实施方案中，抗体数据库是包含或由种系抗体序列组成的数据库。在另一个实施方案中，抗体数据库是包含或由成熟(即，表达的)抗体序列组成的数据库(例如，成熟抗体序列的Kabat数据库，例如KBD数据库)。在另一个实施方案中，抗体数据库包含或由功能性选择的序列(例如，根据QC测定选择的序列)组成。

术语“免疫结合剂”是指分子，所述分子包含抗体的全部或部分抗原结合位置，例如重链和/或轻链可变结构域的全部或一部分，这样免疫结合剂能够特异性识别靶抗原。免疫结合剂的非限定性实例包括全长免疫球蛋白分子和scFv，以及抗体片段，包括但不限于(i)Fab片段，由V_L、V_H、C_L和C_H1结构域组成的单价片段；(ii)F(ab′)₂片段，包含通过铰链区上的二硫桥连接的两个Fab片段的二价片段，(iii)Fab′片段，其基本上是具有铰链区的一部分的Fab(参见，FUNDAMENTAL IMMUNOLOGY(Paul编辑，3.sup.rd ed.1993)；(iv)由V_H和C_H1结构域组成的Fd片段；(vi)单结构域抗体例如Dab片段(Ward等人，(1989)Nature 341：544-546)，其由V_H或V_L结构域组成，Camelid(参见Hamers-Casterman，等人，Nature 363：446-448(1993)和Dumoulin等人，Protein Science 11：500-515(2002))或Shark抗体(例如，shark Ig-NARs

)；和(vii)纳米抗体(Nanobody)，包含单个可变结构域和两个恒定结构域的重链可变区。

如本文中所使用的，术语“功能性质”是例如为了提高多肽的生产性质或治疗功效，其提高(例如相对于常规多肽)对于本领域技术人员来说是期望的和/或有利的多肽(例如，免疫结合剂)的性质。在一个实施方案中，功能性质是提高的稳定性(例如，热稳定性)。在另一个实施方案中，功能性质是提高的溶解性(例如，在细胞条件下)。在另一个实施方案中，功能性质是非聚集性。在另一个实施方案中，功能性质是表达(例如，在原核细胞中)的提高。在另一个实施方案中，功能性质是在内含体纯化方法后重折叠产量的提高。在某些实施方案中，功能性质不是抗原结合亲和力的提高。

scFv的基于序列的分析

本发明提供了用于分析scFv序列的方法，其允许鉴定scFv序列中选择用于突变的氨基酸位置。选择用于突变的氨基酸位置是经预测影响scFv的功能性质例如溶解性、稳定性和/或抗原结合的氨基酸位置，其中预测该位置上的突变提高scFv的性能。因此，本发明允许对scFv进行比简单随机突变scFv序列中的氨基酸位置更集中的改造以优化性能。

在图1的流程图中示意性地图解了scFv序列的基于序列的分析的某些方面。如该图中所示的，将待优化的scFv序列与一个或多个抗体数据库(包括由因稳定和可溶而被选择的scFv序列组成的抗体数据库)中的序列相比较。这可允许鉴定特别地scFv形式中对于稳定性和/或溶解性至关重要的残基，以及鉴定特别地在scFv形式(例如，V_L和V_H的组合)中显示不依赖于各自CDR的稳定性、溶解性和/或结合的提高的模式。在鉴定了至关重要的残基后，它们就可用例如在各自数据库中鉴定的出现频率最高的适当的氨基酸进行置换，和/或通过随机或偏好性诱变进行置换。

因此，在一个方面，本发明涉及鉴定单链抗体(scFv)中用于突变的氨基酸位置的方法，所述scFv具有V_H和V_L氨基酸序列，该方法包括：

a)将scFv V_H、V_L或V_H和V_L氨基酸序列输入包含许多抗体V_H、V_L或V_H和V_L氨基酸序列的数据库，以使scFv V_H、V_L或V_H和V_L氨基酸序列与数据库的抗体V_H、V_L或V_H和V_L氨基酸序列比对；

b)将scFv V_H或V_L氨基酸序列中的氨基酸位置与数据库的抗体V_H或V_L氨基酸序列中的相应位置相比较；

d)当氨基酸位置被在数据库的抗体V_H或V_L氨基酸序列中的相应位置上不保守的氨基酸残基占据时，将scFv V_H或V_L氨基酸序列中的氨基酸位置鉴定为用于突变的氨基酸位置。

因此，在本发明的方法中，将目的scFv的序列(即，V_H、V_L或两者的序列)与抗体数据库的序列相比较，然后确定目的scFv中的氨基酸位置是否被在数据库中的序列的相应位置上“保守的”氨基酸残基占据。如果scFv序列的氨基酸位置被在数据库的序列中的相应位置上不“保守的”氨基酸残基占据，则scFv的该氨基酸位置选择用于突变。优选，被分析的氨基酸位置是目的scFv中的构架氨基酸位置。更优选，可分析目的scFv中的每一个构架氨基酸位置。在备选的实施方案中，可分析目的scFv的一个或多个CDR中的一个或多个氨基酸位置。在另外的实施方案中，可分析目的scFv中的各氨基酸位置。

为了确定氨基酸残基在抗体数据库的序列中的特定氨基酸位置(例如，构架位置)上是否“保守”，可计算在特定位置上的保守程度。存在许多不同的本领域内已知的可定量给定的位置上的氨基酸多样性的方法，其全都可用于本发明的方法。优选，使用辛普森多样性指数计算保守程度，该指数是多样性的量度。其考虑到存在于各位置上的氨基酸的数目，以及各氨基酸的相对丰度(abundance)。辛普森指数(S.I.)代表两个随机选择的抗体序列在某些位置包含相同的氨基酸的概率。当测量保守性时，辛普森指数考虑了两个主要因素，丰富度(richness)和均匀度(evenness)。如本文中所使用的，“丰富度”是存在于特定位置上的氨基酸的不同种类的数目的量度(即，数据库中在该位置上显示的不同氨基酸残基的数目是丰富度的量度)。如本文中所使用的，“均匀度”是存在于特定位置上的氨基酸中的每一个的丰度的量度(即，数据库的序列中氨基酸残基在该位置上发生的频率是均匀度的量度)。

虽然残基丰富度独自可用作检查特定位置上的保守程度的量度，但其没有考虑存在于某些位置上的各氨基酸残基的相对频率。其对在数据库的序列中的特定位置上极少发生的氨基酸残基与对在相同位置以极高的频率发生的残基给予同样的权重。均匀度是组成位置的丰富度的不同氨基酸的相对丰度的量度。辛普森指数将两者(丰富度和均匀度)都考虑到了，从而是按照本发明定量保守程度的优选方法。特别地，在非常保守的位置上的低频率残基被认为是潜在有问题的，从而其可选择用于突变。

辛普森指数的公式为D＝∑n_i(n_i-1)/N(N-1)，其中N是调查的序列(例如，在数据库中)的总数，n_i是各氨基酸残基在被分析的位置上的频率。氨基酸事件(i)在数据库中的频率是氨基酸在数据库中发生的次数(n_i)。计数n_i本身以相对频率给出，其表示它们按照事件的总数进行了标准化。当最大多样性发生时，S.I.值是0，当最小多样性发生时，S.I.值是1。因此S.I.的范围是0至1，多样性和指数值呈负相关。

在图2中更详细地描述了概述用于分析数据库的序列中的构架氨基酸位置的多个步骤的流程图。

因此，在上述方法的优选实施方案中，使用辛普森指数给数据库的抗体V_H或V_L氨基酸序列中的相应位置的保守程度赋值。该相应位置的S.I.值可用作该位置的保守性的指标。

在其他实施方案中，将密切相关的抗体序列的可信比对(trustedalignment)(即，考虑蛋白质结构相似性的序列比对)，用于本发明以产生氨基酸的相对丰度和确定的位置的保守程度的矩阵。这些矩阵经设计用于抗体-抗体数据库比较。计算各残基的观察到的频率，并且将其与预期的频率(其基本上是数据集中各残基对于各位置的频率)相比较。

使用所述方法对给定的scFv抗体进行的分析提供了关于给定的scFv抗体中的某些位置上的生物学上允许的突变和罕见残基的信息，以及允许预测其构架中的潜在弱点。可将常规技术用于对“最佳”拟合一组氨基酸-频率数据的氨基酸置换进行工程设计(使用S.I.值和相对频率作为标准)。

上述基于序列的分析可用于scFv的V_H区域，scFv的V_L区域或两者。因此，在一个实施方案中，将scFv V_H氨基酸序列输入数据库并且与数据库的抗体V_H氨基酸序列比对。在另一个实施方案中，将scFv V_L氨基酸序列输入数据库并且与数据库的抗体V_L氨基酸序列比对。在另一个实施方案中，将scFv V_H和V_L氨基酸序列输入数据库并且与数据库的抗体V_H和V_L氨基酸序列比对。用于将一个序列与数据库中的其他序列的集合进行比对的算法在本领域内已良好地建立。将序列进行比对以获得序列之间的最高百分数同一性或相似性。

本发明的方法可用于分析scFv序列中的一个目的氨基酸位置或更优选，可用于分析多个目的氨基酸位置。因此，在上述方法的步骤b)中，可将scFv V_H或V_L氨基酸序列中的多个氨基酸位置与数据库的抗体V_H或V_L氨基酸序列中的相应位置相比较。待分析的优选位置是scFv的V_H和/或V_L序列中的构架位置(例如，可分析各VH和VL构架位置)。另外或备选地，可分析scFv的一个或多个CDR中的一个或多个位置(虽然突变CDR中的氨基酸位置可能不是优选的，因为CDR中的突变比构架区中的突变更可能影响抗原结合活性)。此外，本发明的方法允许分析scFv V_H、V_L或V_H和V_L氨基酸序列中的各氨基酸位置。

在本发明的方法中，可将目的scFv的序列与多种不同类型的抗体序列数据库的一种或多种中的序列相比较。例如，在一个实施方案中，数据库的抗体V_H、V_L或V_H和V_L氨基酸序列是种系抗体V_H、V_L或V_H和V_L氨基酸序列。在另一个实施方案中，数据库的抗体V_H、V_L或V_H和V_L氨基酸序列是重排的亲和力成熟的抗体V_H、V_L或V_H和V_L氨基酸序列。在另一个优选实施方案中，数据库的抗体V_H、V_L或V_H和V_L氨基酸序列是因具有至少一种期望的功能性质例如scFv稳定性或scFv溶解性而被选择的scFv抗体V_H、V_L或V_H和V_L氨基酸序列(下面进一步论述的)。

可从种系序列的序列比对或从天然发生的任何其他抗体序列获得、汇编和/或产生抗体序列信息。序列的来源可包括但不限于一种或多种下列数据库：

·Kabat数据库(.immuno.bme.nwu.Edu(到2007年10月为止)；Johnson和Wu(2001)Nucleic Acids Res.29：205-206；Johnson和Wu(2000)Nucleic Acids Res.28：214-218)。来自2000年的原始数据可通过在美国的FTP和在英国的镜像获得。

·Kabatman包含允许用户就序列的罕见特征检索Kabat序列和使用户能够发现对于特定抗体序列中的CDR的正则分配(canonicalassignment)的数据库。

·AAAAA网站(www.bioc.unizh.ch/antibody/(到2007年10月为止))，由Annemarie Honegger制作的提供关于抗体的序列信息和结构数据的抗体网页。

·ABG：抗体的3D结构的目录(directory)-由Antibody Group(ABG)产生的目录允许用户访问汇编在Protein Data Bank(PDB)中的抗体结构。在该目录中，各PDB条目(entry)具有至原始来源的超链接，从而使重新获得全部信息变得容易。

·ABG：小鼠VH和VK种系区段的种系基因目录，在Instituto deBiotecnologia，UNAM(National University of Mexico)的AntibodyGroup的网页的一部分。

·

国际免疫遗传学信息系

(internationalImMunoGeneTics information

)-由Marie-Paule Lefranc(UniversitéMontpellier II，CNRS)于1989年创建，IMGT是专门于人和其他脊椎动物物种的免疫***的免疫球蛋白、T细胞受体和相关蛋白质的集成知识资源。IMGT由序列数据库(IMGT/LIGM-DB，来自人和其他脊椎动物的IG和TR的综合数据库，具有完全注释的序列的翻译，IMGT/MHC-DB，IMGT/PRIMER-DB)、基因组数据库(IMGT/GENE-DB)、结构数据库(IMGT/3Dstructure-DB)、网络资源(IMGT Repertoire)组成(IMGT，the international ImMunoGeneTicsinformation

imgt.cines.fr(到2007年10月为止)；Lefranc等人(1999)Nucleic Acids Res.27：209-212；Ruiz等人(2000)NucleicAcids Res.28：219-221；Lefranc等人(2001)Nucleic Acids Res.29：207-209；Lefranc等人(2003)Nucleic Acids Res.31：307-310)。

·V BASE-从一千多个公开序列(包括目前从Genbank和EMBL数据库释放的序列)汇编的所有人种系可变区序列的综合目录。

在优选实施方案中，从scFv文库获得抗体序列信息，所述scFv文库具有已在还原性环境中就增强的稳定性和溶解性进行选择的确定的构架。更特别地，已描述了允许细胞内选择在还原性环境中具有增强的稳定性和溶解性的scFv构架的酵母质量控制(QC)-***(参见例如，PCT公开号WO 2001/48017；美国申请号2001/0024831和US2003/0096306；美国专利7,258,985和7,258,986)。在该***中，将scFv文库转化入能够表达特定的已知抗原并且只在抗原-scFv相互作用存在的情况下存活的宿主细胞。在适合抗原和scFv表达且只允许细胞在抗原-scFv相互作用存在的情况下存活的条件下培养转化的宿主细胞。因此，可分离在存活的细胞中表达的并且具有在还原性环境中是稳定的和可溶的确定的构架的scFv。因此，QC-***可用于筛选大scFv文库，从而分离具有在还原性环境中是稳定的和可溶的构架的优选scFv，并且可将这些选择的scFv的序列汇编入scFv序列数据库。然后可使用本发明的方法将这样的scFv数据库用于与其他目的scFv序列的比较目的。在PCT公开号WO 2003/097697和美国申请号20060035320中更详细地描述了之前使用QC***选择和确定的优选scFv构架序列。

原始QC-***的变型在本领域内是已知的。在一个示例性实施方案中(在图3中对其进行了示意性举例说明)，使scFv文库与Gal4酵母转录因子的激活结构域(activation domain)(AD)融合，所述激活结构域又融合至所谓的Gal11p蛋白(11p)的一部分。然后将scFv-AD-Gal11p融合构建体转化入表达Gal 4的前100个氨基酸，从而包含Gal4的DNA结合结构域(DBD；Gal4(1-100))的宿主细胞。Gal11p是已知直接结合Gal4(1-100)的点突变(参见Barberis等人，Cell，81：359(1995))。在这样的条件下培养转化的宿主细胞，所述条件适合于scFv融合蛋白表达并且只允许细胞在scFv融合蛋白足够稳定和可溶以与Gal4(1-100)相互作用，从而形成包含连接至DBD的AD的功能转录因子(图3A)的情况下存活。因此，可分离在存活的细胞中表达的且具有在还原性环境中是稳定的和可溶的确定的构架的scFv。该示例性QC***进一步描述于Auf der Maur等人，Methods，34：215-224(2004)中。

在另一个示例性实施方案中，用于本发明的方法的QC-***描述于图4中。在QC-***的该形式中，将scFv或scFv文库直接融合至功能转录因子并且在包含选择标记的酵母株系中表达。选择标记将只在功能性scFv-转录因子融合物存在的情况下被激活，这表明作为整体的构建体需要是稳定的且可溶的(图4A)。在scFv不稳定的情况下，其将形成聚集体并且最终被降解，从而也引起融合至其的转录因子降解，这样其不再能够激活选择标记的表达(参见图4B)。

在本发明的方法中，可将目的scFv的序列与抗体数据库中的所有序列相比较，或备选地只将数据库中所选择的序列部分用于比较目的。即，可将数据库只限定或限制于与目的scFv具有高百分数相似性或同一性的序列。因此，在本发明的方法的一个实施方案中，数据库是其中只有与scFv抗体V_H、V_L或V_H和V_L氨基酸序列具有高度相似性的抗体V_H、V_L或V_H和V_L氨基酸序列才被包括在数据库中的受限制的数据库。

在将目的scFv序列输入数据库并且将其与数据库中的抗体序列相比较后，分析序列信息以提供关于给定的位置的氨基酸的频率和变异性的信息和预测潜在有问题的氨基酸位置，特别地scFv的构架中潜在有问题的氨基酸位置。这样的信息还可用于设计提高scFv的性质的突变。例如，可通过用在该位置上频繁出现的亲水残基置换暴露于溶剂的疏水残基来提高抗体溶解性。

在本发明的方法中，存在许多可能类型的氨基酸残基，所述氨基酸残基在数据库的抗体序列中的特定位置上可以是“保守的”。例如，一个特定的氨基酸残基，可在该位置上以极高的频率被发现，表明该特定氨基酸残基在该特定位置上是优选的。因此，在该方法的一个实施方案中，在步骤c)中，在数据库的抗体V_H或V_L氨基酸序列中的相应位置上保守的氨基酸残基是这样的氨基酸残基，该氨基酸残基在数据库的抗体V_H或V_L氨基酸序列中的该位置上出现频率最高。在其他实施方案中，位置可以对于特定类型或种类的氨基酸残基是“保守的”(即，位置不是仅被单个特定氨基酸残基优先占据，而是被其各自为相同类型或种类的残基的几个不同氨基酸残基优先占据)。例如，在步骤c)中，数据库的抗体V_H或V_L氨基酸序列中的相应位置可对于：(i)疏水氨基酸残基、(ii)亲水氨基酸残基、(iii)能够形成氢键的氨基酸残基或(iv)具有形成β-折叠的倾向的氨基酸残基是保守的。

在方法的步骤d)中，当氨基酸位置被在数据库的抗体V_H或V_L氨基酸序列中的相应位置上不保守的氨基酸残基占据时，将scFv V_H或V_L氨基酸序列中的氨基酸位置鉴定为用于突变的氨基酸位置。存在许多可能的情况，其中将氨基酸位置鉴定为被“不保守”的氨基酸残基占据，从而将其鉴定为潜在有问题的。例如，如果数据库中的相应氨基酸位置对于疏水残基是保守的并且scFv中的位置被亲水残基占据，那么该位置在scFv中可能是潜在有问题的并且该位置可选择用于突变。同样，如果数据库中相应的氨基酸位置对于亲水残基是保守的并且scFv中的位置被疏水残基占据，那么该位置在scFv中可能是潜在有问题的，并且可选择该位置用于突变。因此，在本文公开的方法的一个优选实施方案中，疏水性氨基酸残基由亲水性残基替换，或反之亦然。在其他情况下，如果数据库中的相应氨基酸位置对于能够形成氢键或具有形成β-折叠的倾向的氨基酸残基是保守的，并且scFv中的位置分别被不能形成氢键或不具有形成β-折叠的倾向的残基占据，那么该位置在scFv中可能是潜在有问题的并且可选择该位置用于突变。因此，在本发明的方法的另一个优选实施方案中，能够形成氢键的氨基酸残基由具有形成β-折叠倾向的氨基酸残基替换，或反之亦然。

在优选实施方案中，可单独或组合地使用本发明中描述的方法以产生组合的氨基酸置换从而提高抗体单链片段的稳定性和/或溶解性。

协方差分析

本发明还涉及用于分析与数据库中的抗体序列相比scFv的序列中的协方差(covariance)的方法。共变的残基可以是例如，(i)构架区(FR)中的残基和CDR中的残基；(ii)一个CDR中的残基和另一个CDR中的残基；(iii)一个FR中的残基和另一个FR中的残基；或(iv)V_H中的残基和V_L中的残基。在抗体的三级结构中彼此相互作用的残基可共变，这样优选氨基酸残基可在共变对的两个位置上都是保守的，并且如果一个残基改变，则另一个残基也必须发生改变以维持抗体结构。用于对一组氨基酸序列进行协方差分析的方法在本领域内是已知的。例如，Choulier，L.等人(2000)Protein 41：475-484描述了将协方差分析用于人和小鼠种系Vκ和V_H序列的比对。

可将协方差分析与用于分析保守氨基酸位置(上述方法中的步骤a)-d))的上述方法组合，这样该方法还可包括步骤：

另外地或备选地，可独立地进行协方差分析，这样本发明提供了包括下列步骤的方法：

a)对数据库的抗体V_H或V_L氨基酸序列进行协方差分析以鉴定氨基酸位置的共变对；

b)将氨基酸位置的共变对与scFv V_H或V_L氨基酸序列中的相应位置比较；

本发明的协方差分析方法可用于分析一个共变对或多于一个共变对。因此，在本发明的一个实施方案中，鉴定了数据库的抗体V_H和/或V_L氨基酸序列中的多个氨基酸位置共变对，并且将其与scFv V_H和/或V_L氨基酸序列中的相应位置相比较。

该方法还可包括突变scFv中的被氨基酸残基(所述氨基酸残基在数据库的抗体V_H或V_L氨基酸序列中的氨基酸位置的共变对上是不保守的)占据的相应位置中的一个或两个位置。在一个实施方案中，用在共变对氨基酸位置上出现频率最高的氨基酸残基置换scFv中的被氨基酸残基(所述氨基酸残基在氨基酸位置的共变对上是不保守的)占据的相应位置中的一个位置。在另一个实施方案中，用在共变对氨基酸位置上出现频率最高的氨基酸残基置换scFv中的被氨基酸残基(所述氨基酸残基在氨基酸位置的共变对上是不保守的)占据的相应位置中的两个位置。

分子建模

可将用于就潜在有问题的残基分析scFv的本发明的基于序列的方法与本领域内已知的用于分析抗体结构/功能关系的其他方法组合。例如，在优选实施方案中，可将本发明的基于序列的分析方法与分子建模组合起来，鉴定另外的潜在有问题的残基。用于抗体结构包括scFv结构的计算机建模的方法和软件已在本领域中建立并且可与本发明的基于序列的方法组合。因此，在另一个实施方案中，步骤a)-d)中所示的上述基于序列的方法还包括步骤：

e)将scFv V_H、V_L或V_H和V_L氨基酸序列经历分子建模；和

f)在scFv V_H、V_L或V_H和V_L氨基酸序列中鉴定至少一个用于突变的另外的氨基酸位置。

该方法还可包括突变scFv V_H、V_L或V_H和V_L氨基酸序列中的通过分子建模鉴定用于突变的该至少一个另外的氨基酸位置。

“功能共有区”对“常规共有区(conventional consensus)”分析

在特别优选的实施方案中，在第一抗体序列数据库(例如，种系数据库(例如，Vbase和/或IMGT)或成熟抗体数据库(例如，KBD))与因具有一个或多个期望的性质而被选择的scFv的第二数据库(例如通过酵母中的QC筛选选择的scFv的数据库，即QC数据库)之间比较一个或多个构架位置上的变异性程度。如图5中所举例说明的，可将变异性值(例如，辛普森指数值)分配给第一(例如，种系)数据库中的构架位置，在图5中称为“G”值，和可将变异性值(例如，辛普森指数值)分配给第二数据库(例如，QC数据库)中的相应构架位置，在图5中称为“Q”值。当特定位置的G值大于Q值(即，在该位置种系序列的变异性比选择的scFv序列的变异性更大)时，表明在该位置上存在有限数目的稳定的scFv构架氨基酸残基，该稳定的scFv构架氨基酸残基可适合于与任何CDR一起使用。备选地，当特定位置的G值比Q值小(即，在该位置上选择的scFv序列的变异性比种系序列中的变异性更大)时，表明该特定位置在scFv中更耐受变异性，从而可代表在其上的氨基酸置换可优化scFv的稳定性和/或溶解性的位置。表A提供了在其上G大于Q或G小于Q的高可变构架残基(hvFR)和氨基酸位置的数目的一览表。如表A中所指出的，氨基酸总数目(Aa#)和高可变构架残基(hvFR)中的变异性在种系和QC-FW之间显著增加。进行分析以产生表A的序列是使用QC测定法选择的约90个scFv序列(如WO03097697中所述；本文称为“Q”)和在2007年10月从http://www.bioc.unizh.ch/antibody/Sequences/index.html处检索到的所有种系VH和VL序列(本文称为“G”)。对于表A的分析，VH和VL结构域未根据其亚型进行分组。

表A：一览表

	Aa#	G＜Q(事件的#)	G＞Q(事件的#)	X/Y	#hvFR(辛普森＜0.4)	G＜Q(事件的#)	G＞Q(事件的#)	X/Y
	Aa#	G＜Q(事件的#)	G＞Q(事件的#)	X/Y	#hvFR(辛普森＜0.4)	G＜Q(事件的#)	G＞Q(事件的#)	X/Y	V_L	108	61	11	5.5	16	13	3	4.3
V_H	116	50	18	2.8	27	22	5	4.4	V_L	108	61	11	5.5	16	13	3	4.3

考虑到上述内容，在另一个方面，本发明提供了鉴定单链抗体(scFv)中的一个或多个用于突变的构架氨基酸位置的方法，所述scFv具有V_H和V_L氨基酸序列，该方法包括：

a)提供V_H、V_L或V_H和V_L氨基酸序列(例如，种系和/或成熟抗体序列)的第一数据库；

c)测定第一数据库的各构架位置和第二数据库的各构架位置上的氨基酸变异性；

d)鉴定在其上氨基酸变异性程度在第一数据库和第二数据库之间不同的一个或多个构架位置，从而鉴定单链抗体(scFv)中用于突变的一个或多个构架氨基酸位置。

优选地，各构架位置上的氨基酸变异性通过使用辛普森指数给保守程度赋值来测定。在一个实施方案中，基于与第一数据库相比，在第二(scFv)数据库中具有更低的辛普森指数值的一个或多个构架氨基酸位置，鉴定用于突变的一个或多个构架氨基酸位置。在另一个实施方案中，基于与第一数据库(例如，种系数据库或成熟抗体数据库)相比，在第二数据库中具有更高的辛普森指数值的一个或多个构架氨基酸位置，鉴定用于突变的一个或多个构架氨基酸位置。

在下面的实施例2和3中更详细地描述了对于三个人V_H家族和三个人V_L家族的变异性分析和用于突变的残基的鉴定。

富集/排除分析

在另一个方面，本发明提供了用于在免疫结合剂中目的构架位置上选择优选氨基酸残基置换(或备选地，排除特定氨基酸置换)(例如，以提高功能性质例如稳定性和/或溶解性)的方法。本发明的方法将第一抗体序列数据库(例如，种系数据库例如Vbase和/或IMGT，或更优选，成熟抗体数据库例如Kabat数据库(KBD))中的目的构架位置上的氨基酸残基的频率与因具有一个或多个期望的性质而被选择的scFv的第二数据库(例如通过酵母中的QC筛选选择的scFv数据库，即QC数据库)中相应氨基酸位置上的氨基酸残基的频率相比较。

与使给定位置处的氨基酸残基突变成共有序列的氨基酸残基的已建立的方法形成对比，已惊奇地发现“功能共有区”方法导致具有改善的期望的功能性质的抗体。这可能是由于下述事实：在所选择的构架中显示一定程度的变异性的在自然界中高度保守的位置应能耐受随机诱变，并且表现增加的发现优于scFv形式中的天然残基的备选氨基酸的概率。此外，对罕见氨基酸的显著偏好是对某个残基的自然选择的指标。基于这两个统计指导方针，选择重链和轻链中的不同残基作为浮动位置(floating position)(耐受变异性的)或优选置换(罕见残基)。

如果相对于第一数据库，即种系数据库和/或成熟抗体数据库，某个氨基酸残基的相对频率在包含具有期望的功能特征的序列的第二数据库中增加，那么各自的残基视为在给定位置处的改善scFv的稳定性和/或溶解性的优选残基。相反，如果与第一数据库相比，某个氨基酸残基的相对频率在第二数据库中减少，那么各自的残基在该位置上在scFv形式的背景中被认为是不利的。

如下面实施例4中详细描述的，可按照它们的Kabat家族亚型(例如，Vh1b、VH3等)将来自第一数据库(例如，成熟抗体序列的数据库)的抗体序列(例如，VH或VL序列)分组。在各序列亚型(即，亚家族)中，各氨基酸残基(例如，A、V等)在各氨基酸位置上的频率测定为该亚型所有被分析的序列的百分数。对第二数据库(即，因具有一个或多个期望的性质而被选择的，例如通过QC筛选选择的scFv的数据库)的所有序列进行同样的测定。对于各亚型，在第一和第二数据库之间比较所得的各氨基酸残基类型在特定位置上的百分数(相对频率)。当某个氨基酸残基的相对频率相对于第一数据库(例如，Kabat数据库)在第二数据库(例如，QC数据库)中增加时，表示各自的残基被有利地选择(即，“富集的残基”)并且为序列提供有利的性质。相反地，当氨基酸残基的相对频率与第一数据库相比在第二数据库中减少时，表明各自的残基是不利的(即，“被排除的残基”)。因此，富集的残基对于提高免疫结合剂的功能性质(例如，稳定性和/或溶解性)是优选残基，然而优选避开被排除的残基。

鉴于前述内容，在一个实施方案中，本发明提供了鉴定用于免疫结合剂的特定位置中的置换的氨基酸残基的方法，其包括：

a)提供已分组的V_H和/或V_L氨基酸序列(例如，按照Kabat家族亚型分组的种系和/或成熟抗体序列)的第一数据库；

b)提供已分组的因具有至少一个期望的功能性质而被选择(例如，根据QC测定)的scFv抗体V_H或V_L氨基酸序列的第二数据库；

c)测定在第一数据库的构架位置和第二数据库的相应的构架位置上的氨基酸残基的氨基酸频率；

d)当氨基酸残基相对于第一数据库在第二数据库中以更高的频率发生(即，富集的残基)时，将该氨基酸残基鉴定为用于免疫结合剂的相应氨基酸位置上的置换的优选氨基酸残基。

可定量第二(scFv)数据库(例如，QC数据库)中氨基酸残基的富集度(enrichment)。例如，可测定第二数据库中残基的相对频率(RF2)与第一数据库中残基的相对频率(RF1)之间的比率。该比率(RF2∶RF1)可称为“富集因子”(EF)。因此，在某些实施方案中，如果第一和第二数据库之间氨基酸残基的相对频率的比率(在本文中，“富集因子”)是至少1(例如，1至10)，那么鉴定了步骤(d)中的氨基酸残基。在优选实施方案中，富集因子大于1.0或大约1.0(例如1.0、1.1、1.2、1.3、1.4或1.5)。在另一个优选实施方案中，富集因子是大约4.0至大约6.0(例如，4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5.0、5.1、5.2、5.3、5.4、5.5、5.6、5.7、5.8、5.9或6.0)。在另一个实施方案中，富集因子是大约6.0至大约8.0(例如，6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9、7.0、7.1、7.3、7.4、7.5、7.6、7.7、7.8、7.9或8.0)。在其他实施方案中，富集因子大于10(例如，10、100、1000、10⁴、10⁵、10⁶、10⁷、10⁸、10⁹或更大)。在某些实施方案中，可以达到无限大的富集因子。

在另一个实施方案中，本发明提供了鉴定在特定位置处待从免疫结合剂中排除的氨基酸残基的方法，该方法包括：

b)提供已分组的因具有至少一个期望的功能性质而被选择(例如，根据QC测定)的scFv抗体V_H和/或V_L氨基酸序列的第二数据库；

d)当氨基酸残基相对于第一数据库在第二数据库中以更低的频率发生时，将该氨基酸残基鉴定为用于免疫结合剂的相应氨基酸位置上的置换的不利氨基酸残基，其中所述氨基酸残基的类型是不利的氨基酸残基(即，被排除的残基)。

在某些优选实施方案中，如果富集因子(EF)小于1，则鉴定了步骤(d)(同上)中的不利氨基酸残基。

此外，本发明提供了改善免疫结合剂的方法，所述免疫结合剂具有V_H和/或V_L氨基酸序列，所述方法包括：

a)鉴定用于突变的一个或多个构架氨基酸位置；

b)鉴定用于步骤a)中鉴定的各个特定构架位置处的置换的优选氨基酸残基；和

c)使各个特定构架位置处的氨基酸残基突变成步骤b)中鉴定的优选氨基酸残基。

优选地，步骤a)通过根据本文公开的方法测定在给定的构架位置处的变异性程度(即通过使用辛普森指数给每个构架位置的保守程度赋值)来进行。优选，根据上文公开的方法鉴定适合于置换的氨基酸，其具有至少1、更优选至少4-6的富集因子。随后使用本领域已知的分子生物学方法，使免疫结合剂的对应的氨基酸残基突变成优选氨基酸残基。免疫结合剂优选是scFv抗体、全长免疫球蛋白、Fab片段、Dab或纳米抗体。

scFv的突变

在本发明的方法中，当scFv中的一个或多个氨基酸位置已鉴定为对于scFv的功能性质是潜在有问题的时候，所述方法还可包括突变scFv V_H或V_L氨基酸序列中的此类一个或多个氨基酸位置。例如，经鉴定用于突变的氨基酸位置可用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上保守或富集的氨基酸残基进行置换。

可使用在本领域中良好建立的几种可能的诱变方法之一突变经鉴定用于突变的氨基酸位置。例如，定点诱变可用于在目的氨基酸位置上进行特定的氨基酸置换。定点诱变还可用于产生一组突变的scFv，其中在目的氨基酸位置上导入了有限的氨基酸置换库集(repertoire)。

另外或备选地，可通过随机诱变或通过偏好性诱变突变经鉴定用于突变的氨基酸位置，从而产生突变的scFv文库，然后筛选突变的scFv的文库并选择scFv，优选选择具有至少一个提高的功能性质的scFv。在优选实施方案中，使用酵母质量控制-***(QC-***)(在上面更详细地描述的)筛选文库，该***允许选择在还原性环境中具有增强的稳定性和/或溶解性的scFv构架。

用于筛选scFv文库的其他适当的选择技术已在本领域内进行了描述，包括但不限于展示技术例如噬菌体展示、核糖体展示和酵母展示(Jung等人(1999)J.Mol.Biol.294：163-180；Wu等人(1999)J.Mol.Biol.294：151-162；Schier等人(1996)J.Mol.Biol.255：28-43)。

在一个实施方案中，经鉴定用于突变的氨基酸位置用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上最显著富集的氨基酸残基置换。在另一个实施方案中，数据库的抗体V_H或V_L氨基酸序列中的相应位置对于疏水氨基酸残基是保守的，并且scFv中经鉴定用于突变的氨基酸位置用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上最显著富集的疏水氨基酸残基进行置换。在另一个实施方案中，数据库的抗体V_H或V_L氨基酸序列中的相应位置对于亲水氨基酸残基是保守的，并且scFv中经鉴定用于突变的氨基酸位置用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上最显著富集的亲水氨基酸残基进行置换。在另一个实施方案中，数据库的抗体V_H或V_L氨基酸序列中的相应位置对于能够形成氢键的氨基酸残基是保守的，并且scFv中经鉴定用于突变的氨基酸位置用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上最显著富集的能够形成氢键的氨基酸残基进行置换。在另一个实施方案中，数据库的抗体V_H或V_L氨基酸序列中的相应位置对于具有形成β-折叠的倾向的氨基酸残基是保守的，并且scFv中经鉴定用于突变的氨基酸位置用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上最显著富集的具有形成β-折叠的倾向的氨基酸残基进行置换。

在一个实施方案中，选择使总自由能最小化的最佳置换作为在目的氨基酸位置上进行的突变。使总自由能最小化的最佳置换可使用玻尔兹曼定律(Boltzmann′s Law)来确定。玻尔兹曼定律的公式是ΔΔG_th＝RTln(f_亲本/f_共有区)。

潜在的稳定性突变的作用可通过检查例如局部和非局部相互作用、规范残基(canonical residue)、界面、暴露程度和β转角倾向来进一步确定。本领域内已知的分子建模方法可以用于例如进一步检查潜在的稳定性突变的作用。如果考虑一组可能的置换，则分子建模法还可用于选择“最适”氨基酸置换。

取决于特定氨基酸位置，可以进行进一步分析。例如，残基可参与重链和轻链之间的相互作用或可通过盐桥或氢键与其他残基相互作用。在这些情况下，可能需要特别的分析。在本发明的另一个实施方案中，可将对于稳定性潜在有问题的残基改变成与其在共变对中的配对物(counterpart)相容的残基。备选地，可对配对残基进行突变以与最初鉴定为有问题的氨基酸相容。

溶解性的优化

scFv抗体中对于溶解性潜在有问题的残基包括在scFv中暴露于溶剂但在全长抗体的背景中将包埋在可变和恒定结构域之间的界面处的疏水氨基酸。在经改造的缺乏恒定结构域的scFv中，参与可变结构域和恒定结构域之间的相互作用的疏水残基变成暴露于溶剂(参见例如，Nieba等人(1997)Protein Eng.10：435-44)。scFv表面上的此类残基倾向于引起聚集，从而引起溶解性问题。

已描述了替换scFv抗体上的暴露于溶剂的疏水氨基酸的许多策略。正如本领域技术人员所熟知的，在某些位置修饰残基会影响抗体的生物物理性质如稳定性、溶解性和亲和力。在许多情况下，这些性质是相关的，这表示一个单个氨基酸的改变可影响上面提及的性质中的若干性质。因此，以非保守方式突变暴露于溶剂的疏水残基可导致减少的稳定性和/或对其抗原的亲和力的丧失。

其他方法意欲通过详尽使用蛋白质展示技术和/或筛选努力来解决溶解性问题。然而，此类方法太耗时，通常不能产生可溶性蛋白质或导致更低的稳定性或抗体亲和力的减小。在本发明中，公开了使用基于序列的分析设计将暴露于溶剂的疏水残基突变成具有更高的亲水性的残基的突变的方法。可通过选择在确定的位置上出现频率最高的亲水氨基酸来替换潜在有问题的残基。如果发现残基与抗体中任何其他残基相互作用，那么潜在有问题的残基可不突变成出现频率最高的残基而是突变成与共变对的第二氨基酸相容的残基。备选地，还可突变共变对的第二氨基酸以恢复氨基酸的组合。此外，可将序列之间的相似性百分数考虑进来以帮助发现两个相关氨基酸的最优组合。

使用几个方法(包括但不限于基于溶剂暴露、实验信息和序列信息的方法以及分子建模)来鉴定scFv表面上的疏水氨基酸。

在本发明的一个实施方案中，通过用数据库中存在于这些位置上的出现频率最高的亲水残基置换暴露于scFv抗体表面上的疏水残基来提高溶解性。该原理基于频繁发生的残基可能是没问题的事实。如本领域技术人员所认识到的，保守置换通常在破坏分子的稳定性中具有较小的影响，而非保守置换可能对scFv的功能性质是有害的。

有时抗体表面上的疏水残基可参与重链和轻链之间的相互作用或可通过盐桥或氢键与其他残基相互作用。在这些情况下，可能需要特别的分析。在本发明的另一个实施方案中，对于溶解性潜在有问题的残基可以不突变成频率最高的残基而是突变成与共变对相容的残基，或可进行第二突变来恢复共变氨基酸的组合。

可使用另外的方法来设计暴露于溶剂的疏水位置上的突变。在本发明的另一个实施方案中，公开了采用将数据库限制于显示与待修饰的scFv的最高相似性的序列的方法(上文更详细论述的)。通过使用这样的受限制的参照数据库，设计突变以使其与要优化的抗体的特定序列背景最相适。在该情况下，当与更大量的序列(即，不受限制的数据库)比较时，所选择的亲水残基实际上在其各自的位置上可能不具有良好的代表性。

稳定性的优化

单链抗体片段包含共价连接轻链和重链可变结构域的肽接头。虽然这样的接头有效地避免使可变结构域破裂，从而使scFv优于Fv片段，但与Fab片段或全长抗体(在这两者中V_H和V_L仅通过恒定结构域间接连接)相比，scFv片段仍然更易于去折叠和聚集。

scFv中另一个常见问题是scFv表面上疏水残基的暴露，这导致分子间聚集。此外，有时在亲和力成熟过程中获得的体细胞突变将亲水残基置于β-折叠的核心内。此类突变在IgG形式中或甚至Fab片段中可被良好耐受，但在scFv中，这很明显引起去稳定和随后的去折叠。

已知的引起scFv去稳定的因素包括：scFv抗体表面上暴露于溶剂的疏水残基；埋藏在蛋白质核心内的罕见亲水残基以及存在于重链和轻链之间的疏水界面中的亲水残基。此外，核心中的非极性残基之间的范德瓦尔斯嵌合作用(van der Waals packing interaction)已知在蛋白质的稳定性中起着重要作用(Monsellier E.和Bedouelle H.(2006)J.Mol.Biol.362：580-93，Tan等人(1998)Biophys.J.75：1473-82；

A.和Plückthun A.(1998)Biochemistry 37：13120-7)。

因此，在一个实施方案中，为了增加scFv抗体的稳定性，鉴定了在非常保守的位置上的罕见和/或不利的氨基酸并且将其突变成在这些保守位置上更常见的氨基酸。此类罕见和/或不利的氨基酸包括：(i)scFv抗体表面上的暴露于溶剂的疏水残基；(ii)埋藏在蛋白质的核心中的罕见亲水残基；(iii)存在于重链和轻链之间的疏水界面中的亲水残基；和(iv)通过立体阻碍干扰VH/VL界面VH/VL的残基。

因此，在本发明的一个实施方案中，稳定性的增加可通过用在这些位置上出现频率最高的氨基酸置换在它们的位置上不具代表性的氨基酸来获得。出现频率通常提供了生物学接受性的指标。

残基可参与重链和轻链之间的相互作用或可通过盐桥、氢键或二硫键与其他残基相互作用。在这些情况下，可能需要特别的分析。在本发明的另一个实施方案中，可将对于稳定性潜在有问题的残基改变成与其共变对中的配对残基相容的残基。备选地，可突变配对残基以使之与最初鉴定为有问题的氨基酸相容。

可使用另外的方法设计提高稳定性的突变。在本发明的另一个实施方案中，公开了采用将数据库限制于显示与待修饰的scFv的最高相似性的序列的方法(上文更详细论述的)。通过使用这样的受限制的参照数据库，设计突变以使其与要优化的抗体的特定序列背景最相适。突变使用存在于所选择的数据库序列亚组中的出现频率最高的氨基酸。在该情况下，当与更大量的序列(即，不受限制的数据库)比较时，所选择的残基实际上可能在其各自的位置上不具有良好的代表性。

scFv组合物和制剂

本发明的另一个方面涉及按照本发明的方法制备的scFv组合物。因此，本发明提供了经改造的scFv组合物，其中与原始的目的scFv相比，已将一个或多个突变导入氨基酸序列，其中突变已被导入经预测影响一个或多个生物学性质例如稳定性或溶解性的位置，特别地一个或多个构架位置。在一个实施方案中，scFv已进行了改造，从而包含一个突变的氨基酸位置(例如，一个构架位置)。在其他实施方案中，scFv已进行了改造，从而包含2、3、4、5、6、7、8、9、10或多于10个突变的氨基酸位置(例如，构架位置)。

本发明的另一个方面涉及本发明的scFv组合物的药物制剂。此类制剂通常包含scFv组合物和药学上可接受的载体。如本文中所使用的，“药学上可接受的载体”包括生理上相容的任何和所有溶剂、分散介质、包衣、抗菌剂和抗真菌剂、等渗剂和吸收延迟剂等。优选，载体适合于例如静脉内、肌内、皮下、胃肠外、脊柱、表皮施用(例如，通过注射或输注)、或局部施用(例如，至眼或皮肤)。取决于施用途径，可将scFv包被在材料中以保护化合物免受酸的作用和可使化合物失活的其他天然条件的损害。

本发明的药物化合物可包括一种或多种药学上可接受的盐。“药学上可接受的盐”是指保持亲本化合物期望的生物学活性并且不提供任何不想要的毒理学效应的盐(参见例如，Berge，S.M.等人(1977)J.Pharm.Sci.66：1-19)。此类盐的实例包括酸加成盐和碱加成盐。酸加成盐包括从无毒无机酸例如盐酸、硝酸、磷酸(phosphoric)、硫酸(sulfuric)、氢溴酸、氢碘酸、亚磷酸(phosphorous)等衍生的盐，以及从无毒有机酸例如脂肪族一羧酸和二羧酸、苯基取代的链烷酸、羟基链烷酸、芳香族酸、脂肪族和芳香族磺酸等衍生的盐。碱加成盐包括从碱土金属例如钠、钾、镁、钙等衍生的盐，以及从无毒有机胺例如N，N′-二苄基乙二胺、N-甲基葡糖胺、氯普鲁卡因、胆碱、二乙醇胺、乙二胺、普鲁卡因等衍生的盐。

本发明的药物组合物还可包含药学上可接受的抗氧化剂。药学上可接受的抗氧化剂的实例包括：(1)水溶性抗氧化剂，例如抗坏血酸、盐酸半胱氨酸、硫酸氢钠、焦亚硫酸钠(sodium metabisulfite)、亚硫酸钠等；(2)油溶性抗氧化剂例如抗坏血酸棕榈酸酯、丁羟基茴香醚(BHA)、丁羟甲苯(BHT)、卵磷脂、没食子酸丙酯、α-生育酚等；和(3)金属螯合剂，例如柠檬酸、乙二胺四乙酸(EDTA)、山梨糖醇、酒石酸、磷酸等。

可用于本发明的药物组合物的适当的水性和非水性载体的实例包括水、乙醇、多元醇(例如丙三醇、丙二醇、聚乙二醇等)和其适当的混合物，植物油例如橄榄油，和可注射的有机酯例如油酸乙酯。可以例如通过使用包衣材料例如卵磷脂、在分散体的情况下通过维持需要的颗粒大小和通过使用表面活性剂维持恰当的流动性。

此类组合物还可包含佐剂例如防腐剂、湿润剂、乳化剂和分散剂。可通过灭菌方法(同上)和通过包含各种抗菌剂和抗真菌剂例如对羟基苯甲酸酯(paraben)、氯丁醇、苯酚、山梨酸等来确保防止微生物的存在。也可期望将等渗剂例如糖、氯化钠等包含入组合物。此外，可通过包含延迟吸收的试剂例如单硬脂酸铝和明胶来获得可注射药物形式的延长吸收。

药学上可接受的载体包括无菌水溶液或分散体以及用于临时制备无菌注射液或分散体的无菌粉剂。此类介质和试剂用于药物活性物质的用途在本领域内是已知的。除非任何常规介质或试剂与活性化合物不相容，否则预期其在本发明的药物组合物中的用途。还可将补充的活性化合物掺入组合物。

治疗性组合物通常必须是无菌的并且在生产和贮存的条件下是稳定的。可将组合物配制为溶液、微乳剂、脂质体或适合高药物浓度的其他有序结构。载体可以是包含例如水、乙醇、多元醇(例如丙三醇、丙二醇和液体聚乙二醇等)和其适当的混合物的溶剂或分散介质。可以例如通过使用包衣例如卵磷脂、在分散体的情况下通过维持需要的颗粒大小和通过使用表面活性剂来维持恰当的流动性。在许多情况下，优选在组合物中包含等渗剂，例如糖、多元醇例如甘露醇、山梨糖醇或氯化钠。可通过在组合物中包含延迟吸收的试剂例如单硬脂酸盐和明胶来获得可注射组合物的延长的吸收。

无菌注射液可通过将活性化合物以需要的量与上面例举的成分的一种或组合一起掺入适当的溶剂中，然后进行灭菌微过滤(如果需要的话)来制备。通常，通过将活性化合物掺入包含基本分散介质和需要的来自上面列举的成分的其他成分的无菌媒介物来制备分散体。在用于制备无菌注射液的无菌粉剂的情况下，制备的优选方法是从之前无菌过滤的溶液产生包含活性成分和任何额外的期望的成分的粉剂的真空干燥和冷冻干燥(冻干法(lyophilization))。

可与载体材料组合从而产生单个剂型的活性成分的量将随正在治疗的受试者以及施用的特定模式的变化而变化。可与载体材料组合从而产生单个剂型的活性成分的量通常是产生治疗效果的组合物的量。一般地，除百分之百外，该量将在大约0.01％至大约99％的活性成分，优选大约0.1％至大约70％，最优选大约1％至大约30％的活性成分的范围内(与药学上可接受的载体组合)。

调整给药方案以提供最佳的期望的应答(例如，治疗应答)。例如，可施用单个大丸剂，可在一段时间内施用几份分开的剂量或可根据治疗状况的紧急性的需要，按比例减少或增加剂量。特别有利地以单位剂型(dosage unit form)配制胃肠外组合物以便施用和保持剂量均一。本文中使用的单位剂型是指适合用作用于待治疗的受试者的单份剂量的物理上分开的单位；各单位包含经计算与需要的药物载体一起产生期望的治疗效果的预先确定量的活性化合物。本发明的单位剂型的规格(specification)受制于和直接取决于(a)活性化合物的独特特征和要获得的具体治疗效果，和(b)配制用于治疗个体的敏感性的此类活性化合物的领域中固有的限制。

基于“功能共有区”方法的免疫结合剂的改造

如实施例2和3中详细描述的，本文中描述的“功能共有区”方法(其中将因提高的性质而被选择的scFv序列的数据库用于分析构架位置变异性)允许鉴定氨基酸位置，所述氨基酸位置与种系和/或成熟抗体数据库中的这些相同位置上的变异性相比，具有更高或更低的对变异性的耐受性。如实施例5和6中详细描述的，样品scFv中某些氨基酸位置至种系共有残基的回复突变具有中性或有害作用，而包含“功能共有区”残基的scFv变体展示与野生型scFv分子相比增加的热稳定性。因此，本文中通过功能共有区方法鉴定的构架位置对于为了改变，优选提高scFv的功能性质的scFv修饰是优选位置。如本文所使用的，术语“功能性质”指例如改善的稳定性、改善的溶解性、非聚集性、表达的改善、在内含体纯化方法后重折叠产量的改善或2种或更多种所述改善的组合。优选地，改善scFv的功能性质不涉及抗原结合亲和力的改善。

如实施例3的表3至8中所示，下列构架位置已被鉴定为用于所指定的V_H或V_L序列中的修饰的优选位置(下面使用的编号是AHo编号***；将AHo编号转换成Kabat***编号的换算表(conversiontable)示于实施例1的表1和2中)：

VH3：氨基酸位置1、6、7、89和103；

VH1a：氨基酸位置1、6、12、13、14、19、21、90、92、95和98；

VH1b：氨基酸位置1、10、12、13、14、20、21、45、47、50、55、77、78、82、86、87和107；

Vκ1：氨基酸位置1、3、4、24、47、50、57、91和103；

Vκ3：2、3、10、12、18、20、56、74、94、101和103；和

Vλ1：1、2、4、7、11、14、46、53、82、92和103。

因此，一个或多个此类氨基酸位置可选择用于免疫结合剂例如scFv分子的改造，从而产生免疫结合剂的变异(即，突变的)形式。优选地，改造导致具有一种或多种改善的功能性质的免疫结合剂，而不影响抗原结合亲和力。在一个优选实施方案中，所得到的免疫结合剂具有改善的稳定性和/或溶解性特征。

因此，在另一个方面，本发明提供了改造免疫结合剂的方法，特别是用于改善免疫结合剂的一种或多种功能性质的方法，所述免疫结合剂包含(i)VH3、VH1a或VH1b结构域类型的重链可变区或其片段，所述重链可变区包含V_H构架残基，和/或(ii)Vκ1、Vκ3或Vλ1结构域类型的轻链可变区或其片段，所述轻链可变区包含V_L构架残基，该方法包括：

a)在免疫结合剂中选择一个或多个氨基酸位置用于突变；和

b)突变一个或多个选择用于突变的氨基酸位置，其中一个或多个选择用于突变的氨基酸位置选自：

在一个优选实施方案中，该方法改善免疫结合剂的一种或多种功能性质，附带条件是scFv的一种或多种功能性质不涉及抗原结合亲和力的改善。

在另一个优选实施方案中，一个或多个选择用于突变的氨基酸位置选自使用AHo编号的VH3的氨基酸位置1、6、7、89和103(使用Kabat编号的氨基酸位置1、6、7、78和89)。

在另一个优选实施方案中，一个或多个选择用于突变的氨基酸位置选自使用AHo编号的VH1a的氨基酸位置1、6、12、13、14、19、21、90、92、95和98(使用Kabat编号的氨基酸位置1、6、11、12、13、18、20、79、81、82b和84)；

在另一个优选实施方案中，一个或多个选择用于突变的氨基酸位置选自使用AHo编号的VH1b的氨基酸位置1、10、12、13、14、20、21、45、47、50、55、77、78、82、86、87和107(使用Kabat编号的氨基酸位置1、9、11、12、13、19、20、38、40、43、48、66、67、71、75、76和93)；

在另一个优选实施方案中，一个或多个选择用于突变的氨基酸位置选自使用AHo编号的Vκ1的氨基酸位置1、3、4、24、47、50、57、91和103(使用Kabat编号的氨基酸位置1、3、4、24、39、42、49、73和85)；

在另一个优选实施方案中，一个或多个选择用于突变的氨基酸位置选自使用AHo编号的Vκ3的氨基酸位置2、3、10、12、18、20、56、74、94、101和103(使用Kabat编号的氨基酸位置2、3、10、12、18、20、48、58、76、83和85)；

在另一个优选实施方案中，一个或多个选择用于突变的氨基酸位置选自使用AHo编号的Vλ1的氨基酸位置1、2、4、7、11、14、46、53、82、92和103(使用Kabat编号的氨基酸位置1、2、4、7、11、14、38、45、66、74和85)。

在不同的实施方案中，1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或多于20个上述氨基酸位置被选择用于突变。

在另外一个方面，本发明提供了用于改善免疫结合剂的稳定性和/或溶解性性质的方法，所述免疫结合剂包含(i)VH3、VH1a或VH1b结构域类型的重链可变区或其片段，所述重链可变区包含V_H构架残基，和/或(ii)Vκ1、Vκ3或V λ1结构域类型的轻链可变区或其片段，所述轻链可变区包含V_L构架残基，所述方法包括：

a)在免疫结合剂中选择一个或多个氨基酸位置用于突变；和

b)使选择用于突变的一个或多个氨基酸位置突变，其中选择用于突变的一个或多个氨基酸位置选自下述：

(i)使用AHo编号的VH3的氨基酸位置1、89和103(使用Kabat编号的氨基酸位置1、78和89)；

(ii)使用AHo编号的VH1a的氨基酸位置1、12、13、14、19、21、90、92、95和98(使用Kabat编号的氨基酸位置1、11、12、13、18、20、79、81、82b和84)；

(iv)使用AHo编号的Vκ1的氨基酸位置1、3、4、24、47、50、57和91(使用Kabat编号的氨基酸位置1、3、4、24、39、42、49和73)；

(v)使用AHo编号的Vκ3的氨基酸位置2、3、10、12、18、20、56、74、94和101(使用Kabat编号的氨基酸位置2、3、10、12、18、20、48、58、76和83)；和

(vi)使用AHo编号的Vλ1的氨基酸位置1、2、4、7、11、14、46、53、82和92(使用Kabat编号的氨基酸位置1、2、4、7、11、14、38、45、66和74)。

在另一方面，本发明提供了改善免疫结合剂的稳定性和/或溶解性性质而不影响免疫结合剂的抗原结合亲和力的方法，所述免疫结合剂包含(i)VH3、VH1a或VH1b结构域类型的重链可变区或其片段，所述重链可变区包含V_H构架残基，和/或(ii)Vκ1、Vκ3或Vλ1结构域类型的轻链可变区或其片段，所述轻链可变区包含V_L构架残基，所述方法包括：

a)在免疫结合剂中选择一个或多个氨基酸位置用于突变；和

(i)使用AHo编号的VH3的氨基酸位置1和103(使用Kabat编号的氨基酸位置1和89)；

(ii)使用AHo编号的VH1a的氨基酸位置1、12、13、14、19、21、90、95和98(使用Kabat编号的氨基酸位置1、11、12、13、18、20、79、82b和84)；

(iii)使用AHo编号的VH1b的氨基酸位置1、10、12、13、14、20、21、45、47、50、55和77(使用Kabat编号的氨基酸位置1、9、11、12、13、19、20、38、40、43、48和66)；

(iv)使用AHo编号的Vκ1的氨基酸位置1和3(使用Kabat编号的氨基酸位置1和3)；

(v)使用AHo编号的Vκ3的氨基酸位置2、3、10、12、18、20、94和101(使用Kabat编号的氨基酸位置2、3、10、12、18、20、76和83)；和

(vi)使用AHo编号的Vλ1的氨基酸位置1、2、4、7、11、14、82和92(使用Kabat编号的氨基酸位置1、2、4、7、11、14、66和74)。

优选，免疫结合剂是scFv，但还可按照本方法对其他免疫结合剂例如全长免疫球蛋白、Fab片段、Dab、纳米抗体或本文中描述的任何其他类型的免疫结合剂进行改造。本发明还包括按照改造方法制备的免疫结合剂以及包含免疫结合剂和药学上可接受的载体的组合物。

在特定示例性实施方案中，根据本发明的方法改造的免疫结合剂是本领域公认的免疫结合剂，其结合具有治疗重要性的靶抗原或包含衍生自具有治疗重要性的免疫结合剂的可变区(VL和/或VL区)或一个或多个CDR(例如，CDRL1、CDRL2、CDRL3、CDRH1、CDRH2和/或CDRH3)的免疫结合剂。例如，目前由FDA或其他管理机构批准的免疫结合剂可以根据本发明的方法进行改造。更具体而言，这些示例性免疫结合剂包括但不限于，抗CD3抗体例如莫罗单抗(

OKT3；Johnson & Johnson，Brunswick，NJ；参见Arakawa等人J.Biochem，(1996)120：657-662；Kung和Goldstein等人，Science(1979)，206：347-349)、抗CD11抗体例如依法珠单抗(

Genentech，South San Francisco，CA)、抗CD20抗体例如利妥昔单抗(

Genentech，South SanFrancisco，CA)、托西莫单抗(

GlaxoSmithKline，London)或替伊莫单抗(

Biogen Idec，Cambridge MA)(参见美国专利号5,736,137；6,455,043；和6,682,734)、抗CD25(IL2Rα)抗体例如达克珠单抗(

Roche，Basel，Switzerland)或巴利昔单抗(

Novartis，Basel，Switzerland)、抗CD33抗体例如吉妥珠单抗(

Wyeth，Madison，NJ-参见美国专利号5,714,350和6,350,861)、抗CD52抗体例如阿仑珠单抗(

Millennium Pharmacueticals，Cambridge，MA)、抗GpIIb/gIIa抗体例如阿昔单抗(

Centocor，Horsham，PA)、抗TNFα抗体例如英利昔单抗(

Centocor，Horsham，PA)或阿达木单抗(

Abbott，Abbott Park，IL-参见美国专利号6,258,562)、抗IgE抗体例如奥马珠单抗(

Genentech，South San Francisco，CA)、抗RSV抗体例如帕利珠单抗(Medimmune，Gaithersburg，MD-参见美国专利号5,824,307)、抗EpCAM抗体例如依决洛单抗(Centocor)、抗EGFR抗体例如西妥昔单抗(

Imclone Systems，NewYork，NY)或帕木单抗(

Amgen，Thousand Oaks，CA)、抗HER2/neu抗体例如曲妥珠单抗(

Genentech)、抗α4整联蛋白抗体例如那他珠单抗(

BiogenIdec)、抗C5抗体例如依库珠单抗(

Alexion Pharmaceuticals，Chesire，CT)和抗VEGF抗体例如贝伐珠单抗(

Genentech-参见美国专利号6,884,879)或雷珠单抗(

Genentech)。

尽管描述了前述内容，但在多种实施方案中，某些免疫结合剂被排除用于本发明的改造方法和/或被排除成为通过改造方法产生的免疫结合剂组合物。例如，在多种实施方案中，存在附带条件，即免疫结合剂不是PCT公开号WO 2006/131013和WO 2008/006235中公开的任何scFv抗体或其变体，例如，PCT公开号WO 2006/131013和WO 2008/006235中公开的ESBA105或其变体，所述专利各自的内容明确地通过引用合并入本文。

在多种其他实施方案中，如果待按上述方法进行改造的免疫结合剂是PCT公开号WO 2006/131013或WO 2008/006235中公开的任何scFv抗体或其变体，那么可存在附带条件，即根据改造方法可选择用于置换的可能的氨基酸位置的清单不包括任何或所有下列氨基酸位置：Vκ1或Vλ1的AHo位置4(Kabat 4)、Vκ3的AHo位置101(Kabat 83)、VH1a或VH1b的AHo位置12(Kabat 11)、VH1b的AHo位置50(Kabat 43)、VH1b的AHo位置77(Kabat 66)、VH1b的AHo位置78(Kabat 67)、VH1b的AHo位置82(Kabat 71)、VH1b的AHo位置86(Kabat 75)、VH1b的AHo位置87(Kabat 76)、VH3的AHo位置89(Kabat 78)、VH1a的AHo位置90(Kabat 79)和/或VH1b的AHo位置107(Kabat 93)。

在另外的多种其他实施方案中，对于待按照上述方法进行改造的任何免疫结合剂和/或按照上述方法产生的任何免疫结合剂，可存在附带条件，即根据改造方法可选择用于置换的可能的氨基酸位置的清单不包括任何或所有下列氨基酸位置：Vκ1或Vλ1的AHo位置4(Kabat 4)、Vκ3的AHo位置101(Kabat 83)、VH1a或VH1b的AHo位置12(Kabat 11)、VH1b的AHo位置50(Kabat 43)、VH1b的AHo位置77(Kabat 66)、VH1b的AHo位置78(Kabat 67)、VH1b的AHo位置82(Kabat 71)、VH1b的AHo位置86(Kabat 75)、VH1b的AHo位置87(Kabat 76)、VH3的AHo位置89(Kabat 78)、VH1a的AHo位置90(Kabat 79)和/或VH1b的AHo位置107(Kabat 93)。

其他实施方案

应理解，本发明还包括美国临时专利申请系列号60/905,365的附录(A-C)和美国临时专利申请序列号60/937,112的附录(A-I)中所示的任何方法、参考文献和/或组合物，包括但不限于，已鉴定的数据库、生物信息学、计算机中(in silico)的数据操作和解释方法、功能测定法、优选序列、优选残基位置/改变、构架鉴定和选择、构架改变、CDR比对和整合以及优选改变/突变。

关于此类方法和组合物的另外的信息可见于U.S.S.N.s60/819,378；和分别于2006年7月和2007年2月6日提交的标题为“scFv Antibodies Which Pass Epithelial And/Or Endothelial Layers”的U.S.S.N.s 60/899,907和PCT公开号WO 2008/006235；2006年6月6日提交的标题为“Stable And Soluble Antibodies Inhibiting TNFα”的WO06131013A2；2003年5月21日提交的标题为“Immunoglobulin Frameworks Which Demonstrate EnhancedStability In The Intracellular Environment And Methods OfIdentifying Same”的EP1506236A2；2000年12月18日提交的标题为“Intrabodies ScFv with defined framework that is stable in areducing environment”的EP1479694A2；2000年12月18日提交的标题为“Intrabodies With Defined Framework That Is Stable In AReducing Environment And Applications Thereof”的EP1242457B1；2003年5月21日提交的标题为“Immunoglobulin Frameworks WhichDemonstrate Enhanced Stability In The Intracellular EnvironmentAnd Methods Of Identifying Same”的WO03097697A2；和2000年12月18日提交的标题为“Intrabodies With Defined Framework ThatIs Stable In A Reducing Environment And Applications Thereof”的WO0148017A1；和Honegger等人，J.Mol.Biol.309：657-670(2001)。

此外，应理解，本发明还包括适合于其他抗体形式例如全长抗体或其片段(例如，Fab、Dab等)的开发和/或改进的方法和组合物。因此，本文中的原理和残基(其鉴定为适合于选择或改变以获得期望的生物物理学和/或治疗性质)可用于广泛的免疫结合剂。在一个实施方案中，通过修饰本文中公开的一个或多个残基位置来改进治疗相关抗体例如FDA批准的抗体。

然而，本发明并不限于免疫结合剂的改造。例如，本领域技术人员将认识到，本发明的方法可以用于改造其他、非免疫球蛋白、结合分子，包括但不限于，纤连蛋白结合分子例如Adnectins(参见WO01/64942以及美国专利号6,673,901、6,703,199、7,078,490和7,119,171)、亲和体(Affibody)(参见例如，美国专利6,740,734和6,602,977以及WO 00/63243)、Anticalins(也称为脂质运载蛋白)(参见WO99/16873和WO 05/019254)、A结构域蛋白质(参见WO02/088171和WO 04/044011)和锚蛋白重复蛋白质例如Darpins或亮氨酸重复蛋白质(参见WO 02/20565和WO 06/083275)。

通过下列不应当被解释为进一步限定的实施例来进一步举例说明本公开内容。整个本申请中引用的所有图和所有参考文献、专利和公开的专利申请的内容明确地以它们的全文通过引用合并入本文。

实施例1：抗***置编号***

在本实施例中，提供了用于鉴定抗体重链和轻链可变区中的氨基酸残基位置的两个不同编号***的换算表。Kabat编号***进一步描述于Kabat等人(Kabat，E.A.，等人(1991)Sequences of Proteins ofImmunological Interest，第5版，U.S.Department of Health andHuman Services，NIH Publication No.91-3242)。AHo编号***进一步描述于Honegger，A.和Plückthun，A.(2001)J.Mol.Biol.309：657-670)。

重链可变区编号

表1：重链可变结构域中残基位置的换算表

———————————————————————————

第1栏，Kabat编号***中的残基位置。第2栏，第1栏中标示的位置在AHo编号***中的相应编号。第3栏，Kabat编号***中的残基位置。第4栏，第3栏中标示的位置在AHo编号***中的相应编号。第5栏，Kabat编号***中的残基位置。第6栏，第5栏中标示的位置在AHo编号***中的相应编号。

————————————————————————————

轻链可变区的编号

表2：轻链可变结构域中残基位置的换算表

—————————————————————————

——————————————————————————

实施例2：scFv序列的基于序列的分析

在本实施例中，详细地描述了scFv序列的基于序列的分析。概述分析过程的流程图示于图1中。

人免疫球蛋白序列的收集和比对

从不同的数据库收集人成熟抗体和种系的可变结构域序列并且将其以单字母代码氨基酸序列的形式输入定制的数据库。使用Needleman-Wunsch序列比对算法的EXCEL工具(Needleman等人，JMol Biol，48(3)：443-53(1970))比对抗体序列。然后将数据库细分成如下4个不同的阵列(根据原始数据来源)以帮助随后的分析和比较：

VBase：人种系序列

IMGT：人种系序列

KDB数据库：成熟抗体

QC数据库：包含通过质量控制筛选选择的所选择scFv构架的ESBATech内部数据库

QC筛选***和根据其选择的具有期望的功能性质的scFv构架序列进一步描述于例如PCT公开号WO 2001/48017、美国申请号20010024831、US 20030096306、美国专利号7,258,985和7,258,986、PCT公开号WO 2003/097697和美国申请号20060035320中。

按照免疫球蛋白的可变结构域的AHo编号***进行缺口的引入和残基位置的命名(Honegger，A.和Plückthun，A.(2001)J.Mol.Biol.309：657-670)。然后，按照Kabat等人(Kabat，E.A.，等人(1991)Sequences of Proteins of Immunological Interest，第5版，U.S.Department of Health and Human Services，NIH Publication No.91-3242)鉴定构架区和CDR区。弃去KDB数据库中低于70％的完整性或在构架区中包含多个未确定的残基的序列。也排除与数据库中的任何其他序列具有超过95％的同一性的序列，从而在分析中避免随机噪音。

序列至亚组的分配

通过按照基于序列同源性的分类方法(Tomlinson，I.M.等人(1992)J.Mol.Biol.227：776-798；Williams，S.C.和Winter，G.(1993)Eur.J.Immunol.23：1456-1461)；Cox，J.P.等人(1994)Eur.J.Immunol.24：827-836)使抗体聚类来将抗体序列分类成不同的家族。与家族共有区的百分数同源性被限定为70％的相似性。在其中序列在两个或更多个不同种系家族之间显示矛盾或同源性百分数低于70％(对任何家族)的情况下，确定最接近的种系对应物，详细分析CDR长度、规范类(canonical class)和定义的亚类残基以正确地分配家族。

统计分析

在确定家族群(family cluster)后，即可对在“质量控制(“QC”)筛选”(该QC筛选详细地描述于PCT公开号WO 2003/097697)中鉴定的结果(hit)进行统计分析。只可能对最具代表性的家族(VH3、VH1a、VH1b、Vk1、Vk3和Vλ1)进行分析，因为最小数目的序列是分析所需要的。通过把数据集中观察到的特定残基类型的次数除以序列的总数来计算各位置i的残基频率fi(r)。通过使用作为***中多样性的数学量度的辛普森指数，将位置的熵N(i)计算为每一个残基位置的变异性的量度(Shenkin，P.S.等人(1991)Proteins 11：297-313；Larson，S.M.和Davidson，A.R.(2000)Protein Sci.9：2170-2180；Demarest，S.J.等人(2004)J.Mol.Biol.335：41-48)，所述辛普森指数提供了比丰富度更多的关于氨基酸组成的信息。通过将存在的不同氨基酸的数目以及各残基的相对丰度考虑进来来计算各位置i的多样性程度。

D = \frac{Σ_{i = 1}^{r} n (n - 1)}{N (N - 1)}

其中：D是辛普森指数，N是氨基酸的总数，r是存在于各位置上的不同氨基酸的数目，n是特定氨基酸类型的残基的数目。

使用不同的标准筛选所选择的Fv构架(通过QC筛选选择的)的QC数据库以定义独特特征。将序列数据库中不同的阵列用于确定Fv构架中残基位置的变异性程度和用于鉴定在自然界中罕见的存在于所选择的Fv构架中的耐受变异的位置。将等于或大于10％的位置的熵评分的差异定义为阈值。如果给定的位置上的残基被其他序列阵列中不常被观察到的氨基酸，即种系数据库(VBase和IMGT)和KDB数据库中不常被观察到的氨基酸占据，那么选择另外的位置。如果发现残基的行为确实不同，(在任何其他序列阵列中具有低代表性或无代表性)，则将残基位置定义为独特的。

所选择的Fv构架序列的独特特征的鉴定的基本原理是构架的已证明是优良的性质和这些发现用于改进的支架的潜在用途。我们假定在所选择的构架中显示一定程度的变异性的在自然界中高度保守的位置应当耐受随机诱变，并且表现增加的发现优于scFv形式中的天然残基的备选氨基酸的概率。此外，对罕见氨基酸的显著偏好是对某个残基的自然选择的指标。基于这两个统计指导方针，选择重链和轻链中的不同残基作为浮动位置(耐受变异性的)或优选置换(罕见残基)。

实施例3：耐受变异性的和罕见残基位置的鉴定

通过使用上述实施例2中的基于序列的scFv分析方法，分析3个重链可变区家族(VH3、VH1a和VH1b)和3个轻链可变区家族(Vκ1、Vκ3和Vλ1)以鉴定耐受变异性的氨基酸位置。特别地，如上所述，测定4个不同数据库Vbase、IMGT、KDB和QC(所选择的scFv)中的序列的各氨基酸位置的多样性程度(如使用辛普森指数计算的)。基于与QC选择的scFv数据库相比Vbase和IMGT种系数据库的这些位置上的辛普森指数值的差异来鉴定耐受变异的和罕见残基的氨基酸位置。此外，对于已鉴定的目的位置，鉴定种系共有残基并且测定QC和KDB数据库中该共有残基的频率。

重链可变区家族VH3、VH1a和VH1b的变异性分析结果分别示于表3、4和5。对于各个表，栏目如下：第1栏：使用AHo编号***的氨基酸残基位置(可使用实施例1的表1中所示的换算表完成至Kabat编号***的转换)；第2至5栏：第1栏中标示的残基位置对于数据库中各抗体阵列的经计算的多样性；第6栏：相应的种系家族和KDB的共有残基；第7栏：第6栏中的共有残基在KDB数据库中的相对残基频率；和第8栏：第6栏中的共有残基在QC选择的scFv数据库中的相对残基频率。

表3：VH3家族的残基的变异性分析和种系中鉴定的共有氨基酸的相应频率。

表4：VH1a家族的残基的变异性分析和种系中鉴定的共有氨基酸的相应频率。

表5：VH1b家族的残基的变异性分析和种系中鉴定的共有氨基酸的相应频率。

轻链可变区家族Vκ1、Vκ3和Vλ1的变异性分析结果分别示于表6、7和8。对于各表，栏目如下：第1栏：使用AHo编号***的氨基酸残基位置(可使用实施例1的表1中所示的换算表完成至Kabat编号***的转换)；第2至5栏：第1栏中标示的残基位置对于数据库中各抗体阵列的经计算的多样性；第6栏：相应的种系家族和KDB的共有残基；第7栏：第6栏中的共有残基在KDB数据库中的相对残基频率；和第8栏：第6栏中的共有残基在QC选择的scFv数据库中的相对残基频率。

表6：Vκ1家族的残基的变异性分析和种系中鉴定的共有氨基酸的相应频率。

表7：Vκ3家族的残基的变异性分析和种系中鉴定的共有氨基酸的相应频率。

表8：Vλ1家族的残基的变异性分析和种系中鉴定的共有氨基酸的相应频率。

如上面表3至8中所示，发现QC***选择的scFv构架中的残基位置的亚组强烈地偏向在种系(VBase和IMGT)和成熟抗体(KDB)中不存在或不具代表性的某些残基，这表明可基于在质量控制酵母筛选***中选择的构架序列的独特特征，合理地提高scFv的稳定性。

实施例4：优选残基的选择

为了选择已知提高scFv的功能性质(例如，稳定性和/或溶解性)的特定氨基酸位置上的优选氨基酸残基置换(或，备选地，排除氨基酸残基)，根据它们的家族亚型(例如，VH1b、VH3等)将来自成熟抗体序列的Kabat数据库的VH和VL序列分组。在各序列亚家族中，将各氨基酸位置上的各氨基酸残基的频率测定为一组亚型的所有被分析的序列的百分数。对QC数据库的所有序列进行同样的测定，所述QC数据库由就增强的稳定性和/或溶解性通过所谓的QC***预选择的抗体组成。对于各亚型，在各相应位置上将针对Kabat序列和针对QC序列获得的各氨基酸残基的所得的百分数(相对频率)进行比较。如果某个氨基酸残基的相对频率相对于Kabat数据库，在QC数据库中增加，那么各自的残基被认为是给定的位置上提高scFv的稳定性和/或溶解性的优选残基。相反地，如果某个氨基酸残基的相对频率相对于Kabat数据库，在QC数据库中减小，那么各自的残基在该位置上在scFv形式的背景中被认为是不利的。

表9描述了不同数据库中VH1b亚型的氨基酸位置H78(AHo编号；Kabat编号H67)上的残基频率的示例性分析。表9中的栏目如下：第1栏：残基类型；第2栏：IMGT种系数据库中残基的频率；第3栏：Vbase种系数据库中残基的频率；第4栏：QC数据库中残基的频率；第5栏：Kabat数据库中残基的频率。

表9：两个种系数据库、QC数据库和成熟抗体的Kabat数据库中VH1b亚型的位置78(AHo编号)上的相对残基频率。

^＊收集的用于残基频率分析的序列的数目

在QC数据库中，以24％的频率(高于在成熟Kabat数据库(KDB_VH1B)中对于相同残基观察到的2％的频率12倍)观察到丙氨酸(A)残基。因此，位置H78(AHo编号)上的丙氨酸残基被认为是该位置上增强scFv的功能性质(例如，稳定性和/或溶解性)的优选残基。相反，在QC数据库中以47％的相对频率(比成熟Kabat数据库中观察到的86％的频率和在种系数据库中对于相同的残基观察到的超过90％的频率(IMGT-germ中91％和Vbase germ中100％)低得多)观察到缬氨酸(V)残基。因此，缬氨酸残基(V)在scFv形式的背景中在位置H78上被认为是不利的残基。

实施例5：来自2个不同方法的ESBA105scFv变体的比较

在本实施例中，比较通过两个不同方法制备的scFv变体的稳定性。亲本scFv抗体是之前已描述的ESBA 105(参见例如，PCT公开号WO 2006/131013和WO 2008/006235)。使用质量控制酵母筛选***选择一组ESBA 105变体(“QC变体”)，所述变体也已在之前进行了描述(参见例如，PCT公开号WO 2006/131013和WO 2008/006235)。通过将某些氨基酸位置回复突变至优选种系共有序列(通过上文实施例2和3中描述的序列分析鉴定的)来制备其他组的变体。通过在氨基酸序列中检索在种系序列中保守但在所选择的scFv中包含罕见的或低频率的氨基酸的位置来选择回复突变(称为种系共有区改造法)。

通过使分子经历热诱导胁迫来就稳定性检测所有变体。通过在广泛范围的温度(25-95℃)下进行攻击，可以测定每一个变体的热去折叠转变(thermal unfolding transition)的大致中点(TM)。使用FT-IRATR光谱法(其中IR光被导向通过干涉仪(interferometer))进行野生型分子和变体的热稳定性测量。测得的信号是干涉图，对该信号进行傅里叶变换，最终的光谱与来自常规的(分散的)红外光谱法的光谱相同。

热去折叠结果概述于下面的表10中并且在图6中进行了图解描述。表10的栏目如下：第1栏：ESBA 105变体；第2栏：包含突变的结构域；第3栏：以AHo编号表示的突变；第4栏：根据图6中的热去折叠曲线计算的TM中点；第5栏：与亲本ESBA 105相比的相对活性；第5栏：用于第1栏中指定的变体的诱变策略。

表10：来自两个不同方法的ESBA 105变体和它们对在FT-IR中测量的总稳定性(经计算的热去折叠转变的中点)的贡献的比较。

与QC变体相比较，至种系共有序列的回复突变对ESBA 105的热稳定性和活性具有负面影响或无影响。因此，这些结果与已由其他人用于提高不同抗体和形式的稳定性的共有区改造方法(参见例如，Steipe，B等人(1994)J.Mol.Biol.240：188-192；Ohage，E.和Steipe，B.(1999)J.Mol.Biol.291：1119-1128；Knappik，A.等人(2000)J.Mol.Biol.296：57-86，Ewert，S.等人(2003)Biochemistry 42：1517-1528；以及Monsellier，E.和Bedouelle，H.(2006)J.Mol.Biol.362：580-593)相矛盾。

在分开的实验中，将上述QC变体(QC11.2、QC15.2和QC23.2)和另外的QC变体(QC7.1)与具有共有序列回复突变(S-2、D-2和D-3)或至丙氨酸的回复突变(D-1)的第二组变体相比较(参见表11)。表11中标示了所选择的构架位置上的残基的同一性，在图7中描述了测量的热稳定性(以任意去折叠单位表示)。虽然一些共有序列变体(S-2和D-1)展示热稳定性的显著增加，但该增加比通过4个QC变体的每一个获得的热稳定性的增加要少。

表11：提供了在包含共有序列回复突变(S-2、D-2、D-3)、至丙氨酸(D-1)或QC残基(QC7.1、QC11.2、QC15.2、QC23.2)的突变的ESBA105变体的所选择构架位置处的构架残基的同一性。不同于亲本ESBA105抗体的残基以粗体斜体标示。氨基酸位置以Kabat编号提供。

因此，本文中的结果证明用于“质量控制酵母筛选***”的选择压力产生了支架的亚群，所述支架的亚群包含在自然界中(仍然在人中)极少观察到的并且推定负责这些构架的优良生物物理性质的共同特征。通过在60℃下攻击ESBA 105的不同变体，可以再确认在选择的scFv构架数据库中鉴定的优选置换的优良性质。因此，已证明本文中描述的基于从QC酵母筛选***获得的所选择的scFv序列的“功能共有区”方法产生这样的scFv变体，其具有比使用种系共有区方法制备的变体更优良的热稳定性。

实施例6：ESBA212scFv变体

在本实施例中，比较具有与ESBA105不同的结合特异性的scFv抗体(ESBA212)的种系共有序列变体的稳定性。

通过将某些氨基酸位置回复突变至优选种系共有序列(通过上面的实施例2和3中描述的序列分析鉴定的)来制备所有ESBA212变体。通过在氨基酸序列中检索在种系序列中保守但在所选择的scFv中包含罕见的或低频率的氨基酸的位置来选择回复突变(称为种系共有区改造法)。如实施例5中一样，通过使分子经历热诱导的胁迫来就稳定性检测所有变体。

ESBA212变体的热去折叠结果概述于下面的表12中，并且在图8中进行了图解描述。表12中的栏目如下：第1栏：ESBA212变体；第2栏：包含突变的结构域；第3栏：以AHo编号表示的突变；第4栏：根据图7中的热去折叠曲线计算的TM中点；第5栏：与亲本ESBA212相比的相对活性；第5栏：用于第1栏中指定的变体的诱变策略。

表12：回复突变至种系共有残基的ESBA212变体和它们对在FT-IR中测量的总稳定性(经计算的热去折叠转变的中点)的贡献的比较。

如对于不相关的ESBA 105scFv抗体所观察到的，至种系共有序列的回复突变对ESBA212的热稳定性和活性具有负面影响或无影响。因此，这些结果用于进一步突出常规的基于共有区的方法的不足。这些缺陷可通过使用本发明的功能共有区方法来解决。

实施例7：具有改善的溶解性的scFv的产生

在这个实施例中，基于结构建模和序列分析的方法用于鉴定在scFv构架区中导致改善的溶解性的突变。

a)结构分析

使用可经由ExPASy网络服务器访问的自动化蛋白质结构同源性建模服务器，对ESBA105scFv的3D结构进行建模。根据溶剂可达的相对面积(rSAS)分析结构，并且残基如下进行分类：(1)显示rSAS≥50％的残基为暴露的；和(2)50％≤rSAS≥25％的残基为部分暴露的。rSAS≥25％的疏水性残基视为疏水斑块(hydrophobic patch)。为了验证发现的每个疏水斑块的溶剂可达面积，利用与ESBA105具有高同源性的27个PDB文件和高于

的分辨率完成计算。计算疏水斑块的平均rSAS和标准差，并且对其中的每一个进行详细检查(参见表13)。

表13：疏水斑块的评估。

残基	结构域	暴露于溶剂的表面％	STDE％	rSAS	序列变异性	VH/抗原界面	VH/VL界面	VH/CH界面
残基	结构域	暴露于溶剂的表面％	STDE％	rSAS	序列变异性	VH/抗原界面	VH/VL界面	VH/CH界面	2	VH	23.06	19.26	10-25％	10-25％	＞0-20％	＞0-20％	0
4	VH	0.66	1.26	0-10％	0-10％	0		0	2	VH	23.06	19.26	10-25％	10-25％	＞0-20％	＞0-20％	0
4	VH	0.66	1.26	0-10％	0-10％	0		0	5	VH	61.85	12.96	50-75％	10-25％	0	＞0-20％	0
12	VH	70.27	9.17	50-75％	10-25％	0	0	60-80％	5	VH	61.85	12.96	50-75％	10-25％	0	＞0-20％	0
12	VH	70.27	9.17	50-75％	10-25％	0	0	60-80％	103	VH	35.85	5.85	25-50％	10-25％	0	＞0-2％	＞0-2％
144	VH	62.17	7.82	50-75％	10-25％	0	0	＞0-2％	103	VH	35.85	5.85	25-50％	10-25％	0	＞0-2％	＞0-2％
144	VH	62.17	7.82	50-75％	10-25％	0	0	＞0-2％	15	VL	49.59	9.77	25-50％	10-25％	0	0	0
147	VL	31.19	23.32	25-50％	10-25％	0	0	60-80％	15	VL	49.59	9.77	25-50％	10-25％	0	0	0

——————————————————————————

第1栏，在AHo编号***中的残基位置。第2栏，第1栏中标示的位置的结构域。第3栏，利用27个PDB文件计算的平均溶剂可达面积。第4栏，第3栏的标准差。第5至9栏，从AHo检索到的疏水斑块的结构作用。

——————————————————————————

在ESBA105中鉴定的大多数疏水斑块对应于可变-恒定结构域(VH/CH)界面。这与scFv形式中的暴露于溶剂的疏水性残基的先前发现(Nieba等人，1997)相关。2个疏水斑块(VH 2和VH 5)也促成VL-VH相互作用，并且因此从序列分析中排除。

b)可溶性突变的设计

从Annemarie Honegger的抗体网页(www.bioc.uzh.ch/antibody)检索到总共122个VL和137个VH序列。序列最初对应于从蛋白质数据库(PDB)(www.rcsb.org/pdb/home/home.do)中提取的Fv或Fab形式的393个抗体结构。不考虑物种或亚组，将序列用于分析，以便增加发现具有比天然残基更高的亲水性的备选氨基酸的概率。排除与数据库内的任何其他序列具有超过95％的同一性的序列，以减少偏差。序列进行比对且就残基频率进行分析。应用序列分析工具和算法，以鉴定和选择亲水突变，从而破坏ESBA105中的疏水斑块。序列根据免疫球蛋白可变结构域的AHo编号***(Honegger和Plückthun 2001)进行比对。将分析限制于构架区。

各位置i在定制的数据库中的残基频率f(r)通过将在数据集内观察到的特定残基的次数除以序列总数来计算。在第一个步骤中，计算每个疏水斑块的不同氨基酸的出现频率。利用上文描述的定制的数据库分析ESBA105中鉴定的每个疏水斑块的残基频率。表14报告了在疏水斑块处的残基频率(除以数据库中存在的残基的总数)。

表14.来自scFv或Fab形式的成熟抗体的259个序列的在ESBA105中鉴定的疏水斑块的残基频率

残基	VH4	VH 12	VH 103	VH 144	VL 15	VL 147
残基	VH4	VH 12	VH 103	VH 144	VL 15	VL 147	A	0.23046215	0	0	0	3.8647343	0.176821923
C	0	0	0	0	0	0	A	0.23046215	0	0	0	3.8647343	0.176821923
C	0	0	0	0	0	0	D	0	0	0	0	0	0
E	0	0	0	0	0	0	D	0	0	0	0	0	0
E	0	0	0	0	0	0	F	0.483091787	0	0.483091787	0	0	0
G	0	0	0	0	0	0	F	0.483091787	0	0.483091787	0	0	0
G	0	0	0	0	0	0	H	0	0	0	0	0	0
I	0	2.415458937	9.661835749	0	5.314009662	70.38834951	H	0	0	0	0	0	0
I	0	2.415458937	9.661835749	0	5.314009662	70.38834951	K	0	0	0	0	0	0
L	96.61835749	89.85507246	7.246376812	27.0531401	45.89371981	15.53398058	K	0	0	0	0	0	0
L	96.61835749	89.85507246	7.246376812	27.0531401	45.89371981	15.53398058	M	0	0	10.62801932	1.93236715	0	0.970873786
N	0	0	0	0	0	0	M	0	0	10.62801932	1.93236715	0	0.970873786
N	0	0	0	0	0	0	P	0.966183575	0	0	0.966183575	21.73913043	0.485436893
Q	0	0	0	0.483091787	0	0	P	0.966183575	0	0	0.966183575	21.73913043	0.485436893
Q	0	0	0	0.483091787	0	0	R	0	0	7.246376812	0	0	0
S	0	0.966183575	0	18.84057971	0	0	R	0	0	7.246376812	0	0	0
S	0	0.966183575	0	18.84057971	0	0	T	0	0	15.4589372	50.72463768	0.966183575	0
V	1.93236715	6.763285024	49.27536232	0	22.22222222	12.62135922	T	0	0	15.4589372	50.72463768	0.966183575	0
V	1.93236715	6.763285024	49.27536232	0	22.22222222	12.62135922	W	0	0	0	0	0	0
Y	0	0	0	0	0	0	W	0	0	0	0	0	0

第1栏：残基类型。第2至5栏，重链中的疏水斑块的残基的相对频率。第6至7栏，轻链中的疏水斑块的残基的相对频率。

在第二个步骤中，通过选择在各个疏水斑块处最丰富的亲水残基，将在疏水斑块处的亲水残基的频率用于设计可溶性突变。表15报告了使用这种方法鉴定的可溶性突变体。根据在数篇文章中公开的平均疏水性值计算亲本和突变体残基的疏水性，并且将其表示为侧链暴露于溶剂的水平的函数。

表15.在ESBA105中引入以破坏疏水斑块的不同可溶性突变

残基	结构域	暴露于溶剂的表面％	亲本残基	亲本残基的疏水性	可溶性突变	突变的疏水性
残基	结构域	暴露于溶剂的表面％	亲本残基	亲本残基的疏水性	可溶性突变	突变的疏水性	4	VH	0.66	L	85.2	A	42.7
12	VH	70.27	V	73.2	S	28	4	VH	0.66	L	85.2	A	42.7
12	VH	70.27	V	73.2	S	28	103	VH	35.85	V	73.2	T	32.8
144^*	VH	62.17	V	73.2	S	28	103	VH	35.85	V	73.2	T	32.8
144^*	VH	62.17	V	73.2	S	28	15	VL	49.59	V	73.2	T	32.8
147	VL	31.19	L	85.2	A	42.7	15	VL	49.59	V	73.2	T	32.8

^＊在位置144处的疏水斑块不改变成数据库中最丰富的亲水残基，而改变成Ser，因为这已包含在ESBA105的CDR供体中。

——————————————————————————————

第1栏，AHo编号***中的残基位置。第2栏，第1栏中标示的位置的结构域。第3栏，从27个PDB文件计算的平均溶剂可达面积。第4栏，ESBA105中的亲本残基。第5栏，从AHo检索到的第4栏的平均疏水性。第6栏，在第1栏中标示的位置处最丰富的亲水残基。从AHo检索到的第6栏的平均疏水性。

c)可溶性ESB A105变体的测试

单独或以多重组合引入可溶性突变，并且就重折叠产量、表达、活性和稳定性以及聚集模式对其进行测试。表16显示基于对溶解性的潜在贡献和突变将改变抗原结合的风险水平，在每种ESBA105优化变体中引入的可溶性突变的各种组合。

表16：ESBA105的可溶性变体的设计。

^＊在第二轮中分开测试

^＊＊下划线将分别包含于轻链和重链中的突变的数目分开。

第1栏，AHo编号***中的残基位置。第2栏，第1栏中标示的位置的结构域。第3栏，ESBA105中不同疏水斑块处的亲本残基。第4栏，在标示的位置处包含可溶性突变的不同变体。

i.溶解性的测量

通过测量在离心的PEG-蛋白质混合物的上清液中的蛋白质浓度，测定ESBA105和变体的最大溶解性。使20mg/ml起始浓度与30-50％饱和的PEG溶液1∶1混合。在凭经验确定Log S对Peg浓度(％w/v)的线性依赖后，基于观察到的野生型ESBA105的溶解性曲线图选择这些条件。显示优良溶解性的变体ESBA105的几个例子的溶解性曲线示于图9中。溶解性值的完整列表也在表17中提供。

表17.与亲本ESBA105相比，突变体的估计的最大溶解性和活性。

ii.热稳定性的测量

使用FT-IR ATR光谱法进行亲本ESBA105的热稳定性测量和溶解性跟踪。对分子实施广泛温度范围(25-95℃)的热攻击。通过对干涉图信号应用傅里叶变换获得变性曲线图(参见图10)。通过应用玻尔兹曼S形模型，将变性曲线图用于估计每种ESBA105变体的热去折叠转变的中点(TM)(表18)。

表18：每种可溶性变体的热去折叠转变的中点(TM)。

iii.聚集性的测量

ESBA105及其可溶性变体也在时间依赖性测试上进行分析，以评估降解和聚集行为。为此，在升高的温度下(40℃)在磷酸盐缓冲液(pH 6.5)中温育可溶性蛋白质(20mg/ml)。对照样品维持于-80℃下。在2周的温育期后就降解(SDS-PAGE)和聚集(SEC)分析样品。这允许弃去易于降解(参见图11)或显示形成可溶性或不溶性聚集物的倾向(参见表19)的变体。

表19：不溶性聚集的测量

蛋白质	蛋白质丧失(不溶性聚集物)
蛋白质	蛋白质丧失(不溶性聚集物)	ESBA105	1.14％
ESBA105 Opt 1_0	8.17％	ESBA105	1.14％
ESBA105 Opt 1_0	8.17％	ESBA105 Opt 0_2	4.45％
ESBA105 Opt 1_2	46.60％	ESBA105 Opt 0_2	4.45％
ESBA105 Opt 1_2	46.60％	ESBA105 VH V103T	-1.95％

iv.可溶性变体的表达和重折叠

也就表达和重折叠产量(相对于亲本ESBA105分子)测试可溶性突变体。这些研究的结果显示于表20中。

表20.可溶性变体的表达和重折叠。

尽管与亲本ESBA105分子相比，所有亲水性可溶性突变体显示出改善的溶解性，但这些分子中仅少数显示适合于其他生物物理学性质。例如，相对于亲本ESBA105分子，许多变体具有减少的热稳定性和/或重折叠产量。特别地，在位置VL147处的亲水置换严重减少稳定性。因此，使不显著影响热稳定性的可溶性突变组合，并且对其实施进一步的热胁迫以证实其性质。

包含4个不同可溶性突变的组合的3个突变体(Opt1.0、Opt0.2和VH：V103T)显著改善ESBA105的溶解性，而不影响重现性、活性或热稳定性。然而，在40℃下温育2周后，在ESBA105中具有Opt1.0和Opt0.2的组合突变的突变体(Opt 1_2)显示增加量的不溶性聚集物(参见表19)。这可以通过位置VL 15处的Val在β折叠转角中的作用加以解释，因为Val在所有氨基酸中具有最大的β折叠倾向。这个结果证实在位置VL 15处的单个可溶性突变是耐受的，但在与破坏其他疏水斑块的可溶性突变体的组合中则不耐受。因此，包含于Opt0_2和VH：V103T中的突变选择为改善scFv分子的溶解性性质的最佳执行者。

实施例8：具有增强的溶解性和稳定性的scFv的产生

通过用经由质量控制(QC)测定法鉴定的稳定性突变置换，进一步优化通过可溶性设计鉴定的ESBA105变体。总共产生了4种构建体，其包含1-3个的上文实施例7中鉴定的可溶性突变(与QC 7.1和15.2中发现的所有稳定性突变(即，VL结构域中的D31N和V83E，以及VH结构域中的V78A、K43和F67L)组合)。所有优化的构建体产生比野生型scFv更可溶的蛋白质(参见表20)。最佳构建体在溶解性方面一致地显示超过2倍的增加(相对于野生型)。scFv分子的活性和稳定性都不受稳定性和溶解性增强突变的组合的显著影响。

表21：具有优化的溶解性和稳定性的scFv

蛋白质	VL/VH突变	FTIRTm(℃)	PEG溶解性(mg/ml)	相对于E105的活性	kD
蛋白质	VL/VH突变	FTIRTm(℃)	PEG溶解性(mg/ml)	相对于E105的活性	kD	QC7.1D-N-15.2	VL：D31N；V83EVH：V78A；K43R；F67L	69.0	90	1.7	9.06×10^-10
QC7.1D-N-15.2VH V103T	VL：D31N；V83EVH：V78A；K43R；F67L；V103T	68.9	106	1.5	8.79×10^-10	QC7.1D-N-15.2	VL：D31N；V83EVH：V78A；K43R；F67L	69.0	90	1.7	9.06×10^-10
QC7.1D-N-15.2VH V103T	VL：D31N；V83EVH：V78A；K43R；F67L；V103T	68.9	106	1.5	8.79×10^-10	QC7.1D-N-15.2Opt 0_2	VL：D31N；V83EVH：V12S；V78A；K43R；F67L；L144S	66.6	121	1.2	8.12×10^-10
QC7.1D-N-15.2VH V103T Opt0_2	VL：D31N；V83EVH：V12S；V78A；K43R；F67L；V103T；L144S	67.3	186	1.5	1.34×10^-9	QC7.1D-N-15.2Opt 0_2	VL：D31N；V83EVH：V12S；V78A；K43R；F67L；L144S	66.6	121	1.2	8.12×10^-10

所有4种变体的溶解性值用于解卷积各个突变对scFv溶解性的贡献。所有突变看起来都以累积方式促成scFv的溶解性，尽管这些残基中的几个在基本序列中和在3D结构内彼此关系密切。分析表明，VH结构域中的3个溶解性增强突变(V12S、L144S、V103T(或V103S))的组合占～60％的scFv溶解性。因为疏水斑块在所有免疫结合剂的可变结构域中是保守的，所以这个最佳突变组合可以用于改善几乎任何scFv或其他免疫结合剂分子的溶解性。

等同物

本领域技术人员将认识到或能够确定(通过只使用常规实验)本文中描述的本发明的特定实施方案的许多等同物。此类等同物意欲包括于下列权利要求中。

Claims

1.鉴定用于免疫结合剂中的特定位置中的置换的一个或多个氨基酸残基的方法，所述方法包括：

a)提供根据亚型分组的V_H和/或V_L氨基酸序列的第一数据库；

b)提供根据亚型分组且因具有至少一种期望的功能性质而被选择的V_H和/或V_L氨基酸序列的第二数据库；

c)测定氨基酸残基在所述第一数据库的构架位置处和在所述第二数据库的相应构架位置处的氨基酸频率；

d)(i)当所述氨基酸具有大于1的富集因子时，鉴定所述氨基酸残基为用于在所述免疫结合剂的相应氨基酸位置处的置换的优选氨基酸残基，或(ii)当所述氨基酸残基具有小于1的富集因子时，鉴定所述氨基酸残基为在所述免疫结合剂的相应氨基酸位置处待排除的氨基酸残基。

2.权利要求1的方法，其中步骤d)的所述氨基酸残基具有4-6的富集因子。

3.前述权利要求中任一项的方法，其中所述第一数据库包含种系V_H、V_L或V_H和V_L氨基酸序列。

4.权利要求1-3中任一项的方法，其中所述第一数据库由种系V_H、V_L或V_H和V_L氨基酸序列组成。

5.前述权利要求中任一项的方法，其中所述第一数据库包含成熟V_H、V_L或V_H和V_L氨基酸序列。

6.权利要求1-5中任一项的方法，其中所述第一数据库由成熟V_H、V_L或V_H和V_L氨基酸序列组成。

7.权利要求5或6的方法，其中所述成熟V_H、V_L或V_H和V_L氨基酸序列来自Kabat数据库(KDB)。

8.前述权利要求中任一项的方法，其中所述第二数据库包含根据QC测定法选择的scFv抗体V_H、V_L或V_H和V_L氨基酸序列。

9.权利要求1-7中任一项的方法，其中所述第二数据库由根据QC测定法选择的scFv抗体V_H、V_L或V_H和V_L氨基酸序列组成。

10.改善免疫结合剂的方法，所述免疫结合剂具有V_H和/或V_L氨基酸序列，所述方法包括：

a)鉴定用于突变的一个或多个构架氨基酸位置；

11.权利要求10的方法，其中步骤a)通过测定在给定构架位置处的变异性程度来进行。

12.权利要求10或11的方法，其中步骤a)通过使用辛普森指数给每个构架位置的保守程度赋值来进行。

13.权利要求10-12中任一项的方法，其中步骤b)的所述优选氨基酸残基根据权利要求1-9中任一项的方法进行鉴定。

14.用于改善免疫结合剂的功能性质的方法，所述免疫结合剂包含重链可变区或其片段，和/或轻链可变区或其片段，所述方法包括：

a)在所述免疫结合剂内选择一个或多个氨基酸位置用于突变；和

b)使选择用于突变的一个或多个氨基酸位置突变，

15.权利要求14的方法，其中所述免疫结合剂包含VH3重链可变区，并且选择用于突变的一个或多个氨基酸位置选自使用AHo编号的VH3的氨基酸位置1、6、7、89和103(使用Kabat编号的氨基酸位置1、6、7、78和89)。

16.权利要求14的方法，其中所述免疫结合剂包含VH1a重链可变区，并且选择用于突变的一个或多个氨基酸位置选自使用AHo编号的VH1a的氨基酸位置1、6、12、13、14、19、21、90、92、95和98(使用Kabat编号的氨基酸位置1、6、11、12、13、18、20、79、81、82b和84)。

17.权利要求14的方法，其中所述免疫结合剂包含VH1b重链可变区，并且选择用于突变的一个或多个氨基酸位置选自使用AHo编号的VH1b的氨基酸位置1、10、12、13、14、20、21、45、47、50、55、77、78、82、86、87和107(使用Kabat编号的氨基酸位置1、9、11、12、13、19、20、38、40、43、48、66、67、71、75、76和93)。

18.权利要求14的方法，其中所述免疫结合剂包含Vκ1轻链可变区，并且选择用于突变的一个或多个氨基酸位置选自使用AHo编号的Vκ1的氨基酸位置1、3、4、24、47、50、57、91和103(使用Kabat编号的氨基酸位置1、3、4、24、39、42、49、73和85)。

19.权利要求14的方法，其中所述免疫结合剂包含Vκ3轻链可变区，并且选择用于突变的一个或多个氨基酸位置选自使用AHo编号的Vκ3的氨基酸位置2、3、10、12、18、20、56、74、94、101和103(使用Kabat编号的氨基酸位置2、3、10、12、18、20、48、58、76、83和85)。

20.权利要求14的方法，其中选择用于突变的一个或多个氨基酸位置选自使用AHo编号的Vλ1的氨基酸位置1、2、4、7、11、14、46、53、82、92和103(使用Kabat编号的氨基酸位置1、2、4、7、11、14、38、45、66、74和85)。

21.权利要求14-20中任一项的方法，其中所述突变进一步包括一个或多个(优选所有)选自使用AHo编号的氨基酸位置12、13和144(使用Kabat编号的氨基酸位置12、85和103)的重链氨基酸位置的链置换。

22.权利要求14-21中任一项的方法，其中选择用于突变的一个或多个氨基酸位置突变成在根据QC测定法选择的抗体序列中的相应氨基酸位置处发现的氨基酸残基。

23.权利要求14-22中任一项的方法，其中选择用于突变的一个或多个氨基酸位置突变成可根据权利要求1-9中任一项的方法鉴定的氨基酸残基。

24.权利要求1-23中任一项的方法，其中所述免疫结合剂是scFv抗体、全长免疫球蛋白、Fab片段、Dab或纳米抗体。

25.权利要求1-9或14-24中任一项的方法，其中所述功能性质是改善的稳定性、改善的溶解性、非聚集性、表达的改善、在内含体纯化方法后重折叠产量的改善或2种或更多种所述改善的组合。

26.权利要求25的方法，其中在原核细胞中观察到所述表达的改善。

27.权利要求1-9和25-26中任一项的方法，其附带条件是所述功能性质不是抗原结合亲和力的改善。

28.根据前述权利要求中任一项的方法制备的免疫结合剂。

29.组合物，其包含权利要求28的免疫结合剂和药学上可接受的载体。