JP2005526518A

JP2005526518A - タンパク質ライブラリーのｉｎｓｉｌｉｃｏ作成と選択

Info

Publication number: JP2005526518A
Application number: JP2004508241A
Authority: JP
Inventors: ルオ，ペイチ; シー，マーク; チォン，ピンギュ; ワン，カイリ; カオ，イチェン; リウ，シェンチアン
Original assignee: アブマクシス，インコーポレイティド
Priority date: 2002-05-20
Filing date: 2003-05-20
Publication date: 2005-09-08
Also published as: AU2003248548A1; SG135053A1; WO2003099999A3; EP1514216A4; AU2003248548B2; WO2003099999A2; EP1514216A2; CA2485732A1; CN1672160A; CN1672160B

Abstract

本発明は、好ましい生物学的機能（例えば、生物学的および／または治療的に重要な標的分子に対する改良された結合親和性）を有する最適化されたタンパク質について、タンパク質ライブラリーを効率的に作成しスクリーニングするための方法を提供する。この方法は、すべての生物（特にヒト）のタンパク質配列の拡張し続けるデータベースを調べることにより、コンピューターで高速処理される。ある実施態様において所望のタンパク質のライブラリーを構築する方法は、以下の工程を含む：リード配列を複数のテスタータンパク質配列と比較し；そして複数のテスタータンパク質配列から、リード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；そしてリード配列をヒットライブラリーで置換することにより、設計したタンパク質のライブラリーを形成する。所望のタンパク質のライブラリーは、in vitroまたはin vivoで発現させて、組換えタンパク質（例えば治療的に重要な標的に対する抗体）のライブラリー（これは、リードタンパク質に対して新規または改良された機能についてスクリーニングすることができる）を産生することができる。

Description

発明の背景
関連出願の相互参照
本出願は、米国特許出願第10/153,159号（2002年5月20日出願、標題「抗体ライブラリーの構造ベースの選択と親和性成熟」）の一部継続出願であり、また特許出願第10/153,176号（2002年5月20日出願、標題「抗体ライブラリーのin silico（コンピューターによる）作成と親和性成熟」）の一部継続出願であり、これらのいずれも、米国特許出願第10/125,687号（2002年4月17日出願、標題「ヒト抗体ライブラリーの構造ベースの構築」の一部継続出願であり、この出願はまた、米国仮出願第60/284,407号（2001年4月17日出願、標題「ヒト抗体ライブラリーの構造ベースの構築」）の利益を請求する。これらの出願は、参照することにより本明細書に組み込まれる。

発明の分野
本発明は一般に、標的分子に対する結合親和性を有するタンパク質のコンピューター支援設計に関し、さらに詳しくは抗体の偏りのあるライブラリーのコンピューターによる予測と実験によるスクリーニングを組合せることによる、多様な配列と標的抗原に対する高親和性とを有する抗体（または免疫グロブリン）のスクリーニング法と同定法に関する。

関連技術の説明
抗体は、脊椎動物で種々の内部および外部刺激（抗原）に応答して作成される。抗体はＢ細胞によってのみ合成され、数百万の型が産生され、それぞれが異なるアミノ酸配列と抗原に対する異なる結合部位とを有する。これらはまとめて免疫グロブリン（Igと省略される）と呼ばれ、血液中の最も多量なタンパク質成分の１つであり、総血漿タンパク質の20重量％を構成する。

天然に存在する抗体分子は、２つの同一の「軽」（L）タンパク質鎖と２つの同一の「重」（H）タンパク質鎖からなり、すべてが水素結合と正確に位置するジスルフィド結合によりつながれている。Chothiaら(1985) J. Mol. Biol. 186:651-663；およびNovotnyとHaber (1985) Proc. Natl. Acad. Sci. USA 82:4592-4596。L鎖とH鎖のＮ末端ドメインは一緒に、各抗体の抗原認識部位を形成する。

哺乳動物の免疫系はユニークな遺伝機構を進化させ、これは、別々の遺伝子セグメントを、これらが転写される前に結合することにより、極めて経済的にほとんど無数の異なる軽鎖と重鎖とを生成することを可能にする。各タイプのIg鎖（κ軽鎖、λ軽鎖、および重鎖）について、単一のペプチド鎖が最終的に合成される遺伝子セグメントの別々のプールがある。各プールは異なる染色体上に有り、通常Ig鎖のV領域をコードする多数の遺伝子セグメントと、C領域をコードする少数の遺伝子セグメントを含有する。Ｂ細胞の成長の間に、合成される２つのIg鎖のそれぞれについて完全なコード配列が、部位特異的遺伝子組換えにより組み立てられ、V領域の全コード配列とC領域のコード配列とを一緒にする。さらに軽鎖のV領域は、２つの遺伝子セグメント（V遺伝子セグメントと、短い結合もしくはJ遺伝子セグメント）から組み立てられたDNA配列によりコードされる。重鎖のV領域は、３つの遺伝子セグメント（V遺伝子セグメント、J遺伝子セグメント、および多様性もしくはDセグメント）から組み立てられたDNA配列によりコードされる。

Ig鎖をコードするのに利用できる遺伝したV、JおよびD遺伝子セグメントの数の多さは、それ自体が抗体の多様性に大きく寄与するが、これらのセグメントの組合せ結合がこの寄与を大きく上昇させる。さらに、遺伝子セグメントの不正確な結合、およびプレＢ細胞段階でV−D−Jセグメント結合中に導入される体細胞変異は、V領域の多様性を大きく上昇させる。

抗原に対して免疫後、哺乳動物は親和性成熟として知られているプロセスを経験して、抗原に対する高親和性を有する抗体を産生させる。そのような抗原指令の体細胞高変異は、おそらく特異的に重鎖および軽鎖V領域コード配列中の点突然変異の蓄積により、および高親和性抗体を有するＢ細胞クローンの選択性拡張により、ある抗原に対する抗体応答を微調整する。

構造的には抗体の種々の機能は、不連続なタンパク質ドメイン（領域）に限定される。抗原を認識し結合する部位は、２つの重鎖と２つの軽鎖のＮ末端にある可変（V_HとV_L）領域内にある３つの超可変領域または相補性決定領域（CDR）からなる。定常ドメインは、抗原への抗体の結合に直接関与しないが、種々のエフェクター機能（例えば抗体依存性細胞障害への抗体の参加）に関与している。

天然の軽鎖と重鎖のドメインは同じ一般的構造を有し、各ドメインは４つのフレームワーク領域を有し、その配列は３つのCDRにより連結され、ある程度保存されている。４つのフレームワーク領域は主にβシートコンフォメーションを取り、CDRはβシート構造を連結し、ある場合にはその一部を構成するループを形成する。各鎖のCDRは、フレームワーク領域により近傍に保持され、他の鎖のCDRとともに抗原結合部位の形成に寄与する。

一般にすべての抗体は、特徴的な「免疫グロブリン折り畳み」を取る。具体的には抗原結合断片の可変ドメインと定常ドメインの両方（Fab、軽鎖のV_LとC_Lおよび重鎖のV_HとC_H1からなる）が、２つのねじれた反対に平行のβシートからなり、これはβサンドイッチ構造を構成する。定常領域は、ギリシアの鍵のようなモチーフで配置された3重および4重のβシートを有し、可変領域はさらに２つの短いβ鎖を有し5重のβシートを作る。

V_LドメインとV_Hドメインは5重のβシートを介して相互作用して、半径が約8.4Åの9重のβ円筒を形成し、ドメイン境界の鎖は互いに約50°傾いている。ドメインの対合は、CDRループを近傍に持ってくる。CDR自体は、約25％のV_L／V_Hドメイン境界を形成する。

６つのCDR（軽鎖についてCDR-L1、-L2および-L3、および重鎖についてCDR-H1、-H2および-H3）は、β円筒フレームワーク上で支持されて抗原結合部位を形成する。その配列は免疫グロブリン構造の残りの部分と比較して超可変性であるが、ループの一部は比較的高度の配列と構造の保存を示す。特にCDR-L2とCDR-H1は、コンフォメーション中で高度に保存されている。

Chothiaと共同研究者は、保存された主要な残基の分析により、６つのCDRループのうちの５つ（CDR-H3以外のすべて）が分かれた限定された数の主鎖コンフォメーション（CDRの標準構造と呼ぶ）を取ることを証明した。ChotiaとLesk (1987) J. Mol. Biol. 196:901-917；Chothiaら (1989) Nature (ロンドン) 342:877；およびChothiaら (1998) J. Mol. Biol. 278:457-479。取られた構造は、パッキングに関与するCDRと接触するフレームワークの両方の、CDR長さといくつかの主要なアミノ酸残基の本体の両方に依存する。標準コンフォメーションは、構造決定基として作用するこれらの主要な残基のみの特異的パッキング、水素結合相互作用、および立体化学的制約により決定される。

抗体の抗原結合部位の３次元構造をモデル化するための種々の方法が開発されている。Ｘ線結晶解析以外に、抗体−リガンド相互作用の原子的詳細を研究するためにコンピューターモデル構築とともに核磁気共鳴（NMR）分光学が使用されている。Dwekら (1975) Eur. J. Biochem. 53:25-39。Dwekと共同研究者はスピンラベルハプテンを使用して、ジニトロフェニルに対するMoPC315ミエローマタンパク質の結合部位を推定した。抗スピンラベルモノクローナル抗体（Anglisterら (1987) Biochem. 26:6958-6064）と抗2-フェニルオキサゾロンFv断片（McManusとRiechmann (1991) Biochem. 30:5851-5857）とを使用して同様の分析が行われている。

抗体結合部位（または抗原結合部位）のコンピューターによる分析とモデル化は、標的抗体配列と、既存のデータベース（例えば、ブルークハーベンタンパク質データバンク（Brookhaven Protein Data Bank））中の既知の構造または構造モチーフを有する抗体とを比較する相同性分析に基づく。かかる相同性ベースのモデル化法を使用して、標的抗体の近似３次元構造が構築される。早期抗体モデル化は、同一の長さと異なる配列を有するCDRループが同様のコンフォメーションを取るかも知れないという推定に基づいていた。KabatとWu (1972) Proc. Natl. Acad. Sci. USA 69:960-964。典型的なセグメント一致アルゴリズムは以下の通りである：あるループ配列がある時、短い相同的骨格断片（例えば、トリペプチド）についてタンパク質データバンク（Protein Data Bank）を検索し、次にこれを集合させて、コンピューターで新しい結合部位モデルに作成する。

さらに最近は、抗体結合部位のコンピューターで行った構造モデル化に、標準ループ構想が取り込まれている。多くの一般的な型では標準構造構想は、(1) 標準位置以外での配列の変化はループコンフォメーションに無関係である、(2) 標準ループコンフォメーションは、基本的にループ−ループ相互作用に依存しない、および (3) 存在する標準モチーフの数が限定されており、これらは、現在既知である抗体結晶コンフォメーションのデータベース中に充分記載されている。この構想に基づきChothiaは、すべての６つのCDRループコンフォメーションがリゾチーム結合抗体D1.3中に有り、５つの標準ループコンフォメーションが他の４つの抗体中にあると予測した。Chothia (1989)、前述。相同性ベースのモデル化をコンフォメーション検索法と組合せて、抗体構造のCDRのモデル化を改良することも可能である。Martin, A.C.R. (1989) PNAS 86:9268-72。

特異的抗体構造をモデル化する以外に、抗体の人工的（または合成）ライブラリーを作成して、これを特異的標的抗原に対してスクリーニングする試みが行われている。モジュラーコンセンサスフレームワークとトリヌクレオチドでランダム化したCDRとに基づいて、完全に合成のコンビナトリアル抗体ライブラリーが設計されている。Knappikら (2000) J. Mol. Biol. 296:57-86。この研究では、ヒト抗体のレパートリーが、構造、アミノ酸配列多様性、および生殖細胞系の使用の観点から分析された。種々の生殖細胞系ファミリーの95％をカバーする７つのV_Hと７つのV_Lを有するモジュラーコンセンサスフレームワーク配列が誘導され、大腸菌（E. coli）について最適化された。すべての49の組合せの遺伝子をファジミドベクター中にクローン化した後、ライブラリー中2×10⁹ 個のメンバーになる抗体ファージ表示ライブラリーのセットを作成した。

ファージ表示（phage display）技術は、生物学的に機能性のタンパク質分子をその表面に発現し表示するバクテリオファージの能力を利用して、抗体断片の大きなライブラリーを作成するのに広く利用されている。抗体のコンビナトリアルライブラリーがバクテリオファージラムダ発現系で作成されており、これはバクテリオファージプラークとしてまたはリソゲンのコロニーとしてスクリーニングされる（Huseら (1989) Science 246:1275；CatonとKoprowski (1990) Proc. Natl. Acad. Sci. USA 87:6450；Mullinaxら (1990) Proc. Natl. Acad. Sci. USA 87:8095；Perssonら (1991) Proc. Natl. Acad. Sci. USA 2432）。バクテリオファージ抗体表示ライブラリーとラムダファージ発現ライブラリーの種々の例が記載されている（Kangら (1991) Proc. Natl. Acad. Sci. USA 88:4363；Clacksonら (1991) Nature 352:624；McCaffertyら (1990) Nature 348:552；Burtonら (1991) Proc. Natl. Acad. Sci. USA 88:10134；Hooggenboomら (1991) Nucleic Acids Res. 19:4133；Changら (1991) J. Immunol. 147:3610；Britlingら (1991) Gene 104:147；Marksら (1991) J. Mol. Biol. 222:581；Barbasら (1992) Proc. Natl. Acad. Sci. USA 89:4457；HawkinsとWinter (1992) J. Immunol. 22:867；Marksら (1992) Biotechnology 10:779；Marksら (1992) J. Biol. Chem. 267:16007；Lowmanら (1991) Biochemistry 30:10832；Lernerら (1992) Science 258:1313）。またRader, C.とBarbas, C.F. (1997)の総説「コンビナトリアル抗体ライブラリーのファージ表示」、Curr. Opin. Biotechnol. 8:503-508 も参照されたい。

一般にファージライブラリーは、V_LやV_Hのような抗体断片をコードするランダムオリゴヌクレオチドのライブラリーまたはcDNAライブラリーを、M13またはfdファージの遺伝子3に挿入することにより作成される。各挿入遺伝子は、遺伝子3産物（ファージの小さいコートタンパク質）のＮ末端で発現される。その結果、多様なペプチドを含有するペプチドライブラリーを構築することができる。次にファージライブラリーは、固定化された目的の標的分子（例えば抗原）に対して親和性スクリーニングされ、特異的に結合したファージ粒子が回収され、大腸菌（Escherichia coli）宿主細胞中への感染により増幅される。典型的には、受容体のような目的の標的分子（例えば、ポリペプチド、炭水化物、糖タンパク質、核酸）が、共有結合によりクロマトグラフィー樹脂に固定化され、親和性クロマトグラフィーにより反応性ファージ粒子が濃縮されるか、および／またはプラークもしくはコロニーリフトのスクリーニングのために標識される。この方法はバイオパニングと呼ばれる。最後に高親和性ファージコロニーを増幅することができ、特異的ペプチド配列の推定のために配列決定することができる。

コンピューターモデル化を使用して抗体をヒト化するための方法が、Queenらにより開発されている。US Patent No. 5,693,762。非ヒトドナー抗体（例えばマウスモノクローナル抗体）の構造は、コンピューターモデル化に基づいて予測され、フレームワーク中の主要なアミノ酸は、形を保持するのに、従ってCDRの結合特異性を保持するのに必要であると予測される。これらの少ない主要なマウスドナーアミノ酸は、ある規定のカテゴリー内の位置と性質に基づいて選択され、ドナーCDRとともにヒトアクセプター抗体フレームワーク中に代用される。例えばカテゴリー1：アミノ酸の位置は、Kabatらにより規定されるようにCDR中にある。KabatとWu (1972) Proc. Natl. Acad. Sci. USA 69:960-964。カテゴリー2：ヒトアクセプター免疫グロブリンのフレームワーク中のアミノ酸が一般的ではないなら、およびその位置のドナーアミノ酸がヒト配列に典型的なら、アクセプターではなくドナーアミノ酸が選択される。カテゴリー3：ヒト化免疫グロブリン鎖の１次配列中の３つのCDRの１つ以上に隣接する位置では、アクセプターアミノ酸ではなくドナーアミノ酸が選択される。これらの基準に基づき、ドナー抗体から個々のアミノ酸の一連の綿密な選択が行われる。生じるヒト化抗体は通常、約90％のヒト配列を含む。コンピューターモデル化により設計されたヒト化抗体が、抗原結合について試験される。結合親和性のような実験結果は、コンピューターモデル化プロセスにフィードバックされて、ヒト化抗体の構造が微調整される。再設計された抗体は次に、改良された生物学的機能について試験することができる。そのような反復性微調整プロセスは、手間がかかり予測が不可能である。

発明の要約
本発明は、好ましい生物学的機能（例えば、生物学的および／または治療的に重要な標的分子に対する改良された結合親和性）を有する最適化されたタンパク質について、タンパク質ライブラリーを効率的に作成しスクリーニングするための革新的方法を提供する。この方法は、すべての生物（特にヒト）のタンパク質配列の拡張し続けるデータベースを調べることにより、コンピューターで高速処理される。タンパク質の進化するデータを利用して、in vitroまたはin vivoでの機能性スクリーニングのためにタンパク質ライブラリーの構造と構造空間の両方が拡張される。本発明の方法を使用することにより、極めて多様なタンパク質配列と機能的に関連する構造のin silicoコンピューター評価に基づいて、抗体のようなタンパク質の拡張しているが機能的に偏りのあるライブラリーを構築することができる。

本発明のある態様において、好ましい機能を有するタンパク質を設計し選択するための方法が提供される。この方法は、好ましくはリードタンパク質中の標的構造／機能モチーフもしくはドメインのアミノ酸配列（以後「リード配列」と呼ぶ）に基づくタンパク質配列のin silico選択により、コンピューターで行われる。リード配列は、タンパク質配列のデータベースを検索するために使用される。データベースの選択は、所望のモチーフの具体的な機能的要求に依存する。例えば、リードタンパク質が酵素で標的モチーフが酵素の活性部位を含むなら、特定の起源、生物、種のタンパク質／ペプチドまたはこれらの組合せのデータベースは、種々の検索基準を使用して検索されて、配列のヒットしたリストを与え、その各々はリードタンパク質中の標的モチーフを置換することができる。リードタンパク質の他のモチーフまたはドメインを設計するために、同様のアプローチが使用される。個々のモチーフ／ドメインの設計された配列を組合せて、設計されたタンパク質のライブラリーが作成される。さらにヒトへの応用（例えば治療薬または診断薬）用に、設計されたタンパク質の免疫原性を低下させるために、好ましくはヒト起源のタンパク質またはヒト化タンパク質のデータベースが検索されて、特に構造的または機能的に決定的に重要ではないリードタンパク質の部位から得られるモチーフについて、配列のヒットしたリストが得られる。設計されたタンパク質のライブラリーは、リードタンパク質に対して改良された生物学的機能を有するタンパク質を得るために、実験的に試験することができる。

ある実施態様においてこの方法は以下の工程を含む：
リードタンパク質から得られるアミノ酸配列を提供し（アミノ酸配列はリード配列と呼ばれる）；
リード配列を複数のテスタータンパク質配列と比較し；そして
複数のテスタータンパク質配列から、リード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；そして
リード配列をヒットライブラリーで置換することにより、設計したタンパク質のライブラリーの形成する。

場合によりこの方法は、以下の工程をさらに含む：
ヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
ヒットライブラリー中のアミノ酸変種を組合せて、ヒット変種ライブラリーを形成するヒット変種の組合せを生成し；そして
ヒット変種ライブラリーから好ましい機能を有するタンパク質を選択する。
また場合によりこの方法は、以下の工程をさらに含む：
スコア化関数を使用して、ヒットライブラリーまたはヒット変種ライブラリーのメンバーが構造的に、リード配列またはリードタンパク質の３次元構造と適合するかどうかを決定し；そして
リード配列またはリードタンパク質とスコアが同等かまたはより優れたメンバーを選択する。
また場合によりこの方法は、以下の工程をさらに含む：
ヒットライブラリー、ヒット変種ライブラリーまたは上記の構造評価に基づき選択されたメンバーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築し；
核酸ライブラリーを発現させて組換えタンパク質のライブラリーを作成し；そして
組換えタンパク質のライブラリーから所望の機能を有するタンパク質を選択する。
また場合によりこの方法は、以下の工程をさらに含む：
ヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
アミノ酸位置変種を対応する遺伝子コドンに逆翻訳することにより、ヒットライブラリーのアミノ酸位置変種プロフィールを核酸位置変種プロフィールに変換し；
核酸位置変種をコンビナトリアル的に組合せてDNAセグメントの縮重核酸ライブラリーを構築し；
縮重核酸ライブラリーを発現させて組換えタンパク質のライブラリーを作成し；そして
組換えタンパク質のライブラリーから所望の機能を有するタンパク質を選択する。

場合により遺伝子コドンは、特定の生物（例えば、哺乳動物細胞、昆虫、植物、酵母、または細菌）の細胞中での発現に好適なものである。場合により遺伝子コドンは、DNAセグメントの縮重核酸ライブラリーの多様性が、過度の実験的努力をすることなく実験でカバーできる多様性範囲内（例えば、1×10⁷ 未満、好ましくは1×10⁶ 未満）であるように、選択されるサイズを低下させることができるものである。

リードタンパク質は、in vitroまたはin vivoでその機能（好ましくは生物学的機能）を改良または改変することが好ましいタンパク質である。リードタンパク質は、完全長タンパク質、オリゴペプチドもしくはペプチドでもよく、また非天然のタンパク質もしくはペプチドでもよい。場合によりリードタンパク質は、公知のタンパク質の断片またはドメイン（特に限定されないが、構造および／または機能性ドメイン、例えば酵素的ドメイン、結合ドメイン、およびより小さい断片もしくはモチーフ、例えばターン、らせんおよびループ）でもよい。さらにタンパク質変種、すなわち非天然に存在するタンパク質類似体構造を使用してもよい。

リードタンパク質は好ましくは、産業界で、治療薬および／または診断薬として使用されるタンパク質である。リードタンパク質の種類は、リガンド、細胞表面受容体、抗原、抗体、サイトカイン、ホルモン、転写因子、シグナル伝達分子、細胞骨格タンパク質および酵素でもよい。

具体的な酵素の種類には、特に限定されないが加水分解酵素、例えばプロテアーゼ、カーボヒドラーゼ、リパーゼ；イソメラーゼ、例えばラセマーゼ、エピメラーゼ、またはタウトメラーゼ；転移酵素、キナーゼ、酸化還元酵素、およびホスファターゼがある。酵素の具体的な例は、Swiss-Prot酵素データベースにリストがある。

リードタンパク質サイトカインの他の例には、特に限定されないが、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-8、IL-10、IFN-β、IFN-γ、IFN-α-2a；IFN α-2b、TNF-α；CD40リガンド（chk）、ヒト肥満タンパク質リプチン、顆粒球マクロファージコロニー刺激因子（GMCSF）、骨形成蛋白質-7、毛様体神経栄養因子、顆粒球マクロファージコロニー刺激因子、単球化学誘引タンパク質1、マクロファージ遊走阻害因子、ヒトグリコシル化阻害因子、ヒトランテス（Rantes）、ヒトマクロファージ炎症性タンパク質1ベータ、ヒト成長ホルモン、白血病阻害因子、ヒト黒色腫増殖刺激活性、好中球活性化ペプチド-2、Cc-ケモカインMcp-3、血小板因子M2、好中球活性化ペプチド2、エオタキシン、間質細胞由来因子-1、インスリン、インスリン様増殖因子I、インスリン様増殖因子II、トランスフォーミング増殖因子B1、トランスフォーミング増殖因子B2、トランスフォーミング増殖因子B3、トランスフォーミング増殖因子A、血管内皮増殖因子（VEGF）、酸性繊維芽細胞増殖因子、塩基性繊維芽細胞増殖因子、内皮増殖因子、神経増殖因子、脳由来神経栄養因子、毛様体神経栄養因子、血小板由来増殖因子、ヒト肝細胞増殖因子、グリア細胞由来神経栄養因子、エリスロポエチン；凝固因子、特に限定されないが、TPAと第VIIa因子；受容体、特に限定されないが、ヒト組織因子の細胞外領域、Gp130のサイトカイン結合領域、G-CSF受容体、エリスロポエチン受容体、繊維芽細胞増殖因子受容体、TNF受容体、IL-1受容体、IL-1受容体／IL1ra複合体、IL4受容体、受容体α鎖、MHCクラスI、MHCクラスII、Ｔ細胞受容体、インスリン受容体、インスリン受容体チロシンキナーゼ、およびヒト成長ホルモン受容体がある。

本発明のさらに別の態様において、リード構造鋳型に基づくタンパク質配列のin silico設計と選択のための方法が提供される。構造鋳型と実質的に同様の構造を有する異なる配列の集合が、配列同一性は低いが構造が類似であるリード配列の遠い相同体について、タンパク質構造のデータベースを検索するためのリード配列として使用される。この方法を使用して、多様なタンパク質配列のライブラリーが構築され、改良されたかまたは所望の機能を有するタンパク質変異体について、in vitroまたはin vivoで実験的にスクリーニングされる。

本発明の具体的な態様において本発明の方法は、配列が多様で互いに機能的に関連する抗体を設計するのに使用される。設計された抗体の配列に基づき、非ヒト抗体の相補性決定領域（CDR）および／またはヒト化フレームワーク（FR）に多様な配列を含む抗体のライブラリーを、高速処理で構築することができる。この抗体ライブラリーは、新規または改良された機能について広範囲の標的分子に対してスクリーニングすることができる。
本発明のさらに別の態様において、リード抗体中の領域のアミノ酸配列に基づく抗体配列（以後「リード配列」と呼ぶ）のin silico選択のための方法が提供される。リード配列は、タンパク質配列のデータベースを検索するのに使用される。データベースの選択は、設計されたモチーフの特異的機能的要求に依存する。例えば、治療的応用のために可変鎖のフレームワーク領域を設計するために、いくつかの構造的に決定的に重要な部位を除いて、完全にヒトの免疫グロブリン配列およびヒトの生殖細胞系免疫グロブリン配列のような進化的に関連するタンパク質配列の集団を使用すべきである。これは、この高度に保存された領域（フレームワーク領域用）中にできるだけ少ない外来変異体を導入することにより、配列の起源を保持しながら免疫応答を低下させるであろう。一方、この高度に可変性の領域の抗原との結合親和性を改良するために、多様なデータベース（例えば、種々の種の免疫グロブリン配列またはジーンバンク（GenBank）中の無関係の配列）を使用してCDRを設計することができる。この方法を使用して、多様な抗体配列のライブラリーを構築し、改良されたかまたは所望の機能を有する抗体変異体について、in vitroまたはin vivoで実験的にスクリーニングすることができる。

ある実施態様においてこの方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し；
リード抗体のCDR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列である）；
リード配列を複数のテスタータンパク質配列と比較し；そして
複数のテスタータンパク質配列から、リード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択する（選択されたペプチドセグメントはヒットライブラリーを形成する）。

この方法は以下の工程をさらに含む：
ヒットライブラリーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築する。

場合により本発明は以下の工程をさらに含む：
ヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
アミノ酸位置変種を対応する遺伝子コドンに逆翻訳することにより、ヒットライブラリーのアミノ酸位置変種プロフィールを核酸位置変種プロフィールに変換し；そして
核酸位置変種をコンビナトリアル的に組合せてDNAセグメントの縮重核酸ライブラリーを構築する。

場合により、遺伝子コドンは細菌での発現に好適なものである。場合により、遺伝子コドンはDNAセグメントの縮重核酸ライブラリーの多様性が、過度の実験的努力をすることなく実験でカバーできる多様性範囲内（例えば、1×10⁷ 未満、好ましくは1×10⁶ 未満）であるように、選択されるサイズを低下させることができるものである。

別の実施態様において本方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し；
リード抗体のCDRとFR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含む第１のアミノ酸配列を提供し（選択されたアミノ酸配列はCDRリード配列である）；
CDRリード配列を複数のテスタータンパク質配列と比較し；そして
複数のCDRテスタータンパク質配列から、CDRリード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはCDRヒットライブラリーを形成する）；
リード抗体のV_HまたはV_L領域中に１つのFRを選択し；
選択されたFR中に少なくとも３つの連続したアミノ酸残基を含む第２のアミノ酸配列を提供し（選択されたアミノ酸配列はFRリード配列である）；
FRリード配列を複数のFRテスタータンパク質配列と比較し；そして
複数のFRテスタータンパク質配列から、FRリード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはFRヒットライブラリーを形成する）；そして
CDRヒットライブラリーとFRヒットライブラリーとを組合せてヒットライブラリーを形成する。

この方法において、複数のCDRテスタータンパク質配列は、ヒトまたは非ヒト抗体のアミノ酸配列を含んでよい。
また本発明において複数のFRテスタータンパク質配列は、ヒト起源のアミノ酸配列、好ましくはヒトもしくはヒト化抗体（例えば、V_HまたはV_L中に少なくとも50％のヒト配列、好ましくは少なくとも70％のヒト配列、さらに好ましくは少なくとも90％のヒト配列、および最も好ましくは少なくとも95％のヒト配列）、さらに好ましくは完全にヒト抗体、および最も好ましくはヒト生殖細胞系抗体を含んでよい。

また本発明において、少なくとも１つの複数のCDRテスタータンパク質配列は、複数のFRテスタータンパク質配列とは異なる。

また本発明において、複数のCDRテスタータンパク質配列はヒトもしくは非ヒト抗体配列であり、複数のFRテスタータンパク質配列はヒト抗体配列、好ましくはヒト生殖細胞系抗体配列である。

本方法はさらに以下の工程を含む：
ヒットライブラリーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築する。

場合により本方法は以下の工程をさらに含む：
CDRヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
アミノ酸位置変種を対応する遺伝子コドンに逆翻訳することにより、CDRヒットライブラリーのアミノ酸位置変種プロフィールを核酸位置変種プロフィールに変換し；そして
核酸位置変種をコンビナトリアル的に組合せてDNAセグメントの縮重核酸ライブラリーを構築する。

場合により、遺伝子コドンは、細菌での発現に好適なものである。場合により遺伝子コドンは、DNAセグメントの縮重核酸ライブラリーの多様性が、過度の実験的努力をすることなく実験でカバーできる多様性範囲内（例えば、1×10⁷ 未満、好ましくは1×10⁶ 未満）であるように、選択されるサイズを低下させることができるものである。

別の実施態様において本方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し；
リード抗体のFR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのFRを選択し；
選択されたFR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列は第１のFRリード配列である）；
第１のリードFR配列を複数のFRテスタータンパク質配列と比較し；そして
複数のFRテスタータンパク質配列から、第１のFRリード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択する（選択されたペプチドセグメントはFRヒットライブラリーを形成する）。

この方法はさらに以下の工程を含む：
選択されたFRとは異なるFR中に少なくとも３つの連続したアミノ酸残基を含む第２のアミノ酸配列を提供し（選択されたアミノ酸配列は第２のFRリード配列である）；
第２のFRリード配列を複数のFRテスタータンパク質配列と比較し；そして
複数のFRテスタータンパク質配列から、第２のFRリード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントは第２のFRヒットライブラリーを形成する）；そして
第１のFRヒットライブラリーと第２のFRヒットライブラリーとを組合せてヒットライブラリーを形成する。

本発明においてリードCDR配列は、選択されるCDR中に少なくとも５つの連続的アミノ酸残基を含む。選択されるCDRは、リード抗体のV_H CDR1、V_H CDR2、V_H CDR3、V_L CDR1、V_L CDR2、およびV_L CDR3よりなる群から選択される。

また本発明においてリードFR配列は、選択されるCDR中に少なくとも５つの連続的アミノ酸残基を含む。選択されるFRは、リード抗体のV_H FR1、V_H FR2、V_H FR3、V_H FR4、V_L FR1、V_L FR2、V_L FR3、およびV_L FR4よりなる群から選択される。

本方法はさらに以下の工程を含む：
ヒットライブラリーのアミノ酸配列をコードするDNAセグメントを含む縮重核酸ライブラリーを構築する。
本発明の別の態様において、リード抗体中の領域のアミノ酸配列（すなわち「リード配列」）に基づく抗体配列のin silico選択のための方法が提供される。リード配列の構造は、同様の3D構造を有するセグメントのタンパク質構造のデータベースを検索するのに使用される。これらのセグメントは、配列プロフィール（本明細書において以後「リード配列プロフィール」と呼ぶ）を与えるように整列される。リード配列プロフィールは、低い配列同一性であるが構造が同様のリード配列の遠い相同体のタンパク質配列のデータベースを検索するのに使用される。この方法を使用して、多様な抗体配列のライブラリーを構築し、改良されたかまたは所望の機能を有する抗体変異体について、in vitroまたはin vivoで実験的にスクリーニングすることができる。

ある実施態様においてこの方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し；
リード抗体のCDR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列である）；
リード配列の３次元構造を提供し；
リード配列の構造に基づいてリード配列プロフィールを作成し；
リード配列プロフィールを複数のテスタータンパク質配列と比較し；そして
複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択する（選択されたペプチドセグメントはヒットライブラリーを形成する）。

本発明においてリード配列の３次元構造は、Ｘ線結晶解析、核磁気共鳴（NMR）分光法、または理論的構造モデル化から得られる構造でもよい。

本発明において、リード配列プロフィールを作成する工程は以下を含む：
リード配列の構造を複数のテスタータンパク質セグメントの構造と比較し；
リード配列とテスタータンパク質セグメントの主鎖コンフォメーションの差の自乗平均の平方根を決定し；
主鎖コンフォメーションの差の自乗平均の平方根が5Å未満、好ましくは4Å未満、さらに好ましくは3Å未満、および最も好ましくは2Å未満であるテスタータンパク質セグメントを選択し；そして
選択されたテスタータンパク質セグメントのアミノ酸配列をリード配列と整列させてリード配列プロフィールを作成する。

場合により複数のテスタータンパク質セグメントの構造は、タンパク質データバンクから検索される。
場合により、リード配列プロフィールを作成する工程は以下を含む：
リード配列の構造を複数のテスタータンパク質セグメントの構造と比較し；
リード配列とテスタータンパク質セグメントの主鎖コンフォメーションのＺスコアを決定し；
Ｚスコアが2より大きい、好ましくは3より大きい、さらに好ましくは4より大きい、および最も好ましくは5より大きいテスタータンパク質セグメントのセグメントを選択し；そして
選択されたテスタータンパク質セグメントのアミノ酸配列をリード配列と整列させてリード配列プロフィールを作成する。

場合によりリード配列プロフィールを作成する工程は、CE、MAPS、モンテカルロおよび3Dクラスタリングアルゴリズムよりなる群から選択されるアルゴリズムにより行われる。
本方法はさらに以下の工程を含む：
ヒットライブラリーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築する。

場合により本方法はさらに以下の工程を含む：
ヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
アミノ酸位置変種を対応するトリヌクレオチドコドンに逆翻訳することにより、ヒットライブラリーのアミノ酸位置変種プロフィールを核酸位置変種プロフィールに変換し；そして
核酸位置変種をコンビナトリアル的に組合せてDNAセグメントの縮重核酸ライブラリーを構築する。

上記の任意の方法はさらに以下の工程を含む：
核酸または縮重核酸ライブラリーのDNAセグメントを宿主生物細胞中に導入し；
ヒットライブラリーのアミノ酸配列を含有する組換え抗体が宿主生物細胞中で産生されるように、DNAセグメントを宿主細胞中で発現させ；そして
10⁶ M^-1、好ましくは10⁷ M^-1、さらに好ましくは10⁸ M^-1、および最も好ましくは10⁹ M^-1より高い親和性で標的抗原に結合する組換え抗体を選択する。

本発明のさらに別の態様において、リード抗体の3D構造に基づく抗体配列のin silico選択のための方法が提供される。リード配列または使用されるリード抗体の特異的領域からの配列プロフィールは、配列同一性は低いが構造が類似のリード配列の遠い相同体について、タンパク質配列のデータベースを検索するのに使用される。これらの遠い相同体はヒットライブラリーを形成する。ヒットライブラリー中の配列は、リード抗体の3D構造（本明細書において以後「リード構造鋳型」と呼ぶ）との構造適合性について評価される。リード構造鋳型と構造的に適合性のあるヒットライブラリー中の配列が選択され、改良されたかまたは所望の機能を有する抗体変異体について、in vitroまたはin vivoで実験的にスクリーニングされる。

ある実施態様においてこの方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、リード構造鋳型として定義される既知の３次元構造を有する）；
リード抗体のCDR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列である）；
リード配列プロフィールを複数のテスタータンパク質配列と比較し；
複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
スコア化関数を使用して、ヒットライブラリーのメンバーがリード構造鋳型と構造的に適合性があるかどうかを決定し；そして
リード配列と同等であるかまたはよりすぐれたスコアのヒットライブラリーのメンバーを選択する。

本発明においてスコア化関数は、静電的相互作用、ファンデアワールス相互作用、静電的溶媒和エネルギー、溶媒がアクセス可能な表面溶媒和エネルギー、およびコンフォメーションエントロピーよりなる群から選択されるエネルギースコア化関数である。

場合によりスコア化関数は、Amberフォースフィールド（forcefiled）、Charmm フォースフィールド、Discover cvff フォースフィールド、ECEPP フォースフィールド、GROMOS フォースフィールド、OPLS フォースフィールド、MMFF94 フォースフィールド、Tripos フォースフィールド、MM3 フォースフィールド、Dreiding フォースフィールド、およびUNRES フォースフィールド、および他の知識ベースの統計的フォースフィールド（平均フィールド）および構造ベースの熱力学ポテンシャル関数よりなる群から選択されるフォースフィールドを含むものである。

また本発明において、ヒットライブラリーのメンバーを選択する工程は、
ΔE_total = E_vdw + E_bond + E_angel + E_{electrostatics} + E_solvation
の式に基づいて計算されるリード配列より低いかまたは同等の総エネルギーを有するヒットライブラリーのメンバーを選択する。

また本発明において、ヒットライブラリーのメンバーを選択する工程は、改良されたスコア化関数
ΔG_b = ΔG_MM + ΔG_sol - TΔS_SS
（式中、
ΔG_MM = ΔG_ele + ΔG_vdw (1)
ΔG_sol = ΔG_ele-sol + ΔG_ASA (2)）
を使用して、結合状態と非結合状態の差として計算されるリード配列より小さい結合フリーエネルギーを有するヒットライブラリーのメンバーを選択する。

本方法はさらに以下の工程を含む：
ヒットライブラリーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築する。
場合により本方法はさらに以下の工程を含む：
ヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
アミノ酸位置変種を対応するトリヌクレオチドコドンに逆翻訳することにより、ヒットライブラリーのアミノ酸位置変種プロフィールを核酸位置変種プロフィールに変換し；そして
核酸位置変種をコンビナトリアル的に組合せてDNAセグメントの縮重核酸ライブラリーを構築する。

本発明のさらに別の態様において、3D構造もしくはリード抗体の構造集合体、または複数の抗体の構造集合体（以後まとめてリード構造鋳型と呼ぶ）に基づき抗体配列のin silico選択のための方法が提供される。低い配列同一性であるが構造が類似のリード配列の遠い相同体のタンパク質配列のデータベースを検索するのに使用されるリード抗体の特異的領域からのリード配列または配列プロフィール。これらの遠い相同体はヒットライブラリーを形成する。ヒットライブラリーのアミノ酸位置変種プロフィール（AA-PVP）は、リード配列の各位置に現れるアミノ酸変種の頻度に基づき構築される。AA-PVPに基づき、低頻度変種の、カットオフがあるかまたは無いリード配列の各位置のアミノ酸変種をコンビナトリアル的に組合せることにより、ヒット変種ライブラリーが構築される。ヒット変種ライブラリー中の配列は、リード構造鋳型との構造適合性について評価に付される。リード構造鋳型と構造的に適合性のあるヒットライブラリー中の配列が選択され、改良されたかまたは所望の機能を有する抗体変異体についてin vitroまたはin vivoで実験的にスクリーニングされる。

ある実施態様において、本方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、リード構造鋳型として定義される既知の3D構造を有する）；
リード抗体のCDR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列である）；
リード配列を複数のテスタータンパク質配列と比較し；
複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
リード配列の各位置に現れるアミノ酸変種の頻度に基づきヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
ヒットライブラリー中のアミノ酸変種を組合せて、ヒット変種ライブラリーを形成するヒット変種の組合せを作成し；
スコア化関数を使用して、ヒット変種ライブラリーのメンバーがリード構造鋳型と構造的に適合性があるかどうかを決定し；そして
リード配列と同等であるかまたはよりすぐれたスコアのヒット変種ライブラリーのメンバーを選択する。

本方法において、ヒットライブラリー中のアミノ酸変種を組合せる工程は以下を含む：
出現頻度が4回より大きい、好ましくは6回より大きい、さらに好ましくは8回より大きい、および最も好ましくは10回より大きいアミノ酸変種を選択し（カットオフの頻度の2％〜10％、好ましくは5％であり、カットオフ後に失われた場合は、リード配列からのアミノ酸の一部を含む）；そして
ヒットライブラリー中の選択されたアミノ酸変種を組合せて、ヒット変種ライブラリーを形成するヒット変種の組合せを生成する。

本方法においてスコア化関数は、静電的相互作用、ファンデアワールス相互作用、静電的溶媒和エネルギー、溶媒がアクセス可能な表面溶媒和エネルギー、およびコンフォメーションエントロピーよりなる群から選択されるエネルギースコア化関数である。
場合によりスコア化関数は、Amberフォースフィールド（forcefiled）、Charmm フォースフィールド、Discover cvff フォースフィールド、ECEPP フォースフィールド、GROMOS フォースフィールド、OPLS フォースフィールド、MMFF94 フォースフィールド、Tripos フォースフィールド、MM3 フォースフィールド、Dreiding フォースフィールド、およびUNRES フォースフィールド、および他の知識ベースの統計的フォースフィールド（平均フィールド）および構造ベースの熱力学ポテンシャル関数よりなる群から選択されるフォースフィールドを含むものである。

本方法はさらに以下の工程を含む：
ヒットライブラリーの選択されたメンバーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築する。
場合により本方法は以下の工程を含む：
ヒット変種ライブラリーの選択されたメンバーを少なくとも２つのサブヒット変種ライブラリーに分割し；
サブヒット変種ライブラリーを選択し；
選択されたサブヒット変種ライブラリーのアミノ酸位置変種プロフィールを作成し；
アミノ酸位置変種を対応するトリヌクレオチドコドンに逆翻訳することにより、選択されたサブヒット変種ライブラリーのアミノ酸位置変種プロフィールを核酸位置変種プロフィールに変換し；そして
核酸位置変種をコンビナトリアル的に組合せてDNAセグメントの縮重核酸ライブラリーを構築する。

ヒット変種ライブラリーを分解する工程は以下を含む：
リード配列と同等かまたはより優れたスコアを有するヒット変種ライブラリーの10〜30メンバーをランダムに選択する（選択されたメンバーはサブ変種ライブラリーを形成する）。

場合により、ヒット変種ライブラリーを分解する工程は以下を含む：
ヒット変種ライブラリーのアミノ酸位置変種プロフィールを作成して、ヒット変種プロフィールを得て；
ある距離のカットオフ（8Å〜4.5Å）以内のリード配列の構造体または構造集合体のCαもしくはCβまたは重い原子の接触地図に基づき、ヒット変種プロフィールをサブ変種プロフィールのセグメントに分解する。4.5Å、好ましくは5Å、さらに好ましくは6Å、および最も好ましくは8Å以内の構造モデルもしくはリード構造鋳型。

別の実施態様において本方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、既知の３次元構造を有する）；
リード抗体以外のV_HもしくはV_L領域中の異なる配列を有する１つ以上の抗体の3D構造を提供し；
リード抗体と１つ以上の抗体の構造体とを組合せて構造集合体を形成し（構造集合体はリード構造鋳型として定義される）；
リード抗体のCDR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列である）；
リード配列を複数のテスタータンパク質配列と比較し；
複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
リード配列の各位置に現れるアミノ酸変種の頻度に基づきヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
ヒットライブラリー中のアミノ酸変種を組合せて、ヒット変種ライブラリーを形成するヒット変種の組合せを生成させ；
スコア化関数を使用して、ヒット変種ライブラリーのメンバーがリード構造鋳型と構造的に適合性があるかどうかを決定し；そして
リード配列と同等であるかまたはよりすぐれたスコアのヒット変種ライブラリーのメンバーを選択する。

［ルートVII．図2Bに示す配列から構造から機能空間へのリード配列を使用する連続的工程を請求する］

具体的な実施態様において本方法は以下の工程を含む：
a) リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、既知の３次元構造を有する）；
b) リード抗体のCDR中のアミノ酸配列を同定し；
c) リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
d) 選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列として定義される）；
e) リード配列を複数のテスタータンパク質配列と比較し；
f) 複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
g) リード配列の各位置に現れるアミノ酸変種の頻度に基づきヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
h) ヒットライブラリー中のアミノ酸変種を組合せて、ヒット変種ライブラリーを形成するヒット変種の組合せを生成させ；
i) スコア化関数を使用して、ヒット変種ライブラリーのメンバーがリード構造鋳型と構造的に適合性があるかどうかを決定し；
j) リード配列と同等であるかまたはよりすぐれたスコアのヒット変種ライブラリーのメンバーを選択し；
k) ヒット変種ライブラリーの選択されたメンバーのアミノ酸配列をコードするDNAセグメントを含む縮重核酸ライブラリーを構築し；
l) 核酸ライブラリーの多様性を決定し、多様性が1×10⁶より大きい場合は、核酸ライブラリーの多様性が1×10⁶と等しいかまたはより小さくなるまで工程j)〜l)を繰り返し；
m) 縮重核酸ライブラリー中のDNAセグメントを宿主生物の細胞中に導入し；
n) ヒットライブラリーのアミノ酸配列を含有する組換え抗体が宿主生物細胞中で産生されるように、DNAセグメントを宿主細胞中で発現させ；
o) 10⁶ M^-1より高い親和性で標的抗原に結合する組換え抗体を選択し；そして
p) 10⁶ M^-1より高い親和性で標的抗原に結合する組換え抗体が見つからない場合、工程e)〜o)を繰り返す。

別の具体的な実施態様において本方法は以下の工程を含む：
a) リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、リード構造鋳型として定義される既知の３次元構造を有する）；
b) リード抗体のCDR中のアミノ酸配列を同定し；
c) リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
d) 選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列として定義される）；
e) リード配列の１つ以上のアミノ酸残基を１つ以上の異なるアミノ酸残基で置換してリード配列を変異させて、リード配列変異体ライブラリーを作成し；
f) 第１のスコア化関数を使用して、リード配列変異体ライブラリーがリード構造鋳型と構造的に適合性があるかどうかを決定し；
g) リード配列と同等であるかまたはよりすぐれたスコアのリード配列変異体を選択し；
h) リード配列を複数のテスタータンパク質配列と比較し；
i) 複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
j) リード配列の各位置に現れるアミノ酸変種の頻度に基づきヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
k) ヒットライブラリー中のアミノ酸変種を組合せて、ヒット変種の組合せを生成させ；
l) 選択された配列変異体をヒット変種の組合せと組合せて、ヒット変種ライブラリーを産生させ；
m) 第２のスコア化関数を使用して、ヒット変種ライブラリーのメンバーがリード構造鋳型と構造的に適合性があるかどうかを決定し；
n) リード配列と同等であるかまたはよりすぐれたスコアのヒット変種ライブラリーのメンバーを選択し；
o) ヒット変種ライブラリーの選択されたメンバーのアミノ酸配列をコードするDNAセグメントを含む縮重核酸ライブラリーを構築し；
p) 核酸ライブラリーの多様性を決定し、多様性が1×10⁶より大きい場合は、核酸ライブラリーの多様性が1×10⁶と等しいかまたはより小さくなるまで工程n)〜p)を繰り返し；
q) 縮重核酸ライブラリー中のDNAセグメントを宿主生物の細胞中に導入し；
r) ヒットライブラリーのアミノ酸配列を含有する組換え抗体が宿主生物細胞中で産生されるように、DNAセグメントを宿主細胞中で発現させ；
s) 10⁶ M^-1より高い親和性で標的抗原に結合する組換え抗体を選択し；そして
t) 10⁶ M^-1より高い親和性で標的抗原に結合する組換え抗体が見つからない場合、工程e)〜s)を繰り返す。

本発明のさらに別の態様において、リード抗体に基づく変異抗体のライブラリーを構築するためのコンピューターによる方法が提供される。ある実施態様において本方法は以下を含む：
入力としてリード抗体のCDR領域中の少なくとも３つの連続的アミノ酸残基を含むアミノ酸配列を取り（アミノ酸配列はリード配列である）；
コンピューターが実行できるロジックを使用してリード配列を複数のテスタータンパク質配列と比較し；
複数のテスタータンパク質配列から、リード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し；そして
出力として、ヒットライブラリーを形成する選択されたペプチドを作成する。
上記の任意の方法において、リード配列の長さは好ましくは5〜100aa、さらに好ましくは6〜80aa、および最も好ましくは8〜50aaである。

上記の任意の方法において、CDR中のアミノ酸配列を同定する工程は、Kabat基準またはチョチア（Chothia）基準を使用して行われる。
また上記の任意の方法において、リード配列は、リード抗体のV_HもしくはV_L、CDR1、CDR2もしくはCDR3、またはCDRとFRの組合せ（例えば、CDR1-FR2、FR2-CDR2-FR3）内の特定の領域、および完全長V_HもしくはV_L配列からのアミノ酸配列を含む。リード配列は好ましくは、選択されたCDR中に少なくとも６つの連続的アミノ酸残基、さらに好ましくは選択されたCDR中に少なくとも７つの連続的アミノ酸残基、およびまた好ましくは選択されたCDR中にすべてのアミノ酸残基を含む。

また上記の任意の方法において、リード配列は、選択されたCDRにすぐ隣接する少なくとも１つのアミノ酸残基をさらに含む。
また上記の任意の方法において、リード配列は、選択されたCDRにフランキングする少なくとも１つのFRをさらに含む。

また上記の任意の方法において、リード配列は、選択されたCDRのＣ末端またはＮ末端に隣接する１つ以上のCDRもしくはFRをさらに含む。

また上記の任意の方法において、リード構造鋳型は、完全に組み立てられたリード抗体の3D構造体、またはリード抗体の重鎖もしくは軽鎖可変領域（例えば、CDR、FRおよびこれらの組合せ）である。

また上記の任意の方法において、複数のテスタータンパク質配列は、特にフレームワーク領域の、好ましくは抗体配列、さらに好ましくはヒト抗体配列、最も好ましくはヒト生殖細胞系抗体配列（Vデータベース）を含む。

また上記の任意の方法において、複数のテスタータンパク質配列は、抗体のCDRについてNIHもしくはSwiss-ProtデータベースのまたはKabatデータベースのジーンバンクから検索される。
また上記の任意の方法において、リード配列を複数のテスタータンパク質配列と比較する工程は、BLAST、PSI-BLAST、プロフィールHMM、およびCOBLATHよりなる群から選択されるアルゴリズムにより行われる。

また上記の任意の方法において、ヒットライブラリー中の選択されたペプチドセグメントとリード配列との配列同一性は、好ましくは少なくとも25％、好ましくは少なくとも35％、および最も好ましくは少なくとも45％である。
また上記の任意の方法において、方法は以下の工程をさらに含む：
核酸もしくは縮重核酸ライブラリーによりコードされるヒットライブラリーのアミノ酸配列を含有する組換え抗体を宿主生物の細胞中に導入し；そして
10⁶ M^-1、好ましくは10⁷ M^-1、さらに好ましくは10⁸ M^-1、および最も好ましくは10⁹ M^-1より高い親和性で標的抗原に結合する組換え抗体を選択する。

組換え抗体は、完全に組み立てられた抗体、Fab断片、Fv断片、または１本鎖抗体でもよい。
宿主生物は、移動された外来遺伝子配列を発現することができる任意の生物またはその細胞株を含み、特に限定されないが酵母、植物、昆虫および哺乳動物がある。

組換え抗体は、完全に組み立てられた抗体、Fab断片、Fv断片、または１本鎖抗体でもよい。例えば組換え抗体は、細菌細胞で発現され、ファージ粒子の表面に表示される。ファージ粒子上に表示される組換え抗体は、V_HとV_Lにより形成される２本鎖ヘテロダイマーでもよい。V_HおよびV_L鎖のヘテロダイマー化は、それぞれV_HとV_L鎖に融合した２つの非抗体ポリペプチド鎖の間で形成されたヘテロダイマーにより促進される。例えばこれらの２つの非抗体ポリペプチドは、それぞれヘテロダイマー受容体GABA_B R1(GR1)とR2(GR2)から得られる。

あるいは、ファージ粒子上に表示される組換え抗体は、ペプチドリンカーで連結されたV_HとV_Lを含有する１本鎖抗体でもよい。ファージ粒子の表面上の１本鎖抗体の表示は、１本鎖抗体とGR1との融合体とファージpIIIキャプシドタンパク質とGR2との融合体とで形成されるヘテロダイマーにより促進される。

それに対してスクリーニングされる標的抗原は、小分子や巨大分子（例えば、タンパク質、ペプチド、核酸およびポリ炭水化物）がある。
本発明のさらに別の態様において、コンピューターで読める媒体が提供される。コンピューター媒体には、リード抗体に基づく変異抗体のライブラリーを構築するためのロジックがあり、このロジックは以下を含む：
入力として、リード抗体のCDR中に少なくとも３つの連続的アミノ酸残基を含むアミノ酸配列を含み（アミノ酸配列はリード配列である）；
リード配列を複数のテスタータンパク質配列と比較し；
複数のテスタータンパク質配列から、リード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し；そして
出力として、ヒットライブラリーを形成する選択されたペプチドセグメントを作成する、ロジック。

本発明のさらに別の態様において、10⁶ M^-1より高い結合親和性でヒト血管内皮増殖因子（VEGF）に結合することができるモノクローナル抗体が提供される。このモノクローナル抗体は、完全に組み立てられた抗体、Fab断片、Fv断片、１本鎖抗体（scFv）でもよい。

ある実施態様においてモノクローナル抗体の重鎖CDR3は、配列番号36〜48および63〜125よりなる群から選択されるアミノ酸配列を含む。
別の実施態様においてモノクローナル抗体の重鎖CDR1は、配列番号19〜30よりなる群から選択されるアミノ酸配列を含む。

さらに別の実施態様においてモノクローナル抗体の重鎖CDR2は、配列番号31〜35よりなる群から選択されるアミノ酸配列を含む。
場合によりモノクローナル抗体の重鎖CDR3は、配列番号36〜48および63〜125よりなる群から選択されるアミノ酸配列を含み、かつモノクローナル抗体の重鎖CDR1は、配列番号19〜30よりなる群から選択されるアミノ酸配列を含む。

また場合によりモノクローナル抗体の重鎖CDR3は、配列番号36〜48および63〜125よりなる群から選択されるアミノ酸配列を含み、かつモノクローナル抗体の重鎖CDR2は、配列番号31〜35よりなる群から選択されるアミノ酸配列を含む。

また場合によりモノクローナル抗体の重鎖CDR1は、配列番号19〜30よりなる群から選択されるアミノ酸配列を含み、かつモノクローナル抗体の重鎖CDR2は、配列番号31〜35よりなる群から選択されるアミノ酸配列を含む。

別の実施態様において、VEGFに対するモノクローナル抗体の重鎖可変領域（V_H）は配列番号126のアミノ酸配列を含み、VEGFに対するモノクローナル抗体の軽鎖可変領域（V_L）は配列番号127のアミノ酸配列を含む。

さらに別の実施態様において、VEGFに対するモノクローナル抗体の重鎖可変領域（V_H）は配列番号126、128、129、130、および131のアミノ酸配列を含み、VEGFに対するモノクローナル抗体の軽鎖可変領域（V_L）は配列番号127のアミノ酸配列を含む。

本発明の方法を使用して設計される抗体は、特に限定されないが、癌、自己免疫疾患（例えば、多発性硬化症、リウマチ様関節炎、全身性エリテマトーデス、Ｉ型糖尿病、および重症筋無力症）、移植片対宿主反応病、心血管疾患、ウイルス感染（例えば、HIV、肝炎ウイルス、および単純ヘルペスウイルス）、細菌感染、アレルギー、II型糖尿病、血液疾患（例えば、貧血）を含む種々の疾患の診断または治療に使用される。抗体はまた、診断的もしくは治療的残基に結合した結合体として、または化学療法剤もしくは生物製剤と組合せて、使用することができる。抗体はまた、多様な投与経路による投与用に調製される。例えば抗体は、経口、局所的、非経口、腹腔内、静脈内、動脈内、経皮的、鼻内、吸入、膣、眼内、局所的送達（例えば化学的またはステント）、皮下、脂肪組織内、関節内、またはくも膜下投与される。

上記の任意の実施態様において、設計されるタンパク質（例えば抗体）は、合成されるか、または特に限定されないが細菌、酵母、植物、昆虫および哺乳動物を含む任意の生物の細胞中で発現される。細胞の具体的な種類には、特に限定されないが、ドロソフィラ、メラノガスター（Drosophila melanogaster）細胞、サッカロミセスセレビッシェ（Saccharomyces cerevisiae）や他の酵母、大腸菌（E. coli）、枯草菌（Bacillus subtilis）、SF9細胞、C129細胞、293細胞、ノイロスポラ（Neurospora）、BHK、CHO、COSおよびHeLa細胞、繊維芽細胞、神経鞘腫細胞株、不死化哺乳動物骨髄性細胞およびリンパ性細胞株、Jurkat細胞、肥満細胞、および他の内分泌細胞や外分泌細胞、および神経細胞がある。哺乳動物細胞の例には、特に限定されないが、すべての種類の腫瘍細胞（特に黒色腫、骨髄性白血病、肺、***、卵巣、結腸、腎臓、前立腺、膵臓および睾丸の癌）、心筋細胞、内皮細胞、上皮細胞、リンパ球（Ｔ細胞およびＢ細胞）、肥満細胞、好酸球、血管間質細胞、肝細胞、白血球（単核リンパ球を含む）、幹細胞（例えば造血幹細胞）、神経細胞、皮膚細胞、肺細胞、腎臓細胞、肝臓細胞、および心臓細胞幹細胞、破骨細胞、軟骨細胞や他の結合組織細胞、ケラチン細胞、メラノサイト、肝臓細胞、腎臓細胞、および脂肪細胞がある。

好ましくは、設計されるタンパク質は、当業者に公知の方法に従って、発現後に精製または単離される。精製法の例には、電気泳動法、分子的方法、免疫学的方法、およびクロマトグラフィー法（イオン交換クロマトグラフィー、疎水性クロマトグラフィー、親和性クロマトグラフィー、逆相HPLCクロマトグラフィー、およびクロマトフォーカシングを含む）がある。必要な精製の程度は、設計されるタンパク質の用途により変動する。ある場合には、精製の必要が無い。

また上記の任意の実施態様において、設計されるタンパク質は、所望の機能、好ましくは生物学的機能（例えば、既知の結合パートナーへの結合）、生理学的活性、安定性プロフィール（pH、熱的、緩衝液条件）、基質特異性、免疫原性、毒性などについてスクリーニングすることができる。

細胞ベースのアッセイを使用するスクリーニングにおいて、設計されるタンパク質は、好ましくは検出可能におよび／または測定可能に改変された細胞の表現型に基づき選択される。表現型変化の例には、特に限定されないが、大きな物理的変化、例えば細胞形態、細胞増殖、細胞生存能力、基質もしくは他の細胞への接着、および細胞密度；１つ以上のRNA、タンパク質、脂質、ホルモン、サイトカインまたは他の分子の発現の変化；１つ以上のRNA、タンパク質、脂質、ホルモン、サイトカインまたは他の分子の平衡状態（すなわち半減期）の変化；１つ以上のRNA、タンパク質、脂質、ホルモン、サイトカインまたは他の分子の生物活性または比活性の変化；イオン、サイトカイン、ホルモン、増殖因子、または他の分子の分泌の変化；細胞膜電位、偏光性、完全性または輸送の変化；ウイルスや細菌病原体の感染性、感受性、潜伏性、接着性、および取り込みの変化、がある。
上記の任意の実施態様において、設計されるタンパク質（例えば抗体）は、合成されるか、またはタグタンパク質もしくはペプチドとの融合タンパク質として発現される。タグタンパク質またはペプチドは、設計されるタンパク質を同定、単離、シグナル化、柔軟性の上昇、分解の上昇、分泌、移動、または細胞内保持の上昇、またはその発現の増強をするのに使用される。

定義
構造クラスター：自乗平均の平方根（RMSD）のいくつかの経験的に選択されたカットオフ値（例えば、整列した残基のCα原子の）と統計的有意性（Ｚスコア）に基づき、ファミリーに集めた一群の構造。これらの値は、目的の構造の間で全体に比較後、経験的に決定される。構造クラスターを検索するのにいくつかのプログラムを使用することができる。CE（コンビナトリアル伸長）アルゴリズム（Shindyalov IN, Bourne PE (1998) Protein Engineering 11:739-747）については、使用される基準はRMSD＜2ÅかつＺスコア＞4である。MAPS（タンパク質構造の多重整列（Multiple Alignment of Protein Structures））は、複数のタンパク質構造の比較のための自動プログラムである。このプログラムは、共通の構造類似性の3Dモデルを自動的に重ね合わせ、すべての構造中でどの残基が構造的に同等であるかを検出し、残基対残基整列を提供する。構造が同等の残基は、すべてのタンパク質の主鎖と側鎖原子のおよその位置に従って定義される。構造類似性に従って、プログラムは構造多様性のスコアを計算し、これは系統樹を構築するのに使用することができる（Lu, G (1998) 「タンパク質構造の多重整列のためのアプローチ」）。構造集合において、ファミリー内の構造鋳型の分布、および構造ファミリー内の配列もしくは配列プロフィールへの制約に関する共通の情報を理解するために、構造クラスター内のメンバーが分析される。

集合構造体：NMR（核磁気共鳴）による構造測定において、単一の構造より構造の集合（おそらく数個のメンバー）（そのすべてがNMRデータに一致し、良好な立体構造を保持する）が、タンパク質データバンク（Protein Data Bank）に保存されていることは公知である。この集合のモデル間の比較により、タンパク質コンフォメーションがNMRの制約によりいかに測定されるかについてのある程度の情報が得られる。NMRで測定される集合構造体に対応するすべての配列が同じ配列を有することを指摘したい（可変コンフォメーションを有する１つのタンパク質）。構造集合体はさらに、配列および／または長さの変動があるが、これらの構造（例えばNMR測定からまたは分子動力学シミュレーションから）以外に同様の主鎖コンフォメーションを有し、同じ配列であるが自然の形の変動のために構造が異なるものを有する。

集合配列：標的タンパク質のある性質（例えば、安定性または結合親和性）を統計的に規定する配列の集団。

集合平均または代表的構造：構造クラスター内のすべてのメンバーが同じ長さのアミノ酸を有するなら、すべての構造の主鎖原子中の原子の位置は平均化され、次に平均モデルは、NMR測定された平均構造と同様に、正常な結合距離と角度（「抑制最小化」）に従うように調整される。構造クラスター内のすべてのメンバーのアミノ酸の長さが異なるなら、クラスター内のすべての他のメンバーの平均的特徴を代表するメンバーが、代表的構造として選択されるであろう。

標準構造：超可変領域の通常存在する主鎖コンフォメーション。

構造レパートリー：あるクラスのタンパク質が占めるすべての構造の集まり、例えば抗体フレームワークおよびCDRについて観察されるモジュラー構造や標準構造。
配列レパートリー：タンパク質ファミリーの配列の集まり。

機能性レパートリー：例えば抗体について、種々の抗原に結合できる多様な機能的CDRと関係する、タンパク質が示すすべての機能の集まり。

生殖細胞系遺伝子セグメント：生殖細胞系からの遺伝子を意味する（そこからこれらが生成される半数体生殖体および二倍体細胞）。生殖細胞系DNAは、単一の免疫グロブリン重鎖または軽鎖をコードする複数の遺伝子セグメントを含有する。これらの遺伝子セグメントは生殖細胞中で運搬されるが、機能的遺伝子に準備されるまで、重鎖や軽鎖に転写も翻訳もすることができない。骨髄中でのＢ細胞分化中に、これらの遺伝子セグメントは、108を超える特異性を与えることができる動的遺伝子系によりランダムにシャフルされる。これらの遺伝子セグメント配列のほとんどは、生殖細胞系データベースから入手できる。V遺伝子データベースと呼ぶ可変重鎖および軽鎖は、配列相同性に基づいてサブファミリーに分類される。

再整列された免疫グロブリン配列：Ｂ細胞分化と成熟プロセス中に生殖細胞系遺伝子セグメントを転写および翻訳することにより生成する重鎖と軽鎖中の機能的免疫グロブリン遺伝子配列。ここで使用される再整列された免疫グロブリン配列のほとんどは、Kabat-Wuデータベースからのものである。

BLAST：対の配列解析のための基礎的局所的整列検索ツール（Basic Local Alignment Search Tool）。BLASTは、２つの配列の間の類似性を検出するのに位置非依存性のスコア化パラメータを用いる発見的アルゴリズムを使用し、デフォールトパラメータは、Expectが10、Word Size 3，Scoring matrix BLOSUM62、exostenceのGap costs 11、extension 1で使用した。

PSI-BLAST：位置特異的繰り返しBLASTすなわちPSI-BLASTプログラムは、あるラウンドの検索で見つかった配列を使用して、次のラウンドの検索のためのスコアモデルを構築する繰り返し検索を行う。PSI-BLASTでは、アルゴリズムは特定のスコアマトリックスに関係していない。従来、A×A置換マトリックスを使用して行われている（ここでAはアルファベットサイズである）。代わりにPSI-BLASTは、QxAマトリックスを使用し、ここでQは問題の配列の長さである；各点で文字のコストは、問題の配列に対する位置と対象配列中の文字に依存する。２つのPSI-BLASTパラメータが調整される；pseudocount定数デフォールトは、10から7に変更されており、PSI-BLASTモデルに一致分を含めるためのE値閾値は、0.001から0.002に変更されている。

エネルギー背景：ピークと谷が分子の集合状態を規定するエネルギー分布。エネルギー背景は、折り畳みプロセスの完全な説明ならびに局所的構造状態の説明を与えることができ、共通の最適化もしくは最小化構造は、局所的エネルギー最小内の多くの可能な状態の集まりから単一の構造種のみを説明する。

一致／一致スコア：分子の実験的に観察可能な性質（例えば、安定性、活性および親和性）の尺度。

一致背景（fitness landscape）：分子の他の固有のパラメータ（例えば配列）により規定される一致スコアの分布。

配列空間：配列レパートリーを参照。
構造空間：構造レパートリーを参照。
機能空間：機能性レパートリーを参照。

リード配列：配列データベースを検索するのに使用される配列。
変種プロフィール／配列プロフィール／位置変種プロフィール（PVP）：あるセットのペプチド配列についての各位置のアミノ酸エントロピーの記載。これは、アミノ酸（AA-PVP）または核酸（NA-PVP）の範囲と頻度の両方を含む。

ヒットライブラリー／ヒットリスト：リード配列または配列プロフィールを使用して配列データベースを検索することにより見つかる配列の集まり。

ヒット変種ライブラリー／ライブラリーＩ：ヒットライブラリーの変種プロフィールのコンビナトリアル算出から得られるin silicoアミノ酸配列ライブラリー。

ヒット変種ライブラリーII／ライブラリーII／設計されたアミノ酸ライブラリー／改良されたアミノ酸ライブラリー：再プロフィール化または具体的設計の結果としてヒット変種ライブラリーＩから得られるin silicoアミノ酸配列ライブラリー。変種の再プロフィール化は以下により行われる：1) 特定のカットオフ値または主要なアミノ酸残基を含有する配列のウィンドウを用いて、配列クラスターベースのエネルギーランキングを選択することにより、2) 機能的スクリーニングにより同定される特定の位置残基を含めることにより、および／または 3) 当業者がかかる測定をするのに利用できる任意の他の方法を使用して、残基または配列クラスターを含めるかまたは排除することにより。

ヒット変種ライブラリーIII／ライブラリーIII：機能的スクリーニングのために縮重オリゴヌクレオチドライブラリー（後述）によりin vitroで発現されるアミノ酸配列ライブラリー。ライブラリーIIIは、逆翻訳、最適化コドン使用、ヌクレオチドレベルでの組換え、および生じるコンビナトリアル核酸ライブラリーの発現のために、ライブラリーIIの配列空間を拡張する。

縮重核酸／オリゴヌクレオチドライブラリー：設計されたアミノ酸ライブラリー（上記ライブラリーII）に対応するアミノ酸変種プロフィールを標的とするのに使用される混合オリゴヌクレオチドのライブラリー。これは、最適化したコドンを使用してライブラリーIIのアミノ酸位置変種プロフィールから逆翻訳される対応する核酸位置変種プロフィールのコンビナトリアル算出から得られる。

コンビナトリアルアミノ酸／ペプチドライブラリー：アミノ酸位置変種プロフィールの完全なコンビナトリアル算出から作成されるライブラリー。ライブラリーＩとライブラリーIIはそのようなライブラリーである。

コンビナトリアル核酸／オリゴヌクレオチドライブラリー：核酸位置変種プロフィールの完全なコンビナトリアル算出から作成されるライブラリー。

DNAシャフリング：オリゴヌクレオチド断片化と相同的組換えの多重繰り返しにより親配列の混合物から組換えオリゴヌクレオチドを作成する方法（Stemmer WP(1994) Nature 370:389-391）。

in silico合理的ライブラリー設計：所望の一致を有するものを同定するために配列および構造空間中の試料集合を効率的に定義するために、進化、構造および機能データを取り込むデジタルアミノ酸もしくは核酸ライブラリーを設計する方法。

プロフィール陰れマルコフモデル（Profile Hidden Markov Model）（プロフィールHMM）：タンパク質の配列プロフィールに基づく配列ファミリーの１次構造コンセンサスの統計モデル。これは、アミノ酸の、および挿入と欠失を開き伸長するための位置特異的スコアを使用して、多重配列整列のコンセンサスの統計的記載に基づく遠い配列相同体を検出する。多重配列整列は、多重配列整列プログラム、例えばClustalWまたは構造集合が与える構造ベースの多重配列整列により、与えられる。

スレッディング：配列ならびに局所的パラメータ（例えば２次構造や溶媒暴露）を取り込むスコア化関数を使用して、構造鋳型候補のライブラリーにタンパク質の配列をつなぐことにより、タンパク質の折り畳みを割り当てる方法。スレッディングプロセスは、アミノ酸配列の２次構造の予測と問題の配列の各残基の溶媒の接近し安さとから出発する。予測される構造の生じる１次元（1D）プロフィールは、既知の3D構造のライブラリーの各メンバーにつながれる。各配列−構造対の最適スレッディングは、動的プログラミングを使用して得られる。全体的な最適配列−構造対は、問題の配列の予測される3D構造を構成する。

逆スレッディング：ある標的構造および／または構造クラスターにつなぐことにより、配列データベースから最適配列について検索する方法。種々のスコア化関数を使用して、種々の長さのタンパク質配列を含むライブラリーから最適配列について選択する。

側鎖ロタマー：側鎖の二面角またはカイ角で定義されるアミノ酸側鎖のコンフォメーション。

ロタマーライブラリー：タンパク質構造データベース中の側鎖コンフォメーションの分析から得られるすべてのアミノ酸について、骨格二面角ファイとファイ（骨格依存性ロタマーライブラリーと呼ぶ）または骨格に非依存性の二面角（骨格非依存性ロタマーライブラリーと呼ぶ）に基づく、側鎖ロタマーの分布。

Dunbrack RLとKarplus M (1993) JMB 230:543-574を参照。

発明の詳細な説明
本発明は、改良された生物学的機能、例えば生物学的および／または治療的に重要な標的分子に対する改良された結合親和性を有する、最適化されたタンパク質について、タンパク質ライブラリーを効率的に作成しスクリーニングするシステムと方法を提供する。この方法は、すべての生物、特にヒトのタンパク質配列の拡大し続けるデータベースを調べることにより、コンピューターにより高速に処理される。自然からの進化的配列のデータベース調査と、天然の配列の構造が関連する変種のコンピューターによる設計とを組合せて、本発明の方法は、タンパク質ライブラリーのコンピューターによる設計と機能的スクリーニングにおいて、他の方法からの明確な飛躍である。

この革新的方法を使用することにより、抗体のようなタンパク質の偏りのあるライブラリーを、極端に多様なタンパク質配列と機能的に関連する構造のコンピューターによる評価に基づき、in silicoで構築することができる。in silicoのライブラリー構築とスクリーニングのこの集合ベースの統計的方法は、in vitroまたはin vivoスクリーニングが事実上達成できなかった目標である、タンパク質配列と構造空間の一致とエネルギー背景の分布を効率的に作成する。in silicoスクリーニング後に、選択されたタンパク質をコードする配列に基づく拡張された核酸ライブラリーが構築され、発現系に導入され、in vitroまたはin vivoで改良されたかまたは新規機能を有するタンパク質についてスクリーニングされる。

図1は、本発明の方法の種々の実施態様を概説する一連のフローチャートである。既知の配列および／または構造を用いるリードタンパク質に基づき、タンパク質のライブラリーを構築し、図1に示す少なくとも４つの経路（経路Ｉ〜IV）後に、所望の機能を有する候補についてスクリーニングすることができる。

ある実施態様において本方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し；
リード抗体のCDR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列である）；
リード配列を複数のテスタータンパク質配列と比較し；そして
複数のテスタータンパク質配列から、リード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択する（選択されたペプチドセグメントはヒットライブラリーを形成する）。
この方法は以下の工程をさらに含む：
ヒットライブラリーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築する。

図1Aの経路Ｉは、この実施態様を模式的に示す。この実施態様において、既知の配列と構造を有するリードタンパク質（例えば抗体）が提供される。リードタンパク質の選択されたセグメント（以後「リード配列」と呼ぶ）との程度の異なる同一性について、タンパク質配列の豊富なプール（例えば、ヒト抗体レパートリー）がスクリーニングされる。このスクリーニングから、陰れマルコフモデルすなわちHMMのような配列整列法を使用して、異なる程度の相同性を有するタンパク質配列のリストが選択される（以後「ヒットライブラリー」と呼ぶ）。次にヒットライブラリーのアミノ酸配列をリード配列に対してプロフィール化して、リード配列の各位置のアミノ酸残基の変動を証明する。後述のセクション7に詳述されるように、プロフィール化配列の一部またはすべてが選択され、in vitroまたはin vivoの機能的スクリーニングについて核酸のライブラリーに逆翻訳する。

図1Bの経路IIは、この実施態様を模式的に示す。この実施態様において、ヒットライブラリーのアミノ酸配列をリード配列に対してプロフィール化した後、各残基位置のアミノ酸（またアミノ酸位置変種プロフィールまたはAA-PVPとも呼ぶ）の頻度に基づきコンビナトリアルライブラリー（以後「ヒット変種ライブラリーＩ」または「ライブラリーＩ」と呼ぶ）を構築する。このアプローチを使用して、ヒット変種ライブラリーＩは実質的にヒットライブラリーより大きい。より高頻度で観察されるもの（進化的選択を示す）に基づいて、AA-PVPを修飾（例えばフィルターにかけ）して各位置について好適な変異体に偏らせることにより、低下した変種プロフィールが生成し、そのコンビナトリアル算出によりヒット変種ライブラリーIIが得られる。ヒット変種ライブラリーIIプロフィールは、in vitroまたはin vivoでの機能的スクリーニングのために、核酸のライブラリーに逆翻訳される。

場合により、遺伝子コドンは、細菌での発現に好適なものである。場合により遺伝子コドンは、DNAセグメントの縮重核酸ライブラリーの多様性が、過度の実験的努力をすることなく実験でカバーできる多様性範囲内（例えば、好ましくは1×10⁷ 未満、より好ましくは1×10⁶ 未満）であるように、選択されるサイズを低下させることができるものである。

この方法において、複数のCDRテスタータンパク質配列は、ヒトまたは非ヒト抗体のアミノ酸配列を含んでよい。

また本発明において複数のFRテスタータンパク質配列は、ヒト起源のアミノ酸配列、好ましくはヒトもしくはヒト化抗体（例えば、V_HまたはV_L中に少なくとも50％のヒト配列、好ましくは少なくとも70％のヒト配列、さらに好ましくは少なくとも90％のヒト配列、および最も好ましくは少なくとも95％のヒト配列）、さらに好ましくは完全にヒト抗体、および最も好ましくはヒト生殖細胞系抗体を含んでよい。

また本発明において、複数のCDRテスタータンパク質配列はヒトもしくは非ヒト抗体配列であり、複数のCDRテスタータンパク質配列はヒト抗体配列、好ましくはヒト生殖細胞系抗体配列である。

本方法はさらに以下の工程を含む：
ヒットライブラリーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築する。
場合により本方法は以下の工程をさらに含む：
CDRヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
アミノ酸位置変種を対応する遺伝子コドンに逆翻訳することにより、CDRヒットライブラリーのアミノ酸位置変種プロフィールを核酸位置変種プロフィールに変換し；そして
核酸位置変種をコンビナトリアル的に組合せてDNAセグメントの縮重核酸ライブラリーを構築する。

本方法においてリードCDR配列は、選択されるCDR中に少なくとも５つの連続的アミノ酸残基を含む。選択されるCDRは、リード抗体のV_H CDR1、V_H CDR2、V_H CDR3、V_L CDR1、V_L CDR2、およびV_L CDR3よりなる群から選択される。

本方法はさらに以下の工程を含む：
ヒットライブラリーのアミノ酸配列をコードするDNAセグメントを含む縮重核酸ライブラリーを構築する。

本発明の別の態様において、リード抗体中の領域のアミノ酸配列（すなわちリード配列）に基づく抗体配列のin silico選択のための方法が提供される。リード配列の構造は、同様の3D構造を有するセグメントのタンパク質構造のデータベースを検索するのに使用される。これらのセグメントは、配列プロフィール（本明細書において以後「リード配列プロフィール」と呼ぶ）を与えるように整列される。リード配列プロフィールは、低い配列同一性であるが構造が同様のリード配列の遠い相同体のタンパク質配列のデータベースを検索するのに使用される。この方法を使用して、多様な抗体配列のライブラリーを構築し、改良されたかまたは所望の機能を有する抗体変異体について、in vitroまたはin vivoで実験的にスクリーニングすることができる。

場合によりリード配列プロフィールを作成する工程は、CE、MAPS、モンテカルロおよび3Dクラスタリングアルゴリズムよりなる群から選択されるアルゴリズムにより行われる。

ある実施態様においてこの方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、リード構造鋳型として定義される既知の３次元構造を有する）；
リード抗体のCDR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列である）；
リード配列プロフィールを複数のテスタータンパク質配列と比較し；
複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
スコア化関数を使用して、ヒットライブラリーのメンバーがリード配列プロフィールと構造的に適合性があるかどうかを決定し；そして
リード配列と同等であるかまたはよりすぐれたスコアのヒットライブラリーのメンバーを選択する。

図1Cの経路IIIは、この実施態様を模式的に示す。この実施態様において、ロタマーデータベースからの側鎖を代用することによりリードタンパク質の3D構造中にヒットライブラリーの配列を構築し、リードタンパク質の3D構造（以後「リード構造鋳型」と呼ぶ）との構造適合性についてスコア化される。構造評価に基づいて、エネルギー関数のスコアに従ってランク付けすることにより、ヒットライブラリーが再プロフィール化される。所望のエネルギー関数を有するヒットライブラリーの配列の一部が選択され、in vitroまたはin vivoの機能的スクリーニングのために核酸のライブラリーに逆翻訳される。この実施態様において、アミノ酸配列コンビナトリアル工程は無い。

本発明のさらに別の態様において、本方法は以下の工程を含む：
ある実施態様において、本方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、リード構造鋳型として定義される既知の3D構造を有する）；
リード抗体のCDR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列である）；
リード配列を複数のテスタータンパク質配列と比較し；
複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
リード配列の各位置に現れるアミノ酸変種の頻度に基づきヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
ヒットライブラリー中のアミノ酸変種を組合せて、ヒット変種ライブラリーを形成するヒット変種の組合せを作成し；
スコア化関数を使用して、ヒット変種ライブラリーのメンバーがリード構造鋳型と構造的に適合性があるかどうかを決定し；そして
リード配列と同等であるかまたはよりすぐれたスコアのヒット変種ライブラリーのメンバーを選択する。

本方法においてスコア化関数は、静電的相互作用、ファンデアワールス相互作用、静電的溶媒和エネルギー、溶媒がアクセス可能な表面溶媒和エネルギー、およびコンフォメーションエントロピーよりなる群から選択されるエネルギースコア化関数である。

本方法はさらに以下の工程を含む：
ヒットライブラリーの選択されたメンバーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築する。

図1Dの経路IVは、この実施態様を模式的に示す。この実施態様において、ヒットライブラリーのアミノ酸配列をリード配列、ヒット変種のコンビナトリアルライブラリー、すなわち変種ライブラリーＩに対してプロフィール化した後、ヒット変種ライブラリーIIが、各残基位置のアミノ酸の出現頻度に基づいて構築される（経路IIIのように）。ヒット変種ライブラリーIIの配列は、ロタマーデータベースからの側鎖を代用することにより、鋳型タンパク質の3D構造中に構築され、リード構造鋳型との構造適合性についてスコア化される。構造評価に基づき、エネルギー関数中のスコアに従ってランク付けすることにより、ヒット変種ライブラリーIIは再プロフィール化される。所望のエネルギー関数を有するヒットライブラリーIIの配列の一部が選択され、in vitroまたはin vivoの機能的スクリーニングのために核酸のライブラリーに逆翻訳される。当業者により決定される他の選択的因子に基づき、ライブラリーIIの変種プロフィールへの追加の修飾が適用される。すなわちライブラリーIIは、進化的、構造的、および／または機能的データに基づく所望のライブラリーである。

in silicoで作成される選択されたヒットリストまたはヒット変種ライブラリーIIの配列に基づいて、抗体の合成ライブラリーが実験室で構築され、標的抗原に対してスクリーニングされる。高速スクリーニングのために多様な生物学的アッセイを使用することができ、例えばファージ表示（SmithとScott (1993) Meth. Enzymol. 217:228-257）、リボゾーム表示（HanesとPluckthun (1997) Proc. Natl. Acad. Sci. USA 94:4937-4942）、酵母表示（Kiekeら、(1997) Protein Eng. 10:1303-1310）、および他の細胞外または細胞内発現系がある。

そのようなプロセス（すなわち、デジタル抗体ライブラリーのコンピューターによる予測と合成抗体ライブラリーの実験によるスクリーニング）は、選択された抗体の結合親和性を改良するために繰り返すことができる。第１ラウンドのスクリーニング後、選択された抗体の３次元構造をコンピューターでモデル化する。また、配列とコンフォメーション空間を拡大することにより構造を修飾し、これを標的抗原によるソフトドッキング（soft docking）に付して、第２世代のデジタル抗体ライブラリーを作成する。第２世代のデジタル抗体ライブラリーを次に実験的にスクリーニングして、第１世代の選択抗体より高い親和性を有する抗体を選択する。そのような修飾と抗原に対するスクリーニングの繰り返しプロセスは、脊椎動物における抗体成熟の自然のプロセスを模倣する。

本発明の概念的フレームワークと実際的応用を、以下のセクションで詳細に説明する。

1. 本発明の概念的フレームワーク
本発明は、分子生物学、特にタンパク質折り畳みと設計の分野に長い間存在する問題に対する革新的解答を提供する。本発明者らが開発したアプローチは、タンパク質折り畳みと設計の最良のアイデアを組合せて、強力な統合システムとし、これは、高速処理と低コストで現実的応用のための新規タンパク質製剤を開発することができる。
本発明者らは、分子生物学における中心的課題は、タンパク質、RNAおよびDNA分子のようなバイオポリマーの機能性レパートリーを、その配列と構造で描写することであると考えている。バイオポリマーの機能性レパートリーは、進化の過程の選択的圧力と、種々の環境条件下でのバイオポリマーの折り畳みと安定性に対する部分的制約の複雑な相互作用により作成される。天然のバイオポリマーとランダムポリマーとの差は何か。天然に存在するバイオポリマーの機能、配列および構造空間の豊富な多様性を利用して、安定な構造と正しい生物学的機能を有する新規バイオポリマーを作成するための、最適の方策は何か。これらの問題に対する答は、分子設計と進化、特に結合活性と触媒活性が上昇した新規タンパク質の発見に特に重要である。

本発明は、以下の３つの工程でこの問題に取り組む：1) タンパク質折り畳みと進化の基礎である一般的概念的フレームワークを考察し、本発明を理解するのに必要な基礎的知識を提供する；2) タンパク質折り畳みと設計およびこれらのアプローチに関連する問題に使用される現在の実験的および理論的方法を説明する；および3) タンパク質設計と工学の長年の問題の一部を解決するための本発明のアプローチを概説する。

1) タンパク質折り畳みと進化
タンパク質は、多様な生物学的機能を行うための基本的な分子である。タンパク質は、その線形配列をユニークな３次元構造に折り畳むことにより、その生物学的機能を獲得する。配列からタンパク質構造を予測することは、未解決の問題である。しかし、特に中間体の集合と折り畳み経路の遷移状態の統計的解釈の出現により、タンパク質折り畳みの機構の理解に重要な進展がなされている。

溶液中のタンパク質コンフォメーションの動的性質は、実験的および理論的研究の両方で充分説明されている。タンパク質コンフォメーションの動的変動は、酵素活性におけるアロステリック制御（Monod, J., Wyman, J. および Changeux, J.P. (1965) J. Mol. Biol., 12:88-118）、タンパク質−タンパク質やタンパク質−核酸相互作用、およびコンフォメーションゲーティング（Zhou, H-X, Wlodek, S.T., McCammon, J.A. (1998) PNAS 95:9280-9283）のような生物学的機能の一部を実施するのに必須である。

連続的集合アプローチは、静的Ｘ線構造と比較してバイオポリマーのより現実的な見解を与えるのみではなく、他の方法で説明するのは不可能な増加する実験的観察結果を説明するための一般的フレームワークを与えるため、連続的集合アプローチは、タンパク質折り畳み機構を説明するための古典的不連続状態アプローチより優れている（Hong Qian (2002) Protein Science 11:1-5）。この見解は、巨大分子の生物学的機能を理解するのに、エネルギー背景でコンフォメーション集合の連続的分布の統計的性質を使用する重要性を強調している（Baldwin RL (1995) 5:103-109 J. Biomol. NMR; Pande VJ など (1998) Curr. Opin. Struct. Biol. 8:68-79）。

ヘテロポリマーの凍結と設計を研究するために使用されるランダムエネルギーモデル（REM）は、タンパク質折り畳みと設計の優れた近似的物理的モデルとなる（Vijay S. Pande, Alexander Yu. Grosberg, および Toyoichi Tanhaka, Review of Modern Physics, Vol. 72, No. 1, 2000 およびその中の文献を参照）。ヘテロポリマーの凍結遷移の統計的性質に基づくタンパク質折り畳みと設計の単純なモデルの定量的研究により、多くのことがわかっている。連続的エネルギースペクトル中に分布した集合のコンフォメーション状態の間の相遷移は、あるセットの充分規定されたエネルギーウェルにあるいくつかの不連続な状態の伝統的見解と比較して、タンパク質の折り畳みと結合性のより現実的な説明を与える。REM背景は、ある指定された配列が動力学的に近づくことができ熱力学に安定なコンフォメーションに折り畳むための必要かつ充分な条件は、上の部分で連続的エネルギースペクトルを示し下の部分で顕著なエネルギー最小を示すエネルギー分布であることを示唆する（Vijay S. Pande, Alexander Yu. Grosberg, および Toyoichi Tanhaka, Review of Modern Physics, Vol. 72, No. 1, 2000 およびその中の文献；ShakhnovichとGutin, 1993 PNAS, 90:7195-7199を参照）。従って、指定の配列の基底状態とREM連続的エネルギースペクトルの底とのエネルギーギャップを拡大するように、配列を設計すべきである。エネルギーギャップは、配列の固有のコンフォメーションのエネルギーを低下させる（安定性のための正の設計）か、または配列の代替コンフォメーションのエネルギーを押し上げる（特異性のための負の設計）ことにより拡大される。

タンパク質折り畳みのこの単純なモデルから得られる一般的規則は、最近の新規コンピューターによるタンパク質設計において厳密に守られた：アミノ酸の組成は変化しないが、エネルギーが最小にされる（Koehl P と Levitt M (1999) J Mol Biol 293:1161-1181）。ある構造に適合する配列の集合特性を規定することは、具体的な最適配列を見つけることより重要であると言われている（Koehl P と Levitt M (1999) J Mol Biol 293:1183-1193）。設計された配列の多重整列は、情報エントロピーにより測定される配列空間を規定し；この配列空間のサブセットは、自然界で観察される同じ構造整列から得られる配列空間とサイズが似ている（Koehl P と Levitt M (2001) PNAS 1-6）。この研究は、トポロジーと安定性がある折り畳みの配列空間を規定し、配列空間のサブセットは、機能的一致により規定することができることを示す。しかし、この方法は、アミノ酸の組成を変化させないことにより、各位置のアミノ酸の選択に大きすぎる制限を与える。

タンパク質進化の動的性質は、理論的および進化的生物学者により活発に研究されている（Maynard-Smith, J (1970) Nature, 225:563-564）。一致背景を測定する値に配列をマッピング（遺伝子型）することは、進化生物学の中心的課題である。遺伝子型と表現型の関係は定量的方法で一般的に分析するには複雑過ぎるが、この関係は配列（遺伝子型）と構造（表現型）の関係に単純化され、従ってこれを使用して配列の一致を、以下のようにあるバイオポリマーの形にスコア化することができる：
遺伝子型（配列） ← 一致スコア → 表現型（構造）

自然界で観察されるタンパク質は、特異的機能を果たすという選択的圧力下で進化してきた。興味深いことに、機能的タンパク質の一致背景がマッピングされ、タンパク質折り畳み分野のような同様の手段を使用してシミュレートされている。一致背景は、タンパク質の機能的性質を増強する変異体集合を規定するために、配列空間中でマッピングされる。配列集合の統計的性質は、標的タンパク質の配列空間の中立ネットワークを説明するために使用されている（Stadler P F. Journal of Molecular Structure (Theochem) 463, 7-19 (1999); J Theor Biol 2001, 212:35-46）。

背景理論には３つの基本的成分が埋め込まれている：配向のセット；各配向に割り当てられた一致関数；および距離を規定する配向の間の連結性または配向の間の関係。一致関数は、タンパク質の性質（例えば２つのタンパク質（受容体とリガンド；抗原と抗体）の間の結合親和性、酵素の触媒活性、または標的足場の構造的安定性）として広義に規定される。

進化の観点から、天然のRNAおよびタンパク質の配列−構造関係のマッピングにより生じる一致背景は、部分的に相関する背景下で進化した配列空間の中立のネットワークの存在を予測し、新しい一致関数への一致進化への効率的な経路を提供する。これに対して、中立の隣接体（neighbor）無しで粗い一致背景で進化したランダム配列は、局所的最適条件に捕捉され、配列空間中の局所的集団に至る。天然の配列は、登山のプロセスで選択的圧力下で進化的最適化を受けてきた。配列改変による新しい一致関数への有効な経路は、ランダム変異ではなく空間空間中の中立のネットワークに従うことである（Stadler P F. Journal of Molecular Structure (Theochem) 463, 7-19 (1999); J Theor Biol 2001, 212:35-46; Aderonke Babajideなど(1997) Folding & Design 2:262-269）。点突然変異を介して一致背景を検索すること対タンパク質空間中の遺伝子組換えの相対的効率は、REMならびにヘテロポリマーベースのモデルを使用してシミュレートし、比較することができる（Bogarad L, Deem MW (1999) PNAS 96:2591-2595；Cui Y, Wong WH, Bornber-Bauer E, Chan HS (2002) 99:809-814）。

単純化モデルを使用するタンパク質折り畳みと進化の上記理論的研究は、折り畳みと進化中のタンパク質構造と配列の集合状態の統計的性質についての情報を与えた。本発明者らは、分子生物学、スピンガラスの物理学、およびヘテロポリマーの物理学の概念を組合せる理論は、バイオポリマーの動的性質の統一されたフレームワークを与えると考えている。ここで問題は、タンパク質モデルに基づくそのような概念的フレームワークを、いかにして配列と構造空間の両方でタンパク質の機能的背景をマッピングする実際的アプローチに変換するかということである。

2) 当該分野のタンパク質配列設計の現代の実験的および理論的方法とそこに横たわる問題
タンパク質工学の主要な目標は、新規または改良された機能を有するタンパク質を作成することである。このために、所望の性質を有するタンパク質（主に酵素）を得るために２つのアプローチが使用されている：in vitro指令分子進化と構造ベースのコンピューターによる設計。in vitro指令進化のアプローチは、相同配列、ランダム突然変異誘発および遺伝子シャフリングを使用して、多様な配列ライブラリーを作成する。所望の性質を有する変異体は、高速スクリーニングにより選択され、再シャフリングされる。この方法は、所望のレベルの機能的増強が達成されるまで繰り返される。

「スクリーニングしたものが得られる」という指令進化の最初の規則は、タンパク質ライブラリーの機能的一致の評価におけるスクリーニング法の重要性を強調している（Wintrode, P および Arnold, FH (2000) Adv Protein Chem. 55:161-226）。高速処理の酵素的スクリーニングの利用可能性と改良された感度が、指令進化のある程度の成功につながった。合理的工学と比較して、指令進化は、追加の情報（例えば、標的酵素の構造）をほとんどまたは全く必要とせず、規定の選択的圧力下で分子の大きなプールから生物活性についてスクリーニングすることができる。

スクリーニング能への依存性は、作成されるコンビナトリアルライブラリーのサイズに上限を設け、従って試験される機能空間のサイズに上限が設けられる。エラーが起きやすいPCRを使用するランダム突然変異誘発は、多様なライブラリーを作成するには偏りのある不充分なプロセスであるため、1回のランダム変異による有意な機能的改良の可能性は小さく、多重同時ランダム変異については急速に低下する。また核酸レベルで単一のコドン位置でいくつかの変異体を同時に作成することは困難である。

さらに、高い相同性（＞70％）を有する配列の相同的組換えへのDNAシャフリングの依存性は、生じるライブラリーがカバーできる配列空間を限定する。その結果、シャフリングとスクリーニングの各連続的繰り返しは、縮小する局所的配列空間中の試験につながる。これは、性質が増強された新しい相同配列を同定するのに効率的であるが、より大きな機能的改良を有する真に新規配列を同定するのに適切ではないかも知れない。

にもかかわらず、ランダム突然変異誘発を取り込むことにより、有効なアミノ酸置換が作成され同定される。有効な点突然変異の蓄積は、所望の性質を有する多くの重要な酵素を進化させスクリーニングするのにうまく使用されている。単純なランダム突然変異誘発方策以外に、DNAシャフリング（同じかまたは異なる種の複数の親からの遺伝子を組合せるファミリーシャフリングアプローチを含む）は、高度に改良された生体触媒を生成する（Ness J E Del Cardayre, SB Minshul, J & Stemmer, WPC (2000) Adv Protein Chem 55:261-292）。

タンパク質折り畳みと密接に関連する問題として、逆折り畳み問題としてタンパク質設計が考慮されている（Drexler, KE (1981) PNAS 78:5f275-5278；Pabo, C. (1983) Nature 301:200）（標的構造を与える配列を見いだすこと）。標的足場を与えるタンパク質配列を設計することは、広範囲の応用のために改良された性質を有するタンパク質を操作するのに重要な工程であると見なされる。

逆折り畳みプロトコールに関連する主要な課題は、剛性のあるタンパク質骨格を維持する必要性である。試験する必要のあるコンフォメーション空間は巨大であるため、現実的な理由のために、タンパク質の静的Ｘ線構造はいまだに、合理的な構造ベースのタンパク質またはドラッグデザインの出発点として使用されている。逆タンパク質折り畳みアプローチは、アミノ酸間の相互作用を記載する半経験的な全原子エネルギー機能に基づくタンパク質構造に適合する最適配列を計算しようとしている。未変性のタンパク質は、小さな変動を頑丈なコンフォメーション的適応により許容することが知られているが、剛性のあるタンパク質骨格のコンピューターによる基底状態は、タンパク質骨格または側鎖ロタマーの小さな変動を充分に許容できず、安定性の充分な尺度にならない。

これらの課題に取り組むために、規則的な２次構造間の相対的配向を調整することにより、骨格のパラメータ表示に対するいくつかの試みがされている（Harbury, PB, Tidor B. & Kim, PS (1995) Protein Science 92, 8408-8412；Su A & Mayo SL (1997) Prot Sci. 6, 1701-1707；Harbury PB, Plecs JJ, Tidor B, Alber T, Kim PS (1998) Science 282, 1562-1467）。本発明者らは、局所的束縛を緩和するための簡単だが効率的な解答は、タンパク質ループ（不規則であり、その骨格移動は一般的にパラメータ化することが困難である）について本発明で証明されるようにタンパク質の任意の種類の構造についての、骨格と側鎖とを含むエネルギーの最小化であると考えている（Keating AE, Malashkevich VN, Tidor B, Kim PS (2001) PNAS 98, 14825-30）。

規則的な２次構造（後述）のようないくつかの場合は別にして、ほとんどのタンパク質設計方策は、コンフォメーション空間を検索するという膨大な作業を低減させるために、配列選択における逆折り畳みプロトコールに厳密に従う。固定された骨格の場合でさえ、タンパク質側鎖のロタマーライブラリーから組み立てたタンパク質を安定化させるのに種々の因子を取り込む経験的エネルギー機能に対する最良の解答を検索するために、強力な検索アルゴリズム（推計学的モンテカルロ法または遺伝的アルゴリズムおよび決定論的行き止まり排除を含む）が必要である（Ponder, J.W. & Richards, F.M. (1983) J. Mol. Biol. 193, 775-791; Hellinga, H.W., Richards, F.M. (1994) PNAS 91, 5803-5807; Desjarlais, J.R. & Handel, T.M. (1995) Prot Sci. 4, 2006-2018; Dahiyat, B.I. & Mayo, S.L. (1996) Prot. Sci. 5, 895-903）。

表面に露出したアミノ酸について、進化的圧力は、充填の制約が保存されたアミノ酸選択につながるコア領域より、配列選択を決定するのにより大きな役割を果たす。しかし、表面の物理的制約が小さいこと、高度に可変性の電荷および極性溶媒和相互作用は、露出した側鎖について困難な設計上の問題を提起する。立体的制約は、タンパク質のコア位置のアミノ酸を設計するのに主要な決定因子であるため、この制限はほとんどタンパク質設計法をタンパク質のコアに限定する。

一部のアルゴリズムは、タンパク質を不連続な領域（例えば、コア、境界および表面残基）に分けて、タンパク質構造の異なる部位に対して異なるスコア化関数を持たせようとしている（Dahiyat, B.I. & Mayo, S.L. (1996) Prot. Sci. 5, 895-903）。しかし、タンパク質−タンパク質相互作用について、重要な残基はタンパク質の表面に位置し、タンパク質（最も困難かまたは不規則な構造のクラスのタンパク質）のループの上にある可能性が高い。タンパク質間の相互作用により、相互作用する残基の一部は埋まるか露出が半分になり、タンパク質の不連続な領域中の具体的なクラスの残基として相互作用をモデル化することを困難にしている。本発明者らは、タンパク質−タンパク質相互作用（例えば、抗体のCDRと抗原またはサイトカインとその受容体との相互作用）を仲介するのにタンパク質ループが広く関与しているが、当該分野で既存の方法は、良好な相同性モデルとデータベース情報とを組合せない限りは、フォースフィールドベースのアプローチのみを用いてもタンパク質のループ構造の相互作用を正確に予測することはできないであろうと考えている（van Vlijmen HW, Karplus M (1997) J Mol Biol 267, 975-1001）。

タンパク質折り畳みを予測するのに現在のフォースフィールドでは不充分であるため、タンパク質折り畳みと設計の永続的な問題は、タンパク質安定性に寄与することが知られているすべての因子を捕捉し、その予測が実験データと良く一致するエネルギー関数を開発することである。この操作がいかに精巧であっても、タンパク質の折り畳み状態と展開された状態の２つの大きな数の安定性の間の小さな差を計算することは、本質的に困難であり、誤差を招きやすい。目的の領域が、陽性残基と荷電残基を有する２つのタンパク質の間の境界（そのフォースフィールドパラメータは、正確な評価のために現在活発に研究中である）にある場合、この困難さは一層大きくなる。スコア化関数はまた、特定の試験系からの実験的フィードバックに過剰適合することがある。簡単に説明すると、タンパク質内のコアパッキングと比較して、極性および荷電残基が優勢なタンパク質の間の相互作用の正確な計算は、この分野ではいまだに困難な仕事である。本発明者は、タンパク質の疎水性コアをパッキングするのに非常に有効であることが証明されている側鎖プレーシングアルゴリズムは、この継続する問題に対して有効な解答とならない可能性があると考えている。

本発明者らは、逆折り畳みプロトコールにおいて固定骨格を使用することはまた、側鎖ロタマーの位置およびこれらの間の立体的反発を過剰制限することを強調しておく。そのような側鎖ロタマーに対する硬直的制限は非現実的である。実際のタンパク質は、コンフォメーション状態の改変集合を思わせる溶液中の動的変動により、側鎖変異またはロタマーを受け入れるであろう。規則的な２次構造要素の間のパラメータ表示は、タンパク質骨格の全体的折り畳みを進めるのに使用されていることに注目されたい（Harbury, PB, Tidor B. & Kim, PS (1995) ；Su & Mayo (1997) Prot Sci. ；Harbury PB, etc (1998) Science 282, 1562-1467）。しかし、規則的ではない２次構造要素（例えばループ）にそのようなアプローチを使用して、変動する集合状態を説明することはいまだに困難である。

コンピューター法による限界のために、せっかつな進化的タンパク質設計者達は、合理的構造ベースのアプローチを全く避けることを選択し、あるセットの強力な実験手段を発明した。しかし如何に強力でも、ランダム突然変異誘発により多様なライブラリーを作成し、これらを実験によりスクリーニングすることは、極めて非効率的である。一方、DNAシャフリングによる相同的遺伝子の組換えは、配列と構造空間の限定された試験を可能にするのみである。

本発明者らは、あらかじめ物理的制約の無いコンピューター法は、はるかに大きな配列空間を検索することができると考えている。さらに、合理的アプローチの主要な利点と主な推進力は、実験によるスクリーニングの前にすべての段階で配列を設計し制御できることである。これは、タンパク質設計者が、出発配列にほとんどまたは全く相同性を持たない新規配列の発見につながるかも知れないより大きな距離を試験するタンパク質配列空間で、より大きな実際的ジャンプをすることを可能にする。さらに、これらの「ジャンプ」の実際のサイズと方向は、新しいピークへの機能的背景に従うように実験的フィードバックに一致して制御することができる。この能力は、コンピューターの能力の増強と新規アルゴリズムおよび新しいソフトウェアツールの開発により、劇的にに上昇すると予測される。

明らかなことであるが、コンピューターの能力自体は、小さいが重要な構造変動が理解され捕捉されない限り、コンピューターによるタンパク質設計を、in vitroのタンパク質進化実験法より優れたものにするのではない。例えば、有効な変異は一般的に、触媒部位に局在化されるものではなく、変動するタンパク質骨格を有するタンパク質の大きな部分に分布していることが証明されている（Spiller B, Gershenson A, Arnold FH, Stevens R. (1999) PNAS 96, 12305-12310）。

現在の技術では、生物活性の実験によるスクリーニングがまだ、実験条件下で複雑な競合因子により制御される分子の生物学的機能を評価するために利用できる唯一の信頼できるアプローチである。コンピューター法ですべての詳細を同時に正確に捕捉し、広範な実験的試験をせずに答をピンポイントで見つけることは極めて困難である。さらに、ほとんどのスコア化関数は、活性または特異性ではなく安定性を計算できるのみである。

進化的配列設計に光をあてる一部の統計ベースのアプローチが開発されている。タンパク質折り畳みにおいてランダムエネルギーモデルに似た単純化したモデルを使用して、BogaradとDeemは、低エネルギー構造を有する非相同的DNAセグメントのDNA交換は、DNAシャフリングによる相同的DNAの遺伝子組換えより、タンパク質空間の一致背景を検索するのにはるかに効率的であり、これは点突然変異より優れていることを証明した（Bogarad L, Deem MW (1999) PNAS 96, 2591-2595）。最近、ヘテロポリマーベースのモデルが、構造ベースの進化的アプローチで一致背景の配列−構造関係をうまくマッピングするのに使用されている（Cui Y, Wong WH, Bornberg-Bauer E, Chan HS (2002) 99, 809-814）。点突然変異は、進化的背景の分散性ウォーク（diffusive walks）につながることがわかっており、ここで、低下した一致性のバリアを介して交差が起きる。エネルギーまたは一致背景の平滑さはクロスオーバーと点突然変異率の比とともに、タンパク質配列と構造空間の試験におけるクロスオーバーの有効性を決定する。すなわち、本発明者らは、進化的配列設計は、点突然変異と相同的遺伝子組換えに限定すべきではないと考えている。

実験的フィードバックもまた、タンパク質の性質の予測される改良を示し、理論的予測と実験の間の一致を改良するのに必須である（Desjarlais, J.R. & Handel, T.M. (1995) Prot Sci. 4, 2006-2018; Dahiyat, B.I. & Mayo, S.L. (1996) Prot. Sci. 5, 895-903；Keating AE, Malashkevich VN, Tidor B, Kim PS (2001) PNAS 98, 14825-30）。すなわち本発明者らは、実験的値とコンピューターによる値の一致が確認（Keating AE, Malashkevich VN, Tidor B, Kim PS (2001) PNAS 98, 14825-30）されて、広く（異なる種類のタンパク質の種々の領域の極性および荷電残基を含む）証明されなければ、実験的ライブラリーは、コンピューターからの全体的最適化またはサブ最適化解答のまわりの配列に限定すべきではないと考えている。その代わり、リード配列と同等かまたは優れたスコアのエネルギー背景への広範囲の分散をカバーするような実験的ライブラリーを構築すべきである。

in vitro指令進化とコンピューターによる配列設計が収束し始めている。例えば構造ベースの新規設計された酵素は、通常あまり活性ではない（Benson, DE, Wisz, MS & Hellinga HW (2000) PNAS 97, 6292-6297; Bolon DN, Mayo SL (2001) PNAS 98, 14274-14279）。しかし異なる足場での配列のこれらの新規設計は出発点となり、活性改良のための指令進化を受ける（Altamirano, MM, Blackburn, JM, Aguayo C, Fersht AR (1000) Nature 403, 617-622）。逆に、構造ベースのコンピューターによる方法は、指令進化における検索空間を減少させるために、進化的設計で濃縮された点突然変異の可能な部位を同定するのに使用することができるが、これらの部位は、配列プロフィール化の部位とは異なることがわかっている（Voigt CA, Mayo S, Arnold, FH & Wang Z-G (2001) PNAS 98, 3778-3783）。

しかし本発明者らは、面倒な実験室作業の前に、指令進化の方策を分析し定量的に測定すべきであると考えている。増強のために可能な実験条件と可能な限界を最適化するために、DNAシャフリングをコンピューターでシミュレートするいくつかの工程が取られている（Moore, GL, Maranas CD, Lutz S, Benkovic S (2001) PNAS 98, 3226-3231）。種々のアプローチにより検索できる巨大なタンパク質空間があるために、各実験的またはコンピューターによるアプローチに固有の効率と限界を比較して、手元の具体的な問題の最適な経路を決定することが重要である。

本発明者らはまた、構造ベースのタンパク質設計について、問題の核心は非現実的過程を用いる複雑な問題に対する決定論的アプローチにあると考えている。タンパク質を安定化する相互作用は非常に複雑であることは公知である。設計に使用される静的構造は、他のタンパク質またはリガンドと相互作用するか変化することが観察される溶液中の動的変動の集合平均である。従って、標的関数に対する最適の解答を探す考えは、興味深い理論的課題であるが、実際の生物学的問題に対してはあまり関係もしくは現実的関係が無いかも知れない。エネルギー関数の欠陥または剛性のある骨格を使用する厳密な制限またはその両方は、設計問題に対する「最適解答」を汚染するであろう。すなわち再度本発明者らは、実験的ライブラリーが、計算で使用される過程やパラメータにより偏りがあるかも知れない計算からの全体的に最適のまたは最適以下の解答のまわりの配列に限定すべきではないと考えている。その代わり、好適な範囲（例えば、リード配列より優れているかまたは同等のスコア）をカバーする配列を、実験によるスクリーニングに使用すべきである。

進化的タンパク質設計について、生体触媒（例えば酵素）としてのタンパク質の設計への現在のアプローチはまだ、科学であるというより芸術である。しかしいくつかの方法は、充分頑強であり、市販の生体触媒設計の世間の問題を解決するのに直接応用できる。DNAシャフリングやランダム突然変異誘発によるDNA組換えは機能的スクリーニングのための多様なタンパク質ライブラリーを提供してきたが、ライブラリー作成のためのより効率的な方法を探索すべきであり、そのプロセスは、最終的なスクリーニング結果にのみ依存するより、予測可能で日常的なものとなるであろう。今までのところ、指令進化は、生体触媒の設計に最も良く応用されており、これは、化学反応を容易に検出できる酵素活性について高速スクリーニングをすることが簡単なためである。

しかし本発明者らは、変異が全タンパク質配列に分布した指令進化により提供される予想外の解答はまた、薬理学的関係のあるいくつかのタンパク質を進化させる問題を提起すると考えている。治療的抗体設計において、いくつかの領域（例えばCDR、および以前は不活性のフレームワーク領域への修飾）に限定する必要のある変異は、タンパク質を免疫原性にする可能性がある。実験的シャフリング中のそのような好ましくない変異体は、逆クロス法により最小化または除去しなければならない；できれば、これらの免疫原性変異体の除去は、厳しい実験的試みにより得られる活性改良を無駄にすることが無いことを期待したい。

合理的な構造ベースのタンパク質設計は、その開発で急速な進化をし、感動的な結果を与え始めた。数年にわたって、疎水性コアを再パッキング（Malakauskas, S.M. & Mayo, S.L. (1998) Nature Struct. Biol. 5, 470-475）することにより、および自然界では観察されない新規足場を発見（Harbury P.B. ら(1998) Science 282, 1462-1467）することにより、標的足場（Dahiyat, B.I. & Mayo, S.L. (1997) Science 278, 82-87）と顕著な改良された熱安定性とを有するタンパク質変種のコンピューターによる設計において、刺激的な進歩があった。生物活性と親和性設計について、この合理的アプローチを拡張して、結合部位に対するアロステリック作用を介して結合活性を調節できるオープン、アポ、およびクローズドリガンド結合状態の３つの異なるコンフォメーション状態で、結合部位の周りに残基を設計することにより結合親和性に影響を与えるという、ある興味深い進展がなされた（Marvin, J.S. & Hellinga H.W. (2001) Nat Struct Biol 8, 795-798）。しかし生物学的および医学的関心のあるほとんどのタンパク質について、そのような設計に必要な構造情報は、まだ利用できないかまたはそのような設計には不充分な低い分解能であるが、構造ゲノム計画は、加速的速度で構造情報を増加させると考えられる。

3) 本発明のアプローチ
本発明は、集合ベースの統計的方法を使用することにより、タンパク質配列と構造空間において一致およびエネルギー背景の分布を効率的にマッピングするための革新的アプローチを提供する。

タンパク質折り畳みと設計の基礎となる原理の知識が不充分なため、タンパク質コンビナトリアルライブラリーへの集合ベースの統計的アプローチは、ある構造または構造ファミリーに適合し、リード配列より優れたスコアのエネルギー背景の分布をカバーする配列集合を設計しようとする。これは、設計されるある固定の構造への具体的な最適解答ではなく、配列または構造の分布であるため、これは統計的である。これは、具体的な配列または構造ではなく核酸ライブラリーにより標的とされる構造／配列集合であるため、これは集合ベースである。

本発明者らは、配列空間中の異なる集合へのエネルギー分布関数の分割が、以後の実験法による有効な試験を可能にすると考えている。選択されたタンパク質配列の機能空間をマッピングするためのこの統計的アプローチは、上記の一致背景の点で実際の生物学的関心のあるタンパク質配列を選択する手段を提供する。単一の最適化配列またはサブ最適配列の群より集合の統計的性質を規定することにより、タンパク質設計者は、現在のコンピューター法に固有の限界により生じる偏りのある解答に捕捉されるか間違った方向に動くことを避ける可能性が高い。

本発明のアプローチは、タンパク質折り畳みの単純なモデルの理論的研究から得られた知識と、当該分野の既存の方法に関連する問題の本発明者らの理解に基づく進化とを組合せることにより開発されている。研究と実験を通して本発明者らは、特に抗体操作という刺激的な分野の、精製折り畳み、操作、および設計についての問題に対する現実的解答を開発した。

図2Aは、本発明者らが開発したin silicoバイオポリマー進化システムを概説する。図2A〜Cに示すように、所望の機能を有する最終的候補配列への初期標的バイオポリマー（例えばタンパク質）からの経路は、生物学的重要性のある３つの空間を通過する：配列、構造および機能空間。

配列空間においては、進化的に関連する配列のデータベースを検索するためにリード配列が使用される。この検索は構造空間に応用されて、構造整列が使用されると、さらに離れた配列が得られる。ヒットライブラリーの変種プロフィールは、各位置のアミノ酸頻度と変種を記載する。

構造空間においては、低下した変種プロフィールと分割（図1C、1Dおよび2A〜C）もしくは完全な配列ライブラリー、またはこれらのランダム組合せに基づく、in silicoでヒット変種ライブラリーが作成される（図1E〜H、2AおよびCを参照）。このヒット変種ライブラリーまたはランダム／完全な配列ライブラリーは、構造鋳型を使用してスコアが付けられ、好適な配列集合が選択され、再プロフィール化されてin silicoで拡張核酸（NA）ライブラリーが生成する。in silicoのNAライブラリーのサイズが評価され、ライブラリーサイズが許容されるなら、オリゴヌクレオチド合成に進む。そうでない場合は、ヒット変種ライブラリーは小さいセグメントに再分割され、生じるライブラリーの間で配列および構造相関を維持するために、重複配列を有する小さいNAライブラリーが生成される（実施例の欄と図28A〜Cを参照）。

機能空間においてNAライブラリーは実験的にスクリーニングされる。陽性配列はコンピューターサイクルに戻して入力されてライブラリーが改良される。強い陽性クローンは、さらなる評価と治療薬開発の可能性に移される。実験によるスクリーニングにヒットするものがなければ、構造ベースのスコア化の新しいリード配列集合および／または変種プロフィールが標的システムのために選択され、プロセスが再度開始される。

図2Aの記載から明らかなように、コンピューターの分野の他の方法からの本明細書に記載のアプローチと進化的配列設計との重要な差異は、本発明が、両方の世界の最適なものを組合せて、一致背景を連続で検索し、構造空間をより効率的に検索することである。我々のアプローチは、タンパク質配列データベース中の進化的情報をタンパク質の物理的制約（例えば配列の3D構造との適合性）とを組合せる。タンパク質の生物学的機能は、配列空間中の進化的選択と構造空間中の物理的制約の両方を満足する配列の限定されたセットを試験することにより、コンピューターで評価することができる。

本発明の方法の特定の応用において、実験的およびコンピューター試験の両方のモデルシステムとして抗体が使用される。抗体は、研究、診断薬、および医学的応用に広く使用されている。抗体は良好な特異性と親和性で種々の標的に結合する。化学反応を触媒する触媒性抗体もまた、開発されている。

より具体的な応用において、抗体超可変ループまたは相補性決定領域（CDＲ）ならびにフレームワーク領域（FR）が標的とされる。CDRは抗体抗原結合と特異性を決定し、フレームワーク領域は、CDRが生物学的機能のために正しく位置する足場を与える。抗体分子は、その分子構造のために操作によく適しており、CDRとフレームワーク領域は配列的かつ構造的に規定される。

図1A（経路Ｉ）に概説されるように、発現されたタンパク質データベース中のポリペプチドセグメントは、最適化されるリード抗体の特異的領域（例えばV_H CDR3）に対してコンピューターでスクリーニングされ、リード抗体と一致する配列パターンを有するものが選択される。選択された配列はヒットライブラリーを形成する。

さらに図1B（経路II）に概説するように変種プロフィールは、ヒットライブラリー中の発生数とともに、ヒットライブラリーからの各配列位置でアミノ酸変種をリストすることにより作成することができる。このプロフィールのコンビナトリアル算出は、ヒット変種ライブラリーＩを示す。この変種プロフィールは、リード配列または対応する位置の配列プロフィールからアミノ酸を含めることにより（ここでこれらは、ヒットライブラリーから喪失している）、またはあるカットオフ頻度より下のアミノ酸変種を排除することにより、またはその両方により編集される。生じる変種プロフィールは、ヒット変種ライブラリーII（指定されたライブラリー）を規定する。

図1Cと1Dに概説するように、ヒット変種ライブラリーＩまたはIIの各メンバーは、リード鋳型構造またはモデル（利用できるなら）の対応する領域上に「移植」され、スコア化関数を使用して、3D構造の残りの部分と構造的に適合性のあるものについて選択される。場合によりヒット変種ライブラリーは標的抗原の存在下または非存在下で評価することができる。好ましいスコアを有する抗体が選択され、実験室で抗原への実際の結合親和性について実験的にスクリーニングされる。実施例の欄に記載のように、このアプローチを使用してヒト血管内皮増殖因子（VEGF）に対する多数の抗体が選択され、標的抗原VEGFに結合できることが証明される。これらの一部は、リード抗体より高い親和性を示す（図30と36）。

後述の欄のさらなる開示でさらに明らかなように、本発明により提供されるアプローチは当該分野のものと概念的に区別できるのみでなく、抗体操作において多くの現実的利点を有する。

タンパク質データベースに集められた発現されたタンパク質配列を利用することにより、このアプローチは、in silicoで親和性成熟の自然のプロセスを有効に模倣するのみでなく、改良された結合親和性によりタンパク質の進化を劇的にに速めることができる。例えば、任意のセットのアミノ酸配列（特に限定されないが、種々の種からの免疫学的興味のある配列を含む）を使用して、CDR親和性成熟のためのリード配列に対するプロフィール化のライブラリー多様性を最大にすることができる。しかし、免疫原性の可能性を最小にするために、ヒト生殖細胞系および／またはヒト起源の配列は、ヒト化またはフレームワーク設計のフレームワーク領域のリード配列に対してプロフィール化するのに使用すべきである。すなわち、その応用、サイズおよび種（例えばヒト、マウスなど、または利用できるすべての種）の起源に基づくデータベースの選択は、設計タンパク質の柔軟性と制御を可能にする。

さらに、このアプローチは、複合体構造またはモデルが利用できるなら、標的分子(例えば、リード抗体の抗原）の存在下でタンパク質変異体のモデル化を随時含む。計算に抗体と抗原の相互作用を含めることにより、スクリーニングプロセスは、抗原指令プロセスとして親和性成熟の自然のプロセスをより密接に模倣し、計算された結合親和性は実験値とよく相関するかも知れない。

さらに本発明の方法は、抗体ライブラリーのコンピューターによる予測（これは、複合体構造または構造モデルが利用できるなら、特定の標的分子もしくは抗原に偏りがある）と、抗原に対する高結合親和性を有するものを選択するためのライブラリーの実験によるスクリーニングとを組合せる。そのようなプロセスは、選択された抗体の結合親和性を改良するために繰り返すことができる。鋳型として高親和性複合体構造が利用できるなら、ヒット変種ライブラリーをコンピューターによりプレスクリーニングしてライブラリーサイズを小さくし、リード抗体の各位置のアミノ酸の完全なランダム化により作成される伝統的なライブラリーと比較して、高度に焦点化を維持することができる。in silicoでのヒット変種ライブラリーの予測と構築により、タンパク質進化の全プロセスを速め、高速処理で抗体親和性成熟の自然のプロセスを有効に模倣することができる。

好適な実施態様においてリードタンパク質は抗体または免疫グロブリンであり、標的分子は鋳型抗体に結合する抗原である。リードタンパク質は任意のタンパク質であり、好ましくはＸ線結晶学または核磁気共鳴分光法により分解される既知の３次元構造を有するタンパク質である。あるいは、鋳型タンパク質の3D構造または構造集合体は、当該分野で公知のアルゴリズムを使用してコンピューターによるモデル化により提供される。

4) 抗体選択と操作における本発明の方法と他の方法の比較
非常に多様なライブラリーからの抗体の選択は、広範囲の配列をカバーすることを可能にし、こうして最適配列を見つける機会を大きくする。しかし、例えばCDR中のリード抗体のランダム突然変異誘発から得られる抗体配列については、ランダム化したCDRの必ずしもすべての構造が、リード抗体の3D構造と適合性があるわけではない。ランダム突然変異誘発からのタンパク質配列とは反対に発現されたタンパク質配列を使用し、本発明の方法を使用して適合しない配列をフィルターにかけることにより、より少ない数の配列が選択される。その結果、スクリーニングされる抗体の配列空間は、変異抗体の親和性結合成熟と安定化に極めて関連する配列を失うことなく、サイズが低下する。

これに対して、抗体ライブラリーを構築するための当該分野の現在の方法は、免疫ヒト抗体遺伝子プール、投薬経験の無いＢ細胞Igレパートリー、または特定の生殖細胞系配列からのcDNAライブラリーのin vitro単離を含む。BarbasとBurton (1996)、前述；De Haard ら (1999)、前述；およびGriffithsら (1994)、前述。これらのライブラリーは非常に大きく、抗体配列が極めて多様である。そのような従来的アプローチは、できるだけ大きくできるだけ多様な抗体のライブラリーを作成して、インビボで抗原に対する免疫学的応答を模倣しようとする。典型的には、これらの抗体の大きなライブラリーは、ファージ表面に表示され、標的分子への高結合親和性を有する抗体についてスクリーニングされる。そのような「大きな池で釣り」または「大きな干し草の山の中の針を見つける」アプローチは、配列レパートリーのサイズの単純な上昇が、高親和性で標的抗原に結合できる抗体をつり上げる可能性が高いが、不充分な試験、不充分な多様性および不確定のライブラリー組成のために非効率的であるという仮定に基づく。

本発明者らは、そのような従来のアプローチに関連するいくつかの問題があると考えている。配列ライブラリーのサイズの単純な上昇は、機能的多様性の有効な上昇に必ずしも相関しないかも知れない。さらに、極めて大きな実験ライブラリーを作成することへの物理的限界のために、10¹¹を超える多様性を有するライブラリーをin vitroで構築することは非常に困難かも知れない。実際に実験的にスクリーニングされるライブラリーは、理論的に予測されたサイズで配列レパートリーの一部のみを与える。さらに、極めて大きなライブラリーをin vitroで取り扱い操作することに関連する困難さと過小表示のために、ライブラリーのサイズを増加させるための試みで時間とお金が失われ、それでも機能的多様性が有意に増加しないという、当然の心配がある。

当該分野に存在する他のアプローチは、人工的抗体ライブラリーをコンピューターにより設計し、次に細菌中で発現される合成抗体ライブラリーを構築することである。Knappikら、前述。人工的抗体ライブラリーは、生殖細胞系ファミリーに従って重鎖と軽鎖配列の各サブグループのコンセンサス配列に基づいて設計された。コンセンサスは、使用頻度に応じて自動的に加重値を与えられた。再整列した配列の集団に対して検索することにより、各コンセンサス配列の最も相同的な再整列配列を同定し、コンセンサスがこの最も近い再整列された配列と異なるすべての位置を調べた。さらに７つのV_Hおよび７つのV_Lコンセンサス配列についてモデルを作成し、その構造的性質について分析した。

しかし、選択された抗体の治療的応用に関する限り、そのようなアプローチについていくつかの問題がある。コンセンサス配列の定義は自由すぎて、規定されるそのような人工的配列が自然の機能的構造を代表しないかもしれないが、実験と構造分析はいくつかの好ましくないアミノ酸の組合せを排除する。コンセンサス配列は、再整列ヒト配列でよく使用されるヒト生殖細胞系配列を主にカバーするように設計されているが、これはコンセンサス配列ライブラリーを、進化の過程でこれまで接触してきた限定された数の抗原に向けるという偏りがあるかも知れない。これらのライブラリー構築法は主に、大きな抗体ライブラリーからリード抗体またはヒットを見つけることに焦点を当てているが、親和性成熟について、上記アプローチのほとんどはいまだに抗体親和性成熟について極めて限定されている。より古典的なアプローチ（例えば、CDR歩行、ランダム突然変異誘発、CDRの各位置での段階的飽和突然変異誘発など）が、抗体親和性成熟に使用されている。本発明は、親和性成熟の偏りのあるライブラリーを設計するようになっている。

本発明者らは、異なる種からの構造をマッピングすることにより機能空間を試験することは、抗体ライブラリーの広範囲の機能的CDRをカバーし、これが結合できる抗原の範囲を拡張できると考えている。このアプローチは、新規抗原を標的とするための抗体ライブラリーの設計において非常に重要であろう。本発明の方法は典型的には、抗体または他の天然起源由来の構造的制約に依存する。本発明において、各ライブラリー配列をリード抗体の3D構造フレームワークにフィッティングすることにより、ヒトおよび他の種からのものを含む利用できるすべてのタンパク質（好ましくは抗体）の完全な配列空間を分析することができる。

この分析に基づき、生じる変異体抗体は、その配列が新規であるのみでなく、リード抗体より高い親和性を有する。後述の実施例の欄に示すように、本発明の方法を使用して多くの変異体抗体が選択され、リード抗VEGF抗体と同等かまたはより強い親和性でヒトVEGFに結合することが実験的に証明される。

2. 本発明のタンパク質設計方策を実施するのに使用される方法の詳細な説明
この方法は、配列、構造および機能空間の探索と、これらの間の関係の評価を含む（図1A〜D、1E〜H、2A〜C）。出発点は、利用可能なら、リード構造またはリード配列またはその両方である。方法は、機能的スクリーニングのために最適化された変種プロフィールを同定するために、配列空間と構造空間の両方を系統的に調べる。３つのモードの情報交換がある：i) 配列および／または構造空間中の情報の別々の評価と次に組合せ、ii) 配列から構造へ、または構造から配列へ、またはiii) 配列または構造単独からの連続的評価。配列設計は配列空間と構造空間で別々に調べられる（２つの別のサイクル）が、これらの２つの別々のサイクルからの変種プロフィールを比較し、組合せて、機能的スクリーニングにおける強力候補を産生する可能性のある良好なコンセンサス変種プロフィールを有する最適の全体的変種プロフィールに到達することができる。

標的配列を相同配列と比較する結果として、または既知の相同的構造の構造的整列により、配列プロフィールが得られるため、２つの出発点は機能的に相互に関連している。配列プロフィールはまた、機能的または構造的情報を示唆する変異データから得られる。同様に構造集合体は、分子動的シミュレーションにより作成されるが、既知の構造の配列整列からまたは相同的ベースのモデル化から得ることもできる。

各サイクルで到達する変種プロフィールは、さらなる改良のために比較されているおよび／または他のサイクルに移されるため、配列と構造空間中の２つのフィルター化および改良サイクルは、フィルター化と評価工程でさらに関連している。配列由来の変種プロフィールについて、これは、変種プロフィールをランク付けし改良するために、構造空間中の既知の鋳型について構造的に評価される。逆に、構造由来の変種プロフィールは配列空間に移されて、これらが、ヒットもしくは変種ライブラリーの同じスーパーファミリーに属するかどうか、または最終的なライブラリーサイズを制御するための比較と分割のために評価することができる。

1) 配列空間
配列空間では、目標は、標的機能について最適化された変種プロフィールを決定することである。このサイクルは、データベース配列検索と配列プロフィールを使用した整列によるヒットライブラリーの同定で始まる。これは、単純なBLAST検索またはプロフィールHMMのような確率的アプローチである。ヒットライブラリー内の変動に基づき、配列がフィルター化され分割される。これは、各位置のアミノ酸頻度と分布を評価することにより行われる。通常各位置で最も高い頻度を有する残基ならびに標的配列からの残基が、変種プロフィール内に含まれる。変種の頻度の分布、または各位置で比較的より高くランク付けされるアミノ酸に依存するカットオフ値（それぞれ5％またはそれ以上）を、変種プロフィール内に含めることができる。

分割は、オリゴヌクレオチドライブラリーの最終的サイズに現実的な限界を設けるために必要かも知れない。分割は、オリゴヌクレオチドライブラリーのサイズを、種々の変種プロフィールセグメントの縮重核酸ライブラリーの機能として計算することにより決定される。すなわち、高度に可変の変種プロフィールは、生じるオリゴヌクレオチドライブラリーのサイズが、有効で効率的な実験的合成、形質転換およびスクリーニングについての限界内に設定できるように、分割することができる。

別の分割スキームは、構造相関情報を使用することである。３次元で折り畳みするペプチドは順番に遠いセグメントと相互作用するため、分割のために構造的に相関する配列を割り当てるために構造鋳型またはモデルを使用することができる。例えばループの末端は相関するが、頂点自体は末端とあまり相互作用しない。そのような場合、変種プロフィールは少なくとも２つのプロフィールに分割される：１つは２つの末端のために、１つは頂点のために。

変種プロフィールを高度に分割するのに、アプローチの片方または両方が使用される。分割する時、隣接セグメントの間である程度構造相関が維持されるように、セグメント間で少なくとも２つ、好ましくは３つ、またはそれ以上の残基重複があるべきである。機能的に最適化されたオリゴヌクレオチドライブラリーサイズを達成するために、アプローチの片方または両方が使用される。

配列変種プロフィールがいったん決定されると、既知の構造鋳型または相同性ベースのモデルおよびスコア化関数（後述）を使用して、そのライブラリーがコンピューターによりスクリーニングされる。このランキングは、好ましくない変種をフィルター化により除去しながら好ましい変種を同定することにより変種プロフィールをフィルター化し減少させ、こうして同時に実験的ライブラリーのサイズを濃縮し減少させる。

2) 構造空間
構造空間では、目標は、標的機能について最適化されている変種プロフィールを決定することであるが、１つの構造または構造の集合で出発して、次に構造の集合の平均に基づいて配列をスコア化する。このサイクルはあるセットの構造と、コンピューターによりスクリーニングできスコア化関数を使用して評価できる関連する配列に開始する。

すべての物理化学的変数を説明できる理論的理想的なスコア化関数について、エネルギースコアランク付けは、機能的ランク付けと完全に相関するであろう。これは可能ではないしコンピューターでも現実的ではなく、構造または配列が機能との相関が悪い不完全なスコア化関数を使用しなければならない。設計プロトコールの目標は、所望の機能を有するあるセットの可能な配列を同定することであるため、不完全だが配列と構造を機能と相関させるスコア化関数を使用することができる。

そのようなスコア化関数は、コンピューター項の任意の組合せを含み、機能的値を配列または構造の値と相関またはマッピングさせる。単純な例は、疎水性充填関数を脂肪族または芳香族側鎖の適切な密度を有する配列と相関させるファンデアワールスエネルギーである。別の例は、配列中の特定の位置の求核性側鎖基の存在と相関する酵素的加水分解活性である。

一般に、スコア化関数は、タンパク質の構造的安定性と機能に相関する一部またはすべての寄与項を含む熱力学的エネルギーの合計に基づくであろう。最も一般的には、これらは、静電的溶媒和エネルギー、非極性溶媒和エネルギーおよび側鎖と骨格エントロピーを含むであろう。MM-PBSAまたはMM-GBSAは、分子力学（MM）フォースフィールドを使用して計算された標準項を、ポアソン−ボルツマン（BP）式を解いて、または一般化ボーン（Born）（GB）近似を使用して計算された連続的溶媒モデルを用いる静電的溶媒和を含む溶媒和項、および表面積（SA）との比率に基づく溶媒がアクセスできる溶媒和項とを、コンフォメーションエントロピー（骨格と側鎖を含む）からの寄与とともに、組合せる方法である。実験的値と分子動的シミュレーションから得られる集合構造体に基づいてMM-PBSAで計算された値との間に良好な相関が報告されている（Wang, W, Donini O, Reyes CM, Kollman PA. (2001) Annu Rev Biophys Biomol Struct 30, 211-43）。MM-PBSAに基づくこの改良されたスコア化関数は、鋳型構造との適合性について配列ライブラリーをスキャンするのに使用したCONGENで行われたAmber94フォースフィールドの総エネルギーに基づいて単純なスコア化関数を評価するのに使用した（例えば、図12を参照）。ここで使用した単純なスコア化関数と、１つの鋳型構造（1cz8）を使用してリード配列のヒットライブラリーについて改良されたスコア化関数との比較（図12DとE）は、単純なスコア化関数が改良されたスコア化関数と相関することを示唆するが、相関地図中の有意な分散は、改良されたスコア化関数との一致を改良するために単純なスコア化関数にある改良ができることを示唆する。

タンパク質およびドラッグ設計で使用される他のスコア化関数と比較して、MM-PBSAまたはMM-GBSAはスコア化の良好な物理モデルであり、種々の問題を均一に扱うが、これは、システムの集合平均を計算するのに陽関数の水の分子動的シミュレーションから複数の軌道が必要なため、コンピューター的には高価である。この方法は、単純なスコア化法を超えて一部の困難な変異体を研究するのに有用であり、高速処理コンピューターによるスクリーニングで使用される方法を評価するための対照として役立つ。

3) 最適化変種プロフィール
設計プロトコールの最初の結果は、最適化変種プロフィールである。これは、配列と構造評価の両方の結果を具体化し、その結果進化的および構造的選択が設計中に取り込まれる。機能空間中の以後の工程は、このプロフィールを評価し改良することを目的とするが、必要であれば、以前の工程を修飾して、設計プロトコール中の種々の工程で、生じるライブラリーの循環濃縮が行われる。

好適な実施態様において本方法は以下を含む：
本方法は以下の工程を含む：
a) リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、既知の３次元構造を有する）；
b) リード抗体のCDR中のアミノ酸配列を同定し；
c) リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
d) 選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列として定義される）；
e) リード配列を複数のテスタータンパク質配列と比較し；
f) 複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
g) リード配列の各位置に現れるアミノ酸変種の頻度に基づきヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
h) ヒットライブラリー中のアミノ酸変種を組合せて、ヒット変種ライブラリーを形成するヒット変種の組合せを生成させ；
i) スコア化関数を使用して、ヒット変種ライブラリーのメンバーがリード構造鋳型と構造的に適合性があるかどうかを決定し；
j) リード配列と同等であるかまたはよりすぐれたスコアのヒット変種ライブラリーのメンバーを選択し；
k) ヒット変種ライブラリーの選択されたメンバーのアミノ酸配列をコードするDNAセグメントを含む縮重核酸ライブラリーを構築し；
l) 核酸ライブラリーの多様性を決定し、多様性が1×10⁶より大きい場合は、核酸ライブラリーの多様性が1×10⁶と等しいかまたはより小さくなるまで工程j)〜l)を繰り返し；
m) 縮重核酸ライブラリー中のDNAセグメントを宿主生物の細胞中に導入し；
n) ヒットライブラリーのアミノ酸配列を含有する組換え抗体が宿主生物細胞中で産生されるように、DNAセグメントを宿主細胞中で発現させ；
o) 10⁶ M^-1より高い親和性で標的抗原に結合する組換え抗体を選択し；そして
p) 10⁶ M^-1より高い親和性で標的抗原に結合する組換え抗体が見つからない場合、工程e)〜o)を繰り返す。

図2Bに示すように、本方法は、構造ベースの多重整列に基づく標的配列または配列プロフィールから出発し、進化的濃縮配列データベースに基づいて変種プロフィールについて検索し、次に構造鋳型または集合とのその適合性を評価し、次に実験的に標的化することができる配列集合を選択する。この方法は、我々の例で例示される。まずこれは、まだ理論的計算では捕捉されていない配列またはその組合せ中にコードされる進化的情報（発現、折り畳みを含む）を利用する。第２に、無関係の多くのランダム配列を除去した後、生じるライブラリーについて構造ベースのスクリーニングは、改良されたコンピューターによるスクリーニングを受ける。また集合構造体を使用してその一部に、MM-PBSAのような改良されたコンピューターによるスコア化を適用することができる。本発明者らは、この方法は、時間とコストを大幅に節約して、実験によるスクリーニングについて高度に改良された配列ライブラリーを与えると考えている。

図2Cは、本方法の他の実施態様を例示する。本方法は以下の工程を含む：
a) リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、リード構造鋳型として定義される既知の３次元構造を有する）；
b) リード抗体のCDR中のアミノ酸配列を同定し；
c) リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
d) 選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列として定義される）；
e) リード配列の１つ以上のアミノ酸残基を１つ以上の異なるアミノ酸残基で置換してリード配列を変異させて、リード配列変異体ライブラリーを作成し；
f) 第１のスコア化関数を使用して、リード配列変異体ライブラリーがリード構造鋳型と構造的に適合性があるかどうかを決定し；
g) リード配列と同等であるかまたはよりすぐれたスコアのリード配列変異体を選択し；
h) リード配列を複数のテスタータンパク質配列と比較し；
i) 複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
j) リード配列の各位置に現れるアミノ酸変種の頻度に基づきヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
k) ヒットライブラリー中のアミノ酸変種を組合せて、ヒット変種の組合せを生成させ；
l) 選択された配列変異体をヒット変種の組合せと組合せて、ヒット変種ライブラリーを産生させ；
m) 第２のスコア化関数を使用して、ヒット変種ライブラリーのメンバーがリード構造鋳型と構造的に適合性があるかどうかを決定し；
n) リード配列と同等であるかまたはよりすぐれたスコアのヒット変種ライブラリーのメンバーを選択し；
o) ヒット変種ライブラリーの選択されたメンバーのアミノ酸配列をコードするDNAセグメントを含む縮重核酸ライブラリーを構築し；
p) 核酸ライブラリーの多様性を決定し、多様性が1×10⁶より大きい場合は、核酸ライブラリーの多様性が1×10⁶と等しいかまたはより小さくなるまで工程n)〜p)を繰り返し；
q) 縮重核酸ライブラリー中のDNAセグメントを宿主生物の細胞中に導入し；
r) ヒットライブラリーのアミノ酸配列を含有する組換え抗体が宿主生物細胞中で産生されるように、DNAセグメントを宿主細胞中で発現させ；
s) 10⁶ M^-1より高い親和性で標的抗原に結合する組換え抗体を選択し；そして
t) 10⁶ M^-1より高い親和性で標的抗原に結合する組換え抗体が見つからない場合、工程e)〜s)を繰り返す。

4) 機能空間
機能空間では、目標は、最適化変種プロフィールから得られるライブラリーを発現しスクリーニングすることである。機能的サイクルを含む２つの成分がある。機能に直接影響を与えないかも知れないがタンパク質の発現に重要な操作成分は、オリゴヌクレオチドの最適化である。オリゴヌクレオチドライブラリーのサイズに対する現実的制限の決定は、変種の配列分割と再プロフィール化へのガイドとして使用される。

他の成分は、すべての以前の工程の結果を直接反映する機能的スクリーニングであり、設計方策の最終的評価部分である。実験的機能的スクリーニングの結果は、ライブラリー候補がさらなる評価に移すことができるかまたは以前の工程からのライブラリーを濃縮および改良するのに使用することができるかを決定する。例えば、種々のレベルの機能を示す配列のセットは、変種プロフィールを狭めるために、または記載の位置で異なる残基に加重を付けるのに使用することができる。さらに、縮重オリゴヌクレオチド設計の使用による配列空間のジャンプは、新規の機能的変種の同定につながり、これは最適化変種プロフィールをさらに濃縮するのに使用することができる。あるいはアミノ酸の特定のセットの頻度は、機能的優先性または発現の優先性を反映することがある。後者の場合、低発現であるが良好な機能を示す配列は、機能を維持しながら発現レベルを改良するコドン使用の修飾を促進することがある。最も高頻度の変種のみを選択することはコンセンサスにのみ近づき、「平均」機能性配列に至る可能性があるため、いくつかの第２のまたは第３の「段」の変種、すなわち低い頻度で存在する変種を選択することが重要である。例外的変種が、自然には観察されていない組合せからくることがある。我々は、ガイドとして自然の進化的パターンを使用するが、自然には観察されていない組合せを捜しており、これは、これらが進化時間スケールでは好ましくないが我々が直ぐ応用するのに有用であるか、またはおそらく自然はこれらをまだ試していないためである。この意味で、ランダム変異体またはこれらの組合せの構造ベースのスクリーニングは、自然にはまだ観察されていないが構造的に好適な変異体を与える可能性があるが、これは、構造とポテンシャル関数の正確さならびにコンピューターの速度に厳しい要求を突きつける。

5) 繰り返し、改良、および濃縮
設計プロトコールは、評価される異なる空間に従って分割されるが、すべての操作サイクルは相互に関連し統合されて、情報を交換することができ、任意の空間を自由に循環して、最適化変種プロフィールに基づきライブラリーを連続的に改良および濃縮する。その結果、標的配列または構造から候補配列への経路は単一の経路ではなく、３つのサイクルの間の一連の振動であり、それぞれが最適化変種プロフィールの選択を改良する。

さらに、設計プロトコールの機能性評価と繰り返し性は、変種選択を改良するだけでなく、少なくとも調べた範囲の配列と構造についてスコア化関数の正確度を向上させる。予測が失敗したことは、適合性の無い鋳型であることを示す。これはまた、特定の寄与（例えば、機能的スクリーニングにおけるグリシン優先性における骨格エントロピー）は、より重く加重すべきであることを示す。特定の荷電残基（例えば、V_H CDR3中のArg対Lys）は、特定のコンフォメーションを配向させる役割のために好ましいことがある（後述の欄を参照）。

6) スコアとランク付けによる配列の再プロフィール化
上記したように、ヒット変種ライブラリー中の配列は、抗原の存在下および非存在下でのリード抗体との構造的適合性に基づいて評価することができる。構造評価から得られるスコアとランク付けに従って、ヒット変種ライブラリー中の配列は再プロフィール化されて、機能的配列のための配列および構造空間の試験を最適化する。この工程は、リード配列よりスコアの良いヒット変種ライブラリーのサブ集団の選択と、最適化ライブラリーを作成するためのそれらの再プロフィール化とを含む。１つの選択肢は、リードよりスコアの良いすべての配列の再プロフィール化である。しかしこれは、実験によるスクリーニングのためのライブラリーが大きくなりすぎる。好適な方法は、ある低エネルギー窓またはいくつかのそのようなサブセット中の配列サブセットを選択することである（図7）、これは、後述の欄と図6に概説されるように、実験的核酸ライブラリーの最終的サイズを小さくするであろう。合理的選択と設計とを組合せると、この工程は、スコアの良い配列を有するライブラリーを濃縮するはずである。

プロフィールの修飾と最適化は、物理的な核酸ライブラリーの最終的サイズを考慮しなければならない（図6）。１つの方策は、ヒット変種ライブラリーの最大スコアの10〜20％を再プロフィール化して、位置変種の数を、実験で容易に標的化できる限界内に制限することである（好ましくは縮重核酸ライブラリーについては＜10⁶）。同様に我々は、ある位置に所望のアミノ酸を含有する低エネルギー配列のセットを選択してもよい。

7) 断片への配列の分割
サイズを制御する他の方策は、構造空間中の構造的に相関する断片と相関しない断片に基づいて、配列を分割することである。より小さい変種プロフィールを有するこれらの分割した配列は、いくつかの小さいライブラリーを作成するのに使用することができる。この説明は、第１近似として構造が離れたセグメントはしばしば無関係であり、その結果大きく分かれた変異は独立に処理することができるが、空間中で互いに結合する断片は、コンビナトリアル核酸ライブラリーにより同時に標的化すべきであるというものである。ループの場合は、ループの基部を形成する配列は一般にループの閉鎖に関連するが、頂部はしばしばループの基部とは相関しない。そのような場合、アミノ酸サブ変種プロフィールは３つのセグメントに分割され、第１と第３のセグメント（ループの基部）があるプロフィールとライブラリー設計に使用され、第２のセグメント（ループの頂部）は第２のプロフィールとライブラリー設計に使用される。生じるライブラリーの間の小レベルの構造的相関を維持するために、断片間に２または３つの位置重複があるはずである。同様に、より長いプロフィールは、配列と対応するライブラリーの長さにまたがるようにするために、重複セグメントの連鎖に分割することができる。CαまたはCβ距離マトリックスのような単純な基準を調べて、相関するセグメントを同定することができる（図28A）。場合により、より詳細な相互作用マトリックスをマッピングして、相互作用の数と種類を調べることができるが、基礎的原理は相関セグメントを同定するものと同じである。

生じる再プロフィール化は、観察された実験的または構造的基準に基づいてさらに修飾され増強される。これらには、追加の極性アミノ酸との既知の水素結合の種々の位置、大きな脂肪族または芳香族基とのファンデアワールス接触の大きい領域、またはグリシンによる柔軟性の上昇により利益を受ける領域がある。実験的フィードバックにおいて、以後の設計改良のための基礎として、早期スクリーニングからのアッセイ結果に基づいて変種を加えてもよい。より洗練された分析は、配列内のアミノ酸基の結合（例えば、塩結合または水素結合）を考慮してもよい。追加の設計上の制約には、溶媒がアクセスできるタンパク質の非極性基の表面積がある。

修飾され最適化されたプロフィールにより、我々は、「ヒット変種ライブラリーII」とよぶ新しいアミノ酸配列ライブラリー、またはライブラリー群（ヒット変種ライブラリーIIA、IIB、IICなど）を作成し、これらを同じエネルギー関数を使用してスコア化する。変種組換えとプロフィール修飾は、カバーされる配列および構造空間に拡張されると考えられるため、エネルギー分布は元々のエネルギー窓の外に拡張するはずである（図7、13A、17A、および18）。

本発明の方法の種々の実施態様を以下に詳細に説明する。

3. in silicoでのヒット抗体ライブラリーの構築
図1Aに例示されるようにヒットライブラリーは、リード抗体の領域からのリード配列に基づいてin silicoで構築することができる。タンパク質配列のデータベース（例えば、NIHのジーンバンク（GenBank）、または抗体のCDRのKabatのデータベース）からの配列を、リード配列との整列に基づいて、種々の配列整列アルゴリズムを使用して検索する。

図3は、ヒットライブラリーを構築するための方法の例を示し、これは、リード配列または配列プロフィールとの異なる同一性のタンパク質配列データベースの検索から始まる。リード配列プロフィールは、同じファミリーの構造モチーフ内で配列を整列させることにより作成される。このリード配列プロフィールは、リード配列への相同性の小さいヒットライブラリーについて配列データベースを検索するためのHMMを構築するのに使用することができる。このアプローチは、多様なヒット配列の豊富なプール（すなわちヒットライブラリー）を見つけて、データベースからのリード配列のすべての利用可能な変種が含まれることを確認するために行われる。

リード配列に対してスクリーニングされるデータベースは、好ましくは発現されたタンパク質配列（すべての生物の配列を含む）を含む。さらに好ましくは、このタンパク質配列は、哺乳動物（ヒトを含む）や、フレームワークを標的とするならげっ歯類に由来してもよい。場合によりタンパク質配列は、特定の種または同じ種の特定の手段からでもよい。例えばヒト免疫グロブリン配列データベースから採取されるタンパク質配列は、ポリペプチドセグメントのライブラリーを構築するのに使用することができる。完全なランダムなタンパク質配列を使用してライブラリーを構築する従来の方法と比較して、本発明のこのアプローチは、タンパク質の進化から得られる配列情報を利用し、こうして抗体生成と親和性成熟の自然のプロセスをより厳密に模倣する。

設計されるタンパク質の領域／ドメインに依存して、異なる進化的起源を有するタンパク質のデータベースが利用される。例えば、設計抗体のヒト免疫原性を低下させるために、ヒト起源の配列さらに好ましくは生殖細胞系配列が、設計目的に使用される。一方、CDR中の多様性を上昇させるために、広範囲のデータベースおよび／または構造ベースの設計法から広範な配列検索と選択が利用されて、構造および／または機能的多様性を上昇させる。そのような配列および構造ベースの選択により、配列のまれな組合せがCDRに見つかるが、フレームワーク領域中の配列はできるだけヒト配列ファミリーに近く維持される。

さらに、多様な種（ヒトまたは他の非ヒト種、特に限定されないが、マウス、ウサギなどを含む）の配列からのアミノ酸残基のいくつかの組合せが、ある領域（例えば、抗体中のCDRとフレームワークの境界）で好ましいことがある。このアプローチは、種々のモチーフの間で相対的配向を維持するかまたは最適化するために行われる。

多くの配列整列法を使用して、データベースからの配列を高〜低配列同一性の範囲のリード配列（またはリード配列プロフィール）と整列することができる。多くの配列ベースの整列プログラムが開発されており、特に限定されないが、Smith-Watermanアルゴリズム、Needleman-Wunschアルゴリズム、Fasta、Blast、Psi-Blast、Clustalxおよびプロフィール陰れマルコフモデルがある。

場合により、密接に関連する配列（例えば、＞50％の配列相同性）を検索するために、BLAST（基礎的局所的整列検索ツール（Basic Local Alignment Search Tool））のような単純な配列検索法を使用することができる。BLASTは、２つの配列間の類似性を検出するために位置非依存性スコア化パラメータ（例えば、BLOSUM62など）を用いる発見的アルゴリズムであり、日常的配列整列で広く使用されている（Altschul SF, Gish W, Miller W, Myers EW, Lipman Dj (1990) J Mol Biol 215, 403-410）。しかしBLAST分析は、あまりにも限定的過ぎてリード配列の離れた相同体を検出できない。リード配列の離れた相同体を検索するためには、配列整列のためのより進んだツールを使用することができる。

プロフィールベースの配列整列法は、リード配列の変種の検索に使用され、例えばPSI-BLAST（位置特異的繰り返しBLAST）およびHMMなどがある。これらのプロフィールベースの配列整列法は、リード配列のより離れた相同体を検出することができる（Altshul, SF, Madden, TL, Schaffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ (1997) Nucleic Acids Res 25, 3389-3402; Krogh, A, Brown M, Mian SI, Sjolander Km Haussler D (1994) J. Mol. Biol 235, 1501-1531）。

PSI-BLASTは、プロフィールベースの配列検索法に属する新世代BLASTプログラムである（Altshul, SF, Madden, TL, Schaffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ (1997) Nucleic Acids Res 25, 3389-3402）。PSI-BLASTは、BLASTが作成した統計的に有意な整列を位置特異的マトリックスに自動的に組合せて、データベース中の配列整列をスコア化する。新たに検索された配列は位置特異的スコア化マトリックスに取り込まれて、データベース中の別のラウンドの配列検索を開始する。この方法は、ヒットするものが無くなるまでまたはあらかじめ設定した基準が満たされるまで繰り返される。PSI-BLASTはプロフィール陰れマルコフモデル（HMM）ほど高感度ではないが、あらかじめ作成したモチーフプロフィールが無い場合のその速度と操作の容易さにより、本発明で使用することができる。

プロフィール陰れマルコフモデルすなわちHMMは、ある配列または配列整列ファミリーの１次配列コンセンサスの統計的モデルである。配列ファミリーは、対応する多重配列および／または構造整列から生じる多重配列整列として定義される。HMMの基礎である正式な確率的ベースは、ベイズ確率論（Byaesian probability theory）を使用して、整列された配列のプロフィールに基づいてスコア化パラメータの設定をガイドすることを可能にする。この同じ特徴がまた、HMMが位置依存性スコアを使用して一環したアプローチを使用することを可能にして、アミノ酸とギャップの両方の整列をスコア化する。HMMのこれらの特徴は、これを古典的な発見的方法と比較して遠い相同体を検索するための強力な方法としている（Eddy S.R (1996) Curr Opin Struct. Biol 6, 361-365）。１次配列中のパターンは、パターン認識アルゴリズムにより検出することができ、従って標的配列（１つの配列のみが使用される時）または配列プロフィール（複数の配列整列が使用される時）に関連するより多くのメンバーを取り出すのに使用することができる。配列中の高次の相関、または３次元空間でのアミノ酸の相互作用を捕捉するためには、多重構造整列から生じる多重配列整列が、ヒットライブラリーを作成するために本発明で使用される好適な方法である。

場合により、高度に多様なヒットライブラリーを検索するのに構造ベースの配列整列を使用してもよい。この方法は検出可能な配列相同性が無い場合に、種々の多重配列整列を比較するのに使用できる標準法であるためである（Sauder JM, Arthur JW, Dunbrack RL Jr (2000) Proteins 40, 6-22）。多重構造整列は、対応する多重配列整列を直接与える。あるいはこれらの密接に関連した構造は、多重配列整列プロフィールを作成するために配列スレッディングの構造鋳型として使用することができる（Jones DT (1999) J Mol Biol 1999, 797-815）。多重配列と構造整列とを組合せ方法が、既知のタンパク質配列の構造および機能的性質を説明することが報告されている（Al-Lazikani B, Sheinerman FB, Honig B (2001) PNAS 98, 14796-14801）。

また場合により、逆スレッディングプロセスを使用して高度に多様なヒットライブラリーを検索してもよい。逆スレッディングプロセスは、スレッディングプロセスの反対である。スレッディングは、配列側鎖相互作用ならびに局所的パラメータ（例えば２次構造および溶媒暴露）を取り込むスコア化関数を使用して、構造鋳型候補のライブラリーにその配列（すなわち、問題の配列）をスレッドする（通す）プロセスである。スレッディングプロセスは、問題の配列の抽出残基のアミノ酸配列の２次構造と溶媒のアクセスし易さの予測で始まる。予測された構造の生じる一次元（1D）プロフィールは、既知の3D構造のライブラリーの各メンバーにスレッドされる。各配列−構造対の最適スレッディングが、問題の予測された3D構造を構成する。

これに対して、逆スレッディングは、配列をある標的構造または標的構造の構造クラスター集合にスレッディングして、配列データベースから最適配列を検索するプロセスである。種々の長さのタンパク質配列を含むライブラリーから最適配列を選択するのに、種々のスコア化関数が使用される。

例えば、ヒト生殖細胞系免疫グロブリンデータベースからのアミノ酸配列をリード抗体の3D構造上にスレッドして、許容されるスコアを有する配列を検索することができる。選択された配列はヒットライブラリーを構成する。逆スレッディングプロセスは、スレッディングプロセスの反対であり、前者が標的構造鋳型に一致する最適配列を見つけようとするのに対して、後者は、標的構造プロフィールに一致する最適3D構造を見つける。
さらに、リード抗体について見つかる配列のヒットしたものの上のものは、リード抗体の3D構造と適合性のある最適な「コンセンサス」コンビナトリアル配列を選択するために、コンビナトリアルアプローチで各位置の多重アミノ酸を逆スレッディングすることによりプロフィール化される。コンセンサス配列を捜すこのプロセスは、Knappikら(2000)が記載した各位置の単純な配列平均を使用する方法とは異なる。本発明のコンセンサス配列は、各位置で可能なアミノ酸のすべての可能な組合せを使用して構造ベースの逆操作アプローチを使用して、検索された配列に基づいて作成され、構造鋳型とのその適合性をスコア化することにより最適化される。

配列整列により使用される方法以外に、配列整列に使用される配列モチーフと対応するデータベースは、本発明の方法においても決定的に重要である。ここで使用される配列または配列プロフィールは、抗体領域についてタンパク質の機能の構造分析に基づいて定義される（例えば、抗原結合についてCDRモチーフ（CDR1、CDR2、およびCDR3）、抗体足場を支持するためにフレームワーク領域（FR1、FR2、FR3およびFR4）。例として、ジーンバンク（GenBank）とKabatデータベースを使用して、種々の種からの配列ヒットについて検索して、抗体のCDRに一致するヒットライブラリーの多様性を上昇させ、所望の抗体の結合親和性を最大にすることができる。一方、ヒトまたはヒト生殖細胞系配列データベースでさえ、好ましくは設計するがフレームワークの非ヒト起源の免疫原性エピトープを作成する機会を減少させるために、フレームワーク設計の配列ヒットについて検索するのに使用される。配列選択工程は、特に設計された抗体の最終的に治療的応用を考慮すると、設計の配列起源の最大の柔軟性と制御を可能にする。

重複配列を排除し再プロフィール化して、より正確なHMMまたはPSI-BLASTプロフィールを得ることにより、ヒットライブラリーをさらに改良することができる。実施例の欄に詳細に記載するように、Ｎ末端またはＣ末端でフランキングするいくつかの残基の有るかまたは無いヒト抗VEGF抗体のKabat分類（および構造モチーフ）に従って、V_H CDR3をリード配列として使用した。HMMER 2.1.1ソフトウェアパッケージのユーティリティー（hmmbuild、hmmcalibrate、hmmsearch、hmmalign）をデフォールト設定（http://hmmer.wust1.eduhttp://hmmer.wust1.edu中のEddy S）で使用して、HMMモデルを構築し、合成されたランダム配列に対してHMMモデルを較正し、ヒット配列についてデータベースを検索し、それらを整列した。リード配列と同じ長さの１つのヒット配列が、整列と変種プロフィールのために使用される、整列された配列中の挿入または欠失はまた、整列位置で変種をプロフィール化するのに使用することができる。

図3に示すように、抗VEGF抗体のV_H CDR3配列の１つのリード配列をHMMとして使用してKabatデータベースを検索すると、リード配列に対して40〜100％の範囲の配列同一性を有する108個のユニークな配列が見つかった（図10Aと19C）。このリード配列の多重整列配列プロフィールをHMMとして使用して同じKabatデータベースを検索すると、リード配列に対して15〜100％の範囲の配列同一性を有する251個のユニークな配列が見つかった（図19C）。これらの結果は、プロフィールHMMが、リード配列とは遠い相同性を有する配列を見つけることができることを示す。すなわち、多重構造整列から得られる配列プロフィールは、ヒットライブラリーの多様性を拡張するであろう。

ヒットライブラリーの配列はまた、使用されるデータベースに依存する。例えば上記でKabatデータベースの代わりにGenpeptを使用すると、単一のリード配列をHMMとして使用した時または構造ベースの配列プロフィールをHMMとして使用した時、Kabatデータベース中のものとは異なるヒットが見つかった。

データベースを検索して構築されたヒットライブラリー中の配列は、分析し（例えば、各アミノ酸残基の位置頻度に基づきプロフィール化することにより）、in vitroまたはin vivoで所望の機能についてスクリーニングするために直接使用することができる。図1Aの経路Ｉと図3を参照。

場合により、ヒットライブラリー中の配列はプロフィール化され使用されてヒット変種ライブラリーＩが構築され、これは次に、所望の機能についてin vitroまたはin vivoでスクリーニングされる。図1Bの経路IIと図4を参照。

また場合により、ヒットライブラリーは、逆スレッディングまたはフォースフィールドベースの完全原子提示のような方法を使用して、リード構造鋳型との適合性のスコア化に基づいてフィルターにかけられる。生じるスコアのランク付けに基づいて、所望の機能についてin vitroまたはin vivoでスクリーニングのためにヒット変種ライブラリーIIが選択される。図1Cの経路IIIと図5を参照。

また場合により、ヒットライブラリーＩは、スレッディングまたはフォースフィールドベースの完全原子提示のような方法を使用して、リード構造鋳型との適合性のスコア化に基づいてフィルターにかけられる。ヒットの相対的ランク付けに基づいて、所望の機能についてin vitroまたはin vivoでスクリーニングのためにヒット変種ライブラリーIIが選択される。図1Dの経路IVと図5を参照。

4. ヒット変種ライブラリーの構築
タンパク質の構造および配列空間中にコードされる豊富な多様性をさらに調べるために、配列整列に基づいて選択されたヒットは、変種プロフィールを作成するために配列の各アミノ酸位置でプロフィール化される。ヒット変種ライブラリーは、この変種プロフィールを使用してコンビナトリアル的に算出される。図4は、ヒット変種ライブラリーを構築するための方法の例である。ヒットライブラリー（すなわち、配列ヒットまたはフィルターにかけた配列ヒット）から作成される変種プロフィールは、ヒット配列中の各位置に現れるアミノ酸の頻度に基づいて記載される（図11と19B）。プロフィール化された変種は、コンビナトリアルライブラリーを構築するための優れた出発点となる。

このヒット変種ライブラリーのサイズを小さくするために、各位置のアミノ酸の頻度（例えば、5％またはそれ以上の頻度）または好適な変種に基づくいくつかのカットオフ値および／またはコンピューターによる結果を応用することができる（ヒットの総数の10％のカットオフについては図11の下の部分を参照；図19Bは5％を使用する）。各位置でのこれらの非常に好適なアミノ酸残基に基づく変種は、高親和性または他の所望の機能を有する配列を釣り上げるための組換え配列の優れたプールとなるはずである。

各位置の変種の頻度に基づいて計算される情報配列エントロピーは、整列した配列中の残基の同一性が、アミノ酸残基のランダム分布からどの程度逸脱するかを測定するための定量的手段を提供する。タンパク質変種を含む配列の高度に可変性の突然変異誘発の確率を考慮するために、本発明では相対的エントロピーを使用することができる（Plaxo KW, Larson S, Ruczinski, Riddle DS, Thayer EC, Buchwitz B, Davidson AR, Baker D (2000) J Mol Biol 298, 303-312）。本発明者らは、相対的部位エントロピーが、発現されたタンパク質のデータベースからの真の進化的データに基づくため、コンピューターによるスクリーニングおよび実験によるスクリーニングの標的とすべき位置および変異体の良好なガイドとなると考えている。

相対的部位エントロピーは、ヒット配列の構造と機能を維持しながら進化中に蓄積されたアミノ酸残基の各位置の多様性の尺度である。これらの部位は、コンピューターによるスクリーニングと実験によるスクリーニングとを組換えるために選択される。生じるコンビナトリアルヒット変種ライブラリーのサイズは、各位置のすべての20個のアミノ酸のランダムな組合せにより生成するものよりはるかに小さいため、より正確で詳細なコンピューターによるスクリーニングまたは直接的な実験によるスクリーニングを実施することができる。

本発明のヒットライブラリーにより生じる配列エントロピーは、当該分野の他の研究者らが、フォースフィールドベースのコンピューター法を使用して、アミノ酸置換に対する構造許容性を測定するのに使用した部位エントロピーとは無関係である（Voigt CA, Mayo SL, Arnold FH, Wang ZG (2001) PNAS 98, 3778-3783）。フォースフィールドベースの方法は進化によっては試験されていないいくつかの新規変異体を提供するであろうが、進化的配列から得られる部位エントロピー（すなわち、配列エントロピー）は、取り込まれた構造的、動力学的、発現および生物学的活性を含むすべての情報を用いて、各位置での変化と好適な変異体についてより有意な統計量を提供するはずである。これは、フォースフィールドベースの方法では充分に理解も予測もされていない抗体のループ領域のような困難な構造を標的化するのに重要かも知れないが、これらは、本発明のデータベースの方法を使用してある程度自信を持ってモデル化することができる。進化的情報に依存する相同性ベースの方法はいまだに、フォースフィールドベースのシミュレーションを用いて増強することができるループ構造をモデル化するための最も信頼できる方法の１つである。

実施例の欄に詳細に記載されるように、抗VEGF抗体（リード抗体）の変種プロフィールはいくつかの異なるアプローチを使用して検索された。このリード抗体のV_H CDR3の配列に基づき、Kabat、genpept、およびKabat、genpept、imgt、その他を組合せた非重複データベースからのヒットリストの変種プロフィールが記載される。この抗体からの親和性成熟した配列中に、他の研究者らが観察した重要な変異体はまた、本発明の方法を使用して検索した変種プロフィール中に高頻度で現れる。例えば、単一の最も重要な変異体は成熟配列中のY97（図9B）により置換されたリード配列中のH97であり、これはこの位置でアミノ酸変種がほとんど50％である（図11）。本発明の上記方法は、タンパク質設計と操作においていくつかの利点を有する。任意の組換えライブラリーにおいて、多様性は必ずしも、スクリーニングできる能力により限定されるのではなく、これは、多様性の割り当てと従って設計が機能的に関連するライブラリーの作成において重要な要因であることを意味する。本方法は、タンパク質、特に抗体のin silicoの合理的設計である。これは、ヒットライブラリーを形成するための発現されたタンパク質のデータベースからの機能的に類似の「天然の」ポリペプチド断片の選択で始まる。「天然に」存在するペプチド断片中の特異的位置変化の分析は、好適な残基と位置についての進化的データ（変種プロフィール）を与える。変種の決定的に重要な分析は、重要な残基と組合せを同定することができる。選択変種の低下したセットのコンビナトリアル算出により、機能的に関連する配列に注目するヒット変種ライブラリーが作成される。

変種プロフィールで開始して、本発明のin silico合理的ライブラリー設計は、機能的および構造データに基づくタンパク質断片の注目されたライブラリーを生成する。in silico組換えはある程度まで、相同配列のファミリーのDNAシャフリングと原理が似ている。しかし本発明のアプローチは、広く分布した配列相同性を有するタンパク質配列のファミリーにとって、非常に効率的な配列組換え法である。さらに本発明において、組換えはアミノ酸レベルで置き、そのメンバーがランダムに組換えされて設計されるライブラリーを作成するために具体的な機能性領域まで局在化することができる。これは、相同性要求により束縛されず、構造的または実験データに従って選択的に修飾することができる。例えば、ヒットライブラリー中の配列は、検索法と使用したデータベースに依存して、リード配列に対して100〜20、またはそれ以下の配列同一性を有する。比較すると、DNAシャフリングは、密接に関連する配列相同体の間のDNA組換えプロセスであり、組換えられた核酸配列間の配列相同性に厳しい要件があり；DNAシャフリングは、有効な変異体組換えを作成することは非効率的であり、実験的組換え中にランダム変異を受けやすい。

5. 抗体変種ライブラリーの構造ベースの評価
上記したようにヒットライブラリーまたはヒットライブラリーからの変種プロフィールの組換えから得られるヒット変種ライブラリーは、リードタンパク質との構造的適合性に基づいて評価してもよい。抗体変種ライブラリーの構造ベースの評価のために本発明は、以下の問題を扱う：i) 抗体とタンパク質複合体を形成する抗原の存在下で、非標準ループのコンフォメーションを如何にモデル化するか；(ii) 抗体および／または抗原構造を最適に適合させるために、CDRループ骨格に側鎖を如何に置くか；(iii) 高親和性を有する安定な抗体−抗原複合体を形成させるために、CDRループを最適なフレームワークモデルと如何に組合せるか。実施法は以下に詳述される。

1) 抗体構造と構造モデル
リード抗体の構造鋳型は、Ｘ線またはNMR構造から直接取られるか、または後述の構造的コンピューターエンジンを使用してモデル化される。実施例の欄に示すように、抗VEGF抗体の構造鋳型はPDBデータベースから取られる（親抗体用に1BJ1、そして成熟抗体用に1CZ8）。両方の鋳型を抗原VEGFの存在下と非存在下で使用した。実施例に記載のスコア化は、抗原VEGFの存在下の1CZ8からである。

2) リード抗体の構造鋳型に基づく評価
例として、既知の3D構造を有する抗体がリードタンパク質として機能する。代替法（例えば、相同性ベースのモデル化）を応用して、操作される標的タンパク質について妥当に規定された鋳型構造を作成できるため、充分規定された構造（例えばＸ線結晶学により得られるもの）のこの要件は絶対的ではない。ヒット変種ライブラリーの作成には、アミノ酸位置変種プロフィールの決定、修飾、および最適化が必要である。リード配列およびヒットライブラリーとヒット変種ライブラリー中の配列は、リード抗体の3D構造の点でスコア化され、これらの配列についてランク付け分布を得るためにスコア化される。実施例の欄のスコア化は経験的な全原子エネルギー関数に基づいているが、任意のコンピューターで扱えるスコア化または一致関数を応用して、これらの配列を構造的に評価できることに注意されたい。

図5は、リード、ヒットライブラリー、およびヒット変種ライブラリーからの配列の構造的評価の方法の例を示す。スコア化とランク付けについて、これらの配列は、骨格依存性／非依存性ロタマーライブラリーからの側鎖を代用することにより、リード構造鋳型中に構築される（Dunbrack RL Jr, Karplus M (1993) J Mol Biol 230:543-574）。置換されたセグメントの側鎖と骨格は次に、局所的ひずみを緩和するために局所的にエネルギーが最小化される。各構造は、リード構造鋳型中の配列の相対的安定性を測定するカスタムエネルギー関数を使用してスコア化される。

リード、ヒットライブラリーおよびヒット変種ライブラリーからの配列のエネルギーの比較は、種々の配列のリード構造鋳型との構造適合の程度を示す。多くの配列がリード配列より優れているかまたは悪いスコアを有する非常に広い分布を得ることは、妥当ではないことは無い。焦点は、具体的な配列（許容されるが）を同定することではなく、リード配列と同等かまたはより優れたスコアを有する配列または配列集合の集団を同定し、縮重核酸ライブラリーを使用して同時に標的化できる配列中の集合体の性質を共有することである。アミノ酸配列集合体は、単一の具体的な配列より良好なエピトープ認識の結合部位および配向と良好な構造的適合性を示す可能性がある配列空間である。統計的集合平均の周りに分布した配列集合体のコンビナトリアルライブラリーは、改良された親和性を有する良好な候補を見つける機会を上昇させるために、実験的に標的化すべきである。

3) そのリガンドの存在下でのリード構造鋳型に基づく評価
場合により、リード、ヒットライブラリーおよびヒット変種ライブラリーからの配列を、リガンドまたは抗原、例えばVEGFとの複合体中のリード抗VEGF抗体の存在下で、リード構造鋳型に基づいて評価することができる。このアプローチは、リードタンパク質とそのリガンドにより形成される複合体の構造が公知であるかまたは容易に確認できる時、有用である。

抗原の存在下では、抗体と抗原との複合体形成の完全な熱力学的サイクルが計算に含まれる。特に結合部位における抗体のコンフォメーションは、好適な側鎖ロタマーとのその標準的ファミリーからの個々のCDRループコンフォメーションならびにCDRループ間の相互作用に基づいてモデル化される。広範囲のコンフォメーション（アミノ酸残基の側鎖のもの、および抗原結合部位のCDRループのものを含む）を試験することができ、抗体の主要なフレームワーク（または足場）に取り込まれる。抗原が存在すると、そのようなコンフォメーション的モデル化は、物理−化学的フォースフィールドならびに半経験的および知識ベースのパラメータを使用して、スコア化より高い物理的関連性、抗体産生の自然のプロセスのより良好な提示、および体内での成熟を確保する。

4) 抗原の存在下と非存在下での抗体配列のスコアの相関
抗原とその抗体の間で複合体構造を持ち、抗体ライブラリーを抗原に結合する良好な確率を有する配列に焦点を当てることが好ましい。残存ながら、生物医学的関心のある抗体について、抗体と抗原の複合体構造はまだ利用できない。

本発明者らは、標的抗体足場を安定化するのに好適な多くの配列はまた、抗原への結合に直接関与するV_H CDR3についてさえ、特異的な抗体−抗原複合体を安定化することができる選択された候補の１つであることを見いだした。相関分析は、抗原の存在下と非存在下で抗体配列のスコアに一般的な相関傾向があることを示す（図12C）。さらに、良好なスコアで選択された配列の大きな集団は、ここで使用される抗VEGFのV_H CDR3のような結合モチーフの足場を安定化するのに好ましい。

複雑な構造無しでも、抗体構造単独で、抗原の正しい結合部位を有しながら、標的足場を安定化する配列の集団を与えることができることに注意されたい。抗原結合によるコンフォメーション変化が観察されているが、コンフォメーション変化が多くの可能な解答のうちの唯一のものかまたは抗原−抗体相互作用の絶対的な必要性であるかは不明である。目標は、このコンフォメーションシフトを受けない限りは結合構造が必要条件ではなくなるように、機能性タンパク質を形成する可能性のある配列の集合を同定することである。結合および非結合状態での抗体の利用可能な構造に基づくと、これは好ましい仮定である。これらが同じファミリーの集合構造に属する限りは、ここで取ったアプローチ（19Aを参照）で、少なくとも一部の構造の変動が許される。

あるいは、リード抗体の構造が利用可能ではないなら、鋳型をモデル化により作成してもよい。抗体構造または構造モチーフは、相同性モデル化を使用して比較的自信を持って構造モデルが作成されるタンパク質の最もよく知られている例の一部である。すなわち、リード構造鋳型を使用することなく、リード配列の配列ライブラリーを標的化することが可能である。実施例の欄に示すように、標的モチーフをカバーする配列ライブラリーのストレッチが合成でき、リード抗体の構造に依存することなく高親和性を有する抗体についてスクリーニングするのに使用することができる。

5) 構造的コンピューターエンジン
リード構造鋳型に対してライブラリーをモデル化し評価するのに多くのプログラムが利用できる。例えばこれらの目的に分子力学ソフトウェアが使用され、さらなる例には、特に限定されないが、CONGEN、SCWRL、UHBD、GENPOLおよびAMBERがある。

CONGEN（CONformation GENerator）は、タンパク質のセグメントについてコンフォメーション検索を行うためのプログラムである（R.E. Bruccoleri (1993) Molecular Simulations 10, 151-174 (1993); R.E. Bruccoleri, E. Haber, J. Novotny, (1998) Nature 335, 564-568 (1988); R. Bruccoleri, M. Karplus. (1987) Biopolymers 26, 137-168）。これは、既知の構造中に決定されていないループまたはセグメントを構築（すなわち相同性モデル化）する必要がある場合の問題に最も適している。このプログラムは、CHARMMバージョン16の修正版であり、CHARMMバージョンのほとんどの機能を有する（Brooks BR, Bruccoleri BE, Olafson BD, States DJ, Swaminathan S, Karplus M. (1983) J. Comput. Chem. 4, 187-217）。

使用される基礎エネルギー関数は、結合、角度、ねじれ角、特異角、ファンデアワールスおよび距離依存性誘電率を有する静電相互作用についての項を含み、CONGENを使用して測定できるAmber94フォースフィールドを使用する。（実施例の欄を参照）。

CONGENプログラムは、最も低いエネルギーを有する天然に存在する構造に近いかまたはこれと対応する低エネルギーコンフォーマーを検索するために使用される（BruccoleriとKarplus (1987) Biopolymers 26:137-168; およびBruccoleriとNovotny (1992) Immunomethods 96-106）。正確なGibbs関数と短いループ配列があると、ループのすべての立体化学的に許容される構造を作成でき、そのエネルギーを計算することができる。低いエネルギーを有するものが選択される。

このプログラムは、基礎的または改良スコア化関数を使用して、コンフォメーション検索と構造評価の両方を行うのに使用することができる。プログラムは、分子の他の性質（例えば溶媒がアクセスできる表面およびコンフォメーションエントロピー、ある立体的制約など）を計算することができる。これらの性質のそれぞれは後述の他の性質と組合せて、デジタルライブラリーをスコア化するのに使用することができる。

本発明において、V_H CDR3以外の５つのCDR（V_L CDR1、2、および3、およびV_H CDR1、および2）の規定された標準構造。V_H CDR3は、その長さとコンフォメーションが大きく変化することが知られているが、PDB（タンパク質データバンク（Protein Data Bank））データベースでより多くの抗体構造が利用できるようになっているため、そのコンフォメーションのモデル化が進展している。CONGENは、標準構造が利用できない場合に、ループ領域（例えば、V_H CDR3）のコンフォメーションを作成して、鋳型配列の側鎖を標的アミノ酸の対応する側鎖ロタマーで置換するのに使用される。第３に、モデルはさらに構造モデルの立体的不一致とひずみを緩和するために、エネルギー最小化または分子動力学シミュレーションまたは他のプロトコールにより最適化することができる。

SCWRLは、側鎖配置プログラムであり、骨格依存性ロタマーライブラリーを使用して側鎖ロタマーやロタマーの組合せを作成することができる（Dunbrack RL Jr, Karplus M (1993) J Mol Biol 230:543-574；Bower, MJ, Cohen FE, Dunbrack RL (1997) J Mol Biol 267, 1268-1282）。このライブラリーは、カイ1-カイ2-カイ3-カイ4 値のリストと、あるファイ−プサイ値での残基の相対的確率を提供する。このプログラムはさらに、これらのコンフォメーションを調べて側鎖−骨格の不一致や側鎖−側鎖不一致を小さくすることができる。いったん立体的不一致が最小にされると、置換されたセグメントの側鎖と骨格はエネルギーを最小にして、CONGENを使用して局所的ひずみを緩和することができる（BruccoleriとKarplus (1987) Biopolymers 26:137-168）。

抗体構造を構築するために特異的に開発されたいくつかの自動プログラムが、本発明の抗体の構造モデル化で使用される。ABGENプログラムは、抗体断片の構造モデルを得るための自動抗体構造作成アルゴリズムである。Mandalら(1996) Nature Biotech. 14:332-328。ABGENは、相同性ベースの足場技術を利用し、不変の厳密に保存された残基、既知のFabの構造モチーフ、超可変ループの標準的特徴、残基置換のねじれひずみ、および主要な残基間相互作用の使用を含む。具体的には、ABGENアルゴリズムは、２つの主要なモジュール（ABalignとABbuild）からなる。ABalignは、その構造が既知の抗体のすべてのV領域配列を有する抗体配列の整列を提供し、整列スコアを計算する。最も高いスコアのライブラリー配列は、試験配列に最もフィットすると考えられる。ABbuildは次に、この最適フィットモデル出力をABalignにより使用して、３次元構造を作成し、所望の抗体配列についてデカルト座標を提供する。

WAM（Whitelegg NRJ とRees, AR (2000) Protein Engineering 13, 819-824）は、ABMの改良版であり、組合せアルゴリズム（Martin, ACR, Cheetham, JC, およびRees AR (1989) PNAS 86, 9268-9272）を使用して、Ｘ線PDBデータベースからのCDRループの標準コンフォメーションと、CONGENを使用して作成したループコンフォメーションとを使用して、CDRコンフォメーションをモデル化する。簡単に説明すると、抗体構造のモジュール性は、タンパク質相同性モデル化と構造予測の組合せを使用して、その構造をモデル化することを可能にする。

好適な実施態様において以下の方法が、抗体構造をモデル化するために使用される。抗体は配列と構造の両方が最もよく保存されているタンパク質の１つであるため、抗体の相同性モデルは比較的簡単であるが、既存の標準構造または挿入もしくは欠失のある構造内でまだ決定されていないいくつかのCDRループを除く。しかしこれらのループは、相同性モデル化とコンフォメーション検索を組合せるアルゴリズムを使用してモデル化することができる（例えば、CONGENはそのような目的に使用することができる）。

CDRの５つ（L1、2、3およびH1、2）について規定された標準構造が使用される。可変重鎖中のH3（すなわち、V_H CDR3）は、その長さとコンフォメーションが大きく変動することが知られているが、より多くの抗体構造が利用できるようになるにつれてそのコンフォメーションのモデル化が進展している。モデル化法には、タンパク質構造予測法、例えばスレッディング、および比較モデル化があり、これは、類似性モデル化配列に基づいて未知の構造の配列を少なくとも１つの既知の構造と整列させる。この新規（de novo）または最初からの（ab initio）方法はまた、配列のみから構造を予測することを有望にしている。未知のループコンフォメーションは、標準構造が利用できない場合は、CONGENを使用して試験することができる（Bruccoleri, E. Haber, J. Novotny, (1998) Nature 355, 564-568）。あるいは最初からの（ab initio）方法（特に限定されないが、Rosetta ab initio法を含む）を使用して、モデル化された配列と任意の既知の構造との折り畳みレベルの類似性に依存せずに、抗体CDR構造を予測することができる（Bonneau R, Tsai J, Ruczinski I, Chivian D, Rohl C, StraussCE, Baker D (2001) proteins Suppl 5, 119-126）。最新の明確な溶媒分子動力学と不明確な溶媒フリーエネルギー計算を使用するより正確な方法を使用して、CONGENまたはRosseta ab initio法から作成したモデルから未変性様構造を改良し選択することができる（Lee MR, Tsai J, Baker D, Kollman PA (2001) J Mol Biol 313, 417-430）。

ここで使用されるＸ線構造（1BJ1および／または1CZ8）または上記のモデル化された構造を、後述の実験によるスクリーニングのための抗体ライブラリーを設計するための構造鋳型として使用することができる。

6) 構造評価のためのスコア化関数
本発明のある実施態様において上記セクション3と4に記載の配列評価プロセスからの選択された配列の構造評価のために、コンピューターによる分析が使用される。この評価は、経験的かつパラメータ化したスコア化関数に基づき、以後の必要なin vitroスクリーニングの数を減少させることを目的とする。

このアプローチは、既存の構造鋳型を使用して、作成されたすべてのアミノ酸ライブラリーをスコア化する。抗体−抗原相互作用を評価するための鋳型として既知の構造を使用することは以下を仮定している、(i) 抗体と抗原分子の構造は、結合および遊離の状態で大きく変化しない、(ii) CDR中の変異は、全体ならびに局所的構造を大きく変化させない、および(iii) CDR中の変異によるエネルギー作用は局在化されており、スコア化して変異と直接関連する機能を評価することができる。既知の構造を鋳型として有する利点は、これが、モデル化構造を使用するより困難なアプローチと比較して、設計改良の良好な出発点となることができる点である。これらの配列ヒットのエネルギー分布は、これらが如何にうまく、その標的との構造適合性の点で標的足場の一致関数をカバーしているかを明らかにするはずである。

上記仮定は必ず、変異体の構造の不確実性のために誤差を招くため、変異体は構造を変化させたなら、精巧なスコア化関数でも有意義な予測ができない可能性がある。実施例の欄に示すように、抗VEGF抗体のモデル系において最初の計算で、一般的なしかしよく試験されたフォースフィールド（後述）を使用した。これは、一致背景の好適な領域を、実験的に実施した集合配列を試験することにより調べることができる場合、一般的に具体的な系に持ち込まれる偏りを避けることができる。しかし本発明は、構造評価のための精巧なスコア化関数の使用を排除しない。

配列と構造との適合性をスコア化するために、多くのエネルギー関数を使用することができる。典型的には4種類のエネルギー関数を使用することができる：(1) 経験的物理的化学フォースフィールド、例えば単純なモデル化合物から得られる後述の標準的分子力学的フォースフィールド；(2) タンパク質構造から抽出される知識ベースの統計的フォースフィールド、いわゆる構造ベースの配列プロフィール化から得られる平均フォースの電位またはスレッディングスコア；(3) 実験的モデル系を使用してフォースフィールドパラメータをフィッティングすることによるパラメータ化フォースフィールド；(4) 各項につ種々の加重因子のある(1)〜(3)の１つまたはいくつかの項の組合せ。

以下は、スコア化関数に使用または取り込むすることができる一部の充分試験された物理的−化学的フォースフィールドである。例えばamber94は後述の実施例で配列−構造適合性をスコア化するためにCONGENで使用された。フォースフィールドには、特に限定されないが以下のフォースフィールドを含み、これらは当業者により広く使用されている：Amber 94 (Cornell, WD, Cieplak P, Bayly CI, Gould IR, Merz KM Jr, Ferguson DM, Spellmeyer DC. Fox T, Caldwell JW および Kollman PA. JACS (1995) 117, 5179-5197 (1995); CHARMM (Brooks, B.R., Bruccoleri, R.E., Olafson, B.D., States, D.J.. Swaminathan, S., Karplus, M. (1983) J. Comp. Chem. 4, 187-217.; MacKerell, A D ; Bashford, D; Bellott, M; Dunbrack, R L; Eva seck, J D; Field, M J; Fischer, S; Gao, J; Guo, H; Ha, S; JosephMcCarthy, D; Kuc nir. L; Kuczera, K; Lau, F T K; Mattos, C; Michnick, S; Ngo, T; Nguyen, D T; Pro hom, B; Reiher, W E; Roux, B; Schlenkrich, M; Smith, J C; Stote, R; Straub. J; Watanabe, M; WiorkiewiczKuczera, J; Yin, D; Karplus, M (1998) J. Phys. Chem., B 102, 3586-3617); Discover CVFF (Dauber-Osguthorpe, P.; Roberts. V. A.; Osguthorpe, D. J.; Wolff, J.; Genest, M.; Hagler, A. T. (1988) Proteins: Structure, Function and Genetics, 4, 31-47.); ECEPP (Momany, F. A., McGuire, R. F.. Burgess, A. W., & Scheraga, H. A., (1975) J. Phys. Chem. 79, 2361-2381.; Nemethy. G., Pottle, M. S., & Scheraga, H. A., (1983) J. Phys. Chem. 87, 1883-1887); GROMOS (Hermans. J., Berendsen, H. J. C., van Gunsteren, W. F., & Postma, J. P. M., (1984) Biopolymers 23, 1); MMFF94 (Halgren, T. A. (1992) J. Am. Chem. Soc. 114, 7827-7843.; Halgren, T. A. (1996) J. Comp. Chem 17, 490-519.; Halgren, T. A. (1996) J. Comp. Chem. 17, 520-552.; Halgren, T. A. (1996) J. Comp. Chem. 17, 553-586.; Halgren, T. A., および Nachbar, R. B. (1996) J. Comp. Chem. 17, 587-615.; Halgren, T. A. (1996) J. Comp. Chem. 17, 616-641.); OPLS (Jorgensen. W. L., & Tirado-Rives, J.,(1988) J. Am. Chem. Soc. 1lO, 1657-1666.; Damm, W., A. Frontera, J. Tirado-Rives および W. L Jorgensen (1997) J. Comp. Chem. 18, 1955-1970.); Tripos ,(Clark. M., Cramer 111, R. D., van Opdenhosch, N., (1989) Validation of the General Purpose Tripose 5.2 Force Field, J. Comp. Chem. 10, 982-1012.); MM3 (Lii, J-H., & Allinger, N. L. (1991) J. Comp. Chem. 12, 186-199). 例えば Dreiding (Mayo SL, Olafson BD, Goddard (1990) J Phy Chem 94, 8897-8909) 、またはタンパク質折り畳みまたはUNRES (United Residue Forcefield; Liwo ら、(1993) Protein Science 2, 1697-1714; Liwo ら、(1993) Protein Science 2, 1715-1731; Liwo ら、(1997) J. Comp. Chem. 18, 849-873; Liwo ら、(1997) J. Comp. Chem. 18:874-884; Liwo ら、(1998) J. Comp. Chem. 19:259-276.)のようなシミュレーションで使用した他の一般的フォースフィールドも使用される。

タンパク質構造から得られる統計的電位も、配列とタンパク質構造の間の適合性を評価するのに使用することができる。これらの電位には、特に限定されないが、残基対電位がある（Miyazawa S, Jernigan R (1985) Macromolecules 18, 534-552; Jernrgan RL, Bahar, I (1996) Curr. Opin. Struc. Biol. 6, 195-209）。平均フォースの電位（Hendlich ら、(1990) J. Mol. Biol. 216, 167-180）は、タンパク質のコンフォメーション集合を計算するのに使用されている（Sippl M (1990) J Mol Biol. 213, 859-883）。しかし、これらのフォースフィールドのある程度の限界も考察される（Thomas PD, Dill KA (1996) J Mol Biol 257, 457-469; Ben-Naim A (1997) J Chem Phys 107, 3698-3706）。

配列と構造の間の適合性をスコア化する他の方法は、配列プロフィール化（Bowie JU, Luthy R, Eisenberg DA (1991) Science 253, 164-170）、またはスレッディングスコア（Jones DT, Taylor WR, Thornton JM (1992) Nature 358, 86-89; Bryant, SH, Lawrence, CE (1993) Proteins 16, 92-112; Rost B, Schneider R, Sander C (1997) J Mol Biol 270, 471-480; Xu Y, Xu D (2000) Proteins 40, 343-354）を使用することである。準化学近似またはボルツマン統計またはベイズの定理（Simons KT, Kooperberg C. Huang E, Baker D (1997) J Mol Biol 268, 209-225）に基づくこれらの統計的フォースフィールドは、配列と構造の一致またはタンパク質設計の配列の長所を評価するのに使用される（Dima RI. Banavar J R, Maritan A (2000) Protein Science 9, 812-819）。

さらに、タンパク質構造の熱力学安定性に関連する構造ベースの熱力学パラメータもまた、配列と構造の一致を評価するために使用される。構造ベースの熱力学的方法において、熱力学的量（例えば、熱容量、エンタルピー、エントロピー）は、タンパク質の構造に基づいて計算することができて、モデル化合物またはタンパク質熱量測定研究からの熱力学的データを使用して熱変性の温度依存性を説明することができる（Spolar RS, Livingstone JR, Record MT (1992) Biochemistry 31, 3947-3955; Spolar RS, Record MT (1994) Science 263, 777-784; Murphy KP, Freire E (1992) Adv Protein Chem 43, 313-361; Privalov PL, Makhatadze GI (1993) J Mol Biol 232, 660-679; Makhatadze GI, Privalov PL (1993) J Mol Biol 232, 639-659）。構造ベースの熱力学的パラメータを使用して、変異体配列と水素交換保護因子の構造安定性を集合ベースの統計的熱力学的アプローチを使用して計算することができる（Hilser VJ, Dowdy D, Oas TG. Freire E (1998) PNAS 95, 9903-9908）。タンパク質２次構造形成の統計的熱力学的モデルに関する熱力学的パラメータはまた、実験モデル系を使用して測定され、予測と実験データの間ですばらしい一致が得られている（Rohl CA, Baldwin RL (1998) Methods Enzymol 295, 1-26; Serrano L (2000) Adv Protein Chem 53, 49-85）。

分子力学的フォースフィールドからの種々の項といくつかの特異的成分の組合せは、ほとんどタンパク質設計プログラムで使用されている。好適な実施態様においてフォースフィールドは、標準的分子力学フォースフィールド（例えば、Amber、Charmm、OPLS、cvff、ECEPP）からの１つまたはいくつかの項（例えば、vdw、水素結合、および静電相互作用）、および、タンパク質の安定性を制御すると考えられている１つまたはいくつかの項からなる。

スコア化関数を改良するために、追加のエネルギー項が後期工程で導入され、これは、実験結果からのずれと目的の特異的抗体−抗原相互作用の影響をより良く解決するためにスコア化関数を微調整することを可能にする。例えば、１つのエネルギー項は、アルギニン変異を不利にさせて、側鎖コンフォメーションの予測の不確実性による全体のスコアへの寄与を低下させ、アルギニンを好むこのスコア化関数の偏りを補償する。他のエネルギー項は、表面積計算に基づき、荷電および極性基をスコア化でき、その結果、露出された表面により、電荷の埋没に至る変異は不利にされる。

実際は、鋳型構造または構造集合体との配列の適合性をスコア化するのに使用できる多くのスコア化関数がある。改良されたスコア化関数は、いくつかの項（分子力学フォースフィールドを使用して計算される、静電相互作用およびファンデアワールス相互作用からの寄与ΔGMM、静電溶媒和および溶媒がアクセス可能な表面を含む溶媒和からの寄与ΔGsol、およびコンフォメーションエントロピーからの寄与を含む）からなる（Sharp KA. (1998) Proteins 33, 39-48; Novotny J. Bruccoleri RE, Davis M, Sharp KA (1997) J Mol Biol 268, 401-411）。

コンピューターによるスクリーニングの簡便で迅速な方法は、CONGENで実施されるようにAmber94のような分子力学的フォースフィールドからの項を含む基礎スコア化関数を使用して、エネルギー項の合計または組合せを使用して計算することである。
ΔE_total = E_bond + E_angel + E_dihed + E_impr + E_vdw + E_elec + E_solvation + E_other
または、結合フリーエネルギーは、改良スコア化関数
ΔG_b = ΔG_MM + ΔG_sol - TΔS_SS
ここで
ΔG_MM = ΔG_ele + ΔG_vdw (1)
ΔG_sol = ΔG_ele-sol + ΔG_ASA (2)
を使用して、結合および非結合状態の差として計算される。

ΔG_eleとΔG_vdw（静電およびファンデアワールス相互作用エネルギー）は、ΔG_MMについてCONGENで行ったamber94パラメータを使用して計算され、ここでΔG_ele-solは、絶縁境界の無いタンパク質中の不均一に分布した荷電を、タンパク質の形により規定される絶縁境界のある水相中に移動させるのに必要な市電溶媒和エネルギーである。これは、参照と変異体構造の静電電位についてのポアソン−ボルツマン式を解くことにより計算される。ΔG_ASA（非極性エネルギー）は、非極性溶質基を水性溶媒中に移動させるためのエネルギーコストであり、溶媒分子が再構築される。これは、分子の溶媒がアクセスできる表面と１次相関することが証明されている（Sitkoff D, Sharp, KA, Honig B (1994) J Phys Chem 98, 1978-1988; Pascual-Ahir & Silla (1990) J Comp Chem 11, 1047-1060)。

側鎖エントロピー（ΔSSS）の変化は、特に結合界面での、局所的側鎖コンフォメーション空間に対する作用の尺度である。これは、結合および非結合状態の許容された側鎖コンフォメーションの数の比から計算される。一般的スコア化目的に、種々の骨格コンフォメーション中の多重側鎖のコンフォメーション種特異性を試験して負荷される大きなコンピューターへの要求を避けるために、独立の側鎖近似を変異側鎖に適用する。

ヒットライブラリーまたはヒット変種ライブラリー中の配列は、標的構造との構造的適合性について評価され、標的折り畳みのエネルギー背景上にマッピングされる。多数の変種は抗体足場を安定化することができるため抗VEGF抗体について、抗原の存在下および非存在下での抗体配列のスコアは一般的に関連している（図12Cを参照）。特に、標的エピトープに結合できる配列の有意な割合がある。実施例の欄に示すように、CDRライブラリー配列は、一致スコアに基づき、鋳型抗体−抗原複合体（1CZ8）の相対的安定性に基づきランク付けされ、実験的に選択された配列が同定される（図13A）。

結合状態と非結合状態の両方の抗原中のスコアを測定して、いずれかの状態の極めて好ましくない配列を排除することは、有効であり、可能である。こうすることにより我々は、検索空間を有効に縮小させながら、結合および非結合状態の差を正確にスコア化する必要性を避けることができる。

スコア化関数は、ヒットライブラリー、ヒット変種ライブラリーＩまたはヒット変種ライブラリーII中の配列をスコア化するのに使用され、かつ場合により、リード配列またはリード構造鋳型配列およびライブラリー配列の差が計算されて熱力学的サイクルが完了する。従って、以下の任意の基準に基づいて、さらなる実験的スクリーニングのために配列が選択される：1) 抗体構造の安定化においてリード配列より優れたスコアの配列が選択される；2) 抗体−抗原複合体の安定化においてリード配列より優れたスコアの配列が選択され；3) スコア化関数が大きい数の間の小さな差を充分に区別できるほど高感度なら、結合状態と非結合状態のスコアの差はリード配列より優れている。最後の基準は、高度に改良されたスコア化関数または高品質集合ベースのスコア化関数が利用できる時のみ、および好ましくは、スコア化関数の較正について高品質変異体データが利用できる系で、使用すべきである。

リード配列より良いスコアの配列が分析され、異なるクラスターに分類される。クラスターの組合せは、充分な配列と構造空間をカバーし、これは一致背景中の所望の領域をカバーする（図7）。配列をクラスターしてスコア化窓を選択するこのアプローチは、物理的ライブラリーサイズを小さくするための試みとして見なされる。アプローチをクラスターする他の利点は、いくつかの離れたスコア化窓以後の核酸ライブラリー（例えば、核酸ライブラリーＩ、II、IIIなど、図7）の組合せはそれでも、リード配列よりスコアの良いかなりの配列および構造空間をカバーすることである。このクラスタリングプロセスの好ましい結果は、これらの配列クラスターのそれぞれは、組合せライブラリーよりはるかに小さい物理的ライブラリーサイズが必要なだけであるため、クラスターのそれぞれをコードする核酸ライブラリーは、in vitroまたはin vivoの完全なスクリーニングのために充分小さいことである。

本発明のある実施態様において、ヒット変種ライブラリーのスコア化は、所望の機能のために最適化した配列の集団を選択するために、およびヒット変種ライブラリーIIの出発設計を調製するために使用される。生じるヒット変種ライブラリーIIのスコア化は、修飾と設計増強の変種プロフィールへの影響を調べるために使用される。核酸ライブラリーから得られる（後述のセクション7に詳述）ヒット変種ライブラリーIIIはまた、ライブラリーの一致を決定、および分子標的の一致背景上に配列と構造空間をマッピングすることにおけるスコア化関数の有効性を評価するためにスコア化される。

具体的な実施態様において、MM項からの標準項は、静電溶媒和項と、静電溶媒和の連続的溶媒モデルを用いて計算された溶媒がアクセスできる溶媒和項とを含む溶媒和項と組合わされている；これらのMM-PBSAまたはMM-GBSA法は、骨格と側鎖を含むコンフォメーションエントロピーからの寄与とともに、フリーエネルギー変化において実験値と計算値の間で良好な相関を示している（Wang W, Kollman P (2OOO) J Mol Biol 303, 567-582）。タンパク質とドラッグデザインで使用される他のスコア化関数と比較して、MM-PBSAまたはMM-GBSAはスコア化のための良好な物理的モデルであり、一貫したアプローチにより種々の問題を扱うが、システムの集合平均を計算するのに、明確な水の中の分子動的シミュレーションから多重軌道が必要なためコンピューター的に高価になり、連続的溶媒モデルはコンピューター的に遅い。これらの正確な方法は、ライブラリースクリーニングに使用される単純なスコア化関数を較正するための、または単純な計算ではできないいくつかの困難な変異を研究するためのベンチマークを提供する。

7) タンパク質設計のフォースフィールドの例
タンパク質のコア内の正しいパッキング相互作用をスコア化するための重要な相互作用であるファンデアワールス（vdw）相互作用を使用して、計算で許容されたロタマー配列を試験することによりタンパク質コア配列を設計した（Ponder JW, Richards FM (1987) J Mol Biol 193, 775-791）。確率アルゴリズムを用いるシミュレートした進化を使用して、ポテンシャル関数下で一群の配列を選択することができる；タンパク質の疎水性コア中の残基について選択された配列のエネルギーのランク順序は、その生物活性とよく相関する（Hellinga HW, Richards FM (1994) PNAS 91, 5803-5807)。

推計アルゴリズムを使用してタンパク質を設計するのに、同様のアルゴリズムを使用した（Desjarlais J, Handel T, (1995) Protein Science 4, 2006-2018; Kono H, Doi J (1994) Proteins, 19, 244-255）。標的足場の設計配列へのポテンシャル関数の作用は、ファンデアワールス、静電学、および表面依存性半経験的環境フリーエネルギーまたは項の組合せを含めて、アミノ酸配列の組成を一定に維持する自動タンパク質設計法で評価されている。エネルギー関数の各追加項は、パッキングのためのvdw、折り畳み特異性のための静電作用、および疎水性残基の埋め込みのためのかつ親水性残基の露出のための環境的溶媒和項により、設計された配列の性能を漸進的に向上させることが証明された（Koehl P. Levitt M (1999) J Mol Biol 293, 1161-1811）。

最適の解答を見つけるためにエネルギー表面を試験するのに自己矛盾のない平均フィールドアプローチが使用された（Delarue M, Koehl. (1997) Pac. Symp. Biocomput. 109-121; Koehl P, Delarue M, (1994) J. Mol. Biol. 239, 249-275; Koehl P, Delarue M (1995) Nat. Struct. Biol. 2, 163-170; Koehl P. Delarue M (1996) Curr. Opin. Struct. Biol. 6:222-226; Lee J. (1994) Mol. Biol. 236, 918-939; Vasquez (1995) Biopolymers 36, 53-70）。分子フィールド、知識ベースの統計的フォースフィールドおよび他の経験的補正からの項の組合せはまた、標的足場の未変性の配列に近いタンパク質配列を設計するのに使用されている（Kuhlman B, Baker D (2000) PNAS 97, 10383-l0388）。タンパク質コア設計の立体的反発以外に、構造ベースの熱力学的項が含められた（Jiang X. Farid H, Pistor E, Farid RS (2OOO) Protein Science 9, 403-416）。知識ベースのポテンシャルはタンパク質を設計するのに使用されている（Rossi A. Micheletti C, Seno F, Maritan A (2001) Biophysical Journal 80, 480-490）。

フォースフィールドはまた、特にタンパク質設計目的に行き止まり排除アルゴリズムと組合せて最適化されている（Dahiyat BI, Mayo SL (1996) Protein Science 5, 895-903）。エネルギー関数は、分子力学的エネルギー項と特異的な溶媒和項とを組合せる対の機能性型に分解され、コア、境界および表面位置の残基について使用される；行き止まり排除アルゴリズムは、大きな数のコンビナトリアルロタマー配列を調べるのに使用される。タンパク質設計に使用されるフォースフィールドと固定骨格を有する強固な逆折り畳みプロトコールとの厳密性は必然的に、高率の偽陰性結果を与えている；ソフトエネルギー関数または柔軟性のある骨格が可能なら許容されるであろう多くの配列が拒絶される。さらにタンパク質設計に使用されるエネルギー関数は、タンパク質折り畳みまたは安定性の研究に広く使用され試験されている一般的なフォースフィールド（例えばAmberまたはCharmm）とは極めて異なる（Gordon DB, Marshall SA, Mayo SL (1999) Curr Opin Stru Biol 9, 509-513）。タンパク質設計プロトコールに含まれる偽陰性の問題のために直接の比較は不可能かも知れないため、特定のプロトコールを使用して設計された配列を、別の方法からの配列と比較する時は注意をする必要がある。

本発明者らは、ほとんど制限の無いタンパク質の設計にとって、タンパク質でにおける高い偽陰性率は問題ではないが、ほんのわずかに制限領域のみがタンパク質機能を改良するための改変配列を有することが許される薬学的応用のタンパク質の設計にとって、これは深刻な問題を提起すると考えている。例えば、実際にはVEGF抗体中のV_H CDR3のほんの１つまたは２つの残基のみがその結合親和性を改良するのみであるが、V_H CDR3には多くの変種が許容されるが、フレームワーク領域については、ヒト化のために数個の変異体が許容されるのみである。従って、標的領域中のこれらのわずかの変異体を同定するために、機能改良のために最も重要なことは、コンピューターによるスクリーニングのスケールまたはスピードではなく正確さである。
場合により、分子動力学または他のコンピューター法を使用して、配列をランク付けするのに使用される構造集合体や集合平均スコアを生成することができる（Kollman PA, Massova I, Reyes C, Kuhn B, Huo SH, Chong LT, Lee M. Lee TS, Duan Y, Wang W, Donini O, Cieplak P, Srinivasan P, Case DA, and Cheatham TE (2000) Acc. Chem Res. 33, 889-897）。集合構造体から計算される平均的性質は、実験測定からの対応するデータとより良好な相関を示す。

6. リード構造鋳型に基づく変異体抗体ライブラリーの構築
あるいは、リード抗体の3D構造に基づき変異体抗体ライブラリーが直接構築され、次にin vitroまたはin vivoで所望の機能についてスクリーニングされる。このアプローチは、ヒット変種ライブラリーの構築を避けることにより近道をし、タンパク質データベースをスクリーニングすることにより構築されるヒットライブラリーからの配列を直接評価する。このアプローチは、図1Cまたは1E-Hに経路IIIとして記載されている。

セクション3に詳述されるように、ヒットライブラリーを構築するのにいくつかの方法がある。ヒットライブラリーを構築する１つの方法は、タンパク質データベースを検索して、変異すべき領域のアミノ酸配列、例えばリード抗体の重鎖のCDR3（CDR H3）と配列パターンが一致するセグメントを見つける。CDR H3配列と高い相同性を有する配列を検索するのに、従来のBLAST分析を使用してもよい。
場合により、PSI-BLASTを使用して、鋳型抗体のCDR H3の配列相同物を検索してもよい。

また場合により、単一の標的配列および／または多重配列整列を使用して、プロフィール陰れマルコフモデル（HMM）を構築してもよい。このHMMは次に、タンパク質配列データベース（例えばタンパク質のKabatデータベース、およびフレームワークのヒト生殖細胞系免疫グロブリンデータベース）からの近いおよび離れたヒト相同対の両方を検索するのに使用される。種々の種からの免疫学的関心のあるタンパク質のKabatデータベースは、CDRの多様な配列を設計するのに使用することができる。

配列整列またはその組合せのための任意の上記方法を使用して選択されるヒットライブラリー中の配列はプロフィール化して、鋳型抗体中の対応する領域（例えばCDR H3）の各位置のアミノ酸の種類とその出現頻度を比較することができる。
ヒットライブラリーの各メンバーは、鋳型抗体中の対応する領域（例えばCDR H3）に移植され、抗体の残りとの構造的適合性について、上記セクション5に記載のスコア化関数を使用して試験される。

同様のアプローチを使用して、リード抗体の異なる領域（例えば、重鎖と軽鎖のCDR1、CDR2）からのリード配列に基づいてヒットライブラリーが構築され、リード抗体の残りとの構造適合性について試験することができる。これらのライブラリーを組合せて、リード抗体の異なる領域への同時変異が可能になり、こうして変異体抗体ライブラリーの多様性が上昇する。

これらのプロセスで選択されたすべての変異体抗体配列はプールされ、in vitroまたはin vivoで標的抗原への高親和性結合についてスクリーニングされる。

7. 実験によるスクリーニングのための核酸ライブラリーの構築
in vitroまたはin vivoの機能的スクリーニングを促進するために、本発明の上記方法を使用して選択されるアミノ酸配列をコードする核酸ライブラリーが構築される。核酸ライブラリーのサイズは、アミノ酸配列を選択しプロフィール化するための具体的な方法に依存して変化する。例えば、あまりにも多くのアミノ酸配列が選択され組換えられる場合は、核酸のサイズは＞10⁶に達しても良い。実験的に効率的で完全なスクリーニングを促進するために、アミノ酸配列の分割および再プロフィール化を行って、核酸ライブラリーのサイズが小さくされる。上記セクション5に記載のように、例えばヒット変種ライブラリーIIを作成するのに使用されるプロフィールはまた、in vitroもしくはin vivoの実験によるスクリーニングのための核酸ライブラリーのサイズを測定するのに使用される。

図6は、選択されたアミノ酸残基のアミノ酸配列をコードする核酸ライブラリー、例えばヒット変種ライブラリーIIを構築するための方法の例を示す（図4と5）。核酸ライブラリーを構築するために、アミノ酸プロフィール中の変種は、ライブラリーサイズとコドン使用を考慮して、対応する核酸に逆翻訳される（図6）。

例えば、あるアミノ酸ライブラリーの多様性をカバーする最も単純で最も小さい核酸ライブラリーを得るために、発現系で使用される唯一の好適なコドンがアミノ酸ライブラリーをコードするように選択される。対応するヌクレオチド位置変種プロフィール（NT-PVP）は、AA-PVPの逆翻訳から得られ、ヌクレオチドコンビナトリアル算出から核酸ライブラリーサイズが決定される。例えば、図13A〜Cを参照。このサイズが10⁶未満である場合、核酸ライブラリーの合成（例えば、核酸ライブラリーＩ、II、IIIなど、図7）が行われ、次に実験によるスクリーニングが行われる。サイズが10⁶より大きいなら、セクション2に配列空間またはプロフィールに記載されているように、ヒット変種ライブラリーIIはより短いライブラリーに分割されるか、またはスコア化分布を再試験して、新しいAA-PVPを作成して小ライブラリーサイズを生成する。

NT-PVPを使用することにより、選択された核酸配列を個々に合成することなく、縮重核酸ライブラリーを構築することができる。このアプローチでは、各位置についてヌクレオチドの異なる混合物を用いて自動オリゴヌクレオチド合成機をプログラミングすることにより、各ライブラリー（例えば、核酸Ｉ、II、IIIなど、図7）について１回の通過で核酸ライブラリーの合成を行うことができるため、コストと時間を節約してくれる。その結果、縮重核酸ライブラリーの配列空間は、有意に拡張して多様性が上昇する。核酸ライブラリー（ヒット変種ライブラリーIIIとして翻訳される）のサイズは、設計されたアミノ酸配列をコードするもの（例えばヒット変種ライブラリーII）より大きいが、縮重ライブラリー構築のこのアプローチは、設計された配列を含むのみでなく、元々の設計されたものと同等またはより優れている機能を有する新規配列を見つける可能性を上昇させる。

念のため、NT-PVPを使用して作成された核酸ライブラリーを、アミノ酸配列ライブラリーに逆翻訳してヒット変種ライブラリーIIIを作成し、エネルギー関数を使用してスコア化して、ヒット変種ライブラリーIIによりカバーされる配列と構造空間とライブラリーの一致を評価する（図13A）。最終的な評価には、ライブラリーの一致と、配列および構造空間を一致背景のマッピングにおけるスコア化関数の有効性とを証明するために、実験的選択データが必要である。

8. 構造が利用できない変異体ライブラリーの構築
配列ライブラリーをより小さい成分に分割することにより、変異体ライブラリーを構築することができる。これは、低分解構造しか利用できないかまたは全く構造が利用できない場合も、有利である。配列を重複する連続的配列セグメントに分割することにより複合体ライブラリーが設計される。各断片は縮重核酸ライブラリーを用いて標的化することができる。低分解構造しか利用できないかまたは全く構造が利用できない場合も、構造が結合していることが測定される変種は、縮重核酸ライブラリーを使用して同時に標的化されることを注意されたい（後述の実施例を参照）。このアイデアはセクション2の7)に記載されており、後述の実施例で例示される（設計については図28A〜D、実験結果については図30と36を参照されたい）。

簡単に説明すると、配列変種ライブラリーは、以下のように小断片に分解される：構造が離れたセグメントはしばしば相関せず、その結果広く離れた変異は独立に処理されるが、空間で互いに結合する断片は、コンビナトリアル核酸ライブラリーにより同時に標的化すべきである。この場合、構造情報は好ましいが、絶対に必要ではないことに注意されたい（詳細については後述の実施例と図28A〜Dを参照）。

本発明の利点
アミノ酸配列と構造モチーフの大きなコンビナトリアル空間を試験し、タンパク質間の分子間相互作用をスコア化することにより、アミノ酸配列のライブラリーをコンピューターでスクリーニングすることができる。ここで使用される特異的抗体−抗原複合体について、それぞれリード配列単独、抗体構造、および抗体と抗原の複合体構造に基づいて、抗体のいくつかのライブラリーが設計され構築される。すべてのライブラリーは、その配列および／または構造がリード抗体に偏りがある；その一部は複合体中の特異抗原に対する。すなわち抗体ライブラリーは、cDNAライブラリーからまたは特異抗体リードのランダム突然変異誘発からの抗体の集まりより、濃縮されており関連する。これらのライブラリーは、特異抗原を用いる親和性成熟について実験的にスクリーニングされる。CDR中のリード抗体配列とは異なる種々の配列が選択される（図16Aと27を参照）。選択された配列の一部は、リード抗体（または親抗体）より遅いオフレート（より高い親和性を示唆する）を示す。この中で、２つの変異体（図30と36を参照）（例えばH97Yおよび／またはS101T）が、文献で報告された親和性成熟したV_H CDR3配列中の決定的に重要な変異体と同一であるが、１つの新規変異体（S101R）は、文献で報告されたS101Tより、２つの独立した実験系で測定すると、オフレートパニングが良好であった（Chen Y, Wlesmann C. Fuh G, Li B, Christinger HW, McKay P, de Vos AM (1999) J Mol Biol 293, 865-881）。

本発明は、いくつかの面で有利であると考えられる。まずこのアプローチは、タンパク質の進化データを使用して、配列および構造空間の両方でヒットライブラリーを拡張する。進化的に濃縮された配列データベースからリード配列の近いならびに遠い相同体を検索するのに、単純なBLASTから強力になっていくプロフィールベースのアプローチ（例えばPSI-BLASTおよび／またはHAMMER）までの配列検索法が利用される。利用できるリード構造の多重配列整列に基づく配列プロフィールの使用は、伝統的な多重配列整列アプローチより多くの配列空間のサンプリングを可能にする。従ってここで使用した方法は、多様性、ならびに新規ヒットまたは結合親和性が上昇した変異体の組合せを見つける機会を上昇させる。

第２に、配列空間中のサンプリングはまた、特定の目的に適した配列データベースの選択を強調する。例えば、CDRの設計するための多様な配列データベースの使用およびヒト生殖細胞系またはフレームワーク領域のヒト起源の配列の使用は、免疫原性が大きな問題である薬学的応用のタンパク質を設計するのに使用すべきである。

第３に、種々のデータベースから既存の存在を使用する配列設計は、１つの進化的に濃縮された配列またはその組合せが使用されるため、簡便かつ高度に効率的である。改良されたが計算が高価なスコア化関数を応用して、管理可能なサイズの得られる配列プールをスコア化することができ、これは、折り畳みと発現とを含む情報を暗示的に取り込む。

第４に、構造鋳型と最適化スコア化関数の使用は、任意の実験によるスクリーニングの前に、コンビナトリアルヒット変種ライブラリーのサイズを効率的にフィルターにかけ縮小することができる。すなわち、大きな仮想配列空間をコンピューターで試験でき、好ましい配列の集合の以後の選択は、多様な配列空間をカバーするいくつかの小さなライブラリーの実験的合成を指令することができる。

第５に、ライブラリーサイズの制御（これは核酸ライブラリーについて通常約10³〜10⁷である）は、直接機能的スクリーニングを実験的に実施することを容易にする。直接機能的スクリーニングは、in silico法の有効性と正確性についての最終的な試験であるため、コンピューターによるスクリーニングでスコア化関数と構造鋳型に関連するいくつかの固有の限界が実験的に試験される。

第６に、長い配列を分割するための単純な構造相関の使用はライブラリーサイズの制御を可能にし、その結果、多様性を大きく喪失することなく実験的に管理できる。これはまた、利用できる構造情報がほとんどなくても、リード配列の配列ライブラリーを設計することを可能にする。

最後に、スコア化関数の適応性とパラメータ化は、各実験サイクルでの改良を可能にする。実験でスクリーニングしたクローンは、プロフィールの実際の位置変種であり、これは種々のスコア化項を改良することにより、スコア化関数を改良するためのフィードバックとして使用することができる。

要約すると、タンパク質の配列および構造空間でコンピューターによるスクリーニングを用いて、実験限界内で、直接実験によるスクリーニングを組合せることにより機能空間を調べることは、我々がここに抗体について示すようにタンパク質工学および設計に対する強力なアプローチである。

実施例
抗体ライブラリーのin silico構築のために本発明の方法を使用した。抗体設計において本発明を証明するために、原理の証明実験の抗原として血管内皮増殖因子（VEGF）を選択する。VEGFとその受容体については、豊富な配列および構造情報が利用できる（Muller YA, Christinger HW, Keyt BA, de Vos AM (1997) Structure 5, 1325-1338; Wiesmann C. Fuh G, Christinger HW, Eigenbrot C, Wells JA, de Vos AM (1997) Cell 91 , 695-704）、VEGFとそのヒト化抗体との複合体（Muller YA, Christinger HW, Li B, Cunningharn BC, Lowman HB, de Vos AM (1998) Structure 6, 1153- I167、およびVEGFとその成熟抗体との複合体（Chen Y, Wiesmann C, Fuh G, Li B, Christinger HW. McKay P, de Vos AM (1999) J Mol Biol 293, 865-881）。これらは、本発明の方法を試験するための良好な根拠を提供する。本発明により提供される方法を使用することにより、抗体配列、抗体の構造、抗体とその抗原との複合体構造からの増加してきた情報を利用して、抗VEGF抗体のいくつかのデジタルライブラリーがin silicoで設計された。１本鎖または２本鎖の抗体結合単位を用いる２つの独立の新規ファージ表示系（phage display system）により、VEGFへの高親和性結合について、抗体ライブラリーの集団をin vitroでスクリーニングした。

1. 抗VEGF抗体ライブラリーのin silico設計
VEGFは発生における主要な血管形成因子であり、内皮細胞を刺激することにより固形腫瘍の増殖に関与する。マウスモノクローナル抗体はVEGF依存性細胞増殖を阻止し、in vivoで腫瘍増殖を遅らせることがわかった（Kim KJ, Li B, Winer J, Armanini M, Gillett N, Phillips HS, Ferrara N (1993) Nature 362, 841-844）。このマウス抗体はヒト化（Presta LG, Chen H, O'Connor SJ, Chisholm V, Meng YG. Krummen L, Winkler M, Ferrara N (1997) Cancer Res. 57, 4593-4599; Baca M. Presta LG, O'Connor SJ, Wells JA (1997) J Biol Chem 272, 10678-10684）、およびファージ表示とオフレート選択を使用して親和性成熟された（Chen Y, Wiesmann C, Fuh G, Li B. Christinger HW, McKay P, de Vos AM (1999) J Mol Biol 293, 865-881）。VEGFと親抗体との間で形成された複合体（Muller YA, Chen Y, Christinger HW, Li B. Cunningham, BC, Lowman HB, de Vos AM (1998) Structure 6, 1153-1167）、ならびにVEGFと成熟抗体との間で形成された複合体（Chen Y. Wiesmann C, Fuh G, Li B, Christinger HW, McKay P, de Vos AM, Lowman HB (1999) J. Mol Biol 293, 865-881）のＸ線構造が報告された。

図9Aは、ヒト化抗VEGF抗体（以後「親抗VEGF抗体」）の可変領域のアミノ酸配列と、ヒト化抗VEGF抗体から親和性成熟した抗体（以後「成熟抗VEGF抗体」）を示す。抗原と接触することが観察されたV_H CDR中のアミノ酸残基のそれぞれを、下に以後「c」と記載する。図9Bは、V_H CDR中の親抗VEGF抗体と成熟抗VEGF抗体の整列である。フレームワークとCDRは、Kabat基準に従って命名される（Kabat EA, RediMiller M, Perry HM, Gottesman KS (1987) Sequences of Proteins of Inununological Interest 第４版、国立衛生研究所（National Institutes of Health）, ベセスダ、メリーランド州）。アミノ酸残基の差を太字で強調してある。図9Bに示すように、成熟抗体のみが、親抗体とは異なる２つのアミノ酸残基をV_H CDR1（T28DとN31H）とV_H CDR3（H97YとS100aT）に有する。親和性成熟後はCDR2に変化は無い。

成熟抗VEGF抗体は、V_H鎖に４つの変異（T28D、N31H、H97Y、およびS100aT）を有する親抗VEGF抗体よりVEGFに対して135倍高い結合親和性を有する。V_H CDR3中の変異の２つは、親抗体に対して結合親和性を個々に14倍（H97Yから）と２倍（S100aTから）改良する（Chen Y, Wiesmann C, Fuh G, Li B, Christinger HW, McKay P, de Vos AM, Lowman HB (1999) J. Mol Biol 293, 865-881の表6を参照）。V_H CDR3中のH97Y単独による14倍の親和性の改良は、これを親和性成熟について単一の最も重要な変異とし、これは、H97Yにより抗原と抗体の間で２つの追加のＨ結合が作成されるというＸ線による複合体構造の観察と一致する。

本発明において抗体のCDRとフレームワークのような各モチーフは、モジュラーin silico進化的設計アプローチを使用して標的化することができる。このモジュラー設計は図8に記載される。各CDRにはわずかな限定された数のコンフォメーション（標準構造と呼ぶ）のみがあることは理解されている。抗体のこれらの構造的特徴は、抗体構造の広範な分析から、V_LおよびV_H中のCDR1、CDR2、およびCDR3のような抗体の種々の領域の構造化されたモチーフを使用して、進化的配列設計を試験するための優れたシステムを提供する。これらの構造と配列保存は、異なる種にわたって観察されている。実際、抗体の足場、または免疫グロブリン折り畳みは、自然界で観察される最も豊富な構造の１つであり、種々の抗体と関連分子中で高度に保存されている。

本発明者らは、上記の親抗VEGF抗体は、本発明の方法を使用して指令抗体親和性成熟のためのモデル系のリードタンパク質として機能できると考えている。成熟抗VEGF抗体（Chenら、前述）は、本発明の方法を使用して得られた結果を証明するための参照または陽性対照となることができる。

さらに構造の重なりは、VEGFと親抗体とで形成される複合体の構造が、VEGFと成熟抗体とで形成する複合体とほとんど重なることを明らかにした。成熟前後の抗体構造は実質的に同じであるため、親抗体と成熟抗体の構造は、本発明の方法を使用して抗VEGF抗体のデジタルライブラリーの設計に使用された。本発明の方法はまた、配列ベースのアプローチまたは誘導された構造変化を含有する構造集合体をを使用して、抗原結合により誘導された一致を有する抗体を設計するのに使用することができる。

リードタンパク質として親抗VEGF抗体をそしてリード配列としてそのV_H CDR3を使用して、図1D中に経路IVとしてそして図2に模式図で概説した方法に従ってV_H CDR3のデジタルライブラリーを構築した。

リード配列は、親抗VEGF抗体のV_H CDR3と隣接フレームワーク領域からのいくつかのアミノ酸残基とを含有した（図9B）。概説すると、V_H CDR3と遠い相同性を有するヒットアミノ酸配列を検索し選択することにより、ヒットライブラリーを構築した。ヒットライブラリーに基づいて各位置ですべての変種を記載するために変種プロフィールを作成し、あるカットオフ値でフィルターにかけて、生じるヒット変種ライブラリーのサイズをコンピューターのまたは実験の限界内まで小さくした。以下を促進するために変種プロフィールもまた構築した：i) 一致背景中の好適な領域をカバーする配列空間のサンプリング；ii) 好適なペプチド集合配列を標的とする縮重核酸ライブラリーの分割と合成；iii) 所望の機能について抗体ライブラリーの実験によるスクリーニング；およびiv) さらなる設計と最適化のためのフィードバックのある実験結果の分析。

VEGFと抗VEGF抗体とで形成された複合体の利用できるＸ線構造から、リード構造鋳型を得た。VEGFと親抗VEGF抗体の複合体構造を1BJ1とよび、VEGFと成熟抗VEGF抗体との複合体構造を1CZ8と呼ぶ。スキャンした配列の相対的ランクで1CZ8構造鋳型からの結果は1BJ1からの結果と同様であった。

1) リード配列
V_H CDR3のリード配列は、Kabat分類に従って親抗VEGF抗体から取られ、隣接フレームワーク領域からのアミノ酸残基CAKとWGがそれぞれＮ末端とＣ末端でV_H CDR3配列をフランクする（図9B）。図9Bに示すように、親抗体と成熟抗体のV_H CDR3は２つのアミノ酸位置のみが異なる。親抗体のV_H CDR3配列のみを使用して、タンパク質データベース検索のためのHMMを作成した。

2) ヒットライブラリーと変種プロフィール
単一のリード配列（配列番号5）（図9B）を使用して作成したHMMを較正し、Kabatデータベース（Johnson, G and Wu, TT (2001) Nucleic Acids Research, 29, 205-206）を検索するのに使用した。予測値すなわちE値より大きいすべての配列ヒットを記載し、HAMMER2.2.1パッケージを使用して整列する。ヒットリストから重複し成熟した配列（すなわち、成熟配列が利用できないと仮定して配列番号6）を除去した後、リードHMMについて残りの107個のヒット配列がヒットライブラリーを形成する。

図10Aに示すように、107個のヒット配列は、Kabatデータベースからのリード配列の35〜95％の範囲である。ヒットの間の進化的距離は、樹状図で図10Bに、プログラムTreeView1.6.5（http://taxonomy.zoology.gla.ac.uk/rod /rod.html）を使用して表示する。系統樹を、ClustalW 1.81（Thompson JD, Higgins DG, Gibson TJ (1994) Nucleic Acids Research 22, 4673-4680）中の隣接体結合法（Saitou N, Nei M (1987) Mol Biol Evol 4, 406-425）を使用して分析した。

各位置の変種プロフィールを図11に示す。図11のAA-PVP表は、各位置での各アミノ酸残基の出現数を与える。表リストの下の変種プロフィールは、各位置での出現が減少する順に、参照配列としてリード配列を用いてデータベースから見つかったすべての変種を記載する。

ヒットライブラリーからの107個のヒット配列の多様性は、各位置のアミノ酸の頻度と変化の両方を示すAA-PVP表で見ることができる。V_H CDR3中の親抗VEGF抗体と成熟抗VEGF抗体の配列の差を比較すると、２つの異なるアミノ酸（Kabat番号付けシステムを使用してH97YとS100aT）が各位置で記載される変種に含まれる。成熟配列の結合親和性を上昇させるのに最も重要な変異体であることが報告されたH97Y（Chen Y, Wiesmann C, Fuh G, Li B, Christinger HW, McKay P, de Vos AM, Lowman HB (1999) J. Mol Biol 293, 865-881）は、その位置で最も高頻度な残基（〜25％）として容易に同定される。S100aTは、その位置で同定される変種の〜5％を占める。図11の右下部分は、カットオフ頻度10またはそれ以下で出現する変種をフィルターにかけた後の変種プロフィールを示す。フィルター化後に、配列の各位置でほんのわずかの数の変種のみが許容されることが明らかになる；しかし、そのようなカットオフでは、エネルギースコア化は維持されるであろうが、成熟配列中のS100aTのような一部の重要な変異体が失われるかも知れない。

進化的選択プールからの変種プロフィールは、変化できるかまたは固定できるリード配列中の位置を同定するのに有用なデータを提供する。この部位は３つのカテゴリーに分類することができる：i) 構造が保存された部位は進化しても保存されたままである。高頻度残基は、これらの位置で標的モチーフの足場を維持するのに使用することができる；ii) 焦点化した突然変異誘発を用いて、可変の機能的ホットスポットを標的化すべきである；iii) 機能的ホットスポットで同時に可変性を提供しながら、標的足場を安定化するためのi)とii)の組合せ。

機能性変種からのアミノ酸のセットは進化的に選択され最適化されているので、変種プロフィール中の頻度に従って機能的ホットスポットでこれらを含めるべきである。さらに、コンピューターや実験の制約を満足するために、各位置の変種は他の有用な変異体候補を含めるかまたは好ましくない変異体候補を排除するようにフィルター化または優先順位付けすることができる。

3) ヒットライブラリーのコンビナトリアル配列の構造ベースの評価
変種プロフィールは、各位置でおよび好適な順序の具体的な変異体で、好適なアミノ酸残基上で有益であるが、これは、膨大な数の組換え体を具体化する。頻度カットオフを使用するあるフィルター化は、コンピューターによるスクリーニングで評価されるかまたは実験ライブラリーにより直接標的化される必要があるコンビナトリアル配列を減少させる。変種プロフィールに適用されるカットオフを用いてさえ、実験によるスクリーニングのために最終配列でスコア化され評価される必要がある多くのコンビナトリアル配列がある（図13A〜Cおよび28A〜Dに示す）。

ヒットライブラリーおよびヒット変種ライブラリーを形成するそのコンビナトリアル配列をスクリーニングするために、構造ベースのスコア化が適用される。親抗VEGF抗体のV_H CDR3の側鎖は、各残基位置の変種ライブラリーからの対応するアミノ酸変種のロタマーにより置換された。ロタマーのコンフォメーションを作成し、骨格依存性ロタマーライブラリーを使用するプログラムSCWRL（登録商標）（バージョン2.1）を使用して最適化した（Bower MJ, Cohen FE, Dunbrack RL (1997) JMB 267, 1268-82）。

スコア化は、抗原VEGFの構造の存在下および非存在下でCONGEN［Bruccoleri and Karplus (1987) Biopolymers 26: 137-168］のAmber94を使用して、最適ロタマーを検索しエネルギーを100ステップ最小化することにより行った。図12AとBは、それぞれ親（1BJ1）と成熟（1CZ8）抗VEGF抗体の構造を使用して、VEGF抗原有りおよび無しで、CONGENを用いて計算した総エネルギーに基づく、抗VEGF変種ライブラリーのエネルギースコアを示す。親および成熟配列のスコアは、図12AとBで印を付けてある。成熟配列は、抗原の有り／無しで両方の構造中で親配列よりスコアは良く、成熟配列の変異体が、抗体構造ならびにVEGF抗原とのその複合体の両方を安定化することを示唆する。図12Cは、抗原の存在下および非存在下での配列のスコア化が一般的に相関することを示し、これは、抗体構造のみに基づく配列スクリーニングがまた、その抗原との良好な結合親和性を有する良好な配列候補となることを示唆する。

図12Aと12Bに示すように、親配列および成熟配列より高いスコアを有する、種々の変種ライブラリーの多くの配列がある。エネルギー模式図のエネルギースコア化の分布は、V_H CDR3のヒット変種ライブラリー、そのコンビナトリアルペプチド、縮重核酸ライブラリーのコンビナトリアルライブラリー、および実験的に選択された配列からの10個の選択された配列について図13Aに示す。スコア化は、成熟配列中のY97が絶えずH97よりスコアが良く、これは実験観察結果と一致する（Chen Y, Wiesmann C, Fuh G, Li B, Christinger HW, McKay P, de Vos AM, Lowrnan HB (1999) J. Mol Biol 293, 865-881）。T100aは成熟配列中にあるようにS100aより好適であり、一方TとSの両方とも100b位置中では同等に好適である。すなわち、構造ベースのエネルギースコア化は、元々タンパク質データベースから選択された進化的配列のプロフィール化に基づいて作成されたヒット変種ライブラリーの各位置での変種の出現を再プロフィール化するための別の独立した方法を提供する。

CONGENで使用された単純なエネルギー関数を使用してスコア化関数の正確度を測定するために、配列のランダム選択したセットのエネルギーを、側鎖エントロピー、非極性溶媒和エネルギーおよび静電溶媒和エネルギーを含む改良されたカスタムスコア化関数を使用して計算した。３つのエネルギー項を計算した：側鎖エントロピー、非極性溶媒和エネルギー、および静電溶媒和エネルギー。ループの骨格エントロピーを計算する追加の選択肢があった。側鎖エントロピーは、CONGEN中のコンフォメーション検索コマンドCGENを使用して計算した。CGEN下の選択肢は、側鎖コンフォメーションツリーを拡張するための各結合（節）でひずみ空間を使用して個々の側鎖形成ツリー検索を行うと定義した。これらには、各側鎖についてSEARCH DEPTHとSIDE選択肢があり、SGRIDパラメータをAUTOに設定して、各ひずみ角が不連続間隔で回転するようにした。具体的には、AUTO設定は、例えばフェニル、チロシル、カルボキシル、およびアミノ基中のように回転対称を有する結合についてひずみグリッド角30度を使用し、他のすべてについて10度を使用した。MIN選択肢は、各ひずみについて局所的エネルギー極小で回転サンプリングが開始するように設定した。またVAVOIDO選択肢は、ファンデアワールス反発回避をオンにするように含めた。MAXEVDWパラメータは、比較的高い100kcal/molに設定して、ファンデアワールス反発を緩和させ、算出中により多くのコンフォーマーが得られるようにした。

側鎖コンフォメーション検索を、各変異体残基側鎖について繰り返した。コードは、コンフォメーション空間のツリー検索により到達する「下の葉の数」を出力する（これは、完了したツリー検索の数である）。近似として、側鎖コンフォメーション検索は、計算時間が最小になるように、各残基を独立に処理する。互いに接触しない残基について、これは良好な近似値である。互いに接触する可能性のある残基について、コンフォメーション算出は、コンフォメーションの数を過剰に推定する傾向がある。我々は、より多くのサンプリングを得るために比較的高いファンデアワールス反発を使用するため、残基接触による誤差は、コンフォメーション空間の人工的測定において減少させなければならない。さらに、コンフォメーションの数が大きくなると、残基接触による誤差の意味は小さくなりがちであり、これは、エントロピーの相対的変化は、変異体と参照構造中のコンフォメーションの数の対数の差であるためである。

非静電溶媒和エネルギーは、CONGENで使用されたGEPOL (Pascual-Ahuir JL, Silla E (1993) J Comput Chem 11, 1047-1060）コマンドを使用して、スケーリング定数を70cal/mol/A² (Tunon I, Sma E, Pascual-Ahuir JL (1992) Prot Eng 5, 715-716) にしてGEPOL93アルゴリズムにより計算した時、分子表面に比例するようにした。表面の三角形の分割レベルを特定するNDIVは3に設定する。値は1〜5の範囲であり、5は最も高い正確度を与えるが、CPU時間要求が顕著に上昇する。RGRIDは2.5Aに設定し、これは、隣接体を見つけるのに使用される空間グリッドを説明する。

静電溶媒和エネルギーは、UHBDプログラム（Davis ME, Madura JD, Luty BA. McCammon JA (1991) Comput Phys Commun 62, 187-197）で使用された有限差PB（FDPB）法を使用して計算した。変異の周りの領域については、焦点化法を使用した。自動プロトコールは３つのグリッドを生成する：粗い、細かい、焦点グリッド。グリッド単位はそれぞれ1.5、0.5および0.25オングストロームである。焦点グリッドは、変異残基が占めるデカルト容量にまたがる球形グリッドである。細かいグリッドは、タンパク質または複合体の全容量にまたがる球形グリッドである。粗いグリッドは、各軸で細かいグリッドの約2倍のサイズに設定されている球形グリッドであり、細かいグリッドの約8倍の容量をカバーする。粗いグリッドは、長期の溶媒作用を説明するのに有用であり、細かいグリッドの境界条件を設定する。同様に細かいグリッドは、タンパク質内部の静電的寄与を説明し、焦点グリッドの境界条件を設定する。焦点グリッドは、変異による局在化作用のより詳細を説明する。タンパク質内部と外部の誘電率は、それぞれ4と78に設定される。温度は300ケルビンに、イオン強度は150mMに設定される。最大繰り返しは200に設定される。内部および外部誘電率が4に設定されるように計算は均一な誘電率で繰り返され、そして２つのエネルギーの差が計算される。後者の計算は、グリッドへ電荷を与えることによるエネルギーを示す。

CONGEN中のAmber94フォースフィールドとここで使用されたUHBD中のPBからの溶媒和項を使用するカスタムスコア化関数または分子力学的エネルギーは、MM-PBSAまたはMM-GBSAに等しいことが証明された。エネルギー関数は、特に、エネルギー関数の集合平均（Kollman PA, Massova I, Reyes C, Kuhn B, Huo SH, Chong LT, Lee M, Lee TS, Duan Y, Wang W, Donini O, Cieplak P, Srinivasan P, Case DA, and Cheatham TE (2OOO) Acc. Chem Res. 33, 889-897）に基づいて、配列とその変種をスコア化するより正確な方法を提供するために分子動力学的計算による構造集合体を使用する時、実験データより良好な一致（Sharp KA. (1998) Proteins 33, 39-48; Novotny J, Bruccoleri RE. Davis M, Sharp KA (1997) J Mol Biol 268, 401-411）を示す。

4) ヒット変種ライブラリーの変種プロフィールの低下
ほとんどの好適な残基を維持しながらライブラリー候補のサイズを低下させるために、上記したようにヒット変種ライブラリーからの変種プロフィールをフィルターにかけた。図13Aの上の部分は、カットオフ値より出現頻度が小さいアミノ酸で構造ベースの評価で排除した後の、ヒット変種ライブラリーからのランク上位の10個の選択された配列の低下した変種プロフィールを示す。リストは、標的抗原に結合できる多様な配列の選択における本発明の証明についての盲検法として選択した。変種ライブラリーの１つのコンピューターによるスクリーニングからの10個の選択された配列には、いくつかの共通の特徴がある：例えばVEGF抗原の存在下または非存在下で鋳型構造として1bj1または1cz8を使用してランク上位の200個の配列について、R94、Y97およびR100aはいつも対応するK94、H97およびS100aより優れている。後に実験の欄で示すように、実際H97Yは親和性成熟のための良好な変異体である。しかし。アルギニンへのK94RおよびS100aRのような変異は興味深い例である：一方で、K94Rは親和性成熟の良好な変異体ではないが、K94RはKabat分類に従うとCDRとフレームワークの境界にあり、ヒトフレームワーク配列にとっては進化的に好適である。本発明の実験的選択で証明されるようにK94はR94より好適（図30と36）であり、これは、R94変異が抗VEGF抗体の結合親和性を上昇させるという文献（Baca M, Presta LG, O'Connor SJ, Wells JA (1997) J Biol Chem 272, 10678-10684）の観察結果と一致する。他方で、S100aRはV_H CDR3成熟の最も重要な単一の変異の１つであり、文献で報告されているようにS100aTより好適であり、ファージ表示において厳しい洗浄条件下でも多数回のラウンドのパニングでも持続する（図30と36を参照）。

変種プロフィール中のいくつかの重要な変異体を見逃さないように、野生型からのリジン（例えばK94R）のようないくつかの残基を含めてもよいが、これらはヒットライブラリーのフィルター化で使用されたカットオフ値より低いか、またはこれらは、長い側鎖またはコンフォメーション変化を有する荷電残基を含む計算の仮定に関連する問題のためにアルギニンよりスコアが悪い。従って、長い側鎖を有する荷電残基（例えばアルギニンおよびリジン）については、設計ライブラリーにおいて、同じ位置に予測される残基と野生型残基が含まれる。低下した変種プロフィールは、リード配列からの多様な配列を有する機能性ライブラリーの設計についてここで使用した本発明の方法の盲検法として、ヒット変種ライブラリーIIを算出するのに使用した。

5) ヒット変種ライブラリーII − スコア化選択と最適化から設計したアミノ酸ライブラリー
好適なスコアおよび／または好適な相互作用に参加する可能性のある残基の存在に基づいて上位の配列を選択する方策を使用して、核酸ライブラリー設計のためのアミノ酸配列のクラスターを同定した（図7）。上記したように、コンピューターによる評価からのそれぞれV_H CDR3、CDR1およびCDR2についての図13A〜Cの配列（例えば10個の配列）のクラスターを、in vitroでのさらなる実験のために選択した。ペプチド配列と各位置の変種を図13Aの左上部分に記載する。フィルターにかけた変種プロフィールに基づいてコンビナトリアルライブラリーを作成し、ヒット変種ライブラリーIIを形成した。抗VEGF（図13A）のV_H CDR3について、ヒット変種ライブラリーIIのサイズは、リード配列よりスコアの良い選択された上位の10個の配列の変種プロフィールに基づくと72である（使用した変種ライブラリー中の上のランクの10個の配列）。V_H CDR1とCDR2については図13BとCを参照されたい。

6) ヒット変種ライブラリーIIに基づく縮重核酸ライブラリーの構築
上記で構築したヒット変種ライブラリーを、単一の縮重核酸ライブラリーを用いて標的化した。図13Aの下の部分は、V_H CDR3について最適の大腸菌（E. coli）コドンを使用する逆翻訳から得られる核酸配列プロフィールを示す。このプロフィールに基づき、塩基の混合物を各縮重位置に取り込むことにより縮重核酸ライブラリーを合成した。合成のコンビナトリアル作用の結果として、この縮重核酸ライブラリーは、4608のサイズの拡張したアミノ酸ライブラリーをコードする（「ヒット変種ライブラリーIII」と呼ぶ）。V_H CDR1とCDR2については図13BとCを参照されたい。

上記で構築した縮重核酸ライブラリーをファージ表示系（phage display system）にクローン化し、96ウェルプレート上に被覆された固定化VEGFへの結合に基づき、ファージ表示された抗体（ccFv）を選択した。後述のセクション2に詳述するように、小さい核酸ライブラリーサイズで、1〜3ラウンドの洗浄と選択（すなわちパニング）を行い、陽性ELISA反応を示すクローンを選択し、V_H CDR3について図14Bに示すように配列決定した。陽性クローンは、核酸ライブラリーへの縮重コドンの取り込みとともに、標的化位置で多様な変種プロフィールを示す。

設計したもの対実験的にスクリーニングした抗体配列の結果を図14〜18で分析する。簡単に説明するとV_H CDR1、2、3の配列は、V_H CDR3について上記した本発明の方法に基づいて設計されている。V_H CDR3、CDR2およびCDR2についてコンピューターでスクリーニングしたライブラリーから選択した上位の10個の配列とその変種プロフィールを図13A〜Cに示す。図16Aは、図13A〜Cに示す縮重核酸のV_H CDR1、CDR2およびCDR3から実験的に選択されたアミノ酸配列を記載する。図16Bは、抗VEGF V_H CDR1、2、3の対応する親配列に対する、V_H CDR1、CDR2およびCDR3ライブラリーから選択された配列の配列同一性の分布を示す。図17Aは、４つの異なるライブラリー（設計アミノ酸配列、設計配列のアミノ酸変種のコンビナトリアルライブラリー、およびユニークなアミノ酸配列をコードするコンビナトリアル縮重核酸ライブラリーおよび全縮重核酸ライブラリー）の関係と、例としてラウンド3からの抗VEGF V_H CDR3ライブラリーを使用して、Xに示した実験的に選択された陽性クローンの分布を示す（図17Bの表を参照）。異なるライブラリー中の分布は、選択条件、ライブラリー設計の有効性、選択されたクローンの相対的サイズ対配列決定したクローンのライブラリーもしくは数に依存する。図17Bは、４つのライブラリー（図17A）の間の関係と抗VEGF V_H CDR1、2、3ライブラリーの陽性クローンの実験的に選択された配列の分布を示す表である。

V_H CDR3の詳細な分析を後述する。図14Aは、縮重核酸ライブラリー（図13A）にコードされるV_H CDR3を有する機能性抗VEGF ccFv抗体のラウンド1とラウンド3で同定されたELISA陽性クローンのUV読み値を示す。図14Bは、図13Aに示す核酸ライブラリーのファージ表示によるラウンド1と3の選択からの陽性クローンのV_H CDR3配列を示す。親抗VEGF抗体や成熟抗VEGF抗体（図9BとC）のV_H CDR3とは異なるいくつかの位置で大きな変動が有って、多くの多様な配列が選択されることが明らかである。図14Cは、スクリーニングした配列の多様性を示す陽性クローンの系統樹を例示する。図14Bに示すV_H CDR3からの選択された陽性クローンの配列同一性は、親V_H CDR3配列に対して57〜73パーセントの範囲である。図15A〜Bは、第１ラウンドと第３ラウンドでスクリーニング配列の起源の３群への分解を示すパイチャートである：設計アミノ酸配列、設計アミノ酸配列からのコンビナトリアルアミノ酸配列、および合成した縮重核酸ライブラリーによりコードされるユニークなコンビナトリアルアミノ酸配列。配列分析について各ラウンドから限定された数の陽性クローンのみが選択されるため、図は、設計、そのコンビナトリアルアミノ酸、および核酸ライブラリーからの選択された配列のパーセントを例示するのみである。

これらの実験は、本発明の方法を使用することにより、多様な配列と系統発生的距離を有するのみでなく、関連する生物学的機能（例えば、VEGFのような標的抗原に結合する能力）を有する抗体が選択されることを証明した。

図18は、例としてV_H CDR3の各段階で、アミノ酸配列のスコア化結果を使用する配列設計の漸進的進化を要約する。左から右へ模式図は、リード配列、データベース検索から作成したヒットライブラリー、ヒット変種ライブラリーＩ中のコンピューターでスクリーニングしたコンビナトリアル配列、設計アミノ酸配列の選択された群（ヒット変種ライブラリーII）、ライブラリーIIプロフィールから得られた縮重核酸ライブラリー、および実験でスクリーニングされた陽性クローンと配列のエネルギースペクトルを示す。このプロセスは、増強もしくは所望の性質を有する配列が実験的に選択されるまで、実験からのフィードバックを用いて繰り返される。

図19A〜Dは、リード配列または複数の構造に基づく整列から得られたリード配列に基づく配列相同性分布の比較を示す。図19Aは、構造ベースの多重配列整列から作成したリードプロフィールを示す。リード配列の構造モチーフは、ある距離のカットオフ内の同様の構造についてタンパク質構造データベース（PDBデータバンク）を検索するのに使用される。各構造とV_H CDR3構造モチーフ（青で着色）の間の平均自乗平均の平方根の差（RMSD）は、2Å以内である。対応する多重配列整列を、対応する構造のPDB IDと色とともに図19Aの右に示す。

図19Bは、親抗VEGF抗体のV_H CDR3のリード配列プロフィールに基づいて作成したヒットライブラリーの251個のユニークな配列の変種プロフィールを示す。図の下の部分は、頻度の5％カットオフ（この場合は12）を使用して得られたフィルターにかけた変種プロフィールを示す。興味深いことに、リード配列プロフィールから作成された変種プロフィール中にも重要な変異体（H97YとS100aRまたはS100aT、図30と36を参照）が観察される。

図19Cは、親V_H CDR3配列に対するヒットライブラリーからの配列の分布を示す。丸は、HMM検索について単一の親配列を使用して、36％までの配列同一性が同定できることを示す。三角は、構造ベースの多重配列整列からのリード配列プロフィールを使用して、さらに下のほぼ20％までの配列同一性が見つけられることを示す。ここで使用される配列検索方策は、リード配列に対して遠い相同性（20％の低さまで）を有する多様なヒットを見つけることができる。

図19Dは、配列、構造および機能空間中の有望な候補について検索するためにここで使用した本発明の方法の概念的進化を示す。基礎的なアイデアは、機能空間で改良された機能を有する候補を見つけるために、配列および構造空間中のヒットと変種ライブラリーの多様性を拡張するということである。ヒットと変種ライブラリーの多様性および／またはサイズが、例えばリード配列または配列プロフィールの遠い相同体（図19Aに示す）を見つけることにより上昇するが、配列、構造および機能空間の間の交差部分は、機能が向上した配列を見つける確率が上昇すると、より小さい領域に焦点化することができる。

HMMモデルを作成するためのプロフィールとして構造ベースの多重配列整列を使用することは、リード配列の遠い相同体（問題の配列の20％の配列同一性まで）を見つけることを可能にすることは明らかである。ここに記載した本発明の方法は、利用できる配列と構造情報が増加しスコア化関数の正確度が改良されると、抗体CDRライブラリーを設計するのにより強力になるであろう。

2. in vitroで設計された抗体ライブラリーの機能的スクリーニング
上記の方法を使用して親抗VEGF抗体のリード配列に基づいてin silicoで設計した抗体ライブラリーを、新規ファージ表示系（phage display system）を使用して抗原VEGFに結合する能力について試験した。親抗体または成熟抗体の構造が、構造ベースのコンピューターによるスクリーニングのために使用された。１本鎖抗体（scFv）の型を取る抗体をスクリーニングする一般的アプローチ（図20と32に示す他の新規方法を参照）に対して、２本鎖抗体ライブラリーを発現させ、バクテリオファージの表面に表示させた。２本鎖抗体は、抗体のFabを機能的に模倣するためにV_HとV_Lのヘテロダイマー化により形成される。この２本鎖抗体を「ccFv」と呼ぶ。上記したようにin silicoで設計した抗体の配列をコードする縮重核酸ライブラリーに基づいて、ccFvライブラリーを構築した。

ccFvを設計するための理由、ccFvライブラリーの構築と発現、およびccFvライブラリーの機能的スクリーニングを、以下に詳述する。

1) ccFv − ヘテロダイマー性コイルドコイル安定化抗体
抗体Fv断片は、全抗原結合部位を含有する最も小さい抗体断片である。Fv断片は２つのV_HとV_L断片間で非常に小さい相互作用エネルギーを有し、生理学的条件下での多くの応用にはあまりにも不安定なことが多い。当然ながら、V_HとV_Lドメインは、定常ドメイン（C_H1とC_L）中に位置する鎖間ジスルフィド結合により連結されてFab断片を形成する。V_HおよびV_L断片はまた、１つの断片のカルボキシ末端と別の断片のアミノ末端とを短いペプチドリンカーにより人工的につないで１本鎖Fv抗体断片（scFv）を形成することもできることは公知である。
本発明は、V_HとV_Lヘテロダイマーを安定化するための新しい方策を提供する。ユニークなヘテロダイマー化配列対を設計し、これを使用して、Fab様機能的人工的Fv断片ccFvを作成した（図20）。ヘテロダイマー配列対のそれぞれは、ヘテロダイマー受容体GABA_B R1とR2から得られた。この配列対は特異的にコイルドコイル構造を形成し、GABA_B-R1とGABA_B-R2受容体の機能的ヘテロダイマー化を仲介する。抗体のV_HとV_Lのヘテロダイマーを操作するために、GABA_B R1とGABA_B-R2コイルドコイルドメイン（それぞれGR1とGR2）を、それぞれV_H断片とV_L断片のカルボキシ末端に融合させた。すなわち、V_HとV_Lの機能的対合ccFv（コイルドコイルFv）は、GR1とGR2の特異的なヘテロダイマー化により仲介される。さらに、GR1とGR2ドメインのカルボキシ末端を、柔軟性のあるスペーサーまたはフレキソン「SerArgGlyGlyGlyGly」［配列番号7］（または「GlyGlyGlyGlySer」［配列番号18］）を加えて修飾した。ヘテロダイマー性ccFvをさらに安定化するために、GR1とGR2コイルドコイルのＣ末端に「ValGlyGlyCys」［配列番号8］スペーサーを加えて一対のシステイン残基を導入して、コイルドコイルGR1およびGR2介在ヘテロダイマーがジスルフィド結合で共有結合できるようにした（図20〜21）。ccFvは分子量35kDaで大腸菌（E. coli）で発現された。

2) 抗VEGF（AM2-ccFv）とファージ表面へのその表示
抗VEGF抗体AM2のV_HとV_L配列を図22A〜Bに示す。これは、親抗VEGF抗体を修飾して設計した抗体である。設計したCDR配列ライブラリーの効率的なクローニングを促進するために、親抗VEGF抗体のV_HとV_L遺伝子中にユニークな制限部位を導入した。AM2 V_HとV_L遺伝子の両方をファジミドベクターにクローン化してファージ表示ベクターpABMD12を構築した。図23Aと23Bは、それぞれベクター地図と配列［配列番号17］を示す。このベクターは２つの融合タンパク質を発現するであろう：V_H-GR1とV_L-GR2-pIII融合体。発現されたV_H-GR1とV_L-GR2-pIII融合体は、細胞周辺腔中に分泌され、ここでこれらはヘテロダイマー化して、コイルドコイルドメインを介して安定なccFv抗体（「AM2-ccFv」と呼ぶ）を形成する。
ファージ上にAM2-ccFvを表示するために、pABMD12ベクターを細菌TG1細胞中に形質転換した。pABMD12ベクターを有するTG1細胞をさらにKO7ヘルパーファージで重感染させた。感染したTG1細胞を2×yt/Amp/Kan中で30℃で一晩増殖させた。ファジミド粒子をPEG/NaClにより培養物上清から沈殿させ、PBSに再懸濁して固定化VEGFに対してライブラリー選択をした。２時間結合後、非結合ファージを洗い流し、結合ファージを溶出させ、次のラウンドのパニングのために増幅した。

ファージ粒子上に表示されたccFvの結合は、ファージELISAによる抗原結合活性により検出した。簡単に説明すると、抗原（例えばVEGF）をまずELISAプレートに被覆した。5％ミルク／PBSでブロッキング後、ファージ溶液をELISAプレートに加えた。固定化抗原に結合したファージを、ファージ被覆タンパク質pVIIIに対するHRP結合抗M13抗体とインキュベートして検出した。基質ABTS［2，2’−アジノ−ビス（3−エチルベンズチアゾロン−6−スルホン酸）］を、HRP活性の測定に使用した。このアッセイはAM2に特異性が高いことが証明された。

上記のファージELISAでAM2-ccFvと比較するために、１本鎖AM2抗体（AM2-scFv）ファージも調製した。図24に示すように、固定化VEGFへのAM2-ccFvファージの見かけの結合親和性は、AM2-scFvファージよりほとんど１オーダー高い。すなわち、ファージ粒子上に表示されると、AM2-ccFvとAM2-scFvともに機能性であると結論される。

3) モデル抗体ライブラリーからのccFvファージの濃縮
AM2-ccFv表示ファージがバックグランドファージから濃縮できることを証明するために、我々はパニング実験を行って「モデルライブラリー」からAM2-ccFvファージについて選択した。モデルライブラリーは、AM2-ccFvファージを無関係のAM1-ccFv表示ファージと1：10⁶または1：10⁷の比率で混合して調製した。固定化VEGF抗原について2ラウンドのパニングを行った。100μlの2μg/ml VEGFを96ウェルプレート中の各ウェルに被覆した。PBS中の5％ミルクでブロッキングした後、2％ミルク／PBS中の1×10¹²ライブラリーファージをウェルに加え、室温で2時間インキュベートした。ファージ溶液を捨て、ウェルをPBST（PBS中0.05％ツイーン20）で5回洗浄し、PBSで5回洗浄した。結合ファージを100mM トリエチルアミンで溶出させ、TG1培養物に加えて感染させた。感染したTG1細胞から調製したファージを次のラウンドのパニングと上記ファージELISAに使用した。各ラウンドのパニング後、回収されたAM2-ccFvファージ対AM1-ccFvファージの比を、PCRにより感染したTG1コロニーを分析して測定した。AM2-ccFv遺伝子とAM1-ccFv遺伝子の配列の差のために、AM2-ccFv遺伝子を特異的に増幅するがAM1-ccFv遺伝子は増幅しない一対のプライマーを設計した。図25Aに示すように、第２ラウンドのパニングからのファージは非常に高いELISA読み値を与え、2ラウンドのパニング後に1：10⁶と1：10⁷ライブラリーの両方からAM2-ccFvファージの高い濃縮が達成されたことを示唆する。PCR分析は、AM2-ccFvファージの出現率が、第１ラウンドのパニング後の1：10⁷ライブラリーから4.4％であり、第２ラウンドのパニングから100％であることを確認した（図25B）。

4) 設計したccFv抗体のファージライブラリーの構築とパニング
図8に概説するように、モジュラー進化的アプローチを使用して、コンピューターによるスクリーニングと実験によるスクリーニングのために抗体ライブラリーを構築した。設計したCDR配列のライブラリーをコードするオリゴを合成し、PCRにより増幅した。増幅用のプライマーは、合成CDR配列をpABMD12ベクター中にクローン化するための制限部位を含有する。CDR1、CDR2、およびCDR3の挿入のためにそれぞれNheIとXmaI、XmaIとSpeII、およびPstIとStyIの制限部位を使用して、AM2-ccFvのために３つのV_Hライブラリーを調製した。連結後、DNAをTG1細胞中に形質転換した。TG1細胞からKO7ヘルパーファージ感染によりファージを調製した。固定化VEGFに対する3ラウンドのパニングを後述のように行った。100μlの2μg/ml VEGFを96ウェルプレート中の各ウェルに被覆した。PBS中の5％ミルクでブロッキングした後、2％ミルク／PBS中の1×10¹²ライブラリーファージをウェルに加え、室温で2時間インキュベートした。ファージ含有溶液を捨て、ウェルをPBST（PBS中0.05％ツイーン20）で5回洗浄し、PBSで5回洗浄した。結合ファージを最後に100mM トリエチルアミンで溶出させ、TG1培養物に加えて感染させた。感染したTG1細胞から調製したファージを次のラウンドのパニングに使用した。各ラウンドのパニング後、94〜376個のクローンをファージELISAのために取り上げた（図26AとB）。ファージELISAからの陽性クローンをPCRにより増幅し配列決定した。次にDNA配列をアミノ酸配列に翻訳した。３つのライブラリーからのコードアミノ酸配列を図27の表に記載する。

5) ３次構造または構造モデルからの制約の有るおよび無い配列に基づくライブラリー設計
CDRライブラリーを設計するための別の方策は、構造空間中でCDR配列を無関係のおよび関係のあるセグメントに分割し、CDRループのＮ末端およびＣ末端領域のような構造的に結合した部位で共変変異体を検出することである（ほとんどの場合に低い分解構造で充分である）。例えば図28Aは、V_H CDR3のフィルターにかけたヒット変種プロフィールを実験的選択からの他の変種と組合せることにより得られる抗VEGF抗体のV_H CDR3の複合変種プロフィールを示す。我々は、多様な供給源からの変種を組合せて、ライブラリー構築のための複合変種プロフィールを作成できることを証明したい。約10⁶〜10⁷の多様性を有する核酸ライブラリーにより各小さい変種プロフィールがカバーできることを確認するために、この変種プロフィールは、より小さい変種プロフィールのいくつかのセグメントに分解できる。分解したセグメントライブラリーでは、V_H CDR3成熟配列とH97YおよびS101T（KabatのS100aT）との組合せは意図的に避けたことを注意されたい（図28A〜D）。

図28A〜Dは、抗VEGF V_H CDR3の配列ライブラリーを示す。ライブラリーを３つのセグメントに分解する：図28Dは、結合した変種を含有する可能性のあるＮ末端とＣ末端をカバーする（1〜3）、図28Cはセグメント(4)を含有し、図28Dは、他のセグメント(5)を含有する。すべての３つのセグメントは、約10⁶のサイズの核酸ライブラリーによりカバーされる：図28B中の(1〜3)は、３つの縮重核酸ライブラリーにより標的化され、一方図28C〜D中の(4)と(5)は、別々の縮重核酸ライブラリーにより標的化される。

これらのセグメントライブラリーを設計する理由は以下の通りである。構造的に遠いセグメントはしばしば無関係であり、従って空間中で広く分かれた変異は独立に処理することができる。CDR3ループについて、配列は３つのセグメントに分割される：第１と第３のセグメント（ループの基部）はライブラリー設計のための１つのプロフィールを形成し、ループの頂部はライブラリー設計のための縮重核酸ライブラリー中にサイズが10⁶の２つのプロフィールに分解される。図28Bに示されるように、空間中で互いに結合するＮ末端とＣ末端の断片（ループの基部を形成する配列は一般的にループ閉環に相関する）は、３つの縮重オリゴヌクレオチド（1〜3）のみを有するコンビナトリアル核酸ライブラリーにより同時に標的化すべきである。CαまたはCβ距離マトリックスのような単純な基準を調べて、相関するセグメントを同定することができる（8Å内のCα原子中の構造と距離接触マトリックスについては図28Aを参照）。場合により、より詳細な相互作用マトリックスをマッピングして、相互作用の数と種類を調べることができるが、基礎的原理は相関セグメントを同定するものと同じである。

頂部のライブラリー（例えば図28Cと28Dの(4)と(5)）はしばしば無関係である。これらは、各ライブラリーが、実験により容易に管理できるサイズ範囲（図28C〜D中で＜10⁶）に限定されるなら、連続的に１次配列に沿って縮重オリゴヌクレオチドライブラリーにより、標的化される。生じるライブラリー間で小さいレベルの局所的相関を維持するために、断片間に位置の重複がなければならない。同様に、長いセグメントは重複セグメントに分割されて、配列の長さをまたがるようにし、対応するライブラリーを作成することができる。

生じる再プロフィール化は、観察された実験的または構造的またはコンピューター基準に基づいてさらに修飾され増強される。これらには、追加の極性アミノ酸との既知の水素結合の種々の位置、大きな脂肪族または芳香族基とのファンデアワールス接触の大きい領域、またはグリシンによる柔軟性の上昇により利益を受ける領域がある。実験的フィードバックにおいて、図28Aの変種プロフィールで証明されるように、以後の設計改良のための基礎として、早期スクリーニングからのアッセイ結果に基づいて変種を加えてもよい。より洗練された分析は、配列内のアミノ酸基の結合（例えば、塩結合または水素結合）を考慮してもよい。

6) ccFvライブラリーL14のためのオフレートパニング
高親和性抗体を選択するために、オフレートパニングプロセスを行ってライブラリーL14を選択した（図28A〜Dを参照）。ファージ表面上の抗体断片と固定化抗原との相互作用の強さは、オンレート（結合速度）とオフレート（解離速度）により測定される相互作用性親和性により測定される。前記試験により、高親和性の抗体は通常遅いオフレートを有するが、低親和性の抗体は速いオフレートを有し、これらのオンレートは同様である。固定化抗原からの低親和性を有する抗体の解離を促進するためにオフレートパニングを設計し、洗浄条件の厳しさ（ストリンジェンシー）を徐々に上昇させた。ストリンジェンシーが上昇する洗浄液を適用して、低親和性ファージを洗い流し、親和性が高くなっていく（すなわち、遅いオフレート）ファージを残した。従って、厳しくなる洗浄条件を生き延びるファージは高親和性を有し、その存在が優勢になるファージは存在が低いものより高い親和性を有するはずである。我々はまた、種々のパニング条件下で（図29と35A〜B）２つの独立の表示プラットフォーム（図20と32）を使用して、ファージレベルで匹敵するオフレートパニングを証明する。ファージパニングから生じる陽性クローンまたはクローンのコンセンサスは、ある配列または変種、親配列と比較して抗原に対して増強した親和性を有することを強く示唆する。

V_H CDR3配列を短い重複セグメントに分解することにより、抗VEGF V_H CDR3ライブラリーとしてL14を調製した（図28A〜Dを参照）。遅いオフレートを区別するために、多くのパニング条件を操作した。最初の2ラウンドのパニングで、ウェルをPBSTとPBSで軽く6回洗浄して、低親和性のファージを除去した。パニング3から出発して、結合ファージをさらに長時間洗浄して、より速いオフレート（解離）を有するものを除去した。そのような解離期間の持続とストリンジェンシーをパニングの回数とともに増加させ（図29）、より多くのファージを解離させ除去した；これに対して、遅いオフレート（高親和性）を有するものは結合したまま残り、最終的に濃縮される。図29に記載のように、パニング3はPBS中で37℃で1時間行った（PBSは10分毎に新鮮なものを使用し、その間に短い洗浄を行い解離したファージを除去した）；パニング4はPBS中で37℃で2時間行った；パニング5はPBST中で室温で1時間、次にPBS中で37℃で2時間行った；パニング6は大量（20ml）のPBS中で室温で一晩行った；パニング7はさらに洗浄の温度（30℃）、容量（50ml）、および時間（24時間）を上昇させた。図29に示すように、上記の洗浄ストリンジェンシーを変化させる以外に、抗原濃度、ファージ入力濃度を低下させ、結合時間の温度を上昇させて、解離をさらに増強した。パニングから生き延びたクローンをランダムに取り上げ、ファージELISAで測定して、VEGFに結合する能力を確認した。パニング5と7の両方でクローンから100％ELISA陽性率が得られ、パニング5以降はすべての生存ファージがVEGFに結合でき、従って洗い流されたファージはより速いオフレートを持っていたことを示唆している。ファージELISAで陽性のクローンのうちで、パニング5からの20クローンとパニング7からの10クローンを、DNA配列決定のためにランダム取り上げた。V_H CDR3のコードアミノ酸配列を図30に要約する。野生型と平均抗体の頻度は、パニング5で20％であった。高ストリンジェンシーでさらに2ラウンドのオフレートパニング後に、野生型配列の頻度はパニング7で0まで低下した。これに対して、HR（H97、R101またはKabatではR100a）変異体は、パニング5で35％からパニング7で70％まで濃縮され（図30）、これは最終的に唯一の優勢なクローンとなった。HT（H97、T101またはKabatではT100a）変異体の存在（30％）は、パニング5と7で変化しなかった。P0からP7までのHR変異体の濃縮を図31に示す。これらのデータは、HRとHT変異体の両方が野生型抗体より高い親和性を有することを示唆する。HR変異体の親和性はHT変異体（これは、成熟配列について報告された（Chen Y, Wiesmann C, Fuh G, Li B, Christinger HW, McKay P, de Vos AM, Lowrnan HB (1999) J. Mol Biol 293, 865-881）ように101位（またはKabatでは100a）にアルギニンではなくスレオニンを有する）の親和性より高いはずである。

8) アダプター介在ファージ表示系による１本鎖（scFv）抗VEGF抗体ライブラリーのパニング
後述の独立した系を使用して、オフレートパニング方策をさらに試験した。

従来のファージ表示系では、目的のタンパク質をファージカプシドタンパク質（例えばpIII）に融合させてファージの表面に表示させた。融合タンパク質は組み立てられてファージ粒子となり、野生型ファージタンパク質はKO7のようなヘルパーファージにより提供された。我々は、「アダプター指令表示系」と呼ぶ新しいファージ表示系を開発した。一般的に目的のタンパク質は、特異的にヘテロダイマーを形成する一対のアダプター（１つは発現ベクター中の表示されたタンパク質と融合され、他の１つはヘルパーベクター中のファージカプシドタンパク質と融合する）により、ファージ粒子の表面に輸送される。本例の一対のアダプターは、上記のGR1とGR2である。図32に記載のように、目的のタンパク質（scFv抗VEGF）はアダプター（GR1）との融合体として発現されて、発現ベクター中でscFv-GR1の構築体を形成する（図33AとB）。GR2をヘルパーファージのゲノム中に挿入して、pIIIカプシドタンパク質との融合体を形成した（pIIIのGR2-CT、図33AとB）。その結果、修飾ゲノムを有するヘルパーファージは次にGMCTウルトラヘルパーファージと命名される（図34AとB）。TG1細胞では、発現ベクターはscFv-GR1を発現し、これは次に細菌細胞周辺腔中に分泌される。細胞をさらにGMCTウルトラヘルパーファージで感染させ、これはpIIIのGR2-CTを発現し、細菌細胞周辺腔中にも分泌される。従ってscFv-GR1とpIIIのGR2-CTは、GR1とGR2のコイルドコイル相互作用により特異的にヘテロダイマーを形成し、これは最終的にファージの表面にscFvを組み立てる。

この系を使用して我々は、抗VEGF scFvライブラリーL17（上記ccFvライブラリーL14と同等）を構築した（抗VEGF CDR3 V_H合成ライブラリー）。ライブラリーL14の選択と同様に、オフレートパニングを適用した。ライブラリーDNAをTG1細胞に形質転換し、次にGMCTウルトラヘルパーファージでレスキューした。標準的プロトコールに従ってファージを調製し、96ウェルプレート中の固定化VEGFに対する結合を試験した。図35Aに示すように、パニング1と2からのウェルを、まずPBSTで10回洗浄し、次にPBSで室温で10回洗浄し、次にPBST中で室温で1時間解離した（PBSTは10分毎に新鮮なものに交換し、その間に短い洗浄を行い解離したファージを除去した）；パニング3では解離時間を2時間に増加させた。パニング3から回収したファージを使用して、２つの平行パニング（図35B）（パニング4とパニング5）を行って、低親和性のファージの解離をさらに促進させた：パニング4では150ml PBSTで18時間、パニング5では37℃。パニング4からELISA陽性の10クローンとパニング5から8クローンを、配列決定のためにランダムに取り上げた。データを図36に示す。パニング4では、WT配列の存在は10％であった。HT変異体（30％）とHA変異体（30％）の頻度は同等であった。分析した10クローンの中で101位（100a Kabat）にはアルギニン残基は証明されず（図36）、この段階で低出現率を示唆している。これに対して、パニング5では解離ストリンジェンシーを上昇させることにより、101位（100a Kabat）のアルギニンの存在は50％（8クローンのうち４つ）まで上昇し、パニング5では優勢になる。比較すると、HT変異体は30％から12.5％まで低下し、WTは10％から0まで低下し、図30の観察結果と一致する。この結果は、HR変異体がHT変異体またはWTより高い親和性を有することを強く示唆する。

9) ライブラリー設計、多様性および親和性成熟の要約
図30と36の両方に示した結果は、ここで使用した２つの独立した新規ファージ表示系のオフレートパニングは、新規変異体HR（H97、R101またはKabatでR100a）を選択できることを示唆する。HR変異体は、報告された成熟配列中の対応するHT（H97、T101またはKabatでT100a）変異体より高い結合親和性を有する（図9B）。さらにHR変異体は、YS（Y97、S101またはKabatでS100a）変異体より良く抗原に結合する（図36のパニング4を参照）。YS変異体は以前、WTに対して14倍結合親和性を改良すると報告され、成熟抗VEGF抗体のV_H CDR3の単一の最も重要な変異体であると考えられた（Chen Y, Wiesmann C, Fuh G, Li B, Christinger HW, McKay P, de Vos AM, Lowrnan HB (1999) J. Mol Biol 293, 865-881）。この変異体H97Yはまた、データベース検索（図11）とコンピューターによるスクリーニング（図13A）により、設計ライブラリーで重要であることがわかった。

K94は興味深い例であり、ある程度考察に値する。厳密に言うと、K94はKabat命名法ではV_H CDR3に属さない。しかしV_H CDR3のＮ末端の配列CAKは、HMMモチーフの作成において含まれ、その理由は、この配列が配列モチーフの境界に強い制約を与えるためである。CAKはフレームワークとV_H CDR3の境界領域であるため、我々は、この領域の変異が結合親和性に与える影響を試験することを考える。R94はデータベース検索とコンピューターによるスクリーニングの両方で好適であることがわかったが（図11と13A）、K94は実験によるスクリーニングでR94より強く結合する（図30と36）。K94とR94の両方をライブラリーに含めるとK94のみが選択された（図28B、30および36）が、R94はVEGFへの結合においてまだ活性がある（図13Aと14B）。この理由は、ジョイント領域中のR94は、抗体の他の領域と相互作用することにより抗原への結合においてV_H CDR3の配向を変化させ、こうしてコンピューターによるスクリーニングに使用された元々のK94Ｘ線構造（成熟抗体）を失効させるためかも知れない。R94は、ヒト化中に抗VEGF抗体の結合親和性をほぼ5倍低下させることが報告された（Presta LG, O'Connor SJ, Wells JA (1997) J Biol Chem 272, 10678- 10684）。この問題を避けるためにいくつかのアプローチが使用できる：(1) CDRのみを設計するなら、境界の残基を設計することを避ける；(2) 親および好適な残基の両方（例えば、94のKとRの両方）を実験ライブラリー中で組合せる。RとKは、データベース検索からこの位置で好ましい２つの主要な残基（R94についてほぼ90％、K94についてほぼ10％）であるため、この場合これらは妥当かつ直接的である（図11を参照）；(3) 分子動的シミュレーションによりコンピューターでR94をこの位置でコンフォメーションを試験し、改変構造または構造集合体がR94とともに使用されるかどうか調べる。

要約すると、抗VEGF抗体のV_H CDR3領域の周りの３つの重要な部位が、VEGFの抗体の結合親和性に対して直接影響を有することがわかっている。３つの位置（K94、H97およびS101）の変異の２つ（Y97とR101またはR100aKabat）は、抗原の存在下および／または非存在下で親または成熟抗体構造を使用して、抗原との改良された結合に重要であることがわかり、R94はジョイント領域での変異により誘導される構造変化の可能性のために正しく予測できなかった。Y97は、我々の実験によるスクリーニングで証明されたように、親和性改良の重要な変異であることがわかっている。R101（R100aKabat）は、２つの独立のファージ表示系により確認される新規変異体であり、おそらくY97より高い親和性を付与するであろう。

R94、Y97およびR101を含むこれらの変異体のほとんどは、ヒット変種プロフィール中の優勢変種に属する（図11を参照）（＞5％）。従って単純な配列検索により、ヒット変種ライブラリーからこれらが見つかるであろう。変種ライブラリーの構造ベースのスクリーニングでは、これらの変異体はまた、図13Aに示すように選択された配列プロフィール中で高くランクされる。集合配列スコア化の観点から、親配列より高いスコアの配列のプール化と再プロフィール化はまた、観察された変種を94（88％R、12％K）、97（60％Y、17％H）、および101（60％R、17％T、13％S）で高くランク付けされる。R94に関連する問題を除くと、Y97とR101またはT101に対する統計的選択性は我々の設計で明らかである。我々は、変種プロフィールを作成するための配列検索および／または構造ベースのスコア化を使用する我々のライブラリー設計を証明した。２つの独立した新規ファージ表示系を使用する実験によるスクリーニングまたは選択は、V_H中の親配列とは異なる配列を設計するのに、ここに記載した本発明の方法の有用性を証明した。ここで見つかった変異体の一部（例えばY97および／またはR101またはT101）は、親配列より少なくとも10倍高い親和性を有する（Y97は親和性の14倍改良を占め、一方R101は我々の実験でより高い親和性を有することが証明された（図36を参照）。外挿すると、変異体の組合せ（例えばY97とR101）は、成熟配列について報告されたものより高い親和性を有する可能性がある。

親和性成熟したV_H CDR3の結合親和性を、図37に示すようにバイオセンサーチップ上に固定化したVEGFを用いて、SPR(表面プラスマ共鳴）装置（BIAcore）を使用して測定した。タンパク質を発現させ精製した。X50はccFvフォーマット中に有り、図22Aと22Bに示すV_HとV_Lの参照配列を含有する。X63はV_H CDR3中にH97YとS101Tを、文献に報告されたFabフォーマットの14倍改良に対してKdが6.3倍改良された（Chen Y, Wiesmann C, Fuh G, Li B, Christinger HW, McKay P, de Vos AM, Lowrnan HB (1999) J. Mol Biol 293, 865-881の表6を参照）。X64はV_H CDR3中にS101Rを含有し、参照に対して2.5倍改良され；この改良はほとんどすべてオンレートの上昇による。逆標識法改良のこの新規変異体の重要性は報告されていないが、この位置で包括的突然変異誘発が行われた。またこの位置のデータベース中の頻度は低い。これは、ここで取ったアプローチは、親和性改良のための重要な変異体を発見できることを示す。X65はH97YとS101Rを含有し、同じ条件下でccFvフォーマットを使用して10倍の改良を示し、これは親和性成熟したV_H CDR3配列（Chen Y, Wiesmann C, Fuh G, Li B, Christinger HW, McKay P, de Vos AM, Lowrnan HB (1999) J. Mol Biol 293, 865-881）のX63の最良の変異体組合せ（H97YとS101T）より結合親和性が強い。

実施例2
フレームワーク最適化のための抗VEGF抗体ライブラリーの作成
VEGFは発生における主要な血管形成因子であり、内皮細胞を刺激することにより固形腫瘍の増殖に関与する。マウスモノクローナル抗体はVEGF依存性細胞増殖を阻止し、in vivoで腫瘍増殖を遅らせることがわかった（Kim KJ, Li B, Winer J, Armanini M, Gillett N, Phillips HS, Ferrara N (1993) Nature 362, 841-844）。このマウス抗体は、抗原結合ループを移植後にいくつかの主要なフレームワーク位置でランダム突然変異誘発を使用してヒト化された（Presta LG, Chen H, O'Connor SJ, Chisholm V, Meng YG. Krummen L, Winkler M, Ferrara N (1997) Cancer Res. 57, 4593-4599; Baca M. Presta LG, O'Connor SJ, Wells JA (1997) J Biol Chem 272, 10678-10684）。典型的には、部位特異的突然変異誘発と選択後に、いくつかのあらかじめ決められた主要な位置で、ヒトまたはコンセンサスヒトフレームワークを親の非ヒト抗体からの非ヒトアミノ酸で置換することにより作成される。これらのヒト化抗体は通常、親抗体の同起源の抗原に親抗体より弱い親和性で結合する（ヒト化抗VEGFについてはその親マウス抗体より約6倍弱い、Baca M, Presta LG, O'Connor SJ, Wells JA (1997) J Biol Chem 272, 10678-10684, および他のバージョンのヒト化抗VEGFについては2倍弱い、Presta LG, Chen H, O'Connor SJ, Chisholm V, Meng YG, Krummen L. Winkler M, Ferrara N (1997) Cancer Res. 57, 4593-4599; Baca M, Presta LG, O'Connor SJ. Wells JA (1997) J Biol Chem 272, 10678-10684を参照）。この結合親和性の喪失は、CDRの親和性成熟を使用することにより回復されるであろう（Chen Y. Wiesmann C, Fuh G, Li B, Christinger HW, McKay P, de Vos AM, Lowman HB (1999) J. Mol Biol 293, 865-881）。

記載の本発明の方法を使用して我々は、フレームワーク最適化により、文献（Presta LG, Chen H, O'Connor SJ, Chisholm V. Meng YG, Krummen L, Winkler M, Ferrara N (1997) Cancer Res. 57, 4593-4599）に報告された親／参照抗VEGF抗体フレームワークより結合親和性（ccFvフォーマット中）が4倍高い２つのヒト化フレームワークを発見した。報告されたヒト化抗VEGF抗体（図22AとB）は、その対応するマウス抗体よりほぼ2倍弱いため、これらの２つのヒト化抗体は、ヒト化により対応するマウス抗体よりほぼ2倍高い結合親和性を有するはずである。

1. 抗VEGF抗体フレームワークライブラリーのin silico設計
図38Aの上のパネルは、マウス抗VEGF抗体（そこでは「マウス抗VEGF抗体またはa4.6.1」と呼ばれる）、ヒト化抗体（ライブラリーから選択されたHU2.0とHU2.10、およびV_HとV_Lの両方について主要な位置でヒト化のために使用されたアミノ酸（Baca M, Presta LG, O'Connor SJ, Wells JA (1997) J Biol Chem 272, 10678-10684を参照）のフレームワークfr123のアミノ酸配列を示す。フレームワークとCDRは、Kabat基準（Kabat EA, RediMiller M, Perry HM, Gottesman KS (1987) Sequences of Proteins of Inununological Interest 第４版、国立衛生研究所（National Institutes of Health）, ベセスダ、メリーランド州）に従って命名されるが、他の分類も使用できる。図38Aの下のパネルは、マウス抗VEGF抗体（そこでは「マウス抗VEGF抗体」と呼ばれる）およびここで親および参照フレームワークとして使用され、文献（Presta LG, Chen H, O'Counor SJ, Chisholm V, Meng YG, Krummen L, Winkler M, Ferrara N (1997) Cancer Res. 57, 4593-4599）に報告されたヒト化抗体（そこでは「ヒト化抗VEGF抗体」と呼ばれる）のフレームワークfr123領域のアミノ酸配列を示す。フレームワーク4は関係して一定であるため設計されない。しかし所望であれば、同じアプローチを使用して設計することができる。また、FR1またはFR2またはFR3およびFR4の別々のセグメントを個々に設計でき、所望であれば一緒に貼りつけることができる。CDRとFRの組合せは、ここに記載したアプローチを使用して各セグメントまたはセグメントの組合せを設計することにより、同時に設計することができる。CDR1とCDR2の位置は矢印を使用して示すが、図には記載していない。CDRは、マウス抗VEGFからの図9B中のものと同じである。図38Bは、マウス抗VEGF抗体のV_H FR123のリード配列に基づくヒトV_H生殖細胞系配列を使用して作成されるヒットライブラリーの変種プロフィールを示す。下の変種プロフィールは、アミノ酸位置の多様性を示す。図の下の部分は、それぞれカットオフ頻度5と13を使用して得られたフィルターにかけた変種プロフィールを示す。ヒットリストのメンバーのうちで5回またはそれ以下、または13回またはそれ以下の出現のすべての位置アミノ酸をフィルターにかける。図38B（続き）は、カットオフ無しでマウス抗VEGF抗体のV_H FR123のリード配列に基づくヒトV_H生殖細胞系配列を使用して作成したヒットライブラリーの再プロフィール化変種プロフィールを示すが、各位置の変種は、総エネルギーまたはファンデアワールスエネルギーを使用して、抗体構造との構造的適合性に基づいてランク付けされる。一部の参照アミノ酸は、その総エネルギーまたは特異的パッキングに基づいていくつかの位置で好適であることがわかったが、その出現頻度は非常に低い（例えば、矢印で注を付けたF68(F67), L72(L7l), S77(S76) およびK98(K94)を参照）。例えばF68とL72は、選択のためのライブラリーに含まれる。図38Cは、カットオフ19でフィルターにかけた変種プロフィールを有するマウス抗VEGF抗体のV_H FR123のリード配列に基づき、Kabat由来ヒトV_H配列を使用して作成したヒットライブラリーの変種プロフィールを示す。このプロフィールは、低頻度で出現するが足場形成において重要であるいくつかのアミノ酸の重要性を強調する。マウスV_H FR123配列を、連続的数字を使用して示す位置で点線の上に参照として記載する。アミノ酸のすべての変種は点線の下に記載する。変種中の点は、参照と同じアミノ酸である。図38Dは、カットオフ5でヒトV_H生殖細胞系配列からのフィルターにかけた変種プロフィールを使用するデザイナーライブラリーを示す（図38Bを参照）。FR123配列の上の配列番号はKabat命名法（kabataa）とそのCDR中のアミノ酸を含む連続順序に基づく。このフィルターにかけた変種プロフィールは、抗体構造のみが使用される場合の構造適合性のランク順序を反映するように、コンピューターでさらにスクリーニングすることができる。カットオフ5でフィルターにかけた変種プロフィールからは無くなっている２つのアミノ酸、F70(F69)とL72(L71)は、構造ベースのスクリーニングに基づいてこれらの位置で最も好適なアミノ酸の仲間であるため、これらも含まれる。構造ベースのスクリーニングからの上位100個の配列の最終的に提出されたライブラリーはまた、F70(F69)、L72(L71)、S77(S76)、およびK98(K94)（カッコ内の数字はKabat命名法に基づく配列番号を示す）を含み、これは、Rのような一部のアミノ酸が、VH CDR3親和性成熟のK94Rについて前記したようにL72(L71)とK98(K94)について計算で過剰に予測されるためである。

図38Dの下のパネルは、VH fr123のヒト化に使用されるアミノ酸を用いるデザイナーライブラリーを示す。図38Dに示すように、ヒト対非ヒト配列はVHの全鎖を通して多くの位置で異なるが、他のアプローチで使用されるアミノ酸ライブラリーはいくつかの主要な位置で濃縮され、一方本発明は、VHとVL鎖の両方を通して種々の位置を標的化し、これらの位置のいくつかの変異体は出発抗体のデザイナーライブラリーに基づく。

本発明において、図8に示すフレームワークFR1、FR2、FR3、およびFR4のような各モチーフ、各フレームワークモチーフまたは抗体のFR123のようなその組合せは、モジュラーin silico進化的設計アプローチを使用して標的化することができる。各モチーフについて限定された数のコンフォメーション（標準構造と呼ぶ）のみまたはその組合せがあることは理解されている。抗体のこれらの構造的特徴は、抗体構造の広範な分析に基づく抗体の種々の領域での構造化モチーフを使用して、進化的配列設計を試験するための優れた系を提供する。これらの構造と配列保存は、異なる種を超えて観察されている。実際、抗体の足場または免疫グロブリン折り畳みは、自然界で観察される最も豊富な構造の１つであり、種々の抗体や関連する分子で高度に保存されている。
本発明者らは、上記の親抗VEGF抗体は、本発明の方法を使用して治療的および他の応用のために、指令抗体最適化のモデル系のリードタンパク質として機能できると考えている。ヒト化抗VEGF抗体（Bacaら、前述；Prestaら、前述）は、本発明の方法を使用して得られた結果を評価するための参照または陽性対照として機能することができる。

さらに構造の重なりは、VEGFと親抗体とで形成される複合体の構造が、VEGFと成熟抗体とで形成する複合体とほとんど重なることを明らかにした。抗体構造、特にフレームワーク領域は実質的に同じであるため、親抗体と成熟抗体の構造は、本発明の方法を使用して抗VEGF抗体のデジタルライブラリーの設計に使用された。本発明の方法はまた、配列ベースのアプローチ、または誘導された構造変化を含有する構造集合体を使用して、抗体フレームワークを設計するのに使用することができる。

リードタンパク質としてマウス抗VEGF抗体フレームワークをそしてリード配列としてそのV_H FR123を使用して、図1D中に経路IVとしてそして図2に模式図で概説した方法に従ってV_H FR123のデジタルライブラリーを構築した。

概説すると、V_H CDR3と遠い相同性を有するヒットアミノ酸配列を検索し選択することにより、ヒットライブラリーを構築した。ヒットライブラリーに基づいて各位置ですべての変種を記載するために変種プロフィールを作成し、あるカットオフ値でフィルターにかけて、生じるヒット変種ライブラリーのサイズをコンピューターのまたは実験の限界内まで小さくした。以下を促進するために変種プロフィールをまた構築した：i) 一致背景中の好適な領域をカバーする配列空間の試験；ii) 好適なペプチド集合配列を標的とする縮重核酸ライブラリーの分割と合成；iii) 所望の機能について抗体ライブラリーの実験によるスクリーニング；およびiv) さらなる設計と最適化のためのフィードバックのある実験結果の分析。

VEGFと抗VEGF抗体とで形成された複合体の利用できるＸ線構造から、リード構造鋳型を得た。VEGFと親抗VEGF抗体の複合体構造を1BJ1とよび、VEGFと成熟抗VEGF抗体との複合体構造を1CZ8と呼ぶ。スキャンした配列の相対的ランクで1CZ8構造鋳型からの結果は1BJ1からの結果と同様であった。モデル化構造または構造集合体または集合平均はまた、配列をスクリーニングするのに使用することができる。

1) リード配列
V_H FR123のリード配列は、Kabat分類に従ってマウス抗VEGF抗体から取られる（図38B）。

2) ヒットライブラリーと変種プロフィール
単一のリード配列 A4.6.1（図38A）を使用して作成したHMMを較正し、Kabatデータベース（Johnson, G and Wu, TT (2001) Nucleic Acids Research, 29, 205-206）から得られたヒト重鎖生殖細胞系配列データベースおよび／またはヒト配列データベース（ヒト生殖細胞系とヒト化配列とを含む）を検索するのに使用した。予測値すなわちE値より大きいすべての配列ヒットを記載し、HAMMER2.2.1パッケージを使用して整列する。ヒットリストから重複配列を除去した後、リードHMMについて残りのヒット配列がヒットライブラリーを形成する。

ヒトVH生殖細胞系からのヒット配列の配列同一性は、リード配列の40〜68％の範囲であり、Kabatデータベース（このデータベースは、検索の感度とその相対的ランク付けを上昇させるためにfr123断片に分解される）（ヒト起源の免疫グロブリン配列を含有するなら、他のデータベースを使用してもよい）から得られるヒト免疫グロブリン配列からのヒット配列の対応する配列同一性は、約30〜75％の範囲である。ヒット間の進化的距離は、プログラムTreeView1.6.5（http://taxonomy.zoology.gla.ac.uk/rod /rod.html）を使用して分析することができる。系統樹を、ClustalW 1.81（Thompson JD, Higgins DG, Gibson TJ (1994) Nucleic Acids Research 22, 4673-4680）中の隣接体結合法（Saitou N, Nei M (1987) Mol Biol Evol 4, 406-425）を使用して分析した。

図38BとDのAA-PVP表は、各位置での各アミノ酸残基の出現数を与える。表リストの下の変種プロフィールは、各位置での出現が減少する順に、参照配列としてリード配列を用いてデータベースから見つかったすべての変種を記載する。ヒトVH生殖細胞系とKabat由来のヒトVH配列とのヒット配列の同一性の差を比較すると、AA-PVPの差が明らかである：ヒト生殖細胞系配列からのAA-PVPについて、各位置のすべての変異体はヒト起源であるが、AA-PVPはまた、出発非ヒト抗体配列から来るかも知れない非ヒト起源もしくは低出現頻度のアミノ酸、または進化の過程で標的抗体などの足場を安定化するのに構造的に重要なアミノ酸を含有する。例えば、図42B中のF70とL72は、VH3生殖細胞系ファージ分からのAA-PVPでは同定されない（図42を参照、ヒトVH3生殖細胞系ではこれらの２つの位置でＩとRのみが許容される）。しかし一方F75とL77は、非常に低い頻度の出現でヒトVH生殖細胞系配列中で許容される。これらのアミノ酸F70とL72は、Kabat由来ヒト配列からのAA-PVPでは比較的高い頻度で出現する。アミノ酸のすべての変種を点線の下に記載する。変種中の点は、参照中の同じアミノ酸であることを示す。図38Dは、コア5でヒトVH生殖細胞系配列からのフィルターにかけた変種プロフィールを使用するデザイナーライブラリーを示す（図38Bを参照）。FR123配列の上の配列番号は、Kabat命名法（kabataa）とそのCDR中のアミノ酸を含む連続順序に基づく。このフィルターにかけた変種プロフィールは、抗体構造のみが使用される場合の構造適合性のランク順序を反映するように、コンピューターでさらにスクリーニングすることができる。カットオフ5でフィルターにかけた変種プロフィールからは無くなっている２つのアミノ酸、F70(F69)とL72(L71)は、構造ベースのスコア化に基づいてこれらの位置で最も好適なアミノ酸の仲間であるため、これらも含まれる。構造ベースのスクリーニングからの上位100個の配列の最終的に提出されたライブラリーはまた、F70(F69)、L72(L71)、S77(S76)、およびK98(K94)（カッコ内の数字はKabat命名法に基づく配列番号を示す）を含み、これは、Rのような一部のアミノ酸が、VH CDR3親和性成熟のK94Rについて前記したようにL72(L71)とK98(K94)について計算で過剰に予測されるためである。

図42はまた、FとIの両方が、パニングによりこの位置で同定でき、この位置で優勢なL72のみが同定できることを示す。簡単に説明すると、フレームワーク最適化のためのヒト起源の異なるデータベースの使用は、改良された結合親和性と安定性を伴うヒト化を含むフレームワーク最適化のためのアミノ酸の、多様であるが強力な選択肢を提供する。治療用抗体の開発における我々の知識の増加により、より多くの抗体配列データが蓄積され、本発明を使用して我々の設計を助けるであろう。主要な位置およびこれらの位置に関連するアミノ酸を仮定するのに、前もって仮定は必要無い。この情報は本発明の方法を使用して自動的に明らかにされるため、より多くのデータが蓄積されるとデータベース中のその出現の増加により、良好に規定されるであろう。構造ベースの基準を使用して、他の有用な可能性のある変異体を含むように、変種を再プロフィール化し優先させることができる（図38B−続きを参照）。

3) ヒットライブラリーのコンビナトリアル配列の構造ベースの評価
変種プロフィールは、各位置でおよび好適な修飾していない順序の具体的な変異体で、好適なアミノ酸残基上で有益であるが、これは、膨大な数の組換え体を具体化する。スコア化は、F70とL72が構造ベースのスコア化で好適であるためプロフィール中に維持すべきであることを示すが、その出現頻度は、データベース検索から得られるプロフィールについて使用されるカットオフより低い（図38B−続き）。すなわち、構造ベースのエネルギースコア化は、元々はタンパク質データベースから選択される進化的配列のプロフィール化に基づいて作成されたヒット変種ライブラリーについて、各位置で変種の出現を再プロフィール化するための別の方法を提供する。頻度カットオフを使用するあるフィルター化は、コンピューターによるスクリーニングで評価されるかまたは実験ライブラリーにより直接標的化される必要があるコンビナトリアル配列を減少させることができる。変種プロフィールに適用されるカットオフを用いてさえ、実験によるスクリーニングのために最終配列でスコア化され評価される必要がある多くのコンビナトリアル配列がある（図38Dの下のパネルに示すように）。

ヒットライブラリーおよびヒット変種ライブラリーを形成するそのコンビナトリアル配列をスクリーニングするために、構造ベースのスコア化が適用される。1CZ8または1BJ1中の抗VEGF抗体のV_H FR123の側鎖は、各残基位置の変種ライブラリーからの対応するアミノ酸変種のロタマーにより置換された。ロタマーのコンフォメーションを作成し、骨格依存性ロタマーライブラリーを使用するプログラムSCWRL（登録商標）（バージョン2.1）を使用して最適化した（Bower MJ, Cohen FE, Dunbrack RL (1997) JMB 267, 1268-82）。
スコア化は、抗原VEGFの構造の存在下および非存在下でCONGEN［Bruccoleri and Karplus (1987) Biopolymers 26: 137-168］のAmber94フォースフィールドを使用して、最適ロタマーを検索しエネルギーを100ステップ最小化することにより行った。

図39Aは、VEGF抗原の不存在下（最も左の列）と存在下（真ん中の列）で鋳型構造として1bj1（上のパネル）と1cz8（下のパネル）を使用して、Ｘ軸の1列に比較的密な青いストリップ中のヒトVH生殖細胞系配列を使用した、マウス抗VEGFのVHフレームワークfr123ヒット配列についてのスコア化模式図の分布を、そしてＸ軸の0列に比較的疎な青いストリップ中に、マウスおよびヒト化フレームワークfr123（Prestaら、前述）配列と広く使用されているヒトVH生殖細胞系DP47についてのスコア化模式図の分布を示す。抗原の存在下および不存在下での配列のスコアは相関し（最も右の列）、フレームワーク最適化のための抗体構造は、抗原と最小の接触をするため、フレームワーク最適化のほとんどに充分であることを示す。コンビナトリアル配列ライブラリーのスコア化模式図は、ここには示していない。

図39Bは、ライブラリー中の配列と参照マウスVH FR123配列との差、および参照、マウスVH FR123、報告された（Prestaら、前述、1997、およびChenら、前述、1999）ヒト化VH FR123、上位の200個のデザイナー配列、およびヒトCDR H3生殖細胞系（DP47と呼ぶ広く使用されているVHヒト生殖細胞系）についてのＸ軸の系統発生的距離に基づくランクスコア化を左のパネルに示す。ヒト生殖細胞系の１つの変種プロフィール（AA-PVP）の構造ベースのスクリーニングからの上位200の配列は、系統発生分析（赤のサイクル）においてヒトVH3生殖細胞系ファミリーとクラスターを形成し、一方リードマウス抗体フレームワークは、設計されたものから系統発生的距離が遺伝的に離れている（高出現頻度の生殖細胞系VH配列のみが含まれる時、および1bj1からのヒト化配列（Prestaら、前述）が、比較的低出現率のアミノ酸、例えばF70(F69)とK98(K94)（図42CとDを参照）を含むことにより、わずかに変化するであろう。ｙ軸は、ほとんどの設計フレームワークVH fr123が、マウス、参照およびヒト化フレームワークVH fr123（DP47に近い）に対して良好な構造的適合性を有する。これらは、その使用したデータベースにより部分的に規定されるようにここに記載した本発明の方法のフレームワーク最適化のヒト様特徴を支持する。

4) ヒット変種ライブラリーの変種プロフィールの低下
カットオフ値より低い出現頻度を有するか、および／または構造足場形成との適合性に基づいて配列をスクリーニングすることによりアミノ酸を排除後のヒット変種ライブラリーから得られた、図38Bに示す好適な残基のほとんどを維持しながら、ライブラリー候補のサイズを低下させるために、上記したようにヒット変種ライブラリーからの変種プロフィールを、フィルターにかけた。例えば、ヒットライブラリーのフィルター化で使用されるカットオフ値より低いが、野生型からの変種プロフィール中のいくつかの重要な変異体（例えばF70とL72）が含まれる。これらは、構造ベースのプロフィール化を使用して評価され、ファージ表示において厳しい洗浄条件下の多数回のラウンドのパニングでも持続する（図42）。構造ベースのスコア化からの上位100個の配列を、元々のプロフィールの構造ベースのプロフィール化からのF70とL72とともに使用した。

5) ヒット変種ライブラリーIIに基づく縮重核酸ライブラリーの構築
上記で構築したヒット変種ライブラリーを、図40Aに示す縮重オリゴヌクレオチドを用いて標的化した。上記で構築した縮重核酸ライブラリーをファージ表示系にクローン化し、96ウェルプレート上に被覆された固定化VEGFへの結合に基づき、ファージ表示された抗体（ccFv）を選択した。VH抗VEGFの最終的に設計したヒト化配列を図40Aに示す。抗VEGFのVHの約120アミノ酸残基について、コンピューター設計の結果として34アミノ酸を変化させた：そのうち18個を固定（太字で下線を引いた）し、16個は記載のccFv系を使用してファージ表示ライブラリースクリーニング（「X」と表示）による測定の結果として置いた。従ってスクリーニング中の好適なアミノ酸残基の複数の選択肢を作成するために、16個の位置に対応するDNA配列の縮重を作成した。ライブラリーの理論密度は約2.6×10⁵である。ライブラリーをファージ表示ベクターpABMD12中に入れ、ここで抗VEGFのVHをライブラリーにより置換した。その結果、VLとライブラリーにより置換された種々のVHが対合して、抗VEGFの機能性ccFvを形成するであろう。次にファージ表示ライブラリーを、固定化VEGFタンパク質抗原に対するさらなるパニングのために使用した。

縮重位置の広範囲の分散した分布をカバーするライブラリーを作成するために、ライブラリーを設計した部位で縮重位置を用いて複数の重複縮重DNAオリゴを合成した。アセンブリープロセスは、２つのPCR反応、アセンブリーPCR、および増幅PCRから構成された。アセンブリーオリゴは35〜40量体で設計し、平均約60℃の融解温度で15〜20塩基が重複した。設計生成物の最終的な増幅のために、1対の追加の増幅オリゴプライマー（Amp93とAmp94）を作成した。従って、アセンブリーPCRは以下を含む：等量のアセンブリーオリゴプライマー、最終総濃度8μM、0.8μMのdNTP、1×pfu緩衝液（ストラタジーン（Stratagene））、および2.5単位のpfuターボ（ストラタジーン（Stratagene））。熱サイクルは以下の通り行った：94℃ x 45", 58℃ x 45", 72℃ x 45" を30サイクル、そして最後の伸長を72℃で10分。PCR産物を10倍希釈し、増幅PCRの鋳型として使用し、ここですべての試薬は、増幅プライマーを最終濃度1μMで加えた以外は同じである。熱サイクルは以下の通り行った：94℃ x 45", 60℃ x 45", 72℃ x 45" を30サイクル、そして最後の伸長を72℃で20分。最終生成物（VHライブラリー）を精製し、HIndIIIとStyIで消化し（図26）、最後にベクターpABMD12にサブクローン化して元々のマウスVHを置換した。このライブラリーを使用して、TG1細胞を電気的に形質転換（電気穿孔法？）し、これを次に増幅し、ヘルパーファージKO7（アマシャム（Amersham））でレスキューした後、標準的方法に従って30℃で一晩ライブラリーのファージを産生させた。

6) 抗VEGFのヒト化V_Hのファージ表示ライブラリーのパニング
上記例に記載の構築したライブラリーをスクリーニングするために、精製したホモダイマーVEGFタンパク質（カルビオケム（Calbiochem））をコーティング緩衝液（0.05M NaHCO₃、pH9.6）中の指定濃度で希釈し、マイキシソルブ（Maxisorb）ウェル（ヌンク（Nunc））に4℃で一晩固定化した。次に被覆ウェルを5％ミルク中で37℃で1時間ブロック後、PBSで希釈したファージライブラリーをウェルに適用して37℃で2時間インキュベートした。インキュベーション混合物はまた、非特異結合を最小にするために2％ミルクを日常的に含有した。インキュベーションの最後に、ウェルを洗浄し、次に結合したファージを1.4％トリエチルアミンで溶出した後、TG1細胞を感染させ、次に増幅のためにKO7ヘルパーファージによりレスキューした。次にファージを増幅するために、感染しレスキューしたTG1細胞を30℃で一晩カルベニシリンとカナマイシンの存在下で増殖させ、次にファージライブラリーを採取した。増幅したファージを、次のラウンドのパニングの供給ライブラリーとして使用した。パニング法は、図41に要約した。一方、5回目以降のパニングからの個々のクローンをファージELISA用にランダムにサンプリングし、固定化VEGFへの特異的結合を確認し、5回目〜7回目のパニングから100％の陽性を示した。最後に、2×YT/カルベニシリン（100μg/ml）／カナマイシン（70μg/ml）のプレートで増殖させた単離したクローンを、5回目のパニング（P5）から開始して配列決定のためにサンプリングして、設計に対するヒット位置とヒット配列を規定した。

上記ライブラリーパニングからのヒットの配列解析の要約を図42Aに示し、ここでライブラリーを設計した位置で、ヒト生殖細胞系のファミリーIIIのVHの優勢残基、およびライブラリーパニングからのヒットとともに、アミノ酸残基を比較した。記載のように、ファージ表示ライブラリースクリーニングにより測定のために設計した16個の位置のうち、連続番号で1、11、17、24、70、72、74、77、78、79、98位の特定のアミノ酸残基は、P5（5回目のパニング）から最後（8回目）のパニングまで維持されたかまたは優勢となり、一方残りの位置は、優勢残基のある程度の変動を示した。最後の16個の位置（図42Bで影を付けた）のうちの9個で残基の最終選択は、ヒト免疫グロブリンVHのファミリーIIIの同等の位置の残基と主に一致し、これは、選択された種はファミリーIIIに入る可能性が高いことを示す。

図42Cは、記載のヒト生殖細胞系VH3ファミリー、マウス抗VEGF VHフレームワークFR123、およびヒト化VHフレームワークfr123とともに、抗VEGFのファージ表示ライブラリーのパニングからの上位のヒットVH配列の系統発生的分析を示す。図42Cに示すように、ヒト生殖細胞系ブイHSPファミリーは、予測されたように系統発生的距離でクラスターを形成する。選択された最適化VHフレームワークもまた、ヒト化VH配列（注を参照）とクラスターを形成し、ヒト生殖細胞系VH3ファミリーに系統発生的距離が非常に近く、一方マウスVHフレームワークは場合によりVHフレームワークおよびヒト生殖細胞系から非常に遠い。VHのヒト免疫グロブリンレパートリーに対するヒット配列の系統発生的分析は、これらが最も密接にファミリーIIIに関連することを示唆する。系統発生的分析はまた、最終的なヒット配列が、抗VEGFのマウス起源の配列と比較して、ヒト免疫グロブリンのファミリーIIIにはるかに密接に関連していることを示す（Y. Chenら、1999）。要約するとこの結果は、34個の位置の大多数についてヒト起源のアミノ酸残基がうまく測定されたことを示した。

さらに、5個の位置（すなわち連続番号で6、72、77、79、98位）（図42B）は、選択後に好適なヒト残基では終わらず、連続番号（図42B）で70と74位は、ヒト起源の残基である少数集団を取り上げることができた。少数にとどまっているが、これらの集団は一環して、連続的な厳しい洗浄と複数のパニングを生き延び、これらが実際、抗原に対して高親和性を有することを証明している。これらの位置は、ヒト起源の優勢な残基を選択しなかった。一方、ヒト起源残基の少数集団の存在（連続番号（図42B）で70と74位）は、これらの位置をヒト化できる可能性を示唆する。

これは、ヒト様と、集合構造体もしくは構造平均からの構造鋳型もしくは鋳型との適合性との微妙なバランスに依存して、最適化抗体のヒトまたはヒト様配列を用いて最適化したフレームワークの設計における本発明の方法を支持する。図42Bは、いくつかの充分性状解析された配列D36、D40およびD42および関連配列についての注釈付きの別の系統樹見解で、これらの配列の系統発生的距離を示す。D36は、系統発生的距離で報告されているヒト化配列と同様にヒトであるかまたはほとんど良好ではない。

抗VEGF VHライブラリーパニングからの上位のヒット（最後の2回のパニングからの上位のヒット、7回目と8回目のパニング）の完全長配列を、マウス抗VEGF VH（Y. Chenら、1999）とヒト免疫グロブリンVHのファミリーIIIの優勢配列とともに図42Aに記載する。

7) 高親和性を有する抗VEGFのヒト化VHの選択
図41に要約されるように、高親和性結合体を選択しない洗浄のストリンジェンシーを上昇させるために、洗浄時間の延長、洗浄容量の増加、被覆VEGF濃度の低下、投入ライブラリーファージの減少などの方法を行った。これらのすべての方法は、比較的低親和性の相互作用の解離を促進し、高親和性の相互作用が選択的に残るようにする。次にこのパニングを生き延びるファージのクローンをサンプリングして、配列決定を行う。このパニングからの上位のヒットの抗VEGF VH配列の完全長を図42Aに記載する。記載した我々の本発明の方法を使用して我々は、フレームワーク最適化（図43AとBを参照）により、親もしくは参照抗VEGF抗体より高い結合親和性をccFvフォーマットで有する３つ（D36、D40およびD42）のヒト化フレームワークを発見した（ヒト化抗VEGF抗体については図22AとBを参照（Presta LG, Chen H, O'Counor SJ, Chisholm V, Meng YG, Krummen L, Winkler M, Ferrara N (1997) Cancer Res. 57, 4593-4599）。これらの改良は主に、フレームワークヒト化単独によるオンレートの大きな上昇とオフレートの小さな低下から来る。図43Aは、ccFvファージ表示系（上記図23〜25の説明を参照）を使用して、デザイナーVH最適化ライブラリーから選択される抗VEGF抗体の最適化VHフレームワーク（FR123）の配列を示す。D36、D40およびD42のVH fr123は、元々のマウス抗体VH FR123と、マウス抗体からの同じCDRを有するヒト化配列（Prestaら、前述）とともに。下のパネルの点は、参照と同じアミノ酸を示す（マウスVHフレームワークfr123）。

図43Bは、BIAcoreバイオセンサーを使用してデザイナーライブラリーから選択された５つの抗体、親抗体（X50）および抗VEGF抗体の最適化フレームワーク（D36、D40、D41およびD42）の親和性データを示す（その配列については図43Aと図43Bの注を参照）。測定は、精製抗体がCM5バイオチップ上に固定化された抗原（VEGF）に25℃で結合する時のSPR単位の変化（ｙ軸）対時間（ｘ軸）を測定することにより行われる。オンレートとオフレートの両方を、1：1ラングミュア結合モデルを使用してデータフィッティングにより測定した。２つのヒト化フレームワークD36とD40は、フレームワーク最適化により親／参照抗VEGF抗体配列より結合親和性（ccFvフォーマットで）がほぼ4倍高く（ヒト化抗VEGF抗体については図22AとBを参照（Presta LG, Chen H, O'Counor SJ, Chisholm V, Meng YG, Krummen L, Winkler M, Ferrara N (1997) Cancer Res. 57, 4593-4599）、一方D42は、参照抗体とほぼ同じである。報告されたヒト化抗VEGF抗体（図22AとB）は、その比較したマウス抗体より約2倍弱いため、これらの２つのヒト化抗体は、ヒト化により対応するマウス抗体より約2倍高い結合親和性を有するはずである。

図44は、最適化VHフレームワークの安定性の上昇を示す（日36とD40）。ｙ軸は、親X50と最適化フレームワーク（D36とD40）について精製抗体を4、37および42℃で17時間インキュベートした後の、BIAcoreを使用して25℃で固定化VEGF抗原への結合が活性に維持された抗体のパーセントを示す。これは、最適化フレームワークが、報告（Prestaら、前述、1997）されたヒト化VHフレームワークより高い安定性を有することを示す。

図45は、最適化VHフレームワークの改良された発現を示す。最適化フレームワーク（D36、D40およびD42）はまた、SDS-PAGE／クマシーブルー染色に検出される発現収率で示されるように、親／野生型抗体（X50）に対して、改良された発現を示す。

本発明の方法を使用して設計された抗体ライブラリーはバクテリオファージ系のみでなく、他の生物（特に限定されないが、酵母、昆虫、植物および哺乳動物細胞）中でも発現されスクリーニングされることを注意されたい。設計された抗体（抗原結合断片および他の抗体型を含む）は、種々の組換えDNA技術または他の技術により産生される。例えば設計抗体をコードするDNAセグメントは発現ベクター中にクローン化され、公知の方法（これは細胞宿主の種類により異なり、特に限定されないが塩化カルシウムトランスフェクション、電気穿孔法、リポフェクション、およびフレームシフトトランスフェクションがある）により宿主細胞に移される。抗体は、当該分野の標準的方法（特に限定されないが、硫酸アンモニウム沈殿、親和性カラム、カラムクロマトグラフィー、ゲル電気泳動などがある）により精製される。添付の特許請求の範囲により規定されるように、本発明の精神と範囲を逸脱することなく、種々の修飾が当業者には可能である。

本発明の方法を使用して設計される抗体は、種々の疾患［特に限定されないが、癌、自己免疫疾患（例えば、多発性硬化症、リウマチ様関節炎、全身性エリテマトーデス、1型糖尿病、および重症筋無力症）、移植片対宿主反応病、心血管疾患、フレームシフト感染（例えば、HIV、肝炎ウイルス、および単純ヘルペスウイルス）、細菌感染、アレルギー、II型糖尿病、血液疾患（例えば、貧血）がある］の診断または治療に使用される。
抗体はまた、診断用もしくは治療用残基と結合した結合体として、または化学療法剤または生物製剤と組合せて使用することもできる。抗体はまた、多様な投与経路を介する投与用に調製することもできる。例えば、抗体は、経口、局所的、非経口、腹腔内、静脈内、動脈内、経皮的、舌下、筋肉内、直腸内、頬内、鼻内、吸入、膣内、眼内、局所的供給（例えばカテーテルまたはステントにより）、皮下、脂肪組織内、関節内、またはくも膜下に、投与または同時投与してもよい。

in silicoでタンパク質ライブラリーを設計するための本発明の方法は、種々の形の任意の計算システム（特に限定されないが、スーパーコンピューター、パーソナルコンピューター、パーソナルデジタルアシスタント（PDA）、ネットワークコンピューター、分布コンピューター、またはインターネットもしくは他のマイクロプロセッサーシステムがある）で行われる。本明細書に記載の方法とシステムは、ランダムアクセスメモリー（RAM）のような記憶素子以外の種々のタイプの実行可能な媒体で実行することができる。他のタイプの実行可能な媒体には、特に限定されないが、コンピューターで読める保存媒体があり、これは任意の記憶デバイス、コンパクトディスク、ジップディスクまたはフロッピーディスクでもよい。

上記で引用した特許、特許出願および刊行物は、参照することによりその全体が本明細書に組み込まれる。

所望の機能を有するタンパク質について選択するために本発明で使用することができる方法の４つの実施態様を例示する。図1A-D中のリードは、リード配列であるか、または複数の構造に基づく整列からの配列プロフィールである。ヒットライブラリー、ヒット変種ライブラリーＩとIIは、定義の部分で定義される。所望の機能を有するタンパク質について選択するために本発明で使用することができる方法の４つの実施態様を例示する。図1A-D中のリードは、リード配列であるか、または複数の構造に基づく整列からの配列プロフィールである。ヒットライブラリー、ヒット変種ライブラリーＩとIIは、定義の部分で定義される。所望の機能を有するタンパク質について選択するために本発明で使用することができる方法の４つの実施態様を例示する。図1A-D中のリードは、リード配列であるか、または複数の構造に基づく整列からの配列プロフィールである。ヒットライブラリー、ヒット変種ライブラリーＩとIIは、定義の部分で定義される。所望の機能を有するタンパク質について選択するために本発明で使用することができる方法の４つの実施態様を例示する。図1A-D中のリードは、リード配列であるか、または複数の構造に基づく整列からの配列プロフィールである。ヒットライブラリー、ヒット変種ライブラリーＩとIIは、定義の部分で定義される。所望の機能を有するタンパク質について選択するために本発明で使用することができる方法の４つの可能な実施態様を例示する。ここでリードは、構造体または構造モデルまたは構造集合体またはプロフィール（多重重なり構造体）を意味し、次に、リード構造体または構造集合体からの対応する配列または配列プロフィールは、構造ベースのスクリーニングに基づきヒット配列ライブラリーについてすべての可能な配列またはランダム組合せをスクリーニングするのに使用することができる。生じるヒット変種ライブラリーは、直接実験によるスクリーニングについて使用されるか、または対応するリード配列もしくは配列プロフィールから得られる配列ヒットプロフィールと比較することができる（図2A〜Cを参照）。構造鋳型は、実験的測定および／またはモデル化からの構造体、構造集合体（２つより大きい構造体）を意味する。所望の機能を有するタンパク質について選択するために本発明で使用することができる方法の４つの可能な実施態様を例示する。ここでリードは、構造体または構造モデルまたは構造集合体またはプロフィール（多重重なり構造体）を意味し、次に、リード構造体または構造集合体からの対応する配列または配列プロフィールは、構造ベースのスクリーニングに基づきヒット配列ライブラリーについてすべての可能な配列またはランダム組合せをスクリーニングするのに使用することができる。生じるヒット変種ライブラリーは、直接実験によるスクリーニングについて使用されるか、または対応するリード配列もしくは配列プロフィールから得られる配列ヒットプロフィールと比較することができる（図2A〜Cを参照）。構造鋳型は、実験的測定および／またはモデル化からの構造体、構造集合体（２つより大きい構造体）を意味する。所望の機能を有するタンパク質について選択するために本発明で使用することができる方法の４つの可能な実施態様を例示する。ここでリードは、構造体または構造モデルまたは構造集合体またはプロフィール（多重重なり構造体）を意味し、次に、リード構造体または構造集合体からの対応する配列または配列プロフィールは、構造ベースのスクリーニングに基づきヒット配列ライブラリーについてすべての可能な配列またはランダム組合せをスクリーニングするのに使用することができる。生じるヒット変種ライブラリーは、直接実験によるスクリーニングについて使用されるか、または対応するリード配列もしくは配列プロフィールから得られる配列ヒットプロフィールと比較することができる（図2A〜Cを参照）。構造鋳型は、実験的測定および／またはモデル化からの構造体、構造集合体（２つより大きい構造体）を意味する。所望の機能を有するタンパク質について選択するために本発明で使用することができる方法の４つの可能な実施態様を例示する。ここでリードは、構造体または構造モデルまたは構造集合体またはプロフィール（多重重なり構造体）を意味し、次に、リード構造体または構造集合体からの対応する配列または配列プロフィールは、構造ベースのスクリーニングに基づきヒット配列ライブラリーについてすべての可能な配列またはランダム組合せをスクリーニングするのに使用することができる。生じるヒット変種ライブラリーは、直接実験によるスクリーニングについて使用されるか、または対応するリード配列もしくは配列プロフィールから得られる配列ヒットプロフィールと比較することができる（図2A〜Cを参照）。構造鋳型は、実験的測定および／またはモデル化からの構造体、構造集合体（２つより大きい構造体）を意味する。本発明により提供されるin silicoタンパク質進化系の模式図である。配列、構造および機能空間を介して、リード構造から／リード配列プロフィールまたはリード配列／リード配列プロフィールから候補配列への移動可能な経路を例示するために、配列、構造および機能空間の三角関係が示される。配列空間において、リード配列またはプロフィールは、進化的に関連する配列の特異的データベースを検索するのに使用される。リード構造の構造整列に基づく配列プロフィールは、リード配列の遠い相同体を検索するのに使用することができる。ヒットライブラリーの変種プロフィールは、アミノ酸配列の位置頻度とエントロピーを説明する。進化的に好適な変種プロフィールを与えるために、変種プロフィールはフィルターにかけらされ、再度プロフィール化される。この操作は、関連する配列データベース上で種々の検索法を用いて繰り返される。構造空間において、in silico変種プロフィールは、ランダムまたは進化的にプールされた配列ライブラリーの構造ベースのスクリーニングを使用して作成される。変種プロフィールはフィルターにかけられ改良されて、構造的に好適な変種プロフィールを与える。この方法は、より優れたスコア化関数と代表的構造集合体を用いて、繰り返され改良される。進化にまたは構造に基づくアプローチを使用して作成される変種プロフィールを、逐次（2B：配列から構造から機能空間へ；2C：構造から配列から機能空間へ）に、または平行（配列特異的から機能空間へ、および構造空間から機能空間へ）して使用して、アミノ酸の全体的変種プロフィールまたはライブラリーを与えることができる。生じるアミノ酸の変種ライブラリーは、好適なまたは最適化されたコドンを使用して核酸ライブラリー中に逆翻訳される。この操作を異なるフィルター化および分割法を用いて繰り返して、ライブラリーサイズを実験的に管理可能な範囲に調整することができる。機能空間中の機能性変異体について選択するために、合成された核酸ライブラリーは、形質転換によりベクター中に導入され、例えばファージ粒子上に機能的に発現もしくは表示される。固定化抗原に対する選択と濃縮のラウンドが行われる。所望の候補が実験的に選択されるまで、方法の全体または一部を繰り返し、改良することができる。抗体ライブラリー設計のために本発明で提供される方法の実施態様の模式図。逐次的方法は、まず「配列」から「構造」へ、そして「機能」空間へ移動する。設計はリード配列からまたは配列プロフィールから開始する（構造ベースの整列からの多重整列配列）。配列データベースを検索することによりヒットライブラリーが作成される。あるカットオフでヒットライブラリーにより得られるヒットプロフィールは、ヒット変種ライブラリーを与える。ヒットライブラリーまたはヒット変種ライブラリーは、鋳型構造としてリード構造または構造集合体を使用して、コンピューターでスクリーニングされる。得られる配列ライブラリーは、鋳型構造または構造集合体との適合性に基づきランク付けされる。リード配列より優れたまたは同等のスコアを有する配列が選択され、プロフィール化されて核酸（NA）ライブラリーが作成される。in silicoのNAライブラリーサイズが評価され、ライブラリーサイズが許容されるなら、オリゴヌクレオチド合成に移る。そうでない場合は、ヒット変種ライブラリーを小さいセグメントに再分割し、小さいNAライブラリーが作成される。機能空間では、核酸ライブラリーは実験的にスクリーニングされ、陽性の配列がライブラリー改良のために計算サイクルに戻される。強い陽性クローンを、さらなる評価と治療法開発候補に移される。実験によるスクリーニングでヒットするものが無い場合は、標的システムのためにリードまたはその新しいリードプロフィールが選択され、操作が繰り返される。抗体ライブラリー設計のために本発明で提供される方法の実施態様の模式図。代替逐次的方法は、まず「構造」から「配列」へ、そして「機能」空間へ移動する。設計はリード構造からまたは構造集合体から開始する。標的位置でのランダム変異の組合せが、構造鋳型とのその適合性についてコンピューターでスクリーニングされる。リード配列より優れたまたは同等のスコアを有する配列の変種プロフィールが作成される。この変種プロフィールは、配列データベースを検索することにより与えられるものと比較および／または組合わされる。配列と構造空間に示すコンセンサス頻度に基づいて新規変異体が含有されるかまたは排除されて、核酸ライブラリーが作成される。操作の残りの部分は、図2Bに記載のものと同様である。このアプローチは、進化的配列情報に依存することなく、構造ベースのコンピュータースクリーニングにより新規変異体を見つけることの重要性を強調する。データベースの検索からの配列プロフィールは、スコア化関数の正確性ならびに使用される試験アルゴリズムに依存するコンピュータースクリーニングから得られる変種プロフィールを評価することを助けるであろう。構造整列に基づく単一のリードまたはリードプロフィールを使用する、データベース検索によるin silicoのヒットライブラリー構築法を例示する。この検索結果は分類され、重複配列（バックグランドが異なっていても）が除去されて、ヒットライブラリー中のユニークな配列のリストが作成される。リード配列／配列プロフィール、配列検索法、および種々のデータベースの影響が、図4〜6に示される。アミノ酸の進化的位置選択を分析するのに使用されるヒットライブラリーからの変種プロフィールに基づく、ヒット変種ライブラリーＩの構築法を例示する。各位置のアミノ酸変種の頻度、変動エントロピー、およびエネルギースコアに基づいてフィルター化することにより、改良された変種プロフィールが得られる。改良された変種プロフィールから、ヒット変種ライブラリーIIがコンビナトリアル的に算出される。ヒット変種ライブラリーIIの構造的にスクリーニングされたものを作成するための、ヒット変種ライブラリーＩまたはIIの構造的評価と選択のための方法を例示する。リード構造鋳型に適用されるヒット変種ライブラリーＩまたはIIをスコア化およびランク付けするために、コンピューター選択は単純かつカスタムエネルギー関数を使用する。各配列について、骨格依存性ロタマーライブラリーを使用して側鎖が作成され、側鎖と骨格は鋳型バックグランドに対してエネルギーが最小にされて局所的ひずみを緩和する。鋳型構造中のヒット変種ライブラリーＩまたはIIの一致が、単純かつカスタムエネルギー関数を使用してスコア化されランク付けされる。核酸（NA）ライブラリーへの翻訳のための新しいヒット変種ライブラリーIIを構築するのに、「最適」配列のいくつかの集合が選択される。選択基準には、配列集合、構造的考慮または機能的考慮を含む。実験的に管理可能な限界内で核酸ライブラリーを作成するために、アミノ酸配列の集合が再プロフィール化される（図6）。

ヒット変種ライブラリーIIから逆翻訳により核酸（NA）ライブラリーを構築するための方法を例示する。アミノ酸の核酸への逆翻訳は、好適なコドン使用を最適化しながら、核酸ライブラリーのサイズを実験的に管理できる限界内に維持するためである。核酸ライブラリーのサイズが計算され、実験限界内に維持されるか、またはヒット変種プロフィールは、変種の数を低下させることにより修飾されるかより短いセグメント中に分割される。分割は、構造が相関したセグメントまたは一連の重複した連続的相関セグメントを使用して行われる。一致背景（fitness landscape）のいくつかの領域でライブラリーを試験する方策の概略である。より大きな機能空間を試験するようにコンビナトリアルアミノ酸またはその縮重核酸ライブラリーを設計することができるなら、選択されたペプチド配列の一致背景は、より大きな一致背景をカバーするように拡張することができる。設計されたライブラリーからの戦略的試験は、重複と多様性の拡張につながり、これは機能空間の一致背景の大きな進化的ジャンプを含むことができる。抗体操作のための典型的なライブラリープラスミドのモジュラー要素を示す。フレームワークとCDR配列のライブラリーを、それぞれまたはコンビナトリアル的に繰り返して設計される。FR＝フレームワーク領域。CDR＝相補性決定領域。RE＝制限酵素部位。図9Aは、V_H CDR中の親VEGF抗体と成熟抗VEGF抗体との配列比較である。「c」は、Ｘ線構造中で抗原−抗体複合体の原子が4.5Å以内で接触することを示す。太字は、V_H CDR（CDR1とCDR3）中の親抗抗体と成熟抗抗体の間のアミノ酸の差を強調する。V_H CDRの番号付けは、Kabatの規則と逐次的スキームに従う（100、100aなどより100、101）。図9Bは、隣接領域を有するV_H CDR3中の親抗VEGF抗体と成熟抗VEGF抗体との配列比較である。親抗体からの配列（配列番号5）は、データベースの検索に使用されるリード配列である。V_H CDRの番号付けは、Kabatとここでも使用される逐次的スキームである。親抗VEGF抗体のV_H CDR3のリード配列に対するその配列同一性（％で）に対して、ヒットライブラリーの頻度の分布を示す。リード配列は図9Bに示し、プロフィールHMM（HAMMER2.1.1）を使用してKabatデータベースを検索した（Johnson, GとWu, TT（2001）Nucleic Acids Research 29:205-206）。図10Aのデータベース検索から得られるヒットライブラリーの系統発生的多様性を示すために、図10Aに示すヒットライブラリーの配列の系統樹を例示する。親抗VEGF抗体のV_H CDR3のリード配列に基づいて作成したヒットライブラリーの107の配列の変種プロフィールを示す。上の部分は、リード配列の各位置の20個のアミノ酸のアミノ酸頻度を記載する表を示す。下の変種プロフィールは、アミノ酸位置の多様性を示す。アミノ酸多様性（図の左下に示す）の選択的制御の無いコンビナトリアルライブラリーの完全な記載には、10¹⁹のオーダーのライブラリーサイズが必要であろう。図の右下部分は、カットオフ頻度10を使用して得られたフィルターをかけた変種プロフィールを示す。ヒットリストの107個のメンバーのうちで10以下で存在するすべての位置アミノ酸は、フィルターをかけられる。このフィルターにかけた変種プロフィールは、さらにコンピューターでスクリーニングして、抗体構造のみが使用される場合は構造適合性のランキングオーダーを反映させ、または抗体と抗原との複合体構造が使用される場合は、抗原との結合親和性を反映させるようにすることができる。変種プロフィールは、図9Aに示すように、抗原と抗体との接触部位との相関を示さない。 CONGENで実施したAmber94フォースフィールドの総エネルギーのスコア化関数を使用して、VEGF抗原の非存在下(A)と存在下(B)での、それぞれ親（1bj1）抗体構造と成熟（1cz8）抗体構造中の抗VEGF抗体変種ライブラリーのスコアの典型的なプロットを示す。成熟（M）および親（P）配列のスコアは、矢印で示す。成熟配列のスコアは、両方の鋳型構造中で抗原の非存在下および存在下で、親配列より良好である。図12cは、抗原の存在下および非存在下での変種ライブラリーのスコアの相関を示す。ここで使用される単純なスコア化関数はまた、成熟抗体（lcz8）の鋳型構造を使用してヒットライブラリー（図10と11）の改良されたスコア化関数と全体に相関したが、相関プロット中の一部の分散は、相関を改良するために単純なスコア化関数に、溶媒和などを含むいくつかの項を追加すべきであることを示唆する。図13Aは、本発明の方法が親配列または成熟配列とは異なる多様な機能的配列を選択できることを証明するために、実験によるスクリーニングのための抗VEGFV_H CDR3ヒット変種ライブラリーのコンピューターによるスクリーニングからの上位10個の配列を選択することができることを示す。縮重核酸中のアミノ酸変種プロフィールと対応する変種ライブラリーを記載する。図の右上のエネルギー模式図は、コンピューターによるスクリーニングから選択された10個の配列の左から右へのエネルギー分布、その変種アミノ酸コンビナトリアルライブラリー、核酸コンビナトリアルライブラリー、およびin vitroの実験によるスクリーニングから選択された陽性クローンを示す。エネルギー模式図に示す配列プールのそれぞれに対応する配列ライブラリーは、矢印で示す。 V_H CDR1とCDR2の変種ライブラリーのコンピューターによるスクリーニングから選択された10個の配列、そのアミノ酸変種プロフィール、および抗VEGF抗体のV_H CDR1とCDR2ライブラリーの縮重核酸中の対応する変種ライブラリーを示す。 V_H CDR1とCDR2の変種ライブラリーのコンピューターによるスクリーニングから選択された10個の配列、そのアミノ酸変種プロフィール、および抗VEGF抗体のV_H CDR1とCDR2ライブラリーの縮重核酸中の対応する変種ライブラリーを示す。設計された核酸ライブラリーによりコードされるV_H CDR3（図13A）を用いて、機能的抗VEGF ccFv抗体のラウンド1とラウンド3の選択で同定されたELISA陽性クローンのUV読み値を示す。下の数字は、96ウェル（8×12）ELISAプレート中の列番号を示す。影の異なるバーは、異なる列を示す。図13Aに示す核酸ライブラリーのファージ表示を介して、ラウンド1とラウンド3の選択からの陽性クローンのV_H CDR3配列を示す。親および成熟抗VEGF抗体のV_H CDR3（図9AとB）とは異なる多くの多様な配列が、いくつかの位置で大きな変動で選択されることが明らかである。スクリーニングした配列の多様性を示す陽性クローンの系統樹を例示する。図14AとBに示すV_H CDR3からの選択された陽性クローンの配列同一性は、Ｎ末端CAKとＣ末端WG残基（図9Bを参照）を含めて親V_H CDR3配列に対して57〜73％の範囲であった。第１のラウンドと第３のラウンドのスクリーニングされた配列の起源を3群に分類したものを示すパイチャートである：設計されたアミノ酸配列、設計された配列からのコンビナトリアルアミノ酸配列、および合成された縮重核酸ライブラリーによりコードされる新規コンビナトリアルアミノ酸配列。A：３つのライブラリーの陽性クローンから実験的に選択された配列の分布を有する、in vitroでの第１ラウンドのスクリーニングからのV_H CDR3クローン。 B：３つのライブラリーの陽性クローンから実験的に選択された配列の分布を有する、in vitroでの第３ラウンドのスクリーニングからのV_H CDR3クローン。配列分析のために各ラウンドからほんのわずかの陽性クローンのみしか選択されないため、図は、設計された配列からの選択された配列、そのコンビナトリアルアミノ酸、および核酸ライブラリーの大まかなパーセントを示すためにのみ使用される。図13A〜Cに示す縮重核酸のV_H CDR1、CDR2、およびCDR3ライブラリーからの実験的に選択されたアミノ酸配列を記載する表である。図16Bは、それぞれ抗VEGF V_H CDR1、2および3の対応する親配列に対する、V_H CDR1、CDR2およびCDR3ライブラリーからの選択された配列の配列同一性の分布を示す。対応する親配列とは異なる機能的な多様な配列を選択できることが明らかである。

４つの異なるライブラリー（設計されたアミノ酸配列、設計された配列のアミノ酸変種のコンビナトリアルライブラリー、およびユニークなアミノ酸配列をコードする縮重核酸ライブラリーと完全な縮重核酸ライブラリー）の間の図による関係と、Ｘで示す実験的に選択された陽性クローンの分布を示す。最も内側（斜線を付けた）円は、例えばヒット変種ライブラリーのエネルギースコアに基づいて選択した設計されたアミノ酸配列ライブラリーを示す。影を付けた円は、ヒット変種ライブラリーのコンピューターによるスクリーニングから選択された配列のコンビナトリアルアミノ酸ライブラリーを示す。第３の（斜線を付けた）円は、ユニークなコンビナトリアルアミノ酸ライブラリーをコードするコンビナトリアルアミノ酸ライブラリーである。最も外側の円は、アミノ酸ライブラリーの逆翻訳から得られたすべてのアミノ酸配列の縮重核酸ライブラリーを示す。最も外側の円対第３の（斜線を付けた）円の相対的サイズは、コドン使用のような他の要因を考慮して、アミノ酸から核酸配列への逆翻訳法の効率に依存する。「Ｘ」は、実験的に選択された配列を示す。例えば、第３のラウンドからの抗VEGF V_H CDR3ライブラリーをここに示す（図17B中の表を参照）。異なるライブラリー中の分布は、選択条件、ライブラリー設計の有効性、選択されたクローン対ライブラリーの相対的サイズ、または配列決定したクローンの数などに依存する。４つのライブラリー（図17A）の間の関係と、抗VEGF V_H CDR1、2、および3ライブラリーの陽性クローンの実験的に選択された配列の分布とを示す表を示す。「AA_Seq/Comb」欄は、コンピューターによるスクリーニングで選択されたアミノ酸配列の数（設計されたライブラリーＩ）と、選択された配列の組換え配列の数（変種ライブラリーII）とを示す。「NN_seqs/peptide seq」欄は、縮重核酸ライブラリーの核酸配列、および縮重核酸ライブラリーによりコードされるユニークなアミノ酸配列の数を示す。「exp_seq」欄は、陽性クローンからの実験的に選択されたユニークな配列の数を示す。「選択された配列の分布」欄は、設計されたアミノ酸配列、アミノ酸変種のそのコンビナトリアルライブラリー、およびユニークなペプチド配列をコードする縮重核酸のライブラリーの数を示す。左から右へ、操作の種々の段階での抗VEGF V_H CDR3の配列一致スコアの進化を示す：リード配列、ヒットライブラリー、ヒット変種ライブラリーＩ、コンピューターによるスクリーニングから選択された配列（影を付けたバンド）、選択された配列のコンビナトリアルライブラリー（ヒット変種ライブラリーII）、コンビナトリアルアミノ酸配列をコードするコンビナトリアル核酸ライブラリー、および実験的に選択された配列。リード配列は、配列のデータベースから進化的ヒットライブラリーを同定するのに使用された。ヒットライブラリーの多様性に基づいて、in silicoコンビナトリアルライブラリーを設計した。リードより良いスコアを有するコンピューターによりスクリーニングした配列のサブセットを、コンビナトリアルアミノ酸ライブラリーを作成するのに使用した。多様性を拡張するために縮重核酸合成方策を使用して、コンビナトリアルアミノ酸ライブラリーをコードする縮重核酸ライブラリーを作成した。ライブラリーの実験によるスクリーニングにより、改良された機能を有する可能性のある配列が得られた。構造ベースの多重配列整列から作成されたリードプロフィールを示す。リード配列の構造モチーフは、ある範囲のカットオフ内で同様の構造についてタンパク質構造データベース（PDBデータバンク）を検索するのに使用される。V_H CDR3のCα原子を使用して、５つの構造が重ねられる。各構造とV_H CDR3構造モチーフ（青く着色）の間の自乗平均の平方根（RMSD）は約2Åである。対応する多重配列整列を、そのPDB IDおよび対応する色とともに、その右に示す。親抗VEGF抗体のV_H CDR3のリード配列プロフィールに基づいて作成されるヒットライブラリーの251個のユニークな配列の変種プロフィールを示す。上の部分は、リード配列の各位置での20個のアミノ酸のアミノ酸頻度を記載する表を示す。図の下の部分は、頻度の5％カットオフまたはこの場合12を使用して得られた、フィルターにかけた変種プロフィールを示す。ヒットリストの251個のメンバーのうちで12回またはそれ以下で存在するすべての位置固体アミノ酸を除去する。このフィルターにかけた変種プロフィールは、構造集合体を使用してさらにコンピューターによりスクリーニングすることができる。親V_H CDR3配列（図9B）に対するヒットライブラリーからの配列の分布を示す。円は、36％までの配列同一性は、HMM検索の単一の親配列を使用して同定することができることを示す。三角は、〜20％までのさらに低い配列同一性は、構造ベースの多重配列整列からのリード配列プロフィールを使用して、見いだすことができることを示す。ここで使用される配列検索法は、リード配列に対して遠い相同性（20％の低さ）の多様なヒットを見いだすことができる。配列、構造および機能空間の共通部分内にある焦点を当てたライブラリーを作成する一般的方策を示す。図19A〜Cに示すように、ヒット配列の多様性は、構造ベースの多重整列を使用して増強される。配列と構造空間の両方で多様性を拡張することができ、すべての３つの空間の共通部分で良好なヒットを同定することができる。種々の抗原結合単位（Abu）配向を示す模式図である。本発明の方法で使用される２つの新規表示システムに注目されたい：ccFvシステム、GR1とGR2の間にジスルフィド結合を有するヘテロダイマー性のコイルドコイル安定化Fv、およびGMCTシステム、アダプター介在scFv表示システム。対象ccFv Abuを構築するのに使用されたGABAb 受容体1と2のヌクレオチドおよびアミノ酸配列を示す。コイルドコイル配列は、ヒトGABA_b-R1とGABA_b-R2受容体から得られる。GABA_b 受容体からのコーディングアミノ酸配列を太字で示す。柔軟性のあるGlyGlyGlyGlyスペーサーを、R1とR2ヘテロダイマー化配列のアミノ末端に付加して、機能的Fvヘテロダイマー形成を促進させた。ヘテロダイマーをさらに安定化するために、我々は、ValGlyGlyGlyスペーサーを導入して、ジスルフィド結合によりヘテロダイマーコイルドコイル対を固定させた。GGGGスペーサーのＮ末端の追加のSerArgコード配列は、V_HとV_L断片のカルボキシ末端にそれぞれGR1とGR2ドメインの融合のためのXbaI部位またはXhoI部位を提供する。抗VEGF ccFv抗体AM2のそれぞれヌクレオチド配列とアミノ酸配列を示す。抗VEGF ccFv抗体AM2のそれぞれヌクレオチド配列とアミノ酸配列を示す。ファジミドベクターpABMD12の模式図である。 pABMD12ベクターの配列を示す。固定化VEGF抗原へのファージ表示AM2 ccFvとscFvの結合能力の比較を示す。結果は、ファージ粒子上でccFvを組み立て表示することができることを示す。モデルライブラリーパニングからのAM2-ccFvを使用したELISAの結果を示す。結果は、モデルライブラリーのパニングにおいてAM2-ccFv抗体を表示するファージの濃縮を示す。試験配列はモデルライブラリーから選択することができることを示す1/10⁷ モデルライブラリーパニングからのPCR結果を示す。ライブラリーパニングからのファージを使用したELISAの骨格を示す。結果は、V_H CDR1、CDR2ライブラリーからVEGF結合ファージが選択されたことを示す（V_H CDR3について図14Aを参照）。（図16Aと同じ）設計された抗VEGF V_H CDR1、CDR2、およびCDR3ライブラリーをコードする実験的に選択されたクローンのアミノ酸配列を記載する表である。複合抗VEGF V_H CDR3ライブラリーの配列ライブラリーを示す。ライブラリーサイズは大きすぎて、１つまたは数個の縮重核酸ライブラリーによりカバーできないため、変種プロフィールは、図28Aに示す変種プロフィールを有する３つのセグメントに分解される。セグメントは、図28Aの右側に示す8Å内のCα原子の接触地図に基づいて分解される。図28Aはまた、抗VEGF V_H CDR3のリボン模式図ならびに8Å以内のCα原子の接触距離を示す。このアプローチは、構造のトポロジーに基づいて大きな変種プロフィールを小さいセグメントに分解する一般的方法を提供する。１次配列中に離れた共変体（例えば、ループ内で近接したＮ末端残基とＣ末端残基）を捕捉するための配列のセグメント化に、トポロジー的特徴からの構造の制約のみが必要なため、低分解構造または構造モデルがこの目的に役立つ。図28Bは、結合した変種（1〜3）を含有し得るＮ末端とＣ末端をカバーする。ライブラリーと最後に合成された縮重オリゴヌクレオチドのコンビナトリアルサイズとともに、アミノ酸ライブラリーと核酸ライブラリーの両方の変種プロフィールが記載される。図28Cはセグメント(4)を含有する。すべての３つのセグメントは、10⁶未満のサイズの核酸ライブラリーによりカバーされる：図28B中の(1〜3)は３つの縮重核酸ライブラリーにより標的とされ、図28C〜D中の（4)と(5)は、別の縮重核酸ライブラリーにより標的とされる。図28Dは別のセグメント(5)を含有する。すべての３つのセグメントは、10⁶未満のサイズの核酸ライブラリーによりカバーされる：図28B中の(1〜3)は３つの縮重核酸ライブラリーにより標的とされ、図28C〜D中の（4)と(5)は、別の縮重核酸ライブラリーにより標的とされる。 ccFvライブラリーL14をパニングするために、ならびに各パニングからの濃縮因子のために、使用される操作と条件を要約する。L14ライブラリーは、図28B〜Dに示すすべての５つの縮重オリゴヌクレオチドを一緒にプールして、図28A〜D中で構築される。 ccFv表示プラットフォームを使用してライブラリーL14の5と7をパニングすることにより選択されるV_H CDR3変種のアミノ酸配列を示す。5のパニング後に、すべての変種が101位に位置することを注目されたい。２つの変種のみ（S101RとS101T）が、ラウンド7後に選択される。 V_H CDR3についてのライブラリーL14のパニングからのHR(H97, S010R)ファージの濃縮を示す。ラウンド0、5、および7でのHRと親抗体WT（図9Bも参照）の濃縮を強調してある。１本鎖抗体ライブラリーのための新規コイルドコイルドメイン相互作用介在表示（CDIM）アダプター指令表示システムの簡単な模式図を示す。大腸菌（E. coli）中の発現ベクターpGDH1単独の形質転換感染は、細菌周辺腔中のGR1と融合した可溶性タンパク質の発現と産生を可能にする。GR2と融合した遺伝子操作されたコートタンパク質および他のファージタンパク質を発現するUltraHelperファージベクターによる同じ細菌の重感染は、細菌周辺腔中のファージ粒子の合成後に、繊維性ファージの表面上の抗体断片（または他のタンパク質）の表示を可能にする。図33A は、GMCT-UltraHelperファージプラスミドの地図を示す。この構築体は、KO7kpnファージベクター中のアダプターGR2とmycタンパク質に融合した遺伝子操作された遺伝子IIIの追加のコピーをコードするヌクレオチド配列と、WT遺伝子III配列に隣接するリボゾーム結合配列OmpAリーダー配列とを含有する。図33Bは、ヌクレオチドとアミノ酸配列レベルでGMCT-UltraHelperファージを産生するために、KO7Kpnの遺伝子的に修飾した領域を示す。 pABMX14のタンパク質発現ベクター地図（A）と完全なヌクレオチド配列（B）を示し、これは、抗生物質選択のためのアンピシリン耐性遺伝子（Amp）、プラスミド複製開始点（ColE1 ori）、f1ファージ複製開始点（f1 ori）、lacプロモーター／lacO1制御タンパク質発現カセット（plac-RBS-pelB-GR1-DH）、および制限エンドヌクレアーゼ部位を含む。NcoI／XbaIまたはNcoI／NotIまたはXbaI／NotI制限部位は、目的のタンパク質をコードするヌクレオチド配列を挿入するのに使用することができる。 pABMX14のタンパク質発現ベクター地図（A）と完全なヌクレオチド配列（B）を示し、これは、抗生物質選択のためのアンピシリン耐性遺伝子（Amp）、プラスミド複製開始点（ColE1 ori）、f1ファージ複製開始点（f1 ori）、lacプロモーター／lacO1制御タンパク質発現カセット（plac-RBS-pelB-GR1-DH）、および制限エンドヌクレアーゼ部位を含む。NcoI／XbaIまたはNcoI／NotIまたはXbaI／NotI制限部位は、目的のタンパク質をコードするヌクレオチド配列を挿入するのに使用することができる。図35Aは、各ラウンドの濃縮因子（A）とともに、scFvライブラリーL17をパニングするのに使用される操作と条件とを要約する。V_H CDR3領域中のL17ライブラリーの配列は、L14と全く同じである（図28A〜Dを参照）。図35Bは、パニングプロセスのフローチャートを示す。アダプター介在ファージ表示系（phage display system）を使用して、それぞれ２つの平行工程4と5からのオフレートパニングによりライブラリーL17から選択されたV_H CDR3変種のアミノ酸配列を示す。オフレートパニング4では、配列は97および／または101位に位置する変種（Kabat命名法では100a）を用いて選択された。オフレートパニング5では、配列は、101（100a）および／または102（100b）および／または103（100c）に位置する変種を用いて選択された。成熟配列中の２つの重要な変異体YS(H97Y-S101)とHT(H97-101TまたはH97-S100aT)は、パニング4とパニング5から別々に選択された。これらの２つの位置での変種の組合せは、V_H CDR3中の成熟配列H97YとS100aTを与えるかも知れない（図9B）。しかしこの組合せは、分解したセグメント中では意識的に避けられる（図28A〜Dを参照）。HR(H97-S100aR)は再度、成熟配列（図9B）であるHT(H97-S100aT)より高い頻度（3/1）で証明され、これは図30のパニング7の同様の観察結果（7/3）と一致する。 BIAcoreバイオセンサーを使用してデザイナーライブラリーからのccFv表示フォーマットを介して選択された抗VEGF抗体のVH CDR3(FR123)を含有する４つの抗体の親和性データを示す。精製された抗体が、25℃でCM5バイオチップ上に固定化されたその抗原（VEGF）に結合する時、SPR単位（ｙ軸）対時間（ｘ軸）の変化を測定することにより、測定が行われる。オンレートとオフレートの変化の両方を、1:1ラングミュア結合モデルを使用してデータフィッティングから求めた。X50はccFvフォーマット中にあり、図22Aと22Bに示すVHとVLの親配列を含有する。X63は、VH CDR3中にH97YとS101TをKdが6.3倍改良されて含有し（図9Bを参照）、残りはX50と同じである。X64は、VH CDR3中にS101R変異体を、参照X50に対して2.5倍改良されて含有する；この改良はほとんどオンレート上昇に由来する。X65はH97YとS101Rとを含有し、同じ条件下でccFvフォーマットを使用してX50に対して10倍の改良を示し、これは、親和性成熟VH CDR3配列の最も多く報告されている変異体組合せX63（H97YとS101T）より結合親和性が強い（Chenら、前述(1999)、J. Mol. Biol. 293:865-881参照）。図38A は、Kabat命名法に基づき定義された重鎖可変領域のフレームワーク領域FR123を、比較のために報告された（Bacaら、前述、1997）ヒト化について使用されるランダムライブラリーとともに示す。A4.6.1に示されるマウス抗VEGF VHフレームワークFR123配列を、図9Bに示す。ここで親および参照フレームワークfr123として使用されるヒト化抗体（以後「ヒト化抗VEGF抗体」と呼ぶ）は、文献に報告されている（Prestaら、前述、1997）。FR123の上記配列番号は、Kabat命名法（kabataa）に基づき、その連続的順序はCDR中のアミノ酸を含む。図38Bは、マウス抗VEGF抗体のVH FR123のリード配列に基づくヒトVH生殖細胞系配列を使用して作成したヒットライブラリーの変種プロフィールを示す。下の変種プロフィールは、アミノ酸の位置多様性を示す。図の下の部分は、それぞれカットオフ頻度5と13とを使用して得られたフィルターにかけた変種プロフィールを示す。ヒットリストのメンバーのうちで5回またはそれ以下（13回またはそれ以下）出現するすべての位置アミノ酸は、フィルターにかけられる。図38B（続き）は、ヒットライブラリーの再度プロフィール化した変種プロフィールは、カットオフ無しでマウス抗VEGF抗体のVH FR123のリード配列に基づきヒトVH生殖細胞系配列を使用して作成されたが、各位置の変種は、総エネルギーまたはファンデアワールスエネルギーを使用して、抗体構造との構造適合性に基づいてランク付けされることを示す。このランキングは、低出現頻度のいくつかのアミノ酸が、最適化のために維持されるフレームワークの足場を安定化するのに構造的に重要であることを強調する。図38Cは、カットオフ19で、フィルターにかけた変種プロフィールを有するマウス抗VEGF抗体のVH FR123のリード配列に基づいてKabat由来のヒトVH配列を使用して作成したヒットライブラリーの変種プロフィールを示す。マウスVH FR123配列は参照として、連続番号をつけた位置で点線で記載されている。アミノ酸のすべての変種を、点線の下に記載する。変種中の点は、参照中と同じアミノ酸を示す。図38Dは、カットオフ5でヒトVH生殖細胞系配列からのフィルターにかけた変種プロフィールを使用したデザイナーライブラリーを示す（図38Bを参照）。FR123に付けた上記配列番号は、Kabat命名法（kabataa）とCDR中のアミノ酸を含む連続順序に基づく。フィルターにかけた変種プロフィールはさらに、コンピューターによりスクリーニングされて、抗体構造のみが使用される場合の、構造適合性のランキングオーダーを反映する。カットオフ5でフィルターにかけた変種プロフィールからは欠失している２つのアミノ酸F70(F69)とL72(L71)は、構造ベースのスコア付けに基づいてこれらの位置で最も好適なアミノ酸の仲間であるため、これらもまた含まれた。構造ベースのスクリーニングからの上の100位にランクされる配列について最終的に提出されたライブラリーはまた、F70(F69)、L72(L71)、S77(S76)およびK98(K94)（カッコ内の数字は、Kabat命名法に基づく配列番号を示す）を含み、なぜならRのような一部のアミノ酸は、VH CDR3親和性成熟中のK94Rについてすでに考察されているように、L72(L71)とK98(K94)についての計算で過度に予測されるためである。図39Aは、VEGF抗原の非存在下（最も左の列）と存在下（真ん中の列）で鋳型構造として1bj1（上のパネル）と1cz8（下のパネル）を使用して、列1中に比較的密な青のストリップ中ヒトVH生殖細胞系配列を使用したマウス抗VEGFのVHフレームワークfr123ヒット配列のスコア付け図の分布をｘ軸に示し、一緒に、列0中に比較的疎な青のストリップ中のマウスとヒトフレームワークfr123（Prestaら、前述を参照）配列と広く使用されているヒトVH生殖細胞系DP47をｘ軸に示す。抗原の存在下および非存在下での配列のスコアは相関（最も右の列）しており、これらは抗原との接触が最小であるため、フレームワーク最適化のほとんどに充分なフレームワーク最適化の抗体構造を示す。コンビナトリアル配列ライブラリーのスコア付け図は示していない。図39Bは、報告された（Prestaら、前述、1997とChenら、前述、1999参照）マウスVH FR123、ヒト化VH FR123、およびランク上位の200のデザイナー配列とヒトVH3生殖細胞系（DP47と呼ぶ広く使用されているVHヒト生殖細胞系を含む）について、ライブラリー中の配列と参照マウスVH FR123配列との差に基づくランキングスコアを左のパネルに、系統発生的距離をｘ軸（これらの連結する距離（図14Cも参照））に示す。ヒト生殖細胞系の１つの変種プロフィール（AA-PVP）の構造ベースのスクリーニングからの上の200のランクの配列は、系統発生的分析（赤丸）でヒトVH3生殖細胞系ファミリーと集合し、一方リードマウス抗体フレームワークは、その系統発生的距離が、1bj1（Prestaら、前述）から設計（ヒト生殖細胞系VH配列のみが含まれる）されヒト化された配列より遺伝的に遠いが、系統発生的距離は、F89(F69)およびK98(K94)のような比較的低い発生頻度を有するアミノ酸を含めることにより、わずかに変化するであろう（図42CとD）。ｙ軸は、ほとんどの設計されたフレームワークVH fr123は、マウス参照およびヒト化フレームワークVH fr123（DP47に近い）と比較して、構造との良好な構造適合性を有することを示す。これらは、その使用したデータベースにより部分的に定義されるように、ここに記載の本発明の方法のフレームワーク最適化のヒト様特徴を支持する。ライブラリー組み立てに使用される重複オリゴ、抗VEGFの重鎖可変領域（VH）ライブラリーの核酸およびアミノ酸配列を示す。DNA配列の縮重位置を、それぞれS（CまたはG）、R（AまたはG）、M（AまたはC）、Y（CまたはT）、K（GまたはT）、W（AまたはT）により示される；そして、コードされる対応するアミノ酸残基は、「X」と記載される。CDR領域は太字で表される。HindIIIとStyIは、それぞれライブラリーの上流および下流クローニング部位である。ライブラリー組み立てに使用される重複オリゴ、抗VEGFの重鎖可変領域（VH）ライブラリーの核酸およびアミノ酸配列を示す。DNA配列の縮重位置を、それぞれS（CまたはG）、R（AまたはG）、M（AまたはC）、Y（CまたはT）、K（GまたはT）、W（AまたはT）により示される；そして、コードされる対応するアミノ酸残基は、「X」と記載される。CDR領域は太字で表される。HindIIIとStyIは、それぞれライブラリーの上流および下流クローニング部位である。抗VEGF VHのファージ表示ライブラリーのパニングの要約。P1〜P8は、パニングの第１ラウンド〜第8ラウンドを示す。コーティングのためのVEGF濃度とライブラリーのファージの量（入力）は、パニングの進行とともに減少した。すべての洗浄条件は、PBST中の10回の簡単な洗浄で始まり、結合ファージの溶出が起きる前に、PBS中の10回の簡単な洗浄で終わった。すべての場合にインキュベーションは37℃で2時間行った。第8回目のパニングでは、インキュベーション中でライブラリーを競合ファージと5の比率で混合した。抗VEGF VHのファージ表示ライブラリーのパニングからのヒットクローンの完全長配列。配列決定データは、ファージ表示ライブラリーのそれぞれ第７回および第8回のパニングから単離された。採用したCDR領域の配列（CDR1、2および3）は、本文に記載のようにライブラリー構築中のマウス抗VEGF抗体配列（図9Bを参照）中と同じままであった。ヒット率は、記載のパニング段階における特定のクローンの発生率である。抗VEGF VHのファージ表示ライブラリーのパニングの要約。文字は、特定の位置のアミノ酸残基を示す（文字の後ろの数字により示され、これは、逐次的およびKabat命名法の両方で図38Aにより例示されるように、抗VEGFの重鎖の可変領域のアミノ酸配列の線形の順序に基づく）。抗VEGF VHの公表されたマウス配列とその対応するヒト化体を、それぞれ左の第１と第２の列に示し、ヒト免疫グロブリンファミリーIIIの同じ位置の優勢な残基と整列させて示す。配列決定データは、それぞれファージ表示ライブラリーの5番目、6番目、7番目、および8番目のパニングから単離したクローンから得られた。文字の前の数字は、試験中の特定の残基のヒット率（％で）を示す（＊ PCRのエラーにより生じる）。抗VEGFのファージ表示ライブラリーのパニングからの上のヒットVH配列の系統発生的分析を、注釈したように、ヒト生殖細胞系VH3ファミリー、マウス抗VEGF VHフレームワークFR123およびヒト化VHフレームワークfr123とともに示す。図42Cに示すように、ヒト生殖細胞系VH3ファミリーは、予測されたように系統発生的距離で集合する。選択された最適化されたVHフレームワークはまた、ヒト化VH配列（注釈に記載のように）と集合し、これはヒト生殖細胞系VH3ファミリーと系統発生的距離が非常に近く、一方マウスVHフレームワークは、最適化されたVHフレームワークおよびヒト生殖細胞系からはかなり遠い、これは、本発明の方法が設計において、最適化した抗体の完全にヒトの配列またはヒト様配列を有するフレームワークを、ヒト様と構造鋳型もしくは集合構造体もしくは構造平均からの鋳型との適合性の間の微妙なバランスに依存して最適化したという結論を支持する。図42Dは、いくつかのよく性状解析された配列D36、D40およびD42と関連配列について注釈付きで、別の樹の見解でこれらの配列の系統発生的距離を示す。D36は、ヒトであるか、または系統発生的距離で報告されたヒト化配列より少し良好である。 ccFvファージ表示系（phage display system）（上記図23〜25の説明を参照）を使用して、デザイナーVH最適化ライブラリーから選択された抗VEGF抗体の最適化VHフレームワーク（FR123）の配列を示す。元々のマウス抗体VH FR123とマウス抗体からの同じCDRを有するヒト化配列（Prestaら、前述）とともに、D36、D40およびD42のVH fr123。下のパネルの点は、アミノ酸が参照と同じであることを示す（マウスVHフレームワーク fr123）。 BIAcoreバイオセンサー（図43A参照、およびその配列について図43Bを参照）を使用してデザイナーライブラリーから選択された抗VEGF抗体の５つの抗体、親抗体（X50）、および最適化したフレームワーク（D36、D40、D41およびD42）の親和性データを示す。精製抗体が、25℃でCM5バイオチップ上に固定化されたその抗原（VEGF）に結合する時、SPR単位（ｙ軸）対時間（ｘ軸）の変化を測定することにより、測定が行われる。オンレートとオフレートの変化の両方を、1:1ラングミュア結合モデルを使用してデータフィッティングから求めた。２つのヒト化フレームワークD36とD40は、フレームワーク最適化の結合親和性（ccFvフォーマットで）が、親／参照抗VEGF抗体配列よりほぼ4倍高く（文献に報告されたヒト化抗VEGF抗体フレームワークについては図22AとBを参照（Presta LG, Chen H, O'Connor SJ, Chisholm V, Meng YG, Krummen L, Winkler M, Ferara N (1997) Cancer Res. 57:4593-4599））、D42は参照抗体とほぼ同じである。報告されたヒト化抗VEGF抗体（図22AとB）は対応するマウス抗体よりほぼ2倍弱いため、これらの２つのヒト化抗体は、ヒト化により対応するマウス抗体よりほぼ2倍高い結合親和性を有するはずである。最適化VHフレームワーク（D36とD40）の安定性の上昇を示す。ｙ軸は、抗体の割合は、親X50と最適化フレームワーク（D36とD40）について精製抗体を4、37および42℃で17時間インキュベートした後に、25℃でBIAcoreを使用して固定化したVEGF抗原への結合が活性なままであることを示す。これは、最適化フレームワークが、報告された（Prestaら、前述、1997）ヒト化VHフレームワークより高い安定性を有することを示す。最適化V_Hフレームワークの発現の改良を示す。最適化フレームワーク（D36、D40およびD42）はまた、SDS-PAGE／クマシーブルー染色により検出される収率発現で示されるように、親／野生型抗体（X50）と比較して、発現が改良されていることを示す。ヒトVEGFに対する選択された抗体のVHとVLのアミノ酸配列を示す。

Claims

抗体配列のライブラリーを構築する方法であって、この方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し；
リード抗体のCDR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列である）；
リード配列を複数のテスタータンパク質配列と比較し；そして
複数のテスタータンパク質配列から、リード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択する（選択されたペプチドセグメントはヒットライブラリーを形成する）。
リード配列の長さは5〜100aaである、請求項1の方法。
リード配列の長さは6〜80aaである、請求項1の方法。
リード配列の長さは8〜50aaである、請求項1の方法。
CDR中のアミノ酸配列を同定する工程は、Kabat基準またはチョチア（Chothia）基準を使用して行われる、請求項1の方法。
リード配列は、CDR1、CDR2、CDR3、FR1-CDR1、CDR1-FR2、FR2-CDR2、CDR2-FR3、FR3-CDR3、CDR3-FR4、FR1-CDR1-FR2、FR2-CDR2-FR3、およびFR3-CDR3-FR4よりなる群から選択されるリード抗体のV_HまたはV_L内の領域からのアミノ酸配列を含む、請求項1の方法。
リード配列は、選択されたCDR中に少なくとも６つの連続的アミノ酸残基を含む、請求項1の方法。
リード配列は、選択されたCDR中に少なくとも７つの連続的アミノ酸残基を含む、請求項1の方法。
リード配列は、選択されたCDR中にすべてのアミノ酸残基を含む、請求項1の方法。
リード配列は、選択されたCDRにすぐ隣接する少なくとも１つのアミノ酸残基をさらに含む、請求項1の方法。
リード配列は、選択されたCDRにフランクするFR中に少なくとも１つのアミノ酸残基をさらに含む、請求項1の方法。
リード配列は、選択されたCDRのＣ末端またはＮ末端に隣接する１つ以上のCDRもしくはFRをさらに含む、請求項1の方法。
複数のテスタータンパク質配列は抗体配列を含む、請求項1の方法。
複数のテスタータンパク質配列はヒト抗体配列を含む、請求項1の方法。
複数のFRテスタータンパク質配列は、V_HまたはV_L中に少なくとも70％のヒト配列を有するヒト化抗体配列を含む、請求項1の方法。
複数のFRテスタータンパク質配列は、ヒト生殖細胞系抗体配列を含む、請求項1の方法。
複数のテスタータンパク質配列は、抗体のCDRについてNIHのジーンバンク、Swiss-Protデータベース、およびKabatデータベースからなるデータベースから検索される、請求項1の方法。
リード配列を複数のテスタータンパク質配列と比較する工程は、BLAST、PSI-BLAST、プロフィールHMM、およびCOBLATHよりなる群から選択されるアルゴリズムにより行われる、請求項1の方法。
ヒットライブラリー中の選択されたペプチドセグメントとリード配列との配列同一性は、少なくとも25％である、請求項1の方法。
ヒットライブラリー中の選択されたペプチドセグメントとリード配列との配列同一性は、少なくとも35％である、請求項1の方法。
ヒットライブラリー中の選択されたペプチドセグメントとリード配列との配列同一性は、少なくとも45％である、請求項1の方法。
以下の工程をさらに含む請求項1の方法：
ヒットライブラリーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築する。
以下の工程をさらに含む請求項1の方法：
ヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
アミノ酸位置変種を対応する遺伝子コドンに逆翻訳することにより、ヒットライブラリーのアミノ酸位置変種プロフィールを核酸位置変種プロフィールに変換し；そして
核酸位置変種をコンビナトリアル的に組合せてDNAセグメントの縮重核酸ライブラリーを構築する。
遺伝子コドンは、細菌での発現に好適なものである、請求項23の方法。
遺伝コドンは、DNAセグメントの縮重核酸ライブラリーの多様性が、1×10⁷ 未満であるように選択される、請求項23の方法。
遺伝コドンは、DNAセグメントの縮重核酸ライブラリーの多様性が、1×10⁶ 未満であるように選択される、請求項23の方法。
以下の工程をさらに含む請求項23の方法：
縮重核酸ライブラリーのDNAセグメントを宿主生物細胞中に導入し；
縮重核酸ライブラリーによりコードされるヒットライブラリーのアミノ酸配列を含有する組換え抗体が宿主生物細胞中で産生されるように、DNAセグメントを宿主細胞中で発現させ；そして
10⁶ M^-1 より高い親和性で標的抗原に結合する組換え抗体を選択する。
選択された組換え抗体の親和性は10⁸ M^-1より高い、請求項27の方法。
選択された組換え抗体の親和性は10⁹ M^-1より高い、請求項27の方法。
宿主生物は、細菌、酵母、植物、昆虫および哺乳動物よりなる群から選択される、請求項27の方法。
組換え抗体は、完全に組み立てられた抗体、Fab断片、Fv断片、または１本鎖抗体よりなる群から選択される、請求項27の方法。
組換え抗体はファージ粒子の表面上に表示される、請求項27の方法。
ファージ粒子の表面上に表示される組換え抗体は、V_HとV_Lにより形成される２本鎖ヘテロダイマーでもよい、請求項32の方法。
V_HおよびV_L鎖のヘテロダイマー化は、それぞれV_HとV_L鎖に融合した２つの非抗体ポリペプチド鎖の間で形成されたヘテロダイマーにより促進される、請求項33の方法。
非抗体ポリペプチド鎖は、それぞれヘテロダイマー受容体GABA_B R1(GR1)とR2(GR2)から得られる、請求項34の方法。
ファージ粒子の表面上に表示される組換え抗体は、ペプチドリンカーで連結されたV_HとV_Lを含有する１本鎖抗体である、請求項32の方法。
ファージ粒子の表面上の１本鎖抗体の表示は、１本鎖抗体とGR1との融合体とファージpIIIキャプシドタンパク質とGR2との融合体とで形成されるヘテロダイマーにより促進される、請求項36の方法。
標的抗原は、小有機分子、タンパク質、ペプチド、核酸およびポリ炭水化物よりなる群から選択される、請求項27の方法。
抗体配列のライブラリーを構築する方法であって、この方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し；
リード抗体のCDRとFR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含む第１のアミノ酸配列を提供し（選択されたアミノ酸配列はCDRリード配列である）；
CDRリード配列を複数のテスタータンパク質配列と比較し；
複数のCDRテスタータンパク質配列から、CDRリード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはCDRヒットライブラリーを形成する）；
リード抗体のV_HまたはV_L領域中に１つのFRを選択し；
選択されたFR中に少なくとも３つの連続したアミノ酸残基を含む第２のアミノ酸配列を提供し（選択されたアミノ酸配列はFRリード配列である）；
FRリード配列を複数のFRテスタータンパク質配列と比較し；そして
複数のFRテスタータンパク質配列から、FRリード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはFRヒットライブラリーを形成する）；そして
CDRヒットライブラリーとFRヒットライブラリーとを組合せてヒットライブラリーを形成する。
複数のCDRテスタータンパク質配列は、ヒトまたは非ヒト抗体のアミノ酸配列を含む、請求項39の方法。
複数のFRテスタータンパク質配列は、ヒト抗体のアミノ酸配列を含んでよい、請求項39の方法。
複数のFRテスタータンパク質配列は、V_HまたはV_L中に少なくとも70％のヒト配列を有するヒト化抗体配列を含む、請求項39の方法。
複数のFRテスタータンパク質配列は、ヒト生殖細胞系抗体配列を含む、請求項39の方法。
少なくとも１つの複数のCDRテスタータンパク質配列は、複数のFRテスタータンパク質配列とは異なる、請求項39の方法。
複数のCDRテスタータンパク質配列はヒトもしくは非ヒト抗体配列であり、複数のFRテスタータンパク質配列はヒト抗体配列である、請求項39の方法。
以下の工程をさらに含む請求項39の方法：
ヒットライブラリーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築する。
以下の工程をさらに含む請求項39の方法：
CDRヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
アミノ酸位置変種を対応する遺伝子コドンに逆翻訳することにより、CDRヒットライブラリーのアミノ酸位置変種プロフィールを第１の核酸位置変種プロフィールに変換し；そして
核酸位置変種をコンビナトリアル的に組合せてDNAセグメントの縮重CDR核酸ライブラリーを構築する。
ライブラリー抗体配列を構築する方法であって、この方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し；
リード抗体のFR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのFRを選択し；
選択されたFR中に少なくとも３つの連続したアミノ酸残基を含む第１のアミノ酸配列を提供し（選択されたアミノ酸配列は第１のFRリード配列である）；
第１のリードFR配列を複数のFRテスタータンパク質配列と比較し；そして
複数のFRテスタータンパク質配列から、第１のFRリード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択する（選択されたペプチドセグメントはFRヒットライブラリーを形成する）。
以下の工程をさらに含む請求項48の方法：
選択されたFRとは異なるFR中に少なくとも３つの連続したアミノ酸残基を含む第２のアミノ酸配列を提供し（選択されたアミノ酸配列は第２のFRリード配列である）；
第２のFRリード配列を複数のFRテスタータンパク質配列と比較し；
複数のFRテスタータンパク質配列から、第２のFRリード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントは第２のFRヒットライブラリーを形成する）；そして
第１のFRヒットライブラリーと第２のFRヒットライブラリーとを組合せてヒットライブラリーを形成する。
リードFR配列は、リード抗体のV_H FR1、V_H FR2、V_H FR3、V_H FR4、V_L FR1、V_L FR2、V_L FR3、およびV_L FR4よりなる群から選択される選択されたFR中に、少なくとも５つの連続的アミノ酸残基を含む、請求項48の方法。
請求項48の方法であって、以下の工程をさらに含む：
ヒットライブラリーのアミノ酸配列をコードするDNAセグメントを含む核酸または縮重核酸ライブラリーを構築する。
複数のFRテスタータンパク質配列は、CDRが削除された抗体配列を含む、請求項48の方法。
複数のFRテスタータンパク質配列は、CDRが削除されたヒト抗体配列を含む、請求項48の方法。
リード配列プロフィールに基づいて抗体配列のライブラリーを構築する方法であって、この方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し；
リード抗体のCDR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列である）；
リード配列の３次元構造を提供し；
リード配列の構造に基づいてリード配列プロフィールを作成し；
リード配列プロフィールを複数のテスタータンパク質配列と比較し；そして
複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択する（選択されたペプチドセグメントはヒットライブラリーを形成する）。
リード配列の３次元構造は、Ｘ線結晶解析、核磁気共鳴（NMR）分光法、または理論的構造モデル化から得られる構造である、請求項54の方法。
リード配列プロフィールを作成する工程は以下の工程を含む請求項54の方法：
リード配列の構造を複数のテスタータンパク質セグメントの構造と比較し；
リード配列とテスタータンパク質セグメントの主鎖コンフォメーションの差の自乗平均の平方根を決定し；
主鎖コンフォメーションの差の自乗平均の平方根が5Å未満であるテスタータンパク質セグメントを選択し；そして
選択されたテスタータンパク質セグメントのアミノ酸配列をリード配列と整列させてリード配列プロフィールを作成する。
主鎖コンフォメーションの差の自乗平均の平方根が4Å未満である、請求項56の方法。
主鎖コンフォメーションの差の自乗平均の平方根が2Å未満である、請求項56の方法。
リード配列プロフィールを作成する工程は以下の工程を含む請求項54の方法：
リード配列の構造を複数のテスタータンパク質セグメントの構造と比較し；
リード配列とテスタータンパク質セグメントの主鎖コンフォメーションのＺスコアを決定し；
Ｚスコアが2より大きい、好ましくは3より大きい、さらに好ましくは4より大きい、および最も好ましくは5より大きいテスタータンパク質セグメントのセグメントを選択し；そして
選択されたテスタータンパク質セグメントのアミノ酸配列をリード配列と整列させてリード配列プロフィールを作成する。
リード配列プロフィールを作成する工程は、CE、MAPS、モンテカルロおよび3Dクラスタリングアルゴリズムよりなる群から選択されるアルゴリズムにより行われる、請求項54の方法。
以下の工程をさらに含む請求項54の方法：
ヒットライブラリーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築する。
以下の工程をさらに含む請求項54の方法：
ヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
アミノ酸位置変種を対応するトリヌクレオチドコドンに逆翻訳することにより、ヒットライブラリーのアミノ酸位置変種プロフィールを核酸位置変種プロフィールに変換し；そして
核酸位置変種をコンビナトリアル的に組合せてDNAセグメントの縮重核酸ライブラリーを構築する。
リード配列に基づいて変異抗体のライブラリーを構築するためのコンピューターによる方法であって、この方法は以下の工程を含む：
入力としてリード抗体のCDR領域中の少なくとも３つの連続的アミノ酸残基を含むアミノ酸配列を取り（アミノ酸配列はリード配列である）；
コンピューターが実行できるロジックを使用してリード配列を複数のテスタータンパク質配列と比較し；
複数のテスタータンパク質配列から、リード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し；そして
出力として、ヒットライブラリーを形成する選択されたペプチドを作成する。
リード配列に基づいて変異抗体のライブラリーを構築するためのロジックを含むコンピューターで読める媒体であって、ロジックは、
入力としてリード抗体のCDRの少なくとも３つの連続的アミノ酸残基を含むアミノ酸配列を取り（アミノ酸配列はリード配列である）；
リード配列を複数のテスタータンパク質配列と比較し；
複数のテスタータンパク質配列から、リード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し；そして
出力として、ヒットライブラリーを形成する選択されたペプチドを作成する、ロジックを含む上記媒体。
リード抗体の構造に基づいて抗体のライブラリーを構築する方法であって、この方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、リード構造鋳型として定義される既知の３次元構造を有する）；
リード抗体のCDR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列である）；
リード配列を複数のテスタータンパク質配列と比較し；
複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
スコア化関数を使用して、ヒットライブラリーのメンバーがリード構造鋳型と構造的に適合性があるかどうかを決定し；そして
リード配列と同等であるかまたはよりすぐれたスコアのヒットライブラリーのメンバーを選択する。
リード配列の長さは5〜100aaである、請求項65の方法。
リード配列の長さは6〜80aaである、請求項65の方法。
リード配列の長さは8〜50aaである、請求項65の方法。
CDR中のアミノ酸配列を同定する工程は、Kabat基準またはチョチア（Chothia）基準を使用して行われる、請求項65の方法。
リード配列は、CDR1、CDR2、CDR3、FR1-CDR1、CDR1-FR2、FR2-CDR2、CDR2-FR3、FR3-CDR3、CDR3-FR4、FR1-CDR1-FR2、FR2-CDR2-FR3、およびFR3-CDR3-FR4よりなる群から選択されるリード抗体のV_HまたはV_L内の領域からのアミノ酸配列を含む、請求項65の方法。
リード配列は、選択されたCDR中に少なくとも６つの連続的アミノ酸残基を含む、請求項65の方法。
リード配列は、選択されたCDR中に少なくとも７つの連続的アミノ酸残基を含む、請求項65の方法。
リード配列は、選択されたCDR中にすべてのアミノ酸残基を含む、請求項65の方法。
リード配列は、選択されたCDRにすぐ隣接する少なくとも１つのアミノ酸残基をさらに含む、請求項65の方法。
リード配列は、選択されたCDRにフランクするFR中に少なくとも１つのアミノ酸残基をさらに含む、請求項65の方法。
リード配列は、選択されたCDRのＣ末端またはＮ末端に隣接する１つ以上のCDRもしくはFRをさらに含む、請求項65の方法。
複数のテスタータンパク質配列は抗体配列を含む、請求項65の方法。
複数のテスタータンパク質配列はヒト抗体配列を含む、請求項65の方法。
複数のFRテスタータンパク質配列は、V_HまたはV_L中に少なくとも70％のヒト配列を有するヒト化抗体配列を含む、請求項65の方法。
複数のFRテスタータンパク質配列は、ヒト生殖細胞系抗体配列を含む、請求項65の方法。
複数のテスタータンパク質配列は、抗体のCDRについてNIHのジーンバンク、Swiss-Protデータベース、およびKabatデータベースからなるデータベースから検索される、請求項65の方法。
リード配列を複数のテスタータンパク質配列と比較する工程は、BLAST、PSI-BLAST、プロフィールHMM、およびCOBLATHよりなる群から選択されるアルゴリズムにより行われる、請求項65の方法。
ヒットライブラリー中の選択されたペプチドセグメントとリード配列との配列同一性は、少なくとも25％である、請求項65の方法。
ヒットライブラリー中の選択されたペプチドセグメントとリード配列との配列同一性は、少なくとも35％である、請求項65の方法。
ヒットライブラリー中の選択されたペプチドセグメントとリード配列との配列同一性は、少なくとも45％である、請求項65の方法。
スコア化関数は、静電的相互作用、ファンデアワールス相互作用、静電的溶媒和エネルギー、溶媒がアクセス可能な表面溶媒和エネルギー、およびコンフォメーションエントロピーよりなる群から選択されるエネルギースコア化関数である、請求項65の方法。
スコア化関数は、Amberフォースフィールド（forcefiled）、Charmm フォースフィールド、Discover cvff フォースフィールド、ECEPP フォースフィールド、GROMOS フォースフィールド、OPLS フォースフィールド、MMFF94 フォースフィールド、Tripos フォースフィールド、MM3 フォースフィールド、Dreiding フォースフィールド、およびUNRES フォースフィールドよりなる群から選択されるフォースフィールドを含むスコア化関数である、請求項65の方法。
ヒットライブラリーのメンバーを選択する工程は、
ΔE_total = E_vdw + E_bond + E_angel + E_{electrostatics} + E_solvation
の式に基づいて計算されるリード配列より低いかまたは同等の総エネルギーを有するヒットライブラリーのメンバーを選択することを含む、請求項65の方法。
ヒットライブラリーのメンバーを選択する工程は、改良されたスコア化関数
ΔG_b = ΔG_MM + ΔG_sol - TΔS_SS
（式中、
ΔG_MM = ΔG_ele + ΔG_vdw (1)
ΔG_sol = ΔG_ele-sol + ΔG_ASA (2)）
を使用して、結合状態と非結合状態の差として計算されるリード配列より小さい結合フリーエネルギーを有するヒットライブラリーのメンバーを選択することを含む、請求項65の方法。
リード構造鋳型は完全に組み立てられたリード抗体である、請求項65の方法。
リード構造鋳型はリード抗体のV_HまたはV_Lの3D構造である、請求項65の方法。
リード構造鋳型は、リード抗体のCDRまたはFRの3D構造またはこれらの組合せである、請求項65の方法。
リード構造鋳型は、Ｘ線結晶解析、核磁気共鳴（NMR）分光法、または理論的構造モデル化から得られる構造である、請求項65の方法。
以下の工程をさらに含む請求項65の方法：
ヒットライブラリーのアミノ酸配列をコードするDNA配列を含む核酸ライブラリーを構築する。
以下の工程をさらに含む請求項65の方法：
ヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
アミノ酸位置変種を対応する遺伝子コドンに逆翻訳することにより、ヒットライブラリーのアミノ酸位置変種プロフィールを核酸位置変種プロフィールに変換し；そして
核酸位置変種をコンビナトリアル的に組合せてDNAセグメントの縮重核酸ライブラリーを構築する。
遺伝子コドンは、細菌での発現に好適なものである、請求項95の方法。
遺伝子コドンは、DNAセグメントの縮重核酸ライブラリーの多様性が、1×10⁷ 未満であるように選択される、請求項95の方法。
遺伝子コドンは、DNAセグメントの縮重核酸ライブラリーの多様性が、1×10⁶ 未満であるように選択される、請求項95の方法。
以下の工程をさらに含む請求項95の方法：
縮重核酸ライブラリーのDNAセグメントを宿主生物細胞中に導入し；
縮重核酸ライブラリーによりコードされるヒットライブラリーのアミノ酸配列を含有する組換え抗体が宿主生物細胞中で産生されるように、DNAセグメントを宿主細胞中で発現させ；そして
10⁶ M^-1より高い親和性で標的抗原に結合する組換え抗体を選択する。
選択された組換え抗体のの親和性が10⁸ M^-1より高い、請求項99の方法。
選択された組換え抗体のの親和性が10⁹ M^-1より高い、請求項99の方法。
宿主生物は、細菌、酵母、植物、昆虫および哺乳動物よりなる群から選択される、請求項99の方法。
組換え抗体は、完全に組み立てられた抗体、Fab断片、Fv断片、または１本鎖抗体よりなる群から選択される、請求項99の方法。
組換え抗体はファージ粒子の表面上に表示される、請求項99の方法。
ファージ粒子の表面上に表示される組換え抗体は、V_HとV_Lにより形成される２本鎖ヘテロダイマーである、請求項104の方法。
V_HおよびV_L鎖のヘテロダイマー化は、それぞれV_HとV_L鎖に融合した２つの非抗体ポリペプチド鎖の間で形成されたヘテロダイマーにより促進される、請求項105の方法。
非抗体ポリペプチド鎖は、それぞれヘテロダイマー受容体GABA_B R1(GR1)とR2(GR2)から得られる、請求項0106の方法。
ファージ粒子の表面上に表示される組換え抗体は、ペプチドリンカーで連結されたV_HとV_Lを含有する１本鎖抗体である、請求項104の方法。
ファージ粒子の表面上の１本鎖抗体の表示は、１本鎖抗体とGR1との融合体とファージpIIIキャプシドタンパク質とGR2との融合体とで形成されるヘテロダイマーにより促進される、請求項108の方法。
標的抗原は、小有機分子、タンパク質、ペプチド、核酸およびポリ炭水化物よりなる群から選択される、請求項99の方法。
抗体配列のライブラリーを構築する方法であって、この方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、リード構造鋳型として定義される既知の３次元構造を有する）；
リード抗体のCDR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列である）；
リード配列プロフィールを複数のテスタータンパク質配列と比較し；
複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
リード配列の各位置に現れるアミノ酸変種の頻度に基づきヒットライブラリーの適用ウイルス粒子を作成し；
ヒットライブラリー中のアミノ酸変種を組合せて、ヒット変種ライブラリーを形成するヒット変種の組合せを作成し；
スコア化関数を使用して、ヒット変種ライブラリーのメンバーがリード構造鋳型と構造的に適合性があるかどうかを決定し；そして
リード配列と同等であるかまたはよりすぐれたスコアのヒット変種ライブラリーのメンバーを選択する。
ヒットライブラリー中のアミノ酸変種を組合せる工程は以下を含む請求項111の方法：
出現頻度が4回より大きいアミノ酸変種を選択する。
ヒットライブラリー中のアミノ酸変種を組合せる工程は以下を含む請求項111の方法：
出現頻度が6回より大きいアミノ酸変種を選択する。
ヒットライブラリー中のアミノ酸変種を組合せる工程は以下を含む請求項111の方法：
出現頻度が各位置で総変種の5％より大きいアミノ酸変種を選択する。
ヒットライブラリー中のアミノ酸変種を組合せる工程は以下を含む請求項111の方法：
出現頻度が各位置で総変種の10％より大きいアミノ酸変種を選択し；そして
ヒットライブラリー中の選択されたアミノ酸変種を組合せて、ヒット変種ライブラリーを形成するヒット変種の組合せを生成する。
ヒットライブラリー中のアミノ酸変種を組合せる工程は以下を含む請求項111の方法：
出現頻度が各位置で総変種の5％より大きいアミノ酸変種を選択し；
出現頻度が各位置で総変種の5％と等しいかまたはそれより小さい場合、リード配列のアミノ酸を選択し；そして
ヒットライブラリー中の選択されたアミノ酸変種を組合せて、ヒット変種ライブラリーを形成するヒット変種の組合せを生成する。
スコア化関数は、静電的相互作用、ファンデアワールス相互作用、静電的溶媒和エネルギー、溶媒がアクセス可能な表面溶媒和エネルギー、およびコンフォメーションエントロピーよりなる群から選択されるエネルギースコア化関数である、請求項111の方法。
スコア化関数は、Amberフォースフィールド（forcefiled）、Charmm フォースフィールド、Discover cvff フォースフィールド、ECEPP フォースフィールド、GROMOS フォースフィールド、OPLS フォースフィールド、MMFF94 フォースフィールド、Tripos フォースフィールド、MM3 フォースフィールド、Dreiding フォースフィールド、およびUNRES フォースフィールドよりなる群から選択されるフォースフィールドを含むスコア化関数である、請求項111の方法。
以下の工程をさらに含む請求項111の方法：
ヒットライブラリーの選択されたメンバーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築する。
以下の工程をさらに含む請求項111の方法：
ヒット変種ライブラリーの選択されたメンバーを少なくとも２つのサブヒット変種ライブラリーに分解し；
サブヒット変種ライブラリーのアミノ酸位置変種プロフィールを作成し；
アミノ酸位置変種を対応する遺伝子コドンに逆翻訳することにより、選択されたサブヒット変種ライブラリーのアミノ酸位置変種プロフィールを核酸位置変種プロフィールに変換し；そして
核酸位置変種をコンビナトリアル的に組合せてDNAセグメントの縮重核酸ライブラリーを構築する。
ヒット変種ライブラリーを分解する工程は以下を含む請求項120の方法：
リード配列と同等かまたはより優れたスコアを有するヒット変種ライブラリーの10〜30メンバーをランダムに選択する（選択されたメンバーはサブ変種ライブラリーを形成する）。
ヒット変種ライブラリーを分解する工程は以下を含む請求項120の方法：
ヒット変種ライブラリーのアミノ酸位置変種プロフィールを作成して、ヒット変種プロフィールを得て；そして
ある距離のカットオフ（4.5Å〜8Å）を使用して、リード構造鋳型のCα、Cβまたは重い原子の接触地図に基づき、ヒット変種プロフィールをサブ変種プロフィールのセグメントに分解する。
ヒット変種ライブラリーを分解する工程は以下を含む請求項120の方法：
ヒット変種ライブラリーのアミノ酸位置変種プロフィールを作成して、ヒット変種プロフィールを得て；そして
6Å−8Åの距離カットオフを使用して、リード構造鋳型のCα、Cβまたは重い原子の接触地図に基づき、ヒット変種プロフィールをサブ変種プロフィールのセグメントに分解する。
複数の抗体の構造集合体に基づいて抗体のライブラリーを構築する方法であって、この方法は以下の工程を含む：
リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、既知の３次元構造を有する）；
リード抗体以外のV_HもしくはV_L領域中の異なる配列を有する１つ以上の抗体の3D構造を提供し；
リード抗体と１つ以上の抗体とを組合せて構造集合体を形成し（構造集合体はリード構造鋳型として定義される）；
リード抗体のCDR中のアミノ酸配列を同定し；
リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列である）；
リード配列を複数のテスタータンパク質配列と比較し；
複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
リード配列の各位置に現れるアミノ酸変種の頻度に基づきヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
ヒットライブラリー中のアミノ酸変種を組合せて、ヒット変種ライブラリーを形成するヒット変種の組合せを生成させ；
スコア化関数を使用して、ヒット変種ライブラリーのメンバーがリード構造鋳型と構造的に適合性があるかどうかを決定し；そして
リード配列と同等であるかまたはよりすぐれたスコアのヒット変種ライブラリーのメンバーを選択する。
リード抗体の構造に基づいて抗体のライブラリーを構築する方法であって、この方法は以下の工程を含む：
a) リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、既知の３次元構造を有する）；
b) リード抗体のCDR中のアミノ酸配列を同定し；
c) リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
d) 選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列として定義される）；
e) リード配列を複数のテスタータンパク質配列と比較し；
f) 複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
g) リード配列の各位置に現れるアミノ酸変種の頻度に基づきヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
h) ヒットライブラリー中のアミノ酸変種を組合せて、ヒット変種ライブラリーを形成するヒット変種の組合せを生成させ；
i) スコア化関数を使用して、ヒット変種ライブラリーのメンバーがリード構造鋳型と構造的に適合性があるかどうかを決定し；
j) リード配列と同等であるかまたはよりすぐれたスコアのヒット変種ライブラリーのメンバーを選択し；
k) ヒット変種ライブラリーの選択されたメンバーのアミノ酸配列をコードするDNAセグメントを含む縮重核酸ライブラリーを構築し；
l) 核酸ライブラリーの多様性を決定し、多様性が1×10⁶より大きい場合は、核酸ライブラリーの多様性が1×10⁶と等しいかまたはより小さくなるまで工程j)〜l)を繰り返し；
m) 縮重核酸ライブラリー中のDNAセグメントを宿主生物の細胞中に導入し；
n) ヒットライブラリーのアミノ酸配列を含有する組換え抗体が宿主生物細胞中で産生されるように、DNAセグメントを宿主細胞中で発現させ；
o) 10⁶ M^-1より高い親和性で標的抗原に結合する組換え抗体を選択し；そして
p) 10⁶ M^-1より高い親和性で標的抗原に結合する組換え抗体が見つからない場合、工程e)〜o)を繰り返す。
リード抗体の構造に基づいて抗体のライブラリーを構築する方法であって、この方法は以下の工程を含む：
a) リード抗体の重鎖（V_H）または軽鎖（V_L）の可変領域のアミノ酸配列を提供し（リード抗体は、リード構造鋳型として定義される既知の３次元構造を有する）；
b) リード抗体のCDR中のアミノ酸配列を同定し；
c) リード抗体のV_HまたはV_L領域中の１つのCDRを選択し；
d) 選択されたCDR中に少なくとも３つの連続したアミノ酸残基を含むアミノ酸配列を提供し（選択されたアミノ酸配列はリード配列として定義される）；
e) リード配列の１つ以上のアミノ酸残基を１つ以上の異なるアミノ酸残基で置換してリード配列を変異させて、リード配列変異体ライブラリーを作成し；
f) 第１のスコア化関数を使用して、リード配列変異体ライブラリーがリード構造鋳型と構造的に適合性があるかどうかを決定し；
g) リード配列と同等であるかまたはよりすぐれたスコアのリード配列変異体を選択し；
h) リード配列を複数のテスタータンパク質配列と比較し；
i) 複数のテスタータンパク質配列から、リード配列と少なくとも10％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；
j) リード配列の各位置に現れるアミノ酸変種の頻度に基づきヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
k) ヒットライブラリー中のアミノ酸変種を組合せて、ヒット変種の組合せを生成させ；
l) 選択された配列変異体をヒット変種の組合せと組合せて、ヒット変種ライブラリーを産生させ；
m) 第２のスコア化関数を使用して、ヒット変種ライブラリーのメンバーがリード構造鋳型と構造的に適合性があるかどうかを決定し；
n) リード配列と同等であるかまたはよりすぐれたスコアのヒット変種ライブラリーのメンバーを選択し；
o) ヒット変種ライブラリーの選択されたメンバーのアミノ酸配列をコードするDNAセグメントを含む縮重核酸ライブラリーを構築し；
p) 核酸ライブラリーの多様性を決定し、多様性が1×10⁶より大きい場合は、核酸ライブラリーの多様性が1×10⁶と等しいかまたはより小さくなるまで工程n)〜p)を繰り返し；
q) 縮重核酸ライブラリー中のDNAセグメントを宿主生物の細胞中に導入し；
r) ヒットライブラリーのアミノ酸配列を含有する組換え抗体が宿主生物細胞中で産生されるように、DNAセグメントを宿主細胞中で発現させ；
s) 10⁶ M^-1より高い親和性で標的抗原に結合する組換え抗体を選択し；そして
t) 10⁶ M^-1より高い親和性で標的抗原に結合する組換え抗体が見つからない場合、工程e)〜s)を繰り返す。
以下の工程を含む、設計されるタンパク質のライブラリーを構築する方法：
リードタンパク質から得られるアミノ酸配列を提供し（このアミノ酸配列はリード配列と呼ぶ）；
リード配列を複数のテスタータンパク質配列と比較し；そして
複数のFRテスタータンパク質配列から、リード配列と少なくとも15％の配列同一性を有する少なくとも２つのペプチドセグメントを選択し（選択されたペプチドセグメントはヒットライブラリーを形成する）；そして
リード配列をヒットライブラリーで置換して設計されるタンパク質のライブラリーを形成する。
リード配列の長さは好ましくは5〜100aaである、請求項127の方法。
リード配列の長さは好ましくは6〜80aaである、請求項127の方法。
リード配列の長さは好ましくは8〜50aaである、請求項127の方法。
リードタンパク質は、酵素受容体、サイトカイン、腫瘍サプレッサー、ケモカイン、抗体および増殖因子よりなる群から選択される種類のタンパク質である、請求項127の方法。
複数のテスタータンパク質配列はヒトタンパク質配列を含む、請求項127の方法。
複数のテスタータンパク質配列は、それぞれ少なくとも70％のヒト配列を有するヒト化タンパク質配列を含む、請求項127の方法。
複数のテスタータンパク質配列は、ジーンバンク（GenBank）またはSwiss-Protデータベースのタンパク質データベースから検索される、請求項127の方法。
リード配列を複数のテスタータンパク質配列と比較する工程は、BLAST、PSI-BLAST、プロフィールHMM、およびCOBLATHよりなる群から選択されるアルゴリズムにより行われる、請求項127の方法。
ヒットライブラリー中の選択されたペプチドセグメントとリード配列との配列同一性は、少なくとも25％である、請求項127の方法。
ヒットライブラリー中の選択されたペプチドセグメントとリード配列との配列同一性は、少なくとも35％である、請求項127の方法。
ヒットライブラリー中の選択されたペプチドセグメントとリード配列との配列同一性は、少なくとも45％である、請求項127の方法。
以下の工程を含む請求項127の方法：
設計されるタンパク質のライブラリーから所望の機能を有するタンパク質を選択する。
所望の機能はリードタンパク質の改良された生物学的機能である、請求項139の方法。
改良された生物学的機能は、安定性の増強、酵素活性の増強、リードタンパク質の同種のリガンドへの結合親和性の増強、およびあらかじめ決められた生物の発現の増強よりなる群から選択される、請求項140の方法。
以下の工程をさらに含む請求項127の方法：
ヒットライブラリーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築する。
以下の工程をさらに含む請求項127の方法：
ヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
ヒットライブラリー中のアミノ酸変種を組合せて、ヒット変種ライブラリーを形成するヒット変種の組合せを生成し；そして
ヒット変種ライブラリーから好ましい機能を有するタンパク質を選択する。
以下の工程をさらに含む請求項143の方法：
スコア化関数を使用して、ヒットライブラリーのメンバーが構造的に、リード配列またはリードタンパク質の３次元構造と適合するかどうかを決定し；そして
リード配列またはリードタンパク質とスコアが同等かまたはより優れたメンバーを選択する。
リード配列またはリードタンパク質の３次元構造は、Ｘ線結晶解析、核磁気共鳴（NMR）分光法、または理論的構造モデル化から得られる構造である、請求項144の方法。
スコア化関数は、静電的相互作用、ファンデアワールス相互作用、静電的溶媒和エネルギー、溶媒がアクセス可能な表面溶媒和エネルギー、およびコンフォメーションエントロピーよりなる群から選択されるエネルギースコア化関数である、請求項144の方法。
スコア化関数は、Amberフォースフィールド（forcefiled）、Charmm フォースフィールド、Discover cvff フォースフィールド、ECEPP フォースフィールド、GROMOS フォースフィールド、OPLS フォースフィールド、MMFF94 フォースフィールド、Tripos フォースフィールド、MM3 フォースフィールド、Dreiding フォースフィールド、およびUNRES フォースフィールドよりなる群から選択されるフォースフィールドを含むスコア化関数である、請求項127の方法。
メンバーを選択する工程は、
ΔE_total = E_vdw + E_bond + E_angel + E_{electrostatics} + E_solvation
の式に基づいて計算されるリード配列またはリードタンパク質より低いかまたは同等の総エネルギーを有するメンバーを選択することを含む、請求項143の方法。
メンバーを選択する工程は、改良されたスコア化関数
ΔG_b = ΔG_MM + ΔG_sol - TΔS_SS
（式中、
ΔG_MM = ΔG_ele + ΔG_vdw (1)
ΔG_sol = ΔG_ele-sol + ΔG_ASA (2)）
を使用して、結合状態と非結合状態の差として計算されるリード配列またはリードタンパク質より小さい結合フリーエネルギーを有するメンバーを選択することを含む、請求項143の方法。
以下の工程をさらに含む請求項127の方法：
設計されるタンパク質のライブラリーのアミノ酸配列をコードするDNAセグメントを含む核酸ライブラリーを構築し；
核酸ライブラリーを発現させて組換えタンパク質のライブラリーを作成し；そして
組換えタンパク質のライブラリーから所望の機能を有するタンパク質を選択する。
以下の工程をさらに含む請求項127の方法：
ヒットライブラリーのアミノ酸位置変種プロフィールを作成し；
アミノ酸位置変種を対応する遺伝子コドンに逆翻訳することにより、ヒットライブラリーのアミノ酸位置変種プロフィールを核酸位置変種プロフィールに変換し；
核酸位置変種をコンビナトリアル的に組合せてDNAセグメントの縮重核酸ライブラリーを構築し；
縮重核酸ライブラリーを発現させて組換えタンパク質のライブラリーを作成し；そして
組換えタンパク質のライブラリーから所望の機能を有するタンパク質を選択する。
抗体のVEGFへの結合親和性が10⁶ M^-1より高く、モノクローナル抗体の重鎖CDR3は、配列番号36〜48および63〜125よりなる群から選択されるアミノ酸配列を含む、ヒト血管内皮増殖因子（VEGF）に対する抗体。
抗体の重鎖CDR1は、配列番号19〜30よりなる群から選択されるアミノ酸配列を含む、請求項152の抗体。
モノクローナル抗体の重鎖CDR2は、配列番号31〜305りなる群から選択されるアミノ酸配列を含む、請求項152の抗体。
抗体は、モノクローナル抗体、Fab、Fv、または１本鎖抗体である、請求項152の抗体。
抗体のVEGFへの結合親和性が10⁶ M^-1より高く、抗体の重鎖可変領域（V_H）は、配列番号126、128、129、130、および131よりなる群から選択されるアミノ酸配列を含み、抗体の軽鎖可変領域（V_L）は配列番号127のアミノ酸配列を含む、ヒト血管内皮増殖因子（VEGF）に対する抗体。